Text
Pseudo-Populations; A Basic Concept in Statistical Surveys
Pertemuan pertama saya dengan istilah “populasi semu” adalah ketika saya terlibat dalam proyek DACSEIS Uni Eropa (Kualitas Data dalam Survei Kompleks dalam Masyarakat Informasi Eropa Baru), di mana saya bertanggung jawab atas kontribusi Austria. Dalam proyek ini, antara lain, populasi buatan atau “pseudopopulasi,” yang selanjutnya disebut “alam semesta yang masuk akal atau sintetis,” yang dihasilkan berdasarkan data dari Survei Angkatan Kerja nasional yang relevan di negara-negara peserta, digunakan untuk menganalisis kualitas berbagai metode. untuk memperkirakan varians statistik angkatan kerja seperti jumlah orang yang bekerja atau menganggur melalui simulasi (lih. Münnich dkk. 2003). Selain itu, saat mengajar mahasiswa program sarjana dan magister statistika di universitas saya dalam mata kuliah metode pengambilan sampel, saya menyadari bahwa gambaran menghasilkan populasi semu berpotensi meningkatkan pemahaman siswa secara substansial tentang berbagai konsep dalam teori pengambilan sampel dan metodologi survei. Misalnya, seseorang dapat mendeskripsikan penduga Horvitz-Thompson dari total variabel penelitian, yang merupakan dasar statistik dalam teori pengambilan sampel, dengan menghasilkan populasi semu yang memperkirakan populasi terbatas asli sehubungan dengan parameter ini. Untuk tujuan ini, nilai variabel yang diamati dalam sampel ditetapkan ke unit populasi semu dengan mereplikasi masing-masing nilai tersebut dengan faktor yang mencerminkan proses pengambilan sampel dan estimasi. Biasanya, faktor replikasi tersebut bukanlah bilangan bulat. Estimator Horvitz–Thompson dari total populasi asli tidak lain adalah total dari variabel yang sama dalam populasi semu yang tidak hanya terdiri dari seluruh unit, tetapi juga bagian dari keseluruhan unit. Konsep penduga total lebih lanjut, seperti penduga rasio atau regresi, dapat diilustrasikan dengan cara yang sama. Perbedaan konsep-konsep ini dijelaskan oleh perbedaan komposisi populasi semu terhadap variabel penelitian. Intinya konsep populasi semu menyatukan beberapa ciri teori sampling statistik seperti teknik pengambilan sampel dan metode estimasi dalam satu atap. Menurut pengalaman saya, pendekatan ini mungkin sangat membantu untuk mengomunikasikan pemahaman dasar teknik-teknik tersebut, karena rumus-rumusnya seringkali tidak dapat dipahami secara intuitif oleh semua siswa, terutama mereka yang memiliki sedikit pengetahuan tentang teori probabilitas. Dengan pemahaman metodologis yang mendasar ini, pelajar dan pengguna lainnya harus dapat fokus pada pertanyaan mengenai perbedaan antara metode dan implementasi praktisnya dalam perangkat lunak statistik seperti R (untuk buku terbaru lihat, misalnya, Lumley 2010; Kauermann dan Küchenhoff 2011). Oleh karena itu, bagian pertama monografi ini dapat dilihat sebagai buku teks yang menggunakan pendekatan terpadu konsep populasi semu untuk menjelaskan berbagai aspek teori pengambilan sampel dan metodologi survei. Setelah bab pengantar tentang survei statistik, di Bab. 2, konsep populasi semu diperkenalkan untuk menggambarkan alasan di balik penduga Horvitz – Thompson. Selanjutnya, konsep tersebut diterapkan pada penyajian metode pengambilan sampel probabilitas dan non-probabilitas yang berbeda serta prosedur estimasi alternatif estimasi rasio, estimasi regresi, dan penyesuaian proporsional berulang dengan menggunakan informasi tambahan. Bab ini dilanjutkan dengan pemaparan mengenai pendugaan jumlah khusus seperti besarnya populasi asli dengan metode capture-recapture dan fungsi distribusi kumulatif suatu variabel yang diteliti. Hal ini dilengkapi dengan contoh lain penerapan pembentukan populasi semu dalam survei statistik seperti estimasi kovarians, ukuran asosiasi, estimasi area kecil, dan pengambilan sampel dua fase. Bab 3 membahas permasalahan praktis “Tidak Ada Respons dan Jawaban yang Tidak Benar”. Metode statistik penyesuaian bobot dan kompensasi imputasi data untuk nonresponse juga dijelaskan secara intuitif dalam pendekatan populasi semu yang disajikan yang berjalan seperti benang merah dalam karya ini. Bagian kedua monografi ini membahas bidang teori sampling dan metodologi survei, di mana penulis menerapkan konsep populasi semu dalam penelitiannya. Dalam Bab. 4, disajikan prinsip-prinsip dasar studi simulasi di bidang pengambilan sampel survei. Dasar dari studi semacam ini dibentuk oleh populasi asli atau populasi pengganti yang mendekati kenyataan, yaitu populasi semu lainnya. Contoh penggunaannya dalam analisis sekunder data PISA (Program Penilaian Siswa Internasional) Austria menyimpulkan bab ini (lih. Quatember dan Bauer 2012). Sebenarnya, istilah populasi semu pertama kali digunakan dalam literatur yang relevan mengenai jenis metode bootstrap tertentu untuk populasi terbatas, yang digunakan sebagai alternatif intensif komputer untuk memperkirakan distribusi sampling dari statistik sampel. Pertanyaan terpenting yang harus dijawab oleh peneliti untuk prosedur bootstrap ini adalah bagaimana membuat populasi bootstrap, yang dapat berfungsi sebagai dasar yang memadai untuk proses pengambilan sampel ulang sehubungan dengan sifat statistik dari estimator yang sedang diselidiki. Tinjauan pendekatan untuk menjawab pertanyaan mendasar ini disajikan di Bagian. 5.2. Selain itu, penerapan langsung pendekatan Horvitz–Thompson dalam menghasilkan populasi semu yang memungkinkan tidak hanya seluruh unit dalam populasi bootstrap dibahas secara rinci sebagai penerapan konsep pada teknik pengambilan sampel ulang ini (cf. Quatember 2014b). Hal ini dapat dilihat sebagai pelengkap alami dari karya-karya yang baru diterbitkan di bidang ini. Sebuah contoh penerapan bootstrap populasi terbatas mengakhiri bab ini. Dalam Bab. 6, masalah tidak adanya respons dan jawaban yang tidak benar diatasi lagi, ketika konsep populasi semu diterapkan pada “Rancangan Pertanyaan Respons Acak Umum,” yang merupakan alternatif perlindungan privasi dibandingkan pertanyaan langsung. Dalam konteks ini, konsep ini berfungsi sebagai dasar untuk memperluas teori yang disajikan sejauh ini terutama mengenai pengambilan sampel acak sederhana dengan penggantian skema pengambilan sampel probabilitas umum. Hal ini sangat penting karena dalam bidang yang menggunakan metode ini, misalnya penelitian sosial atau kesehatan empiris, skema pengambilan sampel probabilitas yang kompleks lebih sering digunakan. Quatember (2009, 2012) menyajikan generalisasi dari kelompok strategi tertentu yang dapat diterapkan pada variabel biner. Di sini, standardisasi tersebut disajikan untuk variabel kategorikal umum dan kuantitatif. Kerangka kerja yang disajikan mencakup strategi yang telah diterbitkan dan, pada saat yang sama, semua kombinasi pertanyaan dan instruksi lainnya yang termasuk dalam kelompok ini belum dipublikasikan dalam artikel individual. Metode seperti ini saat ini digunakan dalam banyak kesempatan (lih. Lensvelt-Mulders dkk. 2005), namun tidak benar-benar muncul dalam opini dan riset pasar, di mana, jika memungkinkan (atau perlu) untuk meninggalkan jalur yang biasa, metode tersebut memiliki potensi untuk meningkatkan kualitas survei mengenai atribut-atribut sensitif seperti jajak pendapat. Bab penutup tentang “Kerangka Terpadu untuk Pengendalian Pengungkapan Statistik” (Bab 7) membahas teknik statistik, yang tentunya berbeda dengan metode yang dibahas pada bab sebelumnya karena tujuannya bukan untuk meningkatkan efisiensi hasil survei. Sebaliknya, istilah pengendalian pengungkapan statistik merangkum metode yang mengurangi kualitas data dengan cara yang terkendali untuk meningkatkan privasi data. Bidang ini menjadi semakin penting dalam beberapa tahun terakhir. Pada musim panas tahun 2013, misalnya, menurut sebuah artikel yang diterbitkan di majalah berita Jerman Spiegel, aktivis privasi data melaporkan bahwa pusat komputer apoteker di Jerman Selatan menjual data pasien yang tidak dienkripsi secara memadai kepada perusahaan riset pasar. Pada dasarnya, perdagangan dengan data tersebut sah jika data dibagikan dan digunakan dengan cara terenkripsi. File mikrodata ini berisi informasi yang dapat digunakan dalam riset pasar perusahaan farmasi. Dalam kasus khusus ini, identitas pasien hanya terselubung oleh sebuah kode, yang memungkinkan pengguna yang diketahui mengetahui nomor keamanan pasien yang sebenarnya. Selain itu, usia dan jenis kelamin pasien juga disertakan dalam file. Oleh karena itu, perusahaan farmasi mungkin dapat memahami praktik medis mana yang meresepkan obat tertentu. Aktivis privasi data menunjukkan bahwa dengan cara ini, perusahaan dapat mengontrol keberhasilan pekerjaan staf penjualan mereka. Masalah serupa juga dibahas pada waktu yang sama di Austria, di mana para dokter langsung menjual data pasiennya. Dalam bab ini, konsep populasi semu diterapkan pada sekelompok teknik pengungkapan untuk menciptakan kerangka kerja terpadu yang dapat dipahami untuk metode “kelompok CSI” ini (lih. Quatember dan Hausner 2013). Singkatan CSI adalah singkatan dari sebuah proses yang dimulai dengan pengklonan variabel, diikuti dengan penekanan artifisial terhadap nilai-nilai klon tersebut dan diakhiri dengan imputasi atas nilai-nilai yang ditekan tersebut. Pada akhirnya, variabel asli akan dihapus dari file dan versi yang disamarkan harus mengambil alih tugasnya. Dalam konteks ini, deskripsi proses estimasi dengan gagasan untuk menghasilkan populasi semu menandai momen ketika tindakan penyeimbangan antara perlindungan data wajib dan permintaan yang dapat dimengerti dari pihak ketiga untuk mengakses data survei terjadi. Karena buku ini berisi pengalaman mengajar dan penelitian saya di bidang kualitas data dalam survei statistik dengan pendekatan terpadu konsep pseudopopulasi, saya ingin mengucapkan terima kasih kepada semua orang yang telah memberi saya kesempatan untuk mendapatkan semua pengalaman ini di Johannes. Universitas Kepler, Linz, Austria. Secara khusus, saya berterima kasih kepada seluruh kolega saya di Departemen Statistika Terapan yang telah menginspirasi saya selama ini. Secara khusus, saya ingin mengucapkan terima kasih kepada Werner Müller, kepala Akuisisi Data dan Kualitas Data, atas dukungan dan dorongannya yang tiada henti. Selain itu, saya tidak ingin lupa menyebutkan sekelompok orang, yang mungkin tidak terlalu menyadari bahwa mereka adalah motivator terbaik saya dari tahun ke tahun—para siswa.
No copy data
No other version available