MODUL SURVEI SAMPEL
oleh : Muhardi Kahar
KATA PENGANTAR Sebagai pendukung perencanaan survei khususnya survei dengan pendekatan rumahtangga dan sebagai pelengkap variabel untuk penyusunan indikator kesepakatan Millennium Development Goals (MDGs) di tingkat kecamatan telah diterbitkan publikasi Seri 4 dengan judul “Metode Survei MDGs Tingkat Kecamatan”. Buku seri 4 ini juga merupakan pengembangan dan pelengkap publikasi Seri 2 yang menguraikan aspek pengembangan metode sampling yang merupakan salah satu alat untuk menetapkan pilihan metode sampling yang dapat digunakan sebagai dasar penentuan besar sampel untuk survei-survei pendekatan rumahtangga. Kedua buku tersebut bertujuan untuk mendukung tercapainya survei yang akhirnya menghasilkan berbagai indikator dari variabel MDGs atau variabel lainnya yang mendukung variabel MDGs. Melengkapi terbitnya buku seri 4 sebagai bahan acuan dasar yang lebih sederhana terutama dalam hal pemahaman dasar bagi pengguna data, maka disusunlah Modul Survei Sampel yang merupakan intisari dari buku seri 4, dimana penulis sebagai salah satu anggota tim. Format isi modul ini tidak banyak berbeda dari sumber aslinya dan diharapkan dapat lebih mudah dimengerti dan diaplikasikan oleh konsumen data dalam memahami maksud, tujuan, dan bagaimana mendesain suatu survei dengan baik dan benar. Akhir kata, semoga tulisan ini bermanfaat bagi dunia penelitian khususnya yang berkaitan dengan survei berbasis sampel.
Jakarta, 5 Oktober 2010 Penulis
2
DAFTAR ISI Halaman Kata Pengantar.........................................................................................................2 Daftar Isi .................................................................................................................3 BAB I. PENDAHULUAN Latar Belakang ..................................................................................................5 Tujuan ...............................................................................................................5 Materi yang Dicakup .........................................................................................6 BAB II. DASAR-DASAR SURVEI SAMPEL Keuntungan dan Kelemahan Survei Sampel ...................................................7 Desain Survei ....................................................................................................9 Penentuan Populasi dan Target Populasi ........................................................10 Informasi & Indikator yang Diperlukan .............................................................11 BAB III. METODE SAMPLING Penyusunan Kerangka Sampel ...................................................................... 12 Metode Sampling A. Sampling Elemen & Contoh Acak Sederhana ........................................................................................12 Sampling Sistematik ..................................................................................16 Sampling Berstrata ....................................................................................17 B. Sampling Klaster & Contoh.........................................................................23 Pengkajian Besarnya Sampel ..........................................................................27 Estimasi (Data rumahtangga & individu) ..........................................................30 Standard Error dan Tingkat Kepercayaan ........................................................31 BAB IV. APLIKASI PENARIKAN SAMPEL Contoh Penyediaan Kerangka Sampel ...........................................................33 Contoh Penarikan Sampel ...............................................................................34 Overview of CENVAR......................................................................................36 Latihan-latihan .................................................................................................37
3
LAMPIRAN I.
KONSEP DEFINISI ..................................................................................... 40
II. GLOSSARY ................................................................................................ 41 TABEL ANGKA RANDOM DAFTAR PUSTAKA
4
BAB I PENDAHULUAN Latar Belakang Pengumpulan data tentang indikator MDGs meliputi 8 tujuan yaitu (1) penghapusan kemiskinan, (2) mencapai pendidikan dasar untuk semua, (3) kesetaraan gender dan pemberdayaan perempuan, (4) penurunan angka kematian anak, (5) meningkatan kesehatan ibu, (6) memerangi HIV/AIDS, malaria dan penyakit menular lainnya, (7) menjamin kelestarian lingkungan berkelanjutan, dan (8) kemitraan global. Setiap tujuan tersebut ditetapkan target-target pencapaian secara kuantitatif untuk selama kurun waktu 1990-2015. Modul ini akan menjelaskan lebih singkat dan cukup detail tentang dasar-dasar survei sampel dan dasar-dasar metode sampling. Selanjutnya bagaimana mengaplikasikan metode sampling sesuai temuan pada pengkajian pengembangan metode sampling yang akan dijelaskan secara rinci berikut tatacara penyusunan kerangka sampel, pembentukan kerangka sampel, pengambilan sampel sampai terbentuk daftar sampel hingga prosedur estimasi. Tujuan Kegiatan penulisan modul ini dimaksud sebagai suatu modul yang menjelaskan secara lebih sederhana tapi cukup rinci tentang tatacara mendesain survei secara menyeluruh dan khusus serta dibahas hal-hal yang berkaitan dengan metode sampling. Diharapkan modul ringkasan ini dapat digunakan sebagai pedoman para pengguna data untuk mendesain survei dan metode sampling yang akan diterapkan pada level kecamatan. Dengan adanya modul ini diharapkan semua pihak dalam melakukan perancangan survei dapat: a. Memahami bagaimana langkah-langkah melaksanakan survei dan memahami penggunaan metode sampling untuk estimasi tingkat kecamatan sesuai sifat-sifat variabel yang dikumpulkan, khususnya variabel MDGs dan arti pentingnya menetapkan besar sampel sesuai dengan tingkat heterogenitas/homogenitas karakteristik dari variabel. b. Memahami keterkaitan antara penerapan probability dan non probability sampling serta hubungan antara sampling error dan non sampling error. c. Mandiri dalam penyediaan kerangka sampel dan penyusunannya, penarikan sampel, serta penyediaan daftar sampel. Pada materi ini dicakup pula tatacara penyusunan kerangka sampel di lapangan untuk penarikan sampel unit sampling tahap akhir (ultimate sampling unit). d. Mandiri dalam mengadakan estimasi dan penghitungan tingkat presisi (standard error) dari hasil survei.
5
Materi yang Dicakup Modul ringkasan yang akan diuraikan pada tulisan ini sifatnya tidak terlalu teknis teori, akan tetapi lebih bersifat aplikatif sehingga mudah dipahami oleh berbagai pihak. Walaupun demikian pengetahuan dasar tentang statistik tetap diperlukan agar lebih dapat menjabarkan penerapan metode sampling yang digunakan serta keuntungan dan kelemahannya. Untuk memahami bagaimana mendesain survei secara menyeluruh, maka pada modul ini secara garis besar materi dikelompokkan menjadi 2, yaitu: a. Materi yang menjelaskan dasar-dasar survei sampel b. Materi yang menjelaskan dasar-dasar metode sampling c. Pada modul ini juga diberikan contoh aplikasi penerapan metode sampling yaitu prosedur penyusunan kerangka sampel dan penarikan sampel
6
BAB II DASAR-DASAR SURVEI SAMPEL Keuntungan dan Kelemahan Survei Sampel Keuntungan dari pengumpulan data secara sampel antara lain:
a. Menghemat biaya karena data dikumpulkan hanya pada sebagian unit dalam populasi. Dengan mengumpulkan informasi secara sampel maka materi survei yang disediakan, jumlah petugas akan lebih singkat sehingga memerlukan biaya yang lebih kecil.
b. Mempercepat hasil survei, karena dengan melakukan survei sampel berarti pelaksanaan lapangan dan pengolahan akan lebih cepat.
c. Cakupan materi lebih luas dan beragam karena bersifat sampel kebutuhan data d. Akurasi lebih tinggi, karena kualifikasi petugas lebih baik. Karena bersifat sampel maka jumlah petugas lebih sedikit dan pemilihan petugas yang baik lebih selektif, sehingga secara tidak langsung akan mereduksi kesalahan yang diakibatkan bukan oleh metode sampling yang disebut non sampling error. Bila sampel bertambah besar, non sampling error menjadi lebih besar dan sebaliknya sampling error akan menjadi lebih kecil. Sampling error pada suatu sensus tidak terjadi, tetapi yang ada hanya non sampling error. Sedangkan pada survei sampel kesalahan yang mungkin terjadi bisa non sampling error dan sampling error dengan total kesalahan (total error) lebih kecil dibanding dengan sensus.
Gambar 2.1: Sampling Error dan Non Sampling Error
Besar kesalahan Non sampling error A
C B
Sampling error
Besar sampel (n) A, B, dan C menunjukkan total error/kesalahan Berbagai kesalahan yang menyebabkan bias dapat digambarkan sebagai berikut:
7
Gambar 2.2: Sumber-sumber Bias Bias kerangka sampel Bias sampling
Bias sampling (konsisten) Bias statistik (konsisten) Salah cakupan Bukan observasi
Tidak menjawab (non response)
Bias non sampling Pencacahan/pengumpulan data Observasi
Pengolahan
Kelemahan dari pengumpulan data secara sampel antara lain: a. Penyajian wilayah kecil Penyajian sampai wilayah kecil seperti kecamatan atau desa dengan jumlah sampel terbatas tidak akan dapat dipenuhi. Dalam metode sampling diperlukan sejumlah sampel untuk level penyajian tertentu karena banyaknya sampel bukan tergantung pada banyaknya unit dalam populasi, tetapi lebih kepada melihat tingkat heterogenitas karakteristik dari unit-unit dalam populasi. b. Penyajian variabel langka/jarang terjadi/proporsi kecil Survei sampel sangat sulit untuk menyajikan variabel yang kejadiannya langka atau kejadiannya kecil dalam populasi (proporsi kecil). c. Trend data Bila diperlukan data berkala untuk mengukur perubahan yang sangat kecil, suatu survei sampel dari satu periode ke periode berikutnya kemungkinan tidak dapat digunakan, kecuali bila digunakan panel (sampel sama untuk beberapa periode). d. Tidak tersedianya kerangka sampel Apabila tidak tersedia kerangka sampel maka probability sampling tidak akan bisa diterapkan.
8
Desain Survei Berbagai hal yang pula diperhatikan dalam mendesain suatu survei sampel adalah: a. Mendefinisikan cakupan dan isi dari populasi karena akan sangat menentukan metode sampling yang dapat digunakan atau mencari estimator yang sesuai dan penyediaan kerangka sampel. b. Menetapkan metode observasi, termasuk tatacara pengumpulan data dan pengolahan data. Penetapan jenis variabel yang akan dikumpulkan dan konsep definisi yang akan digunakan merupakan hal penting yang perlu dibahas sebelum melangkah lebih lanjut. c. Menetapkan rencana analisis dengan menetapkan rancangan tabel yang perlu dihasilkan serta metode analisis. d. Memastikan kegunaan survei misalnya untuk menyajikan data MDGs pada level kecamatan dengan menyajikan berbagai indikator yang telah ditetapkan pada butir c di atas. Kegunaan dari hasil survei ini perlu dibahas secara luas oleh desainer survei, karena semakin banyak data yang dihasilkan dari suatu survei diminati oleh konsumen akan menunjukkan keberhasilan dari suatu survei. e. Menetapkan tingkat presisi yang dikehendaki sesuai dengan jenis variabel yang akan dikumpulkan dan memperkirakan kira-kira variabel mana yang tidak dapat diestimasi melalui survei yang akan dilaksanakan. Kesepakatan antara desainer sampel dengan desainer survei serta konsumen data perlu diadakan sehingga berbagai pihak akan ikut bertanggung jawab terhadap hasil survei dan menyadari bahwa berbagai kesalahan akan timbul bukan saja dari sisi metode sampling tetapi juga dari sisi lain di luar metode sampling. Oleh karena itu setiap tahapan kegiatan yang harus dilakukan dalam melaksanakan survei perlu diikuti dengan seksama, yang meliputi: a. Perencanaan Tahapan ini sangat menentukan keseluruhan proses pelaksanaan suatu survei yang di dalam istilah selanjutnya disebut sebagai desainer survei. Desain survei harus dilakukan oleh desainer survei sesuai dengan disiplin ilmunya termasuk di dalamnya desain sampel. Perencanaan survei supaya dilakukan dengan baik dan matang termasuk di dalamnya penentuan jadwal kegiatan yang menjadi pegangan agar hasil survei tepat waktu. Disamping itu faktor biaya dan penyediaannya harus sudah dapat ditetapkan dalam perencanaan. Biaya sangat memegang peranan penting disamping penetapan besarnya sampel yang optimal. Materi survei secara keseluruhan supaya ditetapkan dan disinkronisasikan dengan aspek lain seperti desain sampel, penyajian, kualifikasi petugas, dan sebagainya. b. Persiapan Tahapan ini merupakan tahapan kedua, setelah aspek perencanaan siap. Pada tahap ini diperlukan persiapan lapangan seperti penyediaan daftar sampel, daftar isian dan panduannya, rekrutmen petugas sesuai dengan kualifikasi yang ditentukan dan aturan organisasi lapangan, rancangan pengawasan, dan sebagainya. c. Pelaksanaan lapangan Pelaksanaan lapangan merupakan tahapan pengumpulan informasi sesuai materi dan prosedur yang telah ditetapkan. Berbagai hal yang telah ditentukan harus diikuti,
9
perubahan sepihak tidak ditolerir karena akan menyebabkan berkurangnya tingkat akurasi data dan keterbandingan antar wilayah menjadi tidak terjamin. d. Pengolahan & Penyajian e. Pengolahan dilakukan sesuai prosedur yang ditetapkan dan merupakan kegiatan yang diawali dengan penerimaan dokumen dari hasil pengumpulan data. Pada tahapan kegiatan pengolahan, sebagai dasar pemeriksaan kelengkapan dokumen dengan menggunakan daftar sampel berikut identitasnya yang perlu dicocokkan dengan hasil pengumpulan data. Pemeriksaan konsistensi isian antara lain berupa editing dan diikuti pemberian kode serta pengecekan melalui komputer (validasi) hingga data bersih dan siap untuk tabulasi. Penyajian merupakan kegiatan akhir. Pada tahap ini sebelum data disajikan dan disebarluaskan maka terlebih dahulu diadakan pengecekan kewajaran (consistency check) baik konsistensi antar tabel maupun keterbandingannya dengan hasil survei sebelumnya bila ada. Penentuan Populasi dan Target Populasi Penentuan populasi dan target populasi selalu harus dilakukan tidak hanya pada Survei MDGs tetapi juga pada saat memulai mendesain suatu survei yang lain. Secara umum cakupan dari populasi survei dapat digambarkan melalui 4 level, yaitu: a. Populasi survei
b. Frame populasi
c. Target populasi
d. Inferensia
Setiap level perlu dicermati sehingga dapat ditentukan target populasi yang sesuai sehingga hasil survei dapat dikaji baik secara deskriptif maupun statistik inferensial. Gambaran ke empat level terlihat pada Gambar 2.3. Gambar 2.3: Cakupan Populasi Survei Inferensial * Model * Ekstrapolasi * Indikator, dsb Perlu ditentukan dengan berbagai pertimbangan
Target populasi
Perlu dikaji * Kelengkapan frame * Coverage error
Frame populasi
Perlu dikaji * Kemudahan cakupan lokasi * Kemungkinan adanya non response
Sampling error
Probability samples response
Populasi survei
Non Probability samples
Item non
10
Didasarkan pada obyek dan tujuan survei pada tahap awal terlebih dahulu ditentukan apakah suatu survei dalam desain sampelnya mengarah ke probability atau non probability sampling. Perlu diperhatikan bahwa probability sampling mengandung dua unsur kesalahan (error), yaitu: a. Sampling error b. Non sampling error Pada probability sampling selain mempertimbangkan berbagai hal yang berkaitan dengan disiplin ilmu, juga mempertimbangkan bahwa setiap unit dalam populasi harus mempunyai peluang untuk terpilih dalam sampel. Dengan demikian diharapkan dapat dilakukan estimasi nilai parameter. Probability sampling akan menghasilkan suatu estimasi yang sekaligus dapat dihitung kesalahan yang disebabkan oleh desain sampel (standard error). Untuk non probability sampling, penentuan desain sampel lebih mengarah pada judgement dari perencana berdasarkan berbagai pertimbangan sesuai dengan disiplin ilmu yang bersangkutan. Dalam non probability sampling tidak semua unit mempunyai peluang untuk terpilih dalam sampel. Informasi & indikator yang Diperlukan Sesuai dengan obyek dan tujuan survei, dijabarkan jenis-jenis variabel yang akan dikumpulkan dan selanjutnya dipelajari apakah variabel tersebut dapat dikumpulkan/digali informasinya atau tidak. Daftar variabel tadi supaya dilengkapi dengan variabel pendukung yang terkait, karena kemungkinan suatu indikator memerlukan lebih dari satu variabel atau untuk mendapatkan suatu informasi memerlukan tambahan dukungan informasi lain. Sebagai contoh untuk variabel pengangguran, urutan pertanyaan terlebih dahulu dimulai dengan menanyakan jenis kegiatan, mempunyai pekerjaan atau tidak atau terjadinya kasus seseorang yang sebenarnya termasuk penganggur tetapi tidak mencari pekerjaan karena sudah bosan mencari pekerjaan. Perlu diperhatikan bahwa jumlah variabel yang dikumpulkan jangan terlalu banyak karena akan mengakibatkan kebosanan responden dalam menjawab pertanyaan. Perlu pula dipelajari variabel yang mungkin sulit atau responden cenderung tidak mau menjawab, misalnya mengenai pendapatan secara rinci, sehingga tidak perlu dikumpulkan informasinya atau bila data sangat diperlukan dapat dilakukan pengumpulan data secara khusus.
11
BAB III DASAR-DASAR METODE SAMPLING Penyusunan Kerangka Sampel BPS di dalam setiap kesempatan suatu sensus lengkap selalu merancang kerangka sampel yang sekaligus dilengkapi datanya untuk digunakan penarikan sampel. Hasil Sensus Penduduk atau pendataan lengkap lainnya yang berkaitan dengan kependudukan seperti P4B digunakan sebagai kerangka sampel untuk survei dengan pendekatan rumahtangga. Kerangka sampel ini secara sepintas kelihatannya mudah untuk dibentuk dan diaplikasikan. Dalam kenyataan terjadi berbagai kendala yang memerlukan perhatian dan pemantauan secara khusus antara lain: a. Kelengkapan daftar blok sensus beserta muatan dan identitas serta perubahannya belum tercatat dengan baik, dan kesadaran ke arah ini masih kurang. b. Identifikasi blok sensus pada peta kurang jelas, yang menyebabkan coverage error. c. Pengelolaan termasuk mekanisme dan penyimpanan kerangka sampel belum tertata dengan baik. Belum adanya kesadaran penuh terhadap pentingnya kerangka sampel. d. Penanggungjawab yang menangani belum sepenuhnya ditunjuk untuk seluruh jenis kerangka sampel secara terintegrasi. Selanjutnya dipelajari muatan blok sensus yaitu terbatas pada yang menyangkut banyaknya rumahtangga dan blok sensus. Pada Susenas apabila ternyata muatan rumahtangga dalam blok sensus melebihi 150, maka diadakan pemecahan blok sensus menjadi kelompok segmen yang jumlah rumahtangga untuk setiap blok sensus sekitar 100. Pemecahan ini dilakukan setelah penarikan sampel blok sensus, sehingga untuk setiap blok sensus ini penarikan sampel menjadi 3 tahap karena pada blok sensus tersebut selanjutnya dipilih satu kelompok segmen dengan peluang banyaknya rumahtangga. Metode Sampling Metode sampling yang akan diuraikan adalah probability sampling sebagai alat penentuan sampel yang dapat digunakan untuk memperkirakan nilai populasi beserta cara penarikan sampel dan estimasinya. Metode sampling yang akan diuraikan meliputi: A. Sampling Elemen & Contoh Acak Sederhana & Contoh Acak sederhana pada sampling elemen digunakan bila pada populasi hanya tersedia daftar unit tanpa variabel pendukung dan unit tersedia berupa elemen. Sampling elemen pada umumnya hanya digunakan pada populasi yang unitnya tidak terlalu banyak dan areanya tidak terlalu luas. Sampling acak sederhana ini merupakan dasar bagi metode selanjutnya, maka pengertian dari metode sampling serta cara
12
estimasinya akan dibahas terlebih dahulu. Metode sampling lainnya dapat dipandang sebagai modifikasi atau pengembangan dari metode sampling acak sederhana. Metode sampling acak sederhana ini yang akan dibahas disini terbatas pada penarikan sampel acak sederhana tanpa pemulihan (without replacement). Tanpa pemulihan diartikan bila suatu unit yang sudah terpilih tidak ada kemungkinan untuk terpilih lagi, seperti misalnya kocokan pada arisan, lotere, dan sebagainya. Notasi yang digunakan adalah sebagai berikut: N
: ukuran populasi atau banyaknya unit dalam populasi
n
: ukuran sampel atau banyaknya unit/elemen terpilih dalam sampel
Y
: nilai karakteristik dari variabel yang diamati dari populasi
yi
: nilai karakteristik dari variabel unit ke i dari sampel
Y
: rata-rata nilai karakteristik per unit elemen dari populasi
y
: rata-rata nilai karakteristik per unit elemen dari sampel
S2
: varians dari populasi
s
2
: varians dari sampel
P
: proporsi suatu kejadian dalam populasi (proporsi populasi)
p
: proporsi suatu kejadian dari sampel (proporsi sampel)
Oleh karena penarikan sampel dilakukan dengan menggunakan angka random, maka sampel terpilih akan tergantung dari angka randomnya. Secara keseluruhan akan terbentuk sejumlah kemungkinan gugus sampel (all possible samples), yang banyaknya tergantung dari metode penarikan sampel yang digunakan. Distribusi dari nilai statistik setiap gugus sampel yang mungkin terbentuk disebut distribusi sampling seperti dijelaskan sebelumnya. Sebagai contoh dengan metode yang sederhana, yaitu memilih n dari N unit secara acak sederhana tanpa pemulihan, akan diperoleh kemungkinan sampel terbentuk sebanyak: N
N N! Cn n n! ( N n)!
(1)
Misalnya banyak unit dalam populasi N = 5 dengan karakteristik elemen sebagai berikut: Elemen ke
1
Nilai karakteristik
y1 = 8
2 y2 = 6
3
4
y3 = 12
y4 = 10
5 y5 = 4
Diambil sampel sebanyak n = 2, maka jumlah sampel yang mungkin terbentuk sebanyak: 5
5 5! 5x4 x3x2 x1 C2 10 , 2 2! (5 2)! 2 x1x3x2 x1
13
Sebelum menetapkan berapa besarnya sampel seperti diatas, hal yang perlu ditentukan terlebih dahulu adalah nilai varians (keragaman) karakteristik dari populasi. Statistik yang sering digunakan untuk menentukan ukuran sampel adalah rata-rata, dan karenakan karakteristik survei belum tentu tersedia pada data populasi (parameter), maka dapat digunakan data survei sebelumnya. Varians rata-rata suatu karakteristik pada metode acak sederhana, sebagai berikut: Varians:
v( y )
Standard error:
N n s2 s2 N n n
se( y )
Relative standard error:
N n s2 N n
(2)
s2 s n n
se ( y ) y
(3)
(4)
Dengan dapat diperkirakannya nilai S2 atau s2 maka dapat ditentukan besarnya sampel (n) sesuai dengan yang diharapkan. Tahap selanjutnya dalam menentukan sampel berbasis acak sederhana adalah menentukan tingkat presisi.
d Z / 2 se ( y )
(5)
presisi = tingkat keyakinan x standard error (dalam hal ini presisi nilai rata-rata karakteristik per elemen) Z/2 : menunjukkan tingkat keyakinan/kepercayaan yang dikehendaki, bila Z/2 = 1,96 berarti tingkat kepercayaan adalah 95 persen. Dengan demikian sampel yang dibutuhkan untuk memperkirakan nilai rata-rata dengan presisi d dan tingkat kepercayaan (1-) 100%, adalah:
d Z /2
N ( Z / 2 S ) 2 N n S2 , sehingga n . N n Nd 2 ( Z / 2 S ) 2
(6)
Contoh Sampling Acak Sampling acak umumnya banyak ditemui pada kehidupan sehari-hari, seperti arisan yang menggunakan kocokan, pengundian hadiah, door prize, dll. Pada kasus tersebut, peluang setiap orang yang ikut serta adalah sama. Penarikan sampel seperti itu dapat juga menggunakan tabel Angka Random (lihat lampiran). Pada sampling acak penarikan angka random untuk menentukan yang terpilih dapat dilakukan berulang kali, dengan syarat yang sudah dipilih tidak dipilih kembali. Misalkan dalam suatu acara arisan yang diikuti 30 orang akan memilih 1 orang, maka dengan menggunakan Tabel Angka Random (TAR), kita akan memilih satu angka random yang nantinya akan mengidentifikasikan pemenangnya. Tata cara penentuan angka random sebagai berikut: 1. Siapkan Tabel Angka Random (TAR) yang terdiri atas 2 halaman (Lampiran 1).
14
2. Setiap halaman terdiri atas 25 kolom dan 35 baris. Masing-masing halaman diberi nomor kolom 1, 2 ,3, …25 dan nomor baris 1, 2, 3, …, 35. 3. Ambilah sebuah pensil atau benda berujung runcing. Buka salah satu halaman dari 2 halaman TAR yang telah disiapkan. Untuk keperluan ini dapat digunakan sembarang halaman TAR. Picingkan mata atau alihkan pandangan ke tempat lain, dan letakkan ujung pensil di atas lembaran TAR. Bilangan yang paling dekat dengan posisi ujung pensil adalah merupakan titik awal pembacaan angka random untuk menentukan halaman, baris, dan kolom yang akan digunakan untuk memilih angka random (R). Mulai dari titik ini bacalah 5 bilangan ke kanan. Misalkan halaman yang digunakan untuk pembacaan ini adalah halaman pertama TAR dan ujung pensil jatuh pada bagian tertentu dari tabel seperti pada ilustrasi berikut: .
14
15
16
17
18
19
20
21
22
23
.
9
6
9
1
0
8
2
5
3
7
25
2
6
4
1
1
1
2
6
7
1
26
9
1
9
7
4
6
6
0
2
9
27
9
1
9
7
4
6
6
0
2
9
28
2
5
1 2
6
3
8
7
9
7
29
8
9
7
0
1
5
0
8
7
7
30
4
3
3
4
9
1
3
3
4
8
.
Lima angka di sebelah kanan tanda titik ( . ) adalah 26387 Penentuan halaman pembacaan TAR Karena ada 2 halaman TAR, angka random yang digunakan untuk menentukan halaman ini cukup satu angka saja. Untuk mudahnya, gunakan angka 0, 1, 2, ….., 9 dengan ketentuan bahwa angka ganjil untuk menyatakan halaman pertama Tabel Angka Random, angka 0 (nol) dan genap untuk halaman kedua. Pada pembacaan di atas, yaitu 26387, dijit pertama adalah 2. Oleh karena itu halaman yang terpilih adalah halaman kedua dari Tabel Angka Random. Penentuan baris Karena pada setiap halaman ada 35 baris, maka untuk penentuan baris digunakan bilangan yang terdiri atas 2 dijit. Sebagai contoh, untuk bilangan 01, 36, dan 71 digunakan untuk menyatakan baris 1, bilangan 02, 37, dan 72 digunakan untuk menyatakan baris 2, dan seterusnya. Pada pembacaan di atas (26387), dijit ke-2 dan ke-3 adalah 63, maka baris pembacaan jatuh pada baris ke-28, karena 63 - 35 = 28. Penentuan kolom Karena pada setiap halaman ada 25 kolom, maka untuk penentuan kolom ini digunakan bilangan yang terdiri atas 2 dijit. Sebagai contoh, untuk bilangan 01, 26, 51, dan 76 digunakan untuk menyatakan kolom 1, bilangan 02, 27, 52, dan 77 digunakan untuk menyatakan kolom 2, dan seterusnya.
15
Pada pembacaan di atas, dijit ke-4 dan ke-5 adalah 87, maka kolom pembacaan jatuh pada kolom ke-12, karena 87- (25+25+25)=12. Sehingga TAR yang digunakan adalah halaman 2, baris ke 28 dan kolom ke 12. Jika interval nilainya puluhan (2 dijit) maka dalam hal ini kolom yang digunakan adalah kolom (12) dan (13) 4. Sehingga TAR yang digunakan adalah halaman 2 baris 28 dan kolom 12. Karena peserta arisan 30 orang (2 digit), maka ambil dua kolom ke kanan, jadi kolom yang digunakan adalah kolom 12 dan kolom 13 pada baris 28 tersebut. Dari TAR terlihat angka yang tertera adalah 02, artinya peserta arisan dengan nomor urut 2 terpilih sebagai pemenangnya. Sampling Sistematik & Contoh Pada penarikan sampel acak sederhana setiap unit dipilih dengan menggunakan tabel angka random. Dengan demikian kita harus menarik sampel sebanyak n kali, misal dari suatu kecamatan harus dipilih 300 rumahtangga berarti harus mengambil angka random sebanyak 300 kali. Untuk memperingan penarikan sampel ini maka diterapkan penarikan sampel secara sistematik, dengan hanya mengambil satu angka random saja dan lainnya akan mengikuti dengan menghitung intervalnya. Salah satu yang sederhana adalah penggunaan sistematik linear dengan cara sebagai berikut: a. Hitung interval, yaitu
N n
b. Tentukan satu angka random yang lebih kecil atau sama dengan intervalnya. Angka random ini selanjutnya disebut angka random pertama R 1. Angka random selanjutnya R2 = R 1 + I R3 = R2 + I = R1 + 2I . . Rn = Rn-1 + I = R1 + (n-1)I Rn digunakan sebagai kontrol apakah penarikan sampel sudah benar. Misal banyaknya unit dalam populasi N = 30 dan banyaknya unit dalam sampel n = 5, maka I = 6 sehingga R1 < 6 katakan 2, maka yang harus dipilih adalah nomor 2, 8, 14, 20, dan 26 yang harus dicek dengan Rn = R1 + (n-1)I = 2 + 4(6) = 26. Selain untuk mempermudah penarikan sampel, penarikan sampel sistematik juga dapat meningkatkan efisiensi, misal dengan mengadakan pengaturan unit-unit (systematic arrangement). Seperti pada contoh soal acak sederhana, elemen terletak dengan urutan sebagai berikut:
16
Elemen
1
2
3
4
5
Nilai karakteristik
8
6
12
10
4
urutan letak elemen diubah menjadi: Elemen
1
2
3
4
5
Nilai karakteristik
4
6
8
10
12
Elemen diurutkan menurut besarnya nilai karakteristik, dalam hal ini dari nilai terkecil ke nilai terbesar, sehingga kalau dilakukan penarikan sampel secara sistematik, sampel akan menyebar dengan terwakili dari nilai kecil sampai dengan nilai besar. Pada pemberian nomor urut wilayah desa/kota dan blok sensus misalnya dari ujung barat daya secara zig-zag, salah satu cara pemberian nomor urut ini dimaksud apabila dilalukan penarikan sampel secara sistematik, sampel akan menyebar di seluruh wilayah. Metode estimasi yang digunakan, karena biasanya sampling sistematik semata-mata hanya untuk mempermudah penarikan sampel, adalah sama dengan acak sederhana. Contoh sampel sistematik Sampling sistematik pada sampling elemen pada dasarnya sama dengan sampling acak, yaitu dapat menggunakan TAR sebagai cara untuk menentukan unit terpilih yang pertama. Pada sampling sistematik unit terpilih kedua dipilih secara sistematik berdasarkan angka random pertama. Sesuai teori diatas angka random pertama adalah unit terpilih pertama. Berdasarkan contoh sampling acak, dimana R1 adalah 02, maka jika dipilih 3 pemenang sekaligus, maka unit terpilih kedua dan ketiga ditentukan dengan menghitung interval. Interval = 30/3 = 10. Sehingga peserta arisan yang terpilih sebagai pemenang adalah dengan nomor urut: R1 = 2
(peserta nomor urut 2)
R2 = 2 + 10 = 12
(peserta nomor urut 12)
R3 = 2 + 2(10) = 22 (peserta nomor urut 22) Contoh lain dapat dilihat di BAB IV. Sampling Berstrata & Contoh Dalam metode sampling dikenal dengan istilah strata, yaitu mengelompokkan unit-unit dalam populasi menjadi strata, dengan tujuan untuk efisiensi penggunaan metode sampling atau untuk keperluan lain seperti domain penyajian (daerah perkotaan dan daerah pedesaan, daerah miskin dan bukan daerah miskin, atau daerah sulit dan bukan daerah sulit). Penggunaan stratifikasi untuk efisiensi metode sampling adalah dengan mengusahakan pengelompokan elemen yang karakteristiknya lebih homogen. Pembentukan strata dapat tidak langsung mengelompokkan elemen, tetapi unit level di atasnya, sebagai contoh desa/kota dapat dijadikan dasar pembentukan strata sedangkan unit samplingnya tetap rumahtangga.
17
Keuntungan Penggunaan Sampling Berstrata 1. 2. 3. 4.
Dapat diperoleh estimasi dengan presisi lebih tinggi Pada setiap strata dapat digunakan metode sampling berbeda Strata dapat dianggap populasi sendiri Dalam beberapa hal membawa manfaat pada pengelolaan administrasi
Pengelompokan unit sampling ke dalam strata yaitu membagi N unit sampling menjadi N1, N2, ……….., NL yang masing-masing menunjukkan jumlah unit dalam strata, yaitu strata ke 1, ke 2, dan seterusnya sampai dengan ke L. L menunjukkan banyak strata yang dibentuk pada populasi. N1 + N2 + ……………. + NL = N Pembentukan Strata dengan Tujuan Meningkatkan Presisi Untuk membentuk strata diperlukan variabel pendukung yang dapat digunakan untuk mengelompokkan unit sampling sehingga varians dari nilai variabel di dalam strata menjadi lebih homogen. Dan bila memungkinkan lebih baik lagi bila dapat diusahakan agar perbedaan rata-rata nilai karakteristik antar strata dibuat sebesar mungkin. Secara skematis pembentukan strata disajikan pada Gambar 3.1. Gambar 3.1: Skema Pembentukan Strata Populasi Bentuk gambar adalah merupakan ciri dari elemen populasi
I
Stratifikasi populasi II III
IV
Berbagai cara dapat dilakukan untuk dasar pembentukan strata tergantung tujuan dari pembentukan strata dan sifat-sifat variabel antara lain: a. Unit sampling itu sendiri, sebagai contoh blok sensus dikelompokkan menurut blok sensus dengan rumahtangga elit dan non elit, blok sensus padat dan blok sensus tidak padat rumahtangga/penduduk. Jadi dalam kasus ini yang dikelompokkan adalah unit sampling itu sendiri dan karakteristiknya juga karakteristik dari blok sensus itu sendiri (lihat Gambar 3.1). b. Variabel wilayah administrasi misalnya desa perkotaan dan desa pedesaan. c. Variabel letak geografis, misalnya desa pantai dan desa bukan pantai.
18
d. Variabel lainnya misalnya kepadatan penduduk, jenis lapangan usaha (daerah pertanian dan non pertanian). e. Perusahaan/usaha bisa dibedakan usaha skala besar, sedang, dan kecil, misalnya berdasarkan omzet atau jumlah tenaga kerja. f.
Sekolah, bisa sekolah negeri dan sekolah swasta.
Notasi N
: banyaknya unit elemen dalam populasi
Nh
: banyaknya unit elemen pada strata ke h
n
: ukuran sampel atau banyaknya unit elemen dalam sampel pada populasi
nh
: ukuran sampel atau banyaknya unit elemen dalam strata ke h
nh Nh Nh Wh N 1 Nh Yh y N h i 1 hi fh
1 yh nh
: fraksi sampel pada strata ke h : penimbang pada strata ke h, atau proporsi banyaknya unit pada strata ke h : rata-rata nilai karakateristik pada strata ke h dari populasi
nh
y i 1
: rata-rata nilai karakteristik pada strata ke h dari simple
hi
Nh 1 S ( y Yh ) 2 N h 1 i 1 hi
: varians strata ke h pada populasi
1 nh s ( y yh ) 2 nh 1 i 1 hi
: varians strata ke h dari sampel
2 h
2 h
Pada pembahasan akan diuraikan estimasi dan penghitungan varians serta penentuan besarnya sampel pada strata dengan metode acak sederhana (stratified simple random sampling). Dengan demikian rumus yang digunakan sama dengan rumus sebelumnya hanya pada notasi ditambah h yang menunjukkan strata.
Yst Yst Varians
L
Yh h 1
1 Y N st
V (Y ) st
L
h 1
L
h 1
Nh nh
Nh 1 N nh
nh
y i 1
nh
i 1
L
yhi
N h nh Sh2 W Nh nh h 1 L
2 h
(7)
hi
W y h
h 1
h
Sh2 W (1 f h ) nh h 1
(8)
L
2 h
(9)
19
N h nh 1, Nh
apabila faktor koreksi diabaikan
sederhana, yaitu V (Y ) st
maka penghitungan varians menjadi
Sh2 . W nh h 1 L
2 h
Untuk nilai varians sampel menjadi:
v(Y ) st v( y ) st
sh2 . W nh h 1 L
2 h
(10)
Penghitungan tersebut dapat dimodifikasi untuk proporsi, yaitu:
1 Ph Nh
Sh2
Nh
y i 1
(11)
hi
Nh P Q Ph Qh , Nh 1 h h L
Nh P N h
Pst
pst
W p
h 1
Qh 1 Ph
L
W P h 1
h
(12)
h
L
h 1
h
h
L
v( p) st
W h 1
2 h
L
v( p) st
W h 1
2 h
(1 f h )
ph qh , nh
qh 1 ph
ph qh nh
(13)
(14)
Alokasi Sampel Alokasi sampel ke dalam setiap strata dapat dilakukan melalui 4 cara, yaitu: a. Alokasi sembarang, alokasi ini jarang dilakukan. b. Alokasi sama, hal ini sering dilakukan apabila S 2 antar strata kurang lebih sama. Sebagai contoh dari kajian di buku Seri 2 diperoleh gambaran bahwa nilai p untuk berbagai variabel antar kecamatan tidak terlalu jauh berbeda (p otomatis dapat menggambarkan varians). Kecamatan sebagai populasi sekaligus sebagai strata bagi kabupaten/kota, maka pada konklusinya dibuat kesepakatan bahwa sampel per kecamatan cukup diwakili 300-500 rumahtangga, dengan memperhatikan juga kompromi besarnya N.
nh
n L
(15)
c. Alokasi sebanding, alokasi ini digunakan bila rata-rata karakteristik antar strata berbeda jauh dan varians strata tidak tersedia. Penghitungan besarnya sampel setiap strata (nh) sebanding dengan banyaknya unit dalam strata (Nh), yaitu:
20
nh
Nh n N n atau h h N n N
(16)
sehingga dalam penghitungan rata-rata populasi tidak perlu ada penimbang, estimasi menjadi:
1 L nh Yˆst , prop y hi . n h 1 i 1
(17)
Atau dengan perkataan lain rata-rata di atas sudah otomatis merupakan rata-rata tertimbang (self weighting design):
1 f V (Yˆ ) st , prop n
L
W h 1
2 h
S h2 .
(18)
Perkiraan varians menjadi:
1 f V (Yˆ ) st , prop n
L
W h 1
2 2 h h
s .
(19)
d. Alokasi optimum. Apabila ada variabel pendukung yang dapat digunakan untuk mengetahui S h2 atau s h2 maka alokasi optimum akan meningkatkan presisi dari metode sampling. Dalam metode ini sampel dialokasikan ke dalam setiap strata agar diperoleh standard error sekecil mungkin dan dengan memperhatikan besarnya variance. Makin besar varians, maka sampel yang dialokasikan juga makin besar, dengan penghitungan sebagai berikut:
nh
Nh Sh L
N h 1
h
n .
(20)
Sh
Dalam penghitungan besarnya sampel dapat digunakan 2 pertimbangan yaitu penetapan besarnya sampel dengan biaya tersedia tetapi menghasilkan varians sekecil mungkin atau sebaliknya dengan varians ditetapkan mendapatkan biaya sekecil mungkin (meminimumkan biaya). Apabila faktor biaya akan diikutsertakan, maka perlu diketahui total biaya tersedia dan atau biaya per unit pada strata (mungkin sama atau mungkin tidak sama). L
C C0
cn h 1
h h
.
(21)
C : total biaya C0 : biaya tidak dipengaruhi desain dan metode sampling ch : biaya per elemen untuk strata h nh : banyaknya unit sampel pada strata ke h Bila faktor biaya dipertimbangkan, maka rumus (20) menjadi:
21
nh
(C C0 ) N h S h / ch L
N h 1
h
n .
(22)
S h / ch
Penentuan besarnya sampel secara keseluruhan adalah: a. Alokasi sama L
L N h2 S h2 h 1
n
(23)
L
N V 2
2
N h 1
h
S
2 h
S
2 h
b. Alokasi sebanding L
N N h S h2 h 1
n
(24)
L
N V 2
2
N h 1
h
c. Alokasi optimum
n
L L N h S h ch N h S h / ch h 1 h 1 L
N V 2
2
N h 1
h
S
(25)
2 h
Bila biaya per unit antar strata sama, maka:
n
L N h Sh h 1
2
(26)
L
N V 2
2
N h 1
h
S
2 h
V di atas berarti standard error yang dikehendaki dan telah memperhitungkan tingkat kepercayaan:
V
V0 Z / 2
(27)
dengan: V0 merupakan standard error yang ditetapkan dan Z/2 = 1,96 bila tingkat keyakinan yang diinginkan 95 %. Untuk sampling proporsi, digunakan rumus yang sama hanya varians diperhitungkan:
Sh2 Ph Qh atau sh2 ph qh .
22
Contoh sampling elemen berstrata Sampling elemen berstrata yang pernah diterapkan diantaranya pada sensus sampel Sensus Ekonomi 2006. Strata yang digunakan adalah golongan klasifikasi perusahaan menurut jenis kegiatannya, sebagai contoh strata: 1 2 3 4 5 6
: : : : : :
Industri Makanan Industri Minuman Industri Pengolahan Tembakau Industri Tekstil Industri Pakaian Jadi Industri Kulit, Barang dari Kulit, dan Alas Kaki
Penarikan sampel dilakukan untuk setiap strata. Proses penarikan sampel dilakukan secara acak atau sistematik seperti bahasan sebelumnya. Tahapannya adalah mengelompokkan unit-unit perusahaan atau usaha berdasarkan hasil sensus ekonomi ke dalam jenis-jenis strata diatas. Kemudian unit-unit di setiap strata dipilih secara sistematik (umumnya). Metode pemilihan sudah dijelaskan pada bahasan sebelumnya. Pada BAB IV diberi contoh konkret sampling sistematik yang menggunakan strata. B. Sampling Klaster & Contoh Metode sampling klaster sebenarnya sama dengan sampling elemen yang berupa acak sederhana, stratifikasi, sistematik dan sampling berpeluang. Perbedaan terletak pada unit sampling yang digunakan. Penarikan sampel pada klaster tidak langsung ke elemen, tetapi terlebih dahulu melalui kelompok elemen yang selanjutnya disebut unit sampling. Pada elemen sampling misalnya rumahtangga sebagai unit sampling, tetapi pada klaster, unit sampling adalah kelompok rumahtangga seperti desa, RT/RW, blok sensus, sekolah, dan sebagainya. Ada dua cara dalam menentukan unit yang diteliti, yaitu: a. Semua elemen/unit yang ada dalam klaster terpilih dikumpulkan informasinya. Penarikan sampel ini disebut sampling satu tahap. b. Sebagian elemen/unit yang ada dalam klaster terpilih dikumpulkan informasinya. Penarikan sampel ini disebut sampling bertahap (multistage cluster sampling). Tahapan penarikan sampel dapat 2 tahap atau lebih dan ditinjau dari efisiensi desain sampel sebaiknya hanya 2 tahap karena makin banyak tahapannya makin kurang efisien. Alasan penggunaan sampling klaster antara lain: a. Pengumpulan data pada unit yang berdekatan lebih mudah, murah, cepat, dan operasi lapangan lebih memungkinkan dibanding bila unit menyebar di seluruh populasi. b. Biaya transport antar individu unit mahal sehingga klaster akan lebih efisien. c. Kesulitan penyediaan kerangka sampel sampai ke elemen sebagai unit sampling.
23
Penghitungan pada sampling klaster untuk perkiraan nilai rata-rata karakteristik suatu variabel bukan merupakan rata-rata per klaster tetapi rata-rata per elemen. Dalam contoh di atas tidak diperkirakan rata-rata per desa, blok sensus, sekolah, dan sebagainya, tetapi ditujukan untuk penghitungan rata-rata per rumahtangga, orang, murid, dan sebagainya. Cara penghitungan dalam sampling satu tahap sama dengan sampling elemen, yaitu untuk memperkirakan rata-rata per elemen. Notasi yang digunakan dan penghitungan dilakukan sebagai berikut: N n Mi
: banyaknya klaster dalam populasi : banyaknya klaster terpilih : banyaknya unit/elemen dalam klaster ke i
n 1 M M n i 1 i
yi
1 Mi
Mi
y i 1
(28)
: rata-rata nilai karakteristik per unit/elemen dari klaster ke i
(29)
: rata-rata perkiraan nilai karakteristik per unit/elemen dari populasi
(30)
Mi
n
y yn
i
: perkiraan nilai rata-rata banyaknya unit/elemen dalam klaster
i 1 j 1 n
M i 1
ij
i
1 f 2 : perkiraan varians dari perkiraan rata-rata s nilai karakteristik per unit/elemen n b 2 n Mi 1 : varians karakteristik 2 sb2 2 ( yi y n ) diantara unit/elemen. n 1 i 1 M v( yn )
(31)
Metode sampling klaster di atas dapat dikembangkan untuk sampling proporsi dan sampling berpeluang serta stratifikasi seperti halnya pada sampling elemen.
24
Cluster 2 Tahap Penarikan sampling bertahap merupakan pengembangan metode sampling klaster satu tahap. Pada uraian hanya akan dibahas untuk sampling dua tahap karena metode sampling ini yang biasanya diaplikasikan untuk survei-survei dengan pendekatan rumahtangga. Penarikan sampel bertahap digunakan dengan alasan: a. Tidak tersedianya kerangka sampel yang memuat unit sampel terkecil b. Membangun kerangka sampel membutuhkan biaya, tenaga, dan waktu yang banyak c. Pengawasan lapangan lebih mudah d. Ditinjau dari biaya lebih efisien dibanding acak sederhana e. Ditinjau dari efisiensi, lebih efisien dari sampling klaster satu tahap. Metode estimasi pada penarikan sampel bertahap tergantung pada cara penarikan sampelnya. Pada survei-survei pendekatan rumahtangga seperti Survei Sosial Ekonomi Nasional dan Survei Tenaga Kerja Nasional digunakan sampling 2 tahap, yaitu tahap pertama memilih blok sensus dan tahap ke dua dari blok sensus terpilih dipilih rumahtangga. Berbagai modifikasi penarikan sampel dapat dilakukan pada metode sampling bertahap. Apabila kedua tahap dilakukan penarikan sampel acak sederhana, maka:
N Yˆ n
M i mi yij i 1 mi j 1 n
(32)
Dalam hal ini
N n
adalah faktor pengali tahap pertama (F1)
Mi mi
adalah faktor pengali tahap kedua (F2i)
kalau dibalik
n N
adalah fraksi sampling tahap pertama (f1)
mi Mi
adalah fraksi sampling tahap kedua (f2i)
dimana mi adalah banyaknya unit tahap kedua yang terpilih dalam sampel. Rumus di atas dapat disederhanakan bila f2i dibuat konstan, misal f2i = 1/5, berarti pada tahap kedua dipilih m i = 1/5 Mi atau faktor pengali tahap kedua menjadi konstan yaitu 5. Dengan demikian estimasi menjadi sederhana, yaitu:
25
N Y F n 2
mii
n
y i 1 j 1
n
ij
F1 F2
mi
y i 1 j 1
ij
(33)
sehingga hasil survei cukup dikalikan dengan satu faktor yaitu F = F1 F2 berarti desain menjadi self weighting. Penerapan selanjutnya dapat dimodifikasi dengan menggunakan perkiraan rasio sebagai estimator. Modifikasi lain adalah menggunakan penarikan sampel tahap pertama dengan ukuran sebanding terhadap banyaknya unit yang akan digunakan pada tahap kedua, sedangkan tahap kedua dapat dilakukan penarikan sampel dengan acak sederhana atau sistematik. Penghitungan perkiraan menjadi:
1 Y n pi
Mi M0
M i'
n
i 1
1 M i' pi mi
mi
y j 1
(34)
ij
: misalkan Mi adalah banyaknya rumahtangga pada blok sensus terpilih ke i yang digunakan sebagai peluang berasal dari kerangka sample : adalah banyaknya rumahtangga pada blok sensus terpilih ke i dari hasil listing
Apabila mi dibuat konstan yaitu m seperti halnya pada Survei Sosial Ekonomi Nasional yaitu 16, maka metode sampling dua tahap tersebut menjadi mendekati self weighting design. Dengan menggunakan estimator rasio, maka penyesuaian (adjustment) estimasi dapat dilakukan.
M0 Y k nm
k
n
m
y i 1 j 1
(35)
ij
Y berasal dari sumber lain Y
Untuk metode sampling ini penghitungan perkiraan menjadi sederhana bila penarikan sampel dilakukan dengan peluang secara pemulihan.
v(Y )
1 n(n 1)
1 Mi Yi pi mi
n
(Y Y) i 1
i
2
(36)
mi
y j 1
ij
Secara umum dalam sampling dua tahap varians perkiraan dipengaruhi oleh varians dari unit sampling tahap pertama dan varians unit sampling tahap kedua. Karakteristik unit sampling tahap pertama biasanya lebih heterogen dan karakteristik unit sampling tahap kedua lebih homogen. Sebagai contoh karakteristik/sifat-sifat unit di dalam blok
26
sensus lebih homogen dibandingkan karakteristik antar blok sensus. Rumahtangga yang berdekatan biasanya lebih homogen. Varians unit sampling tahap pertama dan tahap kedua masing-masing ditulis sebagai berikut:
Sb2
S w2i
S w2
:
varians (standar deviasi kuadrat) dari karakteristik per unit antar klaster : varians dari nilai karakteristik per unit dalam klaster
: rata-rata varians dari karakteristik per unit yang diperhitungkan dari masing-masing klaster.
Penarikan sampel 2 tahap (two stage sampling) dapat dikembangkan menjadi double sampling (two phase sampling). Perbedaan antara two stage sampling dan two phase sampling adalah pada penarikan sampel tahap kedua. Pada double sampling, penarikan sampel unit sampling tahap kedua langsung dilakukan pada masing-masing unit sampling tahap pertama terpilih secara independent. Sedangkan pada two stage sampling, penarikan sampel dari unit tahap kedua dilakukan setelah dibentuk kerangka sampel baru secara keseluruhan pada unit sampel terpilih tahap pertama. Pengkajian Besarnya Sampel Pada metode sampling, penentuan besarnya sampel merupakan hal penting yang perlu dipikirkan sebelum melangkah lebih lanjut dengan melihat sifat-sifat variabel yang menjadi tujuan survei. Sifat-sifat variabel yang makin heterogen atau makin langka kejadiannya akan memerlukan sampel yang cukup besar, bahkan kemungkinan apabila sangat langka atau sangat heterogen maka tidak akan memungkinkan digunakan probability sampling. Metode kajian besarnya sampel untuk variabel MDGs yang sesuai dengan penghitungan indikator MDGs berupa proporsi, maka cara yang mudah untuk mengkaji besarnya sampel yaitu dengan menggunakan rumus untuk proporsi menjadi
n
Z2/2 PQ , Q = (1 – P). d2
Apabila margin of error e persen dari p (d = e p), maka rumus menjadi:
n
Z 2/ 2 PQ (ep) 2
(37)
dan bila nilai proporsi diperoleh dari survei sampel sebelumnya, untuk pengkajian besarnya sampel, maka penghitungannya menjadi:
n
Z 2/ 2 pq . (ep) 2
(38)
27
Penghitungan di atas didasarkan pada sampling elemen dan perlu disesuaikan apabila digunakan sampling bertahap dengan memperhitungkan design effect-nya (deff). Kajian buku Seri 2 menggunakan deff sebesar 1, dengan pertimbangan bahwa dari penghitungan, cukup banyak variabel dengan deff mendekati 1. Disamping itu penyesuaian lain adalah perlu diperhitungkan adanya non response. Dengan memperhitungkan non response sebesar 5 persen dan bila dimasukkan ke dalam rumus, penghitungannya menjadi:
Z2/ 2 ( p)(q)(deff )(1,05) . m0 (ep) 2 ( k )( x )
(39)
Pada penghitungan sampling elemen penarikan sampel langsung ke elemen sehingga n menunjukkan banyaknya rumahtangga terpilih. Pada penghitungan sampling dua tahap, banyaknya rumahtangga terpilih dinyatakan dengan m dan banyaknya blok sensus terpilih dinyatakan dengan n. Sedangkan deff sendiri sangat tergantung pada besarnya rumahtangga terpilih dalam blok sensus dan intracluster correlation coefficient ( ). Pada penghitungan di atas, diperhitungkan pula besar k dan x , dengan penjelasan sebagai berikut: p : perkiraan proporsi kejadian dari indikator yang diperkirakan (proporsi kejadian dari target populasi), lihat Tabel 4.11 buku Seri 2 publikasi sebelumnya yang menunjukkan cara penghitungan p k
: proporsi kejadian dari target populasi terhadap populasi
x : rata-rata banyaknya anggota rumahtangga yang perlu diperhitungkan karena unit samplingnya adalah rumahtangga
deff
Varians suatu metode sampling 1 (m 1) Varians metode acak sederhana (elemen) (n 1)m sb2 n sw2 (n 1)m sb2 n(m 1) sw2
(40)
(41)
dengan: m0
: banyaknya seluruh rumahtangga yang harus dipilih
m
: banyaknya rumahtangga dipilih per klaster
n
: banyaknya klaster terpilih
m0 = n m m
( yij yi ) 2 2 M 1 i sb2 ( yi yn ) 2 s w2i i 1 2 ˆ n 1 i 1 M (m 1) n
, dimana
28
m
yi
yij i 1
m
n
s w2
s i 1
n
2 wi
.
Dengan melihat rumus di atas maka di dalam penghitungan besarnya sampel sangat dipengaruhi bagaimana tingkat heterogenitas karakteristik suatu variabel baik antar klaster maupun dalam klaster. Contoh Sampling Klaster Sampling klaster dalam kehidupan sehari-hari dapat ditemui seperti survei yang dilakukan untuk mengetahui persentase rumahtangga menurut golongan tingkat pendidikan kepala rumahtangga. Survei berbasis klaster adalah survei yang selama ini sering digunakan BPS, seperti Susenas, Sakernas, SDKI, dll. Klaster yang digunakan adalah blok sensus. Penarikan sampel klaster dapat menerapkan metode acak, sistematik, atau dengan sampling berstrata. Umumnya klaster terpilih dipilih dengan metode PPS (Probability Proportional To Size). Prinsip PPS adalah blok sensus dengan size (biasanya jumlah rumahtangga seiap blok) terbesar memiliki peluang terpilih terbesar. Penjelasan lebih detail tentang PPS dapat dilihat pada buku seri 2 dan 4. Setiap desa/kelurahan dibagi habis menjadi blok sensus yang mencakup sekitar 80-120 rumahtangga dengan batas-batas yang jelas/mudah dikenali, baik batas alam maupun buatan. Batas satuan lingkungan setempat (SLS) seperti RT, RW, dusun, lingkungan, dan sebagainya, diutamakan sebagai batas blok sensus bila batas SLS tersebut jelas (batas alam atau buatan). Apabila memungkinkan dan memenuhi syarat disarankan SLS adalah ekuivalen sebagai blok sensus atau gabungan dari SLS sehingga lebih mudah dalam pengenalannya. Satu blok sensus harus terletak dalam satu hamparan. Ada 3 jenis blok sensus, yaitu: Blok sensus biasa (B) adalah blok sensus yang sebagian besar muatannya antara 80 sampai 120 rumahtangga atau bangunan tempat tinggal atau bangunan bukan tempat tinggal atau gabungan keduanya. Blok sensus ini yang dimasukkan kerangka sampel sebagai dasar pemilihan sampel blok sensus (sampling tahap pertama). Blok sensus khusus (K) adalah blok sensus yang tertutup untuk umum. Tempat-tempat yang biasa dijadikan blok sensus khusus antara lain asrama/barak militer, asrama perawat, panti asuhan dengan 100 penghuni atau lebih dan lembaga pemasyarakatan (tidak ada batasan jumlah penghuni). Blok sensus persiapan (P) adalah blok sensus yang kosong seperti sawah, kebun, tegal, rawa, hutan, daerah yang dikosongkan (digusur) atau bekas permukiman yang terbakar atau daerah kosong yang dipersiapkan untuk pemukiman. Estimasi Prosedur estimasi disesuaikan dengan tatacara penarikan sampel. Prosedur estimasi dapat dilakukan melalui dua cara, yaitu:
29
a. Dengan memperhitungkan secara langsung dengan rumus sampling dua tahap (jika digunakan sampling dua tahap):
1 n M 0 M i' m ˆ Yi yij n i 1 M i m j 1
(42)
Nilai M i' diambil dari hasil listing dan pada penghitungan pada saat pengolahan digunakan sebagai penimbang.
M M' Yˆi 0 i Mi m
m
y j 1
ij
n 1 v( y ) (Yi Y ) 2 n(n 1) i 1
(43)
(44)
b. Estimasi ini dapat disederhanakan dengan menggunakan estimasi rasio, dengan data pendukung dari sumber lain, yaitu proyeksi rumahtangga atau penduduk. Apabila digunakan estimator cara ini, perlu dipersiapkan data pendukungnya. Bila digunakan estimator rasio, maka estimasi pada suatu kecamatan, adalah sebagai berikut: Data Rumahtangga Estimasi nilai rata-rata karakteristik per rumahtangga:
y
1 n m y nm i 1 j 1 ij
(45)
= perkiraan banyaknya rumahtangga pada suatu kecamatan, dapat diambil dari M 0 sumber lain atau berdasarkan estimasi yang disesuaikan dengan data penduduk yang digunakan. Misal digunakan jumlah penduduk dari proyeksi( P ), maka:
Mˆ 0
Pˆ Rata - rata anggota rumah tangga dari sampel
Rata-rata banyaknya anggota rumahtangga dari sampel: n
R amg rt
y i 1
i ,ang rt
n
m i 1
,
i
apabila mi konstan seperti disarankan, yaitu antara 12-20, maka:
30
n
R amg rt
y i 1
i ,ang rt
.
nm
Data rumahtangga lainpun dapat dihitung perkiraannya dengan menggunakan rumus di atas, dimana yi diganti karakteristik dari variabel lainnya, seperti rumahtangga dengan sanitasi sendiri, air bersih, dan sebagainya. Estimasi ini akan menunjukkan proporsi rumahtangga dengan sanitasi sendiri, air bersih, dan sebagainya. Dengan demikian untuk tabulasi dapat digunakan faktor pengali karakteristik rumahtangga yaitu:
Frt
Mˆ 0 Mˆ Perkiraan rumah tangga n 0 nm Rumah tangga sampel mi
.
(46)
i 1
Catatan : Hati-hati bila ada non response, maka faktor pengali harus disesuaikan dengan adanya non response. Data Individu/Penduduk Cara penghitungan perkiraan data penduduk sama seperti cara penghitungan variabel rumahtangga, hanya dalam hal ini digunakan rasio banyaknya penduduk pada kecamatan bersangkutan yang disesuaikan dengan banyaknya penduduk saat survei yang telah disepakati, misalnya data proyeksi. Estimasi nilai rata-rata karakteristik per rumahtangga:
y yij
:
Pend :
1 n mi y nm i 1 j 1 ij
nilai karakteristik penduduk dari rumahtangga ke j blok sensus ke i Perkiraan banyaknya penduduk pada suatu kecamatan yang diambil dari sumber lain, misal proyeksi penduduk.
Dari data sampel dapat diperoleh banyaknya rumahtangga dalam sampel, misal p pend. Dengan demikian dapat dihitung faktor pengali penduduk untuk suatu kecamatan, yaitu:
Fpend
Perkiraan penduduk kecamatan Pˆpend Penduduk dalam sampel p pend
.
Standard Error dan Tingkat Kepercayaan Pada rumus sebelumnya telah dijelaskan mengenai metode estimasi baik untuk perkiraan total dan rata-rata atau proporsi dan varians. Kedua estimasi ini sangat erat dengan penghitungan standard error dan tingkat kepercayaan.
31
Standard error diperhitungkan untuk melihat perkiraan kesalahan yang timbul akibat penggunaan metode sampling dan relative standard error menunjukkan persentase kesalahan tersebut. Sedangkan standard error sendiri dihitung dari akar varians. Dari hasil survei, penghitungan tersebut dinyatakan:
se( y )
v( y ) atau se(Y )
v(Y )
se( y ) se(Y ) . rse( y ) rse(Y ) y Y
(47)
Penggunaan hasil penghitungan standard error ini perlu dilengkapi dengan menunjukkan selang kepercayaannya (confidence interval) dengan menetapkan tingkat kepercayaan/keyakinan misalnya 95 persen atau 99 persen, yang masing-masing berarti Z/2 =1,96 atau Z/2 = 2,58. Selang kepercayaan ini dapat dituliskan sebagai berikut: p + Z/2 (e.p)
y Z / 2 (e. y )
(48)
Y Z / 2 (e.Y ) . Penghitungan standard error dari data hasil survei diharapkan menghasilkan margin of error sesuai yang diharapkan saat penetapan besarnya sampel pada saat mendesain sampel (rse e). e = persentase margin of error atau standard error ep = standard error . Penghitungan varians dan standard error selain menggunakan rumus di atas dapat didekati dengan rumus yang digunakan pada saat memperkirakan m, yaitu:
m
Z2/ 2 ( p)(1 p)(deff )(1,05) (ep) 2 ( k )( x )
Z2/ 2 ( p)(1 p)(deff )(1,05) e m p 2 ( k )( x ) 2
e
(49)
Z2/ 2 (1 p)(deff )(1,05) m p ( k )( x )
Z2/ 2 (1 p)(deff )(1,05) . m p( k )( x )
Nilai-nilai p, k, x , deff, dan
(50)
1,05 = m' dihitung dari hasil survei. m
Perlu diperhatikan disini bahwa nilai penyebut yang menunjukkan banyaknya sampel rumahtangga langsung dihitung dari sampel rumahtangga yang diolah, yaitu m' , sehingga:
e
Z 2/ 2 (1 p)(deff ) m' p( k )( x )
32
BAB IV. APLIKASI PENARIKAN SAMPEL Contoh Penyediaan Kerangka Sampel Penggunaan daftar Listing Rumahtangga Mengapa diperlukan listing rumahtangga? Penarikan sampel yang sering digunakan adalah 2 tahap, yaitu tahap pertama memilih blok sensus dan pada tahap kedua memilih rumahtangga. Selanjutnya rumahtangga terpilih sebagai unit observasi dimana informasinya dikumpulkan baik informasi rumahtangga maupun informasi orang/perorangan. Listing atau pendaftaran rumahtangga pada blok sensus terpilih sangat diperlukan, karena: a. Tidak tersedia daftar rumahtangga yang mutakhir. Perubahan keberadaan rumahtangga jauh lebih cepat dibandingkan dengan perubahan suatu area. b. Pada saat listing, yang didaftar tidak terbatas pada rumahtangga saja tetapi dapat pula dikumpulkan variabel pendukung yang dapat digunakan untuk:
Efisiensi penarikan sampel, misal untuk pengaturan penarikan sampel diperlukan variabel lain sebagai dasar untuk penggolongan rumahtangga,
Membentuk unit sampling sesuai keperluan survei,
Menambah variabel guna estimasi karena variabel tersebut merupakan variabel yang langka/kejadiannya jarang,
Daftar Listing
33
Penyediaan daftar listing harus sesuai dengan metode sampling yang akan digunakan. Daftar listing dapat sederhana atau rinci disesuaikan dengan tujuannya seperti telah dijelaskan yaitu hanya terbatas untuk keperluan penarikan sampel atau perlu lebih rinci dengan memasukkan beberapa variabel penting yang memerlukan ditemukannya kejadian lebih banyak seperti pertanyaan kelahiran dan kematian. Blok sensus umumnya terdiri dari sekitar 100 rumahtangga dan sampel rumahtangga pada setiap blok sensus terpilih hanya sekitar 12-20 rumahtangga. Jadi bila pertanyaan rare cases seperti kelahiran dan kematian ditanyakan melalui listing, maka responden akan sebanyak 100/12 kali dibandingkan melalui surveinya sendiri (bila rumahtangga untuk survei adalah 12 rumahtangga per blok sensus). Tetapi perlu perhatian dalam estimasi dan penimbang karena penarikan sampel blok sensus menggunakan peluang sebanding dengan banyaknya rumahtangga. Contoh: Daftar listing sederhana untuk suatu blok sensus terpilih bila hanya digunakan untuk penarikan sampel rumahtangga.
Contoh Pendaftaran Rumahtangga PENDAFTARAN RUMAHTANGGA No. Segmen (1)
Nama RT/RW dan nama jalan (2)
No. urut bangunan fisik
No. urut bangunan sensus
No. urut rumah tangga
Nama kepala rumah tangga
Banyaknya anggota rumah tangga
(3)
(4)
(5)
(6)
(7)
Daftar di atas merupakan contoh variabel yang perlu dimasukkan dalam daftar listing untuk penarikan sampel rumahtangga secara langsung tanpa mengkaitkan dengan variabel lainnya. Walaupun daftar listing tersebut sederhana, tetapi yang terpenting adalah pekerjaan pendaftaran rumahtangga dilakukan dengan hati-hati agar tidak terlewat atau duplikasi karena hal ini akan mempengaruhi estimasi. Kecenderungan selama ini kesalahcakupan yang terjadi adalah lewat cacah karena adanya batas-batas blok sensus yang kurang jelas atau karena wilayahnya luas sehingga tidak semua bangunan terdeteksi. Coverage error yang terjadi selama ini mengakibatkan estimasi secara direct estimate melalui rumus menyebabkan bias yang cukup besar. Oleh karena
34
itu agar estimasi lebih efisien, digunakan ratio estimator dengan menggunakan data proyeksi penduduk atau data administrasi lainnya yang lebih akurat. Contoh 1 : Penarikan Sampel Elemen (Rumahtangga) Berdasarkan contoh Pendaftaran Rumahtangga diatas, maka jika pada tahap kedua akan dilakukan penarikan sampel langsung rumahtangga, maka dapat digunakan nomor urut rumahtangga di kolom (5) pada contoh 5. Penarikan sampel rumahtangga disarankan secara sistematik, karena akan mempermudah penarikan sampel oleh petugas, yaitu cukup mengambil satu angka random. Nomor urut terakhir di kolom (5) menunjukkan banyaknya rumahtangga pada blok sensus (Mi) dan selanjutnya pada setiap blok sensus dipilih antara 12-20 rumahtangga (perlu ditetapkan misalnya 16). Hitung interval untuk penarikan sampel rumahtangga, yaitu:
I
Banyaknya rumah tangga hasil listing m
Cari angka random < I (R1) Dan selanjutnya ditentukan rumahtangga terpilih secara keseluruhan, yaitu: R1 R 2 = R1 + I R3 = R2 + I = R1 + 2I R4 = R3 + I = R1 + 3I . Rm = Rm + I = R1 + (m-1)I Rumahtangga yang mempunyai nomor urut sama dengan angka random di atas dilingkari. Rumahtangga terpilih adalah rumahtangga yang nomor urutnya dilingkari dan rumahtangga terpilih tersebut selanjutnya dituangkan ke dalam daftar sampel rumahtangga yang telah ditentukan, sebagai pedoman petugas untuk mengadakan wawancara. Hindari penggantian sampel karena hal ini akan menyebabkan bias dalam estimasi dan bila diperkenankan penggantian sampel ada kecenderungan petugas dengan mudah melakukan penggantian sampel. Contoh 2 : Penarikan Sampel Elemen Berstrata (Perusahaan) Pada tabel berikut, populasi perusahaan dibedakan menurut 24 strata KBLI (Klasifikasi Baku Lapangan Usaha). Penarikan sampel perusahaan dilakukan untuk setiap strata dan dengan cara sistematik. Jumlah sampel setiap strata sama (equal sample size)
Jumlah populasi dan sampel Industri Mikro menurut KBLI
35
Populasi
1 15
2 24
3 12
4 42
5 27
.... …
.... …
…. …
…. …
… …
24 12
Jumlah 275
Sampel
3
3
3
3
3
…
…
…
…
…
3
72
…
…
…
…
…
Interval
15/3 24/3 12/3 42/3 27/3 =5
=8
=4
=14
=9
12/3 =4
Perusahaan untuk setiap strata diberikan nomor urut 1 sd N. Selanjutnya untuk setiap strata masing-masing dipilih angka random pertama (R1≤Interval). Selanjutnya perusahaan terpilih adalah dengan nomor urut sesuai angka R: Strata 1 : Jika R1 = 1, maka R2 = 1+5 = 6, R3 = 1 + 2(5) = 11 Strata 2 : Jika R1 = 5, maka R2 = 5+5 = 10, R3 = 5 + 2(5) = 15 Strata 3 : Jika R1 = 1, maka R2 = 1+5 = 6, R3 = 1 + 2(5) = 11 Strata 4 : Jika R1 = 7, maka R2 = 3+5 = 8, R3 = 3 + 2(5) = 13 Strata 5 : Jika R1 = 2, maka R2 = 2+5 = 7, R3 = 2 + 2(5) = 12 ........... Strata 24 : Jika R1 = 4, maka R2 = 4+5 = 9, R3 = 4 + 2(5) = 14 Tambahan : Setelah proses pengolahan data selesai, maka diperlukan segera proses tabulasi termasuk didalamnya estimasi dan penghitungan Sampling Error. Penghitungan Sampling Error menggunakan paket program CENVAR Variance Calculation System. Sampling Error (kesalahan sampling) adalah kesalahan yang disebabkan oleh metode sampling yang digunakan. Sampling error merupakan akar dari varians estimasi yang menunjukkan tingkat keragaman dari nilai-nilai estimasi. Sering disebut sebagai standard error yang jika dibagi dengan nilai estimasi merupakan relative standard error (RSE). RSE adalah kesalahan yang disebabkan oleh metode sampling yang digunakan. Overview of CENVAR: CENVAR adalah paket program dalam IMPS (Integrated Microcomputer Processing System) yang ditujukan untuk menghitung presisi dan akurasi dari rancangan survei sampel yang digunakan. Indikator yang digunakan adalah melalui penghitungan estimasi dan standard error untuk mengukur ketepatan ukuran terhadap parameter populasi seperti total, rata-rata, rasio, dan proporsi untuk domain estimasi yang berbeda. Untuk setiap parameter spesifik dan domain dari estimasi, CENVAR mengeluarkan output tabel yang terdiri dari: a. Nilai Estimasi Parameter b. Standard Error c. Coefficient of Variation (RSE)
36
d. Confidence Interval (95%) e. Design Effect (DEFF) f.
Jumlah Observasi sampel darimana estimasi tersebut dihitung
Dengan komponen output berupa indikator tersebut diatas, seorang pengguna dapat melihat sejauh mana akurasi data metode sampling yang diterapkan pada survei tersebut. Dengan demikian pengguna dapat mengkaji sekaligus mengevaluasi realibilitas dari hasil survei. CENVAR mempunyai 4 jenis tipe file: a. Data Dictionary file : adalah komponen utama yang terdapat dalam CENVAR Data Dictionary berfungsi untuk mendefinisikan variabel serta layout data. File data dictionary akan mempunyai ekstention file DD. b. Data file : Data yang dapat diakses adalah berupa ASCII file dalam format DAT. c. Settings File : Berisi rancangan sampel yang digunakan, dengan ekstention file CVF. Settings file ini sangat tergantung kepada layout data yang sudah didefinisikan sebelumnya. d. Output file : Berupa tabel dalam format ASCII dengan ekstention VAR. Tampilan menu utama dalam program IMPS seperti gambar 6.9.
Gambar 6.9 Untuk menjalankan CENVAR, maka secara umum ada beberapa tahapan yang perlu dipersiapkan, yaitu: a. Menentukan tabulasi yang akan dihasilkan pada survei b. Memilih sejumlah variabel yang akan disajikan nilai sampling error-nya c. Menentukan spesifikasi untuk analisis variabel tabel sampling error
37
d. Membuat layout input data CENVAR dengan data dictionary e. Running CENVAR f.
Modifikasi output CENVAR
Adapun penjelasan yang detail tentang CENVAR akan dijelaskan dalam uraian tersendiri. Latihan-latihan Berikut akan diberikan latihan pemutakhiran kerangka sampel dan latihan penarikan sampel. Latihan pemutakhiran kerangka sampel adalah melakukan pengecekan keberadaan blok sensus beserta muatannya sebagai unit pertama yang dipilih. Latihan penarikan sampel merupakan penarikan sampel rumahtangga yang dilakukan secara sistematik.
Latihan Pemutakhiran Kerangka Sampel:
Nurt
(1)
NAMA KRT
(2)
Keberadaan ruta 1 – Ditemukan 2 - Ganti KRT 3 - Pindah dlm BS 4 - Pindah luar BS 5 - Tdk ditemukan 6 – Baru (3)
Pendidikan Kepala Ruta
<SMP
SMP
SMA
SMA>
(4)
(5)
(6)
(7)
1
HAIJA SUMIRA
V
2
HADIYANTO
3
SUHARMAJI
4
IR RUDY WIDONO
V
5
HAMZAH TANZIL
V
6
ROBERT JOHAN
7
MONICA WIJAYA
8
DIONNY PALIT
9
HENGKI WIJAYA
V
10
GO RUSLI
V
11
MUH WANDI
12
IRENE LIMPO
13
LIANG MING HHIANG
V V
V V V
V V V
38
14
DAENG BADO
V
15
SYAMSUDDIN
V
16
YANTO
V
17
SUMINI
V
18 19
HENDRIK WIJAYA DATTIA JEMMY WIJAYA
20
BENNY WIJAYA
V V V
Tabel diatas menunjukkan data nama kepala rumahtangga hasil pencacahan Sensus Penduduk pada suatu blok sensus yang terpilih sampel kegiatan suatu survei A. Blok sensus tersebut selanjutnya akan dimutakhirkan untuk mendapatkan informasi rumahtangga terbaru, selanjutnya akan dipilih sampel sebanyak 5 rumahtangga. Dari informasi lapangan diperoleh informasi bahwa rumahtangga yang masih ditemukan adalah nomor urut 1,2,4,5,7,8,9,10,14,15,18,19,20. Rumahtangga yang sudah pindah dari blok sensus tersebut adalah nomor urut 3 dan 16. Rumahtangga nomor urut 6,11,12 tidak ditemukan, dan nomor urut 13 & 17 salah nama yaitu harusnya Lian Min dan Suminiwati. Sedangkan dari penulusuran lapangan tidak terdapat rumahtangga baru. Untuk pendidikan kepala rumahtangga sudah sesuai. Isilah form diatas sesuai keterangan diatas.
Latihan Penarikan Sampel: Dengan menggunakan sampling sistematik, lakukan penarikan sampel dengan terlebih dahulu mengurutkan rumahtangga berdasarkan tingkat pendidikan. Sehingga rumahtangga pada kolom pendidikan karuta <SMP diurutkan sampai selesai terlebih dahulu, kemudian baru ke kolom selanjutnya. Latihan Estimasi dan Sampling Error: Dari soal diatas, misalkan diketahui 5 sampel data yang dikumpulkan menurut variabel sbb: Nus Rata-rata pengeluaran Pendidikan mak&non mak perkpt/bln KRT 1 550000 SMA 2 345000 SMP 3 650000 PT 4 225000 SMA 5 820000 PT Buatlah estimasi rata-rata pengeluaran makanan&non makanan perkpt/bln beserta nilai standard error (relative standard error) pada blok sensus tersebut. Juga coba hitung estimasi proporsi KRT tamat PT.
39
Lampiran KONSEP DEFINISI Blok Sensus Biasa adalah blok sensus yang muatannya antara 80 sampai 120 rumahtangga atau bangunan sensus tempat tinggal atau bangunan sensus bukan tempat tinggal atau gabungan keduanya dan sudah jenuh. Blok Sensus Khusus adalah blok sensus yang mempunyai muatan sekurangkurangnya 100 orang, kecuali untuk lembaga permasyarakatan tidak ada batas muatan. Tempat-tempat yang bisa dijadikan blok sensus khusus antara lain asrama militer (tangsi) dan daerah perumahan militer dengan pintu keluar masuk yang dijaga. Blok Sensus Persiapan adalah blok sensus yang kosong seperti sawah, kebun, tegalan, rawa, hutan, daerah yang dikosongkan (digusur) atau bekas permukiman yang terbakar. Sub Blok Sensus adalah bagian dari blok sensus. Blok sensus yang mempunyai muatan lebih dari 150 rumahtangga harus dipecah menjadi beberapa sub blok sensus. Bangunan Fisik adalah tempat berlindung yang mempunyai dinding, lantai, dan atap, baik tetap maupun sementara, baik digunakan untuk tempat tinggal maupun bukan tempat tinggal. Bangunan dapur, kamar mandi, garasi, dan lainnya yang terpisah dari bangunan induk dianggap bagian dari bangunan induk tersebut (satu bangunan) jika terletak dalam satu pekarangan. Bangunan yang luas lantainya kurang dari 10 m 2 dan tidak digunakan untuk tempat tinggal dianggap bukan bangunan fisik.
40
Bangunan Sensus adalah sebagian atau seluruh bangunan fisik yang mempunyai pintu keluar masuk sendiri dan dalam satu kesatuan penggunaan. Segmen adalah satuan/kumpulan dari bangunan fisik yang mempunyai batas yang jelas dan membagi habis wilayah blok sensus. Lingkungan adalah satuan wilayah yang membagi habis suatu desa dan biasanya mempunyai seorang kepala yang dipilih oleh masyarakat setempat. Rumahtangga Biasa adalah seorang atau sekelompok orang yang mendiami sebagian atau seluruh bangunan fisik atau sensus, dan biasanya tinggal bersama serta makan dari satu dapur. Rumahtangga biasa umumnya terdiri dari bapak, ibu, dan anak. Anggota Rumahtangga adalah semua orang yang biasanya bertempat tinggal di suatu rumah tangga, baik yang berada di rumahtangga maupun sementara tidak ada pada waktu pencacahan. Anggota rumahtangga yang telah bepergian 6 bulan/lebih, dan yang bepergian kurang dari 6 bulan tetapi dengan maksud pindah selama 6 bulan/lebih, tidak dianggap sebagai anggota rumahtangga. Sebaliknya orang yang telah tinggal 6 bulan/lebih atau bermaksud tinggal 6 bulan/lebih dianggap sebagai anggota rumah tangga.
GLOSSARY Populasi merupakan agregasi dari seluruh elemen yang perlu ditentukan berikut isi, unit, cakupan, dan waktu. Sebagai contoh populasi adalah semua penduduk yang bertempat tinggal dalam rumahtangga biasa di Kecamatan Polobangkang Selatan, Kabupaten Takalar, pada bulan Agustus tahun 2007. Contoh lain populasi adalah semua sekolah SD Negeri yang ada di Kecamatan Polobangkang Selatan, Kabupaten Takalar. Target populasi merupakan sub populasi dari elemen yang ada pada populasi yang berbagai indikatornya akan dicari, seperti penduduk usia 7-12 tahun. Elemen adalah unit yang digunakan untuk mendapatkan informasi, misalnya rumahtangga. Elemen biasanya merupakan unit sampling terkecil (ultimate sampling unit). Unit Observasi adalah unit dimana informasinya diperoleh baik secara langsung maupun melalui responden tertentu. Elemen sangat erat kaitannya dengan unit observasi. Elemen bisa sama dengan unit observasi, sebagai contoh rumahtangga adalah selain sebagai elemen juga dapat sebagai unit observasi, misal pengumpulan data keadaan tempat tinggal. Unit observasi bisa individu dari elemen, misalnya anggota rumahtangga. Unit Sampling adalah unit yang dijadikan dasar penarikan sampel baik berupa elemen maupun kumpulan elemen (klaster). Sebagai contoh, rumahtangga dapat dijadikan sebagai unit sampling dan atau kumpulan rumahtangga pada wilayah tertentu dapat dijadikan unit sampling seperti blok sensus, RT/RW, bahkan desa. Di luar rumahtangga
41
cukup banyak unit yang dapat dijadikan unit sampling sesuai dengan tujuan survei seperti sekolah, kelas, Puskesmas, perusahaan/usaha dan sebagainya. Daftar Unit (Unit List) adalah daftar unit yang digunakan sebagai dasar penarikan sampel seperti daftar blok sensus, daftar rumahtangga, daftar perusahaan/usaha, daftar sekolah, daftar kelas, daftar murid, dan sebagainya. Karakteristik adalah ciri, sifat atau hal-hal yang dimiliki elemen, seperti penghasilan, pengeluaran, biaya, jumlah anggota rumahtangga. Prevalensi/kejadian merupakan kejadian pada target populasi yang berbagai indikatornya akan disajikan dan diperhitungkan terhadap target populasi, seperti Angka Partisipasi Murni (APM) SD, yaitu kejadian penduduk usia 7-12 tahun masih sekolah dibagi dengan penduduk usia 7-12 tahun (target populasi). Sensus Lengkap adalah pendataan secara lengkap seluruh unit yang ada dalam suatu wilayah (populasi). Hasilnya merupakan data populasi yang disebut parameter. Sebagai contoh, tujuan dari berbagai jenis sensus adalah untuk memperoleh data penduduk, pertanian, usaha industri, perdagangan dan sebagainya dari populasi. Sampling ialah cara pengumpulan data melalui sebagian unit dalam populasi dan hasilnya merupakan data perkiraan atau estimate. Oleh karena tidak semua elemen diteliti, maka data perkiraan akan berbeda dengan parameter. Perbedaan atau selisih itu disebut kesalahan samping (sampling error). Makin kecil kesalahan sampling suatu perkiraan, makin teliti perkiraan tersebut, nilainya makin dekat dengan nilai parameter. Probability Sampling atau penarikan sampel dengan menggunakan peluang ialah metode penarikan sampel yang memperhatikan suatu nilai untuk mengukur tingkat kemungkinan terjadinya kejadian sampel tersebut. Dalam hal ini dipergunakanlah fungsi probabilitas yaitu fungsi yang dapat dipergunakan untuk menghitung probabilitas suatu kejadian. Non Probability Sampling atau penarikan sampel yang tidak menggunakan prinsip probabilitas, dalam artian sampel yang diambil berdasarkan kriteria-kriteria tertentu sesuai maksud dan tujuan dari survei atau penelitian tersebut. Sampling Error (kesalahan sampling) adalah kesalahan yang disebabkan oleh metode sampling yang digunakan. Sampling error merupakan akar dari varians estimasi yang menunjukkan tingkat keragaman dari nilai-nilai estimasi. Sampling error disebut juga standard error. Standard error bila dibagi dengan nilai rata-rata merupakan relative standard error (kesalahan yang disebabkan oleh metode sampling yang dinyatakan dalam persen). Non Sampling Error adalah kesalahan yang bukan disebabkan oleh metode sampling yang digunakan. Kesalahan ini bersumber kepada masalah seperti pendataan lapangan yang kurang akurat, sampel yang tidak semestinya, pemahaman konsep dan definisi yang belum baik, kesalahan pengolahan dan sebagainya.
Sampel atau contoh ialah sebagian dari populasi. Elemen-elemen anggota sampel, merupakan anggota populasi darimana sampel diambil.
42
Master File (Kerangka Induk) adalah keseluruhan file yang berisi daftar semua elemen/unit atau kelompok elemen/unit secara lengkap berikut identitas dan informasinya dengan kondisi lengkap dan mutakhir. Kerangka Sampel adalah daftar semua unit yang akan dijadikan sampling unit (sebagai dasar penarikan sampel) dan harus memenuhi persyaratan kerangka sampel yang dibentuk dari master file. Kerangka sampel merupakan semua unit dalam suatu populasi yang nilai parameternya akan diperkirakan. Memilih sampel berarti memilih beberapa sampling unit dari kerangka sampel untuk membuat perkiraan. Daftar Sampel merupakan daftar dari unit sampling yang terpilih dalam sampel, baik berupa kelompok unit maupun berupa elemen/unit sampling terkecil. Unit sampling terpilih dilengkapi dengan identitas lokasi secara lengkap. Korelasi (R) menunjukkan keeratan hubungan suatu variabel dengan variabel lainnya dari unit-unit yang ada, seperti hubungan pendidikan dengan pendapatan, pendapatan dengan pengeluaran rumahtangga. Intraclass / Intracluster / Intercluster Correlation Coefficient ( ) menunjukkan keeratan hubungan suatu karakteristik antara unit-unit dalam klaster. Makin besar ( ) berarti hubungan makin erat atau kecenderungan unit-unit dalam klaster mempunyai karakteristik yang homogen. Sebagai contoh rumahtangga yang lokasinya berdekatan cenderung karakteristiknya homogen. Rate of Homogenity adalah ukuran yang menunjukkan tingkat homogenitas antar unit di dalam kelompok/cluster. Design Effect adalah suatu ukuran yang menyatakan nilai keterbandingan antara desain sampel yang digunakan dalam suatu survei dengan desain sampel yang bersifat acak sederhana. Efisiensi adalah suatu ukuran yang menyatakan nilai keterbandingan antara desain sampel yang digunakan dalam suatu survei dengan desain sampel lainnya, selain desain sampel yang bersifat acak sederhana.
43
TABEL ANGKA RANDOM Halaman 1 No.
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
0 9 1 1 5 1 8 6 3 5 1 2 2 6 3 7 5 9 1 3 6 7 2 0 2 1 1 3 3 3 6 1 6 2 6
3 7 6 2 5 6 4 3 3 7 8 6 3 2 7 0 6 9 6 1 8 4 7 0 9 6 1 5 8 1 6 4 8 0 4
4 7 7 5 5 2 4 0 2 6 1 6 4 3 8 2 6 4 0 1 3 5 4 3 9 9 2 2 2 9 6 9 0 4 1
7 4 6 6 9 2 2 1 1 0 8 2 2 6 5 9 2 9 8 6 4 7 2 9 4 0 7 4 3 6 7 0 9 0 9
3 2 6 8 5 7 1 6 1 8 0 3 4 2 9 1 1 5 1 9 3 2 3 6 9 8 9 1 1 2 4 8 5 7 5
8 4 2 5 6 7 7 3 2 6 7 8 0 8 4 7 8 7 5 3 9 5 7 8 8 3 4 0 6 5 0 4 1 6 8
6 6 2 9 3 9 5 7 3 3 9 9 6 1 3 1 3 2 0 3 1 6 8 2 9 6 7 1 8 9 6 4 1 7 9
9 7 7 9 5 4 3 8 4 2 2 7 4 9 5 2 7 2 4 2 3 5 6 9 4 6 5 6 6 1 7 5 4 3 7
6 6 6 2 6 3 3 5 2 4 4 7 7 9 1 1 3 7 7 4 7 7 5 6 2 5 0 2 3 4 1 1 0 9 7
9 2 6 6 4 9 1 9 9 4 6 5 4 5 2 3 5 7 2 3 0 6 3 1 4 9 6 0 8 7 4 1 0 0 9
6 4 5 9 3 4 5 1 7 0 4 8 8 5 8 4 9 8 3 5 5 5 4 6 6 8 0 3 4 9 6 7 3 0 1
4 2 6 6 8 9 7 6 8 9 4 4 2 0 3 0 6 8 3 0 5 9 8 6 8 3 6 3 2 6 4 5 3 7 5
7 8 5 9 5 5 2 9 6 4 1 1 9 9 3 3 8 4 2 2 7 2 5 3 4 6 0 3 3 4 0 7 9 5 0
3 1 0 6 4 4 4 5 4 7 7 6 7 2 9 3 3 2 7 7 4 9 5 7 9 2 9 2 8 4 5 3 6 1 6
6 1 2 6 8 4 5 5 5 2 1 0 7 2 5 2 5 9 1 8 3 9 9 3 6 6 1 5 9 3 7 8 0 4 1
6 4 6 8 2 3 5 5 6 7 6 7 7 6 0 0 0 5 4 9 0 7 0 2 9 4 9 1 7 3 1 8 2 0 5
1 5 7 2 4 5 0 6 0 9 5 4 7 1 0 3 8 4 3 8 7 6 6 2 1 1 7 2 0 4 9 0 7 1 9
4 7 1 7 6 4 6 7 7 6 8 4 7 1 8 8 7 5 4 7 7 8 9 0 0 1 4 6 1 9 5 5 5 4 3
6 2 0 3 2 8 8 1 8 5 0 9 8 9 3 7 7 7 0 1 4 6 7 3 8 1 6 3 5 1 8 9 1 0 2
9 0 7 1 2 2 8 9 2 4 9 9 1 7 0 6 5 2 9 9 0 0 2 0 2 2 6 8 0 3 6 0 9 2 0
8 4 3 0 3 1 7 9 5 4 7 8 0 0 4 1 9 1 4 2 4 7 9 7 5 6 0 7 8 3 1 5 0 0 0
6 2 2 5 1 7 7 8 2 9 9 3 7 0 2 3 7 6 5 0 4 1 6 7 3 7 2 9 7 4 1 2 7 4 1
3 5 9 0 6 3 0 1 4 1 8 1 4 5 3 8 1 6 5 1 2 9 5 8 7 1 9 7 7 8 0 2 6 0 9
7 3 0 3 2 7 4 0 2 7 3 1 5 6 4 9 2 4 9 5 2 1 7 4 5 9 4 6 5 6 5 7 0 2 0
1 3 7 7 4 9 7 5 0 4 8 4 3 7 0 5 2 3 3 3 7 3 6 5 9 0 3 4 6 8 6 4 6 3 1
Halaman 2 No.
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
0 0 6 2 1 1 9 4 6 9 3 8 0 8 9 5 6 3 6 9 0 6 8 5 3 0 6 0 0 0 7 8 4 9 4
5 7 8 6 4 7 0 1 0 1 4 5 9 8 0 3 3 5 3 8 2 4 5 8 5 3 2 8 7 1 2 8 5 6 3
2 9 7 5 6 5 2 2 2 2 5 2 7 7 9 7 3 3 4 2 6 5 0 5 8 9 9 4 0 8 8 7 1 7 3
6 7 1 9 5 3 6 3 0 5 0 2 9 5 6 4 8 0 3 5 3 5 7 4 5 2 5 5 8 5 4 8 7 6 1
9 1 8 6 5 7 5 5 5 3 5 0 1 8 2 2 0 5 3 3 2 2 2 1 2 1 3 9 5 8 7 2 7 2 6
3 0 6 1 2 7 9 2 0 8 7 4 3 0 3 3 6 8 6 7 1 2 6 6 7 8 0 3 5 9 1 8 5 8 7
7 8 8 6 6 5 2 5 8 0 7 3 7 1 7 9 8 2 8 5 1 2 1 2 9 2 2 1 1 9 1 1 6 1 7
0 8 5 5 8 8 1 5 1 5 4 9 7 8 0 9 6 1 2 5 7 1 3 4 4 7 7 5 8 5 4 6 5 2 2
6 2 8 5 7 7 1 9 6 9 3 4 4 1 0 6 5 4 6 2 6 8 8 1 8 4 5 2 4 6 3 8 5 5 3
0 3 5 3 5 1 9 9 9 0 7 3 8 4 0 7 4 6 9 6 9 2 9 5 7 6 9 2 0 6 5 4 7 4 0
2 0 5 5 8 7 2 3 3 9 9 7 7 2 0 6 9 0 6 0 7 4 0 5 6 5 3 6 4 5 1 1 2 2 2
2 9 4 8 7 1 3 1 1 4 8 3 3 2 9 1 9 6 5 1 1 8 1 1 1 7 7 0 5 1 9 3 8 2 4
3 9 8 3 5 4 5 0 9 5 8 8 8 9 0 3 0 7 5 9 5 2 1 5 4 9 7 2 4 1 1 5 4 0 0
5 8 7 7 9 1 2 4 9 8 0 1 2 5 0 2 0 2 1 1 0 2 0 4 8 9 5 1 4 0 1 2 0 1 2
8 4 6 7 3 6 2 4 7 2 3 5 9 7 0 2 6 1 1 8 8 2 0 4 5 1 4 7 7 1 5 5 1 1 9
5 2 6 8 6 1 3 9 3 8 3 3 7 5 3 8 5 7 8 2 0 8 7 4 4 6 1 5 5 9 8 3 9 1 4
1 9 4 8 2 5 3 6 6 4 0 9 2 4 0 6 2 1 3 8 8 0 8 8 5 9 6 4 1 3 4 9 7 9 0
5 9 7 0 2 0 3 9 8 1 0 4 2 2 6 9 6 0 7 1 9 6 2 0 6 6 6 6 3 4 9 4 2 4 8
1 6 5 7 4 7 1 9 6 3 9 7 2 4 9 8 9 9 8 4 5 0 0 0 2 5 4 9 9 8 2 5 1 2 6
3 4 4 0 1 2 2 6 8 6 1 9 1 9 0 4 4 4 8 6 6 0 4 0 6 6 8 1 0 8 6 3 2 5 3
9 6 7 4 2 1 9 1 3 4 0 3 0 3 5 9 0 2 6 7 3 6 5 6 9 3 8 9 2 1 5 7 2 7 3
2 1 3 2 6 2 6 0 5 5 9 3 5 9 5 4 2 5 1 4 8 1 9 2 0 0 6 8 4 5 0 5 5 1 8
0 7 3 1 7 4 9 4 8 3 7 6 0 3 8 6 8 2 3 7 1 5 6 6 1 3 9 7 9 8 1 4 1 9 3
3 1 2 0 8 1 3 7 1 7 7 2 3 2 5 2 2 1 8 1 5 4 3 5 8 3 7 7 4 4 1 5 2 6 2
5 6 0 5 6 9 0 4 3 5 9 4 2 8 7 6 9 3 4 1 7 1 6 6 4 7 8 2 9 9 1 6 7 1 3
DAFTAR PUSTAKA Babbie, Survey Research Methods, Wadsworth Publishing Company, Inc., Belmont, California. BPS-CIDA-UNICEF, 2007, Seri 1 Upaya Pemantauan dan Evaluasi Program Pelayanan Sosial Ibu dan Anak, BPS ISBN 978-979-724-587-0 BPS-CIDA-UNICEF, 2007, Seri 2 Pengembangan Metode Sampling untuk Mendapatkan Estimasi Indikator MDGs Tingkat Kecamatan, BPS ISBN 978-979-724-5887-7 Cochran, William G., 1977, Sampling Technique, John Willey & Sons, Third Edition. FAO Statistical Development Series, 1989, Sampling Methods for Agricultural Surveys. Kish, Leslie, 1995, Survey Sampling, Willey Classics, Library Edition. Levy, Paul S., Stanley Lemeshow, 1999, Sampling of Populations, John Wiley & Sons, Third Edition. Unicef, 2006, Multiple Indicator Cluster Survey Manual 2005, Monitoring the Situation of Children and Women. United Nations, National Household Survey Capability Programme, Sampling Frame and Sample Designs for Integrated Household Survey Programmes. United Nations, 2005, Household Sample Survey in Developing and Transition Countries. Verma, Vijay, 1991, Sampling Methods, Training Handbook Statistical Institute for Asia and The Pacific.