J. Sains MIPA, April 2009, Vol. 15, No. 1, Hal.: 66 - 70 ISSN 1978-1873
PENENTUAN UKURAN CONTOH OPTIMUM DESAIN TWO STAGE CLUSTER SAMPLING (Studi Kasus Pendugaan Variabel Demografi di Kabupaten Blitar) Rusida Yuliyanti* Pusat Penelitian Kependudukan LIPI Jakarta 12710 *Alamat korespondensi e-mail: Diterima 5 Februari 2009, disetujui untuk diterbitkan 27 Mei 2009
ABSTRAK The aim of this paper is determine of optimum sample size in first step (how many choice census blocks) and in second step (how many household fraction) at estimation demography variable with two stage cluster sampling design in Blitar district for margin of error value (ε) = 5%,10%,15%, 20%, 25% and 30%. The estimation demography variable included in the resident characteristics group is 405, 110, 49, 28, 18 dan 12 census blocks with 0.309 household fraction at margin of error value (ε) = 5%,10%,15%,20%,25% and 30%. For labor and education groups needs 342, 91, 41, 23, 15, 10 and 2146, 905, 461, 273, 179 choice census blocks with 0.177 and 0.217 household fraction at margin of error value (ε) = 5%,10%,15%, 20%, 25%, 30%. Keywords: two stage cluster sampling, census blocks and household fraction
1. PENDAHULUAN Banyak lembaga pemerintah yang memberikan pelayanan atau jasa penyediaan data dan informasi yang bermanfaat untuk penelitian salah satunya adalah BPS. Jika dilihat peranannya BPS mempunyai fungsi menetapkan dan menyediakan sistem informasi di bidang statistik yang digunakan baik oleh pihak pemerintah, swasta maupun masyarakat. Guna memenuhi fungsinya BPS menyelenggarakan dan melaksanakan berbagai macam sensus dan survei di Indonesia. Dalam melaksanakan survei BPS menggunakan berbagai metode sampling, salah satunya yaitu metode two stage cluster sampling dengan unit sampling tahap pertama adalah blok sensus dan tahap keduanya rumah tangga. Menurut Katalog BPS1), blok sensus didefinisikan bagian dari suatu wilayah desa/kelurahan yang digunakan sebagai unit sampling terkecil dan daerah kerja dari seorang pencacah dalam sensus dan survei yang akan datang. Metode two stage cluster sampling sering digunakan BPS dalam survei-survei dengan pendekatan rumah tangga misalnya survei-survei yang berkaitan dengan variabel demografi. Metode tersebut digunakan disamping untuk efisiensi biaya juga karena tidak tersedianya kerangka contoh unit survei yaitu rumah tangga. Metode two stage cluster sampling ini tidak terlepas dari kesalahan yang menyebabkan tidak akuratnya hasil survei. Namun kesalahan yang terjadi dapat diperkecil dengan menentukan ukuran contoh optimum. Penentuan ukuran contoh optimum tahap pertama dan kedua pada metode ini menjadi faktor penting untuk memperoleh survei efisien. Survei yang efisien akan mewakili karakteristik populasi dan sampling error yang dihasilkan relatif kecil. Kajian ini bertujuan menentukan ukuran contoh optimum tahap pertama (banyaknya blok sensus terpilih) dan tahap kedua (besarnya fraksi rumah tangga) pada pendugaan variabel demografi dengan desain two stage cluster sampling di kabupaten Blitar untuk nilai margin of error (ε) 5%,10%,15%, 20%, 25%, 30% pada selang kepercayaan 95%. 2. METODE PENELITIAN Metode penarikan contoh cluster dua tahap merupakan pengembangan dari metode penarikan contoh cluster dengan pengambilan contoh dilakukan secara dua tahap yaitu tahap pertama, memilih beberapa cluster dari cluster-cluster dalam populasi secara acak dan tahap kedua, memilih beberapa unit contoh dari tiap cluster terpilih secara acak pula 2). Menurut Levy & Lemeshow3) pendugaan parameter populasi untuk total, rataan tiap cluster dan rataan tiap unit sebagai berikut :
66
2009 FMIPA Universitas Lampung
J. Sains MIPA, April 2009, Vol. 15, No. 1
N i ni ∑ x ij n i j=1
M m a. Total, Xˆ = ∑ m i =1
(1)
m n b. Rataan tiap cluster, Xˆ = 1 ∑ N i ∑ x ij i
m i =1 n i
(2)
j =1
ˆ c. Rataan tiap unit, Xˆ = X
(3)
N
= banyaknya cluster populasi; N = banyaknya unit populasi = M ∑ N i i =1 Ni = banyaknya unit pada cluster ke-i ni = banyaknya unit terpilih cluster ke-i; m = banyaknya cluster terpilih xij = nilai sampel karakteristik x pada unit ke-j dari cluster ke-i Ragam sampling pendugaan rataan dan total dari two-stage cluster sampling tergantung dari dua komponen yaitu ragam di dalam cluster (within-cluster variance) dan ragam antar cluster (between-cluster variance), oleh Levy & Lemeshow dirumuskan sebagai berikut3): M
Ragam antar cluster,
(
)
2 M ∑ X −X i σ2 = i = 1 1 M
Ragam dalam cluster,
(4)
2 1 M N Ni σ2 = ∑ i ∑ X − X 2 N ij i i = 1 Ni −1 j = 1
(5)
N i X = ∑ X (total nilai karakteristik X cluster ke-i) i ij j =1 M Ni N i ∑ ∑X ij ∑ X ij i = 1 j = 1 ; Rataan tiap unit cluster ke-i : Rataan tiap cluster : X = j=1 X = M i N i
Menurut Levy & Lemeshow3) koefisien korelasi intraklas (ρ) adalah sebuah parameter yang sangat penting dalam teori sampling, untuk menentukan besarnya ukuran contoh optimum pada tahap kedua serta standard error penduga rataan atau total dari metode two stage cluster sampling dimana koefisien korelasi intraklas dipengaruhi nilai keragaman di dalam dan antar cluster. Nilai koefisien ini berada antara −
1 ≤ ρ ≤ +1 . N −1
Bila tingkat kehomogenan tersebut tinggi maka nilai koefisien korelasi intraklas besar berarti contoh yang diambil di setiap cluster relatif sedikit, karena unit-unit dalam cluster relatif homogen. Pemilihan contoh yang sedikit tersebut dianggap sudah dapat mewakili populasi. Dalam penentuan ukuran contoh optimum pada metode two stage cluster sampling, koefisien korelasi intraklas dirumuskan sebagai berikut: ρ=
M 2 − N 2 σ σ2 (M − 1) 1 M 2 + N (N − 1 ) 2 σ σ2 (M − 1) 1
(6)
M ∑ Ni dengan N = i = 1 (rataan banyaknya unit di setiap cluster populasi M
Levy & Lemeshow3) juga menyatakan bahwa rataan contoh optimum pada tahap kedua guna pendugaan total dan atau rataan tergantung pada koefisien korelasi intraklas dan biaya, yaitu : n =
c1 (1 − ρ ) c2 ρ
(7)
dengan c1 adalah biaya yang berhubungan dengan pemilihan sampel tahap pertama sehingga nilainya tergantung dari banyaknya cluster yang dipilih (biaya per cluster), c2 adalah biaya yang berhubungan dengan pemilihan sampel tahap kedua sehingga nilainya tergantung dari banyaknya unit yang dipilih (biaya per unit). Penentuan alokasi contoh tahap kedua, banyaknya unit contoh yang diambil di setiap cluster terpilih (ni),
2009 FMIPA Universitas Lampung
67
R. Yuliyanti... Penentuan Ukuran Contoh Optimum Desain Two Stage Cluster Sampling
dipengaruhi oleh besarnya fraksi sampling tahap kedua dan banyaknya unit pada cluster ke-i (Ni). Unit contoh tahap kedua ini mencapai optimum jika nilai fraksi sampling tahap keduanya optimum. Menurut Levy & Lemeshow3) fraksi sampling tahap kedua yang optimum sebanding dengan besarnya rataan contoh optimum pada tahap kedua ( n ) dan berbanding terbalik dengan rataan banyaknya unit di setiap cluster populasi ( N ), dirumuskan f = n . Karena ni dipengaruhi oleh nilai f optimum maka N
alokasi contoh tahap kedua mencapai optimum saat kita mengambil unit contoh di cluster ke-i sebanyak n = f × N . Sedangkan untuk pemilihan cluster terseleksi mencapai optimum bila kita mengambil cluster
i
i
sebanyak m yaitu :
( ) Ni (X − X )2 ( ) j∑=1 i i
σ12 M M M Ni Ni − ni + ∑ 2 2 X (M −1) N2 X i =1 ni Ni −1 m= σ12 ε2 + z2 X 2(M −1) 1− α 2
(10)
Nilai margin of error adalah besarnya perbedaan relatif antara nilai pendugaan (statistik) dengan nilai yang sebenarnya (parameter populasi) atau batas dari penyimpangan yang diinginkan untuk nilai dugaan rata-rata. Som4) menyatakan bahwa nilai margin of error parameter populasi ditentukan oleh standar deviasi dari dugaan parameter tersebut dan selang kepercayaan yang diinginkan (nilai Z (1− α) ). Nilai margin of error dari µ (rataan populasi) adalah ε=Z
σ σ =Z (1 − α) µˆ (1 − α) n
(11)
dengan σ : standar deviasi µ (rataan populasi), n: banyaknya contoh yang diambil, σ : standar deviasi dugaan µ.
µˆ
2.1. Data dan Variabel yang Digunakan Data yang digunakan berupa data sekunder hasil Sensus Penduduk 2000 (SP2000-L2) dengan domain Kabupaten Blitar. Variabel yang digunakan adalah variabel demografi yang terdiri dari variabelvariabel berikut : A. Karakteristik penduduk, terdiri dari variabel : 1. Jumlah penduduk secara total. 2. Jumlah penduduk laki-laki. 3. Jumlah penduduk perempuan. 4. Jumlah rumah tangga yang kepala rumah tangganya laki-laki. 5. Jumlah rumah tangga yang kepala rumah tangganya peremuan. 6. Jumlah penduduk yang berumur 15-49 tahun dan telah kawin. 7. Jumlah penduduk laki-laki berumur 15-49 tahun dan telah kawin. 8. Jumlah penduduk perempuan berumur 15-49 tahun dan telah kawin. 9. Jumlah wanita umur 10 tahun ke atas yang pernah kawin. 10. Jumlah anak kandung yang dilahirkan hidup. 11. Jumlah anak kandung yang masih hidup. B. Tenaga kerja, terdiri dari variabel : 1. Jumlah penduduk yang berumur 5 tahun ke atas menurut kegiatan seminggu yang lalu adalah bekerja. 2. Jumlah penduduk yang berumur 5 tahun ke atas menurut kegiatan seminggu yang lalu adalah mencari pekerjaan. 3. Jumlah penduduk berumur 5 tahun ke atas yang bekerja menurut status pekerjaannya adalah berusaha sendiri atau dibantu karyawan/buruh. 4. Jumlah penduduk berumur 5 tahun ke atas yang bekerja menurut status pekerjaannya adalah berstatus karyawan/buruh C. Pendidikan, yang terdiri dari variabel: 1. Jumlah penduduk yang berumur 5 tahun ke atas menurut ijazah/STTB tertinggi yang dimiliki adalah belum/tidak punya ijazah. 2. Jumlah penduduk yang berumur 5 tahun ke atas yang berijazah SD/sederajat.
68
2009 FMIPA Universitas Lampung
J. Sains MIPA, April 2009, Vol. 15, No. 1
3. Jumlah penduduk yang berumur 5 tahun ke atas yang berijazah SLTP/sederajat. 4. Jumlah penduduk yang berumur 5 tahun ke atas yang berijazah SLTA/sederajat. 5. Jumlah penduduk yang berumur 5 tahun ke atas yang berijazah PT. 6. Jumlah penduduk yang berumur 5 tahun ke atas menurut kegiatan seminggu yang lalu sekolah. Kendala biaya untuk menentukan ukuran contoh optimum tahap II : • Biaya per blok sensus (c1) : Rp 250.000,00 • Biaya per unit rumah tangga (c2 ) : Rp 11.600,00 2.2. Metode Analisis Data Kajian ini menggunakan analisis kuantitatif dimana tahapan pengolahan data SP2000 untuk menentukan ukuran contoh optimum adalah sebagai berikut : 1. Menentukan variabel demografi yang digunakan dalam kajian ini serta mengelompokannya. 2. Reformat data SP2000-L2 dari record penduduk menjadi record rumah tangga. 3. Untuk masing-masing variabel di tiap kelompok, dihitung : a) Ragam populasi meliputi ragam di dalam dan antar cluster. b) Koefisien korelasi intraklas. c) Ukuran contoh optimum tahap pertama (banyaknya blok sensus terpilih) dan kedua (besarnya fraksi rumah tangga untuk blok sensus terpilih tersebut) dengan nilai margin of error (ε) yaitu 5%,10%,15%,20%,25%,30% pada selang kepercayaan 95% (α= 5%). 4. Menentukan ukuran contoh optimum yaitu banyaknya blok sensus terpilih dan besarnya fraksi rumah tangga untuk masing-masing kelompok variabel demografi berdasarkan variabel yang dipakai dengan menggunakan kaidah maksimum. Program pengolahan data menggunakan program makro S-Plus 2000.
3. HASIL DAN PEMBAHASAN Ukuran contoh optimum tahap pertama dan tahap kedua pada pendugaan variabel demografi di kabupaten Blitar dihitung berdasarkan penggelompokan variabel demografi yaitu kelompok karakteristik penduduk., tenaga kerja dan pendidikan dimana kabupaten Blitar terdiri dari 22 kecamatan dan 2747 blok sensus. Penentuan ukuran contoh optimum untuk setiap kelompok variabel demografi menggunakan kaidah maksimum yaitu mengambil n ukuran contoh optimum yang terbesar dari ukuran contoh optimum variabelvariabel yang ada pada masing-masing kelompok variabel demografi. Penggunaan kaidah maksimum ini dikarenakan n ukuran contoh optimum yang terbesar tersebut bisa mewakili ukuran contoh optimum semua variabel di setiap kelompok variabel demografi. Hal ini berarti, jika kita mengambil contoh sebesar n untuk menduga variabel yang mempunyai ukuran contoh optimum lebih kecil dari n maka pendugaan variabel ini bisa mencapai optimum. Tetapi biaya yang dikeluarkan akan lebih besar dibandingkan dengan pendugaan yang menggunakan ukuran contoh optimum variabel tersebut karena contoh (blok sensus dan unit RT) yang diambil akan lebih banyak. Tabel 1. Ukuran Contoh Optimum Variabel Demografi Kabupaten Blitar Kelompok variabel demografi Kependudukan Tenaga Kerja Pendidikan Rataan unit RT Fraksi RT Blok Sensus, ε : 5% Blok Sensus, ε : 10% Blok Sensus, ε : 15% Blok Sensus, ε : 20% Blok Sensus, ε : 25% Blok Sensus, ε : 30%
33 0.309 405 110 49 28 18 12
19 0.177 342 91 41 23 15 10
23 0.217 2146 905 461 273 179 126
Banyaknya blok sensus terpilih yang optimum guna pendugaan variabel di ke-3 kelompok variabel demografi dihitung untuk nilai margin of error (ε) yang ditentukan sebelum melakukan survei yaitu sebesar
2009 FMIPA Universitas Lampung
69
R. Yuliyanti... Penentuan Ukuran Contoh Optimum Desain Two Stage Cluster Sampling
5%, 10%, 15%, 20%, 25% dan 30% seperti yang tertera pada Tabel Ukuran Contoh Optimum Variabel Demografi Kabupaten Blitar di bawah ini . Sedangkan banyaknya unit RT terpilih di setiap blok sensus terpilih yang harus diambil untuk mencapai pendugaan yang optimum tergantung dari besarnya fraksi RT yaitu sebanyak fraksi RT dikali banyaknya unit RT di blok sensus terpilih. Berdasarkan Tabel 1 tersebut, kelompok pendidikan mempunyai ukuran contoh optimum (yaitu banyaknya blok sensus dan fraksi RT terpilih) paling besar dan sangat besar dibandingkan ke-3 kelompok variabel demografi lainnya untuk semua nilai margin of error (ε). Hal ini dikarenakan ragam antar blok sensus relatif besar dan ragam di dalam blok sensus relatif kecil sehingga koefisien korelasi intraklas kelompok pendidikan lebih besar dibandingkan ketiga kelompok variabel demografi lainnya. Sedangkan banyaknya blok sensus dan rataan unit RT terpilih yang optimum pada kelompok tenaga kerja paling sedikit kemudian disusul dengan kelompok karakteristik penduduk. Pada kelompok pendidikan juga terlihat bahwa untuk nilai ε = 5 % kita harus mengambil 2146 blok sensus dari 2747 blok sensus yang guna mencapai ukuran contoh yang optimum. Nilai ini sangat banyak untuk ukuran contoh dan pasti akan memerlukan biaya yang sangat besar dalam proses pelaksanaan survei. Menurut tabel di atas, nilai fraksi RT terbesar terdapat pada kelompok karakteristik penduduk yaitu 0,309. Hal ini karena ragam di dalam blok sensus kelompok ini relatif besar dibandingkan kelompok lain dan ragam antar blok sensusnya relatif lebih kecil sehingga nilai koefisien korelasi interklasnya kecil yang mengakibatkan nilai rataan unit RT kelompok karakteristik penduduk menjadi besar (bahkan paling besar). Karena nilai fraksi RT sebanding dengan nilai rataan unit RT maka nilai fraksi RT kelompok karakteristik penduduk juga menjadi paling besar dibandingkan kelompok tenaga kerja dan pendidikan.
4. KESIMPULAN Ukuran contoh optimum tahap pertama (blok sensus) dan kedua (fraksi rumah tangga) dengan metode two stage cluster sampling untuk pendugaan variabel demografi di kabupaten Blitar bervariasi sesuai dengan variabel yang diduga pada masing-masing kelompok. Banyaknya blok sensus terpilih dan fraksi rumah tangga yang optimum untuk pendugaan variabel demografi di kabupaten Blitar dengan nilai margin of error (ε) = 5%, 10%, 15%, 20% dan 30% pada masing-masing kelompok variabel adalah sebagai berikut : a. Kelompok karakteristik penduduk. Pendugaan variabel demografi yang termasuk dalam kelompok karakteristik penduduk memerlukan blok sensus terpilih yang optimum sebanyak 405, 110, 49, 28, 18 dan 12 blok sensus dengan fraksi rumah tangga sebesar 0, 309 saat nilai ε = 5%, 10%, 15%, 20% dan 30%. b. Kelompok tenaga kerja Guna mencapai pendugaan variabel demografi kelompok tenaga kerja yang optimum, kita membutuhkan blok sensus terpilih sebanyak 342, 91, 41, 23, 15 dan 10 blok sensus pada saat nilai ε = 5%, 10%, 15%, 20% dan 30% dengan fraksi rumah tangga sebesar 0,177. c. Kelompok pendidikan Ukuran blok sensus yang optimum untuk pendugaan variabel demografi yang termasuk dalam kelompok pendidikan adalah sebanyak 2146, 905, 461, 273, 179 dan 179 blok sensus dengan fraksi rumah tangga sebesar 0,217 pada saat nilai ε = 5%, 10%, 15%, 20% dan 30%.
DAFTAR PUSTAKA 1. Katalog BPS : 1613 . 2000. Kerangka Contoh Induk- Blok Sensus Th. 2000. Badan Pusat Statistik. Jakarta. 2. Scheaffer, R. L., Mendenhall, W., and Ott, L. 2006. Elementary Sur-vey Sampling. 6th ed. Boston : PWSKENT Publishing Compa. 3. Levy, P.S., and Lemeshow, S. 1999. Sampling of Populations - Methods and Applications. 3rd ed. New York : Wiley. 4. Som, R.L. 1996. Practical Sampling Techniques. 2nd ed., rev. and expanded. Marcel Dekker, Inc. Madison Avenue, New York.. 5. Mattjik, . A. A., Yuliyanti, R. dan Martono, T. 2009. Pengujian Subhipotesis Pengaruh Interaksi Genotipe × Lingkungan pada Model AMMI. J. Sains MIPA, 15 (1): 35-41.
70
2009 FMIPA Universitas Lampung