PERTEMUAN 5-MPC 2 PRAKTIK
Oleh: Adhi Kurniawan
SEKOLAH TINGGI ILMU STATISTIK
Unequal Cluster Sampling βΊ Misalkan satu gugus sampel yang berukuran n cluster yang ditarik dari N cluster secara simple random sampling wor. βΊ Notasi yang dipergunakan sama dengan cluster berukuran sama, hanya mengganti π dengan ππ . ππ : banyaknya unit dalam cluster ke-i βΊ Estimasi rata-rata unit untuk cluster ke-i dirumuskan: 1 π¦π. = ππ
ππ
π¦ππ π=1
βΊ Untuk estimasi rata-rata unit populasi terdapat 3 pendekatan: 1. Rata-rata sederhana dan tidak mempertimbangkan ukuran cluster 2. Rata-rata dengan memperhitungkan ukuran cluster dari sampel 3. Rata-rata dengan menggunakan ukuran cluster dalam populasi
Unequal Cluster Sampling 1. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan dari rata-rata cluster tanpa ditimbang dengan terpilih ππ 1 π¦= π
banyaknya elemen dalam cluster
.
π
Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb: π = ππβ² π¦ π£ π = ππβ² 2 π£ π¦ Keterangan: π 1 πβ² = ππ. π
π¦π. π=1
1βπ 2 π£ π¦ = π π π1 Keterangan: 1 2 π π1 = (π β 1)
π=1
π
π¦π. β π¦
2
π=1
--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias
Contoh Soal 1 Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh: Perpustakaan
Jam baca pengunjung
1
4.5
5.5
4.2
2.0
5.5
1.0
2.5
2
4.0
5.6
5.5
6.5
1.8
2.0
1.4
1.5
3
6.5
4.0
7.0
3.5
4.5
4
5.0
3.5
7.0
0.5
1.0
2.0
2.5
6.5
5
0.8
4.5
6.5
5.5
6.5
3.2
0.5
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tidak tertimbang. Lengkapi dengan standar error, RSE-nya !
Contoh Soal 1
1
4.5
5.5
4.2
2.0
5.5
1.0 2.5
7
25.2
3.6
2
4.0
5.6
5.5
6.5
1.8
2.0 1.4 1.5 0.5
9
28.8
3.2
3
6.5
4.0
7.0
3.5
4.5
5
25.5
5.1
4
5.0
3.5
7.0
0.5
1.0
2.0 2.5 6.5
8
28
3.5
5
0.8
4.5
6.5
5.5
6.5
3.2
6
27
4.5
35
134.5
19.9
Total
Unequal Cluster Sampling 2. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan dari karakteristik seluruh unit dalam sampel 1 β² π¦ = π
π
π=1
ππ π¦π. = πβ²
π π=1 ππ π¦π. π π=1 ππ
=
ππ π π=1 π=1 π¦ππ π π=1 ππ
1 β π β²2 β² π£ π¦ = π π π1 Keterangan: π 1 β²2 π π1 = 2 ππ2 π¦π. β π¦ β² πβ² (π β 1) π=1 1 β² π = π
π
2
=
π π=1 π¦π. π π=1 ππ
Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb: π β² = ππβ² π¦ β² π£ π = ππβ² 2 π£ π¦ β² Keterangan: π 1 πβ² = ππ. π π=1
ππ. π=1
--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias konsisten
Contoh Soal 2 Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh: Perpustakaan
Jam baca pengunjung
1
4.5
5.5
4.2
2.0
5.5
1.0
2.5
2
4.0
5.6
5.5
6.5
1.8
2.0
1.4
1.5
3
6.5
4.0
7.0
3.5
4.5
4
5.0
3.5
7.0
0.5
1.0
2.0
2.5
6.5
5
0.8
4.5
6.5
5.5
6.5
3.2
0.5
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data sampel. Lengkapi dengan standar error, RSE-nya !
Contoh Soal 2
Unequal Cluster Sampling
Contoh Soal 3 Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Diketahui jumlah pengunjung perpustakaan di provinsi tersebut dalam satu hari adalah 180 orang. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh: Perpustakaan
Jam baca pengunjung
1
4.5
5.5
4.2
2.0
5.5
1.0
2.5
2
4.0
5.6
5.5
6.5
1.8
2.0
1.4
1.5
3
6.5
4.0
7.0
3.5
4.5
4
5.0
3.5
7.0
0.5
1.0
2.0
2.5
6.5
5
0.8
4.5
6.5
5.5
6.5
3.2
0.5
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data populasi. Lengkapi dengan standar error, RSE-nya !
Contoh Soal 3
1
4.5
5.5
4.2
2.0
5.5 1.0 2.5
2
4.0
5.6
5.5
6.5
1.8 2.0 1.4
3
6.5
4.0
7.0
3.5
4.5
4
5.0
3.5
7.0
0.5
1.0 2.0 2.5
5
0.8
4.5
6.5
5.5
6.5 3.2
Total
1.5 0.5 6.5
7
25.2
3.6
3.3600
9
28.8
3.2
3.8400
5
25.5
5.1
3.4000
8
28
3.5
3.7333
6
27
4.5
3.6000
134.5 19.9
17.9333
35
Estimasi Proporsi pada Unequal Cluster Sampling
Estimasi Proporsi pada Unequal Cluster Sampling No
Tipe estimator
1
Tidak tertimbang
2
Tertimbang dg cluster size dari sampel
3
Tertimbang dg cluster size dari populasi
Estimasi proporsi populasi
Variance between cluster mean
Sampling variance
Estimasi Total berdasarkan proporsi pada Unequal Cluster Sampling No
Tipe estimator
Estimasi total populasi
Sampling variance
1
Tidak tertimbang
π΄ = ππβ² π
π£ π΄ = ππβ² 2 π£ π
2
Tertimbang dengan cluster size dari sampel
π΄β² = ππβ² πβ²
π£ π΄β² = ππβ² 2 π£ πβ²
3
Terimbang dengan cluster size dari populasi
π΄β = πππβ
π£ π΄β = ππ 2 π£ πβ
Estimasi Proporsi pada Unequal Cluster Sampling βΊ Contoh Soal: Suatu survei dilakukan di suatu desa dengan memilih sampel secara acak sebanyak 3 cluster dari 25
Cluster
cluster yang ada di desa tersebut. Kemudian
dilakukan
pencacahan
(1)
terhadap semua rumah tangga yang terdapat
pada
cluster
terpilih.
1
Perkirakan proporsi dan total rumah tangga pertanian hortikultura di desa tsb beserta standar error dan RSE-nya
2
dengan 3 cara ! (untuk cara 3, diketahui
jumlah rumah tangga di desa tsb sebanyak 105 rumah tangga)
3
Apakah ada ART yang Jika kolom(3) memelihara/menguasai/ kode 1, apakah Rumah melakukan kegiatan hasilnya tangga pertanian tanaman dijual/ditukar ? hortikultura? (1=Ya, (1=Ya, 2=Tidak) 2=Tidak) (2) (3) (4) 1 2 2 1 1 3 2 4 1 2 1 2 2 1 1 3 2 1 1 2 2 1 1 3 2 4 1 2 5 1 1
Estimasi Proporsi pada Unequal Cluster Sampling βΊ Konsep dan Definisi: Kegiatan
usaha
pertanian
adalah
kegiatan
pemeliharaan,
pembudidayaan,
pengembangbiakan, pembesaran/penggemukan dengan tujuan sebagian atau seluruh hasilnya untuk dijual/ditukar/memperoleh keuntungan. Khusus untuk budidaya padi dan palawija, pemeliharaan sapi potong, sapi perah, dan kerbau
walaupun untuk konsumsi sendiri tetap dikategorikan sebagai usaha pertanian. Rumah tangga pertanian adalah rumah tangga yang satu atau lebih anggota rumah tangganya mengelola usaha pertanian baik usaha milik sendiri maupun milik pihak
lain.
Estimasi Proporsi pada Unequal Cluster Sampling Cluster 1
4
1
0.1111
0.2381
2
3
1
0.0000
0.2381
3
5
2
0.1111
0.4762
Total
12
4
0.2222
0.9524
Untuk penghitungan estimasi tidak tertimbang
Untuk penghitungan estimasi tertimbang dengan cluster size dari sampel
Untuk penghitungan estimasi tertimbang dengan cluster size dari populasi
Cara 1: Estimasi Tidak Tertimbang
Cara 2: Estimasi Tertimbang dengan Cluster Size dari Sampel
Cara 3: Estimasi Tertimbang dengan Cluster Size dari Populasi
Penghitungan Sampling Error dengan Stata Contoh Soal 2:
Suatu wilayah yang terdiri dari 10 cluster diambil sampel secara acak sebanyak 3 cluster, kemudian dilakukan pengukuran terhadap jumlah ART pada semua rumah tangga pada cluster terpilih. Jumlah rumah tangga di wilayah tersebut adalah 42 rumah tangga. Perkirakan rata-rata jumlah ART tiap rumah tangga beserta standar error-nya !
Cluster_id
Household_id
ART
1
1
4
1
2
5
1
3
3
1
4
6
2
1
5
2
2
4
2
3
7
3
1
3
3
2
6
3
3
5
3
4
6
3
5
2
Penghitungan Sampling Error dengan Stata (Estimasi tidak tertimbang) use "D:Bahan Ajar MPC\unequal cluster.dtaβ collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta gen art_per_ruta= art/ruta gen N=10 Gen weight=10/3*4 svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing) pweight: <none> VCE: linearized Single unit: missing Strata 1:
SU 1: cluster_id FPC 1: N svy linearized : mean art_per_ruta (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2 Linearized Mean Std. Err. [95% Conf. Interval] art_per_ruta
4,744445 ,247531
3,679404 5,809485
Penghitungan Sampling Error dengan Stata (Estimasi tertimbang dengan ukuran cluster dari data sampel) use "D:Bahan Ajar MPC\unequal cluster.dtaβ gen N=10 gen weight=10/3
svyset cluster_id [pweight=weight], fpc(N) vce(linearized) pweight: weight VCE: linearized Single unit: missing Strata 1: SU 1: cluster_id FPC 1: N svy linearized : mean art (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of PSUs = 3 Design df = 2
Number of obs Population size
Linearized Mean art
Std. Err. [95% Conf. Interval]
4,666667 ,2130032 3,750188
5,583146
= =
12 40
Penghitungan Sampling Error dengan Stata (Estimasi tertimbang dengan ukuran cluster dari data populasi) use "D:Bahan Ajar MPC\unequal cluster.dtaβ collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta gen art_per_ruta= art/ruta gen N=10 gen weight=10/3*4.2 gen art_per_ruta2= ruta/4.2* art_per_ruta svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing) pweight: <none> VCE: linearized Single unit: missing Strata 1: SU 1: cluster_id FPC 1: N svy linearized : mean art_per_ruta2 (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2 Linearized Mean Std. Err. [95% Conf. Interval]
art_per_ruta2
4,444444
,3513642
2,932646
5,956243
Soal Latihan Pengeluaran Berikut ini adalah data hasil survei konsumsi rumah tangga di suatu kelurahan. Survei dilakukan secara cluster sampling dengan mengambil id id perkapita sampel sebanyak 3 cluster secara SRS WOR dari 20 cluster di kelurahan cluster ruta sebulan tsb. Selanjutnya, dilakukan pencacahan terhadap semua rumah tangga (000) yang ada di cluster terpilih. Dari hasil pemutakhiran (updating) rumah 380 1 tangga diketahui bahwa jumlah rumah tangga di kelurahan tsb 440 2 sebanyak 102 rumah tangga. 1 500 3 a. Metode estimasi manakah yang sebaiknya anda gunakan ? 320 4 b. Perkirakan rata-rata pengeluaran perkapita perbulan di desa 400 tersebut, beserta standar error, RSE, dan 95%-CI nya ! 1 c. Dari jawaban point (b), selanjutnya dilakukan pengkategorian 330 2 rumah tangga sebagai berikut: 330 2 3 (1) Ekonomi lemah: 490 4 Pengeluaran perkapita< π¦ β β 1,96 Γ π π π¦ β 310 5 (2) Ekonomi menengah: 350 1 π¦ β β 1,96 Γ π π π¦ β β€Pengeluaran perkapitaβ€ π¦ β + 1,96 Γ π π π¦ β 350 2 (3) Ekonomi atas: 480 3 Pengeluaran perkapita> π¦ β +1,96 Γ π π π¦ β 3 Perkirakan proporsi dari masing-masing kategori di atas, lengkap 310 4 dengan standar error, RSE, dan 95% CI-nya ! 350 5 460 6
TERIMA KASIH Have A Nice Sampling