PERTEMUAN 4-MPC 2 PRAKTIK
Oleh: Adhi Kurniawan
SEKOLAH TINGGI ILMU STATISTIK
Analysis Of Variance (ANOVA) Untuk Cluster Sampling βΊ Anova Untuk Data Sampel Source Between Cluster
Degreeβs of Freedom πβ1
Sum of Square π
Mean Square
π
πππ΅ =
π¦π β π¦
2 ππ π1 =
2
πππ΅ πβ1
π=1 π=1
Within Cluster
π(π β 1)
π
π
πππ =
π¦ππ β π¦π
2
2 π π€
πππ = π(π β 1)
π=1 π=1
Total
ππ β 1
π
π
πππ0 =
π¦ππ β π¦
2
π 2 =
ππππ ππ β 1
π=1 π=1
Dengan demikian, sample variance dapat dinyatakan dalam bentuk: 2 2 π π β 1 π + π π β 1 π π€ π1 π 2 = ππ β 1
Koefisien Korelasi Intraklaster π βΊ Koefisien korelasi intraklaster mengukur tingkat homogenitas di dalam klaster, sehingga juga biasa disebut rate of homogenity (roh) βΊ Berdasarkan tabel Anova, ukuran koefisien korelasi intraklaster bisa diperoleh dengan formula yang sederhana yaitu: π πππ π=1β β π β 1 ππππ βΊ Karena 0 β€
πππ ππππ
β€ 1 maka nilai π akan berada pada interval:
β1 β€πβ€1 πβ1 2 2 βΊ Jika elemen di dalam cluster homogen sempurna maka π = 1, π π€ = 0, π π1 = π 2
βΊ Jika elemen di dalam cluster heterogen sempurna maka π =
β1 2 , π π€ πβ1
2 = π 2 , π π1 =0
Koefisien Korelasi Intraklaster π βΊ Contoh soal 1: Diketahui suatu akademi memiliki 24 kelas yang masing-masing kelas terdiri dari 8 mahasiswa. Untuk memperkirakan jumlah buku statistik yang dimiliki oleh mahasiswa, dilakukan pengambilan sampel secara SRS WOR sebanyak 4 kelas, kemudian dilakukan wawancara terhadap semua mahasiswa yang berada pada kelas terpilih. Data yang diperoleh: Kelas (π) Mahasiswa (π)
1
2
3
4
1
3
7
6
8
2
1
2
1
4
3
6
4
2
8
4
8
4
9
1
5
2
9
2
4
6
2
8
6
3
7
4
7
4
8
8
2
4
5
8
Dari data tersebut, buatlah tabel annova dan hitung koefisien korelasi intraklasternya !
Koefisien Korelasi Intraklaster π 1 π¦= π
Kelas (π)
Mahasiswa (π)
1
2
3
4
1
3
7
6
8
2
1
2
1
4
3
6
4
2
8
4
8
4
9
1
5
2
9
2
4
6
2
8
6
3
7
4
7
4
8
8
2
4
5
8
π π2 =
π
π¦π. = π=1
1 (π β 1)
1 π¦= π 2 π π1 =
π 2
=
π¦π β π¦
2
π¦π. β π¦ π=1
π
π¦π = π=1
1 πβ1
π
=
π=1
Total ππ. Rata-rata ππ πππ
1 2 π π€ = π
π
π π2 = π=1
Koefisien Korelasi Intraklaster π 1 π¦= π
Kelas (π)
Mahasiswa (π)
1
2
3
4
1
3
7
6
8
2
1
2
1
4
3
6
4
2
8
4
8
4
9
1
5
2
9
2
4
6
2
8
6
3
7
4
7
4
8
8
2
4
5
8
Total ππ.
28
45
35
44
Rata-rata ππ
3,5
5,625
4,375
5,5
πππ
5,71
5,98
7,125
8
π π2 =
π
Rata2 buku per kelas
π¦π. = 38 π=1
1 (π β 1)
π
π¦π. β π¦
2
= 64,667
π=1
Rata2 buku per mahasiswa
1 π¦= π 2 π π1 =
π
π¦π = 4,75 π=1
1 πβ1
π
π¦π β π¦
2
= 1,0104
π=1
1 2 π π€ = π
π
π π2 = 6,70375 π=1
Koefisien Korelasi Intraklaster π Source
dof
Between Cluster
πβ1
Sum of Square π
Mean Square
π
πππ΅ =
π¦π β π¦
2 ππ π1 =
2
πππ΅ πβ1
π=1 π=1
Within Cluster
π(π β 1)
π
π
πππ =
π¦ππ β π¦π
2
2 π π€ =
πππ π(π β 1)
π=1 π=1
Total
ππ β 1
π
π
ππππ =
π¦ππ β π¦ π=1 π=1
π πππ π=1β β = π β 1 ππππ
2
π 2 =
ππππ ππ β 1
Koefisien Korelasi Intraklaster π Source
dof
Between Cluster
πβ1
Sum of Square π
Mean Square
π
πππ΅ =
π¦π β π¦
2 ππ π1 =
2
πππ΅ πβ1
π=1 π=1
Within Cluster
π(π β 1)
π
π
πππ =
π¦ππ β π¦π
2
2 π π€ =
πππ π(π β 1)
π=1 π=1
Total
ππ β 1
π
π
ππππ =
π¦ππ β π¦
2
π 2 =
ππππ ππ β 1
π=1 π=1
Source
dof
Sum of Square
Mean Square
Between Cluster
3
24,2496
8,0832
Within Cluster
28
187,7050
6,7038
Total
31
211,9546
6,8372
π πππ 8 187,705 π=1β β =1β Γ = β0,0121 π β 1 ππππ 8 β 1 211,9546
Hubungan π dengan Sampling Varians βΊ Unbiased sampling varians: 1βπ π π£ π¦ π£ π¦ = 2 = π
ππ β 1 2 β π 1 + (π β 1)π πβ1 1 β π ππ β 1 2 β β π 1 + (π β 1)π ππ2 πβ1 1βπ Untuk n besar β π£ π¦ β
β π 2 1 + (π β 1)π ππ π£ π¦ =
β
1 Rata β rata per cluster (kelas) β π¦ = π
π
π¦π. = 38 π=1
4 1β 1 β π ππ β 1 2 24 β 31 β 6,8372 β 1 + 7 β β0,0121 = 13,4723 π£ π¦ = β βπ 1+ πβ1 π = π πβ1 4 3 π 1 Rata β rata per elemen (mahasiswa) β π¦ = π¦π = 4,75 π π=1 4 1 β π£ π¦ 1 β π ππ β 1 2 24 β 31 β 6,8372 β 1 + 7 β β0,0121 = 0,2105 1 π£ π¦ = 2 = β β π 1 + π β 1 π = π ππ2 πβ1 4 β 82 3 π π π¦ = 0,2105 = 0,4588 4 1 β 1βπ 24 β 6,8372 β 1 + 7 β β0,0121 = 0,1629 2 π£ π¦ β
β π 2 1 + π β 1 π = ππ 4β8 β jika n kecil lebih baik pakai rumus (1)
Design Effect (Deff) Pada Cluster Sampling Design Effect
Design Effect pada cluster sampling merupakanperbandingan antara varians suatu cluster sampling dengan varians sampel acak sederhana (SRS). 1βπ 2 2 π π1 ππ π1 π(π¦)πππ’π π‘ππ π·πππ = = π = 2 1βπ 2 π(π¦)π ππ π π ππ (ππ΄ β π) = π + (π΄ β π)π π΄(π β π) Untuk n besar maka: π«πππ β
π + (π΄ β π)π Nilai deff untuk contoh soal 1: (ππ β 1) π·πππ = 1 + (π β 1)π π(π β 1) 31 = 1 + 7 β β0,0121 8Γ3
= 1,182
Estimasi Proporsi pada Equal Cluster Sampling Ilustrasi
Jumlah bola hitam ππ
ππ = π
ππ = π
ππ = π
ππ = π
Proporsi bola hitam ππ
ππ =
π π
π ππ = π
π ππ = π
π ππ = π
Estimasi proporsi bola hitam π
Sampling variance
π=
π π
π
ππ = π=π
Sebanyak 20 kotak yang masingmasing berisi 5 buah bola diambil sampel sebanyak 4 kotak secara acak. Bola-bola yang terdapat di dalam kotak terdiri dari 2 warna yaitu putih dan hitam. Perkirakan proporsi bola bewarna hitam beserta variansnya ! Dari keterangan di atas: π = 20, π = 4, π=5
π π π π π Γ + + + = π, π π π π π π
πβπ π πβπ π π = πππ = π π(π β π)
π
ππ β π π=π
π
=
πβ π
π ππ Γ π, ππππ = π, ππππ
Estimasi Proporsi pada Equal Cluster Sampling Dalam estimasi proporsi: π
ππππ = π
ππ β π π=1
2 π π1
2
ππππ = π π β 1 + ππππ = πππ΅ + πππ
π
+π
ππ ππ
π=1 2 πππ π€
Keterangan: 2 βΊ πππ = πππ π€ 2 βΊ πππ΅ = π π β 1 π π1
βΊ ππππ = ππππ Koefisien korelasi intraklaster: π πππ π=1β β π β 1 ππππ Design effect: (ππ β 1) π·πππ = 1 + (π β 1)π π(π β 1)
Estimasi Proporsi pada Equal Cluster Sampling Contoh Soal 2:
Sebanyak 384 rumah tangga dikelompokkan menjadi 48 cluster dengan muatan rumah tangga untuk setiap cluster sama. Kemudian diambil sampel secara acak sebanyak 5 cluster dan dilakukan wawancara terhadap semua rumah tangga pada cluster terpilih. Dari hasil wawancara, diperoleh data pendidikan tertinggi yang ditamatkan oleh KRT sebagai berikut: Ruta
Cluster 1
2
3
4
5
1
2
2
1
2
5
2
3
4
2
3
1
3
1
5
4
4
3
4
4
4
2
5
4
5
1
3
5
3
2
6
5
2
2
2
2
7
3
1
3
3
1
8
2
5
4
1
1
Keterangan kode: 1: Tidak tamat SD/sederajat 2: Tamat SD/sederajat 3: Tamat SMP/sederajat 4: Tamat SMA/SMK/sederajat 5: Tamat Perguruan Tinggi a. Perkirakan proporsi KRT yang pendidikannya SMP ke atas, lengkapi dengan standar error, RSE, dan 95%-CI ! b. Hitung koefisien korelasi intracluster dan design effect-nya !
Estimasi Proporsi pada Equal Cluster Sampling Penyelesaian Cluster
Ruta
1
2
3
4
5
ππ
1 π= π
π
ππ = π=1
π
1 2 π π1 = ππ β π (π β 1) π=1 1βπ 2 π£ π = π = π π1 π π π =
ππ ππ π π2 = ππ ππ
1 2 π π€ = π
Total
π
π π2 = π=1
2 πππ = πππ π€ = 2 πππ΅ = π π β 1 π π1 = ππππ = πππ + πππ΅ = π πππ π=1β β = π β 1 ππππ (ππ β 1) π·πππ = 1 + (π β 1)π = π(π β 1)
2
=
Estimasi Proporsi pada Equal Cluster Sampling Penyelesaian Cluster
Ruta
Total
1
2
3
4
5
ππ
4
5
4
5
3
21
ππ
4 8 4 8 16 64
5 8 3 8 15 64
4 8 4 8 16 64
5 8 3 8 15 64
3 8 5 8 15 64
21 8 19 8 77 64
π π2 =
1 77 Γ = 0,240625 5 64
ππ π π2 = ππ ππ
1 2 π π€ = π
π
π=1
1 π= π 2 π π1
π
π=1
1 21 21 ππ = Γ = = 0,525 5 8 40
1 = (π β 1)
π
ππ β π π=1
1β
2
= 0,01094
5 48 Γ 0,01094 = 0,00196
1βπ 2 π = π π1 5 π π π = 0,00196 = 0,04427 π£ π =
2 πππ = πππ π€ = 5 Γ 8 Γ 0,240625 = 9,625 2 πππ΅ = π π β 1 π π1 = 8 Γ 5 β 1 Γ 0,01094 = 0,35008 ππππ = πππ + πππ΅ = 9,625 + 0,35008 = 9,97508 π πππ 8 9,625 π=1β β =1β Γ = β0,10275 π β 1 ππππ 8 β 1 9,97508 (ππ β 1) 5Γ8β1 π·πππ = 1 + (π β 1)π = 1 + (8 β 1) Γ (β0,10275) = 0,3421 π(π β 1) 8Γ 5β1
Penghitungan Sampling Error Rata-rata Elemen dengan Stata Data Awal
Lay Out data untuk Stata id_kelas
id_mahasiswa
buku
4
1
1
3
6
8
1
2
1
2
1
4
1
3
6
6
4
2
8
1
4
8
4
8
4
9
1
1
5
2
5
2
9
2
4
1
6
6
2
8
6
3
2
7
4
7
4
8
1
7
4
8
2
4
5
8
1
8
2
2
1
7
2
2
2
2
3
4
2
4
4
dst
dst
dst
Kelas (π)
Mahasiswa (π)
1
2
3
1
3
7
2
1
3
Penghitungan Sampling Error Rata-rata Karakteristik Elemen dengan Stata use "A:\Bahan Ajar MPC\contoh soal 1.dtaβ gen N=24 gen weight=24/4
nama file nama direktori
svyset id_kelas [pweight=weight], fpc(N) vce(linearized)
cluster Sampling weight=N/n
pweight : weight VCE : linearized Single unit : missing jumlah populasi Strata 1 :
SU 1 : id_kelas FPC 1 :N svy linearized : mean buku Koefisien korelasi intraklaster: (running mean on estimation sample) π(π β 1) Survey: Mean estimation Γ ππππ β 1 Number of strata = 1 Number of obs = 32 ππ β 1 Number of PSUs = 4 Population size = 192 π= πβ1 Design df = 3 8(4 β 1) Linearized Γ 1.182 β 1 Mean Std. Err. [95% Conf. Interval] 4Γ8β1 buku 4.75 estat effect Linearized Mean
.4588066
3.289873 6.210127
Std. Err.
DEFF
DEFT
buku
.4588066
1.182
.99247
4.75
=
8β1
= β0,0121 Koefisien korelasi intraklaster yang bernilai kecil ini mengindikasikan bahwa unit-unit di dalam klaster heterogen
Penghitungan Sampling Error Rata-rata Karakteristik Elemen dengan Stata oneway buku id_kelas Analysis of Variance Source SS Between groups 24.25 Within groups 187.75 Total 212
df 3 28 31
MS 8.08333333 6.70535714 6.83870968
F 1.21
Prob > F 0.3259
Koefisien korelasi intraklaster: π πππ π=1β Γ π β 1 ππππ 8 187,75 =1β Γ 8β1 212 = β0,0121 Koefisien korelasi intraklaster yang bernilai kecil ini mengindikasikan bahwa unit-unit di dalam klaster heterogen
Penghitungan Sampling Error Total Karakteristik dengan Stata use "A:\Bahan Ajar MPC\contoh soal 1.dtaβ gen N=24 gen weight=24/4 svyset id_kelas [pweight=weight], fpc(N) vce(linearized)
nama file nama direktori cluster
pweight : weight Sampling weight=N/n VCE : linearized Single unit : missing Strata 1 : jumlah populasi SU 1 : id_kelas FPC 1 :N svy linearized : total buku (running total on estimation sample) Koefisien korelasi intraklaster: Survey: Total estimation Number of strata = 1 Number of obs = 32 π(π β 1) Γ ππππ β 1 Number of PSUs = 4 Population size = 192 ππ β 1 Design df = 3 π= Linearized πβ1 Total Std. Err. [95% Conf. Interval] 8(4 β 1) buku
912
88.09086 631.6556 1192.344
Estat effect Linearized buku
Total
Std. Err.
DEFF
DEFT
912
88.09086 1.182 .99247
Γ 1.182 β 1 4Γ8β1 = 8β1 = β0,0121 Koefisien korelasi intraklaster yang bernilai kecil ini mengindikasikan bahwa unit-unit di dalam klaster heterogen
Penghitungan Sampling Error Rata-rata Cluster dengan Stata use "A:\Bahan Ajar MPC\contoh soal 1.dtaβ gen N=24 gen weight=24/4
nama file nama direktori
collapse (sum) buku (mean) weight (mean) N (max) id_mahasiswa, by(id_kelas) svyset id_kelas [pweight=weight], fpc(N) vce(linearized) cluster Sampling weight=N/n
pweight : weight VCE : linearized jumlah populasi Single unit : missing Strata 1 : SU 1 : id_kelas FPC 1 :N svy linearized : mean buku (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 4 Number of PSUs = 4 Population size = 24 Design df = 3 Linearized Mean Std. Err. [95% Conf. Interval] buku 38 3.670453 26.31898 49.68102
Penghitungan Sampling Error dengan Menggunakan Stata (Proporsi) use "A:\Bahan Ajar MPC\contoh soal 2.dtaβ gen N=48 gen weight=48/5
nama file nama direktori
gen pendidikan_krt2=0 replace pendidikan_krt2=1 if pendidikan_krt>2 svyset id_cluster [pweight=weight], fpc(N) vce(linearized) pweight : weight VCE : linearized Single unit : missing Strata 1 : SU 1 : id_cluster FPC 1 :N svy linearized : proportion pendidikan_krt2 (running proportion on estimation sample) Survey: Proportion estimation Number of strata = 1 Number of obs = 40 Number of PSUs = 5 Population size = 384 Design df = 4
cluster sampling weight=N/n
jumlah populasi
Penghitungan Sampling Error dengan Menggunakan Stata (Proporsi) Linearized Pendidikan_krt2 0 1
Proportion
Std. Err.
[95% Conf. Interval]
.475 .525
.0467707 .0467707
.3451437 .6048563 .3951437 .6548563
Proportion
Std. Err.
DEFF
.475 .525
.0467707 .0467707
.342105 .584898 .342105 .584898
estat effect Linearized Pendidikan_krt2 0 1
DEFT
Koefisien korelasi intraklaster: π(π β 1) 8(5 β 1) Γ ππππ β 1 Γ 0,342105 β 1 ππ β 1 5Γ8β1 π= = = β0,10275 πβ1 8β1 Koefisien korelasi intraklaster yang bernilai kecil ini mengindikasikan bahwa unit-unit di dalam klaster heterogen
Latihan 1 (kerjakan secara manual dan dengan menggunakan stata) Suatu kebun apel terdiri dari 270 petak yang masing-masing petak memuat 4 pohon apel. Suatu random sampel sebanyak 12 petak dipilih secara SRS WOR, kemudian dilakukan pengukuran terhadap berat semua buah apel (kg) yang dihasilkan oleh tiap pohon di petak terpilih. Petak
Pohon 1
2
3
4
1
5,53
4,84
0,69
15,79
2
26,11
10,93
10,08
11,18
3
11,08
0,65
4,21
7,56
4
12,66
32,52
16,92
37,02
5
0,87
3,56
4,81
27,54
6
6,40
11,68
40,05
5,12
7
54,21
34,63
52,55
37,20
8
1,24
35,97
29,54
25,28
9
37,94
47,07
19,64
28,11
10
25,52
38,10
26,24
6,77
11
45,98
5,17
24,74
1,90
12
7,13
34,35
1,17
6,53
a. Buatlah tabel annova-nya! b. Hitung koefisien korelasi intraklaster. c. Perkirakan rata-rata berat apel tiap pohon beserta standar error, RSE, dan 95%CI-nya!. Hitung design effect-nya ! d. Perkirakan rata-rata berat apel tiap petak beserta standar error, dan RSE, dan 95%CI-nya! e. Perkirakan berat total apel di kebun tersebut beserta standar error, RSE, dan 95%CI-nya ! f. Perkirakan proporsi dan total pohon yang berat produksi apelnya lebih dari rata-rata berat produksi apel tiap pohon di kebun tersebut. Lengkapi dengan nilai standar error, dan RSE, dan 95%CI-nya!. Hitung koefisien korelasi intraklaster dan design effect-nya! g. Interpretasikan hasil yang diperoleh !
TERIMA KASIH Have A Nice Sampling