PERTEMUAN 1-MPC 2 PRAKTIK
Oleh: Adhi Kurniawan
SEKOLAH TINGGI ILMU STATISTIK
Untuk meningkatkan presisi (mengurangi varians sampling), desain sampling sering memanfaatkan auxiliarry variable yang mempunyai hubungan yang erat dengan variabel yang diteliti
Digunakan dalam tahap penarikan sampel (Z)
Dasar Stratifikasi
Sebagai size pada PPS Sampling
Dasar pengurutan pada sampling sistematik (implicit stratification)
Variabel Pendukung (Auxiliarry Variable)
Ratio Estimate
Digunakan dalam tahap estimasi parameter (X)
Difference Estimate
Regression Estimate
GENERALIZED ESTIMATOR 𝒚𝑮 = 𝒚 + 𝒄 𝑿 − 𝒙 dengan c merupakan sesuatu yang belum ditetapkan (konstan atau variabel) 𝑦, 𝑥 merupakan nilai rata-rata karakteristik 𝑦 dan 𝑥 dari data sampel 𝑋 merupakan nilai rata-rata karakteristik 𝑥 dari data populasi Keterangan: 1.
Jika 𝑐 = 0 maka 𝑦𝐺 = 𝑦 ----> (rata-rata sederhana)
2.
Jika 𝑐 = 𝑘 (𝑘 adalah konstanta, tidak tergantung pada sampel), maka
𝑦𝐷 = 𝑦 + 𝑘 𝑋 − 𝑥 ----> (difference estimator) 3.
Jika 𝑐 = 𝛽 (𝛽 adalah konstanta, koefisien regresi populasi), maka 𝑦𝑙𝑟 = 𝑦 + 𝛽 𝑋 − 𝑥 ----> (regression estimator)
4.
Jika 𝑐 = 𝑏 (𝑏 adalah random variable, estimator untuk 𝛽), maka 𝑦𝑙𝑟 = 𝑦 + 𝑏 𝑋 − 𝑥 ----> (regression estimator)
5.
Jika 𝑐 = 𝑟 (𝑟 = 𝑦 𝑥), maka 𝑦𝑅 = 𝑦 + 𝑟 𝑋 − 𝑥 = 𝑟𝑋 ----> (ratio estimator)
GENERALIZED ESTIMATOR PADA DESAIN SRS No 1
Nama Estimator
Estimator rata-rata
Penduga SRS
1 𝑦= 𝑛
𝑛
𝑦𝑖
𝑦 𝑋 = 𝑅𝑋 𝑥
Penduga rasio (ratio estimator)
3
Penduga beda (difference estimator)
𝑦𝐷 = 𝑦 + 𝑘(𝑋 − 𝑥 )
4
Penduga regresi (regression estimator)
𝑦𝑙𝑟 = 𝑦 + 𝑏(𝑋 − 𝑥 )
Keterangan:
𝑠𝑦𝑥 𝑏= 2 𝑠𝑥 𝜌=
1 =𝑛−1
𝑠𝑦𝑥 = 𝑠𝑥 𝑠𝑦
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
1 2 𝑥 − 𝑥 𝑖 𝑛−1 𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦 𝑥𝑖 − 𝑥
2
𝑦𝑖 − 𝑦
=
2
𝑣 𝑦 =
1−𝑓 2 𝑠𝑦 𝑛
𝑖=1
2
𝑦𝑅 =
Unbiased Sampling Variance
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦 𝑥𝑖 − 𝑥 2
(1 − 𝑓) 2 𝑠𝑦 − 2𝑅 𝜌𝑠𝑦 𝑠𝑥 + 𝑅 2 𝑠𝑥2 𝑛 (1 − 𝑓) 2 = 𝑠𝑦 − 2𝑘𝜌𝑠𝑦 𝑠𝑥 + 𝑘 2 𝑠𝑥2 𝑛 (1 − 𝑓) 2 = 𝑠𝑦 − 2𝑏𝜌𝑠𝑦 𝑠𝑥 + 𝑏 2 𝑠𝑥2 𝑛 (1 − 𝑓) 2 = 𝑠𝑦 1 − 𝜌2 𝑛
𝑣 𝑦𝑅 = 𝑣 𝑦𝑅 𝑣 𝑦𝑙𝑟
1 𝑋= 𝑁 1 𝑥= 𝑛
𝑁
𝑋𝑖 → rata − rata populasi 𝑖=1 𝑛
𝑥𝑖 → rata − rata sampel 𝑖=1
GENERALIZED ESTIMATOR PADA DESAIN SRS No
Nama Estimator
Estimator total
Unbiased Sampling Variance
𝑌 = 𝑁𝑦
𝑣 𝑌 = 𝑁2𝑣 𝑦
Penduga rasio (ratio estimator)
𝑌𝑅 = 𝑁𝑦𝑅
𝑣 𝑌 = 𝑁 2 𝑣 𝑦𝑅
3
Penduga beda (difference estimator)
𝑌𝐷 = 𝑁𝑦𝐷
𝑣 𝑌 = 𝑁 2 𝑣 𝑦𝐷
4
Penduga regresi (regression estimator)
𝑌𝑙𝑟 = 𝑁𝑦𝑙𝑟
𝑣 𝑌 = 𝑁 2 𝑣 𝑦𝑙𝑟
1
Penduga SRS
2
Keterangan: 𝑁: jumlah populasi
Relative Efficiency (RE) Merupakan perbandingan varians dari dua metode. Metode yang variansnya lebih kecil daripada metode lainnya dikatakan lebih efisien 𝑣 𝑌1 𝑣 𝑦1 𝑅𝐸 = 𝑎𝑡𝑎𝑢 𝑅𝐸 = 𝑣(𝑦2 ) 𝑣(𝑌2 )
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 1: Sebuah pengamatan dilakukan terhadap 100 lahan yang ditanami pohon cabai merah di suatu desa. Dari hasil pengamatan dengan eye estimate diperoleh total produksi dari 100 lahan tersebut sebanyak 5750 kg. Sebuah random sampel sebanyak 10 lahan diambil secara SRS WOR dan setiap lahan terpilih dilakukan pemanenan cabai merah dan selanjutnya dilakukan pengukuran terhadap berat dari cabai yang dihasilkan. Data produksi cabai (kg) dari lahan terpilih yang diperoleh dari hasil pengamatan (eye estimate) dan hasil pengukuran sebagai berikut:
No urut lahan Produksi (pengukuran) Produksi (pengamatan)
1
2
3
4
5
6
7
8
9
10
51
42
46
39
71
61
58
57
58
67
56
47
48
40
78
59
52
58
55
67
a. Perkirakan rata-rata produksi cabai per lahan dan total produksi cabai merah di desa tersebut dengan menggunakan difference estimator (𝑘 = 1) beserta standar error, RSE, dan 95% confidence intervalnya ! Interpretasikan hasil yang diperoleh b. Perkirakan rata-rata produksi cabai per lahan dan total produksi cabai merah di desa tersebut dengan menggunakan regression estimator beserta standar error, RSE, dan 95% confidence interval-nya ! Interpretasikan hasil yang diperoleh c. Hitunglah efisiensi penduga regresi terhadap penduga beda. Kesimpulan apa yang dapat diperoleh ?
REGRESSION ESTIMATOR PADA DESAIN SRS Bentuk lain dari varians regression estimator: 1−𝑓 2 1−𝑓 2 2 𝑣 𝑦 = 𝑠𝑦 1 − 𝜌 = 𝑠𝑦 − 𝑠𝑦2 𝜌2 𝑛 𝑛 2 2 𝑠 𝑠 1−𝑓 2 1 − 𝑓 𝑦𝑥 𝑦𝑥 = 𝑠𝑦 − 𝑠𝑦2 2 2 = 𝑠𝑦2 − 2 𝑛 𝑛 𝑠𝑦 𝑠𝑥 𝑠𝑥 1−𝑓 2 1−𝑓 = 𝑠𝑦 − 𝑏𝑠𝑦𝑥 = 𝑛 𝑛(𝑛 − 1) 𝒏
𝒏
𝒚𝒊 − 𝒚 𝒊=𝟏
1−𝑓 = 𝒚𝒊 − 𝒚 − 𝒃 𝒙𝒊 − 𝒙 𝑛(𝑛 − 1) 𝒊=𝟏 1−𝑓 = ∙ 𝑺𝑺𝑹𝒆𝒔 𝑛(𝑛 − 1) Keterangan: 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝒆𝒊 = 𝒚𝒊 − 𝒚 − 𝒃 𝒙𝒊 − 𝒙
𝒏 𝟐
−𝒃
𝒚𝒊 − 𝒚 𝒙𝒊 − 𝒙 𝒊=𝟏
𝟐
𝒏
𝑆𝑢𝑚 𝑂𝑓 𝑆𝑞𝑢𝑎𝑟𝑒 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝑆𝑆𝑅𝑒𝑠 =
𝒚𝒊 − 𝒚 − 𝒃 𝒙𝒊 − 𝒙 𝒊=𝟏
𝟐
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 1 jika diselesaikan dengan SPSS
Syntax SPSS REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT Produksi_pengukuran /METHOD=ENTER Produksi_pengamatan.
Koefisien korelasi 𝝆
REGRESSION ESTIMATOR PADA DESAIN SRS Estimasi rata-rata
SSRes
𝑦𝑙𝑟 = 𝑦 + 𝑏 𝑋 − 𝑥 = 𝑦 + 𝑏𝑋 − 𝑏𝑥 = 𝑦 − 𝑏𝑥 + 𝑏𝑋 = 4,405 + 0,903 × 57,5 =56,3275 1−𝑓 𝑣 𝑦𝑙𝑟 = × 𝑆𝑆𝑅𝑒𝑠 𝑛(𝑛 − 1)
1 − 0,1 × 134,347 10(10 − 1) = 1,34347 =
𝑠𝑒 𝑦𝑙𝑟 = 1,15908 Estimasi total 𝑌𝑙𝑟 = 𝑁𝑦𝑙𝑟 = 100 × 56,3275 = 5632,75 𝑣 𝑌𝑙𝑟 = 𝑁 2 𝑣 𝑦𝑙𝑟 = 1002 × 1,34347 = 13.434,7 𝑠𝑒 𝑌𝑙𝑟 = 115,908
Koefisien regresi 𝒃
𝒚 − 𝒃𝒙
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 2: Untuk meneliti kondisi pendidikan para penyandang cacat, dilakukan suatu survei disabilitas di pulau Jawa. Dari 118 kabupaten/kota diambil sampel sebanyak 30 kabupaten/kota secara SRS WOR, kemudian dilakukan pencacahan ke semua Sekolah Luar Biasa (SLB) yang ada di kabupaten/kota terpilih. Untuk setiap SLB yang dikunjungi, dilakukan tes terhadap para penyandang cacat yang belajar di sekolah tersebut. Misalkan, 𝑥𝑖 merupakan jumlah guru yang mengajar di SLB untuk kabupaten/kota ke-i, 𝑦𝑖 merupakan jumlah penyandang cacat yang nilai tesnya berada di atas standar nilai minimal yang ditetapkan. Diketahui jumlah guru SLB di pulau Jawa sebanyak 826 orang. Ringkasan data yang diperoleh sebagai berikut: 𝑛
𝑛
𝑥𝑖 = 225 , 𝑖=1
a.
𝑛
𝑦𝑖 = 1127 , 𝑖=1
𝑛
𝑥𝑖2 = 3005 ,
𝑥𝑖 𝑦𝑖 = 14977 , 𝑖=1
𝑛
𝑖=1
𝑦𝑖2 = 75281 𝑖=1
Perkirakan total penyandang cacat di pulau Jawa yang nilainya berada di atas standar minimal dengan
penduga rata-rata sederhana, lengkapi dengan standar error, RSE, dan 95% Confidence Interval-nya ! b.
Dengan regression estimator, perkirakan total penyandang cacat di pulau Jawa yang nilainya berada di atas standar minimal beserta standar error, RSE, dan 95% Confidence Interval-nya !
c.
Hitunglah efisiensi regression estimator terhadap penduga SRS ! Apa yang dapat anda simpulkan ?
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 3: Dari data Sensus Ternak tahun lalu diperoleh informasi bahwa jumlah peternak sapi di suatu wilayah sebanyak 82.688 rumah tangga peternak dan rata-rata jumlah sapi untuk tiap peternak sebanyak 9 ekor. Sebuah sampel acak sederhana sebanyak 5.168 peternak diambil dari populasi tersebut untuk memperkirakan produksi susu yang dihasilkan. Jumlah sapi yang diperoleh dari hasil observasi adalah 48.450 ekor dan rata-rata produksi susu untuk tiap peternak sebanyak 300 liter per hari. Informasi lain yang diperoleh sebagai berikut: 𝑠𝑦 = 28,8 𝑠𝑥 = 1,25 𝜌 = 0,875 Dengan menggunakan regression estimator, a.
Perkirakan rata-rata produksi susu per hari yang dihasilkan oleh rumah tangga peternak beserta standar error, rse, dan 95% Confidence Interval-nya !
b.
Perkirakan total produksi susu per hari di wilayah tersebut beserta standar error, rse, dan 95% Confidence Interval-nya !
c.
Interpretasikan hasil yang diperoleh !
Keterangan: 𝑥 menyatakan jumlah sapi. 𝑦 menyatakan produksi susu.
REGRESSION ESTIMATOR PADA DESAIN SRS Soal Latihan 4: Dalam rangka Praktik Kerja Lapangan, mahasiswa Tingkat 3 STIS melakukan penelitian kondisi kesehatan masyarakat di suatu wilayah. Dari hasil pemutakhiran (updating) rumah tangga yang dilakukan secara sensus (complete enumeration) di blok sensus terpilih diperoleh informasi bahwa jumlah penduduk yang mengalami keluhan kesehatan selama sebulan yang lalu sebanyak 248 orang. Dari populasi eligible rumah tangga sebanyak 120 rumah tangga yang diperoleh dari hasil pemutakhiran, diambil sampel sebanyak 10 rumah tangga secara SRS WOR untuk dilakukan pencacahan yang lebih rinci. Data yang diperoleh: No urut ruta sampel Jumlah ART mengalami keluhan (hasil updating) Jumlah ART mengalami keluhan (hasil pencacahan)
1
2
3
4
5
6
7
8
9
10
3
0
3
0
3
0
2
4
4
1
4
1
4
1
3
1
2
4
4
1
a. Dengan menggunakan penduga rata-rata sederhana, penduga rasio, penduga beda (k=1), dan penduga regresi, perkirakan jumlah penduduk yang mengalami keluhan kesehatan selama sebulan yang lalu beserta standar error, rse, dan 95% Confidence Interval-nya !. Interpretasikan hasil yang diperoleh. b. Bandingkan efisiensi dari keempat metode pada point (a). Metode manakah yang mempunyai efisiensi yang terbaik ?
GENERALIZED ESTIMATOR PADA DESAIN PPS No 1
Nama Estimator Penduga PPS
Estimator total 𝑌𝑝𝑝𝑠
1 = 𝑛
𝑛
𝑖=1
Unbiased Sampling Variance
𝑦𝑖 𝑝𝑖
𝑌𝑝𝑝𝑠
𝑣 𝑌𝑝𝑝𝑠
2
Penduga rasio (ratio estimator)
𝑌𝑅(𝑝𝑝𝑠) =
3
Penduga beda (difference estimator)
𝑌𝐷(𝑝𝑝𝑠) = 𝑌𝑝𝑝𝑠 + 𝑘(𝑋 − 𝑋𝑝𝑝𝑠 )
4
Penduga regresi (regression estimator)
𝑏=
𝑋𝑝𝑝𝑠
𝑛
𝑖=1
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖
2
𝑣 𝑌𝑅(𝑝𝑝𝑠) = 𝑣 𝑌𝑝𝑝𝑠 − 2𝑅 𝜌 𝑣 𝑌𝑝𝑝𝑠 𝑣 𝑋𝑝𝑝𝑠 + 𝑅 2 𝑣 𝑋𝑝𝑝𝑠
𝑋 = 𝑅𝑋
𝑌𝑙𝑟(𝑝𝑝𝑠) = 𝑌𝑝𝑝𝑠 + 𝑏(𝑋 − 𝑋𝑝𝑝𝑠 )
𝑦𝑖 𝑥𝑖 − 𝑌𝑝𝑝𝑠 − 𝑋𝑝𝑝𝑠 𝑝𝑖 𝑝𝑖 2 𝑥𝑖 − 𝑋𝑝𝑝𝑠 𝑝𝑖
1 = 𝑛(𝑛 − 1)
𝑣 𝑌𝐷(𝑝𝑝𝑠) = 𝑣 𝑌𝑝𝑝𝑠 − 2𝑘𝜌 𝑣 𝑌𝑝𝑝𝑠 𝑣 𝑋𝑝𝑝𝑠 + 𝑘 2 𝑣 𝑋𝑝𝑝𝑠 𝑣 𝑌𝑙𝑟(𝑝𝑝𝑠) = 𝑣 𝑌𝑝𝑝𝑠 − 2𝑏𝜌 𝑣 𝑌𝑝𝑝𝑠 𝑣 𝑋𝑝𝑝𝑠 + 𝑏2 𝑣 𝑋𝑝𝑝𝑠 = 𝑣 𝑌𝑝𝑝𝑠 1 − 𝜌2
𝜌=
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖 𝑥𝑖 − 𝑋𝑝𝑝𝑠 𝑝𝑖
2
𝑥𝑖 − 𝑋𝑝𝑝𝑠 𝑝𝑖 𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖
2
𝑋𝑝𝑝𝑠
1 = 𝑛
𝑛
𝑖=1
𝑥𝑖 𝑝𝑖
𝑝𝑖 =
𝑍𝑖 𝑍
𝑍 merupakan nilai dari variabel pendukung yang digunakan sebagai size (dasar peluang) dalam pengambilan sampel secara PPS, 𝑋 merupakan variabel pendukung yang digunakan pada tahap estimasi.
GENERALIZED ESTIMATOR PADA DESAIN PPS No
Nama Estimator
Estimator rata-rata
Unbiased Sampling Variance
1
Penduga PPS
2
Penduga rasio (ratio estimator)
𝑦𝑅(𝑝𝑝𝑠) =
𝑌𝑅(𝑝𝑝𝑠) 𝑁
𝑣 𝑦𝑅(𝑝𝑝𝑠) =
𝑣(𝑌𝑅(𝑝𝑝𝑠) ) 𝑁2
3
Penduga beda (difference estimator)
𝑦𝐷(𝑝𝑝𝑠) =
𝑌𝐷(𝑝𝑝𝑠) 𝑁
𝑣 𝑦𝐷(𝑝𝑝𝑠) =
𝑣(𝑌𝐷(𝑝𝑝𝑠) ) 𝑁2
4
Penduga regresi (regression estimator)
𝑦𝑙𝑟(𝑝𝑝𝑠) =
𝑌𝑙𝑟(𝑝𝑝𝑠) 𝑁
𝑣 𝑦𝑙𝑟(𝑝𝑝𝑠) =
𝑣(𝑌𝑙𝑟(𝑝𝑝𝑠) ) 𝑁2
Keterangan:
𝑣 𝑌𝑝𝑝𝑠 𝑣 𝑋𝑝𝑝𝑠
1 = 𝑛(𝑛 − 1) 1 = 𝑛(𝑛 − 1)
𝑦𝑝𝑝𝑠 =
𝑛
𝑖=1 𝑛
𝑖=1
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖 𝑥𝑖 − 𝑋𝑝𝑝𝑠 𝑝𝑖
2
2
𝑌𝑝𝑝𝑠 𝑁
𝑣 𝑦𝑝𝑝𝑠 =
𝑣(𝑌𝑝𝑝𝑠 ) 𝑁2
REGRESSION ESTIMATOR PADA DESAIN PPS Soal Latihan 5 Berdasarkan hasil pencacahan Potensi Desa (Podes) 2011, jumlah tindak kriminalitas di suatu kecamatan mencapai 775 kasus. Suatu survei dilakukan di kecamatan tersebut pada akhir tahun 2012 dengan mengambil sampel sebanyak 12 desa dari 30 desa secara PPS WR dengan size jumlah rumah tangga. Jumlah rumah tangga di kecamatan tersebut sebanyak 69.875 rumah tangga. Dari setiap desa terpilih diteliti jumlah kasus kriminalitas yang terjadi selama tahun 2012.
Jumlah Kriminalitas
No
Jumlah ruta
1
1750
19
14
2
1500
16
9
3
2625
28
21
a. Perkirakan total tindak kriminalitas di kecamatan tsb tahun 2012 dengan estimasi PPS beserta standar error, RSE, dan 95% Confidence interval-nya!
4
2000
28
14
5
3000
24
21
b. Jika jumlah tindak kriminalitas tahun 2011 dijadikan sebagai auxiliarry variable, perkirakan total kasus kriminalitas yang terjadi di kecamatan tsb pada tahun 2012 dengan estimasi regresi beserta standar error, RSE, dan 95% Confidence intervalnya !
6
1000
6
9
7
3000
38
21
8
1250
12
10
9
3625
38
29
c. Hitung relative efficiency estimasi regresi terhadap estimasi PPS !
10
3250
48
26
d. Interpretasikan hasil yang diperoleh
11
3875
35
31
12
1000
8
7
2011 2012 (Podes) (survei)
TERIMA KASIH Have A Nice Sampling