MODEL BAYES UNTUK PENDUGAAN AREA KECIL DENGAN PENARIKAN CONTOH BERPELUANG TIDAK SAMA PADA KASUS RESPON BINOMIAL DAN MULTINOMIAL
APLIKASI : PENDUGAAN INDEKS PENDIDIKAN LEVEL KECAMATAN DI JAWA TIMUR
AGNES TUTI RUMIATI
G161080031 / STK
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2012
MODEL BAYES UNTUK PENDUGAAN AREA KECIL DENGAN PENARIKAN CONTOH BERPELUANG TIDAK SAMA PADA KASUS RESPON BINOMIAL DAN MULTINOMIAL APLIKASI : PENDUGAAN INDEKS PENDIDIKAN LEVEL KECAMATAN DI JAWA TIMUR
Oleh: AGNES TUTI RUMIATI G161080031 / STK
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada
Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2012
Judul
Nama Mahasiswa Nomor Pokok Program Studi
:
: : :
Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama pada Kasus Respon Binomial dan Multinomial. Aplikasi : Pendugaan Indeks Pendidikan Level Kecamatan di Jawa Timur Agnes Tuti Rumiati G161080031 Statistika
Menyetujui: Komisi Pembimbing
Prof. Dr. Ir. Khairil A. Notodiputro, MS Ketua
Dr. Ir. I Wayan Mangku, MSc Anggota
Dr. Ir. Kusman Sadik, MS. Anggota
Mengetahui:
Koordinator Program Studi Statistika
Dr. Ir. Aji Hamim Wigena, MSc.
Dekan Sekolah Pascasarjana
Dr. Ir. Dahrul Syah, MSc.Agr
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi yang berjudul Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus Respon Binomial dan Multinomial adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan daftar pustaka disertasi ini.
Bogor, September 2012
Agnes Tuti Rumiati NIM. G161080031/STK
ABSTRACT AGNES TUTI RUMIATI. Bayesian Models for Small Area Estimation Based on Unequal Probability Sampling of Binomial and Multinomial Responses. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, I WAYAN MANGKU and KUSMAN SADIK
In this research a Bayesian Method of Small Area Estimation (SAE) has been developed based on binomial and multinomial response variables using Susenas data obtained from unequal probability sampling. Case study was carried out to predict education level of the population measured by literacy rate and mean years of schooling in sub-district level in East Java Province. The SAE model for binomial response was developed with two methods, i.e. using weighted logit normal mixed model and involving the probability of sampling selection model as exponential function into the SAE model. A simulation study was carried out by implementing 100 times sampling selection into population data. Penalized Quasi Likelihood (PQL) and Restricted Maximum Likelihood method (REML) was used to parameter estimation of SAE model. Based on the simulation result, we found that the weighted logit normal mixed model gave the best estimate. In application, the weighted logit normal mixed model also provided good prediction of literacy rate in Sumenep and Pasuruan regency.For the multinomial respons, we applied the weighted logit multinomial mixed model. MSE estimation was used Jackknife method and it gave very small MSE of about 1,14 x10-7.
Keywords: SAE model, Bayesian approach, binomial and multinomial response Monte Carlo integration, literacy rate, Susenas, unequal probability sampling, logit normal mixed model, logit multinomial mixed model.
RINGKASAN Berbagai survei umumnya dirancang untuk menduga parameter populasi untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi, kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah yang lebih kecil, umumnya jumlah contoh
kurang mencukupi jika digunakan
untuk menduga berdasarkan rancangan. Di Indonesia, kebutuhan untuk melakukan pendugaan di area kecil mulai dirasakan terutama untuk merancang dan mengevaluasi kebijakan dan program pembangunan di level kabupaten /kota. Salah satu indikator yang mengukur hasil pembangunan di suatu wilayah adalah Indeks Pembangunan Manusia (IPM). IPM dihitung oleh Badan Pusat Satistik (BPS) dengan menggunakan data dasar hasil Survai Sosial Ekonomi Nasional (Susenas). Susenas dilakukan oleh BPS tiap tahun, dirancang untuk menduga parameter sosial-ekonomi level nasional atau regional sehingga tidak cukup representatif untuk pendugaan parameter tingkat kecamatan. Penggunaan data Susenas untuk pendugaan parameter di tingkat kecamatan atau desa akan menghadapi dua persoalan statistika yaitu: 1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan contohnya memiliki peluang tidak sama karena rancangan penarikan contoh dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil blok sensus pada tahap pertama dan pada tahap ke dua mengambil rumah tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam Susenas memiliki peluang tidak sama. Penelitian ini bertujuan untuk mengembangkan model SAE untuk menduga Indeks Pendidikan yang merupakan salah satu komponen IPM. Indeks Pendidikan diukur dengan angka melek huruf dan rata-rata lama sekolah di suatu wilayah. Angka melek huruf diukur dengan proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis, sedangkan rata-rata lama sekolah diukur dari proporsi penduduk berusia 10 tahun ke atas di tiap level pendidikan tertentu. Proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis adalah parameter dari sebuah distribusi Binomial, sedangkan
proporsi penduduk
berusia 10 tahun ke atas di tiap level pendidikan tertentu merupakan parameter dari distribusi Multinomial. Dalam penelitian disertasi ini, pengembangan model SAE untuk peubah respon Binomial dan Multinomial berbasis pada penarikan contoh berpeluang tidak sama mengacu kepada beberapa penelitian tentang pengembangan model
SAE untuk peubah respon binomial dan multinomial, serta pengembangan model SAE yang memperhitungkan peluang penarikan contoh. Pendugaan parameter area dilakukan dengan menggunakan pendekatan Bayes. Dengan melakukan simulasi, diperoleh bahwa model SAE untuk peubah respon binomial menggunakan sebaran prior logit normal melalui pendekatan Bayes empirik yang dikembangkan dengan memperhitungkan peluang penarikan contoh memberikan penduga yang paling baik karena dapat menurunkan bias dan
KTG dari penduga. Dengan mengaplikasikan model SAE logit normal
terbobot melalui pendekatan Bayes, dihasilkan perbedaan antara nilai parameter populasi dengan prediksinya relatif kecil. Kabupaten Sumenep memiliki ratarata bias sebesar 0,0628 dan nilai KTG sebesar 0,0149 dan untuk Kabupaten Pasuruan rata-rata biasnya sebesar 0,0136 dengan KTG sebesar 0,0212. Sementara itu metode pendugaan area kecil yang dikembangkan berdasarkan penarikan contoh informatif yaitu dengan menyertakan model peluang penarikan contoh dalam bentuk fungsi eksponensial memberikan ratarata bias relatif yang rendah namun memberikan akar rata-rata kuadrat bias relatif maupun KTG yang lebih tinggi dibandingkan dengan metode pendugaan menggunakan sebaran prior logit normal terbobot. Besarnya nilai KTG lebih banyak disebabkan karena ragam pendugaan yang relatif besar sehingga walaupun memberikan bias yang kecil maka KTG akan cenderung tinggi. Penurunan bias dari model SAE eksponensial ini menunjukkan bahwa memperhitungkan peluang penarikan contoh dalam model SAE akan dapat menurunkan bias. Pfefferman (2010) mengatakan bahwa mengabaikan peluang penarikan contoh dalam model SAE akan menghasilkan bias pendugaan karena dengan mengabaikan peluang penarikan contoh, maka pendugaan parameter model untuk area/unit yang terambil sebagai contoh sama dengan area/unit yang tidak terambil sebagai contoh. Berdasarkan hasil simulasi maupun aplikasi di Kabupaten Sumenep dan Pasuruan membuktikan bahwa model SAE untuk peubah respon binomial
menggunakan model campuran logit normal terbobot memberikan hasil yang paling akurat dalam pendugaan parameter proporsi area kecil. Selanjutnya pendugaan area kecil untuk respon multinomial dilakukan dengan cara yang sama yaitu melalui model campuran logit multinomial terbobot. Pendugaan KTG dilakukan dengan menggunakan metode Jackknife. Dari hasil aplikasi di Kabupaten Sumenep dan Pasuruan,
penduga KTG untuk logit
multinomial terbobot melalui pendekatan Bayes juga memberikan nilai penduga KTG yang sangat kecil yaitu pada kisaran antara 1,14 x 10-7 sampai 8,17 x10-7 karena pada mumnya kondisi blok sensus di tiap kecamatan relatif sama. Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau heterogenitas dari nilai respon dari area yang satu ke area yang lain. Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada heterogenitas nilai dugaan proporsi dari area ke area. Semakin heterogen maka akan menghasilkan nilai dugaan KTG yang cenderung lebih besar. Hal yang sama juga ditemui pada pendugaan area kecil yang memperhitungkan peluang penarikan contoh. Besarnya KTG yang dihasilkan oleh metode SAE yang menyertakan fungsi eksponensial dari peluang percontohan perlu dikaji lebih dalam karena bias yang dihasilkan relatif sangat kecil sehingga kemungkinan besarnya KTG disebabkan oleh ragam pendugaan yang besar. Perlu dikembangkan model yang serupa tetapi dapat menurunkan ragam pendugaan.
@ Hak Cipta Institut Pertanian Bogor (IPB), Tahun 2012 Hak Cipta Dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruhnya karya tulis ini tanpa mencantumkan atau menyebutkan sumber: a. Pengutipan
hanya
untuk
kepentingan
pendidikan,
penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah b. Pengutipan tidak merugikan kepentingan yang wajar IPB
2. Dilarang mengumumkan atau memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa ijin IPB.
PRAKATA
Puji syukur penulis panjatkan kehadirat Allah SWT, karena atas rahmat dan hidayah-Nyalah akhirnya disertasi dengan judul “Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus Respon
Binomial dan Multinomial”, dengan aplikasi Pendugaan Indeks
Pendidikan Level Kecamatan di Jawa Timur ini dapat diselesaikan dengan baik. Selain untuk memenuhi syarat memperoleh gelar doktor pada program studi Statistika-IPB, disertasi ditujukan untuk menghasilkan metode statistik yang dapat digunakan oleh pemerintah atau pihak lain untuk melakukan pendugaan area kecil yang memiliki jumlah data terbatas tanpa perlu menambah contoh dengan memanfaatkan informasi yang ada sehingga dapat mengurangi biaya penelitian. Selama pelaksanaan penelitian dan penyelesaian disertasi ini, penulis banyak mendapatkan bantuan dari berbagai pihak baik secara moril dan meteriil sehingga disertasi ini dapat terselesaikan dengan baik. Pada kesempatan ini secara khusus penulis mengucapkan terima kasih kepada : 1.
Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. I Wayan Mangku dan Bapak Dr Kusman Sadik selaku dosen pembimbing yang telah banyak memberikan arahan, bimbingan dan saran hingga disertasi ini bias diselesaikan dengan baik.
2.
Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang telah menjadi teman diskusi, memberikan saran dan dorongan moril.
3.
Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah memberikan layanan pengajaran dan administrasi yang baik.
4.
Seluruh dosen dan karyawan Jurusan Statistika FMIPA ITS,
5.
Para peneilti dan karyawan BPS Pusat dan Provinsi Jawa Timur yang banyak membantu memberikan data dan penjelasan terkait data Susenas dan Sensus Penduduk
6.
Para peneiliti dan karyawan Pusat Penelitian Potensi daerah dan Pemberdayaan
Masyarakat
(PDPM),
LPPM-ITS
yang
telah
memberikan bantuin moril dan materiil selama penulis melaksanakan studi S3 dan menyelesaikan penelitian disertasi 7.
Suami dan anak-anak tercinta serta seluruh keluarga yang senantiasa memberikan dorongan semangat, doa yang ikhlas dan telah mendampingi penulis selama studi S3 dan menyelesaikan penelitian disertasi.
8.
Teman-teman
sesama mahasiswa
program
Pasca
Sarjana
di
Departemen Statistika-IPB serta berbagai pihak lain yang tidak dapat penulis sebutkan satu persatu. Akhir kata, dengan segala kerendahan hati, penulis menyadari bahwa disertasi ini masih jauh dari sempurna, oleh karena itu penulis sangat mengharapkan saran dan masukan yang bermanfaat untuk memperbaiki tulisan disertasi ini. Namun demikian, penulis berharap tulisan ini dapat bermanfaat bagi mereka yang memerlukannya. Semoga Allah SWT senantiasa memberikan kebaikan untuk kita semua.
Bogor, September 2012
Agnes Tuti Rumiati
RIWAYAT HIDUP
Penulis dilahirkan di kota Mojokerto, Jawa Timur pada tanggal 24 Juli 1957 dari pasangan Bapak JH Soeratman (alm) dan Ibu P Sri Woelan (alm). Penulis merupakan anak pertama dari lima bersaudara dan menikah dengan Ir. Nus Irwansyah, MBA dan telah dikaruniai dua anak yaitu Duta Perdana MA dan Rizqi Yoshita. Pendidikan Sarjana ditempuh di Jurusan Matematika, FIPIA – ITS lulus pada tahun 1982 dengan pembimbing Bapak I Nyoman Latra, MS. Pada tahun 1996, penulis memperoleh gelar Master of Science dari School of Mathematics and Statistics, The University of Sheffield, United Kingdom dengan pembimbing tesis Professor John Biggins. Sejak tahun 2008 penulis menempuh Program Doktor pada Program Studi Statistika Sekolah Pascasarjana IPB. Sejak tahun 1985 sampai dengan saat ini penulis bekerja sebagai dosen di Jurusan Statistika, FMIPA-ITS dan peneliti di Pusat Penelitian Potensi daerah dan Pemberdayaan Masyarakat (PDPM), Lembaga Penelitian dan Pengabdian Masyarakat (LPPM)-ITS. Selama mengikuti pendidikan Program Doktor, penulis telah menghasilkan beberapa karya ilmiah yang telah dipublikasikan dalam seminar nasional serta jurnal ilmiah, diantaranya : 1. Rumiati, AT, Notodiputro AK, Mangku IW dan Sadik K, 2012. Empirical Bayesian Method for The Estimation of Literacy Rate at Sub-district Level. Case Study: Sumenep District of East Java Province, IPTEK, The Journal for Technology and Science, Vol. 23, No. 1, February 2012. 2. Rumiati, AT, Regresi Polinomial local untuk Data Survey Berskala Besar, Studi kasus: Model Pengeluaran Rumah Tangga berdasarkan Data Susenas Jawa Timur 2006. Prosiding pada Seminar Nasional Statistika, 7 Nopember 2009. Jurusan ITSSurabaya.
DAFTAR ISI
Halaman DAFTAR TABEL ..........................................................................................
v
DAFTAR GAMBAR ......................................................................................
vi
DAFTAR LAMPIRAN ..................................................................................
viii
I.
II.
Pendahuluan.......................................................................................
1
1.1. Latar Belakang .............................................................................
1
1.2. Tujuan Penelitian ..........................................................................
5
1.3. Ruang Lingkup .............................................................................
5
1.4. Kebaruan .....................................................................................
7
1.5. Sistematika Disertasi....................................................................
8
Tinjauan pustaka ................................................................................
11
2.1. Pendahuluan ................................................................................
11
2.2
Model Dasar Pendugaan Area Kecil ............................................
11
2.2.1. Pendugaan Area Kecil Berbasis Area ...............................
12
2.2.2. Pendugaan Area Kecil Berbasis Unit ................................
13
Pendugaan Parameter Model Pendugaan Area kecil ...................
14
2.3
2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE) ...........
14
2.3.2 Pendugaan Parameter Model SAE Melalui Pendekatan Bayes................................................................................ 2.4. Peluang Penarikan Contoh ..........................................................
16 18
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh .........................................................................................
21
Indeks Pembangunan Manusia (IPM) ..........................................
23
2.6.1. Cara Perhitungan IPM ......................................................
24
2.6.2. Indikator Pendidikan/ Pengetahuan ..................................
26
2.7. Survei Sosial Ekonomi Nasional (Susenas) .................................
27
2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh ....
27
2.7.2. Penentuan Bobot ..............................................................
28
2.6
i
III. Model Bayes untuk Pendugaan Area Kecil Berbasis Peubah Respon Binomial ................................................................................
30
3.1
Pendahuluan ...............................................................................
30
3.2
Metode Pendugaan Langsung Melalui Pendekatan Bayes..........
32
3.2.1. Pendugaan Bayes Menggunakan Sebaran Prior Beta ....
32
3.2.2. Pendekatan Bayes Menggunakan Sebaran Prior LogitNormal..............................................................................
35
3.3. Metode Pendugaan Tak Langsung Melalui Pendekatan Bayes . .
36
3.4. Aplikasi
:
Pendugaan
Angka
Melek
Huruf
di
Tingkat
Kecamatan, Kabupaten Sumenep Berbasis Data Susenas .........
39
3.4.1. Pendugaan Langsung ......................................................
40
3.4.2. Pendugaan Tak Langsung ..............................................
43
3.5. Pembahasan ...............................................................................
45
IV. Model SAE Berbasis Sebaran Respon Multinomial Melalui Pendekatan Bayes ..............................................................................
47
4.1. Pendahuluan ..............................................................................
47
4.2. Model SAE untuk Respon Multinomial .......................................
48
4.2.1. Pendugaan Parameter Model .........................................
49
4.2.2. Pendugaan Ragam .........................................................
52
4.2.3. Pendugaan Parameter Area Melalui Pendekatan Bayes .
54
4.3. Aplikasi: Pendugaan
Rata-Rata Lama Sekolah Tingkat
Kecamatan di Jawa Timur Berbasis Data Susenas 2010 ...........
56
4.3.1. Pengukuran Peubah Respon dan Peubah Penyerta .......
56
4.3.2. Hasil Eksplorasi Data ......................................................
57
4.3.3. Pendugaan
Rata-rata
Lama
Sekolah
di
Tingkat
Kecamatan .....................................................................
58
4.4. Pembahasan ..............................................................................
60
V. Model Bayes Pendugaan Area Kecil untuk Respon Binomial dan Multinomial Berbasis Penarikan Contoh Berpeluang Tidak Sama.....................................................................................................
62
5.1. Pendahuluan ..............................................................................
62
5.2. Penyertaan Peluang Penarikan Contoh pada Model SAE...........
63
ii
5.3. Pendugaan Area Kecil Menggunakan Model Campuran Linier Terbobot ......................................................................................
70
5.4. Pengembangan Model Bayes SAE Berbasis Penarikan Contoh Berpeluang Tidak Sama untuk Respon Binomial .........................
71
5.4.1. Penentuan Bobot ............................................................
72
5.4.2. Metode Pendugaan Parameter Area Kecil dengan Menyertakan Peluang Penarikan Contoh yang Bersifat Eksponensial .................................................................. 5.4.3. Metode
Pendugaan
Parameter
Area
73
Kecil
menggunakan Model Linier Campuran Terbobot ...........
74
5.4.4. Evaluasi Terhadap Penduga............................................
74
5.4.5. Simulasi............................................................................
75
5.4.6. Aplikasi : Pendugaan Angka Melek Huruf di Kabupaten Sumenep dan Kabupaten Pasuruan Provinsi Jawa Timur............................................................................ 5.5
78
Model SAE Berbasis Penarikan Contoh Berpeluang Tidak Sama Untuk Peubah Respon Multinomial ..................................
80
5.5.1. Pengembangan model SAE: Model Campuran Logit Multinomial Terbobot........................................................
80
5.5.2. Aplikasi: Pendugaan rata-rata lama sekolah di tingkat kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan.......................................................................... 5.6.
5.7
82
Perhitungan Indeks Pendidikan di Kabupaten Sumenep dan Pasuruan .....................................................................................
84
Pembahasan................................................................................
86
5.7.1. Model
SAE
untuk
respon
Binomial
dengan
memperhitungkan peluang penarikan contoh.................. 5.7.2. Model
SAE
untuk
respon
Multinomial
86
dengan
memperhitungkan peluang penarikan contoh..................
87
IV. Pembahasan......................................................................................
88
6.1.
Pendahuluan……………………………………………………….
88
6.2. Perbandingan metode pendugaan langsung dan tak langsung untuk pendugaan area kecil melalui pendekatan Bayes............
iii
88
6.3. Pengaruh peluang penarikan contoh dalam Model SAE untuk respon Binomial dalam peningkatan kualitas penduga...............
90
6.4. Pengembangan model SAE berbasis pada peubah respon Multinomial dengan penarikan contoh berpeluang tidak sama... VII Kesimpulan dan Saran …………………………………………………
90
93
7.1.
Kesimpulan………………………………………………………….
93
7.2.
Saran…………………………………………………………………
94
Daftar Pustaka ………………………………………………………………….
95
Daftar Istilah …………………………………………………………………….
99
Lampiran ………………………………………………………………………..
100
iv
DAFTAR TABEL Halaman Tabel 2.1
Peubah dan sumber data dari masing-masing komponen IPM ...
24
Tabel 2.2.
Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM .....
25
Tabel 2.3.
Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan .
26
Tabel 3.2.
Rata-rata pendugaan angka melek huruf dan KTG kecamatan di Kabupeten Sumenep dan Kabupaten Pasuruan menggunakan pendekatan Bayes ......................................................................
Tabel 4.1.
Klasifikasi tingkat pendidikan tertinggi penduduk usia 10 tahun ke atas ...........................................................................................
Tabel 4.2.
46
56
Rata-rata dugaan proporsi penduduk pada jenjang pendidikan tertentu dan rata-rata nilai KTG dugaan tiap kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan .......................... 58
Tabel 5.1.
Nilai rata-rata bias relatif dan rata-rata kuadrat bias relatif untuk model terbobot dan model eksponensial .....................................
Tabel 5.2.
78
Hasil Simulasi Dugaan p i (proporsi penduduk usia 10 tahun ke atas yang bisa baca tulis) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep....................................
Tabel 6.1
78
Perbandingan kualitas penduga untuk model SAE untuk respon Binomial dengan dan tanpa memperhatikan peluang penarikan contoh...........................................................................................
v
91
DAFTAR GAMBAR
Halaman Gambar 1.1
Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Binomial….......................................................
Gambar 1.2
Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Multinomial......................................................
Gambar 3.1
6
7
Proporsi Penduduk 10 tahun ke atas yang bisa baca tulis berdasarkan data Susenas tahun 2010 di Kabupaten Sumenep dan Pasuruan...........................................................
Gambar 3.2
Hasil Pendugaan angka melek huruf dengan menggunakan metode klasik dan Metode Bayes ..........................................
Gambar 3.3
Kabupaten
Pasuruan ...............................................................................
Gambar 3.6
Gambar 4.1
43
Hubungan kemampuan baca tulis dengan usia berdasarkan jenis kelamin di Kabupaten Sumenep dan
Gambar 3.5
42
Plot dari nilai dugaan KTG menggunakan sebaran prior Beta dan Logit-Normal melalui metode pendugaan langsung..........
Gambar 3.4
39
44
Plot hasil dugaan angka melek huruf dan KTG di Kabupaten Sumenep .................................................................... ……….
45
Plot hasil dugaan paramater p i (angka melek huruf) dan KTG di Kabupaten Pasuruan.............................................................................
45
Proporsi penduduk berusia 10 tahun ke atas berdasarkan lama sekolah berdasarkan data Susenas 2010 di Kabupaten Sumenep dan Kabupaten Pasuruan........................................
Gambar 4.2
57
Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas di tiap jenjang pendidikan di Kabupaten Sumenep dan Kabupaten Sumenep ..............................................................
Gambar 4.3
59
Plot Hasil Proporsi Penduduk Berusia 10 tahun keatas di tiap jenjang pendidikan dan Nilai Dugaan KTG di Kabupaten Pasuruan ................................................................................
Gambar 4.4
59
Plot Hasil Dugaan Angka Melek Huruf dan Nilai KTG Dugaan di Kabupaten Sumenep ..........................................................
vi
60
Gambar 5.1
Plot hasil simulasi pendugaan p i (angka melek huruf) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep
Gambar 5.2
Plot hasil simulasi bias pendugaan p i untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep .....................
Gambar 5.3
79
Nilai dugaan, parameter populasi, dan bias dugaan angka melek huruf di Kabupaten Pasuruan.......................................
Gambar 5.5
77
Nilai dugaan, parameter populasi, dan bias dugaan angka melek huruf di Kabupaten Sumenep.........................................
Gambar 5.4
77
79
Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan tertentu dan Dugaan KTG Menggunakan Model SAE logit multinomial terbobot di Kabupaten Sumenep...........................
Gambar 5.6
Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan tertentu dan Dugaan KTG menggunakan model SAE
logit
multinomial terbobot di Kabupaten Pasuruan........................... Gambar 5.7
83
84
Nilai dugaan rata-rata lama sekolah menggunakan model SAE logit multinomial terbobot di Kabupaten Sumenep dan Pasuruan.................................................................................... 84
Gambar 5.8
Prediksi Indeks Pendidikan di Kabupaten Sumenep dan Kabupaten Pasuruan Menggunakan Model SAE……………….
85
Peta Tematik Indeks Pendidikan di Kabupaten Sumenep…….
85
Gambar 5.10 Peta Tematik Indeks Pendidikan di Kabupaten Pasuruan…….
86
Gambar 5.9
vii
DAFTAR LAMPIRAN
Halaman Lampiran 1
Program SAS untuk pendugaan model SAE ......................
Lampiran 2
Program Matlab untuk perhitungan pendugaan area kecil
100
melalui pendugaan langsung melalui sebaran prior logit normal ................................................................................ Lampiran 3
Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan langsung melalui sebaran prior beta ....
Lampiran 4
101
103
Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan tak langsung (berbasis model) melalui sebaran prior logit normal tanpa bobot ...............................
Lampiran 5
105
Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan tak langsung melalui sebaran prior logit normal dengan memperhitungkan bobot peluang .......
Lampiran 6
107
Jumlah penduduk usia 10 tahun keatas berdasarkan data sensus dan susenas serta jumlah blok sensus di tiap kecamatan di Kabupaten Sumenep ....................................
Lampiran 7
109
Jumlah penduduk usia 10 tahun keatas berdasarkan data sensus dan susenas serta jumlah blok sensus di tiap kecamatan di Kabupaten Pasuruan ....................................
Lampiran 8
110
Hasil Pendugaan Paramater pi (proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis) dan KTG untuk masing-masing kecamatan di Kabupaten Sumenep ...........
Lampiran 9
111
Hasil Pendugaan Paramater pi (proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis) dan KTG untuk masing-masing kecamatan di Kabupaten Pasuruan ...........
Lampiran 10
Hasil pendugaan
proporsi penduduk pada tiap tingkat
pendidikan tertinggi di Kabupaten Sumenep ...................... Lampiran 11
Hasil pendugaan
112
KTG untuk pendugaan
113
proporsi
penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Sumenep .......................................................... Lampiran 12
Hasil pendugaan
114
proporsi penduduk pada tiap tingkat
pendidikan tertinggi di Kabupaten Pasuruan ......................
viii
115
Lampiran 13
Hasil pendugaan
KTG untuk pendugaan
proporsi
penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Pasuruan .......................................................... Lampiran 14
116
Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit normal terbobot dan model campuran logit normal terbobot di Kabupaten Sumenep ............................................................................
Lampiran 15
117
Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit normal terbobot di Kabupaten Pasuruan ..........................................................
Lampiran 16
118
Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit multinomial terbobot di Kecamatan Pragaan, Kabupaten Sumenep ....................
Lampiran 17
Pendugaan
119
KTG untuk penduga proporsi penduduk di
tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Sumenep ..................... Lampiran 18
Hasil pendugaan pendidikan
proporsi penduduk di tiap jenjang
berdasarkan
model
campuran
logit
multinomial terbobot di Kabupaten Pasuruan .................... Lampiran 19
120
121
Penduga KTG untuk penduga proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Pasuruan ...................
Lampiran 20
Prediksi Indeks Pendidikan di Kabupaten Sumenep menggunakan model SAE …………………………………...
Lampiran 21
124
Hubungan antara Proprosi Penduduk untuk tiap jenjang pendidikan
Berdasarkan
Usia dan jenis kelamin di
kabupaten Sumenep .......................................................... Lampiran 23
123
Prediksi Indeks Pendidikan di Kabupaten Pasuruan menggunakan model SAE ……………………………………
Lampiran 22
122
125
Hubungan antara Proprosi Penduduk untuk tiap jenjang pendidikan dengan Usia dan jenis kelamin di kabupaten Pasuruan ...........................................................................
ix
126
BAB I Pendahuluan
1.1. Latar Belakang Berbagai survei umumnya dirancang untuk menduga parameter populasi untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi, kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah yang lebih kecil, umumnya jumlah contoh
kurang mencukupi jika digunakan
untuk pendugaan berdasarkan rancangan. Dewasa ini telah dikembangkan sebuah metode pendugaan parameter di suatu area dimana jumlah contohnya berukuran kecil dan bahkan tidak ada yaitu Metode Pendugaan Area Kecil atau Small Area Estimation (SAE). Pendugaan dalam SAE didasarkan pada model dan merupakan pendugaan tidak langsung. Oleh karena itu dibutuhkan informasi tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah penyerta (auxiliary variable). Model SAE pertama kali diperkenalkan oleh Fay & Heriot (1979), yaitu model yang memperhitungkan dua jenis keragaman yang mencakup 1) keragaman peubah respon yang tidak dapat diterangkan seluruhnya oleh hubungan peubah respon dengan
informasi tambahan yang disebut model
pengaruh tetap dan 2) keragaman spesifik area kecil yang tidak dapat diterangkan oleh informasi tambahan, merupakan pengaruh acak area kecil. Oleh karena itu model SAE mengandung dua komponen galat yaitu galat karena model dan galat karena pendugaan parameter secara langsung. Rataan atau tolal area kecil dapat dinyatakan sebagai kombinasi linier dari pengaruh tetap dan pengaruh acak. Secara aliran klasik, pendugaan parameter untuk model dasar SAE biasanya menggunakan metode Prediksi Tak-bias Linier Terbaik (Best Linear Unbiased Predictor) yaitu dengan meminimumkan Kuadrat Tengah Galat (KTG) dari penduga. Pendugaan dengan Prediksi Tak-bias Linier Terbaik (PTLT) ini tidak tergantung pada kenormalan dari pengaruh acak tetapi tergantung pada ragam atau koragam
dari pengaruh acak.
1
Sedangkan komponen ragam-
koragam sering diduga dengan menggunakan metode Kemungkinan Maksimum (Maximum Likelihood:ML) atau Kemungkinan Maksimum Berkendala (Restricted Maximum Likelihood: REML) dengan mengasumsikan kenormalan. Dengan cara tersebut pendugaan melalui proses dua tahap yang dikenal sebagai Prediksi Tak-bias Linier Terbaik Empirik
(PTLTE). Rao (2003) mengatakan bahwa
metode BLUP atau EBLUP hanya cocok untuk peubah kontinu, tetapi kurang sesuai jika digunakan untuk pemodelan peubah respon bertipe diskrit. Metode
PTLT atau PTLTE dapat diaplikasikan untuk model linier
campuran yang banyak digunakan untuk pendugaan area kecil. Dalam pendugaan parameter dari model linier campuran tersebut tidak dibutuhkan kenormalan dari pengaruh acak dan galat , tetapi kenormalan dibutuhkan untuk mendapatkan penduga KTG yang akurat (Rao, 2003). Model linier campuran itu sendiri dirancang untuk peubah bertipe kontinu dan kurang sesuai untuk peubah bertipe diskrit (biner atau cacahan). Untuk data biner atau cacahan, khususnya model regresi
logistik dan model log linier akan lebih
tepat menggunakan
metode pendugaan melalui pendekatan Bayes, baik melalui metode Bayes Empirik (Empirical Bayes) maupun metode Bayes Berhirarki (Hierarchical Bayes). Di Indonesia, beberapa peneliti yang mengembangkan model SAE diantaranya adalah
Kurnia et al. (2007), yang membahas pengaruh mis-
spesifikasi desain survey pada pendugaan area kecil. Selain itu Kurnia et al. (2007) membahas tentang pendekatan non parameterik dalam SAE. Selanjutnya Kurnia (2009) meneliti tentang prediksi terbaik empirik untuk model transformasi logaritma di dalam pendugaan area kecil
dengan penerapan pada data
Susenas. Peneliti yang lain adalah Sadik (2009) mengembangkan metode prediksi tak-bias linear terbaik dan bayes berhirarki untuk pendugaan area kecil berdasarkan model state space. Beberapa peneliti
yang telah mengembangkan model pendugaan area
kecil untuk data biner diantaranya adalah Malec et al. (1997), Boostra et al. (2011), Jiang dan Lahiri (2001), Rao (2003), Clarke et al. (2006) dan Chandra et al. (2009). Para peneliti tersebut umumnya menggunakan sebaran prior Beta atau logit normal, sedangkan untuk pendugaan parameter digunakan metode Kemungkinan Quasi Berpenalti (Penalized Quasi-Likelihood) dan pendugaan ragam dengan menggunakan pendekatan ML atau REML. Metode SAE untuk
2
data
biner
yang
dikembangkan
oleh
para
peneliti
tersebut
tidak
memperhitungkan peluang percontohan dari data yang digunakan. Model SAE berbasis sebaran multinomial telah dikembangkan oleh Molina et al. (2007) dengan metode yang didasarkan pada aplikasi dari Model Campuran Logit Multinomial (Multinomial Logit Mixed Model). Model SAE untuk peubah multinomial
oleh Molina mengasumsikan pengaruh acak yang sama
untuk semua katagori. Scealy (2010) mengembangkan model Molina et al. (2007) dengan memasukkan pengaruh acak katagori. Untuk pendugaan parameter model Scealy (2010) mengaplikasikan metode Kemungkinan Quasi Berpenalti (KQB), pendekatan ML dan/atau REML. Metode tersebut kemudian diaplikasikan untuk pendugaan parameter angkatan kerja di area kecil. Pendugaan KTG untuk penduga parameter didekati melalui dua metode yaitu bootstrap parametrik dan pendekatan analitik serta kemudian membandingkan keduanya. Sceally (2010) menghasilkan bahwa metode boostrap parametrik memberikan hasil lebih baik dibandingkan dengan pendekatan analitik, namun perbedaannya sangat kecil. Pada umumnya di dalam model SAE dianggap semua area terwakili dalam contoh atau dianggap bahwa contoh area dipilih dengan peluang yang sama (Pfeffermann 2010). Hanya ada beberapa studi yang memperhatikan struktur peluang percontohan dengan menggunakan peluang tidak sama, misalnya Kott (1990), Arora dan Lahiri (1997) serta Prasad dan Rao (1999). Pfeffermann (2010) berbendapat bahwa pendugaan yang dilakukan tanpa memperhatikan peluang penarikan contoh akan menghasilkan penduga yang berbias. Demikian juga Lehtonen (2009) menyatakan bahwa dengan menyertakan bobot peluang penarikan contoh ke dalam model, misalkan proporsional terhadap ukuran populasi atau proportional to size (pps), dapat dihasilkan peningkatan akurasi dan pengurangan bias. Lehtonen (2009) mengembangkan pendugaan langsung di area kecil yang mengaplikasikan Model Generalized Regression (GREG) dimana pendugaan parameter menggunakan metode PTLTE yang menyertakan bobot unit contoh. Model SAE yang memperhitungkan struktur peluang penarikan contoh yang telah dikembangkan oleh para peneliti tersebut adalah untuk model SAE dengan
peubah
respon
normal.
Pendugaan
parameter
menggunakan
pendekatan klasik yaitu mengaplikasikan PTLT atau PTLTE. Pengembangan model SAE berbasis penarikan contoh berpeluang tidak sama khusus untuk data
3
biner dibahas oleh Chen et al. (2010) yang menggunakan pendekatan Bayes Empirik dan Berhirarki. Di Indonesia, kebutuhan untuk pendugaan area kecil misalkan kecamatan atau desa makin meningkat, khususnya untuk menyusun kebijakan atau perencanaan pembangunan oleh pemerintah daerah. Salah satu indikator yang dijadikan dasar dalam perencanaan pembangunan adalah Indeks Pembangunan Manusia (IPM) yang mengukur pencapaian hasil pembangunan di sebuah wilayah (BPS 2005). IPM diukur dalam 3 dimensi dasar yaitu: 1)Hidup yang sehat dan panjang umur yang diukur dengan harapan hidup saat kelahiran; 2) Pengetahuan yang diukur dengan angka tingkat baca tulis pada orang dewasa dan rata-rata lama sekolah serta 3) standar hidup layak yang diukur dengan daya beli (UNDP 1998). IPM dapat digunakan untuk mengklasifikasikan apakah sebuah wilayah adalah maju, berkembang atau terbelakang, Selain itu IPM juga digunakan untuk mengukur pengaruh dari kebijakan ekonomi terhadap kualitas hidup. Di Indonesia perhitungan IPM dilakukan oleh Badan Pusat Statistik (BPS) yang secara resmi mempublikasikan IPM secara periodik setiap tahun untuk tingkat provinsi dan kabupaten/kota. Dewasa ini perhitungan IPM untuk tingkat kecamatan mulai dibutuhkan untuk
digunakan sebagai dasar
Kabupaten. IPM untuk
perencanaan pembangunan di tingkat
tingkat kecamatan, yang
membandingkan hasil
pembangunan antar kecamatan, baru dilakukan oleh sebagian pemerintah kabupaten/kota. Perhitungan IPM di tingkat kecamatan umumnya dilakukan dengan cara klasik, yaitu menggunakan pendugaan langsung dengan cara menambah jumlah contoh agar mencukupi. Sebagai contoh perhitungan IPM untuk Kabupaten Probolinggo (Rumiati et al. 2007), Sumenep (Rumiati et al. 2008), Tuban (Rumiati et al. 2009) dilakukan dengan memanfaatkan data Survei Sosial Ekonomi Nasional (Susenas) dan menambah jumlah data melalui survai. Penggunaan data Susenas untuk pendugaan parameter di tingkat kecamatan atau desa akan menghadapi dua persoalan statistik yaitu: 1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan contohnya memiliki peluang tidak sama karena rancangan penarikan contoh dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil blok sensus pada tahap pertama dan pada tahap ke dua mengambil rumah
4
tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam Susenas memiliki peluang tidak sama. Dalam penelitian ini dibahas pengembangan metode SAE yang dapat digunakan untuk menduga parameter pendidikan yang merupakan komponen Indeks Pendidikan dalam IPM. Perhitungan Indeks Pendidikan melalui pendugaan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf dihitung berdasarkan proporsi penduduk yang mampu baca dan tulis dari penduduk yang berusia 10 tahun ke atas. Sedangkan rata-rata lama sekolah dihitung berdasarkan proporsi penduduk yang telah berada pada jenjang pendidikan tertentu yang dikalikan dengan lama menempuh pendidikan di jenjang tersebut dibagi dengan jumlah penduduk. Jumlah penduduk yang bisa baca tulis diasumsikan memiliki sebaran Binomial dan jumlah penduduk pada tiap jenjang pendidikan diasumsikan memiliki sebaran Multinomial. Selanjutnya karena perhitungan IPM menggunakan data Susenas, maka persoalan statistik terkait dengan keterbatasan jumlah data dan ketidaksamaan peluang dalam penarikan contoh. Oleh karena itu
yang menjadi pertanyaan
penelitian ini
adalah bagaimana model pendugaan area kecil untuk peubah respon binomial dan multinomial pada kasus penarikan contoh berpeluang tidak sama. Rao (2003) mengatakan bahwa untuk data biner atau cacahan, khususnya model regresi
logistik dan model log linier akan lebih
tepat menggunakan
metode pendugaan melalui pendekatan Bayes. Oleh karena itu dalam penelitian ini pendugaan area kecil dilakukan melalui pendekatan Bayes didasarkan pada model SAE untuk peubah respon Binomial dan Multinomial berbasis peluang penarikan contoh tidak sama. Selanjutnya model SAE yang dihasilkan diaplikasikan untuk pendugaan Indeks Pendidikan kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan, Provinsi Jawa Timur. 1.2. Tujuan Penelitian 1.
Mengembangkan model SAE berbasis sebaran Binomial dan Multinomial melalui pendekatan Bayes dengan penarikan contoh berpeluang
tidak
sama. 2.
Mengaplikasikan metode pendugaan
area kecil
yang diperoleh dari
tujuan pertama untuk menduga angka melek huruf dan rata-rata lama sekolah ditingkat kecamatan dalam rangka menghitung Indeks Pendidikan di Studi kasus Kabupaten Sumenep dan Pasuruan.
5
1.3. Ruang Lingkup Ruang lingkup penelitian ini meliputi pengembangan metode pendugaan area kecil untuk peubah respon Binomial dan Multinomial melalui pendekatan Bayes. Pengembangan model SAE akan memperhatikan peluang penarikan contoh mengingat penerapan dari metode SAE tersebut diaplikasikan untuk menduga Indeks Pendidikan di tingkat kecamatan dengan data Susenas dimana contohnya diambil berdasarkan peluang tidak sama. Secara khusus model SAE yang akan dikaji merupakan model berbasis unit dengan pendugaan parameter menggunakan metode Bayes Empirik berdasarkan sebaran prior logit normal dari parameter (p i ) yang diduga. Metode pendugaan parameter menggunakan integrasi numerik karena penyelesaian persamaan secara analitik untuk model Bayes khususnya berbasis data biner sulit ditemukan. Metode SAE yang dikembangkan untuk peubah respon Binomial dan Multinomial berbasis peluang contoh tidak sama diaplikasikan untuk menduga Indeks Pendidikan di tingkat kecamatan di Jawa Timur. Studi kasus yang diambil adalah kabupaten Sumenep (yang mewakili daerah pertanian dan perkebunan) dan Kabupaten Pasuruan (mewakili daerah industri) di Jawa Timur. Secara garis besar kerangka penelitian dapat dilihat pada Gambar 1 dan Gambar 2. 1.4. Kebaruan Beberapa peneliti telah melakukan pengembangan model SAE untuk peubah respon Binomial dan Multinomial yang berbasis data biner, baik melalui pendekatan klasik maupun melalui pendekatan Bayes. Model SAE yang dikembangkan umumnya tidak memperhatikan peluang penarikan contoh dan menganggap contoh yang digunakan berdasarkan pada penarikan contoh secara acak dengan peluang yang sama. Pendugaan parameter dalam penelitian ini memperhitungkan cara penarikan contoh khususnya untuk penarikan contoh berpeluang tidak sama. Dengan menggunakan data Susenas, pendugaan IPM oleh BPS di Indonesia hanya sampai tingkat kabupaten/ kota karena ketidak cukupan data untuk area yang lebih kecil (kecamatan atau desa). Pendugaan IPM di level kecamatan umumnya dilakukan dengan menambah jumlah contoh dimana pendugaan parameter dilakukan secara langsung dan tanpa memperhitungan peluang tiap unit contoh. 6
1
Pengembangan Model
Tanpa memperhatikan peluang penarikan contoh
Pendugaan Parameter Area : Pendekatan Bayes
Model logit normal
Dengan memperhatikan peluang penarikan contoh Model logit normal terbobot
2
Model SAE dengan menyertakan fungsi peluang penarikan contoh
Pendugaan Parameter model SAE : PQL/REML Pendugaan Parameter model : Metode KM
Lokasi: Kecamatan Lenteng , Kabupaten Sumenep
Simulasi
Model logit normal
Data Sensus Penduduk 2010 Penarikan contoh area (blok sensus) : 5 area
diulang 100 x
Penarikan contoh RT 16 RT Perhitungan bobot area kecil (bloksensus ) 2
Aplikasi Data Susenas 2010
Perhitungan bobot individu
Model SAE dengan Fungsi Peluang Eksponensial 100 set contoh tanpa bobot 100 set contoh dengan bobot
Lokasi: Kabupaten Sumenep dan Pasuruan Perhitungan bobot area kecil (bloksensus )
Model logit normal tanpa bobot
Perhitungan Bias, KTG
Perhitungan bobot individu
Perhitungan Bias, KTG Model logit normal terbobot
Model logit normal terbobot
Data Sensus Penduduk 2010
Perhitungan angka melek huruf di tiap kecamatan Perhitungan bias
Perhitungan KTG
Gambar 1.1. Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Binomial Keterangan 1. Tahap pengembangan model SAE dengan respon binomial dengan memperhatikan struktur peluang 2. Simulasi dengan mengambil kecamatan Lenteng, yaitu dengan penarikan contoh gerombol dua tahap yang diulang sebanyak 100 kali 3. Aplikasi, menerapkan model terbaik yang diperoleh dari hasil aplikasi untuk menduga angka melek huruf di level kecamatan di Kabupaten Sumenep dan Pasuruan
7
1
Pengembangan Model
Tanpa memperhatikan peluang penarikan contoh Model logit multinomial
Pendugaan Parameter model SAE : KQB/KMB
Model logit multinomial terbobot
Pendugaan Parameter model SAE : KQB/KMB
Dengan memperhatikan peluang penarikan contoh
2
Aplikasi
Pendugaan Parameter Area : Pendekatan Bayes
Pendugaan Parameter Area : Pendekatan Bayes
Lokasi: Kabupaten Sumenep dan Pasuruan
Data Susenas 2010
Model logit multinomial tanpa bobot
Model logit multinomial terbobot
Perhitungan bobot individu
Perhitungan bobot area kecil (bloksensus )
Perhitungan rata-rata lama sekolah di tiap kecamatan Perhitungan KTG
Gambar 1.2. Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Multinomial Keterangan 1. Tahap pengembangan model SAE dengan respon multinomial dengan memperhatikan struktur peluang 2. Aplikasi, menerapkan model logit multinomial untuk pendugaan rata-rata lama sekolah di level kecamatan di Kabupaten Sumenep dan Pasuruan
Dalam disertasi ini dibahas tentang pendugaan Indeks Pendidikan sebagai salah satu komponen IPM di area kecil (kecamatan) didasarkan pada sebaran Binomial untuk pendugaan angka melek huruf dan sebaran Multinomial untuk pendugaan rata-rata lama sekolah. Kebaruan dari penelitan ini adalah: 1. Disertasi ini mengembangkan Metode SAE berbasis respon Binomial dan Multinomial melalui pendekatan Bayes dengan memperhitungkan peluang penarikan contoh. 2. Disertasi
ini
mengembangkan
Metode
Bayes
SAE
yang
dapat
diaplikasikan untuk menduga Indeks Pendidikan di tingkat kecamatan dengan memperhitungan bobot dalam percontohan Susenas. Pendekatan 8
semacam ini, yaitu pendugaan Bayes dengan memperhitungkan bobot percontohan belum pernah dilakukan baik oleh BPS maupun oleh peneliti lain. Oleh karena itu disertasi ini menghasilkan metode baru untuk pendugaan Indeks Pendidikan dengan tingkat akurasi dan presisi yang lebih tinggi. 1.5. Sistematika Disertasi Disertasi ini terbagi menjadi 3 (tiga) bagian besar. Bagian pertama membahas tentang pendugaan area kecil secara umum dan hal-hal yang terkait dengan proses penarikan contoh serta perhitungan IPM. Bagian kedua membahas perkembangan model SAE khususnya untuk sebaran respon Binomial dan Multinomial dengan contoh penerapan dalam pendugaan angka melek huruf dan rata-rata lama sekolah di level kecamatan di di dua kabupaten di Jawa Timur. Bagian ketiga membahas pengembangan model SAE untuk sebaran Binomial dan Multinomial berbasis pada penarikan contoh berpeluang tidak sama dan penerapannya untuk pendugaan Indeks Pendidikan di level Kecamatan di Jawa Timur. Secara rinci disertasi ini terbagi kedalam 7 bab. Bab 1 adalah pendahuluan yang berisi uraian latar belakang, yujuan, ruang lingkup dan kebaruan dari disertasi. Pada bab II dibahas tinjauan pustaka berisi tentang model dasar SAE dan perkembangannya, meliputi pendugaan parameter menggunakan pendekatan klasik dan pendekatan Bayes. Di dalam tinjauan pustaka juga dibahas tentang metode penarikan contoh dalam Susenas serta penentuan bobot untuk kepentingan pendugaan parameter dengan metode langsung. Selanjutnya pada bab II ini juga dibahas tentang Indeks Pembangunan Manusia (IPM) dan Indeks Pendidikan serta cara perhitungannya. Pada bab III dibahas tentang pendugaan area kecil untuk respon Binomial, khususnya untuk pendugaan parameter berbasis model dengan pendekatan Bayes. Dalam bab ini juga disajikan pendugaan Bayes dengan metode langsung (tidak berbasis model) yaitu dengan menggunakan sebaran prior Beta dan logit normal.
Model SAE untuk respon Binomial kemudian diaplikasikan untuk
pendugaan angka melek huruf di tingkat kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan di provinsi Jawa Timur dengan menggunakan data Susenas 2010. Pada bab IV dibahas tentang pendugaan parameter untuk model SAE
9
berbasis peubah respon Multinomial. Dalam bab ini juga digunakan pendekatan Bayes dengan mengembangkan model SAE untuk peubah respon Multinomial yang dikembangkan oleh Sceally (2010) dimana pengaruh area dibedakan atas katagori. Model SAE yang dikembangkan diaplikasikan untuk menduga rata-rata lama sekolah untuk level kecamatan di kabupaten Sumenep berdasarkan Susenas 2010. Pada bab V dikaji pendugaan area kecil (SAE) berdasarkan penarikan contoh berpeluang tidak sama. Kajian ini dimaksudkan untuk mempelajari cara pemberian bobot terhadap unit percobaan maupun area yang terambil sebagai contoh. Dalam bab ini dipelajari berbagai ide pengembangan model SAE terkait dengan peluang penarikan contoh atau memperhitungkan peluang penarikan contoh dalam pengembangan dalam pengembangan model SAE. Perhitungan bobot penarikan contoh sesuai dengan proses penarikan contoh yang diaplikasikan dalam Susenas. Model SAE yang memperhitungkan peluang penarikan contoh diaplikasikan untuk menduga rata-rata lama sekolah untuk level kecamatan di kabupaten Sumenep berdasarkan Susenas 2010. Bab VI berisi pembahasan yang megintegrasikan semua hasil pengkajian pengembangan metode SAE melalui pendekatan Bayes baik untuk respon Binomial
maupun
Multinomial
tanpa
memperhitungkan
atau
dengan
memperhitungkan peluang penarikan contoh. Selain itu pada bab ini juga dibahas hasil penerapan pendugaan Indeks Pendidikan di kabupaten Sumenep dan Pasuruan Bab VII adalah bab kesimpulan yang berisi rangkuman semua hasil penelitian dan saran baik untuk penelitian ke depan maupun saran secara umum kepada pemerintah.
10
BAB II Tinjauan Pustaka
2.1. Pendahuluan Dalam bab ini dibahas berbagai metode terkait dengan metode pendugaan area kecil, dimulai dengan pembahasan model dasar pendugaan area kecil meliputi metode pendugaan parameter dan pendugaan Kuadrat Tengah Galat (KTG), baik menggunakan cara klasik maupun melalui pendekatan Bayes. Kajian pustaka selanjutnya adalah tentang pengembangan pendugaan SAE yang memperhitungkan proses pengambilan contoh khususnya untuk pengambilan contoh yang berpeluang tidak sama. Karena model SAE yang dibahas dalam penelitian ini diaplikasikan untuk menghitung Indeks Pendidikan yang merupakan salah satu komponen dari Indeks Pembangunan Manusia, sehingga pada bab ini juga akan dijelaskan cara dan dasar perhitungan IPM khususnya untuk Indeks Pendidikan. Data yang digunakan adalah data Susenas untuk Provinsi Jawa Timur tahun 2010 dan data Sensus Penduduk tahun 2010 khususnya di Kabupaten Sumenep dan Pasuruan. Oleh karena itu juga dibahas metode penarikan contoh Susenas dan cara pembobotan untuk pendugaan parameter berbasis data Susenas. 2.2.
Model Dasar Pendugaan Area Kecil Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk wilayah atau area yang besar, misalnya untuk wilayah nasional/ regional (provinsi/kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan. Karena itu untuk area kecil umumnya jumlah contoh menjadi kurang mencukupi terutama jika ingin digunakan pendugaan berdasarkan rancangan. Oleh karena itu beberapa peneliti statistik telah mengembangkan Pendugaan Area Kecil atau
Metode
Small Area Estimation (SAE) untuk pendugaan
parameter di suatu area dimana jumlah contohnya berukuran kecil. Metode SAE ini pertama kali diperkenalkan oleh Fay & Heriot (1979), merupakan pendugaan tidak langsung atau berdasarkan model (model based
11
estimation). Oleh karena itu untuk membangun model SAE dibutuhkan informasi tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah penyerta (auxiliary variable). Peubah penyerta ini dapat diukur dari survai yang lain atau dalam catatan administrasi dan diharapkan memiliki korelasi dengan peubah yang diamati. Dengan metode SAE diharapkan adanya perbaikan efisiensi dari pendugaan parameter dalam area kecil jika peubah penyerta tersedia. Model SAE memperkenalkan model campuran yang menyertakan pengaruh area spesifik yang memperhitungkan variasi antar area diluar yang dapat dijelaskan oleh peubah penyerta yang ada di dalam model. Ketersediaan data dari peubah penyerta akan sangat menentukan kesuksesan dalam pembuatan model SAE. Rao (2003) menyatakan bahwa penggunaan model SAE ini memberikan beberapa keuntungan yaitu: 1) Diagnostik model dapat digunakan untuk mendeteksi kecocokan dengan data, misalkan menggunakan analisis sisaan 2) Pengukuran presisi area-spesifik dapat diasosiasikan dengan setiap pendugaan setiap area kecil, 3) Model linier campuran seperti model regresi logistik dengan pengaruh acak area–spesifik tetap dapat dilakukan, demikian juga untuk struktur data yang cukup kompleks misalkan struktur data time series atau spasial; 4) pengembangan metode untuk model pengaruh acak dapat dimanfaatkan untuk mencapai akurasi dalam area kecil. 2.2.1. Pendugaan Area Kecil Berbasis Area Misalkan terdapat M area kecil di dalam populasi, maka untuk kepentingan pendugaan area kecil hanya diambil contoh sebanyak m area. Diasumsikan bahwa parameter yang diperhatikan dalam area kecil ke-i, misalkan θ i dapat dinyatakan sebagai sebuah fungsi yang menghubungkan parameter tersebut dengan peubah pembantu yang diukur dari area kecil yaitu z i = (z1i ,z 2i ,.....,z pi )T . Rao (2003) mengatakan bahwa model linier yang menjelaskan hubungan tersebut adalah:
θ = zT β + b υ i=1,2,........m, i i i i
(2.1)
12
dimana b i adalah konstanta positif yang diketahui dan β = (β1 , β 2 ,......., β P )
T
adalah vektor koefisien regresi berukuran p x 1. Selanjutnya υi adalah pengaruh acak area spesifik diasumsikan memiliki sebaran υi ~ (0,σ υ2 ) Jika penduga langsung θˆi diketahui, maka θˆi dapat dinyatakan sebagai :
θˆi = θi + ei , untuk i=1,2,........m,
(2.2)
dimana :
E p (ei θi ) = 0,
V p (ei θi ) = ψ i .
(2.3)
Rao (2003) menjelaskan bahwa model SAE untuk tingkat area, terdiri dari dua komponen model yaitu komponen model pendugaan langsung dan pendugaan tak langsung. Kombinasi model pendugaan langsung (2.2) dan tak langsung (2.1) dikenal sebagai
Model Campuran Linier Terampat/MCLT
(Generalized Linear Mixed Model:GLMM) sebagai berikut:
θˆi = ziT β + biυi + ei .
(2.4)
Model area kecil seperti yang dijelaskan pada persamaan (2.4) di atas dikenal sebagai model Fay-Heriot, dimana keragaman peubah respon di dalam area kecil diasumsikan dapat diterangkan oleh hubungan peubah respon dengan informasi tambahan yang disebut
sebagai model pengaruh tetap. Selain itu
terdapat komponen keragaman spesifik area kecil yang tidak dapat diterangkan oleh informasi tambahan dan disebut sebagai komponen pengaruh acak area kecil.
Gabungan dari dua asumsi tersebut membentuk model pengaruh
campuran. 2.2.2. Pendugaan Area Kecil Berbasis Unit Pendugaan area kecil berbasis unit mengasumsikan bahwa data dari peubah penyerta level unit x ij =(x ij1 ,......x ijp )T tersedia untuk setiap elemen ke j pada area ke-i. Peubah yang diperhatikan adalah y ij yang diasumsikan memiliki hubungan dengan x ij melalui model: yij = xijT β + υi + eij , j=1,......,n i , i=1,........m.
(2.5)
Pengaruh acak area υi diasumsikan merupakan peubah acak yang bersifat iid sedangkan eij = kij e~ij dengan k ij adalah konstata dan e~ij adalah peubah acak
13
yang bersifat iid dan bebas terhadap υi dimana E m (e~ij ) = 0 e2 dan V em (e~ij ) = σ e2 . Seringkali υi dan e ij diasumsikan memiliki sebaran peluang normal. Dengan mengasumsikan bahwa percontohan s i berukuran n i diambil dari populasi di area ke-i berukuran N i (i=1,2...m) dan penarikan contoh dalam setiap area diambil secara acak sederhana, sehingga model (2.5) dapat dinyatakan dalam bentuk matriks: 1i ei yi X i y i = * = * β + υi * + * 1i ei yi X i
(2.6)
yi* menyatakan unit-unit yang tidak terambil dalam percontohan. Jika Yi adalah rata-rata populasi di area ke-i, maka Yi dapat ditulis sebagai: Yi = f i yi + (1 − f i )Yi *
(2.7)
dimana f i = ni / N i dan yi adalah rata-rata dari seluruh contoh di area ke-i dan
Yi * menyatakan rata-rata elemen populasi dari bagian yang tidak terambil sebagai contoh. Oleh karena itu untuk model SAE berbasis unit, pendugaan parameter area kecil Yi sama dengan menduga Yi * jika data percontohan {y i } dan {Xi } tersedia.
2.3.
Pendugaan Parameter Model SAE
2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan Prediksi Takbias Linier Terbaik Empirik (PTLTE) Parameter di area kecil, misalkan rataan atau tolal, dapat dinyatakan sebagai kombinasi linier dari efek tetap dan efek acak seperti dinyatakan pada persamaan (2.1) untuk model berbasis area dan persamaan (2.5) untuk model berbasis unit. Melalui pendekatan klasik, pendugaan parameter model SAE umumnya mengaplikasikan metode PTLT dengan meminimumkan Kuadrat Tengah Galat (KTG). Metode PTLT ini tidak tergantung pada kenormalan dari efek acak tetapi tergantung pada ragam atau koragam dari efek acak. Untuk menduga komponen ragam dan koragam umumnya digunakan metode ML atau REML dengan mengasumsikan kenormalan. Dengan cara tersebut pendugaan dilakukan melalui proses dua tahap yang dikenal sebagai PTLTE.
14
Misalkan data percontohan memenuhi model linier campuran terampat berikut:
y = Xβ + Zv + e
(2.8)
dimana: y adalah vektor data observasi berukuran n x 1 X dan Z adalah matriks berukuran n x p dan n x h yang diketahui v dan e adalah berdistribusi saling bebas dengan rataan 0 dan ragam G dan R yang tergantung pada parameter δ = (δ 1 ,.....δ q )T , diasumsikan bahwa δ adalah himpunan bagian dari ruang Euclidean sedemikian hingga Var ( y ) = V = V (δ ) = R + ZGZT adalah non singular untuk semua δ yang terdapat dalam himpunan bagian tersebut, dimana Var (y) adalah matrik ragam-koragam dari y. Parameter yang akan diduga merupakan kombinasi linier: µ = 1T β + m T v (Rao 2003). Penduga dari µ adalah µˆ = a T β + b untuk a dan b diketahui dan merupakan penduga tak bias jika E ( µˆ ) = E ( µ ) . Selanjutnya Kuadrat Tengah Galat (KTG) didefinisikan sebagai KTG ( µˆ ) = E ( µ − µ ) 2 dan jika µ adalah
penduga tak bias dari µ, maka KTG ( µˆ ) = Var ( µ − µ ) . Pada Rao (2003), penduga PTLT µ
yang meminimumkan KTG
dinyatakan dalam formula: ~ ~ ~ H = t(δ(y) = 1T ~ μ β + mT~ v = 1T β + m T GZ T V −1 (y − Xβ ),
(2.9)
dimana: ~ ~ β = β (δ) = (X T V −1 X)−1 X T V −1 y
(2.10)
adalah penduga tak bias linier terbaik (Best Linear Estimator: BLUE) dari β dan ~ ~ v=~ v(δ) = GZ T V −1 (y − Xβ ) .
(2.11)
Penduga PTLT tergantung pada ragam δ yang biasanya tidak diketahui. Jika δ diduga dengan δˆ = δˆ ( y ) , maka akan diperoleh Prediksi Tak-bias Linier Terbaik Empirik
(PTLTE) yang tetap merupakan penduga tak bias bagi µ.
Penduga δ diperoleh melalui metode ML atau REML. Untuk model berbasis unit, dimana rataan area kecil ke-i dinyatakan oleh ~ ~ fungsi: µ i = X Ti β + υ i . Untuk model percontohan y ij = X ijT β + υ i + e ij , j=1,..n i ; i=1,....,m dapat ditulis dalam bentuk matriks sebagai berikut:
15
y i = X i β + υ i 1ni + ei .
Model
(2.12)
SAE yang dinyatakan oleh (2.12) merupakan bentuk khusus dari
persamaan (2.8), dimana Gi = σ υ2 , dan Ri + σ e2 diag1≤ j ≤ni (k ij2 ) sehingga:
Vi −1 =
γ 1 T diag j (aij ) − i ai ai . 2 ai σe
(2.13)
Dengan mengambil (σ υ2 / σ e2 ) /(1 − γ i ) = γ i / ai dimana ai = ∑ aij , ai = (ai1 ,...., aini )T j
maka penduga PTLT dari µ i adalah (Rao 2003): ~ ~
~
µ~iH = XTi β + γ i ( yia − xiaT β )
(2.14)
dimana yia dan xia adalah rataan terbobot:
yia = ∑ aij yij / ai.,
xia = ∑ aij xij / ai.,
j
j
~
β adalah penduga tak bias linier terbaik bagi β ~
β = (∑ X iT Vi −1 X i ) −1 (∑ X iT Vi −1 yi )
(2.15)
X iT Vi −1 X i = Ai = σ e−2 (∑ aij xij xijT − γ i ai. xia xiaT )
(2.16)
X iT Vi −1 yi = σ e−2 (∑ aij xij yij − γ i ai. xia yij ) .
(2.17)
i
i
j
j
Penduga tak bias linier terbaik (2.14) dapat dinyatakan sebagai rata-rata terbobot dari penduga regresi berikut:
[
~ yia + ( X i − xia )T β ~
]
dan penduga regresi sintetik ~
µ~iH = γ i yia + ( X i − xia )T β + (1 − γ i ) X iT β .
~ X iT β
(2.19)
Bobot γ i (0 ≤ γ i ≤ 1) mengukur ragam model ( σ υ2 ), relatif terhadap ragam total
σ υ2 + σ e2 / ai . Jika ragam model relatif kecil maka γ i akan kecil dan bobotnya akan lebih besar di komponen sintetik.
2.3.2. Pendugaan Parameter Model SAE Melalui Pendekatan Bayes Melalui pendekatan Bayes, pendugaan parameter di area kecil dapat dilakukan dengan 2 cara yaitu pendugaan Bayes Empirik/BE (Empirical Bayes: EB) dan Bayes Berhirarki /BH (Hierarchical Bayes:HB). Untuk pendekatan Bayes Empirik, pendugaan didasarkan pada sebaran posterior yang diduga dari data, sedangkan pada pendekatan Bayes berhirarki parameter model yang tidak diketahui
diperlakukan sebagai komponen acak yang memiliki sebaran prior
16
tertentu. Model pendugaan area kecil menggunakan Bayes telah dikembangkan oleh beberapa peneliti diantaranya Gosh dan Rao (1994), You dan Rao (2000). Pendekatan Bayes, baik Bayes Empirik maupun Bayes Berhirarki merupakan metode yang dapat diaplikasikan secara lebih umum sehingga banyak digunakan untuk data diskrit, misalkan untuk data biner dan data cacahan. Untuk peubah respons dengan sebaran normal, model dasar area dapat dinyatakan sebagai model Bayes berhirarki dua tahap yaitu: ind
1) θˆi / θ i ~ N (θ i ,ψ i ) , i: 1,2,3,……,m
(2.20)
ind
2) θ i ~ N ( ziT β , bi2σ υ2 ) , i: 1,2,3,……,m
(2.21)
Dimana β adalah vektor parameter regresi berukuran p x 1. Dalam pendekatan Bayes, parameter model β dan σ υ2 adalah peubah acak, dan model hirarki dua tahap disebut model hirarki bebas bersyarat (conditionally independent
(
)
hierarchical model : CIHM) karena pasangan θˆi ,θ i adalah bebas di antara area i, untuk β dan σ υ2 tertentu. Penduga optimum dari θ i merupakan nilai harapan bersyarat dari θ i jika diberikan θˆi , β dan σ υ2 :
E (θi θˆi , β ,σ υ2 ) = θˆiB = γ iθˆi + (1 − γ i ) ziT β
(2.22)
bi2σ υ2 dimana γ i = 2 2 . Nilai harapan dari θ i merupakan nilai harapan dari bi σ υ + ψ i
(
)
sebaran posterior (atau bersyarat) dari θ i jika diberikan θˆi , β dan σ υ2 :
θi θˆi , β ,σ υ2 ~ N (θˆiB , g1i (σ υ2 ) = γ iψ i ) .
(2.23)
Penduga θˆiB = θˆiB ( β ,σ υ2 ) adalah penduga Bayes dibawah squared error loss dan merupakan nilai optimum dari KTG, dimana KTG (θˆiB ) = E (θˆiB − θ i ) 2 , selalu lebih kecil dibandingkan dengan θ dan linier atau non linier dalam θˆi . Jiang et al. (2002) menyatakan bahwa θˆiB disebut
prediksi terbaik (Best
Prediction: BP) dari penduga θ i karena diperoleh dengan tanpa mengasumsikan parameter model.
17
Penduga Bayes θˆiB tergantung pada parameter model β dan σ υ2 yang diduga dengan menggunakan metode ML atau REML dari sebaran marjinal : ind
(
)
θˆi ~ N ziT β , bi2σ υ2 + ψ i . .
(2.24)
Penduga parameter dinotasikan dengan βˆ dan σˆ υ2 , sehingga dengan menggantikan βˆ untuk β dan σˆ υ2 untuk σ υ2 , maka Penduga Bayes Empirik (Empirical Bayes Prediction: EBP) untuk θ i adalah:
(
)
θˆiEB = θˆiB βˆ , σˆυ2 = γˆiθˆi + (1 − γˆi ) ziT βˆ .
(2.25)
Penduga BE, θˆiEB adalah identik dengan penduga PTLTE yang dinotasikan dengan θˆiH
(
juga merupakan rataan dari estimasi densitas posterior ,
)
(
)
f θ i θˆ, βˆ , σˆ υ2 dari θ i , yaitu N θˆiEB , γˆiψ i .
2.4. Peluang Penarikan Contoh Metode pengambilan contoh berbasis peluang telah banyak dibahas oleh beberapa peneliti. Metode pengambilan contoh berbasis peluang yang banyak dibahas dan sering diaplikasikan adalah metode pengambilan contoh acak sederhana (simple random sampling), metode pengambilan contoh berstrata (stratified sampling), metode pengambilan contoh bergerombol (cluster sampling) dan metode pengambilan contoh sistematik (systematic sampling). Masingmasing metode pengambilan contoh memiliki konsekuensi terhadap perhitungan pendugaan parameter. Dalam rangka mendapatkan penduga yang tak berbias maka bobot peluang tersebut harus diperhitungkan dalam pendugaan parameter. Misalkan akan diduga parameter total Y = ∑U y j atau rataan Y = Y / N , dengan menggunakan contoh s yang diambil dari populasi U dengan peluang p(s), maka dengan mengasumsikan semua elemen j ∈ s dapat diobservasi, maka Yˆ adalah penduga berbasis rancangan dari Y dan dikatakan tak bias jika: E p (Yˆ ) = ∑ p ( s )Yˆs = Y .
(2.26)
18
[
]
2 Ragam untuk Yˆ adalah V p (Yˆ ) = E p Yˆ − E p (Yˆ ) dan penduga untuk V p (Yˆ )
yang
dinotasikan
dengan
v p (Yˆ ) = s 2 (Yˆ )
dikatakan
tak
berbias
jika
E p = [ S 2 (Yˆ )] = V p (Yˆ ) .
Untuk pengambilan contoh yang dirancang dengan bobot w j , dimana w j merupakan jumlah elemen-elemen dalam populasi yang direpresentasikan oleh contoh j sehingga, jika π j adalah peluang terambilnya contoh ke j maka
w j = 1 / π j . Bobot w j tergantung pada s dan elemen j (j ∈ s), sehingga
π j = ∑{s , j∈s} p( s) , j=1,2,....,N dan {s: j ∈ s} menyatakan jumlah dari semua contoh s yang memuat elemen j. Oleh karena itu penduga Y dapat ditulis sebagai: Yˆ = ∑ s w y j j
(2.27)
dimana Σ s menyatakan jumlah j ∈ s. Besarnya bobot w j ditentukan oleh metode penarikan contoh yang diterapkan. Misalkan untuk pengambilan contoh acak sederhana
setiap unit
percobaan memiliki bobot yang sama untuk terambil sebagai contoh yaitu 1/N dimana N adalah jumlah unit percobaan dalam populasi yang diteliti. Sedangkan metode penarikan contoh berbasis peluang yang lain akan memiliki bobot yang berbeda tergantung kepada metode penarikan contoh yang digunakan. Pada Cochran (1977) dan Shao J (1999) telah dibahas cara perhitungan bobot untuk masing-masing metode penarikan contoh. Metode
pendugaan
parameter
secara
langsung
dengan
memperhitungankan bobot percontohan dikenal sebagai Horvitz-Thompson Estimator untuk berbagai cara penarikan contoh (Shao 1999). Jika w i adalah adalah bobot untuk contoh ke-i, maka untuk berbagai metode penarikan contoh perhitungan bobot w i sebagai berikut: 1. Penarikan Contoh Acak Sederhana (PCAS) wi = n / N .
2. Penarikan Contoh Berstrata (PCB) Jika i dalam stratum h, maka : wi = nh / N h .
3. Penarikan Contoh Gerombol (PCG)
19
yi ∈ P
Misalkan
adalah sebuah kelompok (cluster) dan yi = yi1 ,..... yiN
i
dimana M i adalah ukuran dari cluster ke-i, i=1,2.....N. Jumlah unit dalam P M
adalah N = ∑ N i . i =1
Penarikan Contoh Gerombol Satu Tahap Penarikan contoh dilakukan dengan cara memilih y i dengan mengobservasi semua y ij . Oleh karena itu jika digunakan cara PCAS dengan w i =k/N maka total contoh k
adalah n = ∑ N i dan i =1
Ni M M Yˆs = ∑ ∑ yij = ∑ Yi k i∈S1 j =1 k i∈S1
(2.28)
dimana ragam penduganya adalah: Var (Yˆs ) =
N2 k M Y 1 − ∑ Yi − k ( M − 1) M i =1 M
2
(2.29)
S 1 adalah penarikan contoh tahap pertama. Jika pemilihan contoh proposional terhadap ukuran populasi (propotional to size: pps) maka w i =kN i /N. Sehingga Horvitz-Thompson estimator: Y N N 1 Ni Yˆpps = ∑ ∑ yij = ∑ i. k i∈S1 N i j =1 k i∈S1 N i
(2.30)
Penarikan contoh bergerombol dua tahap Untuk pemilihan secara acak sederhana (PCAS) pada tahap pertama dan pada tahap kedua dipilih m i contoh dari setiap cluster y i, wi = kmi /( MN i ) maka penduga Horvitz-Thompson adalah N M Yˆs = ∑ i ∑ yij k i∈S1 ni j∈S2 i
dimana S 2i
(2.31)
menyatakan perontohan gerombol pada tahap ke dua. Untuk
pemilihan secara pps pada tahap pertama dan n i adalah contoh dari y i yang dipilih pada tahap ke dua, maka: (2.32)
N 1 Yˆpps = ∑ ∑ yij . k i∈S1 ni j∈S2 i
20
4. Penarikan contoh Sistematik P={y 1 ,.....y N } adalah populasi dengan ukuran N=nk. Untuk memilih contoh berukuran n maka pada pemilihan pertahap diambil contoh j secara acak dari {1,.....k} sehingga contoh yang terambil adalah: { y j , y j+k, , ..,y j+(n-1)k ), maka w i =k-1. Penduga Horvitz-Thompson adalah n
Yˆ sy= k ∑ y j +(t −1) k
(2.33)
t =1
dimana
E (Yˆsy ) = Y .
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh. Pfefferman et al (1998) memperhitungkan peluang penarikan contoh dalam pengembangan model SAE berdasarkan penarikan contoh dua tahap. Didefinisikan peubah indikator I i dan I ij dimana I i =1 jika area ke i terambil sebagai contoh dan I ij =1 jika unit ke j diambil sebagai contoh dari area ke i yang sudah terambil sebagai contoh atau i ∈ s . Dengan membagi U ke dalam M area M
dengan N i adalah banyaknya unit
di area ke-i, sehingga
∑N i =1
i
= N , maka
penarikan contoh dua tahap pada polulasi U tersebut adalah sebagai berikut: 1) Tahap pertama memilih m area dengan peluang 2) Tahap ke dua diambil n i unit dengan peluang
π i = P(i ∈ s ) .
π j / i = P ( j ∈ si | i ∈ s )
dari area yang telah terambil sebagai contoh pada tahap pertama, maka bobot penarikan contoh tahap satu adalah wi = 1 / π i dan untuk tahap ke dua adalah w j / i = 1 / π j / i .
Pada tahap pertama, fungsi kepadatan peluang (probablity density function: pdf) untuk pengaruh u i dibedakan atas area yang terambil dan tidak terambil sebagai contoh: Pada area yang terambil sebagai contoh ( i ∈ s ): def
bayes
f s (ui ) = f (ui | I i = 1) =
P( I i = 1 | ui ) f p (ui ) P( I i = 1)
(2.34)
Pada area yang tidak terambil sebagai contoh ( i ∉ s ) : def
bayes
f c (ui ) = f (ui | I i = 0) =
P( I i = 0 | ui ) f p (ui ) P( I i = 0)
21
(2.35)
Pada tahap ke dua, fungsi kepadatan peluang percontohan (sample pdf) dan fungsi kepadatan peluang komplemen percontohan (sample-complement pdf) dari y ij didefinisikan serupa dengan (2.34) dan (2.35), yaitu : Untuk unit yang terambil sebagai contoh adalah def
f s ( yij | xij , ui ) = f ( yij | xij , ui , I ij = 1) =
P( I ij = 1 | yij , x ij , ui ) f p ( yij | xij , ui ) P( I ij = 1 | yij , ui )
(2.36)
Untuk unit yang tidak terambil sebagai contoh def
f c ( y ij | xij , u i ) = f ( y ij | xij , u i , I ij = 0) =
P ( I ij = 1 | y ij , x ij , u i ) f p ( y ij | xij , u i ) P( I ij = 0 | y ij , u i )
(2.37)
Jika (υ1 ,υ 2 ) diukur pada elemen-elemen i ∈ U dan (π i , wi ) menyatakan peluang contoh (sample inclusion probabilities) dan bobot percontohan (sampling weight), dengan mendefinisikan Ep adalah nilai harapan dibawah populasi, Es adalah nilai harapan
dibawah percontohan dan Ec adalah nilai harapan
dibawah komplemen contoh, maka fungsi kepadatan peluang dari (υ1 ,υ 2 ) adalah: Untuk area yang terambil sebagai contoh:
f s (υ1i | υ 2i ) = f (υ1i | υ 2i , i ∈ s ) =
E p (π i | υ1i ,υ 2i ) f p (υ1i | υ 2i ) E p (π i | υ 2i )
(2.38)
sehingga: E p (υ1i | υ 2i ) =
Es ( wiυ1i | υ 2i ) Es ( wi | υ 2i )
(2.39)
1 Es ( wi | υ 2i )
(2.40)
dimana: E p (π i | υ 2i ) =
Untuk area yang tidak terambil sebagai contoh adalah: f c (υ1i | υ 2i ) = f (υ1i | υ 2i , i ∉ s ) =
E p [(1 − π i ) | υ1i ,υ 2i ] f p (υ1i | υ 2i ) E p [(1 − π i | υ 2i ]
E [( wi − 1) | υ1i ,υ 2i ] f s (υ1i | υ 2i ) = s E s [( wi − 1 | υ 2i ]
22
(2.41)
Oleh karena itu nilai harapan dari komplemen contoh adalah: Ec (υ1i | υ 2i ) =
E p [(1 − π i )υ1i | υ 2i ] E p [(1 − π i | υ 2i )
(2.42)
E [( w − 1) | υ1i ,υ 2i ] = s i Es [( wi − 1 | υ 2i ]
2.6. Indeks Pembangunan Manusia (IPM) Indeks Pembangunan Manusia (IPM) / Human Development Index (HDI) adalah pengukuran perbandingan dari tingkat pendidikan, kesehatan dan standar hidup layak untuk semua negara seluruh dunia. IPM digunakan untuk mengklasifikasikan apakah sebuah wilayah/negara adalah wilayah/negara maju, berkembang atau terbelakang dan juga untuk mengukur pengaruh dari kebijaksanaan ekonomi terhadap kualitas hidup. Indeks ini pada tahun 1990 dikembangkan oleh pemenang nobel India Amartya Sen dan Mahbub ul Haq seorang ekonom Pakistan dibantu oleh Gustav Ranis dari Yale University dan Lord Meghnad Desai dari London School of Economics dan sejak itu dipakai oleh Program pembangunan PBB dan dipublikasikan dalam laporan IPM tahunan . Komponen pembentuk IPM yaitu komponen kesehatan, pendidikan dan standar hidup layak , masing masing diukur dengan Indeks Kesehatan, Indeks Pendidikan dan Indeks Standar Hidup Layak. Indeks Kesehatan dihitung berdasarkan jumlah anak lahir hidup dari wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun (children surviving : CS). Indeks Pendidikan diukur berdasarkan angka melek huruf dan rata – rata lama sekolah penduduk usia 10 tahun ke atas, sedangkan Indeks Standar Hidup Layak diukur dengan rata-rata pengeluaran konsumsi riil per kapita pertahun Di Indonesia, pengukuran IPM dilakukan oleh Badan Pusat Statistik (BPS). Perhitungan dan publikasi
IPM dilakukan oleh BPS tiap tahun untuk tingkat
propinsi (yang membandingkan tingkat keberhasilan pembangunan antar propinsi),
dan
tingkat
kabupaten/kota
kabupaten/kota).
23
(membandingkan
IPM
antar
2.6.1. Cara Perhitungan IPM Data dasar yang digunakan dalam pendugaan IPM pada umumnya adalah data hasil survei Susenas yang diselenggarakan oleh BPS tiap tahun. BPS dan UNFPA (1998) menjelaskan tentang cara penghitungan IPM dimana komponen yang akan dihitung berdasarkan data survey adalah Indeks Kesehatan (yang diduga berdasarkan angka harapan hidup dan angka kematian bayi), Indeks Pendidikan (yang diduga dari rata-rata lama sekolah dan angka melek huruf) serta Daya Beli (rasio antara penghasilan dan harga di wilayah tertentu) seperti yang ditunjukkan oleh Tabel 2.1. Tabel 2.1. Peubah dan sumber data dari masing-masing komponen IPM
Komponen IPM
Peubah
Sumber data
Susenas (BPS) • Angka melek huruf • Rata-rata lama sekolah Kesehatan Susenas (BPS • Jumlah anak lahir hidup dari Profil Kesehatan wanita usia 15-49 tahun (Kemenkes) (Children Even Born: CEB) • Jumlah anak masih hidup dari wanita berusia 15-49 tahun (Children Surviving: CS) Standar hidup layak Susenas (BPS) • Pengeluaran konsumsi riil per kapita per tahun *) Berdasarkan UNDP patokan usia penduduk 15 tahun ke atas, namun BPS Pendidikan/pengetahuan*)
menggunakan patokan usia di atas 10 tahun
Keterangan: a. Indeks Pendidikan diukur dengan dua indikator yaitu Angka Melek Huruf /AMH (literacy rate) dan Rata-rata Lama Sekolah/RLS (Mean Years of Schooling: MYS). Angka melek huruf diolah dari peubah kemampuan membaca dan menulis, sedangkan rata-rata lama sekolah dihitung menggunakan tiga variabel secara simultan yaitu partisipasi sekolah, tingkat/kelas yang sedang/ pernah dijalani, dan jenjang pendidikan tertinggi yang ditamatkan b. Indeks Kesehatan dihitung berdasarkan
jumlah anak lahir hidup dari
wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun (children surviving: CS).Usia Hidup yang diukur dengan angka harapan hidup waktu lahir (e 0 ). Metode
24
ini menggunakan dua macam data dasar yaitu rata-rata anak yang dilahirkan hidup (live - births) dan rata-rata anak yang masih hidup (still living) per wanita usia 15 – 49 tahun menurut kelompok umur lima tahunan. c. Indeks Kesejahteraan (Standar Hidup Layak) diukur dengan rata-rata pengeluaran konsumsi riil per kapita pertahun. Standar Hidup Layak, seringkali dihitung dengan menggunakan rata-rata pengeluaran per kapita riil yang disesuaikan (adjusted real per capita expenditure). Perhitungan indeks masing-masing komponen IPM dihitung dengan formula sebagai berikut : Indeks (X i ) : = (X i – X min )/(X max – X min )
(2.43)
dimana : X i : Indikator komponen pembangunan manusia ke – i (i = 1,2,3). X min : Nilai minimum X i (lihat Tabel 2.2) X max : Nilai maksimum X i (lihat Tabel 2.2) Nilai minimal Indeks (Xi) adalah 0 dan maksimum 1, namun untuk mempermudah cara membaca skala dinyatakan dalam 100 (persamaan 2.43) dikalikan 100, sehingga 0 < Indeks (X i ) <100). Angka IPM adalah dihitung dengan rumus rata-rata sederhana dari masing-masing Indeks X i yaitu : IPM = 1 / 3[ X (1) + X (2) + X (3)]
(2.44)
dimana : X(1) : Indeks Kesehatan. X(2) : Indeks Pendidikan = 2/3 (Indeks Melek Huruf) + 1/3 ( Indeks rata-rata lama sekolah). X(3) :
Indeks standar hidup layak (sering diukur dengan konsumsi per kapita yang disesuaikan.
Tabel 2.2 Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM Indikator
Nilai Maksimum
Nilai minimum
Catatan
Angka Harapan Hidup
85
25
Standar UNDP
Angka Melek Huruf
100
0
Standar UNDP
Rata-rata lama sekolah
15
Konsumsi per kapita yang disesuaikan
0 (a)
737.720
300.000 (1996) 360.000 (b) (1999)
25
UNDP menggunakan GNP per capita riil yang disesuaikan
Keterangan a) Proyeksi konsumsi per kapita yang disesuaikan untuk Jakarta tahun 2018 setelah disesuaikan dengan rumus Atkinson. Proyeksi ini berdasarkan asumsi pertumbuhan konsumsi per kapita 6,5 % selama periode 19932018. b) Setara dengan dua kali garis kemiskinan Propinsi Sulawesi Selatan daerah pedesaan tahun 1990. Untuk tahun 1999 nilai minimum yang disesuaikan adalah 360.000 (penyesuaian adanya krisis ekonomi). 2.6.2. Indikator Pendidikan/ Pengetahuan Indikator pendidikan dihitung berdasarkan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf diduga berdasarkan proporsi jumlah penduduk umur 10 tahun keatas yang mampu membaca dan menulis baik untuk huruf latin maupun huruf lainnya. Sedangkan rata-rata lama sekolah dihitung berdasarkan data yang didapat dari pertanyaan tentang jenjang dan jenis pendidikan tertinggi yang pernah diduduki. Konversi tahun untuk tingkat pendidikan yang ditamatkan dapat dilihat pada Tabel 2.3. Rumus yang digunakan untuk menghitung Ratarata Lama Sekolah (RLS) adalah: RLS =
dimana : f i wi
∑ f i wi
(2.45)
∑ fi
= jumlah penduduk menurut jenjang pendidikan = penimbang setiap jenjang pendidikan.
Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan No 1 2 3 4 5 6 7 8 9 10
Tingkat pendidikan Tidak pernah sekolah SD SLTP SLTA D1 D2 D3/akademi D4/Sarjana S2 /Master S3/Doktor
Konversi 0 6 9 12 13 14 15 16 18 21
26
Sumber : UNDP dan BPS (2001) Catatan : Bila seseorang drops out kelas dua SLTA, maka konversi tahun lama pendidikannya adalah = 9 + 2 – 1 = 10 tahun
2.7. Survei Sosial Ekonomi Nasional (Susenas) Susenas adalah survai yang diselenggarakan BPS tiap tahun, ditujukan untuk memonitor perubahan tingkat kesejahteraan masyarakat Indonesia. Jumlah contoh dalam Susenas 2010 mencakup sekitar 304.369 rumahtangga di 497 kabupaten/kota seluruh Indonesia, sehingga estimasi bisa dilakukan sampai dengan tingkat kabupaten/kota (BPS 2010). Di Jawa Timur, Susenas dilaksanakan dengan mengambil jumlah contoh sekitar 29.000 responden untuk 38 Kabupaten/kota atau 639 kecamatan. 2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh Kerangka percontohan untuk Susenas tahun 2010 berdasarkan listing rumahtangga hasil listing Sensus Penduduk (SP) tahun 2010. Penarikan contoh dalam survai Susenas menggunakan rancangan percontohan dua tahap untuk daerah perkotaan dan tiga tahap untuk daerah pedesaan (BPS 2010). Kerangka percontohan pemilihan tahap pertama adalah master sampel blok sensus (BS) biasa kondisi 5 Mei 2010. Master BS tersebut disertai dengan informasi banyaknya rumah tangga hasil listing SP2010, muatan blok sensus dominan (pemukiman biasa, pemukiman mewah, pemukiman kumuh), informasi daerah sulit/tidak sulit, dan klasifikasi desa/kelurahan (rural/urban). Kerangka percontohan pemilihan tahap kedua adalah daftar rumah tangga biasa hasil listing SP2010 dalam blok sensus. Metode penarikan contoh yang digunakan yaitu penarikan contoh dua tahap berstrata. Tahapan dari metode ini diuraikan sebagai berikut: •
Tahap pertama, memilih
blok sensus dari
secara pps (Probability
Proportional to Size) dengan size banyaknya rumah tangga hasil listing SP2010 (M i ). •
Tahap kedua, dari setiap blok sensus terpilih dipilih sejumlah rumah tangga biasa (n=16) secara sistematik berdasarkan hasil listing SP2010. Jumlah contoh blok sensus untuk penduga kabupaten/kota merupakan
jumlah contoh minimum untuk pendugaan di tingkat kabupaten/kota. Contoh blok sensus dibedakan atas daerah perkotaan dan perdesaan yang diidentifikasi berdasarkan daerah sulit atau tidak sulit. Alokasi jumlah contoh menurut daerah perkotaan
dan
perdesaan
di
setiap
27
kabupaten/kota
dilakukan
secara
proporsional terhadap proporsi akar jumlah rumah tangga dalam RBL1 dengan akar biaya per unit.
Nh mh =
ch Nh ∑ h =1
ch
H
×n
(2.46)
dengan: mh
: Jumlah contoh blok sensus dalam strata h
Nh
: Jumlah rumah tangga biasa dalam strata h
ch
: Biaya per unit dalam strata h
m
: Jumlah target contoh.
Kerangka contoh yang digunakan untuk pemilihan rumah tangga adalah daftar rumah tangga biasa hasil listing SP2010. Pemilihan contoh rumah tangga secara sistematik sampling dengan ukuran sampel rumah tangga yang harus dipilih di setiap blok sensus adalah 16 rumah tangga. Nomor urut rumah tangga yang terpilih sebagai contoh sudah ditetapkan dari BPS-RI.
2.7.2.Penentuan Bobot Bobot penarikan contoh diperhitungkan dalam rangka mendapatkan pendugaan tak bias untuk parameter di tiap Kabupaten/Kota. Misalkan pada suatu kabupaten/kota target contoh blok sensus pada strata ke-h adalah n h yang dipilih secara pps dengan size banyaknya rumah tangga hasil listing SP 2010 ( M hi ), maka peluang contoh blok sensus ke-i terpilih sebagai contoh menurut BPS (2010) adalah Phi =
N hi Mh
=
∑ N hi
N hi , N oh
(2.47)
i
sehingga fraksi penarikan contoh tahap pertamanya adalah N m × N hi f hi = m h × M hi = h h N oh ∑ N hi
.
(2.48)
i
Bila pada setiap blok sensus ditarik sejumlah rumah tangga (fixed size: m) dengan equal probability, peluang bersyarat terpilihnya rumah tangga ke-j blok
28
sensus ke-i dalam strata h, dan diketahui dari blok sensus ke-i Phj|i =
adalah:
1 n , maka fraksi penarikan contoh tahap kedua adalah: f hj|i = . Oleh N hi N hi
karena itu overall sampling fraction adalah: f hij = f hi × f hj|i =
mh × N hi m ×n n × = h = f konstan. N oh N hi N oh
(2.49)
Overall sampling fraction f konstan untuk setiap blok sensus terpilih, maka rancangan penarikan sampel tersebut dinamakan self-weighting design. Dengan demikian design weight dapat dirumuskan sebagai berikut: Whij =
N oh mh × n
dimana:
Whij
: bobot rumah tangga ke-j, blok sensus ke-i dalam strata h
N oh
: banyaknya populasi rumah tangga biasa hasil listing SP2010 dalam strata h
mh
: banyaknya contoh blok sensus dalam strata h
n
: banyaknya contoh rumah tangga di blok sensus ke-i.
29
BAB III Model Bayes untuk Pendugaan Area Kecil Berbasis Peubah Respon Binomial
3.1. Pendahuluan Peubah respon y ij merupakan peubah respon biner yang diukur pada area ke-i dimana y ij bernilai 1 atau 0. Sebagai contoh y ij adalah peubah yang mengukur kemampuan baca tulis, maka y ij =1 jika individu tertentu di area ke–i bisa baca dan tulis dan y ij =0
jika tidak bisa baca
tulis. Jika peubah y ij
diasumsikan memiliki sebaran Bernoulli dengan parameter p i, maka fungsi massa peluang dari y ij adalah: f ( y ij | pi ) = pi ji (1 − pi ) y
(3.1)
ind
atau ditulis yij | pi
~ Bernoulli( p ) , untuk i
j=1,2,.....n i ; i=1,2,.....,m. Selanjutnya
didefinisikan yi = ∑ j yij , adalah jumlah kejadian yang menjadi perhatian di area ke-i , maka y i memiliki sebaran Binomial dengan fungsi peluang:
ni f ( y i | pi ) = piyi (1 − pi ) ni − yi yi
(3.2)
ind
atau ditulis: yi | pi ~ Binomial (ni , pi ) . Dalam contoh kasus penelitian ini, y i adalah jumlah individu di area ke-i yang bisa membaca dan menulis. Parameter area kecil yang ingin diduga adalah proporsi area kecil, pi = Yi = ∑ j yij / N i , dimana
yi = ∑ j yij merupakan statistik minimum cukup
dari p i . Jika penarikan contoh dilakukan dengan metode acak sederhana, maka penduga proporsi di area ke-i yaitu pˆ i , diturunkan melalui metode pendugaan peluang maksimum (ML), yaitu
pˆ i = ∑ yij / ni = yi / ni . Penduga ML ini j
merupakan pendugaan langsung melalui pendekatan klasik. Melalui pendekatan Bayes, pendugaan parameter pi dapat dilakukan secara langsung yaitu dengan tidak memanfaatkan informasi tambahan dari
30
peubah penyerta dan pendugaan tidak langsung yaitu
menggunakan model
dengan memanfaatkan informasi dari peubah penyerta. Pendugaan langsung melalui pendekatan Bayes adalah menganggap parameter p i merupakan peubah yang memiliki distribusi tertentu. Dalam pendugaan Bayes terdapat dua jenis informasi yaitu informasi prior diperoleh dari sebaran prior dan informasi dari hasil survai. Untuk peubah binomial, sebaran prior yang digunakan adalah sebaran beta atau logit normal. Untuk pendugaan berbasis model, digunakan transformasi fungsi logit terhadap p ij atau logit (p ij ).
Beberapa peneliti yang telah mengembangkan
model pendugaan area kecil untuk data biner melalui pendekatan Bayes adalah Malec et al. (1997)
mengembangkan Model SAE untuk data biner yang
diaplikasikan pada data survei di bidang kesehatan berbasis kombinasi area dan unit. Pendugaan parameter yang dilakukan oleh Malec et al. (1997) adalah metode Bayes berhirarki yang dibandingkan dengan metode standar dan metode Bayes Empirik. Clarke et al. (2006) mengembangkan metode SAE berdasarkan data biner untuk menduga angka pengangguran di area kecil.
Pendugaan angka
pengangguran didasarkan pada data pengangguran dari Labour Force Survey (LFS) dan data administratif. Peubah penyerta yang digunakan adalah usia yang dibagi ke dalam 3 kelompok (16-24 tahun, 25-49 tahun dan lebih dari 50 tahun), dan jenis kelamin. Pendugaan parameter model diperoleh dengan menggunakan pendugaan Kemungkinan Quasi Berpenalti (KQB) atau Penalized Quasi Likelihood (PQL) untuk pendugaan β dan µ dan menggunakan Kemungkinan Maksimum Berkendala (KMB) atau Restricted Maximum Likelihood (REML) untuk menduga σ. Untuk membuktikan konsistensi penduga parameter β dilakukan dengan cara meregresikan nilai β berdasarkan dua data yaitu dari pemerintah lokal dan dari parlemen, membandingkan CV (Coefficient of Variation) keduanya, dan membandingkan standard error masing-masing dengan standard error dari pendugaan langsung. Diperoleh hasil bahwa metode yang digunakan memiliki konsistensi terhadap penduga dan memberikan nilai SE lebih baik dibandingkan dengan pendugaan langsung Chandra et al. (2009) mengembangkan pendugaan area kecil untuk proporsi dalam survai bisnis. Metode pendugaan parameter
yang mereka
kembangkan adalah Empirical Best Predictor (EBP) dibawah model linier campuran terampat dan Model-Based Direct Estimator (MBDE). Selanjutnya
31
Boostra et al. (2011) mengembangkan
pendugaan area kecil untuk status
tenaga kerja di Australia. Model yang digunakan adalah model berbasis unit, yang merupakan model linier campuran dengan pengaruh area (dalam hal ini area adalah kota). Metode pendugaan parameter model menggunakan Kemungkinan Maksimum (KM). Untuk memilih kovariat dalam model dilakukan diagnostik secara grafis. Diperoleh bahwa model SAE menghasilkan KTG lebih kecil dari metode pendugaan yang lain.
3.2. Metode Pendugaan Langsung Melalui Pendekatan Bayes. Melalui pendekatan Bayes Rao (2003) menyatakan bahwa, metode pendugaan langsung untuk parameter
pi dapat dilakukan melalui dua alternatif
cara yaitu: 1) dengan mengasumsikan bahwa parameter p i merupakan peubah yang memiliki sebaran
beta dengan parameter α dan β dan 2)
dengan
menggunakan fungsi logit log it ( pi ) = log[ pi /(1 − pi )] atau probit Φ ( pi ) yang −1
diasumsikan memiliki sebaran normal. Untuk alternatif 1, sebaran beta untuk parameter parameter pi merupakan sebaran prior, sedangkan untuk alternatif 2, sebaran priornya adalah menggunakan sebaran normal. 3.2.1. Pendugaan Bayes Menggunakan Sebaran Prior Beta Untuk alternatif 1, dimana pendugaan Bayes diturunkan dengan menggunakan sebaran prior Beta, maka parameter p i dianggap sebagai sebuah peubah
acak
yang
memiliki
sebaran
peluang
Beta
atau
ditulis
iid
pi ~ Beta(α , β );α > 0, β > 0 . Beta (α,β) menyatakan sebaran Beta dengan
parameter α dan β dengan bentuk fungsi peluang:
f ( pi | α , β ) =
Γ(α + β ) α −1 pi (1 − pi ) β −1 ;α > 0, β > 0. Γ(α )Γ( β )
(3.3)
Pendugaan Bayes untuk parameter p i diperoleh dengan mencari nilai ekspektasi dari sebaran posterior untuk p i yaitu dengan mencari sebaran marjinal dari sebaran bersama dari (y i , p i ), yaitu: ni Γ(α + β ) α −1 f ( yi , pi ) = piyi (1 − pi ) ni − yi x pi (1 − pi ) β −1 . Γ(α )Γ( β ) yi
32
(3.4)
Dari persamaan (3.4) maka diperoleh sebaran posterior p i yang merupakan sebaran bersayarat dari p i jika y i diketahui yaitu: f ( pi / yi ,α , β ) =
f ( yi , pi / α , β ) . f ( yi )
(3.5)
Sebaran posterior p i merupakan sebebaran Beta dengan parameter ( yi + α ) dan ( ni − yi + β ), atau ditulis: ind
pi | yi ,α , β ~ beta( yi + α , ni − yi + β ).
(3.6)
Penduga Bayes dari p i dan varians posteriornya diberikan oleh:
pˆ iB (α , β ) = E ( pi | yi , α , β ) =
yi + α ni + α + β
(3.7)
dan
V ( pi | yi ,α , β ) =
( yi + α )(ni − yi + β ) . (ni + α + β + 1)(ni + α + β ) 2
(3.8)
Penduga Bayes Empirik untuk p i diperoleh dengan menggantikan α dan β dengan penduganya yaitu αˆ dan βˆ yang dapat diperoleh dengan dua cara yaitu dengan menggunakan metode momen atau dengan memaksimumkan fungsi kemungkinan dari sebaran posterior atau disebut sebagai metode KM (Kemungkinan Maksimum), akan diperoleh nilai αˆ KM dan βˆ KM . Dengan menggunakan metode penduga momen, maka dugaan untuk α dan β diperoleh dengan menyelesaikan persamaan berikut:
pˆ =
αˆ nT s 2p − pˆ (1 − pˆ )(m − 1) 1 dan = 2 αˆ + βˆ αˆ + βˆ + 1 pˆ (1 − pˆ )[nT − ∑i ni / nT − (m − 1)]
2 dimana s p =
∑ (n / n i
i
T
(3.9)
)( pˆ i − pˆ ) 2 , nT = ∑ i ni .
Sedangkan menggunakan metode peluang maksimum, αˆ ML dan
βˆML
diperoleh dengan memaksimumkan fungsi likelihood l(α,β) dari sebaran betaind
binomial yi | α , β ~ Beta − Binomial : ni n Γ (α + y )Γ ( β + n − y ) Γ(α + β ) i i i i l (α , β ) = ∏ x i =1 yi Γ(α + β + ni ) Γ(α )Γ( β )
dimana fungsi sebarannya berbentuk:
33
(3.10)
ni Γ(α + yi )Γ( β + ni − yi ) Γ(α + β ) . f ( yi | α , β ) = x Γ(α + β + ni ) Γ(α )Γ( β ) yi
(3.11)
Rao (2003) menyatakan bahwa Fungsi (3.11) di atas dapat disederhanakan menjadi: ni − y i −1 ni −1 m y i −1 l (α , β ) = c + ∑ ∑ log(α + h) + ∑ log(β + h) − ∑ log(α + β + h) i =1 h = 0 h =0 h =0
yi −1
ni − y i −1
h =0
h =0
dimana ∑ log(α + h) akan sama dengan nol; jika y i =0 dan dengan
nol
jika
y i =n i .
E ( y ij ) = µ = α /(α + β )
(3.12)
∑ log(β + h) sama
dan
τ = 1 /(α + β ) ,
ρ = Corr ( y ij , y ik ) = 1 /(α + β + 1) untuk j ≠ k . Dengan menggunakan µ dan
τ
maka bentuk fungsi likelihoodnya menjadi: ni − y i −1 ni −1 m y i −1 l ( µ ,τ ) = const + ∑ ∑ log( µ + hτ ) + ∑ log(1 − µ + hτ ) − ∑ log(1 + hτ ) . i =1 h = 0 h =0 h =0
Selanjutnya penduga ML dapat diperoleh dengan metode Newton-Raphson atau metode iteratif yang lain karena bentuk tertutup (closed –form) untuk αˆ ML dan βˆML tidak ada. Dengan menggantikan α dan β dengan αˆ dan βˆ ke dalam persamaan (3.7) dan (3.8) diperoleh penduga Bayes Empirik dari p i yaitu:
pˆ iEB = pˆ iB (αˆ , βˆ ) = γˆi pˆ i + (1 − γˆi ) pˆ
(
(3.13)
)
dimana γˆ i = n i / n i + αˆ + βˆ . EB Penduga Bayes Empirik dari parameter p i ( pˆ i ) adalah rata-rata terbobot
ˆ. dari penduga langsung p kepada
Jika n i membesar maka bobot yang diberikan
pˆ i akan lebih besar. Persamaan penduga tersebut di atas serupa
dengan penduga Fay-Heriot untuk model berbasis area. Penduga EB
pˆ iEB
mendekati tidak bias untuk p i jika m besar karena E( pˆ i -p i ) akan mendekati nol.
34
Pendugaan
KTG
dapat
dicari
melalui
metode
Jackknife,
yang
menghasilkan penduga KTG ( pˆ iEB ) yang mendekati tak bias. Penduga Jackknife dari KTG ( pˆ iEB ) yaitu ktg ( pˆ iEB ) diperoleh dengan cara menghitung :
[
m −1 m Mˆ 1i = g 1i (αˆ , βˆ , y i ) − ∑ g 1i (αˆ −l , βˆ −l , y i − g 1i (αˆ , βˆ , y i ) m l =1
(
m −1 EB EB Mˆ 2i = ∑ p i , −l − pˆ i m l =1 m
]
)
(3.14)
2
(3.15)
dimana
pˆ iEB = k i ( y i , µˆ , σˆ )
ˆ −l , σˆ −l ) pˆ iEB , −l = k i ( y i , µ g 1i ( µˆ , σˆ , y i ) = V ( p i | y i , α , β ) =
( y i + αˆ )(n i − y i + βˆ ) (αˆ + n i + βˆ + 1)(αˆ + n i + βˆ ) 2
dan g 1i ( µˆ −l , σˆ −l , y i ) diperoleh dengan menggantikan µ dan σˆ dengan
µˆ −l dan σˆ −l (diperoleh dengan menghilangkan area ke-l) Penduga ML diperoleh dari {( y i , ni ), i ≠ 1,....., m}
ktg ( pˆ iEB ) = Mˆ 1i + Mˆ 2i
(3.16)
3.2.2. Pendekatan Bayes Menggunakan Sebaran Prior Logit-Normal. Transformasi fungsi logit p i yaitu log it ( pi ) = log[ pi /(1 − pi )] diasumsikan memiliki sebaran normal N ( µ , σ 2 ) , ditulis: log it ( pi ) = log[ pi /(1 − pi )] ~ N ( µ ,σ 2 ). iid
(3.17)
Dengan mendefinisikan zi = [log it ( pi ) − µ ] / σ , maka z i akan memiliki sebaran normal standar N (0,1) atau ditulis
zi = [log it ( pi ) − µ ] / σ ~ N (0,1) maka p i dapat dinyatakan sebagai fungsi µ dan σ sebagai berikut:
pi = u ( µ + σzi ) =
e µ +σzi . 1 + e µ +σzi
(3.18)
Penduga Bayes untuk p i adalah pˆ i ( µ ,σ ) = E ( pi | yi , µ ,σ ) yang diperoleh B
dari nilai ekspektasi p i dari sebaran posterior p i jika y i , µ dan σ diketahui.
35
lmplementasi dari penduga Bayes Empirik lebih kompleks untuk model logit normal karena tidak ada bentuk analitik untuk penduga Bayes dan varians posterior dari p i . Untuk model logit-normal, Rao (2003) mengatakan bahwa penduga Bayes dari p i dapat dinyatakan sebagai rasio dari integral berdimensi satu atas zi ~ N (0,1) sebagai berikut:
pˆ iB ( µ ,σ ) = E ( pi / yi , µ ,σ ) =
E [h1 ( µ + σz ) exp{h2 ( yi , µ + σz )}] E [exp{h2 ( yi , µ + σz )}]
(3.19)
dimana h2 ( yi , ( µ + σz )) = ( µ + σz ) yi − ni log(1 + e µ +σz ).
Ragam posteriornya adalah V ( p i | y i , µ , σ ) , yang dapat dianggap merupakan fungsi dari ( µ , σ , y i ) atau ditulis sebagai V ( p i | y i , µ , σ ) = g 1i ( µ , σ , y i )
[
:
]
2
V ( pi | yi , µ , σ ) = E ( pi2 | yi , µ ,σ ) − pˆ iB ( µ ,σ .
(3.20)
Pendugaan terhadap µ dan σ diperoleh dengan memaksimumkan fungsi Log likelihood, l(µ,σ), untuk model logit-normal yaitu:
l ( µ ,σ ) = const + ∑ log[E [exp{h2 ( yi , µ + σz )}]]. m
(3.21)
i =1
Selanjutnya dengan menggunakan pendugaan ML diperoleh penduga EB EB
dari p i , pˆ i
= pˆ iB ( µˆ , σˆ ) dengan menggantikan µˆ dan σˆ .
Pendugaan KTG Perhitungan
mse J ( pˆ iEB )
menggunakan
penduga
ML
cukup
rumit,
sebaliknya menggunakan metode momen seperti yang dilakukan oleh Jiang (1998) lebih mudah dilakukan, yaitu dengan menyamakan:
∑i y i = nT pˆ = nT E[h1 ( µ + σz )]
[
]
2 2 ∑ ( yi − yi ) = ∑ ni ( ni − 1) E h1 ( µ + σz ) .
i
i
Perhitungan E ( pi ) = E[h1 ( µ + σz )] dan E ( pi2 ) = E[h12 ( µ + σz )] dilakukan dengan menggunakan integrasi Monte Carlo. Penduga Jackknife dari MSE ( pˆ iEB ) yaitu mse( pˆ iEB ) diperoleh dengan menggantikan
pˆ iEB = k i ( y i , µˆ , σˆ ) dan
ˆ ˆ pˆ iEB , − l = k i ( y i , µ − l , σ − l ) dalam persamaan
(3.14) dan (3.15).
36
3.3. Metode Pendugaan Tak Langsung Melalui Pendekatan Bayes. Sesuai dengan prosedur yang dilakukan oleh Malec et al. (1997), diasumsikan bahwa tiap individu dalam populasi dapat dimasukkan ke dalam kelompok yang saling terpisah (mutually exclucive and exhoustive) berdasarkan pada status sosial-ekonomi atau status demografi tertentu. Misalkan Y ij merupakan peubah acak biner untuk individu ke-j dalam area i dimana i=1,2.....I; j=1,......,N i maka Y ij merupakan peubah acak bebas Bernoulli dengan (Y ij =1| p ij )=p ij . Model yang menghubungkan parameter dengan kovariatnya adalah model regresi logistik dengan efek acak area sebagai berikut:
log it ( pij ) = xijT β + υi
iid
υi ~ N (0,σ υ2 ).
,
(3.22)
Model di atas disebut sebagai model linier logistik campuran yang merupakan anggota dari model linier campuran terampat. Peubah tak bebasnya adalah logit (p ij ) dan peubah bebas adalah X. Selanjutnya x ij adalah vektor kovariat tetap dan diasumsikan tidak tergantung pada i. Untuk kasus pendugaan proporsi penduduk yang bisa baca tulis, maka dugaan proporsi penduduk yang bisa baca tulis p i adalah jumlahan dari jumlah penduduk dalam percontohan yang bisa baca tulis dibagi dengan jumlah percontohan di area ke-i dan penduga p i dari individu yang tidak bisa baca tulis yang tidak terambil sebagi contoh. Secara matematis ditulis sebagai berikut: p i = f i y i + (1 − f i ) y i*
(3.23)
dimana:
{( y , x ), j ∈ s ; i = 1,...., m} ij
ij
i
s i adalah percontohan berukuran n i dari area ke-i dan si′ adalah unitunit yang tidak diambil contohnya. f i = n i /N i ,
yi adalah rata-rata contoh (proporsi) y i* = ∑ y il /( N i − ni ) adalah rata-rata dari unit-unit yang tidak diambil l∈s 'i
contohnya dalam area i. *
Penduga Bayes dari yi diberikan oleh:
(
pˆ iB( c ) = E p i ( c ) | y i , β , σ υ
) =∑
l∈si′
37
p il /( N i − ni )
dimana: y i adalah dari contoh dalam area ke i.
p il = E ( y il | p il , y i , β , σ υ ) untuk l ∈ si′ . *
Penduga Bayes dari yi
(
)
adalah pˆ iB( c ) = E p i ( c ) | y i , β , σ υ , sehingga penduga
Bayes dari p i dapat dinyatakan sebagai:
pˆ iB = pˆ iB ( β ,σ υ ) = f i yi + (1 − f i ) pˆ iB( c ) .
(3.24)
Sehingga:
pˆ iB( c )
E (∑ p il exphi ∑ xijT y ij , y i , σz , β l j∈si = E ∑ p il | y i , β , σ υ = l E exp hi ∑ xijT y ij , y i , σz , β j∈si
(3.25)
dimana
[
(
)]
hi ∑ xijT yij ,σz , β = ∑ xijT yij β + (σz ) yi − ∑ log 1 + exp xijT β + σz .. j∈si j∈si j∈si
(3.26)
Rao (2003) mengatakan bahwa pendugaan parameter model β dan
συ
dapat dilakukan melalui berbagai cara, diantaranya algoritma EM, MCMC seperti yang disarankan oleh Mc Coullagh dan Searle (2001) dan KQB. Selain itu untuk mendapatkan dugaan β dan
συ
juga dapat digunakan metode momen.
Dengan menggunakan KM ataupun metode momen maka akan diperoleh
βˆ dan σˆυ sehingga dapat diperoleh BE untuk p i (proporsi di area ke i) yaitu piEB = pˆ iB ( βˆ , σˆυ ) . Jika f i (sampling fraction) dapat diabaikan, maka pˆ iB dapat
diekspresikan sebagai:
1 Ni Pˆi B ≈ E ∑ pil / yi , β ,σ υ . N i l =1
(3.27)
Ragam posterior P i tereduksi menjadi:
V ( Pi / yi , β ,σ υ ) = (1 − fi ) 2 E ( yi* − pˆ iB( c ) ) 2 = ( N i− 2 E ∑ pil (1 − pil ) / yi , β ,σ υ + V ∑ pil | yi , β ,σ υ , l∈si′ l∈si′
38
(3.28)
E (∑ pil2 exphi ∑ xijT yij , yi ,σz , β l j∈si . E ∑ pil2 | yi , β ,σ υ = l T E exphi ∑ xij yij , yi ,σz , β j∈si
(3.29)
Tidak ada bentuk analitik (closed form) untuk mendapatkan nilai ekspektasi di atas sehingga perhitungan nilai ekspektasi dilakukan dengan metode numerik. Pendugaaan KTG ( pˆ iEB ) dilakukan dengan metode Jackknife dengan
menggantikan
pˆ iEB = k i ( y i , µˆ , σˆ ) dan
yaitu
ˆ ˆ pˆ iEB , − l = k i ( y i , µ − l , σ − l ) dalam
persamaan (3.24) sampai dengan persamaan (3.29) sehingga diperoleh nilai
Mˆ 1i dan Mˆ 2i , sekaligus diperoleh nilai KTG yaitu Mˆ 1i + Mˆ 2i . 3.4. Aplikasi : Pendugaan Angka Melek Huruf di Tingkat Kecamatan, Kabupaten Sumenep Berbasis Data Susenas Model SAE yang telah dibahas pada sub bab (3.2) dan (3.3) di atas diaplikasikan pada pendugaan angka melek huruf di tingkat kecamatan disalah satu Kabupaten di Jawa Timur yaitu Kabupaten Sumenep dan Kabupaten Pasuruan Provinsi Jawa Timur. Data dasar yang digunakan adalah data Survei Ekonomi Nasional (Susenas) yang dilakukan oleh BPS tahun 2010. Untuk Kabupaten Sumenep, dari populasi sebesar 339.403 tangga diambil contoh sebanyak 2307 rumah tangga dan rata-rata jumlah contoh di tiap kecamatan 86 rumah tangga. Berdasarkan data Susenas Kabupaten Sumenep rata-rata proporsi yang bisa baca dan tulis di tiap kecamatan sekitar 77.6%. Gambar 3.1 menunjukkan bahwa terdapat dua kecamatan yang memiliki proporsi terendah yaitu kecamatan Batuputih (39.5%) dan kecamatan Talango (58%), Angka melek huruf di Kabupaten Pasuruan
relatif lebih baik dibandingkan dengan Kabupaten
Sumenep, rata-rata proporsi yang bisa baca dan tulis di tiap kecamatan sekitar 90,07%. Di Kabupaten pasuruan terdapat tiga kecamatan yang memiliki proporsi terendah yaitu kecamatan Puspo (75,5%), Lekok (75,5) dan kecamatan Nguling (71%).
39
Kecamatan
(a) Kabupaten Sumenep
40
Pohjentrek
Nguling
Lekok
Puspo
Rembang
Pasrepan
Winongan
Kraton
Grati
Purwodadi
Lumbang
GondangWetan
Prigen
Tutur
Sukorejo
Tosari
Beji
Pandaan
0 Wonorejo
0,2
Bangil
0,4
Rejoso
0,6
p r o p o r s i Kejayan
0,8
Gempol
p r o p o r s i 1
Purwosari
Arjasa Sapeken Bluto Ra'As Kangayan Manding Gayam Giligenteng Kalianget Kota Sumenep Pragaan Nonggunong Dasuk Saronggi Masalembu Batuan Ganding Lenteng Rubaru Ambunten Guluk Guluk Pasongsongan Dungkek Batang Batang Gapura Talango Batuputih
1,2 1,2
0,8
1
0,6
0,4
0,2 0
Kecamatan
(b) Kabupaten Pasuruan
Gambar 3.1. Proporsi Penduduk 10 tahun ke atas yang bisa baca tulis berdasarkan data Susenas tahun 2010 di Kabupaten Sumenep dan Pasuruan
3.4.1. Pendugaan Langsung Penduga langsung untuk proporsi penduduk berusia 10 tahun ke atas dan nilai KTG nya adalah sebagai berikut: 1) Menggunakan metode klasik dengan rumus pˆ i = ∑ yij / ni = yi / ni . j
2) Menggunakan
pendekatan
Bayes
dengan
sebaran
prior
beta.
Pendugaan α dan β menggunakan metode momen, yaitu dengan menghitung αˆ dan βˆ menggunakan persamaan (3.9), dimana: s 2 = ∑i (n / n )( pˆ − pˆ ) 2 , nT = ∑i ni p i T i
ˆ adalah proporsi penduduk yang bisa baca tulis dihitung dari contoh p
n i : ukuran contoh di kecamatan ke-i n T : jumlah contoh Susenas di Kabupaten Sumenep. Sedangkan penduga p i dihitung dengan menggunakan rumus (3.13)
(
)
dimana γˆi = ni / ni + αˆ + βˆ .. Untuk pendugaan KTG ( pˆ iEB ) dilakukan dengan menggunakan metode Jackknife, diperoleh dengan menggantikan pˆ iEB = k i ( y i , µˆ , σˆ )
ˆ ˆ ˆ , σˆ , y i ) dan dan pˆ iEB , − l = k i ( y i , µ − l , σ − l ) dalam persamaan (3.14) Dan g 1i ( µ g 1i ( µˆ −l , σˆ −l , y i ) dalam persamaan (3.15) dimana: g 1i ( µˆ , σˆ , y i ) = V ( p i | y i , α , β ) =
( y i + αˆ )(n i − y i + βˆ ) (αˆ + n i + βˆ + 1)(αˆ + n i + βˆ ) 2
µˆ −l dan σˆ −l adalah dugaan dari µ dan σ yang dihitung dari data tanpa kecamatan ke l. Penduga
ktg j ( pˆ iEB ) = Mˆ 1i + Mˆ 2i
KTG ( pˆ iEB ) adalah
diperoleh
dari
persamaan (3.16). 3) Menggunakan
fungsi
logit(p i ),
maka
penduga
parameter
pi
menggunakan rumus pada persamaan (3.19). Selanjutnya integral pembilang dan penyebut pada persamaan (3.19) dihitung dengan langkah sebagai berikut: 1. Menghiitung penduga µˆ dan σˆ dari distribusi normal
log it ( pi ) = log[ pi /(1 − pi )] ~ N ( µ ,σ 2 ) iid
40
µˆ = rata-rata dari logit (p ij )
σˆ = standard deviasi dari logit (p ij ) 2. Membangkitkan z dari distribusi N(0,1) dengan mengambil n=500, kemudian untuk tiap nilai z dari langkah ke dua, hitung: A a = E [h1 ( µ + σz ) exp{h2 ( y i , µ + σz )}] = h1 ( µ + σz a ) exp{h2 ( y i , µ + σz a )}x dimana h1 ( µ + σ zi ) =
1 2π
exp− 1 / 2 z a2 , a=1,...500
µ +σz i
e dan 1 + e µ +σzi
h2 ( y i , ( µ + σz )) = ( µ + σz ) y i − n i log(1 + e µ +σz )
Atau:
Aa =
e µ +σz a 1 + e µ +σz a
x exp( µ + σz a ) y i − ni log(1 + e
µ +σ z a
)x
1 2π
e −1 / 2 z a
2
Sehingga: E [h1 ( µ + σz ) exp{h2 ( y i , µ + σz )}] =
3.
1 x ∑a Aa 500
Menghitung
µ +σ Ba = exp ( µ + σz a ) yi − ni log(1 + e E [exp{h2 ( y i , µ + σz )}] = ∑
500 a
za
1 −1/ 2 za2 ) x e 2π
1 Ba 500
Penduga Bayes dihitung dengan mencari rasio dari hasil pada langkah ke -2 dan ke-3 diatas Nilai KTG dihitung dengan menggunakan metode Jacknife menggunakan rumus (3.16) namun dengan menghitung varians (p i ) melalui rumus:
[
g1i ( µˆ , σˆ , yi ) = V ( pi | yi , µ , σ ) = E ( pi2 | yi , µ , σ ) − pˆ iB ( µ , σ dimana:
]
2
E ( p i ) = E[h1 ( µ + σz )] dan E ( p i2 ) = E[ h12 ( µ + σz )]
∑i y i = nT pˆ = nT E[h1 ( µ + σz )]
[
2 2 ∑ ( y i − y i ) = ∑ n i (n i − 1) E h1 ( µ + σz ) i i
]
Dengan mengaplikasikan metode momen seperti yang telah dijelaskan oleh persamaan (3.9), pendugaan parameter α dan β menggunakan sebaran prior Beta adalah: 41
Kabupaten Sumenep: αˆ = 6.007941dan βˆ =1.735254. Kabupaten Pasuruan: αˆ = 16,1824 dan βˆ =1,6204.. Selanjutnya dengan menggunakan sebaran prior logit-normal pendugaan proporsi di area kecil (kecamatan) dilakukan dengan cara numerik menggunakan persamaan (3.19) yaitu
dengan membangkitkan nilai z dari sebaran
N(0,1)
n=500. Hasil pendugaan parameter (p i ) dengan mengaplikasikan metode pendugaan langsung ditunjukkan oleh
Lampiran 8 dan Lampiran 9,
secara
grafis ditunjukkan oleh Gambar 3.2. Dapat dilihat bahwa untuk pendugaan langsung, metode KM memberikan hasil yang hampir sama dengan metode Bayes yang menggunakan sebaran prior logit normal, demikian juga dengan pendekatan menggunakan sebaran prior beta.
1
1
0,9
0,95
0,8
0,9
0,7 0,85 0,6 0,8
0,5
0,75
0,4 0,3
0,7 0
5
10
15
20
25
30
0
5
10
15
20
25
Pendekatan Kalsik ML
Pendekatan Kalsik ML Pendekatan Bayes Logit (pEB Logit) Pendekatan Bayes Beta (pEB Beta)
Pendekatan Bayes Logit (pEB Logit) Pendekatan Bayes Beta (pEB Beta)
(a) Kabupaten Sumenep
(b) Kabupaten Pasuruan Gambar 3.2.
Hasil Pendugaan angka melek huruf dengan menggunakan metode klasik dan Metode Bayes Pada pendugaan proporsi dengan menggunakan sebaran prior logit normal, sebaliknya untuk sebaran prior Beta, bobot untuk komponen contoh pada
(
yi yaitu γˆi = ni / ni + αˆ + βˆ
)
relatif besar yaitu sekitar 0.905
untuk
Kabupaten Sumenep dan 0,827 untuk kabupaten Pasuruan. Oleh karena itu pendugaan Bayes secara langsung lebih dipengaruhi oleh komponen contoh karena bobot untuk komponen populasi relatif kecil sehingga tidak memberikan pengaruh yang berarti pada penduga Bayes. Hasil dugaan KTG menggunakan metode Jackknife untuk pendugaan langsung yang ditunjukkan oleh Gambar 3.3 memperlihatkan bahwa kedua
42
metode pendugaan langsung kurang memberikan akurasi yang bagus karena menghasilkan nilai MSE relatif tinggi dan kurang stabil.
0,01
0,0045
0,009
0,004
0,008
0,0035
0,007
0,003
0,006
0,0025
0,005 0,004
0,002
0,003
0,0015
0,002
0,001
0,001
0,0005
0
0 0
5
10 KTG logit
15
20
25
30
0
5
10 KTG Logit
KTG beta
(a) Kabupaten Sumenep
15
20
25
KTG Beta
(b) Kabupaten Pasuruan
Gambar 3.3 Plot dari nilai dugaan KTG menggunakan sebaran prior Beta dan Logit-Normal melalui metode pendugaan langsung 3.4.2. Pendugaan Tak Langsung Melalui pendugaan tak langsung, angka melek huruf diduga melalui model dengan peubah penyerta usia dan jenis kelamin. Peubah usia dibagai kedalam 5 katagori yaitu antara 10 -30 tahun, 30-40 tahun, 40-50 tahun, 50-60 tahun dan di atas 60 tahun dan jenis kelamin dibedakan atas 2 katagori yaitu laki-laki dan perempuan. Oleh karena itu setiap individu di area ke i dapat diklasifikasikan kedalam k kelompok, k =1,2....10 yang merupakan kombinasi antara usia dan jenis kelamin. Sedangkan peubah respon untuk model SAE adalah proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis di kelompok ke k di area ke i. Karena penarikan contoh dalam Susenas dilakukan dengan cara memilih contoh blok sensus secara acak pada tahap pertama dan selanjutnya memilih contoh keluarga dalam blok sensus yang terpilih pada tahap kedua, maka area kecil yang dimaksud pada penelitian ini adalah blok sensus. Gambar 3.4 yang menjelaskan hubungan antara kemampuan baca tulis dengan usia dinyatakan dalam grafik, menunjukkan bahwa makin tinggi proporsi usia, maka pendudukan yang bisa baca dan tulis semakin kecil. Terlihat bahwa proporsi penduduk laki-laki yang bisa baca dan tulis cenderung lebih banyak dibandingkan dengan penduduk perempuan. Berdasarkan uji korelasi dengan
43
mengambil α=5% terbukti bahwa kemampuan baca tulis dipengaruhi oleh usia dan jenis kelamin. Dengan demikian pendugaan tak langsung (berbasis model) dapat dilakukan dengan memanfaatkan peubah jenis kelamin usia sebagai peubah penyerta ke dalam model SAE. 0,99 1,00 0,90
0,995
0,965
0,986
0,853
0,907
0,80
0,721
0,70 0,60
0,573
0,624
0,50 0,40
0,441
0,30 0,20 10-30 tahun
31-40 tahun
41-50 tahun
Laki-laki
51-60 tahun
1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20
0,97 1,00
0,76 0,77
0,37
31-40 tahun
Laki-laki
Perempuan
(a) Kabupaten Sumenep
0,84 0,81
10-30 tahun
0,200 > 60 tahun
0,96 0,95
41-50 tahun
51-60 tahun
> 60 tahun
Perempuan
(b) Kabupaten Pasuruan Gambar 3.4.
Hubungan kemampuan baca tulis dengan usia berdasarkan jenis kelamin di Kabupaten Sumenep dan Kabupaten Pasuruan Melalui pendugaan tak langsung yaitu dengan melalui model SAE, pendugaan parameter model menggunakan metode KQB yang kemudian digunakan untuk menduga
yi* berdasarkan sebaran prior logit normal
menggunakan pendekatan Bayes Empirik (persamaan 3.25). Perhitungan nilai harapan pembilang dan penyebut dari persamaan tersebut menggunakan metode Montecarlo. Hasil pendugaan parameter dan KTG menggunakan metode pendugaan tak langsung untuk Kabupaten Sumenep dan kabupaten Pasuruan dapat dilihat pada Lampiran 8 dan Lampiran 9. Dalam bentuk grafik dapat dilihat pada Gambar 3.5 untuk Kabupaten Sumenep dan dan Gambar 3.6 untuk Kabupaten Pasuruan. Melalui pendekatan Bayes, berdasarkan pendugaan tak langsung, ratarata angka melek huruf kecamatan di Kabupaten Sumenep sebesar 0,827 dengan dugaan KTG sebesar 0,027. Kecamatan Batuputih yang memiliki angka melek huruf terendah berdasarkan pendugaan langsung sebesar 0,510. Sedangkan untuk Kabupaten Pasuruan, rata-rata angka melek huruf kecamatan berdasarkan pendugaan langsung sebesar 0,927 dengan nilai KTG sebesar
44
0,036. Kecamatan Nguling memiliki angka melek huruf terendah yaitu berdasarkan pendugaan langsung sebesar 0,725 .
Dugaan Angka Melek Huruf p r o p o r s i
Dugaan KTG
1,000
1,40E-01
0,950 0,900
K T G
0,850 0,800 0,750
1,20E-01 1,00E-01 8,00E-02 6,00E-02
0,700
4,00E-02
0,650 0,600
2,00E-02
0,550
0,00E+00
0,500 250
240
220
200
Kecamatan
180
160
140
120
80
100
70
50
30
10
10 30 50 70 80 100120140160180200220240250
Kecamatan
Gambar 3.5. Plot hasil dugaan angka melek huruf dan KTG di Kabupaten Sumenep Dugaan Angka Melek Huruf p r o p o r s i
Dugaan KTG
1,000
1,80E-01 1,60E-01
0,950
K T G
0,900 0,850
1,40E-01 1,20E-01 1,00E-01 8,00E-02 6,00E-02
0,800
4,00E-02 2,00E-02
0,750
230
210
190
170
150
130
110
90
70
50
30
10
230
210
190
170
150
130
90
110
70
50
10
0,700
30
0,00E+00
Kecamatan
Kecamatan
Gambar 3.6. Plot hasil dugaan paramater p i (angka melek huruf) dan KTG di Kabupaten Pasuruan
3.5.
Pembahasan Pendugaan angka melek huruf (proporsi penduduk berusia 10 tahun ke
atas yang bisa baca tulis) seperti dijelaskan oleh Gambar 3.2 menunjukkan bahwa metode pendugaan langsung melalui pendekatan Bayes Empirik memberikan hasil yang hampir sama dengan metode pendugaan langsung secara melalui pendekatan klasik. Hal ini disebabkan karena nilai dugaan α dan β relative kecil dibandingkan dengan nilai n i sehingga bobot untuk y i yaitu
45
(
)
γˆ i = n i / n i + αˆ + βˆ sangat besar (sekitar 0.905). Demikian juga untuk pendugaan Bayes Empirik dengan sebaran prior logit normal,
bobot untuk komponen
populasi terlalu kecil sehingga sebaran prior tidak terlalu berpengaruh kepada penduga Bayes. Nilai pendugaan KTG pendugaan langsung cenderung rendah, baik untuk pendugaan berbasis sebaran prior Beta maupun sebaran logit normal. Nilai KTG untuk pendugaan angka melek huruf di kecamatan Batuputih jauh lebih tinggi dibandingkan kecamatan yang lain karena nilai dugaan angka melek huruf di Kecamatan Batuputih sangat rendah dibandingkan dengan kecamatan lainnya. Tabel 3.2 menunjukkan rata-rata pendugaan angka melek huruf dan KTG kecamatan di Kabupeten Sumenep dan kabupaten Pasuruan menggunakan pendekatan Bayes. Tabel 3.2. Rata-rata pendugaan angka melek huruf dan KTG kecamatan di Kabupeten Sumenep dan kabupaten Pasuruan menggunakan pendekatan Bayes Kabupaten Sumenep Metode
Rata-rata Kecamatan
Rata-rata KTG
Kabupaten Pasuruan Rata-rata Kecamatan
Rata-rata KTG
Pendugaan langsung -
Prior Beta
0,7789
0,0019
0,9034
0,0009
-
Prior Logit-normal
0,7794
0,0026
0,9046
0,0012
0,827
0,027
0,927
0,036
Pendugaan Tak langsung (Model –logit normal)
Tabel 3.2 di atas menunjukkan bahwa pendugaan Bayes berbasis model menunjukkan perbedaan yang cukup signifikan dengan metode tak langsung baik melalui pendekatan klasik maupun Bayes. Keberadaan peubah penyerta yaitu usia dan jenis kelamin sangat berpengaruh pada penduga p i , karena bobot untuk komponen model lebih dominan dibandingkan dengan bobot untuk komponen penduga langsung disebabkan oleh kecilnya sampling fraction (f i =n i /N i ).
46
BAB IV. Model SAE Berbasis Sebaran Respon Multinomial Melalui Pendekatan Bayes
4.1.
Pendahuluan Jika setiap hasil pengukuran dapat dikatagorikan ke dalam q katagori A 1 ,
A 2 ,...........
A q , maka proporsi pada katagori ke k, k=1,2....q dinyatakan oleh p k
dan dikatakan bahwa p 1 , p 2 ,.....p q adalah paramater dari sebaran multinomial. Model SAE untuk respon multinomial ditujukan untuk menduga parameter p 1 , p 2 ,.....p q untuk area kecil ke-i dimana jumlah contoh dia area tersebut tidak cukup representatif. Dengan memperhatikan salah satu katagori sebagai kejadian sukses dan menganggap katagori yang lain sebagai kejadian gagal, maka model SAE untuk respon multinomial dapat dikembangkan dengan cara sama dengan respon binomial. Model SAE berbasis pada sebaran multinomial telah dikembangkan oleh beberapa peneliti diantaranya Molina et al. (2007) yang mengembangkan metode SAE model Campuran Logit Multinomial (Multinomial Logit Mixed Model). Dalam penelitiannya, Molina menerapkan Model Campuran Logit Multinomial dengan memasukkan satu pengaruh acak area ke dalam model sehingga pengaruh acak dianggap sama untuk setiap kelas multinomial. Scealy (2010) berpendapat bahwa pengaruh acak setiap katagori tidak sama, oleh karena itu Scealy mengembangkan model yang dikembangkan oleh Molina et al. (2007) dengan memasukkan pengaruh acak katagori dengan memperhitungkan
korelasi
antar
katagori.
Metode
tersebut
kemudian
diaplikasikan untuk pendugaan parameter angkatan kerja di area kecil. Pendugaan KTG didekati dengan dua metode yaitu
parametric bootstrap dan
pendekatan analitik (analytical approximations) dan kemudian membandingkan keduanya.
Untuk pendugaan parameter model, baik Molina (2007) maupun
Scealy (2010) mengaplikasikan metode pendugaan KQB dan untuk komponen ragam melalui pendekatan KM atau KMB. Vizcaino et al (2011) mengembangkan pendugaan area kecil berbasis peubah respon multinomial untuk pendugaan indikator angkatan kerja di Galicia, Spanyol berdasarkan data Labour Force Survey (LFS). Mereka menggunakan
47
model
Campuran
Logit
Multinomial
dimana
pendugaan
parameternya
menggunakan kombinasi metode KQB untuk memprediksi parameter β dan pendugaan terhadap pengaruh acak menggunakan metode KMB. Untuk pendugaan KTG, mereka menggunakan metode parameteric bootstrap seperti yang dilakukan oleh Gonzalez-Manteiga et al. (2008). Dalam penelitian ini model SAE berbasis pada sebaran multinomial yang dikembangkan didasarkan pada pengembangan model yang dilakukan oleh Scealy (2010) yaitu dengan mengaplikasikan model Campuran Logit Multinomial. Dalam pengembangan model tersebut dimasukkan pengaruh acak area dimana pengaruh acak dalam setiap area kecil tidak sama untuk setiap kelas multinomial karena varians dari pengaruh acak diasumsikan tidak sama diantara setiap katagori. Untuk pendugaan parameter model digunakan metode pendugaan KQB dan untuk pendugaan komponen ragam digunakan KMB sedangkan prediksi area kecil dilakukan dengan pendekatan Bayes. Pendugaan KTG dengan metode Jackknife seperti telah dijelaskan pada Bab III. Selanjutnya
model
SAE
untuk
peubah
respon
multinomial
yang
dikembangkan diaplikasikan untuk pendugaan proporsi penduduk berusia 10 tahun ke atas yang telah/sedang menduduki jenjang pendidikan tertentu dalam rangka menghitung rata-rata lama sekolah di tingkat kecamatan. Lokasi studi yang diambil adalah Kabupaten Sumenep dan kabupaten Pasuruan Propinsi Jawa Timur. Jenjang pendidikan terdiri dari 6 katagori yaitu Katagori I: tidak pernah bersekolah (lama sekolah 0 tahun) Katagori 2: putus SD (lama sekolah 1-3 tahun) Katagori 3: SD (lama sekolah 4-6 tahun) Katagori 4: SLTP (lama sekolah 7-9 tahun) Katagori 5: SLTA (lama sekolah 10-12 tahun) Katagori 6: Perguruan tinggi (lama sekolah 13 tahun ke atas) 4.2.
Model SAE untuk Respon Multinomial Untuk
kasus multinomial,
setiap hasil pengukuran hanya dapat
dikatagorikan ke dalam sejumlah katagori tertentu, misalnya q katagori. Untuk area (u i ) tertentu sebaran peluang multinomial dapat dinyatakan sebagai:
y ik | u i ~ M (ni , pi1 ,...... piq −1 )
(4.1)
48
Jika didefinisikan γ q = p1 + p 2 + ...... + p q . Maka sebaran peluang multinomial (4.1) adalah :
ni yi1 p i1 ..... p iqyiq ,i=1,2......m P Yi1 = y i1 ,..., Yiq = y iq | ni , u i = y ....... y iq i1
(
)
(4.2)
ni + q − 1 , k=1,2,....q-1. dimana ∑ y k = ni k q −1 Sebaran marjinal dari setiap komponen multinomial y ik adalah Binomial:
yik ~ B(ni , pik ) . Jika X ik merupakan vektor kovariat tetap dan diasumsikan tidak tergantung pada i dan k, maka model linier yang didasarkan pada rasio q −1 θ ik = log( p ik / p iq ) = log p ik / 1 − ∑ p ik adalah:
k =1
θ ik = x ik β k + uik , untuk i=1,....m dan k=1,....q
(4.3)
dimana : β k adalah vektor parameter x ik adalah vektor peubah penyerta pada katagori ke-k. u ik adalah pengaruh acak katagori ke-k pada area ke-i, Diasumsikan
bahwa
ui
memiliki
sebaran
multivariate
normal
u i ~ N (0, Wi ) dengan fungsi sebaran peluang:
f (u i ) =
1 2π Wi
1/ 2
exp −
1 t −1 u i Wi u i 2
(4.4)
dimana dan u i saling bebas dengan matriks varians kovarians dengan Wi = diag (ϕ k ) . Peluang dari katagori ke –k dalam area ke-i adalah: 1≤ k ≤ q −1
pik =
exp{θ ik } q −1
1 + ∑ exp{θ il }
, i=1,2,.............m dan k=1,2.......q-1.
(4.5)
l =1
4.2.1. Pendugaan Parameter Model Molina et.al. (2007) menduga parameter model β k dan u
dengan
menggunakan metode KQB. Keuntungan menggunakan metode KQB adalah metode tersebut mudah diaplikasikan walaupun menurut Hazel et.al (2001)
49
metode KQB dapat menghasilkan bias terutama jika jumlah contoh dalam kelas multinomial n ijk kecil. Pendugaan parameter dari model (4.3) diturunkan dari fungsi kemungkinan untuk β, φ dan u = (u1t .u 2t ,...., u mt ) t . Dengan y ij = (y ij1 , ......y ijq )t untuk 1 = 1,....,m dan j = 1,.....,n j , maka menurut Pawitan (2001), fungsi kemungkinan untuk parameter β, φ dan u adalah adalah:
m m ni L( β ,ϕ , u ) = f ( y | u ) f (u ) = ∏∏ f ( yij1 ,..... yijq | ui ∏ f (ui ) . i =1 i =1 j =1
(4.6)
Idealnya pendugaan β dan φ dilakukan dengan menggunakan metode kemungkinan maksimum yaitu dengan memaksimumkan L(β, φ) dimana:
m m ni L( β ,ϕ ) = ∫ ∏∏ [ f ( y | u ) f (u )] = ∏∏ f ( yij1 ,..... yijq −1 | ui ∏ f (ui ) du i =1 j =1 i =1 i =1 j =1 (4.7) m ∞ ∞ ni = ∏ ∫ ∫ f (ui ) ∏ f ( yij1 ,..... yijq −1 | ui du d 1 ....du dq −1 . i =1 j =1 −∞−∞ m
ni
Dengan memaksimumkan fungsi kemungkinan (4.7), pendugaan β dan φ dapat diperoleh dengan menggunakan metode Monte-Carlo seperti dilakukan oleh Hartzel et al (2001) atau integrasi numerik atau dengan metode Newton Raphson. Molina et al (2007) menggunakan metode KQB yang diperkenalkan oleh Breslow dan Clayton (1993). Jika diasumsikan φ diketahui, maka fungsi kemungkinan menjadi:
l (β, u ) = c −
m ni q 1 m t −1 ∑ u i Wi u i + ∑ ∑ ∑ y ijk log pijk 2 i =1 i =1 j =1 k
(4.8)
dimana c adalah konstanta. Penduga kemungkinan maksimum diperoleh dengan menurunkan satu kali mersamaan (4.8) dan menyamakannya dengan 0 sehingga didapat penyelesaian dari sistem persamaan tersebut. Misalkan parameter β terdiri dari b k komponen, karena masing-masing level katagori diasumsikan memiliki nilai parameter β k yang berbeda, maka dengan mendefinisikan indeks komponen β k dan X ijk dan komponen ke-b dari masing-masing parameter di level ke k adalah β k(b). Oleh karena itu dengan mendefinisikan:
50
e
pijk =
t x ijk β k + u ik q −1
t βu ∑ xijk
1 + e k =1
untuk k = 1,2..., q ; k ' = 1,2..., q − 1 ; j = 1,2..., ni ; i = 1,2..., m b=1,........,B j’ maka dapat diperoleh :
xik '(l ) (1 − pijk ' ) = − xijk '(l ) pijk '
∂ log pijk ∂β k '(l )
jika k = k' selain itu.
Untuk k ' = 1,2..., q − 1
∂ log(β, u ) m ni = ∑ ∑ xijk '(l ) ( yijk ' − nij pijk ' ) ∂β k '(l ) i =1 j =1
(4.9)
Turunan pertama terhadap pengaruh acak u adalah:
∂ log p ijk ∂u i 'k '
1 − p i ' jk ' = − p i ' jk ' 0
jika k = k' dan i = i' jika k ≠ k' dan i ≠ i' selain itu
dan untuk j’=1,2....q-1, maka diperoleh:
∂ (∑i =1 ∑ ji=1 ∑k =1 yijk log pijk ) m
n
q
∂ui 'k '
j =1
Selanjutnya dicari Wi −1
ni
= ∑ ( yi ' jk ' − mi ' j pi ' jk ' ).
dan
untuk i=1,......m dan
ϕ11 ϕ1q −1 = ϕ q −11 ϕ .q −1
Untuk mendapatkan penduga dengan metode Newton Raphson dibutuhkan turunan kedua dari
,
dan
Pendugaan parameter model
untuk
adalah
(4.10) dimana:
51
dengan
(4.11)
4.2.2. Pendugaan Ragam Untuk pendugaan komponen ragam digunakan metode kemungkinan maksimum (KM)
atau
metode kemungkinan maksimum berkendala (KMB).
Pendekatan KM untuk pendugaan komponen ragam menghasilkan penduga yang berbias seperti dinyatakan oleh Harville (1997) yang dikutip oleh Sceally (2010). Oleh karena itu Molina et al (2007) menggunakan pendekatan KMB untuk menduga komponen ragam. Melalui metode KMB komponen pengaruh tetap β dipandang sebagai parameter penggangu, sehingga sedapat mungkin diupayakan menghilangkan pengaruh dari β untuk membentuk ML marjinal untuk komponen ragam. Dalam model linier campuran normal seringkali dilakukan transformasi sedemikian
52
hingga bebas dari unsur β, kemudian dicari ML untuk komponen ragam dari data baru hasil transformasi. Sceally (2010) menyatakan bahwa pendekatan REML dalam kasus multinomial adalah: l (ϕ ) −
1 log X t V −1 X 2
(4.12)
dimana
1 1 1 l (ϕ ) = − log W − log Z t ΣZ + W −1 − uˆ t W −1uˆ . 2 2 2 Suku ke dua dari persamaan
(4.13)
(4.12) disebut sebagai bagian penalty.
Penduga KMB diturunkan dengan memaksimumkan persamaan (4.12) terhadap semua komponen ragam. Menurut Sceally (2010), metode KMB memang dapat mengurangi bias namun ada kemungkinan akan menghasilkan ragam yang lebih besar dibandingkan dengan metode KML. Untuk menurunkan penduga komponen ragam dengan metode KMB dibutuhkan turunan pertama dan ke dua dari log X t V −1 X . Turunan pertamanya adalah ∂ log X t V −1 X ∂ϕ a
(
)
−1 ∂V −1 = Tr X t V −1 X X t X , ∂ϕ a
dimana: ∂V −1
ϕa
= −V −1
∂V −1 ∂W t −1 V = −V −1Z ZV , ∂ϕ a ∂ϕ a
sehingga: ∂ log X t V −1 X ∂ϕ a
(
= Tr X t V −1 X
)
−1
X tV −1Z
∂W t −1 Z V X . ∂ϕ a
Sedangkan turunan ke duanya adalah:
∂ 2 log X 1 V −1 X ∂ϕ b ∂ϕ a
= 2Tr X 1 V −1 X
(
− Tr X 1 V −1 X
(
)
X 1 V −1 Z
∂W t −1 ∂W t −1 ZV Z Z V X ∂ϕ a ∂ϕ b
)
X 1 V −1 Z
∂W t −1 Z V X X 1 V −1 X ∂ϕ b
−1
−1
(
)
−1
X 1 V −1 Z
∂W t −1 Z V X. ∂ϕ b
* * Mengikuti cara yang dilakukan Sceally (2010), didefinisikan Sϕ dan J ϕ sebagai:
53
t
1 −1 ∂ log X1 V −1 X ∂ log X1 V −1 X ∂ log X1 V −1 X 1 ∂ log X V X * dan ,...... , ..... Sϕ = Sϕ − ∂ϕ1 ∂ϕ q−1 ∂ϕ1ϕ 2 ∂ϕ q−2ϕ q−1 2
∂ 2 log X1 V −1 X ∂ 2ϕ1 2 ∂ log X1 V −1 X ∂ϕ1∂ϕ1 1 * J ϕ = J ϕ − . 2 . 2 1 −1 ∂ log X V X ∂ϕ1∂ϕ q −1
∂ 2 log X1 V −1 X ∂ϕ1∂ϕ 2 ∂ϕ1∂ϕ q −1 ∂ 2 log X1 V −1 X ∂ 2 log X1 V −1 X .......... ∂ϕ 2 ∂ϕ q −1 ∂ 2ϕ 2 2 2 1 −1 1 −1 ∂ log X V X ∂ log X V X .......... ∂ϕ 2 ∂ϕ q −1 ∂ 2 ∂ϕ q −1 ∂ 2 log X1 V −1 X
..........
sehingga dengan β dan u diketahui dan dengan maka penduga φ adalah:
ϕ baru = ϕ sebelumnya − ( J ϕ* ) −1 Sϕ* .
(4.14)
4.2.3. Pendugaan Parameter Area Melalui Pendekatan Bayes Peubah respon y ijk dianggap merupakan peubah acak biner untuk individu ke-j dalam area i dalam katagori ke-k dimana i=1,2.....I;
j=1,......,N i ,
k=1,2.....q-1 sehingga y ijk merupakan peubah acak bebas Bernoulli dengan (Y ijk =1| p ijk )=p ijk . Model yang menghubungkan parameter dengan kovariatnya adalah model regresi logistik dengan efek acak area seperti dinyatakan oleh persamaan 4.2. Jika L menyatakan banyaknya grup dari kombinasi katagori dari peubah pembantu dan s menyatakan kumpulan individu yang terambil sebagai contoh sedangkan s’ adalah kumpulan individu yang tidak terambil sebagai contoh, maka jumlah individu pada area ke –i dapat dinyatakan sebagai: L
L
l =1
l =1
Yi = ∑ yils + ∑ yils '
(4.15)
s t dimana yil = ( yil1 ,...... yil ( q −1) ) dan yils ' adalah vektor yang tidak diketahui dari unit
yang tidak terambil contohnya.
Scealy (2010) mengatakan bahwa untuk
mendapatkan penduga dari Y i maka yils ' diduga dengan:
54
t xt β +uˆ e xil 1β1 +uˆi1 e ilq −1 q −1 iq −1 s' s' ,......, q −1 yˆ il = nil q −1 xtilk β1 +uˆik xt β +uˆ 1 + ∑ e ilk q −1 ik 1 + ∑ e k k
t
.
(4.16)
q
s' diketahui, maka proporsi unit pada katagori ke-k di Dengan asumsi nils ' = ∑ yijk k =1
area ke-i p ik adalah:
pik = f ik yik + (1 − f ik ) yik*
(4.17)
dimana: f ik = n ik /N ik ,
yik adalah rata-rata contoh (proporsi) di area ke i dan katagori ke k yik* = ∑ yikl /( N ik − nik ) adalah rata-rata dari unit-unit yang tidak diambil l∈s 'i
contohnya dalam area i pada katagori ke-k. *
Penduga Bayes dari yik diturunkan dengan cara yang sama dengan penduga Bayes untuk respon binomial yang telah dibahas pada Bab III, yaitu: pˆ iB( k ) = E ∑ p ikl | y ik , β , σ υ l T E ( ∑ p ikl exp hik ∑ x ijk y ikj , y ik , σ k z , β k j∈sik l = T E exp hik ∑ x ijk y ijk , y ik , σ k z , β k j∈sik
(4.18)
dimana
hik ∑ xijT yijk ,σ k z , β k = ∑ xijT yijk β k + (σ k z ) yik − j∈s j∈sik ik ∑ log 1 + exp xijT β k + σ k z .
[
(
)]
(4.19)
j∈slk
Dengan menggantikan
βˆk dan σˆ kυ pada persamaan (4.9) dapat
diperoleh penduga Bayes empirik untuk p ik (proporsi pada katagori ke k di area EB B ke i) yaitu p ik = pˆ ik ( βˆ , σˆ υ ) .
Pendugaaan KTG ( pˆ kiEB ) dilakukan dengan metode Jackknife seperti yang dilakukan pada pendugaan SAE untuk peubah respon Binomial pada Bab III
55
EB yaitu dengan menggantikan pˆ ik = k ik ( yik , µˆ , σˆ ) dan pˆ ik , − l = k ik ( yik , µˆ −l , σˆ −l )
EB
dalam persamaan (4.5) sampai dengan persamaan (4.6) sehingga diperoleh nilai
Mˆ 1ik dan Mˆ 2ik , sehingga diperoleh nilai MSE untuk pendugaan pada katagori ke k dan area ke-i yaitu Mˆ 1ik + Mˆ 2ik .
4.3.
Aplikasi: Pendugaan Rata-Rata Lama Sekolah Tingkat Kecamatan di Jawa Timur Berbasis Data Susenas 2010
4.3.1. Pengukuran Peubah Respon dan Peubah Penyerta. Dalam penelitian ini, di setiap area kecil populasi dibagi dalam kelas-kelas yang merupakan kombinasi peubah penyerta yaitu usia dan jenis kelamin. Usia dibagi dalam 5 kelas dan jenis kelamin dibagi dalam 2 kelas (laki-laki dan perempuan). Peubah respon yang diamati adalah proporsi penduduk yang telah berada pada jenjang pendidikan tertinggi yang pernah ditempuh dimana jenjang pendidikan diklasifikasi menjadi 6 seperti dijelaskan oleh Tabel 4.1. Data yang digunakan dalam penelitian ini adalah data Susenas tahun 2010 dan data Sensus Penduduk tahun 2010 di Jawa Timur khususnya untuk Kabupaten Sumenep dan Kabupaten Pasuruan. Tabel 4.1. Klasifikasi tingkat pendidikan tertinggi penduduk usia 10 tahun ke atas Katagori (k)
Lama sekolah (th)
Titik tengah
1 2 3 4 5 6
0 1-3 4-6 7-9 10-12 *) >13
0 2 5 6 11 16
*) maksimum 19 tahun Proporsi penduduk di tiap jenjang pendidikan dipengaruhi oleh usia dan jenis kelamin (lihat Lampiran 20).
Semakin tinggi usia maka proporsi yang
pernah menempuh pendidikan menengah dan tinggi makin kecil. Sebaliknya makin tinggi usia maka penduduk yang tidak pernah bersekolah makin banyak. Bersarnya proporsi di tiap level pendidikan berbeda antara penduduk laki-laki dan perempuan. Oleh karena itu usia dan jenis kelamin
56
dapat diduga akan
memberikan pengaruh kepada nilai proporsi di tiap jenjang pendidikan dan layak untuk dijadikan peubah penyerta. 4.3.2. Hasil Eksplorasi Data Di Kabupaten Sumenep, hasil eksplorasi data (Gambar 4.1) menunjukkan bahwa penduduk berusia 10 tahun ke atas yang belum pernah bersekolah cukup tinggi yaitu 22,71%. Penduduk yang hanya menamatkan pendidikan sekolah dasar adalah yang paling tinggi yaitu 28,25%, selanjutmya penduduk yang bisa menyelesaikan pendidikan SMP 12,5%, SMA hanya 12 % dan perguruan tinggi tidak sampai 4%. 30,0% 25,0%
30,0% 22,7%
t 20,0% a h 15,0% u n 10,0% 5,0%
34,2%
35,0%
28,2%
t a h u n
12,5% 11,9%
25,0% 20,0%
10,0% 4,5% 4,2% 2,9% 2,7% 2,3% 1,8% 1,7% 1,2% 1,0% 0,9% 0,7% 0,1% 0,6%
2
4
6
13,9%
7,8%
5,0%
5,0% 4,9% 4,5% 3,5% 2,3%
2,3% 2,0% 1,4% 1,2% 0,9% 0,2% 0,6% 0,2%
0,0%
0,0% 0
15,1%
15,0%
0 2 4 6 Lama Sekolah
8 10 12 14 16
Lama Sekolah
(a) Kabupaten Sumenep
8
10 12 14 16
(b) Kabupaten Pasuruan Gambar 4.1
Proporsi penduduk berusia 10 tahun ke atas berdasarkan lama sekolah berdasarkan data Susenas 2010 di Kabupaten Sumenep dan Pasuruan Sedangkan untuk Kabupaten Pasuruan penduduk berusia 10 tahun ke atas yang belum pernah bersekolah cukup tinggi yaitu 8%. Penduduk yang hanya menamatkan pendidikan sekolah dasar 34.24%, selanjutmya penduduk yang bisa menyelesaikan pendidikan SMP 15%, SMA sekitar 14% dan perguruan tinggi tidak sampai 4% Grafik pada Lampiran 20 menunjukkan hubungan antara jenjang pendidikan tertinggi yang pernah ditempuh oleh penduduk usia 10 tahun dengan usia dan jenis kelamin. Terlihat dari grafik tersebut bahwa di Kabupaten Sumenep, untuk penduduk yang tidak pernah bersekolah. Semakin tinggi usia maka proporsi penduduk yang tidak pernah bersekolah makin tinggi, dimana penduduk laki-laki memiliki proporsi lebih rendah dibandingkan dengan 57
penduduk perempuan. Sebaliknya semakin tinggi usia maka penduduk yang mampu menamatkan sekolah SD, SLTP dan SLTA juga main kecil. Penduduk laki-laki memiliki proporsi yang lebih tinggi dibandingkan dengan perempuan. 4.3.3. Pendugaan Rata-rata Lama Sekolah di Tingkat Kecamatan. Seperti telah dijelaskan di atas bahwa y ik merupakan peubah respon multinomial, dalam penelitian ini mengukur jumlah penduduk berusia 10 tahun ke atas yang memiliki jenjang pendidikan ke k, k=1,2...6 pada area ke-i. Selanjutnya model linier yang diduga adalah θ ik = x ik β k + uik dimana θ ik adalah fungsi logit (p ik ) yaitu θ ik = log( p ik / p iq ) = log p ik
q −1 / 1 − ∑ p ik . k =1
Dengan menggunakan data Susenas 2010, pendugaan parameter β dan φ dalam penelitian ini adalah menggunakan metode PQL dengan cara memaksimumkan fungsi likelihood seperti yang dinyatakan oleh persamaan (4.6). Selanjutnya pendugaan ragam mengikuti metode yang disarankan oleh Molina et al (2007) yaitu menggunakan pendekatan REML yang dilakukan dengan memaksimumkan persamaan (4.11). Hasil pendugaan p ik (proporsi penduduk berusia sepuluh tahun ke atas pada jenjang pendidikan ke k), k=1,2...,6) dapat dilihat pada Gambar 4.2 untuk Kabupaten Sumenep dan Gambar 4.3. untuk Kabupaten Pasuruan.
Prediksi
proporsi di tiap jenjang pendidikan penduduk dapat dilihat pada Lampiran 10. Gambar 4.2 dan Gambar 4.3 juga menjelaskan pendugaan KTG menggunakan metode Jackknife. Secara rinci dugaan proporsi untuk tiap katagori pendidikan dan nilai dugaan KTG dapat dilihat pada Lampiran 11. Nilai KTG untuk masing-masing model sangat rendah, hal ini menunjukkan bahwa nilai bias dan ragam dari dugaan sangat kecil (lihat Tabel 4.2). Tabel 4.2. Rata-rata dugaan proporsi penduduk pada jenjang pendidikan tertentu dan rata-rata nilai KTG dugaan di Kabupaten Sumenep dan Pasuruan Parameter
Katagori 4
1
2
3
5
6
0.2405 1.54E-09
0.0551 5.14E-10
0.3941 3.87E-09
0.1471 1.02E-09
0.1105 9.66E-10
0.0492 6.42E-10
0.0895 1.52E-03
0.4518 6.76E-03
0.1355 5.07E-03
0.0967 6.21E-03
0.1335 2.28E-02
Kabupaten Sumenep Rata-rata proporsi Rata-rata KTG
Kabupaten Pasuruan Rata-rata proporsi Rata-rata KTG
0.0930 1.06E-03
58
Nilai dugaan proporsi penduduk di tiap jenjang pendidikan
Nilai dugaan KTG 3,00E-08
0,8000
2,50E-08
0,7000 0,6000
K T G
0,5000 0,4000 0,3000
2,00E-08 1,50E-08 1,00E-08
0,2000 5,00E-09
0,1000 0,0000
250
240
220
200
180
160
140
120
80
Kecamatan
100
70
50
10
250
240
220
200
180
160
140
120
80
100
70
50
30
10
0,00E+00 30
p r p o r s i
Kecamatan
Tidak Sekolah
Putus SD
Tidak Sekolah
Putus SD
Lulus SD
Lulus SMP
Lulus SD
Lulus SMP
Lulus SMA
PT
Lulus SMA
PT
Gambar 4.2. Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas di tiap jenjang pendidikan dan nilai dugaan KTG di Kabupaten Sumenep Nilai dugaan proporsi penduduk di tiap jenjang pendidikan
Nilai dugaan KTG
0,8000
6,00E-01
0,7000 5,00E-01
0,6000 0,5000
K T G
0,4000 0,3000 0,2000
4,00E-01
3,00E-01
2,00E-01
0,1000 1,00E-01 220
230
210
190
170
150
130
110
90
70
50
Kecamatan
30
0,00E+00 10
200
180
160
140
120
100
80
70
50
30
0,0000 10
p r o p o r s i
Tidak Sekolah
Putus SD
Tidak Sekolah
Putus SD
Lulus SD
Lulus SMP
Lulus SD
Lulus SMP
Lulus SMA
PT
Lulus SMA
PT
Gambar 4.3. Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas di tiap jenjang pendidikan dan nilai dugaan KTG di Kabupaten Pasuruan
59
Prediksi rata-rata lama sekolah di tiap kecamatan di Kabupaten Sumenep dan Pasuruan dapat dilihat pada Gambar 4.4. Terilaht bahwa rata-rata lama sekolah di Kabupaten
Pasuruan
lebih tinggi dibandingkan dengan rata-rata
lama sekolah di tiap kecamatan di Kabupaten Sumenep.
Sebagian besar
kecamatan di Kabupaten Sumenep memiliki rata-rata lama sekolah kurang dari 6 tahun. Nilai dugaan rata-rata Lama Sekolah (tahun) di Kabupaten Sumenep
l a m a s e k o l a h
Nilai dugaan rata-rata Lama Sekolah (tahun) di Kabupaten Pasuruan 11,50
9,50 8,50
l a m a
8,57
7,50
7,49
7,45 6,98
6,81
6,50
s e k o l a h
6,40 5,77 5,68
5,50
4,76 4,59
4,50 3,50
5,72
5,49
4,97 4,75 4,70 4,84 4,66 4,36 4,15 3,95 3,97 3,67
5,51 4,66
9,77
9,50
10,07
8,74 8,76 8,32 8,08 8,02
8,50 7,50 6,95
6,50
6,60 6,21
6,23
5,50
5,53
4,50
5,30 5,25 4,65
5,21 5,03
4,11
5,18 4,804,68 4,14
3,50
2,87
2,50
10,97
10,50
2,50
2,10
1,50
10 30 50 70 90 110 130 150 170 190 210 230
240
210
180
150
90
120
70
40
10
1,50
Kecamatan
Kecamatan
Gambar 4.4. Plot Hasil dugaan angka melek huruf dan nilai KTG dugaan di Kabupaten Sumenep
4.4.
Pembahasan Dalam penelitian ini, pengaruh
peubah penyerta yaitu usia dan jenis
kelamin terhadap peubah respon pada model SAE dengan
peubah respon
multinomial dibedakan atas katagori. Untuk katagori 1 (tidak pernah bersekolah) dan 2 (putus sekolah dasar) memiliki nilai dugaan parameter β positif, namun untuk jenjang pendidikan lebih tinggi nilai β negatif. Untuk model SAE khusus untuk jenjang pendidikan SD memiliki nilai KTG yang relatif lebih besar dibandingkan dengan jenjang pendidikan yang lain karena proporsi penduduk pada jenjang pendidikan SD lebih bervariasi dari kecamatan ke kecamatan baik untuk Kabupaten Sumenep maupun kabupaten Pasuruan.
Sebaliknya nilai KTG untuk pendugaan proporsi penduduk yang
60
putus sekolah SD (lama sekolah 0-3 tahun) sangat kecil karena proporsi penduduk yang putus sekolah SD di semua kecamatan hampir sama, baik untuk Kabupaten Pasuruan dan Kabupaten Sumenep. Nilai KTG dengan nilai peubah respon yang heterogen seperti pada jenjang pendidikan SD relatif lebih tinggi dibandingkan dengan model SAE yang didasarkan pada nilai peubah respon yang homogen. Kenyataan ini menunjukkan bahwa pendugaan KTG dengan metode Jackknife sangat tergantung kepada heterogenitas dari proprosi di kecamatan, semakin homogen maka nilai KTG akan makin kecil.
61
BAB V Model Bayes Pendugaan Area Kecil untuk Respon Binomial dan Multinomial Berbasis Penarikan Contoh Berpeluang Tidak Sama
5.1.
Pendahuluan Pada
umumnya
pengembangan
model
SAE
dan
dilakukan dengan menganggap semua area terwakili dalam
pendugaannya contoh atau
menganggap contoh area dipilih dengan peluang yang sama (Pfeffermann, 2010). Beberapa peneliti yaitu Kott (1990), Arora dan Lahiri (1997) serta Prasad dan Rao (1999), yang mengembangkan model SAE yang memperhatikan peluang pengambilan contoh menyatakan bahwa pendugaan yang dilakukan tanpa memperhatikan peluang penarikan contoh akan menghasilkan penduga yang berbias. Model SAE yang dikembangkan dengan memperhitungkan peluang penarikan contoh umumnya untuk peubah respon bertipe kontinu khususnya peubah respon yang memiliki distribusi normal.
Lehtonen et al. (2009)
mengaplikasikan Model Generalized Regresion (GREG) mengaplikasikan metode PTLTE untuk pendugaan parameter area dengan menyertakan bobot unit contoh. Penelitian oleh Lehtonen R (2009) tersebut menghasilkan peningkatan akurasi dan mengurangi bias. Dengan memberikan bobot pada unit contoh,
You
dan
Rao
(2002)
mengembangkan
model
SAE
dengan
mengaplikasikan metode Pseudo PTLTE untuk pendugaan parameter area kecil. Model tersebut diterapkan untuk menduga produksi jagung di wilayah kecil (kota) dan dihasilkan bahwa metode PTLTE semu (pseudo EBLUP) menghasilkan KTG yang sedikit lebih kecil dibandingkan dengan metode PTLTE. Dalam bukunya Rao (2003) juga membahas model SAE untuk peubah respon normal dimana pendugaan parameter mengaplikasikan PTLT semu ( Pseudo –BLUP) atau PTLTE. semu (Pseudo –EBLUP) Pfefferman et al. (1998) juga telah membahas pengaruh peluang penarikan contoh dari proses penarikan contoh gerombol dua tahap (multistage cluster sampling) terhadap kualitas penduga model SAE. Pfefferman et al.(1998) mengasumsikan bahwa peluang penarikan contoh memiliki korelasi dengan
62
karakteristik area atau unit percontohan, oleh karena itu disebut sebagai percontohan informatif (informative sampling). Selanjutnya berdasarkan ide Pfefferman tersebut, Eideh dan Nathan (2009) mengasumsikan bahwa peluang penarikan contoh memiliki hubungan dalam bentuk fungsi eksponensial dengan karakteristik area dan unit. Pengembangan model SAE yang dilakukan oleh Eideh dan Nathan (2009) yaitu dengan menyertakan model eksponensial tersebut ke dalam model SAE. Seperti telah dijelaskan sebelumnya bahwa tujuan utama penelitian ini adalah mengembangkan model SAE yang dapat diaplikasikan dalam menduga Indeks Pendidikan yang merupakan salah satu komponen IPM di area kecil dimana data dasar yang digunakan adalah Susenas yang penarikan contohnya berpeluang tidak sama.
Oleh karena ide pengembangan metode SAE yang
memperhatikan peluang penarikan contoh seperti yang telah dilakukan oleh para peneliti di atas digunakan sebagai dasar pengembangan model SAE dengan memperhitungkan peluang penarikan contoh yang dapat digunakan untuk menduga komponen Indeks Pendidikan yaitu model SAE untuk respon binomial dan multinomial. Pendugaan parameter area kecil dilakukan dengan pendekatan Bayes. Selanjutnya metode tersebut akan diaplikasikan untuk menduga angka melek huruf dan rata-rata lama sekolah di Kabupaten Sumenep dan Kabupaten Pasuruan, Provinsi Jawa Timur.
5.2.
Penyertaan Peluang Penarikan Contoh pada Model SAE. Mengacu pada penelitian Pfefferman (1998), Eideh dan Nathan (2009)
mengembangkan model SAE berbasis peluang tidak sama dengan penarikan contoh dua tahap yang mengasumsikan bahwa peluang penarikan contoh baik untuk penarikan contoh area dan penarikan contoh unit memiliki hubungan dengan karakteristik area dan unit dalam bentuk fungsi eksponensial. Pada tahap pertama, misalkan pengaruh area yang dinyatakan dengan peubah u i memiliki hubungan dengan karakteristik area z i , sehingga hubungan antara peubah u i dan z i dinyatakan oleh fungsi
ui = zi'γ + ηi , Untuk
tahap
ind
ηi ~ N (0,σ u ) ke
dua,
(5.1) diasumsikan
terdapat
peubah
penyerta
x ij =(x ij1 ,......,x ijr )’ yang mempengaruhi y ij yang tersedia untuk semua kelompok percontohan maka hubungan antara y ij dan x ij dinyatakan oleh fungsi:
63
yij = µi + xij' β + eij ,
ind
eij ~ N (0, σ e2 )
(5.2)
dimana
Dengan cara lebih sederhana maka gabungan dari persamaan (5.1) dan (5.2) adalah:
Mengikuti cara yang dikembangkan oleh Pfefferman (1998) yaitu dengan memperhatikan peluang penarikan contoh, maka, fungsi kepadatan peluang untuk
dalam percontohan area ke-i adalah: (5.3)
dimana . Eideh dan Nathan (2009) mengasumsikan bahwa rata-rata peluang terambilnya area ke-i sebagai contoh dapat dinyatakan sebagai fungsi eksponensial dari peubah yang menggambarkan karaketristik area sebagai berikut: .
(5.4)
Misalkan model matematik yang menghubungkan peluang penarikan contoh ke-i dengan peubah area dinyatakan dalam bentuk fungsi eksponensial sebagai berikut:
{
}
E (π | µ , z ) = 1 / E (π | µ , z ) = exp (bµ + b' z ) s i i i p i i i i i
(5.5)
dimana z i adalah peubah yang menyatakan karakteristik area ke-i dan b adalah parameter yang menghubungkan kedua peubah. Jika wi = 1 / π i menyatakan bobot dari area ke-i, maka persamaan (5.5) dapat dinyatakan sebagai:
E s ( wi | µ i , z i ) = 1 / E p (π i | µ i , z i ) = exp{− (bµ i + b' z i )}
(5.6)
Berdasarkan persamaan (5.3), maka fungsi kepadatan peluang untuk pengaruh acak u i dapat ditulis sebagai: (5.7) dimana: .
64
(5.8)
Dengan cara yang sama maka pada tahap kedua, fungsi kepekatan peluang untuk y ij dapat dituliskan dalam formula: (5.9) Selanjutnya peluang terambilnya contoh unit ke j pada area ke-i yaitu π j / i diamsumsikan memiliki hubungan dengan
karakteristik unit yang dinyatakan
sebagai peubah x ij dalam bentuk fungsi eksponensial sebagai berikut: .
(5.10)
Sama dengan peluang area, model matematik yang menghubungkan peluang ( π j / i ) atau bobot ( w j / i = 1 / π j / i ) terambilnya unit ke-j pada area ke-i dengan peubah penyerta adalah:
E p (π j|i | yij , x ij , µ i ) = exp(dyij + d ' x ij )
(5.11) (5.12)
Oleh karena itu fungsi kepadatan peluang untuk y ij untuk µ i dan x ij tertentu adalah: (5.13) dimana (5.14) Persamaan (5.8) dan (5.14) menunjukkan bahwa jika diasumsikan peluang penarikan contoh memiliki hubungan dengan karakteristik area dan unit dalam bentuk fungsi eksponensial, maka terjadi pergeseran rata-rata sebesar untuk pengaruh area dan
untuk unit.
Dengan mendefinisikan b = (b0 , b1 ,...., bq )' , z i = (1, z i 2 ,..., z iq )' , d = (d 0 , d1 ,...d r )' dan x ij = (1, xij 2 ,..., xijr )' , maka dengan menggunakan metode penduga KM, pendugaan vektor parameter B dan D adalah (5.15) (5.16) dimana
.
Untuk y ij yang diasumsikan memiliki sebaran normal dan dengan menyertakan peluang terambilnya contoh maka bentuk fungsi kepadatan
65
peluang y ij untuk µ i dan x ij diketahui dapat dinyatakan oleh persamaan (5.14). Nilai harapan dan ragam dari sebaran tersebut adalah: (5.17) +
(5.18) (5.19)
1)
Pendugaan Parameter Model SAE Selanjutnya
pendugaan
parameter
model
SAE
dilakukan
dengan
memaksimumkan fungsi kemungkinan baik untuk area dan unit yang terambil sebagai contoh serta untuk area dan unit yang tidak terambil sebagai contoh. Dalam pendugaan paramater, Eideh dan Nathan (2009) mengaplikasikan dua cara yaitu melalui metode Kemungkinan Maksimum (Maximum Likelihood ) dan metode Pendugaan Kemungkinan Maksimum Semu (KMS) atau Pseudo Maximum Likelihood ). Metode KM tidak memperhitungkan bobot penarikan contoh sehingga rancangan percontohan diabaikan, sedangkan metode KMS memperhitungkan bobot penarikan contoh. Jika m i adalah jumlah contoh pada area ke i dan penarikan contoh dilakukan secara acak, maka untuk j=1,2....m i , sebaran y ij akan saling bebas dan masing-masing memiliki sebaran normal dengan rataan dan ragam, koragam seperti dinyatakan oleh persamaan (5.17), (5.18) dan (5.19). Oleh karena itu fungsi peluang bersama antara ( yij ,........ yimi ) untuk percontohan area ke-i adalah:
x .
(5.20)
Metode Kemungkinan Maksimum Fungsi kemungkinan diperoleh dari mentransformasikan persamaan (5.20) dengan transformasi logaritma natural, yaitu:
66
Jika didefinisikan
,
maka fungsi likelihood diatas menjadi lebih sederhana dan merupakan fungsi , yaitu:
dari
.
( 5.21)
Dengan memaksimumkan fungsi kemungkinan yang dinyatakan oleh persamaan (5.21) diatas maka akan diperoleh penduga
. Jika parameter
informatif tidak diketahui maka parameter b dan d yang digunakan untuk menghitung
β 0 = bσ µ2
dan
γ 0 = dσ e2 dapat diduga dengan menggunakan
persamaan (5.15) dan (5.16).
Metode Kemungkinan Maksimum Semu Alternatif lain untuk pendugaan parameter model SAE adalah dengan menggunakan metode Kemungkinan Maksimum Semu (KMS). Metode KMS ini dikembangkan oleh beberapa peneliti seperti Binder (1983), Asparouhov (2006) dan Eideh dan Nathan (2009). Pada kasus penarikan contoh dua tahap, peluang penarikan contoh untuk unit ke-i pada area ke j adalah π ij = π i π j / i , i=1,2......,N ; j=1,2......,M i . Oleh karena itu bobot percontohan adalah w ij =w i w j/i dimana
67
wi = 1 / π i dan
w j / i = 1 / π j / i , i=1,2......N. Eideh dan Nathan (2009) menyatakan bahwa kontribusi dari area ke-i pada log-likelihood sensus (untuk seluruh populasi) adalah:
Sehingga fungsi kemungkinan yang harus dimaksimumkan adalah:
Oleh karena itu penduga fungsi kemungkinan
adalah:
(5.22) Secara singkat persamaan (5.31) ditulis dalam bentuk:
.
(5.23)
Penduga KMS adalah nilai-nilai yang diperoleh dengan cara memaksimumkan persamaan (5.23) menggunakan metode numerik. Pendugaan Ragam
(5.24) dimana
2)
.
Pendugaan parameter pengaruh area Sebaran percontohan bersyarat µ i | yi1 ,...... yimi tergantung pada sebaran
percontohan dari efek area pada tahap pertama dan sebaran yij | µ i pada tahap kedua. Untuk
µ i | yi1 ,...... yimi
penduga Bayes untuk µ i | y i
yang diasumsikan menyebar normal, maka
merupakan nilai tengah dari sebaran posterior
68
f(
yang diperoleh dari: f(
sebaran posterior f(
Nilai tengah untuk
adalah:
Parameter rataan untuk sebaran normal di atas dapat dinyatakan sebagai:
(5.25) dimana:
dan
Sehingga: (5.26)
.
Pendugaan paramater di area yang terambil sebagai contoh
(5.27) dimana
.
69
Pendugaan parameter untuk area yang tidak terambil sebagai contoh Untuk area yang tidak terambil sebagai contoh, maka peluang untuk tidak terambil sebagai contoh adalah
. Karena tidak ada unit yang diamati
atau terambil dalam percontohan maka pengaruh area yang tidak terambil sebagai contoh bukan merupakan fungsi dari percontohan unit, sehingga:
µ j ,c y s =
z 'j
γˆ −
{ {
}
gˆ ( z j )bˆσˆ µ2 exp bˆ( z 'j γˆ ) + 0.5bˆ 2 σˆ µ2 . 1 − gˆ ( z ) exp bˆ( z ' y ) + 0.5)bˆσˆ 2 j
j
µ
}
(5.28)
Menurut Eideh dan Nathan (2006) Untuk model SAE seperti yang dinyatakan oleh persamaan
y = x' β + µ + e dimana µi = µ + ηi , ij ij i ij
maka
pendugaan parameter area ke-i yang terambil sebagai contoh adalah:
µˆ s ,i = φi ( yi − xi'βˆ ) + (1 − φi )( µˆ ) + (1 − φi )bσ µ2 − φi dσ e2
(5.29)
dimana Sedangkan dugaan parameter untuk area yang tidak terambil sebagai contoh dinyatakan oleh persamaan :
µˆ c , j = µˆ −
5.3.
bσ µ2 exp(bµˆ + 0.5b 2σ µ2 ) 1 − exp(bµˆ + 0.5b 2σ µ2 )
.
(5.30)
Pendugaan Area Kecil Menggunakan Model Campuran Linier Terbobot. Rao (2003) membahas model SAE berbasis penarikan contoh berpeluang
tidak sama untuk peubah respon normal. Model SAE dikembangkan dengan memberikan bobot pada area survei dengan manggunakan rata-rata bobot level unit
wij = wij / ∑ wik = wij / wi. k
yiw = ∑ wij yij = ∑ wij ( xijT β + µ i + eij ) j
j
=
xiwT
(5.31)
β + µ i + eiw
70
dimana dan
eiw = ∑ wij eij dengan E (eiw ) = 0 dan V (eiw ) = σ e2 ∑ wij2 = σ e2 δ iw j
j
xiw = ∑ wij xij . Selanjutnya pendugaan parameter dilakukan dengan j
mengaplikasikan metode PTLT atau PTLTE untuk persamaan (5.31) di atas. Rao (2003) menyebut metode pendugaan untuk unit contoh berpeluang tidak sama dengan istilah PTLT semu (pseudo BLUP) atau PTLTE semu (pseudo EBLUP).
You dan Rao (2002) mencoba menerapkan metode PTLTE semu
untuk menduga produksi jagung di wilayah kecil (kota) dan dihasilkan bahwa metode PTLTE semu menghasilkan KTG yang sedikit lebih kecil dibandingkan dengan PTLTE. 5.4.
Pengembangan Model Bayes SAE Berbasis Penarikan Contoh Berpeluang Tidak Sama untuk Respon Binomial Seperti telah dijelaskan pada Bab III, setiap individu dalam populasi
diklasifikasikan berdasarkan pada 2 peubah demografi yaitu usia (yang terdiri dari 5 katagori) dan jenis kelamin (terdiri dari 2 katagori) sehingga terdapat maksimum k=10 katagori. Jumlah individu yang berada dalam area ke i dan katagori ke j (j=1,......k i ) merupakan peubah Binomial dengan peluang p ij . Selanjutnya peubah respon y ij didefinisikan sebagai fungsi logit(p ij ) yaitu
yij = log it ( pij ) =
pij 1 − pij
.
Dengan memperhatikan
peluang
penarikan
contoh,
maka
dalam
penelitian ini pendugaan area kecil melalui pendekatan Bayes untuk peubah respon Binomial didasarkan pada pengembangan 2 model SAE sebagai berikut: 1) Menggunakan model linier terampat untuk sebaran respon logit normal dengan memberikan bobot penarikan contoh pada peubah respon y ij = logit (p ij ) dan peubah prediktor x ij . 2) Menggunakan model SAE dengan menyertakan peluang percontohan dalam bentuk fungsi eksponensial seperti yang dikembangkan oleh Eideh dan Nathan (2009). Kedua metode di atas dibandingkan dengan metode SAE yang tidak memperhitungkan bobot peluang dengan menggunakan model seperti pada persamaan (3.23). Pendugaan proporsi di area kecil menggunakan pendekatan
71
Bayes dengan mengaplikasikan formula Bayes seperti yang ditunjukkan oleh persamaan (3.25).
5.4.1. Penentuan Bobot Bobot percontohan untuk penarikan contoh merupakan kebalikan dari peluang penarikan contoh. Misalkan pada penarikan contoh dua tahap seperti yang dilakukan dalam Susenas, maka bobot percontohan dihitung dari perkalian fraksi penarikan contoh pada tahap satu dan tahap dua. Jika di kecamatan tertentu contoh diambil dalam dua tahap dimana pada tahap pertama dipilih blok sensus secara pps (proportional to size) dengan size banyaknya rumah tangga hasil listing SP2010 ( N i ), maka peluang contoh pada blok sensus ke-i untuk terpilih sebagai percontohan adalah π i =
Ni M
=
∑ Ni
Ni . Dari N
i
M area atau blok sensus yang ada dipilih m area kecil (blok sensus), sehingga fraksi penarikan contoh tahap pertama adalah:
fi = n ×
Ni
=
N
∑N
n × Ni N
.
i
(5.32)
i
Bila pada blok sensus yang terpilih ditarik sejumlah rumah tangga (n i ) dengan peluang yang sama, maka peluang bersyarat terpilihnya individu ke-j pada blok sensus ke-i dinyatakan sebagai π
j|i
, dimana π j|i =
1 . Jumlah individu Ni
yang terpilih adalah n i , sehingga fraksi penarikan contoh pada tahap kedua adalah f j|i =
ni . Sehingga overall sampling fraction adalah: Ni
f ij = f i × f j|i =
m × Ni N
×
ni m × ni . = Ni N
(5.33)
Dengan demikian design weight dapat dirumuskan sebagai berikut: wij =
N m × ni
(5.34)
dengan: wij
: bobot individu ke-j, blok sensus ke-i
N : banyaknya populasi listing SP2010 di kecamatan tertentu
72
m
: banyaknya contoh blok sensus yang diambil di kecamatan tertentu
n i : banyaknya contoh individu di blok sensus ke-i. 5.4.2. Metode Pendugaan Parameter Area Kecil dengan Menyertakan Peluang Penarikan Contoh yang Bersifat Eksponensial. Hubungan antara peluang penarikan contoh dengan karakteristik area dan unit dinyatakan dalam bentuk fungsi eksponensial seperti dijelaskan oleh persamaan (5.15) dan (5.21). Dalam penelitian ini bobot peluang terambilnya contoh dihitung berdasarkan penarikan contoh dua tahap sehingga bobot peluang penarikan contoh untuk tahap satu adalah wi =
mN dan bobot peluang Ni
untuk unit seperti dinyatakan oleh persamaan (5.43) yaitu wij =
N . m × ni
Peubah yang diduga memiliki hubungan dengan peluang penarikan contoh adalah peubah respon yaitu logit (p i ) untuk penarikan contoh area dan logit (p ij ) untuk unit. Peluang penarikan contoh untuk area adalah pps, tergantung pada jumlah penduduk, dimana jumlah penduduk sangat dipengaruhi oleh maju tidaknya suatu wilayah. Di Indonesia, semakin maju suatu wilayah, maka jumlah penduduknya semakin besar dan tingkat pendidikannya juga makin baik artinya angka melek hurufnya makin tinggi. Karena itu jika penarikan contoh area (blok sensus) dilakukan secara pps, maka akan sangat beralasan menghubungkan peluang penarikan contoh dengan angka melek huruf. Dengan kata lain peluang area ke-i terambil sebagai contoh (
) diasumsikan memiliki hubungan dengan
p i atau logit (p i ). melalui formula: wi = exp by i dimana y i =logit (p i ).
Sedangkan untuk level unit,
(5.35)
diasumsikan memiliki hubungan dengan logit
(p ij ) melalui formula:
wij = exp dy ij dimana y ij =logit (p ij ),
(5.36)
oleh karena itu koefisien z i dan x ij pada persamaan (5.6) dan (5.12) diambil sama dengan nol. Jika seluruh area kecil dalam populasi dibedakan atas area yang terambil sebagai contoh dan yang tidak terambil sebagai contoh, maka dengan menggunakan formula (5.29) dan (5.30), sebagai contoh diduga dengan:
73
parameter area ke-i yang terambil
µˆ s ,i = φi ( yi − xi'βˆ ) + (1 − φi )( µˆ ) + (1 − φi )bσ µ2 − φi dσ e2
(5.37)
sedangkan pendugaan parameter untuk area yang tidak terambil sebagai contoh:
µˆ c , j = µˆ −
bσ µ2 exp(bµˆ + 0.5b 2σ µ2 )
(5.38)
1 − exp(bµˆ + 0.5b 2σ µ2 )
dimana dan
.
5.4.3. Metode Pendugaan Parameter Area Kecil menggunakan Model Linier Campuran Terbobot Dengan memperhatikan peluang penarikan contoh, pengaruh bobot penarikan contoh untuk pendugaan area kecil diwujudkan dalam model-logit normal terbobot mengacu kepada cara Rao (2003) yang dinyatakan dalam persamaan (5.31). Dalam penelitian ini bobot tiap individu yang berada pada klasifikasi ke j pada area ke-i adalah w ij , sehingga model SAE untuk y ij =logit (p ij ) terbobot adalah:
wij yij = wij ( xijT β + µ i + eij ) = xiwT β + µ i + eiw dimana
[
yij = log it ( pij ) = log pij /(1 − pij )
]
(5.39)
eiw = wij eij ,
dan
E (eiw ) = 0 ,
V (eiw ) = σ e2 ∑ wij2 = σ e2δ iw j
Pendugaan parameter pada model (5.39) menggunakan metode KMB yang diterapkan untuk model linier logistik terbobot. ~ ~
~
µ~ij = XTi β + γ i ( yia − xiaT β )
dimana
(5.40)
µ~ij = log it pij .
' Prediksi yang diperoleh adalah y ij terbobot yaitu yˆ ij = wij yˆ ij , sehingga ' penduga y ij tanpa bobot adalah yˆ ij = yˆ ij / wij . Selanjutnya pendugaan area kecil
menggunakan pendekatan Bayes seperti yang dijelaskan pada persamaan (3.25) 5.4.4. Evaluasi Terhadap Penduga Evaluasi
terhadap
kualitas
penduga
didasarkan
pada
besarnya
simpangan dari nilai dugaan terhadap nilai parameter populasi yang diukur dari
74
Rata-rata Bias Relatif (RBR), Akar dari Rata-rata Kuadrat Bias Relatif (ARKBR) dan Kuadrat Tengah Galat (KTG): (5.41) (5.42) .
(5.43)
5.4.5. Simulasi Dalam rangka mengevaluasi sifat
penduga, maka dilakukan studi
simulasi dengan mengambil salah satu kecamatan di Kabupaten Sumenep yaitu kecamatan Lenteng yang terdiri dari 16 blok sensus dengan jumlah penduduk 48.696 jiwa. Jumlah penduduk berusia 10 tahun keatas 48.282 jiwa, teridiri dari 22.762 laki-laki dan 25.520 perempuan. Jumlah penduduk berusia 10 tahun ke atas di tiap blok sensus sangat bervariasi, yaitu antara 559 jiwa sampai 7110 jiwa. Proporsi penduduk yang bisa baca tulis sekitar 74%, untuk laki-laki sebesar 80,53% dan perempuan hanya 69,32%.
1)
Proses Penarikan contoh dan penentuan bobot Pada survai Susenas, blok sensus dipilih secara acak dengan peluang
proportional to size, oleh karena itu blok sensus merupakan area kecil yang diamati. Dalam simulasi ini, metode penarikan contoh dilakukan
sesuai dengan
metode Susenas yaitu penarikan contoh dua tahap dimana pada tahap pertama dipilih 5 blok sensus secara pps (Probability Proportional to Size) dengan size banyaknya rumah tangga hasil senarai SP2010 (N i ) dan pada tahap kedua, dari setiap blok sensus terpilih dipilih sejumlah 16 rumah tangga biasa secara acak berdasarkan hasil listing SP2010. Penarikan contoh diulang sebanyak 100 kali Fraksi penarikan contoh pada tahap pertama sesuai dengan persamaan (5.34) dan untuk tahap kedua sesuai dengan persamaan (5.35), yaitu: •
Tahap pertama, peluang terambilnya contoh area (blok sensus) tertentu adalah
dimana N i adalah jumlah populasi pada blok sensus
ke i dan N adalah jumlah populasi di seluruh kecamatan. •
Tahap kedua, peluang terambilnya contoh dia area ke-i adalah
75
2) Pendugaan Area Kecil Sesuai dengan proses yang telah dijelaskan pada sub bab 5.3, pendugaan parameter model dilakukan dengan 3 cara yaitu: a. Dengan menggunakan model SAE dengan tidak memperhitungkan bobot seperti pada
persamaan (3.23). Pendugaan proporsi di area kecil
menggunakan pendekatan Bayes dengan mengaplikasikan formula Bayes seperti yang ditunjukkan oleh persamaan (3.25) b. Dengan memperhitungkan bobot penarikan contoh yang diasumsikan memiliki hubungan eksponensial seperti ditunjukkan oleh persamaan (5.35) dan (5.36). Pendugaan area kecil menggunakan rumus (5.37) dan (5.38) c. Dengan memperhitungkan bobot penarikan contoh seperti ditunjukkan oleh persamaan (5.39) Evaluasi
terhadap
kualitas
penduga
didasarkan
pada
besarnya
simpangan dari nilai dugaan terhadap nilai parameter populasi yang diukur dengan RBR, ARKBR dan KTG seperti pada rumus (5.41), (5.42) dan (5.43). 3)
Hasil Simulasi Nilai dugaan angka melek huruf (proporsi penduduk usia 10 tahun ke atas
yang bisa baca tulis) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep seperti dijelaskan pada Tabel 5.2 dan dalam bentuk grafik ditunjukkan pada Gambar 5.1. Gambar 5.2 menjelaskan besarnya bias dugaan dari masingmasing metode. Gambar 5.1 maupun Gambar 5.2 menunjukkan bahwa metode pendugaan parameter melalui pendekatan Bayes dengan menggunakan model logit normal campuran terbobot memberikan hasil yang terbaik. Sedangkan untuk pendugaan parameter yang menyertakan fungsi peluang dalam bentuk eksponensial memliki bias yang lebih besar.
76
1 0,95 0,9 0,85 0,8 0,75 0,7 0,65 0,6 0,55 0,5
Dugaan Angka Melek Huruf
1
3
5
7
9
11
Populasi Model logit normal Tanpa Bobot
13
15
17
Model Eksponensial Model Logit normal dengan bobot
Gambar 5.1 Plot hasil simulasi pendugaan p i (angka melek huruf) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep 0,500
Bias Dugaan Angka Melek Huruf
0,400 0,300 0,200 0,100 0,000 -0,100
1
3
5
7
9
11
13
15
17
-0,200
Bias Model Eksponensial Bias Model logit normal Tanpa Bobot Bias Model Logit normal dengan bobot
Gambar 5.2 Plot hasil simulasi bias pendugaan p i untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep Hasil simulasi ini juga menunjukkan bahwa model logit normal campuran terbobot dengan pendekatan Bayes memberikan nilai ARKBR dan KTG paling kecil yaitu sebesar 0,0107 dibandingkan metode yang lain (lihatTabel 5.1). Namun hasil perhitungan nilai rata-rata bias relatif (RBR) lebih tinggi dibandingkan dengan dengan SAE
yang menyertakan model peluang
eksponensial. Tingginya nilai KTG untuk model SAE eksponensial tersebut disebabkan karena bias pada area (blok sensus) ke-7 sangat tinggi dan model
77
nilai pendugaan dari hasil simulasi lebih menyebar dibandingkan dengan metode yang lain .
Tabel 5.1. Nilai rata-rata bias relatif dan rata-rata kuadrat bias relatif untuk model terbobot dan model eksponensial pˆ EB KTG RBR RKBR Model Logit Normal Model Logit Normal Terbobot (W) Model Eksponensial Populasi
0,824 0,835 0,740 0,741
0,0203 0,0107 0,1172
0,1122 0,0414 -0,0009
0,1430 0,1298 0,2266
Tabel 5.2. Hasil Simulasi Dugaan p i (proporsi penduduk usia 10 tahun ke atas yang bisa baca tulis) untuk tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep ModelCampuran Logit Normal Tanpa Bobot
Model Campuran Logit Normal Terbobot
ModelEksponensial
Populasi
pˆ EB -TB
pˆ EB -B
pˆ EB - Exp
p
1
0.910
0.899
0.890
0.882
2
0.863
0.773
0.942
0.735
3
0.885
0.844
0.905
0.818
4
0.885
0.887
0.925
0.868
5
0.817
0.866
0.791
0.754
6
0.803
0.671
0.894
0.618
7
0.871
0.616
0.948
0.515
8
0.849
0.779
0.879
0.723
9
0.869
0.930
0.800
0.828
10
0.819
0.859
0.790
0.737
11
0.797
0.810
0.640
0.726
12
0.822
0.868
0.732
0.757
13
0.857
0.944
0.691
0.828
14
0.803
0.810
0.553
0.707
15
0.753
0.668
0.794
0.613
0.821 0.844 0.848 Angka Melek Huruf Kecamatan Lenteng
0.758
Blok
16
0.741
5.4.6. Aplikasi : Pendugaan Angka Melek Huruf di Kabupaten Sumenep dan Kabupaten Pasuruan Provinsi Jawa Timur Berdasarkan hasil simulasi, metode terbaik untuk pendugaan parameter proporsi adalah model logit normal terbobot dimana pendugaan parameter area dilakukan melalui pendekatan Bayes. Selanjutnya metode tersebut digunakan untuk menduga angka melek huruf di Kabupaten Sumenep dan Pasuruan. Hasil
78
pendugaan parameter model SAE dengan menggunakan metode PQL dapat dilihat pada Tabel 5.3 Gambar 5.3. menunjukkan hasil dugaan angka melek huruf di Kabupaten Sumenep dan Kabupaten Pasuruan. Prediksi angka melek huruf di kabupaten Sumenep adalah 0,8189 dimana nilai parameter populasi 0,7589.
0,15
0,90
0,10 0,05 B i 0,00 a -0,05 s -0,10
Proporsi
0,80 0,70 0,60
190 40 150 230 60 140 180 100 20 70 220 80 160
0,20 1,00
-0,15 0,50
-0,20
0,40
-0,25 10 30 50 70 90 110 130 150 170 190 210 230 241
-0,30 Kode Kecamatan
Kode Kecamatan Populasi
rata-rata bias = -0.0628
Model Bobot
(a) Nilai parameter vs dugaan angka melek huruf
(b) Nilai bias dugaan angka melek huruf
1,0000
0,6
0,9000
0,5
0,8000
0,4
Kec. Beji
140
190
230
100
60
20
-0,2
Kode Kecamatan Populasi
130
10 30 50 70 90 110 130 150 170 200 220 240
-0,1
90
0,4000
200
0,5000
70
0,6000
110
0,3 B i 0,2 a 0,1 s 0
0,7000
50
Proporsi
Gambar 5.3 Nilai dugaan, parameter populasi dan bias dugaan angka melek huruf di Kabupaten Sumenep
-0,3
Model Bobot
Kode Kecamatan
rata-rata bias = 0.0136
(a) Nilai parameter vs dugaan angka melek huruf
(b) Nilai bias dugaan angka melek huruf
Gambar 5.4. Nilai dugaan, parameter populasi dan bias dugaan angka melek huruf di Kabupaten Pasuruan
79
Sedangkan untuk kabupaten Pasuruan, nilai prediksinya adalah 0,8808 dengan nilai parameter populasi: 0,9044. Terlihat bahwa perbedaan antara nilai dugaan dan nilai parameter populasi relatif sangat kecil, artinya Model Logit Normal Terbobot dapat menghasilkan bias yang sangat kecil. Nilai KTG untuk dugaan tersebut adalah 0,0149 untuk Kabupaten Sumenep dan untuk Kabupaten Pasuruan sedikit lebih besar yaitu 0,0202. Tingginya nilai KTG di Kabupaten Pasuruan disebabkan karena bias dugaan yang relatif tinggi di salah satu kecamatan yaitu di Kecamatan Tosari karena proporsi penduduk berusia 10 tahun keatas yang bisa baca tulis di kecamatan tersebut sangat rendah dibandingkan dengan kecamatan yang lain yaitu hanya sekitar 50%.
5.5.
Model SAE Berbasis Penarikan Contoh Berpeluang Tidak Sama Untuk Peubah Respon Multinomial
5.5.1. Pengembangan model SAE: Model Campuran Logit Multinomial Terbobot Sebaran marjinal dari setiap komponen multinomial y ik adalah binomial:
yik ~ B(ni , pik ) . Jika X ik merupakan vektor kovariat tetap dan diasumsikan tidak tidak tergantung pada i dan k, maka model linier yang didasarkan pada rasio
q −1
k =1
θik = log( pik / piq ) = log pik / 1 − ∑ pik seperti yang dinyatakan oleh persamaan
(4.2) adalah θ ik = x ik β k + uik , untuk i=1,....m dan k=1,....q Hasil pengembangan model SAE untuk respon binomial sebelumnya telah disimpulkan bahwa model SAE terbaik untuk respon binomial yang menyertakan peluang penarikan contoh adalah model campuran logit-normal terbobot. Oleh karena itu dalam penelitian ini, bobot peluang juga diperhitungkan dalam model SAE untuk peubah respon multinomial. Bobot peluang diberikan kepada setiap unit percobaan sehingga pada model SAE yang dijelaskan oleh persamaan (4.2) adalah wik = ∑ wijk / nik dimana w ijk adalah bobot pengamatan ke j pada katagori j
.
ke k di area ke i. Sehingga model SAE untuk logit (p ik ) terbobot dari peubah respon multinomial adalah: y = w y = w [x β + u + e ] ikw ik ik ik ik k ik ik
80
(5.52)
q −1 dimana y = log p / p = log p / 1 − ∑ p dari percontohan. ik ik ik ik iq k =1
Selanjutnya pendugaan parameter model dilakukan dengan metode PQL dan REML sama seperti pada pendugaan parameter model SAE untuk respon binomial untuk memperoleh pendugaan βˆ
kw
dan σˆ
kυw
dari model terbobot.
Untuk X ik , yaitu peubah penyerta dari populasi diketahui, maka nilai dugaan dari logit
(p ikw )
adalah
θˆ
ikw
= X βˆ + u . ik kw ik
Untuk
mendapatkan
nilai
θˆ = log p / p maka θˆ dikalikan dengan kebalikan bobot untuk setiap ik ikw ik iq katagori yaitu 1/w ik . Pendugaan parameter model (5.22) menggunakan metode PQL yang diterapkan untuk model linier logistik terbobot. Prediksi yang diperoleh adalah y ik terbobot yaitu
yˆ ' = w yˆ , sehingga penduga y ik tanpa bobot adalah ik ik ik
yˆ = yˆ ' / w . Selanjutnya pendugaan area kecil menggunakan pendekatan ik ik iw Bayes seperti yang dijelaskan pada persamaan (3.25) yaitu dengan menduga komponen yik* dari persamaan pik = f ik yik + (1 − f ik ) yik . p ik adalah proporsi unit *
populasi pada katagori ke-k di area ke-i yang dinyatakan sebagai jumlah dari komponen percontohan dan komponen bukan percontohan dimana f ik = n ik /N ik adalah fraksi percontohan untuk katagori ke k.
yik
adalah rata-rata contoh (proporsi) di area ke i dan katagori ke k
y ik*
adalah rata-rata dari unit-unit yang tidak diambil contohnya pada katagori ke-k dalam area i
* Pendugaan y ik diturunkan dengan cara yang sama dengan penduga
Bayes untuk model SAE dengan peubah respon multinomial pada Bab IV yaitu dengan persamaan (4.8).
Penduga Bayes empirik untuk p ik (proporsi pada
katagori ke k di area ke i) yaitu p EB = pˆ B ( βˆ ,σˆ ) ik ik υ Pendugaaan KTG ( pˆ EB ) dilakukan dengan metode Jackknife seperti ki yang dilakukan pada pendugaan SAE untuk peubah respon Binomial pada Bab III atau respon multinomial tanpa bobot pada Bab IV yaitu dengan menggantikan
81
pˆ EB = k ( y , µˆ , σˆ ) ik ik ik
dan
pˆ EB = k ( y , µˆ , σˆ ) dalam persamaan (4.5) ik ,−l ik ik − l − l
sampai dengan persamaan (4.6) untuk memperoleh Mˆ dan Mˆ . Dengan 1ik 2ik demikian nilai KTG
untuk pendugaan pada katagori ke k dan area ke-i
KTG ( pˆ EB ) = Mˆ + Mˆ . ki 1ik 2ik 5.5.2. Aplikasi: Pendugaan Rata-rata Lama Sekolah di Tingkat Kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan. Model SAE untuk respon multinomial terbobot seperti dijelaskan oleh persamaan (5.22) diaplikasikan untuk menghitung rata-rata lama sekolah kecamatan di Kabupaten Sumenep dan Kabupaten Pasuruan. Pendugaan ratarata lama sekolah di tiap kecamatan didasarkan pada model area kecil yaitu blok sensus. Melalui pendekatan Bayes, dengan menggunakan rumus (3.25), nilai penduga proporsi penduduk di tiap jenjang pendidikan dan rata-rata nilai KTG berdasarkan model SAE yang diperoleh ditunjukkan oleh Lampiran 17 dan Lampiran 19 dan secara grafis ditunjukkan oleh Gambar 5.5 dan Gambar 5.6. Dalam satu kecamatan, proporsi penduduk di tiap jenjang pendidikan relatif sama dari satu blok sensus ke blok sensus yang lain relatif homogen, sehingga dengan metode Jackknife, penduga KTG relatif sangat kecil
yaitu
untuk Kabupaten Sumenep antara 3,9 x 10-11 sampai 1,2 x10-5, sedangkan untuk Kabupaten Pasuruan antara 1,31. 10-11 sampai 1,37. 10-3. Gambar 5.7 menunjukkan rata-rata lama sekolah di tiap kecamatan berdasarkan model SAE logit multinomial terbobot. Untuk Kabupaten Sumenep, rata-rata lama sekolah antara 3.99 tahun sampai 8,36 tahun dan di Kabupaten Pasuruan antara 4,11 tahun sampai 10,97 tahun.
Beberapa kecamatan di
Kabupaten Sumenep dan Pasuruan bahkan memiliki rata-rata lama sekolah relatif rendah yaitu sekitar 4 tahun.
82
Dugaan proporsi di tiap jenjang pendidikan Kab. Sumenep (dengan pembobotan) 0,7000
Dugaan KTG (dengan pembobotan) 9,00E-05
0,6000
8,00E-05 7,00E-05 6,00E-05
0,4000
MSE
Proporsi
0,5000
0,3000
5,00E-05 4,00E-05 3,00E-05
0,2000
2,00E-05 0,1000
1,00E-05
240
210
180
150
90
120
70
10
10 30 50 70 80 100 120 140 160 180 200 220 240 250
40
0,00E+00
0,0000
Kecamatan
Tidak SekolahKecamatan Putus SD SD SMP SMA PT
Tidak Sekolah SD SMA
Putus SD SMP PT
Gambar 5.5. Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan tertentu dan dugaan KTG menggunakan model SAE logit multinomial terbobot di Kabupaten Sumenep
MSE Pendugaan Tingkat Pendidikan Kab. Pasuruan (dengan pembobotan)
0,9000
9,00E-03
0,8000
8,00E-03
0,7000
7,00E-03
0,6000
6,00E-03 5,00E-03
MSE
Proporsi
Pendugaan Tingkat Pendidikan Kab. Pasuruan (dengan pembobotan)
0,5000
4,00E-03
0,4000
3,00E-03
0,3000
2,00E-03
0,2000
1,00E-03
0,1000
0,00E+00
10 30 50 70 90 110 130 150 170 190 210 230
10 30 50 70 90 110 130 150 170 190 210 230
0,0000
Kecamatan Tidak Sekolah SD SMA
Kecamatan Tidak Sekolah SD SMA
Putus SD SMP PT
Putus SD SMP PT
Gambar 5.6. Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan tertentu dan dugaan KTG menggunakan model SAE logit multinomial terbobot di Kabupaten Pasuruan
83
Rata-rata Lama Sekolah di tiap kecamatan, Kabupaten Sumenep
Rata-rata Lama Sekolah di tiap kecamatan ,Kabupaten Pasuruan 10,500
9,500
9,500
8,500
7,887,95
7,68
7,23 7,11 6,94 6,84
6,500
7,18 7,14 6,81
5,68 5,37
5,500
5,68 5,48
5,51
4,84
4,66
4,500
6,98 6,72
6,38
6,31
8,500
8,46 8,318,27 7,99
7,49
Tahun
7,500 Tahun
9,32
8,36
7,68
7,26
6,500
6,61 6,46 6,38 6,16 6,215,97
6,29 5,535,62 5,30
5,500
4,66
4,15
7,500
4,500
4,11
3,99
5,03
4,65 4,45
5,41 4,60
3,500 10 30 50 70 90 110 130 150 170 190 210 230
240
210
180
150
120
90
70
40
10
3,500
Kecamatan
Kecamatan
Gambar 5.7 Nilai dugaan rata-rata lama sekolah menggunakan model SAE logit multinomial terbobot di Kabupaten Sumenep dan Pasuruan
5.6.
Perhitungan Pasuruan
Indeks
Pendidikan
di
Kabupaten
Sumenep
dan
Berdasarkan prediksi angka melek huruf dan rata-rata lama sekolah, berikut ini dihitung nilai Indeks Pendidikan di tiap kecamatan menggunakan rumus sebagai berikut: Indeks Pendidikan = 2/3 I MH +1/3 IRLS dimana: Indeks AMH/RLS: (X i – X min )/ (X max – X min ) AMH: Angka melek huruf
IMH: Indeks melek huruf
RLS: Rata-rata lama sekolah
IRLS : Indeks Rata-rata lama sekolah
Dalam bentuk grafik nilai indeks pendidikan di tiap kecamatan dikabupaten Sumenep dan Pasuruan dapat dilihat pada Gambar 5.8. Sedangkan dalam peta tematik indeks pendidikan di Kabupaten Sumenep dan pasuruan ditunjukkan pada Gambar 5.9. dan Gambar 5.10.
84
Kabupaten Pasuruan
Indeks
90,00 80,00 70,00 60,00 50,00 40,00 30,00 20,00 10,00 0,00
90,00 80,00 70,00 60,00 50,00 40,00 30,00 20,00 10,00 0,00
10 40 70 100 130 160 190 220 241
Indeks
Kabupaten Sumenep
10 40 70 100 130 160 200 230
Kecamatan
Kecamatan
Gambar 5.8. Prediksi Indeks Pendidikan di kabupaten Sumenep dan Kabupaten Pasuruan menggunakan model SAE
Gambar 5.9. Peta Tematik Indeks Pendidikan di kabupaten Sumenep
85
Gambar 5.10. Peta Tematik Indeks Pendidikan di kabupaten Pasuruan
5.7.
Pembahasan
5.7.1. Model SAE untuk respon Binomial dengan memperhitungkan peluang penarikan contoh. Hasil simulasi menunjukkan bahwa metode pendugaan area kecil menggunakan sebaran prior logit normal melalui pendekatan Bayes empirik yang dikembangkan dengan memperhitungkan peluang penarikan contoh memberikan penduga parameter proporsi area kecil yang paling baik karena dapat menurunkan bias dan KTG dari penduga. Sementara itu metode pendugaan area kecil yang dikembangkan berdasarkan penarikan contoh informatif yaitu dengan menyertakan model peluang penarikan contoh dalam bentuk fungsi eksponensial memberikan rata-rata bias relatif yang rendah namun memberikan akar rata-rata kuadrat bias relatif maupun KGT yang lebih tinggi dibandingkan dengan metode pendugaan menggunakan sebaran prior logit normal terbobot. Besarnya nilai KTG lebih banyak disebabkan karena ragam pendugaan yang relatif besar sehingga walaupun memberikan bias yang kecil maka KTG akan cenderung tinggi. Penurunan bias dari model SAE eksponensial ini menunjukkan
86
bahwa memperhitungkan peluang penarikan contoh dalam model SAE akan dapat menurunkan bias. Pfefferman (2010) mengatakan bahwa mengabaikan peluang penarikan contoh dalam model SAE akan menghasilkan bias pendugaan karena dengan mengabaikan peluang penarikan contoh, maka pendugaan parameter model untuk area/unit yang terambil sebagai contoh sama dengan area/unit yang tidak terambil sebagai contoh. Dengan mengaplikasikan model SAE logit normal terbobot melalui pendekatan Bayes, dihasilkan perbedaan antara nilai parameter populasi dengan prediksinya relatif kecil, rata-rata bias relatif mutlak untuk Kabupaten Sumenep 0,0628 dengan KTG sebesar 0,0149. Untuk Kabupaten Pasuruan, rata-rata bias relatif mutlak adalah 0,0136 dengan nilai KTG sebesar 0,0202. Oleh karena itu, berdasarkan hasil simulasi maupun aplikasi di Kabupaten Sumenep dan Pasuruan menunjukkan bahwa model SAE untuk peubah respon Binomial menggunakan model campran logit normal terbobot memberikan hasil yang paling akurat dalam pendugaan parameter proporsi area kecil. 5.7.2. Model SAE untuk respon Multinomial dengan memperhitungkan peluang penarikan contoh. Oleh karena model campuran logit normal terbobot memberikan hasil yang paling baik pada pendugaan area kecil untuk respon binomial, maka diterapkan cara yang sama pada pendugaan area kecil untuk respon multinomial. Untuk Kabupaten Sumenep, nilai pendugaan rata-rata lama sekolah antara 3,99 tahun sampai 8,36 tahun. Untuk Kabupaten Pasuruan rata-rata lama sekolah antara 4,11 tahun sampai 10,92 tahun. Nilai dugaan KTG menggunakan metode Jackknife relatif sangat kecil, tertinggi adalah 0,00137 karena pada umumnya kondisi blok sensus di tiap kecamatan relatif sama. Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau heterogenitas dari nilai respon dari area yang satu ke area yang lain.
87
BAB VI Pembahasan
6.1.
Pendahuluan Model pendugaan area kecil untuk respon Binomial dan Multinomial pada
dasarnya dikembangkan dari model SAE untuk data biner, dimana peubah yang diamati hanya memiliki dua kemungkinan nilai yaitu 1 (jika berada pada katagori tertentu yang menjadi perhatian) dan 0 (jika tidak berada dalam katagori tertentu yang menjadi perhatian).
Selanjutnya jika peubah yang diperhatikan adalah
jumlah kejadian tertentu yang diperhatikan maka peubah tersebut akan mengikuti sebaran
Binomial dengan parameter p yaitu proporsi kejadian dalam tiap n
contoh. Pendugaan parameter proporsi p dapat dilakukan melalui dua pendekatan yaitu pendekatan klasik dan Bayes. Pendugaan proporsi melalui pendekatan Bayes dapat dilakukan secara langsung yang dilakukan dengan mengasumsikan bahwa parameter tersebut berasal dari suatu distribusi tertentu yang disebut distribusi prior. Distribusi atau sebaran prior yang sering digunakan untuk menduga parameter Binomial adalah sebaran prior Beta
yang merupakan conjugate dari fungsi massa peluang
Binomial dan sebaran prior logit normal, dimana peubah respon ditransormasikan dalam fungsi logit. Pendugaan area kecil berbasis pada data biner, baik untuk peubah respon Binomial maupun multinomial menggunakan metode tak tangsung atau berbasis model menggunakan sebaran prior logit normal. Pengembangan model SAE untuk respon binomial dan multinomial dalam penelitian ini dilakukan dengan memperhatikan peluang penarikan contoh. 6.2.
Perbandingan metode pendugaan langsung dan tak langsung untuk pendugaan area kecil melalui pendekatan Bayes Pendugaan proporsi di area kecil melalui pendekatan Bayes dapat
dilakukan dengan dua cara yaitu pendugaan langsung dan tak langsung yaitu berbasis
model.
Perbandingan kualitas penduga didasarkan pada dua
pendekatan yang telah dibahas pada Bab III melalui studi kasus pendugaan
88
angka melek huruf di tingkat kecamatan dengan menyertakan dua peubah penyerta yaitu usia dan jenis kelamin. Model SAE untuk peubah respon Binomial melalui pendekatan Bayes didasarkan pada sebaran prior logit normal. Pendugaan SAE tersebut merupakan model campuran logit normal dimana pendugaan parameter yang sering dipakai oleh para peneliti adalah
metode
Penalized Quasi-Likelihood (PQL) dan pendugaan ragam dengan pendekatan ML dan/atau REML. Melalui pendekatan bayes yaitu dengan menggunakan metode Bayes Empirik, metode pendugaan langsung dengan sebaran prior Beta dan sebaran prior logit normal memberikan hasil yang hampir sama dengan metode pendugaan langsung secara klasik karena bobot untuk komponen populasi terlalu kecil sehingga sebaran prior tidak terlalu berpengaruh kepada penduga Bayes.. Untuk sebaran prior Beta, nilai dugaan α dan β relatif kecil dibandingkan dengan jumlah contoh di tiap area (n i ) sehingga bobot untuk y i
(
yaitu
)
γˆi = ni / ni + αˆ + βˆ sangat besar, sekitar 0.905 untuk Kabupaten Sumenep dan sekitar 0,827 untuk Kabupaten Pasuruan. Nilai KTG pendugaan langsung cenderung tinggi, baik untuk pendugaan berbasis sebaran prior Beta maupun sebaran logit normal, sedangkan untuk pendugaan tak langsung melalui model SAE
berbasis unit dengan peubah
respon logit (p ij ) dan sebaran prior logit normal cenderung memberikan nilai KTG yang jauh lebih baik dapat dilihat dari rata-rata KTG pendugaan angka melek huruf
kecamatan
di
Kabupeten
Sumenep
dan
kabupaten
Pasuruan
menggunakan model SAE yang paling kecil dibandingkan kedua metode pendugaan langsung. Karena bobot untuk komponen model lebih dominan yaitu karena fraksi percontohan (sampling fraction), f i =n i /N i , relatif kecil maka keberadaan peubah penyerta yaitu usia dan jenis kelamin sangat berpengaruh pada pendugaan parameter area kecil p i . Dari kajian tersebut diperoleh kesimpulan bahwa metode pendugaan tak tangsung menghasilkan kualitas penduga yang lebih baik, artinya keberadaan peubah penyerta dapat meningkatkan kualitas penduga terutama dapat menurunkan ragam penduga sedangkan untuk pendugaan langsung, karena jumlah contoh relatif kecil cenderung memberikan ragam yang besar. Model SAE untuk respon Binomial melalui pendekatan Bayes yang dibahas pada Bab III tidak memperhitungkan peluang percontohan dari data yang digunakan.
89
6.3.
Pengaruh peluang penarikan contoh dalam Model SAE untuk respon Binomial dalam peningkatan kualitas penduga. Pada Bab V dibahas pengembangan model SAE untuk respon Binomial
dengan memperhitungkan penarikan contoh dimana pendugaan parameter area melalui pendekatan Bayes. Pengembangan model SAE yang memperhatikan peluang penarikan contoh agar dapat diaplikasikan untuk menduga angka melek huruf atau parameter lain yang berasal dari sebaran Binomial di area kecil di Indonesia dengan menggunakan data Susenas tanpa menambah jumlah contoh. Dengan memperhatikan peluang penarikan contoh, area kecil yang digunakan adalah blok sensus. Dilakukan studi simulasi di salah satu kecamatan (Kecamatan Lenteng, Kabupaten Sumenep) dengan mengaplikasikan tiga model SAE, yaitu model SAE melalui pendekatan Bayes Empirik tanpa menyertakan bobot peluang, model SAE logit normal terbobot dan model SAE yang menyertakan bobot peluang penarikan contoh sebagai fungsi eksponensial dari karakteristik area atau unit. Hasil simulasi menunjukkan bahwa metode pendugaan area kecil menggunakan model SAE logit normal terbobot memberikan penduga parameter proporsi area kecil yang paling baik karena menurunkan besarnya KTG dan bias dalam
pendugaan.
Metode pendugaan area kecil yang
dikembangkan
berdasarkan percontohan informatif dimana peluang percontohan merupakan fungsi eksponensial memberikan rata-rata bias relatif
rendah namun
menghasilkan KTG lebih tinggi dibandingkan dengan metode pendugaan menggunakan sebaran prior logit normal terbobot (Lihat Tabel 6.1).
Hal ini
disebabkan adanya penambahan ragam yang disebabkan oleh penambahan model peluang penarikan contoh dalam model SAE. Aplikasi model campuran logit normal terbobot untuk menduga angka melek huruf di kabupaten Sumenep dan Pasuruan juga membuktikan bahwa metode tersebut menghasilkan rata-rata bias relatif dan KTG yang relatif kecil, yaitu untuk Kabupaten Sumenep sebesar 0,0628 dan nilai KTG sebesar 0,0149 dan untuk Kabupaten Pasuruan sebesar 0,0136 dengan KTG sebesar 0,0202.
90
Tabel 6.1. Perbandingan kualitas penduga untuk model SAE untuk respon Binomial dengan dan tanpa memperhatikan peluang penarikan contoh.
pˆ EB
Rata-rata Bias relatif
KTG
Model Logit Normal
0,8240
O,1122
0,0204
Model Logit Normal Terbobot
0,8350
0,0414
0,0107
Model Eksponensial
0,7400
-0,0009
0,1172
• Kabupaten Sumenep
0,8189
-0,0628
0,0149
• Kabupaten Pasuruan
0,8808
0,0136
0,0202
• Kabupaten Sumenep
0,7589
• Kabupaten Pasuruan
0,9044
Model SAE
Simulasi
Model Logit Normal Terbobot Aplikasi
Populasi
Dengan mengabaikan peluang penarikan contoh, maka pendugaan parameter
dengan mengasumsikan bahwa model berdasarkan
percontohan
sama dengan model dari komplemen percontohan Oleh karena itu mengabaikan peluang percontohan akan menghasilkan penduga yang bias (Pfefferman 2010).. Dari
hasil
simulasi
terlihat
bahwa
pendugaan
berbasis
model
tanpa
memperhitungkan peluang penarikan contoh menghasilkan bias sekitar 0,1122 sementara dengan memperihutngkan penarikan contoh turun menjadi hanya 0.0414 untuk model logit normal terbobot dan 0,0009 untuk model eksponensial. 6.4.
Pengembangan model SAE berbasis pada peubah respon Multinomial dengan penarikan contoh berpeluang tidak sama Model SAE berbasis sebaran multinomial yang dikembangkan dalam
penelitian ini mengacu pada penelitian yang telah dilakukan oleh Molina et al. (2007) dan Scealy (2010). Untuk pendugaan parameter model Scealy (2010) mengaplikasikan metode KQB, pendekatan
KM dan/atau
KMB. Pendugaan
area kecil menggunakan pendekatan Bayes seperti yang dilakukan untuk model SAE dengan respon Binomial. Dalam aplikasi, peubah penyerta yang digunakan yaitu usia dan jenis kelamin dimana pengaruh peubah penyerta terhadap peubah respon pada model SAE dengan peubah respon multinomial dibedakan atas katagori. Untuk model SAE tanpa memperhitungkan peluang penarikan contoh
yang telah dibahas
pada bab IV, berdasarkan aplikasi pada pendugaan rata-rata lama sekolah di kecamatan di kabupaten pasuruan dan Sumenep menghasilkan nilai dugaan
91
koefisien untuk peubah penyerta usia, parameter β positif untuk katagori 1 (tidak pernah bersekolah) dan 2 (putus sekolah dasar), namun untuk jenjang pendidikan lebih tinggi menghasilkan nilai dugaan β negatif. Sedangkan untuk peubah penyerta jenis kelamin, penduga β di katagori 3 (lulus SD) di kabupaten Sumenep
negatif
sedangkan untuk katagori yang lain positif. Hal ini
menunjukkan bahwa pada kelompok tersebut proporsi laki-laki yang lulus SD lebih kecil dibandingkan perempuan. Beberapa dengan Kabupaten Pasuruan, nilai dugaan β untuk katagori 3,4 dan 5 (lulus SD, SLTP dan SLTA ) semuanya negatif yang menunjukkan bahwa tingkat pendidikan perempuan lebih tinggi dibandingkan laki-laki. Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada heterogenitas dari nilai dugaan proporsi dari area ke area. Semakin heterogen (seperti pada jenjang pendidikan SD), maka akan menghasilkan nilai dugaan KTG yang cenderung lebih besar. Hal yang sama juga ditemui pada pendugaan area kecil yang memperhitungkan peluang penarikan contoh.
Dengan
menggunakan metode Jackknife, hasil penduga KTG untuk logit multinomial terbobot melalui pendekatan Bayes juga memberikan nilai penduga KTG yang sangat kecil. Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau heterogenitas dari nilai respon dari area yang satu ke area yang lain.
92
BAB VII Kesimpulan Dan Saran
7.1.
Kesimpulan Melalui pendekatan Bayes Empirik , metode pendugaan langsung dengan
menggunakan sebaran prior Beta dan sebaran prior logit normal memberikan hasil yang hampir sama dengan metode pendugaan langsung secara klasik karena bobot untuk komponen populasi terlalu kecil sehingga sebaran prior tidak terlalu berpengaruh kepada penduga Bayes. Dengan menggunakan sebaran prior logit normal, pendugaan area kecil menggunakan metode pendugaan tak tangsung menghasilkan kualitas penduga yang lebih baik, artinya
keberadaan peubah penyerta dapat meningkatkan
kualitas penduga terutama dapat menurunkan ragam penduga sedangkan untuk pendugaan langsung, karena jumlah contoh relatif kecil cenderung memberikan ragam yang besar Melalui pendekatan Bayes, model SAE untuk respon Binomial yang dikembangkan
dengan
memperhitungkan
peluang
penarikan
contoh
menghasilkan penduga dengan kualitas yang lebih baik yaitu memberikan bias dan nilai KTG yang sangat kecil. Penyertaan peluang penarikan contoh dalam bentuk fungsi eksponensial pada model SAE
menghasilkan penduga yang
memiliki bias sangat kecil namun menghasilkan KTG yang relatif lebih tinggi dibandingkan dengan model SAE berdasarkan model campuran logit normal terbobot.
Oleh karena itu, melalui pendekatan Bayes, model campuran logit
normal terbobot menghasilkan kualitas penduga yang lebih baik dibandingkan dengan model SAE yang menyertakan fungsi eksponensial
dari peluang
penarikan contoh. Melalui pendekatan bayes, model SAE berbasis sebaran multinomial berdasarkan model campuran logit normal terbobot memberikan penduga dengan KTG yang sangat kecil yaitu pada kisaran antara 1,3 x 10-11 sampai 1,37 x10-3 Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada heterogenitas
nilai dugaan proporsi dari area ke area. semakin heterogen
93
(seperti pada jenjang pendidikan SD), maka akan menghasilkan nilai dugaan KTG yang cenderung lebih besar. Hal yang sama juga ditemui pada pendugaan area kecil yang memperhitungkan peluang penarikan contoh. 7.2.
Saran Dalam penelitian ini pengembangan model SAE untuk respon Binomial
maupun Multinomial yang memperhitungkan peluang penarikan contoh adalah dengan memberikan bobot pada unit percontohan dan dengan menyertakan model eksponsial dari peluang penarikan contoh dalam model SAE. Pendugaan parameter model SAE menggunakan metode PQL dan REML dimana metode tersebut masih memungkinkan adanya bias dalam pendugaan. Oleh karena itu masih terbuka untuk mengembangkan metode pendugaan dengan cara yang lain. Besarnya KTG yang dihasilkan oleh metode SAE yang menyertakan fungsi eksponensial dari peluang percontohan perlu dikaji lebih dalam karena bias yang dihasilkan relatif sangat kecil sehingga kemungkinan besarnya KTG disebabkan oleh ragam pendugaan yang besar. Perlu dikembangkan model yang serupa tetapi dapat menurunkan ragam.
94
Daftar Pustaka Arora V dan Lahiri P. 1997. On the Superiority of the Bayesian Method over the BLUP in Small Area Estimation Problems. Statistica Sinica, 7, 1053–1064. BPS dan UNFPA. 1998. Pemantauan Perkembangan Kesejahteraan Rakyat, Pemanfaatan Data Susenas dan Data Sosial Kependudukan lainnya, Badan Pusat Statistik. Jakarta BPS. 2005. Kumpulan Metodologi Survei Sosial Tahun 2003-2005. Jakarta : Badan Pusat Statistik (BPS). BPS. 2010.
Metodologi Survei Sosial Ekonomi Nasional 2010 Badan Pusat
Statistik. Jakarta Boonstra HJ, Buelens B, Leufkens K and Smeets M 2011. Small Area Estimates of Labour Status in Dutch Municipalities.
Statistics Netherlands: The
Hague/Heerlen Chen CX, Lumley T dan Wakefield J. 2010. The use os sampling in Bayesian Hierarchical Models for Small Area Estimation. Technical Report no 583. Department of Statistics University of Washington, Seatle, Washington, USA Chandra H, Chambers R, dan Salvati N. 2009.
Small Area Estimation of
Proportions in Business Survey. Working Paper. Centre for Statistical and Survey Methodology The University of Wollongong. Clarke P, Curtis D, Misoulis N dan Cruddas M.2006. Small Area Estimation of Unemployment for Parliamentary Constituencies. 10th Meeting of the National Statistics Methodology Advisory Committee Cochran WG. 1977. Sampling Technique, 3rd ed, New York; Wiley Eideh A, Nathan G. 2009. Two-stage informative cluster sampling—estimation and prediction with applications for small-area models. Journal of Statistical Planning and Inference 139 Fay R E dan Herriot RA. 1979. Estimates of income for small places1 an application of James-Stein procedures to census data. Journal of the American Statistical Association 74, 269- 277. Ghosh M dan Rao JNK. 1994. Small area estimation: an appraisal. Statistical Sciences 9, 55-93.
95
Ghosh M, Natarajan K, Stroud TWF dan Carlin BP. 1998. Generalized linear models for small-area estimation. Journal of the American Statistical Association 93, 273-282. Gonzalez-Manteiga W, Lombardia MJ, Molina I, Morales D dan Santamaria L. 2007. Estimation of the mean squared error of predictors of small area linear parameters under a logistic mixed model. Computational Statistics and Data Analysis, 51, 2720-2733. Harville DA. 1990. Discussion on Robinson paper. That BLUP is a good thing: the estimation of random effects. Statistical Science. 6, 15-51. Henderson CR. 1975. Best linear unbiased estimation and prediction under selection model. Biometrics 31, 423-447. Jiang J dan Lahiri P. 2001. Empirical Best Prediction for Small area inference with binary data, Annals of the Institute of Statistical Mathematics, 53, 217243 Jiang J, Lahiri P dan Wan SM. 2002. A Unified Jackknife Theory. Annals of Statistics, 30, in press. Kurnia A dan Notodiputro KA. 2007. Pengaruh Misspesifikasi Desain Survey Pada Pendugaan Area Kecil Dengan Pendekatan Generalized Regression. Seminar Nasional Matematika dan Pendidikan Matemática, 24 November 2007, Universitas Negeri Yogyakarta, Kurnia A., Notodiputro, K.A. and Ibrahim,N.A. 2007. A Nonparametric Approach in Small Area Estimation. Proceeding at the ICCS-IX, 12 - 14 December 2007. Universiti of Malaya, Shah Alam –Malaysia
Kurnia A. 2009. Prediksi Terbaik Empirik untuk Model Transformasi Logaritma di Dalam Pendugaan Area Kecil dengan Penerapan Pada Data Susenas. Disertasi. Sekolah Pasca Sarjana IPB, Bogor.
Kott PS. 1990. Robust small domain estimation using random effects modeling. Survey Methodology 15, 3-12. 1 Lehtonen R, Myrskylä M, Särndal CE dan Veijanen A. 2009. Estimation for domains and small areas under unequal probability sampling
96
Maiti T.1998. Hierarchical Bayes estimation of mortality rates for disease mapping. Journal Statistical Planning and Inference 69, 339-348. Malec D, Sedransk J, Moriarity CL dan Leclere FB. 1997. Small area inference for binary variables in the National Helath Interview Survey. Journal of the American Statistical Association 92: 815-826. McCulloch CE. and Searle SR. 2001. Generalized, Linear, and Mixed Models. New York: John Wiley & Sons, Inc. Molina I, Saei A dan Lombardia MJ. 2007. Small Area Estimates of Labour Force Participation under a Multinomial Logit Mixed Model. Journal of the Royal Statistical Society; Series A (Statistics in Society), 170 (4), pp.975-1000 Pfeffermann D, Krieger A M, Rinot Y. 1998. Parametric Distributions of complex survey data under informative probability sampling. Statistica Sinica 8,1087-1114 Pfeffermann D, Sverchkov M. 2007. Small area estimation using informative probability sampling of areas and within the selected areas. Journal of the American Statistical Association 102: 1427–1439. Pfeffermann D and Sverchkov M .2010. Small Area Estimation Under Informative Sampling. S3RI Methodology Working Paper M03/22, Southampton Science Research Institute. Prasad NGN dan Rao JNK. 1990. The Estimation of Mean Squared Errors of Small Area Estimators. Journal of American Statistical Association, 85, 163-171. Rao JNK. 2003. Small Area Estimation. New York : John Wiley and Sons. Robinson GK.1991. That BLUB Is a Good Thing: The Estimation of Random Effects. Statistical Science,6, 15-31. Rumiati AT, Sutikno dan Desi S.2002. Penyusunan IPM Kabupaten Probolinggo. Bappeda Kabupaten Probolinggo. Rumiati AT, Sutikno dan Desi S. 2007. Penyusunan IPM Kabupaten Sumenep. Bappeda Kabupaten Sumenep. Rumiati AT, Sutikno dan Desi S. 2009. Penyusunan IPM Kabupaten Tuban Bappeda Kabupaten Tuban.
97
Sadik K. 2009. Metode Prediksi Tak-bias Linier Terbaik dan Bayes Berhirarki Untuk Pendugaan Area Kecil Berdasarkan Model State Space. Disertasi. Sekolah pasca Sarjana IPB, Bogor. Scealy J. 2010. Small Area Estimation Using a Multinomial Logit Mixed Model with Category Specific Random Effects. Australian Bureau of Statistics and Australian National University UNDP. 1990. Concept and Measurement of Human Development. Human Development Report You Y dan Rao JNK. 2000. Hierarchical Bayes estimation of small area means using multi-level models. Survey Methodology, 26 173-181. You Y dan Rao JNK. 2002. A Pseudo-Empirical Best Linear Unbiased Prediction Approach to Small Area Estimation Using Survey Weights, Canadian Journal of Statistic, 30: 431-439. Vizcaino EL, Cortina MJL dan Gonzalez D M. 2011. Multinomial-based small area estimation of labour force indicators in Galicia. X Congreso Galego de Estatistica e Investigacion de Operacions. Pontevedra, 3-4-5 de Novembro de 2011.
98
Lampiran 1. Program SAS untuk pendugaan model SAE data bobot; input blok wi; datalines; 1 5.029 ... 19 9.852 20 7.900 ; data baca; input blok gender usia logit; datalines; 5 1 1 11.513 ... 15 2 4 -1.099 ; title 'Model tanpa Bobot'; proc mixed data=baca noclprint covtest scoring; class blok; model logit=gender usia/s outpm=d ddfm=kenwardroger ddfm=residual; random intercept/sub=blok; run; title 'Model dengan Bobot'; data bbaca; merge baca bobot; by blok; gender=gender*wi; usia=usia*wi; logit=logit*wi; if logit^=. then output; keep blok gender usia logit; run; proc mixed data=bbaca noclprint covtest scoring; class blok; model logit=gender usia/s outpm=d ddfm=kenwardroger ddfm=residual; random intercept/sub=blok; run; *) Base SAS and SAS/STAT software. Two versions of the %GLIMMIX macro are available, one for use with Version 6.12 of the SAS System, one for use with Version 8 or later. Save the %GLIMMIX macro definition. Replace the text within quotes in the following statement with the location of the %GLIMMIX macro definition file on your system. In your SAS program or in the SAS editor window, specify this statement to define the %GLIMMIX macro and make it available for use: %inc "";
By default, %GLIMMIX uses restricted/residual psuedo likelihood (REPL). The default is PQL with an extra-dispersion parameter to find the parameter estimates of the generalized linear mixed model you specify. The macro calls PROC MIXED iteratively until convergence, which is decided using the relative deviation of the variance/covariance parameter estimates. An extra-dispersion scale parameter is estimated by default.
100
Lampiran 2. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan langsung melalui sebaran prior logit normal function [pEB,MSE]=bayeslogit(phat,n,y) %function 'bayeslogit' adalah pendugaan bayes metode pendugaan langsung dengan menggunakan %prior Normal fungsi logit. % Input yang dibutuhkan adalah 'phat', 'n', 'y' %'phat' adalah proporsi penduduk yang bisa membaca didapatkan dari sampel berupa % konstanta; %'n' adalah vektor yang berisi ukuran sampel dalam tiap kecamatan, misalkan % banyak kecamatan adalah m maka ukuran vektor 'n' adalah mx1; %'y'adalah vektor yang berisi jumlah penduduk yang bisa membaca ukuran %vektor 'y' sama dengan vektor 'n'; %Output dari function ini adalah MSE berupa vektor berukuran mx1 dan %penduga Bayes dari prior Normal fungsi logit (pEB) %menghitung banyak kecamatan m=length(n); %mencari nilai rata-rata logit (a) dan standard deviasi logit (b) [a,b]=prior(phat,n,y); %mencari vektor penduga Bayes (pEB) dan vektor g [pEB,g]=Z(phat,n,y,a,b); %menghilangkan kecamatan ke-l for l=1:m j=1; for i=1:m if i~=l nl(j,1)=n(i,1); yl(j,1)=y(i,1); j=j+1; else j=j; end end %mencari parameter prior dari hasil eliminasi [a,b]=prior(phat,nl,yl); %menghitung penduga Bayes berdasarkan parameter eliminasi [pEBl(:,l),gl(:,l)]=Z(phat,n,y,a,b); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2;
101
end function [miu,sigma]=prior(phat,n,y) %function 'prior' digunakan untuk menduga parameter dari logit m=length(n); %mencari logit for i=1:m n1=n(i,1);y1=y(i,1); p1=y1/n1;logit(i,1)=log(p1/(1-p1)); end; miu=mean(logit);%perhitungan rata-rata logit sigma=std(logit);%perhitungan standard deviasi logit end function [pEB,g]=Z(phat,n,y,miu,sigma) %function 'Z' digunakan untuk mencari penduga Bayes menggunakan prior %Normal fungsi logit m=length(n); z=randn(500,1); %membangkitan 500 data ~N(0,1) for i=1:m n1=n(i,1);y1=y(i,1); p1=y1/n1;p(i,1)=p1; for j=1:500 par=miu+sigma*z(j,1); h1=exp(par)/(1+exp(par)); h2=par*y1-n1*log(1+exp(par)); nz=(1/(2*pi))*exp(-1/2*((z(j,1)^2))); A(j,1)=h1*exp(h2)*nz; B(j,1)=exp(h2)*nz; end EA=mean(A); EB=mean(B); pEB(i,1)=EA/EB; %menghitung penduga Bayes g(i,1)=((y1+miu)*(n1-y1+sigma))/ ((miu+n1+sigma+1)*((miu+n1+sigma)^2)); end end
102
Lampiran 3. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan langsung melalui sebaran prior beta function [ pEB,MSE ] = bayesbeta(phat,n,y) %function 'bayesbeta' adalah pendugaan pendugaan langsung dengan menggunakan %prior beta.
bayes
metode
% Input yang dibutuhkan adalah 'phat', 'n', 'y' %'phat' adalah proporsi penduduk yang bisa membaca didapatkan dari sampel berupa % konstanta; %'n' adalah vektor yang berisi ukuran sampel dalam tiap kecamatan, misalkan % banyak kecamatan adalah m maka ukuran vektor 'n' adalah mx1; %'y'adalah vektor yang berisi jumlah penduduk yang bisa membaca ukuran %vektor 'y' sama dengan vektor 'n'; %Output dari function ini adalah MSE berupa vektor berukuran mx1 dan %penduga Bayes dari prior Beta (pEB) %menghitung banyak kecamatan m=length(n); %mencari nilai alpha (a) dan beta (b) [a,b]=prior(phat,n,y); %mencari penduga Bayes (pEB) dan nilai g [pEB,g]=B(phat,n,y,a,b); %menghilangkan kecamatan ke-l for l=1:m j=1; for i=1:m if i~=l nl(j,1)=n(i,1); yl(j,1)=y(i,1); j=j+1; else j=j; end end [a,b]=prior(phat,nl,yl); [pEBl(:,l),gl(:,l)]=B(phat,n,y,a,b); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m
103
M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2; end function [a,b]=prior(phat,n,y) %function 'prior' adalah fungsi yang bertujuan mencari nilai alpha (a) dan %beta(b) pada pendugaan bayes metode pendugaan langsung dengan menggunakan %prior beta. %menghitung jumlah sampel total nt=sum(n); %menghitung banyak kecamatan m=length(n); %menghitung nilai sp square sp2=0; for i=1:m n1=n(i,1);y1=y(i,1); p1=y1/n1;p(i,1)=p1; sp=(n1/nt)*((p1-phat)^2); sp2=sp2+sp; end; %menghitung nilai a dan b berdasarkan 2 persamaan yang telah ditentukan per6=(nt*sp2-phat*(1-phat)*(m-1))/(phat*(1-phat)*(ntsum(n.^2)/(nt-(m-1)))); d=solve('(a/(a+b))-phat','(1/(a+b+1))-per6','a','b'); a=subs(subs(d.a,'phat',phat),'per6',per6); b=subs(subs(d.b,'phat',phat),'per6',per6); end function [pEB,g]=B(phat,n,y,a,b) %function 'B' adalah fungsi untuk menghitung penduga Bayes (pEB) dengan menggunakan %prior beta. m=length(n); for i=1:m y1=y(i,1);n1=n(i,1);p1=y1/n1;p(i,1)=p1; g(i,1)=((y1+a)*(n1-y1+b))/((a+n1+b+1)*((a+n1+b)^2)); gm(i,1)=n1/(n1+a+b); pEB(i,1)=gm(i,1)*p(i,1)+(1-gm(i,1))*phat;%menghitung penduga Bayes end; end
104
Lampiran 4. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan tak langsung (berbasis model) melalui sebaran prior logit normal tanpa bobot function [pEB,MSE,p]=bayesunit(N,D,k,x,y,B,sig) m=length(N); %mengubah bentuk x [a,b]=size(x); c(:,1)=ones(a,1); for i=1:b c(:,i+1)=x(:,i); end x=c; %mengubah bentuk k q=length(x); t=1; k1(1,1)=t; for h=2:q if k(h,1)==k(h-1,1) k1(h,1)=t; else t=t+1; k1(h,1)=t; end end k=k1; %mencari vektor penduga Bayes (pEB) dan vektor g [pEB,g,p]=U(N,D,k,x,y,B(:,1),sig(1,1)); %menghilangkan kecamatan ke-l for l=1:m %menghitung penduga Bayes berdasarkan parameter eliminasi [pEBl(:,l),gl(:,l)]=U(N,D,k,x,y,B(:,l+1),sig(l+1,1)); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2; end function [pEB,g,p]=U(N,D,k,x,y,B,sig) m=length(N); z=randn(500,1); %membangkitan 500 data ~N(0,1) A1=zeros;A12=zeros;B1=zeros; for i=1:m [q,w]=size(x);j=1; xa=zeros(1,w);ya=zeros; for h=1:q if k(h,1)==i xa(j,:)=x(h,:);
105
ya(j,1)=y(h,1); j=j+1; end end n1=j-1;N1=N(i,1); f1=n1/N1;Y1=sum(ya);D1=D(i,1); [s,t]=size(xa);miu=xa*B; v=(1-(D1/(sig+D1)))*(ya-miu); sigv=std(v); xy=xa'*ya; for j=1:500 par=miu+sigv*z(j,1); h1=0;h2b=0;h12=0;h13=0; for u=1:s par1=par(u,:); h1=h1+(exp(par1)/(1+exp(par1))); h13=h13+((exp(par1)/(1+exp(par1)))*1(exp(par1)/(1+exp(par1)))); h12=h12+((exp(par1)/(1+exp(par1)))^2); h2b=h2b+(log(1+exp(par1))); end h2=xy'*B+sigv*z(j,1)*Y1-h2b; nz=(1/sqrt(2*pi))*exp(-1/2*((z(j,1)^2))); A1(j,1)=h1*exp(h2)*nz;A13(j,1)=h13*exp(h2)*nz; A12(j,1)=h12*exp(h2)*nz; B1(j,1)=exp(h2)*nz; end EA(i,1)=mean(A1);EA1=mean(A12);EB(i,1)=mean(B1);EA2=mean(A13 ); pEB(i,1)=f1*(Y1/n1)+(1-f1)*(1/s)*(EA(i,1)/EB(i,1)); %menghitung penduga Bayes v(i,1)=(EA1/EB(i,1))-(EA(i,1)/EB(i,1))^2; g(i,1)=(N1^-2)*((EA2/EB(i,1))+v(i,1)); end miu1=x*B; for u=1:q miu2=miu1(u,:); h1=(exp(miu2)/(1+exp(miu2))); p(u,i)=h1; end end
106
Lampiran 5. Program Matlab untuk perhitungan pendugaan area kecil melalui pendugaan tak langsung melalui sebaran prior logit normal dengan memperhitungkan bobot peluang function [pEB,MSE,p]=bayesunit(N,D,k,x,y,B,sig,w) m=length(N); %mengubah bentuk x [a,b]=size(x); c(:,1)=ones(a,1); for i=1:b c(:,i+1)=x(:,i); end x=c; %mengubah bentuk k q=length(x); t=1; k1(1,1)=t; for h=2:q if k(h,1)==k(h-1,1) k1(h,1)=t; else t=t+1; k1(h,1)=t; end end k=k1; %mencari vektor penduga Bayes (pEB) dan vektor g [pEB,g,p]=U(N,D,k,x,y,B(:,1),sig(1,1),w); %menghilangkan kecamatan ke-l for l=1:m %menghitung penduga Bayes berdasarkan parameter eliminasi [pEBl(:,l),gl(:,l)]=U(N,D,k,x,y,B(:,l+1),sig(l+1,1),w); deltag(:,l)=gl(:,l)-g; deltap(:,l)=pEBl(:,l)-pEB; end %perhitungan MSE for i=1:m M1(i,1)=g(i,1)-((m-1)/m)*sum(deltag(i,:)); M2(i,1)=((m-1)/m)*sum(deltap(i,:).^2); end MSE=M1+M2; end function [pEB,g,p]=U(N,D,k,x,y,B,sig,w) m=length(N); z=randn(500,1); %membangkitan 500 data ~N(0,1) A1=zeros;A12=zeros;B1=zeros; for i=1:m [q,w]=size(x);j=1; xa=zeros(1,w);ya=zeros; for h=1:q if k(h,1)==i
107
xa(j,:)=x(h,:); ya(j,1)=y(h,1); wa(j,1)=w(h,1); j=j+1; end end n1=j-1;N1=N(i,1); f1=n1/N1;Y1=sum(ya);D1=D(i,1); xa1(:,1)=xa(:,1); xa1(:,2)=xa(:,2).*wa; xa1(:,3)=xa(:,3).*wa; [s,t]=size(xa);miu=(xa1*B)./wa; v=(1-(D1/(sig+D1)))*(ya-miu); sigv=std(v); xy=xa'*ya; for j=1:500 par=miu+sigv*z(j,1); h1=0;h2b=0;h12=0;h13=0; for u=1:s par1=par(u,:); h1=h1+(exp(par1)/(1+exp(par1))); h13=h13+((exp(par1)/(1+exp(par1)))*1(exp(par1)/(1+exp(par1)))); h12=h12+((exp(par1)/(1+exp(par1)))^2); h2b=h2b+(log(1+exp(par1))); end h2=xy'*B+sigv*z(j,1)*Y1-h2b; nz=(1/sqrt(2*pi))*exp(-1/2*((z(j,1)^2))); A1(j,1)=h1*exp(h2)*nz;A13(j,1)=h13*exp(h2)*nz; A12(j,1)=h12*exp(h2)*nz; B1(j,1)=exp(h2)*nz; end EA(i,1)=mean(A1);EA1=mean(A12);EB(i,1)=mean(B1);EA2=mean(A13 ); pEB(i,1)=f1*(Y1/n1)+(1-f1)*(1/s)*(EA(i,1)/EB(i,1)); %menghitung penduga Bayes v(i,1)=(EA1/EB(i,1))-(EA(i,1)/EB(i,1))^2; g(i,1)=(N1^-2)*((EA2/EB(i,1))+v(i,1)); end miu1=x*B; for u=1:q miu2=miu1(u,:); h1=(exp(miu2)/(1+exp(miu2))); p(u,i)=h1; end end
108
Lampiran 6. Jumlah penduduk usia 10 tahun keatas berdasarkan data sensus dan susenas serta jumlah blok sensus di tiap kecamatan di Kabupaten Sumenep
Kode
Kecamatan
Jumlah blok sensus (populasi)
Jumlah blok sensus percontohan (Susenas)
Sensus
Susenas
10
Pragaan
14
4
51657
157
20
Bluto
20
2
38456
88
30
Saronggi
14
1
29270
41
40
Giligenteng
8
1
22340
43
50
Talango
8
3
32439
134
60
Kalianget
7
2
32884
99
70
Kota Sumenep
20
5
58880
261
71
Batuan
7
0
10154
0
80
Lenteng
20
3
48282
146
14
3
31254
117 45
90
Ganding
100
Guluk Guluk
12
1
44010
110
Pasongsongan
10
2
36302
85
120
Ambunten
15
1
31347
44
130
Rubaru
11
2
31008
92
140
Dasuk
15
1
25583
50
150
Manding
11
1
24230
42
160
Batuputih
14
2
37334
81
170
Gapura
17
2
32170
70
180
Batang
16
2
44897
88
190
Dungkek
15
2
32105
79
200
Nonggunong
8
1
11686
33
210
Gayam
10
2
28939
75
220
Ra'As
9
2
30428
71
230
Sapeken
9
2
33763
99
240
Arjasa
25
3
49728
130
241
Kangayan
8
1
17074
33
250
Masalembu
1
17783
52
4
109
Lampiran 7. Jumlah penduduk usia 10 tahun keatas berdasarkan data sensus dan susenas serta jumlah blok sensus di tiap kecamatan di Kabupaten Pasuruan
10
Purwodadi
13
Jumlah blok sensus percontohan (Susenas) 2
20
Tutur
12
30
Puspo
40
Tosari
50
Kode
Kecamatan
Jumlah blok sensus (populasi)
Sensus
Susenas
54636
91
1
44136
41
7
1
22478
45
8
2
15607
92
Lumbang
12
1
27863
39
60
Pasrepan
17
2
41914
89
70
Kejayan
25
1
50967
56
80
Wonorejo
15
3
45738
143
90
Purwosari
15
3
64165
134
100
Prigen
14
2
69430
95
110
Sukorejo
19
4
67012
175
120
Pandaan
18
4
87397
180
130
Gempol
15
4
101608
191
140
Beji
14
3
64587
137
150
Bangil
15
3
65835
137
160
Rembang
17
1
48850
54
170
Kraton
25
4
66710
191
180
Pohjentrek
9
0
22888
0
190
GondangWetan
20
3
41788
145
200
Rejoso
16
1
35718
51
210
Winongan
28
1
33833
33
220
Grati
15
3
62221
132
230
Lekok
11
3
56191
155
240
Nguling
15
2
46354
77
110
Lampiran 8. Hasil Pendugaan Paramater pi (proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis) dan KTG untuk masingmasing kecamatan di Kabupaten Sumenep
No
Kecamatan
Pendekatan Bayes
Pendekatan Klasik Logit
Beta
Model Logit
KM
pEB Logit
KTG logit
pEB Beta
KTG beta
pEB Model
KTG Model
1
Pragaan
0,8521
0,8468
0,0011
0,8484
0,00086
0.911
0,0053
2
Bluto
0,9348
0,9123
0,0009
0,9228
0,00075
0.927
0,0039
3
Saronggi
0,8272
0,8234
0,0019
0,8231
0,00165
0.758
0,0109
4
Giligenteng
0,8684
0,8472
0,0036
0,8535
0,00278
0.960
0,0013
5
Talango
0,5802
0,6075
0,0035
0,5976
0,00283
0.911
0,0180
6
Kalianget
0,8615
0,8488
0,0022
0,8529
0,00175
0.945
0,0093
7
Kota Sumenep
0,8571
0,8507
0,0011
0,8529
0,00090
0.965
0,0005
8
Batuan
0,7865
0,7896
0,0020
0,7860
0,00175
9
Lenteng
0,7375
0,7489
0,0026
0,7412
0,00220
0.669
0,0109
10
Ganding
0,7556
0,7634
0,0023
0,7575
0,00189
0.851
0,0066
11
Guluk Guluk
0,6696
0,6812
0,0023
0,6767
0,00186
0.928
0,1210
12
Pasongsongan
0,6489
0,6643
0,0029
0,6589
0,00226
0.881
0,0813
13
Ambunten
0,6750
0,6916
0,0029
0,6842
0,00251
0.812
0,0460
14
Rubaru
0,7010
0,7141
0,0022
0,7068
0,00200
0.863
0,0726
15
Dasuk
0,8372
0,8274
0,0034
0,8285
0,00282
0.866
0,0754
16
Manding
0,8837
0,8691
0,0016
0,8752
0,00119
0.937
0,1241
17
Batuputih
0,3950
0,4413
0,0093
0,4184
0,00213
0.510
0,0153
18
Gapura
0,6429
0,6609
0,0032
0,6544
0,00253
0.789
0,0273
19
Batang Batang
0,6437
0,6609
0,0031
0,6548
0,00244
0.665
0,0140
20
Dungkek
0,6471
0,6644
0,0031
0,6581
0,00248
0.765
0,0172
21
Nonggunong
0,8462
0,8327
0,0037
0,8352
0,00297
0.611
0,0091
22
Gayam
0,8806
0,8637
0,0020
0,8702
0,00154
0.679
0,0131
23
Ra'As
0,8977
0,8809
0,0014
0,8883
0,00106
0.897
0,00006
24
Sapeken
0,9412
0,9194
0,0008
0,9299
0,00063
0.981
0,0001
25
Arjasa
0,9874
0,9625
0,0004
0,9778
0,00016
0.825
0,0043
26
Kangayan
0,8919
0,8622
0,0033
0,8726
0,00257
0.757
0,0063
27
Masalembu
0,8108
0,8085
0,0042
0,8055
0,00352
0.832
0,0045
111
Lampiran 9. Hasil Pendugaan Paramater pi (proporsi penduduk berusia 10 tahun ke atas yang bisa baca tulis) dan KTG untuk masing-masing kecamatan di Kabupaten Pasuruan Pendekatan Klasik
Pendekatan Bayes
10
Purwodadi
0.912
Beta pEB KTG Beta Brta 0.9116 0.0007
20
Tutur
0.927
0.9214
0.0012
0.9229
0.0018
0,933
0,11890
30
Puspo
0.756
0.7990
0.0029
0.8138
0.0042
0,785
0,04028
40
Tosari
0.935
0.9306
0.0006
0.9304
0.0007
0,968
0,00052
50
Lumbang
0.923
0.9187
0.0013
0.9209
0.0020
0,958
0,13149
60
Pasrepan
0.843
0.8537
0.0012
0.8601
0.0016
0,849
0,00584
70
Kejayan
0.982
0.9645
0.0005
0.9521
0.0006
0,984
0,16321
80
Wonorejo
0.958
0.9526
0.0003
0.9485
0.0003
0,970
0,00000
90
Purwosari
0.985
0.9762
0.0002
0.9655
0.0002
0,979
0,00040
100
Prigen
0.926
0.9236
0.0006
0.9249
0.0008
0,958
0,00168
110
Sukorejo
0.931
0.9294
0.0003
0.9295
0.0004
0,978
0,00023
120
Pandaan
0.944
0.9413
0.0003
0.9399
0.0003
0,973
0,00090
130
Gempol
0.969
0.9635
0.0002
0.9580
0.0002
0,982
0,00024
140
Beji
0.942
0.9379
0.0004
0.9366
0.0004
0,980
0,00042
150
Bangil
0.971
0.9637
0.0002
0.9567
0.0003
0,980
0,00036
160
Rembang
0.815
0.8382
0.0020
0.8490
0.0028
0,857
0,07384
170
Kraton
0.880
0.8821
0.0005
0.8863
0.0006
0,928
0,00343
190
GondangWetan
0.924
0.9225
0.0004
0.9237
0.0005
0,946
0,00173
200
Rejoso
0.961
0.9474
0.0008
0.9409
0.0009
0,984
0,15661
210
Winongan
0.879
0.8894
0.0020
0.8987
0.0032
0,914
0,10660
220
Grati
0.886
0.8891
0.0007
0.8944
0.0008
0,881
0,00392
230
Lekok
0.755
0.7707
0.0011
0.7781
0.0016
0,842
0,00752
240
Nguling
0.714
0.7508
0.0023
0.7596
0.0030
0,725
0,00531
Kecamatan
KM
112
Logit (direct) pEB KTG Logit logit 0.9152 0.0009
Model Logit pEB KTG Model Model 0,966 0,00109
Lampiran 10. Hasil pendugaan proporsi pada tiap tingkat pendidikan tertinggi di Kabupaten Sumenep
10
Pragaan
0,1504
0,0417
0,4259
0,2708
0,0628
0,0484
Ratarata Lama Sekolah 5,77
20
Bluto
0,1134
0,0603
0,3943
0,1947
0,1967
0,0405
6,40
30
Saronggi
0,2819
0,1111
0,3317
0,1420
0,1039
0,0295
4,59
40
Giligenteng
0,0869
0,0679
0,6062
0,1003
0,0846
0,0540
5,68
50
Talango
0,3472
0,0859
0,2525
0,1277
0,1141
0,0726
4,76
60
Kalianget
0,0937
0,0397
0,3430
0,1769
0,2141
0,1325
7,49
70
Kota Sumenep
0,0747
0,0382
0,2240
0,1659
0,3331
0,1640
8,57
80
Lenteng
0,3419
0,0336
0,3378
0,1144
0,1209
0,0515
4,75
90
Ganding
0,2558
0,1030
0,4063
0,0918
0,0996
0,0436
4,70
100
Guluk Guluk
0,6860
0,0906
0,0918
0,0371
0,0586
0,0358
2,10
110
Pasongsongan
0,1603
0,0341
0,5457
0,1012
0,1178
0,0408
5,49
120
Ambunten
0,1952
0,0343
0,5893
0,0993
0,0460
0,0359
4,84
130
Rubaru
0,2655
0,0625
0,5239
0,0553
0,0502
0,0425
4,36
140
Dasuk
0,2706
0,0266
0,5994
0,0477
0,0266
0,0292
4,15
150
Manding
0,1067
0,0399
0,2999
0,3403
0,1678
0,0454
6,81
160
Batuputih
0,5146
0,0467
0,3448
0,0287
0,0344
0,0308
2,87
170
Gapura
0,2785
0,0868
0,3960
0,1074
0,0724
0,0588
4,66
180
Batang Batang
0,3418
0,1032
0,3852
0,0582
0,0766
0,0349
3,95
190
Dungkek
0,3004
0,0594
0,3132
0,1575
0,1239
0,0456
4,97
200
Nonggunong
0,3791
0,0326
0,4807
0,0326
0,0425
0,0326
3,67
210
Gayam
0,3244
0,0308
0,5327
0,0350
0,0445
0,0326
3,97
220
Ra'As
0,0550
0,0364
0,3971
0,3552
0,0352
0,0301
5,72
230
Sapeken
0,0520
0,0337
0,2146
0,5168
0,1367
0,0463
7,45
240
Arjasa
0,2071
0,0257
0,1120
0,3133
0,3138
0,0280
6,98
241
Kangayan
0,2194
0,0267
0,5757
0,1091
0,0425
0,0267
4,66
250
Masalembu
0,1494
0,0814
0,5228
0,0463
0,1538
0,0463
5,51
Kecamatan
Proporsi penduduk berusia 10 tahun keatas tiap kategori jenjang pendidikan 1
2
3
4
5
6
113
Lampiran 11. Hasil pendugaan KTG untuk pendugaan proporsi penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Sumenep Kecamatan
KTG dari penduga area kecil untuk tiap kategori 1
2
3
4
5
6
10
Pragaan
6,33E-10
1,29E-10
2,92E-09
1,27E-09
1,69E-10
1,29E-10
20
Bluto
3,14E-10
1,78E-10
3,53E-09
4,07E-10
5,29E-10
1,07E-10
30
Saronggi
1,39E-09
3,97E-10
1,70E-09
4,67E-10
3,08E-10
8,75E-11
40
Giligenteng
6,32E-10
4,20E-10
5,39E-09
4,18E-10
3,18E-10
2,05E-10
50
Talango
1,77E-09
2,96E-10
1,31E-09
4,98E-10
2,19E-10
1,40E-10
60
Kalianget
4,88E-10
3,37E-10
2,99E-09
2,02E-09
2,28E-09
1,40E-09
70
Kota Sumenep
3,40E-10
2,15E-10
1,71E-09
1,35E-09
2,59E-09
1,29E-09
90
Ganding
1,96E-09
9,12E-11
2,05E-09
4,37E-10
2,78E-10
1,30E-10
100
Guluk Guluk
1,40E-09
3,06E-10
2,92E-09
3,36E-10
3,42E-10
1,53E-10
110
Pasongsongan
9,88E-09
1,50E-09
1,64E-09
2,07E-09
1,97E-09
1,22E-09
120
Ambunten
1,78E-10
8,62E-10
5,64E-09
5,47E-10
5,01E-10
1,74E-10
130
Rubaru
7,50E-10
1,94E-09
6,68E-09
1,59E-09
1,88E-09
2,40E-09
140
Dasuk
9,75E-10
7,28E-10
5,32E-09
7,67E-10
7,82E-10
6,57E-10
150
Manding
9,16E-10
1,65E-09
6,36E-09
1,55E-09
1,65E-09
1,76E-09
160
Batuputih
1,28E-09
1,73E-09
1,51E-09
2,23E-09
4,48E-10
1,20E-10
170
Gapura
3,03E-09
6,95E-11
1,55E-09
3,76E-11
4,27E-11
3,81E-11
180
Batang Batang
1,77E-09
1,77E-11
2,99E-09
3,53E-10
1,81E-10
1,49E-10
190
Dungkek
1,50E-09
2,47E-10
2,15E-09
2,29E-11
1,14E-10
5,42E-11
200
Nonggunong
1,51E-09
8,04E-11
1,62E-09
6,58E-10
4,40E-10
1,67E-10
210
Gayam
4,80E-09
5,24E-10
2,42E-08
5,87E-11
6,58E-09
5,05E-09
220
Ra'As
1,67E-09
9,88E-10
5,21E-09
9,73E-10
9,35E-10
6,90E-10
230
Sapeken
1,85E-10
7,79E-11
2,03E-09
1,87E-09
6,86E-11
5,82E-11
240
Arjasa
4,73E-10
1,97E-10
1,05E-09
5,14E-09
5,72E-10
1,86E-10
241
Kangayan
7,44E-10
4,20E-11
2,40E-10
1,20E-09
1,23E-09
1,10E-10
250
Masalembu
7,72E-10
4,04E-11
3,75E-09
2,36E-10
6,19E-11
3,90E-11
114
Lampiran 12. Hasil pendugaan proporsi penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Pasuruan
Kecamatan
Proporsi penduduk berusia 10 tahun keatas tiap kategori jenjang pendidikan 1
2
3
4
5
6
Ratarata Lama Sekolah
10
Purwodadi
0,0461
0,0387
0,5549
0,1466
0,0500
0,1637
20
Tutur
0,0621
0,0557
0,6654
0,1325
0,0547
0,0296
5,92 6,95
30
Puspo
0,2393
0,0969
0,5685
0,0311
0,0311
0,0330
5,53
40
Tosari
0,0525
0,0669
0,6066
0,1192
0,0391
0,1156
4,11
50
Lumbang
0,0851
0,0760
0,6528
0,0959
0,0537
0,0363
6,23
60
Pasrepan
0,1561
0,1602
0,4562
0,0775
0,0419
0,1081
5,30
70
Kejayan
0,1111
0,1167
0,6709
0,0496
0,0245
0,0271
5,25
80
Wonorejo
0,0434
0,0933
0,2721
0,1760
0,0666
0,3485
4,65
90
Purwosari
0,0413
0,0713
0,3673
0,1516
0,1290
0,2396
8,74
100
Prigen
0,0659
0,0459
0,3456
0,0737
0,1267
0,3422
8,08
110
Sukorejo
0,0342
0,0827
0,2998
0,1743
0,1905
0,2184
8,76
120
Pandaan
0,0431
0,0571
0,2177
0,1337
0,1300
0,4184
8,32
130
Gempol
0,0422
0,0487
0,2319
0,2897
0,3358
0,0516
9,77
140
Beji
0,0516
0,0359
0,3694
0,2352
0,2330
0,0749
8,02
150
Bangil
0,0245
0,0351
0,1555
0,1165
0,1429
0,5255
10,07
160
Rembang
0,1821
0,1274
0,4123
0,1470
0,1046
0,0267
10,97
170
Kraton
0,1053
0,0832
0,6053
0,1228
0,0497
0,0336
5,03
190
Gondangwetan
0,0769
0,1388
0,3590
0,1649
0,1631
0,0972
5,21
200
Rejoso
0,0320
0,0964
0,4698
0,2832
0,0891
0,0295
6,60
210
Winongan
0,1179
0,1863
0,5229
0,0773
0,0549
0,0408
6,21
220
Grati
0,1125
0,0776
0,6230
0,1001
0,0424
0,0444
4,80
230
Lekok
0,1651
0,1130
0,5396
0,1166
0,0366
0,0290
5,18
240
Nguling
0,2486
0,1554
0,4245
0,1019
0,0337
0,0358
4,68
115
Lampiran 13. Hasil pendugaan KTG untuk pendugaan proporsi penduduk pada tiap tingkat pendidikan tertinggi di Kabupaten Pasuruan KTG dari penduga area kecil untuk tiap kategori jenjang -10 pendidikan (10 )
Kecamatan 1
2
3
4
5
6
10
Purwodadi
2,65E-10
2,09E-10
5,14E-09
3,38E-10
3,11E-10
1,06E-09
20
Tutur
8,84E-10
9,64E-10
8,54E-09
6,40E-10
1,01E-09
5,26E-10
30
Puspo
6,61E-10
6,01E-10
5,77E-09
8,93E-10
8,93E-10
9,39E-10
40
Tosari
4,84E-10
1,03E-09
1,20E-08
8,33E-10
2,03E-10
4,66E-10
50
Lumbang
5,56E-10
6,08E-10
8,02E-09
7,00E-10
8,47E-10
5,71E-10
60
Pasrepan
1,67E-09
1,57E-09
3,44E-09
5,34E-10
3,31E-10
8,21E-10
70
Kejayan
7,78E-10
7,98E-10
8,48E-09
1,24E-09
1,32E-09
1,55E-09
80
Wonorejo
6,22E-10
8,01E-10
3,57E-09
2,04E-09
5,85E-10
2,89E-09
90
Purwosari
2,06E-10
3,98E-10
2,87E-09
9,23E-10
3,22E-10
5,91E-10
100
Prigen
7,53E-10
6,68E-10
4,20E-09
1,16E-09
1,16E-09
3,39E-09
110
Sukorejo
1,30E-10
2,45E-10
1,29E-09
9,59E-10
1,04E-09
1,21E-09
120
Pandaan
1,93E-10
2,26E-10
9,67E-10
6,36E-10
5,88E-10
1,96E-09
130
Gempol
3,20E-11
4,69E-11
4,15E-10
8,80E-10
1,07E-09
1,69E-10
140
Beji
1,45E-10
8,17E-11
2,44E-09
9,84E-10
4,58E-10
1,42E-10
150
Bangil
2,45E-02
3,51E-02
1,55E-01
1,17E-01
1,43E-01
5,26E-01
160
Rembang
6,06E-10
1,01E-09
2,50E-09
9,06E-10
1,19E-09
2,84E-10
170
Kraton
2,13E-10
1,16E-10
3,96E-09
3,06E-10
8,44E-11
5,94E-11
190
Gondangwetan
2,59E-10
7,67E-10
1,87E-09
5,59E-10
8,26E-10
5,52E-10
200
Rejoso
1,81E-09
1,40E-09
3,98E-09
9,85E-10
1,46E-09
4,74E-10
210
Winongan
3,64E-10
1,03E-10
5,13E-09
8,47E-10
9,76E-10
7,29E-10
220
Grati
5,43E-10
2,68E-10
5,64E-09
1,50E-10
6,85E-11
1,18E-10
230
Lekok
3,69E-10
2,30E-10
3,50E-09
2,29E-10
5,19E-11
4,08E-11
240
Nguling
8,37E-10
7,11E-10
3,01E-09
4,15E-10
1,12E-10
1,18E-10
116
Lampiran 14. Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit normal terbobot dan model campuran logit normal terbbot di Kabupaten Sumenep Kecamatan Pragaan Bluto Saronggi Giligenteng Talango Kalianget Kota Sumenep Guluk Guluk Pasongsongan Ambunten Rubaru Dasuk Manding Batuputih Gapura Batang Batang Dungkek Nonggunong Gayam Ra'As Sapeken Arjasa Kangayan Masalembu Pragaan Bluto
pPopulasi 0.8458 0.8542 0.8104 0.7700 0.6610 0.8358 0.9404 0.7524 0.8522 0.8621 0.7093 0.6478 0.7136 0.7710 0.7506 0.5866 0.6568 0.5769 0.5299 0.7459 0.7104 0.8655 0.8834 0.9212 0.9243 0.7706
MSE
117
pEB
Bias
0.922 0.903 0.758 0.960 0.849 0.943 0.962 0.663 0.750 0.928 0.810 0.811 0.938 0.866 0.937 0.478 0.728 0.649 0.790 0.611 0.692 0.815 0.974 0.825 0.757 0.832 0.01498
0,0762 0,0488 -0,0524 0,19 0,188 0,1072 0,0216 -0,0894 -0,1022 0,0659 0,1007 0,1632 0,2244 0,095 0,1864 -0,1086 0,0712 0,0721 0,2601 -0,1349 -0,0184 -0,0505 0,0906 -0,0962 -0,1673 0,0614
Lampiran 15. Hasil pendugaan angka melek huruf di tiap kecamatan berdasarkan model campuran logit normal terbobot di Kabupaten Pasuruan Kecamatan Purwodadi Tutur Puspo Tosari Lumbang Pasrepan Kejayan Wonorejo Purwosari Prigen Sukorejo Pandaan Gempol Beji Bangil Rembang Kraton Gondangwetan Rejoso Winongan Grati Lekok Nguling
Populasi
pEB
Bias
0,9212
0,96
0,0388
0,9243
0,933
0,0087
0,7706
0,785
0,0144
0,831
0,968
0,137
0,78
0,958
0,178
0,8038
0,811
0,0072
0,8706
0,984
0,1134
0,8622
0,87
0,0078
0,9329
0,971
0,0381
0,9248
0,902
-0,0228
0,9104
0,987
0,0766
0,9618
0,936
-0,0258
0,9513
0,94
-0,0113
0,9684
0,436
-0,5324
0,9804
0,959
-0,0214
0,8634
0,857
-0,0064
0,8937
0,975
0,0813
0,9345
0,87
-0,0645
0,959
0,984
0,025
0,8877
0,914
0,0263
0,9124
0,87
-0,0424
0,803
0,768
-0,035
0,8834
0,579
-0,3044
0.02020
MSE
118
Lampiran 16. Hasil pendugaan proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Sumenep Proporsi 1
2
3
4
5
6
Ratarata
Pragaan
0.1039
0.0462
0.4106
0.2741
0.1217
0.0435
6.309
Bluto
0.0936
0.0657
0.2666
0.1676
0.0966
0.3099
8.362
Saronggi
0.1124
0.2176
0.3504
0.1629
0.1124
0.0442
5.368
Giligenteng
0.0869
0.0679
0.6062
0.1003
0.0846
0.0540
5.683
Talango
0.6046
0.0886
0.2169
0.0890
0.0658
0.1353
4.660
Kalianget
0.1634
0.0503
0.4462
0.1651
0.2399
0.0648
7.231
Kota Sumenep
0.0410
0.0261
0.6453
0.0566
0.0414
0.1895
6.936
Kecamatan
Batuan Lenteng
0.2367
0.0243
0.2297
0.0952
0.0808
0.3333
7.681
Ganding
0.0664
0.0664
0.5168
0.0927
0.0664
0.2018
7.114
Guluk Guluk
0.1650
0.1244
0.2733
0.1347
0.1989
0.1037
6.385
Pasongsongan
0.0558
0.0460
0.5792
0.0893
0.0561
0.1737
6.837
Ambunten
0.1955
0.0343
0.5889
0.0994
0.0460
0.0360
4.835
Rubaru
0.1593
0.0506
0.3617
0.0606
0.0665
0.3013
7.495
Dasuk
0.2707
0.0266
0.5994
0.0477
0.0266
0.0292
4.146
Manding
0.1067
0.0399
0.2999
0.3403
0.1678
0.0454
6.806
Batuputih
0.4107
0.0345
0.2533
0.0222
0.0246
0.2547
5.477
Gapura
0.2838
0.0624
0.3424
0.0775
0.0487
0.1851
5.677
Batang
0.2390
0.0686
0.2736
0.0301
0.0567
0.3320
7.184
Dungkek
0.0648
0.0655
0.5039
0.0903
0.0648
0.2106
7.140
Nonggunong
0.3490
0.0374
0.5039
0.0427
0.0471
0.0373
3.995
Gayam
0.1897
0.0172
0.3559
0.0228
0.0360
0.3785
7.880
Ra'As
0.0629
0.0483
0.3562
0.2218
0.0346
0.1852
6.719
Sapeken
0.0502
0.0375
0.1905
0.4548
0.1681
0.0989
7.949
Arjasa
0.2071
0.0257
0.1120
0.3134
0.3137
0.0280
6.976
Kangayan
0.2193
0.0267
0.5756
0.1091
0.0425
0.0267
4.659
Masalembu
0.1494
0.0814
0.5229
0.0463
0.1537
0.0463
5.510
119
Lampiran 17. Penduga KTG untuk penduga proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Sumenep Kecamatan
MSE 1
2
3
4
5
6
Pragaan
3.18E-07
8.31E-09
5.19E-08
2.66E-08
2.94E-09
1.14E-09
Bluto
3.13E-09
5.47E-09
5.52E-09
3.55E-09
1.89E-09
4.32E-09
Saronggi
1.29E-06
4.85E-06
1.24E-05
2.70E-06
1.29E-06
5.08E-07
Giligenteng
8.16E-07
5.02E-07
3.69E-05
1.04E-06
7.41E-07
4.73E-07
Talango
3.51E-07
4.51E-08
1.08E-07
4.31E-08
2.94E-08
6.82E-08
Kalianget
2.82E-06
1.02E-06
1.53E-05
1.00E-05
7.46E-06
1.95E-06
Kota Sumenep
6.61E-09
1.32E-10
1.06E-08
5.58E-10
3.87E-10
1.42E-09
Batuan Lenteng
5.46E-09
1.40E-09
1.81E-09
2.64E-10
7.07E-10
2.71E-09
Ganding
1.21E-05
2.04E-07
2.09E-05
3.68E-07
2.37E-07
3.02E-07
Guluk Guluk
2.89E-06
1.66E-06
7.73E-06
1.99E-06
4.14E-06
2.16E-06
Pasongsongan
6.62E-09
4.63E-10
8.86E-09
9.41E-10
5.32E-10
1.58E-09
Ambunten
4.45E-08
1.89E-09
3.66E-07
1.18E-08
3.09E-09
2.98E-09
Rubaru
4.90E-09
5.23E-10
3.87E-09
6.47E-10
6.34E-10
2.62E-09
Dasuk
1.41E-09
7.46E-11
4.39E-09
1.32E-10
7.46E-11
7.89E-11
Manding
3.62E-10
1.31E-10
1.81E-09
2.19E-09
8.01E-10
2.16E-10
Batuputih
5.94E-09
4.33E-10
1.79E-09
2.81E-10
2.44E-10
2.46E-09
Gapura
1.35E-06
2.04E-07
3.91E-07
8.86E-08
4.29E-08
1.38E-07
Batang
1.59E-09
7.53E-10
1.07E-09
2.13E-10
6.93E-10
3.76E-09
Dungkek
2.32E-09
1.04E-09
3.86E-09
1.82E-09
1.41E-09
8.98E-09
Nonggunong
4.03E-09
2.46E-10
4.79E-09
2.46E-10
3.15E-10
2.42E-10
Gayam
4.21E-09
1.52E-10
5.80E-09
2.25E-10
4.06E-10
4.14E-09
Ra'As
0.00E+00
8.37E-05
0.00E+00
0.00E+00
0.00E+00
0.00E+00
Sapeken
8.50E-10
4.79E-10
1.64E-09
5.65E-09
1.03E-09
5.85E-10
Arjasa
7.43E-10
4.19E-11
2.40E-10
1.20E-09
1.23E-09
1.10E-10
Kangayan
7.72E-10
4.04E-11
3.75E-09
2.36E-10
6.19E-11
3.90E-11
Masalembu
5.99E-10
3.01E-10
4.10E-09
1.56E-10
6.26E-10
1.85E-10
120
Lampiran 18. Hasil pendugaan proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Pasuruan Kecamatan
Proporsi
Purwodadi
1 0,0512
2 0,0450
3 0,6220
4 0,0935
5 0,1099
6 0,0783
6,293
Tutur
0,0621
0,0557
0,6654
0,1325
0,0547
0,0296
5,530
Puspo
0,2396
0,0968
0,5684
0,0311
0,0311
0,0330
4,106
Tosari
0,2068
0,1125
0,3179
0,2758
0,0700
0,0573
5,622
Lumbang
0,0852
0,0760
0,6528
0,0959
0,0537
0,0363
5,301
Pasrepan
0,0774
0,3935
0,3765
0,0542
0,0261
0,0734
4,455
Kejayan
0,1112
0,1167
0,6708
0,0496
0,0245
0,0271
4,647
Wonorejo
0,1020
0,0563
0,3593
0,0829
0,0159
0,3836
8,309
Purwosari
0,0451
0,0767
0,5024
0,2352
0,1827
0,0482
7,256
Prigen
0,1302
0,0761
0,5135
0,1207
0,2581
0,1205
8,272
Sukorejo
0,0285
0,0511
0,2106
0,2989
0,2973
0,1135
8,463
Pandaan
0,0385
0,0535
0,2828
0,2507
0,2991
0,0807
7,986
Gempol
0,0259
0,0368
0,1704
0,2306
0,3495
0,1868
9,323
Beji
0,0618
0,0360
0,4025
0,2685
0,1017
0,1294
6,607
Bangil
0,0299
0,0693
0,6312
0,0833
0,0586
0,1277
6,458
Rembang
0,1821
0,1274
0,4123
0,1470
0,1045
0,0267
5,029
Kraton
0,0646
0,0706
0,5000
0,2204
0,0957
0,0488
6,164
GondangWetan
0,1276
0,1920
0,2978
0,1035
0,1049
0,1741
6,380
Rejoso
0,0321
0,0964
0,4698
0,2832
0,0891
0,0295
6,215
Winongan
0,0012
0,0158
0,1289
0,8002
0,0503
0,0038
7,685
Grati
0,1254
0,1450
0,6303
0,0289
0,0261
0,0442
4,602
Lekok
0,1207
0,0936
0,5520
0,1495
0,0406
0,0567
5,412
Nguling
0,1314
0,1053
0,4887
0,0925
0,0205
0,1623
5,973
121
Lampiran 19. Penduga KTG untuk penduga proporsi penduduk di tiap jenjang pendidikan berdasarkan model campuran logit multinomial terbobot di Kabupaten Pasuruan Kecamatan
KTG 1
2
3
4
5
6
Purwodadi
4,22E-04
4,22E-04
5,26E-06
1,26E-07
2,75E-05
1,97E-05
Tutur
8,84E-10
9,64E-10
8,54E-09
6,40E-10
1,01E-09
5,26E-10
Puspo
6,63E-10
6,02E-10
5,77E-09
8,93E-10
8,93E-10
9,39E-10
Tosari
6,42E-04
4,71E-05
6,07E-06
3,01E-06
9,40E-06
1,18E-05
Lumbang
5,56E-10
6,08E-10
8,02E-09
7,00E-10
8,47E-10
5,71E-10
Pasrepan
1,37E-03
2,25E-03
1,03E-06
1,15E-06
2,14E-06
6,44E-06
Kejayan
7,77E-10
7,99E-10
8,48E-09
1,24E-09
1,32E-09
1,55E-09
Wonorejo
2,27E-05
5,90E-06
3,75E-05
5,41E-06
9,67E-07
1,53E-05
Purwosari
1,50E-09
2,73E-09
2,54E-08
9,02E-09
1,59E-08
4,26E-09
Prigen
4,28E-06
1,21E-05
1,80E-04
1,15E-05
8,03E-03
3,61E-03
Sukorejo
1,59E-09
2,35E-09
2,00E-08
2,70E-08
3,01E-08
5,25E-09
Pandaan
9,16E-09
2,62E-08
5,84E-08
3,68E-08
6,00E-08
2,51E-08
Gempol
2,66E-09
1,82E-09
2,50E-08
3,64E-08
6,45E-08
3,36E-08
Beji
3,63E-10
1,90E-10
4,03E-09
2,55E-09
7,28E-10
8,85E-10
Bangil
2,26E-07
3,22E-08
7,37E-08
1,45E-07
1,95E-08
5,00E-08
Rembang
6,06E-10
1,01E-09
2,50E-09
9,06E-10
1,19E-09
2,85E-10
Kraton
3,73E-09
3,07E-10
4,94E-09
1,28E-09
2,66E-11
1,31E-11
GondangWetan
8,87E-10
3,09E-09
4,92E-09
1,69E-09
7,23E-10
1,23E-09
Rejoso
1,81E-09
1,40E-09
3,98E-09
9,85E-10
1,46E-09
4,74E-10
Winongan
1,21E-09
1,20E-09
8,52E-10
1,12E-08
1,15E-09
9,27E-11
Grati
2,44E-09
1,86E-09
5,90E-09
5,59E-10
8,39E-10
2,22E-09
Lekok
6,41E-08
5,40E-08
6,12E-07
1,14E-07
2,48E-08
5,10E-08
Nguling
2,46E-05
1,77E-06
1,10E-05
1,32E-06
2,63E-06
2,26E-05
122
Lampiran 20. Prediksi Indeks Pendidikan di Kabupaten Sumenep menggunakan model SAE
10
Pragaan
92.2
42.058
75.486
Rata-rata Lama Sekolah 6.31
20
Bluto
90.3
55.743
78.781
8.36
30
Saronggi
75.8
35.789
62.463
5.37
40
Giligenteng
96
37.888
76.629
5.68
50
Talango
84.9
31.064
66.955
4.66
60
Kalianget
94.3
48.204
78.935
7.23
70
Kota Sumenep
96.2
46.237
79.546
6.94
80
Lenteng
66.3
51.203
61.268
7.68
Kode
Kecamatan
90
Ganding
100
Guluk Guluk
110
Pasongsongan
120
Indeks Melek Huruf
Indeks Rata-rata Lama Sekolah
Indeks Pendidikan
75
47.428
65.809
7.11
92.8
42.564
76.055
6.38
81
45.583
69.194
6.84
Ambunten
81.1
32.235
64.812
4.84
130
Rubaru
93.8
49.965
79.188
7.49
140
Dasuk
86.6
27.643
66.948
4.15
150
Manding
93.7
45.373
77.591
6.81
160
Batuputih
47.8
36.514
44.038
5.48
170
Gapura
72.8
37.848
61.149
5.68
180
Batang
64.9
47.891
59.230
7.18
190
Dungkek
79
47.598
68.533
7.14
200
Nonggunong
61.1
26.632
49.611
3.99
210
Gayam
69.2
52.533
63.644
7.88
220
Ra'As
81.5
44.794
69.265
6.72
230
Sapeken
97.4
52.995
82.598
7.95
240
Arjasa
82.5
46.505
70.502
6.98
241
Kangayan
75.7
31.061
60.820
4.66
250
Masalembu
83.2
36.733
67.711
5.51
123
Lampiran 21. Prediksi Indeks Pendidikan di Kabupaten Pasuruan menggunakan model SAE
10
Purwodadi
96
Indeks Ratarata Lama Sekolah 41.953
77.984
Rata-rata Lama Sekolah 6.29
20
Tutur
93.3
36.864
74.488
5.53
30
Puspo
78.5
27.371
61.457
4.11
40
Tosari
96.8
37.483
77.028
5.62
50
Lumbang
95.8
35.343
75.648
5.30
60
Pasrepan
81.1
29.697
63.966
4.45
70
Kejayan
98.4
30.982
75.927
4.65
80
Wonorejo
87
55.396
76.465
8.31
Kode
Kecamatan
Indeks Melek Huruf
Indeks Pendidikan
90
Purwosari
97.1
48.375
80.858
7.26
100
Prigen
90.2
55.145
78.515
8.27
110
Sukorejo
98.7
56.418
84.606
8.46
120
Pandaan
93.6
53.240
80.147
7.99
130
Gempol
94
62.152
83.384
9.32
140
Beji
43.6
44.049
43.750
6.61
150
Bangil
95.9
43.053
78.284
6.46
160
Rembang
85.7
33.524
68.308
5.03
170
Kraton
97.5
41.094
78.698
6.16
180
Pohjentrek
87
42.534
72.178
6.35
190
GondangWetan
98.4
41.431
79.410
6.38
200
Rejoso
91.4
51.230
78.010
6.21
210
Winongan
87
30.677
68.226
7.68
220
Grati
76.8
36.079
63.226
4.60
230
Lekok
57.9
39.819
51.873
5.41
240
Nguling
96
41.953
77.984
5.97
124
Lampiran 22. Hubungan antara Proprosi Penduduk untuk tiap jenjang pendidikan dengan Usia dan jenis kelamin di kabupaten Sumenep 0 tahun (tidak sekolah)
0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00
Lulus SD
0,50 0,40 0,31
0,27 0,23
0,26
0,24 0,19 0,11 0,08
0,10
0,06 0,03
0,00
31-40 tahun
41-50 tahun
51-60 tahun
Usia
> 60 tahun
10-30 tahun
laki-laki perempuan
usia
Putus SD (3 tahun)
41-50 tahun
51-60 tahun
> 60 tahun
laki-laki perempuan
0,66
0,60
0,57
0,50
0,30
31-40 tahun
Lulus SMP
0,70
0,41
0,40
0,30 0,25
0,20
0,03 0,02
0,50
0,34
0,30
0,09
10-30 tahun
0,40
0,36 0,35
0,40
0,20
0,20
0,30
0,20
0,22
0,20
0,11
0,10
0,09
0,13 0,08
0,10
0,08 0,04
0,00
0,00 10-30 tahun
31-40 tahun
41-50 tahun
Usia
0,70
0,60
-0,10
51-60 > 60 tahun tahun laki-laki perempuan
SMA
0,40
0,25
0,10 -0,10
10-30 tahun
Usia
31-40 tahun
> 60 tahun
0,69
0,50
0,42 0,30
0,30 0,10 0,11
0,00
51-60 tahun
PT
0,60 0,40 0,21
0,20
41-50 tahun
laki-laki perempuan
0,70
0,59
0,30
31-40 tahun
Usia
0,60 0,50
10-30 tahun
41-50 tahun
0,07 0,05 51-60 tahun
0,14
0,20
0,02
0,10
0,01 > 60 tahun
0,00 -0,10
laki-laki
Usia
perempuan
125
0,02 0,01
0,13
0,08
0,06
0,16
0 0,03 10-30 31-40 41-50 51-60 > 60 tahun tahun tahun tahun tahun laki-laki perempuan
Lampiran 23. Hubungan antara Proprosi Penduduk untuk tiap jenjang pendidikan dengan Usia dan jenis kelamin di kabupaten Pasuruan. 0 tahun (tidak sekolah)
0,40
10-30 tahun
31-40 tahun
0,66
0,60
0,36
0,52
0,40 0,30
0,27 0,25
0,20
0,14 0,10
0,13 0,10
Usia
51-60 > 60 tahun tahun laki-laki
Usia
0,60
0,65
0,50 0,40
0,40 0,21
0,20
0,28
0,60 0,37
laki-laki
0,37 0,24
0,30 0,20
0,12 0,04
0,20
0,10
0,01
0,17
0,00
0,01 0,04 0,02 10-30 31-40 41-50 51-60 > 60 tahun tahun tahun tahun tahun
Usia
0,03 0,01
PT
0,70
0,62
0,30
0,07 0,06
10-30 31-40 41-50 51-60 > 60 tahun tahun tahun tahun tahun
perempuan
Lulus SMA
0,10
0,10
0,00
0,06 0,04
-0,10 41-50 tahun
0,18
0,10
0,00 31-40 tahun
0,27
0,20
0,20
10-30 tahun
51-60 > 60 tahun tahun laki-laki perempuan
SMP
0,70
0,50
0,30
41-50 tahun
Usia
0,40
0,00
0,12 0,12
0,11
0,00
0,45
-0,10
0,23 0,21
0,20
0,16
0,10
0,50
0,50
0,26
0,22
0,20
Lulus SD
0,60
0,37
0,30
10-30 31-40 41-50 51-60 > 60 tahun tahun tahun tahun tahun laki-laki Usia perempuan
0,70
Putus SD
0,50
0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00
-0,10
10-30 tahun
Usia
laki-laki perempu…
126
31-40 tahun
41-50 tahun
0,03
0
0 0,03 51-60 > 60 tahun tahun laki-laki perempuan
Daftar Istilah dan Singkatan NO
Bahasa Indonesia
Bahasa Inggris
1
Angka melek huruf
Literacy rate
2
Akar dari Rata-rata Kuadrat Bias Relatif
Relative root mean square error
(ARKBR)
(RRMSE)
3
Bayes empirik (BE )
Empirical Bayes (EB
4
Bayes berhirarki (BH)
Hierarchical Bayes (HB).
5
Bias relatif
Relative bias RB)
6
Fraksi Percontohan
Sampling fraction
7
Indeks Pembangunan Manusia (IPM)
Human Developmen Index (HDI)
8
Kemungkinan Maksimum (KM)
Maximum likelihood (ML)
9
Kemungkinan Maksimum Berkendala (KMB)
Restricted maximum likelihood ( REML)
10
Kuadrat Tengah Galat (KTG)
Mean square error (MSE)
11
Pendugaan Area Kecil
Small area estimation (SAE).
12
Peubah penyerta
Auxiliary variable
13
Prediksi tak-bias linier terbaik (PTLT )
Best linear unbiased predictor: (BLUP)
14
Prediksi tak-bias linier terbaik empirik
Empirical best linear unbiased predictor
(PTLTE).
(EBLUP)
15
Prediksi tak-bias linier terbaik semu
Pseudo EBLUP
16
Kelompok yang saling terpisah
Mutually exclucive and exhoustive
17
Model Campuran Logit Multinomial
Multinomial logit mixed model.
18
Model Campuran Linier Terampat/MCLT
Generalized linear mixed model (GLMM)
19
Kemungkinan Maksimum Semu (KMS)
Pseudo maximum likelihood (PML).
20
Kemungkinan Quasi Berpenalti (KQB)
Penalized Quasi-likelihood (PQL)
21
Pengambilan contoh acak sederhana
Simple random sampling (SRS)
22
Pengambilan contoh berstrata
Stratified sampling
23
Pengambilan contoh bergerombol
Cluster sampling
24
Pengambilan contoh sistematik
Systematic sampling.
25
Rata-rata lama sekolah (RLS)
Mean year of schooling (MYS)
99