KAJIAN MODEL PENDUGAAN AREA KECIL UNTUK PENDUGAAN TINGKAT PENGANGGURAN MENGGUNAKAN PENDEKATAN BAYES
YUSRIANTI HANIKE
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Model Pendugaan Area Kecil Untuk Pendugaan Tingkat Pengangguran Menggunakan Pendekatan Bayes ” adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Februari 2016
Yusrianti Hanike G151130261
RINGKASAN YUSRIANTI HANIKE. Kajian Model Pendugaan Area Kecil untuk Pendugaan Tingkat Pengangguran Menggunakan Pendekatan Bayes. Dibimbing oleh KUSMAN SADIK dan ANANG KURNIA. Pendugaan area kecil merupakan suatu metode untuk menduga parameter pada suatu subpopulasi dengan ukuran contoh kecil. Metode yang dikembangkan dalam pendugaan area kecil adalah metode pendugaan tidak langsung dengan memanfaatkan kekuatan area di sekitarnya dan sumber data di luar area. Tujuan dari metode pendugaan ini adalah untuk meningkatkan keefektifan ukuran contoh dan menurunkan keragaman dugaan parameter. Pada praktiknya pendugaan yang menggunakan data administrasi dari Badan Pusat Statistik terkadang tidak sesuai dengan area yang akan dibentuk. Untuk mengatasi hal tersebut, dilakukan post-stratification yang merupakan pengelompokan (strata) data setelah pengambilan contoh. Data Sakernas BPS terkait pengangguran terbuka distratifikasi berdasarkan latar belakang pendidikan yang terdiri dari tujuh kategori pendidikan. Post-stratification yang dihasilkan dapat dipandang dengan dua pendekatan model yakni model I, pengaruh pendidikan dianggap sebagai pengaruh tetap yang dimodelkan dengan menggunakan peubah dummy, dan model II, pengaruh pendidikan dianggap sebagai pengaruh acak. Pendekatan post-stratification pada model I menghasilkan kelayakan model yang lebih baik dari model II. Pada kasus pendugaan tingkat pengangguran terbuka yang menjadi perhatian penelitian, pendekatan model Poisson-Gamma mampu mengatasi asumsi sebaran Poisson yang tidak terpenuhi, baik data yang mengalami overdispersi maupun underdispersi. Penduga dengan menggunakan metode Bayes empirik memiliki nilai KTG yang lebih kecil dibanding dengan penduga langsung. Metode Bayes empirik dapat mengatasi permasalahan dari pendugaan langsung dengan menambahkan informasi peubah penyerta, sehingga menghasilkan pendugaan yang lebih akurat. . Kata kunci : Pendugaan Area Kecil, Post-stratification, Model Poisson-Gamma, Bayes empirik.
SUMMARY YUSRIANTI HANIKE. Study of Small Area Estimation (SAE) for Estimating the Unemployment Rate Using Bayes approach. Supervised by KUSMAN SADIK and ANANG KURNIA. Small area estimation model reflects the demand for reliable small area estimates for regional planning. Small areas can be a geographical region of a country, a demographic group (a particular sex, race or age group) or a demographic group within a geographical area. While, estimation used direct estimator has big variance and sometimes wasn’t valid estimation. Using indirect estimation, small area estimation, fixed it and more reliable than direct survey estimates. In the absence of adequate direct information in small areas, small area estimation technique borrows strength from related sources to produce precise small area estimates. In fact, we find the empirical Bayes as the indirect estimator has smaller mean square error than direct estimator. In our research, we used post-stratification to handle the area interest. Poststratification is stratified method after survey sampling data. The data obtained by BPS-Statistic Indonesia about unemployment rate which stratified into seven category education. The result of this, made up teo model approach.First, the effect education as the fixed or be dummy variable and the second, the education as the random variable. Using post-stratification, model I results better evaluated model than model II. In unemployment rate case, the respon variable has Poisson assumption that can be handling by Poisson-Gamma model approach. This approach can resolve the underdispersion and overdispersion problem. Keywords: Small Area Estimation, Post-stratification, Poisson-Gamma Model, Empirical Bayes.
© Hak Cipta Milik IPB, Tahun 2016 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB
KAJIAN MODEL PENDUGAAN AREA KECIL UNTUK PENDUGAAN TINGKAT PENGANGGURAN MENGGUNAKAN PENDEKATAN BAYES
YUSRIANTI HANIKE
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016
Penguji Luar Komisi pada Ujian Tesis : Dr Ir Indahwati, MSi
Judul Tesis : Kajian Model Pendugaan Area Kecil untuk Pendugaan Tingkat Pengangguran Menggunakan Pendekatan Bayes Nama : Yusrianti Hanike NIM : G151130261
Disetujui oleh Komisi Pembimbing
Dr Kusman Sadik, SSi MSi Ketua
Dr Anang Kurnia, SSi MSi Anggota
Diketahui oleh
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr Kusman Sadik, SSi MSi
Dr Ir Dahrul Syah,MScAgr
Tanggal Ujian : 11 Januari 2016
Tanggal Lulus :
PRAKATA Puji syukur penulis panjatkan kehadirat Allah SWT atas limpahan rahmat dan ridho-Nya, kesempatan, dan kesehatan yang dikaruniakan-Nya sehingga tesis yang berjudul “Kajian Model Pendugaan Area Kecil untuk Pendugaan Tingkat Pengangguran Menggunakan Pendekatan Bayes” ini dapat terselesaikan. Terima kasih penulis ucapkan kepada Bapak Dr Kusman Sadik, S.Si., M.Si. Dan Dr. Anang Kurnia, S.Si., M.Si. selaku pembimbing, atas kesediaan dan kesabaran untuk membimbing dan membagi ilmunya kepada penulis dalam penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan sebesarbesarnya kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan kerjasamanya selama ini. Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga penulis ucapkan kepada Ayahanda dan Ibunda tercinta Hanike Gani dan Darmawati Buhari yang telah membesarkan dan mendidik penulis dengan penuh kasih sayang demi keberhasilan penulis selama menjalani proses pendidikan, juga adikku tersayang Nisrina Hanike dan Putra Tri Sarwan, dan terima kasih tercurah kepada teman spesialku Arfandi Arif serta seluruh keluarga besarku atas doa dan semangatnya. Terima kasih juga kepada program BPPDN Direktorat Pendidikan Tinggi (Dikti) yang telah membiayai pendidikan Magister selama dua tahun di IPB dan Penelitian Unggulan Sesuai Mandat Divisi (PUB) yang turut serta memberikan kontribusi dalam penyelesaian thesis. Penelitian ini telah dipublikasikan pada SEAMS (South East Asian Mathematical Society) UGM Conference 7” UGM Yogyakarta pada 18–21 Agustus 2015. Penulis juga menyampaikan terima kasih kepada seluruh mahasiswa Pascasarjana Departemen Statistika IPB atas segala bantuan dan kebersamaannya selama menghadapi masa-masa terindah maupun tersulit dalam menuntut ilmu, serta semua pihak yang telah banyak membantu dan tak sempat penulis sebutkan satu per satu. Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.
Bogor, Februari 2016
Yusrianti Hanike
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
1 PENDAHULUAN Latar Belakang Tujuan Penelitian Manfaat Penelitian
1 1 2 2
2 TINJAUAN PUSTAKA Pendugaan Langsung Post-Stratification Sampling Pendugaan Tidak Langsung Model Linear Terampat Model Poisson-Gamma Bayes Empirik
3 3 3 4 7 8 10
3 METODE PENELITIAN Data Metode Analisis
12 12 14
4 HASIL DAN PEMBAHASAN Deskripsi Data Pengangguran Post-Stratification Sampling Pemodelan dan Pendugaan Parameter Penduga Kuadrat Tengah Galat Kelayakan model Pendugaan Pengangguran
15 15 16 17 20 21 22
5 SIMPULAN DAN SARAN Simpulan Saran
25 25 25
DAFTAR PUSTAKA
26
LAMPIRAN
29
RIWAYAT HIDUP
DAFTAR TABEL 1 Rincian peubah respon dan penyerta 2 Presentase pengangguran setiap kabupaten 3 Proporsi kejadian terhadap contoh data pengangguran terbuka tahun 2014 4 Hasil pengecekan asumsi pada sebaran Poisson 5 Hasil penanganan asumsi equidispersi model Poisson-Gamma 6 Pendugaan ragam area dan dispersi 7 Pendugaan β pada model I 8 Pendugaan β pada model II 9 Hasil perbandingan KTG dari setiap area 10 Hasil nilai BIC pada kelayakan model I dan model II
13 15 16 18 18 19 19 20 20 21
DAFTAR GAMBAR 1 Diagram pemilihan contoh blok sensus dan rumah tangga Sakernas 2 Diagram contoh Sakernas menurut angkatan kerja 3 Kuadrat tengah galat pendugaan langsung, dan pendugaan tidak langsung menggunakan Bayes empirik kabupaten/kota di Sulawesi Selatan tahun 4 Pendugaan langsung Kabupaten/Kota Bulukumba, Pinrang, Enrekang, Sinjai, Pangkep dan Soppeng di Sulawesi Selatan tahun 2014 5 Pendugaan tidak langsung Kabupaten/Kota Makassar, Maros, dan Luwu Timur di Sulawesi Selatan tahun 2014
13 14 21 22 23
DAFTAR LAMPIRAN 1 Hasil perbandingan pendugaan langsung, dan tidak langsung (model I dan II) 2 Tabel Kuadrat tengah galat pendugaan langsung, dan Bayes empirik (model I dan II) 3 Formula Poisson-Gamma 4 syntax dan output
28 29 33 39
1 1 PENDAHULUAN
Latar Belakang Survei merupakan salah satu alat untuk pengumpulan data. Pentingnya survei seiring dengan meningkatnya kebutuhan terhadap informasi yang lebih rinci pada lingkup keseluruhan populasi terhadap bagian dari populasinya, terlebih saat ini sistem pemerintah di Indonesia menganut sistem desentralisasi (Bappenas 2010). Terkait dengan fungsi survei tersebut, saat ini dilakukan beberapa pengembangan metodologi survei. Survei yang dilakukan oleh pemerintah, umumnya didesain untuk memperoleh statistik nasional yang melingkupi daerah yang cakupannya besar. Program yang dicanangkan pemerintah lebih spesifik membutuhkan informasi untuk wilayah yang lebih kecil, contohnya informasi pada level kabupaten, kecamatan bahkan mungkin level desa. Ukuran contoh pada level wilayah tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Hasil pendugaan juga tidak dapat dilakukan jika area tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu, dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini. Metode tersebut dikenal dengan metode pendugaan area kecil (Small Area Estimation/SAE). Pendugaan parameter untuk model dasar SAE biasanya menggunakan metode Prediksi Tak-bias Linier Terbaik (Best Linear Unbiased Predictor) yaitu dengan meminimumkan Kuadrat Tengah Galat (KTG) dari penduga. Rao (2003) mengatakan bahwa metode tersebut hanya cocok untuk peubah kontinu, tetapi kurang sesuai jika digunakan untuk pemodelan peubah respon bertipe diskrit (biner atau cacahan). Untuk peubah bertipe diskrit akan lebih tepat menggunakan metode pendugaan melalui pendekatan Bayes, baik melalui metode Bayes empirik maupun metode Bayes berhirarki. Pada pendekatan Bayes empirik, pendugaan berdasarkan pada sebaran posterior yang diduga dari data. Adapun pada pendekatan Bayes berhirarki, parameter model yang tidak diketahui (termasuk komponen ragam) diperlakukan sebagai komponen acak yang masing-masing memiliki sebaran prior tertentu. Sebaran posterior untuk parameter yang menjadi perhatian diperoleh berdasarkan seluruh sebaran prior tersebut. Pendugaan model SAE diaplikasikan pada berbagai kebijakan pemerintah salah satunya pengentasan kemiskinan. Pengentasan kemiskinan pada aspek sumber daya manusia dapat dilakukan dengan menyiapkan lapangan kerja atau menanggulangi banyaknya pengangguran di Indonesia. Dalam penanggulangan pengangguran, beberapa program pengentasan memperhatikan latar belakang dari penggangguran. Salah satunya terkait jenjang pendidikan yang telah ditempuh dari pengangguran tersebut. Tak hanya itu, dari informasi pengangguran ini akan menjadi indikator dari pelaksanaan program pemberdayaan masyarakat, sehingga menjadi penting untuk diteliti. Tingkat pengangguran pada setiap jenjang pendidikan dapat dianggap sebagai peubah respon bertipe diskrit. Salah satu sebaran yang cocok dalam menggambarkan tingkat pengangguran pada setiap jenjang pendidikan ini adalah sebaran berbasis Multinomial. Ini dikarenakan sebaran Multinomial adalah sebaran yang memiliki lebih dari dua peluang. Penelitian sebelumnya, Rumiati
2 (2012) yang mengadopsi sebaran ini melakukan pendugaan angka melek huruf pada jenjang pendidikan di Provinsi Jawa Timur. Pendugaan melalui sebaran Multinomial ternyata menemukan jalan yang sulit. Satu respon dengan berbagai kategori menyebabkan analitik yang rumit. Mengatasi hal ini, maka ditawarkan solusi post-stratification. Post-stratification adalah salah satu cara untuk melakukan pengelompokkan setelah data survei. Teknik ini diperkenalkan oleh Holt dan Smith (1979) yang melakukan pengelompokan atau stratifikasi dari data yang telah disurvei. Hogan (2003) mengadopsi teknik ini pada data sensus yang tidak homogen. Selain itu, Little (1993) juga melakukan teknik ini dengan menstratifikasi survei kesehatan mental berdasarkan gender, ras, dan umur Menurut BPS (2014) Pengangguran pada setiap provinsi di Indonesia tercatat sekitar 10%, hal ini menyebabkan angka yang kecil untuk kejadian pengangguran di level kabupaten. Maka dari itu, banyaknya pengangguran diasumsikan memiliki sebaran Poisson. Permasalahan kemudian, Poisson pada umumnya melenceng dari asumsi equidipersi, equidispersi adalah nilai rata-rata sama dengan nilai ragamnya. Salah satu cara mengatasi hal tersebut yakni dengan mengakomodasi ragam ekstra dari pengamatan data contoh. Metode ini dikenal dengan Binomial negatif yang didasari oleh model campuran Poisson-Gamma (Kismiantini 2007). Selanjutnya, pendugaan parameter akan dilakukan melalui pendekatan Bayes, mengingat sebaran ini merupakan sebaran diskrit (Rao 2003). Pendekatan Bayes yang digunakan yakni Bayes empirik dikarenakan pendugaan yang dilakukan diambil dari data sehingga pendugaan terhadap asumsi equidispersi dari data dapat dimasukkan pada pendugaan yang diharapkan dapat mengatasi asumsi tersebut. Definisi pengangguran akan dibatasi dengan mengacu pada Badan Pusat Statistik (BPS) yakni pengangguran terbuka. Di tahun 2013, tercatat ada 10 provinsi yang termasuk memiliki tingkat pengangguran terbuka yang tinggi, salah satunya yakni Sulawesi Selatan. Di tahun 2013 Sulawesi memiliki tingkat pengangguran sebesar 5.08%, sementara dana yang dianggarkan untuk pemberdayaan masyarakat pada daerah tersebut terbilang besar yakni sekitar 20,34% APBD (Komite Ekonomi Nasional, 2011). Melalui hal tersebut, akan dilakukan penelitian dengan menduga tingkat pendidikan pengangguran pada level kabupaten di Provinsi Sulawesi Selatan. Tujuan Penelitian 1. Menduga persentase area kecil pada model Poisson-Gamma melalui pendekatan Bayes 2. Menerapkan pendugaan model Poisson-Gamma pada tingkat pengangguran pada setiap jenjang pendidikan melalui post-stratification sampling di setiap kabupaten di Sulawesi Selatan baik melalui pendugaan langsung maupun pendekatan Bayes. Manfaat Penelitian Penelitian ini bermanfaat bagi pemerintah daerah di Provinsi Sulawesi Selatan ataupun di tingkat kabupaten/kota di Provinsi Sulawesi Selatan terutama
3 di bidang sosial dalam mengidentifikasi banyaknya pengangguran terbuka pada kabupaten/kota di Provinsi Sulawesi Selatan.
4 2
TINJAUAN PUSTAKA
Pendugaan Langsung Dalam konteks survei, penduga dikatakan langsung (direct estimator) apabila pendugaan parameter di suatu area hanya didasarkan pada data contoh yang diperoleh dari area tersebut (Sadik 2009). Contoh kasus misalnya, pendugaan tingkat pengangguran suatu kabupaten didasarkan hanya pada data survei yang diperoleh dari kabupaten tersebut. Informasi lain yang berada di luar area kabupaten tersebut tidak diperhitungkan. Metode pendugaan langsung memiliki kelemahan jika dihadapkan pada contoh dengan ukuran kecil, yaitu dugaan yang dihasilkan tidak memiliki presisi yang memadai. Nilai hasil pendugaan langsung pada suatu area kecil merupakan penduga tak bias meskipun memiliki ragam yang besar dikarenakan dugaannya diperoleh dari ukuran contoh yang kecil (Rao 2003). Data contoh yang digunakan adalah data Survei Angkatan Kerja Nasional (Sakernas) tahun 2014. Data yang digunakan merupakan hasil penarikan contoh dari Sakernas, sehingga pada pendugaan merupakan pendugaan yang berbasis pada rancangan survei. Maka akan memperhitungkan bobot yang dihasilkan pada penarikan contoh tersebut. Pada pendugaan yang berbasis pada rancangan survei, pembobot rancangan 𝑤𝑗 (𝑠) memiliki peranan penting dalam membentuk penduga berbasis rancangan 𝜃 bagi 𝜃. Pembobot ini bergantung pada s dan elemen 𝑗 𝑗𝜖𝑠 dengan 𝑗 = 1,2, … 𝑛𝑖 dan 𝑖 = 1,2, … . 𝑚. Pembobot ini telah ditentukan oleh Sakernas berdasarkan metode penarikan contoh yang digunakan. Sehingga penduga langsung untuk setiap area dapat diekspresikan sebagai berikut:
𝜃𝑖𝐷𝐸
=
𝑛𝑖 𝑗=1 𝑤𝑗(𝑠) 𝑦𝑗
(2.1)
𝑛𝑤
𝑛
𝑖 dengan 𝑛𝑤 = 𝑗 =1 𝑤𝑗 , pembobot ini merupakan bentuk umum dari penduga Horvit Thompson (Cochran 1977). Penduga ragam proporsi area kecil merupakan penduga takbias, sehingga Kuadrat Tengah Galat (KTG) sama dengan penduga ragam proporsi area kecil tersebut. Pendugaan ragam pada pendugaan langsung mengacu pada data survei. Menurut Demnati dan Rao (2007) Taylor linearization sering digunakan untuk mendapatkan ragam dari pendugaan pada populasi terbatas. Metode ini digunakan pada pendugaan statistik yang kompleks baik pada pendugaan rasio maupun logistik pada regresi. Secara garis besar, metode ini diaplikasikan pada desain penarikan contoh pada pendugaan ragam yang tak berbias untuk pendugaan linear, berbeda dengan jackknife metode ini lebih sederhana. Prosedur dari pendugaan ragam dapat dituliskan sebagai berikut:
𝑉 𝜃𝑖 =
𝐻 =1
2 𝑛 1 − 𝜆𝑓1 𝑠1 + 𝜆𝑓1
𝑛 𝑖=1 𝑚𝑖
2 1 − 𝜆𝑓2𝑖 𝑠2𝑖
(2.2)
5
dengan
2 𝑠1 =𝑛
1 −1
2 𝑚𝑖 𝑡 𝑖𝑗 𝑗 =1 𝑚𝑖 (𝑦 ) 𝑒𝑖𝑗𝑘 = 𝑦𝑖𝑗𝑘 − 1
,
𝑛 𝑖=1
𝑡𝑖
2
1
−𝑛
𝑚𝑖 𝑗 =1 𝑡𝑖𝑗 ,
𝑡𝑖 =
2 𝑛 𝑖=1 𝑡𝑖
dan
,
2 =𝑚 𝑠2
𝑡𝑖𝑗 =
𝑚 𝑖𝑗 𝑘=1
1 𝑖 −1
𝑚𝑖 𝑗 =1
𝑡𝑖𝑗
2
𝑑𝑖𝑗𝑘 𝑔𝑖𝑗𝑘 𝑒𝑖𝑗𝑘 (𝑦)
− .
𝑦𝑖𝑗𝑘 . 𝑑𝑖𝑗𝑘 = 1/(𝑓1 𝑓2𝑖 ) dengan 𝑓1 = 𝑛 /𝑁 dan 𝑓2𝑖 = 𝑚𝑖 /𝑀𝑖 . 𝑁 menunjukkan banyaknya populasi pada sampling pertama sementara 𝑀𝑖 menunjukkan banyaknya populasi di sampling kedua. Metode ini dapat dihitung menggunakan aplikasi SAS dengan menggunakan surveymeans procedure. Post-stratification Sampling Post-stratification adalah teknik penarikan contoh dengan melakukan pengelompokkan setelah data survei. Teknik ini awalnya didesain karena strata yang telah ada pada data sensus dianggap tidak homogen. Mengatasi hal tersebut maka diberikan solusi dengan menggunakan post-stratification sampling. Walaupun sifatnya yang subjektif dalam pemberian strata, teknik ini terbilang mampu memberikan hasil pendugaan yang lebih baik (Hogan 2003). Kelebihan lain yang diberikan teknik ini yakni dapat meningkatkan ketepatan perkiraan pada populasi dan meminimalisir ragam dalam menduga ratarata. Teknik ini pun menjadi efektif, jika unit contoh untuk strata tidak bisa dikendalikan misalnya memiliki pencilan atau tingkat heterogen yang tinggi (Westfall et al. 2011). Pendugaan melalui post-stratification menurut Westfall et al (2011) dapat dirumuskan sebagai berikut: 𝑝𝑠
𝜃𝑖 =
𝐷𝐸 𝐾 𝑘=1 𝑊𝑖𝑘 𝜃𝑖
(2.3)
dengan 𝑊𝑖𝑘 adalah bobot yang dihasilkan dari post-stratification yakni peluang dari banyaknya sampel dari strata yang terpilih di 𝑘𝑖 terhadap seluruh jumlah sampel. Standar error dari hasil pendugaan pada persamaan (2.2) dapat 𝑝𝑠
dihitung dengan 𝑠𝑒 𝜃𝑖
untuk
𝑆
2
𝑛 𝑘𝑗
𝑖𝑘
=
𝑖=1
=
(𝑦𝑘𝑗𝑖 −𝑦𝑘𝑗𝑖 )2 𝑛 𝑘𝑗 −1
1 𝑛𝑖
2 𝐾 𝑘=1 𝑊𝑖𝑘 𝑆 𝑖𝑘
+
1 2 𝐾 𝑘=1(1 − 𝑊𝑖𝑘 ) 𝑛𝑖 𝑆 𝑖𝑘
dan
Pendugaan dapat pula dihitung menggunakan
aplikasi SAS dengan menggunakan surveymeans procedure . Pendugaan Tidak Langsung Permasalahan yang ditimbulkan dari pendugaan langsung (direct estimator) dapat ditanggulangi dengan mengembangkan suatu metode pendugaan dengan cara tidak langsung (indirect estimation). Tujuan dari pendugaan ini adalah untuk meningkatkan keefektifan ukuran contoh dan menurunkan keragaman sehingga lebih akurat. Pendugaan tersebut dikenal sebagai pendugaan area kecil. Pendugaan parameter pendugaan tidak langsung menggunakan informasi tambahan. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat ”meminjam kekuatan” (borrowing strength) informasi dari
6 hubungan antara peubah respon dengan informasi yang ditambahkan. Dengan demikian, pendugaan tidak langsung ini dapat mencakup data dari area yang lain. Chand dan Alexander (1995) dalam Kurnia (2009) menyebutkan bahwa prosedur pendugaan area kecil pada dasarnya memanfaatkan kekuatan informasi area sekitarnya (neighbouring areas) dan sumber data di luar area yang statistiknya ingin diperoleh melalui pembentukan model yang tepat untuk meningkatkan efektifitas ukuran contoh. Secara umum, pendugaan area kecil dapat dikatakan sebagai suatu model untuk menduga parameter pada suatu area yang relatif kecil dalam percontohan survei dengan memanfaatkan informasi dari luar area, dari dalam area itu sendiri dan dari luar survei. Pendugaan tidak langsung untuk menduga parameter regresi dapat menggunakan metode Penduga Tak Bias Linier Terbaik Empirik (EBLUP), Penduga Bayes empirik dan juga Penduga Hierarchical Bayes. Pendugaan tidak langsung membagi model area kecil ke dalam 2 kelompok yaitu model berbasis area (basic area level model) dan model berbasis unit (basic unit level model). Model Berbasis Area Perhatikan suatu populasi berukuran 𝑁 yang dipartisi ke dalam 𝑚 himpunan bagian yang masing-masing berukuran 𝑁1 , … , 𝑁𝑚 yang selanjutnya disebut sebagai area atau domain. Misalkan 𝑌𝑖𝑗 merupakan suatu nilai dari peubah yang diamati pada unit ke-j untuk area ke-i. Tujuannya untuk memperoleh rata-rata dari 1 𝑁𝑖 m area yang memenuhi persamaan 𝑌𝑖 = 𝑁 𝑗 =1 𝑌𝑖𝑗 untuk i=1,2,…, m. 𝑖
Suatu contoh berukuran 𝑛 diambil dari populasi dengan menggunakan rancangan penarikan contoh tertentu. Penduga langsung sebut saja, 𝜇𝑖 , bagi parameter 𝑌𝑖 merupakan penduga yang hanya menggunakan data contoh dari area m. Melalui rancangan seperti ini maka menurut Fay dan Herriot (1979) penduga langsung untuk area-area dengan data contoh yang kecil akan mempunyai ragam yang terlalu besar. Untuk mengurangi ragam tersebut, dalam konteks pendugaan area kecil, Fay-Herriot (1979) mengasumsikan bahwa parameter 𝜇𝑖 = 𝑔(𝑌𝑖 ) untuk beberapa 𝑔(. ) yang dihubungkan pada data tambahan dalam area tertentu xi = (x1i, . . ., xpi)T mengikuti model linear seperti di bawah ini: 𝜇𝑖 = 𝒙𝑇𝑖 𝜷 + 𝑏𝑖 𝑢𝑖
i = 1,2,...,m
(2.4)
dengan bi adalah konstanta bernilai positif dan 𝜷 = (𝛽1 , … , 𝛽𝑝 )𝑇 vektor koefisien regresi berukuran 𝑝 × 1. 𝑢𝑖 pengaruh acak dari area tertentu yang saling bebas dan bersebaran identik dengan nilai harapan model 𝐸( 𝑢𝑖 ) = 0 dan ragam model 𝑉(𝑢𝑖 ) = 𝜎𝑢2 . Untuk membuat model mengenai rata-rata area kecil 𝑌𝑖𝑗 di bawah model (2.4) diasumsikan bahwa telah tersedia penduga langsung 𝜇𝑖 . Menurut Rao (2003) sebagaimana metode James-Stein diasumsikan bahwa : 𝜇𝑖 = 𝑔 𝑌𝑖 = 𝜇𝑖 + 𝑒𝑖 𝑖 = 1,2, … , 𝑚
(2.5)
7 saling bebas dengan nilai harapan dan ragamnya masing-masing adalah 𝐸 𝑒𝑖 𝜇𝑖 ) = 0 dan 𝑉 𝑒𝑖 𝜇𝑖 ) = 𝜎𝑒2 . Pada umumnya diasumsikan pula 𝑒𝑖 adalah galat penarikan contoh dengan ragam penarikan contoh 𝜎𝑒2 adalah diketahui. Dengan mengkombinasikan model pada persamaan 2.4 dan 2.5 maka akan diperoleh : 𝜇𝑖 = 𝒙𝑻𝒊 𝜷 + 𝑏𝑖 𝑢𝑖 + 𝑒𝑖
𝑖 = 1, … , 𝑚
(2.6)
model di atas melibatkan dua buah galat, yaitu galat 𝑢𝑖 dan 𝑒𝑖 , dalam hal ini diasumsikan bahwa keduanya saling bebas. Model di atas adalah kasus khusus untuk model campuran linear. Model Berbasis Unit Model level unit merupakan suatu model dengan data pendukung yang tersedia bersesuaian antara individu dengan data respon. Misal 𝒙𝑖𝑗 = 𝑇 (𝑥1𝑖𝑗 , 𝑥2𝑖𝑗 , … , 𝑥𝑝𝑖𝑗 ) tersedia pada elemen ke-j di area ke-i. Peubah yang diperhatikan adalah 𝑦𝑖𝑗 yang diasumsikan memiliki hubungan dengan 𝒙𝑖𝑗 melalui model: 𝑦𝑖𝑗 = 𝒙𝑇𝑖𝑗 𝜷 + 𝑢𝑖 + 𝑒𝑖𝑗 , 𝑗 = 1, … , 𝑛𝑖 , 𝑖 = 1, … , 𝑚
(2.7)
dengan pengaruh acak area yang diasumsikan bebas dan menyebar identik, dengan 𝑒𝑖𝑗 = 𝑘𝑖𝑗 𝑒𝑖𝑗 , dengan 𝑘𝑖𝑗 adalah nilai konstanta yang diketahui dan 𝑒𝑖𝑗 menyebar iid terhadap 𝑢𝑖 dan 𝐸(𝑒𝑖𝑗 ) = 0 dan ragam model 𝑉(𝑒𝑖𝑗 ) = 𝜎𝑒2 . Pada umumnya 𝑢𝑖 dan 𝑒𝑖𝑗 diketahui. Jika diasumsikan contoh dengan ukuran 𝑛𝑖 yang diambil dari 𝑁𝑖 unit pada area ke-i dan berdasarkan pada model (2.6) maka dapat pula dibentuk persamaan yang menggunakan peubah penyerta 𝒙𝑖𝑗 pada contoh terambil 𝑠𝑖 sebagai berikut: 𝒚𝒊 𝑃 = 𝑿𝑃𝑖 𝜷 + 𝑢𝑖 𝟏𝑷𝒊 + 𝒆𝒊 𝑷 , 𝑖 = 1, … , 𝑚 dengan 𝑿𝑃𝑖 adalah 𝑁𝑖 × 𝑝, 𝒚𝒊 𝑃 , 𝟏𝑷𝒊 , 𝒆𝒊 𝑷 adalah vektor berukuran 𝑁𝑖 × 1 dan 𝟏𝑷𝒊 = (1, … ,1)𝑇 ,sehingga asumsi penarikan contoh dalam setiap area yang diambil secara acak sederhana, maka model dapat dinyatakan dalam bentuk matriks: 𝒚𝒊 𝒆𝒊 𝑿𝒊 𝟏𝒊 𝒚𝒊 𝑃 = 𝒚 ∗ = ∗ 𝛽+ ∗ 𝑢𝑖 + 𝒆 ∗ 𝑿𝒊 𝟏𝒊 𝒊 𝒊
(2.8)
dimana bagian yang ditandai asterisk (*) menunjukkan unit yang tidak tercakup dalam contoh. Jika 𝑌𝑖 merupakan rata-rata populasi di area kecil ke-i, maka 𝑌𝑖 adalah: 𝑌𝑖 = 𝑓𝑖 𝑦𝑖 + 1 − 𝑓𝑖 𝑌𝑖
∗
(2.9)
8 ∗
𝑛
dengan 𝑓𝑖 = 𝑁𝑖 , 𝑦𝑖 adalah rata-rata dari seluruh contoh di area ke-i dan 𝑌𝑖 adalah 𝑖
rata-rata elemen populasi dari bagian yang tidak terambil sebagai contoh. Oleh karena itu, untuk model SAE berbasis unit, pendugaan parameter area kecil 𝑌𝑖 ∗ sama dengan menduga 𝑌𝑖 jika data contoh 𝑦𝑖 dan 𝑿𝑖 𝑃 tersedia. Model SAE yang digunakan dalam penelitian ini adalah model level area karena data pendukungnya hanya ada pada level area tertentu yaitu kabupaten/kota. Model Linear Terampat Istilah Model linear terampat merujuk pada kelas model yang lebih luas yang dipopulerkan oleh diperkenalkan oleh McCullagh dan Nelder (1983). Model ini mengasumsikan bahwa peubah respon mengikuti sebaran dari keluarga eksponensial dengan 𝜇𝑖 , yang biasanya diasumsikan sebagai suatu fungsi (seringkali bentuknya nonlinear) dari 𝒙𝑻𝒊 𝜷. Beberapa penulis menyatakan bentuknya adalah nonlinear karena 𝜇𝑖 seringkali merupakan fungsi nonlinear dari kovariat. Namun McCullagh dan Nelder (1983) mempertimbangkan fungsi tersebut sebagai bentuk yang linear, karena kovariat ini mempnegaruhi sebaran respon hanya melalui kombinasi linear dari 𝒙𝑻𝒊 𝜷. Model linear terampat didefinisikan dalam bentuk segugus peubah acak 𝑌1 , … . , 𝑌𝑛 yang saling bebas, dan masing-masing peubah acak tersebut mempunyai sebaran yang sama dari keluarga eksponensial (Hajarisman 2013). Sebaran tersebut memiliki sifat-sifat sebagai berikut: 1. Sebaran dari masing-masing peubah respon berbentuk kanonik dan bergantung pada satu parameter tunggal 𝜃𝑖 , yang fungsi peluangnya dapat dituliskan sebagai berikut: 𝑓 𝑦 𝜃, 𝜏 = exp
𝑦𝜃 −𝑏 𝜃 𝑎 𝜙
+ 𝑐 𝑦, 𝜙
(2.10)
Sebaran dari semua peubah peubah acak 𝑌𝑖 mempunyai bentuk yang sama. Misalkan 𝐸 𝑌𝑖 = 𝜇𝑖 , dengan 𝜇𝑖 merupakan suatu fungsi bagi 𝜃𝑖 . Dalam GLM dilakukan transformasi bagi 𝜇𝑖 sedemikian rupa sehingga diperoleh 𝑔(𝜇𝑖 ) = 𝜂 = 𝒙𝑻𝒊 𝜷 dengan g merupakan fungsi monoton dan mempunyai turunan yang disebut juga sebagai fungsi hubung (link function), 𝒙𝒊 merupakan vektor dari peubah penyerta berukuran p x 1. Model linear terampat mempunyai tiga buah komponen, yaitu: 1. Peubah respons 𝑌1 , … . , 𝑌𝑛 yang diasumsikan merupakan anggota dari sebaran keluarga eksponensial. Komponen acaknya adalah peubah respon. 2. Komponen sistematik adalah kombinasi linear dari kovariat 𝑥1 , … . , 𝑥𝑝 . 3. Fungsi penghubung adalah fungsi yang menghubungkan antara komponen acak dan komponen sistematik. Fungsi ini harus bersifat terdiferensialkan monoton. Penelitian ini fokus pada peubah respon dengan sebaran Poisson. Fungsi peluang pada poisson dapat dituliskan sebagai berikut: 2.
𝑓 𝑦𝑖 |𝜃𝑖
=
𝑒 −𝑛 𝑖 𝜃 𝑖 (𝑛 𝑖 𝜃 𝑖 )𝑦 𝑖 𝑦𝑖 !
9 = exp 𝑦𝑖 log(𝑛𝑖 𝜃𝑖 ) − (𝑛𝑖 𝜃𝑖 − log(𝑦𝑖 !)]
(2.11)
dengan 𝜃 = log(𝑛𝑖 𝜃𝑖 ), 𝜙 = 1, 𝑏 𝜃 = exp(𝜃) dan 𝑐 𝑦, 𝜙 = − log 𝑦𝑖 ! . Hal ini menunjukkan bahwa sebaran Poisson merupakan anggota dari keluarga eksponensial. Fungsi penghubung dari Poisson ini adalah log, jika parameter alamiah 𝜇𝑖 dimodelkan 𝜇𝑖 = 𝒙𝑇𝑖 𝜷 + 𝑢𝑖 yang tidak lain merupakan model SAE berbasis area pada persamaan (2.4), dapat dituliskan sebagai berikut: log 𝜇𝑖 = 𝒙𝑇𝑖 𝜷 + 𝑢𝑖
(2.12)
melalui persamaan (2.12) akan dilakukan pendugaan terhadap area ke-i berdasarkan metode yang akan digunakan, dalam hal ini Bayes empirik. Model Poisson-Gamma Pada sebaran Poisson biasanya tidak memenuhi asumsi equidipersi. Asumsi ini menyatakan bahwa nilai ragamnya sama dengan nilai rataannya. Pada umumnya, gejala yang dialami yakni overdispersi. Overdispersi terjadi karena keragamannya yang lebih besar dari nilai tengahnya. Hal ini akan mengakibatkan galat baku dari parameter dugaan menjadi berbias ke bawah. Fenomena overdispersi dan underdispersi untuk kasus Poisson dapat dituliskan: Overdispersi : Var (Y) > E (Y) dan underdispersi: Var (Y) < E(Y). Menurur Rodriguez (2013) cara untuk mendeteksi asumsi ini adalah dengan menggunakan pearson chi-square yang dibagi dengan derajat bebas sebagai berikut: 𝜒2
dimana 𝜒 2 =
𝑛 (𝑦 𝑖 −𝜇 𝑖 𝑖=1 𝜙 𝜇 𝑖
)2
𝜙 = 𝑑𝑓
(2.13)
dan df = n – p dengan n adalah banyaknya observasi
dan p adalah banyaknya parameter. Untuk mengatasi hal tersebut maka dikembangkanlah formulasi Poisson yang mengakomodasi ragam ekstra dari pengamatan data contoh, model ini dikenal dengan model campuran Poisson-Gamma (Kismiantini 2007). Pada sebaran Poisson diasumsikan sebaran Gamma sebagai prior yang merupakan conjugate dari sebaran Poisson. Sebaran Poisson dinotasikan 𝑦𝑖 ~Poisson(𝑛𝑖 𝜃𝑖 ). Misalnya dinotasikan 𝜃𝑖 dengan 𝜃𝑖 = 𝜇𝑖 𝛾𝑖 , dengan 𝜇𝑖 = 𝒙𝑻𝒊 𝜷 + 𝑢𝑖 dan 𝛾𝑖 mengikuti sebaran Gamma dengan rataan 1 dan ragam 1/𝜙. Parameter 𝜙 merupakan parameter dari dispersi. Jeong dan Yang (2009) menyatakan bahwa masalah dari rataan yang rendah diakibatkan dari pendugaan 𝜙 dari ukuran contoh yang kecil. Misalkan 𝑥1 , … . , 𝑥𝑝 merupakan peubah penyerta dan diasumsikan rataan dari 𝜇𝑖 dari persamaan linier di bawah ini: 𝜂 𝜷; 𝒙 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽𝑝 𝑥𝑝 + 𝑢
(2.14)
10 dengan 𝜷 = (𝛽0 , 𝛽1 , … , 𝛽𝑝 )′ dan 𝒙 = (𝑥1 , 𝑥2 , … , 𝑥𝑝 )′, dan 𝑢 = peubah acak area dan diasumsikan log sebagai fungsi hubung, sehingga dapat dibentuk sebagai berikut: log 𝜇𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + ⋯ + 𝛽𝑝 𝑥𝑖𝑝 + 𝑢𝑖 .
(2.15)
Fungsi kepekatan Poisson, 𝑦𝑖 ~ Poisson (𝑛𝑖 𝜃𝑖 ) dapat dituliskan sebagai berikut: 𝑓 𝑦𝑖 |𝜃𝑖 = Menurut Jeong 𝜙 𝜃𝑖 |𝑢𝑖 ~Gamma 𝜙, 𝜇
dan
𝑒 −𝑛 𝑖 𝜃 𝑖 (𝑛 𝑖 𝜃 𝑖 )𝑦 𝑖
, 𝑦𝑖 = 0,1, ….
𝑦𝑖!
Yang
(2009)
(2.16)
fungsi
kepekatan
peluang
𝑖
𝑒
𝜋 𝜃𝑖 |𝑢𝑖 =
−𝜃 𝑖
𝜙 𝜇𝑖
𝜃 𝑖 𝜙 −1
Γ(𝜙 )
𝜙 𝜙 𝜇𝑖
, 𝜃𝑖 > 0
(2.17)
sehingga fungsi kepekatan bersamanya dapat dituliskan sebagai berikut : 𝑓 𝑦𝑖 , 𝜃𝑖 =
𝑒 −𝑛 𝑖 𝜃 𝑖 (𝑛 𝑖 𝜃 𝑖 )𝑦 𝑖 𝑒
−𝜃 𝑖
𝑦𝑖!
=
𝜙 𝜇𝑖
𝜙 𝜙
𝜃 𝑖 𝜙 −1
𝜇𝑖
Γ(𝜙 )
𝑛𝑖𝑦 𝑖
𝜙 𝜇𝑖
, 𝑦𝑖 = 0,1, … ; 𝜃𝑖 > 0
𝜙
𝑦 𝑖 !Γ(𝜙 )
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒
𝜙
−𝜃 𝑖 𝑛 𝑖 + 𝜇𝑖
(2.18)
dengan Γ(. ) adalah fungsi Euler gamma yang didefinisikan sebagai Γ 𝛼 = ∞ 𝛼 −1 −𝑡 𝑡 𝑒 𝑑𝑡. Sebaran marjinal 𝑦𝑖 diperoleh dari persamaan (2.18) yang 0 ditegralkan terhadap 𝜃𝑖 membentuk sebaran Binomial negatif yang dapat dinyatakan sebagai berikut: 𝑚 𝑦𝑖 =
𝜙
Γ(𝑦 𝑖 +𝜙)
𝜙
𝑦 𝑖 !Γ(𝜙 )
𝑛 𝑖 𝜇 𝑖 +𝜙
1−𝑛
𝜙 𝑖 𝜇 𝑖 +𝜙
𝑦𝑖
(2.19)
dengan rata-rata dan ragam: 𝐸 𝜃𝑖 𝑦𝑖 = 𝑉 𝜃𝑖 𝑦𝑖 =
𝑦 𝑖 +𝜙
(2.20)
𝜙 𝜇𝑖
𝑛 𝑖 +( ) 𝑦 𝑖 +𝜙 𝑛𝑖+
𝜙 𝜇𝑖
2
.
(2.21)
11 Persamaan (2.21) menunjukkan parameter skala 𝜙 dapat mengakomodasi overdispersi. Pada pendekatan Bayes, digunakan rata-rata posterior (2.20) sebagai penduga 𝜃𝑖 ketika parameter yang diasumsikan diketahui.
12 Bayes Empirik Berdasarkan model Poisson-Gamma, didapatkan nilai harapan fungsi posterior, nilai harapan inilah yang menjadi pendugaan Bayes 𝐸 𝜃𝑖 𝑦𝑖 = 𝜃𝑖𝐵 . Jika 𝜙 dan 𝛽 diduga dari data, pendugaan ini dikenal dengan Bayes empirik 𝜃𝑖𝐸𝐵 . Pendekatan Bayes empirik tidak berbeda jauh dengan pendekatan frequentist, karena hanya menghubungkan model dengan memvalidasi data. Pendekatan ini tidak memerlukan pendugaan parameter prior, berbeda dengan metode hierarchical Bayes. Jika 𝜙, 𝑢 and 𝛽 diasumsikan diketahui melalui pendugaan dari data, parameter tersebut akan disubstitusi pada pendugaan EB terhadap fungsi posterior dari 𝜃𝑖 . Fungsi posterior menurut aturan Bayes dapat dituliskan sebagai berikut: 𝜋 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝑓 𝑦 𝑖 ,𝜃 𝑖 𝑚 𝑦𝑖
(2.22)
sehingga, posterior dapat didefinisikan memiliki 𝜃𝑖 |𝑦𝑖 , 𝛽, 𝜙 ~ Gamma(𝑦𝑖 + 𝜙, 𝑛𝑖 + 𝜇𝜙 ) . 𝑖 Penduga Bayes yang merupakan nilai harapan dari fungsi posterior dapat dinyatakan sebagai berikut: 𝜃𝑖𝐸𝐵 =
𝑦 𝑖 +𝜙
(2.23)
𝜙 𝜇𝑖
𝑛 𝑖 +( )
dengan 𝜇𝑖 = exp (𝛽0 + 𝛽1 𝑥𝑖1 + ⋯ + 𝛽𝑝 𝑥𝑖𝑝 + 𝑢𝑖 ). Pendugaan EB pada persamaan (2.23) dengan 𝜇𝑖 = 𝜂(𝜷; 𝒙𝒊 ) dan 𝜃𝑖 didapatkan melalui pendugaan dengan metode maksimum likelihood dan dapat dituliskan dalam bentuk sebagai berikut:
𝜃𝑖𝐸𝐵 =
𝜙 𝑛𝑖 𝜇𝑖 + 𝜙
𝜇𝑖 +
= 𝛿𝑖 𝜇𝑖 + (1 − 𝛿𝑖 )𝜃𝑖 dengan 𝛿𝑖 = 𝑛
𝜙 𝑖 𝜇 𝑖 +𝜙
𝑛𝑖 𝜇𝑖 𝑛𝑖 𝜇𝑖 + 𝜙
𝜃𝑖 (2.24)
dengan 0 < 𝛿𝑖 < 1.
Pendugaan parameter 𝜙 dan 𝜇𝑖 dilakukan dengan menggunakan metode Laplace Approximation. Metode Laplace Approximation adalah salah teknik pendugaan parameter baik pada pengaruh tetap maupun acak. Metode ini mengatasi sebaran yang tidak normal, lalu melakukan pendekatan normal untuk melakukan pendugaan. Pada Tahapannya, metode ini akan menentukan modus dari fungsi posterior kemudian menempatkannya sebagai rataan berdasarkan asumsi normal. Kelebihan dari teknik ini yakni dapat menghasilkan pendugaan yang lebih akurat dibandingkan dengan menggunakan quasi-likelihood (Bolker et al. 2009). Tak hanya itu, teknik ini memberikan perkiraan yang lebih akurat dari setiap fungsi parameter dalam analisis Bayesian. Pedugaan melalui metode ini dapat dihitung melalui program SAS pada Glimmix procedure.
13 Penduga MSE(𝜃𝑖𝐸𝐵 ) atau kuadrat tengah galat (KTG) didapatkan posterior. Steffey dan Kass (1989) menyatakan bahwa KTG dari EB dapat didekatkan dengan menggunakan ragam yang dihasilkan dari Bayes dengan mensubtitusikan parameter yang telah diduga yakni kedalam (2.21) maka dapat dijabarkan sebagai berikut: 𝑉𝑖𝐸𝐵 =
𝑛 𝑖 𝜃 𝑖 +𝜙 𝑛𝑖+
𝜙 𝜇𝑖
2
.
dari ragam pendugaan pendugaan 𝜙 dan 𝛽
(2.25)
Pendugaan Bayes empirik baik pada pendugaan proporsi maupun KTG dihitung melalui program SAS dengan menggunakan Proc IML.
14 3
METODE PENELITIAN Data
Data yang digunakan dalam penelitian ini adalah data primer dari Survei Angkatan Kerja Nasional (Sakernas) 2014 yang diambil pada triwulan III bulan Agustus 2014. Sakernas Agustus 2014 dilaksanakan di seluruh wilayah Republik Indonesia dengan jumlah contoh sekitar 200 000 rumah tangga, tersebar pada 20 000 blok sensus di seluruh provinsi baik di daerah perkotaan maupun perdesaan. Sebanyak 20 000 blok sensus diantaranya 5 000 blok sensus adalah contoh Sakernas triwulanan III dan 15 000 blok sensus merupakan contoh Sakernas tambahan dengan pendataan yang dilakukan hingga tingkat kabupaten/kota. Rumah tangga korps diplomatik, rumah tangga yang tinggal baik blok sensus khusus dan rumah tangga khusus yang berada di blok sensus biasa tidak dipilih dalam contoh. Menurut pedoman Sakernas 2014, desain contoh pada survei ini dilakukan dalam tiga tahap yakni tahap pertama: dari daftar wilayah cacahan SP2010 dipilih 30 000 wilayah cacahan untuk Susenas secara Probability Proportional to Size (pps) dengan ukuran jumlah rumah tangga SP2010. Kemudian 30 000 wilayah cacahan tersebut dialokasikan sama ke dalam empat triwulan, masing-masing sebesar 7 500 wilayah cacahan. Dari 7 500 wilayah cacahan Susenas Triwulan I, dipilih 5 000 wilayah cacahan secara sistematik untuk Sakernas 2011 Triwulan I dan akan digunakan lagi untuk Triwulan II, III, dan IV. Tahap kedua: memilih dua blok sensus pada setiap wilayah cacahan terpilih Susenas yang juga terpilih Sakernas secara pps sistematik dengan ukuran jumlah rumah tangga hasil pemutakhiran SP2010. Selanjutnya blok-blok sensus terpilih dialokasikan secara acak untuk Susenas dan Sakernas. Blok-blok sensus terpilih Sakernas ini digunakan untuk pendugaan provinsi dan dibagi ke dalam 4 paket contoh. Khusus untuk Sakernas Triwulan III, yang diperuntukkan untuk estimasi kabupaten, diperlukan tambahan contoh blok sensus. Dari 15 000 contoh wilayah cacahan terpilih Susenas Triwulan II dan III masing-masing dipilih dua blok sensus, satu untuk keperluan Susenas dan yang lainnya untuk Sakernas. Blok sensus untuk Sakernas yang terpilih dari PSU Susenas Triwulan II dan III ini selanjutnya digunakan sebagai contoh blok sensus komplemen yang merupakan tambahan contoh yang apabila digabungkan dengan blok sensus pendugaan provinsi (Sakernas Triwulan III) dapat digunakan untuk pendugaan kabupaten. Tahap ketiga: memilih 10 rumah tangga secara sistematik berdasarkan hasil pemutakhiran rumah tangga SP2010. Pada Sakernas Provinsi Sulawesi Selatan terdiri kabupaten/kota sebanyak 24 dengan blok sensus sebanyak 696 dan rumah tangga sebanyak 6 960. Dari rumah tangga tersebut terambil contoh sebanyak 24 231 individu. Diagram pemilihan contoh blok sensus dan rumah tangga Sakernas dapat dilihat pada Gambar 1. Definisi pengangguran mengacu pada BPS yakni pengangguran terbuka. Pengangguran terbuka didefinisikan yakni individu berumur 15 tahun ke atas, tidak bekerja setelah lebih dari satu minggu, mencari pekerjaan, mempersiapkan usaha, putus asa/merasa tidak mungkin mendapatkan pekerjaan, sudah punya pekerjaan tetapi belum bekerja.
15
Gambar 1 Diagram pemilihan contoh blok sensus dan rumah tangga Sakernas Definisi pengangguran terbuka pada Gambar 2 distratifikasi berdasarkan metode post-stratification. Teknik stratifikasi dilakukan pada hasil data survei menjadi 7 kategori yaitu tidak tamat SD, SD, SMP, SMA, SMK, Diploma, lulusan universitas. Sehingga, jika kategori dan kabupaten dikombinasikan akan membentuk 168 informasi mengenai pengangguran berdasarkan kategori pendidikannya. Tabel 1 Rincian peubah respon dan penyerta No Nama Peubah 1 Banyaknya pengangguran area ke-i(𝑦𝑖 ) 2 Pendapatan kabupaten (𝑥1 ) 3 Kapasitas perekonomian (𝑥2 ) 4
Kapasitas sosial kemasyarakatan (𝑥3 )
Status Peubah respon Peubah penyerta Peubah penyerta
Penjelasan Banyaknya pengangguran terhadap banyaknya contoh
Nilai pendapatan kabupaten dalam satuan rupiah Program/kegiatan pemberdayaan masyarakat melalui Peningkatan kapasitas sosial kemasyarakatan (SDM) Peningkatan keterampilan pemasaran hasil produksi Peubah Program/kegiatan pemberdayaan penyerta masyarakat melalui Peningkatan kapasitas sosial kemasyarakatan (SDM) penguatan kelembagaan sosial kemasyarakatan
16
Data yang digunakan untuk peubah penyerta yakni potensi desa tahun 2014. Data hasil Pendataan Potensi Desa (Podes) 2014 dapat dimanfaatkan untuk berbagai keperluan oleh berbagai pihak yang membutuhkan sumber data berbasis wilayah. Podes 2014 dilaksanakan selama bulan April 2014, mencakup seluruh wilayah administrasi pemerintahan setingkat desa (BPS 2014).
Gambar 2 Diagram contoh Sakernas menurut angkatan kerja Metode Analisis Data akan dianalisis dengan dua model yakni pendugaan langsung dan dengan pendekatan Bayes. Berikut penjabaran proses analisis: 1. Data peubah respon yakni kategori pendidikan pengangguran terbuka dilakukan teknik penarikan contoh post-stratification. 2. Eksplorasi data dan pengecekan asumsi Poisson. 3. Menghitung proporsi pendidikan pengangguran melalui pendugaan langsung pada persamaan (2.1). 4. Menentukan kuadrat tengah galat (KTG) dari pendugaan langsung pada persamaan (2.2). 5. Pendugaan 𝜷, 𝜙 dan ragam pengaruh acak melalui Laplace Approximation. 6. Menentukan penduga bayes, yang dapat dinyatakan sebagai berikut: Dimana 𝛿𝑖 = 𝑛
𝜙 𝑖 𝜇 𝑖 +𝜙
𝜃𝑖𝐸𝐵 = 𝛿𝑖 𝜇𝑖 + (1 − 𝛿𝑖 )𝜃𝑖 dengan 0 < 𝛿𝑖 < 1.
7. Menentukan nilai proporsi dari setiap pendugaan pengangguran pada setiap jenjang dengan membagi berdasakan ukuran sampel yang terambil pada setiap area. Hasil proporsi kemudian dikonversi menjadi persentase. 8. Menghitung KTG melalui pendekatan Bayes pada persamaan (2.24). 9. Membandingkan KTG pendugaan langsung dan penduga Bayes
17 4 HASIL DAN PEMBAHASAN
Deskripsi Data Pengangguran Provinsi Sulawesi Selatan terdiri dari 24 kabupaten, setiap kabupaten didefinisikan memiliki 7 kategori pendidikan yakni belum tamat SD, tamat SD, tamat SMP, tamat SMA, tamat SMK, tamat diploma, tamat universitas. Data pengangguran Sulawesi Selatan diasumsikan bersebaran Poisson. Ini disebabkan beberapa kejadian pada setiap kabupaten di setiap jenjang pendidikan memiliki kejadian yang sedikit. Kejadian yang sedikit disebabkan oleh beberapa faktor. Diantaranya contoh yang sedikit dan pembatasan definisi pengangguran. Data pengangguran yang digunakan diambil dari Sakernas 2014. Konsep dan definisi yang digunakan dalam pengumpulan data ketenagakerjaan melalui Sakernas oleh Badan Pusat Statistik (BPS) adalah The labor force concept yang disarankan oleh International Labor Organization (ILO) yakni: Pengangguran meliputi yakni individu berumur 15 tahun ke atas, penduduk yang tidak bekerja atau sedang mencari pekerjaan lebih dari satu minggu, atau mempersiapkan suatu usaha, atau merasa tidak mungkin mendapat pekerjaan (putus asa), atau sudah diterima bekerja, tetapi belum mulai bekerja. Berikut hasil survei terhadap banyaknya penggangguran dalam bentuk persentase untuk setiap kabupaten di Sulawesi Selatan tahun 2014. Tabel 2 Persentase pengangguran setiap kabupaten No 1 2 3 4 5 6 7 8 9 10 11 12
Kabupaten Selayar Bulukumba Bantaeng Jeneponto Takalar Gowa Sinjai Bone Maros Pangkep Barru Soppeng
Persentase 1.43 2.87 2.71 2.39 2.23 3.03 1.11 5.10 7.80 1.43 7.17 2.23
No 13 14 15 16 17 18 19 20 21 22 23 24
Kabupaten Wajo Sidenreng Rappang Pinrang Enrekang Luwu Tana Toraja Luwu Utara Luwu Timur Toraja Utara Makassar Pare-pare Palopo
Persentase 3.82 5.25 2.87 2.71 6.37 4.30 1.75 7.48 3.50 10.51 4.94 7.01
Tabel 2 menyajikan persentase pengangguran di setiap kabupaten di Sulawesi Selatan. Dari hasil deskriptif data, kota Makassar adalah daerah dengan tingkat pengangguran tertinggi. Persentase pengangguran di kota tersebut yakni 10.51%. Di urutan kedua yakni Kabupaten Maros dengan persentase sebanyak 7.80%.
18 Post-stratification Sampling Post-stratification sampling adalah teknik penarikan contoh stratifikasi setelah data diperoleh. Post-stratification sampling ini biasanya dilakukan jika ingin melakukan stratifikasi pada daerah tertentu sesuai dengan keinginan penelitian. Sifatnya yang subjektif menyebabkan teknik ini tidak memiliki aturan tertentu pada proses stratifikasinya (James et. al. 2011). Teknik ini dapat disajikan dalam beberapa model. Model dengan menggunakan teknik penarikan contoh ini akan menyebabkan ragam yang lebih kecil pada setiap area yang dihasilkan sebelum dilakukan post-stratification. Namun, kebaikan model yang dihasilkan tergantung pada peubah penyerta yang mendukung (Westfall et. al. 2011). Sifatnya yang nonadministrasi menyebabkan peubah penyerta yang ingin digunakan menjadi terbatas. Maka dari itu, model yang dihasilkan belum tentu lebih baik jika dibandingkan dengan model tanpa stratifikasi. Tabel 3 Proporsi kejadian terhadap contoh data pengangguran terbuka tahun 2014 Ktgr/Kab
Selayar
Tdk tmt SD SD SMP SMA SMK Diploma Univ
0 0 2.36 2.78 0 5.56 3.08
Ktgr/Kab Tdk tmt SD SD SMP SMA SMK Diploma Univ Ktgr/Kab Tdk tmt SD SD SMP SMA SMK Diploma Univ
Sinjai 0 0.39 0 1.26 2.5 2.38 2.44 Wajo 0.36 1.2 1.55 8.08 0 22.22 10.91
Bulu kumba 0 1.01 1.1 4.37 3.17 5.56 4.23
Ban taeng 1.66 1.31 0.55 2.92 0 5.26 5.19
Bone
Maros
1.03 0.87 1.8 6.85 4.76 4.55 4.71
1.2 1.75 6.29 11.11 4.88 8.7 7.61
Sidrap
Pinrang
1.02 3.3 2.62 5.11 10.71 0 4.65
1.26 1.57 2.05 1.69 3.85 0 2.86
Jene ponto 0.26 1.02 0.55 4.81 4.44 0 4.94 Pang kep 0 1.09 0 2.22 3.23 0 1.96 Enre Kang 0 0.63 0.78 3.09 1.43 3.03 2.04
Takalar
Gowa
0.36 0.51 1.17 1.14 6.12 15.79 2.86
0 0.42 1.03 2.42 5.61 0 5.56
Barru 1 1.6 4.07 5.73 2.56 9.68 5.49 Luwu 0.91 1.48 3.25 6.19 8.7 9.52 8.2
Tana Toraja 0.5 0.69 0.85 5.41 5.56 23.81 8.47 Parepare 0 0.68 2.26 7.69 5.49 0 7.32
Sop Peng 0 1.13 1.28 4.04 3.13 4.55 4.05
Luwu Utara 0 1.98 0.99 0.71 4.76 6.25 0
5.26 4.62 1.86 5.95 7.79 5.88 3.19
Luwu Timur 3.21 3.61 3.66 9.46 10.71 6.67 7.35
Maka ssar 0 0.98 2.13 5.33 9.52 14.81 8.66
Toraja Utara 0 0 0.57 7.38 6.42 9.09 6.25
Palopo
19 Pada pendugaan pengangguran di Provinsi Sulawesi Selatan dilakukan poststratification pada kategori pendidikan. Pendekatan penarikan contoh ini, akan membentuk area sebanyak 168 area yang merupakan kombinasi dari kabupaten dan kategori pendidikan. Sementara untuk ukuran contoh dapat dilihat pada Tabel 3 dari setiap kabupaten di setiap jenjang bila dibandingkan dengan total populasi yang ada, rata-rata ukuran contoh hanya berkisar 0.7% dari total populasi. Berdasarkan Tabel 3, kecilnya contoh yang diperoleh dapat menyebabkan pendugaan dengan ragam yang tinggi dengan hanya mengandalkan pendugaan langsung. Maka dari itu, dilakukan pendugaan dengan menggunakan model pendugaan area kecil. Untuk penelitian ini, kejadian nol masih diabaikan. Berdasarkan pada Tabel 3, kabupaten dengan tingkat pengangguran tertinggi berdasarkan proporsi contoh terhadap kejadian adalah Tana Toraja, urutan kedua yakni Kabupaten Wajo dan ketiga yakni Kabupaten Takalar. Ketiga proporsi terbesar ini terdapat pada kategori diploma. Berdasarkan jumlah pengangguran di setiap kabupaten/kota, Kota Makassar memiliki tingkat pengangguran tertinggi. Sementara untuk kategori pendidikan, SMA merupakan kategori dengan tingkat pengangguran tertinggi. Pemodelan dan Pendugaan Parameter Berdasarkan model SAE maka didefinisikan dua model yang dapat disajikan dengan menggunakan aturan post-stratification. Pada model I mendefinisikan pengaruh acak di tujuh kategori pada kabupaten/kota yang sama diasumsikan sama, sementara di model II setiap kategori baik di kabupaten/kota yang sama tetap memiliki pengaruh acak yang berbeda. Model I Pada pendugaan model I, peubah yang menjelaskan kategori pendidikan didefinisikan dalam bentuk dummy. Hal ini dimaksudkan bahwa untuk semua kategori pendidikan pada setiap kabupaten memiliki pendugaan area u yang sama. Model dapat dituliskan sebagai berikut: 𝜂𝑖 ∗ = 𝛽0 + 𝛽1 𝑥𝑖1 + ⋯ + 𝛽𝑝 𝑥𝑖𝑝 + 𝛼1 𝐷1i + ⋯ + 𝛼k 𝐷𝑘𝑖 + 𝑢𝑖
(4.1)
dengan 𝑖 ∗ = 1, … , 168 ; 𝑝 = 1,2,3; 𝑘 = 1, … , 6 Model II Pada model II, pengaruh acak didefinisikan sebagai kombinasi antara kategori dan kabupaten/kota. Model ini menunjukkan bahwa setiap kategori pendidikan di dalam satu kabupaten/kota memiliki pengaruh acak yang berbeda. Model tersebut dapat dituliskan sebagai berikut: 𝜂𝑖∗ = 𝛽0 + 𝛽1 𝑥𝑖1 + ⋯ + 𝛽𝑝 𝑥𝑖𝑝 + 𝑢𝑖∗
(4.2)
dengan 𝑖 ∗ = 1, … , 168 ; 𝑝 = 1,2,3; dimana i adalah area yang terbentuk dan p adalah peubah penyerta. Perbedaan dari kedua model adalah jumlah pengaruh acak yang berbeda. Model II sebanyak 168 sementara pada model I hanya 24 sesuai dengan
20 banyaknya kabupaten/kota yang terdapat di Sulawesi Selatan. Model yang pada persamaan (4.1) maupun (4.2) akan diduga terlebih dahulu pengaruh acak (𝒖) maupun pengaruh tetap. Pengaruh tetap yakni nilai dispersi 𝜙 dan pendugaan 𝜷. Pendugaan parameter 𝜙, 𝜷 dan 𝒖 telah dibahas pada bab sebelumnya dengan menggunakan Laplace approximation. Peubah respon yang diasumsikan memiliki sebaran Poisson sering melanggar asumsi equidispersi. Maka dari itu, perlu penanganan terlebih dahulu. Penanganan asumsi ini bisa dilakukan melalui beberapa cara. Pada penelitian ini fokus pada penanganan asumsi equidispersi melalui model Poisson-Gamma. Model ini mampu mengatasi asumsi Poisson tersebut (Kismiantini 2007). Sebelum dilakukan penanganan asumsi equidispersi dilakukan pengecekan asumsi terlebih dahulu. Pengecekan dilakukan dengan menggunakan pearson chisquare, menururt Rodriguez (2013) jika chi-square/df bernilai kurang dari satu berarti data mengalami underdispersi sementara jika lebih dari satu maka data mengalami overdispersi. Tabel 4 Hasil pengecekan asumsi pada sebaran Poisson Model Model I Model II
Chi-square/df 1.23 0.35
Pelanggaran asumsi dapat diatasi dengan menggunakan model PoissonGamma yang didasarkan pada marjinal model Poisson-Gamma atau Binomial negatif, berikut persamaannya: 𝑚 𝑦𝑖 =
𝜙 Γ(𝑦 𝑖 +𝜙) 𝜙 𝑦 𝑖 !Γ(𝜙) 𝑛 𝑖 𝜇 𝑖 +𝜙
1−𝑛
𝑦𝑖 𝜙 . 𝑖 𝜇 𝑖 +𝜙
(4.3)
Model ini dapat mengatasi masalah overdispersi atau underdispersi karena tidak mengharuskan nilai rata-rata sama dengan nilai ragam. Persamaan (4.3) 𝑛 𝜇 memiliki nilai harapan marginal 𝑛𝑖 𝜇𝑖 dan ragam marginal 𝑛𝑖 𝜇𝑖 (1 + 𝜙𝑖 𝑖 ) dimana
𝜙 adalah nilai dispersi yang akan diduga. Menurut Abdalhalim (2013) jika 𝜙 −1 → 0 maka sebaran gamma akan mamiliki 𝑣𝑎𝑟(𝜃𝑖 ) → 0 yang konvergen terhadap sebaran 𝜇𝑖 . Sama halnya pada persamaan model Poisson-Gamma (4.3) dimana jika 𝑣𝑎𝑟(𝜃𝑖 ) → 𝜇𝑖 maka akan konvergen terhadap sebaran Poisson yang menyebabkan rata-rata mendekati 𝜇𝑖 . Berdasarkan hal tersebut, berikut hasil penanganan melalui model PoissonGamma yang tersaji pada Tabel 5. Tabel 5 Hasil penanganan asumsi equidispersi model Poisson-Gamma Model Model I Model II
Chi-square/df 0.91 0.94
Tabel 5 menunjukkan penanganan asumsi equidispersi model I dan model II. Pada pengecekan terlihat nilai general chi-square/df pada model II yang
21 mengalami underdispersi menjadi 0.94 sementara model I yang mengalami overdispersi menjadi 0.91. Pada hasil uji di atas, nilai yang dihasilkan menunjukkan bahwa melalui model Poisson-Gamma menghasilkan nilai dispersi yang mampu mendekatkan nilai rata-rata dengan nilai ragam Poisson. Pendugaan ragam area dan dispersi diduga melalui metode Laplace approximation melalui program SAS pada Glimmix procedure. Tabel 6 Pendugaan ragam area dan dispersi Model Model I Model II
Ragam area (𝜎𝑢2 ) 0.21 0.02
Dispersi (𝜙) 0.11 0.58
Pada Tabel 6 dijabarkan hasil pendugaan terhadap ragam area dan nilai dispersi pada setiap model. Ragam area pada model II lebih kecil dibandingkan pada model I. Pada pendugaan dispersi, model I memiliki dispersi 0.11 dan model II yakni 0.58. Hasil pendugaan area maupun dispersi ini selanjutnya akan disubtitusi ke pendugaan pada pendekatan Bayes. Tabel 7 Pendugaan 𝜷 pada model I Pengaruh Tetap Intercept X1 X2 X3 Kategori 1 Kategori 2 Kategori 3 Kategori 4 Kategori 5 Kategori 6
Poisson-Gamma Pendugaan p-value 1.33 <.0.0001 0.22 0.02 0.13 0.29 0.09 0.52 -0.91 <.0001 -0.23 0.21 -0.16 0.33 0.62 0.0002 -0.22 0.22 -1.01 <.0001
Taraf kepercayaan yang digunakan adalah 95%, pada pendugaan pengaruh tetap pada model I, peubah penyerta yang dilihat dari nilai p-value menunjukkan signifikasi hanya pada peubah x1. Model untuk pendugaan area, peubah penyerta yang digunakan hanya x1. Kategori 1, 4 dan 6 menunjukkan nilai yang yang signifikan. Akan tetapi, seluruh kategori tetap dimasukkan untuk kepentingan pemodelan pada kategori tersebut.
22
Tabel 8 Pendugaan 𝜷 pada model II Pengaruh tetap Intercept X1 X2 X3
Poisson-Gamma Pendugaan p-value 1.27 <2e-16 0.22 0.02 0.11 0.35 0.08 0.52
Pendugaan pengaruh tetap pada model II yakni menunjukkan bahwa hanya pada peubah x1 saja yang signifikan. Peubah x1 yakni rata-rata pendapatan pada area ke-i. Penduga Kuadrat Tengah Galat Salah satu acuan untuk mengetahui lebih baiknya suatu metode yakni dengan melihat nilai KTG. Nilai KTG yang lebih kecil menunjukkan hasil pendugaan yang lebih baik. Pendugaan KTG pada pendugaan langsung menggunakan penduga ragam melalui Taylor Linearization sementara pada metode Bayes empirik dengan menggunakan ragam posterior. Perbandingan antara pendugaan langsung dan Bayes empirik, baik dengan model I maupun II, terlihat bahwa pendugaan melalui Bayes empirik lebih baik dibandingkan dengan pendugaan langsung. Hal tersebut dapat dilihat pada Gambarg3 dan Lampiran 2 bahwa pendugaan Bayes empirik memiliki KTG yang lebih kecil dibandingkan dengan pendugaan langsung. Pada perbandingan KTG pendugaan langsung dengan Bayes empirik model I memiliki proporsi sebanyak 1 yang berarti seluruh KTG dari 168 area pendugaan dengan menggunakan Bayes empirik memiliki KTG yang lebih kecil dibandingkan dengan pendugaan langsung. Begitupula pada perbandingan model 2. Hal ini menunjukkan bahwa penduga langsung memiliki lebih sedikit KTG yanglebih kecil dibanding Bayes empirik. Sehingga, pendugaan langsung tidak lebih baik dibandingkan dengan pendugaan menggunakan Bayes empirik, baik pada model I maupun pada model II. Tabel 9 Perbandingan KTG dari setiap area Model Penduga Langsung terhadap model I Penduga Langsung terhadap model II Model I / model II
Proporsi Kuadrat Tengah Galat 1 0.88 1
Pada Tabel 9 perbandingan dari model I dan model II menunjukkan proporsi bernilai 1. Hal ini menunjukkan bahwa keseluruhan KTG pada model I lebih kecil dibandingkan dengan model II.
23 0.0035 0.0030 0.0025 0.0020 0.0015 0.0010 0.0005
Barru
Luwu Timur Pendugaan Langsung
Makassar Model I
Palopo
Universitas
SMK
SMP
Blum tamat
Diploma
SMA
SD
Universitas
SMK
SMP
Blum tamat
Diploma
SMA
SD
Universitas
SMK
SMP
Blum tamat
0.0000
Soppeng
Model II
Gambar 3 Kuadrat tengah galat pendugaan langsung, dan pendugaan tidak langsung menggunakan Bayes empirik kabupaten/kota di Sulawesi Selatan tahun 2014 Besarnya KTG pada model II menunjukkan adanya keragaman pada kategori pendidikan. Maka dari itu, dapat disimpulkan bahwa kategori pendidikan tertentu pada kabupaten tertentu di kabupaten di Sulawesi Selatan memiliki pengaruh yang berbeda. Kelayakan Model Kriteria kecocokan model bisa bervariasi bergantung pada sifat-sifat kriteria dan model yang dibentuk. Suatu model dapat dikatakan cocok terhadap data sebagaimana banyaknya parameter dalam model meningkat. Salah satu ukuran untuk mengevaluasi kecocokan model adalah Bayesian information criterion (BIC). Statistik BIC didefinisikan sebagai berikut: 𝐵𝐼𝐶 = −2𝑙 𝑦 𝜃𝑓𝑖𝑡 + 𝑝 ln 𝑚
(4.4)
dimana p merupakan banyaknya parameter. Bentuk kedua dalam persamaan di atas bertindak sebagai faktor koreksi dalam masalah parameterisasi dari model. Konsepnya adalah kriteria pada BIC lebih konsisten terhadap banyaknya data dan parameter yang berbeda pada model yang dibandingkan (John et al. 2012). Tabel 10 Hasil nilai BIC pada kelayakan model I maupun II Model Model I Model II
BIC 752.35 823.94
24
Berdasarkan Tabel 10 model II tidak lebih baik dibandingkan dengan model I. Penyebab utama yakni peubah penyerta yang tidak spesifik untuk setiap area. Beberapa area memiliki peubah penyerta yang sama lantaran kurangnya data yang memadai. Kurangnya data disebabkan area yang dibentuk bukan area administrasi sehingga sulit untuk mendapatkan peubah penyerta yang cocok untuk model. Pendugaan Pengangguran Tingkat pengangguran Sulawesi Selatan tahun 2014 berdasarkan BPS (2014) menyatakan bahwa proporsi pengangguran yakni 5.08. Jumlah penggangguran tercatat sebanyak 188 765 dari total 3 715 801. Kabupaten dengan tingkat pengangguran tertinggi yakni Kota Makassar dengan proporsi sebesar 10.51 sedangkan kabupaten dengan tingkat pengangguran terendah yakni Kabupaten Sinjai dengan proporsi sebesar 0.8. Pendugaan pengangguran di Sulawesi Selatan akan dilakukan pada setiap kategori pendidikan melalui dua metode yakni dengan menggunakan pendugaan langsung dan pendekatan Bayes. Pendugaan langsung didasarkan pada pendugaan Horvit-Thompson dengan memasukkan bobot desain contoh yang dihasilkan dari teknik penarikan contoh survei Sakernas BPS. Hasil dari pendugaan langsung terhadap proporsi pengangguran berdasarkan kategori pendidikan di Sulawesi Selatan disajikan pada Gambar 4 dan Lampiran 1.
0.00
0.00
0.57
1.77 1.31
2.30
2.89 2.07 1.44 1.25 1.71 1.09 0.00
2.58 1.19 0.00
5.36 4.89
4.93
4.72
4.44 3.25 0.00
1.55 0.98 0.00
1.24 1.55 1.75
1.14
0.00 0.20 0.00
1.19
1
0.33
2
2.28 2.19 1.94
3
2.29
4
3.32
3.75
5
0.00
Persentase Pengangguran
6
0 123456712345671234567123456712345671234567
1 = tidak lulus SD, 2 = lulusan SD, 3 = lulusan SMP, 4 = lulusan SMA 5 = lulusan SMK, 6 =lulusan diploma, 7=lulusan universitas
Gambar 4
Pendugaan langsung Kabupaten Enrekang, Sinjai, Soppeng, Pangkep, Pinrang, Bantaeng, di Sulawesi Selatan tahun 2014
25
6 4
0.11 0.57 1.41 1.65 2.76 2.96
2
12.57 12.85 6.11 6.68
8
6.31 6.57
10
1.17 1.36 2.31 2.52
12
6.24 6.36
14
10.05 10.50
8.90 9.21 11.12 11.94 7.15 8.70 9.16 9.84
16
10.68 10.89
18
3.48 3.73 4.30 4.54 3.74 3.99
Persentase Pengangguran
20
12.16 14.15 10.67 11.17
17.64 18.51
Hasil pendugaan langsung tentang banyaknya pengangguran di Sulawesi Selatan, senada dengan kondisi garis kemiskinan di provinsi ini. Salah satunya yakni Kabupaten Tana Toraja. Hal tersebut tertera pada Lampirang2 yang menunjukkan bahwa persentase pengangguran yang tinggi dengan persentase 12.82. Berbeda pada pendugaan tidak langsung yang memiliki asumsi dasar dalam pemodelannya yakni keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian dengan pengaruh tetap/informasi tambahan. Asumsi selanjutnya adalah keragaman area yang diterangkan oleh pengaruh acak area. Fay dan Herriot (1979) mengusulkan suatu metode pemodelan untuk menduga pendapatan perkapita suatu area dengan memasukkan pengaruh campuran (pengaruh acak area dan pengaruh tetap) kedalam model. Pengaruh tetap yang telah diduga melalui Laplace approximation menjadi bagian dari pendugaan Bayes empirik. Pengaruh tetap berupa peubah penyerta dan dispersi selanjutnya disubstitusi pada 𝜃𝑖𝐸𝐵 . Peubah dispersi disajikan pada Tabel 6 sementara peubah penyerta yang tertera pada Tabel 7 dan Tabel 8 yang terdiri dari tiga peubah. Selain hasil penduga dari peubah penyerta dan acak area, pendugaan langsung juga menjadi bagian dari pendugaan Bayes empirik. Hasil pendugaan tidak langsung melalui Bayes empirik menghasilkan pendugaan yang tidak memiliki nilai nol. Ini disebabkan karena adanya informasi peubah penyerta di dalam pendugaan. Sehingga setiap area memiliki pendugaan dan tentunya memiliki informasi yang lebih banyak dibanding pendugaan langsung. Hasil pendugaan Bayes empirik ini disajikan pada Gambar 5 dan Lampiran 1.
0 1
2
3
4
5
Luwu Timur
6
7
1
2
3
4
5
6
Makassar Model I
7
1
2
3
4
5
6
7
Maros
Model II
1 = tidak lulus SD, 2 = lulusan SD, 3 = lulusan SMP, 4 = lulusan SMA 5 = lulusan SMK, 6 =lulusan diploma, 7=lulusan universitas
Gambar 5
Pendugaan tidak langsung Kabupaten/Kota Makassar, Maros, dan Luwu Timur di Sulawesi Selatan tahun 2014
26
Hasil pendugaan pada pendugaan langsung maupun tidak langsung menunjukkan hasil pendugaan yang berbeda pada beberapa kategori. Kecilnya contoh dari setiap area menyebabkan beberapa area pun memiliki proporsi pengangguran yang sangat kecil bahkan nol. Pada pendugaan langsung masih terdapat beberapa kategori pendidikan yang memiliki proporsi nol. Berbeda dengan pendugaan tidak langsung yang memasukkan informasi tambahan yakni peubah penyerta pada pendugaannya sehingga mampu mengatasi pendugaan yang memiliki proporsi nol. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat ”meminjam kekuatan” (borrowing strength) informasi dari hubungan antara peubah respon dengan informasi yang ditambahkan (Rao 2003).
27 5 SIMPULAN DAN SARAN
Simpulan Besarnya keragaman dari penduga langsung dapat diatasi dengan menggunakan pendugaan tidak langsung melalui model pendugaan area kecil. Penduga dengan menggunakan metode Bayes empirik memiliki nilai kuadrat tengah galat yang lebih kecil dibanding dengan penduga langsung. Metode Bayes empirik dapat mengatasi permasalahan dari pendugaan langsung dengan menambahkan informasi peubah penyerta, sehingga memiliki pendugaan yang lebih akurat. Kajian pendugaan area kecil pada model I, pengaruh acak berdasarkan data administrasi (kabupaten/kota), dan model II, pengaruh acak berdasarkan kombinasi post-stratification dan data administrasinya, menunjukkan model I memiliki nilai kelayakan model yang lebih baik dibandingkan dengan model II. Adapun penyimpangan asumsi respon Poisson dapat diatasi dengan baik melalui pendekatan Poisson-Gamma.
Saran Pada penelitian ini dihadapkan pada keterbatasan ketersediaan peubah penyerta, upaya dalam menentukan peubah penyerta yang berpengaruh diyakini merupakan nilai tambah yang besar untuk meningkatkan akurasi pendugaan yang dilakukan berdasarkan temuan pada penelitian ini.
28 DAFTAR PUSTAKA Abdalhalim MAS. 2013. Double truncated poisson regression model with random effects.[dissertasi]. Greeley(CO): University of Nothern Colorado. [Bappenas] Badan Perencanaan Pembangunan Nasional. 2010. Membangun Sistem Database MDGs dan Program Pembangunan untuk Perencanaan dan Penganggaran pada Masyarakat Miskin. Jakarta (ID): Bappenas. [BPS] Badan Pusat Statistik. 2014. Penjelasan Teknis Data Podes. Jakarta(ID):BPS. [BPS] Badan Pusat Statistik. 2014. Pedoman Pengawas Survei Angkatan Nasional (Sakernas) Agustus 2014. Jakarta (ID):BPS. [BPS Prov. Sulsel] Badan Pusat Statistik. 2014. Garis kemiskinan, produksi sektor perkebunan dan perikanan, indeks pembangunan manusia menurut kabupaten/kota tahun 2010-2013 [internet].[diunduh 28 Oktober 2015] Tersedia pada : http://sulsel.bps.go.id/Subjek/view/id/28. Bolker, BM , Brooks ME, Clark CJ, Geange SW, Poulsen JR, Stevens MHH, dan White JS. 2009. Generalized linear mixed models: a practical guide for ecology and evolution. Trends in Ecology & Evolution. 24(3):127-135. doi: 10.1016/j.tree.2008.10.008. Cochran W G. 1977. Sampling Techniques. New York: Wiley. Demnati A, Rao JNK. 2007. Linearization variance estimator for survey data: somerecent work. ICES-III; 2007 Juni 18-21; Montreal, Canada(CA). AMSTAT. Hlm 916-925; [diunduh 27 Okt 2015]. Tersedia pada: https://www.amstat.org/meetings/ices/2007/proceedings/ICES2007000130. PDF. Hajarisman N. Pemodelan area kecil untuk menduga angka kematian bayi melalui pendekatan model regresi poisson bayes berhirarki dua-level [disertasi]. Bogor (ID): Institut Pertanian Bogor. Hogan H. 2003. The accuracy and coverage evaluation: theory and design. Survey Methodology. 29: 129-138. Holt D, Smith T M F. 1979. Post-stratification. J.R. Statist. Soc. A. 142(1):33-46. Kismiantini. 2007. Pendugaan statistik area kecil berbasis model poisson gamma [tesis]. Bogor(ID): Institut Pertanian Bogor. James AW, Paul LP, John WC. 2011. Post-stratified estimation: within-strata and total sample size recommendations.NRC Research Press. 41:1130-1139. Jeong, KM, Yang HR. 2009. Dispersion parameter of poisson-gamma model in the small area estimation. J.K. Data Analysis Society. 11: 23–32. Komite Ekonomi Nasional. 2011. Laporan Akhir Tim Kajian Pemberdayaan Masyarakat Lokal dalam Memingkatkan Kesejahteraan. Jakarta: Komite Ekonomi Nasional Kurnia A. 2009. Prediksi terbaik empirik untuk model transformasi logaritma di dalam pendugaan area kecil dengan penerapan pada data susenas[disertasi]. Bogor (ID): Institut Pertanian Bogor. Little RJA, 1993. Post Stratification: A Modeler’s Perspective. J.A. Statistical Association. 88(423):1001-1012. Rao JNK. 2003. Small Area Estimation. New York : John Wiley and Sons.
29 Rodriguez G. 2013. Models for count data with overdispersion [internet].[diunduh 25 Nov 2015]. Tersedia pada: http://data.princeton.edu/wws509/ notes/c4addendum.pdf Rumiati AT. 2012. Model bayes untuk pendugaan area kecil dengan penarikan contoh berpeluang tidak sama pada kasus respon binomial dan multinomial. [disertasi]. Bogor (ID): Institut Pertanian Bogor. Sadik K. 2009. Metode prediksi tak-bias linier terbaik dan bayes berhirarki untuk pendugaan area kecil berdasarkan model state space [disertasi]. Bogor (ID): Institut Pertanian Bogor. Westfall J, Paul LP, John WC. 2011. Post-stratified estimation:within-strata and total sample size recommendations. NRC Research Press. 41: 1130–1139. doi:10.1139/X11-031. Yulianti, Huseno T, Febriani. 2011. Pengaruh Karakteristik Kependudukan terhadap Pengangguran di Sumatera Barat. Jurnal Manajemen dan Kewirausahaan. 2(2): 15-43.
Lampiran 1 Hasil perbandingan pendugaan langsung, dan tidak langsung (model I dan II) Belum Tamat SD Model II
SD
SMP
Lgsg
Model I
Model II
SMA
Lgsg
Model I
Model II
SMK
Lgsg
Model I
Model II
Diploma
Lgsg
Model I
Model II
Universitas
Estimator
Lgsg
Model I
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Selayar
0.00
0.06
0.32
0.00
0.05
0.25
2.40
2.48
2.86
3.36
3.46
3.90
0.00
0.33
1.72
6.49
7.05
9.67
3.46
3.63
4.36
Bulukumba
0.00
0.04
0.22
1.22
1.26
1.42
1.24
1.30
1.57
4.25
4.32
4.57
3.31
3.48
4.23
3.19
3.79
6.40
6.28
6.43
7.09
Bantaeng
1.77
1.81
1.97
1.31
1.38
1.69
0.57
0.63
0.89
2.30
2.38
2.72
0.00
0.23
1.22
5.36
5.92
8.38
4.89
5.04
5.65
Jeneponto
0.38
0.40
0.53
1.48
1.53
1.77
0.81
0.88
1.14
7.29
7.40
7.84
2.28
2.52
3.57
0.00
0.65
3.43
4.52
4.66
5.24
Takalar
0.53
0.57
0.74
0.71
0.77
1.01
0.97
1.03
1.31
0.95
1.02
1.29
9.00
9.22
10.17
19.09
19.56
21.99
3.62
3.78
4.46
Gowa
0.00
0.03
0.17
0.26
0.30
0.50
1.10
1.15
1.40
2.83
2.88
3.11
5.06
5.17
5.60
0.00
0.59
3.07
7.09
7.21
7.73
Sinjai
0.00
0.05
0.25
0.20
0.24
0.42
0.00
0.05
0.27
1.24
1.31
1.61
1.55
1.83
3.01
1.75
2.01
3.14
3.75
3.88
4.46
Bone
0.93
0.97
1.13
0.67
0.72
0.93
1.76
1.82
2.11
6.99
7.04
7.25
3.85
3.99
4.55
5.19
5.69
7.81
5.51
5.64
6.19
Maros
1.13
1.17
1.36
2.26
2.31
2.52
6.24
6.31
6.57
12.50
12.57
12.85
5.98
6.11
6.68
11.70
12.16
14.15
10.55
10.67
11.17
Pangkajene Kepulauan
0.00
0.06
0.32
1.19
1.23
1.40
0.00
0.08
0.44
2.58
2.66
3.01
4.72
5.07
6.59
0.00
0.62
3.24
2.07
2.18
2.65
Barru
1.04
1.08
1.24
1.74
1.76
1.85
4.48
4.52
4.68
6.53
6.58
6.78
1.59
1.88
3.09
7.30
7.65
9.15
6.70
6.83
7.34
Soppeng
0.00
0.04
0.22
0.98
1.02
1.20
1.55
1.62
1.93
3.32
3.44
3.91
2.29
2.63
4.11
3.25
3.74
5.88
4.44
4.59
5.22
Wajo
0.44
0.48
0.66
1.29
1.32
1.43
1.50
1.59
1.96
8.38
8.49
8.96
0.00
0.39
2.02
31.30
32.26
37.13
14.45
14.64
15.47
Sidenreng Rappang
1.12
1.16
1.32
2.99
3.03
3.20
3.16
3.20
3.41
5.97
6.05
6.39
9.55
9.75
10.57
0.00
0.79
4.16
7.38
7.63
8.71
Pinrang
1.44
1.49
1.69
1.25
1.29
1.48
1.71
1.77
2.01
1.09
1.18
1.58
2.89
3.03
3.64
0.00
0.45
2.34
4.93
5.08
5.75
Enrekang
0.00
0.08
0.42
1.19
1.26
1.55
0.33
0.37
0.56
2.28
2.35
2.64
2.19
2.35
3.03
1.94
2.27
3.71
1.14
1.21
1.54
Luwu
0.38
0.43
0.65
0.80
0.83
0.97
3.34
3.38
3.53
5.78
5.84
6.08
9.18
9.42
10.43
7.38
7.89
10.10
10.56
10.74
11.50
Tana Toraja
0.23
0.28
0.52
0.25
0.32
0.65
0.77
0.82
1.02
5.22
5.30
5.61
5.80
5.92
6.44
28.33
28.77
30.89
7.99
8.17
8.96
Luwu
0.00
0.05
0.26
2.27
2.31
2.50
0.33
0.39
0.62
0.54
0.62
0.96
5.70
5.96
7.08
8.79
9.41
12.34
0.00
0.31
1.63
Belum Tamat SD
SD
SMP
SMA
SMK
Diploma
Universitas
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
3.42
3.48
3.73
4.24
4.30
4.54
3.68
3.74
3.99
8.82
8.90
9.21
10.92
11.12
11.94
6.79
7.15
8.70
8.99
9.16
9.84
0.00
0.05
0.24
0.00
0.07
0.35
0.73
0.80
1.07
7.42
7.51
7.89
7.37
7.47
7.90
12.82
13.28
15.38
6.09
6.32
7.29
Makassar
0.00
0.11
0.57
1.36
1.41
1.65
2.71
2.76
2.96
6.21
6.24
6.36
9.95
10.05
10.50
17.44
17.64
18.51
10.63
10.68
10.89
Pare-pare
0.00
0.10
0.50
0.86
0.94
1.26
2.58
2.64
2.91
8.48
8.54
8.79
5.72
5.84
6.36
0.00
0.51
2.66
7.00
7.14
7.71
Palopo
5.41
5.47
5.71
5.67
5.73
6.00
2.23
2.28
2.50
4.64
4.70
4.95
8.48
8.62
9.22
3.59
4.23
6.98
4.97
5.08
5.58
Estimator Utara Luwu Timur Toraja Utara
Lampiran 2 Tabel Kuadrat tengah galat pendugaan langsung, dan Bayes empirik (model I dan II) Kabupaten Kategori
Selayar Lgsg
Bulukumba
Model I
Model II
Lgsg
Model I
Bantaeng
Jeneponto
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Belum Tamat SD
0
0.000003331
0.000018
0
0.00000159
0.000008
0.000071538
0.000001428
0.000007
0.000014086
0.000000751
0.000004
SD
0
0.000002022
0.000011
0.000049818
0.000001414
0.000007
0.000092496
0.000005328
0.000026
0.000107
0.000003257
0.000016
SMP
0.000194
0.000008402
0.000038
0.000076629
0.000003787
0.000018
0.000032132
0.000003542
0.000018
0.000065566
0.000003616
0.000018
SMA
0.000377
0.000012448
0.000053
0.000257
0.000004605
0.000019
0.000135
0.000007173
0.000033
0.000973
0.000017061
0.000061
SMK
0
0.000096244
0.000505
0.000576
0.000036428
0.000156
0
0.000048391
0.000254
0.000266
0.000066259
0.0003
Diploma
0.003916
0.000536033
0.001981
0.001013
0.00043822
0.001879
0.002724
0.00045316
0.001747
0
0.000381412
0.001996
Universitas
0.00059
0.00003458
0.000147
0.001215
0.000034573
0.000129
0.000628
0.000027069
0.000107
0.000613
0.00002389
0.000096
Kabupaten
Takalar
Gowa
Kategori
Lgsg
Model I
Model II
Model I
Model II
Model I
Model II
Lgsg
Model I
Model II
0.000028146
0.000001513
0.000008
0
0.000000922
0.000005
0
0.000001969
0.00001
0.000029583
0.000001429
0.000007
SD
0.000049672
0.00000309
0.000015
0.000006624
0.000001983
0.00001
0.000003828
0.000001707
0.000009
0.00002238
0.000002257
0.000011
SMP
0.000048217
0.000004148
0.00002
0.000062554
0.000003258
0.000016
0
0.000002371
0.000012
0.000106
0.000004633
0.000022
SMA
0.000046146
0.000003957
0.00002
0.000164
0.000003266
0.000014
0.000092169
0.000004908
0.000024
0.000313
0.000003786
0.000014
SMK
0.002399
0.000083832
0.000281
0.000412
0.000014167
0.000056
0.000241
0.000079225
0.000375
0.000361
0.000021276
0.000089
Diploma
0.010035
0.000828268
0.002121
0
0.000306336
0.001602
0.000305
0.000072664
0.000341
0.002548
0.00033613
0.001304
Universitas
0.000675
0.000030159
0.000127
0.000971
0.00002253
0.000081
0.00067
0.000022158
0.000093
0.000745
0.000023075
0.000089
Maros
Lgsg
Bone
Belum Tamat SD
Kabupaten
Lgsg
Sinjai
Pangkep Model II
Lgsg
Barru
Soppeng
Kategori
Lgsg
Model I
Model I
Model II
Lgsg
Model I
Model II
Model I
Model II
Belum Tamat SD
0.000043837
0.000001983
0.00001
0
0.000003224
0.000017
0.000035877
0.000001365
0.000007
Lgsg 0
0.000001566
0.000008
SD
0.00013
0.000002561
0.000012
0.000046475
0.000001645
0.000008
0.000038486
0.000000516
0.000002
0.000033453
0.000001717
0.000008
SMP
0.000361
0.000005685
0.000021
0
0.000006309
0.000033
0.000164
0.000001798
0.000007
0.000122
0.000005224
0.000025
SMA
0.000799
0.000009019
0.000027
0.000216
0.00000754
0.000034
0.000343
0.000003434
0.000013
0.00028
0.000014781
0.000063
SMK
0.000835
0.000025489
0.000096
0.002095
0.000164634
0.000655
0.000253
0.000083824
0.000394
0.000517
0.000130991
0.000591
Diploma
0.007115
0.000430631
0.001315
0
0.000338991
0.001782
0.002033
0.000191651
0.000682
0.001039
0.000294746
0.001264
Universitas
0.00148
0.000025651
0.000082
0.000212
0.000012714
0.000058
0.000925
0.000021577
0.000079
0.000723
0.000028468
0.000115
Kabupaten
Wajo
Sidrap
Pinrang
Enrekang
Kategori
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Belum Tamat SD
0.000019345
0.000001535
0.000008
0.000046906
0.000001421
0.000007
0.00006845
0.000002225
0.000011
0
0.000005692
0.00003
SD
0.000032894
0.000000713
0.000003
0.000106
0.000001899
0.000008
0.00004618
0.000001924
0.000009
0.000056851
0.000004824
0.000023
SMP
0.000112
0.000007612
0.000036
0.000169
0.000002731
0.000012
0.000077299
0.000003386
0.000016
0.000005367
0.000001754
0.000009
SMA
0.000809
0.000019936
0.000068
0.000534
0.000009128
0.000034
0.000060487
0.000008799
0.000043
0.000146
0.000005124
0.000023
SMK
0
0.000132489
0.000692
0.001476
0.000066024
0.000217
0.000275
0.000023088
0.000101
0.000162
0.000027231
0.000124
Diploma
0.030971
0.005151498
0.010717
0
0.000565085
0.00293
0
0.000177376
0.000929
0.000378
0.000119666
0.000553
Universitas
0.003082
0.000084602
0.000241
0.002456
0.000100203
0.000356
0.001196
0.000032819
0.00013
0.000043755
0.000005692
0.000028
Kabupaten
Luwu
Tana Toraja
Lgsg
Model I
Luwu Utara Lgsg
Model II
Luwu Timur
Kategori
Lgsg
Model I
Model II
Lgsg
Model I
Model II
Model I
Model II
Lgsg
Belum Tamat SD
0.000007182
0.000002385
0.000012
0.000005079
0.000002847
0.000015
0
0.000002166
0.000011
0.000191
0.00000417
Model I
Model II 0.000018
SD
0.000017794
0.000001047
0.000005
0.000006048
0.000005427
0.000028
0.000101
0.000002115
0.00001
0.000249
0.000004095
0.000017
SMP
0.000124
0.000001529
0.000007
0.000040144
0.000002144
0.000011
0.000005515
0.000002817
0.000014
0.000196
0.00000407
0.000017
SMA
0.000339
0.000004504
0.000017
0.000437
0.000007483
0.000029
0.000029028
0.000005972
0.00003
0.000545
0.000009126
0.000031
SMK
0.002387
0.000096094
0.000319
0.000774
0.000020932
0.00008
0.001526
0.000095388
0.000363
0.001846
0.000070403
0.000221
Diploma
0.003024
0.000418507
0.001478
0.012048
0.000889741
0.001946
0.006949
0.000767198
0.002588
0.002449
0.000198976
0.000722
Universitas
0.002135
0.000058368
0.000186
0.00171
0.000054983
0.000191
0
0.000085963
0.00045
0.00163
0.000043585
0.000146
Kabupaten Kategori
Toraja Utara Lgsg
Model I
Makassar Model II
Lgsg
Pare-pare Lgsg
Palopo
Model I
Model II
Model I
Model II
Lgsg
Belum Tamat SD
0
0.000001875
0.00001
0
0.000010524
0.000055
0
0.000008152
0.000043
0.000339
0.00000459
Model I
Model II 0.000018
SD
0
0.000004003
0.000021
0.000098209
0.00000301
0.000014
0.000073882
0.000005566
0.000028
0.000407
0.000005624
0.000022
SMP
0.000053092
0.00000393
0.00002
0.000143
0.000002514
0.000011
0.000163
0.000004388
0.00002
0.000133
0.000002897
0.000013
SMA
0.000637
0.000012485
0.000044
0.000174
0.00000112
0.000004
0.000481
0.00000593
0.00002
0.000227
0.000004618
0.000019
SMK
0.00075
0.000015595
0.000056
0.000974
0.000019148
0.000062
0.000622
0.000020386
0.000078
0.001186
0.000033122
0.000113
Diploma
0.007371
0.000491855
0.001459
0.003073
0.000098015
0.000261
0
0.000229384
0.0012
0.001276
0.000507966
0.002121
Universitas
0.001184
0.000074816
0.00028
0.000505
0.000004086
0.000013
0.000866
0.000027013
0.000098
0.000602
0.000018256
0.000072
33
Lampiran 3 Formula model Poisson Gamma dan empirical Bayes Pendugaan Poisson Gamma 𝜂 𝜷; 𝒙 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽𝑝 𝑥𝑝 + 𝑢 Dimana 𝜷 = (𝛽0 , 𝛽1 , … , 𝛽𝑝 )′ dan 𝒙 = (𝑥1 , 𝑥2 , … , 𝑥𝑝 )′, dan diasumsikan log sebagai link function, dapat dibentuk sebagai berikut: log 𝜇𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + ⋯ + 𝛽𝑝 𝑥𝑖𝑝 + 𝑢𝑖 𝜇𝑖 = exp (𝛽0 + 𝛽1 𝑥𝑖1 + ⋯ + 𝛽𝑝 𝑥𝑖𝑝 + 𝑢𝑖 ) Peubah penyerta 𝒙 = (𝑥1 , 𝑥2 , … , 𝑥𝑝 )′ adalah vektor dari covariat dan 𝜷 adalah vektor berukuran (p+1) x 1 yang merupakan efek tetap. Efek tetap lainnya pada sebaran Poisson ini adalah dispersi 𝜙. Fungsi kepadatan peluang Poisson 𝑦𝑖 ~ Poisson (𝑛𝑖 𝜃𝑖 ) 𝑒 −𝑛 𝑖 𝜃 𝑖 (𝑛𝑖 𝜃𝑖 )𝑦 𝑖 𝑓 𝑦𝑖 |𝜃𝑖 = , 𝑦𝑖 = 0,1, …. 𝑦𝑖 ! Fungsi kepadatan peluang 𝜃𝑖 = 𝜇𝑖 𝛾𝑖 , dengan 𝛾𝑖 memiliki rata-rata 1 dan ragam 1/𝜙 𝜙 dengan 𝜃𝑖 ~Gamma 𝜙, 𝜇 , 𝑖
𝜋 𝜃𝑖 =
𝑒
−𝜃 𝑖
𝜙 𝜇𝑖
𝜃𝑖 𝜙 −1 𝜙 Γ(𝜙) 𝜇𝑖
𝜙
, 𝜃𝑖 > 0
Sehingga fungsi bersamanya 𝑓 𝑦𝑖 , 𝜃𝑖 =
=
𝑒 −𝑛 𝑖 𝜃 𝑖 (𝑛 𝑖 𝜃 𝑖 )𝑦 𝑖 𝑒
𝑛𝑖𝑦 𝑖
−𝜃 𝑖
𝑦𝑖! 𝜙 𝜇𝑖
𝜃 𝑖 𝜙 −1
Γ(𝜙 )
𝜙
𝑦 𝑖 !Γ(𝜙 )
𝜙 𝜇𝑖
𝜙 𝜙 𝜇𝑖
, 𝑦𝑖 = 0,1, … ; 𝜃𝑖 > 0
𝜙
𝜃𝑖
𝑦 𝑖 +𝜙−1 −𝜃 𝑖 𝑛 𝑖 +𝜇 𝑖 𝑒
Dimana Γ(. ) adalah fungsi Euler gamma didefinisikan Γ 𝛼 =
𝑓 𝑦𝑖 , 𝜃𝑖 =
𝑛𝑖 𝑦 𝑖
𝜙 𝜙 𝜇𝑖
𝑦𝑖 ! Γ(𝜙)
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
∞ 𝛼 −1 𝑡 0
𝑒 −𝑡 𝑑𝑡.
34
𝑚 𝑦𝑖 =
𝜙 𝜙
𝑛𝑖 𝑦 𝑖
𝜙
𝜇𝑖
𝜃𝑖
𝑦𝑖 ! Γ 𝜙
𝑦 𝑖 +𝜙−1 −𝜃 𝑖 𝑛 𝑖 +𝜇 𝑖
𝑒
∞
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒
𝑚 𝑦𝑖 ≈
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
𝑑𝜃𝑖
𝑑𝜃𝑖
0 𝜙
Misalkan 𝑤𝑖 = 𝜃𝑖 𝑛𝑖 + 𝜇
𝜃𝑖 =
𝑖
𝑑𝑤𝑖 𝜙 = 𝑛𝑖 + 𝑑𝜃𝑖 𝜇𝑖
𝑑𝜃𝑖 =
1 𝜙 𝜇𝑖
𝑛𝑖+
𝑤𝑖
1
𝑑𝑤𝑖
𝜙
𝑛𝑖 + 𝜇
𝑖
Jika persamaan di atas di subtitusikan sehingga dapat dibentuk sebaran berikut : ∞
𝑚 𝑦𝑖 ≈
𝑦 𝑖 +𝜙−1
1 𝑛𝑖 + 𝜇
0
𝑚 𝑦𝑖 ≈
𝑚 𝑦𝑖 =
𝑛𝑖 + 𝜇
𝑒 −𝑤 𝑖 𝑤𝑖 𝑦 𝑖 +𝜙−1 𝑑𝑤𝑖 0
𝑖
𝑦 𝑖 +𝜙
1
Γ(𝑦𝑖 + 𝜙)
𝜙
𝑛𝑖 + 𝜇 𝜙 𝜙 𝜇𝑖
𝑦𝑖 ! Γ 𝜙
𝑚 𝑦𝑖 =
𝑖
𝑦 𝑖 +𝜙 ∞ 𝜙
𝑛𝑖 𝑦 𝑖
𝑑𝑤𝑖
𝜙
𝑛𝑖 + 𝜇
𝑖
1
𝑚 𝑦𝑖 ≈
1
𝑒 −𝑤 𝑖
𝑤𝑖
𝜙
𝑖
𝑦 𝑖 +𝜙
1
Γ 𝑦𝑖 + 𝜙
𝜙
𝑛𝑖 + 𝜇
𝑖
1 Γ 𝑦𝑖 + 𝜙 𝑛𝑖 𝑦 𝑖 𝜙 𝑦𝑖 ! Γ 𝜙 𝑛𝑖 + 𝜇
𝑦 𝑖 +𝜙
𝑖
Γ 𝑦𝑖 + 𝜙 𝑚 𝑦𝑖 = 𝑦𝑖 ! Γ 𝜙 𝑚 𝑦𝑖 =
𝜙 𝑛𝑖 𝜇𝑖 + 𝜙
Γ(𝑦𝑖 + 𝜙) 𝜙 𝑦𝑖 ! Γ(𝜙) 𝑛𝑖 𝜇𝑖 + 𝜙
𝜙
𝑛𝑖 𝜇𝑖 𝑛𝑖 𝜇𝑖 + 𝜙
𝜙
1−
𝑦𝑖
𝜙 𝑛𝑖 𝜇𝑖 + 𝜙
𝑦𝑖
35
Dengan fungsi bersama maka sebaran marginal 𝑦𝑖 |𝜷, 𝜙 adalah Binomial Negatif sebagai berikut: Γ(𝑦𝑖 + 𝜙) 𝜙 𝑚 𝑦𝑖 = 𝑦𝑖 ! Γ(𝜙) 𝑛𝑖 𝜇𝑖 + 𝜙
𝜙
𝑦𝑖
𝜙 1− 𝑛𝑖 𝜇𝑖 + 𝜙
Berdasarkan teorema Bayes maka fungsi posterioir adalah sebagai berikut: 𝜋 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 = 𝜙 𝜇𝑖
𝑛𝑖𝑦 𝑖
𝜋 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝑓 𝑦𝑖 , 𝜃𝑖 𝑚 𝑦𝑖
𝜙
𝑦 𝑖 !Γ(𝜙 )
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒 𝜙
𝑦 𝑖 !Γ(𝜙)
𝑛 𝑖 𝜇 𝑖 +𝜙
𝜙 𝑦 𝑖 +𝜙
𝜋 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝜙
Γ(𝑦 𝑖 +𝜙)
𝑛𝑖 + 𝜇
𝑖
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
1−𝑛
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒
𝑦𝑖
𝜙 𝑖 𝜇 𝑖 +𝜙
𝜙
−𝜃 𝑖 𝑛 𝑖 + 𝜇
𝑖
Γ(𝑦𝑖 + 𝜙)
Sehingga, posterior dapat didefinisikan memiliki 𝜃𝑖 |𝑦𝑖 , 𝛽, 𝜙 ~ Gamma(𝑦𝑖 + 𝜙 𝜙, 𝑛𝑖 + 𝜇 ) 𝑖
Penduga Bayes merupakan nilai harapan dari posterior berikut : 𝜙 𝑦 𝑖 +𝜙
∞
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝜃𝑖
𝑛𝑖 + 𝜇
𝑖
∞
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ≈ 0
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ≈ 0
𝑑𝑤𝑖 𝜙 = 𝑛𝑖 + 𝑑𝜃𝑖 𝜇𝑖
𝑖
𝑑𝜃𝑖
𝜃𝑖 =
𝑑𝜃𝑖 =
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒 𝜃𝑖 Γ(𝑦𝑖 + 𝜙) ∞
𝜙
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
Γ(𝑦𝑖 + 𝜙)
0
Misalkan 𝑤𝑖 = 𝜃𝑖 𝑛𝑖 + 𝜇
𝜃𝑖 𝑦 𝑖 +𝜙−1 𝑒
1 𝜙 𝜇𝑖
𝑛𝑖+
𝑤𝑖
1 𝑛𝑖 +
𝜙
−𝜃 𝑖 𝑛 𝑖 + 𝜇
𝜃𝑖 𝑦 𝑖 +𝜙 𝑒 Γ(𝑦𝑖 + 𝜙)
𝜙 𝜇𝑖
𝑑𝑤𝑖
𝑑𝜃𝑖
𝑖
𝑑𝜃𝑖
36
∞
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ≈
𝑦 𝑖 +𝜙
1 𝜙
0
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ≈
𝑛𝑖 + 𝜇
𝑖
𝑤𝑖 𝑦 𝑖 +𝜙 𝑒 −𝑤 𝑖 𝑑𝑤𝑖
𝑛𝑖 + 𝜇
𝑖
𝜙 𝜇𝑖
−𝑦 𝑖 −𝜙−1
0 ∞
𝑤𝑖 𝑦 𝑖 +𝜙 𝑒 −𝑤 𝑖 𝑑𝑤𝑖 0
−𝑦 𝑖 −𝜙−1
𝜙 𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ≈ 𝑛𝑖 + 𝜇𝑖 𝜙 𝑦 𝑖 +𝜙
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝑑𝑤𝑖
𝑦 𝑖 +𝜙+1 ∞ 𝜙
𝑛𝑖 + 𝜇
𝜙
𝑛𝑖 + 𝜇
𝑖
1
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ≈ 𝑛𝑖 +
1
𝑒 −𝑤 𝑖
𝑤𝑖
Γ(𝑦𝑖 + 𝜙 + 1)
𝜙 −𝑦 𝑖 −𝜙−1
𝑛𝑖 + 𝜇
𝑖
𝑖
Γ 𝑦𝑖 + 𝜙 + 1
Γ 𝑦𝑖 + 𝜙 𝜙 −1
𝑛𝑖 + 𝜇
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝑖
Γ 𝑦𝑖 + 𝜙 + 1
Γ 𝑦𝑖 + 𝜙 𝜙 𝑛𝑖 + 𝜇𝑖
𝑦𝑖 + 𝜙 Γ 𝑦𝑖 + 𝜙 𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 = Γ 𝑦𝑖 + 𝜙
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝐵
𝜃𝑖 =
−1
𝑦𝑖 + 𝜙 𝜙
𝑛𝑖 + 𝜇
𝑖
𝑦𝑖 + 𝜙 𝜙
𝑛𝑖 + 𝜇
𝑖
Ragam posterior 𝑉 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 = 𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 − [𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 ]2 , Maka dari itu, 𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 didapatkan sebagai berikut: 𝜙 𝑦 𝑖 +𝜙
∞
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 =
𝜃𝑖 2
𝑛𝑖 + 𝜇
𝑖
𝜙
𝜃𝑖
𝑦 𝑖 +𝜙−1 −𝜃 𝑖 𝑛 𝑖 +𝜇 𝑖
𝑒
𝑑𝜃𝑖
Γ(𝑦𝑖 + 𝜙)
0 ∞
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 ≈ 0
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
𝑦 𝑖 +𝜙−1 𝑒 2 𝜃𝑖 𝜃𝑖 Γ(𝑦𝑖 + 𝜙)
𝑑𝜃𝑖
37
∞
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 ≈ 0 𝜙
Misalkan 𝑤𝑖 = 𝜃𝑖 𝑛𝑖 + 𝜇
𝜃𝑖 =
𝑖
𝑑𝑤𝑖 𝜙 = 𝑛𝑖 + 𝑑𝜃𝑖 𝜇𝑖
∞
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 ≈
1
𝐸 𝜃𝑖
𝑖
𝑛𝑖 + 𝜇
𝑖
−𝑦 𝑖 −𝜙−2
𝜙 𝜇𝑖
𝑖
𝑤𝑖 𝑦 𝑖 +𝜙 𝑒 −𝑤 𝑖 𝑑𝑤𝑖
Γ(𝑦𝑖 + 𝜙 + 1)
𝜙 −𝑦 𝑖 −𝜙−2
𝑛𝑖 + 𝜇
𝑖
Γ 𝑦𝑖 + 𝜙 + 2
Γ 𝑦𝑖 + 𝜙
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 = 𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 =
0 ∞
−𝑦 𝑖 −𝜙−2
𝜙 −2
2
𝑖
0
𝜙 𝑦 𝑖 +𝜙
𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝑑𝑤𝑖
𝜙
𝑛𝑖 + 𝜇
𝑤𝑖 𝑦 𝑖 +𝜙 𝑒 −𝑤 𝑖 𝑑𝑤𝑖
𝜙
𝑛𝑖 + 𝜇
1
𝑦 𝑖 +𝜙+2 ∞
𝜙 𝑦𝑖 , 𝛽, 𝜙 ≈ 𝑛𝑖 + 𝜇𝑖
2
𝑒 −𝑤 𝑖
𝑤𝑖
1
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 ≈ 𝑛𝑖 +
2
𝑖
𝑦 𝑖 +𝜙+1
1 𝜙
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 ≈
𝑑𝑤𝑖
𝜙
𝑛𝑖 + 𝜇
𝑛𝑖 + 𝜇
0
𝑑𝜃𝑖
𝑤𝑖
𝜙 𝜇𝑖
𝑛𝑖+
1
𝑑𝜃𝑖 =
𝜙 𝜇𝑖
−𝜃 𝑖 𝑛 𝑖 +
𝜃𝑖 𝑦 𝑖 +𝜙+1 𝑒 Γ(𝑦𝑖 + 𝜙)
𝑛𝑖 + 𝜇
𝑖
Γ 𝑦𝑖 + 𝜙 + 2
Γ 𝑦𝑖 + 𝜙
𝑦𝑖 + 𝜙 + 1 𝑦𝑖 + 𝜙 Γ 𝑦𝑖 + 𝜙 Γ 𝑦𝑖 + 𝜙
𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 =
𝑛𝑖 +
𝑦𝑖 + 𝜙 + 1 𝑦𝑖 + 𝜙 𝜙 2
𝑛𝑖 + 𝜇
𝑖
𝑉 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 = 𝐸 𝜃𝑖 2 𝑦𝑖 , 𝛽, 𝜙 − 𝐸 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙
2
𝜙 𝜇𝑖
−2
38
2
𝑦𝑖 + 𝜙 + 1 𝑦𝑖 + 𝜙
𝑉 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 =
𝑛𝑖 + 𝜇
𝑉 𝜃𝑖 𝑦𝑖 , 𝛽, 𝜙 = 𝐸 𝜃𝑖 𝑦𝑖 =
𝑦𝑖 + 𝜙 𝑛𝑖 + (𝜇 )
𝜙
𝑛𝑖 +
𝑖
𝜇𝑖
𝑦𝑖 + 𝜙 2
𝜙
𝑛𝑖 +
𝜇𝑖
𝑦𝑖 + 𝜙
𝑉 𝜃𝑖 𝑦𝑖 =
𝜙
𝑦𝑖 + 𝜙
−
𝜙 2
𝑛𝑖 +
𝑖
𝜙
2
𝜇𝑖
Pada prinsipnya empirical Bayes yakni pendugaan melalui data.Misalkan 𝑦 melalui pendugaan langsung 𝜃𝑖 = 𝑛 𝑖 , maka pendugaan empirical Bayes dapat 𝑖
dituliskan sebagai berikut: 𝜃𝑖
𝐸𝐵
𝐵
= 𝜃𝑖 =
𝑦𝑖 + 𝜙 𝜙
𝑛𝑖 + (𝜇 ) 𝑖
𝜃𝑖
𝐸𝐵
𝑦𝑖
=
𝜙
𝑛𝑖 + (𝜇 ) 𝑖
𝜃𝑖
𝐸𝐵
+
𝜙 𝜙
𝑛𝑖 + (𝜇 ) 𝑖
𝜙
𝑛𝑖 𝜙 𝜇 . + . 𝑖 = 𝜙 𝜙 𝜙 𝑛𝑖 + (𝜇 ) 𝑛𝑖 𝑛𝑖 + (𝜇 ) 𝜇 𝑦𝑖
𝑖
𝑖
𝜃𝑖
𝐸𝐵
𝜙
𝑛𝑖
𝑦𝑖 𝜙 𝜇𝑖 𝜇𝑖 . + . = 𝜙 𝜙 𝑛𝑖 + (𝜇 ) 𝑛𝑖 𝑛𝑖 + (𝜇 ) 𝜙 𝑖
𝜃𝑖
𝐸𝐵
=
𝑖
𝑦𝑖 𝜙 + . 𝜇𝑖 𝜙 𝑛𝑖 + (𝜇 ) 𝑛𝑖 𝑛𝑖 𝜇𝑖 + 𝜙 𝑛𝑖
.
𝑖
Jika 𝛿𝑖 = 𝑛
𝜙 𝑖 𝜇 𝑖 +𝜙
𝑖
Maka, 𝜃𝑖
𝐸𝐵
= (1 − 𝛿𝑖 )𝜃𝑖𝐷𝐸 + 𝛿𝑖 𝜇𝑖
39
Lampiran 4 Syntax dan output /*menginput data model II*/ proc import datafile ="D:/tesis/gabungan data/data baru/data lengkap.csv" out = kemiskinan2 dbms = csv replace; delimiter = ";"; getnames=yes; run; proc import datafile ="D:tesis/gabungan data/data baru/Y individu area 168.csv" out = kemiskinan dbms = csv replace; delimiter = ";"; getnames=yes; run; /*deskripsi data model II*/ proc tabulate data=kemiskinan out=a; class area; var y; weight bobot; tables area all, y*(sum mean var) n; run; proc tabulate data=kemiskinan out=b; class area; var bobot; tables area all, sum*bobot; run; proc sort data=a; by area; proc sort data=b; by area; data c; merge a b; by area; data design; set c;
40
if(_type_=0) then delete; run; /*pendugaan parameter fixed dan random*/ /*model II dist poisson*/ proc glimmix data=kemiskinan2 method=laplace; class area ; model y = x1 x2 x3 / dist=poisson ddfm= BW solution; random intercept/subject=area solution; ods output covb=covbeta solutionF=beta covparms=ragam asycov=acovsigma2; output out=model2 pred=p pred(ilink)=pa resid=r var(ilink)=var ; id area y _xbeta_ _zgamma_; run; /*model II dist nb*/ proc glimmix data=kemiskinan2 method=laplace; class area ; model y = x1 / dist=nb ddfm= BW solution; random intercept/subject=area solution; ods output covb=covbeta solutionF=beta covparms=ragam asycov=acovsigma2; output out=model2 pred=p pred(ilink)=pa resid=r var(ilink)=var ; id area y _xbeta_ _zgamma_; run; data composite; merge kemiskinan2 design model2; by area; run; /*pendugaan Bayes empirik*/ proc iml; use composite; read all var {y} into y; read all var {pa} into pa; read all var {area} into area; read all var {N} into N; read all var {y_mean} into yi; use ragam; read all var {estimate} into ragam; ragamscale=ragam[2,1]; N_mu=N#pa; Nyi=N#yi;
41
nobs=nrow(y); sigmau=J(nobs,1,ragamscale); gamma=sigmau/(sigmau+N_mu); ypa=(gamma#pa)+((1-gamma)#yi); /*pendugaan proporsi pengangguran*/ g1=(sigmau+nyi)/((n+(sigmau/pa))##2); /*ragam posterior*/ e=ypa-yi; create results var{area ypa g1 yi e}; append; close results; quit; data gabung2; merge composite results; run; proc print data=gabung2; run; /*menginput data model I*/ proc import datafile ="D:tesis/gabungan data/data baru/data/penduga langsung dummy.csv" out = kemiskinandummy dbms = csv replace; delimiter = ";"; getnames=yes; run; proc import datafile ="D:tesis/gabungan data/data baru/data/dummy data.csv" out = kemiskinan2dummy dbms = csv replace; delimiter = ";"; getnames=yes; run; /*data dist poisson model I*/ /*pendugaan parameter fixed dan random*/ proc glimmix data=kemiskinan2dummy method=laplace; class area kategori;
42
model y = x1 x2 x3 kategori/dist=Poisson ddfm=BW solution; random area/type=vc solution; ods output covb=covbeta solutionF=beta covparms=ragam asycov=acovsigma2; output out=modeldummy pred=p pred(ilink)=pa resid=r; id area kategori y _xbeta_ _zgamma_; run; /*data dist nb model I*/ proc glimmix data=kemiskinan2dummy method=laplace; class area kategori; model y = x1 kategori/dist=nb ddfm=BW solution; random area/type=vc solution; ods output covb=covbeta solutionF=beta covparms=ragam asycov=acovsigma2; output out=modeldummy pred=p pred(ilink)=pa resid=r; id area kategori y _xbeta_ _zgamma_; run; /*pendugaan Bayes empirik*/ data composite; merge kemiskinan2dummy kemiskinandummy modeldummy; by area kategori; run; proc iml; use composite; read all var {y} into y; read all var {pa} into pa; read all var {area} into area; read all var {kategori} into kategori; read all var {N} into N; read all var {y_mean} into yi; use ragam; read all var {estimate} into ragam; ragamscale=ragam[2,1]; N_mu=N#pa; Nyi=N#yi; nobs=nrow(y); sigmau=J(nobs,1,ragamscale); gamma=sigmau/(sigmau+N_mu); ypa=(gamma#pa)+((1-gamma)#yi); /*pendugaan proporsi pengangguran*/ g1=(sigmau+nyi)/((n+(sigmau/pa))##2); /*ragam posterior*/ e=ypa-yi;
43
create results var{area kategori ypa g1 yi e}; append; close results; quit; data gabung; merge composite results; run; proc print data=gabung; run;
Model I Poisson Fit Statistics for Conditional Distribution 664.08 -2 log L(Y | r. effects) 207.08 Pearson Chi-Square 1.23 Pearson Chi-Square / DF
Effect Intercept x1 x2 x3 Kategori Kategori Kategori Kategori Kategori Kategori Kategori
Solutions for Fixed Effects Kategori Estimate Standard DF t Valu Error e 1.324 0.1348 20 9.82 0.2372 0.09945 138 2.39 0.1345 0.1291 138 1.04 0.07952 0.1321 138 0.6 -0.9067 0.1828 138 -4.96 1 -0.2624 0.1487 138 -1.76 2 -0.167 0.1448 138 -1.15 3 0.6235 0.1215 138 5.13 4 -0.2377 0.1477 138 -1.61 5 -1.0068 0.1896 138 -5.31 6 0 . . . 7
Negative Binomial Fit Statistics for Conditional Distribution 664.81 -2 log L(Y | r. effects) 152.67 Pearson Chi-Square
Pr > |t| <.0001 0.018 0.3 0.548 <.0001 0.08 0.251 <.0001 0.11 <.0001 .
44
Pearson Chi-Square / DF
0.91
Pendugaan Parameter Covariance Parameter Estimates Cov Parm Estimate Standard Error 0.2104 0.08231 Area 0.1117 0.04928 Scale Kebaikan Model Fit Statistics -2 Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) CAIC (smaller is better) HQIC (smaller is better)
718.04 738.04 739.44 749.82 759.82 741.16
Model II Poisson Fit Statistics for Conditional Distribution 531.84 -2 log L(Y | r. effects) 59.15 Pearson Chi-Square 0.35 Pearson Chi-Square / DF
Effect Intercept x1 x2 x3
Solutions for Fixed Effects Estimate Standard DF t Valu Pr > |t| Error e 1.0057 0.07949 164 12.65 <.0001 0.2091 0.07139 164 2.93 0.0039 0.1349 0.09511 164 1.42 0.1578 0.0794 0.09797 164 0.81 0.4189
Negative Binomal Fit Statistics for Conditional Distribution 792.86 -2 log L(Y | r. effects) 157.88 Pearson Chi-Square
45
Pearson Chi-Square / DF
0.94
Pendugaan Parameter Covariance Parameter Estimates Cov Parm Subject Estimate Intercept Scale Kebaikan Model Fit Statistics -2 Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) CAIC (smaller is better) HQIC (smaller is better)
area
803.45 811.45 811.69 823.94 827.94 816.52
Standar d Error 0.02842 0.1415 0.5892 0.1868
46
RIWAYAT HIDUP Penulis dilahirkan di Maros pada tanggal 5 Oktober 1991, sebagai anak pertama dari pasangan Hanike Gani dan Darmawati Buhari. Pendidikan sekolah menengah ditempuh di SMA Negeri 1 Maros Program IPA, lulus pada tahun 2009. Pada tahun yang sama penulis diterima di program studi Matematika di Universitas Negeri Makassar, Makassar dan menyelesaikannya pada tahun 2013. Kesempatan untuk melanjutkan program master (S2) pada program studi Statistika, Sekolah Pascasarjana IPB, diperoleh pada tahun 2013 dengan program BPPDN dari Direktorat Jendral Pendidikan Tinggi (Dikti). Penulis juga menulis karya ilmiah yang telah dipublikasikan dalam jurnal internasional yang berjudul “Post-stratification Sampling in Small Area Estimation (SAE) Model for unemployment rate by Bayes Approach” diterbitkan pada AIP Conference Proceding, 1707, 080019 (2016); http://dx.doi.org/10.1063/1.4940876 (Agustus 2016), www.scitation.aip.org. Pada tahun 2015 penulis juga pernah mempresentasikan hasil penelitian dengan artikel yang berjudul “Study of Small Area Estimation Model for unemployment rate estimation by bayes approach” pada International Seminar SEAMS UGM , Thailand pada tanggal 18-21 Agustus 2015.