SEMINAR NASIONAL TEKNOLOGI 2015 Institut Teknologi Nasional Malang ISSN: 2407 – 7534
Small Area Estimation dengan Pendekatan Empirical Bayes Berbasis Model Beta-Binomial Untuk Estimasi Angka Pengangguran di Kabupaten Sumba Timur Lamatur Heribertus Sidabutar1, Dr. Dra. Ismaini Zain, M.Si2
1
Mahasiswa Magister Statistika, Institut Teknologi Sepuluh Nopember 2, Dosen Jurusan Statistika, Institut Teknologi Sepuluh Nopember Email:
[email protected],
[email protected]
ABSTRAK Dalam era otonomi daerah, dibutuhkan suatu perencanaan dan pengambilan kebijakan sampai level yang terkecil. Untuk itu diperlukan informasi yang rinci mengenai indikator pembangunan, tidak hanya untuk level kabupaten/kota saja namun diharapkan sampai level kecamatan dan bahkan hingga level kelurahan/desa. Salah satu indikator pembangunan yang penting adalah data pengangguran. Akan tetapi, data pengangguran yang menjadi kebutuhan pemerintah otonomi daerah tersebut hingga saat ini belum bisa tersedia pada tingkat kecamatan karena keterbatasan cakupan sampel pada Survei Angkatan Kerja Nasional (Sakernas) yang dilaksanakan oleh BPS. Masalah tersebut dapat diberikan solusi dengan menerapkan Small Area Estimation (SAE), salah satunya dengan pendekatan Empirical Bayes berbasis model Beta-Binomial. Empirical Bayes merupakan suatu metode pendugaan yang terdiri dari fungsi kepekatan peluang prior, fungsi kepekatan peluang posterior dan fungsi kepekatan peluang marginal. Salah satu model yang dapat digunakan dalam metode Empirical Bayes adalah model Beta-Binomial, karena model ini memenuhi ketiga fungsi kepekatan peluang tersebut. Model Beta-Binomial digunakan dalam penelitian ini karena cocok untuk data biner. Tujuan dari penelitian ini adalah melakukan kajian terhadap estimator pada metode Empirical Bayes berbasis model Beta-Binomial dan menerapkannya untuk mendapatkan estimasi angka pengangguran tingkat kecamatan di Kabupaten Sumba Timur. Kemudian dilakukan perbandingan hasil estimasi langsung dan metode Empirical Bayes berbasis model Beta-Binomial melalui nilai MSE dengan pendekatan Jackknife dan Bootstrap. Kata kunci: Angka Pengangguran, Small Area Estimation, Empirical Bayes, Model Beta-Binomial, Jackknife, Bootstrap
ABSTRACT In the era of regional autonomy, we need a planning and policy-making until the smallest level of area. It required detailed information on development indicators, not only to the level of district/city, but it is expected to district level and even up to the level of the urban/rural. One of important development indicator is the unemployment data. However, the unemployment data that is needed by the local autonomous government until now could not be available at the district level due to the limited scope of the sample at the National Labour Force Survey conducted by the BPS. These problems may be given a solution by applying the Small Area Estimation (SAE), one of the Empirical Bayes approach based BetaBinomial models. Empirical Bayes is an estimation method comprising density function prior opportunities, opportunities posterior density function and density function of marginal opportunities. One model that can be used in the method of Empirical Bayes is Beta-Binomial models, because this model meets the third function of density opportunity. Beta-Binomial models used in this study because it is suitable for binary data. The purpose of this study is a review of the method of Empirical Bayes estimator based on BetaBinomial models and apply them to obtain the estimated unemployment rate of districts in East Sumba. Then performed a direct comparison of the results of estimation and Empirical Bayes methods based on Beta-Binomial models through the MSE with Jackknife and Bootstrap approach. Keywords: Unemployment, Small Area Estimation, Empirical Bayes, Model Beta-Binomial, Jackknife, Bootstrap
Pendahuluan Dalam era otonomi daerah dibutuhkan suatu perencanaan dan pengambilan kebijakan sampai level yang terkecil. Untuk itu diperlukan suatu informasi yang rinci mengenai indikator pembangunan, tidak hanya untuk level kabupaten/kota saja namun diharapkan sampai level kelurahan/desa. Seiring dengan perkembangan otonomi daerah tersebut, Badan Pusat Statistik (BPS) dituntut untuk memproduksi statistik dan menyajikannya sebagai informasi, sesuai SENATEK 2015 | Malang, 17 Januari 2015
639
SEMINAR NASIONAL TEKNOLOGI 2015 Institut Teknologi Nasional Malang ISSN: 2407 – 7534
kebutuhan daerah sebagai bentuk kontribusi positif BPS sebagai lembaga statistik nasional dalam mendukung perencanaan dan kebijakan pembangunan daerah. Salah satu indikator penting yang dapat digunakan untuk mendukung perencanaan dan kebijakan pembangunan daerah adalah indikator ketenagakerjaan. Indikator ketenagakerjaan di Indonesia diukur oleh Badan Pusat Statistik salah satunya dengan Tingkat Pengangguran Terbuka (TPT) atau disebut angka pengangguran. Angka pengangguran di Kabupaten Sumba Timur yaitu sebesar 3,05 persen, menempati urutan ke-7 tertinggi dari 21 kabupaten/kota yang ada di Provinsi NTT. Angka pengangguran di Kabupaten Sumba Timur yang masih cukup tinggi bila dibandingkan dengan kabupaten/kota lain di Provinsi NTT ini menjadi salah satu perhatian pemerintah daerah sehingga membutuhkan informasi pengangguran sampai level area kecil di bawah kabupaten/kota sebagai dasar kebijakan yang akan dilakukan. Akan tetapi, data pengangguran tingkat kecamatan yang menjadi kebutuhan pemerintah otonomi daerah tersebut belum bisa direalisasikan oleh pemerintah pusat. Selama ini pemerintah pusat melalui BPS menyajikan angka pengangguran hanya sampai tingkat kabupaten/kota saja. Penyebabnya adalah cakupan sampel Survei Angkatan Kerja Nasional (Sakernas) sebagai dasar penghitungan pengangguran hanya dirancang untuk estimasi pada tingkat kabupaten/kota. Pada dasarnya, estimasi angka pengangguran tingkat kecamatan akan terpenuhi apabila pemerintah daerah mampu menyediakan anggaran untuk menambah jumlah ukuran sampel. Namun, masalah muncul ketika tidak semua daerah mampu mengalokasikan anggaran tersebut sehingga perlu diterapkan metode statistik yang dapat memenuhi ketersediaan informasi meskipun sumber daya yang dimiliki terbatas. Jika penghitungan angka pengangguran tingkat kecamatan dilakukan secara langsung tanpa penambahan sampel maka disebut sebagai estimasi langsung yang dihadapkan dengan masalah besarnya standard error yang dihasilkan sebagai akibat dari kecilnya ukuran sampel serta dipaksakan untuk mendapatkan estimasi area kecilnya. Menurut Hasanudin [2], masalah tersebut menjadi alasan perlunya metode estimasi dengan cara tidak langsung yang dapat mengurangi standard error. Solusi yang tepat untuk masalah tersebut adalah dengan menerapkan metode Small Area Estimation (SAE). Pendugaan sederhana area kecil yang didasarkan pada penerapan model desain penarikan sampel (design-based) disebut sebagai pendugaan langsung (direct estimation). Pendugaan langsung tidak mampu memberikan ketelitian yang cukup bila ukuran sampel dalam small area berukuran kecil, sehingga statistik yang dihasilkan akan memiliki varian yang besar atau bahkan pendugaan tidak dapat dilakukan karena tidak terwakili dalam survei (Prasad dan Rao, [4]). Metode-metode pendugaan parameter alternatif dalam SAE antara lain Empirical Best Linier Unbiased Prediction (EBLUP), Empirical Bayes (EB) dan Hierarchical Bayes (HB) Estimation (Ghosh dan Rao, [1]). Metode EBLUP menduga parameter yang meminimumkan Mean Square Error dengan mensubstitusi komponen varian yang tidak diketahui dengan penduga varian melalui data sampel. Dalam metode EB, parameter model diestimasi dari distribusi marginal data untuk selanjutnya inferensi didasarkan pada distribusi posterior yang diestimasi. Kemudian dalam metode HB, pendugaan didasarkan pada distribusi posterior dimana parameter diestimasi dengan rata-rata posterior dan presisinya diukur dengan varian posteriornya (Ghosh dan Rao, [1]). Dikatakan Kismiantini [3] bahwa model standar untuk data biner adalah model Binomial. Pada metode Bayes parameter yang digunakan merupakan variabel random yang mempunyai distribusi tertentu (distribusi prior) (Walpole dan Myers, [6]). Dalam kasus data berdistribusi Binomial, distribusi prior yang digunakan diantaranya adalah distribusi prior konjugate Beta (Rao, [5]). Dengan demikian dalam kerangka SAE, metode SAE pendekatan Empirical Bayes berbasis model Beta-Binomial dapat menjadi alternatif untuk mengatasi masalah estimasi angka pengangguran. Pada makalah ini bertujuan untuk menerapkan metode Empirical Bayes berbasis model Beta-Binomial untuk mendapatkan estimasi angka pengangguran tingkat kecamatan di Kabupaten Sumba Timur Provinsi NTT dan melakukan perbandingan hasil estimasi langsung dan metode Empirical Bayes berbasis model BetaBinomial melalui nilai MSE.
Metode Penelitian Data yang digunakan dalam makalah ini adalah data sekunder yang bersumber dari Badan Pusat Statistik (BPS) yaitu raw data SAKERNAS 2013 dan raw data Podes 2014. Variabel yang menjadi perhatian dalam makalah ini adalah tingkat pengangguran terbuka (TPT) atau yang SENATEK 2015 | Malang, 17 Januari 2015
640
SEMINAR NASIONAL TEKNOLOGI 2015 Institut Teknologi Nasional Malang ISSN: 2407 – 7534
biasa disebut dengan angka pengangguran, dimana variabel pengamatan yi adalah jumlah pengangguran pada kecamatan ke-i dan ni adalah jumlah angkatan kerja pada kecamatan ke-i. Tahapan Analisis Data 1.
Menghitung dugaan langsung proporsi dan ragam proporsi pengangguran masing-masing kecamatan di kabupaten Sumba Timur dengan formula:
ˆi ˆi yi ˆ ˆ dan Var i i ni ni
dimana yi = jumlah pengangguran pada kecamatan ke-i
ni = jumlah angkatan kerja pada kecamatan ke-i ˆi = dugaan langsung proporsi rumah tangga miskin kelurahan ke-i 2.
Menghitung proporsi dan ragam proporsi pengangguran di kabupaten Sumba Timur menggunakan rataan dan ragam terboboti dengan formula:
ˆ dimana
ˆ
n n i n i ˆi dan s2 i n i ˆi ˆ T T
2
= rataan terboboti kabupaten Sumba Timur
nT T ni
s2 = ragam terboboti kabupaten Sumba Timur 3.
Menduga parameter sebaran beta-binomial ˆ dan ˆ dengan metode momen Kleinman menggunakan rataan dan ragam contoh terboboti dari persamaan:
ˆ ˆ ˆ dan diperoleh:
ˆ dan
nT s2 ˆ 1 ˆ m 1 1 ˆ ˆ 1 ˆ 1 ˆ nT i ni2 nT m 1
ˆ 1 ˆ nT ni2 nT m 1 i 1 dan ˆ ˆ 2 ˆ ˆ nT s 1 m 1 2 ˆ 1 ˆ nT ni nT m 1 i 1 1 1 ˆ ˆ nT s2 ˆ 1 ˆ m 1 ˆ dimana ˆ dan dugaan parameter sebaran Beta-Binomial
4. Melakukan pendugaan Empirical Bayes proporsi pengangguran
ˆ EB i
masing-masing
kecamatan di kabupaten Sumba Timur menggunakan formula:
ˆiEB ˆi ˆ , ˆ ˆiˆi 1 ˆi ˆ
dimana
ˆi
ni ni ˆ ˆ
ˆi = dugaan langsung proporsi pengangguran kecamatan ke-i ˆ = dugaan langsung proporsi pengangguran di kabupaten Sumba Timur
5.
Menghitung kuadrat galat tengah (MSE) dari penduga Empirical Bayes menggunakan metode Jackknife, dan Bootstrap dengan tahapan sebagai berikut: SENATEK 2015 | Malang, 17 Januari 2015
641
SEMINAR NASIONAL TEKNOLOGI 2015 Institut Teknologi Nasional Malang ISSN: 2407 – 7534
a. Metode Jacknife Proses perhitungan MSE menggunakan metode Jacknife adalah sebagai berikut: o
Mˆ 1i dengan formula:
Hitung nilai
m 1 Mˆ 1i g1i ˆ , ˆ , yi g1i ˆ l , ˆl , yi g1i ˆ , ˆ , yi m l 1
dimana
ˆ
m
g1i ˆ , ˆ , yi merupakan ragam posterior g1i
l
, ˆl , yi
merupakan ragam posterior yang diperoleh dengan menghapus
pengamatan ke-l o
Hitung
Mˆ 2i dengan formula:
m 1 m ˆ EB ˆ EB Mˆ 2i i , l i m l 1
2
dimana
ˆiEB
adalah penduga proporsi Empirical Bayes
ˆiEB ,l
adalah penduga proporsi Empirical Bayes yang diperoleh dengan menghapus
pengamatan ke-l. Hitung
MSEJ ˆiEB dengan formula:
MSEJ ˆiEB Mˆ 1i Mˆ 2i b. Metode Bootstrap Proses perhitungan MSE menggunakan metode Bootstrap adalah sebagai berikut: o
Menghitung penduga ragam proporsi Empirical Bayes g1i
ˆ dan penduga ragam 2 v
g ˆ b hasil resampling bootstrap sebanyak B kali. B
proporsi Empirical Bayes
1i
b 1
2 v
ˆ o Menghitung M 1i , B menggunakan persamaan:
1 B Mˆ 1i , B 2 g1i ˆ v2 g1i ˆ v2 b B b1 o
Menghitung penduga proporsi Empirical Bayes Bayes
o
ˆiEB b
Menghitung
dan penduga proporsi Empirical
Mˆ 2i , B menggunakan persamaan
2
Menghitung kuadrat tengah galat
ˆiEB
hasil resampling bootstrap.
1 B Mˆ 2i , B ˆiEB b ˆiEB B b 1 o
MSEB ˆiEB
dengan menggunakan persamaan
MSEB ˆiEB Mˆ 1i , B Mˆ 2i , B 6. 7.
Membandingkan kuadrat tengah galat dari penduga langsung dengan penduga Empirical Bayes. Membandingkan kuadrat galat tengah galat dari penduga Empirical Bayes antara metode Jacknife dan Bootstrap.
SENATEK 2015 | Malang, 17 Januari 2015
642
SEMINAR NASIONAL TEKNOLOGI 2015 Institut Teknologi Nasional Malang ISSN: 2407 – 7534
Hasil dan Pembahasan Pada makalah ini, terdapat dua penduga proporsi yang digunakan dalam menduga proporsi angka pengangguran di Kabupaten Sumba Timur yakni dengan penduga langsung dan dengan penduga Empirical Bayes dari model Beta-Binomial. Penduga langsung merupakan penduga yang diperoleh dari banyaknya pengangguran per jumlah angkatan kerja yang diperoleh dari survei. Sedangkan penduga Empirical Bayes merupakan penduga yang dihitung berdasarkan penduga langsung dengan pembobot yang diperoleh dari model Beta-Binomial. Dugaan proporsi angka pengangguran pada setiap kecamatan untuk masing-masing metode dapat dilihat pada tabel 1 di bawah ini: Tabel 1. Hasil perhitungan dugaan angka pengangguran di Kabupaten Sumba Timur No
Nama Kecamatan
Langsung
EB
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Lewa Nggaha Ori Angu Lewa Tidahu Katala Hamu Lingu Tabundung Pinu Pahar Paberiwai Karera Matawai La Pawu Kahaungu Eti Mahu Ngadu Ngala Pahunga Lodu Wula Waijelu Rindi Umalulu Pandawai Kambata Mapambuhang Kota Waingapu Kambera Haharu Kanatang
1,4706 3,3333 5,2632 4,6610 2,7778 1,7857 2,9703 3,4091 3,5714 3,0303 4,7619 2,2222 4,0816 3,7736 3,0021 2,4783 2,1078 3,1403 1,3278 1,5724 2,5573 2,4736
1,5484 3,2768 5,1132 4,3257 2,4553 1,8312 2,7688 3,3087 3,4733 3,1233 4,7544 2,3122 3,9943 3,5954 3,1052 2,4557 2,0067 3,1288 1,2153 1,4459 2,5698 2,4554
Kemudian untuk membandingkan keakuratan antara penduga langsung dengan penduga Empirical Bayes, dilihat dari nilai MSE nya. Pada tabel 2 dapat dilihat bahwa nilai MSE untuk penduga Empirical Bayes lebih kecil dibandingkan dengan MSE penduga langsung. Hal ini menunjukkan bahwa penduga proporsi area kecil menggunakan model BetaBinomial lebih akurat jika dibandingkan dengan penduga langsung. Tabel 1. Hasil perhitungan MSE dengan metode langsung, Jackknife dan Bootstrap Empirical Bayes No 1 2 3
Nama Kecamatan Lewa Nggaha Ori Angu Lewa Tidahu
Langsung 0,1523 0,1875 0,0586
Jackknife
Bootstrap
0,0073 0,0089 0,0033
0,0071 0,0087 0,0032
SENATEK 2015 | Malang, 17 Januari 2015
643
SEMINAR NASIONAL TEKNOLOGI 2015 Institut Teknologi Nasional Malang ISSN: 2407 – 7534
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Katala Hamu Lingu Tabundung Pinu Pahar Paberiwai Karera Matawai La Pawu Kahaungu Eti Mahu Ngadu Ngala Pahunga Lodu Wula Waijelu Rindi Umalulu Pandawai Kambata Mapambuhang Kota Waingapu Kambera Haharu Kanatang
0,25 0,0303 0,1094 0,1875 0,2461 0,1709 0,1600 0,0622 0,0850 0,0604 0,1875 0,1523 0,0482 0,1957 0,0301 0,1423 0,1534 0,2755 0,1054
0,0127 0,0010 0,0054 0,0089 0,0130 0,0046 0,0081 0,0037 0,0024 0,0018 0,0089 0,0073 0,0027 0,0065 0,0013 0,0043 0,0035 0,0112 0,0083
0,0122 0,0010 0,0053 0,0087 0,0124 0,0046 0,0078 0,0036 0,0024 0,0018 0,0087 0,0071 0,0025 0,0062 0,0013 0,0041 0,0031 0,0110 0,0081
Kesimpulan Berdasarkan hasil penerapan pada data pengangguran di kabupaten Sumba Timur dapat diambil kesimpulan bahwa penduga Empirical Bayes berbasis model Beta-Binomial lebih dapat diandalkan daripada penduga langsung, yang diperlihatkan dengan semakin kecilnya nilai MSE. Sebagai saran, perbaikan pendugaan Empirical Bayes pada model Beta-Binomial dapat dilakukan dengan memasukkan variabel penyerta ke dalam model.
Daftar Pustaka 1. Gosh, M. dan Rao, J.N.K., (1994), “Small Area Estimation : An Appraisal”, Statistical Sciences, Institute of Mathematical Statistics, Vol. 9, No. 1, hal. 55-76
2. Hasanudin, N. (2011). Pertimbangan Penting yang Mendasari Penggunaan Metode Small Area 3. 4. 5. 6.
Estimation. Prosiding Seminar Nasional Statistika 2011 Universitas Padjadjaran (hal. 218-226). Bandung: UNPAD. Kismiantini (2007), Pendugaan Statistik Area Kecil dengan Metode Empirical Constrained Bayes. Makalah ini disampaikan pada Seminar Nasional Matematika. UPI Bandung, 8 Desember 2007 Prasad, N.G.N. dan Rao, J.N.K., (1990), “The Estimation of Mean Squared Errors of Small Area Estimation”, Journal of American Statistical Association, 85, hal.163-171. Rao, J.N.K. (2003), Small Area Estimation. New Jersey: John Wiley & Sons, Inc. Walpole, R. E dan Myers, R. H., (1986), Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Terbitan Kedua, ITB, Bandung.
SENATEK 2015 | Malang, 17 Januari 2015
644