PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
(DS.5) MODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER (Kasus : Pendugaan Proporsi Keluarga Miskin Di kabupaten Jember Jawa Timur) Etis Sunandi1), Khairil A Notodiputro2), Anik Djuraidah3) Alumni Program Studi Statistika Sekolah Pascasarjana IPB, 2) 3) Staf Pengajar Program Studi Statistika, FMIPA, IPB 1)
[email protected], 2)
[email protected], 3)
[email protected]
1)
Abstrak Pendugaan area kecil merupakan suatu metode statistika untuk menduga parameter pada suatu subpopulasi dengan jumlah contohnya berukuran kecil atau bahkan tidak ada. Metode ini memanfaatkan data dari domain besar untuk menduga peubah yang menjadi perhatian pada domain yang lebih kecil. Model-model dalam pendugaan area kecil mengasumsikan bahwa pengaruh acak galat area saling bebas. Namun dalam beberapa kasus, asumsi ini sering dilanggar. Penyebabnya adalah keragaman suatu area dipengaruhi area sekitarnya, sehingga efek spasial dapat dimasukkan ke dalam pengaruh acak area. Rao (2003) menyatakan bahwa salah satu model dalam pendugaan area kecil yang dapat dipengaruhi oleh efek spasial adalah model Logit-Normal. Model tersebut digunakan untuk menduga proporsi melalui metode Bayes berhirarki (Hierarchical Bayes/BB). Tujuan pertama dari penelitian ini adalah mengembangkan metode Bayes untuk data respon biner variabel dengan menambahkan efek spasial. Tujuan terakhir adalah untuk menerapkan metode pendugaan area kecil menggunakan pendekatan BB untuk menentukan proporsi keluarga miskin di Kabupaten Jember. Hasilnya menunjukkan bahwa estimasi langsung dan tidak langsung estimasi proporsi yang diperoleh 10 desa di keluarga miskin lebih dari 50%. Selanjutnya, hasil dari model BB berdasarkan data Susenas Jember, model Logit-Normal dengan tetangga terdekat merupakan model terbaik. Persentase Model diperkirakan keluarga miskin di Jember adalah 40,93%. Kata Kunci : Proporsi Bayes berhirarki, pendugaan area kecil, pembobot spasial, proporsi keluarga miskin
1. PENDAHULUAN Pendugaan area kecil merupakan suatu metode statistika untuk menduga parameter pada suatu subpopulasi dengan jumlah contohnya berukuran kecil atau bahkan tidak ada. Metode ini memanfaatkan data dari domain besar untuk menduga peubah yang menjadi perhatian pada domain yang lebih kecil. Statistik area kecil (small area statistic) telah menjadi perhatian para statistisi dunia secara sangat serius sejak sepuluh tahun terakhir ini. (Rahman 2008). Menurut Russo et al. (2005) pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh dan dikenal sebagai metode pendugaan langsung. Kelemahan metode ini pada subpopulasi adalah tidak memiliki presisi
Jurusan Statistika-FMIPA-Unpad 2011
414
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
yang memadai yang disebabkan oleh kecilnya jumlah contoh yang digunakan untuk memperoleh dugaan tersebut. Oleh karena itu, dikembangkan metode pendugaan secara tidak langsung. Tujuan dari metode pendugaan ini adalah untuk meningkatkan keefektifan ukuran contoh dan menurunkan keragaman sehingga lebih akurat.Menurut Lahiri (2008) dalam Sadik (2009), metode pendugaan tidak langsung pada area kecil pada dasarnya memanfaatkan kekuatan area sekitar dan sumber data di luar area yang statistikanya ingin diperoleh. Model-model dalam pendugaan area kecil mengasumsikan bahwa pengaruh acak galat area saling bebas. Namun dalam beberapa kasus, asumsi ini sering dilanggar. Penyebabnya adalah keragaman suatu area dipengaruhi area sekitarnya, sehingga efek spasial dapat dimasukkan ke dalam pengaruh acak. Efek spasial merupakan hal yang lazim terjadi antara satu area dengan area yang
lain, ini berarti
bahwa area
yang
satu
mempengaruhi area lainnya. Dalam statistika, model yang dapat menjelaskan hubungan antara suatu area dengan area sekitarnya adalah model spasial Penelitian ini membentuk model spasial Bayes pada pendugaan daerah kecil dengan model Logit-Normal yang akan diterapkan pada data kemiskinan. Tema yang diusung dalam penelitian ini yaitu pendugaan proporsi keluarga miskin di Kabupaten Jember Provinsi Jawa Timur. Penelitian ini akan menggunakan peubah respon yang menyebar menurut Binomial (Logit) dan pengaruh area yang menyebar menurut distribusi Normal. Hal ini yang mendasari pemakaian Model Logit-Normal. Sebelum pembahasan yang lebih lanjut, harus dimengerti tentang kemiskinan terlebih dahulu. Kemiskinan didefinisikan sebagai suatu keadaan tidak terpenuhinya kebutuhan hidup sehari-hari, seringkali dihubungkan dengan kebutuhan, kesulitan dan kekurangan sumber daya dalam pengertian yang luas. Menurut BPS, Kemiskinan adalah kondisi seseorang yang hanya dapat memenuhi kebutuhan konsumsi kurang dari 2100 kalori perhari. Patokan kecukupan 2100 kalori ini berlaku untuk semua umur, jenis kelamin, dan perkiraan tingkat kegiatan fisik, berat badan, serta perkiraan status fisiologis penduduk, ukuran ini sering disebut dengan garis kemiskinan. Penelitian ini bertujuan mengembangkan metode Bayes berhirarki khusus untuk data peubah respon biner dengan menambahkan pengaruh spasial dan menerapkan metode pendugaan area kecil melalui pendekatan Bayes berhirarki untuk menentukan proporsi keluarga miskin di Kabupaten Jember Provinsi Jawa Timur.
Jurusan Statistika-FMIPA-Unpad 2011
415
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
2. LANDASAN TEORI 2.1 Model spasial otoregresif bersyarat (Conditional Autoregressive/ CAR) Menurut Banerjee et al. (2004), CAR didefinisikan sebagai model spasial yang menyebar Normal. Model CAR pengaruh acak bersama
= ( ,…,
) diperoleh
pengaruh acak area, dengan area-l, dan Matriks ( −
)
diperoleh dari
bergantung pada pengaruh area lain. Untuk distribusi ( ,( −
~
)
) dengan
merupakan vector
adalah matriks pembobot spasial yang menunjukkan hubungan area-i yaitu Matriks diagonal ragam pengaruh acak area-i = diag
,
,…,
,
.
bersifat simetriks dan definit positif. Sementara itu korelasi spasial ( ) =
; −1 ≤
≤ 1. Menurut Rao 2003,
matriks pembobot spasial Q. Jika
merupakan akar ciri terbesar
= 0, maka model CAR diasumsikan pengaruh acak area-i
saling bebas. Beberapa tipe pola pembentukan matriks pembobot spasial, diantaranya adalah tetangga terdekat dan korelasi. Matriks ini mempunyai aturan sebagai berikut : 1. Matriks pembobot spasial korelasi ( )
=
dengan nilai 0 ≤ | | ≤ 1. 2. Matriks pembobot spasial tetangga terdekat ( )
dengan
=
1 0
adalah korelasi antara area-i dan area-l. Ukuran dari korelasi yang kuat antara
area-i dan area-l jika | | ≥ 0.5,
sedangkan
jarak Euclid antara area-i dengan area-l.
Pembobot spasial tetangga terdekat akan bernilai 1 bila area-i mempunyai korelasi kuat dengan area-l. 2.2 Model Logit-Normal dengan pengaruh spasial Model yang digunakan dalam pendugaan proporsi keluarga miskin area-i melalui metode Bayes berhirarki adalah model Logit-Normal yang didefinisi sebagai berikut: ( ,
| ~
( )= ′ +
=
) , ~
( ,( −
)
)
( )∝1 1
~
( , ) ;
≥ 0,
>0
Prosedur MCMC yang terkenal adalah Gibbs bersyarat. Menurut Rao (2003) Gibbs bersyarat untuk model ini adalah Jurusan Statistika-FMIPA-Unpad 2011
416
PROSIDING Seminar Nasional Statistika | 12 November 2011 i. [ | , ii. [
, ]~
(∑
,
| , , ]~ ( | ,
iii.
∗
[
′) ] , [( − ′ )′( − ′ )] +
+
, ) ∝ ℎ( | ,
Pendugaan parameter
ISSN : 2087-5290. Vol 2, November 2011
(1)
) ( )
dan
dibangkitkan secara langsung dari (i) dan (ii). Parameter ∗
pada bagian (i) persamaan (1) dinyatakan oleh
= (∑
′
) (∑
′
∗
). Sementara
itu, bagian (iii) persamaan (1) dinyatakan sebagai i.
( | ,
, ) ∝ ℎ( | ,
ii.
ℎ( | ,
iii.
( )=
)=
−
(1 −
adalah diagonal matriks (( −
dengan
) ( ) [
−
′ ]
(2)
) )
) pada baris dan kolom ke-i. Nilai proporsi
Bayes berhirarki akan diduga melalui simulasi gibbs sampling Metropolis-Hasting (M-H). Sampel gibbs MCMC dapat dibangkitkan langsung dari (iii) pada persamaan (2). Adapun algoritma M-H adalah sebagai berikut: 1. Diambil sebarang nilai
∗
dari sebaran uniform (0,1). , (( −
2. Dibangkitkan ~ ( )
lalu dicari nilai 3. Dihitung
( )
,
∗
)
) ,
( ).
=
( ∗)
=
( )
,1 ;
= 0, 1, … , 4. Dibangkitkan 5. Dipilih
(
)
dari distribusi uniform (0,1). =
∗
jika
( )
≤
,
∗
.
6. Diulangi langkah 3 sampai diperoleh D sampel. Setelah dilakukan simulasi M-H, diperoleh barisan penduga proporsi sebagai berikut ( )
,…,
( )
;
= 1, … ,
. Kemudian besaran posterior yang sedang diamati dapat dihitung.
Penduga proporsi Bayes berhirarki penduga proporsi Bayes berhirarki | ̂ =
1
( )
−
Jurusan Statistika-FMIPA-Unpad 2011
adalah
≈ ∑
( )
=
(.)
. Sedangkan ragam
adalah (.)
(3)
417
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
3. METODOLOGI PENELITIAN Studi kasus dilakukan pada data Susenas Kabupaten Jember Jawa Timur. Ada dua model yang digunakan dalam penelitian ini yaitu : model Logit-Normal Bayes berhirarki dengan pembobot spasial korelasi (BB1), dan model Logit-Normal Bayes berhirarki dengan pembobot spasial tetangga terdekat (BB2). Data yang digunakan adalah proporsi keluarga miskin untuk desa / kelurahan di Kabupaten Jember Jawa Timur. Data ini merupakan data Survei Sosial-Ekonomi Nasional (Susenas) 2008 yang berbasis rumah tangga serta data Potensi Desa (PODES) 2008 sebagai sumber data pendukung. Adapun peubah penjelas yang diasumsikan mempengaruhi dan menggambarkan proporsi keluarga miskin adalah: Persentase keluarga pertanian ( ), Jumlah keluarga yang menerima kartu ASKESKIN dalam setahun (
), Jumlah keluarga
pengguna listrik PLN ( ), Jumlah sekolah (SD, SMP, SMA, PT) ( ), Jumlah keluarga bertempat tinggal di bantaran/tepi sungai ( ), Jumlah Surat Keterangan Tidak Mampu (SKTM) setahun terakhir ( ), Jumlah lembaga pendidikan keterampilan lainnya ( ), dan Jumlah Tenaga Kerja Indonesia/TKI ( ). 4. HASIL DAN PEMBAHASAN 4.1 Pendugaan Langsung Proporsi Keluarga Miskin Di Jember Pendugaan langsung proporsi keluarga miskin dilakukan pada 35 desa/kelurahan yang ada di Kabupaten Jember. Jumlah contoh yang diambil di setiap desa bervariasi yaitu sebanyak 14-16 rumah tangga. Hasil pendugaan langsung menunjukkan bahwa proporsi keluarga miskin pada desa-desa yang disurvei beragam. Hal ini ditunjukkan oleh nilai koefisien keragaman yang cukup besar yaitu 53.86%. Beberapa nilai statistik penduga langsung tersaji pada Tabel 1. Terdapat 10 desa yang memiliki proporsi keluarga miskin lebih dari setengah. Bahkan, terdapat satu desa yang memiliki proporsi keluarga miskin cukup tinggi sebesar 0.933 yaitu Desa Karang Semanding. Sebaliknya, terdapat dua desa yaitu Desa Arjasa dan Desa Tegal Besar memiliki proporsi keluarga miskin cukup kecil yaitu sebesar 0.063.
Jurusan Statistika-FMIPA-Unpad 2011
418
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
Tabel 1 Nilai-Nilai Statistik Penduga Langsung Proporsi Keluarga Miskin di Kabupaten Jember Jawa Timur Statistik
Penduga Langsung Proporsi
Rata-rata
0.42
Simpangan Baku
0.22
Koefesien Keragaman (%)
53.86
Minimum
0.06
Median
0.38
Maksimum
0.93
4.2 Pendugaan proporsi Bayes Berhirarki Keluarga Miskin di Jember Penggunaan metode BB pada model Logit-Normal dengan pembangkitan MetropolisHasting sebanyak 1000 sampel menghasilkan nilai proporsi (pBB1 dan pBB2) yang berbeda dengan hasil dari pendugaan langsung (PL). Dari hasil tersebut, terdapat 10 desa yang memiliki proporsi keluarga miskin lebih dari setengah. Bahkan, ada beberapa desa yang memiliki proporsi kemiskinan yang cukup besar yaitu lebih dari 0.7 seperti Desa Karang Semanding, Pringgowirawan, Wringin Agung, dan Sukorejo. Pada Desa Karang Semanding pBB1 keluarga miskin sebesar 0.887 yang dapat diartikan terdapat 1950 keluarga miskin dari 2199 keluarga yang tinggal di desa tersebut. Sedangkan pBB2 keluarga miskin di Desa Karang Semanding sebesar 0.875 ini berarti terdapat 1924 keluarga miskin dari 2199 keluarga yang tinggal di desa tersebut. Hal ini mengindikasikan bahwa pendugaan dengan menggunakan BB1 dan BB2 menghasilkan dugaan proporsi yang cukup berbeda. Nilai penduga proporsi Bayes berhirarki mempunyai kecendrungan yang sama dengan penduga proporsi langsung. Hal ini mengindikasikan bahwa pendugaan BB menghasilkan penduga proporsi yang konsisten. Gambar 1 menunjukkan bahwa secara umum penduga proporsi Bayes berhirarki mempunyai nilai yang lebih besar daripada penduga langsung proporsi. Oleh karena itu, dapat dikatakan bahwa penduga peroporsi Bayes berhirarki adalah penduga yang overestimate.
Jurusan Statistika - FMIPA-Universitas Padjadjaran
419
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
0 .0 7 0 .0 6
selisih proporsi
0 .0 5 0 .0 4 0 .0 3 0 .0 2 0 .0 1 0 .0 0 s e lis ih p B B 1 d e n g a n P L
s e lis ih p B B 2 d e n g a n P L
Gambar 1. Diagram kotak selisih antara penduga proporsi Bayes berhirarki (pBB1 dan pBB2) dan penduga langsung proporsi Pendugaan proporsi Bayes berhirarki (pBB) dari data Susenas, model terbaik dipilih hanya berdasarkan nilai dugaan ragam pBB. Walaupun rata-rata ragam
pBB1 dan pBB2
mempunyai nilai yang sama, namun jika dilihat dari ragam penduga proporsi Bayes berhirarki per area, terdapat 24 area yang memiliki nilai ragam pBB1 lebih besar dari pBB2. Dengan kata lain, dapat disimpulkan bahwa BB2 lebih baik dari BB1. Sedangkan bila dilihat perbandingan antara dugaan ragam PL dan pBB, secara umum nilai dugaan ragam pBB lebih kecil dugaan ragam PL. sehingga dapat ditarik kesimpulan bahwa pendugaan proporsi menggunakan model Logit-Normal Bayes berhirarki lebih baik dari pendugaan langsung proporsi. Agregasi persentase keluarga miskin di Kabupaten Jember diduga melalui model-model yang digunakan dalam penelitian ini. Pendugaan langsung menduga bahwa persentase keluarga miskin di Kabupaten Jember Jawa Timur sebesar 39.99%. Model BB1 menduga persentase keluarga miskin di Jember pada tahun 2008 sebesar 41.26% . Selanjutnya, BB2 menduga persentase keluarga miskin di Indonesia sebesar 40.93%. Dengan demikian, hampir 50% keluarga di Jember merupakan keluarga miskin pada tahun 2008.
5. SIMPULAN Hasil pendugaan proporsi Bayes berhirarki pada data Susenas Kabupaten Jember, model Logit-Normal Bayes berhirarki dengan pembobot spasial tetangga terdekat, secara umum memiliki dugaan ragam yang terkecil jika dibandingkan dengan model Logit-Normal Bayes berhirarki dengan pembobot spasial korelasi. Sedangkan bila dilihat perbandingan antara ragam PL dan pBB, secara umum nilai dugaan ragam pBB lebih kecil dugaan ragam PL. sehingga dapat ditarik kesimpulan bahwa pendugaan proporsi menggunakan model Logit-Normal Bayes berhirarki lebih baik dari pendugaan langsung proporsi. Jurusan Statistika - FMIPA-Universitas Padjadjaran
420
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
Pendugaan langsung dan Bayes berhirarki proporsi keluarga miskin di Kabupaten Jember Jawa Timur menduga terdapat 10 desa/kelurahan yang memiliki proporsi keluarga miskin lebih dari 50%. Model Logit-Normal Bayes berhirarki dengan pembobot spasial korelasi menduga persentase keluarga miskin di Jember pada tahun 2008 sebesar 41.26% . Sementara itu, model Logit-Normal Bayes berhirarki dengan pembobot spasial tetangga terdekat menduga persentase keluarga miskin di Indonesia sebesar 40.93%.
6.
DAFTAR PUSTAKA
Battese, G E; Harter, R M; Fuller, WA. 1988. An Error-Components Model for Prediction of County Crop Areas Using Survey and Satellite Data. J Amer Statist Assoc, Vol 83:pp 28-36. Banerjee S, Carlin BP, Gelfan AE . 2004. Hierarchical Modeling and Analysis for Spatial Data. Boca Raton: Chapman & Hall/CRC Press Company. BPS [Badan Pusat Statistik]. 2008. Data dan Informasi Kemiskinan 2008. Jakarta: Badan Pusat Statistik. Rahman LOA. 2008. Aproksimasi Bootstrap Parametrik pada
Pendugaan Selang Prediksi
Statistik Area Kecil [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Rao JNK. 2003. Small Area Estimation. New York: John Wiley and Sons. Russo C, Sabbatini M, Salvatore R. 2005. General Linear Models in Small Area Estimation: an assessment in agricultural surveys. Sadik K. 2009. Metode Prediksi Tak-Bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space [disertasi]. Bogor: Program Pascasarjana, Institut Pertanian Bogor.
Jurusan Statistika - FMIPA-Universitas Padjadjaran
421