PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
(DS.4) MODEL OTOREGRESIF SIMULTAN BAYES UNTUK ANALISIS DATA KEMISKINAN Safaat Yulianto1, Anik Djuraidah2, Aji Hamim Wigena2 1Akademi Statistika Muhammadiyah Semarang 2Jurusan Statistika, Institut Pertanian Bogor Abstrak Simultaneous Autoregressive (SAR) adalah model spasial yang berasal dari persamaan regresi linear dengan galatnya dimodelkan dalam bentuk model otoregresif. Dalam penelitian terdahulu (Meilisa, 2010) menggunakan metode kemungkinan maksimum/maximum likelihood (ML) dalam pendugaan parameter tanpa mempertimbangkan informasi awal (prior). Pada penelitian ini digunakan pendekatan metode Bayes dengan informasi awal yang terdiri dari independence Jeffreys, Jeffreys-rule dan uniform. Data yang digunakan adalah Headcount Index tingkat kabupaten di Provinsi Jawa Timur yang merupakan data sekunder berasal dari hasil Pendataan Potensi Desa/Kelurahan tahun 2008 yang dilakukan oleh BPS. Berdasarkan analisis diperoleh model Bayesian Simultaneous Autoregressive (SAR Bayes) terbaik yaitu dengan informasi awal Jefrreys-rule, model SAR dan model SAR Bayes sama baiknya digunakan dalam menentukan faktor-faktor untuk menganalisis kemiskinan di Provinsi Jawa Timur. Kata kunci: otoregresif simultan Bayes, prior noninformatif, fungsi kemungkinan terintegrasi, matriks tetangga terdekat 1.
PENDAHULUAN Permasalahan
kemiskinan
tidak
hanya
berdiri
sendiri,
sehingga
dalam
penanggulangannya menuntut pemahaman, kecermatan dan kehati-hatian. Berbagai upaya dilakukan pemerintah untuk mengatasi masalah kemiskinan. Strategi dan bentuk intervensi yang tepat dari pemerintah dalam upaya mengurangi kemiskinan di tanah air diantaranya ketersediaan data kemiskinan yang akurat. Strategi penanggulangan kemiskinan lebih efektif dengan pendekatan geografis yang akan berhubungan dengan sumber daya alam dan manusia, karena kemiskinan suatu wilayah dipengaruhi oleh kemiskinan di wilayah sekitarnya. Hal ini berdasarkan hukum geografi I yang dikemukakan Tobler yang berbunyi ”Segala sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang lebih dekat mempunyai pengaruh dari sesuatu yang jauh” (Waller & Gotway, 2004). Adanya efek spasial merupakan hal yang lazim terjadi antara satu wilayah dengan wilayah yang lain, ini berarti bahwa wilayah yang satu mempengaruhi wilayah lainnya. Dalam statistika, model yang dapat menjelaskan hubungan antara suatu wilayah dengan wilayah sekitarnya disebut sebagai model spasial.
Jurusan Statistika-FMIPA-Unpad 2011
406
PROSIDING Seminar Nasional Statistika | 12 November 2011 2.
ISSN : 2087-5290. Vol 2, November 2011
MODEL SAR Model SAR dideskripsikan sebagai suatu model yang mempertimbangkan apabila suatu
daerah yang dipilah-pilah menjadi subdaerah-subdaerah, antara subdaerah yang satu dan subdaerah lainnya saling berhubungan secara simultan, {Ai : i = 1, 2, ..., n}, Ai melambangkan kumpulan dari subdaerah-subdaerah. Misalkan
(
):
gaussian acak dimana {A1,..., An} bentuk lattice dari D, dengan
∈( ∪
,…,
) adalah proses
∪… ∪
=
dan Ai
Aj = 0; ∀ i ≠ j (Oliviera & Song, 2008). Peubah y(Ai) merupakan peubah respon untuk setiap subdaerah yang diobservasi dengan peubah penjelas xi = (xi1, ... , xip)’ dimana p < n. Untuk penyederhanaan, peubah y(Ai) selanjutnya dituliskan dalam notasi yi. Model regresi SAR dari y = (y1, ... , yn) dapat dituliskan dalam persamaan: =
′
+ ∑
− ′
+
, i = 1, ..., n
(1)
Jika dimisalkan B = (bij)nxn , maka persamaan (1) dapat dituliskan : =
+ ( −
)+
dengan β = (β1, ..., βp)’, ε = (ε1 ,..., εn)’ diasumsikan εi ~N(0,σi2) sehingga y ~ N[X β, ( (In - B)-1 M (In - B’)-1)]
(2)
M = σ2In, dan σ2 > 0 tidak diketahui ; (In - B) = matriks nonsingular B=
dengan
merupakan parameter spasial yang tidak diketahui
W = (wij)nxn merupakan matriks pembobot spasial simetri yang nonnegatif. Matriks pembobot spasial pada dasarnya merupakan matriks ketergantungan spasial yang menggambarkan hubungan antar daerah. Kedekatan suatu daerah berdasarkan ketergantungan spasial biner, sehingga matriks pembobot ini mempunyai aturan sebagai berikut : =
1, untuk daerah yang bersebelahan dengan daerah 0, untuk lainnya
Baris pada matriks ketergantungan spasial menunjukkan hubungan spasial suatu daerah dengan daerah lain.
3.
MODEL SAR BAYES Model Bayesian Simultaneous Autoregressive (SAR Bayes) adalah model spasial yang
berasal dari persamaan regresi linear dengan galatnya dimodelkan dalam bentuk model otoregresif. Peubah acak pada satu daerah dan daerah lainnya diamati secara simultan sedangkan pendugaan parameternya memanfaatkan informasi awal dan informasi contoh. Misalkan yi peubah acak yang mempunyai sebaran pada persamaan (2) maka fungsi kemungkinan dari
=( ,
, ) berdasarkan data yang diobservasi sebagai berikut:
Jurusan Statistika-FMIPA-Unpad 2011
407
PROSIDING Seminar Nasional Statistika | 12 November 2011
( | )∝(
)
=(
dengan
− )(
−
( −
)′
)=(
−
−
( −
ISSN : 2087-5290. Vol 2, November 2011
)
(3)
)
Sebaran informasi awal dari η adalah : ( )∝ (
( )
,
)
,
(4)
dengan Ω = Rp x (0,∞) merupakan ruang parameter yang memiliki ciri khas tergantung pada pembobotnya,
R yang nilainya ditetapkan (Gill, 2002) dan
informasi awal marginal dari
( ) merupakan
dalam selang (λn-1, λ1-1); λi , untuk i = 1, ..., n adalah nilai akar
ciri dari matriks pembobot W. Fungsi posterior dari persamaan (3) dan (4) dinotasikan sebagai berikut: ∫
( , )
dengan
( | ) ( )
( | )∝ =( −
( | ) ( )
=
(5)
′ )′
( −
) ;
=(
( | ) disebut fungsi kemungkinan terintegrasi dari
)′(
)
(Oliviera & Song, 2008).
Informasi awal noninformatif digunakan yakni: 1. Informasi awal Jeffreys Informasi awal Jeffreys terbagi menjadi dua, yakni : i) informasi awal independence Jeffreys ( )∝ ∑
−
∑
ii) informasi awal Jeffreys-rule ( )∝|
(
−
|
)
( )
2. Informasi awal uniform Informasi awal uniform memberikan bobot nilai yang sama untuk semua nilai ( )∝1
parameter spasial, di tuliskan sebagai :
,
( )
Dalam tahapan pendugaan parameter model, ketika menggunakan metode bayes berhirarki, maka perhitungan yang dilakukan biasanya melalui integral multidimensi, alternatif yang dapat digunakan yakni menghitung besaran posterior melalui integrasi numerik dan salah satu metode yang digunakan adalah algoritma MCMC. Pendugaan parameter model didasarkan sampel pada sebaran posterior : ( ,
, | )= ( |
, , ) (
| , ) ( | )
dari persamaan (3) dan (4) diketahui bahwa : (i)
( |
, , )~
Jurusan Statistika-FMIPA-Unpad 2011
,
(
)
408
PROSIDING Seminar Nasional Statistika | 12 November 2011
(
(ii)
| , )~
+
(iii) ( ( | ) ∝
ISSN : 2087-5290. Vol 2, November 2011
− 1,
(6) (
)
( )
Simulasi dari (i) dan (ii) untuk mendapatkan parameter
dan
pada persamaan (6)
dapat dibangkitkan secara langsung dengan menggunakan algoritma MCMC, sedangkan untuk mendapatkan sampel
dari (iii) pada persamaan (6) diselesaikan dengan
menggunakan algoritma Adaptive Rejection Metropolis Sampling (ARMS) yang diusulkan oleh Gilks dkk. (1995). 4.
PEMILIHAN MODEL TERBAIK Metode yang digunakan untuk memilih model bayes terbaik dengan Bayesian
Information Criterion (BIC) dan ragam dari penduga, sedangkan kebaikan model dapat dilihat dari nyata atau tidaknya koefisien parameter model dan nilai koefisien determinasi (R2). Untuk menghitung nilai BIC digunakan rumus sebagai berikut: BIC = -2log L + p log (n) dengan L = nilai maksimum dari fungsi kemungkinan p = banyaknya parameter dalam model ; n = banyaknya ulangan Model dikatakan baik jika memiliki nilai BIC yang kecil. Selain metode tersebut, nilai ragam penduga juga dapat menjadi kriteria pemilihan model terbaik. Penduga dikatakan baik jika memiliki ragam yang kecil. Untuk menghitung ragam penduga digunakan rumus sebagai berikut: var ( ) = E( ) − [E( )] Untuk pemilihan model yang terbaik dapat digunakan uji kebaikan model, yakni dengan menggunakan koefisien determinasi yang dinotasikan dengan : ∑(
= ∑(
) )
Sedangkan Kuadrat Tengah Galat (KTG) digunakan untuk membandingkan antara model SAR Bayes dan model SAR. Untuk menghitung KTG digunakan rumus sebagai berikut: =
∑(
− −
)
Model dikatakan baik jika memiliki nilai KTG yang lebih kecil dibandingkan model lainnya.
Jurusan Statistika-FMIPA-Unpad 2011
409
PROSIDING Seminar Nasional Statistika | 12 November 2011 5.
ISSN : 2087-5290. Vol 2, November 2011
DATA Dalam penelitian ini digunakan data Potensi Desa (Podes) 2008 dari BPS Provinsi Jawa
Timur. Peubah respon pada penelitian ini adalah headcount index (HCI) kemiskinan di tingkat kabupaten. HCI adalah persentase penduduk yang berada dibawah garis kemiskinan. Garis Kemiskinan (GK) merupakan penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non-Makanan (GKNM), dengan GKM adalah jumlah nilai pengeluaran dari 52 komoditi dasar makanan yang dikonsumsi penduduk, disetarakan dengan 2100 kalori perkapita sehari, sedangkan GKNM adalah penjumlahan nilai kebutuhan dari komoditi non makanan terpilih meliputi perumahan, sandang, pendidikan dan kesehatan (BPS 2008). Berdasarkan Meilisa (2010), peubah penjelas dari data Podes yang signifikans dengan model, yaitu : persentase penduduk yang mempunyai pendidikan dibawah SD (X1), persentase rumah tangga yang tidak menggunakan air minum yang tidak berasal dari air mineral, air PAM, pompa air, sumur atau mata air yang terlindung (X2), persentase penduduk yang mendapatkan jaminan pemeliharaan kesehatan (X3),
persentase
penduduk
yang
dibolehkan membeli beras dengan harga murah bersubsidi (X4) dan persentase penduduk yang mendapat surat miskin (X5). 6.
HASIL PEMBAHASAN
Analisis Model SAR Bayes Hasil pendugaan berdasarkan tiga informasi awal noninformatif dengan pengambilan contoh sebanyak 2.000 kali. Dari hasil pendugaan tersebut diperoleh perbandingan nilai BIC pada Tabel 1 yang menunjukkan bahwa nilai BIC yang terkecil diperoleh pada pendugaan dengan informasi awal Jeffreys-rule, sehingga dapat dikatakan pendugaan model SAR Bayes terbaik didapatkan jika pendugaannya menggunakan informasi awal Jeffreys-rule. Tabel 1 Perbandingan Nilai BIC dan Ragam Penduga Indep. Jeffreys
Jeffreys-rule
Uniform
BIC
Ragam
73.0231
72.1088
73.0995
b0
0.2297
0.1898
0.2185
b1
0.0064
0.0053
0.0066
b2
0.0065
0.0054
0.0064
b3
0.0033
0.0025
0.0032
b4
0.0112
0.0091
0.0108
b5
0.0026
0.0023
0.0026
0.0707
0.0414
0.0673
0.0032
0.0030
0.0032
Jurusan Statistika-FMIPA-Unpad 2011
410
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
Koefisien model SAR Bayes dengan informasi awal Jeffreys-rule yang sesuai tertera pada Tabel 2 menunjukkan bahwa semua nilai pendugannya nyata. Koefisien determinasi (R2)
model sebesar
99.43% menggambarkan
proporsi
keragaman
peubah yang
mempengaruhi persentase penduduk di bawah garis kemiskinan dapat dijelaskan dengan peubah penjelas yang dipilih. Tabel 2 Koefisien Penduga Model SAR Bayes Penduga b0 b1 b2 b3 b4 b5 R2
Koefisien 3,111 0,835 0,163 0,113 0,350 0,358 0,100 0.9943
se Koefisien 0,4213 0,0716 0,0712 0,0515 0,0929 0,0477 0,0555
t-hitung 7,3836 11,6647 2,2822 2,1933 3,7680 7,5089 1,7948
p value 0,0000* 0,0000* 0,0293* 0,0357* 0,0007* 0,0000* 0,0809*
Keterangan : *) nyata pada α = 10% Berdasarkan hasil perhitungan tersebut dapat diketahui bahwa besarnya nilai penduga untuk persentase penduduk yang mempunyai pendidikan dibawah SD mengindikasikan sumbangan terbesar bagi kenaikan persentase penduduk di bawah garis kemiskinan, sehingga peubah tersebut seharusnya menjadi prioritas utama dalam program pengentasan kemiskinan. Hubungan spasial yang ada akan mempengaruhi persentase kemiskinan sebesar 0.10 yang berpengaruh terhadap peningkatan persentase penduduk di bawah garis kemiskinan di Provinsi Jawa Timur. Pengujian asumsi regresi pada model SAR Bayes dengan informasi awal Jeffreys-rule yakni : a. Asumsi Kehomogenan Uji ini dapat dilihat dari plot sisaan pada Gambar 1(a). Dari plot sisaan terhadap dugaan dari model ini memberikan petunjuk bahwa plot tidak mengikuti pola tertentu dan menyebar merata serta tidak cenderung berada di sekitar garis nol. Plot ini menunjukkan asumsi homos- kedastisitas atau uji kehomogenan sisaan terpenuhi. b. Asumsi Kenormalan Pengujian asumsi sisaan berdistribusi normal atau uji kenormalan terlihat pada Gambar 1(b). Berdasarkan gambar tersebut terlihat plot sisaan cenderung terlihat disekitar garis lurus, yang menunjukkan sisaan mengikuti distribusi normal. Hal ini
Jurusan Statistika-FMIPA-Unpad 2011
411
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
diperkuat dengan nilai Kolmogorov-Smirnov (KS) sebesar 0.118 dengan nilai pvalue > 0.150 yang menunjukkan sisaan berdistribusi normal.
(a) (b) Gambar 1 Uji homoskedastisitas atau uji kehomogenan sisaan terhadap nilai dugaan dari model SAR Bayes dari 38 kabupaten/kota (a), Uji sisaan berdistribusi normal atau uji kenormalan pada model SAR Bayes menggunakan informasi awal Jeffreys-rule (b) c. Asumsi Otokorelasi Sisaan Uji ini dilakukan dengan uji Durbin Watson (DW). Hasil pengolahan yang diperoleh, nilai uji DW sebesar 1.757. Pada p = 5, α = 1%, n = 38, diperoleh nilai dL = 1.02 dan nilai dU = 1.58, karena dU < DW < 4-dL, maka DW nyata yang berarti tolak H0 sehingga disimpulkan asumsi tidak ada otokorelasi pada sisaan terpenuhi. Analisis Perbandingan Model SAR Bayes dan Model SAR Beberapa kriteria yang tercantum dalam Tabel 3, menunjukkan bahwa nilai koefisien determinasi, nilai R2adjust, dan nilai KTG dari model SAR Bayes dan model SAR untuk kasus kemiskinan di Provinsi Jawa Timur sama. Tabel 3. Hasil perbandingan model Bayesian SAR dan model SAR Penduga
Bayesian SAR
SAR
b0 b1 b2 b3 b4 b5
3.111 0.835 0.163 0.113 0.350 0.358 0.750 0.100 0.9943 0.9860 0.8629
3.269 0.849 0.133 0.114 0.358 0.357 0.820 0.121 0.9989 0.9860 0.8638
R2 R2adjust MSE
Jurusan Statistika-FMIPA-Unpad 2011
412
PROSIDING Seminar Nasional Statistika | 12 November 2011 7.
ISSN : 2087-5290. Vol 2, November 2011
SIMPULAN
Dari tiga informasi awal noninformatif yang digunakan, informasi awal Jeffreys-rule merupakan informasi awal terbaik dalam model SAR Bayes.
Berdasarkan nilai koefisien determinasi, nilai R2adjust, dan nilai Kuadrat Tengah Galat (KTG), model SAR dan model SAR Bayes sama baiknya digunakan untuk menganalisis kemiskinan di Provinsi Jawa Timur berdasarkan peubah-peubah penjelas yang dipilih dalam model.
8.
DAFTAR PUSTAKA
[BPS] Badan Pusat Statistik. 2008. Data dan Informasi Kemiskinan 2008. Jakarta: Badan Pusat Statistik. Gilks WR, Best NG, Tan KKC. 1995. Adaptive Rejection Metropolis Sampling within Gibbs Sampling. Journal of the Royal Statistical Society. Series C (Applied Statistics) 44(4):455472 Gill J. 2002. Bayesian Methods: A Social and Behavioral Sciences Approach. Chapman & Hall/CRC Press Company Meilisa M. 2010. Model Otoregresif Simultan dan Otoregresif Bersyarat untuk Analisis Kemiskinan di Provinsi Jawa Timur [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Oliviera V de, Song JJ. 2008. Bayesian Analysis of Simultaneous Autoregressive Models. The Indian Journal of Statistics 70-B(2):323-350. Waller RA, Gotway CA. 2004. Applied Spatial Statistics for Public Health Data. New Jersey: JohnWiley & Sons, Inc.
Jurusan Statistika-FMIPA-Unpad 2011
413