Oleh Veni Freista H. (1308100054)
Dosen Pembimbing Dr.rer.pol. Heri Kuswanto
JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2011
Pendahuluan Tinjauan Pustaka Metodologi Penelitian
Analisis dan Pembahasan
Kesimpulan dan Saran
LATAR BELAKANG Angka Kematian Bayi (AKB) sebagai Indikator Kesehatan
Beberapa penelitian telah dilakukan menggunakan regresi
Milenium Development Goals (MDGs)
Ardiyanti (2010) Rani (2011)
Basilia (2003) Model tunggal Bayesian Model Averaging (BMA) untuk Model yang tidak pasti
Faktor pemeriksaan kehamilan, pelayanan kesehatan, tersedianya posyandu, pendidikan ibu, dan penolong persalinan.
AKB Jawa Timur menurun namun tergolong tinggi Persentase persalinan dengan bantuan non medis Faktor utama: jumlah sarana kesehatan, jumlah tenaga medis, dan %persalinan dengan bantuan non medis Faktor lain :rata-rata jumlah pengeluaran RT,rata-rata pemberian ASI eksklusif, % rumah tangga yang memiliki air bersih, dan %penduduk miskin
LATAR BELAKANG Raftery, dkk (1998)
Penelitian sebelumnya tentang aplikasi BMA
Prinsip dasar BMA adalah memprediksi model terbaik berdasarkan ratarata terboboti dari seluruh model terbaiknya
Volinsky (1997), Hoeting, dkk (1999), Liang, dkk (2001), Madigan (1994), Mubwandarikwa, dkk (2005), Montgomery dan Nyhan (2010), Viallefont, dkk (2001)
Hasil dari estimasi mencakup semua sehingga bisa mendapatkan hasil estimasi yang lebih baik (Madigan dan Raftery 1994)
BMA memberikan keakuratan hasil prediksi yang lebih tinggi daripada regresi linier
Bayesian Model Averaging (BMA)
BMA belum pernah digunakan untuk memodelkan kasus di Indonesia
RUMUSAN MASALAH
1
2
3
Bagaimana hasil prediksi Bayesian Model Averaging terhadap faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Timur? Bagaimana hasil prediksi Regresi linier berganda terhadap faktor-faktor yang mempengaruhi angka kematian bayi di Jawa Timur? Bgaimana perbandingan hasil prediksi antara BMA dan Regresi?
TUJUAN PENELITIAN memprediksi faktor yang bepengaruh secara signifikan terhadap angka kematian bayi di Jawa Timur dengan metode bayesian model averaging (BMA) dan regresi linier serta mengetahui perbandingan hasil prediksinya
MANFAAT PENELITIAN
1
• memprediksi faktor-faktor yang berpengaruh secara signifikan terhadap angka kematian bayi yang tergolong tinggi di Jawa Timur dengan harapan bisa memberikan hasil yang lebih akurat daripada regresi linier
2
• referensi mengenai metode statistik baru dalam pemilihan model.
BATASAN MASALAH Data yang digunakan dikhususkan pada data cross section dan tidak melibatkan efek spasial (lokasi daerah)
BAYESIAN MODEL AVERAGING (BMA) Pemilihan model tunggal cenderung mengabaikan ketidakpastian model sehingga bisa menyebabkan hasil estimasi yang kurang tepat. Bayesian model averaging (BMA) adalah salah satu metode untuk menyelesaikan ketidakpastian model dengan merata-ratakan probabilitas posterior dari semua model yang mungkin.
Model BMA dibentuk dari persamaan regresi berikut Misalkan terdapat p variabel prediktor, maka jumlah model yang terbentuk sebanyak q = 2p model. Jika adalah model yang mungkin terbentuk dan adalah nilai yang akan diprediksi maka probabilitas posterior jika diketahui Y adalah rata-rata dari distribusi posterior jika diketahui model diboboti oleh probabilitas model posterior
Persamaan BMA prior
dimana dan
likelihood
prior
Pemilihan Model BMA Penentuan model diterima atau tidak dengan metode occam’s window
dengan nilai c adalah 20. Nilai c tersebut setara dengan alfa 0.05 untuk p value (Jeffreys, 1961). Model dikeluarkan dari persamaan BMA jika probabilitas model posterior lebih besar dari nilai c. Kriteria signifikasi parameter: Pr[β1≠0|D] < 50% maka X1 tidak signifikan Jika diantara 50%-75% maka ada bukti yang lemah untuk menyatakan X1 sebagai faktor penyebab, jika diantara 75%-95% maka ada bukti yang cukup kuat, antara 95%-99% menunjukkan bahwa terdapat bukti yang kuat, jika lebih dari 99% maka bukti yang ada sangat kuat
REGRESI LINIER BERGANDA Model regresi berganda adalah sebagai berikut
dengan Ŷ = nilai penduga bagi variabel Y b0, b1, . . ., bk = dugaan bagi parameter konstanta β0, β1, . . ., βk e = error
Pengujian Parameter Model Regresi 1. Uji Serentak H 0 : β1 = β 2 = β 3 = β p = 0 H1: minimal ada satu βi ≠ 0, i=1,2,…p Statistik uji
Jika FHitung > Fα(v1,v2) maka H0 ditolak
2. Uji Individu H 0 : βi = 0 H1: βi ≠ 0
Statistik uji H0 ditolak apabila thitung > ttabel yaitu t(α/2,n-p-1)
Uji Asumsi Regresi Uji Normalitas Kolmogorov Smirnov H0 H1
: Residual berdistribusi normal : Residual tidak berdistribusi normal
Statistik uji H0 diterima apabila nilai D lebih kecil dari Dtabel
Uji Linieritas dengan metode grafik Pengujian Multikolinearitas diindikasikan dengan nilai VIF. Pengujian Heterokedastisitas uji Gletser
Dilakukan untuk mengetahui ada tidaknya hubungan antara residual (error) dengan variabel bebasnya.
Pengujian Autokorelasi (hub.linier antar error) H0 : 0 H1 : 0
Statistik uji
n
d
e t 2
t
et 1
n
e t 1
2
2 t
1. Jika d < dl, berarti terdapat autokorelasi positif 2. Jika d > (4 – dl), berarti terdapat autokorelasi negatif 3. Jika du < d < (4 – dl), berarti tidak terdapat autokorelasi 4. Jika dl < d < du atau (4 – du), berarti tidak dapat disimpulkan
Kesalahan Prediksi digunakan untuk mengetahui tingkat keakuratan dari hasil yang diperoleh. Kesalahan prediksi bisa diketahui melalui selang kepercayaan untuk dugaan nilai y.
Angka Kematian Bayi (AKB) Kematian bayi adalah kematian yang terjadi saat bayi lahir sampai sebelum mencapai usia satu tahun. Dari sisi penyebabnya
Kematian endogen: terjadi pada bulan pertama setelah bayi dilahirkan, umumnya disebabkan oleh faktor bawaan Kematian Eksogen: terjadi antara usia satu bulan sampai satu tahun, umumnya disebabkan oleh faktor yang berkaitan dengan pengaruh lingkungan
Dinas Kesehatan
Sosio ekonomi
tempat tinggal, pendidikan ibu dan indeks kesejahteraan ibu.
Biologis
jenis kelamin anak, usia ibu, paritas dan interval kelahiran.
Faktor lain
berat waktu lahir, pemeriksaan antenatal dan penolong persalinan juga dipertimbangkan berpengaruh terhadap angka kematian bayi yang tinggi tersebut, yang untuk tahap lanjutan perlu dilakukan studi lebih dalam.
METODOLOGI PENELITIAN
Data Sekunder
Dinas Kesehatan Jawa Timur TAHUN 2009
METODOLOGI PENELITIAN Variabel penelitian 1. Jumlah kematian bayi per 1000 kelahiran hidup (Y) 2.Prosentase sarana kesehatan (RS dan puskesmas) (X1) 3. Prosentase tenaga kesehatan (X2)
Tenaga kesehatan meliputi medis, perawat, bidan, farmasi, kesehatan masyarakat, gizi, keterapian fisik, dan teknisi medis. 4. Prosentase posyandu (X3)
5. Prosentase kelahiran ditolong non medis (X4) 6. Prosentase bayi yang tidak diberi ASI eksklusif (X5) ASI eksklusif adalah pemberian ASI saja tanpa makanan dan minuman lain sampai bayi berusia 6 bulan.
7. Prosentase ibu yang tidak melakukan kunjungan bayi (X6) kunjungan anak usia kurang dari satu tahun (29 hari-11 bulan) untuk mendapatkan pelayanan
8. Prosentase ibu hamil risti (X7) Ibu hamil risti adalah ibu hamil dengan keadaan penyimpangan dari normal yang secara langsung menyebabkan kesakitan dan kematian bagi ibu maupun bayinya. 9. Prosentase berat badan lahir rendah (kurang dari 2500 gram) (X8) 10. Prosentase rumah tidak sehat (X9) bangunan rumah tinggal yang memenuhi syarat kesehatan yaitu memilik jamban sehat, tempat pembuangan sampahu, sarana air bersih, sarana pembuangan air limbah, ventilasi baik, kepadatan hunian rumah sesuai dan lantai rumah tidak dari tanah. 11.Prosentase penduduk miskin (X10)
Langkah Penelitian Statistika Deskriptif Membagi data menjadi data training sebanyak 30 data dan data testing sebanyak 8 data Meregresikan data training Y dan X Estimasi parameter data training
Uji asumsi
Membuat model prediksi BMA
Memilih model terbaik
Menghitung kesalahan prediksi dengan data testing
Menghitung kesalahan prediksi dengan data testing Membandingkan hasil BMA dan regresi linier Kesimpulan
ANALISIS DAN PEMBAHASAN Deskripsi Angka Kematian Bayi di Jawa Timur 39.6
36.65
35.32
32.93
32.2
31.41
31.28 23
2004
2005
2006
2007
2008
2009
AKB JawaTimur per 1000 kelahiran hidup
2010
target MDGs
0 Pacitan Ponorogo Trenggalek Tulungagung Blitar Kediri Malang Lumajang Jember Banyuwangi Bondowoso Situbondo Probolinggo Pasuruan Sidoarjo Mojokerto Jombang Nganjuk Madiun Magetan Ngawi Bojonegoro Tuban Lamongan Gresik Bangkalan Sampang Pamekasan Sumenep Kediri (Kota) Blitar (Kota) Malang (Kota) Probolinggo (Kota) Pasuruan (Kota) Mojokerto (Kota) Madiun (Kota) Surabaya (Kota) Batu (Kota)
jumlah kematian bayi
Jumlah kematian bayi tiap kabupaten/kota 350
300
250
200
150
100
50
Faktor-Faktor yang Mempengaruhi Kematian Bayi Bayesian Model Averaging Hipotesis yang digunakan adalah sebagai berikut. H0: i 0 H1 : i 0 dengan i=1,2,…,10
Variabel Prediktor Konstan Rasio jumlah sarana kesehatan Rasio jumlah tenaga kesehatan Rasio jumlah posyandu % kelahiran ditolong non medis % bayi yang tidak diberi ASI eksklusif % ibu yang tidak melakukan kunjungan bayi % ibu hamil risti % berat badan lahir rendah % rumah tidak sehat Rasio jumlah penduduk miskin
Variabel signifikan
Posterior probabilities (%)
EV
SD
100 100 59.5 18.5 21.6 10.9
196.4 -37750 -308.3 -69.43 -0.4028 0.02529
61.4285 5570.03 331.19 233.26 1.15 0.13
100
2.233
0.62
42.2 100 67.1 9
-1.283 35.87 -0.4245 -0.01334
1.98 6.99 0.39 0.2
Lima Model Terbaik BMA Variabel
Model 1
Model 2
Model 3
Model 4
Model 5
Intercept
187.1
236.9
145.4
164.4
219.2
X1
-36480.0
-38030.0
-34160.0
-39480.0
-41010.0
X2
-540.5
-517.6
-541.0
*
*
X3
233.26
*
*
*
*
X4
1.15
*
*
*
*
X5
0.1348
*
*
*
*
X6
2.328
2.022
2.44
2.262
1.935
X7
*
-2.751
*
*
-2.966
X8
33.28
37.3
36.42
33.06
37.4
X9
-0.5971
-0.6902
*
-0.5977
-0.6981
X10
*
*
*
*
*
R2
0.823
0.839
0.792
0.792
0.811
Post prob.
0.127
0.099
0.062
0.060
0.046
Berdasarkan probabilitas posterior diatas maka model Bayesian Model Averaging
Kesalahan Prediksi BMA CI
Pengamatan Y bawah
Y
Keterangan
Y atas
Y1
25.82255
139.1822
120
Masuk
Y2
140.5658
253.9255
311
Tidak masuk
Y3
21.64318
135.0028
213
Tidak masuk
Y4
137.8012
251.1608
123
Tidak masuk
Y5
75.9335
189.2932
118
Masuk
Y6
26.32289
139.6826
76
Masuk
Y7
66.00323
179.3629
93
Masuk
Y8
-78.8976
34.46202
49
Tidak masuk
Kesalahan prediksi
50%
Regresi Linier Berganda Model regresi berganda 𝑦 = 257 − 38412𝑋1 − 405𝑋2 − 289𝑋3 − 0.78𝑋4 + 0.218𝑋5 + 2𝑋6 − 3.24𝑋7 + 39.3𝑋8 − 0.663𝑋9 + 0.091𝑋10
Uji Serentak H 0: i 0 H1 : Minimal ada satu i 0 dengan i=1,2,…,10
Ftabel=2,38
Sumber
SS
F
P Value
Regresi
111387
10.60
0.000
Eror
19966
Total
131353
Uji Individu
H0: i 0 H1 : i 0
signifikan
dengan i=1,2,…,10
Variabel Prediktor Koefisien Konstan 257.29 Rasio jumlah sarana -38412 kesehatan Rasio jumlah tenaga -404.6 kesehatan Rasio jumlah posyandu -288.7 % kelahiran ditolong -0.778 non medis % bayi tidak diberi ASI 0.2179 eksklusif % ibu tidak melakukan 1.9960 kunjungan bayi % ibu hamil risti -3.240 % berat badan lahir 39.317 rendah % rumah tidak sehat -0.6634 Rasio jumlah penduduk 0.0913 miskin R2 84.8 %
SE 81.69 5931
Pvalue 0.005 0.000
337.5
0.245
464.3 1.889
0.541 0.685
0.3600
0.552
0.6507
0.006
2.177 7.523
0.153 0.000
0.4252 0.6685
0.135 0.893
Uji Asumsi Uji Normalitas H0: Residual berdistribusi normal H1 : Residual tidak berdistribusi normal
KS= 0.130 < Dtabel=0.242 P value > 0.15
Terima H0
Uji Linieritas H0: Model linier H1 : Model tidak linier
Titik-titik pengamatan memiliki korelasi yang rendah namun masih cenderung mengikuti garis sehingga model linier
Uji Multikolineritas Variabel Prediktor
VIF
Rasio jumlah sarana kesehatan
1.9
Konstan
Rasio jumlah tenaga kesehatan Rasio jumlah posyandu
1.7 1.6
% kelahiran ditolong non medis
2.4
% bayi yang tidak diberi ASI eksklusif % ibu yang tidak melakukan kunjungan bayi
1.4
% ibu hamil risti % berat badan lahir rendah (BBLR)
% rumah tidak sehat Rasio jumlah penduduk miskin
1.6
1.8 1.9 2.4 2.1
Nilai VIF semua variabel < 10 sehingga tidak ada multikolinearitas
Uji Autokorelasi H0 : 0 H1 : 0
nilai Durbin-Watson sebesar 2.46460 dengan nilai D tabel yaitu Dl sebesar 0.712 dan Du sebesar 2.363. Nilai Du < D < (4-Dl) yang berarti tidak terdapat autokorelasi. Uji Heteroskedastisitas
Sumber Regresi Error Total
SS 1812.8 2218.4 4031.2
F 1.55
P Value 0.196
P Value > 0.05 sehingga tidak terjadi gejala heteroskedastisitas
Kesalahan Prediksi CI
Pengamatan
Y bawah
Y atas
Y
Keterangan
Y1
25.33672
132.8122
120
Masuk
Y2
135.3236
242.799
311
Tidak masuk
Y3
5.418861
112.8943
213
Tidak masuk
Y4
133.4973
240.9727
123
Tidak masuk
Y5
80.85981
188.3353
118
Masuk
Y6
11.29726
118.7727
76
Masuk
Y7
73.85866
181.3341
93
Masuk
Y8
-89.7974
17.67804
49
Tidak masuk
Kesalahan prediksi
50%
Perbandingan Bayesian Model Averaging dan Regresi Linier Nilai Signifikasi Parameter dan Standar Error dengan BMA dan Regresi BMA Variabel
Regresi
Probabilitas posterior (%)
SE
Pvalue
SE
Rasio jumlah sarana kesehatan
100*
5570.03
0.000*
5931
Rasio jumlah tenaga kesehatan
59.5*
331.19
0.245
337.5
Rasio jumlah posyandu
18.5
233.26
0.541
464.3
% kelahiran ditolong non medis % bayi yang tidak diberi ASI eksklusif
21.6
1.15
0.685
1.889
10.9
0.13
0.552
0.3600
% ibu yang tidak melakukan kunjungan bayi
100*
0.62
0.006*
0.6507
% ibu hamil risti
42.2
1.98
0.153
2.177
% BBLR
100*
6.99
0.000*
7.523
% rumah tidak sehat
67.1*
0.39
0.135
0.4252
9
0.2
0.893
0.6685
Rasio jumlah penduduk miskin
Catatan: * menunjukkan variabel yang signifikan
Standart error BMA lebih kecil daripada regresi
Kesalahan Prediksi
BMA Regresi
Kesalahan prediksi 50% 50%
Memberikan hasil yang sama yaitu dengan kesalahan prediksi sebesar 50%
Kesimpulan Faktor-faktor yang mempengaruhi jumlah kematian bayi di Jawa Timur menggunakan BMA adalah rasio jumlah sarana kesehatan, prosentase ibu yang tidak melakukan kunjungan bayi, prosentase berat badan lahir rendah (BBLR), rasio jumlah tenaga kesehatan, dan prosentase rumah tidak sehat
Faktor-faktor yang mempengaruhi jumlah kematian bayi di Jawa Timur menggunakan Regresi berganda adalah rasio jumlah sarana kesehatan, prosentase ibu yang tidak melakukan kunjungan bayi, dan prosentase berat badan lahir rendah (BBLR)
Standart error dari setiap parameter BMA lebih kecil daripada regresi pada semua variabel prediktornya. Hal ini menunjukkan bahwa BMA memberikan estimasi parameter β yang lebih efisien daripada regresi. Namun jika dilihat dari kesalahan prediksinya, BMA dan regresi memberikan hasil yang sama yaitu masing-masing sebesar 50%.
Saran •
•
Menambah variabel prediktor mengenai sosial ekonomi agar bisa memberikan hasil yang lebih jelas mengenai faktor-faktor yang mempengaruhi jumlah kematian bayi. Menambah data testing agar bisa mengetahui lebih jelas perbedaan hasil prediksi antara metode BMA dan regresi. Data testing yang sedikit bisa menyebabkan peluang yang besar untuk memberikan hasil yang sama dalam menghitung kesalahan prediksi.
DAFTAR PUSTAKA
Ardiyanti, S.T. 2010. Pemodelan Angka Kematian Bayi dengan Pendekatan Geographically Weighted Poisson Regression di Provinsi Jawa Timur. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Badan Pusat Statistik.(2009). Survei Sosial Ekonomi Nasional Propinsi Jawa Timur. Surabaya. Brown,P.J., Vannucci, M., Fearn,T.(2002). Bayesian Model Averaging With Selection Of Regressors. J. R. Statist. Soc. B Part 3, pp. 519–536. Dinas Kesehatan.(2009). Profil Kesehatan Propinsi Jawa Timur. Surabaya. Draper N and Smith H, (1992). Analisis Regresi Terapan Edisi 2: Penerbit PT Gramedia Pustaka Utama, Jakarta. Hoeting, J, Madigan, D, Raftery, A.E, and Volinsky, C.T. (1999). Bayesian Model Averaging: A Tutorial. Statistical Science 14:382–401. Liang, F. M, Troung, Y, and Wong, W. H. (2001). Automatic Bayesian Model Averaging for Linear Regression and Applications in Bayesian Curve Fitting. Statistical Science, 11(4):1005-1029. Madigan, D, Raftery, A. E.(1994). Model Selection and Accounting for Model Uncertainty in Graphical Models Using Occam’s Window. Journal of the American Statistical Association,Vol.89, No.428,1535-1546. Montgomery, J. and Nyhan, B.(2010). Bayesian Model Averaging: Theoretical developments and Practical Applications. Society for Political Methodology working paper. Raftery, A. E, Madigan, D, and Hoeting, J. (1997). Bayesian Model Averaging for Linear Regression Models. Journal of the American Statistical Association. 92. Rani, D.S. 2011. Pemodelan Angka Kematian Bayi dengan Pendekatan Geographically Weighted Poisson Regression Semiparametric di Provinsi Jawa Timur. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Volinsky, C. T. (1997). Bayesian Model Averaging for Censored Survival Models. Ph.D. Dissertation, Univ. Washington, Seattle. Viallefont, V, Raftery, A.E, Richardson, S. (2001). Variable Selection and Bayesian Model Averaging in Case-Control Studies. Statistical in Medicine.