PEMODELAN REGRESI POISSON PADA FAKTOR-FAKTOR FAKTOR FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI JAWA TIMUR TAHUN 2007
Yayuk Listiani NRP 1306 100 068 DOSEN PEMBIMBING
Dr. Purhadi, M. Sc. JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2010
LATAR BELAKANG
• Masih tingginya Angka Kematian Bayi di Indonesia termasuk Indonesia termasuk Jawa Timur • Perkembangan angka kematian dari tahun ketahun adalah salah satu Perkembangan angka kematian dari tah n ketah n adalah salah sat alat untuk menilai keberhasilan program pembangunan kesehatan
• AKB diasumsikan berdistribusi Poisson
• Regresi Poisson
Perumusan Masalah
Tujuan
• Bagaimana mendapatkan model Generalized regresi poisson yang terbaik dan faktor yang mempengaruhi IMR di IMR di Provinsi Jawa Timur tahun 2007 dengan menggunakan kriteria AIC?
• Menentukan model Generalized regresi poisson yang terbaik dan menentukan faktor‐faktor yang y g mempengaruhi IMR di provinsi Jawa Timur tahun 2007 dengan menggunakan kriteria AIC.
Regresi Poisson dimana
yi adalah Variabel repon e − μ ( x i ;β ) [ μ ( x i ; β )] y i f ( yi ; β ) = yi !
μ(xi ;β)adalah Model regresi
xi adalah Variabel prediktor β adalah parameter
Model regresi poisson mempunyai logaritma sebagai berikut.
μ( x i,β ) = exp( β 0 + β1x 1 + L + β k x k )
ln( μ ) = ( β 0 + β 1 x1 + L + β k x k )
Kolinieritas Pendeteksian adanya kasus kolinieritas menurut Hocking (1996) dapat d t dilihat dilih t melalui: l l i 1). VIF ( Variance Inflation Factor) Nilai VIF yyang g bernilai 1 menunjukkan j bahwa variabel prediKtor tidak saling berkorelasi. Sedangkan jika VIF lebih besar dari 10 maka hal tersebut menunjukkan adanya kolinieritas antar variabel predictor. 2). ) Bila koefisien f korelasi pearson antar variabel prediktor lebih dari 0.95 maka menunjukkan adanya kolinieritas antar variabel prediktor. 3) Bila 3). Bil nilai il i minimum i i eigen i (λi) pada d matriks t ik korelasi k l i antar t variabel prediktor kurang dari 0.05 maka menunjukkan adanya kolinieritas antar variabel prediktor. prediktor
Generalized Poisson Regression (GPR) Generalized Poisson Regression (GPR) yi
⎛ μi ⎞ (1 + ω yi ) yi −1 ⎡ − μi (1 + ω yi ) ⎤ exp f ( μi , ω , yi ) = ⎜ ⎟ ⎢ ⎥ + + 1 ! 1 ωμ y ωμ i ⎠ i i ⎝ ⎣ ⎦
E( y i x i ) = μ i
V ( y i | xi ) = μ i (1 + ωμ i ) 2
Jika ω = 0 maka model regresi GP akan menjadi regresi Poisson biasa. Jika ω > 0, maka model regresi GP merepresentasikan data count yang overdispersion, dan jika ω < 0 underdispersion.
Estimasi Parameter Salah satu metode penaksiran parameter yang dapat digunakan untuk menaksir parameter adalah parameter adalah metode MLE. Bentuk MLE Bentuk umum fungsi likelihood likelihood untuk regresi poisson adalah sebagai berikut. −
e
n
∑ μ ( x i ;;ββ ) ⎡ ⎢ ⎣
i =1
L ( yi , β ) =
n
∏
⎤
μ (x i ; β )y i ⎥
i =1
⎦
n
∏
yi!
i =1
Fungsi ln-likelihood untuk regresi poisson adalah: ln( L ( y i , β )) =
∑ [y ( x n
i
i =1
T i β)
]
− exp( x iT β ) − ln ( y i !)
Pengujian Parameter Parameter Uji Serentak dengan hipotesis: H0 : β 1 = β 2 L = β k = 0 H1 : paling tidak ada satu βj ≠ 0, j = 1,2,…,k Statistik uji:
⎡ ⎛ L(ωˆ ) ⎞⎤ ⎟⎥ G = −2 ⎢ln⎜⎜ ˆ ) ⎟⎥ ⎢⎣ ⎝ L(Ω ⎠⎦ 2
ˆ) L (Ω
L(ωˆ ) 2 Tolak H0 jika Ghitung ≥ χ v2,α Dengan v adalah banyaknya parameter model dibawah populasi dikurangi dengan banyaknya parameter dibawah H d b k t dib h H0
Pengujian Parameter Pengujian terhadap parameter model regresi Poisson secara individu Pengujian terhadap parameter model regresi Poisson secara individu menggunakan hipotesis: H0 : βi = 0 H1 : β : βi ≠ 0 ≠0 Statistik uji: βˆ
ti =
i
SE( βˆi )
H0 akan ditolak jika |thit|> tα/2;v dimana α adalah tingkat signifikansi dan v adalah derajat bebas. Pemilihan Model Terbaik Menurut Bozdogan (2000) Akaike Information Criterion (AIC) didefinisikan Menurut Bozdogan (2000) Akaike Information Criterion (AIC) didefinisikan sebagai berikut. AIC = −2 ln L(θˆ) + 2k L (θˆ) adalah maksimum likelihood, dan k adalah jumlah parameter adalah maksimum likelihood dan k adalah jumlah parameter
Kematian Bayi Kematian bayi adalah kematian yang terjadi antara saat setelah bayi lahir sampai bayi belum berusia tepat satu tahun. tahun Kematian bayi endogen atau yang umum disebut dengan kematian neonatal; adalah kematian bayi yang terjadi pada bulan pertama setelah dilahirkan, umumnya disebabkan oleh faktor-faktor yang dibawa anak sejak lahir. Kematian bayi eksogen atau kematian post neo-natal, adalah kematian bayi yang terjadi setelah usia satu bulan sampai menjelang usia satu tahun yang disebabkan oleh faktor-faktor yang bertalian dengan pengaruh lingkungan luar.
Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari hasil Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2007 yang dilakukan oleh BPS (Badan Pusat Statistika). Pada penelitian ini menggunakan data IMR (angka kematian bayi) pada tahun 2007 untuk tiap Kabupaten/ Kota di b / d Provinsi Jawa Timur yang terdiri d dari d 38 Kabupaten/Kota. b /
Variabel respon adalah data angka kematian bayi tahun 2007 pada Provinsi J Jawa Ti Timur d variabel dan i b l prediktor(X) dikt (X) adalah d l h sebagai b i berikut. b ik t No.
Nama Variabel
(1)
(2)
1
X1
Jumlah sarana kesehatan (RS & puskesmas) pada tiap kabupaten/kota
2
X2
Persentase persalinan yang dilakukan dengan bantuan non medis (dukun bayi) pada tiap kabupaten/kota
3
X3
Rata-rata usia perkawinan pertama pada tiap kabupaten/kota
4
X4
Rata-rata lama sekolah wanita berstatus kawin pada tiap kabupaten/kota
5
X5
Rata-rata jumlah pengeluaran rumah tangga (dalam rupiah) pada tiap kabupaten/kota per bulan
6
X6
Persentase daerah yang berstatus desa pada tiap kabupaten/kota
7
X7
Rata-rata lama pemberian ASI eksklusif pada tiap kabupaten/kota
8
X8
Persentase rumah tangga yang memiliki air bersih pada tiap kabupaten/kota
9
X9
Persentase penduduk miskin pada tiap kabupaten/kota
Analisis Deskriptif Statistik Deskriptif Data Infant Mortality di Provinsi Jawa Timur pada Tahun 2007 V i b l Variabel
M Mean
St Deviasi St. D i i
Mi i Minimum
M ki Maksimum
y
21,03
19,10
0,00
60,00
x1
116,42
51,55
15,00
228,00
x2
15,11
17,37
0,49
68,31
x3
19,65
0,965
18,00
21,54
x4
6,758
1,782
2,45
10,22
x5
265744
67469
191840
456992
x6
55,25
31,06
0,00
91,67
x7
8,956
1,547
6,68
12,49
x8
62,15
12,29
40,56
99,11
x9
15,93
9,30
2,03
35,88
rata-rata Infant Mortality di Provinsi Jawa Timur pada tahun 2007 adalah 21,03 dengan jumlah kematian paling sedikit 0 orang dan paling banyak 60 orang.
Kolinieritas Antar Variabel Prediktor Semua variabel ilai
x1
x2
x3
x4
x5
x6
x7
x8
x9
VIF
1,678
9,400
12,183
21,325
8,811
13,931
1,689
1,475
5,024
Eigen
5,317
1,357
0,744
0,634
0,437
0,349
0,081
0,052
0,029
Nilai AIC model regresi poisson Regresi Poisson
AIC
Variabel Signifikan
Semua Variabel
727,4
X1,X3,X4,X6,X7,X8
T Tanpa X3
738 3 738,3
X1,X X2,X X3,X X6,X X7,X X8
Tanpa X4
732,3
X1,X2,X3,X7,X8
Tanpa X6
730,9
X1,X2,X3,X7,X8
Model Regresi Poisson Model Regresi Poisson
Parameter
Estimasi
SE
DF
t
P-Value
β0
7,8052
0,002047
38
3813,36
< 0,0001
β1
-0,00377
0,000929
38
-4,06
0,0002
β2
-0,00345
0,004196
38
-0,82
0,4167
β3
-0,4648
0,05278
38
-8,81
< 0,0001
β4
0,2180
0,08118
38
2,69
0,0107
β5
-0,00000467
0,00000175
38
-0,27
0,7905
β6
0,00996
0,003329
38
2,99
0,0048
β7
0,1292
0,02735
38
4,72
< 0,0001
β8
0,02709
0,003819
38
7,09
< 0,0001
β9
0,004119
0,008107
38
0,51
0,6143
Deviasi/df adalah19,3786 Æ Overdispersi
Model Regresi Generalized Poisson Model
AIC
exp( β 0 + β 6 x6i )
315,2
exp( β 0 + β 5 x5i + β 8 x8i )
316,6
exp(β0 + β3 x3i + β5 x5i + β8 x8i )
318 4 318,4
exp(β 0 + β1 x1i + β 2 x2i + β 3 x3i + β 5 x5i )
320,3
exp( p(β0 + β1 x1i + β 2 x2i + β3 x3i + β5 x5i + β8 x8i ) exp(β 0 + β1 x1i + β 2 x2i + β3 x3i + β 4 x4i + β 7 x7i + β8 x8i )
321,8 323,2
exp(β 0 + β 1 x1i + β 2 x 2i + β 3 x 3i + β 6 x 6i + β 7 x 7 i + β 8 x 8i + β 9 x 9i )
324,7
exp((β 0 + β1 x1i + β 2 x2i + β 3 x3i + β 4 x4i + β 6 x6i + β 7 x7i + β8 x8i + β 9 x9i )
326,1
Nilai Estimasi Parameter Model Regresi Generali ed Poisson di Provinsi Nilai Estimasi Parameter Model Regresi Generalized Poisson di Pro insi Jawa Ja a Timur Tim r Tahun Tah n 2007
Parameter
Estimasi
SE
DF
T
P-Value
β0
10 5728 10,5728
0 00469 0,00469
38
2254 3 2254,3
<0 0001 <0,0001
β1
-0,00306
0,003713
38
-0,82
0,4153
β2
-0,01107
0,01128
38
-0,98
0,3325
β3
-0 3248 -0,3248
0 08632 0,08632
38
-3 76 -3,76
0 0006 0,0006
β5
-0,00000242
0,0000053
38
-0,45
0,6524
ω
0,1946
0,03577
38
5,44
<0,0001
Nilai ω > 0, maka model regresi GP merepresentasikan data count yang overdispersion
Pengujian Parameter Dengan hipotesis: H0 : β1 = β 2 L = β k = 0 H1 : paling tidak ada satu βj ≠ 0, j = 1,2,…,k Keputusan: Tolak H0 Æ Nilai ‐2 log likelihood adalah 308,3
Dengan hipotesis : H0 : βi = 0 (pengaruh variabel ke‐i tidak signifikan) i ifik ) H1 : βi ≠ 0 (pengaruh variabel ke‐i signifikan) Keputusan: X3ÆTolak H0 Æ nilai |thit|>ttabel(2.0244) (2 0244)
S hi Sehingga diperoleh model regresi generalized di l h d l i li d poisson berikut: i b ik t μˆ = exp(10,5728 - 0,00306 x1 - 0,01107 x 2 - 0,3248 x3 - 0,00000242 x5 )
Faktor yang mempengaruhi jumlah angka kematian bayi di Provinsi Jawa Timur adalah jumlah sarana kesehatan, persentase persalinan yang dilakukan dengan bantuan non medis, rata‐rata usia perkawinan pertama dan rata‐rata jumlah pengeluaran rumah tangga (dalam rupiah) per bulan pada tiap kabupaten/kota.
KESIMPULAN Model regresi poisson yang diperoleh ternyata tidak memenuhi asumsi equi‐dispersion sehingga digunakan model regresi generalized poisson untuk pemodelan data angka kematian bayi di provinsi Jawa Timur tahun k d l d k k i b i di i iJ Ti h 2007. Dari analisis dan pembahasan pada bab 4 diperoleh model regresi generalized poisson dengan kriteria pemilihan model terbaik AIC adalah model yang mengandung x1 x2 x3 dan x5 Dari model regresi generalized model yang mengandung x1,x2, x3 dan x5 Dari model regresi poisson yang diperoleh dapat dilihat bahwa faktor yang mempengaruhi jumlah angka kematian bayi di Provinsi Jawa Timur adalah jumlah sarana kesehatan, persentase persalinan yang dilakukan kesehatan, persentase yang dilakukan dengan bantuan non non medis, rata‐rata usia perkawinan pertama dan rata‐rata jumlah pengeluaran rumah tangga (dalam rupiah) per bulan pada tiap kabupaten/kota. p
Daftar Pustaka • • • • • • • • •
Agresti, A.(2002). Categorical Data Analysis Second Edition, John Wiley & Sons, New York New York. Arriaga, A.E.(1979). Infant and Child Mortality in Selected Asian Countries. Proceding of The Meeting on Socio economic Determinants of Consequences of Mortality, Mexico City. A t ti E T & Y Astuti, E.T & Yanagawa, T.(2002).Testing Trend for Count Data with Extra‐Poisson T (2002) T ti T d f C t D t ith E t P i Variability. Biometrics, 58, 398‐402 Badan Penelitian & Pengembangan Kesehatan.(1995). Survei Kesehatan Rumah Tangga 1995. Jakarta: Departemen Kesehatan RI. Badan Pusat Statistik.(2001). Estimasi Fertilitas, Mortalitas dan Migrasi Hasil Sensus Penduduk Tahun 2000. Jakarta :Badan Pusat Statistik. Bappenas dan LD‐UI.(2003). Kajian Awal Perencanaan Jangka Panjang bidang Sumber Daya Manusia: Draft Awal, Jakarta. Manusia: Draft Awal, Jakarta. Bozdogan, H. (2000). Akaike's Information Criterion and Recent Developments in Information Complexity, Mathematical Psychology, 44, 62‐91.
TERIMA KASIH TERIMA KASIH