KAJIAN OVERDISPERSI PADA REGRESI POISSON MENGGUNAKAN SEMIPARAMETRIK ZERO-INFLATED POISSON
NANDA PINANDITA RAMADHANI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi yang berjudul Kajian Overdispersi pada Regresi Poisson Menggunakan Semiparametrik Zero-Inflated Poisson adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2014 Nanda Pinandita ramadhani NIM G14100060
ABSTRAK NANDA PINANDITA RAMADHANI. Kajian Overdispersi pada Regresi Poisson Menggunakan Semiparametrik Zero-Inflated Poisson. KUSMAN SADIK dan DIAN KUSUMANINGRUM. Salah satu penyebab overdispersi adalah banyaknya amatan bernilai nol pada peubah respon yang dapat dideteksi melalui nilai dispersi yaitu rasio antara deviance dengan derajat bebas. Metode yang dapat digunakan untuk mengatasi permasalahan tersebut adalah Zero-Inflated Poisson (ZIP). Pendekatan semiparametrik menjadi model alternatif yang digunakan karena mengandung komponen parametrik dan nonparametrik sehingga memiliki tingkat fleksibilitas tinggi. Nilai bias relatif mutlak (BRM) digunakan untuk mengetahui tingkat akurasi penduga parameter dan akar kuadrat tengah galat (AKTG) digunakan untuk mendeteksi kebaikan model. Nilai BRM terkecil data simulasi terdapat pada ZIP untuk overdispersi sedangkan regresi Poisson untuk nonoverdispersi. Nilai AKTG terkecil secara keseluruhan terdapat pada model semiparametrik sehingga untuk jenis data campuran lebih baik menggunakan model semiparametrik. Pada model semiparametrik ZIP untuk data aplikasi angka kematian ibu hamil di Provinsi Jawa Timur terjadi overdispersi karena menunjukkan nilai dispersi yang lebih besar dari satu. Model semiparametrik ZIP ini juga merupakan model terbaik karena menghasilkan nilai AKTG terkecil. Peubah penjelas yang berpengaruh nyata terhadap jumlah kematian ibu hamil di Provinsi Jawa Timur berdasarkan model semiparametrik ZIP ini adalah peubah penjelas X1 (kunjungan ibu hamil K1). Kata kunci : Overdispersi, Semiparametrik, Zero-Inflated Poisson ABSTRACT NANDA PINANDITA RAMADHANI. Overdispersion Assessment in Poisson Regression Using Semiparametric Zero-Inflated Poisson. Supervised by KUSMAN SADIK and DIAN Kusumaningrum. One of the causes of overdispersion is that there are many zero observations on the response variable which can be detected by the dispersion value which is the ratio of deviance and degrees of freedom. The method to overcome this problem is the Zero-Inflated Poisson (ZIP). Semiparametric approach be used as an alternative model because it has parametric and nonparametric component so it has a high degree of flexibility. Absolute of Relative Bias (ARB) is used to determine the level of accuracy of parameter estimators and Root of Mean Square of Error (RMSE) is used to determine the goodness of fit of the model. Results show that the ARB smallest value from simulation data was found in ZIP for overdispersion while Poisson regression for nonoverdispersion. The smallest RMSE was found on semiparametric model that show that semiparametric model was more suitable for mixed data. On the semiparametric ZIP model for the maternal mortality rate in East Java application data, which had overdispersion
indicated by the dispersion values is greater than one. This semiparametric ZIP model also has the smallest RMSE values so that it can be said to be the best model. Variable which affect the number of maternal mortality in East Java based on the semiparametric ZIP model is X1 (visits of pregnant women K1). Keywords: Overdispersion, Semiparametric, Zero-Inflated Poisson
KAJIAN OVERDISPERSI PADA REGRESI POISSON MENGGUNAKAN SEMIPARAMETRIK ZERO-INFLATED POISSON
NANDA PINANDITA RAMADHANI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Judul Skripsi : Kajian Overdispersi pada Regresi Poisson Menggunakan Semiparametrik Zero-Inflated Poisson Nama : Nanda Pinandita Ramadhani NIM : G14100060
Disetujui oleh
Dr Kusman Sadik, MSi Pembimbing I
Dian Kusumaningrum, MSi Pembimbing II
Diketahui oleh
Dr Anang Kurnia, MSi Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala karuniaNya sehingga penulis dapat menyelesaikan penelitian dan penulisan karya ilmiah yang berjudul Kajian Overdispersi pada Regresi Poisson Menggunakan Semiparametrik Zero-Inflated Poisson. Terima kasih penulis ucapkan kepada Bapak Dr Kusman Sadik, MSi dan Ibu Dian Kusumaningrum, MSi selaku komisi pembimbing, atas bimbingan dan motivasi yang diberikan selama kegiatan penelitian dan penulisan karya ilmiah ini. Terima kasih juga penulis sampaikan kepada eyang yang selalu memberikan doa dan motivasi kepada penulis. Tidak lupa kepada teman-teman Statistika 47 tercinta, terima kasih atas perhatian dan motivasinya. Terima kasih disampaikan juga kepada Program Beasiswa Bidikmisi Kementerian Pendidikan RI atas bantuan beasiswa yang diberikan sehingga penulis bisa menyelesaikan studi hingga selesai. Semoga karya ilmiah ini bermanfaat. Bogor, Agustus 2014 Nanda Pinandita Ramadhani
DAFTAR ISI DAFTAR TABEL
ix
DAFTAR GAMBAR
ix
DAFTAR LAMPIRAN
ix
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Regresi Poisson
2
Zero-Inflated Poisson
2
Model Semiparametrik
3
METODE
4
Data
4
Data Simulasi
4
Data Aplikasi
4
Prosedur Analisis Data HASIL DAN PEMBAHASAN Data Simulasi
5 6 6
Pendekatan Nonparametrik dengan B-Spline
6
Mendeteksi Overdispersi
8
Mendeteksi Multikolinieritas
9
Akurasi Penduga Parameter
9
Kebaikan Model Data Aplikasi
10 11
Identifikasi Komponen Parametrik dan Nonparametrik
12
Letak Titik Knot dan Basis B-Spline
12
Identifikasi Multikolinieritas dan Overdispersi
13
Model Terbaik
14
Model Semiparametrik Zero-Inflated Poisson
14
SIMPULAN DAN SARAN Simpulan
16 16
Saran
16
DAFTAR PUSTAKA
16
LAMPIRAN
18
RIWAYAT HIDUP
24
DAFTAR TABEL 1 2 3 4
Nilai parameter koefisien regresi Nilai dispersi dan jumlah peubah respon bernilai nol pada setiap n dan Hasil uji multikolinieritas data simulasi
5
Hasil uji multikolinieritas data aplikasi Nilai AKTG Nilai dugaan parameter semiparametrik ZIP
6 7
Nilai AKTG regresi Poisson dan ZIP model parametrik dan semiparametrik pada setiap n dan
4 8 9 10 13 14 15
DAFTAR GAMBAR 1
Plot antara peubah penjelas dengan peubah respon yang dibangkitkan pada 7
2 3
Jumlah kematian ibu hamil di kabupaten/kota provinsi jawa timur Plot pencar antara jumlah kematian ibu hamil dengan faktor yang diduga mempengaruhi
11 12
DAFTAR LAMPIRAN 1 2 3 4 5
Nilai BRM regresi Poisson dan ZIP model Parametrik dan Semiparametrik pada setiap n dan Algoritma data aplikasi Penduga model semiparametrik Poisson data aplikasi Penduga model parametrik Poisson data aplikasi Penduga model parametrik ZIP data aplikasi
18 22 22 22 22
PENDAHULUAN Latar Belakang Analisis regresi merupakan metode dalam statistika yang digunakan untuk mengkaji hubungan antara peubah respon dengan peubah penjelas. Analisis regresi Poisson merupakan salah satu jenis analisis regresi yang digunakan untuk memodelkan kejadian yang jarang terjadi dengan peubah respon berupa data cacah atau data diskrit. Data cacah termasuk dalam data kuantitatif yang tidak berbentuk pecahan. Analisis regresi Poisson memiliki asumsi yaitu kesamaan nilai rata-rata dan nilai ragam yang disbut dengan equidispersi. Akan tetapi dalam kenyataannya, sering terjadi pelanggaran dalam asumsi tersebut. Pelanggaran yang terjadi adalah underdispersi yaitu nilai ragam yang lebih kecil dari rataan dan overdispersi yaitu nilai ragam yang lebih besar dari rataan (Long 1997). Penyebab overdispersi salah satunya adalah banyaknya amatan bernilai nol pada peubah respon. Metode yang dapat digunakan untuk menangani overdispersi pada regresi Poisson adalah regresi Zero-Inflated Poisson (ZIP) (Li 2012). Regresi ZIP dengan model semiparametrik menjadi alternatif yang digunakan beberapa peneliti karena memiliki tingkat fleksibilitas tinggi. Penelitian menggunakan model semiparametrik pada ZIP diantaranya dapat dilihat pada Li (2012), Lam KF et al (2006), dan Chiogna M dan Gaetan C (2002). Model semiparametrik mampu menjelaskan hubungan antara peubah respon dengan peubah penjelas yang sebagian pola datanya diketahui dan sebagian lagi tidak diketahui. Hal ini dikarenakan, model semiparametrik mengandung komponen parametrik dan nonparametik (Sugiantari dan Budiantara 2013). Pendugaan koefisien regresi pada komponen parametrik dapat menggunakan metode kuadrat terkecil sedangkan pada nonparametrik dapat menggunakan berbagai pendekatan, salah satunya adalah spline (Wibowo et al 2009). Penelitian ini menerapkan model semiparametrik ZIP dengan data simulasi dan data aplikasi. Pada proses simulasi digunakan nilai dispersi untuk mendeteksi terjadinya overdispersi. Nilai dispersi merupakan rasio antara deviance dengan derajat bebas, jika hasil nilai dugaan dispersi lebih dari satu maka model mengalami overdispersi (Halekoh et al 2007). Penelitian dilanjutkan dengan mendeteksi keakuratan nilai penduga parameter melalui nilai bias relatif mutlak (BRM) atau Absolute of Relative Bias (ARB) terkecil dan mengidentifikasi model terbaik melalui nilai akar kuadrat tengah galat (AKTG) atau Root of Mean Square of Error (RMSE) terkecil. Data aplikasi yang digunakan berupa data Angka Kematian Ibu Hamil di Provinsi Jawa Timur. Angka Kematian Ibu Hamil merupakan kejadian yang jarang terjadi untuk beberapa daerah di Jawa Timur sehingga data ini dapat digunakan sebagai penerapan model semiparametrik ZIP pada data riil.
2 Tujuan Penelitian Tujuan dilakukannya penelitian ini sebagai berikut: 1. Membandingkan keakuratan penduga parameter regresi Poisson dan ZIP pada data peubah respon yang mengandung banyak nilai nol. 2. Menentukan kebaikan model dengan membandingkan nilai RMSE model parametrik dan semiparametrik pada regresi Poisson dan ZIP.
TINJAUAN PUSTAKA Regresi Poisson Peluang data cacah pada regresi Poisson ditentukan berdasarkan sebaran Poisson. Fungsi peluang sebaran Poisson dengan parameter adalah: *
+
( ) Nilai rata-rata dan ragam sebaran Poisson bernilai sama yaitu ( ) kondisi ini disebut sebagai equidispersi. Nilai tengah parameter regresi Poisson adalah ( ) sehingga model regresi Poisson dituliskan sebagai berikut: ( ) dengan x adalah peubah penjelas, adalah banyaknya peubah penjelas
adalah parameter koefisien regresi, dan k (Long 1997)
Zero-Inflated Poisson (ZIP) Regresi Zero-Inflated Poisson (ZIP) merupakan gabungan dari sebaran Poisson dengan sebaran kejadian bernilai nol. Kondisi tersebut dituliskan oleh Li (2012) sebagai berikut: (
)
(
,
)
(
(
) )
-(
( )
[(
)
)
]
dengan ( ) adalah fungsi indikator, sebagai parameter sebaran Poisson, dan adalah peluang kejadian bernilai nol dengan 0 ≤ ≤ 1, ketika maka sebaran ZIP menjadi sebaran Poisson. Fungsi sebaran ZIP diatas dituliskan dengan lebih jelas sebagai berikut (Chiogna dan Gaeta 2007): ( ) ( ) ( ) ( ) { ( ) Berdasarkan fungsi sebaran diatas diperoleh nilai ragam yang lebih besar dari ( ) ( ) ( rataan yaitu ( ) ( ) dan ) (Xiang et al 2007).
3 Fungsi penghubung untuk
dan menurut Xiang et al (2007) adalah : ( )
( )
.
/
dengan X adalah matriks peubah penjelas, dan adalah parameter model berukuran (p+1)x1 dan (q+1)x1 dengan . Menurut Ridout et al (1998) adalah parameter skalar yang menggambarkan banyak sedikitnya nilai nol pada peubah respon yang terbentuk namun tidak dapat mengontrol banyaknya nilai nol menghasilkan jumlah nol yang semakin kecil yang terbentuk. Nilai sedangkan menghasilkan nilai nol yang semakin besar.
Model Semiparametrik Model semiparametrik mengandung dua komponen yaitu parametrik dan nonparametrik. Salah satu pendekatan nonparametrik dalam model semiparametrik adalah spline. Pendekatan spline yang biasa digunakan adalah spline truncated dan B-Spline. Bentuk umum regresi parametrik yaitu: Bentuk matriksnya: Pendugaan koefisien regresi dapat menggunakan metode kuadrat terkecil dengan meminimumkan terhadap ̂ ( ) (Laome 2009). sehingga diperoleh penduga sebagai berikut: Bentuk umum regresi nonparametrik sebagai berikut: ( ) ( ) merupakan kurva regresi yang tidak diketahui polanya. Fungsi ( ) yang didekati dengan B-Spline dapat dituliskan menjadi: ( )
∑
( )
dengan merupakan basis B-Spline dari titik knot dengan orde m, knot K, dan adalah parameter. Fungsi B-Spline secara rekursif yaitu: ( )
( )
( )
dengan ( )
{
(Budiantara et al 2006) Berdasarkan bentuk parametrik dan nonparametrik diatas maka bentuk regresi semiparametrik adalah: ( ) Lam et al (2006) menuliskan model semiparametrik ZIP yang berasal dari model log seperti berikut : ( ) ( )
4
METODE Data Data yang digunakan pada penelitian ini adalah data simulasi dan data aplikasi. Data simulasi dibangkitkan menggunakan software R 3.0.1 dan data aplikasi diperoleh dari Dinas Kesehatan Provinsi Jawa Timur pada Profil Kesehatan Provinsi Jawa Timur tentang Angka Kematian Ibu Hamil 2012. Data Simulasi Secara umum prosedur simulasi ini mengacu pada algoritma Setyawan (2012). Data yang dibangkitkan adalah data peubah respon yang memiliki banyak amatan bernilai nol dengan kondisi overdispersi dan nonoverdispersi. Model yang akan dibentuk seperti berikut: ( ) ( ) dengan ( ) merupakan komponen nonparametrik yang mengikuti persamaan ( ) Peubah penjelas pada penelitian Wibowo (2009) bernilai dibangkitkan mengikuti sebaran seragam dan merupakan sebaran diskret, untuk mempermudah pemakaian dan meminimalisasi dummy maka digunakan peubah biner yang menghasilkan intersep berbeda. Peubah penjelas diasumsikan sebagai peubah tetap dengan n yang digunakan adalah 15, 30, 50, 100, dan 200. ditetapkan secara subjektif oleh peneliti yaitu . Nilai Parameter yang diperlukan terbagi menjadi dua komponen yaitu parametrik dan nonparametrik. Pendekatan nonparametrik menggunakan B-Spline dengan m=2 dan K=1. Model semiparametrik memiliki tingkat keefektifan lebih baik dibandingkan model parametrik, untuk mengkaji kondisi tersebut digunakan pula model parametrik dengan mengabaikan ( )sebagai komponen nonparametrik sehingga ( ) diasumsikan sebagai Penentuan parameter ditentukan secara subjektif oleh peneliti sebagai berikut: Tabel 1 Nilai parameter koefisien regresi Parameter
Parametrik Nonoverdispersi Overdispersi 1 1 -0.3 0.8 0.5 0.2 0.6 0.6 -
Semiparametrik Nonoverdispersi Overdispersi 1 1 -0.3 0.8 0.5 0.2 0.1 0.1 0.35 0.35 0.15 0.15
Data Aplikasi Peubah yang digunakan berdasarkan penelitian Kartiningrum (2013). Satuan pengamatan yang digunakan sebanyak 38 Kabupaten/Kota di Jawa Timur. Peubah respon (Y) adalah jumlah kematian Ibu Hamil dan peubah penjelas yang digunakan meliputi: 1. Persentase Kunjungan Ibu Hamil K1 (X1) 2. Persentase Kunjungan Ibu Hamil K4 (X2) 3. Persentase Ibu Hamil mendapat tablet FE1 (X3)
5 4. Persentase Ibu Hamil mendapat tablet FE3 (X4) 5. Persentase Komplikasi kehamilan yang ditangani (X5)
Prosedur Analisis Data A. Tahapan analisis yang digunakan pada simulasi data adalah: 1. Membangkitkan n buah data peubah penjelas yang menyebar Seragam(1,2), yang bersifat biner(0,1), dan ( ) untuk komponen nonparametrik. 2. Mencatat nilai , , , dan nilai minimum ( ), maksimum ( ) dari . 3. Model semiparametrik dilakukan tahapan: a. Mencari nilai interval dan letak knot dengan rumus (Permatasari 2009): ( ) dengan nknot=K+2 ( ) b. Menentukan persamaan basis berdasarkan fungsi rekursif B-Spline. c. Menghitung nilai masing-masing basis B-Spline. 4. Menghitung nilai masing-masing amatan dengan: a. Parametrik: ( ) b. Semiparametrik: ( ) 5. Membangkitkan peubah respon: I. Nonoverdispersi: Membangkitkan n data respon yang menyebar Poisson( ) II. Overdispersi: a. Menghitung parameter b. Menghitung nilai yaitu: ∑ ( ) ∑ ( ) c. Membangkitkan n data yang menyebar Seragam(0,1) sebagai variabel c. d. Membangkitkan bilangan acak variabel yp yang menyebar Poisson( ). e. Membandingkan variabel c setiap pengamatan dengan nilai . Jika maka dan jika maka . 6. Mencatat dan menghitung peubah respon yang bernilai nol. 7. Menghitung nilai dispersi yang merupakan rasio dari deviance dengan derajat bebas. Rodriguez (2007) menuliskan fungsi deviance sebagai berikut: ∑{
( ) ̂
(
̂ )}
8. Menghitung nilai Variance Inflation Factors (VIF) untuk memastikan tidak terjadi multikolinieritas seperti berikut:
dengan
adalah koefisien determinasi.
6 9.
Melakukan pendugaan parameter model parametrik dan semiparametrik pada regresi Poisson dan ZIP. 10. Menghitung nilai bias relatif mutlak (Savic 2009 dalam Setyawan 2012): ̂ ∑| |
11. 12. 13. 14.
dengan r adalah banyaknya data dugaan, ̂ adalah penduga ke-i parameter , dan adalah parameter sebenarnya. Mengulangi langkah 1-10 sebanyak 1000 kali Menghitung rata-rata dari 1000 nilai dispersi yang dihasilkan regresi Poisson. Menghitung rata-rata dari 1000 nilai BRM masing-masing penduga parameter. Menghitung nilai AKTG sebagai berikut (Moses dan Devadas 2012): √ (∑(
̂) )
15. Membandingkan nilai BRM dan AKTG model parametrik dan semiparametrik pada regresi Poisson dan ZIP. Nilai BRM terkecil menunjukkan penduga dengan akurasi baik dan AKTG terkecil menunjukkan model yang disarankan penggunaannya. B. Tahapan untuk analisis dan pemodelan jumlah kematian ibu hamil adalah: 1. Membuat plot pencar untuk menentukan komponen parametrik dan nonparametrik. 2. Memilih peubah penjelas untuk menghindari multikoliniearitas. 3. Menentukan letak titik knot dan basis menggunakan B-Spline untuk komponen nonparametrik. 4. Mengidentifikasi overdispersi dengan menghitung nilai dispersi. 5. Menghitung dan membandingkan nilai AKTG model semiparametrik dan parametrik pada regresi Poisson dan ZIP. 6. Melakukan pemodelan data dengan model yang menghasilkan AKTG terkecil.
HASIL DAN PEMBAHASAN Data Simulasi Pendekatan Nonparametrik dengan B-Spline Data simulasi yang digunakan telah ditentukan terdiri dari dua komponen yaitu parametrik dan nonparametrik. Plot yang terdapat pada Gambar 1 menunjukkan bahwa cenderung membentuk pola linier sedangkan tidak membentuk pola linier sehingga dapat dikatakan bahwa data yang dibangkitkan terbukti terdiri dari komponen parametrik dan nonparametrik. Berdasarkan
7 kondisi data tersebut maka model alternatif berupa model semiparametrik dapat digunakan pada data simulasi ini.
Gambar 1 Plot antara peubah penjelas dengan peubah respon yang dibangkitkan pada Komponen nonparametrik pada data simulasi dilakukan pendekatan fungsi B-Spline menggunakan orde( ) sebanyak 2 dan knot asli( ) sebanyak 1. Cara membentuk fungsi B-Spline diperlukan pendefinisian knot tambahan sebanyak 2m yaitu ( dengan ( dan ( ) ) ) , adalah nilai minimum dan adalah nilai maksimum (Budiantara et al 2006). Pada kasus ini knot tambahan yang terbentuk sebanyak 4 yaitu dan sehingga total knot yang terbentuk sebanyak 5 knot yaitu Diperlukan penghitungan nilai interval untuk mengetahui jarak antar knot, hasil dari nilai interval ini digunakan untuk mencari letak knot dan perhitungan rekursif B-Spline (Permatasari 2009). Nilai interval yang terbentuk pada adalah 49.5. Data diurutkan dari yang terkecil sehingga knot asli terletak pada data ke-50.5, dilakukan pembulatan ke bawah maka knot asli terletak pada data ke-50. Pendefinisian nilai dari masingmasing knot adalah ; ; dengan adalah knot asli. Persamaan basis B-Spline ditentukan melalui fungsi rekursif B-Spline. Persamaan basis yang terbentuk adalah: ( )
{
( ) { ( )
{
8 Mendeteksi Overdispersi Adanya overdispersi pada data simulasi dideteksi dengan nilai dispersi ( ). Halekoh et al (2007) menyatakan apabila nilai maka terjadi overdispersi. Hasil simulasi pada Tabel 2 menunjukkan bahwa data nonoverdispersi memiliki sehingga terbukti bahwa peubah respon yang dibangkitkan tidak nilai mengandung overdispersi sedangkan pada data overdispersi menghasilkan nilai yang berarti pada peubah respon yang dibangkitkan terbukti terjadi overdispersi. Tabel 2 juga menunjukkan bahwa semakin besar nilai memberikan hasil nilai nol yang semakin besar. Data dengan n kecil dan besar tidak bisa menghasilkan iterasi yang konvergen sehingga tidak dapat dideteksi jumlah amatan bernilai nol dan nilai dispersinya. Hal ini menunjukkan bahwa semakin besar nilai nol pada ukuran data yang semakin kecil tidak dapat dilakukan analisis lebih lanjut. Tabel 2 Nilai dispersi dan jumlah peubah respon bernilai nol pada setiap n dan Model
Parametrik
n
15
30
50
100
200
Semiparametrik
15
30
50
100
Parameter skalar ( ) 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 -
Hasil Simulasi Jumlah amatan Nilai dispersi ( ) bernilai nol 10.56 0.86 8.18 14.29 Tidak Konvergen Tidak Konvergen 13.35 0.88 17.15 8.39 19.81 8.64 Tidak Konvergen 26.36 0.90 28.62 10.78 34.63 11.23 37.41 13.65 40.51 0.97 57.16 10.90 74.73 11.59 82.74 13.58 47.22 0.99 57.76 8.54 73.79 10.97 82.97 13.51 12.50 0.87 12.08 14.92 Tidak Konvergen Tidak Konvergen 15.50 0.91 18.87 9.81 21.03 10.99 Tidak Konvergen 27.45 0.92 29.94 10.34 37.53 12.75 38.12 14.28 42.57 0.98
9 Model
Semiparametrik
n
100
Parameter skalar ( ) 0.1 0.4 0.6
Hasil Simulasi Jumlah amatan Nilai dispersi ( ) bernilai nol 57.22 8.31 74.48 10.52 84.19 12.60
Mendeteksi Multikolinieritas Mendeteksi terjadi multikolinieritas diperlukan untuk menghindari besarnya nilai ragam pada peubah penjelas. Menurut Draper dan Smith (1998), salah satu metode untuk mengetahui adanya multikolineritas antar peubah bebas dengan melihat nilai VIF. Apabila nilai VIF > 10 maka menunjukkan terjadi multikolinieritas yang tinggi. Tabel 3 menunjukkan hasil dari nilai VIF data simulasi kurang dari 10 maka dapat dikatakan bahwa tidak terjadi multikolinieritas pada peubah penjelas yang digunakan sehingga data dapat digunakan untuk analisis lebih lanjut. Tabel 3 Hasil uji multikolinieritas data simulasi n
15
30
50
100
200
Parameter skalar ( ) 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6
Nilai VIF Parametrik X1 X2 X3 2.654 2.232
1.187 1.311
2.482 2.560
3.101 2.260 3.570
1.022 1.075 1.097
3.123 2.330 3.395
2.269 2.529 2.460 2.298 2.468 2.622 2.243 2.503 2.591 2.775 2.375 2.425
1.062 1.009 1.191 1.023 1.042 1.019 1.025 1.016 1.053 1.004 1.013 1.002
2.178 2.534 2.589 2.273 2.430 2.591 2.278 2.486 2.583 2.771 2.384 2.428
X1
Nilai VIF Semiparametrik X2
2.692 1.459 1.572 1.352 Tidak Konvergen Tidak Konvergen 1.153 1.090 2.339 1.087 1.218 1.191 Tidak Konvergen 1.161 1.068 3.045 1.034 1.203 1.168 1.163 1.052 1.027 1.024 1.061 1.025 1.057 1.015 1.058 1.025 1.034 1.012 1.047 1.008 1.007 1.004 1.002 1.005
2.706 1.472
4.530 4.748
4.683 4.898
1.920 3.345 1.843
2.301 2.844 2.414
1.804 1.602 1.602
1.493 3.158 1.537 1.543 1.265 1.282 1.320 1.301 1.045 1.048 1.047 1.041
1.957 2.300 2.009 2.127 2.174 2.181 2.199 2.211 1.140 1.135 1.123 1.122
1.616 1.802 1.624 1.573 2.152 2.130 2.178 2.191 1.136 1.147 1.135 1.136
Akurasi Penduga Parameter Nilai BRM dari masing-masing penduga parameter untuk semua set data terdapat pada Lampiran 1. Nilai BRM regresi ZIP model parametrik maupun semiparametrik pada data nonoverdispersi memiliki nilai yang relatif lebih besar dibandingkan regresi Poisson. Hal ini menunjukkan bahwa regresi Poisson memiliki tingkat keakuratan yang baik dalam menduga parameter pada data yang tidak mengalami overdispersi karena regresi ZIP melakukan pendugaan dua jenis pada model logit. Regresi ZIP parameter yaitu pada model log dan menghasilkan nilai BRM yang relatif lebih kecil daripada regresi Poisson pada data yang mengalami overdispersi untuk model parametrik dan semiparametrik.
10 Hasil tersebut menunjukkan bahwa ZIP memiliki tingkat keakuratan yang lebih baik dalam menduga parameter pada data yang mengalami overdispersi karena banyaknya peubah respon bernilai nol. Nilai BRM masing-masing penduga semakin kecil pada ukuran data yang semakin besar dan berlaku sebaliknya pada yang semakin besar. Kebaikan Model Pemilihan model terbaik antara model parametrik dan semiparametrik pada regresi Poisson dan ZIP dilakukan dengan melihat nilai AKTG yang dihasilkan model tersebut. Semakin kecil nilai AKTG yang dihasilkan maka model dikatakan semakin baik. Tabel 4 menunjukkan nilai AKTG regresi Poisson lebih besar daripada ZIP pada data yang mengalami overdispersi karena banyaknya peubah respon bernilai nol sehingga dapat dikatakan bahwa ZIP lebih baik digunakan. Tabel 4 Nilai AKTG regresi Poisson dan ZIP model parametrik dan semiparametrik pada setiap n dan N
15
30
50
100
200
AKTG
0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6 0.1 0.4 0.6
Poisson Parametrik Semiparametrik 3.36 2.37 4.69 3.88 Tidak Konvergen Tidak Konvergen 2.53 2.67 10.91 9.76 4.67 4.21 Tidak Konvergen 2.03 1.99 9.99 8.94 5.51 4.50 4.81 3.44 5.35 4.23 10.77 8.88 7.09 4.56 6.39 5.36 3.25 3.13 10.39 9.91 6.57 6.49 5.52 5.49
ZIP Parametrik Semiparametrik 3.57 2.43 4.86 3.27 Tidak Konvergen Tidak Konvergen 2.31 2.58 8.56 4.76 3.71 3.65 Tidak Konvergen 2.66 1.73 6.00 3.58 5.27 3.71 5.57 3.27 6.18 3.57 7.51 5.24 6.52 3.93 7.38 5.27 3.72 3.50 6.38 5.96 4.32 3.67 4.83 4.62
Nilai AKTG pada data nonoverdispersi memberikan hasil yang berbeda, regresi Poisson memiliki nilai lebih kecil daripada ZIP sehingga regresi Poisson lebih baik digunakan pada data nonoverdispersi. Hasil AKTG model parametrik dan semiparametrik menunjukkan bahwa model semiparametrik memiliki nilai lebih kecil daripada model parametrik. Hal ini menunjukkan bahwa model semiparametrik lebih baik digunakan daripada model parametrik. Berdasarkan hasil tersebut semiparametrik ZIP lebih disarankan untuk digunakan pada data overdispersi karena banyaknya peubah respon bernilai nol dengan jenis data campuran sedangkan semiparametrik Poisson lebih disarankan untuk digunakan pada data nonoverdispersi dengan jenis data campuran. Kondisi ini menunjukkan
11 bahwa diperlukannya penentuan karakteristik dari komponen data yang digunakan sebelum memutuskan jenis metode yang diterapkan. Apabila kondisi nonparametrik diabaikan dan diasumsikan sebagai komponen parametrik akan memberikan hasil yang tidak efisien dan keakuratan penduga parameter yang kurang baik karena pada model parametrik dibutuhkan kondisi data dari peubah penjelas dan peubah respon yang linier atau menyebar normal.
Data Aplikasi Data aplikasi yang digunakan berupa data Angka Kematian Ibu Hamil (AKIH) provinsi Jawa Timur pada tahun 2012. Provinsi Jawa Timur merupakan salah satu provinsi yang terletak di pulau Jawa yang memiliki 29 Kabupaten dan 9 Kota sehingga amatan yang digunakan pada data aplikasi sebanyak 38 Kabupaten/Kota. Peubah penjelas yang digunakan sebanyak lima peubah yang diduga dapat mempengaruhi banyak sedikitnya jumlah kematian ibu hamil dengan satuan yang digunakan adalah persentase. Persentase tersebut diperoleh dari jumlah ibu hamil yang tercatat dalam suatu kategori peubah penjelas dibagi jumlah ibu hamil, misalnya X1 (persentase kunjungan ibu hamil K1) untuk kabupaten Pacitan diperoleh dari jumlah kunjungan ibu hamil K1 di Pacitan dibagi jumlah ibu hamil di Pacitan seperti berikut:
Gambar 2 Jumlah kematian ibu hamil di kabupaten/kota provinsi jawa timur Beberapa daerah di provinsi jawa timur memiliki nilai persentase lebih dari 100, nilai ini disebabkan oleh adanya ibu hamil yang mendapat pelayanan berdasarkan kategori peubah penjelas bukan merupakan ibu hamil dari daerah tersebut. Data AKIH untuk beberapa daerah merupakan kejadian yang jarang terjadi dan pada Gambar 2 dapat dilihat bahwa data AKIH merupakan jenis data cacah sehingga data ini dapat digunakan pada regresi Poisson. Selain itu, dalam data AKIH ini diduga terjadi overdispersi karena ditemukan 6 daerah yaitu
12 Kabupaten Bangkalan, Kota Madiun, Kota Mojokerto, Kota Pasuruan, Kota Batu, dan Kota Probolinggo yang memiliki nilai AKIH nol yang berarti ±15% dari data. Identifikasi Komponen Parametrik dan Nonparametrik Pola yang terbentuk antara Y dengan X1, X2, X3, dan X4 pada Gambar 3 cenderung mengikuti garis linier dan mayoritas data bergerombol mendekati garis linier, berbeda dengan pola Y dengan X5 yang mayoritas datanya menyebar menjauhi garis linier dan ketika dilakukan analisis regresi menghasilkan R2=0%. Perbedaan kelima plot pada Gambar 3 tidak terlalu signifikan namun secara sederhana kondisi tersebut dapat dikategorikan bahwa X1, X2, X3, dan X4 merupakan komponen parametrik sedangkan X5 adalah komponen nonparametrik.
Gambar 3 Plot pencar antara jumlah kematian ibu hamil dengan faktor yang diduga mempengaruhi Letak Titik Knot dan Basis B-Spline Komponen nonparametrik data aplikasi yaitu X5 dilakukan pendekatan dengan B-Spline menggunakan orde( )= dan knot asli( )=1. Pembentukan fungsi B-Spline pada data aplikasi sama seperti pada data simulasi yaitu sehingga knot tambahan yang terbentuk menentukan knot tambahan sebanyak
13 adalah , yaitu dan . Total knot yang terbentuk adalah 5 knot (4 knot tambahan dan 1 knot asli) yaitu . Data yang digunakan dalam penelitian ini sebanyak 38 observasi dengan nilai interval sebesar 18.5 sehingga knot asli berada pada data ke-19.5, dilakukan pembulatan ke bawah berarti terletak pada data ke 19. Data ke-19 bernilai sebesar 82.23, nilai minimum ( ) sebesar 49.65 dan maksimum ( ) sebesar 125.84. Basis B-Spline yang dihasilkan sebanyak 3 basis yaitu ( ) ( ) ( ) dengan masing-masing basis mempunyai 2 fungsi berbeda setiap selangnya. Persamaan setiap basis B-Spline data aplikasi adalah: ( )
{
( )
{
( )
{
Identifikasi Multikolinieritas dan Overdispersi Data aplikasi penelitian ini menggunakan lima peubah penjelas yang diduga mempengaruhi peubah respon berupa jumlah kematian ibu hamil dengan model semiparametrik dan parametrik. Peubah penjelas kelima (X5) merupakan komponen nonparametrik dalam model semiparametrik sehingga X5 terbagi menjadi tiga bagian yaitu B1, B2, dan B3 berdasarkan hasil B-Spline. Model parametrik mengabaikan kondisi X5 sebagai komponen nonparametrik yang berarti menganggap seluruh peubah penjelas merupakan komponen parametrik. Tabel 5 Hasil uji multikolinieritas data aplikasi Peubah X1 X2 X3 X4 B1 B2 B3
VIF 6.027 4.502 8.958 8.466 3.312 3.223 1.974
Peubah X1 X2 X3 X4 X5
VIF 5.378 4.240 8.934 8.433 1.327
Pada peubah penjelas yang digunakan dilakukan penghitungan VIF untuk menghindari terjadinya multikolinieritas. Hasil pengujian multikolinieritas pada Tabel 5 menunjukkan seluruh peubah penjelas memiliki nilai VIF < 10 yang berarti tidak terjadi multikolinieritas namun terdapat beberapa peubah penjelas yang menghasilkan nilai VIF cukup besar karena itu dilakukan pengecekan korelasi antar peubah penjelas menggunakan korelasi pearson. Hasil korelasi pearson menunjukkan bahwa X1 dan X2 memiliki korelasi yang kuat yaitu 0.805 selain itu, X3 dan X4 juga
14 memiliki korelasi yang kuat sebesar 0.889. Berdasarkan hasil tersebut dilakukan pemilihan peubah penjelas, pemilihan peubah penjelas ini dilakukan secara subjektif karena antar peubah penjelas memiliki nilai korelasi yang sama kuat, dalam penelitian ini digunakan peubah penjelas X1, X3, dan X5. Pendeteksian overdispersi secara sederhana dapat dilihat melalui nilai ragam yang lebih besar dari rataan. Peubah respon data aplikasi memiliki nilai rataan 3.026 dan nilai ragam sebesar 10.837. Hasil tersebut menunjukkan bahwa nilai ragam lebih besar dari rataan sehingga diduga terjadi overdispersi. Dugaan terjadinya overdispersi diperkuat dengan hasil nilai dispersi( ) yang lebih besar dari 1, model semiparametrik memberikan hasil sebesar 3.385 dan model parametrik memiliki sebesar 3.307. Berdasarkan hasil tersebut dapat disimpulkan bahwa pada data aplikasi yang digunakan terjadi overdispersi.
Model terbaik Pemilihan model antara model semiparametrik dan parametrik pada regresi Poisson dan ZIP dalam kasus jumlah kematian ibu hamil di Provinsi Jawa Timur dengan melihat nilai AKTG terkecil. Tabel 6 menunjukkan nilai AKTG pada semiparametrik ZIP lebih kecil dibandingkan model lain sehingga model semiparametrik ZIP lebih baik untuk digunakan dalam pemodelan kasus data penelitian ini. Tabel 6 Nilai AKTG Model Parametrik Poisson Semiparametrik Poisson Parametrik ZIP Semiparametrik ZIP
AKTG 3.228 3.224 2.956 2.952
Nilai AKTG pada Tabel 6 menunjukkan bahwa tidak terdapat perbedaan yang signifikan antar model, hal ini disebabkan oleh karakteristik data aplikasi masing-masing peubah penjelas memiliki kemiripan satu dengan yang lain sehingga hasilnya pun tidak berbeda jauh. Kementrian Kesehatan menyatakan beberapa penyebab lain dari kematian ibu hamil yaitu pendarahan, eklampsia, sepsis, dan infeksi. Penyebab tersebut dihasilkan berdasarkan kajian kinerja IGD Obstetri-Ginekologi dari RSUP Cipto Mangunkusumo. Namun, karena tidak ditemukan data yang jelas dari penyebab-penyebab tersebut maka pada penelitian ini hanya digunakan penyebab-penyebab berdasarkan dugaan Dinas Kesehatan. Model Semiparametrik Zero-Inflated Poisson (ZIP) Model pada regresi ZIP terbagi menjadi dua jenis. Model pertama disebut count model atau model log yang digunakan untuk menentukan peluang dari peubah respon suatu amatan bernilai selain nol sedangkan model kedua yaitu zero-inflation model atau model logit digunakan untuk menentukan peluang dari peubah respon suatu amatan bernilai nol (Long 1997). Tabel 7 merupakan hasil pendugaan parameter dengan model semiparametrik ZIP menggunakan R 3.0.1.
15 Tabel 7 Nilai dugaan parameter semiparametrik ZIP Count Model (Intercept) X1 X3 B1 B2 B3 Zero-Inflation Model (Intercept) X1 X3 B1 B2 B3
Nilai Dugaan 2.84718 -0.03184 0.01650 -0.38100 0.08290 -0.82695
Galat Baku 2.12699 0.01815 0.01208 0.74174 0.65195 0.58351
Nilai-Z 1.339 -1.755 1.366 -0.514 0.127 -1.417
Nilai-p 0.1807 * 0.0793 0.1720 0.6075 0.8988 0.1564
-16.67908 0.07669 -0.00380 9.09480 8.77352 -0.17111
16.22252 0.08991 0.07647 8.78226 9.27532 4.29819
-1.028 0.853 -0.050 1.036 0.946 -0.040
0.304 0.394 0.960 0.300 0.344 0.968
*) signifikansi pada taraf nyata 10% Persamaan model untuk semua peubah penjelas dapat dituliskan sebagai berikut: ( ) ( ) ( ) dan ( (
) )
)
( (
) Tabel 7 menunjukkan pada model log, peubah penjelas yang berpengaruh nyata terhadap respon pada taraf nyata 10% adalah X1 sedangkan pada model logit tidak terdapat peubah penjelas yang berpengaruh nyata. Persamaan model log menunjukkan bahwa kunjungan ibu hamil K1 (X1) memiliki hubungan negatif dengan jumlah kematian ibu hamil di Provinsi Jawa Timur. Kondisi tersebut menjelaskan bahwa semakin sedikit ibu hamil yang melakukan kunjungan K1 akan semakin meningkatkan angka kematian ibu hamil maka disarankan kepada ibu hamil melakukan kunjungan K1 untuk proses pemeriksaan awal kehamilan sehingga dapat dideteksi dari awal kondisi janin dan kesehatan ibu.
16
SIMPULAN DAN SARAN Simpulan Data yang digunakan pada penelitian ini merupakan jenis data campuran yang terdiri dari komponen parametrik dan nonparametrik dengan komponen nonparametriknya dilakukan pendekatan B-Spline. Berdasarkan jenis data tersebut, didapatkan penduga parameter regresi ZIP yang lebih baik daripada regresi Poisson untuk data kondisi overdispersi karena nilai nol berlebih pada peubah respon. Kebaikan model didapatkan pada model semiparametrik baik menggunakan regresi Poisson maupun ZIP sehingga untuk jenis data seperti penelitian ini lebih baik digunakan semiparametrik Poisson pada kasus nonoverdispersi dan semiparametrik ZIP pada kasus overdispersi karena nilai nol berlebih pada peubah respon.
Saran Komponen nonparametrik pada penelitian ini dibentuk menggunakan fungsi sinus sehingga pola yang terbentuk pun mengikuti fungsi sinus dengan pendekatan yang digunakan adalah B-Spline. Pada penelitian berikutnya disarankan untuk menggunakan fungsi matematika yang lain dalam pembentukan komponen nonparametrik. Disarankan pula untuk menggunakan pendekatan nonparametrik selain B-Spline sehingga dapat diketahui apakah kesimpulan pada penelitian ini juga berlaku untuk fungsi dan pendekatan nonparametrik yang lain. Pada data aplikasi yang digunakan dalam penelitian ini dihasilkan nilai AKTG yang tidak berbeda jauh. Hal ini disebabkan karakteristik data peubah penjelas yang digunakan memiliki kemiripan. Oleh karena itu pada penelitian berikutnya disarankan untuk menambahkan peubah penjelas berdasarkan faktor-faktor yang disebutkan oleh RSUP Cipto Mangunkusumo yang diharapkan dapat menghasilkan nilai lebih beragam.
DAFTAR PUSTAKA Budiantara IN, Suryadi F et al. 2006. Pemodelan B-Spline dan MARS pada Nilai Ujian Masuk terhadap IPK Mahasiswa Jurusan Disain Komunikasi Visual UK. Petra Surabaya. [Internet]. [diunduh tanggal 2014 Maret 23]. Terdapat pada: http://cpanel.petra.ac.id/ejournal/index.php/ind/article/viewFile/16497/16489. Chiogna M, Gaetan C. 2007. Semiparametric zero-inflated Poisson Models with application to animal abundance studies. Environmetrics. 18(3):303:314. http://dx.doi.org/10.1002/env.830. Draper NR, Smith H. 1998. Applied Regression Analysis. Canada: A WileyInterscience Publication.
17 Halekoh U, Hojsgaard S. 2007. Overdispersion. Denmark: Unit of Statistics and Decision Analysis, The Faculty of Agricultural Sciences, University of Aarhus. Kartiningrum ED, Nursaidah. 2013. Pemodelan Faktor Yang Mempengaruhi Kematian Ibu Di Propinsi Jawa Timur Menggunakan Zero Inflated Poisson Regression. Prosiding Seminar Nasional. ISBN:978-979-98438-8-3. Lam KF, Xue H, Cheung YB. 2006. Semiparametric Analysis of Zero-Inflated Count Data. Biometrics. 62:996-1003. doi:10.1111/j.1541-0420.2006.00575.x. Laome L. 2009. Model Regresi Semiparametrik Spline Untuk Data Longitudinal Pada Kasus Kadar CD4 Penderita HIV. Paradigma Vol.13 No. 2 hlm. 189-194. Li CS. 2012. Score Test for Semiparametric Zero-Inflated Poisson Models. Journal of Statistics and Probanility. http://dx.doi.org/10.5539/ijsp.v1n2p1. Long JS. 1997. Regression Models for Categorical and Limited Dependent Variables. Number 7 in Advance Quantitative Techniques in The Social Sciences. California : Sage Publications. Moses KP, Devadas MD. 2012 . An Approach to Reduce Root Mean Square Error in Toposheets. J of Scientific Research. 91(2):268-274. Permatasari D. 2009. Pemodelan Kurva Imbal Hasil Obligasi Korporasi Rating AA dan A dengan Nelson Siegel Svensson dan Cubic Spline Smooting. Institut Teknologi Sepuluh November. [Internet]. [diunduh pada tanggal 18 Mei 2014]. Terdapat pada: http://oc.its.ac.id/ambilfile.php?idp=1211. Ridout , M. 1998. Models for count data with many zeros. International Biometric Conference. [Internet]. [diunduh 2014 Juni 27]. Tersedia pada: https://www.kent.ac.uk/smsas/personal/msr/webfiles/zip/ibc_fin.pdf. Rodriguez G. 2007. Poisson Models for Count Data. [Internet]. [diunduh 2014 Jan 17]. Terdapat pada: http://data.princeton.edu/wws509/notes/c4.pdf. Setyawan A. 2013. Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero Inflated Poisson pada data Overdispersi [skripsi]. Bogor (ID) : Institut Pertanian Bogor. Sugiantari AP, Budiantara IN. 2013. Analisis Faktor-Faktor yang Mempengaruhi Angka Harapan Hidup di Jawa Timur Menggunakan Regresi Semiparametrik Spline. Jurnal Sains dan Semi Pomits Vol.2 No.1. Wibowo W, Haryatmi S, Budiantara IN. 2009. Metode Kuadrat Terkecil Untuk Estimasi Kurva Regresi Semiparametrik Spline. [Internet]. [diunduh tanggal 2014 Februari 02]. Terdapat pada: http://eprints.uny.ac.id/7064/1/S.12%20Wahyu%20Wibowo.pdf. Xiang L, Lee AH, Yau KKW, McLachlan GJ. 2007. A score test for overdispersion in zero-inflated poisson mixed regression poisson. Statistics in Medicine. 26:1608-1622.doi:10.1002/sim.2616.
18 Lampiran 1 Nilai BRM regresi Poisson dan ZIP model Parametrik dan Semiparametrik pada setiap n dan Model
n
Parameter
BRM Poisson
Parametrik
15
-
0.1
0.4
0.6
30
-
0.1
0.4
0.6
50
-
0.1
0.4
0.6
b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3
ZIP 3.41 1.53 0.89 1.08 3.78 0.61 2.22 7.12 Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen 2.38 1.34 0.72 1.29 6.03 2.24 0.68 7.43 5.99 1.33 1.99 8.35 Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen 2.05 1.22 0.59 1.06 4.12 0.91 1.48 5.63 8.35 4.36 2.25 6.71 8.74 4.51 2.30 7.23
4.42 2.26 1.29 1.17 2.62 0.35 1.04 5.29
3.45 1.89 1.23 2.14 2.50 0.98 0.32 1.65 1.99 0.45 0.67 2.77
2.32 1.43 0.97 1.95 1.25 0.30 0.44 1.68 2.75 1.46 0.71 2.28 2.88 1.53 0.79 2.35
19 Model
n
Parametrik
100
Parameter
BRM Poisson
-
0.1
0.4
0.6
200
-
0.1
0.4
0.6
Semiparametrik
15
-
0.1
\ 0.4
b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5
ZIP 1.53 0.84 0.27 0.58 2.75 0.59 1.02 3.72 5.14 2.71 1.51 4.21 8.13 5.06 2.05 5.65 1.18 0.45 0.07 0.16 2.00 0.43 0.69 2.60 3.59 1.87 1.04 2.87 5.37 3.41 1.41 3.72 3.58 1.37 0.92 2.30 1.20 0.84 1.87 0.94 1.59 3.32 1.91 0.83 Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen
2.04 1.08 0.42 1.15 0.87 0.21 0.29 1.16 1.48 0.81 0.43 1.21 2.55 1.62 0.61 1.79 1.51 0.93 0.13 0.72 0.56 0.13 0.21 0.74 1.03 0.55 0.29 0.83 1.67 1.06 0.39 1.17 5.70 3.54 1.36 4.17 2.24 1.25 0.77 0.39 0.95 2.18 1.52 0.68
20 Model
n
Parameter
Semiparametrik
15
0.6
30
-
BRM Poisson
0.1
0.4
0.6
50
-
0.1
0.4
0.6
b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1
ZIP Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen 3.21 1.10 0.79 1.87 0.82 0.53 1.11 0.75 1.18 6.39 1.17 0.79 6.54 7.14 1.86 5.11 8.38 2.45 Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen Tidak Konvergen 2.72 0.93 0.41 1.02 0.46 0.25 1.07 0.67 1.21 5.91 1.53 0.76 5.86 6.40 1.78 4.59 7.46 2.18 7.62 8.46
5.26 3.22 0.93 3.38 1.82 0.88 0.26 0.22 0.38 2.01 0.62 0.27 2.39 2.67 0.54 2.77 3.01 0.94
4.51 2.48 0.69 2.32 0.97 0.50 0.25 0.20 0.34 1.84 0.57 0.25 2.03 2.25 0.52 1.60 2.56 0.67 2.72 3.07
21 Model
n
Parameter
Semiparametrik
50
0.6
100
-
BRM Poisson
0.1
0.4
0.6
200
-
0.1
0.4
0.6
b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1 b2 b3 b4 b5 b0 b1
ZIP 1.90 6.23 9.01 1.85 1.27 0.23 0.13 0.76 0.24 0.11 0.97 0.63 1.09 5.52 1.41 0.68 5.46 5.84 1.65 4.23 6.79 2.03 4.60 5.99 1.23 6.37 5.21 1.36 0.83 0.12 0.06 0.30 0.11 0.02 0.83 0.42 0.72 4.08 0.81 1.64 3.42 3.66 1.15 2.67 4.12 1.11 2.54 2.59
0.53 2.23 3.16 0.60 2.50 1.17 0.42 1.72 0.69 0.32 0.22 0.17 0.32 1.66 0.54 0.23 1.88 2.09 0.48 1.49 2.35 0.60 1.56 2.23 0.67 2.95 2.10 0.59 1.29 0.74 0.13 0.82 0.23 0.15 0.18 0.16 0.24 1.31 0.29 0.50 1.22 1.36 0.31 1.97 1.45 0.32 0.92 0.99
22 Model
n
Semiparametrik
200
Parameter
BRM Poisson
0.6
b2 b3 b4 b5
ZIP 1.22 8.90 4.41 6.35
0.36 6.91 1.56 1.65
Lampiran 2 Algoritma data aplikasi parametrik <- read.table("I:/Bahan/aplikasi-p.txt", header=TRUE) modelpoisson <- glm(Y~X1+X3+X5 , family="poisson", data=parametrik) modelzip <- zeroinfl(Y~X1+X3+X5, data=parametrik) semiparametrik <- read.table("I:/Bahan/aplikasi-s.txt", header=TRUE) modpoi <- glm(Y~X1+X3+B1+B2+B3, family="poisson", data=semiparametrik) modzip <- zeroinfl(Y~X1+X3+B1+B2+B3, data=semiparametrik)
Lampiran 3 Penduga model semiparametrik Poisson data aplikasi
(Intercept) X1 X3 B1 B2 B3
Nilai Dugaan 3.56844 -0.03996 0.01805 -0.86481 -0.19511 -0.79067
Galat Baku 2.01110 0.01676 0.01225 0.69408 0.62543 0.56496
Nilai-Z 1.774 -2.383 1.474 -1.246 -0.312 -1.400
Nilai-p 0.0760 * 0.0172 0.1406 0.2128 0.7551 0.1617
*) signifikansi pada taraf nyata 5%
Lampiran 4 Penduga model parametrik Poisson data aplikasi
(Intercept) X1 X3 X5
Nilai Dugaan 2.280066 -0.029029 0.013895 0.003112
Galat Baku 1.226250 0.014501 0.011344 0.006595
Nilai-Z 1.859 -2.002 1.225 0.472
Nilai-p 0.0630 * 0.0453 0.2206 0.6370
Nilai-Z 1.882 -1.243 1.001 -0.516
Nilai-p *0.0598 0.2138 0.3170 0.6060
*) signifikansi pada taraf nyata 5%
Lampiran 5 Penduga model parametrik ZIP data aplikasi Count Model (Intercept) X1 X3 X5
Nilai Dugaan 2.341502 -0.019364 0.011102 -0.003531
Galat Baku 1.244149 0.015578 0.011096 0.006847
23 Zero-Inflation Model (Intercept) X1 X3 X5
Nilai Dugaan -1.65884 0.06319 -0.01252 0.06224
*) signifikansi pada taraf nyata 10%
Galat Baku 7.55593 0.07090 0.07279 0.04176
Nilai-Z -0.220 0.891 -0.172 -1.490
Nilai-p 0.826 0.373 0.863 0.136
24
RIWAYAT HIDUP Penulis dilahirkan pada 07 Maret 1992 di Kediri, Jawa Timur yang merupakan cucu pertama dari Ibu Hj. Kustiani dan (alm) H. Syafi’i. Tahun 2004 penulis lulus dari SD Negeri 1 Kayen Lor kemudian melanjutkan pendidikan di SMP Negeri 1 Plemahan hingga tahun 2007 dan tahun 2010 penulis menyelesaikan pendidikan di SMA Negeri 1 Pare. Tahun yang sama, penulis diterima di Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) sebagai mahasiswa FMIPA dengan mayor Statistika dan minor Matematika Keuangan dan Aktuaria. Penulis menyelesaikan kuliah dengan bantuan beasiswa Bidik Misi. Selama mengikuti perkuliahan, penulis aktif di himpunan profesi mahasiswa Statistika Gamma Sigma Beta (GSB) sebagai staf Survey and Research pada periode kepengurusan 2011-2012 dan menjadi sekretaris Survey and Research periode kepengurusan 2012-2013. Selain itu, penulis juga aktif dalam kegiatan kepanitiaan seperti Panitia Pemilihan Raya Pusat KM IPB 2010 sebagai Bendahara, Staf Desain Dekorasi dan Dokumentasi Statistika Ria 2011, kadiv Desain Dekorasi dan Dokumentasi Statistika Ria 2012, staf kesekretariatan Kompetisi Statistika Junior 2012, sekretaris One Day with Statistician 2013, dan lain-lain. Penulis juga berkesempatan menjadi asisten mata kuliah Metode Statistika. Tahun 2012 penulis bergabung dalam tim PKM-P dan berhasil lolos pendanaan DIKTI. Pada 27 Juni – 28 Agustus 2013, penulis melaksanakan kegiatan Praktik Lapang di PT. Swadaya Panduartha, Jakarta.