PERBANDINGAN ANTARA REGRESI POISSON, BINOMIAL NEGATIF, DAN ZERO-INFLATED POISSON PADA DATA OVERDISPERSI
AJI SETYAWAN
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012
ABSTRAK AJI SETYAWAN. Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson pada Data Overdispersi. Dibimbing oleh KUSMAN SADIK dan INDAHWATI. Regresi Poisson digunakan untuk mengkaji hubungan antara peubah penjelas dengan peubah respon yang berupa data cacah. Regresi Poisson mengasumsikan nilai tengah dan ragam dari peubah respon mempunyai nilai yang sama. Akan tetapi, dalam penerapannya sering terjadi kondisi overdispersi. Overdispersi adalah kondisi pada saat ragam dari peubah respon lebih besar dari nilai tengah peubah respon. Overdispersi dapat terjadi karena banyaknyajumlah pengamatan yang bernilai nol pada peubah respon.Salah satu penanganan overdispersi pada regresi Poisson adalah menggunakan Regresi Binomial Negatif. Sedangkan penanganan overdispersi yang disebabkan oleh banyaknya jumlah amatan dengan peubah respon yang bernilai nol dapat menggunakan regresi Zero-Inflated Poisson (ZIP).Kajian simulasi dilakukan untuk membandingkan kinerja metode regresi Poisson, regresi Binomial Negatif, dan regresi ZIP yang dicobakan pada data yang tidak overdispersi dan data overdispersi. Pada data overdispersi diatur berbagai persentase jumlah amatan dengan peubah respon yang bernilai nol pada tiap jumlah amatan. Ketiga metode memberikan hasil yang sama baiknya pada data yang tidak mengalami overdispersi baik dari penduga parameter, penduga galat baku, dan sisaan. Overdispersi pada regresi Poisson akan menghasilkan galat baku yang lebih kecil dari nilai sesungguhnya (underestimate). Semakin besar jumlah amatan maka penduga parameter yang dihasilkan akan semakin mendekati parameter yang sebenarnya. Semakin besar persentase jumlah amatan yang bernilai nol pada peubah respon maka parameter yang dihasilkan akan semakin jauh dari parameter yang sebenarnya. Penerapan regresi ZIP pada data dengan banyak jumlah amatan yang bernilai nol pada peubah respon menghasilkan penduga parameter dan penduga galat baku dari penduga parameter yang sangat dekat dengan nilai sebenarnya daripada penduga parameter dan penduga galat baku yang dihasilkan oleh regresi Poisson dan regresi Binomial Negatif. Kata kunci: Regresi Poisson, Overdispersi, Regresi Binomial Negatif,Regresi Zero-Inflated Poisson
PERBANDINGAN ANTARA REGRESI POISSON, BINOMIAL NEGATIF, DAN ZERO-INFLATED POISSON PADA DATA OVERDISPERSI
Oleh : AJI SETYAWAN
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012
Judul Nama NRP
: Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson pada Data Overdispersi : Aji Setyawan : G14080021
Disetujui
Pembimbing I
Pembimbing II
Dr. Ir. Kusman Sadik, M.Si NIP : 196909121997021001
Dr. Ir. Indahwati, M.Si NIP : 19650712199032002
Diketahui Ketua Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si NIP : 196504211990021001
Tanggal Lulus :
KATA PENGANTAR Puji syukur penulis panjatkan kehadirat Allah SWT karena atas rahmat dan hidayah-Nya, penulis dapat menyelesaikan karya ilmiah ini. Karya ilmiah ini berjudul ”Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson pada Data Overdispersi”.Karya ilmiah ini penulis susun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan, bimbingan, dan bantuan dari banyak pihak. Oleh karena itu, dalam kesempatan ini penulis menyampaikan ucapan terima kasih kepada: 1. Bapak Ir. Hari Wijayanto, M.Si selaku Ketua Departemen Statistika FMIPA IPB. 2. Bapak Dr. Ir. Kusman Sadik, M.Sidan Ibu Dr. Ir. Indahwati, M.Si selaku dosen pembimbing yang telah memberikan bimbingan,masukan dan arahan kepada penulis. 3. Seluruh Dosen Departemen Statistika yang telah memberikan ilmu dan wawasan selama penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika yang telah banyak membantu penulis. 4. Kedua orang tua, adik, dan bude yang telah memberikan doa, kasih sayang serta dukungan baik moril maupun materil selama menuntut ilmu. 5. Rizki Fadhilah dan keluarga yang telah memberikan doa, kasih sayang, nasehat, dan dukungannya. 6. Bimandra A. Djafaara, Rifki Rizal, Andzar Syafa’atur Rahman, Iqbal Noviandi, Hadi Septian Guna Putra, M. Ferdiansyah, M. Seftian, Wisnu Panata Praja, Ferdian Bangkit Wijaya, Agus Sopian, dan De Budi Sudarsono yang telah memberikan dukungan dan bantuan selama penulis menyelesaikan karya ilmiah ini. 7. Teman-teman seperjuangan statistika khususnya Statistika 45 yang telah bersama-sama dalam segala suka maupun duka. 8. Seluruh pihak yang telah memberikan dukungan dan bantuan dalam penyelesaian karya ilmiah ini. Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pihak. Amin.
Bogor, November2012
Aji Setyawan
RIWAYAT HIDUP Penulis dilahirkan di Rembangpada tanggal 9 Agustus 1990 dari pasangan Suwarno dan Sulistyaningsih. Penulis merupakan anak pertama dari dua bersaudara. Tahun 2002 penulis lulus dari SD Negeri Kutoharjo2Rembang. Kemudian melanjutkan studi di SLTP Negeri 2 Rembang hingga tahun 2005. Selanjutnya, penulis menyelesaikan pendidikan di SMA Negeri 1Rembang dan lulus pada tahun 2008. Pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) dan diterima sebagai mahasiswa Departemen Statistika, FMIPA IPB dengan mayor Statistika dengan pilihan minor Matematika Keuangan dan Aktuaria. Selama mengikuti perkuliahan, penulis aktif dalam organisasi kemahasiswaan statistika Himpunan Profesi Gamma Sigma Beta (GSB)sebagai Ketua Badan Pengawas Himpunan Profesi Gamma Sigma Beta periode kepengurusan 2011 dan menjadi staf Beta ClubHimpunan Profesi Gamma Sigma Beta (GSB) pada periode kepengurusan 2010. Selain itu, penulis juga aktif dalam kegiatan kepanitiaan seperti Lomba Jajak Pendapat Statistika 2011 sebagai staf Divisi Logistik dan Transportasi, Statistika Ria 2010 sebagai Ketua Divisi Acara dan 2009 sebagai staf Divisi Logistik dan Transportasi,Welcome Ceremony Statistics (WCS) 2010 sebagai Ketua Pelaksana, serta beberapa kegiatan lainnya. Pada Februari - April 2012, penulis melaksanakan kegiatan praktik lapang di Balai Penelitian Tanaman Pemanis dan Serat (BALITTAS), Malang.
DAFTAR ISI Halaman DAFTAR GAMBAR ................................................................................................................. viii DAFTAR TABEL .................................................................................................................... viii DAFTAR LAMPIRAN ............................................................................................................ viii PENDAHULUAN .................................................................................................................... Latar Belakang .................................................................................................................... Tujuan .................................................................................................................................
1 1 1
TINJAUAN PUSTAKA ........................................................................................................... Regresi Poisson .................................................................................................................... Overdispersi ........................................................................................................................ Regresi Binomial Negatif ................................................................................................... Regresi Zero-Inflated Poisson (ZIP) ..................................................................................... Evaluasi Penduga Parameter dan Penduga Galat Baku Relatif .............................................
1 1 2 2 3 3
METODOLOGI ....................................................................................................................... Data ..................................................................................................................................... MetodeSimulasi ....................................................................................................................
3 3 4
HASIL DAN PEMBAHASAN ................................................................................................ Mendeteksi Overdispersi ...................................................................................................... Data Tidak Overdispersi ....................................................................................................... Data Overdispersi .................................................................................................................
5 5 5 6
KESIMPULAN DAN SARAN ................................................................................................ Kesimpulan ........................................................................................................................... Saran .....................................................................................................................................
8 8 9
DAFTAR PUSTAKA ...............................................................................................................
9
LAMPIRAN .............................................................................................................................
10
viii
DAFTAR GAMBAR 1 2 3 4
Halaman Plot peluang sebaran Poisson ............................................................................................ 1 Plot hubungan peubah penjelas dengan peubah respon pada regresi Poisson ................... 2 Plot antara sisaan dengan nilai Y dari ketiga model pada data tidak overdispersi ........... 6 Plot antara sisaan dengan nilai Y dari ketiga model pada data overdispersi .................... 8
DAFTAR TABEL 1 2 3 4 5
Halaman Rata-rata nilai-p dan jumlah amatan bernilai nol pada peubah respon dari setiap set data 5 Nilai mutlak bias relatif (ARB) dan MSE dari setiap penduga parameter regresi pada data yang tidak overdispersi ............................................................................................... 6 Galat baku dugaan dan galat baku sebenarnyadari penduga parameter regresi pada data yang tidak overdispersi ..................................................................................................... 7 Nilai mutlak bias relatif (ARB) dan MSE pada persentase jumlah amatan dengan peubah respon yang bernilai nol sebesar 60%.................................................................... 7 Galat baku dugaan dan galat baku sebenarnya penduga parameter pada persentase jumlah amatan dengan peubah respon yang bernilai nol sebesar 60%............................... 8
DAFTAR LAMPIRAN 1 2 3 4 5
Halaman Diagram alir metode simulasi ........................................................................................... 11 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen) untuk data yang tidakoverdispersi .................................................................................... 12 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen) untuk data yang mengalami overdispersi .......................................................................... 13 Nilai mutlak bias relatif (ARB) dan MSE pada setiap persentase jumlahamatan dengan peubah respon yang bernilai nol ....................................................................................... 16 Galat baku dugaan dan galat baku sebenarnya dari penduga parameter pada setiap persentase jumlah amatan dengan peubah respon yang bernilai nol ................................. 17
1
Latar belakang Dalam berbagai penelitian yang menggunakan penerapan statistika, sering dilakukan pengkajian hubungan antara peubah respon dengan peubah penjelas. Hubungan fungsional antara peubah respon dengan peubah penjelas dapat dijelaskan oleh analisis regresi. Analisis regresi linier mengasumsikan bahwa peubah respon merupakan peubah kontinu yang mengikuti sebaran normal. Apabila peubah respon berupa diskret atau data cacah, maka analisis ini tidak dapat digunakan. Jika analisis regresi linier digunakan untuk peubah respon berupa data cacah maka akan menyebabkan hasil yang tidak efisien, tidak efektif, dan pendugaan parameter yang berbias (Long 1997). Metode yang tepat digunakan untuk peubah respon berupa data cacah adalah analisis regresi Poisson. Pada regresi Poisson, peluang data cacah ditentukan berdasarkan sebaran Poisson. Nilai tengah dari sebaran Poisson merupakan fungsi dari peubah penjelasnya. Regresi Poisson mengasumsikan nilai tengah dan ragam dari peubah respon mempunyai nilai yang sama. Akan tetapi, dalam penerapannya sering terjadi kondisi overdispersi. Overdispersi adalah kondisi pada saat ragam dari peubah respon lebih besar dari nilai tengah peubah respon (Long 1997). Overdispersi dapat terjadi karena banyaknya pengamatan yang bernilai nol pada peubah respon (Ridout et al. 1998). Salah satu penanganan overdispersi pada regresi Poisson adalah menggunakan Regresi Binomial Negatif. Sedangkan penanganan overdispersi yang disebabkan oleh banyaknyaamatanyang bernilai nol pada peubah respon dapat menggunakan regresi Zero-Inflated Poisson (ZIP). Regresi ZIP ini membagi amatan ke dalam dua proses atau model. Model pertama digunakan untuk menentukan peluang dari peubah respon suatu amatan bernilai nol yang selanjutnya disebut model logit sedangkan model kedua digunakan untuk menentukan peluang dari peubah respon suatu amatanyang bernilai selain nol (Long 1997). Tujuan Penelitian ini dilakukan dengan tujuan sebagai berikut: 1. Membandingkan penduga parameter dari regresi Poisson, regresi Binomial Negatif, dan regresi ZIPuntuk data dengan banyak jumlahamatan bernilai nol pada peubah
respon dengan kondisi overdispersi dan tidak overdispersi. 2. Membandingkan penduga galat baku dari penduga parameter dari regresi Poisson, regresi Binomial Negatif, dan regresi ZIP untuk data dengan banyak jumlah amatan bernilai nol pada peubah respon dengan kondisi overdispersi dan tidak overdispersi.
TINJAUAN PUSTAKA Regresi Poisson Regresi Poisson sering digunakan untuk memodelkan kejadian yang jarang terjadi dengan data berupa data cacah. Fungsi peluang dari sebaran Poisson dengan parameter µ (Hardin & Hilbe 2007) adalah:
P (Y = y | µ ) =
exp(- µ ) µ
y
y! dengany = 0, 1, 2, … dan µ > 0. Contoh plot peluang sebaran Poisson dapat dilihat pada Gambar 1. Plot peluang sebaran Poisson
0.25
Keterangan µ=3 µ=5 µ=8 µ=12
0.20
Peluang
PENDAHULUAN
0.15 0.10 0.05 0.00 0
10
20
30
40
50
y
Gambar 1 Plot peluang sebaran Poisson Poisson juga merupakan bagian dari keluarga eksponensial, sehingga bisa dituliskan:
P (Y = y | µ ) = exp { y ln( µ ) - µ - ln Γ ( y + 1)} Kemudian nilai tengah parameter dapat ditulis: E ( yi | xi ) = µi = exp(xi β) sehingga model regresi Poisson (Long 1997) adalah: ln(µi )=xi β =β 0 +β1 x i1 +β 2 x i2 +...+β k x ik +ε i dengan: i = j = xij = β0 =
1, 2, ..., n 1, 2, ..., k peubah penjelas ke-j, amatan ke-i konstanta
2
βj
= koefisien regresi peubah penjelas ke-j n = banyaknya amatan k = banyaknya peubah penjelas Keluarga eksponensial biasanya ditulis dalam bentuk: yθ − b (θ ) f y ( y; θ , φ ) = exp + c( y, φ ) a (φ ) Dengan θ adalah parameter natural dan ø adalah skala yang dibutuhkan untuk menghasilkan galat baku yang mengikuti distribusi dalam keluarga eksponensial (Hardin & Hilbe 2007). Gambar 2 memperlihatkan contoh plot hubungan antara peubah respon dengan peubah penjelas pada regresi Poisson. P lo t re g re s i P o is s o n 30 25 20
Y 15 10 5
overdispersi dapat ditulis var(Y) > E(Y). Sebaliknya, data yang ragam peubah respon bernilai lebih kecil dari rata-rata peubah respon disebut dengan underdispersi (McCullagh & Nelder 1989). Long (1997) dalam Jackman (2007) menyatakanoverdispersi dapat terjadi karena adanya sumber keragaman yang tidak teramati pada data atau adanya pengaruh peubah lain yang mengakibatkan peluang terjadinya suatu kejadian bergantung pada kejadian sebelumnya. Overdispersi akan mengakibatkan simpangan baku dari parameter dugaan menjadi berbias ke bawah (underestimate) dan signifikansi dari pengaruh peubah penjelas menjadi berbias ke atas (overstate) (Ismail & Jemain 2007). Dugaan overdispersi dapat diukur melalui rasio antara deviance dengan derajat bebasnya. Jika rasio ini menghasilkan nilai yang lebih besar dari satu, maka model tersebut dikatakan mengalami overdispersi. Deviance model regresi Poisson memiliki persamaan sebagai berikut :
0 0
Gambar 2
2
4
6
X
8
ܦൌ ʹ ൜ݕ
10
Plot hubungan peubah penjelas dengan peubah respon pada regresi Poisson
Pendugaan dari parameter koefisien regresi Poisson dapat dilakukan dengan menggunakan metode Maximum Likelihood Estimation (MLE). Fungsi kemungkinan dari regresi Poisson adalah (Yesilova et al. 2010a): n
L(β) =
∏P( y | β) i
i =1
(∑
n
exp =
i =1
{
[ exp(xiβ)]) ∏ [ exp(xiβ)] n
∏
i =1
n
i =1
yi
}
yi !
dan logaritma natural dari kemungkinannya sebagai berikut:
fungsi
ln L(β ) = ∑ { yi x i β - exp( x i β ) - ln ( yi !)} n
i =1
ୀ
െ െ ̂ ̂
dengan yi merupakan nilai aktual amatan ke-i dari peubah respon dan ̂ merupakan nilai dugaan peubah respon untuk amatan ke-i (Hardin & Hilbe 2007).Rasio dispersi(α) ini dapat diuji secara formal dengan hipotesis sebagai berikut : H0 : α = 1 H1 : α > 1 Hipotesis nol ditolak jika D > χ2(n-p;α) (Halekoh et al. 2007) dengan n adalah jumlah amatan dan p adalah jumlah parameter. Regresi Binomial Negatif Regresi Binomial Negatif merupakan salah satu cara untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut :
(
) αµ y 1 α P ( y | µ,α ) = y ! Γ (α ) 1 + αµ 1 + αµ Γ y +α
−1
−1
Overdispersi Dalam model regresi Poisson terdapat asumsi yang harus dipenuhi. Asumsi tersebut adalah nilai rata-rata dari peubah respon harus bernilai sama dengan ragam peubah respon, yang disebut juga ekuidispersi. Namun, dalam analisis data cacah sering dijumpai data dengan ragam peubah respon bernilai lebih besar dari rata-rata peubah respon, biasa disebut dengan overdispersi. Fenomena
dengan y merupakan nilai dari data cacah,µ adalah nilai harapan y, dan α merupakan parameter dispersi, α>0 (Yesilova et al. 2010b). Jika α 0, maka distribusi ini mendekati sebaran Poisson(µ). Sebaran Binomial Negatif memiliki nilai tengah dan ragam ଶ (Ismail & Jemain 2007).
→
-1
3
Peubah respon didefinisikan sebagai peubah acak berdistribusi Binomial Negatif dengan fungsi penghubung log. Model regresi yang akan dibentuk, yaitu : ln(µ i )=x i β
=β 0 +β1 x i1 +β 2 x i2 +...+β k x ik Parameter regresi Binomial Negatif (β) diduga menggunakan penduga kemungkinan maksimum. Regresi Zero-Inflated Poisson (ZIP) Model Regresi ZIP merupakan model campuran untuk data cacahdengan banyak nilai nol pada peubah respon. Model ini merupakan kombinasi dari sebaran Poisson dengan sebaran kejadian yang bernilai nol (Cameron & Trivedi 1998). Berikut fungsi sebaran dari ZIP: ω + (1 - ω ) exp(- µ ); y = 0 Pr(Y = y ) = y (1 - ω ) exp ( - µ ) µ / y !; y > 0 dengan Y~ZIP(µ,ω). µ adalah parameter dari sebaran Poisson, sedangkan ω adalah peluang dari kejadian bernilai nol (Ridout et al. 1998). Kemudian dari fungsi sebaran tersebut didapatkan E(Y) dan var(Y) sebagai berikut: E(Y)=(1-ω)µ
ω ( E (Y ))2 1- ω
var(Y ) = E (Y ) +
Berdasarkan nilai di atas regresi ZIP tidak mengasumsikan nilai var(Y)=E(Y) karena nilai dari var(Y) ZIP lebih besar dari E(Y) sehingga ZIP bisa digunakan untuk mengatasi masalah overdispersi. Model penghubung yang digunakan untuk µ dan ω adalah
ω = Gγ 1- ω
ln( µ ) = X β dan ln
X dan G adalah matriks peubah penjelas (Yesilova et al. 2010b). Sedangkanβ dan γ adalah vektor-vektor parameter model berukuran (p+1)x1 dan (q+1)x1 yang akan diduga nilainya. Peubah penjelas yang digunakan dalam model log dapat bernilai sama atau berbeda dengan peubah penjelas yang digunakan dalam model logit. Jika peubah penjelas yang digunakan dalam model log dan model logit sama maka fungsi penghubungnya menjadi ln( µ ) = X β dan
ω = τ Xβ (Ridout et al. 1998). 1- ω
ln
Fungsi log-likelihood untuk model ZIP dapat ditulis sebagai:
lnL(β,γ)=∑ I(yi =0)ln exp ( gi γ ) +exp -exp ( xiβ ) + n
(
i=1
(
))
∑(1-I ( y =0) ) ( y xiβ-exp ( xiβ) ) n
i
i
i=1
∑ ln (1+exp ( gi γ ) ) n
i=1
dengan I(yi=0) bernilai 1 jikayi=0 danbernilai 0 jikayiselainnya. Pendugaankemungkinanmaksimumuntukβdan γdiperolehdenganmenggunakanalgoritmaExpe ctation-Maximization (EM) (Cameron &Trivedi 1998). Evaluasi Penduga Parameter dan Penduga Galat Baku Relatif Menurut Savic (2009) akurasi nilai penduga parameter dapat dilihat dari nilai bias relatif (BR) dan Root Mean Square Error (RMSE). Persamaan dari nilai bias relatif adalah:
BR=
βɵi -β x100% β i=1
∑ r
1
r
Menurut Muzathik (2011) jika nilai bias relatif terletak dalam selang -10% sampai 10% maka penduga parameter tersebut dapat diterima. Sedangkan nilai RMSE dapat diketahui dari persamaan:
RMSE=
∑ ( βɵ -β ) r
1
r
2
i
i=1
dengan: r = banyaknya data dugaan
୧ = penduga ke-i parameter
= parameter yang sebenarnya. Semakin kecil nilai bias relatif dan nilai RMSE maka model dikatakan semakin baik. Sedangkan jika ingin mengetahui nilai penduga galat baku relatif dapat dicari dengan membagi antara galat baku penduga dengan penduga parameter. Kemudian untuk mengetahui nilai galat baku relatif sebenarnya dapat menggunakan persamaan (Savic 2009):
1 r βɵ i -β sd (βɵ )= ∑ r i=1 β
2
*
METODOLOGI Data Data yang digunakan adalah data hasil simulasi dengan parameter yang telah ditentukan. Data yang dibangkitkan digunakan untuk mendapatkan penduga parameter dari
4
regresi Poisson, regresi Binomial Negatif, dan regresi ZIP. Data yang dibangkitkan adalah data dengan banyak jumlah amatan bernilai nol (excess zero) pada peubah respon dengan kondisi overdispersi dan tidak overdispersi. Pada data overdispersi, persentase jumlah amatan pada peubah respon yang bernilai nol ditentukan sebesar 40%, 60%, dan 80%. Besaran parameter dan peubah yang ditentukan untuk membuat model ln(µ)=β0+β1X1i+β2X2i, adalah: 1. Parameter koefisien regresi: a. Untuk data tanpa overdispersi: β0=1.5, β1=-ln(2), β2=ln(3) b. Untuk data dengan overdispersi: β0=1, β1=0.4, β2=0.6, dan τ yang berbeda-beda untuk setiap persentase amatan pada peubah respon yang bernilai nol. Untuk 40% τ ditetapkan sebesar -0.15, untuk 60% τ=0.175, dan untuk 80% τ=0.5 2. Peubah bebas: a. Untuk data tanpa overdispersi: peubah X1 adalah peubah acak yang menyebar Normal (5,2) dan peubah X2 adalah peubah acak yang menyebar Seragam (1,2). X1 dan X2 diasumsikan sebagai peubah tetap. b. Untuk data dengan overdispersi: Peubah X1 adalah peubah acak yang menyebar Normal (3,1), sedangkan X2 adalah peubah acak yang menyebar Seragam (0,2). X1 dan X2 diasumsikan sebagai peubah tetap. 3. Peubah respon: Peubah respon Yi merupakan data yang akan dibangkitkan. Dalam simulasi ini peubah respon yang dibangkitkan adalah a. Peubah respon dengan banyak jumlah amatan bernilai nol pada kondisi tanpa overdispersi (α=0). b. Peubah respon dengan banyak jumlah amatan bernilai nol pada kondisi overdispersi. 4. Respon yang diamati dalam penelitian sebanyak n=60, 100, dan 200. Untuk memperoleh hasil pendugaan yang mewakili populasi maka pembangkitan data diulang sebanyak r=1000 kali.
1. 2.
3.
Metode Simulasi Membangkitkan n buah data peubah penjelasX1 dan peubah bebas X2. Menghitung nilai µ pada masing-masing amatan dengan cara µi=exp(β0+β1x1i+ β2x2i). Membangkitkan peubah respon:
a.
4. 5. 6.
7.
8. 9.
10.
11. 12.
13.
Pada data yang tidak mengalami overdispersi, data respon didapat dengan cara membangkitkan n buah data peubah respon yang menyebar Poisson (µi). b. Pada data yangmengalami overdispersi, data respon didapat dengan cara: 1) Menghitung parameter γ0=τβ0, γ1= τβ1,dan γ2= τβ2 2) Menghitung nilai ωi pada masing-masing amatan dengan cara: exp ( γ 0 +γ1 x 1i +γ 2 x 2i ) ωi = 1+exp ( γ 0 +γ1 x 1i +γ 2 x 2i ) 3) Membangkitkan variabel c dengan cara membangkitkan n buah data yang menyebar Seragam (0,1). 4) Membangkitkan variabel Yp dengan cara membangkitkan bilangan acak yang menyebar Poisson (µi). 5) Membandingkan variabel c pada tiap amatan dengan nilai ωi. Apabila ci>ωi maka Yi=Yp, sedangkan apabila ci≤ωimaka Yi=0. Mencatat nilai peubah respon dan semua peubah penjelas. Menghitung jumlah data respon yang bernilai nol. Melakukan pendugaan parameter menggunakan regresi Poisson, regresi Binomial Negatif, dan regresi ZIP. Mencatat nilai deviance yang dihasilkan dari regresi Poisson dan menghitung nilaip yang digunakan untuk melakukan uji formal overdispersi. Mencatat nilai pendugaan parameter dari masing-masing metode regresi. Mencatat penduga galat baku dari masingmasing penduga parameter untuk ketiga metode regresi. Menghitung nilai bias relatif, nilai mutlak bias relatif mutlak (ARB/Absolute Relative Bias), dan Mean Square Error (MSE) dari masing-masing penduga parameter. Mengulangi langkah 1-10 1000 kali Menghitung rata-rata nilai-p dan ratarataamatanyang bernilai nol pada peubah respon. Membuat diagram kotak garis dari nilainilai bias relatif masing-masing penduga parameter dari regresi Poisson, regresi Binomial Negatif,dan regresi ZIP.
5
14. Menghitung rata-rata dari 1000 nilai bias relatif mutlak dan MSE dari masingmasing penduga parameter untuk ketiga metode. 15. Menghitung rata-rata dari penduga galat baku masing-masing penduga parameter untuk ketiga metode 16. Menghitung galat baku sebenarnya dari penduga parameter pada ketiga metode regresi, dengan rumus:
sd*(βɵ )=
βɵ -β ) ( ∑ n 1
1000
2
i
i=1
17. Melihat nilai mutlak bias relatif dan MSE dari penduga parameter serta nilai galat baku duga dan sebenarnya dari setiappenduga parameter untuk ketiga metode. Diagram alir dari metode simulasi dapat dilihat pada Lampiran 1.
besar dibandingkan yang lain tetapi perbedaannya tidak signifikan. Dari hasil nilai mutlak bias relatif dan MSE yang dihasilkan dapat dikatakan bahwa regresi Poisson, regresi Binomial Negatif, dan regresi ZIP sama baiknya dalam pendugaan parameter untuk data yang tidak mengalami overdispersi. Namun, regresi Poisson dan regresi Binomial Negatif lebih efektif digunakan dalam pendugaan parameter karena pada regresi ZIP selain menduga parameter β (model log) juga dilakukan pendugaan terhadap parameter γ (model logit). Tabel 1 Rata-rata nilai-p dan jumlah amatan bernilai nol pada peubah respon dari setiap set data Ditetapkan n
HASIL DAN PEMBAHASAN 60
Mendeteksi Overdispersi Adanya overdispersi pada data hasil simulasi dapat dideteksi dengan menggunakan nilai deviance atau nilai-p yang terbentuk. Pendeteksian overdispersi untuk data hasil simulasi dapat dilihat pada Tabel 1. Pada data cacah yang tidak mengandung overdispersi (α=0), pengujian rasio dispersi menghasilkan nilai peluang yang lebih besar dari taraf nyata yang ditentukan, yaitu sebesar 5%, artinya data cacah hasil simulasi tersebut terbukti tidak mengandung overdispersi. Sedangkan pada data cacah yang mengandung overdispersi (α>0), uji formal untuk rasio dispersi memiliki nilai pelung yang lebih kecil dari taraf nyata yang ditentukan, artinya data cacah yang dibangkitkan terbukti mengalami overdispersi. Data Tidak Overdispersi Data cacah yang tidak mengalami overdispersi dianalisis menggunakan regresi Poisson, regresi Binomial Negatif, dan regresi ZIP. Ketiga metode ini menghasilkan penduga parameter yang mendekati nilai parameter sebenarnya. Semakin besar ukuran contoh maka nilai penduga parameter yang dihasilkan akan semakin dekat dengan parameter yang sebenarnya.Tabel 2 memperlihatkan bahwa nilai mutlak bias relatifdan MSE dari ketiga metode pada setiap parameter bernilai kecil. Selain itu, nilai mutlak bias relatifdan MSE antar metode menghasilkan nilai yang hampir sama. Nilai mutlak bias relatif dan MSE pada regresi ZIP memiliki nilai yang sedikit lebih
100
200
Hasil simulasi
Parameter dispersi
Jumlah nol
Jumlah nol
Nilai-p
Keterangan
α=0
-
46.22%
0.583
Ekuidispersi
α>0
40%
39.67%
0
Overdispersi
α>0
60%
62.07%
0
Overdispersi
α>0
80%
79.44%
0
Overdispersi
α=0
-
46.47%
0.632
Ekuidispersi
α>0
40%
39.72%
0
Overdispersi
α>0
60%
61.89%
0
Overdispersi
α>0
80%
79.80%
0
Overdispersi
α=0
-
46.39%
0.693
Ekuidispersi
α>0
40%
39.74%
0
Overdispersi
α>0
60%
62.00%
0
Overdispersi
α>0
80%
79.96%
0
Overdispersi
Sebaran nilai bias relatif dari masingmasing penduga parameter untuk semua data disajikan dalam diagram kotak garis pada Lampiran 2. Berdasarkan diagram kotak garis tersebut dapat dilihat bahwa nilai tengah dari bias relatif untuk semua parameter dari seluruh data yang tidak mengalami overdispersi mendekati nol. Pada penelitian ini juga dilakukan pendugaan terhadap galat baku dari penduga parameter regresi. Ketiga metode regresi ini menghasilkan penduga galat baku yang mendekati nilai galat baku sebenarnya dari setiap penduga parameter regresi. Nilai penduga galat baku dari penduga parameter dan galat baku sebenarnya dapat dilihat pada Tabel 3. Pada Tabel 3 dapat dilihat bahwa penduga galat baku dari ketiga metode regresi menghasilkan nilai yang hampir sama dengan nilai galat baku sebenarnya dari penduga parameter. Pada regresi ZIP menghasilkan
6
Tabel 2 Nilai mutlak bias relatif (ARB) dan MSE dari setiap penduga parameter regresi pada data yang tidak overdispersi Poisson Binomial Negatif ZIP n Parameter ARB(%) MSE ARB(%) MSE ARB(%) MSE 60
100
200
b0
34.664
0.437
34.888
0.443
35.590
0.473
b1
6.832
0.004
6.929
0.004
8.508
0.006
b2
28.730
0.160
28.943
0.162
30.612
0.180
b0
24.440
0.216
24.538
0.218
25.096
0.236
b1
4.897
0.002
4.931
0.002
5.719
0.003
b2
20.224
0.079
20.224
0.079
21.002
0.088
b0
17.160
0.104
17.303
0.106
17.662
0.111
b1
3.262
0.001
3.290
0.001
3.728
0.001
b2
14.284
0.040
14.462
0.040
14.955
0.043
selisih antara penduga galat baku dengan galat baku sebenarnya yang sedikit lebih besar dibandingkan regresi Poisson dan regresi Binomial Negatif tetapi selisih atau perbedaan tersebut tidak terlalu signifikan. Plot sisaan dengan nilai Y Keterangan
6
Poisson Binomial Negatif ZIP
Sisaan
4 2 0 -2 -4
0
2
4
6
Y
8
10
12
Gambar 3 Plot antara sisaan dengan nilai Y dari ketiga model pada data tidak overdispersi Contoh plot sisaan dari ketiga model regresi dengan setiap nilai Y atau setiap amatan pada salah satu set data (n=100) dapat dilihat pada Gambar 3. Plot ini memperlihatkan bahwa residual yang terbentuk menghasilkan nilai yang hampir sama untuk model regresi Poisson, regresi Binomial Negatif, dan regresi ZIP. Hal ini menunjukkan ketiga model memberikan hasil penduga parameter yang sama baiknya. Data Overdispersi Data cacah yang mengalami overdispersi dibangkitkan dengan berbagai persentase jumlah amatan yang bernilai nol pada peubah responnya. Hal ini dilakukan untuk mengetahui penduga parameter yang dihasilkan menggunakan regresi Poisson,
regresi Binomial Negatif, dan regresi ZIP dalam berbagai kondisi jumlah amatan yang bernilai nol pada peubah respon. Penelitian ini ingin melihat seberapa besar penyimpangan yang terjadi pada data cacah yang mengalami overdispersi dengan banyak jumlah amatan yang bernilai nol pada peubah respon jika dianalisis menggunakan regresi Poisson dan regresi Binomial Negatif. Pada data yang mengalami overdispersi dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%, 60%, dan 80%, regresi Poisson dan regresi Binomial Negatif tidak tepat digunakan dalam pendugaan parameter karena penduga parameter regresi yang dihasilkan sangat jauh dari nilai parameter sebenarnya. Nilai mutlakbias relatif dan MSE yang dihasilkan untuk persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60% dapat dilihat pada Tabel 4 dan selengkapnya terdapat pada Lampiran 3. Semakin besar ukuranpersentase jumlah amatan yang bernilai nol pada peubah respon maka nilai mutlak bias relatif dan MSE yang dihasilkan akan semakin besar. Semakinbesar ukuran contoh maka nilai mutlak bias relatif dan MSE dari masingmasing penduga parameter akan semakin kecil. Pada keseluruhan data yang dibangkitkan, nilai mutlak bias relatif dan MSE yang dihasilkan oleh regresi Poisson dan regresi Binomial Negatif jauh lebih besar daripada yang dihasilkan oleh regresi ZIP. Bahkan untukpersentase jumlah amatan dengan peubah respon yang bernilai nol sebesar 80% padajumlah amatan (n) sebesar 60 dan 100 regresi Binomial Negatif tidak bisa menghasilkan iterasi yang konvergen yang menyebabkan tidak ada penduga parameter yang dihasilkan. Dari nilai mutlak bias relatif
7
Tabel 3 Galat baku dugaan dan galat baku sebenarnyadari penduga parameter regresi pada data yang tidak overdispersi Poisson Binomial Negatif ZIP n Parameter Dugaan Sebenarnya Dugaan Sebenarnya Dugaan Sebenarnya 60
100
200
b0
0.614
0.661
0.629
0.665
0.635
0.688
b1
0.061
0.061
0.063
0.062
0.067
0.076
b2
0.373
0.399
0.383
0.402
0.388
0.425
b0
0.455
0.465
0.464
0.466
0.469
0.486
b1
0.043
0.044
0.044
0.044
0.046
0.052
b2
0.277
0.280
0.283
0.281
0.287
0.297
b0
0.308
0.323
0.314
0.325
0.317
0.334
b1
0.028
0.029
0.029
0.029
0.030
0.033
b2
0.188
0.199
0.191
0.200
0.194
0.208
dan MSE yang dihasilkan menunjukkan bahwa penduga parameter yang dihasilkan oleh regresi Binomial Negatif dan regresi Poisson tidak sesuai dengan parameter sebenarnya atau parameter yang ditetapkan. Pada Tabel 4 dan Lampiran 4 nilai mutlak bias relatif dan MSE dari regresi ZIP memiliki nilai yang kecil untuk keseluruhan data yang telah dibangkitkan dengan kriteria yang ditentukan. Hal ini menunjukkan bahwa regresi ZIP baik digunakan dalam pendugaan parameter untuk data yang mengalami overdispersi dengan seluruh jenis persentase jumlah amatan bernilai nol pada peubah respon yang telah ditetapkan. Sebaran nilai bias relatif dari masingmasing penduga parameter untuk semua data yang mengalami overdispersi dengan berbagai persentase jumlah amatan yang bernilai nol pada peubah respon disajikan dalam diagram kotak garis pada Lampiran 3. Berdasarkan diagram kotak garis tersebut dapat dilihat bahwa nilai tengah dari bias relatif untuk semua parameter regresi ZIP sangat dekat dengan nol. Hal ini menunjukkan parameterparameter yang dihasilkan oleh regresi ZIP tidak berbias. Pengaruh overdispersi pada regresi Poisson terlihat jelaspada penduga galat baku koefisien
regresi yang dihasilkan. Pada data yang tidak mengalami overdispersi, nilai galat baku dari koefisien regresi Poisson mendekati nilai galat baku sebenarnya. Namun pada data yang mengalami overdispersi,nilai galat baku dari penduga parameter regresi Poisson menjadi lebih kecil dari nilai galat baku sebenarnya (underestimate). Kondisi ini juga terjadi pada penduga dari galat baku penduga parameter yang dihasilkan oleh regresi Binomial Negatif. Nilai penduga galat baku dari penduga parameter dan nilai galat baku sebenarnya dari penduga parameter regresi ketiga model untuk persentase jumlah amatan dengan peubah respon yang bernilai nol sebesar 60% dapat dilihat pada Tabel 5 dan selengkapnya terdapat pada Lampiran 5. Pada Tabel 5 dan Lampiran 5 juga dapat dilihat bahwa regresi ZIP menghasilkan penduga galat baku yang mendekati nilai galat baku sebenarnya dari setiap penduga parameter regresi. Dari penduga parameter dan penduga galat baku yang dihasilkan menunjukkan bahwa regresi ZIP mampu mengatasi overdispersi pada regresi Poisson dengan data yang memiliki banyak jumlah amatan yang bernilai nol pada peubah respon.
Tabel 4 Nilai mutlak bias relatif (ARB) dan MSE pada persentase jumlah amatan dengan peubah respon yang bernilai nol sebesar 60% Persentase respon bernilai nol
Jumlah amatan
60%
60
Parameter
Poisson
Binomial Negatif
ZIP
ARB (%)
MSE
ARB (%)
MSE
ARB (%)
MSE
b0
88.379
1.180
86.033
1.100
18.207
0.053
b1
45.247
0.052
44.427
0.050
11.243
0.003
b2
47.146
0.131
46.984
0.130
13.014
0.010
8
Persentase respon bernilai nol
Jumlah amatan
Poisson
Parameter
100 60% 200
Binomial Negatif
ZIP
ARB (%)
MSE
ARB (%)
MSE
ARB (%)
MSE
b0
84.191
1.041
83.560
1.016
13.037
0.027
b1
37.143
0.034
36.747
0.033
8.162
0.002
b2
37.518
0.079
37.322
0.078
9.560
0.005
b0
78.369
0.787
78.306
0.784
9.231
0.013
b1
24.863
0.016
24.816
0.016
5.587
0.001
b2
27.510
0.043
27.511
0.043
6.795
0.003
dari model regresi ZIP berada sekitar nilai nol. Hal ini menunjukkan bahwa pada data overdispersi dengan banyak jumlah amatan yang bernilai nol pada peubah respon, regresi ZIP akan menghasilkan pendugaan model yang lebih baik.
Plot sisaan dengan nilai Y 50
Keterangan
Poisson Binomial Negatif ZIP
40 30 20
na sai 10 S
0
KESIMPULAN DAN SARAN
-10 -20 -30
0
20
40
Y
60
80
Kesimpulan Parameter dugaan yang dihasilkan oleh regresi ZIP memberikan hasil yang lebih baik dibandingkan regresi Poisson dan regresi Binomial Negatif pada data yang mengandung overdispersi dengan banyak jumlah amatan yang bernilai nol pada peubah respon. Penerapan regresi ZIP pada data yang mengalami overdispersi dengan banyak jumlah amatan yang bernilai nol pada peubah respon menghasilkan penduga galat baku yang hampir sama dengan nilai galat baku sebenarnya dari masing-masing penduga parameter. Pada data yang mengandung overdispersidengan banyak jumlah amatan yang bernilai nol pada peubah respon,
100
Gambar 4 Plot antara sisaan dengan nilai Y dari ketiga model pada data overdispersi Plot sisaan dari ketiga model regresi dengan setiap nilai Y atau setiap amatan pada salah satu set data yang mengalami overdispersi yaitu n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60 % dapat dilihat pada Gambar 4. Plot ini memperlihatkan bahwa residual yang terbentuk dari model regresi ZIP menghasilkan nilai yang lebih baik dari model regresi Poisson dan regresi Binomial Negatif karena sebagian besar sisaan yang dihasilkan
Tabel 5 Galat baku dugaan dan galat baku sebenarnya penduga parameter pada persentase jumlah amatan dengan peubah respon yang bernilai nol sebesar 60% Persentase respon bernilai nol
Jumlah amatan
60
60%
100
200
Poisson
Binomial Negatif
ZIP
Parameter Dugaan
Sebenarnya
Dugaan
Sebenarnya
Dugaan
Sebenarnya
b0
0.210
1.086
0.241
1.049
0.225
0.231
b1
0.052
0.228
0.061
0.224
0.056
0.057
b2
0.093
0.362
0.109
0.360
0.097
0.100
b0
0.159
1.020
0.165
1.008
0.166
0.166
b1
0.039
0.185
0.041
0.183
0.041
0.041
b2
0.070
0.281
0.073
0.279
0.071
0.073
b0
0.111
0.887
0.112
0.886
0.113
0.116
b1
0.027
0.125
0.027
0.125
0.028
0.028
b2
0.048
0.208
0.049
0.208
0.049
0.051
9
regresi ZIP dapat memberikan uji signifikansi peubah bebas yang lebih berarti dibandingkan regresi Poisson dan regresi Binomial Negatif. Padadata yang tidak mengalami overdispersi, regresi Poisson, regresi Binomial Negatif, dan regresi ZIP memberikan hasil yang sama baiknya dalam penduga parameter dan penduga galat baku. Semakin besar ukuran contoh atau jumlah amatan maka nilai mutlak bias relatif dan MSE dari masing-masing parameter akan semakin kecil. Sedangkan semakin besar persentase jumlah amatan yang bernilai nol pada peubah respon maka nilai mutlak bias relatif dan MSE dari masing-masing parameter untuk tiap metode akan semakin besar. Saran Hal yang perlu diberikan perhatian dalam penelitian ini adalah penentuan parameter, persentase jumlah amatan yang bernilai nol pada peubah, dan ukuran contoh. Tentunya akan lebih menarik jika parameter, persentase jumlah amatan yang bernilai nol pada peubah respon, jenis peubah bebas, dan ukuran contoh yang ditetapkan lebih bervariasi agar lebih dapat mewakili populasi sehingga akan diperoleh kesimpulan yang lebih mewakili kondisi yang sebenarnya di lapangan.
DAFTAR PUSTAKA Cameron AC, Trivedi PK. 1998. Regression Analysis of Count Data. Cambridge: Cambridge University Press. Halekoh U, Hojsgaard S. 2007. Overdispersion. Denmark: Unit of Statistics and Decision Analysis, The Faculty of Agricultural Sciences, University of Aarhus. Hardin JW, Hilbe JM. 2007. Generalized Linear Models and Extensions. Texas: A Stata Press Publication. Ismail N, Jemain AA. 2007. Handling Overdispersion with Negative Binomial and Generalized Poisson Regression Models. Virginia: Casualty Actuarial Society Forum. Jackman S. 2007. Models for Counts Political Science. [terhubung berkala]. http://jackman.stanford.edu/classes/350C/ Poisson.pdf [4 Mei 2012]. Long JS. 1997. Regression Models for Categorical and Limited Dependent Variables. Number 7 in Advance Quantitive Techniques in The Social Sciences. California: Sage Publications.
McCullagh P, Nelder JA. 1989. Generalized Linear Models. London: Chapman & Hall. Muzathik MA, Nik WBW, Samo KB, Sopian K, Alghoul MA. 2011. Daily Global Solar Radiation Estimate Based on Sunshine Hours.International Journal of Mechanical and Materials Engineering (IJMME), Vol.6 (2011), No.1, 75-80 Ridout M, Demetrio CGB, Hinde JP. 1998. Models for Counts Data with Many Zeros. Proceedings of XIXth International Biometric Conference, Cape Town, Invited Papers, pp. 179-192. Savic R. 2009. Performance in Population Models for Count Data, Part II: A New SAEM algorithm. Paris: Universite ParisDiderot-Paris VII. Yesilova A, Kaya Y, Kaki B, Kasap I. 2010. Analysis of Plant Protection Studies with Excess Zeros Using Zero-Inflated and Negative Binomial Hurdle Models. Turkey: Gazi University Journal of Science. Yesilova A, Kaydan MB, Kaya Y. 2010. Modelling Insect-Egg Data with Excess Zeros Using Zero-Inflated Regression Models. Turkey: Faculty of Science, Hacettepe University.
LAMPIRAN
11
Lampiran 1 Diagram alir metode simulasi Non-overdispersi
Menentukan jumlah amatan (n) n=60, 100, dan 200
Overdispersi
Membangkitkan X1i dan X2i X1i ~ Normal (5,2); X2i ~ Seragam (1,2)
Membangkitkan X1i dan X2i X1i ~ Normal (3,1); X2i ~ Seragam (0,2)
Menghitung nilai µ i µ i=exp(β0+β1X1i+β2X2i) β0=1.5; β1=-ln(2); β2=ln(3)
Menghitung nilai µ i µ i=exp(β0+β1X1i+β2X2i) β0=1; β1=0.4; β2=0.6
Menentukan persentase amatan yang bernilai nol (40%, 60%, dan 80%)
Yi~Poisson (µ i)
Menghitung parameter γ0=τβ0, γ1=τβ1, dan γ2=τβ2 τ40%=-0.15; τ60%=0.175; τ80%=0.5
Menghitung nilai
Membangkitkan variabel ci ~ Seragam(0,1)
Yi=0
Ya
Tidak Yi~Poisson (µ i)
Regresi Poisson
Nilai deviasi
Nilai-p
Regresi Binomial Negatif
Penduga parameter (Nilai bias relatif, nilai mutlak bias relatif, dan MSE)
Galat Baku
Regresi ZIP
Penduga parameter (Nilai bias relatif, nilai mutlak bias relatif, dan MSE)
Galat Baku
12
Lampiran 2 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen) untuk data yang tidakoverdispersi Untuk n=60
Untuk n=100
Untuk n=200
13
Lampiran 3 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen) untuk data yang mengalami overdispersi Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
14
Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
15
Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
16
Lampiran 4
Persentase respon bernilai nol
Nilai mutlak bias relatif (ARB) dan MSE pada setiap persentase jumlah amatan dengan peubah respon yang bernilai nol Poisson
Jumlah amatan
Parameter
60
100 40% 200
60
100 60% 200
60
100 80% 200
Binomial Negatif
ZIP
ARB (%)
MSE
ARB (%)
MSE
ARB (%)
MSE
b0
70.491
0.689
70.279
0.684
13.515
0.028
b1
27.751
0.019
27.625
0.019
8.020
0.002
b2
30.255
0.050
30.189
0.050
9.426
0.005
b0
63.765
0.528
63.627
0.525
10.275
0.017
b1
20.613
0.011
20.543
0.011
6.193
0.001
b2
23.272
0.031
23.261
0.031
7.581
0.003
b0
63.024
0.473
63.024
0.473
6.995
0.008
b1
15.894
0.006
15.894
0.006
4.267
0.000
b2
16.463
0.015
16.462
0.015
4.995
0.001
b0
88.379
1.180
86.033
1.100
18.207
0.053
b1
45.247
0.052
44.427
0.050
11.243
0.003
b2
47.146
0.131
46.984
0.130
13.014
0.010
b0
84.191
1.041
83.560
1.016
13.037
0.027
b1
37.143
0.034
36.747
0.033
8.162
0.002
b2
37.518
0.079
37.322
0.078
9.560
0.005
b0
78.369
0.787
78.306
0.784
9.231
0.013
b1
24.863
0.016
24.816
0.016
5.587
0.001
b2
27.510
0.043
27.511
0.043
6.795
0.003
b0
117.954
2.238
Tidak konvergen
27.379
0.147
b1
79.417
0.160
Tidak konvergen
18.839
0.012
b2
86.377
0.450
Tidak konvergen
20.193
0.029
b0
98.624
1.528
Tidak konvergen
19.141
0.060
b1
65.743
0.106
Tidak konvergen
12.230
0.004
b2
70.267
0.292
Tidak konvergen
13.751
0.012
b0
95.441
1.245
95.298
1.240
12.833
0.026
b1
50.279
0.060
50.261
0.061
8.485
0.002
b2
52.455
0.150
52.499
0.151
9.267
0.005
17
Lampiran 5
Persentase respon bernilai nol
Galat baku dugaan dan galat baku sebenarnya dari penduga parameter pada setiap persentase jumlah amatan dengan peubah respon yang bernilai nol Poisson
Jumlah amatan
Parameter
60
100 40%
200
60
100 60%
200
60
100 80%
200
Binomial Negatif
ZIP
Dugaan
Sebenarnya
Dugaan
Sebenarnya
Dugaan
Sebenarnya
b0
0.166
0.830
0.168
0.827
0.169
0.169
b1
0.040
0.139
0.041
0.138
0.041
0.041
b2
0.071
0.224
0.072
0.224
0.072
0.072
b0
0.126
0.727
0.127
0.725
0.128
0.131
b1
0.030
0.104
0.031
0.103
0.031
0.031
b2
0.054
0.175
0.055
0.175
0.055
0.057
b0
0.088
0.688
0.088
0.688
0.089
0.088
b1
0.021
0.078
0.021
0.078
0.021
0.021
b2
0.038
0.123
0.038
0.123
0.038
0.037
b0
0.210
1.086
0.241
1.049
0.225
0.231
b1
0.052
0.228
0.061
0.224
0.056
0.057
b2
0.093
0.362
0.109
0.360
0.097
0.100
b0
0.159
1.020
0.165
1.008
0.166
0.166
b1
0.039
0.185
0.041
0.183
0.041
0.041
b2
0.070
0.281
0.073
0.279
0.071
0.073
b0
0.111
0.887
0.112
0.886
0.113
0.116
b1
0.027
0.125
0.027
0.125
0.028
0.028
b2
0.048
0.208
0.049
0.208
0.049
0.051
b0
0.291
1.496
Tidak konvergen
0.348
0.383
b1
0.076
0.400
Tidak konvergen
0.095
0.108
b2
0.134
0.671
Tidak konvergen
0.155
0.170
b0
0.221
1.236
Tidak konvergen
0.244
0.245
b1
0.057
0.326
Tidak konvergen
0.064
0.064
b2
0.101
0.541
Tidak konvergen
0.107
0.108
b0
0.153
1.116
0.157
1.113
0.163
0.162
b1
0.039
0.246
0.040
0.247
0.042
0.044
b2
0.069
0.387
0.071
0.388
0.072
0.070