REGRESI BINOMIAL NEGATIF SEBAGAI MODEL ALTERNATIF UNTUK MENGHINDARI MASALAH OVERDISPERSSION PADA REGRESI POISSON (Studi Kasus : Penderita Demam Berdarah Dengue (DBD) Kota Bogor Tahun 2008)
NOVIRA SARTIKA
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012
RINGKASAN NOVIRA SARTIKA. Regresi Binomial Negatif Sebagai Model Alternatif untuk Menghindari Masalah Overdisperssion pada Regresi Poisson. Dibimbing oleh Dr. Ir. I Made Sumertajaya, M.S dan Pika Silvianti, S.Si, M.Si Kasus Demam Berdarah Dengue (DBD) merupakan salah satu masalah kesehatan masyarakat yang utama di Indonesia khususnya Kota Bogor. Penyakit DBD disebabkan oleh virus Dengue dari genus Flavivirus famili Flaviviridae yang ditularkan melalui nyamuk Aedes aegypti dan Aedes albopictus. Penelitian ini bertujuan untuk mengetahui faktor-faktor yang berpengaruh terhadap jumlah penderita DBD Kota Bogor tahun 2008 dengan peubah respon yaitu jumlah penderita DBD di desa/kelurahan yang ada di Kota Bogor. Analisis statistika yang digunakan adalah regresi Poisson. Namun pada penerapannya terjadi pelanggaran asumsi yang disebut Overdisperssion. Pendekatan model yang dilakukan adalah menggunakan regresi Binomial Negatif. Model regresi Binomial Negatif merupakan model alternatif untuk menghindari masalah overdisperssion pada regresi Poisson. Berdasarkan model regresi Binomial Negatif diketahui faktor-faktor yang mempengaruhi jumlah penderita DBD adalah jumlah penduduk dan jumlah curah hujan per hari dengan nilai AIC sebesar 489.23 dan R2DEV,BN sebesar 59.43%. Kata kunci : Demam Berdarah Dengue (DBD), regresi Poisson, overdisperssion, regresi Binomial Negatif
REGRESI BINOMIAL NEGATIF SEBAGAI MODEL ALTERNATIF UNTUK MENGHINDARI MASALAH OVERDISPERSSION PADA REGRESI POISSON (Studi Kasus : Penderita Demam Berdarah Dengue (DBD) Kota Bogor Tahun 2008)
Oleh : NOVIRA SARTIKA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012
Judul
: Regresi Binomial Negatif Sebagai Model Alternatif untuk Menghindari Masalah Overdisperssion pada Regresi Poisson : Novira Sartika : G14070064
Nama NIM
Disetujui
Pembimbing I
Pembimbing II
Dr. Ir. I Made Sumertajaya, M.S NIP : 196807021994021001
Pika Silvianti, S.Si, M.Si
Diketahui
Ketua Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si NIP : 196504211990021001
Tanggal Lulus :
PRAKATA Puji syukur kehadirat Allah SWT atas segala berkah dan rahmat-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Karya ilmiah ini berjudul ”Regresi Binomial Negatif Sebagai Model Alternatif untuk Menghindari Masalah Overdisperssion pada Regresi Poisson”. Karya ilmiah ini penulis susun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan, bimbingan dan bantuan dari banyak pihak yang sangat berarti bagi penulis. Oleh karena itu, dalam kesempatan ini penulis menyampaikan ucapan terima kasih kepada: 1. Bapak Dr. Ir. Hari Wijayanto, M.Si selaku Ketua Departemen Statistika FMIPA IPB. 2. Bapak Dr. Ir. I Made Sumertajaya, M.S dan Ibu Pika Silvianti, S.Si, M.Si selaku dosen pembimbing yang telah memberikan bimbingan, masukan, dan arahan selama penulisan karya ilmiah ini. 3. Dra. Itasia Dina S. M.Si selaku dosen penguji luar yang telah memberikan beberapa masukan dan arahan kepada penulis. 4. Seluruh Dosen dan Staf Pengajar Departemen Statistika yang telah memberikan ilmu dan wawasan selama penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika yang telah banyak membantu penulis. 5. Kedua orang tua dan keluarga yang telah memberikan doa, kasih sayang serta dorongan baik moril maupun materil. 6. Teman-teman seperjuangan IPB khususnya statistika 44 yang telah bersama-sama dalam segala suka maupun duka. Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pembaca.Amin.
Bogor, Februari 2012
Novira Sartika
RIWAYAT HIDUP Penulis dilahirkan di Sungai Apit, Siak, Riau pada tanggal 22 Nopember 1989 dari pasangan berbahagia Bapak Badu Karim dan Ibu Siti Fatimah. Penulis merupakan anak keenam dari delapan bersaudara. Tahun 2001 penulis lulus dari SD 022 Muhammadiyah Sungai Apit Siak, kemudian melanjutkan studi di SMP Negeri 1 Sungai Apit Siak hingga tahun 2004. Selanjutnya, penulis menyelesaikan pendidikannya di SMA Negeri 1 Sungai Apit Siak dan lulus pada tahun 2007. Pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Beasiswa Utusan Daerah (BUD). Setelah satu tahun menjalani perkuliahan di Tingkat Persiapan Bersama (TPB), pada tahun 2007 penulis diterima sebagai mahasiswa Departemen Statistika, FMIPA IPB dengan mayor Statistika. Selama mengikuti perkuliahan, penulis berkesempatan menjadi Asisten Dosen Mata Kuliah Rancangan Percobaan dan Metode Statistika pada tahun ajaran 2010/2011. Selain itu, Pada tahun 2009 penulis bergabung dengan lembaga bimbingan belajar “MAFIA CLUBS” sebagai tenaga pengajar dan bendahara. Penulis juga aktif dalam organisasi kemahasiswaan diantaranya Himpunan Profesi Gamma Sigma Beta (Himpro GSB) dan Ikatan Keluarga Pelajar dan Mahasiswa Riau (IKPMR) Bogor, serta kegiatan kepanitiaan seperti Lomba Jajak Pendapat Statistika (LJPS), Welcome Ceremony of Statistics (WCS), Statistics Gathering (SG), The 5th Statistika Ria (SR), dan lain-lain. Pada bulan Juli - Agustus 2011 Penulis melaksanakan kegiatan praktik lapang di Direktorat Sumberdaya Manusia (SDM) Institut Pertanian Bogor.
DAFTAR ISI Halaman DAFTAR TABEL ..................................................................................................................... viii DAFTAR GAMBAR ................................................................................................................ viii DAFTAR LAMPIRAN ............................................................................................................. viii PENDAHULUAN .....................................................................................................................
1
Latar Belakang ..................................................................................................................... Tujuan ..................................................................................................................................
1 1
TINJAUAN PUSTAKA ............................................................................................................
1
Demam Berdarah Dengue (DBD) ......................................................................................... Sebaran Binomial ................................................................................................................... Sebaran Poisson ..................................................................................................................... Sebaran Binomial Negatif ...................................................................................................... Generalized Linear Model (GLM) ......................................................................................... Regresi Poisson ..................................................................................................................... Overdisperssion pada Data Cacahan ..................................................................................... Regresi Binomial Negatif ...................................................................................................... Ukuran Kebaikan Model Regresi Binomial Negatif .............................................................. Akaike Information Criteria (AIC) ............................................................................... Koefisien Determinasi (R2) ...........................................................................................
1 1 2 2 3 3 4 4 4 4 5
METODOLOGI ........................................................................................................................
5
Data ..................................................................................................................................... Metode .................................................................................................................................
5 5
HASIL DAN PEMBAHASAN .................................................................................................
5
Deskripsi Data ....................................................................................................................... Model Regresi Poisson .......................................................................................................... Model Regresi Binomial Negatif ........................................................................................... Implikasi Overdisperssion pada Regresi Poisson ..................................................................
5 6 6 7
SIMPULAN DAN SARAN ........................................................................................................
8
DAFTAR PUSTAKA ...............................................................................................................
8
LAMPIRAN ..............................................................................................................................
9
DAFTAR TABEL Halaman 1
2
Nilai dugaan parameter model regresi Poisson ......................................................................... 6 Nilai dugaan parameter model regresi Binomial Negatif .......................................................... 7
DAFTAR GAMBAR Halaman 1 2
Sepuluh desa/kelurahan dengan jumlah penderita DBD tertinggi ............................................. 5 Plot antara sisaan dan nilai dugaan dari model regresi Binomial Negatif ................................. 7
DAFTAR LAMPIRAN Halaman 1 2 3 4
Nilai korelasi antar peubah ...................................................................................................... 10 Nilai AIC dan R2DEV,BN dari model regresi Binomial Negatif dengan berbagai kombinasi peubah penjelas ...................................................................................................... 10 Algoritma untuk pendugaan parameter regres Poisson menggunakan R 2.14.0 ...................... 11 Algoritma untuk pendugaan parameter regresi Binomial Negatif menggunakan R 2.14.0 ...... 11
1
PENDAHULUAN Latar Belakang Penyakit Demam Berdarah Dengue (DBD) sering terjadi di daerah tropis dan subtropis yang muncul pada musim hujan. Jumlah kasus DBD cenderung meningkat, baik dalam jumlah maupun luas wilayah yang terjangkit. Kasus DBD dapat ditekan jika faktor-faktor yang mempengaruhi jumlah penderita DBD sudah diketahui. Hubungan antara faktor-faktor tersebut dengan jumlah penderita DBD dapat diketahui dengan menggunakan analisis regresi. Analisis regresi yang cocok digunakan adalah regresi Poisson. Analisis regresi Poisson digunakan karena jumlah penderita DBD merupakan data cacahan dan peluang kejadiannya kecil. Regresi Poisson merupakan analisis statistika yang mengasumsikan nilai ragam dari peubah respon Y sama dengan nilai tengahnya. Namun dalam penerapannya sering dijumpai ragam dan nilai tengahnya tidak sama. Misalnya ragam lebih besar dari nilai tengahnya. Kasus seperti ini disebut Overdisperssion. Jika terjadi kasus overdisperssion, regresi Poisson menjadi tidak valid sehingga diperlukan model alternatif yang tidak tergantung pada asumsi ragam sama dengan nilai tengahnya. Model alternatif yang sering digunakan diantaranya adalah regresi Binomial Negatif, regresi QuassiLikelihood, regresi Generalized Poisson, regresi Zero Inflated Poisson (ZIP), regresi Quassi-Poisson, dan lain sebagainya. Dalam penelitian ini model alternatif yang akan dicobakan adalah regresi Binomial Negatif. Tujuan Tujuan penelitian ini adalah memodelkan kasus DBD untuk mengetahui faktor-faktor yang berpengaruh terhadap jumlah penderita DBD Kota Bogor menggunakan regresi Poisson dan regresi Binomial Negatif. TINJAUAN PUSTAKA Demam Berdarah Dengue (DBD) Demam Berdarah Dengue (DBD) adalah penyakit yang disebabkan oleh virus Dengue dari genus Flavivirus, famili Flaviviridae melalui gigitan nyamuk Aedes aegypti dan Aedes albopictus. Adapun nyamuk Aedes aegypti memiliki kemampuan terbang mencapai radius 100-200 meter. Oleh karena itu, jika di suatu lingkungan terkena kasus DBD, maka masyarakat yang berada pada radius tersebut harus waspada.
Virus ini muncul akibat pengaruh musim atau alam serta perilaku manusia. Penyakit DBD pertama kali di Indonesia ditemukan di Surabaya (Jawa Timur) pada tahun 1968 dan menyebar ke berbagai daerah. Pada tahun 1980 telah diketahui bahwa seluruh provinsi di Indonesia telah terjangkit penyakit DBD, kecuali Timor-Timur. Peningkatan jumlah kasus dan wilayah yang terjangkit disebabkan oleh semakin baiknya sarana transportasi penduduk, adanya pemukiman baru, kurangnya kesadaran manusia terhadap pembersihan sarang nyamuk, terdapatnya vektor nyamuk hampir di seluruh pelosok tanah air dan adanya sel tipe virus yang bersikulasi sepanjang tahun. Penyakit ini juga dapat diderita oleh orang yang sebagian besar tinggal di lingkungan lembab dan pinggiran kumuh (Kristina et al. 2004, diacu dalam Tobing TMDNL 2011). Nyamuk Aedes aegypti lebih menyukai tempat yang gelap, berbau, dan lembab. Tempat perindukan yang sering dipilih oleh Aedes aegypti adalah kawasan yang padat dengan sanitasi yang kurang memadai, terutama digenangan air dalam rumah, seperti pot, vas bunga, bak mandi atau tempat penyimpanan air lainnya seperti tempayan, drum, atau ember plastik. Sebaran Binomial Suatu percobaan sering kali terdiri atas ulangan-ulangan dan masing-masing mempunyai dua kemungkinan hasil yaitu berhasil atau gagal. Jika ulangan-ulangan tersebut bersifat saling bebas dan peluang keberhasilan setiap ulangan tetap sama yaitu sebesar 0.5 maka percobaan ini dinamakan percobaan Binomial. Percobaan Binomial memiliki ciri-ciri sebagai berikut : 1. Percobaan terdiri atas n ulangan. 2. Dalam setiap ulangan, hasilnya dapat digolongkan sebagai berhasil atau gagal. 3. Peluang berhasil yang dilambangkan dengan p untuk setiap ulangan adalah sama dan tidak berubah-ubah. 4. Ulangan-ulangan itu bersifat bebas satu sama lainnya. Sebaran peluang bagi peubah acak ini disebut sebaran Binomial. Sebaran Binomial bergantung pada banyaknya ulangan dan peluang keberhasilan pada suatu ulangan. Sehingga sebaran Binomial memiliki fungsi peluang sebagai berikut (Walpole 1974) : (
)
( )
; x = 0, 1, 2,…, n
2
dengan nilai tengah, E(X)=np dan ragamnya, V(X)= npq. Keterangan : x = Banyaknya keberhasilan dalam n ulangan p = Peluang keberhasilan q = Peluang kegagalan; q=1-p n = Banyaknya ulangan bebas yang dilakukan. Sebaran Poisson Percobaan yang menghasilkan nilai-nilai bagi suatu peubah acak X, yaitu banyaknya hasil percobaan yang terjadi selama suatu selang waktu tertentu atau di suatu daerah tertentu sering disebut percobaan Poisson. Percobaan Poisson memiliki ciri-ciri sebagai berikut : 1. Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu atau suatu daerah tertentu tidak bergantung pada banyaknya hasil percobaan yang terjadi pada selang waktu atau daerah lain yang terpisah. 2. Peluang terjadinya satu hasil percobaan selama suatu selang waktu yang singkat sekali atau dalam suatu daerah yang kecil, sebanding dengan panjang selang waktu tersebut atau besarnya daerah tersebut dan tidak bergantung pada banyaknya hasil percobaan yang terjadi di luar selang waktu atau daerah tersebut. 3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat tersebut atau dalam daerah yang kecil tersebut dapat diabaikan. Sebaran peluang bagi peubah acak ini disebut sebaran Poisson. Sebaran Poison hanya bergantung pada rata-rata banyaknya hasil percobaan yang terjadi selama selang waktu atau daerah yang diberikan. Sehingga sebaran Poisson memiliki fungsi peluang sebagai berikut (Walpole 1974) : (
)
dengan nilai tengah dan ragamnya sama, E(X)=V(X)=µ. Keterangan : x = Banyaknya hasil percobaan yang terjadi selama suatu selang waktu atau daerah tertentu µ = Rata-rata banyaknya hasil percobaan yang terjadi selama selang waktu atau dalam daerah yang diberikan e = 2.71828… Sebaran Poisson dan Binomial memiliki bentuk histogram yang bentuknya hampir sama bila n besar dan p kecil (dekat dengan
nol). Oleh karena itu, bila kedua kondisi itu dipenuhi, sebaran Poisson dengan µ=np dapat digunakan untuk menghampiri peluang Binomial. Sebaran Binomial Negatif Sebaran Binomial Negatif merupakan sebaran peubah acak yang mirip dengan sebaran Binomial, kecuali bahwa ulangan diulang terus sampai terjadi sejumlah keberhasilan tertentu. Jadi, jika pada sebaran Binomial ingin ditentukan x keberhasilan dalam n ulangan, dengan n telah ditetapkan terlebih dahulu, namun pada sebaran Binomial Negatif ingin diketahui peluang keberhasilan ke-k terjadi pada ulangan ke-x. Sebaran Binomial Negatif memiliki ciriciri yang sama dengan sebaran Binomial. Sebaran peluangnya disebut sebaran Binomial Negatif. Karena nilai peluang dalam sebaran tersebut bergantung pada banyaknya keberhasilan yang diinginkan dan peluang keberhasilan pada suatu ulangan, maka fungsi peluang bagi sebaran Binomial Negatif adalah sebagai berikut (Walpole 1974) : (
)
(
)
( )
dengan nilai tengah, ( )
dan ragamnya,
.
Keterangan : x = Banyaknya ulangan yang dilakukan sampai diperoleh r keberhasilan k = Banyaknya keberhasilan p = Peluang keberhasilan q = Peluang kegagalan; q=1-p. Sebaran Binomial Negatif merupakan sebaran campuran Poisson-Gamma. Misalkan bahwa peubah acak Y~Poisson (λ) dan diasumsikan λ~Gamma (α,β). Sebaran Gamma (α,β) memiliki nilai tengah αβ dan ragam αβ2. Fungsi peluang bersama bagi Y dan λ dapat ditulis sebagai berikut : (
)
( | ) ( )
Akan tetapi, karena λ tidak diamati maka λ harus dipisahkan melalui sebaran marginalnya, yaitu : (
)
∫
( | ) ( )
∫
( ) ( )
∫
(
)
3
Integral di atas diselesaikan menggunakan bantuan fungsi Gamma yaitu :
( (
)
(
∫ ) )
∫ [(
(
) ]
)
[(
) ]
dengan demikian sebaran marginal dapat ditulis sebagai berikut : (
)
(
) ( )
(
(
) ( )
(
) ( )
(
)
(
) (
) (
)
keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002) menyatakan ada tiga komponen dalam GLM yaitu : 1. Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya. 2. Systematic component (komponen sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan. 3. Link function (fungsi penghubung) ditunjukkan dengan fungsi nilai harapannya sama dengan komponen sistematiknya. Regresi Poisson Regresi Poisson merupakan salah satu model regresi dengan peubah respon Y yang menyebar mengikuti sebaran Poisson. Fungsi peluang sebaran Poisson dapat ditulis sebagai berikut :
)
untuk y=0, 1, 2, 3,… sehingga diperoleh nilai tengah dan ragamnya sebagai berikut : ( | ) ( ) ( | )] ( | )] ( ) ( )
( ) ( )
)
( (
) ( )
) (
)
Misalkan merupakan contoh acak dari sebaran Poisson dengan rata-rata . Fungsi peluang dinyatakan sebagai berikut:
Model regresi Binomial Negatif yang dibangun memiliki sebaran Binomial Negatif dengan parameter µ dan k, dimana dan , sehingga nilai tengah dan ragamnya menjadi, ( ) dan ( ) . Ragam ini merupakan fungsi kuadratik yang mengakomodasi parameter overdisperssion (k > 0). Sehingga sebaran Y menjadi: (
(
)
Jika k→0 maka sebaran ini mendekati sebaran Poisson (µ). Binomial Negatif mampu mengakomodasi overdisperssion (k > 0) tetapi tidak underdisperssion (k < 1) pada model Poisson. Secara umum didefenisikan bahwa peubah respon merupakan peubah acak yang menyebar menurut sebaran Binomial Negatif dengan parameter µ dan k sebagai berikut : Y~ BN (µ, k) dan fungsi penghubung log yaitu : log µ = XTβ Generalized Linear Model (GLM) Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam
(
)
Regresi Poisson termasuk salah satu dari Generalized Linear Model (GLM) karena peubah respon memiliki sebaran dalam keluarga eksponensial yaitu sebaran Poisson. Regresi Poisson mengasumsikan bahwa peubah respon yang menyebar Poisson, tidak ada multikolinearitas antar peubah penjelas, dan memiliki ragam yang sama dengan nilai tengahnya. Asumsi multikolinearitas dalam penelitian ini dilihat dari nilai korelasi antar peubah penjelas. Jika nilai korelasinya lemah (r<0.5) maka dianggap tidak ada masalah multikolinearitas. Pada GLM terdapat sebuah fungsi yang linear dan menghubungkan nilai tengah peubah respon dengan sebuah peubah penjelas yaitu: ( ) ( ) Fungsi disebut fungsi penghubung (link function). Hubungan antara nilai tengah dengan peubah penjelas linear adalah: ( )
(
)
Terdapat dua fungsi penghubung yang biasa digunakan dalam regresi Poisson. Pertama adalah penghubung identitas (identity
4
link). Kedua adalah penghubung log (log link). Fungsi penghubung identitas memiliki bentuk : ( ) dan fungsi penghubung log berbentuk : ( )
( )
Fungsi penghubung log adalah fungsi yang lebih cocok digunakan karena fungsi log menjamin bahwa nilai peubah yang diharapkan dari peubah responnya akan bernilai non negatif. Sehingga fungsi penghubung yang digunakan dalam penelitian ini adalah fungsi penghubung log. Hubungan antara nilai tengah peubah respon dengan peubah penjelas linear adalah sebagai berikut : ( ) (
)
Sehingga model regresi Poisson berganda dapat dituliskan sebagai berikut: (
dispersi yang dihasilkan lebih besar dari satu maka model tersebut dikatakan mengalami overdisperssion. Deviance model regresi Poisson memiliki persamaan sebagai berikut (Kleinbaum et al. 1988) :
)
dengan merupakan peubah penjelas ke-k pada pengamatan ke-i dan dan adalah nilai tengah banyaknya kejadian (Cameron dan Trivedi 1998). Pendugaan parameter koefisien regresi Poisson dapat diduga menggunakan Penduga Kemungkinan Maksimum (Maximum Likelihood Estimator) melalui iterasi dengan metode Fisher Scoring untuk memaksimumkan fungsi log-likelihoodnya. Hal ini dilakukan karena penurunan rumus yang tidak bisa dilakukan secara matematis karena cukup sulit sehingga dilakukan melalui metode iterasi. Metode Fisher Scoring dalam penelitian ini dilakukan menggunakan perangkat lunak R 2.14.0. Overdisperssion pada Data Cacahan Long (1997) dalam Jackman (2003) menyatakan bahwa kejadian overdisperssion karena adanya sumber karagaman yang tidak teramati pada data atau adanya pengaruh peubah lain yang mengakibatkan peluang terjadinya suatu kejadian bergantung pada kejadian yang sebelumnya. Menurut McCullagh & Nelder (1989), data cacahan untuk regresi Poisson dikatakan mengandung overdisperssion jika ragam lebih besar dari nilai tengahnya, Var(Y)>E(Y). Dugaan dispersi dapat diukur melalui rasio antara Deviance dengan derajat bebasnya. Rasio ini selanjutnya disebut rasio dispersi. Jika rasio
[
( | ̂) ] ( | ̂)
∑[
(
̂
(
̂ ))]
dengan ( | ̂ ) adalah logaritma natural dari model kemungkinan tanpa melibatkan ( | ̂ ) adalah semua peubah penjelas dan logaritma natural dari model yang melibatkan semua peubah penjelas. Regresi Binomial Negatif Misalkan yi adalah nilai dari peubah respon untuk pengamatan ke-i dan xi adalah vektor dari nilai peubah penjelas untuk pengamatan ke-i dengan i=1,2,..,n. Model regresi Binomial Negatif mengasumsikan bahwa peubah respon ke-i mengikuti sebaran Binomial Negatif. Model regresi Binomial Negatif berganda dapat dituliskan sebagai berikut: (
)
Pendugaan parameter koefisien Regresi Binomial Negatif dapat diduga menggunakan Penduga Kemungkinan Maksimum (Maximum Likelihood Estimator) melalui iterasi dengan metode Fisher Scoring untuk memaksimumkan fungsi loglikelihoodnya. Hal ini dilakukan karena penurunan rumus yang tidak bisa dilakukan secara matematis karena cukup sulit sehingga dilakukan melalui metode iterasi. Metode Fisher Scoring dalam penelitian ini dilakukan menggunakan perangkat lunak R 2.14.0. Ukuran Kebaikan Model Regresi Binomial Negatif Pemilihan model regresi yang terbaik perlu dilakukan untuk memperoleh hasil analisis regresi yang optimal. Beberapa ukuran kebaikan model yang digunakan pada regresi Binomial Negatif adalah Akaike Information Criteria (AIC) dan Koefisien Determinasi (R2). Akaike Information Criteria (AIC) Perhitungan perbaikan model kemungkinan maksimum yang sering digunakan adalah Akaike Information Criteria (AIC). Akaike mendefenisikan perhitungan AIC sebagai berikut : ( | ̂)
5
( | ̂ ) adalah logaritma natural dengan dari model yang melibatkan semua peubah penjelas dan p adalah banyak parameter. AIC merupakan kriteria yang mempertimbangkan banyak parameter. Nilai AIC yang semakin kecil menunjukkan model yang semakin baik. Koefisien Determinasi (R2) Ukuran proporsi keragaman peubah respon yang dapat diterangkan oleh peubah penjelas disebut Koefisien Determinasi (R2). Koefisien deterrminasi (R2) dalam analisis regresi linear didasarkan pada pemakaian jumlah kuadrat dengan metode kuadrat terkecil. Penggunaan R2 dapat menggambarkan keeratan hubungan regresi antara peubah respon Y dengan peubah penjelas X. Nilai R2 yang semakin besar (0≤R2≤1) menunjukkan semakin tepat dugaan dari model regresi. Menurut Cameron dan Windmeijer (1995), ukuran R2 pada regresi Binomial Negatif yang didasarkan pada sisaan deviance (deviance residual) sebagai berikut : ∑ ∑
{ {
( ) ̂
(̅)
( (
) )
(
)
(̂
)
(
)
(̅
)
( (
)} )}
Keterangan : yi = Nilai amatan ke-i dari peubah respon ̂ = Nilai dugaan untuk amatan ke-i ̅ = Rata-rata peubah respon y θ = parameter ekstra yang diduga bersamaan dengan parameter β METODOLOGI Data Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Dinas Kesehatan (Dinkes) dan Badan Perencanaan Pembangunan Daerah (Bappeda) Kota Bogor tahun 2008. Adapun peubah respon dalam penelitian ini adalah jumlah penderita DBD di Kota Bogor. Sedangkan peubah penjelas yang digunakan adalah sebagai berikut : 1. Jumlah penduduk (X1) 2. Pertambahan penduduk karena perpindahan penduduk (X2) 3. Jumlah KK prasejahtera (X3) 4. Jumlah KK sejahtera I (X4) 5. Jumlah bangunan tidak permanen (X5) 6. Jumlah KK di bantaran sungai (X6) 7. Jumlah KK di pemukiman kumuh (X7) 8. Jumlah madrasah (X8) 9. Jumlah curah hujan per hari (X9)
Metode Tahapan yang dilakukan dalam penelitian ini adalah : 1. Melakukan eksplorasi data awal Analisis statistika deskriptif digunakan untuk mengetahui karakteristik penduduk Kota Bogor. 2. Menentukan model regresi Poisson dengan menggunakan semua peubah penjelas. 3. Menganalisis adanya overdisperssion pada model regresi Poisson. Hal ini dapat dilihat dari rasio dispersi yang lebih besar dari satu. 4. Menentukan model regresi Binomial Negatif dengan menggunakan semua peubah penjelas. 5. Melakukan pendugaan parameter regresi Binomial Negatif dengan penduga kemungkinan maksimum. 6. Pemilihan model regresi Binomial Negatif terbaik dari kombinasi peubah penjelas yang signifikan dan yang tidak signifikan terhadap peningkatan jumlah DBD berdasarkan nilai AIC yang kecil dan nilai R2DEV,BN yang besar. 7. Menarik kesimpulan dari hasil analisis yang diperoleh. HASIL DAN PEMBAHASAN Deskripsi Data Kota Bogor dibagi menjadi enam kecamatan yaitu kecamatan Bogor Barat, Bogor Selatan, Bogor Tengah, Bogor Timur, Bogor Utara, dan Tanah Sareal dengan masing-masing jumlah desa/kelurahan 16, 16, 11, 6, 8, dan 11. Persentase rata-rata jumlah penderita DBD di Kota Bogor adalah sebesar 1.47 %. Desa/Kelurahan Bantarjati Tegal Gundil Baranangsiang Kedung Badak Kebon Pedes Babakan Tanahbaru Sindang Barang Kedung Waringin Semplak
91 71 63 49 49 48 38 37 37 34
Jumlah Penderita DBD Gambar 1
Sepuluh desa/kelurahan dengan jumlah penderita DBD tertinggi.
6
Berdasarkan Gambar 1 terlihat bahwa sepuluh desa/kelurahan dengan jumlah penderita DBD paling banyak. Desa/kelurahan dengan jumlah penderita DBD tertinggi tersebar di desa/kelurahan Bantarjati yaitu sebanyak 91 jiwa dan tertinggi kedua tersebar di desa/kelurahan Tegal Gundil sebanyak 71 jiwa dan diikuti oleh desa/kelurahan lainnya. Penelitian ini menggunakan sembilan faktor sebagai peubah penjelas yang diperkirakan mempengaruhi jumlah penderita DBD. Berdasarkan Lampiran 1 dapat dilihat bahwa peubah respon memiliki korelasi yang signifikan dengan dua peubah penjelas yaitu jumlah penduduk dan jumlah curah hujan per hari serta memiliki hubungan yang linear. Selain itu, antar peubah penjelas terdapat korelasi yang lemah karena nilai korelasi semua peubah penjelasnya di bawah 0.5 (r<0.5). Sehingga masalah multikolinearitas dianggap telah teratasi dan kesembilan peubah penjelas tersebut diikutsertakan dalam analisis selanjutnya. Model Regresi Poisson Hasil pendugaan parameter untuk model regresi Poisson dapat dilihat pada Tabel 1. Hasil ini diperoleh menggunakan perangkat lunak R 2.14.0 dan algoritmanya secara lengkap dapat dilihat pada Lampiran 3. Tabel 1 Nilai dugaan parameter model regresi Poisson P β0 β1 β2 β3 β4 β5 β6 β7 β8 β9
Nilai Dugaan -4.2600000 0.0000647 0.0004910 -0.0000228 -0.0003580 -0.0000899 -0.0002600 -0.0011500 0.0157000 0.0015600
Galat Baku 0.68700000 0.00000465 0.00035600 0.00016300 0.00008860 0.00005860 0.00022300 0.00034400 0.00894000 0.00016700
Nilai Z -6.199 13.905 1.377 -0.140 -4.041 -1.536 -1.164 -3.331 1.755 9.353
Pr(>|Z|) 5.67e-10** < 2e-16** 0.168503 0.888312 5.32e-05** 0.124507 0.244547 0.000866** 0.079339 < 2e-16**
Deviace: 322.25; derajat bebas: 54; Rasio dispersi: 5.97. Huruf P menunjukkan parameter dan tanda “**” menunjukkan peubah penjelas yang signifikan pada taraf nyata 5%.
Model regresi Poisson untuk semua peubah penjelas dapat ditulis sebagai berikut : ln (µi)= β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + β6X6 + β7X7 + β8X8 + β9X9 µi = exp(β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + β6X6 + β7X7 + β8X8 + β9X9) µi= exp(–4.26 + 0.0000647X1 + 0.000491X2 – 0.0000228X3 – 0.000358X4 – 0.0000899X5 – 0.00026X6 – 0.00115X7 + 0.0157X8 + 0.00156X9)
Berdasarkan Tabel 1 terlihat bahwa dari dari sembilan peubah penjelas hanya empat peubah yang berpengaruh nyata terhadap respon pada taraf nyata 5% yaitu jumlah penduduk (X1), jumlah KK sejahtera I (X4), jumlah KK di pemukiman kumuh (X7), dan jumlah curah hujan per hari (X9). Model tersebut menunjukkan bahwa setiap penambahan satu orang di suatu desa/kelurahan akan menyebabkan nilai harapan jumlah penderita DBD meningkat sebesar exp(0.0000647)=1.000064702 kali dengan asumsi peubah lain dianggap tetap. Artinya, setiap penambahan 10000 penduduk akan meningkatkan nilai harapan jumlah penderita DBD sebanyak 10000.64702 ≈10001 orang dengan asumsi peubah lain dianggap tetap. Setiap penambahan satu KK sejahtera I akan menyebabkan nilai harapan jumlah penderita DBD menurun sebesar exp(-0.000358)=0.999642064 kali dengan asumsi peubah lain dianggap tetap. Artinya, setiap penambahan 10000 KK sejahtera I akan menurunkan nilai harapan jumlah penderita DBD sebanyak 9996.42064≈9997 orang dengan asumsi peubah lain dianggap tetap. Selanjutnya berlaku untuk peubah penjelas lainnya yang signifikan terhadap peubah respon. Berdasarkan Tabel 1 menunjukkan bahwa nilai rasio dispersi antara Deviance dan derajat bebasnya sebesar 5.97. Nilai ini berarti bahwa model regresi Poisson mengalami overdisperssion. Sehingga hasil yang diperoleh merupakan hasil semu. Kondisi ini menyebabkan faktor-faktor yang mempengaruhi jumlah penderita DBD tidak dapat dipastikan berdasarkan model regresi Poisson. Pendekatan model yang dilakukan adalah menggunakan regresi Binomial Negatif sebagai model alternatif untuk menghindari masalah overdisperssion pada regresi Poisson. Model Regresi Binomial Negatif Hasil pendugaan parameter untuk model regresi Binomial Negatif dapat dilihat pada Tabel 2. Hasil ini diperoleh menggunakan perangkat lunak R 2.14.0 dan algoritmanya secara lengkap dapat dilihat pada Lampiran 4. Berdasarkan Tabel 2 terlihat bahwa dari sembilan peubah penjelas hanya dua peubah yang berpengaruh nyata terhadap respon pada taraf nyata 5%. Kedua peubah tersebut adalah jumlah penduduk (X1) dan jumlah curah hujan per hari (X9).
7
Tabel 2 Nilai dugaan parameter model regresi Binomial Negatif P β0 β1 β2 β3 β4 β5 β6 β7 β8 β9
Nilai Dugaan -3.9900000 0.0000698 0.0003920 -0.0003750 -0.0002550 -0.0001650 -0.0002060 -0.0009960 0.0033600 0.0015000
Galat Baku 1.5200000 0.0000137 0.0009510 0.0004170 0.0002160 0.0001690 0.0005990 0.0006680 0.0221000 0.0003740
Nilai Z -2.622 5.091 0.412 -0.900 -1.179 -0.976 -0.344 -1.490 0.152 4.002
Pr(>|Z|) 0.00874 ** 3.57e-07 ** 0.68061 0.36801 0.23837 0.32930 0.73049 0.13630 0.87884 6.28e-05 **
Deviace : 70.539; AIC : 489.23; R2DEV,BN : 59.43%; Theta : 4.018. Huruf P menunjukkan parameter dan tanda “**” menunjukkan peubah penjelas yang signifikan pada taraf nyata 5%.
Model regresi Binomial Negatif untuk semua peubah penjelas dapat ditulis sebagai berikut :
3
ln (µi)= β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + β6X6 + β7X7 + β8X8 + β9X9
signifikan dengan yang tidak signifikan berdasarkan nilai AIC yang kecil dan R2DEV,BN yang besar. Hasil yang diperoleh dapat dilihat pada Lampiran 2. Berdasarkan hasil yang diperoleh, model dengan dua peubah penjelas yang signifikan terhadap peubah penjelas yaitu jumlah penduduk (X1) dan jumlah curah hujan per hari (X9) yang terdapat pada Tabel 2 lebih baik digunakan daripada menggunakan kombinasinya dikarenakan nilai AIC yang kecil dan R2DEV,BN yang lebih besar. Selain itu, model dengan dua peubah penjelas lebih efektif dan efisien. Plot antara sisaan dan nilai dugaan dari model regresi Binomial Negatif pada Gambar 2 terlihat bahwa pola cenderung menyebar di sekitar garis nol dan memiliki ragam tidak homogen. Hal ini dapat dilihat dari sisaan yang membentuk pola seperti segitiga.
1 0
residuals
-1
Model tersebut menunjukkan bahwa setiap penambahan satu orang di suatu desa/kelurahan akan menyebabkan nilai harapan jumlah penderita DBD meningkat sebesar exp(0.0000698)=1.000064682 kali dengan asumsi peubah lain dianggap tetap. Artinya, setiap penambahan 10000 penduduk akan meningkatkan nilai harapan jumlah penderita DBD sebanyak 10000.64682 ≈10001 orang dengan asumsi peubah lain dianggap tetap. Setiap kenaikan curah hujan 1 mm/hari/Ha akan menyebabkan nilai harapan jumlah penderita DBD meningkat sebesar exp(0.0015)=1.00156335 kali dengan asumsi peubah lain dianggap tetap. Artinya, setiap kenaikan 10000 mm/hari/Ha akan meningkatkan nilai harapan jumlah penderita DBD sebanyak 10015.6335≈10016 orang dengan asumsi peubah lain dianggap tetap. Sedangkan jika penambahan satu orang di suatu desa/kelurahan dan jumlah curah hujan meningkat 1 mm/hari/Ha secara bersamaan ke dalam model regresi Binomial Negatif akan menyebabkan nilai harapan jumlah penderita DBD meningkat sebesar exp(0.0000698+0.0015)=1.001571033 kali dengan asumsi peubah lain dianggap tetap. Pemilihan model regresi Binomial Negatif terbaik dilakukan dengan mengkombinasikan peubah penjelas yang
-2
µi= exp(–3.99 + 0.0000698X1 + 0.000392X2 – 0.000375X3 – 0.000255X4 – 0.000165X5 – 0.000206X6 – 0.000996X7 + 0.00336X8 + 0.0015X9)
2
µi = exp(β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + β6X6 + β7X7 + β8X8 + β9X9)
10
20
30
40
50
60
fitted.values
Gambar 2 Plot antara sisaan dan nilai dugaan dari model regresi Binomial Negatif. Peningkatan jumlah penduduk akan meningkatkan mobilitas penduduk, perubahan kepadatan, dan distribusi penduduk. Selain itu, faktor perubahan iklim khususnya perubahan curah hujan akan berefek terhadap ekosistem daratan dan lautan serta berpengaruh terhadap kesehatan manusia terutama terhadap perkembangbiakan vektor penyakit seperti nyamuk Aedes Aegypti, malaria, dan lain-lain. Implikasi Overdisperssion pada Regresi Poisson Overdisperssion merupakan pelanggaran asumsi yang terjadi pada regresi Poisson dimana ragam lebih besar dari nilai tengahnya. Implikasi dari kejadian overdisperssion pada regresi Poisson dalam penelitian ini adalah : 1. Faktor-faktor yang mempengaruhi jumlah penderita DBD tidak dapat dipastikan
8
berdasarkan model regresi Poisson karena hasil yang diperoleh dari model regresi Poisson merupakan hasil semu. 2. Model regresi Poisson yang terbentuk akan menghasilkan penduga parameter yang berbias. 3. Nilai penduga bagi galat baku yang lebih kecil (underestimate) yang selanjutnya dapat mengakibatkan kesalahan (misleading) pada inferensia bagi parameternya. Hal ini dapat dilihat dari galat baku yang dihasilkan oleh regresi Poisson pada Tabel 1 lebih kecil dibandingkan galat baku pada Tabel 2 dari regresi Binomial Negatif. Sehingga menyebabkan empat peubah penjelas yang signifikan pada regresi Poisson ternyata hanya dua peubah saja yang signifikan pada regresi Binomial Negatif. SIMPULAN DAN SARAN Simpulan Penggunaan model regresi Poisson pada kasus DBD di Kota Bogor menunjukkan adanya pelanggaran asumsi yaitu terjadinya overdisperssion. Hal ini dilihat dari rasio dispersinya yang lebih besar dari satu. Berdasarkan model regresi Binomial Negatif diketahui faktor-faktor yang mempengaruhi jumlah penderita DBD Kota bogor adalah faktor jumlah penduduk dan faktor jumlah curah hujan per hari. Saran Penelitian selanjutnya disarankan menggunakan pendekatan model regresi lainnya sebagai model alternatif untuk menghindari masalah overdisperssion pada regresi Poisson diantaranya regresi QuassiLikelihood, regresi Generalized Poisson, regresi Zero Inflated Poisson (ZIP), regresi Quassi-Poisson, dan lain sebagainya serta melakukan survei secara langsung ke desadesa yang terkena DBD. DAFTAR PUSTAKA Agresti A. 2002.Categorical Data Analysis. John Wiley & Son, Inc. Cameron AC, Trivedi PK. 1998. Regression Analysis of Count Data. New York: Cambridge University. Cameron AC, Windmeijer FAG. 1995. Rsquared Measures for Count Data Regression Model with Apllications to Health Care Utilization. Journal Of Business And Economics Statistics (1995).
Fleiss JL, Levin B, Paik MC. 2003. Statistical Methods for Rates and Proportion. Ed ke-3. USA: colombia university. Heinzl H, Mittlbӧck M. 2003. PseudoRsquared Measures for Poisson Regression Models with Over- or Underdispersion. Computational & Data Analysis 44 (2003). 253-271. Jackman S. 2007. Models for Counts Political Science. http://jackman.stanford.edu/classes/350C/ Poisson.pdf [15 November 2011] Kleinbaum DG, Kupper LL, Muller KE. 1988. Apllied Regression Analysis and Other Multivariable Methods. Boston: PWSKENT Publishing Company. Kristina, Isminah, Wulandari L. 2004. Kajian Masalah Kesehatan. [terhubung berkala]. http://www.litbang.depkes.go.id/maskes/0 52004/demamberdarah1 [30 Januari 2012]. Lee J, Wong DWS. 2001. Statistic for Spatial Data. New York: John Wiley & Sons, Inc. Long JS. 1997. Regression Models for Categorical and Limited Dependent Variables. Number 7 in Advance Quantitive Techniques in The Social Sciences. Sage Publications. Thousand Oaks, California. McCullagh P, Nelder JA. 1989. Generalized Linear Models. London:Chapman & Hall. Rohimah Siti R. 2011. Model Spasial Otoregresif Poisson Untuk Mendeteksi Faktor-Faktor Yang Berpengaruh Terhadap Jumlah Penderita Gizi Buruk Di Provinsi Jawa Timur [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Tobing Theresia MDNL. 2011. Pemodelan Kasus Demam Berdarah (DBD) Di Jawa Timur Dengan Model Poisson Dan Binomial Negatif [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Walpole R.E. 1974. Introduction To Statistics. Ed ke-2. New York: MacMillan Publishing Co., Inc.
LAMPIRAN
10
Lampiran 1 Nilai korelasi antar peubah Y X1 X2 X3 X4 X5 X6 X1 0.649** p-value 0.000 X2 -0.011 -0.057 p-value 0.932 0.653 X3 0.122 0.297** -0.214 p-value 0.338 0.017 0.089 X4 -0.038 0.291** 0.031 0.165 p-value 0.764 0.020 0.806 0.192 X5 0.081 0.258** -0.091 0.051 0.278** p-value 0.523 0.040 0.477 0.690 0.026 X6 0.071 0.089 0.072 0.177 0.222 -0.088 p-value 0.575 0.485 0.573 0.161 0.078 0.489 X7 -0.125 -0.074 -0.022 -0.048 -0.013 -0.058 0.060 p-value 0.325 0.560 0.863 0.708 0.921 0.650 0.639 X8 0.190 0.336** -0.326** 0.177 0.112 0.082 -0.059 p-value 0.132 0.007 0.008 0.161 0.376 0.517 0.644 X9 0.415** 0.238 0.036 -0.022 0.000 0.138 0.256** p-value 0.001 0.058 0.777 0.861 0.998 0.278 0.041 Tanda “**” menunjukkan peubah yang saling berkorelasi dan signifikan pada taraf 5%.
Lampiran 2
X7
X8
-0.145 0.254 0.213 0.091
-0.138 0.277
Nilai AIC dan R2DEV,NB dari model regresi Binomial Negatif dengan berbagai kombinasi peubah penjelas
Jumlah Peubah Penjelas
3 Peubah
4 Peubah
5 Peubah
6 Peubah
Kombinasi Peubah
AIC
R2DEV,NB (%)
X1, X9, X2
483.56
52.24
X1, X9, X3
482.82
53.49
X1, X9, X4
481.35
55.45
X1, X9, X5
482.47
53.46
X1, X9, X6
483.67
52.09
X1, X9, X7
481.78
53.89
X1, X9, X8
483.84
51.96
X1, X9, X4, X2
482.89
55.81
X1, X9, X4, X3
482.53
56.37
X1, X9, X4, X5
482.69
56.31
X1, X9, X4, X6
483.29
55.37
X1, X9, X4, X7
481.35
57.33
X1, X9, X4, X8
483.35
55.44
X1, X9, X4, X7, X2
482.98
57.59
X1, X9, X4, X7, X3
482.53
58.23
X1, X9, X4, X7, X5
482.56
58.38
X1, X9, X4, X7, X6
483.28
57.25
X1, X9, X4, X7, X8
483.35
57.33
X1, X9, X4, X7, X3, X2
484.34
58.35
X1, X9, X4, X7, X3, X5
483.5
59.48
X1, X9, X4, X7, X3, X6
484.51
58.17
X1, X9 X4, X7, X3, X8
484.53
58.23
11
Lampiran 2 (lanjutan) Jumlah Peubah 7 Peubah
8 Peubah 9 Peubah
Kombinasi Peubah X1, X9, X4, X7, X3, X5, X2 X1, X9, X4, X7, X3, X5, X6 X1, X9, X4, X7, X3, X5, X8 X1, X9, X4, X7, X3, X5, X2, X6 X1, X9, X4, X7, X3, X5, X2, X8 X1, X9, X4, X7, X3, X5, X2, X6, X8
AIC 485.37 485.39 485.5 487.25 487.34 489.23
R2DEV,NB (%) 59.54 59.39 59.48 59.45 59.51 59.45
Lampiran 3 Algoritma untuk pendugaan parameter regresi Poisson menggunakan R 2.14.0 poisson<-read.table("D:/Semangat lagi/data poisson.csv", sep=",", header = TRUE) summary(poisson) attach(poisson) modelpoisson<-glm(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, family="poisson", data=poisson) summary(modelpoisson) exp(modelpoisson$coefficients)## nilai exp(model poisson) modelpoisson$deviance/modelpoisson$df.residual ## cek overdispersi
Lampiran 4 Algoritma untuk pendugaan parameter regresi Binomial Negatif menggunakan R 2.14.0 library(MASS) library(lmtest) modelnegbin.nb <- glm.nb(Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9, data= poisson) summary(modelnegbin.nb) exp(modelnegbin.nb$coefficients) ## nilai exp(model negbin) ##kebaikan model negbin betanb<-modelnegbin.nb$coefficients betanb<-as.matrix(betanb) betanb satu<-rep(1,64) satu<-as.vector(satu) satu xnb<-cbind(satu,X1,X2,X3,X4,X5,X6,X7,X8,X9) xnb<-as.matrix(xnb) xnb mu.topinb<-exp(xnb%*%betanb) mu.topinb<-as.vector(mu.topinb) mu.topinb y<-as.vector(Y) y satu<-rep(1,64) satu<-as.vector(satu) satu y_bar<-mean(Y) y_bar thetanb<-rep(4.018,64) thetanb theta<-4.018 theta atasnb<-sum(y*log(y/mu.topinb)-((y*thetanb)*log((y+thetanb)/(mu.topinb+thetanb)))) atasnb bawahnb<-sum(y*log(y/y_bar)-((y*thetanb)*log((y+thetanb)/(y_bar+theta)))) bawahnb R2.DEVNB<-1-(atasnb/bawahnb) R2.DEVNB ## plot residuals vs fitted.value fitted.values<-fitted.values(modelnegbin.nb) fitted.values residuals<-residuals(modelnegbin.nb) residuals plot(fitted.values,residuals)
12
### Kombinasi Peubah Penjelas ## 3 PEUBAH library(MASS) library(lmtest) modelnegbin.nb1 <- glm.nb(Y ~ X1 + X9 + X2 , data= poisson) modelnegbin.nb2 <- glm.nb(Y ~ X1 + X9 + X3 , data= poisson) modelnegbin.nb3 <- glm.nb(Y ~ X1 + X9 + X4 , data= poisson) modelnegbin.nb4 <- glm.nb(Y ~ X1 + X9 + X5 , data= poisson) modelnegbin.nb5 <- glm.nb(Y ~ X1 + X9 + X6 , data= poisson) modelnegbin.nb6 <- glm.nb(Y ~ X1 + X9 + X7 , data= poisson) modelnegbin.nb7 <- glm.nb(Y ~ X1 + X9 + X8 , data= poisson) summary(modelnegbin.nb1) summary(modelnegbin.nb2) summary(modelnegbin.nb3) summary(modelnegbin.nb4) summary(modelnegbin.nb5) summary(modelnegbin.nb6) summary(modelnegbin.nb7) ##kebaikan model negbin kombinasi betanb1<-modelnegbin.nb1$coefficients betanb1<-as.matrix(betanb1) betanb1 satu<-rep(1,64) satu<-as.vector(satu) xnb1<-cbind(satu,X1,X9,X2) xnb1<-as.matrix(xnb1) xnb1 mu.topinb1<-exp(xnb1%*%betanb1) mu.topinb1<-as.vector(mu.topinb1) mu.topinb1 y<-as.vector(Y) y satu<-rep(1,64) satu<-as.vector(satu) satu y_bar<-mean(Y) y_bar thetanb1<-rep(3.509,64) thetanb1 theta1<-3.509 theta1 atasnb1<-sum(y*log(y/mu.topinb1)-((y*thetanb1)*log((y+thetanb1)/(mu.topinb1+thetanb1)))) atasnb1 bawahnb1<-sum(y*log(y/y_bar)-((y*thetanb1)*log((y+thetanb1)/(y_bar+theta1)))) bawahnb1 R2.DEVNB1<-1-(atasnb1/bawahnb1) R2.DEVNB1 betanb2<-modelnegbin.nb2$coefficients betanb2<-as.matrix(betanb2) betanb2 satu<-rep(1,64) satu<-as.vector(satu) xnb2<-cbind(satu,X1,X9,X3) xnb2<-as.matrix(xnb2) xnb2 mu.topinb2<-exp(xnb2%*%betanb2) mu.topinb2<-as.vector(mu.topinb2) mu.topinb2 thetanb2<-rep(3.541,64) thetanb2 theta2<-3.541 theta2 atasnb2<-sum(y*log(y/mu.topinb2)-((y*thetanb2)*log((y+thetanb2)/(mu.topinb2+thetanb2)))) atasnb2 bawahnb2<-sum(y*log(y/y_bar)-((y*thetanb2)*log((y+thetanb2)/(y_bar+theta2)))) bawahnb2 R2.DEVNB2<-1-(atasnb2/bawahnb2) R2.DEVNB2
13
betanb3<-modelnegbin.nb3$coefficients betanb3<-as.matrix(betanb3) betanb3 satu<-rep(1,64) satu<-as.vector(satu) xnb3<-cbind(satu,X1,X9,X4) xnb3<-as.matrix(xnb3) xnb3 mu.topinb3<-exp(xnb3%*%betanb3) mu.topinb3<-as.vector(mu.topinb3) mu.topinb3 thetanb3<-rep(3.696,64) thetanb3 theta3<-3.696 theta3 atasnb3<-sum(y*log(y/mu.topinb3)-((y*thetanb3)*log((y+thetanb3)/(mu.topinb3+thetanb3)))) atasnb3 bawahnb3<-sum(y*log(y/y_bar)-((y*thetanb3)*log((y+thetanb3)/(y_bar+theta3)))) bawahnb3 R2.DEVNB3<-1-(atasnb3/bawahnb3) R2.DEVNB3 betanb4<-modelnegbin.nb4$coefficients betanb4<-as.matrix(betanb4) betanb4 satu<-rep(1,64) satu<-as.vector(satu) xnb4<-cbind(satu,X1,X9,X5) xnb4<-as.matrix(xnb4) xnb4 mu.topinb4<-exp(xnb4%*%betanb4) mu.topinb4<-as.vector(mu.topinb4) mu.topinb4 thetanb4<-rep(3.591,64) thetanb4 theta4<-3.591 theta4 atasnb4<-sum(y*log(y/mu.topinb4)-((y*thetanb4)*log((y+thetanb4)/(mu.topinb4+thetanb4)))) atasnb4 bawahnb4<-sum(y*log(y/y_bar)-((y*thetanb4)*log((y+thetanb4)/(y_bar+theta4)))) bawahnb4 R2.DEVNB4<-1-(atasnb4/bawahnb4) R2.DEVNB4 betanb5<-modelnegbin.nb5$coefficients betanb5<-as.matrix(betanb5) betanb5 satu<-rep(1,64) satu<-as.vector(satu) xnb5<-cbind(satu,X1,X9,X6) xnb5<-as.matrix(xnb5) xnb5 mu.topinb5<-exp(xnb5%*%betanb5) mu.topinb5<-as.vector(mu.topinb5) mu.topinb5 thetanb5<-rep(3.505,64) thetanb5 theta5<-3.505 theta5 atasnb5<-sum(y*log(y/mu.topinb5)-((y*thetanb5)*log((y+thetanb5)/(mu.topinb5+thetanb5)))) atasnb5 bawahnb5<-sum(y*log(y/y_bar)-((y*thetanb5)*log((y+thetanb5)/(y_bar+theta5)))) bawahnb5 R2.DEVNB5<-1-(atasnb5/bawahnb5) R2.DEVNB5 betanb6<-modelnegbin.nb6$coefficients betanb6<-as.matrix(betanb6) betanb6 satu<-rep(1,64) satu<-as.vector(satu) xnb6<-cbind(satu,X1,X9,X7)
14
xnb6<-as.matrix(xnb6) xnb6 mu.topinb6<-exp(xnb6%*%betanb6) mu.topinb6<-as.vector(mu.topinb6) mu.topinb6 thetanb6<-rep(3.654,64) thetanb6 theta6<-3.654 theta6 atasnb6<-sum(y*log(y/mu.topinb6)-((y*thetanb6)*log((y+thetanb6)/(mu.topinb6+thetanb6)))) atasnb6 bawahnb6<-sum(y*log(y/y_bar)-((y*thetanb6)*log((y+thetanb6)/(y_bar+theta6)))) bawahnb6 R2.DEVNB6<-1-(atasnb6/bawahnb6) R2.DEVNB6 betanb7<-modelnegbin.nb7$coefficients betanb7<-as.matrix(betanb7) betanb7 satu<-rep(1,64) satu<-as.vector(satu) xnb7<-cbind(satu,X1,X9,X8) xnb7<-as.matrix(xnb7) xnb7 mu.topinb7<-exp(xnb7%*%betanb7) mu.topinb7<-as.vector(mu.topinb7) mu.topinb7 thetanb7<-rep(3.492,64) thetanb7 theta7<-3.492 theta7 atasnb7<-sum(y*log(y/mu.topinb7)-((y*thetanb7)*log((y+thetanb7)/(mu.topinb7+thetanb7)))) atasnb7 bawahnb7<-sum(y*log(y/y_bar)-((y*thetanb7)*log((y+thetanb7)/(y_bar+theta7)))) bawahnb7 R2.DEVNB7<-1-(atasnb7/bawahnb7) R2.DEVNB7 ## 4 PEUBAH library(MASS) library(lmtest) modelnegbin.nb8 <- glm.nb(Y ~ X1 + X9 + X4 + X2, data= poisson) modelnegbin.nb9 <- glm.nb(Y ~ X1 + X9 + X4 + X3, data= poisson) modelnegbin.nb10 <- glm.nb(Y ~ X1 + X9 + X4 + X5, data= poisson) modelnegbin.nb11 <- glm.nb(Y ~ X1 + X9 + X4 + X6, data= poisson) modelnegbin.nb12 <- glm.nb(Y ~ X1 + X9 + X4 + X7, data= poisson) modelnegbin.nb13 <- glm.nb(Y ~ X1 + X9 + X4 + X8, data= poisson) summary(modelnegbin.nb8) summary(modelnegbin.nb9) summary(modelnegbin.nb10) summary(modelnegbin.nb11) summary(modelnegbin.nb12) summary(modelnegbin.nb13)
##kebaikan model negbin kombinasi betanb8<-modelnegbin.nb8$coefficients betanb8<-as.matrix(betanb8) betanb8 satu<-rep(1,64) satu<-as.vector(satu) xnb8<-cbind(satu,X1,X9,X4,X2) xnb8<-as.matrix(xnb8) xnb8 mu.topinb8<-exp(xnb8%*%betanb8) mu.topinb8<-as.vector(mu.topinb8) mu.topinb8 thetanb8<-rep(3.730,64) thetanb8
15
theta8<-3.730 theta8 atasnb8<-sum(y*log(y/mu.topinb8)-((y*thetanb8)*log((y+thetanb8)/(mu.topinb8+thetanb8)))) atasnb8 bawahnb8<-sum(y*log(y/y_bar)-((y*thetanb8)*log((y+thetanb8)/(y_bar+theta8)))) bawahnb8 R2.DEVNB8<-1-(atasnb8/bawahnb8) R2.DEVNB8 betanb9<-modelnegbin.nb9$coefficients betanb9<-as.matrix(betanb9) betanb9 satu<-rep(1,64) satu<-as.vector(satu) xnb9<-cbind(satu,X1,X9,X4,X3) xnb9<-as.matrix(xnb9) xnb9 mu.topinb9<-exp(xnb9%*%betanb9) mu.topinb9<-as.vector(mu.topinb9) mu.topinb9 thetanb9<-rep(3.740,64) thetanb9 theta9<-3.740 theta9 atasnb9<-sum(y*log(y/mu.topinb9)-((y*thetanb9)*log((y+thetanb9)/(mu.topinb9+thetanb9)))) atasnb9 bawahnb9<-sum(y*log(y/y_bar)-((y*thetanb9)*log((y+thetanb9)/(y_bar+theta9)))) bawahnb9 R2.DEVNB9<-1-(atasnb9/bawahnb9) R2.DEVNB9 betanb10<-modelnegbin.nb10$coefficients betanb10<-as.matrix(betanb10) betanb10 satu<-rep(1,64) satu<-as.vector(satu) xnb10<-cbind(satu,X1,X9,X4,X5) xnb10<-as.matrix(xnb10) xnb10 mu.topinb10<-exp(xnb10%*%betanb10) mu.topinb10<-as.vector(mu.topinb10) mu.topinb10 thetanb10<-rep(3.742,64) thetanb10 theta10<-3.742 theta10 atasnb10<-sum(y*log(y/mu.topinb10)-((y*thetanb10)*log((y+thetanb10)/(mu.topinb10+thetanb10)))) atasnb10 bawahnb10<-sum(y*log(y/y_bar)-((y*thetanb10)*log((y+thetanb10)/(y_bar+theta10)))) bawahnb10 R2.DEVNB10<-1-(atasnb10/bawahnb10) R2.DEVNB10 betanb11<-modelnegbin.nb11$coefficients betanb11<-as.matrix(betanb11) betanb11 satu<-rep(1,64) satu<-as.vector(satu) xnb11<-cbind(satu,X1,X9,X4,X6) xnb11<-as.matrix(xnb11) xnb11 mu.topinb11<-exp(xnb11%*%betanb11) mu.topinb11<-as.vector(mu.topinb11) mu.topinb11 thetanb11<-rep(3.702,64) thetanb11 theta11<-3.702 theta11 atasnb11<-sum(y*log(y/mu.topinb11)-((y*thetanb11)*log((y+thetanb11)/(mu.topinb11+thetanb11)))) atasnb11 bawahnb11<-sum(y*log(y/y_bar)-((y*thetanb11)*log((y+thetanb11)/(y_bar+theta11)))) bawahnb11
16
R2.DEVNB11<-1-(atasnb11/bawahnb11) R2.DEVNB11
betanb12<-modelnegbin.nb12$coefficients betanb12<-as.matrix(betanb12) betanb12 satu<-rep(1,64) satu<-as.vector(satu) xnb12<-cbind(satu,X1,X9,X4,X7) xnb12<-as.matrix(xnb12) xnb12 mu.topinb12<-exp(xnb12%*%betanb12) mu.topinb12<-as.vector(mu.topinb12) mu.topinb12 thetanb12<-rep(3.869,64) thetanb12 theta12<-3.869 theta12 atasnb12<-sum(y*log(y/mu.topinb12)-((y*thetanb12)*log((y+thetanb12)/(mu.topinb12+thetanb12)))) atasnb12 bawahnb12<-sum(y*log(y/y_bar)-((y*thetanb12)*log((y+thetanb12)/(y_bar+theta12)))) bawahnb12 R2.DEVNB12<-1-(atasnb12/bawahnb12) R2.DEVNB12 betanb13<-modelnegbin.nb13$coefficients betanb13<-as.matrix(betanb13) betanb13 satu<-rep(1,64) satu<-as.vector(satu) xnb13<-cbind(satu,X1,X9,X4,X8) xnb13<-as.matrix(xnb13) xnb13 mu.topinb13<-exp(xnb13%*%betanb13) mu.topinb13<-as.vector(mu.topinb13) mu.topinb13 thetanb13<-rep(3.698,64) thetanb13 theta13<-3.698 theta13 atasnb13<-sum(y*log(y/mu.topinb13)-((y*thetanb13)*log((y+thetanb13)/(mu.topinb13+thetanb13)))) atasnb13 bawahnb13<-sum(y*log(y/y_bar)-((y*thetanb13)*log((y+thetanb13)/(y_bar+theta13)))) bawahnb13 R2.DEVNB13<-1-(atasnb13/bawahnb13) R2.DEVNB13 ## 5 PEUBAH library(MASS) library(lmtest) modelnegbin.nb14 <- glm.nb(Y ~ X1 + X9 + X4 + X7 + X2, data= poisson) modelnegbin.nb15 <- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3, data= poisson) modelnegbin.nb16 <- glm.nb(Y ~ X1 + X9 + X4 + X7 + X5, data= poisson) modelnegbin.nb17 <- glm.nb(Y ~ X1 + X9 + X4 + X7 + X6, data= poisson) modelnegbin.nb18 <- glm.nb(Y ~ X1 + X9 + X4 + X7 + X8, data= poisson) summary(modelnegbin.nb14) summary(modelnegbin.nb15) summary(modelnegbin.nb16) summary(modelnegbin.nb17) summary(modelnegbin.nb18) ##kebaikan model negbin kombinasi betanb14<-modelnegbin.nb14$coefficients betanb14<-as.matrix(betanb14) betanb14 satu<-rep(1,64) satu<-as.vector(satu) xnb14<-cbind(satu,X1,X9,X4,X7,X2)
17
xnb14<-as.matrix(xnb14) xnb14 mu.topinb14<-exp(xnb14%*%betanb14) mu.topinb14<-as.vector(mu.topinb14) mu.topinb14 thetanb14<-rep(3.899,64) thetanb14 theta14<-3.899 theta14 atasnb14<-sum(y*log(y/mu.topinb14)-((y*thetanb14)*log((y+thetanb14)/(mu.topinb14+thetanb14)))) atasnb14 bawahnb14<-sum(y*log(y/y_bar)-((y*thetanb14)*log((y+thetanb14)/(y_bar+theta14)))) bawahnb14 R2.DEVNB14<-1-(atasnb14/bawahnb14) R2.DEVNB14 betanb15<-modelnegbin.nb15$coefficients betanb15<-as.matrix(betanb15) betanb15 satu<-rep(1,64) satu<-as.vector(satu) xnb15<-cbind(satu,X1,X9,X4,X7,X3) xnb15<-as.matrix(xnb15) xnb15 mu.topinb15<-exp(xnb15%*%betanb15) mu.topinb15<-as.vector(mu.topinb15) mu.topinb15 thetanb15<-rep(3.914) thetanb15 theta15<-3.914 theta15 atasnb15<-sum(y*log(y/mu.topinb15)-((y*thetanb15)*log((y+thetanb15)/(mu.topinb15+thetanb15)))) atasnb15 bawahnb15<-sum(y*log(y/y_bar)-((y*thetanb15)*log((y+thetanb15)/(y_bar+theta15)))) bawahnb15 R2.DEVNB15<-1-(atasnb15/bawahnb15) R2.DEVNB15 betanb16<-modelnegbin.nb16$coefficients betanb16<-as.matrix(betanb16) betanb16 satu<-rep(1,64) satu<-as.vector(satu) xnb16<-cbind(satu,X1,X9,X4,X7,X5) xnb16<-as.matrix(xnb16) xnb16 mu.topinb16<-exp(xnb16%*%betanb16) mu.topinb16<-as.vector(mu.topinb16) mu.topinb16 thetanb16<-rep(3.928) thetanb16 theta16<-3.928 theta16 atasnb16<-sum(y*log(y/mu.topinb16)-((y*thetanb16)*log((y+thetanb16)/(mu.topinb16+thetanb16)))) atasnb16 bawahnb16<-sum(y*log(y/y_bar)-((y*thetanb16)*log((y+thetanb16)/(y_bar+theta16)))) bawahnb16 R2.DEVNB16<-1-(atasnb16/bawahnb16) R2.DEVNB16 betanb17<-modelnegbin.nb17$coefficients betanb17<-as.matrix(betanb17) betanb17 satu<-rep(1,64) satu<-as.vector(satu) xnb17<-cbind(satu,X1,X9,X4,X7,X6) xnb17<-as.matrix(xnb17) xnb17 mu.topinb17<-exp(xnb17%*%betanb17) mu.topinb17<-as.vector(mu.topinb17) mu.topinb17 thetanb17<-rep(3.875,64)
18
thetanb17 theta17<-3.875 theta17 atasnb17<-sum(y*log(y/mu.topinb17)-((y*thetanb17)*log((y+thetanb17)/(mu.topinb17+thetanb17)))) atasnb17 bawahnb17<-sum(y*log(y/y_bar)-((y*thetanb17)*log((y+thetanb17)/(y_bar+theta17)))) bawahnb17 R2.DEVNB17<-1-(atasnb17/bawahnb17) R2.DEVNB17 betanb18<-modelnegbin.nb18$coefficients betanb18<-as.matrix(betanb18) betanb18 satu<-rep(1,64) satu<-as.vector(satu) xnb18<-cbind(satu,X1,X9,X4,X7,X8) xnb18<-as.matrix(xnb18) xnb18 mu.topinb18<-exp(xnb18%*%betanb18) mu.topinb18<-as.vector(mu.topinb18) mu.topinb18 thetanb18<-rep(3.868,64) thetanb18 theta18<-3.868 theta18 atasnb18<-sum(y*log(y/mu.topinb18)-((y*thetanb18)*log((y+thetanb18)/(mu.topinb18+thetanb18)))) atasnb18 bawahnb18<-sum(y*log(y/y_bar)-((y*thetanb18)*log((y+thetanb18)/(y_bar+theta18)))) bawahnb18 R2.DEVNB18<-1-(atasnb18/bawahnb18) R2.DEVNB18 ## 6 PEUBAH library(MASS) library(lmtest) modelnegbin.nb19<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X2,data= poisson) modelnegbin.nb20<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5,data= poisson) modelnegbin.nb21<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X6,data= poisson) modelnegbin.nb22<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X8,data= poisson) summary(modelnegbin.nb19) summary(modelnegbin.nb20) summary(modelnegbin.nb21) summary(modelnegbin.nb22) ##kebaikan model negbin kombinasi betanb19<-modelnegbin.nb19$coefficients betanb19<-as.matrix(betanb19) betanb19 satu<-rep(1,64) satu<-as.vector(satu) xnb19<-cbind(satu,X1,X9,X4,X7,X3,X2) xnb19<-as.matrix(xnb19) xnb19 mu.topinb19<-exp(xnb19%*%betanb19) mu.topinb19<-as.vector(mu.topinb19) mu.topinb19 thetanb19<-rep(3.931,64) thetanb19 theta19<-3.931 theta19 atasnb19<-sum(y*log(y/mu.topinb19)-((y*thetanb19)*log((y+thetanb19)/(mu.topinb19+thetanb19)))) atasnb19 bawahnb19<-sum(y*log(y/y_bar)-((y*thetanb19)*log((y+thetanb19)/(y_bar+theta19)))) bawahnb19 R2.DEVNB19<-1-(atasnb19/bawahnb19) R2.DEVNB19 betanb20<-modelnegbin.nb20$coefficients betanb20<-as.matrix(betanb20)
19
betanb20 satu<-rep(1,64) satu<-as.vector(satu) xnb20<-cbind(satu,X1,X9,X4,X7,X3,X5) xnb20<-as.matrix(xnb20) xnb20 mu.topinb20<-exp(xnb20%*%betanb20) mu.topinb20<-as.vector(mu.topinb20) mu.topinb20 thetanb20<-rep(3.989,64) thetanb20 theta20<-3.989 theta20 atasnb20<-sum(y*log(y/mu.topinb20)-((y*thetanb20)*log((y+thetanb20)/(mu.topinb20+thetanb20)))) atasnb20 bawahnb20<-sum(y*log(y/y_bar)-((y*thetanb20)*log((y+thetanb20)/(y_bar+theta20)))) bawahnb20 R2.DEVNB20<-1-(atasnb20/bawahnb20) R2.DEVNB20 betanb21<-modelnegbin.nb21$coefficients betanb21<-as.matrix(betanb21) betanb21 satu<-rep(1,64) satu<-as.vector(satu) xnb21<-cbind(satu,X1,X9,X4,X7,X3,X6) xnb21<-as.matrix(xnb21) xnb21 mu.topinb21<-exp(xnb21%*%betanb21) mu.topinb21<-as.vector(mu.topinb21) mu.topinb21 thetanb21<-rep(3.917,64) thetanb21 theta21<-3.917 theta21 atasnb21<-sum(y*log(y/mu.topinb21)-((y*thetanb21)*log((y+thetanb21)/(mu.topinb21+thetanb21)))) atasnb21 bawahnb21<-sum(y*log(y/y_bar)-((y*thetanb21)*log((y+thetanb21)/(y_bar+theta21)))) bawahnb21 R2.DEVNB21<-1-(atasnb21/bawahnb21) R2.DEVNB21 betanb22<-modelnegbin.nb22$coefficients betanb22<-as.matrix(betanb22) betanb22 satu<-rep(1,64) satu<-as.vector(satu) xnb22<-cbind(satu,X1,X9,X4,X7,X3,X8) xnb22<-as.matrix(xnb22) xnb22 mu.topinb22<-exp(xnb22%*%betanb22) mu.topinb22<-as.vector(mu.topinb22) mu.topinb22 thetanb22<-rep(3.915,64) thetanb22 theta22<-3.915 theta22 atasnb22<-sum(y*log(y/mu.topinb22)-((y*thetanb22)*log((y+thetanb22)/(mu.topinb22+thetanb22)))) atasnb22 bawahnb22<-sum(y*log(y/y_bar)-((y*thetanb22)*log((y+thetanb22)/(y_bar+theta22)))) bawahnb22 R2.DEVNB22<-1-(atasnb22/bawahnb22) R2.DEVNB22 ## 7 PEUBAH library(MASS) library(lmtest) modelnegbin.nb23<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5 + X2, data= poisson) modelnegbin.nb24<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5 + X6, data= poisson) modelnegbin.nb25<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5 + X8, data= poisson)
20
summary(modelnegbin.nb23) summary(modelnegbin.nb24) summary(modelnegbin.nb25) ##kebaikan model negbin kombinasi betanb23<-modelnegbin.nb23$coefficients betanb23<-as.matrix(betanb23) betanb23 satu<-rep(1,64) satu<-as.vector(satu) xnb23<-cbind(satu,X1,X9,X4,X7,X3,X5,X2) xnb23<-as.matrix(xnb23) xnb23 mu.topinb23<-exp(xnb23%*%betanb23) mu.topinb23<-as.vector(mu.topinb23) mu.topinb23 thetanb23<-rep(4.001,64) thetanb23 theta23<-4.001 theta23 atasnb23<-sum(y*log(y/mu.topinb23)-((y*thetanb23)*log((y+thetanb23)/(mu.topinb23+thetanb23)))) atasnb23 bawahnb23<-sum(y*log(y/y_bar)-((y*thetanb23)*log((y+thetanb23)/(y_bar+theta23)))) bawahnb23 R2.DEVNB23<-1-(atasnb23/bawahnb23) R2.DEVNB23 betanb24<-modelnegbin.nb24$coefficients betanb24<-as.matrix(betanb24) betanb24 satu<-rep(1,64) satu<-as.vector(satu) xnb24<-cbind(satu,X1,X9,X4,X7,X3,X5,X6) xnb24<-as.matrix(xnb24) xnb24 mu.topinb24<-exp(xnb24%*%betanb24) mu.topinb24<-as.vector(mu.topinb24) mu.topinb24 thetanb24<-rep(4.000,64) thetanb24 theta24<-4.000 theta24 atasnb24<-sum(y*log(y/mu.topinb24)-((y*thetanb24)*log((y+thetanb24)/(mu.topinb24+thetanb24)))) atasnb24 bawahnb24<-sum(y*log(y/y_bar)-((y*thetanb24)*log((y+thetanb24)/(y_bar+theta24)))) bawahnb24 R2.DEVNB24<-1-(atasnb24/bawahnb24) R2.DEVNB24 betanb25<-modelnegbin.nb25$coefficients betanb25<-as.matrix(betanb25) betanb25 satu<-rep(1,64) satu<-as.vector(satu) xnb25<-cbind(satu,X1,X9,X4,X7,X3,X5,X8) xnb25<-as.matrix(xnb25) xnb25 mu.topinb25<-exp(xnb25%*%betanb25) mu.topinb25<-as.vector(mu.topinb25) mu.topinb25 thetanb25<-rep(3.990,64) thetanb25 theta25<-3.990 theta25 atasnb25<-sum(y*log(y/mu.topinb25)-((y*thetanb25)*log((y+thetanb25)/(mu.topinb25+thetanb25)))) atasnb25 bawahnb25<-sum(y*log(y/y_bar)-((y*thetanb25)*log((y+thetanb25)/(y_bar+theta25)))) bawahnb25 R2.DEVNB25<-1-(atasnb25/bawahnb25) R2.DEVNB25
21
## 8 PEUBAH library(MASS) library(lmtest) modelnegbin.nb26<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5 + X2 + X6, data= poisson) modelnegbin.nb27<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5 + X2 + X8, data= poisson) summary(modelnegbin.nb26) summary(modelnegbin.nb27) ##kebaikan model negbin kombinasi betanb26<-modelnegbin.nb26$coefficients betanb26<-as.matrix(betanb26) betanb26 satu<-rep(1,64) satu<-as.vector(satu) xnb26<-cbind(satu,X1,X9,X4,X7,X3,X5,X2,X6) xnb26<-as.matrix(xnb26) xnb26 mu.topinb26<-exp(xnb26%*%betanb26) mu.topinb26<-as.vector(mu.topinb26) mu.topinb26 thetanb26<-rep(4.014,64) thetanb26 theta26<-4.014 theta26 atasnb26<-sum(y*log(y/mu.topinb26)-((y*thetanb26)*log((y+thetanb26)/(mu.topinb26+thetanb26)))) atasnb26 bawahnb26<-sum(y*log(y/y_bar)-((y*thetanb26)*log((y+thetanb26)/(y_bar+theta26)))) bawahnb26 R2.DEVNB26<-1-(atasnb26/bawahnb26) R2.DEVNB26
betanb27<-modelnegbin.nb27$coefficients betanb27<-as.matrix(betanb27) betanb27 satu<-rep(1,64) satu<-as.vector(satu) xnb27<-cbind(satu,X1,X9,X4,X7,X3,X5,X2,X8) xnb27<-as.matrix(xnb27) xnb27 mu.topinb27<-exp(xnb27%*%betanb27) mu.topinb27<-as.vector(mu.topinb27) mu.topinb27 thetanb27<-rep(4.007,64) thetanb27 theta27<-4.007 theta27 atasnb27<-sum(y*log(y/mu.topinb27)-((y*thetanb27)*log((y+thetanb27)/(mu.topinb27+thetanb27)))) atasnb27 bawahnb27<-sum(y*log(y/y_bar)-((y*thetanb27)*log((y+thetanb27)/(y_bar+theta27)))) bawahnb27 R2.DEVNB27<-1-(atasnb27/bawahnb27) R2.DEVNB27 ## 9 PEUBAH library(MASS) library(lmtest) modelnegbin.nb28<- glm.nb(Y ~ X1 + X9 + X4 + X7 + X3 + X5 + X2 + X6 + X8, data= poisson) summary(modelnegbin.nb28) ##kebaikan model negbin kombinasi betanb28<-modelnegbin.nb28$coefficients betanb28<-as.matrix(betanb28) betanb28 satu<-rep(1,64) satu<-as.vector(satu) xnb28<-cbind(satu,X1,X9,X4,X7,X3,X5,X2,X6)
22
xnb28<-as.matrix(xnb28) xnb28 mu.topinb28<-exp(xnb28%*%betanb28) mu.topinb28<-as.vector(mu.topinb28) mu.topinb28 thetanb28<-rep(4.018,64) thetanb28 theta28<-4.018 theta28 atasnb28<-sum(y*log(y/mu.topinb28)-((y*thetanb28)*log((y+thetanb28)/(mu.topinb28+thetanb28)))) atasnb28 bawahnb28<-sum(y*log(y/y_bar)-((y*thetanb28)*log((y+thetanb28)/(y_bar+theta28)))) bawahnb28 R2.DEVNB28<-1-(atasnb28/bawahnb28) R2.DEVNB28