BAB I PENDAHULUAN 1.1.Latar Belakang Masalah Masalah kecelakaan lalu lintas saat ini sudah merupakan masalah global yang mendapat perhatian dari masyarakat internasional. Menurut data World Health Organization (WHO) setiap tahun kecelakaan lalu lintas telah menyebabkan rata-rata 1,24 juta jiwa meninggal dunia serta 50 juta jiwa mengalami luka-luka dan cacat tetap. Hal ini berarti kecelakaan lalu lintas menyebabkan kurang lebih 3397 jiwa meninggal dunia pada setiap harinya. Di Indonesia, menurut World Health Organization (WHO) kecelakaan lalu lintas merupakan pembunuh terbesar ketiga, di bawah penyakit jantung koroner dan tuberculosis (TBC). (www.bin.go.id). Menurut data Badan Pusat Statistik, pada tahun 2010 tercatat 66.488 kasus kecelakaan lalu lintas dan mengakibatkan 19.873 jiwa meninggal dunia. Tahun
2011 terjadi 108.696
kecelakaan lalu lintas dan mengakibatkan 31.195 jiwa meninggal dunia. Tahun 2012 terjadi 117.949 kecelakaan lalu lintas dan mengakibatkan 29.544 jiwa meninggal dunia dan pada tahun 2013 terjadi 100.106 kecelakaan lalu lintas dan mengakibatkan 26.416 jiwa meninggal dunia. Hal ini berarti, sejak tahun 2010 sampai dengan 2013 tercatat 393.239 kasus kecelakaan lalu lintas dan 107.028 jiwa meninggal dunia atau kurang lebih 73 jiwa meninggal dunia setiap harinya. (www.bps.go.id). Sedangkan di Daerah Istimewa Yogyakarta, menurut data Badan Pusat Statistik Yogyakarta, sejak tahun 2010 sampai dengan tahun 2013
1
2
tercatat 17.303 kasus kecelakaan yang mengakibatkan 1.473 jiwa meninggal dunia, 2.885 jiwa mengalami luka berat dan 22.959 jiwa mengalami luka ringan. Hal ini berarti, di Daerah Istimewa Yogyakarta (DIY) pada setiap harinya terjadi kurang lebih 11 kasus kecelakaan lalu lintas. (www.yogyakarta.bps.go.id). Berawal dari kondisi diatas, dalam tesis ini akan membahas analisis data kecelakaan lalu lintas yang terjadi di Daerah Istimewa Yogyakarta (DIY) pada kurun waktu dari tahun 2012 sampai dengan tahun 2013. Salah satu metode untuk menganalisis data kecelakaan lalu lintas tersebut adalah dengan menggunakan analisis regresi. Analisis regresi merupakan metode yang sering di gunakan untuk menganalisis hubungan antara suatu variabel respon (dependent variable) dengan satu atu lebih variabel penjelas (independent variables). Pada umumnya, analisis regresi biasa mengasumsikan bahwa variabel dependennya kontinu, tetapi dalam prakteknya pada beberapa penelitian terdapat pula variabel dependen yang berupa data diskrit.
Data kecelakaan lalu lintas merupakan
variabel respon yang berupa data diskrit, maka model regresi yang dapat digunakan untuk menganalisis data tersebut adalah model regresi Poisson. Regresi Poisson merupakan metode yang digunakan untuk menganalisis data diskrit (count data) yang menyatakan jumlah atau banyaknya kejadian dalam suatu periode waktu tertentu. Pada model regresi Poisson terdapat asumsi yang harus dipenuhi, salah satunya adalah yaitu asumsi kesamaan antara mean sampel dan variansi sampelnya, yang biasa disebut dengan istilah equidispersi (equidispersion). Akan tetapi, pada analisis data diskrit yang menggunakan regresi Poisson sering terjadi overdispersi (overdispersion) yaitu keadaan dimana
3
nilai variansnya lebih besar dari nilai meannya. Salah satu penyebab terjadinya overdispersi adalah terlalu banyak nilai nol (excess zeros) pada variabel respon. Ada beberapa model regresi yang dapat digunakan untuk mengatasi masalah overdispersi yang di karenakan terlalu banyak nilai nol pada variabel respon (excess zeros), diantaranya model regresi Zero Inflated Poisson (ZIP), Model Regresi Zero Inflated Negative Binomial (ZINB) dan Model Regresi Zero Inflated Generalized Poisson (ZIGP). Pada tesis ini akan membahas tentang Pemodelan Data Cacah Excess Zero Menggunakan Model Berbasis Poisson dan Binomial Negatif . 1.2 Rumusan Masalah Berdasarkan latar belakang tersebut dapat di rumuskan beberapa permasalahan berikut : 1. Bagaimana mendapatkan model terbaik pada data cacah excess zero menggunakan model berbasis Poisson dan Binomial Negatif? 2. Bagaimana cara menguji model data cacah excess zero menggunakan model berbasis Poisson dan Binomial Negatif. 3. Bagaimana aplikasi numerik pemodelan data cacah excess zero menggunakan model berbasis Poisson dan Binomial Negatif
4
1.3 Tujuan penelitian Tujuan penelitian ini adalah untuk mendapatkan pemodelan terbaik pada kasus data cacah excess zero dengan menggunakan model berbasis Poisson dan Binomial Negatif. Selain itu, penelitian ini bertujuan untuk memenuhi salah satu syarat dalam meraih gelar master bidang matematika pada program studi matematika FMIPA UGM, dan juga untuk memperkaya khasanah riset bidang ilmu statistik di Indonesia. 1.4 Tinjauan Pustaka Regresi Poisson adalah metode yang digunakan untuk menganalisis data diskrit yang mengasumsikan adanya kesamaan antara mean sampel dan variansi sampelnya. Akan tetapi, pada analisis data diskrit yang menggunakan regresi Poisson sering terjadi keadaan dimana nilai variansnya lebih besar dari nilai meannya yang disebut dengan istilah overdispersi. Salah satu penyebab terjadinya overdispersi adalah terlalu banyak nilai nol (excess zeros) pada variabel respon. Ada beberapa model regresi yang dapat digunakan untuk mengatasi overdispersi
yang
disebabkan
adanya
exccess
zeros,
Lambert
(1992)
menggunakan Zero Inflated Poisson (ZIP) untuk mengatasi overdispersi. Lee (2002), dalam artikelnya ‘Modeling Young Driver Motor Vehicle Crashes : Data With Extra Zeros’, menganalisis kasus overdispersi menggunakan model regresi Negative Binomial dan Model Regresi Zero Inflated Poisson (ZIP).
5
Famoye, Felix dan Karan P. Singh (2006), dalam artikelnya “Zero-Inflated Generalized Poisson Regression Model with an Application to Domestic Violence Data”, menganalisis kasus overdispersi menggunakan model regresi Zero-Inflated Generalized Poisson (ZIGP). Aswani (2011) membandingkan antara Model Regresi Zero Inflated Generalized Poisson (ZIGP) dengan Model Regresi Zero Inflated Poisson (ZIP) untuk mengatasi kasus overdispersi dengan menganalisis data klaim asuransi kendaraan bermotor pada Perusahaan Jasa Raharja. Martini (2013) menggunakan Zero Inflated Negative Binomial (ZINB) untuk mengatasi overdispersi yang disebabkan oleh exccess zeros, yaitu dengan cara membandingkan Zero Inflated Negative Binomial (ZINB) dengan Zero Inflated Poisson (ZIP) untuk menganalisis faktor-faktor yang mempengaruhi jumlah perenang terdiagnosa infeksi telinga selama setahun. Pada tesis ini kasus overdispersi akan di analisis dengan model regresi Zero Inflated Poisson (ZIP), Model Regresi Zero Inflated Generalized Poisson (ZIGP) dan Model Regresi Zero Inflated Negative Binomial (ZINB). Sedangkan data yang akan di analisis yaitu data kecelakaan lalu lintas yang terjadi di Kota Yogyakarta pada kurun waktu tahun 2012 sampai dengan tahun 2013. 1.5 Metodologi Penelitian Dalam penulisan tesis ini metodologi yang di gunakan terdiri dari dua tahap, yaitu :
6
1. Studi literatur yang di peroleh dari sumber resmi, seperti buku-buku di perpustakaan, jurnal-jurnal, situs-situs pendukung yang tersedia di internet, maupun bimbingan langsung dari dosen pembimbing. 2. Studi kasus akan dilakukan menggunakan data nyata yang di peroleh dari SATLANTAS Polres Kota Yogyakarta. Pengolahan tesis menggunakan software MS Excel 2010 dan software R 1.6 Sistematika Penulisan. Sistematika penulisan tesis terdiri atas 5 (lima) bab, yaitu diawali dengan Bab I Pendahuluan, yang memuat Latar Belakang, Rumusan Masalah, Tujuan Penelitian, Tinjauan Pustaka, Metodologi Penelitian dan Sistimatika Penulisan. Selanjutnya Bab II Landasan Teori, yang memuat tentang teori-teori dasar mengenai GLM, Metode Iterasi Newton Rapshon, Distribusi Poisson, model regresi Poisson, interpretasi koefisien regresi, estimasi parameter, dan ukuran ketepatan model regresi. Kemudian Bab III memuat tentang
Model Zero Inflated Poisson
(ZIP), Model Zero Inflated Generalized Poisson (ZIGP), dan Model Regresi Zero inflated Negative Binomial (ZINB). Di lanjutkan Bab IV memuat aplikasi numerik yang membahas tentang data kecelakaan lalu lintas di KotaYogyakarta, hasil analisis data, (akan memuat implementasi model regresi dalam studi kasus). Terakhir adalah Bab V Penutup, meliputi Kesimpulan dan Saran yang memuat rangkuman hasil penelitian dan saran untuk penelitian selanjutnya.