BAB I PENDAHULUAN
1.1.
Latar Belakang dan Permasalahan Analisis regresi merupakan salah satu analisis yang paling populer
digunakan dalam sebuah penelitian untuk mengetahui bentuk hubungan antara variabel respon dengan satu atau lebih variabel prediktor. Analisis regresi yang umumnya digunakan adalah analisis regresi klasik, dimana variable responnya merupakan data kontinu yang mengikuti distribusi normal. Namun, jika variabel respon yang dimiliki berupa data biner yang saling bebas dan memiliki distribusi yang identik maka analisis yang lebih cocok digunakan adalah analisis regresi logistik. Dalam analisis regresi logistik, variabel respon (Y) diasumsikan mengikuti sebaran binomial dengan variansi pengamatan sama dengan variansi yang diharapkan. Jika nilai variansi pengamatan lebih besar dari variansi yang diharapkan akan mengindikasikan adanya masalah overdispersi pada pengamatan data biner tersebut. Hal ini dapat menyebabkan nilai standar eror menjadi underestimate, sehingga penarikan kesimpulan menjadi tidak tepat. Overdispersi
dapat
terjadi
dikarenakan
adanya
pengelompokkan
(clustering) dalam populasi seperti rumah tangga, keluarga, lingkungan dan lainlain yang secara alami akan membentuk sendiri kelompok-kelompoknya. Selain itu adanya pengamatan atau pengujian berulang pada suatu objek yang sama sehingga akan diperoleh suatu peluang respon yang berbeda dari satu percobaan ke percobaan lain (McCullagh & Nelder, 1983). Apabila masalah overdispersi ini diabaikan maka akan menyebabkan nilai duga galat baku yang terlalu kecil (underestimates), hal ini dapat berakibat pada penarikan kesimpulan yang tidak tepat karena membawa kita pada pengujian hipotesis dengan peluang melakukan kesalahan jenis I semakin besar. Artinya
1
2
peluang untuk menolak hipotesis nol yang seharusnya diterima menjadi semakin besar. Terdapat beberapa metode yang dapat menyelesaikan permasalahan overdispersi pada regresi logistik, diantaranya model binomial berkorelasi, model logistik normal, metode Williams, regrsi beta binomial, dan lain-lain. Pada skripsi ini penulis akan menggunakan Beta-Binomial Regression untuk mengatasi permasalahan overdispersi pada regresi logistik biner.
1.2.
Pembatasan Masalah Batasan masalah sangat diperlukan untuk menjamin keabsahan dalam
kesimpulan yang diperoleh. Berdasarkan latar belakang masalah dan kajian-kajian pendukung lain, penulis dapat memberikan rumusan dan batasan masalah sehubungan dengan kompleksnya masalah yang akan muncul dalam pembahasan. Dalam penelitian ini, permasalahan yang akan ditinjau adalah mengenai masalah overdispersi yang terjadi pada regresi logistik. Penelitian ini difokuskan pada asumsi-asumsi yang digunakan, metode pendugaan parameter, interpretasi parameter-parameter, bentuk statistik uji yang akan digunaan dalam regresi betabinomial. Serta membandingkan model regresi beta-binomial dengan model regresi logistik biner biasa untuk melihat keefektifan dari model regresi beta-binomial tersebut.
1.3.
Tujuan Penulisan Tujuan penulisan ini adalah untuk memberikan solusi terhadap
permasalahan overdispersi yang terjadi dalam regresi logistic biner dengan menggunakan Beta-Binomial Regression Model. Dengan mengatasi permasalahan overdispersi tersebut peneliti ingin menggambarkan hubungan antara variabel respon dengan peubah responnya, selain itu peneliti juga ingin melihat efektifitas dari beta-binomial regresi jika dibandingkan dengan regresi logisitik biner yang biasa digunakan pada umumnya.
3
1.4.
Tinjauan Pustaka Penulisan ini diangkat dari beberapa penelitian dengan tema serupa yang
telah dilakukan. Penelitian yang menjadi acuan utama pada penulisan ini diantaranya adalah Jurnal “Beta Binomial Regression” oleh Hilbe (2013) yang mengangkat tema mengenai kasus overdispersi pada regresi logistik biner yang disebabkan adanya keragaman dalam peluang respon sehingga diperoleh rataan yang sangat kecil, untuk itu diasumsikan bahwa rataan dari respon berdistribusi beta. Pada skripsinya “Model Regresi Zero Inflated Negative Binomial”, Martini(2013) membahas mengenai overdispersi pada regresi poisson yang disebabkan oleh banyaknya nilai nol yang berlebih pada variabel respon (excess zero) yang diaplikasikan pada data infeksi telinga pada perenang di New South Wales. Selain itu Astuti (2006) dalam jurnalnya “Uji Trend/Regresi untuk Data Overdispersi” mengatakan bahwa apabila suatu data yang megandung overdispersi tetap dimodelkan menggunakan sebaran binomial maupun poisson akan menghasilkan kesimpulan yang menyesatkan. Untuk itu beliau menyarankan untuk menggunakan pemodelan dengan sebaran beta-binomial. Kurnia at al (2002) dalam jurnalnya “Overdispersi dalam Regresi Logistik” mengatakan bahwa overdispersi dapat disebabkan oleh variabel respon yang terlalu beragam ataupun korelasi antara peubah biner. Beberapa metode yang dapat digunakan untuk mengatasi masalah tersebut diantaranya adalah metode Williams dan regresi beta-binomial. Selain beberapa sumber yang sudah disebutkan di atas, digunakan beberapa literature lainnya yang juga telah dicantumkan dalam daftar pustaka.
1.5.
Metode Penulisan Metode yang digunakan dalam penulisan skripsi ini adalah berdasarkan
studi literature. Sumber literature yang diperoleh penulis didapatkan dari sumber-
4
sumber resmi seperti perpustakaan, buku-buku atas teori yang berkaitan, jurnal, dan situs-situs artikel pendukung yang diperoleh dari internet yang berhubungan dengan tema yang ditulis. Selanjutnya untuk mempermudah pengolahan dan analisis tema yang dibicarakan, dilakukan perhitungan dengan bantuan program R versi 3.0.2 software statistika lain seperti SPSS 19, yang menunjang dalam penyusunan skripsi ini.
1.6.
Sistematika Penulisan Penulisan skripsi ini disusun dengan sistematika penulisan sebagai berikut:
BAB I
PENDAHULUAN Bab ini berisikan latar belakang dan permasalahan, pembatasan masalah, tujuan dan manfaat penelitian, tinjauan pustaka, metode penulisan, dan sistematika penulisan.
BAB II
DASAR TEORI Bab ini membahas beberapa teori yang berkaitan dengan pembahasan pokok
permasalahan
seperti
Matriks,
Ekpektasi,
Variansi,
Kovariansi, Distribusi Binomial, Distribusi Beta, Maximum Likelihood Estimator (MLE), Metode Iterasi Newton Raphson, Generelized Linar Model (GLM), GAMLSS, Fungsi Hubung, Regresi Logistik, dan Overdispersi. BAB III
REGRESI BETA BINOMIAL Bab ini membahas tentang masalah Distribusi Beta Binomial, Model Regresi Beta Binomial, Estimasi Parameter Regresi Beta Binomial, Pengujian Parameter Regresi Beta Binomial, Pemilihan Model, dan Algoritma Model Regresi Beta-Binomial.
BAB IV
STUDI KASUS Bab ini berisi tentang aplikasi dari Beta Binomial Regression Model serta perbandingannya dengan Model Regresi Logistik Biner.
BAB V
PENUTUP
5
Bab ini berisi kesimpulan yang diperoleh dari pembahasan pada babbab sebelumnya serta saran mengenai kelanjutan dari pembahasan dalam skripsi ini khususnya untuk perkembangan ilmu statistika sebagai akibat dari kelebihan dan kekurangan penelitian yang dilakukan.