KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN MENGGUNAKAN REGRESI BINOMIAL NEGATIF (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)
RANI PUSPA DEWI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008
Karya ini ku persembahkan untuk .... Orang tuaku.. Teman-temanku: Meta, Mala, Yusri, Ika, Agustina, Ufi, Neng, Sevrien. Thx for our friendship,,hope we will be friends forever... Teman-teman STK 41 : Tjipto, Efril, Dhika, Zul, Nikhen, Rere, Chery, Rangga, Leisha, Amey, Wiwik, Lia, Fisca, Mbay, Irene, Inal, Kus dan teman-teman lainnya yang tidak dapat di sebutkan satu per satu. Senang bisa bertemu kalian dan menjadi bagian dari kalian semua...
RINGKASAN RANI PUSPA DEWI. Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta). Dibimbing oleh AGUS M. SOLEH dan FARIT MOCHAMMAD AFENDI. Model Regresi Poisson secara umum digunakan untuk menganalisis data cacah (count data) di mana rata-rata dan ragamnya harus sama. Namun kondisi ini jarang sekali ditemukan sehingga seringkali terjadi masalah overdispersi pada data. Salah satu model yang dapat mengakomodir masalah ini adalah Regresi Binomial Negatif. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta. Pendidikan merupakan salah satu faktor penting yang berperan dalam upaya peningkatan kesejahteraan rakyat dan pembentukan sumber daya manusia yang berkualitas. Ujian Nasional merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa, dimulai ketika tahun 2003 dimana terjadi perubahan sistem pendidikan di Indonesia dengan adanya pemberlakuan standar nilai kelulusan. Jumlah siswa yang tidak lulus UN diasumsikan menyebar mengikuti sebaran Poisson, sehingga untuk mengetahui pengaruh faktor eksternal dapat digunakan Regresi Poisson. Jumlah siswa yang tidak lulus UN menunjukkan terjadi overdispersi, sehingga pemodelan yang tepat adalah menggunakan Regresi Binomial Negatif. Hasil analisis menunjukkan bahwa faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus UN adalah akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Model Regresi Binomial Negatif memenuhi kriteria kebaikan model daripada model Regresi Poisson dalam masalah overdispersi, sehingga dapat disimpulkan Regresi Binomial Negatif merupakan salah satu solusi yang dapat digunakan untuk mengatasi permasalahan overdispersi. Kata kunci : Ujian Nasional, Regresi Poisson, Regresi Binomial Negatif, overdispersi
KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN MENGGUNAKAN REGRESI BINOMIAL NEGATIF (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)
RANI PUSPA DEWI
Skripsi Sebagai Salah satu syarat untuk meperoleh gelar Sarjana Sains Pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008
Judul Skripsi : KAJIAN OVERDISPERSI PADA REGRESI POISSON DENGAN MENGGUNAKAN REGRESI BINOMIAL NEGATIF (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta) Nama : Rani Puspa Dewi NRP : G14104022
Menyetujui: Pembimbing I,
Pembimbing II,
Agus M. Soleh, S.Si, M.T. NIP. 132232455
Farit Mochamad Afendi, M.Si NIP. 132314007
Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Drh. Hasim, DEA NIP. 131578806
Tanggal Lulus:
RIWAYAT HIDUP Penulis dilahirkan di Jakarta tanggal 23 Desember 1986 sebagai anak pertama dari pasangan Bambang Sudjati dan Linda Syarifah. Pendidikan dasar diselesaikan penulis di SD Waskito 4 pada tahun 1998, dilanjutkan dengan pendidikan menengah pertama di SLTP Negeri 2 Pamulang dan lulus pada tahun 2001. Tahun 2004 penulis menyelesaikan pendidikan menengah atas di SMA Negeri 1 Pamulang dan pada tahun yang sama diterima sebagai mahasiswa di Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Selama perkuliahan penulis aktif berorganisasi sebagai Anggota Departemen Olahraga dan Seni Himpunan Profesi Gamma Sigma Beta tahun 2006 dan anggota Divisi Data Analysis Decision Centre. Selain itu, penulis juga aktif mengikuti beberapa kegiatan kepanitiaan seperti Statistika Ria 2005, Statistika Ria 2006, Studium General dan Software Training 2006 serta Pesta Sains Nasional 2007. Penulis juga pernah menjadi asisten responsi untuk mata kuliah Metode Statistika pada tahun 2006-2007. Pada bulan Februari-Maret 2008 penulis diberi kesempatan untuk melaksanakan kegiatan praktik lapang pada Strategic Planning Departement di Hotline Advertising.
KATA PENGANTAR Alhamdulillahi robbil alamin, puji dan syukur penulis panjatkan kehadirat Allah SWT atas limpahan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Tak lupa shalawat serta salam penulis panjatkan kepada Rasulullah Muhammad SAW beserta keluarga, sahabat dan umatnya. Karya ilmiah ini berjudul ”Kajian Overdispersi pada Regresi Poisson dengan Menggunakan Regresi Binomial Negatif (Studi Kasus Ketidaklulusan Siswa SMA dalam Ujian Nasional di DKI Jakarta)”. Karya ilmiah ini memuat kajian mengenai pemodelan Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor eksternal yang berpengaruh terhadap ketidaklulusan siswa SMA dalam Ujian Nasional di DKI Jakarta yang dapat memberikan manfaat kepada penulis khususnya dan kepada semua pihak pada umumnya. Terima kasih penulis ucapkan kepda semua pihak yang telah membantu dalam penyusunan karya ilmiah ini, antara lain : 1. Bapak Agus M. Soleh S.Si, M.T. dan Bapak Farit Mochammad Afendi M.Si atas bimbingannya selama menyelesaikan karya ilmiah ini. 2. Bapak Daryono, Ibu Eli dan pihak DIKMENTI Propinsi DKI Jakarta atas bantuannya kepada penulis memperoleh data untuk karya ilmiah ini. 3. Efril dan Cheria sebagai teman seperjuangan dan atas bantuannya dalam entry data. 4. Mas Supri dan Adi atas softcopy skripsinya dan waktu sharing-nya tentang materi penelitian ini. 5. Wiwik, Lia dan Doddy yang telah bersedia menjadi pembahas dalam seminar. 6. Keluarga khususnya kedua orang tuaku dan adikku Vina atas doa, kasih sayang dan dukungannya yang mendorong penulis untuk memberikan yang terbaik. 7. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis selama menyelesaikan karya ilmiah ini.
Bogor, September 2008
Rani Puspa Dewi
DAFTAR ISI Halaman DAFTAR TABEL......................................................................................................................... vii DAFTAR GAMBAR .................................................................................................................... vii DAFTAR LAMPIRAN ................................................................................................................. vii PENDAHULUAN Latar Belakang......................................................................................................................... 1 Tujuan...................................................................................................................................... 1 TINJAUAN PUSTAKA Generalized Linear Model....................................................................................................... 1 Regresi Poisson ....................................................................................................................... 1 Overdispersi Pada Regresi Poisson ......................................................................................... 1 Regresi Binomial Negatif ........................................................................................................ 2 Goodness of Fits Tests............................................................................................................. 2 BAHAN DAN METODE Bahan....................................................................................................................................... 2 Metode..................................................................................................................................... 2 HASIL DAN PEMBAHASAN Deskripsi Data ......................................................................................................................... 3 Model Regresi Poisson dan Regresi Binomial Negatif............................................................ 5 Goodness of Fits Model........................................................................................................... 6 SIMPULAN DAN SARAN Simpulan.................................................................................................................................. 6 Saran........................................................................................................................................ 7 DAFTAR PUSTAKA ................................................................................................................... 7 LAMPIRAN.................................................................................................................................. 8
DAFTAR TABEL Halaman 1.
Peubah penjelas untuk membangun model ............................................................................ 3
2.
Jumlah SMA negeri dan swasta berdasarkan rayon wilayah ................................................. 3
3.
Nilai rata-rata karakteristik SMA........................................................................................... 4
4.
Deskripsi peubah penjelas...................................................................................................... 5
5.
Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007 .............................................. 5
6.
Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007..................................... 5
7.
Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007 ..................... 6
8.
Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 .......................................................................................................... 6
9.
Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 .......................................................................................................... 6
DAFTAR GAMBAR Halaman 1.
Diagram alur analisis ............................................................................................................. 3
2.
Persentase jumlah siswa tidak lulus UN ................................................................................ 3
3.
Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta ................ 4
DAFTAR LAMPIRAN Halaman 1.
Hasil uji parameter model Regresi Poisson masing-masing tahun ajaran 1.1 Hasil uji parameter model Regresi Poisson tahun ajaran 2005/2006................................ 9 1.2 Hasil uji parameter model Regresi Poisson tahun ajaran 2006/2007................................ 9
2.
Hasil uji parameter model Regresi Binomial Negatif masing-masing tahun ajaran 2.1 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2005/2006 ................ 10 2.2 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2006/2007 ................ 10
1
PENDAHULUAN Latar Belakang Model Regresi Poisson secara umum telah banyak digunakan untuk menganalisis data cacah di mana rata-rata dan ragamnya sama. Akan tetapi kondisi ini jarang sekali ditemukan pada data, sehingga seringkali ditemukan keragaman data lebih besar daripada rata-ratanya. Fenomena seperti ini disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Nasional (UN) di DKI Jakarta. UN merupakan salah satu isu pendidikan yang sering menimbulkan kontroversi dikalangan siswa. Hal ini bermula pada tahun 2003 ketika pemerintah mengubah Evaluasi Belajar Tahap Akhir Nasional (EBTANAS) menjadi UN. Perubahan ini ditujukan agar sumber daya yang dihasilkan lebih berkualitas yaitu dengan memberlakukan standar nilai kelulusan. Jumlah siswa SMA yang tidak lulus UN dapat dikatakan masih cukup tinggi. Sementara itu diketahui bahwa tingkat pendidikan penduduk berkorelasi positif dengan status ekonomi, derajat kesehatan dan laju pertumbuhan penduduk (Depdiknas dalam Wulansari 2008). Hasil penelitian Wulansari (2008) menyatakan secara statistik jumlah siswa yang tidak lulus UN dapat diasumsikan berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, sehingga hubungan antara jumlah siswa yang tidak lulus UN dengan faktor-faktor yang berpengaruh dapat diketahui melalui Regresi Poisson. Tujuan Tujuan dari penelitian ini adalah mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA dalam UN di DKI Jakarta untuk tahun ajaran 2005/2006 dan 2006/2007.
TINJAUAN PUSTAKA Generalized Linear Model Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum untuk respon berdistribusi dalam keluarga eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002)
menyatakan ada tiga komponen dalam GLM yaitu: Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan peluang distribusinya. (komponen Systematic component sistematik) yang ditunjukkan dengan peubah penjelas yang digunakan. Link function ditunjukkan dengan fungsi nilai harapannya sama dengan systematic component. Regresi Poisson Regresi Poisson termasuk ke dalam GLM dan merupakan salah satu bentuk analisis regresi yang digunakan untuk model data cacah (count data) dan data dalam bentuk tabel kontingensi. Model Regresi Poisson kadang dikenal dengan log-linear model, terutama ketika digunakan untuk model tabel kontingensi. Model Regresi Poisson dengan peubah penjelas X dapat dituliskan sebagai berikut (Agresti, 2002) : Log = +x Fungsi peluang sebaran Poisson adalah:
f ( y; )
e y y !
y=0,1,2,....
dengan asumsi E(Y)= Var(Y)=. Fungsi penghubung kanonik (cannonical link function) untuk Regresi Poisson yaitu: g ( ) log( ) ( X ' ) Pendugaan parameter koefisien Regresi Poisson dapat diduga dengan menggunakan Maximum Likelihood Estimation (MLE) melalui iterasi dengan metode Newton Raphson untuk memaksimumkan fungsi loglikelihoodnya L(y,,). Overdispersi pada Regresi Poisson Data cacah untuk Regresi Poisson dikatakan mengandung overdispersi apabila keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Fenomena overdispersi (McCullagh & Nelder, 1983) dapat dituliskan: Var(Y) > E(Y)
2
Overdispersi dapat diindikasikan dengan nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada data. Overdispersi dapat pula terjadi karena adanya pengamatan missing pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, peubah penjelas perlu ditransformasi atau kesalahan spesifikasi link function (Hardin & Hilbe, 2007). Regresi Binomial Negatif Regresi Binomial Negatif merupakan salah satu solusi untuk mengatasi masalah overdispersi pada data cacah yang didasarkan pada model campuran Poisson-Gamma (Hardin & Hilbe, 2007). Fungsi peluang Binomial Negatif adalah sebagai berikut: k y ( y k) k k 1 f ( y, k, ) (k)( y 1) k k y=0,1,2,.... di mana k dan adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut parameter dispersi. Goodness Of Fit Tests Ismail dan Jemain (2007) menyatakan bahwa goodness of fits model Regresi Poisson dan Regresi Binomial Negatif dapat dilihat dari nilai Pearson Chi-squares, Deviance, AIC BSC (Akaike Information Criterion), (Bayesian Schwartz Information Criterion) dan nilai Likelihood Ratio statistics. Nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya menunjukkan model yang lebih baik. Sedangkan nilai AIC dan BSC yang lebih kecil menujukkan model yang lebih baik dan untuk nilai Likelihood Ratio Statistics yang menunjukkan Tolak H0 berarti model tersebut yang lebih baik, karena mengindikasikan adanya overdispersi pada data. Famoye, Wulu & Singh (2004) menyatakan untuk goodness of fits dapat pula digunakan nilai log-likelihood di mana model dengan nilai log-likelihood yang lebih besar menunjukkan model yang lebih baik.
BAHAN DAN METODE Bahan Data yang digunakan dalam penelitian ini adalah data sekunder jumlah kelulusan siswa tiap SMA di DKI Jakarta yang diperoleh dari Dinas Pendidikan Menengah dan Tinggi (DIKMENTI) Propinsi DKI Jakarta. Peubah respon yang diamati adalah jumlah siswa yang tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1. Pada penelitian ini untuk membangun model dimasukkan pula peubah offset, yaitu suatu peubah penjelas yang dimasukkan ke dalam model namun nilai koefisiennya tidak diestimasi tapi diasumsikan nilainya sama dengan 1 dan biasanya nilainya bervariasi dari satu observasi ke observasi lain. Peubah yang digunakan sebagai peubah offset adalah jumlah peserta UN. Metode Tahapan metode yang dilakukan dalam penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan adalah sebagai berikut : 1. Analisis statistika deskriptif jumlah siswa tidak lulus UN per rayon wilayah. 2. Deskripsi peubah penjelas untuk mendapatkan karakteristik SMA pada masing-masing tahun ajaran. 3. Pendeteksian overdispersi pada data dengan melihat nilai Pearson Chi-squares dan Deviance yang dibagi dengan derajat bebasnya. 4. Melakukan analisis Regresi Poisson dan Regresi Binomial Negatif untuk mengetahui faktor-faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN. 5. Interpretasi model Regresi Poisson dan Regresi Binomial Negatif. 6. Identifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, BSC, Pearson Chi-squares, Deviance, Likelihood ratio dalam statistics dan log-likelihood permasalahan overdispersi. Software yang digunakan dalam penelitian ini adalah Microsoft Excel 2007, SPSS 15, Stata 10 dan SAS 9.1.
3
Data Jumlah siswa tidak lulus (Y)
13 Peubah penjelas (X1,…,X13)
Deskripsi data
Deteksi Overdispersi
Analisis Regresi Poisson
Analisis Regresi Binomial Negatif
Gambar 1. Diagram alur analisis
HASIL DAN PEMBAHASAN Deskripsi Data Banyaknya SMA di DKI Jakarta terhitung sebanyak 497 sekolah yang terdiri dari 116 SMA negeri dan 381 SMA swasta dengan distribusi jumlah SMA pada masing-masing rayon wilayah dapat dilihat pada Tabel 2. Persentase jumlah siswa yang tidak lulus UN untuk tahun ajaran 2005/2006 tercatat sebesar 5.61% lebih besar dibandingkan tahun ajaran 2006/2007 yang hanya sebesar 3.67% (Gambar 2). Tabel 2. Jumlah SMA negeri dan swasta berdasarkan rayon wilayah Rayon Negeri Swasta Wilayah Jakarta Barat 17 97 Jakarta Pusat 13 60 Jakarta Selatan 29 67 Jakarta Timur 39 95 Jakarta Utara 17 62 Kepulauan 1 0 Seribu Jumlah 116 381
Persentase Jumlah Siswa Tidak Lulus
Tabel 1. Peubah penjelas untuk membangun model Peubah Penjelas Simbol Kategori Jumlah peserta Peubah UN offset Negeri=1, Status SMA X1 Swasta=2 A=1, B=2, Akreditasi SMA X2 C=3 Rata-rata jumlah Numerik X3 siswa per kelas Jumlah ruang Numerik kelas dengan X4 kondisi baik Jumlah ruang Numerik kelas dengan X5 kondisi rusak ringan Numerik Jumlah ruang kelas dengan X6 kondisi rusak berat Jumlah ruang Numerik X7 kelas bukan milik Jumlah Numerik X8 laboratorium IPA Jumlah Numerik laboratorium X9 bahasa Jumlah Numerik laboratorium X10 komputer Jumlah Numerik X11 laboratorium IPS Jumlah Numerik X12 perpustakaan Jumlah guru Numerik X13
6% 5% 4% 3% 2% 1% 0%
5.61% 3.76%
2005/2006
2006/2007
Gambar 2. Persentase jumlah siswa tidak lulus UN Distribusi jumlah siswa tidak lulus UN tahun ajaran 2005/2006 dan 2006/2007 untuk tiap rayon wilayah di DKI Jakarta memperlihatkan jumlah siswa tidak lulus terbesar terjadi pada tahun ajaran 2005/2006 (Gambar 3). Ketidaklulusan tertinggi terjadi pada rayon Jakarta Pusat untuk tahun ajaran 2005/2006, sedangkan untuk tahun ajaran 2006/2007 ketidaklulusan tertinggi terjadi pada rayon Jakarta Timur.
4
Ju m la h S isw a T id a k Lu lu s
1400 1200 1000 800 600 400
2005/2006
200
2006/2007
0
Rayon Wilayah
Gambar 3. Grafik distribusi jumlah siswa tidak lulus UN tiap rayon wilayah di DKI Jakarta Karakteristik untuk masing-masing tahun ajaran berdasarkan peubah penjelas secara lengkap dapat dilihat pada Tabel 3 dan Tabel 4. Tahun ajaran 2005/2006 Karakteristik tahun ajaran 2005/2006 menunjukkan bahwa rata-rata jumlah siswa tidak lulus UN lebih tinggi daripada tahun ajaran 2006/2007. Kebanyakan SMA negeri pada tahun ajaran ini terakreditasi A, hanya satu yang terkreditasi B dan tidak ada SMA negeri yang terakreditasi C. Sedangkan untuk SMA swasta banyaknya SMA terakreditasi A dan B tidak berbeda jauh dan hanya 16 SMA swasta yang terakreditasi C. Rata-rata Log dari jumlah peserta UN lebih besar dibandingkan tahun ajaran 2006/2007. Rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2006/2007. Tahun Ajaran 2006/2007 Karakteristik pada tahun ajaran 2006/2007 menunjukkan bahwa jumlah siswa tidak lulus UN lebih rendah daripada tahun ajaran 2005/2006. Seluruh SMA negeri pada tahun ajaran ini terakreditasi A, sedangkan banyaknya SMA swasta yang terkreditasi A, B dan C tidak jauh berbeda dengan tahun ajaran 2005/2006. Rata-rata Log dari jumlah peserta UN lebih kecil dibanding tahun ajaran 2005/2006. Rata-rata jumlah siswa per kelas,
jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru hampir sama dengan tahun ajaran 2005/2006. Tabel 3. Nilai rata-rata karakteristik SMA Rata-rata Karakteristik SMA 2005/2006 2006/2007 Jumlah siswa 5.64 4.51 tidak lulus Rata-rata jumlah siswa 28.54 28.20 per kelas Jumlah ruang kelas dengan 13.58 13.46 kondisi baik Jumlah ruang kelas dengan 0.25 0.25 kondisi rusak ringan Jumlah ruang kelas dengan 0.05 0.05 kondisi rusak berat Jumlah ruang kelas bukan 0.11 0.11 milik Jumlah laboratorium 0.57 0.57 IPA Jumlah laboratorium 0.52 0.52 Bahasa Jumlah laboratorium 0.82 0.81 Komputer Jumlah laboratorium 0.17 0.17 IPS Jumlah 0.92 0.93 perpustakaan Jumlah guru 32.41 32.12 Peserta (Offset) 4.5287 4.4176
5
Tabel 4. Deskripsi peubah penjelas Tahu Akr n Status Juml edit Ajara SMA ah asi n A 99 Negeri B 1 C 0 2005/ 2006 A 151 Swasta B 114 C 16 A 100 Negeri B 0 C 0 2006/ 2007 A 159 Swasta B 115 C 15
% 25.98% 0.26% 0% 39.63% 29.92% 4.2% 25.71% 0% 0% 40.87% 29.56% 3.86%
Model Regresi Poisson dan Regresi Binomial Negatif Overdispersi terjadi pada data tahun ajaran 2005/2006 dan 2006/2007 yang ditunjukkan oleh nilai Pearson Chi-squares dan Deviance dibagi dengan derajat bebas bernilai lebih dari 1 (Tabel 5). Tabel 5. Hasil uji overdispersi tahun ajaran 2005/2006 dan 2006/2007 Tahun Pearson Deviance Ajaran Chi-squares 2005/2006 12.190 9.270 2006/2007 15.119 9.311 Model Regresi Poisson untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 6 dengan taraf nyata yang digunakan =10%. Hasil analisis dari uji koefisien parameter Regresi Poisson disajikan pada Lampiran 3.1 dan Lampiran 3.2. Berdasarkan hasil analisis dari Uji Wald untuk koefisien parameter Regresi Poisson model tahun ajaran 2005/2006 faktor eksternal yang berpengaruh terhadap jumlah siswa yang tidak lulus UN adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, jumlah laboratorium bahasa dan jumlah guru. Sedangkan untuk model tahun ajaran 2006/2007 faktor eksternal yang berpengaruh adalah status SMA, akreditasi SMA, rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi baik, jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas bukan milik, jumlah laboratorium IPA, jumlah laboratorium bahasa, jumlah
laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Pada Tabel 6 terlihat bahwa nilai dugaan parameter model tahun ajaran 2005/2006 untuk rata-rata jumlah siswa per kelas, jumlah ruang kelas dengan kondisi rusak berat, jumlah ruang kelas bukan milik, laboratorium bahasa dan jumlah guru bernilai negatif. Hal ini menunjukkan bahwa hubungan antara peubah-peubah tersebut dengan log rata-rata dari jumlah siswa tidak lulus UN berbanding terbalik dan berlaku sebaliknya untuk nilai dugaan parameter yang bernilai positif. Hasil dari model Regresi Poisson ini dibandingkan dengan model Regresi Binomial Negatif. Tabel 6. Persamaan Regresi Poisson tahun ajaran 2005/2006 dan 2006/2007 Tahun Model Regresi Poisson Ajaran Log()= -1.435 -0.187 X1(1) + 0.696 X2(3) - 0.012 2005/2006 X3 - 0.212 X6 0.055 X7 - 0.319 X9 - 0.028 X13 Log()= -3.514 + 0.34 X1(1) + 1.202 X3(3) + 1.085 X3 (2) + 0.023 X4 - 0.013 X5 0.056 X6 + 0.074 2006/2007 X8 + 0.287 X9 + 0.178 X10 + 0.268 X11 – 1.05 X12 – 0.356 X13 - 0.027 X14 Model Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan tahun 2006/2007 dapat dilihat pada Tabel 7. Hasil analisis dari uji koefisien parameter Regresi Binomial Negatif disajikan pada Lampiran 4.1 dan Lampiran 4.2. Akreditasi dan jumlah guru merupakan faktor eksternal yang berpengaruh terhadap ketidaklulusan siswa dalam UN untuk kedua tahun ajaran. Faktor jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru merupakan faktor eksternal lainnya yang berpengaruh pula untuk tahun ajaran 2006/2007. Tidak berpengaruhnya jumlah ruang kelas dengan kondisi rusak ringan, jumlah ruang kelas dengan kondisi rusak berat dan jumlah ruang kelas bukan milik disebabkan karena hampir sebagian besar SMA di DKI Jakarta tidak memiliki ruang kelas dengan kondisi tersebut.
6
Tabel 7. Persamaan Regresi Binomial Negatif tahun ajaran 2005/2006 dan 2006/2007 Tahun Model Regresi Ajaran Binomial Negatif Log()= -1.6487 + 0.760 2005/2006 X2(3) – 0.028 X13 Log()= -1.8568 + 0.8267 X2(2) + 1.0729 X2(3) - 0.0220 X4 + 2006/2007 0.3232 X10 - 0.8312 X11 - 0.5850 X12 0.0440 X13 Dari Tabel 7 terlihat bahwa untuk model tahun ajaran 2005/2006 nilai dugaan parameter untuk jumlah guru bernilai negatif yang berarti hubungan antara log rata-rata jumlah siswa tidak lulus UN dengan jumlah guru berbanding terbalik. Jika terjadi kenaikan jumlah guru maka log rata-rata jumlah siswa tidak lulus akan menurun. Begitu pula berlaku sebaliknya untuk nilai dugaan parameter akreditasi SMA yang bernilai positif. Model Regresi Poisson menghasilkan hampir semua peubah penjelas berpengaruh terhadap jumlah siswa tidak lulus UN sedangkan pada model Regresi Binomial Negatif menunjukkan hal yang sebaliknya. Hal ini menunjukkan bahwa Regresi Binomial Negatif memberikan hasil uji signifikansi peubah penjelas yang lebih berarti dibanding Regresi Poisson sebagai akibat adanya overdispersi pada data. Goodness of Fits Model Kebaikan model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/ 2006 dan 2006/2007 dapat dilihat pada Tabel 8 dan Tabel 9. Untuk mendapatkan model yang terbaik dapat dilihat dari nilai AIC dan BSC yang paling kecil, nilai Pearson Chi-squares dan Deviance yang lebih mendekati derajat bebasnya dan nilai log-likelihood yang lebih besar. Pada Tabel 8 dan Tabel 9 terlihat bahwa hasil pemodelan faktor eksternal terhadap jumlah siswa tidak lulus UN dengan Regresi Binomial Negatif memenuhi kriteria yang telah disebutkan sehingga dapat dikatakan model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson untuk mengatasi permasalahan overdispersi. Nilai pvalue dari Likelihood ratio test model Regresi Binomial Negatif untuk tahun ajaran 2005/2006 dan 2006/2007 yaitu 0.0000 (pvalue < =10%) atau Tolak H0 dan
disimpulkan bahwa terjadi overdispersi pada data. Tabel 8. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2005/2006 Goodness Regresi Regresi of Fits Binomial Poisson Statitics Negatif AIC 4335.053 2047.444 BSC 4394.195 2110.528 Pearson 4475.605 397.7475 Chi-squares Deviance 3392.256 414.8415 Log-2152.526 -1007.7218 likelihood Likelihood 908.104 78.12 ratio (p-value = (p-value = statistics 0.0000 0.0000) Tabel 9. Goodness of fits statistics model Regresi Poisson dan Regresi Binomial Negatif tahun ajaran 2006/2007 Goodness Regresi Regresi of Fits Binomial Poisson Statitics Negatif AIC 4211.490 1738.708 BSC 4212.490 1802.125 Pearson 5654.693 438.3615 Chi-squares Deviance 3482.492 374.3787 Log-2090.745 -853.35393 likelihood Likelihood 2021.192 96.37 ratio (p-value = (p-value = statistics 0.0000 0.0000)
SIMPULAN DAN SARAN Simpulan Faktor eksternal yang berpengaruh terhadap jumlah siswa tidak lulus untuk tahun ajaran 2005/2006 adalah akreditasi SMA dan jumlah guru. Sedangkan untuk tahun ajaran 2006/2007 faktor eksternal yang berpengaruh antara lain akreditasi SMA, jumlah ruang kelas dengan kondisi baik, jumlah laboratorium komputer, jumlah laboratorium IPS, jumlah perpustakaan dan jumlah guru. Model Regresi Binomial Negatif merupakan salah satu solusi yang dapat digunakan untuk mengatasi permasalahan dalam data yang mengandung overdispersi.
7
Hal ini ditunjukkan dengan terpenuhinya kriteria kebaikan modelnya yaitu nilai AIC dan BSC yang paling kecil, nilai Pearson Chisquares dan Deviance yang lebih mendekati derajat bebasnya, nilai log-likelihood yang lebih besar dan nilai likelihood ratio tests yang menunjukkan Tolak H0. Saran Beberapa solusi lain yang dapat digunakan untuk mengatasi permasalahan overdispersi yaitu dengan Quasi-Likelihood dan Generalized Poisson Regression. Untuk penelitian selanjutnya dapat dibandingkan beberapa metode tersebut untuk mengetahui metode mana yang dapat memberikan tingkat akurasi yang cukup tinggi.
DAFTAR PUSTAKA Agresti A. 2002. Categorical Data Analysis. John Wiley & Sons, Inc. Ismail N & AA. Jemain. 2007. Handling Overdispersion with Binomial Negative and Generalized Poisson Regression Models. Casualty Actuarial Society Forum Casualty Actuarial Society – Arlington:Virginia:Winter, 103-158. http://www.casact.org/pubs/forum/07wfo rum/07w109.pdf. [29 April 2008] Famoye F, Wulu JT., Singh KP. 2004. On The Generalized Poisson Regression Model with An Apllication to Accident Data. Journal of Data Science 2, 287-295. Hardin JW, JM Hilbe. 2007. Generalized Linear Models and Extensions. Texas: A Stata Press Publication McCullagh P & JA Nelder. 1983. Generalized Linear Models. London: Chapmann and Hall. Wulansari, AD. 2008. Aplikasi Poisson Regression [abstrak]. Institut Teknologi Sepuluh November. http://berbagi.net/perlukah-/aplikasipoisson-regression-13.html. [25 April 2008]
LAMPIRAN
9
Lampiran 1. Hasil uji parameter model Regresi Poisson masing-masing tahun ajaran Lampiran 1.1 Hasil uji parameter model Regresi Poisson tahun ajaran 2005/2006 95% Wald Hypothesis Test Confidence Interval Std. Parameter B Wald Error Lower Upper Chidf Sig. Square (Intercept) -1.435 0.1689 -1.766 -1.104 72.247 1 0.000 Swasta -0.187 0.0808 -0.346 -0.029 5.381 1 0.020 C 0.696 0.1207 0.459 0.932 33.189 1 0.000 B 0.070 0.0619 -0.051 0.192 1.288 1 0.256 Rata-rata jumlah -0.012 0.0033 -0.018 -0.006 13.790 1 0.000 siswa per kelas Baik -0.002 0.0032 -0.008 0.005 0.290 1 0.590 Rusak ringan -0.008 0.0141 -0.035 0.020 0.302 1 0.583 Berat -0.212 0.0981 -0.404 -0.020 4.682 1 0.030 Bukan Milik -0.055 0.0285 -0.111 0.001 3.687 1 0.055 Lab IPA -0.041 0.0345 -0.108 0.027 1.398 1 0.237 Lab Bahasa -0.319 0.0504 -0.417 -0.220 40.026 1 0.000 Lab Komputer 0.017 0.0423 -0.066 0.100 0.169 1 0.681 Lab IPS 0.008 0.0652 -0.119 0.136 0.017 1 0.898 Perpustakaan 0.028 0.0804 -0.130 0.186 0.122 1 0.727 Jumlah guru -0.028 0.0027 -0.033 -0.022 102.494 1 0.000 (Scale) 1 Lampiran 1.2 Hasil uji parameter model Regresi Poisson tahun ajaran 2006/2007 95% Wald Hypothesis Test Confidence Interval Std. Parameter B Wald Error Lower Upper Chidf Sig. Square (Intercept) -3.514 0.1725 -3.852 -3.176 415.070 1 0.000 Swasta 0.340 0.0978 0.148 0.531 12.073 1 0.001 C 1.202 0.1422 0.923 1.480 71.437 1 0.000 B 1.085 0.0637 0.960 1.209 290.059 1 0.000 Rata-rata jumlah 0.023 0.0033 0.017 0.030 49.151 1 0.000 siswa per kelas Baik -0.013 0.0043 -0.022 -0.005 9.411 1 0.002 Rusak ringan -0.056 0.0256 -0.106 -0.005 4.711 1 0.030 Berat -0.020 0.0719 -0.161 0.121 0.076 1 0.783 Bukan Milik 0.074 0.0121 0.050 0.098 37.114 1 0.000 Lab IPA 0.287 0.0292 0.230 0.345 96.831 1 0.000 Lab Bahasa 0.178 0.0535 0.073 0.283 11.092 1 0.001 Lab Komputer 0.268 0.0490 0.172 0.364 29.990 1 0.000 Lab IPS -1.050 0.1085 -1.262 -0.837 93.544 1 0.000 Perpustakaan -0.356 0.0811 -0.515 -0.197 19.303 1 0.000 Jumlah guru -0.027 0.0034 -0.034 -0.021 65.691 1 0.000 (Scale) 1
10
Lampiran 2. Hasil uji parameter model Regresi Binomial Negatif masing-masing tahun ajaran Lampiran 2.1 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2005/2006 95% Wald Confidence Hypothesis Test Interval Std. Parameter B Wald Error Lower Upper Chidf Sig. Square (Intercept) -1.6487 0.6101 -2.8445 -0.4529 -2.70 1 0.007 Swasta -0.235 0.2827 -0.7890 0.3192 -0.83 1 0.406 C 0.760 0.4355 -0.0933 1.6137 1.75 1 0.081 B 0.250 0.2127 -0.1670 0.6668 1.18 1 0.240 Rata-rata jumlah siswa -0.009 0.0105 -0.0299 0.0113 -0.89 1 0.375 per kelas Baik -0.007 0.0107 -0.0275 0.0144 -0.61 1 0.541 Rusak ringan 0.018 0.0762 -0.1311 0.1677 0.24 1 0.811 Berat -0.171 0.1925 -0.5487 0.2060 -0.89 1 0.373 Bukan Milik -0.100 0.0833 -0.2636 0.0629 -1.20 1 0.228 Lab IPA -0.062 0.1316 -0.3197 0.1963 -0.47 1 0.639 Lab Bahasa -0.216 0.1842 -0.5770 0.1451 -1.17 1 0.241 Lab Komputer 0.133 0.1520 -0.1649 0.4310 0.88 1 0.381 Lab IPS -0.257 0.2271 -0.7017 0.1885 -1.13 1 0.259 Perpustakaan 0.165 0.2816 -0.3867 0.7170 0.59 1 0.557 Jumlah guru -0.028 0.0089 -0.0455 -0.0105 -3.14 1 0.002 (Scale) 1.906 0.1664 1.6061 2.2616 Lampiran 2.2 Hasil uji parameter model Regresi Binomial Negatif tahun ajaran 2006/2007 95% Wald Confidence Hypothesis Test Interval Std. Parameter B Wald Error Lower Upper Chidf Sig. Square (Intercept) -1.8568 0.6260 -3.0838 -0.6298 -2.97 1 0.003 Swasta -0.2397 0.3707 -0.9663 0.4869 -0.65 1 0.518 C 1.0729 0.5361 0.0222 2.1236 2.00 1 0.045 B 0.8267 0.2461 0.3444 1.3091 3.36 1 0.001 Rata-rata jumlah siswa 0.0219 0.0137 -0.0049 0.0488 1.60 1 0.109 per kelas Baik -0.0220 0.0134 -0.0482 0.0042 -1.65 1 0.099 Rusak ringan -0.0748 0.0666 -0.2054 0.0558 -1.12 1 0.262 Berat 0.0298 0.1890 -0.3407 0.4003 0.16 1 0.875 Bukan Milik 0.0105 0.1028 -0.1909 0.2120 0.10 1 0.919 Lab IPA 0.1139 0.1487 -0.1775 0.4053 0.77 1 0.443 Lab Bahasa -0.0153 0.2258 -0.4579 0.4273 -0.07 1 0.946 Lab Komputer 0.3232 0.1867 -0.0427 0.6891 1.73 1 0.083 Lab IPS -0.8312 0.2792 -1.3784 -0.2840 -2.98 1 0.003 Perpustakaan -0.5850 0.3451 -1.2613 0.0913 -1.70 1 0.090 Jumlah guru -0.0440 0.0114 -0.0662 -0.0217 -3.87 1 0.000 (Scale) 2.9955 0.2824 2.4901 3.6035