PENERAPAN REGRESI LOGISTIK BINER MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA TAHUN 2008/2009 (Studi Kasus : Fakultas MIPA IPB)
ISNA HUSNIYATI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010
RINGKASAN ISNA HUSNIYATI. Penerapan Regresi Logistik Biner Multilevel terhadap Nilai Akhir Metode Statistika Tahun 2008/2009 (Studi Kasus : Fakultas MIPA IPB). Dibimbing oleh AUNUDDIN dan INDAHWATI. Kelas-kelas paralel pada mata kuliah Metode Statistika membentuk suatu struktur hirarki, dimana mahasiswa sebagai level kesatu tersarang pada kelas paralel sebagai level kedua. Pada penelitian ini regresi logistik biner multilevel diterapkan terhadap nilai akhir Metode Statistika dengan dua kategori huruf mutu, yaitu kategori I adalah kategori baik (huruf mutu A dan B) serta kategori II adalah kategori cukup dan kurang (huruf mutu C, D dan E). Faktor-faktor yang berpengaruh terhadap kategori nilai akhir Metode Statistika pada level mahasiswa adalah IPK TPB dan jenis kelamin, sedangkan pada level kelas paralel faktor yang berpengaruh adalah persentase nilai Pengantar Matematika minimal B. Pengaruh IPK TPB terhadap kategori huruf mutu berbeda antar kelas paralel dengan keragaman intersep dan kemiringan IPKTPB pada fungsi logit antar kelas paralel, yaitu berturut –turut sebesar 31,0908 dan 2,0558. Penyisihan kelas Kimia yang cenderung aneh pada analisis menyebabkan perbedaan antar kelas karena pengaruh IPK TPB menjadi lebih kecil . Mahasiswa perempuan mempunyai kecenderungan mendapat nilai A dan B lebih besar 1,84 kali dibandingkan mahasiswa laki-laki, sedangkan setiap kenaikan IPK TPB 0,1 satuan diikuti dengan bertambahnya kecenderungan mahasiswa mendapat nilai kategori A dan B sebesar 1,37 kali. Kata kunci : Struktur hirarki, Regresi logistik biner multilevel
PENERAPAN REGRESI LOGISTIK BINER MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA TAHUN 2008/2009 (Studi Kasus : Fakultas MIPA IPB)
ISNA HUSNIYATI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2010
Judul Skripsi :
Nama NIM
: :
Penerapan Regresi Logistik Biner Multilevel terhadap Nilai Akhir Metode Statistika Tahun 2008/2009 (Studi Kasus : Fakultas MIPA IPB) Isna Husniyati G14051800
Menyetujui Pembimbing I,
Pembimbing II,
(Prof. Dr. Ir. Aunuddin, M.Sc) NIP : 130354141
(Ir. Indahwati, M.Si) NIP : 196507121990032002
Mengetahui : Ketua Departemen,
(Dr. Ir. Hari Wijayanto, M.Si) NIP : 196504211990021001
Tanggal Lulus :
KATA PENGANTAR Alhamdulillahirobbil’alamin. Puji dan Syukur penulis panjatkan kehadirat Allah SWT atas limpahan rahmat dan karunia Nya sehingga penulisan karya ilmiah ini berhasil diselesaikan. Judul karya ilmiah ini adalah Penerapan Regresi Logistik Biner Multilevel terhadap Nilai Akhir Metode Statistika tahun 2008/2009 (Studi Kasus : Fakultas MIPA IPB). Karya ilmiah ini merupakan salah satu syarat kelulusan yang harus dipenuhi mahasiswa untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Ucapan terimakasih penulis sampaikan kepada Bapak Prof. Dr. Ir. Aunuddin, M.Sc dan Ibu Ir. Indahwati, M.Si selaku pembimbing atas segala bantuan, saran, kritik, dan waktu yang telah diberikan selama proses penulisan karya ilmiah ini. Selain itu terima kasih juga penulis sampaikan untuk: 1. Seluruh dosen di Departemen Statistika FMIPA IPB yang telah memberikan bekal ilmu dan wawasan selama penulis menuntut ilmu di Departemen Statistika IPB. 2. Bapak, ibu, dan seluruh keluarga atas doa, kasih sayang, dukungan serta semangat yang diberikan selama ini. 3. Copa yang telah memberikan kasih sayang, dukungan, serta semangatnya 4. Miu, Wiwi, Momon, dan Melisa atas masukan dan sarannya selama ini. 5. Sofi, Eva, Niar, Ame dan semua CSS 42 atas persahabatan kalian selama ini. 6. Seluruh staf Departemen Statistika, Pak Iyan, Bu Markonah, Bu Try, Bu Aat, Bu Sulis, Bu Dedeh, Mang Sudin, Mang Ndur, mang Herman dan Pak Edi atas bantuan dan keramahannya. 7. Seluruh teman-teman di Statistika 42 atas bantuan, semangat, keceriaan dan kebersamaannya selama ini. 8. Kakak-kakak dan teman-teman STK 40, 41, 43, 44 atas keceriannya. 9. Semua pihak yang tidak mungkin disebutkan satu per satu. Semoga semua amal baik dan bantuan yang telah diberikan kepada penulis mendapat balasan dari Allah SWT, dan semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan. Penulis mohon maaf atas segala kekurangan dan kesalahan yang terdapat di dalam penyusunan karya ilmiah ini.
Bogor, Februari 2010
Penulis
RIWAYAT HIDUP Penulis dilahirkan di Kudus, pada tanggal 23 September 1987 dari Bapak Sugeng Subagyo dan Ibu Dewi Kholifah. Penulis merupakan putri kedua dari empat bersaudara. Penulis memulai pendidikannya di SD Negeri Jurang I Gebog Kudus dan lulus pada tahun 1999. Kemudian penulis melanjutkan pendidikan di MTs Banat Kudus hingga tahun 2002. Setelah menyelesaikan studinya di MA Banat Kudus pada tahun 2005, penulis diterima sebagai mahasiswa Institut Pertanian Bogor (IPB) melalui jalur Beasiswa Utusan Daerah (BUD) dari Departemen Agama. Selama satu tahun pertama, penulis harus melalui Tahap Persiapan Bersama (TPB). Pada tahun 2006, penulis diterima sebagai mahasiswa Departemen Statistika dengan mayor Statistika dan minor Ekonomi Pertanian. Selama kuliah, penulis aktif dalam organisasi kemahasiswaan yaitu anggota divisi HRD Himpunan profesi Gamma Sigma Beta (GSB) pada tahun 2008-2009. Penulis juga aktif dalam kegiatan kemahasiswaan yang diadakan oleh Departemen Statistika maupun Fakultas, antara lain Pesta Sains 2007, Statistika Ria 2007, Pesta Sains 2008, dan Welcome Ceremony Statistics (WCS) 2008. Penulis melakukan kegiatan praktik lapang di Pusat Sosial Ekonomi dan Kebijakan Pertanian Bogor pada bulan Februari-April 2009.
DAFTAR ISI Halaman
DAFTAR TABEL .................................................................................................................... vii DAFTAR GAMBAR ................................................................................................................. vii DAFTAR LAMPIRAN .............................................................................................................. vii PENDAHULUAN Latar Belakang ...................................................................................................................... 1 Tujuan .................................................................................................................................. 1 TINJAUAN PUSTAKA Regresi Multilevel .................................................................................................................. 1 Regresi Logistik Biner satu level ............................................................................................ 1 Regresi Logistik Biner Multilevel ........................................................................................... 2 Pemilihan Model Multilevel Terbaik....................................................................................... 2 Pengujian Hipotesis ................................................................................................................ 3 Interpretasi Koefisien ............................................................................................................ 3 BAHAN DAN METODE Bahan..................................................................................................................................... 3 Metode ................................................................................................................................... 4 HASIL DAN PEMBAHASAN Deskripsi Data........................................................................................................................ 4 Regresi Logistik Biner satu level ............................................................................................ 5 Regresi Logistik Biner Multilevel ........................................................................................... 5 Pemilihan Model Terbaik ....................................................................................................... 7 Interpretasi Koefisien ............................................................................................................. 7 KESIMPULAN Kesimpulan ............................................................................................................................ 7 DAFTAR PUSTAKA .................................................................................................................. 8 LAMPIRAN ................................................................................................................................ 9
vii
DAFTAR TABEL Halaman
1 Persentase kategori nilai akhir mahasiswa yang berupa huruf mutu................................................. 4 2 Hasil pendugaan parameter menggunakan regresi logistik biner satu level ................................... 5 3 Hasil uji perbandingan pada model intersep acak ............................................................................... 5 4 Hasil pendugaan parameter tetap model intersep acak terbaik ......................................................... 6 5 Hasil uji pemilihan efek kemiringan acak ............................................................................................ 6 6 Hasil pendugaan parameter tetap model dengan penambahan interaksi peubah penjelas pada level yang berbeda ..................................................................................................................................... 6 7 Hasil pendugaan parameter tetap model akhir ...................................................................................... 6 8 Hasil pendugaan parameter tetap model akhir yang direduksi........................................................... 6 9 Hasil uji perbandingan model untuk memperoleh model terbaik ...................................................... 7 10 Rasio odds peubah penjelas yang nyata ................................................................................................. 7
DAFTAR GAMBAR Halaman 1
Struktur data nilai akhir mahasiswa FMIPA ........................................................................................ 4
2
Persentase kategori nilai mahasiswa pada masing-masing kelas paralel........................................ 4
DAFTAR LAMPIRAN Halaman
1
Deskripsi nilai peubah penjelas untuk setiap kelas paralel ............................................................. 10
2
Deskripsi hubungan antara kategori nilai akhir dengan peubah penjelas ..................................... 10
3
Plot interaksi peubah penjelas pada level yang sama maupun pada level yang berbeda ........... 12
4
Plot regresi logistik satu level untuk semua dan masing- masing kelas paralel dengan peubah penjelas IPK TPB ................................................................................................................................... 13
5
Syntax program paket R versi 2. 10. 0................................................................................................ 14
1
PENDAHULUAN Latar Belakang Pemodelan multilevel merupakan suatu teknik statistika untuk menganalisis data dengan struktur hirarki. Struktur hirarki mengindikasikan bahwa data yang dianalisis terdiri dari beberapa level, dimana level yang lebih rendah tersarang dalam level yang lebih tinggi. Alasan diperlukannya analisis multilevel adalah karena dalam struktur hirarki individu-individu dalam kelompok yang sama cenderung mirip, sehingga antar amatan pada level yang lebih rendah tidak saling bebas. Penelitian mengenai pemodelan multilevel diantaranya telah dilakukan oleh Tantular (2009) dan Widiyani (2009) terhadap data berbentuk kontinu yang menyebar normal. Pada beberapa kasus adakalanya data struktur hirarki berupa data kategori yang menyebar binomial, sehingga hasil penelitian yang dilakukan oleh Tantular dan Widiyani tidak sesuai jika diterapkan. Pada data kategori, model multilevel yang dapat diterapkan adalah model multilevel logistik. Apabila peubah respon terdiri dari dua kategori yaitu Y=1 (sukses) dan Y=0 (gagal) maka metode regresi multilevel yang sesuai adalah regresi logistik biner multilevel. Kelas-kelas paralel pada mata kuliah Metode Statistika membentuk suatu struktur hirarki, dimana mahasiswa sebagai level kesatu yang tersarang pada kelas paralel sebagai level kedua. Pada penelitian ini regresi logistik biner multilevel diterapkan terhadap nilai akhir Metode Statistika dengan dua kategori huruf mutu, yaitu kategori I adalah kategori baik (huruf mutu A dan B) serta kategori II adalah kategori cukup dan kurang (huruf mutu C, D dan E). Tujuan Menerapkan model regresi logistik biner multilevel untuk mengetahui faktor-faktor yang berpengaruh terhadap kategori nilai akhir Metode Statistika dan menduga komponen ragam dari model yang diperoleh. TINJAUAN PUSTAKA Regresi Multilevel Model multilevel digunakan untuk data dengan struktur hirarki. Model paling sederhana adalah model dua level dimana level pertama merupakan data individu dan level kedua adalah data kelompok. Sebagai
contoh adalah mahasiswa (level pertama) yang berada pada kelas paralel (level kedua). Secara umum model regresi multilevel mempunyai struktur data hirarki yaitu: 1. Sebuah peubah tak bebas yang diukur pada level paling bawah (level 1) 2. Beberapa peubah penjelas yang diukur pada setiap level Pada regresi biasa intersep dan kemiringan untuk setiap kelompok nilainya sama (fixed), sedangkan pada model multilevel intersep maupun kemiringan untuk setiap kelompok nilainya bisa berbeda (random), sehingga dapat dilihat keragaman antar kelompok (Goldstein, 1995). Regresi Logistik Biner Satu level Regresi logistik adalah suatu analisis statistika yang mendeskripsikan hubungan antara peubah respon yang memiliki dua kategori atau lebih dengan satu atau lebih peubah penjelas yang berskala kategori atau kontinu (Hosmer dan Lemeshow, 2000). Model regresi logistik biner digunakan pada peubah respon yang bersifat biner. Untuk satu kejadian peubah respon Y mengikuti sebaran Bernoulli dengan fungsi sebaran peluang :
dengan yi = {0,1} dan i adalah peluang kejadian ke-i bernilai Y=1. Jika kejadian peubah respon Y berjumlah n dan setiap kejadian saling bebas dengan yang lain maka Y akan mengikuti sebaran Binomial. Hosmer dan Lemeshow (2000) menjelaskan bahwa model regresi logistik dengan E(Y = 1 | x) sebagai (x) adalah:
Dalam regresi logistik diperlukan fungsi penghubung logit, transformasi logit sebagai fungsi dari (x) adalah:
Untuk peubah bebas bersifat kategori, maka diperlukan peubah boneka (dummy variable). Secara umum jika sebuah peubah skala nominal atau ordinal mempunyai k kemungkinan nilai, maka diperlukan k - 1 peubah boneka. Pendugaan parameter pada regresi logistik adalah menggunakan metode kemungkinan maksimum (maximum likelihood). Metode ini dapat dilakukan jika antara amatan yang satu
2
dengan yang lain diasumsikan saling bebas, maka fungsi kemungkinan maksimumnya adalah:
dengan: i = 1, 2, ..., p yi = pengamatan pada peubah penjelas ke-i (xi ) = peluang sukses untuk peubah penjelas ke-i diduga dengan memaksimumkan i dengan pendekatan logaritma sehingga fungsi log-likelihood-nya sebagai berikut:
1−
1− ( )
Selanjutnya dibuat turunan pertama L( ) terhadap i = 0, dengan i = 1, 2, 3, ..., p dan diperoleh berdasarkan proses iterasi dengan bantuan paket R versi 2.10. 0. Regresi Logistik Biner Multilevel Seperti halnya pada regresi logistik biasa, pada model multilevel apabila responnya biner maka untuk penaksiran parameternya juga memerlukan suatu fungsi penghubung (Hox, 2002). Secara umum rumusan matematis regresi logistik multilevel dengan satu peubah penjelas pada level kesatu dan level kedua adalah sebagai berikut :
; (1) (2) (3) Pada persamaan (1), koefisien regresi dan memiliki indeks j untuk kelompok, yang mengindikasikan bahwa koefisien regresi beragam antar kelompok. X merupakan peubah penjelas pada level terendah dan Z merupakan peubah penjelas pada level kelompok. Keragaman koefisien regresi dimodelkan oleh peubah penjelas dan sisaan acak pada level kelompok pada persamaan (2) dan (3). Dengan mensubstitusikan persamaan (2) dan (3) terhadap persamaan (1), maka menghasilkan persamaan model regresi logistik multilevel pada persamaan (4) : (4) Pada persamaan (4), adalah koefisien regresi dan adalah sisaan pada level kelompok dari . Koefisien regresi diidentifikasi sebagai bagian tetap dari model (fixed effect)
karena bagian ini tidak berubah antar kelompok ataupun antar individu sedangkan bagian acak (random effect) adalah sisaan pada level kelompok maupun level individu. Menurut Collet (2003) model logit multilevel dengan beberapa peubah penjelas dapat ditulis dalam bentuk : (5) Misal dan adalah normal baku dari sedangkan standar deviasi bagian acak adalah yang merupakan bagian dari model linier. Transformasi logit menyebabkan yang sering disebut sebagai logistic normal distribution. Pendugaan parameter pada model regresi multilevel logistik diperoleh dengan menggunakan perhitungan Maximum Likelihood yang kompleks dan prosedur pendugaan yang rumit. Fungsi kemungkinan maksimumnya adalah :
Fungsi likelihood untuk n observasi adalah . Fungsi likelihood ini mempunyai parameter yang tidak diketahui yaitu , , . Setelah itu fungsi likelihood diintegralkan terhadap , hasil fungsinya disebut dengan marginal likelihood function.
Parameter dan diduga dengan memaksimumkan fungsi marginal likelihood . Nilai dan diperoleh menggunakan iterasi dengan bantuan paket R versi 2. 10. 0. Pemilihan Model Multilevel Terbaik Berdasarkan Hox (2002), strategi pemilihan model multilevel terbaik pada model multilevel adalah sebagai berikut : 1. Menyusun model intersep acak, yaitu : Menganalisis model tanpa peubah penjelas Menganalisis model dengan menambahkan seluruh peubah penjelas level kesatu Menganalisis model dengan menambahkan seluruh peubah penjelas level kedua
3
2. Memilih struktur kemiringan acak, yaitu dengan menguji keragaman kemiringan pada masing-masing peubah penjelas di level kesatu 3. Menyusun model akhir yaitu dengan menambahkan interaksi antara peubah penjelas level satu dan level dua. Pembandingan dua model yang tersarang dilakukan dengan menggunakan besaran selisih Devians. Secara umum Devians dapat didefinisikan sebagai berikut :
dimana adalah fungsi kemungkinan model adalah fungsi tanpa peubah penjelas dan kemungkinan dengan p peubah penjelas. Pengujian untuk membandingkan model terdapat dua hipotesis yaitu adalah model tersarang dan adalah model penuh. Misal untuk membandingkan kedua model ( M1 dan M2) dengan M1 tersarang pada M2 maka digunakan suatu ukuran selisih Devians yaitu :
dengan adalah banyaknya parameter pada model yang tersarang dan adalah banyaknya parameter pada model penuh. Apabila pengujian nyata maka M2 lebih cocok dibandingkan dengan M1. Pengujian Hipotesis Pengujian hipotesis pada model multilevel dilakukan terhadap parameter tetap dan parameter acak. Hipotesis parameter tetap yang digunakan adalah sebagai berikut : Pada level 1, dan dengan = 1,2,…,q dan q menyatakan banyak parameter pada level 1. Pada level 2, dan dengan = 1,2,…,r dan r menyatakan banyak parameter pada level 2. Statistik uji parameter tetap adalah statistik Wald sebagai berikut:
Dalam hal ini W mengikuti sebaran normal baku. ditolak jika . Menurut Goldstein (2005) selisih Devians dapat digunakan pada uji hipotesis parameter acak. Hipotesis parameter acak yang digunakan adalah (model tanpa parameter acak) dan (model dengan parameter acak).
Interpretasi Koefisien Interpretasi koefisien untuk model regresi logistik adalah dengan melihat rasio odssnya. Koefisien model logit mencerminkan perubahan nilai fungsi logit g(x) untuk perubahan satu unit peubah penjelas x. Dalam analisis model logit rasio odds didefinisikan sebagai berikut: Interpretasi dari rasio odds ini adalah untuk peubah penjelas x yang berskala nominal dan ordinal, yaitu kecenderungan untuk Y = 1 pada X = 1 sebesar ψ kali dibandingkan pada X = 0. Rasio odds mengindikasikan seberapa lebih kemungkinan munculnya suatu kejadian sukses pada suatu kelompok dibandingkan dengan kelompok lainnya. Selang kepercayaan untuk rasio odds adalah : Untuk model regresi logistik dengan peubah penjelas yang kontinu, rasio odds dan selang kepercayaan rasio odss dapat dihitung dengan:
Interpretasi pada peubah penjelas kontinu adalah jika , kenaikan nilai peubah x diikuti dengan semakin naiknya kecenderungan untuk Y=1. BAHAN DAN METODE Bahan Data yang digunakan dalam penelitian ini adalah data nilai akhir mahasiswa mata kuliah Metode Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor (FMIPA IPB), kecuali departeman Biologi. Data respon berupa nilai huruf mutu mata kuliah Metode Statistika tahun 2008/2009 yang dibagi menjadi dua kategori, yaitu kategori I adalah kategori baik (huruf mutu A dan B), yang bernilai 1 serta kategori II adalah kategori cukup dan kurang (huruf mutu C, D dan E), yang bernilai 0. Data diambil dari level mahasiswa (level satu) yang berjumlah 443 didalam tujuh kelas paralel (level dua) . Struktur data nilai akhir mahasiswa pada kelas paralel disajikan pada Gambar 1. Pada Gambar 1 terlihat bahwa mahasiswa (M1, M2,…,Mni) dengan i=1,2,…,8 yang tersarang pada kelas paralel (G1,G2,…,G8).
4
kategori I dan sisanya nilai kategori II sebesar 32,5%. Tabel 1 Persentase kategori nilai akhir mahasiswa yang berupa huruf mutu
G6 = ILKOM G7 = FIS G8 = BKM
Gambar 1
Struktur data nilai akhir Metode Statistika mahasiswa FMIPA Peubah penjelas pada level mahasiswa adalah asal daerah, Indeks Prestasi Kumulatif Tingkat Persiapan Bersama (IPK TPB), dan Jenis Kelamin (JK). Untuk peubah penjelas pada level kelas paralel adalah persentase kelas paralel yang mempunyai nilai Pengantar Matematika minimal B (%PM) dan jumlah mahasiswa. Pada penelitian analisis regresi logistik biner multilevel dilakukan dengan bantuan fungsi lme4 ( ) dalam paket R versi 2. 10. 0. Penggunaan fungsi ini memerlukan fungsi lain yaitu mlmREV ( ) yang bisa didapatkan di http://cran.r-project.org.
1. 2.
3.
4.
5.
Metode Melakukan analisis deskriptif terhadap data Melakukan analisis regresi logistik biner satu level untuk data pada semua dan masing-masing kelas paralel. Mencari model multilevel logistik biner terbaik yang dapat memodelkan kategori nilai akhir Metode Statistika Membandingkan model regresi logistik biner satu level dan multilevel dengan menggunakan ukuran selisih Devians. Interpretasi koefisien model regresi logistik multilevel biner melalui nilai rasio odds dan selang kepercayaan rasio odds. HASIL PEMBAHASAN
Deskripsi Data Persentase mahasiswa FMIPA yang memperoleh nilai akhir berupa huruf mutu (A, B, C, D & E) dapat dilihat pada Tabel 1. Tabel 1 memperlihatkan bahwa mahasiswa lebih banyak yang mendapat nilai B yaitu sebesar 37,7%, sedangkan mahasiswa yang mendapat nilai E hanya sebesar 0,5%. Dengan demikian sebesar 67,5% mahasiswa mendapat nilai
Frekuensi
Persentase
132 167 118 24 2
29,8% 37,7% 26,6% 5,4% 0,5%
Gambar 2 menunjukkan pada setiap kelas paralel mahasiswa lebih banyak memperoleh nilai akhir dengan kategori I kecuali pada kelas G2 (GFM) dan G5 (Matematika). Berdasarkan Gambar 2 juga terlihat adanya keragaman pencapaian nilai akhir Metode Statistika antar kelas paralel. 97
100
82 71
80
Peresentase
keterangan : G1 = STK G2 = GFM G4 = KIM G5 = MTK
Huruf mutu A B C D E
80 66
60 35
40
33
20 0
G1
G2
G4
C, D & E
Gambar 2
G5
G6
G7
G8
A, B
Persentase kategori nilai mahasiswa pada setiap kelas paralel Deskripsi nilai peubah penjelas untuk setiap kelas paralel disajikan pada Lampiran 1. Rata-rata jumlah mahasiswa perkelas sebanyak 73 mahasiswa dan rata-rata persentase nilai Pengantar Matematika minimal B sebesar 63,75%. Deskripsi mengenai hubungan antara kategori nilai Metode Statistika dengan peubah penjelas dapat dilihat pada Lampiran 2. Berdasarkan Lampiran 2 dapat dilihat bahwa IPK TPB berpengaruh terhadap kategori nilai akhir. Semakin besar nilai IPK proporsi mahasiswa mendapat nilai dengan kategori I semakin besar. Mahasiswa dengan IPK lebih besar dari sama dengan 3,5 hanya satu yang mendapat nilai dengan kategori II, sedangkan mahasiswa dengan IPK kurang dari 2,75 mendapat nilai dengan kategori II sebesar 58,52%. Pada peubah penjelas Jenis kelamin
5
dapat dilihat bahwa mahasiswa perempuan cenderung lebih banyak mendapat nilai kategori I daripada mahasiswa laki-laki. Mahasiswa FMIPA baik yang berasal dari Jawa maupun luar Jawa cenderung lebih banyak yang mendapat nilai Metode Statistika dengan kategori I. Lampiran 2 juga memperlihatkan bahwa semakin besar Persentase nilai Pengantar tidak Matematika minimal B (% PM) memperbesar proporsi mahasiswa mendapat nilai kategori I, yaitu pada kelas G4 (Kimia) dengan % PM sebesar 58,67%, mahasiswa memperoleh nilai kategori I mencapai 97,33%, sedangkan pada kelas G5 (Matematika) dengan % PM sebesar 76,71%, mahasiswa memperoleh nilai kategori I hanya sebesar 32,8%. Selain itu tampak kecenderungan bahwa pada kelas-kelas besar (jumlah mahasiswa ≥ 70) proporsi mahasiswa yang mendapat nilai dengan kategori I lebih banyak dibandingkan kelas kecil. Hal ini kemungkinan disebabkan karena sebagian kelas paralel merupakan kelas besar sehingga tidak terlalu terlihat pengaruh dari jumlah mahasiswa terhadap nilai akhir. Interaksi antar peubah penjelas disajikan pada Lampiran 3. Pada Lampiran 3 dapat dilihat bahwa peubah penjelas yang mungkin berinteraksi adalah peubah penjelas pada level yang berbeda yaitu interaksi antara IPK TPB dengan %PM dan asal daerah dengan %PM. Regresi Logistik Biner Satu Level Model regresi logistik biner satu level digunakan sebagai model dasar dan pembanding bagi model multilevel logistik. Berikut adalah hasil pendugaan dengan regresi logistik satu level terhadap data semua kelas yang disajikan pada Tabel 2. Tabel 2 Hasil Pendugaan parameter tetap menggunakan regresi logistik biner satu level Intersep IPK TPB JK Asal daerah % PM Jlh mhssw
Penduga Galat baku Nilai p -2,8532 1,1477 0,0129 2,9195 0,3311 < 2e-16 -0,6440 0,2494 0,0098 -0,1060 0,2961 0,7203 -0,1139 0,0189 1,96e-09 0,0374 0,0073 3,85e-07
Berdasarkan Tabel 2 dapat dilihat bahwa semua peubah penjelas berpengaruh nyata terhadap kategori nilai akhir Metode Statistika kecuali asal daerah. Banyaknya peubah penjelas yang nyata kemungkinan disebabkan
karena mahasiswa dalam kelas paralel cenderung mirip atau tidak saling bebas, sehingga mengakibatkan meningkatnya resiko salah jenis I dalam pengujian hipotesis. Pada Lampiran 4 disajikan hasil regresi logistik satu level untuk setiap kelas paralel dengan peubah penjelas IPK TPB. Terlihat adanya perbedaan fungsi logistik antar kelas paralel. Hal ini mengindikasikan perlunya dilakukan pemodelan multilevel terhadap data nilai akhir Metode Statistika. Pada Lampiran 4 juga dapat dilihat bahwa kelas G4 (Kimia) fungsi logistiknya cenderung aneh atau sangat berbeda dari kelas-kelas lain. Untuk itu dilihat juga pengaruh penyisihan kelas G4 terhadap model yang terbentuk. Regresi Logistik Biner Multilevel Dalam kajian pemodelan multilevel memerlukan pembentukan model intersep acak dan model kemiringan acak. Model yang dibentuk dengan intersep acak adalah sebagai berikut : 1. Model tanpa ada pengaruh peubah penjelas. 2. Model yang ditambah dengan peubah penjelas level 1. 3. Model yang ditambah dengan peubah penjelas level 2. Analisis data diawali dengan melihat perbedaan kelas paralel tanpa dipengaruhi peubah penjelas. Berdasarkan hasil pengujian terhadap model tanpa dipengaruhi peubah penjelas diperoleh bahwa pengaruh intersep nyata pada taraf α= 10% dengan nilai p sebesar 0,0656. Selanjutnya untuk memperoleh model intersep acak yang terbaik maka setiap model akan dibandingkan dengan model sebelumnya. Ukuran yang digunakan adalah selisih Devians dan metode pengujiannya menggunakan Statistik Khi Kuadrat. Hasil perbandingan tersebut dapat dilihat pada Tabel 3. Tabel 3
Hasil uji perbandingan pada model intersep acak Devians
Model tanpa peubah penjelas Model ditambah peubah penjelas level 1 Model ditambah peubah penjelas level 2
Nilai p
475,5 367,2
<2e-16
360,4
0,2532
6
Dari Tabel 3 dapat dijelaskan bahwa perbandingan antara model tanpa peubah penjelas dan model ditambah peubah penjelas level 1 adalah nyata artinya model yang lebih cocok adalah model ditambah peubah penjelas level 1. Selanjutnya perbandingan antara model ditambah peubah penjelas level 1 dan peubah penjelas level 2 tidak nyata artinya model yang lebih cocok adalah model ditambah peubah penjelas level 1. Hasil perhitungan pendugaan parameter untuk model terbaik intersep acak adalah sebagai berikut :
Pengaruh dari interaksi peubah penjelas pada level 1 dan level 2 tidak nyata pada taraf α = 10%, artinya tidak terdapat interaksi antar peubah penjelas pada level yang berbeda, maka dalam kasus ini pada model akhir tidak ditambahkan interaksi peubah penjelas pada level yang berbeda (Tabel 7).
Tabel 4
Intersep IPK TPB JK Asal daerah % PM IPK TPB* %PM Asal daerah*%PM
Hasil pendugaan parameter tetap model intersep acak terbaik
Penduga Intersep -7,6626 IPK TPB 3,0617 JK -0,6051 Asal daerah 0,0427
Galat baku Nilai p 1,2027 1,88e-10 0,3691 < 2e-16 0,2777 0,0294 0,3308 0,8973
Berdasarkan Tabel 4 diatas dapat dijelaskan bahwa IPK TPB dan Jenis kelamin berpengaruh nyata terhadap nilai akhir mahasiswa pada taraf α = 10%, sedangkan asal daerah tidak berpengaruh nyata. Setelah diperoleh model intersep acak terbaik, selanjutnya dilakukan pembentukan model kemiringan acak dengan menambahkan model intersep acak yang terbaik dengan efek acak dari masing-masing peubah penjelas level 1. Kemudian untuk memperoleh kemiringan acak yang nyata, maka dilakukan pembandingan model intersep acak terbaik dengan model kemiringan acak dari masingmasing peubah penjelas level 1. Tabel 5
Hasil uji pemilihan efek kemiringan acak
Perbandingan Model Model kemiringan acak IPK TPB Model kemiringan acak JK Model kemiringan acak Asal daerah
Nilai p 0,0381 0,3975 0,7352
Berdasarkan pengujian pada Tabel 5, efek kemiringan acak yang nyata terhadap model adalah efek kemiringan dari peubah penjelas IPK TPB. Langkah selanjutnya untuk memperoleh model multilevel logistik adalah dengan menambahkan interaksi peubah penjelas pada level yang berbeda. Interaksi yang ditambahkan pada model adalah interaksi antara IPK TPB dengan % PM dan asal daerah dengan % PM. Hasil pendugaan parameternya dapat dilihat pada Tabel 6.
Tabel 6
Tabel 7
Hasil pendugaan parameter tetap model dengan penambahan interaksi peubah penjelas pada level yang berbeda Penduga Galat baku -8,9632 19,0473 4,7108 5,4824 -0,6118 0,2813 -0,4411 2,4742 0,011 0,2927
Nilai p 0,6379 0,3902 0,0297 0,8588 0,9698
-0,0233
0,0836
0,7803
0,0068
0,0380
0,8573
Hasil pendugaan parameter tetap pada model akhir
Penduga Galat baku Nilai p Intersep -3,6719 3,2978 0,2655 IPK TPB 3,1728 0,7012 6,05e-06 JK -0,6162 0,2824 0,0292 Asal daerah 0,0096 0,3395 0,9773 % PM -0,0749 0,0469 0,1104 Jlh mhssw 0,0045 0,0169 0,7873 Pada Tabel 7 dapat dilihat bahwa peubah penjelas pada level 1 dan level 2 yaitu Asal daerah, jumlah mahasiswa, dan % PM tidak nyata pada taraf α= 10%. Karena terdapat peubah penjelas yang tidak nyata maka dilakukan reduksi terhadap model akhir dengan cara mengeliminasi peubah penjelas yang paling tidak nyata yaitu asal daerah dan jumlah mahasiswa. Hasil reduksi dari model akhir dapat dilihat pada Tabel 8. Pada Tabel 8 dapat dijelaskan bahwa semua peubah penjelas berpengaruh terhadap nilai akhir mahasiswa pada taraf α= 10%. Tabel 8
Intersep IPK TPB JK % PM
Hasil pendugaan parameter tetap model akhir yang direduksi Penduga Galat baku Nilai p -3,6487 3,2629 0,2635 3,1811 0,6821 3,11e-06 -0,6073 0,2802 0,0302 -0,0706 0,0406 0,0828
7
Pemilihan Model Terbaik Hasil yang telah didapatkan pada regresi logistik biner satu level dan model logistik multilevel biner dibandingkan menggunakan ukuran selisih Devians. Hasil uji perbandingan model disajikan pada Tabel 9. Tabel
9
Hasil uji perbandingan untuk memperoleh model terbaik
Devians Model logistik satu level 410,2 Model logistik multilevel 354,0 Model logistik multilevel yang direduksi 356,9
Nilai p 6,2e-16 0,2254
Tabel 9 memperlihatkan bahwa perbandingan model logistik satu level dan model logistik multilevel adalah nyata artinya model yang lebih cocok adalah model logistik multilevel, sedangkan perbandingan antara model multilevel sebelum direduksi dan setelah reduksi adalah tidak nyata artinya model yang lebih cocok adalah model multilevel yang direduksi. Selain itu pemilihan model multilevel reduksi sebagai model terbaik, karena mempunyai nilai Devians yang hampir sama dengan model multilevel sebelum reduksi tetapi dengan jumlah parameter yang lebih sedikit. Adapun model terbaik yang terbentuk adalah : dengan Atau dalam bentuk model campuran :
Model menunjukkan adanya perbedaan antar kelas paralel dengan keragaman kemiringan IPK TPB pada fungsi logit yaitu sebesar 2,0558 dan keragaman intersep pada fungsi logit adalah sebesar 31,0908. Penyisihan kelas G4 yang cenderung aneh pada analisis menghasilkan model yang hampir sama yaitu dengan kemiringan acak IPK TPB, akan tetapi keragaman menjadi menurun yaitu keragaman kemiringan IPK TPB pada fungsi logit sebesar 1,5196 (turun sebesar 26%) dan keragaman intersep pada fungsi logit sebesar 22,1867 (turun sebesar 28,6%).
Interpretasi Koefisien Interpretasi pada regresi logistik dilakukan melalui rasio odds. Jika suatu peubah memiliki nilai koefisien yang bertanda positif maka nilai rasio odds akan lebih dari satu sedangkan peubah yang nilai koefisiennya negatif maka nilai rasio odds akan kurang dari satu. Nilai dugaan rasio odds dari model terbaik (Tabel 8) beserta selang kepercayaan untuk masing-masing peubah penjelas dapat dilihat pada Tabel 10. Tabel 10 Rasio odds peubah penjelas yang nyata Dugaan SK 90 % bagi Rasio rasio Odds Peubah Odds Lower Upper JK 0,54 0,34 0,86 IPKTPB 1,37 1,23 1,54 % PM 0,49 0,46 0,96 Berdasarkan Tabel rasio odds diatas dengan selang kepercayaan 90% dapat dijelaskan bahwa mahasiswa laki-laki memiliki kecenderungan mendapat nilai kategori I antara 0,34 sampai 0,86 kali daripada mahasiswa perempuan. Setiap kenaikan IPKTPB sebesar 0,1 satuan diikuti dengan bertambahnya peluang mahasiswa mendapat nilai kategori I antara 1,23 sampai 1,54 kali. Sementara itu kecenderungan mahasiswa mendapat nilai kategori I turun menjadi 0,46 sampai 0,96 kali untuk setiap kenaikan %PM sebesar sepuluh satuan. Hubungan negatif tersebut kemungkinan disebabkan karena data nilai akhir mahasiswa pada kelas G4 (Kimia) dengan % PM sebesar 58,67% proporsi mahasiswa mendapat nilai kategori I mencapai 97,33%, sedangkan mahasiswa pada kelas G5 (Matematika) dengan % PM sebesar 76,71% proporsi mahasiswa mendapat nilai kategori I hanya sebesar 32,8%. KESIMPULAN Kesimpulan Faktor-faktor yang berpengaruh terhadap kategori nilai akhir Metode Statistika FMIPA pada level mahasiswa adalah IPK TPB dan jenis kelamin. Pada level kelas paralel faktor yang berpengaruh adalah persentase nilai Pengantar Matematika minimal B (%PM). Dalam hal ini pengaruh IPK TPB menyebabkan pebedaan antar kelas paralel dengan keragaman kemiringan sebesar 2,0558 dan keragaman intersep sebesar 31,0908. Penyisihan kelas Kimia dari analisis menyebabkan perbedaan antar kelas paralel
8
karena pengaruh IPK TPB menjadi lebih kecil. Mahasiswa perempuan mempunyai kecenderungan memperoleh nilai A dan B 1,84 kali lebih besar daripada mahasiswa laki-laki. Setiap kenaikan IPK TPB sebesar 0,1 satuan diikuti dengan bertambahnya kecenderungan mahasiswa memperoleh nilai kategori A dan B sebesar 1,37 kali. DAFTAR PUSTAKA Bliese, P. 2006. Multilevel Models in R version 2.3. R development Core Team. Collet, D. 2003. Modelling Binary Data Second Edition. United States of America : Chapman and Hall. Goldstein, H. 1995. Multilevel Statistical nd
Models 2 Ed. London : E-Book of Arnold. Hosmer, D. W dan Lemeshow, S. 2000. Appplied Logistic Regression Second Edition. New York : John Wiley and Sons. Hox, J. 2002. Multilevel Analysis Techniques and Applications. New Jersey : Lawrence Erlbaum Associates, Inc. Tantular, B. 2009. Penerapan model regresi linier multilevel pada data pendidikan dan data nilai ujian. [tesis]. Program Pasca Sarjana, Institut Pertanian Bogor. Widiyani, W. 2009. Pengkajian model regresi dua level terhadap capaian nilai akhir metode statistika tahun 2008/2009. [skripsi]. Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
10
Lampiran 1 Deskripsi nilai peubah penjelas untuk setiap kelas paralel Persentase Kelas
JK Perem Lakipuan laki
IPK TPB < 2,75
G1
61,5
38,5
G2
51,02
G4
62,67
G5
2,75-3,5
= 3,5
Rataan IPK TPB
Asal daerah Luar Jawa Jawa
% PM
Jumlah Mahasiswa
13,85
61,54
24,62
73,8
26,2
3,2
71,21
70
48,98
44,9
46,94
8,16
57,14
42,86
2,76
51,02
49
37,33
26,67
64
9,33
89,33
10,67
2,99
58,67
78
61,64
38,36
34,25
53,42
12,33
88,73
11,27
2,98
76,71
79
G6
39,33
60,67
26,97
62,92
10,11
83,91
16,09
3
71,91
115
G7
50
50
37,5
53,13
9,38
59,38
40,63
2,89
56,25
38
56,67
43,33
38,33
50
11,67
80
20
2,93
60,66
79
54,63
45,37
30,47
57,11
12,42
78,82
21,18
2,98
G8 Seluruh kelas Lampiran 2
Deskripsi hubungan antara kategori nilai akhir dengan peubah penjelas IPK TPB
Jenis Kelamin 98
100
80
72
90
60
Persentase
Persentase
70 60 50
62
70
75
80
41
40
50 40 30
30 20
20
10
10 0
0 < 2,75
2,75-3,5
C, D & E
A, B
= 3,5
Perempuan
C, D & E
Laki-laki
A, B
11
Jumlah Mahasiswa
Lampiran 2 (Lanjutan) Asal Daerah
73 80
69 70
70
63
Persentase
56 60
Persentase
50
60 50 40
40 30 30 20 20
10
10
0 < 70
= 70
0 Jawa
luar Jawa
C, D & E
A, B
Persentase nilai PM = B
80
74
70
62
Persentase
60 50 40 30 20 10 0 < 70%
C, D & E
= 70%
A, B
C, D & E
A, B
12
Lampiran 3
Plot interaksi antar peubah penjelas baik pada level yang sama maupun pada level yang berbeda JK*%PM
100
100
80
80
Persentase nilai kategori I
Persentase nilai kategori I
IPKTPB*JK
60
40
60
40
20
20
0
0 Perempuan
< 2,75
2,75-3,5
Laki-laki
< 70%
= 3,5
Perempuan
Laki-laki
Asal Daerah*%PM
100
100
80
80
Persentase nilai kategori I
Persentase nilai kategori I
IPKTPB*Asal Daerah
= 70%
60 40
60 40 20
20 0 0
< 70% Jawa
Jawa < 2,75
2,75-3,5
= 3,5
IPKTPB*%PM 100
Persentase nilai kategori I
80 60 40 20 0 < 70% < 2,75
2,75-3,5
= 70%
Luar Jawa
= 70% = 3,5
Luar Jawa
13
Lampiran 4 Plot regresi logistik satu level untuk semua dan masing-masing kelas paralel dengan peubah penjelas IPK TPB 1
0,9
0,8
Peluang Nilai kategori I
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0 1
1,5
2
2,5
3
3,5
4
IPK TPB G1
G2
G4
G5
G6
G7
G8
Semua
14
Lampiran 5
Syntax program paket R 2.10.0
•
Membaca dan menampilkan peubah library(tcltk) library(xlsReadWrite) name <- tclvalue(tkgetOpenFile(filetypes = "{{Excel Files} {.xls}} {{All files} *}")) if (name == "") return Data <- read.xls(name, colNames = TRUE, sheet = 1, type = "data.frame", from = 1, rowNames = NA, colClasses = NA, checkNames = TRUE, dateTimeAs = "numeric", stringsAsFactors = default.stringsAsFactors())
•
Syntax analisis logistik biner satu level f <- glm( kategori~IPK_TPB+Jns_klmn+ Asl_daerah+Prsn_Nilai_PM+Jmlh_Mhssw, data=Data,family=binomial("logit"))
•
Syntax analisis multilevel logistik biner : model intersep acak library(lme4) M1 <-lmer(kategori ~ 1 + (1 | Kls_Prll), data=Data,family=binomial(link=logit)) M2 <-lmer(kategori ~ IPK_TPB + Jns_klmn + Asl_daerah + (1 | Kls_Prll) , data=Data,family=binomial(link=logit)) M3 <-lmer kategori ~ IPK_TPB + Jns_klmn + Asl_daerah + Jmlh_Mhssw + Prsn_Nilai_PM + (1| Kls_Prll) , data=Data,family=binomial(link=logit)) anova (M1,M2,M 3)
•
Syntax analisis multilevel logistik biner : model kemiringan acak F1 <- lmer(kategori~IPK_TPB+Jns_klmn +Asl_daerah+(IPK_TPB | Kls_Prll),data=Data,family=binomial(link=logit)) F2 <- lmer(kategori~IPK_TPB+Jns_klmn+Asl_daerah +(Jns_klmn | Kls_Prll),data=Data,family=binomial(link=logit)) F3 <- lmer(kategori~IPK_TPB+Jns_klmn +Asl_daerah +(Asl_daerah | Kls_Prll),data=Data,family=binomial(link=logit)) anova (M2, F1) anova (M2, F2) anova (M2, F3)
•
Syntax analisis multilevel logistik biner : model akhir M4 <- lmer(kategori ~ IPK_TPB + Jns_klmn + Asl_daerah+ Prsn_Nilai_PM + IPK_TPB * Prsn_Nilai_PM + Asl_daerah * Prsn_Nilai_PM + (IPK_TPB | Kls_Prll),data=Data,family=binomial(link=logit)) M5 <- lmer(kategori ~ IPK_TPB + Jns_klmn + Asl_daerah+ Prsn_Nilai_PM + Jmlh_Mhssw + (IPK_TPB | Kls_Prll),data=Data,family=binomial(link=logit)) M6 <- lmer(kategori ~ IPK_TPB + Jns_klmn + Prsn_Nilai_PM + (IPK_TPB | Kls_Prll),data=Data,family=binomial(link=logit)) anova (M5, M6)