1
Analisis Faktor-faktor yang Mempengaruhi Masa Studi Lulusan Mahasiwa Program Magister Institut Teknologi Sepuluh Nopember (ITS) Surabaya Menggunakan Regresi Logistik Ordinal Dan Regresi Probit Ordinal Imam Ahmad Al Fattah1), Madu Ratna2), dan Vita Ratnasari3) Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim, Surabaya 60111 1) E-mail:
[email protected] 2)
[email protected] 3)
[email protected] 1),2),3)
Abstrak- Salah satu hal yang dapat dijadikan sebagai ukuran keberhasilan seseorang dalam menempuh pendidikan program magister di Institut Teknologi Sepuluh Nopember (ITS) Surabaya adalah masa studi. Masa studi merupakan masa untuk menyelesaikan beban studi dalam mengikuti proses pendidikan pada program studinya. Penelitian ini bertujuan untuk menganalisis faktor-faktor yang mempengaruhi masa studi lulusan mahasiswa program magister di ITS. Data yang digunakan adalah data lulusan mahasiswa pascasarjana program magister ITS Surabaya periode Maret 2008 sampai dengan Maret 2011. Metode yang dipakai adalah regresi logistik ordinal dan regresi probit ordinal. Berdasarkan analisis data dan pembahasan dapat diketahui bahwa faktorfaktor yang mempengaruhi masa studi lulusan mahasiswa program magister ITS adalah nilai TOEFL, jenis kelamin, kesesuaian bidang studi, nilai IPK S1, dan asal fakultas. Berdasarkan ketepatan klasifikasi, Pseudo R2 McFadden, Akaike’s Information Criterion (AIC), dan Schwardz Bayessian Information Criterion (SBIC) dapat diketahui bahwa analisis regresi logistik ordinal lebih baik daripada analisis regresi probit ordinal pada studi kasus faktor-faktor yang mempengaruhi masa studi lulusan mahasiswa program magister ITS. Pola kriteria pemilihan model hasil resampling menunjukkan bahwa model regresi logistik ordinal tidak selalu lebih baik. Kata kunci– Masa Studi, Program Magister, Regresi Logistik Ordinal, Regresi Probit Ordinal, Pseudo R2 McFadden, AIC, SBIC, Resampling
I. PENDAHULUAN
K
eberhasilan pendidikan tinggi merupakan modal yang penting dalam mewujudkan keberhasilan tujuan nasional bidang pendidikan, yaitu mencerdaskan kehidupan bangsa. Oleh karena itu, perlu dilakukan penelitian untuk mengetahui tingkat keberhasilan pendidikan tinggi di Indonesia. Terdapat dua hal yang perlu diperhatikan dalam pengukuran keberhasilan mahasiswa dalam studi, yaitu berdasarkan nilai Indeks Prestasi Kumulatif (IPK) dan masa studi [1]. Pada penelitian ini permasalahan yang dibahas berfokus pada keberhasilan pendidikan tinggi berdasarkan masa studi karena penelitian keberhasilan pendidikan tinggi berdasarkan IPK sudah pernah dilakukan oleh Fathurahman [2] menggunakan regresi probit ordinal. Guillory [3] mengungkapkan bahwa salah satu ukuran kesuksesan pembelajaran pada suatu pendidikan tinggi adalah tingkat ketepatan masa studi. Seorang mahasiswa membutuhkan waktu normal selama empat semester untuk menyelesaikan program magisternya. Akan tetapi, dalam praktiknya mahasiswa tidak sela-
lu dapat menyelesaikan studinya tersebut dalam waktu normal. Hal itu menunjukkan bahwa seorang mahasiswa dapat menyelesaikan studinya dalam tiga tingkat ketepatan masa studi, yaitu lebih lama, normal, dan lebih cepat. Oleh karena itu, pada penelitian ini masa studi lulusan mahasiswa program magister ITS Surabaya sebagai variabel respon dikategorikan berdasarkan tingkatannya menjadi 3 kategori, yaitu lulus lebih dari empat semester, empat semester, dan tiga semester. Penelitian ini bertujuan untuk mengetahui karakteristik lulusan mahasiswa program magister ITS dan faktor-faktor yang mempengaruhi masa studinya. Untuk mengetahui hal tersebut diperlukan analisis statistik yang melibatkan variabel respon dan variabel prediktor. Analisis statistik yang sering digunakan untuk menjelaskan pola hubungan antara variabel respon dan variabel prediktor adalah analisis regresi [4]. Karena data pada variabel respon merupakan data kualitatif, maka model yang dapat menjelaskan hubungan antara variabel respon dan variabel prediktor dalam hal ini adalah model logit atau model probit [5]. Oleh karena itu, faktor-faktor yang mempengaruhi masa studi lulusan mahasiswa program magister ITS Surabaya dianalisis menggunakan regresi logistik ordinal dan regresi probit ordinal dimana akan dibahas juga terkait perbandingan hasil keduanya. Ada beberapa penelitian terdahulu yang terkait dengan penelitian ini. Perhitungan tingkat kelulusan dilakukan oleh Starck, Love, & McPherson [6]. Analisis waktu kelulusan mahasiswa dengan metode CHAID pada FMIPA Universitas Udayana dilakukan oleh Padmini, Suciptawati, & Susilawati [7]. Fuks dan Salazar [8] mengklasifikasikan konsumsi peralatan elektronik rumah tangga di Rio de Janeiro Brazil dengan regresi logistik ordinal. Kockelman dan Kweon [9] menggunakan model regresi probit ordinal untuk mengetahui faktor-faktor yang mempengaruhi pengendara mobil mengalami luka ringan, sedang, berat, dan sangat berat akibat kecelakaan. Jumaidin [10] membandingkan bias pada model regresi logistik ordinal dan regresi probit ordinal untuk mengetahui faktor-faktor yang mempengaruhi nilai UNAS. Akbar, Mukarromah, dan Paramita [11] menerapkan Bagging regresi logistik ordinal pada status gizi balita. II. TINJAUAN PUSTAKA Statistika Deskriptif Statistika deskriptif merupakan metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna [12]. Statistika deskriptif diA.
2 gunakan untuk mendeskripsikan atau menggambarkan objek penelitian yang diambil dari sampel maupun populasi [13]. Untuk menggambarkan dua atau lebih variabel secara simultan dengan jumlah kategori yang terbatas digunakan cross tabulation [14].
Pengujian parameter dilakukan secara parsial dan secara serentak. i. Uji Parsial
H 0 : βk = 0
H1 : β k ≠ 0 , k=1,2,…,p
Distribusi Normal dan Distribusi Multinomial Distribusi normal merupakan distribusi kontinu yang paling penting dalam bidang statistika [12] dengan fungsi distribusi probabilitas sebagai berikut. B.
f ( y) =
1 2πσ 2
1 ( y − µ )2 exp − 2 2σ
Φ ( y ) = P (Y ≤ y ) =
∫
−∞
1 t − µ 2 exp − dt 2π σ 2 σ 1
n ∆ y1 y J −1
(3)
∆ = π 0y0 π 1y1 π Jy−J 1−1 (1 − π 0 − π 1 − − π J −1 ) n − y0 − y1 −− y J −1
C. Regresi Logistik Ordinal Model yang dipakai dalam regresi logistik ordinal adalah model logit (cumulative logit models) dimana sifat ordinal dari respon Y dituangkan dalam peluang kumulatif [15]. Berikut peluang kumulatif P(Y≤j│x). p expθ 0 j + ∑ β k x ki k =1 P (Y ≤ j | x) = p 1 + expθ 0 j + ∑ β k x ki k =1
(4)
Apabila terdapat 3 kategori pada variabel respon maka nilai peluang pada tiap kategori respon adalah sebagai berikut. p expθ1 + ∑ β k x ki k =1 π 1 ( x ) = P (Y ≤ 1 x ) = p 1 + expθ1 + ∑ β k x ki k =1
(5)
p p expθ 2 + ∑ β k xki expθ1 + ∑ β k xki k =1 k =1 − π 2 (x ) = P(Y ≤ 2 x ) − π 1 (x ) = p p (6) 1 + expθ 2 + ∑ β k xki 1 + expθ1 + ∑ β k xki k =1 k =1 p expθ 2 + ∑ β k xki 1 k =1 = (7) π 3 (x ) = 1 − P(Y ≤ 2 x ) = 1 − p p 1 + expθ 2 + ∑ β k xki 1 + expθ 2 + ∑ β k xki k =1 k =1
Metode yang digunakan dalam pendugaan parameter model regresi logistik ordinal adalah Maximum Likelihood Estimation (MLE). Dugaan parameter diperoleh melalui pendekatan iteratif menggunakan metode Newton-Raphson dengan persamaan sebagai berikut. −1 +1) (8) θ(t = θ( t ) − H ( t ) q ( t ) Iterasi akan berhenti jika kondisi konvergen terpenuhi, yaitu θ(t +1) − θ(t ) ≤ ε dimana ε adalah bilangan sangat kecil.
2
(9)
H 0 ditolak apabila Wk2 > χ (α ,1) atau p-value < α . 2
ii. Uji Serentak
H 0 : β1= β 2= ...= β p= 0
H1 : Minimal ada satu β k ≠ 0 , k=1,2,…,p
(2)
Distribusi multinomial merupakan merupakan salah satu distribusi yang sering digunakan dalam analisis statistik pada data kategori. Distribusi multinomial diperoleh dari percobaan yang menghasilkan lebih dari dua kemungkinan hasil. Menurut Agresti [14], apabila terdapat n percobaan yang menghasilkan J kemungkinan hasil yang berupa kategori ( y 0 , y1 , , y J ) dengan probabilitas (π 0 , π 1 , , π J ) maka distribusi probabilitas variabel random Y0 , Y1 , , YJ dapat ditulis seperti pada persamaan (3). P(Y0 = y 0 , Y1 = y1 ,..., YJ −1 = y J −1 ; n, π) = y0
βˆk Wk2 = SE ( βˆ ) k
(1)
Adapun fungsi distribusi kumulatif dari distribusi normal dinyatakan dalam persamaan (2). y
Statistik uji:
Statistik uji: L(ωˆ ) G 2 = −2 ln ˆ ) L (Ω
(10)
H 0 ditolak apabila statistik uji G lebih dari nilai chisquare dengan derajat bebas p atau p-value < α . Uji kesesuaian model (Goodness of Fit Test) menggunakan hipotesis sebagai berikut. H 0 : model sesuai (tidak ada perbedaan antara hasil observasi dengan hasil prediksi) H 1 : model tidak sesuai (ada perbedaan antara hasil observasi dengan hasil prediksi) Statistik uji: n πˆij 1 − πˆij −2∑ yij ln + 1 − yij ) ln D= (11) ( i =1
yij
1 − yij
H 0 ditolak apabila p-value < α . Hasil pemodelan menggunakan regresi logistik ordinal dapat diinterpretasikan berdasarkan nilai odds ratio. Odds ratio merupakan ukuran asosiasi yang menggambarkan seberapa besar kemungkinan suatu kejadian terjadi. D. Regresi Probit Ordinal Regresi probit ordinal lebih disarankan untuk digunakan dalam pemodelan data apabila diketahui bahwa data berdistribusi normal [16]. Pemodelan dapat diawali dengan memperhatikan model pada persamaan (12). Y * = xT β + ε (12)
dimana Y * merupakan variabel respon kontinu, β merupakan vektor parameter koefisien dengan β = [β 0 β1 β p ]T , x merupakan vektor variabel bebas dengan x = [1 X 1i X pi ]T ,
dan ε merupakan error yang diasumsikan N (0, σ 2 ) . Pada regresi probit ordinal dilakukan pengkategorian terhadap Y secara ordinal, yaitu untuk Y * ≤ γ 1 dikategori*
kan dengan Y = 0 , untuk γ 1 < Y * ≤ γ 2 dikategorikan dengan Y = 1 , ... , untuk γ i −1 < Y * ≤ γ i dikategorikan dengan ... , untuk Y * > γ k dikategorikan dengan Y = k , sehingga diperoleh model sebagai berikut. γ 1 − xT β (13) P (Y = 0 ) = Φ σ Y = i −1,
γ 2 − xT β γ 1 − xT β − Φ P (Y = 1) = Φ σ σ
(14)
3 γ i − xT β γ i −1 − x T β P (Y = i − 1) = Φ − Φ σ σ
(15)
γ − xT β (16) P(Y = k ) = 1 − Φ k σ dimana Y = 0 untuk kategori terendah dan Y = k untuk kategori tertinggi. Menurut Greene [17], untuk menginterpretasikan model regresi probit ordinal pada persamaan (13) sampai dengan persamaan (16) digunakan efek marginal (marginal effects). Efek marginal menyatakan besarnya pengaruh tiap variabel prediktor yang signifikan terhadap probabilitas tiap kategori pada variabel respon. γ − xT β β j ∂P (Y = 0 ) − = φ 1 (17) ∂X j σ σ γ − x T β β j ∂P(Y = 1) γ 1 − x T β − φ 2 = φ ∂X j σ σ σ
(18)
γ − x T β β j ∂P(Y = i − 1) γ i −1 − x T β − φ i = φ σ σ ∂X j σ
(19)
γ − xT β β j ∂P (Y = k ) = φ i σ ∂X j σ
(20)
Adapun prosedur pengujian parameter dan pengujian kesesuaian model pada regresi probit ordinal sama seperti pada regresi logistik ordinal. E. Multikolinieritas Multikolinieritas merupakan kondisi dimana terdapat hubungan yang linear atau korelasi antar variabel bebas yang signifikan pada model. Hal ini tidak diperkenankan terjadi pada analisis regresi. Untuk mengetahui ada tidaknya multikolinieritas dapat digunakan nilai Variance Inflation Factors (VIF). Dikatakan terdapat multikolinieritas apabila nilai VIF lebih dari 10 [18]. VIF =
1 2 1− Rj
H. Masa Studi Mahasiswa Masa studi adalah masa untuk penyelesaian beban studi dalam mengikuti proses pendidikan pada program studinya [20]. Adapun faktor-faktor yang mempengaruhi masa studi adalah sebagai berikut. i. Masa studi S2 dipengaruhi oleh empat faktor, yaitu jenis kelamin, status perkawinan, nilai IPK S1, dan jenis pekerjaan [21]. ii. Skor Test Potensi Akademik (TPA), kesesuaian bidang studi, IPK saat S1, status perkawinan, dan asal perguruan tinggi saat S1 mempengaruhi prestasi mahasiswa pascasarjana ITS periode lulusan 96-102 dalam hal lama tempuh studi [22]. iii. Ada lima variabel prediktor yang mempengaruhi keberhasilan studi mahasiswa antara lain, nilai IPK jenjang sarjana, dana perkuliahan, nilai Test Potensi Akademik (TPA), nilai Test of English as a Foreign Language (TOEFL), dan kesesuaian bidang minat [2]. III. METODOLOGI PENELITIAN Data yang digunakan pada penelitian ini merupakan data sekunder yang diperoleh dari Pascasarjana Institut Teknologi Sepuluh Nopember (ITS) Surabaya, yaitu data lulusan mahasiswa pascasarjana program magister ITS Surabaya periode Maret 2008 sampai dengan Maret 2011 dimana terdapat 1284 lulusan. Adapun variabel penelitian yang digunakan disajikan pada Tabel 1. Tabel 1. Variabel Penelitian No. 1
Variabel Variabel respon : Y : Masa studi
Tipe
Kategori
Kategori
0 untuk Y>4 semester 1 untuk Y=4 semester 2 untuk Y=3 semester
Variabel prediktor : X 1 : Nilai TPA X 2 : Nilai TOEFL X 3 : Jenis kelamin
Kontinu Kontinu Kategori
X 4 : Kesesuaian bidang studi
Kategori
X 5 : Nilai IPK S1 X 6 : Lama waktu lulus dari S1 ke S2 X 7 : Sumber pendanaan
Kontinu Kontinu Kategori
X 8 : Status pernikahan
Kategori
X 9 : Jenis pekerjaan
Kategori
X 10 : Usia X 11 : Fakultas
Kontinu Kategori
0 = perempuan 1 = laki-laki 0 = tidak sesuai 1 = sesuai 0 = sendiri 1 = beasiswa BPPS 2 = beasiswa instansi 3 = beasiswa lainnya 0 = menikah 1 = belum menikah 0 = pegawai negeri/BUMN 1 = pegawai swasta/wiraswasta 2 = belum bekerja 0 = FMIPA; 3=FTK 1 = FTI; 4=FTIF 2 = FTSP;
(21) 2
F. Kriteria Pemilihan Model Terbaik Evaluasi model pada penelitian ini menggunakan ukuran ketepatan klasifikasi dan nilai kriteria pemilihan model (Pseudo R2 McFadden, AIC, dan SBIC). i. Ketetapan Klasifikasi Model Nilai ketepatan klasifikasi tersebut dapat diperoleh dengan membandingkan nilai prediksi yang benar dari model dengan nilai observasi sebenarnya. ii. Pseudo R2 McFadden log L1 2 (22) RMF = 1− LogL0 iii. Akaike’s Information Criterion (AIC) (23) ln L( P ) p AIC ( p ) = −2
empiris yang diperoleh dari proses resampling atau pengambilan sampel secara berulang disebut metode bootstrap. Metode bootstrap melakukan penarikan sampel dengan pengembalian dari sampel asli. Meskipun jumlah replikasi bootstrap kecil (misal B=25), biasanya sudah cukup informatif. Tetapi dengan B=50 sudah sangat cukup untuk memberikan estimasi yang akurat [19]. Replikasi yang lebih banyak diperlukan dalam hal interval konfidensi bootstrap.
n
+2
n
iv. Schwardz Bayessian Information Criterion (SBIC) ln L( P ) p ln n SBIC ( p ) = −2 +2 (24) n n G. Metode Bootstrap Metode yang digunakan untuk mengestimasi suatu distribusi populasi yang tidak diketahui dengan distribusi
Statistika deskriptif digunakan untuk mendeskripsikan karakteristik lulusan mahasiswa program magister ITS. Pemodelan menggunakan regresi logistik ordinal dan regresi probit ordinal untuk digunakan untuk mengetahui faktorfaktor yang mempengaruhi masa studi lulusan mahasiswa program magister ITS. Sebelum pemodelan dilakukan uji
4 multikolinieritas untuk mengetahui independensi antar variabel bebas. Untuk mengetahui faktor-faktor yang siginifikan dilakukan pengujian parameter secara parsial dan serentak untuk selanjutnya dibentuk model terbaik dari masing-masing metode regresi. Adapun hasil dari kedua metode regresi tersebut dibandingkan berdasarkan nilai ketepatan klasifikasi dan nilai kriteria pemilihan model, yaitu Pseudo R2 McFadden, AIC, dan SBIC. Resampling dengan 50 kali replikasi dilakukan untuk mengetahui pola kriteria pemilihan model yang dihasilkan kedua metode regresi.
Minimum
Maksimum
43,21 183 2 0 18
212,11 656 4 32 60
Rata-rata 131,46 435,16 3,0891 5,336 30,095
VIF 5,722 4,474 4,045 5,607 9,083
C. Analisis Regresi Logistik Ordinal Berikut pengujian parameter secara parsial.
H1 : β k ≠ 0 , k=1,2,…,6,8,…,11 Statistik uji: βˆk Wk2 = SE ( βˆ ) k
Standar Deviasi 29,16 65,43 0,3317 4,771 6,323
Berdasarkan Tabel 2 dapat diketahui bahwa pada saat masuk program magister ITS, usia dari lulusan mahasiswa program magister ITS rata-rata 30 tahun. Lulusan tersebut rata-rata memiliki selang waktu dari lulus S1 ke S2 selama 5 tahun. Dari segi kemampuan akademik, nilai IPK pada saat S1 lulusan tersebut rata-rata sebesar 3,09. Selain itu, lulusan tersebut memiliki nilai TPA rata-rata sebesar 131,46. Sedangkan dari segi kemampuan bahasa asing, lulusan tersebut memiliki nilai TOEFL pada saat masuk S2 rata-rata sebesar 435. Terdapat 6 variabel prediktor kategori dalam penelitian ini. Mayoritas lulusan mahasiswa program magister ITS berjenis kelamin laki-laki, sudah menikah, dan memiliki kesesuaian bidang antara S1 dan S2. Dari segi sumber pendanaan, paling banyak berasal dari beasiswa BPPS. Apabila dilihat dari asal fakultasnya, lulusan paling banyak berasal dari FTI. Sedangkan berdasarkan jenis pekerjaannya, lulusan paling banyak bekerja sebagai pegawai negeri atau BUMN. Cross tabulation antara variabel respon dengan variabel prediktor kategori menunjukkan bahwa mayoritas lulusan yang lulus 4 semester berjenis kelamin laki-laki, memiliki kesesuaian bidang studi antara jenjang sarjana dengan jenjang magister, dan sudah menikah. Berdasarkan sumber pendanaannya, lulusan yang mendapatkan beasiswa BPPS paling banyak lulus 4 semester tetapi paling sedikit yang lulus 3 semester. Selain itu, lulusan yang lulus 4 semester paling banyak bekerja sebagai pegawai negeri atau BUMN dan berasal dari FMIPA. B. Uji Multikolinieritas Hasil uji multikolinieritas untuk mengetahui independensi antar variabel prediktor disajikan pada Tabel 3. Berdasarkan Tabel 3 dapat diketahui bahwa terdapat nilai VIF yang lebih dari 10, yaitu pada variabel sumber pendanaan (X 7;0, X 7;1 , dan X 7;2, ). Hal ini menunjukkan bahwa terdapat multikolinieritas pada studi kasus ini. Oleh
2
H 0 ditolak apabila Wk2 > χ (α ,1) atau p-value < α . 2
Tabel 4. Hasil Uji Parsial Regresi Logistik Ordinal Variabel
Tabel 2. Deskripsi Variabel Prediktor Kontinu
X1 X2 X5 X6 X 10
Tabel 3. Hasil Uji Multikolinieritas VIF Variabel VIF Variabel 1,252 X 7;0 74,938 X 10 1,271 X 7;1 35,264 X 11;0 1,164 X 7;2 19,819 X 11;1 1,099 X 8;0 1,867 X 11;2 1,540 X 9;0 4,183 X 11;3 4,965 X 9;1 2,937
Variabel X1 X2 X 3;0 X 4;0 X5 X6
H 0 : βk = 0
IV. ANALISIS DAN PEMBAHASAN A. Karakteristik Lulusan Mahasiwa Program Magister ITS Variabel respon penelitian ini adalah masa studi lulusan mahasiswa program magister ITS yang dikategorikan dalam 3 kategori, yaitu kategori 0 (Y>4 semester), 1 (Y=4 semester), dan 2 (Y=3 semester). Mayoritas lulusan tersebut lulus dalam waktu 4 semester, yaitu sebanyak 59,8% dari total lulusan. Berdasarkan variabel prediktornya, penelitian ini melibatkan variabel prediktor kontinu dan kategori. Variabel
karena itu, variabel sumber pendanaan tidak diikutsertakan dalam analisis selanjutnya.
Koefisien
Konstanta (0) 3,4395 Konstanta (1) 6,6290 X1 0,0021 X2 0,0023 X 3;0 -0,2518 X 3;1 X 4;0 -0,2666 X 4;1 X5 1,0575 X6 0,0118 X 8;0 -0,0837 X 8;1 X 9;0 0,2985 X 9;1 -0,0357 X 9;2 X 10 0,0011 X 11;0 0,4835 X 11;1 -0,1858 X 11;2 -0,8221 X 11;3 0,3735 X 11;4 2 Nilai 1; 0 , 05 = 3,841
Std. Error 1,0207 1,0366 0,0022 0,0010 0,1244
Wk
2
P-Value
Keputusan
11,3552 40,8927 0,9137 5,4571 4,0985
0,0008 0,0000 0,3391 0,0195 0,0429
Terima H 0 Tolak H 0 Tolak H 0
0,1266
4,4357
0,0352
Tolak H 0
0,2113 0,0263 0,1504
25,0442 0,2003 0,3099
0,0000 0,6545 0,5778
Tolak H 0 Terima H 0 Terima H 0
0,1839 0,1854
2,6343 0,0370
0,1046 0,8474
Terima H 0 Terima H 0
0,0214 0,1095 0,1046 0,1263 0,1639
0,0028 19,5077 3,1529 42,3977 5,1938
0,9577 0,0000 0,0758 0,0000 0,0227
Terima H 0 Tolak H 0 Terima H 0 Tolak H 0 Tolak H 0
χ
Berdasarkan Tabel 4 dapat diketahui bahwa terdapat 5 variabel signifikan dalam model, yaitu nilai TOEFL, jenis kelamin, kesesuaian bidang, nilai IPK, dan asal fakultas. Selanjutnya dilakukan pengujian parameter secara serentak terhadap variabel-variabel tersebut.
H 0 : β 2 = β 3 = β 4 = β 5 = β11 = 0
H1 : Minimal ada satu β k ≠ 0 , k=2,3,4,5,11 Statistik uji: L(ωˆ ) G 2 = −2 ln ˆ ) L (Ω Karena nilai p-value sebesar 0,000. Nilai tersebut kurang dari α sehingga H0 ditolak yang berarti minimal ada satu variabel yang signifikan dalam model. Dengan demikian dapat dikatakan bahwa berdasarkan uji parsial dan uji serentak variabel nilai TOEFL, jenis kelamin, kesesuaian bidang, nilai IPK, dan asal fakultas.signifikan dalam model. Berikut adalah model probabilitas untuk setiap kategori pada variabel respon yang diperoleh dari hasil estimasi parameter regresi logistik ordinal pada Tabel 5. exp( A) exp(B ) 1 πˆ1 ( y ) = , πˆ 2 ( y ) = − πˆ1 ( y ), πˆ3 ( y ) = 1 + exp( A) 1 + exp(B ) 1 + exp(B )
5 Dimana: A = 2,753 + 0,002 X 2 − 0,293 X 3;0 − 0,273X 4;0 + 1,001X 5 + +0,534X 11;0 − 0,22X 11;1 − 0,874X 11;2 + 0,397 X 11;3
B = 5,922 + 0,002 X 2 − 0,293 X 3;0 − 0,273X 4;0 + 1,001X 5 + +0,534X 11;0 − 0,22X 11;1 − 0,874X 11;2 + 0,397 X 11;3 Tabel 5. Estimasi Parameter Regresi Logistik Ordinal Variabel Konstanta (0) Konstanta (1) X2 X 3;0 X 3;1 X 4;0 X 4;1 X5 X 11;0 X 11;1 X 11;2 X 11;3 X 11;4
B 2,753 5,922 0,002 -0,293
S.E. 0,603 0,625 0,001 0,121
Wald 4,569 9,482 2,429 -2,417
Sig. 0,000 0,000 0,015 0,016
Exp(B) 15,689 373,323 1,002 0,746
-0,273
0,126
-2,167
0,030
0,761
1,001 0,534 -0,220 -0,874 0,397
0,182 0,106 0,103 0,124 0,162
5,512 5,037 -2,140 -7,073 2,447
0,000 0,000 0,032 0,000 0,014
2,721 1,706 0,802 0,417 1,487
Interpretasi dari pemodelan regresi logistik ordinal dapat dilakukan berdasarkan nilai odds rasio. Sebagai contoh untuk setiap kenaikan satu satuan IPK S1 akan cenderung meningkatkan probabilitas untuk lulus dalam waktu 3 semester sebesar 2,721 kali. Sedangkan lulusan yang tidak memiliki kesesuaian bidang antara jenjang sarjana dengan jenjang magister memiliki probabilitas untuk lulus dalam waktu 3 semester sebesar 0,761 kali probabilitas lulusan yang memiliki kesesuaian bidang. Uji kesesuaian model menggunakan statistik uji deviance menghasilkan nilai p-value > α , yaitu 1.000. Hal ini menunjukkan bahwa H0 diterima dan berarti model sesuai. D. Analisis Regresi Probit Ordinal Dengan menggunakan prosedur yang sama seperti pada regresi logistik ordinal, berikut adalah hasil pengujian parameter model regresi probit ordinal secara parsial. Tabel 6. Hasil Uji Parsial Regresi Probit Ordinal Variabel
Koefisien
Konstanta (0) 1,8870 Konstanta (1) 3,7597 X1 0,0013 X2 0,0013 X 3;0 -0,1552 X 3;1 X 4;0 -0,1413 X 4;1 X5 0,5983 X6 0,0083 X 8;0 -0,0515 X 8;1 X 9;0 0,1706 X 9;1 -0,0045 X 9;2 X 10 -0,0014 X 11;0 0,2662 X 11;1 -0,0958 X 11;2 -0,4725 X 11;3 0,2124 X 11;4 2 Nilai 1; 0 , 05 = 3,841
Std. Error
Wk
2
P-Value
Keputusan
0,5846 0,5903 0,0012 0,0006 0,0714
10,4176 40,5687 1,1566 5,6281 4,7257
0,0012 0,0000 0,2822 0,0177 0,0297
Terima H 0 Tolak H 0 Tolak H 0
0,0724
3,8053
0,0511
Terima H 0
0,1202 0,0151 0,0855
24,7815 0,3061 0,3635
0,0000 0,5801 0,5466
Tolak H 0 Terima H 0 Terima H 0
0,1056 0,1058
2,6069 0,0018
0,1064 0,9661
Terima H 0 Terima H 0
0,0123 0,0624 0,0591 0,0726 0,0910
0,0137 18,2126 2,6261 42,4027 5,4530
0,9069 0,0000 0,1051 0,0000 0,0195
Terima H 0 Tolak H 0 Terima H 0 Tolak H 0 Tolak H 0
χ
Tabel 6 menunjukkan bahwa terdapat 4 variabel yang signifikan, yaitu nilai TOEFL, jenis kelamin, nilai IPK, dan asal fakultas. Selanjutnya variabel-variabel tersebut diuji secara serentak menggunakan uji G. dimana dihasilkan nilai p-value sebesar 0,000. Nilai tersebut kurang dari α sehingga H0 ditolak. Hal tersebut menunjukkan bahwa minimal ada satu variabel yang signifikan dalam model. Dengan demikian dapat dikatakan bahwa berdasarkan uji parsial dan uji serentak variabel nilai TOEFL, jenis kelamin, nilai IPK, dan asal fakultas.signifikan dalam model. Adapun
model terbaik dari analisis regresi probit ordinal diperoleh dari hasil estimasi parameter pada Tabel 7. Tabel 7. Estimasi Parameter Model Regresi Probit Ordinal Variabel Konstanta (0) Konstanta (1) X2 X 3;0 X 3;1 X5 X 11;0 X 11;1 X 11;2 X 11;3 X 11;4
B 1,635 3,496 0,001 -0,172
S.E. 0,345 0,354 0,006 0,069
Wald 4,735 9,878 2,657 -2,476
Sig. 0,000 0,000 0,008 0,013
Exp(B) 5,128 32,985 1,001 0,842
0,568 0,324 -0,106 -0,498 0,184
0,103 0,059 0,058 0,071 0,087
5,495 5,464 -1,834 -7,019 2,104
0,000 0,000 0,067 0,000 0,035
1,764 1,382 0,900 0,608 1,202
Pˆ (Y = 0 ) = Φ[1,635 − (C )], Pˆ (Y = 1) = Φ[3,496 − (C )] − Pˆ (Y = 0 ), Pˆ (Y = 2 ) = 1 − Φ[3,496 − (C )]
Dimana: C = 0,001X 2 − 0,172 X 3;0 + 0,568 X 5 + 0,324 X 11;0 − 0,106 X 11;1 + −0,498 X 11; 2 + 0,184 X 11;3
Interpretasi model regresi probit ordinal dapat dilakukan berdasarkan efek marginal. Sebagai contoh berikut efek marginal nilai TOEFL terhadap probabilitas masa studi lulusan mahasiswa program magister ITS. ˆ (Y = 0 ) ∂P T ˆ ˆ [ ] ( )] [ ∂X 2
= − β 2 φ γ 1 − x β = −0,001 φ 1,635 − C
∂Pˆ (Y = 1) ˆ = β 2 φ γ 1 − x T βˆ − φ γ 2 − x T βˆ = 0,001 φ {[1,635 − (C )] − φ [3,496 − (C )]} ∂X 2 ˆ (Y = 2 ) ∂P ˆ = 0,001 φ [3,496 − (C )] = βˆ2 φ γ 2 − x T β ∂X 2
{[
] [
[
]}
]
Sebagai contoh untuk lulusan nomor 1 dapat diketahui nilai efek marginal TOEFL terhadap probabilitas lulus lebih dari 4 semester, 4 semester , dan 3 semester berturut-turut adalah sebesar -0,00021, -9,8x10-5, dan 0,000307. Nilai efek marginal terbesar adalah untuk masa studi 3 semester. Hal tersebut menunjukkan bahwa nilai TOEFL memberikan pengaruh yang besar terhadap probabilitas lulusan nomor 1 untuk lulus dalam waktu 3 semester. Uji kesesuaian model regresi probit ordinal menghasilkan nilai p-value > α , yaitu 1.000. Hal ini menunjukkan bahwa H0 diterima dan berarti model sesuai. E. Perbandingan Hasil Analisis Regresi Logistik Ordinal dan Regresi Probit Ordinal Perbandingan hasil analisis regresi logistik ordinal dan regresi probit ordinal dilakukan untuk mengetahui model mana yang lebih baik untuk menjelaskan faktor-faktor yang mempengaruhi masa studi lulusan mahasiswa program magister ITS. Perbandingan dilakukan berdasarkan ketepatan klasifikasi, nilai Pseudo R2 McFadden, Akaike’s Information Criterion (AIC), dan Schwardz Bayessian Information Criterion (SBIC). Adapun hasil perbandingannya disajikan pada Tabel 8. Tabel 8. Perbandingan Kriteria Pemilihan Model
Ukuran Ketepatan Klasifikasi Pseudo R2McFadden AIC SBIC
Nilai Logistik 61,76% 0,0601 1,7510 1,7912
Probit 61,45% 0,0569 1,7554 1,7916
Berdasarkan Tabel 8 dapat diketahui bahwa model regresi logisik ordinal menghasilkan ketepatan klasifikasi dan nilai Pseudo R2 McFadden yang lebih besar daripada model regresi probit ordinal, serta menghasilkan nilai AIC dan SBIC yang lebih kecil daripada model regresi probit
6 ordinal. Oleh karena itu, dapat dikatakan bahwa pada studi kasus dalam penelitian ini model regresi logistik ordinal merupakan model yang lebih baik untuk menjelaskan faktorfaktor yang mempengaruhi masa studi lulusan mahasiswa program magister ITS. Selisih atau perbedaan antara kriteria pemilihan model model (Pseudo R2 McFadden, AIC, dan SBIC) yang dihasilkan oleh model regresi logistik ordinal dan model regresi probit ordinal relatif kecil atau hampir sama. Oleh karena itu, dilakukan resampling sebanyak 50 kali replikasi untuk mengetahui pola kriteria pemilihan model yang dihasilkan. Berdasarkan Gambar 1 dapat diketahui bahwa kriteria pemilihan model yang dihasilkan membentuk pola fluktuatif dan selalu berimpit setiap replikasi. Hal ini menunjukkan bahwa kriteria pemilihan model yang dihasilkan oleh model regresi logistik ordinal tidak selalu lebih baik daripada kriteria pemilihan model yang dihasilkan oleh model regresi probit ordinal. Dengan demikian dapat dikatakan bahwa dalam menyelesaikan permasalahan yang melibatkan variabel respon yang bersifat kategori dengan skala ordinal, model regresi logistik ordinal tidak selalu lebih baik daripada model regresi probit ordinal, tergantung pada permasalahan yang dianalisis. 1.825 Logit
0.09
1.86 Logit
Probit
Probit
[1] [2]
1.82
1.775
1.80
0.06
SBIC
1.750
0.07 A IC
Pseudo R-Sq McFadden
DAFTAR PUSTAKA
1.84
1.800 0.08
Logit Probit
dan asal fakultas dari FTSP memberikan pengaruh yang besar terhadap probabilitas untuk lulus lebih dari 4 semester. Pada studi kasus dalam penelitian ini, análisis regresi logistik ordinal lebih baik daripada análisis regresi probit ordinal karena menghasilkan ketepatan klasifikasinya dan nilai Pseudo R2 McFadden yang lebih besar, serta nilai Akaike’s Information Criterion (AIC), dan Schwardz Bayessian Information Criterion (SBIC) yang lebih kecil. Berdasarkan pola kriteria pemilihan model dari hasil resampling dapat diketahui bahwa model regresi logistik ordinal tidak selalu lebih baik daripada model regresi probit ordinal. Pada penelitian selanjutnya disarankan untuk dikembangkan dengan menggunakan kriteria pemilihan model yang lebih konsisten, yaitu AICc karena software statistik Eviews hanya menyediakan fasilitas kriteria pemilihan model berdasarkan Pseudo R2McFadden, AIC, dan SBIC. Selain itu, berdasarkan metode estimasi yang digunakan, penelitian selanjutnya disarankan untuk menggunakan Almost Unbiased Liu Estimator (AULE) untuk mengatasi kasus multikolinieritas.
1.725 1.700
0.05
10
20
30 B
40
50
[4]
1.72
[5]
1.70
1.650 0
[3]
1.74
1.675
0.04
1.78 1.76
0
10
20
30
40
50
0
10
20
B
30
40
50
B
Gambar 1. Perbandingan Kriteria Pemilihan Model
V. KESIMPULAN DAN SARAN Lulusan mahasiswa program magister ITS mayoritas memiliki masa studi 4 semester dimana mayoritas lulusan tersebut berjenis kelamin laki-laki, memiliki kesesuaian bidang antara jenjang sarjana dan magister, dan paling banyak berasal dari FMIPA. Adapun rata-rata nilai TOEFL lulusan tersebut pada saat masuk S2 sebesar 435 dan ratarata IPK pada saat S1 sebesar 3,09. Berdasarkan analisis regresi logistik ordinal, faktor yang berpengaruh terhadap masa studi lulusan mahasiswa program magister ITS adalah nilai TOEFL, jenis kelamin, kesesuaian bidang studi, nilai IPK S1, dan asal fakultas. Nilai odds ratio menunjukkan bahwa semakin tinggi nilai TOEFL dan nilai IPK S1 maka probabilitas untuk lulus dalam waktu 3 semester akan cenderung semakin tinggi. Selain itu, lulusan yang berjenis kelamin laki-laki dan memiliki kesesuaian bidang memiliki probabilitas yang lebih besar untuk lulus lebih cepat daripada lulus perempuan dan tidak memiliki kesesuaian bidang studi. Dilihat dari asal fakultasnya, probabilitas terbesar untuk lulus lebih cepat berasal dari lulusan FMIPA. Dengan menggunakan análisis regresi probit ordinal, faktor yang berpengaruh terhadap masa studi lulusan mahasiswa program magister ITS adalah nilai TOEFL, jenis kelamin, nilai IPK S1, dan asal fakultas. Efek marginal nilai TOEFL, nilai IPK S1, dan asal fakultas dari FMIPA dan FTK memberikan pengaruh yang besar terhadap probabilitas untuk lulus lebih cepat. Sedangkan jenis kelamin perempuan
[6] [7]
[8]
[9]
[10]
[11] [12] [13] [14] [15] [16] [17] [18] [19] [20]
[21]
[22]
Ratnasari, V. (2012). Estimasi Parameter dan Uji Signifikansi Model Probit Bivariat. Surabaya. Disertasi Jurusan Statistika FMIPA ITS. Fathurahman, M. (2008). Pemodelan Regresi Probit Ordinal: Studi Kasus Indeks Prestasi Kumulatif Lulusan Magister Program Pasca Sarjana ITS Surabaya. Surabaya: Tesis Jurusan Statistika FMIPA ITS. Guillory, C.W. (2008). A Multilevel Discrete Time Hazard Model of Retention Data in Higher Education. Disertasi Louisiana State University. Louisiana. Kutner, M.H., Nachtsheim, C.J., & Nether, J. (2008). Applied Linier Regression Models. New York: McGraw-Hill Companies. Gujarati, D.N. (2003). Basic Econometric (4th Edition). New York: McGraw-Hill Companies. Starck, P.L., Love, K., & McPherson, R. (2008). Calculating Graduation Rates. Journal of Professional Nursing, XXIV(4), 197-204. Padmini, I.A.S., Suciptawati, N.L.P., & Susilawati, M. (2012). Analisis Waktu Kelulusan Mahasiswa Dengan Metode Chaid: Studi Kasus Pada FMIPA Universitas Udayana. e-Jurnal Matematika, I(1), 89-93. Fuks, M., & Salazar, E. (2008). Applying Models for Ordinal Logistic Regression to the Analysis of Household Electricity Consumption Classes in Rio de Janeiro, Brazil. Energy Economics, XXX(4), 1672-1692. Kockelman, K.M., & Kweon, Y.J. (2002). Driver Injury Severity: An Application of Ordered Probit Models. Accident Analysis and Prevention, XXXIV, 313-321. Jumaidin. (2009). Bias Pada Model Regresi Logistik Ordinal dan Regresi Probit Ordinal untuk Mengetahui Faktor-faktor yang Mempengaruhi Nilai UNAS. Surabaya: Tesis Jurusan Statistika FMIPA ITS. Akbar, M.S., Mukarromah, A., & Paramita, L. (2010). Bagging Regresi Logistik Ordinal pada Status Gizi Balita. Media Statistika, III(2), 103-116. Walpole, R.E. (1995). Pengantar Statistika (Edisi Ketiga). Jakarta: PT Gramedia Pustaka Utama. Bhattacharyya, G.K., & Johnson, R.A. (1977). Statistical Concepts and Methods. New York: John Wiley & Sons, Inc. Agresti, A. (2002). Categorical Data Analysis (2nd Edition). New York: John Wiley & Sons, Inc. Hosmer, D.W., & Lemeshow, S. (2000). Applied Logistic Regression. New York: John Wiley & Sons, Inc. Finney, D.J. (1971). Probit Analysis (3th Edition). Cambridge: Cambridge University Press. Greene, W.H. (2000). Econometrics Analysis (4th Edition). New Jersey: Prentice Hall. Hocking, R.R. (1996). Methods and Applications of Linear Models: Regression and Analysis of Variance. New York: John Wiley & Sons, Inc. Efron, B. & Tibshirani, J.R. (1993). An Introduction to the Bootstrap. New York: Champman & Hall, Inc. Warsa, U.C. (2004). Keputusan Rektor Universitas Indonesia Nomor 478/SK/R/UI/2004 Tentang Evaluasi Keberhasilan Studi Mahasiswa Universitas Indonesia. Jakarta. Thoha, I.F. (2003). Studi Tentang Tingkat Keberhasilan Mahasiswa S2 Program Pascasarjana IPB. Bogor: Skripsi Departemen Statistika FMIPA IPB. Hadi, W.A., & Suhartono. (2012). Pemodelan Faktor-faktor yang Mempengaruhi Prestasi Mahasiswa Pascasarjana ITS dengan Regresi Logistik dan Neural Network, Jurnal Sains dan Seni ITS, I(1), 136-140.