SIDANG TERBUKA PROMOSI DOKTOR RINGKASAN DISERTASI
ESTIMASI PARAMETER DAN UJI SIGNIFIKANSI MODEL PROBIT BIVARIAT VITA RATNASARI 1307 301 201
PROMOTOR/CO.PROMOTOR Dr. Purhadi, M.Sc Dr. Ismaini Zain, M.Si Dr. Suhartono, M.Sc
PROGRAM DOKTOR JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2012
KATA PENGANTAR Alhamdulillah, segala puji syukur penulis panjatkan kehadirat Allah SWT yang telah melimpahkan rahmat, hidayah, petunjuk dan ilmu-Nya sehingga penulis dapat menyelesaikan disertasi dengan judul “ESTIMASI PARAMETER DAN UJI SIGNIFIKANSI MODEL PROBIT BIVARIAT”. Disertasi ini dibuat untuk memenuhi salah satu syarat untuk memperoleh gelar Doktor di Program Pascasarjana Program Studi Statistika Institut Teknologi Sepuluh Nopember Surabaya. Terselesaikannya penelitian ini tidak lepas dari bimbingan, dorongan, kerjasama, bantuan maupun motivasi yang tulus dari semua pihak yang tidak dapat penulis sebutkan satu persatu. Oleh karena itu sebagai rasa syukur, penulis ucapkan terima kasih sedalam-dalamnya kepada 1. Bapak Dr. Suhartono, M.Sc sebagai Kaprodi S3 Statistika ITS dan copromotor yang telah memberikan bimbingan, arahan dan semangat kepada penulis untuk menyelesaikan disertasi. 2. Bapak Dr. Purhadi, M.Sc, selaku promotor yang dengan sabar dan banyak meluangkan waktu untuk memberikan bimbingan, dorongan, petunjuk serta arahan dan semangat kepada penulis untuk menyelesaikan disertasi. 3. Ibu Dr. Ismaini Zain M.S, selaku co-promotor yang telah memberikan bimbingan, arahan dan semangat kepada penulis untuk menyelesaikan disertasi. 4. Bapak Prof. I. Nyoman Budiantara, M.Si, Dr. Muhammad Mashuri,M.T dan Dr. Sony Sunaryo, M.Si selaku tim penilai dan penguji yang telah banyak memberikan saran dan masukan kepada penulis. 5. Bapak Prof. Drs. H. Nur Iriawan M.Ikom, Ph.D selaku penguji yang telah memberikan wawasan kepada penulis. 6. Bapak Prof. Drs. I. Made Tirta, Dipl.Sc, M.Sc, Ph.D. selaku penguji eksternal yang telah memberikan saran dan masukan kepada penulis. 7. Bapak Dr. Brodjol Sutijo, M.Si dan Dr. Bambang Wijanarko O, M.Si selaku tim validasi yang telah banyak memberikan saran dan masukan.
i
8. Bapak Purwanto yang dengan sabar membantu peneliti untuk pengambilan data di program pascasarjana. 9. Bapak dan ibu dosen pengajar serta staf jurusan Statistika FMIPA ITS Surabaya yang telah memberikan ilmu, semangat, dan motivasi kepada penulis agar segera menyelesaikan pendidikan doktor di program pascasarjana statistika ITS. 10. Kedua orangtuaku yang selalu mendoakan dan memberikan motivasi. 11. Suami dan anak-anakku tersayang (Prasetyo, Maya, Talitha dan Nadya) yang telah memberikan ijin, doa dan selalu memberikan semangat. 12. Teman-teman S3 di jurusan Statistika ITS. 13. Semua pihak yang tidak dapat disebutkan satu persatu atas semua dukungannya sampai terselesaikannya disertasi ini.
Penulis menyadari bahwa penulisan disertasi ini masih terdapat kekurangan dan jauh dari kesempurnaan. Oleh karena itu penulis membuka segala kritik dan saran yang membangun demi kesempurnaan tulisan ini. Akhir kata, semoga disertasi ini dapat berguna dan bermanfaat bagi semua pihak. Amin.
Surabaya, Juli 2012
Penulis
ii
ABSTRAK
Model Probit Bivariat adalah salah satu pemodelan statistik yang melibatkan dua variabel respon kualitatif. Sampai saat ini permasalahan utama dalam proses pemodelan Probit Bivariat adalah masih mengasumsikan tidak ada korelasi antara kedua variabel respon. Dengan demikian, tujuan dari penelitian ini adalah mendapatkan estimasi parameter dan statistik uji pada model Probit Bivariat dengan mempertimbangkan adanya korelasi antara kedua variabel respon. Hasil kajian teoritis menunjukkan bahwa metode Maximum Likelihood Estimation (MLE) merupakan salah satu metode estimasi yang dapat digunakan untuk mendapatkan estimasi parameter pada model Probit Bivariat. Karena persamaan untuk mendapatkan estimasi parameter tidak closed form, maka digunakan metode numerik dengan iterasi Newton Raphson. Pada tahap selanjutnya, metode Maximum Likelihood Ratio Test (MLRT) dikembangkan untuk mendapatkan statistik uji serentak dan parsial. Pada uji serentak, untuk n besar telah dibuktikan bahwa statistik uji G2 asimptotik berdistribusi χ v2,α . Sedangkan pada uji parsial, untuk n besar ditunjukkan bahwa statistik uji G2 asimptotik berdistribusi χ1,2α . Selanjutnya, hasil kajian teoritis diaplikasikan pada data real untuk mengetahui faktor-faktor yang mempengaruhi keberhasilan studi mahasiswa pascasarjana di ITS. Hasil studi menunjukkan bahwa model Probit Bivariat yang mempertimbangkan adanya korelasi antar variabel respon dapat meningkatkan ketepatan klasifikasi dari 6,58 % menjadi 51,48 %. Kata kunci: Model Probit Bivariat, MLE, MLRT, Ketepatan klasifikasi.
iii
ABSTRACT Bivariate Probit Model is one of the statistical modeling that involves two qualitative response variables. Until now, the main issue of the Bivariate Probit is the modeling process still assume no correlation between the two response variables. Thus, the purpose of this research is to study further now to get the estimated parameters and test statistics of Bivariate Probit model by considering the correlation between two response variables. The results of theoretical studies indicate that the Maximum Likelihood Estimation (MLE) method is one method of estimation that can be used to obtain estimated parameters of the Bivariate Probit models. Because the equations to obtain estimated parameters are not closed form, then a numerical method with Newton Raphson iteration is used. The next step, Maximum Likelihood Ratio Test (MLRT) method is developed to obtain both simultaneous and partial statistic test. For large n, it can be proved that 2 the simultaneous test statistic G asymptotically χ v2,α distribution. While on a partial test, for large n, it has been demonstrated that the test statistic G2 asymptotically χ1,2α distribution. Finally, the study is applied to real data about the affected factors of study successfully of graduate students ITS. The results show that the Bivariate Probit models that consider the correlation between the response variables can improve the classification accuracy is from 6.58 % to 51.48 %. Keywords: Bivariate Probit model, MLE, MLRT, Classification accuracy
iv
1. PENDAHULUAN Analisis statistik yang sering digunakan untuk menjelaskan hubungan antara variabel respon dan prediktor adalah analisis regresi (Kutner, Nachtsheim, dan Neter 2008). Dalam menganalisa data statistik sangatlah diperhatikan data yang digunakan. Data dibedakan atas dua macam, yaitu data kuantitatif dan kualitatif (Winkelmann dan Boes 2006). Apabila data pada variabel respon adalah kuantitatif, maka analisis yang digunakan adalah analisis regresi klasik atau sering disebut dengan analisis regresi. Jika data pada variabel respon adalah kualitatif, maka model yang mampu menyelesaikan adalah model logit atau probit (Gujarati 2003; Green 2008). Istilah probit yang artinya probability unit, pertama kali dikenalkan oleh Bliss (1934) dalam suatu artikel di jurnal Science. Artikel ini membahas tentang probabilitas terbunuhnya tikus dengan bermacam-macam dosis pestisida. Terbunuhnya tikus sebagai variabel respon dengan dua kategori yaitu mati dan tidak mati, sedangkan dosis pestisida yang diberikan sebagai variabel prediktor. Kemudian Aitchison dan Silvey (1957) mengembangkan model probit dengan jumlah kategori variabel respon lebih dari dua. Ditinjau dari bidang yang dikaji, Bliss (1934); Aitchison dan Silvey (1957) menerapkan model probit di bidang biostatistik. Data bio-statistik pada umumnya dalam bentuk struktur data kelompok. Sedangkan Mc-Kelvey dan Zavoina (1975) adalah peneliti yang pertama kali menerapkan model probit di luar bidang bio-statistik, yaitu di bidang sosial-politik dan datanya berbentuk data individu, bukan data kelompok. Model yang dikaji dalam penelitian ini difokuskan pada model probit lebih dari satu variabel respon. Model probit yang melibatkan satu variabel respon telah banyak diterapkan oleh beberapa peneliti antara lain O’Donnell dan Connor (1996), Kockelman dan Kweon (2002), Abdel-Aty (2003), dan Song dan Lee (2005). Dalam perkembangannya, pemodelan statistik khususnya model probit tidak hanya melibatkan sebuah variabel respon akan tetapi lebih dari satu variabel. Misal
Bokosi 2007 telah menerapkan dan mengembangkan model Probit
Bivariat, sedangkan Nugraha 2010 mengembangkan model probit multivariat. Bokosi (2007) membahas tentang dinamika kemiskinan rumah tangga tahun 1998 dan tahun 2002. Sedangkan Nugraha (2010) mengkaji model probit secara teoritis. 1
Namun, kedua peneliti mengasumsikan antara variabel respon masih saling independen. Hal ini bertentangan dengan konsep multivariat, bahwa kedua variabel respon harus saling dependen. Bertitik tolak dari penelitian Bokosi (2007) serta Nugraha (2010) yang masih menerapkan model probit multivariat dengan asumsi kedua variabel saling independen, maka perlu dilakukan penelitian tentang penggunaan model probit multivariat yang melibatkan diantara variabel respon yang saling dependen. Sedangkan Cessie dan Houwelingen (1994) telah mengem-bangkan jika variabel responnya saling dependen dengan model logit. Pada umumnya, pembentukan model statistik terdapat tiga tahapan, begitu pula menentukan model probit. Tahapan tersebut adalah menentukan estimasi parameter, pengujian hipotesis dan pemilihan model terbaik. Metode estimasi yang digunakan untuk pemodelan probit univariat adalah Maximum Likelihood Estimation atau MLE (Aitchison dan Silvey 1957; McKelvey dan Zavoina 1975; Snapinn dan Small 1986; O’Donnell dan Connor 1996; Kockelman dan Kweon 2001; Abdel-Aty 2003; Song dan Lee 2005). Persamaan yang diperoleh tidak close form, sehingga McKelvey dan Zavoina (1975) serta Snapinn dan Small (1986) menyelesaikan dengan metode Newton Raphson. Gibbons dan Gok (1998) menggunakan Expectation Maximization (EM) algorithm dan Song dan Lee (2005) menggunakan Monte Carlo EM algorithm. Sedangkan Nugraha (2010) mendapatkan estimasi parameter model probit menggunakan prosedur iterasi BHHH (Berndt, Hall, Hall, dan Hausman) dan BFGS (Broyden, Fletcher, Goldfarb dan Shanno), yang mana prosedur iterasi tersebut difokuskan pada turunan pertama. Tahapan kedua adalah melakukan pengujian hipotesis. Metode yang digunakan untuk mendapatkan statistik uji model probit univariat adalah Maximum Likelihood Ratio Test atau MLRT (McKelvey dan Zavoina 1975; Snapinn dan Small 1986). Tahapan ketiga adalah memilih model terbaik. Kriteria dalam pemilihan model adalah Akaike Information Criterion (AIC) (Fujimoto 2003; Hardin dan Hilbe 2007). Semakin kecil nilai AIC, maka model semakin baik. Metode estimasi untuk pemodelan probit baik univariat maupun multivariat membutuhkan metode iterasi dalam penyelesaiannya. Perhitungan akan sulit apabila dihitung secara manual, sehingga untuk mempermudah mendapatkan estimasi parameter dilakukan dengan bantuan program komputer. Sampai saat ini, 2
beberapa software statistik masih belum mengaplikasikan model probit multivariat dengan mempertimbangkan dependensi antar variabel respon. Sehingga pada disertasi ini selain mengkaji secara teori akan dikaji pula secara empiris dengan menerapkan program estimasi dan pengujian hipotesis dengan menggunakan software matlab. Kajian teori model probit bivariat, dimulai estimasi parameter, pengujian hipotesis serta memilih model terbaik, kemudian dilanjutkan pada studi empiris. Kasus pada studi empiris membahas tentang faktor-faktor yang mempengaruhi keberhasilan mahasiswa dalam studi. Salah satu ukuran keberhasilan mahasiswa dalam studi adalah nilai Indeks Prestasi Kumulatif (IPK).
Menurut peraturan a-
kademik Institut Teknologi Sepuluh Nopember pasal 25 tahun 2009, setiap kelulusan seorang mahasiswa akan diberikan predikat kelulusan, yaitu dengan pujian (cumlaude), sangat memuaskan dan memuaskan. Predikat kelulusan ditetapkan berdasarkan nilai IPK dan masa studi dengan kategori yang telah ditentukan. Dengan demikian terdapat dua hal yang perlu dipertimbangkan dalam pengukuran keberhasilan mahasiswa dalam studi, yaitu berdasarkan nilai IPK dan masa studi. Nilai IPK semakin besar dan masa studi semakin pendek merupakan keberhasilan seorang mahasiswa dalam menyelesaikan studi.
Tujuan Penelitian Secara rinci, tujuan penelitian yang ingin dicapai adalah sebagai berikut. 1. Mendapatkan estimasi parameter model probit bivariat. 2. Mendapatkan statistik uji untuk hipotesis model probit bivariat. 3. Mendapatkan pemodelan probit bivariat dengan mengaplikasikan pada faktorfaktor yang mempengaruhi keberhasilan studi mahasiswa pascasarjana.
Orisinalitas Penelitian Beberapa peneliti yang fokus dalam membahas dan mengkaji model probit multivariat antara lain Bokosi (2007) dan Nugraha (2010). Bokosi (2007) masih mengasumsikan antar variabel respon saling independen. Sedangkan Nugraha (2010) masih mengkaji secara teoritis untuk model probit. Sampai saat ini penyelesaian model probit multivariat masih diasumsikan antara variabel respon 3
saling independen. Oleh karena itu, kontribusi penelitian ini adalah dapat menyelesaikan permasalahan dengan menggunakan model probit multivariat, khususnya model probit bivariat jika antara variabel responnya saling dependen. Secara lengkap telah dikaji secara teoritis tentang estimasi dan pengujian statistik model Probit Biner Bivariat yang saling dependen (Ratnasari, Purhadi, Zain, dan Suhartono 2011a). Selain itu telah dikaji secara teoritis tentang estimasi dan pengujian parameter model Probit Bivariat ( r × c) yang saling dependen (Ratnasari, Purhadi, Zain, dan Suhartono 2011b).
2. TINJAUAN PUSTAKA Model probit merupakan salah satu pemodelan statistik dengan variabel respon kualitatif (berkategori). Model probit univariat adalah model probit yang melibatkan hanya sebuah variabel respon. Jika variabel respon kualitatif tersebut mempunyai dua kategori maka model tersebut adalah model Probit Biner. Misal variabel respon Y merupakan variabel respon kualitatif teramati yang mempunyai dua kategori. Variabel respon Y diasumsikan berasal dari variabel Y * . 2.1 Model Probit Univariat Menurut Green (2008) variabel respon kualitatif Y berasal dari variabel respon yang tidak teramati Y * yaitu y * = βT x + ε . Dimana variabel x adalah variabel prediktor, yang dinotasikan x = 1 X 1 L X q
T
dengan ukuran
(q + 1) ×1 , dan q adalah banyaknya variabel prediktor. Parameter β adalah vektor parameter koefisien, β = β 0
ε
T
β1 L β q yang berukuran (q + 1) ×1 . Variabel
diasumsikan berdistribusi Normal dengan mean 0 dan varians 1. PDF dari
( )
variabel Y * adalah f y* =
2 1 1 exp − y* − βT x . Y * berdistribusi Normal 2π 2
(
)
dengan mean βT x dan varians satu. Estimasi Model Probit c Kategori Model Probit c kategori diawali oleh penelitian McKelvey dan Zavoina 1975. Jika variabel respon mempunyai c kategori, maka diperlukan c − 1 thres-
4
hold yaitu γ 1 < γ 2 < L < γ c −1 , seperti pada Gambar 2.1. Secara rinci adalah sebagai berikut:
Y =1 Y =2
jika y* ≤ γ 1 , jika γ 1 < y* ≤ γ 2 ,
M
Y =k
jika γ k −1 < y* ≤ γ k ,
M
Y =c
jika y* > γ c−1 .
Gambar 2.1 Grafik PDF y* dengan c Kategori
Kemudian variabel respon Y dibentuk menjadi variabel dummy. Bentuk struktur data dari variabel dummy respon Y dapat dilihat pada Tabel 2.1. Tabel 2.1 Struktur Data Variabel Dummy Respon Y dengan
Variabel Responden Respon (Y ) ke- i
c Kategori
Variabel dummy
Probabilitas
Y =1
Y =2
L
Y =c
p1
p2
L
pc
1
2
0
1
L
0
p11
p21
L
pc1
2
c
0
0
p22
L
pc 2
L
L
1
1
0
1 M 0
p12
M
L O L
M p1n
M p2n
O L
M pcn
n
5
Vektor variabel respon Y = [Y1 Y2 L Yk
L Yc −1 ] mengikuti disT
tribusi Multinomial. Probabilitas untuk pc ( x) adalah pc (x) = 1 − ( p1 (x) + p2 (x) + L + pc −1 (x) ) . Probabilitas masing-masing kategori adalah sebagai berikut: Kategori ke-1: Y = 1 mempunyai probabilitas
P(Y = 1) = P(Y * ≤ γ 1 ) = p1 (x) = Φ ( z1 ) . Kategori ke-2: Y = 2 mempunyai probabilitas
P(Y = 2) = P(γ 1 < Y * ≤ γ 2 ) = p2 (x) = Φ ( z2 ) − Φ ( z1 ) . M
Kategori ke-c: Y = c mempunyai probabilitas
P(Y = c) = P(Y * > γ c−1 ) = pc (x) = 1 − Φ( z(c −1) ) . Efek marginal variabel ∂P (Y = 1 x)
pada model Probit univariat adalah
= − β φ (γ 1 − βT x ) .
∂x ∂P (Y = 2 x) ∂x
x
= φ (γ 1 − βT x) − φ (γ 2 − βT x) β .
M
∂P(Y = c x) ∂x
= β φ (γ c −1 − βT x) .
Variabel respon Y berdistribusi Multinomial Y ~ M [1; p1 (x),L , pc −1 (x)] . Kemudian dilakukan pengambilan sampel sebanyak n observasi, i = 1, 2,L , n . Oleh karena itu fungsi likelihood adalah n
L (β ) = ∏ [ p1 ( x i ) ] i =1
y1i
[ p2 ( x i ) ]
y2 i
L [ pc ( x i ) ]
yci
.
Kemudian dilakukan ln likelihood, yaitu: n
c
ln L(β) = ∑∑ yki ln pk ( xi ) . i =1 k =1
Langkah berikutnya adalah menurunkan ln-likelihood terhadap β .
6
1 ∂pk (xi ) ∂ ln L(⋅) n c = ∑∑ yki . ∂β pk (xi ) ∂β i =1 k =1
(2.1)
Persamaan 2.1 menunjukkan bentuk yang tidak closed form, maka untuk memperoleh penaksir β digunakan prosedur iterasi metode Newton Raphson. Iterasi ke m metode Newton Raphson adalah (Hardin dan Hilbe 2007) −1
β( m ) = β ( m −1) − H (β( m −1) ) g(β ( m −1) ) . Proses akan berhenti, jika β ( m ) − β ( m−1) ≤ Θ , dengan Θ adalah bilangan yang sangat kecil. Komponen yang diperlukan pada proses iterasi metode Newton Raphson adalah menentukan vektor turunan pertama fungsi likelihood terhadap parameter β atau vektor g (β) dan menentukan matriks turunan kedua fungsi likelihood terhadap parameter β atau matriks H (β) . Secara matematis vektor
g (β) dan matriks H (β) adalah ∂ ln L (β) g (β) = ∂β ( q +1)×1 dan
∂ 2 ln L(β) H(β) = . T ∂β∂β ( q +1)×( q +1)
Untuk menyelesaikan Persamaan 2.1 diperlukan beberapa konsep dasar tentang turunan. Berikut akan diberikan beberapa konsep dasar tentang turunan vektor.
Lemma 2.1 (Dudewics dan Mishra 1988) a. Jika diberikan vektor a yang berukuran p × 1 dan w berukuran p × 1 , maka
∂ (aT w ) =w. ∂a b. Jika Φ (aT w ) adalah distribusi kumulatif normal, maka dimana φ (aT w ) adalah distribusi normal standar. c. Jika φ (aT w ) adalah distribusi normal standar, maka
7
∂Φ(aT w ) = a φ (aT w ) , ∂w
∂φ (aT w ) = −a (aT w )φ (aT w ) . ∂w Turunan probabilitas tiap kategori adalah sebagai berikut: Turunan probabilitas untuk Yi = 1 adalah
∂p1 (xi ) = − xi φ ( z1i ) . ∂β
Turunan probabilitas untuk Yi = 2 adalah
∂p2 (xi ) = − xi φ ( z2 i ) + xi φ ( z1i ) . ∂β
M
Turunan probabilitas untuk Yi = k adalah
∂pk (xi ) = −xi φ ( zki ) − φ ( z( k −1)i ) . ∂β
M
Pada akhirnya turunan probabilitas untuk Yi = c adalah
∂pc ( x i ) = x i φ ( z( c −1) i ) . ∂β Elemen matriks Hessian adalah menurunkan Persamaan 2.1 terhadap β , yaitu: 2 ∂ 2 ln L(β) n c 1 T = ∑∑ yki ( − xi xi ) φ ( zk i ) − φ ( z( k −1) i ) φ ( zk i ) − φ ( z( k −1)i ) + ∂β∂βT p ( x ) i =1 k =1 k i
1 T yki xi xi zki φ ( zki ) − z( k −1)i φ ( z( k −1) i ) . pk (xi )
(2.2)
Merujuk pada matriks Hessian H(β) yang terdapat pada Persamaan 2.2, dan vektor g(β) pada Persamaan 2.1, dengan menggunakan prosedur iterasi Newton Raphson akan diperoleh estimasi parameter β untuk model probit c kategori.
Pengujian Signifikansi Parameter Model Probit Univariat Hipotesis suatu parameter perlu dilakukan pengujian. Pengujian ini berguna untuk mengetahui variabel-variabel yang masuk dalam model dan mempunyai kontribusi yang nyata terhadap perubahan variabel respon. Misalkan H0 dan H1 adalah H0 : θ ∈ ω dan H1 : θ ∈ω c , dengan
8
f ( yi ; β0 , β1 , β 2 , L, β q ) untuk i = 1, 2, L , n . Parameter ( β 0 , β1 , β 2 , L , β q ) dinotasikan dengan Ω . Metode yang digunakan untuk menentukan statistik uji dalam pengujian hipotesis adalah menggunakan metode Maximum Likelihood Ratio Test (MLRT). Misalkan
ω
subset dari Ω , maka rasio likelihood dinotasikan dengan
λ=
L (ω ) L (ωˆ ) max . = ω ˆ ) max L ( Ω ) L (Ω Ω
Daerah penolakan pada statistik uji ini adalah tolak H0 jika ( y : λ ≤ λ0 ) , dimana
λ0 adalah 0 ≤ λ 0 ≤ 1 (Casella dan Berger 2002). Pengujian Signifikansi Parameter Secara Serentak Model Probit c Kategori Secara umum fungsi likelihood di bawah populasi L(Ω) untuk model probit c kategori adalah sebagai berikut: n
L (Ω ) = ∏ Φ (γ 1 − βT x i ) i =1
y1i
Φ (γ 2 − βT x i ) − Φ (γ 1 − βT xi )
y2 i
L 1 − Φ (γ ( c −1) − βT xi )
Kemudian L(Ω) diln-kan, yaitu n
ln L (Ω) = ∑ y1i ln Φ (γ 1 − βT xi ) + y2i ln Φ (γ 2 − βT xi ) − Φ (γ 1 − βT xi ) + L + i =1
yci ln 1 − Φ (γ ( c −1) − βT x i ) .
Langkah selanjutnya ln L(Ω) diturunkan terhadap β , yaitu:
y1i ∂Φ (γ 1 − βT xi ) n y2 i ∂ ln L(Ω) n = ∑ × + ∑ T T T ∂β ∂β i =1 Φ (γ 1 − β x i ) i =1 Φ (γ 2 − β xi ) − Φ(γ 1 − β xi )
(
)
∂ Φ (γ 2 − βT xi ) − Φ (γ 1 − βT xi ) +L + ∂β
(
∂ 1 − Φ (γ ( c −1) − βT xi ) yci ∑ 1 − Φ(γ − βT x ) ∂β i =1 ( c −1) i n
9
) .
(2.3)
yci
.
Karena Persamaan 2.3 merupakan persamaan yang tidak closed form, maka persamaan tersebut diselesaikan menggunakan penyelesaian numerik. Prosedur iterasi yang digunakan adalah metode iterasi Newton Raphson. Dengan demikian
ˆ = { βˆ , βˆ , βˆ ,K, βˆ } . ˆ ) , dimana Ω didapatkan L(Ω 0 1 2 q n
ˆ ) = ∏ Φ (γ − βˆ T x ) L (Ω 1 i
y1i
i =1
ˆT ˆT Φ (γ 2 − β xi ) − Φ (γ 1 − β xi )
1 − Φ(γ ( c −1) − βˆ T xi )
y2 i
L×
yci
(2.4)
Fungsi likelihood di bawah H0 adalah n
L(ω ) = ∏ f ( y i ; β 0 ) . i =1
Dari max L (ω ) didapatkan ωˆ = { βˆ0 } , sehingga diperoleh ln L(ωˆ ) , yaitu: ω
n
L (ωˆ ) = ∏ Φ (γ 1 − βˆ0 ) i =1
n
= ∏ pˆ1* ( xi )
y1i
i =1
y1i
Φ (γ 2 − βˆ0 ) − Φ (γ 1 − βˆ0 )
pˆ 2* (x i )
y2 i
L pˆ c* ( xi )
yci
y2 i
L 1 − Φ (γ ( c −1) − βˆ0 )
.
yci
(2.5)
Likelihood ratio (G2 ) diperoleh dengan menggunakan perbandingan antara Persa-
maan 2.4 dan 2.5 yaitu ˆ ) − ln L(ωˆ ) , G 2 = 2 ln L(Ω
dimana n
L(ωˆ ) = ˆ) L (Ω
∏ pˆ1* (xi ) pˆ 2* (xi ) i =1 y1i
y2 i
L pˆ c* (xi )
∏ [ pˆ1 (xi )] [ pˆ 2 (xi )]
y2 i
L[ pˆ c (xi )]
n
y1i
i =1
n
yci
yci
=
c
∏ ∏ pˆ *g (xi )
y gi
∏ ∏ pˆ g (xi )
y gi
i =1 g =1 n c
.
i =1 g =1
2 2 Tolak H0 jika G > χv,α , dimana v adalah banyaknya parameter model di bawah
populasi
dikurangi
v = (q + 1) − 1 = q .
banyaknya
parameter
model
di
bawah
H0,
yaitu
Likelihood ratio (G 2 ) asimptotik berdistribusi χ 2v untuk
n → ∞ (Agresti 2002). Nilai
χ 2v;α dapat diperoleh dari tabel Chi-Square.
10
Pengujian Signifikansi Parameter Secara Parsial Model Probit Univariat Setelah dilakukan pengujian serentak, langkah selanjutnya adalah pengujian parsial. Pada pengujian parsial, dapat diketahui kontribusi setiap variabel prediktor. Pengujian hipotesis uji parsial sebagai berikut. H0 :
βt = 0 .
H1 :
β t ≠ 0 dengan t = 0,1, 2,L , q .
Himpunan dibawah populasi adalah Ω = {β 0 , β1 ,L , β t ,L , β q } . Himpunan dibawah H0 adalah ω = {β 0 , β1 ,L , β t −1 , β t +1 ,L , β q } . ˆ ) − ln L(ωˆ ) . Statistik uji untuk uji parsial adalah G 2 = 2 ln L(Ω
Likelihood ra-
tio G 2 dengan n → ∞ , asimptotik berdistribusi χ12 . Keputusan untuk menolak H0 jika G 2 > χ1,2α .
3. Metodologi Penelitian Pada bab tiga dibahas tentang jenis penelitian yang berisi kajian teori dan empiris. Tahapan pada kajian teoritis meliputi estimasi parameter dan pengujian hipotesis untuk model Probit Biner Bivariat (2 × 2) , model Probit Bivariat (3 × 3) dan secara umum model Probit Bivariat ( r × c) . Sedangkan tahapan kajian empiris meliputi sumber data, variabel penelitian serta aplikasi tentang mengevaluasi keberhasilan studi mahasiswa pascasarjana.
3.1 Estimasi Parameter Model Probit Bivariat Untuk mendapatkan estimasi parameter model Probit Bivariat sebagai berikut: Membuat tabel kontingensi. Menentukan probabilitas di setiap sel. Menentukan fungsi likelihood dari variabel random. Untuk mendapatkan parameter β1 , β2 , fungsi likelihood di ln-kan. Memaksimumkan fungsi likelihood dengan menurunkan ln fungsi likeli-
hood terhadap parameter β dan kemudian menyamakan dengan nol. Jika diperoleh bentuk yang tidak closed form, maka untuk memperoleh penaksir maksimum likelihood diselesaikan dengan penyelesaian nume-
11
rik. Prosedur iterasi yang digunakan metode Newton Raphson. Terlebih dahulu menentukan vektor g(β) , yang merupakan turunan pertama dari fungsi likelihood terhadap parameter β . Kemudian menentukan matrik
H(β) , yang elemen-elemennya merupakan turunan kedua terhadap parameter β . 3.2. Pengujian Hipotesis Model Probit Bivariat Untuk mendapatkan statistik uji serentak dan parsial model Probit Bivariat adalah sebagai berikut: Tahapan pengujian serentak model Probit Bivariat, yaitu: a. Menentukan hipotesis H 0 : β11 = β12 = L = β1q = 0 dan
β 21 = β 22 = L = β 2 q = 0 .
H1: paling sedikit ada satu β rs ≠ 0 , dengan r = 1, 2 dan s = 1, 2,L , q . b. Membuat fungsi likelihood di bawah populasi L (Ω ) . Dari max L ( Ω ) didapatkan Ωˆ yaitu Ω
ˆ = { βˆ , βˆ ,K , βˆ , βˆ , βˆ ,K , βˆ } . Ω 10 11 1q 20 21 2q ˆ). Setelah diperoleh βˆ dapat dihitung ln L (Ω
c. Membuat fungsi likelihood dibawah H0 atau jika H0 benar L (ω ) . * Dari max L (ω ) didapatkan ωˆ = { βˆ10* , βˆ20 }.
ω
Setelah diperoleh estimasi βˆ * , didapatkan ln L(ωˆ ) . ˆ). d. Membandingkan antara L(ωˆ ) dan L(Ω
L(ωˆ ) ˆ G 2 = −2ln Λ = −2ln = 2ln L(Ω) − 2ln L(ωˆ ). ˆ L ( Ω ) e. Menentukan distribusi dari G 2 . f. Menentukan daerah penolakan H0. Tahapan pengujian parsial model Probit Bivariat yaitu: a. Menentukan hipotesis
H0 : β rt = 0 .
12
H1: β rt ≠ 0 , dengan r = 1, 2 dan t = 0,1, 2,L , q . b. Membuat fungsi likelihood dibawah H0 atau jika H0 benar L(ω * ) . Dari max L (ω ) didapatkan ωˆ * = { βˆ10** , βˆ11** ,L , βˆr**( t −1) , βˆr**( t +1) ,L , βˆ2**q } . ω
Setelah diperoleh βˆ ** , maka didapat ln L(ωˆ * ) . ˆ). c. Membandingkan antara L(ωˆ * ) dan L(Ω
L(ωˆ * ) ˆ ) − 2ln L(ωˆ * ) . = 2ln L(Ω G 2 = −2ln Λ = −2ln ˆ) L (Ω d. Menentukan distribusi dari daerah G 2 e. Menentukan daerah penolakan H0.
3.3
Pemodelan Keberhasilan Studi Mahasiswa Pascasarjana
Model Probit Bivariat diaplikasikan pada data kelulusan mahasiswa program pascasarjana di ITS dengan 2 variabel respon dan 7 variabel prediktor.
Sumber Data Pada penelitian ini, data yang digunakan adalah data sekunder lulusan mahasiswa pascasarjana ITS program magister lulusan Maret 2008 – Maret 2011.
Variabel Penelitian Penelitian ini membahas tentang faktor-faktor yang mempengaruhi keberhasilan seorang mahasiswa dalam studi. Variabel respon yang diukur adalah
Y1 = Nilai Indeks Prestasi Kumulatif (IPK). Dibedakan atas 2 kategori (IPK < 3,5 ; IPK ≥ 3,5). Dibedakan atas 3 kategori (IPK < 3,5 ; 3,5 ≤ IPK < 3,75 ; IPK ≥ 3,75).
Y2 = Masa studi. Dibedakan atas 2 kategori (tidak tepat ; tepat). Dibedakan atas 3 kategori (> 4 semester ; 4 semester ; 3 semester). Sedangkan variabel prediktor yang diduga mempengaruhi keberhasilan studi adalah sebagai berikut.
X 1 = Nilai Test Potensi Akademik (TPA). X 2 = Nilai TOEFL awal (pada saat masuk S2).
13
X 3 = Jenis kelamin (perempuan ; laki-laki). X 4 = Kesesuaian bidang studi dengan S1 (tidak sesuai ; sesuai). X 5 = Nilai IPK S1. X 6 = Lama waktu dari lulus S1 ke S2. X 7 = Sumber dana (sendiri ; beasiswa). Langkah-langkah Analisis Langkah-langkah analisis pemodelan probit bivariat adalah a. Melakukan identifikasi variabel respon, dengan cara menguji apakah antar variabel respon saling dependen (variabel nilai IPK S2 dan masa studi). Metode yang digunakan adalah metode Chi-Square. b. Melakukan identifikasi variabel prediktor, dengan cara mendeteksi korelasi antara variabel-variabel prediktor (variabel nilai TPA, nilai TOEFL, jenis kelamin, kesesuaian bidang, nilai IPK S1, lama lulus dari S1 ke S2 dan sumber dana). c. Menentukan estimasi parameter model Probit Bivariat. d. Menguji secara serentak model model Probit Bivariat. e. Memilih model terbaik dengan menggunakan kriteria AIC.
4. ANALISIS DAN PEMBAHASAN Bab ini akan dikaji tentang model Probit Bivariat, baik teoritis (estimasi parameter dan pengujian hipotesis) maupun empiris. 4.1 Model Probit Biner Bivariat (2 × 2) Model Probit Biner Bivariat (2× 2) adalah model probit yang memiliki dua variabel respon kualitatif yang masing-masing variabel mempunyai dua kategori. Misal kedua variabel respon tersebut adalah variabel Y1 dan Y2 , yang diasumsikan berasal dari variabel yang tidak teramati Y1* dan Y2* yaitu y1* = β1T x + ε1 dan y2* = βT2 x + ε 2 , T
dimana β1 = β10 β11 β12 L β1q ,
14
T
β 2 = β 20 β 21 β 22 L β 2 q ,
x = 1 x1 x2 L xq
T
dan q adalah banyaknya variabel prediktor
x , β1 dan β 2 berukuran ( q + 1) × 1 .
Pembentukan kategori pada variabel respon yaitu dengan memberikan threshold tertentu ( γ dan δ ) pada variabel yang tidak teramati Y1* dan Y2* . Kategori yang dibentuk dari y1* = β1T x + ε1 adalah
Y1 = 0 jika y1* ≤ γ dan Y1 = 1 jika y1* > γ . Sedangkan dari y2* = βT2 x + ε 2 , kategori yang dibentuk
Y2 = 0 jika y2* ≤ δ dan Y2 = 1 jika y2* > δ . Probabilitas pada tabel kontingensi (2 × 2) dengan z1 = γ − β1T x dan z2 = δ − βT2 x , secara rinci dijabarkan sebagai berikut: p11 ( x) = 1 − Φ ( z1 ) − Φ ( z2 ) + Φ ( z1 , z2 ) ,
(4.1)
p10 ( x) = Φ ( z2 ) − Φ ( z1 , z2 ) ,
(4.2)
p01 (x) = Φ ( z1 ) − Φ ( z1 , z2 ) ,
dan
(4.3)
p00 ( x) = Φ ( z1 , z2 ) .
(4.4)
Nilai marginal p1 (x) dan p2 (x) secara berturut adalah
p1 (x) = 1 − Φ( z1 ) dan p2 (x) = 1 − Φ( z2 ) . Estimasi Maksimum Likelihood Model Probit Biner Bivariat (2 × 2) Berikut ini diberikan suatu proposisi untuk memperoleh estimasi parameter β pada model Probit Biner Bivariat (2 × 2) . Proposisi 4.1 Jika model Probit Biner Bivariat (2 × 2) diberikan oleh Persamaan 4.1 sampai 4.4 dimana z1 = γ − β1T x dan z2 = δ − βT2 x , maka estimasi parameter β dapat diperoleh dengan metode MLE yang menggunakan perhitungan iterasi Newton Raph-
15
son, dengan elemen vektor g(β) pada Persamaan 4.5, 4.6 dan elemen matriks Hessian H (β ) pada Persamaan 4.7, 4.8, 4.9.
Elemen vektor g(β) adalah sebagai berikut: ∂ ln L(⋅) n = ∑ xi ( − ai y11i + bi y10 i + ci y01i − d i y00i ) ϕ 1i + ( ai y11i − ci y01i ) φ ( z1i ) ] ∂β1 i =1
(4.5) n ∂ ln L (⋅) = ∑ x i ( − ai y11i + bi y10i + ci y01i − d i y00 i ) ϕ 2 i + ( ai y11i − bi y10 i ) φ ( z 2 i ) ∂β 2 i =1
(4.6) dengan
1 ai = p2i − p01i
1 , bi = p1i − p2i + p01i
1 1 , ci = , di = p01i 1 − p1i − p01i
z − z ρ 1 ϕ 2i = φ ( z2i ) 1 + erf 1i 2i . 2(1 − ρ 2 ) 2 Elemen matriks Hessian H (β ) adalah sebagai berikut: a.
(
n ∂ 2 ln L (⋅) 2 x i xTi − [φ ( z1i ) ] ai2 y11i + ci2 y01i + 2φ ( z1i ) ϕ 1i ai2 y11i + ci2 y01i + = ∑ T ∂β1 ∂β1 i =1
z1iφ ( z1i ) [ ai y11i − ci y01i ] − ϕ12i ai2 y11i + bi2 y10i + ci2 y01i +di2 y00i +
)
− ϕ 11i [ ai y11i − bi y10 i − ci y01i + d i y00 i ] ,
(4.7)
dengan
ϕ 11i = z1i ϕ 1 + ρ φ ( z1i , z2i ) . b.
∂ 2 ln L(⋅) n = ∑ xi xTi − φ ( z2i ) φ ( z1i ) ai2 y11i + ∂β1 ∂βT2 i =1
(
− ϕ 2i ϕ 1i ai2 y11i + bi2 y10 i + ci2 y01i + d i2 y00 i +
φ ( z1i ) ϕ 2i ai2 y11i + ci2 y01i + φ ( z2i ) ϕ 1i ai2 y11i + bi2 y10i + φ ( z1i , z2i ) [ ai y11i − bi y10i − ci y01i + d i y00i ]) .
16
(4.8)
c.
(
n ∂ ln L (⋅) 2 xi xTi − [ φ ( z2 i ) ] ai2 y11i + bi2 y10 i + 2 φ ( z2 i ) ϕ 2i ai2 y11i + bi2 y10 i + = ∑ T ∂β 2 ∂β 2 i =1
z2i φ ( z2i ) [ ai y11i − bi y10i ] − ϕ 22i ai2 y11i + bi2 y10i + ci2 y01i + di2 y00i +
ϕ 22 i [ ai y11i − bi y10 i − ci y01i + d i y00 i ]) ,
(4.9)
dengan
ϕ 22i = z2i ϕ 2i + ρ φ ( z1i , z2i ) . Setelah vektor g(β) dan matriks Hessian H (β ) didapat, maka dilakukan proses iterasi Newton Raphson. Persamaan proses iterasi Newton Raphson adalah seba−1
gai berikut β( m ) = β ( m −1) − H (β( m −1) ) g(β ( m −1) ) . Parameter β ( m ) adalah parameter
β dengan iterasi ke- m . Proses iterasi untuk parameter β akan berhenti jika β ( m ) − β ( m−1) ≤ Θ dimana Θ adalah bilangan yang sangat kecil.
Pengujian Hipotesis Model Probit Biner Bivariat (2 × 2) Pengujian hipotesis pada model Probit Biner Bivariat (2 × 2) terdapat dua tahapan, yaitu pengujian serentak dan parsial. Pengujian serentak adalah menguji apakah variabel X 1 , X 2 ,..., X q mempunyai pengaruh yang signifikan terhadap variabel respon Y1 dan Y2 . Untuk pengujian serentak diberikan suatu proposisi sebagai berikut.
Proposisi 4.2 Jika model Probit Biner Bivariat (2 × 2) diberikan oleh Persamaan 4.1 sampai 4.4 dan ingin diuji hipotesis H 0 : β11 = β12 = L = β1q = 0 dan β 21 = β 22 = L = β 2 q = 0
H 1 : paling sedikit ada satu βrs ≠ 0 , dengan r = 1, 2 dan s = 1, 2,L , q , maka a. Statistik uji hipotesis ini adalah n pˆ − pˆ 01i G 2 = 2∑ y11i ln 2*i * i =1 pˆ 2i − pˆ 01i
1 − pˆ1i − pˆ 01i y00i ln * * 1 − pˆ1i − pˆ 01i
pˆ1i − pˆ 2i + pˆ 01i + y10i ln * * * pˆ1i − pˆ 2i + pˆ 01i
.
17
pˆ 01i + y01i ln * pˆ 01i
+
d b. G 2 → W , n → ∞ dimana W ~ χ v2 .
c. Hipotesis diatas mempunyai daerah penolakan G 2 > χ v2,α .
Setelah pengujian secara serentak, tahapan selanjutnya adalah pengujian parsial. Untuk menentukan statistik uji pada pengujian parsial serupa seperti pada pengujian serentak. Berikut ini diberikan suatu proposisi untuk pengujian parsial.
Proposisi 4.3 Jika model Probit Biner Bivariat (2 × 2) diberikan oleh Persamaan 4.1 sampai 4.4 dan akan diuji hipotesis H0 :
β rt = 0
H1 :
β rt ≠ 0 dengan r = 1, 2 dan t = 0,1, 2,L , q maka
a. Statistik uji hipotesis ini adalah n pˆ pˆ pˆ i pˆ 00i y G 2 = 2 ∑ y11i ln 11**i + y10 i ln **10 i + y01i ln 01 + ln ** 00 i ** i =1 pˆ11i pˆ10i pˆ 01i pˆ 00i
.
d b. G 2 → W , n → ∞ dimana W ~ X 12 .
c. Hipotesis diatas mempunyai daerah penolakan G 2 > χ1,2α .
4.2 Model Probit Bivariat (3×3) Model Probit Bivariat (3×3) memiliki dua variabel respon yang masing-masing mempunyai 3 kategori. Kategori pada variabel respon terbentuk dari va-riabel Y1* dan Y2* yaitu y1* = β1T x + ε1 dan y2* = βT2 x + ε 2 dengan threshold tertentu, misal
γ 1 , γ 2 dan δ1 , δ 2 . dimana β1 = β10 β11 β12 L β1q
T
T
dan β 2 = β 20 β 21 β 22 L β 2 q ,
T
x = 1 x1 x2 L xq , q adalah jumlah variabel prediktor .
Tiga kategori yang dibentuk dari y1* = β1T x + ε1 adalah
Y1 = 1 jika y1* ≤ γ 1 ,
18
Y1 = 2 jika γ 1 < y1* ≤ γ 2 , Y1 = 3 jika y1* > γ 2 . Tiga kategori yang dibentuk dari y2* = βT2 x + ε 2 adalah
Y2 = 1 jika y2* ≤ δ1 , Y2 = 2 jika δ1 < y2* ≤ δ 2 , Y2 = 3 jika y2* > δ 2 . Kedua variabel respon yang telah terkategori, dibentuk menjadi tabel kontingensi Y1 dan Y2 . Jika masing-masing variabel respon mempunyai 3 kategori, maka akan terbentuk tabel kontingensi (3 × 3) . Vektor variabel respon Y berdistribusi Multinomial, dengan probabilitas sebagai berkut:
p33 (x) = 1 − Φ( z12 ) − Φ( z22 ) + Φ( z12 , z22 ) ,
(4.10)
p32 (x) = Φ( z22 ) − Φ( z12 , z22 ) − Φ( z21 ) + Φ( z12 , z21 ) ,
(4.11)
p31 (x) = Φ( z21 ) − Φ( z12 , z21 ) ,
(4.12)
p23 (x) = Φ( z12 ) − Φ( z11 ) − Φ( z12 , z22 ) + Φ( z11 , z22 ) ,
(4.13)
p22 (x) = Φ( z12 , z22 ) + Φ( z11 , z22 ) − Φ( z12 , z21 ) + Φ( z11 , z21 ) ,
(4.14)
p21 (x) = Φ( z12 , z21 ) − Φ( z11 , z21 ) ,
(4.15)
p13 (x) = Φ( z11 ) − Φ( z11 , z22 ) ,
(4.16)
p12 (x) = Φ( z11 , z22 ) − Φ( z11 , z21 ) ,
(4.17)
p11 (x) = Φ( z11 , z21 ) .
(4.18)
dengan z11 = γ 1 − β1T x , z12 = γ 2 − β1T x , z21 = δ1 − βT2 x , dan z22 = δ 2 − βT2 x . Estimasi Maksimum Likelihood Model Probit Bivariat (3 × 3) Untuk mendapatkan estimasi parameter β dalam model Probit Bivariat (3 × 3) diberikan proposisi sebagai berikut. Proposisi 4.4 Jika model Probit Bivariat (3 × 3) diberikan pada Persamaan 4.10 sampai 4.18, dimana z11 = γ 1 − β1T x , z12 = γ 2 − β1T x dan z21 = δ1 − βT2 x , z22 = δ 2 − βT2 x maka esti-
19
masi β dapat diperoleh dengan metode MLE menggunakan perhitungan iterasi Newton Raphson, dengan elemen vektor g(β) pada Persamaan 4.19, 4.20 dan elemen matriks Hessian pada Persamaan 4.21, 4.22, 4.23. Turunan pertama ln L(⋅) terhadap β1 adalah ∂ ln L(⋅) n = ∑ xi [φ ( z12i )(ai y33i − d i y23i ) + φ ( z11i )(d i y23i − gi y13i ) + ∂β1 i =1
ϕ 1(22)i (− ai y33i + bi y32i + d i y23i − ei y22i ) + ϕ 1(21)i (−bi y32i + ci y31i + ei y22i − f i y21i ) + ϕ 1(12) i (− d i y23i + ei y22i + g i y13i − hi y12i ) + ϕ 1(11)i (−ei y22i + fi y21i + hi y12i − ji y11i )] (4.19) dengan ai =
1 1 1 1 1 1 , bi = , ci = , di = , ei = , fi = , p33i p32i p31i p23i p22i p21i
gi =
1 1 1 1 , hi = , dan ji = . = p13i p12 i p11i 1 − p33i − L − p11i
1 2
z − z ρ 21i 11i ; 2(1 − ρ 2 )
ϕ 1(11)i = φ ( z11i ) 1 + erf
ϕ 1(12)i
1 = φ ( z11i ) 1 + erf 2
1 2
z − z ρ 22i 11i ; 2(1 − ρ 2 ) z − z ρ 21i 12 i ; 2(1 − ρ 2 )
ϕ 1(21) i = φ ( z12i ) 1 + erf
1 2
z − z ρ 22 i 12i . 2(1 − ρ 2 )
ϕ 1(22) i = φ ( z12i ) 1 + erf
Dengan cara yang serupa seperti mendapatkan turunan ln L(⋅) terhadap β1 , akan diperoleh turunan ln L(⋅) terhadap β 2 . Persamaan turunan ln L(⋅) terhadap β 2 adalah sebagai berikut.
20
∂ ln L(⋅) n = ∑ xi [ φ ( z22i ) (ai y33i − bi y32i ) + φ ( z21i ) (bi y32i − ci y31i ) + ∂β 2 i =1
ϕ 2(22)i (− ai y33i + bi y32i + di y23i − ei y22i ) + ϕ 2(21) i (−bi y32i + ci y31i + ei y22i − f i y21i ) + ϕ 2(12)i (−d i y23i + ei y22i + gi y13i − hi y12i ) + ϕ 2(11) i (−ei y22i + fi y21i + hi y12i − ji y11i )] . (4.20) dengan
1 2
z − z ρ 11i 21i , 2(1 − ρ 2 )
ϕ 2(11) i = φ ( z21i ) 1 + erf
1 2
z − z ρ 11i 22i , 2(1 − ρ 2 )
ϕ 2(12)i = φ ( z22i ) 1 + erf
1 2
z − z ρ 12 i 21i , 2(1 − ρ 2 )
ϕ 2(21)i = φ ( z21i ) 1 + erf
1 2
z − z ρ 12i 22 i . 2(1 − ρ 2 )
ϕ 2(22) i = φ ( z22i ) 1 + erf
Dari Persamaan 4.19 dan 4.20 didapatkan persamaan yang tidak closed form, oleh karena itu untuk memperoleh penaksir parameter pada model Probit Bivariat
(3 × 3) digunakan iterasi Newton Raphson. Elemen-elemen pada matriks Hessian untuk model Probit Bivariat (3 × 3) adalah sebagai berikut. a.
∂ 2 ln L(⋅) n = ∑ xi xTi − φ ( z12i )2 ai2 y33i + di2 y23i − φ ( z11i )2 di2 y23i + gi2 y13i + T ∂β1 ∂β1 i =1
(
2 φ ( z12 i ) φ ( z11i ) d i2 y 23i + z11i φ ( z11i ) [ d i y 23i − g i y13i ] + z12 i φ ( z12 i ) [ ai y33i − d i y 23i ] +
2ϕ 1(12) i ( d i2 y23i + g i2 y13i )φ ( z11i ) − d i2 y23iφ ( z12 i ) + 2ϕ 1(22) i ( ai2 y33i + d i2 y23i )φ ( z12i ) − d i2 y23iφ ( z11i ) + 2 2 2 2 2 −ϕ 1(11) i ei y22 i + f i y21i + hi y12 i + ji y11i + 2 2 2 2 2 −ϕ 1(12) i d i y 23i + ei y22 i + g i y13i + hi y12 i +
21
−ϕ 1(2 21) i bi2 y32i + ci2 y31i + ei2 y22i + f i 2 y21i + 2 2 2 2 2 −ϕ 1(22) i ai y33i + bi y32 i + d i y23i + ei y22 i +
2ϕ 1(11) i ϕ 1(12) i ei2 y22i + hi2 y12 i − 2ϕ 1(11) i ϕ 1(22) i ei2 y22 i + 2ϕ 1(11) i ϕ 1(21) i ei2 y22i + fi 2 y21i − 2ϕ 1(12) i ϕ 1(21) i ei2 y22 i + 2ϕ 1(12) i ϕ 1(22) i d i2 y23i + ei2 y22i + 2ϕ 1(21) i ϕ 1(22) i bi2 y32 i + ei2 y22 i +
ϕ 11(11)i [ −ei y22i + fi y21i + hi y12i − ji y11i ] + ϕ 11(12)i [ −di y23i + ei y22i + gi y13i − hi y12i ] + ϕ 11(21)i [ −bi y32i + ci y31i + ei y22i − fi y21i ] + ϕ 11(22) i [ − ai y33i + bi y32i + d i y23i − ei y22 i ]) .
(4.21)
dengan
ϕ 11(11) i = z11i ϕ 1(11)i + ρφ ( z11i , z21i ) . ϕ 11(12)i = z11i ϕ 1(12) i + ρ φ ( z11i , z22i ) . ϕ 11(21) i = z12i ϕ 1(21)i + ρ φ ( z11i , z21i ) . ϕ 11(22)i = z12i ϕ 1(22)i + ρ φ ( z12i , z22i ) . b.
∂ 2 ln L(⋅) n = ∑ xi xiT (− ai2 y33i φ ( z22i ) φ ( z12 i ) + φ ( z22i , z21i ) [ ei y22i − fi y21i − hi y12 i + T ∂β1∂β 2 i =1
− ji y11i ] + φ ( z12i , z21i ) [bi y32i − ci y31i − ei y22i + fi y21i ] +
φ ( z12i , z22i ) [ ai y33i − bi y32i − di y23i + ei y22i ] + φ ( z11i , z22i ) [ d i y23i − ei y22i − gi y13i + hi y12i ] + φ ( z11i ) ϕ 2(12)i d i2 y23i + g i2 y13i − φ ( z11i ) ϕ 2(22)i d i2 y23i + φ ( z12 i ) ϕ 2(22) i ai2 y33i + d i2 y23i − φ ( z12 i ) ϕ 2(12) i d i2 y23i + φ ( z21i ) ϕ 1( 21) i bi2 y32i + ci2 y31i − φ ( z 22i ) ϕ 1( 21) i bi2 y32i + φ ( z22 i ) ϕ 1(22)i ai2 y33i + bi2 y32i − φ ( z 21i ) ϕ 1(22)i bi2 y32i + −ϕ 1(11) i ϕ 2(11) i ei2 y22 i + f i 2 y21i + hi2 y12 i + ji2 y11i +
22
−ϕ 1(12) i ϕ 2(12) i d i2 y23i + ei2 y22i + g i2 y13i + hi2 y12i + −ϕ 1(21) i ϕ 2(21) i bi2 y32i + ci2 y31i + ei2 y22i + f i 2 y21i + −ϕ 1(22) i ϕ 2(22) i ai2 y33i + bi2 y32i + d i2 y23i + ei2 y22i +
ϕ 1(11)i ϕ 2(12)i ei2 y22 i + hi2 y12 i + ϕ 1(11)i ϕ 2(21)i ei2 y22 i + fi 2 y21i + −ϕ 1(11)i ϕ 2(22) i ei2 y22i + ϕ 1(12) i ϕ 2(11) i ei2 y22 i + hi2 y12 i + −ϕ 1(12)i ϕ 2(21) i ei2 y22i + ϕ 1(12) i ϕ 2( 22) i d i2 y23i + ei2 y22i +
ϕ 1(21) i ϕ 2(11) i ei2 y22 i + f i 2 y21i − ϕ 1(21) i ϕ 2(12) i ei2 y22 i + ϕ 1(21) i ϕ 2(22) i bi2 y32 i + ei2 y22i − ϕ 1(22) i ϕ 2(11) i ei2 y22 i +
)
ϕ 1(22)iϕ 2(12)i di2 y23i + ei2 y22i + ϕ 1(22)iϕ 2(21)i bi2 y32i + ei2 y22i .
(4.22)
c. Elemen ketiga dari matriks Hessian
(
∂ 2 ln L(⋅) n 2 = ∑ x i xTi − [φ ( z22i )] ai2 y33i + bi2 y32i + T ∂β 2 ∂β 2 i =1
− [φ ( z21i )] bi2 y32i + ci2 y31i + z21i φ ( z21i ) [bi y32i − ci y31i ] + 2
z22i φ ( z22i ) [ ai y33i − bi y32i ] + 2 φ ( z22i ) φ ( z21i ) bi2 y32i + 2 ϕ 2(21) i (bi2 y32i + ci2 y31i ) φ ( z 21i ) − bi2 y32i φ ( z 22i ) + 2 ϕ 2(22) i (ai2 y33i + bi2 y32i ) φ ( z 22 i ) − bi2 y32i φ ( z21i ) +
ϕ 22(11)i [ −ei y22i + fi y21i + hi y12i − ji y11i ] + ϕ 22(12)i [ −di y23i + ei y22i + gi y13i − hi y12i ] + ϕ 22(21)i [ −bi y32i + ci y31i + ei y22i − fi y21i ] + ϕ 22(22)i [ −ai y33i + bi y32i + di y23i − ei y22i ] + 2 2 2 2 2 2 2 2 2 2 −ϕ 2(11) i ei y22 i + f i y21i + hi y12 i + ji y11i −ϕ 2(12) i d i y23i + ei y22 i + g i y13i + hi y12 i + 2 2 2 2 2 2 2 2 2 2 −ϕ 2(21) i bi y32 i + ci y31i + ei y22 i + f i y21i −ϕ 2(22) i ai y32 i + bi y31i + d i y 22 i + ei y21i +
2 ϕ 2(11) i ϕ 2(12) i ei2 y22 i + hi2 y12 i + 2 ϕ 2(11) i ϕ 2(21) i ei2 y22 i + fi 2 y21i +
−2ϕ 2(11) i ϕ 2(22)i ei2 y22i − 2ϕ 2(12)i ϕ 2(21)i ei2 y22i + 2 ϕ 2(12) i ϕ 2(22) i d i2 y23i + ei2 y22 i +
)
2 ϕ 2(21)i ϕ 2(22)i bi2 y32i + ei2 y22i .
(4.23)
dengan
23
ϕ 22(11)i = z21i ϕ 2(11) i + ρ φ ( z11i , z21i ) . ϕ 22(12)i = z22i ϕ 2(12)i + ρ φ ( z11i , z22i ) . ϕ 22(21) i = z21i ϕ 2(21)i + ρ φ ( z12i , z21i ) . ϕ 22(22) i = z22i ϕ 2(22)i + ρ φ ( z12i , z22i ) . Setelah didapatkan vektor g(β) dan matriks Hessian H(β) dari model Probit Bivariat (3 × 3) , maka untuk mendapatkan estimasi parameter β dilakukan iterasi Newton Raphson. Proses iterasi akan berhenti jika β ( m ) − β ( m−1) ≤ Θ , dimana Θ adalah bilangan yang sangat kecil.
Pengujian Hipotesis Model Probit Bivariat (3 × 3) Berikut diberikan suatu proposisi untuk pengujian hipotesis model Probit Bivariat (3 × 3) , baik pengujian serentak maupun parsial.
Proposisi 4.5 Jika model Probit Bivariat (3 × 3) diberikan pada Persamaan 4.10 sampai 4.18, dan ingin diuji hipotesis H 0 : β11 = β12 = L = β1q = 0 dan β 21 = β 22 = L = β 2 q = 0
H 1 : paling sedikit ada satu βrs ≠ 0 , dengan r = 1,2 dan s = 1, 2,..., q , maka a. Statistik uji hipotesis ini adalah n G 2 = 2∑ y11i ln i =1 pˆ i y23i ln 23 pˆ 23i
pˆ11i pˆ11 i
pˆ12i + y12i ln pˆ12i
pˆ 31i + y31i ln pˆ 31i
pˆ13i pˆ 21i pˆ 22i + y13i ln + y21i ln + y22i ln pˆ13i pˆ 21i pˆ 22i pˆ 32i pˆ 33i + y32i ln + y33i ln . pˆ 32i pˆ 33i
d b. G 2 →W , n → ∞ dimana W ~ χ v2 .
c. Hipotesis diatas mempunyai daerah penolakan G 2 > χ v2,α . Untuk mendapatkan uji parsial model Probit Bivariat (3 × 3) , berikut ini diberikan suatu proposisi.
24
+
Proposisi 4.6 Jika model Probit Bivariat (3 × 3) dengan Persamaan 4.10 sampai 4.18 dan diuji hipotesis H0 :
β rt = 0
H1 :
β rt ≠ 0 dengan r = 1, 2 dan t = 0,1, 2,L , q , maka
a. Statistik uji untuk hipotesis ini adalah n pˆ pˆ pˆ pˆ i G 2 = 2∑ y11i ln 11i + y12i ln 12i + y13i ln 13i + y21i ln 21 + i =1 pˆ11i pˆ12i pˆ13i pˆ 21i
pˆ i y22i ln 22 pˆ 22i
pˆ i y33i ln 33 pˆ 33i
pˆ 23i + y23i ln pˆ 23i
pˆ 31i + y31i ln pˆ 31i
pˆ 32 i + y32i ln pˆ 32 i
+
.
d b. G 2 → W , n → ∞ dimana W ~ X 12 .
c. Hipotesis diatas mempunyai daerah penolakan G 2 > χ1,2α .
4.3 Model Probit Bivariat (r × c) Model Probit Bivariat (r × c) memiliki dua variabel respon dengan r kategori dan c kategori. Misal variabel Y1* dan Y2* adalah variabel respon yang tidak teramati yaitu y1* = β1T x + ε 1 dan y 2* = β T2 x + ε 2 , dimana β1T = β10
β11
β12 L β1q ,
x = 1 x1 x2 L xq
T
dan
q
βT2 = β 20
β 21
β 22 L β 2 q
adalah jumlah variabel prediktor .
Dengan threshold tertentu γ 1 , γ 2 ,L , γ r −1 dan δ1 , δ 2 ,L , δ c −1 , maka kategori untuk y1* = β1T x + ε 1 adalah
Y1 = 1
jika y1* ≤ γ 1
Y1 = 2
jika γ 1 < y1* ≤ γ 2
M Y1 = j
jika γ j −1 < y1* ≤ γ j
25
M jika y1* > γ r −1 .
Y1 = r
Kategori untuk y2* = βT2 x + ε 2 adalah Y2 = 1
jika y2* ≤ δ 1
Y2 = 2
jika δ1 < y2* ≤ δ 2
M jika δ k −1 < y2* ≤ δ k
Y2 = k
M jika y2* > δ c −1 .
Y2 = c
Probabilitas ( p11 , p12 , p13 ,L , prc ) pada tabel kontingensi (r × c) , yaitu
p11 = Φ( z11 , z21 ) ,
(4.24)
p12 = Φ( z11 , z22 ) − Φ( z11 , z21 ) ,
(4.25)
M
p21 = Φ( z12 , z21 ) − Φ( z11 , z21 ) ,
(4.26)
p22 = Φ( z12 , z22 ) − Φ( z11 , z22 ) − Φ( z12 , z21 ) + Φ( z11 , z21 )
(4.27)
M prc = 1 − Φ ( z1( r −1) ) − Φ ( z2( c −1) ) + Φ ( z1( r −1) , z2( c −1) ) ,
(4.28)
dengan z11 = γ 1 − β1T x , z12 = γ 2 − β1T x , z13 = γ 3 − β1T x , ..., z1( r −1) = γ r −1 − β1T x , T z21 = δ1 − βT2 x , z 22 = δ 2 − β T2 x , z23 = δ 3 − β 2T x , ..., z2( c −1) = δ c −1 − β 2 x .
Estimasi Maksimum Likelihood Probit Bivariat (r × c) Berikut ini diberikan suatu proposisi untuk memperoleh estimasi parameter β dalam model Probit Bivariat (r × c) .
Proposisi 4.7 Jika model Probit Bivariat (r × c) diberikan pada Persamaan 4.24 sampai 4.28, dimana z11 = γ 1 − β1T x , z12 = γ 2 − β1T x , z13 = γ 3 − β1T x , ..., z1( r −1) = γ r −1 − β1T x , dan T z21 = δ1 − βT2 x , z 22 = δ 2 − β T2 x , z23 = δ 3 − β 2T x , ..., z2( c −1) = δ c −1 − β 2 x maka estima-
si parameter β dapat diperoleh dengan metode MLE menggunakan perhitungan
26
iterasi Newton Raphson, dengan elemen vektor g(β) pada Persamaan 4.29, 4.30 dan elemen matriks Hessian H (β ) pada Persamaan 4.31, 4.32, 4.33. Turunan pertama ln(⋅) terhadap β1 adalah
1 ∂pghi ∂ ln L(⋅) n c r = ∑∑∑ yghi . ∂β1 pghi ∂β1 i =1 h =1 g =1
(4.29)
Sedangkan turunan pertama ln(⋅) terhadap β 2 adalah
∂ ln L(⋅) n c r 1 ∂pghi = ∑∑∑ yghi ∂β 2 pghi ∂β 2 i =1 h =1 g =1
.
(4.30)
Persamaan 4.29 dan 4.30 merupakan bentuk yang tidak closed form, maka untuk memperoleh penaksir maksimum likelihood dapat diselesaikan dengan metode numerik (dengan iterasi Newton Raphson). Formula elemen-elemen pada matriks Hessian adalah ∂ 2 ln L(⋅) n c r ∂ 1 a. = y ∑∑ ∑ ghi ∂β1 ∂β1T ∂β1 pghi i =1 h =1 g =1
∂pghi 1 ∂ 2 pghi T + y ghi T ∂β1 pghi ∂β1 ∂β1
,
∂ 2 ln L(⋅) n c r ∂ 1 b. = y ∑∑∑ ghi ∂β 2 ∂βT2 ∂ β pghi i =1 h =1 g =1 2
∂pghi 1 ∂ 2 p ghi T + y ghi T ∂β 2 pghi ∂β 2 ∂β 2
, dan
(4.32)
∂ 2 ln L(⋅) n c r ∂ 1 = ∑∑∑ y ghi c. T ∂β1 ∂β 2 ∂ β i =1 h =1 g =1 2 pghi
∂pghi 1 ∂ 2 p ghi T + y ghi T ∂ p β 1 ghi ∂β 2 ∂β1
.
(4.33)
(4.31)
Setelah didapatkan vektor g(β) dan matriks Hessian H (β) , maka untuk mendapatkan estimasi parameter β pada model Probit Bivariat (r × c) dilakukan iterasi Newton Raphson. Proses iterasi akan berhenti jika β ( m ) − β ( m−1) ≤ Θ , dimana Θ adalah bilangan yang sangat kecil.
Pengujian Hipotesis Model Probit Bivariat (r × c) Selanjutnya diberikan proposisi untuk pengujian serentak dan parsial pada model Probit Bivariat (r × c) sebagai berikut.
27
Proposisi 4.8 Jika model Probit Bivariat (r × c) diberikan pada Persamaan 4.26 sampai 4.30 dan ingin diuji hipotesis H 0 : β11 = β12 = L = β1q = 0 dan β 21 = β 22 = L = β 2 q = 0
H 1 : paling sedikit ada satu βrs ≠ 0 , dengan r = 1, 2 dan s = 1, 2,L , q , maka a. Statistik uji untuk hipotesis ini adalah n pˆ pˆ G 2 = 2∑ y11i ln 11• i + y12i ln 12• i i =1 pˆ11i pˆ12i
pˆ13i pˆ rci + y13i ln • + L + yrci ln • . pˆ13i pˆ rci
d b. G 2 →W , n → ∞ dimana W ~ χ v2 .
c. Hipotesis diatas mempunyai daerah penolakan G 2 > χ v2,α . Proposisi untuk pengujian parsial pada model Probit Bivariat (r × c) adalah sebagai berikut.
Proposisi 4.9 Jika model Probit Bivariat (r × c) diberikan pada Persamaan 4.26 sampai 4.30 dan diuji hipotesis H0 :
β rt = 0 .
H1 :
β rt ≠ 0 dengan r = 1, 2 dan t = 0,1, 2,L , q , maka
a. Statistik uji untuk hipotesis diatas adalah n pˆ G 2 = 2 ∑ y11i ln 11••i i =1 pˆ11i
pˆ12i pˆ rci + y12 i ln •• + L + yrci ln •• . pˆ 12 i pˆ rci
d b. G 2 → W , n → ∞ dimana W ~ X 12 .
c. Hipotesis diatas mempunyai daerah penolakan G 2 > χ1,2α .
4.4 AIC Model Probit Bivariat Salah satu kriteria untuk mendapatkan model yang terbaik pada model Probit Bivariat dengan menggunakan AIC. Semakin kecil nilai AIC maka model semakin baik. Formula AIC Model Probit Bivariat adalah sebagai berikut:
28
AIC =
−2 ln L ( M pb ) + 2 q n
dimana
q
= banyaknya parameter dalam model
n
= banyaknya data
L ( M pb ) = likelihood untuk model Probit Bivariat
4.5 Model Probit tentang Keberhasilan Mahasiswa ditinjau dari Nilai Indeks Prestasi Kumulatif dan Masa Studi Ukuran keberhasilan seorang mahasiswa dalam studi antara lain dapat dilihat dari Indeks Prestasi Kumulatif (IPK) dan ketepatan masa studi. Peraturan akademik Institut Teknologi Sepuluh Nopember 2009 menyatakan pada pasal 25 bahwa setiap mahasiswa diberikan predikat kelulusan. Predikat kelulusan ditetapkan berdasarkan nilai IPK dan masa studi. Mahasiswa lulusan ITS program magister pascasarjana diberikan predikat kelulusan, yaitu memuaskan, sangat memuaskan dan dengan pujian. Kriteria penilaian untuk ketiga predikat tersebut adalah sebagai berikut. 1. Dengan pujian (cumlaude) diberikan yang nilai IPK S2 ≥ 3,75 dan masa studi ≤ 4 semester.
2. Sangat memuaskan merupakan predikat kelulusan dengan nilai IPK S2 ≥ 3,75 dan masa studi > 4 semester, atau nilai 3,5 ≤ IPK S2 < 3,75 dan masa studi 4 atau 5 semester. 3. Predikat memuaskan, nilai 3,5 ≤ IPK S2 < 3,75 dan masa studi > 5 semester, atau nilai 2,75 ≤ IPK S2 < 3,5 (IPITS 2010). 4.5.1 Model Probit Biner Bivariat (2 × 2) Nilai IPK S2 dan ketepatan masa studi secara bersama-sama diduga dipengaruhi oleh nilai TPA, nilai TOEFL, jenis kelamin, kesesuaian bidang, nilai IPK S1, lama lulus S1, dan sumber dana selama kuliah di program magister. Nilai IPK S2 dibedakan menjadi dua kelompok, yaitu nilai IPK S2 < 3,5 dan nilai IPK S2 ≥ 3,5. Ketepatan masa studi dibedakan atas tepat waktu dan tidak tepat waktu.
29
Untuk mengetahui adanya dependensi antara nilai IPK S2 dan masa studi dilakukan uji independensi. Uji independensi dua variabel kategorikal adalah uji Pearson Chi- Square (Agresti 2002). Dengan statistik uji Chi-square disimpulkan bahwa antara nilai IPK S2 dan masa studi saling dependen. Kesimpulan ini didapatkan dari nilai Chi-Square sebesar 27,234, lebih besar dibandingkan dengan 2 χ1;0.10 = 2,706 . Tabel kontingensi antara nilai IPK S2 dan masa studi dapat dilihat
pada Tabel 4.1. Korelasi Kendall’s Tau antara variabel IPK S2 dan ketepatan masa studi dengan tabel kontingensi pada Tabel 4.1 adalah sebesar 0,1795. Tabel 4.1 Tabel Kontingensi Nilai IPK S2 dan Masa Studi (2 × 2) Masa studi
IPK S2
Tidak tepat
Total Tepat
IPK S2 < 3,5
118 (87,1)
298 (328,9)
416
IPK S2 ≥ 3,5
59 (89,9)
370 (339,1)
429
Total
177
668
845
Tahapan berikut menguji serentak model Probit Biner Bivariat (2× 2) . Kesimpulan yang didapat adalah paling sedikit satu variabel prediktor signifikan dalam model. Tahapan berikutnya pemilihan model terbaik dengan menggunakan kriteria AIC. Nilai AIC terkecil (2,2093) untuk model probit Biner Bivariat mempunyai variabel prediktor nilai TPA, nilai TOEFL, kesesuaian bidang, nilai IPK S1 dan sumber dana ( ( X 1 , X 2 , X 4 , X 5 , X 7 ) . Hasil uji serentak model ini 2 menunjukkan bahwa G 2 sebesar 173,44 ( G 2 > χ10;0.10 = 15, 987 ). Artinya bahwa
paling sedikit satu variabel prediktor signifikan dalam model. Sedangkan uji parsial menunjukkan bahwa variabel sumber dana ( X 7 ) tidak signifikan berpengaruh pada nilai IPK S2, dan nilai TPA ( X 1 ) tidak signifikan berpengaruh pada masa studi mahasiswa program pascasarjana. Dengan demikian y1* dan y2* adalah sebagai berikut: yˆ1* = −5, 4893 + 0, 0038 x1 + 0, 0054 x2 + 0, 2313 x4 + 0, 7944 x5 + 0, 0828 x7 dan
yˆ 2* = −2,5164 − 0, 0021x1 + 0, 0017 x2 − 0,1630 x4 + 0,9045 x5 + 0,3112 x7 .
30
Jika seorang mahasiswa mempunyai nilai TPA = 200, nilai TOEFL = 450, sesuai dengan bidang di S1, nilai IPK S1 = 3, dan mendapatkan beasiswa, maka probabilitas tiap kategori adalah
pˆ11 = 0,5157 , pˆ10 = 0,1390 , pˆ 01 = 0, 2393 dan pˆ 00 = 0,1060 , dengan z1 = γ − β1T x dan z2 = δ − βT2 x , dimana γ = 0 dan δ = 0 . Dengan demikian, dapat disimpulkan bahwa mahasiswa tersebut mempunyai peluang terbesar sebesar 51,57 % dalam kategori atau kelompok mahasiswa yang mempunyai nilai IPK S2 ≥ 3.5 dan tepat waktu dalam menyelesaikan perkuliahan di program magister. Pemodelan ini, mempunyai ketepatan klasifikasi dalam memprediksi sebesar 51,48 %. Gambar 4.1 menunjukkan bahwa semakin tinggi nilai IPK S1, semakin tinggi probabilitas seorang mahasiswa mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu. Jika nilai IPK S1 sebesar 4, maka probabilitas untuk mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu sebesar 83,92 %. Tetapi jika mahasiswa tersebut mempunyai nilai IPK S1 sebesar 2,5, maka probabilitas untuk mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu sebesar 32,52 %. 2.96
3.5
IP K S 2>=3.5 & tepat w aktu IP K S 2 < 3.5 & tidak tepat w aktu
1.0 0.9 0.8
Probabilitas
0.7
0.7
0.6 0.5
0.5
0.4 0.3 0.2 0.1 0.0 2.50
2.75
3.00
3.25 Nilai IPK S1
3.50
3.75
4.00
Gambar 4.1 Grafik Hubungan antara Probabilitas pˆ 11 ; pˆ 00 dan Nilai IPK S1
31
Jika IPK S1 sebesar 3,50, maka probabilitas mendapatkan IPK S2 ≥ 3,5 dan tepat waktu sebesar 70 %. Ketika probabilitas untuk mendapatkan IPK S2 ≥ 3,5 dan tepat waktu sebesar 50 %, maka nilai IPK S1 sebesar 2,96. Pengaruh nilai TOEFL terhadap probabilitas mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu berbanding lurus, semakin tinggi nilai TOEFL maka probabilitas mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu semakin tinggi. Hubungan antara probabilitas dan nilai TOEFL dapat dilihat pada Gambar 4.2, ketika probabilitas seorang mahasiswa pascasarjana mendapatkan IPK S 2 ≥ 3,5 dan tepat waktu sebesar 50 %, maka nilai TOEFL awal sebesar 443. Jika nilai TOEFL awal 475, maka probabilitas seorang mahasiswa pascasarjana mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu sebesar 56 %. 443 1.0
475
567
IPK>=3.5 & tepat wak tu IPK<3.5 & tidak tepat wak tu
0.9 0.8
Probabilitas
0.7
0.7
0.6
0.56 0.5
0.5 0.4 0.3 0.2 0.1 0.0 300 325 350 375 400 425 450 475 500 525 550 575 600 625 650 675
Nilai TOEFL Awal
Gambar 4.2 Grafik Hubungan antara Probabilitas pˆ 11 ; pˆ 00 dan Nilai TOEFL Sedangkan pengaruh kesesuaian bidang dapat dilihat pada Tabel 4.2, jika mahasiswa mempunyai nilai TPA 200, nilai TOEFL 450, sesuai bidang, nilai IPK S1 sebesar 3 dan mendapatkan beasiswa, maka probabilitas untuk mendapat-kan nilai IPK S2 ≥ 3,5 dan tepat waktu sebesar 51,57 %. Tetapi jika mahasiswa tersebut tidak sesuai bidang, maka probabilitas untuk mendapatkan nilai IPK S2 ≥ 3,5 dan tepat waktu sebesar 47,47 %.
32
Tabel 4.2 Probabilitas pˆ 11 dan pˆ 00 ditinjau dari Kesesuaian Bidang Kesesuaian Bidang 1. 2.
Probabilitas pˆ 11
Probabilitas pˆ 00
0,5157 0,4747
0,1060 0,1053
Sesuai Tidak
Interpretasi model probit untuk melihat efek perubahan variabel prediktor terhadap probabilitas variabel respon adalah mengukur efek marjinalnya. Jika ingin mengetahui efek perubahan variabel nilai IPK S1 ( X 5 ) dengan mengasumsikan variabel prediktor yang lain konstan (nilai TPA = 200, nilai TOEFL sebesar 450, sesuai bidang di S1, nilai IPK S1 = 3, dan mendapatkan beasiswa), dimana βˆ15 = 0, 7944 dan βˆ25 = 0, 9045 , maka efek perubahan nilai IPK S1 pada model Probit Biner Bivariat tersebut adalah sebagai berikut: ∂pˆ ∂pˆ ∂pˆ ∂pˆ11 = 0,3886 , 10 = 0, 0958 , 01 = 0,1043 , dan 00 = −0,1885 . ∂x5 ∂x5 ∂x5 ∂x5
Efek marjinal nilai IPK S1 terhadap pˆ 11 sebesar 0,3886 artinya perubahan nilai IPK S1 sebesar 1 unit akan meningkatkan 0,3886 terhadap probabilitas dengan kategori IPK S2 ≥ 3,5 dan tepat waktu.
4.5.2 Model Probit Bivariat (3× 3) Jika variabel respon IPK S2 dan masa studi dikategorikan menjadi 3 kategori, maka hasil uji independensi menyimpulkan bahwa kedua variabel tersebut saling dependen. Uji independensi kedua variabel respon dapat dilihat pada Tabel 4.3, dimana nilai Chi-Square sebesar 53,037 lebih besar dari Chi-Square tabel ( χ 4.0,10 = 7, 779) . Tabel 4.3 Tabel Kontingensi Nilai IPK S2 dan Masa Studi (3 × 3) Masa studi > 4 semester
4 semester
3 semester
Total
IPK S2 < 3,50
118 (87,1)
255 (253,5)
43 (75,3)
416
3,50 ≤ IPK S2 < 3,75
44 (61,6)
182 (179,2)
68 (53,2)
294
IPK S2 ≥ 3,75
15 (28,3)
78 (82,3)
42 (24,4)
135
177
515
153
845
Total
33
Uji serentak pada model probit bivariat (3 × 3) menyimpulkan bahwa minimal ada satu variabel prediktor yang signifikan dalam model, dengan nilai statistik uji G 2 sebesar 400,75. Model probit bivariat (3 × 3) terbaik adalah model probit dengan lima variabel prediktor dengan AIC sebesar 3,7889. Kelima variabel prediktor tersebut adalah nilai TOEFL, nilai TPA, jenis kelamin, kesesuaian bidang dan nilai IPK S1. Dengan demikian variabel y1* dan y2* adalah yˆ1* = −6, 7838 + 0, 0074 x1 + 0, 0068 x2 − 0,1486 x3 + 0,1805 x4 + 1,1436 x5 dan yˆ 2* = −3, 0033 + 0, 0004 x1 + 0, 0016 x2 + 0,1147 x3 − 0, 4134 x4 + 0, 7751x5 ,
dimana
z11 = γ 1 − β1T x , z12 = γ 2 − β1T x , z21 = δ1 − βT2 x , dan z22 = δ 2 − βT2 x , dengan γ 1 = −1 ,
γ 1 = −1 , δ1 = −1 dan δ 2 = 1 . Jika seorang mahasiswa mempunyai nilai TPA 200, nilai TOEFL 500, perempuan, sesuai bidang, dan nilai IPK S1 sebesar 3,5 maka model Probit Bivariat (3 × 3) adalah
pˆ 33 = 0,1948 , pˆ 32 = 0, 6070 , pˆ 31 = 0, 0978 , pˆ 23 = 0, 0102 , pˆ 22 = 0, 0679 , pˆ 21 = 0, 0218 , pˆ13 = 0, 00002 , pˆ12 = 0, 0003 dan pˆ11 = 0, 0002 . Karena probabilitas terbesar adalah pˆ 32 , maka mahasiswa tersebut diprediksi akan mempunyai nilai IPK S2 ≥ 3,75 dan lama studi 4 semester, dengan probabilitas 60,70 %. Ketepatan klasifikasi model Probit Bivariat (3 × 3) sebesar 30,41 %. Jika seorang mahasiswa mempunyai nilai TPA 200, nilai TOEFL awal 500, wanita, dan sesuai bidang S1, maka dengan nilai IPK S1 yang semakin tinggi akan mempunyai peluang seorang mahasiswa termasuk dalam kategori nilai IPK S2 ≥ 3,75 dengan masa studi 4 semester. Hubungan antara probabilitas dan nilai IPK S1 dapat dilihat pada Gambar 4.3. Seorang mahasiswa dengan nilai IPK S1 sebesar 2,93 mempunyai probabilitas 50 % tergolong dalam kategori nilai IPK S2
≥ 3,75 dengan masa studi 4 semester. Jika seorang mahasiswa mempunyai nilai
34
IPK S1 sebesar 3,5 maka ia berpeluang 60,7 % mendapatkan IPK S2 ≥ 3,75 dengan masa studi 4 semester. 2.93 1.0
3.5
p33=IP K>3.75 & 3 smt p32=IP K > 3.75 & 4 smt p23=3.5 < IP K < 3.75 & 3 smt p22=3.5 < IP K < 3.75 & 4 smt
0.9 0.8
Probabilitas
0.7 0.6
0.607
0.5
0.5
0.4 0.3 0.2 0.1 0.0
2.50
2.75
3.00
3.25 nilai IPK S1
3.50
3.75
4.00
Gambar 4.3 Grafik Hubungan antara pˆ 33 , pˆ 32 , pˆ 23 dan pˆ 22 dengan Nilai IPK S1
400 1.0
475
p33=IP K>3.75 & 3 smt p32=IP K > 3.75 & 4 smt p23=3.5 < IP K < 3.75 & 3 smt p22=3.5 < IP K < 3.75 & 4 smt
0.9 0.8
Probabilitas
0.7 0.6
0.588
0.5
0.5
0.4 0.3 0.2 0.1 0.0 310
350
390
430
470 510 550 Nilai TOEFL Awal
590
630
670
Gambar 4.4 Grafik Hubungan antara pˆ 33 , pˆ 32 , pˆ 23 dan pˆ 22 dengan Nilai TOEFL
35
Seperti nilai IPK S1, nilai TOEFL mempunyai pengaruh positif terhadap nilai IPK S2 dan masa studi seorang mahasiswa. Hubungan antara probabilitas dan nilai TOEFL dapat dilihat pada Gambar 4.4. Semakin tinggi nilai TOEFL awal seorang mahasiswa, maka akan mempunyai peluang lebih besar seorang mahasiswa termasuk dalam kategori dengan nilai IPK S2 ≥ 3,75 dengan masa studi 4 semester. Seorang mahasiswa mempuyai nilai TOEFL awal 470, maka akan mendapatkan peluang 58,8 % untuk mendapatkan nilai IPK S2 ≥ 3,75 dengan masa studi 4 semester. Tabel 4.4 Probabilitas pˆ 33 , pˆ 32 , pˆ 23 dan pˆ 22 ditinjau dari Kesesuaian Bidang No. 1. 2.
pˆ 33
pˆ 32
pˆ 23
pˆ 22
0,1948 0,3125
0,6070 0,5104
0,0102 0,0282
0,0679 0,0922
Kesesuaian Bidang Sesuai Tidak
Tabel 4.4 menunjukkan bahwa seorang mahasiswa yang sesuai bidang untuk mendapatkan nilai IPK S2 ≥ 3,75 dengan masa studi 4 semester mempunyai probabilitas lebih besar dibanding yang tidak sesuai bidang. Tepatnya probabilitas seorang mahasiswa yang sesuai bidang adalah 60,7 %, sedangkan yang tidak sesuai bidang 51,04 %. Untuk mengetahui pengaruh setiap variabel, dapat diukur dengan nilai efek marjinal. Jika βˆ15 = 1,1436 dan βˆ25 = 0, 7751 pada model probit bivariat (3 × 3) diatas maka efek marjinal nilai IPK S1 ( X 5 ) dengan variabel lainnya
konstan adalah sebagai berikut: ∂pˆ 33 ∂pˆ ∂pˆ ∂pˆ = 0, 2307 , 32 = 0, 0646 , 31 = −0, 0941 , 31 = −0, 0941 , ∂x5 ∂x5 ∂x5 ∂x5 ∂pˆ 23 ∂pˆ ∂pˆ ∂pˆ = 0,3921 , 22 = −0,1289 , 21 = −0, 0599 , 13 = −0, 0001 , ∂x5 ∂x5 ∂x5 ∂x5 ∂pˆ12 ∂pˆ = −0, 0012 , dan 11 = −0, 0009 ∂x5 ∂x5
Efek marjinal nilai IPK S1 terhadap pˆ 32 sebesar 0,0646 artinya perubahan nilai IPK S1 sebesar satu unit akan meningkatkan 0,0646 terhadap probabilitas ke dalam kategori IPK S2 ≥ 3,75 dengan masa studi 4 semester.
36
4.6 Ketepatan Klasifikasi Model Probit Bivariat Untuk melihat keakuratan ketepatan klasifikasi suatu model, pada penelitian ini dilakukan membagi data menjadi dua bagian yaitu data training dan data testing. Persentase yang digunakan dalam pembagian kedua data ini adalah 90:10, 80:20, 70:30, 60:40 dan 50:50. Uji perbedaan diantara kelima persentase tersebut ditunjukkan bahwa tidak ada perbedaan ketepatan klasifikasi yang signifikan, baik untuk data training maupun data testing. Sehingga untuk data keberhasilan mahasiswa pascasarjana tidak mempunyai perbedaan yang signifikan di antara kelima macam persentase data training dan testing. Secara numerik, ketepatan klasifikasi model Probit Bivariat dengan mengasumsikan korelasi nol dibandingkan dengan model Probit Bivariat yang mempertimbangkan adanya korelasi menunjukkan perbedaan yang signifikan. Pemodelan yang mempertimbangkan korelasi diantara kedua variabel respon mempunyai ketepatan klasifikasi lebih besar dibanding yang mengasumsikan tidak berkorelasi. Ketepatan klasifikasi pada model Probit Bivariat yang mengasumsikan diantara variabel respon tidak berkorelasi sebesar 6,58 %. Sedangkan ketepatan klasifikasi pada model Probit Bivariat yang mempertimbangkan adanya korelasi diantara kedua variabel respon sebesar 51,48 %.
5. Kesimpulan dan Saran Pada penelitian ini terdapat beberapa kesimpulan dan saran tentang kajian estimasi parameter dan pengujian statistik model Probit Bivariat, yaitu: Kesimpulan Berdasarkan hasil analisa dan pembahasan, terdapat beberapa kesimpulan yang diperoleh yaitu: 1. Metode estimasi yang digunakan untuk mendapatkan parameter model Probit Biner Bivariat (2 × 2) , model Probit Bivariat (3 × 3) dan model Probit Bivariat
(r × c) adalah Maximum Likelihood Estimation (MLE). Karena persamaan turunan pertama menghasilkan persamaan yang tidak closed form, maka untuk menyelesaikannya dilakukan prosedur iterasi Newton Raphson.
37
2. Metode pengujian statistik yang digunakan adalah Maximum Likelihood Ratio Test (MLRT) dan didapatkan statistik uji pada pengujian hipotesis serentak yaitu G 2 yang secara asimptotik berdistribusi χv2 untuk n → ∞ . Statistik uji pada pengujian hipotesis parsial adalah uji G 2 yang secara asimptotik berdistribusi χ12 untuk n → ∞ . 3. Uji Chi Square untuk tabel kontingensi (2 × 2) menunjukkan bahwa ada hubungan yang signifikan antara nilai IPK S2 dengan ketepatan studi. Dengan menggunakan model Probit Biner Bivariat (2 × 2) , variabel prediktor (nilai TPA, nilai TOEFL, kesesuaian bidang, nilai IPK S1, serta sumber dana semasa studi) signifikan mempengaruhi variabel respon (nilai IPK S2 dan ketepatan masa studi). Sedangkan untuk model Probit Bivariat (3 × 3) variabel prediktor yang mempengaruhi variabel respon (nilai IPK S2 dan masa studi) adalah nilai TPA, nilai TOEFL, jenis kelamin, kesesuaian bidang, dan nilai IPK S1).
5.2 Saran Pada penelitian ini dibatasi pada dua variabel respon. Kenyataan di lapangan mungkin terjadi lebih dari dua variabel respon yang akan diamati. Oleh karena itu pada penelitian lebih lanjut dapat dilakukan dengan melibatkan lebih dari dua variabel respon. Korelasi yang digunakan dapat dilakukan dengan cara mengestimasi korelasi.
DAFTAR PUSTAKA Abdel-Aty, M. (2003). Analysis of Driver Injury Severity Levels at Multiple Locations Using Ordered Probit Models. Journal of Safety Research: vol. 34, hal. 597-603. Agresti, A. (2002). Categorical Data Analysis. Second Edition, Wiley-Interscience A John Wiley & Sons,Inc. Aitchison, J. dan Silvey, S.D. (1957). The Generalization of Probit Analysis to the Case of Multiple Responses. Biometrika: vol. 44, No. 2, vol. 131-140. Bliss, C.I. (1934). The Method of Probits. American Association for the Advancement of Science: Science, New Series, vol.79, no. 2037, hal. 38–39.
38
Boes, S. dan Winkelmann, R. (2004). Income and Happiness: New Results from Generalized Threshold and Sequential Models. Discussion Paper Series IZA DP no. 1175. Bokosi, F.K. (2007). Household Poverty Dynamics in Malawi: A Bivariate Probit Analysis. Journal of Applied Sciences: Asian Network for Scientific Information, vol.7, no, 2, hal. 258-262. Chambers, E.A. dan Cox, D.R. (1967). Discrimination Between Alternative Binary Response Models. Biometrika: vol. 54, hal. 573-578. Casella, G. dan Berger, R.L. (2002). Statistical Inference, Second Edition. Duxbury Press, An Imprint of Wadsworth Publishing Company Belmont, California. Cessie, S.L. dan Houwelingen, J.C.V. (1994). Logistic Regression for Correlated Binary Data. Appl. Statist: vol. 43, no. 1, hal. 95-108. Dudewics, E.J. dan Mishra, S.N. (1988). Modern Mathematical Statistics. Wiley series in probability and mathematical statistics, John Wiley & Sons. Everitt, B.S. (1994). The Analysis of Contingency Tables. Second Edition. Monographs on Statistics and Applied Probability, Chapman & Hall, London, New York. Finney, D.J. (1971). Probit Analysis, Third Edition. Cambridge at The University Press. New York. Fujimoto, K . (2003). Application Of Multinomial And Ordinal Regression To Data Of The Japanese Female Labor Market. Thesis, University of Pittsburgh, Faculty Of Arts And Science. Greene, W.H. (2008). Econometrics Analysis. Sixth Edition, Prentice Hall, Englewood Cliffs, New Jersey. Guillory, C.W (2008). A Multilevel Discrete Time Hazard Model of Retention Data In Higher Education. Dissertation, Lousiana State University, Louisiana. Gujarati, D.N. (2003). Basic Econometric. 4-th Edition. Mc Graw Hill, New York. Hair, J.F., Black, W.C., Babin, B.J., Anderson, R.E., dan Tatham, R.L. (2006). Multivariate Data Analysis, Prentice Hall, Inc., New Jersey. Hardin, J.W. dan Hilbe, J.M. (2007). Generalized Linear Models and Extensions. Second Edition. A Stata Press Publication, Texas.
39
IPITS. (2010). Informasi dan Pengenalan ITS Bagi Mahasiswa Baru 2010-2011. Institut Teknologi Sepuluh Nopember, Surabaya. Kockelman, K.M. dan Kweon, Y. (2002). Driver injury severity: an application of ordered probit models. Accident Analysis & Prevention: vol.34, hal. 313-321. Kutner, M.H., Nachtsheim, C.J., dan Nether, J. (2008). Applied Linear Regression Models. McGraw-Hill Companies. New York Long, J.S. (1997). Regression Models for Categorical and Limited Dependent Variables. Sage Publications International Educational and Professional Publisher Thousand Oaks, London, New Delhi. McCullagh, P. dan Nelder, J.A., (1989). Generalized Linear Models. Chapman & Hall, London Weinheim New-York. McKelvey, R.D. dan Zavoina, W. (1975). A Statistical Model for the Analysis of Ordinal Level Dependent Variables. Journal of Mathematical Sociology: vol. 4, hal. 103-120. Nugraha, J. (2010). Pemodelan Pilihan Diskrit Menggunakan Model Probit dan Model Mixed Logit pada Respon Multivariat. Disertasi, Jurusan Matematika FMIPA UGM Yogyakarta. O’Donnell, C.J. dan Connor, D.H. (1996). Predicting The Severity of Motor Vehicle Accident Injuries Using Models of Ordered Multiple Choice. Accident Analysis & Prevention: vol. 28, no. 6, hal. 739-753. Ratnasari, V., Purhadi, Zain, I., dan Suhartono (2011a). Estimasi dan Statistik Uji pada Model Probit Biner Bivariat. Jurnal Ilmu Dasar: vol. 12, no. 1, hal. 97102. Ratnasari, V, Purhadi, Zain, I., dan Suhartono (2011b). Estimation and Test Statistic in Bivariate Probit Model ( r × c) . Journal of Basic and Applied Scientific Research: vol. 1, no. 3, hal. 178-188. Sharma, S. (1996). Applied Multivariate Techniques, John Willey & Sons, Inc. Canada. Snapinn, S.M. dan Small, R.D. (1986). Test of Significance Using Regression Models for Ordered Categorical Data. Biometrics: vol.42, hal. 583-592. Song, X.Y. dan Lee, S.Y. (2005). A Multivariate Probit Latent Variable Model for Analyzing Dichotomous Responses. Statistica Sinica: vol.15, hal. 645-664. Winkelmann, R. dan Boes, S. (2006). Analysis of Microdata. Springer-Verlag Berlin Heidelberg, German.
40
RIWAYAT HIDUP PENULIS
I. Identitas Pribadi 1. Nama
: Vita Ratnasari, S.Si, M.Si
2. NIP
: 19700910 199702 2 001
3. Tempat/Tanggal Lahir: Jember, 10 September 1970 4. Alamat Rumah
: Jl. Pradah Permai 3/31 Surabaya
5. Instansi
: Jurusan Statistika-FMIPA ITS Surabaya
6. Alamat Kantor
: Jl. Arief Rahman Hakim Sukolilo Surabaya
7. Email
:
[email protected] [email protected]
II. Riwayat Pendidikan -
SDK Maria Fatima II Jember, tahun 1983. SMPN 2 Jember, tahun 1986. SMAN 1 Jember, tahun 1989. Sarjana Statistika pada jurusan Statistika-FMIPA ITS Surabaya, tahun 1995. Magister Statistika pada jurusan Statistika-FMIPA ITS Surabaya, tahun 2001.
III. Riwayat Penelitian a. Penelitian Penelitian yang telah dilakukan selama masa studi yang mendukung dalam penyelesaian disertasi: 1. Penelitian Hibah Doktor DP2M Dikti dengan judul Estimasi dan Statistik Uji pada Model Probit Bivariat, tahun 2010 (Ketua peneliti). 2. Penelitian Strategis Nasional dengan judul Pemetaan Potensi Ekonomi Perempuan pada Rumah Tangga Miskin (RTM) dan Bukan RTM, (Studi Pemodelan Partisipasi Ekonomi Perempuan di Jawa Timur dengan Metode Regresi Logistik Multivariat), tahun 2009 (Ketua Peneliti). b. Publikasi Publikasi dalam bentuk jurnal yang telah dilakukan selama masa studi yang mendukung dalam penyelesaian disertasi:
41
Jurnal Internasional Ratnasari, V, Purhadi, Zain, I., dan Suhartono (2011). Estimation and Test Statistic in Bivariate Probit Model (r × c) . Journal of Basic and Applied Scientific Research: vol. 1, no. 3, hal. 178-188. Jurnal Nasional Terakreditasi Ratnasari, V., Purhadi, Zain, I., dan Suhartono (2011). Estimasi dan Statistik Uji pada Model Probit Biner Bivariat. Jurnal Ilmu Dasar: vol. 12, no. 1, hal. 97-102. Jurnal Nasional Ratnasari, V, Sunaryo, S, Setiawan (2008). Goodness of Fit pada Binary Logit dan Probit. Journal of Mathematics and Science: vol.11, no. 2. hal.31-35. c. Seminar Publikasi dalam bentuk seminar yang telah dilakukan selama masa studi yang mendukung dalam penyelesaian disertasi: Seminar Internasional Ordinal Probit Regression Modeling (Factors that Influence Human Development Index in East Java Province), Seminar Internasional, 13-15 Agustus 2009 di Universitas Malahayati Lampung. Seminar Nasional Pemodelan Melek Huruf dan Rata-rata Lama Studi dengan Pendekatan Model Biner Bivariat. Seminar Nasional Statistika, 13 Nopember 2010 di Universitas Padjajaran Bandung.
42