ANALISIS REGRESI PEUBAH RESPON KUALITATIF Analisis regresi digunakan ini variabel respon yang bersifat kualitatif, misalnya respon siswa-siswa yang diberikan perlakuan tertentu dalam suatu ujian apakah lulus atau tidak lulus, mutu baik atau jelek, dan sebagainya. Dalam kasus respon Y yang bersiat kualitatif, maka pengukuran yang dilakukan hanyalah memberikan nilai 0 dan 1 untuk kategori tertentu, misalnya respon hidup diberi nilai 1 sedangkan respon mati diberinilai 0, siswa-siswa yang lulus diberi nilai 1 sedangkan yang tidak lulus diberi nilai 0. Teknik pengukuran dengan memberikan nilai 0 dan 1 menggunakan variabel dummy atau peubah boneka dalam analisis regresi
dimana
peubah
boneka
merupakan
cara
yang
sederhana
untuk
mengkuantifikasi variabel kualitatif dalam model regresi. Untuk variabel kualitatif yang mempunyai k kategori bisa dibangun k-1 peubah boneka. Pendugaan parameter dan uji inferensinya sama dengan analisis regresi linier sederhana. Model yang dapat digunakan dalam permasalahan yang variabel respon kualitatif adalah: 1. Model Peluang Linear Bentuk fungsional dari model peluang linear tidak lain merupakan model regresi linear dengan variabel-variabelnya merupakan variabel dummy (dapat salah satu variabel tak bebas yang bersifat dummy), atau variabel tak bebas dan variabel bebas yang bersifat dummy). Dengan kata lain model peluang linear mengambil bentuk regresi linear dengan variabel tak bebas bersifat dummy, sedangkan variabel bebas dapat mengambil bentuk salah satu apakah dummy atau bukan dummy. Bentuk model peluang linear adalah : Y = b 0 + b1 X + e
Dimana: X = nilai dari atribut untuk individu (objek pengamatan) yang dipelajari
ì1 ; jika tergolong dalam kategori pertama Y = í î0 ; jika tergolong dalam kategori kedua (bukan kategori pertama)
e
= galat (error) yang timbul pada pengamatan yang diasumsikan sebagai
variabel acak yang berdistribusi secara bebas dengan nilai tengah sama dengan nol Secara formal, model peluang linear sering ditulis dalam bentuk berikut:
ì b 0 + b 1 X i , jika 0 < b 0 + b 1 X i < 1 ï Pi = í1, jika b 0 + b 1 X i > 1 ï 0 , jika b + b X £ 0 0 1 i î Model peluang linear disamping dipergunakan untuk peramalan juga dipergunakan
untuk
penggolongan
atau
pengelompokan.
Untuk
keperluan
penggolongan (pengelompokan), maka dipergunakan kriteria berikut : ^ ì ïkelompok pertama (Y = 1), jika Y > 1 2 alokasikan pada : í ^ ïkelompok kedua (Y = 0), jika Y £ 1 2 î
Sebagaimana halnya dengan model regresi linear, maka model peluang linear diduga menggunakan metode kuadrat terkecil dengan persamaan dugaannya adalah: Ù
Y = b 0 + b1 X
2. Model Logit (Logit Model) Model logit didasarkan pada fungsi peluang logistik komulatif yang dispesifikasikan, sebagai berikut:
Pi = F ( b 0 + b 1 X 1i ) =
1 1 = - zi - ( b 0 + b1 X 1i ) 1+ e 1+ e
Dalam fungsi tersebut, e merupakan bilangan dasar logaritma natural (ln) yang diperkirakan sama dengan 2,71828128 atau dibulatkan menjadi 2,71828. Pi merupakan peluang bahwa suatu objek pengamatan akan tergolong ke dalam kategori tertentu berdasarkan nilai tertentu dari variabel bebas X1. Untuk menentukan bagaimana model logit (persamaan diatas) dapat diduga, maka langkah pertama adalah melakukan penggandaan kedua sisi persamaan itu dengan ( 1 + e - zi ), sehingga diperoleh : (1 + e - Z i ) Pi = 1
Selanjutnya apabila persamaan di atas dibagi dengan Pi lalu dikurang 1, maka diperoleh
e -Zi =
1 - Pi 1 -1= Pi Pi
Berdasarkan definisi diketahui bahwa
e - zi = 1
e zi
, dengan demikian
persamaan diatas dapat pula dinyatakan sebagai berikut :
e Zi =
Pi 1 - Pi
Persamaan di atas dapat pula dinyatakan dalam bentuk linear logaritmik, sebagai berikut:
P Z i = ln ( i ) 1 - Pi atau, P ln ( i ) = Z i = b 0 + b 1 X 1i 1 - Pi
Untuk menduga persamaan di atas secara langsung adalah tidak mungkin, karena Pi hanya mengambil nilai 0 dan 1, di mana komponen (
Pi ) akan menjadi 0 1 - Pi
bila Pi =0 dan menjadi tidak terdefinisi apabila Pi=1. Untuk mengatasi hal ini, maka data pengamatan perlu dikelompokkan ke dalam kelas-kelas berdasarkan kriteria tertentu. Dengan demikian model logit dapat diduga berdasarkan nilai-nilai peluang tertentu dari setiap kelompok data pengamatan. Jika kita mendefinisikan ri sebagai frekuensi pengamatan dalam kelas ke-i yang berukuran ni, maka peluang untuk kelas ke-i dapat diduga melalui: ^
Pi =
ri ni ^
Dengan demikian model peluang logit dapat diduga menggunakan Pi sebagai pendekatan bagi Pi sebagai berikut: ^
P P ln ( i ) » ln ( i ^ ) sehingga 1 - Pi 1- P i
^
Pi
r /n r ln ( ) = ln ( i i ) = ln ( i ) ^ 1 - ri / ni ni - ri 1 - Pi
Berdasarkan uraian di atas, maka dapat dibangun model logit untuk keperluan secara empirik sebagai berikut:
ln (
ri ) = b 0 + b 1 X 1i + ei ni - ri
Persamaan di atas merupakan persamaan yang linear dalam parameter, sehingga dapat diduga menggunakan menggunakan metode kuadrat terkecil. ^
Karena Pi tidak tepat sama dengan Pi, maka terdapat masalah dalam menggunakan metode kuadrat terkecil untuk pendugaan kasus data berkelompok. Jika
kita mengasumsikan setiap objek pengamatan dalam kelompok adalah bebas dan mengikuti distribusi peluang binomial, maka variabel tak bebas dari persamaan di atas akan berdistribusi mendekati distribusi normal (apabila ukuran contoh besar) yang memiliki nilai rata-rata (nilai tengah) sama dengan nol dan ragam sebesar: Vi =
ni ri (ni - ri )
Dengan demikian persamaan tersebut akan memiliki sifat heteroskedastik (hetroscedastic). Untuk mengatasi hal ini, maka persamaan tersebut diduga menggunakan metode kuadrat terkecil terbobot (weighted least squares method), dengan jalan melakukan pembobotan terhadap setiap nilai pengamatan melalui penggandaan pembobot wi = 1
Vi
Fungsi respons logistik atau sering disebut sebagai fungsi peluang logit telah banyak diterapkan dalam percobaan biologi yang juga dikenal memiliki kurva pertumbuhan berbentuk huruf (kurva sigmoid).
3. Model Probit (Probit Model) Apabila model logit menggunakan fungsi peluang logistik kumulatif, maka model probit menggunakan fungsi peluang normal kumulatif, oleh karena itu kadangkadang model probit disebut dengan model normit (normit model). Pada prinsipnya model probit serupa dengan model logit, kecuali model logit menggunakan fungsi peluang logistik kumulatif sedangkan model probit menggunakan fungsi peluang normal kumulatif. Model probit dapat dinyatakan sebagai berikut : Pi = F (Z i ) = F (b 0 + b1 X 1i )
dimana F menunjukkan fungsi peluang kumulatif sedangkan X1 menunjukkan variabel bebas yang bersifat stokastik.
Oleh karena model peluang probit berkaitan dengan fungsi peluang normal kumulatif, maka kita dapat menulis model peluang probit sederhana, sebagai berikut: Z i = b 0 + b1 X 1i + ei
Oleh karena pada persamaan Pi menunjukkan peluang bahwa suatu kejadian akan terjadi, misalkan peluang kematian hama yang mendapatkan larutan pembasmi hama tertentu, maka ia dapat diukur melalui daerah dibawah kurva normal baku dari ¥ sampai Zi.
Untuk memperoleh suatu dugaan dari indeks Zi, maka kita dapat mempergunakan invers dari fungsi normal kumulatif, sehingga diperoleh: Z i = F -1 (Pi ) = b 0 + b1 X 1i + ei
Kita dapat menginterpretasikan peluang Pi yang dihasilkan dari model probit sebagai suatu dugaan dari peluang bersyarat (conditional probability) bahwa suatu obyek pengamatan atau kelmpok akan mengalami suatu kejadian berdasarkan nilai tertentu dari variabel X, misalnya kita dapat menduga berapa peluang kematian dari hama yang memperoleh larutan pembasmi hama berkadar tertentu (nilai tertentu dari X). Hal ini akan serupa dengan peluang bahwa variabel normal baku Zi akan lebih kecil atau sama dengan b 0 + b1 X 1i atau P ( Z i £ b 0 + b1 X 1i ) , dimana besar nilai peluang tersebut dapat dilihat dari tabel distribusi normal kumulatif .