BAB II TINJAUAN PUSTAKA 2.1
Pengertian Pendidikan Ki Hajar Dewantara (Bapak Pendidikan Nasional Indonesia, 1889-1959)
menjelaskan tentang pengertian pendidikan yaitu: โPendidikan umumnya berarti daya upaya untuk memajukan budi pekerti (karakter, kekuatan batin), pikiran dan jasmani anak-anak selaras dengan alam dan masyarakatโ. Menurut Undang-Undang No.20 Tahun 2003 tentang Sistem Pendidikan Nasional menyatakan bahwa pendidikan adalah usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spiritual keagamaan, pengendalian diri, kepribadian, kecerdasan, akhlak mulia, serta keterampilan yang diperlukan untuk dirinya, masyarakat, bangsa dan Negara. 2.2
Pengertian Perguruan Tinggi Menurut Peraturan Pemerintah No.30 tahun 1990 perguruan tinggi adalah
organisasi satuan pendidikan, yang menyelenggarakan pendidikan di jenjang pendidikan tinggi, penelitian dan pengabdian kepada masyarakat.
7
8
Menurut Hamalik (1983) Perguruan tinggi adalah lembaga pendidikan tinggi. Pada umumnya istilah โPerguruan Tinggiโ dapat dinyatakan sebagai lembaga pendidikan tertinggi yang mendidik para calon sarjana dalam bidang keilmuan tertentu. Melalui lembaga ini para mahasiswa dididik untuk menjadi seorang yang ahli, professional dalam suatu ilmu atau suatu bidang keilmuan serta sanggup mengabdikannya guna kepentingan masyarakat dan bangsa. 2.3
Pengertian Mahasiswa Menurut Sarwono (1978) mahasiswa adalah setiap orang yang secara resmi
terdaftar untuk mengikuti pelajaran di perguruan tinggi dengan batas usia sekitar 18-30 tahun. Mahasiswa merupakan suatu kelompok dalam masyarakat yang memperoleh statusnya karena ikatan dengan perguruan tinggi. Mahasiswa juga merupakan calon intelektual atau cendikiawan muda dalam suatu lapisan masyarakat. Mahasiswa sebagai pelajar perguruan tinggi dituntut untuk belajar dengan cara yang berbeda ketika di sekolah menengah, yang ternyata tidak cukup hanya bersifat reseptif dan reproduktif, tetapi harus cukup mengadakan penelitian, belajar mandiri, mencoba sendiri dan menemukan sendiri. Dengan demikian belajar di perguruan tinggi juga berbeda dengan lingkungan di sekolah menengah, di mana mahasiswa harus lebih intim dan lebih cakap dalam menggunakan sumber-sumber belajar seperti perpustakaan, laboratorium, studi lapangan, diskusi kerja, seminar.
9
Sehingga diharapkan seorang mahasiswa dapat bersifat objektif, berfikir logis, kritis, sistematis, dan kontruktif (Musnawar, 1979 dalam Hamalik, 1989). 2.4
Prestasi Belajar Prestasi selalu dihubungkan dengan pelaksanaan suatu kegiatan atau aktivitas.
Prestasi belajar merupakan hal yang tidak dapat dipisahkan dari kegiatan belajar, karena kegiatan belajar merupakan proses, sedangkan prestasi belajar merupakan output dari proses belajar. Menurut Sukmadinata (2005), prestasi atau hasil belajar (achievement) merupakan realisasi dari kecakapan-kecakapan potensial atau kapasitas yang dimiliki seseorang. Penguasaan hasil belajar dapat dilihat dari perilaku, baik perilaku dalam bentuk penguasaan pengetahuan, keterampilan berpikir maupun keterampilan motorik. Di perguruan tinggi, hasil belajar atau prestasi belajar ini dapat dilihat dari penguasaan mahasiswa akan mata kuliah yang telah ditempuh. Alat untuk mengukur prestasi atau hasil belajar disebut tes prestasi belajar atau achievement test yang disusun oleh dosen yang mengajar mata kuliah yang bersangkutan. Faktor-faktor yang memengaruhi prestasi belajar dapat berasal dari diri sendiri (faktor internal) dan dari luar dirinya sendiri (faktor eksternal).
10
2.4.1 Faktor Internal Adapun faktor internal yang memengaruhi prestasi belajar adalah sebagai berikut: 1.
Motivasi kemampuan intelektual Dari beberapa penelitian, ditemukan adanya korelasi positif dan cukup kuat antara taraf intelegensi dengan prestasi seseorang yaitu berkisar 0,70.
2.
Minat Pada umumnya, seseorang akan merasa senang untuk melakukan sesuatu sesuai dengan minatnya.
3. Bakat Bakat merupakan kapasitas untuk belajar dan itu baru terwujud kalau sudah mendapat latihan. 4. Sikap Seseorang akan menerima atau menolak sesuatu berdasarkan penilaiannya pada obyek yang dinilainya berguna atau tidak. 5. Motivasi berprestasi Semakin tinggi motivasi berprestasi seseorang maka akan semakin baik prestasi yang akan diraihnya.
11
6. Konsep Diri Konsep diri menunjukkan bagaimana seseorang memandang dirinya serta kemampuan yang ia miliki. Mahasiswa yang memiliki konsep diri yang positif akan lebih berhasil di Perguruan Tinggi. 7. Sistem Nilai Sistem ini merupakan keyakinan yang dimiliki seseorang tentang cara bertingkah laku dan kondisi akhir dari yang diinginkannya. Sistem nilai yang dianut dapat memengaruhi gaya hidup dan tindakan seseorang. 2.4.2 Faktor Eksternal Faktor eksternal adalah faktor-faktor yang dapat memengaruhi prestasi belajar yang sifatnya di luar diri mahasiswa, yaitu beberapa pengalaman-pengalaman, keadaan keluarga, lingkungan sekitarnya dan sebagainya. Pengaruh lingkungan ini pada umumnya bersifat positif dan tidak memberikan paksaan kepada individu. Menurut Slameto (2003) faktor-faktor eksternal yang dapat memengaruhi belajar adalah keluarga, lingkungan kampus dan lingkungan masyarakat. a. Faktor Keluarga Keluarga adalah suatu lingkungan yang terdiri dari orang-orang terdekat bagi seorang anak. Banyak sekali waktu dan kesempatan bagi seorang anak untuk berjumpa dan berinteraksi dengan keluarganya. Kondisi yang harmonis dalam keluarga dapat memberikan stimulasi dan respon yang baik dari anak sehingga
12
prilaku dan prestasinya menjadi baik. Sebaliknya jika keluarga tidak harmonis atau broken home akan berdampak negatif bagi perkembangan mahasiswa, perilaku dan prestasi cenderung terhambat, dan akan muncul masalah-masalah dalam perilaku dan prestasinya. Dalam faktor lingkungan keluarga yang sangat perlu diperhatikan adalah suasana rumah, cara orang tua mendidik, fasilitas belajar dan keadaan ekonomi keluarga. b. Lingkungan Kampus Kampus merupakan tempat kegiatan dan proses pendidikan berlangsung. Faktorfaktor yang memengaruhi proses belajar mengajar dilingkungan kampus adalah metode mengajar dosen, hubungan mahasiswa dengan dosen, hubungan mahasiswa dengan mahasiswa, keadaan gedung, sarana yang mendukung dilingkungan kampus, metode belajar, dan kurikulum atau sistem pembelajaran. c. Lingkungan Masyarakat Masyarakat disekitar mahasiswa sangat berpengaruh terhadap belajar mahasiswa. Masyarakat yang terdiri dari orang-orang yang tidak terpelajar dan mempunyai kebiasaan yang tidak baik akan berpengaruh pada mahasiswa. Mahasiswa akan tertarik untuk berbuat seperti yang dilakukan orang-orang di sekitarnya. Akibatnya belajarnya terganggu dan bahkan anak akan kehilangan semangat untuk belajar karena perhatiannya terpusat kepada pelajaran berpindah ke perbuatan-perbuatan yang selalu dilakukan orang-orang di sekitarnya. Sebaliknya, jika lingkungan anak adalah orang-orang yang terpelajar yang baik-baik, mereka mendidik dan menyekolahkan anaknya, antusias dengan cita-cita
13
yang luhur akan masa depan anaknya, anak juga akan terpengaruh ke hal-hal yang dilakukan oleh orang-orang dilingkungannya, sehingga akan berbuat seperti orangorang yang ada dilingkungannya. Keadaan masyarakat juga menentukan prestasi belajar. bila di sekitar tempat tinggal keadaan masyarakatnya terdiri dari orang-orang yang berpendidikan, terutama anak-anaknya rata-rata bersekolah tinggi dan moralnya baik. hal ini akan mendorong anak lebih giat belajar. 2.5
Uji Chi -Square (Khi-kuadrat, ๐๐ ) Uji Chi-Square (๐ 2 ) pertama dikembangkan oleh statistika Inggris yang
bernama Karl Pearson. Uji Chi-Square (๐ 2 ) antara lain dapat digunakan untuk mengetahui hubungan diantara dua variabel tertentu (untuk uji independensi), dalam hal ini variabel yang dimaksud mempunyai skala pengukuran nominal dan ordinal. Jika tidak terdapat hubungan antara variabel-variabel tersebut, bisa dikatakan variabel-variabel tersebut bersifat saling bebas (independen). Misalkan suatu variabel pertama memiliki r kategori yaitu A1, A2, . . ., Ar dan variabel kedua memiliki k kategori yaitu B1, B2, . . ., Bk. Banyak pengamatan pada kategori ke-i (i = 1, 2, . . ., r) variabel pertama dan kategori ke-j (j = 1, 2, . . ., k) variabel kedua akan dinyatakan dengan Oij. Hasilnya dapat dilihat dalam sebuah tabel kontingensi r x k sebagai berikut:
14
Tabel 2.1 Struktur Data Uji Chi Square Variabel 2
B1
...
Bj
...
Bk
Jumlah
Variabel 1 A1 . . . Ai . . . Ar Jumlah
O11 . . . Oi1 . . . Or1 n.1
... . . . ... . . . ... ...
O1j . . . Oij . . . Orj n.j
... . . . ... . . . ... ...
O1k . . . Oik . . . Ork n.k
n1. . . . ni. . . . nr. N
Sumber: Usman dan Setiady (2006) Keterangan: Oij = Banyaknya pengamatan pada baris ke-i dan kolom ke-j ni. = Total banyaknya pengamatan pada baris ke-i n.j = Total banyaknya pengamatan pada kolom ke-j
Misalkan peluang kejadian Ai dan Bj adalah pij dengan i = 1, 2, . . ., r dan j = 1, 2, . . ., k, maka peluang kejadian untuk setiap Ai dan Bj dapat disajikan pada Tabel 2.2.
15
Tabel 2.2 Peluang Kejadian Kejadian 2
B1
...
Bj
...
Bk
Jumlah
Kejadian 1 A1 . . . Ai . . . Ar Jumlah
p11 . . . pi1 . . . pr1 p.1
... . . . ... . . . ... ...
p1j . . . pij . . . prj p.j
... . . . ... . . . ... ...
p1k . . . pik . . . prk p.k
p1. . . . pi. . . . pr.
Sumber: Usman dan Setiady (2006) Keterangan: pij = Peluang kejadian Ai dan Bj pi. = Peluang total pada baris ke-i p.j = Peluang total pada kolom ke-j Rumus peluang kejadian adalah: ๐๐๐ =
๐๐๐ ๐
; โ๐ , โ๐
(2.1)
Nilai harapan untuk masing-masing sel adalah:
๐ธ๐๐ =
(๐๐. )(๐.๐) ๐
; i = 1, . . . , r dan j = 1, . . . , k
(2.2)
Statistik yang digunakan dalam alat uji hipotesis adalah:
2
๐ =
(๐ โ๐ธ ) โ๐๐=1 โ๐๐=1 ๐๐ ๐๐ ๐ธ ๐๐
2
; i = 1, . . . , r dan j = 1, . . . ,k
(2.3)
16
Dengan: ๐๐๐ = Jumlah individu yang diamati pada baris ke-i dan kolom ke-j ๐ธ๐๐ = Jumlah individu yang diharapkan pada baris ke-i dan kolom ke-j N = Total banyaknya individu yang diamati โ๐๐=1 โ๐๐=1
= Jumlah seluruh sel menurut kolom dan baris
Statistik uji ๐ 2 berdistribusi chi-square dengan derajat bebas (r-1)(k-1). Berikut adalah langkah-langkah uji hipotesis chi-square : 1. Hipotesis H0 : pij = pi. p.j (kedua variabel saling bebas) H1 : pij โ pi. p.j (kedua variabel tidak saling bebas) 2. Susun frekuensi-frekuensi pengamatan dalam tabel kontingensi k x r, dengan k kolom untuk kelompok-kelompoknya. 3. Menentukan ๐ผ 2 4. Menentukan daerah penolakan, yaitu ๐ 2 > ๐๐ผ(๐โ1)(๐โ1)
5. Tentukan nilai frekuensi harapan tiap sel yaitu: ๐ธ๐๐ =
(๐๐. )(๐.๐) ๐
6. Mencari ๐ 2 = โ๐๐=1 โ๐๐=1
(๐๐๐ โ๐ธ๐๐ ) ๐ธ๐๐
2
17
7. Menarik kesimpulan a. Bila ๐ 2 masuk daerah penolakan, maka H0 ditolak. b. Bila ๐ 2 tidak masuk dalam daerah penolakan, maka H0 diterima. 2.6
Analisis CHAID (Chi-Squared Automatic Interaction Detection) Metode CHAID (Chi-Squared Automatic Interaction Detection) pertama kali
diperkenalkan pada sebuah artikel yang berjudul โAn Exploratory Technique for investigating Large Quantities of Categorical Dataโ oleh Dr. G. V. Kass tahun 1980 pada buku Applied Statistics. Teknik tersebut merupakan teknik yang lebih awal dikenal sebagai Automatic Interaction Detection (AID). Metode CHAID secara umum bekerja dengan mempelajari hubungan antara variabel respon dengan beberapa variabel prediktor kemudian mengklasifikasi sampel berdasarkan hubungan tersebut. Menurut Gallagher (2000), CHAID merupakan suatu teknik iteratif yang menguji satu persatu variabel prediktor yang digunakan dalam klasifikasi, dan menyusunnya berdasarkan pada tingkat signifikansi statistik chi-square terhadap variabel respon. CHAID digunakan untuk membentuk segmentasi yang membagi sebuah sampel menjadi dua atau lebih kelompok yang berbeda berdasarkan sebuah kriteria tertentu. Hal ini kemudian diteruskan dengan membagi kelompok-kelompok tersebut menjadi kelompok yang lebih kecil berdasarkan variabel-variabel prediktor yang lain.
18
CHAID adalah sebuah metode untuk mengklasifikasikan data kategori yang tujuan dari prosedurnya adalah untuk membagi rangkaian data menjadi subgrupsubgrup berdasarkan pada variabel respon (Lehmann dan Eherler, 2001). Hasil dari pengklasifikasian dalam CHAID akan ditampilkan dalam sebuah diagram pohon. 2.6.1 Variabel-Variabel Dalam Analisis CHAID Variabel respon dan variabel prediktor dalam analisis CHAID adalah variabel kategorik. Menurut Gallagher (2000), CHAID akan membedakan variabel-variabel prediktor kategorik menjadi tiga bentuk yang berbeda, yaitu: 1. Monotonik Yaitu variabel prediktor
yang kategorinya
dapat
dikombinasikan atau
digabungkan oleh CHAID hanya jika keduanya berdekatan satu sama lain, yaitu variabel-variabel yang kategorinya mengikuti urutan aslinya (data ordinal). 2. Bebas Yaitu variabel prediktor
yang kategorinya
dapat
dikombinasikan atau
digabungkan ketika keduanya berdekatan atau tidak satu sama lain (data nominal). 3. Mengambang (floating) Yaitu variabel prediktor yang kategori didalamnya dapat diperlakukan seperti monotonik kecuali untuk kategori yang missing value, yang dapat berkombinasi dengan kategori manapun.
19
2.6.2 Algoritma CHAID Menurut Magidson dalam Kunto dan Hasana (2006), algoritma CHAID digunakan untuk melakukan penggabungan dan pemisahan kategori-kategori dalam variabel yang akan di analisis. Secara garis besar algoritma ini dapat dibagi menjadi tiga tahap, yaitu penggabungan (merging), pemisahan (splitting), dan penghentian (stopping). 1. Penggabungan (Merging) Tahap pertama dalam algoritma CHAID adalah penggabungan (merging). Pada tahap ini akan diperiksa signifikansi dari masing-masing kategori variabel prediktor terhadap variabel respon adalah sebagai berikut: a. Bentuk tabel kontingensi dua arah untuk masing-masing variabel prediktor dengan variabel responnya. b. Hitung statistik chi-square untuk setiap pasang kategori yang dapat dipilih untuk digabung menjadi satu, untuk menguji kebebasannya dalam sebuah sub tabel kontingensi 2 x J yang dibentuk oleh sepasang kategori tersebut dengan variabel responnya yang mempunyai sebanyak J kategori. c. Untuk masing-masing nilai chi-square berpasangan, hitung p-value berpasangan bersamaan. Diantara pasangan-pasangan yang tidak signifikan, gabungkan sebuah pasangan kategori yang paling mirip (yaitu pasangan yang mempunyai nilai chisquare berpasangan terkecil dan p-value terbesar) menjadi sebuah kategori tunggal, dan kemudian dilanjutkan kelangkah d.
20
d. Periksa kembali kesignifikanan kategori baru setelah digabung dengan kategori lainnya dalam variabel prediktor. Jika masih ada pasangan yang belum signifikan, ulangi langkah c. Jika semuanya sudah signifikan lanjutkan kelangkah e. e. Hitung p-value terkoreksi Bonferroni didasarkan pada tabel yang telah digabungkan. 2. Pemisahan (Splitting) Tahap pemisahan memilih variabel prediktor yang akan digunakan sebagai split node (pemisahan node) yang terbaik. Pemisahan dikerjakan dengan membandingkan p-value (dari tahap penggabungan) pada setiap variabel prediktor. Langkah pemisahan adalah sebagai berikut: a. Pilih variabel prediktor yang memiliki p-value terkecil (paling signifikan) yang akan digunakan sebagai split node. b. Jika p-value kurang dari atau sama dengan tingkat spesifikasi alpha, split node menggunakan variabel prediktor ini. Jika tidak ada variabel prediktor dengan nilai p-value yang signifikan, tidak dilakukan split dan node ditentukan sebagai terminal node (node akhir). 3. Penghentian (Stopping) Tahap penghentian dilakukan jika proses pertumbuhan pohon harus dihentikan sesuai dengan peraturan pemberhentian di bawah ini: a. Tidak ada lagi variabel prediktor yang signifikan menunjukkan perbedaan terhadap variabel respon.
21
b. Jika pohon sekarang mencapai batas nilai maksimum pohon dari spesifikasi, maka pertumbuhan akan berhenti. c. Jika ukuran nilai child node kurang dari nilai ukuran child node minimum spesifikasi, atau berisi pengamatan-pengamatan dengan jumlah yang terlalu sedikit maka node tidak akan di gabung. 2.6.3 Koreksi Bonferroni (Bonferroni Correction) Koreksi Bonferroni adalah suatu proses koreksi yang digunakan ketika beberapa uji statistik untuk kebebasan atau ketidakbebasan dilakukan secara bersamaan (Sharp et al., 2002). Koreksi Bonferroni biasanya digunakan dalam pembandingan berganda. Ketika terdapat sebanyak M uji perbandingan yang sudah dikatakan bebas satu sama lain, peluang untuk melakukan kesalahan tipe 1 atau ฮฑ (dalam satu atau lebih uji-uji tersebut), akan sama dengan 1 dikurangi peluang untuk tidak melakukan kesalahan tipe 1 dalam uji-uji tersebut, dimana nilainya akan lebih besar dari ฮฑ yang telah ditentukan. Secara umum, hal tersebut dapat dirumuskan sebagai berikut (Bagozzi, 1994): 1 โ (1 โ ๐ผ )๐ > ๐ผ
(2.4)
22
Dengan: M = pengali Bonferroni ๐ผ = kesalahan tipe 1 Pengali Bonferrani untuk masing-masing tipe variabel-variabel prediktor adalah berbeda. Menurut Gallagher (2000) pengali Bonferroni untuk masing-masing jenis variabel-variabel prediktor adalah sebagai berikut: 1. Variabel prediktor monotonik ๐โ1 ๐=( ) ๐โ1
(2.5)
2. Variabel prediktor bebas (๐โ๐)๐
๐ ๐ = โ๐โ1 ๐=0 (โ1) ๐!(๐โ๐)!
(2.6)
3. Variabel prediktor mengambang ๐โ2 ๐โ2 ๐=( )+๐( ) ๐โ2 ๐โ1 Dengan: M = pengali Bonferroni c = banyaknya kategori variabel prediktor awal r = banyaknya kategori variabel prediktor setelah penggabungan
(2.7)
23
2.6.4 Diagram Pohon Klasifikasi CHAID CHAID akan menghasilkan sebuah diagram pohon klasifikasi yang menggambarkan pembentukan segmen. Diagram CHAID terdiri dari batang pohon (tree trunk) dengan membagi (split) menjadi lebih kecil berupa cabang-cabang (brances). Y ny = 1 ny = 2 ny = 3
X1 1
3 2
ny = 1, x1 = 1
ny = 1, x1 = 2
ny = 1, x1 = 3
ny = 2, x1 = 1
ny = 2, x1 = 2
ny = 2, x1 = 3
ny = 3, x1 = 1
ny = 3, x1 = 2
ny = 3, x1 = 3
X2 4
X3 5
6
7
ny = 1, x1 = 1, x2 = 1
ny = 1, x1 = 1, x2 = 2
ny = 1, x1 = 3, x3 = 1
ny = 1, x1 = 3, x3 = 2
ny = 2, x1 = 1, x2 = 1
ny = 2, x1 = 1, x2 = 2
ny = 2, x1 = 3, x3 = 1
ny = 2, x1 = 3, x3 = 2
ny = 3, x1 = 1, x2 = 1
ny = 3, x1 = 1, x2 = 2
ny = 3, x1 = 3, x3 = 1
ny = 3, x1 = 3, x3 = 2
Gambar 2.1 Diagram Pohon Dalam Analisis CHAID Sumber: Lehmann dan Eherler (2001)
24
Menurut Myers dalam Kunto dan Hasana (2006) diagram pohon CHAID mengikuti aturan โdari atas ke bawahโ (top-down stopping rule). Diagram pohon disusun mulai dari kelompok induk (parent node), berlanjut dibawahnya sub kelompok (child node) yang berturut-turut dari hasil pembagian kelompok induk berdasarkan kriteria tertentu. Node pada ujung pohon yang tidak terdapat percabangan lagi disebut terminal node. Tiap-tiap node dari diagram pohon ini menggambarkan sub kelompok dari sampel yang diteliti dan berisi keseluruhan sampel dan frekuensi absolute ni untuk setiap kategori yang disusun. Pada pohon klasifikasi CHAID terdapat istilah kedalaman (depth) yang berarti banyaknya tingkatan node-node sub kelompok sampai ke bawah pada node sub kelompok yang terakhir. Pada kedalaman pertama, sampel dibagi oleh X1 sebagai variabel prediktor terbaik untuk variabel respon berdasarkan uji chi-square. Tiap node berisi informasi tentang frekuensi variabel Y, sebagai variabel respon, yang merupakan bagian dari sub kelompok yang dihasilkan berdasarkan kategori yang disebutkan (X1). Pada kedalaman ke-2 (node X2 dan X3) merupakan pembagian dari X1 (untuk node ke-1 dan ke-3). Dengan cara yang sama, sampel selanjutnya dibagi oleh variabel prediktor yang lain, yaitu X2 dan X3, dan selanjutnya menjadi sub kelompok pada node ke-4, 5, 6, dan 7 (Lehmann dan Eherler, 2001). Pada masingmasing node ditampilkan persentase responden untuk setiap kategori dari variabel respon, dan juga ditunjukkan jumlah total responden untuk masing-masing node (Myers, dalam Kunto dan Hasana, 2006).
25
2.7
Analisis Regresi Logistik Biner Analisis regresi logistik biner merupakan suatu teknik untuk menganalisis
data yang variabel responnya memiliki dua kategori dengan satu atau lebih variabel prediktor yang berskala kontinu dan atau kategorik. Metode regresi logistik merupakan metode regresi dengan variabel respon Y dalam bentuk kategorik yaitu variabel biner atau dikotomi yang mempunyai dua kemungkinan nilai (Ryan, 1997). Apabila variabel Y merupakan variabel biner atau dikotomi dalam artian nilai variabel respon terdiri dari dua kategori yaitu โsuksesโ (Y=1) atau โgagalโ (Y=0), maka variabel Y mengikuti sebaran Bernoulli yang mempunyai fungsi peluang: ๐(๐ = ๐ฆ) = ๐ ๐ฆ (1 โ ๐)1โ๐ฆ ; ๐ฆ = 0,1
(2.8)
Nilai harapan dari variabel respon Y untuk nilai variabel prediktor x yang diberikan
adalah
[๐ธ (๐|๐ฅ )].
Untuk
menyerderhanakan
notasi,
digunakan
๐(๐ฅ ) = ๐ฝ0 + ๐ฝ1 ๐1 + ๐ฝ2 ๐2 + โฆ + ๐ฝ๐ ๐๐ dan ๐(๐ฅ ) = ๐ธ(๐|๐ฅ) yang menjelaskan rataan bersyarat dari Y untuk nilai x yang diberikan apabila digunakan distribusi logistik (Hosmer&Lemeshow,1989). Dapat dilihat pada persamaan berikut: ๐ (๐ฅ ) =
exp [๐(๐ฅ)] 1+exp [๐(๐ฅ)]
=
exp (๐ฝ0 +๐ฝ1 ๐1 +๐ฝ2 ๐2 + โฆ+๐ฝ๐ ๐๐ ) 1+exp (๐ฝ0 +๐ฝ1 ๐1 +๐ฝ2 ๐2 + โฆ+๐ฝ๐ ๐๐ )
(2.9)
Persamaan 2.8 disebut fungsi logistik ๐[๐(๐ฅ)], sehingga dapat dituliskan sebagai berikut: exp [๐(๐ฅ)]
๐[๐(๐ฅ )] = 1+exp[๐(๐ฅ)] ,
โ โ < ๐(๐ฅ ) < +โ
(2.10)
26
Apabila ditetapkan nilai g(x) pada persamaan 2.9, maka akan diperoleh: lim
๐(๐ฅ)โโโ
๐[๐(๐ฅ )] = 0
lim ๐[๐(๐ฅ )] = 1
(2.11)
๐(๐ฅ)โโ
Dari persamaan 2.11 dapat dilihat bahwa nilai ๐[๐(๐ฅ)] selalu berada pada selang 0 dan 1 untuk semua nilai g(x), sehingga nilai ๐[๐(๐ฅ)] menunjukkan bahwa model logistik menggambarkan peluang suatu kejadian atau risiko dari suatu kejadian. Hubungan antara variabel prediktor dan peluangnya adalah hubungan tidak linier sehingga untuk mendapatkan hubungan yang linier dilakukan suatu tranformasi logit. Hasil transformasinya sebagai berikut: ๐(๐ฅ)
๐(๐ฅ ) = ln (1โ๐(๐ฅ)) = ๐ฝ0 + ๐ฝ1 ๐1 + ๐ฝ2 ๐2 + โฆ + ๐ฝ๐ ๐๐
(2.12)
Fungsi sebaran responnya adalah ๐ฆ = ๐(๐ฅ ) + ๐, sehingga apabila nilai y=1 maka ๐ = 1 โ ๐(๐ฅ) dengan peluang ๐(๐ฅ), sedangkan apabila y=0 maka ๐ = โ ๐(๐ฅ) dengan peluang 1 โ ๐(๐ฅ). Sebaran ๐ mengikuti sebaran Binomial dengan rataan 0 dan ragam ๐(๐ฅ )[1 โ ๐(๐ฅ)]. 2.8
Pendugaan Parameter Metode paling umum yang digunakan untuk menduga parameter pada model
regresi logistik adalah metode kemungkinan maksimum (Methode of Maximum Likelihood) (Hosmer & Lemeshow, 1989). Secara umum fungsi likelihood didefinisikan sebagai fungsi peluang bersama dari variabel acak yang dibentuk oleh sampel.
Khususnya,
untuk
sampel
dengan
ukuran
n
dengan
amatannya
27
( y1 , y 2 ,๏, y n ) korespondensi variabel acaknya adalah
๏จY1 , Y2 ,๏, Yn ๏ฉ.
Selama Yi
dianggap independen, maka fungsi densitas peluang bersamanya adalah sebagai berikut: ๐(๐1 , ๐2 , โฆ , ๐๐ ) = โ๐๐=1 ๐(๐๐ ; ๐)
(2.13)
Jika Y dikodekan 0 dan 1 maka menurut persamaan (2.9) ๐(๐ฅ ) = ๐(๐ = 1|๐ฅ) dan 1 โ ๐(๐ฅ ) = ๐(๐ = 0|๐ฅ) sehingga, untuk pasangan-pasangan (๐ฅ๐ , ๐ฆ๐ ) berlaku ๐ฆ๐ = 1 dengan fungsi kemungkinan maksimumnya adalah 1 โ ๐(๐ฅ๐ ). Secara sistematis fungsi kemungkinan maksimum untuk pasangan (๐ฅ๐ , ๐ฆ๐ ) adalah sebagai berikut: ๐(๐ฅ๐ ) = ๐(๐ฅ๐ )๐ฆ๐ [1 โ ๐(๐ฅ๐ )]1โ๐ฆ๐
(2.14)
Apabila amatan-amatan diasumsikan saling bebas, fungsi kemungkinan maksimum dapat ditulis sebagai berikut: ๐(๐ฝ ) = โ๐๐=1 ๐(๐ฅ๐ ) = โ๐๐=1 ๐(๐ฅ๐ )๐ฆ๐ [1 โ ๐(๐ฅ๐ )]1โ๐ฆ๐
(2.15)
Metode kemungkinan maksimum memberikan nilai penduga dari vektor ๐ฝ โฒ = (๐ฝ0 ๐ฝ1 โฆ ๐ฝ๐ ) dengan memaksimumkan fungsi kemungkinan bersama pada persamaan (2.15), secara matematik bentuk logaritma dari fungsi kemungkinan bersama adalah sebagai berikut: ๐ฟ(๐ฝ ) = ln[๐(๐ฝ )] = โ๐๐=1[๐ฆ๐ ln[๐(๐ฅ๐ )] + (1 โ ๐ฆ๐ ) ln[1 โ ๐(๐ฅ๐ )]]
(2.16)
28
exp [๐(๐ฅ )]
Dengan substitusi ๐(๐ฅ๐ ) = 1+exp[๐(๐ฅ๐ )] dimana ๐(๐ฅ๐ ) = ๐ฝ0 + ๐ฝ1 ๐1 + ๐ฝ2 ๐2 + โฆ + ๐ฝ๐ ๐๐ ๐
maka diperoleh: exp[๐(๐ฅ )]
1
๐ฟ(๐ฝ ) = โ๐๐=1 [โ๐๐=1 ๐ฆ๐ ln [1+exp[๐(๐ฅ๐ )]] + (1 โ ๐ฆ๐ )ln [1+exp[๐(๐ฅ )]]] ๐
๐
1
1
= โ๐๐=1 [[๐ฆ๐ ๐๐ exp[๐(๐ฅ๐ )] โ ๐ฆ๐ ln(1 + exp[๐(๐ฅ๐ )]) + ๐๐ [1+exp[๐(๐ฅ )]] โ ๐ฆ๐ ๐๐ [1+exp[๐(๐ฅ )]]] ๐
๐
=
โ๐๐=1 [๐ฆ๐ [๐(๐ฅ๐ )] โ ๐ฆ๐ ln(1 + exp[๐(๐ฅ๐ )]) + [ln 1 โ ln[1 + exp[๐(๐ฅ๐ )]]] โ ๐ฆ๐ [ln 1 โ ln[1 + exp[๐(๐ฅ๐ )]]]]
= โ๐๐=1(๐ฆ๐ [๐(๐ฅ๐ )] โ ๐ฆ๐ ln(1 + exp[๐(๐ฅ๐ )])) โ ln[1 + exp[๐(๐ฅ๐ )]] + ๐ฆ๐ ln[1 + exp[๐(๐ฅ๐ )]]
= โ๐๐=1 ๐ฆ๐ [๐(๐ฅ๐ )] โ ln[1 + exp[๐(๐ฅ๐ )]] ๐
= โ ๐ฆ๐ (๐ฝ0 + ๐ฝ1 ๐1 + ๐ฝ2 ๐2 + โฆ + ๐ฝ๐ ๐๐ ) โ ln (1 + exp(๐ฝ0 + ๐ฝ1 ๐1 + ๐ฝ2 ๐2 + โฆ + ๐ฝ๐ ๐๐ )) ๐=1
Untuk memperoleh nilai penduga ๐ฝฬ๐ , dimana i = 1, 2, . . ., p yang memaksimumkan nilai fungsi ๐ฟ(๐ฝ ). Selanjutnya ๐ฟ(๐ฝ ) dideferensialkan terhadap setiap ๐ฝ๐ . ๐
๐ฟ(๐ฝ) = โ (๐ฝ0 ๐ฆ๐ + ๐ฝ1 ๐ฅ1 ๐ฆ๐ + โฏ + ๐ฝ๐ ๐ฅ๐ ๐ฆ๐ โ ln (1 + exp(๐ฝ0 ๐ฆ๐ + ๐ฝ1 ๐ฅ1 ๐ฆ๐ + โฏ + ๐ฝ๐ ๐ฅ๐ ๐ฆ๐ ))) ๐=1 ๐
๐ฟ๐ฟ(๐ฝ) 1 = โ [๐ฆ๐ โ ( . exp(๐ฝ0 ๐ฆ๐ + ๐ฝ1 ๐ฅ1 ๐ฆ๐ + โฏ + ๐ฝ๐ ๐ฅ๐ ๐ฆ๐ ))] ๐ฟ๐ฝ0 1 + exp(๐ฝ0 ๐ฆ๐ + ๐ฝ1 ๐ฅ1 ๐ฆ๐ + โฏ + ๐ฝ๐ ๐ฅ๐ ๐ฆ๐ ) ๐=1
๐ฟ๐ฟ(๐ฝ) ๐ฟ๐ฝ1
dan
= โ๐๐=1 [๐ฅ1 ๐ฆ๐ โ
1 1+๐๐ฅ๐[๐(๐ฅ๐)]
. ๐ฅ1 exp[๐(๐ฅ๐ )]]
29
๐ฟ๐ฟ(๐ฝ) ๐ฟ๐ฝ๐
1
= โ๐๐=1 [๐ฅ๐ ๐ฆ๐ โ 1+๐๐ฅ๐[๐(๐ฅ )] . ๐ฅ1 exp[๐(๐ฅ๐ )]] ๐
Untuk mendapatkan ๐ฝ๐ , i= 1, 2, . . ., p maka ๐ฟ๐ฟ(๐ฝ) ๐ฟ๐ฝ0
= โ๐๐=1 [๐ฆ๐ โ (1+exp(๐ฝ ๐ฟ๐ฟ(๐ฝ) ๐ฟ๐ฝ1 ๐ฟ๐ฟ(๐ฝ) ๐ฟ๐ฝ๐
2.9
1
0 ๐ฆ๐ +๐ฝ1 ๐ฅ1 ๐ฆ๐ +โฏ+๐ฝ๐ ๐ฅ๐ ๐ฆ๐ )
= โ๐๐=1 [๐ฅ1 ๐ฆ๐ โ
1
๐ฟ๐ฟ(๐ฝ) ๐ฟ๐ฝ๐
=0
. exp(๐ฝ0 ๐ฆ๐ + ๐ฝ1 ๐ฅ1 ๐ฆ๐ + โฏ + ๐ฝ๐ ๐ฅ๐ ๐ฆ๐ ))] = 0
. ๐ฅ1 exp[๐(๐ฅ๐ )]] = 0
(2.17)
= โ๐๐=1 [๐ฅ๐ ๐ฆ๐ โ 1+๐๐ฅ๐[๐(๐ฅ )] . ๐ฅ1 exp[๐(๐ฅ๐ )]] = 0
(2.18)
1+๐๐ฅ๐[๐(๐ฅ๐)] 1
๐
Pengujian Parameter Pengujian terhadap parameterโparameter model dilakukan untuk mengetahui
peran seluruh variabel prediktor baik secara bersamaโsama (simultan) maupun secara parsial. Menurut Hosmer dan Lemeshow (2000), untuk pengujian parameter secara bersama dapat digunakan uji nisbah kemungkinan yaitu uji G dengan hipotesis: H0 : ฮฒ1= ฮฒ2= ... = ฮฒp= 0 (Tidak ada pengaruh sekumpulan variabel prediktor terhadap variabel respon). H1 : minimal ada satu ฮฒiโ 0 (Minimal satu dari variabel prediktor berpengaruh terhadap variabel respon). Statistik uji yang digunakan adalah statistik uji G di mana rumus uji G adalah: ๏ฉL ๏น G ๏ฝ ๏ญ2 ln ๏ช 0 ๏บ ๏ซ Lk ๏ป
Keterangan:
L0
= fungsi kemungkinan maksimum tanpa variabel prediktor
Lk
= fungsi kemungkinan maksimum dengan variabel prediktor
(2.19)
30
Jika H0 benar, statistik uji G akan mengikuti sebaran distribusi ๐ 2 dengan 2 derajat bebas (p-1). Hipotesis nol akan ditolak jika nilai statistika uji G > ๐๐โ1,๐ผ .
Kriteria uji yang digunakan adalah:
๏ฌ๏ฃ ๏ฃ ๏ก2 / 2,db , Terima H 0 G๏ฝ๏ญ 2 ๏ฎ ๏พ ๏ฃ ๏ก / 2,๏ฌ , Tolak H 0 Sedangkan pengujian parameter ฮฒi secara parsial dilakukan dengan membandingkan model terbaik yang dihasilkan oleh uji simultan terhadap model tanpa variabel bebas di dalam model terbaik. Pengujian hipotesis yang dilakukan yaitu: H0 : ฮฒi = 0 (Tidak ada pengaruh variabel bebas yang diuji terhadap variabel respon). H1 : ฮฒi โ 0 (Terdapat pengaruh variabel bebas yang diuji terhadap variabel respon). Statistik ujinya adalah: W ๏ฝ
๏ขหi
๏จ ๏ฉ
^
SE ๏ขหi
(2.20)
Jika H0 benar, maka statistik uji W akan mengikuti sebaran normal baku Z, H 0 akan ditolak jika W > ๐๐ผโ2 . 2.10
Regresi Logistik Bertatar (Stepwise Logistic Regression) Regresi logistik bertatar adalah sebuah metode yang digunakan untuk
memasukkan atau mengeluarkan variabel-variabel dari suatu model (Hosmer & Lemeshow, 1989).
Metode ini diawali dengan metode seleksi langkah maju
kemudian dilanjutkan dengan eliminasi langkah mundur.
31
Seleksi langkah maju didasarkan pada nilai log likelihood (L). Uji yang digunakan adalah Log Likelihood Ratio Test dengan statistik uji G, yaitu: G ๏ฝ 2๏จL0 ๏ญ L j ๏ฉ
(2.21)
Keterangan: L0 : Nilai log likelihood model hanya dengan konstanta. Lj : Nilai log likelihood model dengan variabel ke-j. Pada langkah awal, dimasukkan nila p yang minimum, selanjutnya diteruskan dengan penambahan variabel yang dilakukan dengan uji G. Seleksi langkah maju berhenti jika pada langkah kedua atau seterusnya diperoleh nilai p pada uji G yang bermakna (Hosmer & Lemeshow, 1989). Kemudian dilanjutkan dengan langkah mundur dengan menggunakan statistik uji: ๐บ = 2 (๐ฟ๐1๐2 โ ๐ฟ๐๐ ) ๐ฟ๐1๐2
(2.22)
: Nilai log likelihood hasil seleksi langkah maju dengan variabel yang dimasukkan adalah variabel 1 dan variabel 2.
๐ฟ ๐๐
: Nilai log likelihood jika variabel yang masuk pada tahap ke-j dibuang.
Pembuangan langkah ke-j dengan pertimbangan nilai p yang maksimum. Langkah eliminasi langkah mundur dihentikan jika diperoleh statistik G dengan nilai p-value > ฮฑ. Kemudian dilakukan analisis untuk menyusun model regresi logistik dan interpretasi masing-masing koefisien.
32
2.11
Interpretasi Koefisien Interpretasi koefisien dilakukan pada variabel-variabel yang berpengaruh
nyata. Pada regresi logistik dengan satu variabel prediktor ฮฒ1= g(x+1) โ g(x) menunjukkan perubahan nilai logit untuk setiap satu unit perubahan pada variabel prediktor x untuk model regresi logistik dengan satu variabel prediktor dikotomi dapat diilustrasikan dalam tabel 2.3 berikut (Hosmer & Lemeshow, 1989). Tabel 2.3. Nilai-nilai Dari Model Logistik untuk Variabel Prediktor Dikotomi Variabel Respon
Variabel Prediktor X=1
Y=1
๐ (1) =
Y=0
X=0 exp(๐ฝ0 + ๐ฝ1 ) 1 + exp(๐ฝ0 + ๐ฝ1 )
1 โ ๐ (1) =
Jumlah
๐ (0) =
1 1 + exp(๐ฝ0 + ๐ฝ1 )
1
exp(๐ฝ0 ) 1 + exp(๐ฝ0 )
1 โ ๐ (0) =
1 1 + exp(๐ฝ0 )
1
Sumber: Hosmer & Lemeshow (1989) Nilai odds rasio antara Y=1 dengan Y=0 untuk X=1 adalah ๐(1)โ[1 โ ๐(1)], sedangkan nilai odds rasio antara Y=1 dengan Y=0 untuk X=0 adalah ๐(0)โ[1 โ ๐(0)]. Log dari kedua odds rasio tersebut didefinisikan sebagai g(1) dan g(0). Odds ratio (ฯ) didefinisikan sebagai rasio dari odds untuk x=1 dengan x=0 sehingga: P(Y=1|X=1)/P(Y=0|X=1)
[๐(1)โ[1โ๐(1)]]
ฮจ = P(Y = 1|X = 0)/P(Y=0|X=0) = [๐(0)โ[1โ๐(0)]] = exp(ฮฒ1 )
(2.23)
33
[ฯ(1)/[1โฯ(1)]]
๐ฟ๐(ฮจ) = Ln ([ฯ(0)/[1โฯ(0)]]) = g(1) โ g(0) = ๐ฝ1 = ๐๐๐๐ ๐๐๐๐๐ก
(2.24)
Model logistik dengan satu peubah bebas dikotomi, koefisien ฮฒ1 adalah beda logit, sedangkan exp(ฮฒ1) adalah nilai rasio dari odds (Hosmer &Lemeshow. 1989). Berdasarkan persamaan (2.23) dapat diinterpretasikan bahwa rasio odds (ฯ)=1 berarti bahwa individu dengan nilai X = 1 mempunyai peluang yang sama dengan individu nilai X = 0 dalam kaitannya dengan Y = 1. Jika 1 < ฯ < โ maka individu X = 1 mempunyai peluang yang lebih besar dibanding dengan X = 0 dalam kaitannya dengan Y = 1. Sebaliknya jika 0 < ฯ < 1 individu dengan X = 1 mempunyai peluang yang lebih kecil dibanding X = 0 dalam kaitannya dengan Y = 1.