ANALISIS CART KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA DI FEM DAN FAPERTA
FIRA NURAHMAH AL AMIN
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA* Dengan ini saya menyatakan bahwa skripsi berjudul Analisis CART Ketepatan Waktu Lulus Berdasarkan Karakteristik Mahasiswa di FEM dan FAPERTA adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, November 2013
Fira Nurahmah Al Amin NIM G14090036
ABSTRAK FIRA NURAHMAH AL AMIN. Analisis CART Ketepatan Waktu Lulus Berdasarkan Karakteristik Mahasiswa di FEM dan FAPERTA. Dibimbing oleh INDAHWATI dan YENNI ANGRAINI. Lulus tepat waktu merupakan salah satu indikator keberhasilan mahasiswa dalam memperoleh gelar sarjana. Penelitian sebelumnya dengan menggunakan metode CHAID (Chi-Squared Automatic Interaction Detection) mendapatkan kesimpulan bahwa peluang klasifikasi tertinggi dalam menggolongkan mahasiswa IPB yang lulus tepat waktu berasal dari FEM, sedangkan peluang klasifikasi terendah berasal dari FAPERTA. Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengidentifikasi karakteristik mahasiswa sebagai indikator ketepatan waktu lulus dari fakultas dengan ketepatan lulus mahasiswa tertinggi dan terendah dengan menggunakan metode CART (Classification and Regression Tree). Pohon klasifikasi FEM menggolongkan mahasiswa lulus tepat waktu tertinggi sebesar 75% memiliki ciri-ciri berasal dari Departemen IE dan MAN. Pohon klasifikasi FAPERTA menggolongkan mahasiswa lulus tepat waktu tertinggi sebesar 26.1% memiliki ciri-ciri berasal dari Departemen AGH dan PTN, dan memiliki IPK lebih besar dari 3.335. Pohon klasifikasi FAPERTA lebih baik dalam menduga mahasiswa lulus tepat waktu dengan nilai ketepatan sebesar 81.47% sedangkan pohon klasifikasi FEM lebih baik dalam menduga mahasiswa lulus tidak tepat waktu dengan nilai ketepatan sebesar 71.4%. Kata kunci: CART, CHAID, pohon klasifikasi
ABSTRACT FIRA NURAHMAH AL AMIN. Timeliness Pass Analysis Based on Characteristics of FEM and FAPERTA Students Using CART Method. Supervised by INDAHWATI and YENNI ANGRAINI. Graduate on time is one of the indicators of a student’s success in obtaining their undergraduate degrees. Previous study using CHAID (Chi-Squared Automatic Interaction Detection) method concluded that the highest probability classification for the IPB students who graduated on time comes from FEM and the lowest probability classification comes from FAPERTA. According to that, the purpose of this research is to identify the student’s characteristics as an indicator of the timeliness pass from the faculty with highest and lowest number of students who graduated on time using CART method. Tree classification of FEM classifies the characteristics of the highest students that graduated on time by 75% as the students from Departements of IE and MAN. Tree classification of FAPERTA classifies the characteristics of the highest students that graduated on time by 26.1% as the students from Departements of AGH and PTN and have GPA greater than 3.335. The classification tree of FAPERTA is better to estimate students who graduated on time with accuracy value 81.47% and the classification tree of FEM is better to estimate students who didn’t graduate on time with accuracy value 71.4%. Keywords: CHAID, CART, tree classification
ANALISIS CART KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA DI FEM DAN FAPERTA
FIRA NURAHMAH AL AMIN
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2013
Judul Skripsi : Analisis CART Ketepatan Waktu Lulus Berdasarkan Karakteristik Mahasiswa di FEM dan FAPERTA Nama : Fira Nurahmah Al Amin NIM : G14090036
Disetujui oleh
Dr Ir Indahwati, MSi Pembimbing I
Yenni Angraini, MSi Pembimbing II
Diketahui oleh
Dr Ir Hari Wijayanto, MS Ketua Departemen
Tanggal Lulus:
PRAKATA Segala puji dan syukur kepada Allah SWT atas kasih sayang, keberkahan, dan hidayah-Nya sehingga karya ilmiah ini dapat diselesaikan. Salawat serta salam Penulis panjatkan kepada Nabi Muhammad SAW yang telah membawa petunjuk untuk para pengikutnya. Karya ilmiah ini berjudul “Analisis CART Ketepatan Waktu Lulus Berdasarkan Karakteristik Mahasiswa di FEM dan FAPERTA” sebagai salah satu syarat kelulusan untuk meraih gelar sarjana. Selain itu Penulis ingin mengucapkan terima kasih kepada 1. Mama dan Papa beserta kedua adik Penulis yaitu Fajar dan Filia atas perjuangan, kasih sayang, motivasi dan lirihan doa yang senantiasa dipanjatkan untuk Penulis. 2. Ibu Dr Ir Indahwati, MSi dan Ibu Yenni Angraini, MSi selaku dosen pembimbing atas kesabaran, pengarahan, saran, nasehat dan inspirasi yang diberikan selama pembuatan karya ilmiah ini. 3. Ibu Pika Silvianti, MSi selaku dosen penguji luar atas saran dan masukan untuk karya ilmiah ini. 4. Seluruh Dosen Statistika IPB atas ilmu yang diajarkan selama Penulis menjalani studinya beserta para Staf Administrasi terutama Ibu Markonah dan Ibu Tri. 5. Teman-teman satu pembimbing skripsi Habibah R, Rindy AP, Aisyah NS, dan Dyah A yang sama-sama berjuang untuk menyelesaikan karya ilmiah, terima kasih untuk support dan diskusinya. 6. Teman-teman satu perjuangan Astri W, Wahyu B, Rizky N, Azyl YKS, Riad CS, Rafika N dan seluruh keluarga besar Statistika IPB angkatan 46, terima kasih atas motivasi dan supportnya selama ini. 7. Kak Mia Amelia, kak Hadi, kak Nurul Fitri terima kasih atas ilmu dan saran yang telah diberikan kepada penulis. 8. Sasni TP, Sarah P, Linda E, Amirah Yumn, Rianika N, Nurhalimah, Karina, Casia N, Miko Novri A, Martua P, Nanie K, Kartika AP, Aindra Budiar terima kasih atas doa dan dukungannya selama ini. 9. Rosalina, Siti Kendalia, Rizky Oktavkiani B, Cucu S, Syeila R dan temanteman TPB terima kasih atas motivasi dan supportnya. 10. Alv Nurhiya, Hikmah terima kasih atas doa dan dukungannya. Akhir kata semoga karya ilmiah ini bermanfaat dan dapat memberikan kontribusi dalam menambah kekayaan keilmuan statistik.
Bogor, November 2013
Fira Nurahmah Al Amin
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
METODE
2
Data
2
Prosedur Analisis Data
2
HASIL DAN PEMBAHASAN
4
Gambaran Umum Data
4
Pohon Klasifikasi FAPERTA
6
Pohon Klasifikasi FEM
9
Perbandingan Antara FEM dan FAPERTA KESIMPULAN Simpulan
11 12 12
DAFTAR PUSTAKA
12
LAMPIRAN
14
RIWAYAT HIDUP
17
DAFTAR TABEL 1 2 3 4 5
Proporsi mahasiswa FAPERTA dan FEM Simpul-simpul terminal pada setiap status ketepatan lulus FAPERTA Kesesuaian klasifikasi CART mahasiswa FAPERTA Simpul-simpul terminal pada setiap status ketepatan lulus FEM Kesesuaian klasifikasi CART mahasiswa FEM
5 8 8 10 10
DAFTAR GAMBAR 1 2 3 4 5
Persentase ketepatan lulus mahasiswa di FAPERTA dan FEM Persentase banyaknya kelulusan Departemen FAPERTA dan FEM Persentase ketepatan waktu lulus berdasarkan karakteristik mahasiswa Pohon Klasifikasi FAPERTA Pohon Klasifikasi FEM
4 5 6 7 9
DAFTAR LAMPIRAN 1 Daftar peubah yang digunakan beserta kategorinya 2 Ringkasan diagram pohon klasifikasi mahasiswa FAPERTA 3 Ringkasan diagram pohon klasifikasi mahasiswa FEM
14 15 16
PENDAHULUAN Latar Belakang Pendidikan adalah usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi diri (UU No. 20 tahun 2003). Salah satu jenjang pendidikan yang menjadi syarat dalam mencari pekerjaan adalah perguruan tinggi. Perguruan tinggi yang akan dianalisis dalam karya ilmiah ini adalah Institut Pertanian Bogor (IPB). Dalam buku Panduan Program Sarjana 2009, Visi IPB menjadi perguruan tinggi berbasis riset kelas dunia dengan kompetensi utama pertanian tropika dan biosains serta berkarakter kewirausahaan. Motto IPB yaitu mencari dan memberi yang terbaik. Oleh karena itu, perguruan tinggi IPB tentunya menyiapkan calon-calon sarjana yang handal dan mempunyai keterampilan di bidangnya masing-masing. Lulus tepat waktu merupakan salah satu indikator keberhasilan mahasiswa dalam memperoleh gelar sarjana. Mahasiswa dikatakan lulus tepat waktu apabila menyelesaikan studinya di perguruan tinggi selama kurang dari atau sama dengan empat tahun, sedangkan mahasiswa dikatakan tidak lulus tepat waktu apabila menyelesaikan studinya di perguruan tinggi selama lebih dari empat tahun. Dalam praktiknya mahasiswa tidak selalu dapat menyelesaikan pendidikan sarjana dalam kurun waktu empat tahun. Mahasiswa yang telah menyelesaikan studi program sarjana selanjutnya mendaftar sebagai calon wisudawan. Pada saat mendaftar sebagai calon wisudawan dicatat juga peubah karakteristik mahasiswa. Penelitian mengenai ketepatan waktu lulus mahasiswa IPB dikaitkan dengan karakteristik mahasiswa telah dilakukan oleh Pertiwi (2013) menggunakan metode CHAID (Chi-Squared Automatic Interaction Detection). Hasil penelitian menyimpulkan bahwa peluang klasifikasi tertinggi menggolongkan mahasiswa IPB lulus tepat waktu berasal dari FEM sebesar 65.45%, sedangkan peluang klasifikasi terendah menggolongkan mahasiswa IPB lulus tepat waktu berasal dari FAPERTA sebesar 11.8%. Berdasarkan hal tersebut perlu dilakukan penelitian lebih lanjut mengenai peubahpeubah karakteristik mahasiswa dalam menentukan ketepatan waktu lulus mahasiswa dari fakultas dengan ketepatan waktu lulus mahasiswa tertinggi dan terendah. Metode yang digunakan dalam penelitian ini adalah metode CART (Classification and Regression Tree). CART adalah salah satu metode atau algoritma dari teknik pohon keputusan. CART adalah suatu metode statistik nonparametrik yang dapat menggambarkan hubungan antara peubah respon (peubah dependen) dengan satu atau lebih peubah penjelas (peubah independen). Menurut Breiman et al. (1993) apabila peubah respon berbentuk kontinu maka metode yang digunakan adalah metode pohon regresi (regression trees), sedangkan apabila peubah respon memiliki skala kategorik maka metode yang digunakan adalah metode klasifikasi pohon (classification trees). Peubah respon dalam penelitian ini berskala kategorik, sehingga metode yang akan digunakan adalah metode pohon klasifikasi. Persamaan antara metode CART dan CHAID yaitu keduanya dikembangkan untuk topik analisis klasifikasi. Keunggulan metode CART adalah
2 tidak perlu dipenuhinya asumsi sebaran oleh semua peubah (Breiman et al. 1993). CART tidak dipengaruhi oleh pencilan, kolinieritas, heterokedastisitas atau struktur distribusi galat yang biasanya mempengaruhi metode parametrik. Pencilan akan diisolasi ke dalam simpul tertentu sehingga tidak mempengaruhi penyekatan (Komalasari 2007). CART dapat mengeksplorasi data berstruktur kompleks dan banyak peubah, hasil lebih mudah untuk di interpretasikan, memudahkan eksplorasi data dan pengambilan keputusan (Lewis 2000). Komalasari (2007) menyatakan bahwa metode CART tidak didasarkan pada model probabilistik sehingga hal ini menjadi salah satu kelemahannya. Pada metode CART tidak ada tingkat probabilitas atau selang kepercayaan yang berhubungan dengan dugaan untuk pengelompokan data baru. Tingkat kepercayaan dan keakuratan hasil dari CART benar-benar hanya didasarkan pada keakuratan saat pembentukan pohon, seberapa baik hal ini telah dilakukan untuk menduga peubah respon seperti yang diinginkan. Tujuan Penelitian Tujuan dilakukannya penelitian ini adalah untuk mengidentifikasi karakteristik mahasiswa FEM dan FAPERTA sebagai indikator ketepatan waktu lulus dengan menggunakan pendekatan pohon klasifikasi CART.
METODE Data Data yang digunakan merupakan data wisudawan IPB berdasarkan tiga periode wisuda yaitu periode 2010/2011 terdiri dari 5 tahap wisuda, periode 2011/2012 terdiri dari 5 tahap wisuda, dan periode 2012/2013 terdiri dari 4 tahap wisuda. Penelitian ini menggunakan satu peubah respon (Y) yaitu ketepatan waktu lulus (1 = tepat waktu, 2 = tidak tepat waktu) dan delapan peubah penjelas (X) berdasarkan karakteristik mahasiswa yaitu Departemen, Minor, IPK, Jenis Kelamin, Asal Daerah, Asal Sekolah, Jalur Masuk, dan Beasiswa yang dapat dilihat pada Lampiran 1. Peubah Departemen, Minor, Jenis Kelamin, Asal Daerah, Asal Sekolah, Jalur Masuk, dan Beasiswa merupakan peubah kategorik, sedangkan peubah IPK merupakan peubah numerik. Data yang digunakan dalam penelitian ini adalah data sekunder dari Direktorat Administrasi dan Pendidikan (Dit-Ap) IPB. Peubah IPK yang tersedia hanya sampai semester 7, karena IPK yang tercatat saat mendaftar wisuda bukan saat seluruh nilai keluar. Jalur masuk yang diamati adalah USMI, SNMPTN, dan BUD, karena jalur masuk yang lain memiliki jumlah mahasiswa yang sedikit. Prosedur Analisis Data Tahapan-tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut: 1. Analisis deskriptif terhadap peubah penjelas dan peubah respon.
3 2. Membuat pohon klasifikasi dengan algoritma CART pada mahasiswa yang berasal dari FAPERTA dan FEM. Algoritma CART sebagai berikut : a. Pemilihan pemilah (Classifier) Setiap pemilah hanya bergantung pada nilai satu peubah penjelas (Breiman et al. 1993). Jika peubah penjelas kontinu 𝑋𝑗 dengan ruang sampel berukuran n, dan n amatan sampel yang berbeda maka terdapat n-1 pemilahan yang berbeda. Jika 𝑋𝑗 peubah penjelas kategori berskala nominal bertaraf L, maka akan diperoleh 2𝐿−1 -1 pemilah, sedangkan 𝑋𝑗 peubah penjelas kategori berskala ordinal, maka akan diperoleh L-1 pemilah yang mungkin dilakukan. Pemilah dipilih berdasarkan tingkat keheterogenan. Tingkat keheterogenan suatu kelas dari suatu simpul tertentu diukur dengan menggunakan nilai impuritasnya. Fungsi impuritas dapat diukur dengan menggunakan fungsi keheterogenan indeks Gini. i(t) = 1 - 𝑗 𝑝2 (𝑗|𝑡) i(t) adalah fungsi keheterogenan indeks Gini dan p(j|t) adalah peluang unit pengamatan dalam kelas ke–j dari simpul t 𝑝(𝑗 ,𝑡) p(j|t) = 𝑝(𝑡) dengan p(j,t) adalah nilai kelas ke–j pada suatu simpul t dan p(t) adalah kemungkinan kelas masuk pada simpul t p(j,t) = 𝜋𝑗 𝑁𝑗 (𝑡)/𝑁𝑗 p(t) = 𝑗 𝑝(𝑗, 𝑡) sehingga p(j|t) dinyatakan sebagai berikut : p(j|t) =
𝜋 𝑗 𝑁𝑗 (𝑡)/𝑁𝑗 𝑗
𝜋 𝑗 𝑁𝑗 (𝑡)/𝑁𝑗
sehingga
𝑗
𝑝 𝑗 𝑡 =1
dengan 𝜋𝑗 adalah peluang awal kelas ke-j, 𝑁𝑗 adalah banyaknya unit pengamatan dalam kelas ke-j, dan 𝑁𝑗 (𝑡) adalah banyaknya unit pengamatan dalam kelas ke-j pada simpul t. Ketika 𝜋𝑗 = 𝑁𝑗 /N maka didapatkan : 𝑁 (𝑡)
𝑗 p(j|t)= 𝑁(𝑡)
sehingga p(j|t) adalah relative proporsi dari kelas ke-j dalam simpul ke t. Nilai kebaikan pemilah ∅(𝑠, 𝑡) didefinisikan sebagai berikut : ∅(𝑠, 𝑡) = ∆𝑖 𝑠, 𝑡 = 𝑖(𝑡) − 𝑃𝐿 𝑖(𝑡𝐿 ) − 𝑃𝑅 𝑖(𝑡𝑅 ) dengan ∅(𝑠, 𝑡) adalah kriteria nilai kebaikan pemilah, 𝑃𝐿 𝑖(𝑡𝐿 ) adalah proporsi pengamatan dari simpul t menuju simpul kiri, dan 𝑃𝑅 𝑖(𝑡𝑅 ) adalah proporsi pengamatan dari simpul t menuju simpul kanan. Maka pemilah 𝑠 ∗ dengan nilai penurunan keheterogenan tertinggi yaitu : ∆𝑖 𝑠 ∗ , 𝑡1 = 𝑚𝑎𝑥𝑠∈𝑆 ∆𝑖 𝑠, 𝑡1 (1) Nilai penurunan keheterogenan dalam pohon diistilahkan sebagai improvement dalam software SPSS. Peubah penjelas dengan pemilah tertentu yang memiliki improvement tertinggi digunakan sebagai pemilah awal. b. Penentuan simpul terminal Suatu simpul t akan menjadi simpul terminal apabila pada simpul t tersebut sudah homogen dengan batasan n tertentu (Breiman et al. 1993).
4 c. Penandaan label kelas Label kelas dari simpul terminal ditentukan berdasarkan aturan jumlah terbanyak, yaitu : 𝑝 𝑗0 𝑡 = 𝑚𝑎𝑥𝑗 𝑝(𝑗|𝑡), maka label kelas untuk terminal t adalah 𝑗0 (Breiman et al. 1993). d. Penentuan Pohon Klasifikasi Optimum Ukuran pohon yang besar akan menyebabkan nilai kompleksitas yang tinggi karena struktur data yang digambarkan cenderung kompleks, sehingga perlu dilakukan penanganan untuk mendapatkan pohon optimum yang berukuran sederhana tetapi memberikan nilai kesalahan klasifikasi yang kecil (Breiman et al. 1993). Cara mendapatkan pohon optimum dengan teknik pemangkasan. Pemangkasan akan memangkas bagian pohon yang kurang penting. Tingkat kepentingan pohon diukur dengan biaya kompleksitas (cost complexity). Persamaannya adalah : 𝑅𝛼 (𝑇) = 𝑅 𝑇 + 𝛼|𝑇| dengan : 𝑅𝛼 (𝑇) = biaya kompleksitas (cost complexity) 𝑅 𝑇 = kesalahan klasifikasi pohon pada pohon bagian T = parameter biaya kompleksitas |𝑇| = himpunan simpul terminal pada T Pohon optimum 𝑇𝑘 yang terbentuk memiliki kriteria : 𝑅𝛼 (𝑇(𝛼)) = min 𝑅𝛼 (𝑇)
HASIL DAN PEMBAHASAN Gambaran Umum Data Data yang digunakan terdiri dari 853 mahasiswa dari FAPERTA dan 990 mahasiswa dari FEM. Gambar 1 menunjukkan pada FAPERTA sebanyak 88% mahasiswa lulus tidak tepat waktu dan 12% mahasiswa lulus tepat waktu. Pada FEM sebanyak 65% mahasiswa lulus tepat waktu dan 35% mahasiswa lulus tidak tepat waktu. FEM
FAPERTA tepat waktu 12%
tdk tepat waktu 35% tepat waktu 65%
tdk tepat waktu 88%
Gambar 1 Persentase ketepatan lulus mahasiswa di FAPERTA dan FEM Gambar 2 menunjukkan persentase kelulusan terbanyak FAPERTA yaitu mahasiswa yang berasal dari Departemen AGH sebesar 45.02% sedangkan persentase kelulusan paling sedikit yaitu mahasiswa yang berasal dari Departemen ARL sebesar 16.41%. Hal ini dipengaruhi oleh jumlah mahasiswa di Departemen
5 AGH terbanyak jika dibandingkan departemen lainnya di FAPERTA, sedangkan jumlah mahasiswa di Departemen ARL paling sedikit dibandingkan departemen lainnya di FAPERTA. Proporsi jumlah mahasiswa tiap departemen di FAPERTA dapat dilihat dari Tabel 1. Pada FEM persentase kelulusan terbanyak yaitu mahasiswa yang berasal dari Departemen MAN sebesar 29.29% sedangkan persentase kelulusan paling sedikit yaitu mahasiswa yang berasal dari Departemen ESL sebesar 18.08%. Berbeda dengan FAPERTA, pada FEM jumlah mahasiswa pada masing-masing departemen cenderung merata. Proporsi jumlah mahasiswa tiap departemen di FEM dapat dilihat dari Tabel 1. Banyaknya kelulusan mahasiswa berhubungan dengan banyaknya proporsi mahasiswa pada masing-masing departemen di FAPERTA dan FEM (Tabel 1). 45.02%
FAPERTA
FEM 26.87%
16.41%
AGH
ARL
19.93%
18.64%
MSL
PTN
29.29%
25.76% 18.08%
AGB
IE
ESL
MAN
Gambar 2 Persentase banyaknya kelulusan pada masing-masing departemen di FAPERTA dan FEM
Dari Tabel 1 dapat dilihat proporsi mahasiswa pada masing-masing Departemen di FAPERTA dan FEM. Pada FAPERTA proporsi mahasiswa terbesar yaitu berasal dari Departemen AGH sedangkan proporsi mahasiswa terkecil berasal dari Departemen ARL. Pada FEM proporsi mahasiswa tiap departemen cenderung merata dan departemen yang memiliki proporsi terkecil adalah ESL. Tabel 1 Proporsi mahasiswa FAPERTA dan FEM Fakultas FAPERTA
FEM
Departemen MSL AGH HPT ARL IE MAN AGB ESL
2007 0.20 0.45 0.18 0.17 0.24 0.25 0.28 0.23
2008 0.19 0.42 0.22 0.17 0.25 0.24 0.28 0.23
2009 0.20 0.44 0.18 0.18 0.25 0.26 0.26 0.23
2010 0.21 0.39 0.22 0.18 0.25 0.25 0.28 0.22
2011 0.20 0.41 0.22 0.17 0.23 0.27 0.26 0.24
2012 0.19 0.40 0.22 0.19 0.19 0.28 0.28 0.25
Gambar 3 menunjukkan bahwa mahasiswa dari Departemen AGH memiliki nilai ketepatan lulus tertinggi yaitu sebesar 17.19% pada FAPERTA, sedangkan pada FEM mahasiswa yang memiliki persentase tertinggi ketepatan lulus berasal dari Departemen IE sebesar 75.69%. Secara umum analisis deskriptif dari kedua fakultas tersebut mahasiswa yang mengambil minor memiliki ketepatan lulus
6 yang lebih tinggi jika dibandingkan dengan mahasiswa yang tidak mengambil minor. Hal ini dikarenakan mahasiswa yang memiliki minor cenderung menyelesaikan mata kuliah dan studi minor satu paket pada periode tertentu. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10%
FAPERTA
FEM
Minor
tepat waktu
JK
Tidak Menerima
Menerima
USMI
SNMPTN
BUD/Beasiswa
Swasta
Negeri
Luar Jabodetabek
Jabodetabek
Laki-laki
Perempuan
Tidak Ada
Ada
MAN
ESL
IE
AGB
PTN
MSL
ARL
AGH
0%
Daerah Sekolah Jalur masukBeasiswa
tidak tepat waktu
Gambar 3 Persentase ketepatan waktu lulus berdasarkan karakteristik mahasiswa
Mahasiswa berjenis kelamin perempuan memiliki persentase ketepatan lulus lebih tinggi jika dibandingkan dengan mahasiswa berjenis kelamin laki-laki. Mahasiswa yang berasal dari Jabodetabek dan SMA Negeri memiliki persentase ketepatan lulus lebih tinggi jika dibandingkan dengan mahasiswa yang berasal dari Luar Jabodetabek dan SMA Swasta. Mahasiswa yang menerima beasiswa memiliki persentase ketepatan lulus yang lebih tinggi jika dibandingkan dengan mahasiswa yang tidak menerima beasiswa. Mahasiswa yang menggunakan jalur masuk BUD/Beasiswa memiliki persentase ketepatan yang lebih tinggi jika dibandingkan dengan mahasiswa jalur masuk USMI dan SNMPTN. Mahasiswa melalui jalur masuk BUD/Beasiswa memiliki syarat harus menyelesaikan studi mata kuliah selama empat tahun jika melebihi batas tersebut dikenakan biaya yang telah ditentukan. Hal ini menjadi motivasi mahasiswa yang melalui jalur BUD/Beasiswa untuk lulus tepat waktu. Pohon Klasifikasi FAPERTA Pohon klasifikasi pada FAPERTA menghasilkan sembilan simpul yang terdiri dari lima simpul terminal, tiga simpul dalam, dan satu simpul induk. Peubah penjelas yang masuk ke dalam pohon klasifikasi yaitu Departemen, IPK,
7 Jenis Kelamin dan Jalur Masuk. Pemilah dengan nilai improvement tertinggi digunakan sebagai pemilah awal dalam pohon. Pemilah awal adalah peubah Departemen dengan nilai improvement sebesar 0.007 (Gambar 4). Hal ini menyatakan bahwa peubah tersebut merupakan peubah yang paling dominan dalam pembentukan pohon klasifikasi.
Gambar 4 Pohon Klasifikasi FAPERTA Pada pohon klasifikasi saat dipilah ke sebelah kiri dan kanan oleh sebuah pemilah yang berasal dari peubah penjelas akan menghasilkan nilai improvement. Improvement adalah kebaikan pemilah melalui nilai penurunan keheterogenan dalam pohon yang dihasilkan oleh persamaan (1). Mahasiswa yang bejumlah 853 pada simpul pertama (simpul 0) dipilah menjadi kelompok kiri dan kelompok kanan oleh peubah Departemen. Mahasiswa yang berasal dari Departemen AGH dan PTN sebanyak 543 mahasiswa mengelompok pada simpul 1 (kiri) sedangkan mahasiswa yang berasal dari Departemen MSL dan ARL sebanyak 310 mahasiswa mengelompok pada simpul 2 (kanan). Mahasiswa yang berasal dari Departemen AGH dan PTN sebanyak 543 mahasiswa pada simpul 1 dipilah menjadi kelompok kiri dan kanan oleh peubah
8 IPK. Mahasiswa yang memiliki IPK kurang dari atau sama dengan 3.335 sebanyak 424 mahasiswa mengelompok pada simpul 3 (kiri), sedangkan mahasiswa yang memiliki IPK lebih besar dari 3.335 sebanyak 119 mahasiswa mengelompok pada simpul 4 (kanan). Hasil yang diperoleh adalah simpul 3 dan 4 merupakan simpul terminal. Penurunan nilai keheterogenan menggunakan indeks Gini sebesar 0.003 ditunjukan oleh improvement pada Gambar 4. Ukuran pohon yang besar akan menyebabkan nilai kompleksitas yang tinggi karena struktur data yang digambarkan cenderung kompleks, sehingga perlu dilakukan pemangkasan untuk mendapatkan pohon optimum yang berukuran sederhana tetapi memberikan nilai validasi silang cukup kecil (Breiman et al. 1993). Pada pohon klasifikasi FAPERTA tidak dilakukan pemangkasan karena pohon yang terbentuk berukuran sederhana. Tabel 2 Simpul-simpul terminal pada setiap status ketepatan lulus FAPERTA Status Tepat n Simpul Karakteristik Kelulusan Waktu 424 3 AGH, PTN; IPK<=3.335 13.7% Tidak 123 5 MSL, ARL; Laki-laki 1.6% Tepat 129 7 MSL, ARL; Perempuan; USMI 3.9% Waktu MSL, ARL; Perempuan; SNMPTN, 58 8 8.6% BUD/Beasiswa Tepat 119 4 AGH, PTN; IPK>3.335 26.1% Waktu Kelima simpul terminal dari pohon klasifikasi FAPERTA terdapat pada simpul 3, 4, 5, 7, dan 8. Pada simpul 4 terjadi kenaikan persentase mahasiswa lulus tepat waktu sebesar 26.1% memiliki ciri-ciri yaitu berasal dari Departemen AGH dan PTN, dan memiliki IPK lebih besar dari 3.335. Pada simpul ke 5 memiliki persentase tepat waktu terendah yaitu sebesar 1.6% memiliki ciri-ciri yaitu mahasiswa yang berasal dari Departemen MSL dan ARL, dan berjenis kelamin laki-laki. Simpul-simpul terminal pada setiap status ketepatan lulus terdapat pada Tabel 2. Status kelulusan ditentukan dengan cut off 20% maka dikategorikan simpul tersebut tepat waktu karena data FAPERTA sebagian besar mahasiswa tidak lulus tepat waktu. Pohon Klasifikasi FAPERTA memiliki nilai ketepatan sebesar 81.47% (Tabel 3). Persentase untuk menduga mahasiswa lulus tidak tepat waktu secara benar yaitu sebesar 88.3% sedangkan untuk menduga lulus tepat waktu secara benar sebesar 30.7%. Tabel 3 Kesesuaian klasifikasi CART mahasiswa FAPERTA Prediksi % Obsevasi Kebenaran Tepat waktu Tidak tepat waktu Tepat waktu 31 70 30.7% Tidak tepat waktu 88 664 88.3% Persen total 13.95% 86.04% 81.47% Model pohon klasifikasi penelitian ini lebih baik dalam menduga mahasiswa yang lulus tidak tepat waktu jika dibandingkan dengan mahasiswa yang lulus tepat waktu. Nilai kesalahan positif sebesar 69.3% yaitu kesalahan
9 ketika observasi mengatakan lulus tepat waktu, namun diprediksi lulus tidak tepat waktu. Nilai kesalahan negatif sebesar 11.7% yaitu kesalahan ketika observasi mengatakan lulus tidak tepat waktu, namun diprediksi lulus tepat waktu. Pohon Klasifikasi FEM Pohon klasifikasi pada FEM menghasilkan sebelas simpul yang terdiri dari enam simpul terminal, empat simpul dalam, dan satu simpul induk. Peubah penjelas yang masuk ke dalam pohon klasifikasi yaitu Departemen, IPK, Jalur Masuk dan Minor. Pemilah awal adalah peubah Departemen dengan nilai improvement sebesar 0.023 (Gambar 5).
Gambar 5. Pohon Klasifikasi FEM Mahasiswa yang bejumlah 990 pada simpul pertama (simpul 0) dipilah menjadi kelompok kiri dan kelompok kanan oleh peubah Departemen. Mahasiswa yang berasal dari Departemen IE dan MAN sebanyak 545 mahasiswa mengelompok pada simpul 1 (kiri) sedangkan mahasiswa yang berasal dari
10 Departemen AGB dan ESL sebanyak 445 mahasiswa mengelompok pada simpul 2 (kanan). Simpul 1 merupakan simpul terminal. Mahasiswa yang berasal dari Departemen AGB dan ESL sebanyak 445 mahasiswa dipilah menjadi kelompok kiri dan kanan oleh peubah IPK. Mahasiswa yang memiliki IPK kurang dari atau sama dengan 3.325 sebanyak 203 mahasiswa mengelompok pada simpul 3 (kiri), dan mahasiswa yang memiliki IPK lebih besar dari 3.325 sebanyak 242 mahasiswa mengelompok pada simpul 4 (kanan). Penurunan nilai keheterogenan menggunakan indeks Gini sebesar 0.022 ditunjukan oleh nilai improvement pada Gambar 5. Sama halnya dengan pohon klasifikasi FAPERTA, pada pohon klasifikasi FEM tidak dilakukan pemangkasan karena pohon yang terbentuk sederhana. Keenam simpul terminal dari pohon klasifikasi FEM terdapat pada simpul 1, 5, 7, 8, 9 dan 10. Pada simpul pertama memiliki persentase tepat waktu tertinggi yaitu sebesar 75% memiliki ciri-ciri yaitu berasal dari Departemen IE dan MAN. Pada simpul kelima memiliki persentase tepat waktu terendah sebesar 22.4% memiliki ciri-ciri yaitu berasal dari Departemen AGB dan ESL, memiliki IPK kurang dari atau sama dengan 3.325, dan melalui Jalur Masuk SNMPTN. Simpul-simpul terminal pada setiap status ketepatan lulus terdapat pada Tabel 4. Status kelulusan ditentukan dengan cut off 50% maka dikategorikan simpul tersebut tepat waktu karena data FEM sebagian besar mahasiswa tepat waktu kecuali pada analisis deskriptif mahasiswa yang berasal dari Departemen ESL tidak tepat waktu dapat dilihat pada Gambar 3. Tabel 4 Simpul-simpul terminal pada setiap status ketepatan lulus FEM Status Tepat n Simpul Karakteristik Kelulusan Waktu AGB, ESL; IPK<=3.325; 67 5 22.4% Tidak Tepat SNMPTN Waktu ESL; IPK<=3.325; USMI, 80 10 36.2% BUD/Beasiswa 545 1 IE, MAN 75% AGB, ESL; IPK>3.325; Tidak Ada 65 7 55.4% Minor Tepat Waktu 177 8 AGB, ESL; IPK>3.325; Ada Minor 72.9% AGB; IPK<=3.325; USMI, 56 9 53.6% BUD/Beasiswa Ketepatan pohon klasifikasi FEM yang dihasilkan dengan metode CART yaitu sebesar 71.4% (Tabel 5). Persentase untuk menduga mahasiswa lulus tidak tepat waktu secara benar yaitu sebesar 30.1% sedangkan untuk menduga lulus tepat waktu secara benar sebesar 93.2%. Tabel 5 Kesesuaian klasifikasi CART mahasiswa FEM Prediksi % Obsevasi Kebenaran Tepat waktu Tidak tepat waktu Tepat waktu 604 44 93.2% Tidak tepat waktu 239 103 30.1% Persen total 85.2% 14.8% 71.4%
11 Model pohon klasifikasi FEM ini lebih baik dalam menduga mahasiswa yang lulus tepat waktu jika dibandingkan dengan mahasiswa yang lulus tidak tepat waktu. Nilai kesalahan positif sebesar 6.8% yaitu kesalahan ketika observasi mengatakan lulus tepat waktu namun diprediksi lulus tidak tepat waktu. Nilai kesalahan negatif sebesar 69.9% yaitu kesalahan ketika observasi mengatakan lulus tidak tepat waktu namun diprediksi lulus tepat waktu. Perbandingan Antara FEM dan FAPERTA Persamaan pohon klasifikasi antara FEM dan FAPERTA adalah peubah Departemen sama-sama muncul sebagai pemilah awal. Hal ini menunjukkan departemen memiliki karakteristik yang berbeda dalam satu fakultas. Selain itu pohon klasifikasi dari kedua fakultas yang terbentuk cukup sederhana sehingga tidak perlu dilakukan pemangkasan. Perbedaan pohon klasifikasi antara FEM dan FAPERTA adalah peubah yang masuk pada pohon klasifikasi FAPERTA yaitu Departemen, IPK, Jenis Kelamin dan Jalur Masuk sedangkan pada pohon klasifikasi FEM yaitu Departemen, IPK, Jalur Masuk dan Minor. Pada pohon klasifikasi FAPERTA saat penyekatan awal oleh peubah Departemen keduanya baik pemilah kiri maupun kanan memiliki cabang. Pada pohon klasifikasi FEM pemilah kiri tidak memiliki cabang dan menjadi simpul terminal. Hal ini dapat diartikan bahwa simpul ini tidak dipengaruhi oleh peubah lain selain departemen sehingga bersifat homogen. Mahasiswa yang berasal dari FEM cenderung tepat waktu karena saat penelitian sebagian besar mahasiswa menggunakan data sekunder. Mahasiswa yang berasal dari Departemen ESL dalam penelitiannya menggunakan data penelitian lapang sehingga lebih banyak mahasiswa yang lulus tidak tepat waktu. Mahasiswa yang berasal dari FAPERTA cenderung tidak tepat waktu karena dari keseluruhan departemen saat penelitian menggunakan data primer melalui pengamatan lapangan secara langsung, mengamati makhluk hidup seperti tanaman atau hewan, cuaca serta iklim (IPB 2009). Oleh karena itu, mahasiswa yang berasal dari FAPERTA membutuhkan waktu yang lebih lama dalam menyelesaikan studinya. Pohon klasifikasi FAPERTA persentase ketepatan lulus tertinggi hanya sebesar 26.1%. Departemen IE pada FEM memiliki persentase ketepatan waktu lulus tertinggi karena berdasarkan informasi terjadi pergeseran mata kuliah Metodologi Penelitian dari semester 7 ke semester 6 (IPB 2011). Mata kuliah ini merupakan mata kuliah dasar bagi penelitian akhir mahasiswa. Hal tersebut menjadi acuan pada saat semester 7, mahasiswa dapat memulai penelitian pada semester 8 mahasiswa hanya fokus pada penelitian akhir tanpa kegiatan kuliah dalam kelas. Keseluruhan Departemen dari FEM pada semester 8 hanya fokus pada penelitian akhir yaitu seminar dan skripsi (IPB 2009).
12
KESIMPULAN Simpulan Pada pohon klasifikasi FAPERTA persentase tepat waktu tertinggi sebesar 26.1% yang memiliki ciri-ciri yaitu mahasiswa berasal dari Departemen AGH dan PTN, dan memiliki IPK lebih besar dari 3.335. Adapun persentase tepat waktu terendah sebesar 1.6% yang memiliki ciri-ciri yaitu mahasiswa berasal dari Departemen MSL dan ARL, dan berjenis kelamin Laki-laki. Nilai ketepatan pohon klasifikasi FAPERTA sebesar 88.2%. Pada pohon klasifikasi FEM persentase tepat waktu tertinggi sebesar 75% memiliki ciri-ciri yaitu mahasiswa berasal dari Departemen IE dan MAN. Adapun persentase tepat waktu terendah sebesar 22.4% yang memiliki ciri-ciri yaitu mahasiswa berasal dari Departemen AGB dan ESL, memiliki IPK kurang dari sama dengan 3.325, dan melalui Jalur Masuk SNMPTN. Nilai ketepatan pohon klasifikasi FEM sebesar 71.4%. Model pohon klasifikasi FEM lebih baik dalam menduga mahasiswa lulus tepat waktu sedangkan model pohon klasifikasi FAPERTA lebih baik dalam menduga mahasiswa lulus tidak tepat waktu. Persentase ketepatan pohon klasifikasi FEM untuk menduga mahasiswa lulus tepat waktu lebih besar daripada menduga mahasiswa lulus tidak tepat waktu, sedangkan persentase ketepatan pohon klasifikasi FAPERTA untuk menduga mahasiswa lulus tidak tepat waktu lebih besar daripada menduga mahasiswa lulus tepat waktu.
DAFTAR PUSTAKA Breiman L, Friedman JH, Olshen RA, Stone CJ. 1993. Classification and Regression Trees. New York: Champman and Hall. Budi M. 2010. Perbandingan Algoritme Pruning pada Decision Tree yang Dikembangkan dengan Algoritme CART. JIIK (2) [Internet]. [diunduh 2013 September 8]; 15(2): 7-13. Tersedia pada : http://repository.ipb.ac.id/ [DIT-AP] Direktorat Administrasi dan Pendidikan. 2013. Data Calon Wisuda Periode 2010 sampai dengan 2013. Bogor(ID): IPB. [IPB] Institut Pertanian Bogor. 2009. Panduan Program Pendidikan Sarjana Edisi Tahun 2009. Bogor (ID): IPB Pr. [IPB] Institut Pertanian Bogor. 2011. Panduan Program Pendidikan Sarjana Edisi Tahun 2011. Bogor (ID): IPB Pr. [IPB] Institut Pertanian Bogor. TPB Dalam Angka [Internet]. [diunduh 2013 Sept 24]. Tersedia pada: http://tpb.ipb.ac.id Komalasari WB. 2007. Metode Pohon Regresi untuk Eksploratori Data dengan Peubah yang Banyak dan Kompleks [Internet]. [diunduh 2013 Sept 8]. 16(1):967-980: Jakarta(ID). Tersedia pada : http://digilib.litbang.deptan.go.id/ Kurniawan T, Anauddin, Wagiono YK. 2002. Penerapan Metode Pemangkasan dalam CART (Classification and Regression Tree) [Internet]. [diunduh 2013 Sept 8]. 7(2):19-25: Bogor(ID). Tersedia pada : http://repository.ipb.ac.id/
13 Lewis RJ. 2000. An Introduction to Classification and Regression Trees (CART) Analysis [Internet]. [diunduh 2013 Sept 10]. California (US).. Tersedia pada: http://citeseerx.ist.psu.edu Pertiwi RA. 2013. Analisis CHAID untuk Identifikasi Ketepatan Waktu Lulus Berdasarkan Karakteristik Mahasiswa [skripsi]. Bogor (ID): Institut Pertanian Bogor.
14 Lampiran 1 Daftar peubah yang digunakan beserta kategorinya Peubah Y
Definisi Ketepatan Waktu Lulus
X1
Fakultas/ Departemen
X2
Minor
X3
IPK
X4
Jenis Kelamin
X5
Asal Daerah
X6
Asal Sekolah
X7
Jalur Masuk
X8
Beasiswa
FAPERTA 1 : Tepat waktu 2 : Tidak tepat waktu 1 : Manajemen Sumberdaya Lahan (MSL) 2 : Agronomi dan Holtikultura (AGH) 3 : Proteksi Tanaman (PTN) 4 : Arsitektur Lanskap (ARL)
FEM 1 : Tepat waktu 2 : Tidak tepat waktu 1 : Ekonomi dan Studi Pembangunan (IE) 2 : Manajemen (MAN) 3 : Agribisnis (AGB) 4 : Ekonomi Sumberdaya dan Lingkungan (ESL)
0 : Tidak ada minor 1 : Ada minor Numerik 1 : Laki-laki 2 : Perempuan 1 : Jabodetabek 2 : Luar jabodetabek 1 : SMA Negeri 2 : SMA Swasta 1 : SNMPTN 2 : USMI 3 : BUD/Beasiswa 1 : Menerima beasiswa 2 : Tidak menerima beasiswa
0 : Tidak ada minor 1 : Ada minor Numerik 1 : Laki-laki 2 : Perempuan 1 : Jabodetabek 2 : Luar jabodetabek 1 : SMA Negeri 2 : SMA Swasta 1 : SNMPTN 2 : USMI 3 : BUD/Beasiswa 1 : Menerima beasiswa 2 : Tidak menerima beasiswa
15 Lampiran 2 Ringkasan diagram pohon klasifikasi mahasiswa FAPERTA
Klasifikasi
Ciri-ciri Klasifikasi
Simpul
Tepat Waktu
1 2 3
AGH, PTN; IPK<=3.335 AGH, PTN; IPK>3.335 MSL, ARL; Laki-laki MSL, ARL; Perempuan; USMI MSL, ARL; Perempuan; SNMPTN, BUD/Beasiswa
3 4 5
13.7% 26.1% 1.6%
Tidak Tepat Waktu 86.3% 73.9% 98.6%
7
3.9%
96.1%
8
8.6%
91.4%
4 5
16 Lampiran 3 Ringkasan diagram pohon klasifikasi mahasiswa FEM
Klasifikasi
Ciri-ciri Klasifikasi
Simpul
Tepat Waktu
1
IE, MAN AGB, ESL; IPK<=3.325; SNMPTN AGB, ESL; IPK>3.325; Tidak ada minor AGB, ESL; IPK>3.325; Ada minor AGB; IPK<=3.325; USMI, BUD/Beasiswa ESL; IPK<=3.325; USMI, BUD/Beasiswa
1
75%
Tidak Tepat Waktu 25%
5
22.4%
77.6%
7
55.4%
44.6%
8
72.9%
27.1%
9
53.6%
46.4%
10
36.2%
63.8%
2 3 4 5 6
17
RIWAYAT HIDUP Penulis bernama Fira Nurahmah Al Amin, lahir di Bogor pada tanggal 19 Juli 1991, anak dari pasangan Amin Syarifuddin dan Bd. Nuraida Am. Keb. Penulis merupakan putri pertama dari tiga bersaudara. Penulis menempuh pendidikan sekolah dasar di SD Negeri Polisi I Bogor dan lulus pada tahun 2003. Selanjutnya, penulis melanjutkan studinya di SMP Negeri 7 Bogor dan lulus pada tahun 2006. Pada tahun 2009, penulis lulus dari Sekolah Menengah Atas di SMA Negeri 6 Bogor dan sekarang sedang menempuh studinya di jurusan Statistika IPB dengan minor Ilmu Konsumen. Selama kuliah di IPB, penulis pernah aktif di UKM Music Agriculture X-Pression (MAX!!) IPB, pengurus Himpunan Keprofesian Gamma Sigma Beta selama 2 periode menjabat sebagai staf Human Resource Development di tahun 2011 dan staf Data Analyze di tahun 2012, aktif dalam Organisasi ekstra kampus Persatuan Mahasiswa Kota Bogor (PMKB) dan sekarang aktif sebagai pengajar mata pelajaran Matematika di Bimbingan Konsultasi Belajar Nurul Fikri. Penulis pernah melakukan praktik lapang di Pusat Data dan Informasi Pertanian Kementrian Pertanian Republik Indonesia pada bulan Februari dan Maret 2013.