PREDIKSI INDEKS PRESTASI KUMULATIF MAHASISWA ILMU KOMPUTER IPB MENGGUNAKAN ALGORITMA VFI5
ABDUL NASRAH G64103012
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007
PREDIKSI INDEKS PRESTASI KUMULATIF MAHASISWA ILMU KOMPUTER IPB MENGGUNAKAN ALGORITMA VFI5
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Oleh : ABDUL NASRAH G64103012
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007
ABSTRACT ABDUL NASRAH. Grade Point Average Prediction of Computer Science IPB Students with VFI5 Algorithm. Counseled by AZIZ KUSTIYO and IRMAN HERMADI. First year evaluation point cannot show end year evaluation point that generate value, namely Grade Point Average (GPA), because GPA is a cumulative grade that take from first year evaluation point up to end year evaluation value. In this research, we want to know GPA without seeing GPA in every year, just look grade from the first year evaluation point and some courses feature that we can say GPA Prediction. In this research, we use VFI5 algorithm for GPA prediction. VFI5 algorithm have two processes, training process and prediction process. The training process output can describe feature character and relation between features that are courses feature and GPA relation.This research aims to analyze and looks for TPB courses that influence to GPA of Computer Science students, analyze with describing distributing point for each GPA classes, and predict GPA classes based on TPB courses. Training description is very important thing in this research. Training description can explain distributing points of courses grade. Distributing points is important thing for everyone, students and teachers. Students can see courses that influence to their GPA, otherwise teacher can look for the most succesful courses for their students. On General Sociology course, this research show that it is very difficult to get A grade. On File System and Mathematic Discret courses, with 2.00≤GPA <2.50 class always have vote for A grade, and little possibility to get D grade. The highest accuration rate of 2001/2002 generation is found from combination between Fisika II, Calculus, and GPA of TPB features. Accuration rate that is resulted by VFI5 Algorithm on prediction process with the features is 70.61%. In otherwise that case is not same with 2002/2003 generation, because accuration rate that resulted is 60.03%. The similiarity between 2001/2002 and 2002/2003 generations is highest accuration rate for each features test showed from Fisika II feature. Accuration rate of fisika II feature on 2001/2002 generation is 65.35%, otherwise on 2002/2003 generation is 65.39%. Keywords : Feature, Grade Point, Grade Point Average, VFI5 Algorithm, Training Description, Accuration
: Prediksi Indeks Prestasi Kumulatif Mahasiswa Ilmu Komputer IPB Menggunakan Algoritma VFI5 Nama : Abdul Nasrah NRP : G64103012 Judul
Menyetujui:
Pembimbing I
Pembimbing II
Aziz Kustiyo, S.Si., M.Kom. NIP 132206241
Irman Hermadi, S.Kom., MS NIP 132321422
Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Prof. Dr. Ir. Yonny Koesmaryono, MS NIP. 131473999
Tanggal Lulus :
RIWAYAT HIDUP Penulis dilahirkan di Panyabungan hari Rabu tanggal 18 Mei 1984. Penulis adalah anak pertama dari empat bersaudara dari pasangan Asran dan Nurhelmi. Pada tahun 2000 penulis melanjutkan sekolah di SMU Negeri 3 Plus Sipirok hingga tahun 2003. Pada tahun yang sama penulis diterima sebagai mahasiswa S1 Ilmu Komputer Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui jalur USMI. Pada tahun 2006, penulis melaksanakan kegiatan Praktik Kerja Lapangan di PT Transformasi Televisi Indonesia. Selama mengikuti perkuliahan, penulis pernah aktif di Himpunan Mahasiswa Ilmu Komputer (HIMALKOM) tahun kepengurusan 2004/2005.
PRAKATA Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala curahan rahmat dan karunia-Nya sehingga skripsi dengan judul Prediksi Indeks Prestasi Kumulatif Mahasiswa Ilmu Komputer IPB Menggunakan Algoritma VFI5 ini, dapat diselesaikan. Dalam menyelesaikan karya tulis ini penulis mendapatkan banyak sekali bantuan, bimbingan dan dorongan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada semua pihak yang telah membantu kelancaran penelitian ini, antara lain kepada: 1 Orangtua tercinta, Ayahanda Asran dan Ibunda Nurhelmi atas segala do’a , kasih sayang, dan dukungan baik dari moril maupun materiil yang telah diberikan selama ini. 2 My sweety bubby, Ema Rahayu yang tak bosan memberikan semangat, do’a dan motivasi sampai penelitian ini selesai dilakukan. 3 Bapak Aziz Kustiyo, S.Si., M.Kom. selaku pembimbing pertama atas bimbingan dan arahannya selama penyusunan karya tulis ini. 4 Bapak Irman Hermadi, S.Kom., M.S selaku pembimbing kedua atas bimbingan dan arahannya selama penyusunan karya tulis ini. 5 Bapak Toto Haryanto, S.Kom. yang telah bersedia menjadi penguji. 6 Yahman Faoji atas saran dan bantuannya pada penyusunan kata pengantar dalam Bahasa Inggris. 7 Anak-anak kosan B’boyz, Mulyadi, Vicky, Cunning, Komang, Iqbal, Ryan, Inang, Dona, Goffar, Pandi dan Nugie yang sudah memberikan semangat dan dukungan selama penelitian ini dilakukuan. 8 Anak-anak kosan Cinta, Pisardo, Jemi, Dhiku, Rizal, Nono dan Firat yang sudah memberikan semangat dan dukungan selama penelitian ini dilakukuan. 9 Galan Saputra Aji, Faiq Al-Syawaf, dan Yogi Purno Yudho atas kejasamanya sebagai pembahas. 10 Anak-anak cewek, Irena, Amelia, Vita, Yulia, Yustin dan Thessi yang sudah memberikan semangat dan dukungan selama penelitian ini dilakukuan. 11 Dani Nugraha R, Gemma Ramdhani, Regi Hardelina, Atik Pawestri Sulistiyo, Aristi Imka Apniasari, dan Hida Nur Firqiani selaku teman perjuangan satu bimbingan. 12 Yayan Rukmayana atas saran dan bantuannya dalam pengerjaan tugas akhir. 13 Teman - teman ilkom 40 atas kebersamaannya dari awal kuliah sampai sekarang. Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis sampaikan terima kasih banyak. Semoga penelitian ini dapat memberi manfaat.
Bogor, Agustus 2007
Abdul Nasrah
vii
DAFTAR ISI Halaman DAFTAR TABEL ....................................................................................................................viii DAFTAR GAMBAR ................................................................................................................viii DAFTAR LAMPIRAN .............................................................................................................viii PENDAHULUAN Latar Belakang ....................................................................................................................... 1 Tujuan.................................................................................................................................... 1 Ruang Lingkup....................................................................................................................... 1 Manfaat.................................................................................................................................. 1 TINJAUAN PUSTAKA Klasifikasi .............................................................................................................................. 1 K-fold Cross Validation .......................................................................................................... 2 Mata Kuliah TPB ................................................................................................................... 2 Indeks Prestasi ....................................................................................................................... 2 Satuan Kredit Semester........................................................................................................... 2 Algoritma Voting Feature Intervals (VFI5) ............................................................................. 2 METODE PENELITIAN Data ....................................................................................................................................... 5 Praproses................................................................................................................................ 5 Data Latih dan Data Uji .......................................................................................................... 5 Algoritma VFI5...................................................................................................................... 5 Pelatihan ................................................................................................................................ 6 Seleksi Fitur ........................................................................................................................... 6 Klasifikasi .............................................................................................................................. 6 Akurasi .................................................................................................................................. 6 Lingkungan Pengembangan .................................................................................................... 6 HASIL DAN PEMBAHASAN Pelatihan (deskripsi training) .................................................................................................. 6 Pengujian ............................................................................................................................. 10 KESIMPULAN DAN SARAN Kesimpulan .......................................................................................................................... 13 Saran.................................................................................................................................... 14 DAFTAR PUSTAKA ................................................................................................................ 14 LAMPIRAN .............................................................................................................................. 15
viii
DAFTAR TABEL Halaman 1 Pembagian kelas menurut selang IPK kelulusan......................................................................... 5 2 Sebaran nilai MK pada tingkat TPB angkatan 2001/2002........................................................... 7 3 Sebaran nilai MK pada tingkat 2 angkatan 2001/2002................................................................ 8 4 Sebaran nilai MK pada tingkat TPB angkatan 2002/2003........................................................... 9 5 Sebaran nilai MK pada tingkat 2 angkatan 2002/2003................................................................ 9 6 Bobot untuk setiap mata kuliah TPB........................................................................................ 10 7 Akurasi fitur lengkap untuk angkatan 2001/2002 ..................................................................... 11 8 Akurasi fitur seleksi tahap pertama untuk angkatan 2001/2002 ................................................ 12 9 Akurasi fitur seleksi MK kombinasi untuk angkatan 2001/2002 ............................................... 12 10 Akurasi fitur lengkap untuk angkatan 2002/2003 ................................................................... 12 11 Akurasi fitur seleksi tahap pertama untuk angkatan 2002/2003............................................... 13 12 Akurasi fitur seleksi MK kombinasi untuk angkatan 2002/2003 ............................................. 13
DAFTAR GAMBAR Halaman 1 Algoritma pelatihan (training) VFI5. ......................................................................................... 4 2 Algoritma prediksi (klasifikasi) VFI5. ....................................................................................... 4 3 Tahapan proses klasifikasi data. ................................................................................................ 5
DAFTAR LAMPIRAN Halaman 1 Daftar mata kuliah wajib masa program TPB........................................................................... 16 2 Daftar mata kuliah pilihan Program Studi masa program TPB.................................................. 17 3 Sebaran nilai mata kuliah tingkat TPB angkatan 2001/2002 ..................................................... 18 4 Sebaran nilai mata kuliah tingkat 2 angkatan 2001/2002 .......................................................... 19 5 Sebaran nilai mata kuliah tingkat TPB angkatan 2002/2003 ..................................................... 20 6 Sebaran nilai mata kuliah tingkat 2 angkatan 2002/2003 .......................................................... 21 7 Akurasi fitur seleksi kombinasi awal untuk angkatan 2001/2002 .............................................. 22
1
PENDAHULUAN Latar Belakang Setiap mahasiswa baru Institut Pertanian Bogor (IPB) diwajibkan mengikuti program pendidikan dasar yang mempelajari pengetahuan dasar umum dan dasar keahlian selama dua semester pada Tingkat Persiapan Bersama (TPB). Program TPB bertujuan memberikan landasan pengetahuan dasar kepada mahasiswa agar dapat mengikuti pendidikan tahap selanjutnya di fakultasfakultas yang ada di IPB. Program ini juga memperkenalkan wawasan lingkungan hidup dan pertanian berkelanjutan secara umum, serta membekali pengetahuan untuk menilai dengan pertimbangan sosial-ekonomi dan budaya dalam setiap tindakan yang dilakukan (IPB Press 2003). Mata kuliah yang diselenggarakan TPB terdiri atas mata kuliah wajib dan mata kuliah pilihan program studi. Mata kuliah wajib yaitu mata kuliah yang harus diikuti oleh seluruh mahasiswa IPB dengan jumlah sebanyak 12 satuan kredit semester (SKS), sedangkan mata kuliah pilihan program studi berjumlah 19 mata kuliah yaitu mata kuliah yang sesuai dengan program studi yang diminatinya (IPB Press 2003). Oleh karena itu setiap mahasiswa pada suatu Program Studi tertentu dalam kasus ini Ilmu Komputer akan mendapatkan mata kuliah yang sama dan SKS yang sama pada masa TPB. Penilaian akhir tahun pertama (evaluasi awal) dilaksanakan oleh program TPB, penilaian status studi mahasiswa selanjutnya akan dilakukan sepenuhnya oleh fakultas masing-masing (IPB Press 2003). Penilaian akhir tahun pertama saja tidak dapat menentukan penilaian akhir program studi yang menghasilkan nilai yang disebut dengan nilai Indeks Prestasi Kumulatif (IPK), karena IPK adalah nilai kumulatif yang diperoleh dari hasil penilaian akhir tahun pertama sampai penilaian akhir program studi. Pada penelitian ini yang ingin diketahui justru nilai IPK dengan hanya menggunakan penilaian akhir tahun pertama yang menghasilkan IP TPB dan beberapa fitur mata kuliah yang disebut dengan prediksi IPK tanpa memperhatikan penilaian setiap akhir tahun. Pada penelitian ini algoritma yang digunakan untuk memprediksi IPK adalah Algoritma VFI5. Algoritma VFI5 memiliki dua proses yaitu pelatihan dan pengujian (klasifikasi). Hasil dari pelatihan Algoritma
VFI5 dapat mendeskripsikan prilaku fitur dan kaitan antara fitur-fitur dalam hal ini MK dengan IPK. Tujuan Tujuan dari penelitian ini adalah : 1 Menganalisis dan mencari mata kuliah TPB yang berpengaruh pada IPK kelulusan mahasiswa jurusan Ilmu Komputer. 2 Menganalisis dengan cara mendeskripsikan sebaran-sebaran nilai untuk setiap kelas IPK yang telah ditentukan. 3 Memprediksi kelas IPK atau selang kelulusan berdasarkan mata kuliah TPB. Ruang Lingkup Ruang lingkup penelitian sebagai berikut :
ini adalah
1 Data yang digunakan untuk penelitian ini adalah data nilai mahasiswa Ilmu Komputer angkatan 2001/2002 dan 2002/2003. 2 Pada Algoritma VFI5, yang digunakan sebagai bobot untuk suatu fitur mata kuliah adalah SKS dari mata kuliah yang bersangkutan. Manfaat Penelitian ini diharapkan dapat menghasilkan informasi sebagai berikut : 1 Menunjukkan mata kuliah yang memiliki keunikan untuk setiap kelas IPK. 2 Menunjukkan mata kuliah yang berpeluang paling tinggi mendapatkan nilai rendah dan tinggi untuk setiap tahunnya. 3 Mengetahui IPK kelulusan dengan menggunakan fitur yang sudah terseleksi.
TINJAUAN PUSTAKA Klasifikasi Klasifikasi merupakan proses menemukan sekumpulan model (atau fungsi) yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001). Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan, dibentuk sebuah model yang ada. Penentuan model tersebut berdasarkan
2
analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance (kasus) baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Güvenir et al. 1998). K-fold Cross Validation Validasi silang dan bootstrapping merupakan metode dalam memperkirakan generalisasi error berdasarkan "resampling" (Weiss & Kulikowski 1991 diacu dalam Sarle 2004). Metode k-fold cross validation membagi sebuah himpunan contoh secara acak menjadi k himpunan bagian (subset) yang saling bebas. Dilakukan ulangan sebanyak k- kali untuk pelatihan dan pengujian. Pada setiap ulangan, disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan (Stone 1974 diacu dalam Fu 1994). Pada metode ini, data awal dibagi menjadi k subset atau “fold” yang saling bebas secara acak, yaitu S1,S2, ...,Sk, dengan ukuran setiap subset kira-kira sama. Pelatihan dan pengujian dilakukan sebanyak k kali. Pada iterasi ke i, subset Si diperlakukan sebagai data pengujian, dan subset lainnya diperlakukan sebagai data pelatihan. Jadi, pada iterasi pertama S2, ...,Sn menjadi data pelatihan dan S1 menjadi data pengujian. Pada iterasi kedua S1,S3, ...,Sn menjadi data pelatihan dan S2 menjadi data pengujian, dan seterusnya. K-fold cross validation merupakan metode dalam memperkirakan generalisasi error berdasarkan “resampling” (Weiss & Kullilkowski 1991; Efron & Tibshirani 1993; Hjorth 1994; Plutowski et al. 1994; Shao & Tu 1995 diacu dalam Sarle 2004). Mata Kuliah TPB Mata kuliah (MK) yang diselenggarakan Tahap Persiapan Bersama (TPB) terdiri atas mata kuliah wajib dan mata kuliah pilihan program studi. Mata kuliah wajib yaitu mata kuliah yang harus diikuti oleh seluruh mahasiswa IPB dengan jumlah sebanyak 12 satuan kredit semester (SKS), sedangkan mata kuliah pilihan program studi berjumlah 19 mata kuliah yaitu mata kuliah yang sesuai dengan program studi yang diminatinya (IPB Press 2003). Daftar mata kuliah wajib dapat dilihat pada Lampiran 1, sedangkan daftar mata kuliah pilihan program studi dapat dilihat pada Lampiran 2.
Indeks Prestasi IP adalah singkatan dari Indeks Prestasi yang merupakan suatu nilai akhir yang diperoleh mahasiswa setelah menyelesaikan studinya pada satu semester. Penilaian keberhasilan studi semester dilakukan pada tiap akhir semester. Penilaian ini meliputi semua mata kuliah yang direncanakan oleh mahasiswa dalam KRS yang sah pada semester tersebut, dengan menggunakan rumus IP sebagai berikut : n
IP =
∑
Nj .kj
j =1
.
n
∑ kj j =1
Keterangan IP = Indeks Prestasi Nj = Nilai mata kuliah j n = Mata kuliah kj = Bobot SKS mata kuliah
IP yang diperoleh mahasiswa pada semester bersangkutan digunakan dalam menentukan beban studi yang boleh diambil pada semester berikutnya. Satuan Kredit Semester Satuan Kredit Semester disingkat SKS adalah ukuran yang digunakan untuk menyatakan : 1 Besarnya beban studi mahasiswa. 2 Ukuran keberhasilan usaha kumulatif bagi suatu program tertentu. 3 Ukuran untuk beban penyelenggaraan pendidikan, khususnya bagi dosen (IPB Press 2003). Algoritma Voting Feature Intervals (VFI5) Algoritma klasifikasi Voting Feature Intervals (VFI5) merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilainilai feature atau atribut (Demiröz et al. 1997 diacu dalam Güvenir & Emeksiz 2000, Güvenir et al. 1998). Pengklasifikasian instance baru berdasarkan voting pada klasifikasi yang dibuat oleh nilai tiap-tiap feature secara terpisah. VFI5 merupakan algoritma klasifikasi yang bersifat non-incremental dimana semua instance pelatihan diproses secara bersamaan (Güvenir & Sirin 1996 diacu dalam Güvenir & Emeksiz 2000). Dari instance-instance pelatihan tersebut, Algoritma VFI5 membuat interval untuk setiap feature. Interval-interval yang dibuat dapat berupa range interval atau point
3
interval. Point interval terdiri atas seluruh end point secara berturut-turut. Range interval terdiri atas nilai-nilai antara dua end point yang berdekatan namun tidak termasuk kedua end point tersebut. Untuk setiap interval, vote setiap kelas pada interval tersebut disimpan. Dengan demikian, sebuah interval dapat merepresentasikan beberapa kelas dengan menyimpan vote setiap kelas, sehingga Algoritma VFI dapat dikatakan sebagai MultiClass feature projection based algorithms. Keunggulan Algoritma VFI5 adalah algoritma ini cukup kokoh (robust) terhadap feature yang tidak relevan namun mampu memberikan hasil yang baik pada real-world datasets yang ada. VFI5 mampu menghilangkan pengaruh yang kurang menguntungkan dari feature yang tidak relevan dengan mekanisme voting-nya (Güvenir 1998). Algoritma klasifikasi VFI5 mampu melakukan klasifikasi lebih cepat dibandingkan dengan Algoritma nearest neighbor dan decision tree (Demiröz 1997). VFI5 mampu menangani nilai feature yang tidak diketahui (hilang) dengan cara mengabaikan nilai feature tersebut yang ada pada data pelatihan dan data pengujian. Namun pada Algoritma nearest neighbor dan decision tree, nilai tersebut harus diganti (Quinlan 1993 diacu dalam Demiröz 1997). Mengabaikan feature yang tidak diketahui merupakan pendekatan yang alami dan masuk akal (Demiröz 1997). Algoritma VFI5 terdiri atas dua tahap, yaitu pelatihan dan klasifikasi. 1 Pelatihan Langkah pertama pada tahap pelatihan adalah menemukan end point setiap feature f dari setiap kelas c. End point untuk feature linear, yaitu feature yang nilainya memiliki urutan atau bisa dibandingkan tingkatannya, merupakan nilai minimum dan nilai maksimum feature tersebut. End point untuk feature nominal, yaitu feature yang nilainya tidak memiliki urutan dan tidak bisa dibandingkan tingkatannya, merupakan semua nilai yang berbeda yang ada pada feature kelas yang sedang diamati. Sebelum dibentuk interval, seluruh end point yang diperoleh untuk setiap feature linear diurutkan. Jika suatu feature merupakan feature linear maka akan dibentuk dua interval yaitu point interval dan range interval. Jika
feature tersebut merupakan feature nominal maka hanya dibentuk point interval. Batas bawah pada range interval (ujung paling kiri) adalah -∞ sedangkan batas atas range interval (ujung paling kanan) adalah +∞. Jumlah maksimum end point pada feature linear adalah 2k sedangkan jumlah maksimum intervalnya adalah 4k+1, dengan k adalah jumlah kelas yang diamati. Setelah itu, jumlah instance pelatihan setiap kelas c dengan feature f untuk setiap interval i dihitung dan direpresentasikan sebagai interval_class_count[f,i,c]. Untuk setiap instance pelatihan, dicari interval i, yaitu interval nilai feature f dari instance pelatihan e (ef) tersebut berada. Jika interval i merupakan point interval dan ef sama dengan batas bawah interval tersebut (sama dengan batas atas untuk point interval), jumlah kelas instance tersebut (ef) pada interval i ditambah 1. Jika interval i merupakan range interval dan ef jatuh pada interval tersebut maka jumlah kelas instance ef pada interval i ditambah 1. Hasil proses ini merupakan vote kelas c pada interval i. Untuk menghilangkan efek perbedaan distribusi setiap kelas, vote kelas c untuk feature f pada interval i dinormalisasi dengan cara membagi vote tersebut dengan jumlah instance kelas c yang direpresentasikan dengan class_count[c]. Hasil normalisasi ini dinotasikan sebagai interval_class_vote[f,i,c]. Kemudian nilainilai interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote beberapa kelas pada setiap feature sama dengan 1. Normalisasi ini bertujuan agar setiap feature memiliki kekuatan voting yang sama pada proses klasifikasi yang tidak dipengaruhi oleh ukurannya. 2 Prediksi (klasifikasi) Proses klasifikasi diawali dengan inisialisasi vote setiap kelas dengan nilai nol. Untuk setiap feature f, dicari interval i dimana nilai ef jatuh, dengan ef merupakan nilai feature f dari instance tes e. Jika ef tidak diketahui (hilang), feature tersebut tidak diikutsertakan dalam voting (memberikan vote nol untuk setiap kelas). Oleh karena itu, feature yang memiliki nilai tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan. Interval tersebut dapat menyimpan instance pelatihan dari beberapa
4
kelas. Kelas-kelas dalam sebuah interval direpresentasikan oleh vote kelas-kelas tersebut pada interval itu. Untuk setiap kelas c, feature f memberikan vote yang sama dengan interval_class_vote[f,i,c]. Notasi tersebut merepresentasikan vote feature f yang diberikan untuk kelas c.
dimana feature_vote[f,Cj] merupakan vote feature f untuk kelas Cj dan k adalah jumlah kelas. Kemudian d vektor vote, dimana d merupakan jumlah feature, dijumlahkan untuk memperoleh total vektor vote 〈vote[C1], ..., vote[Ck]〉. Kelas dengan jumlah vote terbesar diprediksi sebagai kelas dari instance tes e.
Setiap feature f mengumpulkan vote-votenya dalam sebuah vektor 〈feature_vote[f,C1], ..., feature_vote[f,Cj], ..., feature_vote[f,Ck]〉,
Pseudocode algoritma pelatihan dan prediksi VFI5 dapat dilihat pada Gambar 1 dan Gambar 2.
train(TrainingSet): begin for each feature f for each class c EndPoints[f] = EndPoints[f] ∪ find_end_points(TrainingSet,f,c); sort(EndPoints[f]); if f is linear for each end point p in EndPoints[f] form a point interval from end point p form a range interval between p and the next endpoint ≠ p else /* f is nominal*/ each distinct point in EndPoints[f] forms a point interval for each interval i on feature dimension f for each class c interval_class_count[f,i,c]=0 count_instances(f,TrainingSet); for each interval i on feature dimension f for each class c interval_ class _ vote[ f ,i,c ] = int erval _ class _ count[ f ,i,c ] class _ count[ c ] normalize interval_class_vote[f,i,c] * such that ∑c interval_class_vote[f,i,c] = 1 * end Gambar 1 Algoritma pelatihan (training) VFI5. classify(e): * e: example to be classified * begin for each class c vote[c] = 0 for each feature f for each class c * vote of feature f for class c * feature_vote[f,c] = 0 if ef value is known i = find_interval( f, ef ) feature_vote[f,c] = interval_class_vote[f,i,c] for each class c vote[c] = vote[c] + (feature_vote[f,c]*weight[f]); return class c with highest vote[c] end Gambar 2 Algoritma prediksi (klasifikasi) VFI5.
5
METODE PENELITIAN Penelitian ini memiliki beberapa tahapan proses untuk mengetahui akurasi yang diperoleh Algoritma VFI5 dalam pengklasifikasian mahasiswa pada suatu kelas tertentu. Tahapan proses tersebut disajikan pada Gambar 3.
Praproses
Data Uji
Seleksi Pelatihan VFI5 Klasifikasi
Data Latih dan Data Uji Seperti penelitian lain yang menggunakan Algoritma VFI5 sebagai algoritma klasifikasi, ada suatu kelas yang memisahkan kelompok instance yang satu dengan yang lain. Maka untuk data nilai mahasiswa seperti ini pembagian kelas ditentukan dengan cara membagi kelas dalam suatu selang, yang dinamakan selang IPK.
Data
Data Latih
nilai fitur yang tidak lengkap (tidak diketahui) tidak diambil datanya. Hal ini disebabkan karena sebagian mahasiswa tersebut tidak/belum menyelesaikan studinya. Oleh karena itu semua instance yang memiliki nilai fitur yang tidak lengkap tidak dipergunakan sebagai data pelatihan maupun data pengujian.
Data Uji
Akurasi
Gambar 3 Tahapan proses klasifikasi data. Proses utama yang terjadi yaitu praproses, pelatihan untuk melihat domain dan sebaransebaran nilai fitur, seleksi fitur untuk mencari fitur terbaik dan prediksi (klasifikasi) untuk menduga kelas dari suatu instance baru. Data Ada dua set data yang dipakai untuk pelatihan dan pengujian (klasifikasi) yaitu data nilai mahasiswa angkatan 2001/2002 dan 2002/2003 mulai dari tingkat 1 sampai dengan lulus. Pada Algoritma VFI5 dikenal ada beberapa istilah seperti instance dan feature (fitur). Untuk kasus data nilai mahasiswa seperti ini, mahasiswa dijadikan sebagai instance dan mata kuliah beserta IP TPB dijadikan sebagai fitur. Praproses Sebelum data digunakan untuk tahap selanjutnya, setiap instance dalam hal ini mahasiswa pada setiap data yang memiliki
Baik data latih maupun data uji memiliki kelas yang sama yaitu selang IPK. Untuk lebih jelasnya pembagian kelas dapat dilihat pada Tabel 1. Tabel 1 Pembagian kelas menurut selang IPK kelulusan Selang IPK Kelas 2.00≤IPK<2.50 I 2.50≤IPK<3.00 II 3.00≤IPK<3.50 III 3.50≤IPK≤4.00 IV Data yang digunakan dibagi menjadi beberapa subset (himpunan bagian) dengan ukuran contoh yang lebih kurang sama. Pembagian data dilakukan secara acak dengan mempertahankan perbandingan jumlah instance setiap kelas. Untuk itu dilakukan suatu metode pembagian data yang disebut dengan 3-fold cross validation. Data akan dibagi secara acak menjadi 3 himpunan bagian yang ukurannya hampir sama satu sama lain. Himpunan bagian yang dihasilkan yaitu S1, S2 dan S3, digunakan sebagai pelatihan dan pengujian yang masingmasing diulang sebanyak 3 kali. Pada iterasi ke-1, himpunan bagian S1 diperlakukan sebagai data pengujian, dan himpunan bagian lainnya diperlakukan sebagai data pelatihan, dan seterusnya untuk himpunan bagian yang lain. Algoritma VFI5 Pada penelitian ini digunakan Algoritma VFI5 dengan bobot yang berbeda untuk setiap fitur, baik untuk instance yang fiturnya lengkap maupun instance yang fiturnya diseleksi. Untuk fitur mata kuliah, bobot
6
diberikan sesuai dengan beban SKS mata kuliah yang bersangkutan, sedangkan fitur IP TPB disesuaikan. Untuk fitur mata kuliah yang sudah terseleksi, bobot yang dipakai sesuai dengan beban SKS, sedangkan fitur yang tidak terseleksi diberikan bobot yang bernilai nol. Pada tahap ini terdiri atas dua proses yaitu pelatihan dan prediksi (klasifikasi) kelas instance baru. Pelatihan Data yang telah dibagi-bagi menjadi 3 himpunan bagian kemudian menjadi input algoritma klasifikasi VFI5. Pada tahapan ini akan dibentuk intervalinterval dari setiap feature yang ada. Jika feature tersebut adalah feature linear maka akan dibentuk dua buah interval, yaitu point interval dan range interval. Jika feature tersebut adalah feature nominal maka hanya akan dibentuk satu interval, yaitu point interval. Setelah semua interval terbentuk, langkah selanjutnya adalah menghitung jumlah instance setiap kelas yang berada pada setiap interval tersebut. Seleksi Fitur Pada tahap seleksi fitur, dilakukan suatu pemilihan fitur-fitur yang berpengaruh berdasarkan hasil dari percobaan. Jika dengan penambahan suatu fitur menghasilkan akurasi tinggi maka fitur tersebut akan dipakai seterusnya, jika sebaliknya fitur akan dihilangkan. Klasifikasi Pada tahap klasifikasi, setiap nilai feature dari suatu instance baru diperiksa letak interval nilai feature tersebut. Vote-vote setiap kelas untuk setiap feature pada setiap interval yang bersesuaian diambil dan kemudian dijumlahkan. Kelas dengan nilai total vote tertinggi menjadi kelas prediksi instance baru tersebut. Akurasi Hasil yang diamati pada penelitian ini adalah perubahan rata-rata tingkat akurasi yang dicapai algoritma klasifikasi VFI5 dalam mengklasifikasikan data pengujian setelah dilakukan perubahan pada ukuran contoh data pelatihan. Tingkat akurasi diperoleh dengan perhitungan :
tingkat akurasi =
∑ data uji benar diklasifikasi ∑ total data uji
Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai berikut : • Microsoft Windows XP Service Pack 2 • Matlab 7.0.1 Di sisi lain, perangkat keras digunakan adalah sebagai berikut :
yang
• • • • •
Prosesor AMD Sempron 2600+ DDRAM 768 MB Harddisk dengan kapasitas 80 GB ATI Radeon 9550 XT 128 MB Monitor VGA dengan resolusi 1024x768 pixel • Keyboard • Mouse.
HASIL DAN PEMBAHASAN Pada bab ini akan dibahas dua proses yaitu proses pelatihan (deskripsi training) dan pengujian. Pada proses pelatihan untuk pendeskripsian metode k-fold cross validation tidak dipakai, karena pada pelatihan tidak ada yang dijadikan sebagai data uji, semua data dijadikan sebagai data latih. Dengan demikian, pada pengujian data dibagi menjadi dua yaitu data latih dan data uji. Pelatihan (deskripsi training) Deskripsi untuk sebaran-sebaran nilai hanya terbatas pada nilai A, D dan E. Hal ini dikarenakan nilai A adalah nilai tertinggi dan berpotensi tinggi untuk meningkatkan nilai IPK, sedangkan nilai D dan E adalah nilai terendah. Ada dua hal penting yang harus diperhatikan ketika membaca tabel hasil pelatihan yaitu : 1 Pada mata kuliah apakah kelas 2.00≤IPK<2.50 mendapatkan nilai D dan E? 2 Apakah sebaran nilai A untuk setiap kelas IPK sejalan dengan tingkat kelas IPK? Setelah dilakukan proses pelatihan dengan dua data yaitu data angkatan 2001/2002 dan data angkatan 2002/2003, maka deskripsi untuk data pelatihan dibagi dua yaitu deskripsi data angkatan 2001/2002 dan deskripsi data angkatan 2002/2003.
7
1 Deskripsi angkatan 2001/2002
o o o o o o
Deskripsi data mahasiswa 2001/2002 dibagi dalam dua penjelasan sesuai dengan perbedaan tingkatan yaitu data latih tingkat TPB dan data latih tingkat 2. • Data latih tingkat TPB
Contohnya, untuk mata kuliah Fisika II, peluang (vote) kelas 2.00≤IPK<2.50 lebih tinggi dibandingkan dengan vote kelas 2.50≤IPK<3.00, dan pada mata kuliah Matematika Dasar, peluang (vote) kelas 3.00≤IPK<3.50 lebih besar dibandingkan dengan kelas 3.50≤IPK≤4.00.
Setelah dilakukan pelatihan, hasil sebaran nilai mata kuliah dapat dilihat pada Tabel 2. Untuk sebaran nilai yang lebih lengkap dapat dilihat pada Lampiran 3. Dapat dilihat pada Tabel 2, kelas 2.00≤IPK<2.50 mendapatkan nilai terendah pada pada mata kuliah berikut: o o o o o o
Fisika II Matematika Dasar Kalkulus Pengantar Ilmu Pertanian Pendidikan Agama Olahraga dan Seni
Ada hal unik pada mata kuliah TPB angkatan 2001/2002 ini yaitu pada mata kuliah Sosiologi Umum, tidak ada satupun instance yang mendapatkan nilai A pada mata kuliah tersebut, bahkan pada kelas 3.50≤IPK≤4.00 juga tidak ada instance yang mendapatkan nilai A.
Biologi Kimia Umum Algoritma dan Pemrograman Matematika Dasar Kalkulus Sosiologi Umum
Ketika pada mata kuliah yang lain vote untuk sebaran nilai A selalu dimonopoli oleh kelas 3.50≤IPK≤4.00, tetapi untuk MK PIP minat untuk mendapatkan nilai A tampaknya tidak begitu besar karena tidak satu pun instance yang ada di kelas 3.50≤IPK≤4.00 mendapatkan nilai A pada MK tersebut.
Pada mata kuliah Biologi, Kimia Umum, Algoritma dan Pemrograman, dan Matematika Dasar nilai D hanya terdapat pada kelas 2.00≤IPK<2.50, sedangkan untuk mata kuliah Sosiologi Umum dan Kalkulus masih tersebar pada kelas lain. Ada beberapa mata kuliah yang sebaran nilai A-nya tidak sejalan dengan tingkat kelas IPK yaitu :
Tabel 2 Sebaran nilai MK pada tingkat TPB angkatan 2001/2002 MK *Bio Fis I Fis II *KimUm *Algor PengKom *MatDas *Kalkulus *PIP PA PK B. Ind B. Ing *OR *SosUm
2.00≤IPK<2.50
2.50≤IPK<3.00
A 0.0521 0 0.0702 0 0.1049 0 0.1528 0.0875 0.2072 0.0493 0.0963 0.0807 0.1624 0.1744 0
A 0.1541 0 0.0415 0.2287 0.1239 0.1357 0.1806 0 0.3674 0.2333 0.1708 0.1196 0.2079 0.2886 0
D 1.0000 0 0 1.0000 1.0000 0 1.0000 0.7451 0 0 0 0 0 0 0.8354
KELAS 3.00≤IPK<3.50
D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.1646
A 0.2854 0.3871 0.4322 0.3527 0.4305 0.3667 0.4182 0.0598 0.4254 0.2363 0.2636 0.2759 0.2778 0.3103 0
D 0 0 0 0 0 0 0 0.2549 0 0 0 0 0 0 0
3.50≤IPK≤4.00 A 0.5084 0.6129 0.4562 0.4188 0.3408 0.4976 0.2483 0.8527 0 0.4811 0.4695 0.5243 0.3519 0.2267 0
D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Keterangan : tanda * pada mata kuliah menunjukkan bahwa mata kuliah tersebut menarik untuk diperhatikan.
• Data latih tingkat 2 Pada data latih tingkat 2 setelah dilakukan pelatihan, dapat dilihat bahwa kelas 2.00≤IPK<2.50 mendapatkan nilai terendah
pada hampir semua mata kuliah yang ada pada tingkat 2, kecuali untuk mata kuliah Matematika Diskret, Ekonomi Umum, Sistem Berkas dan Metode Statistika.
8
Untuk mata kuliah Bahasa Pemrograman dapat dilihat bahwa hampir semua kelas mendapatkan nilai D, bahkan nilai D juga didapatkan oleh kelas 3.50≤IPK≤4.00 dengan vote yang lebih tinggi dibandingkan dengan kelas 2.00≤IPK<2.50.
Untuk nilai A pada mata kuliah Bahasa Pemrograman hanya didapatkan oleh kelas 3.00≤IPK<3.50 (vote = 1). Hal tersebut tidak berbeda pada mata kuliah Struktur Data, nilai A pada mata kuliah Struktur Data juga didapatkan pada kelas 3.00≤IPK<3.50.
Kelas 3.50≤IPK≤4.00 tidak hanya mendapatkan nilai D pada mata kuliah Bahasa Pemrograman, kelas ini juga mendapatkan nilai D pada mata kuliah Organisasi Komputer dengan vote sebesar 0.27 vote.
Untuk lebih jelasnya, sebaran nilai yang terjadi pada mahasiswa angkatan 2001/2002 di tingkat 2 ini dapat dilihat pada Tabel 3. Untuk sebaran nilai yang lebih lengkap dapat dilihat pada Lampiran 4.
Tabel 3 Sebaran nilai MK pada tingkat 2 angkatan 2001/2002 MK ElDas *RaDig *P. Logika *KalkulusII MatDis EkUm *AlLin *BasProg *TBO *StrukDat *OrKom *SisBer *B. Ing II *PHP MetStat
2.00≤IPK<2.50 A 0 0 0 0.04 0 0 0 0 0 0 0.13 0 0 0
D 1.00 0.84 1.00 0 0 1.00 0.44 1.00 1.00 0.68 0 0.70 0.77 0
2.50≤IPK<3.00 E -
0 0 0 0 0 0 1.00 0 0 0 0 0 0 0
A 0.04 0.12 0.46 0.12 0.15 0.09 0 0.04 0 0.10 0.04 0.04 0 0.06
D 0 0.16 0 0 0 0 0.09 0 0 0.05 0 0.14 0.23 0
KELAS 3.00≤IPK<3.50 E 0 0 0 0 0 0 0 0 0 0 0 0 0 0
A 0.25 0.23 0.54 0.31 0.36 0.20 1.00 0.51 1.00 0.35 0.40 0.13 0.12 0.41
D 0 0 0 0 0 0 0 0 0 0 0 0.16 0 0
3.50≤IPK≤4.00 E 0 0 0 0 0 0 0 0 0 0 0 0 0 0
A 0.71 0.65 0 0.53 0.49 0.71 0 0.44 0 0.55 0.43 0.83 0.88 0.53
D 0 0 0 0 0 0 0.48 0 0 0.27 0 0 0 0
E 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Keterangan : tanda * pada mata kuliah menunjukkan bahwa mata kuliah tersebut menarik untuk diperhatikan.
2 Deskripsi angkatan 2002/2003 Deskripsi data mahasiswa 2002/2003 dibagi dalam dua penjelasan sesuai dengan perbedaan tingkatan yaitu data latih tingkat TPB dan data latih tingkat 2. • Data latih tingkat TPB Kelas 2.00≤IPK<2.50 pada angkatan 2002/2003 berbeda dengan kelas 2.00≤IPK<2.50 pada angkatan 2001/2002 dalam hal perolehan nilai D. Dapat dikatakan angkatan 2002/2003 lebih sukses dibandingkan dengan angkatan 2001/2002, karena nilai D yang ditemukan lebih sedikit dibandingkan angkatan 2001/2002. Nilai D hanya terdapat pada mata kuliah Biologi dan Sosiologi Umum.
Ada hal menarik untuk mata kuliah Fisika I dan Fisika II yaitu nilai A dan nilai D tidak tersebar di kelas manapun. Nilai Fisika I dan Fisika II hanya tersebar pada nilai B dan C. Pada data latih tingkat TPB angkatan 2001/2002 mata kuliah Sosiologi Umum tidak ada mahasiswa yang mendapatkan nilai A. Hal ini juga hampir sama dengan data latih tingkat TPB angkatan 2002/2003. Nilai A hanya didapatkan pada kelas 2.50≤IPK<3.00, dan setelah dilakukan pembedahan data, nilai A hanya didapatkan pada satu instance. Untuk lebih jelasnya, sebaran nilai dapat dilihat pada Tabel 4. Di sisi lain, untuk sebaran nilai yang lebih lengkap dapat dilihat pada Lampiran 5.
9
Tabel 4 Sebaran nilai MK pada tingkat TPB angkatan 2002/2003 MK
2.00≤IPK<2.50 A
*Bio *Fis I *Fis II KimUm Algor *PengKom MatDas *Kalkulus *PIP PA *PK B. Ind B. Ing *OR *SosUm
0 0 0 0 0.1248 0.1674 0 0 0.2804 0 0.1153 0 0 0.2696 0
D 0.8438 0 0 0 0 0 0 0 0 0 0 0 0 0 1.0000
KELAS 2.50≤IPK<3.00 A 0.0642 0 0 0.1750 0.1618 0.1550 0.1586 0.0690 0.0519 0.1984 0.1708 0.0796 0.2448 0.2297 1.0000
D 0.1563 0 0 0 0 0 0 1.0000 0 0 0 0 0 0 0
3.00≤IPK<3.50 A 0.3578 0 0 0.3000 0.2972 0.1196 0.3070 0.3103 0.2003 0.2915 0.1373 0.2046 0.3147 0.2311 0
3.50≤IPK≤4.00
D
A 0.5780 0 0 0.5250 0.4161 0.5580 0.5354 0.6207 0.4674 0.5101 0.5766 0.7160 0.4406 0.2696 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Keterangan : tanda * pada mata kuliah menunjukkan bahwa mata kuliah tersebut menarik untuk diperhatikan.
• Data latih tingkat 2 Pada data latih tingkat 2 angkatan 2002/2003 ini, kelas 2.00≤IPK<2.50 lebih sedikit instancenya yang mendapatkan nilai D jika dibandingkan dengan angkatan 2001/2002. Namun untuk mata kuliah Matematika Diskret dan Sistem Berkas selalu tidak ditemukan nilai D pada kelas 2.00≤IPK<2.50.
angkatan sebelumnya hanya empat mata kuliah saja.
Ada hal menarik yang dapat dilihat pada tabel pelatihan antara angkatan 2001/2002 dengan angkatan 2002/2003 yaitu pada sebaran nilai A. Untuk mata kuliah Matematika Diskret dan Sistem Berkas, kelas 2.00≤IPK<2.50 selalu mendapatkan nilai A, baik pada angkatan 2001/2002 maupun angkatan 2002/2003. Ketika kelas Berbeda halnya dengan kelas 2.00≤IPK<2.50 sangat susah untuk 2.00≤IPK<2.50, kelas 2.50≤IPK<3.00 pada mendapatkan nilai A pada tingkat 2 ini, tingkat 2 angkatan 2002/2003 ini lebih banyak namun untuk MK Matematika Diskret dan yang mendapatkan nilai D jika dibandingkan Sistem Berkas sepertinya tidak ada masalah. angkatan 2001/2002. Ada tujuh mata kuliah Mungkin MK ini dapat menjadi dorongan yang mendapatkan nilai D sedangkan untuk mendapatkan nilai yang terbaik. Tabel 5 Sebaran nilai MK pada tingkat 2 angkatan 2002/2003 MK ElDas RaDig *P. Logika *KalkulusII MatDis *EkUm *AlLin *BasProg *TBO StrukDat *OrKom *SisBer *B. Ing II *PHP *MetStat
2.00≤IPK<2.50
KELAS 2.50≤IPK<3.00
A
D
A
0 0 1.0000 0 1.0000 0.8438 0.9153 0.9153 0 0 0 0.8438 0 1.0000
0.0816 0.1220 0.0493 0.1084 0.0757 0.1429 0.0796 0 0.1000 0.0660 0.1011 0.1777 0.1000 0.0438
0 0 0 0.1951 0 0 0 0 0 0 0.1560 0 0 0
D 0 1.0000 0 0 0 0.1563 0.0848 0.0848 0 1.0000 0 0.1563 1.0000 0
3.00≤IPK<3.50 A 0.3674 0.2195 0.2852 0.2090 0.4135 0.4286 0.2046 0.3636 0.3000 0.3396 0.3529 0.1827 0.2250 0.3656
3.50≤IPK≤4.00
D
A 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0.5510 0.6585 0.6655 0.4876 0.5108 0.4286 0.7159 0.6364 0.6000 0.5943 0.3900 0.6396 0.6750 0.5906
Keterangan : tanda * pada mata kuliah menunjukkan bahwa mata kuliah tersebut menarik untuk diperhatikan.
D 0 0 0 0 0 0 0 0 0 0 0 0 0 0
10
Jika dibandingkan kelas 3.50≤IPK≤4.00 angkatan 2001/2002 dengan kelas 3.50≤IPK≤4.00, maka akan didapat kesimpulan bahwa angkatan 2002/2003 lebih sukses, karena tidak ada instance yang mendapatkan nilai D, juga tidak ada mata kuliah yang tidak mendapatkan nilai A. Untuk lebih jelasnya, sebaran nilai yang terjadi pada mahasiswa angkatan 2002/2003 di tingkat 2 dapat dilihat pada Tabel 5. Untuk lebih lengkapnya sebaran nilai yang lain dapat dilihat pada Lampiran 6. Pengujian Data yang diujikan pada tahap ini hanya menggunakan data nilai mahasiswa tingkat TPB, oleh karena itu fitur yang dipakai untuk semua pengujian adalah mata kuliah TPB. Tahap pengujian terdiri atas dua langkah uji yaitu uji fitur lengkap dan uji fitur seleksi. Uji fitur lengkap adalah cara pengujian data yang melibatkan semua fitur yang terdapat pada data pelatihan. Di sisi lain, uji fitur seleksi adalah cara pengujian data yang menggunakan fitur yang berpengaruh saja, sedangkan fitur yang tidak berpengaruh dihilangkan. Pada uji seleksi fitur dilakukan seleksi fitur-fitur yang memiliki potensi besar untuk meningkatkan akurasi pengujian. Semua uji yang dilakukan pada tahap pengujian melalui metode 3-fold cross validation. Data dibagi 3 himpunan bagian, dua himpunan bagian dijadikan sebagai data latih dan himpunan bagian lainnya sebagai data uji. Setelah dilakukan pelatihan, dilakukan pengujian data dengan pembagian data uji angkatan 2001/2002 dan data uji angkatan 2002/2003. 1 Data uji angkatan 2001/2002 Setelah dilakukan pelatihan, dilakukan pengujian data dengan pembagian data uji angkatan 2001/2002 dan data uji angkatan 2002/2003. • Uji Fitur Lengkap Ada empat percobaan untuk menguji data yang menggunakan fitur lengkap oleh setiap instancenya. Pada awal penelitian, data tidak dibebankan memakai bobot, karena dianggap setiap fitur memiliki bobot yang sama yaitu satu. Percobaan I pun dilakukan dengan tidak memberikan bobot sehingga akurasi uji yang didapatkan adalah 41.49%. Akurasi ini didapatkan dari rata-rata akurasi pada ketiga
himpunan bagian dengan akurasi himpunan bagian pertama adalah 35%, himpunan bagian yang kedua 52.6% dan yang ketiga 36.8%. Akurasi 41.49% adalah akurasi yang sangat kecil bila dibandingkan dengan penelitian-penelitian lain yang menggunakan VFI5 sebagai algoritmanya. Oleh karena itu dilakukan percobaan II dengan setiap fitur yang ada diberikan bobot yang berbeda-beda. Untuk itu setiap fitur mata kuliah diberikan bobot sesuai dengan beban SKS pada mata kuliah yang bersangkutan. Contohnya mata kuliah Bahasa Inggris memiliki beban SKS sebanyak tiga, jadi bobot yang diberikan adalah tiga. Untuk lebih jelasnya, bobot setiap mata kuliah ditunjukkan pada Tabel 6. Tabel 6 Bobot untuk setiap mata kuliah TPB No. Mata Kuliah SKS Bobot 1. Bio 2 2 2. Fis 1 3 3 3. Fis 2 3 3 4. KimUm 3 3 5. Algor 3 3 6. PengKom 3 3 7. MatDas 3 3 8. Kalkulus 3 3 9. PIP 1 1 10. PA 3 3 11. PK 3 3 12. B. Ind 2 2 13. B. Ing 3 3 14. OR 1 1 15. SosUm 3 3 Setelah dilakukan percobaan II dengan penambahan bobot, ternyata rata-rata akurasi yang dihasilkan meningkat menjadi 46.6%, dengan himpunan bagian pertama akurasi yang diperoleh 40%, himpunan bagian kedua 57.9% dan himpunan bagian ketiga 42.1%. Dapat dilihat akurasi untuk setiap himpunan bagian rata-rata meningkat 5% dari sebelumnya. Kedua percobaan di atas belum menunjukkan tingkat akurasi yang memuaskan. Kemudian dilakukan percobaan III dengan menambahkan fitur IP TPB untuk setiap instancenya. Penambahan fitur IP TPB ini diharapkan menghasilkan akurasi yang lebih tinggi bila dibandingkan dengan kedua percobaan di atas. Alasan penambahan fitur IP TPB adalah karena IP tingkat TPB sangat mempengaruhi IPK kelulusan. Seperti diketahui bahwa IPK adalah kumulatif dari IP-IP mulai dari tingkat TPB sampai seorang mahasiswa dinyatakan lulus.
11
Namun yang menjadi masalah dalam penelitian ini adalah bobot untuk fitur IP TPB. Fitur IP TPB bukanlah fitur seperti MK yang lain, IP TPB tidak mungkin memiliki beban SKS layaknya sebuah mata kuliah. Olehkarena itu diputuskan untuk memberikan bobot untuk keseluruhan fitur dengan nilai satu saja. Dengan penambahan fitur IP TPB tadi diperoleh akurasi yang lebih tinggi lagi dibandingkan dengan dua percobaan sebelumnya. Rata-rata akurasi yang dihasilkan adalah 50%, dengan akurasi pada himpunan bagian pertama 50%, himpunan bagian kedua 52.6% dan himpunan bagian ketiga 47.4%. Rata-rata akurasi meningkat untuk setiap himpunan bagian dari sebelumnya sebanyak 5%. Dari hasil percobaan III dapat disimpulkan bahwa pengaruh fitur IP TPB sama dengan pengaruh fitur mata kuliah lainnya. Olehkarena itu fitur IP TPB memang layak untuk dijadikan fitur penting dalam penelitian ini. Percobaan IV adalah percobaan untuk melihat pengaruh akurasi yang terjadi apabila semua fitur diberikan bobot sesuai beban SKS sedangkan pada fitur IP TPB masih bernilai satu. Hal ini dilakukan untuk mencari bobot yang tepat untuk fitur IP TPB. Ternyata setelah dilakukan percobaan IV, akurasi yang ditemukan lebih kecil dibandingkan dengan akurasi percobaan III. Hal ini membuktikan bahwa pengaruh bobot bernilai satu tidak meningkatkan akurasi. Dengan demikian, pada percobaan selanjutnya pemberian bobot dilakukan sesuai dengan beban SKS mata kuliah yang ada. Percobaan V adalah percobaan dengan pemberian bobot untuk fitur IP TPB bernilai tiga (bobot tertinggi dari keseluruhan fitur MK). Hasilnya rata-rata akurasi meningkat menjadi 51.75%, bertambah 1.75, dengan hanya akurasi himpunan bagian ketiga yang bertambah sebesar 5%.
Untuk hasil yang lebih lengkap mengenai rata-rata akurasi percobaan dapat dilihat pada Tabel 7. Tabel 7 Akurasi fitur lengkap untuk angkatan 2001/2002 Percobaan
1
Ak urasi (%) 2 3
Rataan (%)
Percobaan I Percobaan II
35.00 40.00
52.63 57.89
36.84 42.11
41.49 46.67
Percobaan III Percobaan IV Percobaan V
50.00 45.00 50.00
52.63 52.63 52.63
47.37 47.37 52.63
50.00 48.33 51.75
Percobaan VI
50.00
52.63
47.37
50.00
Keterangan : 1 2 3 4 5 6
Percobaan I : tanpa bobot dan tanpa IP TPB. Percobaan II : tanpa IP, bobot = SKS MK. Percobaan III : IP, tanpa bobot. Percobaan IV : bobot dan IP( bobot = 1). Percobaan V : bobot dan IP( bobot = 3). Percobaan VI : bobot dan IP( bobot = 2).
Dari hasil-hasil percobaan yang menggunakan semua fitur dapat disimpulkan bahwa ada kemungkinan sebagian fitur MK yang perannya lebih penting dibandingkan sebagian yang lain dalam perhitungan akurasi. Oleh karena itu hasil akurasi yang didapatkan sangat kecil karena disebabkan oleh fitur yang perannya tidak penting tadi. Hal inilah yang mendasari percobaan-percobaan selanjutnya dengan menyeleksi fitur yang mempunyai peran penting. Fitur yang terseleksi nantinya akan dipakai untuk memprediksi IPK kelulusan seorang mahasiswa yang masih berada di tingkat TPB. • Uji Fitur Seleksi Pada awal pengujian fitur yang dipakai adalah fitur mata kuliah pilihan program studi kemudian diseleksi semua fitur-fitur yang diperkirakan lebih dekat relasinya dengan mata kuliah yang ada pada jurusan Ilmu Komputer. Dengan demikian, didapatkan akurasi seperti yang ditunjukkan pada Lampiran 7.
Percobaan VI adalah percobaan dengan pemberian bobot untuk fitur IP TPB yang bernilai dua. Hasilnya lebih bagus percobaan V karena akurasi yang didapatkan rata-rata bernilai 50%, sama dengan hasil pada percobaan III.
Oleh karena akurasi-akurasi pada Lampiran 7 masih dikategorikan kecil untuk kasus ini, maka untuk itu dilakukan suatu konsep pengujian dengan memakai satu buah fitur mata kuliah saja yang dikombinasikan dengan fitur IP TPB dari tujuh fitur mata kuliah. Jadi, pada percobaan-percobaan berikutnya fitur IP TPB selalu dipakai dalam pengujian.
Dari keseluruhan percobaan yang dilakukan, percobaan V adalah percobaan paling tinggi akurasinya yaitu sebesar 51.7%.
Pengujian seperti ini akan menunjukkan akurasi dari setiap fitur mata kuliah. Tiga akurasi tertinggi dari mata kuliah akan dicari
12
kombinasinya lebih lanjut. Dengan demikian, akurasi pengujian diharapkan menghasilkan akurasi tertinggi dari semua percobaan yang telah dilakukan. Setelah semua fitur diujikan dapat disimpulkan bahwa fitur MK Fisika II memang paling berpengaruh untuk menghasilkan pengujian dengan akurasi yang paling tinggi, diikuti fitur Pengenalan Komputer kemudian fitur Kalkulus menempati posisi ketiga. Untuk lebih jelasnya dapat dilihat pada Tabel 8. Tabel 8 Akurasi fitur seleksi tahap pertama untuk angkatan 2001/2002 Percobaan
1
Akurasi (%) 2 3
Rataan (%)
Percobaan I Percobaan II
35.00 65.00
57.89 47.37
52.63 57.89
48.51 56.75
Percobaan III PercobaanIV Percobaan V
75.00 60.00 55.00
57.89 52.63 63.16
63.16 52.63 52.63
65.35 55.09 56.93
PercobaanVI PercobaanVII
70.00 45.00
52.63 57.89
52.63 52.63
58.42 51.84
Percobaan VIII
75.00
57.89
52.63
61.84
Tabel 9 Akurasi fitur seleksi MK kombinasi untuk angkatan 2001/2002 Percobaan
Akurasi (%) 2 3
1
Rataan (%)
Percobaan I Percobaan II
70.00 75.00
57.89 73.68
52.63 63.16
60.16 70.61
Percobaan III Percobaan IV
80.00 75.00
68.42 68.42
57.89 57.89
68.77 67.10
Keterangan : 1 2 3
4
Percobaan I adalah kombinasi antara fitur MK Fisika II dengan Pengenalan Komputer. Percobaan II adalah kombinasi antara fitur MK Fisika II dengan Kalkulus. Percobaan III adalah kombinasi antara fitur MK Pengenalan Komputer dengan Kalkulus. Percobaan IV adalah kombinasi antara ketiga fitur MK.
2 Data uji angkatan 2002/2003
Keterangan :
Pengujian yang dilakukan pada angkatan 2002/2003 memiliki format yang sama dengan angkatan 2001/2002. Pada angkatan 2001/2002 telah ditemukan kombinasi yang tepat, sehingga pada angkatan 2002/2003 tidak dicari kombinasi baru. Pengujian data angkatan 2002/2003 dilakukan sebagai perbandingan dengan angkatan sebelumnya.
1
• Uji Fitur Lengkap
2 3 4 5 6 7 8
Percobaan I hanya memakai fitur IP TPB tanpa fitur MK (sebagai perbandingan), percobaan seterusnya memakai IP tingkat TPB. Percobaan II fitur MK yang dipakai adalah Fisika I. Percobaan III fitur MK yang dipakai adalah Fisika II. Percobaan IV fitur MK yang dipakai adalah Algoritma dan Pemrograman. Percobaan V fitur MK yang dipakai adalah Matematika Dasar. Percobaan VI fitur MK yang dipakai adalah Kalkulus Percobaan VII fitur MK yang dipakai adalah Bahasa Inggris. Percobaan VIII fitur MK yang dipakai adalah Pengenalan Komputer.
Dengan demikian, untuk tahap selanjutnya dilakukan percobaan dengan mencari kombinasi terbaik dari ketiga fitur dengan melihat akurasi yang dihasilkan. Hasilnya adalah kombinasi terbaik yang didapatkan yaitu kombinasi antara fitur MK Fisika II dengan fitur MK Kalkulus dengan rata-rata akurasi sebesar 70.61%. Dalam pengklasifikasian, akurasi seperti ini masih diragukan untuk memprediksi sebuah instance. Mungkin hal ini disebabkan karena terlalu banyak fitur-fitur lain pada tingkat 2, 3 dan 4 yang pengaruhnya bisa lebih kuat dibandingkan fitur-fitur MK yang ada di TPB. Akurasi dari hasil kombinasi ketiga fitur dapat dilihat pada Tabel 9.
Setelah proses pengujian dilakukan sesuai dengan prosedur pada pengujian sebelumnya didapatkan hasil yang berbeda. Jika pada pengujian sebelumnya dinyatakan bahwa ratarata akurasi terbaik didapatkan ketika fitur IP TPB bernilai tiga, sedangkan pada pengujian data angkatan 2002/2003 ini akurasi terbaik didapatkan ketika semua fitur diberikan bobot bernilai sama. Akurasi dengan pengujian fitur lengkap ditunjukkan pada Tabel 10. Tabel 10 Akurasi fitur lengkap untuk angkatan 2002/2003 1
Akurasi (%) 2
3
Rataan (%)
Percobaan I Percobaan II
50.00 50.00
31.58 21.05
27.78 27.78
36.45 32.94
Percobaan III Percobaan IV
61.11 55.55
47.37 36.84
44.44 33.33
50.97 41.91
Percobaan V Percobaan VI
55.56 55.56
47.37 42.11
38.89 38.89
47.27 45.52
Percobaan
Keterangan : 1 2 3 4 5 6
Percobaan I : tanpa bobot dan tanpa IP TPB. Percobaan II : tanpa IP, bobot = SKS MK. Percobaan III : IP, tanpa bobot. Percobaan IV : bobot dan IP( bobot = 1). Percobaan V : bobot dan IP( bobot = 3). Percobaan VI : bobot dan IP( bobot = 2).
13
• Uji Fitur Seleksi Pada percobaan sebelumnya tiga akurasi tertinggi berurutan terdapat pada fitur MK Fisika II, Pengenalan Komputer, dan Kalkulus. Di lain pihak, untuk data angkatan 2002/2003 ini tiga akurasi tertinggi secara berurutan ditempati oleh fitur MK Fisika II, Fisika I, dan Matematika dasar. Untuk lebih lengkapnya dapat dilihat pada Tabel 11. Tabel 11 Akurasi fitur seleksi tahap pertama untuk angkatan 2002/2003 Percobaan
1
Akurasi (%) 2 3
Rataan (%)
Percobaan I
66.70
63.16
55.56
61.79
Percobaan II Percobaan III PercobaanIV
72.20 72.20 61.10
68.42 68.42 63.16
50.00 55.55 55.56
63.54 65.39 59.94
Percobaan V PercobaanVI PercobaanVII
66.70 50.00 72.20
68.42 68.42 63.16
55.56 55.56 50.00
63.55 57.99 61.79
PercobaanVIII
77.80
68.42
44.44
63.55
Keterangan : 1
2 3 4 5 6 7
8
Percobaan I hanya memakai fitur IP TPB tanpa fitur MK (sebagai perbandingan), percobaan seterusnya memakai IP tingkat TPB. Percobaan II fitur MK yang dipakai adalah Fisika I. Percobaan III fitur MK yang dipakai adalah Fisika II. Percobaan IV fitur MK yang dipakai adalah Algoritma dan Pemrograman. Percobaan V fitur MK yang dipakai adalah Matematika Dasar. Percobaan VI fitur MK yang dipakai adalah Kalkulus. Percobaan VII fitur MK yang dipakai adalah Bahasa Inggris. Percobaan VIII fitur MK yang dipakai adalah Pengenalan Komputer.
Karena fitur yang berpengaruh dalam pengujian sudah ditemukan pada percobaan data angkatan 2001/2002, sehingga untuk angkatan 2002/2003 hanya memperhatikan akurasinya saja. Hasilnya ternyata akurasi yang dihasilkan lebih kecil dibandingkan data angkatan sebelumnya yaitu sebesar 60.04%. Hal ini disebabkan karena variasi data antara angkatan 2001/2002 dengan 2002/2003 tidak sama, tidak ada kesinkronan data. Akurasi kombinasi fitur selengkapnya dapat dilihat pada Tabel 12.
Tabel 12 Akurasi fitur seleksi MK kombinasi untuk angkatan 2002/2003 1
Akurasi (%) 2
3
Rataan (%)
Percobaan I Percobaan II
77.80 66.70
68.42 57.89
38.89 55.56
61.70 60.04
Percobaan III Percobaan IV
55.70 66.70
63.15 57.90
50.00 50.00
56.24 58.19
Percobaan
Keterangan : 1 Percobaan I adalah kombinasi antara fitur MK Fisika II dengan Pengenalan Komputer. 2 Percobaan II adalah kombinasi antara fitur MK Fisika II dengan Kalkulus. 3 Percobaan III adalah kombinasi antara fitur MK Pengenalan Komputer dengan Kalkulus. 4 Percobaan IV adalah kombinasi antara ketiga fitur MK.
KESIMPULAN DAN SARAN Kesimpulan Pada mata kuliah Sosiologi Umum, hasil pengamatan menunjukkan bahwa mahasiswa jurusan Ilmu Komputer sangat sulit mendapatkan nilai A. Untuk mata kuliah Sistem Berkas dan Matematika Diskret, kelas dengan selang 2.00≤IPK<2.50 selalu mendapatkan untuk nilai A, dan tidak ada instance (mahasiswa) yang mendapatkan vote untuk nilai D. Rata-rata akurasi tertinggi pada angkatan 2001/2002 didapatkan melalui kombinasi antara fitur mata kuliah Fisika II, Kalkulus dan IP TPB. Rata-rata akurasi yang dihasilkan oleh Algoritma VFI5 pada pengujian dengan memakai ketiga fitur tersebut adalah 70.61%. Hal tersebut tidak berlaku untuk data angkatan 2002/2003, karena rata-rata akurasi yang dihasilkan sebesar 60.03%. Persamaan antara data angkatan 2001/2002 dengan angkatan 2002/2003 adalah rata-rata akurasi tertinggi untuk pengujian setiap fitur terdapat pada MK Fisika II. Ratarata akurasi fitur Fisika II pada angkatan 2001/2002 sebesar 65.35%, sedangkan data angkatan 2002/2003 sebesar 65.39%. Hasil penelitian ini akan lebih bermanfaat ketika proses penjurusan mahasiswa TPB, sehingga jurusan Ilmu Komputer dapat mempertimbangkan seorang mahasiswa untuk masuk jurusan Ilmu Komputer dengan melihat nilai mata kuliah Fisika dan Kalkulus beserta IP TPB.
14
Saran Beberapa saran untuk penelitian selanjutnya adalah : 1 Penelitian berikutnya dapat menggunakan Algoritma JST Propagasi Balik, sehingga didapatkan nilai IPK yang bukan berupa kelas. 2 Penelitian berikutnya mencoba mencari bobot yang tepat untuk fitur IP TPB dan juga bobot fitur mata kuliah yang lainnya.
DAFTAR PUSTAKA Demiröz G. 1997. Non-Incremental Classification Learning Algorithms Based on Voting Feature Intervals. http://www.cs.bilkent.edu.tr/tech-reports/ 1997/BU-CEIS-9715.ps.gz Demiröz G, Güvenir HA. 1997. Classification by Voting Feature Intervals. http://www.cs.bilkent.edu.tr/tech-reports/ 1997/BU-CEIS-9708.ps.z. Güvenir HA. 1998. A Classification Learning Algorithm Robust to Irrelevant Features. http://www.cs.bilkent.edu.tr/tech-reports/ 1998/BU-CEIS-9810.ps.gz. Güvenir HA, Demiröz G, İlter N. 1998. Learning Differential Diagnosis of Erythemato-Squamous Diseases using Voting Feature Intervals. Artificial Intelligence in Medicine, 13 (3), 147-165. Güvenir HA, Emeksiz N. 2000. An Expert System for the Differential Diagnosis of Erythemato-Squamous Diseases. Expert Systems with Applications, Vol. 18, No. 1, (2000), hlm 43-49. Han J, Kamber M. 2001. Data Mining Concepts & Techniques. USA : Academic Press [IPB] Institut Pertanian Bogor. 2003. Panduan Pendidikan Program Sarjana IPB. Edisi Tahun 2003. Bogor : IPB. Sarle W. 2004. What are cross-validation and bootstrapping?. http://www.faqs.org/faqs/ ai-faq/neural-nets/part3/section-12.html [Maret 2006].
LAMPIRAN
16
Lampiran 1 Daftar mata kuliah wajib masa program TPB No. Kode SKS Mata Kuliah 1. MKU 111 3(2-2) Pendidikan Agama Islam 2. MKU 112 2(2-0) Pendidikan Agama Protestan 3. MKU 113 2(2-0) Pendidikan Agama Katolik 4. MKU 114 3(2-2) Pendidikan Agama Hindu 5. MKU 115 3(2-2) Pendidikan Agama Budha 6. IPB 100 1(1-0) Pengantar Ilmu Pertanian 7. MKU 131 2(2-0) Bahasa Indonesia 8. MKU 141 3(2-3) Bahasa Inggris 9. MKU 121 3(2-2) Pendidikan Pancasila dan Kewarganegaraan 10. MKU 151 1(0-2) Olahraga dan Seni Jumlah 12 SKS
Kode PS Asal Baru A00 A343 A01 A341 A02 A342 A04 A241 A05 A541 A06 A441 A07 A141 A08 A143 A09 A142 A10 A344 B01 B041 C01 C141 C02 C241 C03 C341 C04 C441 C05 C541 C06 C641 D01 D141 D02 D241 D03 D341 D04 D142 E01 E141 E02 E241 E03 E341 E04 E142 F01 F141 F02 F241 F03 F341 G01 G442 G02 G241 G03 G141 G04 G341 G05 G541 G06 G641 G07 G741 G08 G441 H01 H141 H02 H241
Mata Kuliah AG BA BB Program Studi\Kredit 2 3 3 Holtikultura 1 2 ● Agronomi 1 2 ● Arsitektur Lansekap 1 2 ● Ilmu Tanah 1 2 ● Gizi Masyarakat & Sd Manusia 2 1 ● Ilmu Hama & Penyakit Tumbuhan 2 2 ● Manajemen Agribisnis 2 ● 1 Ekonomi Pertanian & Sumberdaya 2 ● 1 Komunikasi & Pengembangan M. 2 ● 2 Pemuliaan Tanaman & Tekben 1 ● 2 Kedokteran Hewan 1 ● ● Budidaya Perairan 1 ● 2 Manaj. Sd & Lingkungan Perairan 1 2 ● Teknologi Hasil Perikanan 1 2 ● Sosek Perikanan 1 ● 2 Pemanfaatan Sd Perikanan 1 2 ● Ilmu Kelautan 1 2 ● Teknologi Produksi Peternakan 1 2 ● Ilmu Nutrisi & Makanan Ternak 1 2 ● Sosek Peternakan 1 ● 2 Teknologi Hasil Ternak 1 ● ● Manajemen Hutan 2 1 ● Teknologi Hasil Hutan 2 1 ● Konservasi Sumberdaya Hutan 2 1 ● Budidaya Hutan 2 1 ● Teknik Pertanian 2 1 ● Teknologi Pangan 2 1 ● Teknologi Industri Pertanian 2 1 ● Kimia 2 1 ● Meteorologi 2 1 ● Statistika 2 1 ● Biologi 2 1 ● Matematika 2 1 ● Ilmu Komputer 2 ● ● Fisika 2 1 ● Biokimia 1 2 ● Ekonomi Pembangunan 2 ● 1 Manajemen 2 ● 1 E1 = Ekonomi Dasar I Keterangan : E2 = Ekonomi Dasar II AG = Agama F1 = Fisika Dasar I BA = Biologi A F2 = Fisika Dasar II BB = Biologi B FA = Fisika Umum A BH = Biologi Hewan FB = Fisika Umum B EU = Ekonomi Umum I1 = Bahasa Inggris I
BH 3 ● ● ● ● ● ● ● ● ● ● 1 ● ● ● ● ● ● 1 ● ● 1 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
E1 3 ● ● ● ● ● ● 1 1 ● ● ● ● ● ● 1 ● ● ● ● 1 ● ● ● ● ● ● ● ● ● ● 1 ● 1 ● ● ● 1 1
E2 3 ● ● ● ● ● ● 2 2 ● ● ● ● ● ● 2 ● ● ● ● 2 ● ● ● ● ● ● ● ● ● ● 2 ● 2 ● ● ● 1 1
EU F1 F2 FA FB 3 3 3 3 4 2 ● ● 1 ● 2 ● ● 1 ● 2 1 2 ● ● 2 ● ● ● 1 1 ● ● 2 ● 2 ● ● 1 ● ● ● ● 2 ● ● ● ● 2 ● 1 ● ● 2 ● 2 ● ● 1 ● 4 ● ● 1 ● 2 ● ● 1 ● 2 ● ● ● 1 2 ● ● ● 1 ● ● ● 2 ● 2 1 2 ● ● 3 1 2 ● ● 2 ● ● 2 ● 2 ● ● 1 ● ● ● ● 2 ● 2 ● ● 2 ● 1 ● ● 2 ● 1 ● ● 2 ● 1 ● ● 2 ● 1 ● ● 2 ● 1 ● ● ● 2 1 ● ● 2 ● 1 ● ● 2 ● 1 1 2 ● 1 1 1 2 ● ● 1 ● ● ● ● 2 ● ● 1 ● ● 1 2 ● ● 3 1 2 ● ● 4 1 2 ● ● 2 1 2 ● ● ● ● ● 2 ● ● ● ● 2 ● IN =Bahasa Indonesia K1 = Kimia Dasar I K2 = Kimia Dasar II KO = Kimia Organik KU = Kimia Umum PK = Pend. Pancasila Kewarganegaraan
I1 3 1 1 1 1 2 1 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 1 2 2
dan
ID 2 1 1 1 1 2 1 2 2 2 1 2 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 1 2 2
K1 3 1 1 ● 1 1 1 ● ● ● 1 1 1 1 1 ● ● 1 ● 1 ● ● 1 1 1 1 ● 1 1 1 ● ● 1 ● ● 1 1 ● ●
K2 KO KU PK MA 3 3 3 2 3 2 4 ● 1 ● ● 2 ● 1 ● ● ● 1 1 ● 2 ● ● 1 1 2 ● ● 2 1 ● 2 ● 1 1 ● ● 1 2 1 ● ● 1 2 1 ● ● 1 2 ● ● 2 ● 1 ● ● 2 ● 1 ● ● ● ● 1 ● ● 2 ● 1 ● 2 ● ● 1 ● ● ● 1 1 ● ● ● 1 1 ● ● 2 ● 1 ● ● ● 1 1 ● 2 ● ● 1 ● ● ● 1 1 ● ● ● 1 1 ● ● ● ● 2 1 ● ● ● 2 1 ● ● ● 2 1 ● ● ● 2 1 ● ● 1 1 1 2 3 ● 2 1 2 ● ● 2 1 2 ● ● 2 1 ● ● 1 2 1 ● ● 1 2 1 ● 2 ● 3 ● ● ● 1 2 1 ● ● 1 2 1 2 ● ● 2 1 2 ● ● 1 1 ● ● 1 2 1 ● ● 1 2 1 MA = Matematika Dasar MB = Pengantar Matematika KA = Kalkulus I KB = Kalkulus OS = Olahraga dan Seni IP = Pengantar Ilmu Pertanian SU = Sosiologi Umum
*Sumber : IPB Press “Panduan Program Sarjana” edisi 2003, halaman 63-64, Tabel 6.2 Matriks Pengambilan Mata Kuliah pada Program TPB-IPB Kurikulum 2002
MB 3 1 1 1 ● ● ● ● ● 1 1 1 1 1 1 1 1 1 1 1 1 1 ● ● ● ● ● ● ● ● ● ● 1 ● ● ● ● ● ●
KA KB OS IP SU 3 3 1 1 3 ● 2 1 2 2 ● 2 1 2 2 ● 2 1 2 2 2 ● 2 2 2 2 ● 1 1 1 2 ● 2 2 2 2 ● 1 1 1 2 ● 1 1 1 ● 2 2 1 1 ● 2 2 2 2 ● 2 2 2 2 ● 2 2 2 2 ● 2 2 2 2 ● 2 2 2 2 ● 2 2 2 2 ● 2 1 2 2 ● 2 1 2 2 ● 2 2 2 2 ● 2 1 2 2 ● 2 2 2 2 ● 2 2 2 2 2 ● 2 1 1 2 ● 2 1 1 2 ● 2 1 1 2 ● 2 1 1 2 ● 2 1 1 2 ● 1 1 1 2 ● 1 1 1 2 ● 1 1 1 2 ● 2 1 1 2 ● 2 1 1 ● 2 1 2 2 2 ● 1 1 1 2 ● 1 1 1 2 ● 1 1 3 2 ● 1 2 2 2 ● 1 1 1 2 ● 1 1 1 1 = diambil pada semester 1 2 = diambil pada semester 2 ● = dst diambil melalui fakultas
KELAS MK
2.00≤IPK<2.50 A
B
C
0.052
0.159
0.500
Fis 1
0
0.060
Fis 2
0.070 0
2.50≤IPK<3.00 E
A
B
C
E
A
B
C
1
0
0.154
0.377
0.295
0
0
0.285
0.291
0.205
0
0
0.508
0.173
0
0
0
0.399
0
0
0
0.178
0.334
0
0
0.387
0.371
0.159
0
0
0.613
0.391
0.108
0
0
0.196
0.835
0
0
0.041
0.125
0.819
1
0
0.228
0.367
0.165
0
0
0.432
0.224
0
0
0
0.456
0.213
0
0
0
0.371
0.181
0
0
0.353
0.300
0
0
0
0.419
0.204
0
0
0
0.105
0.069
0.346
1
0
0.124
0.163
0.364
0
0
0.430
0.094
0.290
0
0
0.341
0.673
0
0
0
0
0.208
0.690
0
0
0.136
0.328
0.175
0
0
0.367
0.238
0.135
0
0
0.498
0.226
0
0
0
MatDas
0.153
0.135
0.366
1
0
0.181
0.212
0.433
0
0
0.418
0.215
0.201
0
0
0.248
0.438
0
0
0
Kalkulus
0.087
0.143
0.291
0.745
0
0
0.170
0.382
0
0
0.060
0.687
0.221
0.255
0
0.853
0
0.105
0
0
PIP
0.207
0.247
0.281
0
0
0.367
0.243
0.222
0
0
0.425
0.244
0.192
0
0
0
0.267
0.305
0
0
PA
0.049
0.385
0
0
0
0.233
0.247
1
0
0
0.236
0.264
0
0
0
0.481
0.104
0
0
0
PK
0.096
0.314
0.772
0
0
0.171
0.309
0.228
0
0
0.264
0.263
0
0
0
0.469
0.113
0
0
0
B. Ind
0.081
0.359
0.452
0
0
0.119
0.297
0.445
0
0
0.276
0.344
0.103
0
0
0.524
0
0
0
0
B. Ing
0.162
0.379
0.560
0
0
0.208
0.448
0.248
0
0
0.278
0.173
0.192
0
0
0.352
0
0
0
0
OR
0.174
0.343
0
0
0
0.289
0.203
0
0
0
0.310
0.176
0
0
0
0.227
0.279
0
0
0
0
0.063
0.481
0.835
0
0
0.205
0.355
0.165
0
0
0.323
0.164
0
0
0
0.409
0
0
0
Bio
KimUm Algor PengKom
SosUm
D
3.50≤IPK≤4.00
3.00≤IPK<3.50 D
D
E
A
B
C
D
E
KELAS MK
2.00≤IPK<2.50 A
B
C
2.50≤IPK<3.00 D
E
A
B
C
3.50≤IPK≤4.00
3.00≤IPK<3.50 D
E
A
B
C
D
E
A
B
C
D
E
ElDas RaDig
0
0.152
0.483
1
0
0.043
0.300
0.393
0
0
0.249
0.382
0.124
0
0
0.708
0.165
P. Logika
0
0.076
0.442
0.835
0
0.119
0.361
0.290
0.165
0
0.229
0.314
0.269
0
0
0.652
Kalkulus II
0
0
0.224
1
0
0.463
0.113
0.375
0
0
0.537
0.263
0.281
0
0
0
0.041
0.376
0.835
0
0
0.121
0.395
0.165
0
0
0.307
0.229
0
0
0
EkUm
0
0.186
0.756
0
0
0.155
0.495
0.244
0
0
0.359
0.319
0
0
AlLin
0
0
0.481
1
0
0.086
0.354
0.355
0
0
0.200
0.451
0.164
BasProg
0
0
0.305
0.439
1
0
0.045
0.400
0.086
0
1
0.465
TBO
0
0.145
0.574
1
0
0.040
0.343
0.339
0
0
0.515
StrukDat
0
0.087
0.341
1
0
0
0.129
0.381
0
0
1
MatDis
OrKom
0
0
0
0.248
0
0
0
0.624
0.121
0
0
0.531
0
0
0
0
0
0.487
0
0
0
0
0
0
0.713
0.195
0
0
0
0.185
0
0
0
0.491
0.110
0.475
0
0.198
0.087
0
0
0.445
0.314
0
0
0
0.358
0.156
0
0
0
0.425
0.123
0
0
0
0.056
0.243
0.676
0
0.100
0.232
0.466
0.050
0
0.348
0.346
0.291
0
0
0.551
0.365
0
0.274
0
0.131
0.153
0.658
0
0
0.039
0.362
0.278
0
0
0.404
0.236
0.064
0
0
0.426
0.249
0
0
0
B. Ing II
0
0.164
0.508
0.702
0
0.038
0.387
0.343
0.138
0
0.131
0.449
0.149
0.160
0
0.831
0
0
0
0
PHP
0
0.082
0.383
0.772
0
0
0.146
0.407
0.228
0
0.123
0.506
0.210
0
0
0.877
0.267
0
0
0
MetStat
0
0.166
0.645
0
0
0.064
0.426
0.267
0
0
0.408
0.228
0.088
0
0
0.528
0.180
0
0
0
SisBer
KELAS MK
2.00≤IPK<2.50 A
B
C
D
2.50≤IPK<3.00 E
3.50≤IPK≤4.00
3.00≤IPK<3.50
A
B
C
D
E
A
B
C
D
E
A
B
C
D
E
Bio
0
0.278
0.671
0.844
0
0.064
0.490
0.249
0.156
0
0.358
0.232
0.080
0
0
0.578
0
0
0
0
Fis 1
0
0.123
0.342
0
0
0
0.114
0.332
0
0
0
0.147
0.326
0
0
0
0.616
0
0
0
Fis 2
0
0.195
0.308
0
0
0
0.108
0.399
0
0
0
0.209
0.293
0
0
0
0.488
0
0
0
KimUm
0
0.215
0.690
0
0
0.175
0.299
0.255
0
0
0.300
0.307
0.055
0
0
0.525
0.179
0
0
0
Algor
0.125
0.407
0.315
0
0
0.162
0.302
0.311
0
0
0.297
0.291
0.200
0
0
0.416
0
0.175
0
0
PengKom
0.167
0
0.394
0
0
0.155
0.384
0.255
0
0
0.120
0.616
0.187
0
0
0.558
0
0.164
0
0
MatDas
0
0.215
0.665
0
0
0.159
0.478
0.216
0
0
0.306
0.307
0.119
0
0
0.535
0
0
0
0
Kalkulus
0
0.170
0.466
0
0
0.069
0.221
0.367
1
0
0.310
0.325
0.167
0
0
0.621
0.284
0
0
0
PIP
0.280
0.239
0.272
0
0
0.052
0.250
0.403
0
0
0.200
0.246
0.324
0
0
0.467
0.265
0
0
0
PA
0
0.354
0.462
0
0
0.198
0.246
0.428
0
0
0.292
0.253
0.110
0
0
0.510
0.147
0
0
0
PK
0.115
0.365
0
0
0
0.171
0.287
1
0
0
0.137
0.348
0
0
0
0.577
0
0
0
0
B. Ind
0
0.130
0.400
0
0
0.080
0.217
0.315
0
0
0.205
0.217
0.286
0
0
0.716
0.435
0
0
0
B. Ing
0
0.292
0.536
0
0
0.245
0.325
0.166
0
0
0.315
0.383
0
0
0
0.441
0
0.298
0
0
0.270
0
0
0
0
0.230
0.509
0
0
0
0.231
0.491
0
0
0
0.270
0
0
0
0
0
0.086
0.416
1
0
1
0.175
0.385
0
0
0
0.308
0.198
0
0
0
0.431
0
0
0
OR SosUm
KELAS MK
2.00≤IPK<2.50 A
B
C
2.50≤IPK<3.00 D
E
A
B
C
3.50≤IPK<4.00
3.00≤IPK<3.50 D
E
A
B
C
D
E
A
B
C
D
E
ElDas RaDig
0
0
0.700
0
0
0.082
0.685
0.233
0
0
0.367
0.315
0.067
0
0
0.551
0
0
0
0
P. Logika
0
0.189
0.421
0
0
0.122
0.315
0.429
1
0
0.220
0.496
0.150
0
0
0.659
0
0
0
0
KalkulusII
0
0.228
0.328
1
0
0.049
0.338
0.516
0
0
0.285
0.434
0.156
0
0
0.665
0
0
0
0
0.195
0.166
0.538
0
0
0.108
0.399
0.398
0
0
0.209
0.435
0.064
0
0
0.488
0
0
0
0
EkUm
0
0.517
0.293
1
0
0.076
0.319
0.707
0
0
0.414
0.164
0
0
0
0.511
0
0
0
0
AlLin
0
0.151
0.361
0.844
0
0.143
0.308
0.267
0.156
0
0.429
0.288
0.172
0
0
0.429
0.252
0.200
0
0
BasProg
0
0
0.373
0.915
0
0.080
0.199
0.391
0.085
0
0.205
0.352
0.237
0
0
0.716
0.448
0
0
0
TBO
0
0.134
0.391
0.915
0
0
0.323
0.470
0.085
0
0.364
0.319
0.139
0
0
0.636
0.224
0
0
0
StrukDat
0
0
0.649
0
0
0.100
0.329
0.289
0
0
0.300
0.424
0.062
0
0
0.600
0.247
0
0
0
MatDis
OrKom
0
0
0.616
0
0
0.066
0.250
0.296
1
0
0.340
0.375
0.088
0
0
0.594
0.375
0
0
0
0.156
0.225
0.730
0
0
0.101
0.667
0.270
0
0
0.353
0.107
0
0
0
0.390
0
0
0
0
B. Ing II
0
0.188
0.671
0.844
0
0.178
0.296
0.249
0.156
0
0.183
0.359
0.080
0
0
0.640
0.157
0
0
0
PHP
0
0.177
0.592
0
0
0.100
0.360
0.302
1
0
0.225
0.463
0.106
0
0
0.675
0
0
0
0
MetStat
0
0.322
0.462
1
0
0.044
0.448
0.428
0
0
0.366
0.230
0.110
0
0
0.591
0
0
0
0
SisBer
22
Lampiran 7 Akurasi fitur seleksi kombinasi awal untuk angkatan 2001/2002 Percobaan
Akurasi (%)
Rataan (%)
1
2
3
Percobaan I
61.1111
47.3684
27.7778
45.4191
Percobaan II
61.1111
57.8947
27.7778
48.9278
Percobaan III
66.6667
68.4211
33.3333
56.1403
Percobaan IV
61.1111
63.1579
50.0000
58.0896
Percobaan V
55.5556
63.1579
61.1111
59.9415
Percobaan VI
66.6667
57.8947
38.8889
54.4834
Percobaan VII
72.2222
57.8947
55.5556
61.8908
Percobaan VIII
61.1111
63.1579
61.1111
61.7933
Percobaan IX
55.5556
57.8947
50.0000
54.4834
Percobaan X
44.4444
36.8421
16.6667
32.6510
Percobaan XI
66.6667
63.1579
61.1111
63.6452
Percobaan XII
66.6667
57.8947
44.4444
56.3352
Keterangan: 1 Percobaan I Fitur-fitur yang dipakai adalah Fisika I, Fisika II, Algoritma dan Pemrograman, Matematika Dasar, Kalkulus, B. Inggris, Pengenalan Komputer. 2 Percobaan II Fitur-fitur yang dipakai adalah Fisika I, Fisika II, Algoritma dan Pemrograman, Matematika Dasar, Kalkulus, B. Inggris, Pengenalan Komputer. 3 Percobaan III Fitur-fitur yang dipakai adalah Fisika I, Fisika II, Algoritma dan Pemrograman, Matematika Dasar, Kalkulus, B. Inggris 4 Percobaan IV Fitur-fitur yang dipakai adalah Fisika I, Algoritma dan Pemrograman, Matematika Dasar, Kalkulus, Pengenalan Komputer. 5 Percobaan V Fitur-fitur yang dipakai adalah Algoritma dan Pemrograman, Matematika Dasar, Kalkulus, Pengenalan Komputer. 6 Percobaan VI Fitur-fitur yang dipakai adalah Fisika II, Kalkulus, B. Inggris, Pengenalan Komputer. 7 Percobaan VII Fitur-fitur yang dipakai adalah Fisika II, Kalkulus, B. Inggris 8 Percobaan VIII Fitur-fitur yang dipakai adalah Matematika Dasar, Kalkulus 9 Percobaan IX Fitur-fitur yang dipakai adalah Algoritma dan Pemrograman, Kalkulus 10 Percobaan X Fitur-fitur yang dipakai adalah Fisika I, Fisika II, Algoritma dan Pemrograman, Matematika Dasar, Kalkulus, B. Inggris, dan tanpa IP TPB 11 Percobaan XI Fitur-fitur yang dipakai adalah Fisika II, Matematika Dasar, Kalkulus 12 Percobaan XII Fitur-fitur yang dipakai adalah Fisika II, Matematika Dasar, Kalkulus, Pengenalan Komputer.