JURNAL INFORMATIKA HAMZANWADI Vol. 2 No. 1, Mei 2017, hal. 48-62
ISSN: 2527 - 6069
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM INFORMASI AKADEMIK SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN HAMZANWADI SELONG Muhammad Khairul Rizal1, Suhartini2, Jagat Sugiantara3 1,2,3 Universitas Hamzanwadi
[email protected] ABSTRACT Development of Information Technology (IT) has provided the means for universities to improve the quality of service to its academic community. IT supported information system that can provide added value to each college if it is designed to be an information system that is effective and efficient. Effective use of information systems and efficient indicates that the system can support the achievement of the vision and mission of the college [1]. Classification technique is one of data mining techniques including supervised learning. Supervised learning means the process of establishing a correspondence (function) using a training dataset, seen as a "past experience" from a model. The goal is to predict from a value (output) of a function to each new object (input) after completing the training process [2]. C4.5 is one method used to induce a decision tree that was discovered by J. Ross Quinlan. This algorithm is derived from the popular ID3 algorithm used in making the decision tree. C4.5 is suitable algorithms used to classify large amounts of data into a certain class of classes based on the pattern of the existing data [3]. From the results of tests performed, both confusion matrix and ROC Curve proven that the results of tests performed C4.5 algorithm has an accuracy value of 98.18%. From the research that the role of the C4.5 algorithm is able to predict the level of student satisfaction of the Academic Information Systems College of Teacher Training and Education Hamzanwadi Selong. Keywords: The information system, Academic Information System (SIAKAD), Algorithms C.45
PENDAHULUAN Seiring dengan perkembangan teknologi informasi yang semakin pesat, keberadaan sistem informasi untuk mendukung kegiatan operasional suatu organisasi baik didalam organisasi bisnis, institusi pendidikan maupun institusi pemerintahan berkembang menjadi kebutuhan yang mendasar dan memegang peranan penting. Dalam dunia usaha, sistem informasi tersebut sudah menjadi hal umum untuk dipergunakan sebagai penunjang bisnis dalam kegiatan operasional maupun kegiatan yang bersifat strategis [4]. Dalam dunia pendidikan, keberadaan sistem informasi merupakan salah satu komponen yang tidak dapat dipisahkan dari aktivitas pendidikan itu sendiri. Keterbukaan pendidikan dan permintaan mahasiswa atau orang tua untuk mendapatkan pelayanan yang lebih baik, menyebabkan pihak manajemen perguruan tinggi berusaha terus meningkatkan efisiensi dan
48
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
efektifitas pengelolaan perguruan tinggi, baik dengan jalan pengembangan SDM, manajemen mutu (ISO) ataupun pengembangan sistem informasi [4]. Perkembangan Teknologi Informasi (TI) telah memberikan berbagai sarana bagi perguruan tinggi untuk meningkatkan kualitas pelayanan terhadap sivitas akademiknya. Sistem informasi yang didukung TI dapat memberikan nilai tambah bagi setiap perguruan tinggi jika didesain menjadi suatu sistem informasi yang efektif dan efisien. Penggunaan sistem informasi yang efektif dan efisien menandakan bahwa sistem tersebut dapat mendukung tercapainya Visi dan Misi perguruan tinggi tersebut [1]. Perguruan tinggi swasta yang cukup tua di Indonesia bagian timur ini adalah Sekolah Tinggi Keguruan dan Ilmu Pendidikan (STKIP) Hamzanwadi Selong yang telah berdiri sejak tahun 1972. Saat ini STKIP Hamzanwadi Selong terdiri dari 15 program studi dengan 11 program studi sudah terakreditasi dan empat program studi mendapatkan izin penyelenggaran dengan jumlah mahasiswa yang aktif sekitar 5000 orang. Sistem informasi yang dimiliki saat ini masih dirasakan belum optimal meskipun sudah terintegrasi dengan beberapa departemen yang ada. Sudah saatnya perguruan tinggi tersebut memiliki penataan sistem informasi terintegrasi yang baik agar proses bisnis yang ada tetap berjalan dengan mengedepankan pelayanan yang optimal kepada mahasiswa. Sistem informasi yang dimiliki oleh STKIP Hamzanwadi Selong saat ini yaitu Sistem Informasi Akademik (SIAKAD) dengan aplikasi yang terdiri atas Sistem Informasi Akademik Mahasiswa (SIAM), Sistem Informasi Monitoring Akademik (SIMA), Sistem Registrasi Akademik (SIRAK), perpustakaan digital (Digital Library), Sistem Penerimaan Mahasiswa Baru (SPMB), Sistem Informasi Keuangan (SIMKEU), Sistem Informasi Wisuda dan sistem lainnya yang belum pernah di lakukan evaluasi, sehingga belum dapat di ketahui sejauh mana sistemsistem tersebut sudah berjalan dan memberikan kontribusi terhadap lembaga. Permasalahan tersebut dapat diselesaikan dengan menggunakan metode data mining. Teknik klasifikasi adalah salah satu dari teknik data mining yang termasuk supervised learning. Supervised learning artinya proses pembentukan sebuah korespondensi (fungsi) menggunakan sebuah training dataset, dilihat sebagai sebuah "pengalaman masa lalu" dari sebuah model. Tujuannya adalah untuk memprediksi dari sebuah nilai (output) dari sebuah fungsi untuk setiap objek baru (input) setelah menyelesaikan proses training [2].
49
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya kedalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan utama yang dilakukan yaitu pembangunan model sebagai prototype untuk disimpan sebagai memori dan penggunaan model tersebut untuk melakukan pengenalan/klasifikasi/prediksi pada unsur objek data lain agar diketahui di kelas mana objek data tersebut dalam model yang sudah disimpannya [5]. Ada beberapa algoritma klasifikasi data mining yang dapat digunakan untuk strategi dalam pengajaran seperti yang ditulis oleh Sergio Moro dan Raul M.S. Laureano diantaranya Naïve Bayes (NB), Decision Trees (DT) dan Support Vector Machines (SVM) [6]. C4.5 merupakan salah satu metode yang digunakan untuk menginduksi pohon keputusan yang ditemukan oleh J. Ross Quinlan. Algoritma ini diturunkan dari algoritma ID3 yang populer digunakan dalam membuat pohon keputusan. C4.5 merupakan algoritma yang cocok digunakan untuk mengklasifikasi data dalam jumlah besar kedalam kelas kelas tertentu berdasarkan pola data yang ada [3]. Di dalam data mining dan machine learning C4.5 digunakan untuk mempelajari data dalam jumlah besar, membuat model pembelajaran berupa pohon keputusan yang dapat diterapkan untuk memprediksi data yang belum muncul. Mengklasifikasikan data kuesioner evaluasi Sistem Informasi Akademik secara cepat, tepat, dan komperhensip, serta Algoritma c4.5 merupakan suatu metode pengolahan data yang dapat dapat memberikan pemahaman kepada pimpinan tentang kualitas Sistem Informasi Akademik Sekolah Tinggi Keguruan dan Ilmu Pendidikan Hamzanwadi Selong. Hasil dari pengolahan data menggunakan c4.5 dan dijadikan penilaian dan pengukuran tingkat kepuasan mahasiswa terhadap Sistem Informasi Akademik yang ada. Berdasarkan uraian tersebut di atas, maka penelitian diberi judul “Prediksi Tingkat Kepuasan Mahasiswa Terhadap Sistem Informasi Akademik Sekolah Tinggi Keguruan dan Ilmu Pendidikan Hamzanwadi Selong Menggunakan Algoritma C.45”.
Sistem Informasi Akademik (SIAKAD) Sistem Informasi Akademik (SIAKAD) STKIP Hamzanwadi Selong merupakan sistem yang secara manajemen terintegrasi antara satu unit dengan unit yang lainnya. Sistem ini dapat di akses
melalui
alamat
http://www.hamzanwadi.ac.id
atau
www.siakad.hamzanwadi.ac.id
SIAKAD dikembangkan pertama kali tahun 2012 dengan modifikasi yang sudah dilakukan lebih dari empat kali modifikasi. Rekayasa ulang yang pernah dilakukan disebabkan karena perubahan 50
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
kebijakan dari lembaga. Efisiensi, efektifitas dan persaingan untuk memberikan pelayanan yang baik kebapada seluruh civitas akademik merupakan salah satu alasan SIAKAD di kembangkan, hingga saat ini SIAKAD sudah memiliki 8 aplikasi diantaranya sebagai berikut. 1. Super User Sistem informasi Super User merupakan sistem informasi yang hanya dapat di akses oleh administrator lembaga. Sistem ini memiliki fungsi yang sangat vital terhadap sistem yang lainnya. Segala kegiatan yang didasarkan pada kalender akademik diatur pada sistem ini, selain itu sistem ini juga mengatur penggunaan sistem yang lain di SIAKAD. Pengelolaan Super User oleh Administrator harus mendapatkan ijin oleh kepala pusat Teknologi Informasi dan Komunikasi (TIK) lembaga, mengingat sistem ini memegang kendali seluruh sistem yang ada. 2. Sistem Informasi Penerimaan Mahasiswa Baru (SPMB) Sistem Informasi Penerimaan Mahasiswa Baru (SPMB) merupakan sistem seleksi penerimaan mahasiswa. Sistem ini mengelompokkan mahasiswa melalui beberapa jalur penerimaan yaitu, jalur undangan dan jalur tes 3. Sistem Informasi Keuangan (SIKU) Sistem Informasi Keuangan (SIKU) merupakan sistem informasi menghubungkan sistem keuangan lembaga, Bank dan Mahasiswa. SIKU memiliki berbagai fitur di antaranya adalah, Neraca (Master Biaya, Paket Tagihan dan pengiriman tagihan), Tagihan (Data Tagihan dan Validasi Tagihan Lainnya), Validasi (Tagihan Mahasiswa, Status Mahasiswa), Laporan (Status Tagihan, Laporan Transaksi, Neraca, Lihat Tagihan Belum Bayar, Total Master Biaya) dan Koreksi. Sistem keuangan merupakan kunci utama mahasiswa untuk dapat melakukan kegiatan selama studi, jika mahasiswa memiliki status registrasi tidak aktif, maka mahasiswa tidak dapat menginputkan KRS dan lain sebagainya. Hal ini akan menyebabkan mahasiswa dianggap tidak menempuh kegiatan akademik dan akan di masukkan dalam kategori cuti. 4. Sistem Informasi Registrasi Akademik (SIRAK) Sistem Registrasi Akademik (SIRAK) merupakan cerminan dari manajemen akademik dalam lembaga, hal itu sebabkan karena segala sesuatu yang menjadi inti pelayanan ada pada bagian SIRAK seperti kurikulum yang diterapkan, penerapan kalender akademik, penilaian dan lain sebagainya. SIRAK dikelola oleh bagian akademik dan program studi, pengelolaan tersebut 51
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
dipisahkan karena masing-masing memiliki tugas dan fungsi yang berbeda sesui dengan Tugas Pokok dan Fungsi (TUPOKSI) yang telah disahkan oleh lembaga. 5. Sistem Informasi Pelaporan (SIMPEL) Penerapan sistem informasi yang baik dan dapat dikatakan tidak gagal adalah dapat dilihat dari pejabat (Decision Maker) yang membuat kewanangan dapat membuat keputusan yang tepat berdasarkan sistem informasi. Sistem Informasi Pelaporan (SIMPEL) dalam hal ini memegang fungsi kearah yang telah ditetapkan yaitu, menyajikan data kepada pejabat baik tentang kemahasiswaan, keuangan maupun kepegawaian, sehingga para pembuat keputusan dapat mengambil kebijakan yang tepat sesuai dengan data yang disajikan. 6. Sistem Informasi Perpustakaan Digital (Digital Library) Kemudahan pencarian sumber pustaka merupakan salah satu kebutuhan mahasiswa yang harus dipenuhi oleh setiap lembaga pendidikan. Meskipun saat ini pencarian sumber pustaka dapat melalui berbagai media, namun pencarian dalam sumber pustakan dalam lingkup internal dengan informasi yang spesifik seperti jumlah buku yang tersedia, letak buku, dan informasi rinci lainnya dapat sangat membantu mahasiswa. Untuk memenuhi kebutuhan ini, sistem informasi perpustakaan digital (Digital Library) mampu menyediakan informasi kepada mahasiswa secara akurat dan cepat. 7. Sistem Informasi Wisuda (SIDA) Sistem Informasi Wisuda (SIDA), dikelola oleh bagian akademik. Sistem ini menyajikan data mahasiswa yang sudah melengkapi syarat untuk diwisuda. Kelengkapan data ini nantinya akan di unduh untuk kemudian di buatkan buku wisuda atau dalam bentuk Compact Disk (CD) sesuai dengan kepentingan lembaga, yang akan diserahkan pada saat mahasiswa di wisuda. 8. Sistem Informasi Akademik Mahasiswa (SIAM) Sistem ini merupakan sistem informasi yang kelola langsung oleh mahasiswa, sistem ini sangat penting bagi mahasiswa untuk mengetahui segala transaksi akademik selama mahasiswa melakukan studi. Selain itu sistem ini juga memberikan informasi kepada mahasiswa mengenai biaya studi yang akan dikenakan setiap semesternya. Uraian secara jelas mengenai SIAM adalah sebagai berikut. SIAKAD dapat diakses dengan alamat http://siakad.hamzanwadi.ac.id/ sehingga akan muncul tampilan seperti pada Gambar 2.1. 52
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Gambar 2. 1 Halaman Depan SIAKAD Setelah Mahasiswa mengakses alamat tersebut, mahasiswa dapat memilih Login Mahasiswa sehingga akan tampil seperti pada Gambar 2.2.
Algoritma C.45 C4.5 merupakan salah satu metode yang digunakan untuk menginduksi pohon keputusan yang ditemukan oleh J. Ross Quinlan. Algoritma ini diturunkan dari algoritma ID3 yang populer digunakan dalam membuat pohon keputusan. C4.5 merupakan algoritma yang cocok digunakan untuk mengklasifikasi data dalam jumlah besar kedalam kelas kelas tertentu berdasarkan pola data yang ada [17]. Di dalam data mining dan machine learning C4.5 digunakan untuk mempelajari data dalam jumlah besar, membuat model pembelajaran berupa pohon keputusan yang dapat diterapkan untuk memprediksi data yang belum muncul. Beberapa kelebihan dari pohon keputusan [16]: 1. Hasil analisa berupa diagram pohon yang sangat mudah dimengerti. 2. Mudah untuk dibangun, serta membutuhkan data percobaan yang lebih sedikit dibandingkan algoritma klasifikasi lainnya. 3. Mampu mengolah data nominal dan kontinyu. 4. Model yang dihasilkan dapat dengan mudah dimengeri, beberapa teknik klasifikasi yang berbeda seperti neural network menyajikan model dengan informasi logis yang tersirat, sehingga perlu dipelajari. 5. Menggunakan teknik statistik sehingga dapat divalidasikan. 6. Cepat dan handal dalam mengolah dataset besar. 7. Akurasi yang dihasilkan mampu menandingi teknik klasifikasi yang lainnya.
53
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
C4.5 adalah bagian dari algoritma untuk klasifikasi dalam pembelajaran machine learningdan data mining. C4.5 merupakan algoritma yang cocok digunakan untuk masalah klasifikasi pada machine learning dan data mining [17]. C4.5 memetakan atribut dari kelas sehingga dapat digunakan untuk menemukan prediksi terhadap data yang belum muncul. Algoritma C4.5 dan pohon keputusan merupakan dua model yang tak terpisahkan, karena untuk membangun sebuah pohon keputusan, dibutuhan algoritma C4.5. Di akhir tahun 1970 hingga di awal tahun 1980-an, J. Ross Quinlan seorang peneliti di bidang mesin pembelajaran mengembangkan sebuah model pohon keputusan yang dinamakan ID3 (Iterative Dichotomiser), walaupun sebenarnya proyek ini telah dibuat sebelumnya oleh E.B. Hunt, J. Marin, dan P.T. Stone. Kemudian Quinlan membuat algoritma dari pengembangan ID3 yang dinamakan C4.5 yang berbasis supervised learning.
Gambar 2. 2 Model Pohon Keputusan Tahapan dalam membuat sebuah pohon keputusan dengan algoritma C4.5 [16] yaitu: 1. Mempersiapkan data training, dapat diambil dari data histori yang pernah terjadi sebelumnya dan sudah dikelompokan dalam kelas-kelas tertentu. 2. Menentukan akar dari pohon dengan menghitung nilai gain yang tertinggi dari masing-masing atribut atau berdasarkan nilai index entropyterendah. Sebelumnya dihitung terlebih dahulu nilai index entropy, dengan rumus:
(2.1) Keterangan:i = himpunan
m = jumlah partisi i
f(i,j) = proposi j terhadap i
kasus 3. Hitung nilai gain dengan rumus:
(2.1) 54
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Keterangan: P = jumlah partisi atribut
ni = proporsi ni terhadap i
n = jumlah kasus dalam n
Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1: Tabel 1. Keputusan Bermain Tenis
Dalam kasus yang tertera pada Tabel 1, akan dibuat pohon keputusan untuk menentukan main tenis atau tidak dengan melihat keadaan cuaca (outlook), temperatur, kelembaban (humidity) dan keadaan angin (windy). Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera dalam Rumus 2.1. Sedangkan perhitungan nilai entropy dapat dilihat pada rumus 2.2. Berikut ini adalah penjelasan lebih rinci mengenai masing-masing langkah dalam pembentukanpohon keputusan dengan menggunakan algoritma C4.5 untuk menyelesaikan permasalahan. Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No,dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK,TEMPERATURE, HUMIDITY dan WINDY.
55
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
Kerangka Pemikiran Kerangka Teori dapat dilihat pada Gambar dibawah ini Indicator
Propoced Model
Objective
Measurement
Dataset
ROC Curve (AUC)
No Preproning
C 45
Model Acuracy
Information Gain
Confusion Matrix (Accuracy)
K-fold Validation
Gambar 2. 3 Kerangka Pemikiran Penjelasan untuk kerangka pemikiran pada Gambar diatas adalah: Data pelanggan akan diklasifikasikan dengan C4.5 menjadi 2 kelompok, puas dan tidak puas. Pengujian hasil dilakukan dalam 10 langkah(10 folds cross-validation). Hasil penelitian akan diukur dengan menggunakan confusion matrix, dan ROC Curve.
METODE Desain Penelitian Dalam sebuah penelitian, metode yang digunakan untuk memecahkan masalah, diantaranya: mengumpulkan data, merumuskan hipotesis atau proposisi, menguji hipotesis, hasil penafsiran, dan kesimpulan yang dapat dievaluasi secara independen oleh orang lain . Ada empat metode penelitian yang umum digunakan yaitu : Pengumpulan data, pengolahan data, model yang diusulkan, eksperimen dan pengujian, evaluasi dan validasi hasil. Dalam penelitian ini ada beberapa tahapan yang dilakukan seperti pada gambar 3.1.
56
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Pengumpulan Data Pengolahan Awal Data Model/Metode Yang Eksperimen dan Evaluasi dan Validasi Gambar 3. 1 Tahapan Penelitian
HASIL PENELITIAN DAN PEMBAHASAN Pengujian Model dengan 10 Folds Cross Validation Berdasarkan eksperimen yang telah dilakukan dapat dijelaskan sebagai berikut: Tabel 4. 1 Eksperimen mencari nilai Creterion Criterion
MS for S MLS MG MD Conpidence accuracy AUC
gain ratio
4
2
0.1
20
0.25
93.64% 0.695
information_gain
4
2
0.1
20
0.25
94.55% 0.769
gini index
4
2
0.1
20
0.25
94.55% 0.758
accuracy
4
2
0.1
20
0.25
88.59% 0.794
Tabel 4. 2 Eksperimen mencari nilai minimal size for split Criterion
MS for S MLS MG MD Conpidence accuracy AUC
information_gain 1
2
0.1
20
0.25
94.55%
0.769
information_gain 2
2
0.1
20
0.25
94.55%
0.769
information_gain 3
2
0.1
20
0.25
94.55%
0.769
information_gain 4
2
0.1
20
0.25
94.55%
0.769
information_gain 5
2
0.1
20
0.25
94.55%
0.769
information_gain 6
2
0.1
20
0.25
94.55%
0.819
information_gain 7
2
0.1
20
0.25
94.55%
0.869
information_gain 8
2
0.1
20
0.25
94.55%
0.869
57
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
information_gain 9
2
0.1
20
0.25
94.55%
0.869
information_gain 10
2
0.1
20
0.25
94.55%
0.869
Tabel 4. 3 Eksperimen mencari nilai minimal leaf size Criterion
MS for S MLS MG MD Conpidence accuracy AUC
information_gain 7
1
0.1
20
0.25
98.18%
0.743
information_gain 7
2
0.1
20
0.25
94.55%
0.869
information_gain 7
3
0.1
20
0.25
95.91%
0.976
information_gain 7
4
0.1
20
0.25
94.55%
0.951
information_gain 7
5
0.1
20
0.25
92.73%
0.928
information_gain 7
6
0.1
20
0.25
92.68%
0.927
information_gain 7
7
0.1
20
0.25
93.18%
0.925
information_gain 7
8
0.1
20
0.25
93.18%
0.923
information_gain 7
9
0.1
20
0.25
92.73%
0.926
information_gain 7
10
0.1
20
0.25
92.73%
0.926
Tabel 4. 4 Eksperimen mencari nilai Minimal Gain Criterion
MS for S MLS MG MD Conpidence accuracy AUC
information_gain 7
1
0.0
20
0.25
98.18%
0.743
information_gain 7
1
0.1
20
0.25
98.18%
0.743
information_gain 7
1
0.2
20
0.25
98.18%
0.743
information_gain 7
1
0.3
20
0.25
97.73%
0.84
information_gain 7
1
0.4
20
0.25
90.89%
0.936
information_gain 7
1
0.5
20
0.25
79.00%
0.573
information_gain 7
1
0.6
20
0.25
77.19%
0.5
information_gain 7
1
0.7
20
0.25
77.19%
0.5
information_gain 7
1
0.8
20
0.25
77.19%
0.5
information_gain 7
1
0.9
20
0.25
77.19%
0.5
58
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Tabel 4. 5 Eksperimen mencari nilai Maximal Depth Criterion
MS for S MLS MG MD Conpidence accuracy AUC
information_gain 7
1
0.0
10
0.25
98.18%
0.743
information_gain 7
1
0.0
20
0.25
98.18%
0.743
information_gain 7
1
0.0
30
0.25
98.18%
0.743
information_gain 7
1
0.0
40
0.25
98.18%
0.743
information_gain 7
1
0.0
50
0.25
98.18%
0.743
information_gain 7
1
0.0
60
0.25
98.18%
0.743
information_gain 7
1
0.0
70
0.25
98.18%
0.743
information_gain 7
1
0.0
80
0.25
98.18%
0.743
information_gain 7
1
0.0
90
0.25
98.18%
0.743
information_gain 7
1
0.0
100
0.25
98.18%
0.743
Tabel 4. 6 Eksperimen mencari nilai Conpidence Criterion
MS for S MLS MG MD Conpidence accuracy AUC
information_gain 7
1
0.1
20
0.05
97.73%
0.736
information_gain 7
1
0.1
20
0.10
95.00%
0.865
information_gain 7
1
0.1
20
0.15
98.18%
0.743
information_gain 7
1
0.1
20
0.20
98.18%
0.743
information_gain 7
1
0.1
20
0.25
98.18%
0.743
information_gain 7
1
0.1
20
0.30
96.36%
0.82
information_gain 7
1
0.1
20
0.35
93.14%
0.942
information_gain 7
1
0.1
20
0.40
93.14%
0.942
information_gain 7
1
0.1
20
0.45
95.00%
0.913
information_gain 7
1
0.1
20
0.50
95.00%
0.913
59
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
Gambar 4. 1 Pohon Keputusan semua atribut Tree PEOU6 > 3.500 | AT3 > 2.500: Puas {Puas=137, Tidak Puas=0} | AT3 = 2.500 | | PU1 > 2.500: Puas {Puas=10, Tidak Puas=0} | | PU1 = 2.500: Tidak Puas {Puas=0, Tidak Puas=4} PEOU6 = 3.500 | AT1 > 3.500 | | PEOU4 > 1.500: Puas {Puas=15, Tidak Puas=0} | | PEOU4 = 1.500: Tidak Puas {Puas=0, Tidak Puas=2} | AT1 = 3.500 | | ATU2 > 2.500 | | | PU2 > 2.500 | | | | BI3 > 3.500: Puas {Puas=5, Tidak Puas=0} | | | | BI3 = 3.500 | | | | | PEOU4 > 3.500: Puas {Puas=2, Tidak Puas=0} | | | | | PEOU4 = 3.500: Tidak Puas {Puas=0, Tidak Puas=5} | | | PU2 = 2.500: Tidak Puas {Puas=0, Tidak Puas=6} | | ATU2 = 2.500: Tidak Puas {Puas=0, Tidak Puas=33}
60
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
KESIMPULAN DAN SARAN Kesimpulan Dari hasil penelitian dapat ditarik suatu kesimpulan bahwa peran algoritma C4.5 mampu prediksi tingkat kepuasan mahasiswa terhadap Sistem Informasi Akademik Sekolah Tinggi Keguruan dan Ilmu Pendidikan Hamzanwadi Selong. 1.1.Saran Walaupun model algoritma C4.5 memiliki tingkat akurasi yang baik dalam memprediksi, namun ada beberapa hal yang harus ditambahkan untuk menambah tingkat akurasi algoritma C4.5, yaitu: 1. Untuk mengetahui tingkat akurasi dari algoritma, akan lebih baik algoritma C4.5 dibandingkan atau dikomparasi dengan model algoritma lain seperti Naive Bayes, Neural Network atau Support Vector Machine. 2. Sistem analisa kredit untuk penentuan kelayakan pemberian kredit bagi nasabah ditingkatkan. 3. Dengan menambah jumlah data yang lebih besar dan atribut yang lebih banyak, diharapkan hasil pengukuran akan didapatkan lebih baik lagi. 4. Menggunakan metode seleksi atribut yang lain seperti chi-square, untuk ketepatan penyeleksian atribut.
DAFTAR PUSTAKA [1] I. A. Mastan and W. W. Winarno, “EVALUASI TINGKAT KEPUASAN PENGGUNA SISTEM INFORMASI CYBER CAMPUS (SICYCA) DENGAN MODEL DELONE DAN MCLEAN (STUDI KASUS: STIKOM SURABAYA),” 2013. [2] Y. S. Nugroho, “DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI KELULUSAN MAHASISWA UNIVERSITAS DIAN NUSWANTORO,” 2009. [3] N. Padhy, P. Mishra, and R. Panigrahi, “The Survey of Data Mining Applications And Feature Scope,” 2012. [4] Y. Dwitayanti, “DAMPAK IMPELEMENTASI SISTEM INFORMASI AKADEMIK TERHADAP KEPUASAN MAHASISWA,” 2011. [5] G. Fiastantyo, “PERBANDINGAN KINERJA METODE KLASIFIKASI DATA MINING MENGGUNAKAN NAÏVE BAYES DAN ALGORITMA C4.5 UNTUK PREDIKSI KETEPATAN WAKTU KELULUSAN MAHASISWA,” 2009. [6] K. Hastuti, “Analisis komparasi algoritma klasifikasi data mining untuk prediksi mahasiswa non aktif,” vol. 2012, no. Semantik, pp. 241–249, 2012. [7] N. M. Wasilah, PENERAPAN DATA MINING UNTUK MENGANALISIS KEPUASAN KONSUMEN MENGGUNAKAN METODE C4.5, vol. 5. 2013. 61
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
[8] [9] [10] [11] [12] [13]
[14] [15] [16] [17]
[18]
V. Mandasari, B. A. Tama, and U. Sriwijaya, “Analisis Kepuasan Konsumen Terhadap Restoran Cepat Saji Melalui Pendekatan Data Mining : Studi Kasus XYZ,” 2011. I. F. Rohman, “Penerapan Algoritma C4 . 5 Pada Kepuasan Pelanggan Perum DAMRI,” 2015. J. Geller, “Data Mining : Practical Machine Learning Tools and Techniques with Java Implementations,” 2002. F. Santosa, “A LEVEL-SET APPROACH FOR INVERSE PROBLEMS INVOLVING OBSTACLES,” 1996. C. A. Survey, L. Rokach, and O. Maimon, “Top-Down Induction of Decision Trees,” 2005. F. X. Suryadi, S. Lecturer, W. Development, S. Policy, T. Water, R. H. Susanto, C. A. Data, I. Centre, and S. Sumatra, “World Congress of the International Commission of Agricultural and Biosistems Engineering (CIGR),” 2010. L. Le and P. H. Roy, “PCR Mapping of Integrons Reveals Several Novel Combinations of Resistance Genes,” 1995. J. Han, J. Pei, and Y. Yin, “Mining F requen tP atterns without Candidate Generation,” 2011. F. Gorunescu, S. I. Mcclean, and P. H. Millard, “A queueing model for bed-occupancy management and planning of hospitals,” 2002. X. Wu, V. Kumar, J. R. Quinlan, J. Ghosh, Q. Yang, H. Motoda, G. J. Mclachlan, A. Ng, B. Liu, P. S. Yu, Z. Z. Michael, S. David, and J. H. Dan, Top 10 algorithms in data mining. 2008. Berndtssom, M., Hansson, J., Olsson, B., & Lundell, B. (2008). "A Guide for Students in Computer Science and Information Sistems. London: Springer.,” p. 2008, 2008.
62