“ SISTEM MONTORING DAN PREDIKSI PRESTASI AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA DECISION TREE C4.5 ” 1 Lingga Hidayat, 2Dodi Siregar, 3Ilham Faisal Program Studi Teknik InformatikaSekolah Tinggi Teknik Harapan Medan Jl. HM Jhoni No 70 Medan, Indonesia 1
[email protected]
1,2,3
Abstrak Kebanyakan perguruan tinggi telah menerapkan sistem komputerisasi dalam mencatat dan mengelola data nilai akademik mahasiswa. Namun, sistem ini tidak dapat memprediksi prestasi akademik mahasiswa untuk periode berikutnya. Penelitian ini bertujuan untuk mengembangkan sistem monitoring dan prediksi prestasi akademik mahasiswa. Tools yang digunakan untuk melakukan analisis dan desain adalah use case diagram. Sedangkan, bahasa pemrograman yang digunakan untuk merancang sistem adalah Mircosoft Visual Basic.NET dengan menggunakan aplikasi SQL Server sebagai database engine dan aplikasi Crystal Report 10 sebagai desain laporannya.Hasil dari penelitian ini adalah sistem informasi prediksi dan monitoring prestasi akademik mahasiswa yang dapat digunakan untuk menyelesaikan permasalahan yang dihadapi oleh perguruan tinggi. Kata Kunci : Metode Klasifikasi C4.5, Use Case Diagram, Sistem Monitoring, Prestasi Akademik Mahasiswa Abstract Most colleges have implemented a computerized system for recording and managing data students' academic value. However, this system can not predict the academic achievement of students for the next period. This research aims to develop a system of monitoring and prediction of students' academic achievement. Tools used to perform analysis and design is the use case diagram. Meanwhile, the programming language used to design the system is Mircosoft Visual Basic.NET application using SQL Server as the database engine and the application Crystal Report 10 as laporannya.Hasil design of this study is the prediction information systems and monitoring student academic achievement that can be used to resolve problems faced by universities. Keywords: Classification Methods C4.5, Use Case Diagram, System Monitoring, Student Academic Achievement
1.
Pendahuluan Saat ini, kebanyakan perguruan tinggi telah menerapkan sistem komputerisasi dalam mencatat dan mengelola data nilai akademik mahasiswa. Daftar nilai akademik ini akan digunakan oleh pihak perguruan tinggi dalam memberikan tunjangan pendidikan. Sistem terkomputerisasi ini memiliki kelemahan yaitu sistem ini tidak dapat memprediksi prestasi akademik mahasiswa untuk periode berikutnya. Hal ini diperlukan untuk mengetahui kemampuan mahasiswa dalam mempelajari dan mengikuti perkuliahan. Informasi ini dapat digunakan oleh pihak perguruan tinggi untuk memperbaiki sistem perkuliahan yang sedang berjalan sekarang ini. Selain itu, belum tersedianya informasi mengenai prediksi prestasi akademik mahasiswa menyebabkan pihak jurusan tidak dapat melakukan monitoring terhadap prestasi akademik mahasiswa. Informasi ini dapat digunakan untuk memberikan perhatian khusus bagi mahasiswa yang kurang mampu mengikuti perkuliahan. Salah satu metode yang dapat digunakan untuk menyelesaikan pe rmasalahan di atas adalah algoritma decision tree C4.5. Algoritma decision tree C4.5 merupakan salah satu jenis algoritma pengelompokan data berdasarkan kriteria tertentu.
Dengan menggunakan algoritma decision tree C4.5 ini, mahasiswa akan dikelompokkan menjadi 4 kelompok (Prestasi Bagus, Prestasi Baik, Prestasi Cukup, Prestasi Kurang). Penelitian mengenai “Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa”. Penelitian ini menghasilkan informasi bahwa nilai semester enam memiliki pengaruh terbesar terhadap tingkat kelulusan mahasiswa. Akurasi prediksi dari penelitian ini adalah sebesar 87,5 % [1]. Berdasarkan permasalahan di atas, penulis tertarik untuk menerapkan algoritma decision tree C4.5 dalam melakukan penyeleksian prediksi mahasiswa. Adapun penelitian ini bertujuan untuk merancang sebuah aplikasi yang mampu melakukan monitoring dan prediksi terhadap tingkat prestasi akademik dari mahasiswa dengan menggunakan algoritma decision tree C4.5. Manfaat dari penelitian ini untuk memberikan informasi pendukung kepada pihak perguruan tinggi dalam proses monitoring dan dapat dijadikan sebagai bahan pertimbangan dalam pengembangan tingkat prestasi mahasiswa pada perguruan tinggi.
2.
Metodologi Penelitian Metodologi yang digunakan dalam penelitian ini adalah model Waterfall yang memiliki langkah-langkah yang dapat dirincikan sebagai berikut: 1. Mengumpulkan dan mempelajari materi yang berhubungan dengan prosedur pencatatan dan penilaian tingkat prestasi mahasiswa serta cara kerja dari algoritma decision tree C4.5 dari buku, internet, artikel dan sumber-sumber lainnya . 2. Mempelajari cara penerapan algoritma decision tree C4.5 dalam melakukan monitoring dan prediksi prestasi akademik mahasiswa dengan menggunakan alat bantu berupa activity diagram. 3. Mengembangkan perangkat lunak (sistem) yang terdiri dari langkah-langkah : a) Memodelkan fungsi yang terdapat pada sistem dengan menggunakan use case diagram. b) Merancang tampilan interface dari perangkat lunak. c) Merancang database yang akan digunakan dalam perangkat lunak. d) Membuat aplikasi dengan menggunakan bahasa pemrograman Microsoft Visual Basic.NET. 4. Mengevaluasi dengan melakukan pengisian data mahasiswa periode sebelumnya dari suatu perguruan tinggi ke dalam aplikasi dan membandingkan laporan hasil yang telah diproses oleh sistem dengan laporan yang dihasilkan sebelum menggunakan sistem. 5. Melakukan pengujian terhadap sistem pada perguruan tinggi dengan memasukkan data calon mahasiswa yang telah tersedia kemudian menarik kesimpulan dari hasil pengujian. 2.1 Sistem Suatu sistem pada dasarnya adalah sekolompok unsur yang erat hubungannya satu dengan yang lain, yang berfungsi bersamasama untuk mencapai tujuan tertentu. Secara sederhana, suatu sistem dapat diartikan sebagai suatu kumpulan atau himpunan dari unsur, komponen, atau variabel yang terorganisir, saling berinteraksi, saling tergantung satu sama lain, dan terpadu. Dari defenisi ini dapat dirinci lebih lanjut pengertian sistem secara umum. 2.2 Monitoring Monitoring didefinisikan sebagai siklus kegiatan yang mencakup pengumpulan, peninjauan ulang, pelaporan, dan tindakan atas informasi suatu proses yang sedang diimplementasikan. Umumnya, monitoring digunakan dalam checking antara kinerja dan target yang telah ditentukan. Monitoring ditinjau dari hubungan terhadap manajemen kinerja adalah proses terintegrasi untuk memastikan bahwa proses
berjalan sesuai rencana (on the track). Monitoring dapat memberikan informasi keberlangsungan proses untuk menetapkan langkah menuju ke arah perbaikan yang berkesinambungan. Pada pelaksanaannya, monitoring dilakukan ketika suatu proses sedang berlangsung. Level kajian sistem monitoring mengacu pada kegiatan per kegiatan dalam suatu bagian, misalnya kegiatan pemesanan barang pada supplier oleh bagian purchasing. Indikator yang menjadi acuan monitoring adalah output per proses / per kegiatan. Umumnya, pelaku monitoring merupakan pihak-pihak yang berkepentingan dalam proses, baik pelaku proses (self monitoring) maupun atasan / supervisor pekerja. Berbagai macam alat bantu yang digunakan dalam pelaksanaan sistem monitoring, baik observasi / interview secara langsung, dokumentasi maupun aplikasi visual [2]. 2.3 Sistem Monitoring Sistem monitoring merupakan sistem yang didesain untuk bisa memberikan feedback ketika program sedang menjalankan fungsinya. Feedback dimaksudkan untuk memberikan informasi / keadaaan sistem pada saat itu. Sistem monitoring merupakan kumpulan prosedur dan program untuk mengkomputasi sistem informasi yang didesain untuk mencatat dan mentransmisikan data berdasarkan informasi yang diperloleh. Sistem monitoring adalah kumpulan fitur informatif yang memberikan informasi mengenai apa saja yang terjadi dengan sistem yang di-monitor. Sistem monitoring akan memberikan dampak yang baik bila dirancang dan dilakukan secara efektif. 2.4 Prediksi Prediksi adalah suatu proses memperkirakan secara sistematis tentang sesuatu yang paling mungkin terjadi di masa depan berdasarkan informasi masa lalu dan sekarang yang dimiliki, agar kesalahannya (selisih antara sesuatu yang terjadi dengan hasil perkiraan) dapat diperkecil. Prediksi tidak harus memberikan jawaban secara pasti kejadian yang akan terjadi, melainkan berusaha untuk mencari jawaban sedekat mungkin yang akan terjadi [3]. Berdasarkan teknik yang digunakan untuk memprediksi maka prediksi dapat dibagi menjadi dua bagian yaitu prediksi kualitatif dan prediksi kuantitatif. Prediksi kualitatif didasarkan atas data kualitatif pada masa lalu. Metoda kualitatif digunakan jika data masa lalu dari variabel yang akan diprediksi tidak ada, tidak cukup atau kurang dipercaya. Hasil prediksi yang dibuat sangat tergantung pada individu yang menyusunnya. Hal ini penting karena hasil prediksi tersebut ditentukan berdasarkan pemikiran yang bersifat judgement atau opini, pengetahuan dan pengalaman dari penyusunnya. Oleh karena itu metode kualitatif ini disebut juga judgemental, sudjective, intuitive.
Prediksi kuantitatif didasarkan atas data kuantitatif pada masa lalu. Hasil prediksi yang dibuat sangat tergantung pada metode yang dipergunakan dalam prediksi tersebut. Dengan metoda yang berbeda akan diperoleh hasil prediksi yang berbeda. Hal yang perlu diperhatikan dari penggunaan metoda tersebut adalah baik tidaknya metoda yang digunakan dan sangat ditentukan dari penyimpangan antara hasil prediksi dengan kenyataan yang terjadi. Metoda yang baik adalah metoda yang memberikan nilainilai perbedaan atau penyimpangan yang mungkin.
dari proses yang terdapat dalam sistem, merumuskan prasyarat desain sistem dan pemodelan sistem. 3.1 Analisis Proses Secara garis besar, prosedur kerja dari sistem yang akan dibuat dapat digambarkan seperti terlihat pada gambar berikut: Mulai
1
Input data program studi Pembuatan pohon
2.5 Data Mining Data Mining (Penambangan data) merupakan bidang ilmu multidisplin, menggambarkan area-area kerja yang termasuk didalamnya adalah teknologi basis data, pembelajaran mesin, statistik, pengenalan pola, pengambilan informasi, jaringan saraf tiruan, sistem berbasis pengetahuan, kecerdasan buatan, komputasi kinerja-tinggi, dan visualisasi data. Data Mining diartikan sebagai menambang data atau upaya untuk menggali informasi yang berharga dan berguna pada database yang sangat besar. Hal terpenting dalam teknik data mining adalah aturan untuk menemukan pola frekuensi tinggi antar himpunan itemset yang disebut fungsi Association Rules (Aturan Asosiasi). Data Mining disebut juga Knowledge Discovery in Database (KDD) didefenisikan sebagai ekstraksi informasi potensial implisit dan tidak dikenal dari sekumpulan data. Proses Knowledge Discovery in Database melibatkan hasil proses data mining proses pengekstrak kecenderungan suatu pola data), kemudian mengubah hasilnya secara akurat menjadi informasi yang mudah dipahami. Ada beberapa macam pendekatan yang berbeda yang diklasifikasikan sebagai teknik pencarian informasi/pengetahuan dalam KDD. Ada pendekatan kuantitatif, seperti pendekatan probabilistik seperti logika induktif, encarian pola, dan analisis pohon keputusan. Pendekatan yang lain meliputi deviasi, analisis kecenderungan, algoritma genetik, jaringan saraf tiruan, dan pendekatan campuran dua atau lebih dari beberapa pendekatan yang ada [4].
Input data mahasiswa
Input mahasiswa
Input data penilaian mahasiswa Proses Penelusuran Pohon Proses Algoritma Klasifikasi C4.5 Hasil prediksi
Nilai entropy dan gain Selesai
1
Gambar 1 Kerangka Penelitian Berdasarkan gambar 3.1, terlihat bahwa proses monitoring nilai mahasiswa dimulai dengan algoritma klasifikasi C4.5 terlebih dahulu dengan memasukkan training dari data mahasiswa periode sebelumnya. Terakhir, akan ditentukan hasil penelusuran pohon yang menghasilkan prediksi tingkat kelulusan mahasiswa. 3.2 Pemodelan Sistem Sistem Monitoring dan Prediksi Prestasi Akademik Mahasiswa Menggunakan Algoritma Decision Tree C4.5 ini dapat dimodelkan dengan menggunakan use case diagram seperti terlihat pada gambar berikut: Sistem Monitoring dan Prediksi Prestasi Akademik Mahasiswa Menggunakan Algoritma Decision Tree C4.5
Memasukkan data program studi
Memasukkan data mahasiswa
Memasukkan data penilaian mahasiswa Staf Administrasi
2.6 Algoritma Klasifikasi C4.5 Algoritma Klasifikasi C4.5 atau disebut juga sebagai algoritma decision tree merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal. Algoritma ini termasuk metode data mining, yang merupakan proses menemukan pola dengan memilah-milah sejumlah data yang besar menggunakan teknologi pengenalan pola. 3. Perancangan Sistem Sebelum melakukan perancangan sebuah sistem untuk menyelesaikan suatu permasalahan, terlebih dahulu harus dilakukan analisis terhadap sistem tersebut, untuk mendeskripsikan alur kerja
Melakukan proses login
Menghitung nilai kriteria dan sub kriteria
<< include >>
<< include >>
Menampilkan hasil penilaian dengan menggunakan algoritma klasifikasi C4.5
Menghitung nilai scoring untuk setiap mahasiswa << include >> Menampilkan laporan detail perhitungan
Manajer
Menampilkan laporan hasil penilaian
Gambar 2 Use Case Diagram dari Sistem Monitoring dan Prediksi Prestasi Akademik Mahasiswa
3.3 Perancangan Tampilan Antar Muka Sistem Monitoring dan Prediksi Prestasi Akademik Mahasiswa Menggunakan Algoritma Decision Tree C4.5 ini memiliki beberapa tampilan yang digunakan sebagai tempat pengisian data yang diperlukan oleh sistem. Berikut perinciannya.
3.4 Perancangan Laporan Laporan yang dihasilkan sebagai output dari sistem yang dibuat dapat dirincikan sebagai berikut: 1. Laporan Jurusan
Gambar 3 Rancangan Form Filter Laporan Jurusan
Pada form Mahasiswa ini, dapat dimasukkan rincian data pribadi dari mahasiswa, seperti nama siswa, jenis kelamin, tempat dan tanggal lahir, alamat, kode pos, email, telepon, no HP, golongan darah, agama, nama ayah dan ibu, asal sekolah dan kewarganegaraan. Selain itu, juga dimasukkan data tambahan lainnya, seperti hasil rekomendasi untuk masuk ke perguruan tinggi yang bersangkutan. 2. Form Program Studi Form ini dapat diakses dengan mengklik menu ‘Data Utama’ >> ‘Program Studi’ sehingga sistem akan menampilkan form berikut:
4. Implementasi Sistem Berikut dirincikan tampilan input dari perangkat lunak: Form yang pertama kali muncul pada saat menjalankan perangkat lunak adalah form Login yang dapat dilihat pada gambar dibawah :
Gambar 4 Tampilan Form Login Apabila proses login berhasil, maka sistem akan menampilkan form Menu Utama seperti terlihat pada gambar berikut:
Gambar 5 Tampilan Form Menu Utama Pada form ini, terdapat beberapa menu yang dapat diakses, seperti: 1. Form Mahasiswa Form ini dapat diakses dengan mengklik menu ‘Data Utama’ >> ‘Mahasiswa’ sehingga sistem akan menampilkan form berikut:
Gambar 7 Tampilan Form Program Studi Pada form Program Studi ini akan dimasukkan semua data program studi yang terdapat pada perguruan tinggi yang bersangkutan. 3. Form User Form ini dapat diakses dengan mengklik menu ‘Data Utama’ >> ‘User’ sehingga sistem akan menampilkan form berikut:
Gambar 8 Tampilan Form User Pada form User akan dimasukkan semua data user yang dapat menggunakan sistem. Data user yang dimasukkan ini akan diperlukan pada saat akan melakukan login ke dalam sistem. 4. Form Nilai Form ini dapat diakses dengan mengklik menu ‘Transaksi’ >> ‘Data Nilai’ sehingga sistem akan menampilkan form berikut:
Gambar 6 Tampilan Form Mahasiswa Gambar 9 Tampilan Form Nilai
Pada form Nilai Ujian dapat dimasukkan data nilai yang diperoleh mahasiswa pada periode sebelumnya. Nilai ujian yang dimasukkan ini akan dijadikan sebagai data training untuk melakukan proses monitoring dan prediksi prestasi akademik untuk periode selanjutnya. 5. Form Prediksi Form ini dapat diakses dengan mengklik menu ‘Transaksi’ >> ‘Proses Prediksi’ sehingga sistem akan menampilkan form berikut:
Gambar 10 Tampilan Form Proses Prediksi 6. Form Proses Monitoring Form ini dapat diakses dengan mengklik menu ‘Transaksi’ >> ‘Proses Monitoring’ sehingga sistem akan menampilkan form berikut:
Gambar 13 Contoh Hasil Penentuan Penentuan Kelompok Mahasiswa Dari kasus diatas akan dibuat sebuah pohon keputusan untuk menentukan proses monitoring. Berikut rincian langakah penyelasaian dalam pembentukan pohon keputusan. Langkah 1 :Menghitung nilai entropy dan nilai gain Lakukan perhitungan untuk jumlah kasus keseluruhan yang ada, jumlah kasus untuk hasil Tinggi, Sedang dan Rendah. Kemudian lakukan perhitungan untuk mencari nilai Entropy dari setiap nilai atribut dan nilai Gain untuk setiap atribut. Jumlah kasus : 17 Jumlah kasus dengan hasil Tinggi : 5 Jumlah kasus dengan hasil Sedang : 6 Jumlah kasus dengan hasil Rendah: 6 Hitung nilai entropy dari total kasus :
Gambar 11 Tampilan Form Proses Monitoring Pada form Proses Monitoring ini akan ditampilkan hasil prediksi prestasi dari mahasiswa yang bersangkutan. 4.1 Prosedur Kerja Sistem Agar dapat lebih memahami mengenai proses kerja dari algoritma klasifikasi C4.5, maka diberikan sebuah contoh sederhana berikut ini: Setelah dicari nilai entropy pada setiap nilai dariatribut yang ada, kemudian lakukan perhitungan untuk mencari nilai gain dari setiap atribut. Nilai gain dari masing-masing atribut :
Gambar 12 Contoh Rincian Data Kemudian kita tentukan kategori dari nilai bobot yang ditentukan.
Gain (Jurusan)
3.
Aplikasi Mysql untuk menyimpan data yang dimasukkan ke dalam sistem.
5. Penutup
Gambar 14 Hasil perhitungan untuk nilai entropy dan gain ditunjukkan Langkah 2 : Menentukan node akar a) Dari hasil perhitungan pada tabel diatas, diketahui bahwa nilai Gain terbesar yaitu pada atribut Jurusan yaitu sebesar 1.439. Sehingga atribut Jurusan menjadi node akar. b) Pada atribut Jurusan terdapat 14 nilai atribut, yaitu Teknik Informatika, Sistem Informasi, Teknik Sipil, Teknik Industri, Teknik Mesin dan Teknik Elektro. Hampir semua nilai atribut sudah mengklasifikasikan kasus menjadi 1 sehingga tidak perlu dilakukan perhitungan lebih lanjut. Dari proses tersebut maka dapat dihasilkan pohon sementara seperti berikut ini. Merk
Teknik Informatika
Sistem Informasi
SEDANG
5.2 Saran Adapun beberapa saran yang ingin penulis sampaikan adalah: 1. Sistem dapat dikembangkan lebih lanjut dengan menambahkan data training (data periode sebelumnya) sehingga akurasi dari hasil yang diperoleh sistem dapat lebih akurat. 2. Sistem dapat dikembangankan dengan pemrograman berbasis web, karena bersifat online.
Teknik Elektro Teknik Sipil
TINGGI
5.1 Kesimpulan Berdasarkan hasil penelitian,dapatditarikbeberapa kesimpulan: 1. Sistem informasi yang telah dihasilkan dapat melakukan proses monitoring prestasi untuk setiap mahasiswa secara cepat dan tepat. 2. Proses pengecekan nilai maupun pencarian data bisa dilakukan dengan cepat dan tepat. 3. Keunggulan sistem mencakup: a. Sistem mampu menghasilkan informasi hasil prediksi untuk setiap mahasiswa. b. Menerapkan metode klasifikasi C4.5 untuk melakukan prediksi prestasi akademik mahasiswa sudah tepat.
RENDAH
Teknik Industri
RENDAH
Teknik Mesin
RENDAH
Daftar Pustaka SEDANG
[1] David Hartanto Kamigi dan Seng Hansun, 2014,
Gambar 15 Pohon Sementara Proses Klasifikasi C4.5
Implementasi
4.2 Spesifikasi Kebutuhan Sistem Program ini dijalankan dengan menggunakan perangkat keras (hardware) yang direkomendasikan sebagai berikut : 1. Prosesor Intel Atom CPU N2600 1.6 GHz. 2. Memory 2 GB. 3. Harddisk 500 GB. 4. VGA card 1 GB. 5. Monitor dengan resolusi 1024 X 768 pixel. 6. Keyboard dan mouse. Adapun perangkat lunak (software) yang direkomendasikan untuk menjalankan aplikasi ini adalah lingkungan sistem operasi Windows XP/7/8/10. Untuk merancang perangkat lunak, diperlukan beberapa software pendukung seperti:
Tingkat Kelulusan Mahasiswa
1.
Bahasa pemrograman Microsoft Visual Basic.NET.
2.
Aplikasi Adobe Photoshop CS6 untuk mendesain gambar background perangkat lunak.
Algoritma
Data
C4.5
Mining
untuk
dengan
Memprediksi
[2] Muhammad Revo Dwi Putro, Teguh Susanto dan Erwin Sutomo, 2014, Sistem Informasi Monitoring Antrian pada Koperasi Setia Bhakti Wanita Berbasis Web, JSIKA Vol 3, No 1 (2014)/ ISSN 2338-137X. [3] Baafai, 2013. Prediksi Kerusakan Motor Induksi.Skripsi. [4] Dwi Ayu Nursela, 2014, Penerapan Algoritma C4.5 Untuk Klasifikasi Tingkat Keganasan Kanker Payudara, Universitas Dian Nuswantoro Semarang.
[5] Kennedi Tampubolon, Hoga Saragih, Bobby Reza, 2013, Implementasi Data Mining Algoritma
Apriori
Pada
Sistem
Persediaan Alat-Alat Kesehatan, Majalah Ilmiah, Informasi dan Teknologi Ilmiah (INTI),
ISSN
:
2339-210X.