JURNAL
IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA
IMPLEMENTATION OF DATA MINING WITH C4.5 ALGORITHM TO PREDICT STUDENT ACHIEVEMENT
Oleh: SITI MUHIMATUL KHOIROH NPM : 12.1.03.02.0315
Dibimbingoleh : 1.
Dr. SURYO WIDODO, M.Pd.
2.
RISKY ASWI RAMADHANI, M.Kom.
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS NUSANTARA PGRI KEDIRI 2017
ArtikelSkripsi Universitas Nusantara PGRI Kediri
Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
simki.unpkediri.ac.id || 1||
ArtikelSkripsi Universitas Nusantara PGRI Kediri
IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA Siti Muhimatul Khoiroh 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
[email protected] Dr. Suryo Widodo, M.Pd. dan Risky Aswi Ramadhani, M.Kom. UNIVERSITAS NUSANTARA PGRI KEDIRI
ABSTRAK Dalam lembaga Pendidikan khususnya di SMK Pemuda Papar memiliki banyak data namun belum dimanfaatkan secara optimal. Data yang dimiliki sekolah biasanya dalam jumlah besar dan terus bertambah setiap tahunnya. Dengan memanfaatkan metode data mining data tersebut dapat diolah menjadi informasi yang berguna khususnya bagi SMK Pemuda Papar. Penelitian ini menerapkan algoritma C4.5 pada data mining ke dalam sebuah aplikasi yang dapat digunakan untuk memprediksi prestasi siswa SMK Pemuda Papar. Dengan menerapkan metode tersebut penelitian ini diharapkan dapat menghasilkan pola aturan prediksi prestasi siswa sehingga dapat mengantisipasi sejak dini terhadap siswa yang berpotensi mengalami hambatan dalam belajarnya. Penelitan ini berhasil menerapkan algoritma C4.5 ke dalam aplikasi. Aplikasi tersebut dapat mengetahui pola-pola prediksi prestasi siswa di SMK Pemuda Papar. Dari pola-pola yang dihasilkan oleh aplikasi kemudian dapat diinterpretasikan menjadi sebuah informasi atau knowledge baru. Kata kunci : data mining, algoritma C4.5, prediksi prestasi siswa.
I. LATAR BELAKANG Sekolah Menengah Kejuruan (SMK) merupakan
lembaga
pendidikan
yang
pembelajaran
dan
bimbingan
sesuai
dengan kemampuan siswa tersebut.
berupaya menciptakan siswa tamatan yang
Yang harus dilakukan oleh lembaga
terampil dan memiliki keahlian sehingga
pendidikan adalah melakukan antisipasi
lulusannya dapat langsung terjun ke dunia
terhadap siswa yang berpotensi mengalami
kerja maupun melanjutkan ke pendidikan
hambatan atau kurang berprestasi dalam
yang lebih tinggi [1]. Namun setiap siswa
belajarnya. Hal ini penting dilakukan
memiliki tingkat ketrampilan yang berbeda
karena semakin awal sekolah kejuruan
sehingga memerlukan bimbingan yang
mengetahui adanya potensi siswa yang
berbeda pula. Untuk itu perlu diketahui
kemungkinan akan mengalami hambatan
lebih dini mengenai tingkat prestasi dan
dalam belajarnya, maka sekolah bisa
ketrampilan siswa agar bisa memberikan
melakukan
Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
langkah-langkah
antisipatif.
simki.unpkediri.ac.id || 2||
ArtikelSkripsi Universitas Nusantara PGRI Kediri
Akibat
yang
dari
pola yang terdapat pada data siswa. Data
pencegahan
mining, sering disebut sebagai knowledge
sejak dini terhadap peserta didik yang
discovery in database (KDD). KDD adalah
berpotensi mengalami hambatan dalam
kegiatan
belajarnya atau kurang berprestasi adalah
pemakaian data, historis untuk menemukan
banyak siswa tidak naik kelas dan sulit
keteraturan, pola atau hubungan dalam set
menerima pelajaran di kelasnya.
data berukuran besar [2]. Algoritma C4.5
kurangnya
mungkin
antisipasi
muncul
atau
yang meliputi
pengumpulan,
Untuk itu dibutuhkan sistem yang
merupakan algoritma data mining yang
mampu memprediksi sejak dini terhadap
menggunakan pohon keputusan dalam
peserta
penyelesaiannya. Algoritma C4.5 dapat
didik
berprestasi
yang
atau
berpotensi
mengalami
tidak
hambatan
menghasilkan
pohon
keputusan
yang
dalam belajarnya sehingga guru dapat
mudah diinterprestasikan, memiliki tingkat
melakukan bimbingan atau pendampingan
akurasi yang dapat diterima.
khusus terhadap siswa tersebut. Adapun kriteria
yang
menjadi
dasar
dalam
penentuan prediksi prestasi siswa adalah Tingkat
Sosial
Data mining adalah analisis otomatis
Motivasi Siswa, Kedisiplinan Siswa dan
dari data yang berjumlah besar dan
Prestasi Masa Lalu.
kompleks
lembaga
khususnya
di
SMK
memiliki
banyak
Orang
A. Data Mining
tua,
Dalam
Ekonomi
II. METODE
pendidikan
dengan
tujuan
untuk
menemukan pola atau kecenderungan yang
Pemuda
Papar
penting yang biasanya tidak disadari
namun
belum
keberadaannya [3]. Data mining juga
dimanfaatkan secara optimal. Data yang
disebut sebagai serangkaian proses untuk
dimiliki sekolah biasanya dalam jumlah
menggali nilai tambah berupa pengetahuan
besar dan akan terus bertambah setiap
yang selama ini tidak diketahui secara
tahunnya antara lain data kehadiran siswa,
manual dari suatu kumpulan data [3]. Data
data/ berkas penerimaan siswa baru, data
mining,
tingkat sosial ekonomi orang tua yang
knowledge discovery in database (KDD).
biasa diinput pada saat penerimaan siswa
KDD adalah kegiatan
baru maupun data yang dimiliki oleh
pengumpulan, pemakaian data, historis
BP/BK di sekolah.
untuk menemukan keteraturan, pola atau
data
Dengan banyaknya data yang ada, penulis ingin menggali suatu aturan dan Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
sering
juga
disebut
sebagai
yang meliputi
hubungan dalam set data berukuran besar [2]. simki.unpkediri.ac.id || 3||
ArtikelSkripsi Universitas Nusantara PGRI Kediri
Jadi data mining adalah suatu proses
menghitung gain digunakan rumus seperti
penggalian data yang memanfaatkan data
berikut :
yang cukup besar melalui serangkaian
πΊπππ π, π΄ = πΈππ‘ππππ¦ π β
ππ π π=1 π
β πΈππ‘ππππ¦ π΄
proses untuk mendapatkan informasi baru yang berguna.
Keterangan :
B. Decision Tree
S
: himpunan kasus
Data
A
: atribut
Mining, salah satu yang populer adalah
N
: jumlah partisi atribut A
Pohon Keputusan (Decision Tree). Pohon
|Si|
: jumlah kasus pada partisi ke-i
keputusan merupakan salah satu metode
|S|
: jumlah kasus dalam S
klasifikasi yang sangat menarik yang
Sebelum mendapatkan nilai Gain adalah
melibatkan konstruksi pohon keputusan
dengan mencari nilai Entropy. Entropy
yang terdiri dari node keputusan yang di
digunakan untuk menentukan seberapa
hubungkan dengan cabang-cabang dari
informatif sebuah masukan atribut untuk
simpul akar sampai ke node daun (akhir).
menghasilkan sebuah atribut. Rumus dasar
Pada node keputusan attribut akan diuji,
dari Entropy adalah sebagai berikut:
dan
πΈππ‘ππππ¦ π =
Ada
banyak
setiap
hasil
metodologi
akan
menghasilkan
π π=1 βππ
β πππ2 ππ
cabang. Setiap cabang akan diarahkan ke
Keterangan:
node lain atau ke node akhir untuk
S
: himpunan kasus
menghasilkan suatu keputusan [4].
A
: fitur
C. Algoritma C4.5
n
: jumlah partisi S
Secara umum Algoritma C4.5 untuk
Pi
: proporsi dari Si terhadap S
membangun
Dari kutipan di atas Perhitungan C4.5
pohon
keputusan
adalah
sebagai berikut [5] :
dimulai dengan mencari nilai entropy dari
1. Pilih atribut sebagai akar.
semua data. Nilai entropy digunakan
2. Buat cabang untuk tiap-tiap nilai.
sebagai dasar perhitungan gain tiap atribut,
3. Bagi kasus dalam cabang.
nilai gain tertinggi menjadi akar dari pohon
4. Ulangi proses untuk setiap cabang
keputusan perhitungan dilakukan hingga
sampai semua kasus pada cabang
semua atribut terdefinisi.
memiliki kelas yang sama. Untuk memilih
atribut
sebagai
akar,
didasarkan pada nilai gain tertinggi dari atribut-atribut
yang
ada.
Untuk
Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
III. HASIL DAN KESIMPULAN A. HasilImplementasiSistem 1. Desain Proses DFD simki.unpkediri.ac.id || 4||
ArtikelSkripsi Universitas Nusantara PGRI Kediri
Berikutmerupakan Implementasi Algoritma
Data
C4.5
DFD
Level
0
Halaman input data training terletak pada
dengan
menu master, pilih training, lalu pilih
memprediksi
simbol tambah. Halaman ini digunakan
Mining
untuk
prestasi siswa.
untuk memasukkan data training yang ingin ditambahkan. 3. OutputTraining
DFD level 0 mempunyai 1 entitas yaitu
Pada halaman output training merupakan
admin. Entitas admin mempunyai aktivitas
halaman yang menampilkan hasil dari data
untuk mengolah sistem dan menggunakan
training
aplikasi. Relasi dari admin ke proses yaitu
sebelumnya.
admin
4. Output Hasil Perhitungan
mengirim
data
login
admin,
yang
sudah
diinputkan
menginputkan data training, menginputkan data rule dan menginputkan data testing. Relasi
dari
proses
ke
admin
yaitu
mendapatkan hak akses login admin, mendapat laporan data training, mendapat laporan data rule dan mendapat laporan
Pada halaman outputhasil perhitungan
data testing
merupakan halaman yang menampilkan
2. Input Data Training
hasil perhitungan berdasarkan data training yang sudah diinputkan. 5. InputTesting
Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
simki.unpkediri.ac.id || 5||
ArtikelSkripsi Universitas Nusantara PGRI Kediri
mining dengan Algoritma C4.5 untuk prediksi prestasi siswa, yang sudah dijelaskan pada bab 4. Penelitian ini menggunakan data siswa kelas X, XI, XII Tahun pelajaran 2015/2016. Dari data siswa tersebut dijadikan data training, untuk dijadikan acuan dalam Halaman inputdata testing terletak pada menu metode, lalu pilih data testing.
perhitungan Algoritma C4.5. 2.
Data testing yang digunakan adalah
Halaman ini digunakan admin untuk
data
melakukan testing data siswa sesuai atribut
2016/2017 yang berjumlah 153 siswa,
yang
dari hasil testing di atas ditemukan
dimasukkan
dan
dibandingkan
dengan data real untuk masing-masing siswa.
X
Tahun
Pelajaran
Hasil akurasi sebesar = 83,66%. 3.
6. OutputAkurasi
kelas
Program aplikasi prediksi prestasi siswa menggunakan Algoritma C4.5 yang telah dihasilkan ini merupakan aplikasi berbasis web menggunakan bahasa
pemrograman
PHP
yang
memiliki tampilan menarik dan mudah diimplementasikan. IV. DAFTAR PUSTAKA [1] Susanto, Heri, dan Sudiyatno. 2014. Data Mining untuk Memprediksi Prestasi Siswa Berdasarkan Sosial Ekonomi, Motivasi, Kedisiplinan dan Prestasi Masa Lalu. Yogyakarta. Pada halaman output akurasi merupakan halaman yang menampilkan hasil inputan data testing yang dibandingkan dengan
[2] Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis.Yogyakarta:Graha Ilmu.
keadaan sebenarnya. B. KESIMPULAN Berikutmerupakankesimpulan
yang
diperolehdarihasilpenelitian: 1.
Telah dihasilkan rancangan sistem dari perhitungan
Implementasi
Data
Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
[3] Pramudiono, I. 2007. Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data. http://www.ilmukomputer.org/wpcontent/uploads/2006/08/ikodatamining.zip Diakses pada tanggal 31 Desember 2015 jam 11.30 simki.unpkediri.ac.id || 6||
ArtikelSkripsi Universitas Nusantara PGRI Kediri
[4] Pramudiono, I. 2007. Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data. http://www.ilmukomputer.org/wpcontent/uploads/2006/08/ikodatamining.zip Diakses pada tanggal 31 Desember 2015 jam 11.30 [5] Kusrini, dan Emha Taufik Luthfi. 2009. Algoritma Data Mining. Yogyakarta: Penerbit Andi.
Siti Muhimatul Khoiroh | 12.1.03.02.0315 FakultasTeknik β TeknikInformatika
simki.unpkediri.ac.id || 7||