Simposium Nasional Ilmu Pengetahuan dan Teknologi (SIMNASIPTEK) 2017 ISBN: 978-602-61268-4-9
Penerapan Algoritma Klasifikasi Data Mining Decision Tree Untuk Menentukan Penjurusan Siswa SMA 6 Tasikmalaya Mira Kusmira1, Richardus Eko Indrajit2 1
AMIK BSI Tasikmalaya Tasikmalaya, Indonesia
[email protected] 2
ABFI Institute Perbanas Jakarta, Indonesia
[email protected]
Abstract – SMA Negri 6 Tasikamlaya is one of senior high schools in Tasikmalaya city which currently has 2 majors, SCIENCE and SOCIAL. This student majors can lead learners to focus on developing their own abilities and interests. The selection of improper majors can be very detrimental to students’ interests and careers in the future. These majors are expected to maximize the potential, talent or individual talents which could increase its academic value. Based on the background, by applying the data mining techniques, it is expected to help students to determine the appropriate majors according to the criteria appointed. As for the data mining techniques which is used in the determination of this major uses Decision Tree method. While the attributes used to determine the majors consisted of Average Mathematical Value, Average Score Value, Average SOCIAL Score.This research is based on business intelligence which focused on determining the majors in SMA Negeri 6 Tasikmalaya by using the Decision Tree method. Kata Kunci: Kata Kunci: Data mining, Decision Tree, Klasifikasi, SMA I. PENDAHULUAN Kurikulum yang digunakan pada Sekolah Menegah Atas (SMA) saat ini adalah kurikulum 2013. Dalam perkembangan kurikulum yang baru ini terdapat beberapa perbedaan dengan kurikulum sebelumnya. Salah satunya yaitu perbedaan dalam menentukan jurusan pada siswa-siswi SMA. Penjurusan di sekolah SMA 6 Tasikmalaya dilihat dari nilai rata rata rapot, selain itu juga dilihat dari nilai Rata-rata IPA SMP, Nilai Rata-rata IPS SMP, Nilai rata rata matematika SMP. Tujuan dari penjurusan itu sendiri adalah agar kelak dikemudian hari, pelajaran yang diberikan kepada siswa lebih terarah sesuai dengan minat dan bakat masing masing,. Karena tidak jarang juga siswasiswi yang asal- asalan dalam menentukan jurusan yang mereka ambil. Atau hanya sekedar mengikuti teman temannya saja. Mengacu pada penelitian yang telah dilakukan sebelumnya. Maka kali ini Metode Decision Tree akan di uji cobakan di lingkungan SMA Negeri 6 Tasikmalaya yang merupakan sebagai contoh yang mungkin terjadi, Tujuan dari penelitian ini adalah untuk mengetahui penjurusan di SMA Negeri 6 Tasikmalaya.
II. LANDASAN TEORI 2.1 Algoritma C4.5 Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Algoritma C4.5 dan ID3 diciptakan oleh seorang peneliti dibidang kecerdassan buatan bernama J. Rose Quinlan pada
akhir tahun 1970-an. Algoritma C4.5 akan membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun. Ada beberapa tahapan dalam membuat sebuah pohon keputusan dalam algoritma C4.5, yaitu [4]: 1. Mempersiapkan data training. Data training biasanya diambil dari kata histori yang pernah terjadi sebelumnya atau disebut data masa lalu dan sudah dikelompokkan dalam kelas-kelas tertentu. 2. Menghitung akar dari pohon. Akar akan diambil dari atribut yang akan terpilih, dengan cara menghitung nilai gain dari masing-masing atribut, nilai gain yang paling tinggi yang akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dulu nilai entropy. Untuk menghitung nilai entropy digunakan rumus
Keterangan : S = Himpunan kasus n = jumlah partisi S Pᵢ= proporsi Sᵢ terhadap S Kemudian Hitung nilai gain menggunakan rumus :
Keterangan : S = Himpunan kasus A = Fitur Prosiding SIMNASIPTEK: Hal. A-49
Simposium Nasional Ilmu Pengetahuan dan Teknologi (SIMNASIPTEK) 2017 ISBN: 978-602-61268-4-9 n = jumlah partisi atribut A │Si│= proporsi Si terhadap S │S │= jumlah kasus dalam S 2.2 Decision Tree Secara singkat bahwa Decision Tree merupakan salah satu metode klasifikasi pada Text Mining. Klasifikasi adalah “proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas data tertentu (Jianwei Han, 2001)” Pohon Keputusan atau dikenal dengan Decision Tree adalah salah satu metode klasifikasi yang menggunkan representasi suatu struktur pohon yang yang berisi alternatif-alternatif untuk pemecahan suatu masalah. Pohon ini juga menunjukkan faktor-faktor yang mempengaruhi hasil alternatif dari keputusan tersebut disertai dengan estimasi hasil akhir bila kita mengambil keputusan tersebut. Peranan pohon keputusan ini adalah sebagai Decision Support Tool untuk membantu manusia dalam mengambil suatu keputusan[3]. Manfaat dari decision tree adalah melakukan break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga orang yang mengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. Konsep yang digunakan oleh decision tree adalah mengubah data menjadi suatu keputusan pohon dan aturan-aturan keputusan(rule). Decision tree menggunakan struktur hierarki untuk pembelajaran supervised. Proses dari decision tree dimulai dari root node hingga leaf node yang dilakukan secara rekursif[4]. Di mana setiap percabangan menyatakan suatu kondisi yang harus dipenuhi dan pada setiap ujung pohon menyatakan kelas dari suatu data. Pada decision tree terdiri dari tiga bagian yaitu[4]: a. Root node Node ini merupakan node yang terletak paling atas darisuatu pohon. b. Internal node Node ini merupakan node percabangan, hanya terdapat satu input serta mempunyai minimal dua output. c. Leaf node. Node ini merupakan node akhir, hanya memiliki satu input, dan tidak memiliki output.
Gambar 1. Decision Tree prediksi cuaca
Prosiding SIMNASIPTEK: Hal. A-50
2.3 Penjurusan SMA Sekolah Menengah Atas (SMA), adalah jenjang pendidikan menengah pada pendidikan formal di Indonesia setelah lulus Sekolah menengah pertama (atau sederajat). Kurikulum yang digunakan pada Sekolah Menengah Atas (SMA) saat ini adalah kurikulum 2013. Dalam perkembangan kurikulum yang baru ini terdapat perbedaan dengan kurikulum sebelumnya. Salah satu perbedaannya yaitu dalam proses penentuan jurusan pada siswa SMA, karena penjurusan dilakukan pada kelas X. 2.4 Business Inteligence (BI) Business Inteligence (BI) bukanlah sebuah produk atau sistem, melainkan sebuah arsitektur dan koleksi operasional yang terintegrasi terhadap aplikasi pengambil keputusan dan database yang menyediakan pelaku bisnis kemudahan untuk akses ke data bisnis (Darudiato, Santoso, & Wiguna, 2002). Beberapa ahli menjelaskan mengenai pengertian business intelligence sebagai berikut (Ljubljana, Turk, & Jaklič, 2010) : a. Business intelligence merupakan proses mengumpulkan dan menganalisis informasi bisnis internal dan eksternal (Okkonen et al., 2002). b. Business intelligence adalah suatu arsitektur dan koleksi terintegrasi operasional serta dukungan keputusan aplikasi dan database yang memberikan kemudahan akses ke data bisnis (Moss & Atre, 2003). c. Business intelligence merupakan istilah umum untuk aplikasi, platform, alat-alat dan teknologi yang mendukung proses menjelajahi data bisnis, relasi data dan tren. BI menyediakan seorang eksekutif dengan informasi yang tepat waktu dan akurat untuk lebih memahami bisnis nya dan untuk membuat keputusan bisnis yang lebih banyak informasi, real-time (Raisinghani, 2004). Definisi dasar dari business intelligence (Turban et al, 2011) mencirikan business intelligence sebagai istilah payung yang menggabungkan arsitektur, peralatan, database, alat analisis, aplikasi dan metodologi (Horakova et al., 2003). Lingkungan business intelligence. meliputi semua pengembangan, pengolahan informasi, dan kegiatan pendukungan yang diperlukan untuk memberikan informasi bisnis yang sangat relevan dan memiliki kemampuan analisis bisnis (Ljubljana et al., 2010). Dalam lingkungan business intelligence, organisasi merancang dan menerapkan business intelligence system. Ini dapat didefinisikan sebagai suatu sistem informasi yang menyediakan kualitas informasi untuk pengambilan keputusan analisis sebagai sumber untuk membimbing bisnis untuk mencapai tujuan organisasi. Menurut (Negash,2004) business intelligence system biasanya menggabungkan alat-alat analisis dengan penyimpanan data, pengumpulan data danmanajemen pengetahuan untuk memberikan pengguna akhir dengan informasi yang kompleks dan kompetitif untuk perencana dan pengambil keputusan (Journal & Business, 2015). Tujuan utama dari business
Simposium Nasional Ilmu Pengetahuan dan Teknologi (SIMNASIPTEK) 2017 ISBN: 978-602-61268-4-9 intelligence system yaitu interaktif akses ke data, manipulasi data dan memungkinkan manajer bisnis dan analis untuk melakukan analisis yang tepat. III. METODE PENELITIAN Metode yang di usulkan pada penelitian ini adalah metode data mining dengan menggunakan pendekatan algoritma decisison tree, dan dapat diterapkan pada studi kasus Menentukan Penjurusan siswa SMA Negeri 6 tasikmalaya dan berikut model yang di usulkan.
Data yang digunakan dalam penelitian ini adalah sebanyak 120 data siswa kelas x di SMA 6 Tasikmalaya data hasil penjurusan siswa dengan atribut nama, nilai matematika, nilai ipa, nilai ips, nilai rata-rata, kelas jurusan Tabel 2. Data Master Penjurusan siswa
Data Set
Split Data
Decision Tree
Evaluasi
Gambar 2. Model metode yang di usulkan untuk Menentukan Penjurusan siswa SMA Negeri 6 tasikmalaya Gambar 2 adalah model yang dapat diusulkan pada studi kasus penelitian ini untuk memdapatkan hasil penentuan penjurusan di SMA Negeri 6 Tasikmalaya. Pertama menentukan data set yang akan dia ambil yaitu dari data siswa negeri 6 tasikmalaya khususnya data siswa kelas x . jumlah yang digunakan sebanyak 120 Data tersebut memiliki 4 atribut yang digunakan untuk proses penjurusan, diantaranya adalah rata-rata raport matematika, ratarata raport IPA, rata-rata raport IPS, Dimana atribut hasil sebagai target, dan pada atribut target ada dua kelas yang menjadi tujuan atau target yaitu IPA dan IPS. Berikut adalah klasifikasi penentuan jurusan berdasarkan grade Nilai.
Tabel 2. Merupakan contoh data penjurusan siswa SMA 6 Tasikmalaya kelas x, yang diambil dari data master sekolah SMA 6 Tasikmalaya. Jumlah sample data yang digunakan pada penenlitian ini adalah sebanyak 120 data siswa.
Tabel 1. Acuan nilai penjurusan Nilai
Klasifikasi
86-100 71-85 56-70
IPA IPS IPS
IV. PEMBAHASAN Dalam bab ini akan dibahas mengenai data yang akan digunakan dalam penelitian, data tersebut akan di hitung mengguanakan algorita Decision tree 4.1 Data yang digunakan
Prosiding SIMNASIPTEK: Hal. A-51
Simposium Nasional Ilmu Pengetahuan dan Teknologi (SIMNASIPTEK) 2017 ISBN: 978-602-61268-4-9 Tabel 3. Data master nilai siswa
pengatahuan berupa data prediksi penjurusan siswa SMS 6 tasikmalaya Tabel 4. Prediksi jumlah siswa yang masuk jurusan kelas IPA atau IPS Nilai rata-rata < 86 > 86
Kelas Jurusan IPS IPA
Jumlah 54 66
Tabel 4. Menunjukan prediksi siswa masuk kelas jurusan IPA atau kelas juruan IPS, berdassarkan jumlah data sample sebanyak 120 siswa yang terdapat di SMA 6 tasikmalaya yang masuk jurusan kelas IPS adalah sebanyak 54 siswa dan yang masuk jurusan kelas IPA adalah sebanyak 66 siswa
Tabel 3 adalah tabel data nilai siswa yang diambil dari nilai akhir mata kuliah matematika, ipa, ips yang menjadi acuan untuk masuk jurusan IPA, maupun IPS di SMA 6 tasikmalaya. Dari data – data diatas diolah dengan menggunakam algoritma decision tree sehingga menghasilkan model atau pola baru dan dapat mengetahui akurasi dari setiap penjurusan. Proses pengolahan data tersebut menggunakan Rapid Miner. Berikut implementasinya menggunakan Decision Tree terhadap dataset menggunakan Rapidminer 7.3.
Gambar 4. Metode decision tree untuk menghasilkan menentukan penjurusan siswa SMA 6 tasikmalaya
Gambar 5. Pola yang di hasilkan decision tree Pola yang dihasilkan dari pengolahan data penentuan jurusan siswa SMS 6 Tasikmalaya dengan algoritma decision tree yang di tunjukan oleh gambar 5. Model atau pola tersebut memberikan acuan sebagai
Prosiding SIMNASIPTEK: Hal. A-52
Proses pengolahan data pada penelitian ini dengen algoritma decision tree telah di lakukan, selanjutnya akan dilakukan proses evaluasi efektifitas algoritma terhadap proses ekstraksi data berdasarkan tingkat akurasi, presisi, serta Area Under Curve(AUC). Tabel 5. Confusion Matrix True IPS Pred IPS 54 Pred IPA 0 Class Recall 100.00%
True IPA 2 64 96.97%
class precisian 96.43% 100.00 %
Tabel 6. Evaluasi Algoritma Evaluasi Accurancy Precision AUC
Nilai 98.33% 96.43% 0.980
Tabel 6 Confusion Matrix adalah table korelasi antara algoritma dengan atribut. Sedangkan table 7 menjabarkan nilai akurasi algoritma decision tree terhadap pengolahan data sebesar 98.33%, dengan presisi 96.43% nilai tersebut mengartikan algoritma memiliki korelasi yang baik dengan atribut yang telah di proses oleh algoritma. Nilai AUC yang di dapatkan dari hasil klasifikasi algoritma terhadap data atribut sebesar 0.980, yang mengartikan proses klasifikasi yang dilakukan oleh decision tree terhadap atribut sangat baik. V. KESIMPULAN Dari hasil penelitian dengan menggunakan Decision tree dapat disimpulkan bahwa metode Decision tree mempunyai akurasi kecocokan dari hasil penjurusan yang sebenarnya terhadap prediksi. Hasil dari dari penelitian tersebut mendapatkan nilai akurasi 98.33%, dengan precision 96.43 dan memiliki nilai AUC 0.980 Sarannya dapat menggunakan data latih yang lebih banyak lagi dan memiliki atribut yang lebih beragam dan dapat mencoba dengan metode- metode yang lain lagi selain dengan Decision tree.
Simposium Nasional Ilmu Pengetahuan dan Teknologi (SIMNASIPTEK) 2017 ISBN: 978-602-61268-4-9
UCAPAN TERIMAKASIH Penulis mengucapkan terimakasih kepada Prof.Dr.Ir.R. Eko Indrajit selaku dosen mata kuliah Business Intelligence yang telah banyak membantu dalam meneyelesaikan penyusunan penelitian tersebut, serta kepada orang tua, teman-teman seperjuangan yang telah bnayak mendukung dalam menyelesaikan penyususnan penelitian tersebut. REFERENSI Ayu Purwarianti, (2010). Sistem Informasi Inteligen. Magister Informatika STEI ITB. Han, Jiawei, Micheline Kamber, (2006), Data Mining Concept and Techniques (2nd edition), Morgan Kaufmann Publish. Ian H. Witten, Eibe Frank,(2005), Data Mining : Practical Machine Learning Tools and Techniques, Second Edition, Morgan Kaufmann Publishers. Jian Wang Bo Yuan Wenhuang Liu. (2008). Application of Decision Trees in Mining High-Value Credit Card Customers. Proceedings of the 11th Joint Conference on Information Sciences. Q. Wang, Y. Wu, J. Xiao, and F. Guang, (2007). The Applied Research Based on Decision Tree of Data Mining In Third-Party Logistics”, IEEE International Conference on Logistics, pp. 1540-1544. Tsang, Smith, Ben Kao, Kevin Y.Yipi, Wai shing Ho,and sau Dan Lee. Decision Tree for Uncertain Data. IEEE Computer Society. 2009 Eko Sudaryanto, “Pengaruh Minat Belajar dan Penjurusan Terhadap Prestasi Belajar Siswa di SMK Katolik ST Lois Randublatung”, Skripsi Fakultas Keguruan dan Ilmu Pendidikan, Universitas Muhammadia Surakarta, Surakarta, 2009. Bahar, “Penentuan Jurusan Sekolah Menengah Atas Dengan Algoritma Fuzzy C-Means”, Tesis Magister Komputer, Universitas Dian Nuswantoro, Semarang, 2011.
Munawaroh Holisatul dkk, “ Perbandingan Algoritma ID3 Dan C5.0 Dalam Identifikasi Penjurusan Siswa SMA”, Jurnal Sarjana Teknik Informatika , Vol. 1, No. 1, pp. 1-12, Juni, 2013. Kustiyaningsih Yeni dkk, “Sistem Pendukung Keputusan Untuk Menentukan Jurusan Pada Siswa SMA Menggunakan Metode KNN Dan SMART”, Fakutas Teknik Universitas Trunojoyo, Bangkalan, 2010. Herawati Rosita, “Rekomendasi Penjurusan di SMU YSKI dengan Algoritma K-Means”, Fakultas Ilmu Komputer Universitas Soegijapranata, Semarang, 2012. Fathoni Muhammad dan Saniman, “Jurnal Pengantar Algoritma dan Pemrograman”, Jurnal Saintikom, Vol.4, No.1, pp.120-133, Januari 2008. Pressman Roger S., “Software Engineering : Practitioner’s Approach 7th Edition”. McGraw-Hill, Inc, New York, 2012. PROFIL PENULIS Mira Kusmira. Lahir pada tanggal 01 Oktober 1988 di Tasikmalaya. Memperoleh gelar Sarjana Teknik Informatika (S.T) dari Universitas Bina Sarana Informatika Bandung pada tahun 2011. Richardhus Eko Indrajit. Guru besar Ilmu Komputer di ABFI Institute Perbanas. Memperoleh Gelar Master of Science di bidang Applied Computer Science dari Hardvad University (Massachusetts, USA) dengan fokus bidang Articial Intelligence. Gelar Doctor of Business Administration dari University of the City of Manyla (Intramuros, Philipines).
Prosiding SIMNASIPTEK: Hal. A-53