Vol. 2, No. 1, 2014
Jurnal Komputasi
©2014 Ilmu Komputer Unila Publishing Network all right reserved
Membangun Rule Dengan Algoritma Iterative Dichotomiser 3 (Id3) Untuk Penjurusan Siswa SMA 1
Didik Kurniawan, 2Anie Rose Irawati, 3Hilman hudaya 1
Jurusan Ilmu Komputer FMIPA Unila Jurusan Ilmu Komputer FMIPA Unila 3 Jurusan Ilmu Komputer FMIPA Unila 2
Abstract Indonesian Senior High School has a policy to decide the majors for the student that match their interests, talents and abilities. By developing an auto learning decision support system with iterative dichotomiser 3 (ID3) algorithms help the teachers to make decision for student majoring. ID3 algorithms is a part of learning techniques of artificial intelligence. By using data sample from the past as training data, the system then will be able to give a decision support that can be used as a reference for teachers to majoring students. To get a good decision accuracy required training data with wide variation. The result showed the more vary of training data the higher accuracy of the decision result. Keywords: Artificial intelligence, decide SHS students majors, Decision Support System (DSS), Iterative Dichotomiser (ID3) algorithms, rule.
1
Pendahuluan
Pada jenjang pendidikan SMA memiliki sistem khusus yaitu penjurusan yang dilaksanakan oleh siswa kelas X yang akan naik ke kelas XI, dimana siswa akan ditempatkan di jurusan yang sesuai dengan minat, bakat, dan kemampuan siswa itu sendiri. Pada umumnya SMA memiliki tiga jurusan yaitu jurusan IPA, IPS, dan bahasa. Penentuan jurusan bagi siswa dilakukan dengan penilaian terhadap kriteria-kriteria tertentu dan pada akhirnya guru yang akan memutuskan. Sering kali guru memutuskan berdasarkan perhitungan yang sederhana seperti hanya berdasarkan kemampuan dominan dari siswa atau hanya mengandalkan minat dari siswa itu sendiri. Kurangnya konsistensi dalam menentukan keputusan oleh guru (masih bersifat subyektif) serta perbedaan keputusan antar guru menjadi kelemahan dari sistem yang sedang berjalan. Hal ini berujung pada keputusan yang bersifat tidak adil. Faktor utamanya adalah karena banyaknya siswa yang akan ditentukan jurusannya sehingga sulit untuk menganalisis jurusan yang sesuai dengan bakat, minat, dan kemampuanya. Teknik learning dapat membuat komputer sanggup untuk belajar dari data-data yang telah diberikan. Teknik learning juga dapat menjadikan data-data baru yang telah diujikan menjadi pengalaman (experience) dan akan membuat sistem semakin pakar sehingga dengan menerapkan teknik learning maka SPK dapat beradaptasi dengan kebutuhan pengguna secara otomatis. Algoritma Iterative Dichotomiser 3 (ID3) adalah algoritma bagian dari decision tree learning dimana ID3 membangkitkan decision tree dari sampel-sampel yang diberikan untuk dipelajari dan menghasilkan aturan (rule). Rule tersebut akan digunakan untuk menghasilkan suatu keputusan yang menjadi acuan oleh pengambil keputusan dalam menentukan keputusan. Pada penelitian ini rule akan diimplementasikan pada sistem penjurusan SMA yang diharapkan akan membantu guru dalam melakukan penjurusan siswa. ID3 pada decision tree learning menggunakan data-data valid yang digunakan sebelumnya untuk mendapatkan rule dan mencari dukungan keputusan jurusan yang diambil. SPK tersebut akan dibangun berbasiskan web sehingga dapat diakses atau digunakan oleh komputer lain tanpa harrus meng-install aplikasinya.
http://jurnal.fmipa.unila.ac.id/index.php/komputasi
Hal 42 dari 74
Vol. 2, No. 1, 2014
Jurnal Komputasi
©2014 Ilmu Komputer Unila Publishing Network all right reserved
2
Metode Penelitian
2.1
Decision Tree Learning
Decicion tree learning adalah suatu metode belajar yang sangat populer dan banyak digunakan secara praktis. Metode ini merupakan metode yang berusaha menemukan fungsi-fungsi pendekatan yang bernilai diskrit dan tahan terhadap data-data yang terdapat kesalahan (noise data) serta mampu mempelajari ekspresi-ekspresi disjungtive (ekspresi OR). Iterative Dichotomiser 3 (ID3), ASSISTANT, dan C4.5 merupakan jenis dari decision tree learning. Dalam membangun decision tree learning dibutuhkan evaluasi semua atribut yang ada menggunakan suatu ukuran statistik untuk mengukur efektifitas suatu atribut dalam mengklasifikasikan kumpulan sampel data. Dalam hal ini information gain adalah yang paling banyak digunakan [7]. Berikut adalah cara untuk mencari suatu informasi gain dari suatu atribut. 1. Entropy Dalam mengitung information gain terlebih dahulu harus memahami suatu ukuran lain yang disebut entropy. Di dalam bidang information theory, entropy sering digunakan sebagai suatu parameter untuk mengukur heterogenitas (keberagaman) dari suatu sampel data. Entropy adalah ukuran ketidakpastian dimana semakin tinggi entropy, maka semakin tinggi ketidakpastian [6]. Dengan pohon keputusan, pengukuran ini digunakan untuk menentukan seberapa informatif sebuah simpul. Jika kumpulan sampel semakin heterogen, maka nilai entropy-nya semakin besar. Secara matematis entropy dirumuskan sebagai berikut: 𝑒𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑𝑐𝑖 −𝑝𝑖 𝑙𝑜𝑔2 𝑝𝑖 ............... (1) 2. Information Gain Setelah mendapatkan nilai entropy untuk suatu kumpulan sampel data, maka kita dapat mengukur efektivitas suatu atribut dalam menglasifikasikan data. Information Gain (juga dikenal sebagai hanya Gain) menggunakan entropy untuk menentukan atribut yang terbaik yang digunakan untuk menciptakan perbedaan [6]. Dengan menghitung Gain, kita menentukan tingkatan entropy dengan menggunakan atribut tersebut. Jadi, kolom dengan Gain yang lebih tinggi akan digunakan sebagai node dari pohon keputusan. Ukuran efektifitas ini disebut sebagai information gain. Secara matematis, intormation gain dari suatu atribut A, dituliskan sebagai berikut: 𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) − ∑𝑣∈𝑉𝑎𝑙𝑢𝑒𝑠(𝐴)
2.2
|𝑆𝑣 | |𝑆|
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑣 ) .............. (2)
Iterative Dichotomiser 3 (ID3)
ID3 adalah algoritma decision tree learning (algoritma pembelajaran pohon keputusan) yang menggunakan strategu pencarian hill-climbing, yaitu dimulai dari pohon kosong, kemudian secara progresif berusaha menemukan sebuah pohon keputusan yang mengklasifikasikan sampel-sampel data secara akurat tanpa kesalahan. Pertumbuhan cabang-cabang pohon keputusan pada lgoritma ID3 dilakukan sampai pohon tersebut mampu mengklasisifikasikan sampel data secara akurat dengan tingkat kebenaran 100 % sesuai dengan data latih [7].
http://jurnal.fmipa.unila.ac.id/index.php/komputasi
Hal 43 dari 74
Vol. 2, No. 1, 2014
Jurnal Komputasi
©2014 Ilmu Komputer Unila Publishing Network all right reserved
Gambar 1. Algoritma ID3[7]
3
Pembahasan
3.1
Learning
Tahapan learning adalah proses pembelajaran data latih untuk mendapatkan suatu pohon keputusan. Dengan mengimplementasikan algoritma Iterative Dichotomiser 3(ID3) terhadap data latih pada Tabel 1 yang memiliki keberagaman yang baik maka akan mendapatkan pohon keputusan pada Gambar 2.
No 1 2 3 4 5 6 7 8 9
Nilai IPA Baik Cukup Kurang Baik Cukup Kurang Baik Cukup Kurang
Tabel 1. Sampel data / data latih A Nilai IPS Nilai BHS Bakat Minat Cukup Baik BHS IPS Cukup Baik IPS BHS Cukup Cukup IPA IPA Baik Baik IPA IPA Baik Kurang IPS BHS Baik Kurang BHS IPS Kurang Cukup BHS IPA Kurang Kurang IPS BHS Kurang Cukup IPA IPS
http://jurnal.fmipa.unila.ac.id/index.php/komputasi
Keputusan IPS BHS IPS IPA IPS IPS IPA IPA BHS
Hal 44 dari 74
Vol. 2, No. 1, 2014
Jurnal Komputasi
©2014 Ilmu Komputer Unila Publishing Network all right reserved
Gambar 2. Pohon keputusan perhitugan otomatis / pohon keputusan A Dari pohon keputusan pada Gambar 2 makan dapat dibuat suatu rule pada gambar 3. If ( (nIIPS==’baik’ and minat==’IPA’) or (nIPS==’kurang’ and minat=’IPA’) or (nIPS==’kurang’ and minat=’BHS’) ) Keputusan=’IPA’ Else if ( (nIIPS==’baik’ and minat==’IPS’) or (nIIPS==’baik’ and minat==’BHS’) or (nIIPS==’cukup’ and minat==’IPA’) or (nIIPS==’cukup’ and minat==’IPS’) ) Keputusan=’IPS’ Else if ( (nIIPS==’cukup’ and minat==’BHS’) or (nIIPS==’kurang’ and minat==’IPS’) ) Keputusan=’BHS’
Gambar 3. Rule
3.2
Pengujian Hasil Keputusan
Pengujian hasil keputusan ini adalah mengetahui seberapa besar tingkat akurasi dari hasil keputusan yang dikeluarkan. Pada pengujian ini peneliti dibantu oleh guru pelatih untuk memberitahu keputusan yang dihasilkan benar atau salah dengan menggunakan rule pada Gambar 3. 1.
Pengujian petama Pada pengujian pertama data latih akan diujikan dengan data latih itu sendiri untuk mengetahui seberapa baik algoritma ini mengidentifikasi dirinya sendiri. Hasil dari pengujian pertama terangkum pada Tabel 2. Data Uji Data Latih A
Tabel 2 Hasil pengujian pertama terhadap data latih A Keputusan tidak tepat Akurasi 100%
http://jurnal.fmipa.unila.ac.id/index.php/komputasi
Hal 45 dari 74
Vol. 2, No. 1, 2014
Jurnal Komputasi
©2014 Ilmu Komputer Unila Publishing Network all right reserved
2.
Pengujian kedua Pada pengujian kedua data uji yang digunakan adalah data yang belum pernah diketahui atau dilatih sebelumnya untuk mengetahui tingkat akurasi dari setiap data latih terhadap data yang belum pernah diketahui. Jika diketahui data uji menghasilkan keputusan pada Gambar 4 dibandingkan dengan hasil pengujian dengan data latih A maka hasil dari pengujian keempat dapat dilihat pada Tabel 3.
Gambar 4 Data uji Tabel 7 Hasil pengujian keempat dengan data uji belum pernah diketahui Data Latih Keputusan Tidak Tepat Akurasi A 8 (No: 1,5,6,7,8,10,14,15) 60%
4
Kesimpulan
4.1
Kesimpulan
Berdasarkan hasil penelitian yang telah dilakukan dapat disimpulkan beberapa hal sebagai berikut ; 1. Rule telah berhasil dibangun untuk membantu guru atau sekolah dalam menentukan jurusan siswa SMA sesuai dengan kebutuhan. 2. Algoritma ID3 dapat diimplementasikan oleh sistem sehingga sistem dapat membuat pohon keputusan secara otomatis.
http://jurnal.fmipa.unila.ac.id/index.php/komputasi
Hal 46 dari 74
Vol. 2, No. 1, 2014
Jurnal Komputasi
©2014 Ilmu Komputer Unila Publishing Network all right reserved
3. Algoritma ID3 dapat mengidentifikasi dengan sempurna data latih yang diujikan kembali dengan catatan data latih tidak memiliki data ganda/noise. 4. Data latih yang baik adalah data latih dengan parameter yang beragam dan berimbang. 5. Jumlah data latih mempengaruhi rule yang diberikan dan semakin banyak data latih maka semakin baik dan kompleks rule yang didapatkan
4.2
Saran
Beberapa saran yang diberikan untuk pengembangan penelitian ini lebih lanjut adalah sebagai berikut ; 1. Perlunya dibuat suatu sistem yang memfasilitasi rule yang didapatkan menjadi suatu program yang dapat langsung digunakan oleh guru dalam mencari keputusan. 2. Perlunya dibuat suatu sistem auto learning pada pengembangan berikutnya sehingga rule yang diperoleh semakin baik.
5
Daftar simbol c pi A V Values(A) |Sv| |S| Entropy(Sv)
6
= = = = = = = =
jumlah nilai yang ada pada atribut target (jumlah kelas klasifikasi) menyatakan jumlah sampel untuk kelas i atribut menyatakan nilai yang mungkin untuk atribut A himpunan nilai-nilai yang mungkin untuk atribut A jumlah sampel untuk nilai v jumlah sampel data entropy untuk sampel-sampel yang memiliki nilai v
Refference
[1]
Ariani, Pepi Dwi. Sistem Pendukung Keputusan Pemilihan Jurusan SMK Menggunakan NeuroFuzzy. Undergraduate Thesis, Institut Teknologi Sepuluh Nopember: Surabaya (2010) [2] Desiani, A. dan Muhammad Arhami. Konsep Kecerdasan Buatan. Palembang: ANDI (2006) [3] Fitriyani. Sistem Pendukung Keputusan Penjurusan Sma Menggunakan Metode AHP. Seminar Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Semantik 2012). ISBN 979 - 26 0255 – 0. Jurusan Sistem Informasi, STMIK Atma Luhur Pangkalpinang (2012) [4] Setiawan, Bambang. Perancangan Sistem Pendukung Keputusan (Spk) Untuk Menentukan Kelaiklautan Kapal : Studi Kasus Di Kantor Administrasi Pelabuhan Klas Utama Tj. Perak Surabaya. Master Thesis, Institut Teknologi Sepuluh Nopember: Surabaya (2010) [5] Siswoutomo, Wiwit. PHP Undercover Mengungkap Rahasia Pemrograman PHP. Jakarta: Elex Media Komputindo (2005) [6] Slocum, Mary. Decision Making Using ID3 Algorithm. Rivier Academic Journal, Volume 8, Number 2, Fall. M.S. Program in Computer Science, Rivier University (2012) [7] Suyanto. Artificial Intelegent (Cetakan kedua). Informatika: Bandung (2011) [8] Sutojo. T, Edy Mulyanto, Vincent Suhartono. Kecerdasan Buatan. Semarang: ANDI (2011) [9] Rosa A. S dan Salahudin. Rekayasa Perangkat Lunak. Modula: Bandung (2011) [10] Utami, Winda Pangesti. Penerapan Algoritma Iterative Dichotomiser Three untuk Pemilihan Dosen Pembimbing. Universitas Kristen Satya Wacana: Jawa Tengah (2012) [11] Wahyudin. Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru. Jurnal Pendidikan Teknologi Informasi Dan Komunikasi (PTIK). ISSN 1979-9462. Universitas Pendidikan Indonesia: Bandung (2009) [12] Wibowo, Bagus Ari. Perancangan dan Implementasi Sistem Pendukung Keputusan untuk Jalan Menggunakan Metode ID3 (Studi Kasus BAPPEDA Kota Salatiga). Universitas Kristen Satya Wacana: Jawa Tengah (2011)
http://jurnal.fmipa.unila.ac.id/index.php/komputasi
Hal 47 dari 74