PENGAMBILAN POLA KELULUSAN TEPAT WAKTU PADA MAHASISWA STMIK AMIKOM YOGYAKARTA MENGGUNAKAN DATA MINING ALGORITMA C4.5
Naskah Publikasi
diajukan oleh Muchamad Piko Henry Widiarto 04.22.0400
kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA 2011
i
ii
PATTERN MAKING ON-TIME GRADUATION ON THE STUDENT STMIK AMIKOM YOGYAKARTA USING C4.5 ALGORITM DATA MINING
PENGAMBILAN POLA KELULUSAN TEPAT WAKTU PADA MAHASISWA STMIK AMIKOM YOGYAKARTA MENGGUNAKAN DATA MINING ALGORITMA C4.5
Muchamad Piko Henry Widiarto Jurusan Sistem Informasi STMIK AMIKOM YOGYAKARTA
ABSTACT
Progress of sophisticated computer applications have helped performance of big companies which requires an application that need an application that can perform calculation of big amounts of data. Data mining is a process of discovering meaningful connections, patterns, and trends by examining the large collection of data stored in storage by using pattern recognition techniques such as statistics and mathematics. Therefore, data mining is indispensable in helping make decisions with the results of data using one algorithm is applicable. Purpose of the implementation of the "data mining" of C4.5 algorithm on STMIK AMIKOM Yogyakarta is help a manager of data management systems of student graduation improving the quality of education. Due to the frequent occurrence of buildup of students which not graduate on time according to education level in each period of graduation. Therefore, implementation of data mining will help classify the student data which will then be calculated using the C4.5 algoritm and the patterns are accurate decisions.
Keywords: Data mining, C4.5 Algoritm, Computer System
iii
1.
Latar Belakang Masalah STMIK AMIKOM Yogyakarta merupakan salah satu perguruan tinggi yang
sukses menarik banyak mahasiswa disetiap periodenya. Namun ada beberapa hal yang tidak seimbang antara masuk dan keluarnya mahasiswa yang telah menyelesaikan studinya. Mahasiswa yang masuk dalam jumlah besar, tetapi mahasiswa yang lulus tepat waktu sesuai dengan ketentuan jauh sangat kecil dibandingkan masuknya. Sehingga terjadi penumpukan mahasiswa dalam jumlah tinggi disetiap periode kelulusan. Oleh karena itu untuk meningkatkan kualitas pada perguruan tinggi STMIK AMIKOM Yogyakarta, maka haruslah ada filter pada mahasiswa yang mendaftar untuk masuk. Data mining merupakan salah satu metode yang tepat untuk membentuk polapola yang mungkin memberikan indikasi yang bermanfaat pada data mahasiswa yang dalam jumlah besar. Pada data mining ini dapat dirumuskan sebuah permasalahan yang dijadikan sebagai acuan yaitu proses Algoritma C4.5 menentukan mahasiswa yang akan lulus tepat waktu sesuai dengan ketentuan jenjang pendidikan yang diambil. 2.
Landasan Teori
2.1.
Data mining Menurut Gartner Group, data mining adalah suatu proses menemukan hubungan
yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika (Larose, 2005). Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidangbidang ilmu yang sudah mapan terlebih dulu. Berawal dari beberapa disiplin ilmu, data mining bertujuan untuk memperbaiki teknik tradisional sehingga bisa menangani: 1.
Jumlah data yang sangat besar
2.
Dimensi data yang tinggi
3.
Data yang heterogen dan berbeda bersifat
2.2.
Teknik Data Mining
2.2.1
Klasifikasi Teknik Klasifikasi dalam data mining dikelompokkan ke dalam Teknik Pohon
Keputusan, Bayesian (Naïve Bayesian dan Bayesian Belief Networks), Jaringan Saraf Tiruan (Backpropagation), Teknik yang berbasis konsep dari penambangan aturanaturan asosiasi, dan teknik lain (k-Nearest Neighboor, algoritma genetik, teknik dengan pendekatan himpunan rough dan fuzzy.)
1
Setiap teknik memiliki kelebihan dan kekurangannya sendiri. Data dengan profil tertentu mungkin paling optimal jika diklasifikasi dengan teknik tertentu, atau dengan kata lain, profil data tertentu dapat mendukung termanfaatkannya kelebihan dari teknik ini.
Gambar 2.2 Pengelompokan Teknik Klasifikasi Secara umum, Proses Klasifikasi dapat dilakukan dalam dua tahap, yaitu proses belajar dari data pelatihan dan klasifikasi kasus. Pada proses belajar, Algoritma Klasifikasi mengolah data training untuk menghasilkan sebuah model. Setelah model diuji dan dapat diterima, pada tahap klasifikasi, model tersebut digunakan untuk memprediksi kelas dari kasus baru untuk membantu proses pengambilan keputusan (Han et al.,2001; Quinlan, 1993). 2.3
Pohon Keputusan Pohon Keputusan atau Decision Tree merupakan metode klasifikasi dan prediksi
yang sangat kuat dan terkenal. Metode Pohon Keputusan mengubah fakta yang sangat besar menjadi Pohon Keputusan yang merepresentasikan aturan. Aturan dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat diekspresikan dalam bentuk bahasa database seperti SQL untuk mencari record pada kategori tertentu. Pohon Keputusan adalah sebuah struktur pohon dimana setiap node pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu pembagian hasil uji, dan node daun merepresentasikan kelompok kelas tertentu. Level node teratas dari sebuah Pohon Keputusan adalah node akar yang biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara top-down untuk solusinya. 2.4
Algoritma C4.5 Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai
berikut. 1.
Pilih atribut sebagai node akar.
2.
Buat cabang untuk tiap-tiap nilai.
3.
Bagi kasus dalam cabang.
2
4.
Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama. Untuk memilih atribut sebagai node akar, didasarkan pada nilai Gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung Gain digunakan rumus seperti tertera dalam persamaan berikut: Gain(S,A) = Entropy(S) – ∑
| | | |
* Entropy(Si)
Keterangan : S : himpunan kasus A : atribut n : jumlah partisi atribut A | |
: jumlah kasus pada partisi ke-i
| | : jumlah kasus dalam S Sebelum mendapatkan nilai Gain adalah mencari nilai Entropy. Entropy digunakan untuk menentukan seberapa informatif sebuah masukan atribut untuk menghasilkan keluaran atribut. Rumus dasar dari Entropy tersebut adalah sebagai berikut : Entropy(S) = ∑ Keterangan : S : himpunan Kasus A : fitur n : jumlah partisi S pi : proporsi dari Si terhadap S 2.5
Java Java telah mengakomodasi hampir seluruh fitur penting bahasa – bahasa
pemrograman yang ada semenjak perkembangan komputasi modern manusia. Sebagai sebuah bahasa pemrograman, Java dapat membuat seluruh bentuk aplikasi, desktop, web dan lainnya, sebagaimana dibuat dengan menggunakan bahasa pemrograman konvensional yang lain. Java adalah bahasa pemrograman yang berorientasi obyek (OOP) dan dapat dijalankan pada berbagai platform sistem operasi. Perkembangan Java tidak hanya terfokus oada satu sistem operasi, tetapi dikembangkan untuk berbagai sistem operasi dan bersifat open source. Sebagai sebuah peralatan pembangun, teknologi Java menyediakan banyak tool: compiler, interpreter, penyusun dokumentasi, paket kelas dan sebagainya.Aplikasi dengan teknologi Java secara umum adalah aplikasi serba guna yang dapat dijalankan pada seluruh mesin yang memiliki JRE. Berdasarkan white paper resmi dari SUN, Java memiliki karakteristik:Sederhana (Simple), Terdistribusi (Distributed), Interpreted, Robust, Secure, Portable, Performance., Multithreaded, dan Dynamic.
3
2.6
MySql MySQL merupakan software yang didistribusikan secara gratis walaupun ada
versi untuk komersial. Barulah sejak versi 3.23.19,
MySQL dikategorikan software
berlisensi GPL, yaitu dapat dipakai tanpa biaya untuk kebutuhan apapun. Awalnya, MySQL hanya dapat berjalan pada sistem operasi UNIX serta variannya. Namun kini, MySQL dapat diberbagai sistem operasi, termasuk Windows. MySQL menjadi database server open source yang sangat populer dan merupakan Database Relational (RDMS), yang mempunyai kemampuan yang sangat cepat untuk menjalankan perintah SQL dengan multi-thread dan mult-user. Dengan melihat kemampuannya, maka MySQL dijadikan database server yang handal tambahan feature terus dikembangkan agar lebih optimal. 3.
Analisis dan Perancangan Sistem
3.1
Analisis Sistem Analisis sistem yang dipaparkan dalam pembahasan ini merupakan gambaran
secara keseluruhan kendala-kendala yang ada dalam aplikasi data mining yang berbasis algoritma C4.5 pada sistem STMIK AMIKOM Yogyakarta.Dengan adanya sistem yang masih bersifat manual mengakibatkan proses sistem yang terjadi kurang efektif dan efisien. Data dari sistem adalah berupa atribut yang dimiliki oleh mahasiswa, nilai atribut, dan nilai kemungkinannya. Data yang dimaksud adalah data yang mempunyai minimal dua kolom atribut. Satu kolom sebagai kolom atribut masukan dan satu kolom sebagai kolom atribut target. Dari setiap kolom terdapat nilai-nilai yang akan dipergunakan untuk kalkulasi, dan nilai dari setiap atribut harus bersifat diskret. Ketentuan lain yang harus dipenuhi agar masukan dapat diproses dengan lancar adalah peletakan kolom target harus berada pada posisi terakhir dari kolom pada tabel masukan. Sistem akan membaca masukan dengan atribut target berada pada kolom terakhir dari tabel, maka dari itu selain kolom terakhir sistem akan mengenalinya sebagai atribut masukan dari sistem.Beberapa komponen variable yang digunakan yaitu : 1
NEM. Variabel nem berisi seluruh kemungkinan nem yang dimiliki oleh mahasiswa untuk diisi pada proses input program. Nilai yang sudah ditentukan pada program ini antara lain 0-3.99, 4-6.99, 7-10.
2
Jurusan SMA. Variabel Jurusan SMA berisi seluruh kemungkinan jurusan yang diambil oleh mahasiswa sebelum masuk perguruan tinggi. Nilai yang sudah ditentukan pada program berdasarkan hasil pengelompokan survei antara lain ipa, ips, bahasa, smk.
3
Jurusan Kuliah. Variabel jurusan kuliah beriisi seluruh kemungkinan jurusan yang akan diambil oleh mahasiswa pada perguruan tinggi STMIK AMIKOM Yogyakarta. Pengelompokan jurusan kuliah dibagi menjadi 4 berdasarkan
4
ketentuan perguruan tinggi yaitu S1 Teknik Informatika, S1 Sistem Informasi, D3 Teknik Informatika, D3 Manajemen Informatika. 4
Konsentrasi. Variabel konsentrasi berisi data konsentrasi mata kuliah yang akan dipilih mahasiswa pada saat pertengahan kuliah. Pengelompokan yang ada berdasarkan ketentuan yang dibuat program adalah jaringan, pemrograman, multimedia.
5
Ekonomi. Variabel ekonomi adalah variabel yang berisi tentang keadaan ekonomi mahasiswa.Pilihan yang terdapat pada program ini antara lain dibedakan menjadi tiga bagian yaitu atas, menengah, dan bawah.
6
Keputusan. Variabel keputusan merupakan data yang berfungsi untuk menentukan hasil keputusan. Dalam pengelompokan data sudah ditentukan secara tetap agar tidak terjadi kesalahan dalam perhitungan proses program. Data keputusan hanya memiliki dua buah nilai yaitu “ya” dan “tidak”.
3.1.1
Analisis Model Berikut ini adalah penjelasan lebih terperinci mengenai tiap-tiap langkah dalam
pembentukan
pohon
keputusan
dengan
menggunakan
algoritma
C4.5
untuk
menyelesaikan permasalahan dalam tugas akhir ini.Salah satu proses kalkulasi dari entropy adalah proses kalkulasi nilai entropy TOTAL yaitu dengan jumlah sampel 36 data. Table 3.1 Tabel Data Informasi NEM
Jur. SMA
Jur. Kul.
Konsent.
Ekonom.
Keputusan
0-3.99=7
ipa=17
S1TI=13
Jaringan=21
Atas=9
Ya=21
4-6.99=16
ips=7
S1SI=6
Pemrograman=8
Menengah=18
Tidak=15
7-10=13
bahasa=11
D3TI=3
Multimedia=7
Bawah=9
smk=1
D3MI=14
Table 1
Gain(S,A) = Entropy(S) – ∑
| | | |
* Entropy(Si) Entropy(S) = ∑
Keterangan : S
: himpunan kasus
A
: atribut
n
: jumlah partisi atribut A
Keterangan : S
: himpunan Kasus
A
: fitur
n : jumlah partisi S
Si : jumlah kasus pada partisi ke-i
pi : proporsi dari Si terhadap S
S : jumlah kasus dalam S
5
pi
Dengan menggunakan rumus Algoritma C4.5 maka hasil yang didapat adalah seperti yang tertera pada tabel di bawah ini : Table 3.3 Tabel Data Hasil Kalkulasi node 1 total nem
s 36
ya 21
tidak entropy 15 0,979869
0 - 3.99 4 - 6.99 7 - 10
7 16 13
3 10 8
4 0,985228 3 0,876614 5 0,961237
ipa ips bahasa smk
17 7 11 1
8 6 7 0
9 0,997503 1 0,591673 4 0,94566 1 0
13 6 3 14
5 5 2 9
8 1 1 5
21 8 7
13 3 5
8 0,958712 5 0,954434 2 0,863121
9 18 9
7 11 3
2 0,764205 7 0,964079 6 0,918296
1
0
gain 0,051577
jur Sma
0,104827
jur kul S1 TI S1 SI D3 TI D3 MI konsentrasi jaringan pemrograman multimedia ekonomi atas menengah bawah 1,1 jur Sma = smk
0,082227 0,961237 0,650022 0,918296 0,940286 0,040695
0,077204
1
0
Dari tabel hasil kalkulasi di atas dapat kita lihat hasil entropy dan gain yang diperoleh oleh masing-masing atribut. Dan dapat dilihat juga hasil pohon keputusan berdasarkan kolom node yang dihasilkan. Pada node pertama dihasilkan variabel Jurusan SMA sebagai pohon pertama. Pohon pertama ditentukan dari melihat hasil gain terbesar. Setelah itu untuk menentukan hasil keputusan akhir dapat dilihat dari hasil entropy yang hasilnya nol. Apabila telah di dapat hasil entropy nol maka selanjutnya kita lihat hasil variabel keputusan yang paling banyak nilainya. Dari yang terbanyak nilainya maka akan menjadi hasil penentu keputusan akhir atau bisa dipastikan untuk hasil keputusannya adalah tidak.
Gambar 3.1 Bukti hasil pohon keputusan dari program.
6
Gambar pohon keputusan di atas menunjukkan hasil dari perhitungan diatas dengan hasil dari program yang telah dibuat terbentuklah sebuah pola. Dimulai dari pohon pertama yaitu jurusan sma, selanjutnya jurusan sma yang bernilai smk langsung menuju pola dengan keputusan tidak,selanjutnya masing-masing variabel tersebut mempunyai pola keputusannya masing-masing. 3.2 Perancangan Sistem 3.2.1
Perancangan Alur Sistem Dalam aplikasi ini, rancangan alur program dituangkan kedalam alur program
(Flowchart) terlebih dahulu. Alur program dalam sistem data mining ini adalah sebagai berikut :
Gambar 3.2 Flowchart Sistem 3.2.2
Perancangan Use Case Diagram Use Case
diagram adalah suatu bentuk diagram yang menggambarkan
fungsionalitas yang diharapkan dari sebuah sistem dilihat dari perspektif pengguna diluar sistem.
Gambar 3.3 Use Case Diagram
7
Dari gambar diatas terlihat bahwa ada satu actor yaitu user.User di atas hanya ada satu yaitu yang berfungsi sebagai admin. User tersebut dapat melakukan aktifitas memasukkan data, mengubah data, melihat pohon keputusan, menghapus data menguji atribut identitas, tambah data, hapus data, edit data, dan melihat pohon keputusan. 3.2.3
Perancangan Activity Diagram Activity Diagram merupakan suatu diagram yang dapat menampilkan secara
detail urutan proses dari aplikasi. Perancangan aplikasi data mining ini dapat digambarkan dengan menggunakan Activity Diagram sebagai berikut :
Gambar 3.4 Activity Diagram Dari gambar Activity Diagram diatas dapat dilihat bahwa aplikasi data mining STMIK AMIKOM Yogyakarta memiliki empat komponen yaitu Proses Pembentukan Pola, Visualisasi Pohon Keputusan, Pola Keputusan, dan Identitas Mahasiswa. Saat pertama kali membuka aplikasi, maka user akan langsung masuk ke halaman utama. Di halaman utama ini, user dapat memilih operasi yang diinginkan. Dengan memilih operasi proses data, user dapat melakukan penambahan data keputusan dengan memasukkan nilai-nilai atribut dan nilai kemungkinannya. Dari data yang telah diinputkan tersebut, kemudian user dapat melakukan pembentukan pohon keputusan dengan menekan button proses. Proses kedua dalam aplikasi ini yaitu pohon keputusan. Saat tampil halaman pohon keputusan, maka user harus menekan button tampilkan untuk memicu terbentuknya pohon keputusan. Proses selanjutnya adalah pola keputusan. Pada halaman pola keputusan ini, user diminta untuk menginputkan atribut-atribut yang dimiliki oleh seorang mahasiswa untuk dicocokkan dengan pohon keputusan yang telah terbentuk.
8
4.
Implementasi dan Pembahasan
4.1
Implementasi Sistem Implementasi sistem bertujuan untuk memastikan bahwa sistem yang dibangun
dapat
bekerja
dengan
baik
dan
sesuai
yang
diharapkan.
Sebelum
sistem
diimplementasikan dalam kehidupan sehari-hari maka sistem harus dipastikan telah bebas dari kesalahan. Kesalahan-kesalahan yang mungkin terjadi yaitu penulisan bahasa, kesalahan tampilan, dan kesalahan proses pada saat dioperasikan. Untuk dapat mengetahui kesalahan-kesalahan pada sistem yang dibangun maka harus dilakukan pengujian terhadap sistem tersebut. 4.2
Implementasi Interface
4.2.1
Halaman Utama Form Halaman Utama adalah halaman yang pertama kali muncul setelah aplikasi
dijalankan.
Gambar 4.1 Halaman Utama 4.2.2
Halaman Proses Pembentukan Pola Halaman form Proses Pembentukan Pola akan muncul setelah memilih menu
Proses Data. Halaman ini berfungsi untuk melakukan konversi data yang dipilih untuk membentuk pohon keputusan.
9
Gambar 4.2 Halaman Proses Pembentukan Pola Pada halaman ini terdapat dua bagian tombol yaitu bagian tombol atas yang terdiri dari Baru, Ubah, Simpan, Batal, dan Hapus berfungsi untuk mengolah data rule pada tabel dan yang kedua adalah bagian tombol bawah yang terdiri dari tombol Proses yang berguna untuk melakukan proses perhitungan menggunakan algoritma C4.5. Halaman ini membutuhkan beberapa class script program untuk melakukan proses tesebut. Diantara class itu adalah class fungsi yang berfungsi melakukan perhitungan dengan menggunakan algoritma C4.5. 4.2.3
Halaman Visualisasi Keputusan Halaman ini berisi visualisasi pohon keputusan yang dihasilkan dari pengolahan
tabel pada proses pembentukan pola keputusan yang dibuat.
Gambar 4.3 Halaman Visualisasi Keputusan
10
4.2.4
Halaman Identitas Mahasiswa Pada form ini berfungsi untuk melakukan penambahan dan perubahan data
identitas mahasiswa yang selanjutnya data ini akan berguna untuk diseleksi yang akan lulus tepat waktu dengan pola keputusan sebagai standar penilainnya. Data Identitas Mahasiswa ini akan tersimpan pada tabel Mahasiswa.
Gambar 4.4 Halaman Identitas Mahasiswa 4.2.5
Halaman Pola Keputusan Form ini berfungsi untuk menentukan proses keputusan mahasiswa yang
diprediksi lulus tepat waktu dan yang tidak. Data Mahasiswa diambil dari tabel Mahasiswa melalui form Tabel Identitas Mahasiswa dengan menekan tombol Cari.
Gambar 4.5 Halaman Pola Keputusan 4.2.6
Form Tabel Identitas Mahasiswa Form ini muncul setelah menekan tombol Cari pada Halaman Pola Keputusan.
Pada form ini berfungsi untuk mengambil data identitas mahasiwa untuk diperiksa dengan pola keputusan yang telah terbentuk.
11
Gambar 4.6 Form Tabel Identitas Mahasiswa 4.2.7
Form Konten Bantuan Form ini berisi mengenai cara penggunaan aplikasi data mining ini.
Gambar 4.7 Halaman Konten Bantuan
12
4.2.8
Halaman Tentang Halaman ini berisi informasi pembuat.
Gambar 4.8 Halaman Tentang 5.
Penutup
5.1
Kesimpulan Berdasarkan hasil penelitian dan pembahasan yang telah dilakukan dapat
diambil beberapa kesimpulan, antara lain: 1.
Data mining dapat digunakan untuk membantu manajemen STMIK AMIKOM Yogyakarta dalam menentukan keputusan kelulusan mahasiswa tepat pada waktunya sesuai pola yang terbentuk.
2.
Hasil penelitian ini sebagai gambaran bagi mahasiswa STMIK AMIKOM Yogyakarta implementasi teknik data mining di lapangan.
3.
Perancangan
pohon
keputusan
memudahkan
dalam
proses
penalaran
penentuan pola keputusan yang terbentuk. 4.
Sistem ini telah memberi kemudahan bagi user untuk menentukan hasil keputusan yang mudah dimengerti dalam bentuk visualisasi pohon keputusan.
5.
Data yang bisa diambil hanya file yang berekstensi *.csv (Comma Delimited).
6.
Dalam data mining ada data eksternal pendukung. Di dalam penelitian ini ada beberapa variabel data atau beberapa field tabel ditambahkan ke dalamnya seperti status ekonomi, konsentrasi secara spesifik.
13
5.2
Saran Mengingat keterbatasan yang dimiliki oleh penulis, baik pengetahuan, waktu,
maupun pemikiran, maka penulis dapat memberikan beberapa gambaran sebagai saran yang dapat dipakai sebagai acuan dalam pengembangan aplikasi ini di masa yang akan datang, antara lain: 1.
Dengan hasil kesimpulan point terakhir, memberikan saran kepada STMIK AMIKOM Yogyakarta agar menambah variabel pada form pengisian calon mahasiswa baru berupa range status ekonomi keluarga atau orangtua dan konsentrasi yang ingin diambil.
2.
Untuk membuat hasil pola data mining ini bisa optimal dan real di lapangan seperti apa yang ada dalam penelitian ini, hendaknya STMIK AMIKOM Yogyakarta membuat kategori Tugas Akhir atau Skripsi yang akan atau telah dikerjakan untuk mendukung variabel konsentrasi yang akan diambil.
3.
Menyempurnakan segala kekurangan program yang belum diketahui oleh penulis. Seperti hal menambah variabel-variabel data dari segi sosial dan psikologi mahasiswa yang analisanya dapat dilakukan pada jenjang magister maupun doktoral.
4.
Memberikan sistem yang baik dalam pembentukan pola keputusan basisdata yang ada.
14
DAFTAR PUSTAKA Anonim, 2009. Bab 10 Data mining, diakses dari
pada tanggal 3 Maret 2010.
Basuki,A dan Syarif,I , 2003. Decision Tree, diakses dari http://www2.eepisits.edu/~basuki/lecture/DecisionTree.pdf, pada 3 Maret 2010. Firmansyah,
K,
2010.
Sekilas
Data
mining,
diakses
dari
http://kikifirmansyah.blog.upi.edu/2010/02/27/sekilas-data-mining/#more-191, pada tanggal 15 Maret 2010. http://repository.usu.ac.id/bitstream/123456789/19859/3/Chapter%20II.pdf Kusrini, Luthfi,E.T, 2009. Algoritma Data mining. Yogyakarta: Andi. Larose,D.T, 2005. DiscoveringKnowledge in Data: An Introduction to Data mining. John Willey & Sons, Inc. Said,F.L, 2009. BAB I Konsep,Pengertian, Manfaat, dari
dan Tujuan Data mining, diakses
http://fairuzelsaid.wordpress.com/2009/10/27/data-mining-1-konsep-
pengertian-manfaat-dan-tujuan-data-mining/, pada tanggal 12 Maret 2010. Said,F.L,
2009.
Data
mining
–
Konsep
Pohon
Keputusan,
diakses
dari
http://fairuzelsaid.wordpress.com/2009/11/24/data-mining-konsep-pohonkeputusan/, pada tanggal 12 Maret 2010. Shaufiah,
2010.
Pengenalan
Data
mining,
diakses
dari
http://imeldas.blog.ittelkom.ac.id/blog/files/2010/03/Dami1_Introduction.pdf, pada 5 Maret 2010. Turban,E, dkk. 2005. Decicion Support Systems and Intelligent Systems. Yogyakarta: Andi Offset.
15
16