IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS MENGGUNAKAN METODE NAIVE BAYES
SKRIPSI Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I pada Program Studi Teknik Informatika Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta Oleh : AHMAD FIKRI MAURIZA L200100123
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA 2014
i
ii
iii
DAFTAR KONTRIBUSI Dengan ini saya menyatakan bahwa skripsi ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka. Berikut saya sampaikan daftar kontribusi dalam penyusunan skripsi: 1. Mas Setiawan sebagai rekan untuk pencarian data sebagai bahan olah data mining. 2. Saya sendiri yang mengolah data dan penghitungan metode naive bayes berdasarkan sumber-sumber pada buku, literatur dan internet.. 3. Aplikasi yang saya gunakan untuk membantu skripsi ini yaitu. a. WEKA 3.7.10. b. Microsoft Excel 2007. c. Excel2Arrf Converter V.1.0-Beta. d. Notepad ++ 4. Laptop yang
digunakan memiliki spesifikasi Processor Intel Dual-Core
2,30 GHz, Ram 3,00 GB, Hardisk 250 GB, VGA mobile Intel (R) 45 Express Chipset Family dengan ukuran memori 1341 MB. 5. Laporan diketik menggunakan software Microsoft Office 2007. 6. Yusuf Sulistyo Nugroho, S.T., M.Eng, selaku dosen pembimbing yang memberikan masukan dan arahan dalam penyusunan skripsi ini.
iv
Demikian pernyataan dan daftar kontribusi ini saya buat dengan sejujurnya. Saya bertanggungjawab atas isi dan kebenaran daftar diatas.
Surakarta,
Desember 2013
Ahmad Fikri Mauriza
Mengetahui : Pembimbing
Yusuf Sulistyo Nugroho, S.T,. M.Eng NIK : 100.1197
v
MOTTO DAN PERSEMBAHAN
MOTTO :
“Manfaatkan waktu dan kesempatan mu dengan sebaik-baiknya sebelum rasa penyesalan itu datang menghantuimu” -Ibu“Bismillah, semua hal itu pasti dapat kita taklukan dengan tangan kita bermodal niat dan usaha” -Penulis“Harapan besar membuat segala yang besar jadi mungkin” -Benjamin Franklin-
vi
PERSEMBAHAN :
Dengan mengucap syukur Alhamdulillah atas rahmad dan hidayah Allah SWT, akan kupersembahkan karya ini kepada orang-orang saya sayangi: 1. Bapak - Ibuku tercinta yang tak pernah lelah dalam memotifasiku dan mendoakan untuk meraih kesuksesan di dunia dan akhirat. 2. Nada dan Irsya sebagai adik, penghibur dan teman saat dirumah. 3. Keluarga besar H. Abdullah Syafii (mbah kakung) yang telah mendukung dan mendoakan di setiap langkahku agar dapat menyelesaikan kuliah lebih cepat dan menuju kesuksesan setiap lulus. 4. Devi, Asri, Nurul dan Lukman yang telah bersedia menjadi teman, sahabat, dan keluarga yang menemani hari-hari dengan keceriaan dan kebahagiaan. 5. Pak Nursito (Pak kost) dan teman-teman kost AL-FIKR yang sudah menemani mulai awal kuliah sampai lulus. 6. Teman-teman Teknik Informatika angkatan 2010 terutama teman-teman gembel dan kepompong yang telah menemaniku mulai semester 1 sampai semester 7 dan berjuang menempuh gelar sarjana bersama-sama. 7.
Keluarga besar Teknik Informatika UMS yang telah banyak memberikan ilmu dan pengalamannya.
8. Semua pihak yang tidak dapat saya sebutkan satu persatu atas semua hal yang telah diberikan.
vii
KATA PENGANTAR
Assalamu’alaikum warohmatullohi Wabarakatuh Puji syukur kehadirat Allah SWT, yang telah melimpahkan nikmat dan anugerah yang sangat luar biasa sehingga saya dapat menyelesaikan skripsi dengan baik yang berjudul “Implementasi Data Mining Untuk Memprediksi Kelulusan
Mahasiswa Fakultas Komunikasi
Dan
Informatika Ums
Menggunakan Metode Naive Bayes”. Skripsi ini disusun sebagai syarat wajib untuk menyelesaikan pendidikan jenjang Strata 1 pada Program Studi Teknik Informatika Universitas Muhammadiyah Surakarta. Atas selesainya skripsi ini tidak lepas dari dukungan dan bantuan dari berbagai pihak sehingga dapat berjalan dengan lancar dan sesuai harapan, oleh karena itu pada kesempatan ini penulis ingin menyampaikan banyak terima kasih kepada : 1. Allah SWT yang telah memberikan nikmat dan hidayahnya kepada penulis sehingga diizinkan untuk menyelesaikan skripsi ini. 2. Orang tua dan keluarga besar penulis yang telah memberikan segala dukungan berupa doa, moral dan materi. 3. Bapak Husni Thamrin, S.T, M.T., Ph.D selaku dekan Fakultas Komunikasi Dan Informatika Universitas Muhammadiyah Surakarta. 4. Bapak Dr. Heru Supriyono, M.Sc selaku ketua Program Studi Teknik Informatika.
viii
5. Bapak Yusuf Sulistyo Nugroho, S.T, M.Eng selaku pembimbing skripsi yang telah banyak membantu dalam memberikan petunjuk dan saran-saran dalam penyusunan skripsi ini. 6. Mas Setiawan sebagai partner dalam kolaborasi skripsi ini yang telah menemani mengerjakan skripsi dan membantu dalam pencarian data-data yang diperlukan dalam penyusunan skripsi. 7. Bapak dan ibu dosen pengampu mata kuliah pada Program studi teknik informatika yang telah memberikan ilmu serta pengalamannya kepada penulis. 8. Teman-teman Teknik Informatika khususnya angkatan 2010 kelas E yang telah mendukung dan menjadi teman yang sama-sama berjuang meraih gelar sarjana. 9. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang berperan dan membantu dalam penyelesaian skripsi ini. Semoga Allah SWT selalu melimpahkan nikmat dan hidayahnya kepada orang-orang yang telah membantu dalam kelacaran penyusunan ini. Penulis berharap semoga skripsi ini dapat bermanfaat bagi penulis dan orang lain untuk dikembangkan sehingga akan dapat menghasilkan penelitian-penelitan yang lebih baik lagi dari sebelum-sebelumnya. Wassalamu’alaikum Warohmatullohi Wabarokatuh. Surakarta, 20 Desember 2013
Penulis
ix
DAFTAR ISI
HALAMAN JUDUL ................................................................................... i HALAMAN PERSETUJUAN ..................................................................... ii HALAMAN PENGESAHAN ...................................................................... iii DAFTAR KONTRIBUSI ............................................................................. iv MOTTO DAN PERSEMBAHAN ................................................................ vi KATA PENGANTAR ................................................................................. viiii DAFTAR ISI ............................................................................................... x DAFTAR TABEL ........................................................................................ xiii DAFTAR PERSAMAAN ............................................................................ xiii DAFTAR GAMBAR ................................................................................... xiv ABSTRAKSI ............................................................................................... xvi BAB I
PENDAHULUAN .................................................................... 1 A. Latar Belakang .................................................................... 1 B. Rumusan Masalah ............................................................... 4 C. Batasan Masalah ................................................................. 4 D. Tujuan Masalah .................................................................. 5 E. Manfaat Penelitian .............................................................. 5 F. Sistematika Penulisan ......................................................... 6
BAB II
TINJAUAN PUSTAKA ............................................................ 8 A. Telaah Penelitian ................................................................ 8 B. Landasan Teori ................................................................... 11 x
1. Prediksi ......................................................................... 11 2. Kelulusan Mahasiswa .................................................... 12 3. Data Mining .................................................................. 12 4. Proses Data Mining ....................................................... 13 5. Naive Bayes .................................................................. 15 6. Weka ............................................................................. 15 BAB III
METODOLOGI PENELITIAN ................................................ 17 A. Waktu Dan Tempat Penelitian ............................................. 17 B. Peralatan Utama Dan Pendukung ........................................ 17 C. Alur Penelitian .................................................................... 18 D. Langkah Penelitian ............................................................. 21 1. Identifikasi Masalah ...................................................... 21 2. Pengumpulan Data ........................................................ 21 3. Kelengkapan Data Dan Kebutuhan ................................ 24 a. Cleaning Data .......................................................... 24 b. Penentuan Sampel ................................................... 25 4. Implementasi Data Mining ............................................ 25 a. Pengubahan Format Arff ......................................... 25 b. Menentukan Metode ................................................ 26
BAB IV
HASIL DAN PEMBAHASAN ................................................. 28 A. Hasil Penelitian ................................................................... 28 B. Analisis Dan Pembahasan ................................................... 28 1. Menentukan Atribut ...................................................... 28
xi
2. Penentuan Sampel ......................................................... 29 3. Pengolahan Data ........................................................... 30 4. Pengubahan Data Dalam Arff ........................................ 31 5. Implementasi Dengan Naive Bayes ............................... 32 6. Implementasi Dalam Weka 3.7.10 ................................. 36 7. Membandingkan Metode Naive Bayes .......................... 57 BAB V
PENUTUP ................................................................................. 61 A. Kesimpulan ......................................................................... 61 B. Saran ................................................................................... 61 1. Bagi Peneliti Berikutnya ............................................... 61 2. Bagi Fakultas ................................................................ 62
DAFTAR PUSTAKA .................................................................................. 63 LAMPIRAN ................................................................................................ 66
xii
DAFTAR TABEL
Tabel 3.1 Daftar Atribut .............................................................................. 22 Tabel 3.2 Daftar Atribut Beserta Isinya ....................................................... 24 Tabel 4.1 Perbandingan dari Naive Bayes, J48 dan OneR ............................ 55
DAFTAR PERSAMAAN
Persamaan (3.1) Metode Slovin .................................................................. 25 Persamaan (3.2) Irisan (X|Y) ...................................................................... 27 Persamaan (3.3) Naive Bayes ..................................................................... 27
xiii
DAFTAR GAMBAR
Gambar 2.1 Tahap-Tahap Data Mining ....................................................... 13 Gambar 3.1 Diagram Alir Penelitian ........................................................... 19 Gambar 3.2 Diagram Ven ........................................................................... 27 Gambar 4.1 Data Asal Sebelum Dikelompokkan ........................................ 30 Gambar 4.2 Hasil Data Yang Sudah Dikodekan .......................................... 30 Gambar 4.3 Jendela Excel2Arrf Converter V.1.0-Beta ................................ 31 Gambar 4.4 Cara Upload .Xls Pada Converter ............................................ 31 Gambar 4.5 Hasil Converter ....................................................................... 32 Gambar 4.6 Data Training .......................................................................... 33 Gambar 4.7 Data Praproses ........................................................................ 36 Gambar 4.8 Jurusan Pada Lama Studi ......................................................... 37 Gambar 4.9 Gender Pada Lama Studi ......................................................... 38 Gambar 4.10 Daerah Pada Lama Studi ....................................................... 39 Gambar 4.11 Asal Sekolah Pada Lama Studi .............................................. 40 Gambar 4.12 Jumlah SKS Pada Lama Studi ............................................... 41 Gambar 4.13 Jumlah MK Pada Lama Studi ................................................ 42 Gambar 4.14 Asisten Pada Lama Studi ....................................................... 43 Gambar 4.15 Penyebaran Jurusan dan Gender ............................................ 44 Gambar 4.16 Penyebaran Jurusan dan Daerah ............................................. 45 Gambar 4.17 Penyebaran Gender dan Daerah ............................................. 46 Gambar 4.18 Penyebaran Jurusan dan SKS.................................................. 47
xiv
Gambar 4.19 Penyebaran Jurusan dan MK ................................................. 48 Gambar 4.20 Penyebaran Jurusan dan Gender ............................................ 49 Gambar 4.21 Penyebaran Gender dan SKS ................................................ 44 Gambar 4.22 Hasil Klasifikasi Naive Bayes ............................................... 47 Gambar 4.23 Hasil Evaluasi ....................................................................... 48 Gambar 4.24 Detail Akurasi Dan Confusion Matrix ................................... 49 Gambar 4.25 Memasukkan Data Uji ........................................................... 50 Gambar 4.26 Pencarian File Data Uji .......................................................... 50 Gambar 4.27 Hasil Evaluasi Akurasi Data Uji ............................................ 51 Gambar 4.28 Visualiza Classifier Errors ..................................................... 51 Gambar 4.29 Hasil Prediksi Data Uji .......................................................... 52 Gambar 4.30 Evaluasi J48 .......................................................................... 53 Gambar 4.31 Evaluasi Oner ........................................................................ 54
xv
ABSTRAKSI Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta memiliki jumlah 2358 mahasiswa dengan jumlah lulusan 388 mahasiswa, Dengan bertambah pesatnya jumlah mahasiswa baru setiap tahunnya dengan demikian secara otomatis akan terciptanya data-data yang sangat banyak dan akan menambah melimpahnya data yang tersimpan tapi minim informasi. Agar data yang awalnya tidak terpakai tersebut dapat diubah menjadi suatu informasi data yang sangat bermanfaat dengan menggunakan teknik data mining. Salah satunya dapat untuk memprediksi lama studi mahasiswa apakah dapat lulus kurang dari 4 tahun atau lebih dari 4 tahun dengan berdasarkan atribut-atribut yang digunakan. Metode Naive Bayes digunakan untuk menganalisis data dalam pengenalan pola dan memprediksi kelulusan mahasiswa. Data yang diperlukan yaitu data-data mahasiswa yang sudah lulus sebagai data training sedangkan data-data mahasiswa yang masih menempuh studi kuliah sebagai data uji. Dengan adanya penelitian ini dapat memberikan informasi yang berguna sehingga dapat meningkatkan kualitas atau dijadikan suatu acuan bagi mahasiswa untuk memprediksi kelulusan dengan tepat waktu. Berdasarkan hasil prediksi dari jumlah 342 data sampel yang diuji hanya 86 mahasiswa yang akan lulus tepat waktu atau hanya sekitar 25,15 %, sedangkan mahasiswa yang akan lulus terlambat berjumlah 256 mahasiswa mencapai 74,85% dari jumlah data sampel. Kata kunci : Data Mining, Naive Bayes, Prediksi
xvi