ANALISA PERBANDINGAN ALGORITMA NAÏVE BAYES, BACKPROPAGATION, DAN DECISION TREE J48 DALAM KLASIFIKASI STATUS GIZI BALITA
TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Oleh: Lina Mumtazatun Nisaa’ NIM. 09560476
JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2013
LEMBAR PERSETUJUAN
ANALISA PERBANDINGAN ALGORITMA NAÏVE BAYES, BACKPROPAGATION, DAN DECISION TREE J48 DALAM KLASIFIKASI STATUS GIZI BALITA
TUGAS AKHIR
Oleh : Lina Mumtazatun Nisaa’ 09560476 Telah Direkomendasikan Untuk Diajukan Sebagai Judul Tugas Akhir Di Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui,
Pembimbing I
Pembimbing II
Ir. Nur Alif Mardiyah, MT
Gita Indah Marthasari, ST
NIP : 108.9203.0257
NIP : 108.0611.0442
LEMBAR PENGESAHAN ANALISA PERBANDINGAN ALGORITMA NAÏVE BAYES, BACKPROPAGATION, DAN DECISION TREE J48 DALAM KLASIFIKASI STATUS GIZI BALITA
TUGAS AKHIR
Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata Satu Teknik Informatika Universitas Muhammadiyah Malang Disusun Oleh : Lina Mumtazatun Nisaa’ 09560476 Tugas Akhir ini telah diuji dan dinyatakan lulus oleh tim penguji pada tanggal 26 Juli 2013
Mengetahui/Menyetujui Penguji I
Penguji II
Hariyady, S.Kom, MT NIP : 101.9406.0262
Yushintia Pramitarini, S.ST, MT
Mengetahui Ketua Jurusan Teknik Informatika
Eko Budi Cahyono, S.Kom, MT NIP : 108.9504.0330
LEMBAR PERNYATAAN Yang bertanda tangan di bawah ini: Nama Tempat / Tgl Lahir NIM Fakulats / Jurusan
: Lina Mumtazatun Nisaa’ : Gresik, 6 Januari 1991 :09560476 : Teknik / Teknik Informatika
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “ANALISA PERBANDINGAN ALGORITMA NAÏVE BAYES, BACKPROPAGATION, DAN DECISION TREE J48 DALAM KLASIFIKASI STATUS GIZI BALITA” beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya. Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku. Malang, 26 Juli 2013 Yang Membuat Pernyataan
Lina Mumtazatun Nisaa’
Mengetahui, Dosen Pembimbing I
Ir. Nur Alif Mardiyah, MT NIP : 108.9203.0257
Dosen Pembimbing II
Gita Indah Marthasari, ST NIP : 108.0611.044
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, yang telah memberi kekuatan dan petunjuk serta melimpahkan rahmat, dan hidayah-Nya, sehingga penulis dapat
menyelesaikan
Tugas
Akhir
yang
berjudul
“ANALISA
PERBANDINGAN ALGORITMA NAÏVE BAYES, BACKPROPAGATION, DAN DECISION TREE J48 DALAM KLASIFIKASI STATUS GIZI BALITA”. Dengan menyadari adanya keterbatasan kemampuan, pengetahuan, referensi dan pengalaman, Tugas Akhir ini masih jauh dari sempurna. Untuk itu saran dan masukkan untuk kesempurnaan sangat penulis harapkan. Akhir kata penulis berharap semoga Tugas Akhir ini dapat bermanfaat dan menjadi tambahan ilmu pengetahuan.
Malang, 26 Juli 2013
Penulis
LEMBAR PERSEMBAHAN
Dalam penulisan tugas akhir ini tidak akan terselesaikan dengan baik tanpa adanya bimbingan dan sumbangan dari berbagai pihak. Pada kesempatan ini penulis ingin menyampaikan terima kasih kepada : 1. Allah SWT atas rahmat dan hidayah-Nya sehingga penulis mampu menyelesaikan tugas akhir ini. 2. Aba dan ibu yang sudah memotivasi dan memberikan dukungan berupa doa, materi, dan kasih sayang sehingga dapat menyelesaikan skripsi ini dengan lancar. 3. Saudara-saudara q tersayang mbk Irma, mas isa, mbk dwi, dek iqbal, dan c ndut dek mais, terima kasih buat doanya. 4. Ibu Ir. Nur Alif Mardhiyah,MT dan ibu Gita Indah Marthasari, S.Kom selaku dosen pembimbing Tugas Akhir, terima kasih atas kesabaran ibu dalam membimbing penulis. 5. Seluruh staff dan dosen pengajar Jurusan Teknik Informatika. 6. My Hubby yang paling cakep Reza Haruna Erlanda yang setia membantu dan terus menyemangati dalam suka ataupun duka, yang rela nunggu bimbingan selama mungkin 7. Sahabat-sahabatku seperjuangan putri fitriyah, neni hari, nokey, asti, nuiii, erni, disa, endah, nuril, hanum, nisa dll yang telah memberikan sarannya selama penulisan tugas akhir ini. 8. Teman-teman kos gang 15 C no 14 neni, jannah, siska, kiki, endah, ayu, makaci kebersamaannya. 9. Rekan-rekan 2009 UMM, khususnya informatika kelas J 2009.
DAFTAR ISI Lembar Persetujuan ..............................................................................................2 Lembar Pengesahan .............................................................................................. ii Lembar Pernyataan ...............................................................................................4 Abstraksi ............................................................................................................... iv Abstract ..................................................................... Error! Bookmark not defined. Kata Pengantar .................................................................................................... vi Lembar Persembahan ...........................................................................................6 Daftar Isi .................................................................................................................7 Daftar Gambar .....................................................................................................10 Daftar Tabel ....................................................................................................... xiv BAB I PENDAHULUAN .......................................................................................1 1.1
Latar Belakang ..........................................................................................1
1.2
Rumusan Masalah .....................................................................................2
1.3
Tujuan........................................................................................................3
1.4
Batasan Masalah ........................................................................................3
1.5
Metodologi Penyelesaian Masalah ............................................................4
1.6
Sistematika Penulisan ................................................................................5
BAB II LANDASAN TEORI ................................................................................7 2.1
Data mining ...............................................................................................7
2.1.1 Pengertian Data Mining .........................................................................7 2.1.2 Pengelompokan Data Mining ................................................................7 2.2
Klasifikasi..................................................................................................8
2.3
Status Gizi .................................................................................................9
2.4
Algoritma Naïve Bayes ...........................................................................10
2.5
Jaringan Saraf Tiruan ..............................................................................10
2.5.1 Komponen Jaringan Saraf Tiruan ........................................................11 2.5.2 Model Pelatihan JST ............................................................................12
2.5.3 Algoritma Backpropagation.................................................................13 2.6
Pohon Keputusan.....................................................................................16
2.6.1 Pengertian Pohon Keputusan ...............................................................16 2.6.2 Manfaat Pohon Keputusan...................................................................16 2.6.3 Model Pohon Keputusan......................................................................17 2.7
Algoritma J48 ..........................................................................................18
2.8
WEKA .....................................................................................................19
2.8.1 Pengertian WEKA ...............................................................................19 2.8.2 Dataset .................................................................................................20 2.8.3 Arff File (Representasi Data)...............................................................20 2.9
BAhasa Pemrograman Java .....................................................................21
2.9.1 Definisi dan Sejarah Bahasa Pemrograman Java.................................21 2.9.2 Pembahasan Umum Bahasa Pemrograman Java .................................21 2.9.3 Pembagian Edisi Dalam Pemrograman Java .......................................23 BAB III ANALISA DAN PERANCANGAN SISTEM.....................................24 3.1
Analisa Masalah ......................................................................................24
3.2
Analisa Sistem .........................................................................................25
3.2.1 Flowchart Sistem .................................................................................25 3.2.2 Use Case Diagram ...............................................................................26 3.3
Perancangan Sistem.................................................................................31
3.3.1 Sequence Diagram ...............................................................................31 3.4
Perancangan Pengujian ...........................................................................36
3.5
Desain Interface .......................................................................................36
3.5.1 Form Menu Utama...............................................................................37 BAB IV IMPLEMENTASI DAN HASIL PENGUJIAN ..................................39 4.1
Implementasi Lingkungan Pengembangan Hardware dan Software ......39
4.2
Implementasi Sistem ...............................................................................39
4.2.1.
Pembuatan Basis Data ......................................................................40
4.2.2.
Pembuatan Fungsi Koneksi Database ..............................................40
4.2.3.
Pembuatan Class-Class yang Dibutuhkan .......................................41
4.3
Implementasi Kode Program ...................................................................42
4.3.1 Kode Program Search Data di Direktori ..............................................42 4.3.2 Kode Program Proses Klasifikasi Algoritma Naïve Bayes .................43 4.3.3 Kode Program Proses Klasifikasi Algoritma Backpropagation ..........44 4.3.4 Kode Program Proses Klasifikasi Algoritma Decision Tree J48.........45 4.3.5 Kode Program Simpan Data ke Database ............................................46 4.4
Pengujian .................................................................................................47
4.4.1 Pengujian Sistem .................................................................................47 4.4.1.1 Pengujian Class Utama .................................................................47 4.4.1.2 Pengujian Proses Klasifikasi Algoritma Naïve Bayes dengan Metode Cross Validation 10-folds ...............................................48 4.4.1.3 Pengujian Proses Klasifikasi Algoritma Naïve Bayes dengan Metode Cross Validation 5-folds .................................................48 4.4.1.4 Pengujian Proses Klasifikasi Algoritma Backpropagation dengan Metode Cross Validation 10-folds...................................49 4.4.1.5 Pengujian Proses Klasifikasi Algoritma Backpropagation dengan Metode Cross Validation 5-folds.....................................55 4.4.1.6 Pengujian Proses Klasifikasi Algoritma Decision Tree J48 dengan Metode Cross Validation 10-folds...................................60 4.4.1.7 Pengujian Proses Klasifikasi Algoritma Decision Tree J48 dengan Metode Cross Validation 5-folds.....................................60 4.4.1.8 Pengujian Proses Simpan Hasil ke Database ...............................61 4.4.1.9 Pengujian Proses Lihat Hasil Keseluruhan dengan Metode Cross Validation 10-folds ............................................................62 4.4.1.10 Pengujian Proses Lihat Hasil Keseluruhan dengan Metode Cross Validation 5-folds ..............................................................63 4.4.1.11 Pengujian Proses Lihat Grafik ......................................................64 4.4.2 Analisa Hasil Pengujian .......................................................................64 BAB V KESIMPULAN DAN SARAN ...............................................................68 5.1
Kesimpulan..............................................................................................67
5.2
Saran ........................................................................................................68
DAFTAR PUSTAKA ...........................................................................................70
DAFTAR GAMBAR Gambar 2. 1 Teknik Klasifikasi ...............................................................................8 Gambar 2. 2 Model Pohon Keputusan ...................................................................17 Gambar 2. 3 Contoh ARFF format ........................................................................20 Gambar 3. 1 Flowchart Sistem...............................................................................25 Gambar 3. 2 Use Case Diagran ..............................................................................26 Gambar 3. 3 Activity Diagram Proses Klasifikasi .................................................27 Gambar 3. 4 Activity Diagram Proses Klasifikasi Algoritma Naïve Bayes ..........28 Gambar 3. 5 Activity Diagram Proses Klasifikasi Algoritma Backpropagation ...29 Gambar 3. 6 Activity Diagram Proses Klasifikasi Algoritma Decision Tree J48 .30 Gambar 3. 7 Activity Diagram Aplikasi Lihat Hasil Klasifikasi ...........................31 Gambar 3. 8 Sequance Diagram Proses Klasifikasi ...............................................32 Gambar 3. 9 Sequance Diagram Proses Klasifikasi Algoritma Naïve Bayes ........33 Gambar 3. 10 Sequance Diagram Proses Klasifikasi Algoritma Backpropagation .............................................................................34 Gambar 3. 11 Sequance Diagram Proses Klasifikasi Algoritma Decision Tree J48 ...........................................................................35 Gambar 3. 12 Sequance Diaram Lihat Hasil Klasifikasi .......................................36 Gambar 3. 13 Form Utama ....................................................................................37 Gambar 4. 1 Data Tabel MySQL ...........................................................................40 Gambar 4. 2 Script Koneksi Basis Data .................................................................41 Gambar 4. 3 Class-Class yang Dibutuhkan ...........................................................42 Gambar 4. 4 Kode Program Search Data di Direktori ...........................................42 Gambar 4. 5 Kode Program Proses Klasifikasi Algoritma Naïve Bayes ...............43 Gambar 4. 6 Kode Program Proses Klasifikasi Algoritma Backpropagation ........44 Gambar 4. 7 Kode Program Proses Klasifikasi Algoritma Decision Tree J48 ......45 Gambar 4. 8 Kode Program Simpan Data dari jTable ke Database .......................46 Gambar 4. 9 Menu Utama ......................................................................................47 Gambar 4. 10 Proses Klasifikasi Algoritma Naïve Bayes dengan Metode Cross Validation 10-folds .........................................................................48 Gambar 4. 11 Proses Klasifikasi Algoritma Naïve Bayes dengan Metode Cross Validation 5-folds ...........................................................................48
Gambar 4. 12 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer =1 ......................................................................49 Gambar 4. 13 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 2 .....................................................................50 Gambar 4. 14 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 3 .....................................................................50 Gambar 4. 15 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 4 .....................................................................51 Gambar 4. 16 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 5 .....................................................................51 Gambar 4. 17 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 6 .....................................................................52 Gambar 4. 18 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 7 .....................................................................52 Gambar 4. 19 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 8 .....................................................................53 Gambar 4. 20 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 9 .....................................................................53 Gambar 4. 21 Proses Klasifikasi Algoritma Backpropagation 10-fold dengan Nilai hidden layer = 10 ...................................................................54 Gambar 4. 22 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer =1 ......................................................................55 Gambar 4. 23 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 2 .....................................................................55 Gambar 4. 24 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 3 .....................................................................56 Gambar 4. 25 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 4 .....................................................................56 Gambar 4. 26 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 5 .....................................................................57 Gambar 4. 27 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 6 .....................................................................57
Gambar 4. 28 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 7 .....................................................................58 Gambar 4. 29 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 8 .....................................................................58 Gambar 4. 30 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 9 .....................................................................59 Gambar 4. 31 Proses Klasifikasi Algoritma Backpropagation 5-fold dengan Nilai hidden layer = 10 ...................................................................59 Gambar 4. 32 Proses Klasifikasi Algoritma Decision Tree J48 dengan metode cross validation 10-folds .................................................................60 Gambar 4. 33 Proses Klasifikasi Algoritma Decision Tree J48 dengan metode cross validation 5-folds ...................................................................60 Gambar 4. 34 Proses Simpan Hasil ke Database ...................................................61 Gambar 4. 35 Proses Lihat Hasil Keseluruhan 10-folds ........................................62 Gambar 4. 36 Proses Lihat Hasil Keseluruhan 5-folds ..........................................63 Gambar 4. 37 Proses Lihat Grafik .........................................................................64
DAFTAR TABEL Tabel 2. 1 Klasifikasi Status Gizi Anak Balita ........................................................9 Tabel 4. 1 Perbandingan Algoritma Naïve Bayes, Backpropagation, dan Decision Tree J48 dengan Metode Cross Validation 10-Folds ............65 Tabel 4. 2 Perbandingan Algoritma Naïve Bayes, Backpropagation, dan Decision Tree J48 dengan Metode Cross Validation 5-Folds ..............65
DAFTAR PUSTAKA [1]
Anggraeni, Reni & Aviarini, 2010. “Klasifikasi Status Gizi Balita Berdasarkan Indeks Antropometri (BB/U) Menggunakan Jaringan Saraf Tiruan”. Fakultas Ilmu Komputer dan Teknologi Informasi. Universitas Gunadarma.
[2]
Kurniawan Edy, I Ketut & Suryo Sumpeno. “Analisa Rekam Medis untuk Menentukan Pola Kelompok Penyakit Menggunakan Klasifikasi dengan Decision Tree J48”. Pasca Sarjana Teknik Elektro. Institut Sepuluh November. Surabaya.
[3]
Shadiq, Muhammad Ammar, 2009. “Keoptimalan Naive bayes Dalam Klasifikasi”. Program Studi Ilmu Komputer, Matematika Dan Ilmu Pengetahuan Alam,
Fakultas Pendidikan Universitas Pendidikan
Indonesia. [4]
Oktavia, Dian & DL. Chrispina Pardede. “Perbandingan Kinerja Algoritma Decision Tree dan Naïve Bayes dalam Prediksi Kebangkrutan”. Jurusan Sistem Informasi dan Sistem Komputer, Universitas Gunadarma. Jakarta.
[5]
Karlik, Bekir. 2011. “Hepatitis Disease Diagnosis Using Backpropagation and The Naïve Bayes Classifiers”. Department of Computer Engineering, Mevlana University, Konya, Turkey.
[6]
Hamidah, Ida, 2012. “Aplikasi Data Mining Untuk Memprediksi Masa Studi Mahasiswa Menggunakan Algoritma C4.5(Studi Kasus : Jurusan Teknik Komputer-Unikom)”. Jurusan Teknik Komputer. Fakultas Teknik dan Ilmu Komputer. Universitas Komputer Indonesia. Bandung.
[7]
Tessy,
“Data
Mining”.
(online).
http://lecturer.eepis-
its.edu/~tessy/lecturenotes/db2/bab10.pdf. (diakses 20 Maret 2013). [8]
Khoiri, Idah Fitri. 2009. “Status Gizi Balita Di Posyandu Keluruhan Padang Bulan Kecematan Medan Baru”. Fakultas Kedokteran. Universitas Sumatera Utara. Medan.
[9]
Susilowati, 2008. “Pengukuran Status Gizi dengan Antropometri Gizi”. Cimahi.
[10]
Hastuti, Khafiizh, 2012. “Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk Prediksi Mahasiswa Non Aktif”. Seminar Nasional Teknologi Informasi dan Komunikasi Terapan 2012. Universitas Dian Nuswantoro. Semarang.
[11]
Hasbi, Muhammad, 2010. “Penggunaan Pohon Keputusan dalam Teori Keputusan”. Program Studi Teknik Informatika. Sekolah Teknik Elektro dan Informatika. Institut Teknologi Bandung. Bandung.
[12]
Novrina.
“Decision
Tree
(Pohon
Keputusan)”.
(online).
http://novrina.staff.gunadarma.ac.id/Downloads/files/21783/Algoritma+C 4.pdf. (diakses 21 Maret 2013). [13]
Defiyanti, Sofi & D.L. Crispina Pardede. “Perbandingan Kinerja Algoritma ID3 dan C4.5 Dalam Klasifikasi Spam-Mail”. Jurusan Sistem Informasi. Universitas Gunadarma
[14]
Widiastuti, Dwi. “ Analisa Perbandingan Algoritma SVM, Naïve Bayes, dan Decision Tree Dalam Mengklasifikasikan Serangan (Attacks) Pada Sistem Pendeteksi Intrusi”. Jurusan Sistem Informasi. Universitas Gunadarma
[15]
Fajri,
Radhiyatul.
“Pengertian
WEKA”.
(online).
http://www.scribd.com/doc/44561693/Isi. (diakses 23 Maret 2013). [16]
Jiunkpe, 2008. “Dasar Teori-Bahasa Pemrograman Java”. (online). http://digilib.petra.ac.id/jiunkpe/s1/info/2008/jiunkpe-ns-s1-200826404033-10414-java_me-chapter2.pdf. (diakses 26 Maret 2013).