OPTIMASI NEURAL NETWORK UNTUK MENDETEKSI PENYAKIT DIABETES DENGAN ALGORITMA GENETIKA Honainah Jurusan Teknik Informatika, STT Nurul Jadid Probolinggo Email :
[email protected]
ABSTRACT Diabetes is a group of chronic diseases that can cause death . Communities particularly hard layman to detect because the symptoms of diabetes are not clearly visible coupled with long duration and lack of accurate detection equipment only detects diabetes if blood glucose levels . In the detection of diabetes research has been done that ANN with back propagation algorithm method and Fuzzy logic based intelligent system . However, this method is still considered optimal because the average results that show its accuracy ata rate less than the maximum . The new method is proposed with a view to finding a solution better than previous methods in terms of average accuracy , which is the optimization of the neural network algorithm . Neural network is used as a method of artificial intelligence to detect diabetes , while the genetic algorithm is used for optimization of neural network . Evaluation and testing methods used are cross validation , and confusion matrix . Cross validation test results show that the neural network optimization method using a genetic algorithm produces high accuracy is 98.57 % better than without optimization neural network method which produces 94.29 % accuracy and also better than Fuzzy logic based intelligent system that produces accuracy 97 %. Keywords: Detection of diabetes, neural network and genetic algorithm
PENDAHULUAN 1.1 Latar Belakang Penyakit diabetes yang juga dikenal sebagai penyakit kencing manis atau penyakit gula darah adalah golongan penyakit kronis yang ditandai dengan peningkatan kadar gula dalam darah sebagai akibat adanya gangguan sistem metabolisme dalam tubuh, dimana organ pankreas tidak mampu memproduksi hormon insulin sesuai kebutuhan tubuh. [1] Menurut data WHO, Indonesia menempati urutan ke-4 terbesar dalam jumlah penderita Diabetes Mellitus di dunia. Pada tahun 2000 yang lalu saja, terdapat sekitar 5,6 juta penduduk Indonesia yang mengidap diabetes. Namun, pada tahun 2006 diperkirakan jumlah penderita diabetes di Indonesia meningkat tajam menjadi 14 juta orang, dimana baru 50 persen yang sadar mengidapnya dan di antara mereka baru sekitar 30 persen yang datang berobat teratur. Permasalahan utama yang dihadapi oleh penderita diabetes adalah terjadinya komplikasi yang merupakan penyebab utama kesakitan dan kematian. Penyakit diabetes dapat dikatakan tidak mungkin dapat dicegah. Namun untuk menanggulanginya yaitu dengan mencegah komplikasi diabetik, khususnya komplikasi kronik, oleh karena itu diperlukan suatu tindakan agar penderita 66
diabetes dapat menjaga dan mempertahankan agar kadar glukosa darah berada dalam batas-batas normal seperti pada orang yang tidak menderita diabetes. Masyarakat khususnya orang awam sulit untuk mendeteksi adanya penyakit diabetes karena gejalanya yang tidak terlihat dengan jelas ditambah dengan jangka waktunya yang lama dan kurang akuratnya peralatan deteksi diabetes jika hanya mendeteksi kadar glukosa darah. Oleh karena itu ada pasien yang sama sekali tidak merasakan adanya keluhan diabetes, mereka mengetahui adanya diabetes hanya karena pada saat periksa kesehatan kadar glukosa darahnya tinggi yang dalam jangka panjang bisa menyebabkan komplikasi akibat keracunan glukosa yang berakibat hingga kebutaan atau komplikasi lain seperti kaki busuk (gangren) sehingga harus di amputasi. Dalam menentukan tingkat resiko diabetes dapat juga digunakan pemeriksaan penyaring berupa jenis kelamin, usia, berat badan, tekanan darah dan riwayat diabetes dalam garis keturunan [2] yang bertujuan untuk memudahkan dalam identifikasi seseorang mempunyai penyakit diabetes. Berdasarkan uraian di atas, jelas bahwa mendeteksi diabetes merupakan hal penting bagi instistusi kesehatan untuk menentukan kebijakan strategis bagi institusinya. Tugas deteksi dapat ditentukan menjadi dua keputusan yaitu “Ya ” yaitu pasien yang terdeteksi penyakit diabetes dan “Tidak” bagi pasien yang tidak terdeteksi penyakit diabetes. Pada penelitian-penelitian sebelumnya telah dilakukan deteksi terhadap penyakit diabetes menggunakan beberapa metode dan algoritma tertentu yakni Neural Netwok dengan metode Algoritma back propagation dan Algoritma fuzzy logic. Divya, Raman Chhabra, Sumit Kaur, Swagata Ghosh (2013), melakukan penelitian mendeteksi diabetes dengan menggunakan ANN dengan metode Algoritma back propagation. Hasil yang diperoleh spesifisitas 82,14% & 88,8% sensitivitas dan tingkat kesalahan 0,019% untuk 50 sampel yang diuji. [3] Agus Junaidi, (2010) Melakukan penelitian Sistem Cerdas Berbasis Logika Fuzzy Untuk Mendeteksi Penyakit Diabetes. Hasil Algoritma fuzzy logic mampu mendeteksi diabetes dengan parameter berat badan, tekanan darah, umur dan jenis kelamin. Hasilnya dapat ditampilkan sesuai dengan input data oleh pengguna, pada percobaannya memiliki nilai akurasi 97 % dan Error pada deteksi sistem 3%. [6] Riries Rulaningtyas; Herri Trilaksana (2007) melakukan penelitian Pengaplikasian Optimasi Neural Network oleh Algoritma Genetika pada Pendeteksian Kelainan Otak Stroke Iskemik sebagai Media Pembelajaran Dokter Muda. Dalam pengaplikasian ini dihasilkan neural network mampu mendeteksi 100 % data baru, error neural 0,000089 dan fungsi fitness algoritma genetika [8]. Berdasarkan penelitian sebelumnya deteksi diabetes telah banyak dilakukan namun hasilnya belum optimal terbukti dari hasil – hasil penilaian yang diperoleh akurasinya belum mendekati sempurna sebagaimana yang telah dipaparkan pada penelitian sebelumnya di atas.
67
67
Penelitian ini akan melakukan deteksi diabetes dengan menggunakan dua metode yaitu, neural network dan optimasi neural network dengan algoritma genetika. neural network lebih banyak fokus pada mengekstrak pola dan mendeteksi data yang sangat kompleks untuk dibicarakan baik oleh manusia maupun oleh sistem komputer [7]. Selanjutnya neural network akan dioptimasi menggunakan algoritma genetika, karena algoritma genetika sangat tepat penggunaannya dalam hal optimasi, sehingga akan diperoleh hasil yang optimal dan akurasi yang sempurna untuk pendeteksian terhadap penyakit diabetes. Hasil penelitian ini akan diaplikasikan pada Rumah Sakit Umum waluyo Jati Kraksaan untuk mempermudah dalam hal pendeteksian diabetes. 1.2 Rumusan Masalah Berdasarkan latar belakang masalah di atas dapat disimpulkan bahwa banyak penelitian terhadap deteksi penyakit diabetes yang telah dilakukan menggunakan metode dan algoritma yang berbeda, namun hasil yang diperoleh belum optimal dan nilai akurasinya belum mendekati sempurna, sehingga pertanyaan penelitian (research question) pada penelitian ini diarahkan pada penyelesaian masalah untuk : “Bagaimana hasil optimasi terhadap neural network dengan algoritma genetika dalam mendeteksi diabetes ? “ 1.3 Tujuan Penelitian Berdasarkan latar belakang dan rumusan masalah diatas, penelitian ini bertujuan untuk menerapkan model optimasi neural network dengan algoritma genetika untuk mendeteksi penyakit diabetes. 1 1.4 Manfaat 1. Manfaat Praktis Hasil penelitian ini diharapkan dapat memberikan gambaran dan pemahaman penerapan optimasi neural network dengan algoritma genetika pada studi kasus pendeteksian diabetes 2. Manfaat Teoritis Hasil Hasil penelitian ini diharapkan memberikan kontribusi keilmuan pada penelitian Neural Network bagi peneliti atau praktisi yang lain untuk diterapkan pada penelitian lain dengan karakteristik penggunaan algoritma khususnya untuk deteksi penyakit diabetes 3. Manfaat Kebijakan Hasil penelitian ini diharapkan mampu menjadi salah satu alat untuk pendeteksi deabetes pada studi kasus di Rumah Sakit Umum Daerah Waluyo Jati Kraksaan Probolinggo
68
1. TINJAUAN PUSTAKA 2.1 Penelitian Terkait Berikut ini beberapa penelitian terkait deteksi penyakit diabetes dengan beberapa metode yang digunakan dalam State of the Art sebagaimana dalam tabel 2.1. berikut: Tabel 2.1 State of the Art No Judul Tahun Peneliti Metode Accuracy 1 Diabetes 2013 Ms. Komparasi dua metode ANN : Detection Using Divya, (algoritma Artificial 82,14% Artificial Raman Neural BPA: Neural Chhabra, Networks & Back88,8% Networks & Sumit Propagation Algorithm) BackKaur, Propagation Swagata Algorithm [5] Ghosh 2 Sistem Cerdas 2010 Agus Sistem Cerdas berbasis Logika Berbasis Logika Junaidi Logika Fuzzy Fuzzy : Fuzzy untuk 97% Mendeteksi Penyakit Diabetes [6] 3 Pengaplikasian 2007 Riries Optimasi Neural Network Optimasi Optimasi Rulaningt oleh Algoritma Genetika neural Neural Network yas, network oleh Algoritma Herri mampu Genetika pada Trilaksana mendeteksi PendeteksianKe 100 % data lainan Otak baru, error Stroke Iskemik neural sebagai Media 0,000089 Pembelajaran dan fungsi Dokter Muda fitness [7] algoritma genetika
1
69 69
4 Dari hasil penelitian diatas, Divya, Raman Chhabra, Sumit Kaur, dan Swagata Ghosh [3], melakukan penelitian mendeteksi diabetes dengan menggunakan ANN dengan metode Algoritma back propagation. Hasil yang diperoleh spesifisitas 82,14% & 88,8% sensitivitas dan tingkat kesalahan 0,019% untuk 50 sampel yang diuji. Agus Junaidi [6], Melakukan penelitian Sistem Cerdas Berbasis Logika Fuzzy Untuk Mendeteksi Penyakit Diabetes. Hasil dari penelitian ini Algoritma fuzzy logic mampu mendeteksi diabetes dengan parameter yang ditentukan, hasilnya ditampilkan sesuai dengan input data yang telah dimasukkan oleh pengguna, pada percobaannya memiliki nilai akurasi 97 % dan Error pada deteksi sistem 3%. Riries Rulaningtyas; Herri Trilaksana [8] melakukan penelitian Pengaplikasian Optimasi Neural Network oleh Algoritma Genetika pada Pendeteksian Kelainan Otak Stroke Iskemik sebagai Media Pembelajaran Dokter Muda, dalam pengaplikasian ini dihasilkan neural network mampu mendeteksi 100 % data baru, error neural 0,000089 dan fungsi fitness algoritma genetika. 2.2 Landasan Teori 2.2.1 Diabetes Diabetes merupakan golongan penyakit kronis yang dapat menyebabkan kematian. Masyarakat khususnya orang awam sulit untuk mendeteksi adanya penyakit diabetes karena gejalanya yang tidak terlihat dengan jelas ditambah dengan jangka waktunya yang lama dan kurang akuratnya peralatan deteksi diabetes jika hanya mendeteksi kadar glukosa darah. [1] Terdapat beberapa penyebab dari penyakit diabetes namun pada penelitian ini parameter yang digunakan adalah jenis kelamin, umur, tinggi/berat badan dan tekanan darah kerena keempat parameter tersebut lebih diketahui hasil deteksinya dibandingkan dengan gejala atau penyebab diabetes yang lain yang masih memerlukan pemeriksaan lebih lanjut. Dalam penelitian ini dijelaskan bahwa jenis kelamin, usia, berat badan dan tekanan darah pada dasarnya menentukan rasio resiko diabetes. Jadi keempat parameter tersebut akan dijadikan sebagai masukan untuk sistem yang dirancang. 2.2.2 Neural Network Neural Network (NN) sebagai cabang dari ilmu kecerdasan buatan (artificial intelligence) merupakan salah satu sistem pemrosesan informasi yang didesain dengan menirukan cara kerja otak manusia dalam menyelesaikan suatu masalah. Neural network merupakan prosesor tersebar paralel yang sangat besar yang memiliki kecendeungan untuk menyimpan pengetahuan yang bersifat pengalaman dan membuatnya untuk siap digunakan [5]. Neural Network telah banyak diaplikasikan dan sangat sukses digunakan untuk memecahkan berbagai masalah dalam berbagai disiplin ilmu seperti bidang komputer, teknik, ilmu murni, perdagangan, financial dan lain-lain. Menurut Siang banyak model neural network menggunakan manipulasi matriks/ vektor dalam iterasinya, dan Rapidminer menyediakan fungsi-fungsi khusus untuk menyelesaikan model neural network. User tinggal memasukkan 70
vektor masukan, target, model, dan parameter yang diinginkan yaitu laju pemahaman, threshold, bias, dan lain-lain. Secara skematik dijelaskan pada gambar berikut :
Gambar 2.1 perinsip utama neural network
1
Gambar 2.1 Diagram skematik multi-layered perceptron (MLP) dengan aliran searah [7] Dari gambar ditunjukkan pula, bahwa network terdiri dari 3 lapisan node, yaitu input, hidden dan output yang berisikan bilangan R, S, dan K dari proses node, secara berurutan. Setiap node pada lapisan input dihubungkan ke semua node dalam lapisan hidden, dan secara simultan node tersebut akan dihubungkan ke semua node pada lapisan output. Jumlah node dalam lapisan input (R) adalah sama dengan jumlah input pada proses, dan jumlah node output (K) sama dengan jumlah output pada proses. Pemakaian bias node membantu neural network untuk berada dimana saja dalam ruang R-berdimensi 2.2.3 Algoritma Genetika Secara umum, algoritma genetika adalah metode untuk menyelesaikan masalah optimasi berdasarkan prinsip bertahan dalam evolusi. Hal ini dapat dilakukan dengan menciptakan sebuah populasi yang terdiri dari individu-individu dimana setiap individu mempresentasikan kromosom seperti yang terdapat pada DNA manusia. [19] Individu-individu pada populasi tersebut kemudian mengalami proses evolusi. Algoritma genetika adalah salah teknik pencari secara acak yang sangat stategis, dimana dapat bertahan untuk menemukan penyelesaian yang optimal atau mendekati optimal pada persamaan non-linier yang kompleks. 71 71
Secara Analitis Penentuan optimasi dilakukan dengan cara mendeferensialkan persamaan tersebut. Contoh penggunaan metode analitis adalah pada suatu persamaan dengan satu variable, x, yang mempunyai fungsi seperti dibawah : f(x) = x2- 2x + 1 Dalam metode analitis, untuk menemukan titik minimum, x*, pada fungsi diatas adalah dengan mengganggap bahwa gradient dari f(x) sama dengan nol. f’(x) = 0 = 2x -2 dan didapatkan hasil dari persamaan tersebut, yaitu x* = 1. Hasil dari x* disubtitusikan pada deferensial kedua dari persamaan untuk mengetahui dengan pasti nilai minimumnya f “(1) = 2 > 0 1. Secara Numerik Optimasi secara numerik dilakukan dengan cara iterasi. Langkah pertama adalah menentukan nilai awal yang digunakan dalam iterasi. Kemudian menerapkannya pada persamaan tersebut. Iterasi akan berhenti jika f(xk+1) – f(xk) < ε1 atau f ’(xk) < ε2 dimana k adalah jumlah iterasi dan ε adalah nilai batas toleransi atau kriteria ketelitian yang ditentukan Dalam perhitungan untuk menentukan optimasi dengan Algoritma genetika dapat menggunakan tool Rapidminer. Algoritma genetika menggunakan dan memanipulasi populasi untuk memperoleh kondisi optimum. Dalam setiap langkah, algoritma genetika menyeleksi secara acak dari populasi yang ada untuk menentukan yang akan menjadi parent dan menggunakannya untuk menghasilkan children pada generasi berikutnya. Pada setiap generasi, kecocokan parent atau individu dalam populasi dievaluasi.beberapa individu dipilih dari populasi mereka berdasarkan dari kecocokan mereka dalam fungsi fitness, dan diubah (direkomendasikan dan mungkin bermutasi secara acak) untuk membentuk suatu populasi baru. Populasi baru itu kemudian digunakan untuk iterasi selanjutnya dalam algoritma. Biasanya, algoritma akan berhenti ketika jumlah maksimum dari generasi telah dihasilkan atau tingkat kecocokan yang telah ditentukan telah terpenuhi untuk populasi tersebut 2.2.4 Optimasi neural network – Algoritma Genetika Dalam Dengan mengembangkan proses premodelan berdasar neural network, algoritma genetika dapat digunakan untuk mengoptimasi pada input didimensi-R (x) dalam model neural network [15] . Hubungan optimasi dapat ditentukan dengan menemukan optimasi dari factor dimensi-R, x*=[x1*,x2*,…]T, sehingga dapat memperbesar dimensi-K dari fungsi vector f, yang ditunjukkan pada persamaan berikut:
72
6
dimana W={WH,WO} dan b={bH,bo} adalah parameter weight dan bias untuk lapisan hidden dan output. Yang dapat diperhatikan dalam persamaan diatas adalah bahwa problem tersebut merupakan optimasi dengan multi objektive (MO). Pendekatan yang mudah dan sering digunakan untuk menyelesaikan permasalahan optimasi MO adalah dengan mengumpulkan MO menjadi sebuah fungsi single objective (SO). Dalam metode pengumpulan ini, setiap fungsi objective dikalikan dengan koefisient weight (wk) dan hasil fungsi dikombinasikan untuk membentuk sebuah fungsi maksimal. Maksimalisasi dari sebuah fungsi tersebut, ditunjukkan pada persamaan dibawah:
Pemodelan dan optimasi dengan neural network – algoritma genetika diterapkan dalam proses mencari nilai akurasi yang optimal. 2.2.5 Evaluasi dan Validasi Metode 1. Confusion Matrix Confusion Matrix merupakan alat (tools) visualisasi yang biasa digunakan pada supervised learning dan merupakan table matrix yang terdiri dari dua kelas, yaitu kelas yang dianggap sebagai positif dan kelas yang dianggap sebagai negatif [18]. Tiap kolom pada matriks adalah contoh kelas prediksi, sedangkan tiap baris mewakili kejadian di kelas yang sebenarnya. Confusion matrix berisi informasi aktual (actual) dan prediksi (predicted) pada sisitem klasifikasi. Tabel 2.2 adalah contoh tabel confusion matrix yang menunjukan klasifikasi dua kelas. Tabel 2.2 Model Confusion Matrix [19] Predicted
Observed Class Keterangan: True Positive (tp) True Negative (tn) False Positive (fp) False Negative (fn)
73
Class = Yes Class = No
= Proporsi positif = Proporsi negative = Proporsi potitif = Proporsi negatif
Class = Yes A (true positive - tp) C (false positive - fp)
Class = No B (false negative-fn) D (true negative- tn)
positif dalam data set yang diklasifikasikan negative dalam data set yang diklasifikasikan negatif dalam data set yang diklasifikasikan negative dalam data set yang diklasifikasikan
73
Berikut adalah persamaan model confusion matrix: a. Nilai akurasi (acc) adalah proporsi jumlah prediksi yang benar. Dapat dihitung dengan menggunakan persamaan:
b. Sensitivity digunakan untuk membandingkan proporsi tp terhadap tupel yang positif, yang dihitung dengan menggunakan persamaan:
c. Specificity digunakan untuk membandingan proporsi tn terhadap tupel yang negatif, yang dihitung dengan menggunakan persamaan:
d. PPV (positive predictive value) adalah proporsi kasus dengan hasil diagnosa positif, yang dihitung dengan menggunakan persamaan:
e. NPV (negative predictive value) adalah proporsi kasus dengan hasil diagnosa negatif, yang dihitung dengan menggunakan persamaan:
2.3 Kerangka Pemikiran Dalam menyelesaikan penelitian, penulis membuat sebuah kerangka pemikiran yang berguna sebagai pedoman atau acuan penelitian ini sehingga penelitian dapat dilakukan secara konsisten. Penelitian ini terdiri dari beberapa tahap seperti terlihat pada gambar 2.8 kerangka pemikiran. Permasalahan pada penelitian ini adalah belum diketahuinya besar optimasi neural network untuk mendeteksi penyakit diabetes dengan algoritma genetika tepat waktu . Untuk itu digunakanlah optimasi neural network untuk mendeteksi diabetes dengan algoritma genetika untuk memecahkan masalah dilakukan pengujian terhadap kinerja metode neural network tersebut kemudian mengoptimasinya dengan algoritma genetika. Pengujian metode dilakukan dengan model confusion matrix. Untuk mengembangkan aplikasi berdasarkan metode yang dibuat, digunakan tools Rapid Miner. Berikut pengambaran kerangka permikiran yang dilakukan.
74
MASALAH Tingkat akurasi deteksi diabetes belum optimal
METODE Optimasi neural network dengan algoritma genetika
PENGEMBANGAN Tool
Data set
Framework Rapid Miner
Data pasien diabetes 20072011
PENGUKURUAN Perbandingan Confusion Matrix hasil deteksi Neural Network saja dengan yang dioptimasi oleh Algoritma
RESULT Optimasi neural network – algoritma genetika dapat diterapkan pada deteksi diabetes
Gambar 2.3 Kerangka Pemikiran
2. METODE PENELITIAN Metode penelitian yang digunakan dalam penelitian ini adalah penelitian Experiment. Penelitian eksperimen merupakan sebuah penyelidikan hubungan kausal menggunakan tes dikendalikan oleh peneliti. Penelitian eksperimen biasanya dilakukan dalam proyek pengembangan, evaluasi dan pemecahan masalah. Dalam penelitian eksperimen digunakan spesifikasi hardware dan software sebagai alat bantu dalam penelitian yaitu: Tabel 3.1 Spesifikasi hardware dan software Spesifikasi Tipe Prosesor Intel Pentium Dual Core Memori 2 GB Harddisk 250 GB Sistem Operasi Windows 7 Tools RapidMiner
75
75
Pada penelitian ini, data yang digunakan adalah data pasien diabetes di Rumah Sakit Umum Daerah Waluyo Jati Kraksaan Probolinggo Jawa Timur. Data pasien diabetes tersebut diolah menggunakan metode data mining sehingga diperoleh satu metode yang paling akurat dan dapat digunakan sebagai rules dalam deteksi diabetes. Dalam penelitian ini akan dilakukan beberapa langkah-langkah atau tahapan penelitian seperti berikut ini : 1. 2. 3. 4.
Pengumpulan Data Pengolahan Awal Data Eksperimen dan pengujian Metode Evaluasi dan Validasi Hasil
3.1. Pengumpulan data Dalam penelitian ini untuk mendapatkan data – data yang diperlukan penulis menggunakan beberapa metode pengumpulan data sebagai berikut: Ada dua tipe dalam pengumpulan data, yaitu pengumpulan data primer dan pengumpulan data sekunder. Sumber data yang dihimpun langsung oleh peneliti disebut dengan sumber primer, sedangkan apabila melalui tangan kedua disebut sumber sekunder [20]. Pada penelitian ini digunakan pengumpulan data sekunder, yaitu data yang diperoleh dari pasien diabetes di Rumah Sakit Umum Waluyo Jati Kraksaan Probolinggo , yaitu melalui data yang dimiliki oleh lembaga tersebut. Data yang diperoleh dari lembaga tersebut dalam penelitian ini adalah data pasien tahun 2007 – 2011 dengan jumlah data sebanyak 70 record, dengan atribut No, jenis kelamin, umur, berat badan , tekanan darah. Berikut ilustrasi data pasien pada tabel 3.2 : Tabel 3.2 Ilustrasi data pesien diabetes No 1 2 3 4 5 6 7 8 9 10
76
Jenis Kelamin P L P P L L L L L P
Umur 35 46 26 31 44 45 44 42 70 49
Tinggi(cm)/Berat Badan(kg) 165/55 180/80 162/52 155/60 165/55 165/70 172/72 166/65 171/70 155/65
Tekanan Darah 110/70 130/90 120/70 120/70 170/100 150/100 140/90 160/110 150/100 170/100
3.2. Metode Pengolahan Data Awal Data yang diperoleh selanjutnya diolah disesuaikan dngan kebutuhan penelitian. Data ini dikategori untuk memudahkan proses pengujian metode. Data yang dikategori dari masing-masing parameter yang telah ditentukan yaitu usia, jenis kelamin, berat badan dan tekanan darah memiliki nilai linguistik dan rentang nilai yang berbeda, uraiannya sebagai berikut bahwa masing-masing parameter yang telah ditentukan memiliki nilai linguistik dan rentang nilai yang berbeda. [6] Parameter yang digunakan adalah umur, jenis kelamin, berat badan dan tinggi badan, tekanan darah, parameter tersebut menjadi variable input dan selanjutnya parameter tersebut menghasilkan variable output yaitu target “ya” dan “tidak”. Target “ya” ( pasien terdeteksi diabetes) dan target “tidak” (pasien tidak terdeteksi diabetes) diperoleh dari hasil perhitungan nilai linguistik masing-masing parameter tersebut. Semua parameter tersebut akan digunakan sebagai input dari proses training dan testing yang akan menghasilkan nilai akurasi dari model dan optimasi yang akan diterapkan. Berikut data yang dijadikan data training dan testing : Tabel 3.3 ilustrasi data pada data training JENIS NO UMUR SISTOLE IMT TARGET KELAMIN 1 P 26 120 19.81 Tidak 2 P 31 120 24.97 Tidak 3 L 44 170 20.20 Ya 4 L 45 150 25.71 Ya 5 P 44 140 24.34 Tidak 6 L 45 150 25.71 Ya 7 L 44 140 24.34 Tidak 8 L 42 160 23.59 Ya 9 L 70 150 23.94 Ya 10 P 49 170 27.06 Ya 3.3. Eksperimen dan Pengujian Metode Metode yang digunakan pada penelitian ini berdasarkan state of the art tentang deteksi diabetes menggunakan metode Data Mining. Metode yang diusulkan untuk pengolahan data data pasien adalah neural network untuk mendeteksi diabetes selanjutnya neural network akan dioptimasi dengan algorima genetika. Data diolah dengan neural network selanjutnya neural network dioptimasi dengan algoritma genetika dan diimplementasikan dengan RapidMiner 5.1, setelah diolah dan mengahasilkan model, maka terhadap model yang dihasilkan tersebut dilakukan pengujian menggunakan k-fold cross validation, kemudian dilakukan evaluasi dan validasi hasil dengan confusion matrix dan kurva ROC (Receiver Operating Characteristic). Dalam tahapan ini akan dilakukan beberapa langkahlangkah metode yang diusulkan data yaitu seperti berikut:
77
77
Gambar 3.1 Desain Eksperiman
Data yang ditunjukkan Tabel 3.6 menunjukkan hubungan antara variabel input ( jenis kelamin, umur, sistol dan IMT ) dan variabel output target yang diambil dari sampel penelitian ( penderita diabetes) yang dilakukan penulis di RSUD Waluyo Jati Kraksaan Probolinggo mulai tahun 2007 sampai tahun 2011. Data tersebut dijadikan parameter proses dalam penerapan dan pengujian model optimasi neural network – algoritma genetika. Parameter operasi yang digunakan dalam optimasi neural network –algoritma genetika dapat dilihat dari Tabel 3.7 . Sedang, Tabel 3.8 menunjukkan parameter komputasi yang digunakan dalam optimasi NN-GA. Berikut tabel parameter operasi dan tabel parameter komputasi : Tabel 3.4 parameter operasi model optimasi Neural Network –Algoritma Genetika Parameter Operasi Jenis kelamin Usia Berat badan Tekanan darah Target
Rentang Nilai L/P < 30 - > 70 < 18,5 - ≤ 35 < 100 - ≤ 200 Ya / Tidak
Tabel 3.5 parameter operasi model optimasi Neural Network –Algoritma Genetika Parameter Komputasi Population Size Crossover fraction Number of Generatio Mutation probability Elte count
78
Nilai 40 0,8 20 0,05 2
Selanjutnya paameter – pameter tersebut diinputkan padaprose training dan testing yeng menggunakan rapidminer pada tahat eksperimen dan pengujian model. Berikut tahapan eksperimen dan pengujian dari kedua metode tersebut terlihat pada gambar di 1. Eksperimen Model Neural Network
Gambar 3.7 training dan testing metode neural network 2. Eksperimen Model Neural Network – Algritma Genetika (AG )
Gambar 3. 8 training dan testing metode NN - AG
3. HASIL PENELITIAN DAN PEMBAHASAN 4.1 Hasil Eksperimen dan Pengujian Model Neural Network Hasil pengujian dengan metode neural network diperoleh accuracy 94.29%, sebanyak 38 data diprediksi tidak terdeteksi penyakit diabetes ternyata seusai dengan kenyataan yaitu tidak terdeteksi, 2 data diprediski tidak terdeteksi penyakit diabetes ternyata terdeteksi, 28 diprediski terdeteksi ternyata terdeteksi, dan 2 data diprediksi terdeteksi tetapi ternyata 2 data tidak sesuai yaitu tidak terdeteksi seperti terlihat pada Tabel 4.1 .
79
79
Table 4.1 confusion matrix metode neural network Pred.
Tidak
Ya
Tidak Ya
38 2
2 28
4.2 Hasil Eksperimen dan Pengujian Model Neural Network – Algoritma Genetika Dari hasil evaluasi confusion matrix untuk optimasi neural network – algoritma genetika, diketahui tingkat akurasinya 98.57%, dan dari 70 sebanyak 40 data yang diprediksi tidak terdeteksi diabetes ternyata sesuai yaitu 40 data yang tidak terdeteksi dan 1 data diprediksikan tidak terdeteksi ternyata terdeteksi dan sebanyak 29 diprediksi tedeteksi diabetes ternyata sesuai 29 yang terdeteksi diabetes dan tidak ada data yang diprediksi terdeteksi ternyata tidak terdeteksi. hasil pengujian dengan confusion matrix dapat dilihat pada tabel 4.2 berikut : Table 4.1 confusion matrix optimasi NN – AG Pred. Tidak Ya
Tidak 40 0
Ya 1 29
4.3 Perbandingan Metode Neural Network – Algoritma Genetika Tabel 4.3 menjabarkan perbandingan antara model optimasi neural network– algoritma genetika yang memiliki nilai akurasi sebesar 98.57% sedangkan nilai akurasi untuk metode neural network sebesar 94.29% dengan selisih akurasi 4.28%. Tabel 4.3. Perbandingan Performance Metode
Accuracy
Neural Network – algoritma genetika
NN
98.57%
94.29%
4.4 Pembahasan Hasil Eksperimen Setelah dilakukan perbandingan dengan confusion matrix akurasi terlihat metode yang terbaik adalah neural network – algoritma genetika karena akurasi lebih tinggi dalam mengukur akurasi deteksi penyakit diabetes dibandingkan neural network , sehingga dapat ditetapkan bahwa model optimasi neural network – algoritma genetika lebih tepat untuk diterapkan pada pendeteksian penyakit diabetes karena terbukti nilai akurasinya lebih besar dibandingkan metode neural network saja dengan selisih akurasi 4.28%.
80
Hasil eksperimen dan pengujian metode diperoleh hasil akurasi yang berbeda dari masing –masing metode. Hasil akurasi dari meode neural network dan optimasi neural network dengan algoritma genetika tsebut dapat dilihat pada tabel 4.1 dan tabel 4.2. berdasarkan Tabel 4.1 dan tabel 4.2 diatas diketahui bahwa hasil akurasi metode neural network 94.29%, dan model optimasi neural network dengan algoritma genetika diperoleh hasil akurasi sebesar 98.57% dengan selisih akurasi 4.28%. Setelah diketahui hasil dari neural network dan model optimasi neural network dengan algoritma genetika maka langkah selanjutnya adalah membandingkan hasil akurasi dari kedua metode tersebut . Perbandingan terhadap metode neural network dan model optimasi neural network dengan algoritma genetika dapat dilihat pada tabel 4.3. Berdasarkan hasil perbandingan pada metode neural network dan model optimasi neural network dengan algoritma genetika diatas dapat dilihat bahwa dengan hasil nilai akurasi diketahui metode yang terbaik yang akan diterapkan untuk mendeteksi diabetes yang pertama yaitu metode optimasi neural network – algoritma genetika dengan nilai 98.57%, yang kedua adalah metode neural network 94.29%. 4. KESIMPULAN DAN SARAN 5.1 Kesimpulan Dari hasil penelitian yang telah dilakukan pembuatan optimasi neural network – algoritma genetika dan neural network menggunakan data pasien penyakit diabetes. Model yang dihasilkan dikomparasi untuk dapat diketahui metode terbaik dalam deteksi penyakit diabetes. Untuk mengukur kinerja model digunakan confusion matrix yang dapat diketahui bahwa model optimasi neural network– algoritma genetika menghasilkan nilai akurasi lebih tinggi yaitu 98.57 %. Sedang metode neural network menghasilkan nilai akurasi 94.29 %. Dari evaluasi confusion matrix tersebut terlihat bahwa selisih nilai akurasi pada model optimasi neural network – algoritma genetika sebesar 4.28% lebih besar dibandingkan metode neural network. Dengan demikian model optimasi neural network – algoritma genetika adalah metode yang terbaik untuk pemecahan masalah deteksi diabetes dibandingkan dengan neural network . karena besar optimasi telah diketahui melalui besar nilai akurasi yang dimiliki model optimasi neural network – algoritma genetika. 5.2 Saran Walaupun model optimasi neural network – algoritma genetika lebih tepat untuk diterapkan pada deteksi diabates namun pada riset selanjutnya bisa dilakukan penambahan atribut dengan penggunaan data yang lebih besar sehingga akan diperoleh nilai akurasi yang lebih besar dan sempurna. 81
81
DAFTAR PUSTAKA [1] Asma Shaheen, W. A. (2009). Intelligent Decision Support System in Diabetic eHealth Care from the Perspective of Elder. Thesis Department of School of Computing Bleking Institute of Technology Soft Center, Sweden. Soegondo, S. (2005). Diagnosis dan Klasifikasi Diabetes Melitus Terkini. In [2] Penatalaksanaan Diabetes Melitus Terpadu (p. 17). Jakarta: Balai Penerbit FK UI [3] Divya Ms, Chhabra Raman, Kaur Sumit, Ghosh Swagata (2013). Diabetes Detection Using Artificial Neural Networks & Back-Propagation Algorithm [4] Ogor, E. N. (2007). Student Academic Performance Monitoring and Evaluation Using Data Mining Techniques. Fourth Congress of Electronics, Robotics and Automotive Mechanics [5] Al Cripp, (1996). ‘Using Artificial Neural Nets to Predict Academic Performance,' in ACM Symposium on Apllied Computing, 1996. [6] Agus Junaidi (2010), Sistem Cerdas Berbasis Logika fuzzy Untuk Mendeteksi Penyakit Diabetes [7] Cliffe, R. and Nicholas, J, Genetic Set Recombination and Its Application to Neural Network topology Optimisation, University of Edinburgh, Scotland, (2004). [8] Riries Rulaningtyas, (2007) Pengaplikasian Optimasi Neural Network oleh Algoritma Genetika pada Pendeteksian Kelainan Otak Stroke Iskemik sebagai Media Pembelajaran Dokter Muda [9] Suyono, S. (2005). Patofisiologi Diabetes Melitus. In Penatalaksanaan Diabetes. [10] http://www.jurnal.co.id/penyebab-penyakit-diabetes-yang-harus-diwaspadai. [11] Melitus Terpadu (pp. 1-15). Jakarta: Balai Penerbit FK UI [12] Sugiyono, Metode Penelitian Kuantitatif, Kualitatif dan R & D, 4th ed. Bandung, Indonesia: Alfabeta, 2010 [13] Witten, H. I., Eibe, F., & Hall, A. M. (2011). Data Mining Machine Learning Tools and Techiques. Burlington: Morgan Kaufmann Publisher. [14] Edgar, Thomas F., Himmeblau, D.M. dan Landon, L.S, (2001), “Optimization of Chemical Processes”, 2nd Edition, Mc. Graw-Hill, New York. [15] Paul S. Heckerlinga, Ben S. Gerbera, Thomas G. Tapec, Robert S.Wigton, Use of genetic algorithms for neural networks to predictcommunity-acquired pneumonia. Artificial Intelligence in Medicine (2004). [16] Gorunescu, Florin. (2011). Data Mining: Concepts and Techniques. Verlag berlin Heidelberg: Springer [17] Montana, J. David dan Davis, M., (2006), “Training Feedfoward Neural Networks Using Genetic Algorithms”, BBN System and Technologies Corp., Cambridge [18] Riduwan. (2008). Metode dan Teknik Menyusun Tesis. Bandung: Alfabeta
82