PREDIKSI PENYAKIT KENCING MANIS (DIABETES MELLITUS) MENGGUNAKAN ALGORITME KLASIFIKASI VOTING FEATURE INTERVALS 5
EKA HAYANA HASIBUAN
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010
ABSTRAK EKA HAYANA HASIBUAN. Prediksi Penyakit Diabetes Mellitus Menggunakan Algoritme Klasifikasi Voting Feature Intervals 5 Dibimbing oleh AZIZ KUSTIYO dan TRI NOVIATI. Penyakit Diabetes Mellitus (DM) merupakan penyakit berbahaya yang menjadi penyebab kematian terbesar keempat di dunia. Penyandang DM terus meningkat sekitar 7 juta jiwa setiap tahun. Peningkatan tersebut disebabkan oleh perubahan pola hidup sehari-hari seperti kurangnya aktivitas, kebiasaan mengkonsumsi makanan tinggi lemak, karbohidrat dan faktor keturunan. Akibat kebiasaan tersebut menyebabkan kadar gula dalam darah meningkat sehingga menimbulkan komplikasi diantaranya adalah penyakit jantung, ginjal, hati, dan gangguan pada pencernaan yaitu dyspepsia. Penyakit dyspepsia memiliki gejala yang mirip dengan DM sehingga pada penelitian ini dijadikan sebagai penyakit untuk diagnose pembanding. Penerapan algoritme VFI 5 pada data pasien mampu memberikan hasil prediksi yang baik dengan menghasilkan akurasi rata-rata 90% dilakukan berdasarkan validasi silang dengan 3-fold. Hasil dari selang pelatihan pada algoritme VFI5 5 menyatakan bahwa penyakit DM dan dyspepsia memiliki gejala yang mirip, sehingga bagi orang awam sulit untuk membedakan kedua penyakit tersebut tanpa melakukan uji laboratorium. Kata Kunci : Diabetes Mellitus, Dyspepsia, Voting Feature Intervals 5, 3-fold Cross Validation, Klasifikasi.
i
ABSTRACT EKA HAYANA HASIBUAN. The prediction of Diabetes Mellitus disease, using the classification algorithm of Voting Feature Intervals 5. Supervised by AZIZ KUSTIYO and TRI NOVIATI. Diabetes Mellitus (DM) is a dangerous disease that causes the death of the fourth largest in the world. Persons with diabetes continues to increase by approximately 7 million people every year. The increase was caused by changing patterns of daily life such as a lack of activity, eating habits high in fat, carbohydrates and heredity. These habits might cause blood sugar levels rise, which further causes complications such as heart disease, kidney, liver, and gastrointestinal disorders that is dyspepsia. Dyspepsia diseases have symptoms similar to DM. There for in this study, for the diagnosis of disease were used as comparison. The application of VFI5 algorithm on the patient data can give good prediction results by generating an average accuracy of 90% is based on cross validation with a 3-fold. The result of interval training VFI5 algorithm states that DM disease and dyspepsia have similar symptoms, so for the layman it is difficult to distinguish the two diseases without laboratory tests. Keywords: Diabetes Mellitus, dyspepsia, Voting Feature Intervals 5 , 3-fold Cross Validation, Classification.
ii
PREDIKSI PENYAKIT KENCING MANIS (DIABETES MELLITUS) MENGGUNAKAN ALGORITME KLASIFIKASI VOTING FEATURE INTERVALS 5
EKA HAYANA HASIBUAN
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010 iii
Judul
: Prediksi Penyakit Kencing Manis (Diabetes Mellitus) Menggunakan Algoritme Klasifikasi Voting Feature Intervals 5 : Eka Hayana Hasibuan : G64076018
Nama NRP
Menyetujui, Pembimbing I
Pembimbing II
Aziz Kustiyo, S.Si, M.Kom Nip. 197007191998021001
dr. Tri Noviati, MARS Nip. 140240244
Mengetahui, Ketua Departemen
Dr. Ir. Sri Nurdiati, M.Sc Nip. 196011261986012001
Tanggal Lulus :
iv
RIWAYAT HIDUP Penulis dilahirkan di Medan pada tanggal 18 Juni 1986. Anak ketiga dari 4 bersaudara, dari pasangan Bapak Turman dan Ibu Hasni. Pada tahun 2004 penulis lulus dari SMU Negeri 9 Medan, kemudian melanjutkan pendidikan Diploma III pada Program Studi Elektronika dan Teknologi Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Lulus Diploma pada Tahun 2007 penulis melanjutkan studi di Institut Pertanian Bogor jurusan Ilmu Komputer untuk memperoleh gelar sarjana.
v
PRAKATA Bismillahirrohmanirrohim, Segala puji bagi Allah SWT atas segala limpahan rahmat dan karunia-NYA yang telah diberikan, semoga sholawat serta salam tetap tercurahkan kepada nabi Muhammad SAW, sehingga penulis dapat menyelesaikan karya ilmiah ini dengan baik. Judul penelitian ini adalah Prediksi Penyakit Kencing Manis (Diabetes Mellitus) Menggunakan Algoritme Klasifikasi Voting Feature Intervals 5 yang dimulai sejak bulan Januari 2010. Penyelesaian penelitian ini tidak luput dari bantuan dan dukungan dari banyak pihak. Untuk itu saya ingin mengucapkan terima kasih kepada : 1. 2. 3. 4. 5. 6. 7. 8.
9.
Kedua orang tua saya yang senantiasa memberikan do’a dan dukungan. Bapak Aziz Kustiyo, S.Si, M.Kom dan Ibu dr. Tri Noviati, MARS selaku pembimbing dalam menjalankan proses pembuatan karya ilmiah ini. Bapak dr. Muhammad Syafi’i, M.Si yang telah bersedia dalam membagi ilmunya tentang penyakit Diabetes Mellitus dan kesesuaian data pada penelitian ini. Bagian Poliklinik Penyakit Dalam RSUD Pasar Rebo yang telah bersedia dijadikan tempat pengambilan data penelitian. Seluruh dosen pengajar dan civitas akademika Departemen Ilmu Komputer FMIPA IPB Teman-teman satu bimbingan yang bersama-sama berjuang dalam mengambil data penelitian. Kakak, abang dan adik saya yang selalu memberikan dukungannya. Anggi saksono, Crist Ferdian, Fazriah, Arifa, Hannisa, dan teman-teman seangkatan (ilkom ext 2) yang telah bersedia memberikan solusi atas masalah-masalah yang dihadapi selama proses penelitian. Teman-teman Kosan Cirahayu 3, dan semua pihak yang telah membantu memberikan dukungannya yang belum disebutkan di atas.
Akhirnya penulis berharap semoga pernulisan karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan. Amin.
Bogor, Juni 2010
Eka Hayana Hasibuan
vi
DAFTAR ISI Halaman DAFTAR TABEL ............................................................................................................. viii DAFTAR GAMBAR......................................................................................................... viii DAFTAR LAMPIRAN ..................................................................................................... viii PENDAHULUAN ................................................................................................................. 2 Latar Belakang ................................................................................................................... 2 Tujuan ................................................................................................................................ 2 Ruang Lingkup ................................................................................................................... 2 Manfaat .............................................................................................................................. 2 TINJAUAN PUSTAKA ........................................................................................................ 2 Kencing Manis (Diabetes Mellitus) ..................................................................................... 2 Klasifikasi Diabetes Mellitus .............................................................................................. 2 Gejala-gejala Diabetes Mellitus........................................................................................... 3 Dyspepsia........................................................................................................................... 3 Penyebab Dyspepsia ........................................................................................................... 3 Klasifikasi Dyspepsia ......................................................................................................... 3 K-fold Cross Validation ...................................................................................................... 4 Voting Feature Intervals 5 (VFI5)....................................................................................... 4 Confusion Matrix................................................................................................................ 6 METODE PENELITIAN ..................................................................................................... 6 Survei................................................................................................................................. 6 Studi literatur dan konsultasi dengan dokter ........................................................................ 6 Pengumpulan data .............................................................................................................. 6 Data latih dan data uji ......................................................................................................... 7 Pelatihan ............................................................................................................................ 7 Menentukan selang setiap fitur ............................................................................................ 7 Klasifikasi .......................................................................................................................... 7 1. Menentukan nilai vote pada data uji........................................................................... 7 2. Menjumlahkan nilai setiap instances ......................................................................... 7 3. Menentukan kelas prediksi ........................................................................................ 7 Akurasi .............................................................................................................................. 7 Spesifikasi aplikasi ............................................................................................................. 7 HASIL DAN PEMBAHASAN.............................................................................................. 7 Iterasi Pertama.................................................................................................................... 7 Iterasi Kedua ..................................................................................................................... 8 Iterasi Ketiga ..................................................................................................................... 9 KESIMPULAN DAN SARAN ............................................................................................ 11 Kesimpulan ...................................................................................................................... 11 Saran ................................................................................................................................ 11 DAFTAR PUSTAKA .......................................................................................................... 11
vii
DAFTAR TABEL Halaman 1 Confusion Matrix data dengan dua kelas .............................................................................. 6 2 Data iterasi ke-1 .................................................................................................................. 8 3 Prediksi data benar dan salah (iterasi 1) ................................................................................ 8 4 Nilai vote pasien DM ke-41 ................................................................................................. 8 5 Data iterasi ke-2 .................................................................................................................. 9 6 Prediksi data benar dan salah (iterasi2)................................................................................. 9 7 Nilai vote pasien DM ke-21 .............................................................................................. 9 8 Data iterasi ke-3 ................................................................................................................ 10 9 Prediksi data benar dan salah (iterasi 3) ................................................................................. 10 10 Nilai vote pasien DM ke-14 ............................................................................................. 10 11 Akurasi rata-rata .............................................................................................................. 10
DAFTAR GAMBAR Halaman 1 Pseudocode algoritme pelatihan VFI5. ................................................................................. 5 2 Pseudocode algoritme klasifikasi VFI5. ............................................................................... 5 3 Alur metode penelitian. ......................................................................................................... 6
DAFTAR LAMPIRAN Halaman 1 Normalisasi akhir pada iterasi pertama ............................................................................... 13 2 Nilai vote pada pasien salah prediksi pada iterasi pertama................................................... 13 3 Normalisasi akhir pada iterasi kedua .................................................................................. 14 4 Nilai vote pasien salah prediksi iterasi kedua ...................................................................... 14 5 Normalisasi akhir iterasi ketiga .......................................................................................... 15 6 Nilai vote pasien salah prediksi iterasi ketiga ...................................................................... 15 7 Selang-selang hasil proses pelatihan ................................................................................... 16
viii
PENDAHULUAN Latar Belakang Penderita Diabetes Mellitus (DM) meningkat setiap tahunnya. Berdasarkan data dari International Diabetes Federation (IDF) tahun 2009, penderita DM di dunia mencapai 230 juta dan mengalami peningkatan sekitar 3 persen atau sekitar 7 juta setiap tahunnya. Selain itu diabetes telah menjadi penyebab kematian terbesar keempat di dunia. Setiap tahun ada 3,2 juta kematian yang disebabkan oleh diabetes. Perlu diingat bahwa penyakit ini tidak hanya menyerang golongan ekonomi menengah ke atas, tetapi juga pada golongan tidak mampu. Jadi, penyakit ini sudah menjadi ancaman bagi negara-negara di seluruh dunia. Peningkatan jumlah penyandang diabetes ini akibat dari perubahan pola hidup sehari-hari, antara lain karena kurangnya aktivitas fisik dalam menjalankan kegiatan sehari-hari, kebiasaan mengkonsumsi makanan tinggi lemak dan karbohidrat. Akibat dari kebiasaan di atas menyebabkan keadaan hiperglikemi atau kadar gula di atas batas normal yang berlangsung lama dan akan menyebabkan timbulnya serangkaian reaksi kimia pada selsel atau berbagai jaringan atau organ, terutama pada pembuluh darah maupun bagian saraf. Pada pembuluh darah besar akan terjadi penyempitan atau sumbatan di dalam pembuluh darah. Dengan demikian dapat menimbulkan komplikasi seperti stroke, penyakit jantung koroner, gangguan fungsi ereksi, borok pada kaki, dyspepsia (gangguan pada usus) dan lain-lain. Penyakit yang menyebabkan penyakit dyspepsia memiliki gejala-gejala yang hampir mirip dengan diabetes di antaranya adalah mual, lemas dan muntah, Tetapi untuk mengetahui prediksi yang akurat terhadap kedua penyakit ini diperlukan pemeriksaan laboratorium. Pemeriksaan laboratorium membutuhkan biaya yang besar dan tidak semua balai pengobatan memiliki fasilitas yang lengkap seperti instansi-instansi di perkotaan. Algoritme VFI5 dipilih karena algoritme ini merupakan algoritme klasifikasi dan kokoh terhadap fitur yang tidak relevan sehingga mampu memberikan hasil yang baik. Penelitian sebelumnya yang menggunakan VFI5 adalah Guvenir (1998) yang melakukan penelitian diagnosis penyakit erythematosquamous di mana penyakit yang akan diklasifikasikan adalah psoriasis, seboroic dermatis, lichen planus, pityriasis
rosea, chronic dermatitis dan pityriaris rubra pilaris dan penelitian ini menghasilkan akurasi sebesar 99, 2% kemudian oleh Rosyid (2009) tentang diagnosis penyakit paru yang menghasilkan akurasi sebesar 83%. Tujuan Tujuan dari penelitian ini adalah menerapkan algoritme Klasifikasi VFI5 pada pasien rawat jalan Poliklinik Penyakit Dalam di Rumah Sakit Umum Pasar Rebo dan mendapatkan hasil prediksi penyakit DM dengan akurasi yang baik. Ruang Lingkup Ruang lingkup penelitian ini dibatasi pada: 1. Data yang digunakan bersumber dari data Rekam Medik Rawat Jalan di Poliklinik Penyakit Dalam RSUD Pasar Rebo. 2. Jenis Penyakit yang diteliti adalah DM dan dyspepsia. 3. Diagnosa ini tidak menggunakan proses uji laboratorium tetapi menggunakan data hasil pemeriksaan gejala dari pasien DM dan dyspepsia. Manfaat Implementasi penerapan algoritme Klasifikasi VFI5 untuk prediksi penyakit DM ini diharapkan dapat membantu pihak paramedis dalam melakukan prediksi penyakit dalam tanpa harus menggunakan uji laboratorium yang membutuhkan biaya yang besar beserta balai pengobatan terpencil lainnya yang masih minim fasilitas.
TINJAUAN PUSTAKA Kencing Manis (Diabetes Mellitus) Diabetes Mellitus (DM) adalah suatu kumpulan gejala yang timbul pada seseorang yang disebabkan oleh karena adanya peningkatan kadar gula (glukosa) darah akibat kekurangan insulin baik absolut maupun relatif (Arjatmo, 2002). DM juga sering disebut sebagai The Great Imitator, karena penyakit ini dapat mengenai semua organ tubuh dan menimbulkan berbagai macam keluhan dan gejalanya sangat bervariasi. DM dapat timbul secara perlahanlahan sehingga penderita tidak menyadari akan adanya perubahan seperti minum yang lebih banyak, buang air kecil lebih sering, kelelahan ataupun berat badan menurun (Supartondo dan Waspadji 1987). Klasifikasi Diabetes Mellitus Klasifkasi Diabetes Mellitus adalah sebagai berikut :
2
1. Tipe 1 atau diabetes yang bergantung pada insulin (IDDM). DM tipe ini disebabkan oleh kurangnya insulin dalam darah yang disebabkan karena kerusakan dari sel beta pangkreas. Gejala yang paling menonjol adalah sering terjadinya buang air kecil terutama malam hari, sering lapar dan haus, sebahagian besar penderita DM ini memiliki berat badan yang normal ataupun kurus. 2. Tipe 2 atau DM yang tidak bergantung pada insulin (NIDDM). Diabetes tipe ini disebabkan oleh insulin yang ada tidak dapat bekerja dengan baik. Kadar insulin dapat normal, rendah bahkan meningkat tetapi fungsi insulin untuk metabolisme glukosa tidak ada atau kurang. DM tipe ini ditandai dengan obesitas. 3. DM yang berhubungan dengan keadaan atau sindrom lainnya. 4. DM gestasional (GDM). Terjadi pada wanita yang tidak menderita DM sebelum kehamilannya. Gejala-gejala Diabetes Mellitus Keluhan umum pasien DM seperti poliuria, polidipsia, polifagia pada DM umumnya tidak ada. Sebaliknya, yang sering mengganggu pasien adalah keluhan akibat komplikasi degeneratif kronik pada pembuluh darah dan saraf. Pada DM lansia terdapat perubahan patofisiologi akibat proses menua, sehingga gambaran klinisnya bervariasi dari kasus tanpa gejala sampai kasus dengan keluhan yang sering muncul adalah adanya gangguan penglihatan karena katarak, rasa komplikasi yang luas, kesemutan pada tungkai serta kelemahan otot (neuropati perifer) dan luka pada tungkai yang sukar sembuh dengan pengobatan lazim.
dialami oleh sedikitnya 20% dalam populasi umum (Soewignjo 2009). Penyebab Dyspepsia Berbagai hal yang dianggap sebagai penyebab dyspepsia misalnya adalah asam lambung, keradangan, gangguan motilitas, alkohol, rokok, obat yang merangsang dan makanan yang pedas, Tetapi bukti yang jelas dari peranan hal-hal tersebut belum ditemukan. Gejala dyspepsia dapat juga disebabkan karena keadaan dalam lambung atau esophagus misalnya ulkus peptikum, dyspepsia non ulkus, esophageal reflux, gastritis dan keganasan lambung. Tetapi banyak kelainan di luar lambung yang menimbulkan simptom yang mirip dengan dyspepsia seperti penyakit empedu (batu atau keradangan), obat-obat, DM, pangkreatitis kronik, penyakit hati kronik dan hepatoma. Klasifikasi Dyspepsia Klasifikasi dyspepsia gejalanya sebagai berikut:
gejala-
1.
Dyspepsia Fungsional Gejala dyspepsia fungsional (menurut kriteria Roma) terdiri atas: a. Gejala menetap selama 3 bulan dalam 1 tahun. b. Nyeri epigastrium yang menetap atau sering kambuh (recurrent). c. Tidak ada kelainan organik yang jelas (termasuk endoskopi). d. Tidak ada tanda-tanda IBS (Irritable Bowel Syndrome). 2. a.
Dyspepsia Dyspepsia adalah Sindroma yang terdiri atas keluhan-keluhan yang disebabkan oleh kelainan traktus digestivus bagian proksimal yang dapat berupa mual atau muntah, kembung, dysphagia, rasa penuh, nyeri epigastrium atau nyeri retrosternal dan ruktus, yang berlangsung lebih dari 3 bulan dan didiagnosa GERD (Taley 2005). Dyspepsia juga sering disebut dengan “sakit maag” merupakan keluhan yang sangat sering kita jumpai sehari hari. Sebagai contoh dalam masyarakat di negara-negara barat dyspepsia dialami oleh sedikitnya 25% populasi. Di negara negara Asia belum banyak data tentang dyspepsia tetapi diperkirakan
beserta
b.
Dyspepsia Organik Gejala dyspepsia Organik dibedakan menjadi: Dyspepsia Ulcus Merupakan bagian penting dari dyspepsia organik. Gejala utama dari ulkus peptikum adalah hunger pain food relief. Untuk ulkus duodeni nyeri umumnya terjadi 1 sampai 3 jam setelah makan, dan penderita sering terbangun di tengah malam karena nyeri. Tetapi banyak juga kasus kasus yang gejalanya tidak jelas dan bahkan tanpa gejala. Pada ulkus lambung seringkali gejala hunger pain food relief tidak jelas, bahkan kadang kadang penderita justru merasa nyeri setelah makan. GERD (Gastroesophageal Reflux Disease) Dahulu GERD dimasukkan dalam dyspepsia pungsional tetapi setelah ditemukan dasar-dasar organik maka
3
GERD dimasukkan ke dalam dyspepsia organik. Penyakit ini disebabkan Inkompetensi/relaksasi sphincter cardia yang menyebabkan regurgitasi asam lambung ke dalam esofagus. Gejala khas GERD adalah heart burn, rasa nyeri pada epigastrium, rasa nyeri pada retrosternal, regurgitasi asam, nafas pendek dan batukbatuk. K-Fold Cross Validation Merupakan metode membagi data menjadi kfold yang saling bebas secara acak dengan ukuran relatif sama. Pelatihan dan pengujian dilakukan sebanyak k-kali. Pada iterasi ke-i, subset Si dijadikan sebagai data pengujian, dan data subset lainnya dijadikan sebagai data pelatihan. Tingkat akurasi dapat dihitung dengan membagi jumlah hasil klasifikasi yang benar dari k-iterasi dengan semua jumlah instance pada data awal (Han & Kamber 2001). Voting Feature Intervals 5 Algoritme klasifikasi VFI5 merepresentasikan sebuah konsep yang mendeskripsikan konsep selang antar fitur. Algoritme ini dikembangkan oleh Gülşen Demiröz dan Halil Altay Güvenir pada tahun 1997. Telah dikemukakan bahwa algoritme VFI ini termasuk dalam algoritme yang supervised, yaitu algoritme yang memiliki target berupa kelas-kelas data dan bersifat nonincremental yang berarti semua data pelatihan diproses secara bersamaan (Demiröz dan Güvenir 1997). Algoritme VFI terus berkembang hingga pada versi terakhirnya yaitu algoritme VFI5. Proses klasifikasi instance baru didasari pada feature vote. Masing-masing fitur yang ada memberikan nilainya pada voting di antara kelas-kelas yang ada. Kelas yang menerima nilai vote tertinggi maka ditentukan sebagai kelas yang diprediksi. Pada algoritme VFI5 selang dari setiap fitur diperoleh dari data latih. Algoritme VFI5 juga membuat interval untuk setiap fitur berupa range interval dan point interval. Sebuah range interval didefinisikan sebagai sebuah himpunan nilai-nilai yang berurutan dari fitur yang diberikan. Sebuah point interval didefinisikan untuk sebuah nilai fitur tunggal dimana hanya sebuah nilai tunggal yang digunakan untuk mendefinisikan selang tersebut. Keunggulan algoritme VFI5 adalah algoritme ini cukup kokoh (robust) terhadap feature yang tidak relevan namun mampu memberikan hasil yang baik pada real world
dataset yang ada. VFI5 juga mampu menghilangkan pengaruh yang kurang menguntungkan dari feature yang tidak relevan dengan mekanisme votingnya (Güvenir 1998). Berikut terdapat dua proses pada algoritme VFI5 yaitu proses pelatihan dan proses klasifikasi. 1. Pelatihan Proses pelatihan ini bertujuan untuk mencari model yang akan digunakan untuk proses klasifikasi. Pada proses pelatihan ini akan dihasilkan selang pada setiap fitur. Sebuah selang mewakili himpunan nilai-nilai dari fitur yang diberikan. End point pada selang harus diketahui untuk menghasilkan selang fitur tertentu. Proses menemukan end point berbeda untuk fitur linear dan fitur nominal. Untuk fitur linear nilai-nilainya memiliki urutan dan dapat dibandingkan tingkatannya. Untuk menentukan end point pada fitur ini dengan cara mencari nilai maksimum dan minimum pada fitur tersebut untuk setiap kelas. Berbeda dengan fitur nominal dimana nilai-nilai dari fitur tersebut tidak memiliki urutan dan tidak dapat dibandingkan tingkatannya, untuk menentukan end point pada fitur ini dengan cara mencatat semua nilai yang berada pada fitur tersebut. Pada fitur selang menghasilkan point interval dan range interval serta jumlah maksimal end point, sedangkan fitur nominal hanya menghasilkan point interval saja. Untuk setiap selang i dari sebuah fitur f dihitung jumlah instance pelatihan setiap kelas c yang jatuh pada selang i dan hasilnya disimpan sebagai interval_class_count [f,i,c]Hasil dari proses ini merupakan vote kelas c pada selang i. jumlah instance untuk setiap kelas c dapat berbeda-beda, sehingga dilakukan normalisasi pada vote kelas c untuk fitur f dan selang i, untuk menghilangkan efek perbedaan distribusi setiap kelas. Normalisasi dilakukan dengan cara membagi jumlah instance pelatihan setiap kelas c yang ada pada selang i sebuah fitur f dengan jumlah instance pada setiap kelas c, kemudian hasilnya disimpan sebagai interval_class_vote [f,i,c]. Nilai yang ada pada interval_class_vote[f,i,c] dinormalisasi kembali sehingga jumlah vote setiap kelas c pada selang i untuk fitur f sama dengan pseudocode algoritme pelatihan VFI5 pada Gambar 1.
4
train(TrainingSet): begin for each feature f if f is linear for each class c EndPoints[f] = EndPoints[f] U find_end_points(TrainingSet,f,c); sort(EndPoints[f]); for each end point p in EndPoints[f] form a point interval from end point p form a range interval between p and next EndPoints ≠ p else /* f is nominal */ form a point interval for each value of f for each interval i on feature dimension f for each class c interval_class_count[f,i,c] = count_instances(f, i, c); for each interval i on feature dimension f for each class c interval_class_vote[f,i,c] = interval_class_count[f,i,c] / class_count[c] normalize interval_class_vote[f,i,c]; /*such that ∑c interval_class_count[f,i,c]=1*/ end. Gambar 1.Pseudocode algoritme pelatihan VFI5 2. Klasifikasi Pada setiap kelas c, vote diberi nilai awal 0 karena semua fitur pada awalnya belum memberikan vote, kemudian dicari selang i dimana instance pengujian jatuh pada selang tersebut untuk setiap fitur f. Jika terdapat nilai suatu fitur dari instance pengujian yang hilang atau tidak diketahui, maka fitur tersebut diasumsikan tidak memberikan vote sehingga nilai vote untuk fitur tersebut sama dengan 0. Setelah instance pengujian jatuh pada selang i, maka semua vote setiap kelas c pada selang
tersebut disimpan dalam sebuah vektor
, dimana feature_vote[f,Cj] merupakan fitur untuk kelas Cj dan k adalah jumlah kelas. Kemudian nilai-nilai vote dari setiap fitur pada selang i dimana instance pengujian jatuh dijumlahkan setelah masingmasing dikalikan dengan bobot fitur yang bersesuaian dan hasilnya disimpan dalam sebuah vektor vote . Kelas dengan jumlah vote terbesar diramalkan sebagai kelas prediksi. Gambar 2 merupakan pseudocode algoritme klasifikasi VFI5.
classify(e): /*e is example to be classified*/ begin for each class c vote[c]=0 */sum of vote of class c*/ for each feature f for each class c feature_vote[f,c]=0 /*vote of feature f for class c*/ if f value is known i= find_interval(f, ef) feature_vote[f, c]=interval_class_vote[f,i,c] for each class c vote[c]= vote[c] + (feature_vote[f, c] * w(f)); return class c with highest vote[c]; end Gambar 2.Pseudocode algoritme klasifikasi VFI5
5
Confusion Matrix Confusion matrix merupakan informasi tentang penggambaran data aktual yang direpresentasikan pada baris matriks dan kelas data hasil prediksi pada sebuah algoritme yang direpresentasikan pada kolom matriks klasifikasi. Untuk menentukan akurasi algoritme klasifikasi dapat dicari dengan mengevaluasi pada kolom matriks. Pada Tabel 1 disajikan confusion matrix untuk data dengan dua kelas (Kohavi & Provost 1998 diacu dalam Hamilton 2002).
Studi literatur dan konsultasi dengan dokter Tahap selanjutnya adalah studi literatur yang berkaitan dengan penyakit dan algoritme VFI5 dan dilanjutkan dengan konsultasi dengan dokter spesialis penyakit dalam. Hal ini dilakukan untuk mendapatkan informasi data Survei
Studi Literatur dan Konsultasi dengan dokter
Tabel 1. Confusion matrix data dengan dua kelas. Prediksi
Data Kelas 1 Aktual
Pengumpulan data
Data
Kelas 2
Kelas 1
a
b
Kelas 2
c
d
Keterangan : a adalah jumlah instance kelas 1 yang berhasil diprediksi dengan benar sebagai kelas 1, b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2, c adalah jumlah instance kelas 2 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 1, d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.
Data latih
VFI5
Data Uji
Pelatihan
Klasifikasi
Menentukan Selang setiap fitur
Menentukan nilai vote
Menjumlahkan nilai setiap instance berdasarkan fiturnya
Menentukan Kelas Prediksi
Akurasi
Gambar 3. Alur metode penelitian
METODE PENELITIAN Gambar 3. Diagram alur metode penelitian Penelitian ini dilakukan dengan beberapa tahapan proses untuk memperoleh hasil akurasi dari algoritme klasifikasi VFI5 dengan 3-fold validation pada penyakit DM dan dyspepsia. Tahapan-tahapan diagram alur penelitian disajikan pada Gambar 3. Survei Survei data dilakukan ke lembaga/instansi yang bersedia menyediakan data dan sekaligus bersedia sebagai tempat penelitian. Instansi yang dijadikan tempat survei dan penelitian adalah Rumah Sakit Umum Daerah Pasar Rebo Jakarta Timur.
variabel gejala pendukung DM yang relevan untuk bahan penelitian. Konsultasi tersebut dilakukan dengan beberapa dokter diantaranya dr. TriNoviati (Rumah Sakit Pasar Rebo) dr. Muhammad Syafi’i, M.Si (Rumah Sakit Pasar Rebo) Pengumpulan data Data yang digunakan pada penelitian ini adalah data rekam medis dokter dan perawat di Rumah Sakit Pasar Rebo. Data yang diteliti merupakan data gejala umum DM dan dyspepsia yang berupa data diskret. Kemudian untuk mempermudah penerapan algoritme data tersebut dikonversi menjadi data nominal 0 dan
6
1. Setelah itu dikonsultasikan dengan pihak dokter sehingga didapat relevasi data yang tepat untuk prediksi penyakit DM.
pada instance baru tersebut. Hasil dari proses ini merupakan hasil prediksi penyakit DM atau dyspepsia pada data uji.
Data latih dan data uji Data yang telah dikonversi akan dibagi menjadi data latih dan data uji. Untuk pembagian data latih dan data uji ini akan dilakukan dengan menggunakan metode acak. Seluruh data akan dibagi menjadi 2 : 1, di mana 2 untuk banyaknya data latih dan 1 untuk banyaknya data uji.
Akurasi Tahap akhir dari metode penelitian ini adalah menghitung nilai akurasi dari hasil yang diperoleh pada tahap pengolahan data menggunakan algoritme VFI5. Akurasi dapat dihitung dengan:
Pelatihan Proses pelatihan pada penelitian ini dilakukan dengan menggunakan algoritme VFI5, di mana data latih yang telah ditentukan digunakan sebagai input dari algoritme VFI5 dalam proses pelatihan. Gejala umum penyakit DM dan dyspepsia sebagai fitur dari setiap data pasien, sedangkan DM dan dyspepsia merupakan kelas dari data pasien tersebut Selang setiap fitur Selang setiap fitur didapat dari proses pelatihan. Untuk menentukan selang-selang ini terlebih dahulu dilakukan proses normalisasi yang dilakukan pada proses pelatihan. Selangselang ini berisikan nilai vote untuk setiap kelas pada setiap gejala. Klasifikasi Tahapan dari klasifikasi terdiri dari 3 tahap yaitu tahap menentukan nilai vote pada data uji, tahap menjumlahkan setiap instances dan tahap menentukan kelas prediksi. Berikut penjelasan dari tahapan tersebut. 1. Menentukan nilai vote pada data uji Pada proses klasifikasi, terdapat tahap menentukan nilai vote untuk instance baru. Nilai vote ini ditentukan dengan cara nilai fitur dari instance baru akan diperiksa dan dilihat letak selang nilai fitur tersebut, kemudian nilai vote setiap instance pada data latih yang terletak pada selang yang sama dengan instance yang baru akan disimpan sebagai vote dari instance baru tersebut. 2. Menjumlahkan nilai setiap instances Nilai vote yang telah dihasilkan dari tahap klasifikasi pertama dan telah dikalikan dengan bobot pada tahap klasifikasi kedua akan dijumlahkan pada setiap instance-nya. 3.Menentukan kelas prediksi Hasil penjumlahan vote dari setiap instance akan dibandingkan, kelas dengan total vote yang tertinggi akan menjadi kelas prediksi
∑data uji benar klasifikasi Akurasi =
X 100% ∑ total data uji
Spesifikasi aplikasi Aplikasi ini akan dikembangkan berbasis desktop, dengan implementasi perangkat keras dan perangkat lunak sebagai berikut : Perangkat keras yang digunakan berupa komputer notebook dengan spesifikasi: - Processor Intel Pentium core 2 solo 1,4 GHz - RAM 4 GB - HDD 500 GB Perangkat lunak yang digunakan : - Sistem Operasi : Microsoft Vista Premium - Matlab 7.1
HASIL DAN PEMBAHASAN Pada tahap awal, data gejala DM dan dyspepsia atau data variabel yang masih berbentuk data ordinal dikonversi menjadi data nominal 0 dan 1. Data yang diberi nilai 0 adalah data yang tidak mengalami gejala sedangkan nilai 1 adalah data yang mengalami gejala. Proses ini dilakukan untuk mempermudah proses perhitungan algoritme. Proses konversi dilakukan melalui konsultasi dengan dokter. Hal ini dilakukan karena pihak dokter lebih memahami setiap gejala DM dan dyspepsia yang relevan dilihat dari tingkat pengaruh pada setiap gejala. Data yang telah dikonversi kemudian dibagi tiga bagian sesuai dengan konsep 3Fold Cross Validation. Proses perhitungan menggunakan algoritme VFI5 dengan membagi antara data latih dan data uji 2:1, dimana 2 untuk data latih dan 1 untuk data uji. Pada pembagian data latih dan data uji dilakukan secara acak dengan menghitung banyaknya jumlah setiap angka nominal pada setiap gejala agar setiap data latih mendapatkan semua nilai nominal dari setiap
7
gejala. Pada penelitian ini dilakukan tiga kali percobaan sesuai dengan konsep K- fold cross validation dengan nilai k = 3 untuk mengoptimisasi data yang ada. Berikut ini diberikan penjelasan secara rinci pembahasan pada 3 percobaan tersebut: Iterasi pertama Pada iterasi pertama dapat dijelaskan bahwa yang menjadi fitur pada pasien DM adalah pusing, mual, muntah, dan lemas. Di sisi lain yang menjadi fitur pada pasien dyspepsia adalah demam, nyeri ulu hati, sesak nafas, nyeri dada, mencret, batuk dengan nilai vote lebih dari 0,5. Pada iterasi pertama data yang digunakan sebagai data latih berjumlah 54 data yang dibagi dalam dua kelas yaitu kelas DM sebanyak 34 data dan kelas dyspepsia sebanyak 20 data. Kemudian untuk data ujinya berjumlah 26 data yang dibagi menjadi dua kelas juga yaitu kelas DM sebanyak 16 data dan untuk kelas dyspepsia sebanyak 10 data. Pada Tabel 2 disajikan rincian data iterasi pertama. Tabel 2. Data iterasi ke-1 Jumlah Data
Data Data latih Data uji
54 26
Subset Instance Kelas Kelas DM Dys 34 16
20 10
Data di atas diolah menggunakan algoritme klasifikasi VFI5. Diawali dengan proses pelatihan, dimana setiap gejala atau fitur dicari nilai end point-nya sampai didapatkan nilai vote dari setiap fitur. Pada Tabel 3 disajikan prediksi data yang benar dan salah pada fold pertama. Tabel 3. Prediksi data yang benar dan salah(iterasi 1) Prediksi
Aktual
Data DM
Dys
DM
15
1
Dys
1
9
Dari Tabel 3 di atas dapat dilihat bahwa prediksi data kelas DM yang benar sebanyak 15 data dan prediksi kelas yang salah sebanyak 1 pasien yaitu pasien DM yang ke-41, Kemudian prediksi kelas dyspepsia yang benar ada sebanyak 9 data dan prediksi kelas
dyspepsia yang salah ada 1 data yaitu pasien dyspepsia yang ke-80 yang diprediksi sebagai DM dan akurasi dari hasil prediksi data yang benar sebesar 92,31%. Pada hasil normalisasi akhir pada iterasi pertama dijelaskan bahwa pasien ke 35 sampai ke pasien ke-50 yang kelas sebenarnya merupakan pasien DM sedangkan pasien ke-51 sampai ke pasien ke-80 yang kelas sebenarnya merupakan pasien dyspepsia. Hasil normalisasi akhir disajikan pada Lampiran 1. Pada Tabel 4 disajikan nilai vote data salah prediksi pada pasien DM ke-41 sedangkan nilai vote pada pasien dyspepsia ke-80 disajikan pada Lampiran 2. Tabel 4. Nilai vote pasien DM ke-41 Data pasien DM ke 41 alaGeG
Gejala pasien DM
Nilai Vote DM
Dys
Pusing
1
0.758
0.242
Mual
0
0.370
0.630
Muntah
1
0.624
0.376
Lemas
1
0.595
0.405
Demam
1
0.310
0.690
Nyeri Ulu hati
1
0.420
0.580
Sesak nafas
1
0.266
0.734
Nyeri dada
1
0.407
0.593
Mencret
1
0.320
0.680
batuk Total Normalisasi Akhir
1
0.181 4.251
0.819 5.749
0.425
0.575
Keterangan: 0 : Nilai Tidak 1 : Nilai Ya
Pada iterasi pertama kesalahan prediksi ada pada setiap kelas, oleh karena itu pada Tabel 4 disajikan nilai vote pasien DM pada fitur dengan nilai yang lebih besar pada pasien dyspepsia adalah mual, demam, nyeri ulu hati, nyeri dada, mencret, dan batuk. Kesalahan kedua terdapat pada data pasien dyspepsia ke80 yang diprediksi ke dalam kelas DM pada fitur dengan nilai vote yang lebih besar pada pasien DM adalah pusing, lemas, sesak nafas, mencret dan batuk. Iterasi Kedua Hasil pelatihan pada iterasi kedua yang menjadi fitur pada pasien DM adalah pusing, mual, muntah, dan muntah. Di sisi lain yang menjadi fitur pada pasien dyspepsia adalah demam, nyeri ulu hati, sesak nafas, nyeri dada, mencret, batuk dengan nilai vote lebih dari 0,5. Nilai selang 0 dari hasil pelatihan untuk fitur
8
nyeri dada pada kelas DM dan kelas dyspepsia cukup dekat artinya untuk fitur nyeri dada bisa dimiliki oleh kelas DM dan dyspepsia. Iterasi kedua menggunakan data latih berjumlah 54 data yang dibagi ke dalam kelas DM sebanyak 33 data dan kelas dyspepsia sebanyak 20 data. Data uji menggunakan data yang berjumlah 26 data yang masing-masing dibagi ke dalam kelas DM sebanyak 17 data dan kelas dyspepsia sebanyak 10 data. Pada Tabel 5 disajikan data iterasi ke-2.
dengan nilai vote yang lebih tinggi pada fitur demam, nyeri ulu hati, mencret dan batuk. Kesalahan pada pasien DM yang ke-21 ini dapat dikatakan bahwa pasien ini mengalami penyakit DM yang sudah berkomplikasi dengan dyspepsia. Tabel 7. Nilai vote pasien DM ke-21 Data pasien DM ke 21
alaGeG
Tabel 5. Data iterasi ke-2 Data
Jumlah Data
Subset Instance Kelas Kelas DM
Dys
Data latih Data uji
53
33
20
27
17
10
Pada Tabel 5 disajikan prediksi data benar dan salah pada iterasi kedua. Untuk data yang benar diprediksi menjadi pasien DM berjumlah 16 data sedangkan yang salah berjumlah 1 yaitu data pasien DM yang ke-21 dan untuk data yang benar diprediksi menjadi pasien dyspepsia berjumlah 9 data sedangkan data yang salah berjumlah 1 yaitu data pasien dyspepsia yang ke-67. Akurasi yang diperoleh dari prediksi data yang benar pada iterasi kedua sebesar 92,59% dimana terdapat peningkatan terhadap akurasi sebelumnya sebesar 0,28% dengan kesalahan prediksi sebanyak 2 pasien. Tabel 6. Prediksi data yang benar dan salah(iterasi 2) Prediksi
Aktual
Data DM
Dys
DM
16
1
Dys
1
9
Hasil normalisasi akhir pada iterasi kedua, pasien ke-18 sampai pasien ke-34 yang kelas sebenarnya merupakan pasien DM sedangkan pasien ke-61 sampai pasien ke-70 yang kelas sebenarnya merupakan pasien dyspepsia. Hasil normalisasi akhir dapat dilihat pada Lampiran 3. PadaTabel 7 disajikan nilai vote data salah prediksi pertama pada pasien DM yang ke-21, dimana pasien DM diprediksi ke dalam pasien dyspepsia karena pasien DM ini yang memiliki fitur pusing, mual, muntah dan lemas sebenarnya merupakan ciri utama dari penyakit DM, tetapi pasien DM ini juga memiliki fitur
Gejala pasien DM
Pusing 1 Mual 1 Muntah 1 Lemas 1 Demam 1 Nyeri Ulu 1 hati Sesak nafas 0 Nyeri dada 0 Mencret 1 batuk 1 Total Normalisasi Akhir
Nilai Vote
DM
Dys
0,653 0.517 0.621 0.615 0.361
0.347 0,483 0.379 0.385 0.639
0.395
0.605
0.645 0.517 0.318 0.168 4.811 0.481
0.355 0.483 0.682 0.832 5.189 0.519
Kesalahan prediksi kedua adalah pada pasien dyspepsia yang ke-67, yaitu pasien dyspepsia yang diprediksi ke dalam kelas DM dan untuk pasien dyspepsia yang salah prediksi mempunyai fitur dengan nilai yang lebih besar yaitu pada pusing, mual, muntah, lemas, demam, nyeri ulu hati, nyeri dada dan batuk. Nilai vote data salah prediksi pada pasien dyspepsia ke-67 dapat dilihat pada Lampiran 4. Iterasi Ketiga Pada selang hasil pelatihan iterasi ketiga ini dapat dijelaskan bahwa, untuk pasien DM memiliki fitur pusing, mual, muntah dan lemas sedangkan untuk demam, nyeri ulu hati, sesak nafas, nyeri dada, mencret dan batuk merupakan fitur dari pasien dyspepsia dengan nilai vote lebih dari 0,5. Iterasi ketiga ini adalah percobaan terakhir yang dilakukan pada penelitian ini. Iterasi ini menggunakan data latih berjumlah 53 data yang dibagi ke dalam kelas DM sebanyak 33 data dan kelas dyspepsia sebanyak 20 data. Untuk data ujinya berjumlah 27 data dan dibagi ke dalam kelas DM sebanyak 17 data dan kelas dyspepsia sebanyak 10 data. Berikut pada Tabel 8 disajikan data iterasi ke-3.
9
Tabel 8. Data iterasi ke-3 Jumlah Data
Data Data latih Data uji
Subset Instance Kelas Kelas DM Dys
53
33
20
27
17
10
Pada Tabel 9 disajikan prediksi data yang benar dan salah dari iterasi ketiga, dimana untuk data prediksi benar sebagai pasien DM sebanyak 16 data dan untuk data salah prediksi sebagai pasien DM sebanyak 1 data. Data prediksi benar sebagai pasien dyspepsia sebanyak 7 data dan untuk data salah prediksi sebagai pasien DM ada sebanyak 3 data. Tabel 9. Prediksi data yang benar dan salah(iterasi 3) Prediksi
Aktual
Data DM
Dys
DM
16
1
Dys
3
7
Akurasi dari prediksi data yang benar sebesar 85,19% dimana terjadi penurunan dari akurasi sebelumnya. Penurunan akurasi sebesar 7,4% disebabkan oleh pada iterasi ketiga ini kesalahan prediksi terhadap pasien berjumlah 4 pasien. Tabel 10. Nilai vote pasien DM ke-14 Data pasien DM ke 14
pasien ke-60 yang kelas sebenarnya merupakan pasien dyspepsia. Hasil dari normalisasi akhir ini dapat dilihat pada Lampiran 5. Pada Tabel 10 disajikan nilai vote data salah prediksi pasien DM yang ke-14 sedangkan pada kesalahan data pasien dyspepsia ke-51, pasien dyspepsia ke-52 dan pasien dyspepsia ke-57 dapat dilihat pada Lampiran 6. Kesalahan prediksi pertama terjadi pada pasien DM yang ke-14 yaitu pasien DM yang diprediksi ke dalam kelas dyspepsia. Pasien DM salah prediksi pada fitur dengan nilai yang lebih besar adalah mual, lemas, demam, nyeri ulu hati, sesak nafas, mencret, dan batuk. Kesalahan prediksi kedua adalah pada data dyspepsia yang ke-51 yaitu pasien dyspepsia yang diprediksi ke kelas DM karena pada fitur dengan nilai yang lebih besar adalah mual, muntah, lemas, sesak nafas dan batuk. Kesalahan prediksi ketiga adalah pada pasien dyspepsia yang ke-52 yaitu pasien dyspepsia yang diprediksi ke kelas DM pada fitur dengan nilai yang lebih besar adalah pusing, mual, muntah, lemas, nyeri dada. Kesalahan terakhir dari iterasi ketiga adalah pada data pasien dyspepsia yang ke-57 yaitu pasien dyspepsia yang diprediksi ke kelas DM pada fitur dengan nilai yang lebih besar adalah mual, muntah, lemas, demam, nyeri ulu hati, nyeri dada, mencret. Dari keselurahan iterasi, penelitian ini menghasilkan akurasi rata-rata sebesar 90%. Pada Tabel 11 disajikan hasil akurasi rata-rata dari setiap percobaan. Tabel 11. Akurasi rata-rata
Gejala pasien DM
DM
Dys
Pusing
1
0,653
0.347
Iterasi I
26
54
92.31%
Mual
0
0,350
0,650
Iterasi II
27
53
92,59%
Muntah
1
0,653
0,347
Iterasi III
27
53
Lemas
0
0,099
0,901
Demam Nyeri Ulu hati Sesaknafas
1
0,362
0,638
1
0,447
0,553
1
0,288
0,712
Nyeri dada
0
0,589
0,411
Mencret
1
0,357
0,643
batuk
1
0,139
0,861
Total
3.938
6,062
Normalisasi Akhir
0.393
0,606
alaGeG
Nilai Vote
Hasil dari normalisasi akhir pada iterasi ketiga adalah pasien ke-1 sampai pada pasien ke-17 yang kelas sebenarnya merupakan pasien DM, sedangkan pada pasien ke-51 sampai pada
Gejala
Jumlah data uji
Rata-rata
Jumlah data latih
Akurasi
85,19% 90,00%
Dari seluruh percobaan pada penelitian ini diperoleh bahwa, nilai selang hasil dari pelatihan umumnya memiliki pola yang sama antara iterasi pertama sampai pada iterasi ketiga yaitu untuk fitur pusing, mual, muntah dan lemas merupakan gejala-gejala umum dari pasien DM, sedangkan untuk fitur demam, nyeri ulu hati, sesak nafas, nyeri dada, mencret dan batuk merupakan gejala-gejala dari pasien dyspepsia. Tetapi pada iterasi kedua, hasil nilai pelatihannya cukup mirip pada fitur nyeri dada sehingga diperoleh nilai selang yang tidak jauh berbeda antara kelas DM dan kelas dyspepsia
10
yang artinya bahwa untuk fitur nyeri dada bisa dimiliki oleh kedua pasien tersebut. Nilai hasil selang pelatihan dapat dilihat pada Lampiran 7. Pada hasil setiap iterasi memiliki kesalahan prediksi pada masing-masing data pasien yaitu pada iterasi pertama, data salah prediksi ada pada pasien DM ke-41 dan pasien dyspepsia ke-80. Pada iterasi kedua kesalahan prediksi ada pada pasien DM ke-21 dan pasien dyspepsia ke-67, sedangkan pada iterasi ketiga kesalahan prediksi ada pada pasien DM ke-14, pasien dyspepsia ke-51, dyspepsia ke-52, dyspepsia ke-57. Masing-masing kesalahan tersebut dapat dilihat pada fiturnya. Pada iterasi pertama sampai pada iterasi ketiga untuk pasien DM yang diprediksi menjadi pasien dyspepsia memiliki pola kesalahan prediksi dengan nilai vote lebih besar pada fitur demam, nyeri ulu hati, mencret dan batuk, sedangkan data salah prediksi pada pasien dyspepsia yang diprediksi menjadi pasien DM memiliki pola kesalahan yang sama dengan vote lebih besar pada fitur pusing, mual, muntah, lemas. Terdapat kasus pada iterasi ketiga di mana pasien dyspepsia diprediksi ke dalam kelas DM namun selisih nilai normalisasi dari kedua kelas tersebut kurang dari 0,01. Kesalahan tersebut disajikan pada lampiran 6. Tabel ini menunjukkan bahwa pasien dyspepsia yang diprediksi ke dalam kelas DM adalah pasien dyspepsia yang memiliki gejala yang sama dengan pasien DM. Pada kasus tersebut menurut keterangan dari dokter bahwa pasien tersebut sudah mengalami komplikasi, sehingga perlu diadakan uji lanjut oleh dokter menggunakan proses uji laboratorium.
KESIMPULAN DAN SARAN Kesimpulan Pada penelitian ini algoritme Voting Feature Interval 5 digunakan untuk klasifikasi data. Data yang digunakan pada penelitian ini merupakan data rekam medik dari poli penyakit dalam Rumah Sakit Pasar Rebo. Jumlah keseluruhan data yang digunakan sebanyak 80 data terdiri dari kelas DM sebanyak 50 data dan untuk kelas dyspepsia sebanyak 30 data. Penelitian ini menggunakan 3-fold cross validation yaitu percobaan dibagi menjadi iterasi pertama, iterasi kedua dan iterasi ketiga, masing-masing dengan kombinasi data latih dan uji yang berbeda. Iterasi pertama menghasilkan akurasi sebesar 92,31% dengan dua kesalahan prediksi pada pasien DM ke-41
dan pasien dyspepsia ke-80, akurasi iterasi kedua sebesar 92,59% dengan 2 kesalahan prediksi yaitu pada pasien DM ke-21 dan pasien dyspepsia ke-67 dan akurasi iterasi ketiga sebesar 85,19% dengan 4 kesalahan prediksi yaitu pada pasien DM ke-14, Pasien dyspepsia ke-51, Pasien dyspepsia ke-52, Pasien dyspepsia ke-57. Hasil selang fitur pada proses pelatihan dan normalisasi akhir pada penelitian ini adalah mirip. Saran Pada penelitian berikutnya diharapkan agar data dapat ditambah sehingga data yang dihasilkan lebih representatif.
DAFTAR PUSTAKA Arjatmo T. 2002. Penatalaksanaan Diabetes Mellitus Terpadu.Cet 2. Jakarta: Balai PenerbitFKUI.http://askep.blogdetik.com/2 008/12/07/diabetes-mellitus/ Demiroz G, Guvenir HA. 1997. Classification by voting feature intervals. http:\\www.cs.ucf.edu/~ecl/papers/miros97 classification.pdf Guvenir. 1998. An Expert system for the differential diagnosis of erythematosquamous diseases. Turki: Department of Computer Engennering, Bilkent University Hamilton H, Gurak E, Findlater L. 2003. ConfusionMatrix.http://www2.cs.uregina.ca /~dbd/cs831/notes/confusion_matrix.html Han J, Kamber M. 2001. Data Mining Concepts & Techniques. USA: Academic Press. Soewignjo S. 2009. Dyspepsia, Rumah Sakit BiomedikaMataram.http://biomedikamatar am.wordpress.com/2009/05/08/102 Supartondo, S waspadji. 1987. Gambaran Klinis Diabetes Mellitus, Ilmu Penyakit Dalam. Jilid 1 Jakarta Fakultas Kedokteran Universitas Indonesia. Talley N, J Vakil Nimish. 2005. Guidelines for the Management of Dyspepsia. http://www.gi.org/physcians/guidelines/dy spepsia.pdf
11
LAMPIRAN
12
Lampiran 1 Normalisasi akhir pada iterasi pertama No Pasien
Normalisasi kelas DM
Normalisasi kelas DYS
35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80.
0,522 0,616 0,518 0,648 0,517 0,597 0,429 0,616 0,51 0,598 0,521 0,599 0,611 0,665 0,578 0,584 0,487 0,465 0,477 0,497 0,397 0,461 0,364 0,435 0,364 0,522
0,478 0,384 0,482 0,352 0,483 0,403 0,571 0,384 0,49 0,402 0,479 0,401 0,389 0,335 0,422 0,416 0,513 0,535 0,523 0,503 0,603 0,539 0,636 0,565 0,636 0,478
Hasil Prediksi Kelas
Kelas Sebenarnya
DM DM DM DM DM DM DYS DM DM DM DM DM DM DM DM DM DYS DYS DYS DYS DYS DYS DYS DYS DYS DM
DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS
Lampiran 2 Nilai vote pada pasien salah prediksi iterasi pertama
Gejala
Iterasi 1 Nilai vote pasien DMNilai vote pasien Dys41 80 Kelas Kelas Kelas Kelas DM
Dys
DM
Dys
Pusing
0.758
0.242
0.758
0.242
Mual
0.370
0.630
0.370
0.630
Muntah
0.624
0.376
0.164
0.836
Lemas
0.595
0.405
0.405
Demam
0.310
0.690
0.595 0.310
Nyeru ulu hati
0.420
0.580
0.420
0.580
Sesak nafas
0.266
0.734
0.686
0.314
Nyeri dada
0.407
0.593
0.407
0.593
Mencret
0.320
0.680
0.721
0.279
Batuk
0.181
0.819
0.805
0.195
Total Normalisasi Akhir
4.251
5.749
5.237
4.763
0.425
0.575
0.524
0.476
0.690
13
Lampiran 3 Normalisasi akhir pada iterasi kedua No pasien 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70.
Normalisasi Kelas DM 0,597 0,543 0,575 0,481 0,593 0,575 0,527 0,536 0,538 0,534 0,599 0,541 0,536 0,597 0,632 0,564 0,576 0,397 0,387 0,402 0,412 0,463 0,414 0,558 0,417 0,387 0,316
Normalisasi Kelas Dys 0,402 0,456 0,424 0,518 0,407 0,424 0,472 0,463 0,461 0,465 0,400 0,458 0,463 0,402 0,367 0,435 0,423 0,602 0,613 0,598 0,587 0,536 0,585 0,441 0,582 0,613 0,683
Hasil Prediksi Kelas DM DM DM DYS DM DM DM DM DM DM DM DM DM DM DM DM DM DYS DYS DYS DYS DYS DYS DM DYS DYS DYS
Kelas Sebenarnya DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS
Lampiran 4 Nilai vote pada pasien salah prediksi iterasi kedua Iterasi 2 Gejala
Nilai vote pasien DM-21
Nilai vote pasien Dys-67
Kelas
Kelas
Kelas
Kelas
DM
Dys
DM
Dys
Pusing
0,653
0.347
0,653
0.347
Mual
0.517
0,483
0.517
0,483
Muntah
0.621
0.379
0.621
0.379
Lemas
0.615
0.385
0.615
0.385
Demam
0.361
0.639
0,697
0,303
Nyeru ulu hati
0.395
0.605
0,622
0,378
Sesak nafas
0.645
0.355
0,248
0,752
Nyeri dada
0.517
0.483
0,517
0.483
Mencret
0.318
0.682
0,318
0.682
Batuk
0.168
0.832
0,772
0,228
Total Normalisasi Akhir
4.811
5.189
5.582
4.418
0.481
0.519
0.558
0.441
14
Lampiran 5 Normalisasi akhir iterasi ketiga No Pasien
Normalisasi Kelas DM
Normalisasi Kelas DYS
Hasil Prediksi Kelas
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60.
0,624 0,613 0,624 0,587 0,589 0,587 0,614 0,593 0,575 0,577 0,624 0,548 0,575 0,394 0,52 0,518 0,537 0,504 0,501 0,431 0,339 0,442 0,444 0,506 0,403 0,405 0,451
0,376 0,387 0,376 0,413 0,411 0,413 0,386 0,407 0,425 0,423 0,376 0,452 0,425 0,606 0,48 0,482 0,463 0,496 0,499 0,569 0,661 0,558 0,556 0,494 0,597 0,595 0,549
DM DM DM DM DM DM DM DM DM DM DM DM DM DYS DM DM DM DM DM DYS DYS DYS DYS DM DYS DYS DYS
Kelas Sebenarnya DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DM DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS
Lampiran 6 Nilai vote pada pasien salah prediksi iterasi ketiga
Gejala
Pusing Mual Muntah Lemas Demam Nyeru ulu hati Sesak nafas Nyeri dada Mencret Batuk Total Normalisasi Akhir
Nilai vote pasien DM14 Kelas Kelas DM Dys 0,653 0.347 0,35 0,650 0,653 0,347 0,099 0,901 0,362 0,638 0,447 0,553 0,288 0,712 0,589 0,411 0,357 0,643 0,139 0,861 3.938 6.062
Iterasi 3 Nilai vote pasien Nilai vote pasien Dys51 Dys52 Kelas Kelas Kelas Kelas DM Dys DM Dys 0,216 0,784 0,347 0,653 0,421 0,421 0,579 0,579 0,347 0,347 0,653 0,653 0,324 0,324 0,676 0,676 0,362 0,638 0,362 0,638 0,447 0,553 0,447 0,553 0,346 0,288 0,712 0,654 0,32 0,68 0,411 0,589 0,357 0,643 0,375 0,625 0,221 0,139 0,861 0,779 5,045 4,955 5.012 4.988
Nilai vote pasien Dys57 Kelas Kelas DM Dys 0,216 0,784 0,421 0,579 0,347 0,653 0,324 0,676 0,268 0,732 0,437 0,563 0,288 0,712 0,411 0,589 0,375 0,625 0,139 0,861 5.060 4.940
0.393
0.504
0.506
0.606
0.495
0.501
0.498
0.494
15
LAMPIRAN 7 Nilai selang hasil pelatihan iterasi pertama Pusing
Mual DM:0,078 Dys:0,922
DM:0,758 Dys:0,242
0
1
Muntah
DM:0,370 Dys:0,630
DM:0,541 Dys:0,459
0
1
Lemas DM:0,164 Dys:0,836
DM:0,624 Dys:0,376
DM:0,227 Dys:0,773
DM:0,595 Dys:0,405
0
1
0
1
DM:0,602 Dys:0,398
DM:0,420 Dys:0,795
0
1
DM:0,531 Dys:0,469
DM:0,407 Dys:0,593
0
1
DM:0,799 Dys:0,201
DM:0,205 Dys:0,795
0
1
DM:0,464 Dys:0,536
DM:0,517 Dys:0,483
0
1
Demam
Nyeri Ulu Hati DM:0,805 Dys:0,195
DM:0,310 Dys:0,690
0
1
Sesak Nafas
Nyeri dada
DM:0,686 Dys:0,314
DM:0,266 Dys:0,734
0
1
Mencret
Batuk DM:0,712 Dys:0,288
DM:0,338 Dys:0,662
0
1
Nilai selang hasil pelatihan iterasi kedua. Pusing
Mual DM:0,216 Dys:0,784
DM:0,653 Dys:0,347
0
1
Muntah
Lemas DM:0,267 Dys:0,733
DM:0,621 Dys:0,379
DM:0,212 Dys:0,788
DM:0,615 Dys:0,385
0
1
0
1
Demam
Nyeri Ulu Hati DM:0,697 Dys:0,303
DM:0,361 Dys:0,639
DM:0,622 Dys:0,378
DM:0,395 Dys:0,605
0
1
0
1
16
Sesak Nafas
Nyeri dada
DM:0,645 Dys:0,355
DM:0,248 Dys:0,752
0
1
Mencret
DM:0,517 Dys:0,483
DM:0,464 Dys:0,536
0
1
DM:0,772 Dys:0,228
DM:0,168 Dys:0,832
0
1
DM:0,350 Dys:0,536
DM:0,579 Dys:0,421
0
1
Batuk DM:0,666 Dys:0,334
DM:0,318 Dys:0,682
0
1
Nilai selang hasil pelatihan iterasi ketiga. Pusing
Mual DM:0,216 Dys:0,784
DM:0,653 Dys:0,347
0
1
Muntah
Lemas DM:0,216 Dys:0,784
DM:0,653 Dys:0,347
DM:0,099 Dys:0,901
DM:0,676 Dys:0,324
0
1
0
1
DM:0,563 Dys:0,437
DM:0,447 Dys:0,553
0
1
DM:0,589 Dys:0,411
DM:0,320 Dys:0,680
0
1
Demam
Nyeri Ulu Hati DM:0,732 Dys:0,268
DM:0,362 Dys:0,638
0
1
Sesak Nafas Nyeri dada DM:0,654 Dys:0,346
DM:0,288 Dys:0,712
0
1
Mencret
Batuk DM:0,625 Dys:0,375
DM:0,357 Dys:0,643
DM:0,779 Dys:0,201
DM:0,139 Dys:0,861
0
1
0
1
17