Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No. 2, Februari 2018, hlm. 543-553
e-ISSN: 2548-964X http://j-ptiik.ub.ac.id
Sistem Pakar Diagnosis Penyakit Mulut menggunakan Metode Bayessian Network Ridho Adi Febrian1, Rekyan Regasari Mardi Putri2, Suprapto3 Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email:
[email protected],
[email protected],
[email protected] Abstrak Penyakit pada mulut (oral ulcer) merupakan kondisi yang terjadi pada sekitar rongga mulut yang dapat disebabkan karena beberapa faktor antara lain jamur, bakteri, virus, anti immune, dan alergi. Permasalahan yang ditemukan adalah gejala dari penyakit mulut antar penyakit pada kategori yang sama memiliki kemiripan yang cukup tinggi sehingga dibutuhkan pengetahuan dan pengalaman pakar untuk mendiagnosis penyakit tersebut. Berdasarkan permasalahan tersebut, peneliti merancang sebuah sistem pakar penyakit mulut yang memiliki pengetahuan pakar untuk mendapatkan diagnosa penyakit mulut beserta tindakan medis yang dibutuhkan oleh pasien. Metode yang digunakan pada basis pengetahuan sistem pakar ini yaitu bayessian network dengan bahasa pemrograman PHP dan menggunakan database mySQL. Berdasarkan hasil pengujian fungsional menggunakan metode uji blackbox didapatkan semua fungsi dapat berjalan dengan baik dan sesuai dengan perancangan. Sedangkan pada pengujian akurasi didapatkan akurasi terbaik sebesar 86,13% melalui 3 kali percobaan dengan variasi yang berbeda menggunakan 23 data uji. Dengan hasil akurasi yang cukup tinggi maka sistem pakar penyakit mulut menggunakan metode bayessian network ini disimpulkan memiliki performa yang baik. Kata Kunci: sistem pakar, penyakit mulut, bayesian network
Abstract Oral ulcer is a condition that occurs around the oral cavity that can be caused by several factors such as fungi, bacteria, viruses, anti immune, and allergies. The problems are symptoms of oral ulcer between diseases in the same category have a high similarity that required knowledge and expert experience to diagnose the disease. Based on these problems, researchers designed a system of oral ulcer experts who have expert knowledge to obtain a diagnosis of oral ulcer along with medical treatment required by the patients. The method used in the knowledge base of this expert system is bayessian network with PHP programming language and using mySQL database. Based on the results of functional testing using blackbox test method obtained all functions can run well and in accordance with the design. While the accuracy test obtained the best accuracy of 86.13% through 3 experiments with different variations using 23 test data. With a fairly high accuracy results then the oral disease expert system using Bayessian network method is concluded to have good performance. Keywords: expert system, oral ulcer, bayessian network
Di Indonesia, pasien penderita penyakit mulut dan gigi tiap tahun mengalami peningkatan. Menurut data statistik yang dirilis oleh kementerian kesehatan RI, pada tahun 2007 jumlah penduduk Indonesia yang menderita masalah pada gigi dan mulut sebanyak 23,2%, kemudian pada tahun 2013 jumlah itu meningkat menjadi 25,9% (Kesehatan, 2013). Dari persentase penderita masalah pada gigi dan mulut yang mendapat perawatan medis pada tahun 2007 sebanyak 29,7% sedangkan pada tahun 2013 sebanyak 31,1%. Sedangkan jumlah
1. PENDAHULUAN Penyakit pada mulut merupakan penyakit yang terjadi pada sekitar rongga mulut yang dapat disebabkan karena jamur, bakteri, virus, anti immune, dan alergi (silverman, 2001). Penyakit pada rongga mulut dapat digolongkan sebagai penyakit yang serius karena dari penyakit ini banyak kondisi medis lain yang dapat lebih kronis seperti kanker.
Fakultas Ilmu Komputer Universitas Brawijaya
543
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
dokter gigi di Indonesia mulai dari dokter gigi hingga spesialis pada tahun 2016 tercatat 62.588 dengan jumlah dokter spesialis gigi hanya 3008 (kki.go.id,2016). Para lulusan sarjana kedokteran gigi baru ini tentu belum memiliki pengalaman menangani pasien dengan kasus penyakit mulut. Ditambah ilmu penyakit mulut ini dapat dikatakan cukup rumit karena banyak kondisi yang hampir sama. Sebagai contoh, untuk diagnosis penyakit pseudomembranous candidiasis memiliki kondisi medis atau gejala yang hampir sama dengan nodular candidiasis. Kedua penyakit ini memiliki kesamaan yang signifikan dikarenakan keduanya termasuk dalam penyakit candididasis. Pada penyakit nodular candidiasis, lidah atau buccal mukosa penderita akan ditemukan lesi putih yang perih dan rasa tidak enak pada mulut serta kondisi mulut yang tidak bersih. Kondisi medis tersebut juga dialami oleh penderita pseudomembranous candidiasis, akan tetapi lesi pada pseudomembranous candidiasis dapat dikerok atau dikelupas. Dari persamaan gejala-gejala ini maka dibutuhkan pengalaman seorang ahli untuk membedakannya. Permasalahan ini dikhawatirkan bagi dokter gigi muda yang kurang berpengalaman akan perbedaan penyakit mulut memberikan diagnosis yang kurang tepat kepada pasien. Diagnosis yang kurang tepat ini dapat berakibat pada kesalahan pemberian treatment kepada pasien. Pemberian treatment yang salah dapat memperburuk kondisi pasien. Dengan adanya permasalahan tersebut maka penulis membuat sebuah aplikasi βSistem Pakar Diagnosis Penyakit Mulut Menggunakan MetodeBayesianONetworkβ.Bayessiananetwork merupakan salah satu metode reasoning under uncertainty yang menggambarkan struktur sebuah pengetahuan dengan semua kemungkinan dan nilai probabilitas antar nodenode sehingga ketidakpastian pada sistem dapat dihindari(Ben-Gal, 2007). BayesianONetwork juga dapat digunakan untuk menghitung kehadiran berbagai gejala yang nantinya dapat memudahkan diagnosis penyakit mengingat adanya ketidakpastian gejala terhadap penyakit. BayesianONetwork juga memiliki akurasi yang cukup bagus dan juga dapat mengurangi kompleksitas jika dibandingkan dengan Naive Bayes. Sistem pakar diharapkan mampu mencari solusi sebagaimana yang dilakukan oleh seorang pakar, seperti memberikan diagnosis dan saran pengobatan penderita. Fakultas Ilmu Komputer, Universitas Brawijaya
544
2. DASAR TEORI 2.1. KAJIAN PUSTAKA Berdasar topik penelitian skripsi yang dibahas, penulis akan menjelaskan beberapa penelitian-penelitian terdahulu yang relevan dengan topik penelitian. Uraian dari penelitianpenelitian tersebut dapat dilihat pada Tabel 1. Tabel 1. Kajian Pustaka
Judul an expert system for diagnosis and manageme nt oral ulcer ENTDEx: ENT Diganosis Expert System Using Bayesian Networks
Perancang an dan Implement asi Sistem Pakar Pendukung Diagnosa Penyakit Anjing Dengan Metode Bayesian Network A Bayesian Network Decision Model for Supporting the Diagnosis of Dementia, Alzheimerβ s disease and Mild Cognitive
Objek Masukan dan Parameter Gejala penyakit mulut yang ditemukan pada pasien
Metode
Keluaran
Proses
Hasil Penelitian
Forward chaining
Diagnosis penyakit mulut yang sesuai
Gejalagejala yang dirasaan oleh pasien atau pengguna mengenai telinga, hidung maupun tenggoroka nnya Gejalagejala yang terjadi pada anjing
Bayesian Network
Hasil diagnosis sistem yang mengelomp okkan pasien ke dalam 3 kelas jenis penyakit yaitu telinga, hidung dan tenggorokan Diagnosis penyakit anjing yang dikelompok kan menjadi 19 jenis penyakit anjing
Dataset berupa Kasus klinis pasien dari Univ Kedoktera n Duke. Atribut terdiri dari faktor predisposis i, hasil tes neuropsiko logis, data
Bayesian Network
Bayesian Network
Diagnosis dari 3 jenis penyakit yaitu Demensia, Alzheimer dan Mild Cognitive Impairment (Penurunan Kognitif Ringan)
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Impairmen t
demografi.
545
kasus yang disajikan dalam sebuah graf pada Gambar 2.
2.2. SISTEM PAKAR Sistem pakar atau expert systems merupakan bagian dari AI (Artificial Intelligence) yang mengeksplorasi bagaimana sebuah komputer dapat memiliki keahlian seperti seorang ahli dibidangnya (Moursund, 2006). Keahlian yang dimaksud adalah kemampuan seorang pakar dibidangnya dalam mengambil sebuah kesimpulan pada suatu kasus dengan pengetahuan dan pengalaman yang dimiliki.Struktur dari sistem pakar dapat dilihat pada Gambar 1.
Gambar 2. Contoh kasus
Berdasar graf pada Gambar 2 di atas, dengan Bayesian Network maka permasalahanpermasalahan berikut akan diselesaikan: π(π|π) = π(π)
Lingkungan Konsultasi
Lingkungan Pengembangan
User Fakta spesifik terkait kasus
π(π |π, π) = π(π )
Knowledge base Β· Fakta Β· Aturan
π(π|π, π, π ) = π(π|π)
Antarmuka pengguna Fasilitas penjelasan
Knowledge engineer Akuisisi pengetahuan Pengetahuan pakar
Mesin inferensi Aksi yang direkomendasikan
Blackboard (workplace)
Perbaikan pengetahuan
Gambar 1. Struktur Sistem Pakar
2.3. BAYESIAN NETWORK Bayessian network (BN) atau yang bisa juga disebut jaring kepercayaan merupakan bagian dari probabilitas graphical model. Struktur atau jaringan dari metode ini digunakan untuk menggambarkan relasi antar node (pengetahuan) untuk menghilangkan ketidakpastian pada domain tersebut (Ruggeri, 2007). Node yang dimaksud disini adalah variabel-variabel yang akan digunakan sebagai pengetahuan pada sistem. Bayessian network merupakan penggabungan dari teory grafik/network, probabilitas (teorema bayes), ilmu komputer, dan statistik. Pada Bayessian Network, setiap node merepresentasikan variabel acak yang diamati, variabel laten, parameter yang tidak diketahui ataupun hipotesis. Edge merepresentasikan ketergantungan bersyarat antar node, sedangkan node yang saling tidak terhubung menyatakan variabel bebas bersyarat. Untuk mengilustrasikan proses dari Bayesian Network, maka akan diberikan contoh Fakultas Ilmu Komputer, Universitas Brawijaya
π(π|π, π, π , π) = π(π|π, π, π )
(1)
Pada persamaan 1 di atas dapat dilihat, Bayesian Network akan menyelesaikan permasalahan berdasar struktur graf yang terbentuk. Misalkan pada persamaan 1 yang pertama yaitu P(a|f) ditanyakan peluang terjadinya βaβ dengan diberikannya kejadian βfβ. Karena βaβ dan βfβ tidak memiliki ketergantungan satu sama lain, persamaan bisa disederhanakan menjadi P(a) dan begitu juga dengan persaman-persamaan berikutnya. Berdasar contoh kasus pada Gambar 2 maka probabilitas f jika diberikan semua variabel yang ada dapat dihitung dengan: π(π|π, π , π, π) =
π(π,π,π ,π,π) π(π,π ,π,π)
=β
π(π,π,π ,π,π)
πβ² π(πβ²,π,π ,π,π)
(2)
Dimana: P(f|a,s,g,j) = Probabilitas kejadian f diberikan oleh kejadian a,s,g,j P(f,a,s,g,j) = Joint distribution kejadian f,a,s,g,j P(a,s,g,j) = Joint distribution kejadian a,s,g,j (Marginal probability) Persamaan 2 jika diselesaikan menggunakan persamaan 1 maka akan menjadi π(π|π, π , π, π) =
π(π)π(π)π(π )π(π|π)π(π|π, π, π ) βπβ² π(π β² )π(π)π(π )π(π|π β² )π(π|π β² , π, π ) =
π(π)π(π |π )π(π|π, π, π ) βπβ² π(πβ² )π(π|π β² )π(π|π β² , π, π )
(3)
Dimana P(f|a,s,g,j) = Probabilitas kejadian f diberikan oleh kejadian a,s,g,j P(f) = Peluang terjadinya variabel f
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
P(g|f) P(j|f,a,s)
= Peluang terjadinya variabel g diberikan variabel f = Peluang terjadinya variabel f diberikan variabel f,a, dan s
Pada persamaan 3, P(f) disebut juga sebagai prior probability, P(g|f) dan P(j|f,a,s) disebut sebagai conditional probability, sedangkan pembagi pada rumus Bayesian Network disebut juga Marginal Probability yang fungsinya sebagai normalizing constant. 2.4. F-measure Metode f-measure atau juga merupakan metode yang mengkombinasikan precision dan recall yang diterapkan dalam deret harmonik (Liu, 2007). Precision dan recall merupakan variabel yang sesuai digunakan dalam kasus information retrieval karena precision dan recall mengukur seberapa lengkap dan seberapa tepat klasifikasi tersebut dalam nilai yang positip. Menurut Liu,2007, kondisi dari precision, dan recall dibagi menjadi 4 yang dapat dilihat pada Tabel 2. Tabel 2. Pembagian kondisi f-measure
Actual positive
Actual negative
Classified positive Jumlah solusi benar dari solusi yang sebenarnya (true positive) Jumlah dari solusi benar namun tidak sesuai dengan solusi sebenarnya (false positive)
Classified negative Jumlah solusi salah dari solusi yang sebenarnya (false negative) Jumlah dari solusi yang tidak ditemukan dan tidak sesuai dengan solusi sebenarnya (true negative)
Berdasarkan Tabel 2, maka dapat dirumuskan persamaan untuk precision, recall, dan f-measure yang dapat dilihat pada persamaan berikut. ππππππ πππ = ππππππ =
πππ’π πππ ππ‘ππ£π (ππ) πππ’π πππ ππ‘ππ£π (ππ)+πΉπππ π πππ ππ‘ππ£π (πΉπ) πππ’π πππ ππ‘ππ£π (ππ)
(4)
πππ’π πππ ππ‘ππ£π (ππ)+πΉπππ π πππππ‘ππ£π (πΉπ) ππππππ πππ Γππππππ
π β ππππ π’ππ = 2Γ
ππππππ πππ+ππππππ
(5)
(6)
2.5. Penyakit Mulut Penyakit pada mulut (oral ulcer) merupakan penyakit yang terjadi pada sekitar rongga mulut yang dapat disebabkan karena jamur, bakteri, virus, anti immune, dan alergi (silverman, 2001). Penyakit mulut dibagi menjadi 2 kategori besar yaitu lesi berwarna putih dan lesi non-putih. Dalam penelitian kali Fakultas Ilmu Komputer, Universitas Brawijaya
546
ini kategori yang diangkat adalah lesi putih atau white lessions. Berikut adalah contoh penyakit pada kategori white lessions: 1. Lichen Planus 2. Lichenoid Reaction 3. Nicotinic Stomatitis 4. Candidiasis 5. Geographic Tongue 6. White Sponge Nevus 7. Focal (frictional) Keratosis 8. Fordyce Granule 9. Mucosal Burns Contoh dari penyakit mulut diatas juga digunakan sebagai kelas pada sistem. Penyakit tersebut merupakan penyakit yang sering muncul di Indonesia. 3. PERANCANGAN 3.1 Basis Pengetahuan Basis pengetahuan merupakan sebuah basis/tempat dimana semua pengetahuan dari sistem berbasis pengetahuan yang berasal dari pakar disimpan. Didalam basis pengetahuan terdapat dua hal yaitu fakta atau apa yang diketahui sistem terkait domain tertentu dan aturan atau representasi logika yang dapat berupa logical references. Basis pengetahuan sendiri dibagi menjadi dua yaitu rule based dan case base. Pada peneltian ini digunakan metode case base reasoning sebagai metode penalaran pada basis pengetahuan. Secara singkat case base reasoning merupakan metode penalaran berdasarkan kasus-kasus yang disimpan atau dimiliki basis pengetahuan untuk membuat kesimpulan. Sedangkan rule based reasoning merupakan metode penalaran yang mengambil keputusan berdasarkan aturan yang disimpan pada sistem. Struktur dari bayessian network didapatkan melalui konsultasi dengan pakar dan pengambilan pengetahuan melalui daftar pustaka dan referensi-referensi yang terkait dengan penyakit mulut. Struktur dari bayessian network ini digambarkan dengan tujuan untuk mengetahui hubungan antara penyakit dan gejala yang terkait, sehingga terbentuk aturan yang dapat menghindari ketidak pastian pada sistem. Struktur dari bayesisan network sistem pakar penyakit mulut dapat dilihat pada Gambar 3.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer G01
G10
G15
G20
G25
G26
G02
G06
G11
G16
G21
G03
G07
G12
G17
G22
G04
G08
G13
G18
G23
G05
G09
G14
G19
G24
547 Mulai
Data training penyakit mulut
P01
P02
P09
Buat struktur bayessian network
P08
P03
Hitung prior probability
P07 P04
P05
P06
Gambar 3. Struktur Graf BN penyakit mulut
Hitung conditional proability table
3.2. Mesin Inferensi
Hitung posterior probability
Dalam perancangan sistem pakar penyakit mulut dengan bayessian network ini menggunakan pendekatan mesin inferensi backward chaining. Metode penalaran backward chaining atau metode penalaran kebelakang merupakan pola penalaran pada mesin inferensi yang dimulai dengan membuat hipotesis untuk kemudian ditarik pada faktafakta yang sesuai pada kasus ini adalah gejalagejala. Pada Gambar 4 akan dijelaskan diagram blok dari mesin inferensi yang akan diterapkan pada sistem pakar penyakit mulut. INFERENSI BACKWARD CHAINING BAYESSIAN NETWORK Fakta
Aturan
Data masukan pengguna
Hipotesa penyakit
Diagnosa
Kesimpulan Perhitungan bayessian network
Pencarian probabilitas tertinggi
Gambar 4. Diagram Blok Inferensi bacward Chaning dengan metode Bayesian Network
Selanjutnya dari gejala-gejala yang ada akan dilakukan proses perhitungan probabilitas menggunakan metode Bayesian Network. Alur algoritma dari Bayesian Network dapat dilihat pada Gambar 5.
Selesai
Gambar 5. Flowchart Bayessian Network
3.3. Blackboard Blackboard adalah sebuah bagian dari memori yang berfungsi sebagai basis data untuk menyimpan hasil sementara dari suatu keputusan sebelum mengambil keputusan. Pada sistem pakar yang menggunakan metode Bayesian Network ini nantinya akan dihasilkan perhitungan sementara yang meliputi prior probabilty, conditional probability dan posterior probability. Ketiga nilai tersebut merupakan hasil perhitungan sementara yang akan disimpan dulu ke dalam sebuah Blackboard. 3.4. Fasilitas Penjelas Fasilitas penjelas memberikan keterangan hasil perhitungan dari Bayesian Network, sehingga pengguna mengerti bagaimana sistem pakar menghasilkan kesimpulan. Fasilitas penjelas pada sistem pakar ini akan menampilkan bagaimana sistem dapat mencapai kesimpulan tertentu dengan menampilkan tabel hasil nilai Prior probability, Conditional probability dan Posterior probability 3.5. Perbaikan Pengetahuan Perbaikan pengetahuan pada sistem pakar ini akan melakukan pembaharuan jika terdapat pengetahuan baru yang belum ada di database. Pembaharuan pengetahuan dilakukan dengan memeriksa data latih, jika ada pengetahuan baru pada data training maka sistem akan menambahkan pengetahuan dalam basis pengetahuan
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
3.6. Antarmuka Antarmuka merupakan penghubung antara sistem pakar dengan pemakai. Dengan antarmuka, pengguna dapat melakukan komunikasi dengan sistem pakar. Pada umumnya sistem pakar melakukan pendekatan berupa form tanya jawab dengan pengguna. Form tanya jawab tersebut berupa form konsutasi yang dapat dilihat pada Gambar 6.
Gambar 6. Antarmuka Konsultasi
4. PENGUJIAN DAN ANALISIS 4.1. Pengujian Validasi Pengujian blackbox merupakan teknik pengujian validasi yang digunakan untuk mengetahui apakah sistem yang dibangun sudah benar sesuai dengan yang dibutuhkan baik untuk kebutuhan fungsional. Hasil pengujian validasi dengan menggunakan blackbox menunjukkan hasil akurat dengan nilai 100% karena semua fungsi pada sistem telah berjalan sesuai dengan perancangan. 4.2. Pengujian Akurasi Data Latih Pengujian akurasi data training ini menggunakan metode K fold cross validation dan metode f-measure sebagai alat ukur. Jumlah K yang digunakan sebanyak 6 dengan total data training sebanyak 78, sehingga 1 K memiliki 13 data training. Pengujian dilakukan sebanyak dua kali percobaan. Berikut adalah tabel pembagian data untuk pengujian menggunakan K-fold percobaan ke 1 dan percobaan ke 2. Tabel 3. Pengujian akurasi data latih percobaan 1 Fold 1
Fold 2
Fold 3 Fold 4 Hasil
Fold 5
Fold 6
pakar
sistem
pakar
sistem
pakar
sistem
pakar
sistem
pakar
sistem
pakar
sistem
P 0 1
P 0 2
P 0 1
P 0 2
P 0 1
P 0 1
P 0 1
P 0 1
P 0 1
P 0 2
P 0 1
P 0 2
Fakultas Ilmu Komputer, Universitas Brawijaya
P 0 1 P 0 2 P 0 3 P 0 3 P 0 3 P 0 4 P 0 5 P 0 6 P 0 7 P 0 8 P 0 9 P 0 3
548 P 0 2 P 0 2 P 0 3 P 0 3 P 0 3 P 0 4 P 0 2 P 0 8 P 0 7 P 0 8 P 0 9 P 0 2
P 0 1 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 6 P 0 7 P 0 8 P 0 9 P 0 4
P 0 1 P 0 2 P 0 3 P 0 3 P 0 5 P 0 4 P 0 5 P 0 8 P 0 7 P 0 8 P 0 9 P 0 7
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 6 P 0 7 P 0 8 P 0 9 P 0 5
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 8 P 0 2 P 0 8 P 0 8 P 0 2 P 0 4 P 0 9
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 6 P 0 7 P 0 8 P 0 9 P 0 8
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 6 P 0 7 P 0 8 P 0 9 P 0 2
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 7 P 0 8 P 0 8 P 0 1 P 0 9
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 7 P 0 5 P 0 7 P 0 8 P 0 8 P 0 6 P 0 4
P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 7 P 0 8 P 0 9 P 0 2 P 0 7
P 0 2 P 0 2 P 0 3 P 0 3 P 0 1 P 0 5 P 0 5 P 0 8 P 0 8 P 0 4 P 0 6 P 0 8
Berdasarkan tabel 3 diatas maka dapat dihitung akurasi dari sistem menggunakan metode f-measure untuk tiap fold. Tabel 4 berikut akan menampilkan contoh perhitungan akurasi pada percobaan pertama menggunakan fmeasure. Tabel 4. Contoh perhitungan akurasi Kod e
T P
F P
F N
P01
1
0
0
P02
2
1
0
P03
2
0
0
P04
2
0
0
P05
1
0
0
P06
1
0
0
P07
1
0
0
T N 1 2 1 0 1 1 1 1 1 2 1 2 1 2
Precisi on
Reca ll
FMeasur e
1
1
1
0,667
1
0,8
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
P08
1
0
1
P09
1
0
0
1 1 1 2
Rata-rata
1
0,5
0,667
1
1
1
0,96
0,95
0,9407
Tabel 5. Hasil akurasi pengujian data latih percobaan 1 Fold 1 2 3 4 5 6
Akurasi percobaan 1 53,96 % 64,81 % 35,19 % 94,07 % 62,08 % 35,42 %
Berdasarkan Tabel 5 diatas maka didapatkan rata-rata akurasi dari percobaan 1 sebesar 57,59%. Akurasi tertinggi didapatkan pada fold ke 4 dengan nilai akurasi 94,07%. Selanjutnya dilakukan percobaan ke 2 dengan jumlah fold yang sama yaitu 6 fold , jumlah data sebanyak 23, dan variasi data yang berbeda dengan percobaan pertama. Tabel 6 berikut akan menggambarkan pembagian data tiap fold dari percobaan kedua. Tabel 6. Pengujian akurasi data latih percobaan 2 Fold 1
Fold 2
Fold 3 Fold 4 Hasil
Fold 5
Fold 6
pakar
sistem
pakar
sistem
pakar
sistem
pakar
sistem
pakar
sistem
pakar
sistem
P 0 5 P 0 1 P 0 1 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 6
P 0 5 P 0 2 P 0 2 P 0 2 P 0 3 P 0 3 P 0 5 P 0 4 P 0 8
P 0 1 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 6
P 0 2 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 8 P 0 5 P 0 8
P 0 1 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 7
P 0 2 P 0 2 P 0 2 P 0 3 P 0 3 P 0 1 P 0 7 P 0 5 P 0 7
P 0 1 P 0 1 P 0 2 P 0 3 P 0 3 P 0 3 P 0 4 P 0 5 P 0 6
P 0 2 P 0 2 P 0 2 P 0 3 P 0 3 P 0 3 P 0 4 P 0 5 P 0 8
P 0 1 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 6
P 0 1 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 7 P 0 2 P 0 7
P 0 1 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 4 P 0 5 P 0 7
P 0 2 P 0 2 P 0 2 P 0 3 P 0 3 P 0 4 P 0 5 P 0 2 P 0 7
Fakultas Ilmu Komputer, Universitas Brawijaya
P 0 7 P 0 8 P 0 9 P 0 3
549 P 0 7 P 0 8 P 0 9 P 0 8
P 0 7 P 0 8 P 0 9 P 0 5
P 0 8 P 0 2 P 0 4 P 0 9
P 0 8 P 0 8 P 0 2 P 0 9
P 0 8 P 0 8 P 0 6 P 0 4
P 0 7 P 0 8 P 0 9 P 0 4
P 0 7 P 0 8 P 0 9 P 0 7
P 0 7 P 0 8 P 0 9 P 0 8
P 0 8 P 0 8 P 0 9 P 0 2
P 0 8 P 0 9 P 0 1 P 0 7
P 0 8 P 0 9 P 0 6 P 0 2
Berdasarkan tabel 6 diatas maka dapat dihitung akurasi dari sistem menggunakan metode f-measure untuk tiap fold. Tabel 7 berikut akan menampilkan hasil perhitungan akurasi pada percobaan kedua. Tabel 7. Akurasi Pengujian Variasi 20 Data Latih Fold 1 2 3 4 5 6
Akurasi percobaan 2 57,04 % 31,48 % 48,15 % 61,11 % 54,7 % 54,5 %
Berdasarkan tabel 7 diatas maka didapatkan rata-rata akurasi dari percobaan 1 sebesar 51,16%. Maka untuk rata-rata akurasi sistem berdasarkan 2 percobaan yang dilakukan sebesar 54,38%. 4.3. Analisis Pengujian Variasi Data Latih Berdasar hasil pengujian data latih di atas, ditemukan bahwa akurasi terbesar dengan nilai 94,07 % merupakan akurasi pada K ke 4 pada percobaan ke 1 dan rata-rata akurasi sebesar 54,38 %. Nilai akurasi pada tiap K berbeda-beda sehingga dapat disimpulkan variasi data latih sangat berpengaruh pada tingkat akurasi sistem. Selain variasi data latih, kemiripan gejala antar penyakit dapat menyebabkan kesalahan diagnosis. 4.4. Pengujian Akurasi Variasi Data Uji Pengujian akurasi data uji dilakukan dengan tujuan untuk mengetahui dampak dari variasi data uji pada akurasi sistem. Pengujian variasi data uji ini menggunakan data uji sebanyak 23 data dengan variasi data yang berbeda dan 3 kali percobaan. Data uji ini hanya berisikan gejalagejala tanpa hasil diagnosis. Pengujian ini menggunakan f-measure sebagai metode untuk mendapatkan akurasi. Tabel 6 berikut akan menampilkan data uji yang digunakan.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Tabel 6. Pengujian Akurasi Variasi Data Uji N o 1. 2. 3. 4. 5. 6. 7. 8. 9. 10 . 11 . 12 . 13 . 14 . 15 . 16 . 17 . 18 . 19 . 20 . 21 . 22 . 23 .
Ekseperimen ke1 2 Paka Siste Paka Siste r m r m P02 P02 P06 P06 P04 P05 P02 P02 P02 P02 P02 P02 P03 P03 P07 P07 P09 P09 P03 P03 P01 P01 P06 P06 P03 P03 P01 P01 P08 P08 P03 P03 P02 P02 P02 P03
Paka r P04 P03 P02 P04 P03 P01 P08 P02 P09
Siste m P04 P03 P02 P04 P03 P01 P08 P02 P09
P01
P01
P04
P04
P04
P04
P04
P08
P08
P03
P03
P01
P08
P08
P02
3
550
P05
2
1
0
P06
1
0
0
P07
1
0
0
P08
2
0
0
P09
1
0
0
2 0 2 2 2 2 2 1 2 2
Rata-rata
0,6667
1
0,8
1
1
1
1
1
1
1
1
1
1
1
1
0,9444
0,95
0,93946
Tabel 8. Pengujian Akurasi Variasi Data Uji
P04
Kod e
T P
F P
F N
P04
P04
P01
3
0
1
P02
P07
P07
P02
2
1
1
P04
P09
P02
P03
P03
3
1
0
P03
P05
P05
P01
P01
P04
3
0
2
P05
P05
P09
P09
P06
P06
P05
1
1
0
P03
P03
P03
P03
P04
P04
P06
2
0
0
P04
P04
P04
P04
P05
P05
P07
2
0
0
P06
P06
P04
P04
P01
P02
P08
2
0
0
P05
P05
P01
P01
P04
P05
P09
1
1
0
P04
P04
P08
P08
P05
P05
P07
P07
P07
P07
P09
P04
T N 1 9 1 9 1 9 1 8 2 1 2 1 2 1 2 1 2 1
Rata-rata
Precisi on
Reca ll
FMeasur e
1
0,75
0,85714
0,6667
0,67
0,66667
0,75
1
0,85714
1
0,6
0,75
0,5
1
0,66667
1
1
1
1
1
1
1
1
1
0,5
1
0,66667
0,8241
0,89
0,82937
Tabel 9. Pengujian Akurasi Variasi Data Uji P02
P02
P04
P05
P04
P09
Kod e
P03
P03
P01
P01
P07
P07
P01
2
0
1
Berdasar Tabel 6 diatas maka dapat dilakukan perhitungan f-measure untuk mendapatkan akurasi dari sistem. Berikut adalah hasil perhitungan f-measure.
P02
2
1
1
P03
2
1
0
P04
5
1
2
Tabel 7. Pengujian Akurasi Variasi Data Uji
P05
2
1
0
P06
1
0
0
P07
2
0
0
P08
1
0
0
P09
1
1
1
Kod e
T P
F P
F N
P01
2
0
0
P02
4
0
1
P03
5
1
0
P04
3
0
1
T N 2 1 1 8 1 7 1 9
Precisi on
Reca ll
FMeasur e
1
1
1
1
0,8
0,88889
0,8333
1
0,90909
T P
F P
F N
Rata-rata 1
0,75
0,85714
Fakultas Ilmu Komputer, Universitas Brawijaya
T N 2 0 1 9 2 0 1 5 2 0 2 2 2 1 2 2 2 0
Precisi on
Recall
FMeas ure
1
0,667
0,8
0,6667
0,667
0,666 7
0,6667
1
0,8
0,8333
0,714
0,769 2
0,6667
1
0,8
1
1
1
1
1
1
1
1
1
0,5
0,5
0,5
0,8148
0,84
0,815
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
551
Berdasarkan hasil perhitungan f-measure dari 3 kali percobaan dengan variasi data yang berbeda didapatkan nilai akurasi tertinggi adalah 0,9619 atau 93,94% dengan rata-rata 86,13%.
15.
P05
P05
P09
P09
P06
P06
16.
P03
P03
P03
P03
P04
P04
17.
P04
P04
P04
P04
P05
P05
18.
P06
P06
P04
P04
P01
P02
4.5. Analisis Pengujian Variasi Data Latih
19.
P05
P05
P01
P01
P04
P05
Berdasar hasil pengujian variasi data uji di atas, ditemukan bahwa akurasi terbesar bernilai 93,94% merupakan akurasi pada percobaan ke 1 dengan rata-rata hasil percobaan sebesar 86,13. Hasil perhitungan akurasi dari ke-3 percobaan diatas berbeda-beda. Hal ini menggambarkan bahwa variasi dari dari data uji mempengaruhi akurasi dari sistem.
20.
P04
P04
P08
P08
P05
P05
21.
P07
P07
P07
P07
P09
P04
22.
P02
P02
P04
P05
P04
P09
23.
P03
P03
P01
P01
P07
P07
4.6. Pengujian Akurasi Variasi Data Uji Tambahan Pengujian akurasi data uji tambahan dilakukan dengan menggunakan data uji sebanyak 23 data dengan variasi data yang berbeda sebanyak 3 kali percobaan. Data uji ini hanya berisikan gejala-gejala tanpa hasil diagnosis. Data uji ini memiliki hasil diagnosis yang didapatkan melalui konsultasi dengan pakar. Metode yang digunakan pada pengujian ini adalah f-measure. Pada pengujian ini digunakan probabilitas 0,01 pada sistem untuk gejala dengan kemunculan yang jarang. Hasil pengujian tambahan dapat dilihat pada Tabel 10. Tabel 10. Pengujian Akurasi Variasi Data Uji Tambahan Ekseperimen ke1
No
2
3
1.
Paka r P02
Siste m P02
Paka r P06
Siste m P06
Paka r P04
Siste m P04
2.
P04
P05
P02
P02
P03
P03
3.
P02
P02
P02
P02
P02
P02
4.
P03
P03
P07
P07
P04
P04
5.
P09
P09
P03
P03
P03
6.
P01
P01
P06
P06
7.
P03
P03
P01
8.
P08
P08
9.
P02
10.
Berdasar hasil pengujian pada tabel 10, maka akurasi dari sistem dapat diukur menggunakan metode f-measure. Hasil pengujian akurasi variasi data uji dilihat pada tabel berikut. Tabel 11. Akurasi Pengujian percobaan 1 Kod e
T P
F P
F N
P01
2
0
1
P02
3
1
0
P03
4
0
0
P04
5
0
0
P05
3
0
0
P06
1
0
0
P07
2
0
0
P08
1
0
0
P09
1
0
0
3 1 3 0 3 0 2 9 3 1 3 3 3 2 3 3 3 3
Rata-rata
Precisi on
Recall
FMeas ure
1
0,666 7
0,8
0,75
1
0,857 143
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0,972
0,963
0,962
Tabel 12. Akurasi Pengujian percobaan 2
P03
Kod e
T P
F P
F N
P01
P01
P01
1
0
1
P01
P08
P08
P03
P03
P02
P02
P02
3
1
1
P02
P02
P03
P09
P09
P03
4
1
0
P01
P01
P04
P04
P04
P04
11.
P04
P04
P08
P08
P04
P04
P04
5
1
0
12.
P03
P03
P01
P02
P07
P07
P05
1
0
0
13.
P08
P08
P04
P09
P02
P03
14.
P02
P03
P05
P05
P01
P01
P06
1
0
0
P07
2
0
0
Fakultas Ilmu Komputer, Universitas Brawijaya
T N
T N 3 2 2 9 2 9 2 8 3 3 3 3 3
Precisi on
Reca ll
FMeasur e
1
0,5
0,66667
0,75
0,75
0,75
0,8
1
0,88889
0,8333
1
0,90909
1
1
1
1
1
1
1
1
1
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
P08
2
0
0
P09
1
0
1
2 3 2 3 2
Rata-rata
1
1
1
1
0,5
0,66667
0,9315
0,86
0,8757
Tabel 13. Akurasi Pengujian percobaan 3 Kod e
T P
F P
F N
P01
1
0
1
P02
2
1
1
P03
5
1
0
P04
5
0
0
P05
2
0
0
P06
1
0
0
P07
3
0
0
P08
1
0
0
P09
1
0
0
T N 3 2 3 0 2 8 2 9 3 2 3 3 3 1 3 3 3 3
Rata-rata
Precisi on
Reca ll
FMeasur e
1
0,5
0,66667
0,6667
0,66 7
0,66667
0,8333
1
0,90909
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0,9444
0,91
0,91583
4.7. Analisis Pengujian Variasi Data Uji Tambahan Berdasar hasil pengujian variasi data uji di atas, ditemukan bahwa akurasi rata-rata dari 3 kali percobaan adalah 91,78%. Dibandingkan dengan hasil uji pada pengujian data uji menggunakan semua data latih pada sub bab 6.2, hasil pengujian menggunakan probabilitas 0,01 lebih besar 5,65%. Maka dapat disimpulkan bahwa dengan probabilitas 0,01 untuk gejala dengan kemunculan jarang meningkatkan akurasi dari sistem. 5. KESIMPULAN Kesimpulan yang didapat dari penelitian yang telah dilakukan adalah: 1. Basis pengetahuan yang dibangun pada sistem pakar penyakit mulut ini digambarkan menggunakan graph bayessian network untuk memperjelas hubungan antar gejala dan penyakit. Berdasarkan basis pengetahuan yang dibentuk, selanjutnya mesin inferensi akan mengolah data training dan masukan pengguna untuk mendapatkan nilai prior Fakultas Ilmu Komputer, Universitas Brawijaya
2.
3.
552 probability, conditional probability, dan nilai posterior yang digunakan sebagai kesimpulan. Hanya nilai posterior tertinggi yang akan digunakan sebagai hasil diagnosis sistem. Untuk menguji sistem pakar diagnosis penyakit mulut menggunakan metode bayessian network ini dilakukan uji validasi, dengan hasil semua fungsi telah sukses dibangun. Struktur graph bayessian network dibangun berdasarkan hasil akuisisi pengetahuan yang didapatkan melalui wawancara dengan pakar dan studi literatur. Dengan dibentuknya graph bayessian network ini maka hubungan atau aturan antara gejala dan penyakit dari sistem pakar dapat dibangun. Pembangunan aturan pada sistem ini akan semakin baik dengan ditambahkannya fungsi perbaikan pengetahuan. Nilai akurasi yang didapatkan melalui proses pengujian akurasi pada sub bab sebelumnya dengan melakukan pengujian data uji sebanyak 3 kali dengan variasi yang berbeda menghasilkan rata-rata akurasi sebesar 86,13%. Untuk hasil akurasi pengujian tambahan dengan mengganti probabilitas CPT untuk gejala dengan kemunculan jarang menjadi 0,01 didapatkan nilai rata-rata akurasi sistem sebesar 91,78%. Dengan nilai akurasi sebesar 86,13% maka sistem dikatakan mampu bekerja dengan cukup baik.
DAFTAR PUSTAKA Ben-Gal dan F, Ruggeri. 2007. Bayessian Network. Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons Feller, William. 1968. An Introduction to Probability Theory and its Application (Volume 1). John Wiley & Son. ISBN 0471-25708-7. Giarattano, Joseph.2001. Expert Systems Principles and Programming (third edition). China Machine Press. China Harijanti, Kus. 2015. Kuliah ilmu penyakit mulut 1. Universitas Airlangga. Surabaya:Indonesia Heckerman, David. 1996. A Tutorial On Learning With Bayessian Network. Microsoft research. Microsoft Corporation
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Hening. 2015. Kelainan praganas pada rongga mulut. Universitas Airlangga. Surabaya:Indonesia Kendal, S.L. dan Creen. M. 2007. An Introduction to Knowledge Engineering. Springer-verlag. London:United Kingdom Kesehatan RI, Kementerian. 2013. Situasi kesehatan gigi dan mulut. http://www.depkes.go.id/download.php?f ile=download/pusdatin/infodatin/infodati n-gilut.pdf. Jakarta (diakses 4 september 2016) Konsil Kedokteran Indonesia. 2016. jumlah dan penyebaran dokter di Indonesia. http://www.kki.go.id/. Jakarta:Indonesia (diakses 29 September 2016) Laskaris, George. 2006. Pocket Atlas for Oral Disease. University of athens. Thieme:Athena. Liu, Bing. 2007. Web data mining. University of Illinois. Springer-Verlag Berlin Heidelberg. ISBN-10 3-540-37881-2 Lucas, Peter J.F. dan V.D. Gaag, Linda. 1991. Principles of expert system. Centre for mathematic and computer science. Amsterdam:Belanda Moursund, David. 2006. Brief Introduction to Educational Implications of Artificial Intelligence. University of oregon:United State Pearl, Judea dan Russel, Stuart. 2000. Bayessian Network. University of California:United State Regezi A. Joseph dan Sciubba J. James. 2008. Regezi: Oral Pathology: Clinical Pathological Correlation 5th edition. Saunders, l imprint Silverman, Sol. 2001. Essentials of oral medicine. BC Decker Inc. London:United Kingdom Subakti, Irfan. 2006. Sistem Berbasis Pengetahuan. Jurusan teknik informatika, Institut Teknologi Sepuluh Nopember. Surabaya:Indonesia Todd, Bryan. 1992. An Introduction to Expert System. Oxford University:Inggris
Fakultas Ilmu Komputer, Universitas Brawijaya
553