BAB I PENDAHULUAN 1.1 Latar Belakang Sistem pakar adalah suatu cabang kecerdasan buatan yang menggunakan pengetahuan-pengetahuan khusus yang dimiliki oleh seorang ahli untuk menyelesaikan suatu masalah tertentu. Salah satu penalaran dalam sistem pakar adalah penalaran berbasis kasus atau lebih dikenal dengan Case-Based Reasoning (CBR). CBR telah menjadi teknik yang sukses untuk sistem berbasis pengetahuan dalam banyak domain. Dimana CBR menggunakan pengalaman sebelumnya dalam kasus yang mirip untuk memahami dan memecahkan permasalahan baru. CBR mengumpulkan kasus sebelumnya yang hampir sama dengan masalah yang baru dan berusaha untuk memodifikasi solusi agar sesuai dengan kasus yang baru (Aamodt dan Plaza,1994). Untuk menemukan solusi dari sebuah kasus baru yang diberikan, sistem akan mencari kasus-kasus dalam basis kasus yang memiliki tingkat kesamaan yang paling tinggi. Telah banyak dilakukan penelitian tentang sistem pakar berbasis kasus atau Case Based Reasoning (CBR). Beberapa peneliti telah banyak meneliti terkait dengan sistem pakar berbasis kasus atau Case Based Reasoning (CBR) dengan menggunakan metode Probabilitas Bayesian untuk mendiagnosa sesuatu seperti diagnosa penyakit dll. Penelitian tentang diagnosa penyakit akibat virus eksantema oleh Agus Sasmito Aribowo dengan akurasi yang didapatkan sebanyak 45,2%, mendiagnosa penyakit gagal ginjal dengan akurasi yang didapatkan sebanyak 63.922 % oleh Sri Rahayu. Dan terkait dengan sistem pakar berbasis kasus atau Case Based Reasoning (CBR) dengan menggunakan metode Nearest Neighbor untuk mendiagnosa sesuatu seperti mendiagnosa penyakit umum oleh Ardian Nur Romadhan dengan akurasi 77,7%, mendignosa penyakit diagnosis penyakit anjing oleh Fransica Octaviani S, Joko Purwadi, dan Rosa Delima dengan akurasi 90%.
Dalam penelitian ini peneliti ingin menerapkan metode-metode diatas dalam sistem pakar berbasis Case Based Reasoning (CBR) dalam studi kasus mendiagnosa penyakit pada anak. Untuk mendiagnosa penyakit pada anak ini peneliti menggunakan data gejala-gejala awal yang dialami oleh anak tersebut. Proses yang berjalan adalah sistem akan melakukan penelusuran terhadap kesamaan antara kasus baru yang dialami oleh anak dengan kasus-kasus lama yang terdapat di database sistem dengan mengunakan metode Probabilitas Bayesian dan Nearest Neighbor. Setelah itu akan didapatkan hasil kasus yang hampir sama dengan kasus lama tersebut dan akan dibandingkan hasil yang didapatkan dari metode Probabilitas Bayesian dengan hasil yang didapatkan dari metode Nearest Neighbor. 1.2 Rumusan Masalah Dari latar belakang masalah tersebut dapat dirumuskan suatu permasalahan yaitu : a. Bagaimana perbandingan dalam penerapan metode Probabilitas Bayesian dan Nearest Neighbor pada Case Based Reasoning (CBR) dalam mendiagnosa penyakit pada anak ? b. Bagaimana merancang sistem pakar berbasis kasus atau Case Based Reasoning (CBR) untuk mendiagnosa penyakit pada anak dengan menerapkan metode Probabilitas Bayesian dan Nearest Neighbor ? 1.3 Tujuan Penelitian Tujuan dilakukannya penelitian ini adalah untuk mengetahui perbandingan kinerja Sistem Pakar dalam mendiagnosa penyakit pada anak dengan penggunaan metode Probabilitas Bayesian dan Nearest Neighbor dalam penalaran berbasis kasus. 1.4 Batasan Masalah Adapun batasan masalah dari penelitian ini adalah: 1. Penyakit yang digunakan disini adalah penyakit yang umum terjadi pada anak.
2. Data penelitian yang digunakan disini adalah data dari RS Wangaya. 3. Nilai pembobotan dari penelitian ini adalah hasil diskusi dengan 1 pakar yaitu Dr. I G A K Suandi Sp.A sebagai Dokter Spesialis Anak. 1.5 Manfaat Penelitian Manfaat dari penelitian ini adalah 1. Bagi Masyarakat Dapat dijadikan gambaran untuk meningkatkan pengetahuan dan wawasan masyarakat mengenai gejala-gejala umum penyakit pada anak agar tidak memiliki rasa kecemasan yang tinggi. Dan juga membantu ibu-ibu untuk mendiagnosa awal penyakit yang diderita oleh anak mereka dan dapat memberikan penanganan awal. 2. Bagi Penulis Diharapkan dapat menambah pengetahuan bagi penulis mengenai gejalagejala awal untuk mendiagnosa penyakit pada anak. 1.6 Metodologi Penelitian 1.6.1
Desain Penelitian Penelitian ini mengambil judul “Penerapan Metode Probabilitas Bayesian
dan Nearest Neighbour dalam Sistem Pakar Berbasis Case Based Reasoning (CBR)”. Desain penelitian yang digunakan dalam penelitian ini adalah studi kasus. Menurut (Hasibuan, 2007), studi kasus merupakan penelitian yang memusatkan perhatian pada suatu kasus tertentu dengan menggunakan individu atau kelompok sebagai bahan studinya. Penggunaan penelitian studi kasus ini biasanya difokuskan untuk menggali dan mengumpulkan data yang lebih dalam terhadap objek yang diteliti untuk dapat menjawab permasalahan yang sedang terjadi. Dalam masalah yang diambil, akan ada gejala-gejala 4 penyakit umum pada anak yang akan digunakan untuk menjadi data dalam penelitian ini. Akan terjadi penelusuran dari gejala-gejala baru yang dialami anak tersebut dengan mengunakan metode Probabilitas Bayesian dan Nearest Neighbor. Setelah itu
akan dibandingkan hasil yang didapatkan dari metode-metode tersebut dengan kasus lama yang diperoleh dari RS Wangaya. Dan dari sanalah akan didapatkan hasil penyakit yang hampir sama dengan data-data penyakit yang diperoleh dari RS Wangaya.
1.6.2
Pengumpulan Data Setelah dilakukan identifikasi masalah dan tujuan, selanjutnya yaitu tahap
pengumpulan data. Untuk mengetahui data apa saja yang dibutuhkan untuk menyelesaikan permasalahan ini, sebelumnya telah dilakukan studi literature dan studi lapangan. Jenis data yang digunakan pada penelitian ini dari cara memperolehnya yaitu data primer. Data primer adalah data yang berasal dari sumber asli atau pertama. Data ini tidak tersedia dalam bentuk terkompilasi ataupun dalam bentuk file-file. Data ini harus dicari melalui narasumber/responden, yaitu orang yang kita jadikan objek penelitian atau orang yang kita jadikan sebagai saran mendapatkan informasi ataupun data. (Jonathan Sarwono,2006:129). Selain data primer, didalam penelitian juga menggunakan data sekunder. Data sekunder adalah data yang sudah tersedia sehingga kita tinggal mencari dan mengumpulkan. (Jonathan Sarwono,2007:123) Pada penelitian ini data yang digunakan adalah data gejala-gejala penyakit pada anak yang diperoleh dari kasus-kasus di RS Wangaya, dan data penyakitnya diperoleh dari pakar. Pakarnya sendiri adalah seorang Spesialis Anak. Pada tabel 1.1 akan ditampilkan tabel penyakit pada anak dari pakar, pada tabel 1.2 akan ditampilkan tabel gejala penyakit gejala penyakit pada anak, dan pada tabel 1.3 akan ditampilkan tabel keputusan penyakit berdasarkan gejala. Tabel 1. 1 Tabel Penyakit Pada Anak (Sumber : Dr. I G A K Suandi Sp.A) Kode
Penyakit
K1
Demam Berdarah
K2
Demam Thypoid
K3
Diare
K4
TBC
Tabel 1. 2 Tabel Gejala Penyakit Pada Anak (Sumber : RS. Wangaya) Kode
Gejala
G1
Demam
G2
Mual
G3
Muntah
G4
Menjadi Lemas
G5
Bibir Kering
G6
Nafsu Makan dan Minum Menurun
G7
Batuk
G8
Pilek
G9
Mimisan
G10
Bibir Berdarah
G11
Sakit Saat Menelan
G12
Sakit Kepala
G13
Gatal Seluruh Tubuh
G14
Buang Air Besar Terus Menerus
G15
Keluar Bintik Merah Pada Tubuh
G16
Sakit Perut
G17
Sakit Tenggorokan
G18
Sesak Nafas
G19
Sariawan
G20
Sembelit
G21
Menggigil
G22
Lidah Putih
G23
Nyeri Otot
G24
Perut Sering Berbunyi
G25
Kejang
G26
Batuk Darah
G27
Benjolan Di Leher
G28
Terkadang Berkeringat
Tabel 1. 3 Tabel Keputusan Penyakit Berdasarkan Gejala (Sumber : RS. Wangaya) Tabel Keputusan Penyakit Berdasarkan Gejalanya Gejala Demam Mual Muntah Menjadi Lemas Bibir Kering Nafsu Makan dan Minum Menurun Batuk Pilek Mimisan Bibir Berdarah Sakit Saat Menelan Sakit Kepala Gatal Seluruh Tubuh Buang Air Besar Terus Menerus Keluar Bintik Merah Pada Tubuh Sakit Perut Sakit Tenggorokan Sesak Nafas Sariawan Sembelit Menggigil Lidah Putih Nyeri Otot Perut Sering Berbunyi
Penyakit K1
K2
K3
K4
√ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √
√ √ √ √ √ √ √ √ √
√ √ √ √
√ √ √ √
√ √ √
√ √ √ √
√
√
√
√
√
√
√
√
√ √ √ √ √ √
√
√
√
Kejang Batuk Darah Benjolan Di Leher Terkadang Berkeringat 1.6.3
√ √ √
Metode Yang Digunakan Metode yang digunakan dalam penelitian ini adalah Probabilitas Bayesian
dan Nearest Neighbor. Untuk metode Probabilitas Bayesian, perhitungan tingkat Similarity dari kasus-kasus dengan gejala yang diberikan pada pakar, yang ada dalam database menggunakan metode Probabilitas Bayesian. Proses dilakukan setelah proses retrieve informasi dari data kasus yang sudah terindex. Hasil proses retrieve sangat mungkin berupa beberapa kasus yang mirip dan dekat dengan gejala-gejala untuk penyakit dari pakar tersebut. Untuk memilih satu dari beberapa kasus termirip perlu manajemen ketidakpastian. Ketidakpastian ini akan dihitung menggunakan teorema Probabilitas Bayesian, dengan rumus sebagai berikut: 𝑃(𝐻|𝐸) =
𝑃(𝐸|𝐻).𝑃(𝐻)
………………………………………………..(1.1)
𝑃(𝐸)
Algoritmanya adalah sebagai berikut 1. Melakukan proses pencarian kasus yang mirip dan dekat dengan gejalagejala untuk penyakit anak dari kasus yang diperoleh dari RS.Wangaya. 2. Membandingkan antara kasus lama dengan kasus baru. Kasus 1, 2, 3, dan 4 merupakan kasus lama. Sedangkan kasus 5 merupakan kasus baru yang akan dibandingkan dengan 4 kasus lama tersebut Tabel 1. 4 Contoh Kasus Gejala/id_kasus Demam Mual Muntah Menjadi Lemas Bibir Kering Nafsu Makan dan Minum Menurun
1
2
1 0.67 0.67 0.67 0
3
4
5
0.67 0.67 0.67 0.67 0.33 1 0.33 0.67 0 0 0 0 0.67 0 1 0.67 0.67 0.67 0.33 0
0 0.67 0.67 0.67 0.67
Batuk Mimisan Bibir Berdarah Sakit Saat Menelan Sakit Kepala Pilek Gatal Seluruh Tubuh Buang Air Besar Terus Menerus Keluar Bintik Merah Pada Tubuh Sakit Perut Sakit Tenggorokan Sesak Nafas Sariawan Sembelit Menggigil Lidah Putih Nyeri Otot Perut Sering Berbunyi Kejang Batuk Darah Benjolan Di Leher Terkadang Berkeringat Kasus 1 adalah Demam
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0.67 0 0 0 0.67 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0
0
0
0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Berdarah yang memiliki
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 gejala yang
sama dengan kasus 5. Kasus 2 adalah Demam Berdarah yang memiliki 4 gejala yang sama dengan kasus 5. Kasus 3 adalah Demam Berdarah yang memiliki 3 gejala yang sama dengan kasus 5. Kasus 4 adalah Demam Thypoid yang memiliki 4 gejala yang sama dengan kasus 5. 3. Cari similarity value nya dengan cara 𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 𝑉𝑎𝑙𝑢𝑒 =
𝑔𝑒𝑗𝑎𝑙𝑎 𝑦𝑎𝑛𝑔 𝑠𝑎𝑚𝑎 𝑗𝑢𝑚𝑙𝑎ℎ 𝑔𝑒𝑗𝑎𝑙𝑎
………………………………(1.2)
Untuk Kasus 1, Similarity Value = 3/28 = 0.1072 Untuk Kasus 2, Similarity Value = 4/28 = 0.1429 Untuk Kasus 3, Similarity Value = 3/28 = 0.1072 Untuk Kasus 4, Similarity Value = 4/28 = 0.1429 4. Setelah didapatkan SV dari masing-masing kasus, maka ditentukan MSVnya, karena disini maksimal banyaknya gejala pada satu kasus adalah
6 jadi minimal gejala yang sama pada kasus baru adalah 3. Jadi karena Similarity Value = 3/28 = 0.1072, maka MSVnya adalah 0.1072. 5. Setelah terkumpul kasus-kasus yang memiliki MSV >= 0.1072 maka dihitunglah kasus tersebut mengunakan metode Probabilitas Bayesian. Awalnya adalah dicari nilai dari masing-masing kasus tersebut, seperti berikut 𝑃(𝐾1) = 𝑃(𝐾2) = 𝑃(𝐾3) = 𝑃(𝐾4) =
𝐾𝑎𝑠𝑢𝑠 𝐷𝐵
3
𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠
= 4 = 0.75
𝐾𝑎𝑠𝑢𝑠 𝐷𝐵
3
𝐾𝑎𝑠𝑢𝑠 𝐷𝐵
3
= 4 = 0.75 𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠 = 4 = 0.75 𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠 𝐾𝑎𝑠𝑢𝑠 𝐷𝑇
1
𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠
= 4 = 0.25
6. Setelah diperoleh hasil dari P(K) dari masing-masing kasus, akan dicari P(S|K) dari masing-masing kasus seperti berikut P(S|K1) = 0.75 ∗ 3 = 2.25 P(S|K2) = 0.75 ∗ 4 = 3 P(S|K3) = 0.75 ∗ 3 = 2.25 P(S|K4) = 0.25 ∗ 4 = 1 7. Setelah itu dicari totalnya yaitu P(S) dari semua kasus tersebut 𝑃(𝑆) = (0.75 ∗ 2.25) + (0.75 ∗ 3) + (0.75 ∗ 2.25) + (0.25 ∗ 1) = 1.6875 + 2.25 + 1.6875 + 0.25 = 5.875 8. Setelah itu akan diperoleh hasil probabilitas bayes dari masing-masing kasus seperti berikut 𝑃(𝐾1|𝑆) =
𝑃(𝑆|𝐾1)∗𝑃(𝐾1)
𝑃(𝐾2|𝑆) =
𝑃(𝑆|𝐾2)∗𝑃(𝐾2)
𝑃(𝐾3|𝑆) =
𝑃(𝑆|𝐾3)∗𝑃(𝐾3)
𝑃(𝐾4|𝑆) =
𝑃(𝑆|𝐾4)∗𝑃(𝐾4)
𝑃(𝑆) 𝑃(𝑆) 𝑃(𝑆) 𝑃(𝑆)
= = = =
2.25∗0.75 5.875 3∗0.75 5.875
= 0.3829
2.25∗0.75 5.875 1∗0.25 5.875
= 0.2872
= 0.2872
= 0.0425
Jadi kesimpulan dari perhitungan kasus diatas dengan Metode Probabilitas Bayesian, maka didapatkan kesimpulan penyakit mengarah pada kasus 2 dengan hasil 0.3829 atau 38.29% Untuk metode Nearest Neighbor, Pada proses Retrieve ini akan dilakukan pembobotan dengan menggunakan metode Nearest Neighbour. 1. Akan melakukan proses pembobotan dengan melakukan pencocokan satu per satu antara gejala yang dmasukan dengan data yang ada di dalam basis pengetahuan. Proses pembobotan yang dilakukan oleh sistem ditampilkan dalam perhitungan di bawah ini. Bobot parameter (w) :
Gejala Penting = 5
Gejala Sedang = 3
Gejala Biasa
=1
Dan Bobot Nilai Gejalanya adalah
Sangat Dirasakan = 1
Cukup Dirasakan = 0.67
Sedikit Dirasakan = 0.33
2. Dan untuk nilai pendekatan di setiap gejala nya adalah Tabel 1. 5 Tabel Nilai Pendekatan Nilai 1
Nilai 2
Pendekatan
Sangat Dirasakan
Sangat Dirasakan
1
Sangat Dirasakan
Cukup Dirasakan
0.5
Sangat Dirasakan
Sedikit Dirasakan
0.25
Cukup Dirasakan
Sangat Dirasakan
0.5
Cukup Dirasakan
Cukup Dirasakan
1
Cukup Dirasakan
Sedikit Dirasakan
0.5
Sedikit Dirasakan
Sangat Dirasakan
0.25
Sedikit Dirasakan
Cukup Dirasakan
0.5
Sedikit Dirasakan
Sedikit Dirasakan
1
3. Cari Similarity dari dengan membandingkan Kasus Baru dan Semua Kasus Lama seperti berikut Kasus Lama DB
Kasus Baru
Demam (1) (5)
Demam (0.67)
Mual (0.67) (5)
Mual (0.67)
Muntah (0.67) (3)
Bibir Kering (0.67)
Menjadi Lemas (0.67) (3)
Nafsu
Makan
&Minum
Menurun (0.67)
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 =
(0.5∗5) : (1∗5) 5:5:3:3
2.5:5
=
16
= 0.46
Kasus Lama DB
Kasus Baru
Demam (0.67) (5)
Demam (0.67)
Mual (0.67) (5)
Mual (0.67)
Bibir Kering (0.67) (3)
Bibir Kering (0.67)
Nafsu Makan &Minum Menurun
Nafsu
(0.33) (5)
Menurun (0.67)
Makan
&Minum
Menjadi Lemas (0.67) (3)
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 =
(1∗5): (1∗5):(1∗3) : (0.5∗5) 5:5:3:5:3
15.5
= 21 = 0.738
Kasus Lama DT
Kasus Baru
Demam (0.67) (5)
Demam (0.67)
BAB Terus Menerus (0.67) (1)
Mual (0.67)
Batuk (0.67) (3)
Bibir Kering (0.67)
Nafsu Makan &Minum Menurun
Nafsu
(0.67) (5)
Menurun (0.67)
Makan
&Minum
Menjadi Lemas (0.67) (5)
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 =
(1∗5): (1∗5) 5:1:3:5:5
10
=19 = 0.526
Jadi kesimpulan dari perhitungan kasus diatas dengan Metode Nearest Neighbour, maka didapatkan kesimpulan penyakit mengarah pada kasus 2 dengan hasil 0.738 atau 73.8% 1.6.4
Evaluasi dan Validasi Hasil Pada tahap ini akan dilakukan evaluasi dan validasi hasil. Evaluasi dan
validasi hasil dilakukan untuk mengetahui apakah yang dihasilkan sudah sesuai dengan tujuan yang ingin dicapai. Pengujian sistem dilakukan dengan menginputkan kasus awal yang diderita oleh pasien dan sistem akan membandingkan kasus baru pasien dengan kasus lama yang terdapat dalam basis kasus. Dan jika terdapat hasil 2 kasus yang serupa dengan kasus baru maka akan dilakukan pengecekan terhadap gejala-gejala yang terdapat dalam data diatas.setelah itu akan didapatkan keakuratan sistem terhadap kasus baru dari pasien tersebut. Hasil yang ingin didapatkan adalah akurasi dari penerapan metode Probabilitas Bayesian dan Nearest Neighbor dalam sistem pakar berbasis kasus atau Case Based Reasoning (CBR) untuk mendiagnosa gejala-gejala penyakit pada anak. Untuk mendapatkan persentase nilai akurasi untuk hasil perhitungan dari metode Probabilitas Bayesian dan Nearest Neighbor adalah
𝑃𝑒𝑟𝑠𝑒𝑛𝑡𝑎𝑠𝑒 𝐻𝑎𝑠𝑖𝑙 =
𝑘𝑎𝑠𝑢𝑠 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟 × 100% 𝑠𝑒𝑚𝑢𝑎 𝑘𝑎𝑠𝑢𝑠
Berikut adalah tabel untuk mencatat hasil perhitungan yang didapatkan dari sistem ini : Tabel 1. 6 Tabel Hasil Perhitungan Data
Penyakit
Probabilitas
Nilai
Nearest
Bayesian
Bayes
Neighbor
Similarity