SISTEM PENDUKUNG KEPUTUSAN UNTUK MENDIAGNOSIS DIABETES MENGGUNAKAN C4.5 Muhammad Fakhrurrifqi1,Anifuddin Aziz2 Program Diploma Komsi Sekolah Vokasi UGM1,2
[email protected] [email protected]
ABSTRAK Pada penentuan seseorang positif menderita diabetes atau tidak, indikasi penentuannya selain didasarkan pada prosedur tetap (protap), juga berdasarkan pengalaman klinis. Hal ini dapat memungkinkan seorang dokter mengambil keputusan yang kurang tepat. Kondisi fisik dan keluhan yang dialami pasien satu dan lainnya juga beragam. Riwayat medis pasien juga berbeda-beda, demikian juga kondisi pasien. Sehingga terdapat banyak sekali faktor yang harus dipertimbangkan oleh seorang dokter dalam mendiagnosis diabetes. Pada penelitian ini akan dikembangkan suatu sistem untuk memberi panduan bagi dokter dalam mendiagnosis diabetes dari seorang pasien sesuai dengan kondisi fisik pasien menggunakan Case Based Reasoning dengan hirarkispohon metode C45. Hasil yang didapatkan dari penelitian ini adalah metode C4.5 bisa digunakan untuk menentukan diagnosis diabetes dengan tingkat akurasi yang baik sehingga sistem yang dibangun dapat member panduan kepada dokter dalam mendiagnosis diabetes. Kata kunci: Diabetes, SistemPendukungKeputusan, C4.5 penggunaan obat yang tidak rasional yang
PENDAHULUAN Pada diagnosis diabetes atau penentuan
akan berdampak pada tingginya biaya
seseorang positif menderita diabetes atau
pengobatan dan resiko efek samping obat,
tidak,
selain
maka perlu dilakukan suatu penelitian yang
didasarkan pada prosedur tetap (protap),
bisa menghasilkan suatu sistem untuk
juga berdasarkan pengalaman klinis. Hal ini
memberi
dapat
menentuan
indikasi
penentuannya
memungkinkan
seorang
dokter
panduan
bagi
diagnosis
dokter
diabetes
dalam seorang
pasien, sesuai dengan kondisi fisik pasien.
mengambil keputusan yang kurang tepat. Kondisi fisik dan keluhan yang dialami
CBR telah dikenalkan pada awal
pasien satu dan lainnya juga beragam.
1980an sebagai pendekatan penalaran yang
Riwayat medis pasien juga berbeda-beda,
dipercaya didukung oleh ide bahwa orang
demikian juga kondisi pasien. Sehingga
menggunakan
terdapat banyak sekali faktor yang harus
ketika
dipertimbangkan oleh seorang dokter dalam
Umumnya, CBR memiliki sejumlah besar
penentuan diabetes.
kasus-kasus sebelumnya yang tersimpan
Berdasarkan meningkatkan
hal
tersebut,
perbaikan
klinis
untuk dan
kembali
pengalamannya
memecahkan
suatu
masalah.
dalam basis kasus. Ketika ada masalah baru, akan
dilihat
sebagai
kasus
baru
dan
pencegahan penentuan penderita diabetes
dibandingkan dengan kasus-kasus pada basis
yang
kasus. Kemudian, kasus yang mirip dengan
kurang
tepatsertamengurangi
102Jurnal Rekam Medis, ISSN 1979-9551, VOL.VII.NO.2, OKTOBER 2013, Hal102-107
kasus baru akan digunakan sebagai saran
tanggal 9 Mei 1990.Data diabetes ini
pada penguna sebagai solusi terhadap
menggunakan delapan attribut dan satu
masalah baru tersebut. Biasanya, kasus baru
kelas, yaitu :
yang diselesaikan, akan ditambahkan ke
1. Jumlah kali kehamilan
dalam basis kasus. Banyak sistem CBR yang
2. Kadar gula darah setelah
ditelah dipublikasikan untuk memecahkan
puasa
minimal 2 jam
masalah dalam berbagai bidang, seperti :
3. Tekanan darah (mm Hg)
diagnosis,
4. Ketebalan lipatan lapisan kulit triceps
perencanaan,
desain,
dan
pengolahan citra[1]. Sistem
CBR
pengindeksan
(mm) dapat
hirarkis
menggunakan seperti
pohon
keputusan dan C4.5[2]. Pada CBR, pohon
5. 2 jam serum insulin (mu U/ml) 6. Indeks massa tubuh (Berat(dalam kg) / tinggi (dalam meter) ^ 20)
keputusan dikategorikan sebagai teknik
7. Funsi Silsilah diabetes
pengindeksan kasus dengan pendekatan
8. Usia (tahun)
induktif. Pendekatan induktif digunakan
9. Kelas (Positif / Negatif)
untuk menentukan struktur berbasis kasus.
b. Pengolahan data awal
Struktur hirarkis basis kasus yang dihasilkan
Pada tahap ini dilakukan pengolahan
menurunkan ruang pencarian pada saat
data awal, yaitu normalisasi data, untuk
proses retrieval[3].
bisa
digunakan
sebagai
data
Pada penelitian ini, akan digunakan
pembentukan pohon. Ketika data masuk
metode C4.5 yang merupakan kelompok
ke dalam sistem, setiap data akan
algoritma
untuk
didiskritkan.
yang
dapat
dengan mengelompokkan setiap data dari
dokter
dalam
attribut. Jumlah kelompok yang akan
seorang
dibuat adalah tergantung pada jumlah
pasien menggunakan Case Based Reasoning
data yang ada. Dalam penelitian ini akan
dengan hirarkis pohon metode C4.5.
menggunakan rumus :
pohon
membangun memberi
suatu
panduan
menentuan
keputusan sistem bagi
diagnosis
diabetes
Pendiskritkan
dilakukan
k 1 3,3log n
METODE
dengan:
Penelitian
ini
dilakukan
beberapatahapan.
melalui Tahapan-
k = banyak kelompok yang akan dibentuk
tahapantersebutadalah :
n = jumlah keseluruhan data
a. Pencarian data
c. Perancangan sistem
Pada tahap ini, dilakukan pengambilan
Pada tahap ini dilakukan perancangan
data diabetes. Data didapatkan dari
algoritma
National
perancangan antarmuka. Paket
Digestive
Institute
of
andKidney
Diabetes
and
Diseasespada
C4.5,
juga
dilakukan C4.5
merupakan rancangan untuk algoritma
Sistem Pendukung Keputusan Untuk...(Muhammad F, Anifuddin A )103
pembentukan tree untuk metode C4.5.
pada node tersebut sedangkan attribut
Sebagaimana ditunjukkan Gambar 2.1,
attTerpakai
paket ini terdiri dari tujuh kelas, yaitu :
digunakan untuk menyimpan attribut-
node, root, stem, leaf, tree, tampilan, test.
attribut yang sudah digunakan oleh node-
Kelas node merupakan representasi dari
node sebelum node tersebut. Selain itu
node-node yang menyusun suatu tree.
kelas ini juga memiliki metode getData()
Kelas
yang
ini
dataTerkandung
mempunyai dan
attribute
merupaka
berfungsi
untuk
attribut
yang
mendapatkan
attTerpakai.
dataTerkandung, serta terdapat metode
Attribut dataTerpakai yang berfungsi
apa yang berfungsi untuk mengetahui
untuk menyimpan data yag terkandung
node apa yang tersebut.
Gambar 2.1 Class Diagram pohon C4.5
104Jurnal Rekam Medis, ISSN 1979-9551, VOL.VII.NO.2, OKTOBER 2013, Hal102-107
Node pada tree ini terdiri dari tiga
tersebut
merupakan
bagian
macam, yaitu root, stem dan leaf. Dengan
pecahan attribut induknya.
demikian dibentuk tiga kelas dari kelas node
a. Implementasi sistem
anak
dari
sehingga ketiga kelas tersebut memiliki
Pada tahap ini dilakukan pembuatan
semua attribut dan metode node. Kelas-kelas
program komputer menggunakan bahasa
tersebut adalah kelas root, stem dan leaf.
Java berdasarkan rancangan yang telah
Kelas root merupakan node paling atas yang
dibuat.
tidak memiliki node induk. Kelas ini
b. Pengujian sistem
memiliki attribut anak dengan tipe node,
Pada tahap ini akan dilakukan pengujian
yaitu root akan menyimpan node yang
terhadap sistem yang telah dibangun.
terdapat pada bawahnya atau bisa disebut
Pengujian dilakukan untuk mengetahui
node anak. Pembagian node-node anak ini
tingkat akurasi sistem.
berdasar suatu attribut yang tersimpan pada variabel attPembagi. Kelas root ini memiliki
HASIL DAN PEMBAHASAN
metode utama, yaitu buatCabang. Metode ini
Data diabetes akan dibagi menjadi dua
digunakan untuk membangkitkan node-node
bagian. Bagian pertama akan dijadikan
anak sesuai dengan prosedur yang ada.
sebagai data pembelajaran, yaitu data yang
Kelas stem merupakan node yang
digunakan untuk membentuk pohon C4.5,
berada ditengah. Dia memiliki node induk
sedang bagian kedua akan digunakansebagai
dan node anak. Kelas ini hampir sama
data uji. Setelah pohon C4.5
dengan kelas root, akan tetapi kelas ini
dibangun,
mempunyai attribut bapak yang digunakan
dimasukkan dimasukkan ke dalam pohon
untuk menyimpan node induknya serta
tersebut sehingga akan didapatkan kelas atau
attribut anakKe yang digunakan untuk
diagnosis pasien.
mengetahui dvbagian
node anak
tersebut dari
merupakan
pecahan
attribut
berhasil
maka setiap data uji akan
Terdapat 768 sampel kasus pada data diabetes ini. Dari sekian banyak sampel kasus tersebut, akan dibagi menjadi 2
induknya. Kelas leaf merupakan representasi dari
bagian, yaitu : data pembelajaran dan data
node paling bawah, node yang mempunyai
uji. Pembagian data menggunakan 75%,
induk akan tetapi tidak memiliki node anak.
artinya 75% dari keseluruhan sempel kasus (
Kelas ini memiliki attribut bapak yang
576 sampel kasus) digunakan sebagai data
digunakan
pembeajaran
untuk
menyimpan
node
seperti
ditunjukkan
pada
induknya, attribut kelas yang digunakan
Gambar 3.1 dan sisanya (192 sampel kasus)
untuk menyimpan kelas dari data-data yang
digunakan
terkumpul di dalamnya serta attribut anakKe
ditunjukkan pada Gambar 3.2. Data diabetes
yang digunakan untuk mengetahui node
ini akan disimpan ke dalam sebuah file
sebagai
data
uji
seperti
bertipe arff. Ketika data masuk ke dalam
Sistem Pendukung Keputusan Untuk...(Muhammad F, Anifuddin A )105
sistem,
setiap
Pendiskretisasi
data
akan
dilakukan
didiskritkan. dengan
mengelompokkan setiap data dari attribut. Jumlah kelompok yang akan dibuat adalah tergantung pada jumlah data yang ada.
Gambar 3.2 Tabel data uji Sistem yang dibangun menggunakan bahasa pemrograman JAVA dapat berjalan Gambar 3.1 Tabel data pembelajaran
dengan baik dan mampu melakukan fungsifungsi sesuai dengan rancangan yang telah dibuat. Hasil perhitungan akurasi yang didapatkan ditunjukkan pada tabel 3.1.
106Jurnal Rekam Medis, ISSN 1979-9551, VOL.VII.NO.2, OKTOBER 2013, Hal102-107
Tabel 3.1 Hasil Pengujian Jumlah data uji
192
Kasus Benar
119
Kasus Tidak Di Dapatkan Kelas
32
Kasus Salah
41
Industrial Automation and Soft Computing Genoa, Italy, 376-381
Pall, Sankar K., Shiu, Simon C.K., 2004, Foundation of Soft Case Based Reasoning, John Wiley and Sons, USA.
119 / (192 – 32) = 74.375 %
Akurasi
Dari tingkat akurasi yang didapatkan, maka untuk data diabetes, sistem ini dapat digunakan untuk membantu dokter dalam menentuan
diagnosis
diabetes
seorang
pasien.
SIMPULAN 1.
Berhasil dibangun suatu sistem yang dapat menjadi panduan bagi dokter dalam menentuan diagnosis diabetes seorang pasien sesuai dengan kondisi fisik pasien.
2.
Berdasarkan hasil pengujian, diperoleh kesimpulan bahwa metode C4.5 bisa digunakan untuk menentukan diagnosis diabetes dengan tingkat akurasi yang baik
DAFTAR PUSTAKA Yang, B.S., Han, T., Kim, Y.S., 2004, Integration of ART-Kohonen and case-based reasoning for intelligent fault diagnosis, Expert Systems with Applications 16, 387-3 Jha, G., Hui, S.C., Foo, S., 1999, A hybrid case-based reasoning and neural network approach to online intelligent fault diagnosis, Proceedings of 3rd International ICSC Symposia on Intelligent
Sistem Pendukung Keputusan Untuk...(Muhammad F, Anifuddin A )107
108Jurnal Rekam Medis, ISSN 1979-9551, VOL.VII.NO.2, OKTOBER 2013, Hal102-107