Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No. 3, Maret 2018, hlm. 1275-1282
e-ISSN: 2548-964X http://j-ptiik.ub.ac.id
Klasifikasi Penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF) dengan Menerapkan Algoritma Decision Tree C4.5 (Studi Kasus : Rumah Sakit Wilujeng Kediri) Ulva Febriana1, M. Tanzil Furqon2, Bayu Rahayudi3 Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email:
[email protected],
[email protected],
[email protected] Abstrak Demam merupakan naiknya suhu tubuh yang lebih tinggi dari biasanya. Demam itu bukanlah penyakit, melainkan awal gejala seseorang terkena penyakit. Ada banyak penyakit yang disebabkan oleh demam, contohnya seperti Typhoid Fever dan Dengue Haemorragic Fever. Kedua penyakit tersebut apabila diamati secara klinis akan sulit membedakannya. Karena kedua penyakit itu hampir memiliki gejalagejala yang sama dan apabila terjadi kesalahan dalam mendiagnosisnya akan menyebabkan hal yang fatal pada pasien. Penyakit Typhoid Fever merupakan demam yang disebabkan oleh bakteri Salmonella Typhi yang menyebar ke seluruh tubuh dan Dengue Haemorragic Fever penyakit demam yang disebabkan oleh gigitan nyamuk Aedes Aegypti. Untuk mengatasi hal tersebut, maka dibuatlah sistem klasifikasi diagnosa penyakit Typhoid Fever dan Dengue Haemorragic Fever berdasar pada gejalagejala yang dimiliki oleh pasien dengan menerapkan algoritma desicion tree C4.5. Akurasi yang diperoleh sistem klasifikasi penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF) dengan dilakukan pengujian k-folds cross validation didapatkan nilai rata-rata akurasi tertinggi pada 5fold cross validation dengan akurasi sebesar 91,875% yang menggunakan data uji sebanyak 32 data dan data latih sebanyak 128 data. Hasil uji coba ke-4 pada pengujian 5-fold cross validation ini menghasilkan akurasi tertinggi yaitu sebesar 97%. Sedangkan analisis dengan melakukan pengujian 16-fold cross validation dari data uji sejumlah 10 data dan data latih sejumlah 150 data, didapatkan hasil nilai uji coba sebesar 100% pada uji coba ke-2, ke-3, ke-4, ke-6, ke-9, ke-11, ke-12 dan ke-16. Walaupun nilai akurasi 100% yang didapatkan pada pengujian ini jumlahnya ada banyak, rata-rata akurasi pada pengujian 16fold cross validation ini masih dibawah nilai rata-rata akurasi yang didapat dengan pengujian 5-fold cross validation. Kata Kunci : Demam, Typhoid Fever, Dengue Haemorragic Fever, C4.5 Abstract Fever is a rise in body temperature is higher than usual. Fever is not a disease, but the initial symptoms of a person affected by the disease. There are many diseases caused by fever, such as Typhoid Fever and Dengue Haemorragic Fever. Both diseases when observed clinically will be difficult to distinguish them. Because the two diseases almost have the same symptoms and if there is an error in diagnosing it will cause a fatal thing in the patient. Typhoid Fever disease is a fever caused by Salmonella Typhi bacteria that spread throughout the body and Haemorragic Fever Dengue fever caused by Aedes Aegypti mosquito bites. To overcome this, then made a classification system of disease diagnosis Typhoid Fever and Dengue Haemorragic Fever based on symptoms possessed by patients by applying desicion tree algorithm C4.5. Accuracy obtained by Typhoid Fever (TF) and Dengue Haemorhagic Fever (DHF) classification system by k-folds cross validation test showed the highest accuracy value on 5-fold cross validation with accuracy of 91,875% using 32 data test and Training data of 128 data. The results of the 4th test on 5-fold cross validation test resulted in the highest accuracy of 97%. While the analysis by conducting 16-fold cross validation test of the test data of 10 data and training data of 150 data, obtained the result of the test value of 100% on the 2nd, 3rd, 4th, 6th, The 9th, the 11th, the 12th and the 16th. Although the 100% accuracy value obtained in this test is numerous, the average accuracy of the 16-fold cross validation test is still below the average score of accuracy obtained by testing 5-fold cross validation. Keywords: Fever, Typhoid Fever, Haemorragic Fever Dengue, C4.5. Fakultas Ilmu Komputer Universitas Brawijaya
1275
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
1. PENDAHULUAN Demam merupakan naiknya suhu tubuh menjadi lebih tinggi daripada biasanya. Suhu tubuh normal manusia berada pada titik 37 oC, jika suhu tubuh menunjukkan lebih dari angka tersebut menunjukkan adanya demam yang disebabkan oleh infeksi (Purwoko, 2005). Demam bukanlah suatu penyakit, melainkan awal gejala seseorang terserang penyakit. Beberapa penyakit tersebut antara lain seperti Pneumonia, Malaria, Meningitis, Infeksi Saluran Kemih, Tifus, bahkan penyakit yang lebih berbahaya seperti Demam Berdarah. Ada beberapa penyakit yang apabila diamati secara klinis akan sulit membedakan diagnosisnya. Dan apabila salah dalam mendiagnosis penyakit yang diderita maka akan menyebabkan fatal pada pasien. Contohnya dalam mendiagnosis penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF), karena penyakit tersebut memiliki gejala-gejala yang hampir sama sehingga akan merasa sulit dalam membedakannya (Judarwanto, 2009). Penyakit Typhoid Fever (TF) atau masyarakat awam mengenalnya dengan tifus ialah penyakit demam karena adanya infeksi bakteri Salmonella Typhi yang menyebar ke seluruh tubuh. Gejala penyakit ini berkembang selama satu sampai dua minggu setelah seorang pasien terinfeksi oleh bakteri tersebut. Gejala umum yang terjadi pada penyakit tifus mencakup suhu tubuh yang tinggi mencapai 39oC-40oC, sakit kepala, nyeri pada otot, sakit perut, hilangnya nafsu makan, kelelahan dan lidah kotor (Yahya, 2008). Sedangkan, Dengue Haemorhagic Fever (DHF) merupakan penyakit yang disebabkan oleh virus Dengue yang ditularkan melalui gigitan nyamuk Aedes Aegypti. Gejala awal penyakit DHF antara lain demam tinggi yang berlangsung sepanjang hari selama 2-7 hari, manifestasi pendarahan, trobosit yang turun secara terus menerus, hemokonsentrasi, pembesaran hati, nyeri otot, mual dan muntah, dan diare (Depkes, 2015). Dengan adanya permasalah tersebut, maka dibuatlah suatu perangkat lunak yang digunakan untuk mengklasifikasikan seorang pasien tersebut masuk dalam kategori terkena penyakit Typhoid Fever (TF) atau Dengue Haemorhagic Fever (DHF), berdasarkan gejala-gejala yang diderita oleh pasien pada suatu rumah sakit. Dengan adanya pengelompokkan akan mempermudah manajemen pengawasan penyakit untuk melihat penyakit tersebut masuk Fakultas Ilmu Komputer, Universitas Brawijaya
1276
dalam kategori penyakit Typhoid Fever (TF) atau justru masuk dalam kategori penyakit Dengue Haemorhagic Fever (DHF). Klasifikasi merupakan suatu proses dalam kecerdasan buatan yang menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya (Bertalya, 2009). Klasifikasi dalam penelitian ini dilakukan dengan menerapkan algoritma decision tree C4.5 dengan mengoptimalkan atribut-atribut yang berasal dari dataset yang terpercaya. Pada penelitian sebelumnya yang dilakukan oleh (Adeyemo & Adeyeye, 2015) meneliti tentang prediksi penyakit tifus dengan menerapkan algoritma ID3, C4.5 dan MLP ke dalam penelitiannya, masukkan dari sistem tersebut terdiri dari beberapa atribut antara lain : umur, jenis kelamin, nyeri perut, sakit kepala, pusing, batuk, demam, muntah, kehilangan selera makan dan keluaran sistem berupa diagnosis penyakitnya. Algoritma MLP ternyata memiliki akurasi lebih tinggi dibandingkan dengan dua algoritma lainnya, yaiu sebesar 83,6299%, tetapi dalam kecepatan dalam melatih data algoritma C4.5 lebih baik dengan hanya 0,01 detik. Selanjutnya, penelitian yang dilakukan oleh (Hartanto & Hansun, 2014) menerapkan data mining dengan algoritma C4.5 untuk prediksi tingkat kelulusan mahasiswa dengan 4 kategori yang berupa lulus cepat, lulus tepat, lulus terlambat, dan drop out. Atribut yang berpengaruh dalam hasil prediksinya yaitu IPS semester enam. Akurasi yang dihasilkan dari sistem ini sebesar 87,5% dari data training sebanyak 60 dan 40 data testing. Berdasarkan penelitian yang sudah dilakukan diatas, maka dalam penelitian ini dirancanglah sebuah sistem klasifikasi gejala penyakit Typhoid Fever (TF) atau Dengue Haemorhagic Fever (DHF) dengan menerapkan metode decision tree C4.5 untuk mendiagnosa jenis penyakit yang diderita oleh pasien di suatu rumah sakit. Sistem ini diharapkan dapat membantu dokter dan tenaga medis dalam melakukan diagnosis penyakit berdasarkan gejala-gejala yang dimasukkan dan penerapan metode decision tree C4.5 dapat memberikan hasil yang maksimal dalam diagnosa serta memiliki keakuratan yang tinggi. 2. DASAR TEORI
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
2.1 Decision tree C4.5 Algoritma C4.5 merupakan sebuah metode yang digunakan untuk klasifikasi yang bersifat prediktif. Pembentukan decision tree (pohon keputusan) merupakan dasar dari algoritma C4.5 ini, cabang-cabang pohon merupakan pertanyaan klasifikasi dan daunnya merupakan kelas-kelas. Dalam pembangunan pohon keputusan dibutuhkan beberapa tahapan yaitu dengan memilih atribut sebagai akar, membuat cabang pada masing-masing nilai, membagi kasus dalam cabang dan mengulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. Berikut adalah tahap-tahap perhitungan algoritma C4.5 (Suwondo, Asmarajati, & Surahman, 2013) : 1. Menyiapkan data training. 2. Menghitung nilai index Entropy terlebih dahulu dengan persamaan 2.1 (1)
i 1
Keterangan : S = himpunan kasus n = jumlah partisi S pi = proporsi dari Si terhadap S 3.
Menghitung gain, untuk menetapkan atribut sebagai akar dengan menghitung nilai gain tertinggi dari semua atribut yang ada n
Si
i 1
|S|
Gain( S , A) Entropy( S )
Entropy( S i )
(2) Keterangan : S = himpunan kasus A = atribut n = jumlah partisi atribut A |Si| = jumlah kasus pada partisi ke-i |S| = jumlah kasus dalam S 4.
keakuratan sebuah model yang dibangun berdasarkan dataset tertentu. Salah satu teknik cross validation yang populer yaitu k-fold cross validation. Dalam teknik k-fold cross validation, dataset dibagi menjadi sejumlah K-buah partisi secara acak. Kemudian dilakukan sejumlah Kkali uji coba, dimana masing-masing uji coba tersebut menggunakan data partisi ke-K sebagai data uji dan sisa partisi lainnya sebagai data latih (Wihardi, 2013). Untuk mendapatkan nilai akurasi pada pengujian k-fold cross validation menggunakan persamaan 2.3 berikut ini :
Akurasi
dataujibenar 100% jumlahdatauji
(3)
dan untuk mendapatkan nilai rata-rata hasil tiap uji coba dapat menggunakan persamaan 2.4
Rata rata
akurasi 100% ujicoba
(4)
2.3 Dengue Haemorhagic Fever (DHF)
n
Entropy ( S ) pi log 2 pi
1277
Ulangi langkah kedua sampai semua record terpartisi, dan proses partisi akan berhenti saat semua record dalam simpul N mendapat kelas yang sama, tidak ada atribut didalam record yang dipartisi lagi, dan tidak ada record didalam cabang yang kosong.
Demam Berdarah atau bahasa ilmiahnya disebut dengan Dengue Haemorhagic Fever merupakan penyakit virus dengue yang disebabkan oleh gigitan nyamuk Aedes Aegypti. Nyamuk Aedes Aegypti hidup didaerah yang mempunyai iklim tropis dengan suhu yang lembab. Nyamuk ini mempunyai ciri-ciri tubuh hitam dengan belang putih pada kakinya. Gejala penderita penyakit ini sekarang tidak terduga dan seringkali disepelekan oleh masyarakat awam. Gejala-gejala penyakit Dengue Haemorhagic Fever sebagai berikut : 1. Mendadak demam tinggi (lebih dari 38 oC) yang berlangsung secara terus menerus selama 2 sampai 7 hari 2. Terdapat bintik-bintik merah pada kulit 3. Terasa mual, muntah dan kepala pusing 4. Nyeri ulu hati 5. Trombosit yang turun terus menerus 6. Diare Maka diperlukan adanya pemberantasan pada nyamuk penularnya, pemberantasan tersebut dilakukan dengan cara fogging atau pengasapan pada tiap rumah agar nyamus aedes aegypti mati dan dapat pula dilakukan dengan cara 3M yaitu Menguras, Menutup dan Mengubur (WHO, 1998). 2.4 Typhoid Fever (TF)
2.2 Cross Validation Cross validation merupakan salah satu teknik untuk menilai atau memvalidasi Fakultas Ilmu Komputer, Universitas Brawijaya
Demam Tifoid atau Typoid Fever ialah penyakit infeksi akut pada saluran pencernaan dengan gejala yang timbul berupa demam satu minggu atau lebih disertai adanya gangguan
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
pada saluran pencernaan atau tanpa gangguan kesadaran (Astuti, 2013). Penyakit typoid ini mempunyai hubungan erat dengan lingkungan terutama pada lingkungan yang penyediaan air minumnya tidak memenuhi syarat kesehatan dan sanitasi yang buruk pada lingkungan. Faktorfaktor yang mempengaruhi penyakit typoid tersebar yaitu polusi udara, sanitasi umum, kualitas air temperatur, kepadatan penduduk, kemiskinan dan lain-lain (Harahap, 2011). Gejala-gejala yang muncul pada penyakit ini (Widodo, 2006) sebagai berikut : 1. Demam 2. Sakit kepala 3. Mual, muntah 4. Diare 5. Tidak nafsu makan 6. Lemas 7. Lidah kotor
1278
mana sistem bekerja dengan memasukkan data gejala pasien kemudian data diproses dengan metode decision tree C4.5, Langkah pertama yaitu dengan menghitung nilai entropy dengan persamaan (1) kemudian akan dihitung nilai gain dengan persamaan (2) dan didapatkan tree dalam bentuk rule. Keluaran yang dihasilkan sistem berupa jenis penyakit yang diderita oleh pasien.
3. METODOLOGI PENELITIAN Gambar 1 dibawah ini merupakan langkahlangkah sistem : Gambar 2. Perancangan Sistem
5. IMPLEMENTASI SISTEM
Gambar 1. Metodologi Penelitian
Pada studi literatur membahas teori-teori yang berkaitan untuk penelitian, Selanjutnya analisis kebutuhan untuk menganalisa kebutuhankebutuhan apa saja yang dibutuhkan untuk membangun sistem. Kebutuhan sistem meliputi kebutuhan hardware, kebutuhan software dan kebutuhan data. Pada proses pengumpulan data, data penelitian didapatkan di Rumah Sakit Wilujeng Kediri, yang meliputi penyakit Thypoid Fever (TF) dan Dengue Haemorragic Fever (DHF). 4. PERANCANGAN SISTEM Arsitektur perancangan sistem yang akan dibangun seperti Gambar 2 di bawah ini yang Fakultas Ilmu Komputer, Universitas Brawijaya
Pada bab implementasi sistem membahas mengenai implementasi dari perancangan yang sebelumnya dibuat. Implementasi dari sistem ini berupa spesifikasi dari perangkat keras dan lunak, batasan implementasi, implementasi algoritma dan implementasi antarmuka system. Spesifikasi sistem terdiri dari spesifikasi perangkat keras dan spesifikasi perangkat lunak yang digunakan dalam membangun sistem. Sedangkan implementasi antarmuka terdiri dari halaman-halaman dari sistem yang telah dibuat. 5.1 Rule yang terbentuk Berikut adalah rule yang terbentuk dari 160 dataset yang digunakan : 1. IF atribut trombosit=normal AND atribut lidah kotor=berat THEN kategori penyakit Thypoid Fever. 2. IF atribut trombosit=normal AND atribut lidah kotor=tidak ada AND atribut mual muntah=ya THEN kategori penyakit Thypoid Fever. 3. IF atribut trombosit=normal AND atribut lidah kotor=tidak ada AND atribut mual muntah=tidak AND atribut sakit kepala=ya THEN kategori penyakit Thypoid Fever.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
4. IF atribut trombosit=normal AND atribut lidah kotor=tidak ada AND atribut mual muntah=tidak AND atribut sakit kepala=tidak THEN kategori penyakit LAIN. 5. IF atribut trombosit=sedang AND atribut bintik merah=ada THEN kategori penyakit Dengue Haemorragic Fever. 6. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=berat THEN kategori penyakit Thypoid Fever. 7. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=ya AND atribut tidak nafsu makan=ya AND atribut sakit kepala=ya THEN kategori penyakit Thypoid Fever. 8. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=ya AND atribut tidak nafsu makan=ya AND atribut sakit kepala=tidak AND atribut lemas=ya THEN kategori penyakit Thypoid Fever. 9. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=ya AND atribut tidak nafsu makan=ya AND atribut sakit kepala=tidak AND atribut lemas=tidak AND atribut demam=<5 THEN kategori penyakit Thypoid Fever. 10. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=ya AND atribut tidak nafsu makan=ya AND atribut sakit kepala=tidak AND atribut lemas=tidak AND atribut demam= >=6 THEN kategori penyakit Dengue Haemorragic Fever. 11. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=ya AND atribut tidak nafsu makan=tidak AND atribut nyeri ulu hati=ya THEN kategori penyakit Dengue Haemorragic Fever. 12. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=ya AND atribut tidak nafsu makan=tidak AND atribut nyeri ulu
Fakultas Ilmu Komputer, Universitas Brawijaya
13.
14.
15.
16.
17.
18.
19.
20.
1279
hati=tidak THEN kategori penyakit Thypoid Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=tidak AND atribut sakit kepala=ya THEN kategori penyakit Dengue Haemorragic Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=tidak AND atribut sakit kepala=tidak AND atribut nyeri ulu hati=ya AND atribut lemas=ya THEN kategori penyakit Dengue Haemorragic Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=tidak AND atribut sakit kepala=tidak AND atribut nyeri ulu hati=ya AND atribut lemas=tidak THEN kategori penyakit Thypoid Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=ya AND atribut mual muntah=tidak AND atribut sakit kepala=tidak AND atribut nyeri ulu hati=tidak THEN kategori penyakit Thypoid Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=tidak AND atribut tidak nafsu makan=tidak THEN kategori penyakit Thypoid Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=tidak AND atribut tidak nafsu makan=ya AND atribut sakit kepala=ya AND atribut nyeri ulu hati=ya AND atribut lemas=ya AND atribut demam=<5 THEN kategori penyakit Dengue Haemorragic Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=tidak AND atribut tidak nafsu makan=ya AND atribut sakit kepala=ya AND atribut nyeri ulu hati=ya AND atribut lemas=ya AND atribut demam= >=6 THEN kategori penyakit Thypoid Fever. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=tidak AND atribut tidak nafsu makan=ya AND
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
atribut sakit kepala=ya AND atribut nyeri ulu hati=ya AND atribut lemas=tidak THEN kategori penyakit Thypoid Fever. 21. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=tidak AND atribut tidak nafsu makan=ya AND atribut sakit kepala=ya AND atribut nyeri ulu hati=tidak THEN kategori penyakit Thypoid Fever. 22. IF atribut trombosit=sedang AND atribut bintik merah=tidak ada AND atribut lidah kotor=tidak ada AND atribut diare=tidak AND atribut tidak nafsu makan=ya AND atribut sakit kepala=tidak THEN kategori penyakit LAIN. 23. IF atribut trombosit=rendah THEN kategori penyakit Dengue Haemorragic Fever.
2
32
128
88%
3
32
128
94%
4
32
128
97%
5
32
128
RATA-RATA AKURASI
8
6. PENGUJIAN DAN ANALISIS Pada bab pengujian dan analisis membahas mengenai pengujian dan analisa terhadap sistem klasifikasi penyakit penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF) dengan menggunakan metode decision tree C4.5. Pengujian pada sistem ini akan dilakukan dengan menggunakan k-fold cross validation. Dalam pengujian ini dataset dibagi menjadi Kbuah partisi kemudian dilakukan sebanyak Kkali percobaan, dimana disetiap percobaan menggunakan data partisi ke-K sebagai data uji dan sisa data lainnya sebagai data latih.
1280
10
91% 91,875%
1
20
140
85%
2
20
140
90%
3
20
140
90%
4
20
140
90%
5
20
140
95%
6
20
140
100%
7
20
140
80%
8
20
140
95%
RATA-RATA AKURASI
90,625%
1
16
144
69%
2
16
144
94%
3
16
144
88%
4
16
144
94%
5
16
144
94%
6
16
144
94%
7
16
144
100%
8
16
144
94%
9
16
144
81%
10
16
144
94%
RATA-RATA AKURASI
90%
1
10
150
70%
2
10
150
100%
6.1 Hasil pengujian k-fold cross validation
3
10
150
100%
Pengujian sistem ini menggunakan k-fold cross validation, yaitu dengan melakukan uji coba dengan menggunakan 2-fold, 5-fold, 8-fold, 10-fold dan 16-fold Dalam pengujian ini dataset dibagi menjadi K-buah partisi kemudian dilakukan sebanyak K-kali percobaan, dimana disetiap percobaan menggunakan data partisi keK sebagai data uji dan sisa data lainnya sebagai data latih. Hasil pengujian k-fold cross validation dapat dilihat pada Tabel 1 berikut.
4
10
150
100%
5
10
150
80%
6
10
150
100%
7
10
150
90%
8
10
150
90%
9
10
150
100%
10
10
150
90%
11
10
150
100%
12
10
150
100%
13
10
150
80%
14
10
150
70%
15
10
150
90%
16
10
150
100%
Tabel 1. Hasil Pengujian k-fold cross validation KFOLD
2 5
UJI COBA KE-
JUMLAH DATA DATA DATA UJI LATIH
AKURA SI (%)
1
80
80
88%
2
80
80
93%
RATA-RATA AKURASI
90%
1
32
128
91%
Fakultas Ilmu Komputer, Universitas Brawijaya
16
RATA-RATA AKURASI
91,250%
Representasi grafik pada Tabel 1 hasil pengujian k-fold cross validation dapat dilihat
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
pada Gambar 3.
1281
ke-11, ke-12 dan ke-16. Walaupun nilai akurasi 100% yang didapatkan pada pengujian ini jumlahnya ada banyak, rata-rata akurasi pada pengujian 16-fold cross validation ini masih dibawah nilai rata-rata akurasi yang didapat dengan pengujian 5-fold cross validation. Jadi, pengujian yang optimal terjadi ketika menggunakan 5-fold cross validation. 7. KESIMPULAN
Gambar 3. Grafik Pengujian k-fold cross validation 6.2 Analisis hasil pengujian k-fold cross validation Pada pengujian dengan menggunakan kfold cross validation dengan melalukan beberapa kali uji dengan nilai k yang berbeda didapatkan nilai rata-rata akurasi tertinggi pada 5-fold cross validation dengan akurasi sebesar 91,875% yang menggunakan data uji sebanyak 32 data dan data latih sebanyak 128 data. Hasil uji coba ke-4 pada pengujian 5-fold cross validation ini menghasilkan akurasi tertinggi yaitu sebesar 97%. Saat uji coba k-fold cross validation dengan menggunakan data uji dan data latih berjumlah sama yaitu pada percobaan 2-fold cross validation mendapatkan hasil akurasi yang berbeda, karena setiap data latih pada setiap uji coba mempunyai data latih yang berbeda-beda. Untuk analisis dengan uji coba dengan menggunakan 8-fold cross validation pada uji coba ke-2, ke-3 dan ke-4 menghasilkan akurasi sama yaitu sebesar 90%, menghasilkan nilai akurasi sebesar 95% yang sama pada uji coba ke5 dan ke-8 dan menghasilkan akurasi 100% pada uji coba ke-6, uji coba dari 8-fold cross validation ini memakai data uji berjumlah 20 data dan data latih sejumlah 140 data. Analisis untuk pengujian 10-fold cross validation menghasilkan akurasi 100% pada uji coba ke-7, artinya pada uji coba tersebut hasil dari data uji sama dengan data latih, pada pengujian ini menggunakan data latih berjumlah 144 data dan data uji sebanyak 16 data. Sedangkan analisis dengan melakukan pengujian 16-fold cross validation dari data uji sejumlah 10 data dan data latih sejumlah 150 data, didapatkan hasil nilai uji coba sebesar 100% pada uji coba ke-2, ke-3, ke-4, ke-6, ke-9, Fakultas Ilmu Komputer, Universitas Brawijaya
Berdasarkan hasil penelitian tentang klasifikasi penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF) dengan menerapkan algoritma decision tree C4.5 dapat disimpulkan bahwa : 1. Algoritma decision tree C4.5 dapat diterapkan dalam proses klasifikasi penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF) dimana dilakukan beberapa tahapan proses pembentukan decision tree yaitu dengan menghitung nilai entropy dan gain. 2. Akurasi yang diperoleh sistem klasifikasi penyakit Typhoid Fever (TF) dan Dengue Haemorhagic Fever (DHF) dengan dilakukan pengujian k-folds cross validation didapatkan nilai rata-rata akurasi tertinggi pada 5-fold dengan akurasi sebesar 91,875% yang menggunakan data uji sebanyak 32 data dan data latih sebanyak 128 data. Sedangkan analisis dengan melakukan pengujian 16-fold cross validation dari data uji sejumlah 10 data dan data latih sejumlah 150 data, didapatkan hasil nilai uji coba sebesar 100% pada uji coba ke-2, ke-3, ke-4, ke-6, ke-9, ke-11, ke-12 dan ke-16. Walaupun nilai akurasi 100% yang didapatkan pada pengujian ini jumlahnya ada banyak, rata-rata akurasi pada pengujian 16-fold cross validation ini masih dibawah nilai rata-rata akurasi yang didapat dengan pengujian 5-fold cross validation. Jadi, pengujian yang optimal terjadi ketika menggunakan 5-fold cross validation. 8. DAFTAR PUSTAKA Adeyemo, & Adeyeye. (2015). Comparative Study of ID3/C4.5 Desicion Tree and Multiplayer Peceptron Algorithms for the Prediction of Typhoid Fever. African Journal of Computing & ICT : IEEE.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Astuti, O. (2013). Demam Tifoid. Fakultas Kedokteran Universitas Muhammadiyah Surakarta. Bertalya. (2009). Konsep Data Mining : Klasifikasi Pohon Keputusan. Universitas Gunadarma. Depkes. (2015, Januari 8). Demam Berdarah Biasanya Mulai Meningkat di Januari. Diambil kembali dari depkes.go.id: http://www.depkes.go.id/article/view/1 5011700003/demam-berdarahbiasanya-mulai-meningkat-dijanuari.html Harahap, N. (2011). Karakteristik Penderita Demam Typoid Rawat Inap . RSUD Deli Serdang Lubuk Pakam. Hartanto, D., & Hansun, S. (2014). Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa. ISSN 2085-4552. Judarwanto, W. (2009, Februari 19). Demam Yang Dapat Mengancam Jiwa. Diambil kembali dari infodemam.com: https://infodemam.com/2009/02/19/de mam-yang-dapat-mengancam-jiwa/ Purwoko, S. (2005). Pertolongan Pertama Untuk Anak. Jakarta: PT Gramedia Pustaka Utama. Suwondo, A., Asmarajati, D., & Surahman, H. (2013). ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG KORONER. Prosiding Seminar Nasional Teknologi dan Teknopreneur (SNTT). WHO. (1998). Demam Berdarah Dengue, Diagnosis, Pengobatan, Pencegahan dan Pengendalian. Jakarta: EGC. Widodo, J. (2006). Demam Tifoid, Buku Ajar Ilmu Penyakit Dalam. Jakarta: Pusat Penerbitan Departemen Ilmu Penyakit Dalam FKUI. Wihardi, Y. (2013, April 2). K-Fold Cross Validation. Diambil kembali dari http://blog.yayaw.web.id/riset/k-foldscross-validation Yahya, R. C. (2008, Mei 10). jevuska.com. Diambil kembali dari JEVUSKA: Fakultas Ilmu Komputer, Universitas Brawijaya
1282 https://www.jevuska.com/2008/05/10/d emam-tifoid-typhoid-fever/