PERANCANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK DIAGNOSA PENYAKIT PADA ANAK (Studi Kasus: BPS Amanah)
NASKAH PUBLIKASI
diajukan oleh Nofitriyani 11.11.5428
kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA YOGYAKARTA 2015
PERANCANGAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK DIAGNOSA PENYAKIT PADA ANAK (Studi Kasus: BPS Amanah) Nofitriyani1), Armadyah Amborowati2), 1)
Teknik Informatika STMIK AMIKOM Yogyakarta Dosen Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ringroad Utara, Condongcatur, Depok, Sleman, Yogyakarta Indonesia 55283 2)
1)
Email :
[email protected] ,
[email protected]
Abstract – Susceptible to interference, espcially children. Parents who lack an understanding of health, entrust the matter to experts or specialists who understand more about health. However, sometimes the eperts or specialisthave weaknesses in working hours (of practice) and a limited number of patients that have to wait for the queue. For that the patientmay experience disappointetment, consequently comfort felt by the patient or the doctor himself distracted. Therefore parents need an expert who can facilitate in diagnosing diseases. Because of them that we need a tool that can diagnose diseases such as data mining. With the help of data mining is expected to assist physicians in the treatment of patiens or with data mining also a physician assistant can also help treat patients. The problems that occur are dealt with a casethat is capable of searching for data reinforce the results of the decision and the expected decision technique C4.5 algorithm generated wll be accurate. The results of this study will produce an output that is featuring a selection of the patiens symptoms, types of illness and it s management.
2)
diderita oleh pasien. Dimana, aplikasi ini akan mengimplementasikan Data Mining menggunakan algoritma C4.5. 2. Pembahasan Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data, berupa pengetahuan didalam database yang selama ini tidak diketahui secara manual. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstrasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [1]. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Dengan metode pohon keputusan kita dapat mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan [1]. Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan untuk membagi kumpulan data yang besar menjadi himpunan - himpunan record yang lebih kecil dengan menerapkan serangkain aturan keputusan. Dengan masing - masing rangkaian pembagian, anggota himpunan hasil menjadi mirip satu dengan yang lain [1].
Keywords – data mining, choice of symptoms, type of disease, C4.5 algorithm, BPS 1. Pendahuluan
Pediatri berasal dari bahasa Yunani yaitu pedos yang berarti anak dan iatrica yang berarti pengobatan. Arti bahasa Indonesia yang sebenarnya ialah ilmu pengobatan anak [2].
Perkembangan dunia kesehatan saat ini sangatlah penting, itu karena kesadaran masyarakat akan manfaat kesehatan sudah tinggi sehingga peningkatan jumlah kesehatan setiap tahun mengalami kenaikan. Dengan demikian bukan tidak mungkin dapat menimbulkan masalah bagi setiap anggota medis dalam mendiagnosa dengan baik. BPS Amanah merupakan salah satu contoh Lembaga Bidan Praktek Swasta yang bisa membantu permasalahan kesehatan yang ada di masyarakat. Namun, terkadang terdapat pula kelemahannya seperti jam kerja (praktek) terbatas dan banyaknya pasien sehingga harus menunggu antrian. Selain itu, pihak BPS masih mendiagnosa penyakit pasien secara manual. Oleh karena itu, dibutuhkan sebuah sistem yang dapat membantu mendiagnosa penyakit pasien agar mempermudah para tenaga medis. Dengan itu aplikasi ini akan memnbantu pihak lembaga terkait agar dapat mendiagnosa penyakit yang
2.1 Analisis Penyakit Untuk mengetahui suatu penyakit perlu diketahui dahulu gejala-gejala yang dirasakan. Meskipun hanya dari gejala klinis (langsung) dari situ dokter dapat mengambil suatu kesimpulan berupa penyakit yang diderita. Adapun gejala yang digunakan pada aplikasi ini yaitu, demam, pneunonia, muntah, batuk pilek dan sesak nafas. 2.1.1 Ispa Infeksi saluran pernafasan atas (Ispa) adalah infeksi yang terutama mengenai struktur saluran pernafasan diatas laring, tetapi kebanyakan penyakit ini mngenai bagian saluran atas dan bawah secara berurutan [3].
1
2.1.2 Kulit
n
: jumlah partisi S
Kulit adalah organ tubuh penting paling luar dari manusia yang membatasi lingkungan dalam dan luar tubuh manusia. Fungsinya disamping dipengaruhi oleh kerusakan struktur juga oleh penyakit [4].
pi
:
Selanjutnya, akan diuraikan penjelasan lebih terperinci mengenai tiap-tiap langkah dalam pembentukan pohon keputusan dengan menggunakan algoritma C4.5 deperti dibawah ini.
2.2 Analisa Data Data yang berada di sistem adalah berupa atribut yang dimiliki oleh pasien, nilai atribut dan kemungkinannya. Data yang dimaksud adalah data yang minimal mempunyai dua kolom, yaitu satu kolom sebagai kolom atribut dan satu kolom untuk kolom atribut target. Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut : 1.
Pilih atribut sebagai akar
2.
Buat cabang untuk tiap nilai
3.
Bagi kasus dalam cabang
4.
Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama.
proporsi dari Si terhadap S
Tabel 1 Perhitungan node 1
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut yang ada, aka digunakan rumus :
Dari tabel perhitungan diata, maka diperoleh pohon keputusan seperti pada gambar beikut. Keterangan :
S
: himpunan kasus
A
: atribut
n
: jumlah partisi pada atribut A
|Si|
: jumlah kasus pada partisi ke -i
|S|
: jumlah kasus pada S
Sedangkan sebagai berikut :
untuk perhitungan
Usia
0-1 tahun
6-12 tahun
1-5 tahun
Kulit
Ispa 1.1 Sesak nafas
Ya
entropi
Tidak
Ispa pneumonia
Tidak Ya
Keterangan :
S
: himpunan kasus
A
: fitur
Ispa
Kulit
Gambar 1 Hasil akhir pohon keputusan
2
2.3
Perancangan Basis Data
2.3.1
Entity Relationship Diagram
terstruktur. DFD sering digunakan untuk menggambarkan suatu sistem yang telah ada atau sistem baru yang akan dikembangkan secara logika tanpa mempertimbangkan lingkungan fisik dimana data tersebut mengalir atau disimpan [5].
Entity Relationship Diagram adalah gambar atau diagram yang menunjukkan informasi yang dibuat, disimpan dan digunakan dalam sistem bisnis [5].
id id
id_parent
no_rm atribut usia nilai_atribut
n
1 jenis_kelamin
pasien
pohon keputusan c45
mengetahui
jenis_penyakit
demam
jml_kasus_ispa
pneumonia
jml_kasus_kulit
muntah
proses
n
1
batuk_pilek
id
sesak_nafas
id_parent
jenis_penyakit
lakukan
rule_c45 rule jenis_penyakit
n
n
id jenis_penyakit
id
n
no_rm
n
testing
atribut
rule_penentu_keputusan
mining _c45
nilai_atribut
id_rule_c45 jml_kasus_ispa
keputusan_c45
id
cocok jml_kasus_kulit
id_rule_c45
pohon atribut
entropy
nilai_atribut
inf_gain
Gambar 4 DataFlow Diagram
inf_gain_gain
2.3.4 Gambar 2 Entity Relationship Diagram
2.3.2
2.3.4.1 Flowchart Data Pasien Pada proses algoritma form proses mining akan terjadi penginputan data keputusan yang berasal dari identitas pasien. Pada tahap ini semua proses penginputan data akan dikumpulkan menjadi satu kemudian akan ditentukan hasil keputusannya dengan menggunakan teknik mining algoritma C4.5. Berikut ini adalah gambar Flowchart dari proses data pasien.
Relasi Tabel
testing PK
PK
id no_rm id_rule_c45 keputusan_c45
data_pasien
Flowchart
id no_rm usia jenis_kelamin jenis_penyakit demam pneumonia muntah batuk_pilek sesak_nafas
rule_penentu_keputusan PK
id id_rule_c45 atribut nilai_atribut cocok pohon
PK
pohon_keputusan PK
mining_c45 id atribut nilai_atribut jml_kasus_ispa jml_kasus_kulit proses entropy inf_gain inf_gain_temp
rule_c45 PK
id id_parent rule proses jenis_penyakit
id atribut nilai_atribut id_parent jenis_penyakit jml_kasus_ispa jml_kasus_kulit proses id_rule_c45
Gambar 3 Relasi Tabel
2.3.3
Data Flow Diagram
Data Flow Diagram merupakan alat ayng digunakan pada metodologi pengembangan sistem yang
Gambar 5 Flowchart data pasien
3
2.3.4.2
Flowchart Proses Keputusan
Form keputusan merupakan proses hasil akhir yang dilakukan oleh pengguna untuk memudahkan melihat hasil keputusan berdasarkan masing-masing variabel yang akan diuji satu persatu. Dimulai dari pohon pertama yang ditentukan oleh program dan selanjutnya program akan membuka kemungkinan variabel berikutnya sesuai hasil perhitungan. Setelah terjadi proses tersebut maka hasil akhir akan diperoleh keputusan yang ditentukan program berdasarkan hasil dari perhitungan akhir. Dibawah ini adalah Flowchart dari Form proses keputusan. Gambar 7 Halaman data input pasien Setelah data kasus dimasukkan dalam program, proses selanjutnya adalah dengan melakukan perhitungan menggunakan teknik algortima C4.5 dan akan membentuk pohon keputusan. Pohon keputusan yang dihasilkan dari program adalah sebagai berikut :
Gambar 8 Halaman pohon keputusan Setelah pohon keputusan terbentuk, maka program akan menghasilkan tahapan akhir yaitu jenis penyakit yang diderita oleh pasien. Hasil dari program tersebut adalah sebagai berikut :
Gambar 6 Flowchart proses keputusan
2.4 Implementasi Sistem Implementasi sistem merupakan tahap meletakkan sistem yang dikembangkan setelah melakukan analisis dan rancangan sistem. Tahap implementasi dilakukan ketika sistem telah melalui tahap pengujian, pengujian sistem dilakukan untuk mengetahui apakah program telah bebas dari kesalahan-kesalahan sebelum diterapkan. Dibawah ini adalah tampilan form data pasien, fungsinya untuk menginputkan data kasus pasien, secara manual atau dalam bentuk file *.csv.
Gambar 9 Halaman konsultasi 4
2.5 Pengujian Program Pada pengujian sistem ini akan dilakukan menggunakan Black Box Testing. Pada Black Box Testing ini cara pengujiannya dengan menjalankan atau mengeksekusi unit atau modul, kemudian diamati, apakah hasil dari unit sesuai dengan proses bisnis yang diinginkan.
2.6.1
Screenshot Halaman Konsultasi
Tabel 2 Pengujian Black Box Menu Pengujian input data Pengujian ambil file .csv Pengujian lihat data input Pengujian lakukan mining C45 Pengujian pohon keputusan Pengujian daftar penyakit Pengujian konsultasi Pengujian lain-lain
menu
Pengujian Pengisian data pasien
Hasil Baik
Menyimpan hasil input ke database Menampilkan data masukkan Menampilkan hasil dari proses mining C45 Menampilkan pohon keputusan dan rule Menampilkan daftar penyakit yang termasuk kelompok Ispa dan Kulit Menampilkan hasil diagnosa pasien Menampilkan menu bantuan dan pembuat program
Baik Baik
Gambar 10 Halaman konsultasi
Baik 2.6.2 Baik Baik
Baik Baik
Tabel 3 Pengujian Form Konsultasi
Data masukkan No RM Usia Jenis kelamin Demam Pneumonia Muntah Batuk pilek Sesak nafas
Kasus dan Hasil Pengujian Yang Pengamatan diharapkan Dapat Data yang menampilkan ditampilkan data sesuai sesuai dengan no dengan rm, usia, yang jenis kelamin, gejala dan diderita oleh pasien jenis
Screenshot Data Masukan Pasien
Gambar 11 Data masukan pada Ms. Excel
Berdasarkan hasil perbandingan diatas, nilai yang dihasilkan oleh program memiliki akurasi 90 %, dilihat dari data pada Ms. Excel dengan data yang dimasukkan pada program aplikasi, beserta sreenshot sebagai bukti akurasi. Oleh karena itu, dapat disimpulkan bahwa program ini dapat di implementasikan di lapangan.
Kesimpulan [ ] Diterima [ ] Ditolak
3.
penyakit yang diderita oleh pasien
Kesimpulan
Berdasarkan hasil penelitian dan pembahasan yang telah dilakukan, maka dapat diambil kesimpulan, yaitu : 1. Data Mining dapat digunakan untuk membantu pihak BPS Amanah dalam mendiagnosa penyakit pada anak. Dimana proses diagnosa yang dilakukan berdasarkan pada rule pohon keputusan yang terbentuk sebelumnya.
2.6 Pengecekan Nilai Akurasi Pengecekan nilai akurasi pada program bertujuan untuk mengetahui seberapa siapkah pogram untuk diimplementasikan di lapangan. Pengecekan nilai akurasi dapat dilihat seperti dibawah ini.
5
2. Sistem mampu mengimplementasikan pohon keputusan menggunakan algoritma C4.5 dengan cara menginputkan data kasus pasien yang akan di diagnosa.
Armadyah Amborowati, memperoleh gelar Sarjana Komputer (S.Kom) Jurusan Sistem Informasi STMIK AMIKOM Yogyakarta. Memperoleh gelar Master of Engineering (M.Eng) Program Pasca Sarjana Magister Teknologi Informasi Fakultas Teknik Elektro Universitas Gajah Mada Yogyakarta. Saat ini menjadi Dosen di STMIK AMIKOM Yogyakarta.
3. Hasil penelitian ini merupakan gambaran dalam melihat implementasi dari teknik data mining di lapangan. 4. Data yang dapat diambil hanya file yang berekstensi *.csv (Comma Delimited). Saran Mengingat keterbatasan yang dimiliki oleh penulis, baik pengetahuan, waktu maupun pemikiran, maka penulis dapat memberikan beberapa gambaran sebagai saran yang dapat dipakai sebagai acuan yang akan datang, antara lain : 1. Selama melakukan penelitian ada variabel yang dibutuhkan, namun dari pihak BPS memiliki sedikit data mengenai gejala-gejala yang diderita oleh pasien. 2. Menyempurnakan segala kekurangan program yang belum diketahui oleh penulis, seperti menambahkan variabel data yang dibutuhkan untuk proses diagnosa. 3. Untuk pengembangan sistem sebaiknya data yang ditambahkan ke dalam sistem di update secara berkala untuk menghasilkan data yang lebih akurat dan dibuat tampilan yang lebih baik lagi karena dinilai masih sangat sederhana. Daftar Pustaka [1] Kusrini dan Emha Taufiq Luthfi. 2009. Algoritma Data Mining. Yogyakarta: Andi [2] Gilbert, P. 1986. Penyakit yang Lazim pada Anak-Anak. Jakarta: Arcan [3] Behrman, E Richard dan Victor C. Vaughan. 1988. Ilmu Kesehatan Anak. Jakarta : Buku Kedokteran EGC [4] Akhsin, Zulkoni. 2011. Parasitologi Untuk Keperawatan, Kesehatan Masyarakat dan Teknik Lingkungan. Yogyakarta : Nuha Medika. [5] Al Fatta, Hanif. 2007. Analisis Dan Perancangan Sistem Informasi Yogyakarta: Andi.
Biodata Penulis Nofitriyani, memperoleh gelar Sarjana Komputer (S.Kom), jurusan Teknik Informatika STMIK Amikom Yogyakarta, lulus tahun 2015
6