Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2016, pp. 303~307 303
Kajian Penerapan Radial Base Function (RBF) Dalam Mendeteksi Penyakit Tuberculosis (Tb) Derry Wiliandani AMIK BSI Karawang e-mail:
[email protected] Abstract Nowadays in the world of health, the diagnosis of disease becomes a very difficult thing to do. However, medical records have stored symptoms of the patient's illness and the diagnosis of the illness. This kind of thing is very useful for health experts. Tuberculosis is one of the top ten diseases in Indonesia that can claim human life. The purpose of this study is to optimize the Radial Basis Function (RBF) neural network algorithm to improve accuracy in the prediction of tuberculosis. This study was made to predict Tuberculosis disease using Radial Basis Function (RBF) algorithm. To measure the accuracy level of the algorithm is used Counfusion Matrix testing method and ROC curve. Keywords: Radial Base Function, Tuberculosis
1. Pendahuluan Dewasa ini dalam dunia kesehatan, diagnosis penyakit menjadi hal yang sangat sulit dilakukan. Namun demikian catatan rekam medis telah menyimpan gejala-gejala penyakit pasien dan diagnosis penyakitnya. Hal seperti ini tentu sangat berguna bagi para ahli kesehatan. Mereka dapat menggunakan catatan rekam medis yang sudah ada sebagai bantuan untuk mengambil keputusan tentang diagnosis penyakit pasien. (Prasetyo, 2012). Penyakit Tuberculosis merupakan salah satu sepuluh penyakit terbesar di Indonesia yang bisa merenggut nyawa manusia. Berdasarkan hal tersebut untuk meningkatkan upaya menurunkan angka kesakitan dan revalensi timbulnya komplikasi pada penyakit Tuberculosis maka perlu kiranya dilakukan penelitian-penelitian yang mengarah pada pembuatan sistem yang dapat mendeteksi timbulnya penyakit Tuberculosis sehingga dapat dilakukan upaya prefentif serta upaya rehabilitatif bagi penderita Tuberculosis dengan pendekatan yang menyeluruh, sehingga dampak terjadinya berbagai penyakit menahun, seperti penyakit Tuberculosis. Informasi yang dihasilkan untuk selanjutnya bisa digunakan oleh edukator Tuberculosis maupun dokter sebagai dasar untuk melakukan tindakan tindakan yang diperlukan. 2. Metode Penelitian Menurut (Kothari, 2004) Jenis penelitian eksperimen adalah metode yang menguji kebenaran sebuah hipotesis dengan statistik
dan menghubungkan dengan masalah penelitian. Jenis penelitian eksperimen dibagi dua, yaitu eksperimen absolut dan eksperimen komparatif. Eksperimen absolut mengarah kepada dampak yang dihasilkan dari eksperimen, misalnya pengaruh honor dosen terhadap kinerja. Sedangkan eksperimen komparatif yaitu membandingkan dua objek yang berbeda, misalnya membandingkan dua algoritma yang berbeda dengan melihat hasil statistik masing-masing yang mana lebih baik (Kothari, 2004). Penelitian yang penulis ambil untuk penelitian ini adalah Eksperimen Komparatif. Tujuan dari penelitian ini untuk melakukan evaluasi model neural network menggunakan Radial Basis Function (RBF) untuk mengetahui algoritma dalam memprediksi penyakit tuberculosis.. Sedangkan teknik pengumpulan data dilakukan dengan beberapa cara, antara lain: 1. Observasi Penulis mengumpulkan data yang diperlukan dengan cara meninjau langsung ke perusahaan . 2. Wawancara Dengan metode ini penulis melakukan wawancara kepada Staff Finance dengan mengajukan pertanyaan yang berhubungan dengan proses pencatatan dan pelaporan PPh 21 pada perusahaan. 3. Studi Pustaka Dalam hal ini penulis selain observasi dan wawancara juga mengumpulkan data dengan mencari bahan referensi dari buku,
Diterima 24 Februari, 2016; Revisi 02 Maret, 2016; Disetujui 15 Maret, 2016
ISBN: 978-602-61242-4-1
makalah, dan website. 3. Pembahasan Tabel 1 Atribute, tipe, ukuran dan nilai Atribut No
Atribut
Tipe
Ukuran
Nilai Atribut
1
Nomor Registrasi
Numeric
Scale
Angka
2
Lama Batuk
Numeric
Scale
1-10
3
Jenis Batuk
Numeric
Scale
1-10
4
Keringat Malam
Numeric
Scale
1-10
5
Lemas
Numeric
Scale
1-10
6
Sesak Nafas
Numeric
Scale
1-10
7
Sakit Dinding Dada
Numeric
Scale
1-10
8
Demam
Numeric
Scale
1-10
9
Hilang Nafsu Makan
Numeric
Scale
1-10
10
Berat Badan Menurun
Numeric
Scale
1-10
11
Output
Numeric
Nominal
1
:
Terinfeksi 0 : Tidak Terinfeksi
Data hasil pemeriksaan dapat dilihat pada tabel 2 berikut : Tabel 2. Data hasil pemeriksaan penyakit tuberculosis Hilan Nomor NO
Registras i
Jenis Lama Batuk
Batu k
Sakit Keringat
Lema
Sesak
Malam
s
Nafas
Dindin g Dada
Dema m
g
Berat
Nafsu
Badan
Maka
Menurun
Output
n 1
000826
5
1
1
1
2
1
3
1
1
0
2
000827
5
4
4
5
7
10
3
2
1
0
3
000828
3
1
1
1
2
2
3
1
1
0
4
000829
6
8
8
1
3
4
3
7
1
0
5
000830
4
1
1
3
2
1
3
1
1
0
6
000831
8
10
10
8
7
10
9
7
1
1
7
000832
1
1
1
1
2
10
3
1
1
0
8
000833
2
1
2
1
2
1
3
1
1
0
9
000834
2
1
1
1
2
1
1
1
5
0
10
000835
4
2
1
1
2
1
2
1
1
0
11
000836
1
1
1
1
1
1
3
1
1
0
12
000837
2
1
1
1
2
1
2
1
1
0
13
000838
5
3
3
3
2
3
4
4
1
1
14
000839
1
1
1
1
2
3
3
1
1
0
15
000840
8
7
5
10
7
9
5
5
4
1
KNiST, 30 Maret 2016 304
ISBN: 978-602-61242-4-1
Berdasarkan tabel 2, data yang di peroleh untuk penelitian ini sebanyak 500 record hasil pemeriksaan penyakit tuberculosis, baik data yang bermasalah maupun data yang tidak bermasalah. Untuk mendapatkan data yang berkualitas diperlukan teknik dalam preprosessing (Han & Kamber, 2006), yaitu: 1. Data Cleaning Data cleaning bekerja untuk membersihkan nilai yang kosong, tidak konsisten atau mungkin tuple yang kosong (missing values dan noisy). 2. Data Integration Data Integration berfungsi menyatukan tempat penyimpanan (arsip) yang berbeda ke dalam satu data. 3. Data Reduction Jumlah atribut dan tuple yang digunakan untuk data training mungkin terlalu besar, hanya beberapa atribut yang diperlukan sehingga atribut yang tidak diperlukan akan dihapus. Tuple dalam data set mungkin terjadi duplikasi atau terdapat tuple yang sama, sehingga untuk memprediksi jumlah tuple, tuple yang sama dijadikan dalam satu tuple untuk mewakili tuple tersebut. Berdasarkan data yang diperoleh, tidak perlu lagi dilakukan data integration, hal ini disebabkan karena tempat penyimpanan (arsip) yang digunakan hanya bersumber dari satu tempat penyimpanan (arsip) saja, sehingga tidak diperlukan adanya proses penyatuan tempat penyimpanan (arsip). Sedangkan proses data cleaning dan data reduction perlu dilakukan. Hal ini disebabkan karena dalam data yang diperoleh masih terdapat kemungkinan adanya data yang bernilai kosong, tidak konsisten atau mungkin tuple yang kosong (missing values dan noisy) serta adanya kemungkinan terjadi duplikasi atau terdapat tuple yang sama. a. Data Cleaning (Menghilangkan Missing Value) b. Dalam data, terdapat 1 missing value, seperti terlihat pada tabel 3 berikut : Tabel 3. Data Missing Value
Dari tabel 4 di atas, terlihat bahwa pada atribut Sakit Dinding Dada terdapat 1 record atau 3 persen data yang memiliki missing value. Pengolahan Awal Data 1. Pembentukan Sumber Data Random (Set the Random Seed) Ditentukan inisiasi pembangkit aktif (active generator initialization), yaitu nilai awal (starting point) berupa nilai tetap (fixed value): 9191972.
Gambar 1. Pemilahan data untuk Training Sampel dan Holdout sample Setelah semua langkah yang dibutuhkan untuk analisa telah dilakukan, maka terlihat hasil prediksi berdasarkan data training sebagai berikut :
Berdasarkan data diatas, maka didapatkan hasil identifikasi seperti terlihat pada tabel 4 berikut:
Tabel 4. Statistik Missing Value
Gambar 2. Hasil Prediksi Data Training RBF
KNiST, 30 Maret 2016 305
ISBN: 978-602-61242-4-1
Gambar 3.Network Diagram RBF Training Diagram network yang terbentuk terdiri dari 10 input / predictors (tidak termasuk bias), 4 Hidden layer (tidak termasuk bias) dan 2 output (bernilai 0 dan 1).Setelah melampaui beberapa tahapan lanjutan, berikut ini gambaran dari hasil network testing:
4. Simpulan Penelitian ini dibuat untuk memprediksi penyakit Tuberculosis menggunakan algoritma Radial Basis Function (RBF) untuk mengetahui akurasi dalam mendeteksi penyakit. Untuk mengukur tingkat akurasi tersebut digunakan metode pengujian Counfusion Matrix dan Kurva ROC. Berdasarkan pengukuran tingkat akurasi algoritma tersebut, diketahui bahwa algoritma RBF memiliki tingkat akurasi yang lebih tinggi. Dengan demikian, algoritma RBF dapat digunakan untuk prediksi penyakit Tuberculosis. 5. Referensi Bramer, M. (2007). Principles of Data Mining. London: Springer. Eldin, Ahmed. (2011). A Data Mining Approach for the Prediction of Hepatitis C Virus protease Cleavage Sites. Cairo : International Journal of Advanced
KNiST, 30 Maret 2016 306
ISBN: 978-602-61242-4-1
Computer Science and Applications Vol 2 No.12. Gorunescu, Florin. (2011). Data Mining: Concepts and Techniques. Verlag berlin Heidelberg: Springer Han, J., & Kamber, M. (2007). Data Mining Concepts and Techniques. San Fransisco: Mofgan Kaufan Publisher. Karlik. (2011). Hepatitis Disease Diagnosis Using Backpropagation and the Naive Bayes Classifiers. Turkey : Journal of Science and Technology Vol. 1 No. 1. Kumar, D. Senthil & Sathyadevi, G & Sivanesh, S. (2011). Decision Support System for Medical Diagnosis Using Data Mining. India : International Journal of Computer Science Issues, Vol 8, Issue 3, No. 1. Kumar, Varun & Sharathi, Vijay & Devi, Gayathri (2012). Hepatitis Prediction Model based on Data Mining Algorithm and Optimal Feature Selection to Improve Predictive Accuracy. Vellore : International Journal of Computer Applications (0975-8887) Volume 51 No. 19. Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta: Andi Publishing. Larose, D. T. (2005). Discovering Knowledge in Databases. New Jersey: John Willey & Sons Inc. Liao. (2007). Recent Advances in Data Mining of Enterprise Data: Algorithms and Application . Singapore: World Scientific Publishing. Myatt, Glenn J. (2007). Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data Mining. New Jersey:
John Wiley & Sons, Inc. Ozyilmaz, Lale & Yildirim, Tulay. (2003). Artificial Neural Network for Diagnosis of Hepatitis Disease. Riduwan. (2008). Metode dan Teknik Menyusun Tesis. Bandung: Alfabeta. Santosa, B. (2007). Data Mining Teknik Pemanfaat Data Untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu. Shukla, A., Tiwari, R., & Kala, R. (2010). Real Life Application of Soft Computing. Taylor and Francis Groups, LLC. UCI (Universitas California, Invene) Machine Learning Repository dengan alamat website http://archive.ics.uci.edu/ml/machinelearning-databases/hepatitis/ UCI (Universitas California, Invene) Machine Learning Repository dengan alamat website http://archive.ics.uci.edu/ml/machinelearning-databases/00225/ Vercellis, C. (2009). Business Intelligent: Data Mining and Optimization for Decision Making. Southern Gate: John Willey & Sons Inc. Witten, H. I., Eibe, F., & Hall, A. M. (2011). Data Mining Machine Learning Tools and Techiques. Burlington: Morgan Kaufmann Publisher. Wu, X., & Kumar, V. (2009). The Top Ten Algorithms in Data Mining. Boca Raton: CRC Press.
KNiST, 30 Maret 2016 307