Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
ANALISA REKAM MEDIS UNTUK MENENTUKAN STATUS GIZI ANAK BALITA MENGGUNAKAN NAIVE BAYES CLASSIFIER Yushintia Pramitarini1), I Ketut Eddy Purnama 2), Mauridhi Hery Purnomo3) 1)Bidang Keahlian Telematika (Konsentrasi CIO), Jurusan Teknik Elektro Institut Teknologi Sepuluh Nopember (ITS) Email:
[email protected] Program Studi Teknik Multimedia Jaringan, Jurusan Teknik Elektro 2,3) Institut Teknologi Sepuluh Nopember (ITS) Surabaya, Indonesia ABSTRAK Makalah ini melakukan pencarian pola status gizi yang sering dialami oleh pasien balita yang mana bisa dideteksi dari informasi yang terkandung dalam kumpulan rekam medis. Rekam medis merupakan informasi identitas dan riwayat berobat oleh pasien pada suatu balai pengobatan (klinik, rumah sakit, ataupun puskesmas). Rekam medis mempunyai informasi yang lengkap dari pasien dan intepretasinya sudah sesuai dengan standar WHO dimana ada status gizi baik, status gizi sedang, status gizi kurang, status gizi lebih dan status gizi buruk. Atribut yang digunakan adalah jenis kelamin, umur, tinggi badan, berat badan, dan tiga buah komorbid (diare, edema, dan pneumonia). Pencarian pola akan dilakukan dengan menerapkan metode klasifikasi dengan algoritma naive bayes dengan jumlah data bersih sebanyak 198 data. Hasil dari penelitian ini adalah mengklasifikasikan data yang ada sesuai dengan intepretasinya. Pengujian dilakukan dengan membagi data sampel yang ada menjadi 70%:30% , 50%:50% dan 30%:70%. Untuk uji validitasnya diperoleh bila prosentase 70:30 maka besar nilai akurasinya 88%, jika prosentasenya 50:50 maka besar nilai akurasinya 55% dan jika presentasi validasinya 30:70 maka besar nilai akurasinya 28% Kata kunci: Rekam Medis, Data Mining, Naive Bayes
PENDAHULUAN Salah satu upaya peningkatan derajat kesehatan adalah perbaikan pada gizi masyarakat. Gizi yang seimbang dapat meningkatkan ketahanan tubuh serta kecerdasan dan menjadikan pertumbuhan yang normal (Depkes RI, 2004). Sebaliknya, gizi yang tidak seimbang bisa menyebabkan kurangnya Energi Protein (KEP), kurang vitamin A (KVA), Gangguan Akibat Kekurangan Yodium (GAKY) dan Anemia Gizi Besi (Depkes RI, 2004 ). Permasalahan kurangnya energi protein (KEP) atau gizi kurang yang sering ditemukan terutama pada anak balita biasa disebut gizi buruk dan merupakan masalah yang sulit ditanggulangi oleh pemerintah. Pada dasarnya penyebab gizi buruk adalah kurangnya intake (konsumsi) makanan terhadap kebutuhan makan seseorang. Keadaan gizi dari seorang pasien anak dapat juga dipengaruhi oleh penyakit yang menyertainya, misalnya seorang pasien balita mengalami penyakit kwasiokor yang mana mengakibatkan si pasien mengalami gizi buruk.Untuk mencatat perkembangan riwayat gizi balita, rumah sakit atau puskesmas dikerjakan oleh petugas yang mencatat segala data terkait dengan perkembangan gizi pada anak. Rumah sakit atau puskemas harus mempunyai tenaga rekam medis (sesuai dengan pendidikannya). Petugas rekam medis tersebut memiliki tugas untuk mencatat segala data terkait ISBN : 978-602-97491-6-8 C-16-1
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
dengan pengobatan ataupun kejadian-kejadian tertentu pada pasien anak di poli anak. Data tersebut digunakan oleh dokter untuk diagnosa penyakit dan landasan untuk memberikan penanganan lebih lanjut sesuai riwayat penyakit yang di derita oleh pasien. Setelah pasien tersebut datang dan mendapat penanganan dari dokter, pasien akan pulang dan kembali ke klinik sesuai dengan jadwal dari dokter dan data tersebut akan menjadi tumpukan berkas di rumah sakit/puskesmas. Kumpulan data status gizi yang ada diklasifikasikan secara manual oleh petugas menjadi 5 kelompok status gizi yaitu gizi buruk, gizi kurang, gizi baik, gizi sedang dan gizi lebih. Hal tersebut membutuhkan waktu yang cukup lama dan tingkat ketelitian yang tinggi. Nutrition Chart dengan standart baku antropometeri WHO-NCHS merupakan acuan dalam menentukan pengklasifikasian status gizi. Dalam pemakaian untuk penilaian status gizi, antropomteri disajikan dalam bentuk indeks yang dikaitkan dengan variabel lain. Variabel yang dikaitkan antara lain umur, berat badan,tinggi badan dan jenis kelamin. Variabel tersebut akan dikaitkan pula dengan penyakit yang diderita oleh si pasien. Dalam penelitian ini diambil tiga penyakit karena frekuensi terbanyak yang sering diderita oleh pasien yaitu diare, edema, dan pneumonia. Untuk melakukan pengklasifikasian status gizi pada anak yang berkaitan dengan penyakit penyertanya, bisa dilakukan dengan menerapkan metode Naive Bayes Classifier (NBC) yang merupakan pendekatan probabilitas untuk menghasilkan klasifikasi. NBC menggunakan gabungan probabilitas kata atau term dengan probabilitas kategori untuk menentukan kemungkinan kategori bagi dokumen yang diberikan. Keunggulan dari NBC adalah bahwa NBC memerlukan sejumlah kecil data pelatihan untuk mengestimasi parameter (rata-rata dan varian dari variabel) yang diperlukan untuk klasifikasi. Karena variabel diasumsikan independen, hanya varian dari variabel-variabel untuk setiap kelas yang perlu ditentukan dan bukan keseluruhan covariance matrix. Tujuan dari penelitian ini adalah menerapkan naive bayes classifier untuk mengklasifikasikan status gizi balita sesuai dengan penyakit yang menyertainya sehingga memberikan informasi yang terkait dengan indeks variabel yang ada. METODE PENELITIAN Pada makalah Analisa Rekam Medis untuk Menentukan Status Gizi Anak Balita Menggunakan Naive Bayes Classifier ini dapat menentukan pola status gizi anak sesuai dengan data yang ada . Pada tahap ini akan diarahkan pada langkah-langkag teknik klasifikasi pada pengelolaan data rekam medis untuk mencari probabilitas atau kemungkinan yang mempunyai tingkat akurasi serta sensitifitas tinggi. Prosedur dalam membuat sebuat sistem yang menggunakan teknik klasifikasi ini terdiri beberapa tahap, antara lain: Pengumpulan Data
Prepocessing (cleaning data)
Klasifikasi Naive Bayes
Pengujian dan Analisa
Gambar 1 Blok Diagram Penelitian ISBN : 978-602-97491-6-8 C-16-2
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
Berdasarkan Gambar 1, tahapan pertama adalah pengumpulan data yang akan diolah kedalam sistem. Setelah data sudah didapat maka akan dilakukan proses berikutnya yaitu preprocessing. Preprocessing merupakan tahap awal pengolahan data sebelum masuk ke proses klasifikasi data. Tujuan dilakukannya tahap ini untuk meningkatkan akurasi data. Data cleaning terdapat proses pembersihan data yang kosong atau data-data lain yang dapat mengakibatkan noise/ error dengan memperkecil adanya data outlier. Data Cleaning menjadi proses yang sangat penting dikarenakan data perlu dibersihkan agar analisa menjadi lebih akurat. Setelah proses pembersihan data telah dilakukan maka selanjutnya akan dilakukan proses klasifikasi. Metode klasifikasi menggunakan algoritma naive bayes. Proses klasifikasi telah dilakukan maka selanjutnya akan dilakukan pengujian dan analisa. HASIL DAN PEMBAHASAN Pada makalah ini akan dilakukan pengujian terhadap sistem yang digunakan untuk melakukan klasifikasi data rekam medis. Data yang dijadikan sebagai training pada metode klasifikasi algoritma naive bayes adalah 200 data. Algoritma Naive Bayes Metode ini berfungsi untuk mencari nilai probabilitas tiap faktor resiko sehingga nantinya hasilnya akan dijadikan perhitungan untuk menentukan apakah resikonya kecil sedang atau besar. Alur metode Naive Bayes pada Proyek Akhir ini sebagai berikut: Baca database 1. Apakah data berupa numerik ? a. Cari nilai mean dan standart deviasi dari masing-masng paameter yang merupakan data numerik. b. Cari nilai probabilitasnya dengan cara menghitung jumlah data yang sesuai dari kategori yang sama dibagi dengan jumlah data pada kategori tersebut 2. Mendapatkan nilai dalam tabel mean, standart deviasi dan probabilitas Untuk lebih jelasnya dapat dilihat pada Gambar 2.
Gambar 2 Alur Algoritma Naive Bayes ISBN : 978-602-97491-6-8 C-16-3
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
Untuk mengolah data input dalam algoritman Naive Bayes harus melakukan perhitungan terhadap database / data training. Tabel 1 diatas adalah contoh probabilitas yang diperoleh dari perhitungan data training yang sudah berupa database, Jika pada tabel 1 probabilitas dijumpai adanya nilai 0, maka hasil tersebut diganti dengan nilai yang sangat kecil (misalnya : 0.0001). Tabel 1 Tabel Probabilitas
Analisa Pengujian kelayanan penggunaan aplikasi ini, menggunakan data sample dari rekam medis laporan pasien tumbuh kembang dalam rumah sakit umum periode juni – oktober 2012. Dari rekam medis terdapat 198 data sample kemudian peneliti membaginya menjadi 2 bagian yaitu data training dan data testing validasi dengan presentase 70% : 30% , 50% : 50%, dan 30% : 70% berdasarkan status gizi. Dari 198 data sampel terdapat status gizi baik sebanyak 88 data sample, status gizi sedang sebanyak 29 data sample, status gizi kurang sebanyak 39 data sample, status gizi lebih sebanyak 5 data sample dan status gizi buruk sebanyak 37 data sample. Sehingga didapat perolehan data training dan data testing pada tabel berikut:
Presentase (%) 70 : 30 50 : 50 30 :70
Tabel 2 Presentase Data Sample untuj Uji Validasi Data Sampel Data Training Data Testing 0 1 2 3 4 0 1 2 3 62 20 27 3 26 26 9 12 2 44 15 20 3 19 44 14 19 2 26 9 12 2 11 62 20 27 3
4 11 18 26
Dari hasil pengujian diketahui bahwa pada saat dilakukan pengujian sampel dengan presentase 70:30 data testing status gizi diperoleh hasil pada Gambar 3.
ISBN : 978-602-97491-6-8 C-16-4
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
Gambar 3 Uji Validasi 70% : 30%
Berdasarkan grafik diatas dapat dijelaskan bahwa dari pengujian dengan perbandingan 70% : 30% diperoleh hasil perhitungan sebagai berikut: 1. Data testing pada status gizi baik sebanyak 26 data dari jumlah keseluruhan data 60 diperoleh keputusan 25 data (41%) yang sesuai dan 1 (2%) data tidak sesuai 2. Data testing pada status gizi sedang yang berjumlah 9 data dari jumlah keseluruhan data 60 diperoleh keputusan 7 data (11%) yang sesuai dan 2 (4%) data yang tidak sesuai 3. Data testing pada status gizi kurang yang berjumlah 12 data dari jumlah keseluruhan data 60 diperoleh keputusan 10 data (16%) yang sesuai dan 2 data (4%) data yang tidak sesuai. 4. Data testing status gizi lebih yang berjumlah 2 data dari jumlah keseluruhan data 60 diperoleh keputusan 2 data (4%) yang sesuai dan 0 (0%) data yang tidak sesuai. 5. Data testing status gizi buruk yang berjumlah 11 data dari jumlah keseluruhan data 60 diperoleh keputusan 10 data (16%) yang sesuai dan 1 (2%) data yang tidak sesuai. Kemudian dilakukan kembali pengujian sampel dengan presentase 50:50 data testing status gizi sehingga diperoleh hasil sebagai berikut:
Gambar 4 Uji Validasi 50% : 50%
Berdasarkan grafik diatas dapat dijelaskan bahwa dari pengujian dengan perbandingan 50% : 50% diperoleh hasil perhitungan sebagai berikut: 1. Data testing pada status gizi baik sebanyak 44 data dari jumlah keseluruhan data 97 diperoleh keputusan 25 data (25%) yang sesuai dan 19 (19%) data tidak sesuai 2. Data testing pada status gizi sedang yang berjumlah 14 data dari jumlah keseluruhan data 97 diperoleh keputusan 8 data (8%) yang sesuai dan 6 (6%) data yang tidak sesuai 3. Data testing pada status gizi kurang yang berjumlah 19 data dari jumlah keseluruhan data 97 diperoleh keputusan 10 data (10%) yang sesuai dan 9 data (9%) data yang tidak sesuai.
ISBN : 978-602-97491-6-8 C-16-5
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
4. Data testing status gizi lebih yang berjumlah 2 data dari jumlah keseluruhan data 97 diperoleh keputusan 2 data (2%) yang sesuai dan 0 (0%) data yang tidak sesuai. 5. Data testing status gizi buruk yang berjumlah 18 data dari jumlah keseluruhan data 97 diperoleh keputusan 10 data (10%) yang sesuai dan 8 (8%) data yang tidak sesuai. Selanjutnya untuk presentase 30:70 diperoleh sebagai berikut:
Gambar 5 Uji Validasi 30% : 70%
Berdasarkan grafik diatas dapat dijelaskan bahwa dari pengujian dengan perbandingan 30% : 70% diperoleh hasil perhitungan sebagai berikut: 1. Data testing pada status gizi baik sebanyak 62 data dari jumlah keseluruhan data 138 diperoleh keputusan 19 data (14%) yang sesuai dan 81 (45%) data tidak sesuai 2. Data testing pada status gizi sedang yang berjumlah 20 data dari jumlah keseluruhan data 138 diperoleh keputusan 6 data (4%) yang sesuai dan 14 (10%) data yang tidak sesuai 3. Data testing pada status gizi kurang yang berjumlah 27 data dari jumlah keseluruhan data 138 diperoleh keputusan 8 data (5%) yang sesuai dan 19 data (13%) data yang tidak sesuai. 4. Data testing status gizi lebih yang berjumlah 3 data dari jumlah keseluruhan data 138 diperoleh keputusan 0 data (0%) yang sesuai dan 3 (2%) data yang tidak sesuai. 5. Data testing status gizi buruk yang berjumlah 26 data dari jumlah keseluruhan data 138 diperoleh keputusan 8 data (5%) yang sesuai dan 18 (12%) data yang tidak sesuai. Dari penjelasan diatas dapat kita analisa bahwa semakin banyak jumlah data training maka akan semakin tinggi nilai validitasnya. Dengan dilakukan pengujian presentase uji data validasi dapat dianalisa bahwa semakin banyak basis kasus data training nilai validitasnya semakin tinggi atau sesuai, sebaliknya semakin sedikit basis kasus/data training nilai validitasnya semakin rendah berdasarkan uji validitas. Untuk nilai keakuratan dapat kita lihat pada tabel berikut. Tabel 3 Nilai Tiap Presentase Validasi Presentase Validasi Nilai Akurasi Nilai Error 70 : 30 88% 12% 50 : 50 55% 42% 30 : 70 28% 82%
ISBN : 978-602-97491-6-8 C-16-6
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
KESIMPULAN DAN SARAN 1. 2.
3.
4.
5.
6.
7.
8.
9.
Hasil dari penelitian yang telah dilakukan dapat diambil beberapa kesimpulan yaitu: Atribut yang digunakan dalam penelitian ini ada 7 yaitu (1) jenis kelamin, (2) umur, (3) tinggi badan, (4) berat badan, (5) komorbid diantaranya diare, edema, dan pneumonia Pengambilan data yang pada bulan juni-oktober 2012 didapatkan 200 data kotor. Setelah dilakukan pembersihan data tidak lengkap dan kemudian melalui proses seleksi data yang dibutuhkan dalam analisa rekam medis, maka didapatkan 198 data bersih atau mempunyai prosentase data sebesar 99% Pengujian kelayanan penggunaan aplikasi ini, menggunakan data sample dari rekam medis laporan pasien tumbuh kembang dalam rumah sakit umum periode juni – oktober 2012. Dari rekam medis terdapat 198 data sample kemudian peneliti membaginya menjadi 2 bagian yaitu data training dan data testing validasi dengan presentase 70% : 30% , 50% : 50%, dan 30% : 70% berdasarkan status gizi. Jika sampel data dibagi menjadi data training 70% dan data testing 30% maka hasil pengujian yang didapat adalah 54 data yang sesuai dan 6 data yang tidak sesuai atau bisa kita prosentasekan 88% untuk data yang sesuai dan 12% data yang tidak sesuai Jika sample data dibagi menjadi data training 50% dan data testing 50% maka hasil pengujian yang diperoleh adalah 55 data yang sesuai dan 42 data yang tidak sesuai atau bisa kita prosentasekan 55% data yang sesuai dan 42% data yang tidak sesuai. Jika sample data dibagi menjadi data training 30% dan data testing 70% maka hasil pengujian yang diperoleh adalah 41 data yang sesuai dan 97 data yang tidak sesuai atau bisa diprosentasekan 28% untuk data yang sesuai dan 82% yang tidak sesuai Nilai akurasi dari tiap-tiap intepretasi untuk presentase validasi 70:30 didapatkan nilai akurasi 88% kemudian presentase validasi 50:50 diperoleh nilai akurasi 55% dan presentase validasi 30:70 didapatkan nilai akurasi 28%. Nilai error yang terjadi pada tiap-tiap intepretasi untuk presentase validasi 70:30 diperoleh nilai sebesar 12% kemudian untuk presentase validasi 50:50 diperoleh nilai 42% dan presentase validasi 30:70 didapatkan nilai error yang besar yaitu 82% Dengan adanya pengujian tersebut dapat disimpulkan bahwa semakin banyak basis kasus data training nilai validitasnya semakin tinggi atau sesuai, sebaliknya jika semakin sedikit data training maka nilai validitasnya semakin rendah.
DAFTAR PUSTAKA Ammar, Shadiq.M. 2010. Keoptimalan Naive Bayes dalam klasifikasi. Universitas Pendidikan Indonesia. Amir Fallahi, Shahram Jafari. 2011. An Expert System for Detection of Breast Cancer Using Data. IJAST Vol 34. Caruana, R. Nicules Mizil. 2006. An Empricial Comparison Of Supervised Learning Algorithms. Cornel University. Dejan Dinevski, Uros Bele, dkk. 2008. Clinical Decision Suport Systems. University of Ljublijana Slovenia. Kurniawan, Edi. 2011. Analisa Rekam Medis untuk Menentukan Pola Kelompok Penyakit Menggunakan Klasifikasi dengan Decission Tree J48. Institut Teknologi Sepuluh Nopember Surabaya. ISBN : 978-602-97491-6-8 C-16-7
Prosiding Seminar Nasional Manajemen Teknologi XVII Program Studi MMT-ITS, Surabaya 2 Februari 2013
Gozali, Ahmad. 2010. Hubungan Antara Status Gizi dengan Klasifikasi Pneumonia. G. Lavanya. 2012. Breast Tumour Detection and Classification using Naive Bayes Classifier Algorithm. International Journal of Emerging trends in Engineering and Development. Vol.3 Jiawei Han and Micheline Kamber, “Data Mining Concepts and Techniques”, Second Edition, 2006 Korb, K.B., Nicholson,AE. 201), Bayesian Artificial Intelligence, CRC Press. Krisno. 2004. Dasar-dasar ilmu gizi. Kurnianti, Ika , et al. 2007 . Sistem Pendukung Keputusan Penanganan Kesehatan Balita menggunakan penalaran fuzzy mamdani. UII. Yogyakarta. Supriarsa, et al. 2001. Penilaian Status Gizi.Jakarta: Penerbit Buku Kedokteran ECG, pp: 37-121. Scoot, Allison. 2007. Bayesian modelling of tuberculosis clustering from DNA fingerprint data. Wahyuni, Tri .A. 2011. Sistem Pendukung Keputusan Untuk Pemilihan Bayi Sehat di RSI Kalimasada Bantul . Yogyakarta. Widardo, 1997. Ilmu Gizi II: Anthropometeri Gizi. Fakultas Kedokteran Universitas Sebelas Maret, Surakarta. BPK, pp: 12-33. William H. Inmon, Building The Data Warehouse 4 th. Edition, Wiley. Publishing,Inc., 2005. World Health Organization. 2009. child growth standards and the indentification of severe acute malnutrition in infants and children. Xu Dezhi. 2011. Rule Based Classification to Detect Malnutrition in Children. IJCSE. Zhang, Harry. 2004. The Optimality of Naive bayes. Universitas of Brunswick, Canada.
ISBN : 978-602-97491-6-8 C-16-8