IMPLEMENTASI ALGORITMA FUZZY K-MEANS PADA DATA REKAM MEDIS BERDASARKAN KODE PENYAKIT INTERNASIONAL (ICD10) Mulya Negara Bachtiar1, Haryanto Hanny2 1 Mahasiswa, 2Dosen Pembimbing Program Studi Teknik Informatika/Fakultas Ilmu Komputer Jl. Nakula I No. 5-11, Semarang, 50131, 024 3517261 Email :
[email protected],
[email protected] ABSTRAK Penelitian ini dilakukan untuk mengolah data rekam medis pada RSUD Kardinah Tegal, dengan adanya data rekam medis yang semakin bertumpuk maka akan mempersulit pada pengambilan informasi, selain itu kebanyakan dokter tidak bisa membaca penyakit pasien secara langsung dengan hanya melihat kode penyakit pasien berdasarkan kode internasional(ICD10). Agar bisa membaca kode penyakit pasien maka akan dilakukan pengelompokan atau pengklasteran terlebih dahulu penyakit pasien berdasarkam kode penyakit internasional. Untuk mencapai tujuan penelitian, maka dipilih 1 atribut yang ada pada data rekam medis. Data rekam medis yang dimaksud terdiri dari atribut diagnosa penyakit berdasarkan International Classification of Diseases-10th (ICD-10). Penelitian ini menggunakan algoritma Fuzzy K-Means dikarenakan dalam data set tersebut mempunyai berbagai macam sub-sub kode penyakit berdasarkan kode penyakit internasional (ICD10). Dengan adanya masalah tersebut maka akan dilakukan penelitian untuk mengambil informasi pengelompokan dan pembentukan klaster mana saja yang masuk kedalam penyakit tertentu berdasarkan kode penyakit internasional (ICD10). Hasil dari pengklasteran tersebut dengan menggunakan Fuzzy K-Means selanjutnya akan dilakukan pengukuran tingkat kesalahan atau Distance Error dari analisis data pasien berdasarkan ICD10. Kata Kunci :
Rekam Medis, Kode Penyakit Internasional (ICD10), Klastering, Fuzzy C-Means
ABSTRACT This research is to process medical record data on RSUD Kardinah Tegal, with medical record data that continuously stacking, make it harder to gather information, furthermore many of doctors canβt read patient directly with only look at patient disease code based on International Code Disease (ICD10). In order to read the patient code disease, grouping or clustering the patient based on international code disease first. to meet the research goal. Then selected one attribute that available on medical record data. medical record data that selected consist of disease diagnose attribute based on International Classification Disease-10th (ICD10). This research using Fuzzy CMeans algorithm because the data set have many disease sub-codes based on International Disease Code(ICD10).Result from the clustering using Fuzzy C-Means, next we need to measure distance error from analysis patient data based on ICD10 Keywords: Medical record, International Code Disease(ICD10), Clustering, Fuzzy K-Means.
1.
PENDAHULUAN
1.1 Latar Belakang
data tapi minim informasi. Data mining sendiri sering disebut sebagai knowledge
Pertumbuhan yang sangat pesat dari
discovery in database (KDD) adalah
akumulasi data telah menciptakan kondisi
kegiatan yang meliputi pengumpulan, 1
pemakaian data historis untuk menemukan
yang akan semakin rumit untuk diolah dan
keteraturan, pola hubungan dalam set data
sulit menghasilkan suatu informasi.
berukuran besar. Salah satu algoritma yang
Dari penelitian ini data yang belum
dikenal dalam data mining yaitu Fuzzy K-
diolah berada pada sub level terendah
Means.
K-Means
sehingga kita belum tahu kode penyakit
(FCM), merupakan salah satu metode
tersebut masuk dalam kelas tertentu yang
clustering yang merupakan bagian dari
ada pada level tertinggi atau super
metode
FCM
kelasnya. Hasil dari penelitian ini dengan
pengelompokan
menggunakan algoritma Fuzzy K-Means
fuzzy sehingga data dapat menjadi anggota
yaitu kita dapat mengetahui kode penyakit
dari semua kelas atau cluster terbentuk
pasien yang diproses akan masuk dalam
dengan derajat atau tingkat keanggotaan
klaster tertentu yang membentuk suatu
yang berbeda antara 0 hingga 1. pertama
informasi
kali adalah menentukan pusat cluster yang
mengasilkan
akan menandai lokasi rata-rata untuk tiap
penyakit pasien pada level tertinggi dan
cluster. Pada kondisi awal, pusat cluster ini
juga dapat mengetahui distance error
masih
algoritma
Pengertian
Hard
menggunakan
belum
Fuzzy
K-Means.
model
akurat.
Tiap-tiap
data
bahwa
data
suatu
tersebut
kesatuan
Fuzzy
akan klaster
K-Mean
pada
memiliki derajat keanggotaan untuk tiap-
pengelompokan data penyakit pasien.
tiap cluster. Dengan cara memperbaiki
1.2 Perumusan Masalah
pusat cluster dan nilai keanggotaan tiap-
Berdasarkan dari latar belakang diatas
tiap data secara berulang, maka dapat
dapat
dilihat bahwa pusat cluster akan menujui
mengimplementasikan algoritma Fuzzy K-
lokasi
Means untuk
yang
tepat.
Perulangan
ini
dirumuskan,
bagaimana
cara
pengelompokan penyakit
didasarkan pada minimasi fungsi obyektif
pasien berdasarkan kode internasional atau
[ 1 ].
yang biasa disebut dalam dunia medis
Penelitian ini menerapkan ilmu data
yaitu
International
Classification
of
mining yaitu pada permasalahan kode
Diseases-10th (ICD-10)
penyakit internasional yang terlalu banyak
cara untuk mengetahui tingkat distance
sehingga sulit untuk dikelompokan sesuai
error algoritma Fuzzy K-Means pada data
dengan kategori penyakit yang semestinya
penyakit pasien.
dan kode penyakit berdasarkan kode
1.3 Batasan Masalah
internasional yang semakin banyak maka akan mengakibatkan penumpukan data
Adapun
dan bagaimana
batasan-batasan
masalah
dalam penelitian ini adalah:
2
1. Kriteria yang digunakan sebagai dasar,
diperoleh
dari
seberapa besarkah tingkat distance error
RSUD
yang dihasilkan dari penerapan Fuzzy K-
Kardinah Tegal Jawa tengah. Yaitu
Means pada data penyakit pasien, apakah
berupa data set
mendapatkan tingkat distance error yang
rekam medis
pasien.
rendah
2. Data mining hanya sebagai alat bantu
untuk
pengelompokan pasien
menentukan kode
penyakit
berdasarkan
kode
internasional.
atau
malah
sebaliknya.
Lalu
mempermudah pihak RSUD Kardinah dalam proses pengelompokan penyakit pasien, khususnya pada bagian rekam medis.
Bagian
rekam
medis
akan
dimudahkan untuk mengolah data yang
3. Metode yang digunakan dalam
tadinya data tersebut diolah secara manual,
proses ini adalah Klastering dan
tidak tertata, dan hanya menghasilkan
menggunakan algoritma Fuzzy K-
informasi terbatas, maka akan di permudah
Means
akan
untuk mengelompokan penyakit pasien
membagi data kedalam klaster
berdasarkan kode internasional yang akan
tertentu
dibuat dengan menggunakan algoritma
yang
dan
nantinya
akan
dilakukan
penghitungan tingkat akurati.
Fuzzy K-Means dan metode Klastering.
4. Software yang digunakan adalah Matlab R2012a.
2. METODE 2.1 Data Mining Data mining adalah proses yang
1.4 Tujuan Penelitian Tujuan dari penelitian berdasarkan
menggunakan teknik statistic, matematika,
rumusan masalah yang telah dijelaskan
kecerdasan buatan, dan machine learning
diatas yaitu apakah metode Klastering
untuk mengekstraksi dan mengidentifikasi
dengan menggunakan algoritman Fuzzy
informasi
K-Means dapat dipakai dalam penerapan
pengetahuan yang terkait dari berbagai
untuk membagi pengelompokan klaster
database besar [2], berikut adalah langkah-
mana saja yang masuk dalam kode
langkah dalam data mining :
penyakit internasional (ICD10) dan untuk mengetahui
distance
pengimplementasian
error
pada
Fuzzy K-Means
pada data penyakit. 1.5 Manfaat Penelitian Manfaat yang akan diperoleh dari penelitian ini adalah untuk mengetahi
yang
bermanfaat
dan
1. pemilihan data (data selection), pemilihan
data
relevan
yang
didapat dari basis data. 2. pembersihan data (data cleaning), proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. 3
3. pengintegrasian
data
(data
untuk tiap-tiap klaster.
Dengan cara
integration), penggabungan data
memperbaiki pusat klaster dan derajat
dari berbagai basisdata ke dalam
keanggotaan tiap-tiap titik data secara
satu basisdata baru
berulang, maka akan dapat dilihat bahwa
4. transformasi data, data diubah atau
pusat klaster akan bergerak menuju lokasi
digabung ke dalam format yang
yang tepat. Perulangan ini didasarkan pada
sesuai untuk diproses dalam data
minimasi
mining.
menggambarkan jarak dari titik data yang
5. data mining, suatu proses di mana metoda
diterapkan
untuk
fungsi
obyektif
yang
diberikan kepusat cluster yang terbobot oleh
derajat
keanggotaan
titik
data
menemukan pengetahuan berharga
tersebut. Langkah-langkah algoritma FCM
dan tersembunyi dari data;
adalah sebagai berikut [3] :
6. evaluasi pola (pattern evaluation),
1. Tentukan :
untuk mengidentifikasi pola-pola
a. Matriks X berukuran n x m,
menarik untuk di representasikan
dengan n = jumlah data yang akan
kedalam knowledge based.
dicluster; dan m = jumlah variabel
7. representasi
pengetahuan
(knowledge
presentation),
b. Jumlah variabel klaster (variabel
penyajian
C) yang akan dibentuk, dimana
visualisasi
dan
pengetahuan
mengenai
yang
digunakan
memperoleh
(kriteria).
teknik
untuk awal mula klaster di-setting
untuk
bernilai lebih besar sama dengan
pengetahuan
yangdiperoleh pengguna. 2.2 Fuzzy K-Means Fuzzy C-Means adalah suatu teknik klasterisasi yang mana keberadaannya
2 (C β₯ 2) c. Tentukan
besar
variabel
pembobot (variabel w), pada fase inisialisasi nilai variabel w diberikan lebih dari 1.
tiap-tiap titik data dalam suatu klaster
d. Jumlah maksimum iterasi.
ditentukan oleh derajat keanggotaan [3].
e. Kriteria
penghentian
yang
Konsep dari Fuzzy C-Means pertama kali
diberikan pada variabel Ξ΅ ( Ξ΅ =
adalah menentukan pusat klaster, yang
nilai positif yang sangat kecil).
akan menandai lokasi rata-rata untuk tiap-
2. Bentuk matriks partisi awal U
tiap klaster. Pada kondisi awal, pusat
(derajat keanggota-an dalam klaster)
klaster ini masih belum akurat. Tiap-tiap
matriks partisi awal biasanya dibuat
titik data memiliki derajat keanggotaan
secara acak. 4
3. Hitung pusat cluster V untuk setiap
antar
anggota
klaster
yang
berbeda.
claster dengan menggunakan rumus
Kategori algoritma klastering yang banyak
dibawah ini :
dikenal adalah Hirarki Klastering.Hirarki
π π π=π(πππ ) πΏππ π π π=π(πππ )
π½ππ =
Klastering adalah salah satu algoritma klastering yang dapat digunakan untuk
4. Setelah mendapatkan Centroid pada
meng-klaster
dokumen
(document
stiap clusternya langkah selanjutnya
klastering). Dari teknik hirarki klastering,
adalah menghitung jarak data ke
dapat dihasilkan suatu kumpulan partisi
Centroid,
yang berurutan, dimana dalam kumpulan
dengan
menggunakan
rumus dibawah ini :
tersebut terdapat [4]: a. Klaster β klaster yang mempunyai
π
(π₯1 β π1 )2
π· π₯1 , π1 =
poin β poin individu. Klaster β
π =1
klaster ini berada di level yang
5. Menghitung nilai keanggotan data untuk
membentuk
paling bawah.
matrix
b. Sebuah klaster yang didalamnya
baru,dengan menggunakan rumus
terdapat poin β poin yang dipunyai
dibawah ini :
semua klaster didalamnya. Single β2
π11
klaster ini berada di level yang
π·(π₯1, π1)π€ β1 π π=1
β2 π· (π₯1, π1)π€ β1
paling atas. β2
=
2.4 ICD10
π·(π₯1, π1)π€ β1 β2 π·(π₯1, π1)π€β1
6. Menghitung objektif,
+
β2 π·(π₯1, π2)π€ β1
nilai dengan
+
β2 π·(π₯1, π3)π€ β1
fungsional menggunakan
π
(π’ππ )π€ π· π₯π , ππ
π½=
terbatas
dari
kategori
kode
subdivisi-subdivisi untuk mengidentifikasi kelompok besar dan sesuatu yang spesifik.
2.3 Klastering teknik
dikelompokkan
nomor
konsep penyakit. Struktur hirarki dengan
2
π=0 π=0
Pada
yang berarti bahwa ICD-10 berisi nomor-
eksklusif yang menggambarkan seluruh
rumus dibawah ini: π
ICD-10 adalah klasifikasi statistik,
klastering
menjadi
akan
klaster-klaster
Tujuan ICD-10 diantaranya adalah untuk mendapatkan
rekaman analisis,
sistematis,
berdasarkan kemiripan satu data dengan
melakukan
interprestasi
dan
yang lain. Prinsip dari klastering adalah
Menyediakan informasi diagnosis dan
memaksimalkan kesamaan antar anggota
tindakan bagi riset, edukasi dan kajian
satu klaster dan meminimumkan kesamaan
assesment kualitas keluaran [5].
5
gambar dibawah ini berupa contoh data
2.5 Metode Pengumpulan Data Sesuai dengan sumber data dan
sample yang diolah :
tujuan penyusunan penelitian ini serta untuk mendapatkan data yag benar-benar akurat
dan
relevan,
maka
dalam
pengumpulan data penulis menggunakan beberapa teknik yaitu teknik Observasi. Penelitian
ini
penulis
menggunakan
observasi pada database pasien RSUD Kardinah Kota Tegal. Observasi langsung digunakan mendapatkan
untuk
mengamati
data-data
yang
atau telah
ditentukan aspek yang akan diobservasi dari data pasien pada bagain rekam medis di RSUD Kardinah. Observasi langsung
Gambar 2.2 Data mentah 2.6 Metedeologi Penelitian Langkah dan aturan penelitian ini ditunjukkan oleh gambar dibawah ini:
juga memungkinkan bagi seorang observer untuk mendapatkan data secara detail atau terperinci sesuai apa yang dibutuhkan. Parameter yang dijadikan acuan yaitu Diagnosa
penyakit
berdasarkan
International Classification of Diseases 10th (ICD-10) (Diagnosis Utama), berikut gambar fied data yang akan diolah.
Gambar 2.1 data yang akan diolah Data diatas akan di pindahkan ke excel dengan ekstensi .xlsx seperti pada
Gambar 2.3 analisis perancangan 6
2.7 Implementasi Penelitian Disini akan dibahas langkah-langkah implementasi dan analisis hasil penelitian data penyakit pasien berdasarkan kode internasional untuk membentuk sebuah klaster penyakit yang lebih tinggi levelnya dengan menggunakan algoritma Fuzzy KMeans. Data yang digunakan pada penelitian ini
adalah
berdasarkan
dataset kode
kode
penyakit
internasional
pada
RSUD Kardinah Kota Tegal. Data yang
Gambar 3.1 hasil fungsional objektif Hasil data yang mentah telah diolah
digunakan dengan jumlah 234 dataset
sehingga
penyakit pasien berdasarkan kode penyakit
dikelompokan
internasional. Untuk menganalisis kode
terbentuk, terlihat seperti pada gambar
penyakit
dibawah ini :
yang
masuk dalam
Klaster
terbentuk sesuai
klaster
dan
klaster
yang
tertentu maka akan digunakan Software Matlab untuk menghasilkan pembentukan
.
Klaster pada data set tersebut. 3.
PEMBAHASAN PENELITIAN
3.1 Hasil dan Analisis Hasil yang didapatkan keseluruhan sebanyak 44 iterasi dari 234 data penyakit berdasarkan kode penyakit internasional yang dikelompokan kedalam 17 klaster dengan hasil perubahan fungsional objektif sebesar 13637927,740369 pada iterasi ke 44 dan data sudah terklaster kedalam klaster yang terbentuk.
Gambar 3.2 hasil klaster terbentuk 3.2 Analisis Pengujian Distance Error Keseluruhan data yang telah diolah dengan dibentuk 17 klaster dari 234 dataset kode penyakit internasional maka dihasilkan
data
kode
penyakit
internasional yang sudah terkelompok atau sudah terklaster seperti pada gambar 2.5. Selanjutnya akan dilakukan penghitungan 7
distance error pada setiap data yang
berdasarkan
dibentuk oleh setiap klasternya. Pengujian
(ICD10).
dilakukan dengan menghitung jarak data pada
setiap
perhitungan
klaster jarak
menggunakan
minkowski
dengan
kode
internasional
2. Didapatkan pengelompokan kode penyakit berdasarkan kode penyakit internasional menggunakan Fuzzy
rumus seperti dibawah ini :
K-Means,
π
πππΎ =
pengelompokan kode penyakit dari
π β ππ | π₯ β π ππ
dengan
susunan
234 dataset sampel yang terbagi Keterangan :
menjadi 17 klaster jenis penyakit
π
πππΎ
= Perhitungan Jarak.
π₯
= Data Asli.
yang tertera seperti pada Gambar
π ππ = Nilai dari Centeroid klaster. Dengan memanfaatkan perhitungan jarak
minkowski
untuk
melakukan
evaluasi pada hasil pengklasteran Fuzzy K-Means
dihasilkan
Distance
Error
sebesar 2,553 dari pengklasteran yang telah diolah pada 234 database kode penyakit
(ICD10)
yang
dibentuk 17
klaster. Dengan hasil distance error yang didapat maka dikatakan bagus dan baik dalam implementasi FCM pada data pengelompokan kode penyakit pasien, dikarenakan jarak
distance error yang
dihasilkan semakin mendekati angka 0. 4.
EVALUASI KESELURUHAN
4.1 Kesimpulan dan Saran
3. Didapatkan hasil tingkat distance error sebesar 2,553. Berarti
hasil
implementasi algoritma FCM pada data kode penyakit berdasarkan kode internasional dikatakan memuaskan karena
distance
error
hampir
mendekati 0, jka tingkat distance error semakin mendekati angka 0 maka error pada pengklasteran data kode penyakit pasien semakin sedikit dan hasilnya baik Tidak lupa pula didapatkan saran untuk mereview hasil dari keseluruhan penelitian ini adalah sebagai berikut: 1. Dapat dilakukan uji coba dengan melakukan modifikasi algoritma
Didapat kesimpulan untuk mereview hasil dari keseluruhan penelitian ini adalah sebagai berikut: 1. Teknik
3.2.
Fuzzy
K-Means
untuk
mendapatkan hasil yang lebih maksimal agar tingkat distance
data
mining
dengan
algoritma Fuzzy K-Means dapat diimplementasikan pengelompokan
pada kode
sistem penyakit
error
semakin
rendah
dan
mendekati angka 0. 2. Penelitian
dapat
dilanjutkan
dengan menggunakan data lain 8
yang
berhubungan
dengan
[6] Talitah Titi Mei, " Pembuatan system
atau
cerdas untuk deteksi dini penyakit
pengklasteran pengelompokan data.
jantung
DAFTAR PUSTAKA
"
Clustering
Berdasarkan
Nilai
menggunakan
algortma Decision Tree dan fuzzy
[1] Idni Irsalina, Endang Supriyati, Tutik Khotimah,
dengan
Clustering," 2010.
Gender
Maksimum
Minimum Amplitudo Suara Berbasis Fuzzy C-Means (FCM)," Prosiding SNATIF, 2014. [2] Dwi Prabantini, Sistem Pendukung dan Sistem Cerdas. Yogyakarta, 2005. [3] Berget Ingunn, Mevik Bjrnhelge, Ns Tormod.
New
Applications
of
Modifications Fuzzy
and
C-means
Methodology, Computational Statistics and Data Analysis, (52) 5, 2008, pp. 2403-2418. [4] Yunus Abdul Halim. (2012, Desember) Zero - Center. [Online]. http://zerofisip.web.unair.ac.id/artikel_detail69819Sistem%20Data%20%28Database%29Hierarchical%20Clustering.html diakses pada tanggal 28 November 2014 [5] Novita Yuliani, "Analisis keakurata Kode diagnosis penyakit Commotion Cerebri pasien rawat inap berdasarkan ICD-10 rekam medis rumah sakit islam Klaten," INFOKES, vol. 1, Februari 2010.
9