BAB III BAHAN DAN METODE 3.1. BAHAN Sampel penelitian bersumber dari basis data dalam Sistem Informasi Manajemen Rumah Sakit Pusat Pertamina dan Sistem Informasi Laboratorium Rumah Sakit Pusat Pertamina. Periode pengambilan data dari tanggal 1 oktober 2004 sampai dengan 31 Desember 2005. Data tersebut meliputi: 1. Data pasien yang diduga menderita penyakit diabetes berjumlah 9.919 pasien. Pasien yang dipilih adalah pasien dengan minimal satu kali kunjungannya didiagnosa diabetes, pasien yang melahirkan bayi di atas 4.000 gr, pasien dengan tekanan darah tinggi, pasien dengan berat badan yang termasuk ke dalam kategori obesitas. 2. Data terapi obat serta hasil pemeriksaan laboratorium yang dilakukan pada pasien selama periode 01 Oktober 2004 sampai dengan 31 Desember 2005 baik yang berasal dari rawat jalan maupun rawat inap dikumpulkan. Persyaratan catatan medis yang dijadikan sampel mengacu pada international classification of deseases tenth revision (ICD 10 ) dimana penyakit diabetes melitus diberi kode E.10 Insulin-dependent diabetes mellitus, E.11 Noninsulin -dependent diabetes mellitus, E.12 Malnutrition-related diabetes mellitus, E.13 Other specified diabetes mellitus dan E.14 Unspecified diabetes mellitus. Dari 9.919 pasien yang diduga menderita penyakit diabetes didapat 159.476 record terapi obat dan 211.694 hasil laboratorium. Untuk membentuk data training dan testing, diambil 10 jenis data pemeriksaan hasil laboratorium yang paling banyak dilakukan yaitu Kolesterol Total (CHOL), Trigliserida (TG), Glukosa Urin Puasa (URN), Aseton Urin Puasa (ACTN), Glukosa Darah Puasa (GLUN), Kolesterol HDL (HDL), Kolesterol LDL (LDL), Glukosa Urin 2 jam PP (UPOST), Aseton Urin 2 jam PP (ACTPP). Terdapat 41.958 record hasil pemeriksaan laboratorium yang memenuhi kriteria tersebut.
41
Banyaknya pasien yang mempunyai catatan medis lengkap adalah 1.386 orang. Rata-rata umur ± standar deviasi (SD) dari data tersebut adalah 59.29 ± 10.25 tahun. Dari data tersebut diperoleh rasio laki-laki : perempuan adalah 4 : 6. Karakteristik umum data yang ditambang dapat dilihat pada Tabel 2, sedangkan rata-rata variabel hasil pemeriksaan laboratorium dapat dilihat pada Tabel 3. Tab el 2 Karakteristik umum data pasien Data Diabetes
Sex Laki-laki Perempuan
Bukan Daibetes
Laki-laki Perempuan
Jumlah Baris
Prosentase Setiap Kelas
Umur
±
SD
121
7.37
59.88
±
8.31
60.49
±
8.71
59.20
±
10.69
58.81
±
10.72
283
17.24
469
28.56
769
46.83
Tabel 3 Rata-rata variabel pemeriksaan laboratorium Variabel
Mean
±
SD
Glukosa Darah Puasa (mg/dl) Glukosa Darah 2 jam PP (mg/dl) Glukosa Urin 2 jam PP Aseton Urin Puasa Glukosa Urin Puasa Aseton Urin 2 jam PP Kolesterol LDL (mg/dl) Kolesterol HDL (mg/dl) Kolesterol Total (mg/dl) Trigliserida (mg/dl)
125.33 171.19 0.74 0.03 0.27 0.01 129.37 47.26 207.82 159.40
± ± ± ± ± ± ± ± ± ±
55.59 86.50 1.21 0.23 0.80 0.16 38.66 12.61 45.21 100.58
Sumber data yang digunakan dalam penelitian ini selain dari basis data yang sudah tersedia juga berasal dari isian pertanyaan. Pertanyaan yang diajukan ke pasien terdiri dari pemeriksaan fisik meliputi tinggi badan, berat badan dan tekanan darah, serta riwayat diabetes. Riwayat diabetes meliputi awal diagnosis diabetes ditetapkan, riwayat keluarga diabetes, riwayat merokok, riwayat kehamilan, dan pengobatan diabetes yang dilakukan.
42
3.2. METODE 3.2.1. Kerangka Pemikiran Meningkatnya penderita penyakit diabetes melitus di beberapa negara berkembang, akibat peningkatan kemakmuran di negara bersangkutan, akhir -akhir ini banyak disoroti. Peningkatan pendapatan per kapita dan perubahan gaya hidup terutama di kota-kota besar, menyebabkan peningkatan prevalansi penyakit degeneratif, seperti jantung koroner, hipertensi, hiperlipidemia, diabetes dan lainlain. Menghadapi jumlah pasien diabetes melitus yang semakin meningkat, diperlukan
peningkatan
Penanggulangan
diabetes
peran melitus
semua perlu
tingkat
pelayanan
dilakukan
secara
kesehatan. tepat
dan
berkesinambungan dengan keterlibatan program dan sektor terkait. Atas dasar pemikiran di atas, perlu kiranya dilakukan upaya-upaya penanganan agar dampak negatif penyakit ini dapat diminimalkan, dengan membuat dan menerapkan suatu sistem yang dapat memprediksi timbulnya penyakit diabetes melitus dalam upaya peringatan dini bagi pasien. Sebagai langkah awal maka perlu adanya studi pustaka berkenaan dengan penyakit diabetes melitus untuk lebih mengenal dan memahami permasalahan penyakit ini. Kemudian dilakukan identifikasi dari permasalahan yang akan diteliti untuk memperjelas permasalahan dan penentuan alternatif solusi. Selanjutnya dilakukan pengumpulan data untuk menentukan parameter-parameter yang dapat menyebabkan timbulnya penyakit diabetes melitus. Sumber data yang dikumpulkan pada penelitian nanti barasal dari SIM RSPP dan LIS RSPP. Data tersebut kemudian akan disimpan dalam suatu data warehouse, yang selanjutnya dibuat suatu model menggunakan teknik classification based association untuk mengetahui keterkaitan antara parameter-parameter yang diduga sebagai penyebab timbulnya gejala penyakit diabetes. Gambar 9 menunjukkan garis besar kerangka pemikiran dari penelitian ini.
43
Mulai
Identifikasi Masalah
Pengumpulan Data
Pembuatan Clinical Data Warehouse dengan Star Schema
Pembuatan Model Prediksi Penyakit Diabetes Melitus
Pembuatan Program Aplikasi
Pengujian
Tidak
Sesuai Harapan
Ya Kelayakan Penerapan
Selesai
44
Gambar 11 Kerangka pemikiran pembuatan aplikasi data mining untuk diagnosis penyakit diabetes 3.2.2. Tata Laksana Kegiatan penelitian ini dilakukan dengan dua tahapan utama, yaitu proses pembentukan model klasifikasi dan pembuatan program aplikasi untuk mendeteksi penyakit diabetes. Proses pembentukan model klasifikasi dilakukan berdasarkan urutan proses pada Gambar 12. Proses dimulai dengan pendefinisian masalah serta mempelajari bisnis proses dari sistem yang sedang berjalan. Pada tahap kedua yaitu pembentukan data warehouse diabetes dilakukan melalui dua tahapan yaitu membuat rancangan logik dan rancangan fisik serta melakukan proses Extraction, Transformation, Loading (ETL).
Membuat rancangan logik dan rancangan fisik Pembuatan rancangan logik dilakukan dengan menentukan jenis in formasi yang dibutuhkan. Salah satu tekniknya adalah dengan menggunakan entity relationship modelling. Perancangan fisik dilakukan dengan menggunakan Structure Query Language (SQL). Extraction, Transformation, Loading (ETL) Setelah membuat basis data, langkah selanjutnya adalah melakukan proses Extraction Transformation dan Loading (ETL). Ekstraksi adalah operasi mengekstrak data dari sistem sumber untuk selanjutnya digunakan dalam lingkungan data warehouse. Setelah ekstraksi, data tersebut ditransformasi dan dimuat kedalam data warehouse. Metode ekstraksi yang dipilih adalah full extraction yaitu dengan mengekstrak seluruh data yang ada pada sistem sumber menggunakan export file.
Data Warehouse Diabetes
Visualisasi Ekstraksi
Pendefinisian Masalah
Data Mining
Analisis Hasil
Working database 45
Asimilasi Pengetahuan Gambar 12 Tahapan proses data mining Data mining Metodologi data mining didasarkan pada tiga tahapan yang dilakukan untuk mendeteksi penyakit diabetes. Ketiga tahapan tersebut adalah a) menangani data yang tidak lengkap melalui ekstraksi, b) merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit serta c) rule mining dan klasifikasi. Pada tahap pertama, pemrosesan awal data diabetes dilakukan untuk menghapus data yang tidak
lengkap
dan
mengekstrak
data
yang
akan
digunakan
untuk
mengelompokkan penyakit diabetes atau bukan. Pada tahap kedua setiap data yang bernilai kontinyu didiskritkan.. Hasil dari tahap pertama dan kedua diatas disimpan dalam working database. Pada tahap ketiga, algoritme association rule mining digunakan untuk menghasilkan aturan-aturan, yang berguna untuk mendeteksi penyakit diabetes atau bukan. Merubah Data Kontinyu Menjadi Data Diskrit Data sampel yang digunakan pada penelitian ini mempunyai atribut yang nilainya numerik, sedangkan algoritme CPAR bekerja dengan atribut-atribut yang nilainya nominal. Untuk menggunakan algoritme tersebut atribute yang bernilai numerik tersebut diganti dengan atribute yang bernilai nominal yang menunjukkan interval nilai dengan nilai-nilai diskrit. Proses ini dikenal sebagai diskritisasi dan berisi transformasi dari variabel quantitatif ke dalam variabel kualitatif.
46