BAB III ANALISIS
3.1
Data Understanding Phase Pada penelitian ini, data kasus yang digunakan adalah data pasien liver.
Data ini dikumpulkan dari timur laut bagian Andhra Pradesh, India. Data pasien liver terdiri dari 416 (empat ratus enam belas) pasien pengidap penyakit liver dan 167 (seratus enam puluh tujuh) pasien yang nonliver. Variabel yang terdapat pada data pasien liver tersebut adalah sebagai berikut : 1) Age (Usia) 2) Gender (Jenis Kelamin) 3) Total Bilirubin (Bilirubin Total) 4) Direct Bilirubin (Bilirubin Langsung) 5) Alkaline Phosphatase (ALP) 6) Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase (ALT) 7) Serum Glutamic Oxaloacetic Transaminase (SGOT) / Aspartate Aminotransferase (AST) 8) Total Protein (Protein Total) 9) Albumin 10) Albumin- Globulin Ratio (A/G Rasio) 11) Liver Patient (Yes/No)
Data pasien liver yang diambil dari UCI Machine Learning Repository berupa format comma separated values (CSV) seperti yang digambarkan pada Gambar 3.1 berikut.
III-1
III-2
Gambar 3.1 Data Pasien Liver dalam Format CSV
Data yang didapat tidak disertai keterangan yang menjelaskan maksud secara rinci mengenai maksud dari data, sehingga peneliti harus menganalisis dengan langkah awal melakukan pencarian informasi mengenai liver. Setelah melakukan pencarian tersebut, maka didapat beberapa informasi dan keterangan yang dapat membuat peneliti lebih memahami mengenai data pasien liver tersebut. Variabel-variabel tersebut merupakan komponen yang mempengaruhi seseorang memiliki indikasi menderita penyakit liver. Beberapa atribut merupakan istilah-istilah dalam kedokteran atau kesehatan yang terkait dengan penyakit liver. Untuk keterangan lebih lanjut, pada Tabel 3.1 dijelaskan definisi dari istilahistilah tersebut dari setiap komponen.
Tabel 3.1 Definisi Istilah No 1
Istilah
Definisi
Total Bilirubin
Bilirubin
adalah
produk
utama
dari
(Bilirubin Total)
penguraian sel darah merah yang tua.
III-3
No 2
Istilah
Definisi
Direct Bilirubin
Bilirubin disaring dari darah oleh hati dan
(Bilirubin Langsung)
dikeluarkan
pada
cairan
empedu.
Sebagaimana hati menjadi semakin rusak, bilirubin total akan meningkat. Sebagian dari bilirubin total termetabolisme, dan bagian
ini
langsung.
disebut
Bila
sebagai
bagian
ini
bilirubin meningkat,
penyebab biasanya di luar hati. Bilirubin langsung larut dalam air. 3
Alkaline Phosphatase
enzim yang dibuat oleh hati, tulang, dan
(ALP)
plasenta
dan
biasanya
hadir
dalam
konsentrasi tinggi pada darah tumbuh dan empedu dan dalam konsentrasi rendah pada darah. ALP dilepaskan ke dalam darah dalam jumlah yang meningkat selama kerusakan sel-sel hati dan selama aktivitas normal seperti pertumbuhan tulang dan kehamilan 4
Serum
Glutamic Pyruvic Enzim yang diproduksi di hati ketika
Transaminase
(SGPT)
/ membran sel-sel hati rusak. Biasanya hadir
Alanin
Aminotransferase di sel-sel hati dan jantung. SGPT dilepaskan
(ALT)
ke dalam darah ketika hati atau jantung rusak. Tingkat ALT diukur untuk membantu menilai
tingkat
menentukan
kerusakan
seberapa
baik
hati
dan
pengobatan
bekerja. 5
Serum Glutamic
Enzim yang diproduksi di dalam hati.
Oxaloacetic Transaminase
Ketika sel-sel hati yang rusak, AST
(SGOT)
/
Aspartate dilepaskan . Peningkatan kadar AST dapat
III-4
No
Istilah
Definisi
Aminotransferase (AST)
mengindikasikan penyakit hati, tetapi juga terlihat pada orang dengan kerusakan otot.
6
Total Protein
Protein total terdiri atas albumin (60%) dan
(Protein Total)
globulin (40%). Penurunan angka protein total dapat menggambarkan kerusakan hati, kerusakan ginjal atau kerusakan dimana protein tidak dicerna sepenuhnya
7
Albumin
Protein darah yang diproduksi oleh hati dan berperan dalam mempertahankan volume darah normal. Tingkat albumin yang rendah dikaitkan dengan sirosis hati.
8
Albumin-Globulin (A/G Rasio)
Ratio Perbandingan albumin dengan globulin yang merupakan konstituen utama protein yang ditemukan dalam darah. Rasio yang abnormal terlihat ketika kadar albumin atau globulin meningkat atau menurun. Rasio abnormal terlihat pada berbagai gangguan, termasuk penyakit ginjal dan hati.
Batas normal setiap komponen-komponen yang terkait liver tersebut ditentukan oleh nilai laboratorium normal. Setiap laboratorium dalam menentukan nilai normal tergantung pada alat yang dipakai dan cara pemakaiannya. Saat peneliti mengambil data pasien liver tersebut tidak ada keterangan mengenai nilai laboratorium normal yang dipakai sebagai acuan untuk data tersebut, maka itu peneliti menentukan untuk mengambil salah satu nilai laboratorium normal yang diambil dari Paramount Health Service, yaitu sebuah organisasi pelayanan kesehatan di India yang menyediakan pelayanan inovatif terhadap kebutuhan kesehatan. Pada Tabel 3.2 menjelaskan nilai laboratorium normal pada nilai tes laboratorium Paramount Health Service :
III-5
Tabel 3.2 Nilai Laboratorium Normal Paramount Health Service No 1
Nilai
Komponen
Normal
Total Bilirubin (Bilirubin Total)
0.2 – 1.0
Satuan mg/dL (milligram per deciliter)
2
Direct Bilirubin
0.1 – 1.0
(Bilirubin Langsung 3
mg/dL (milligram per deciliter)
Alkaline Phosphatase (ALP)
20 – 70
u/L (unit per liters)
4
Serum
Glutamic
Pyruvic
10 – 40
Transaminase (SGPT) / Alanin
u/L (unit per liters)
Aminotransferase (ALT) 5
Serum
Glutamic
Oxaloacetic
0 – 41
Transaminase (SGOT) / Aspartate
u/L (unit per liters)
Aminotransferase (AST) 6
Total Protein (Protein Total)
6–8
g/dL (gram per deciliter)
7
Albumin
3.8 – 5.0
g/dL (gram per deciliter)
8
Albumin- Globulin Ratio (A/G Rasio)
3.2
>1
g/dL (gram per deciliter)
Data Preparation Phase Pada fase pengolahan data ditentukan kasus dan variabel yang akan
dianalisis. Dari data pasien liver ini, kolom yang diambil sebagai variabel keputusannya adalah kolom Liver Patient, sedangkan kolom yang diambil sebagai variabel penentu dalam pembentukan pohon keputusan adalah kolom : 1) Age (Usia) 2) Gender (Jenis Kelamin) 3) Total Bilirubin (Bilirubin Total) 4) Direct Bilirubin (Bilirubin Langsung)
III-6
5) Alkaline Phosphatase (ALP) 6) Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase (ALT) 7) Serum Glutamic Oxaloacetic Transaminase (SGOT) / Aspartate Aminotransferase (AST) 8) Total Protein (Protein Total) 9) Albumin
Tidak semua variabel dipilih dalam pembentukan pohon keputusan. Variabel Albumin/Globulin Ratio tidak dilibatkan karena sudah terwakili oleh Albumin. Berdasarkan variabel yang sudah dipilih, maka format data menjadi seperti pada Gambar 3.2.
Gambar 3.2 Format Baru Data Pasien Liver
Setelah ditemukan format data pasien liver yang baru, peneliti melakukan praproses dengan 2 (dua) cara sebagai berikut :
III-7
3.2.1
Praproses Menggunakan Rumus GINI Rumus GINI digunakan untuk menentukan klasifikasi atribut yang bernilai
kontinyu. Tahap-tahap praproses menggunakan rumus GINI adalah sebagai berikut : 1) Mengurutkan nilai-nilai pada atribut 2) Menghitung rata-rata dari setiap nilai yang bersebelahan setelah diurutkan 3) Menghitung GINI untuk semua nilai rata-rata 4) Nilai GINI paling kecil menjadi split untuk atribut tersebut 3.2.2
Praproses Pengklasifikasian Berdasarkan Referensi Kesehatan Peneliti menggunakan referensi kesehatan dari World Health Organization
(WHO) untuk pengelompokkan usia dan nilai laboratorium normal Paramount Health Service (PHS) untuk mengklasifikasi atribut yang lain pada data pasien liver. Berikut adalah pengelompokkan atribut-atribut yang perlu diklasifikasikan sebelum proses data : 1) Mengelompokkan age Pengelompokkan age dilakukan dengan memasukkan usia pasien dalam range seperti pada Tabel 3.3. Klasifikasi age berdasarkan pembagian umur menurut WHO (World Health Organization).
Tabel 3.3 Klasifikasi Age Klasifikasi
Age (Tahun) Batas Bawah
Child Young - Adult
Batas Atas
<=14 15
Old
49 >=50
2) Mengelompokkan nilai total bilirubin Pengelompokkan total bilirubin dilakukan dengan memasukkan nilai bilirubin total dalam range seperti pada Tabel 3.4.
III-8
Tabel 3.4 Klasifikasi Total Bilirubin Klasifikasi
Total Bilirubin (mg/dL) Batas Bawah
1
Batas Atas
<= 1.0
2
1.1
2.0
3
2.1
3.0
4
3.1
9.0
5
> 9.0
3) Mengelompokkan nilai direct bilirubin Pengelompokkan direct bilirubin dilakukan dengan memasukkan nilai bilirubin langsung dalam range seperti pada Tabel 3.5. Tabel 3.5 Klasifikasi Direct Bilirubin Klasifikasi
Direct Bilirubin(mg/dL) Batas Bawah
1
Batas Atas
<= 1.0
2
1.1
2.0
3
2.1
5.0
4
> 5.0
4) Mengelompokkan nilai alkaline phosphatase/ALP Pengelompokkan ALP dilakukan dengan memasukkan nilai ALP dalam range seperti pada Tabel 3.6. Tabel 3.6 Klasifikasi Alkaline Phosphatase/ ALP Klasifikasi
Alkaline Phosphatase (u/L) Batas Bawah
1
Batas Atas
<= 140
2
141
210
3
211
280
4
281
420
5
> 420
III-9
5) Mengelompokkan nilai SGPT/ALT Pengelompokkan SGPT/ALT dilakukan dengan memasukkan nilai SGPT/ ALT dalam range seperti pada Tabel 3.7.
Tabel 3.7 Klasifikasi SGPT/ ALT Klasifikasi
SGPT/ALT (u/L) Batas Bawah
1
Batas Atas
<= 40
2
41
80
3
81
120
4
121
200
5
> 200
6) Mengelompokkan nilai SGOT/AST Pengelompokkan SGOT/AST dilakukan dengan memasukkan nilai SGOT/ AST dalam range seperti pada Tabel 3.8.
Tabel 3.8 Klasifikasi SGOT/AST Klasifikasi
SGOT/AST (u/L) Batas Bawah
1
Batas Atas
<=41
2
42
82
3
83
164
4
> 164
7) Mengelompokkan nilai total protein Pengelompokkan total protein dilakukan dengan memasukkan nilai protein total dalam range seperti pada Tabel 3.9.
III-10
Tabel 3.9 Klasifikasi Total Protein Klasifikasi
Total Protein (g/dL) Batas Bawah
1
Batas Atas
>= 6.0
2
5.0
3
5.9 < 5.0
8) Mengelompokkan nilai albumin Pengelompokkan albumin dilakukan dengan memasukkan nilai albumin dalam range seperti pada Tabel 3.10.
Tabel 3.10 Klasifikasi Albumin Albumin (g/dL)
Klasifikasi
Batas Bawah
Batas Atas
1
3.8
6.0
2
3.0
3.7
3
2.0
2.9
4
0.0
1.9
9) Menerjemahkan nilai liver patient Penerjemahan liver patient dilakukan dengan mengganti nilai liver patient dengan nilai seperti pada Tabel 3.11.
Tabel 3.11 Penerjemahan Liver Patient Liver Patient
Nilai Baru
1
Yes
2
No