BAB III METODE PENELITIAN 3.1 Desain Penelitian Desain penelitian yang dikembangkan dalam pengembangan sistem keputusan jantung ini adalah sebagai berikut. Data Pelatihan
Studi Literatur
Data
Data testing
Proses Fuzzy Decision Tree
Menentukan Table atribut
Menentukan Table MF Pembentuk nilai MF Menentukan nilai Mf Mencari nilai fuzzy entropy Mencari dan menentukan nilai information gain
FDT
Tahapan testing Data sample
Data testing
Menentukan Grafik
Array pembentuk grafik
Tahap Kesimpulan
Rule inferensi
Simulasi program
Menentukan kembali Tabel MF
Keputusan
Gambar 3.1 Desain Penelitian 32
33
Penjelasan gambar: 1. Tahap data penelitian a. Studi literatur dilakukan dengan mempelajari dan memahami teoriteori yang digunakan, yaitu mencari gejala-gejala atau faktor-faktor yang menjadi gejala penyakit jantung, teori Fuzzy Decision Tree, algoritma FID3 dan perhitungan mencari Fuzzy Entrophy dan Information Gain. b. Pengumpulan data-data mengenai gejala yang diderita oleh pasien. Data yang digunakan diperoleh dari http://archive.ics.uci.edu 2. Tahap pemrosesan Fuzzy Decision Tree a. Menentukan nilai Fuzzy Membership Function. b.
Setelah didapat nilai fuzzy decision tree maka langkah selanjutnya yaitu mencari dan menentukan nilai Fuzzy Entrophy yang nantinya akan dijadikan dalam pencarian nilai information gain
c. Setelah menentukan nilai Fuzzy Entrophy maka dicarilah nilai Information Gain dari setiap atribut. Nilai information gain inilah yang akan digunakan untuk merepresentasikan masalah, pencarian nilai yang terbesar yang akan dijadikan sebagai node. Penjelasan algoritma terdapat pada sub bab 3.3 d. Setelah mendapatkan nilai information gain, maka pemrosesan dalam pengembangan sistem untuk keputusan jantung mulai bisa terlihat karena mulai membentuk suatu grafik keputusan
34
e. Algoritma FID3 dimodifikasi atau disesuaikan dengan kebutuhan pencarian resiko terhadap penderita penyakit jantung. Penjelasan algoritma terdapat pada sub bab 2.5 3. Tahap kesimpulan Pada tahap kesimpulan dapat dilihat dan diambil sebagai keputusan untuk data testing dari grafik yang telah didapat. 4. Tahap testing a. Sistem Pendukung Keputusan Penyakit Jantung merupakan nama perangkat lunak yang dikembangkan. b. Metode pendekatan perangkat lunak yang digunakan dalam penelitian ini adalah pendekatan terstruktur dengan model proses sekuensial linier. Pendekatan terstruktur lebih menekankan pada aliran data. Model
sekuensial
linier
mengusulkan
sebuah
pendekatan
pengembangan perangkat lunak yang sistematik dan sekuensial mulai dari system level dan terus maju ke analisis, desain, implementasi, pengujian, dan pemeliharaan (Pressman, 2001: 28).
Gambar 3.2 Model Perangkat Lunak Model sekuensial linier memiliki beberapa aktivitas, yaitu sebagai berikut. a. Analisis Pada tahap ini dilakukan analisis terhadap kebutuhan sistem (fungsional dan non fungsional), kebutuhan pengguna, kebutuhan informasi, dan
35
kebutuhan antarmuka eksternal. Untuk memodelkan sistem, pada tahap analisis ini digunakan Context Diagram, Data Flow Diagram (DFD), kamus
data
(data
dictionary),
dan
spesifikasi
proses
(process
specification). b. Desain Tahap desain berfungsi untuk mengtranslasikan spesifikasi kebutuhan perangkat lunak dari tahap analisis, menjelaskan bagaimana perangkat lunak dapat berfungsi, dan menjelaskan bagaimana spesifikasi perangkat lunak diimplementasikan. Tahap desain meliputi perancangan data, perancangan
arsitektur,
perancangan
antarmuka,
dan
perancangan
prosedur. Tool yang digunakan adalah structure chart untuk memodelkan perancangan arsitektur dan dialog chart untuk memodelkan perancangan antarmuka. c. Coding Coding atau implementasi merupakan penerjemahan hasil desain ke dalam bahasa yang dimengerti oleh komputer. Dalam penelitian ini digunakan PHP untuk bahasa pemrograman dan my SQL sebagai database dalam pembuatan sistemnya.
3.2 Representasi Masalah Untuk merepresentasikan masalah menentukan resiko terhadap penyakit jantung digunakan pencarian fungsi keanggotaan fuzzy, pencarian Fuzzy Entrophy dan pencarian Information Gain dan treshold dalam FDT.
36
3.2.1
Sampel data dengan representasi Fuzzy membership function Secara umum terdapat dua macam atribut: diskrit dan kontinu. Banyak
algoritma
memerlukan data dengan nilai diskrit. Hal ini tidak mudah untuk
mengganti kontinu domain dengan yang diskrit. Ini membutuhkan beberapa partisi dan clustering. Hal ini juga sangat sulit untuk menentukan batas dari terus menerus atribut. Sebagai contoh, bagaimana kita mendefinisikan apakah sakit dada selalu penyakit jantung atau tidak? Dapatkah kita mengatakan bahwa normal sakit dada hanya dalam waktu 5 menit atau paling lama 15 menit? Bisakah kita mengatakan itu adalah saat tidak beraktifitas 2 menit, dan 30 menit ketika beraktifitas? Oleh karena itu, beberapa peneliti mengutip konsep Fuzzy dalam metode ID3, pengganti data sampel dengan ekspresi dan bentuk metode Fuzzy ID3. Berikut ini adalah contoh dari representasi Fuzzy untuk data sampel. (G.Liang, 2005) Sesuai dengan parameter yang sudah ditentukan dalam pendeteksian resiko penyakit jantung pada data yang didapat ada 9 parameter diantaranya yaitu chest pain, tresbps, chol, fbs, restecg, thalach, exang, slope, dan thal. Sedangkan parameter yang digunakan pada penelitian ini hanya diambil 6 parameter dikarenakan atribut yang lain telah mencakup dalam 1 parameter yaitu restecg, berikut penjelasan mengenai atribut tersebut. 1. Chest pain Chest pain yaitu jenis sakit dada. Jenis sakit dada ini peneliti menyimpulkan dinilai dalam hitungan menit dan memiliki 4 atribut antara lain.
37
a. Typ angina, jenis sakit dada yang lama dirasa kisaran 5 – 10 menit b. Atyp angina, jenis sakit dada yang lama dirasa kisaran 10 – 30 menit c. Asympt, jenis sakit dada yang lama dirasa kisaran 30 – 60 menit d. Non angina, jenis sakit dada yang lama dirasa kisaran lebih dari 60 menit 2. Tresbps Tresbps atau biasa dikenal tekanan darah tinggi (Hipertensi) adalah suatu peningkatan tekanan darah didalam arteri. Berikut klasifikasi berdasarkan tekanan darah tinggi (Hipertensi). Tabel 3.1 Klasifikasi Berdasarkan tresbps Batas tekanan
Keterangan
<130/85
Normal
130 – 139/85 – 89
Normal tinggi
140 – 159 /90 – 99
Stadium 1 (hipertensi ringan)
160 – 179/100 – 109 Stadium 2 (hipertensi sedang) 180 – 209/110 – 119 Stadium 3 (hipertensi berat) >210/210
Stadium 4 (hipertensi maligna)
3. Chol Chol biasa dikenal dengan cholesterol atau kolesterol, klasifikasi pada chol yaitu desirable apabila kadar kolesterol < 200, borderline 200 – 239, dan tinggi apabila kadar kolesterolnya >240. 4. Fasting Blood Sugar (FBS) Fasting Blood Sugar (FBS) atau kadar gula. Klasifikasi pada fbs terhadap keputusan jantung yaitu apabila kadar gula < 120 mg/dl maka F, dan
38
apabila kadar gula >120 mg/dl maka dinyatakan T terhadap kadar gula atau fbs tersebut. 5. Restecg Restecg
yaitu
Resting
Electrocardiographic
Results.
Restecg
ini
kesimpulan dari hasil tes Elektrokardiografi (EKG). Elektrokardiografi (EKG) adalah pencatatan potensial bioelektrik yang dipancarkan jantung melalui elektroda-elektroda yang diletakkan pada posisi dipermukaan tubuh. Dalam pengklasifikasian terhadap restecg, peneliti menyimpulkan apabila pada data sample terdapat normal maka nilai tersebut <50 % dari hasil tes EKG, tetapi apabila dalam data terdapat Left Vent Hyper maka nilai tersebut >50% dari hasil tes EKG. 6. Thalach Thalach yaitu denyut jantung. Thalach ini diklasifkasikan berdasarkan denyut jantung dalam hitungan /menit. Maka didapat klasifikasi untuk thalach yaitu
3.2.2
a. Bradikarbi
: < 80 kali/menit
b. Normal
: 80 – 100 kali/menit
c. Takikarbi
: >100 kali/menit
Implementasi algoritma FID3 Seperti yang telah dijelaskan pada sub-bab 2.6, algoritma yang dipakai
untuk pembangunan ADPJ ini menggunakan algoritma FID3. Implementasi algoritma FID3 pada ADPJ ini adalah sebagai berikut.
39
1. Membuat root node dari semua data training yang ada dengan member nilai derajat keanggotaan untuk semua record sama dengan 1. 2. Menghitung fuzzy entrophy dari training set yang ada. Dari hasil perhitungan diperoleh nilai fuzzy entrophy. Nilai ini akan digunakan untuk menghitung nilai information gain dari masing-masing atribut. 3. Menghitung information gain dari atribut dalam kelas, sehingga dari hasil tersebut dipilih atibut dengan nilai information gain terbesar. Atribut yang nilainya terbesar selanjutnya digunakan untuk mengekspansi tree atau menjadi root-node, tapi pada sub-node selanjutnya atribut tersebut tidak dapat digunakan untuk mengekspansi tree.
4. Data training diekspansi berdasarkan atribut nilai information gain terbesar sehingga diperoleh hasil ekspansi tree.
3.3 Alat dan Bahan Penelitian 3.3.1
Alat Penelitian
1. Penelitian ini dilakukan dengan menggunakan komputer dengan spesifikasi. •
Prosesor Intel Pentium Core 2 duo T5250 2,4GHz
•
RAM 1Gb
•
VGA 512 MB 32 Bit
•
Layar dengan resolusi 1280 X 800 pixel, 32 bit color.
•
Mouse
40
2. Sistem operasi Microsoft Windows XP atau Linux atau sistem operasi Microsoft Windows versi yang lebih tinggi dan mendukung aplikasi XAMPP 1.7.3. 3. Perangkat lunak untuk perancangan sistem informasi: •
XAMPP tools versi 1.7.3 (PhpMyAdmin, MySql, Apache).
•
Text editor. (Macromedia Dreamweaver 8, Notepad ++, Geany)
•
Web browser.
4. Perangkat keras penyimpan data berupa flashdisk, cd dan dvd.
3.3.2.
Bahan Penelitian
1) Database pasien dan database gejala 2) Parameter dari penyakit jantung 3) Nilai Membership Function 4) Nilai Fuzzy entrophy dan nilai information gain