BAB V IMPLEMENTASI (Evaluation Phase dan Deployment Phase)
5.1
Lingkungan Implementasi Implementasi merupakan tahapan dimana hasil perancangan yang telah
dibangun mulai diterapkan pada kondisi yang menyerupai kondisi yang sebenarnya. Lingkungan implementasi meliputi lingkungan perangkat lunak (software) dan lingkungan perangkat keras (hardware).
5.1.1
Lingkungan Perangkat Keras (Hardware) Spesifikasi
minimal
dari
hardware
yang
diperlukan
pada
saat
implementasi diantaranya adalah :
5.1.2
a. Microprosesor
: Intel Pentium 4
b. Harddisk
: 4GB
c. Memori
: RAM 128 MB
d. Monitor
: 1024 x 768 ”
Lingkungan Perangkat Lunak (Software) Spesifikasi software yang digunakan untuk membangun sistem ini adalah :
5.2
a. Sistem Operasi
: Windows
b. Program Aplikasi
: MS Visual Basic 6.0
c. Perangkat Tambahan
: PHPMyAdmin
Implementasi Komponen Implementasi komponen merupakan daftar dari perancangan yang telah
diimplementasikan. Implementasi komponen algoritma C4.5 pada data pasien liver adalah sebagai berikut :
V-1
V-2
Tabel 5.1 Implementasi Komponen No
Nama Form
File Fisik
File Executable
1
Menu Utama
frmUtama.frm
daming.exe
2
Latih Data
frmLatihData.frm
daming.exe
3
Pohon Keputusan
frmPohon.frm
daming.exe
4
Aturan
frmAturan.frm
daming.exe
5
Hasil Penghitungan Entropy
frmTampilHitung.frm
daming.exe
frmUjiDataInput.frm
daming.exe
frmUjiDataMaster.frm
daming.exe
dan Gain 6
Pengujian Data (Data Masukan)
7
Pengujian Data (Data Master)
5.3
Struktur Menu Struktur dari simulasi implementasi algoritma C4.5 pada data pasien liver
digambarkan pada Gambar 5.1.
MENU UTAMA
LATIH DATA
POHON KEPUTUSAN
ATURAN TERBENTUK
PENGHITUNGAN ENTROPI DAN GAIN
UJI DATA (INPUT DATA)
PRA PROSES DATA
PROSES DATA
Gambar 5.1 Struktur Menu
UJI DATA (MASTER DATA)
KELUAR
V-3
5.4
Implementasi Tampilan Tampilan antarmuka simulasi implementasi algoritma C4.5 pada data
pasien liver digambarkan pada Gambar 5.2 sampai dengan Gambar 5.8.
5.4.1
Tampilan Menu Utama Pada tampilan Gambar 5.2, terdapat opsi-opsi untuk melakukan latih data,
menampilkan pohon keputusan, menampilkan daftar aturan, menampilkan penghitungan entropy dan gain, melakukan pengujian dengan data masukan, serta pengujian data master dan penghitungan akurasi. Melakukan latih data merupakan proses wajib yang harus dilalui apabila ingin memasuki opsi yang lain.
Gambar 5.2 Tampilan Menu Utama
5.4.2
Tampilan Latih Data Tampilan Gambar 5.3 akan muncul setelah pengguna memilih opsi latih
data. Pada latih data terdapat pengaturan data yang meminta pengguna untuk mengisi persentase data untuk data latih dan data uji. Setelah mengatur data, pengguna memilih akan melakukan praproses data menggunakan rumus GINI atau berdasarkan referensi kesehatan yang menjadi acuan. Setelah melakukan praproses, pengguna memilih tombol perintah proses data yang meliputi penghitungan entropy dan gain serta pembentukan pohon keputusan.
V-4
Gambar 5.3 Tampilan Latih Data
5.4.3
Tampilan Pohon Keputusan Tampilan Gambar 5.4 akan muncul secara otomatis setelah proses data
selesai dilakukan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan entropy dan gain secara visual berupa pohon keputusan.
V-5
Gambar 5.4 Tampilan Pohon Keputusan
5.4.4
Tampilan Daftar Aturan Tampilan Gambar 5.5 akan muncul setelah pengguna memilih opsi untuk
menampilkan daftar aturan pada tampilan menu utama. Tampilan ini berfungsi untuk menampilkan daftar aturan sesuai dengan silsilah pada pohon keputusan.
V-6
Gambar 5.5 Tampilan Daftar Aturan
5.4.5
Tampilan Hasil Penghitungan Tampilan Gambar 5.6 akan muncul setelah pengguna memilih opsi untuk
menampilkan hasil penghitungan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan entropy dan gain dengan kondisi baris penentu tertentu.
Gambar 5.6 Tampilan Hasil Penghitungan
V-7
5.4.6
Tampilan Uji Data (Data Masukan) Tampilan uji Gambar 5.7 akan muncul setelah pengguna memilih opsi uji
data dengan data masukan. Tampilan ini berfungsi untuk mengetahui hasil keputusan pasien liver berdasarkan pohon keputusan yang telah terbentuk.
Gambar 5.7 Tampilan Uji Data dengan Data Masukan
5.4.7
Tampilan Uji Data (Data Master) dan Akurasi Tampilan Gambar 5.8 akan muncul setelah pengguna memilih opsi uji
data master dan penghitungan akurasi. Tampilan ini berfungsi untuk menampilkan perbandingan pengujian data berdasarkan pohon keputusan dengan data liver, menampilkan jumlah data terklasifikasi dan tidak terklasifikasi serta menampilkan persentase akurasi.
V-8
Gambar 5.8 Tampilan Uji Data dengan Data Master dan Akurasi
5.5
Implementasi Basis Data Implementasi algoritma C4.5 menggunakan 1 (satu) basis data bernama
db_liver yang terdiri dari 15 (lima belas) buah tabel. Struktur tabel bisa dilihat pada Gambar 5.9 sampai dengan Gambar 5.23. 1) Tabel data pasien liver (tb_liver) berisi record pasien liver
Gambar 5.9 Struktur Tabel Data Pasien Liver
V-9
2) Tabel atribut (tb_atribut) menyimpan atribut-atribut yang terdapat pada data pasien liver beserta split atributnya.
Gambar 5.10 Struktur Tabel Atribut
3) Tabel perbandingan pengujian (tb_comparetesting) menyimpan hasil pengujian data master pasien liver dengan hasil pengujian data berdasarkan pohon keputusan
Gambar 5.11 Struktur Tabel Perbandingan Pengujian Data
4) Tabel entropi (tb_entopy) menyimpan hasil penghitungan entropi sampai terbentuknya pohon keputusan
Gambar 5.12 Struktur Tabel Entropi
5) Tabel gain (tb_gain) berisi menyimpan hasil penghitungan gain sampai terbentuknya pohon keputusan
V-10
Gambar 5.13 Struktur Tabel Gain
6) Tabel hasil pengujian (tb_hasiltesting) menyimpan hasil pengujian data pasien liver berdasarkan pohon keputusan
Gambar 5.14 Struktur Tabel Hasil Pengujian Data
7) Tabel penghitungan (tb_hitung) menyimpan penghitungan jumlah kasus berdasarkan baris penentu
Gambar 5.15 Struktur Tabel Penghitungan
8) Tabel klasifikasi atribut (tb_klas_atribut) menyimpan hasil klasifikasi atribut
Gambar 5.16 Struktur Tabel Klasifikasi Atribut
V-11
9) Tabel praproses (tb_pra) menyimpan hasil praproses data pasien liver
Gambar 5.17 Struktur Tabel Praproses Data
10) Tabel pra-GINI (tb_pre_gini) menyimpan data pasien liver untuk menentukan split atribut
Gambar 5.18 Struktur Tabel Pra Gini
11) Tabel aturan (tb_rules) menyimpan daftar aturan yang terbentuk dari pohon keputusan
Gambar 5.19 Struktur Tabel Aturan
V-12
12) Tabel pengujian (tb_testing) menyimpan data uji
Gambar 5.20 Struktur Tabel Pengujian
13) Tabel simpul pohon keputusan (tb_tree_atribut) menyimpan simpul dan atribut yang terlibat pada pohon keputusan
Gambar 5.21 Struktur Tabel Simpul Pohon Keputusan
14) Tabel simpul pohon detail (tb_trklasdetail) menyimpan klasifikasi atribut yang terlibat pada pohon keputusan beserta hasil kelanjutannya sampai menemukan hasil keputusan akhir.
Gambar 5.22 Struktur Tabel Simpul Pohon Detail
V-13
5.6
Pengujian Implementasi Pada penelitian ini, akan digunakan 3 (tiga) skenario dalam proses
pengujian : 1) Skenario (1) Pengujian implementasi dilakukan dengan urutan sebagai berikut : a) Mengatur persentase data latih dan data uji b) Melakukan praproses data dengan menggunakan rumus GINI c) Proses data d) Menghitung tingkat akurasi 2) Skenario (2) Pengujian implementasi dilakukan dengan urutan sebagai berikut : a) Mengatur persentase data latih dan data uji b) Melakukan praproses data dengan mengklasifikasikan data pasien liver berdasarkan referensi kesehatan c) Proses data d) Menghitung tingkat akurasi
Skenario (1) dan (2) dilakukan masing-masing sebanyak 10 (sepuluh) kali dengan pengaturan persentase data latih dan data uji terbagi pada Tabel 5.2. Tabel 5.2 Pengaturan Persentase Data Latih dan Data Uji Latih Data
Persentase
Persentase Data
Ke-
Data Latih
Uji
1
10 %
90 %
2
20 %
80 %
3
30 %
70 %
4
40 %
60 %
5
50 %
50 %
6
60 %
40 %
7
70 %
30 %
8
80 %
20 %
9
90 %
10 %
10
100 %
100 %
V-14
3) Skenario (3) Membandingkan tingkat akurasi hasil pengujian skenario (1) dengan hasil pengujian skenario (2).
5.6.1
Skenario (1) Berdasarkan Tabel 5.3, diperoleh rata-rata persentase akurasi pengujian
data dengan praproses menggunakan rumus GINI adalah 39,00 %. Dengan akurasi tertinggi yaitu 56,22% dan akurasi terendah yaitu 22,41%.
Tabel 5.3 Hasil Pengujian Data (Praproses Menggunakan Rumus GINI) Jumlah Data
Latih
Jumlah
Jumlah
Jumlah Data
Jumlah Data
Data Ke-
Data Latih
Data Uji
Terklasifikasi (YES)
Terklasifikasi (NO)
1
58
525
222
151
152
2
117
466
271
78
117
3
175
408
217
70
121
4
233
350
159
27
164
5
292
291
133
20
138
6
350
233
71
12
150
7
408
175
50
8
117
8
466
117
49
7
61
9
525
58
13
4
41
10
583
583
173
21
389
Tidak Terklasifikasi
Latih Data Ke-
Jumlah Hasil Sesuai
Jumlah Hasil Tidak Sesuai
Persentase Akurasi (%)
Persentase Kesalahan (%)
1
268
257
51.05
48.95
2
262
204
56.22
43.78
3
215
193
52.70
47.30
4
141
209
40.29
59.71
5
113
178
38.83
61.17
6
69
164
29.61
70.39
7
46
129
26.29
73.71
8
46
71
39.32
60.68
9
13
45
22.41
77.59
10
194
389
33.28
66.72
39.00
61.00
Rata-rata Persentase
V-15
5.6.2
Skenario (2) Berdasarkan Tabel 5.4, diperoleh rata-rata persentase akurasi pengujian
data dengan praproses berdasarkan referensi kesehatan adalah 54,89 %. Dengan akurasi tertinggi yaitu 67,75% dan akurasi terendah yaitu 45,92%.
Tabel 5.4 Hasil Pengujian Data (Praproses Berdasarkan Referensi Kesehatan) Latih Data Ke-
Jumlah Data Latih
Jumlah Data Uji
Jumlah Data Terklasifikasi (YES)
Jumlah Data Terklasifikasi (NO)
Jumlah Data Tidak Terklasifikasi
1
58
525
289
167
69
2
117
466
227
145
94
3
175
408
225
80
103
4
233
350
217
51
82
5
292
291
161
46
84
6
350
233
117
40
76
7
408
175
99
23
53
8
466
117
76
8
33
9
525
58
38
5
15
10
583
583
320
75
188
Latih Data Ke-
Jumlah Hasil Sesuai
Jumlah Hasil Tidak Sesuai
Persentase Akurasi (%)
Persentase Kesalahan (%)
1
284
241
54.10
45.90
2
232
234
49.79
50.21
3
208
200
50.98
49.02
4
193
157
55.14
44.86
5
146
145
50.17
49.83
6
107
126
45.92
54.08
7
90
85
51.43
48.57
8
68
49
58.12
41.88
9
38
20
65.52
34.48
10
395
188
67.75
32.25
54.89
45.11
Rata-rata Persentase
V-16
5.6.3
Skenario (3) Berdasarkan Gambar 5.24, terlihat bahwa tingkat akurasi pengujian data
dengan praproses berdasarkan referensi kesehatan cenderung meningkat sedangkan tingkat akurasi pengujian data dengan praproses menggunakan rumus GINI cenderung menurun.
Grafik Perbandingan Hasil Uji Data 80,00 70,00 65,52
Persentase Akurasi (%)
60,00 56,22
50,00
54,10 52,70 51,05 49,79 50,98
67,75
58,12
55,14 51,43
50,17 45,92
40,00
40,29
39,32
38,83
33,28
30,00
29,61 26,29 22,41
20,00 10,00 10
20
30
40
50
60
70
80
90
100
Persentase Data Latih (%) Hasil Uji Data (Referensi Kesehatan) Hasil Uji Data (Gini)
Gambar 5.23 Grafik Perbandingan Hasil Pengujian Data
V-17
5.7
Evaluation Phase Tingkat keakuratan pengujian data dengan praproses menggunakan rumus
GINI cenderung menurun, hal ini kemungkinan terjadi karena dipengaruhi oleh penghitungan GINI untuk split atribut bernilai kontinyu hanya menghasilkan 2 (dua) klasifikasi atribut yaitu lebih kecil dari sama dengan (<=) dan lebih besar (>) dari split atribut, sedangkan data-data pada atribut bernilai kontinyu itu beragam sehingga berpengaruh pada pengujian data dan tingkat akurasi. Adapun kelebihan dari aplikasi ini adalah : 1. Pengguna
bisa
memilih
cara
melakukan
praproses
data,
yaitu
menggunakan rumus GINI atau berdasarkan referensi kesehatan. 2. Aplikasi ini menyimpan hasil penghitungan entropy dan gain
5.8
Deployment Phase Hasil akhir dari implementasi algoritma C4.5 pada data pasien liver ini
berupa pohon keputusan dan daftar aturan yang terbentuk. Berikut adalah contoh hasil implementasi tersebut : 1) Nama
: Deployment (1)
Jumlah Data Latih
: 5% dari 583 data (29 data)
Jumlah Data Uji
: 95% dari 583 data (554 data)
Praproses
: Rumus GINI
Atribut dan Split
:
Gambar 5.24 Atribut dan Split untuk Deployment (1)
V-18
Pohon Keputusan
:
Gambar 5.25 Pohon Keputusan Simpul 1.1 untuk Deployment (1)
Gambar 5.26 Pohon Keputusan Simpul 1.2 untuk Deployment (1)
V-19
Daftar Aturan
: 20 (dua puluh) aturan terbentuk
Gambar 5.27 Daftar Aturan Deployment (1)
2) Nama
: Deployment (2)
Jumlah Data Latih
: 5% dari 583 data (29 data)
Jumlah Data Uji
: 95% dari 583 data (554 data)
Praproses
: Berdasarkan Referensi Kesehatan
Atribut dan Split
:
Gambar 5.28 Atribut dan Split untuk Deployment (2)
V-20
Pohon Keputusan
:
Gambar 5.29 Pohon Keputusan Simpul 1.1 – 1.3 untuk Deployment (2)
Gambar 5.30
V-21
Pohon Keputusan Simpul 1.4 – 1.5 untuk Deployment (2) Daftar Aturan
: 40 (empat puluh) aturan terbentuk
Gambar 5.31 Daftar Aturan Deployment 2 (1)
Gambar 5.32 Daftar Aturan Deployment 2 (2)