EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5
SETA BAEHERA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009
EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Oleh : SETA BAEHERA G64066040
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009
ABSTRAK SETA BAEHERA. Eksplorasi Metode Penentuan Nilai End Point pada Algoritma Voting Feature Intervals 5. Dibimbing oleh Aziz Kustiyo. Voting Feature Intervals 5 adalah salah satu algoritma klasifikasi yang merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature (Güvenir 1998). Klasifikasi menggunakan algoritma ini didasarkan pada vote dari nilai-nilai pada feature. Cara kerja algoritma ini yaitu membuat interval dari setiap feature menggunakan instance yang terdapat pada feature tersebut. Interval yang dibuat dapat berupa range interval atau point interval. Point interval terdiri dari seluruh end point semua feature secara berurut sedangkan range interval terdiri dari nilai-nilai antara dua end point yang berdekatan namun tidak termasuk kedua end point tersebut. Nilai vote setiap kelas akan disimpan pada setiap interval. Tujuan dari penelitian ini adalah untuk mengeksplorasi metode penentuan nilai end point pada algortima VFI5. Pengeksplorasian nilai end point pada algoritma VFI5 dilakukan dengan cara menempatkan kembali end point yang lebih merepresentasikan batas setiap kelas. Penempatan end point itu dilakukan dengan berbagai cara, antara lain : metode desil dan metode min(n+1) max(n-1). Algoritma VFI5 menghasilkan nilai akurasi rata-rata sebesar 95,92% pada pengujian data Iris. Nilai yang sama pun diperoleh oleh algoritma VFI5 dengan metode end point desil, sedangkan algoritma VFI5 dengan metode end point min(n+1) max(n-1) hanya menghasilkan nilai akurasi rata-rata sebesar 93,87%. Pada pengujian data Wine, algoritma VFI5 menghasilkan nilai akurasi rata-rata sebesar 94,38%. Algoritma VFI5 dengan metode end point desil menghasilkan nilai akurasi rata-rata yang cukup jauh dibawah nilai akurasi rata-rata algoritma VFI5 biasa, yaitu sebesar 91,55%, sedangkan algoritma VFI5 dengan metode end point min(n+1) max(n-1) menghasilkan nilai akurasi rata-rata sebesar 92,67%. Pada pengujian data Ikan Koi, nilai akurasi rata-rata algoritma VFI5 dengan metode end point desil sebesar 95,79% dapat melebihi nilai akurasi rata-rata algoritma VFI5 biasa yang menghasilkan nilai 94,96%. Nilai akurasi ratarata algoritma VFI5 dengan metode end point min(n+1) max(n-1) terpaut cukup jauh dibandingkan kedua algoritma yang lainnya, yaitu sebesar 91,67%. Algoritma VFI5 dengan metode end point desil dan algoritma VFI5 dengan metode end point min(n+1) max(n-1) akan mengalami kecenderungan penurunan kinerja bila dibandingkan dengan algoritma VFI5 biasa. Semakin banyaknya jumlah data uji yang memiliki nilai di luar interval akan membuat turunnya kinerja kedua algoritma VFI5 yang diubah tersebut. Kata kunci : Klasifikasi, Algoritma VFI5, Desil
Judul
:
Eksplorasi Metode Penentuan Nilai End Point pada Algoritma Voting Feature Intervals 5
Nama
:
Seta Baehera
NIM
:
G64066040
Menyetujui:
Pembimbing
Aziz Kustiyo, S.Si, M.Kom. NIP 19700719 199802 1 001
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. drh. Hasim, DEA NIP 19610328 198601 1 002
Tanggal Lulus :
RIWAYAT HIDUP Penulis dilahirkan di Bogor tanggal 21 Mei 1985, anak ke sepuluh dari sepuluh bersaudara dari pasangan Bapak Asikin Ardiwinata dan Ibu Sulastri Nilawidyanti. Tahun 2003, penulis lulus dari SMU Negeri 1 Bogor, kemudian melanjutkan pendidikan pada Diploma 3 Teknik Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Pada tahun 2006 penulis melanjutkan pendidikan pada Ilmu Komputer Penyelenggaraan Khusus Institut Pertanian Bogor.
PRAKATA Bismillahirahmanirrahim, Alhamdulillahi Rabbil ’alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas limpahan rahmat dan karuniaNya sehingga penulis dapat menyelesaikan skripsi dengan judul Eksplorasi terhadap Metode Penentuan Nilai End Point pada Algoritma Voting Feature Intervals 5 ini. Shalawat serta salam juga penulis ucapkan kepada junjungan kita Rasulullah SAW beserta seluruh sahabat dan umatnya hingga akhir zaman. Dalam penyelesaian skripsi ini, penulis dibantu oleh beberapa pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada pihak-pihak yang telah membantu menyelesaikan skripsi ini, antara lain : •
Kepada Bapak dan Ibu tercinta yang selalu memberikan motivasi dan doanya. Terima kasih atas semangat dan kasih sayangnya.
•
Bapak Aziz Kustiyo, S.Si, M.Kom., selaku dosen pembimbing.
•
Bapak Dr.Ir.Agus Buono, M.Si, M.Kom, selaku dosen penguji I.
•
Bapak Sony Hartono Wijaya, S.Kom, M.Kom, selaku dosen penguji II.
•
Seluruh dosen IPB yang telah memberi banyak ilmu kepada penulis.
•
Ida Maryani yang selalu memberikan perhatian dan dukungannya kepada penulis.
•
Seluruh staf karyawan Departemen Ilmu Komputer FMIPA IPB.
•
Bapak Adianto, S.Kom, Bapak Edi, S.Kom dan Ibu Yanti, S.Kom., sebagai guru sewaktu SLTP yang telah memberikan banyak motivasi kepada penulis.
•
Muhamad Haikal, Syachrudin, Lucky Irwansyah, Andriana Nurwitasari, Nurul Khaerani, Agung Manunggal, Deni Kurniawan, Dwi Agusta M, Eka Marliana, Rika Indriani, Ahmad R Holili dan seluruh teman-teman Ilkom Ekstensi Angkatan 1 yang tidak mungkin penulis sebutkan satu per satu.
Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat dan berguna bagi semua pihak yang membutuhkan, Amin.
Bogor, Mei 2009
Seta Baehera, A.Md
DAFTAR ISI Halaman DAFTAR TABEL ....................................................................................................................................... iii DAFTAR GAMBAR ................................................................................................................................... iv DAFTAR LAMPIRAN................................................................................................................................ iv PENDAHULUAN Latar Belakang ...................................................................................................................................... 1 Tujuan .................................................................................................................................................. 1 Ruang Lingkup .................................................................................................................................... 1 TINJAUAN PUSTAKA Klasifikasi ........................................................................................................................................... K-Fold Cross Validation..................................................................................................................... Algoritma Voting Feature Interval 5 (VFI5) ...................................................................................... Desil.................................................................................................................................................... Confusion matrix ................................................................................................................................
1 2 2 5 5
METODE PENELITIAN Data .................................................................................................................................................... Data Latih dan Data Uji ...................................................................................................................... Algoritma VFI5 .................................................................................................................................. Algoritma VFI5 metode Desil ............................................................................................................ Algoritma VFI5 metode min(n+1) max(n-1) ...................................................................................... Jangkauan Interval .............................................................................................................................. Pelatihan ............................................................................................................................................. Klasifikasi ........................................................................................................................................... Akurasi ............................................................................................................................................... Lingkungan Pengembangan................................................................................................................
5 6 6 6 6 6 6 7 7 7
HASIL DAN PEMBAHASAN Data Iris .............................................................................................................................................. Iterasi pertama .................................................................................................................................... Iterasi kedua........................................................................................................................................ Iterasi ketiga ....................................................................................................................................... Akurasi data Iris ................................................................................................................................. Data Wine ........................................................................................................................................... Iterasi pertama .................................................................................................................................... Iterasi kedua........................................................................................................................................ Iterasi ketiga ....................................................................................................................................... Akurasi data Wine ............................................................................................................................... Data Ikan Koi...................................................................................................................................... Iterasi pertama .................................................................................................................................... Iterasi kedua........................................................................................................................................ Iterasi ketiga ....................................................................................................................................... Akurasi data Ikan Koi .........................................................................................................................
7 7 8 9 10 11 11 12 13 13 14 14 15 16 17
KESIMPULAN DAN SARAN Kesimpulan ......................................................................................................................................... 17 Saran ................................................................................................................................................... 18 DAFTAR PUSTAKA ................................................................................................................................ 18 LAMPIRAN .............................................................................................................................................. 19
DAFTAR TABEL Halaman 1 Confusion matrix data dengan dua kelas................................................................................................. 2 Spesifikasi Data ...................................................................................................................................... 3 Jumlah instance data latih dan data uji untuk data Iris iterasi pertama ................................................... 4 Jumlah instance data latih dengan nilai di luar interval pada data Iris iterasi pertama ........................... 5 Jumlah instance data uji dengan nilai di luar interval pada data Iris iterasi pertama .............................. 6 Hasil tahap klasifikasi data Iris iterasi pertama ...................................................................................... 7 Jumlah instance data latih dan data uji untuk data Iris iterasi kedua ...................................................... 8 Jumlah instance data latih dengan nilai di luar interval pada data Iris iterasi kedua .............................. 9 Jumlah instance data uji dengan nilai di luar interval pada data Iris iterasi kedua ................................. 10 Hasil tahap klasifikasi data Iris iterasi kedua ........................................................................................ 11 Jumlah instance data latih dan data uji untuk data Iris iterasi ketiga .................................................... 12 Jumlah instance data latih dengan nilai di luar interval pada data Iris iterasi ketiga ............................ 13 Jumlah instance data uji dengan nilai di luar interval pada data Iris iterasi ketiga ............................... 14 Hasil tahap klasifikasi data Iris iterasi ketiga ....................................................................................... 15 Nilai kinerja rata-rata dari ketiga metode end point untuk data Iris ..................................................... 16 Jumlah instance data latih dan data uji untuk data Wine iterasi pertama .............................................. 17 Jumlah instance data latih dengan nilai di luar interval pada data Wine iterasi pertama ...................... 18 Jumlah instance data uji dengan nilai di luar interval pada data Wine iterasi pertama ......................... 19 Hasil tahap klasifikasi data Wine iterasi pertama .................................................................................. 20 Jumlah instance data latih dan data uji untuk data Wine iterasi kedua ................................................. 21 Jumlah instance data latih dengan nilai di luar interval pada data Wine iterasi kedua.......................... 22 Jumlah instance data uji dengan nilai di luar interval pada data Wine iterasi kedua............................. 23 Hasil tahap klasifikasi data Wine iterasi kedua ..................................................................................... 24 Jumlah instance data latih dan data uji untuk data Wine iterasi ketiga ................................................. 25 Jumlah instance data latih dengan nilai di luar interval pada data Wine iterasi ketiga ......................... 26 Jumlah instance data uji dengan nilai di luar interval pada data Wine iterasi ketiga ............................ 27 Hasil tahap klasifikasi data Wine iterasi ketiga ..................................................................................... 28 Nilai kinerja rata-rata dari ketiga metode end point untuk data Wine ................................................... 29 Jumlah instance data latih dan data uji untuk data Ikan Koi iterasi pertama ........................................ 30 Jumlah instance data latih dengan nilai di luar interval pada data Ikan Koi iterasi pertama ................ 31 Jumlah instance data uji dengan nilai di luar interval pada data Ikan Koi iterasi pertama ................... 32 Hasil tahap klasifikasi data Ikan Koi iterasi pertama ............................................................................ 33 Jumlah instance data latih dan data uji untuk data Ikan Koi iterasi kedua............................................ 34 Jumlah instance data latih dengan nilai di luar interval pada data Ikan Koi iterasi kedua .................... 35 Jumlah instance data uji dengan nilai di luar interval pada data Ikan Koi iterasi kedua ....................... 36 Hasil tahap klasifikasi data Ikan Koi iterasi kedua ............................................................................... 37 Jumlah instance data latih dan data uji untuk data Ikan Koi iterasi ketiga ........................................... 38 Jumlah instance data latih dengan nilai di luar interval pada data Ikan Koi iterasi ketiga.................... 39 Jumlah instance data uji dengan nilai di luar interval pada data Ikan Koi iterasi ketiga ...................... 40 Hasil tahap klasifikasi data Ikan Koi iterasi ketiga ............................................................................... 41 Nilai kinerja rata-rata dari ketiga metode end point untuk data Ikan Koi .............................................
5 6 7 8 8 8 8 9 9 9 9 9 10 10 10 11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16 16 17
DAFTAR GAMBAR Halaman 1 Algoritma pelatihan VFI5 (Demiroz 1997) ............................................................................................ 2 Algoritma klasifikasi VFI5 (Demiroz 1997) ........................................................................................... 3 Tahap penelitian...................................................................................................................................... 4 Diagram nilai kinerja rata-rata untuk data Iris ........................................................................................ 5 Diagram nilai kinerja terhadap nilai di luar interval pada data uji Iris .................................................. 6 Diagram nilai kinerja rata-rata untuk data Wine ..................................................................................... 7 Diagram nilai kinerja terhadap nilai di luar interval pada data uji Wine ................................................ 8 Diagram nilai kinerja rata-rata untuk data Ikan Koi ............................................................................... 9 Diagram nilai kinerja terhadap nilai di luar interval pada data uji Ikan Koi ..........................................
3 4 5 10 10 14 14 17 17
DAFTAR LAMPIRAN Halaman 1 Jenis feature (f) pada data Iris ................................................................................................................ 2 Jenis feature (f) pada data Ikan Koi ........................................................................................................ 3 Nilai instance di luar interval pada data latih Iris iterasi pertama dengan metode VFI5d ...................... 4 Nilai instance di luar interval pada data latih Iris iterasi pertama dengan metode VFI5m ..................... 5 Nilai instance di luar interval pada data uji Iris iterasi pertama dengan metode VFI5 ........................... 6 Nilai instance di luar interval pada data uji Iris iterasi pertama dengan metode VFI5m ........................ 7 Nilai instance di luar interval pada data uji Iris iterasi pertama dengan metode VFI5d ......................... 8 Nilai hasil proses klasifikasi untuk iterasi pertama pada data Iris .......................................................... 9 Confusion matrix pada data uji Iris iterasi pertama dengan metode VFI5 .............................................. 10 Confusion matrix pada data uji Iris iterasi pertama dengan metode VFI5d .......................................... 11 Confusion matrix pada data uji Iris iterasi pertama dengan metode VFI5m ......................................... 12 Nilai instance di luar interval pada data latih Iris iterasi kedua dengan metode VFI5d ....................... 13 Nilai instance di luar interval pada data latih Iris iterasi kedua dengan metode VFI5m ...................... 14 Nilai instance di luar interval pada data uji Iris iterasi kedua dengan metode VFI5 ............................ 15 Nilai instance di luar interval pada data uji Iris iterasi kedua dengan metode VFI5m ......................... 16 Nilai instance di luar interval pada data uji Iris iterasi kedua dengan metode VFI5d .......................... 17 Nilai hasil proses klasifikasi untuk iterasi kedua pada data Iris............................................................ 18 Confusion matrix pada data uji Iris iterasi kedua dengan metode VFI5 ............................................... 19 Confusion matrix pada data uji Iris iterasi kedua dengan metode VFI5d ............................................. 20 Confusion matrix pada data uji Iris iterasi kedua dengan metode VFI5m ............................................ 21 Nilai instance di luar interval pada data latih Iris iterasi ketiga dengan metode VFI5d ....................... 22 Nilai instance di luar interval pada data latih Iris iterasi ketiga dengan metode VFI5m ...................... 23 Nilai instance di luar interval pada data uji Iris iterasi ketiga dengan metode VFI5m ......................... 24 Nilai instance di luar interval pada data uji Iris iterasi ketiga dengan metode VFI5d .......................... 25 Nilai hasil proses klasifikasi untuk iterasi ketiga pada data Iris ........................................................... 26 Confusion matrix pada data uji Iris iterasi ketiga dengan metode VFI5 ............................................... 27 Confusion matrix pada data uji Iris iterasi ketiga dengan metode VFI5d ............................................. 28 Confusion matrix pada data uji Iris iterasi ketiga dengan metode VFI5m ............................................ 29 Nilai instance di luar interval pada data latih Wine iterasi pertama dengan metode VFI5d ................. 30 Nilai instance di luar interval pada data latih Wine iterasi pertama dengan metode VFI5m ................ 31 Nilai instance di luar interval pada data uji Wine iterasi pertama dengan metode VFI5 ...................... 32 Nilai instance di luar interval pada data uji Wine iterasi pertama dengan metode VFI5d .................... 33 Nilai instance di luar interval pada data uji Wine iterasi pertama dengan metode VFI5m ................... 34 Nilai hasil proses klasifikasi untuk iterasi pertama pada data Wine...................................................... 35 Confusion matrix pada data uji Wine iterasi pertama dengan metode VFI5 .........................................
20 20 20 20 21 21 21 22 23 23 23 23 23 24 24 24 25 25 25 26 26 26 26 27 27 28 28 28 28 29 29 30 31 32 33
Halaman 36 Confusion matrix pada data uji Wine iterasi pertama dengan metode VFI5d ....................................... 37 Confusion matrix pada data uji Wine iterasi pertama dengan metode VFI5m ...................................... 38 Nilai instance di luar interval pada data latih Wine iterasi kedua dengan metode VFI5d ..................... 39 Nilai instance di luar interval pada data latih Wine iterasi kedua dengan metode VFI5m .................... 40 Nilai instance di luar interval pada data uji Wine iterasi kedua dengan metode VFI5.......................... 41 Nilai instance di luar interval pada data uji Wine iterasi kedua dengan metode VFI5d ........................ 42 Nilai instance di luar interval pada data uji Wine iterasi kedua dengan metode VFI5m....................... 43 Nilai hasil proses klasifikasi untuk iterasi kedua pada data Wine ......................................................... 44 Confusion matrix pada data uji Wine iterasi kedua dengan metode VFI5 ............................................ 45 Confusion matrix pada data uji Wine iterasi kedua dengan metode VFI5d .......................................... 46 Confusion matrix pada data uji Wine iterasi kedua dengan metode VFI5m ......................................... 47 Nilai instance di luar interval pada data latih Wine iterasi ketiga dengan metode VFI5d..................... 48 Nilai instance di luar interval pada data latih Wine iterasi ketiga dengan metode VFI5m ................... 49 Nilai instance di luar interval pada data uji Wine iterasi ketiga dengan metode VFI5 ......................... 50 Nilai instance di luar interval pada data uji Wine iterasi ketiga dengan metode VFI5d ....................... 51 Nilai instance di luar interval pada data uji Wine iterasi ketiga dengan metode VFI5m ...................... 52 Nilai hasil proses klasifikasi untuk iterasi ketiga pada data Wine ......................................................... 53 Confusion matrix pada data uji Wine iterasi ketiga dengan metode VFI5 ............................................ 54 Confusion matrix pada data uji Wine iterasi ketiga dengan metode VFI5d .......................................... 55 Confusion matrix pada data uji Wine iterasi ketiga dengan metode VFI5m ......................................... 56 Nilai instance di luar interval pada data latih Ikan Koi iterasi pertama dengan metode VFI5d............ 57 Nilai instance di luar interval pada data latih Ikan Koi iterasi pertama dengan metode VFI5m .......... 58 Nilai instance di luar interval pada data uji Ikan Koi iterasi pertama dengan metode VFI5 ................ 59 Nilai instance di luar interval pada data uji Ikan Koi iterasi pertama dengan metode VFI5d .............. 60 Nilai instance di luar interval pada data uji Ikan Koi iterasi pertama dengan metode VFI5m ............. 61 Nilai hasil proses klasifikasi untuk iterasi pertama pada data Ikan Koi ................................................ 62 Confusion matrix pada data uji Ikan Koi iterasi pertama dengan metode VFI5 ................................... 63 Confusion matrix pada data uji Ikan Koi iterasi pertama dengan metode VFI5d ................................. 64 Confusion matrix pada data uji Ikan Koi iterasi pertama dengan metode VFI5m ................................ 65 Nilai instance di luar interval pada data latih Ikan Koi iterasi kedua dengan metode VFI5d ............... 66 Nilai instance di luar interval pada data latih Ikan Koi iterasi kedua dengan metode VFI5m .............. 67 Nilai instance di luar interval pada data uji Ikan Koi iterasi kedua dengan metode VFI5d .................. 68 Nilai instance di luar interval pada data uji Ikan Koi iterasi kedua dengan metode VFI5m ................. 69 Nilai hasil proses klasifikasi untuk iterasi kedua pada data Ikan Koi ................................................... 70 Confusion matrix pada data uji Ikan Koi iterasi kedua dengan metode VFI5....................................... 71 Confusion matrix pada data uji Ikan Koi iterasi kedua dengan metode VFI5d ..................................... 72 Confusion matrix pada data uji Ikan Koi iterasi kedua dengan metode VFI5m.................................... 73 Nilai instance di luar interval pada data latih Ikan Koi iterasi ketiga dengan metode VFI5d ............... 74 Nilai instance di luar interval pada data latih Ikan Koi iterasi ketiga dengan metode VFI5m.............. 75 Nilai instance di luar interval pada data uji Ikan Koi iterasi ketiga dengan metode VFI5.................... 76 Nilai instance di luar interval pada data uji Ikan Koi iterasi ketiga dengan metode VFI5d.................. 77 Nilai instance di luar interval pada data uji Ikan Koi iterasi ketiga dengan metode VFI5m ................ 78 Nilai hasil proses klasifikasi untuk iterasi ketiga pada data Ikan Koi ................................................... 79 Confusion matrix pada data uji Ikan Koi iterasi ketiga dengan metode VFI5 ...................................... 80 Confusion matrix pada data uji Ikan Koi iterasi ketiga dengan metode VFI5d .................................... 81 Confusion matrix pada data uji Ikan Koi iterasi ketiga dengan metode VFI5m ...................................
33 33 33 34 34 35 36 37 38 38 38 38 39 39 40 41 42 43 43 43 43 44 44 45 46 47 48 48 48 48 49 50 51 52 53 53 53 53 54 54 55 56 57 58 58 58
PENDAHULUAN Latar Belakang Klasifikasi merupakan salah satu bidang kajian pada machine learning. Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001). Voting Feature Intervals 5 merupakan algoritma klasifikasi yang bersifat supervised dan non-incremental. Algoritma Voting Feature Intervals dikembangkan sampai pada versi ke-5 (VFI5). Representasi dari algoritma tersebut berdasarkan teknik feature interval. Feature interval adalah suatu teknik dimana kelas-kelas diproyeksikan dalam nilai interval pada masingmasing feature (atribut) dari kelas tersebut secara terpisah. Algoritma VFI5 telah diterapkan oleh Güvenir, Demiroz dan Ilter (1997) pada penelitian diagnosis penyakit Erythemato-Squamous. Algoritma VFI5 membuat interval untuk setiap feature yang berupa range interval atau point interval. Untuk setiap interval, nilai vote untuk setiap kelas pada interval tersebut akan disimpan. Dengan demikian sebuah interval dapat merepresentasikan beberapa kelas dengan menyimpan nilai vote setiap kelas sehingga algoritma VFI5 tersebut dapat disebut sebagai Multi Class Feature Projection Based Algorithms (Demiroz 1997). Algoritma VFI5 membangun range interval dan point interval didasarkan pada nilai minimum dan maksimum suatu feature pada setiap kelas. Algoritma VFI5 dapat diterapkan pada berbagai jenis data, antara lain data kategori, data nominal ataupun data kontinu. Pada jenis data kontinu, nilai vote yang terkandung dalam range interval hanya diwakili oleh satu nilai. Selain itu panjang interval antara range interval satu dengan yang lainnya tidak selalu sama. Kedua hal ini dapat menyebabkan perbedaan representasi kelas pada
range interval tersebut. Contohnya pada suatu himpunan data tertentu, nilai vote dalam suatu range interval yang panjang, yang tidak hanya cukup diwakili oleh satu nilai dapat merepresentasikan lebih dari satu kelas. Permasalahan ini dapat menyebabkan turunnya tingkat akurasi klasifikasi algoritma VFI5. Untuk mengatasi permasalahan tersebut perlu dilakukan kembali penempatan point interval maupun range interval yang lebih merepresentasikan batas setiap kelas. Tujuan Tujuan dari penelitian ini adalah untuk mencari alternatif cara pengambilan nilai end point pada Algoritma Voting Feature Intervals 5. Penelitian ini dilakukan dengan cara menempatkan kembali point interval dan range interval. Ruang Lingkup Ruang lingkup penelitian yang dilakukan adalah sebagai berikut: 1
2 3
Penerapan Algoritma VFI5 dilakukan pada 3 data yaitu data Iris yang memiliki 3 kelas, data Wine yang memiliki 3 kelas dan data Ikan Koi (Tera 2008) yang memiliki 2 kelas. Data Ikan Koi berasal dari Departemen Perikanan IPB. Data Iris, Wine dan Glass didapatkan pada situs UCI Repository of Machine Learning Databases di ics.uci.edu. Semua data yang digunakan memiliki jenis data kontinu. Setiap feature (ciri) data memiliki bobot sama.
TINJAUAN PUSTAKA Klasifikasi Klasifikasi merupakan proses menemukan sekumpulan model (atau fungsi) yang menggambarkan dan membedakan konsep atau kelas-kelas data, yang bertujuan agar model tersebut dapat digunakan untuk memprediksi
kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001). Penelitian terdiri atas dua tahap, yaitu pelatihan dan klasifikasi. Pada tahap pelatihan, dibentuk sebuah model domain permasalahan dari setiap instance (data pelatihan) yang ada. Penentuan model tersebut berdasarkan analisis terhadap sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance (kasus) baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Güvenir et al. 1998). K-Fold Cross Validation Beberapa teknik memperkirakan generalisasi error telah dikembangkan, yaitu hold out, leave one out, cross validation, dan bootstrapping (Fu 1994). Validasi silang dan bootstrapping merupakan metode dalam memperkirakan generalisasi error berdasarkan “resampling” (Sarle 2004). Metode k-fold cross validation membagi sebuah himpunan contoh secara acak menjadi k himpunan bagian (subset) yang saling bebas, dengan ulangan sebanyak k-kali untuk pelatihan dan pengujian. Pada setiap ulangan, disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan (Fu 1994). Pada metode ini, data awal dibagi menjadi k subset atau “fold” yang saling bebas secara acak, yaitu S1,S2,S3,…,Sk, dengan ukuran setiap subset kira-kira sama. Pelatihan dan pengujian dilakukan sebanyak k kali. Pada iterasi ke-i subset Si diperlakukan sebagai data pengujian, dan subset lainnya diperlakukan sebagai data pelatihan. Jadi, pada iterasi pertama S2,…,Sk menjadi data pelatihan dan data S1 menjadi data pengujian. Pada iterasi kedua S1,S3,…,Sk menjadi data pelatihan dan data S2 menjadi data pengujian, dan seterusnya. Tingkat akurasi dihitung dengan cara membagi jumlah hasil klasifikasi yang benar dari k iterasi dengan jumlah semua instance pada data awal (Han & Kamber 2001).
Algoritma Voting Feature Intervals 5 (VFI5) Voting Feature Intervals adalah salah satu algoritma yang digunakan dalam pengklasifikasian data. Algoritma tersebut dikembangkan oleh Demiroz dan Güvenir pada tahun 1997. Algoritma Voting Feature Intervals merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature atau atribut. Demiroz dan Güvenir (1997) mengemukakan bahwa algoritma tersebut adalah algoritma yang supervised artinya memiliki target, dalam hal ini adalah kelas-kelas data dari kasus yang ada, dan bersifat non-incremental artinya semua instance pelatihan diproses secara bersamaan. Pengklasifikasian instance baru berdasarkan voting pada klasifikasi yang dibuat oleh nilai tiap-tiap feature secara terpisah. Algoritma Voting Feature Intervals yang dikembangkan sudah sampai pada versi yang ke-5 atau sering disebut VFI5. Algoritma VFI5 memiliki dua tahap yaitu pelatihan dan klasifikasi. Pada tahap pelatihan akan dibentuk interval untuk setiap feature yang berupa range interval atau point interval. Untuk setiap interval, nilai vote untuk setiap kelas pada interval tersebut akan disimpan. Dengan demikian sebuah interval dapat merepresentasikan beberapa kelas dengan menyimpan nilai vote setiap kelas sehingga algoritma VFI5 tersebut dapat disebut sebagai Multi Class Feature Projection Based Algorithms. Keunggulan algoritma VFI5 adalah algoritma tersebut cukup kokoh (robust) terhadap feature yang tidak relevan namun mampu memberikan hasil yang baik pada real-world datasets yang ada. VFI5 mampu menghilangkan pengaruh yang kurang menguntungkan dari feature yang tidak relevan dengan mekanisme votingnya (Güvenir 1998). Algoritma klasifikasi VFI5 mampu melakukan klasifikasi lebih cepat dibandingkan dengan algoritma nearest neighbor dan decision tree. VFI5 mampu menangani nilai feature yang
train(TrainingSet): begin for each feature f for each class c EndPoints[f] = EndPoints[f] find_end_points(TrainingSet,f,c); sort(EndPoint[f]); if f is linear for each end point p in EndPoints[f] form a point interval from end point p form a range interval between p and the next end point ≠ p else /*f is nominal*/ each distinct point in EndPoint[f] forms a point interval for each interval i on feature dimension f for each class c interval_class_count[f,i,c] = 0 count_instances(f,TrainingSet); for each interval i on feature dimension f for each class c interval_class_vote[f,i,c] =
_
_
,,
_
normalize interval_class_vote[f,i,c] * such that interval_class_vote[f,i,c] = I * end Gambar 1 Algoritma pelatihan VFI5 (Demiroz 1997) tidak diketahui (hilang) dengan cara mengabaikan nilai feature tersebut yang ada pada data pelatihan dan data pengujian, sedangkan pada algoritma nearest neighbor dan decision tree, nilai tersebut harus diganti. Demiroz dan Güvenir (1997) mengembangkan algoritma VFI5 menjadi dua tahap yaitu pelatihan dan klasifikasi. 1.
Pelatihan Langkah pertama pada tahap pelatihan adalah menemukan end point setiap feature f dari setiap kelas c. End point untuk feature linier, yaitu feature yang nilainya memiliki urutan atau bias dibandingkan tingkatannya, merupakan nilai minimum dan nilai maksimum feature tersebut. End point untuk feature nominal, yaitu feature yang nilainya tidak memiliki urutan dan tidak bias dibandingkan tingkatannya, merupakan semua
nilai yang berbeda yang ada pada feature kelas yang sedang diamati. Sebelum dibentuk interval, seluruh end point yang diperoleh untuk setiap feature linier diurutkan. Jika suatu feature merupakan feature linier maka akan dibentuk dua interval, yaitu point interval dan range interval. Jika feature tersebut merupakan feature nominal maka akan dibentuk point interval. Batas bawah pada range interval (ujung paling kiri) adalah -∞ sedang batas atas range interval (ujung paling kanan) adalah ∞. Jumlah maksimum end point pada feature linier adalah 2k sedangkan jumlah maksimum intervalnya adalah 4k + 1, dengan k adalah jumlah kelas yang diamati. Setelah itu, jumlah instance pelatihan setiap kelas c dengan feature f untuk setiap interval i dihitung dan direpresentasikan sebagai interval_class_count[f,i,c]. Untuk setiap instance
classify(e): /* e: example to be classified */ begin for each class c vote[c] = 0 for each feature f for each class c feature_vote[f,c] = 0 /* vote of feature f for class c */ if ef value is known i = find_interval(f,ef) feature_vote[f,c] = interval_class_vote[f,i,c] for each class c vote[c] = vote[c] + ( feature_vote[f,c] * weight[f] ) feature class c with highest vote[c] end Gambar 2 Algoritma klasifikasi VFI5 (Demiroz 1997) pelatihan dicari interval i,yaitu nilai feature f dari instamce pelatihan e(ef) tersebut berada pada interval i. Jika interval i merupakan point interval dan ef sama dengan batas bawah interval tersebut (sama dengan batas atas untuk point interval), jumlah instance tersebut (ef) pada interval i ditambah 1. Jika interval i merupakan range interval dan ef jatuh pada interval tersebut maka jumlah kelas instance ef pada interval i ditambah 1. Hasil proses ini merupakan vote kelas c pada interval i. Untuk menghilangkan efek perbedaan distribusi setiap kelas, vote kelas c untuk feature f pada interval i dinormalisasi dengan cara membagi vote tersebut dengan jumlah instance kelas c yang direpresentasikan dengan class_count[c]. Hasil normalisasi ini dinotasikan sebagai interval_class_vote[f,i,c]. Kemudian nilainilai interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote beberapa kelas pada setiap feature sama dengan 1. Normalisasi ini bertujuan agar setiap feature memiliki kekuatan voting yang sama pada proses klasifikasi yang tidak dipengaruhi oleh ukurannya. 2. Klasifikasi Proses klasifikasi diawali dengan inisialisasi vote setiap kelas dengan nilai nol. Untuk setiap feature f, dicari letak ef pada interval i tersebut berada, dengan ef merupakan nilai feature f dari
instance tes e. Jika ef tidak diketahui (hilang), feature tersebut tidak diikutsertakan dalam voting (memberikan vote nol untuk setiap kelas). Oleh karena itu, feature yang memiliki nilai tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan. Interval tersebut dapat menyimpan instance pelatihan dari beberapa kelas. Kelas-kelas dalam sebuah interval direpresentasikan oleh vote kelas-kelas tersebut pada interval itu. Untuk setiap kelas c, feature f memberikan vote yang sama dengan interval_class_vote[f,i,c]. Notasi tersebut merepresentasikan vote feature f yang diberikan untuk kelas c. Setiap feature f mengumpulkan vote-votenya dalam sebuah vektor (feature_vote[f,C1],…, feature_vote[f,Cj],…,feature_vote[f,Ck]), dengan feature_vote[f,Cj] merupakan vote feature f untuk kelas Cj dan k adalah jumlah kelas. Kemudian d vektor vote, dengan d merupakan jumlah feature, dijumlahkan untuk memperoleh total vektor vote (vote[C1],…,vote[Ck]). Kelas dengan jumlah vote terbesar diprediksi sebagai kelas dari instance tes e. Pseudocode algoritma pelatihan dan klasifikasi VFI5 dapat dilihat pada gambar 1 dan 2.
Desil Persentil (percentile) ke-p (untuk nilai p antara 0 hingga 100) dari sebuah sampel adalah membagi sampel sehingga p% dari nilai sampel berada di bawah persentil ke-p dan (100-p)% di atas persentil ke-p (Navidi 2006). Desil (Desil) merupakan variasi lain dari kuartil (quartile) ataupun persentil yang juga merupakan metode pengubahan range. Sebagai contoh, nilai desil pertama (D1) yang juga merupakan persentil ke-10 (P10) terdapat pada penelusuran sampel ke-[(n + 1)/10], nilai desil kedua (D2) atau persentil ke-20 (P20) terdapat pada penelusuran ke-[2(n + 1)/10] dan begitu seterusnya (Fleming & Nellis 1994).
•
d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.
METODE PENELITIAN Penelitian ini melalui beberapa tahapan proses untuk menganalisa peningkatan kinerja algoritma VFI5. Tahapan proses tersebut disajikan pada Gambar 3.
Confusion Matrix Confusion matrix mengandung informasi tentang kelas data yang aktual direpresentasikan pada baris matriks dan kelas data hasil prediksi suatu algoritma direpresentasikan pada kolom matriks klasifikasi. Kemampuan dari algoritma klasifikasi biasanya dievaluasi dari data yang ada pada matriks. Pada Tabel 1 disajikan confusion matrix untuk data dengan dua kelas (Kohavi & Provost 1998 diacu dalam Hamilton 2002). Tabel 1 Confusion matrix data dengan dua kelas. Prediksi Data Kelas 1 Kelas 2 Kelas 1 a b Aktual Kelas 2 c d
Gambar 3 Tahapan penelitian
Keterangan :
Tahapan yang utama adalah tahapan pelatihan untuk melihat model dan domain permasalahan data dan klasifikasi untuk menduga kelas dari data pengujian.
•
Data
•
•
a adalah jumlah instance kelas 1 yang berhasil diprediksi dengan benar sebagai kelas 1, b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2, c adalah jumlah instance kelas 2 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 1,
Data yang digunakan sebanyak 3 data yaitu data Iris, data Wine dan data Ikan Koi (Tera 2008) yang berasal dari Departemen Perikanan IPB. Data Iris dan Wine didapatkan dari UCI Repository of Machine Learning Databases, anonymous ftp dari www.ics.uci.edu dalam direktori pub/machine-learning-databases.
Tabel 2 Spesifikasi Data. Nama Data Iris Wine Ikan Koi
Feature 4 13 13
Class 1 50 59 59
Jumlah instance Class 2 50 71 60
Data Iris merupakan himpunan data jenis bunga sebanyak 150 instances yang terbagi menjadi 3 kelas yaitu Iris Setosa, Iris Versicolor dan Iris Virginica (Fisher & Marshal 1988). Distribusi kelas data Iris sebesar 33,3% untuk setiap kelas artinya setiap kelas memiliki himpunan sebanyak 50 instances. Data ini terdiri dari 4 feature, antara lain: Sepal Length, Sepal Width, Petal Length dan Petal Width. Hal ini dapat dilihat pada Lampiran 1. Data Wine merupakan data klasifikasi anggur yang berasal dari Itali (Forina & Aeberhard 1991). Data ini memiliki 3 kelas dan bersifat kontinu. Data Ikan Koi (Tera 2008) merupakan himpunan data klasifikasi jenis kelamin ikan Koi sebanyak 119 instances yang terbagi menjadi 2 kelas yaitu jantan dan betina. Distribusi kelas data Ikan Koi sebesar 50% untuk setiap kelas. Data ini terdiri dari 13 feature, antara lain: panjang, lebar, perimeter, elongation, circularity, rectangular, area, indeks merah, indeks hijau, indeks biru, intensitas, hue dan saturation. Hal ini dapat dilihat pada Lampiran 2. Jumlah distribusi data pada keempat data tersebut dapat dilihat pada Tabel 2. Data latih dan data uji Pada tahapan ini dilakukan proses 3-fold cross validation yaitu membagi data menjadi 3 bagian. Pembagian data tersebut dilakukan secara acak dengan mempertahankan perbandingan jumlah instance setiap kelas. Data tersebut akan digunakan sebagai data latih dan data uji. Algoritma VFI5 Pada penelitian ini digunakan algoritma VFI5 dengan bobot setiap feature diasumsikan sama yaitu satu. Tahapan ini terdiri atas dua proses yaitu pelatihan dan klasifikasi.
Class 3 50 48 -
Data Distribution (%) 33 : 33 : 33 33 : 40 : 27 50 : 50
Algoritma VFI5 metode Desil Algoritma VFI5 dengan metode Desil ini merupakan salah satu alternatif dari algoritma VFI5 biasa. Pada algoritma VFI5 biasa untuk menentukan nilai end point digunakan metode minimum dan maksimum dari suatu kelas pada setiap feature. Algoritma VFI5 metode Desil menggunakan metode Desil untuk menentukan nilai end point. Nilai Desil yang digunakan adalah nilai Desil ke-1 dan nilai Desil ke-9. Algoritma VFI5 metode min(n+1) max(n-1) Algoritma VFI5 dengan metode min(n+1) max(n-1) juga merupakan salah satu alternatif dari algoritma VFI5. Nilai end point yang digunakan pada algoritma ini adalah nilai minimum ke-2 terkecil dan nilai maksimum ke-2 terbesar dari setiap kelas dan setiap feature pada data latih. Jangkauan Interval Jangkauan interval adalah lebar interval secara keseluruhan yang merupakan selisih nilai end point terkecil dan nilai end point terbesar. Pelatihan Data yang telah dibagi menjadi beberapa subset pada masing-masing model akan menjadi input algoritma VFI5. Pada tahapan ini akan dibentuk interval-interval dari setiap feature yang ada. Jika feature tersebut adalah feature kontinu maka akan dibentuk dua interval yaitu point interval dan range interval. Jika feature tersebut adalah feature nominal maka akan hanya terbentuk point interval. Setelah interval semua feature terbentuk langkah selanjutnya adalah menghitung jumlah instance setiap kelas yang jatuh pada setiap interval tersebut. Setelah dinormalisasi hasil dari
jumlah instance tersebut akan menghasilkan nilai vote yang akan digunakan pada proses klasifikasi. Klasifikasi
HASIL DAN PEMBAHASAN
Pada tahap klasifikasi setiap nilai feature dari instance pengujian diperiksa dan dilihat pada interval berapa nilai tersebut jatuh. Nilai vote yang diberikan setiap kelas untuk setiap feature pada interval yang bersesuaian diambil dan kemudian dijumlahkan. Kelas dengan nilai vote tertinggi menjadi kelas prediksi dari instance pengujian tersebut. Akurasi Penghitungan tingkat akurasi diperoleh berdasarkan data pengujian. Tingkat akurasi diperoleh dengan rumus tingkat_akurasi
spesifikasi : Intel Core2Duo 1.6 GHz, RAM 1024 MB, Harddisk 120 GB.
∑ data uji benar klasifikasi ∑ total data uji
Tingkat akurasi menunjukan tingkat kebenaran pengklasifikasian data terhadap kelas yang sebenarnya. Semakin rendah nilai akurasi maka semakin tinggi kesalahan klasifikasi. Tingkat akurasi yang baik adalah tingkat akurasi yang mendekati nilai 100%. Tingkat akurasi dihitung, baik bagi data hasil klasifikasi VFI5 murni dan data hasil klasifikasi VFI5 yang telah mengalami penyesuaian metode. Tingkat akurasi inilah yang menjadi perbandingan tingkat kinerja antara data klasifikasi VFI5 murni dan data klasifikasi VFI5 dengan penyesuaian metode. Lingkungan Pengembangan Penelitian ini diimplementasikan dengan menggunakan menggunakan Microsoft Visual Basic 2005 dan basisdata Microsoft Access 2007 untuk komputasi algoritma VFI5. Perangkat keras yang digunakan adalah komputer desktop dengan spesifikasi : Intel Pentium4 2.6 GHz, RAM 2048 MB, Harddisk 370 GB dan komputer notebook dengan
Penelitian ini diterapkan pada tiga data yang berbeda, yaitu : data Iris, data Wine dan data Ikan Koi. Setiap data akan diuji dengan menggunakan 3-Fold Cross Validation, yang artinya setiap data akan mengalami 3 kali iterasi percobaan dengan berbagai kombinasi subset data latih dan subset data uji. Ketiga data tersebut akan diujikan terhadap algoritma VFI5 dengan berbagai metode pengambilan nilai end point. Algoritma VFI5 standar dengan metode end point min max akan dibandingkan dengan algoritma VFI5 dengan metode end point desil dan algoritma VFI5 dengan metode end point min(n+1) max(n-1). Untuk memudahkan penulisan, algoritma VFI5 standar dengan metode end point min max akan disebut dengan VFI5, algoritma VFI5 dengan metode end point desil akan disebut dengan VFI5d dan algoritma VFI5 dengan metode end point min(n+1) max(n-1) akan disebut dengan VFI5m. Data Iris Data awal sebanyak 150 instances dan terdiri dari 3 kelas, yaitu: 50 instances kelas Iris Setosa, 50 instances kelas Iris Versicolour dan 50 instances kelas Iris Virginica. Iterasi pertama Data latih untuk data Iris ini terdiri dari 99 instances dan data uji terdiri dari 51 instances. Pada data latih, untuk semua kelas Iris, baik IrisSetosa, Iris-Virginica dan Iris-Versicolour berjumlah masing-masing 33 instances. Pada data uji, untuk semua kelas Iris, masing-masing berjumlah 17 instances (Tabel 3). Tabel 3 Jumlah instances data latih dan data uji untuk data Iris iterasi pertama. Data Latih Data Uji
IrisSetosa 33 17
IrisVirginica 33 17
IrisVersicolour 33 17
Pada tahap pelatihan terdapat nilai-nilai dari setiap feature yang berada di luar jangkauan interval. Hal ini hanya terjadi pada VFI5d dan VFI5m. Terdapat dua macam nilai instance yang berada di luar interval, yaitu nilai instance yang memiliki nilai lebih kecil dari nilai end point terkecil (di bawah interval) dan nilai instance yang lebih besar dari nilai end point terbesar (di atas interval). Banyaknya jumlah instance dari setiap feature yang memiliki nilai di luar interval dapat dilihat pada Tabel 4. Tabel 4 Jumlah instance data latih dengan nilai di luar interval pada data Iris iterasi pertama. Metode VFI5d VFI5m
di bawah interval 13 8
di atas interval 9 4
Total 22 12
dan 7). Hal ini mengambarkan bahwa jangkauan interval paling lebar dimiliki oleh VFI5, kemudian VFI5m dan selanjutnya VFId. Jangkauan interval tersebut dapat pula ditulis sebagai berikut VFI5 > VFI5m > VFI5d. Tabel 6 Hasil tahap klasifikasi data Iris iterasi pertama. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
96,08%
96,08%
94,12%
49
49
48
2
2
3
51
51
51
Berdasarkan data yang tertera pada Tabel 3, terlihat bahwa VFI5d memiliki nilai di luar interval yang lebih banyak dari VFI5m. Hal ini dikarenakan jangkauan interval yang dimiliki oleh VFI5d lebih sempit dibandingkan dengan VFI5m (Lampiran 3 dan 4).
Dapat dilihat pada Tabel 5 bahwa VFI5 maupun VFI5d memiliki tingkat akurasi yang lebih baik sebesar 96,08% dibandingkan dengan VFI5m sebesar 94,12% sehingga selisih diantaranya sebesar 1,96%. Data mengenai jumlah instance dapat dilihat pada Lampiran 8.
Pada tahap klasifikasi terdapat pula nilai-nilai yang berada di luar interval. Hal ini terjadi pada VFI5, VFI5d dan VFI5m. Sama halnya pada tahap pelatihan, pada tahap klasifikasi ini pun nilai instance yang berada di luar interval terbagi menjadi dua macam, yaitu nilai instance yang memiliki nilai lebih kecil daripada nilai end point terkecil (di bawah interval) dan nilai instance yang memiliki nilai lebih besar daripada nilai end point terbesar (di atas interval) (Tabel 5).
Hasil prediksi tahap klasifikasi memperlihatkan bahwa kesalahan yang umum terjadi pada ketiga metode tersebut adalah instance yang termasuk ke dalam kelas IrisVirginica diprediksi sebagai kelas Iris-Versicolor ataupun sebaliknya. Data mengenai hasil prediksi dapat dilihat pada Lampiran 9, 10 dan 11.
Tabel 5 Jumlah instance data uji dengan nilai di luar interval pada data Iris iterasi pertama. Metode VFI5 VFI5d VFI5m
di bawah interval 2 10 8
di atas interval 1 8 3
Total 3 18 11
Data yang tertera pada Tabel 4 menunjukan bahwa VFI5 memiliki nilai di luar interval paling sedikit jika dibandingkan dengan VFI5d dan VFI5m. VFI5m memiliki nilai di luar interval lebih sedikit dibandingkan VFI5d (Lampiran 5, 6
Iterasi kedua Pada iterasi kedua ini, data latih terdiri dari 102 instances dan data uji terdiri dari 48 instances. Pada data latih, untuk semua kelas Iris, baik Iris-Setosa, Iris-Virginica dan IrisVersicolour berjumlah masing-masing 34 instances. Pada data uji, untuk semua kelas Iris, masing-masing berjumlah 16 instances (Tabel 7). Tabel 7 Jumlah instances data latih dan data uji untuk data Iris iterasi kedua. Data Latih Data Uji
IrisSetosa 34 16
IrisVirginica 34 16
IrisVersicolour 34 16
Banyaknya jumlah instance dari setiap feature yang memiliki nilai di luar interval pada tahap pelatihan dapat dilihat pada Tabel 8. Tabel 8 Jumlah instance data latih dengan nilai di luar interval pada data Iris iterasi kedua. Metode VFId VFI5m
di bawah interval 6 8
di atas interval 11 6
Total 17 14
VFI5d pada data Iris iterasi kedua ini menghasilkan nilai di luar interval yang lebih banyak dibandingkan dengan VFI5m (Lampiran 12 dan 13). Banyaknya jumlah instance dari setiap feature yang memiliki nilai di luar interval pada tahap klasifikasi dapat dilihat pada Tabel 9. Tabel 9 Jumlah instance data uji dengan nilai di luar interval pada data Iris iterasi kedua. Metode VFI5 VFI5d VFI5m
di bawah interval 1 3 2
di atas interval 4 10 8
Total 5 13 10
Seperti halnya pada data uji Iris iterasi pertama, jumlah nilai di luar interval pada data Iris iterasi kedua ini pun berturut-turut dari jumlah yang paling sedikit dimiliki oleh VFI5, selanjutnya VFI5m dan diikuti oleh VFI5d sehingga jangkauan interval dari ketiga metode tersebut dapat pula ditulis sebagai berikut VFI5 > VFI5m > VFI5d (Lampiran 14, 15 dan 16). Tabel 10 Hasil tahap klasifikasi data Iris iterasi kedua. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
93,75%
93,75%
87,50%
45
45
42
3
3
6
48
48
48
Berdasarkan data yang tertera pada Tabel 10 bahwa VFI5 dan VFI5d sama-sama memiliki
tingkat akurasi yang lebih baik sebesar 93,75% dibandingkan dengan VFI5m sebesar 87,50%. Informasi mengenai jumlah instance dapat dilihat pada Lampiran 17. Sama seperti halnya pada data Iris iterasi pertama, hasil prediksi tahap klasifikasi pada data Iris iterasi kedua ini memperlihatkan kesalahan yang umum terjadi adalah instance yang termasuk ke dalam kelas Iris-Virginica diprediksi sebagai kelas Iris-Versicolor ataupun sebaliknya. Kesalahan paling banyak terjadi pada pengklasifikasian dengan menggunakan algoritma VFI5d. Data mengenai hasil prediksi dapat dilihat pada Lampiran 18,19 dan 20. Iterasi ketiga Pada iterasi ketiga, data latih dan data uji sama jumlahnya dengan iterasi kedua. Jumlah instances yang dipergunakan dalam data latih dan data uji dapat dilihat pada Tabel 11. Tabel 11 Jumlah instances data latih dan data uji untuk data Iris iterasi ketiga. Data Latih Data Uji
IrisSetosa 34 16
IrisVirginica 34 16
IrisVersicolour 34 16
Banyaknya jumlah instance dari setiap feature yang memiliki nilai di luar interval pada tahap pelatihan dapat dilihat pada Tabel 12. Tabel 12 Jumlah instance data latih dengan nilai di luar interval pada data Iris iterasi ketiga. Metode VFI5d VFI5m
di bawah interval 9 7
di atas interval 10 5
Total 19 12
VFI5d menhasilkan jumlah instance dengan nilai di luar interval yang lebih banyak dibandingkan dengan VFI5m (Lampiran 21 dan 22). Pada tahap klasifikasi, banyaknya jumlah instance dari setiap feature yang memiliki nilai di luar interval hanya terjadi pada VFI5d dan VFI5m (Tabel 13).
Tabel 13 Jumlah instance data uji dengan nilai di luar interval pada data Iris iterasi ketiga. Metode VFI5 VFId VFI5m
di bawah interval 0 4 2
di atas interval 0 3 1
Total 0 7 3
Jumlah instance dengan nilai di luar interval yang dimiliki oleh VFI5d lebih banyak daripada VFI5m (Lampiran 23 dan 24). Hal ini dapat pula disimpulkan bahwa jangkauan interval VFI5m lebih besar dibandingkan dengan VFI5d (VFI5m > VFI5d) Tabel 14 Hasil tahap klasifikasi data Iris iterasi ketiga. Tingkat akurasi Instance yang benar Instance yang salah Total Instance
VFI5
VFI5d
VFI5m
97,92%
97,92%
100,00%
47
47
48
1
1
0
48
48
48
Berdasarkan Tabel 14, nilai kinerja VFI5m sebesar 100% dapat mengungguli VFI5 maupun VFI5d. VFI5 dan VFI5d sama-sama menghasilkan nilai kinerja sebesar 97,92% sehingga selisih diantaranya sebesar 2,08%. Data mengenai jumlah instance dapat dilihat pada Lampiran 25. Kesalahan hasil prediksi pada data Iris iterasi ketiga ini hanya terjadi pada algoritma VFI5 dan VFI5d. Kesalahan yang terjadi adalah instance yang termasuk ke dalam kelas Iris-Versicolor diprediksi sebagai kelas Iris-Virginica. Pada algoritma VFI5m semua instance berhasil diprediksi secara benar. Data mengenai hasil prediksi dapat dilihat pada Lampiran 26, 27 dan 28.
Akurasi data Iris Berdasarkan hasil yang didapatkan dari ketiga iterasi akan didapatkan nilai kinerja ratarata ketiga metode end point tersebut (Tabel 15). Tabel 15 Nilai kinerja rata-rata dari ketiga metode end point untuk data Iris. Metode VFI5 VFI5d VFI5m
Iterasi1 96,08% 96,08% 94,12%
Iterasi2 93,75% 93,75% 87,50%
Iterasi3 97,92% 97,92% 100,00%
Rata-rata 95,92% 95,92% 93,87%
VFI5 dan VFI5d menghasilkan tingkat kinerja yang sama, yaitu sebesar 95,92%. VFI5m menghasilkan kinerja yang berada sedikit dibawahnya, yaitu sebesar 93,87%. Jumlah instance di luar interval untuk iterasi ketiga jauh lebih sedikit dibandingkan iterasi pertama dan kedua sehingga mungkin hal ini mengakibatkan nilai kinerja yang lebih baik (Gambar 4). 100.00% 80.00% 60.00%
VFI5
40.00%
VFI5d
20.00%
VFI5m
0.00% 1
2
3
Gambar 4 Diagram nilai kinerja rata-rata untuk data Iris Nilai di luar interval pada data uji Iris yang dipetakan terhadap nilai kinerja ketiga metode tersebut akan memperlihatkan kecenderungan jumlah nilai di luar interval dari setiap metode VFI5. Pada Gambar 5 terlihat bahwa pola interval yang dimiliki oleh VFI5 lebih sedikit memiliki nilai di luar interval dibandingkan dengan VFI5d dan VFI5m.
Akurasi (%)
100 95 VFI5
90
VFI5d
85
VFI5m 80 0
2
4
6
8
10 12 14 16 18 20
Nilai di luar interval (instance)
Gambar 5 Diagram nilai kinerja terhadap nilai di luar interval pada data uji Iris
VFI5d memiliki nilai di luar interval yang lebih banyak dibandingkan dengan VFI5m. VFI5d memiliki 105 nilai instance yang berada di luar interval, sedangkan VFI5m memiliki 33 nilai instance (Lampiran 29 dan 30). Seperti halnya tahap klasifikasi pada data Iris, tahap klasifikasi pada data Wine ini pun memiliki nilai instance yang berada di luar interval (Tabel 18).
Data Wine
Tabel 18 Jumlah instance data uji dengan nilai di luar interval pada data Wine iterasi pertama.
Data awal sebanyak 178 instances dan terdiri dari 3 kelas, yaitu: 59 instances kelas 1, 71 instances kelas 2 dan 48 instances kelas 3.
Metode VFI5 VFI5d VFI5m
Iterasi pertama Data latih pada data Wine terdiri dari 119 instances dan data uji terdiri dari 59 instances. Pada data latih, untuk kelas 1 terdiri dari 39 instance, kelas 2 terdiri dari 48 instance dan kelas 3 terdiri dari 32 instances. Pada data uji, untuk kelas 1 berjumlah 20 instance, kelas 2 berjumlah 23 instance dan kelas 3 berjumlah 16 instance (Tabel 16). Tabel 16 Jumlah instances data latih dan data uji untuk data Wine iterasi pertama. Data Latih Data Uji
Kelas 1 39 20
Kelas 2 48 23
Kelas 3 32 16
Sama halnya tahap pelatihan pada data Iris, tahap pelatihan pada data Wine ini pun memiliki nilai instance yang berada di luar interval. Banyaknya jumlah instance yang memiliki nilai di luar interval dari setiap feature dapat dilihat pada Tabel 17. Tabel 17 Jumlah instance data latih dengan nilai di luar interval pada data Wine iterasi pertama. Metode VFI5d VFI5m
di bawah interval 43 13
di atas interval 62 20
Total 105 33
di bawah interval 15 43 22
di atas interval 6 45 25
Total 21 88 47
Berdasarkan Tabel 18, terlihat bahwa nilai di luar interval yang dimiliki oleh VFI5d berjumlah paling banyak dibandingkan dengan VFI5 dan VFI5m (Lampiran 31, 32 dan 33). VFI5m memiliki jumlah lebih banyak dibandingkan VFI5 sehingga jangkauan interval yang dimiliki oleh VFI5 lebih besar dibandingkan VFI5d dan VFI5m (VFI5 > VFI5m > VFI5d). Tabel 19 Hasil tahap klasifikasi data Wine iterasi pertama. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
94,92%
84,75%
93,22%
56
50
55
3
9
4
59
59
59
Tingkat kinerja VFI5 memiliki nilai yang lebih baik dibandingkan dengan VFI5d maupun VFI5m, yaitu sebesar 94,92%. VFI5d menghasilkan nilai akurasi 84,75% dan VFI5m menghasilkan nilai kinerja sebesar 93,22% (Tabel 19). Banyaknya jumlah instance dapat dilihat pada Lampiran 34.
Kesalahan prediksi pada data Wine iterasi pertama ini umumnya terjadi pada instance yang termasuk ke dalam kelas 2 yang dikenali sebagai kelas 1 ataupun kelas 3. Hal ini terjadi pada kesemua algoritma. Khususnya pada algoritma VFI5d, kesalahan hasil prediksi pun terjadi pada instance yang termasuk kedalam kelas 3 yang dikenali sebagai kelas 2. Data mengenai hasil prediksi dapat dilihat pada Lampiran 35, 36 dan 37. Iterasi kedua Data latih terdiri dari 119 instances dan data uji terdiri dari 59 instances. Pada data latih, untuk kelas 1 terdiri dari 39 instance, kelas 2 terdiri dari 48 instance dan kelas 3 terdiri dari 32 instances. Pada data uji, untuk kelas 1 berjumlah 20 instance, kelas 2 berjumlah 23 instance dan kelas 3 berjumlah 16 instance (Tabel 20). Tabel 20 Jumlah instances data latih dan data uji untuk data Wine iterasi kedua. Data Latih Data Uji
Kelas 1 39 20
Kelas 2 48 23
Kelas 3 32 16
Banyaknya jumlah instance yang memiliki nilai di luar interval dari setiap feature dapat dilihat pada Tabel 21. Tabel 21 Jumlah instance data latih dengan nilai di luar interval pada data Wine iterasi kedua. Metode VFI5d VFI5m
di bawah interval 50 17
di atas interval 62 17
Total 112 34
VFI5m memiliki nilai di luar interval yang jauh lebih sedikit bila dibandingkan dengan VFI5d. VFI5m memiliki jumlah instance sebanyak 34, sedangkan VFI5d memiliki 112 instance (Lampiran 38 dan 39). Jumlah instance yang memiliki nilai di luar interval pada tahap klasifikasi dapat dilihat pada Tabel 22.
Tabel 22 Jumlah instance data uji dengan nilai di luar interval pada data Wine iterasi kedua. Metode VFI5 VFI5d VFI5m
di bawah interval 8 23 21
di atas interval 5 36 11
Total 13 59 32
Seperti halnya pada iterasi kedua VFI5 memiliki jumlah instance dengan nilai di luar interval yang jauh lebih sedikit dibandingkan dengan VFI5d maupun VFI5m (Lampiran 40, 41 dan 42). Maka jangkauan interval yang dimiliki VFI5 lebih besar dibandingkan VFI5d dan VFI5m (VFI5 > VFI5m > VFI5d). Tabel 23 Hasil tahap klasifikasi data Wine iterasi kedua. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
93,22%
94,92%
88,14%
55
56
52
4
3
7
59
59
59
Kinerja yang dihasilkan oleh VFI5d dengan nilai 94,92% mampu mengungguli VFI5 yang memiliki nilai 93,22%. VFI5m dengan nilai 88,14% masih belum mampu mendekati kinerja kedua algoritma VFI5 dengan metode yang berbeda. Banyaknya jumlah instance dapat dilihat pada Lampiran 43. Hasil prediksi tahap klasifikasi pada data Wine iterasi kedua ini memiliki kesalahan yang cukup beragam. Instance yang termasuk ke dalam kelas 1 dikenali sebagai kelas 2, instance yang termasuk ke dalam kelas 2 dikenali sebagai kelas 1 atau kelas 3 serta instance yang termasuk kelas 3 dikenali sebagai kelas 2. Hal ini terjadi pada algoritma VFI5 dan algoritma VFI5m. Pada algoritma VFI5d kesalahan hasil prediksi hanya terjadi pada instance yang
termasuk ke dalam kelas 1 dan kelas 3, instance yang termasuk ke dalam kelas 2 seluruhnya berhasil diprediksi secara benar. Instance yang termasuk ke dalam kelas 1 salah diprediksi menjadi kelas 2 dan instance yang termasuk ke dalam kelas 3 salah diprediksi menjadi kelas 2 (Lampiran 44, 45 dan 46).
Tabel 26 Jumlah instance data uji dengan nilai di luar interval pada data Wine iterasi ketiga.
Iterasi ketiga
Berdasarkan Tabel 26, berturut-turut mulai dari jumlah instance yang paling sedikit dimiliki oleh VFI5, kemudian VFI5m selanjutnya VFI5d (Lampiran 49, 50 dan 51). Maka jangkauan interval yang paling besar dimiliki oleh VFI5 (VFI5 > VFI5m > VFI5d).
Data latih terdiri dari 118 instances dan data uji terdiri dari 60 instances. Pada data latih, untuk kelas 1 terdiri dari 40 instance, kelas 2 terdiri dari 46 instance dan kelas 3 terdiri dari 32 instances. Pada data uji, untuk kelas 1 berjumlah 19 instance, kelas 2 berjumlah 25 instance dan kelas 3 berjumlah 16 instance (Tabel 24). Tabel 24 Jumlah instances data latih dan data uji untuk data Wine iterasi ketiga. Data Latih Data Uji
Kelas 1 40 19
Kelas 2 46 25
Kelas 3 32 16
Banyaknya jumlah instance yang memiliki nilai di luar interval dari setiap feature dapat dilihat pada Tabel 25. Tabel 25 Jumlah instance data latih dengan nilai di luar interval pada data Wine iterasi ketiga. Metode VFI5d VFI5m
di bawah interval 53 15
di atas interval 58 20
Total 111 35
VFI5m memiliki nilai di luar interval yang jauh lebih sedikit, yaitu 35 instance bila dibandingkan dengan VFI5d yang memiliki instance sebanyak 111 (Lampiran 47 dan 48). Jumlah instance yang memiliki nilai di luar interval pada tahap klasifikasi dapat dilihat pada Tabel 26.
Metode VFI5 VFI5d VFI5m
di bawah interval 8 29 9
di atas interval 8 29 15
Total 16 58 24
Tabel 27 Hasil tahap klasifikasi data Wine iterasi ketiga. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
95,00%
95,00%
96,67%
57
57
58
3
3
2
60
60
60
Dapat dilihat pada Tabel 27, nilai kinerja VFI5m sebesar 96,67% mengungguli VFI5 dan VFI5d. VFI5 dan VFI5d menghasilkan nilai kinerja sama, yaitu sebesar 95% sehingga selisih kinerja mencapai 1,67%. Jumlah instance dapat dilihat pada Lampiran 52. Kesalahan hasil prediksi pada algoritma VFI5d dan algoritma VFI5m terjadi pada instance yang termasuk ke dalam kelas 2 yang dikenali sebagai kelas 1. Pada algoritma VFI5, kesalahan terjadi pada instance yang termasuk ke dalam kelas 1 dikenali sebagai kelas 3 dan instance yang teramsuk ke dalam kelas 3 dikenali sebagai kelas 2 (Lampiran 53, 54 dan 55). Akurasi data Wine Berdasarkan hasil yang didapatkan dari ketiga iterasi akan didapatkan nilai kinerja ratarata ketiga metode end point tersebut (Tabel 28).
Tabel 28 Nilai kinerja rata-rata dari ketiga metode end point untuk data Wine. Metode VFI5 VFI5d VFI5m
Iterasi1 94,92% 84,75% 93,22%
Iterasi2 93,22% 94,92% 88,14%
Iterasi3 95,00% 95,00% 96,67%
Rata-rata 94,38% 91,55% 92,67%
Data Ikan Koi Data awal sebanyak 119 instances dan terdiri dari 2 kelas, yaitu: 59 instances kelas ikan betina dan 60 instances kelas ikan jantan. Iterasi pertama
VFI5 menghasilkan tingkat kinerja sebesar 94,38%. VFI5d menghasilkan nilai kinerja yang terkecil yaitu sebesar 91,55%. VFI5m menghasilkan kinerja yang berada sedikit dibawah VFI5, yaitu sebesar 92,67% (Gambar 6). 100.00% 80.00% 60.00%
VFI5
40.00%
VFI5d VFI5m
20.00% 0.00% 1
2
3
Gambar 6 Diagram nilai kinerja rata-rata untuk data Wine Nilai di luar interval pada data uji Wine yang dipetakan terhadap nilai kinerja ketiga metode tersebut akan memperlihatkan kecenderungan jumlah nilai di luar interval dari setiap metode VFI5. Pada Gambar 7 terlihat bahwa pola interval yang dimiliki oleh VFI5 lebih sedikit memiliki nilai di luar interval dibandingkan dengan VFI5d dan VFI5m.
Akurasi (%)
100 95 VFI5
90
VFI5d 85
VFI5m
80 0
20 40 60 80 Nilai di luar interval (instance)
100
Gambar 7 Diagram nilai kinerja terhadap nilai di luar interval pada data uji Wine
Data latih untuk data Ikan Koi ini terdiri dari 79 instances dan data uji terdiri dari 40 instances. Pada data latih, untuk kelas ikan betina terdiri dari 39 instance dan kelas ikan jantan terdiri dari 40 instance. Pada data uji, untuk kelas ikan betina berjumlah 20 instance dan kelas ikan jantan berjumlah 20 instance (Tabel 29). Tabel 29 Jumlah instances data latih dan data uji untuk data Ikan Koi iterasi pertama. Data Latih Data Uji
Kelas ikan betina 39 20
Kelas ikan jantan 40 20
Banyaknya jumlah instance yang memiliki nilai di luar interval dari setiap feature dapat dilihat pada Tabel 30. Tabel 30 Jumlah instance data latih dengan nilai di luar interval pada data Ikan Koi iterasi pertama. Metode VFI5d VFI5m
di bawah interval 39 23
di atas interval 33 60
Total 72 83
VFI5m memiliki nilai di luar interval yang sedikit lebih banyak, yaitu 83 instance bila dibandingkan dengan VFI5d yang memiliki instance sebanyak 72 (Lampiran 56 dan 57). Jumlah instance yang memiliki nilai di luar interval pada tahap klasifikasi dapat dilihat pada Tabel 31. Tabel 31 Jumlah instance data uji dengan nilai di luar interval pada data Ikan Koi iterasi pertama. Metode VFI5 VFI5d VFI5m
di bawah interval 3 30 27
di atas interval 7 26 44
Total 10 56 71
VFI5 memiliki jumlah instance dengan nilai di luar interval yang jauh lebih sedikit dibandingkan dengan VFI5d maupun VFI5m (Lampiran 58, 59 dan 60). Jumlah instance bagi VFI5d masih lebih sedikit bila dibandingkan dengan VFI5m sehingga jangkauan interval secara berturut-turut adalah VFI5 > VFI5d >VFI5m. Tabel 32 Hasil tahap klasifikasi data Ikan Koi iterasi pertama. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
92,50%
95,00%
82,50%
37
38
33
3
2
7
40
40
40
Pada iterasi pertama ini nilai kinerja diantara ketiga metode ini bervariasi. VFI5 menghasilkan nilai kinerja sebesar 92,5%, VFI5d menghasilkan nilai kinerja yang lebih baik, yaitu sebesar 95%, sedangkan VFI5m menghasilkan nilai kinerja yang terkecil diantara ketiganya yaitu sebesar 82,50%. Jumlah instance dapat dilihat pada Lampiran 61. Pada algoritma VFI5d dan algoritma VFI5m, kesalahan hasil prediksi terjadi pada instance yang termasuk ke dalam kelas jantan yang dikenali sebagai kelas betina ataupun sebaliknya, sedangkan pada algoritma VFI5 hanya terjadi pada instance yang termasuk ke dalam kelas betina yang dikenali sebagai kelas jantan (Lampiran 62, 63 dan 64). Iterasi kedua Data latih terdiri dari 79 instances dan data uji terdiri dari 40 instances. Pada data latih, untuk kelas ikan betina terdiri dari 39 instance dan kelas ikan jantan terdiri dari 40 instance. Pada data uji, untuk kelas ikan betina berjumlah 20 instance dan
kelas ikan jantan berjumlah 20 instance (Tabel 33). Tabel 33 Jumlah instances data latih dan data uji untuk data Ikan Koi iterasi kedua. Data Latih Data Uji
Kelas ikan betina 39 20
Kelas ikan jantan 40 20
Banyaknya jumlah instance yang memiliki nilai di luar interval dari setiap feature dapat dilihat pada Tabel 34. Tabel 34 Jumlah instance data latih dengan nilai di luar interval pada data Ikan Koi iterasi kedua. Metode VFI5d VFI5m
di bawah interval 38 30
di atas interval 30 43
Total 68 73
VFI5m memiliki nilai di luar interval yang sedikit lebih banyak, yaitu 73 instance bila dibandingkan dengan VFI5d yang memiliki instance sebanyak 68 (Lampiran 65 dan 66). Jumlah instance yang memiliki nilai di luar interval pada tahap klasifikasi dapat dilihat pada Tabel 35. Tabel 35 Jumlah instance data uji dengan nilai di luar interval pada data Ikan Koi iterasi kedua. Metode VFI5 VFI5d VFI5m
di bawah interval 0 23 13
di atas interval 0 11 27
Total 0 34 40
VFI5 tidak memiliki instance dengan nilai di luar interval. Jumlah instance bagi VFI5d masih lebih sedikit bila dibandingkan dengan VFI5m sehingga jangkauan interval secara berturut-turut adalah VFI5 > VFI5d >VFI5m (Lampiran 67 dan 68).
Tabel 36 Hasil tahap klasifikasi data Ikan Koi iterasi kedua. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
97,50%
97,50%
92,50%
39
39
37
1
1
3
40
40
40
Pada data Ikan Koi iterasi kedua ini VFI5 dan VFI5d menghasilkan nilai kinerja yang sama, yaitu sebesar 97,5%, sedangkan VFI5m menghasilkan nilai kinerja yang lebih buruk, yaitu sebesar 92,5%. Jumlah instance dapat dilihat pada Lampiran 69. Pada algoritma VFI5, kesalahan hasil prediksi terjadi pada instance yang termasuk ke dalam kelas jantan yang dikenali sebagai kelas betina, sedangkan pada algoritma VFI5d terjadi sebaliknya, instance yang termasuk ke dalam kelas betina salah diprediksi menjadi kelas jantan. Kedua macam kesalahan prediksi hasil tersebut muncul pada algoritma VFI5m (Lampiran 70, 71 dan 72). Iterasi ketiga Data latih terdiri dari 80 instances dan data uji terdiri dari 39 instances. Pada data latih, untuk kelas ikan betina terdiri dari 40 instance dan kelas ikan jantan terdiri dari 40 instance. Pada data uji, untuk kelas ikan betina berjumlah 19 instance dan kelas ikan jantan berjumlah 20 instance (Tabel 37). Tabel 37 Jumlah instances data latih dan data uji untuk data Ikan Koi iterasi ketiga. Data Latih Data Uji
Kelas ikan betina 40 19
Kelas ikan jantan 40 20
Banyaknya jumlah instance yang memiliki nilai di luar interval dari setiap feature dapat dilihat pada Tabel 38.
Tabel 38 Jumlah instance data latih dengan nilai di luar interval pada data Ikan Koi iterasi ketiga. Metode VFI5d VFI5m
di bawah interval 42 41
di atas interval 36 55
Total 78 96
VFI5m memiliki nilai di luar interval yang sedikit lebih banyak, yaitu 96 instance bila dibandingkan dengan VFI5d yang memiliki instance sebanyak 78 (Lampiran 73 dan 74). Jumlah instance yang memiliki nilai di luar interval pada tahap klasifikasi dapat dilihat pada Tabel 39. Tabel 39 Jumlah instance data uji dengan nilai di luar interval pada data Ikan Koi iterasi kedua. Metode VFI5 VFI5d VFI5m
di bawah interval 12 16 14
di atas interval 16 23 29
Total 28 39 43
VFI5 memiliki instance dengan nilai di luar interval sebesar 28 instance. Jumlah instance bagi VFI5d masih lebih sedikit bila dibandingkan dengan VFI5m sehingga jangkauan interval secara berturut-turut adalah VFI5 > VFI5d >VFI5m (Lampiran 75, 76 dan 77). Tabel 40 Hasil tahap klasifikasi data Ikan Koi iterasi ketiga. Tingkat akurasi Instance yang benar Instance yang salah Total instance
VFI5
VFI5d
VFI5m
94,87%
94,87%
100,00%
37
37
39
2
2
0
39
39
39
Berdasarkan Tabel 39, nilai kinerja yang dihasilkan oleh VFI5 dan VFI5d sama, yaitu sebesar 94,87%, sedangkan VFI5m menghasilkan nilai yang lebih baik yaitu 100%. Banyaknya jumlah instance dapat dilihat pada Lampiran 78.
100 95 Akurasi (%)
Pada algoritma VFI5, kesalahan hasil prediksi terjadi pada instance yang termasuk ke dalam kelas jantan yang dikenali sebagai kelas betina, sedangkan pada algoritma VFI5d terjadi sebaliknya, instance yang termasuk ke dalam kelas betina salah diprediksi menjadi kelas jantan. Pada algoritma VFI5m semua instance berhasil diprediksi secara benar (Lampiran 79, 80 dan 81).
VFI5
90
VFI5d 85
VFI5m
80
Akurasi data Ikan Koi
0
Berdasarkan hasil yang didapatkan dari ketiga iterasi akan didapatkan nilai kinerja ratarata ketiga metode end point tersebut (Tabel 41). Tabel 41 Nilai kinerja rata-rata dari ketiga metode end point untuk data Ikan Koi. Metode VFI5 VFI5d VFI5m
Iterasi1 92,50% 95,00% 82,50%
Iterasi2 97,50% 97,50% 92,50%
Iterasi3 94,87% 94,87% 100,00%
Rata-rata 94,96% 95,79% 91,67%
VFI5 menghasilkan tingkat kinerja sebesar 94,96%. VFI5d menghasilkan nilai kinerja yang lebih baik yaitu sebesar 95,79%. VFI5m menghasilkan kinerja yang paling kecil, yaitu sebesar 91,67% (Gambar 8). 100.00% 80.00% 60.00%
VFI5
40.00%
VFI5d
20.00%
VFI5m
0.00% 1
2
3
Gambar 8 Diagram nilai kinerja rata-rata untuk data Ikan Koi Nilai di luar interval pada data uji Wine yang dipetakan terhadap nilai kinerja ketiga metode tersebut akan memperlihatkan kecenderungan jumlah nilai di luar interval dari setiap metode VFI5. Pada Gambar 9 terlihat bahwa pola interval yang dimiliki oleh VFI5 lebih sedikit memiliki nilai di luar interval dibandingkan dengan VFI5d dan VFI5m.
20
40
60
80
Nilai di luar interval (instance)
Gambar 9 Diagram nilai kinerja terhadap nilai di luar interval pada data uji Ikan Koi
KESIMPULAN DAN SARAN Kesimpulan Algoritma VFI5 biasa memiliki selang nilai akurasi rata-rata sebesar 1,54% dari seluruh data yang diuji. Algoritma VFI5 dengan metode end point desil dan algoritma VFI5 dengan metode end point min(n+1) max(n-1) cenderung memiliki selang nilai akurasi rata-rata yang lebih besar dibandingkan dengan algoritma VFI5 biasa, yaitu sebesar 4,37% untuk algoritma VFI5 dengan metode end point desil dan 2,2% untuk algoritma VFI5 dengan metode end point min(n+1) max(n1). Algoritma VFI5 menghasilkan nilai akurasi rata-rata sebesar 95,92% pada pengujian data Iris. Nilai yang sama pun diperoleh oleh algoritma VFI5 dengan metode end point desil, sedangkan algoritma VFI5 dengan metode end point min(n+1) max(n-1) hanya menghasilkan nilai akurasi rata-rata sebesar 93,87%. Pada pengujian data Wine, algoritma VFI5 menghasilkan nilai akurasi rata-rata sebesar 94,38%. Algoritma VFI5 dengan metode end point desil menghasilkan nilai akurasi rata-rata yang cukup jauh dibawah nilai akurasi rata-rata algoritma VFI5 biasa, yaitu sebesar 91,55%, sedangkan algoritma VFI5 dengan metode end
Intervals. New Trends in Artificial Intelligence and Neural Networks(TAINN’97) : 190-194. http://citeseer.ist.psu.edu /paper/34532.pdf. [November 2008]
point min(n+1) max(n-1) menghasilkan nilai akurasi rata-rata sebesar 92,67%. Pada pengujian data Ikan Koi, nilai akurasi rata-rata algoritma VFI5 dengan metode end point desil sebesar 95,79% dapat melebihi nilai akurasi rata-rata algoritma VFI5 biasa yang menghasilkan nilai 94,96%. Nilai akurasi rata-rata algoritma VFI5 dengan metode end point min(n+1) max(n1) terpaut cukup jauh dibandingkan kedua algoritma yang lainnya, yaitu sebesar 91,67%. Algoritma VFI5 dengan metode end point desil dan algoritma VFI5 dengan metode end point min(n+1) max(n-1) akan mengalami kecenderungan penurunan kinerja bila dibandingkan dengan algoritma VFI5 biasa. Semakin banyaknya jumlah data uji yang memiliki nilai di luar interval akan membuat turunnya kinerja algoritma VFI5 dengan metode end point desil dan algoritma VFI5 dengan metode end point min(n+1) max(n-1). Saran Penelitian ini dapat dikembangkan lebih lanjut dengan mengkonsentrasikan titik penelitian pada pengujian metode penentuan end point min max, end point desil dan end point min(n+1) max(n-1) terhadap tingkat kemenjuluran data (skewness) yang lebih besar.
Fleming M.C, Nellis J.G. 1994. Principles of Applied Statistic. New York : Routledge. Fu L. 1994. Neural Network in Computers Intelligence. Singapura : McGraw-Hill. Hamilton H, Gurak E, Findlater L. 2003. Confusion Matrix. http://www2.cs.uregina.ca/ ~dbd/cs831/notes/confusion_matrix/confusio n_matrix.html. Han J, Kamber M. 2001 . Data Mining Concepts & Techniques. USA : Academic Press. Navidi W. 2006. Statistic for Engineers and Scientists. New York : McGraw-Hill. Sarle W. 2004. What are cross-validation and bootstrapping?. http://www.faqs.org/faqs/ aifaq/neural-nets/part3/section-12.html [November 2008]
DAFTAR PUSTAKA Demiroz G. 1997. Non-Incremental Classification Learning Algorithms Based on Voting Feature Intervals. http://www.cs.bilkent. edu.tr/tech-reports/1997/BU-CEIS9715.ps.gz Demiroz G, Guvenir HA. 1997. Classification by Voting Feature Intervals. http://www.cs.bilkent.edu.tr/tech-reports/ 1997/BU-CEIS-9708.ps.gz Demiroz G, Guvenir HA, Ilter N. 1997. Differential Diagnosis of ErythematoSquamous Diseases using Voting Feature
LAMPIRAN
Lampiran 1 Jenis feature (f) pada data Iris Feature keFeature 1 Feature 2 Feature 3 Feature 4
Nama feature Sepal Length Sepal Width Petal Length Petal Width
Lampiran 2 Jenis feature (f) pada data Ikan Koi Feature keFeature 1 Feature 2 Feature 3 Feature 4 Feature 5 Feature 6 Feature 7 Feature 8 Feature 9 Feature 10 Feature 11 Feature 12 Feature 13
Nama feature Panjang Lebar Perimeter Elongation Circularity Rectangular Area Index Merah Index Hijau Index Biru Intensitas Hue Saturation
Lampiran 3 Nilai instance di luar interval pada data latih Iris iterasi pertama dengan metode VFI5d feature 1 2 3 4
Di bawah interval 3 5 2 3
Di atas interval 1 2 3 3
Jumlah
13
9
Lampiran 4 Nilai instance di luar interval pada data latih Iris iterasi pertama dengan metode VFI5m feature 1 2 3 4 Jumlah
Di bawah interval 2 2 1 3 8
Di atas interval 1 1 1 1 4
Lampiran 5 Nilai instance di luar interval pada data uji Iris iterasi pertama dengan metode VFI5 instance 14 16 28 Jumlah instance
Di bawah interval 1
Di atas interval 2
2 2
1
Lampiran 6 Nilai instance di luar interval pada data uji Iris iterasi pertama dengan metode VFI5m instance 9 10 13 14 14 14 16 28 30 35 44 Jumlah instance
Di bawah interval 1 4 4 1 3 4
Di atas interval
2
2 2 4 4 8
3
Lampiran 7 Nilai instance di luar interval pada data uji Iris iterasi pertama dengan metode VFI5d instance 6 9 10 13 14 14 14 15 16 17 21 28 30 35 40 44 49 Jumlah instance
Di bawah interval 1 4 4 1 3 4 3
Di atas interval 2
2 2 2
2 2 2 4 3 4 4 10
8
Lampiran 8 Nilai hasil proses klasifikasi untuk iterasi pertama pada data Iris
instance 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kelas aktual 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2
Kelas VFI5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 3 2 2 2 2 2
Kelas VFI5d 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 3 2 2 2 2 2
Kelas VFI5m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 3 2 2 2 2 2
instance 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51
Kelas aktual 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3
Kelas VFI5d 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3
Kelas VFI5m 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3 3 3 3 2 3 3 3
Lampiran 9 Confusion matrix pada data uji Iris iterasi pertama dengan metode VFI5
Aktual
Data Setosa Virginica Versicolor
Setosa 17 0 0
Prediksi Virginica Versicolor 0 0 16 1 1 16
Lampiran 10 Confusion matrix pada data uji Iris iterasi pertama dengan metode VFI5d
Aktual
Data Setosa Virginica Versicolor
Setosa 17 0 0
Prediksi Virginica Versicolor 0 0 16 1 1 16
Lampiran 11 Confusion matrix pada data uji Iris iterasi pertama dengan metode VFI5m
Aktual
Data Setosa Virginica Versicolor
Setosa 17 0 0
Prediksi Virginica Versicolor 0 0 16 1 2 15
Lampiran 12 Nilai instance di luar interval pada data latih Iris iterasi kedua dengan metode VFI5d feature 1 2 3 4 Jumlah
Di bawah interval 1 2 3 6
Di atas interval 3 3 2 3 11
Lampiran 13 Nilai instance di luar interval pada data latih Iris iterasi kedua dengan metode VFI5m feature 1 2 3 4 Jumlah
Di bawah interval 1 1 1 5 8
Di atas interval 1 1 1 3 6
Lampiran 14 Nilai instance di luar interval pada data uji Iris iterasi kedua dengan metode VFI5 instance 6 33 34 38 47 Jumlah instance
Di bawah interval 3
Di atas interval 3 3 3 1
1
4
Lampiran 15 Nilai instance di luar interval pada data uji Iris iterasi kedua dengan metode VFI5m instance 6 16 33 33 34 34 38 38 47 47 Jumlah instance
Di bawah interval 3 4
Di atas interval
1 3 1 3 1 3 1 3 2
8
Lampiran 16 Nilai instance di luar interval pada data uji Iris iterasi kedua dengan metode VFI5d instance 6 16 18 33 33 34 34 35 38 38 46 47 47 Jumlah instance
Di bawah interval 3
Di atas interval 2
2 1 3 1 3 2 1 3 1 1 3 3
10
Lampiran 17 Nilai hasil proses klasifikasi untuk iterasi kedua pada data Iris instance 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kelas aktual 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Kelas VFI5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 3 2 2 2 2 2
Kelas VFI5d 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 3 2 2 2 2 2
Kelas VFI5m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 3 2 2 2 2 2
instance 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Kelas aktual 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Lampiran 18 Confusion matrix pada data uji Iris iterasi kedua dengan metode VFI5
Aktual
Data Setosa Virginica Versicolor
Setosa 16 0 0
Prediksi Virginica Versicolor 0 0 14 2 1 15
Lampiran 19 Confusion matrix pada data uji Iris iterasi kedua dengan metode VFI5d
Aktual
Data Setosa Virginica Versicolor
Setosa 16 0 0
Prediksi Virginica Versicolor 0 14 1
0 2 15
Kelas VFI5 2 3 2 2 2 2 2 3 3 2 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5d 2 3 2 2 2 2 2 3 3 2 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5m 3 3 2 2 2 2 2 3 3 2 3 2 3 2 3 3 3 3 3 3 3 3 3
Lampiran 20 Confusion matrix pada data uji Iris iterasi kedua dengan metode VFI5m
Aktual
Data Setosa Virginica Versicolor
Setosa 16 0 0
Prediksi Virginica Versicolor 0 0 13 3 3 13
Lampiran 21 Nilai instance di luar interval pada data latih Iris iterasi ketiga dengan metode VFI5d feature 1 2 3 4 Jumlah
Di bawah interval 2 4 3 9
Di atas interval 1 3 3 3 10
Lampiran 22 Nilai instance di luar interval pada data latih Iris iterasi ketiga dengan metode VFI5m feature 1 2 3 4 Jumlah
Di bawah interval 1 1 1 4 7
Di atas interval 1 1 1 2 5
Lampiran 23 Nilai instance di luar interval pada data uji Iris iterasi ketiga dengan metode VFI5m instance 1 4 43 Jumlah instance
Di bawah interval 4 4
Di atas interval
4 2
1
Lampiran 24 Nilai instance di luar interval pada data uji Iris iterasi ketiga dengan metode VFI5d instance 2 5 8 9 35 39 43 Jumlah instance
Di bawah interval 3 1 1 1
Di atas interval
4 4 4 4
3
Lampiran 25 Nilai hasil proses klasifikasi untuk iterasi ketiga pada data Iris instance 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kelas aktual 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Kelas VFI5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Kelas VFI5d 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
Kelas VFI5m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2
instance 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Kelas aktual 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5d 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5m 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Lampiran 26 Confusion matrix pada data uji Iris iterasi ketiga dengan metode VFI5
Aktual
Data Setosa Virginica Versicolor
Setosa 16 0 0
Prediksi Virginica Versicolor 0 0 16 0 1 15
Lampiran 27 Confusion matrix pada data uji Iris iterasi ketiga dengan metode VFI5d
Aktual
Data Setosa Virginica Versicolor
Setosa 16 0 0
Prediksi Virginica Versicolor 0 0 16 0 1 15
Lampiran 28 Confusion matrix pada data uji Iris iterasi ketiga dengan metode VFI5m
Aktual
Data Setosa Virginica Versicolor
Setosa 16 0 0
Prediksi Virginica Versicolor 0 0 16 0 0 16
Lampiran 29 Nilai instance di luar interval pada data latih Wine iterasi pertama dengan metode VFI5d feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 4 4 4 3 2 3 3 5 3 4 3 1 4 43
Di atas interval 4 4 10 6 5 3 5 5 6 3 4 5 2 62
Lampiran 30 Nilai instance di luar interval pada data latih Wine iterasi pertama dengan metode VFI5m feature 1 2 3 4 5 6 7 8 9 10 11 12 13
Di bawah interval 1 1 1 1 1 1 1 1 1 1 1 1 1
Di atas interval 2 2 2 3 1 2 1 2 1 1 1 1 1
Jumlah
13
20
Lampiran 31 Nilai instance di luar interval pada data uji Wine iterasi pertama dengan metode VFI5 instance 2 7 9 14 14 15 15 19 21 21 21 22 23 30 35 36 42 44 47 50 56 Jumlah instance
Di bawah interval 4
Di atas interval 1 1
4 1 4 13 13 3 4 9 9 9 9 4 8 13 12 12 12 9 15
6
Lampiran 32 Nilai instance di luar interval pada data uji Wine iterasi pertama dengan metode VFI5d instance 1 1 1 2 3 4 4 4 5 6 6 7 7 7 8 9 9 11 13 14 14 14 14 15 15 15 15 15 15 16 17 19 19 19 20 21 21 21 21 21 22 22 23 24 25 25
Di bawah interval
Di atas interval 1 5 12
4 9 1 6 13 3 6 13 4 1 13 13 4 1 13 13 4 1 7 9 4 1 6 7 9 13 13 1 6 7 13 8 2 3 4 9 10 9 8 9 9 8 6
instance 26 28 28 28 29 30 30 31 31 31 32 33 35 35 35 36 36 36 38 38 40 40 40 40 42 42 42 44 45 46 47 47 49 50 50 51 51 52 54 55 56 57 Jumlah instance
Di bawah interval
Di atas interval 11
2 3 5 5 2 9 3 8 5 6 11 4 5 6 2 8 6 2 3 2 4 5 9 2 13 11 12 6 6 8 12 8 7 12 2 8 7 9 9 9 2 43
45
Lampiran 33 Nilai instance di luar interval pada data uji Wine iterasi pertama dengan metode VFI5m instance 1 1 2 4 4 4 6 7 9 11 14 14 15 15 15 17 19 19 21 21 21 22 22 23 25
Di bawah interval
Di atas interval 1 12
4 1 6 13 13 1 1 13 4 1 4 1 13 1 7 13 3 4 9 9 8 9 6
instance 26 28 30 31 31 31 32 35 35 36 38 40 42 44 46 47 49 50 51 51 55 56 Jumlah instance
Di bawah interval
Di atas interval 11
3 9 3 8 5 6 4 5 8 3 5 13 12 6 12 8 12 2 8 9 9 22
25
Lampiran 34 Nilai hasil proses klasifikasi untuk iterasi pertama pada data Wine
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Kelas aktual 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2
Kelas VFI5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2
Kelas VFI5d 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 3
Kelas VFI5m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 3
23
2
2
3
2
24 25 26 27 28 29 30
2 2 2 2 2 2 2
2 2 2 2 1 2 2
2 2 2 1 1 2 3
2 2 2 2 1 2 3
instance
instance 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59
Kelas aktual 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5 2 3 2 2 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5d 2 3 2 2 1 2 2 2 2 2 2 2 1 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5m 2 2 2 2 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Lampiran 35 Confusion matrix pada data uji Wine iterasi pertama dengan metode VFI5
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 20 2 0
Prediksi Kelas 2 0 20 0
Kelas 3 0 1 16
Lampiran 36 Confusion matrix pada data uji Wine iterasi pertama dengan metode VFI5d
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 20 4 0
Prediksi Kelas 2 0 15 1
Kelas 3 0 4 15
Lampiran 37 Confusion matrix pada data uji Wine iterasi pertama dengan metode VFI5m
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 20 2 0
Prediksi Kelas 2 0 19 0
Kelas 3 0 2 16
Lampiran 38 Nilai instance di luar interval pada data latih Wine iterasi kedua dengan metode VFI5d feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 4 3 4 4 2 4 3 6 7 4 2 3 4 50
Di atas interval 3 4 9 4 10 5 4 4 4 3 4 5 3 62
Lampiran 39 Nilai instance di luar interval pada data latih Wine iterasi kedua dengan metode VFI5m feature 1 2 3 4 5 6 7 8 9 10 11 12 13
Di bawah interval 1 1 1 2 2 2 2 1 1 1 1 1 1
Di atas interval 1 2 1 1 1 1 2 1 2 1 1 2 1
Jumlah
17
17
Lampiran 40 Nilai instance di luar interval pada data uji Wine iterasi kedua dengan metode VFI5 instance 3 28 34 44 44 45 46 49 49 51 56 57 58 Jumlah instance
Di bawah interval
Di atas interval 12
5 5 6 7 11 11 11 10 11 10 10 11 8
5
Lampiran 41 Nilai instance di luar interval pada data uji Wine iterasi kedua dengan metode VFI5d instance 1 1 3 4 5 6 6 9 10 12 14 17 20 21 22 23 26 26 28 28 32 33 34 34 35 35 35 37 37 38 39
Di bawah interval
Di atas interval 5 12 12 12 12 3 5 3 12 13 5 3 5
5 8 2 4 11 5 10 13 8 5 9 8 3 5 6 7 11 3
instance 43 44 44 44 44 45 46 47 48 48 48 49 49 50 51 51 51 52 53 53 54 55 55 56 56 57 57 58 Jumlah instance
Di bawah interval
Di atas interval 12
6 7 11 2 11 11 11 11 12 5 11 10 3 11 8 10 11 2 8 11 4 8 11 10 11 10 11 23
36
Lampiran 42 Nilai instance di luar interval pada data uji Wine iterasi kedua dengan metode VFI5m instance 1 3 5 6 21 23 28 28 32 34 34 37 44 44 44 45 46 47 49 49 51 51 52 54 56 56 57 57 58 Jumlah instance
Di bawah interval
Di atas interval 12 12 12 3
5 2 5 10 13 5 9 7 6 7 11 11 11 11 11 10 11 10 11 11 11 10 11 10 11 18
11
Lampiran 43 Nilai hasil proses klasifikasi untuk iterasi kedua pada data Wine
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Kelas aktual 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2
Kelas VFI5 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 3
Kelas VFI5d 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 2 2
Kelas VFI5m 1 2 1 1 1 2 1 2 1 1 1 1 1 1 1 1 1 1 1 1 2 3
23
2
2
2
2
24 25 26 27 28 29 30
2 2 2 2 2 2 2
2 2 2 2 2 2 2
2 2 2 2 2 2 2
2 2 2 2 2 2 2
instance
instance 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59
Kelas aktual 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5 2 2 2 2 2 2 1 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3
Kelas VFI5d 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3
Kelas VFI5m 2 2 2 2 3 2 1 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3
Lampiran 44 Confusion matrix pada data uji Wine iterasi kedua dengan metode VFI5
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 19 1 0
Prediksi Kelas 2 1 21 1
Kelas 3 0 1 15
Lampiran 45 Confusion matrix pada data uji Wine iterasi kedua dengan metode VFI5d
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 18 0 0
Prediksi Kelas 2 2 23 1
Kelas 3 0 0 15
Lampiran 46 Confusion matrix pada data uji Wine iterasi kedua dengan metode VFI5m
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 17 1 0
Prediksi Kelas 2 3 20 1
Kelas 3 0 2 15
Lampiran 47 Nilai instance di luar interval pada data latih Wine iterasi ketiga dengan metode VFI5d feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 4 3 4 5 4 4 3 6 6 4 3 3 4 53
Di atas interval 4 3 4 4 4 8 5 4 8 3 3 4 4 58
Lampiran 48 Nilai instance di luar interval pada data latih Wine iterasi ketiga dengan metode VFI5m feature 1 2 3 4 5 6 7 8 9 10 11 12 13
Di bawah interval 1 1 1 2 1 2 1 1 1 1 1 1 1
Di atas interval 1 1 1 2 1 2 2 4 2 1 1 1 1
Jumlah
15
20
Lampiran 49 Nilai instance di luar interval pada data uji Wine iterasi ketiga dengan metode VFI5 instance 13 20 24 25 25 28 28 30 30 34 35 36 36 36 38 56 Jumlah instance
Di bawah interval
Di atas interval 6 8
1 1 9 1 2 1 11 10 1 1 3 7 2 2 8
8
Lampiran 50 Nilai instance di luar interval pada data uji Wine iterasi ketiga dengan metode VFI5d instance 3 3 3 7 7 10 11 11 11 13 13 16 17 19 19 20 20 23 24 24 25 25 26 26 27 28 28 30 30 30 31
Di bawah interval 8
Di atas interval 6 7 1 6 7
4 8 9 6 7 9 6 6 7 13 8 13 1 9 1 9 10 13 3 1 2 1 10 11 10
instance 32 32 33 34 35 36 36 36 36 36 37 37 37 38 39 41 42 42 43 43 48 48 49 52 53 54 56 Jumlah instance
Di bawah interval 10 13 13 10 1 1
Di atas interval
3 4 7 12 10 13 4 2 9 13 3 4 10 13 6 7 10 3 6 9 2 29
29
Lampiran 51 Nilai instance di luar interval pada data uji Wine iterasi ketiga dengan metode VFI5m instance 11 13 13 20 24 25 25 27 28 28 30 30 30 34 35 36 36 36 36 37 38 39 42 56 Jumlah instance
Di bawah interval
Di atas interval 9 6 7 8
1 1 9 3 1 2 1 10 11 10 1 1 3 4 7 4 2 9 4 2 9
15
Lampiran 52 Nilai hasil proses klasifikasi untuk iterasi ketiga pada data Wine
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Kelas aktual 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2
Kelas VFI5 1 1 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2
Kelas VFI5d 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2
Kelas VFI5m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2
23
2
2
2
2
24 25 26 27 28 29 30
2 2 2 2 2 2 2
1 2 2 2 2 2 2
2 2 2 2 2 2 2
2 2 2 2 2 2 2
instance
instance 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
Kelas aktual 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5 2 2 2 2 2 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5d 2 2 2 2 1 1 2 2 2 2 1 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Kelas VFI5m 2 2 2 2 2 1 2 2 2 2 1 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Lampiran 53 Confusion matrix pada data uji Wine iterasi ketiga dengan metode VFI5 Data Aktual
Kelas 1 Kelas 2 Kelas 3
Kelas 1 18 2 0
Prediksi Kelas 2 0 23 0
Kelas 3 1 0 16
Lampiran 54 Confusion matrix pada data uji Wine iterasi ketiga dengan metode VFI5d
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 19 3 0
Prediksi Kelas 2 0 22 0
Kelas 3 0 0 16
Lampiran 55 Confusion matrix pada data uji Wine iterasi ketiga dengan metode VFI5m
Aktual
Data Kelas 1 Kelas 2 Kelas 3
Kelas 1 19 2 0
Prediksi Kelas 2 0 23 0
Kelas 3 0 0 16
Lampiran 56 Nilai instance di luar interval pada data latih Ikan Koi iterasi pertama dengan metode VFI5d feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 4 5 4 3 4 3 4 1 3 2 2 2 2 39
Di atas interval 3 3 3 3 3 4 2 3 2 4 3 33
Lampiran 57 Nilai instance di luar interval pada data latih Ikan Koi iterasi pertama dengan metode VFI5m feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 1 2 1 2 1 3 1 1 3 2 2 2 2 23
Di atas interval 2 2 2 1 2 4 1 13 13 15 2 1 2 60
Lampiran 58 Nilai instance di luar interval pada data uji Ikan Koi iterasi pertama dengan metode VFI5 instance 5 5 6 6 6 13 14 14 22 22 Jumlah instance
Di bawah interval 2
Di atas interval 4 4 10 12
2 2 10 11 13 3
7
Lampiran 59 Nilai instance di luar interval pada data uji Ikan Koi iterasi pertama dengan metode VFI5d instance 1 1 1 1 1 1 1 2 2 2 2 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 9 13
Di bawah interval 2 6 9
Di atas interval
4 10 11 13 10 12 11 13 2 6 9 4 10 2 6 9 4 10 12 6 9 4 10 12 6 2
instance 13 13 13 13 13 14 14 14 14 14 14 14 16 21 22 22 22 24 24 26 26 33 33 35 36 36 36 Jumlah instance
Di bawah interval 6 9
Di atas interval
4 10 12 2 6 8 9 4 10 12 13 7 12 11 13 11 13 11 13 2 4 6 6 11 13 30
26
Lampiran 60 Nilai instance di luar interval pada data uji Ikan Koi iterasi pertama dengan metode VFI5m instance 1 1 1 1 1 1 2 2 2 2 2 2 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8 8 9 9 9 12 12 13
Di bawah interval 2 6 9
Di atas interval
10 11 13 10 12 8 9 11 13 8 9 2 6 9 4 10 6 9 4 10 12 6 9 4 10 12 8 9 6 8 9 8 9 2
instance 13 13 13 13 13 14 14 14 14 14 14 14 19 19 20 20 22 22 22 22 24 24 24 26 26 26 27 28 35 35 36 36 36 36 Jumlah instance
Di bawah interval 6 9
Di atas interval
4 10 12 2 6 8 9 4 10 12 8 9 8 9 12 8 11 13 11 13 10 11 13 10 10 10 6 10 11 13 6 10 27
44
Lampiran 61 Nilai hasil proses klasifikasi untuk iterasi pertama pada data Ikan Koi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Kelas aktual 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Kelas VFI5 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Kelas VFI5d 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1
Kelas VFI5m 1 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1
22
1
1
0
0
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
instance
Lampiran 62 Confusion matrix pada data uji Ikan Koi iterasi pertama dengan metode VFI5 Prediksi betina jantan
Aktual
Data betina
17
3
jantan
0
20
Lampiran 63 Confusion matrix pada data uji Ikan Koi iterasi pertama dengan metode VFI5d Prediksi betina jantan
Aktual
Data betina
19
1
jantan
1
19
Lampiran 64 Confusion matrix pada data uji Ikan Koi iterasi pertama dengan metode VFI5m. Prediksi betina jantan
Aktual
Data betina
14
6
jantan
1
19
Lampiran 65 Nilai instance di luar interval pada data latih Ikan Koi iterasi kedua dengan metode VFI5d feature 1 2 3 4 5 6 7 8 10 11 12 13 Jumlah
Di bawah interval 7 4 4 3 4 4 1 1 4 2 4 38
Di atas interval 3 3 3 2 3 3 3 2 3 1 4 30
Lampiran 66 Nilai instance di luar interval pada data latih Ikan Koi iterasi kedua dengan metode VFI5m feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 1 1 1 2 1 7 1 1 4 1 4 2 4 30
Di atas interval 2 2 2 1 2 3 1 12 11 2 2 1 2 43
Lampiran 67 Nilai instance di luar interval pada data uji Ikan Koi iterasi kedua dengan metode VFI5d instance 3 8 8 8 8 15 15 15 15 16 17 18 18 21 21 21 21 22 22 22 23 23 23 23 24 24 24 24 29 29 29 30 37 38 Jumlah instance
Di bawah interval
Di atas interval 13
10 12 11 13 10 12 11 13 5 7 2 12 1 3 5 7 1 3 7 1 3 5 7 1 3 5 7 11 13 6 6 8 6 23
11
Lampiran 68 Nilai instance di luar interval pada data uji Ikan Koi iterasi kedua dengan metode VFI5m instance 1 1 4 4 5 5 6 6 8 8 8 8 8 8 12 12 13 13 14 14 15 15 15 15 15 15 17 18 18 18 19 19 20 20 29 29 29 30 37 38 Jumlah instance
Di bawah interval
Di atas interval 8 9
6 9 6 9 8 9 10 12 8 9 11 13 8 9 8 9 8 9 10 12 8 9 11 13 7 6 9 12 8 9 8 9 11 13 6 6 8 6 13
27
Lampiran 69 Nilai hasil proses klasifikasi untuk iterasi kedua pada data Ikan Koi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Kelas aktual 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Kelas VFI5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Kelas VFI5d 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1
Kelas VFI5m 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
22
1
1
1
1
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1
instance
Lampiran 70 Confusion matrix pada data uji Ikan Koi iterasi kedua dengan metode VFI5
Aktual
Data
Prediksi betina jantan
betina
20
0
jantan
1
19
Lampiran 71 Confusion matrix pada data uji Ikan Koi iterasi kedua dengan metode VFI5d
Aktual
Data
Prediksi betina jantan
betina
19
1
jantan
0
20
Lampiran 72 Confusion matrix pada data uji Ikan Koi iterasi kedua dengan metode VFI5m
Aktual
Data
Prediksi betina jantan
betina
18
2
jantan
1
19
Lampiran 73 Nilai instance di luar interval pada data latih Ikan Koi iterasi ketiga dengan metode VFI5d feature 1 2 3 4 5 7 8 10 11 12 13 Jumlah
Di bawah interval 4 4 4 5 4 4 2 3 4 4 4 42
Di atas interval 4 4 4 2 4 4 2 5 2 5 36
Lampiran 74 Nilai instance di luar interval pada data latih Ikan Koi iterasi ketiga dengan metode VFI5m feature 1 2 3 4 5 6 7 8 9 10 11 12 13 Jumlah
Di bawah interval 1 1 1 2 1 10 1 2 7 3 4 4 4 41
Di atas interval 1 1 1 1 1 5 1 17 16 2 4 1 4 55
Lampiran 75 Nilai instance di luar interval pada data uji Ikan Koi iterasi ketiga dengan metode VFI5 instance 4 4 4 4 4 4 9 9 9 9 10 10 10 10 10 11 11 11 11 11 31 31 31 31 32 32 32 32 Jumlah instance
Di bawah interval 4
Di atas interval 1 2 3 5 7
4 1 2 3 4 1 2 3 5 4 1 2 3 5 1 3 5 7 1 3 5 7 12
16
Lampiran 76 Nilai instance di luar interval pada data uji Ikan Koi iterasi ketiga dengan metode VFI5d instance 4 4 4 4 4 4 9 9 9 9 9 9 10 10 10 10 10 10 11 11 11 11 11 11 17 18 18 26 26 29 29 31 31 31 31 32 32 32 32 Jumlah instance
Di bawah interval 4
Di atas interval 1 2 3 5 7
4 1 2 3 5 7 4 1 2 3 5 7 4 1 2 3 5 7 7 1 7 11 13 3 5 1 3 5 7 1 3 5 7 16
23
Lampiran 77 Nilai instance di luar interval pada data uji Ikan Koi iterasi ketiga dengan metode VFI5m instance 1 1 4 4 4 4 4 4 9 9 9 9 9 9 10 10 10 10 10 10 11 11 11 11 11 11 15 15 16 16 19 19 23 26 26 31 31 31 31 32 32 32 32 Jumlah instance
Di bawah interval
Di atas interval 8 9
4 1 2 3 5 7 4 1 2 3 5 7 4 1 2 3 5 7 4 1 2 3 5 7 8 9 8 9 8 9 6 11 13 1 3 5 7 1 3 5 7 14
29
Lampiran 78 Nilai hasil proses klasifikasi untuk iterasi ketiga pada data Ikan Koi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Kelas aktual 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Kelas VFI5 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1
Kelas VFI5d 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1
Kelas VFI5m 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1
22
1
1
1
1
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
instance
Lampiran 79 Confusion matrix pada data uji Ikan Koi iterasi ketiga dengan metode VFI5
Aktual
Data
Prediksi betina jantan
betina
17
2
jantan
0
20
Lampiran 80 Confusion matrix pada data uji Ikan Koi iterasi ketiga dengan metode VFI5d
Aktual
Data
Prediksi betina jantan
betina
20
0
jantan
2
18
Lampiran 81 Confusion matrix pada data uji Ikan Koi iterasi ketiga dengan metode VFI5m
Aktual
Data
Prediksi betina jantan
betina
19
0
jantan
0
20