MAKARA, SAINS, VOL. 7, NO.3, DESEMBER 2003
PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST Zuherman Rustam1,3, Benyamin Kusumoputro2,3 dan Belawati Widjaja1,2 1Departemen Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Indonesia, Depok 16424, Indonesia 2Fakultas Ilmu Komputer, Universitas Indonesia, Depok 16424, Indonesia 3Laboratorium Komputasi Intelejensia, Universitas Indonesia, Depok 16424, Indonesia E-mail:
[email protected];
[email protected]
Abstrak Komputasi intelejensia yang digunakan dalam masalah klasifikasi pola dapat digolongkan menjadi dua bagian, yaitu yang berbasis pada Neural Network dan yang berbasis pada Pembelajaran Statistika (Statistical Learning). Pembelajaran yang berbasis statistika, pertama kali ditemukan oleh Vapnik pada dekade tujuh-puluhan. Untuk masalah klasifikasi pola Vapnik mengembangkan metode hyperplane optimal separation, atau dikenal juga dengan nama metode Support Vector Machines (SVM). Pada awalnya SVM dirancang hanya untuk menyelesaikan masalah klasifikasi biner, yaitu dari data-data yang ada, diklasifikasikan menjadi dua kelas. Untuk mengklasifikasikan data yang terdiri dari lebih dari dua kelas, metode SVM tidak dapat langsung digunakan. Ada beberapa metode yang dapat digunakan untuk menyelesaikan masalah klasifikasi multikelas SVM yaitu: metode One-vs-One dan metode One-vs-Rest. Kedua metode ini merupakan perluasan dari klasifikasi biner SVM. Kedua metode tersebut akan dibahas di artikel ini dan akan dilihat kinerjanya dalam mengklasifikasikan aroma. Data aroma yang digunakan dalam percobaaan ini terdiri dari 3 jenis aroma, masing-masing aroma terdiri atas 6 kelas. Pembagian kelas ini berdasarkan pada konsentrasi alkohol yang dicampurkan pada masing-masing aroma. Misalkan untuk aroma A, terdapat 6 jenis aroma A dengan kandungan alkohol : 0%, 15%, 25%, 30%, 45% dan 75%. Kinerja dari kedua metode diukur berdasarkan kemampuan untuk mengenal dan mengklasifikasikan aroma, dengan tepat dan sesuai dengan jenis atau kelas, dari data yang diberikan.
Abstract Aroma classification using one-vs-one and one-vs-rest methods. Computational Intelligence used in pattern classification problem can be divided into two different parts, one based on Neural Network and the other based on Statistical Learning. The Statistical Learning discovered by Vapnik on 70-est decade. For the pattern classification, Vapnik developed hyperplane optimal separation, which is known as Support Vector Machines Method (SVM). In the beginning, SVM was designed only to solve binary classification problem, where data existing are classified into two classes. To classify data whose consist of more than two classes, the SVM method can not directly be used. There are several methods can be used to solve SVM multiclasses classification problem, they are One-vs-One Method and One-vs-Rest Method. Both of this methods are the extension of SVM binary classification, they will be discussed in this article so that we can see their performance in aroma classification process. Data of aroma used in this experiment is consisted of three classes of aroma, each of them has six classes. The division of this class is based on alcohol concentration mixed into each of those aromas. For example, for aroma A, there are six kinds of aroma A with different alcohol concentration: 0%, 15%, 25%, 30%, 45% and 75%. The performance of these methods is measured based on their ability to recognize and classify aroma, precisely and match with the right class or variety of data existed. Keywords: classification, kernel, svm, odor
1. Pendahuluan 89
16 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003 Komputasi intelejensia dalam masalah klasifikasi pola dapat digolongkan menjadi dua bagian yaitu yang berbasis pada Neural Network dan yang berbasis pada Pembelajaran Statistika (Statistical Learning). Pembelajaran yang berbasis statistika, pertama kali ditemukan oleh Vapnik pada dekade tujuh-puluhan [1]. Untuk masalah klasifikasi pola, Vapnik mengembang-kan metode hyperplane optimal separation, yang berbasis pada konsep Structural Risk Minimization. Metode hyperplane optimal separation ini dikenal juga dengan nama Support Vector Machines (SVM). Pada awalnya SVM dirancang hanya untuk menyelesaikan masalah klasifikasi biner, yaitu dari data-data yang ada, diklasifikasikan menjadi dua kelas. Untuk mengklasifikasikan data yang terdiri dari lebih dari dua kelas, metode SVM tidak dapat langsung digunakan. Ada beberapa metode yang dapat digunakan untuk menyelesaikan masalah klasifikasi multikelas dengan menggunakan SVM, antara lain: metode One-vs-One dan metode One-vs-Rest. Kedua metode ini merupakan perluasan dari klasifikasi biner SVM. Kedua metode tersebut akan dibahas di artikel ini dan akan dilihat kinerjanya dalam mengklasifikasikan aroma. Data aroma yang digunakan dalam percobaaan ini terdiri dari 3 jenis aroma, masing-masing aroma terdiri atas 6 kelas. Pembagian kelas ini berdasarkan pada banyaknya konsentrasi alkohol yang dicampurkan pada masing-masing aroma. Misalkan untuk aroma A, terdapat 6 jenis aroma A dengan konsentrasi alkohol: 0%, 15%, 25%, 30%, 45% dan 75%. Kinerja dari kedua metode diukur berdasarkan kemampuan untuk mengenal dan mengklasifikasikan aroma, dengan tepat dan sesuai dengan jenis atau kelas, dari data yang diberikan. Metode-metode untuk menyelesaikan masalah klasifikasi aroma, yang telah dilakukan di Laboratorium Komputasi Intelejensia Universitas Indonesia, antara lain: Modifikasi Kernel PCA (Principal Component Analysis) oleh Kusumoputro et.al.[2], Fuzzy-Neuro LVQ oleh Kusumoputro et.al.[3], metode probabilistik neural network (PNN) oleh Kusumoputro et.al.[4], dan Jatmiko et.al. [5], jaringan neural buatan oleh Jatmiko et.al. [6]. Data-data aroma yang digunakan pada metode-metode tersebut, akan dicoba diklasifikasikan dengan meng-gunakan metode One-vs-One dan metode One-vs-Rest. Sistimatika penulisan artikel ini sebagai berikut, pada bagian kedua akan dibahas tentang metode SVM untuk mengklasifikasikan data menjadi dua kelas. Khusus untuk mengklasifikasikan data menjadi dua kelas, metode ini untuk selanjutnya dinamakan klasifikasi biner. Pada bagian kedua juga akan dibahas tentang Metode SVM Multikelas untuk mengklasifikasikan data menjadi beberapa kelas. Metode SVM Multikelas dapat dibagi menjadi dua metode yaitu metode One-vs-One dan metode One-vs-Rest. Pada bagian ketiga, kedua metode SVM ini digunakan untuk mengklasifikasikan data aroma yang yang tersedia di Laboratorium Komputasi Intelenjensia, Universitas Indonesia. Pada bagian ketiga akan dijelaskan tentang tahapan-tahapan dan hasil-hasil percobaan.
2. Metode Penelitian Secara umum masalah klasifikasi biner dapat dinyatakan sebagai berikut. Misalkan diberikan himpunan data sample , dimana
dan
. Akan dicari suatu fungsi keputusan
sedemikian sehingga ,
. Dengan menggunakan fungsi tersebut, data sampel dapat dipisahkan menjadi dua kelas yaitu kelas dan kelas
. Bidang yang memisahkan kedua kelas tersebut merupakan suatu hyperplane , dimana
merupakan vektor normal(vektor bobot) dari hyperplane dan
jarak hyperplane ke titik pusat. Suatu data sampel ditempatkan di kelas
, jika nilai .
akan ditempatkan di kelas
dengan persamaan
konstanta yang menunjukkan
, jika nilai
. Dan akan
. Kedua pernyataan itu dapat dituliskan dalam bentuk fungsi keputusan: (1)
Himpunan data dikatakan linearly separable, jika ada suatu hyperplane sedemikian sehingga data sampel dapat diklasifikasikan kedalam kelas atau kelas .Untuk mencari hyperplane pemisah tersebut, sama artinya dengan mencari pasangan
yang memenuhi persamaan
. Misalkan
dan
menunjukkan
vektor-vektor terluar dari masing-masing kelas, yang paling dekat dengan hyperplane . Bidang yang yang melalui masing-masing vektor-vektor tersebut dinotasikan dengan dan . Jarak dari ke dan jarak dari ke
17 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003 masing-masing dinotasikan dengan dinotasikan dengan
dan
. Sedangkan jarak antara
dengan
, dinamakan margin dan
.
Untuk setiap data sampel
akan memenuhi satu dari dua pernyataan berikut ini:
(2)
Persamaan 2 dapat ditulis dalam bentuk: ,
(3)
Pada klasifikasi biner linier, yang akan dicari adalah pasangan Suatu hyperplane
dikatakan optimal jika
, yang dapat membentuk suatu hyperplane optimal.
, atau jarak dari
ke
sama dengan jarak dari
ke
Karena, (4)
maka masalah mencari
, sama artinya dengan masalah meminimumkan
.
Berdasarkan pembahasan di atas, maka model matematis dari masalah klasifikasi biner dapat dinyatakan dalam bentuk:
(5)
Dengan menggunakan pengali Lagrange, model matematis di atas dapat dinyatakan sebagai : (6)
Solusi dari persamaan 6 adalah (7)
Dengan mensubstitusikan persamaan 7 ke persamaan 6, akan didapatkan model primal lagrange untuk klasifikasi biner: (8)
Sedangkan model Dual Lagrange dari masalah klasifikasi biner adalah:
.
18 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003
(9)
Solusi dari masalah dual ini adalah:
(10)
Dengan diperolehnya nilai dan berarti telah ditemukan suatu hyperplane optimal, yang dapat memisahkan himpunan data sampel menjadi dua kelas. Dengan adanya hyperplane optimal ini, maka untuk menempatkan suatu data sampel ke suatu kelas, digunakan fungsi keputusan: (11)
Persamaan-persamaan di atas dapat digunakan hanya untuk data separable, yaitu data dapat diklasifikasikan dengan tepat ke dalam kelas atau kelas , dengan menggunakan suatu hyperplane . Untuk data nonseparable, dimana hyperplane tidak dapat memisahkan data dengan tepat, terjadi misclassification untuk beberapa data sampel. Untuk mengatasi hal ini, formulasi yang telah dibahas di atas, perlu diubah. Misalkan menunjukkan jarak dari data sampel ke hyperplane, persamaan 2 dirubah menjadi: (12)
Karena faktor misclassification harus diikut sertakan dalam perhitungan, maka masalah klasifikasi biner untuk data nonseparable,
menjadi masalah meminimumkan
dan meminimumkan total kesalahan,
, akibat
misclassification. (13) dimana
adalah parameter yang digunakan untuk mengendalikan hubungan antara slack variable
. Berdasarkan persamaan 12 dan 13, maka model Lagrange untuk klasifikasi biner nonseparable menjadi
(14)
Sedangkan model Dual Lagrange dari masalah klasifikasi biner nonseparable adalah:
dengan
19 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003
(15)
Solusi dari model matematis persamaan 15 ini adalah dan
Dengan membandingkan antara kasus separable dan nonseparable, perbedaaan antara keduanya hanya terletak pada adanya penambahan kendala pada masalah nonseparable. Pada pembahasan di atas, hyperplane yang digunakan merupakan suatu bidang datar ( linier ). Untuk data-data yang hanya dapat dipisahkan dengan menggunakan permukaaan non-linear, persamaan-persamaan di atas tidak dapat langsung digunakan. Langkah pertama untuk mengklasifikasikan input data non-linear tersebut adalah dengan mentransformasikan input data ke suatu ruang yang dinamakan ruang feature.
Misalkan
suatu pemetaan non-linear dari ruang input
dimensi dari
lebih besar dari dimensi dari input
ditransformasikan ke ruang feature
ke ruang feature
,
atau
. Dengan menggunakan fungsi
, dengan perkataan lain,
, semua data sampel . Setelah semua data sampel
ditransformasikan, maka proses klasifikasi tidak lagi dilakukan di ruang input feature. Di ruang feature, proses klasifikasi dilakukan terhadap semua vektor yang telah dibahas di atas. Di ruang feature semua vektor
, dimana
, melainkan dilakukan di ruang , dengan menggunakan cara-cara
dapat diklasifikasikan menjadi dua kelas, dimana
kedua kelas ini dipisahkan oleh suatu hyperplane. Kesulitan yang akan muncul dalam klasifikasi di ruang feature adalah, menyelesaikan model matematis klasifikasi yang mengandung suku-suku dalam bentuk timbul karena tidak diketahuinya fungsi fungsi
dan cara memilih fungsi
diketahui maka dimensi dari vektor
. Kesulitan ini
yang tepat. Kesulitan berikutnya adalah jika
lebih besar dari dimensi dari vektor
. Dari sudut pandang
memory yang digunakan, hal ini berarti perhitungan di ruang feature memerlukan memory yang lebih besar. Untuk mengatasi kesulitan tersebut maka didefinisikan fungsi
yang dinamakan juga fungsi
Kernel. Pada model matematis klasifikasi di ruang feature, semua suku-suku dalam bentuk bentuk
. Dengan menggunakan fungsi Kernel ini, maka masalah perhitungan
dapat dihindari. Hal ini berarti, pencarian hyperplane optimal di ruang feature komputasi secara signifikan.
di ruang feature
tidak akan meningkatkan biaya
Dengan menggunakan fungsi Kernel maka masalah klasifikasi dapat dinyatakan sebagai berikut:
(16)
diganti dengan
20 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003
Persamaan 11 di ruang feature dapat ditulis dalam bentuk, (17)
Untuk menempatkan data sampel
ke suatu kelas, digunakan fungsi keputusan: (18)
Pada percobaan klasifikasi aroma, fungsi Kernel yang digunakan adalah: Kernel RBF :
.
Kernel Polinomial berderajat d: . Kernel Linier :
.
Sampai disini telah lengkap dibahas penggunaan metode SVM untuk mengklasifikasikan data menjadi dua kelas. Untuk menyelesaikan masalah klasifikasi multikelas, digunakan metode One-vs-One dan metode One-vs-Rest. Prinsip kerja dari kedua metode akan dibahas di bawah ini. Misalkan data sampel yang berbeda
terdiri atas
buah kelas,
. Pada metode One-vs-One, untuk setiap pasang kelas
, dilakukan klasifikasi biner. Pada setiap proses klasifikasi digunakan fungsi keputusan:
(19) Karena banyaknya kelas ada
dimana
,
dan
.
buah, maka banyaknya proses klasifikasi biner yang harus dilakukan adalah sebanyak
kali. Setelah seluruh proses , jika ada
selesai dikerjakan, maka suatu data sampel
akan ditempatkan di kelas
sedemikian sehingga memaksimumkan :
,
(20)
dimana
Pada metode One-vs-Rest dilakukan dengan cara sebagai berikut. Untuk himpunan data sampel buah kelas,
, dilakukan klasifikasi biner antara kelas
klasifikasi biner ini dilakukan sebanyak didefinisikan fungsi:
dengan
yang terdiri atas
(kelas sisanya). Proses
kali, sesuai dengan banyaknya kelas yang ada. Pada setiap proses
21 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003
,
dimana
,
Suatu data sampel
(21)
dan
.
akan ditempatkan di kelas
, jika ada
sedemikian sehingga memaksimumkan:
(22)
3. Hasil Eksperimen Untuk mengetahui kinerja kedua metode di atas, dilakukan pengujian dengan data aroma yang dimiliki oleh Laboratorium Komputasi Intelejensia Universitas Indonesia. Data aroma yang digunakan terdiri atas 3 jenis aroma A, B dan C. Setiap jenis aroma dicampurkan dengan alkohol berkonsentrasi : 0%, 15%, 25%, 30%, 45% dan 75%. Sehingga total aroma yang akan diklasifikasikan sebanyak 18 kelas. Untuk masing-masing kelas tersedia 200 data. Banyaknya data training yang digunakan sebanyak 10%, 15%, 20%, 25%, 30%, 35%, 40% dan 50% dari data yang tersedia. Data yang tersisa digunakan sebagai data testing. Pengujian dilakukan dalam 3 tahap: tahap pertama, dilakukan pengujian pada semua data aroma ABC, tahap kedua dilakukan pengujian pada masing-masing data aroma A, B dan C dan tahap ketiga dilakukan pengujian pada setiap pasang aroma yang berbeda yaitu AB, AC dan BC. Pada setiap tahap pengujian, kinerja dari metode One-vs-One dan metode One-vs-Rest diukur berdasarkan kemampuan untuk mengklasifikasikan data aroma pada jenis aroma dan kelas yang tepat. Fungsi Kernel yang digunakan dalam percobaan adalah Kernel Linier, Kernel RBF dengan parameter sigma 2 dan Kernel Polinomial berderajat 4. Sebagai metode pembanding digunakan metode k-Nearest Neighborhood (KNN). Hasil pengujian selengkapnya pada masing-masing tahap dapat dilihat pada Tabel 1, Tabel 2 dan Tabel 3.
Tabel 1. Persentase keberhasilan klasifikasi data aroma pada pengujian tahap pertama untuk semua data aroma
Persentase Keberhasilan Klasifikasi Data Aroma DataAroma ABC
Metode One-vs-One
(18 kelas) One-vs-Rest
KNN Keterangan Tabel 1:
Kernel
Dengan Menggunakan Data Training Perkelas Sebanyak:
Rata-rat a
10%
15%
20%
25%
30%
35%
40%
50%
Linear
91,67
93,70
97,22
99,33
99,81
99,52
100,00
99,89
97,64
Polinomial
92,78
93,70
97,22
99,56
99,63
99,52
100,00
100,00
97,80
RBF
90,56
92,96
97,50
99,33
99,81
99,52
100,00
99,89
97,45
Linear
61,67
77,04
76,11
82,44
75,19
79,37
81,81
81,67
76,91
Polinomial
79,44
90,00
88,89
92,67
95,56
97,78
96,67
98,56
92,44
RBF
77,78
87,41
88,89
91,11
93,15
96,83
96,53
98,22
91,24
73,89
77,41
81,67
89,78
88,33
88,73
87,36
91,22
84,80
Nilai 99,33 % pada kolom data training 25%, baris pertama, menunjukkan persentase keberhasilan metode One-vs-One, dengan menggunakan Kernel Polinomial berderajat 4 ,untuk mengklasifikasikan data aroma ABC pada kelas yang sesuai.
22 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003 Tabel 2. Persentase keberhasilan klasifikasi data aroma pada pengujian tahap kedua untuk satu jenis aroma
Persentase Keberhasilan Klasifikasi Data Aroma DataAroma A (6 kelas)
Metode One-vs-One
One-vs-Rest
B ( 6 kelas )
KNN One-vs-One
One-vs-Rest
C ( 6 kelas )
KNN One-vs-One
One-vs-Rest
KNN
Kernel Linear Polinomial RBF Linear Polinomial RBF Linear Polinomial RBF Linear Polinomial RBF Linear Polinomial RBF Linear Polinomial RBF
Dengan Menggunakan Data Training Perkelas Sebanyak : 10% 95,00 96,67 95,00 90,00 90,00 90,00 68,33 96,67 96,67 96,67 81,67 91,67 83,33 85,00 100,00 100,00 100,00 96,67 96,67 96,67 78,33
15% 100,00 100,00 100,00 83,33 83,33 83,33 82,22 100,00 98,89 100,00 93,33 94,44 95,56 85,56 100,00 100,00 100,00 100,00 100,00 100,00 83,33
20% 100,00 100,00 100,00 99,17 96,67 96,67 83,33 100,00 100,00 100,00 95,00 95,83 94,17 91,67 100,00 100,00 100,00 100,00 98,33 100,00 87,50
25% 96,67 98,10 96,67 96,67 97,33 98,00 84,67 100,00 100,00 100,00 95,33 100,00 98,00 92,67 100,00 100,00 100,00 98,67 96,67 98,67 86,00
30% 100,00 100,00 100,00 90,56 93,89 93,33 85,00 100,00 100,00 100,00 96,67 100,00 98,33 96,67 100,00 100,00 100,00 100,00 100,00 100,00 90,56
35% 96,67 96,67 96,67 100,00 97,62 98,10 80,48 100,00 100,00 100,00 96,67 100,00 98,10 94,76 99,52 100,00 99,52 100,00 100,00 100,00 83,33
40% 100,00 99,58 100,00 97,08 98,75 98,33 92,92 100,00 100,00 100,00 95,00 100,00 100,00 98,33 100,00 100,00 100,00 100,00 100,00 100,00 92,92
Gambar 1. Perbandingan waktu klasifikasi antara metode One-vs-One dengan metode One-vs-Rest, untuk mengklasifikasikan data aroma jenis A.
50% 100,00 100,00 100,00 100,00 100,00 100,00 90,00 100,00 100,00 100,00 97,67 100,00 100,00 98,00 100,00 100,00 100,00 100,00 100,00 100,00 92,33
Rata-rat a 98,54 98,99 98,54 94,60 94,70 94,72 83,37 99,58 99,44 99,58 93,92 97,74 95,94 92,83 99,94 100,00 99,94 99,42 98,96 99,42 86,79
23 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003
24 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003 Tabel 3. Persentase keberhasilan klasifikasi data aroma pada pengujian tahap ketiga untuk setiap pasang aroma
Persentase Keberhasilan Klasifikasi Aroma Data Aroma
Metode
10% AB
One-vs-One
( 12 kelas ) One-vs-Rest
One-vs-One
( 12 kelas ) One-vs-Rest
One-vs-One
( 12 kelas ) One-vs-Rest
KNN
20%
25%
30%
35%
40%
50%
89,17 93,33 100,00 99,00
99,17
99,52
100,00
99,33
97,44
Polinomial
90,00 93,89 100,00 99,00
99,44
99,52
100,00
99,33
97,65
RBF
90,00 93,33 100,00 99,00
99,17
99,52
100,00
99,33
97,54
Liner
80,83 76,67
91,67 86,67
91,67
91,19
88,13
93,17
87,50
Polinomial
88,33 87,22
94,58 96,00
96,11
98,33
98,13
97,83
94,57
RBF
85,00 83,33
93,75 96,00
95,83
97,86
98,75
97,50
93,50
80,00 78,89
84,17 86,67
91,39
91,43
93,13
94,83
87,56
Liner
89,17 93,89
99,58 99,00
99,72
99,52
100,00 100,00
97,61
Polinomial
88,33 93,33 100,00 98,67 100,00
99,52
100,00 100,00
97,48
RBF
90,00 95,00
99,58 99,00
99,72
99,52
100,00 100,00
97,85
Liner
78,33 84,44
89,58 74,67
85,83
81,43
92,50
93,00
84,97
Polinomial
85,00 86,67
95,00 96,00
98,06
96,90
98,96
98,33
94,36
RBF
85,83 85,56
96,25 95,67
96,11
96,67
98,33
98,00
94,05
76,67 73,89
80,83 83,67
87,22
84,76
90,42
93,00
83,81
Liner
99,17 97,22
98,75 99,67 100,00
100,00
100,00 100,00
99,35
Polinomial
99,17 97,78
99,17 99,67 100,00
100,00
100,00 100,00
99,47
RBF
96,67 97,22
98,75 99,67 100,00
99,76
100,00 100,00
99,01
Liner
83,33 88,33
90,83 89,33
78,33
85,71
77,92
92,83
85,83
Polinomial
93,33 93,33
94,17 96,00
96,39
98,33
98,96
99,00
96,19
RBF
93,33 93,33
92,50 96,33
96,67
97,86
98,96
99,00
96,00
82,50 75,56
86,25 88,33
90,00
90,95
93,96
96,17
87,96
KNN BC
15%
Liner
KNN AC
Rata-rat a
Dengan Menggunakan Data Training Sebanyak :
Kernel
Percobaan berikutnya adalah menghitung waktu yang dibutuhkan oleh metode One-vs-One dan metode One-vs-Rest untuk mengklasifikasikan data aroma. Dalam percobaan ini hanya digunakan data aroma jenis A, yang terdiri atas enam kelas, dan menggunakan fungsi Kernel RBF dengan parameter σ = 4. Hasilnya dapat dilihat pada Gambar 1.
4. Kesimpulan Kedua metode yang berbasis SVM ini: metode One-vs-One dan metode One-vs-Rest memiliki kinerja yang lebih unggul dibandingkan dengan KNN. Dari hasil percobaan, dengan menggunakan data training lebih dari 15 buah perkelas, metode One-vs-One telah mampu 100% untuk mengklasifikasikan data aroma berdasarkan kelas yang tepat. Semakin banyak data training yang digunakan, metode One-vs-One akan lebih cepat mengklasifikasikan data dibandingkan dengan metode One-vs-Rest. Jika ditinjau berdasarkan waktu yang digunakan untuk melakukan klasifikasi, metode One-vs-One lebih cepat dibandingkan dengan metode One-vs-Rest. Untuk data training lebih dari 20 buah untuk setiap kelas, metode One-vs-Rest membutuhkan waktu perhitungan yang cukup lama. Dari sudut pandang Kernel yang digunakan, penggunaan fungsi Kernel Polinomial akan memberikan hasil yang lebih jika dibandingkan dengan menggunakan Kernel RBF maupun Kernel Linear.
Daftar Acuan
25 MAKARA, SAINS, VOL. 7, NO. 3, DESEMBER 2003
[1] V.N. Vapnik, The Nature of Statistical Learning, Springer-Verlag, Berlin, 1999. [2] B. Kusumoputro, Z. Rustam, B. Widjaja, Modifikasi Kernel PCA pada Klasifikasi Aroma Multikelas, Lab. Komputasi Intelejensia, Universitas Indonesia, Jakarta, 2003. [3] B. Kusumoputro, Harry, W. Jatmiko, ISA Transactions 41 (2002) 395. [4] B. Kusumoputro, Herry, SNKK III, Jakarta, 2002. [5] W. Jatmiko, B. Kusumoputro, Jurnal Ilmu Komputasi dan Teknologi Informasi 1 (2001) 15. [6] W. Jatmiko, B. Kusumoputro, 2001, Jurnal Ilmu Komputasi dan Teknologi Informasi 1 (2001) 21.