OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA Bain Khusnul Khotimah1*, Agus Zainal Arifin2, Anny Yuniarti3 Pascasarjana Teknik Informatika, Fakultas Teknologi Informasi ITS, Surabaya Indonesia1*, email:
[email protected] Pascasarjana Teknik Informatika, Fakultas Teknologi Informasi ITS, Surabaya, Indonesia2, 3 ABSTRAK Klasifikasi menggunakan fuzzy ARTMAP berbobot adalah metode baru dalam klasifikasi yang diperoleh dengan mengkombinasikan simplified fuzzy ARTMAP dan symmetric fuzzy ART ditambah pembobotan feromon sesuai konsep koloni semut. Metode ini memiliki kelebihan dalam hal efisiensi dan toleran dalam mencari kedekatan kelas serta menyesuaikan node output dengan pola. Kelemahan metode ini sangat dipengaruhi estimasi parameter significant pada saat melakukan training sehingga mempengaruhi kinerja classifier. Untuk mengatasi masalah tersebut perlu dilakukan pemilihan parameter yang signifikant yang sangat berpengaruh dalam meningkatkan nilai akurasi pada klasifikasi. Penelitian ini melakukan optimasi parameter pada klasifikasi fuzzy ARTMAP berbobot menggunakan algoritma genetika atau disebut GA-FAMB. Algoritma ini melakukan pencarian parameter dengan menentukan pembobotan pheromon, pembobotan likenessIntensity dan nilai batas vigilance untuk mendapatkan hasil akurasi yang optimal. Pada algoritma genetika mampu mendapatkan nilai parameter optimal secara otomatis pada klasifikasi FAMB dengan tingkat akurasi yang lebih tinggi untuk set data uci repository menghasilkan ± 92%, sedangkan dengan menggunakan algoritma grid search yang digunakan sebagai algoritma pembanding menghasilkan nilai akurasi ± 88%. kata kunci : fuzzy ARTMAP, simplified fuzzy ARTMAP, symmetric fuzzy ART, fuzzy ARTMAP berbobot, algoritma genetika , algoritma grid search
1. Pendahuluan Klasifikasi adalah suatu kegiatan menggolongkan sebuah obyek ke kategori atau kelas tertentu. Proses klasifikasi dilakukan dengan menggunakan model klasifikasi. Sebuah obyek yang belum diketahui kelasnya diprediksi kelasnya berdasarkan model klasifikasi dengan menyesuaikan nilai attribut-attribut atau fiturfiturnya (Pang Ning Tang, 2005).. Saat ini terdapat banyak algoritma pembelajaran untuk membangun model klasifikasi seperti Adaptive Resonance Theory (ART) merupakan jenis klasifikasi baru dari neural network (Grossberg, 1976). ART dikembangkan menjadi ART-1 untuk mengkluster data biner (Grossberg, 1987).. Selanjutnya dilakukan ART-2 yang mempunyai kelemahan dalam proses searching dimana seluruh output neuron uncummited. Kelemahan ART dapat diperbaiki menggunakan fuzzy ARTMAP dengan cara mengkonversi searching problem menuju optimization problem (Baraldi, 2002). Fuzzy ARTMAP diperoleh dengan mengkombinasikan antara simplified fuzzy ARTMAP dan symmetric fuzzy ART yang
mempunyai fungsi aktifasi dan fungsi mach yang terpengaruh jumlah data di dalam node, hal ini menimbulkan ketidakadilan terhadap node yang memiliki jumlah pattern lebih banyak. Untuk mengatasi masalah tersebut dilakukan modifikasi pembobotan dengan menambahkan konsep algoritma koloni semut pada fuzzy ARTMAP sehingga disebut FAM berbobot atau fuzzy ARTMAP berbobot. Prinsip algoritma ini mirip dengan penyelesaian kasus terpendek dimana setiap semut akan mengikuti jalan yang mengandung jumlah pheromon lebih banyak dibanding lainnya. Semakin dekat jalur yang dilalui semut maka semut yang lewat akan semakin banyak dan jejak pheromon yang ditinggalkan juga semakin banyak, begitu juga sebaliknya. Sehingga cluster node yang dihasilkan akan menyesuaikan dengan jumlah pattern dan dapat menampung pattern lebih banyak (Darlis, 2009). Kelemahan metode fuzzy ARTMAP berbobot optimization problem sangat dipengaruhi oleh inisialisasi parameter pada saat training yang mempengaruhi hasil akurasi. Sehingga penelitian ini akan
melakukan estimasi parameter dengan menggunakan algoritma genetika yang tujuannya dapat meningkatkan kinerja pada classifier. Algoritma genetika sangat baik untuk menyelesaikan permasalahan optimasi dan melakukan search point dengan mencari pola baru yang diharapkan memiliki nilai fitness yang lebih baik dari seluruh kromosom dan dapat meningkatkan kinerja pada classifier (Limai, 2009). Dalam melakukan estimasi parameter pada klasifikasi fuzzy ARTMAP berbobot menggunakan algoritma genetika atau disebut metode GA-FAMB dibandingkan dengan algoritma grid search yang disebut GSFAMB. Algoritma grid search yaitu salah satu algoritma umum yang sering digunakan untuk estimasi parameter, dengan prinsip kerjanya dengan menentukan beberapa nilai parameter pada rentang tertentu, kemudian memilih parameter pada nilai terbaik pada rentang tersebut dan melakukan pencarian berulang pada grid (rentang nilai) yang lebih kecil, dst. Kelemahan algoritma ini pada pencarian grid yang terlalu kecil dapat mengakibatkan overfitting. 2 Tinjauan Pustaka 2.1 Simplified Fuzzy ARTMAP (SFAM) SFAM pada dasarnya merupakan sequential counterpart dari parallel fuzzy ARTMAP yaitu dengan menyederhanakan algoritma dengan hasil yang sama. Sebagai classifier, network training digunakan untuk mencari himpunan template yang berupa hiperrectangle yang mengelompokkan/mengklasifikasikan dari suatu pola sedemikan rupa sehingga mampu memberi Gambaran terbaik tentang data anggota yang ada didalamnya [3]. Misalkan himpunan template W = {w1, w2, …, wC} dan jumlah pola dari X yang sesuai dengan setiap template N ={N1, N2, …, NC}. Yang perlu dicatat bahwa jumlah output node, himpunan W dan N akan bertambah (growing) secara dinamis. Tiga fungsi utama Algoritma SFAM adalah fungsi T (), M () and U (). Sedangkan NEWNODE(new) dalam algoritma tersebut adalah sebuah macro routine yang mengalokasikan new node (template) untuk network, yaitu T (x, w) disebut sebagai choice function atau activation function, yang digunakan untuk mengukur derajat dari resemblance dari x dengan w.
T ( x, w j )
x wj
wj
(2.1)
Dimana a adalah choice parameter, a > 0 M( x, wj) disebut match function, yang digunakan untuk menentukan seberapa jauh kesamaan wj dengan x. M ( x, w j )
x w
(2.2)
j
x
Fungsi ini digunakan sebagai conjunction untuk vigilance parameter 0,1, dimana
M x, w j
yang
berarti
resonansi.
Vigilance merupakan parameter network terpenting untuk menentukan resolusinya : larger vigilance value normally yields larger number dari output nodes dan presisi yang bagus. U ( x, wj) disebut update function, yang digunakan untuk mengupdate sebuah template setelah resonansi dengan sebuah pola: U ( x , w j ) (1 ) w j ( x w j ) (2.3) dimana adalah learning rate, 0 1 . Nilai yang lebih tinggi dari dihasilkan dalam faster learning. Disebut sebagai fast learning dalam ART ketika = 1. Operator dalam persamaan (2.1) hingga (2.2) adalah bitwise AND operator, yaitu a b = (a1 AND b1, a2 AND b2, … acC AND bc) , dan || a|| adalah dirumuskan sebagai berikut, D
a ai
(2.4)
i 1
2.2 Simmetric Fuzzy ART (S-Fuzzy ART) ART-1 menggunakan inherently nonsymmetrical architecture untuk menghitung intrinsically symmetric fuzzy ART (S-Fuzzy ART) yang mengadopsi symmetric activation dan match function, yaitu T(x,wj)=T(wj,x) dan T(x,wj)=M(x,wj) (Baraldi, 2002). Dua bentuk dari symmetric activation dan match function adalah: T (x, w j ) M (x, w j )
(2.5)
1 2
1 x w
j
atau D
min{ x T ( x, w j ) M ( x, w j )
d
, wd }
d 1
D
x w d
d 1
(2.6)
D d
d 1
S-Fuzzy ART dapat diimplementasikan menggunakan skema EART-2. Hal ini menunjukkan bahwa Sfuzzy ART lebih unggul
daripada fuzzy ART dalam hal akurasi klaterisasi dan robust terhadap perubahan dari urutan representasi data. Setelah S-Fuzzy ART menemukan tujuan awalnya, Andrew Baraldi dan Ethem Alpaydin mengusulkan group baru dari ART networks yang disebut simplified ART (SART), merupakan generalisasi dari SFuzzy ART dan dapat diimplementasikan menggunakan skema EART, GART dan SFuzzy ART adalah dua contoh dari SART.
kepekatan pheromon seperti ditunjukkan pada Gambar 2.1.
2. 3 Fuzzy ARTMAP Berbobot Metode ini merupakan pengembangan dari SFAM dan fuzzy ARTMAP yang mana algoritma ini secara umum mengkombinasikan antara fuzzy ARTMAP dan synmetric fuzzy ART serta ditambah dengan pembobotan node cluster berdasarkan jumlah pola dan size dari node cluster tersebut. Ada beberapa hal yang perlu diperhatikan dalam fuzzy ARTMAP sebagai berikut dimana nilai fungsi dari aktifasi T() dan match (M) pada suatu node output tidak terpengaruh terhadap jumlah data yang ada dalam node terxebut, dengan kata lain jika ada dua node output yang memiliki bentuk dan ukuran yang sama, tetapi memiliki jumlah pattern yang ada tidak sama, maka nilai T() maka menimbulkan ketidakadilan terhadap node yang memiliki jumlah pattern yang lebih banyak. Sehingga ide dasar fuzzy ARTMAP berbobot adalah mencari bentuk formula baru dari T() dan M() yang merupakan hasil relaksasi fungsi pada SFAM dan S-fuzzy ART dengan mengalikan dengan parameter likenessintensity (Li). Serta dijumlahkan dengan bobot pheromon dengan maksud memberi nilai lebih besar pada ukuran cluster node yang memiliki pattern lebih banyak. Proses pembobotan dalam algoritma ini mengadopsi sistem pheromon dan peluruhannya pada sistem koloni semut, dan penerapan jejak pheromon pada metode ARTMAP terletak pada seberapa pertambahan size (pola baru sudah didalam cluster). Jika tidak terjadi pertambahan size (pola baru sudah didalam cluster) maka tingkat kepekatan pheromon dalam node tersebut semakin besar walaupun terjadi peluruhan karena waktu. Akan tetapi, jika pola baru menyebabkan ukuran cluster node bertambah besar, maka tingkat peluruhan/evaporasi kepekatan pheromon juga semakin besar karena harus disebar ke ruang baru sehingga tingkat kepekatan pheromon menjadi berkurang [2]. Ilustrasi dari perubahan
Dari ilustrasi Gambar 2.1, jejak pheromon dapat ditulis dengan persamaan :
Gambar 2.1. Size cluster node bertambah karena beresonansi dengan pola baru
r
w
j
(2.1)
(t )
w j (t 1)
j (t 1)
( ( j ( t )( r1 j (t ))) if j ( t 1)||w j ( t 1)|| w j ( t 1)
else
(2.2) Dimana : r =ratio pertambahan size cluster node baru dengan size cluster node lama. = constant pheromon yang ditinggalkan setiap terjadi update cluster node. =constant evaporasi/peluruhan setiap terjadi update cluster node. j ( t 1) = jejak pheromon jika terjadi resonansi antara pola dengan node output. Pengembangan lainnya dari algoritma SFAM ini dengan menggabung antara nilai yang dihasilkan dari T() dan M() pada persamaan dengan nilai dari symmetric fuzzy ARTMAP, dimana T() dan M() berbobot ditunjukkan pada persamaan berikut ini: T(xi , wj ) (1 ) *
x wj n wj
M(xi , wj ) (1) *
x wj wj
1
*
1 x wj
*
(2.7) 2
1 1 x wj
2
j
(2.8)
Dimana nilai adalah bobot kesimetrisan yang jika nilainya 1 berarti sama dengan persamaan fuzzy ARTMAP ditambah pembobotan dan jika nilai 0 maka prinsip kerjanya sama dengan ART.
3. Optimasi parameter menggunakan Algoritma Genetika Algoritma genetika atau GA (Genetic Algorithm) adalah jenis nonpolynomial (NP) Secara khusus dapat di terapkan untuk memecahkan masalah optimasi yang kompleks, sehingga baik untuk aplikasi yang memerlukan startegi pemecahan masalah secara adaptif. Penggunaan algoritma ini secara inheren paralel, karena pencarian pemecahan yang terbaik dilakukan melalui struktur genetik yang menyatakan sejumlah kemungkinan penyelesaian (Godberg, 1989). Diagram alir optimasi parameter dengan menggunakan algoritma genetika ditunjukkan pada Gambar 3.1
diantaranya RHO= vigilance untuk tingkat resonansi pada saat learning , PI = PheromonIntensity untuk pembobotan nilai bias, dan LI = LikenessIntensity untuk menentukan kisimetrisan yang menentukan jumlah node cluster yang terbentuk. 3.2 Fitness Function Kromosom pada individu mewakili parameter fungsi fuzzy ARTMAP untuk menghasilkan nilai fitness. Nilai fitness dihitung pada setiap populasi kromosom dan diambil nilai fitness tertinggi pada setiap populasi [4]. Fitness yang digunakan untuk mengukur performansi klasifikasi. fitness = accuracy klasifikasi
(3.1)
3.3 Desain Kromosom Algoritma genetika digunakan untuk menentukan estimasi parameter yang tujuannya untuk meningkatkan akurasi klasifikasi. Pendekatan fitur diperoleh dari hasil ekstraksi fitur dan hasil analisa parameter fungsi fuzzy ARTMAP berbobot yang terdiri dari parameter =vigilance (Rho), Pi = pheromonintensity dan Li = likenessintensity. Nilai minimum dan maksimum pada parameter dibatasi oleh user. Kromosom gen diilustrasikan pada Gambar 3.2 dan dinyatakan dalam bit string dengan ghenotype yang disimbolkan g 1 ~ g n menyatakan nilai parameter vigilance, g1pi ~ gnpi menyatakan nilai pi parameter pi, g1li ~ glinli menyatakan parameter li.
Gambar 3.2 desain kromosom pada inisialisasi parameter Rho, Pi dan Li
Gambar 3.1. Optimasi parameter menggunakan algoritma genetika 3.1 Inisialisasi Parameter Sebelum menganalisa fitness, maka perlu menganalisa parameter yang berpengaruh terhadap classifier diantaranya analisa fungsi pada metode fuzzy ARTMAP berbobot
Proses pengubahan ghenotype menjadi phenotype dinyatakan sebagai berikut: max p min p p min p xd 2l 1 (3.2) dimana : p = phenotype pada bit string minp= nilai minimum pada parameter maxp= nilai maksimum pada parameter d = nilai desimal pada bit string l = panjang bit string
3.4. Pindah Silang (Crossover) Pindah silang bisa juga berakibat buruk jika ukuran populasinya sangat kecil. Dalam suatu populasi yang sangat kecil, suatu kromosom dengan gen-gen yang mengarah ke solusi akan sangat cepat menyebar ke kromosomkromosom lainnya. Untuk mengatasi masalah ini digunakan suatu aturan bahwa pindah silang hanya bisa dilakukan dengan suatu probabilitas tertentu Pc. Artinya pindah silang bisa dilakukan hanya jika suatu bilangan random (0,1) yang dibangkitkan kurang dari Pc yang ditentukan. Peluang crossover yang digunakan adalah 0.9. Pindah silang bisa dilakukan dalam beberapa cara berbeda. Pindah silang yang digunakan adalah pindah silang satu titik potong (one-point crossover). Suatu titik potong dipilih secara random, kemudian bagian pertama dari orang tua 1 digabungkan dengan bagian kedua dari orang tua 2 (Utami, 2008). 3.5. Mutasi Mutasi digunakan untuk memperkenal-kan beberapa penyebaran tiruan dalam populasi untuk mencegah konvergensi dini pada titik optimum lokal. Prosedur mutasi sangatlah sederhana dan untuk semua gen yang ada jika bilangan random yang dibangkitkan kurang dari probabilitas mutasi Pmut yang ditentukan maka ubah gen tersebut menjadi nilai kebalikannya (dalam binary encoding, 0 diubah 1, dan 1 diubah 0). Besarnya Pmut diset sebagai 1/n, di mana n adalah jumlah gen dalam kromosom. Dengan Pmut sebesar ini berarti mutasi hanya terjadi sekitar satu gen saja (Utami, 2008).. 3.7. Elitisme Karena seleksi dilakukan secara random, maka tidak ada jaminan bahwa suatu individu bernilai fitness tertinggi akan selalu terpilih. Kalaupun individu bernilai fitness tertinggi terpilih, mungkin saja individu tersebut akan rusak (nilai fitnessnya menurun) karena proses pindah silang. Untuk menjaga agar individu bernilai fitness tertinggi tersebut tidak hilang selama evolusi, maka perlu dibuat satu atau beberapa kopinya. Prosedur ini dikenal sebagai elitisme (Utami, 2008).
Tabel 1.Karakteristik data set UCI repository Set Data Wine Ionosphere Sonar WBCD
Jumlah Sample 178 155 208 351
Jumlah Attribut 13 34 60 10
Jumlah Kelas 3 2 2 2
IV. Uji Coba dan Hasil Penelitian 4.1 Data Dan Skenario Uji Coba Tahapan klasifikasi dilakukan pelatihan (training) untuk mendapatkan pemodelan, sedangkan tahapan testing untuk mengukur pemodelan yang menghasilkan akurasi. Hasil akhir dari proses pengklasifikasian menggunakan metode fuzzy ARTMAP berbobot, dilakukan analisis terhadap hasil akurasi, serta dilakukan uji performansi k-folds cross-validation untuk membandingkan antara hasil yang dicapai oleh metode FAMB berbasis GA atau GA-FAMB dan FAMB berbasis Grid Search atau disebut GS-FAMB. Sedangkan diagram alur estimasi parameter ditunjukkan pada Gambar 4.1. Uji coba yang dilakukan pada penelitian ini menggunakan 4 dataset UCI repository yang terdiri data wine, sonar, WBCD, dan ionosphere. Uji coba dilakukan pada sebagian set data UCI machine learning repository pada Tabel 1. Data tersebut didapat di alamat http://www.ics.uci.edu/~mlearn-/databases.
Algoritma genetika digunakan untuk mendapatkan parameter terbaik yang digunakan untuk training menghasilkan pemodelan. Sedangkan algoritma grid search ditunjukkan pada Gambar 4.2. Prinsip GS yaitu memilih parameter terbaik dengan menentukan nilai parameter pada rentang tertentu untuk setiap parameter untuk menghitung performansi dengan k-fold cross validation, kemudian pilih nilai terbaik. Selanjutnya lakukan pencarian ulang pada grid (rentang nilai) yang lebih kecil. Kelemahan dari metode ini melakukan pencarian pada grid yang terlalu kecil yang mengakibatkan overfitting. 4.2 Hasil Penelitian Hasil uji coba ditunjukkan pada Tabel 1. menunjukkan hasil uji coba pembelajaran data set WBCD, nilai fitness tertinggi maksimal sebanding nilai akurasi training yang diperoleh pada fold1 dan fold 5. Berdasarkan uji coba pada Gambar 4.1 maka nilai fitness diperoleh dari nilai akurasi training klasifikasi fuzzy ARTMAP berbobot pada fold 1. Uji coba dilakukan hingga mencapai n iterasi yang sama sampai memperoleh nilai fitness tertinggi dan nilai sama untuk setiap iterasi yaitu kondisi konvergen (Godberg, 1989).
Gambar 4.1 Sistem arsitektur algoritma genetika pada optimasi parameter klasifikasi fuzzy berbobot Gambar 4.2 Estimasi algoritma Grid Search
parameter
dengan
Tabel 4.2. Hasil uji coba data set WBCD menggunakan algoritma genetika Uji ke1 2 3 4 5 6 7 8 9 10 Rata-rata
Sensitifitas 100 97.7778 97.7778 98.0456 97.7273 97.7273 95.4545 97.7273 95.4545 100 97.52134
Spesifisitas 91.6667 100 95.8333 100 95.8333 95.8333 95.8333 95.8333 100 91.3043 96.21375
Akurasi 97.1014 98.5507 97.1014 98.5507 97.0588 97.0588 96.1882 97.0588 97.0588 97.0149 97.27425
Fitness 100 99.8371 99.5114 99.8371 100 99.8374 99.8374 99.5122 99.6748 99.6753
rho 0.2416 0.0061 0.1982 0 .3067 0.0544 0.0258 0.0643 0.2401 0.0533 0.1935
P 0.0415 0.0175 0.0131 0.3755 0.0025 0.0109 0.0236 0.0396 0.004 0.0107
I 0.4417 0.2149 0.4809 0.6626 0.1661 0.178 0.2612 0.332 0.2382 0.3403
Tabel 4.3. Hasil uji coba data set WBCD menggunakan algoritma Grid Search Uji ke1 2 3 4 5 6 7 8 9 10 Rata-rata
Sensitifitas Spesifisitas 97.7778 100.0000 93.3333 100.0000 93.3333 95.0000 100.0000 83.3333 95.4545 95.0000 86.3636 95.8333 90.909 95.8333 97.7273 95.8333 97.7273 91.6667 97.7273 95.6522 95.0353
94.8152
Pada Gambar 4.3 menunjukkan nilai ujicoba pada GA dari keempat data set. Pembelajaran dilakukan hingga konvergen dengan parameter yang berbeda untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada wine maksimal generasi sebanyak 10, sonar sebanyak 50 generasi, WBCD dan ionosphere mencapai
Akurasi 97.1014 95.6522 95.6522 94.203 97.0588 89.7059 92.6471 97.0588 95.5882 95.5882
rho 0.3000 0.3000 0.9000 0.5400 0.4800 0.2600 0.5000 0.2000 0.8600 0.1600
P 0.0200 0.2000 0.8600 0.2200 0.0600 0.1000 0.4000 0.1000 0.4600 0.0600
I 0.7600 0.7600 0.6000 0.2600 0.2200 0.6600 0.7800 0.7400 0.8600 0.6600
95.0256 100 generasi. Sedangkan perbandingan nilai iterasi ketika mencapai konvergen diperoleh pada data wine mulai iterasi 1 sampai 10 nilai konvergen, sonar pada itersi ke-14, WBCD pada iterasi ke-78 dan ionosphere pada iterasi ke-24. semakin banyak atribut dari data set semakin banyak iterasi yang dibutuhkan untuk mencapai konvergen. Tabel 4.3 Rekapitulasi hasil uji coba ten fold cross validation Keterangan Rata-rata selisih akurasi (GAFAMB)-(GSFAMB) Fold GA-FAMB menang Fold GA-FAMB seri Fold GA-FAMB kalah Significant pada tingkat kepercayaan 95%
Gambar 4.3 Perbandingan nilai fitness dengan generasi fold 1
Ionos phere
Wine
Sonar
WBCD
+
+
+
+
7
6
7
7
2
1
3
1
1
3
0
2
ya
ya
ya
Tidak
Dari rekapitulasi hasil uji coba yang ditunjukkan pada Tabel 4.3 dapat diketahui bahwa metode GA-FAMB memiliki mean selisih akurasi positif untuk seluruh 4 dataset (wine, sonar, WBCD, dan ionosphere) mean selisih akurasinya sigifikan pada confidence level 95%. Dari 4 sisanya, pada 1 dataset (ionosphere) signifikan pada confidence level 98%. Sedang pada dataset sonar mean selisihnya tidak signifikan secara statistic
100.0 Akurasi (%)
95 90 85 80 75 70 65 60 1
2
3
4
5
6
7
8
9
10
Fold keWine
WBCD
Ionosphere
Sonar
Gambar 4.6. Grafik Perbandingan Nilai Akurasi metode GS-FAMB
120.0
80.0 60.0 40.0 20.0 0.0
wine
sonar
WBCD
Ionosphere
GS
90.4
71.9
95.0
89.8
GA
93.9
76.4
97.5
93.7
Gambar 4.4 Grafik perbandingan Nilai Akurasi Klasifikasi GA-FAMB vs GSFAMB 100 95 90 Akurasi (%)
100
Akurasi (%)
ditunjukkan pada Gambar 4.5 dan Gambar 4.6. Dari uji coba pembelajaran, dapat disimpulkan bahwa secara umum metode GA-FAMB memiliki akurasi yang lebih baik dari metode GS-FAMB pada parameter optimal. Pada Gambar 4.4 grafik menunjukkan rata-rata nilai akurasi metode GA-FAMB lebih tinggi dibandingkan metode GS-FAMB. Nilai akurasi tertinggi diperoleh pada data set WBCD sedangkan terendah pada akurasi data sonar.
85 80 75 70 65 60 1
2
3
4
5
6
7
8
9
10
Fold keWine
WBCD
Ionosphere
Sonar
Gambar 4.5 Grafik Perbandingan Nilai Akurasi metode GA-FAMB
5. Kesimpulan 1. Algoritma genetika mampu mendapatkan nilai parameter optimal secara otomatis dengan hasil yang lebih tinggi untuk set data wine sebesar 93.88%, sonar sebesar 76.35%, WBCD sebesar 97.51%, ionosphere sebesar 93.74% dibandingkan algoritma grid search untuk set data wine sebesar 90.41%, sonar sebesar 71.86% , WBCD sebesar 95.03%, ionosphere sebesar 89.80%. 2 Dari hasil uji t-test berpasangan, algoritma genetika menunjukkan bahwa nilai akurasi, sensitifitas dan spesifisitas ratarata terbukti nilainya lebih besar dan ratarata selisih akurasinya signifikan pada tingkat kepercayaan 95% dibandingkan pada algoritma grid search. 3. Algoritma GA-FAMB mampu mencapai kondisi konvergen pada 10 kali uji coba dengan nilai akurasi yang lebih tinggi dari metode GS-FAMB pada data UCI repository kecuali data sonar dipengaruhi jumlah fitur yang banyak. 4. Algoritma GA-FAMB mampu melakukan proses klasifikasi dengan baik dan menghasilkan nilai akurasi yang lebih baik dibandingkan metode GS-FAMB 7. Pustaka Baraldi and Ethem Alpaydm (1998) ”Simplified ART-A new class of ART algorithm, ”International computer
Science Institute, Berkeley, CA, TR-98004 Herumurti, Darlis (2009). ”Klasifikasi Individu Penderita Osteoporosis dengan Menggunakan Fuzzy ARTMAP Berbobot. Tesis, Jurusan Informatika, Pasca Sarjana, Institut Teknologi Surabaya Kasuba, T. (1993) ”Simplified Fuzzy ARTMAP” AL Expert, 8, (11), pp 18-25 Whitley, Darrell (1993). ”A Genetic Algorithm Tutorial”, Colorado State Univirsity. Goldberg, David E (1989), Genetic Algorithms in Search, Optimization and Machine Learning, Kluwer Academic Publishers, Boston, MA. Huang, et al (2006). A GA-based feature selection and parameters optimization for support vector machines. Elsevier, Expert Systems with Applications, pp. 231–240. Tan, P.N., Steinbach, M. dan Kumar, V., (2006), Introduction to Data Mining, Pearson Education, Inc., Boston. Utami, N.D. (2008). Analisis Teknik Crossover Pada Penyelesaian Penjadwalan Praktikum Dengan Algoritma Genetika, Skripsi, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Brawijaya, Malang. Whitley, Darrell (1993). ”A Genetic Algorithm Tutorial”, Colorado State University.