Jurnal Ilmiah ILMU KOMPUTER Universitas Udayana Vol. IX, No. 2, September 2016
ISSN 1979 - 5661
ANALISIS & IMPLEMENTASI ALGORITMA KELELAWAR SEBAGAI FITUR SELEKTOR DALAM KLASIFIKASI DERMATOLOGY
Ketut Ardha Chandra1, I Made Widiartha2, Agus Muliantara 3 1,2,3
Program Studi Teknik Informatika, Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana Jalan Kampus Udayana Bukit Jimbaran, Badung-Bali Email:
[email protected],
[email protected],
[email protected]
ABSTRAK Penyakit kulit merupakan salah satu penyakit yang perlu ditangani secara serius baik dalam pencegahan maupun pengobatan.Di Indonesia, penyakit kulit merupakan penyakit yang menjangkit terbanyak kedua sejumlah 501.280 kasus. Sebagai upaya pencegahan dan pengobatan perlu diketahui klasifikasi penyakit kulit apa yang sedang diderita. Untuk mengetahui klasifikasi penyakit yang tepat perlu diketahui fitur-fitur yang tepat pula. Salah satu jenis penyakit kulit yaitu Erythemato-squamou sangat sulit untuk deteksi karena fitur klinis maupun histopatologis menampilkan 90% fitur serupa. Solusi untuk mengoptimasi kinerja klasifikasi dan memilih fitur yang tepat bisa menggunakan metode bio-inspired salah satunya algoritma kelelawar.Pada penelitian sebelumnya algoritma kelelawar mampu memberikan perfoma yang lebih baik bila dibandingkan dengan algoritma genetika, Particle Swarm Optimization dan Geometric Particle Swarm Optimization. Oleh karena Algoritma Kelelawar memberikan hasil yang baik dalam penelitian komparasi sebelumnya, pada penelitian ini Algoritma Kelelawar digunakan sebagai feature selector untuk membantu proses klasifikasi Dermatology menggunakan Naive Bayes dan Backpropagation dengan harapan akurasi yang dihasilkan klasifier lebih optimal. Penelitian ini menggunakan dua skenario dimana skenario pertama klasifikasi berjalan tanpa menggunakan algoritma kelelawar, dan skenario kedua menggunakan algoritma kelelawar.Hasil penelitian ini mendapatkan kesimpulan bahwa dengan menggunakan algoritma kelelawar akurasi klasifikasi Dermatolgy dapat meningkat. Pada klasifier Naive Bayes akurasi meningkat dari 81,81% menjadi 97,27% dan klasifier Backpropagation meningkat dari 61.40% menjadi 92.39% dengan menggunakan variabel yang paling optimal yaitu α=0,75, β=1 dan γ=0,25. Dari kedua klasifier yang digunakan, algoritma kelelawar mampu memberikan hasil yang konsisten sebagai feature selector dengan menghasilkan pemilihan fitur optimal yang sama yaitu fitur : itching, PNL infiltrate, Parakeratosis, Elongation of the rete ridges, Munro microabcess, dan Follicular horn plug. Kata
Kunci:
Algoritma
Kelelawar,
Feature
selector,
Backpropagation ABSTRACT 15
Dermatology,
Naive
Bayes,
16
Jurusan Ilmu Komputer, Vol. IX, No. 2, September 2016, hlm 15-24
Student is an individual transition from adolescence to adulthood. So that the student is still not stable level of emotion in terms of management. Keywords: Financial Applications, Mobile, Android penyembuhan. Namun pada kenyataannya 1
PENDAHULUAN
penyakit kulit memiliki gejala-gejala yang
Penyakit kulit merupakan salah satu penyakit yang perlu ditangani secara serius baik
dalam
pencegahan
maupun
pengobatan.Berdasarkan laporan Organisasi Kesehatan Dunia (WHO) pada tahun 2011, penyakit kulit masih sering terjadi pada masyarakat
pedesaan
di
negara-negara
berkembang dengan konsekuensi ekonomi dan sosial yang serius.
negara
berkembang
dan
banyak
memiliki wilayah pedesaan, harus memiliki sarana
medis
yang
memadai
guna
mengatasi permasalahan penyakit kulit yang
sering
menjadi sulit.Minimnya akurasi disebabkan hasil pengukuran yang salah maupun fiturfitur yang tidak diperlukan yang justru menganggu hasil dari klasifikasi penyakit kulit tersebut. Salah satu tantangan dalam bidang dermatology yaitu membedakan Erythemato – Squamous Diseases (ESD) (Olatunji,2013).Dalam pendeteksian ESD
Indonesia yang merupakan salah satu
hampir serupa sehingga proses klasifikasi
terjadi.Menurut
Direktur
fitur
penyakit
kulit
berdasarkan terbanyak
dan
jaringan
prevalensi pada
subkutan
10
penyakit
masyarakat
Indonesia
menduduki peringkat kedua setelah infeksi saluran penapasan akut dengan jumlah 501.280 kasus (Tuti, 2010).
Penanganan
sejak dini tentunya akan mengurangi jumlah kasus penyakit kulit yang akan terjadi di masyarakat.
kulit perlu diperhatikan gejala-gejala yang timbul agar klasifikasi jenis penyakit kulit dapat diketahui oleh masyarakat dan dapat proses
90%
(Badrinath,2013).
Hal
histopatologis fitur
serupa
ini
memicu
penelitian bagaimana mengoptimasi kinerja klasifikasi agar keakuratannya dapat lebih meningkat. Untuk mendapatkan hasil diagnosa penyakit
kulit
membutuhkan
berbagai
proses untuk memperoleh fitur-fitur yang diperlukan untuk mendapat hasil klasifikasi akhir. Salah satu jenis penyakit kulit yaitu Erythemato – SquamousDiseases melewati tahapan proses klinis dan histopatologis untuk
mendapatkan
klasifikasi
fitur-fitur
dermatology.
Proses
dalam klinis
diperoleh melalui diagnosa secara langsung seperti sejarah keturunan, usia, hingga
Dalam penanganan dini penyakit
dilakukan
maupun
menampilkan
Jenderal Pelayanan Medik Departemen Kesehatan Republik Indonesia tahun 2006
klinis
pencegahan
maupun
penampakan
kulit
secara
langsung.
Sementara proses histopatologis diperoleh melalui pengamatan melalui mikroskop menggunakan sampel kulit pasien. Proses
Chandra, dkk., Analisis & Implementasi…17
histopatologis memerlukan waktu yang
proses diagnosa dapat
lama hingga mendapat fitur-fitur yang
cepat sehingga lebih efisien dari segi waktu
dibutuhkan. Proses pendeteksian yang lama
maupun finansial (Andi, 2003).
akan mengakibatkan pencegahan dini sulit untuk
dilakukan
penyembuhan
akan
dilakukan lebih
Salah satu metode optimasi Bio –
sehingga
proses
Inspired terbaru adalah Bat Algorithm atau
terhambat
sampai
Algoritma
putusan diagnosa telah dihasilkan.
Kelelawar.
Secara
umum
algoritma kelelawar meniru tingkah laku
Terdapat berbagai macam metode
kelelawar dalam mencari makanan dan
klasifikasi modern menggunakan komputasi
dapat membedakan jenis-jenis serangga
sehingga proses klasifikasi bisa dilakukan
walaupun dalam kegelapan total (Yang,
lebih cepat dibandingkan proses klasifikasi
2010). Algoritma kelelawar merupakan
secara konvensional. Tetapi tidak hanya
metode optimasi metaheuristik yang dapat
kecepatan klasifikasi yang dibutuhkan,
digunakan sebagai feature selector dalam
tingkat akurasi yang tinggi juga diperlukan
kasus klasifikasi. Algoritma Kelelawar
utamanya dalam klasifikasi di bidang
memberikan perfoma yang lebih baik bila
kesehatan, sebab bila terdapat kesalahan
dibandingkan dengan beberapa algoritma
akan berpengaruh buruk terhadap kesehatan
lainya seperti Algoritma Genetika, Particle
pasien. Salah satu penelitian komparasi
Swarm Opimization dan Geometric Particle
klasifikasi penyakit kulit menggunakan
Swarm
metode Naive – Bayes hanya menghasilkan
Selain itu Algoritma Kelelawar dapat
tingkat akurasi sebesar 72.85% (Kundu,
memberikan akurasi menggunakan Naive
dkk, 2010). Sehingga proses klasifikasi
Bayes sebagai evaluatornya yang cukup
penyakit kulit khususnya menggunakan
menjanjikan
Naive
dibandingkan dengan metode Exhaustive
–
Bayes
memerlukan
suatu
optimalisasi agar akurasinya meningkat. Berdasarkan
fakta
yang
sebesar
(Ahmad,
98,29
2013).
%
bila
Search dan Genetic Search yang secara
telah
berurutan memberikan hasil 82,97% dan
dijelaskan di atas, dapat disimpulkan bahwa
82,55%
proses
klasifikasi
Optimization
(Pallavi,
2013).
Oleh
karena
Dermatology
atau
Algoritma Kelelawar memberikan hasil
menghadapi
dua
yang baik dalam penelitian komparasi
permasalahan yaitu akurasi yang minim
sebelumnya, Algoritma Kelelawar akan
serta proses diagnosa yang lama. Solusi
digunakan sebagai feature selector untuk
permasalahan tersebut dapat diatasi dengan
membantu proses klasifikasi Dermatology
menggunakan diagnosa komputasi yang
menggunakan
biasa
Backpropagation dengan harapan akurasi
penyakit
kulit
dikenal
dengan
istilah
Bio
–
Informatika. Dengan Bio – Informatika
Naive
Bayes
dan
18
Jurusan Ilmu Komputer, Vol. IX, No. 2, September 2016, hlm 15-24
yang dihasikan klasifier dapat berjalan lebih
bertengger dalam kegelapan (Yang, 2010).
optimal.
Kelelawar memancarkan kadar pulsa suara yang
2
METODE,
DESAIN,
DAN
DATASET 2.1
nyaring
dan
mendengar
gelombang yang memantul dari objek di sekelilingnya. Kadar pulsa dapat bervariasi dan berkorelasi dengan strategi memburu
Metode Terdapat
digunakan
sangat
tiga
dalam
metode
penelitian
ini
yang
segerombolan kelelawar. Berikut adalah
yaitu
representasi kemampuan kelelawar dalam
Algoritma Kelelawar, Naive Bayes dan
algoritma kelelawar :
Backpropagation.
1.
Algoritma
digunakan
sebagai
sementara
Naive
Backpropagation
kelelawar
feature Bayes
digunakan
Kemampuan echolocation
selector,
secara
dan
kelelawar dapat
variasi
dikembangkan
menjadi
inspiredalgorithm
sebagai
dalam
bat
atau
Sebagai
–
algoritma
klasifier untuk mengukur seberapa besar
kelelawar.
contoh
dapat
akurasi yang dihasilkan dari fitur terpilih.
digunakan beberapa rule atau aturan dari kemampuan untuk menentukan
2.1.1
Algoritma Kelelawar
jarak
Algoritma kelelawar pertama kali
perbedaan mangsa dan penghalang.
diperkenalkan oleh Xin – She Yang pada
2.
dan
kelelawar
‘mengetahui’
Kelelawar terbang secara acak dengan
tahun 2010 dalam jurnalnya yang berjudul
kecepatan (Vi) pada posisi (Xi),
A New Metaheuristic Bat – Inspired
dengan
Algorithm.
gelombang ( ) dan kenyaringan (A)
Kemampuan
kelelawar
dalam
frekuensi
(f),
panjang
dalam mencari mangsa. Kelelawar
menangkap mangsanya merupakan hal
mempunyai
yang sangat unik.Kelelawar mempunyai
menyesuaikan panjang gelombang ( )
kemampuan
dalam
dari dari pancaran pulsa dan mengatur
adalah
kadar dari dari emisi pulsa (r) ∈ [0,1]
handal
echolocation.Echolocation kemampuan dengan
menentukan
menggunakan
suatu
lokasi
echo
atau
gelombang. Kemampuan echolocation ini digunakan
untuk
mencari
mangsa,
kemampuan
untuk
yang sangat penting menentukan target terdekat. 3.
Walaupun bervariasi
kenyaringan berapapun
dapat itu,
tapi
menghindari penghalang dan menentukan
diasumsikan
kelelawar.
bervariasi dari bilang positif yang
Semua
kelelawar
menggunakan
echolocation lokasi pada celah untuk
kenyaringan
dapat
maksimum sampai bilang konstan minimum.
Chandra, dkk., Analisis & Implementasi…19
Adapun
implementasi
algoritma
Kenyaringan
(A)
merupakan
kelelawar sebagai feature selector pada
perubahan jumlah fitur dalam suatu iterasi
kasus klasifikasi direpresentasikan sebagai
selama pencarian lokal di sekitar kelelawar
berikut :
terbaik global dan pencarian lokal pada setiap kelelawar
a.
Posisi Masing – masing posisi kelelawar
direpresentasikan
sebagai
string
Dimana :
biner
fitur
dalam
dataset.
Bit
+
: posisi kelelawar baru
dengan panjang N dimana N merupakan total
=
: posisi kelelawar sebelumnya
‘1’
:
mengindikasikan fitur tersebut dipilih dan
kenyaringan
rata-rata
semua
kelelawar dalam satu iterasi
bit ‘0’ tidak dipilih seperti yang terlihat
: bilangan acak diantara -1 dan 1
pada Gambar 2.1. Ketika kelelawar mulai mendekati solusi terbaik, kenyaringan akan berkurang. Berikut adalah formula untuk konfigurasi nilai kenyaringan :
Gambar 2.1 Ilustrasi Posisi Kelelawar
=α
Dimana :
: kenyaringan kelelawar ke – i untuk Persamaan berikut adalah formulasi
iterasi ke t + 1
penyesuaian posisi kelelawar dimana
: kenyaringan kelelawar ke – i pada
adalah posisi kelelawar ke – i,
iterasi ke – t
merupakan nilai kelelawar ke – i sebelumya dan
α
: variabel konstan diantara 0 dan 1
adalah kecepatan kelelawar ke – i Kenyaringan berada di rentang nilai
pada suatu kurun waktu. Dimana :
=
+
: posisi kelelawar ke – i pada iterasi ke – t : posisi kelelawar ke – i pada iterasi t-1 : kecepatan kelelawar ke – i pada iterasi ke – t b.
Kenyaringan
maksimum dan
minimum yang telah
ditentukan.Penentuan nilai maksimum dan minimun bergantung pada domain aplikasi dan
ukuran
dataset.
Secara
empiris,
penentuan nilai maksimum yaitu 1/5 N dimana N merupakan total fitur (Pallavi, 2013). c.
Frekuensi Frekuensi
merupakan
elemen
bilangan real yang akan mempengaruhi
20
Jurusan Ilmu Komputer, Vol. IX, No. 2, September 2016, hlm 15-24
nilai kecepatan. Pemilihan nilai minimum
kelelawar mendekati solusi terbaik, pulse
dan maksimum disesuaikan dengan domain
rateakan perlahan – perlahan berkurang.
Dimana : fi
+(
=
)
−
[1 − exp(− )]
=
aplikasi. Dimana :
: pulse rate kelelawar pada iterasi t+1
: frekuensi kelelawar ke - i
: nilaipulse rate awal pada kelelawar
: variabel konstan diantara 0 dan 1
: variabel konstan diantara 0 dan 1
fmax
: nilai maksimum frekuensi
fmin
: nilai minimumfrekuensi
Dimana
merupakan kadar
pulsa kelelawar dengan solusi baru, d.
Kecepatan
merupakan kadar pulsa kelelawar dengan
Kecepatan kelelawar
masing-masing
direpresentasikan
dengan
solusi sebelumnya, t adalah kurun waktu, adalah nilai konstan.
bilangan integer positif. Kecepatan akan mempengaruhi berapa jumlah fitur yang
f.
Fungsi Fitness Fungsi
harus berubah dalam suatu kurun waktu. Kelelawar berkomunikasi satu dengan yang lainnya melalui solusi global terbaik dan bergerak menuju solusi terbaik global. Dimana :
(
∗
−
=
+(
∗
−
)
setiap
kandidat
digunakan
pada
dimana
dalam
solusi
penelitian ini menggunakan Naive Bayes sebagai evaluatornya.
Dimana :
=
.
+
−
.
: kecepatan kelelawar ke – i pada
: nilai Fitness kelelawar ke – i
iterasi ke-t
: paramater dengan rentang diantara
: kecepatan kelelawar ke – i pada
0 dan 1 untuk bobot akurasi
iterasi ke-( − 1)
: paramater dimana
):
merupakan perbedaan posisi
kelelawar
global
(*)
=1−
bobot jumlah fitur
dengan
untuk
: hasil akurasi yang dihasilkan
kelelawar ke – i pada iterasi ke – t. e.
fitness
klasifier
Pulse Rate Pulse rate (r) mempunyai peran
2.1.2
untuk menentukan kapan pencarian lokal
Naïve Bayes Classifier Thomas Bayes yaitu ilmuwan asal
dari kelelawar terbaik global dilewati.
inggris
Besar nilai pulse rateakan mengurangi
klasifikasi melalui pendekatan probabilitas
kemungkinan melakukan pencarian lokal
dan statistik yang dikenal dengan ‘Naive
dan begitu pula sebaiknya. Maka, ketika
Bayes’.
menemukan
Thomas
suatu
Bayes
metode
memprediksi
Chandra, dkk., Analisis & Implementasi…21
peluang yang akan datang dengan kejadian atau
pengalamaan
sebelumnya
yang
akhirnya dikenal sebagai teorema Bayes. Teorema tersebut dikombinasikan dengan ‘naive’ dimana diasumsikan kondisi antar atribut saling bebas.
Dimana :
=
∑
( ) ( | )
,
= 1, … ,
Gambar 2.2 Arsitektur Backpropagation
: probabilitas nilai kelas : probabilitas kelas
Pada gambar 2.2 diperlihatkan
dengan suatu
nilai atribut ∑
( ) ( | )
satu unit hidden layer.Xi adalah unit input : total dari seluruh
probabilitas
kelas
( ( ))
dikali
dengan seluruh probabilitas kelas dengan suatu nilai atribut 2.1.3
arsitektur jaringan backpropagation dengan
Backpropagation
( | )
layer, Zj adalah unit hidden layer, dan Yk adalah unit output layer. Setiap unit memiliki
bagian
dari
Backpropagation
Neural merupakan
hidden layer dan Wjk adalah bobot dari unit hidden layer ke unit output layer.
Network. metode
Penggunaan
1.
neural network diberikan sejumlah
dicari. ciri dari Backpropagation adalah
data pelatihan dan target. 2.
dihasilkan oleh jaringan. dalam metode biasanya
Tahap Belajar atau pelatihan, dimana pada tahap ini pada backpropagation
dalam artian mempunyai target yang akan
meminimalkan error pada output yang
BackPropagation
terdiri dari dua tahap :
pelatihan terawasi (supervised learning),
backpropagation,
masing-masing.Vij
adalah bobot dari unit input layer ke unit
Backpropagation merupakan salah satu
bobotnya
Tahap pengujian atau penggunaan, pengujian dan penggunaan dilakukan
digunakan
setelah
jaringan multilayer. Jaringan multilayer
Backpropagation
selesai
belajar.
yang dimaksud adalah layer yang terdiri dari input layer (layer masukan), hidden
Setiap umpan maju (feedforward),
layer (layer tersembunyi), output layer
setiap unit input (Xi) akan menerima sinyal
(layer keluaran). Dalam pengembangannya,
input dan akan menyebarkan sinyal tersebut
hidden layer dapat terdiri dari satu atau
pada tiap hidden unit(Zj). Setiap hidden
lebih unit hidden layer.
unit
Arsitektur
jaringan
propagation adalah sebagai berikut :
back
kemudian
akan
menghitung
aktivasinya dan mengirim sinyal (zj) ke tiap unit output.Kemudian setiap unit output
22
Jurusan Ilmu Komputer, Vol. IX, No. 2, September 2016, hlm 15-24
(Yk) juga akan menghitung aktivasinya (yk) untuk menghasilkan respon terhadap input yang diberikan jaringan. Saat proses pelatihan (training), setiap
unit
output
membandingkan
aktivasinya (yk) dengan nilaui target (tk) untuk
menentukan
besarnya
error.
Berdasarkan error ini, dihitung faktor delta k, dimana faktor ini digunakan untuk mendistribusikan error dari output ke layer sebelumnya. Dengan cara yang sama, faktor delta j juga dihitung pada hidden unit Zj, dimana
faktor
ini
digunakan
untuk Gambar 2.3 Flowchart alur sistem
memperbaharui bobot antara hidden layer dan input layer. Setelah semua faktor delta ditemukan,
bobot
untuk
semua
diperbaharui. 2.2
2.3
layer
Dataset Dalam penelitian ini digunakan
datasets yang berasal dari University of
Desain
California Irvine (UCI) Repository yaitu
Gambar 2.3 merupakan diagram
Dermatology
database.
Terdapat
366
user
sampel pasien yang masing – masing
memasukan paramater yang dibutuhkan.
memiliki 34 atribut. Dermatology database
Selanjutnya yaitu proses pemilihan fitur
mempunyai
algoritma kelelawar dengan menggunakan
banyak sehingga sesuai dengan penelitian
dataset yang ada, dimana bagian ini
ini.
alir
dari
sistem.
Pertama-tama
jumlah
fitur
yang
cukup
merupakan training section. Setelah training
Dalam dataset Dermatology pasien
section didapatkan tabel bayangan dari
pada mulanya didiagnosa secara klinis
dataset sementara menggunakan fitur-fitur
dengan 12 fitur.Setelah itu, sampel kulit
yang telah dipilih oleh setiap kelelawar.
pasien diambil sebagai diagnosa 22 fitur
Tabel bayangan akan diuji menggunakan
histopatologis.Hasil
Naive Bayes Classifier untuk memperoleh
Histopatologis didapatkan melalui analisa
nilai akurasi yang akan digunakan dalam
sampel menggunakan mikroskop.Atribut
mencari nilai fitness setiap kelelawar,
klinis maupun histopatologis dapat dilihat
bagian ini merupakan testing section.
pada Tabel 1.
dari
fitur
Dataset Dermatology terdiri atas 34 atribut, 33 merupakan linier dan satu
Chandra, dkk., Analisis & Implementasi…23
merupakan
nominal.Pada
fitur
family
a.
Menghitung
berapa
akurasi
yang
history, nilai ‘1’ mengandung makna bahwa
mampu dihasilkan algoritma kelelawar
keluarga pasien pernah mengalami riwayat
melalui
penyakit
menggunakan dua klasifier yaitu Naive
kulit
sementara
nilai
‘0’
mengandung makna keluarga pasien tidak ada yang memiliki riwayat penyakit kulit.
seleksinya
dengan
Bayes dan Backpropagation. b.
Fitur – fitur lainnya baik klinik maupun histopatologis diberikan rentang nilaii dari
fitur
Mencari variabel
dan γ yang
,
paling optimal. c.
Menguji konsistensi terhadap fitur
0 – 1 dimana 0 memberkan makna fitur
terpilih dari dua klasifier berbeda
tersebut nihil, 3 memberikan makna nilai
(Naïve Bayes & Backpropagation).
yang paling tinggi dan 1 atau 2 memberikan
Konsistensi tercapai bilamana fitur
makna nilai tengah – tengah.
terpilih
Tabel 2.1 Distribusi kelas pada database
merupakan fitur yang sama.
Dermatology Kode
Kelas
Kelas 1
Psoriasis
d.
diantara
kedua
klasifier
Menghitung kompleksitas waktu dari
Jumlah
sistem
Sampel
efisiensi waktu yang diperoleh dengan
112
dan
membandingkannya
metode Brute Force.
Seboreic
e.
Membandingkan akurasi dan waktu
2
Dermatitis
61
proses pada klasifikasi dermatolgy
3
Lichen planus
72
yang
Pityriasis 4
rosea
kelelawar 49 f.
dermatitis
dengan
dan
algoritma
dengan
tanpa
menggunakan algoritma kelelawar.
Cronic 5
diperoleh
52
Analisis karakteristik fitur yang cocok dengan algoritma kelelawar.
Pityriasis 6
rubra pilaris
Karakteristik
20
paramater
untuk
pengujian dalam penelitian ini yaitu sebagai berikut : 3
a.
SKENARIO UJI COBA Pada sub bab ini akan dipaparkan
mengenai dilakukan
hasil
pengujian
yang
telah
analisis
dari
hasil
sertai
pengujian yang diperoleh. Adapun tahapan pengujian yang dilakukan pada penelitian ini sebagai berikut :
Bobot fitness yang digunakan yaitu δ = 0,9 dan
= 0,1. Bobot
merujuk
kepada tingkat akurasi dan
merujuk
kepada jumlah fitur. b.
Penelitian ini menggunakan varian variabel nilai
,
diantara
dan γ dengan rentang 0
dan
1
dengan
24
Jurusan Ilmu Komputer, Vol. IX, No. 2, September 2016, hlm 15-24
increment 0,25 sehingga didapatkan
c.
d.
kedua klasifier yang digunakan
varian , dan γ sebanyak 64 varian.
yaitu: Naive Bayes dan Backpropagation,
berjumlah
berikan hasil yang konsisten terhadap
Kelelawar
yang
30
dibangkitkan
kelelawar,
iterasi
terbukti bahwa algoritma kelelawar mampu
maksimal berjumlah 50 iterasi.
pemilihan fiturnya. Masing-masing klasifier
Metode Brute Force yang digunakan
menunjukan bahwa hasil paling optimal
sebagai perbandingan efisiensi waktu
yaitu menggunakan enam fitur terpilih pada
akan menjalankan seluruh search space
posisi kelelawar :
pada penelitian ini, dimana search
0001000000000100001010010000010000
space
atau dalam kata lain fitur terpilih yaitu fitur
dalam
penelitian
ini
yaitu
seluruh kombinasi fitur pada data dermatology.
Data
dermatology
ke : 4, 14, 19, 21, 24, dan 30. Algoritma kelelawar mempunyai karakteristik
yang akan dieksekusi oleh Brute Force
kompleksitas linear yaitu kompleksitas
sebanyak 2 − 1 = 17.179.869.184
bertumbuh seiring dengan pertumbuhan
kombinasi.
kompleksitasi
( )
memiliki 34 fitur sehingga kombinasi
atau
data. Dalam pengujian didapatkan bahwa algoritma kelelawar membutuhkan waktu
4
HASIL UJI COBA Pengujian
proses sebanyak 544 detik atau 9 menit 4
telah
dilakukan
detik untuk mendapatkan hasil akurasi
sebanyak 10 kali percobaan pada setiap
paling optimal seperti pada tabel 4.12.
klasifier dengan 64 kombinasi fitur α, β dan
Sementara itu hasil analisis menggunakan
γ
30
Brute Force menghasilkan hasil akurasi
kelelawar dan 50 iterasi. Dari 10 percobaan
yang sama dengan algoritma kelelawar
yang telah dilakukan lalu dirata-ratakan dan
namun membutuhkan waktu proses hingga
disajikan pada tabel.
72735 detik atau 20 jam 12 menit 15 detik.
menggunakan
parameter
yaitu
Hasil penelitian menunjukan bahwa
Maka secara signifikan algoritma kelelawar
hasil paling optimal terdapat pada variabel
mampu menghasilkan akurasi yang serupa
dengan nilai α=0,75, β=1
dan γ=0,25.
dengan Brute Force namun dalam segi
Tingkat akurasi yang didapatkan pada
waktu sangat jauh lebih efisien. Untuk
klasifier Naive Bayes yaitu sebesar 97,27%
selengkapnya bisa dilihat pada tabel 4.1
dengan jumlah fitur yang dipilih enam dan nilai fitness sebesar 0.95725. Sementara Backpropagation
menghasilkan
akurasi
sebesar 92.392% dengan jumlah fitur yang dipilih enam dan nilai fitness 0.9133.
Tabel 4.1 Perbandingan Algoritma Kelelawar dengan Brute Force
Chandra, dkk., Analisis & Implementasi…25
algoritma
kelelawar
sebagai
feature
selector dalam klasifikasi dermatology dapat ditarik kesimpulan sebagai berikut. 1.
kelelawar
menyelesaikan
Pada Tabel 4.2 terdapat hasil analisa
Algoritma
mampu
permasalahan
fitur
seleksi dalam klasifikasi dermatology.
pada klasifikasi dermatology
dengan dan tanpa Algoritma Kelelawar.
Dari
Hasil dari pengujian didapatkan bahwa bila
kelelawar bila menggunakan Naive
menggunakan algoritma kelelawar klasifier
Bayes classifier mendapatkan tingkat
Naive Bayes menghasilkan akurasi sebesar
akurasi klasifikasi sebesar 97,27%.
97,27% dengan waktu proses selama
Sementara
544,66 detik dan klasifier Backpropagation
classifier mendapatkan tingkat akurasi
menghasilkan
klasifikasi
waktu
akurasi
proses
Sementara algoritma
92,53%
selama
bila
pengujian,
itu
sebesar
algoritma
Backpropagation
92.39%.
Hasil
detik.
penelitian menunjukan bahwa hasil
menggunakan
paling optimal terdapat pada variabel
2769,86
tanpa
kelelawar
dengan
hasil
hasil
dengan nilai α = 0,75,
klasifikasi
dermatology menggunakan Naive Bayes sebesar 81,81% dengan waktu proses
2.
= 1 dan
0,25.
=
Pada penelitian ini algoritma kelelawar
selama 0,15 detik dan Backpropagation
mampu
menghasilkan
61,40%
konsisten sebagai feature selector
dengan waktu proses selama 2,96 detik.
dalam klasifikasi dermatology dengan
Maka dapat disimpukan bahwa dengan
dua metode klasifier yang berbeda
menggunakan kelelawar hasil klasifikasi
yaitu
menjadi lebih baik walaupun waktu proses
Backpropagation.
relatif lebih lama bila dibandingan dengan
didapatkan
tanpa menggunakan algoritma kelelawar.
optimal berjumlah enam yaitu fitur ke :
akurasi
sebesar
memberikan
:
Naive
bahwa
hasil
Bayes Dari
yang
dan
penelitian
pemilihan
fitur
4, 14, 19, 21, 24, dan 30. Algoritma Tabel 4.2 Perbandingan dengan dan
kelelawar mempunyai kompleksitas
tanpa Algoritma Kelelawar
( ) atau kompleksitas linear. Dalam
pengujian didapatkan bahwa algoritma
kelelawar membutuhkan waktu proses sebanyak 544 detik atau 5
detik untuk mendapatkan hasil akurasi
KESIMPULAN Berdasarkan
mengenai
analisis
9 menit 4
hasil dan
paling optimal.
penelitian implementasi
6
DAFTAR PUSTAKA
26
Jurusan Ilmu Komputer, Vol. IX, No. 2, September 2016, hlm 15-24
Ahmed Majid Taha and Alicia Y.C. Tang.“Bat Algorithm for Rough Set Attribute Reduction”. Journal of Theoritical and Applied Information Technology, Vol 51, No.1 May 2013 Cichosz, Pawel.2015.Data Mining Algorithm : Explanation Using.Poland : John Wiley & Sons, Ltd Chiang, Yi Zhen.Dermatology : A handbook for medical students & junior doctors.Manchester : British Association of Dermatologists Davar Giveski., Hamid Salimi., Akhavan Bitaraf., “Detection of erythematosquamous diseases using ARCatfishBPSO-KVSM”, An Internation Journal (SIPIJ) Vol.2, No.4, December 2011 Downey, Allen.2013.Think Bayes.United States of America : O’Reilly Media, Inc. I. Jr. Fister, D. Fister, X.-S Yang. “A hybrid bat algorithm”. Elektrotehniski vestnik, 2013, in press. N.Badrinath., G.Gopinath., and K.S. Ravichandran., “ Design of Automatic Detection of Erythemato-squamous Disease Through Threshold-based ABCFELM Algorithm”, Journal of Aritificial Intelegence 6 (4):245256, 2013 Pallavi.2013.Bio Inspired Hybrid Bat Algorithm with Naive Bayes Classifier for Feature Selection.International Journal of
Science and Research (IJSR) ISSN (Online) : 2319 – 7064 Volume 4 Issue 4. Sunday Olusanya Olatunji and Hossain Arif, “Identification of ErythematoSquamous Diseases using Extreme Learning Machine and Artificial Neural Network” ICTACT Journal on Soft Computing, October 2013, Volume:04, Issue :01 Taha, Ahmed.2013.Naive Bayes – Guided Bat Algorithm for Feature Selection.The Scientific World Journal Volume 2013, Article ID 325973, 9 Pages. X.-S. Yang, A New Metaheuristic BatInspired Algorithm, in: Nature Inspired Cooperative Strategies for Optimization (NISCO 2010) (Eds. J. R. Gonzalez et al.), Studies in Computational Intelligence, Springer Berlin, 284, Springer, 6574 (2010). Xin-She Yang and Amir H. Gandomi, “Bat Algorithm: A Novel Apporach for Global Engineering Optimization”, Engineering Computatuin, Vol.29, Issue 5, pp.464-483(2012) Xin-She Yang, Bat algorithm: literature review and applications, Int. J. BioInspired Computation, Vol. 5, No. 3, pp. 141–149 (2013).DOI: 10.1504/IJBIC.2013.055093 Yang, X. S., (2011), Bat Algorithm for Multiobjective Optimization, Int. J. Bio-Inspired Computation, Vol. 3, No. 5, pp.267-274.