JURNAL KLASIFIKASI PARKET KAYU JATI MENGGUNAKAN METODE SUPPORT VECTOR MACHINES (SVM)
Rina Yuliana Siagian. 50407731.
KLASIFIKASI PARKET KAYU JATI MENGGUNAKAN METODE SUPPORT VECTOR MACHINES (SVM) Skripsi, Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Gunadarma, 2011. Kata Kunci : Parket Kayu Jati, Support Vector Machines
(vii + 64 + Lampiran)
Dalam industri kayu sekarang, jati dijadikan keping-keping parket (parquet) penutup lantai. Akibat krisis ekonomi global kegiatan usaha ekspor produk flooring parket yang dibuat dari bahan bau kayu jati mengalami penurunan drastis. Oleh karena itu standar mutu dari produksi kayu jati parket harus terus ditingkatkan. Kebutuhan perusahaan manufaktur yang tinggi untuk menjaga kualitas produk yang lengkap, memerlukan kontrol selama produksi dan pada akhir proses. Selama ini kontrol yang digunakan adalah kontrol manusia yang tidak sepenuhnya dapat diandalkan dan tidak menjamin kualitas dari total kontrol. Hal ini dapat diatasi dengan menggunakan komputer visi sebagai inspeksi visual produk control. Dalam menentukan klasifikasi otomatisasi digunakan klasifikasi Support Vector Machines. Klasifikasi Support Vector Machines jenis kayu jati parket bertujuan mengklasifikasikan parket ke dalam beberapa jenis parket yang berbeda-beda tetapi mempunyai sifat yang serupa ke dalam kelompok-kelompok berdasarkan pemakaiannya. Dalam penelitian parket dianalisa dengan menggunakan metode Support Vector Machines (SVM). Features yang digunakan dalam analisa
1
2
klasifikasi ini adalah GLDM,
PERCENTILE, dan
LBP.
Data
dalam
penganalisasian terdiri dari 60 data citra kayu jati parket yang akan dianalisa untuk dijadikan prediksi klasifikasi ke dalam jenis kayu jati parket 1,2, atau 3. Daftar Pustaka (1997-2010)
untuk klasifikasi ini memerlukan
Latar Belakang Kayu
jati
atau
Tectona
otomatisasi.
Grandis termasuk dalam kelas satu karena
kekuatan,
klasifikasi
dan
memerlukan penentuan variabel yang
keindahannya. Meskipun keras dan
akan digunakan. Pada penelitian ini,
kuat, kayu jati mudah dipotong dan
variabel yang digunakan adalah hasil
dikerjakan, sehingga disukai untuk
dari penelitian parket kayu jati
membuat furniture dan ukir-ukiran.
sebelumnya
Kayu
Aprilia [1] dan Nanda Pramitha [19].
jati
keawetan
Otomatisasi
Indonesia
memiliki
beberapa kelebihan yang mungkin
oleh
Arum
Agesti
Batasan Masalah
tidak dimiliki oleh kayu-kayu jenis
Ruang lingkup yang dibahas
lain baik dari sisi kekuatan ataupun
di dalam penulisan skripsi ini adalah
teksturnya. Dalam industri kayu
bagaimana
sekarang, jati juga diolah keping-
pengklasifikasi
keping parket (parquet) penutup
Machines parket kayu jati ke dalam
lantai. Parket kayu juga memiliki
kelas 1, 2, dan 3.
pola yang bermacam-macam. Pada
Tujuan Penelitian
penulisan
ini pola
parket kayu
Penelitian
menghasilkan Support
ini
Vector
bertujuan
diklasifikasikan menjadi 3 (tiga)
untuk mengklasifikasi parket kayu
macam
jati
pola,
sebagaimana
yang
diungkapkan oleh Diah Alfiani [3],
dengan
Support
Machines.
yaitu pola bergaris, pola melengkung yang menyerupai huruf U dan juga
LANDASAN TEORI
pola yang agak cacat (cacatnya tidak melebihi 20 persen). Pengenalan pola
Pengolahan Citra
Vector
3
Pengolahan citra merupakan
optik berupa foto, bersifat analog
proses pengolahan dan analisis citra
berupa sinyal video seperti gambar
yang banyak melibatkan persepsi
pada monitor televisi, atau bersifat
visual. Proses ini mempunyai ciri
digital yang dapat langsung disimpan
data masukan dan informasi keluaran
pada suatu pita magnetik. Citra yang
yang
Istilah
bersifat analog disebut dengan citra
pengolahan citra digital secara umum
yang kontinu. Sedangkan citra yang
didefinisikan
bersifat digital disebut dengan citra
berbentuk
citra.
sebagai
pemrosesan
citra dua dimensi dengan komputer.
diskrit.
Dalam definisi yang lebih luas, pengolahan
citra
digital
juga
Kayu parket termasuk ke dalam jenis kayu daun lebar. Kayu
mencakup semua data dua dimensi.
parket
Citra digital adalah barisan bilangan
potongan
nyata
dengan beberapa butir yang dipasang
maupun
kompleks
yang
diwakili oleh bit tertentu. Dalam perwujudannya, citra
merupakan beberapa
potonganjenis
kayu
secara bersama-sama seperti sebuah mosaik atau puzzle. Tujuan dasar
dibagi menjadi dua yaitu still images
penggunaan
kayu
(citra diam) dan moving images (citra
melapisi lantai agar terlihat lebih
bergerak). Citra diam adalah citra
indah.
tunggal yang tidak bergerak. Citra
mempunyai struktur yang lengkap,
bergerak adalah rangkaian citra diam
struktur tersebut sulit dideskripsikan
yang ditampilkan secara berurutan
dengan formula matematika.
Tekstur
parket
kayu
adalah
parket
sehingga memberi kesan pada mata
Parket berasal dari istilah
kita sebagai gambar yang bergerak.
berbahasa asing, yaitu parquette.
Setiap citra di dalam rangkaian itu
Parquette
disebut frame. Gambar-gambar yang
potongan-potongan
kayu
untuk
tampak pada film layar lebar atau
dijadikan
lantai.
Parket
televisi pada hakikatnya terdiri atas
merupakan lembaran kayu berbentuk
ratusan sampai ribuan frame.
persegi panjang, papan kecil dengan
berarti
penutup
menyusun
Citra sebagai keluaran suatu
pola tertentu, dengan pori-pori sangat
sistem perekaman data dapat bersifat
kecil, lebih dari kayu olahan. Ada
4
beberapa macam tipe parket yaitu :
Dalam industri pengolahan
Solid Wood, Engineering parquet,
kayu,
Laminate parquet
susunan tekstur dan warna dari kayu.
Pada bidang perhutanan dan perkayuan
Indonesia,
sangat
tergantung
dengan
Hal ini nilai ekstetika susunan tekstur
kayu
yang serupa dalam produk parket
digolongkan atas dua kelompok kayu
kayu akan lebih indah. Hal ini
besar yaitu : Kayu daun jarum
menjadikan suatu produk mempuyai
(softwood),
nilai kualitas yang tinggi yang
Kayu
daun
lebar
(hardwood),
merupakan
Untuk lantai kayu parket
tujuan
utama
setiap
perindustrian kayu.
akan lebih baik menggunakan kayu jenis
solid,
karena
kayu
solid
Dalam
sistem
tersebut tahan dari serangan rayap
kayu,
selain memiliki tekstur yang bagus.
pengaturan beberapa jenis kayu yang
Selain itu buat susunan kayu yang
berbeda-beda tetapi memiliki sifat
seimbang dengan bidang furniture.
yang serupa ke dalam kelompok-
Kelebihan
menggunakan
dilakukan
klasifikasi
kelompok
dan
suatu
sistem
subkelompok-
lantai kayu parket adalah, sejuk
subkelompok
waktu panas, hangat waktu dingin,
pemakaiannya.
indah dan anggun, nyaman akrab,
memberikan suatu bahasan yang
tidak masuk angin kalau ditiduri,
mudah untuk menjelaskan secara
hygienic dan non allergy, tidak
singkat sifat-sifat umum kayu yang
membongkar dan merusak lantai
sangat bervariasi tanpa penjelasan
awal. Kondisi lapisan tidak sampai
yang terperinci. Di dalam sistem
mengelupas, tahan noda dan tahan
pengklasifikasian fitur kayu parquet
gores
tersebut,
(ada
lapisan
corundum
berdasarkan Sistem
klasifikasi
digunakanlah
berbagai
crystal), tidak berobah warna, tahan
macam metode analisis fitur. Dan
api rokok (ada lapisan corundum
salah satu metode analisis fitur kayu
crystal), tahan air dan waterproof
parquet
(lapisan atas laminate).
metode Support Vector Machines (SVM).
yang
digunakan
adalah
5
model, yang lain untuk pengujian model.
Klasifikasi Klasifikasi bertujuan untuk memprediksi
target
kelas
untuk
Sebuah diuji
model
dengan
klasifikasi
menerapkan
untuk
setiap kasus dalam data. Sebuah
menguji data dengan nilai target
tugas klasifikasi dimulai dengan satu
dikenal dan membandingkan nilai
set data di mana kelas dikenal. Jenis
prediksi dengan nilai-nilai diketahui.
paling
masalah
Data uji harus sesuai dengan data
klasifikasi adalah klasifikasi biner.
yang digunakan untuk membangun
Dalam klasifikasi biner, atribut target
model
hanya memiliki dua nilai yang
dengan cara yang sama. Biasanya
mungkin. Target multiclass memiliki
data train dan data test berasal dari
lebih dari dua nilai.
set data yang sama asalnya. Matrik
sederhana
dari
Dalam proses membangun model
(pelatihan),
klasifikasi
menemukan
tes
dan
harus
digunakan
algoritma
seberapa
hubungan
memprediksi
dipersiapkan
untuk
akurat
menilai
model
nilai-nilai
dan yang
antara nilai-nilai prediksi dan nilai
diketahui. Hasil model klasifikasi
target. Algoritma klasifikasi yang
berupa kelas dan probabilitas untuk
berbeda menggunakan teknik yang
setiap data.
berbeda
untuk
menemukan
Support
Vector
Machine
hubungan. Hubungan ini diringkas
(SVM) adalah sistem pembelajaran yang
dalam model, yang kemudian dapat
menggunakan ruang hipotesis berupa
diterapkan pada data yang berbeda
fungsi-fungsi linier dalam sebuah ruang
ditetapkan di mana kelas tidak
fitur (feature space) berdimensi tinggi,
diketahui. Klasifikasi model diuji
dilatih dengan algoritma pembelajaran yang
dengan membandingkan nilai-nilai
didasarkan pada teori optimasi dengan
diprediksi nilai target dikenal dalam
mengimplementasikan learning
satu
untuk
yang berasal dari teori pembelajaran statistik
klasifikasi biasanya dibagi menjadi
[1]. Teori yang mendasari SVM sendiri
dua set data: satu untuk membangun
sudah berkembang sejak 1960-an, tetapi
set
data
uji.
Data
bias
baru diperkenalkan oleh Vapnik, Boser dan
6
Guyon pada tahun 1992 dan sejak itu SVM
tidak perlu dilakukan perhitungan ulang
berkembang dengan pesat. SVM adalah
nilai
salah satu teknik yang relatif baru
digunakan disimpan di memori sehingga
dibandingkan dengan teknik lain, tetapi
waktu komputasi yang dibutuhkan menjadi
memiliki performansi yang lebih baik di
jauh lebih singkat. Strategi ini disebut
berbagai
dengan caching.
bidang
bioinformatics,
aplikasi
seperti
pengenalan
tulisan
maka nilai
Akurasi
model
yang baru
yang
akan
tangan, klasifikasi teks dan lain sebagainya
dihasikan dari proses pelatihan dengan
[2].
SVM sangat bergantung pada fungsi kernel Strategi
lainnya
untuk
serta parameter yang digunakan. Oleh
mempercepat algoritma decomposition
karena itu performansinya dapat dioptimasi
adalah shrinking dan caching yang
dengan mencari (mengestimasi) parameter
pertama kali diperkenalkan oleh Joachim.
terbaik. Ada beberapa cara yang dapat
Shrinking merupakan strategi heuristik
dilakukan antara lain cross validation
yang memperkecil permasalahan pencarian
(mudah
solusi untuk persoalan optimasi di atas
out (akurat tetapi membutuhkan biaya
dengan
komputasi yang tinggi), dan
mengabaikan
beberapa
digunakan),
leave-one-
-estimator
bounded support vector (α = C). Hal
[9]. Cara yang ketiga merupakan modifikasi
ini dapat dilakukan karena umumnya nilai
cara kedua yang diusulkan oleh Joachim
vector setelah
[9]. K-folds cross-validation dapat
bounded
support
beberapa iterasi dapat diidentifikasi dan
digunakan
bernilai tetap sampai akhir iterasi [8]. Akan
parameter C dan parameter kernel yang
tetapi, apabila solusi permasalahan dengan
tidak overfit data pelatihan [5]. Dengan
menerapkan shrinking bukan solusi optimal
metode ini, data yang diambil secara acak
untuk (2.26) maka optimasi dilanjutkan
kemudian dibagi menjadi k buah partisi
dengan
keseluruhan
dengan ukuran yang sama. Selanjutnya,
variabel. Seperti yang dilihat di atas
dilakukan iterasi sebanyak k. Pada setiap
algoritma decomposition melakukan
iterasi digunakan sebuah partisi sebagai data
iterasi sampai solusi persamaan (2.22)
pengujian, sedangkan k-1 partisi sisanya
ditemukan. Dalam setiap iterasi nilai
digunakan sebagai data pelatihan. Jadi akan
digunakan. Agar
dicoba berbagai nilai parameter dan
menggunakan
elemen matriks
untuk
menentukan
nilai
7
parameter terbaik ditentukan melalui k-
menurun
jika
diterapkan
pada
folds cross-validation.
imbalanced dataset yaitu data dari kelas dataset adalah
minoritas terletak jauh dari bidang pemisah
dataset yang memiliki contoh kelas negatif
yang ideal, kelemahan pada soft-margin
(kelas mayoritas) jauh lebih banyak
hyperplane (jika nilai parameter C kecil
daripada contoh kelas positif (kelas
maka SVM cenderung mengklasifikasikan
minoritas)
pada
data sebagai kelas mayoritas), dan rasio
rasio
support vector yang tidak seimbang [10].
imbalance dapat mencapai 100 : 1 dan
Pendekatan yang populer untuk mengatasi
bahkan bisa mencapai 100000 : 1 pada
masalah ini adalah memberikan bias
aplikasi lain. Banyak teknik klasifikasi yang
kepada teknik klasifikasi sehingga lebih
akurasinya menurun ketika diterapkan pada
memperhatikan
dataset dengan imbalance ratio yang
minoritas. Hal ini dapat dilakukan melalui
tinggi karena umumnya teknik tersebut
pemberian pinalti yang lebih besar jika
didesain untuk
mengeneralisasi data
terjadi kesalahan dalam mengklasifikasikan
pelatihan dan menghasilkan hipotesis paling
kelas minoritas, dibandingkan jika salah
sederhana yang sesuai dengan data tersebut
mengklasifikasikan kelas mayoritas.
Imbalanced
misalnya
aplikasi fraud detection
instance
dari
[10]. Akan tetapi, hipotesis yang dihasilkan
Pada
sering kali memprediksi hamper semua
menggunakan
instance sebagai kelas yang menjadi
mekanisme untuk mengetahui atribut yang
mayoritas dalam data pelatihan. Selain itu
penting atau yang kurang penting. Atribut
data dari kelas minoritas mungkin dianggap
yang
noise sehingga mungkin saja diabaikan
tidak mempengaruhi
oleh teknik klasifikasi [10].
klasifikasi. Oleh karena itu, jika atribut yang
SVM sendiri merupakan salah satu teknik yang tidak terlalu sensitif terhadap
pelatihan
kelas
SVM
kurang
dengan
tidak
penting
terdapat
umumnya
efektifitas
teknik
kurang penting ini dibuang maka efisiensi teknik
klasifikasi
akan
meningkat.
dataset karena hipotesis
Efektifitas teknik klasifikasi juga dapat
yang dihasilkan hanya dipengaruhi oleh
meningkat jika atribut yang kurang penting
sebagian data yaitu data yang menjadi
ini ternyata menjadi noise. Pada SVM
support vector. Ada beberapa alasan
salah satu cara yang sederhana untuk
mengapa performansi SVM mungkin
mengetahui atribut yang penting adalah
imbalanced
8
seperti yang dilakukan pada [12]. Pemilihan
masing-masing citra yang berbeda.
atribut
dengan
Di mana panjangnya 195 x 1976.
mengevaluasi efektifitas dan efisiensi teknik
Citra ini menghasilkan fitur GLDM,
klasifikasi setelah sebuah fitur dihilangkan.
fitur PERCENTILE, dan fitur LBP.
Dari hasil pengujian setelah fitur ini
Setelah
dihilangkan dapat diketahui sebuah fitur
dilakukan
penting atau tidak dari perbedaan efisiensi
Klasifikasi SVM ini menghasilkan
dan efektifitas.
model pelatihan sebanyak 15 citra
penting
dilakukan
menghasilkan
fitur,
klasifikasi
SVM.
Pada SVM hanya support vector
dari masing-masing kelas dan model
(data yang berada di perbatasan antar kelas)
pengujian sebanyak 5 buah dari
yang mempengaruhi fungsi keputusan hasil
masing-masing kelas.
pelatihan.
Karakteristik
dapat
Awalnya dilakukan analisis
menyelesaikan masalah utama SVM yang
tekstur GLDM yang menghasilkan
menjadi lambat ketika dilatih dengan
nilai
menggunakan data dalam jumlah yang
didapatkan dari Contrast, Angular
sangat besar. Dengan demikian, kita dapat
Second Moment (ASM), Entropy,
memilih kandidat support vector sebelum
Inverse Difference Moment (IDM)
pelatihan, sehingga mengurangi jumlah
dan Mean. Nilai dari fitur-fitur ini
data
akhirnya
berdasarkan dari sudut yang diambil
penggunaan
yaitu sudut 0˚, sudut 45˚, sudut 90˚
pelatihan
mengurangi
dan
ini,
pada
kebutuhan
fitur.
Fitur
GLDM
ini
memori [14].
dan sudut 135˚. Fitur GLDM ini
METODE PENELITIAN
membagi image dalam proses block
Penelitian
ini
adalah
dengan ukuran 8 x 8, kemudian
mengklasifikasi jenis parket kayu jati
setiap sub-image akan dianalisis
berdasarkan citra. Citra ini dibagi
menggunakan
menjadi 3 kelas. Jumlah masing-
GLDM yang telah dihasilkan dari
masing citra dari 3 kelas ini adalah
Arum Agesti Aprilia [22]. Pada
20 image. Jadi jumlah seluruh citra
bagian ini menampilkan nilai fitur
adalah 60 buah. Ukuran citra yang
tekstural GLDM. Namun, karena
digunakan dijadikan sama dengan
hasil regionisasi dari data citra terlalu
melihat ukuran yang terkecil dari
banyak, maka pada bagian ini hanya
metode
statistikal
9
menampilkan sebagian contoh nilai
Pattern yang dianalisis oleh Nanda
fitur GLDM.
Pramitha
[23].
Data-data
yang
diambil akan dijadikan nilai features yang telah ditentukan nilainya. Nilai
Data Masukan PERCENTILE Dalam warna,
metode
percentile
menganalisanya
features berdasarkan dari jumlah
pada
neighbor (nilai tetangga) 8, 16 dan
30,
24 yang masing-masing nilai akan
percentile 50, percentile 70, dan
diambil 10 features dari setiap data.
percentile 90 untuk masing-masing
Nilai features dari setiap data akan
warna dari RGB (Red Green Blue).
terbagi menjadi dua yaitu data
Nilai dari masing-masing percentile
training sebanyak 15 data dan data
menghasilkan pixel. Sama seperti
testing sebanyak 5 data.
10,
percentile
metode
percentile
statistikal
pada
Features setiap data akan
metode color percentile sebelum
dijadikan matriks. Matriks tersebut
proses analisis tiap image dibagi
disesuaikan
menjadi 8 x 8 sub-image.
masing-masing
Data
GLDM,
masukan
dengan
nilai
LBP.
dari
Matriks
ini
tersebut akan dkelompokkan menjadi
menganalisa jenis kayu jati parket
matriks data training dan matriks
dalam bentuk citra RGB. Pada
data testing. Setiap data dari image
bagian
nilai
akan dijadikan satu matriks dengan
hasil
panjang baris yang sama untuk setiap
ini
percentile.
menampilkan Namun,
karena
regionisasi dari data citra terlalu
nilai features LBP.
banyak, maka pada bagian ini hanya
Data inputan akan diolah
menampilkan sebagian contoh nilai
dengan menggunakan metode Local
fitur percentile.
Binary Pattern berdasarkan dari neighbor 8, 16, dan 24. Nilai
Data Masukan LBP Data yang digunakan adalah data kayu parket yang terlebih dahulu dilakukan ekstraksi warna dengan menggunakan Local Binary
neightbour ini menentukan hasil features dari setiap data yang akan diinputkan. Pada
bagian
ini
menampilkan nilai fitur tekstural
10
LBP
8.
Namun,
karena
hasil
Windows
•
XP
regionisasi dari data citra terlalu
Professional
banyak, maka pada bagian ini hanya
sistem operasi.
menampilkan sebagian contoh nilai
sebagai
Matlab 2008a sebagai
•
fitur LBP 8.
perangkat
lunak
pengolahan citra. Spesifikasi Hardware dan Software yang digunakan Spesifikasi software
yang
Model Pelatihan hardware digunakan
dan Fitur
pada
pengembangan aplikasi klasifikasi
ditraining
dahulu dengan menggunakan fungsi Saat
genpred.
SVM ini :
menggunakan
1. Hardware Spesifikasi hardware yang digunakan untuk membuat program ini adalah sebagai
terlebih
pelatihan
waktu
untuk
memproses training. Image yang digunakan saat train sebanyak 15 buah dari masing-masing kelas pada metode analisisnya. Dalam proses
berikut :
training ini membutuhkan counter •
Prosesor
Intel
Pentium 1.86 GHz.
atau
jumlah
kelas
untuk
mengklasifikasikan parket kayu jati, label yang menandakan parket kayu
•
Memori 120 GB.
•
Harddisk 1 Gb.
•
Laptop 14”.
•
Mouse dan Keyboard.
jati tersebut termaksud dalam kelas berapa
nantinya.
Tools
yang
digunakan adalah PRTOOLS untuk klasifikasi.
Pada
saat mengtrain
menghasilkan dataset yang didapat 2. Software Spesifikasi
dari software
yang
digunakan untuk membuat program ini adalah sebagai berikut :
memasukkan
jumlah
keseluruhan data dari semua kelas (label), banyaknya data dari masingmasing kelas (counter), prior, dan nilai fitur
dari
metode
analisis
11
tersebut.
Saat
mengklasifikasikan
Classifier
menggunakan klasifikasi nuSVM. Hasilnya
dapat
dilihat
dengan
yang
Classifier adalah
Nu_SVC.
digunakan
Classifier
ini
melihat nilai Ws dari hasil train
berfungsi untuk mengklasifikasi fitur
datasetnya
GLDM, PERCENTILE, dan LBP.
Model Pengujian
Classifier menentukan pencocokan
Setelah fitur ditraining maka ditesting fungsi
dengan evalpred.
menggunakan memproses
menggunakan Saat
pengujian
waktu
testing.
Image
untuk yang
kelas dari masing-masing fitur yang sesuai. Dilihat dari masing-masing fitur
maka classifier kurang dapat
mengklasifikasi
fitur
yang
ada.
Classifier dibentuk dari PRTools.
digunakan saat test sebanyak 5 buah dari
masing-masing
kelas
pada
metode analisisnya. Dalam proses
PRTools PRTools
adalah
testing ini membutuhkan counter
toolbox
atau
untuk
mengklasifikasi suatu data. Di mana
mengklasifikasikan parket kayu jati,
di dalamnya terdapat mendefinisikan
label yang menandakan parket kayu
kelas dan objek. Di dalam kelas
jati tersebut termaksud dalam kelas
PRTools
berapa
yang
dataset. Struktur data pusat PRTools
digunakan adalah PRTOOLS untuk
adalah dataset. Ini terutama terdiri
klasifikasi. Pada saat mengtest akan
dari satu set objek direpresentasikan
melakukan pengujian terhadap 15
oleh matriks vektor fitur. Elemen-
gambar
Saat
elemen matriksnya adalah satu set
menggunakan
label untuk setiap objek dan satu set
klasifikasi nuSVM. Hasilnya dapat
fitur, juga disebut label fitur. Label
dilihat dengan melihat nilai Labels
bernilai integer. Selain itu, satu set
dari hasil test yang memiliki nilai
probabilitas untuk masing-masing
confidence terbaik untuk menyatakan
kelas, disimpan. Umumnya dataset
kelas mana inmage tersebut
itu dinyatakan dengan A dan bisa
jumlah
kelas
nantinya.
dari
5
mengklasifikasikan
Tools
gambar..
matlab
sebuah
akan
untuk
mengidentifikasi
menangani multi-kelas set objek. Hal
12
untuk
PERCENTILE, dan fitur LBP yang
mendefinisikan lebih dari satu set
gambarnya tidak digunakan pada
label dalam dataset. Misalnya, saat
tahap training :
ini
dimungkinkan
obyek yang piksel dalam gambar,
maka mungkin diberi label sesuai
segmen citra, tetapi juga untuk
Analisa SVM Pada GLDM Ini dilihat dari berapa banyak
gambar yang digunakan. Struktur
data
gambar yang cocok sesuai dengan
transformasi, pengklasifikasi, hasil
penempatan kelas. Maka dari itu
ekstraksi fitur, data definisi skala,
total persen error rate GLDM adalah
proyeksi nonlinier, dan sebagainya.
73 % error rate. Terlalu besar
Biasanya dinyatakan dengan W.
kesalahan yang di peroleh. Jadi,
data
kelas
menyimpan
GLDM
kurang
cocok
untuk
diklasifikasikan menggunakan SVM.
ANALISA HASIL Analisa hasil klasifikasi SVM
Dikarenakan
data
yang
didapat
ini didapatkan dari train dan test.
masih sedikit, nilai fitur terlalu besar,
Fitur yang ditraining didapatkan dari
dan SVM belum bisa mengenali pola
fitur
sesuai
yang
gambarnya
tidak
dengan
dimasukkan pada tahap training dan
confidence
fitur yang gambarnya dimasukkan
semuanya 1.
kelasnya.
value-nya
Nilai hampir
pada tahap training. Fitur yang gambarnya dimasukkan pada tahap training
dilakukan
Analisa SVM Pada PERCENTILE
percobaan
Pada tabel 4.2 disimpulkan
sebanyak 5 kali. Bentuk dari analisa
bahwa
hasil
berupa
memiliki total error rate 100 %.
persentasi tingkat akurat prediksi
Dikarenakan setiap gambar tidak ada
kelas mana yang cocok dari masing-
yang cocok sesuai dengan kelasnya.
masing
Maka dari itu PERCENTILE sangat
klasifikasi
image.
SVM
Maka
dari
itu
klasifikasi
didapatkan hasil klasifikasi SVM
tidak
yang terbaik. Berikut analisa hasil
menggunakan SVM karena nilai fitur
dari
yang disediakan adalah nilai pixel
fitur
GLDM,
fitur
cocok
PERCENTILE
diklasifikasikan
13
serta pengelompokan kelasnya tidak
data train-nya yang sedikit. Vector
ada yang cocok. Nilai confidence
Machines kurang dapat identifikasi
value hampir semuanya 0,99.
perbedaan setiap kelas. Jadi total error rate adalah 33,33 %. Nilai confidence value-nya adalah 1 tiap
Analisa SVM Pada LBP 8 Pada tabel 4.3 di bawah ini
image.
setiap gambar masuk ke kelas 2 semuanya.
Kecocokannya
hanya
dimiliki pada gambar 6 sampai
Analisa SVM Pada GLDM dan PERCENTILE
gambar 10 yang tidak memiliki error
Pada tabel 4.5 di bawah ini
rate. Gambar lainnya memiliki error
setiap gambar masuk ke kelas 2
rate 100 %. Jadi total error rate
semuanya.
adalah 33,33 %. Maka dari ini LBP 8
dimiliki pada gambar 6 sampai
tidak cocok pada klasifikasi SVM,
gambar 10 yang tidak memiliki error
dikarenakan terlalu banyak fitur.
rate. Gambar lainnya memiliki error
Nilai confidence value-nya adalah
rate 100 %. Jadi total error rate
0,99 tiap image.
adalah 33,33 %. Nilai confidence
Kecocokannya
hanya
value-nya adalah 0,97. Maka
Analisa SVM Pada LBP 16, LBP
dari
ini
gabungan
24, LBP 8 + LBP 16, LBP 8 + LBP
GLDM dan PERCENTILE tidak
24, LBP 16 + LBP 24, LBP 8 +
cocok
LBP 16 + LBP 24
dikarenakan terlalu banyak fitur.
Pada tabel 4.4 di bawah ini
pada
klasifikasi
SVM,
Jumlah data untuk training sedikit.
setiap gambar masuk ke kelas 3
Vector
semuanya.
identifikasi perbedaan setiap kelas.
Kecocokannya
hanya
Machines
kurang
dapat
dimiliki pada gambar 11 sampai gambar 15 yang tidak memiliki error
Analisa SVM Pada GLDM + LBP
rate. Gambar lainnya memiliki error
8, GLDM + LBP 16, GLDM + LBP
rate 100 %. Maka dari ini LBP tidak
24, GLDM + (LBP 8 + LBP 16),
cocok
SVM,
GLDM + (LBP 8 + LBP 24),
dikarenakan terlalu banyak fitur dan
GLDM + (LBP 16 + LBP 24),
pada
klasifikasi
14
GLDM + (LBP 8 + LBP 16 + LBP
gambar 15 yang tidak memiliki error
24)
rate. Gambar lainnya memiliki error Pada tabel 4.6 di bawah ini
rate 100 %. Jadi total error rate
setiap gambar masuk ke kelas 2
adalah 33,33 %. Nilai confidence
semuanya.
hanya
value-nya adalah 0,99. Maka dari ini
dimiliki pada gambar 6 sampai
gabungan PERCENTILE dan LBP
gambar 10 yang tidak memiliki error
tidak cocok pada klasifikasi SVM,
rate. Gambar lainnya memiliki error
dikarenakan terlalu banyak fitur.
rate 100 %. Jadi total error rate
Jumlah data untuk training sedikit.
adalah 33,33 %. Nilai confidence
Vector
value-nya adalah 0,98.
identifikasi perbedaan setiap kelas.
Maka
Kecocokannya
dari
ini
Machines
kurang
dapat
gabungan
GLDM dan LBP tidak cocok pada
Analisa SVM Pada PERCENTILE
klasifikasi SVM, dikarenakan terlalu
Pada tabel 4.9 disimpulkan
banyak fitur. Jumlah data untuk
bahwa
klasifikasi
PERCENTILE
training sedikit. Vector Machines
memiliki total error rate 100 %.
kurang dapat identifikasi perbedaan
Dikarenakan setiap gambar tidak ada
setiap kelas.
yang cocok sesuai dengan kelasnya. Maka dari itu PERCENTILE sangat
Analisa SVM Pada PERCENTILE
tidak
+ LBP 8, PERCENTILE + LBP 16,
menggunakan SVM karena nilai fitur
PERCENTILE
24,
yang disediakan adalah nilai pixel.
PERCENTILE + (LBP 8 + LBP
Nilai confidence value-nya hampir
16), PERCENTILE + (LBP 8 +
semuanya 0,99.
+
LBP
cocok
diklasifikasikan
LBP 24), PERCENTILE + (LBP 16 + LBP 24), PERCENTILE +
Analisa SVM Pada GLDM dan
(LBP 8 + LBP 16 + LBP 24)
PERCENTILE
Pada tabel 4.7 di bawah ini setiap gambar masuk ke kelas 3 semuanya.
Kecocokannya
hanya
dimiliki pada gambar 11 sampai
Error rate (e) pada GLDM dan PERCENTILE adalah
15
(untuk class 1) Analisa SVM Pada LBP 8, LBP 16, LBP 24, LBP 8 + LBP 16, LBP 8 + LBP 24, LBP 16 + LBP 24, LBP 8 (untuk class 2)
+ LBP 16 + LBP 24 Pada tabel 4.11 di bawah ini setiap gambar masuk ke kelas 2 semuanya.
(untuk class 3)
Kecocokannya
hanya
dimiliki pada gambar 6 sampai gambar 10 yang tidak memiliki error
Ini dilihat dari berapa banyak
rate. Gambar lainnya memiliki error
gambar yang cocok sesuai dengan
rate 100 %. Maka dari ini LBP tidak
penempatan kelas. Maka dari itu
cocok
total persen error rate GLDM dan
dikarenakan terlalu banyak fitur dan
PERCENTILE adalah 67 % error
data train-nya yang sedikit. Vector
rate. Terlalu besar kesalahan yang di
Machines kurang dapat identifikasi
peroleh. Jadi, GLDM kurang cocok
perbedaan setiap kelas. Jadi total
untuk diklasifikasikan menggunakan
error rate adalah 33,33 %. Nilai
SVM.
confidence value-nya adalah 1 tiap
Dikarenakan
data
yang
didapat masih sedikit, nilai fitur
pada
klasifikasi
SVM,
image.
terlalu besar, dan SVM belum bisa mengenali
pola
dengan
Analisa SVM Pada GLDM + LBP
kelasnya. Nilai confidence value-nya
8, GLDM + LBP 16, GLDM + LBP
berkisar dari 0,89 - 0,99.
24, GLDM + (LBP 8 + LBP 16),
Maka
gabungan
GLDM + (LBP 8 + LBP 24),
GLDM dan PERCENTILE tidak
GLDM + (LBP 16 + LBP 24),
cocok
GLDM + (LBP 8 + LBP 16 + LBP
pada
dari
sesuai
ini
klasifikasi
SVM,
dikarenakan terlalu banyak fitur. Jumlah data untuk training sedikit. Vector
Machines
kurang
dapat
identifikasi perbedaan setiap kelas.
24) Pada tabel 4.12 di bawah ini setiap gambar masuk ke kelas 3 semuanya.
Kecocokannya
hanya
16
dimiliki pada gambar 11 sampai
gabungan PERCENTILE dan LBP
gambar 15 yang tidak memiliki error
tidak cocok pada klasifikasi SVM,
rate. Gambar lainnya memiliki error
dikarenakan terlalu banyak fitur.
rate 100 %. Jadi total error rate
Jumlah data untuk training sedikit.
adalah 33,33 %. Nilai confidence
Vector
value-nya adalah 0,98.
identifikasi perbedaan setiap kelas.
Maka
dari
ini
Machines
kurang
dapat
gabungan
GLDM dan LBP tidak cocok pada
Perbandingan Analisa hasil SVM
klasifikasi SVM, dikarenakan terlalu
yang Imagenya Digunakan Pada
banyak fitur. Jumlah data untuk
Training
training sedikit. Vector Machines
Pada Training dari Fitur GLDM,
kurang dapat identifikasi perbedaan
Fitur PERCENTILE, dan Fitur
setiap kelas.
LBP
dan Tidak Digunakan
Perbandingan dari masingAnalisa SVM Pada PERCENTILE
masing fitur dilihat dari error rate,
+ LBP 8, PERCENTILE + LBP 16,
testing, dan
PERCENTILE
Analisa hasil SVM fitur GLDM yang
+
LBP
24,
confusion matriknya.
tidak
digunakan
pada
PERCENTILE + (LBP 8 + LBP
imagenya
16), PERCENTILE + (LBP 8 +
training, nilai confidence value-nya
LBP 24), PERCENTILE + (LBP
sama besar dengan analisa hasil
16 + LBP 24), PERCENTILE +
SVM
(LBP 8 + LBP 16 + LBP 24)
digunakan pada training. Di mana
fitur
GLDM
image-nya
Pada tabel 4.13 di bawah ini
berjumlah 73 %. Analisa hasil SVM
setiap gambar masuk ke kelas 2
fitur PERCENTILE yang image-nya
semuanya.
tidak
Kecocokannya
hanya
digunakan
pada
training
dimiliki pada gambar 6 sampai
confidence value-nya sama besar
gambar 10 yang tidak memiliki error
dengan analisa hasil SVM fitur
rate. Gambar lainnya memiliki error
PERCENTILE image-nya digunakan
rate 100 %. Jadi total error rate
pada training. Di mana persentase-
adalah 33,33 %. Nilai confidence
nya adalah 100 %. Analisa hasil
value-nya adalah 0,99. Maka dari ini
SVM
fitur
GLDM
dan
17
PERCENTILE yang image-nya tidak
Analisa Umum SVM Pada Fitur
digunakan
GLDM, PERCENTILE, dan LBP
pada
training
nilai
confidence value-nya lebih kecil
Pada fitur GLDM ini SVM
daripada analisa hasil SVM fitur
memiliki nilai fitur yang terlalu
GLDM dan PERCENTILE image-
besar, dan jumlah fiturnya terlalu
nya digunakan pada training. Di
banyak maka dari itu dapat dilihat
mana persentase fitur GLDM dan
dari error rate yang cukup besar
PERCENTILE yang image-nya tidak
persentase-nya yaitu 73 %. Pada
digunakan
adalah
fitur percentile memiliki nilai fitur
33,33 % sedangkan fitur GLDM dan
yang besar dan merupakan nilai pixel
PERCENTILE image-nya digunakan
dari
pada training adalah 67 %. Pada fitur
percentile. Error rate percentile
LBP
sangat besar yaitu 100 %. Pada fitur
pada
training
nilai persentase-nya sama
masing
masing-masing
semua yaitu 33,33 % yang dimana
LBP
memiliki kecocokan kelas
memiliki klasifikasi kelas yang sama
hampir sama semuanya. Terlihat dari
semua dari masing-masing image.
nilai fitur LBP yang hampir sama
Dikarenakan nilainya hampir sama
dari
semua dan jumlah data yang terlalu
memiliki error rate yang sama pula.
banyak.
Pengujian ini dilakukan berulang-
masing-masing
citra.
Jadi
ulang sebanyak 5 kali. Metode One Against One Pada metode One Against
Kesimpulan Skripsi
ini
menghasilkan
untuk
menentukan
One ini terlihat pada masing-masing
program
fitur yang dimana klasifikasi setiap
klasifikasi SVM pada fitur GLDM,
kelas tidak cocok semuanya karena
PERCENTILE, dan LBP. Proses
dimensi nilainya terlalu besar dan
klasifikasi SVM dapat dilihat dari
fitur yang terlalu banyak. Nilai
error rate dari masing-masing fitur.
fiturnya hampir sama sulit untuk
Error rate yang terbaik adalah fitur
membedakan perbedaan klasifikasi.
GLDM dan PERCENTILE yang imagenya digunakan pada training yaitu 40 % untuk kelas 1, 80 % untuk
18
kelas 2, dan 80 % untuk kelas 3. Besarnya
nilai
error
rate
ini
Akbani, Rehan et. Al. 2004. Applying Support Vector Machine to
disebabkan oleh jumlah fitur yang
Imbalanced Datasets,
2004.
terlalu banyak dan jumlah training
Proceedings of ECML-04.
image yang terlalu sedikit sehingga
Alfiani, Diah. Sistem Pengenalan
classifier sulit untuk memberikan
Parket Kayu Menggunakan
confidence
value
yang
cukup
Sub Region, Draft Disertasi
signifikan.
Program Doktor Teknologi
Saran
Informasi Klasifikasi SVM ini dapat
ditingkatkan
dengan
melakukan
Universitas
Gunadarma, 2010. Arief, Muhammad R. H. Klasifikasi
penambahan data yang digunakan
Parket
untuk training dan mereduksi jumlah
berdasarkan Analisa Tekstur
fitur yang digunakan. Selain itu,
GLDM
kombinasi
dari
fitur
yang
Backpropagation, Universitas
memberikan
hasil
terbaik
yaitu
Gunadarma, 2010.
GLDM dan PERCENTILE dapat digunakan metode
sebagai
rekomendasi
ekstraksi
fitur
untuk
penelitian lain yang sejenis.
Kayu
Jati
dengan
Metode
Bernhard Schờlkopf. A Tutorial on nu-Support Vector Machines, Max
Planck
Institute
for
Biological
Cybernetics,
Từbingen,
Germany
bernhard.schoelkopf@tuebin
DAFTAR PUSTAKA
gen.mpg.de Analisis
Burges, Christopher. A Tutorial On
Tekstur Parket Kayu Jati
Support Vector Machines for
Berdasarkan Penggabungan
Pattern Recognition,
Fitur
Mining
Agesti,
Arum
Aprilia.
Ekstraksi
Statistikal Metode
GLDM Color
Universitas 2011.
Metode dan
and
Data
Knowledge
Discovery, 2(2):955-974. 1998.
Percentile,
Chang, Chih-Chung, Chih-Jen Lin. LIB
Gunadarma,
SVM : A Library for Support Vector Machines, 2001.
19
Chen,
Yi-Wei
dan
Chih-jen
Lin.
Combining SVM with Various Features Selection Strategies,
Kobe University. 2006. Lin, Chih-Jen. 2005. Optimization,
2003. Department of Computer
Support
Science,
and
National
Taiwan
Christianini, Nello. Support Vector and Kernel
Vector
Machines,
Mahine
Learning,
http://www.csie.ntu.edu.tw/%
University.
ICML
Machines,
7Ecjlin/papers/rome.pdf.
Diakses tanggal 10 Januari2007.
Muhammad, Nicky Zahab. Analisis
tutorial, 2001. Christianini, Nello dan John S. Taylor. An Introduction
to
Support
Tekstur Parket Kayu Jati Dengan
Menggunakan
Vector Machinesand Other
Metode Statistikal Gray Level
Kernel-based
Difference
Learning
Methods, Cambridge University
Universitas
Press, 2000.
2009.
Hsu, Chih-Wei et al. A Practical Guide
Method, Gunadarma,
Mukkamala, S. et al. Feature Selection
Vector
for Intrusion Detection using
Classification. Department of
Neural Networks and Support
Computer
Vector Machines, 2003.
to
Support
Science
and
Information Engineering, National
Osuna, Edgar E. et. al.1997. Support Vector machines: Training
Taiwan University. 2004. Hsu,
School of Science and technology,
A
and Applications, MIT, 1997.
Comparison of Methods for
Pai-Hsuen Chen, Chih-Jen Lin. A
Chih-Wei,
Chih-Jen
Multi-class
Lin.
Support Vector
Tutorial
on
nu-Support
Machines, IEEE Transactions on
Vector Machines, Department
Neural
of Computer Science and
Networks,
13(2):415-
Information
425.2002. Katagiri,
Shinya
dan
Incremental Support
Shigeo Training
Abe. of
Vector Machines
Using Hyperspheres, Graduate
Engineering
National Taiwan University Taipei 106, Taiwan. Pramitha,
Nanda.
Parket
Analisa Kayu
Fitur Jati
20
Berdasarkan
Warna
dan
Engineering,
Science
and
Tekstur
Menggunakan
Mathematics
School
of
Metode Local Binary Pattern,
Electronics
Universitas
Science,
Gunadarma,
2011.
and
Computer
University
of
Southampton. 10 May 1998.
Prasetiyo. A Comparative Study of
Wu, Shih-Hung (Ph.D), Lin, Chih-
Feature Extraction Methods
Jen’s.
for Wood Texture
Machines and SVM Tool,
Classification. Laboratoire
Dept. of CSIE, CYUT.
Electronique, Informatique et Image (LE2I) UMR CNRS 5158 Le Creusot, France. 2010. Quang, Anh tran et al. Evolving Support
Vector
Machine
Parameters, Slide presentasi ICML. Tsinghua University, 2002. R.P.W. Duin, P. Juszczak, P. Paclik, E. Pekalska, D. de Ridder, D.M.J. Tax, S. Verzakov. PRTools4 A Matlab Toolbox for
Pattern
Recognition,
Version 4.1, August 2007. Schölkopf, Bernhard. Estimating the Support of High-Dimensional Distribution,
Neural
Computation 13, 1443-1471. MIT. 2001. Steve R. Gunn. Support Vector Machines for Classification and Regression, Faculty of
Support
Vector