2 klasifikasi ini adalah GLDM, PERCENTILE, dan LBP. Data dalam penganalisasian terdiri dari 60 data citra kayu jati parket yang akan dianalisa untuk d

JURNAL KLASIFIKASI PARKET KAYU JATI MENGGUNAKAN METODE SUPPORT VECTOR MACHINES (SVM)

Rina Yuliana Siagian. 50407731.

KLASIFIKASI PARKET KAYU JATI MENGGUNAKAN METODE SUPPORT VECTOR MACHINES (SVM) Skripsi, Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Gunadarma, 2011. Kata Kunci : Parket Kayu Jati, Support Vector Machines

(vii + 64 + Lampiran)

Dalam industri kayu sekarang, jati dijadikan keping-keping parket (parquet) penutup lantai. Akibat krisis ekonomi global kegiatan usaha ekspor produk flooring parket yang dibuat dari bahan bau kayu jati mengalami penurunan drastis. Oleh karena itu standar mutu dari produksi kayu jati parket harus terus ditingkatkan. Kebutuhan perusahaan manufaktur yang tinggi untuk menjaga kualitas produk yang lengkap, memerlukan kontrol selama produksi dan pada akhir proses. Selama ini kontrol yang digunakan adalah kontrol manusia yang tidak sepenuhnya dapat diandalkan dan tidak menjamin kualitas dari total kontrol. Hal ini dapat diatasi dengan menggunakan komputer visi sebagai inspeksi visual produk control. Dalam menentukan klasifikasi otomatisasi digunakan klasifikasi Support Vector Machines. Klasifikasi Support Vector Machines jenis kayu jati parket bertujuan mengklasifikasikan parket ke dalam beberapa jenis parket yang berbeda-beda tetapi mempunyai sifat yang serupa ke dalam kelompok-kelompok berdasarkan pemakaiannya. Dalam penelitian parket dianalisa dengan menggunakan metode Support Vector Machines (SVM). Features yang digunakan dalam analisa

1

2

klasifikasi ini adalah GLDM,

PERCENTILE, dan

LBP.

Data

dalam

penganalisasian terdiri dari 60 data citra kayu jati parket yang akan dianalisa untuk dijadikan prediksi klasifikasi ke dalam jenis kayu jati parket 1,2, atau 3. Daftar Pustaka (1997-2010)

untuk klasifikasi ini memerlukan

Latar Belakang Kayu

jati

atau

Tectona

otomatisasi.

Grandis termasuk dalam kelas satu karena

kekuatan,

klasifikasi

dan

memerlukan penentuan variabel yang

keindahannya. Meskipun keras dan

akan digunakan. Pada penelitian ini,

kuat, kayu jati mudah dipotong dan

variabel yang digunakan adalah hasil

dikerjakan, sehingga disukai untuk

dari penelitian parket kayu jati

membuat furniture dan ukir-ukiran.

sebelumnya

Kayu

Aprilia [1] dan Nanda Pramitha [19].

jati

keawetan

Otomatisasi

Indonesia

memiliki

beberapa kelebihan yang mungkin

oleh

Arum

Agesti

Batasan Masalah

tidak dimiliki oleh kayu-kayu jenis

Ruang lingkup yang dibahas

lain baik dari sisi kekuatan ataupun

di dalam penulisan skripsi ini adalah

teksturnya. Dalam industri kayu

bagaimana

sekarang, jati juga diolah keping-

pengklasifikasi

keping parket (parquet) penutup

Machines parket kayu jati ke dalam

lantai. Parket kayu juga memiliki

kelas 1, 2, dan 3.

pola yang bermacam-macam. Pada

Tujuan Penelitian

penulisan

ini pola

parket kayu

Penelitian

menghasilkan Support

ini

Vector

bertujuan

diklasifikasikan menjadi 3 (tiga)

untuk mengklasifikasi parket kayu

macam

jati

pola,

sebagaimana

yang

diungkapkan oleh Diah Alfiani [3],

dengan

Support

Machines.

yaitu pola bergaris, pola melengkung yang menyerupai huruf U dan juga

LANDASAN TEORI

pola yang agak cacat (cacatnya tidak melebihi 20 persen). Pengenalan pola

Pengolahan Citra

Vector

3

Pengolahan citra merupakan

optik berupa foto, bersifat analog

proses pengolahan dan analisis citra

berupa sinyal video seperti gambar

yang banyak melibatkan persepsi

pada monitor televisi, atau bersifat

visual. Proses ini mempunyai ciri

digital yang dapat langsung disimpan

data masukan dan informasi keluaran

pada suatu pita magnetik. Citra yang

yang

Istilah

bersifat analog disebut dengan citra

pengolahan citra digital secara umum

yang kontinu. Sedangkan citra yang

didefinisikan

bersifat digital disebut dengan citra

berbentuk

citra.

sebagai

pemrosesan

citra dua dimensi dengan komputer.

diskrit.

Dalam definisi yang lebih luas, pengolahan

citra

digital

juga

Kayu parket termasuk ke dalam jenis kayu daun lebar. Kayu

mencakup semua data dua dimensi.

parket

Citra digital adalah barisan bilangan

potongan

nyata

dengan beberapa butir yang dipasang

maupun

kompleks

yang

diwakili oleh bit tertentu. Dalam perwujudannya, citra

merupakan beberapa

potonganjenis

kayu

secara bersama-sama seperti sebuah mosaik atau puzzle. Tujuan dasar

dibagi menjadi dua yaitu still images

penggunaan

kayu

(citra diam) dan moving images (citra

melapisi lantai agar terlihat lebih

bergerak). Citra diam adalah citra

indah.

tunggal yang tidak bergerak. Citra

mempunyai struktur yang lengkap,

bergerak adalah rangkaian citra diam

struktur tersebut sulit dideskripsikan

yang ditampilkan secara berurutan

dengan formula matematika.

Tekstur

parket

kayu

adalah

parket

sehingga memberi kesan pada mata

Parket berasal dari istilah

kita sebagai gambar yang bergerak.

berbahasa asing, yaitu parquette.

Setiap citra di dalam rangkaian itu

Parquette

disebut frame. Gambar-gambar yang

potongan-potongan

kayu

untuk

tampak pada film layar lebar atau

dijadikan

lantai.

Parket

televisi pada hakikatnya terdiri atas

merupakan lembaran kayu berbentuk

ratusan sampai ribuan frame.

persegi panjang, papan kecil dengan

berarti

penutup

menyusun

Citra sebagai keluaran suatu

pola tertentu, dengan pori-pori sangat

sistem perekaman data dapat bersifat

kecil, lebih dari kayu olahan. Ada

4

beberapa macam tipe parket yaitu :

Dalam industri pengolahan

Solid Wood, Engineering parquet,

kayu,

Laminate parquet

susunan tekstur dan warna dari kayu.

Pada bidang perhutanan dan perkayuan

Indonesia,

sangat

tergantung

dengan

Hal ini nilai ekstetika susunan tekstur

kayu

yang serupa dalam produk parket

digolongkan atas dua kelompok kayu

kayu akan lebih indah. Hal ini

besar yaitu : Kayu daun jarum

menjadikan suatu produk mempuyai

(softwood),

nilai kualitas yang tinggi yang

Kayu

daun

lebar

(hardwood),

merupakan

Untuk lantai kayu parket

tujuan

utama

setiap

perindustrian kayu.

akan lebih baik menggunakan kayu jenis

solid,

karena

kayu

solid

Dalam

sistem

tersebut tahan dari serangan rayap

kayu,

selain memiliki tekstur yang bagus.

pengaturan beberapa jenis kayu yang

Selain itu buat susunan kayu yang

berbeda-beda tetapi memiliki sifat

seimbang dengan bidang furniture.

yang serupa ke dalam kelompok-

Kelebihan

menggunakan

dilakukan

klasifikasi

kelompok

dan

suatu

sistem

subkelompok-

lantai kayu parket adalah, sejuk

subkelompok

waktu panas, hangat waktu dingin,

pemakaiannya.

indah dan anggun, nyaman akrab,

memberikan suatu bahasan yang

tidak masuk angin kalau ditiduri,

mudah untuk menjelaskan secara

hygienic dan non allergy, tidak

singkat sifat-sifat umum kayu yang

membongkar dan merusak lantai

sangat bervariasi tanpa penjelasan

awal. Kondisi lapisan tidak sampai

yang terperinci. Di dalam sistem

mengelupas, tahan noda dan tahan

pengklasifikasian fitur kayu parquet

gores

tersebut,

(ada

lapisan

corundum

berdasarkan Sistem

klasifikasi

digunakanlah

berbagai

crystal), tidak berobah warna, tahan

macam metode analisis fitur. Dan

api rokok (ada lapisan corundum

salah satu metode analisis fitur kayu

crystal), tahan air dan waterproof

parquet

(lapisan atas laminate).

metode Support Vector Machines (SVM).

yang

digunakan

adalah

5

model, yang lain untuk pengujian model.

Klasifikasi Klasifikasi bertujuan untuk memprediksi

target

kelas

untuk

Sebuah diuji

model

dengan

klasifikasi

menerapkan

untuk

setiap kasus dalam data. Sebuah

menguji data dengan nilai target

tugas klasifikasi dimulai dengan satu

dikenal dan membandingkan nilai

set data di mana kelas dikenal. Jenis

prediksi dengan nilai-nilai diketahui.

paling

masalah

Data uji harus sesuai dengan data

klasifikasi adalah klasifikasi biner.

yang digunakan untuk membangun

Dalam klasifikasi biner, atribut target

model

hanya memiliki dua nilai yang

dengan cara yang sama. Biasanya

mungkin. Target multiclass memiliki

data train dan data test berasal dari

lebih dari dua nilai.

set data yang sama asalnya. Matrik

sederhana

dari

Dalam proses membangun model

(pelatihan),

klasifikasi

menemukan

tes

dan

harus

digunakan

algoritma

seberapa

hubungan

memprediksi

dipersiapkan

untuk

akurat

menilai

model

nilai-nilai

dan yang

antara nilai-nilai prediksi dan nilai

diketahui. Hasil model klasifikasi

target. Algoritma klasifikasi yang

berupa kelas dan probabilitas untuk

berbeda menggunakan teknik yang

setiap data.

berbeda

untuk

menemukan

Support

Vector

Machine

hubungan. Hubungan ini diringkas

(SVM) adalah sistem pembelajaran yang

dalam model, yang kemudian dapat

menggunakan ruang hipotesis berupa

diterapkan pada data yang berbeda

fungsi-fungsi linier dalam sebuah ruang

ditetapkan di mana kelas tidak

fitur (feature space) berdimensi tinggi,

diketahui. Klasifikasi model diuji

dilatih dengan algoritma pembelajaran yang

dengan membandingkan nilai-nilai

didasarkan pada teori optimasi dengan

diprediksi nilai target dikenal dalam

mengimplementasikan learning

satu

untuk

yang berasal dari teori pembelajaran statistik

klasifikasi biasanya dibagi menjadi

[1]. Teori yang mendasari SVM sendiri

dua set data: satu untuk membangun

sudah berkembang sejak 1960-an, tetapi

set

data

uji.

Data

bias

baru diperkenalkan oleh Vapnik, Boser dan

6

Guyon pada tahun 1992 dan sejak itu SVM

tidak perlu dilakukan perhitungan ulang

berkembang dengan pesat. SVM adalah

nilai

salah satu teknik yang relatif baru

digunakan disimpan di memori sehingga

dibandingkan dengan teknik lain, tetapi

waktu komputasi yang dibutuhkan menjadi

memiliki performansi yang lebih baik di

jauh lebih singkat. Strategi ini disebut

berbagai

dengan caching.

bidang

bioinformatics,

aplikasi

seperti

pengenalan

tulisan

maka nilai

Akurasi

model

yang baru

yang

akan

tangan, klasifikasi teks dan lain sebagainya

dihasikan dari proses pelatihan dengan

[2].

SVM sangat bergantung pada fungsi kernel Strategi

lainnya

untuk

serta parameter yang digunakan. Oleh

mempercepat algoritma decomposition

karena itu performansinya dapat dioptimasi

adalah shrinking dan caching yang

dengan mencari (mengestimasi) parameter

pertama kali diperkenalkan oleh Joachim.

terbaik. Ada beberapa cara yang dapat

Shrinking merupakan strategi heuristik

dilakukan antara lain cross validation

yang memperkecil permasalahan pencarian

(mudah

solusi untuk persoalan optimasi di atas

out (akurat tetapi membutuhkan biaya

dengan

komputasi yang tinggi), dan

mengabaikan

beberapa

digunakan),

leave-one-

-estimator

bounded support vector (α = C). Hal

[9]. Cara yang ketiga merupakan modifikasi

ini dapat dilakukan karena umumnya nilai

cara kedua yang diusulkan oleh Joachim

vector setelah

[9]. K-folds cross-validation dapat

bounded

support

beberapa iterasi dapat diidentifikasi dan

digunakan

bernilai tetap sampai akhir iterasi [8]. Akan

parameter C dan parameter kernel yang

tetapi, apabila solusi permasalahan dengan

tidak overfit data pelatihan [5]. Dengan

menerapkan shrinking bukan solusi optimal

metode ini, data yang diambil secara acak

untuk (2.26) maka optimasi dilanjutkan

kemudian dibagi menjadi k buah partisi

dengan

keseluruhan

dengan ukuran yang sama. Selanjutnya,

variabel. Seperti yang dilihat di atas

dilakukan iterasi sebanyak k. Pada setiap

algoritma decomposition melakukan

iterasi digunakan sebuah partisi sebagai data

iterasi sampai solusi persamaan (2.22)

pengujian, sedangkan k-1 partisi sisanya

ditemukan. Dalam setiap iterasi nilai

digunakan sebagai data pelatihan. Jadi akan

digunakan. Agar

dicoba berbagai nilai parameter dan

menggunakan

elemen matriks

untuk

menentukan

nilai

7

parameter terbaik ditentukan melalui k-

menurun

jika

diterapkan

pada

folds cross-validation.

imbalanced dataset yaitu data dari kelas dataset adalah

minoritas terletak jauh dari bidang pemisah

dataset yang memiliki contoh kelas negatif

yang ideal, kelemahan pada soft-margin

(kelas mayoritas) jauh lebih banyak

hyperplane (jika nilai parameter C kecil

daripada contoh kelas positif (kelas

maka SVM cenderung mengklasifikasikan

minoritas)

pada

data sebagai kelas mayoritas), dan rasio

rasio

support vector yang tidak seimbang [10].

imbalance dapat mencapai 100 : 1 dan

Pendekatan yang populer untuk mengatasi

bahkan bisa mencapai 100000 : 1 pada

masalah ini adalah memberikan bias

aplikasi lain. Banyak teknik klasifikasi yang

kepada teknik klasifikasi sehingga lebih

akurasinya menurun ketika diterapkan pada

memperhatikan

dataset dengan imbalance ratio yang

minoritas. Hal ini dapat dilakukan melalui

tinggi karena umumnya teknik tersebut

pemberian pinalti yang lebih besar jika

didesain untuk

mengeneralisasi data

terjadi kesalahan dalam mengklasifikasikan

pelatihan dan menghasilkan hipotesis paling

kelas minoritas, dibandingkan jika salah

sederhana yang sesuai dengan data tersebut

mengklasifikasikan kelas mayoritas.

Imbalanced

misalnya

aplikasi fraud detection

instance

dari

[10]. Akan tetapi, hipotesis yang dihasilkan

Pada

sering kali memprediksi hamper semua

menggunakan

instance sebagai kelas yang menjadi

mekanisme untuk mengetahui atribut yang

mayoritas dalam data pelatihan. Selain itu

penting atau yang kurang penting. Atribut

data dari kelas minoritas mungkin dianggap

yang

noise sehingga mungkin saja diabaikan

tidak mempengaruhi

oleh teknik klasifikasi [10].

klasifikasi. Oleh karena itu, jika atribut yang

SVM sendiri merupakan salah satu teknik yang tidak terlalu sensitif terhadap

pelatihan

kelas

SVM

kurang

dengan

tidak

penting

terdapat

umumnya

efektifitas

teknik

kurang penting ini dibuang maka efisiensi teknik

klasifikasi

akan

meningkat.

dataset karena hipotesis

Efektifitas teknik klasifikasi juga dapat

yang dihasilkan hanya dipengaruhi oleh

meningkat jika atribut yang kurang penting

sebagian data yaitu data yang menjadi

ini ternyata menjadi noise. Pada SVM

support vector. Ada beberapa alasan

salah satu cara yang sederhana untuk

mengapa performansi SVM mungkin

mengetahui atribut yang penting adalah

imbalanced

8

seperti yang dilakukan pada [12]. Pemilihan

masing-masing citra yang berbeda.

atribut

dengan

Di mana panjangnya 195 x 1976.

mengevaluasi efektifitas dan efisiensi teknik

Citra ini menghasilkan fitur GLDM,

klasifikasi setelah sebuah fitur dihilangkan.

fitur PERCENTILE, dan fitur LBP.

Dari hasil pengujian setelah fitur ini

Setelah

dihilangkan dapat diketahui sebuah fitur

dilakukan

penting atau tidak dari perbedaan efisiensi

Klasifikasi SVM ini menghasilkan

dan efektifitas.

model pelatihan sebanyak 15 citra

penting

dilakukan

menghasilkan

fitur,

klasifikasi

SVM.

Pada SVM hanya support vector

dari masing-masing kelas dan model

(data yang berada di perbatasan antar kelas)

pengujian sebanyak 5 buah dari

yang mempengaruhi fungsi keputusan hasil

masing-masing kelas.

pelatihan.

Karakteristik

dapat

Awalnya dilakukan analisis

menyelesaikan masalah utama SVM yang

tekstur GLDM yang menghasilkan

menjadi lambat ketika dilatih dengan

nilai

menggunakan data dalam jumlah yang

didapatkan dari Contrast, Angular

sangat besar. Dengan demikian, kita dapat

Second Moment (ASM), Entropy,

memilih kandidat support vector sebelum

Inverse Difference Moment (IDM)

pelatihan, sehingga mengurangi jumlah

dan Mean. Nilai dari fitur-fitur ini

data

akhirnya

berdasarkan dari sudut yang diambil

penggunaan

yaitu sudut 0˚, sudut 45˚, sudut 90˚

pelatihan

mengurangi

dan

ini,

pada

kebutuhan

fitur.

Fitur

GLDM

ini

memori [14].

dan sudut 135˚. Fitur GLDM ini

METODE PENELITIAN

membagi image dalam proses block

Penelitian

ini

adalah

dengan ukuran 8 x 8, kemudian

mengklasifikasi jenis parket kayu jati

setiap sub-image akan dianalisis

berdasarkan citra. Citra ini dibagi

menggunakan

menjadi 3 kelas. Jumlah masing-

GLDM yang telah dihasilkan dari

masing citra dari 3 kelas ini adalah

Arum Agesti Aprilia [22]. Pada

20 image. Jadi jumlah seluruh citra

bagian ini menampilkan nilai fitur

adalah 60 buah. Ukuran citra yang

tekstural GLDM. Namun, karena

digunakan dijadikan sama dengan

hasil regionisasi dari data citra terlalu

melihat ukuran yang terkecil dari

banyak, maka pada bagian ini hanya

metode

statistikal

9

menampilkan sebagian contoh nilai

Pattern yang dianalisis oleh Nanda

fitur GLDM.

Pramitha

[23].

Data-data

yang

diambil akan dijadikan nilai features yang telah ditentukan nilainya. Nilai

Data Masukan PERCENTILE Dalam warna,

metode

percentile

menganalisanya

features berdasarkan dari jumlah

pada

neighbor (nilai tetangga) 8, 16 dan

30,

24 yang masing-masing nilai akan

percentile 50, percentile 70, dan

diambil 10 features dari setiap data.

percentile 90 untuk masing-masing

Nilai features dari setiap data akan

warna dari RGB (Red Green Blue).

terbagi menjadi dua yaitu data

Nilai dari masing-masing percentile

training sebanyak 15 data dan data

menghasilkan pixel. Sama seperti

testing sebanyak 5 data.

10,

percentile

metode

percentile

statistikal

pada

Features setiap data akan

metode color percentile sebelum

dijadikan matriks. Matriks tersebut

proses analisis tiap image dibagi

disesuaikan

menjadi 8 x 8 sub-image.

masing-masing

Data

GLDM,

masukan

dengan

nilai

LBP.

dari

Matriks

ini

tersebut akan dkelompokkan menjadi

menganalisa jenis kayu jati parket

matriks data training dan matriks

dalam bentuk citra RGB. Pada

data testing. Setiap data dari image

bagian

nilai

akan dijadikan satu matriks dengan

hasil

panjang baris yang sama untuk setiap

ini

percentile.

menampilkan Namun,

karena

regionisasi dari data citra terlalu

nilai features LBP.


Data inputan akan diolah


dengan menggunakan metode Local

fitur percentile.

Binary Pattern berdasarkan dari neighbor 8, 16, dan 24. Nilai

Data Masukan LBP Data yang digunakan adalah data kayu parket yang terlebih dahulu dilakukan ekstraksi warna dengan menggunakan Local Binary

neightbour ini menentukan hasil features dari setiap data yang akan diinputkan. Pada

bagian

ini

menampilkan nilai fitur tekstural

10

LBP

8.

Namun,

karena

hasil

Windows

•

XP

regionisasi dari data citra terlalu

Professional


sistem operasi.


sebagai

Matlab 2008a sebagai

•

fitur LBP 8.

perangkat

lunak

pengolahan citra. Spesifikasi Hardware dan Software yang digunakan Spesifikasi software

yang

Model Pelatihan hardware digunakan

dan Fitur

pada

pengembangan aplikasi klasifikasi

ditraining

dahulu dengan menggunakan fungsi Saat

genpred.

SVM ini :

menggunakan

1. Hardware Spesifikasi hardware yang digunakan untuk membuat program ini adalah sebagai

terlebih

pelatihan

waktu

untuk

memproses training. Image yang digunakan saat train sebanyak 15 buah dari masing-masing kelas pada metode analisisnya. Dalam proses

berikut :

training ini membutuhkan counter •

Prosesor

Intel

Pentium 1.86 GHz.

atau

jumlah

kelas

untuk

mengklasifikasikan parket kayu jati, label yang menandakan parket kayu

•

Memori 120 GB.

•

Harddisk 1 Gb.

•

Laptop 14”.

•

Mouse dan Keyboard.

jati tersebut termaksud dalam kelas berapa

nantinya.

Tools

yang

digunakan adalah PRTOOLS untuk klasifikasi.

Pada

saat mengtrain

menghasilkan dataset yang didapat 2. Software Spesifikasi

dari software

yang

digunakan untuk membuat program ini adalah sebagai berikut :

memasukkan

jumlah

keseluruhan data dari semua kelas (label), banyaknya data dari masingmasing kelas (counter), prior, dan nilai fitur

dari

metode

analisis

11

tersebut.

Saat

mengklasifikasikan

Classifier

menggunakan klasifikasi nuSVM. Hasilnya

dapat

dilihat

dengan

yang

Classifier adalah

Nu_SVC.

digunakan

Classifier

ini

melihat nilai Ws dari hasil train

berfungsi untuk mengklasifikasi fitur

datasetnya

GLDM, PERCENTILE, dan LBP.

Model Pengujian

Classifier menentukan pencocokan

Setelah fitur ditraining maka ditesting fungsi

dengan evalpred.

menggunakan memproses

menggunakan Saat

pengujian

waktu

testing.

Image

untuk yang

kelas dari masing-masing fitur yang sesuai. Dilihat dari masing-masing fitur

maka classifier kurang dapat

mengklasifikasi

fitur

yang

ada.

Classifier dibentuk dari PRTools.

digunakan saat test sebanyak 5 buah dari

masing-masing

kelas

pada

metode analisisnya. Dalam proses

PRTools PRTools

adalah

testing ini membutuhkan counter

toolbox

atau

untuk

mengklasifikasi suatu data. Di mana

mengklasifikasikan parket kayu jati,

di dalamnya terdapat mendefinisikan

label yang menandakan parket kayu

kelas dan objek. Di dalam kelas

jati tersebut termaksud dalam kelas

PRTools

berapa

yang

dataset. Struktur data pusat PRTools

digunakan adalah PRTOOLS untuk

adalah dataset. Ini terutama terdiri

klasifikasi. Pada saat mengtest akan

dari satu set objek direpresentasikan

melakukan pengujian terhadap 15

oleh matriks vektor fitur. Elemen-

gambar

Saat

elemen matriksnya adalah satu set

menggunakan

label untuk setiap objek dan satu set

klasifikasi nuSVM. Hasilnya dapat

fitur, juga disebut label fitur. Label

dilihat dengan melihat nilai Labels

bernilai integer. Selain itu, satu set

dari hasil test yang memiliki nilai

probabilitas untuk masing-masing

confidence terbaik untuk menyatakan

kelas, disimpan. Umumnya dataset

kelas mana inmage tersebut

itu dinyatakan dengan A dan bisa

jumlah

kelas

nantinya.

dari

5

mengklasifikasikan

Tools

gambar..

matlab

sebuah

akan

untuk

mengidentifikasi

menangani multi-kelas set objek. Hal

12

untuk

PERCENTILE, dan fitur LBP yang

mendefinisikan lebih dari satu set

gambarnya tidak digunakan pada

label dalam dataset. Misalnya, saat

tahap training :

ini

dimungkinkan

obyek yang piksel dalam gambar,

maka mungkin diberi label sesuai

segmen citra, tetapi juga untuk

Analisa SVM Pada GLDM Ini dilihat dari berapa banyak

gambar yang digunakan. Struktur

data

gambar yang cocok sesuai dengan

transformasi, pengklasifikasi, hasil

penempatan kelas. Maka dari itu

ekstraksi fitur, data definisi skala,

total persen error rate GLDM adalah

proyeksi nonlinier, dan sebagainya.

73 % error rate. Terlalu besar

Biasanya dinyatakan dengan W.

kesalahan yang di peroleh. Jadi,

data

kelas

menyimpan

GLDM

kurang

cocok

untuk

diklasifikasikan menggunakan SVM.

ANALISA HASIL Analisa hasil klasifikasi SVM

Dikarenakan

data

yang

didapat

ini didapatkan dari train dan test.

masih sedikit, nilai fitur terlalu besar,

Fitur yang ditraining didapatkan dari

dan SVM belum bisa mengenali pola

fitur

sesuai

yang

gambarnya

tidak

dengan

dimasukkan pada tahap training dan

confidence

fitur yang gambarnya dimasukkan

semuanya 1.

kelasnya.

value-nya

Nilai hampir

pada tahap training. Fitur yang gambarnya dimasukkan pada tahap training

dilakukan

Analisa SVM Pada PERCENTILE

percobaan

Pada tabel 4.2 disimpulkan

sebanyak 5 kali. Bentuk dari analisa

bahwa

hasil

berupa

memiliki total error rate 100 %.

persentasi tingkat akurat prediksi

Dikarenakan setiap gambar tidak ada

kelas mana yang cocok dari masing-

yang cocok sesuai dengan kelasnya.

masing

Maka dari itu PERCENTILE sangat

klasifikasi

image.

SVM

Maka

dari

itu

klasifikasi

didapatkan hasil klasifikasi SVM

tidak

yang terbaik. Berikut analisa hasil

menggunakan SVM karena nilai fitur

dari

yang disediakan adalah nilai pixel

fitur

GLDM,

fitur

cocok

PERCENTILE

diklasifikasikan

13

serta pengelompokan kelasnya tidak

data train-nya yang sedikit. Vector

ada yang cocok. Nilai confidence

Machines kurang dapat identifikasi

value hampir semuanya 0,99.

perbedaan setiap kelas. Jadi total error rate adalah 33,33 %. Nilai confidence value-nya adalah 1 tiap

Analisa SVM Pada LBP 8 Pada tabel 4.3 di bawah ini

image.

setiap gambar masuk ke kelas 2 semuanya.

Kecocokannya

hanya

dimiliki pada gambar 6 sampai

Analisa SVM Pada GLDM dan PERCENTILE

gambar 10 yang tidak memiliki error

Pada tabel 4.5 di bawah ini

rate. Gambar lainnya memiliki error

setiap gambar masuk ke kelas 2

rate 100 %. Jadi total error rate

semuanya.

adalah 33,33 %. Maka dari ini LBP 8


tidak cocok pada klasifikasi SVM,


dikarenakan terlalu banyak fitur.


Nilai confidence value-nya adalah


0,99 tiap image.

adalah 33,33 %. Nilai confidence

Kecocokannya

hanya

value-nya adalah 0,97. Maka

Analisa SVM Pada LBP 16, LBP

dari

ini

gabungan

24, LBP 8 + LBP 16, LBP 8 + LBP

GLDM dan PERCENTILE tidak

24, LBP 16 + LBP 24, LBP 8 +

cocok

LBP 16 + LBP 24



pada

klasifikasi

SVM,

Jumlah data untuk training sedikit.


Vector

semuanya.

identifikasi perbedaan setiap kelas.

Kecocokannya

hanya

Machines

kurang

dapat

dimiliki pada gambar 11 sampai gambar 15 yang tidak memiliki error

Analisa SVM Pada GLDM + LBP


8, GLDM + LBP 16, GLDM + LBP

rate 100 %. Maka dari ini LBP tidak

24, GLDM + (LBP 8 + LBP 16),

cocok

SVM,

GLDM + (LBP 8 + LBP 24),

dikarenakan terlalu banyak fitur dan


pada

klasifikasi

14

GLDM + (LBP 8 + LBP 16 + LBP


24)

rate. Gambar lainnya memiliki error Pada tabel 4.6 di bawah ini




semuanya.

hanya

value-nya adalah 0,99. Maka dari ini


gabungan PERCENTILE dan LBP








Vector

value-nya adalah 0,98.


Maka

Kecocokannya

dari

ini

Machines

kurang

dapat

gabungan

GLDM dan LBP tidak cocok pada


klasifikasi SVM, dikarenakan terlalu

Pada tabel 4.9 disimpulkan

banyak fitur. Jumlah data untuk

bahwa

klasifikasi

PERCENTILE

training sedikit. Vector Machines

memiliki total error rate 100 %.

kurang dapat identifikasi perbedaan

Dikarenakan setiap gambar tidak ada

setiap kelas.

yang cocok sesuai dengan kelasnya. Maka dari itu PERCENTILE sangat


tidak

+ LBP 8, PERCENTILE + LBP 16,

menggunakan SVM karena nilai fitur

PERCENTILE

24,

yang disediakan adalah nilai pixel.

PERCENTILE + (LBP 8 + LBP

Nilai confidence value-nya hampir

16), PERCENTILE + (LBP 8 +

semuanya 0,99.

+

LBP

cocok

diklasifikasikan

LBP 24), PERCENTILE + (LBP 16 + LBP 24), PERCENTILE +

Analisa SVM Pada GLDM dan

(LBP 8 + LBP 16 + LBP 24)

PERCENTILE

Pada tabel 4.7 di bawah ini setiap gambar masuk ke kelas 3 semuanya.

Kecocokannya

hanya


Error rate (e) pada GLDM dan PERCENTILE adalah

15

(untuk class 1) Analisa SVM Pada LBP 8, LBP 16, LBP 24, LBP 8 + LBP 16, LBP 8 + LBP 24, LBP 16 + LBP 24, LBP 8 (untuk class 2)

+ LBP 16 + LBP 24 Pada tabel 4.11 di bawah ini setiap gambar masuk ke kelas 2 semuanya.

(untuk class 3)

Kecocokannya

hanya

dimiliki pada gambar 6 sampai gambar 10 yang tidak memiliki error

Ini dilihat dari berapa banyak


gambar yang cocok sesuai dengan

rate 100 %. Maka dari ini LBP tidak

penempatan kelas. Maka dari itu

cocok

total persen error rate GLDM dan

dikarenakan terlalu banyak fitur dan

PERCENTILE adalah 67 % error

data train-nya yang sedikit. Vector

rate. Terlalu besar kesalahan yang di

Machines kurang dapat identifikasi

peroleh. Jadi, GLDM kurang cocok

perbedaan setiap kelas. Jadi total

untuk diklasifikasikan menggunakan

error rate adalah 33,33 %. Nilai

SVM.

confidence value-nya adalah 1 tiap

Dikarenakan

data

yang

didapat masih sedikit, nilai fitur

pada

klasifikasi

SVM,

image.

terlalu besar, dan SVM belum bisa mengenali

pola

dengan

Analisa SVM Pada GLDM + LBP

kelasnya. Nilai confidence value-nya

8, GLDM + LBP 16, GLDM + LBP

berkisar dari 0,89 - 0,99.

24, GLDM + (LBP 8 + LBP 16),

Maka

gabungan


GLDM dan PERCENTILE tidak


cocok

GLDM + (LBP 8 + LBP 16 + LBP

pada

dari

sesuai

ini

klasifikasi

SVM,

dikarenakan terlalu banyak fitur. Jumlah data untuk training sedikit. Vector

Machines

kurang

dapat


24) Pada tabel 4.12 di bawah ini setiap gambar masuk ke kelas 3 semuanya.

Kecocokannya

hanya

16


gabungan PERCENTILE dan LBP








Vector

value-nya adalah 0,98.


Maka

dari

ini

Machines

kurang

dapat

gabungan

GLDM dan LBP tidak cocok pada

Perbandingan Analisa hasil SVM

klasifikasi SVM, dikarenakan terlalu

yang Imagenya Digunakan Pada

banyak fitur. Jumlah data untuk

Training

training sedikit. Vector Machines

Pada Training dari Fitur GLDM,

kurang dapat identifikasi perbedaan

Fitur PERCENTILE, dan Fitur

setiap kelas.

LBP

dan Tidak Digunakan

Perbandingan dari masingAnalisa SVM Pada PERCENTILE

masing fitur dilihat dari error rate,

+ LBP 8, PERCENTILE + LBP 16,

testing, dan

PERCENTILE

Analisa hasil SVM fitur GLDM yang

+

LBP

24,

confusion matriknya.

tidak

digunakan

pada

PERCENTILE + (LBP 8 + LBP

imagenya

16), PERCENTILE + (LBP 8 +

training, nilai confidence value-nya

LBP 24), PERCENTILE + (LBP

sama besar dengan analisa hasil

16 + LBP 24), PERCENTILE +

SVM

(LBP 8 + LBP 16 + LBP 24)

digunakan pada training. Di mana

fitur

GLDM

image-nya


berjumlah 73 %. Analisa hasil SVM


fitur PERCENTILE yang image-nya

semuanya.

tidak

Kecocokannya

hanya

digunakan

pada

training


confidence value-nya sama besar


dengan analisa hasil SVM fitur


PERCENTILE image-nya digunakan


pada training. Di mana persentase-


nya adalah 100 %. Analisa hasil

value-nya adalah 0,99. Maka dari ini

SVM

fitur

GLDM

dan

17

PERCENTILE yang image-nya tidak

Analisa Umum SVM Pada Fitur

digunakan

GLDM, PERCENTILE, dan LBP

pada

training

nilai

confidence value-nya lebih kecil

Pada fitur GLDM ini SVM

daripada analisa hasil SVM fitur

memiliki nilai fitur yang terlalu

GLDM dan PERCENTILE image-

besar, dan jumlah fiturnya terlalu

nya digunakan pada training. Di

banyak maka dari itu dapat dilihat

mana persentase fitur GLDM dan

dari error rate yang cukup besar

PERCENTILE yang image-nya tidak

persentase-nya yaitu 73 %. Pada

digunakan

adalah

fitur percentile memiliki nilai fitur

33,33 % sedangkan fitur GLDM dan

yang besar dan merupakan nilai pixel

PERCENTILE image-nya digunakan

dari

pada training adalah 67 %. Pada fitur

percentile. Error rate percentile

LBP

sangat besar yaitu 100 %. Pada fitur

pada

training

nilai persentase-nya sama

masing

masing-masing

semua yaitu 33,33 % yang dimana

LBP

memiliki kecocokan kelas

memiliki klasifikasi kelas yang sama

hampir sama semuanya. Terlihat dari

semua dari masing-masing image.

nilai fitur LBP yang hampir sama

Dikarenakan nilainya hampir sama

dari

semua dan jumlah data yang terlalu

memiliki error rate yang sama pula.

banyak.

Pengujian ini dilakukan berulang-

masing-masing

citra.

Jadi

ulang sebanyak 5 kali. Metode One Against One Pada metode One Against

Kesimpulan Skripsi

ini

menghasilkan

untuk

menentukan

One ini terlihat pada masing-masing

program

fitur yang dimana klasifikasi setiap

klasifikasi SVM pada fitur GLDM,

kelas tidak cocok semuanya karena

PERCENTILE, dan LBP. Proses

dimensi nilainya terlalu besar dan

klasifikasi SVM dapat dilihat dari

fitur yang terlalu banyak. Nilai

error rate dari masing-masing fitur.

fiturnya hampir sama sulit untuk

Error rate yang terbaik adalah fitur

membedakan perbedaan klasifikasi.

GLDM dan PERCENTILE yang imagenya digunakan pada training yaitu 40 % untuk kelas 1, 80 % untuk

18

kelas 2, dan 80 % untuk kelas 3. Besarnya

nilai

error

rate

ini

Akbani, Rehan et. Al. 2004. Applying Support Vector Machine to

disebabkan oleh jumlah fitur yang

Imbalanced Datasets,

2004.

terlalu banyak dan jumlah training

Proceedings of ECML-04.

image yang terlalu sedikit sehingga

Alfiani, Diah. Sistem Pengenalan

classifier sulit untuk memberikan

Parket Kayu Menggunakan

confidence

value

yang

cukup

Sub Region, Draft Disertasi

signifikan.

Program Doktor Teknologi

Saran

Informasi Klasifikasi SVM ini dapat

ditingkatkan

dengan

melakukan

Universitas

Gunadarma, 2010. Arief, Muhammad R. H. Klasifikasi

penambahan data yang digunakan

Parket

untuk training dan mereduksi jumlah

berdasarkan Analisa Tekstur

fitur yang digunakan. Selain itu,

GLDM

kombinasi

dari

fitur

yang

Backpropagation, Universitas

memberikan

hasil

terbaik

yaitu

Gunadarma, 2010.

GLDM dan PERCENTILE dapat digunakan metode

sebagai

rekomendasi

ekstraksi

fitur

untuk

penelitian lain yang sejenis.

Kayu

Jati

dengan

Metode

Bernhard Schờlkopf. A Tutorial on nu-Support Vector Machines, Max

Planck

Institute

for

Biological

Cybernetics,

Từbingen,

Germany

bernhard.schoelkopf@tuebin

DAFTAR PUSTAKA

gen.mpg.de Analisis

Burges, Christopher. A Tutorial On

Tekstur Parket Kayu Jati

Support Vector Machines for

Berdasarkan Penggabungan

Pattern Recognition,

Fitur

Mining

Agesti,

Arum

Aprilia.

Ekstraksi

Statistikal Metode

GLDM Color

Universitas 2011.

Metode dan

and

Data

Knowledge

Discovery, 2(2):955-974. 1998.

Percentile,

Chang, Chih-Chung, Chih-Jen Lin. LIB

Gunadarma,

SVM : A Library for Support Vector Machines, 2001.

19

Chen,

Yi-Wei

dan

Chih-jen

Lin.

Combining SVM with Various Features Selection Strategies,

Kobe University. 2006. Lin, Chih-Jen. 2005. Optimization,

2003. Department of Computer

Support

Science,

and

National

Taiwan

Christianini, Nello. Support Vector and Kernel

Vector

Machines,

Mahine

Learning,

http://www.csie.ntu.edu.tw/%

University.

ICML

Machines,

7Ecjlin/papers/rome.pdf.

Diakses tanggal 10 Januari2007.

Muhammad, Nicky Zahab. Analisis

tutorial, 2001. Christianini, Nello dan John S. Taylor. An Introduction

to

Support

Tekstur Parket Kayu Jati Dengan

Menggunakan

Vector Machinesand Other

Metode Statistikal Gray Level

Kernel-based

Difference

Learning

Methods, Cambridge University

Universitas

Press, 2000.

2009.

Hsu, Chih-Wei et al. A Practical Guide

Method, Gunadarma,

Mukkamala, S. et al. Feature Selection

Vector

for Intrusion Detection using

Classification. Department of

Neural Networks and Support

Computer

Vector Machines, 2003.

to

Support

Science

and

Information Engineering, National

Osuna, Edgar E. et. al.1997. Support Vector machines: Training

Taiwan University. 2004. Hsu,

School of Science and technology,

A

and Applications, MIT, 1997.

Comparison of Methods for

Pai-Hsuen Chen, Chih-Jen Lin. A

Chih-Wei,

Chih-Jen

Multi-class

Lin.

Support Vector

Tutorial

on

nu-Support

Machines, IEEE Transactions on

Vector Machines, Department

Neural

of Computer Science and

Networks,

13(2):415-

Information

425.2002. Katagiri,

Shinya

dan

Incremental Support

Shigeo Training

Abe. of

Vector Machines

Using Hyperspheres, Graduate

Engineering

National Taiwan University Taipei 106, Taiwan. Pramitha,

Nanda.

Parket

Analisa Kayu

Fitur Jati

20

Berdasarkan

Warna

dan

Engineering,

Science

and

Tekstur

Menggunakan

Mathematics

School

of

Metode Local Binary Pattern,

Electronics

Universitas

Science,

Gunadarma,

2011.

and

Computer

University

of

Southampton. 10 May 1998.

Prasetiyo. A Comparative Study of

Wu, Shih-Hung (Ph.D), Lin, Chih-

Feature Extraction Methods

Jen’s.

for Wood Texture

Machines and SVM Tool,

Classification. Laboratoire

Dept. of CSIE, CYUT.

Electronique, Informatique et Image (LE2I) UMR CNRS 5158 Le Creusot, France. 2010. Quang, Anh tran et al. Evolving Support

Vector

Machine

Parameters, Slide presentasi ICML. Tsinghua University, 2002. R.P.W. Duin, P. Juszczak, P. Paclik, E. Pekalska, D. de Ridder, D.M.J. Tax, S. Verzakov. PRTools4 A Matlab Toolbox for

Pattern

Recognition,

Version 4.1, August 2007. Schölkopf, Bernhard. Estimating the Support of High-Dimensional Distribution,

Neural

Computation 13, 1443-1471. MIT. 2001. Steve R. Gunn. Support Vector Machines for Classification and Regression, Faculty of

Support

Vector

2 klasifikasi ini adalah GLDM, PERCENTILE, dan LBP. Data dalam penganalisasian terdiri dari 60 data citra kayu jati parket yang akan dianalisa untuk d

Recommend Documents