Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
KLASIFIKASI KANSEI MULTI LABEL DENGAN PROBABILISTIC NEURAL NETWORK PADA CITRA BATIK MENGGUNAKAN KOMBINASI FITUR WARNA, TEKSTUR, DAN BENTUK Agung Nilogiri1, *), Nanik Suciati2) dan Diana Purwitasari3) 1, 2, 3) Fakultas Teknologi Informasi, Institut Sepuluh Nopember Surabaya Gedung Teknik Informatika, Jl. Teknik Kimia ITS, Surabaya, 60111, Indonesia *e-mail:
[email protected] ABSTRAK Penelitian tentang klasifikasi citra batik telah banyak dilakukan, salah satunya dengan mengelompokkan citra batik berdasarkan motif. Kansei adalah perasaan psikologis seseorang terhadap sesuatu (misalnya citra). Kansei (impresi) dapat menjadi label kelas dalam pengelompokan citra batik. Penelitian ini bertujuan untuk mengembangkan sistem klasifikasi kansei multi label pada citra batik karena impresi seseorang pada citra tersebut dapat lebih dari satu. Input dari sistem klasifikasi adalah vektor fitur yang dihasilkan dari proses ekstraksi fitur warna, tekstur, dan bentuk dari citra batik. Fitur warna diambil dari komponen Hue pada domain HSV dan seluruh komponen pada domain grayscale. Fitur tekstur diperoleh dari nilai amplitudo dan sudut pada domain frekuensi yang dihitung menggunakan transformasi Fourier. Sedangkan fitur bentuk didapatkan melalui proses filtering menggunakan filter Gabor 4 arah. Principal Component Analysis (PCA) digunakan untuk menyederhanakan dimensi masing – masing fitur. Proses klasifikasi vektor fitur dari citra batik ke dalam multi kelas dilakukan menggunakan Multi Label Probabilistic Neural Network (MLPNN). Hasil uji coba menunjukkan bahwa MLPNN memiliki waktu training yang jauh lebih cepat (0,05 detik) dibanding Back Propagation Neural Network -BPNN- (2 menit 47 detik). Adapun nilai akurasi Tanimoto distance BPNN lebih baik (0,22) dibanding MLPNN (0,26) untuk total 81 citra training dan testing. Kata kunci: klasifikasi, kansei, batik, probabilistic neural network.
PENDAHULUAN Istilah batik berasal dari kata dalam bahasa Jawa yaitu “amba”, yang artinya menulis dan “nitik” yang berarti memberi titik. Kata batik merujuk pada teknik pembuatan corak menggunakan canting atau cap dan pencelupan kain, dengan menggunakan bahan perintang warna corak, bernama “malam” (lilin) yang diaplikasikan di atas kain, untuk menahan masuknya bahan pewarna. Kain batik adalah kain yang memiliki ragam hias (corak) yang diproses dengan “malam” menggunakan canting atau cap sebagai media menggambarnya [Hamidin, 2010]. Indonesian Archipelago Culture Initiatives (IACI) telah mengumpulkan data citra motif pakaian dari 30 propinsi di Indonesia dan termasuk di dalamnya adalah citra batik. Hal tersebut dilakukan sebagai upaya untuk menginventarisasi kekayaan dan menjaga ketahanan budaya tradisional Indonesia. Informasi yang dapat diperoleh dari setiap citra batik yang ditampilkan pada situs tersebut adalah sebagai berikut: nama motif, asal daerah / kota, propinsi, deskripsi, dan kontributor. Namun, informasi yang telah disajikan tersebut belumlah cukup karena impresi yang dihasilkan oleh seseorang saat melihat suatu citra batik dapat berbeda – beda. Kansei (impresi) memiliki arti perasaan psikologis terhadap suatu produk (misal citra batik). Kansei engineering sendiri mengacu pada terjemahan perasaan psikologis konsumen tentang suatu produk ke dalam elemen-elemen desain persepsi [Grimsaeth, 2005]. ISBN : 978-602-97491-5-1 C-5-1
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Pada penelitian tentang batik Indonesia misalnya, Putra [Putra, 2011] melakukan proses ekstraksi fitur menggunakan transformasi wavelet diskrit dan wavelet filter yang dirotasi dan metode klasifikasi multi-layer perceptron serta penambahan alternatif query nama dan jenis motif untuk mengembangkan sistem temu kembali citra batik. Sanabila [Sanabila, 2009] memanfaatkan Generalized Hough Transform untuk mendapatkan fitur bentuk untuk mengenali motif batik Yogyakarta. Di sisi lain penelitian tentang kansei yang tidak terkait dengan batik Indonesia juga telah dilakukan. Chen [Chen et. al., 2008] misalnya, berhasil menggunakan backpropagation Neural Network untuk mempelajari fungsi pemetaan dari ruang fitur citra ke ruang kansei. Huang [Huang et. al., 2003] menggunakan nilai Hue dari ruang HSV, transformasi Fourier, filter Gabor 4 arah, sebagai metode ekstraksi fitur-fitur citra kain pabrikan. Selanjutnya dipadukan dengan principal component analysis (PCA) dan Backpropagation neural network untuk membangun sistem temu kembali citra pakaian pabrikan berbasis kansei. Adapun kelemahan backpropagation neural network adalah lamanya proses training yang mungkin terjadi untuk jumlah data yang besar. Tujuan penelitian ini adalah melakukan klasifikasi citra batik berdasar kansei dengan menggabungkan metode ekstraksi fitur warna, tekstur, dan bentuk yang masing-masing dimensinya disederhanakan menggunakan principal component analysis serta diklasifikasi menggunakan Multi Label Probabilistic Neural Network (MLPNN). PNN dipilih dengan alasan proses training yang cepat [Cheung, 2002] dan terkadang lebih unggul dibanding Backpropagation Neural Netwok, SVM dan KNN [Oliveira et. al., 2008]. Impresi dapat menjadi label kelas dalam pengelompokan citra batik. Multi label dipilih karena impresi seseorang pada citra tersebut dapat lebih dari satu. METODE Metode penelitian klasifikasi multi label kansei citra batik ini dilakukan dengan menggabungkan teknik ekstraksi citra [Huang et. al., 2003], principal component analysis [Smith, 2002], probability neural network (PNN) [Hong, 2012], dan ide pemberian treshold pada PNN untuk kategorisasi teks multi label [Ciarelli et. al., 2009]. Diagram blok sistem yang merepresentasikan langkah metode penelitian dapat dilihat pada gambar 1 berikut:
Gambar 1. Diagram Blok Sistem
ISBN : 978-602-97491-5-1 C-5-2
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Ekstraksi Fitur Warna Metode ekstraksi fitur warna dilakukan dengan mentransformasi citra warna dari domain warna RGB ke HSV dan dari RGB ke grayscale. Nilai Hue yang didapat digunakan sebagai fitur warna bersama dengan nilai grayscale-nya [Huang et. al., 2003]. Jumlah fitur vektor nilai Hue-nya dikelompokkan menjadi 360 vektor fitur dan nilai grayscale dikelompokkan menjadi 4 vektor fitur sehingga memiliki total sebanyak 364 dimensi. Hasil ekstraksi fitur warna dalam histogram dapat dilihat pada gambar 2 berikut:
(a)
(b)
(c)
Gambar 2. (a) Citra Batik, (b) Histogram Hue dan (c) Grayscale Hasil Ekstraksi Fitur Warna
Ekstraksi Fitur Tekstur Metode ekstraksi fitur tekstur dilakukan dengan mentransformasi citra dari ruang warna RGB ke ruang grayscale dan selanjutnya ke ruang frekuensi menggunakan transformasi fourier. Tujuan ekstraksi fitur tekstur batik adalah untuk mendapatkan nilai amplitudo dan sudut arah frekuensinya [Huang et. al., 2003]. Amplitudo dan sudut arah frekuensi dalam domain fourier F(u,v) dapat dinyatakan pada persamaan berikut: ( , )+ Amplitudo spektrum, | ( , )| = ( , ) (1) ( , ) Sudut spektrum, ( , ) = [ ] (2) ( , )
Berikutnya dengan dimensi citra sebesar 640x640 pixel didapatkan jumlah vektor fitur sebesar 2560 dimensi. Rincian informasi amplitudo dan sudut yang didapat dijumlahkan per kolom sehingga masing-masing memiliki 640 vektor fitur. Selanjutnya dijumlahkan per baris sehingga masing-masing memiliki 640 vektor fitur. Hasil ekstraksi fitur tekstur dalam histogram dapat dilihat pada gambar 3 berikut:
(a)
(b)
(c)
Gambar 3. (a) Citra Batik, (b) Histogram Amplitudo dan (c) Sudut Fourier Hasil Ekstraksi Fitur Tekstur ISBN : 978-602-97491-5-1 C-5-3
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Ekstraksi Fitur Bentuk Metode ekstraksi fitur bentuk dilakukan dengan melakukan filtering citra grayscale. menggunakan filter Gabor 4 arah dengan sudut 0, π/4, π/2, dan π3/4. Setelah itu membagi keempat citra hasil filter masing - masing 10x10 sub citra sehingga dihasilkan total 400 sub citra [Huang et. al., 2003]. Kemudian mencari mean masing – masing sub citra untuk membentuk vektor fitur sebanyak 400 dimensi. Sub citra dan histogram mean hasil ekstraksi fitur bentuk dapat dilihat pada gambar 4 berikut:
(a)
(b)
Gambar 4. (a) Sub Citra 10x10 dan (b) Histogram Sub Citra pada Sudut= π/4 Hasil Ekstraksi Fitur Bentuk
Penyederhanaan Dimensi Data Vektor Fitur Principal Component Analysis (PCA) adalah sebuah metode statistik untuk mengurangi dimensi data dengan melakukan analisis kovarian antar faktor [Joliffe, 2002]. Pada penelitian ini, PCA digunakan untuk melakukan reduksi dimensi data pada masingmasing vektor fitur warna, tekstur, dan bentuk. Langkah – langkah implementasi reduksi PCA [Smith, 2002] dilakukan melalui tahapan sebagai berikut: membaca dataset vektor fitur data di-adjust dengan mengurangi tiap data dengan nilai mean-nya menghitung matriks kovarian menghitung Eigen value dan Eigen vector dari matriks kovarian memilih principle component dan membentuk sebuah vektor fitur menurunkan dataset baru Klasifikasi Citra Metode yang digunakan sebagai pengklasifikasi citra batik merupakan bagian dari klasifikasi terawasi (supervised) yaitu: probabilistic neural network (PNN) [Specht, 1990]. PNN merupakan artificial neural network yang digunakan untuk melakukan perhitungan nonliner dengan meng-estimasi probabability density function (PDF) dari dataset menggunakan Parzen probability density estimation. Ciarelli [Ciarelli et. al., 2009] memodifikasi arsitektur PNN versi Specht tersebut menjadi seperti yang ditunjukkan pada gambar 5(b) untuk mengategorikan teks sehingga dapat memiliki kelas label lebih dari satu (multi-label). Kategori kelas yang paling cocok ditentukan oleh keluaran summation layer berdasarkan pada threshold yang telah ditentukan. Jika hasilnya lebih besar dari treshold maka teks tersebut masuk ke dalam kategori keluaran summation layer dan sebaliknya. Arsitektur PNN awal dan yang telah dimodifikasi tersebut dapat dilihat pada gambar 5 berikut ini:
ISBN : 978-602-97491-5-1 C-5-4
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
(a)
(b)
Gambar 5. Arsitektur PNN, (a) Versi Specth dan (b) Versi Ciarelli
Untuk menemukan fungsi korespondensi vektor fitur citra dan kansei, bagian masukan PNN dihubungkan dengan vektor fitur citra dan bagian keluarannya dihubungkan dengan kelas kansei yang telah ditentukan. Secara umum, PNN untuk kelas sebanyak M dapat didefinisikan sebagai berikut [Hong, 2012]: (
( )= ∑
)
exp(− ) (3) √ Langkah – langkah dalam mengklasifikasi motif batik ke dalam impesinya dapat dilihat pada gambar 6 berikut ini:
Gambar 6. Flowchart Klasifikasi dengan PNN
HASIL DAN PEMBAHASAN Komposisi dataset klasifikasi kansei multi label terdiri dari citra training dan testing berturut turut 80% dan 20% yang mewakili 5 motif citra batik. Total dataset training dan testing berjumlah 81 citra. Dataset tersebut memiliki 6 kelas impresi berbeda yang merupakan subset dari penelitian sebelumnya [Akbariah et. al., 2010]. Selanjutnya pembagian kelas impresi untuk motif citra batik dapat dilihat pada tabel berikut: Tabel 1. Motif, Filosofi, dan Impresi Batik. No 1
Motif Repetitif Kotak
2 3,4 5
Kawung Parang, Lereng Buketan (Bucket of flowers)
Filosofi Tergantung pada ornamennya, menunjukkan kebijaksanaan, kesejahteraan dll Memberikan harapan, kebijaksanaan, membimbing Menampilkan perubahan, dinamis, kelebihan Mengekspresikan kecantikan
ISBN : 978-602-97491-5-1 C-5-5
Impresi Dewasa, Kalem Hangat, Kalem, Dewasa Dinamis, Maskulin Feminin
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Uji multi label pada klasifikasi batik ini menggunakan Tanimoto distance. Parameter ∩ adalah interseksi antara set kategori yang diprediksi dan set kategori aktual dari citra tes. Kategori yang diprediksi adalah kategori yang memiliki derajat lebih tinggi daripada treshold . Pada uji Tanimoto distance, semakin nilainya mendekati nol maka semakin banyak jumlah total kategori yang berhasil diprediksi dengan benar. Uji Tanimoto distance dapat dimodelkan dengan persamaan berikut: =
|
|
∩
∩
|
(4)
|
Proses ini didahului dengan pemilihan komposisi vektor fitur hasil reduksi PCA. Persentase informasi hasil PCA yang digunakan dalam penelitian sebelumnya [Huang et. al., 2003] sebenarnya adalah nilai varians yang direpresentasikan oleh Eigen value. Skenario uji coba komposisi vektor fitur hasil reduksi PCA dimulai dari pemilihan nilai batas varians dari 10 sampai dengan 90 dengan interval kenaikan sebesar 10. Selanjutnya dicari nilai keluaran PCA dengan komposisi vektor fitur yang masing-masing dimensinya tidak sama dengan nol. Dari jumlah vektor fitur awal warna sebanyak 364, tekstur sebanyak 2560, dan bentuk sebanyak 400 dimensi didapatkan komposisi fitur warna sebanyak 2, tekstur sebanyak 8 dan bentuk sebanyak 4 dimensi saat persentase informasi bernilai 90. Setelah mendapatkan vektor fitur warna, tekstur, dan bentuk yang masing-masing tidak berdimensi 0 selanjutnya interval kenaikan diturunkan menjadi 1 mulai dari persentase informasi 90 sampai dengan 99. Rincian vektor fitur per kenaikan persentase informasi dapat dilihat pada tabel 2 berikut: Tabel 2. Jumlah Vektor Fitur Hasil Reduksi PCA rentang (a) 10 - 90 dan (b) 90 – 99
(a)
(b)
Dari komposisi vektor fitur pada tabel di atas, diambil 3 skenario persentase informasi 99, 95 dan 90 untuk mencari nilai Tanimoto distance pada citra tes. Selanjutnya melakukan klasifikasi pada citra tes menggunakan PNN yang telah dimodifikasi berdasarkan komposisi treshold [Ciarelli et. al., 2009] dan faktor pengali standar deviasi dengan menggunakan persamaan 3 [Hong, 2012]. Selanjutnya digunakan uji Tanimoto distance seperti yang diusulkan oleh Oliviera [Oliviera et.al., 2008] pada citra tes. Dari 3 skenario didapat 2 skenario yang memiliki rerata nilai Tanimoto terkecil, yaitu skenario PCA 95 dan 90. Grafik karakteristik 2 skenario tersebut dapat dilihat pada gambar 7 berikut:
ISBN : 978-602-97491-5-1 C-5-6
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Tanimoto Distance
Uji Tanimoto PCA 90 1.00
X S t 0.1 d 0.2
0.50
0.3
0.00 0.1 0.3 0.5 0.7 0.9 Threshold
(a)
0.4 0.5
(b)
Gambar 7. Grafik Karakteristik Treshold terhadap Pengali Standar Deviasi Uji Tanimoto Distance (a) PCA 95 dan (b) PCA 90
Dari gambar 7 di atas, rerata nilai uji Tanimoto distance pada citra tes batik terbaik (memiliki nilai uji terkecil) terlihat pada faktor pengali standar deviasi 1 dengan treshold 0.8 (gambar 6.a) dan faktor pengali standar deviasi 0.9 dengan treshold 0.9 (gambar 6.b). Kedua skenario uji memiliki nilai Tanimoto terkecil yang sama yaitu 0.26. Skenario PCA 90 dipilih sebagai hasil terbaik karena dengan jumlah dimensi vektor fitur yang paling kecil menghasilkan rerata nilai Tanimoto yang optimal. Rincian rerata nilai Tanimoto pada citra tes menggunakan PNN dengan PCA 90 dapat di lihat pada tabel 3 berikut:
Faktor Pengali Standar Deviasi
Tabel 3. Rerata Tanimoto Citra Tes pada PNN dengan PCA 90 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0.1 0.60 0.56 0.52 0.55 0.59 0.68 0.69 0.69 0.69 0.70
0.2 0.60 0.55 0.55 0.50 0.55 0.62 0.68 0.68 0.68 0.69
0.3 0.60 0.63 0.56 0.45 0.48 0.54 0.65 0.68 0.68 0.68
0.4 0.60 0.61 0.55 0.51 0.48 0.44 0.49 0.61 0.64 0.68
Treshold 0.5 0.6 0.60 0.60 0.64 0.64 0.55 0.55 0.49 0.49 0.42 0.44 0.45 0.40 0.43 0.37 0.44 0.38 0.57 0.38 0.62 0.45
0.7 0.60 0.64 0.60 0.51 0.44 0.32 0.34 0.37 0.35 0.36
0.8 0.60 0.64 0.65 0.53 0.42 0.34 0.31 0.30 0.32 0.30
0.9 0.60 0.67 0.65 0.56 0.42 0.30 0.29 0.29 0.26 0.28
1 0.60 0.67 0.67 0.63 0.44 0.29 0.29 0.29 0.29 0.29
Selanjutnya hasil uji tanimoto pada PNN dibandingkan dengan rerata Tanimoto distance back propagation neural network (BPNN) menggunakan skenario uji yang dipilih oleh Putra [Putra, 2011]. Putra menggunakan konstanta learning rate = 0.8, momentum = 0.8, epoch = 10000, 2 hidden layer dengan masing-masing 80 dan 40 node dan MSE 0.00027. Dari hasil percobaan dengan 3 skenario pemilihan PCA yang sama dengan PNN didapatkan rerata nilai Tanimoto berturut turut 0.22, 0.32, dan 0.32 untuk PCA 99, 95, dan 90. Dengan demikian skenario dengan hasil rerata nilai Tanimoto terbaik pada BPNN didapat dengan menggunakan PCA 99. Skenario tersebut memiliki waktu training-nya sebesar 167 detik atau 2 menit 47 detik. Hasil skenario dengan PCA 99 pada BPNN selanjutnya dapat dilihat pada tabel 4.
ISBN : 978-602-97491-5-1 C-5-7
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Tabel 4. Rerata Tanimoto Citra Tes pada BPNN dengan PCA 99 PCA 99 Uji ke 1 2 3 4 5 6 7 8 9 10 Rerata
Waktu Training (detik) 176 166 128 193 195 197 84 103 227 202 167.10
Rerata Tanimoto 0.32 0.32 0.00 0.32 0.20 0.32 0.00 0.00 0.32 0.43 0.22
Waktu Testing (detik) 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02
KESIMPULAN DAN SARAN Dari pembahasan di atas dapat disimpulkan penelitian ini membuktikan bahwa probabilistic neural network (PNN) dapat digunakan untuk klasifikasi multi label pada citra (khususnya batik). Hasil uji coba menunjukkan bahwa multi label probabilistic neural network (MLPNN) memiliki waktu training yang jauh lebih cepat (0,05 detik) dibanding back propagation neural network -BPNN- (2 menit 47 detik). Adapun nilai akurasi Tanimoto distance BPNN lebih baik (0.22) dibanding MLPNN (0.26) untuk total 81 citra training dan testing. Pengembangan lebih lanjut dapat dilakukan dengan mencari komposisi faktor pengali standar deviasi dan threshold MLPNN untuk jenis citra lain dengan pertimbangan vektor fitur citra yang paling dominan. DAFTAR PUSTAKA Akbariah, N., Kusnendar, J. dan Wahtudin, A. (2010). Klasifikasi Karakter Pengguna Batik untuk Rekomendasi Motif Menggunakan Algoritma Naïve Bayes, Skripsi, Universitas Pendidikan Indonesia. Chen, Y.W., Sobue, S., dan Huang, X. (2008). Mapping function of color image features and human KANSEI, IEEE International Conference on Intelligent Information Hiding and Multimedia Signal Processing, pp. 725. Ciarelli, P. M., Oliveira, E., Badue, C., dan Souza, A. F. D. (2009). Multi Label Text Categorization Using a Probabilistic Neural Network, International Journal of Computer Information System and Industrial Management Applications (IJCISIM) vol 1 (2009), pp. 133-144 Cheung, V., dan Cannons, K. (2002). An Introduction to Probabilistic Neural Network, Signal and Data Laboratory, Electrical & Computer Engineering, University of Manitoba, Canada. Grimsæth, K. (2005). Linking emotions and product features, KANSEI Engineering, p. 1-45. Hamidin, A.S. (2010). Batik, Warisan Budaya Asli Indonesia, Penerbit NARASI, Yokyakarta Hong, X. (2012). Parzen Windows and Probabilstic Neural Network, Pattern Recognition Lecture Notes, Lecture 2 and 3. Huang, X., Sobue, S., dan Chen, Y. W. (2003). Retrieval of Clothing Fabric Images Based on KANSEI Words, Information, Volume 6, pp. 215-230.
ISBN : 978-602-97491-5-1 C-5-8
Prosiding Seminar Nasional Manajemen Teknologi XVI Program Studi MMT-ITS, Surabaya 14 Juli 2012
Joliffe, I. T. (2002). Principle Component Analysis, Springer Series in Statistics Oliveira, E., dan Ciarelli, P. M. (2008). A Comparison Between a kNN based approach and a PNN Algorithm for a Multi-Label Classification Problem, IEEE Eight International Conference on Intelligent System Design and Application. Smith, L. (2002). A Tutorial on Principal Component Analysis, Lecture’s Note. Putra, R. E. (2011). Implementing Content Base Image Retrieval For Batik Using Rotated Wavelet Transform and Canberra Distance, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Sanabila, H. R. dan Manurung R. (2009). Recognition of Batik Motifs using the Generalized Hough Transform. Proceeding of ICACSIS, p 79
ISBN : 978-602-97491-5-1 C-5-9