Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15 November 2014
ISSN: 1979-911X
SEGMENTASI BERDASARKAN FITUR TEKSTUR MENGGUNAKAN METODE WAVELET HIDDEN MARKOV TREE PADA CITRA BATIK Murinto1, Eko Aribowo2 Program Studi Teknik Informatika, Fakultas Teknologi Industri, Universitas Ahmad Dahlan Yogyakarta e-mail :
[email protected],
[email protected]
1,2,
ABSTRACT Image segmentation has been become an important area of research in image processing, since this process used for the next process in image analysis. Image analysis include image recognition process of a particular input image. The main objective of image segmentation is to divide image into parts of the region (sub-regions) that have common features include: levels of gray scale, texture, color , motion. Image segmentation and classification is often a first step in the acquisition process or the analysis of an image. Application among others in the field of machine vision, face recognition, medical image analysis (analysis of medical imaging), textile industry (batik), etc. There are several methods of texture feature extraction for image segmentation such as Gray Level Co-occurence Matrix (GLCM), Gabor filter method and wavelet transform method. Segmentation is the first step and become a key importance in pattern recognition objects (object recognition). In this paper proposed texture based image segmentation using unsupervised methods in the concept of clustering. Clustering method used is the mean-shift method, while the method of feature extraction using wavelet hidden Markov tree. Image data used in this paper is a data image of batik. Keywords: Batik image, Texture Features, Image Segmentation, Wavelet Hidden Markov Tree. PENDAHULUAN Segmentasi citra dalam beberapa tahun belakangan bidang penelitian yang penting dalam pengolahan citra, karena proses ini merupakan proses yang penting untuk proses selanjutnya yakni analisis citra. Analisis citra meliputi proses pengenalan citra dari suatu citra inputan tertentu. Fungsi utama dari segmentasi citra adalah membagi citra ke dalam bagian-bagian wilayah (sub-regions) yang mempunyai kesamaan fitur antara lain : tekstur, warna, bentuk dan lain sebagainya. Segmentasi dan klasifikasi citra seringkali merupakan langkah awal dalam proses akuisisi atau analisis suatu citra. Aplikasinya antara lain dalam bidang machine vision, pengenalan wajah, analisis citra medik (imaging medical analysis), industri tekstil (batik) dan lain sebagainya (Gaetano, 2006). Dalam aplikasi tertentu, misalnya pengenalan pola batik tertentu, kegiatan awal yang dilakukan adalah melakukan proses segmentasi menggunakan model yang sesuai dengan karakteristik citra tersebut. Melalui model segmentasi yang tepat maka proses pengenalan akan lebih mendapatkan hasil yang memuaskan. Dalam makalah ini ditekankan pada teknik segmentasi citra untuk beberapa kasus citra khusus, yakni citra batik. Batik merupakan bagian dari industri tekstil dan printing, di mana berbeda dengan citra warna alami, citra tekstil mempunyai beberapa fitur yang berbeda : secara umum dalam tekstil terdapat sedikit warna yang dominan dan dalam industri tekstil sering kali perancang mengkombinasikan warna-warna yang berbeda, thickness dan densitas untuk menghasilkan visual impersif dari warna yang lain (teknik halftoning color dalam tekstil cetak). Struktur tekstur tekstil hasil industri (pabrik), noise tekstur yang dihasilkan mempunyai pengaruh yang sangat besar pada tampilan warna citra tekstil, dan ini membuat segmentasi warna dari citra tekstil menjadi pekerjaan yang amat sulit (Lu, 2009). Struktur benang kain menjadikan pekerjaan yang sulit untuk mengelompokkan secara otomatis untuk proses ekstraksi fitur warna yang dominan tersebut dari citra tekstil. Pendekatan multiskala digunakan untuk menghindari adanya permasalahan antara batas lokalisasi dan segmentasi citra beresolusi resolusi tinggi melalui penyimpulan probabilitas posterior maksimum untuk tiap blok secara rekursif dari skala kasar ke halus (fine to coarse). A-327
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15 November 2014
ISSN: 1979-911X
Tujuan akhir dari segmentasi adalah mendapatkan suatu region yang didasarkan pada partisi citra batik pada area yang berbeda-beda (dalam kelas yang berbeda-beda), dimana tiap region dicirikan dengan spesifikasi khusus. Model yang digunakan dalam segmentasi citra meliputi model active contour dan model probabilistik (Synder, 2005). Model probabilistik termasuk diantaranya adalah Model Hidden Markov. Dalam makalah ini difokuskan pada penggunaan model model wavelet hidden Markov tree untuk segmentasi citra berdasarkan fitur tekstur. Teknik Segmentasi Citra Multiskala Segmentasi citra dapat dianggap sebagai proses inferensi konfigurasi terbaik dari pelabelan X dari data citra pengamatan Y, di mana keduanya merupakan random field X dan Y yang didefinisikan pada suatu grid persegi S. Dalam dasar pendekatan segmentasi menggunakan Bayesian, fitur citra yang diekstrak dinotasikan sebagai Y, sedangkan X merepresentasikan random field diskrit yang mengandung kelas dari tiap pixel. Model data kemudian dituliskan dalam bentuk densitas probabilitas p y| x ( y | x ) , di mana densitas sebelumnya p x (x) digunakan untuk menggabungkan pengetahuan mengenai struktur kontekstual dari akurasi segmentasi. Dalam pendekatan Bayesian, segmentasi yang benar (correct segmentation) kemudian diestimasi dengan menggunakan distribusi posterior p x| y ( x | y ) (Bouman and Shapiro, 1994). Dalam Gambar 1 diilustrasikan mengenai model multiskala. Pada tiap skala n, terdapat suatu random field dari vektor fitur citra, Y (n ) dan suatu random field dari label kelas, X (n ) . Dalam aplikasi ini fitur-fitur citra Y (n ) bersesuaian dengan koefisien wavelet Haar pada skala n, Y (n ) mengandung tekstur citra dan informasi tepi pada skala n, sedangkan X (n ) mengandung kelas label yang bersesuaian. Kelakuan dari Y (n ) di sini diasumsikan tergantung pada kelas label X (n ) dan fitur citra skala lebih kasar Y ( n +1) .
Gambar 1. Ilustrasi Pendekatan untuk Segmentasi Bayesian. Y merupakan citra observasi dan X adalah random field yang mengandung kelas dari tiap pixel dalam Y. Tujuan selanjutnya adalah mengestimasi X dari Y (Bouman and Shapiro, 1994) Di sini tiap random field X (n ) tergantung pada field skala lebih kasar setelahya X ( n +1) . Dependensi ini memberikan X (n ) sebagai suatu struktur rantai Markov dalam variabel skala n. Untuk kenyamanan saja di sini didefinisikan bahwa X ( ≤ n ) = { X ( i ) }in= 0 sebagai himpunan dari label-label kelas pada skala n atau halus, dan X ( > n ) = { X ( i ) }iL= n +1 di mana L adalah skala paling kasar. Demikian juga untuk Y ( ≤ n ) dan Y ( > n ) secara sama. Dengan menggunakan notasi ini, struktur rantai Markov dapat dituliskan dalam bentuk fungsi mass probabilitas (probability mass function) sebagai berikut : p x ( n ) | x ( > n ) ( x ( n ) | x ( > n ) ) = p x ( n ) | x ( n +1) ( x ( n ) | x ( n +1) ............. (1) sehingga probabilitas dari x adalah : L
p x ( x) = ∏ p x ( n ) | x ( n +1) ( x ( n ) | x ( n +1) )
.............
n =0
di mana melalui bagian ini term :
p x ( L ) | x ( L +1) ( x ( L ) | x ( L +1) A-328
(2)
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15 November 2014
ISSN: 1979-911X
( L) di asumsikan sebagai p x ( L ) ( x ) ketika L merupakan skala paling kasar. Fitur-fitur citra y (n )
diasumsikan tidak tergantung bersyarat (conditionally independent) yang berikan label kelas x (n ) dan fitur citra y ( n +1) pada skala lebih kasar. Disini densitas bersyarat (conditional density) dari y yang diberikan x dapat dituliskan sebagai persamaan : L
p y| x ( y | x) = ∏ p y ( n ) | x ( n ) , y ( n +1) ( y ( n ) | x ( n ) , y ( n +1) )
......................
(3)
n =0
dengan mengkombinasikan persamaan (1.2) dan (1.3) menghasilkan densitas gabungan sebagai berikut :
p y , x ( y , x ) = p y| x ( y | x ) p x ( x ) L
= ∏ p y ( n ) | x ( n ) , y ( n +1) ( y ( n ) | x ( n ) , y ( n +1) ) p x ( n ) | x ( n +1) ( x ( n ) | x ( n +1) )
..........
(4)
n =0
untuk melakukan segmentasi citra, maka harus diestimasi label-label kelas X dari data fitur citra Y. Wavelet-Hidden Markov Tree Suatu algoritma segmentasi Bayesian didasarkan pada konteks yang berbeda dikenalkan oleh Choi and Baraniuk (1999), di mana model konteks dicirikan melalui suatu vektor konteks v n yang diturunkan dari suatu himpunan sampel ketetanggaan pada skala kasar berikutnya. Untuk menangkap properti tiap region citra yang akan disegmentasi, baik kelakuan skala kecil ataupun besar harus benar-benar dimanfaatkan untuk men-segmentasi, homogenitas region dan batas detail region-region. Dalam penelitian tersebut digunakan suatu dyadic square (blok-blok) untuk implementasi klasifikasi dengan ukuran window yang berbeda-beda. Diberikan suatu inisial square citra x dari n = 2 2 J pixel-pixel dengan ukuran 2 J x 2 J , blok didapatkan secara sederhana melalui pembagian secara rekursif citra ke dalam empat square subcitra dari ukuran yang sama seperti yang ditunjukkan dalam Gambar 2.
Gambar 2. (a) Citra dibagi ke dalam blok persegi d i j pada skala berbeda. Tiap blok dapat diasosiasikan dengan suatu subtree koefisien wavelet Haar (b) Struktur Quad-Tree dari Blok Persegi. Blok persegi d ρj −( i1) dibagi ke dalam empat blok child pada skala j. Dinotasikan suatu blok persegi pada skala j oleh d i j (dengan i suatu indeks abstrak enumerasi kotak-kotak pada skale ini). Pada dua tempat ayng ekstrem, d 00 (root of the tree) adalah inputan citra x, dan tiap d iJ (leaf of the tree) merupakan suatu piksel tunggal. Diberikan suatu random field citra X, blok persegi ini juga merupakan random field, yang dinotasikan dengan Di j . Melalui struktur seperti ini untuk merepresentasikan region-region, citra akan disegmentasi melalui pengestimasian label kelas c pada tiap blok persegi d i . Estimasi ini memerlukan suatu Model piksel PDF untuk tiap kelas yang disesuaikan pada blok persegi. Kebanyak citra dalam dunia nyata, khususnya citra teksture skala keabuan (gray-scale), dicirikan melalui struktur singularitasnya (edge dan ridge). Transformasi wavelet merupakan domain transformasi untuk A-329
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15 November 2014
ISSN: 1979-911X
pemodelan citra yang kaya akan singularitas. Transformasi wavelet dapat diinterpretasikan sebagai suatu detektor tepi multiskala yang merepresentasikan konten singularitas suatu citra pada multiple skala dan tiga orientasi yang berbeda-beda. Karakterisasi singularitas multiskal mmembuat domain wavelet alamiah untuk pemodelan citra bertekstur. Crouse (1998) membangun model hidden Markov tree (HMT), suatu model statistic parametrik untuk transformasi wavelet. Segmentasi citra menggunakan HMT terdiri dari tiga stuktur pohon (tree) yang terpisah yaitu : transformasi wavelet quad-tree, HMT dan pelabelan tree. Adapun algoritma HMTseg adalah sebagai berikut : 1. Dilatih wavelet-domain HMT model untuk tiap tekstur menggunakan homogenitas citra pelatihan . 2. Hitung likelihood multiskala. Dihitung dengan menggunakan algoritma penghitungan likelihood untuk model HMT (Crouse et al, 1998), hitung likelihood tiap blok persegi citra pada skala yang berbeda-beda. Kejadian (1) untuk tiap blok persegi hasil Maximum Likelihood (ML) klasifikasi j dasar c ML untuk suatu jangkauan skala j. 3. Gabungkan likelihood multiskala menggunakan pelabelan tree untuk bentuk klasifikasi MAP multiskala. Transformasi Wavelet Transformasi wavelet merepresentasikan singularitas konten suatu citra pada multipel skala. Dalam penelitian ini digunakan wavelet yang paling sederhana yaitu wavelet Haar. Kontruksi koefisien-koefisien wavelet Haar dari suatu citra dapat diterangkan menggunakan empat filter wavelet 2-D : Lokal smoother hLL , horisontal detektor tepi g LH , vertical edge detector g HL , diagonal detektor tepi g HH yang dituliskan sebagai bentuk matrik berikut ini :
hLL =
1⎞ 1 ⎛1 1⎞ 1 ⎛1 − 1⎞ 1⎛ 1 1 ⎛ 1 − 1⎞ ⎜⎜ ⎟⎟ , g HL = ⎜⎜ ⎟⎟ , g LH = ⎜⎜ ⎟⎟ , g HH = ⎜⎜ ⎟ 2 ⎝1 1⎠ 2 ⎝1 − 1⎠ 2 ⎝−1 −1 ⎠ 2 ⎝ − 1 1 ⎟⎠
untuk menghitung transformasi wavelet dari suatu citra diskrit X yang berukuran 2 J x 2 J , maka dilakukan dengan: 1. set u J [k , l ] = x[k , l ], 0 ≤ k , l ≤ 2 J − 1 2. Konvolusi u J dengan keempat filter di atas dan membuang setiap sampel yang lain dalam dua arah ke k dan l. Menghasilkan subband citra : u J −1 , wJLH−1 , wJHL−1 , wJHH −1 . Tiap subband citra tersebut berukuran 2 J −1 x 2 J −1 . 4-bagian dapat secara langsung dijadikan satu
kembali ke dalam suatu matrik 2 J x 2 J
⎡u J −1 wJHL−1 ⎤ ⎢ LH ⎥ HH ⎣⎢ wJ −1 wJ −1 ⎦⎥ 3. Proses filtering dan downsampling dapat dilanjutkan pada citra u J −1 dan prosedur diiterasi sampai waktu ke J. METODE PENELITIAN Metode yang digunakan dalam penelitian ini meliputi metode pustaka, observasi lapangan dan penelusuran referensi (browsing) yang berkaitan dengan penelitian yang dilakukan. Metode pustaka meliputi pengumpulan data dengan cara membandingkan dan membandingkan referensi yang berkaitan dengan penelitian yang dilakukan, berupa jurnal, buku, dan referensi yang berhubungan dengan penelitian ini. Observasi lapangan dilakukan untuk mengamati objek data yang diperlukan dalam hal ini adalah batik yang didapatkan dari pengrajin, pasar batik dan museum batik. Alat yang digunakan dalam penelitian ini meliputi: perangkat keras berupa laptop fujitsu, A-330
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15 November 2014
ISSN: 1979-911X
kamera digital, flasdisk dan modem. Perangkat lunak berupa sistem operasi windows xp 2, adope photoshop, matlab r.2008, microsoft office dan mozilla firefox. PEMBAHASAN Dalam penelitian ini ditampilkan segmentasi citra batik didasarkan pada representasi teknik segmentasi citra multiskala, dan diuji tampilannya secara analitik. Noise tekstur yang muncul dalam citra batik menimbulkan masalah dalam proses segmentasi. Kebanyakan citra batik diambil secara langsung dari bagian produksi dalam suatu industri batik, maka dari itu tidak terdapat ground truth hasil segmentasi dari citra batik ini, dan ini merupakan sesuatu hal yang sulit untuk secara manual menyediakan data pelatihan untuk segmentasi citra berdasarkan teknik terawasi (supervised). Dalam penelitian ini citra segmentasi multiskala yang dimaksud diasumsikan bahwa jumlah warna-warna yang berbeda dari citra batik inputan diketahui dan warna dominant dan fitur-fitur yang bersesuaian dengannya sebelumnya sudah didapatkan. Di sini diekstraksi dua warna yang dominan yaitu warna merah dan putih seperti terlihat dalam Gambar 3(a). Citra batik Jambi motif kapal sanggat dipergunakan dalam implementasi model wavelet hidden markov tree seperti yang diperlihatkan dalam Gambar 3(b). Citra batik ini merupakan hasil dari industri pabrikan (batik cap) sehingga dalam citra tersebut masih mengandung noise. Sedangkan dalam Gambar 3 (c) diperlihatkan koefisien wavelet haar dari citra batik motif kapal sanggat tersebut.
(a) (b) (c) Gambar 3.(a) Motif Bungo Cengkeh Batik Jambi, 3(b). Koefisien Wavelet Haar Motif Bungo, 3(c) Model Wavelet-HMT Motif Bungo Cengkeh Citra Batik Jambi Dalam penelitian ini untuk menerapkan algoritma HMT (Crouse et al, 1998) pada citra batik Jambi motif bungo cengkeh, beberapa blok homogen dari citra inputan dijadikan sebagai data pelatihan (training data), dan untuk tiap warna dominantsecara random dibagi ke dalam 8 blok 16 x 16. Sedangkan algoritma EM (Crouse at al, 1998) digunakan untuk mengestimasi parameter dari model HMT pada tiap warna yang dominan. Pada saat model dilatih pada blok dengan ukuran 16 x 16 , hasil segmentasi berupa blok-blok yang masih dominan bloknya. Dari sini maka dapat dilihat bahwa model wavelet-HMT sangat berguna bagi citra dengan tepi-tepi, sedangkan pada citra batik dari industri tekstil (pabrik) tepi-tepi tersebut seringkali hilang atau terdistorsi karena adanya noise tekstur yang muncul, sehinga pengulangan perhitungan likelihood dari sub blok citra diasumsikan bahwa blok-blok tersebut independen. Dari pengamatan hasil segmentasi visual maka dapat dilihat bahwa model wavelet-HMT untuk citra batik dari hasil pabrikan masih terdapat noise, hal ini bisa dilihat juga bahwa misklafikasi area warnanya besar, seperti terlihat dalam Gambar 3(c). KESIMPULAN Dari pembahasan di atas dapat diambil beberapa kesimpulan sebagai berikut: 1. Berbeda dengan citra alamiah, citra batik dari hasil pabrikan mempunyai properti yang berbeda-beda : secara umum terdapat beberapa warna dominan. 2. Struktur citra batik pabrikan mengandung noise sehingga menimbulkan permasalahan yang serius A-331
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15 November 2014
ISSN: 1979-911X
untuk menentukan metode segmentasi multiskala mana yang baik. 3. Telah diterapkan model segmentasi dengan menggunakan wavelet-HMT untuk citra batik hasil pabrikan dengan hasil segmentasi yang terlihat memuaskan.. DAFTAR PUSTAKA Lu, X, 2009, Multiscale Segmentation Techniques for Textile Images. College of Computer Science, Zhejiang University, Hangzhou, China. Bouman, C., Liu, B.,1991, Multiple resolution segmentation of textured images, IEEE Trans. On Pattern Analysis and Machine Intelligence, vol.13, no.2, pp. 99-113.. Bouman, C.A, Shapiro, M.,1994, A multiscale random field model for Bayesian image segmentation, IEEE Trans. On Image Processing, vol3., no.2 pp.162 -177. Cheng, H., Bouman, C.A.,2001,Multiscale Bayesian Segmentation Using a Trainable contextt model, IEEE Trans. On Image Processing, vol. 10, no.4, pp.511-525. Choi, H., Baraniu, R.G..,2001, Multiscale image segmentation using wavelet-domain hidden Markov models, IEEE Trans.On Image Processing, Vol.10, no.9, pp.1322-1331. Crouse, M.S., Nowak, R.D., Baraniu, R.G.., 1998, Wavelet-based statistical signal processing using hidden Markov models, IEEE Trans. On Signal Processing, vol.46, no.4, pp. 886-902. Fan, G. Xia, X.G..,2000, Maximum Likelihood texture analysis and classification using wavelet-domain hidden Markov models, Proc. Of 34th Asilomar Conference on Signals, Systems and Computers, Pacific Grove, CA. Crouse,M.S., Nowak, R.D., Baraniu, R.G. 1998. Wavelet-based statistical signal processing using hidden Markov models, IEEE Trans.On Signal Processing, vol.46, no.4, pp.866-902.
A-332