METODE FUZZY COLOR HISTOGRAM UNTUK TEMU KEMBALI CITRA BUNGA
Oleh: DINDA PUTRI BALQIS G64102056
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006
METODE FUZZY COLOR HISTOGRAM UNTUK TEMU KEMBALI CITRA BUNGA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Oleh: DINDA PUTRI BALQIS G64102056
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006
ABSTRAK
DINDA PUTRI BALQIS. Metode Fuzzy Color Histogram untuk Temu Kembali Citra Bunga. Dibimbing oleh YENI HERDIYENI dan MUSHTHOFA. Citra bunga memiliki bentuk dan warna yang sangat beragam. Hal ini menyebabkan sulitnya dilakukan pencarian citra bunga. Ekstraksi warna merupakan salah satu proses yang paling penting pada temu kembali berbasis citra. Penelitian ini akan mengimplementasikan metode fuzzy color histogram (FCH) untuk pengindeksan warna citra bunga. Penelitian ini mengembangkan penggabungan teknik fuzzy c-means (FCM) untuk FCH. Sebagai bahan perbandingan, penelitian juga menggunakan pendekatan FCH menggunakan fungsi Cauchy untuk menghasilkan matriks derajat keanggotaan. Penelitian ini juga membandingkan hasil temu kembali metode FCH dengan conventional color histogram (CCH). Evaluasi hasil temu kembali menggunakan rataan precision untuk tiap tingkat recall. Berdasarkan penelitian ini, metode FCH menggunakan FCM memiliki hasil temu kembali dengan rataan precision mencapai 73%, metode FCH dengan fungsi Cauchy memiliki rataan precision 72%, sedangkan pada CCH nilai rataan precision mencapai 70%. Kata Kunci: flower image retrieval, conventional color histogram, fuzzy color histogram, fuzzy cmeans, cauchy function.
Judul Nama NRP
: Metode Fuzzy Color Histogram untuk Temu Kembali Citra Bunga : Dinda Putri Balqis : G64102056
Menyetujui: Pembimbing I,
Pembimbing II,
Yeni Herdiyeni, S.Si., M.Kom. NIP 132 282 665
Mushthofa, S.Kom
Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Prof. Dr. Ir. Yonny Koesmaryono, MS NIP 131473999
Tanggal Lulus:
RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 29 November 1984 dari ayah Asyikin Solichin dan ibu Sri Hatmoko Meganingsih. Penulis merupakan putri kedua dari dua bersaudara. Tahun 2002 penulis lulus dari SMU Negeri 12 Jakarta dan pada tahun yang sama lulus seleksi masuk IPB melalui jalur Seleksi Penerimaan Mahasiswa Baru IPB. Penulis memilih Program Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Pada tahun 2005 Penulis menjalankan Praktik Lapangan (PL) di Badan Koordinasi Survei dan Pemetaan Nasional (BAKOSURTANAL) Cibinong selama kurang lebih dua bulan.
PRAKATA Alhamdulillahirabbil ‘alamin, puji syukur penulis panjatkan kepada Allah Subhanahu wa ta’ala atas segala curahan rahmat dan karunia-Nya, sehingga skripsi dengan judul Metode Fuzzy Color Histogram untuk Temu Kembali Citra Bunga dapat diselesaikan. Shalawat serta salam juga penulis sampaikan kepada junjungan kita Nabi Muhammad Shallalahu ‘alaihi wasallam beserta seluruh sahabat dan umatnya hingga akhir zaman. Penulis mengucapkan terima kasih kepada Ibu Yeni Herdiyeni, S.Si., M.Kom. dan Bapak Mushthofa, S.Kom selaku pembimbing I dan pembimbing II yang telah banyak memberi saran, masukan dan ide-ide kepada penulis serta kebersamaannya yang tidak bisa terlupakan. Penulis juga mengucapkan terima kasih kepada Bapak Firman Ardiansyah, S.Kom., M.Si. selaku penguji dan pembimbing akademik penulis pada tingkat 2 dan 3 yang telah memberi saran dan masukan. Selanjutnya, penulis ingin mengucapkan terima kasih kepada: 1 Ibu, Bapak dan Mas Nanda yang selalu memberikan dukungan, bimbingan dan kasih sayang. 2 Muqiet E.B. atas segalanya yang tidak bisa dijabarkan. 3 Yuni dan Ratih atas penginapan, printer, kebersamaan dan dukungannya. 4 Erna, Mulan, Ichoy atas hiburannya 5 Eden, Firman, dan teman-teman di Lab CI atas bantuannya menyelesaikan penelitian ini. 6 Ilkomerz 39 yang banyak membantu penulis pada masa perkuliahan. 7 Departemen Ilmu Komputer, dosen dan staf yang telah banyak membantu penulis pada masa perkuliahan dan penelitian. Penulis menyadari bahwa masih banyak kekurangan dalam penelitian ini. Oleh karena itu, kritik dan saran sangat penulis harapkan untuk perbaikan di masa mendatang. Penulis berharap hasil dari penelitian ini dapat bermanfaat dan dapat menjadi acuan bagi penelitian berikutnya.
Bogor, September 2006
Dinda Putri Balqis
DAFTAR ISI Halaman DAFTAR ISI .................................................................................................................................... v DAFTAR TABEL ........................................................................................................................... vi DAFTAR GAMBAR....................................................................................................................... vi DAFTAR LAMPIRAN.................................................................................................................... vi PENDAHULUAN ............................................................................................................................ 1 Latar Belakang ............................................................................................................................ 1 Tujuan ......................................................................................................................................... 1 Ruang Lingkup............................................................................................................................ 1 TINJAUAN PUSTAKA ................................................................................................................... 1 Temu Kembali Citra.................................................................................................................... 1 Ekstraksi Warna .......................................................................................................................... 1 Kuantisasi Warna ........................................................................................................................ 1 Histogram Warna ........................................................................................................................ 1 Fuzzy C-Means Clustering .......................................................................................................... 2 Fuzzy Color Histogram ............................................................................................................... 2 Fungsi Cauchy............................................................................................................................. 3 Ukuran Kesamaan ....................................................................................................................... 3 Recall dan Precision ................................................................................................................... 3 METODE PENELITIAN ................................................................................................................. 3 Data Penelitian ............................................................................................................................ 4 Segmentasi .................................................................................................................................. 4 Ekstraksi Ciri Warna dengan CCH ............................................................................................. 4 Ekstraksi Ciri Warna dengan FCH.............................................................................................. 4 Nilai warna kuantisasi dan histogram awal ........................................................................... 4 Nilai warna kuantisasi FCH................................................................................................... 4 Matriks derajat keanggotaan.................................................................................................. 5 Fuzzy color histogram ........................................................................................................... 5 Pengukuran Kesamaan ................................................................................................................ 5 Piranti Lunak dan Piranti Keras yang Digunakan ....................................................................... 6 HASIL DAN PEMBAHASAN......................................................................................................... 6 Segmentasi citra .......................................................................................................................... 6 Ekstraksi warna ........................................................................................................................... 6 KESIMPULAN DAN SARAN....................................................................................................... 11 Kesimpulan ............................................................................................................................... 11 Saran ......................................................................................................................................... 11 DAFTAR PUSTAKA ..................................................................................................................... 11 LAMPIRAN ................................................................................................................................... 13
DAFTAR TABEL Halaman 1 2 3 4 5
Nilai warna kuantisasi pada proses segmentasi........................................................................... 4 Nilai rataan precision dari hasil temu kembali menggunakan FCH dengan fungsi Cauchy ....... 9 Nilai recall-precision temu kembali citra menggunakan CCH ................................................. 10 Nilai recall-precision temu kembali citra menggunakan FCH dengan FCM............................ 10 Nilai recall-precision temu kembali citra menggunakan FCH dengan Cauchy dan σ = 15..... 11
DAFTAR GAMBAR Halaman 1 2 3 4 5 6 7 8 9 10 11
Fungsi Cauchy............................................................................................................................. 3 Skema kinerja sistem temu kembali citra.................................................................................... 3 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi pertama. ... 6 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi ketiga. ...... 6 Bunga Daffodil. ........................................................................................................................... 6 Hasil CCH. .................................................................................................................................. 7 Hasil FCH dengan fungsi Cauchy. .............................................................................................. 7 Hasil FCH dengan FCM.............................................................................................................. 8 Contoh hasil temu kembali citra.................................................................................................. 8 Contoh hasil temu kembali citra jika bunga pada citra kueri tidak ada dalam basis data............ 9 Nilai rataan precision temu kembali menggunakan FCH dengan fungsi Cauchy pada berbagai jumlah bin dan nilai σ................................................................................................. 10 12 Grafik recall precision temu kembali citra menggunakan CCH. .............................................. 10 13 Grafik recall precision temu kembali citra menggunakan FCH dengan FCM.......................... 10 14 Grafik recall precision temu kembali citra menggunakan FCH dengan fungsi Cauchy dan σ = 15 ........................................................................................................................................ 11
DAFTAR LAMPIRAN Halaman 1 Seluruh citra dalam basis data setelah melalui proses segmentasi ............................................ 14 2 Warna kuantisasi ....................................................................................................................... 17 3 Citra kueri ................................................................................................................................. 18
1
PENDAHULUAN Latar Belakang Seiring dengan perkembangan multimedia yang sangat pesat, jumlah koleksi data citra pun semakin bertambah. Sampai saat ini, dalam temu kembali informasi berbasis citra, pencarian data citra masih memiliki banyak masalah. Berbagai macam metode pencarian citra telah dikembangkan untuk mempermudah pencarian data. Pencarian citra dapat dilakukan berdasarkan warna, bentuk atau tekstur citra. Salah satu metode pencarian citra yang banyak dikembangkan adalah berdasarkan warna citra. Secara konvensional, warna direpresentasikan dengan perpaduan tiga warna primer. Perpaduan tiga warna tersebut dengan komposisi tertentu akan menghasilkan satu warna sekunder, seperti dinyatakan pada persamaan berikut: C = aC1 + bC2 + cC3, dengan C adalah warna sekunder yang merupakan kombinasi linear dari tiga warna primer (C1, C2, C3) dengan koefisien a, b, c pada tiap warna primer (Pitas 1993). Tiap warna sekunder memiliki kombinasi yang unik dari tiap warna primer. Dalam sistem warna RGB, pengolahan terhadap citra warna dilakukan pada tiap matriks warna primer secara terpisah. Representasi warna tersebut sering disebut dengan conventional color histogram (CCH). Adanya perbedaan penafsiran kuantisasi warna yang tidak menentu dan perbedaan persepsi manusia mengenai warna, maka representasi CCH memiliki kelemahan. Hal ini disebabkan karena CCH tidak mempertimbangkan persamaan warna pada bin yang berbeda dan perbedaan pada bin yang sama (Han J & Ma KK 2002). Dengan adanya kelemahan pada metode CCH, selanjutnya representasi CCH dimodifikasi dengan menggunakan teknik fuzzy Hasil modifikasi tersebut kemudian diberi nama metode fuzzy color histogram (FCH). Han J dan Ma KK (2002) telah menggunakan metode FCH untuk meng-ekstraksi ciri warna dengan menggunakan fuzzy c-means clustering (FCM) untuk mendapatkan matriks derajat keanggotaan. Zhang R dan Zhang Z (2004) menggunakan fungsi Cauchy untuk menghasilkan matriks derajat keanggotaannya. Berdasarkan beberapa hasil penelitian, metode FCH memberikan hasil pengenalan yang lebih baik dibandingkan dengan metode CCH. Oleh karena itu, pada penelitian ini akan
dikembangkan sebuah temu kembali citra bunga dengan menggunakan metode fuzzy color histogram. Relevansi antara citra kueri dengan citra dalam basis data ditentukan berdasarkan peringkat dari pengukuran kesamaan (similarity measurement). Tujuan Tujuan penelitian ini adalah mengimplementasikan metode fuzzy color histogram untuk temu kembali citra bunga dan membandingkan metode FCH menggunakan dua pendekatan, yakni FCM dan fungsi Cauchy serta metode CCH. Ruang Lingkup Ruang lingkup percobaan dibatasi pada objek utama citra fotografi bunga dengan latar belakang yang sederhana.
TINJAUAN PUSTAKA Temu Kembali Citra Penelitian mengenai temu kembali citra (image retrieval) mulai dikembangkan pada tahun 1970, dengan menggunakan teknik pelabelan citra, setiap citra diberi label dan pencarian dilakukan berdasarkan label tersebut (text retrieval). Pada saat ini telah banyak dikembangkan temu kembali citra didasarkan pada warna, bentuk, dan tekstur. Teknik ini biasa disebut dengan content based image retrieval (CBIR), (en.wikipedia.org 2006). Ekstraksi Warna Warna merupakan salah satu ciri citra yang paling sering digunakan pada penelitian content-based image retrieval (CBIR). Pengindeksan warna dan pencarian citra berdasarkan warna pada CBIR bisa dilakukan dengan pendekatan color histogram, namun pada penelitian ini akan digunakan fuzzy color histogram. Kuantisasi Warna Kuantisasi warna adalah pemetaan nilai input yang memiliki interval warna yang besar ke dalam nilai output yang memiliki interval warna yang terbatas (Gonzales et al 2004). Histogram Warna Histogram warna menyatakan frekuensi atau peluang keberadaan setiap warna dalam sebuah citra. Banyaknya nilai warna (bin) dapat ditetapkan sesuai kebutuhan pembuatan histogram. Histogram warna dapat dinyatakan sebagai berikut:
2
hi =
1 N
(l )
N
∑P j =1
i|j
4. Menghitung pusat cluster v i
,
n
⎧1 pixel ke - j terkuanti sasi bin ke - i Pi j = ⎨ lainnya ⎩0
histogram warna seperti ini disebut juga conventional color histogram (CCH), (Han J & Ma KK 2002). Fuzzy C-Means Clustering
c
J m (U ,V ; X ) = ∑∑ u ikm x k − vi
2
,
k =1 j =1
dengan x1, x2,..., xn adalah n vektor data. U = u ik adalah sebuah matriks c x n, uik menyatakan nilai keanggotaan ke-i dari sampel input ke-k, xk. Nilai-nilai keanggotaan tersebut memenuhi kondisi berikut:
0 ≤ u ik ≤ 1
, i = 1,2,..., c
∑u
, k = 1,2,..., n,
c
i =1
n
ik
=1
0 < ∑ u ik < n
=
k =1 n
m
xk
ik
∑ (u ) k =1
. m
ik
5. Perbaharui nilai keanggotaan U(l) dengan
uik
(l )
1
=
⎡ x −v ⎤ k i ⎥ − v j =1 ⎣ j ⎦ ⎢ k ⎥ c
Fuzzy c-means (FCM) adalah suatu teknik pengelompokan data (clustering) tanpa proses pelatihan (unsupervised learning). Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. Metode ini didasarkan pada minimisasi fungsi objektif dengan cara memperbaiki pusat cluster dan derajat keanggotaan setiap titik data secara berulang. Fungsi objektif tersebut adalah: n
vi
(l )
∑ (u )
, k = 1,2,..., n,
, i = 1,2,..., c.
k =1
V = {v1 , v 2 ,..., v c } adalah pusat cluster dan m ∈ (1,0) adalah konstanta pembobot. merupakan Fungsi objektif Jm(U,V) penjumlahan dari kuadrat jarak Euclidean antara masing-masing sampel input dan pusat cluster yang sesuai dengan sampel tersebut, dengan jarak terboboti oleh nilai keanggotaan. Output FCM adalah sejumlah pusat cluster dengan derajat keanggotaan setiap titik data terhadap cluster tersebut. Algoritma FCM adalah sebagai berikut (Han J & Ma KK 2002): 1. Input jumlah cluster c, konstanta pembobot m, toleransi nilai error. 2. Inisialisasi pusat cluster vi, untuk 1 ≤ i ≤ c. 3. Data input X = {x1, x2, x3,...,xn}.
dengan
∑⎢ x
2 m −1
i=1,2,...,c. k=1,2,...,n.
Fuzzy Color Histogram Warna merupakan salah satu ciri yang paling fundamental untuk mendiskriminasikan citra. Representasi warna dapat memberikan beragam informasi. CCH dalam representasi warna tidak mempertimbangkan persamaan warna pada bin yang berbeda dan perbedaan pada bin yang sama. Pada CCH, bisa terjadi dua warna yang berbeda diperlakukan sama sehingga kedua warna tersebut dimasukkan ke dalam satu bin histogram. Karena hal tersebut, CCH menjadi sangat sensitif terhadap interfensi noise seperti perubahan iluminasi dan kesalahan kuantisasi. Adanya perbedaan penafsiran dan persepsi manusia mengenai warna, menyebabkan CCH tidak mampu mengatasi perbedaan tersebut. Untuk mengatasi hal tersebut, dibuatlah fuzzy color histogram yang mempertimbangkan persamaan warna pada tiap piksel warna yang terasosiasikan ke semua bin histogram melalui fuzzy set membership function. Pada FCH, satu warna dapat masuk ke dalam dua bin histogram atau lebih dengan derajat keanggotaan yang berbeda tentunya. Tiap warna direpresentasikan dengan himpunan fuzzy (fuzzy set). Hubungan antara warna dimodelkan dengan fungsi keanggotaan (membership function) terhadap fuzzy set. Fuzzy set F pada ruang ciri Rn didefinisikan oleh μF : Rn → [0, 1] yang biasa disebut membership function. Untuk tiap vektor ciri f ∈ R , nilai n
( )
dari μ F f disebut derajat keanggotaan dari f terhadap fuzzy set F (derajat keanggotaan F). Nilai μ F f yang mendekati 1 lebih representatif terhadap vektor ciri f terhadap fuzzy set F (Zhang R & Zhang Z 2004).
( )
3
Fungsi Cauchy Fungsi Cauchy merupakan suatu fungsi keanggotaan. Berdasarkan hasil penelitian sebelumnya fungsi Cauchy lebih baik dari pada cone dan trapezoidal function. Fungsi Cauchy,
C : R n → [0,1] didefinisikan sebagai berikut
(Zhang R & Zhang Z 2004):
r C (x ) =
1 , α v v 1+ ( x − v d)
relevan yang ditemukembalikan terhadap jumlah materi yang relevan, sedangkan precision adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang ditemukembalikan. Average precision adalah suatu ukuran evaluasi yang diperoleh dengan menghitung rata-rata tingkat precision pada berbagai tingkat recall (Grossman D 2002). recall =
dengan r v∈R, d ,α ∈ R , d > 0 dan α ≥ 0 , r v adalah titik tengah dari lokasi fuzzy set, d merepresentasikan lebar dari fungsi dan α menentukan kehalusan dari fungsi. Secara bersamaan, d dan α mendeskripsikan tingkat fuzziness (kekaburan). Pada Gambar 1 diilustrasikan fungsi Cauchy dalam R (0-255) dengan v = 128, d = 15 dan α = 0.7; 1; 1.3; 1.5; 1.7; 2.
precision =
jumlah citra relevan yang terambil jumlah citra relevan dlm basis data
jumlah citra relevan yang terambil jumlah seluruh citra yang terambil
Kelemahan dari pengukuran precision recall adalah ketidakmampuan untuk menilai mana yang lebih baik antara dua buah grafik yang saling menyilang dan seimbang. Untuk mengatasi hal tersebut dilakukan pengukuran kinerja sistem yang mampu menentukan titiktitik optimal. Penentuan titik-titik optimal antara variabel precision dan recall, dapat dilakukan dengan interpolated precision. Penggunaan interpolated precision adalah pengoptimalan precision dengan cara interpolasi nilai precision pada setiap nilai recall. Recall yang digunakan adalah standard recall level.
METODE PENELITIAN Metode penelitian ini akan dibagi menjadi empat tahap yaitu: (1) preprocessing, (2) ekstraksi ciri, (3) temu kembali citra dan (4) evaluasi. Untuk lebih jelasnya, dapat dilihat pada skema kinerja temu kembali citra (Gambar 2). Basis data citra
Gambar 1 Fungsi Cauchy.
Segmentasi citra
Ukuran Kesamaan Ukuran kesamaan antara citra a dan b dirumuskan dengan formula:
d a ,b =
∑ [ fch
Indeks warna citra basis data
(i ) − fchb (i )] , 2
B
i =1
Ekstraksi cirri warna dengan FCH/CCH
a
dengan fch adalah hasil ekstraksi warna dengan menggunakan FCH dan B adalah jumlah bin histogram. Recall dan Precision Dua parameter utama yang dapat digunakan untuk menentukan keefektifan penemukembalian adalah recall dan precision. Recall adalah perbandingan jumlah materi
pengguna
Citra kueri
Hasil kueri
Pengukuran kesamaan
Segmentasi citra
Ekstraksi cirri warna dengan FCH/CCH
Gambar 2 Skema kinerja sistem temu kembali citra.
4
Data Penelitian Data yang digunakan sebanyak 360 citra bunga dalam berbagai jenis yang diambil dari www.flowers.vg. Format citra adalah JPEG berukuran 50x50 piksel dengan latar belakang yang sederhana. Segmentasi Tahap preprocessing dalam penelitian ini adalah melakukan segmentasi seluruh citra untuk mendapatkan wilayah yang menjadi perhatian utama. Segmentasi dilakukan secara otomatis dengan beberapa parameter kuantisasi yang berbeda. Tahapan berikut:
segmentasi
dijelaskan
sebagai
1. Mengkuantisasi warna piksel. Parameter kuantisasi pertama menggunakan warna hitam, merah, hijau, dan biru. Parameter kuantisasi kedua menggunakan warna hitam, merah, hijau, biru, dan putih. Parameter kuantisasi ketiga menggunakan warna hitam, cyan, magenta, dan kuning. Parameter kuantisasi keempat menggunakan warna hitam, cyan, magenta, kuning, dan putih, untuk lebih jelasnya dapat dilihat pada Tabel 1. Kuantisasi ini berguna untuk mengurangi jumlah warna pada citra dan untuk memastikan bahwa variasi warna objek dapat klasifikasikan menurut warna yang sama secara penampakannya (Ardiansyah 2002). 2. Menghitung jumlah piksel tiap warna kuantisasi pada 20x20 piksel pusat citra., dua warna kuantisasi yang memiliki jumlah piksel diatas 70 kecuali warna hitam diambil kemudian seluruh piksel dengan warna kuantisasi tersebut menjadi objek citra yang menjadi perhatian utama. 3. Membuat citra biner. Piksel dengan nilai 1 merupakan daerah bunga pada citra, sedangkan 0 adalah daerah yang tidak diperhitungkan. Tabel 1 Nilai warna kuantisasi pada proses segmentasi Seg 2 Seg 3 Seg 4 Seg 1 000 000 000 000 255 0 0 255 0 0 0 255 255 0 255 255 0 255 0 0 255 0 255 0 255 255 0 255 0 0 255 0 0 255 255 255 0 255 255 0 255 255 255 255 255 255 Kemudian dilakukan pemilihan keempat hasil segmentasi tersebut secara manual. Pada proses ini, beberapa citra masih terdapat sedikit latar belakangnya. Namun hal ini tidak banyak
mempengaruhi kinerja sistem karena bagian latar belakang yang terambil pada umumnya masih termasuk bagian dari warna bunga. Seluruh hasil segmentasi citra dalam basis data dapat dilihat pada Lampiran 1. Ekstraksi Ciri Warna dengan CCH Pada penelitian ini, dilakukan ekstraksi warna menggunakan CCH sebagai pembanding terhadap metode FCH untuk menghasilkan suatu temu kembali citra bunga yang baik. Warna kuantisasi untuk penghitungan CCH menggunakan nilai warna kuantisasi dan jumlah bin yang sama dengan FCH. Ekstraksi Ciri Warna dengan FCH Proses ekstrakasi warna dengan FCH ini tidak terlalu beragam hasilnya pada perbedaan ruang warna (RGB, HSV, Lab) (Vertan C & Boujemaa N 2000). Oleh karena itu, pengolahan citra dilakukan pada ruang warna RGB untuk mempermudah pengolahan citra. 1 Nilai warna kuantisasi dan histogram awal Untuk menghitung FCH, langkah pertama yang dilakukan adalah penghitungan histogram awal. Pada penelitian ini, nilai warna kuantisasi awal tersebut didasarkan pada sebaran warna bunga dalam basis data yang memiliki 37 kelas bunga dengan jenis dan warna yang bervariasi. Untuk tiap kelas bunga diambil sepuluh warna piksel yang muncul terbanyak sehingga dihasilkan 370 warna tanpa ada warna yang sama. Kemudian dilakukan penghitungan histogram awal dengan memetakan tiap pixel yang ditemukan ke dalam 370 warna yang telah ditentukan tersebut. Histogram tersebut menghasilkan jumlah ciri yang terlalu banyak sehingga menyebabkan komputasi yang besar untuk pengenalan pola suatu citra. Dengan demikian, akan dikalikan dengan matriks derajat keanggotaan yang akan meng-hasilkan nilai ciri yang cenderung sedikit bergantung pada jumlah bin histogram yang akan ditentukan. 2 Nilai warna kuantisasi FCH Pengelompokkan warna dilakukan untuk mengklasifikasikan distribusi warna dari seluruh bunga dalam basis data yang telah dihasilkan pada proses sebelumnya kedalam beberapa warna kuantisasi dengan jumlah yang berbeda dengan menggunakan Fuzzy C-Means Clustering (FCM). Pada FCM setiap cluster merepresentasikan bin FCH. Beberapa jumlah kuantisasi warna yang digunakan adalah 10, 15,
5
20, 25 dan 30 (Lampiran 2). Hal ini bertujuan untuk mencari kuantisasi yang optimal dengan jumlah yang sedikit namun peka terhadap kesalahan kuantisasi. 3 Matriks derajat keanggotaan Untuk penghitungan FCH, diperlukan matriks derajat keanggotaan yang dapat diperoleh menggunakan: a. Fuzzy C-Means Clustering Nilai keanggotaan tiap piksel terhadap tiap bin FCH direpresentasikan dengan nilai keanggotaan tiap kuantisasi awal n terhadap pusat cluster n’ yang dihasilkan oleh FCM. Tiap elemen mij dalam matriks derajat keanggotaan adalah nilai keanggotaan kuantisasi awal nj terhadap bin warna ni’ (bin FCH) yang jumlahnya lebih sedikit (n’<
μ c ' (c ) =
1
1 + (d (c' , c) σ )
α
,
dengan d(c’,c) = jarak Euclid antara warna c dgn c’. c’ = warna pada bin FCH. c = semesta warna (universe color). α = digunakan untuk menentukan bentuk atau kehalusan dari fungsi σ = untuk menentukan lebar dari fungsi keanggotaan nilai parameter α = 2 diperoleh dari hasil beberapa percobaan yang dianggap paling baik. Selanjutnya penghitungan FCH dengan pengambilan derajat keanggotaan menggunakan FCM ini disebut sebagai FCH dengan fungsi Cauchy.
Matriks
derajat keanggotaan ini, M = [mij ] n '×n hanya dihitung sekali untuk tiap FCH dengan jumlah bin tertentu dan menghasilkan matriks n’ x n dengan n’ adalah jumlah bin histogram FCH. Matriks derajat keanggotaan diilustrasikan sebagai berikut:
⎡ μ c '1 (c1 ) μ c '1 (c 2 ) ⎢ μ (c ) μ (c ) c '2 2 ⎢ c '2 1 ⎢ M M ⎢ ⎣ μ c ' n' (c1 ) μ c ' n' (c 2 )
L μ c '1 (c n ) ⎤ L μ c '2 (c n ) ⎥⎥ ⎥ O M ⎥ L μ c n' (c n ) ⎦
4 Fuzzy color histogram Model warna fuzzy ini memungkinkan pembesaran pengaruh warna yang diberikan ke warna lainnya (Ruofei Zhang dan Zhongfei Zhang 2004). Pada FCH, setiap warna C yang ditemukan pada citra akan mempengaruhi seluruh kuantisasi warna berdasarkan kemiripan warna dengan warna C tersebut. Hal ini dapat dinotasikan dengan:
h2 (c ' ) = ∑ μ c ' (c ) *h(c) c∈μ
dengan = fuzzy color histogram h2 h(c) = conventional color histogram µc’(c) = nilai keanggotaan dari warna c ke warna c’ Pada penghitungan FCH dengan FCM, hasil kali dari matriks derajat keanggotaan dengan histogram awal sudah menghasilkan matriks FCH tanpa perlu dilakukan normalisasi, Di lain pihak, pada penghitungan FCH dengan fungsi Cauchy dilakukan normalisasi dengan formula:
fch(c' ) =
h2 (c' ) . max c '∈μ h2 (c' )
Dengan demikian, nilai yang dihasilkan akan berkisar antara 0 dan 1. Pengukuran Kesamaan Citra yang digunakan sebagai kueri berjumlah 37 (Lampiran 3) yang diambil dari tiap kelas bunga dan memiliki 5 sampai 18 citra yang relevan dalam basis data. Citra yang relevan ditentukan secara manual dengan memilih bunga dalam basis data yang sejenis dan warna yang sama dengan bunga pada citra kueri. Temu kembali citra dibatasi sampai 30 citra teratas. Nilai kesamaan antar citra dihitung menggunakan persamaan jarak Euclid. Untuk perbandingan keefektifan temu kembali dibuat
6
grafik recall-precision dari masing-masing proses. Piranti Lunak dan Piranti Keras yang Digunakan Piranti lunak yang digunakan pada penelitian ini adalah Matlab 7.0 dan sistem operasi Windows XP Home Edition SP 1, sedangkan spesifikasi piranti keras yang mendukung adalah komputer dengan processor Pentium III 800 MHz dan memori 256 MB.
Ekstraksi warna Pada penelitian ini, dilakukan ekstraksi warna menggunakan CCH dengan nilai warna kuantisasi yang sama dengan FCH. Hasil dari ekstraksi warna dengan menggunakan CCH adalah sebagai berikut:
Gambar 5 Bunga Daffodil.
HASIL DAN PEMBAHASAN Segmentasi citra Parameter kuantisasi yang berbeda menghasilkan wilayah objek utama yang berbeda sehingga dilakukan pemilihan keempat cara segmentasi yang telah dipaparkan. Hal ini bertujuan untuk mendapatkan objek utama citra yang paling baik dengan cara yang sederhana karena fokus dari penelitian ini adalah pada proses ekstraksi ciri warna yang tidak dipengaruhi oleh proses segmentasi.
(a) CCH dengan 10 bin
(b) CCH dengan 15 bin
Gambar 3 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi pertama.
(c) CCH dengan 20 bin
Gambar 4 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi ketiga.
(d) CCH dengan 25 bin
7
(e) CCH dengan 30 bin
(c) FCH dengan Cauchy dengan 20 bin
Gambar 6 Hasil CCH. Gambar 6 adalah hasil CCH dari Gambar 5. Berdasarkan Gambar 6(a), dapat dilihat bahwa bin 1 yang cenderung berwarna ungu merupakan warna yang paling banyak muncul pada bunga daffodil yang berwarna kuning. Sementara itu, warna pada bin 6 yang cenderung berwarna kuning justru memiliki pengaruh yang lebih sedikit. Hal ini merupakan suatu kesalahan kuantisasi yang sering terjadi pada CCH sebagaimana juga terjadi pada histogram yang lain dengan jumlah bin histogram yang berbeda. Kesalahan kuantisasi ini diperbaiki oleh kedua model FCH yang dapat dilihat pada Gambar 7 dan Gambar 8.
(d) FCH dengan Cauchy dengan 25 bin
(e) FCH dengan Cauchy dengan 30 bin Gambar 7 Hasil FCH dengan fungsi Cauchy.
(a) FCH dengan Cauchy dengan 10 bin
Gambar 7 adalah hasil FCH dengan fungsi Cauchy dari Gambar 5. Pada Gambar 7(a), bin 6 yang cenderung berwarna kuning memiliki nilai yang paling tinggi, sedangkan pada bin 1 yang berwarna ungu hanya memiliki sedikit pengaruh. Hal ini memperbaiki hasil CCH sebelumnya dan juga terjadi pada setiap jumlah bin yang berbeda. Selain FCH dengan fungsi Cauchy, pendekatan menggunakan FCH dengan FCM juga memperbaiki kesalahan kuantisasi tersebut (Gambar 8). Gambar 8 adalah hasil FCH dengan FCM dari Gambar 5.
(b) FCH dengan Cauchy dengan 15 bin
(a) FCH dengan FCM dengan 10 bin
8
(b) FCH dengan FCM dengan 15 bin (a) Hasil temu kembali dengan CCH (25 bin)
(c) FCH dengan FCM dengan 20 bin
(b) Hasil temu kembali menggunakan FCH dengan fungsi Cauchy (25 bin)
(d) FCH dengan FCM dengan 25 bin
(e) FCH dengan FCM dengan 30 bin Gambar 8 Hasil FCH dengan FCM.
Temu kembali citra Selain dapat mengatasi kesalahan kuantisasi, kedua metode FCH juga dapat memberikan hasil yang lebih baik pada sistem temu kembali citra seperti dapat dilihat pada Gambar 9.
(c) Hasil temu kembali menggunakan FCH dengan FCM (25 bin) Gambar 9 Contoh hasil temu kembali citra. Pada Gambar 9(a), citra kueri pada contoh temu kembali tersebut berasal dari basis data sehingga hasil temu kembali citra menggunakan CCH masih terlihat cukup baik meskipun tiga citra lainnya yang relevan dalam basis data tidak ditemukembalikan sampai 30 citra teratas. Namun jika jenis dan warna bunga pada kueri citra tidak ada dalam basis data citra, CCH tidak mampu untuk menemukembalikan bunga dengan warna yang hampir sama dengan kueri citra (Gambar 10).
9
ada beberapa bunga yang berbeda sekali masih terambil, sedangkan pada FCH dengan fungsi Cauchy hanya empat bunga yang sama sekali berbeda, bunga pada peringkat 19, 22, 26 dan 29. Evaluasi untuk menentukan keefektifan temu kembali citra pada setiap metode ekstraksi ciri warna digunakan recall dan precision. Nilai recall yang digunakan adalah 0 sampai 1. Nilai ini menunjukkan jumlah bagian citra dari seluruh citra relevan dalam basis data untuk penghitungan nilai precision. (a) Hasil temu kembali dengan CCH (25 bin)
Beberapa percobaan dilakukan untuk menentukan fungsi Cauchy yang optimal dengan derajat keanggotaan yang mampu memberikan hasil temu kembali yang baik. Pada Tabel 2 dapat dilihat rataan precision dari hasil temu kembali menggunakan FCH dengan fungsi Cauchy dan α = 2. Tabel 2 Nilai rataan precision dari hasil temu kembali menggunakan FCH dengan fungsi Cauchy Jumlah bin histogram
(b) Hasil temu kembali menggunakan FCH dengan FCM (25 bin)
10
15
20
(c) Hasil temu kembali menggunakan FCH dengan fungsi Cauchy (25 bin) Gambar 10 Contoh hasil temu kembali citra jika bunga pada citra kueri tidak ada dalam basis data. Kedua FCH memberikan hasil temu kembali yang secara perseptual mendekati bunga pada kueri. Pada CCH, bunga yang ditemukembalikan cenderung berwarna putih, berbeda sekali dengan warna bunga pada citra kueri, sedangkan pada FCH dengan FCM dapat mengambil citra yang memiliki warna yang hampir sama dengan citra pada kueri meskipun
25
30
nilai σ
rataan precision
10 15 20 25 30 10 15 20 25 30 10 15 20 25 30 10 15 20 25 30 10
0,62375 0,6311 0,62399 0,63807 0,63544 0,66245 0,67477 0,66927 0,67095 0,66986 0,68747 0,69181 0,69192 0,68928 0,68213 0,71401 0,72117 0,7169 0,70387 0,69096 0,70591
15
0,70425
20
0,69987
25
0,69473
30
0,68433
10
0,74 0,72
1 0,9
0,7 0,68
0,8
0,66 0,64
0,58 0,56 10 15 20 25 30 10 15 20 25 30 10 15 20 25 30 10 15 20 25 30 10 15 20 25 30 10 bin
15 bin
20 bin
25 bin
precision
0,7
0,62 0,6
30 bin
10 bin
15 bin
20 bin
25 bin
30 bin
1 0,9518 0,82291 0,70313 0,62298 0,52271 0,39549 0,30662 0,2396 0,20934 0,16488 0,53995
1 0,95967 0,89305 0,80683 0,75756 0,63451 0,57427 0,49614 0,32473 0,29055 0,22139 0,63261
1 0,95946 0,89656 0,81222 0,78772 0,70239 0,58501 0,50474 0,34835 0,30785 0,20511 0,64631
1 0,94294 0,89109 0,86844 0,84296 0,79181 0,70271 0,62851 0,37256 0,38007 0,28662 0,7007
1 0,93604 0,92194 0,87543 0,85743 0,80208 0,71285 0,59452 0,39704 0,38933 0,25342 0,70364
Pada hasil temu kembali menggunakan CCH, dapat diperhatikan bahwa pada setiap kenaikan jumlah bin histogram terjadi kenaikan rataan nilai precision. Recall dan precision dari temu kembali dengan CCH cukup tinggi walaupun hanya 10 sampai 30 bin histogram, hal ini karena kuantisasi yang diperoleh adalah dari sebaran warna seluruh kelas bunga dalam basis data bunga.
0,1 0 0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
recall 10 bin
15 bin
20 bin
25 bin
30 bin
Gambar 12 Grafik recall precision temu kembali citra menggunakan CCH. Tabel 4 Nilai recall-precision temu kembali citra menggunakan FCH dengan FCM 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 rataan
10 bin
15 bin
20 bin
25 bin
30 bin
1 0,96847 0,84667 0,77237 0,7331 0,57076 0,43689 0,3278 0,25881 0,20708 0,16156 0,57123
1 0,93581 0,87558 0,83427 0,81015 0,66224 0,6302 0,54519 0,39198 0,36588 0,25514 0,66422
1 0,9471 0,8922 0,84607 0,82579 0,75474 0,70521 0,60627 0,43299 0,434 0,32439 0,70625
1 0,93874 0,91715 0,87909 0,84956 0,7926 0,7383 0,64036 0,47224 0,46003 0,35117 0,73084
1 0,93659 0,90573 0,86558 0,84663 0,80059 0,75316 0,6369 0,49271 0,46668 0,32253 0,72974
1 0,9 0,8 0,7 precisi on
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 rataan
0,4
0,2
Gambar 11 Nilai rataan precision temu kembali menggunakan FCH dengan fungsi Cauchy pada berbagai jumlah bin dan nilai σ.
Tabel 3 Nilai recall-precision temu kembali citra menggunakan CCH
0,5
0,3
rataan precision
Hasil percobaan menunjukkan bahwa pada saat jumlah bin 25 dihasilkan nilai rataan precision yang paling baik untuk berbagai nilai σ. Kuantisasi optimal pada FCH dengan menggunakan fungsi Cauchy terdapat pada jumlah bin 25 dan σ = 15. Pada jumlah bin 30, nilai rataan precision cenderung menurun namun masih lebih tinggi dibandingkan nilai rataan precision pada jumlah bin di bawah 25 pada tiap-tiap nilai σ yang sama.
0,6
0,6 0,5 0,4 0,3 0,2 0,1 0 0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
recall 10 bin
15 bin
20 bin
25 bin
30 bin
Gambar 13 Grafik recall precision temu kembali citra menggunakan FCH dengan FCM.
11
Tabel 5 Nilai recall-precision temu kembali citra menggunakan FCH dengan Cauchy dan σ = 15 10 bin 15 bin 20 bin 1 1 1 0,9343 0,9222 0,9162 0,8590 0,8921 0,8697 0,7868 0,8378 0,8213 0,7317 0,7735 0,8046 0,6448 0,70997 0,72539 0,5728 0,6383 0,6674 0,4837 0,5581 0,5767 0,3593 0,4394 0,4758 0,3427 0,4109 0,4639 0,227 0,2402 0,2890
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
rataan 0,6311
0,6748
25 bin 1 0,9269 0,8856 0,8774 0,8363 0,76372 0,7157 0,6439 0,5145 0,4716 0,2972
30 bin 1 0,9257 0,8724 0,8393 0,8161 0,74475 0,7131 0,6197 0,4879 0,4440 0,2838
0,7212
0,7043
0,6918
1 0,9 0,8
KESIMPULAN DAN SARAN Kesimpulan Penelitian ini telah mengimplementasikan sistem temu kembali citra untuk citra bunga berdasarkan warna dengan menggunakan teknik histogram warna. Penelitian ini mengembangkan penggabungan teknik FCM untuk FCH. Berdasarkan penelitian ini, metode FCH menggunakan FCM memiliki hasil temu kembali dengan rataan precision mencapai 73%, metode FCH dengan fungsi Cauchy memiliki rataan precision 72%, sedangkan pada CCH nilai rataan precision mencapai 70%. Saran
0,7 precision
pengaruh warna yang berulang. Dapat diperhatikan pada jumlah bin 25 nilai rataan precision-nya cenderung lebih tinggi dibandingkan nilai rataan precision pada jumlah bin 30.
0,6 0,5 0,4 0,3 0,2 0,1 0 0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
recall 10 bin
15 bin
20 bin
25 bin
Sistem temu kembali citra khususnya pada citra bunga tidak cukup hanya dengan menggunakan indeks warna saja karena bentuk dan tekstur bunga juga sangat beragam. Berdasarkan penelitian, untuk memperbaiki hasil temu kembali diperlukan informasi lain selain warna seperti bentuk dan tekstur. Oleh karena itu, diperlukan penelitian lebih lanjut mengenai sistem temu kembali citra.
30 bin
Gambar 14 Grafik recall precision temu kembali citra menggunakan FCH dengan fungsi Cauchy dan σ = 15. Berdasarkan Tabel 2, Tabel 3, dan Tabel 4, nilai precision pada bin = 10 cenderung selalu lebih rendah dibandingkan dengan nilai precision pada bin yang lain. Hal ini disebabkan nilai kuantisasi yang belum cukup merepresentasikan warna yang muncul pada seluruh bunga dalam basis data. Berdasarkan Gambar 12, Gambar 13, dan Gambar 14, nilai recall 0,8 dan 0,9 cenderung stabil. Penurunan nilai precision terjadi pada nilai recall 1 karena banyak kueri citra yang tidak menemukan seluruh citra yang relevan dalam basis data citra. Pada FCH, kuantisasi optimal terdapat pada jumlah bin 25, setelah jumlah bin tersebut, nilai recall dan precision menurun. Hal ini disebabkan karena semakin banyak jumlah bin makin banyak kemungkinan warna yang berdekatan sehingga memberikan informasi
DAFTAR PUSTAKA Ardiansyah F. 2002. Segmentasi Automatisasi Objek pada Citra Fotografi untuk Temu Kembali. Departmen Ilmu Komputer, Institut Pertanian Bogor. Bogor. Gonzales RC et al. 2004. Digital Image Processing Using Matlab. Pearson Prentice Hall, New Jersey. Grossman D. IR Book. www.ir.iit.edu/~dagr/ cs529/files/ir_book/ [7 Maret 2002]. Han J & Ma KK, Fuzzy Color Histogram and Its Use in Color Image Retrieval. IEEE Transaction on Image Processing, vol. 11, no. 8, 2002. Pitas I. 1993. Digital Image Processing Algorithms. Prentice Hall. United Kingdom Vertan C & Boujemaa N. 2000. Using Fuzzy Histogram and Distances for Color Image Retrieval. Challenge of Image Retrieval, Brighton.
12
Wikipedia. 2006. Content Based Image Retrieval. en.wikipedia.org. [10 Januari 2006]. 2006. Color Quantization. Wikipedia. en.wikipedia.org. [10 Januari 2006]. Zhang R & Zhang Z, A Robust Color Object Analysis Approach to Efficient Image Retrieval. EURASIP Journal on Applied Signal Processing, 6, 2004, 871-885.
LAMPIRAN
14
Lampiran 1. Seluruh citra dalam basis data setelah melalui proses segmentasi
15
16
17
Lampiran 2. Warna kuantisasi 10 bin histogram warna R G B 156 108 144 203 139 238 240 81 101 204 200 194 227 218 225 223 203 38 202 30 23 193 168 160 220 132 8 237 140 180 15 bin histogram warna R G B 202 27 19 232 221 228 157 114 159 241 140 189 217 191 20 217 25 129 222 128 5 233 220 177 227 215 87 192 163 166 184 203 240 204 136 240 248 92 91 161 86 88 200 196 192
20 bin histogram warna R G B 227 216 93 155 112 157 206 34 24 247 115 136 216 147 248 183 165 142 191 15 10 184 205 242 243 143 192 234 220 180 161 84 87 250 91 87 223 127 3 217 23 129 233 222 228 195 165 176 201 199 194 187 121 228 215 176 18 226 216 28
25 bin historam warna R G B 218 191 9 160 80 86 216 21 128 224 127 2 227 217 93 228 221 29 251 93 86 189 123 231 244 69 115 217 148 249 241 151 161 215 172 22 194 162 173 180 125 41 204 182 185 163 118 166 190 208 243 203 202 196 202 26 18 149 107 148 234 223 229 236 220 181 242 93 183 162 189 215 187 169 141
30 bin histogram warna R G B 226 134 3 252 120 133 219 114 2 216 21 128 190 172 141 217 148 249 215 175 20 188 122 230 229 220 48 236 221 181 226 217 94 245 68 115 163 85 89 244 143 193 202 26 18 167 147 136 157 112 159 161 189 215 182 130 43 219 197 8 198 123 91 200 201 195 225 213 220 203 182 185 223 156 155 187 207 245 236 226 231 149 59 78 193 161 174 251 92 86
18
Lampiran 3. Citra kueri
Kueri01 CR = 5
Kueri02 CR = 9
Kueri03 CR = 11
Kueri04 CR = 10
Kueri05 CR = 10
Kueri06 CR = 7
Kueri07 CR = 9
Kueri08 CR = 7
Kueri09 CR = 8
Kueri10 CR = 9
Kueri11 CR = 6
Kueri12 CR = 6
Kueri13 CR = 9
Kueri14 CR = 6
Kueri15 CR = 10
Kueri16 CR = 8
Kueri17 CR = 14
Kueri18 CR = 6
Kueri19 CR = 11
Kueri20 CR = 11
Kueri21 CR = 11
Kueri22 CR = 11
Kueri23 CR = 7
Kueri24 CR = 10
Kueri25 CR = 6
Kueri26 CR = 11
Kueri27 CR = 14
Kueri28 CR = 14
Kueri29 CR = 8
Kueri30 CR= 10
Kueri31 CR = 18
Kueri32 CR = 18
Kueri33 CR =10
Kueri34 CR = 10
Kueri35 CR = 10
19
Kueri36 CR = 10 Keterangan : CR : Citra Relevan.
Kueri37 CR = 13