CBIR BERDASARKAN EKSTRAKSI FITUR WARNA MENGGUNAKAN JAVA
Agus Sumarna
[email protected] Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Gunadarma, Margonda Raya 100 Depok 16424 telp (021) 78881112, 7863788
ABSTRAKSI Teknik pencarian citra berbasis teks yang ada saat ini belum dapat digunakan untuk merepresentasikan citra yang kita cari didalam sebuah database citra, sehingga seringkali diperoleh hasil pencarian citra yang tidak sesuai dengan yang diinginkan karena kita harus mengetahui kata kunci yang tepat sesuai dengan nama file citra untuk memperoleh citra yang kita inginkan. Untuk mengatasi masalah pencarian citra tersebut, salah satu solusinya adalah dengan menggunakan CBIR. Content-Based Image Retrieval (CBIR) atau temu kembali citra yaitu suatu metode pencarian citra dengan melakukan perbandingan antara fitur citra queri dengan fitur citra yang ada di database (Query by Example). Metode CBIR yang sering digunakan adalah pencarian berdasarkan kemiripan fitur warna, bentuk, dan tekstur. Sedangkan untuk menghitung kemiripan fitur warna tersebut menggunakan metode Euclidean distance. Atas dasar itulah penulis terdorong untuk melakukan penelitian dan pembuatan aplikasi pencarian citra berdasarkan ekstraksi fitur warna dengan menggunakan 2 tipe histogram yaitu Global Color Histogram(GCHs), dan Local Color Histogram(LCHs). Sehingga bisa dilihat perbandingan hasil pencarian menggunakan metode GCHs dengan hasil pencarian menggunakan metode LCHs ataupun menggunakan kedua tipe histogram tersebut. Sehingga mendapatkan hasil pencarian citra berbasis warna yang lebih akurat. Kata kunci : CBIR, Global Color Histogram, Local Color Histogram, Euclidean.
ABSTRACT Text-based image retrieval techniques that exist today can not be used to represent the image that we seek in an image database, which is often obtained by the image search results that are not desirable, because we must know the right keywords in accordance with the image file name to obtain the image we want. To overcome the problem of image retrieval, one solution is to use CBIR. Content-Based Image Retrieval (CBIR) or image retrieval is an image retrieval method by doing a comparison between the query image features with image features that exist in the database (Query by Example). CBIR method is often used similarity search based on color features, shape, and texture. As for calculating the similarity of color features using Euclidean distance. On this basis the author are encouraged to conduct research and manufacture of image search application based on color feature extraction using 2 types of histograms of the Global Color Histogram (GCHs), and Local Color Histogram (LCHs). So that it can be seen
comparing the search results using the method GCHs with the search results using the method LCHs or use both types of these histograms. So get a color-based image search results more accurate. Keywords: CBIR, Global Color Histogram, Local Color Histogram, Euclidean.
PENDAHULUAN Kebutuhan informasi dalam bentuk citra sangat berkembang pesat seiring dengan bertambahnya koleksi citra yang ada didalam database citra berskala besar. Informasi citra tersebut banyak dibutuhkan diberbagai bidang. Seperti bidang perdagangan untuk katalog barang, kepolisian untuk pelacakan tindak kriminalitas melalui citra wajah atau sidik jari, kedokteran untuk citra hasil rongent, dan masih banyak lagi pemanfaatan informasi dalam bentuk citra di bidang yang lainnya. Teknik pencarian citra berbasis teks yang ada saat ini belum dapat digunakan untuk merepresentasikan citra yang kita cari didalam sebuah database citra, sehingga seringkali diperoleh hasil pencarian citra yang tidak sesuai dengan yang diinginkan karena kita harus mengetahui kata kunci yang tepat sesuai dengan nama file citra untuk memperoleh citra yang kita inginkan. Untuk mengatasi masalah pencarian citra tersebut, salah satu solusinya adalah dengan menggunakan Content-Based Image Retrieval (CBIR) atau temu kembali citra yaitu suatu metode pencarian citra dengan melakukan perbandingan antara fitur citra kueri dengan fitur citra yang ada di database (Query by Example). Metode CBIR yang sering digunakan adalah pencarian berdasarkan kemiripan fitur warna, bentuk, dan tekstur [4]. Dalam CBIR terdapat banyak metode pencarian citra. Salah satu metode yang dipakai adalah pencarian citra berdasarkan ekstraksi fitur warna. Dalam CBIR berbasis warna yang dilihat bukan kemiripan dari citra, melainkan kemiripan dari sebaran warna pada citra yang diperbandingkan. Secara umum untuk CBIR berbasis warna dikenal metode histogram warna. Histogram warna memiliki 2 tipe yaitu Global Color Histograms (GCHs) dan Local Color Histograms (LCHs) [5]. Saat ini penelitian mengenai CBIR berbasis warna dengan metode histogram warna masih terbuka luas. Atas dasar itulah penulis terdorong untuk melakukan penelitian dan pembuatan aplikasi pencarian citra berdasarkan ekstraksi fitur warna dengan menggunakan 2 tipe histogram. Sehingga bisa dilihat perbandingan hasil pencarian menggunakan metode
GCHs dengan hasil pencarian menggunakan metode LCHs ataupun menggunakan kedua tipe histogram tersebut. Sehingga mendapatkan hasil pencarian citra berbasis warna yang lebih akurat. METODE PENELITIAN Metode penelitian yang dilakukan terdiri dari beberapa tahap:
Analisa dan Studi Literatur Mengindentifikasi masalah, mengumpulkan dan menganalisis informasi-informasi baik dari artikel situs web, Jurnal, dan buku-buku yang berhubungan dengan teoriteori
dasar
tentang
Content-Based
Image
Retrieval,
histogram
warna,
pemrograman Java, Netbeans, database Derby, dan tutorial JfreeChart untuk menampilkan histogram.
Perancangan Pada tahap ini dirancang sistem retrival citra dengan menggunakan bahasa pemrograman Java, dan editor Netbeans. Tahap ini juga meliputi coding, perancangan user interface, dan merancang database yang digunakan.
Implementasi dan Evaluasi Pada tahap ini dilakukan pengujian pada program untuk melihat hasil dari pencarian citra. Semua hasil yang diperoleh pada tahap pengujian akan dievaluasi. Hasil evaluasi ini akan diambil kesimpulan yang merupakan jawaban atas permasalahan CBIR.
TINJAUAN PUSTAKA Content-Base Image Retrieval. Content-Based Image Retrieval (CBIR) atau temu kembali citra adalah metode yang digunakan untuk melakukan pencarian citra digital pada suatu database citra. Yang dimaksud dengan "Content-Based" di sini adalah : objek yang dianalisa dalam proses pencarian itu adalah actual contents (kandungan aktual) sebuah citra. Istilah konten pada konteks ini merujuk pada warna, bentuk, tekstur, atau informasi lain yang didapatkan dari citra tersebut. Proses umum dari CBIR adalah pada citra yang menjadi query dilakukan proses ekstraksi fitur (image contents), begitu halnya dengan citra yang ada pada basis data citra
juga dilakukan proses seperti pada citra query. Parameter fitur citra yang dapat digunakan untuk retrieval pada system ini dapat berupa histogram, susunan warna, teksture, dan shape, tipe spesifik dari objek, tipe event tertentu, nama individu, lokasi, emosi [4]. Awalnya teknik yang dipakai bukan mencari fitur citra melainkan berdasarkan penambahan deskripsi mengenai citra dalam bentuk teks. Dengan kata lain pertama citra diberi teks berdasarkan citra tersebut kemudian dilakukan pencarian berdasarkan teks (text based) mengunakan sistem database manajemen tradisional. Namun karena pembangkitan teks secara otomatis, mengenai deskripsi spektrum citra, secara detail sulit untuk dilakukan kebanyakan aplikasi text-based image retrieval saat itu melakukan pemberian teks deskripsi citra secara manual. Penelitian dan pengembangan image retrieval dimulai pada sekitar 1970-an. Pada tahun 1979, sebuah konferensi mengenai Database Tehcniques for Pictorial Application diadakan di Florida. Sejak itu aplikasi dalam melakukan manajemen database citra menarik perhatian para peneliti.
Gambar 1. Diagram Arsitektur CBIR (Torres, 2006).
Dalam diagram diatas. Dapat dilihat bahwa CBIR dibagi menjadi 3 bagian yaitu : bagian interface, bagian Query Processing Module, dan bagian Image Database. Untuk penjelasanya adalah sebagai berikut :
1. Bagian pertama adalah interface yang merupakan bagian untuk interaksi antara pengguna dengan sistem CBIR melalui aplikasi GUI (Graphical User Interface). Sedangkan didalamnya terdapat sub bagian :
Data Insertion yang digunakan user untuk memasukan citra yang akan di ekstraksi.
Query Specification untuk menentukan citra yang akan dijadikan citra query serta menentukan metode ekstraksi fitur. Dalam penelitian ini, penulis menggunakan metode ekstraksi local color histogram dan global color histogram.
Visualization untuk menampilkan citra query dan citra hasil pencarian.
2. Bagian kedua adalah Query-processing module. Sedangkan didalamnya terdapat sub bagian :
feature vector extraction yang digunakan untuk mengekstraksi baik citra yang ada didatabase citra maupun citra query.
Similarity Computation digunakan untuk menghitung kesamaan fitur citra.
Ranking
digunakan untuk mengurutkan citra yang memiliki tingkat
kemiripan dengan citra query. 3. Bagian ketiga adalah Image Database. Sedangkan didalamnya terdapat sub bagian
Feature Vectors yang digunakan untuk menyimpan hasil ekstraksi fitur citra. Dan disimpan didalam database derby.
Images merupakan database citra yang secara fisik berupa folder yang didalamnya terdapat kumpulan citra.
Tipe Histogram Citra Histogram warna terdiri dari dua tipe, Global Color Histograms (GCHs) dan Local Color Histograms (LCHs). Pada penggunaan GCH, distribusi warna global suatu citra diambil dan digunakan sebagai metada. Jika pengguna mencari citra dengan yang dalam sistem databasenya hanya memperhatikan distribusi warna global suatu citra, memang, GCH adalah pilihan terbaik. Walaupun demikian, karena GCH hanya mengambil distribusi warna global suatu citra sebagai pertimbangan untuk membandingkan citra, ini bisa mengembalikan hasil yang tidak sesuai dengan persepsi visual.
Misalkan ada tiga citra yang telah dikuantisasi menjadi tiga warna: hitam, abu-abu, dan putih (citra 4.3). Misalkan citra A adalah query image, sedangkan citra B dan C adalah citra-citra dalam database.
Citra A
Citra B
Citra C
Gambar 2. Tiga citra yang terkuantisasi menjadi 3 warna Dibawah ini adalah tabel rincian Global Color Histogram dari 3 citra diatas yaitu “image A”, “image B”, dan “Image C” : Tabel 1. GCHs Citra A, B, dan C Citra
Hitam
Abu-abu
Putih
A
37.5%
37.5%
25%
B
31.25%
37.5%
31.25%
C
37.5%
37.5%
25%
Sedangkan Distribusi warna (GCH) tiga citra diatas adalah seperti pada tabel. Maka, jarak antara citra A dengan citra B dan C adalah : d(A,B) = |0.375 - 0.3125| + |0.375 - 0.375| + |0.25-0.3125| = 0.125 d(A,C) = |0.375 - 0.375| + |0.375 - 0.375| + |0.25 - 0.25| = 0 Dari hasil pembandingan, citra C ternyata ditemukan lebih mirip daripada citra B (karena jarak C lebih kecil). Padahal, sesuai dengan persepsi, yang lebih mirip dengan citra A sebenarnya adalah citra B. Global Color Histogram merepresentasikan keseluruhan bagian citra dengan satu histogram. Sedangkan Local Color Histogram membagi citra menjadi beberapa bagian dan kemudian mengambil histogram warna tiap bagian tadi. LCH memang berisi lebih banyak informasi tentang citra, namun metode ini membutuhkan lebih banyak proses komputasi [6].
PEMBAHASAN Data Citra Dalam penelitian ini menggunakan citra sebagai objek penelitian. Berikut adalah rincian citra yang penulis gunakan : 1. Menggunakan citra berwarna RGB. 2. Format citra yang digunakan adalah format JPEG, JPG, PNG, dan GIF. 3. Dimensi citra berbeda-beda, namun citra disesuaikan ukuran dimensinya (sekitar 200 x 180) agar lebih cepat dalam pemrosesan citra. 4. Jumlah citra 30 citra yang dibagi menjadi 3 kategori. Pengelompokan Citra Dalam penelitian ini, penulis mengelompokan citra kedalam 3 (tiga) yaitu : 1. Kategori citra binatang : 10 buah. 2. Kategori citra bunga mawar : 10 buah. 3. Kategori citra mobil bus : 10 buah.
Gambar 3. Kategori Binatang
Gambar 4. Kategori Bunga Mawar
Gambar 5. Kategori Mobil Bus
Implementasi Rancangan Aplikasi Desktop Berikut penulis akan menjelaskan mengenai tampilan yang terdapat pada aplikasi desktop dan fungsi dari menu-menu yang terdapat pada aplikasi. Tampilan Menu Utama
Gambar 6. Menu Utama Aplikasi
Hasil Uji Coba Hasil Pencarian Pada Kategori Citra Binatang
Gambar 12 Hasil Query LCHs Pada Kategori Binatang
Gambar 13 Hasil Query GCHs Pada Kategori Binatang
Gambar 14 Hasil Query GCHs+LCHs Pada Kategori Binatang
Tabel 2. Hasil Pencarian Pada Kategori Binatang
No
Nama Metode
Jumlah
Waktu Pencarian
Citra
(Detik)
1
Local Color Histogram (LCHs)
6
0
2
Global Color Histogram (GCHs)
4
0
3
LCHs + GCHs
4
1
Sedangkan tabel 3 dibawah ini merupakan rincian dari hasil pencarian citra menggunakan metode Local Color Histogram (LCHs) dengan menggunakan citra bus pada kategori binatang. Pada tabel dibawah terdapat data citra query, jarak Euclidean, dan histogram dari masing-masing citra. Jarak Euclidean dan susunan citra sudah terurut berdasarkan nilai jarak Euclidean. Hasil Pencarian Pada Kategori Citra Mawar
Gambar 15 Hasil Query LCHs Pada Kategori Bunga Mawar
Gambar 16 Hasil Query GCHs Pada Kategori Bunga Mawar
Gambar 17 Hasil Query GCHs+LCHs Pada Kategori Bunga Mawar Tabel 4 Hasil Pencarian Pada Kategori Bunga Mawar
No
Nama Metode
Jumlah
Waktu Pencarian
Citra
(Detik)
1
Local Color Histogram (LCHs)
9
0
2
Global Color Histogram (GCHs)
5
0
3
LCHs + GCHs
5
0
Hasil Pencarian Pada Kategori Citra Bus
Gambar 18. Hasil Query LCHs Pada Kategori Bus
Gambar 19. Hasil Query GCHs Pada Kategori Bus
Gambar 20. Hasil Query GCHs Pada Kategori Bus
Tabel 5 Hasil Pencarian Pada Kategori Binatang
No
Nama Metode
Jumlah
Waktu Pencarian
Citra
(Detik)
1
Local Color Histogram (LCHs)
6
0
2
Global Color Histogram (GCHs)
9
3
3
LCHs + GCHs
6
0
Hasil Pencarian Pada Semua Kategori
Gambar 21. Hasil Query LCHs Pada Semua Kategori
Gambar 22. Hasil Query GCHs Pada Semua Kategori
Gambar 23. Hasil Query GCHs+LCHs Pada Semua Kategori
Tabel 6. Hasil Pencarian Pada Semua Kategori
No
Nama Metode
Jumlah
Waktu Pencarian
Citra
(Detik)
1
Local Color Histogram (LCHs)
21
1
2
Global Color Histogram (GCHs)
18
0
3
LCHs + GCHs
15
1
PENUTUP Kesimpulan Setelah melalui serangkaian ujicoba dan analisis, dapat ditarik beberapa kesimpulan dari proses CBIR berdasarkan ekstraksi fitur warna yaitu metode Local Color Histogram, menghasilkan citra hasil pencarian yang jumlahnya banyak secara kuantitas, dan hasil pencariannya terpegaruh oleh citra geometri misalnya citra yang dirotasi. Sehingga tidak efektif secara kualitas. karena ada citra yang penyebaran warnanya jauh namun tetap ditampilkan sebagai hasil pencarian. Sedangkan metode Global Color Histogram, menghasilkan citra hasil pencarian yang lebih sedikit secara kuantitatif dibandingkan dengan hasil pencarian Local Color Histogram, dan hasil pencariannya tidak terpengaruhi oleh citra geometri. Sehingga lebih efektif karena hanya menampilkan citra yang mempunyai penyebaran warna yang mirip dengan citra query nya. Saran Aplikasi CBIR ini masih terdapat kekurangan, terutama saat melakukan query citra. Karena jika query citra yang ada didatabase citra ukuranya atau dimensinya terlalu besar, maka aplikasi CBIR akan berhenti melakukan query atau terjadi error. Oleh karena itu untuk pengembangan kedepannya harus diadakan proses resize atau perubahan ukuran citra database, agar proses query bisa berjalan lebih cepat.
DAFTAR PUSTAKA
[1]
Ariesto H.S, Fajar Masya, “Pemrograman Berorientasi Objek dengan Java”, Graha Ilmu : Jakarta, 2004.
[2]
Herry Suharto, dkk, “Pemrograman GUI Swing Java dengan Netbeans 5”, Penerbit Andi : Yogyakarta, 2006.
[3]
Rafael C.Gonzales, Paul Wintz, “Second Edition : Digital Image Processing”, AddisonWesley Publishing Company, 1987.
[4]
Sagarmay Deb, “Multimedia Systems and Content-Base Image Retrieval”, Idea Group Publishing, 2004.
[5]
Shengjiu Wang, “A Robust CBIR Approach Using Local Color Histograms,” Department of Computer Science, University of Alberta, Edmonton, Alberta, Canada, Tech. Rep. TR 01-13, October 2001.
[6]
YanuWidodo,http://ilmukomputer.org/wp-content/uploads/2009/10/yanuwid-cbir.pdf, “Penggunaan Color Histogram Dalam Image Retrieval”, 12 Juni 2010.
[7]
______, http://www.java2s.com/Tutorial/Java/0340_Database/Connectto Derbydatabase.htm, “Connect to Derby database”, 27 Juli 2010
[8]
_______, http://www.the-crankshaft.info/2010/07/content-based-image-retrievalquery.html, “Content-Based Image Retrieval Query Paradigms” , 30 Juli 2010