BAB 2
LANDASAN TEORI
Pada bab landasan teori ini akan diuraikan mengenai teori-teori yang terkait dengan Content Based Image Retrieval, ekstraksi fitur, Operator Sobel, deteksi warna HSV, precision dan recall serta beberapa penelitian terdahulu yang relevan.
2.1
Content Based Image Retrieval
Content Based Image Retrieval (CBIR) adalah proses pemanggilan citra dari database atau tempat penyimpanan citra digital lainnya sesuai dengan konten citra tersebut (Chaudari,2012). Dalam CBIR fitur citra dibagi menjadi tiga fitur yaitu warna, tekstur dan bentuk. Fitur warna adalah fitur yang umum digunakan dalam CBIR karena pencarian informasi pada citra berbasis fitur warna lebih mudah dilakukan. Menurut Hastuti, et al. (2009) penelitian tentang CBIR berdasarkan primitif fitur sudah banyak dilakukan diantaranya Swain dan Ballard pada tahun 1991 menggunakan teknik pencocokan titik potong histogram, kemudian Stricker dan Orengo pada tahun 1995 mengembangkan teknik sebelumnya menjadi histogram kumulatif dari warna, kemudian Stricker dan Dimai pada tahun 1996 menggabungkan titik potong histogram dengan beberapa elemen spasial, kemudian Carson pada tahun 1997 menggunakan teknik pemisahan fitur citra query berdasarkan warna. Tahap awal dalam sistem pemanggilan citra berdasarkan konten adalah melakukan proses ekstraksi dan deskripsi pada citra dalam database sehingga menghasilkan vektor fitur. Vektor fitur citra dalam database akan membentuk fitur database. Setelah itu dilakukan proses ekstraksi dan deskripsi pada citra query yang di-input-kan oleh pengguna. Hasil proses ekstraksi akan membentuk vektor fitur. Kemudian dilakukan Similarity Comparison, yaitu mengukur jarak kesamaan antara
Universitas Sumatera Utara
8
vektor fitur citra query dengan vektor fitur citra dalam database. Jarak kesamaan vektor fitur antara citra query dengan citra dalam database akan diurutkan. Citra dengan jarak kesamaan vektor fitur tertinggi akan di tampilkan sebagai output (Long, et al. 2003). Diagram sistem pemanggilan citra berdasarkan konten dapat dilihat pada Gambar 2.1. Umpan Balik Yang Berkaitan input (pengguna)
Citra Query
Ekstraksi & Deskripsi
Vektor Fitur
Citra Similarity Comparison Citra Dalam Database
Ekstraksi & Deskripsi Citra
Vektor Fitur Pengurutan & Pemanggilan citra output
Hasil Pemanggilan citra
Gambar 2.1. Diagram Sistem Content Based Image Retrieval Sumber: Long, et al. 2003
Proses paling penting pada sistem CBIR adalah ekstraksi fitur, karena hasil dari proses ini akan diketahui perbedaan pada setiap citra berdasarkan fiturnya seperti fitur tekstur, bentuk dan warna. Suatu citra memiliki fitur yang berbeda antara citra satu dengan lainnya tergantung pada karakteristik yang menonjol pada citra tersebut. Sebagai contoh dalam dunia nyata, bunga mawar dan bunga melati dapat dibedakan melalui perbedaan warnanya, kertas dan kain dapat dibedakan dari teksturnya, kemudian gambar segitiga dan persegi dapat dibedakan melalui bentuknya.
Universitas Sumatera Utara
9
Menurut Syarif (2014), masing-masing fitur dari citra tersebut didapatkan melalui proses ekstraksi fitur yang tidak mudah, karena satu citra dapat mempunyai multiple feature. Proses ekstraksi fitur yang baik dan benar dapat menentukan keberhasilan dalam membangun suatu aplikasi citra digital.
2.2
Ekstraksi Fitur
Ekstraksi fitur merupakan proses pengindeksan suatu database citra dengan isinya. Secara matematik, setiap ekstraksi fitur merupakan encode dari vektor n dimensi yang disebut dengan vektor fitur. Komponen vektor fitur dihitung dengan proses citra dan teknik analisis serta digunakan untuk membandingkan citra yang satu dengan citra yang lain. Ekstraksi fitur diklasifikasikan kedalam 3 jenis yaitu low level, middle level dan high level. Fitur low level merupakan ekstraksi fitur berdasarkan isi visual seperti warna dan tekstur, fitur middle level merupakan ekstraksi fitur berdasarkan wilayah citra yang ditentukan dengan segmentasi, sedangkan fitur high level merupakan ekstraksi fitur berdasarkan informasi semantik yang terkandung dalam citra (Kusumaningsih, 2009). Menurut Acharya (2005), warna merupakan salah satu fitur visual yang digunakan dalam Content Based Image Retrieval (CBIR). Warna sangat baik jika digunakan untuk temu kembali citra karena memiliki hubungan yang sangat kuat dengan objek dalam sebuah citra dan melatarbelakangi gabungan background, skala, orientasi, perspektif dan ukuran suatu citra. Bentuk dapat didefenisikan sebagai gambaran dari suatu objek dalam posisi, orientasi, dan ukuran. Fitur bentuk dalam suatu citra sangat esensial untuk segmentasi citra karena dapat mendeteksi objek atau batas wilayah. Sedangkan tekstur merupakan fitur citra yang sangat menarik digunakan untuk menentukan karakterisasi suatu citra dengan aplikasi CBIR. Hal ini dikarenakan, tekstur mengandung informasi penting mengenai susunan struktur permukaan suatu citra.
Universitas Sumatera Utara
10
2.2.1 Ekstraksi Fitur Bentuk
Bentuk merupakan salah satu fitur citra yang dapat digunakan untuk mendeteksi objek atau batas wilayah. Proses mendapatkan nilai fitur bentuk dapat dimulai dengan konversi citra RGB menjadi citra grayscale. Hal ini berfungsi untuk mendapatkan nilai warna yang lebih sederhana. Dimana warna grayscale hanya mempunyai intensitas warna 0 – 255 untuk setiap pikselnya. Proses yang digunakan untuk mendapatkan citra grayscale dilakukan dengan mencari nilai rata-rata dari total nilai RGB. Persamaan yang digunakan untuk mendapatkan nilai grayscale dapat dilihat pada persamaan berikut.
G=
r+g+b 3
............................................... (2.1)
Dimana G merupakan nilai grayscale, r merupakan nilai red setiap piksel, g merupakan nilai green pada setiap piksel dan b merupakan nilai blue pada setiap piksel. Setelah nilai grayscale ditemukan maka dilakukan deteksi tepi. Deteksi tepi pada suatu citra adalah suatu proses yang menghasilkan tepi dari objek citra yang membatasi dua wilayah citra homogen yang memiliki tingkat kecerahan yang berbeda. Proses deteksi tepi ini dilakukan sebelum proses ekstraksi fitur bentuk untuk meningkatkan penampakan garis batas suatu daerah atau objek didalam citra dan mendapatkan bentuk dasar citra. Metode untuk deteksi tepi yang digunakan pada penelitian ini adalah Operator Sobel. Operator Sobel menggunakan dua buah matriks konvolusi berukuran 3x3, dimana matriks konvolusi pertama digunakan untuk menentukan gradien pada arah sumbu x dan matriks konvolusi kedua digunakan untuk menentukan gradien pada arah sumbu y. Hasil konvolusi pada arah sumbu x terhadap citra grayscale dinyatakan dengan Gx dan hasil konvolusi pada arah sumbu y terhadap citra grayscale dinyatakan dengan Gy. Hasil Operator Sobel merupakan magnitudo dari gradien yang dapat dihitung dengan persamaan 2.4 atau persamaan 2.5. Sebuah piksel akan dianggap sebagai tepi (bernilai 1) jika nilai magnitudonya lebih besar dari nilai threshold yang ditetapkan.
Universitas Sumatera Utara
11
Teknik threshold yang digunakan adalah Single Global Threshold, dimana segmentasi dilakukan dengan cara mendeteksi citra piksel per piksel dan melabelkan tiap piksel sebagai objek atau background tergantung pada tingkat keabuan dari piksel tersebut. Selanjutnya dilakukan ekstraksi fitur bentuk menggunakan metode Integral Proyeksi. Integral Proyeksi adalah suatu metode yang digunakan untuk mendeteksi batas dari daerah citra. Integral proyeksi disebut juga dengan integral baris dan kolom dari piksel, karena integral proyeksi dilakukan dengan cara menjumlahkan piksel per baris dan piksel per kolom. Nilai integral proyeksi dapat dihitung menggunakan persamaan berikut. h j = h i =
N baris i=1
x(i,j) ........................................ (2.2)
N kolom j=1
x(i,j) ....................................... (2.3)
Hasil perhitungan Integral Proyeksi akan disusun dalam bentuk vektor sebagai defenisi fitur bentuk citra yang diamati. Cara yang sama dilakukan pada setiap citra dan kemudian vektor fitur bentuk dari setiap citra disimpan dalam database.
2.2.2 Ekstraksi Fitur Warna
Warna yang terlihat adalah spektrum cahaya yang dipantulkan oleh benda yang kemudian ditangkap oleh indra penglihatan mata lalu diterjemahkan oleh otak sebagai sebuah warna tertentu. Gonzales,et al (2004) menyampaikan beberapa model warna yang dikenal di dalam pengolahan citra, yakni NTSC, YIQ, RGB, YCbCr, HSV, CMY, CMYK, HSI. Ruang warna National Television Systems Committee (NTSC) digunakan pada televisi. Keuntungan format ini adalah informasi tingkat keabuan dipisahkan dari data warna, sehingga sinyal yang sama dapat digunakan untuk televisi monokrom dan berwarna. Dalam format NTSC, data citra terdiri dari tiga komponen yakni luma (Y), in-phase (I) dan quadrature (Q). Selanjutnya, model warna RGB digunakan pada monitor yang terdiri dari warna merah (red), hijau (green) dan biru (blue). Ketiga warna ini disebut sebagai warna primer.
Universitas Sumatera Utara
12
Ruang warna YCbCr digunakan secara luas di dalam video digital. Dalam format ini, informasi luminance direpresentasikan dengan komponen Y dan informasi warna disimpan sebagai komponen color-difference, Cb dan Cr. Komponen Cb merupakan perbedaan antara komponen biru dengan sebuah nilai referensi. Komponen Cr merupakan perbedaan komponen merah dengan sebuah nilai referensi. Model warna HSV merupakan model warna yang mendefinisikan warna berdasarkan terminologi Hue, Saturation dan Value. Hue digunakan untuk membedakan warnawarna dan menentukan kemerahan (redness), kehijauan (greenness) dari cahaya. Saturation menyatakan tingkat kemurnian suatu warna dan Value menyatakan banyaknya cahaya yang diterima mata tanpa memperdulikan warna (Rakhmawati, 2013). Ruang warna CMY merupakan singkatan dari Cyan, Magenta dan Yellow. Warna CMY biasanya digunakan untuk percetakan, warna CMY pada dasarnya masih memantulkan sedikit warna – warna RGB. Warna Cyan memantulkan warna Red, warna Magenta memantulkan warna Green dan warna Yellow memantulkan warna Blue. Sebagian gelombang cahaya yang tidak diinginkan terkadang masih dipantulkan sehingga menyebabkan kesalahan warna. Pantulan yang tidak diinginkan disebut hue error. Untuk menyiasatinya maka ditambahkan warna black yang disebut key dalam warna CMYK agar tiap komponen warna menjadi lebih pekat dan tidak memantulkan hue error tersebut. Model warna RGB dan CMY sangat cocok untuk implementasi perangkat keras, namun keduanya tidak cocok untuk mendeskripsikan warna berdasarkan interpretasi manusia. Ruang warna HSI (Hue, Saturation, Intensity) menghasilkan warna yang lebih natural dibandingkan RGB dan CMY. Pada penelitian ini digunakan ruang warna HSV untuk ekstraksi fitur warna, hal ini disebabkan ruang warna HSV dapat memilah warna dalam citra seperti penglihatan mata manusia sehingga dapat mengenali warna citra dengan baik. Proses untuk mendapatkan nilai fitur warna dapat dimulai dengan konversi citra RGB menjadi citra HSV. Persamaan untuk melakukan konversi citra RGB menjadi citra HSV dapat dihitung menggunakan persamaan 2.9. sampai dengan persamaan 2.11.
Universitas Sumatera Utara
13
Sebelum melakukan konversi RGB ke HSV diperlukan normalisasi RGB terlebih dahulu dengan persamaan 2.6 sampai dengan persamaan 2.8. Setelah nilai normalisasi RGB selesai, maka dapat dilakukan konversi citra RGB menjadi citra HSV. Informasi penting mengenai konten citra dapat diketahui dengan membuat histogram citra. Histogram citra adalah grafik yang menggambarkan penyebaran nilainilai intensitas piksel dari suatu atau bagian tertentu di dalam citra. Dari sebuah histogram dapat diketahui frekuensi kemunculan nisbi dari intensitas pada citra tersebut. Histogram juga dapat menunjukkan banyak hal tentang kecerahan (brightness) dan kontras dari sebuah citra. Jika digambarkan pada koordinat kartesian maka sumbu X (absis) histogram menunjukkan tingkat warna dan sumbu Y (ordinat) histogram menunjukkan frekuensi kemunculan. Histogram warna sangat efektif mengkarakterisasikan distribusi global dari warna dalam sebuah citra (Sutoyo, 2009). Ekstraksi fitur warna dilakukan dengan menggunakan histogram warna konvensional. Ruang warna yang digunakan adalah ruang warna HSV(hue, saturation, value). Proses untuk mendapatkan nilai fitur warna dimulai dengan konversi warna RGB ke HSV menggunakan persamaan 2.9 sampai dengan persamaan 2.11. Pada proses komputasi kemungkinan kombinasi warna yang besar akan menghabiskan banyak waktu (time consuming). Masalah tersebut dapat diatasi dengan kuantisasi warna (color quantization), yaitu suatu prosedur untuk mengurangi kemungkinan jumlah warna. Dengan cara ini jumlah warna yang besar dapat dikurangi, sehingga proses yang dilakukan semakin mudah. Pada penelitian ini, komponen hue dikuantisasi menjadi 18 bagian, saturation dikuantisasi menjadi 3 bagian dan value dikuantisasi menjadi 3 bagian. Kombinasi dari seluruh komponen warna HSV sebanyak 162 bagian dimana tiap kombinasi kuantisasi warna disimpan sebagai elemen vektor fitur. Tiap elemen vektor fitur disebut bin.
Universitas Sumatera Utara
14
Setelah dilakukan kuantisasi warna maka dilakukan normalisasi histogram agar citra yang memiliki kesamaan distribusi warna dengan ukuran citra yang berbeda tetap memiliki histogram yang sama. Hasil kuantisasi dinormalisasi dalam rentang nilai 0 sampai 1. Hasil proses normalisasi akan disusun dalam bentuk vektor sebagai defenisi fitur warna citra yang diamati. Histogram yang diperoleh disebut histogram HSV-162 bin. Nilai elemen histogram menyatakan normalisasi jumlah piksel citra yang masuk ke dalam bin yang sesuai. Histogram HSV-162 bin merepresentasikan vektor fitur warna citra. Cara yang sama dilakukan pada setiap citra dan kemudian vektor fitur citra dari setiap citra disimpan dalam database.
2.3
Operator Sobel
Filter citra adalah program yang menerapkan metode atau algoritma tertentu di dalam sebuah citra. Filter Sobel adalah termasuk filter citra. Filter Sobel merupakan algoritma Sobel Edge Detection di dalam citra. Operasi filter ini akan bekerja mendeteksi semua piksel citra, mencari batasan warna antara piksel didalam citra. Batasan warna yang dimaksud disini adalah perbedaan nilai warna di tepi antara kelompok warna satu dengan yang lain. Selisih perbedaan nilai warna ini yang kemudian akan dipertimbangkan sebagai piksel-piksel tepi. Kumpulan piksel ini akan membentuk suatu garis (edge). Di dalam operasi filter Sobel tidak hanya memperhitungkan nilai warna dari piksel yang diperiksa, akan tetapi juga memperhitungkan nilai piksel sekitar (Barus, 2011). Algoritma Sobel merupakan salah satu pengembangan dari teknik edge detection sebelumnya. Algoritma ini termasuk algoritma pemrograman yang berfungsi sebagai filter citra. Filter ini mendeteksi keseluruhan edge yang ada. Dalam prosesnya filter ini menggunakan sebuah operator, yang dinamakan Operator Sobel.
Universitas Sumatera Utara
15
Menurut Wijaya (2012), Operator Sobel merupakan pengembangan dari Metode Robert dengan menggunakan HPF (High Pass Filter) yang diberi satu angka nol penyangga. Kelebihan dari Operator Sobel ini adalah kemampuan untuk mengurangi noise sebelum melakukan perhitungan pendeteksian tepi. Operator Sobel menggunakan matriks N x N dengan ordo 3x3, 5x5, 7x7, dan sebagainya. Matriks seperti ini digunakan untuk mempermudah mendapatkan piksel tengah sehingga menjadi titik tengah matriks. Piksel tengah ini merupakan piksel yang akan diperiksa. Cara pemanfaatan matriks ini sama seperti pemakaian sebuah grid, yaitu dengan cara memasukkan piksel-piksel disekitar yang sedang diperiksa (piksel tengah) ke dalam matriks. Cara yang demikian disebut spatial filtering. Contoh matriks pada area citra adalah sebagai berikut. A0
A1
A2
A3
Aij
A4
A5
A6
A7
Teknik spatial filtering menggunakan matriks lainnya yang dinamakan mask. Ukuran matriks mask sama besar dengan matriks piksel yaitu N x N. Didalam mask disimpan jenis operasi yang akan dilakukan terhadap matriks piksel, akan tetapi tidak semua spatial filtering menggunakan mask untuk menyimpan operasinya. Operator Sobel diterapkan dalam dua buah mask yaitu mask horizontal dan mask vertikal. −1 0 Gx = −2 0 −1 0
1 2 1
Gy =
1 2 0 0 −1 −2
1 0 −1
Mask pertama yaitu mask Gx digunakan untuk menghitung selisih titik pada sisi horizontal sehingga dihasilkan titik penelusuran arah horizontal. Mask kedua yaitu mask Gy digunakan untuk menghitung selisih titik pada sisi vertikal sehingga dihasilkan titik hasil penelusuran arah vertikal (Barus, 2011). Menurut Vairalkar (2012) mask Gx dan mask Gy dirancang untuk merespon secara maksimal tepi vertikal maupun horizontal terhadap grid piksel dimana tiap-tiap mask untuk masing-masing dua orientasi tegak lurus. Mask tersebut dapat diterapkan pada citra secara terpisah, untuk menghasilkan pengukuran yang terpisah dari gradien
Universitas Sumatera Utara
16
setiap komponen dalam orientasi masing-masing. Mask juga dapat digabungkan untuk menemukan nilai mutlak gradien pada masing-masing titik dan orientasi gradien tersebut. Untuk mendapatkan gradien gabungan, kedua matriks ini dapat dikombinasikan dengan salah satu dari persamaan berikut, yaitu : G = (Gx )2 +(Gy )2 ................................ (2.4) G = Gx + Gy ....................................... (2.5) Hasil akhir filter Operator Sobel adalah ditemukannya beberapa piksel dengan intensitas yang lebih besar atau tajam dan juga ukuran tepi objek yang jauh lebih besar dari ukuran sebelumnya. Keadaan ini dikarenakan titik-titik yang lebih dekat dengan titik tengah (terperiksa) diberi harga yang lebih dominan dalam perhitungan (Khair, 2013). Langkah-langkah algoritma pendeteksian tepi dengan Operator Sobel diawali dengan meng-input citra warna yang akan dideteksi. Citra warna tersebut dikonversi menjadi bentuk grayscale. Setelah itu dilakukan pendeteksian tepi pada citra, kemudian dilakukan tresholding dan selanjutnya dilakukan proses thinning. Proses selesai dan dihasilkan garis tepi suatu citra digital. Contoh citra bunga dapat dilihat pada Gambar 2.2. dan citra bunga hasil deteksi Operator Sobel pada Gambar 2.3.
Gambar 2.2. Citra Bunga
Universitas Sumatera Utara
17
Gambar 2.3. Citra Bunga Hasil Deteksi Operator Sobel Diagram deteksi tepi menggunakan Operator Sobel dapat dilihat pada Gambar 2.4. Citra Asli (Citra Warna)
Konversi Citra Warna ke Grayscale
Deteksi Tepi Citra
Thresholding
Thinning
Citra Hasil
Gambar 2.4. Diagram Deteksi Tepi Menggunakan Operator Sobel Sumber : Khair, 2013
Universitas Sumatera Utara
18
2.4
Deteksi Warna HSV
HSV merupakan salah satu cara untuk mendefinisikan warna yang didasarkan pada roda warna. Hue mengukur sudut sekitar roda warna (0 derajat pada merah, 120 derajat pada hijau dan 240 derajat pada biru). Saturation menunjukkan radius roda warna sehingga menunjukkan proporsi antara warna gelap ke warna putih murni sedangkan value menunjukkan tingkat kecerahan. Hue memiliki nilai antara 0 hingga 360 derajat sedangkan saturation dan value berkisar dari 0 hingga 100% (Purnamasari, et al. 2008). Untuk model warna HSV dapat dilihat pada Gambar 2.5.
Gambar 2.5. Model Warna HSV Sumber: Rakhmawati, 2013
Ruang warna HSV dapat memilah warna dalam citra seperti penglihatan mata manusia sehingga dapat mengenali warna citra dengan baik. Proses untuk mendapatkan nilai fitur warna dapat dimulai dengan konversi citra RGB menjadi citra HSV. Sebelum citra RGB dikonversi menjadi citra HSV diperlukan normalisasi nilai RGB dengan persamaan berikut. r=
R 255
g= b=
.................................................... (2.6)
G 255 B 255
.................................................. (2.7) ................................................. (2.8)
Universitas Sumatera Utara
19
Dimana R adalah nilai red yang belum dinormalisasi, G adalah nilai green yang belum dinormalisasi, B adalah nilai blue yang belum dinormalisasi, r adalah nilai red yang telah dinormalisasi, g adalah nilai green yag telah dinormalisasi dan b adalah nilai blue yang telah dinormalisasi. Setelah nilai normalisasi RGB selesai, maka citra akan dikonversi menadi citra HSV. Setelah nilai rgb dinormalisasi, maka konversi citra RGB menjadi citra HSV dapat dihitung dengan persamaan berikut. 0° 60° ⨯ ( H=
jika ∆=0 g-b ∆
mod6) b-r
60° ⨯ 2+ 60° ⨯ 4+
S=
0
∆ Cmax
∆ r-g
jika Cmax =r jika Cmax =g jika Cmax =b
......... (2.9)
∆
jika Cmax =0 ................................ (2.10) jika Cmax ≠0
V = Cmax ................................................................. (2.11) Untuk mendapatkan warna HSV diperlukan proses konversi RGB ke HSV karena model warna HSV merupakan model warna yang diturunkan dari model warna RGB (Karmilasari,2011). Contoh tabel warna HSV dapat dilihat pada Tabel 2.1. Tabel 2.1. Contoh Tabel Warna HSV Warna
Nama Warna
(R,G,B)
(H,S,V)
Hitam
(0,0,0)
(0º,0%,0%)
Putih
(255,255,255)
(0º,0%,100%)
Merah
(255,0,0)
(0º,100%,100%)
Lime
(0,255,0)
(120º,100%,100%)
Biru
(0,0,255)
(240º,100%,100%)
Kuning
(255,255,0)
(60º,100%,100%)
Cyan
(0,255,255)
(180º,100%,100%)
Magenta
(255,0,255)
(300º,100%,100%)
Abu-abu
(128,128,128)
(0º,0%,50%)
Merah Tua
(128,0,0)
(0º,100%,50%)
Olive
(128,128,0)
(60º,100%,50%)
Universitas Sumatera Utara
20
2.5
Citra Digital
Citra digital dapat didefenisikan sebagai fungsi dua variabel f(x,y) dimana x dan y adalah koordinat spasial dan nilai f(x,y) yang merupakan intensitas citra pada koordinat tersebut. Teknologi dasar untuk menciptakan dan menampilkan warna pada citra digital berdasarkan pada penelitian terdahulu bahwa sebuah warna merupakan kombinasi dari tiga warna dasar, yaitu merah, hijau, dan biru (Red, Green, Blue RGB). Sistem kordinat pada sebuah citra digital dapat dilihat pada Gambar 2.6.
Gambar 2.6. Sistem Koordinat Citra Digital Citra digital memiliki beberapa format yang memiliki karakteristik tersendiri. Format pada citra digital ini umumnya berdasarkan tipe dan cara kompresi yang digunakan pada citra digital tersebut. Namun dalam penelitian ini format file citra yang digunakan adah format file citra JPEG (.jpg).
2.5.1 Format File Citra JPG JPEG atau Joint Photographic Experts Group adalah format citra yang banyak digunakan untuk meyimpan citra-citra dengan ukuran lebih kecil. JPEG mampu menampilkan warna dengan kedalaman 24-bit true color, mengkompresi citra dengan sifat lossy dan umumnya digunakan untuk menyimpan citra-citra hasil foto. Jika ingin menampilkan citra dengan detail rumit dan bergradasi file citra dengan format ini dapat digunakan. File citra JPEG dapat menghasilkan citra yang hampir seperti aslinya. File citra JPEG dapat menghasilkan warna sampai dengan 16 juta warna. Ukuran file citra JPEG pada umumnya lebih besar dari GIF.
Universitas Sumatera Utara
21
2.5.2 Jenis-jenis Citra Digital Beberapa jenis citra digital yang sering digunakan adalah citra biner, citra grayscale dan citra warna. 2.5.2.1 Citra Biner Citra biner merupakan citra yang telah melalui proses pemisahan piksel-piksel berdasarkan derajat keabuan yang dimiliki. Citra biner adalah citra yang nilai tiap
pikselnya hanya direpresentasikan dalam
membutuhkan satu bit
memori
untuk
satu
menyimpan
bit. Citra
biner hanya
warna hitam dan putih
(Kembaren, 2015). Setiap piksel pada citra bernilai 0 untuk warna hitam dan 1 untuk warna putih (Burger, 2009).
2.5.2.2 Citra Grayscale Citra
grayscale
menggunakan
warna
tingkatan
keabuan.
Warna
abu-abu
merupakan satu-satunya warna pada ruang RGB dengan komponen merah, hijau, dan biru
yang mempunyai
nilai
intensitas yang sama. Citra
grayscale
memiliki
kedalaman warna 8 bit (256 kombinasi warna keabuan). Banyaknya warna yang ada tergantung pada jumlah bit yang disediakan di memori untuk menampung kebutuhan warna.
2.5.2.3 Citra Warna
Citra warna atau citra RGB, merupakan jenis citra yang menampilkan warna dalam bentuk komponen R (red), G (green), dan B (blue). Setiap komponen warna menggunakan 8
bit
(nilainya berkisar antara 0 sampai dengan 255). Dengan
demikian, kemungkinan warna yang bisa ditampilkan mencapai 255 x 255 x 255 atau 16.581.375 warna. Format ini dinamakan true color karena memiliki jumlah warna yang cukup besar.
Universitas Sumatera Utara
22
2.6
Euclidean Distance
Proses pemanggilan citra berdasarkan konten akan melakukan perhitungan jarak kesamaan antara citra query dengan citra yang ada pada database. Sementara itu, hasil pemanggilan citra bukan sebuah citra tunggal tetapi daftar dari citra-citra yang diurutkan berdasarkan tingkat kesamaan citra tersebut dengan citra query. Banyak cara menghitung kesamaan citra yang telah dikembangkan untuk pemanggilan citra dengan kalkulasi empiris dari fitur citra dalam beberapa tahun terakhir. Perhitungan kesamaan atau jarak yang berbeda akan mempengaruhi hasil dari sistem pemanggilan citra secara signifikan (Long, et al. 2003). Similarity comparison adalah bagian dari Content Based Image Retrieval. Similarity comparison sangat bermanfaat saat pengguna tidak dapat menentukan ukuran kesamaan antara citra query dengan citra dalam database dengan akurat. Similarity comparison juga bermanfaat untuk pengurutan citra yang terpilih sebagai hasil. Ada beberapa metode similarity comparison yang digunakan untuk mengukur jarak kesamaan antara citra query dengan citra pada database, salah satunya Euclidean Distance (Larasati, 2012). Euclidean Distance merupakan teknik yang paling sederhana untuk menghitung jarak antara dua vektor. Misalkan diberikan dua buah vektor fitur p dan q, maka jarak di antara dua vektor fitur p dan q dapat ditentukan dengan persamaan berikut. P = p1 ,p2 ,…,pn Q = q 1 ,q2 ,…,qn d=
2
2
p1 -q 1 + p2 -q 2 +…+ pn -q n
2
=
n i=1 pi -q i
Dimana P dan Q adalah citra, d adalah ukuran jarak antara citra query dan citra yang ada pada database. p adalah vektor fitur pada citra P dan q adalah vektor fitur pada citra Q (Karimah, 2014).
Universitas Sumatera Utara
23
2.7
Precision dan Recall
Parameter yang digunakan untuk mengukur keefektifan dari hasil pemanggilan citra berbasis konten salah satunya adalah precision dan recall.
2.7.1 Precision Precision mengevaluasi kemampuan sistem temu kembali informasi untuk menemukan kembali data top ranked yang paling relevan dan di defenisikan sebagai persentase data yang dikembalikan yang benar-benar relevan terhadap query pengguna (Karimah, 2014). Nilai precision dapat ditentukan dengan menghitung citra yang relevan dengan pencarian citra pada citra hasil pemanggilan citra. Nilai precision dapat dihitung dengan persamaan berikut. precision =
Jumlah citra relevan yang ditemukembalikan Jumlah seluruh citra yang ditemukembalikan
2.7.2 Recall Recall menyatakan perbandingan jumlah materi relevan yang ditemukembalikan terhadap seluruh materi relevan (Karimah, 2014). Nilai recall dapat ditentukan dengan menghitung citra yang relevan dengan pencarian citra pada citra dalam database. Nilai recall dapat dihitung dengan persamaan berikut. recall =
Jumlah citra relevan yang ditemukembalikan Jumlah citra relevan dalam 𝑑𝑎𝑡𝑎𝑏𝑎𝑠𝑒
Universitas Sumatera Utara
24
2.8
Penelitian yang Relevan
1)
Hastuti, et al. (2009) dalam
penelitiannya yang berjudul “Content Based
Image Retrieval Berdasarkan Fitur Bentuk Menggunakan Metode Gradient Vector Flow Snake”, menyebutkan bahwa Gradient Vector Flow Snake dapat diinisialisasi didalam dan diluar citra sehingga ketelitian lebih akurat dalam mengenal fitur bentuk sesuai dengan yang diinginkan. Dimana field dihitung sebagai difusi dari gradient vektor dari gray-level atau nilai liner bagian tepi. Sehingga hal ini memungkinkan untuk fleksibel penginisialisasian dari snake dan mendorong konvergensi lekukan ke perbatasan image yang dihasilkan berupa fitur bentuk, sehingga dapat memudahkan Content Based Image Retrieval (CBIR) untuk mengenali image yang mempunyai kemiripan pola bentuk yang ketelitiannya lebih akurat. 2)
Penelitian Putranto (2010) tentang “Segmentasi Warna Citra dengan Deteksi Warna HSV untuk Mendeteksi Objek” menyebutkan bahwa kontrol pengguna dalam hal penentuan sampel warna dan toleransi warna berperan penting dalam proses segmentasi, sampel warna akan menghasilkan nilai acuan warna sebagai acuan segmentasi dan toleransi warna digunakan sebagai jangkauan filter dalam proses segmentasi sehingga dapat diketahui banyaknya objek terdeteksi, luas area dan titik pusat tiap objek.
3)
Purnamasari, et al. (2008) dalam penelitiannya yang berjudul “System Online CBIR Menggunakan Identifikasi Dominan Warna pada Foreground Objek” menyebutkan bahwa hasil presentase kemiripan berdasarkan dominan warna pada foreground objek menunjukkan bahwa fitur warna dominan pada foreground objek sudah dapat membedakan citra dengan baik. Intensitas cahaya mempengaruhi akurasi pada sistem image retrieval ini. Ukuran objek tidak mempengaruhi akurasi pada sistem image retrieval ini.
Universitas Sumatera Utara