BAB 2 TINJAUAN PUSTAKA
2.1
Information Retrieval
Information Retrieval (IR) atau temu-kembali informasi, berkaitan dengan representasi, penyimpanan, pengorganisasian dari, dan akses ke item-item informasi. Representasi dan pengorganisasian item-item informasi hendaklah menyediakan kemudahan akses user (pengguna) ke informasi yang diperlukan. Sayangnya, karakterisasi dari informasi yang diperlukan oleh user bukanlah masalah sederhana. Gambar 2.1 memperlihatkan interaksi user dengan retrieval system (Baeza-Yates, R. dan Ribeiro-Neto, B., 1999).
Retrieval Database Browsing
Gambar 2.1 Interaksi User dengan Retrieval System (Sumber: Baeza-Yates, R. dan Ribeiro-Neto, B., 1999) Berdasarkan operasi query yang dilaksanakan, maka information retrieval ini secara umum dapat dikelompokkan menjadi, a. Text Information Retrieval, secara umum digunakan untuk menemukan kembali teks yang terkandung dalam sebuah dokumen.
Universita Sumatera Utara
b. Multimedia Information Retrieval yakni sistem yang secara khusus menangani data multimedia. Sistem multimedia harus mampu menyimpan, menemukan kembali, memindahkan dan menampilkan data yang memiliki karakteristik data yang heterogen meliputi teks, citra (citra diam dan citra bergerak), grafik dan suara, sesuai dengan keinginan user.
2.2
Image Retrieval Method
Citra dapat digunakan sebagai sumber informasi. Untuk memanfaatkan citra query sebagai sumber informasi, maka diperlukan database citra. Database citra berfungsi untuk menampung informasi tentang citra. Dengan ketersediaan citra dalam jumlah besar, maka diperlukan metode pencarian yang berdaya-guna untuk menemukan kembali citra query dari database. Beberapa metode
pencarian
untuk
menemukan
kembali
citra telah
dikembangkan. Secara umum, metode temu-kembali citra (image retrieval method) dapat diklasifikasikan menjadi dua kategori yakni, a. Metode berbasis-konsep (concept-based method) Metode berbasis-konsep menggambarkan isi citra melalui teks dan field terstruktur. Deskriptor yang digunakan adalah himpunan kata kunci dari fitur citra yang menjelaskan warna, bentuk dan lain-lain b. Metode berbasis-kandungan (content-based method). Metode berbasis-kandungan menggunakan fitur yang secara otomatis diekstraksi dari dalam citra seperti tekstur, warna, bentuk dan kendala spasial untuk menjelaskan citra (Li et al, 2005) Penelitian ini termasuk ke dalam metode temu-kembali citra berbasis kandungan (content-based image retrieval (CBIR)).
2.3
Citra Digital
Citra digital (digital image) dapat didefinisikan sebagai sebuah fungsi dua-dimensi, f(x,y), dimana x dan y merupakan koordinat spasial, serta amplitudo dari f pada setiap pasangan koordinat (x,y) disebut intensitas (intensity) atau tingkat keabuan (gray level) citra pada titik tersebut. Bila (x,y) dan amplitudo f adalah terhingga (finite) atau
Universita Sumatera Utara
kuantitas diskrit (discrete quantities) maka disebut sebagai citra digital (Gonzalez et al, 2004). Citra digital mengandung sejumlah elemen-elemen dasar. Elemen-elemen dasar citra dapat dimanipulasi dan diekploitasi lebih lanjut selama pengolahan. Elemenelemen dasar citra terdiri dari: 1. Kecerahan (brightness) Yang dimaksud dengan kecerahan adalah intensitas cahaya pada elemen gambar (picture element / pixel) di dalam citra. Intensitas cahaya ini bukanlah intensitas yang riil, melainkan intensitas rata-rata dari suatu area yang melingkupinya. 2. Kontras (contrast) Kontras menyatakan sebaran terang (lightness) dan gelap (darkness) di dalam suatu citra. Citra dengan kontras rendah mengakibatkan sebagian besar komposisi citranya adalah terang atau sebagian besar gelap. Citra dengan kontras yang baik, memiliki komposisi gelap dan terang tersebar secara merata. 3. Kontur (contour) Kontur adalah keadaan yang ditimbulkan oleh perubahan intensitas cahaya pada pixel-pixel yang bertetangga. Dengan adanya perubahan intensitas cahaya ini, mata manusia mampu mendeteksi tepi-tepi (edges) objek di dalam citra. 4. Warna (color) Warna adalah persepsi yang dirasakan oleh sistem visual manusia terhadap panjang gelombang cahaya yang dipantulkan oleh objek.
Setiap warna
mempunyai panjang gelombang (λ) yang berbeda. 5. Bentuk (shape) Bentuk adalah properti intrinsik dari objek tiga dimensi untuk sistem visual manusia. Manusia cenderung mengasosiasikan objek menurut bentuknya daripada elemen lainnya (misalnya warna). 6. Tekstur (texture) Tekstur dicirikan sebagai distribusi spasial dari derajat keabuan di dalam sekumpulan pixel-pixel bertetangga. Dengan demikian tekstur tidak dapat didefenisikan oleh sebuah pixel saja. Sistem visual manusia pada hakekatnya tidak menerima informasi citra secara terpisah dari setiap pixel, melainkan menangkap informasi suatu citra sebagai suatu kesatuan.
Universita Sumatera Utara
2.4
Pengolahan Citra Digital
Pengolahan citra digital merupakan sebuah disiplin ilmu yang mempelajari hal-hal yang berkaitan dengan perbaikan kualitas citra (peningkatan kontras, transformasi warna, restorasi citra), transformasi citra (rotasi, translasi, skala, transformasi geometrik), melakukan pemilihan fitur citra (feature image) yang optimal untuk tujuan analisis, melakukan proses penarikan informasi atau deskripsi objek maupun pengenalan objek yang terkandung pada citra, melakukan kompresi atau reduksi data untuk tujuan penyimpanan data, transmisi data dan waktu proses data. Input pengolahan citra digital adalah citra, sedangkan outputnya adalah citra hasil pengolahan ataupun berupa atribut-atribut. Gonzalez dan Woods (2002) menjabarkan tahap-tahap pengolahan citra seperti diperlihatkan pada Gambar 2.2. Berdasarkan diagram pada Gambar 2.2, bukan berarti semua proses harus dilakukan di dalam setiap pengolahan citra, namun tergantung pada tujuan pengolahan. Diagram tersebut juga tidak menyatakan urutan proses yang dilakukan. Diagram dimaksudkan untuk menyampaikan ide dari semua metodologi yang dapat diterapkan pada pengolahan citra untuk tujuan yang berbeda.
Color image processing
Wavelet and multiresolution processing
Compression
Morphological processing
Image restoration
Segmentation
Image enhancement
Representation & description
Knowledge base
Problem domain
Image acquisition
Object recognition
Gambar 2.2 Tahap-tahap Dasar Pengolahan Citra Digital (Sumber: Gonzalez dan Woods, 2002)
Universita Sumatera Utara
Tahap-tahap dasar pengolahan citra digital meliputi: 1. Akuisisi citra (image acquisition) Akuisisi citra merupakan tahap awal untuk memperoleh citra digital. Tujuan akuisisi citra adalah untuk menentukan data yang diperlukan dan memilih metode perekaman citra digital. Tahap ini dimulai dari persiapan objek, persiapan peralatan, sampai pada proses pencitraan. Pencitraan adalah kegiatan transformasi dari citra tampak (foto, gambar, lukisan, patung, pemandangan, dan lain-lain) menjadi citra digital. Beberapa alat yang digunakan untuk pencitraan adalah kamera video, kamera digital, konverter analog ke digital, scanner, Photo sinar-x /sinar infra merah. Umumnya. tahap akuisisi citra melibatkan praproses (preprocessing), misalnya pengaturan skala. 2. Peningkatan kualitas citra (image enhancement) Peningkatan kualitas citra dilakukan dengan memanipulasi parameter-parameter citra. Ide dasarnya adalah untuk menonjolkan detil-detil atau ciri-ciri khusus yang terkandung pada suatu citra. Operasi-operasi yang dilakukan meliputi a. peningkatan kualitas citra (kontras, kecerahan) b. peningkatan tepi (edge enhancement) c. penajaman (sharpening) 3. Pemugaran citra (image restoration) Tujuan dari pemugaran citra adalah meningkatkan penampilan dari suatu citra, namun tidak seperti peningkatan kualitas citra yang secara subjektif. Pemugaran citra bersifat objektif, dalam arti bahwa teknik restorasi cenderung didasarkan pada matematis atau probabilistik degradasi citra. Peningkatan citra didasarkan pada preferensi subjektif manusia tentang apa yang disebut “baik” terhadap peningkatan hasil. Contoh-contoh operasi pemugaran citra adalah: a. penghilangan kesamaran (deblurring) b. penapisan derau (noise filtering). 4. Pengolahan warna citra (color image processing). Secara umum pengolahan warna citra digunakan untuk mempermudah ekstraksi fitur dari suatu citra. Dalam pengolahan warna citra terdapat beberapa konsep mendasar pengolahan warna dan ruang warna yang dapat digunakan. Contohcontoh operasi pengolahan warna citra adalah:
Universita Sumatera Utara
a. konversi ruang warna citra untuk memenuhi kapasitas perangkat tampilan (display device) b. media pemberian warna semu (pseudocoloring). 5. Wavelet dan pengolahan multiresolusi (wavelets and multiresolution processing). Wavelet merupakan dasar untuk mewakili citra dalam berbagai tingkat resolusi. Secara khusus, wavelet sangat mendukung untuk proses kompresi data citra. 6. Kompresi (compression) Kompresi berhubungan dengan teknik untuk mengurangi kapasitas penyimpanan maupun bandwidth yang diperlukan untuk mengirimkan citra ke tempat lain. 7. Pengolahan morfologi (morphological processing) Pengolahan morfologi bertujuan untuk menggali besaran-besaran komponen citra yang berguna untuk mendeskripsikan objek-objek yang terdapat di dalam sebuah citra. Proses segmentasi kadangkala diperlukan dalam proses ini. Contoh-contoh operasi pengolahan morfologi adalah: a. pendeteksian tepi (edge detection) b. ekstraksi batas (boundary extraction) c. ekstraksi fitur (feature extraction) d. analisis citra (image analysis) e. rekonstruksi citra (image reconstruction) 8. Segmentasi (segmentation) Operasi ini bertujuan untuk memecah suatu citra ke dalam bagian-bagian penyusunnya dengan menggunakan suatu kriteria tertentu. Operasi segmentasi berkaitan erat dengan pengenalan pola. Dalam operasi segmentasi, sebuah citra dipartisi menjadi bagian-bagian pokok yang mengandung informasi penting. Secara umum, segmentasi otomatis merupakan pekerjaan yang paling sulit dilakukan di dalam pengolahan citra. Misalnya, memisahkan suatu objek dari latar-belakangnya. 9. Representasi dan deskripsi (representation and description) Representasi dan deskripsi biasanya mengikuti output dari tahap segmentasi yang merumuskan bentuk data yang cocok untuk pemrosesan komputer. Dalam proses ini harus ditetapkan apakah data merepresentasikan batas suatu wilayah, atau karakteristik lainnya seperti sudut, fitur atau atribut-atribut lainnya. Tahap
Universita Sumatera Utara
representasi dan deskripsi ini bertujuan untuk mengubah data mentah menjadi bentuk yang sesuai untuk pengolahan komputer. 10. Pengenalan objek (object recognition) Pengenalan objek adalah proses untuk menyimpulkan kandungan dari suatu citra dan memberikan label objek (misalnya, “kenderaan”). Pengenalan objek juga memberi arti atau makna kepada kelompok objek-objek yang dikenali. Selanjutnya output dari tahap ini diperlukan dalam komputer visi (vision computer). 11. Basis pengetahuan (knowledge base). Basis pengetahuan merupakan database pengetahuan yang berguna untuk memandu operasi dari masing-masing tahap proses dan mengendalikan interaksi antara tahap-tahap proses tersebut. Basis pengetahuan juga berfungsi sebagai referensi pada proses pencocokan template (template matching) atau pengenalan pola.
2.4.1
Ruang warna (color space)
Warna yang diterima oleh mata dari sebuah objek ditentukan oleh warna cahaya yang dipantulkan oleh objek tersebut. Sebagai contoh, suatu objek berwarna hijau karena objek tersebut memantulkan sinar hijau dengan panjang gelombang 450 sampai 490 nanometer (nm). Kedudukan dan panjang gelombang cahaya tampak diperlihatkan pada Gambar 2.3 (Bovik, 2009). Bovik (2009) menyampaikan bahwa munculnya suatu warna dalam kehidupan sehari-hari maupun dalam pengolahan citra tergantung pada 3 faktor yaitu: 1. Sifat pantulan spektrum (spectral reflectance) dari suatu permukaan. Sifat ini menentukan bagaimana suatu permukaan memantulkan gelombang cahaya sehingga menampakkan suatu warna. 2. Kandungan spektrum (spectral content) dari cahaya yang menyinari permukaan. Pada dasarnya suatu gelombang cahaya, mengandung berbagai warna. 3. Respon spektrum (spectral response) dari sensor yang terdapat pada peralatan sistem visual. Respon spektrum akan menentukan kepekaan mata pada sistem visual manusia atau kepekaan kamera pada sistem visual buatan.
Universita Sumatera Utara
Sinar Kosmis
Sinar Sinar UV Cahaya Gamma X Tampak
Ultra Violet 300
Infra Merah
Gelombang Mikro
TV
Cahaya Tampak 400 500 600 700 Panjang gelombang (nm)
Radio
Infra Merah 1000
Tenaga Listrik
1500
Gambar 2.3 Kedudukan dan Panjang Gelombang dari Cahaya Tampak (Sumber: Bovik. A. 2009) Cahaya matahari yang terlihat berwarna putih oleh mata manusia, sebenarnya terdiri dari beberapa gelombang cahaya tampak. Bila cahaya matahari dilewatkan pada sebuah prisma yang terbuat dari kaca tembus cahaya maka akan terjadi pemisahan gelombang sesuai dengan panjangnya masing-masing. Cahaya yang meninggalkan prisma akan terurai menjadi warna ungu, biru, hijau, kuning, jingga dan merah. Gonzales et al (2004) menyampaikan beberapa model warna yang dikenal di dalam pengolahan citra, yakni NTSC, YIQ, RGB, YCbCr, HSV, CMY, CMYK, HSI. Ruang warna NTSC digunakan dalam Televisi. Keuntungan format ini adalah informasi tingkat keabuan dipisahkan dari data warna, sehingga sinyal yang sama dapat digunakan untuk televisi monokrom dan berwarna. Dalam format NTSC, data citra terdiri dari tiga komponen yakni luminance (Y), hue (I) dan saturation (Q). Model warna RGB digunakan pada monitor yang terdiri dari warna merah (red), hijau (green) dan biru (blue). Ketiga warna ini disebut sebagai warna primer. Komponen YIQ dapat diperoleh dari komponen RGB dengan menggunakan transformasi pada Persamaan 2.1. Sebaliknya komponen RGB dapat diperoleh dari komponen YIQ dengan menggunakan transformasi pada Persamaan 2.2. (Gonzalez et al, 2004).
0,114 R Y 0,299 0,587 I = 0,596 − 0,274 − 0,322 G Q 0,211 − 0,523 0,321 B
(2.1)
0,621 Y R 1,000 0,956 G = 1,000 − 0,272 − 0,647 I B 1,000 − 1,106 1,703 Q
(2.2)
Universita Sumatera Utara
Ruang warna YCbCr digunakan secara luas di dalam video digital. Dalam format ini, informasi luminance direpresentasikan dengan komponen Y dan informasi warna disimpan sebagai komponen color-difference, Cb dan Cr. Komponen Cb merupakan perbedaan antara komponen biru dengan sebuah nilai referensi. Komponen Cr merupakan perbedaan komponen merah dengan sebuah nilai referensi. Transformasi RGB ke YCbCr dapat dilakukan dengan menggunakan Persamaan 2.3 (Gonzalez et al, 2004).
Y 16 65,481 128,553 24,966 R C = 128 + − 37,797 − 74,203 112.000 G b Cr 128 112,000 − 93,786 − 18,214 B
(2.3)
Ruang warna HSI (hue, saturation, intensity) merupakan ruang warna yang komponen-komponennya berkontribusi langsung pada persepsi visual manusia. Representasi ruang warna HSI diperlihatkan pada Gambar 2.4. Hue adalah atribut yang menyatakan kemurnian warna (misalnya murni merah, hijau atau kuning) dengan cara menentukan tingkat kemerahan, kehijauan, atau kekuningan. Saturation memberikan ukuran sejauh mana warna murni diencerkan dengan cahaya putih atau persentase warna putih yang ditambahkan ke warna murni. Intensity menggambarkan sensasi warna yang dirasakan atau menyatakan tingkat keabuan. Ruang warna HSI cukup ideal digunakan untuk mengembangkan algoritma pengolahan citra berdasarkan deskripsi warna. Transformasi RGB menjadi HSI dapat dilakukan dengan menggunakan Persamaan 2.4 sampai 2.7 (Gonzalez et al, 2004 dan Russ, 2011).
Universita Sumatera Utara
Gambar 2.4 Representasi Ruang Warna HSI (Hue, Saturation, Intensity) (Sumber: Russ, 2011)
Tingkat keabuan ditentukan sepanjang pusat sumbu. Jarak dari pusat sumbu menyatakan saturation, sementara sudut menyatakan nilai hue. θ H = 360 − θ
θ = cos−1
S =1 −
,B ≤G ,B >G
(2.4)
1 [( R − G ) + ( R − B)] 2 ( R − G ) 2 + ( R − B)(G − B)
(2.5)
3 [min( R, G, B )] R +G + B
(2.6)
1 I = (R + G + B ) 3
(2.7)
Dimana, H menyatakan nilai hue, S menyatkan saturation, I menyatakan Intensity, R menyatkan nilai warna merah, G menyatakan nilai warna hijau, B menyatakan nilai warna biru.
Universita Sumatera Utara
Untuk menyederhakan proses pengolahan citra berwarna, dalam hal tertentu citra warna RGB terlebih dahulu dikonversikan ke citra gray (abu-abu). Konversi citra RGB ke citra gray dapat dilakukan dengan menggunakan Persamaan (2.8). Gray = 0,299 × R + 0,587 × G + 0,114 × B )
(2.8)
Dimana, Gray menyatakan nilai warna gray(abu-abu), R (red), G(green) dan B (blue).
2.4.2
Operasi ambang batas (thresholding)
Tujuan dari operasi ambang batas (thresholding) adalah untuk mentransformasikan atau memetakan nilai yang memenuhi syarat ambang batas ke suatu nilai yang dikehendaki; disesuaikan dengan kebutuhan. Operasi ambang batas sering digunakan untuk mengatur jumlah derajat keabuan yang ada pada citra berdasarkan intensitas tingkat keabuan (grayscale). Secara matematis operasi ambang batas dapat dituliskan seperti Persamaan 2.9.
f i < T1 N1 , N , T ≤ f < T 1 i 2 fo = 2 N n Tn−1 ≤ f i < Tn
(2.9)
Dimana f o adalah nilai output (hasil transformasi); f i adalah nilai input yang akan ditransformasikan; N 1 , N 2 ,...,N n adalah nilai yang dikehendaki; T 1 ,T 2 ,...,T n adalah nilai ambang batas yang disyaratkan. Dengan menggunakan operasi ambang batas, suatu citra yang memiliki tingkat keabuan 255 dapat ditransformasikan menjadi citra biner (citra yang memiliki 2 warna saja yaitu hitam dan putih). Fungsi transformasi yang digunakan adalah Persamaan 2.10.
0, f o ( x, y ) = 255,
f i ( x, y ) <128 f i ( x, y ) ≥128
(2.10)
Universita Sumatera Utara
2.4.3
Histogram warna konvensional
Secara umum histogram menyatakan frekewensi kemunculan atau peluang keberadaan parameter dalam domain. Histogram warna menyatakan frekwensi kemunculan atau peluang setiap warna pixel di dalam sebuah citra. Untuk mengurangi waktu komputasi dan menghemat tempat penyimpanan, histogram warna menggunakan kuantisasi warna. Selain itu, kuantisasi warna juga dapat mengeliminasi komponen warna yang dapat dianggap sebagai noise. Banyaknya komponen kuantisasi (bin) dapat ditetapkan sesuai dengan kebutuhan pembuatan histogram. Operasi ambang batas sangat membantu dalam penghitungan frekwensi masing-masing bin. Peluang setiap bin dari histogram warna dapat ditentukan dengan Persamaan 2.11 dan 2.12.
hi = 1, Pi | j = 0,
1 N
N
∑P j =1
(2.11)
i| j
jika piksel ke j dikuantisas ke bin − i selainnya
(2.12)
dimana h i menyatakan nilai histogram bin ke-i, N menyatakan jumlah pixel dari citra, P i|j menyatakan peluang pixel ke-j dimasukkan ke bin-i. Histogram warna seperti ini dikenal dengan conventional color histogram (CCH) (Nixon dan Aguado, 2002).
2.4.4
Pendeteksian tepi
Tepi (edge) adalah perubahan nilai intensitas derajat keabuan yang mendadak (besar) dalam jarak yang singkat. Perbedaan intensitas inilah yang menampakkan rincian atau batas objek pada citra. Tepi biasanya terdapat pada batas antara dua daerah berbeda pada suatu citra. Tepi dapat diorientasikan dengan suatu arah dan arah ini berbedabeda bergantung pada perubahan intensitas. Pendeteksian tepi (edge detection) adalah operasi yang dijalankan untuk mendeteksi garis tepi (edge), yakni garis yang membatasi dua wilayah citra homogen berdasarkan tingkat kecerahan yang berbeda. Pendeteksian tepi merupakan salah satu langkah untuk meliput informasi di dalam citra. Tepi menampilkan batas-batas objek, oleh karena itu tepi berguna dalam proses segmentasi dan indentifikasi objek di dalam citra.
Universita Sumatera Utara
Tujuan operasi pendeteksian tepi adalah untuk memperjelas garis batas suatu objek dari latar-belakang di dalam citra. Karena tepi termasuk ke dalam komponen berfrekuensi tinggi, maka pendeteksian tepi dapat dilakukan dengan penapis lolos tinggi (high pass filter). Beberapa operator pendeteksi tepi yang umum digunakan, antara lain Sobel, Prewitt, Roberts, Laplacian of a Gaussian (LoG), Zero Crossings dan Canny (Gonzalez et al, 2004). Pendeteksi tepi Sobel (Sobel edge detector) merupakan salah satu metode pendeteksi tepi yang umum digunakan. Pendeteksi tepi Sobel menggunakan dua buah matriks konvolusi berukuran 3 x 3. Matrik konvolusi pada pixel-pixel tetangga berukuran 3 x 3, yang diperlihatkan pada Gambar 2.5.a. Matriks konvolusi pertama digunakan untuk mengestimasi gradient pada arah sumbu x, diperlihatkan pada Gambar 2.5.b. Matrik konvolusi kedua digunakan untuk menentukan gradient pada arah sumbu y, diperlihatkan pada Gambar 2.5.c (Gonzalez et al, 2004). Hasil operasi konvolusi dalam arah sumbu x terhadap citra I dinyatakan dengan G x , dan hasil operasi konvolusi dalam arah sumbu y terhadap citra I dinyatakan dengan dinyatakan dengan G y . Sehingga dengan menggunakan matrik konvolusi maka nilai G x dan G y berturut turut dapat dihitung dengan Persamaan 2.13 dan 2.14. Magnitudo (edge strength) dari gradien dapat dihitung dengan Persamaan 2.15 atau 2.16. Sebuah pixel akan dianggap sebagai tepi (bernilai satu) jika nilai magnitudonya lebih besar dari nilai ambang (threshold) yang ditetapkan. Arah tepi (edge direction) dapat dihitung menggunakan Persamaan 2.17. Setelah nilai edge direction diperoleh, langkah selanjutnya adalah menentukan pixel pixel citra yang merupakan garis (edge). Sebuah pixel akan dianggap sebagai edge jika nilai magnitudonya lebih besar dari nilai threshold yang ditetapkan (Gonzalez et al, 2004). z1 z2 z3 z4 z5 z6 z7 z8 z9 a.
-1 -2 -1 0 0 0 1 2 1 b.
-1 0 1 -2 0 2 -1 0 1 c.
Gambar 2.5. Matrik Konvolusi Pendeteksi Tepi Sobel a. Matrik citra tetangga b. Matrik konvolusi arah sumbu x c. Matrik konvolusi arah sumbu y Gx = ( z7 + 2 z8 + z9 ) − ( z1 + 2 z 2 + z3 )
(2.13)
G y = ( z3 + 2 z6 + z9 ) − ( z1 + 2 z 4 + z3 )
(2.14)
Universita Sumatera Utara
2.4.5
G = Gx + G y
(2.15)
G = Gx2 + G y2
(2.16)
θ = tan −1 (Gy / Gx)
(2.17)
Tekstur
Kebanyakan citra mengandung daerah yang ditandai bukan oleh karena nilai unik dari kecerahan atau warna, tetapi oleh pola nilai kecerahan yang sering disebut tekstur. Hal ini terjadi karena adanya variasi lokal dari kecerahan (atau kadang-kadang warna) dari satu pixel ke pixel berikutnya dalam suatu wilayah kecil. Jika kecerahan ditafsirkan sebagai elevasi dalam sebuah representasi dari citra permukaan, maka tekstur adalah ukuran kekasaran permukaan (Russ, 2011). Tekstur merupakan sifat-sifat atau karakteristik yang dimiliki oleh suatu daerah yang cukup besar sehingga secara alami sifat-sifat tadi berulang dalam daerah tersebut. Daerah yang kecil bila dibandingkan dengan elemen-elemen tekstur yang ada di dalamnya, tidak dapat menunjukkan tekstur itu sendiri. Hal ini menimbulkan masalah tersendiri pada skala (jauh atau dekatnya jarak suatu objek dari kamera saat diambil) yang digunakan untuk mengekstrak sifat-sifat yang berhubungan dengan suatu daerah. Tekstur merupakan sifat penting dari gambar. Berbagai representasi tekstur terus diteliti dalam pengenalan pola dan komputer visi. Pada dasarnya, metode representasi tekstur dapat diklasifikasikan menjadi dua kategori, yakni struktural dan statistik. Metode struktural, meliputi operator morfologi dan grafik adjacency, yang mendesrikpsikan tekstur dengan mengidentifikasi struktural primitif dan aturan penempatannya. Metode ini cenderung efektif bila diterapkan pada tekstur yang sangat teratur. Metode statistik, meliputi daya spektrum Fourier, matriks cooccurence, shift-invariant principal component analysis (SPCA), fitur Tamur, Wold decompotition, Markov random field, fractal model, dan teknik multi-resolution filtering seperti halnya Gabor dan transformasi wavelet, tekstur dikarakteristikkan melalui distribusi statistik dari intensitas. Sesungguhnya, tekstur yang sama bila dilihat dengan dua skala yang berbeda akan terlihat seperti dua tekstur yang berbeda, bila perbedaan skalanya cukup besar. Dengan skala yang semakin kecil atau rapat (jarak objek dengan kamera sangat jauh
Universita Sumatera Utara
ketika pengambilan citra), akan semakin susah untuk mendapatkan tekstur dari permukaan objek. Sehingga tekstur citra menjadi lemah, sehingga terlihat samar. Tinku dan Ray (2005) menyatakan syarat terbentuknya tekstur yaitu, 1. Terdapat pola-pola primitif yang terbentuk dari satu atau lebih pixel. Pola primitif ini dapat berupa titik, garis lurus, garis lengkung, luasan, dan lain-lain yang merupakan elemen dasar dari sebuah bentuk. 2. Pola-pola primitif muncul berulang-berulang dengan interval jarak dan arah tertentu sehingga dapat diprediksi atau ditemukan karakteristik pengulangannya Penelitian ini menggunakan metode berbasis statistika untuk mengekstraksi ciri tekstur. Metode berbasis statistika menganalisis distribusi spasial dari tingkat keabuan dengan menghitung ciri lokal pada setiap pixel. Beberapa perhitungan statistika dari distribusi ciri lokal tersebut dan dapat dianalisa dengan bantuan cooccurrence matrix, seperti yang akan digunakan pada penelitian ini. 2.4.6. Co-occurence matrix Matriks
co-occurence
(co-occurence
matrix)
adalah
suatu
matriks
yang
menggambarkan frekuensi kemunculan pasangan dua pixel dari setiap tingkat keabuan dalam jarak dan arah tertentu dalam citra (Candan dan Sapino, 2010). Matriks cooccurence p(i 1 ,i 2 ) didefinisikan dengan dua langkah. Langkah pertama adalah menentukan lebih dulu jarak antara dua titik dalam arah vertikal dan horizontal (vektor d=(dx,dy)), dimana besaran dx dan dy dinyatakan dalam pixel sebagai unit terkecil dalam citra. Langkah kedua adalah menghitung frekwensi kemunculan pasangan pixel-pixel yang mempunyai nilai intensitas i 1 dan i 2 dan berjarak d pixel. Frekwensi kemunculan setiap pasangan tingkat keabuan diletakkan pada matriks sesuai dengan koordinatnya. Dimana absis untuk nilai intensitas i 1 dan ordinat untuk nilai intensitas i 2 . Misalnya, tingkat keabuan citra berukuran 5 x 5 mempunyai intensitas 0,1 dan 2 seperti pada Gambar 2.6.a. Karena hanya ada tiga nilai intensitas (0,1 dan 2), maka matriks p(i 1 ,i 2 ) akan berukuran 3 x 3. Bila jarak antar titik ditentukan d=(1,1), yang berarti satu pixel ke kanan dan satu pixel ke bawah, maka pasangan pixel yang harus dihitung adalah yang berjarak satu pixel dengan arah sudut 135 0 dari sumbu tegak. Dalam citra berukuran 5 x 5 ada 16 pasangan yang memenuhi syarat ini..
Universita Sumatera Utara
Kemudian pasangan pixel, dimana pixel pertama mempunyai nilai intensitas i 1 dan pasangannya yang berjarak d mempunyai nilai intensitas i 2 , dihitung dan dimasukkan ke dalam kolom ke-i 1 dan baris ke-i 2 pada matriks p(i 1 ,i 2 ). Pada Gambar 2.6.a, terdapat tiga pasangan pixel yang mempunyai pasangan intensitas (2,1) dan terpisah dengan jarak d=(1,1) seperti ditetapkan semula, maka nilai koordinat yang bersangkutan pada matriks p(i 1 ,i 2 ) adalah 3. Matriks co-occurence yang sudah lengkap diisi terlihat pada Gambar 2.6.b.
2 0 0 1 2
1 2 2 1 1 2 2 2 0 1 (a)
0 1 2 0 0
1 2 0 1 1
i1 i2
0 1 0 x 16 2 2
i1 1 2 1 2
2 2 0 3 1 2 2
i2
(b)
Gambar 2.6. Penyusunan Matrik Co-occurence (a) Citra berukuran 5x5 dengan intensitas 0,1,2 (b) Matriks intensitas co-occurence untuk d=(1,1) Setiap elemen matriks p(i 1 ,i 2 ) perlu dinormalisasi dengan cara membaginya dengan jumlah total dari pasangan pixel. Pada contoh yang sama, tiap elemen dibagi dengan bilangan 16 karena jumlah tiap pasangan intensitas dalam Gambar 2.6.a adalah 16. Nilai-nilai elemen matriks setelah di normalisasi kemudian dapat diperlakukan sebagai fungsi probabilitas dengan rentang nilai 0 sampai 1. Matriks co-occurence mengandung informasi distribusi dari pasangan pixel dengan dua buah tingkat keabuan. Beberapa fitur citra yang dapat diekstrasi dari matriks co-occurence adalah: a. Entropi (entropy) yiatu fitur untuk mengukur keteracakan dari distribusi intensitas, dinyatakan dengan Persamaan 2.18. b. Energi (energy) yaitu fitur untuk mengukur konsentrasi pasangan intensitas pada matriks co-occurence, dinyatakan dengan Persamaan 2.19. c. Kontras (contrast) yaitu fitur untuk mengukur kekuatan perbedaan intensitas dalam citra, dinyatakan dengan Persamaan 2.20.
Universita Sumatera Utara
d. Homogenitas (homogenity) yaitu fitur untuk mengukur ke-homogen-an variasi intensitas dalam citra, dinyatakan dengan Persamaan 2.21. e. Inverse moment, yaitu fitur untuk pengukuran kuantitatif himpunan intensitas pixel dari suatu bentuk, dinyatakan dengan Persamaan 2.22. f. Maximum probabilty, yaitu fitur untuk menghitung nilai probabilitas maksimum pasangan intensitas, dinyatakan dengan Persamaan 2.23. g. Korelasi (correlation), yaitu fitur yang mengukur kekuatan dan arah hubungan linier dari pasangan intensitas, dinyatakan dengan Persamaan 2.24.
N
N
Entropy = − ∑∑ p (i, j ) log ( p (i, j ))
(2.18)
i =1 j =1
N
N
Energy = ∑∑ p (i, j ) 2
(2.19)
i =1 j =1
N
N
Contrast = ∑∑ (i − j ) p (i, j ) 2
(2.20)
i =1 j =1
N
N
p (i, j ) j =1 1 + i − j
Homogenity = ∑∑ i =1
N
N
Inverse Moment = ∑∑ i =1 j =1 i≠ j
(2.21)
p (i, j ) 2 i− j
(2.22)
Maximum probability = max( p (i, j )) Correlation =
N
N
∑∑
(i − µi )( j − µ j ) p (i, j )
i =1 j =1
σi σ j
(2.23) (2.24)
Dimana p(i,j) adalah elemen kolom ke-i, baris ke-j dari matriks co-occurrence yang telah dinormalisasi. µ i adalah nilai rata-rata kolom ke-i dan µ j adalah nilai rata-rata baris ke-j pada matriks p. σ i adalah standard deviasi kolom ke-i dan σ j adalah standard deviasi baris ke-j pada p.
2.5
Cosine Similarity
Cosine similarity digunakan untuk mengukur kemiripan dua buah vektor (vektor A dan vektor B) dengan menggunakan cosinus sudut diantara kedua vektor. Persamaan 2.25, memperlihatkan rumus cosine similarity.
Universita Sumatera Utara
n
A⋅ B Similarity = cos(Θ ) = = A B
∑ A ×B i
i =1
n
∑ (A ) i =1
2
i
×
i n
∑ (B ) i =1
(2.25)
2
i
Dimana A dan B adalah vektor yang memiliki n elemen. Nilai kemiripan yang dihasilkan adalah -1 yang berarti vektor A dan B adalah serupa dan berlawanan arah. Nilai 1 berarti verktor A dan B tepat sama, 0 berarti tidak mirip sama sekali dan selainnya menyatakan tingkat kemiripan vektor A dan vektor B.
2.6
Formula Bayes
Formula Bayes digunakan untuk menghitung peluang bersyarat yaitu peluang suatu kejadian setelah kejadian lain terjadi (Neapolitan, 2004). Persamaan 2.26 memperlihatkan formula Bayes. P( A | B) =
P( A ∧ B) P( B)
(2.26)
Dengan bentuk lain Formula Bayes pada Persamaan 2.26 juga dapat ditulis seperti Persamaan 2.27. P( A | B) =
P( B | A) P ( A) P( B)
(2.27)
P(A|B) disebut juga posterior probability adalah peluang A terjadi setelah B terjadi. P(A ∧ B) adalah peluang A dan B terjadi bersamaan. P(B|A) disebut likehood adalah peluang B terjadi setelah A terjadi. P(A) disebut juga prior adalah peluang kejadian A. P(B) adalah peluang kejadian B dan P(B) ≠ 0 2.6.1 Bayesian network Bayesian network adalah sebuah graf berarah tanpa siklus (directed acyclic graph) yang digunakan sebagai representasi grafis pengambilan keputusan (reasoning) dalam wilayah yang tidak pasti. Simbol-simbol jaringan bayesian yang terdiri dari (Neapolitan, 2004):
Universita Sumatera Utara
1. Satu set node, setiap node merepresentasikan setiap variabel yang ada di sistem 2. Link antara dua node yang merepresentasikan hubungan sebab dari satu node ke node lain. 3. Distribusi bersyarat.
Hubungan antara n variabel dapat dibangun dengan bantuan pakar, dari data observasi atau dari gabungan keduanya. Jika diberikan n variabel dan satu set data observasi, maka semua hubungan (relationship) yang mungkin harus ditentukan. Telah dibangun sebuah model bayesian network yang digunakan untuk CBIR (Content Based Image Retrieval) seperti pada Gambar 2.7.
Citra
Basis Data
C1
C2
Cj
Cn
I1
I2
Ij
In
Gambar 2.7. Model Umum Bayesian Network untuk CBIR
Pada Gambar 2.7,
C 1 ..C n merupakan karakteristik citra, sedangkan I 1 ..I j
adalah citra-citra yang terdapat di dalam database. Garis berarah menunjukkan peluang sebuah citra I j memiliki karakteristik C i . Nilai peluang kemiripan antara citra query (Q) dan citra (I) di database dapat dihitung menggunakan formula Bayes pada Persamaan 2.28. P( I j | Q) =
2.7
P( I j ∧ Q) P(Q)
(2.28)
Recall Dan Precision
Recall dan precision merupakan parameter yang digunakan untuk mengukur keefektifan algoritma temu kembali informasi (Information Retrieval). Misalkan sebuah informasi query Q yang akan dicari dari kumpulan dokumen (Collection
Universita Sumatera Utara
Docs). Himpunan R menyatakan dokumen-dokumen yang relevan (Relevant Docs) dengan query. |R| adalah jumlah elemen himpunan dokumen yang relevan. Anggaplah sebuah algoritma pencarian diterapkan dan menghasilkan himpunan dokumen jawaban (Answer Set), A. Dokumen-dokumen di dalam himpunan A diurutkan berdasarkan derajat relevansinya dengan query. Ranking yang dihasilkan dimulai dari derajat relevansi tertinggi. |A| adalah jumlah elemen dari himpunan jawaban A. |Ra| adalah jumlah dokumen yang merupakan irisan himpunan R dan himpunan A. Hubungan antara himpunan-himpunan ini diperlihatkan pada Gambar 2.8 (BaezaYates, R. dan Ribeiro-Neto, B., 1999). Relevant Docs in Answer Set |Ra|
Collection Docs Relevant Docs |R|
Answer Set |A|
Gambar 2.8 Diagram Himpunan Dokumen (Sumber: Baeza-Yates, R. dan Ribeiro-Neto, B., 1999) Recall menyatakan proporsi dari dokumen relevan (himpunan R) yang diterima sebagai hasil temu kembali, dapat ditentukan dengan Persamaan 2.29. Sementara itu, precision menyatakan proporsi dari dokumen himpunan jawaban A yang relevan, dapat ditentukan dengan Persamaan 2.30. Recall =
Ra
Precision =
R Ra A
(2.29)
(2.30)
Anggaplah himpunan dokumen-dokumen yang relevan dengan informasi Q telah diketahui sebelumnya, yakni Rq={d3, d5, d9, d25, d39, d44, d56, d71, d89, d123}; dalam hal ini terdapat sepuluh dokumen yang relevan. Setelah penerapan
Universita Sumatera Utara
algoritma pencarian, diperoleh himpunan dokumen jawaban A yang telah diranking dengan hasil sebagai berikut. Ranking himpunan jawaban A untuk query Q: 1.
d123•
6.
d9•
11. d38
2.
d84
7.
d5
12. d48
3.
d56•
8.
d129
13. d250
4.
d6
9.
d187
14. d113
5.
d8
10. d25•
15. d3•
Dokumen-dokumen yang relevan dengan query q ditandai dengan sebuah bullet setelah nomor dokumen. Dengan memperhatikan ranking ini, mulai dari dokumen paling atas, dapat dijelaskan sebagai berikut. Pertama, dokumen d123 dengan ranking nomor 1 adalah relevan. Selanjutnya, dokumen ini bersesuaian dengan 10% dari seluruh dokumen yang relevan di dalam himpunan Rq. Sehingga dikatakan memiliki precision 100% pada recall 10% (precision = 1/1 atau satu dari satu dokumen yang relevan; recall=1/10 atau satu dari sepuluh dokumen yang telah dilihat). Kedua, dokumen d56 dengan ranking nomor 3 adalah dokumen yang relevan berikutnya, memiliki precision 66% (dua dari tiga dokumen yang relevan) pada recall 20% (dua dari sepuluh dokumen yang telah dilihat). Nilai recall dan precision selengkapnya diperlihatkan pada Tabel 2.1. Grafik Recall dan Precision diperlihatkan pada Gambar 2.9.
Tabel 2.1 Recall dan Precision Recall (%) 10 20 30 40 50 60 70 80 90 100
Precision (%) 100 66 50 40 33 0 0 0 0 0
Universita Sumatera Utara
Gambar 2.9 Grafik Recall - Precision 2.8
Riset-Riset Terkait
Pencarian citra atau penemuan kembali citra merupakan permasalahan yang menarik untuk dibahas. Beberapa riset terkait yang telah dilakukan oleh banyak peneliti sebelumnya, berkaitan dengan temu-kembali citra berbasis-kandungan yang telah memberikan ide pada penelitian ini antara lain: 1. Li et al.(2005), dalam risetnya membangun sebuah sistem untuk temu-kembali citra berbasis-bentuk. Dalam riset ini, fitur bentuk yang kokoh dan efektif diperkenalkan yakni deskriptor citra senyawa (compound image descriptor) yang menggabungkan transformasi Fourier dan koefisien fasa serta fitur global. Riset ini lebih menekankan pada pembentukan deskriptor dengan menerapkan transformasi Fourier 2D standar. 2. Ravi dan Wilson (2010), dalam risetnya menggunakan ruang warna YCbCr untuk mendeteksi daerah kulit pada citra wajah. Citra RGB terlebih dahulu dikonversikan ke dalam ruang YCrCb. YCrCb ini kemudian dikonversikan menjadi citra grayscale. Berdasararkan tepi wajah ditentukan titik pusat dari citra foto wajah. Kemudian dengan menggunakan fitur warna kulit, bentuk wajah dan fitur wajah seperti mulut, mata dan hidung melakukan perbandingan untuk
Universita Sumatera Utara
menentukan jenis kelamin (gender). Klasifikasi dilakukan dengan menggunakan suppport vector machines. 3. Jayech dan Mahjoub (2010), dalam risetnya, mengklasifikasikan citra dengan menggunakan jaringan bayesian dalam beberapa bentuk yakni Naive Bayesian Network, Tree Augmented Naive Bayser dan Forest Augmented Bayse. Tahap awal yang dilakukan dalam klasifikasi citra adalah citra wajah terlebih dahulu dibagi dalam beberapa blok. Kemudian histogram warna dari setiap blok dihitung dengan menggunakan Gaussian Mixture Model (GMM). Deskripsi tektur menggunakan Graylevel Level Co-occurence Matrix (GLCM). Dengan menggunakan K-Means, objek kemudian dikelompokkan ke dalam k cluster. Setiap blok diberi label dan diintegrasikan ke setiap k cluster. Berdasarkan pelabelan inilah dilakukan klasifikasi dengan menggunakan jaringan bayesian. 4. Sivabalakhrisnan dan Manjula (2010), dalam risetnya menggunakan ruang warna HSV untuk mengekstraksi suatu objek bergerak dari latar-belakangnya. Citra diperoleh melalui akuisisi dan segmentasi sebuah deretan video. Langkah awal yang digunakan adalah mendeteksi dan membangun citra latar belakang. Daerah objek bergerak kemudian dipisahkan dari latar belakang yang dibangun. Riset ini mengemukakan algoritma deteksi gerak manusia berbasis wilayah. 5. Koo dan Song. (2005) dalam risetnya memanfaatkan perbedaan relatif warna a* di dalam ruang warna L*a*b* untuk mengestraksi fitur wajah. Fitur wajah yang diekstrak adalah mata, hidung, bibir dan wajah. Dengan mengetahui lokasi fitur wajah ini, peneliti menyarankan koversi daerah wajah dari citra 2D menjadi citra wajah 3D. 6. Gopal dan Prasad (2008), dalam risetnya membangun sebuah sistem temu-kembali citra berbasis-bentuk. Dalam riset ini, deskripsi bentuk dibangun dengan menggunakan deskriptor Fourier. Untuk memperkuat deskripsi bentuk ini, deskriptor Fourier diadapasi dengan freeman code, sehingga diperoleh bentuk tepi objek yang dinyatakan dalam konektivitas-8 atau neighborhood-8. Riset ini lebih menekankan pada pendefenisian fitur bentuk. Pengukuran kemiripan dilakukan dengan menghitung jarak Euclidean. 7. Iqbal dan Aggarwal (2002), mengajukan CIRES, yakni sebuah sistem perpustakaan online berbasis citra digital. Sistem ini menerapkan sistem temukembali citra berbasis-kandungan yang secara tradisional menggunakan analisis
Universita Sumatera Utara
warna dan tekstur. Analisis warna menggunakan ruang warna CIE LAB. Warna dipartisi hingga 2520 warna dan setiap warna diberi nama warna seperti merah muda, coklat dan lain-lain. Analisa tekstur menggunakan filter Gabor dan menyimpan vektor fitur tekstur 48- dimensi. Pengukuran kemiripan digunakan dengan menggunakan jarak Euclidean. Analisis kinerja tidak selalu mencapai tingkat yang memadai dan memuaskan pengguna.
2.9
Persamaan Dengan Riset-Riset Lain
Adapun Persamaan penelitian ini dengan penelitian yang dilakukan sebelumnya adalah menggunakan analisa fitur tekstur dengan menggunakan co-occurence matrix (Jayech dan Mahjoub, 2010).
2.10
Perbedaan Dengan Riset-Riset Lain
Dari beberapa riset yang telah dilakukan oleh peneliti sebelumnya, terdapat beberapa perbedaan dengan riset yang akan dilakukan, yaitu penelitian ini menggunakan tiga fitur yakni fitur warna dengan menggunakan ruang warna HSI, fitur bentuk dengan menerapkan operator Sobel, fitur tekstur yang dianalisa dengan menggunakan cooccurence matrix. Komponen tekstur yang diekstraksi adalah contrast, correlation, energy, homogenity, maximum probability, moment dan entropy. Pengukuran kemiripan citra ditentukan dengan menghitung jarak dengan metode cosine similarity. Penentuan hasil temu-kembali citra dapat dilakukan dengan beberapa cara yakni berdasarkan satu fitur saja (warna, bentuk dan tekstur) atau sekaligus kombinasi dari ketiga fitur yang diterapkan dalam jaringan bayesian.
2.11
Kontribusi Riset
Penelitian ini memberikan kontribusi pemahaman, bahwa suatu citra digital mengandung banyak informasi yang masih perlu diteliti. Berdasarkan kandungannya sebuah citra dapat diidentifikasi dengan menetapkan beberapa fitur seperti warna, bentuk, tekstur, bahkan fitur yang ‘masih tersembunyi’ dan perlu dicari dan diteliti lebih lanjut. Untuk menetapkan setiap fitur membutuhkan penelitian khusus, misalnya dalam fitur warna perlu dilakukan pengkajian untuk memilih ruang warna yang
Universita Sumatera Utara
digunakan. Untuk menetapkan fitur bentuk, diperlukan pengkajian dalam hal menentukan operator atau metode mendeskripsikan bentuk. Untuk menentukan fitur tekstur perlu dilakukan pengkajian tentang bagaimana tekstur diperoleh dan komponen-komponen apa saja yang akan dipertimbangkan dari tekstur tersebut. Setelah fitur-fitur tersebut diperoleh, perlu dipertimbangkan ukuran dan bentuk struktur data yang digunakan untuk menyimpan fitur tersebut ke dalam database, sehingga mempermudah pencariannya kembali. Pertimbangan juga diperlukan dalam menetapkan metode yang digunakan untuk klasifikasi citra dari database sehingga diperoleh suatu sistem temu-kembali citra berbasis-kandungan yang dapat bekerja dengan baik dan efisien. Keberhasilan sistem temu-kembali citra berbasis-kandungan secara umum ditentukan oleh kemampuan untuk menentukan fitur-fitur yang membedakan suatu citra dengan citra yang lain.
Universita Sumatera Utara