Latar Belakang Saat ini kemampuan untuk dapat mengidentifikasi dan mengklasifikasi daun menjadi kebutuhan yang besar bagi taksonomis dalam mengetahui keanekaragaman tanaman (Hickey et al 1999). Identifikasi dapat dilakukan dengan mengenali ciri morfologi dan tekstur dari daun atau juga dengan gabungan keduanya. Content Based Image Retrieval (CBIR) dikembangkan untuk menemukembalikan citra berdasarkan pada informasi citra yang terdiri atas warna, bentuk dan tekstur. CBIR terdiri atas beberapa proses utama antara lain praproses, ekstraksi ciri, pengindeksan, dan penemuan kembali citra. Wu et al (2007) melakukan ekstraksi ciri morfologi pada citra helai daun. Tahap awal adalah mendapatkan lima ciri dasar dari citra helai daun, kemudian kombinasi dari kelima ciri tersebut menghasilkan dua belas ciri turunan.
Secara fisik, bentuk daun dapat dibedakan dengan melihat ciri morfologi yang ada pada setiap helai daun. Penelitian ini dilakukan untuk melengkapi ciri morfologi daun yang sebelumnya dilakukan oleh Annisa (2009). Oleh karena itu, berdasarkan penelitian sebelumnya diharapkan dengan tambahan physiological length dan physiological width akan didapatkan hasil yang baik untuk temu kembali citra helai daun. Tujuan Penelitian Tujuan dari penelitian ini adalah mengevaluasi hasil temu kembali citra dengan menggunakan penciri morfologi (physiological length dan physiological width), tekstur, dan gabungan keduanya dengan model Bayesian Network untuk temu kembali citra helai daun.
Data diperoleh dari hasil penelitian Annisa (2009) yang diambil dengan menggunakan kamera digital. Objek adalah citra helai daun tunggal yang berasal dari sebelas pohon buah yang ada di sekitar kampus IPB Darmaga, yaitu daun alpukat, bisbul, cokelat, durian, jamblang, jambu biji, jambu bol, kepel, manggis, menteng, dan nangka. Penelitian ini difokuskan pada tahap ekstraksi ciri morfologi dasar yaitu physiological length dan physiological width beserta dengan turunannya yaitu, aspect ratio, rectangularity, narrow factor, dan perimeter ratio of physiological length and physiological width.
TINJAUAN PUSTAKA Content Based Image Retrieval (CBIR) Content Based Image Retrieval (CBIR) merupakan suatu pendekatan untuk masalah temu kembali citra yang didasarkan pada informasi yang terkandung di dalam citra itu sendiri seperti warna, bentuk, dan tekstur dari citra (Rodrigues & Araujo 2004). CBIR terdiri atas beberapa tahap yaitu praproses, ekstraksi ciri, pengindeksan dan penemuan kembali citra. Gambar 1 menunjukkan diagram CBIR. Citra Kueri
Citra Basis Data
Praproses
Praproses
Ekstraksi Fitur
Ekstraksi Fitur
Pencarian Indeks
Pengindeksan
Pengukuran Kemiripan Sorted by
Pengindeksan (off-line)
Pebuardi (2008) menggunakan Bayesian Network dalam pengukuran kemiripan citra dengan menggabungkan informasi warna, bentuk, dan tekstur dari suatu citra. Kemudian Annisa (2009) mengimplementasikan pendekatan ekstraksi ciri morfologi untuk mendapatkan ciri dasar yaitu diameter, leaf area dan leaf perimeter. Setelah itu diperoleh ciri turunan berupa smooth factor, form factor, dan perimeter ratio of diameter. Untuk ciri tekstur diperoleh energy, inverse difference moment, entropy, maximum probability, contrast, correlation, dan homogeneity.
Ruang Lingkup
Penemuan Kembali Citra (on-line)
PENDAHULUAN
Indeks Basis Data
Gambar 1 Diagram CBIR. Ekstraksi Ciri Ekstraksi ciri adalah proses mengambil ciriciri yang terdapat pada citra. Pada proses ini objek di dalam citra mungkin perlu dideteksi seluruh tepinya, lalu dihitung properti-properti objek yang berkaitan sebagai ciri. Beberapa proses ekstraksi ciri mungkin perlu mengubah citra masukan sebagai citra biner, melakukan penipisan pola dan sebagainya.
1
Ekstraksi ciri diklasifikasikan ke dalam tiga tingkat yaitu low-level, middle-level dan highlevel. Low-level feature merupakan ekstraksi ciri berdasarkan isi visual seperti warna dan tekstur, middle-level feature merupakan ekstraksi tiap objek dalam citra dan mencari hubungannya, sedangkan high-level feature merupakan ekstraksi ciri berdasarkan informasi semantik yang terkandung dalam citra (Osadebey 2006). Ekstraksi ciri morfologi merupakan salah satu bagian dari CBIR untuk informasi morfologi pada citra. Proses ini bisa dilakukan dengan pendekatan ekstraksi ciri dasar dan turunan dari morfologi citra helai daun. Menurut Vailaya (1996), empat pendekatan yang digunakan dalam menganalisis tekstur adalah analisis statistik, geometrik, berbasis model dan pemrosesan sinyal. Pendekatan secara statistik dilakukan dengan mengukur karakteristik tekstur seperti kehalusan dan keteraturan. Pendekatan secara geometrik adalah mengorganisasikan komponen citra primitif (titik, garis, lingkaran) untuk mendapatkan adanya kemungkinan hubungan struktural. Sementara, pendekatan berbasis model mengasumsikan model citra dasar untuk mendeskripsikan dan menyintesis tekstur. Pendekatan pemrosesan sinyal menggunakan analisis frekuensi dari citra untuk menggolongkan tekstur. Salah satu bagian dari CBIR untuk mendapatkan informasi tekstur pada citra adalah ekstraksi ciri tekstur. Proses ini bisa dilakukan dengan pendekatan secara statistik yaitu co-occurrence matrix. Ekstraksi Ciri Morfologi Wu et al (2007) telah mendeskripsikan ciri morfologi daun yang dapat diekstrak dari citra helai daun. Ciri tersebut dibedakan menjadi dua, yaitu ciri dasar dan ciri turunan.
Gambar 2 Diameter helai daun. 2 Physiological length (Lp) adalah jarak antara ujung dan pangkal daun (panjang tulang daun primer). 3 Physiological width (Wp) adalah jarak terpanjang dari garis yang memotong tegak lurus physiological length yang dibatasi tepi daun. Hubungan keduanya dapat dilihat pada Gambar 3.
Gambar 3 Hubungan antara physiological length dan physiological width. 4 Leaf area ( A ) adalah perhitungan jumlah piksel dari daerah yang dilingkupi tepi daun pada citra yang telah dihaluskan. Ilustrasinya dapat dilihat pada Gambar 4.
Ciri dasar citra helai daun ada lima, yaitu: 1 Diameter ( D ), yang didefinisikan sebagai jarak terpanjang antara dua titik pada tepi daun. Panjang diameter bisa sama atau berbeda dengan panjang tulang daun primer (physiological length). Ilustrasinya dapat dilihat pada Gambar 2.
Gambar 4 Leaf area. 5 Leaf perimeter ( P ) adalah perhitungan jumlah piksel yang terdapat pada tepi daun (keliling). Ilustrasinya dapat dilihat pada Gambar 5.
2
L pW p
(3)
A 5 Narrow factor adalah rasio antara diameter dan physiological length. Ciri ini untuk menentukan apakah bentuk helai daun tersebut tergolong simetri atau asimetri. Jika helai daun tersebut tergolong simetri maka bernilai 1, jika asimetri maka bernilai lebih dari 1. Nilainya dapat dicari menggunakan Persamaan 4.
Gambar 5 Leaf perimeter. Ciri turunan daun ada dua belas, yaitu:
D
1 Smooth factor adalah rasio antara area citra helai daun yang dihaluskan dengan 5x5 rectangular averaging filter dan area citra helai daun yang dihaluskan dengan 2x2 rectangular averaging filter. Ciri ini untuk mengukur keteraturan tepi daun. Semakin teratur tepi daun, nilainya semakin mendekati 1. Sebaliknya, semakin tidak teratur tepi daun, nilainya semakin mendekati 0. 2 Aspect ratio adalah rasio antara physiological length dan physiological width. Persamaannya dapat dilihat pada Persamaan 1. Lp
6 Perimeter ratio of diameter. Ciri ini untuk mengukur seberapa lonjong daun tersebut. Persamaannya dapat dilihat pada Persamaan 5. P
Wp
Ciri ini untuk memperkirakan bentuk helai daun. Jika bernilai kurang dari 1 maka bentuk helai daun tersebut melebar. Jika bernilai lebih dari 1 maka bentuk helai daun tersebut memanjang. Ilustrasinya dapat dilihat pada Gambar 6.
(5)
D
7 Perimeter ratio of physiological length and physiological width. Rumusnya diberikan pada Persamaan 6.
P (1)
(4)
Lp
(L p W p )
(6)
8 Vein features. Persamaannya dapat dilihat pada Persamaan 7, 8,9,10, dan 11. a. Rasio antara area helai daun yang telah dikurangi dengan radius satu piksel dan area daun awal.
Av1 A
(7)
b. Rasio antara area helai daun yang telah dikurangi dengan radius dua piksel dan area daun awal.
Av 2 A Gambar 6 Aspect ratio. 3 Form factor, digunakan untuk mendeskripsikan perbedaan antara daun dan lingkaran Ciri ini untuk mengukur seberapa bundar bentuk helai daun tersebut. Nilai form factor dapat dilihat pada Persamaan 2.
4A 2 P
(2)
4 Rectangularity, mendeskripsikan kemiripan antara daun dan empat persegi panjang. Rumusnya diberikan pada Persamaan 3.
(8)
c. Rasio antara area helai daun yang telah dikurangi dengan radius tiga piksel dan area daun awal.
Av3 A
(9)
d. Rasio antara area helai daun yang telah dikurangi dengan radius empat piksel dan area daun awal.
Av 4 A
(10)
3
e. Rasio antara area helai daun yang telah dikurangi dengan radius empat piksel dan area helai daun yang telah dikurangi dengan radius satu piksel.
Av 4 Av1
IDM
c.
(11)
Co-occurrence Matrix Menurut Osadebey (2006), co-occurrence matrix menggunakan matriks derajat keabuan adalah untuk mengambil contoh secara statistik bagaimana suatu derajat keabuan tertentu terjadi dalam hubungannya dengan derajat keabuan yang lain. Matriks derajat keabuan adalah suatu matriks yang elemen-elemennya mengukur frekuensi relatif kejadian bersama dari kombinasi level keabuan antar pasangan piksel dengan hubungan spasial tertentu. Misal diketahui sebuah citra Q(i,j), p(i,j) merupakan posisi dari operator, dan A adalah sebuah matriks NxN. Elemen A(i,j) menyatakan jumlah titik tersebut terjadi dengan grey level (intensitas) g(i) terjadi, pada posisi tertentu menggunakan operator p, relatif terhadap titik dengan intensitas g(j). Matriks A merupakan co-occurrence matrix yang didefinisikan oleh p. Operator p didefinisikan dengan sebuah sudut θ dan jarak d. Berdasarkan matriks A dapat dihitung nilai-nilai ciri tekstur. Ilustrasinya dapat dilihat pada Gambar 7.
Gambar 7 Representasi co-occurrence matrix. Berikut adalah beberapa formula yang digunakan dalam penghitungan ciri tekstur. a.
Energy, mengukur tingkat keseragaman tekstur. Energi mencapai nilai tertinggi saat persebaran level keabuan konstan atau bersifat periodik. Rumusnya diberikan pada Persamaan 12. (12) E i , j P (i , j ) 2 1
b.
Inverse Difference Moment mencapai nilai tertinggi saat banyak kejadian bersama dalam matriks terkonsentrasi dekat diagonal utama. Formulanya dapat dilihat pada Persamaan 13.
P (i , j ) i j
(13)
Entropy, mengukur tingkat keacakan piksel. Entropi mencapai nilai tertinggi jika semua elemen dalam matriks P sama. Nilai entropy dapat dicari menggunakan Persamaan 14.
E d.
i, j
2
i, j P(i, j ) log P(i, j )
(14)
Maximum probability, menyatakan nilai frekuensi kemunculan bersama terbesar. Semakin tinggi nilainya, semakin teratur teksturnya. Rumusnya diberikan pada Persamaan 15.
MP max ( P ) ij
(15)
e.
Contrast, menyatakan jumlah variasi lokal yang terdapat dalam sebuah citra. Atau dengan kata lain menyatakan tingkat kekontrasan citra. Formulanya dapat dilihat pada Persamaan 16. 2 (16) C i , j i j P (i , j ) 1
f.
Correlation, menyatakan hubungan ketetanggaan antarpiksel. Rumus yang digunakan dapat dilihat pada Persamaan 17. (1 )( j ) P (i , j ) i j (17) C i, j 2 i j
g.
Homogeneity, menyatakan tingkat kehomogenan piksel. Nilainya dapat dicari menggunakan Persamaan 18. P (i , j ) (18) H i, j 1 i j
Evaluasi Hasil Temu Kembali Informasi Tahap evaluasi temu kembali citra dilakukan untuk menilai tingkat keberhasilan dalam proses temu kembali citra terhadap sejumlah koleksi pengujian. Pada tahap evaluasi dilakukan penilaian kinerja sistem dengan melakukan pengukuran recall dan precision dari proses temu kembali berdasarkan penilaian relevansinya. Recall dan Precision Recall dan precision merupakan parameter yang digunakan untuk mengukur keefektifan dari hasil temu kembali. Recall menyatakan proporsi yang ditemukembalikan terhadap
4
seluruh materi relevan pada basis data (korpus). Precision menyatakan proporsi materi relevan yang ditemukembalikan (Baeza-Yates dan Ribeiro- Neto 1999). Recall dan precision diformulasikan sebagai berikut: recall
(19)
precision
(20)
dengan Ra adalah citra relevan yang ditemukembalikan. R adalah jumlah citra relevan yang ada pada basis data. A adalah jumlah seluruh citra yang ditemu kembalikan. Rataan precision merupakan suatu ukuran evaluasi yang diperoleh dengan menghitung rata-rata tingkat precision pada berbagai tingkat recall (Baeza-Yates dan Ribeiro-Neto 1999).
ciri morfologi dasar dari hasil penelitian Annisa (2009) yaitu diameter, leaf area dan leaf perimeter. Pada akhirnya didapatkan ciri turunan citra helai daun yaitu aspect ratio, rectangularity, narrow factor, dan perimeter ratio of physiological length and physiological width. Pengindeksan
Penemuan kembali citra
Basis data citra
Citra kueri
Praproses
Praproses
Ekstraksi ciri
Ekstraksi ciri
Indeks citra basis data
Pengukuran kemiripan
Uji Levene dan Uji-t Uji Levene adalah salah satu teknik dari uji statistika yang digunakan untuk menentukan apakah ada hubungan yang terjadi pada suatu data dengan melihat nilai ragamnya (Imam 2001). Tahapan yang dilakukan yaitu: 1. Diuji apakah ragam kedua data sama atau tidak. 2. Lalu dengan uji–t, diambil suatu keputusan.
Hasil temu kembali
Evaluasi hasil temu kembali
METODE PENELITIAN Penelitian ini akan dikerjakan dalam beberapa tahap, yaitu praproses, ekstraksi ciri, pengindeksan dan penemuan citra kembali. Tahapan secara lengkapnya dapat dilihat pada Gambar 8. Praproses Tahap awal praproses yaitu mengubah citra RGB menjadi citra grayscale. Untuk ekstraksi ciri morfologi, citra grayscale dikonversi lagi menjadi citra biner. Kemudian noise citra dihilangkan. Ekstraksi Ciri Ekstraksi ciri dapat diklasifikasikan menjadi dua bagian yaitu ciri morfologi dan ciri tekstur. a. Ciri Morfologi Tahap selanjutnya ialah mencari ciri morfologi dasar yaitu Lp dan Wp, nilai Lp dihitung dengan menggunakan metode euclidean distance, sedangkan untuk mendapatkan nilai Wp ialah dengan mencari garis terpanjang yang tegak lurus dengan Lp. Kemudian nilai Lp dan Wp digabung dengan
Gambar 8 Metode penelitian. b. Ciri Tekstur Langkah awal yang dilakukan untuk mendapatkan informasi tekstur dari sebuah matriks adalah menentukan co-occurrence matrix yang dihitung dalam empat arah 0o, 45 o 90 o, dan 135 o. Jadi, setiap citra akan dihasilkan empat co-occurrence matrix. Setelah itu, nilai energy, moment, entropy, maximum probability, contrast, correlation, dan homogenity dihitung untuk setiap co-occurrence matrix, sehingga setiap fitur akan diperoleh empat nilai masing masing untuk arah 0 o, 45 o, 90 o, dan 135 o. Nilai dari setiap fitur diperoleh dengan menghitung rata-rata keempat nilai fitur yang bersangkutan. Informasi tersebut kemudian direpresentasikan dengan sebuah vektor yang memilki tujuh elemen dan nilai akhir dari informasi tekstur diperoleh dengan melakukan normalisasi terhadap vektor masing-masing citra. Pengukuran Kemiripan Pengukuran kemiripan antara citra kueri dan citra yang ada dalam basis data dilakukan
5