PENGKLASIFIKASIAN DAUN MANGGA, SALAM DAN SAWO DENGAN MENGGUNAKAN METODE NAIVE BAYES Andrian Riza Hermawan1, Andriano E. Wibowo2, Dhio Alfanda F.3, Dwi Fetiria Ningrum4, Naldo Sancho Liman5 1,2,3,4,5
Program Studi Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya E-Mail:
[email protected],
[email protected],
[email protected],
[email protected],
[email protected] Abstrak
Pengklasifikasian tanaman dapat dilakukan dengan melihat karakteristik daun tanaman tersebut. Daun merupakan salah satu karakteristik tanaman yang mudah dikenali. Warna dan bentuk daun masing-masing tanaman berbeda sehingga dapat ditemukan suatu pola tertentu untuk mengklasifikasikannya. Penelitian ini menggunakan pengenalan pola suatu citra daun untuk diklasifikasi. Daun yang digunakan adalah daun mangga, salam dan sawo. Fitur yang digunakan adalah warna dan bentuk daun. Dalam penelitian ini proses ekstraksi fitur yang digunakan adalah kode rantai. Kode rantai tersebut digunakan untuk mengambil bentuk citra. Penelitian ini menggunakan metode naïve bayes untuk melakukan proses klasifikasi terhadap daun mangga, salam dan sawo. Hasil penelitian ini menunjukkan bahwa tingkat akurasi pada daun mangga adalah 80%, daun salam 80%, dan daun sawo 100%. Kata kunci: Klasifikasi, warna daun, bentuk daun, kode rantai, naïve bayes Abstract Plant classification can be done by observing the leaf’s characteristics. The leaf is one of the plant’s characteristics which is easy to be recognized. The color and the leaf’s shape of each plant are different, therefore a certain pattern can be found to classify it. This research uses a pattern recognition of the leaf’s image to be classified. Leafs that used are mango leaf, bay leaf, and sapodilla leaf. The features are colors and the shape of the leaf. The chain code is used to take the shape of the image. This research is using Naïve Bayes method to do the classification process of mango leaf, bay leaf, and sapodilla leaf. The result of this research shows that degree of accuracy of each mango leaf and bay leaf are 80% while sapodilla leaf is 100%. Key words: Classificatian, leaf’s color, leaf’s shape, chain code, naïve bayes.
1. PENDAHULUAN
direpresentasikan oleh beberapa fitur seperti
Keanekaragaman hayati yang ada di dunia
warna dan bentuk. Citra yang mirip ditentukan
telah mendorong para ahli biologi untuk
oleh kedekatan nilai fitur yang dipakai.
membuat suatu sistem untuk mempelajari dan
Sementara itu di bidang ilmu botani, sangat
mengenali
organisme
melalui
dibutuhkan teknologi pencarian citra daun
klasifikasi.
Pengklasifikasian
merupakan
secara otomatis dari berbagai koleksi citra
pengelompokkan
dengan
organisme
berdasarkan
daun yang ada[1].
Pengklasifikasian
Untuk melakukan representasi terhadap
tumbuhan menggunakan daun dapat dilihat
bentuk obyek pada citra dapat menggunakan
dari bentuk dan warna daun[5]. Pada beberapa
metode Kode Rantai (chain code). Kode rantai
sistem temu kembali citra, sebuah citra dapat
(chain code) adalah metode yang sering
karakteristik
tertentu.
digunakan
untuk
mengidentifikasi
bentuk
(contour) suatu citra[2][6].
P
=
jumlahKodeGenap
+
√2.jumlahKodeGanjil
(1)
Setelah didapatkan fitur warna dan bentuk,
Dengan menggunakan jumlah kode genap
akan terbentuk suatu pola tertentu. Pola
dan ganjil pada arah kode rantai dapat
tersebut
untuk
menghasilkan keliling area suatu citra. Untuk
mengklasifikasi citra daun[4]. Pada penelitian
kode ganjil digunakan √2 karena arah pada
ini digunakan metode naive bayes untuk
kode tersebut diagonal.
dapat
digunakan
menentukan klasifikasi tumbuhan. Daun yang
Sedangkan untuk menghitug luas suatu
digunakan pada penelitian ini adalah daun
citra menggunakan kode rantai seperti pada
mangga, salam dan sawo.
persamaan (2)[7]. Kode 0 : Area = Area + Y
2. METODE PENELITIAN
Kode 1 : Area = Area + (Y + 0.5) Kode 2 : Area = Area
Tahap-tahap pada penelitian ini adalah praproses, fitur ekstraksi, klasifikasi dan post-
Kode 3 : Area = Area – (Y + 0.5)
proses.
Kode 4 : Area = Area – Y Kode 5 : Area = Area – (Y – 0.5)
Metode yang digunakan dalam penelitian ini adalah sebagai berikut.
Kode 6 : Area = Area
2.1 Kode Rantai (Chain code)
Kode 7 : Area = Area + (Y – 0.5)
Kode rantai seperti pada gambar 1 sering digunakan
untuk
mengidentifikasi
bentuk
(contour) suatu citra. Kode ini terbagi menjadi 8 arah dimana urutan pembacaan arah dari satu
(2)
Dimana total area keseluruhan adalah Ʃ Area. 2.2 Naïve Bayes Naïve
bayes
adalah
suatu
metode
titik ke titik yang lain sesuai dengan arah
pengklasifikasian paling sederhana dengan
jarum jam[6].
menggunakan peluang yang ada, dimana diasumsikan bahwa setiap variable X bersifat bebas (independence)[3].
3
2
1
Karena asumsi variabel tidak saling terikat, maka didapatkan persamaan (3).
4
0
(3) 5
6
7
Gambar 1. Arah Kode Rantai
Data yang digunakan dapat bersifat kategorial maupun kontinyu. Untuk data kontinyu
Untuk menghitung keliling area suatu citra dapat menggunakan persamaan (1) berikut[7].
dapat
diselesaikan
menggunakan langkah-langkah berikut.
dengan
1. Hitung probabilitas (Prior) tiap kelas yang
3. HASIL DAN PEMBAHASAN
ada.
Secara garis besar, sistem bekerja sebagai
2. Lalu hitung rata-rata (mean) tiap fitur dengan persamaan (4).
berikut. Pertama, pilih gambar daun yang ingin dikenali. Ketika gambar akan diproses oleh sistem, gambar akan melalui pra-proses
(4)
dimana nilai RGB gambar disimpan terlebih
Dimana :
dahulu dan noise pada gambar dihilangkan.
k = banyaknya data
Selanjutnya dilakukan perubahan dari gambar
n = nilai data
berwarna
menjadi
grayscale
untuk
3. Kemudian hitung nilai standar deviasi dari
mendapatkan bentuk biner gambar tersebut.
fitur tersebut seperti pada persamaan (5).
Setelah permrosesan gambar selesai, dilakukan ekstraksi fitur dengan chain code untuk mendapatkan keliling dan luas daun tersebut.
(5)
Kemudian dilakukan proses klasifikasi dengan menggunakan naïve bayes. Sistem
4. Selanjutnya
menghitung
diuji
dengan
database
yang
densitas
berisikan data 102 daun sebagai data latih dan
probabilitasnya menggunakan persamaan
15 data sampel untuk diuji terlihat pada table
(6).
1. Tabel 1. Jumlah Data Training dan Data (6)
5. Setelah
didapatkan
nilai
densitas
probabilitas dan prior, hitung probabilitas
Sampel dalam Database No. Nama Daun 1. Mangga 2. Salam 3. Sawo Total Jumlah Citra
Jumlah Citra 38 35 40 113
masing-masing kelas dengan menggunakan Masing-masing daun yang akan diuji dicari
persamaan (7). (7)
terlebih dahulu pobabilitas kemunculannya.
Nilai probabilitas terbesar adalah kelas
Sehingga dapat digunakan dalam menentukan
yang sesuai.
klasifikasi pada data testing.
P = P (X│Ci) × P(Ci)
Sedangkan untuk data kategorial, hanya
Selanjutnya nilai rata-rata dan varian setiap
memerlukan semua kemungkinan yang terjadi.
fitur yang digunakan dihitung menggunakan
Metode kode rantai digunakan pada tahap
persamaan(4) dan (5) sehingga dihasilkan nilai
fitur ekstraksi sedangkan metode naive bayes digunakan pada tahap klasifikasi.
seperti pada tabel 2.
Tabel 2. Nilai rata-rata dan varians tiap fitur Fitur
Mean
Variance
R --- Sawo R --- Mangga R --- Salam G --- Sawo G --- Mangga G --- Salam B --- Sawo B --- Mangga B --- Salam chainDiagUtama -- Sawo chainDiagUtama -- Mangga chainDiagUtama -- Salam chainDiagSamping --- Sawo chainDiagSamping --- Mangga chainDiagSamping --- Salam chainVertikal --Sawo chainVertikal --Mangga chainVertikal --Salam chainHorizontal -- Sawo chainHorizontal -- Mangga chainHorizontal -- Salam Keliling --- Sawo Keliling --Mangga Keliling --- Salam Luas --- Sawo Luas --- Mangga Luas --- Salam
33.46 148.82 130.67 49.37 153.64 111.10 29.29 135.88 115.53
85.61 139.85 1058.33 188.42 141.45 1263.96 80.21 189.99 1137.92
125.14
1062.24
108.45
3250.01
76.60
2333.41
112.34
1470.17
95.88
3406.96
62.37
2341.09
265.54
6759.43
387.76
37016.49
191.57
12446.48
57.60
597.54
19.79
181.08
46.57 659.00
1441.67 35283.49
696.52 434.13 30881.43 28047.83 25266.20
112437.41 70732.36 96579381.19 361121619.22 499290986.84
Tabel 3. Hasil Pengujian Sampel 1
Kelas Sawo
2
Sawo
3 4
Sawo Sawo
5
Sawo
6
Salam
7
Salam
8
Salam
9
Salam
10
Salam
11
Mangga
12
Mangga
13
Mangga
14
Mangga
15
Mangga
Posterior 7.8417E22 1.0964E20 4.76E-21 5.7272E21 1.6761E21 3.5315E32 4.2482E24 1.304E23 5.0189E30 2.2832E25 9.4223E23 6.8895E24 4.69765E -24 3.1994E24 5.48E-23
Prediksi Sawo
Hasil Benar
Sawo
Benar
Sawo Sawo
Benar Benar
Sawo
Benar
Salam
Benar
Salam
Benar
Mangga
Salah
Salam
Benar
Salam
Benar
Mangga
Benar
Mangga
Benar
Mangga
Benar
Salam
Salah
Mangga
Benar
Dari 15 data sampel terdapat 2 data yang salah prediksi sehingga total akurasi dari data yang terdapat pada tabel 3 adalah 86.67%. Keakurasiannya
untuk
tiap
kelas
daun
mangga, salam dan sawo adalah 80%, 80% dan 100%. Ada beberapa hal yang harus diperhatikan dalam pengujian tersebut yaitu ukuran citra yang digunakan harus sama agar ketika pengecekan kode rantai kompleksitasnya tidak terlalu tinggi.
Setelah mengetahui nilai rata-rata dan varian tiap fitur yang digunakan maka hasil pengujian dari data testing sebagai berikut.
4. KESIMPULAN Berdasarkan
hasil
uji
coba
dapat
disimpulkan bahwa metode chain code cukup
efektif
untuk
mendapatkan
bentuk
daun
sehingga fitur bentuk lebih optimal. Hasil uji
[4]
coba menunjukkan bahwa metode naïve bayes cukup efektif untuk proses klasifikasi.
[5]
DAFTAR PUSTAKA [1] Agus Zainal Arifin, Bayu Bagus, dan Dini Adni Navastara, “Klasifikasi Online Citra Daun berdasarkan Fitur Bentuk dan Ruas Daun”, Jurusan Teknik Informatika, Fakultas Teknik, Institut Teknologi Sepuluh November, 2009. [2] Z. Wang, Z. Chi, D. Feng, Q. Wang, Leaf Image Retrieval with Shape Features, Lecture Notes in Computer Science 1929 (2000) 477–487. [3] Cahyo Darujati dan Agustinus Bimo Gumelar, “Pemanfaatan Teknik Supervised untuk Klasifikasi Teks Bahasa Indonesia”, Sistem Informasi, Fakultas
[6]
[7]
Ilmu Komputer, Universitas Narotama Surabaya, 2012. Shih, Frank Y. Image Processing and Pattern Recognition : Fundamentals and Techniques. 2010. Wiley Anonymous. Struktur Jaringan & Fungsi Daun. 2012. URL : http://www.sentraedukasi.com/2011/06/struktur-jaringanfungsi-daun.html, diakses tanggal 28 Desember 2012. Cris Luengo. How to Obtain Chain Code. 2010. URL : http://www.cb.uu.se/~cris/blog/index.php/ archives/324, diakses tanggal 11 Oktober 2012 Prof. Yingli Tian, 2012 : “Digital Image Processing Lecture 21 : Image Descriptor and Representation 1”. The City College of New York. URL : wwwee.ccny.cuny.edu/www/web/yltian/Cours es/EE4710/EE4710_Lec21.PDF, diakses tanggal 2 Januari 2013.