IDENTIFIKASI DAUN TANAMAN JATI MENGGUNAKAN K-NEAREST NEIGHBOUR DENGAN EKSTRAKSI FITUR CIRI MORFOLOGI DAUN
M BANGKIT PRATAMA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Daun Jati Tanaman Jati Menggunakan K-Nearest Neighbour dengan Ekstraksi Fitur Ciri Morfologi Daun adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor Bogor, November 2013 M Bangkit Pratama NIM G64104072
ABSTRAK M. BANGKIT PRATAMA. Identifikasi Daun Tanaman Jati dengan K-Nearest Neighbour Menggunakan Ekstraksi Fitur Ciri Morfologi Daun. Dibimbing oleh AZIZ KUSTIYO. Tanaman jati adalah tanaman yang dapat beradaptasi di iklim tropis, sehingga jenis tanaman ini dapat tumbuh baik di Indonesia. Famili dari tanaman jati adalah Lamiaceae yang dapat menghasilkan kayu bernilai ekonomi tinggi. Banyaknya varietas tanaman jati membuat identifikasi tanaman tersebut menjadi sulit. Penelitian ini mengembangkan sistem untuk identifikasi tanaman jati menggunakan ekstraksi ciri morfologi daun. Metode klasifikasi yang digunakan adalah k-nearest neighbor (KNN). Data yang digunakan pada penelitian ini adalah 6 jenis varietas jati. Pembagian data latih dan data uji menggunakan k-fold cross validation dengan nilai k=5. Akurasi rata-rata terbaik yang dihasilkan adalah 73.33%. Kata kunci : K-Nearest Neighbour, Morfologi Daun, Tanaman Jati
ABSTRACT M. BANGKIT PRATAMA. Identification of Teak Leaf Using K-Nearest Neighbour with Leaf Morphology Feature Extraction. Supervised by AZIZ KUSTIYO. The ability of teak plantation to adapt in tropical climate makes this plantation grows well in Indonesia. Teak plantation belongs to Lamiacae and it has a high economic value. The existence of various teak varietas becomes a challenge in teak identification. This research developed a teak identification system using its leaf morphology feature extraction. K-nearest neighbor (KNN) was used as the classification method. Six teak varieties were used as the data. The testing data and training data were divided by k-fold cross validation with k=5. The best average accuracy was 73.33%. Keywords : K-Nearest Neighbour, Leaf Morphology, Teak Tree
IDENTIFIKASI DAUN TANAMAN JATI MENGGUNAKAN K-NEAREST NEIGHBOUR DENGAN EKSTRAKSI FITUR CIRI MORFOLOGI DAUN
M BANGKIT PRATAMA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Penguji: 1 Musthafa, SKom MSc 2 Ir Julio Adisantoso, MKom
Judul Skripsi : Identifikasi Daun Tanaman Jati Menggunakan K-Nearest Neighbour dengan Ekstraksi Fitur Ciri Morfologi Daun Nama : M. Bangkit Pratama NIM : G64104072
Disetujui oleh
Aziz Kustiyo, SSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang dipilih dalam penelitian dilaksanakan sejak bulan September 2012. Topik penelitian ini adalah Identifikasi Daun Jati dengan K-Nearest Neighbour Menggunakan Ekstraksi Ciri Morfologi Daun. Terima kasih penulis ucapkan kepada seluruh pihak yang telah membantu penelitian ini: 1 Ayahanda H Saprudin, SH dan Ibunda Hj Ir Tety Suciaty, MP, serta adik Tysya Aulia Binangkityang telah membantu doa dan semangatnya untuk terus mengerjakan penelitian ini. 2 Bapak Aziz Kustiyo, SSi MKom, selaku dosen pembimbing yang telah banyak memberikan arahan, ide, dan saran untuk penelirian ini. 3 Bapak Musthafa, SKom, MSc dan Ir Julio Adisantoso, MKom, yang telah bersedia menjadi dosen penguji. 4 Rekan mahasiswa: Annisa Aulia, Rizkina Muhammad Syam, R. Ahmad Somadi serta teman-teman ilkom angkatan 5 alih jenis yang telah bersama selama 2,5 tahun. 5 Rekan satu bimbingan: Asep Haryono, Ilvi Nurrizki Utami, Cory Diana Lestari, yang telah memberikan arahan serta saran selama bimbingan besama. 6 Semua pihak yang telah membantu terima kasih yang belum disebutkan disini. Semoga karya ilmiah ini bermanfaat bagi pihak yang membutuhkan.
Bogor, November 2013 M. Bangkit Pratama
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
DAFTAR TABEL
iv
PENDAHULUAN
1
Tujuan Penelitian
1
Manfaat Penelitian
1
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Jati
2
Citra Digital
2
Confusion Matrix
3
METODE
4
Citra Daun
4
Praproses Data
5
Ekstraksi Ciri Morfologi
6
K-Fold Cross Validation
10
Klasifikasi KNN
11
Evaluasi
11
Lingkungan Pengembangan
11
HASIL DAN PEMBAHASAN
12
Citra Daun
12
Ekstraksi Ciri
12
Klasifikasi KNN
12
Perbandingan Dengan Penelitian Sebelumnya
15
SIMPULAN DAN SARAN
15
Simpulan
15
Saran
15
DAFTAR PUSTAKA
16
RIWAYAT HIDUP
22
DAFTAR TABEL 1 2 3 4 5
Akurasi rata-rata 6 fitur (%) Confusion matrix percobaan 6 fitur k=1 Akurasi rata-rata 17 fitur (%) Confusion matrix rata-rata 17 fitur k=1 Perbandingan akurasi dengan penelitian sebelumnya
13 13 13 14 15
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13
Perbandingan gradasi warna 1 bit, 2 bit, 5 bit, 6 bit, 7 bit, dan 8 bit 3 Metode penelitian 4 Contoh masing-masing varietas daun jati yang tepat teridentifikasi 5 Alur proses citra 5 Alur proses RGB ke grayscale 5 Citra masukan untuk ektraksi fitur morfologi 6 Contoh ilustrasi ekstraksi fitur ciri morfologi area daun. 6 Contoh ilustrasi ekstraksi fitur ciri morfologi perimeter daun. 7 Contoh ilustrasi ekstraksi fitur ciri morfologi diameter daun. 7 Contoh ilustrasi ekstraksi fitur ciri morfologi panjang daun Error! Bookmark not defined. Contoh ilustrasi ekstraksi fitur ciri morfologi lebar daun 8 Aspect ratio 8 Akurasi antara 6 fitur dan 17 fitur 14
DAFTAR LAMPIRAN 1 2 3 4 5 6 7 8 9 10
Hasil perhitungan morfologi sebelum dilakukan normalisasi Hasil perhitungan morfologi setelah dilakukan normalisasi Confusion matrix 6 fitur k=3 Confusion matrix 6 fitur k=5 Confusion matrix 6 fitur k=7 Confusion matrix 17 fitur k=3 Confusion matrix 17 fitur k=5 Confusion matrix 17 fitur k=7 Boxplot untuk setiap fitur ciri morfologi daun Hasil opening menggunakan 1 piksel.
17 17 17 17 18 18 18 18 19 21
PENDAHULUAN Indonesia merupakan salah satu negara beriklim tropis. Kawasan beriklim tropis mempunyai potensi yang cukup besar untuk mengembangkan produkproduk kehutanan. Salah satu produk kehutanan yang dapat dikembangkan adalah tanaman jati yang mempunyai nama latin Tectona grandis Linn F. Tanaman jati secara alamiah banyak dijumpai di negara-negara asia selatan dan asia tenggara, yaitu Burma, Thailand, Laos, dan Indonesia. Ratusan species tanaman jati terbesar di seluruh Indonesia, baik jati unggul maupun jati biasa. Banyaknya spesies tanaman jati yang ada menyebabkan kesulitan dalam mengenal jenis tanaman jati yang satu dengan yang lainnya. Untuk mengetahui setiap jenis tanaman jati yang ada dibutuhkan pengalaman dan pengetahuan yang cukup lama. Oleh karena itu, perlu dikembangkan suatu sistem identifikasi tanaman jati. Penelitian sebelumnya yang pernah dilakukan adalah Asanurjaya (2012). Penelitian tersebut dilakukan identifikasi dengan objek yang sama namun klasifikasi menggunakan probabilistic neural network (PNN) berdasakarkan 6 ciri morfologi, dan pada penelitian tersebut diperoleh akurasi sebesar 77.50%. Penelitian terkait selanjutnya yang pernah dilakukan adalah Nurjayanti (2011). Pada penelitian tersebut dilakukan klasifikasi 5 species shorea menggunakan knearest neighbour (KNN) berdasarkan 10 ciri morfologi dan pada penelitian tersebut diperoleh akurasi sebesar 100.00%. Model identifikasi daun jati yang akan dikembangkan dapat digunakan untuk mengenal daun jati. Identifikasi ini dilakukan agar tidak menyebabkan kesalahan pemilihan kayu yang tidak tepat dan mengurangi pertumbuhan jenis kayu dengan sifat-sifat yang tidak diinginkan. Sifat-sifat itu misalnya kualitas kayu yang rendah, pertumbuhan lambat, tajuk lebar yang jarang mencapai ukuran kayu, atau jenis pilihan yang tidak cocok untuk kondisi tanah tertentu. Pada penelitian ini akan dilakukan pada objek daun jati dengan ekstraksi ciri morfologi daun menggunakan k-nearest neighbour classifier. Ciri morfologi daun digunakan sebagai pengolahan citra daun yang dapat mengekstraksi fitur dari daun dan mereduksi dimensi citra tanpa menghilangkan fitur-fitur penting dalam citra tersebut. Diharapkan dengan metode yang berbeda bisa menghasilkan akurasi lebih baik dibandingkan dengan penelitian sebelumnya dengan objek yang sama. Tujuan Penelitian Tujuan dari penelitian ini adalah untuk menerapkan algoritma KNN dan mengimplementasikan teknik ekstraksi fitur ciri morfologi daun dalam mengidentifikasi tanaman jati, serta mengetahui tingkat akurasi dari proses identifikasi tersebut. Manfaat Penelitian Manfaat dari penelitian ini adalah membantu identifikasi daun tanaman jati (Tectona grandis Linn F) sehingga mudah untuk mengenali jenis atau varietas daun Jati.
2 Ruang Lingkup Penelitian Untuk memfokuskan penelitian, ditentukan beberapa batasan masalah/ruang lingkup yaitu sebagai berikut: 1 Jenis tanaman jati yang digunakan adalah tanaman jati Biotrop, jati Emas, jati Jobika, jati Muna, jati Prima, dan jati Super. 2 Data citra tanaman jati diambil pada umur 3-4 bulan. 3 Menggunakan ekstraksi fitur berdasarkan ciri morfologi daun.
TINJAUAN PUSTAKA Jati Pohon besar yang menggugurkan daun. Pada kondisi baik, tinggi dapat mencapai 30 – 40 m. Pada habitat kering, pertumbuhan menjadi terhambat, cabang lebih banyak, melebar dan membentuk semak. Pada tapak bagus, batang bebas cabang 15 – 20 m atau lebih, percabangan kurang dan rimbun. Pohon tua sering beralur dan berbanir. Kulit batang tebal, abu-abu atau coklat muda ke abuabuan. Daun lebar, panjang 25 – 50 cm, lebar 15 – 35 cm, letak daun bersilangan, bentuk elips atau bulat telur. Bagian bawah abu-abu, tertutup bulu berkelenjar warna merah. Ukuran bunga kecil, diameter 6 – 8 mm, keputih-putihan dan berkelamin ganda terdiri benangsari dan putik yang terangkai dalam tandan besar. Jumlah kuncup bunga 800 – 3.800 per tandan, bunga mekar dalam waktu 2 - 4 minggu (Rachmawati 2002). Areal penyebaran alaminya terdapat di India, Myanmar, Thailand dan bagian barat Laos.Batas utara pada garis 250 LU di Myanmar, batas selatan pada garis 90 LU di India. Jati tersebar pada garis 700 – 1000 BT. Penyebarannya ternyata terputus-putus. Hutan jati terpisah oleh pegunungan, tanah-tanah datar, tanah-tanah pertanian dan tipe hutan lainnya. Di Indonesia, jati bukan tanaman asli, tetapi sudah tumbuh sejak beberapa abad lalu di Pulau Kangean, Muna, Sumbawa dan Jawa (Rachmawati 2002). Citra Digital Menurut (Sutoyo et al. 2009) banyak cara untuk menyimpan citra di dalam memori. Cara penyimpanan menentukan jenis citra digital yang terbentuk. Beberapa jenis citra digital yang sering digunakan adalah citra biner, citra grayscale, dan citra warna. 1 Citra biner Banyaknya warna dalam citra biner ada 2, yaitu hitam dan putih. Membutuhkan 1 bit di memori untuk menyimpan kedua warna ini. 2 Citra grayscale Banyaknya warna tergantung jumlah bit yang disediakan di memori untuk menampung kebutuhan warna. Semakin besar jumlah bit warna yang disediakan di memori, semakin halus gradasi warna yang terbentuk.
3
Gambar 1 Perbandingan gradasi warna 1 bit, 2 bit, 5 bit, 6 bit, 7 bit, dan 8 bit Gambar 1 menunjukan perbandingan citra skala kebuan yang ditampilkan di monitor dengan gradasi warna yang berbeda-beda, yaitu 256, 128, 64, 32, 8, 4, dan 2 warna. Perbandingan ini bisa dikatakan bahwa semakin besar tingkat gradasi warna yang digunakan, semakin halus warna citra yang ditampilkan di monitor. 3 Citra warna Setiap pixel pada citra warna mewakili warna yang merupakan kombinasi dari tiga warna dasar (RGB = red green blue). Setiap warna dasar menggunakan penyimpanan 8 bit = 1 byte, yang berarti setiap warna mempunyai gradasi sebanyak 255 warna. Berarti setiap pixel mempunyai kombinasi warna sebanyak 28.28.28 = 224 = 16 juta warna lebih. Itulah sebabnya format ini dinamakan true color karena mempunyai jumlah warna yang cukup besar sehingga bias dikatakan hamper mencakup semua warna di alam. Penyimpanan citra true color di dalam memori berbeda dengan citra grayscale. Setiap pixel dari citra grayscale 256 gradasi warna diwakili oleh 1 byte, sedangkan 1 pixel citra true color diwakili oleh 3 byte, dimana masingmasing byte mempresentasikan warna merah, hijau, dan biru. Confusion Matrix Confusion matrix merupakan sebuah tabel yang terdiri dari banyaknya baris data uji yang diprediksi benar dan tidak benar oleh model klasifikasi.Tabel ini diperlukan untuk menentukan kinerja suatu model klasifikasi (Tan et al. 2006).
4
METODE Pada penelitian ini dilakukan dengan beberapa tahapan. Ilustrasi tahapan proses penelitian disajikan pada Gambar 2. Mulai Citra Daun Praproses Data Ekstraksi Ciri Morfologi K-Fold cross validation
Data Latih
Data Uji
Klasifikasi KNN Evaluasi Selesai
Gambar 2 Metode penelitian Citra Daun Citra Daun yang digunakan pada penelitian ini didapat dari penelitian sebelumnya (Asunarjaya 2012). Citra daun yang digunakan adalah daun daun jati 6 varietas. Satu varietas diwakili dengan 20 citra, sehingga total citra ada sebanyak 120 citra. Citra yang digunakan berukuran 1200×2300 pixel. Citra yang digunakan pada penelitian ini adalah citra daun tanaman jati yang samplenya diambil dari laboratorium kultur jaringan SEAMEO BIOTROP Bogor. Dalam pengambilan citra, daun tanaman jati dipilah-pilah dan diambil yang kualitas daunnya terlihat baik dalam hal bentuk daun yang utuh dan struktur daun yang jelas. Contoh masing-masing varietas daun jati disajikan pada Gambar 3.
5
Citra jati biotrop
Citra jati emas
Citra jati muna
Citra jati prima
Citra jati jobika
Citra jati super
Gambar 3 Contoh masing-masing varietas daun jati yang tepat teridentifikasi Praproses Data Tahapan praproses data dilakukan perubahan warna pada latar belakang. Latar belakang yang sebelumnya berwarna, kemudian dihilangkan. Ilustrasi bisa dilihat di Gambar 4.
Citra hasil akuisisi latar belakang Gambar 4 Alur proses citra
Citra RGB
Citra RGB
Citra grayscale
Gambar 5 Alur proses RGB ke grayscale Setelah dilakukan perubahan warna pada latar belakang, yang dilakukan selanjutnya yaitu akan mengubah citra yang awalnya RGB menjadi grayscale. Untuk mengubah RGB ke grayscale menggunakan rumus (The MathWorks 2008) A = 0.2989 × R + 0.5870 × G + 0.1140 × B dengan: A : Nilai itensitas keabuan R : Nilai komponen merah G : Nilai komponen hijau B : Nilai komponen biru Ilustrasi perubahan citra dapat dilihat di Gambar 5. Proses selanjutnya adalah mengubah citra grayscale ke biner dengan menggunakan threshold. Untuk mendapatkan threshold dilakukan dengan mencoba beberapa nilai dan nilai optimal yang diperoleh sebesar 0.75. Nilai threshold ini berlaku untuk semua citra daun. Nilai threshold merupakan suatu nilai yang memisahkan piksel antara
6 piksel objek dengan piksel latar belakang citra. Ilustrasi dapat dilihat di Gambar 6.
Citra biner Citra grayscale Gambar 6 Citra masukan untuk ektraksi fitur morfologi Ekstraksi Ciri Morfologi Menurut Wu et al (2007) ekstraksi morfologi terdiri atas 2 ciri yaitu ciri dasar dan turunan. Tahap awal ekstraksi adalah mendapatkan ciri-ciri morfoloagi daun. Ciri dasar yang digunakan pada penelitian ini adalah diameter, area, perimeter/keliling, panjang, dan lebar daun. Lima ciri dasar tersebut dapat dikombinasikan sehingga mendapatkan empat ciri turunan dianataranya smooth factor, form factor, perimeter ratio of diameter, perimeter ratio of physiological length and physiological width. Empat ciri turunan itu dikembangkan kembali menjadi 8 ciri turunan diantaranya aspect ratio, rectangularity, narrow factor, dan 5vein features. Informasi ciri ini direpresentasikan sebagai sebuah vektor dengan tujuh belas elemen, fitur elemen itu adalah: 1 Area Area daun dilambangkan dengan A dihitung berdasarkan jumlah piksel berada di dalam tepi daun. Ilustrasi proses ekstraksi fitur ciri morfologi area daun direpresentasikan seperti yang terlihat pada Gambar 7 (Asanurjaya 2012).
Citra biner morfologi yang Matriks citra telah diinvers area Gambar 7 Contoh ilustrasi ekstraksi fitur ciri morfologi area daun.
Citra grayscale
2 Perimeter Perimeter daun dilambangkan dengan P dihitung berdasarkan jumlah piksel yang berada pada tepi daun. Proses untuk menghasilkan tepi-tepi dari citra daun, menggunakan metode deteksi tepi (edge detection) Sobel (Sutoyo T et al 2009). Adapun operator yang digunakan adalah sebagai berikut.
7
Sx = [
]
Sy = [
]
Ilustrasi proses ekstraksi fitur ciri morfologi perimeter daun direpresentasikan seperti yang terlihat pada Gambar 8 (Asanurjaya 2012).
Citra biner morfologi perimeter (edge detection) Matriks citra Gambar 8 Contoh ilustrasi ekstraksi fitur ciri morfologi perimeter daun. Citra grayscale
3 Diameter Diameter dilambangkan dengan D merupakan titik terjauh di antara dua titik dari batas daun. Proses untuk menghasilkan diameter dari citra daun menggunakan rumus Phytagoras. Ilustrasi proses ekstraksi fitur ciri morfologi diameter daun direpresentasikan seperti yang terlihat pada Gambar 9 (Asanurjaya 2012).
Masukan fitur ciri Citra biner morfologi morfologi diameter perimeter Gambar 9 Contoh ilustrasi ekstraksi fitur ciri morfologi diameter daun.
Citra grayscale
4 Panjang dan lebar Panjang fisik dilambangkan dengan Lp merupakan jarak dua titik pangkal daun. Ilustrasi proses ekstraksi fitur ciri morfologi diameter daun direpresentasikan seperti yang terlihat pada Gambar 10. Lebar fisik dilambangkan dengan Wp dihitung berdasarkan panjang garis terpanjang yang memotong garis panjang fisik secara ortogonal. Ilustrasi proses ekstraksi ciri morfologi daun direpresentasikan seperti yang terlihat pada Gambar 11.
8
Gambar 10 Contoh ilustrasi ekstraksi fitur ciri morfologi panjang daun
Gambar 11 Contoh ilustrasi ekstraksi fitur ciri morfologi lebar daun
5 Smooth factor Smooth factor adalah rasio antara area citra helai daun yang dihaluskan dengan 5×5 rectangular averaging filter dan area citra helai daun yang dihaluskan dengan 2×2 rectangular averaging filter. Ciri ini untuk mengukur keteraturan tepi daun. Semakin teratur tepi daun, nilainya semakin mendekati 1. Sebaliknya, semakin tidak teratur tepi daun, nilainya semakin mendekati 0. 6 Aspect ratio Aspect ratio adalah rasio antara physiological length (Lp) dan physiological width (Wp). Persamaannya dapat dilihat pada Persamaan 1 (Nurfadhilah 2011). s ect ati Fungsi ciri ini untuk memperkirakan bentuk helai daun. Jika benilai kurang dari 1 maka bentuk helai daun tersebut melebar. Jika benilai lebih dari 1 maka bentuk helai daun tersebut memanjang.
Gambar 12 Aspect ratio 7 Form factor Form factor merupakan fitur yang digunakan untuk mendeskripsikan bentuk dari daun dan mengetahui seberapa bundar bentuk helai daun tersebut. Nilai form factor dapat dilihat pada Persamaan 2 (Nurfadhilah 2011). fact dengan: A : Area P : Perimeter
9
8 Rectangularity Rectangularity mendeskripsikan seberapa perseginya permukaan daun. Rumusnya diberikan pada Persamaan 3 (Nurfadhilah 2011). ectangula it dengan: Lp : Panjang Wp : Lebar A : Area
9 Narrow factor Narrow factor didefinisikan sebagai rasio antara diameter (D) dan physiological length (Lp). Ciri ini untuk menentukan apakah bentuk helai daun tersebut tergolong simetri atau asimetri. Jika helai daun tersebut tergolong simetri maka benilai 1. Jika asimetri maka bernilai lebih dari 1. Nilainya dapat dicari menggunakan Persamaan 4 (Nurfadhilah 2011). a
w fact
10 Perimeter ratio of diameter Perimeter ratio of diameter yaitu untuk mengukur seberapa lonjong daun tersebut. Persamaannya dapat dilihat pada Persamaan 5 (Nurfadhilah 2011). e i ete
ati
f dia ate
dengan: P : Perimeter D : Diameter 11 Perimeter ratio of physiological lengthand physiological width Perimeter ratio of physiological lengthand physiological Rumusnya diberikan pada Persamaan 6. e i ete
ati
f h sil gical length and h si l gical width
dengan: P : Perimeter Lp : Panjang Wp : Lebar
width.
10 12 Vein features. Persamaannya dapat dilihat pada Persamaan 7, 8, 9, 10 dan 11. Untuk mendapatkan nilai radius masing-masing piksel (Av) menggunakan fungsi morfologi opening. a. Rasio antara area helai daun yang telah dikurangi disk-shaped structuring element dengan radius satu piksel (Av1) dan area daun awal (A). Rumusnya menggunakan Persamaan 7. v
ein featu es
Contoh hasil dari opening dengan menggunakan 1 piksel dilihat pada Lampiran 10. b. Rasio antara area helai daun yang telah dikurangi disk-shaped structuring element dengan radius dua piksel (Av2) dan area daun awal (A). Persamaannya seperti tercantum di bawah ini. ein featu es
v
c. Rasio antara area helai daun yang telah dikurangi disk-shaped structuring element dengan radius tiga piksel (Av3) dan area daun awal (A). Untuk menghitungnya menggunakan Persamaan 9. ein featu es d.
Rasio antara area helai daun yang telah dikurangi disk-shaped structuring element dengan radius empat piksel (Av4) dan area daun awal (A). Persamaan 10 di bawah ini merupakan persamaan yang digunakan. ein featu es
e.
v
v
Rasio antara area helai daun yang telah dikurangi disk-shaped structuring element dengan radius empat piksel (Av4) dan area helai daun yang telah dikurangi disk-shaped structuring element dengan radius satu piksel (Av1). Persamaannya dapat dilihat pada Persamaan 11. ein featu es
v v
K-Fold Cross Validation Data citra daun Jati dibagi menjadi 2 bagian yaitu data latih dan data uji. Data latih digunakan untuk melakukan klasifikasi menggunakan k-nearest neighbour, sedangkan data uji digunakan untuk melakukan pengujian klasifikasi. Penelitian ini menggunakan 6 jenis citra daun Jati, masing-masing terdiri atas 20 data citra. Total 120 data citra daun Jati, 96 data digunakan sebagai data latih dan 24 data digunakan sebagai data uji. Data latih dan data uji akan disusun menggunakan k-fold cross validation. Banyaknya data yang diperoleh sebanyak 120 data maka data disusun menjadi 5 fold. Pada kombinasi ini data dibagi
11 menjadi 5 subset (S1,S2,S3,S4,S5). Pelatihan dan pengujian dilakukan sebanyak k kali.Iterasi ke-i subset S1 diperlakukan sebagai data pengujian dan subset lainnya sebagai data pelatihan. Tingkat akurasi dihitung dengan membagi jumlah keseluruhan klasifikasi yang benar dengan jumlah semua instance pada data awal (Han dan Kamber 2001). Klasifikasi KNN Penelitian ini klasifikasi yang akan digunakan dengan teknik K-Nearest Neighbour. Teknik K-Nearest Neighbour mencari jarak terdekat antara data yang akan dievaluasi dengan k tetangga (neighbour) terdekatnya dalam data pelatihan. Hasil klasifikasi ini diukur menggunakan tingkat akurasi dari data citra yang diuji dan diamati. Nilai k yang akan dicobakan pada penelitian ini adalah 1, 3, 5, dan 7. Pada percobaan ini juga mencobakan beberapa inputan fitur dengan 2 jenis kombinasi inputan fitur. Percobaan 1 dengan fitur 6 ciri morfologi, dan percobaan 2 dengan 17 fitur ciri morfologi. Jika ada sebuah data uji maka akan dihitung kedekatan titik data lainnya pada data latih untuk diklasifikasikan dengan ukuran jarak yang umumnya menggunakan metode Euclidean distance (Han dan Kamber 2001). (
)
√∑
(
)
Evaluasi Kinerja K-NN dapat ditentukan dengan menghitung besaran akurasi yang berhasil diperoleh. Akurasi dapat dihitung dengan persamaan berikut:
Lingkungan Pengembangan Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini adalah sebagai berikut: Perangkat keras: 1 Processor Intel ® Core 2 Duo 2 Memory 3 GB 3 Hardisk 500 GB Perangkat lunak: 1 Sistem Operasi Microsoft Windows 7 2 Matlab 7.7 (R2008b)
12
HASIL DAN PEMBAHASAN Citra Daun Pada penelitian ini terdapat 6 varietas citra daun Jati. Setiap varietas terdiri dari 20 citra, sehingga total data sebanyak 120 citra. Data yang digunakan pada penelitian ini merupakan data penelitian Asanurjaya (2012). Jenis Jati yang digunakan pada penelitian ini adalah Biotrop, Emas, Jobika, Muna, Prima, dan Super. Citra yang digunakan berukuran 1200×2300 pixel yang diakuisisi menggunakan kamera digital yang mempunyai resolusi 12 Megapixel dan jarak antara kamera dan daun ± 20 cm. Citra yang digunakan pada penelitian ini adalah citra daun tanaman jati yang sampelnya diambil dari Laboratorium Kultur Jaringan SEAMEO BIOTROP Bogor. Ekstraksi Ciri Ekstraksi ciri yang digunakan adalah ekstraksi ciri morfologi daun. Penelitian ini akan menggunakan 2 kali percobaan ekstraksi ciri, yaitu dengan jumlah 6 fitur yang dilakukan oleh Asunarjaya (2012), kemudian menambahkan lagi menjadi 17 fitur. Hasil yang diperoleh dari perhitungan morfologi daun memiliki rentang nilai yang sangat jauh seperti tercantum pada Lampiran 1. Rentang nilai terbesar adalah luas area dengan nilai terkecil 272387 dan terbesar 1640700, sedangkan nilai terkecil adalah vein features 1 memiliki nilai rentan terkecil 0.1030 sampai terbesar 0.2711. Nilai fitur yang tinggi akan mempengaruhi jarak tersebut, sehingga mungkin akan sangat berpengaruh terhadap penentuan kelas dari data uji. Hal ini tentunya akan mempengaruhi dalam perhitungan jarak euclid, untuk mengatasi hal tersebut maka dilakukan normalisasi fitur. Oleh karena itu sebelum dilakukan pembagian data latih dan data uji, terlebih dahulu dilakukan normalisasi data sehingga semua nilai akan memiliki rentang nilai yang tidak terlalu jauh. Melakukan normalisasi tidak semua nilai ekstraksi fitur dilakukan, tapi hanya beberapa nilai saja yang memiliki nilai rentang yang sangat jauh yaitu nilai area, perimeter, dan diameter, physiological length dan physiological width seperti terlihat pada Lampiran 2. Normalisasi dilakukan dengan digit terbesar. Setelah dilakukan pengamatan ternyata fitur narrow factor tidak digunakan, karena nilainya sama semua sehingga fitur ini tidak digunakan. Klasifikasi KNN Data hasil ektraksi ciri akan dibagi 2 menggunakan k-fold cross-validation dengan data latih sebanyak 96 dan data uji sebanyak 24. Setelah data dibagi, proses klasifikasi akan dilakukan menggunakan KNN dengan nilai k yang terdiri dari 1, 3, 5, dan 7. Untuk KNN dengan 6 fitur (area, perimeter, diameter, smooth factor, form factor, perimeter ratio of diameter)
13 Tabel 1 Akurasi rata-rata 6 fitur (%) Subset 1 2 3 4 5 Rata-rata
K 1 70.84 66.66 58.33 54.16 58.33 61.66
3 66.66 62.50 37.50 37.50 50.00 50.83
5 54.16 45.83 58.33 45.83 45.83 50.00
7 45.83 54.16 62.50 50.00 37.50 50.00
Tabel 1dapat dilihat bahwa hasil akurasi rata-rata percobaan dengan 6 fitur, tertinggi saat k tetangga terdekat = 1 yaitu 61.66% dan untuk nilai k selain 1 kurang lebih 50.00%. Disini terlihat semakin tinggi nilai parameter k, maka semakin kecil akurasi, karena disebabkan data penyeberan data uji dan data latih saling berdekatan atau bisa disebut berkumpul. Tabel 2 Confusion matrix percobaan 6 fitur k=1 Kelas asal Biotrop Emas Jobika Muna Prima Super
Biotrop 10 1 4 0 2 2
Emas 0 17 1 0 2 0
Kelas prediksi Jobika Muna 4 1 1 0 9 3 1 10 0 0 2 4
Prima 3 1 1 2 16 0
Super 2 0 2 7 0 12
Tabel 2 dapat dilihat bahwa kelas yang paling banyak salah adalah jenis jati Jobika. Jobika teridentifikasi ke semua kelas, yang terbanyak jobika teridentifikasi sebagai Biotrop dan Muna. Jenis jati Emas dan Prima memiliki kesalahan paling sedikit, hal ini disebabkan Emas dan Prima memiliki perbedaan morfologi dengan kelas yang lain. Jenis jati Muna salah teridentifikasi paling banyak ke jenis jati Super, begitupun sebaliknya jati Super paling banyak kesalahan ke jati Muna. Untuk KNN dengan 17 fitur (diameter, area, perimeter/keliling, panjang, lebar, smooth factor, form factor, perimeter ratio of diameter, perimeter ratio of physiological length and physiological width. aspect ratio, rectangularity, narrow factor, dan lima vein features). Tabel 3 Akurasi rata-rata 17 fitur (%) Subset 1 2 3 4 5 Rata-rata
k 1 75.00 75.00 70.83 75.00 70.83 73.33
3 58.33 54.16 62.50 58.33 62.50 59.16
5 54.16 58.33 62.50 54.16 66.66 59.16
7 58.33 58.33 54.16 70.83 54.16 59.16
14 Tabel 3 dapat dilihat bahwa hasil akurasi rata-rata percobaan dengan 17 fitur, tertinggi saat k tetangga terdekat = 1 yaitu 73.33% dan untuk nilai k selain 1 kurang lebih 50%. Disini terlihat semakin tinggi nilai parameter k, maka semakin kecil akurasi, karena disebabkan data penyeberan data uji dan data latih saling berdekatan atau bisa disebut berkumpul. Tabel 4 Confusion matrix rata-rata 17 fitur k=1 Kelas asal biotrop emas jobika muna prima super
biotrop 10 0 1 0 0 0
Kelas Prediksi Jobika muna 4 1 0 0 12 1 6 10 0 0 0 1
emas 2 17 1 0 0 0
Prima 3 3 4 0 20 0
super 0 0 1 4 0 19
Tabel 6 dapat dilihat bahwa dengan menambahkan fitur menjadi 17 fitur, kelas paling banyak salah tetap jenis Jati Muna, Jati Muna paling banyak salah teridentifikasi ke jati Jobika dan Super. Jenis Jati Jobika memiliki kemiripan ke semua kelas, hal ini disebabkan rentang nilai fitur-fitur dari Jobika mencakup nilai-nilai dari varietas yang lain. Sebagai contoh untuk fitur area (Lampiran 9), nilai yang rendah dari Jobika mirip dengan nilai dari Emas dan Prima, sedangkan nilai yang tinggi mirip dengan Muna, dan nilai yang sedang mirip Biotrop dan Super sama seperti percobaan sebelumnya menggunakan 6 fitur. Kesalahan prediksi terbesar jenis Jati Jobika ke jenis Jati Prima, dan Jenis jati Prima tidak memiliki kesalahan prediksi ke kelas lainnya. Jenis jati Emas dan Super memiliki kesalahan terkecil. Jenis Jati emas memiliki kesalahan prediksi ke jenis Jati prima, hal ini dapat disebabkan kemiripan nilai-nilai fiturnya dari Emas berada didalam rentang nilai fitur dari Prima. Penjelasan lebih lengkap dapat dilihat pada kemiripan setiap fitur ciri morfologi daun seperti terlihat pada Lampiran 9.
Akurasi (%)
100
6 fitur 17 fitur
50
0 1
3
5
7
Nilai k Gambar 13 Akurasi antara 6 fitur dan 17 fitur
15 Akurasi klasifikasi berdasarkan 17 fitur lebih tinggi dibandingkan dengan 6 fitur pada semua nilai k (Gambar 13). Nilai data memiliki kemiripan dari masingmasing fitur. Hal ini yang menyebabkan k semakin besar semakin kecil akurasi. Perbandingan Dengan Penelitian Sebelumnya Penelitian sebelumnya dilakukan Asanurjaya (2012) menggunakan 6 jenis Jati dan berdasarkan 6 fitur ciri morfologi. Penelitian tersebut menggunakan classifier probabilistic neural network (PNN) yang menghasilkan akurasi 77.50%. Penelitian yang dilakukan Asanurjaya menggunanakan klasifikasi PNN adalah menggunakan pelatihan (training) supervised. Keuntungan utama menggunakan arsitektur PNN adalah training data PNN mudah dan cepat (Wu et al. 2007). Penelitian dengan clasifier k-nearest neighbour (KNN) dilakukan oleh Nurjayanti (2011) dengan objek daun Shorea dan berdasarkan 10 fitur ciri morfologi yang menghasilkan akurasi 100%, oleh karena itu penelitian ini mengacu pada penelitian Nurjayanti (2011). Pada penelitian yang membedakan disini, penelitian Nurjayanti (2011) masih diinputkan secara manual seperti nilai panjang, lebar, bentuk tulang daun, permukaan daun, ujung, pangkal, sudut antar tulang daun, dan jumlah tulang daun, sedangkan data yang digunakan menggunakan 2 jenis data yaitu numerik dan nominal. Dalam penelitian yang dilakukan data jenis Jati yang digunakan sama dengan penelitian Asanurjaya (2012). Penelitian ini menambahkan 11 fitur morfologi, dengan menggunakan k-nearest neighbour (KNN) menghasilkan akurasi 73.33%. Penelitian Asanurjaya (2012) menghasilkan akurasi lebih tinggi dibandingkan dengan penelitian ini. Tabel 5 Perbandingan akurasi dengan penelitian sebelumnya Obyek penelitian Jenis Fitur Classifier Akurasi Asanurjarya (2012) 6 varietas 6 PNN 77.50% Nurjayanti (2011) 5 spesies 10 KNN 100.00% Penelitian ini 6 varietas 17 KNN 73.33%
SIMPULAN DAN SARAN Simpulan Berdasarkan hasil penelitian yang dilakukan diperoleh beberapa kesimpulan sebagai berikut: 1 Metode k-nearest neighbour dapat diimplementasikan dalam pengenalan daun tanaman jati menggunakan ekstraksi fitur ciri morfologi daun. 2 Penelitian ini menghasilkan akurasi tertinggi sebesar 73.33% pada 16 fitur dengan k tetangga terdekat 1. Saran Saran untuk pengembangan selanjutnya adalah sebagai berikut: 1 Melakukan segmentasi otomatis pada saat praproses citra.
16 2 Menggunakan classifier yang lain dengan 16 fitur ciri morfologi, seperti probalistic neural network (PNN) dan support vector machine (SVM).
DAFTAR PUSTAKA Asanurjaya B. 2012. Identifikasi daun jati menggunakan probabilistic neural network dengan ekstraksi fitur ciri morfologi daun [skripsi]. Bogor (ID): Institut Pertanian Bogor. Han J, Kamber M. 2001. Data Mining Concepts & Techniques. San Francisco (US): Academic Press. Nurfadhilah E. 2011. Identifikasi tumbuhan obat menggunakan fitur citra morfologi, tekstur, dan bentuk dengan klasifikasi probabilistik neural network [skripsi]. Bogor (ID): Institut Pertanian Bogor. Nurjayanti B. 2011. Identifikasi Shorea menggunakan k-nearest neighbour berdasarkan karakteristik morfologi daun [skripsi]. Bogor (ID): Institut Pertanian Bogor. Rachmawati H, Irianto D, Hansen CP. 2002. Tectona Grandis. Bandung (ID): Indonesia Seed Project. Sutoyo T, Mulyanto E, Suhartono E, Nurhayati OD, Wijanarto. 2009. Teori Pengolahan Citra Digital. Yogyakarta (ID): Andi. Tan P, Steinbach M, Kumar V. 2006. Introduction to Data Mining. Boston (US): Pearson Education. The MathWorks. 2008. Image processing toolbox for use with MATLAB: user’s guide version 7 [manual]. Natick (US-MA): The MathWorks. Wu SG, Bao FS, Xu EY, Wang YX, Chang YF, Xiang QL. 2007. A Leaf Recognitian Algorithm for Plant Classification Using Probabilistic Neural Network. Di dalam: IEEE International Symposium on Signal Processing and Information Technology. hlm. 11-16.
17 Lampiran 1 Hasil perhitungan morfologi sebelum dilakukan normalisasi
Lampiran 2 Hasil perhitungan morfologi setelah dilakukan normalisasi
Lampiran 3 Confusion matrix 6 fitur k=3 Kelas asal Biotrop Emas Jobika Muna Prima Super
Biotrop 10 0 5 0 2 2
Emas 0 9 1 0 5 1
Kelas prediksi Jobika Muna 4 0 1 0 8 2 2 12 0 0 1 6
Prima 3 10 1 0 13 0
Super 3 0 3 6 0 10
Lampiran 4 Confusion matrix 6 fitur k=5 Kelas asal Biotrop Emas Jobika Muna Prima Super
Biotrop 7 0 6 0 2 2
Emas 1 12 1 0 4 0
Kelas prediksi Jobika Muna 5 1 0 0 7 2 2 13 1 0 2 7
Prima 4 6 1 0 13 1
Super 2 2 3 5 0 8
18
Lampiran 5 Confusion matrix 6 fitur k=7 Kelas asal Biotrop Emas Jobika Muna Prima Super
Biotrop 10 0 5 0 2 2
Emas 0 11 2 0 7 0
Kelas prediksi Jobika Muna 4 0 0 0 9 1 2 14 0 0 2 6
Lampiran 6 Confusion matrix 17 fitur k=3 Kelas prediksi Kelas asal Biotrop Emas Jobika Muna Biotrop 9 2 5 1 Emas 0 15 0 0 Jobika 3 1 9 5 Muna 0 0 7 7 Prima 2 7 0 0 Super 0 0 1 1
Prima 4 9 0 0 11 1
Prima 3 3 1 2 11 0
Super 2 0 3 4 0 9
Super 0 2 1 4 0 18
Lampiran 7 Confusion matrix 17 fitur k=5 Kelas asal Biotrop Emas Jobika Muna Prima Super
Biotrop 10 0 2 0 2 0
Emas 1 17 3 0 11 0
Kelas prediksi Jobika Muna 5 1 0 0 8 5 5 11 1 0 1 0
Prima 3 3 1 0 6 0
Super 0 0 1 4 0 19
Lampiran 8 Confusion matrix 17 fitur k=7 Kelas asal Biotrop Emas Jobika Muna Prima Super
Biotrop 0 6 0 2 0 0
Emas 17 3 0 10 1 0
Kelas prediksi Jobika Muna 0 0 6 4 2 9 1 0 1 0 0 0
Prima 3 0 5 6 0 0
Super 0 1 4 0 18 0
19
Lampiran 9 Boxplot untuk setiap fitur ciri morfologi daun
Fitur area
Fitur diameter
Fitur physiological width
Fitur perimeter
Fitur physiological length
Fitur smooth factor
20 Lampiran 9 Lanjutan
Fitur aspect ratio
Fitur rectangularity
Fitur form factor
Fitur perimeter ratio of physiological length and physiological width
Fitur perimeter ratio of diameter
Fitur Vein Feature 1
Fitur Vein Feature 2
Fitur Vein Feature 3
21 Lampiran 9 Lanjutan
Fitur Vein Feature 4
Fitur Vein Feature 5
Lampiran 10 Hasil opening menggunakan 1 piksel.
Structuring element radius 1 piksel
Citra biner
Citra hasil opening
22
RIWAYAT HIDUP Penulis lahir pada tanggal 15 Mei 1990 di Kota Cirebon. Penulis merupakan anak pertama dari dua bersaudara, dari pasangan Bapak Saprudin dan Ibu Tety Suciaty. Penulis menyelesaikan pendidikan menengah atas di SMA Negeri 5 Cirebon pada tahun 2007. Setelah menyelesaikan pendidikan di Cirebon, tahun yang sama penulis lulus seleksi di Institut Pertanian Bogor Program diploma IPB Program keahlian Teknik Komputer. Pada tahun 2010 penulis lulus dari Program Diploma IPB dan melanjutkan perkuliahan di Program Alih Jenis Ilmu Komputer IPB.