IDENTIFIKASI DAUN SHOREA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES
AOKIRINDUAN HAYYI AOKO QOYYIMA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Desember 2013 Aokirinduan Hayyi Aoko Qoyyima NIM G64096010
ABSTRAK AOKIRINDUAN HAYYI AOKO QOYYIMA. Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures. Dibimbing oleh AZIZ KUSTIYO. Berbagai jenis pohon kelompok Shorea dari suku Dipterocarpaceae mendominasi hutan hujan dataran rendah di Indonesia. Tiap jenis Shorea memiliki kegunaan yang berbeda-beda dan merupakan penghasil kayu berkualitas tinggi dalam industri konstruksi. Penelitian ini membangun suatu sistem identifikasi daun Shorea menggunakan ekstraksi ciri teksur statistik dengan knearest neighbor sebagai alat pengklasifikasi. Metode statistik menganalisis distribusi spasial dari nilai keabuan, dengan menghitung fitur lokal pada setiap titik di dalam citra dan menurunkan kumpulan nilai statistik dari distribusi fitur lokal tersebut. Perhitungan nilai-nilai level keabuan menghasilkan enam parameter, yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan entropy. Penelitian ini menggunakan 10 jenis daun Shorea. Akurasi terbesar dari penelitian ini yaitu sebesar 90%. Kata kunci: k-nearest neighbor, Shorea, statistical textures
ABSTRACT AOKIRINDUAN HAYYI AOKO QOYYIMA. Shorea Leaves Identification Using K-Nearest Neighbor with Statistical Textures Feature. Supervised by AZIZ KUSTIYO. Various species of Shorea from Dipterocarpaceae family are dominating the lowland rain forests in Indonesia. Each species of Shorea has a unique function and can produce a high qualified timber in the construction industry. This research built an identification system of Shorea leaves using the statistical textures feature extraction with k-nearest neighbor as classifier. Statistical methods were utilized to analyze the spatial distribution of gray level values, by computing local features at each point in the image and deriving a set of statistical values from the distribution of the local features. The calculation of gray level values resulted in six parameters, namely mean, standard deviation, smoothness, third moment, uniformity, and entropy. A highest accuracy of 90% was obtained for the identification of 10 species of Shorea. Keywords: k-nearest neighbor, Shorea, statistical textures
IDENTIFIKASI DAUN SHOREA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES
AOKIRINDUAN HAYYI AOKO QOYYIMA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Penguji: 1 Mushtofa, SKom, MSc 2 Karlina Khiyarin Nisa, SKom, MT
Judul Skripsi : Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures Nama : Aokirinduan Hayyi Aoko Qoyyima NIM : G64096010
Disetujui oleh
Aziz Kustiyo, SSi, MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi, MKom Ketua Departemen
Tanggal Lulus:
Judul Skripsi: IdentifIkasi Daun Shorea Menggunakan K-Nearest Neighbor dengan eiri Statistical Textures Nama : Aokirinduan Hayyi Aoko Qoyyima NIM : G64096010
Disetujui oleh
Aziz Kustiyo, SSi,_ .MKom Pembimbing ...
....
r1.-~
Diketahui
Tanggal Lulus: .1 B DEC
2013
6feif
.
.
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas limpahan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2011 ini ialah Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures. Terima kasih penulis ucapkan kepada seluruh pihak yang telah membantu dalam penelitian ini, di antaranya yaitu: 1 Ayahanda H Rusmawi Baksin, Ibunda Hj Tri Hastuti, dan Kakak Karinduan Sitti Hayyu Koyyumi yang telah memberikan cinta, kasih sayang, doa, serta dukungan yang tidak terkira. 2 Yudi Esa Febriadi yang telah memberikan dukungan, doa, motivasi, dan kasih sayang kepada penulis. 3 Bapak Aziz Kustiyo, SSi, MKom selaku pembimbing yang telah banyak memberikan saran, ide, dan motivasi. 4 Dosen penguji, Bapak Mushtofa, SKom, MSc dan Ibu Karlina Khiyarin Nisa, SKom, MT atas saran dan bimbingannya. 5 Pihak Kebun Raya Bogor atas pemberian sampel daun Shorea. 6 Sahabat-sahabat, Agung Tresna, Anela Febrid Yunita, Dewi Susanti, Hasrul Adiputra, Haswanti, dan Nina Maria yang telah memberikan bantuan, dukungan, doa, dan saran selama penelitian ini berlangsung. 7 Teman-teman satu bimbingan, Alita Wulan Dini, Iman Akbar Ramadhan, Lina Herlina, dan Yuni Purnamasari, terima kasih atas kerjasamanya. 8 Teman-teman Alih Jenis Ilmu Komputer angkatan 4, atas kerjasamanya selama penelitian. Semoga karya ilmiah ini bermanfaat.
Bogor, Desember 2013 Aokirinduan Hayyi Aoko Qoyyima
DAFTAR ISI DAFTAR TABEL
vii
DAFTAR GAMBAR
vii
DAFTAR LAMPIRAN
viii
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
1
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Shorea
2
Histogram
2
Statistical Textures
3
Confusion Matrix
3
Box Plot
3
METODE
4
Data Citra Daun
4
Praproses
5
Ekstraksi Ciri Tekstur
5
Pembagian Data Latih dan Data Uji
7
KNN
7
Hasil Prediksi
8
Lingkungan Pengembangan
8
HASIL DAN PEMBAHASAN
9
Data Citra Daun
9
Praproses
9
Ekstraksi Ciri Tekstur
11
Pembagian Data Latih dan Data Uji
17
KNN
18
Perbandingan dengan Penelitian Terkait
25
SIMPULAN DAN SARAN
26
DAFTAR PUSTAKA
27
LAMPIRAN
28
RIWAYAT HIDUP
46
DAFTAR TABEL 1 2 3 4 5 6 7 8 9 10 11
Pengaturan jarak pengambilan citra Penetapan rentang nilai histogram Pembagian citra latih dan uji berdasarkan pengundian Confusion matrix percobaan 1 untuk k=8 Hasil kuadrat jarak pada data uji seminis kedua saat k=8 Hasil kuadrat jarak pada data uji leprosula pertama saat k=8 Confusion matrix percobaan 2 untuk k=7 Hasil kuadrat jarak pada data uji leprosula pertama saat k=7 Hasil kuadrat jarak pada data uji materialis pertama saat k=7 Hasil kuadrat jarak pada data uji palembanica pertama saat k=7 Perbandingan dengan penelitian terkait
9 10 18 19 19 20 23 23 24 24 25
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Confusion matrix untuk dua kelas Penjelasan box plot Diagram alir sistem Diagram alir KNN Citra jenis Shorea Alur praproses Pemotongan histogram untuk kelas javanica Box plot mean tipe 1 Box plot standar deviasi tipe 1 Box plot smoothness tipe 1 Box plot third moment tipe 1 Box plot uniformity jenis 1 Box plot entropy tipe 1 Box plot mean tipe 2 Box plot standar deviasi tipe 2 Box plot smoothness tipe 2 Box plot third moment tipe 2 Box plot uniformity tipe 2 Box plot entropy tipe 2 Grafik akurasi percobaan 1 Box plot mean antara seminis dan johorensis Box plot mean antara leprosula dan materialis Grafik akurasi percobaan 2 Box plot mean antara leprosula dan javanica
3 4 5 7 9 10 10 12 12 13 13 14 14 15 15 16 16 17 17 18 20 21 22 25
DAFTAR LAMPIRAN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
Contoh citra dan histogram dari masing-masing kelas Contoh data tekstur statistik dari masing-masing kelas Contoh data tekstur statistik ternormalisasi dari masing-masing kelas Confusion matrix percobaan 1 untuk k = 1 Confusion matrix percobaan 1 untuk k = 2 Confusion matrix percobaan 1 untuk k = 3 Confusion matrix percobaan 1 untuk k = 4 Confusion matrix percobaan 1 untuk k = 5 Confusion matrix percobaan 1 untuk k = 6 Confusion matrix percobaan 1 untuk k = 7 Confusion matrix percobaan 1 untuk k = 9 Confusion matrix percobaan 1 untuk k = 10 Box plot standar deviasi (posisi nilai 70.06) antara seminis dan johorensis Box plot smoothness (posisi nilai 0.07) antara seminis dan johorensis Box plot third moment (posisi nilai -3.49) antara seminis dan johorensis Box plot uniformity (posisi nilai 0.014) antara seminis dan johorensis Box plot entropy (posisi nilai 6.74) antara seminis dan johorensis Box plot standar deviasi (posisi nilai 68.08) antara leprosula dan materialis Box plot smoothness (posisi nilai 0.06) antara leprosula dan materialis Box plot third moment (posisi nilai -4.02) antara leprosula dan materialis Box plot uniformity (posisi nilai 0.017) antara leprosula dan materialis Box plot entropy (posisi nilai 6.40) antara leprosula dan materialis Confusion matrix percobaan 2 untuk k = 1 Confusion matrix percobaan 2 untuk k = 2 Confusion matrix percobaan 2 untuk k = 3 Confusion matrix percobaan 2 untuk k = 4 Confusion matrix percobaan 2 untuk k = 5 Confusion matrix percobaan 2 untuk k = 6 Confusion matrix percobaan 2 untuk k = 8 Confusion matrix percobaan 2 untuk k = 9 Confusion matrix percobaan 2 untuk k = 10 Box plot standar deviasi (posisi nilai 0.54) antara leprosula dan javanica Box plot smoothness (posisi nilai 0.34) antara leprosula dan javanica Box plot third moment (posisi nilai 0.25) antara leprosula dan javanica Box plot uniformity (posisi nilai 0.31) antara leprosula dan javanica Box plot entropy (posisi nilai 0.60) antara leprosula dan javanica
28 31 31 32 32 32 33 33 33 34 34 34 35 35 36 36 37 37 38 38 39 39 40 40 40 41 41 41 42 42 42 43 43 44 44 45
PENDAHULUAN Latar Belakang Hutan hujan dataran rendah di Indonesia didominasi oleh jenis-jenis Dipterokarpa (Dipterocarpaceae). Dalam program pengembangan hutan tanaman industri (HTI), jenis-jenis pohon suku Dipterokarpa terutama dari kelompok Shorea spp seperti meranti merah dan beberapa jenis meranti kuning serta meranti putih termasuk jenis-jenis yang diprioritaskan untuk dikembangkan sebagai penghasil kayu bangunan berkualitas tinggi (Istomo et al. 1999). Berdasarkan perihal tersebut, penelitian ini akan membangun suatu sistem yang dapat digunakan untuk mengidentifikasi Shorea, dikarenakan begitu banyaknya jenis dari Shorea yang memiliki kegunaan yang berbeda-beda. Hal ini bertujuan agar tidak terjadi kesalahan dalam penggunaan kayu di dalam kehidupan. Identifikasi tanaman dapat ditentukan berdasarkan ciri morfologi, bentuk, dan tekstur. Pada penelitian ini organ tumbuhan yang akan diamati adalah daun, karena daun merupakan salah satu organ vegetatif tumbuhan yang tidak bergantung pada musim dengan beberapa karakteristik yang dapat diamati. Selain itu, daun sangat cocok sebagai alat identifikasi tanaman karena jumlah daun yang sangat berlimpah dan selalu ada setiap waktu. Proses identifikasi dilakukan dengan menggunakan teknik image processing. Setelah itu, akan dilakukan proses pengklasifikasian terhadap serangkaian citra masukan. Penelitian ini menggunakan objek citra daun Shorea dengan menerapkan metode statistical textures untuk ekstraksi ciri tekstur. Metode statistik menganalisis distribusi spasial dari nilai keabuan, dengan menghitung fitur lokal pada setiap titik di dalam citra, dan menurunkan kumpulan nilai statistik dari distribusi fitur lokal tersebut (Ojala dan Pietikäinen 2004). Penelitian sebelumnya terkait dengan ekstraksi ciri tekstur dengan metode statistical textures telah dilakukan oleh Muhtadan (2009), yang melakukan penelitian mengenai ekstraksi ciri cacat pengelasan pada citra digital film radiografi menggunakan geometric invariant moment dan statistical texture. Dari penelitian tersebut, didapatkan enam parameter yang mampu menghasilkan nilai yang berbeda untuk mewakili masing-masing jenis cacat pengelasan. Pengklasifikasi yang akan digunakan dalam penelitian ini adalah k-nearest neighbor (KNN). Nurjayanti (2011) melakukan identifikasi jenis Shorea menggunakan metode KNN dan menggunakan karakteristik morfologi daun sebagai bahan identifikasi.
Tujuan Penelitian Tujuan penelitian ini adalah melakukan identifikasi terhadap sepuluh jenis Shorea menggunakan ciri tekstur dengan menggunakan algoritme KNN. Penelitian ini juga bertujuan untuk menghitung tingkat akurasi hasil prediksi dari proses klasifikasi.
2 Ruang Lingkup Penelitian Ruang lingkup penelitian ini yaitu: 1 Data diperoleh dari hasil pengambilan citra daun Shorea menggunakan kamera digital. Objek citra merupakan koleksi daun Shorea yang berada di Kebun Raya Bogor. 2 Citra daun yang digunakan adalah citra daun bagian atas. 3 Faktor pencahayaan saat pengambilan citra tidak dirancang. 4 Tekstur statistik yang digunakan yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan entropy.
TINJAUAN PUSTAKA Shorea Shorea (meranti) merupakan salah satu marga dari suku Dipterocarpaceae. Secara harfiah, Dipterocarpaceae berasal dari kata latin, yaitu di=dua, carpa=carpus=sayap, yang berarti buah bersayap dua. Shorea (jenis-jenis meranti, bangkirai, dan balau) biasanya memiliki sayap bervariasi antara 2-5 sayap. Jenis-jenis Dipterokarpa tumbuh secara alami di sebagian besar daerah Kalimantan, Sumatera, Jawa, Nusa Tenggara, Bali, Sulawesi, dan Maluku. Sumatera menempati urutan ke dua setelah Kalimantan dalam hal kekayaan jenis dan penyebaran jenis endemik di dunia (Tata et al. 2008). Shorea memiliki sekitar 194 jenis. Penyebarannya meliputi satu jenis di Jawa, satu atau dua jenis di Sulawesi, tiga jenis di Maluku dan sisanya menyebar ke arah timur sampai Maluku (Indonesia) dan tidak meluas ke Cina bagian selatan (Newman et al. 1999). Ciri-ciri diagnostik utama Shorea adalah pohon sangat besar dengan kulit kayu dalam berlapis-lapis atau coklat merah gelap. Pohon hampir selalu besar, batang utama tinggi dan dua silindris. Tangkai daun berukuran sekitar 0.5-2.5 cm. Daun berukuran panjang 4-18 cm dan lebar 2-8 cm, pangkal daun biasanya simetris, permukaan bawah daun bila diraba licin, pertulangan sekunder bersisip, berjumlah sekitar 7-25 pasang (Newman et al. 1999).
Histogram Histogram derajat keabuan sebuah citra digital pada selang [0, L-1] merupakan sebuah fungsi diskret ( ) n , dengan adalah derajat keabuan yang ke-k dan n adalah jumlah piksel keabuan pada citra yang memiliki tingkat dengan k = 0, 1, . . . , L 1. Melakukan normalisasi histogram merupakan penerapan umum, yaitu dengan cara membagi setiap komponen dengan jumlah seluruh piksel dalam citra, yang dinotasikan dengan produk MN, dengan M dan N merupakan ukuran baris dan kolom citra. Sehingga normalisasi histogram yaitu: ( )
(1)
3 dengan k = 0, 1, 2, ..., L 1. P( ) adalah estimasi dari probabilitas kejadian level intensitas pada suatu citra. Penjumlahan dari seluruh komponen suatu normalisasi histogram sama dengan satu (Gonzalez dan Woods 2008).
Statistical Textures Suatu pendekatan penting untuk melakukan deskripsi region adalah menghitung kandungan teksturnya (texture content). Meskipun tidak ada definisi formal mengenai tekstur, namun deskriptor ini memberikan pengukuran properti seperti kehalusan (smoothness), kekasaran (coarseness), dan keteraturan (regularity). Terdapat tiga prinsip pendekatan untuk mendeskripsikan tekstur region yaitu statistik, struktural, dan spektral (Gonzales dan Woods 2008). Pendekatan statistikal merupakan salah satu pendekatan mudah untuk mendeskripsikan tekstur yaitu dengan menggunakan momen statistik dari histogram intensitas suatu citra atau region (Muhtadan 2009).
Confusion Matrix Confusion matrix merupakan alat yang berguna untuk menganalisis sebaik apakah pengklasifikasi yang digunakan dalam mengenali tuples dari kelas yang berbeda. Confusion matrix untuk dua kelas ditunjukkan pada Gambar 2 (Han dan Kamber 2006).
Gambar 1 Confusion matrix untuk dua kelas Jika terdapat m kelas, confusion matrix adalah suatu tabel yang setidaknya berukuran m m. Masukan pada m baris dan m kolom pertama mengindikasikan jumlah tuples dari kelas i yang telah diberi label oleh pengklasifikasi sebagai kelas j (Han dan Kamber 2006).
Box Plot Box plot merupakan teknik grafis univariat yang sangat berguna. Box plot biasanya digambarkan secara vertikal, akan tetapi format horizontal juga dimungkinkan. Box plot sangat baik dalam menyajikan informasi tentang tendensi sentral, simetri dan kecondongan, serta pencilan. Gambar 1 merupakan penjelasan mengenai notasi-notasi box plot. Box plot terdiri dari kotak persegi panjang yang memuat 50 persen data, dengan atas dan bawah dibatasi oleh hinge yang masingmasing merepresentasikan kuartil Q3 dan Q1. Interquartile range (IQR) adalah ukuran penyebaran data. Semakin tinggi atau semakin lebar IQR (tergantung pada penggambaran box plot) menunjukkan data semakin menyebar. Garis melintang
4 pada kotak menunjukkan median, dan serat (whisker) yang menghubungkan hinges dikedua sisi merepresentasikan data terkecil dan data terbesar. Pencilan (outlier) didefinisikan sebagai suatu pengamatan yang tampak bertentangan atau tidak konsisten terhadap pengamatan yang lain (Tukey 1979).
Gambar 2 Penjelasan box plot
METODE Gambar 3 merupakan alur proses dari metode penelitian ini. Secara umum, metode penelitian terdiri atas pengumpulan data penelitian, praproses, ekstraksi ciri tekstur, pembagian data latih dan data uji, penyimpanan vektor fitur data latih maupun uji, pengklasifikasian data uji dengan KNN, dan tahap terakhir yaitu hasil prediksi. Data Citra Daun Jenis Shorea yang akan digunakan dalam penelitian ini terdiri atas sepuluh spesies. Klasifikasi Shorea dibagi mendadi sepuluh kelas. Label kelas sesuai dengan jenis Shorea yang akan digunakan. Untuk masing-masing kelas digunakan sepuluh buah citra, sehingga total keseluruhan citra adalah 100 buah. Citra daun Shorea yang digunakan pada penelitian ini diakuisisi sendiri dari Kebun Raya Bogor. Teknik pengambilan citra dilakukan dengan menggunakan kamera digital. Daun diletakkan di atas kertas putih sebagai latar belakang. Jarak pengambilan citra dibedakan tergantung pada ukuran citra daun. Proses seleksi terhadap citra daun Shorea juga dilakukan, berdasarkan bentuk dan struktur daun. Pada penelitian ini, pencahayaan pada saat pengambilan citra tidak dirancang.
5 Mulai
Citra Daun
Praproses
Ekstraksi Ciri Tekstur
Data Latih
Data Uji
Simpan Vektor Fitur dan Label Kelas
Simpan Vektor Fitur dan Label Kelas
KNN
Hasil Prediksi
Selesai
Gambar 3 Diagram alir sistem
Praproses Sebelum masuk ke dalam tahap ekstraksi ciri, terlebih dahulu dilakukan praproses untuk citra. Tahap praproses citra dilakukan untuk mempersiapkan citra yang akan digunakan sebelum masuk tahap ekstraksi. Citra masukan untuk untuk ekstraksi tekstur adalah citra grayscale. Citra grayscale tersebut akan diubah ukurannya menjadi lebih kecil dari citra hasil pemotretan awal. Setelah itu, dari citra grayscale tersebut akan dicari nilai histogramnya. Nilai histogram tersebut akan dinormalisasi terlebih dahulu, dengan cara membagi frekuensi setiap nilai derajat keabuan dengan jumlah seluruh piksel dalam citra. Proses manipulasi histogram juga akan dilakukan. Manipulasi tersebut yaitu penghilangan warna background dengan cara mengambil rentang nilai derajat keabuan tertentu.
Ekstraksi Ciri Tekstur Ekstraksi ciri tekstur akan dilakukan dengan menggunakan metode statistical textures. Metode ini akan menghasilkan enam nilai ekstraksi tekstur yaitu intensitas rerata, kontras rerata, smoothness, third moment, uniformity, dan entropy. Di bawah ini merupakan penjelasan dari masing-masing ekstraksi yang telah disebutkan (Leng et al. 2010).
6 1 Perhitungan pertama adalah mean , yang merepresentasikan intensitas rerata. Anggaplah bahwa z adalah variabel acak yang melambangkan intensitas, dan merupakan histogramnya, dengan ( merupakan jumlah tingkat intensitas yang berbeda). ∑
(2)
2 Perhitungan ke dua adalah standar deviasi intensitas. )
∑( Perhitungan standar deviasi
yang menunjukkan kontras ( )
(3)
diperoleh dengan mengakarkan nilai dari ragam. √
(4)
3 Perhitungan ketiga adalah smoothness. Ragam atau juga yang biasa disebut momen ke dua merupakan bagian penting dalam deskripsi tekstur. Momen tersebut adalah pengukuran kontras intensitas yang dapat memberikan deskripsi kehalusan relatif (relative smoothness). ( ⁄
)
(5)
Nilai Ragam dinormalisasi, karena nilai ragam cenderung menjadi besar untuk citra grayscale, maka ragam ini dapat dinormalisasi dengan interval [0, 1]. 4 Perhitungan keempat adalah third moment (momen ketiga). Momen ketiga merupakan pengukuran dari kecondongan (skewness) histogram. Nilai third moment ini juga dinormalisasi. ∑
(
) ( )
(6)
5 Perhitungan kelima adalah keseragaman (uniformity). ∑
(7)
memiliki rentang nilai [0, 1] dan penjumlahanya sama dengan 1, pengukuran adalah maksimum untuk suatu citra dengan semua tingkat keabuannya sama (keseragaman maksimal). 6 Perhitungan terakhir yaitu average entropy atau entropi rerata. Entropi adalah pengukuran variabilitas dan bernilai 0 untuk citra yang konstan. ∑
(8)
Tiap ciri statistical textures akan dilakukan proses normalisasi, yaitu dengan cara membagi setiap nilai dengan nilai terbesar dari himpunan nilai yang ada. Normalisasi ini dilakukan per ciri tekstur. Hal ini dilakukan agar perbedaan nilai
7 antar ciri tekstur statistik tidak terlalu jauh. Semua ciri tekstur statistik yang telah dinormalisasi akan memiliki rantang nilai dari nol sampai satu. Masing-masing ciri statistical textures ini akan dibuat box plot.
Pembagian Data Latih dan Data Uji Seluruh data hasil ekstraksi ciri tekstur dibagi menjadi data latih dan data uji. Presentasi data latih dan data uji pada penelitian ini adalah 80%-20%, yang dipilih secara acak.
KNN K-nearest neighbor adalah salah satu contoh instance-based learning, dengan set data pelatihan (training set) disimpan, sehingga klasifikasi untuk record baru yang belum terklasifikasi dapat ditemukan hanya dengan membandingkannya dengan record paling mirip dalam training set (Larose 2005). Tahap pelatihan algoritme ini hanya menyimpan vektor fitur dan label kelas dari sampel pelatihan (Mirkes 2011). Teknik klasifikasi dari KNN diterapkan pada data latih yang tersedia. Gambar 3 merupakan diagram alir dari algoritme KNN. Mulai
Tentukan k (Jumlah Tetangga Terdekat)
Hitung Jarak Data Uji Ke Training Set Urutkan k Data Berdasarkan Jarak Terkecil
Tentukan Prediksi Kelas Data Uji Berdasarkan Label Kelas Mayoritas
Selesai
Gambar 4 Diagram alir KNN Tentukan k (jumlah tetangga terdekat) Variabel k merupakan jumlah tetangga terdekat dalam klasifikasi. Variabel k merupakan bilangan bulat positif. Pada penelitian ini akan digunakan beberapa nilai k.
8 Hitung jarak data uji ke training set Jarak yang digunakan dalam penilitian ini adalah jarak Euclidean. Tahap ini merupakan perhitungan jarak terdekat untuk setiap data uji. Perhitungan jarak bertujuan untuk mengetahui ukuran kedekatan antara data uji dan latih. Di bawah ini merupakan rumus jarak Euclidean: √∑
(9)
dengan x = , , ...., dan y = , , ...., merepresentasikan atribut nilai m dari dua record (Larose 2005). Urutkan k data berdasarkan jarak terkecil Setelah perhitungan jarak telah dilakukan, maka akan ada k jarak terkecil. Dari k jarak terkecil tersebut, urutkan data dengan jarak terkecil hingga terbesar, lalu berikan peringkat untuk masing-masing data. Tentukan prediksi kelas data uji berdasarkan label kelas mayoritas Penentuan prediksi kelas data uji didasarkan pada label kelas mayoritas pada k. Setelah pemeringkatan data dilakukan, maka akan ditemukan label kelas terbanyak. Label kelas dengan frekuensi terbanyak merupakan hasil kelas prediksi untuk data uji.
Hasil Prediksi Hasil prediksi merupakan output dari sistem. Hasil prediksi ini sangat berpengaruh kepada tingkat akurasi sistem. Mayoritas data uji diharapkan akan diklasifikasikan ke kelas yang benar, sehingga akurasi sistem akan menjadi baik. Akurasi dari suatu classifier pada suatu kumpulan data uji yang diberikan adalah persentase dari tuple kumpulan data uji yang diklasifikasikan dengan benar oleh classifier tersebut. Label kelas terkait dari setiap tuple data uji dibandingkan dengan hasil pembelajaran prediksi kelas dari classifier untuk tuple tersebut (Han dan Kamber 2006). ∑
Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian yaitu: Windows Vista Home Basic. MATLAB R2008b version 7.7.0.471. Microsoft Excel 2010. Perangkat keras yang digunakan dalam penelitian yaitu: Processor Intel Core 2 Duo CPU 2.00 GHz. RAM 2 GB.
(10)
9
HASIL DAN PEMBAHASAN Data Citra Daun Citra yang digunakan adalah sampel daun Shorea milik Kebun Raya Bogor. Ada sepuluh jenis Shorea yang diidentifikasi, yaitu Shorea seminis, pinanga, leprosula, marcoptera, materialis, lepida, johorensis, javanica, platycados, dan palembanica. Sepuluh jenis Shorea tersebut masing-masing terdiri atas sepuluh citra. Ukuran asli citra yaitu 3648 2736 yang diakuisisi menggunakan kamera digital. Pada Gambar 5 disajikan contoh citra untuk masing-masing jenis Shorea.
Gambar 5 Citra jenis Shorea Pada saat pengambilan citra, daun masih melekat pada rantingnya. Pengaturan jarak saat pengambilan citra juga dibedakan berdasarkan jenisnya. Pengaturan jarak antara kamera dengan daun dicantumkan pada Tabel 1. Tabel 1 Pengaturan jarak pengambilan citra Jarak kamera ke daun Jenis Shorea ± 20 – 22 cm lepida, platyclados ± 25 cm marcoptera, johorensis ± 27 – 30 cm pinanga, leprosula, materialis ± 30 cm palembanica ± 32 cm seminis, javanica
Praproses Ukuran citra asli akan mengalami proses pengubahan ukuran, yaitu yang semula berukuran 3648 2736 direduksi menjadi seperlima lebih kecil dari aslinya menjadi 548 730 piksel. Format citra yang digunakan adalah JPG. Citra akan diubah menjadi grayscale. Selanjutnya, nilai histogram akan dicari untuk masing-
10 masing citra grayscale yang telah direduksi. Gambar 6 merupakan contoh alur praproses dari salah satu citra dari jenis seminis. Contoh histogram dari masingmasing kelas dapat dilihat pada Lampiran 1.
Gambar 6 Alur praproses Penghilangan warna background dilakukan dengan cara mengambil rentang nilai tertentu dari histogram yang merupakan perpotongan antara citra daun dengan latar belakang. Rentang nilai untuk masing-masing kelas berbeda-beda. Gambar 7 merupakan contoh ilustrasi dari pemotongan histogram untuk salah satu citra dari kelas javanica.
Gambar 7 Pemotongan histogram untuk kelas javanica Pengambilan rentang nilai ditetapkan dengan mengamati perpotongan yang terjadi pada histogram asli dari suatu citra. Penetapan rentang nilai untuk masingmasing kelas dapat dilihat pada Tabel 2. Tabel 2 Penetapan rentang nilai histogram Rentang nilai 0 - 120 0 - 150 0 - 160 0 - 180
Kelas platyclados lepida, javanica pinanga, leprosula, materialis seminis, marcoptera, johorensis, palembanica
11 Pada Gambar 6, terlihat titik perpotongan terjadi pada saat derajat keabuan bernilai 150, maka untuk kelas javanica akan diambil nilai derajat keabuan dari 0150 saja. Untuk nilai derajat keabuan lebih dari 150 tidak digunakan. Semua citra dalam satu kelas cenderung memiliki pola yang sama untuk penyebaran nilai derajat keabuannya.
Ekstraksi Ciri Tekstur Ekstraksi ciri tekstur dilakukan metode statistical textures yang menghasilkan enam nilai ekstraksi tekstur yaitu intensitas rerata (mean), kontras rerata (standar deviasi), smoothness, third moment, uniformity, dan entropy. Keenam ciri tekstur tersebut disimpan dalam suatu vektor baris. Contoh data tekstur statistik dari masing-masing kelas terdapat pada Lampiran 2, sedangkan contoh data tekstur statistik yang telah dinormalisasi dari masing-masing kelas terdapat pada Lampiran 3. Pada tahap pelatihan, dibuat suatu matriks yang berisi kumpulan data pelatihan yang telah ditentukan label atau kelasnya untuk mengarahkan ciri-ciri tekstur statistik pada data uji. Matriks ini disebut dengan training set. Data pelatihan pada training set ini berupa 80 record tekstur statistik. Tiap record memiliki nilai mean, standar deviasi, smoothness, third moment, uniformity, dan entropy untuk tiap kelas. Ukuran matriks training set ini yaitu 80 6. Setelah ekstraksi ciri dilakukan untuk semua citra, dibuat boxplot untuk masing-masing ciri tekstur statistik. Hal ini dilakukan untuk mengetahui penyebaran data dari ciri tekstur statistik tersebut. Ada dua tipe box plot yang akan dibuat. Tipe 1 yaitu box plot yang diperoleh dari histogram citra grayscale asli, sedangkan tipe 2 yaitu box plot yang diperoleh dari histogram citra grayscale dengan penghilangan warna background dan normalisasi nilai statistcal textures. Tipe 1: Box plot yang diperoleh dari histogram citra grayscale asli
Mean Nilai mean terbesar berdasarkan Gambar 8 terletak pada kelas lepida dengan nilai mean sebesar 223.26. Nilai mean terkecil berada pada kelas javanica dengan nilai mean sebesar 139.83.
12
Gambar 8 Box plot mean tipe 1
Standar Deviasi Nilai standar deviasi terbesar berdasarkan Gambar 9 terletak pada kelas leprosula, dengan nilai standar deviasi sebesar 83.90. Nilai standar deviasi terkecil berada pada kelas platyclados dengan nilai standar deviasi sebesar 35.42.
Gambar 9 Box plot standar deviasi tipe 1
Smoothness Nilai smoothness terbesar berdasarkan Gambar 10 terletak pada kelas leprosula, dengan nilai smoothness sebesar 0.097. Nilai smoothness terkecil berada pada kelas platyclados dengan nilai smoothness sebesar 0.018.
13
Gambar 10 Box plot smoothness tipe 1
Third Moment Nilai third moment terbesar berdasarkan Gambar 11 terletak pada kelas johorensis, dengan nilai third moment sebesar 0.22. Nilai third moment terkecil berada pada kelas palembanica dengan nilai third moment sebesar - .
Gambar 11 Box plot third moment tipe 1
Uniformity Nilai uniformity terbesar berdasarkan Gambar 12 terletak pada kelas lepida, dengan nilai uniformity sebesar 0.46. Nilai uniformity terkecil berada pada kelas javanica dengan nilai uniformity sebesar 0.007.
14
Gambar 12 Box plot uniformity jenis 1
Entropy Nilai entropy terbesar berdasarkan Gambar 13 terletak pada kelas javanica, dengan nilai entropy sebesar 7.36. Nilai entropy terkecil berada pada kelas lepida dengan nilai entropy sebesar 3.09.
Gambar 13 Box plot entropy tipe 1 Tipe 2: Box plot yang diperoleh dari histogram citra grayscale dengan penghilangan warna background dan normalisasi nilai statistcal textures
Mean Nilai mean terbesar berdasarkan Gambar 14 terletak pada kelas johorensis dengan nilai mean sebesar 1. Nilai mean terkecil berada pada kelas platyclados dengan nilai mean sebesar 0.04.
15
Gambar 14 Box plot mean tipe 2
Standar Deviasi Nilai standar deviasi terbesar berdasarkan Gambar 15 terletak pada kelas marcoptera, dengan nilai standar deviasi sebesar 1. Nilai standar deviasi terkecil berada pada kelas platyclados dengan nilai standar deviasi sebesar 0.207.
Gambar 15 Box plot standar deviasi tipe 2
Smoothness Nilai smoothness terbesar berdasarkan Gambar 16 terletak pada kelas pinanga, dengan nilai smoothness sebesar 1. Nilai smoothness terkecil berada pada kelas platyclados dengan nilai smoothness sebesar 0.09.
16
Gambar 16 Box plot smoothness tipe 2
Third Moment Nilai third moment terbesar berdasarkan Gambar 17 terletak pada kelas seminis, dengan nilai third moment sebesar 1. Nilai third moment terkecil berada pada kelas platyclados dengan nilai third moment sebesar 0.05.
Gambar 17 Box plot third moment tipe 2
Uniformity Nilai uniformity terbesar berdasarkan Gambar 18 terletak pada kelas materialis, dengan nilai uniformity sebesar 1. Nilai uniformity terkecil berada pada kelas javanica dengan nilai uniformity sebesar 0.03.
17
Gambar 18 Box plot uniformity tipe 2
Entropy Nilai entropy terbesar berdasarkan Gambar 19 terletak pada kelas johorensis, dengan nilai entropy sebesar 1. Nilai entropy terkecil berada pada kelas platyclados dengan nilai entropy sebesar 0.15.
Gambar 19 Box plot entropy tipe 2
Pembagian Data Latih dan Data Uji Tabel 3 di bawah ini merupakan rincian citra latih dan citra uji yang digunakan dalam sistem. Pembagian citra latih dan citra uji dilakukan secara acak melalui proses pengundian.
18 Tabel 3 Pembagian citra latih dan uji berdasarkan pengundian Data latih Data uji Kelas Citra keCitra keSem 1, 2, 3, 4, 6, 7, 8, 10 5, 9 Pin 1, 2, 3, 4, 5, 8, 9, 10 6, 7 Lep 1, 2, 3, 5, 7, 8, 9, 10 4, 6 Mar 1, 2, 4, 6, 7, 8, 9, 10 3, 5 Mat 1, 2, 4, 5, 7, 8, 9, 10 3, 6 Lei 2, 3, 4, 5, 6, 7, 9, 10 1, 8 Joh 2, 3, 4, 5, 7, 8, 9, 10 1, 6 Jav 2, 3, 4, 5, 6, 8, 9, 10 1, 7 Plt 1, 3, 4, 5, 7, 8, 9, 10 2, 6 Pal 1, 2, 4, 5, 7, 8, 9, 10 3, 6
KNN Jumlah tetangga terdekat (k) yang digunakan dalam penitian ini yaitu sepuluh, dari k=1 sampai k=10. Enam ciri tekstur statistik pada data uji akan dihitung jaraknya dengan 480 ciri tekstur statistik pada training set. Perhitungan jarak dilakukan per tekstur. Dalam penelitian ini dilakukan dua percobaan. Percobaan pertama dilakukan tanpa melakukan pemotongan terhadap histogram dan nilai statistical textures tidak dinormalisasi. Percobaan ke dua dilakukan dengan melakukan pemotongan terhadap histogram dan nilai statistical textures dinormalisasi. Percobaan 1 tanpa penghilangan warna background dan normalisasi
Akurasi
Percobaan pertama dilakukan dengan menggunakan nilai histogram dari citra asli, tanpa dilakukan manipulasi di dalamnya. Gambar 20 merupakan grafik akurasi dari percobaan 1 untuk nilai k=1 sampai k=10. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% k=1 k=2 k=3 k=4 k=5 k=6 k=7 k=8 k=9 k=10 Nilai k
Gambar 20 Grafik akurasi percobaan 1
19 Berdasarkan Gambar 20, nilai k yang menghasilkan akurasi terbesar yaitu k=8 dengan akurasi sebesar 90%, sedangkan akurasi terkecil yaitu 70% yang diperoleh pada saat k=1, k=2, k=4, dan k=10. Untuk mengetahui data mana saja yang salah diklasifikasi, berikut ini merupakan confusion matrix dari hasil klasifikasi percobaan 1 menggunakan k=8. Confusion matrix untuk nilai k yang lain dapat dilihat pada Lampiran 4 sampai Lampiran 12. Tabel 4 Confusion matrix percobaan 1 untuk k=8 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 0 0 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 1 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 0 0 0 0 0 2 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Berdasarkan Tabel 4, kelas yang berhasil diklasifikasikan dengan sempurna untuk setiap citra uji yaitu pinanga, marcoptera, materialis, lepida, johorensis, javanica, platyclados, dan palembanica. Sementara itu dua kelas yang tidak sempurna diklasifikasi yaitu seminis dan leprosula. Untuk kelas seminis citra uji yang salah diklasifikasi merupakan citra uji kedua dan diklasifikasi sebagai kelas johorensis. Pada Tabel 5, data uji kedua dari kelas seminis mengalami penyebaran pada kuadrat jarak. Untuk kelas seminis, hanya satu record yang memiliki kedekatan jarak, dan berada pada peringkat terakhir (peringkat delapan), padahal citra uji tersebut berasal dari kelas yang sama. Sementara itu, untuk kelas johorensis terdapat dua record yang memiliki jarak terdekat dengan data uji, dan kelas inilah yang diprediksi sebagai hasil prediksi. Tabel 5 Hasil kuadrat jarak pada data uji seminis kedua saat k=8 Peringkat Kelas prediksi Kuadrat jarak 1 Palembanica 11.6128 2 Johorensis 18.7406 3 Leprosula 24.8129 4 Pinanga 26.2261 5 Johorensis 26.4702 6 Leprosula 27.0349 7 Marcoptera 36.2030 8 Seminis 41.9431
20 Penjelasan mengenai mengapa hasil prediksi menghasilkan kelas johorensis, sedangkan selain johorensis terdapat leprosula yang memiliki dua record yang menghasilkan jarak yang memiliki kedekatan dengan data uji. Hal itu dikarenakan, peringkat johorensis lebih bagus dibandingkan dengan leprosula, yaitu 2 dan 5 banding 3 dan 6. Untuk kelas leprosula citra uji yang salah diklasifikasi merupakan citra uji pertama dan diklasifikasi sebagai kelas materialis. Pada perbandingan kelas leprosula dengan materialis, tidak terlalu terjadi penyebaran pada kuadrat jarak. Dari kelas materialis terdapat empat record yang menghasilkan jarak yang memiliki kedekatan dengan data uji, sementara itu dari kelas leprosula sendiri tidak ada record yang menghasilkan jarak terdekat. Hal ini berarti, data uji pertama dari kelas leprosula memiliki nilai yang jauh berbeda dengan data leprosula pada training set. Pada Tabel 6 disajikan peringkat dari hasil kuadrat jarak pada kasus ini. Tabel 6 Hasil kuadrat jarak pada data uji leprosula pertama saat k=8 Peringkat Kelas prediksi Kuadrat jarak 1 Javanica 2.5085 2 Materialis 8.0333 3 Materialis 12.2653 4 Javanica 13.1611 5 Materialis 14.2764 6 Pinanga 15.5700 7 Materialis 17.0026 8 Javanica 36.6947 Analisis kesalahan yang terjadi pada kelas seminis dan leprosula dapat dilihat pada box plot perbandingan antara kelas aktual dan kelas prediksi dari masing-masing kelas yang mengalami salah prediksi. Hal itu dilakukan untuk melihat posisi data uji yang salah diprediksi antara kelas aktual dan kelas prediksi tersebut untuk masing-masing ciri tekstur statistik. Di bawah ini merupakan box plot perbandingan antara kelas seminis (kelas aktual) dengan kelas johorensis (kelas prediksi) untuk ciri tekstur mean. Posisi nilai mean data uji pada Gambar 21 ditandai dengan garis putus-putus.
Gambar 21 Box plot mean antara seminis dan johorensis
21 Gambar di atas menunjukkan bahwa posisi nilai mean data uji seminis pertama yaitu 178.50 berada pada lower whisker dan menyinggung lower whisker dari kelas johorensis. Hal itu berarti nilai mean data uji tersebut lebih rendah dari kumpulan nilai mean yang berada dalam bidang IQR. Tekstur statistik selain mean, sebagian besar juga menunjukkan bahwa posisi data uji dalam box plot berada pada lower whisker atau upper whisker, kecuali untuk uniformity dan entropy. Untuk standar deviasi dan smoothness, posisi data uji berada pada upper whisker end (nilai tertinggi dalam himpunan). Box plot perbandingan antara kelas seminis dengan kelas johorensis untuk ciri tekstur yang lain dapat dilihat pada Lampiran 13 sampai Lampiran 17. Berdasarkan fakta tersebut, kesalahan yang terjadi pada kasus ini diprediksi karena data uji seminis ini memiliki nilai yang jauh dari data nilai mean dominan atau nilai mean yang terletak dalam bidang IQR dalam kelas seminis. Hal ini sangat berpengaruh, karena perhitungan KNN didasarkan pada kedekatan jarak antara data uji dengan himpunan data latih. Data uji ini juga tidak begitu memiliki kedekatan yang signifikan dengan kelas johorensis, karena posisi data uji tersebut jika ditinjau dari kelas johorensis sendiri, tidak juga berada dalam bidang IQR. Hal ini relevan dengan hasil kuadrat jarak pada Tabel 5 yang menunjukkan penyebaran kuadrat jarak yang terjadi pada kasus ini. Selanjutnya yaitu analisis kesalahan yang terjadi pada kelas leprosula berdasarkan box plot. Gambar 22 merupakan box plot perbandingan antara kelas leprosula (kelas aktual) dengan kelas materialis (kelas prediksi) untuk ciri tekstur mean. Posisi nilai mean data uji pada Gambar 22 ditandai dengan garis putusputus.
Gambar 22 Box plot mean antara leprosula dan materialis Gambar di atas menunjukkan bahwa posisi nilai mean data uji leprosula pertama yaitu 163.36 berada pada lower whisker end dan menyinggung upper whisker dari kelas materialis. Hal itu berarti nilai mean data uji tersebut merupakan yang terendah pada kelas leprosula. Seperti halnya kasus seminis di atas, kesalahan yang terjadi pada kasus ini diprediksi karena nilai mean dari data uji leprosula ini memiliki nilai yang jauh dari nilai mean dominan atau nilai mean yang terletak dalam IQR dalam kelas leprosula. Berdasarkan Gambar 22 pula dapat dilihat bahwa nilai mean dari data uji ini cenderung memiliki kedekatan dengan kelas materialis. Hal ini dapat dilihat dari ukuran kotak (bidang IQR) dari box plot. Pada kelas leprosula, ukuran
22 kotak lebih panjang, sedangkan pada kelas materialis ukuran kotak lebih kecil. Hal itu berarti nilai mean pada kelas leprosula memiliki penyebaran nilai mean yang luas atau memiliki rentang yang lebih besar dibandingkan dengan nilai mean pada kelas materialis, yang menyebabkan kesalahan prediksi dalam kasus ini. Nilai tekstur statistik lain yang berada pada lower whisker yaitu standar deviasi dan smoothness. Untuk nilai third moment, uniformity, dan entropy berada dalam IQR. Meskipun nilai ketiga tekstur tersebut termasuk ke dalam 50% dari himpunan data, hal itu tidak berpengaruh banyak dalam kontribusi untuk menentukan kuadrat jarak akhir dalam kasus ini. Box plot perbandingan antara kelas leprosula dan kelas materialis untuk ciri tekstur yang lain dapat dilihat pada Lampiran 18 sampai Lampiran 22. Percobaan 2 dengan penghilangan warna background dan normalisasi
Akurasi
Percobaan ke dua dilakukan dengan menggunakan nilai histogram yang telah dimanipulasi. Manipulasi dilakukan dengan cara mengambil rentang nilai tertentu dari nilai derajat keabuan. Setelah histogram dimanipulasi, nilai statistical textures juga akan dinormalisasi dengan cara membagi nilai tekstur statistik dengan nilai yang terbesar yang terdapat dalam himpunan data. Normalisasi ini dilakukan per tekstur. Gambar 23 merupakan grafik akurasi dari percobaan 2 untuk nilai k=1 sampai k=10. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% k=1 k=2 k=3 k=4 k=5 k=6 k=7 k=8 k=9 k=10 Nilai k
Gambar 23 Grafik akurasi percobaan 2 Berdasarkan Gambar 20, nilai k yang menghasilkan akurasi terbesar yaitu k=7, k=9, dan k=10 dengan akurasi sebesar 75%, sedangkan akurasi terkecil yaitu 60% yang diperoleh pada saat k=3, k=4, dan k=6. Percobaan 2 menghasilkan akurasi 15% lebih rendah dibandingkan dengan percobaan 1 yang menghasilkan akurasi tertinggi sebesar 90% pada saat k=8. Tidak terjadinya peningkatan akurasi bisa dipengaruhi oleh faktor pencahayaan yang tidak seragam sehingga berpengaruh pada histogram yang dihasilkan. Untuk mengetahui data mana saja yang salah diklasifikasi, berikut ini merupakan confusion matrix dari hasil klasifikasi percobaan 2 dengan
23 menggunakan k=7. Confusion matrix untuk masing-masing k dapat dilihat pada Lampiran 23 sampai Lampiran 31. Tabel 7 Confusion matrix percobaan 2 untuk k=7 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 2 0 0 0 0 0 0 0 0 1
Pin 0 2 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 2 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Berdasarkan Tabel 7, kelas yang berhasil diklasifikasikan dengan sempurna untuk setiap citra uji yaitu seminis, pinanga, marcoptera, lepida, johorensis, javanica, dan platyclados. Sementara itu tiga kelas yang tidak sempurna diklasifikasi yaitu leprosula, materialis, dan palembanica. Seluruh citra uji untuk kelas leprosula dan materialis gagal diklasifikasi dengan benar. Citra uji pertama dari kelas leprosula diklasifikasi menjadi kelas javanica, sedangkan citra uji ke dua diklasifikasi menjadi kelas materialis. Tabel 8 menjelaskan peringkat dari hasil kuadrat jarak yang terjadi pada kelas leprosula untuk data uji pertama pada saat k=7. Pada Tabel 8, tidak ada satu pun record yang memiliki kedekatan dengan kelas leprosula, sedangkan dari kelas javanica terdapat empat record yang menghasilkan jarak terdekat dengan data uji. Hal ini berarti, data uji pertama dari kelas leprosula memiliki nilai yang jauh berbeda dengan data leprosula pada training set dan lebih memiliki kedekatan dengan data javanica pada training set. Tabel 8 Hasil kuadrat jarak pada data uji leprosula pertama saat k=7 Peringkat Kelas prediksi Kuadrat jarak 1 Javanica 0.00336 2 Javanica 0.00701 3 Materialis 0.00758 4 Javanica 0.00842 5 Javanica 0.01584 6 Materialis 0.02687 7 Palembanica 0.03778 Seluruh citra uji dari kelas materialis diklasifikasi menjadi kelas pinanga. Tabel 10 menjelaskan peringkat dari hasil kuadrat jarak yang terjadi pada kelas materialis untuk data uji pertama pada saat k=7. Untuk data uji pertama dari kelas materialis, pada Tabel 10 terjadi kasus seri seperti pada percobaan 1, yaitu kelas pinanga dan materialis sama-sama memiliki
24 tiga jarak terdekat. Peringkat pinanga lebih bagus dibandingkan dengan materialis, yaitu 1, 2 dan 6, sedangkan materialis yaitu 4, 5 dan 7. Tabel 9 Hasil kuadrat jarak pada data uji materialis pertama saat k=7 Peringkat Kelas prediksi Kuadrat jarak 1 Pinanga 0.00001 2 Pinanga 0.00005 3 Leprosula 0.00014 4 Materialis 0.00014 5 Materialis 0.00015 6 Pinanga 0.00070 7 Materialis 0.00077 Untuk kelas palembanica, citra uji yang gagal diklasifikasi merupakan citra uji pertama, yang diklasifikasi menjadi kelas seminis. Tabel 12 merupakan daftar peringkat dari hasil kuadrat jarak yang terjadi untuk data uji pertama dari kelas palembanica. Tabel 10 Hasil kuadrat jarak pada data uji palembanica pertama saat k=7 Peringkat Kelas prediksi Kuadrat jarak 1 Palembanica 0.00346 2 Seminis 0.00901 3 Marcoptera 0.01001 4 Palembanica 0.01566 5 Seminis 0.01949 6 Seminis 0.03581 7 Marcoptera 0.04369 Berdasarkan Tabel 12, data uji pertama dari kelas palembanica memiliki nilai yang cukup dekat dengan kelas seminis, marcoptera, dan palembanica sendiri. Dari kelas seminis menghasilkan tiga record jarak terkecil, sedangkan untuk kelas palembanica dan marcoptera masing-masing menghasilkan dua record. Analisis kesalahan berdasarkan box plot dilakukan untuk kelas leprosula saja, karena kecendrungan pola box plot yang sama pada ke tiga kelas yang mengalami kesalahan prediksi. Gambar 24 merupakan box plot perbandingan antara kelas leprosula (kelas aktual) dengan kelas javanica (kelas prediksi) untuk ciri tekstur mean. Posisi nilai mean data uji pada Gambar 24 ditandai dengan garis putus-putus. Posisi nilai mean data uji leprosula pertama yaitu 0.308 berada pada lower whisker end yang berarti merupakan nilai mean terkecil dari kelas leprosula.
25
Gambar 24 Box plot mean antara leprosula dan javanica Gambar di atas menunjukkan bahwa posisi nilai mean data uji leprosula menyinggung bidang IQR dari kelas javanica. Hal ini berarti tampak jelas bahwa nilai mean dari data latih ini lebih memiliki keseragaman dengan kelas javanica, bukan dengan kelas leprosula yang merupakan kelas aktualnya, sehingga data uji ini mengalami kesalahan prediksi. Bukan hanya posisi dari nilai mean saja, hampir semua posisi dari nilai tekstur statistik lainnya, kecuali uniformity, yang menyinggung bidang IQR dari kelas javanica. Box plot perbandingan antara kelas leprosula dan kelas javanica untuk ciri tekstur yang lain dapat dilihat pada Lampiran 32 sampai Lampiran 36.
Perbandingan dengan Penelitian Terkait Penelitian yang terkait dengan penelitian ini adalah penilitian dari Nurjayanti (2011) dan Ramadhan (2012). Perbandingan ini dilakukan berdasarkan pada objek penelitian, ekstraksi fitur, pengklasifikasi yang digunakan, dan akurasi yang didapatkan. Di bawah ini merupakan tabel perbandingan dengan penelitian sejenis yang telah dilakukan sebelumnya. Tabel 11 Perbandingan dengan penelitian terkait Nama peneliti Objek penelitian Ekstraksi fitur Pengklasifikasi Nurjayanti 5 jenis daun Morfologi daun KNN (2011) Shorea Ramadhan (2012)
Citra 10 jenis daun Shorea
Discrete wavelet transform Model warna hue saturation value (HSV)
Backpropagation neural network
Data daun Shorea yang diteliti oleh Nurjayanti (2011) adalah Shorea multiflora, palembanica, balengaran, lepida, dan assamica. Karakteristik morfologi daun yang digunakan yaitu panjang daun, lebar daun, bentuk tulang daun, dan lain-lain. Citra daun Shorea yang diteliti oleh Ramadhan (2012) sama
26 dengan penelitian ini. Discrete wavelet transform yang digunakan yaitu DWT Daubechies dan Haar. Penelitian ini menghasilkan akurasi lebih rendah dibandingkan dengan dua penelitian tersebut. Akurasi tertinggi dalam penelitian ini yaitu 90% dan terendah yaitu 70%. Akurasi untuk penelitian Nurjayanti (2011) yaitu 100%. Nurjayanti (2011) mendapatkan nilai akurasi sebesar 100% diperoleh karena terdapat fiturfitur morfologi daun yang bersifat nominal/kategori. Fitur-fitur nominal tersebut yaitu bentuk tulang daun, permukaaan daun, ujung daun, dan pangkal daun. Nilai dari fitur-fitur nominal tersebut diinputkan secara manual. Sementara pada penelitian ini, nilai-nilai fitur diperoleh berdasarkan histogram citra grayscale yang dipengaruhi oleh banyak faktor, seperti pencahayaan, kekontrasan citra, dan lain-lain. Penelitian Ramadhan (2012) memperoleh akurasi tertinggi sebesar 93.3% dan terendah sebesar 33.33% yang menggabungkan DWT Haar dan Daubechies, serta ekstraksi warna HSV.
SIMPULAN DAN SARAN Simpulan Pada penelitian ini, identifikasi sepuluh jenis Shorea dilakukan menggunakan algoritme KNN berdasarkan enam fitur tekstur statistik, yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan entropy. Penelitian ini dilakukan dengan dua kali percobaan. Percobaan pertama yaitu tanpa menghilangkan warna background pada histogram citra grayscale dan tanpa normalisasi nilai statistical textures. Percobaan pertama ini menghasilkan akurasi tertinggi pada saat nilai k=8 dengan akurasi sebesar 90%. Kesalahan prediksi terjadi pada Shorea jenis seminis dan leprosula. Percobaan kedua yaitu dengan menghilangkan warna background pada histogram citra grayscale dan dengan normalisasi nilai statistical textures. Percobaan kedua ini menghasilkan akurasi tertinggi pada saat nilai k=7, k=9, dan k=10, dengan akurasi sebesar 75%. Kesalahan prediksi terjadi pada Shorea jenis leprosula, materialis, dan palembanica.
Saran Pada penelitian ini masih memiliki beberapa kekurangan yang dapat diperbaiki pada penelitian selanjutnya. Adapun beberapa saran untuk penelitian selanjutnya yaitu: 1 Menggunakan classifier lain seperti probabilistic neural network (PNN). 2 Pencahayaan pada saat pengambilan citra diseragamkan.
27
DAFTAR PUSTAKA Gonzalez RC, Woods RE. 2008. Digital Image Processing. Ed ke-3. New Jersey (US): Prentice Hall. Han J, Kamber M. 2006. Data Mining Concept and Techniques. Ed ke-2. San Fransisco (US): Morgan Kaufmann. Istomo, Wibowo C, Hidayati N. 1999. Evaluasi pertumbuhan tanaman meranti (Shorea spp.) di Haurbentes BKPH Jasinga KPH Bogor Perum Perhutani Unit III Jawa Barat. Manajemen Hutan Tropika. 5(2):13-22. Larose DT. 2005. Discovering Knowledge in Data An Introduction to Data Mining. New Jersey (US): J Wiley. Leng J, Huang Z, Li D. 2010. Features extraction and classification of cartridge images for ballistics identification. Di dalam: International Conference on Industrial Engineering and Other Applications of Applied Intelligent Systems; 2010 Jun; Cordoba, Spanyol. Berlin (DE): Springer. hlm 331-340. Mirkes EM. 2011. KNN and potential energy: applet [internet]. [diunduh 2013 Sep 6]. Tersedia pada: http://www.math.le.ac.uk/people/ag153/homepage/ KNN/KNN3.html. Muhtadan. 2009. Ekstraksi ciri cacat pengelasan pada citra digital film radiografi menggunakan geometric invariant moment dan statistical texture. Jurnal Forum Nuklir. 3(2):83-106. Newman MF, Burgess PF, Whitmore TC. 1999. Pedoman Identifikasi PohonPohon Dipterocarpaceae Jawa sampai Nugini. Bogor (ID): Prosea Indonesia. Nurjayanti B. 2011. Identifikasi Shorea menggunakan k-nearest neighbour berdasarkan karakteristik morfologi daun [skripsi]. Bogor (ID): Institut Pertanian Bogor. Ojala T, Pietikäinen M. 2004. Texture classification [internet]. [diacu 2011 Okt 24]. Tersedia pada: http://homepages.inf.ed.ac.uk/rbf/CVonline/ LOCAL_COPIES/OJALA1/texclas.htm Ramadhan IA. 2012. Identifikasi daun Shorea dengan backpropagation neural network menggunakan ekstraksi fitur discrete wavelet transform dan ekstraksi warna HSV [skripsi]. Bogor (ID): Institut Pertanian Bogor. Tata HL, Wibawa G, Joshi L. 2008. Penanaman Meranti di Kebun Karet. Bogor (ID): World Agroforestry Centre, ICRAF Southeast Asia. Tukey JW. 1979. Exploratory Data Analysis. London (GB): Addison-Wesley.
28 Lampiran 1 Contoh citra dan histogram dari masing-masing kelas seminis
pinanga
leprosula
marcoptera
29 Lampiran 1 Lanjutan materialis
lepida
johorensis
javanica
30 Lampiran 1 Lanjutan platyclados
palembanica
31 Lampiran 2 Contoh data tekstur statistik dari masing-masing kelas Third Kelas Mean St. dev Smoothness Uniformity Entropy moments 213.5769 57.2810 Seminis 0.04803 -2.80233 0.13878 5.1516 Pinanga 154.0644 78.1575 0.08587 -0.71603 0.01088 6.9298 Leprosula 182.9605 72.7094 0.07519 -3.14237 0.01685 6.5532 Marcoptera 196.1952 70.3251 0.07068 -2.88252 0.22892 4.7332 Materialis 161.2489 65.5043 0.06190 -2.24268 0.01298 6.6188 Lepida 215.4101 60.8303 0.05384 -5.20403 0.05601 5.7946 Johorensis 181.6181 66.9807 0.06454 -0.06108 0.11831 5.5529 Javanica 147.6544 61.1049 0.05430 -2.53531 0.01053 6.9286 Platyclados 157.7369 52.1889 0.04020 -3.64447 0.02164 6.0113 Palembanica 185.1806 63.7463 0.05882 -5.90845 0.01703 6.4140 Lampiran 3 Contoh data tekstur statistik ternormalisasi dari masing-masing kelas Third Kelas Mean St. dev Smoothness Uniformity moments Seminis 0.5299 0.9549 0.81536 0.94188 0.22372 Pinanga 0.5547 0.6188 0.44897 0.33986 0.73396 Leprosula 0.5513 0.7593 0.66270 0.57791 0.36063 Marcoptera 0.6971 0.9151 0.75325 0.78281 0.32718 Materialis 0.4178 0.5963 0.47361 0.30758 0.59703 Lepida 0.2639 0.6924 0.62944 0.68847 0.07230 Johorensis 0.9682 0.8681 0.68227 0.57496 0.68404 Javanica 0.3478 0.6099 0.49455 0.46269 0.35094 Platyclados 0.1154 0.3286 0.23052 0.13467 0.15898 Palembanica 0.2164 0.5828 0.31791 0.36764 0.14301
Entropy 0.56283 0.87070 0.75064 0.80257 0.64251 0.40800 0.97076 0.66082 0.33772 0.44777
32 Lampiran 4 Confusion matrix percobaan 1 untuk k = 1 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 0 0 0
Pin 0 1 0 0 0 0 0 0 0 0
Lep 0 1 1 1 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 2 0 0 0 1 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 0 0 0
Plt 0 0 0 0 0 0 0 0 1 0
Pal 1 0 0 0 0 0 0 0 0 2
Lampiran 5 Confusion matrix percobaan 1 untuk k = 2 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 0 Plt 0 Pal 0
Pin 0 1 0 0 0 0 0 0 0 0
Lep 0 1 1 1 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 2 0 0 0 1 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 0 0 0
Plt 0 0 0 0 0 0 0 0 1 0
Pal 1 0 0 0 0 0 0 0 0 2
Jav 0 0 0 0 1 0 0 1 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 1 0 0 0 0 0 0 0 0 2
Lampiran 6 Confusion matrix percobaan 1 untuk k = 3 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 0 Plt 0 Pal 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 1 0 0 0 0 2 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 0
33 Lampiran 7 Confusion matrix percobaan 1 untuk k = 4 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 0 0 0
Pin 0 2 1 0 0 0 0 0 0 0
Lep 0 0 0 1 0 0 0 0 0 1
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 1 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 1 0 0 0 0 0 0 0 0 1
Jav 0 0 0 0 0 0 0 2 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Jav 0 0 0 0 0 0 0 2 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Lampiran 8 Confusion matrix percobaan 1 untuk k = 5 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 0 0 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 1
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 1 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Lampiran 9 Confusion matrix percobaan 1 untuk k = 6 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 0 0 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 1
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 1 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
34 Lampiran 10 Confusion matrix percobaan 1 untuk k = 7 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 0 Plt 0 Pal 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 1
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 1 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 0 0 0 0 0 2 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Plt 0 0 0 0 0 0 0 0 2 0
Pal 1 0 0 0 0 0 0 0 0 1
Lampiran 11 Confusion matrix percobaan 1 untuk k = 9 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 0 Plt 0 Pal 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 1
Kelas Hasil Prediksi Mar Mat Lei Joh 0 0 0 1 0 0 0 0 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 0 0 0 0 0 2 0 0
Lampiran 12 Confusion matrix percobaan 1 untuk k = 10 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 0 Plt 0 Pal 0
Pin 0 2 0 0 0 0 0 0 0 0
Lep 0 0 1 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 2 0 0 0 0 2 0 0 0 0 2 0 2 0 0 0 0 0 0 1 0 0 0
Jav 0 0 0 0 0 0 0 0 0 0
35 Lampiran 13 Box plot standar deviasi (posisi nilai 70.06) antara seminis dan johorensis
Lampiran 14 Box plot smoothness (posisi nilai 0.07) antara seminis dan johorensis
36 Lampiran 15 Box plot third moment (posisi nilai -3.49) antara seminis dan johorensis
Lampiran 16 Box plot uniformity (posisi nilai 0.014) antara seminis dan johorensis
37 Lampiran 17 Box plot entropy (posisi nilai 6.74) antara seminis dan johorensis
Lampiran 18 Box plot standar deviasi (posisi nilai 68.08) antara leprosula dan materialis
38 Lampiran 19 Box plot smoothness (posisi nilai 0.06) antara leprosula dan materialis
Lampiran 20 Box plot third moment (posisi nilai -4.02) antara leprosula dan materialis
39 Lampiran 21 Box plot uniformity (posisi nilai 0.017) antara leprosula dan materialis
Lampiran 22 Box plot entropy (posisi nilai 6.40) antara leprosula dan materialis
40 Lampiran 23 Confusion matrix percobaan 2 untuk k = 1 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 1 Plt 0 Pal 0
Pin 0 1 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 1 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 1 1 0 0 0 0 1 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Lampiran 24 Confusion matrix percobaan 2 untuk k = 2 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 1 Plt 0 Pal 0
Pin 0 1 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 1 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 1 1 0 0 0 0 1 0 0
Lampiran 25 Confusion matrix percobaan 2 untuk k = 3 Kelas aktual Sem Sem 1 Pin 0 Lep 0 Mar 1 Mat 0 Lei 0 Joh 0 Jav 1 Plt 0 Pal 0
Pin 0 1 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 1 1 0 0 0 0 1 0 0
41 Lampiran 26 Confusion matrix percobaan 2 untuk k = 4 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 1 0 0 0 1 0 0
Pin 0 1 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 1 1 0 0 0 0 1 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Lampiran 27 Confusion matrix percobaan 2 untuk k = 5 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 1 0 0
Pin 0 1 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 1 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 1 1 0 0 0 0 1 0 0
Lampiran 28 Confusion matrix percobaan 2 untuk k = 6 Kelas aktual Sem Pin Lep Mar Mat Lei Joh Jav Plt Pal
Sem 1 0 0 0 0 0 0 1 0 1
Pin 0 1 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 1 0 0 0 0 0 0 0 0 1 0 0 2 0 0 0 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 1 1 0 0 0 0 1 0 0
42 Lampiran 29 Confusion matrix percobaan 2 untuk k = 8 Kelas aktual Sem Sem 2 Pin 0 Lep 0 Mar 1 Mat 0 Lei 0 Joh 0 Jav 1 Plt 0 Pal 1
Pin 0 2 0 0 2 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 2 0 0
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 1
Plt 0 0 0 0 0 0 0 0 2 0
Pal 0 0 0 0 0 0 0 0 0 2
Lampiran 30 Confusion matrix percobaan 2 untuk k = 9 Kelas aktual Sem Sem 2 Pin 0 Lep 0 Mar 0 Mat 0 Lei 0 Joh 0 Jav 1 Plt 0 Pal 1
Pin 0 2 0 0 1 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 1 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 2 0 0
Lampiran 31 Confusion matrix percobaan 2 untuk k = 10 Kelas aktual Sem Sem 2 Pin 0 Lep 0 Mar 1 Mat 0 Lei 0 Joh 0 Jav 1 Plt 0 Pal 0
Pin 0 2 0 0 1 0 0 0 0 0
Lep 0 0 0 0 0 0 0 0 0 0
Kelas hasil prediksi Mar Mat Lei Joh 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0
Jav 0 0 1 0 0 0 0 2 0 0
43 Lampiran 32 Box plot standar deviasi (posisi nilai 0.54) antara leprosula dan javanica
Lampiran 33 Box plot smoothness (posisi nilai 0.34) antara leprosula dan javanica
44 Lampiran 34 Box plot third moment (posisi nilai 0.25) antara leprosula dan javanica
Lampiran 35 Box plot uniformity (posisi nilai 0.31) antara leprosula dan javanica
45 Lampiran 36 Box plot entropy (posisi nilai 0.60) antara leprosula dan javanica
46 RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 29 Desember 1988 di Jakarta. Penulis merupakan anak ke dua dari dua bersaudara dari pasangan Bapak H Rusmawi Baksin dan Ibu Hj Tri Hastuti. Pada tahun 2006, penulis lulus dari SMA Muhammadiyah 5 Jakarta. Pada tahun yang sama, penulis lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB. Pada Tahun 2009, penulis lulus dari program Diploma Jurusan Teknik Komputer Institut Pertanian Bogor. Pada tahun yang sama, penulis melanjutkan program studi Sarjana di Departemen Ilmu Komputer, Institut Pertanian Bogor, Program Studi Ilmu Komputer.