ABSTRACT BRYAN NURJAYANTI. Shorea Identification Using k-Nearest Neighbour Based on Morphological Characteristics of Leaves. Supervised by AZIZ KUSTIYO. Dipterocarpaceae is a group of tropical plants that is used in a timber industry. One of Dipterocarpaceae clans is Shorea, that is the best timber-producing plant in the industrial world. Shorea is difficult to be identified because it has a lot of diversity. The inability to recognize Shorea in forest will enlarge the exploitation of Shorea that has a good timber quality, and silviculture work becomes less of the target because it is not known which Shorea species that will extinct. Shorea tree is usually identified by using the stems, leaves, fruits, and flowers. However, leave is used for the identification in this research because it tends to be available as a source of observation at anytime. The leaves in this reasearch are the collection from Bogor Botanical Gardens. Data are obtained by manual calculating to get the characteristics of the leaves. The obtained data will be processed using k-Nearest Neighbor to get the closeness of new data and training data. The leaves that are included in this research are Shorea multiflora, palembanica, balangeran, lepida and assamica, each one has 10 data. Each set of data has 10 attributes that support the leaf characteristics. From the whole data, Shorea are divided into five subsets including data training and data testing for each subset. This research has two experiments the first experiment without normalization produces 84% accuracy and the second experiment with a normalization produces 100% accuracy. Keywords : Shorea, k-Nearest Neighbour.
iii
IDENTIFIKASI SHOREA MENGGUNAKAN k-NEAREST NEIGHBOUR BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN
BRYAN NURJAYANTI
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 ii
Judul Penelitian Nama NRP
: Identifikasi
Shorea Menggunakan k-Nearest Neighbour Berdasarkan Karakteristik Morfologi Daun : Bryan Nurjayanti : G64086022
Menyetujui :
Pembimbing
Aziz Kustiyo, S.Si., M.Kom. NIP 19700719 199802 1 001
Mengetahui : Ketua Departemen
Dr. Ir. Sri Nurdiati, M.Sc. NIP. 19601126 198601 2 001
Tanggal Lulus :
iv
RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 8 September 1987. Anak pertama dari 2 bersaudara, dari pasangan Bapak Abdi Iskandar dan Ibu Susilowati. Pada tahun 2005 penulis lulus dari SMU Negeri 89 Jakarta, kemudian melanjutkan pendidikan Diploma III pada Program Studi Manajemen Informatika, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB. Lulus Diploma pada Tahun 2008 penulis melanjutkan studi di Institut Pertanian Bogor Jurusan Ilmu Komputer (ekstensi) untuk memperoleh gelar sarjana. Selama menjalani perkuliahan penulis pernah menjadi asisten dosen di Direktorat Program Diploma Institut Pertanian Bogor pada tahun 2009 sampai 2011.
v
PRAKATA Puji dan syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Terima kasih penulis ucapkan kepada Bapak Aziz Kustiyo, S.Si, M.Kom selaku pembimbing. Adapun penulis mengucapkan terima kasih kepada: 1. Kedua orang tua dan kakak yang telah memberikan dukungan, perhatian, dan doa sehingga penulis dapat menyelesaikan studi di Departemen Ilmu Komputer IPB. 2. Dosen penguji Bapak Toto Haryanto, S.Kom, M.Si dan Bapak Mushthofa, S.Kom, M.Sc atas saran dan bimbingannya. 3. Pihak Kebun Raya Bogor atas sample daun Shorea. 4. Pihak Biotrop atas literatur tentang Shorea. 5. Seluruh dosen pengajar dan civitas akademika Departemen Ilmu Komputer FMIPA IPB. 6. Asep yang telah banyak membantu dalam pembuatan penelitian ini. 7. Dewi ”Meong” teman seperjuangan semasa kuliah. 8. Teman-teman satu bimbingan atas kerjasamanya. 9. Teman-teman Ekstensi ILKOM angkatan 3, atas kerjasamanya selama perkuliahan. 10. Semua pihak yang telah membantu yang belum disebutkan di atas. Semoga penelitian ini dapat bermanfaat bagi semua pihak yang membutuhkan.
Bogor, Juni 2011
Bryan Nurjayanti
vi
DAFTAR ISI Halaman DAFTAR ISI ......................................................................................................................................... vii DAFTAR GAMBAR ............................................................................................................................viii DAFTAR TABEL ................................................................................................................................viii DAFTAR LAMPIRAN.........................................................................................................................viii PENDAHULUAN ................................................................................................................................... 1 Latar Belakang ..................................................................................................................................... 1 Tujuan .................................................................................................................................................. 1 Ruang Lingkup ..................................................................................................................................... 1 Manfaat ................................................................................................................................................ 1 TINJAUAN PUSTAKA .......................................................................................................................... 1 Shorea .................................................................................................................................................. 1 K-Fold Cross Validation ...................................................................................................................... 3 Normalisasi .......................................................................................................................................... 3 Confusion Matrix ................................................................................................................................. 3 KNN (K-Nearest Neighbour) ............................................................................................................... 3 METODOLOGI PENELITIAN............................................................................................................... 4 Kerangka Penelitian ............................................................................................................................. 4 Identifikasi Masalah ............................................................................................................................. 4 Pengadaan Data ................................................................................................................................... 5 Praproses Data ...................................................................................................................................... 6 Penentuan Data Latih dan Data Uji ...................................................................................................... 6 Klasifikasi ............................................................................................................................................ 6 Model Daun Shorea ............................................................................................................................. 6 Hasil Prediksi ....................................................................................................................................... 6 Lingkungan Pengembangan ................................................................................................................. 6 HASIL DAN PEMBAHASAN ............................................................................................................... 7 Praproses .............................................................................................................................................. 7 Percobaan pertama (tanpa normalisasi) ................................................................................................ 8 Percobaan kedua (dengan normalisasi) ................................................................................................ 9 KESIMPULAN DAN SARAN ............................................................................................................. 10 Kesimpulan ........................................................................................................................................ 10 Saran .................................................................................................................................................. 10 DAFTAR PUSTAKA ............................................................................................................................ 10 LAMPIRAN .......................................................................................................................................... 12
vii
DAFTAR GAMBAR Halaman 1 Pohon Shorea. ...................................................................................................................................... 2 2 Daun Shorea multiflora. ...................................................................................................................... 2 3 Daun Shorea palembanica. .................................................................................................................. 2 4 Daun Shorea balangeran. .................................................................................................................... 2 5 Daun Shorea lepida. ............................................................................................................................ 2 6 Daun Shorea assamica......................................................................................................................... 3 7 Diagram alur pembuatan sistem........................................................................................................... 4 8 Lebar dan panjang daun ....................................................................................................................... 5 9 Ujung daun .......................................................................................................................................... 5 10 Pangkal daun. ..................................................................................................................................... 5 11 Sudut daun ......................................................................................................................................... 6 12 Akurasi klasifikasi percobaan pertama. ............................................................................................. 8 13 Hasil iterasi tanpa normalisasi. .......................................................................................................... 9 14 Akurasi klasifikasi percobaan kedua.................................................................................................. 9 15 Perbandingan akurasi. ...................................................................................................................... 10 DAFTAR TABEL
Halaman 1 Confusion matrix dua kelas.................................................................................................................. 3 2 Data daun ............................................................................................................................................. 7 3 Selang nilai fitur daun .......................................................................................................................... 7 4 Konversi fitur-fitur nominal ................................................................................................................. 7 5 Susunan data latih dan data uji............................................................................................................. 8 6 Confusion matrix percobaan pertama .................................................................................................. 8 7 Perhitungan jarak tanpa normalisasi .................................................................................................... 9 8 Hasil perhitungan dengan normalisasi ............................................................................................... 10 DAFTAR LAMPIRAN
Halaman 1 Tabel data penelitian daun Shorea. .................................................................................................... 13 2 Contoh hasil perhitungan Euclidean sebelum normalisasi. ............................................................... 14 3 Contoh hasil perhitungan Euclidean sesudah normalisasi. ................................................................ 15 4 Contoh hasil perhitungan nominal. .................................................................................................... 16 5 Contoh hasil penggabungan kedua jarak sebelum normalisasi. ......................................................... 17 6 Contoh hasil penggabungan kedua jarak sesudah normalisasi........................................................... 18 7 Confusion matrix dengan nilai k=2. ................................................................................................... 19 8 Confusion matrix dengan nilai k=3 .................................................................................................... 19 9 Confusion matrix dengan nilai k=5 .................................................................................................... 19 10 Confusion matrix dengan nilai k=6 .................................................................................................. 20 11 Confusion matrix dengan nilai k=7 .................................................................................................. 20 12 Confusion matrix dengan nilai k=8 .................................................................................................. 20 13 Confusion matrix dengan nilai k=9 .................................................................................................. 21
viii
PENDAHULUAN Latar Belakang Dipterocarpaceae adalah sekelompok tumbuhan hutan hujan tropis yang dimanfaatkan dalam bidang perkayuan. Kelompok famili Dipterocarpaceae yang digunakan dalam perkayuan adalah meranti merah, meranti putih, dan meranti kuning dari jenis Shorea, Anisoptera dan Parashorea. Dipterocarpaceae tumbuh dibagian barat Indonesia, Malaysia, Brunei, Filipina dan penyebarannya ke arah timur sampai dengan Nugini (Irian Jaya dan Papua Nugini). Dipterocarpaceae sulit untuk diidentifikasi terutama di Kalimantan yang memiliki jenis terbanyak. Ketidakmampuan untuk mengenal individu Dipterocarpaceae di hutan memperbesar terjadinya eksploitasi Dipterocarpaceae khususnya jenis Shorea yang memiliki kualitas kayu yang baik dan pekerjaan silvikultur kurang menjadi sasaran karena tidak diketahui jenis Dipterocarpaceae yang akan punah (Newman et al.1999). Shorea adalah salah satu marga tumbuhan penghasil kayu terbaik dalam dunia perindustrian. Dengan nilai ekonomi yang tinggi mengakibatkan eksploitasi besar-besaran pohon Shorea. Hal ini dapat berdampak kepunahan terhadap pohon Shorea dan menyebabkan kerusakan hutan. Model identifikasi daun Shorea yang akan dikembangkan dapat digunakan untuk mengenal daun Shorea. Identifikasi ini dilakukan agar tidak menyebabkan kesalahan pemilihan kayu yang tidak tepat dan mengurangi pertumbuhan jenis kayu dengan sifat-sifat yang tidak diinginkan. Sifat-sifat itu misalnya kualitas kayu yang rendah, pertumbuhan lambat, tajuk lebar yang jarang mencapai ukuran kayu, atau jenis pilihan yang tidak cocok untuk kondisi tanah tertentu. Penentuan identifikasi pohon Shorea, biasanya menggunakan batang, daun, buah, dan bunga. Namun penelitian ini menggunakan daun sebagai bahan identifikasi dikarenakan daun cenderung tersedia sebagai sumber pengamatan sepanjang waktu. Bila menggunakan batang, batang pohon akan berubah warna atau kedalaman alur sejalan dengan bertambahnya umur pohon. Salah satu metode yang digunakan untuk membangun model klasifikasi dalam
mengidentifikasi daun Shorea adalah k-Nearest Neighbour. k-Nearest Neighbour merupakan teknik yang lebih fleksibel karena mampu menglasifikasikan data uji ke dalam kelas label dengan cara mencari data latih yang relatif sama dengan data uji (Tan et al. 2006). Tujuan Penelitian ini bertujuan untuk menerapkan k-nearest Neighbour dalam mengidentifikasi jenis Shorea. Ruang Lingkup Ruang lingkup penilitian ini meliputi : 1 Daun yang diteliti hanya daun Shorea multiflora, palembanica, balangeran, lepida dan assamica. 2 Difokuskan untuk mengidentifikasi daun Shorea dengan mengidentifikasi karakteristik morfologi daun. 3 Data yang digunakan adalah data hasil pengukuran manual terhadap daun Shorea. 4 Daun Shorea yang digunakan diambil dari beberapa koleksi Kebun Raya Bogor. Manfaat Model identifikasi daun Shorea diharapkan dapat membantu dalam mengidentifikasi jenis Shorea. TINJAUAN PUSTAKA Shorea Shorea adalah salah satu marga dari Dipterocarpaceae penghasil kayu terbaik dalam dunia perindustrian. Dengan nilai ekonomi yang tinggi mengakibatkan eksploitasi besar-besaran yang dapat berdampak kepunahan terhadap pohon Shorea dan menyebabkan kerusakan hutan. Shorea memiliki sekitar 194 jenis. Persebarannya meliputi 1 jenis di Jawa, 1 atau 2 jenis di Sulawesi, 3 jenis di Maluku dan sisanya menyebar kearah timur sampai Maluku (Indonesia) dan tidak meluas ke Cina bagian selatan (Newman et al. 1999). Pohon Shorea dapat tumbuh dari batas permukaan laut sampai ketinggian 1750 m. Beberapa jenis Shorea yang berupa pohon
1
penjulang di hutan hujan dari kawasan Paparan Sunda, dapat tumbuh hingga ketinggian 500 m (Newman et al.1999).
mengering coklat merah (Newman et al. 1999).
Gambar 3 Daun Shorea palembanica. 3 Gambar 1 Pohon Shorea. Ciri-ciri diagnostik utama pohon Shorea sangat besar dengan pepagan dalam berlapislapis atau berwarna coklat merah gelap. Daun menjangat, tidak berlipatan, tidak bentuk perisai, tidak berlukup, 4-18 x 2-8 cm, pangkal daun biasanya simetris, permukaan bawah daun bila mengering pudar, pertulangan sekunder bersirip, 7-25 pasang, terpisah permanen, pada permukaan bawah daun bila mengering warnanya sama seperti helai daun, atau lebih gelap pada Shorea javanica (Newman et al. 1999). Penelitian ini menggunakan lima jenis Shorea, yaitu: 1 Shorea multiflora Ciri-ciri utama umumnya berupa pohon kecil sampai sedang dengan buah tanpa sayap. Daun dengan ujung lancip panjang (meruncing), pangkal membundar (membulat), pertulangan daun tembus cahaya bila segar (Newman et al. 1999).
Shorea balangeran Ciri-ciri utama habitat hutan rawa gambut, ujung daun lancip (meruncing), pangkal daun membundar (membulat), permukaan atas daun bila mengering coklat agak lembayung, permukaan bawah bila mengering coklat kekuning-kuningan. Shorea balangeran merupakan salah satu Shorea yang terancam punah (Newman et al. 1999).
Gambar 4 Daun Shorea balangeran. 4
Shorea lepida Ciri-ciri utama pohon dewasa memiliki daun agak tipis, lonjong dan runcing. Permukaan atas daun bila mengering coklat agak lembayung, coklat kuning pada tulang daun, coklat pudar pada permukaan bawah daun (Newman et al. 1999).
Gambar 2 Daun Shorea multiflora. 2
Shorea palembanica Ciri-ciri utama habitat tepi sungai, perawakan berbonggol, daun besar, bila Gambar 5 Daun Shorea lepida.
2
5
Shorea assamica Ciri-ciri utama daun di bawah permukaan memunyai indumentums sisiksisik kecil. Daun jorong atau bundar telur, ujung daun lancip pendek (tumpul), pangkal daun membundar, permukaan daun bila mengering coklat dan bila diraba licin (Newman et al. 1999).
normalisasi terhadap nilai atribut (Larose 2005 diacu dalam Faiza 2009). Salah satu metode normalisasi adalah minmax normalization yang diterapkan untuk fitur numerik. Formula untuk normalisasi atribut X adalah:
Dengan X* adalah nilai setelah dinormalisasi, X adalah nilai sebelum dinormalisasi, min(X) adalah nilai minimum dari fitur, dan max(X) adalah nilai maksimum dari suatu fitur. Confusion Matrix
Gambar 6 Daun Shorea assamica. K-Fold Cross Validation Sebelum digunakan, sebuah sistem berbasis komputer harus dievaluasi dalam berbagai aspek. Di antara aspek-aspek ini, validasi kinerja bisa merupakan yang paling penting. (Fu 1994). Metode k-fold cross validation membagi sebuah himpunan contoh secara acak menjadi k himpunan bagian lain (subset) yang paling bebas. Dilakukan ulangan sebanyak k kali untuk pelatihan dan pengujian. Pada setiap ulangan disisipkan setiap subset untuk pengujian dan subset lainnya untuk pelatihan (Stone 1974 diacu dalam Fu 1994). Tingkat akurasi dihitung dengan membagi jumlah keseluruhan klasifikasi yang benar dengan jumlah semua instance pada data awal (Han & Kamber 2001). ∑ ∑
Normalisasi Pada perhitungan jarak Euclidean, atribut berskala panjang dapat memunyai pengaruh lebih besar daripada atribut berskala pendek. Untuk mencegah hal tersebut perlu dilakukan
Evaluasi model klasifikasi berdasar pada proporsi antara data uji yang diprediksi secara tepat dengan total seluruh prediksi (Tan et al. 2006). Informasi mengenai klasifikasi sebenarnya (aktual) dengan klasifikasi hasil prediksi disajikan dalam bentuk tabel yang disebut confusion matrix seperti diperlihatkan pada Tabel 1. Tabel 1 Confusion matrix dua kelas Kelas aktual Kelas 1 Kelas 2
Kelas hasil prediksi Kelas 1 Kelas 2 a b c d
Jumlah baris dan kolom pada tabel bergantung pada banyaknya kelas target. Akurasi merupakan proporsi jumlah prediksi yang tepat. Contoh perhitungan akurasi untuk tabel tersebut adalah:
KNN (K-Nearest Neighbour) K-Nearest Neighbour merepresentasikan setiap data sebagai titik dalam k-ruang dimensi. Jika ada sebuah data uji maka akan dihitung kedekatan titik data lainnya pada data latih untuk diklasifikasikan berdasarkan kedekatannya yang didefinisikan dengan ukuran jarak (Han & Kamber 2006). Analisis data mendefinisikan ukuran kedekatan atau ukuran kesamaan menggunakan
3
fungsi jarak. Fungsi jarak yang umumnya digunakan adalah jarak Euclidean dengan menggunakan rumus sebagai berikut (Larose 2005). √∑
(
) ,
dengan x = x1,x2, … , xm menyatakan data uji, y = y1,y2, … , ym menyatakan data latih dan xi-yi = selisih data uji dengan data latih. Penelitian ini, terdapat dua jenis data yang digunakan, yaitu data numerik dan data nominal. Data nominal atau sering disebut juga data kategori yaitu data yang diperoleh melalui pengelompokan objek berdasarkan kategori tertentu. Walaupun data nominal dapat dinyatakan dalam bentuk angka, namun angka tersebut tidak memiliki urutan atau makna matematis sehingga tidak dapat dibandingkan (Dharma, 2008). Untuk data nominal atau yang disebut kategori, penggunaan jarak Euclidean tidak tepat, sebaliknya dapat didefinisikan dengan sebuah fungsi yang digunakan untuk membandingkan nilai data uji dan data latih. Untuk menghitung jarak nominal menggunakan rumus sebagai berikut (Larose 2005) .
METODOLOGI PENELITIAN Kerangka Penelitian Penelitian ini memunyai beberapa tahapan untuk mengetahui tingkat akurasi yang diperoleh menggunakan algoritme k-Nearest Neighbour dalam pengidentifikasian daun Shorea. Tahapan proses tersebut akan disajikan pada Gambar 7. Mulai
Identifikasi Masalah
Pengadaan Data
Praproses Data
Penentuan Data Latih dan Data Uji
Data Latih
Data Uji
Klasifikasi
KNN
{ Yang berarti bahwa jika data latih sama dengan data uji maka jaraknya 0, selainnya jaraknya 1. Untuk menggabungkan kedua jarak semua variabel, dilakukan aggregate ketidaksamaan berat rata-rata dari jarak masing-masing fitur dengan menggunakan rumus sebagai berikut (Teknomo, 2006).
Model Pengenalan Daun Shorea
Hasil Prediksi
Selesai
Gambar 7 Diagram alur pembuatan sistem.
∑ ∑
,
dengan k merupakan variabel fitur, ij selisih data latih dan data uji, Sijk merupakan kesamaan dan ketidaksamaan antara objek dimana Wijk bernilai 1 untuk nilai numerik dan 0.5 untuk nilai nominal. Nilai pembobotan ini diberikan agar jarak fitur nominal tidak terlalu mendominasi hasil perhitungan.
Identifikasi Masalah Tahap identifikasi permasalahan yang meliputi tahap pemilihan masalah, identifikasi, tujuan, dan sumber pengetahuan. Masalah yang ada saat ini pihak rimbawan atau pekerja di hutan masih mengalami kesulitan dalam mengidentifikasi daun Shorea. Kesalahan dalam mengidentifikasi ini dapat menyebabkan kesalahan pemilihan kayu yang tidak tepat. Salah satu solusi dari permasalahan tersebut adalah dibuatnya suatu sistem mengenai identifikasi daun Shorea yang dibentuk dari
4
akuisisi pengetahuan pakar dan pustaka yang mendukung.
5
Pengadaan Data Daun Shorea yang digunakan didapatkan dari Kebun Raya Bogor. Penelitian ini menggunakan beberapa atribut yang mencirikan bentuk morfologi daun Shorea. Data yang digunakan merupakan data dari perhitungan manual beberapa jenis daun Shorea. Data dalam penelitian ini memunyai beberapa fitur, yaitu: 1 Panjang daun, yaitu panjang daun diukur dari pangkal daun hingga ujung daun. 2 Lebar daun, yaitu lebar daun diukur berdasarkan permukaan daun paling lebar.
Ujung daun, yaitu bentuk ujung daun. Beberapa bentuk ujung daun di antaranya: a Runcing, jika kedua tepi daun di kanan kiri ibu tulang sedikit demi sedikit menuju ke atas dan pertemuannya pada puncak daun melancip. b Meruncing, seperti pada ujung yang runcing, tetapi titik pertemuan kedua tepi daunnya jauh lebih tinggi dari dugaan, hingga ujung daun nampak sempit panjang dan runcing. c Tumpul, tepi daun yang semula masih agak jauh dari ibu tulang membentuk sudut yang tumpul. d Membulat, seperti pada ujung yang tumpul, tetapi tidak terbentuk sudut sama sekali, hingga ujung daun merupakan semacam suatu busur.
Lebar Daun Panjang Daun 3
Gambar 8 Lebar dan panjang daun Bentuk tulang daun, yaitu susunan tulang cabang pada daun. Bentuk tulang daun dapat dibedakan menjadi : a Menempel : ujung tulang cabang bagian dalam sebelah kanan bertemu dengan ujung tulang cabang bagian dalam sebelah kiri. b Tidak menempel : ujung tulang cabang bagian dalam sebelah kanan tidak bertemu dengan ujung tulang cabang bagian dalam sebelah kiri. Ujung tulang cabang bagian dalam sebelah kiri
4
Gambar 9 Ujung daun 6
Ujung tulang cabang bagian dalam
sebelah kanan
Pangkal daun, yaitu bentuk pangkal daun. Beberapa bentuk pangkal daun di antaranya: a Runcing b Meruncing c Tumpul d Membulat
Gambar 10 Pangkal daun. 7
Keliling daun, yaitu keliling tepi daun yang diukur dengan menggunakan benang.
Permukaan daun, yaitu keadaan permukaan daun bagian atas dan bawah, seperti : a b c d
Atas bawah halus Atas halus bawah kasar Atas bawah kasar Atas kasar bawah halus
Keliling daun 8
Luas daun, yaitu luas permukaan daun yang diukur pada buku berpetak yang memunyai luas ½ cm2 perkotak dengan menjumlahkan kotak yang terisi penuh di dalam gambar
5
daun kemudian dibagi empat. Contoh pengukuran luas :
tetangga (neighbour) terdekatnya dalam data pelatihan. Model Daun Shorea
9
Sudut antar tulang daun, yaitu sudut antara ibu tulang daun dengan tulang cabang daun sebelah kanan atau kiri yang diukur menggunakan busur. Sudut daun
Gambar 11 Sudut daun 10 Jumlah tulang daun, yaitu jumlah tulang cabang daun sebelah kanan dan tulang cabang daun sebelah kiri. Praproses Data Tahapan yang dilakukan dalam praproses di antaranya pengolahan data dengan fitur nominal menggunakan nominal distance seperti bentuk ujung daun, permukaan daun, bentuk tulang daun dan bentuk pangkal daun. Praproses data juga dilakukan pada tahap awal normalisasi data numerik agar didapatkan range antara nol hingga satu. Hal ini dilakukan untuk menghindari perbedaan range yang terlalu besar antar fitur. Penentuan Data Latih dan Data Uji Pada penelitian ini pembagian data latih dan data uji akan dilakukan dengan menggunakan teknik k-fold cross validation dengan nilai k = 5. Klasifikasi Teknik klasifikasi yang akan digunakan menggunakan k–Nearest Neighbour. Teknik k– Nearest Neighbour mencari jarak terdekat antara data yang akan dievaluasi dengan k
Tahapan ini merupakan tahapan yang paling penting karena pada tahap ini teknik klasifikasi diaplikasikan terhadap data yang sudah diperoleh. Teknik klasifikasi yang digunakan menggunakan k–Nearest Neighbour. Langkahlangkah pada metode tersebut yaitu: Hitung jarak Euclidean: pada tahap ini setiap data uji akan dihitung jaraknya ke setiap data latih untuk mengetahui ukuran kedekatan atau ukuran kesamaan antara data uji dengan data latih. Hitung jarak nominal: pada tahap ini dilakukan proses pengubahan beberapa fitur yang bersifat nominal dilambangkan dengan nilai numerik sehingga mempermudah perbandingan data uji terhadap data latih. Aggregate (menggabungkan) data: pada tahap ini data pengolahan nominal dan pengolahan menggunakan Euclidean digabungkan. Penentuan nilai k: pada k–Nearest Neighbour penentuan nilai k yang tepat sangat penting untuk menunjukkan jumlah tetangga terdekat. Setelah didapatkan hasil identifikasi, selanjutnya dilakukan evaluasi klasifikasi yang dihasilkan metode k-Nearest Neighbour. Hasil Prediksi Pada tahap akhir ini diharapkan data testing yang dimasukan akan terklasifikasi pada kelas yang benar. Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian yaitu : Windows XP Home Edition Service Pack 3 XAMPP Version 1.7.1 Notepad v5.1.1 Microsoft Office Excel 2007 Perangkat keras yang digunakan dalam penelitian yaitu : Processor Intel Atom 1.66 GHz RAM 1.00 GB Harddisk kapasitas 150 GB
6
HASIL DAN PEMBAHASAN
No 3
Praproses Data yang digunakan pada penelitian ini merupakan data hasil perhitungan manual fiturfitur morfologi daun Shorea yang diambil dari beberapa koleksi di Kebun Raya Bogor. Berikut disajikan contoh data hasil perhitungan manual dan fitur-fitur yang diperlihatkan pada Tabel 2. Tabel 2 Data daun Jenis Daun Panjang Lebar Bentuk tulang daun Permukaan Daun Ujung Daun Pangkal Daun Keliling Luas Sudut Jumlah tulang daun
Shorea multiflora 9.1 cm 5.7 cm tidak menempel tidak menonjol atas bawah halus meruncing tumpul 22 cm 61.5 cm2 60° 14 buah
Proses pengambilan data ini dilakukan selama satu bulan. Data yang didapat sebanyak 50 data dari perhitungan manual berdasarkan fitur-fitur yang telah ditetapkan sesuai dengan morfologi daun. Data yang digunakan sebanyak 50 data meliputi 10 data Shorea multiflora, 10 data Shorea palembanica, 10 data Shorea balangeran, 10 data Shorea assamica, dan 10 data Shorea lepida. Berdasarkan fitur-fitur yang digunakan terdapat 4 fitur yang bersifat nominal, yaitu fitur bentuk tulang daun, permukaan daun, ujung daun, dan pangkal daun. Fitur-fitur ini memiliki selang nilai yang berbeda. Pada Tabel 3 disajikan selang nilai yang terdapat di setiap fitur. Tabel 3 Selang nilai fitur daun No 1
2
Nama Fitur Bentuk Tulang Daun a. tidak menempel tidak menonjol b. menempel, tidak menonjol c. tidak menempel, bagian bawah menonjol Permukaan Daun a. atas bawah halus b. atas halus bawah kasar
4
Nama Fitur Ujung Daun a. tumpul b. runcing c. meruncing Pangkal Daun a. membulat b. tumpul c. runcing
Dari 50 data Shorea, fitur-fitur yang bernilai nominal dilambangkan dengan angka untuk memudahkan perhitungan algoritme. Pada Tabel 4 disajikan konversi fitur-fitur nominal. Tabel 4 Konversi fitur-fitur nominal No 1
2
3
4
Nama Fitur Bentuk Tulang Daun a. tidak menempel, tidak menonjol b. menempel, tidak menonjol c. tidak menempel, bagian bawah menonjol Permukaan Daun a. atas bawah halus b. atas halus bawah kasar Ujung Daun a. tumpul b. runcing c. meruncing Pangkal Daun a. membulat b. tumpul c. runcing
Nilai Konversi 1 2 3 1 2 1 2 3 1 2 3
Setelah nilai nominal dikonversi maka nilai nominal itu diolah menggunkan nominal distance. Dalam pengolahan fitur atribut yang bernilai numerik menggunakan jarak Euclidean. Dikarenakan adanya perbedaan range antara fitur atribut maka perlu dilakukan normalisasi. Normalisasi yang dilakukan bergantung jenis datanya. Untuk mendapatkan range antara 0 – 1 menggunakan normalisasi min-max normalization. Normalisasi dilakukan sebelum melakukan pengolahan data. Hal ini bertujuan untuk menyamakan range antara fitur. Nilai maksimum dan minimum menggunakan nilai maksimum dan minimum tiap subset. Misal pada fitur panjang daun, nilai maksimum subset satu 108.16, dan nilai minimum subset satu 0.
7
Contoh normalisasi untuk record pertama berdasarkan rumus normalisasi adalah:
mencoba nilai k mulai dari 2 sampai 9 dalam metode k-Nearest Neighbour. Akurasi klasifikasi untuk nilai k=2 sampai k=9 diperlihatkan pada Gambar 12.
Percobaan pertama (tanpa normalisasi) Dari banyaknya data yang diperoleh sebanyak 50 record, dibagi menjadi 5 subset yang setiap subset berisi 2 record dari setiap jenis daun. Percobaan pertama menggunakan 40 record sebagai data latih yang berisi subset 1, 2, 3, dan 4. Subset 5 yang berisi 10 record dijadikan data uji. Percobaan terus dilakukan hingga setiap subset pernah menjadi data uji. Susunan data latih dan data uji pada percobaan disajikan pada Tabel 5. Tabel 5 Susunan data latih dan data Uji Iterasi
Pelatihan
Pengujian
Iterasi pertama Iterasi kedua Iterasi ketiga
S2,S3,S4,S5 S1,S3,S4,S5 S1,S2,S4,S5
S1 S2 S3
Iterasi keempat Iterasi kelima
S1,S2,S3,S5 S1,S2,S3,S4
S4 S5
Data tersebut kemudian diterapkan dalam metode k-Nearest Neighbour melalui tahaptahap berikut ini: 1 Setiap record data uji dihitung jaraknya ke setiap record data latih untuk mengetahui kedekatan antara data uji dengan data latih. Untuk data bertipe numerik, selisih antara data uji dengan data latih adalah pengurangan nilai data uji dengan nilai data latih. Untuk data bertipe nominal, data diolah menggunakan nominal distance. Bila data uji sama dengan data latih maka bernilai nol dan bila data uji berbeda dengan data latih maka bernilai 1. 2 Digabungkan hasil perhitungan yang menggunakan jarak Euclidean dan nominal distance dengan menggunakan rumus aggregate. Memberikan bobot 1 pada hasil perhitungan Euclidean dan bobot 0.5 pada hasil perhitungan nominal. Pemberian bobot 0.5 pada perhitungan nominal agar tidak mendominasi hasil perhitungan. 3 Penentuan nilai k tetangga terdekat pada percobaan pertama dilakukan dengan
Gambar 12 Akurasi klasifikasi percobaan pertama. Berdasarkan gambar tersebut (Gambar 12) akurasi terbesar yang diperoleh adalah 84% dengan nilai k=4 dan k=5. Untuk mengetahui record yang salah diklasifikasikan digunakan confusion matrix yang diperlihatkan pada Tabel 6. Tabel 6 Confusion matrix percobaan pertama Kelas aktual kelas 1 kelas 2 kelas 3 kelas 4 kelas 5
kelas 1 10 0 1 1 0
Kelas hasil prediksi kelas kelas kelas 2 3 4 0 0 0 8 0 0 2 7 0 1 1 7 0 0 0
kelas 5 0 2 0 0 10
Berdasarkan tabel tersebut (Tabel 6) kelas 1 (Shorea multiflora) yang tepat diklasifikasikan sebagai kelas 1 sebanyak 10 record, dan tidak ada kelas 1 yang salah diklasifikasi sebagai kelas 2, kelas 3, kelas 4 dan kelas 5. Kelas 2 (Shorea palembanica) yang tepat diklasifikasi sebagai kelas 2 sebanyak 8 record, kelas 2 yang salah diklasifikasi sebagai kelas 5 sebanyak 2 record. Kelas 3 (Shorea balangeran) yang tepat diklasifikasi sebagai kelas 3 sebanyak 7 record, kelas 3 yang salah diklasifikasi sebagai kelas 1 sebanyak 1 record dan kelas 3 yang salah diklasifikasi sebagai kelas 2 sebanyak 2 record. Kelas 4 (Shorea lepida) yang tepat diklasifikasi sebagai kelas 4 sebanyak 7 record, kelas 4 yang salah dikalsifikasi sebagai kelas 1 sebanyak 1 record, kelas 4 yang salah diidentifikasi sebagai kelas 2 sebanyak 1 record, dan kelas 4 yang
8
salah diidentifikasi sebagai kelas 3 sebanyak 1 record. Kelas 5 (Shorea Assamica) yang tepat diklasifikasi sebagai kelas 5 sebanyak 10 record, dan tidak ada kelas 1 yang salah diklasifikasi sebagai kelas 2, kelas 3, kelas 4 dan kelas 1. Berdasarkan rumus confusion matrix, besarnya akurasi adalah:
Hasil akurasi setiap iterasi pada Gambar 13.
dapat dilihat
100% 80%
Iterasi1
60%
Iterasi2
40%
Iterasi3
20%
Iterasi4
0%
Iterasi5
Nilai K2 3 4 5 6 7 8 9
Gambar 13 Hasil iterasi tanpa normalisasi. Berdasarkan percobaan pertama dapat disimpulkan iterasi ketiga dan keempat memiliki hasil akurasi paling kecil pada setiap nilai k nya. Kesalahan identifikasi terdapat ketika Shorea palembanica teridentifikasi sebagai Shorea assamica pada iterasi ketiga dan Shorea lepida sebagai Shorea palembanica pada iterasi keempat. Hal ini terjadi karena dipengaruhi kemiripan luas dan panjang data uji terhadap data latih. Hasil jarak kedekatan diperlihatkan pada Tabel 7 dengan menggunakn iterasi ketiga sebagai contoh.
pertama dapat disimpulkan nilai k terbaik adalah 3 dengan akurasi tertinggi 84%. Percobaan kedua (dengan normalisasi) Percobaan kedua menggunakan 40 record sebagai data latih yang berisi subset 1, 2, 3, dan 4. Subset 5 yang berisi 10 record dijadikan data uji. Percobaan terus dilakukan hingga setiap subset pernah menjadi data uji. Susunan data latih dan data uji pada percobaan disajikan pada Tabel 5. Data tersebut kemudian diterapkan dalam metode k-Nearest Neighbour melalui tahaptahap berikut ini: 1 Normalisasi dilakukan pada setiap fitur hingga didapatkan range antara 0 sampai 1 pada seluruh data. Hal ini dilakukan untuk mengcegah data uji yang nilainya lebih besar dari data latih. Setelah didapatkan hasil normalisasi, lakukan langkah satu seperti percobaan pertama. 2 Digabungkan hasil perhitungan yang menggunakan euclid dan nominal dengan menggunakan rumus aggregate. Memberikan bobot 1 pada hasil perhitungan Euclidean dan bobot 0.5 pada hasil perhitungan nominal. Pemberian bobot 0.5 pada perhitungan nominal agar tidak mendominasi hasil perhitungan. 3 Penentuan nilai k tetangga terdekat pada percobaan kedua dilakukan dengan mencoba nilai k mulai dari 2 sampai 9 dalam metode k-Nearest Neighbour. Akurasi klasifikasi untuk nilai k=2 sampai k=9 diperlihatkan Gambar 14.
Tabel 7 Perhitungan jarak tanpa normalisasi Jarak 12.46 13.68 12.32 14.75 14.52 19.59 24.13 17.90 18.12
Kelas Shorea assamica Shorea assamica Shorea assamica Shorea assamica Shorea assamica Shorea assamica Shorea palembanica Shorea assamica Shorea assamica
Urutan 2 3 1 5 4 8 9 6 7
Pada perhitungan di atas dapat disimpulkan bahwa Shorea palembanica diidentifikasi sebagai Shorea assamica. Dari percobaan
Gambar 14 Akurasi klasifikasi percobaan kedua Berdasarkan gambar tersebut (Gambar 14) akurasi terbesar yang diperoleh adalah 100%. Hal ini disebabkan karena penggunaan
9
normalisasi yang menyamakan range setiap fitur. Hasil jarak kedekatan diperlihatkan pada Tabel 8 dengan menggunakan iterasi ketiga sebagai contoh. Tabel 8 Hasil perhitungan dengan normalisasi Jarak 0.49 0.58 1.23 0.62 0.69 0.58 0.67 0.63 0.39
Kelas Shorea palembanica Shorea palembanica Shorea lepida Shorea palembanica Shorea palembanica Shorea palembanica Shorea palembanica Shorea palembanica Shorea palembanica
Urutan 2 3 9 5 8 4 7 6 1
Berdasarkan percobaan kedua dihasilkan akurasi 100% pada setiap nilai k. Hal ini dikarenakan perbedaan bentuk morfologi daun yang memang berbeda dan fitur-fiturnya memang mewakili morfologi daun. Perbandingan akurasi sebelum dan sesudah normalisasi diperlihatkan pada Gambar 15.
2.
percobaan pertama tanpa melakukan normalisasi menghasilkan akurasi 84%. Metode k-Nearest Neighbour dapat diterapkan pada pengidentifikasian daun Shorea.
Saran Penelitian ini masih memunyai beberapa kekurangan yang dapat diperbaiki pada penelitian selanjutnya. Beberapa saran itu di antaranya: 1. Menganalisis fitur-fitur untuk mengetahui fitur mana yang paling mempengaruhi proses identifikasi jenis Shorea. 2. Memperbanyak jenis daun Shorea agar lebih bervariasi. 3. Memperbanyak fitur-fitur yang digunakan seperti jarak antara daun, arah tulang daun pertama ke kanan atau ke kiri, perbandingan luas daun kanan dan kiri, jumlah tulang daun kanan dan kiri, memperbaiki perhitungan sudut, perhitungan luas dan keliling menggunakan regresi linear. 4. Menyempurnakan perhitungan pada data nominal.
DAFTAR PUSTAKA Dharma Surya. 2008. Pengolahan dan Analisis Data Penelitian. Jakarta: Direktorat Tenaga Kependidikan, Departemen Pendidikan Nasional. Gambar 15 Perbandingan akurasi. Pada Gambar 16 dapat dilihat bahwa setelah data dinormalisasi memberikan pengaruh yang cukup besar hingga mencapai akurasi 100%. KESIMPULAN DAN SARAN Kesimpulan Dari beberapa percobaan yang dilakukan terhadap data daun Shorea dengan metode kNearest Neighbour, diperoleh kesimpulan sebagai berikut: 1. Akurasi terbesar adalah 100% pada percobaan kedua dengan melakukan normalisasi data, sedangkan pada
Faiza Ninon N. 2009. Prediksi Tingkat Keberhasilan Mahasiswa Tingkat I IPB Dengan Metode k-Nearest Neighbour [Skripsi]. Bogor : Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Freivalds R, Ozols M, Mancinska L. 2009. Theoritical Computer Science. Latvia : University of Latvia. Fu L. 1994. Neural Networks in Computers Intelligence. Singapura: McGraw-Hill. Han J, Kamber M. 2001. Data Mining Concepts & techniques. USA: Academic Press.
10
Kahramanli Humar. 2010. A Novel Distance Measure For Data Vectors with nominal feature values. USA: World Scientific and Engineering Academy and Society. Larose Daniel T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley & Sons, Inc. li Cen, Biswas G. 2002. Unsupervised Learning with Mixed Numeric and Nominal Data. Vol 14. no.4. IEEE Transaction on knowledge and data engineering. Newman et al. 1999. Pedoman Identifikasi Pohon-Pohon Dipterocarpaceae Jawa sampai Niugini. Bogor : PROSEA INDONESIA. Tan Pang-Ning, et al. 2006. Introduction to Data Mining. Boston: Pearson Education, Inc. Teknomo Kardi. Similarity Measurement. http:\\people.revoledu.com\kardi\ tutorial\Similarity\ [22 Februari 2011] Tjitrosoepomo Gembong. 2005. Morfologi Tumbuhan. Jogjakarta : Fakultas Biologi, Gajah Mada University.
11
LAMPIRAN
12
Lampiran 1 Tabel data penelitian daun Shorea. Panjang
Lebar
Keliling
Luas
Sudut
Jumlah Tulang Daun
9.1
5.7
22
30.75
60
14
8.1
5.5
20
26.5
60
14
16
6
34.9
65.25
60
27
15.1
5.5
32.8
54.5
60
28
13.2
4
27.2
32.5
60
29
14.2
4.9
30.8
44.5
50
28
17
5.7
35.5
61.25
65
23
13.5
5.5
29.5
51.5
60
22
17.9
8.9
42.3
60
18
16.5
7.9
39.7
60
18
119.2 5 103.7 5
Bentuk Tulang Daun
Permukaan Daun
Tidak menempel tidak menonjol Tidak menempel tidak menonjol Tidak menempel bagian bawah menonjol Tidak menempel bagian bawah menonjol Tidak menempel tidak menonjol Tidak menempel tidak menonjol Tidak menempel bagian bawah menonjol Tidak menempel bagian bawah menonjol Tidak menempel tidak menonjol Tidak menempel tidak menonjol
Atas bawah halus Atas bawah halus Atas bawah halus Atas bawah halus Atas halus bawah kasar Atas halus bawah kasar Atas bawah halus Atas bawah halus Atas bawah halus Atas bawah halus
Ujung Daun
Pangkal Daun
Kelas
Meruncing
Tumpul
Shorea multiflora
Meruncing
Tumpul
Shorea multiflora
Meruncing
Tumpul
Meruncing
Tumpul
Meruncing
Membulat
Shorea balangeran
Meruncing
Membulat
Shorea balangeran
Runcing
Runcing
Shorea lepida
Runcing
Runcing
Shorea lepida
Tumpul
Membulat
Shorea assamica
Tumpul
Membulat
Shorea assamica
Shorea palembanica Shorea palembanica
13
Lampiran 2 Contoh hasil perhitungan Euclidean sebelum normalisasi. Panjang
Lebar
Keliling
Luas
Sudut
1.69 0.81 27.04 16 5.76 50.41 23.04 4.84 118.81 94.09 1 0.25 141.61 102.01 29.16 4.84 57.76 28.09 102.01 151.29 1 0.16 38.44 24.01 10.24 9 27.04 29.16 118.81 47.61 3.61 0 27.04 51.84 8.41 0.01 5.76 31.36 47.61 51.84
0.81 0.36 0.04 0.25 2.56 0.16 1.96 5.76 5.29 3.61 0.81 0.49 4 2.56 0.25 2.56 0.36 1 7.29 12.96 1.21 0.64 0.49 0 3.61 0.81 0.25 0.25 10.24 3.24 0.25 0.36 1.44 1 2.89 3.61 4.84 0.81 5.29 5.29
9 0.64 84.64 72.25 7.29 169 64 1.44 506.25 372.49 6.25 3.24 576 400 81 7.29 144 72.25 462.25 676 9 2.25 127.69 84.64 16 20.25 88.36 75.69 515.29 234.09 2.89 0 139.24 240.25 12.25 2.25 4.84 84.64 240.25 272.25
81.00 1.00 495.06 297.56 1.56 637.56 81.00 60.06 7353.06 5662.56 441.00 426.42 6683.06 4389.06 297.56 1.56 564.06 110.25 7396.00 13572.25 22.56 27.56 612.56 495.06 3.06 60.06 637.56 529.00 9072.56 3660.25 6.25 0.56 552.25 2232.56 2.25 60.06 18.06 175.56 4192.56 4323.06
0 0 0 0 0 0 100 0 100 100 0 0 0 100 0 0 25 0 100 100 0 0 0 0 0 0 100 0 0 0 0 0 0 0 100 100 100 0 0 100
Jumlah Tulang Daun 4 4 225 196 121 289 100 81 36 9 4 4 361 361 196 121 81 81 16 16 0 4 484 81 196 169 64 81 16 16 4 16 256 196 81 16 16 121 9 16
Total Euclid 9.82 2.61 28.84 24.13 11.75 33.85 19.24 12.37 90.11 79.00 21.29 20.84 88.12 73.18 24.58 11.72 29.53 17.11 89.91 120.53 5.81 5.88 35.54 26.17 15.13 16.10 30.29 26.74 98.66 62.94 4.12 4.11 31.24 52.17 14.38 13.49 12.23 20.33 67.04 69.05
14
Lampiran 3 Contoh hasil perhitungan Euclidean sesudah normalisasi. Panjang
Lebar
Keliling
Luas
Sudut
0.01 0.00 0.15 0.09 0.03 0.27 0.12 0.03 0.64 0.51 0.01 0.00 0.77 0.55 0.16 0.03 0.31 0.15 0.55 0.82 0.01 0.00 0.21 0.13 0.06 0.05 0.15 0.16 0.64 0.26 0.02 0.00 0.15 0.28 0.05 0.00 0.03 0.17 0.26 0.28
0.02 0.01 0.00 0.01 0.07 0.00 0.05 0.16 0.15 0.10 0.02 0.01 0.11 0.07 0.01 0.07 0.01 0.03 0.20 0.36 0.03 0.02 0.01 0.00 0.10 0.02 0.01 0.01 0.28 0.09 0.01 0.01 0.04 0.03 0.08 0.10 0.13 0.02 0.15 0.15
0.01 0.00 0.10 0.09 0.01 0.20 0.08 0.00 0.60 0.44 0.01 0.00 0.68 0.48 0.10 0.01 0.17 0.09 0.55 0.80 0.01 0.00 0.15 0.10 0.02 0.02 0.11 0.09 0.61 0.28 0.00 0.00 0.17 0.29 0.01 0.00 0.01 0.10 0.29 0.32
0.00 0.00 0.03 0.02 0.00 0.03 0.00 0.00 0.39 0.30 0.02 0.02 0.35 0.23 0.02 0.00 0.03 0.01 0.39 0.72 0.00 0.00 0.03 0.03 0.00 0.00 0.03 0.03 0.48 0.19 0.00 0.00 0.03 0.12 0.00 0.00 0.00 0.01 0.22 0.23
0.00 0.00 0.00 0.00 0.00 0.00 0.25 0.00 0.25 0.25 0.00 0.00 0.00 0.25 0.00 0.00 0.06 0.00 0.25 0.25 0.00 0.00 0.00 0.00 0.00 0.00 0.25 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.25 0.25 0.25 0.00 0.00 0.25
Jumlah Tulang Daun 0.01 0.01 0.39 0.34 0.21 0.50 0.17 0.14 0.06 0.02 0.01 0.01 0.63 0.63 0.34 0.21 0.14 0.14 0.03 0.03 0.00 0.01 0.84 0.14 0.34 0.29 0.11 0.14 0.03 0.03 0.01 0.03 0.44 0.34 0.14 0.03 0.03 0.21 0.02 0.03
Total Euclid 0.23 0.15 0.82 0.73 0.57 1.01 0.83 0.58 1.45 1.27 0.26 0.22 1.59 1.49 0.79 0.56 0.85 0.64 1.40 1.73 0.23 0.17 1.12 0.63 0.72 0.63 0.81 0.65 1.43 0.92 0.19 0.19 0.91 1.03 0.73 0.62 0.67 0.72 0.96 1.12
15
Lampiran 4 Contoh hasil perhitungan nominal. Bentuk Tulang Daun 1 0 1 1 0 0 1 1 0 0 0 1 1 1 0 0 1 1 0 0 0 1 1 1 0 0 1 1 0 0 0 0 1 1 0 0 1 1 0 0
Permukaan Daun 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0
Ujung Daun 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1
Pangkal Daun 0 0 0 0 1 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1
Total Nominal 1 0 1 1 2 2 3 3 2 2 0 1 1 1 2 2 3 3 2 2 0 1 1 1 2 2 3 3 2 2 0 0 1 1 2 2 3 3 2 2
16
Lampiran 5 Contoh hasil penggabungan kedua jarak sebelum normalisasi. Total Euclid 9.82 2.61 28.84 24.13 11.75 33.85 19.24 12.37 90.11 79.00 21.29 20.84 88.12 73.18 24.58 11.72 29.53 17.11 89.91 120.53 5.81 5.88 35.54 26.17 15.13 16.10 30.29 26.74 98.66 62.94 4.12 4.11 31.24 52.17 14.38 13.49 12.23 20.33 67.04 69.05
Total Nominal 1 0 1 1 2 2 3 3 2 2 0 1 1 1 2 2 3 3 2 2 0 1 1 1 2 2 3 3 2 2 0 0 1 1 2 2 3 3 2 2
Penjumlahan
k-terdekat
6.88 1.74 19.56 16.42 8.50 23.24 13.82 9.25 60.74 53.34 14.19 14.23 59.08 49.12 17.05 8.48 20.69 12.40 60.61 81.02 3.87 4.26 24.03 17.78 10.75 11.40 21.19 18.83 66.44 42.63 2.75 2.74 21.16 35.11 10.25 9.66 9.15 14.55 45.36 46.70
Shorea multiflora Shorea multiflora
Shorea balangeran
Shorea balangeran
Shorea multiflora Shorea multiflora
Shorea multiflora Shorea multiflora
Shorea lepida
17
Lampiran 6 Contoh hasil penggabungan kedua jarak sesudah normalisasi. Total Euclid 0.23 0.15 0.82 0.73 0.57 1.01 0.83 0.58 1.45 1.27 0.26 0.22 1.59 1.49 0.79 0.56 0.85 0.64 1.40 1.73 0.23 0.17 1.12 0.63 0.72 0.63 0.81 0.65 1.43 0.92 0.19 0.19 0.91 1.03 0.73 0.62 0.67 0.72 0.96 1.12
Total Nominal 1 0 1 1 2 2 3 3 2 2 0 1 1 1 2 2 3 3 2 2 0 1 1 1 2 2 3 3 2 2 0 0 1 1 2 2 3 3 2 2
Penjumlahan
k-terdekat
0.49 0.10 0.88 0.82 1.04 1.34 1.55 1.38 1.63 1.51 0.17 0.48 1.40 1.32 1.19 1.04 1.57 1.43 1.60 1.82 0.15 0.45 1.08 0.75 1.15 1.08 1.54 1.43 1.62 1.28 0.13 0.13 0.94 1.02 1.15 1.08 1.45 1.48 1.31 1.41
Shorea multiflora Shorea multiflora
Shorea multiflora Shorea multiflora
Shorea multiflora Shorea multiflora Shorea palembanica
Shorea multiflora Shorea multiflora
18
Lampiran 7 Confusion matrix dengan nilai k=2. Kelas hasil prediksi Shorea Shorea palembanica balangeran
Kelas aktual
Shorea multiflora
Shorea lepida
Shorea assamica
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
5
3
0
2
Shorea balangeran
1
2
7
0
0
Shorea lepida
0
0
1
9
0
Shorea assamica
0
0
0
0
10
Shorea lepida
Shorea assamica
Lampiran 8 Confusion matrix dengan nilai k=3 Kelas hasil prediksi Shorea Shorea palembanica balangeran
Kelas aktual
Shorea multiflora
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
7
1
0
2
Shorea balangeran
0
3
7
0
0
Shorea lepida
1
1
1
7
0
Shorea assamica
0
0
0
0
10
Lampiran 9 Confusion matrix dengan nilai k=5 Kelas hasil prediksi Shorea Shorea Shorea palembanica balangeran lepida
Kelas aktual
Shorea multiflora
Shorea assamica
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
8
0
0
2
Shorea balangeran
0
2
8
0
0
Shorea lepida
1
2
1
6
0
Shorea assamica
0
0
0
0
10
19
Lampiran 10 Confusion matrix dengan nilai k=6 Kelas hasil prediksi Shorea Shorea Shorea palembanica balangeran lepida
Kelas aktual
Shorea multiflora
Shorea assamica
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
8
0
0
2
Shorea balangeran
0
2
8
0
0
Shorea lepida
2
3
0
5
0
Shorea assamica
0
0
0
0
10
Lampiran 11 Confusion matrix dengan nilai k=7 Kelas hasil prediksi Shorea Shorea Shorea palembanica balangeran lepida
Kelas aktual
Shorea multiflora
Shorea assamica
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
8
0
0
2
Shorea balangeran
0
2
7
1
0
Shorea lepida
2
5
1
2
0
Shorea assamica
0
0
0
0
10
Lampiran 12 Confusion matrix dengan nilai k=8 Kelas hasil prediksi Shorea Shorea Shorea palembanica balangeran lepida
Kelas aktual
Shorea multiflora
Shorea assamica
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
7
0
1
2
Shorea balangeran
0
3
7
0
0
Shorea lepida
2
4
1
3
0
Shorea assamica
0
0
0
0
10
20
Lampiran 13 Confusion matrix dengan nilai k=9 Kelas hasil prediksi Shorea Shorea Shorea palembanica balangeran lepida
Kelas aktual
Shorea multiflora
Shorea assamica
Shorea multiflora
10
0
0
0
0
Shorea palembanica
0
7
0
1
2
Shorea balangeran
0
3
7
0
0
Shorea lepida
2
4
1
3
0
Shorea assamica
0
0
0
0
10
21
Penguji : 1. Toto Haryanto, S.Kom, M.Si. 2. Mushthofa, S.Kom, M.Sc.
22