CLUSTERING JAMUR ASTERINACEAE MENGGUNAKAN METODE K-MEANS
RADHEN INTHAN LEOTHRIANSARI VUTACO
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Clustering Jamur Asterinaceae Menggunakan Metode K-Means adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Februari 2014 Radhen Inthan Leothriansari Vutaco NIM G64096047
ABSTRAK RADHEN INTHAN LEOTHRIANSARI VUTACO. Clustering Jamur Asterinaceae Menggunakan Metode K-Means. Dibimbing oleh SRI NURDIATI dan AZIZ KUSTIYO. Jamur merupakan salah satu tanaman yang banyak dibudidaya oleh para petani di daerah dataran tinggi. Jamur adalah makhluk hidup eukariota yang bersifat heterotrof, yaitu menyerap zat organik dari lingkungannya sehingga hidupnya bersifat parasit dan saprofit. Keanekaragaman jenis jamur ini menyebabkan kesulitan untuk membedakan antara jenis yang satu dengan yang lainnya. Sebelum mengenali jenis jamur dalam hal ini adalah jamur taksa Australia Asterinaceae, diperlukan suatu pengelompokan atau clustering agar dapat dikenali berdasarkan cirinya. Dalam pengelompokan jamur ini, ciri yang dimiliki dikonversi ke dalam bentuk biner. Clustering jamur dengan metode KMeans kemudian digunakan. Dalam clustering ini terdapat tiga tahapan utama, yaitu normalisasi, metode K-Means, dan penghitungan Indeks Davies Bouldin. Penelitian ini mendapatkan clustering terbaik pada jumlah cluster 10. Kata kunci: Indeks Davies Bouldin, jamur Asterinaceae, K-Means.
ABSTRACT RADHEN INTHAN LEOTHRIANSARI VUTACO. Clustering Fungus Asterinaceae Using K-Means Methods. Supervised by SRI NURDIATI and AZIZ KUSTIYO. Fungi are one of the many cultivated crops by farmers in upland areas. Fungi are beings who are heterotrophic eukaryotes, which absorbs organic matter from the environment so that his life is parasitic and saprophyte. Diversity of these fungi cause difficulty to distinguish between one type and another. Before identifying fungi taxa Asterinaceae Australia, a grouping or clustering method is required to recognize the fungi by their characteristics. In grouping these fungi, characteristics possessed are first converted into binary form. K-Means clustering method is then utilized. There are three main stages for the clustering purpose, namely normalization, K-Means method, and Davies Bouldin Index calculation. The results show that the best clustering is obtained with 10 clusters. Keywords: Davies Bouldin Index, fungi Asterinaceae, K-Means.
i
CLUSTERING JAMUR ASTERINACEAE MENGGUNAKAN METODE K-MEANS
RADHEN INTHAN LEOTHRIANSARI VUTACO
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
ii
Penguji: Muhammad Asyhar Agmalaro, SSi, MKom
iii
Judul Skripsi Nama NIM
: Clustering Jamur Asterinaceae Menggunakan Metode K-Means : Radhen Inthan Leothriansari Vutaco : G64096047
Disetujui oleh:
Dr Ir Sri Nurdiati, MSc Pembimbing I
Aziz Kustiyo, SSi, MKom Pembimbing II
Diketahui oleh:
Dr Ir Agus Buono, MSi, MKom Ketua Departemen
Tanggal Lulus :
iv
PRAKATA Puji dan syukur penulis panjatkan kehadirat Allah subhanahu wa ta’ala atas limpahan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Shalawat serta salam tidak lupa penulis curahkan kepada Nabi Besar Muhammad shallallahu ‘alaihi wassalam, keluarga, sahabat, serta umatnya hingga akhir zaman. Tulisan ini merupakan hasil penelitian yang penulis lakukan sejak Oktober 2011 hingga Oktober 2013. Judul yang dipilih dalam penelitian ialah Clustering Jamur Asterinaceae Menggunakan Metode K-Means. Terima kasih penulis ucapkan kepada seluruh pihak yang telah membantu dalam penelitian ini, yaitu: 1 Ayahanda Amin Fauzi, ST, Ibunda Aisyah, Suami Indra Permana, Bidadari kecil bunda Kayla Dzakirah Almahyra, Kakak R.Anthon.NV, dan Adik R.Enthan.DV yang telah memberikan cinta, kasih sayang, doa, semangat, serta dukungan yang begitu berharga. 2 Ibu Dr. Ir. Sri Nurdiati, MSc dan Bapak Aziz Kustiyo, SSi, MKom selaku pembimbing yang telah banyak memberikan saran, masukan dan dukungan kepada penulis. 3 Dosen penguji, Bapak Muhammad Asyhar Agmalaro, SSi, MKom atas saran dan bimbingannya. 4 Rekan-rekan Alih Jenis Ilmu Komputer angkatan 4, atas kerjasamanya selama penelitian. 5 Rekan-rekan Badan Kepegawaian Daerah Pemerintah Provinsi DKI Jakarta, khususnya Sub Bidang Data Kepegawaian atas pengertian dan kerjasamanya. 6 Para sahabat: Sri Rahayu Natasia, Nina Maria Priyatina dan Aokiriduan Hayyi telah berbagi ilmu dan pengetahuan serta dorongan semangat selama pengerjaan skripsi. 7 Pihak-pihak lain yang tidak dapat penulis sebutkan satu persatu yang telah membantu penulis dalam menyelesaikan tugas akhir ini. Penulis menyadari dalam tugas akhir ini masih banyak kekurangan dan kesalahan, karena itu penulis mengharapkan kritik dan saran yang membangun. Harapan penulis semoga penelitian dan tulisan ini bermanfaat untuk pihak-pihak terkait. Bogor, Februari 2014 Radhen Inthan Leothriansari Vutaco
v
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
1
Manfaat Penelitian
1
Ruang Lingkup Penelitian
1
TINJAUAN PUSTAKA
1
Asterinaceae
1
K-Means
2
Indeks Davies Bouldin
2
METODE PENELITIAN
3
Pengumpulan Data Ciri Jamur
3
Praproses Data
4
Clustering Menggunakan Metode K-Means
4
Analisis Hasil Clustering
4
Lingkungan Implementasi
4
HASIL DAN PEMBAHASAN
5
Pengumpulan Data Ciri Jamur
5
Praproses Data
5
Clustering Menggunakan Metode K-Means
6
Analisis Hasil Clustering
7
SIMPULAN DAN SARAN
12
Simpulan
12
Saran
12
DAFTAR PUSTAKA
12
LAMPIRAN
14
vi
DAFTAR TABEL 1 Hasil pengamatan Indeks Davies Bouldin 2 Hasil clustering dengan 3 cluster 3 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil clustering (k=3) 4 Hasil clustering dengan 5 cluster 5 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil clustering (k=5) 6 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil clustering (k=10) 7 Hasil clustering dengan 10 cluster
6 7 8 9 10 11 10
DAFTAR GAMBAR 1 Diagram tahapan proses penelitian 2 Diagram pengamatan Indeks Davies Bouldin 3 Diagram banyaknya perbedaan hasil clustering
3 7 11
DAFTAR LAMPIRAN 1 2 3 3
Tabel fitur ciri Kode fitur ciri Nilai varians dari masing-masing cluster Tabel fitur ciri yang berbeda
14 17 20 21
1
PENDAHULUAN Latar Belakang Asterinaceae merupakan salah satu cendawan yang hidup di permukaan daun. Di seluruh dunia telah dikenal sebanyak 336 spesies Asterinaceae (Kirk et al. 2008). Rahayu (1992) telah mendeskripsikan 135 spesies Asterinaceae asal Australia. Spesies ini dibangun berdasarkan 116 ciri morfologi. Ciri-ciri yang terdapat pada setiap spesies tersebut terkadang memiliki kemiripan yang menyebabkan beberapa spesies tersebut saling terkait satu sama lain. Banyaknya fitur yang dimiliki oleh jamur yang sebagian fitur antar-jamur tersebut memiliki ciri yang hampir sama, membuat jamur-jamur tersebut harus dikelompokkan menurut kesamaan ciri fiturnya. Penerapan clustering menggunakan metode K-Means diharapkan dapat meminimalisasikan objective function yang di-setting dalam proses clustering, yang pada umumnya berusaha meminimalkan variasi di dalam suatu cluster dan memaksimalkan variasi antar-cluster. Tujuan Penelitian Tujuan penelitian ini adalah mengimplementasikan metode K-Means dalam clustering data jamur Asterinaceae dan memperoleh kesamaan karakteristik antarjamur dari hasil clustering menggunakan K-Means. Manfaat Penelitian Penelitian ini diharapkan dapat menghasilkan clustering jamur Asterinaceae secara tepat dan konsisten untuk mengenali jenis jamur serta dapat membantu pihak terkait dalam menganalisis dan mengelompokkan jamur Asterinaceae berdasarkan kesamaan karakteristiknya. Penelitian ini juga diharapkan nantinya dapat dijadikan tahapan praproses klasifikasi untuk penelitian selanjutnya. Ruang Lingkup Penelitian Penelitian ini dibatasi pada data jamur Asterinaceae yang akan digunakan yaitu merupakan data penelitian Rahayu (1992). Data ini terdiri atas 116 fitur ciri dan 135 spesies jamur.
TINJAUAN PUSTAKA Asterinaceae Cendawan merupakan suatu kelompok mikroorganisme yang sangat besar dan dapat ditemukan pada semua relung ekologi. Menurut Hawksworth (1991), diperkirakan 1 500 000 spesies cendawan terdapat di dunia dan 69 000 spesies
2 telah dideskripsikan. Pengelompokan spesies cendawan tersebut dilakukan berdasarkan morfologinya. Asterinaceae merupakan salah satu cendawan yang hidup di permukaan daun. Di seluruh dunia telah dikenal 336 spesies Asterinaceae (Kirk et al. 2008). Rahayu (1992) telah mendeskripsikan 135 spesies Asterinaceae asal Australia. K-Means K-Means merupakan algoritme clustering yang digunakan untuk klasifikasi atau mengelompokkan objek berdasarkan atribut atau fitur ke dalam sejumlah k kelompok (Teknomo 2006b). Algoritme ini dikembangkan oleh MacQueen pada tahun 1967. Metode K-Means ini secara umum dilakukan dengan algoritme dasar sebagai berikut: 1 Tentukan jumlah cluster. 2 Alokasikan data ke dalam cluster secara random. 3 Hitung centroid dari data yang ada di masing-masing cluster. 4 Alokasikan masing-masing data ke centroid terdekat. 5 Kembali ke langkah 3, apabila masih ada data yang berpindah cluster.
Indeks Davies Bouldin Indeks Davies Bouldin (IDB) digunakan untuk mengukur validasi hasil clustering sehingga menghasilkan IDB terbaik. IDB terbaik adalah yang mempunyai nilai minimum atau terkecil. Pengukuran dengan IDB ini memaksimalkan jarak inter-cluster antara cluster Ci dan Cj dan pada waktu yang sama mencoba untuk meminimalkan jarak antartitik dalam sebuah cluster. Jika jarak inter-cluster maksimal berarti kesamaan karakteristik antar-masing-masing cluster sedikit sehingga perbedaan antar-cluster terlihat lebih jelas. Jika jarak intra-cluster minimal berarti masing-masing objek dalam cluster tersebut memiliki tingkat kesamaan karakteristik yang tinggi. Adapun jarak intra-cluster Sc(Qk) dalam cluster Qk dapat dihitung sebagai berikut:
dengan Nk adalah banyak titik yang termasuk dalam cluster Qk dan Ck adalah centroid dari cluster Qk. Jarak inter-cluster didefinisikan:
dengan Ck dan Cl adalah centroid cluster k dan cluster l. Di lain pihak, Indeks Davies Bouldin didefinisikan:
3 dengan nc adalah banyak cluster. Skema clustering yang optimal menurut Indeks Davies Bouldin ialah yang memiliki Indeks Davies Bouldin minimal (Salazar et al. 2002).
METODE PENELITIAN Secara garis besar penelitian ini dilaksanakan dalam lima tahapan, yaitu (1) pengumpulan data ciri jamur, (2) praproses data, (3) clustering menggunakan metode K-Means, (4) analisis hasil clustering. Ilustrasi tahapan proses penelitian disajikan pada Gambar 1. Pengumpulan data ciri jamur
Praproses data
Clustering menggunakan Metode K-Means
Analisis hasil clustering Gambar 1 Diagram tahapan proses penelitian Pengumpulan Data Ciri Jamur Data yang digunakan dalam penelitian ini berupa data cendawan famili Asterinaceae. Data cendawan ini merupakan hasil penelitian dari Rahayu (1992), Departemen Biologi, Fakultas Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Data tersebut didapat dengan menganalisis Asterinaceae yang menumpang pada tanaman indung (host). Data pada penelitian Rahayu (1992) memiliki 116 fitur ciri dari 135 spesies jamur. Dari 116 fitur ciri, ada 12 fitur ciri yang merupakan data kontinu, serta 104 fitur ciri yang merupakan data nominal dan ordinal. Praproses Data Praposes data adalah tahapan yang dilakukan untuk memisahkan data berdasarkan jenis datanya. Ada 2 jenis data pada fitur jamur Asterinaceae ini, yaitu data nominal dan data numerik. Penelitian ini hanya mengambil data
4 nominal saja. Data numerik ini ditiadakan dengan pertimbangan jumlah data numerik hanya terdapat pada 12 fitur ciri. Pada tahap ini dilakukan pengkodean terhadap data. Pengkodean ini dilakukan untuk memudahkan perhitungan jarak antartitik. Clustering Menggunakan Metode K-Means Algoritme K-Means dimulai dengan menentukan jumlah k centroid sesuai kebutuhan user. Setiap objek diukur jaraknya ke semua centroid. Pengelompokan dilakukan berdasarkan jarak minimum objek ke salah satu centroid cluster. Penghitungan jarak pada data nominal digunakan fungsi jarak Hamming (Hamming distance) dengan rumus berikut (Teknomo 2006a): Di =
0
jika xi = y
1
selainnya
Setelah didapatkan banyak data yang bernilai 1, maka dihitung persentasenya dengan rumus: Banyak data
x 100% Total seluruh data Setelah cluster diperoleh, dilakukan penghitungan ulang centroid dengan mencari nilai tengah dari setiap komponen satu cluster. Setelah didapatkan centroid baru, jarak objek dengan centroid kembali dihitung. Iterasi pada algoritme K-Means akan berhenti apabila centroid cluster tidak berubah atau anggota cluster tetap sama. Hasil clustering yang diperoleh menggunakan metode K-Means divalidasi dengan menggunakan Indeks Davies Bouldin (IDB). Clustering dengan hasil IDB terbaik tersebut merupakan yang paling baik dalam pengelompokan jamur Asterinaceae ini. Analisis Hasil Clustering Tahap ini merupakan tahapan yang memperlihatkan representasi terhadap cluster yang sudah divalidasi. Representasi tersebut memperlihatkan karakteristik masing-masing cluster dan centroid dari cluster yang diolah menggunakan metode K-Means sehingga diperoleh informasi penting mengenai karakteristik alami data. Informasi penting yang tersembunyi dari hasil cluster diharapkan bermanfaat sehingga dapat diperoleh penanganan terhadap cluster yang bersangkutan. Lingkungan Implementasi Lingkungan implementasi yang digunakan sebagai berikut: Perangkat Keras: - Processor Intel Core 2 Duo - RAM kapasitas 2 GB - Harddisk kapasitas 250 GB
5 Perangkat lunak: - Sistem Operasi Microsoft Windows 7 Ultimate - MATLAB R2008b - Microsoft Excel 2007
HASIL DAN PEMBAHASAN Pengumpulan Data Ciri Jamur Data fitur ciri Asterinaceae terlampir pada Lampiran 1. Data tersebut merepresentasikan ciri pembeda antara spesies dan cara pengkodean ciri. Sebagai contoh, kolom ‘colonies’ terdiri atas 3 kategori pembeda yaitu occurance, distribution, dan outline. Occurance terdiri atas 2 sub kategori pembeda yaitu epigenous dan hypogenous, dan keduanya dikodekan dengan 1 atau 0, dengan 1 merepresentasikan present (ada), dan 0 merepresentasikan absent (tidak ada). Contoh rentetan kode dari Asterina cordylines sebagai representasi data nominal dapat diartikan sebagai berikut: epigenous ada, hypogenous ada, distribution singular dan confluent ada, outlines orbicular absent, irregular ada, maka bisa ditulis dengan: 1,1,1,1,0,1. Untuk data kode karakter dapat dilihat pada Lampiran 2. Praproses Data Tahapan praproses data merupakan tahapan lanjutan setelah tahapan pengumpulan data selesai. Pengkodean dilakukan pada tahap ini. Jamur yang memiliki ciri yang hanya terdiri atas 2 subkategori fitur ciri mudah untuk direpresentasikan, sedangkan jamur yang memiliki ciri yang terdiri atas 3 atau lebih subkategori memerlukan proses lebih lanjut untuk merepresentasikannya. Misalnya, pada ciri ‘hyphae’ terdapat kategori ‘arrangement’ yang memiliki 4 sub kategori yang masing-masing subkategori memiliki 4 atribut. Keempat atribut tersebut pada mulanya diberi simbol angka bilangan real, kemudian diubah menjadi bilangan biner yang terdiri atas 3 digit. Hasil salah satu terjemahannya antara lain: Unilateral → (1) no (2) less (3) moderate (4) more diterjemahkan ke biner menjadi 1→ 001 2→ 010 3→ 011 4→ 111 Selanjutnya, bilangan biner yang merepresentasikan sub kategori dari satu fitur ini dipecah antar-digitnya, sehingga subkategori yang tadinya terdiri atas 1 kolom, kini terdiri atas 3 kolom. Hal yang sama dilakukan untuk sub kategori yang memiliki 3 atau lebih atribut. Pemisahan digit biner untuk beberapa sub
6 kategori ini mengakibatkan jumlah kolom yang tadinya hanya berjumlah 104 kolom berubah menjadi 223 kolom. Clustering Menggunakan Metode K-Means Clustering hasil dari praproses data dilakukan dengan menerapkan algoritme K-Means. Jumlah cluster yang diinginkan dalam algoritme ini menjadi hal pertama yang ditentukan. Penelitian ini menggunakan 3 cluster. Percobaan pertama dengan menggunakan 3 cluster, percobaan kedua menggunakan 5 cluster, dan percobaan ketiga menggunakan 10 cluster. Selanjutnya, ditentukan centroid lalu dihitung jarak setiap dokumen terhadap setiap centroid dengan jarak Hamming. Setelah jarak Hamming dari masing-masing karakteristik jamur didapat, langkah selanjutnya adalah mencari nilai varians dari masing-masing percobaaan cluster. Nilai varians didapat dari pembagian antara jumlah seluruh jarak Hamming dan jumlah data dikurang 1. Nilai varians dari masing-masing percobaan cluster dapat dilihat pada Lampiran 3. Nilai varians digunakan untuk mencari nilai Indeks Davies Bouldin. Indeks Davies Bouldin digunakan untuk mengukur validitas hasil clustering dengan menggunakan K-Means. Hasil dari pengamatan Indeks Davies Bouldin dapat dilihat pada Tabel 1. Tabel 1 Hasil pengamatan Indeks Davies Bouldin Banyaknya Cluster 3 5 10
Indeks Davies Bouldin (IDB) 2.58 3.22 1.71
Pada Tabel 1, Indeks Davies Bouldin untuk percobaan cluster sebanyak 3 cluster memiliki indeks sebesar 2.58. Hal ini menunjukkan bahwa percobaan dengan 3 cluster tersebut memiliki perbandingan antara jarak antar cluster dan intra-clusternya sebesar 2.58. Begitu juga percobaan dengan 5 cluster yang memiliki perbandingan antara jarak antar cluster dan intra-clusternya sebesar 3.22, dan untuk percobaan dengan 10 cluster memiliki perbandingan antara jarak antar cluster dan intra-clusternya sebesar 1.71. Berdasarkan nilai pada Tabel 1 tersebut, dapat juga digambarkan grafik menurut indeksnya. Gambar grafik pengamatan Indeks Davies Bouldin bisa dilihat pada Gambar 2. Berdasarkan Gambar 2 dapat dilihat bahwa Indeks Davies Bouldin paling minimum adalah 1.71 dengan percobaan hasil clustering sebanyak 10 cluster.
7 3.5 3 2.5 2 1.5 1 0.5 0 3
5
10
Gambar 2 Grafik pengamatan Indeks Davies Bouldin Analisis Hasil Clustering Hasil clustering dari masing-masing cluster dijabarkan sebagai berikut. 1
Clustering dengan 3 cluster Hasil clustering dengan 3 cluster dapat dilihat pada Tabel 2. Tabel 2 Hasil clustering dengan 3 cluster 1 1 12 15 16 17 18 19 20 21 22 23 24 25 26 77 79 88 91 92 93 94 95 96 100 101
Cluster 2 33 34 40 42 43 44 51 52 53 54 55 56 57 58 97 98 99 103 104 105 109 110 111 112 113
3 2 3 4 5 6 7 8 9 10 11 13 14 28 29 83 84 85 118 119 120 130 131 132
1 27 30 35 48 49 50 69 70 71 72 73 74 75 76 102 106 107 108 115 116 117 121 122 123
Cluster 2 59 60 61 62 63 64 65 66 67 68 86 87 89 90 114 124 125 126 127 128 129 133 134 135
3 31 32 36 37 38 39 41 45 46 47 78 80 81 82
8 Kolom yang tidak diberi warna pada Tabel 2 artinya berada di satu kelas yang sama pada penelitian Rahayu (1992), sedangkan kolom yang diberi warna artinya berada pada kelas yang berbeda. Ada 9 spesies jamur yang berada di kelas yang berbeda pada penelitian tersebut. Perbandingan perbedaan kelas dari hasil clustering dengan hasil penelitian Rahayu (1992) dapat dilihat pada Tabel 3. Tabel 3 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil clustering (k=3) Data 1 12 27 30 35 88 40 78 85
Kelas Asterinaceae berdasarkan Rahayu (1992) 3 3 3 3 3 2 3 1 2
Hasil Clustering 1 1 1 1 1 1 2 3 3
Dari Tabel 3 dapat dilihat bahwa hasil clustering pada cluster 1 mempunyai jarak lebih dekat dengan cluster 3 dibandingkan dengan cluster 2. 2 Clustering dengan 5 cluster Hasil clustering dengan 5 cluster dapat dilihat pada Tabel 4. Sama seperti yang dibahas sebelumnya, kolom yang tidak diberi warna pada Tabel 5 artinya berada di satu kelas yang sama pada penelitian Rahayu (1992). Ada 16 spesies jamur yang berada di kelas yang berbeda pada penelitian tersebut. Perbandingan perbedaan kelas dari hasil clustering dengan hasil penelitian Rahayu (1992) dapat dilihat pada Tabel 5. Dari Tabel 5 dapat dilihat bahwa hasil clustering pada cluster 1 dan 2 mempunyai jarak lebih dekat dengan cluster 5. Hasil clustering pada Cluster 3, 4, dan 5 mempunyai jarak lebih dekat dengan cluster 2. Data 91, 92, dan 93 berada dalam satu kelas yang sama pada penelitian Rahayu (1992), tetapi tersebar pada kelas yang berbeda dalam hasil clustering.
9 Tabel 4 Hasil clustering dengan 5 cluster 1 2 11 12 15 16 17 18 19 20 24 25 26 69 70 93 94 95 96 106 107 108 115 116 117 118 119 120
2 10 33 34 35 37 38 40 41 42 43 44 51 52 53 63 64 65 66 67 68 74 75 76 81 82 83 84 86 87 88 89 90 91 99 101 102 133 134 135
Cluster 3 32 103 104 105 109 110 111
4 1 3 4 21 22 23 27 29 30 36 48 49 50 71 72 73 77 78 79 80 85 92 100 121 122 123
5 5 6 7 8 9 13 14 28 31 39 45 46 47 54 55 56 57 58 59 60 61 62 97 98 112 113 114 124 125 126 127 128 129 130 131 132
10 Tabel 5 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil clustering (k=5) Data
Kelas Asterinaceae berdasarkan Rahayu (1992)
Hasil Clustering
2 11 12 93 10 91 99 32 36 80 85 92 100 28 31 39
4 5 5 5 5 2 2 2 2 2 4 2 2
1 1 1 1 2 2 2 3 4 4 4 4 4 5 5 5
3 Clustering dengan 10 cluster Hasil clustering dengan 10 cluster dapat dilihat pada Tabel 7. Seperti yang dibahas sebelumnya, kolom yang tidak diberi warna pada Tabel 6 artinya berada di satu kelas yang sama pada penelitian Rahayu (1992). Ada 5 spesies jamur yang berada di kelas yang berbeda pada penelitian tersebut. Perbandingan perbedaan kelas dari hasil clustering dengan hasil penelitian Rahayu (1992) dapat dilihat pada Tabel 6. Tabel 6 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil clustering (k=10) Data 9 108 32 22 37
Kelas Asterinaceae berdasarkan Rahayu (1992) 4 2 2 2 3
Hasil Clustering 1 4 5 6 10
11 Tabel 7 Hasil clustering dengan 10 cluster 1 9 124 125 126 127 128 129
2 21 23 27 28 29 30 31 33 34 35 74 75 76 91 92 93 94 95 96 100 101 102 115 116 117
3 36 38 39 40 41 63 64 65 97 98 99 112 113 114 130 131 132
4 1 2 3 4 8 10 11 51 52 53 80 81 82 83 84 85 86 87 88 89 90 108 118 119 120
Cluster 5 6 32 15 103 16 104 17 105 18 109 19 110 20 111 22 24 25 26 69 70 106 107
7 5 6 7 12 13 14 45 46 47
8 48 49 50 66 67 68 71 72 73 121 122 123 133 134 135
9 77 78 79
10 37 42 43 44 54 55 56 57 58 59 60 61 62
Dari Tabel 7 dapat dilihat bahwa hasil clustering pada cluster 4, 5, dan 6 mempunyai jarak lebih dekat dengan cluster 2. Dan dari perbandingan semua hasil clustering di atas, dapat digambarkan sebuah diagram mengenai banyaknya ciri yang berbeda dari masing-masing percobaan clustering seperti yang terlihat pada Gambar 3. 18 16 14 12 10 8 6 4 2 0 3
5
10
Gambar 3 Diagram banyaknya perbedaan hasil clustering
12 Gambar 3 menunjukkan adanya keterkaitan antara nilai Indeks Davies Bouldin dan banyaknya spesies yang berbeda cluster dengan penelitian Rahayu (1992) bahwa semakin kecil nilai Indeks Davies Bouldin semakin sedikit pula spesies yang berbeda cluster-nya. Hasil terbaik yang didapat adalah yang memiliki nilai Indeks Davies Bouldin minimum atau perbedaan cluster-nya paling sedikit, yaitu pada percobaan hasil clustering dengan 10 cluster. Adapun fitur ciri yang berbeda dengan hasil percobaan clustering (k=10) dapat dilihat pada Lampiran 4. Lampiran 4 menunjukkan data spesies jamur yang hasil cluster-nya berbeda dengan hasil penelitian Rahayu (1992) beserta fitur cirinya. Sebagai contoh, pada data jamur ke-9, pada hasil percobaan seharusnya berada pada cluster 1, namun pada penelitian Rahayu (1992) berada pada cluster 4. Fitur ciri yang mempunyai perbedaan bisa dilihat pada Lampiran 4 dengan terjemahan kode fitur ciri yang dapat dilihat pada Lampiran 2.
SIMPULAN DAN SARAN Simpulan Pada penelitian ini, clustering pada jamur Asterinaceae dilakukan dengan algoritma K-Means berdasarkan fitur cirinya. Percobaan dilakukan dengan 3 kali, yaitu menggunakan 3 cluster, 5 cluster, dan 10 cluster. Dari ketiga percobaan tersebut, yang memiliki indeks minimum adalah pada 10 cluster, yang pada 10 cluster tersebut juga memiliki perbedaan cluster paling sedikit dengan penelitian Manalu (2012). Saran Penelitian ini dapat dikembangkan lebih lanjut untuk mendapatkan hasil cluster yang lebih baik. Hal-hal yang dapat dilakukan misalnya: 1 Menggunakan jumlah cluster yang lebih besar. 2 Menggunakan fitur ciri yang bernilai numerik dan fitur ciri yang bernilai kontinu kontinu, tidak hanya fitur ciri yang bernilai nominal.
DAFTAR PUSTAKA Hawksworth DL. 1991. The fungal dimension biodiversity: magnitude, significance, and conservation. Mycological Research. 95(6): 641-655. Kirk PM, Cannon PF, Minter DW, Stalpers JA. 2008. Dictionary of The Fungi. Ed ke-10. Wallingford (UK): CABI Europe. Rahayu G. 1992. Australian hyphopodiate Asterinaceae: a taxonomic revision [disertasi]. Armidale (US): Departement of Botany, The University of New England.
13 Salazar GEJ, Veles AC, Parra MCM, Ortega LO. 2002. A cluster validity index for comparing non-hierarchical clustering methods. [diunduh 29 Desember 2012]. Tersedia pada: http://citeseer.ist.psu.edu/rd/salazar02cluster.pdf Saraswati W. 2012. Clustering menggunakan Self Organizing Maps (studi kasus: data perkembangan anak di Kabupaten Bogor) [skripsi]. Bogor (ID): Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Teknomo K. 2006a. Hamming Distance. [diunduh 29 Desember 2012]. Tersedia pada: http://people.revoledu.com/kardi/tutorial/Similarity/HammingDistance.html Teknomo K. 2006b. kMean. [diunduh 29 Desember 2012]. Tersedia pada: http:// http://people.revoledu.com/kardi/tutorial/kMean/WhatIs.htm
14 Lampiran 1 Tabel fitur ciri Colonies Occurance
1. 2. 3. 4. 5. 6.
Epigenous Hypogenous Singular Confluent Orbicular Irregular
Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0)
Branching density
13.
Arrangement
14.
Lightbrown Brown Darkbrown Straight Flexuous Distinct(2), indistinct(1) Numerous(2), rare(1) Unilateral
Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0)
Septation
7. 8. 9. 10. 11. 12.
15.
Alternate
16.
Opposite to another branch Opposite to hyphopodia Wide Acute Loose Close
Distribution Outline Hyphae Colour
Distribution
17. Angles Network
18. 19. 20. 21.
Hyphopodia Density
22.
Distribution
23.
Location
Colour
24. 25. 26. 27.
Arrangement
28.
More(4), moderate(3), less(2), no(1) Regular(1), irregular(0) Middle Distal Intercalary Darker than hyphae(1), similar to hyphae(0) Cluster
29.
Unilateral
More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0)
Present(1), absent(0) Present(1), absent(0) Present(1), absent(0)
More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1)
15 Lanjutan Hyphopodia (lanjutan) 30.
Alternate
31.
Opposite
32.
No septate
33.
1-septate
34.
2-septate
Stigmatopodia Shape
35.
Cylindrical(1), not cylindrical(0)
Stigmatocyst Gross shape
36. 37.
Uniform(1), versiform(0) Hemispherical
38.
Ovate
39.
Cylindrical
40.
Vermiform
41.
Ampulliform
42.
Conical
43.
Bifid or tifid
44.
Entire
45.
Sinuous
46.
Lobate
47.
Deeply lobate
48.
Straight
49.
Reflex
50.
Antrorse
More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1)
More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1)
16 Lanjutan Stigmatocyst (lanjutan)
Thyriothecia Initial
Thickness
Outlines
Margins
51.
Subantrorse
52.
Curved
53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65.
Lateral on 1 side Lateral on 2 side Terminal on stalk Flat Slightly convex Moderately convex Strongly convex Orbicular Ellipsoid Linear X or Y Crenate Fimbriate short loose Fimbriate short close Fimbriate long loose Fimbriate long close Straight Flexuous Isodiametric Rectangular Stellate cracks Longitudinal slit Cell disintegration Radiate
66. 67. 68. Cover wall Cell wall Opening
Basal wall Asci Number Shape Number of
Ascopores Arrangement
69. 70. 71. 72. 73. 74. 75. 76. 77.
More(4), moderate(3), less(2), no(1) More(4), moderate(3), less(2), no(1) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0)
78. 79. 80.
Numerous(2), few(1) Ovate Clavate Ascospores
81.
Hamathecia
Present(1), absent(0) Present(1), absent(0) 8-spored only(1), 8spored and less(0) Present(1), absent(0)
82. 83.
Conglobate Seriate
Present(1), absent(0) Present(1), absent(0)
17 Lanjutan Ascopores (lanjutan) Colour
Constriction
Cell apices
84. 85. 86. 87. 88. 89. 90.
Palebrown Brown Darkbrown Slightly Moderately Strongly Round
91.
Gradually attenuated Bent
92. Cell collapsed
93.
Cell equality
94.
Surface
95. 96. 97. 98. 99. 100. 101. 102. 103.
Location of germination
Germform
104.
Present(1), absent(0) Present(1), absent(0) Smooth Granulose Verrucose Spinulose Close to the apices Middle Close to the septum Stigmatocysts Stigmatocysts with supporting cell Primary hyphae
Lampiran 2 Kode fitur ciri Kode Karakter X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Nama Karakter colonies_epigenous colonies_hypogenous colonies_singular colonies_confluent colonies_orbicular colonies_irregular hyphae_lightbrown hyphae_brown hyphae_darkbrown hyphae_straight
Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Yes(1), no(0) Yes(1), no(0) Yes(1), no(0) On both apices(3), one apex(2), no(1) On both apices(3), one apex(2), no(1) On both apices(3), one apex(2), no(1)
Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Present(1), absent(0) Yes(1), no(0) Yes(1), no(0) Yes(1), no(0) Yes(1), no(0) Yes(1), no(0) Yes(1), no(0)
18 Lanjutan Kode Karakter X11 X12 X13 X14 X15 X16 X17 X18 X19 X20 X21 X22 X23 X24 X25 X26 X27 X28 X29 X30 X31 X32 X33 X34 X35 X36 X37 X38 X39 X40 X41 X42 X43 X44 X45 X46 X47 X48 X49 X50 X51
Nama Karakter hyphae_flexuous hyphae_septation hyphae_branchingdensity hyphae_unilateral hyphae_alternate hyphae_oppositebranch hyphae_oppositehyphopodia hyphae_wide hyphae_acute hyphae_loose hyphae_close hyphopodia_density hyphopodia_distribution hyphopodia_middle hyphopodia_distal hyphopodia_intercalary hyphopodia_colour hyphopodia_Cluster hyphopodia_unilateral hyphopodia_alternate hyphopodia_opposite hyphopodia_noseptate hyphopodia_1septate hyphopodia_2septate stigmatopodia_shape stigmatocysts_grossshape stigmatocysts_hemispherical stigmatocysts_ovate stigmatocysts_cylindrical stigmatocysts_vermiform stigmatocysts_ampulliform stigmatocysts_conical stigmatocysts_bifid outlines_entire outlines_sinuous outlines_lobate outlines_deeplylobate tipdirection_straight tipdirection_reflex tipdirection_antrorse tipdirection_subantrorse
19
Lanjutan Kode Karakter X52 X53 X54 X55 X56 X57 X58 X59 X60 X61 X62 X63 X64 X65 X66 X67 X68 X69 X70 X71 X72 X73 X74 X75 X76 X77 X78 X79 X80 X81 X82 X83 X84 X85 X86 X87 X88 X89 X90 X91
Nama Karakter tipdirection_curved lateralon_1side lateralon_2side Terminalonstalk thickness_flat thickness_slightlyconvex thickness_moderatelyconvex thickness_stronglyconvex outlines_orbicular outlines_ellipsoid outlines_linear outlines_XorY margins_crenate fimbriate_short_loose fimbriate_short_close fimbriate_long_loose fimbriate_long_close coverwall_straight coverwall_flexuous cellwall_isodiametric cellwall_rectangular opening_stellate opening_longitudinal opening_celldisintegration basalwall_radiate asci_number shape_ovate shape_clavate numberof_ascospores numberof_hamathecia arrangement_conglobate arrangement_seriate colour_palebrown colour_brown colour_darkbrown constriction_slightly constriction_moderately constriction_strongly apices_round apices_gradually
20
Lanjutan Kode Karakter X92 X93 X94 X95 X96 X97 X98 X99 X100 X101 X102 X103 X104
Nama Karakter apices_bent cell_collapsed cell_equality surface_smooth surface_granulose surface_verrucose surface_spinulose close_to_the_apices germination_midle close_to_the_septum Stigmatocysts with_supporting_cell primary_hyphae
Lampiran 3 Nilai varians dari masing-masing cluster Percobaan dengan 3 cluster var 1 40.73 var 2 44.29 var 3 47.97 Percobaan dengan 5 cluster var 1 58.61 var 2 52.94 var 3 69.33 var 4 54.20 var 5 56.74 Percobaan dengan 10 cluster var 1 34.83 var 2 36.29 var 3 42.06 var 4 44.75 var 5 29.83 var 6 31.76 var 7 32.87 var 8 37.92 var 9 4.5 var 10 29
21
Lampiran 4 Tabel fitur ciri yang berbeda Data Jamur Ke-
Hasil Percobaan Clustering
Ciri yang berbeda
9
Cluster 1
X18, X19, X29, X33, X44, X45, X46, X48, X50, X51, X67. X71, X77, X78, X79, X80, X81, X82, X83, X84, X85, X86, X87, X88, X89, X90, X90, X91, X92, X93, X95, X96, X97, X98, X99, X102, X04
108
Cluster 4
X31, X41, X53, X92
22
Cluster 6
X1, X2, X3, X4, X6, X7, X9, X10, X11, X12, X14, X15, X16, X17, X18, X21, X22, X29, X30, X32, X39, X44, X45, X48, X49, X50, X52, X54, X58, X60, X64, X65, X70, X71, X72, X73, X78, X80, X82, X86, X87, X89, X90, X91, X95, X99, X100, X104
32
Cluster 5
X2, X8, X9, X10, X11, X14, X15, X16, X18, X20, X21, X22, X23, X29, X30, X31, X33, X38, X39, X41, X43, X44, X46, X47, X69, X50, X51, X54, X58, X60, X62, X66, X70, X71, X73, X74, X80, X81, X85, X86, X87, X9, X90, X91, X92, X93, X95, X99, X101, X102, X104
37
Cluster 10
X1, X3, X6, X9, X10, X12, X13, X16, X17, X18, X20, X22, X23, X24, X25, X28, X29, X30, X31, X32, X36, X39, X46, X47, X48, X51, X54, X55, X59, X60, X67, X68, X73, X81, X82, X86, X89, X90, X91, X95, X96, X98, X99
22
RIWAYAT HIDUP Penulis dilahirkan pada tanggal 27 Juli 1987 di Muara Enim. Penulis merupakan anak kedua dari tiga bersaudara dari pasangan Bapak Amin Fauzi, ST dan Ibu Aisyah. Pada tahun 2005, penulis lulus dari SMA Negeri 1 Muara Enim. Pada tahun yang sama, penulis lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB. Pada tahun 2008, penulis lulus dari program Diploma Jurusan Manajemen Informatika Institut Pertanian Bogor. Pada tahun 2009, penulis melanjutkan program studi Sarjana di Departemen Ilmu Komputer, Institut Pertanian Bogor, Program Studi Ilmu Komputer. Selama menjalani perkuliahan, penulis juga bekerja sebagai Pegawai Negeri Sipil pada Badan Kepegawaian Daerah Pemerintah Provinsi DKI Jakarta Sub Bidang Data Kepegawaian sampai dengan saat ini.