EKSPLORASI METODE KLASIFIKASI PADA DATA BINER
DIAN RARASSANTI G14103017
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007
RINGKASAN DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan ERFIANI dan BAGUS SARTONO. Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya. Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.
i
EKSPLORASI METODE KLASIFIKASI PADA DATA BINER
DIAN RARASSANTI
Skripsi sebagai salah satu syarat memperoleh gelar Sarjana Sains pada Departemen Statistika Fakultas Matematika dan Pengetahuan Alam Institut Pertanian Bogor
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007 ii
RIWAYAT HIDUP Penulis dilahirkan di Bantul pada tanggal 26 Mei 1985 sebagai anak pertama dari dua bersaudara, anak dari pasangan Slamet Wiranto dan Sumi Awaliati. Pada tahun 2003 penulis menyelesaikan pendidikan menengah lanjutan atas di SMU Negeri 5 Bogor sedangkan pada tahun yang sama pula diterima di Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui Undangan Seleksi Masuk IPB (USMI). Selama mengikuti perkuliahan, penulis ikut serta dalam kegiatan Himpro Gamma Sigma Beta (GSB) periode 2003/2004 sebagai staf Departemen Kewirausahaan dan periode 2004/2005 sebagai staf Departemen Eksternal, Keluarga Mahasiswa Muslim Statistika (KAMMUS) periode 2004/2005 sebagai bendahara, dan Decision Centre periode 2006/2007 sebagai sekretaris serta mengikuti kegiatan internal lainnya pula. Penulis juga mengikuti kegiatan Praktek Lapang di PT. Capricorn MARS Indotama pada bulan Februari-April 2007.
iv
KATA PENGANTAR Alhamdulillahirabbil’alamin, segala puji dan syukur dipanjatkan kehadirat Allah SWT atas segala hidayah, nikmat, dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga selalu tercurahkan kepada Rasulullah SAW, keluarga, sahabat dan umatnya hingga akhir zaman. Karya ilmiah ini berjudul “Eksplorasi Metode Klasifikasi pada Data Biner”. Dalam penelitian ini dilakukan eksplorasi terhadap data tanaman obat yang diklasifikasikan berdasarkan khasiatnya. Dari eksplorasi tersebut didapatkan pengklasifikasian tanaman obat menjadi enam klasifikasi. Hal ini diduga sesuai dengan kandungan fitokimia pada tanaman obat yang berhubungan dengan khasiat yang dapat disembuhkan tanaman obat tersebut. Terima kasih penulis sampaikan kepada berbagai pihak yang telah membantu dalam penyelesaian karya ilmiah ini, yaitu kepada : 1. Ibu Dr. Ir. Erfiani, M.S dan Bapak Bagus Sartono, S.Si, M.Si terima kasih atas segala bimbingan, saran dan kritik sehingga karya ilmiah ini dapat diselesaikan. 2. Bapak, Ibu, dan dèk Rista yang aku sayangi atas do’a, semangat dan kasih sayang yang tak pernah berhenti mengalir. 3. Segenap staf pengajar di Departemen Statistika FMIPA IPB terima kasih atas pengajaran yang diberikan sehingga penulis dapat menyelesaikan studi dan karya ilmiah ini. 4. Seluruh staf pegawai Departemen Statistika FMIPA IPB: bu Markonah, bu Sulis, bu Dedeh, bang Sudin, mang Dur, mang Herman, pak Ian, bu Aat dan pak Edi yang selalu setia membantu segala keperluan yang menyangkut penyelesaian karya ilmiah ini. 5. Teman-teman seperjuangan di Statistika 40, terimakasih atas segala kekompakan dan kerjasama yang sudah diberikan selama empat tahun ini. Terlebih lagi Ema (atas tumpangan kost-nya selama beberapa bulan terakhir ini), Lala dan Bayu (atas berbagai bentuk bantuan yang telah diberikan), Ari dan kang masnya, Muti, Daus (teman seperjuanganku), Riko (atas CD-nya), mas Den (atas semua saran yang sudah diberikan), Essy, Rina, Edo, dkk, Anggoro dan seluruh teman-temanku tercinta, terima kasih bantuan dan dukungannya. 6. Mbak Dani’ dan keluarga besarku, mbak Fera, Hurry, the 48’ers, Azzahra crew, juga Halimuners. 7. Semua kakak kelas 39, 38, 37 dan adik-adik Statistika angkatan 41, 42, dan 43. 8. Semua pihak yang telah memberikan dukungan kepada penulis yang tidak dapat disebutkan satu per satu. Penulis menyadari bahwa masih banyak kekurangan dalam karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat.
Bogor, September 2007 Penulis
v
DAFTAR ISI Halaman DAFTAR TABEL ........................................................................................................................ vii DAFTAR GAMBAR ................................................................................................................... vii DAFTAR LAMPIRAN ................................................................................................................ viii PENDAHULUAN Latar Belakang ...................................................................................................................... Tujuan ....................................................................................................................................
1 1
TINJAUAN PUSTAKA Data biner .............................................................................................................................. Klasifikasi ............................................................................................................................. Analisis gerombol ................................................................................................................. Analisis asosiasi ....................................................................................................................
1 1 1 3
BAHAN DAN METODE Bahan ..................................................................................................................................... Metode ...................................................................................................................................
3 3
HASIL DAN PEMBAHASAN Analisis gerombol ................................................................................................................. Analisis asosiasi .................................................................................................................... Eksplorasi hasil analisis gerombol dengan analisis asosiasi ................................................
4 4 6
KESIMPULAN ............................................................................................................................
6
DAFTAR PUSTAKA ..................................................................................................................
7
LAMPIRAN .................................................................................................................................
8
vi
DAFTAR TABEL Halaman 1.
Tabel kontingensi data biner ................................................................................................. 2
2.
Aturan tunggal dari aturan asosiatif ...................................................................................... 5
3.
Klasifikasi dari analisis asosiatif .......................................................................................... 5
DAFTAR GAMBAR Halaman 1.
Grafik asosiasi (Association Graph) .................................................................................... 5
vii
DAFTAR LAMPIRAN Halaman
1.
Data tanaman obat berdasarkan khasiat yang dimilikinya .................................................... 8
2.
Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Fourfoul Point ............................................................................................................... 11
3.
Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Dice ............................................................................................................................... 11
4.
Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Jaccard ........................................................................................................................... 12
5.
Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Ochiai ................................................................................................................. 12
6.
Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 2 .......................................................................................................... 13
7.
Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 5 .......................................................................................................... 13
8.
Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage ..... 14
9.
Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Dice ........................................................................................... 15
10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Ochiai ....................................................................................... 15 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Sokal & Sneath 5 ...................................................................... 16 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak Ochiai ..................................................................................................................................... 16 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage within the New Group dan metode Centroid ......................................................................... 17 14. Tabel aturan asosiasi (association rule) ................................................................................ 18
viii
PENDAHULUAN
TINJAUAN PUSTAKA
Latar Belakang
Data biner
Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal. Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis. Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.
Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).
Tujuan Tujuan penelitian ini adalah untuk: 1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat. 2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.
Klasifikasi Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988). Analisis Gerombol Analisis gerombol adalah salah satu analisis peubah ganda yang prinsip utamanya adalah mengklasifikasikan individu yang relatif sama atau seragam ke dalam suatu gerombol yang didasarkan pada ukuran kedekatan (ukuran jarak atau ukuran kesamaan). Objek yang terletak dalam suatu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam gerombol lain (Johnson & Wichern 2002). Dan diharapkan keragaman unit-unit pengamatan dalam satu gerombol lebih homogen daripada keragaman antar gerombol. Pada jenis data biner, ukuran jarak atau kesamaan dinyatakan dalam bentuk koefisien kesamaan (similarities coefficient) yang nilainya berkisar antara 0 sampai 1. Berbeda dengan konsep jarak untuk data pengukuran, untuk data biner nilai koefisien yang diperoleh bukan menunjukkan kuantitas jarak, tetapi menunjukkan kedekatan dua variabel atau objek. Nilai yang mendekati satu menunjukkan kedua objek tersebut sangat mirip, sedangkan nilai koefisien yang mendekati nol
1
ad − bc
menunjukkan bahwa kedua objek tersebut tidak mirip. Koefisien kesamaan diperoleh dengan terlebih dahulu dibuat tabel kontingensi 2x2 untuk setiap pasang objek ke-i dan ke-j, seperti pada Tabel 1 berikut ini (Digby & Kempton 1987):
3.
Tabel 1. Tabel Kontingensi Data Biner Individu ke-i Total 1 0 Individu 1 a b a+b ke-j 0 c d c+d Total a+c b+d p dengan: p = total jumlah objek a = frekuensi kedua individu bernilai 1 b, c = frekuensi satu objek bernilai 1 dan objek lainnya bernilai 0 d = frekuensi kedua individu bernilai 0
4.
Terdapat dua teknik penggerombolan pada analisis gerombol, yaitu teknik hirarki dan nonhirarki. Teknik berhirarki digunakan jika jumlah gerombol yang terbentuk tidak diketahui sebelumnya, sedangkan teknik nonhirarki digunakan apabila jumlah gerombol yang terbentuk sudah ditetapkan dari awal (Johnson & Wichern 2002). Metode gerombol berhirarki dapat digunakan untuk menggerombolkan data biner. Di dalam metode tersebut terdapat beberapa metode perbaikan jarak, seperti metode pautan tunggal (Single Linkage), pautan lengkap (Complete Linkage), pautan rataan dalam kelompok (Average Linkage within the New Group), pautan rataan antar kelompok (Average Linkage between Merged Group), Centroid, Median, dan Ward (Johnson & Wichern 2002). Adapun beberapa tipe ukuran kesamaan yang digunakan pada data biner, yaitu seperti: 1. Simple Matching Ukuran kesamaan bertipe ini merupakan perbandingan objek yang sepadan terhadap jumlah keseluruhan objek yang ada. Ukuran ini memberikan bobot yang sama baik pada objek yang sepadan maupun yang tidak sepadan. Rumusnya diformulasikan sebagai berikut: a+d p 2. Fourfoul Point Ukuran kedekatan ini adalah salah satu bentuk ukuran kesamaan yang diperuntukan pada data biner. Adapun formulasinya adalah sebagai berikut:
5.
6.
(a + b )(a + c )(b + d )(c + d ) Jaccard Nilai koefisien Jaccard adalah suatu indeks dimana nilai d (0-0 sepadan) tidak dimasukkan dalam perhitungan. Ukuran ini pun memberikan bobot yang sama baik pada objek yang sepadan maupun yang tidak sepadan. Persamaannya sebagai berikut: a a+b+c Dice Ukuran Dice dikenal juga dengan nama ukuran Czekanowski atau ukuran Serensen. Ukuran ini sama dengan ukuran persamaan Jaccard dimana nilai d tidak dimasukkan dalam perhitungan, akan tetapi nilai a (1-1 sepadan) diberikan bobot ganda. Formulasinya adalah: 2a 2a + b + c Sokal & Sneath 2 Ukuran Sokal & Sneath 2 memberikan bobot yang sama pada objek yang tidak sepadan. Masing-masing objek yang tidak sepadan tersebut diberi bobot ganda. Namun nilai d tidak dimasukkan dalam perhitungan. Berikut formulasinya: a a + 2(b + c ) Ochiai Ukuran kesamaan ini diperkenalkan ditahun 1957. Rumus ukuran kesamaan Ochiai diformulasikan sebagai berikut: a (a + b )(a + c )
7.
8.
Sokal & Sneath 4 Ukuran kesamaan ini didasari oleh peluang bersyarat dari satu nilai a, sedangkan nilai objek yang lain dinyatakan sebagai predictor yang dihitung dari nilai rata-ratanya. Adapun rumusnya adalah sebagai berikut: a (a + b ) + a (a + c ) + d (b + d ) + d (c + d ) 4 Sokal & Sneath 5 Ukuran kesamaan ini bebas dari pengkodean objek-objeknya. Adapun rumusnya adalah sebagai berikut: ad
(a + b )(a + c )(b + d )(c + d )
2
Wijayati (2002) menyatakan bahwa metode klasifikasi terbaik adalah metode perbaikan jarak Average Linkage within the New Group dengan simple matching sebagai kombinasi ukuran kesamaannya. Analisis Asosiasi Analisis asosiasi dikenal sebagai salah satu teknik eksplorasi data yang menjadi langkah awal dari berbagai teknik eksplorasi data lainnya. Dasar analisis asosiasi adalah menemukan aturan asosiasi antar kombinasi item atau objek. Contoh aturan asosiasi dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu (Bajcsy 2002). Oleh karena itu, analisis asosiasi dapat didefinisikan sebagai suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). Penting tidaknya suatu aturan asosiasi dapat diketahui dengan dua ukuran, yaitu support (nilai penunjang) yang berarti persentase kombinasi item dalam database dan confidence (nilai kepastian) yang berarti kuatnya hubungan antar item dalam aturan asosiasi. Aturan asosiasi biasanya dinyatakan dalam bentuk : {X1} {X2} (supp = a%, conf = b%) dengan X1 merupakan item di sebelah kiri aturan asosiasi (left hand of rule) sedangkan X2 merupakan item di sebelah kanan aturan asosiasi (right hand of rule). Hal ini berarti b% dari transaksi di database yang memuat item X1 juga memuat item X2. Sedangkan a% dari seluruh transaksi yang ada di database memuat kedua item itu. Dua tahap dalam mendapatkan aturan asosiasi (Tan, Steinbach, & Kumar 2004): • Analisa pola frekuensi tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. • Pembentukan aturan asosiasi Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk
confidence dengan menghitung confidence aturan asosiasi Xi Xj dimana i ≠ j dari support pola frekuensi tinggi Xi dan Xj dengan menggunakan rumus berikut : supp X i ∪ X j Conf (Xi Xj)= supp( X i )
(
)
BAHAN DAN METODE Bahan Data yang digunakan dalam penelitian ini adalah data tanaman obat-obatan tradisional berdasarkan khasiat yang terkandung di dalamnya, yaitu terdiri dari 29 jenis tanaman obat dengan 95 macam gangguan kesehatan yang dapat diatasinya. Dari data yang tercantum, nilai 1 menunjukkan bahwa tanaman obat ke-i berkhasiat mengatasi berbagai gangguan kesehatan tertentu, sedangkan nilai 0 menunjukkan tanaman obat ke-i tidak berkhasiat mengatasi gangguan kesehatan tersebut. Data ini diambil dari PSB (Pusat Studi Biofarmaka) dan dilengkapi informasi dari pustaka “Atlas Tumbuhan Obat Indonesia” (Dalimartha 1999, 2000, 2003). Data yang digunakan terlampir pada Lampiran 1. Perangkat lunak yang digunakan dalam penelitian ini adalah SPSS 13.0 for Windows, Microsoft Excel, dan SAS Enterprise Miner 4.3. Metode Dari data tersebut, dilakukan analisis data dengan menggunakan metode klasifikasi yaitu analisis gerombol dan analisis asosiasi. Tahapan analisis data yang dilakukan dalam penelitian ini adalah: 1. Analisis data menggunakan analisis gerombol berhirarki dilakukan dengan menggunakan bantuan perangkat lunak SPSS 13.0 for Windows. Pada penelitian ini dikombinasikan 7 metode perbaikan jarak dan 20 ukuran kesamaan. Tujuh metode perbaikan jarak yang digunakan adalah: Single Linkage Complete Linkage Average Linkage within the New Group Average Linkage between Merged Group Centroid Median Ward 3
Sementara itu, 20 ukuran kesamaan yang digunakan adalah: Simple matching Fourfoul point Jaccard Dice Sokal & Sneath 1 Sokal & Sneath 2 Sokal & Sneath 3 Sokal & Sneath 4 Sokal & Sneath 5 Ochiai Russel & Rao Rogers & Tanimoto Kulczynski 1 Kulczynski 2 Hamann Goodman & Kruskal Lambda Anderberg’s D Yule’s Y Yule’s Q Dispersion Dengan demikian terdapat 140 kombinasi metode perbaikan jarak dan ukuran jarak yang dilakukan. 2. Analisis data dengan analisis asosiasi, dilakukan pada jumlah level (jumlah item pada aturan asosiasi yang terbentuk) sebanyak 2, hal ini disebabkan karena selain untuk melihat hubungan keeratan antar item di dalamnya, juga akan mempermudah penginterpretasian klasifikasi data tanaman obat berdasarkan khasiatnya tersebut. Adapun tahapannya adalah sebagai berikut: • Analisa pola frekuensi tinggi Mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database, nilai minimum support yang digunakan adalah sebesar 4%. • Pembentukan aturan asosiasi Langkah selanjutnya adalah mencari aturan asosiasi yang memenuhi syarat minimum untuk confidence, nilai minimum confidence yang digunakan adalah sebesar 50%. Sehingga secara keseluruhan analisis ini dapat diinterpretasikan bahwa 50% dari transaksi di database yang memuat item di sebelah kiri aturan asosiasi (left hand of rule) juga memuat item di sebelah kanan aturan asosiasi (right hand of rule). Sedangkan 4% dari seluruh transaksi yang ada di database memuat kedua item tersebut. Analisis ini dianalisis menggunakan perangkat lunak SAS Enterprise Miner 4.3 dan dibantu dengan SPSS 13.0 for Windows. 3. Eksplorasi hasil kedua metode tersebut.
Menginterpretasikan hasil klasifikasi yang diperoleh kedua metode kemudian mencari klasifikasi yang sesuai dan serupa dari kedua metode tersebut.
HASIL DAN PEMBAHASAN Analisis Gerombol Metode perbaikan jarak Complete Linkage dikombinasikan dengan ukuran kesamaan Ochiai, dan Sokal & Sneath 5 mengklasifikasikan tanaman obat menjadi 5 gerombol. Sedangkan apabila dikombinasikan dengan ukuran kesamaan Fourfoul Point, Dice, Jaccard, dan Sokal & Sneath 2 mengklasifikasikan tanaman obat menjadi 6 gerombol. Dendrogram kombinasi antara metode perbaikan jarak Complete Linkage dapat dilihat pada Lampiran 2-7. Hasil penggerombolan oleh metode Complete Linkage dilampirkan pada Lampiran 8. Hasil pengklasifikasian pada metode Average Linkage within the New Group yang dikombinasikan dengan ukuran kesamaan Dice membentuk 5 gerombol. Sedangkan jika dikombinasikan dengan ukuran kesamaan Ochiai dan Sokal & Sneath 5 membentuk 6 gerombol (Lampiran 9-11). Centroid Metode perbaikan jarak membentuk 6 gerombol jika dikombinasikan dengan ukuran kesamaan Ochiai. Dengan dendrogram terlampir pada Lampiran 12. Daftar klasifikasi untuk metode perbaikan jarak Average Linkage within the New Group dan Centroid terlampir pada Lampiran 13. Metode perbaikan jarak yang digunakan pada penelitian ini adalah Average Linkage within the New Group, Complete Linkage, dan Centroid. Sedangkan ukuran kesamaannya adalah Sokal & Sneath 4, Sokal & Sneath 5, Ochiai, Sokal & Sneath 2, Fourfoul point, Jaccard, Dice. Jumlah gerombol yang terbentuk pada penelitian ini sesuai dengan banyaknya kelompok kandungan fitokimia dari tanaman obat, yaitu sebanyak 5 atau 6 gerombol. Hal ini mengidentifikasikan bahwa metode yang dipergunakan untuk melakukan penggerombolan tanaman obat pada penelitian ini sudah tepat digunakan. Analisis Asosiasi Langkah pertama analisis ini adalah analisa nilai frekuensi tinggi atau mencari nilai support dari masing-masing kombinasi rule yang terbentuk. Pada penelitian ini nilai support minimumnya ditetapkan sebesar 4% sehingga
4
nilai support yang kurang dari nilai 4% dihilangkan. Total kombinasi item yang terbentuk oleh analisis asosiasi pada level 2 adalah sebanyak 102 aturan (rule) asosiasi, akan tetapi setelah proses analisa frekuensi tinggi dilakukan, aturan yang memiliki persentase di atas 4% adalah sebanyak 77 aturan asosiasi yang terlihat pada Gambar 1.
Setelah itu, tanaman-tanaman obat yang lain diklasifikasikan sesuai dengan right hand of rule yang terlebih dahulu diurutkan nilai support dan nilai confidence yang menyertainya. Adapun hasil pengklasifikasian yang terbentuk pada analisis asosiasi ini dapat dilihat pada Tabel 3.
Keji beling Buah makasar Kumis kucing Daun ungu Temuputih Rumput mutiara Jahe Tempuyung Sambung nyawa Lidah buaya Temulawak Kunyit Cakar ayam Picisan Iler Saga Sambiloto Sidaguri Meniran Pare Daun sendok Jombang
Gambar 1. Grafik Asosiasi (Association Graph) Dari Gambar 1, terlihat bahwa nilai confidence ditandai oleh perbedaan bentuk, sedangkan nilai support ditandai oleh perbedaan warna, seperti pada sambiloto dan daun sendok terlihat memiliki asosiasi yang cukup besar, yaitu dengan support berada di antara 7.5-8.82% dan confidence di antara 5054.46%, begitu pun tanaman obat yang lainnya. Nilai ini dapat dilihat secara lebih jelas pada tabel asosiasi Lampiran 14. Setelah itu, tahap selanjutnya adalah mencari aturan asosiasi yang memenuhi syarat minimum untuk confidence, nilai minimum confidence yang digunakan adalah sebesar 50%. Dari 77 aturan asosiasi yang terbentuk tadi kemudian diurutkan berdasarkan left hand of rule untuk mendapatkan dasar pengklasifikasiannya dengan cara mencari aturan asosiasi yang unik atau tunggal yang hanya memiliki satu aturan asosiasi saja. Aturan yang ditemukan adalah: Tabel 2. Aturan Tunggal dari Aturan Asosiasi right hand of rule gerombol left hand of rule 1 temuputih daun dewa 2 jombang daun sendok 3 rumput mutiara pegagan 4 jahe adas 5 pare mengkudu
Tabel 3. Klasifikasi dari Analisis Asosiasi Gerombol Tanaman obat 1 daun ungu daun dewa temuputih 2 kumis kucing keji beling daun sendok jombang meniran sambung nyawa sambiloto 3 buah makasar saga cakar ayam pegagan picisan rumput mutiara 4 kunyit jahe sidaguri adas tempuyung 5 temulawak mengkudu pare 5
Gerombol
6
Tanaman obat iler lidah buaya mimba lengkuas mahkota dewa
Klasifikasi pertama terbentuk karena daun ungu dan temuputih memiliki asosiasi yang kuat yaitu daun dewa sebagai penghubung di antara keduanya, selain itu asosiasi daun ungu dan daun dewa memiliki nilai confidence terbesar dari nilai asosiasi yang lainnya, yaitu sebesar 85.71% yang berarti bahwa 85.71% dari khasiat tanaman obat yang memuat daun ungu juga memuat daun dewa, sedangkan 6.32% dari khasiat tanaman obat memuat keduanya. Pada klasifikasi kedua, daun sendok dan jombang sebagian besar memiliki anggota tanaman obat yang sama, sehingga daun sendok, jombang, dan tanaman obat yang sama di dalamnya dapat dijadikan satu klasifikasi. Kumis kucing juga dapat dijadikan satu, karena tanaman obat yang berasosiasi terhadap kumis kucing sama seperti pada daun sendok dan jombang, sedangkan oleh karena keji beling memiliki asosiasi yang kuat dengan daun sendok dan jombang, maka tanaman ini pun dapat dimasukkan ke dalam klasifikasi kedua. Sedangkan klasifikasi ketiga terbentuk dikarenakan memiliki asosiasi yang kuat, hal ini terlihat dari nilai confidence & support yang dimiliki anggota tanaman obat di dalamnya relatif cukup besar antara satu dengan yang lainnya. Terlihat pada saga dan pegagan yang memiliki nilai confidence terbesar ke empat dari keseluruhan aturan asosiasi. Klasifikasi keempat terbentuk karena ada kesamaan asosiasi nilai confidence dan support antara kunyit dan jahe, yaitu dihubungkan dengan tanaman adas. Tempuyung dapat dimasukkan ke dalam klasifikasi ini karena memiliki nilai confidence dan support yang cukup kuat dengan adas dan sidaguri. Pada klasifikasi kelima, masing-masing item di dalamnya saling memiliki keterkaitan, sehingga tujuh tanaman obat ini dapat dimasukan dalam satu gerombol. Seperti dapat dilihat bahwa mimba hanya berasosiasi dengan iler, sedangkan antara iler dengan lengkuas, lidah buaya, dan juga pare dapat diklasifikasikan ke dalamnya karena memiliki nilai support dan confidence yang paling besar. Klasifikasi keenam terbentuk karena pada 77 aturan asosiasi yang dihasilkan tidak muncul sama sekali tanaman mahkota dewa,
sehingga mahkota dewa dapat membentuk klasifikasi sendiri. Eksplorasi Hasil Analisis Gerombol dengan Analisis Asosiasi Klasifikasi dengan menggunakan analisis gerombol yang dihasilkan pada penelitian ini sesuai dengan Wijayati (2002), yang menyebutkan bahwa metode perbaikan jarak terbaik adalah Average Linkage within the New Group. Sedangkan ukuran kesamaan yang memberikan klasifikasi yang memuaskan adalah Sokal & Sneath 5, hal ini didukung oleh hasil pengklasifikasian analisis asosiasi yang menunjukkan hasil yang sama pula. Klasifikasi yang dihasilkan dengan menggunakan analisis asosiasi memiliki kemiripan dengan hasil klasifikasi pada analisis gerombol, yaitu pada kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5. Sehingga dalam penelitian ini data tanaman obat dapat diklasifikasikan ke dalam 6 gerombol dimana masing-masing gerombol yang terbentuk diklasifikasikan berdasarkan khasiat yang terkandung di dalam tanaman obat tersebut. Penggerombolan ini pun sesuai dengan kandungan senyawa fitokimia yang cenderung dapat dibagi ke dalam 6 kelompok, yaitu alkaloid, flavonoid, steroid, triterpenoid, saponin dan tanin.
KESIMPULAN Eksplorasi metode klasifikasi data biner tanaman obat-obatan berdasarkan khasiatnya dapat dilakukan dengan banyak metode. Akan tetapi dasar dari metode pengklasifikasian terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.
6
DAFTAR PUSTAKA Bajcsy, P. 2002. Introduction to Data Mining [modul]. Cox, D. R. & Snell E. J. 1996. Analysis of Binary Data. London: Chapman and Hall. Dalimartha, S. 1999. Atlas Tumbuhan Obat Indonesia. Jilid 1. Depok: Puspa Swara. Dalimartha, S. 2000. Atlas Tumbuhan Obat Indonesia. Jilid 2. Depok: Puspa Swara. Dalimartha, S. 2003. Atlas Tumbuhan Obat Indonesia. Jilid 3. Depok: Puspa Swara. Digby, P. G. N & R. A. Kempton. 1987. Multivariate Analysis of Ecological Communities. New York: Chapman and Hall. Johnson, R. A. & Wichern, D. W. 2002. Applied Multivariate Statistical Analysis. Ed ke-5. New Jersey: Prentice Hall. Kamus Besar Bahasa Indonesia. 1989. Jakarta: Balai Pustaka. Ludwig, J. A. & Reynold, J. F. 1988. Statistical Ecology. Canada: J Wiley. Tan, P.N, M. Steinbach, & V. Kumar. 2004. Introduction to Data Mining [modul]. Wijayati, A. 2002. Evaluasi Konsep Jarak dan Metode Penggerombolan untuk Data Biner [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
7
LAMPIRAN
Daun Dewa
Cakar Ayam
Buah Makasar Adas 0 0 0 0 0 0 0 1 1 1 0 0 1 0 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 1 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 1 0 0 0 0 1 0
0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 1 0 0 0 0 0 0
0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 1 1 1 1 1 1
0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 0 0 0 0 0
0 0 1 0 0 0 0 0 1 0 1 1 0 0 1 1 0 0 1 1 1 0 1 0 1 0 0 0 0 0 0
Lengkuas Kunyit Kumis Kucing Keji Beling Jombang Jahe Iler Daun Ungu Daun Sendok
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0
0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0
Lidah Buaya
0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
0 1 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 1 1 1 0 1 1 0 1 1 0 0 0 1 1
0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 0 0 1 1 1 0 1 1
0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 1 1 0 0 1 0 1 1 0 0 0 1 0
1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 1 1 1 1 0
0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1
0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 1 1 1 1 0 1 0 1 0
Sidaguri Sambung Nyawa Sambiloto Saga Rumput M utiara Picisan Pegagan Pare Mimba M eniran M engkudu M ahkota Dewa
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0
Tempuyung
0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0 1 0 1 0
NAMA TANAMAN
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1
Temulawak
Alzheimer Amandel Anemia Arthritis Asam Urat Asites Asma Batu Empedu Batuk Batuk/Muntaber Darah Bau Badan Bau Mulut Beri-Beri Biang Keringat Bisul Bronchitis Cacar Cacingan Demam Diabetes Melitus Diare Difteri Disentri Flu Gangg. Haid Gangg.Pencernaan Gangg.Penglihatan Gangg. Sal.Kencing Gastritis Gigitan Binatang Ginjal
KHASIAT
Lampiran 1. Data tanaman obat berdasarkan khasiat yang dimilikinya
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0
Temuputih 8
Lidah Buaya
Lengkuas
Kunyit
Kumis Kucing
Keji Beling
Jombang
Jahe
Iler
Daun Ungu
Daun Sendok
Daun Dewa
Cakar Ayam
Buah Makasar
Adas 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Mahkota Dewa
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 0
0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0
Mengkudu
0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
Meniran
0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1
Mimba
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
0 1 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 1 0 1
Pare
0 0 0 1 0 0 0 0 1 0 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 1 0 0
0 0 1 1 0 1 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1
Pegagan
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0
1 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
Picisan
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
1 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
Rumput Mutiara
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0
0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
Saga
0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
Sambiloto
0 0 0 0 1 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 1 0
0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
Sambung Nyawa
0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0
Sidaguri
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0
Tempuyung
0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 1 1 0 0
0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0
Temulawak
Gondongan Gonorhoe Hamil Anggur Hepatitis Hepatoma Herpes Hernia Hiperkolesterolemia Hipertensi Impotensi Infeksi Insomnia Jerawat/Flek Kanker Kegemukan Kejang Kelenjar Getah Bening Keputihan Keracunan Kesemutan Ketombe Kista Kolik Konstipasi Kurang Nafsu Makan Kusta Leukimia Luka Bakar Malaria Masuk Angin Memar/Luka Melancarkan Asi Mimisan Pertumbuhan Rambut
KHASIAT
NAMA TANAMAN
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0
Temuputih 9
Adas
1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 0 1 0 1 1 0 0 0 0 0 0 0
KHASIAT
Mual/ Muntah Nyeri Otot Oedema Patah Tulang Pegal Linu Pembengkakan Payudara Penyakit Kulit Penyakit Mata Perdarahan Perut Kembung Pikun Proteinuria Radang Radang Prostat Rambut Rontok Reumatik Sakit Gigi/Gusi Sakit Kepala Sakit Limpa Sakit Perut Sakit Pinggang Sakit Telinga Sariawan Selulit Sirosis TBC Terkilir Tumor Usus Buntu Wasir
Mahkota Dewa
Lidah Buaya
Lengkuas
Kunyit
Kumis Kucing
Keji Beling
Jombang
Jahe
Iler
Daun Ungu
Daun Sendok
Daun Dewa
Cakar Ayam
Buah Makasar 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 1 0 0 1 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0
Mengkudu
0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1
0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0
Meniran
0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0
0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1
Mimba
0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1
Pare
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 1 1 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 1 1 0 1 0 0 1
Pegagan
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0
Picisan
0 0 1 0 0 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0
0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
Rumput Mutiara
1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1
0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0
Saga
0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0
Sambiloto
0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
Sambung Nyawa
0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 1
Sidaguri
0 0 0 1 0 1 1 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 1 0 1 0 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 1
Tempuyung
0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0
0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Temulawak
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
NAMA TANAMAN
0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0
Temuputih 10
Lampiran 2. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Fourfoul Point Rescaled Distance Cluster Combine C A S E Label ILER PARE LIDAH BUAYA MIMBA MENGKUDU TEMULAWAK KUMIS KUCING MENIRAN DAUN SENDOK JOMBANG KEJI BELING RUMPUT MUTIARA SAGA PEGAGAN BUAH MAKASAR CAKAR AYAM PICISAN DAUN DEWA DAUN UNGU TEMUPUTIH ADAS JAHE LENGKUAS SIDAGURI TEMPUYUNG KUNYIT SAMBILOTO SAMBUNG NYAWA MAHKOTA DEWA
Num 7 19 14 18 16 28 11 17 5 9 10 22 23 20 2 3 21 4 6 29 1 8 13 26 27 12 24 25 15
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Lampiran 3. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Dice Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK JOMBANG MENIRAN PEGAGAN MENGKUDU PARE LENGKUAS DAUN DEWA SAMBILOTO MIMBA RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN TEMUPUTIH DAUN UNGU ILER LIDAH BUAYA KEJI BELING SIDAGURI TEMPUYUNG KUNYIT KUMIS KUCING SAMBUNG NYAWA ADAS JAHE TEMULAWAK MAHKOTA DEWA
Num 5 9 17 20 16 19 13 4 24 18 22 23 2 3 21 29 6 7 14 10 26 27 12 11 25 1 8 28 15
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Lampiran 4. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Jaccard Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK JOMBANG MENIRAN PEGAGAN MENGKUDU PARE LENGKUAS
Num 5 9 17 20 16 19 13
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
11
DAUN DEWA SAMBILOTO MIMBA RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN TEMUPUTIH DAUN UNGU ILER LIDAH BUAYA KEJI BELING SIDAGURI TEMPUYUNG KUNYIT KUMIS KUCING SAMBUNG NYAWA ADAS JAHE TEMULAWAK MAHKOTA DEWA
4 24 18 22 23 2 3 21 29 6 7 14 10 26 27 12 11 25 1 8 28 15
Lampiran 5. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Ochiai Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK JOMBANG MENIRAN PEGAGAN SAMBILOTO SIDAGURI TEMPUYUNG KUNYIT KUMIS KUCING SAMBUNG NYAWA ADAS JAHE TEMULAWAK DAUN DEWA DAUN UNGU LIDAH BUAYA ILER PARE MENGKUDU LENGKUAS MIMBA MAHKOTA DEWA KEJI BELING RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN TEMUPUTIH
Num 5 9 17 20 24 26 27 12 11 25 1 8 28 4 6 14 7 19 16 13 18 15 10 22 23 2 3 21 29
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Lampiran 6. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 2 Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK JOMBANG MENIRAN PEGAGAN MENGKUDU PARE LENGKUAS DAUN DEWA SAMBILOTO MIMBA RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN TEMUPUTIH DAUN UNGU ILER LIDAH BUAYA KEJI BELING SIDAGURI TEMPUYUNG KUNYIT
Num 5 9 17 20 16 19 13 4 24 18 22 23 2 3 21 29 6 7 14 10 26 27 12
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
12
KUMIS KUCING SAMBUNG NYAWA ADAS JAHE TEMULAWAK MAHKOTA DEWA
11 25 1 8 28 15
Lampiran 7. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 5 Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK MENIRAN JOMBANG SAMBILOTO PEGAGAN SIDAGURI TEMPUYUNG KUNYIT KUMIS KUCING SAMBUNG NYAWA ADAS JAHE LENGKUAS ILER PARE MENGKUDU LIDAH BUAYA TEMULAWAK MIMBA MAHKOTA DEWA KEJI BELING DAUN DEWA DAUN UNGU TEMUPUTIH RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN
Num 5 17 9 24 20 26 27 12 11 25 1 8 13 7 19 16 14 28 18 15 10 4 6 29 22 23 2 3 21
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Lampiran 8. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage
Gerombol
Fourfoul Point
1
jombang meniran kumis kucing daun sendok keji beling
2
buah makasar daun ungu cakar ayam picisan daun dewa temuputih
3
iler lidah buaya mimba mengkudu pare
Complete Linkage Dice=Jaccard = Ochiai Sokal & Sneath 2 jombang jombang meniran meniran sambiloto sambiloto daun sendok daun sendok pegagan pegagan mengkudu sidaguri pare tempuyung lengkuas kunyit daun dewa kumis kucing mimba sambung nyawa rumput mutiara saga buah makasar buah makasar picisan rumput mutiara cakar ayam cakar ayam temuputih picisan saga temuputih
iler lidah buaya keji beling daun ungu
keji beling
Sokal & Sneath 5 jombang meniran sambiloto daun sendok pegagan sidaguri tempuyung kunyit kumis kucing sambung nyawa
buah makasar daun ungu cakar ayam picisan daun dewa temuputih rumput mutiara saga keji beling
13
temulawak sidaguri tempuyung kunyit sambiloto sambung nyawa mahkota dewa adas jahe lengkuas
4
5
6
rumput mutiara saga pegagan
sidaguri tempuyung kunyit kumis kucing sambung nyawa adas jahe temulawak
mahkota dewa
-
adas jahe temulawak daun dewa daun ungu lidah buaya iler pare mengkudu lengkuas mimba mahkota dewa
-
adas jahe lengkuas iler mengkudu pare lidah buaya temulawak mimba
mahkota dewa
Lampiran 9. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Dice Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK JOMBANG MENIRAN PEGAGAN SAMBILOTO DAUN DEWA SAMBUNG NYAWA MIMBA KEJI BELING RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN MAHKOTA DEWA DAUN UNGU ILER LIDAH BUAYA TEMULAWAK MENGKUDU PARE ADAS LENGKUAS JAHE SIDAGURI TEMPUYUNG KUNYIT KUMIS KUCING TEMUPUTIH
Num 5 9 17 20 24 4 25 18 10 22 23 2 3 21 15 6 7 14 28 16 19 1 13 8 26 27 12 11 29
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Lampiran 10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Ochiai Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK
Num 5
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
14
JOMBANG MENIRAN PEGAGAN SAMBILOTO KUMIS KUCING KEJI BELING MAHKOTA DEWA RUMPUT MUTIARA SAGA BUAH MAKASAR CAKAR AYAM PICISAN DAUN DEWA DAUN UNGU LIDAH BUAYA ILER PARE MENGKUDU LENGKUAS SAMBUNG NYAWA MIMBA TEMULAWAK SIDAGURI TEMPUYUNG KUNYIT ADAS TEMUPUTIH JAHE
9 17 20 24 11 10 15 22 23 2 3 21 4 6 14 7 19 16 13 25 18 28 26 27 12 1 29 8
Lampiran 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Sokal & Sneath 5 Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK MENIRAN JOMBANG SAMBILOTO KUMIS KUCING SAMBUNG NYAWA KEJI BELING MAHKOTA DEWA BUAH MAKASAR CAKAR AYAM PICISAN RUMPUT MUTIARA SAGA PEGAGAN SIDAGURI TEMPUYUNG KUNYIT ADAS JAHE DAUN DEWA DAUN UNGU TEMUPUTIH ILER PARE LIDAH BUAYA MENGKUDU LENGKUAS MIMBA TEMULAWAK
Num 5 17 9 24 11 25 10 15 2 3 21 22 23 20 26 27 12 1 8 4 6 29 7 19 14 16 13 18 28
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Lampiran 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak Ochiai Rescaled Distance Cluster Combine C A S E Label DAUN SENDOK JOMBANG PEGAGAN SAMBILOTO KUMIS KUCING MENIRAN KEJI BELING SIDAGURI TEMPUYUNG ADAS MENGKUDU KUNYIT SAMBUNG NYAWA JAHE LENGKUAS LIDAH BUAYA
Num 5 9 20 24 11 17 10 26 27 1 16 12 25 8 13 14
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
15
TEMULAWAK ILER PARE MIMBA RUMPUT MUTIARA SAGA DAUN DEWA DAUN UNGU TEMUPUTIH BUAH MAKASAR CAKAR AYAM PICISAN MAHKOTA DEWA
28 7 19 18 22 23 4 6 29 2 3 21 15
Lampiran 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage within the New Group dan metode Centroid Gerombol 1
2
3
Average Linkage Within the New Group Sokal &Sneath 5 Ochiai Dice daun sendok daun sendok daun sendok meniran meniran meniran sambiloto sambiloto sambiloto jombang jombang jombang sambung nyawa pegagan pegagan kumis kucing kumis kucing sambung nyawa keji beling keji beling keji beling mimba daun dewa rumput mutiara rumput mutiara rumput mutiara saga saga saga buah makasar buah makasar buah makasar cakar ayam cakar ayam cakar ayam picisan picisan picisan pegagan mahkota dewa mahkota dewa mahkota dewa
4
daun ungu daun dewa temuputih
5
sidaguri tempuyung kunyit adas jahe
6
iler pare lidah buaya mengkudu lengkuas mimba temulawak
daun ungu daun dewa lidah buaya mimba temulawak mengkudu pare lengkuas iler sambung nyawa sidaguri tempuyung kunyit adas temuputih jahe
daun ungu iler lidah buaya adas temulawak mengkudu pare lengkuas jahe sidaguri tempuyung kunyit kumis kucing temuputih -
Centroid Ochiai daun sendok meniran sambiloto jombang pegagan kumis kucing keji beling
rumput mutiara saga
mahkota dewa buah makasar cakar ayam picisan daun ungu daun dewa temuputih
sidaguri tempuyung kunyit adas mengkudu sambung nyawa jahe lengkuas lidah buaya temulawak iler pare mimba
16
Lampiran 14. Tabel aturan asosiasi (association rule) SET_SIZE 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
EXP_CONF 24,21 29,47 18,95 32,63 31,58 25,26 29,47 24,21 22,11 15,79 32,63 24,21 31,58 31,58 26,32 24,21 24,21 31,58 29,47 17,89 24,21 29,47 24,21 22,11 29,47 24,21 24,21 32,63 25,26 24,21 26,32 17,89 25,26 29,47 25,26 18,95 16,84 31,58 25,26 22,11 17,89 12,63 10,53 32,63
CONF 85,71 83,33 83,33 81,82 80 80 80 80 71,43 71,43 71,43 70 70 66,67 66,67 66,67 66,67 66,67 66,67 63,64 61,11 60,87 60 60 60 60 60 58,82 58,82 58,82 58,33 58,33 58,33 57,14 57,14 57,14 57,14 57,14 57,14 57,14 57,14 57,14 57,14 56,25
SUPPORT 6,32 5,26 5,26 9,47 8,42 8,42 4,21 4,21 5,26 5,26 5,26 7,37 7,37 4,21 4,21 4,21 4,21 8,42 12,6 7,37 11,6 14,7 6,32 6,32 6,32 6,32 6,32 10,5 10,5 10,5 7,37 7,37 7,37 4,21 4,21 4,21 4,21 4,21 4,21 4,21 4,21 4,21 4,21 9,47
LIFT
COUNT
3,54 2,83 4,4 2,51 2,53 3,17 2,71 3,3 3,23 4,52 2,19 2,89 2,22 2,11 2,53 2,75 2,75 2,11 2,26 3,56 2,52 2,07 2,48 2,71 2,04 2,48 2,48 1,8 2,33 2,43 2,22 3,26 2,31 1,94 2,26 3,02 3,39 1,81 2,26 2,59 3,19 4,52 5,43 1,72
6 5 5 9 8 8 4 4 5 5 5 7 7 4 4 4 4 8 12 7 11 14 6 6 6 6 6 10 10 10 7 7 7 4 4 4 4 4 4 4 4 4 4 9
RULE
17
daun ungu ==> daun dewa kumis kucing ==> jombang kumis kucing ==> meniran saga ==> pegagan iler ==> mengkudu iler ==> pare keji beling ==> jombang keji beling ==> daun sendok buah makasar ==> lengkuas buah makasar ==> cakar ayam daun ungu ==> pegagan iler ==> daun sendok sambung nyawa ==> mengkudu kumis kucing ==> mengkudu kumis kucing ==> adas kumis kucing ==> daun dewa kumis kucing ==> daun sendok kunyit ==> mengkudu meniran ==> jombang tempuyung ==> sidaguri meniran ==> daun sendok daun sendok ==> jombang iler ==> daun dewa iler ==> lengkuas sambung nyawa ==> jombang sambung nyawa ==> daun dewa sambung nyawa ==> daun sendok sidaguri ==> pegagan sidaguri ==> pare sidaguri ==> daun sendok kunyit ==> adas kunyit ==> sidaguri lidah buaya ==> pare buah makasar ==> jombang buah makasar ==> pare buah makasar ==> meniran buah makasar ==> picisan daun ungu ==> mengkudu daun ungu ==> pare daun ungu ==> lengkuas daun ungu ==> sidaguri daun ungu ==> lidah buaya daun ungu ==> iler sambiloto ==> pegagan
2 2 2 2 2 2 2 2 SET_SIZE 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
29,47 32,63 31,58 22,11 13,68 32,63 26,32 24,21 EXP_CONF 24,21 31,58 26,32 32,63 31,58 25,26 29,47 24,21 31,58 32,63 32,63 22,11 12,63 24,21 25,26 24,21 31,58 24,21 32,63 31,58 24,21 24,21 18,95 22,11 16,84
56,25 55,56 54,55 54,55 54,55 54,55 54,55 54,55 CONF 54,55 54,17 53,85 53,85 53,85 53,85 53,33 53,33 52,94 52,17 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50
9,47 10,5 6,32 6,32 6,32 6,32 6,32 6,32 SUPPORT 6,32 13,7 7,37 7,37 7,37 7,37 8,42 8,42 9,47 12,6 5,26 5,26 5,26 14,7 6,32 6,32 6,32 6,32 8,42 8,42 8,42 8,42 8,42 5,26 5,26
1,91 1,7 1,73 2,47 3,99 1,67 2,07 2,25 LIFT 2,25 1,72 2,05 1,65 1,71 2,13 1,81 2,2 1,68 1,6 1,53 2,26 3,96 2,07 1,98 2,07 1,58 2,07 1,53 1,58 2,07 2,07 2,64 2,26 2,97
9 10 6 6 6 6 6 6 COUNT 6 13 7 7 7 7 8 8 9 12 5 5 5 14 6 6 6 6 8 8 8 8 8 5 5
sambiloto ==> jombang meniran ==> pegagan saga ==> mengkudu saga ==> lengkuas saga ==> rumput mutiara tempuyung ==> pegagan tempuyung ==> adas tempuyung ==> daun dewa RULE temuputih ==> daun dewa pare ==> mengkudu jahe ==> adas rumput mutiara ==> pegagan temulawak ==> mengkudu temulawak ==> pare cakar ayam ==> jombang cakar ayam ==> daun sendok sidaguri ==> mengkudu daun sendok ==> pegagan iler ==> pegagan iler ==> mimba iler ==> lidah buaya jombang ==> daun sendok kunyit ==> pare kunyit ==> daun sendok lidah buaya ==> mengkudu lidah buaya ==> daun dewa picisan ==> pegagan picisan ==> mengkudu sambiloto ==> daun sendok sambiloto ==> daun dewa sambiloto ==> meniran sambung nyawa ==> lengkuas sambung nyawa ==> sambiloto
18
19