PENDAHULUAN Latar Belakang Jamur merupakan salah satu jenis tumbuhan yang banyak dijumpai di alam, sehingga sejak dahulu jamur dijadikan sebagai bahan konsumsi utama. Seiring dengan berkembangnya waktu, telah diketahui bahwa terdapat lebih dari ribuan jamur dengan berbagai jenis. Tidak semua jenis jamur dapat dikonsumsi (edible). Banyak pula jenis jamur yang beracun (poisonous). Salah satu jenis jamur yang banyak dikonsumsi adalah Agaricus bisporus. Agaricus bisporus adalah jamur pangan yang berbentuk hampir bulat seperti kancing berwarna putih bersih, krem atau coklat muda. Agaricus bisporus merupakan jamur yang paling banyak dibudidayakan di dunia. Jamur ini dikenal juga dengan sebutan table mushroom, cultivated mushroom atau button mushroom yang merupakan kelas edible mushroom. Agaricus bisporus dalam kingdom Fungi termasuk ke dalam famili Agaricus dan Lepiota. Famili Agaricus dan Lepiota yang secara liar hidup di alam terbuka dengan bentuk yang beraneka ragam, warna yang bermacammacam serta sifat yang belum banyak diketahui, pada umumnya bersifat racun. Famili Agaricus dan Lepiota yang beracun dapat menyebabkan sakit pada seseorang yang memakannya, dapat menyebabkan kematian. Famili Agaricus dan Lepiota yang hidup di alam liar ada juga yang dapat dikonsumsi, bahkan ada yang dijadikan sebagai obat. Untuk membedakan jamur famili Agaricus dan Lepiota yang dapat dikonsumsi dengan jenis yang beracun berdasarkan pada bentuk, sifat, dan keadaannya, sangat sukar untuk dilakukan. Hal ini dikarenakan adanya bentuk yang hampir sama dari spesies jamur famili Agaricus dan Lepiota yang dapat di konsumsi dengan spesies jamur lain yang beracun. Pada penelitian ini akan digunakan algoritma VFI5 untuk membedakan jamur famili Agaricus dan Lepiota ke dalam kelas dapat dikonsumsi atau beracun. Tujuan Tujuan dari penelitian ini adalah mengklasifikasikan famili Agaricus dan Lepiota menggunakan algoritma VFI 5 ke dalam kelas dapat dikonsumsi atau beracun.
Ruang Lingkup Ruang meliputi :
lingkup
pada
penelitian
ini
1.
Penerapan algoritma VFI5 pada data jamur (famili Agaricus dan Lepiota) yang bersumber dari UCI repository of machine learning database (http://archive.ics.uci.edu/ml/datasets/Mu shroom).
2.
Bobot setiap fitur pada algoritma VFI5 diasumsikan sama, yaitu satu.
TINJAUAN PUSTAKA Jamur Jamur adalah tubuh-buah yang tampak di permukaan media tumbuh dari sekelompok Fungi (Basidiomycota) yang berbentuk seperti payung, terdiri dari bagian yang tegak (batang) dan bagian yang mendatar atau membulat. Secara teknis biologis, tubuh buah ini disebut basidium. Beberapa jamur aman dimakan manusia bahkan beberapa dianggap berkhasiat obat, dan beberapa yang lain beracun (Ulloa 2001). Gambar 1 merupakan jamur yang dapat dikonsumsi.
Gambar 1 Jamur yang dapat dikonsumsi (Agaricus bisporus) (Sumber : www.mykoweb.com) Klasifikasi Jamur Dalam klasifikasi tumbuhan, kingdom Fungi dibagi ke dalam empat filum. Filum dari kingdom Fungi yaitu: Chytridiomycota, Ascomycota, Zygomycota, dan Basidiomycota (Ulloa 2001). Setiap filum dibagi ke dalam kelas, setiap kelas dibagi ke dalam ordo dan setiap ordo dibagi ke dalam famili. Contohya: jamur yang dibudidayakan (Agaricus bisporus), termasuk ke dalam filum Basidiomycota, dimana terdiri dari semua Fungi yang memproduksi spora dalam bentuk struktur mikroskopik yang biasa dikenal basidia.
1
Agaricus bisporus termasuk ke dalam kelas Hymenomycetes, kelompok dari kelas ini juga didasarkan pada karakteristik spora yang mikroskopik dan cara pelepasan spora. Agaricales, merupakan ordo dari Agaricus bisporus (terdiri dari semua jamur yang memiliki insang) dan jamur ini termasuk ke dalam famili Agaricaceae, dimana merupakan spesies Agaricus. Famili lebih lanjut dibagi ke dalam genus (singular, genus), dan genus dibagi ke dalam spesies (Lincoff 1981). Gambar 2 merupakan urutan taksonomi dari Fungi.
ditutupi rumput (grassy area), halaman rumput dan di sepanjang pinggir jalan. Sebagian dari Agaricaceae merupakan jamur yang baik untuk dikonsumsi, sebagian lain adalah jamur yang beracun, dan sebagian kecil jamur yang mematikan. Delapan genus ditemukan pada North America : Agaricus (± 200 spesies), Chlorophyllum (1 spesies), Cystoderma (20 spesies), Dissoderma (1 spesies), Lepiota (± 100 spesies), Melanophyllum ( 1 spesies), Phaeolepiota (1 spesies), dan Squamanita (2 spesies). Ciri-ciri Agaricaceae, yaitu: memiliki sisik pada butiran-butiran kecil di daerah tudung dan insang yang terpisah dari batang. Agaricaceae, semuanya memiliki tudung membran, kebanyakan diantaranya memiliki cincin yang melekat pada batang. Pada genus seperti Lepiota dan Melanophyllum, cincin sering tidak ditemukan (hilang). Cetakan spora kemungkinan berwarna putih, hijau gelap, coklat tua, kemerah-merahan, keungu-unguan, dan coklat. Jamur ini dikelompokan dalam single famili atas dasar sebuah hubungan dari karakteristik bentuk mikroskopik dan bahan kimia, seperti: daging insang yang tidak pernah berlainan (seperti pada Amanita), spora biasanya halus, berdinding tipis, dan di bagian ujung memiliki pori-pori (Lincoff 1981). Gambar 3 merupakan bentuk cetakan spora Agaricus.
Gambar 2 Urutan taksonomi Fungi Agaricales Agaricales terdiri dari Lima belas famili yang ditemukan atas dasar kemiripan bentuk (shape), warna spora (spore print colour), alat insang (gill), bentuk mikroskopik, dan reaksi kimia (Lincoff 1981). Salah satu ordo Agaricales adalah famili Agaricus dan Lepiota (Agaricaceae) yang termasuk ke dalam kingdom Fungi (Mycota), dan berasal dari filum Basidiomycota. Famili Agaricus dan Lepiota ( Agaricaceae) Agaricaceae merupakan famili dari jamur yang umumnya dibudidayakan (Agaricus bisporus) dan biasanya banyak ditemukan pada daerah kota dan daerah pinggiran kota. Walupun demikian Agaricaceae banyak tumbuh di hutan, batang kayu, daerah yang
Gambar 3 Cetakan spora Agaricus (Sumber : www.mushroomexpert.com) Beberapa jenis famili Agaricus dan Lepiota termasuk ke dalam makro Fungi karena memiliki bentuk yang besar, dapat dilihat dengan mata telanjang dan dapat dipegang dengan tangan (Ulloa 2001). Salah satu bentuk makro Fungi disajikan pada Gambar 4.
2
khususnya insang dengan warna kemerah mudaan, kecoklat-coklatan, ungu kecoklatan atau kehitaman. 3.
Menghindari kesalahan yang lebih banyak dalam menentukan/identifikasi spesies jamur.
Hanya sedikit jamur yang dapat menyebabkan sakit parah dan yang lainnya dapat menyebabkan penyakit yang lebih ringan. Jamur beracun dapat juga menyebabkan Hallucinogenic (Fly) dan terkadang menimbulkan reaksi yang tidak dapat diprediksi (Lincoff 1981). Edible vs Poisonous Mushroom
Gambar 4 Makro Fungi (Agaricaceae) (Sumber : www.visualdictionaryonline.com) Jamur Beracun Untuk menentukan jamur ke dalam kelas dapat dikonsumsi atau beracun sangat sukar dilakukan. Salah satu cara untuk menentukannya adalah dengan mengetahui dengan tepat spesies dari jamur tersebut. Pengalaman sangat menentukan dalam mengenali karakteristik perbedaan jamur yang dapat dikonsumsi dengan spesies beracun. Berikut ini adalah beberapa aturan dari petunjuk yang dapat membantu untuk mengindari jamur beracun: 1.
Untuk menentukan jamur ke dalam kelas dapat dikonsumsi atau beracun sangat sukar dilakukan. Salah satu cara untuk menentukanya adalah dengan mengetahui secara tepat spesies dari jamur tersebut (Lincoff 1981), namun menentukan spesies jamur dapat dikonsumsi bukanlah hal yang mudah. Contohnya, Lepiota americana merupakan spesies dari jamur yang dapat dikonsumsi. Bahkan jamur spesies ini sangat bagus untuk dikonsumsi. Akan tetapi dalam identifikasi bentuk insang dan warna spora harus berhati-hati untuk menentukan spesies jamur ini, karena bisa saja merupakan spesies dari jamur beracun (Chlorophyllum molybdites). Lepiota americana disajikan pada Gambar 6 dan Chlorophyllum molybdites disajikan pada Gambar 7.
Jamur yang tidak boleh dimakan yaitu, spesies Amanita dan khususnya yang harus diperhatikan dalam mengidentifikasi jamur yang menyerupai spesies Amanita atau berbagai jamur putih lainnya. Amanita sp. disajikan pada Gambar 5. Gambar 6 Lepiota americana (Sumber : Lincoff 1981)
Gambar 5 Amanita sp. (Sumber : www.mykoweb.com) 2.
Menghindari jamur yang berwarna coklat dan jamur yang berwarna coklat muda,
Gambar 7 Chlorophyllum molybdites (Sumber : Lincoff 1981)
3
Klasifikasi Klasifikasi adalah proses menemukan sebuah himpunan model (fungsi) yang menggambarkan dan membedakan kelas-kelas data atau berbagai konsep. Tujuanya adalah untuk meramalkan kelas dari objek-objek yang label kelasnya belum diketahui (Han & Kamber 2001). Proses menemukan sebuah model dilakukan pada sebuah himpunan data training (data pelatihan). Untuk proses klasifikasi atau prediksi pada data testing (data pengujian) dilakukan berdasarkan model yang diturunkan data pelatihan tersebut. Voting Feature Intervals 5 (VFI5) Voting Feature Intervals 5 merupakan algoritma klasifikasi yang dikembangkan oleh Demiröz dan Güvenir (Demiröz 1997). Semua instance pelatihan diproses bersamaan. Algoritma VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi. 1
Pelatihan
Pada tahap pelatihan, awalnya ditentukan nilai end point suatu feature f pada kelas data c. End point untuk feature linier adalah feature yang nilainya memiliki urutan dan bisa dibandingkan tingkatannya yaitu berupa nilai minimum dan nilai maksimum setiap kelas c. End point untuk feature nominal adalah feature yang nilainya tidak memiliki urutan dan tidak bisa dibandingkan tingkatannya yaitu semua nilai yang berbeda yang ada pada feature kelas yang sedang diamati. Selanjutnya end points tersebut diurutkan menjadi interval untuk feature f. Terdapat dua jenis interval, yaitu point interval dan range interval. Point interval dibentuk dari setiap nilai yang berbeda dari end points. Range interval dibentuk dari dua nilai end points yang berdekatan tetapi tidak termasuk end points tersebut (Güvenir 1997). Tahap selanjutnya ialah menghitung jumlah instance pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i, direpresentasikan sebagai interval_class_count [f,i,c]. Untuk setiap instance pelatihan, dicari interval i di mana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada batas bawah atau batas atas maka jumlah kelas instance tersebut (ef) pada interval i ditambah 1. Jika interval i merupakan range interval dan nilai ef jatuh pada interval tersebut, maka
jumlah kelas instance ef pada interval i ditambah 1. Hasil dari proses tersebut merupakan jumlah vote kelas c pada interval i. Jumlah vote kelas c untuk feature f pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi setiap kelas. Hasil normalisasi direpresentasikan dalam interval_class_vote [f,i,c]. Nilai-nilai pada interval_class_vote [f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature sama dengan 1. Normalisasi ini bertujuan agar setiap fitur memiliki kekuatan voting yang sama pada proses klasifikasi yang tidak dipengaruhi ukuranya. Berikut ini adalah pseudocode tahap pelatihan dari algoritma VFI5. train (TrainingSet); begin for each feature f if f is linear for each class c EndPoints[f] = EndPoints[f]U find_end_points(TrainingSet,f, c); sort (EndPoints[f]); for each end point p in EndPoints[f] form a point interval from end point p form a range interval between p and the next endpoint p else /*if f is nominal*/ form a point interval for each value of f for each interval i on feature f for each class c interval_class_count[f,i,c]=0; count_instances(f,TrainingSet); for each interval i on feature f for each class c normalize interval_class_vote[f,i,c]; /* such that c
interval_class_vote[f,i,c] = 1 */
end
2
Klasifikasi
Pada tahap awal klasifikasi dilakukan proses inisialisasi awal nilai vote masingmasing kelas dengan nilai 0. Untuk setiap feature f dicari nilai interval i di mana ef jatuh, ef adalah nilai feature f dari instance tes e. Jika ef tidak diketahui, maka feature tersebut tidak disertakan dalam voting (memberi nilai vote 0 untuk masing-masing kelas). Feature yang nilainya tidak diketahui diabaikan.
4
Jika ef diketahui maka interval tersebut ditemukan. Interval tersebut dapat menyimpan instances pelatihan dari beberapa kelas. Kelaskelas dalam sebuah interval direpresentasikan oleh vote kelas-kelas tersebut pada interval itu. Untuk setiap kelas c, feature f memberikan vote yang sama dengan interval_class_vote[f,i,c]. Notasi tersebut merepresentasikan vote feature f yang diberikan untuk kelas c.
METODE PENELITIAN Metode penelitian disajikan pada Gambar 8.
yang
digunakan
Setiap feature f mengumpulkan nilai vote kemudian dijumlahkan untuk memperoleh total vote. Kelas c yang memiliki nilai vote tertinggi diprediksi sebagai kelas dari instance tes e. Pseudocode untuk tahap klasifikasi dapat dilihat di bawah ini (Güvenir et al. 1998). classify (e) begin for each class c vote[c] = 0 for each feature f for each class c feature_vote[f,c] = 0; /*vote of feature f for class c*/ if ef value is known i = find_interval(f,ef) feature_vote[f,c] = interval_class_vote [f,i,c] for each class c vote[c] = vote[c] + feature_vote[f,c]*weight[f]; return class c with highes vote[c]; end
K-Fold Cross Validation K-fold cross validation merupakan metode untuk memperkirakan generalisasi galat berdasarkan ”resampling” (Weiss & kulikowski 1991 diacu dalam Sarle 2004). Hasil diperkirakan dari generalisasi galat biasanya digunakan untuk pemilahan diantara model yang bervariasi. Dalam k-fold cross validation, data dibagi secara acak menjadi k himpunan bagian yang ukurannya hampir sama satu sama lain. Himpunan bagian yang dihasilkan yaitu S1, S2, S3,....., S`k digunakan sebagai pelatihan dan pengujian yang masingmasing diulang sebanyak k kali. Pada iterasi ke-i, himpunan bagian Si digunakan sebagai data pengujian dan himpunan bagian yang lainnya digunakan sebagai data pelatihan, dan seterusnya. Dalam klasifikasi dengan algoritma VFI5 disarankan menggunakan Kfold cross validation dengan nilai k lebih besar dari 2, dan akan lebih baik lagi menggunakan nilai k sebesar mungkin karena semakin besar nilai k maka akurasi yang di dapatkan akan cenderung tetap atau meningkat (Ramdan 2007).
Gambar 8 Metode penelitian Studi Pustaka Pada tahap ini dilakukan studi pustaka yang berhubungan dengan penelitian yang akan dilakukan. Dalam hal ini, studi pustaka meliputi jamur dapat dikonsumsi atau beracun pada famili Agaricus dan Lepiota dan penerapan algoritma VFI 5. Data Data yang digunakan pada penelitian ini berupa kumpulan data jamur (famili Agaricus dan Lepiota) yang diambil dari UCI repository of machine learning database (http://archive.ics.uci.edu/ml/datasets/Mushro om). Kumpulan data jamur ini terdiri atas gambaran hipotesis dari 23 spesies jamur yang berbeda dalam famili Agaricus dan Lepiota. Setiap jamur menggambarkan 22 kumpulan bentuk (atribut) yang berbeda. Bentuk yang beraneka ragam dari famili Agaricus dan Lepiota memungkinkan untuk mendeskripsikan sepesies dari jamur ini
5
berdasarkan 22 fitur yang berbeda. Kumpulan data jamur famili Agaricus dan Lepiota berjumlah 8124 instances yang berbeda. Jumlah data ini terdiri dari 4028 yang digolongkan pada jamur yang dapat dikonsumsi, 3916 digolongkan pada jamur yang beracun. Dua puluh dua fitur jamur famili Agaricus dan Lepiota disajikan pada Lampiran 1. Beberapa contoh gambar fitur jamur disajikan pada Lampiran 2. Praproses Pada tahap ini data yang sudah didapat diubah menjadi data numerik untuk masingmasing atribut. Hal ini digunakan untuk mempermudah dalam memasukan (input) data pada pembuatan program. Klasifikasi Algoritma VFI 5 Tahapan klasifikasi Voting Feature Intervals 5 terdiri dari dua proses yaitu pelatihan dan klasifikasi. Data yang digunakan pada tahapan ini juga dibagi menjadi dua bagian yaitu data pelatihan dan data pengujian. Pembagian Data Latih dan Data Uji Penelitian ini menggunakan metode 3fold cross validation. Oleh karena itu, data yang digunakan dibagi menjadi tiga subset secara acak yang masing-masing subset memiliki jumlah instance dan perbandingan jumlah kelas yang hampir sama. Pembagian data ini digunakan pada proses iterasi klasifikasi. Iterasi dilakukan sebanyak tiga kali. Setiap iterasi, satu subset digunakan untuk pengujian sedangkan subset-subset lainya digunakan untuk pelatihan. Pelatihan Subset data pelatihan digunakan sebagai input bagi algoritma Voting Feature Intervals 5 pada tahapan pelatihan. Langkah pertama yang dilakukan pada tahapan pelatihan yaitu membuat interval dari masing-masing fitur berdasarkan nilai end point masing-masing fitur untuk setiap kelasnya. Setelah end point masing-masing fitur terbentuk maka dimulailah proses voting pada algoritma. Voting yang dilakukan yaitu menghitung jumlah data untuk setiap kelas pada interval tertentu. Masing-masing kelas pada rentang interval tertentu memiliki nilai vote yang berbeda-beda. Nilai vote tersebut akan dinormalisasi untuk mendapatkan nilai vote akhir pada masing-masing fitur.
Pengujian Pada tahapan pengujian atau klasifikasi setiap nilai fitur dari data pengujian akan diperiksa letaknya pada interval. Nilai vote setiap kelas untuk setiap fitur pada interval yang bersesuaian diambil nilainya dan kemudian dijumlahkan. Kelas dengan nilai vote tertinggi menjadi kelas prediksi dari data pengujian tersebut. Tahapan pengujian menggunakan data uji yang telah ditentukan sebelumnya dalam proses iterasi. Data uji yang digunakan disesuaikan dengan subset data pelatihan yang digunakan. Perhitungan Akurasi Pada penelitian ini ingin diketahui akurasi yang dicapai algoritma VFI5. Tingkat akurasi dihitung dengan cara : Tingkat akurasi =
Data uji benar diklasifik asi X 100% Total data uji
Tingkat akurasi menunjukan tingkat kebenaran pengklasifikasian data terhadap kelas sebenarnya. Semakin rendah nilai akurasi maka semakin tinggi kesalahan klasifikasi. Tingkat akurasi yang baik adalah tingkat akurasi yang mendekati nilai 100%. Spesifikasi Implementasi Aplikasi yang digunakan pada penelitian ini dibangun dengan menggunakan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut: Perangkat keras berupa computer mobile: 1.
Processor Intel Pentium M 1,73 GHz
2.
RAM kapasitas 512 MB
3.
Harddisk kapasitas 40 GB
4.
Monitor pada resolusi 1024×768 pixels
5.
Keyboard dan Mouse
Perangkat lunak: 1.
Sistem Operasi : Microsoft Windows XP Home Edition
2.
XAMPP 1.4.16 yang terdiri dari Web Server Apache 2.0 dan sistem manajemen basis data MySQL dengan alat bantu pengolahan data menggunakan PHPMyAdmin
3.
Bahasa Pemrograman: PHP 5.0
4.
Browser: Mozilla Firefox 3.0
6