BAB 1 PENDAHULUAN 1.1 Latar Belakang Beras merupakan makanan pokok sebagian besar penduduk dunia, termasuk penduduk Indonesia. Bangsa Indonesia telah menjadi bangsa yang terbesar mengkonsumsi beras di dunia yaitu 105 kg/kapita/tahun (Machmur, 2008). Tingginya konsumsi beras tersebut menuntut pemerintah untuk selalu mengembangkan varietas padi yang lebih unggul dengan produktivitas tinggi. Konsumsi beras yang tinggi juga memicu terjadinya perdagangan bebas pada produk beras di Indonesia, sehingga pemerintah menerbitkan standar mutu beras giling agar beras yang diperdagangkan memenuhi standar. SNI beras giling berisi syarat mutu beras giling dengan lima tingkatan mutu yakni: mutu I, II, III, IV dan V (Badan Standarisasi Nasional, 1999). Standar mutu atau SNI tersebut belum berlaku efektif dan kurang spesifik di Indonesia (Indrasari dkk, 2009). SNI beras giling belum efektif karena tidak semua komponen mutu yang ada di SNI digunakan sebagai dasar dalam perdagagan beras. SNI ini juga kurang spesifik, karena belum memuat semua sifat-sifat penentu mutu beras. Menurut Damardjati dkk (1995), sifat-sifat yang menentukan mutu beras antara lain: 1) sifat fisik dan sifat giling, 2) cita rasa dan sifat tanak, dan 3) sifat gizi. SNI beras giling hanya memuat sifat fisik dan sifat fisik saja, namun belum menampung cita rasa, sifat tanak dan sifat gizi dari beras. Hal ini disebabkan adanya perbedaan preferensi konsumen tentang cita rasa, sifat tanak dan sifat gizi beras yang mereka konsumsi, sehingga sulit untuk distandarkan secara nasional. Konsumen di setiap daerah mempunyai preferensi yang berbeda-beda terhadap mutu beras. Penampilan beras dan cita rasa (Damardjati,1995) serta kepulenan nasi merupakan faktor utama pilihan konsumen berdasarkan etnis (Setyono dkk, 2008). Penampilan beras, cita rasa, dan kepulenan nasi dapat direpresentasikan oleh sifat fisikokimia beras. Banyaknya varietas padi yang dikembangkan oleh pemerintah menghasilkan banyak pula data tentang sifat fisikokimia beras. Banyaknya data tersebut masih memungkinkan untuk diolah agar diketahui pola datanya sehingga dapat digunakan sebagai bahan pertimbangan dalam 1
pengembangan varietas baru yang disukai konsumen. Pendekatan data mining dimungkinkan dapat digunakan untuk mengetahui pola atau hubungan dalam data tersebut. Data mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar (Santosa, 2007). Salah satu tugas dalam data mining adalah klastering. Tujuan utama dari klastering adalah pengelompokan sejumlah data/obyek ke dalam klaster sehingga dalam setiap klaster akan berisi data yang semirip mungkin (Santosa, 2007). Dengan teknik ini, maka data varietas padi tersebut dapat diklasterkan berdasarkan sifat fisikokimianya dan diharapkan dapat diperoleh informasi tersembunyi dari data set tersebut. Metode klastering yang umum digunakan adalah k-means clustering, yang termasuk metode partition clustering, yakni memilah-milah data/obyek ke dalam klaster-klaster yang ada. Menurut Jain (2009), Metode k-means telah mengalami banyak pengembangan, antara lain: 1) Fuzzy-c-Means, 2) X-means, 3) k-medoid, 4) Kernel k-means. Menurut Agusta (2008), terdapat pula metode kharmonic means dan
k-modes. Variasi metode k-means tersebut umumnya
berhubungan dengan tiga hal yang telah disebutkan oleh Agusta (2007). Namun saat ini telah dihasilkan pengembangan k-means clustering berbasis OWA oleh Cheng dkk (2009) yang melakukan klastering nilai agregat, yang merupakan kumpulan dari nilai multi atribut yang ada. Metode ini berbeda dengan variasi metode k-means yang telah ada sebelumnya. Cheng dkk (2009) lebih fokus pada cara untuk mengurangi kompleksitas data set eksperimental dan keterkaitan antara berbagai kriteria yang ada, yang dapat diatasi dengan cara menggabungkan kmeans dengan OWA. Ditinjau dari sisi perkembangan metode Ordered Weighted Averaging (OWA), ada beberapa penelitian terdahulu yang telah menerapkan metode OWA ini pada kasus pengenalan pola (pattern recognition). Yager (1988) yang pertama kali
memperkenalkan
tentang
OWA,
menyatakan
bahwa
OWA
dapat
diaplikasikan untuk menyelesaikan berbagai problem, termasuk problem klasifikasi. Klasifikasi termasuk metode supervised learning,
metode yang
diterapkan menggunakan latihan (ada proses training) dan tanpa ada guru (teacher). Guru di sini adalah label (output/variabel respon) dari data. Label 2
tersebut yang menandai kemana data akan dikelompokkan (Santosa, 2007). OWA dapat diterapkan untuk memberikan bobot yang berbeda untuk setiap atribut. OWA operator yang tepat dapat digunakan untuk mewakili hubungan antar kriteria yang diagregasikan (Yager, 1988). Pernyataan ini didukung oleh penelitian Grandhi (2003), yang telah mengaplikasikan OWA untuk klasifikasi, pada
kasus
pendeteksian
ranjau
darat
(landmine
detection),
dengan
mengintegrasikan OWA dan Feed Forward Neural Networks (FOWA). Penelitian lainnya oleh Cheng dkk (2009) yang menggabungkan antara OWA dengan metode k-means clustering yang digunakan untuk memecahkan masalah klasifikasi untuk mengelompokkan Key Performance Indicator (KPI) menjadi dua kelas yaitu bagus dan normal pada perusahaan di Taiwan. K-means sebenarnya merupakan metode klastering, namun dalam penelitian Cheng dkk (2009), k-means digunakan untuk menyelesaikan problem klasifikasi dengan melibatkan proses training dan adanya teacher. Artinya, Cheng dkk (2009) masih mengaplikasikan k-means berbasis OWA tersebut pada data yang memiliki label (output/variabel respon), dan hasil penelitian Cheng dkk (2009) menyatakan bahwa metode ini cukup valid untuk menyelesaikan kasus klasifikasi tersebut. Namun, mengingat bahwa k-means itu termasuk metode klastering, maka seharusnya metode k-means berbasis OWA oleh Cheng dkk (2009) juga dapat diaplikasikan untuk menyelesaikan kasus klastering. OWA yang digunakan dalam penelitian Cheng dkk (2009) ini menggunakan persamaan OWA yang dikembangkan oleh Fuller and Majlender (2001), dimana persamaan-persamaan tersebut tidak memperhatikan apakah data yang kita analisis memiliki label (output/variabel respon) atau tidak. karena persamaan ini hanya memerlukan dua input parameter saja yaitu jumlah variabel dari data dan nilai orness (α) atau parameter situasi yang digunakan. Oleh karena itu, diduga bahwa k-means berbasis OWA ini juga dapat digunakan dalam menyelesaikan kasus klastering data, seperti pada data varietas padi. Problem klastering varietas padi memiliki data set eksperimental yang kompleks. Yager (1988) menyatakan OWA operator dapat mengurangi kompleksitas data dengan memadukan nilai-nilai multi attribut ke nilai-nilai agregat yang berupa nilai tunggal. Masing-masing varietas padi memiliki banyak sifat fisikokimia yang mempengaruhi preferensi konsumen dalam memilih beras. 3
Sifat-sifat fisikokimia tersebut merupakan suatu kriteria yang harus dipenuhi dalam menentukan varietas mana yang akan dipilih. Kasus ini mirip dengan kasus pengambilan keputusan multikriteria (Multicriteria Decision Making/MCDM), dimana keputusan beras dari varietas mana yang akan dipilih oleh konsumen tersebut didasarkan pada multikriteria. Menurut Yager (2004), Ordered Weighted Averaging (OWA) sangat berguna untuk proses MCDM yang sering kali memerlukan keterkaitan antar kriteria yang ada. Berdasarkan fakta-fakta tersebut, baik dari sisi metode k-means, persamaan OWA yang digunakan, keunggulan OWA untuk menyelesaikan pengambilan keputusan multikriteria, karakteristik data set varietas padi, maka metode k-means berbasis OWA yang telah dikembangkan oleh Cheng et al. (2009) diduga dapat diaplikasikan pada kasus klastering varietas padi, namun ada beberapa tahapan dalam penelitian Cheng et al. (2009) yang harus dimodifikasi, karena tidak adanya teacher (label/output/variabel respon) pada data set varietas padi dan tidak ada proses training dalam proses pembelajaran dari data tersebut. 1.2 Formulasi Masalah Sebagaimana telah dijelaskan pada latar belakang, yang menjadi permasalahan utama dalam penelitian ini adalah bagaimana memodifikasi metode k-means berbasis Ordered Weighted Averaging (OWA) oleh Cheng dkk (2009) dan melakukan klastering varietas padi berdasarkan sifat fisikokimia beras yang dihasilkan dengan menggunakan modifikasi metode tersebut serta membandingkan performansinya dengan metode klastering yang lain. 1.3 Tujuan Penelitian Tujuan yang ingin dicapai dari penelitian ini adalah: 1. Menginventaris sifat fisikokimia beras yang berkaitan dengan penampilan beras, rasa, dan kepulenan nasi dari beberapa hasil penelitian dan menstrukturkannya kembali 2. Mengaplikasikan k-means berbasis OWA pada klastering data set yang digunakan, antara lain: data set iris (pengelompokan jenis bunga menjadi 3, yaitu Setosa, Virginica dan Versicolor) dan pada data set padi. 3. Mengukur tingkat akurasi metode k-means berbasis OWA dalam klastering data set iris untuk proses validasi
4
4. Membandingkan silhouette value dan Sum of Squares Error antara metode kmeans berbasis OWA dan metode klastering lainnya ketika diaplikasikan untuk klastering data set padi. 5. Mengetahui dan menginterpretasikan hasil klastering data set padi menggunakan modifikasi metode k-means berbasis OWA 1.4 Asumsi Penelitian Asumsi penelitian ini terkait dengan dua aspek, yakni aspek metode yang digunakan dan obyek yang diteliti. Berkaitan dengan metode yang digunakan, variabel pada data varietas padi adalah multikriteria dan diasumsikan semua kriteria tersebut memiliki keterkaitan satu sama lain, sehingga kondisinya sama dengan kasus pengambilan keputusan multikriteria, yang dapat diagregasikan dengan OWA operator. Sedangkan dari obyek yang diteliti yaitu padi, diasumsikan proses perlakuan pasca panen padi adalah sama antar varietas padi sehingga data variabel (sifat fisikokimia beras) tidak dipengaruhi oleh proses perlakuan pasca panen, tetapi hanya disebabkan adanya perbedaan varietas padi. 1.5 Manfaat Penelitian Manfaat dari penelitian ini antara lain menghasilkan klaster-klaster varietas padi berdasarkan sifat fisikokimia beras yang dapat digunakan sebagai bahan pertimbangan bagi konsumen untuk memilih beras dan bagi pemerintah dalam mengembangkan varietas baru yang sesuai dengan preferensi konsumen. 1.6 Sistematika Penulisan Berikut akan dijelaskan mengenai sistematika penulisan laporan penelitian yang telah dilakukan : Bab 1
Pendahuluan Bab ini terdiri dari latar belakang dilakukannnya penelitian ini, berikut perumusan masalah, tujuan penelitian, asumsi penelitian, manfaat penelitian dan sistematika penulisan laporan.
Bab 2
Kajian Pustaka Pada bab dua akan dijabarkan beberapa kajian kepustakaan tentang penelitian-penelitian terdahulu yang berhubungan dengan metode yang digunakan, metode klastering dan tentang varietas padi beserta sifat fisikokimia beras yang dihasilkan sehubungan dengan preferensi konsumen. 5
Bab 3
Metode Penelitian Bab ini memberikan uraian tentang tahapan metode klastering yang akan digunakan, bagaimana memvalidasi metode tersebut, dan prosedur aplikasinya pada kasus klastering varietas padi berdasarkan sifat fisikokimia beras yang dihasilkan.
BAB 4 Hasil dan Pembahasan Bab ini berisi hasil penelitian khususnya tentang struktur data varietas padi, validasi metode k-means berbasis OWA yang dimodifikasi dan perbandingan performansi metode tersebut dibandingkan metode klastering lain ketika diaplikasikan pada data iris dan data varietas padi. BAB 5 Analisis dan Interpretasi Hasil Klastering Bab ini menjelaskan tentang hasil klastering dari modifikasi metode kmeans
berbasis
OWA,
bagaimana
anggota
klasternya
dan
diinterpretasikan hasil klastering tersebut berdasarkan sifat fisikokimia yang dimiliki oleh masing-masing varietas padi dan preferensi konsumen dalam memilih beras. BAB 6 Kesimpulan dan Saran Bab ini berisi hasil akhir yang menjawab tujuan penelitian berdasarkan pada validasi metode, aplikasi metode pada data riil varietas padi dan hasil klastering yang diperoleh. Pada bab ini juga diberikan gambaran kemungkinan penelitian-peelitian lanjutan dari topik yang dibahas dalam penelitian.
6