6
Tabel 6 Daftar peubah karakteristik Kode. X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
Keterangan Hasil gabah (kg/ha) Umur saat akar tembus lilin (HST) Jumlah akar tembus Panjang akar tembus (cm) Berat akar (gr) Laju asimilasi bersih (umur 40-50 HST) (mgr/cm2/hari) Laju pertumbuhan relatif (umur 40-50 HST) (mgr/hari) Laju pengisian biji (g/hari/rumpun) Specific leaf area (gr/cm2 daun) Leaf area ratio (cm2/ gr tanaman) Rata-rata tinggi tanaman (cm) Anakan Panjang malai (cm) Jumlah gabah per malai Berat 200 butir (gr)
Metode Galur atau varietas padi akan digerombolkan dengan menggunakan Cluster Ensemble. Tahapan yang dilakukan dalam penelitian ini adalah: 1. Mentransformasi semua data ke dalam bentuk baku (Z) untuk mengatasi perbedaan satuan. 2. Mengeksplorasi peubah. 3. Menghitung korelasi di antar peubah. Jika terbukti adanya korelasi maka dilakukan analisis komponen utama. 4. Membangun ensemble dengan menggerombolkan objek berdasarkan karakteristiknya menggunakan metode hierarki Pautan tunggal, Pautan lengkap, Pautan rataan, Pautan centroid, dan Pautan median dan metode tak berhierarki k-rataan yang terdiri dari k data awal, Distance Based Starting Point, Density Based Starting Point, Hierarchical Starting Point. Objek akan dibentuk menjadi 2, 3, dan 4 gerombol. Jarak yang digunakan sebagai ukuran kemiripan antar objek adalah jarak Euclid. 5. Membuat tabulasi solusi-solusi yang terbentuk. Hal ini bertujuan untuk memudahkan dalam melihat solusi mana yang memiliki persamaan sehingga hanya salah satu solusi yang akan digunakan sebagai anggota ensemble. 6. Mengkombinasikan seluruh anggota ensemble dengan menggunakan algoritma
7.
Meta-Clustering. Tahap Clustering on Cluster dalam algoritma ini akan menggunakan metode k-rataan secara berulang yang terdiri dari Distance Based Starting Point, Density Based Starting Point, Hierarchical Starting Point. Dari masingmasing solusi akan dihitung nilai reproducibility-nya untuk melihat solusi mana yang paling baik. Algoritma MetaClustering ini dilakukan pada solusi 2, 3, dan 4 gerombol. Dengan demikian diperoleh tiga solusi terbaik berdasarkan jumlah gerombolnya. Lalu dilakukan perhitungan nilai reproducibility adjusted untuk memilih solusi dari jumlah gerombol mana yang paling baik sebagai solusi akhir Consensus. Seluruh tahapan ini dilakukan sebanyak dua kali , yaitu sebelum dan setelah pembuatan aturan pelabelan gerombol. Tahapan akhir dari metode ini adalah mendiskripsikan masing-masing gerombol berdasarkan karakteristik peubah-peubahnya. Sebelum dilakukan pengkategorian, nilai peubah baku ditransformasi balik ke nilai peubah asal. Pengkategorian peubah pada gerombol tertentu adalah sebagai berikut: Tinggi (T). Peubah ke-i pada gerombol ke-j dikategorikan tinggi jika ̅ ij > ̅ i. + 1/2Si. Sedang (S). Peubah ke-i pada gerombol ke-j dikategorikan sedang jika ̅ i. - 1/2Si.< ̅ ij ≤ ̅ i. + 1/2Si. Rendah (R). Peubah ke-i pada gerombol ke-j dikategorikan rendah jika ̅ ij ≤ ̅ i. - 1/2Si. HASIL DAN PEMBAHASAN
Eksplorasi dan Deskripsi Peubah Gambar 2 menunjukkan hasil eksplorasi peubah dengan menggunakan diagram kotak garis. Lebar diagram kotak garis menunjukkan bahwa keragaman peubah tinggi, artinya karakteristik peubah tiap varietas heterogen. Dari gambar dapat dilihat bahwa pada beberapa peubah terdapat varietas yang menjadi pencilan atau memiliki nilai di luar batas atas dan batas bawah diagram kotak garis. Pada peubah hasil gabah, varietas Sentani memiliki nilai yang paling rendah jika dibandingkan dengan varietas lainnya, sehingga varietas ini menjadi pencilan pada peubah hasil gabah. Selain pada peubah tersebut varietas
7
Boxplot of Z1; Z2; Z3; Z4; Z5; Z6; Z7; Z8; ... 3
B11742-RS-2-3-MR-34-1-1-5
2
B11283-6C-PN-5-MR-34-1-1-3
Mahak am Danau tempe B11742-RS-2-3-MR-34-
B.10970C-MR-4-2-1-1-1-SI-3-2-4-1
Data
1
0
-1 Sentani
-2 Sentani
-3 Z1
Z2
Danau tempe Danau tempe
Z3
Z4
Z5
Z6
Z7
Z8
Z9
Z10 Z11 Z12 Z13 Z14 Z15
Gambar 2 Hasil eksplorasi peubah dengan diagram kotak garis Sentani pun menjadi pencilan pada peubah laju pengisian biji. Varietas Danau tempe merupakan pencilan pada beberapa peubah seperti pada peubah laju asimilasi bersih, laju pertumbuhan relatif, dan panjang malai. Selain varietas Danau tempe, galur B11742-RS-2-3-MR-34-1-4-1juga menjadi sebuah pencilan pada peubah panjang malai. Selain varietas di atas, varietas lain yang menjadi pencilan adalah galur B11742-RS-2-3MR-34-1-1-5 yang memiliki nilai tertinggi pada peubah berat akar, galur B.10970C-MR-4-2-1-11-SI-3-2-4-1 pada peubah laju asimilasi bersih, galur B11283-6C-PN-5-MR-34-1-1-3 pada peubah laju pengisian biji, dan varietas Mahakam pada peubah jumlah gabah per malai. Pemeriksaan Korelasi Lampiran 3 menunjukkan hasil pemeriksaan korelasi di antara tiap peubah. Dari hasil yang diperoleh menunjukkan bahwa ada korelasi di antara beberapa peubah. Nilai korelasi yang diperoleh berkisar di bawah -0.4 dan di atas 0.4. Nilai korelasi yang paling tinggi terjadi antara peubah laju asimilasi bersih dan laju relatif pertumbuhan, yaitu sebesar 0.959, sedangkan nilai korelasi yang paling rendah terjadi antara peubah jumlah akar tembus dan
laju pengisian biji sebesar -0.548. Selain itu, di antara peubah hasil gabah dan laju pengisian biji juga memiliki korelasi sebesar 0.636. Antara peubah berat akar dan rata-rata tinggi tanaman juga memiliki korelasi sebesar 0.758. Dengan adanya korelasi di antara beberapa peubah, maka konsep jarak Euclid tidak dapat digunakan langsung. Untuk mengatasi masalah ini, maka dilakukan analisis komponen utama terlebih dahulu untuk menghilangkan korelasi di antara peubah. Dalam penelitian ini, seluruh skor komponen utama akan digunakan untuk penggerombolan varietas padi pada tahap selanjutnya. Anggota Ensemble Tahap awal dalam Cluster Ensemble adalah membentuk sekumpulan solusi gerombol dari metode yang berbeda sebagai anggota ensemble. Pada penelitian ini, anggota ensemble dibentuk dari hasil penggerombolan dengan menggunakan sembilan metode, yaitu: Pautan tunggal, Pautan lengkap, Pautan rataan, Pautan centroid, dan Pautan median, metode k-rataan dengan empat inisialisasi yang berbeda. Setiap metode penggerombolan menghasilkan solusi 2, 3, dan 4 gerombol. Hasil penggerombolan dengan
8
menggunakan metode hierarki menghasilkan ukuran kemiripan yang berbeda-beda untuk setiap metode penggerombolan. Besarnya tingkat kemiripan tersebut dapat dilihat pada Lampiran 4. Hasil penggerombolan pada tahap awal dapat dilihat pada Lampiran 5. Dari lampiran tersebut diketahui bahwa ada beberapa metode yang menghasilkan gerombol yang hanya terdiri dari satu anggota gerombol. Hal ini mengindikasikan bahwa anggota gerombol tersebut merupakan sebuah pencilan yang memiliki karakteristik yang berbeda dengan anggota dari gerombolgerombol lain. Selain itu, beberapa metode pun menghasilkan solusi yang sama yaitu: 1. Solusi 2 gerombol metode Pautan rataan, Pautan centroid, dan Pautan median. Metode Pautan lengkap dan k-rataan 4 memiliki solusi yang sama, namun berbeda dengan kelompok solusi di atas. 2. Solusi 3 gerombol metode Pautan tunggal, Pautan rataan, Pautan centroid, dan Pautan median. 3. Solusi 4 gerombol metode Pautan rataan dan Pautan median. Tidak semua solusi yang dihasilkan akan digunakan sebagai anggota ensemble karena dari beberapa solusi yang sama, hanya akan diambil salah satu solusi saja. Dengan demikian solusi yang akan digunakan sebagai anggota ensemble berjumlah 20 solusi. Solusi Consensus Setelah membangun anggota ensemble, maka tahap selanjutnya adalah membentuk solusi consensus dengan mengombinasikan seluruh anggota ensemble dengan menggunakan algoritma Meta-Clustering. Solusi consensus yang dibentuk adalah solusi 2, 3, dan 4 gerombol. Sebelum Aturan Pelabelan Gerombol Solusi consensus yang dihasilkan sebelum adanya aturan pelabelan gerombol terdiri dari solusi 2, 3, dan 4 gerombol. Hasil penggerombolan beserta nilai reproducibility dan reproducibility adjusted dapat dilihat pada Lampiran 6. Solusi 2 Gerombol Gerombol satu terdiri dari 8 anggota gerombol dan gerombol dua terdiri dari 11 anggota gerombol. Struktur solusi dua gerombol
ini sama dengan yang dihasilkan oleh metode krataan 4 dengan inisialisasi menggunakan Hierarchical Starting Point. Nilai reproducibility dan reproducibility adjusted pada solusi dua gerombol berturut-turut adalah 0.8167 dan 0.6333. Hal ini menunjukkan bahwa terdapat 81.67% dari 19 varietas yang konsisten berada dalam gerombol tertentu untuk seluruh ulangan. Dengan kata lain ada 16 varietas yang memiliki hasil yang konsisten. Solusi 3 Gerombol Gerombol satu terdiri dari 11 anggota gerombol, gerombol dua terdiri dari 7 anggota gerombol, dan gerombol tiga terdiri dari 1 anggota gerombol. Anggota gerombol satu pada solusi tiga gerombol sama dengan anggota gerombol dua pada solusi dua gerombol. Anggota gerombol tiga merupakan pecahan dari gerombol satu pada solusi dua gerombol. Nilai reproducibility dan reproducibility adjusted pada solusi tiga gerombol berturut-turut adalah 0.8275 dan 0.7413. Hal ini menunjukkan bahwa terdapat 82.75 % dari 19 varietas yang konsisten berada dalam gerombol tertentu untuk seluruh ulangan. Nilai reproducibility adjusted pada solusi tiga gerombol lebih tinggi dibandingkan pada solusi gerombol dua. Hal ini mengindikasikan bahwa solusi tiga gerombol dapat mencirikan struktur data yang lebih baik daripada solusi dua gerombol. Solusi 4 Gerombol Gerombol satu terdiri dari 11 anggota gerombol, gerombol dua terdiri dari 6 anggota gerombol, gerombol tiga dan empat terdiri dari 1 anggota gerombol. Varietas Danau tempe cenderung memisahkan diri dari varietas lainnya sehingga membentuk satu gerombol sendiri. Hal ini dapat terjadi karena varietas Danau tempe memiliki karakteristik yang berbeda dari varietas lainnya. Nilai reproducibility dan reproducibility adjusted pada solusi empat gerombol berturutturut adalah 0.8705 dan 0.8273. Hal ini menunjukkan bahwa terdapat 87.05 % dari 19 varietas yang konsisten berada dalam gerombol tertentu untuk seluruh ulangan. Nilai reproducibility adjusted pada solusi empat gerombol lebih tinggi dibandingkan dua solusi sebelumnya. Hal ini mengindikasikan bahwa solusi empat gerombol dapat mencirikan struktur data yang lebih baik daripada solusi dua gerombol dan solusi tiga gerombol.
9
Setelah Aturan Pelabelan Gerombol Solusi consensus yang dihasilkan setelah adanya aturan pelabelan gerombol terdiri dari solusi 2, 3, dan 4 gerombol. Hasil penggerombolan beserta nilai reproducibility dan reproducibility adjusted dapat dilihat pada Lampiran 6. Solusi 2, 3, dan 4 gerombol yang dihasilkan setelah adanya aturan pelabelan gerombol tidak berbeda dengan solusi sebelum adanya aturan pelabelan gerombol. Yang berbeda hanya nilai reproducibility dan reproducibility adjusted yang lebih tinggi daripada sebelumnya. Dapat dilihat pada Lampiran 6, nilai reproducibility untuk solusi 2, 3, dan 4 gerombol setelah aturan pelabelan gerombol berturut-turut adalah 0.9165, 0.9111, 0.9056. Dengan demikian, dengan adanya aturan pelabelan gerombol, maka kekonsistenan solusi gerombol semakin meningkat. Dari nilai reproducibility adjusted sebesar 0.8742, solusi empat gerombol memberikan hasil yang lebih baik dibandingkan solusi dua dan tiga gerombol. Deskripsi Solusi Gerombol Akhir Solusi akhir dari Cluster Ensemble membagi varietas padi ke dalam empat gerombol. Nilai rataan tiap gerombol pada tiap peubah dihitung untuk mengkategorikan gerombol berdasarkan karakteristiknya. Nilai rataan tiap gerombol pada tiap peubah dapat dilihat pada Tabel 7, sedangkan untuk nilai rataan dan standar deviasi tiap peubah dapat dilihat pada Tabel 8. Gerombol Satu Varietas padi yang merupakan anggota dari gerombol satu adalah varietas Nona bokra, B.10970C-MR-4-2-1-1-1-SI-3-2-4-1, B.112836C-PN-5-MR-2-3-SI-1-2-1-1, B11283-6C-PN-5MR-34-1-1-3, B11742-RS-2-3-MR-34-1-1-3, B11742-RS-2-3-MR-34-1-1-4, B11742-RS-2-3MR-34-1-1-5, B11742-RS-2-3-MR-34-1-2-1, B11742-RS-2-3-MR-34-1-2-3, B11742-RS-2-3MR-34-1-4-1. Berdasarkan hasil yang diperoleh dari Tabel 9, gerombol satu merupakan gerombol yang memiliki karakteristik unik dalam peubah berat akar dan anakan yang tinggi, laju pengisian biji yang sedang, dan jumlah gabai per malai yang rendah. Gerombol Dua Varietas padi yang merupakan anggota dari gerombol dua adalah varietas Jatiluhur, B11742-
RS-2-3-MR-34-1-4-3, Dodokan, Silugonggo, Sentani, Singkarak. Berdasarkan hasil yang diperoleh dari Tabel 9, gerombol dua merupakan gerombol yang memiliki karakteristik yang unik dalam peubah hasil gabah, umur saat akar tembus lilin, berat akar, leaf area ratio , dan rata-rata tinggi tanaman yang rendah; panjang akar tembus lilin, panjang malai, dan berat 200 butir yang tinggi. Tabel 7 Rataan peubah setiap gerombol Rataan Gerombol
Peubah X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
1
2
3
4
5475.7 21.9 2.7 11.9 32.1 1.1 112.5 0.9 194.2 52.4 119.1 76.5 23.8 90.9 3.8
5099.7 18.0 4.7 17.6 25.4 1.2 117.2 0.8 197.5 42.2 101.2 73.4 24.1 91.4 4.7
5460.0 20.0 2.0 8.5 28.2 0.9 76.5 1.0 217.0 52.0 110.0 71.3 23.8 103.3 3.9
5831.0 28.0 4.0 12.0 29.5 0.9 87.7 0.8 189.0 55.0 119.0 65.7 23.8 100.5 3.4
Gerombol Tiga Varietas padi yang merupakan anggota dari gerombol tiga adalah varietas Mahakam. Varietas Mahakam membentuk gerombol sendiri karena varietas ini memiliki karakteristik yang berbeda dengan anggota gerombol sebelumnya. Berdasarkan hasil yang diperoleh dari Tabel 9, gerombol tiga merupakan gerombol yang memiliki karakteristik yang unik dalam peubah panjang akar tembus lilin yang rendah; rata-rata tinggi tanaman yang sedang; laju pengisian biji dan specific leaf area yang tinggi. Gerombol Empat Varietas padi yang merupakan anggota dari gerombol empat adalah varietas Danau tempe. Tidak berbeda dengan varietas Mahakam, varietas Danau tempe juga cenderung membentuk gerombol sendiri karena varietas ini merupakan pencilan di beberapa peubah seperti yang terlihat pada diagram kotak garis. Berdasarkan hasil yang diperoleh dari Tabel 8, gerombol empat merupakan gerombol yang
10
memiliki karakteristik yang unik dalam peubah hasil gabah, umur saat akar tembus lilin, dan leaf area ratio yang tinggi; specific leaf area, anakan, dan berat 200 butir yang rendah. Setiap peubah karakteristik telah diwakili oleh tiap gerombol. Deskripsi penggerombolan di atas akan memudahkan para peneliti untuk memilih tetua dalam melakukan persilangan varietas padi sebagai upaya menciptakan varietas baru berdasarkan karakteristik tertentu. Tabel 8 Rataan dan standar deviasi tiap peubah Peubah
̅
s
̅ -1/2 s
̅ + 1/2 s
X1
5466.6
298.6
5317.3
5615.9
X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
22.0 3.4 12.5 28.8 1.0 98.5 0.9 199.4 50.4 112.3 71.7 23.9 96.5 3.9
4.3 1.2 3.8 2.8 0.1 19.5 0.1 12.2 5.6 8.6 4.6 0.2 6.3 0.4
19.8 2.8 10.6 27.4 1.0 88.7 0.8 193.3 47.6 108.0 69.4 23.8 93.4 3.7
24.1 4.0 14.4 30.2 1.1 108.3 0.9 205.5 53.0 116.6 74.0 23.9 99.7 4.1
Tabel 9 Hasil pengkategorian gerombol Kategori Gerombol Peubah 1 2 3 4 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
S S R S T T T S S S T T S R S
R R T T R T T R S R R S T R T
S S R R S R R T T S S S R T S
T T T S S R R R R T T R R T R
KESIMPULAN DAN SARAN Kesimpulan Cluster Ensemble menggerombolkan 19 varietas atau galur padi berdasarkan 15 peubah karakteristiknya menjadi solusi 2, 3, dan 4 gerombol. Kriteria nilai reproducibility adjusted yang diperoleh berturut-turut sebesar 0.8330, 0.8666, 0.8742. Berdasarkan kriteria nilai tersebut, maka dapat disimpulkan bahwa solusi yang paling baik dalam menggerombolkan varietas padi pada penelitian ini adalah solusi 4 gerombol. Setiap gerombol yang diperoleh memiliki peubah yang menjadi karakteristik gerombol itu sendiri. Dengan demikian para peneliti akan lebih mudah dalam memilih perwakilan varietas padi yang dapat digunakan sebagai tetua persilangan berdasarkan karakteristik yang diinginkan. Saran Penelitian selanjutnya lebih baik mengkaji lagi solusi alternatif untuk jarak yang digunakan dalam tahap Clustering on Cluster. Penggunaan jarak Euclid kurang tepat dalam menggerombolkan data berbentuk biner. Dalam penelitian ini, hal tersebut belum bisa diperbaiki karena keterbatasan dalam masalah pemrograman untuk software yang digunakan. DAFTAR PUSTAKA Anggiani D. 2009. Penerapan Cluster Ensemble dalam Penggerombolan Kecamatan di Kabupaten Bogor [Skripsi]. Bogor : Departemen Statistika, Institut Pertanian Bogor. Johnson RA, Winchern DW. 2002. Applied Multivariate Statistical Data Analysis. New Jersey : Prentice Hall. Megawati. 2010. Penggerombolan Kabupaten di Jawa Barat Berdasarkan Indikator Ketahanan dan Kerentanan Pangan Menggunakan Cluster Ensemble [Skripsi]. Bogor : Departemen Statistika, Institut Pertanian Bogor. Orme B. 2008. CCEA v3 Software for Convergent Cluster and Ensemble Analysis. Sawtooth Software. Orme B, Johnson R. 2008. Improving K-Means Cluster Analysis: Ensemble Analysis