Pembimbing : Dr. Ir. Budi Santosa, MSc Ko-pembimbing : Nani Kurniati, ST, MT.
Millatul Ulya 2508 201 005 QMM – S2 Teknik Industri
PENDAHULUAN Padi
K -means K-means
OWA
• • • •
Banyak varietas yang dikembangkan Î tersedia banyak data Mutu beras diklasifikasikan berdasarkan SNI SNI beras belum memasukkan sifat mutu tanak & rasa Penelitian terdahulu: klasifikasi berdasarkan 1 kriteria saja
• Mengelompokkan data/obyek yang mirip ke dalam klaster • Perkembangan k-means telah banyak dilakukan • K-means OWA (Cheng dkk, 2009) Î integrasi k-means & OWA untuk kasus klasifikasi • Operator agregasi, memperhatikan keterkaitan antar kriteria • OWA dapat diaplikasikan pada kasus klasifikasi (Yager, 1988) • K-means OWA (Cheng dkk, 2009) Î menggunakan OWA Fuller&Majlender (2001), tidak butuh input variabel respon Î dapat diaplikasikan untuk kasus klastering.
Memodifikasi k-means OWA (Cheng dkk, 2009) untuk kasus klastering dan mengaplikasikannya pada data set padi
TUJUAN 1. Menginventaris sifat fisikokimia beras yang berkaitan dengan penampilan beras, rasa, & kepulenan nasi & menstrukturkan kembali 2. Mengaplikasikan Modifikasi k-means berbasis OWA pada klastering data set iris & data set padi. 3. Mengukur tingkat akurasi metode k-means berbasis OWA dalam klastering data set iris untuk proses validasi 4. Membandingkan silhouette value dan Sum of Squares Error antara metode k-means berbasis OWA dan metode klastering lainnya ketika diaplikasikan untuk klastering data set padi. 5. Mengetahui dan menginterpretasikan hasil klastering data set padi menggunakan modifikasi metode k-means berbasis OWA
METODE Tahapan Penelitian
Literature Review Obyek penelitian: • Damardjati dan Endang (1991) • Allidawati dan Bambang (1993) • Damardjati (1995) • Indrasari, dkk (2009)
Metode penelitian: • Yager (1988) • Cheng, dkk (2009) • Fuller & Majlender (2001)
Menemukan Gap Penelitian
Identifikasi variabel dan parameter
Modifikasi metode K-Means OWA untuk klastering
Validasi modifikasi metode k-means OWA
Implementasi modifikasi metode k-means OWA untuk klastering data set padi dalam 6 eksperimen (3, 4, 5, 6, 7 dan 8 klaster)
Pengukuran dan perbandingan performansi modifikasi metode k-means OWA
Analisis dan interpretasi hasil
Kesimpulan & Saran
Modifikasi yang dikembangkan k-means OWA (Cheng dkk, 2009) untuk kasus klasifikasi
Data base D
Pemilihan fitur /atribut/ variable (feature selection)
Data base D
Ranking atribut dengan stepwise regression (statistical screening)
Pengurangan fitur /atribut/variable (feature reduction)
Penghitungan nilai agregat (aggregated value)
Klastering nilai agregat
Prediksi klaster dari data testing
Modifikasi k-means OWA untuk kasus klastering
Huberty (1994) Jain & Candrasekaran (1982)
Meranking atribut (ordering attributes) dengan expert judgment (logical screening) Tanpa feature reduction
Agregasi nilai dari atribut dengan OWA
k-means
Menghitung nilai agregat (aggregated value)
Agregasi nilai dari atribut dengan OWA
k-means
Klastering nilai agregat
Memprediksi klaster dari data set
Martinez & Martinez (2005) Izenman (2008)
Penghitungan performansi metode: Accuration rate
Penghitungan performansi modifikasi metode: SSE, silhouette value dan silhouette plot
Evaluasi dan perbandingan dengan metode klasifikasi lain
Evaluasi dan perbandingan dengan metode klastering lain
HASIL & PEMBAHASAN 1. Sifat fisikokimia yang mempengaruhi preferensi konsumen dalam memilih beras Tabel 4.1 Matrik Data Set Sifat Fisikokimia Beberapa Varietas Padi No. Varietas Sifat fisikokimia beras padi kadar Suhu Beras Beras Panjang Bentuk Pengapuran Kadar amilosa gelatinisasi kepala putih beras beras (%) protein (%) (ºC) (%) (%) (%) 1. 2. ... ... 119.
Data set padi : 1. Terdiri dari 119 varietas padi dan 8 sifat fisikokimia beras 2. Diperoleh dengan sintesis hasil-hasil penelitian tentang mutu beras dan hubungannya dengan preferensi konsumen
2. Validasi dengan data set iris Data set Iris
• Tujuan : memastikan bahwa modifikasi metode k-means OWA dapat diaplikasikan pada kasus klastering • Data iris: Klasifikasi 150 bunga iris menjadi 3 kelas (Setosa, Virginica, Versicolor) berdasarkan 4 atribut • Pengurutan atribut: mencoba semua urutan yang mungkin Î 24 kombinasi urutan atribut
Pengurutan atribut / variabel (ordering attributes)
Penghitungan nilai agregat (aggregated value) dengan OWA
Klastering nilai agregat dengan k-means (3 klaster)
Prediksi klaster dari data set iris
Penghitungan performansi modifikasi metode: Accuration rate
Evaluasi dan perbandingan dengan metode klastering lain
Menghitung bobot OWA (α > 0.5)
Validasi dengan data set iris (lanjutan…) Kombinasi urutan
1234
1243
1342
1324
1423
1432
2341
2314
2413
2431
3412
3421
3241
α = 0.5
22
22
22
22
22
22
22
22
22
22
22
22
22
α = 0.6
24
25
22
22
23
22
23
25
29
25
19
18
19
α = 0.7
33
37
24
24
26
24
28
31
42
30
15
8
18
α = 0.8
47
43
24
26
31
25
44
45
71
52
13
10
13
α = 0.9
50
45
36
36
34
34
69
73
87
87
5
9
12
α = 1.0
50
55
48
42
56
42
66
78
79
71
16
7
7
3214
4123
4132
2143
2134
1423
1432
4213
4231
3124
3142
4321
4312
α = 0.5
22
22
22
22
22
22
22
22
22
22
22
22
22
α = 0.6
21
21
20
29
27
23
22
22
19
22
21
19
19
α = 0.7
20
21
19
45
42
26
24
25
19
20
20
18
18
α = 0.8
18
19
17
74
66
31
25
16
24
17
17
6
7
α = 0.9
15
6
6
81
77
34
34
10
9
15
11
6
6
α = 1.0
16
50
6
73
78
42
48
50
6
7
7
6
6
Kombinasi urutan
Keterangan: 1 = Sepal Length 2 = Sepal Width 3 = Petal Length 4 = Petal Width
Jumlah data dengan label prediksi tidak sama dengan label asli
Jumlah data dengan label prediksi sama dengan label asli
Tingkat akurasi
K-means berbasis OWA (urutan variabel: Petal Length, Petal Width, Sepal Length dan Sepal Width serta nilai α = 0.9)
5
145
96.67
K-means (dengan menggunakan jarak cityblock )
17
133
88.67
K-means (dengan menggunakan jarak Euclidean )
16
134
89.33
Hierarchical clustering (Single linkage )
48
102
68
Hierarchical clustering (Complete linkage )
24
126
84
Metode klastering
ANALISIS: K-means OWA (α = 0.9) lebih baik dari pada metode klastering lain pada klastering data iris
Tabel misklasifikasi
3. Implementasi k-means OWA pada data set padi Data set padi
1.Mengetahui jumlah klaster yang sesuai
Pengurutan atribut / variabel (ordering attributes) dengan expert judgment (logical screening)
2.Mengetahui pada α berapa yang menghasilkan klastering terbaik
Penghitungan nilai agregat (aggregated value) dengan OWA
Menghitung bobot OWA
Klastering nilai agregat dengan k-means (3, 4, 5, 6, 7, dan 8 klaster)
Hasil klastering dari data set padi
Penghitungan performansi modifikasi metode: SSE, silhouette value dan silhouette plot Evaluasi dan perbandingan dengan metode klastering lain
3.Membandingkan nilai siluet & SSE modifikasi k-means OWA dgn metode klastering lain 4.Mengetahui & menginterpretasi hasil klastering padi dengan modifikasi kmeans OWA
3. Implementasi k-means OWA (lanjutan…) Eksperimen 3 klaster (α = 0.6) 4 klaster (α = 0.7) 5 klaster (α = 0.6) 6 klaster (α = 0.6) 7 klaster (α = 0.8) 8 klaster
Rata-rata nilai siluet SSE 0.5595 0.69563 0.5549 0.58028 0.5697 0.29335 0.4915 0.24483 0.5806 0.26925 Semua plot siluet mengandung nilai siluet negatif
ANALISIS: 1. Data set padi lebih sesuai diklasterkan menjadi 7 klaster. Karena nilai siluet paling besar dan positif semua (0.5806) dan SSE cukup rendah. 2. Modifikasi k-means OWA terbaik untuk klastering padi menjadi 7 klaster adalah pada α = 0.8
K-means OWA Vs Metode klastering lain Tabel 4.14 Nilai Rata-rata Siluet dan SSE pada Masing-masing Metode Klastering dalam Klastering Data Padi menjadi 7 Klaster Metode Klastering k-means berbasis OWA pada α = 0.8 k-means tanpa OWA – jarak Cityblock k-means tanpa OWA – jarak Euclidean Hierarchical clustering – Single Linkage Hierarchical clustering – Complete Linkage
Rata-rata Nilai Siluet 0.5806 0.2113 0.3882 -0.4781 0.3091
SSE 0.26925 36.333 36.486 538.4738 37.5231
ANALISIS: Modifikasi k-means OWA (α = 0.8) terbaik untuk klastering padi dibanding metode yang lain karena nilai SSE paling rendah dan nilai siluet tertinggi & positif untuk semua klaster yang dihasilkan Salah satu plot siluet dari metode pembanding
Interpretasi Hasil Klastering Tabel 5.1 Hasil klastering data varietas padi dengan k-means berbasis OWA Klaster 1
Jumlah Anggota 12 padi
2
22 padi
3
20 padi
4.
7 padi
5.
29 padi
6.
16 padi
7.
13 padi
Anggota Klaster Singkarak, Cisokan, Cikapundung, IR70, IR37218-24-2-2, B6058-Mr-19-2-32, IR41532-18-1-8-2, B5316-20d-Mr-4-3, IR19661-150-2-2-2-2, B5332-13dMr-1-1, IR37218-24-2-2, B6679-Mr-23-2. Tondano, PB36, Serayu, Ciherang hibrida, B6441-5-Mr5-1, B6228-Mr-47-4-3, IR39536-1-4-5-1-1-1, B5619-5g-Sm-8, B5462f-Kn-15-0-0-3, IR4432-28-540krad-6-Mr-9, S804b-Pn-86-1-3-4, B6256-Mr-10-p, B4169g-Ng-3-5-3, B7093-4e, BP2448-4-2, BP2268-5E-21-3, BP2280-1E-12-2, H34, H36, H43, H57, H72. Bogolestari, Cisadane, Barito, IR20, 627/10krad-3-20-537-7, B4354g-Pn-3, B4180f-30-Ng-4-2, B4127f-Kn-41, B6136-3-Tb-0-1-5, S487b-75, B5975-Mr6-3-2-3, Pn-1f-18, B5986-Pn-7-4-2, B7093-4e,BP1356-1G-KN-4, BP2276-2E28-2, IR73012-15-2-2-1, S4527E-PN-2-3-KN-0, IR73005-69-1-1-2, H30. Bengawan Solo, Batang Pane, B5411e-7b-31-0-3, B4632h-Kp-1, B4363h-Sm8-3-3-2, B7004d-Mr-10-1, H63. Fatmawati, Kalimutu, IR64, Jatiluhur, Arias, Ciapus, IR31892-100-3-3-3-3, B6441-2-Mr-5-4, B6058-Mr-19-2-1-2, IR28224-3-2-3-2, B6717-Mr-5-2, IR32896-6-3-3-2, B6350-Mr-6-1, IR39536-1-3-4-2-2, IR33658-1-6-1-2-1-2, IR35667-30-1-2-2-2, IR24705-116-2-3, IR33463-55-2-1-2-2-2-1, B6555-Mr192-1-36, B6058-Mr-19-2-3-2, B5689f-Sm-33-3, B4460h-Mr-6, B5540e-Tb16, B6780-Mr-36-3, IR33450-25-2-1-2-2-2-1, B5313g-Sm-57-1, B6350-Mr-61-2, IR19661-150-2-2-2-2, RUTT5669B-15-1-2-2-2. Cimandiri, Batang Agam, Kapuas, Progo, Rojolele, Cendrawati, Hawarabatu, Mekongga, Maros, Gadis Jambe, Citarum, Ciherang, Memberamo, Cigeulis, B5446g-Sm-17-1-2, B6256-Mr-6-7-p. Ciujung, Semeru, Cipunegara, Sadang, PB56, PB50, Rendah Padang, Way Apo Buru, Cilosari, S499b-28, B6440-5-Mr-2-3, B5440e-Tb-16, H27.
Rekap klaster
Tabel 5.2 Rekapitulasi Hasil Klastering Data Varietas Padi Sifat fisikokimia Kadar amilosa
*)
Suhu gelatinisasi**) Beras kepala***) Beras putih (%) Panjang beras****) Bentuk beras****) Pengapuran beras*****) Kadar protein (%)
1 Tinggi Sedang – tinggi Mutu III 63–74 Sedang – panjang Medium – ramping Sedang 7.1–10.8
2 Sedang – tinggi Rendah – tinggi Mutu III dan IV 65.0–73.3 Sedang – panjang Medium – ramping Sedang 6.3–10
3 Sedang Rendah – sedang Mutu IV 66–72.2 Sedang – panjang Medium – ramping Sedang 7.2–10.4
Klaster 4 Rendah – sedang Rendah – sedang Mutu V
Medium
5 Sedang – tinggi Rendah – tinggi Mutu II dan III 65–74 Sedang – panjang Medium
Sedang 7.5–11.3
Sedang 6.4–9.4
67–71.9 Panjang
6 Rendah – sedang Rendah – sedang Mutu V 66 – 73 Sedang – panjang Medium – ramping Sedang 5.0–11.6
7 Rendah – sedang Rendah – sedang Mutu III, IV, dan V 68 – 73% Sedang – panjang Medium – ramping Sedang 6.1 – 10.2
1. Klaster 4, 6 dan 7 Î berasnya pulen, panjang & ramping, rasa enak, Masingmasing klaster berbeda pada persen beras kepala dan bentuk beras 2. Klaster 3 mirip dengan klaster 4, 6, dan 7 Î berbeda pada kadar amilosa dan persen beras kepala 3. Klaster 2 dan 5 Î berasnya pulen & pera, panjang & ramping. Klaster 2 dan 5 berbeda pada persen beras kepala dan bentuk beras 4. Klaster 1 Î beras pera, panjang & ramping, rasa enak 5. Secara umum, Klaster 1 dan 6 berisi padi yang saat ini masih banyak ditanam oleh petani
KESIMPULAN 1
Ada 8 Sifat fisikokimia yang berhubungan dgn kepulenan nasi, penampilan beras dan rasa nasi
2
Modifikasi metode k-means OWA cukup valid untuk data iris dan data padi.
3
Tingkat akurasi modifikasi k-means OWA untuk data iris 96.67% dan lebih tinggi dibanding metode klastering lain
4
Modifikasi k-means OWA terbaik pada α= 0.8 dalam klastering data padi, dan performansinya lebih baik dibanding yang lain
5
Jumlah klaster yang sesuai untuk data padi adalah 7 klaster. Klaster 4, 6 & 7 menghasilkan beras pulen, panjang & ramping. Klaster 1 beras pera, panjang & ramping
SARAN 1 Proses ordering attributes masih memungkinkan menggunakan pendekatan lain, misalnya dengan teknik pembobotan baik secara statistik atau melalui penilaian oleh pakar.
2 Perlu juga untuk diteliti lebih lanjut kemungkinan penggunaan operator agregasi yang lain selain OWA untuk diintegrasikan dengan k-means clustering
Ucapan terima kasih
Thank you !!!
RENCANA PENELITIAN Penelitian
Deskripsi
Topik
Klastering data menggunakan modifikasi metode k-means berbasis OWA
Obyek
Data varietas padi
Metode
Metode k-means berbasis OWA
Ruang lingkup
Menggunakan variabel yang merupakan sifat fisiko kimia yang mempengaruhi preferensi konsumen dalam memilih beras
Kontribusi
Dari sisi metode penelitian, dapat menghasilkan modifikasi k-means berbasis OWA yang dapat diaplikasikan pada kasus klastering, serta mengetahui performansi metode k-means berbasis OWA jika dibandingkan dengan metode klatering lainnya dalam kasus pengklasteran varietas padi. Dari sisi obyek penelitian, dapat menghasilkan klasterklaster varietas padi yang memperhatikan multikriteria (berbagai sifat fisikokimia) yang berhubungan dengan preferensi konsumen dalam memilih beras. Klaster ini bermanfaat bagi konsumen untuk memilih beras yang sesuai, bagi petani untuk menanam varietas yang disukai konsumen dan bermanfaat juga bagi pemerintah untuk mengembangkan varietas baru yang lebih memenuhi keinginan konsumen beras.
Literature Review
• Diperkenalkan oleh Yager (1988) • Mampu mendapatkan bobot optimal dari atribut berdasarkan ranking dari pembobotan vektor tersebut setelah proses agregasi
f : Rn Æ R W = [w1, w2, … , wn]T w i ∈ [0,1] untuk i = {1,2,..., n} dan sehingga f (a 1 , a2 ,..., an ) =
∑wb
∑w =1 i
i∈I
i i
i= 1
bi = elemen terbesar ke-i dari agregated object {a1, … , an}
Ciri penting OWA 2 ciri penting:
1. Orness dari agregasi n 1 orness(W) = ( − 1)∑ ((n − i)w i ) n i= 1
dimana Orness (W) = α adalah parameter situasi 2. Ukuran dispersi dari agregasi n
Disp ( W ) = − ∑ w i ln w i i= 1
W` = [wn, wn-1, … , w1] Orness (W`) = 1 – α (Liu, 2004)
Rumus-rumus OWA O’Hagan et al (1988) n
Maksimasi fungsi − ∑ wi ln wi i =1
Menggabungkan Maximum entropy dan OWA
n 1 α =( ) ∑ ((n − i )wi ), 0 ≤ α ≤ 1 n − 1 i =1
Mengubah ke persamaan polinomial Menggunakan Lagrange Multiplier
Fuller & Majlender (2001) j −1 n− j ln wn + ln w1 ⇒ w j = n −1 w1n − j wnj −1 , dan (7 ) ln w j = n −1 n −1 n n −1 w1 [(n − 1)α + 1 − nw1 ] = [(n − 1)α ] [((n − 1)α − n ) w1 + 1], (8) 1 Jika w1 = w2 = ... = wn = ⇒ disp (W ) = ln n (α = 0.5), n ((n − 1)α − n ) w1 + 1 , (9) wn = (n − 1)α + 1 − nw1
dimana wi = bobot vektor ; n = jumlah atribut; α = parameter situasi
K-means Clustering Berbasis OWA (Cheng et al., 2009) • OWA Î menggabungkan multi atribut data menjadi satu nilai agregat seperti satu atribut • Dapat mengurangi kompleksitas data set eksperimental • OWA operator yang tepat dapat digunakan untuk mewakili hubungan antar kriteria yang diagregasikan (Grandhi, 2003)
• Menggunakan persamaan OWA oleh Fuller & Majlender (2001) • Digunakan untuk kasus klasifikasi (supervised learning) Î data yang dianalisis memiliki variabel respon/output/label kelompok
I N D E K S, P A R A M E T E R & V A R I A B E L Indeks i
data ke- (i = 1, 2 , 3, …, m)
j
variable ke- (j = 1, 2 , 3, …, n)
k
jumlah klaster
m
jumlah data
α
parameter situasi ( 0 ≤ α ≤ 1)
n
jumlah variable
ai
nilai agregat data ke- (i = 1, 2, 3, …, m)
r
klaster ke- (r = 1, 2 , …, k)
Cr pusat klaster ke- dengan r = 1, 2,.., k.
Parameter wj bobot variable ke- (j = 1, 2, 3, …, n)
Variabel xij
data ke-i pada variabel ke-j (i = 1, 2 , 3, …, m ; dan j = 1, 2, 3, …, n)
µj
mean dari variabel ke- (j = 1, 2 , ..., n)
µr
mean dari klaster ke- (r = 1, 2 , ..., k)
Sumber Data Data untuk untuk validasi validasi modifikasi modifikasi k-means k-means OWA: OWA: data data set set •• Data Iris didownload didownload dari dari UCI UCI Machine Machine Learning Learning Repository Repository Iris (Frank and and Asuncion, Asuncion, 2010) 2010) (Frank Data untuk untuk implementasi implementasi modifikasi modifikasi k-means k-means OWA OWA :: •• Data data set set varietas varietas padi padi Î Î sintesis sintesis dari dari beberapa beberapa hasil hasil data penelitian tim tim peneliti peneliti Balai Balai Besar Besar Penelitian Penelitian Tanaman Tanaman penelitian Padi, Subang-Jabar, Subang-Jabar, antara antara lain: lain: Padi, • • • •
Damardjati & Endang (1991) Allidawati & Bambang (1993) Damardjati (1995) Indrasari dkk (2009)
Validasi (data iris)
Tabel 4.2 Bobot OWA untuk n = 4 w1 w2 w3 w4
α =0.5 0.2500 0.2500 0.2500 0.2500
Tabel 4.3 No. 1 2 3 4 … 147 148 149 150
α =0.6 0.3474 0.2722 0.2133 0.1671
α =0.7 0.4614 0.2756 0.1647 0.0984
α =0.8 0.5965 0.2520 0.1065 0.0450
α =0.9 0.7641 0.1821 0.0434 0.0103
α =1.0 1.0000 0.0000 0.0000 0.0000
Contoh Perhitungan Nilai Agregat (α = 0.6 ; urutan variabel : SL,SW,PL,PW)
Sepal Length * w1 Sepal Width * w2 Petal Length * w3 5.1 * 0.3474 4.9 * 0.3474 4.7 * 0.3474 4.6 * 0.3474 … 6.3 * 0.3474 6.5 * 0.3474 6.2 * 0.3474 5.9 * 0.3474
3.5 * 0.2722 3.0 * 0.2722 3.2 * 0.2722 3.1 * 0.2722 … 2.5 * 0.2722 3.0 * 0.2722 3.4 * 0.2722 3.0 * 0.2722
1.4 * 0.2133 1.4 * 0.2133 1.3 * 0.2133 1.5 * 0.2133 … 5.0 * 0.2133 5.2 * 0.2133 5.4 * 0.2133 5.1 * 0.2133
Petal Width * w4 Nilai Agregat 0.2 * 0.1671 0.2 * 0.1671 0.2 * 0.1671 0.2 * 0.1671 … 1.9 * 0.1671 2.0 * 0.1671 2.3 * 0.1671 1.8 * 0.1671
3.05648 2.85090 2.81453 2.79523 4.25311 4.51806 4.61551 4.25487
Metode klastering
Tingkat akurasi
Sum of Squares Error (SSE)
K-means berbasis OWA (urutan variabel: Petal Length, Petal Width, Sepal Length dan Sepal Width serta nilai α = 0.9)
96.67
0.12226
K-means (dengan menggunakan jarak cityblock )
88.67
0.53778
K-means (dengan menggunakan jarak Euclidean )
89.33
0.53643
Hierarchical clustering (Single linkage )
68
0.96925
Hierarchical clustering (Complete linkage )
84
0.60901
Implementasi (data padi) Nilai α (Orness) 0.5 0.6 0.7 0.8 0.9 1.0 Rata-rata
3 klaster Rata-rata nilai siluet 0.5545 0.5595 0.5641 0.5886 0.5818 0.5841 0.5721
Nilai α (Orness) SSE 0.5 0.47811 0.69563 0.6 0.91407 0.7 1.0428 0.8 1.0549 0.9 1.788 1.0 Rata-rata
Nilai α (Orness) 0.5 0.6 0.7 0.8 0.9 1.0 Rata-rata
5 klaster Rata-rata nilai siluet 0.5365 0.5697 0.5168 0.5412 0.5862 0.5921 0.5571
SSE 0.21517 0.29335 0.52361 0.49829 0.5153 0.78849
Nilai α (Orness) 0.5 0.6 0.7 0.8 0.9 1.0 Rata-rata
7 klaster Rata-rata nilai siluet 0.5405 0.5331 0.5332 0.5806 0.5357 0.5512 0.5457
SSE 0.12408 0.18891 0.31402 0.26925 0.33123 0.40991
4 klaster Rata-rata nilai siluet 0.5509 0.5510 0.5549 0.5747 0.5735 0.5144 0.5532
SSE 0.34326 0.45356 0.58028 0.65910 0.67071 1.54500
Nilai α (Orness) 0.5 0.6 0.7 0.8 0.9 1.0 Rata-rata
6 klaster Rata-rata nilai siluet 0.5446 0.4915 0.4852 0.5066 0.5514 0.5921 0.5286
SSE 0.15577 0.24483 0.3773 0.41299 0.45354 0.79547
Nilai α (Orness) 0.5 0.6 0.7 0.8 0.9 1.0 Rata-rata
8 klaster Rata-rata nilai siluet 0.5887 0.5169 0.5468 0.5646 0.5386 0.5890 0.5574
SSE 0.099931 0.17335 0.18346 0.25434 0.26981 0.3609
Perbandingan plot siluet
Silhouette Value • Misalkan kita sebut A sebagai cluster dimana data Xi berada, hitung ai sebagai rata-rata jarak Xi ke semua data yang menjadi anggota A. • Anggaplah bahwa C adalah sembarang cluster selain A. • Hitung rata-rata jarak antara Xi dengan data yang menjadi anggota dari C, sebut sebagai d(Xi, C). • Cari rata-rata jarak terkecil dari semua cluster, sebut sebagai bi, bi = min(d(Xi,C)) dengan C≠A. • Silhoutte dari Xi, sebut sebagai si dapat dipandang sebagai berikut (ChihPing, 2005): ⎧ ⎪1 − a i , ⎪ bi ⎪⎪ s i = ⎨0, ⎪ ⎪ ⎪ b i − 1, ⎪⎩ a i
ai < bi ai = bi ai > bi
atau
bi − ai swi = max {ai , bi } Sumber: Izenman (2008)
REFERENSI UTAMA • Allidawati dan Bambang K.(1993), “Metode Uji Mutu Beras dalam Program Pemuliaan Padi”, dalam Padi: Buku 2, Eds: Ismunadji dkk, Badan Litbang Pertanian, Pusat Penelitian dan Pengembangan Tanaman Pangan, Bogor. • Arief, RW., Ernawati, dan Arfi I.(2008), “Uji Organoleptik Nasi Beberapa Varietas Padi Hibrida dan Padi Varietas Unggul Baru”, dalam Prosiding Seminar Nasional Padi 2008, BBPTP, Subang. • Cheng, CH, J-W Wang, dan M-C Wu. (2009), OWA-Weighted Based Clustering Method for Classification Problem, Expert Systems with Application 26, 4988-4995. • Damardjati, D.S. dan Endang Y.P. (1991), “Mutu Beras”, dalam Padi: Buku 3, Eds: Soenarjo dkk, Badan Litbang Pertanian, Pusat Penelitian dan Pengembangan Tanaman Pangan, Bogor. • Damardjati, D.S. (1995), Karakterisasi Sifat dan Standarisasi Mutu Beras sebagai Landasan Pengembangan Agribisnis dan Agroindustri Padi di Indonesia. Badan Litbang Pertanian. • Fuller, R. & Majlender, P. (2001), An analytic approach for obtaining maximal entropy OWA operator weights, Fuzzy Sets and Systems, 124, 53–57. • Grandi, R. (2003), Integration of Ordered Weighted Averaging Operators with Feed-Forward Neural Networks for Optimal Feature Subset Selection And Pattern Classification. Tesis Master. Universitas Florida. Florida. • Huberty, (1994), Applied Discriminant Analysis, Wiley Interscience, New York. • Jain, A.K. (2009), Data Clustering: 50 Years Beyond K-Means. Pattern Recognition Letters.