Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coefficient and Exponential Separation (PCAES) Index (Susanto. S. dan Ernawati)
Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coefficient and Exponential Separation (PCAES) Index Susanto, S.\ dan Ernawati' 1
2
Jurusan Teknik Industri , Fakultas Teknologi Industri-Universitas Katolik Parahyangan, Bandung E-mail:
[email protected]@bdg.centrin.net.id Program Studi Teknik Infonnatika, Fakultas Teknologi Industri , Universitas Atma Jaya Yogyakarta E-mail:
[email protected]. ac.id
Abstract Data Structure is a comp ulsory 4/h semester subject in the Department ofInformatics, Atma Jaya University. Yogyakarta, Indon esia. There are 121 students enrolled in this subject. all ofwhom need to be allocated to classes . This fact raises thr ee questions. Firstly, what is the appropriate number of classes ? Secondly. how do we allocate those students into classes? Thirdly. which student belongs to which class ? -The answer to the second and the third questions for a giv en number ofclasses was formulated in (Susanto and Ernawati, 2006) by employ ing the Fuzzy Clustering concept. As a development to (Susanto and Ernawati, 2006) and (Susanto and Erna wati ,2005) this research tries to answer the first question by employing the Partition Coeffi cient and Exponential Separation (PCAES) Ind ex. Keywords : Fuzzy Clust ering, Partition Coefficient and Expon ential Separation (PCAES) Index. students allocation
1. Pendahuluan Pennasalahan membagi n buah objek, yang masing-masing dicirikan berdasarkan atribut yang dimilikinya, kedalam c buah kelompok telah dibahas dalam (Susanto dan Ernawati, 2006). Pada pembahasan tersebut diilustrasikan tentang sebuah sam pel yang terdiri atas 40 orang lulusan UAJY, yang masing-masing dicirikan dengan 2 jenis data atribut, yaitu IPK dan lama studio Keempat-puluh orang ini masing-masing hendak dikelompokkan kedalam sekian kelom pok atau sekian cluster. Dengan terlebih dahulu menentukan besarnya sekian, pembahasan tersebut berhasil menjawab pertanyaan tentang Clustering atau pengelompokan berikut: siapa menjadi anggota kelompok yang mana . Pertanyaan ini kita sebut sebagai Pertanyaan-l Pertanyaan selanjutnya berapakah sekian itu? Artinya, berapakah nilai c tersebut? Pertanyaan ini kita sebut sebagai Pertanyaan-2 . Pertanyaan-2 ini adalah pertanyaan tentang keabsahan pengelompokan atau cluster validity . Pertanyaan ini telah dicoba untuk dijawab dalam (Susanto dan Emawati, 2005). Kali ini digunakan ilustrasi sebuah sampel yang terdiri atas 121 mahasiswa Jurusan Teknik lnfonnatika, Universitas Atma Jaya Yogyakarta, yang akan menempuh TF4376 (Struktur Data Lanjut), suatu mata kuliah wajib di semester ke-4. Setiap mahasiswa dicirikan oleh 2 buah atribut, yaitu nilai yang pernah mereka peroleh untuk 2 mata kuliah prasyarat bagi TF4376, yaitu TF2474 (Algoritrna dan Pernrograman) dan TF 3276 (Struktur Data). Dalam pembahasan untuk menentukan jumlah kelompok (cluster) yang sah atau valid, (Susanto dan Emawati , 2005) menggunakan ukuran Fukuyama-Sugeno 's Fuzzy Cluster Validity Index yang dibahas dalam (Wu dan Yang, 2005).
143
Jurnal Teknologi lndustri Vol. XI No.2 April 2007: 143-154
Susunan tulisan ini adalah sebagai berikut. Bab Pendahuluan membahas latar belakang penulisan artikel, didalarnnya secara eksplisit dirumuskan permasalahan apa saja yang hendak dijawab, dalam hal ini Pertanyaan-l dan pertanyaan-2 dapat dipandang sebagai Perumusan Masalah. Bab Tinjauan Pustaka membahas beberapa konsep yang berasal dari pelbagai kepustakaan, yang menjadi landasan teori bagi pembahasan Bab selanjutnya. Bab Metode Penelitian membahas langkah-Iangkah sistematis, yang didasarkan pada teori yang telah dibahas pada Bab Tinjauan Pustaka, dalam memecahkan masalah yang telah dirumuskan pada Bab pendahuluan . Bab Hasil Penelitian dan Pembahasannya menyajikan 2 hasil utama dari penelitian ini beserta pembahasannya. Hasil pertama adalah pembagian kelas para peserta kuliah sebagai hasil penerapan algoritma Fuzzy Clust ering terhadap data ke-121 peserta mata kuliah TF4376 (Struktur Data Lanjut) untuk pelbagai kemungkinan jumlah kelas. Hasil kedua adalah rekomendasi tentangjumlah kelas yang valid. Bab Kesimpulan dan Saran berisi kesimpulan dari penelitian ini beserta saran untuk penelitian selanjutnya. 2. Tinjauan Pustaka: Fuzzy Clustering dan Partition Coefficient and Exponential
Separation (PCAES) Index Bab ini membahas 2 (dua) buah teori yang menjadi landasan dari isi artikel ini. Kedua teori tersebut adalah Fuzzy Clustering serta Partition Coefficient and Exponential Separation (PCAES) Index. Selain itu dibahas pula kerangka penerapan kedua teori ini dalam kasus yang dibahas. a. Fuzzy Clustering Secara matematis, masalah Fuzzy Clustering telah dirumuskan oleh [Bezdek, 1981] dalam bentuk masalah optimasi terkendala (constrain ed optimization) berikut ini: 1) diberikan n buah objek, yaitu °\,°2 , . . ., ok> ... , On 2) objek ke-k( Ok) dicirikan oleh p buah atribut, yang dinyatakan dalam bentuk vektor kolom:
=tX k l
xk
Xk2
x kj
'"
XkP)T
dengan xkj menyatakan nilai atribut ke-j (j=1,2, .. .,p) dari objek ke-k (k= 1.2.. .. ,n), 3) berdasarkan ke-p buah atribut yang dimiliki setiap objek. ke-n buah objek dikelompokkan kedalam c buah cluster, yaitu cluster-s, cluster-Z . . .., cluster-c. 4) harus dicari matriks
U=(Uik)cxn
,dan vektor
Vi =(V jl
V i~
V ij
v;PY
5) sehingga nilai fungsional berikut menjadi minimum :
(1)
6) dan kendala-kendala berikut terpenuhi :
[0,1]
lljk E
(2)
c
I
ll lk
= 1, untuk setiap k= I ,2" ... ,n
(3)
;=\
°< I
n
ll ik
< n , untuk setiap i =1,2,. ..,c
(4)
k=1
m>1
144
(5)
tnt
akan
Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coefficient and Exponential Separation (PCAES) Index (Susanto, S. dan Ernawati)
19
lk
In
al Ie
1S
lb
Pad a fungsional (I), besaran
IIX k -viii
menyatakan "jarak" antara atribut dan objek ke-k
(x k ) terhadap "titik pusat" dan cluster-i (V i). Mengingat elemen-elemen vektor Vi menyatakan nilai rata-rata atribut dari seluruh objek yang menjadi anggota cluster-i, maka vektor ini merupakan prototype atau representasi dari seluruh objek yang menjadi anggota cluster-s.
-viII,
Semakin kecil nilai IIX k maka semakin mirip atribut dari objek ke-k dengan prototype (representasi) dan cluster-i, sehingga semakin pantas objek ini untuk menjadi anggota cluster-i ,
n
Ih Ih Ih
n
11
ra
n g
yang berarti semakin besar nilai
Uik.
Sebaliknya, semakin besar nilai
kecil nilai Uik . Pad a kendala (2), nilai derajat keanggotaan objek ke-k
(Ok)
IIXk
-viII, maka semakin
berada pada selang nilai
[0,1]. Pada kendala (3), untuk setiap objek, jumlah dan seluruh nilai derajat keanggotaannya terhadap berbagai cluster adalah 1. Pada kendala (4) , setiap objek pasti menjadi anggota salah satu cluster, namun untuk setiap objek tidak mungkin menjadi anggota dari seluruh cluster. Banyak algoritrna telah dikembangkan bagi masalah Fuzzy Clustering seperti Bezdek (1981), Al-Sultan dan Selim (1991), dan Kamel dan Selim (1994). Berikut adalah algoritrna yang dikembangkan oleh [Bezdek, 1981] : Langkah-I
Tetapkan c, 2:5,c<..[;; ; piJih sembarang
~ >0 dan sembarang norm
I I pada R
m ;
inisiasikan U (0 ) ; tetapkanlah I = O.
]
Langkah -Z
Hitunglah ke-c buah Fuzzy cluster centres
{v:f)} ,dengan
n
~)U~~))2Xj k V(/) )1
~=I
(6)
n
~)U~)) 2 k =1
Langkah-3
I +- I + 1hitunglah
n
1
[t.(:J1
u~)=~ 0, 1
Il~l' dengan
ifI k =0
Vi El~ if I, :;to
(7)
Vi Elk ifI k:;t 0
r, =~ll :5, i :5,c;d ki=llx k-v 11=0} , l~ = {1,2,...,c}- lk dan i
I
Ilk adalah jumlah elemen
dari lk' Langkah-A Jika
Ilu(l+J) _u(l )II« maka stop,jika tidak demikian maka pergi ke Langkah 2.
145
Jurnal Teknologi Industri Vol. Xl No.2 April 2007: /43-/54
b. Partition Coefficient and Exponential Separation (PCAES) Index Untuk menentukan jumlah cluster, atau nilai c, yang optimal dapat dicoba beberapa nilai c. Kemudian digunakan besaran cluster validity Index untuk menilai besaran c yang terbaik (optimal). (Wu dan Yang, 2005) menganjurkan untuk mengelompokkan objek kedalam c=2,...,
j;; buah cluster (bila j;;, pilihlah bilangan bulat yang terdekat dengannya) . Pada penelitian ini digunakan Partition Coefficient and Exponential Separation Index atau disingkat PCAES, yang definisinya adalah: (Wu dan Yang, 2005): 2 kl
u PCAES(c)= LLc
n
;=1 k =1 U M
-
Lexp - ~l? [IIX _x .11 C
;=1
[
k
~T
1
2 ] ]
(8)
dengan
U = max{IU ~ i } ' M
1 ~I ~ c
(9)
k=1
(10) c
~={LX;
(11)
;=1
Jumlah cluster terbaik adalah sebesar c
yang diperoleh dengan memecahkan bentuk
max PCAES(c) .
2 ~ c ~../n
c. Kerangka Penerapan T eori Dalam Kasus Yang Dibahas Pada penelitian ini: I) Banyaknya objek yang dikaji adalah ke-121 peserta perkuliahan TF4376 (Struktur Data Lanjut),jadi n=121,
2) Sesuai saran (Wu dan Yang, 2005). nilai c yang akan dicoba adalah c = 2,3,..., j;; = 11 , 3) Setiap mahasiswa akan dicirikan oleh vektor kolom yang terdiri atas 2 baris, baris pertama dan kedua, berturut-turut, menyatakan nilai mata kuliah prasyarat, yaitu TF2474 (Algoritma dan Pernrograman) dan TF 3276 (Struktur Data), sebagai contoh, mahasiswa pertama akan dicirikan oleh vektor kolom: 4)
x = ( 3.00) I
2.00
( 12)
karena mahasiswa ini mendapat indeks B dan C, berturut-turut, untuk TF2474 dan TF 3276, adapun kesetaraan indeks dan nilai mata kuliah di UniversitasAtma Jaya Yogyakarta diatur pada Tabel I berikut:
146
-----
Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coefficient and Exponential Separation (PCAES) Index (Susanto, S. dan Ernawati)
Tabel I . Indeks dan Nilai
ulai Indeks
oaik 2,...,
1101
-ang
Nilai
A A"
4.00 3.70
8·
3.30
S S
3.00 2.70
c·
2.30
C C
2.00 1.70
D· D
1.30 1.00
E
0.00
3. Metode Penelitian Penelitian ini ditempuh melalui langkah-langkah sebagai berikut:
a. Langkah-l: Merumuskan Masalah Diberikan sejumlah 121 orang peserta perkuliahan TF4376 (Struktur Data Lanjut), yang masing-rnasing dicirikan dengan 2 jenis data, yaitu nilai mata kuliah prasyarat, yaitu TF2474 (Algoritma dan Pernrograman) dan TF 3276 (Struktur Data). Ke-121 orang ini masing-rnasing hendak dikelompokkan kedalam sejumlah cluster, berdasarkan kedua jenis data ini. Masalahnya adalah, bagaimanakah pengelompokan yang akan dihasilkan? Artinya, akan menjadi anggota cluster manakah mahasiswa yang bemama si X itu? Siapa saja mahasiswa yang akan menjadi anggota suatu cluster? Serta, berapa jumlah cluster yang paling optimal (terbaik)?
mtuk
Data
tama ritma akan
b. Langkah-2: Menentukan Metode Pemecahan Masalah Pada penelitian ini teknik Fuzzy c-means Clustering terpilih sebagai metode pemecahan masalah, terutama untuk menjawab pertanyaan: I) bagaimanakah pengelompokan yang akan dihasilkan? 2) akan menjadi anggota cluster manakah mahasiswa yang bemama si X itu ? 3) siapa saja mahasiswa yang akan menjadi anggota suatu cluster? Sedangkan Partition Coefficient and Exponential Separation Index (PCAES) akan digunakan untuk menjawab pertanyaan: berapa jumlah cluster yang paling optimal (terbaik)?
c. Langkah-3: Menentukan Jenis Data yang Diperlukan Jenis data yang diperlukan adalah data nilai mata kuliah prasyarat, yaitu TF2474 (Algoritma dan Pernrograman) dan TF 3276 (Struktur Data) dari ke-121 mahasiswa peserta perkuliahan TF4376 (Struktur Data Lanjut) yang hendak dikelompokkan.
d. Langkah-4: Mengambil Data yang Diperlukan Data yang terambil disajikan pada Tabel 2 pada Apendiks. ,276,
liatur
e. Langkah-5: Mengolah Data Data yang didapat pada Langkah-4 mula-mula akan diolah dengan teknik Fuzzy
J12l
Clustering untuk pelbagai banyak jumlah cluster, yaitu c= 2,3, ..., j;; = = II cluster. Untuk pengolahan data dengan teknik ini akan digunakan software MA TLAB 6.5. Selanjutnya
147
Jurnal Teknologi lndustri Vol. XI No. 2 April 2007: 143-154
untuk setiap c=2,3" ..., II akan dihitung besar an PCAES Indeks. Banyaknya cluster yang terpilih adalah, c', yang memenuhi persamaan: PCAES(c') = min PCAES(c) .
2Sr S I I
f. Langkah-ti: Menginterpretasikan Hasil Pengolahan Data Pada langkah ini akan diberikan interpretasi dari hasil pengolah an data yang dilakukan pada Langkah-5, sehingga besaran U jk dan V ij menjadi jelas arti fisisnya. Interpretasipun akan
diberik an kepada besaran c'.
4. Pengolahan Data: Hasil Penelitian dan Interpretasinya Bab ini membahas hasil yang diperoleh dari pengolahan data sebagai pelaksanaan dari Langkah-5 pada Metod e Penelitian. Selain itu, bab inipun memberik an interpretasi terhadap hasil pengol ahan data sebagai pelaksanaan dari Langkah-6. Sebenarnya penggolah an data dilakuk an untuk kasus jumlah cluster c=2.3 ..... 11, karena keterbatasan ruang penulisan, maka perhitungan yang agak mendetail hanya disajikan untuk kasus c = 5. Misalk an ke-121 peserta perkuliahan TF4376 (Struktur Data Lanjut) akan dikelompokkan kedalam 5 cl us te r, jad i nilai c adalah 5. Misalkan data pada Tabel 2 disimpan diberi nama '·DATA .dat" dan disimpan pada drive C, untuk mengolah data ini dengan bantu an sof tware MATLAB 6.5 berikan perintah berikut:
» X=load('c:\DAT A.dat');
» [Center,U,ObjFcn]=fcm(X,5 ,[2, 10,10"-5))
Perintah "X=l oad('c:\DAT A.da!')" akan membaca file dengan nama "DATAdat" dan komputer akan menyimpannya dalam variabel X. Perint ah "[Center,U,Obj Fcn]=fcm(X,5,[2,1O,10" -5))" akan memasukkan nilai variabel X kedalam fungsi fern (Fuzzy c-me ans ) dan data pada variabel ini akan dibagi kedalam 5 cl uste r, adapun besarn ya pangkat bobot dipilih m=2, iterasi maksimum pada pelaksan aan perhitungan adalah 10, kriteria penghentian iterasi ada lah bila selisih antara 2 solusi yang berurut an telah bernil ai kurang dari 10.5, hasil dari perhitungan adalah didapatkannya pusat cluster atau Center, derajat keanggotaan atau matrik s U serta nilai fungsi tujuan atau ObjFcn. Setelah kedua perintah diberikan. didap at 3 (tiga) bagian hasil berikut ini, Bagian pertam a, yaitu hasil dari perh itungan nilai fungsional, sebaga i beriku t: Iteration CO /(1ll =90 . 0 ~. fen = 12.285709
I
Interpretasin ya, sof twa re MATLAB 6. - rnernerlukan iterasi 90 kali sebelum memperol eh so lusi optimal bagi nilai fungsi onal J(U,y ) pad a persarn aan ( L), yaitu sebesar 12.285709. Bagian kedua , yaitu hasil perhitungan dari nilai-nilai v ij
'
disajikan pada Gambar I
berikut: Ce nter =
2.0644 1.0 140
3.0 123 1.9454 1.1603 1.9478 2.655 1 3.4230 2.0452 1.8034
Gambar 1. Koordinat Pusat Cluster untuk c=5
148
gian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coeffic ient and ': rco nential Separation (PCAES) Index auto. S. dan Ernawat i)
rpil ih
Nilai-nilai ini merupakan'tkoord inat" titik pusat kelima clust er dan memberikan gari s besar citra .iap cluster:
a. Untuk cluster-I , "koordinat" dari titik pusat cluster ini adalah: V II [ V 21
.ukan aka n
J = [2.0644J 1.0140
arti fisisnya , cluster-l akan beranggotakan peserta perkuliahan TF4376 (Struktur Data Lanjut) dengan nilai rat a-rata untuk mata kuliah prasyarat TF2474 (Al goritma dan Pemrograman) dan TF 3276 (Stru ktu r Data), berturut-turut adalah , 2.0644 dan 1.0140; 1 dari iadap data maka
b. Untuk cluster-2, "koordinat" dari titik pusat cluster ini adalah: V 12 [ V 22
J = [3.01231 1.9454)
ikkan
nama tware
..dat " .intah ungs i arn ya 'iteria ~ dari otaan ipat 3
arti fisi snya, cluster-Z akan beranggotakan peserta T F4376 den gan nilai rata-rata untuk mata kuliah prasyarat TF2474 dan TF 3276, berturut-turut adalah, 3.0123 dan 1.9454; demikian seterus nya untuk cluster 3,4 dan 5. Bagian ketiga, yaitu ha sil perhitungan dari nilai-nilai 0.0017 0.00 17 0036 1 0.9927 09927 00343 0.0009 0.0009 00497 000 15 0.00 15 0.0 143 000 33 000)) 0 8656
0.0979 0.0963 04387 0.1703 0. 1969
0.0704 0 127.1 004) 1 00556 02179 00 ) .16 001 98 0.6986 0 59 18
o lOW 00982 004 10 00 180 0.7369
00464 0.018 1 0.8549 0.01.10 00675
o 1059
o 14 18
00982 004 10 00180 o 7.J69
0867 5 0.0345 0022 0 0 0081 0.0680
08675 00345 0.0220 0.008 1 00680
08675 0.0345 0.0220 0.008 1 0.0680
0.8675 0.0345 0.0220 0008 1 0.0680
0.0 128 0 0067 0.950 9 0 0057 00239
0.8675 0 0345 0.0220 0008 1 00680
09878 0.0022 0.0027 0.0007 00066
.olusi
0.0017 0.8675 0.9927 0.0345 0.0009 0.022 0 000 15 0.008 1 0.0033 0.0680
0 5060 02063 0.0626 00348 0 1903
0 7.174 0.0375 00824 0.0 145 0. 1282
Jar I
0 .9878 0.0022 0.0027 0.0007 0.0066
00253 001 11 0.0157 0.003 5 0.9443
0.8675 0.0345 002 20 0 008 1 0.0680
0.7374 0 0375 0.0824 00 145 0. 1282
00709 0.1273 0.2428 00431 00677 0.2179 0.5061 00 198 0. 1125 0.59 18
0.036 1 00343 00497 001 43 0.8656
0.0253 0 0111 0.0 157 0.0035 09443
U= Column, 1 through 11 0.0827 098 78 0 .084 1 0.1192 0.0022 0.0724 0.1654 0.0027 0.5649 0.08 11 0.0007 0.1024 055 16 0.0066 0.1762 Columns 12 throug h 22 0.0464 0.4251 09878 0.0 181 00650 0.0022 08549 0.2707 0.0027 00 130 0.0322 0 0007 0.0675 0.2069 0.0066 Colu mns 2) through J J 0.9878 0.8675 09878 0.0022 0.0345 0.0022 0.0027 00220 0 0027 00007 0.0081 0 0007 0.0066 0.0680 0 .0066 Columns J4 through 44
0.0701 00017 0.8675 0. 1294 09927 00345 0. 1526 00009 0.0220 0.4549 000 15 0.008 1 0. 1929 00033 00680 Column, 45 Ihroug h 55
07374 00827 09878 0.0375 0. 1192 0.0022 0.0824 0.1654 00027 0.0 145 0.08 11 0 .0007 0.1282 0.5516 00066 Columns 56 through 66
0.3458 0.7374 08675 0.3386 0.0375 0.0345 0 0707 0.0824 0.0220 0.0505 00 145 0008 1 0. 1944 0. 1282 0.0680 Columns 67 throug h 77
0.039 \ 0.5060 0.7374 0.8 7 16 0.2063 0 0375 0 0 153 0.0626 0.0824 00170 0.0348 0.0 145 0.0570 0 1903 0 1282
Ujk'
disajikan pada Gambar 2.
0.0134 0.0071 0.9389 00054 00.151
0.0847 0.0829 0.495 8 012 30 0.21.16
0.67 12 0.0400 0.0513 00 117 02258
00 128 00067 0 9509 00057
00361 0.0343 00497 0.014) 08656
00253 0.8675 0.0 111 0.0345 0.015 7 00220 0.0035 0.008 1 0 9443 0.0680
0 8675 0 0) 45 0.0 220 00081 0 0680
0.0253 0.0111 0015 7 0.0035 0.9443
0.8675 0.0345 0022 0 0 .0081 0 .0680
0.8675 0.0345 0.0220 0.008 1 0.0680
09878 0 0022 00027
0 .0007
00066
0.0387 0.7779 0.0279 007 10 0.0845
0.5060 02 063 0.062 6 0.0348 0 1903
0.5060 0.2063 0.0626 0.0348 0.190 3
0.867 5
0 0345
0.02 20
0.0081
00680
0425 1 0.0650 0.2707 0.0322 0.2069
0.7374 0.0375 00824 0.0145 0. 1282
0.7374 003 75 0.0824 0.0145 01282
07374
0.0375
00824
001 45
0 1282
0.1059 0.0982 004 10 0.0 180 07369
0.1273 0.Q431 0.2179 0 0 198 0.59 18
0.0387 0.7779 00279 00710 00845
0.0253
0.011 1
001 57
0 .0035
0944.1
00208 0054 7 00261 08610 003 74
0.1059 0.0982 0.0410 0.0 180 0.7369
0.4956 0.1273
0.049 7 0.0431
01 496 02179
00 1% 0 0198
0.2854 0 59 18
002W
Gambar 2. Deraj at Keanggotaan Objek untuk c=5
149
Jurnal Teknologi Industri Vol. XI No.2 April 200 7: 143-154
Pel
Ex!
(Su 0.7374 0.0375 0.0824 0.0 145 0.1282
0.036 1 0.0343 00497 0.0 143 0.8656
0. 1273 0.043 1 0.2179 00198 0.5918
0.0253 00 111 00 157 0.0035 0.9443
0. 1059 0.0982 0.04 10 0.0 180 0.7)69
0.0633 03082 0.0700 039 17 0. 1668
0.7374 0.0375 0.0824 0 0 145 0.1282
0.036 1 00343 0.0497 0 0143 08656
0.0464 0.018 1 0.8549 0.0130 0.0675
0.0609 0.3973 0.0573 0.3526 0. 1319
0.0704 0. 1418 0.0556 0.0)36 0.6986
0.7374 0.0375 00824 0.0145 0. 1282
0.8675 0 0345 0 0220 0.0081 0.0680
0.7374 0.0235 0.5060 0.0375 0.0477 0 2063 0.0824 0.0391 0 0626 0.0145 0 8430 0.0348 0.1282 0.046 7 0. 1903
Columns 78 through 88 0.9878 0.3458 0.0703 0.0022 0.3386 0 1736 0 0027 0.0707 0.0764 0.0007 0.050 5 0.5719 0.0066 0. 1944 0.10 77 Columns 89 through 99 00782 05060 0039 1 0.0501 0 2063 0.8716 0.2941 0.0626 0.015 3 0 0294 0.0348 0.0170 0.5481 0. 1903 0.0570 Columns 100 through 110 0 1273 0.7374 0.0224 o Q.131 0.0375 0 050 5 0.2179 0.0824 00378 00 198 0 0145 0.8379 0.591 8 0. 1282 005 13 Columns I I I through 121 0.9878 0.0301 0.1059 0.0022 0.8762 0.0982 oOO~ 7 00164 0.04 10 0.000 7 0 0308 0.0 180 0 0066 0.Q.166 0.7369
0.9878 0.0022 0.0027 0.0007 0.0066
0.0827 0. 1192 0. 1654 0 0811 0551 6
09878 000 22 0 0027 0.0007 00066
00529 0.7247 0 0) 07 0.0359 01 558
0.0580 0.8098 00250 00342 0.0730
0.1088 0.6034 0.039 1 0.0320 0.2166
09878 00253 0.0022 0011 1 00027 0.0 157 00007 00035 00066 0.9443
0.036 1 0.0343 0.0497 0 0\43 0.8656
0.9878 00022 0.0027 0.0007 0 0066
0.0486 0 74 14 0 0329 0 0922 0.0849
0 9878 0.0022 0 0027 0 0007 0 0066
0. 1059 0 2224 0.0764 00982 0.4353 0.1 151 0Q.110 0.0810 0. 1932 0.0 180 0 0855 0.44 16 0.7369 0. 1758 0.1736
0.7374 00375 00824 0.0 145 0.1282
Gambar 2 (lanjutan) . Derajat Keanggotaan Objek untuk c=5 Nilai-nilai ini, men ggambarkan derajat keanggotaan suatu objek (yaitu mahas iswa peserta perkuliahan TF4376 (Struktur Data Lanjut)) terhadap kelima cluster, misalnya untuk mahasiswa ke-I , didapatkan (lihat kolom ke-I ): .
unt
kec Ful ma
5.
1m: a.
UII
0.0017
U 2 1
0.9927
U 3 1
= 0.0009
U 4 1
0.0015
U S1
0.0033
Interpretasinya, mahasiswa ke-I ini dapat menjadi anggota dari : cluster-l dengan derajat keanggotaan 0.0017 cluster-2 dengan derajat keanggotaan 0.9927, cluster-3 dengan derajat kean ggotaan 0 .0009, cluster-4 dengan derajat kean ggotaan 0.00 IS , dan cluster-S dengan der ajat keanggotaan 0.0033, karena derajat keanggotaan terbesar adalah terhadap cluster-2, maka maha siswa ke-I menjadi anggota cluster-2. Hasillengkap pengelompokan ke-1 21 maha siswa kedalam 5 cluster adalah sebagai berikut: clust er-l terdiri atas mahasiswa nomor: 6 10 17 18 21 2224-2931-3436374042-4446-49 51-5 658-6272-738283 8587919498 103 lOS 108110-112 114 lIS dan 118 (atau keseluruhan 55 orang); clust er-2 terdiri atas mahasiswa nomor: 1 2 39 41 45 65 71 88 95-97 101 109 116 dan 120 (15 orang) ; cluster-3 terd iri atas mahas isw a nomor: 4 7-9 II IS 1635 dan 100 (8 orang ); clust er-4 terdiri atas mahasiswa nomor: 38 67 74 8490 106 113 dan 121 (8 oran g); cluster-5 terdiri atas mahasiswa nomor: 3 5 12-14 192023 30505763-646668-707577 79-81 86 89 92 93 99 102 104 107 117 dan 119 (35 orang), semua ini disajikan pada T abel 3 pada Apend iks.
Tabel4 berikut memberikan hasil perhitungan PCAES indeks untuk c =2,3 ,..., 11:
150
b.
c.
d.
a.
Pembagian Kelas Peserta Kuliah Berdas arkan Fuzzy Clustering dan Partition Coefficient and Exponential Separation (PCAES) Index (Susanto, S. dan Ernawati)
Tabel 4 . Perhitungan PCAES Indeks untuk c=2,3, ..., 11 c 2 3 4 5 6 7
PCAES(c) 1.461 1.421 1.797 0.081 - I. I27 -1.712
c 8 9 10 11
PCAES(c) - I. J 24 -1.436 -2.626 -2.560
Dari Tabel 4 tampak bahwa nilai maximum dari PCAES indeks, yaitu 1.797, dicapai untuk c=4, artinya sebaiknya ke-121 peserta perkuliahan TF 4376 sebaiknya dikelompokkan kedalam 4 clust er. Penelitian terdahulu (Susanto dan Ernawati, 2005) dengan menggunakan Fukuyama-Sugenos Index memberikan hasil yang berbeda, yaitu membagi ke-121 orang mahasiswa kedalam 5 clust er. serta iswa
5. Kesimpulan dan Saran Berdasarkan pembahasan sebelumnya, dapat diberikan beberapa butir kesimpulan berikut 1m:
a. Teknik Fuzzy c-means Clustering memberikan derajat keanggotaan suatu objek kedalam beberapa clust er. b . Penetapan suatu objek untuk menjadi anggota suatu clust er tertentu dilakukan dengan proses defuzifikasi dengan menetapkan terhadap cluster manakah suatu objek memiliki derajat keanggotaan terbesar, maka objek akan ditetapkan sebagai anggota cluster tersebut. c. Teknik Fuzzy c-means Clustering memberi representasi keseluruhan objek yang menjadi anggota suatu cluster. d. Studi terbatas terhadap penerapan PCAES Index dan Fukuyama-Sugeno 's Ind ex terhadap data pada Tabel 2 memberikan jumlah cluster yang berbeda, sehingga pertimbangan (selain sekedar penggunaan bilangan indeks) masih tetap diperlukan .
ajadi
Selain itu dari penelitian ini dapat pula disampaikan beberapa saran berikut ini: a. Tidak ada jaminan bahwa teknik Fuzzy c-means Clustering akan memberikan jumlah anggota cluster yang relatif berimbang, hal ini dapat ditanggulangi dengan melakukan pergeseran keanggotaan , misalnya tidak dengan memilih derajat keanggotaan terbesar, namun yang kedua terbesar atau ketiga terbesar.
6-49
120
577
151
Jur ual Tekn ologi lndustri Vol. XI No .2 April 2007: 143-154
Apendiks Tabel2. Students score achi eved for the pre req uisites of TF4376 Stude nt I
2 3 4 5 6 7 8 9 10 II 12 13 14 15 J6 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
152
Score for TF 2474 3.00 3.00 200 1.00 2 00 2 00 1.00 1.30 1.30 2 00 1.00 2.30 170 2.30 1.00 1.00 1.30 2.00 2.00 2.00 2.30 2.30 230 2.30 2.30 2.30 2.00 2.30 2.00 2.00 2.30 2.30 2.00 2.30 1.00 23 0 2.00 2.00 3.00 2 30 3.00 2.70 2.70 2.30 3.00 2.30 2.70 1.70 170 2.00 2.00 1.30 1.70 170 1.70 2.00 2.00 23 0 170 3.00
Sco re for TF 3276 2 00 200 2 00 3 00 2.30 1.00 2.70 2.00 2.70 1.30 2.00 2.00 170 1.70 170 170 1.00 1.00 2.00 170 1.00 1.00 170 1.00 1.00 1.00 1.00 1.00 1.00 170 1.00 1.00 1.00 1.00 2.00 1.00 1.00 3.00 2 00 1.00 2.30 1.00 1.00 1.00 2.00 1.00 1.00 1.00 1.00 2.30 1.00 1.00 1.00 1.00 1.00 1.00 170 1.00 1.00 1.00
Student
61 62 63 64 65 66 67 68 69 70 71 72 7'1 74 75 76 77
78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 '}
91) 100 10 1 102 103 104 105 106 107 108 109 110 III 112 113 114 115 116 117 118 119 120 121
Sco re for T F 2474 170 2.30 2.30 170 3.00 2.00 3.70 170 200 2.00 3.00 2.70 170 3.00 2.30 170 1.70 170 2.00 1.70 2.00 2.00 3.00 3.7 0 2.00 2.00 2.00 2.70 2.30 2.70 1.70 2.00 170 2.70 3.00 3.30 2.70 2.00 2 00 1.00 3.00 2.30 170 170 1.70 2.30 2 00 2.00 3.30 170 2.30 170 2.30 2.70 2.00 3.30 2.30 2.00 2.30 370 170
Sco re for T F 3276 100 1 00 1.70 170 2.30 1.70 3.30 1.70 200 170 170 1.00 1.00 3.70 170 1.30 170 1.00 2.00 1.70 170 1.00 1.00 4 00 1.00 2.30 1.00 2.00 170 2.70 1.00 200 2.00 1.00 170 170 170 1.00 170 1.70 270 2.00 1.00 1.70 1.00 3.30 200 1.00 2.30 1.00 1.00 1.00 370 1.00 1 00 2.00 1.70 100 170 1.00
:1.30
Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coefficient and Expon ential Separation (PCAESj Index Susanto, S. dan Ernawati)
Tabel 3. Hasil Clustering terhadap 121 maha siswa kedalam 2, . . ., II cluster Nomor
B' D ~ . k n y .
d ;uu r
11
10
1 .1.. .·.,M 12 1)'U I U
""
H.& o·u'6
I 2)11 4 1 ' ) 6!, 7 1 12 7) ,. 7 ~ ' ~ 9) 96 l r"
(,7 "' 90 11'11
~~
.~
1·1 .' '1 . '
21·H2"''' nJI ·12H
6~
71 . l
Clust er
4
3
2
5
~Jll !'Oll6 l%
6714 "
6 ".\
11'11 11)Q 116
?~ .9f,
(\.) III
J 19 ·11)) 0
• . ~ 19 !>flU
6 10 11· UI112"l
2f)JO~7M'O
H J1 '!l "'9~ 1 · !-6)9 6 IiJ '6
!l19'?
D l~ ·
_"
:, .,., U.) ~f- 4 / ·
~'I . '
,'"
j;;:11'I6 IO l2l
11 U2.\f..3
7'(': 9 117 Iu1 11'1I?
9 17 U"' 9~ 2~ ~ ' " 6 1 7J
~ " ~ ~ ~ I 1" .1 l "' ~ l l " 112
I II
9~
u
I~
1'"
1113 lrJ) Ins
9
6I nu) .· 111.4 ·2'9)1 ·
~ -9 ' l n,
H 36-374 1)
11)91\ 6
44 '6 ~ 1 ~
~5
,
""'1
~ ' H ft4,
4 J jl: II'lo6ID 111
3 s 12 19 ~o 69 W S6 92· 93 101 11'1 '
t. ~
" 911101) 111 1I ~ II~
1114 10 23 :u'l~"' ) 6(, 70 7! ~ I II'?
1 1 ·2214 . ~
43111 06 113 121
6 774U IIl<'>
'I}
3 ~ 111 9 _, ,,
1·2 3", 4 1 45 f> ~ 71" 9tl
~f>9 7 9'"
'91·'93 1<12 I Q1 121
( ~ ~ :.~
~~
t:
I 'll 11(
112 22 &·26
ll H ·HH H• .ar04!. U n o... . ~ ' 6Il , 2 ~ ; • j II !
1) .[ 4 2'0 23
.2. } 41 60
~~7 6 J-64
7H 3 9 ' 114
66 6' 'O 7~ 77ll'O..$l,.;I 99 11'4 111
''''
11 4. ""9
~ 2-
~ ~ ~96 1
7.
H 103 1111111
~. ~ I
l l\ ~
' 19 7-911
H .16)~
100
li)I ·J 7 )4 )6404 1"" 4 u..-. 1 5' 6Il 617H) 'iW 111 114
97 99 10) 11711'9
11 6 101'21 .:"1 _I I j ~ ~ 1
II I I H
1I1l1111 1)11 8
11311 01" ) 6~ ?I ll' 9l"I
10 12 U H 6 J , q ,r, l)'101 1171111
II'
''' :.I"" .....''1' .''' ,..,
n nlt) S79 1
116 1211
7.9 11 1) ·16 -'~ Ion
8
! 7 '1 I H
SI 92 ~ l n ,
JI 'H91'l 91 1M
8
7 ~J
6I>6\1.7fl'1I
')'l
l.llO )l1~7 601 66 ~
11'1 7(.. 11
~00' 1 99
10.&
67 , ,, ll:.
7 1~ 8 9ll~ · 96
3~ u 19 '-0 6016~ .6Q 77
6 III 17·111 17 19 3.1 37
11'1 1 109 116120
'9--SQ ~9 l ·
4 S -4 9 5 1 ·~
93 10 6 ' 07
596 1 7) '6 ~ . ' 1 . 5 f7 9 1 9 '1 11.1 105 I('ll 110 11211 5 11'
1.2)9 4 1 45 65
6 IQP ·a l l ·n 14-:9 ) 1·}.4 ).6.
~.96 In9
)7 4 n4! _H ~
Il 6111l
49 5 1·~~~ -6 1
U2.l 63 75 l"9 91 11711 9
• 1.9 I I I ~ · 16 ) ~ INI
I
-
7P-' 7 ll:~HJ
~~ P 9 1
7
103 In
121423 «1
15UI Q·1'l
63 '~ II J " 97111111 7 II"
61.601 ·10 " 19"1 U, 9 2·
\·2 J'HI ' 5 '; 5 71 . ~ 'lO1 9 ~.Q06 Inl 11l91 1(· l l"I
)Q~ ~1 601
J II 6 1 74 ~1 06121
1 0~
"" 9)l l OS 110 1111
1\4 · I I~
41 ·9 11 )~
I~
16
I I)')
9.1 'Xl I "'"
'"
6
/S 10 o.r s at . nl ' - ~ -' I · 34 ).6.}7 40 42"""46-4 9 !-I·56 ~1I · 59 61-6 2 1 2· 7) 761$ ll:2~ 5 ll:7 9 19 ' ~t ll -'
toet eano 111
61 0 1111l 21n2 4.?, 3 1·34 _\6 J 7 40 4l-4 . U>.
I 2)1141 4 ~ 6~ 71 ~. 95· '91 In l l f19 1I6 1l"1
47 .9 111 5 16 _,~ 11'1'\
~ 67
74 U 90 106 1\J 11I
'10
35 11· 14 \ 9 10 H Yl !-I) ~' 6) 6 4 ~6l!·7 07 !-
7779" 1~"
9 29399 \1)) \1'4 107 111119
49 ~ 1 ·~ ~"
5
1 14·1 1 ~
62 12 ·7) '2 '3 '5 ~7 9 1 Q.411 ' ln .\ I n ~ 111 11l i n. I nIUII ~
'10
4
J.~ ' ·9 1\. 1619·11')2J
61nI 7· 1' 2729 3.· )1 4:".4 9 ~ 1 -~ 6 ~ 9 6 1 7J ~6 ' ll:"' ~" 9 1 9' l nJ I n ~ l Oll 110 III 1I ~
21·22 2" · 26 2' 3 1·3 234 .J6 4rJ42-4 4
JO .I~ _\ ~ ~
~ 7 ~ I OJ
H 63--6U 6
12
"11117., 21-H 14 .?, ' 1_3-136..\1 '042-44 4.6 49 ~I . ~ ~ ll:. 6 !72 ·7j76 " n ·' ) I ! " 9 1Q.49A
)9 4 1 4 ~
6 ~ 6 '1 1
14
UU?tl ~ .
9 7 t rJI II"I6 1Q9!13 Il l.
,'"
3
J'HI 4 !-6~ 6 1 7 1
14~' 8 Ql) 9 ~I OI
11'16 1091 131 16
rt
61TH~'iW
6!t- 1(J 7 ~
971 111 11
7 9 · ~ 1 !l6 ~ 9 92 .93 99. IOO\OlI 0.4 I0 7 Jl 7 119
''''
1 2
"'
) . ~ 7_9 11· 161 9·11l 23
JO'~.Jl !oO ~7
6.;-6.& 66
6'.7rJ
7 ~ . 77
7 9· 1I '6 ~ 92 · 9 ~ W.
100 III! l D6 1M 117\19
. n _\ I ~ 1 1\t
110-111 118
121
1I4 ·11~
7.'\1 12 " '9 l n ' j9 U , ~ ~ 6J 6 ~ 67 69 71 14 .1579 I .~
'4~1Ill: -9"I
2
9 1 9 ' ~ -97
I n l · lll l 11'l6.-!1I1 1"9 11.3 116-11 7 11912t
1.10.11
I ~_
lI~n 2 '"
)7&<141",," ~9~ 1-61
M666li: iO '2-7 ~
Uo-?S .?
l!}.. . ~.~
9 19 ' 91·1 00 I O}· 11l5 10f; IIfl- I Il 114 ·11~ II '
''''
I
153
Jurnal Teknologi lndu stri Vol. XI No.2 April 200 1' 143-154
Daftar Pustaka AI-Sultan, KS, dan Selim, SZ, 1993, A Global Algorithm for the Fuzzy Clustering Problem, Pattern Recognition, Vol. 26, No.9, halaman 1357-1361. Bezdek, JC, 1981, Pattern Recognition with Fuzzy Objective Function Algorithms , Plenum, New York. Kamel , MS, dan Selim, SZ, 1994, New Algorithms for Solving the Fuzzy Clustering Problem, Pattern Recognition, Vol. 27, No.3 halaman 421-428 . Susanto, S. dan Emawati, 2006, Aplikasi Algoritma Fuzzy C-Means Clustering untuk Pengelompokan Lulusan, Jurnal Teknologi Industri , Vol X, No 1, halaman 79-88. Susanto, S. dan Emawati, 2005 , Penerapan Algoritma Fuzzy Clustering dan Fukuyarna Sugeno 's Fuzzy Cluster Validity Index pada Masalah Pengelompokan Mahasiswa, Proceeding of National Seminar on Operations Research/Management Science, Universitas Trisakti, halaman 91-99 . Wu, K.-L. dan Yang, M.-S .,2005. A cluster validity Index for Fuzzy Clustering, Pattern Recognition Letters, Vol. 26, Issue 9, p. 1275-1291.
154