Volume 6, No. 1 Mei 2005
tssN 1411 - 4453 S(
No
23a / D KTI / Kep / 2004
n JURNAL TEKNOLOGI INFORMASI DAN BISNIS
Kajian Eksporim.n Kineria tuury Clustering C Moan, Gusla"Kessol, Galh-
Si Hanat, Amr
Harnzah
A lr4ultiple Dls*rlhlianrAealy3ls On lnlornel Shoppsr Innovativenoss: n4?layxia'u Prdprcilso
,:.,!l;.\4Mnh.]Frki
O.loksi Lingkaran DalamCitra Dlgltal Oongan lvlenggunakan Filter Sobel Dan Tran3formaai Hough
lnan Azhai , Atif Rahnan Ct' tn x u iti tu ita fl ht
&1 e.j I c ! n
el
Suhihan, Adt Budi w,ono
ld*ntllikasl B.rCasarkan Pasfoto M€nggunakan Per.eptu a tty Weighted +,6160r6n Pada Rudng'Warna Soragam Penggunaan Koolbien Kon{inqonsi Pada Data ilining Untuk Mengelahui Fakto."Faktor Yang Mempongaruhl K6soksesa n Alumni Oi Pergu.uan
Thggl Sisi,ii,, g'l-€arning Berbasis Web Unluk Msndukung Kegialan Perkuliahan
FakultasTeknolog lnformasi Un vers las Teknolog Yogyakarta
tssN 1411 - 4453
Volume 6. No.1 [,le]2005
ffi
JU
RNAL TE KNOLOGI INFO RIITASI DAN BISNIS
Jumal PArAR ditednka. oleh Flkultd Tekndlogi lnlomasi, Univesitas
Teknolosi Yosyakarla. Jumal i.i dihaapkan sebagli media bagi stal pensajar, alunni, mahaiswa dan masyarakat luas yang meriliki perhatian terhadan bidang dan pcrkembangm reknologi inlortoasi, hrnslomrsi ilnru pcnacrahuan dan bisnh. Rcdaksi mmerina naskah berupa h6il penelnian, studi puslaka, pengamatln alaupun pendapat atas suatu nrasalah yang timbul dalam kaitannya densan perkenbangan bidmg-bidans dialas. Rcdaksi borhak ncmpcrb0iki atau mmpecinakat tanpa mensuban isi. Arlikel yans di uar tidat sel.lu menceminkan pandonson rcdaksi. , ltektor UnivemihsTeknoloEi Yosyakatu : Dekan Fakullas Tcknolo8i Inlotuasi
U. ireN nas Te*no)
og i
Yogyakan!
Proa Adhi su$nro, M.sc., Ph.D.
Aa.l Ilemaw.n,
Dr. Relantyo Wardoyo, M Sc
Suhimrn, S (om, M Kom BambrnE Mudono, SE., M M Erik Ima' Herl UjlaDto. ST., M.Kom
Ir Dr
Lukito Edi Nulmho, M.Sc, Ph.D
S.T , M.T.
Ir. SunanoGoendi, D.A.A
Dr. Td Gunaftih.
Sl., M M.
Adnrinirr.si d!n Snknl.si
ArrmatR.d,rli: Fokulras'leknololi Infom6 UniveE as'lnkDololl Yoslakflx Jl. Lingkar Ulan Jonbor slcfran Yogiklni 55235 Tclp. (0274)621310. Fax. to274)6D146 E-Mail prkriirlei(:1r llonr.Da!.: h[D://,,\$\ rly.,( i1l]orkr
tssN 1411-4453
volume 6. No.1 Mei2005
W
JURNALTEKNOLOGT INFORMASI OAN BISNIS
Kajid Ekpqinen (i.qja
Fuzzy Cluslcrins C
C!sta-K6€1, Galh-Geva Dd Stiqa oli Anir Honzoh
Mee.
C R€eiresi
AMuhiplcDiscnm nanrAnrlysisOn Internel Shonper Inovaliveness: Malalsia's Pespecfi ve
Deteksi Linskaan Dalam Citra Dicital Dencan
25
32
51
66
Moeigunakm Filer Sobel D& Tnnslomasi Eolgh Inan Azhoti . Ari!Rahhtah Allikasi Visuolhsi Ciira Medis DiBital Fomat Dicon
(Diiital tnaeeAnd Co nukatio h Medicnc) tuhir on. Anf Budi W)ro o Identifikoi B{dasdkm Pslolo MenserlnalQn P erc ept@\lt We i s ht ed $ is t os ru, Pada Rua.e_Wama
Penggunun Koelisi€n Konlinsensi Pcda Dala Mining U.iul Mengebnui FaktotsFaktor Y&g Mempengmhi
K6dcesm Alrmni Di Pagurum Tinggi
Er rlie;e!4
Sish E leminsBerbasis
Web Untuk Mendukuns
1
Vol.6, No.1 Mei 2005 Hal.:1 – 14
KAJIAN EKSPERIMEN KINERJA FUZZY CLUSTERING CMEAN, GUSTA-KESSEL,GATH-GEVA DAN C-REGRESI Oleh : Sri Hartati, Amir Hamzah
ABSTRACT Clustering as a method of grouping objects into some clusters that is based on self similarity. It is very important issues in pattern recognizion, pattern classification and data mining area. One of clustering methods developed using fuzzy approach is known as fuzzy clustering.
Among fuzzy clustering methods, the Fuzzy
C-Means
Algorithm (FCM) had been developed, its extensionthen was developed in various ways to increase its performance sucah as Gustafson-Kessel (FGK) and Gast-Geva (FGG). Those algorithms are still based on center points as cluster prototypes. Another alternative, Fuzzy C-Regression Model (FCRM) was developed and was based on regression line as cluster prototypes. This study is aimed to show performance comparison among algorithms i.e. FCM, FGK,FGG and FCRM. The performance of each algorithm has been tested using simulated and real data. The comparison among the algorithms performances has been showed in connection with their complexity, their cluster validity and their classification rate. The experimental results show that FGK and DGG have better performance than that of FCM in clustering data having many mixture cluster structure. The FCM show that it has a better computasional complexit, and the FCRM has better performance in clustering data with regression pattern data. Key word : fuzzy clustering , cluster validty, classification rate
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
2
PENDAHULUAN Clustering yang sering dikenal sebagai proses segmentasi berbeda dengan classification. Proses clustering tidak memiliki kelas-kelas yang terdefinisikan terlebih dahulu (pre-defined classed). Aplikasi clustering sangat luas, di antaranya pada image processing, data compression, computer vision sampai web mining (Duin, et.al., 2002). Telah banyak
metode clustering dikembangkan antara lain :
hierarchical methods
mencakup agglomerative dan divisive algorithm, partitioning methods mencakup relocation algorithm, probalistic clustering, k-medoid dan k-means method dan yang berbasis neural network (Berkhin,2002), maupun yang memakai pendekatan fuzzy oleh Ruspini (1969) dengan konsep fuzzy objective function algorithm, Dunn (1973) yang menyempurnakan clustering ISODATA yang telah dikembangkan sebelumnya oleh Bezdek (1980) menyempurnakan teori konvergensi dari fuzzy ISODATA. Tulisan ini menyajikan secara ringkas beberapa metode fuzzy clustering dan membandingkan secara eksperimen untuk mengetahui kinerja masing-masing metode.
Fuzzy C-Mean Clustering (FCM) Apabila dimiliki sampel n objek yang masing-masing dicirikan karakteristiknya dengan p atribut (feature) dan terhimpun dalam X={x1,x2,...,xn} dengan setiap xkp 1
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
3
tingkat keanggotaan antara 0 sampai 1. Fuzzy clustering pertama kali dikembangkan oleh Ruspini (1969). Pengembangan dengan penerapan metode least-square dibangun oleh Dunn (1973), yang diformulasikan lebih general oleh Bezek(1973) menjadi algoritma yang terkenal dengan sebutan Fuzzy-C-Means Clustering (FCM). Selanjutnya FCM mengalami berbagai modifikasi dan pengembangan oleh banyak peneliti. Konsep FCM merupakan ide mencari struktur cluster yang meminimalkan jarak antar objek ke setiap titik pusat cluster (sum-square error within group). Bentuk fungsi tujuan yang paling klasik dari FCM adalah : c
n
J1(U,V;X)=
i 1
k 1
2
ik
d ik (vi - x k )
(1)
untuk: 1
atas X. Partisi optimal U* untuk X adalah pasangan (U*,V*) yang
merupakan local minimizer untuk J1. Sedangkan Bezdek (1973), merumuskan bentuk (1) ke bentuk yang lebih luas dengan batasan m(1,) dan generalisasi untuk rumus jarak menjadi persamaan : c
Jm(U,V,X)=
n
i 1
k 1
m ik
(vi - x k ) T A( vi - x k )
(2)
dengan A adalah sembarang matrik definit positif. Bezdek telah meminimalkan bentuk (2) dengan beberpa kendala (1981) yakni dilakukan dengan mendeferensialkan Jm terhadap vi (untuk matrik U dianggap tetap) dan terhadap ik (untuk V dianggap tetap) mendapatkan nilai :
ik
1 x k vi
2
1 j 1 x v j k c
1 /( m 1)
2
1 /( m 1)
untuk i 1,2,...,c; k 1,2,...,n
(3)
dan :
Pakar, Vol.6, No.1 Mei 2005
4
vi
n
1
n
k 1
m k 1
m ik
xik untuk i 1,2,...,c
(4)
ik
Fuzzy Gustafson-Kessel (FGK) Algoritma FCM mengasumsikan struktur cluster berbentuk spherical. Pada kenyataannya tidak setiap struktur cluster berbentuk spherical, tetapi dapat berbentuk elipsoid atau bentuk yang lain. Gustafson and Kessel (1979) mengusulkan modifikasi pada komponen jarak dalam fungsi tujuan Jm yang diminimasi dalam FCM. Matrik A dalam persamaan (2) diusulkan untuk disubstitusi dengan matrik yang disebut fuzzy covariance matrix. Berikut ini jarak yang diusulkan : dik2 = (xk-vi)TAi(xk-vi)
(5)
Dengan : norm-inducing matrix Ai = [det(Si)]1/nSi -1 dan n
Si=covarians matrix, Si=
k 1
m ik
(6)
( x k vi )(x k vi ) T
(7)
n
k 1
m ik
Selanjutnya elemen matrik U, yaitu ik dari persamaan (3) akan disesuaikan menjadi (Gustafson and Kessel, 1979):
ik
1 c
(d j 1
2 ik
(8) 2 1 /( m 1)
/ d jk )
dengan dik dan djk adalah jarak objek ke pusat cluster. Pendekatan jarak dari persamaan (5) mengakomodasi bentuk non-spherical yang muncul dalam struktur cluster dari data yang dimiliki (lihat Gambar 1).
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
5
Gambar 1. Spherical dan non-spherical cluster (Abonyi, 2002)
Fuzzy Gath-Geva Clustering (FGG) Algoritma Fuzzy Gath-Geva Clustering mengembangkan lebih jauh konsep dari Fuzzy Gustafson-Kessel Clustering. Gath-Geva (Abonyi et.al., 2002) mengasumsikan bahwa data adalah satu sampel yang berasal dari populasi dengan distribusi probabilitas Gaussian gabungan (mixture-gaussian distribution). Dengan demikian objek x dianggap sebagai suatu titik data dalam distribusi tersebut dengan fungsi densitas probabilitas : f(x) =
pi (2 )
p/2
1
det(Ai)
exp(1 / 2( x j vi )T Ai ( x j vi ))
(9)
Dengan demikian jarak suatu objek xk ke suatu cluster dengan pusat cluster vi kemudian dirumuskan sebagai : dik2 =
1 1 exp ( xk vi ) T S i ( xk vi ) 2
det(S i ) Pi
(10)
dimana : Si=matrik covarian cluster ke-i vi= pusat cluster ke-i Pi= probabilitas a-priori dari data menjadi anggota cluster ke-i, yaitu : n
Pi=
j 1
n
m i, j
(11)
c
j 1 t 1
m t, j
Pakar, Vol.6, No.1 Mei 2005
6
Sebenarnya dapat dikatakan bahwa algoritma FCG tidak sepenuhnya bersandar pada fungsi tujuan tetapi pada “fuzzifikasi” pada estimator statistik. Secara teknis komputasi selanjutnya algoritma FGG akan memiliki langkah-langkah yang sama dengan algoritma FCM maupun algoritma FKG kecuali pada penghitungan jaraknya.
Fuzzy c-Regression Models (FCRM) Tidak seperti algoritma FCM, FGK atau FGG yang menggunakan titik pusat cluster sebagai prototype cluster, fuzzy c-regression models (FCRM) menggunakan regresi polynomial sebagai prototype cluster (Hathaway and Bezdek, 1993). FCRM menghasilkan estimasi serempak parameter untuk model c-regression dan fuzzy cpartition untuk data. Bentuk umum model regresi adalah : yk=fi(xk,i)
(12)
dimana xk adalah sampel data ke-k dan fungsi fi dengan parameter i pi . Nilai tingkat keanggotaan ik U diinterpretasikan sebagai bobot kecocokan prediksi nilai sampel data tersebut dengan model prediksi fi(xk,i) oleh yk. Sedangkan error prediksi dapat ditulis : Ei,k = (yk-fi(xk,i))2
(13)
Fungsi objektif dari FCRM didefinisikan sebagai : c
n
Em(U,{ i })= ( ik )m Ei , k ( i )
(14)
i 1 k 1
dimana m{1,} adalah eksponen “kefuzzian” dari hasil cluster. Salah satu kemungkinan hasil minimisasi (14) menghasilkan algoritma yang meng-update matrik U melalui update ik dengan persamaan berikut (Abonyi et.al., 2000) :
ik
1 c
(E j 1
i, k
/ E j,k )
(15) 2 /( m 1)
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
7
Validitas Clustering Validitas clustering merupakan ukuran banyaknya cluster yang terbentyuk sedemikian rupa hasil clustering. Chi et.al. (1998) merangkum setidaknya ada tiga alat ukur, yaitu koefisien partisi, entropy partisi dan fungsi validitas kekompakan dan separasi (compactness and separation validity function) dan classification rate. Koefisien partisi ini mengukur kedekatan dari semua sampel masukan terhadap prototipe yang terpilih, sedangkan fungsi validitas kekompakan adalah rasio antara ratarata jarak sampel dengan prototipe yang terpilih dengan minimum jarak antar prototipe. Classification rate digunakan untuk mengukur kemampuan clustering tersebut dalam klasifikasi objek, yakni perbandingan antara banyaknya . f Selain validitas clustering yang umumnya digunakan untuk mencari nilai c yang terbaik dari suatu proses clustering, classification rate digunakan untuk mengukur kemampuan clustering tersebut
dalam klasifikasi objek, yakni perbandingan antara
banyaknya objek yang dapat diklasifikasi dengan dengan tepat sesuai dengan klas dari mana objek tersebut berasal dengan banyaknya objek yang diklasifikasi.
PERBANDINGAN KINERJA BERDASARKAN HASIL EKSPERIMEN CLUSTERING DATA Berikut ini akan disajikan beberapa hasil eksperimen clustering dengan berbagai jenis data, untuk meninjau kompleksitas koopmputasi dan hasil clusteringnya.
Kompleksitas komputasi Data pengujian untuk keempat algoritma tersebut memiliki bebeapa karakteristik yang sama, yaitu : -
Nilai awal matrik U dibangkitkan secara random
-
Iterasi dianggap konvergen bila U reatif berubah cukup kecil
Pakar, Vol.6, No.1 Mei 2005
8
pada setiap iterasi, rumusan jarak yang digunakan berbeda yang mengakibatkan kompleksitas komputasi yang berbeda. Tabel 1 menunjukkan perbedaan kompleksitas komputasi dalam dalam setiap iterasi dengan notasi c= cacah cluster, n cacah sampel data dan p=dimensi (cacah atribut) Tabel 1. Kompleksitas komputasi setiap iterasi Metode
Update V
Update U
Total
Kompleks itas
FCM
(2cp+3c)n+
(3c2p+3cp+4c2+ 4c)n
pc GK
(2cp+3c)n+
GG
FCRM
(3c2p+5cp+4c2+7c)n
O(n)
+ pc 2 2
2
2
(2p c +3p c+4c +3pc+ 3
2
(2p2c2+4c2+3p2c+5pc 3
O(n)
2
pc
9c)n+p c+2p c
+12c)n+p c+2p c +pc
(2cp+3c)n+
(2p2c2+2p2c+5c2+4pc+
(2p2c2+2p2c+5c2+4pc
pc
9c)n+ p3c+2p2c+3c
+9c)n+ p3c+2p2c+3c
-
4cn2+(4c2+2pc+5c)n+
4cn2+(4c2+2pc+5c)n+ O(n2)
2cp3
2cp3
O(n)
Dilihat dari parameter n,c dan p maka hampir semua algoritma berbanding linear terhadap n kecuali FCRM yang berbanding kuadratik terhadap n. Untuk FCM berbanding linear juga untuk cacah atribut dan berbanding kuadratik dengan cacah cluster. Untuk algoritma FGK dan FGG memiliki kompleksitas yang hampir sama, berbanding kuadratik terhadap cacah cluster dan kubik terhapat cacah atribut. Hal terakhir ini karena dalam kedua algoritma tersebut melibatkan invers matrik ukuran pxp pada setiap iterasinya. Pada algoritma FGG komputasi yang melibatkan fungsi exp dan kalkulasi probabilitas apriori setiap cluster menjadikan kompleksitas FGG lebih tinggi dari kompleksitas FGK. Karena pada umumnya nilai n jauh lebih tinggi dari p atau c maka dari keempat algoritma tersebut algoritma FCRM merupakan algoritma yang paling peka terhadap cacah n.
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
9
EKSPERIMEN DENGAN DATA Kasus 1: Data Campuran dengan berbagai pola struktur cluster Kasus 1 merupakan data simulasi dari 6 class dengan beberapa bentuk cluster yang berbeda dengan masing-maing 10 titik pada ruang dua dimensi, seperti tersaji dalam Tabel 2. Tabel 2. Data pola campuran struktur cluster Class –1 Class –2 Class –3 Class –4 Class –5 Class –6
x 1=[4 x 2=[5 x 1=[10 x 2=[2 x 1=[17 x 2=[25 x 1=[10 x 2=[ 5 x 1=[20 x 2=[ 5 x 1=[ 4 x 2=[35
(a) Plot Data asal
4 6 10 16 18 25 12 7 22 7 6 35
5 5 10 18 21 25 14 9 24 9 7 35
5 6
3 4
10 19 27 26 15 10 25 10 9 36
10 21 23 27 17 12 27 12 11 36
(b) FCM
6 6
4 5 7 3 11 9 25 16 21 24 24 25 18 19 12 13 28 29 12 13 12 14 36 35
6 4 11 29 20 26 20 15 30 15 15 35
5] 7] 9 22 14 25 22 16 32 16 18 35
12 ] 22] 26] 24] 24] 18] 34] 18] 21] 35]
(c) FGK
(d) FGG (e) FGG dengan U dari FCM (f) FCRM Gambar 2. Perbandingan clustering Untuk Data berpola cluster campuran Pakar, Vol.6, No.1 Mei 2005
10
Tabel 3. Hasil Clustering Data Kasus 1 dengan cacah cluster c=6 Metod FCM FGK FGG
Jm I 594,97 1.215,50 6.769,20 1.319,20
62 93 7 10 38
Flops 1.708.978 5.761.881 580.383 832.324
F
H
S
CR
0,6747 0,8856 0.9962 0,9975
0,7082 0,2486 * *
0,0035 0,0201 0.2587 0.0340
83,3% 100% 15,2% 100%
FCRM F : Koefisien partisi S : Validitas kekompakan dan separasi H : Entropi partisi CR : Classification Rate I : Iterasi Ket : * nilai H untuk GG tidak dapat ditentukan kerena ada nilai U yang nol FGG murni gagal melakukan clustering karena menjumpai matrix singular pada iterasi 7 FGG dengan U dari hasil FCM mampu menyempurnakan clusterirng menjadi lebih baik (CR = 100%)
Hasil clustering dengan c=6 disajikan dalam Tabel 3.
Hasil clustering
memperlihatkan bawa meskipun nilai Jm untuk FCM paling kecil tetapi nilai CR relatif lebih kecil dari metode FGK atau FGG yang 100% mampu mengcluster dengan benar. Metode
FGK berhasi mengklasifikasi 100%
tetapi iterasi dan flops sangat tinggi,
sedangkan metode FGG gagal karena selalu menemukan “singular matrix” pada iterasi tertentu. Metode FGG berhasil memperbaiki proses FCM hanya dengan 10 iterasi. Dalam kasus seperti ini metode FCM dilanjutkan metode FGG merupakan pilihan terbaik daripada metode FGK. Kasus 2 (IRISDATA): Data dengan jumlah sampel relatif besar (n=150) Pengujian terakhir menggunakan data dari Johnson and Winschern (1982), yaitu data dari tiga species Iris, yaitu : Iris setosa, Iris versicolor dan Iris virginica. Hasil clustering oleh empat metode dirangkum dalam Tabel 4 dan visualisasi grafis dalam Gambar 3
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
11
Tabel 4. Hasil Clusterng Data Kasus 4 (IRIS DATA) Metode
Jm
Iterasi
FCM
15.2985
37
950.400
0.7590
0.4429
0.0417
86,7%
FGK
23.9093
189
9.565.375
0.8374
0.2838
0.3616
88,6%
FGG
24.9659
36
2.405.538
0.9671
0.0634
0.0266
95,6%
F : Koefisien partisi H : Entropi partisi
flops
F
H
S
CR
S : Validitas kekompakan dan separasi CR : Classification Rate
Dari Tabel 4 terlihat bahwa algoritma FGG menunjukkan kinerja yang paling baik ditinjau dari validitas clustering (Nilai F terbesar dari dua metode yang lain dan nilai H terkecil dari kedua metode yang lain). Iterasi oleh metode FGG juga relatif lebih kecil, meskipun cacah flops masih lebih tinggi dari metode FCM. Metode FGG juga memiliki keberhasilan klasifikasi yang paling tinggi , yaitu 95,6% sementara untuk metode FGK dan FCM berutut-turut adalah 88,6% dan 86,7%. Data IRISDATA merupakan data sampel yang diambil dari tiga populasi spesies Iris, yang dalam kasus ini metode FGG kemungkinan paling sesuai.
FCM
FGK
FGG
Gambar 3. Hasil Clustering Data IRISDATA dengan metode FCM,GK dan GG
Pakar, Vol.6, No.1 Mei 2005
12
KESIMPULAN Beberapa kesimpulan yang dapat diambil dari kajian mengenai beberapa varian metode clustering adalah sebagai berikut : 1. Metode FCM memiliki kompleksitas komputasi yang paling kecil dan sesuai untuk data ukuran sampel besar dengan pola cluster cenderung memusat dan berbentuk bola. 2. Metode FGK dan FGG memiliki kompleksitas komputasi yuang hampir sama, yakni lebih tinggi dari FCM karena menggunakan invers matrik. Tetapi masih memiliki level O(n). Metode FGG sesuai untuk data yang berasal dari beberapa populasi yang kemungkinan memiliki distribusi probabilitas tertentu. 3. Sekalipun metode FGK dan FGG lebih fleksibel terhadap bentuk kluster dibanding FCM tetapi metode FGK dan FGG memiliki kelemahan dalam proses clustering jika menjumpai cluster
yang kosong akan menemui matrix singular
yang akan
memberhentikan proses iterasi. 4. Metode FCRM memiliki kompleksitas komputasi yang paling tinggi, O(n2), tetapi untuk data yang kemungkinan memiliki pola-pola hubungan regresi maka metode ini paling sesuai dibandingkanketiga metode yang lain.
Kajian Eksperimen Kinerja Fuzzy Clustering C Mean, Guste-Kessel, Gath-Geva dan C Regresi
13
DAFTAR PUSTAKA Abonyi,J., Babuska,R. and Szeifert,F., 2002, “Modified Gath-Geva Fuzzy Clustering for Identification of Tkagi-Sugeno Fuzzy Models ”, University of Veszprem, Department of Process Engineering, http://www.fmt.vein.hu/softcomp Ball,G.H. and Hall,D.J., 1967,”ISODATA, an Iteratif Method of Multivariate Analysis and Pattern Classification”, Behavioral Science, vol.12, pp.153-155. Berkhin,P.,2002, Survey of Clustering Data Mining Technique, Accrue Soft Inc., San Jose, California Bezdek,J.C., 1980, “A Convergence Theorem for Fuzzy ISODATA Clustering Algorithms”, IEEE Trans. Pattern Anal. Machine Intell., vol. PAMI-2, no.1, pp.18, January, 1980. Chi, Z., Yan, H. and Pham, T., 1996, Fuzzy Algorithms : With Application to Image Processing and Pattern Recognition, Advanve in Fuzzy System-Application and Theory Vol.10., Word Scientific, Sngapore. Duin R.P.W., Juszczak, P., Paclik, P.,Pkalska,E., Rider D. and Skurichina, M., 2002, Introduction to Statistical Pattern Recognition, Pattern Recognition Group, Delf University of Technology, Netherland. Dunn, J.C., 1973, “A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Cluster”, J.Cybernetics, vol.3, no.3, pp.32-57. Gustafson, D.E. and Kessel,W.C., 1979, “Fuzzy Clustering with A Fuzzy Covariance Matrix”, Proc.IEEE CDC,San Diego,CA, pp.761-766, Jan.10-12,1979. Hathaway, R.J. and Bezdek, J.C., 1993, Switching Regression Model and Fuzzy Clustering”, IEEE Trans.on Fuzzy System, 1(3): 195-204. Johnson, R.A. and Wichern, D.W., 1982, Applied Multivariate Statistical Analysis, Prentice-Hall Inc., New Jersey Ruspini, E.H., 1969, “A New Approach to Clustering”, Information and Control, vol.15, no.1, pp.22-32, July 1969.
Pakar, Vol.6, No.1 Mei 2005