Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
PENERAPAN METODE CLUSTERING K-MEANS UNTUK PENGELOMPOKAN KELULUSAN MAHASISWA BERBASIS KOMPETENSI (STUDI KASUS : AMIK LABUHANBATU, RANTAUPRAPAT)
Oleh : SUDI SURYADI, S.Kom, M.Kom Dosen Prodi Manajemen Informatika, AMIK Labuhanbatu Rantauprapat, Medan;
[email protected]
ABSTRAK The difficulty often comes every year, in choosing graduation as a student by an employee perengkrutan partners with AMIK Labuhanbatu. Competence of each student graduation taking influence the employee in question, so as not to disappoint both sides. In this study, the authors try to classify the data using a competency-based graduation one simple data mining techniques, namely clustering technique (clustering) two-dimensional, which means the two variables that will be used in grouping the graduation GPA and the value of student competencies that. Algorithms used in the grouping (clustering) using the K-Means algorithm that starts with a random selection of K, which is the number of clusters to be formed from the data to be in the cluster. This testing is done manually in addition also performed with the RapidMiner data mining application of 46 records. From the results of a study of 46 records were done manually or using RapidMiner data mining applications have 3 groups of competency-based graduation with similar results between the two tests, namely Cluster 1 consists of passing information to the student with IPK of 30.0 to 31.7 and 62.50 to Competency with 71,50 the number of members of cluster 13. Cluster 2 consists of graduation students with IPK of 30.0 to 33.5 and 81.00 to 89.00 competencies that number 18 cluster members. Cluster 3 consists of graduate students with IPK of 30.0 to 33.8 and 72.50 to 79.00 competencies that number 15 cluster members. Keyword : K-Mean. Clustering, Data Mining, Rapidminer keputusan yang kritis, terutama dalam strategi (Davies, 2004). Data mining yang I. PENDAHULUAN Dengan kemajuan teknologi informasi paling sederhana yakni menggunakan teknik sekarang ini, begitu banyak data yang pengelompokan (clustering) dengan terdapat dalam sebuah lembaga pendidikan, algoritma k-means. terutama sekolah tinggi, sehingga menimbulkan kesulitan dalam hal II. PERMASALAHAN pengelompokkan data, masalah Akademi Manajemen Informatika pengelompokan muncul dalam berbagai Komputer (AMIK) Labuhanbatu, adalah aplikasi, seperti data mining dan penemuan salah satu dari lima sekolah tinggi milik pengetahuan (U.M. Fayyad, et al, 1996). Yayasan Universitas Labuhanbatu yang ada Dengan perkembangan teknologi informasi di Kabupaten Labuhanbatu yang setiap terdapat berbagai macam solusi untuk tahunnya sekolah tinggi selalu mewisudakan mengatasi kesulitan tersebut, salah satunya mahasiswa-mahasiswinya. Bertepatan adalah dengan menggunakan teknik data dengan Kelulusan Mahasiswa tersebut, pihak mining, data mining berguna untuk membuat akademik AMIK Labuhanbatu selalu 52
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
menemui kesulitan. Salah satu kesulitan yang selalu dijumpai pihak akademik setiap tahunnya yakni apabila ada permintaan perengkrutan karyawan oleh mitra kerjanya, khususnya kesulitan tersebut terletak pada siapa (mahasiswa) yang akan dipilih untuk memenuhi permintaan oleh mitra kerja AMIK Labuhanbatu. Karena selama ini apabila ada perengkrutan karyawan atas permintaan mitra kerja, selalu memilih lulusan mahasiswa-mahasiswi secara manual atau pemilihan yang didasarkan oleh persaudaraan, kenalan, kedekatan salah-satu pihak dengan mahasiswa, tanpa berdasarkan oleh kompetensi atau kemampuan lain mahasiswa itu sendiri. III. TUJUAN PENELITIAN Penelitian ini bertujuan untuk memecahkan permasalahan yang telah dirumuskan di atas yaitu : a. Memahami bagaimana alagoritma kmeans tersebut dapat digunakan untuk pengelompokan kelulusan mahasiswa dengan menggunakan nilai indeks prestasi komulatif (IPK). b. Menganalisa bagaimana mengukur kinerja metode clustering dengan algoritma k-means sebagai pengambil keputusan yang tepat. c. Merancang propotipe clusterisasi data kelulusan Mahasiswa AMIK Labuhanbatu. d. Mengimplementasikan algoritma kmeans untuk melakukan pengelompokkan dan menentukan jumlah cluster yang paling tepat terhadap data kelulusan mahasiswa AMIK Labuhanbatu. e. Melakukan pengujian terhadap pengelompokan data kelulusan mahasiswa AMIK Labuhanbatu dengan aplikasi yang telah disediakan. IV. LANDASAN TEORI 53
A. Data Mining Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmuβilmu lain, seperti database system, data warehousing, statistic, machine learning, information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data analysis, image database, signal processing. Istilah data mining juga disebut juga knowlwdge discovery (Han, 2006). B. Tujuan Data Mining Baskoro (2010) menyatakan bahwa adapun tujuan dari adanya data mining adalah : a. Explanatory, yaitu untuk menjelaskan beberapa kegiatan observasi atau suatu kondisi. b. Confirmatory, yaitu untuk mengkonfirmasikan suatu hipotesis yang telah ada. c. Exploratory, yaitu untuk menganalisis data baru suatu relasi yang janggal. C. Pengertian Pengelompokan (Clustering) Clustering termasuk metode yang sudah cukup dikenal dan banyak dipakai dalam data mining. Clustering merupakan proses pengelompokan sekumpulan obyek kedalam kelas-kelas obyek yang sama disebut clustering atau pengelompokan.
Gambar 2.2 Clustering
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
D. Tujuan Pengelompokan (Clustering) Tujuan utama dari metode clustering adalah pengelompokan sejumlah data atau obyek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi data yang semirip mungkin seperti diilustrasikan pada gambar 2.2. Dalam clustering metode ini berusaha untuk menempatkan obyek yang mirip (jaraknya dekat) dalam satu cluster dan membuat jarak antar cluster sejauh mungkin. Ini berarti objek dalam satu cluster sangat mirip satu sama lain dan berbeda dengan obyek dalam cluster-cluster yang lain. Dalam metode ini tidak diketahui sebelumnya berapa jumlah cluster dan bagaimana pengelompokannya (Santoso, 2007). E. Pengertian K-Means Pengelompokan k-means merupakan metode analisis kelompok yang mengarah pada pamartisian n objek pengamatan ke dalam k kelompok (cluster) di mana setiap objek pengamatan dimiliki oleh sebuah kelompok dengan mean (rata-rata) terdekat, dimana mencoba untuk menemukan pusat dari kelompok dalam data sebanyak iterasi perbaikan yang dilakukan oleh kedua algoritma. K-Means merupakan salah satu metode pengelompokan data non hirarki (sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data ke dalam kelompok sehingga data berkarakteristik sama dimasukkan ke dalam satu kelompok yang sama dan data yang berkarakteristik berbeda dikelompokkan ke dalam kelompok yang lain. F. Algoritma K-Means Algoritma k-means merupakan algoritma yang membutuhkan parameter input sebanyak k dan membagi sekumpulan n objek kedalam k cluster sehingga tingkat 54
kemiripan antar anggota dalam satu cluster tinggi sedangkan tingkat kemiripan dengan anggota pada cluster lain sangat rendah. Kemiripan anggota terhadap cluster diukur dengan kedekatan objek terhadap nilai mean pada cluster atau dapat disebut sebagai centroid cluster atau pusat massa (Widyawati, 2010). Pengelompokan data dengan metode k-means secara umum dilakukan dengan algoritma sebagai berikut : 1) Tentukan jumlah kelompok 2) Alokasikan data ke dalam kelompok secara acak 3) Hitung pusat kelompok (centroid/ ratarata) dari data yang ada di masingmasing kelompok. 4) Alokasikan masing-masing data ke centroid/ rata-rata terdekat. 5) Kembali ke langkah 3, apabila masih ada data yang berpindah kelompok, atau apabila ada perubahan nilai centroid di atas nilai ambang yang ditentukan, atau apabila perubahan nilai pada fungsi objektif yang digunakan masih di atas nilai ambang yang di tentukan. Pada langkah ke 3 algoritma k-means diatas, lokasi centroid (titik pusat) setiap kelompok yang diambil dari rata-rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-i dalam sebuah kelompok, p menyatakan dimensi data, untuk menghitung sentroid fitur ke-i digunakan formula :
πΆπ =
1 π
βπ π=π ππ ............................. (1)
Di mana formula tersebut dilakukan sebanyak p dimensi sehingga i mulai dari 1 sampai p. Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat kelompok, diantaranya Euclidean
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
(Bezdek, 1981), Manhattan/ City Block ( Miyamoto dan Agusta, 1995), dan Minkowsky (Miyamoto dan Agusta, 1995), Masing-masing cara mempunyai kelebihan dan dan kekurangan. Pengukuran jarak pada ruang jarak (distance space) Euclidean menggunakan formula : π·(π2 , π1 ) = βπ2 βπ1 β2 = π ββπ=1|π2π β π1π |2................ .......... (2)
D adalah jarak antara data X2 dan X1, dan | . | adalah nilai mutlak. Pengukuran jarak pada ruang jarak Manhattan menggunakan formula : π·(π2 , π1 ) = βπ2 βπ1 β1 = π ββπ=1|π2π β π1π |.... ...................... (3)
Pengukuran jarak pada ruang jarak Minkowsky menggunakan formula : π·(π2 , π1 ) = βπ2 βπ1 β2 = 2ββππ=1|π2π β π1π |Ξ» .......................... (4) Ξ» adalah paramater jarak Minkowsky. Secara umum, Ξ» merupakan parameter penentu dalam karakteristik jarak. Jika Ξ»=1, ruang jarak pada Minkowsky sama dengan Manhattan. Jika Ξ»=2, ruang jaraknya akan dengan Euclidean; jika Ξ»=β, ruang jaraknya akan sama dengan ruang jarak Chebyshev. Cara yang paling banyak digunakan adalah Euclidean dan Manhattan. Euclidean menjadi pilihan jika kita ingin memberikan jarak terpendek antar dua titik (jarak lurus), seperti yang ditunjukkan pada gambar 2.4, sedangkan Manhattan memberikan memberikan jarak terjauh pada dua data. Manhattan juga sering digunakan karena kemampuannya dalam mendeteksi keadaan khusus, seperti keberadaan outlier, dengan lebih baik (Agusta, 2005).
55
ο·
Y
y
2
2
X
X
1
1
Euclidean
b. Manhattan
Gambar 2.4 Jarak Dua Data Dalam Dua Dimensi Pada langkah ke empat pada persamaan 4, pengalokasian kembali ke dalam masingmasing kelompok dalam metode k-means didasarkan pada perbandingan jarak antara data dengan centroid setiap kelompok yang ada. Pengalokasian ini dapat di rumuskan sebagai berikut (MacQueen, 1967) : 1 π = πππ{π·(ππ , πΆπ )} πππ = { ............. (5) 0 ππππππ¦π ail adalah nilai keanggotaan titik xi ke pusat kelompok Ci, d adalah jarak dekat terpendek dari data xi ke k kelompok setelah dibandingkan, dan Ci adalah centroid (pusat kelompok) ke l. Fungsi objektif yang digunakan untuk k-means ditentukan berdasarkan jarak dan nilai keanggotaan data dalam kelompok. Fungsi objektif yang digunakan adalah sebagai berikut (MacQueen, 1967) πΎ 2 π½ = βπ π=1 βπ=1 πππ π·(π₯π , πΆπ ) ................ (6) n adalah jumlah data, k adalah jumlah kelompok, aic adalah nilai keanggotaan titik data xi ke pusat kelompok Cl, Cl adalah pusat kelompok ke-l, dan D (xi,Cl) adalah jarak titik xi ke kelompok Cl yang diikuti. a mempunyai nilai 0 atau 1. Apabila suatu data merupakan anggota suatu kelompok, nilai ail=1. Jika tidak, nilai ail=0. III.
PEMBAHASAN Data yang digunakan dalam penelitian ini adalah data yang bertipe record dengan 68 record. Data ini terdiri
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
dari 10 atribut yang merupakan set data dua dimensi yang terdiri dari atas 7 atribut nilai yang menjelaskan tentang kelulusan mahasiswa AMIK Labuhanbatu tahun 2010 yang terdiri dari atribut nomor urut, nilai akademik (sistem kredit semester sks, nilai akhir na, indek prestasi akademik ipk dari
semester I sampai semester VI) dan nilai kompetensi akhir yang dimiliki mahasiswa (pengetahuan dasar PD, kejuruan dan nilai tes bahasa inggris BI dan nilai rata-rata kompetensi RT), dan keterangan ket seperti yang terlihat pada tabel 4.1.
Tabel 4.1 Rekapitulasi Data Kelulusan Mahasiswa AMIK Labuhanbatu Tahun 2010 No 1 1 2 3 4 5 6 7 8 9 10 . . 66 67 68
2 09.051.00.003 10.051.00.002 10.051.00.003 10.051.00.004 10.051.00.005 10.051.00.006 10.051.00.007 10.051.00.011 10.051.00.012 10.051.00.014
3 Effriza MS Adhya DS Afrian Agustini Z Ahmad N Aidatul F Alfian S Ari A Asrul Ayu Lestari
Nilai Akademik SKS NA IPK 4 5 6 120 370 3.08 120 360 3.00 120 360 3.00 120 376 3.13 120 360 3.00 120 360 3.00 120 361 3.01 120 380 3.17 120 360 3.00 120 381 3.18
10.051.03.009 10.051.03.037 10.051.03.059
Subandi Khilaluddin Chichi NS
120 120 120
NPM
Mahasiswa
360 362 365
3.00 3.02 3.04
Nilai Kompetensi PD BI RTK 7 8 9 70 71 70.5 70 60 65.0 70 65 67.5 78 70 74.0 88 75 81.5 70 73 71.5 70 69 69.5 85 77 81.0 80 73 76.5 75 74 74.5
L L L L L L L L L L
78 80 83
L L L
70 78 82
74.0 79.0 82.5
Ket 10
Keterangan : IPK = NA / SKS IPK : Indeks Prestasi Komulatif NA : Nilai Akhir dari perkalian nilai huruf dan bobot seluruh mata kuliah SKS : Sistem Kredit Semester RTK = (PD / BI) / 2 RTK : Nilai rata-rata dari Kompetensi PD : Nilai Pengetahuan Dasar Kejuruan BI : Nilai Bahasa Inggris sehingga akan diperoleh dataset yang 4.1 Seleksi Data Seluruh data atribut pada dataset di bersih untuk digunakan pada tahap atas selanjutnya akan diseleksi untuk mining. Dikatakan missing value, jika mendapatkan atribut-atribut yang bernilai atribut-atribut dalam dataset tidak berisi yang relevan, tidak missing value, dan nilai atau kosong, sementara itu data tidak redundance, di mana ketiga syarat dikatakan redundance, jika dalam satu tersebut merupakan syarat awal yang dataset yang sama terdapat lebih dari satu harus dikerjakan dalam data mining, record yang berisi nilai yang sama. 56
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Berdasarkan data di atas, ada beberapa (RT), sehingga menghasilkan yang atribut yang harus dihilangkan, karena relevan, seperti tabel 4.2 berikut ini : atribut tersebut belum relevan atau masih memiliki sub atribut, contoh atribut nilai nilai akademik terdiri dari ; SKS (jumlah sistem kredit semester dari semester 1 sampai dengan semester 6), nilai akhir (NA) yang merupakan total nilai dari semester 1 sampai semester 6, nilai IPK dan nilai keterangan dan atribut nilai akhir kompetensi terdiri dari nilai dasar pengetahuan kejuruan (PD), nilai bahasa inggris (BI) dan nilai rata-rata kompetensi Tabel 4.2 Data Kelulusan Mahasiswa Tahun 2010 Setelah Seleksi Data MHS KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 . . . M66 M67 M68
IPK 3.08 3.00 3.00 3.13 3.00 3.00 3.01 3.17 3.00 3.18 . . . 3.00 3.02 3.04
KPT 70.50 65.00 67.50 74.00 81.50 71.50 69.50 81.00 76.50 74.50 . . . 74.00 79.00 82.50
Berdasarkan tabel 4.2 di atas, dihasilkan beberapa atribut-atribut yang digunakan dalam penelitian ini adalah mhs ke-, ipk, kpt. Berikut ini adalah atribut-atribut tersebut yaitu : a. MHS KEMerupakan atribut yang berisi record pertama mahasiswa sampai record terakhir. b. IPK
Merupakan atribut yang berisi nilai ratarata dari keseluruhan mata kuliah dari semester I sampai dengan semester VI. c. KPT Merupakan atribut yang berisi nilai ratarata kompetensi (nilai dasar pengetahuan komputer dan nilai bahasa inggris). Hasil akhir dari seleksi data didapatkan 3 atribut yang telah relevan dan konsisten, 3 atribut ini yang digunakan dalam proses clustering. 57
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Dikarenakan informasi yang terkandung di dalamnya sudah mewakili informasi yang dibutuhkan untuk menjadi indikator penentu dalam pengelompokan kelulusan mahasiswa. Sebelum melakukan tahap cleaning terhadap data-data yang memiliki missing value dan redudance. Langkah selanjutnya adalah melakukan pembulatan dengan mengambil 1 digit di belakang koma dari nilai-nilai IPK dan KPT, contoh nilai IPK 3,08 dibulatkan
menjadi 3,1 dan nilai KPT 70,50 menjadi 71.0. Dan agar tidak terlalu jauh hasil yang diperoleh antara nilai indeks prestasi komulatif IPK dengan nilai kompetensi KPT, salah satu atribut pada nilai indeks prestasi komulatif IPK dalam penelitian ini dikalikan dengan 10 setiap data-data yang ada, seperti yang tertulis pada tabel 4.3 tabel pembulatan di bawah ini :
Tabel 4.3 Nilai Awal Dan Nilai Setelah Proses Pembulatan MHS-KE M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 . M15 . M66 M67 M68
NILAI AWAL IPK 3.08 3.00 3.00 3.13 3.00 3.00 3.01 3.17 3.00 3.18 . 3.01 . 3.00 3.02 3.04
KPT 70.50 65.00 67.50 74.00 81.50 71.50 69.50 81.00 76.50 74.50 . 65.00 . 74.00 79.00 82.50
NILAI PEMBULATAN IPK KPT 31 71 30 65 30 68 31 74 30 82 30 72 30 70 32 81 30 77 32 75 . . 30 65 . . 30 74 30 79 30 83
data yang redudance dalam penelitian ini, akan dilakukan cleaning data dengan cara memilih salah satu dari data yang sama tersebut, sehingga hasil akhir dari tahapan cleaning data menjadi 46 record. 4.3 Transformasi Data Hasil akhir yang diperoleh setelah melakukan proses tahap seleksi data, cleaning data, dan pada tahapan tranformasi data ini diperoleh sebanyak 3 atribut yaitu 2 atribut numerik dan 1 atribut label dengan isi data yang relevan
4.2 Cleaning Data Tahapan selanjutnya adalah melakukan cleaning data terhadap datadata yang memiliki mising value dan redudance, karena pada data kelulusan mahasiswa AMIK Labuhanbatu Tahun 2010 seperti pada data M2 dengan M15, masih memiliki data yang redudance yakni sama-sama memiliki nilai IPK=30 dan KPT=65. Hal ini tidak akan memberikan informasi apapun jika dipertahankan keberadaannya. Untuk itu 58
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015 M44 M45 M46
dan konsisten. Dalam pengujian digunakan 46 record sampling setelah ditentukan redudance, seperti pada tabel 4.4 di bawah ini : Tabel 4.4 Data Yang Diolah MHS-KE M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 . . .
IPK 31 30 30 31 30 30 30 32 30 32 . . .
4.4
KPT 71 65 68 74 82 72 70 81 77 75 . . .
31 33 30
65 86 83
Merancang Algoritma
K-means adalah algoritma clustering yang dipilih untuk pengolahan data pada penelitian ini, sehingga informasi yang dibutuhkan dapat terpenuhi. Pada tahapan clustering dengan menggunakan k-means ini di mulai dengan pembentukan cluster, cluster ini dipilih secara random, penulis membentuk 3 cluster ini, karena penulisan menganggap pembentukan cluster ini sudah memenuhi dalam pembagian jumlah anggota cluster pada
Tabel 4.4. Algoritma k-means yang dirancang dalam penelitian ini dapat dilihat pada gambar 4.1 di bawah ini :
59
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Mulai
Jumlah Atribut =2 Jumlah Cluster k=3 Jumlah Centroid=3
Random Centroid
Baca Data IPK dan KPT
Hitung JarakTerdekat Setiap Data dengan Centroid.
Pengelompokan Data Berdasarkan Jarak Terdekat
Tidak
Apakah Berubah Posisi ?
Ya Perubahan Centroid Cluster Baru
Ya
Apakah Data Yang Berpindah
Tidak Selesai
Gambar 4.1 Algoritma K-Means Dari Tahapan proses di mana data yang sudah dipraproses dicluster dengan menggunakan cara kerja algoritma kmeans seperti pada gambar 4.1 sebagai berikut : 1) Menentukan Jumlah Cluster Ditentukan k sebagai jumlah cluster adalah k = 3, sehingga cluster ke-1 adalah C1, cluster ke-2 adalah C2 dan cluster ke3 adalah C3. 2) Alokasikan data kedalam kelompok secara Acak.
Dalam penelitian ini di data yang diambil secara acak pada atribut mahasiswa ke M1, M19 dan M40. 3) Menghitung centroid (titik pusat cluster) awal adalah : Hasil dari data yang diambil secara acak dari M1, M19 dan M40, pusat cluster (centroid) awal adalah C1 = [ 31, 71 ], C2 = [ 32, 83 ], C3 = [ 34, 75 ]. Untuk selanjutnya menggunakan persamaan : (ππΌ + π2 + π3 + β― + ππ ) πΆπ = βπ₯ 4) Menghitung Jarak data Dengan Centroid terdekat 60
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Tempatkan setiap data atau objek ke cluster terdekat, kedekatan kedua obyek ditentukan berdasarkan jarak kedua obyek tersebut. Demikian juga kedekatan suatu data ke cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk dalam cluster mana. Adapun penghitungan jarak menggunakan rumus Euclidean di bawah ini: π·(π₯,π¦) = β(π¦π β π₯π )2
+ (π¦π
β
ditentukan, atau apabila ada perubahan nilai pada fungsi objektif yang digunakan masih di atas nilai ambang yang ditentukan. 4.5
Pengujian Algoritma Langkah selanjutnya adalah pengujian algoritma k-means yang telah di rancang dengan melakukan penghitungan secara manual dari data set yang telah di transformasikan sesuai dengan langkah-langkah algoritma kmeans. Adapun penghitungan yang dimaksud adalah sebagai berikut : a. Iterasi 1 1) Langkah pertama menghitung kembali jarak terpendek setiap data pada cluster terdekat menggunakan persamaman 1 Euclidean.
π₯π )2 .....(1)
5) Kembali ke langkah 3. Apabila masih ada data yang berpindah kelompok, atau ada perubahan nilai centroid di atas nilai ambang yang - Untuk Cluster (C1) : D(C1,M1) = β(31 D(C1,M2) = β(30 D(C1,M3) = β(30 D(C1,M4) = β(31 D(C1,M5) = β(30 D(C1,M6) = β(30 D(C1,M7) = β(30 D(C1,M8) = β(32 D(C1,M9) = β(30 D(C1,M10) = β(32 . . D(C1,M44) = β(31 D(C1,M45) = β(33 D(C1,M46) = β(30
β β β β β β β β β β
31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2
β β β
31)2 31)2 31)2
- Untuk Cluster (C2) D(C2,M1) = β(31 β 32)2 D(C2,M2) = β(30 β 32)2 D(C2,M3) = β(30 β 32)2
+ + + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81 (77 (75
+ (65 + (86 + (83
+ + +
β β β β β β β β β β
71)2 = 0,0000 71)2 = 6,0828 71)2 = 3,6401 71)2 = 3,0185 71)2 = 10,5475 71)2 = 1,1180 71)2 = 1,7579 71)2 = 10,0222 71)2 = 5,5902 71)2 = 3,5795
β 71)2 = 6,0000 β 71)2 = 14,6735 β 71)2 = 11,5148
(71 β 83)2 = 12,5543 (65 β 83)2 = 18,1108 (68 β 83)2 = 15,6285 61
Sudi Suryadi D(C2,M4) = β(31 D(C2,M5) = β(30 D(C2,M6) = β(30 D(C2,M7) = β(30 D(C2,M8) = β(32 D(C2,M9) = β(30 D(C2,M10) = β(32 . . D(C2,M44) = β(31 D(C2,M45) = β(33 D(C2,M46) = β(30
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
β β β β β β β
32)2 32)2 32)2 32)2 32)2 32)2 32)2
β β β
32)2 32)2 32)2
- Untuk Cluster (C3) D(C2,M1) = β(31 β D(C2,M2) = β(30 β D(C2,M3) = β(30 β D(C2,M4) = β(31 β D(C2,M5) = β(30 β D(C2,M6) = β(30 β D(C2,M7) = β(30 β D(C2,M8) = β(32 β D(C2,M9) = β(30 β D(C2,M10) = β(32 β . . D(C2,M44) = β(31 β D(C2,M45) = β(33 β D(C2,M46) = β(30 β
34)2 34)2 34)2 34)2 34)2 34)2 34)2 34)2 34)2 34)2
34)2 34)2 34)2
+ + + + + + +
(74 (82 (72 (70 (81 (77 (75
+ (65 + (86 + (83
+ + + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81 (77 (75
+ (65 + (86 + (83
β β β β β β β
83)2 = 9,0247 83)2 = 2,5000 83)2 = 11,6726 83)2 = 13,6354 83)2 = 2,0276 83)2 = 6,8007 83)2 = 8,5037
β 83)2 = 18,0278 β 83)2 = 2,7951 β 83)2 = 1,6604
β β β β β β β β β β
75)2 = 5,5025 75)2 = 10,7703 75)2 = 8,5000 75)2 = 2,8480 75)2 = 7,6322 75)2 = 5,3151 75)2 = 6,7521 75)2 = 6,4377 75)2 = 4,2720 75)2 = 2,3049
β 75)2 = 10,4403 β 75)2 = 10,5268 β 75)2 = 8,3121
Untuk lebih jelas penghitungan di atas dapat dilihat pada tabel 4.5 di bawah ini : Tabel 4.5 Penghitungan Jarak Data Dengan Centroid Iterasi 1
62
M25 31 82 11.0013 1.3017 7.5517 M26 32 73 1.7159 10.5013 3.3082 M27 33 78 7.2577 5.0833 3.1896 Sudi Suryadi J. Informatika AMIK-LB2.8771 Vol.3 No.2/Mei/2015 M28 31 75 3.5040 8.5408 87 15.5036 3.7454 Nilai 11.9734 Masuk NILAI31 MAHASISWA M29 C1 C2 C3 M30 32 85 14.0715 2.0429 10.1246Kelompok KEIPK KOMPETENSI Terkecil NILAI MAHASISWA M31 32 68 3.6401 15.5000 7.7621 C1 C2 C3 M1 31 71 0.0000 12.5543 5.5025 0.0000 1 KEIPK KOMPETENSI M3230 3065 63 8.5493 10.7703 20.5894 6.0828 13.0992 M2 6.0828 18.1108 1 M1 31 71 0.0000 12.5543 5.5025 M33 32 70 1.2500 13.0024 5.4829 M3 30 68 3.6401 15.6285 8.5000 3.6401 1 M231 3074 65 6.0828 2.8480 18.1108 10.7703 M4 3.0185 9.0247 3 M34 33 83 11.6085 0.7683 2.8480 7.6326 M330 3082 68 3.6401 7.6322 15.6285 8.5000 M5 10.5475 2.5000 2 M35 34 83 12.2577 1.5000 2.5000 8.0156 M430 3172 74 3.0185 5.3151 9.0247 1.1180 2.8480 M6 1.1180 11.6726 1 M36 30 85 14.0248 2.7131 10.7095 M530 3070 82 10.5475 6.7521 2.5000 1.7579 7.6322 M7 1.7579 13.6354 1 M37 33 88 16.5680 4.5277 12.5897 M8 32 81 10.0222 2.0276 6.4377 2.0276 2 M6 30 72 1.1180 11.6726 5.3151 M38 33 81 10.2879 2.4509 6.0283 M9 30 77 5.5902 6.8007 4.2720 4.2720 3 M7 30 70 1.7579 13.6354 6.7521 M39 33 87 15.6625 3.7165 11.5244 M10 32 75 3.5795 8.5037 2.3049 2.3049 3 M8 32 81 10.0222 2.0276 6.4377 M40 34 75 4.9018 8.2074 0.1667 M11 31 84 12.5011 0.9718 8.9598 0.9718 2 M9 30 77 5.5902 6.8007 4.2720 M41 30 79 7.5374 4.8283 5.1296 M12 30 75 4.1037 8.2264 3.9167 3.9167 3 M10 32 75 3.5795 8.5037 2.3049 M42 33 73 2.2423 10.5211 2.8333 M13 33 82 10.6066 1.5811 6.6708 1.5811 2 M11 31 84 12.5011 0.9718 8.9598 M43 31 77 6.0208 4.6465 6.1847 4.0311 M14 30 73 1.7579 10.6735 1.7579 1 M12 30 75 4.1037 8.2264 3.9167 M44 31 65 6.0000 18.0278 10.4403 M15 32 71 0.9014 12.5025 5.0312 0.9014 1 M1330 3384 82 10.6066 9.3590 1.5811 1.9808 6.6708 M16 12.5336 1.9808 2 M45 33 86 14.6735 2.7951 10.5268 M1430 3066 73 1.7579 9.8153 10.6735 4.6465 M17 5.0833 17.1077 1 M46 30 83 11.5148 1.6604 5.0833 8.3121 M1530 3274 71 0.9014 4.0423 12.5025 3.1369 5.0312 M18 3.1369 9.2018 1 M1632 3083 84 12.5336 7.9057 1.9808 0.7071 9.3590 M19 11.5109 0.7071 2 Jarak sedangkan kelompok berikutnya yang M20 data 8.3815 4.2720 4.0311 3 M1734ke setiap 3079 centroid 66 5.0833 4.0311 17.1077 9.8153 ditampilkan kolom 4 sampai 8 pada diikuti data 0.9718 yang M21padaM18 30 0.9718 12.6337 5.9114 3071 74 3.1369 oleh 9.2018 4.0423 ada1 di kolom 30 67 4.0697 16.0954 8.8353 1 tabel 4.6.M22 Jarak M19 terdekat yang dipilih Masuk 32 83 11.5109Kelompok. 0.7071 4.0697 7.9057 M23padaM20 30 6.5643 5.8244 3 ditampilkan kolom nilai 3478 terkecil, 79 8.3815 4.6465 4.2720 4.6465 4.0311 M24 33 89 18.1018 6.0696 14.0419 6.0696 2 M21 30 71 0.9718 12.6337 5.9114 M25 31 82 11.0013 1.3017 7.5517 1.3017 2 M22 30 67 4.0697 16.0954 8.8353 M26 32 73 1.7159 10.5013 3.3082 1.7159 1 M2333 3078 78 6.5643 3.1896 5.8244 3.1896 4.6465 M27 7.2577 5.0833 3 M2431 3375 89 18.1018 2.8771 6.0696 2.8771 14.0419 3.5040 3 Tabel 4.6M28 Hasil Penghitungan Jarak Setiap8.5408 Data Untuk Masing-masing Cluster M2531 3187 82 11.0013 11.9734 1.3017 3.7454 7.5517 M29 15.5036 3.7454 2 dan Penentuan Kelompok Terdekat Iterasi 3.3082 1 M26 3285 73 1.7159 10.5013 M30 32 14.0715 2.0429 10.1246 2.0429 2 NILAI MAHASISWA Nilai Masuk M2732 3368 78 7.2577 5.0833 3.6401 3.1896 M31 3.6401 15.5000 7.7621 1 C1 C2 C3 KEIPK KOMPETENSI Terkecil Kelompok M32 8.5493 20.5894 1 M2830 3163 75 3.5040 13.0992 8.5408 8.5493 2.8771 M1 31 71 0.0000 12.5543 5.5025 0.0000 1 M33 32 70 1.2500 13.0024 5.4829 1.2500 1 M29 31 87 15.5036 3.7454 11.9734 M2 30 65 6.0828 18.1108 10.7703 6.0828 1 M34 33 83 11.6085 0.7683 7.6326 2 M3030 3268 85 14.0715 8.5000 2.0429 0.7683 10.1246 M3 3.6401 15.6285 3.6401 1 M35 34 83 12.2577 1.5000 8.0156 2 M3131 3274 68 3.6401 2.8480 15.5000 1.5000 7.7621 M4 3.0185 9.0247 2.8480 3 M36 30 85 14.0248 2.7131 10.7095 2.7131 2 M3230 3082 63 8.5493 7.6322 20.5894 2.5000 13.0992 M5 10.5475 2.5000 2 M37 33 88 16.5680 4.5277 12.5897 4.5277 2 M3330 3272 70 1.2500 5.3151 13.0024 1.1180 5.4829 M6 1.1180 11.6726 1 M38 33 81 10.2879 2.4509 6.0283 2.4509 2 M7 30 70 1.7579 13.6354 6.7521 1.7579 1 M34 33 83 11.6085 0.7683 7.6326 M39 33 87 15.6625 3.7165 11.5244 3.7165 2 M8 32 81 10.0222 2.0276 6.4377 2.0276 2 M3534 3475 83 12.2577 0.1667 1.5000 0.1667 8.0156 M40 4.9018 8.2074 3 M9 30 77 5.5902 6.8007 4.2720 4.2720 3 M3630 3079 85 14.0248 5.1296 2.7131 4.8283 10.7095 M41 7.5374 4.8283 2 M10 32 75 3.5795 8.5037 2.3049 2.3049 3 M3733 3373 88 16.5680 2.8333 4.5277 2.2423 12.5897 M42 2.2423 10.5211 1 M11 31 84 12.5011 0.9718 8.9598 0.9718 2 M3831 3377 81 10.2879 4.0311 2.4509 4.0311 6.0283 M43 6.0208 6.1847 3 M12 30 75 4.1037 8.2264 3.9167 3.9167 3 M44 6.0000 18.0278 1 M3931 3365 87 15.6625 10.4403 3.7165 6.0000 11.5244 M13 33 82 10.6066 1.5811 6.6708 1.5811 2 M45 33 86 14.6735 2.7951 2 M4030 3473 75 4.9018 10.5268 8.2074 2.7951 0.1667 M14 1.7579 10.6735 4.6465 1.7579 1 M46 30 83 11.5148 1.6604 8.3121 2 M4132 3071 79 7.5374 5.0312 4.8283 1.6604 5.1296 M15 0.9014 12.5025 0.9014 1 2) Mengalokasikan pada dengan elemen matrik M4230 setiap 3384 data 12.5336 73 2.2423 matrik, 10.5211 1.9808 2.8333 dari M16 1.9808 9.3590 2 M43 31 77 6.0208 6.1847 4.0311 centroid terdekat bernilai 1 jika sebuah objek menjadi M17 30 66 5.0833 17.1077 9.8153 5.0833 1 M44 3174 ditentukan 65 6.0000 group. 18.0278 Maka 10.4403diperoleh M18 30 3.1369 9.2018 4.0423 3.1369 1 Keanggotaan kelompok anggota tabel M19 32 83 11.5109 0.7071 7.9057 0.7071 M45 33 86 14.6735 2.7951 10.5268 dengan nilai terkecil yang ada pada setiap assignment sebagai berikut 2pada tabel M20 8.3815 4.2720 3 M4634 3079 83 11.5148 4.0311 1.6604 4.0311 8.3121
data seperti yang tercantum dalam tabel M21 30 71 0.9718 4.6. Keanggotaan objek M22 30 67dinyatakan 4.0697 M23 M24 M25 M26 M27 M28 M29 M30 M31 M32 M33 M34 M35 M36
30 33 31 32 33 31 31 32 32 30 32 33 34 30
78 89 82 73 78 75 87 85 68 63 70 83 83 85
6.5643 18.1018 11.001363 1.7159 7.2577 3.5040 15.5036 14.0715 3.6401 8.5493 1.2500 11.6085 12.2577 14.0248
4.7. 12.6337 5.9114 0.9718 1 Tabel 4.7. Tabel4.0697 Assignment 16.0954 8.8353 1 Iterasi 1 5.8244 6.0696 1.3017 10.5013 5.0833 8.5408 3.7454 2.0429 15.5000 20.5894 13.0024 0.7683 1.5000 2.7131
4.6465 14.0419 7.5517 3.3082 3.1896 2.8771 11.9734 10.1246 7.7621 13.0992 5.4829 7.6326 8.0156 10.7095
4.6465 6.0696 1.3017 1.7159 3.1896 2.8771 3.7454 2.0429 3.6401 8.5493 1.2500 0.7683 1.5000 2.7131
3 2 2 1 3 3 2 2 1 1 1 2 2 2
MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20 M21 M22 M23 M24 M25 M26 M27 M28 M29 M30 M31 M32 M33 M34 M35 M36 M37 M38 M39 M40 M41 M42 M43 M44 M45 M46 SUM
IPK 31 30 30 31 30 30 30 32 30 32 31 30 33 30 32 30 30 30 32 34 30 30 30 33 31 32 33 31 31 32 32 30 32 33 34 30 33 33 33 34 30 33 31 31 33 30
NILAI KOMPETENSI 71 65 68 74 82 72 70 81 77 75 84 75 82 73 71 84 66 74 83 79 71 67 78 89 82 73 78 75 87 85 68 63 70 83 83 85 88 81 87 75 79 73 77 65 86 83
C1
C2
C3
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 19
17
10
SUM 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 46
Maka berdasarkan nilai terkecil yang dihasilkan pada penentuan nilai centroid, maka didapat anggota kelompok pada tabel 4.8. (Cluster) C1
Tabel 4.8 Hasil Pengelompokan Iterasi 1
C2
Anggota Kelompok [M1,M2,M3,M6,M7,M14, M15,M17,M18,M21,M22, M26,M31, M32,M33,M42,M44 ] [M5,M8,M11,M13,M16,M1 9,M24,M25,M29,M30,M34
Sudi Suryadi
C3
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015 ,M35, M36,M37,M38,M39,M41, M45,M46] [M4,M9,M10,M12,M20,M2 3,M27,M28,M40,M43]
C2={(30,82),(32,81),(31,84),(33,82),(30, 84),(32,83),(33,89),(31,82),(31,87),(32,8 5), (33,83),(34,83),(30,85),(33,88),(33,81),( 33,87),(30,79),(33,86),(30,83)}. C3={(31,74),(30,77),(32,75),(30,75),(34, 79),(30,78),(33,78),(31,75),(34,75),(31,7 7)}.
Tempatkan tiap objek ke cluster terdekat berdasarkan nilai centroid yang paling dekat selisihnya (jaraknya). Pada tabel 4.8, didapatkan hasil anggota sebagai berikut : C1={(31,71),(30,65),(30,68),(30,72),(30, 70),(30,73),(32,71),(30,66),(30,74),(30,7 1), (30,67),(32,73),(32,68),(30,63),(32,70),( 33,73),(31,65)}.
3) Menghitung Centroid Dari tabel 4.8 dapat dilihat jumlah anggota yang menempati setiap cluster, di mana cluster 1 = 17, cluster 2 = 19, cluster 3 = 10. Pada iterasi 1 ini akan dihasilkan nilai centroid yang baru dengan menggunakan persamaan :
(π +π +π +β―.+π )
1 2 3 π Ci (x,y) = (π½π’πππβ π΄πππππ‘π πΆππ’π π‘ππ π)
(31+30+30+30+30+30+32+30+30+30+30+32+32+30+32+33+31) = 31 (17) (71+65+68+72+70+73+71+66+74+71+67+73+68+63+70+73+65) (y) = = 69 (17) (30+32+31+33+30+32+33+31+31+32+33+34+30+33+33+33+30+33+30) (x) = (19) (82+81+84+82+84+83+89+82+87+85+83+83+85+88+81+87+79+86+83) (y) = (19) (31+30+32+30+34+30+33+31+34+31) (x) = = 32 (10) (74+77+75+75+79+78+78+75+75+77) (y) = = 76 (10)
C1 (x) = C1 C2 C2 C3 C3
dari penghitungan di atas diperoleh centroid baru dari iterasi 1 ini sebagai berikut : C1 = [ 31, 69 ], C2 = [32,84], C3 = [32,76].
+ (71 + (65
= 84
1) Menghitung jarak terdekat pada pusat cluster (centroid) dari nilai centroid pada iterasi 1 yaitu C1 = [31,69], C2= [32,84], C3=[32,76] menggunakan persamaan 1 Eucledian :
b. Iterasi 2 Pada iterasi ke-2 ini, langkah selanjutnya adalah mengulangi langkah ke-3 algoritma k-means : - Untuk Cluster (C1) D(C1,M1) = β(31 β 31)2 D(C1,M2) = β(30 β 31)2
= 32
β 69)2 = 1,4145 β 69)2 = 4,1556 65
Sudi Suryadi D(C1,M3) = β(30 D(C1,M4) = β(31 D(C1,M5) = β(30 D(C1,M6) = β(30 D(C1,M7) = β(30 D(C1,M8) = β(32 D(C1,M9) = β(30 D(C1,M10) = β(32 . . D(C1,M44) = β(31 D(C1,M45) = β(33 D(C1,M46) = β(30
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
β β β β β β β β
31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2
β 31)2 β 31)2 β 31)2
- Untuk Cluster (C2) D(C2,M1) = β(31 β D(C2,M2) = β(30 β D(C2,M3) = β(30 β D(C2,M4) = β(31 β D(C2,M5) = β(30 β D(C2,M6) = β(30 β D(C2,M7) = β(30 β D(C2,M8) = β(32 β D(C2,M9) = β(30 β D(C2,M10) = β(32 β . . D(C2,M44) = β(31 β D(C2,M45) = β(33 β D(C2,M46) = β(30 β - Untuk Cluster (C3) D(C3,M1) = β(31 β D(C3,M2) = β(30 β D(C3,M3) = β(30 β D(C3,M4) = β(31 β D(C3,M5) = β(30 β D(C3,M6) = β(30 β D(C3,M7) = β(30 β D(C3,M8) = β(32 β D(C3,M9) = β(30 β D(C3,M10) = β(32 β
32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2
32)2 32)2 32)2
32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2
+ + + + + + + +
(68 (74 (82 (72 (70 (81 (77 (75
β β β β β β β β
69)2 = 1,7543 69)2 = 4,9469 69)2 = 12,4341 69)2 = 2,5242 69)2 = 0,7794 69)2 = 11,9474 69)2 = 7,4491 69)2 = 5,5043
+ (65 β 69)2 = 4,0962 + (86 β 69)2 = 16,6018 + (83 β 69)2 = 13,4158
+ + + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81 (77 (75
β β β β β β β β β β
84)2 = 13,1116 84)2 = 18,6620 84)2 = 16,1749 84)2 = 9,5884 84)2 = 2,7231 84)2 = 12,2063 84)2 = 14,1783 84)2 = 2,5806 84)2 = 7,2942 84)2 = 9,0790
+ (65 β 84)2 = 18,5944 + (86 β 84)2 = 2,4319 + (83 β 84)2 = 1,7220
+ + + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81 (77 (75
β β β β β β β β β β
76)2 = 5,6415 76)2 = 11,2031 76)2 = 8,7327 76)2 = 2,1080 76)2 = 5,6089 76)2 = 4,8436 76)2 = 6,7538 76)2 = 4,9023 76)2 = 1,5685 76)2 = 1,6169 66
M15 32 71 1.7329 13.0790 5.6049 M16 30 84 14.4270 1.6773 7.5375 M17 30 66 3.1583 17.6586 10.2012 M18 30 74 4.9561 9.7244 2.5425 Sudi Suryadi J. Informatika AMIK-LB Vol.3 No.2/Mei/2015 M19 32 83 13.4330 1.1095 6.4000 M20 34 79 10.2875 4.8988 3.5133 M21 30 71 1.5257 13.1755 5.7604 . M22 30 67 2.1461 16.6475 9.1877 . M23 30 78 8.4378 6.3056 2.0036 2 = 11,1120 D(C3,M44) = β(31M24β 32)2 33+ (65 β 89 76) 20.0298 5.5433 12.9757 D(C3,M45) = β(33M25β 32)2 31+ (86 β = 6,49381.6863 5.9104 82 76)212.9186 2 2 M26 32 73 3.5811 11.0792 3.6139 D(C3,M46) = β(30 β 32) + (83 β 76) = 6,8343 M27 33 78 9.1725 5.6978 2.3601 NILAI MAHASISWA Nilai Masuk Kelompok C1 75 C2 5.4282 C3 M28 31 9.0982 1.6378 KE- jelas penghitungan IPK KOMPETENSI Terkecil4.9 Kelompok Awal: Untuk lebih di atas dapat dilihat pada tabel berikut ini M29 31 10.4347 M1 31 71 1.414587 13.111617.4119 5.6415 3.1185 1.4145 1 Tabel 4.9 Penghitungan Jarak Data Dengan Centroid Iterasi 2 1 M30 32 8.9454 M2 30 65 4.155685 18.662015.9993 11.2031 1.5660 4.1556 1 1 NILAI MAHASISWA M3 30 68 1.754368 16.1749 2.0242 8.7327 16.0808 1.7543 1 1 M31 32 8.6136 C1 C2 C3 KE-31 IPK KOMPETENSI M4 74 4.946963 9.5884 6.6214 2.1080 21.1454 2.1080 3 3 M32 30 13.6753 M130 31 71 2.7231 1.3569 1.4145 13.1116 5.6415 M5 82 12.434170 5.6089 13.5790 2.7231 2 2 M33 32 6.1045 M6 30 72 2.524265 12.2063 4.1556 4.8436 18.6620 2.5242 1 1 M2 30 11.2031 M34 33 83 13.5372 1.3580 6.4883 M7 30 70 0.779468 14.1783 1.7543 6.7538 16.1749 0.7794 1 1 M3 30 8.7327 M35 34 7.1794 M8 32 81 11.947483 2.5806 14.1819 4.9023 1.8350 2.5806 2 2 M4 31 74 4.9469 9.5884 2.1080 M36 30 9.0018 M9 30 77 7.449185 7.2942 15.9223 1.5685 2.1341 1.5685 3 3 M532 30 82 12.4341 2.7231 5.6089 M10 75 5.504388 9.0790 18.4952 1.6169 3.9905 1.6169 3 3 M37 33 11.4423 M631 30 72 0.5973 12.2077 2.5242 4.8436 M11 84 14.417981 7.4083 12.2063 0.5973 2 2 M38 33 3.0659 5.2555 M7 30 70 0.7794 14.1783 6.7538 M12 30 75 5.9487 8.7410 1.8068 1.8068 3 3 M39 33 87 17.5910 3.2797 10.5435 M13 33 82 12.535281 2.2071 11.9474 5.4888 2.5806 2.2071 2 2 M8 32 4.9023 M40 34 75 6.6698 8.8262 2.5646 M14 30 73 3.475477 11.2049 7.4491 3.8748 7.2942 3.4754 1 1 M9 30 1.5685 M41 30 2.7138 M15 32 71 1.732979 13.0790 9.4248 5.6049 5.2983 1.7329 1 1 M10 32 75 5.5043 9.0790 1.6169 M42 33 3.7792 M16 30 84 14.427073 1.6773 3.9157 7.5375 11.1161 1.6773 2 2 M11 31 84 14.4179 0.5973 7.4083 M43 31 1.3578 M17 30 66 3.158377 17.6586 7.9156 10.2012 6.6983 3.1583 1 1 M12 30 75 9.7244 4.0962 5.9487 8.7410 1.8068 M18 30 74 4.956165 2.5425 18.5944 2.5425 3 1 M44 31 11.1120 M13 33 82 12.5352 2.2071 5.4888 M19 32 83 13.4330 1.1095 6.4000 1.1095 2 2 M45 33 86 16.6018 2.4319 9.5585 M20 34 79 10.287573 4.8988 3.4754 3.5133 11.2049 3.5133 3 3 M14 30 3.8748 M46 30 83 13.4158 1.7220 6.4938 M21 30 71 1.525771 13.1755 1.7329 5.7604 13.0790 1.5257 1 1 M15 32 5.6049 M22 30 67 2.1461 16.6475 9.1877 2.1461 1 1 M16 30 84 14.4270 1.6773 7.5375 M23 data ke 30 setiap centroid 78 8.4378 6.3056 pada 2.0036 kolom 2.0036 4 sampai 3 3 Jarak ditampilkan 8 pada tabel M17 30 66 3.1583 17.6586 10.2012 M24 33 89 20.0298 5.5433 12.9757 5.5433 2 2 4.10. Jarak terdekat yang dipilih ditampilkan pada kolom nilai terkecil, sedangkan M18 30 2.5425 M25 31 82 12.918674 1.6863 4.9561 5.9104 9.7244 1.6863 2 2 kelompok berikutnya yang diikuti oleh data yang ada di kolom Masuk Kelompok. M19 32 83 13.4330 1.1095 6.4000 M26 32 73 3.5811 11.0792 3.6139 3.5811 1 1 M27 33 78 9.172579 5.6978 10.2875 2.3601 4.8988 2.3601 3 3 M20 34 3.5133 M28 31 75 5.4282 9.0982 1.6378 1.6378 3 3 Cluster 30 Jarak 71 1.5257Untuk 13.1755 5.7604 Tabel 4.10 HasilM21 Penghitungan Setiap Data Masing-masing M29 31 87 17.4119 3.1185 10.4347 3.1185 2 2 M22 30 67 2.1461 16.6475 dan Penentuan Kelompok Terdekat Iterasi 29.1877 M30 32 85 15.9993 1.5660 8.9454 1.5660 2 2 M23 NILAI 30 78 8.4378 6.3056 2.0036 MAHASISWA Nilai Masuk Kelompok M31 32 68 2.0242 16.0808 8.6136 2.0242 1 1 C1 C2 C3 KEIPK KOMPETENSI Terkecil Awal M24 33 12.9757 M32 30 63 6.621489 21.145420.0298 13.6753 5.5433 6.6214 Kelompok 1 1 M1 31 71 1.414582 13.5790 13.111612.9186 5.6415 1.6863 1.4145 1 1 M25 31 5.9104 M33 32 70 1.3569 6.1045 1.3569 1 1 M2 30 65 4.155673 18.6620 11.2031 4.1556 1 1 M34 33 83 13.5372 1.3580 3.5811 6.4883 11.0792 1.3580 2 2 M26 32 3.6139 M3 30 68 1.7543 16.1749 8.7327 1.7543 1 1 M35 34 83 14.181978 1.8350 9.1725 7.1794 5.6978 1.8350 2 2 M27 33 2.3601 M4 31 74 4.9469 9.5884 2.1080 2.1080 3 3 M36 30 85 15.922375 2.1341 5.4282 9.0018 9.0982 2.1341 2 2 M28 31 1.6378 M5 30 82 12.4341 3.9905 2.7231 5.6089 2.7231 2 2 M37 33 88 18.4952 11.4423 3.9905 2 2 M29 31 87 12.206317.4119 3.1185 10.4347 M6 30 72 2.5242 4.8436 2.5242 1 1 M38 33 81 12.2077 3.0659 5.2555 3.0659 2 2 M30 32 85 15.9993 1.5660 8.9454 M7 30 70 0.7794 14.1783 6.7538 0.7794 1 1 M39 33 87 17.5910 3.2797 10.5435 3.2797 2 2 M8 32 81 11.9474 2.5806 2.0242 4.9023 16.0808 2.5806 2 2 M31 32 8.6136 M40 34 75 6.669868 8.8262 2.5646 2.5646 3 3 M9 30 77 7.449163 5.2983 7.2942 6.6214 1.5685 21.1454 1.5685 3 3 M41 30 79 9.4248 2.7138 2.7138 3 2 M32 30 13.6753 M10 32 75 5.5043 9.0790 1.6169 1.6169 3 3 M42 33 73 3.915770 11.1161 1.3569 3.7792 13.5790 3.7792 3 1 M33 32 6.1045 M11 31 84 14.4179 0.5973 7.4083 0.5973 2 2 M43 31 77 7.9156 6.6983 1.3578 1.3578 3 3 M34 33 6.4883 M12 30 75 5.948783 18.5944 8.7410 13.5372 1.8068 1.3580 1.8068 3 3 M44 31 65 4.0962 11.1120 4.0962 1 1 M35 34 83 2.2071 14.1819 1.8350 7.1794 M13 33 82 12.5352 5.4888 2.2071 2 2 M45 33 86 16.6018 2.4319 9.5585 2.4319 2 2 M36 30 9.0018 M14 30 73 3.475485 11.2049 3.8748 2.1341 3.4754 1 1 M46 30 83 13.4158 1.7220 15.9223 6.4938 1.7220 2 2 M15 32 71 1.732988 13.079018.4952 5.6049 3.9905 1.7329 1 1 M37 33 11.4423 M16 30 84 14.4270 1.6773 7.5375 1.6773 2 2 M38 33 81 12.2077 3.0659 5.2555 M17 30 66 3.1583 17.6586 10.2012 3.1583 1 1 M39 33 87 17.5910 3.2797 10.5435 M18 30 74 4.9561 9.7244 2.5425 2.5425 3 1 M40 34 75 6.6698 8.8262 2.5646 M19 32 83 13.4330 1.1095 6.4000 1.1095 2 2 M41 30 2.7138 M20 34 79 10.287579 4.8988 9.4248 3.5133 5.2983 3.5133 3 3 M42 33 3.7792 M21 30 71 1.525773 13.1755 3.9157 5.7604 11.1161 1.5257 1 1 M22 30 67 2.1461776716.6475 7.9156 9.1877 6.6983 2.1461 1 1 M43 31 1.3578 M23 30 78 8.4378 6.3056 2.0036 2.0036 3 3 M44 31 65 4.0962 18.5944 11.1120 M24 33 89 20.0298 5.5433 12.9757 5.5433 2 2 M45 33 86 16.6018 2.4319 9.5585 M25 31 82 12.9186 1.6863 5.9104 1.6863 2 2 M46 30 83 11.079213.4158 1.7220 6.4938 M26 32 73 3.5811 3.6139 3.5811 1 1 M27 M28 M29 M30
33 31 31 32
78 75 87 85
9.1725 5.4282 17.4119 15.9993
5.6978 9.0982 3.1185 1.5660
2.3601 1.6378 10.4347 8.9454
2.3601 1.6378 3.1185 1.5660
3 3 2 2
3 3 2 2
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
2) Mengalokasikan setiap data pada centroid terdekat Keanggotaan kelompok ditentukan dengan nilai terkecil yang ada pada setiap data seperti yang tercantum dalam tabel 4.11. Keanggotaan objek dinyatakan dengan matrik, elemen dari matrik bernilai 1 jika sebuah objek menjadi anggota group. Maka diperoleh tabel assignment iterasi 2 sebagai berikut pada tabel 4.11.
68
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Tabel 4.11 Assignment Iterasi 2 MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20 M21 M22 M23 M24 M25 M26 M27 M28 M29 M30 M31 M32 M33 M34 M35 M36 M37 M38 M39 M40 M41 M42 M43 M44 M45 M46 SUM
IPK 31 30 30 31 30 30 30 32 30 32 31 30 33 30 32 30 30 30 32 34 30 30 30 33 31 32 33 31 31 32 32 30 32 33 34 30 33 33 33 34 30 33 31 31 33 30
NILAI KOMPETENSI 71 65 68 74 82 72 70 81 77 75 84 75 82 73 71 84 66 74 83 79 71 67 78 89 82 73 78 75 87 85 68 63 70 83 83 85 88 81 87 75 79 73 77 65 86 83
C1
C2
C3
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
15
1 1 18
13
SUM 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 46
Maka berdasarkan nilai terkecil yang dihasilkan pada penentuan nilai centroid, maka didapat anggota kelompok pada tabel 4.12. 69
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Tabel 4.12 Hasil Pengelompokan Iterasi 2 (Cluster) C1 C2 C3
Anggota Kelompok [M1,M2,M3,M6,M7,M14,M15,M17,M21,M22,M26,M31, M32,M33,M44] [M5,M8,M11,M13,M16,M19,M24,M25,M29,M30,M34,M35, M36,M37,M38,M39,M45,M46] [M4,M9,M10,M12,M18,M20,M23,M27,M28,M40,M41,M42,M43]
Tempatkan tiap objek ke cluster terdekat berdasarkan nilai centroid yang paling dekat selisihnya (jaraknya) pada tabel 4.13, didapatkan hasil anggota sebagai berikut : C1={(31,71),(30,65),(30,68),(30,72),(30, 70),(30,73),(32,71),(30,66),(30,71),(30,6 7),(32,73),(32,68), (30,63),(32,70),(31,65)}. C2={(30,82),(32,81),(31,84),(33,82),(30, 84),(32,83),(33,89),(31,82),(31,87),(32,8 5),
(33,83),(34,83),(30,85),(33,88),(33,81),( 33,87),(33,86),(30,83)}. C3={(31,74),(30,77),(32,75),(30,75),(30, 74),(34,79),(30,78),(33,78),(31,75),(34,7 5),(30,79),(33,73), (31,77)}. Dari tabel 4.13 dapat dilihat jumlah anggota yang menempati setiap cluster, di mana cluster 1 = 15, cluster 2 = 18, cluster 3 = 13. Pada iterasi 2 ini akan dihasilkan nilai centroid yang baru dengan menggunakan persamaan :
(π +π2 +π3 +β―.+ππ )
1 Ci (x,y) = (π½π’πππβ
π΄πππππ‘π πΆππ’π π‘ππ π) (31+30+30+30+30+30+32+30+30+30+32+32+30+32+31) = 31 (15) (71+65+68+72+70+73+71+66+71+67+73+68+63+70+65) (y) = = 69 (15) (30+32+31+33+30+32+33+31+31+32+33+34+30+33+33+33+33+30) (x) = (18) (82+81+84+82+84+83+89+82+87+85+83+83+85+88+81+87+86+83) (y) = (18) (31+30+32+30+30+30+34+30+32+33+31+34+30+33+31) (x) = = 31 (13) (74+77+75+75+73+74+79+78+73+78+75+75+79+73+77) (y) = = 76 (13)
C1 (x) = C1 C2 C2 C3 C3
= 34 = 88
masih melanjutkan ke iterasi ke 3, 4 dan 5. c. Iterasi 5 1) Menghitung jarak terdekat pada pusat cluster (centroid) dari nilai centroid yang terakhir dari iterasi ke 4 yaitu C1 = [31,68], C2=[32,84], C3 = [31,75] menggunakan persamaan 1 Eucledian :
dari penghitungan di atas diperoleh centroid baru dari iterasi 1 ini sebagai berikut : C1 = [ 31, 69 ], C2 = [34,88], C3 = [31,76] Berdasarkan tabel 4.10, jumlah data yang berpindah berjumlah 3 yaitu pada M18, M41 dan M42, kesimpulannya - Untuk Cluster (C1) 70
Sudi Suryadi D(C1,M1) = β(31 β D(C1,M2) = β(30 β D(C1,M3) = β(30 β D(C1,M4) = β(31 β D(C1,M5) = β(30 β D(C1,M6) = β(30 β D(C1,M7) = β(30 β D(C1,M8) = β(32 β D(C1,M9) = β(30 β D(C1,M10) = β(32 β . D(C1,M44) = β(31 β D(C1,M45) = β(33 β D(C1,M46) = β(30 β - Untuk Cluster (C2) D(C2,M1) = β(31 β D(C2,M2) = β(30 β D(C2,M3) = β(30 β D(C2,M4) = β(31 β D(C2,M5) = β(30 β D(C2,M6) = β(30 β D(C2,M7) = β(30 β D(C2,M8) = β(32 β D(C2,M9) = β(30 β D(C2,M10) = β(32 β . . D(C2,M44) = β(31 β D(C2,M45) = β(33 β D(C2,M46) = β(30 β - Untuk Cluster (C3) D(C3,M1) = β(31 β D(C3,M2) = β(30 β D(C3,M3) = β(30 β D(C3,M4) = β(31 β D(C3,M5) = β(30 β D(C3,M6) = β(30 β D(C3,M7) = β(30 β D(C3,M8) = β(32 β
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2 32)2
32)2 32)2 32)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2 31)2
+ + + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81 (77 (75
β β β β β β β β β β
68)2 = 2,5861 68)2 = 2,9872 68)2 = 0,7468 68)2 = 6,1192 68)2 = 13,5909 68)2 = 3,6295 68)2 = 1,6643 68)2 = 13,1191 68)2 = 8,5990 68)2 = 6,6741
+ (65 β 68)2 = 2,9483 + (86 β 68)2 = 17,7733 + (83 β 68)2 = 14,5783 + + + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81 (77 (75
β β β β β β β β β β
84)2 = 13,3992 84)2 = 18,9509 84)2 = 16,4645 84)2 = 9,8743 84)2 = 2,9950 84)2 = 12,4977 84)2 = 14,4685 84)2 = 2,8665 84)2 = 7,5882 84)2 = 9,3616
+ (65 β 84)2 = 18,8799 + (86 β 84)2 = 2,1603 + (83 β 84)2 = 1,9713 + + + + + + + +
(71 (65 (68 (74 (82 (72 (70 (81
β β β β β β β β
75)2 75)2 75)2 75)2 75)2 75)2 75)2 75)2 71
= 4,9260 = 10,4858 = 8,0127 = 1,4000 = 6,2452 = 4,1234 = 6,0321 = 5,6096
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
D(C3,M9) = β(30 D(C3,M10) = β(32 . . D(C3,M44) = β(31 D(C3,M45) = β(33 D(C3,M46) = β(30
β 31)2 + (77 β 75)2 = 1,7328 β 31)2 + (75 β 75)2 = 0,9895
β 31)2 β 31)2 β 31)2
+ (65 β 75)2 = 10,4055 + (86 β 75)2 = 10,2792 + (83 β 75)2 = 7,1596
Untuk lebih jelas penghitungan di atas dapat dilihat pada tabel 4.21 berikut ini : Tabel 4.21 Penghitungan Jarak Terdekat Data Dengan Centroid Iterasi 5 MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14
IPK 31 30 30 31 30 30 30 32 30 32 31 30 33 30
NILAI KOMPETENSI 71 65 68 74 82 72 70 81 77 75 84 75 82 73
C1
C2
C3
2.5861 2.9872 0.7468 6.1192 13.5909 3.6295 1.6643 13.1191 8.5990 6.6741 15.5867 7.0969 13.7071 4.6077
13.3992 18.9509 16.4645 9.8743 2.9950 12.4977 14.4685 2.8665 7.5882 9.3616 0.7663 9.0341 2.4509 11.4965
4.9260 10.4858 8.0127 1.4000 6.2452 4.1234 6.0321 5.6096 1.7328 0.9895 8.1018 1.3177 6.2095 3.1601
Penghitungan jarak data dengan centroid tiap cluster pada 46 record data, sehingga distance atau jarak yang diperoleh dan penentuan kelompok dari nilai terkecil antara ke tiga cluster seperti pada tabel 4.22 sebagai berikut : Tabel 4.22 Hasil Penghitungan Jarak Setiap Data Untuk Masing-masing Cluster dan Penentuan Kelompok Terdekat Iterasi 5 MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20 M21 M22 M23 M24 M25 M26 M27
IPK 31 30 30 31 30 30 30 32 30 32 31 30 33 30 32 30 30 30 32 34 30 30 30 33 31 32 33
NILAI KOMPETENSI 71 65 68 74 82 72 70 81 77 75 84 75 82 73 71 84 66 74 83 79 71 67 78 89 82 73 78
C1
C2
C3
2.5861 2.9872 0.7468 6.1192 13.5909 3.6295 1.6643 13.1191 8.5990 6.6741 15.5867 7.0969 13.7071 4.6077 2.8156 15.5860 1.9953 6.1002 14.6037 11.4464 2.6157 0.9928 9.5917 21.2022 14.0877 4.7362 10.3364
13.3992 18.9509 16.4645 9.8743 2.9950 12.4977 14.4685 2.8665 7.5882 9.3616 0.7663 9.0341 2.4509 11.4965 13.3614 1.7959 72 17.9475 10.0168 1.4036 5.1359 13.4658 16.9362 6.5999 5.2499 1.9801 11.3611 5.9587
4.9260 10.4858 8.0127 1.4000 6.2452 4.1234 6.0321 5.6096 1.7328 0.9895 8.1018 1.3177 6.2095 3.1601 4.9172 8.1967 9.4835 1.8805 7.1018 4.1989 5.0383 8.4703 2.4467 13.6912 6.6022 2.9418 3.0413
Nilai Terkecil 2.5861 2.9872 0.7468 1.4000 2.9950 3.6295 1.6643 2.8665 1.7328 0.9895 0.7663 1.3177 2.4509 3.1601 2.8156 1.7959 1.9953 1.8805 1.4036 4.1989 2.6157 0.9928 2.4467 5.2499 1.9801 2.9418 3.0413
Masuk Kelompok Kelompok Awal 1 1 1 1 1 1 3 3 2 2 1 1 1 1 2 2 3 3 3 3 2 2 3 3 2 2 3 3 1 1 2 2 1 1 3 3 2 2 3 3 1 1 1 1 3 3 2 2 2 2 3 3 3 3
Sudi
M37 M38 M39 M40 Suryadi M41 M42 M43 M44 M45 M46
33 33 33 34 30 33 31 31 33 30
88 81 87 75 79 73 77 65 86 83
19.6674 13.3736 18.7628 7.7742 10.5832 5.0156 9.0777 2.9483 17.7733 14.5783
3.6978 12.1556 3.2655 5.9730 2.9907 11.2633 9.0820 2.5263 J. Informatika 5.5927 3.2857 11.3910 3.1895 6.9912 1.8066 18.8799 10.4055 2.1603 10.2792 1.9713 7.1596
2) Mengalokasikan setiap data pada centroid terdekat Keanggotaan kelompok ditentukan dengan nilai terkecil yang ada pada setiap data seperti yang tercantum dalam tabel 4.22. Keanggotaan objek dinyatakan dengan matrik, elemen dari
3.6978 3.2655 2.9907 2.5263 AMIK-LB 3.2857 3.1895 1.8066 2.9483 2.1603 1.9713
2 2 2 3 Vol.3 3 3 3 1 2 2
2 2 2 3 No.2/Mei/2015 3 3 3 1 2 2
matrik bernilai 1 jika sebuah objek menjadi anggota group. Maka diperoleh tabel assignment sebagai berikut pada tabel 4.23. Tabel 4.23. Assignment Iterasi 5
73
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015 MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20 M21 M22 M23 M24 M25 M26 M27 M28 M29 M30 M31 M32 M33 M34 M35 M36 M37 M38 M39 M40 M41 M42 M43 M44 M45 M46 SUM
IPK 31 30 30 31 30 30 30 32 30 32 31 30 33 30 32 30 30 30 32 34 30 30 30 33 31 32 33 31 31 32 32 30 32 33 34 30 33 33 33 34 30 33 31 31 33 30
NILAI KOMPETENSI 71 65 68 74 82 72 70 81 77 75 84 75 82 73 71 84 66 74 83 79 71 67 78 89 82 73 78 75 87 85 68 63 70 83 83 85 88 81 87 75 79 73 77 65 86 83
C1
C3
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
13
Maka berdasarkan nilai terkecil yang dihasilkan pada penentuan nilai centroid, maka didapat anggota kelompok pada tabel 4.24.
C2
1 1 18
15
SUM 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 46
Tabel 4.24 Hasil Pengelompokan Iterasi 5
74
(Cluste r)
Anggota Kelompok
C1
[M1,M2,M3,M6,M7,M15,M17, M21,M22,M31,M32,M33,M44]
Sudi Suryadi
C2
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
[M5,M8,M11,M13,M16,M19,M 24,M25,M29,M30,M34,M35,M 36,M37,M38,M39,M45,M46]
C3
Tempatkan tiap objek ke cluster terdekat berdasarkan nilai centroid yang paling dekat selisihnya (jaraknya), pada tabel 4.25, didapatkan hasil anggota sebagai berikut : C1={(31,71),(30,65),(30,68),(30,72),(30, 70),(32,71),(30,66),(30,71),(30,67),(32,6 8), (30,63),(32,70),(31,65)}. C2={(30,82),(32,81),(31,84),(33,82),(30, 84),(32,83),(33,89),(31,82),(31,87),(32,8 5),
[M4,M9,M10,M12,M14,M18,M 20,M23,M26,M27,M28,M40,M 41,M42,M43]
(33,83),(34,83),(30,85),(33,88),(33,81),( 33,87),(33,86),(30,83)}. C3={(31,74),(30,77),(32,75),(30,75),(30, 73),(30,74),(34,79),(30,78),(32,73),(33,7 8), (31,75),(34,75),(30,79),(33,73),(31,77)}. Dari tabel 4.25 dapat dilihat jumlah anggota yang menempati setiap cluster, di mana cluster 1 = 13, cluster 2 = 18, cluster 3 = 15. Pada iterasi 5 ini akan dihasilkan nilai centroid yang baru dengan menggunakan persamaan :
(π1 +π2 +π3 +β―.+π )
π Ci (x,y) = (π½π’πππβ π΄πππππ‘π πΆππ’π π‘ππ π)
C1 (x) = C1 (y) = C2 (x) = C2 (y) = C3 (x) = C3 (y) =
(31+30+30+30+30+32+30+30+30+32+30+32+31) (13) (71+65+68+72+70+71+66+71+67+68+63+70+65)
= 31 = 68
(13) (30+32+31+33+30+32+33+31+31+32+33+34+30+33+33+33+33+30) (18) (82+81+84+82+84+83+89+82+87+85+83+83+85+88+81+87+86+83) (18) (31+30+32+30+30+30+34+30+32+33+31+34+30+33+31) (15) (74+77+75+75+73+74+79+78+73+78+75+75+79+73+77) (15)
dari penghitungan di atas diperoleh centroid baru dari iterasi 5 ini sebagai berikut : C1 = [ 31, 68 ], C2 = [32,84], C3 = [31,75] Karena pada iterasi ke-4 dan ke-5 posisi cluster tidak berubah, maka iterasi dihentikan dan hasil akhir yang diperoleh adalah 3 cluster dan proses penghitungan pengelompokan kelulusan mahasiswa berakhir pada tahap iterasi ke 5. Hal ini juga dapat dilihat pada tabel 4.24 hasil pengelompokan iterasi 5 dengan tabel 4.20 hasil pengelompokan iterasi 4.
= 32 = 84
= 31 = 75
Untuk lebih jelas hasil clustering yang terjadi mulai proses iterasi pertama sampai proses iterasi ke lima, dapat di lihat pada tabel 4.25 tentang rekapitulasi hasil pengelompokan kelulusan mahasiswa berbasis kompetensi tahun 2010 dari iterasi pertama sampai iterasi ke lima dengan nilai Eucledian distance dan tabel 4.26 tentang rekapitulasi hasil pengelompokan kelulusan mahasiswa berbasis kompetensi tahun 2010 dari iterasi pertama sampai iterasi ke lima dengan nilai matrik 1 dan 0.
75
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Tabel 4.25. Rekapitulasi Hasil Clustering Kelulusan Mahasiswa Berbasis Kompetensi Tahun 2010 Dengan Nilai Euclidean Distance MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20 M21 M22 M23 M24 M25 M26 M27 M28 M29 M30 M31 M32 M33 M34 M35 M36 M37 M38 M39 M40 M41 M42 M43 M44 M45 M46
C1 0.5270 6.0828 3.6401 3.0185 10.5475 1.1180 1.7579 10.0222 5.5902 3.5795 12.5011 4.1037 10.6066 1.7579 0.9014 12.5336 5.0833 3.1369 11.5109 8.3815 0.9718 4.0697 6.5643 18.1018 11.0013 1.7159 7.2577 3.5040 15.5036 14.0715 3.6401 8.5493 1.2500 11.6085 12.2577 14.0248 16.5680 10.2879 15.6625 4.9018 7.5374 2.2423 6.0208 6.0000 14.6735 11.5148
ITERASI-1 C2 12.5543 18.1108 15.6285 9.0247 2.5000 11.6726 13.6354 2.0276 6.8007 8.5037 0.9718 8.2264 1.5811 10.6735 12.5025 1.9808 17.1077 9.2018 0.7071 4.2720 12.6337 16.0954 5.8244 6.0696 1.3017 10.5013 5.0833 8.5408 3.7454 2.0429 15.5000 20.5894 13.0024 0.7683 1.5000 2.7131 4.5277 2.4509 3.7165 8.2074 4.8283 10.5211 6.1847 18.0278 2.7951 1.6604
C3 5.5025 10.7703 8.5000 2.8480 7.6322 5.3151 6.7521 6.4377 4.2720 2.3049 8.9598 3.9167 6.6708 4.6465 5.0312 9.3590 9.8153 4.0423 7.9057 4.0311 5.9114 8.8353 4.6465 14.0419 7.5517 3.3082 3.1896 2.8771 11.9734 10.1246 7.7621 13.0992 5.4829 7.6326 8.0156 10.7095 12.5897 6.0283 11.5244 0.1667 5.1296 2.8333 4.0311 10.4403 10.5268 8.3121
C1 1.4145 4.1556 1.7543 4.9469 12.4341 2.5242 0.7794 11.9474 7.4491 5.5043 14.4179 5.9487 12.5352 3.4754 1.7329 14.4270 3.1583 4.9561 13.4330 10.2875 1.5257 2.1461 8.4378 20.0298 12.9186 3.5811 9.1725 5.4282 17.4119 15.9993 2.0242 6.6214 1.3569 13.5372 14.1819 15.9223 18.4952 12.2077 17.5910 6.6698 9.4248 3.9157 7.9156 4.0962 16.6018 13.4158
ITERASI-2 C2 13.1116 18.6620 16.1749 9.5884 2.7231 12.2063 14.1783 2.5806 7.2942 9.0790 0.5973 8.7410 2.2071 11.2049 13.0790 1.6773 17.6586 9.7244 1.1095 4.8988 13.1755 16.6475 6.3056 5.5433 1.6863 11.0792 5.6978 9.0982 3.1185 1.5660 16.0808 21.1454 13.5790 1.3580 1.8350 2.1341 3.9905 3.0659 3.2797 8.8262 5.2983 11.1161 6.6983 18.5944 2.4319 1.7220
C3 5.6415 11.2031 8.7327 2.1080 5.6089 4.8436 6.7538 4.9023 1.5685 1.6169 7.4083 1.8068 5.4888 3.8748 5.6049 7.5375 10.2012 2.5425 6.4000 3.5133 5.7604 9.1877 2.0036 12.9757 5.9104 3.6139 2.3601 1.6378 10.4347 8.9454 8.6136 13.6753 6.1045 6.4883 7.1794 9.0018 11.4423 5.2555 10.5435 2.5646 2.7138 3.7792 1.3578 11.1120 9.5585 6.4938
C1 1.9742 3.5947 1.2267 5.5078 12.9835 3.0394 1.1262 12.5072 7.9941 6.0652 14.9752 6.4924 13.0964 4.0085 2.2480 14.9778 2.5984 5.4971 13.9918 10.8448 2.0279 1.5875 8.9853 20.5906 13.4762 4.1362 9.7317 5.9880 17.9667 16.5600 1.6913 6.0609 1.8267 14.0983 14.7426 16.4741 19.0556 12.7676 18.1522 7.2028 9.9751 4.4449 8.4682 3.5495 17.1630 13.9688
76
ITERASI-3 C2 17.9806 23.5432 21.0779 14.4458 7.6993 17.1546 19.0963 7.5307 12.3199 13.8881 5.3851 13.7357 6.8565 16.1607 17.8572 5.9724 22.5426 14.7027 6.1578 9.2522 18.0990 21.5288 11.3433 1.0872 6.7453 15.8607 10.2802 13.9821 3.5052 3.4956 20.8198 26.0033 18.3543 5.8581 5.2540 4.8034 1.4182 7.2557 1.8079 13.2506 10.3436 15.7841 11.6973 23.4067 2.7872 6.6232
C3 5.3758 10.9358 8.4623 1.8473 5.8240 4.5653 6.4808 5.1609 1.5428 1.3916 7.6573 1.5630 5.7603 3.5949 5.3578 7.7658 9.9335 2.2661 6.6546 3.7905 5.4860 8.9203 2.1124 13.2413 6.1582 3.3744 2.6357 1.3658 10.6789 9.2104 8.3679 13.4107 5.8568 6.7587 7.4564 9.2362 11.7059 5.5353 10.8137 2.5787 2.8913 3.5788 1.4618 10.8534 9.8300 6.7257
C1 2.5861 2.9872 0.7468 6.1192 13.5909 3.6295 1.6643 13.1191 8.5990 6.6741 15.5867 7.0969 13.7071 4.6077 2.8156 15.5860 1.9953 6.1002 14.6037 11.4464 2.6157 0.9928 9.5917 21.2022 14.0877 4.7362 10.3364 6.6000 18.5770 17.1717 1.4478 5.4491 2.3666 14.7092 15.3504 17.0828 19.6674 13.3736 18.7628 7.7742 10.5832 5.0156 9.0777 2.9483 17.7733 14.5783
ITERASI-4 C2 14.3458 19.8965 17.4093 10.8214 3.8037 13.4396 15.4126 3.8136 8.5174 10.3085 1.4887 9.9706 3.3656 12.4379 14.3083 2.2207 18.8931 10.9557 2.3385 6.0299 14.4097 17.8820 7.5249 4.3190 2.8965 12.3078 6.8864 10.3322 2.0813 0.5718 17.3081 22.3798 14.8082 2.4130 2.4286 1.7223 2.7632 4.1067 2.1785 10.0007 6.5144 12.3329 7.9284 19.8272 1.5366 2.7316
C3 6.4288 11.9870 9.5099 2.9020 4.8206 5.5891 7.5236 4.1062 1.4961 2.4197 6.6057 2.3356 4.7202 4.6049 6.4074 6.7383 10.9843 3.2024 5.6003 2.9405 6.5258 9.9715 1.4849 12.1896 5.1074 4.4174 1.8400 2.4157 9.6312 8.1585 9.4166 14.4639 6.9069 5.7152 6.4379 8.1997 10.6527 4.5509 9.7688 3.0545 1.9950 4.5673 0.9470 11.9082 8.7881 5.6930
C1 2.5861 2.9872 0.7468 6.1192 13.5909 3.6295 1.6643 13.1191 8.5990 6.6741 15.5867 7.0969 13.7071 4.6077 2.8156 15.5860 1.9953 6.1002 14.6037 11.4464 2.6157 0.9928 9.5917 21.2022 14.0877 4.7362 10.3364 6.6000 18.5770 17.1717 1.4478 5.4491 2.3666 14.7092 15.3504 17.0828 19.6674 13.3736 18.7628 7.7742 10.5832 5.0156 9.0777 2.9483 17.7733 14.5783
ITERASI-5 C2 13.3992 18.9509 16.4645 9.8743 2.9950 12.4977 14.4685 2.8665 7.5882 9.3616 0.7663 9.0341 2.4509 11.4965 13.3614 1.7959 17.9475 10.0168 1.4036 5.1359 13.4658 16.9362 6.5999 5.2499 1.9801 11.3611 5.9587 9.3855 2.8890 1.2754 16.3619 21.4334 13.8614 1.5496 1.8678 2.0263 3.6978 3.2655 2.9907 9.0820 5.5927 11.3910 6.9912 18.8799 2.1603 1.9713
C3 4.9260 10.4858 8.0127 1.4000 6.2452 4.1234 6.0321 5.6096 1.7328 0.9895 8.1018 1.3177 6.2095 3.1601 4.9172 8.1967 9.4835 1.8805 7.1018 4.1989 5.0383 8.4703 2.4467 13.6912 6.6022 2.9418 3.0413 0.9163 11.1203 9.6603 7.9276 12.9610 5.4156 7.2082 7.9013 9.6713 12.1556 5.9730 11.2633 2.5263 3.2857 3.1895 1.8066 10.4055 10.2792 7.1596
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Tabel 4.25 di atas merupakan tabel perubahan anggota setiap cluster dari iterasi pertama sampai iterasi terakhir. Tampak bagian yang berwarna hitam merupakan nilai terkecil dari tiga cluster
setiap iterasi pada masing-masing data. Nilai terkecil merupakan nilai yang akan menentukan letak posisi anggota cluster, dan mempengaruhi perubahan posisi anggota cluster tersebut.
Tabel 4.26. Rekapitulasi Hasil Clustering Kelulusan Mahasiswa Berbasis Kompetensi Tahun 2010 Dengan Matrik 1 dan 0 MAHASISWA KEM1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 M18 M19 M20 M21 M22 M23 M24 M25 M26 M27 M28 M29 M30 M31 M32 M33 M34 M35 M36 M37 M38 M39 M40 M41 M42 M43 M44 M45 M46 Jumlah Anggota Jumlah Data
C1 1 1 1 0 0 1 1 0 0 0 0 0 0 1 1 0 1 1 0 0 1 1 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 1 0 1 0 0 17
ITERASI-1 C2 C3 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 0 0 1 0 0 1 0 1 0 19 10 46
C1 1 1 1 0 0 1 1 0 0 0 0 0 0 1 1 0 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 15
ITERASI-2 C2 C3 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1 1 0 0 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 18 13 46
C1 1 1 1 0 0 1 1 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 13
77
ITERASI-3 C2 C3 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 0 1 1 0 0 1 0 1 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 13 20 46
C1 1 1 1 0 0 1 1 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 13
ITERASI-4 C2 C3 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1 1 0 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 18 15 46
C1 1 1 1 0 0 1 1 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 13
ITERASI-5 C2 C3 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1 1 0 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 18 15 46
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
Tabel 4.26 di atas merupakan tabel perubahan anggota setiap cluster dari iterasi pertama sampai iterasi terakhir dengan tampilan matrik nilai 1 dan 0. Tampak bagian yang berwarna hitam, berisi nilai 1 yang merupakan simbol dari nilai terkecil dari tiga cluster V.
setiap iterasi pada masing-masing data sedangkan nilai 0 merupakan simbol dari nilai yang tidak memenuhi syarat menjadi nilai terkecil. Penjumlahan nilai 1 setiap cluster pada masing-masing iterasi menentukan jumlah anggota setiap clusternya. masalah yang terjadi dalam perengkrutan karyawan oleh mitra kerja AMIK Labuhanbatu dapat diatasi.
Kesimpulan dan Saran-Saran
Dari hasil penelitian, dapat disimpulkan bahwa algoritma K-Means dapat digunakan untuk mengelompokkan kelulusan mahasiswa berbasis kompetensi dengan memanfaatkan nilai indeks prestasi komulatif dan nilai kompetensi mahasiswa itu sendiri. Dari data yang diteliti, diperoleh 3 kelompok kelulusan mahasiswa berbasis kompetensi dengan nilai IPK yang telah di kembalikan ke nilai semestinya dengan membagi bilangan sebelumnya dengan sepuluh yaitu : a) Cluster 1 beranggotakan kelulusan mahasiswa dengan IPK 3,00 sampai dengan 3,17 dan Kompetensi 62,50 sampai dengan 71,50 yang jumlah anggota cluster 13. b) Cluster 2 beranggotakan kelulusan mahasiswa dengan IPK 3,00 sampai dengan 3,35 dan Kompetensi 81,00 sampai dengan 89,00 yang jumlah anggota cluster 18. c) Cluster 3 beranggotakan kelulusan mahasiswa dengan IPK 3,00 sampai dengan 3,38 dan Kompetensi 72,50 sampai dengan 79,00 yang jumlah anggota cluster 15.
6.2 Saran-saran Berdasarkan hasil penulisan yang telah dilakukan maka diharapkan penulisan selanjutnya : 1. Diharapkan dapat dikembangkan proses clustering yang dapat digunakan untuk kelulusan mahasiswa berbasis kompetensi yang berjenis laki-laki maupun perempuan, agar mempermudah pemilihan jika ada permintaan perengkrutan karyawan berdasarkan jenis kelamin. Diharapkan dapat dikembangkan proses clustering ini kedalam sebuah aplikasi data kelulusan mahasiswa berbasis kompetensi yang terintegrasi dengan sistem informasi akademik. DAFTAR PUSTAKA 1. Baskoro (2010). Implementasi Algoritma K-Means Menggunakan Data Penyewaan Alat Berat Untuk Melakukan Estimasi Nilai Outcome, Fakultas Ilmu Komputer, Universitas Pembangunan Nasional βVeteranβ, Jakarta. 2. Besdek (1981). Euclidean. dlm. Eko Prasetyo. Data Mining : Konsep dan Aplikasi Menggunakan Matlab, Yogyakarta: ANDI. 179. 3. Budi Santoso (2007), Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta : Graha Ilmu.
Berdasarkan clustering yang dilakukan diperoleh 3 cluster. Dari hasil ketiga cluster tersebut, diketahui bahwa pada cluster 2 memiliki kelulusan dengan nilai kompetensi paling tinggi dan jumlah anggota yang paling banyak dengan 18 lulusan. Dengan begitu 78
Sudi Suryadi
J. Informatika AMIK-LB Vol.3 No.2/Mei/2015
4. Cary Liniker Simbolon, Nilamsari Kusumastuti dan Beni Irawan (2013), Buletin Ilmiah Mat. Stat. Dan Terapannya (Bimaster). Clustering Lulusan Mahasiswa Matematika FMIPA UNTAN Pontianak Menggunakan Algoritma Fuzzy C-Means. 2 . 21-26 5. Carlos Ordonez (2004). Industry/Government Track Poster. Programming The K-Means Clustering Algorithm in SQL. 1-6 6. Davies, and Paul Beynon (2004). Database Systems Third Edition. Palgrave Macmillan. 7. Eko Prasetyo (2012). Data Mining : Konsep dan Aplikasi Menggunakan Matlab, Edisi 1, Yogyakarta : Andi.178201. 8. Elmasri, Ramez and Shamkant B. Navathe, (2000), βFundamentals of Database Systems. Third Editionβ, Addison Wesley Publishing Company, New York. 9. Han, Jiawei, Kamber dan Micheline (2006), Data Mining Concepts and Techniques Second Edition. 10. Iko Pramudiono (2003). Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data. Kuliah Umum IlmuKomputer.Com. 1-4 11. Mahendiran et.al, (2012), Implementation of K-Means Clustering in Cloud Computing Environment. 12. Ichael W. Trosset (2008). Department of Statistics. Representing Clusters : KMeans Clustering, Self-Organizing Maps, and Multidimensional Scaling. 8. 1-18 13. Narwati (2006), Pengelompokan Mahasiswa Menggunakan Algoritma KMeans. 1-7 14. Tan, P; Steinbach; & Kumar, (2006), V, Introduction to Data Mining. Pearson Education. 15. Tapas Kanungo et. all (2002). Ieee Transactions On Pattern Analysis And Machine Intelligence. An Efficientk-Means Clustering Algorithm: Analysis and Implementation. 24. 1-12 79
16. U.M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, (1996), Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press. 17. Tedy Rismawan dan Sri Kusumadewi (2008). Seminar Nasional Aplikasi Teknologi Informasi 2008 (SNATI 2008). Aplikasi K-Means Untuk Pengelompokan Mahasiswa Berdasarkan Body Mass Index (BMI) dan Ukuran Kerangka. E43-E47. 18. Ance Faber (1994). Los Alamos Science. Clustering and The Continuous K-Means Algorithm. 22. 1-7 19. Witten, Ian H. and Frank, Eibe, (2005), Data Mining Practical Machine Learning Tools and Techniques, Second Edition. 20. Widyawati, (2010), Perbandingan Clustering Based On Frequent Word Sequence (CFWS) Dan KMeans Untuk Pengelompokan Dokumen Berbahasa Indonesia. Fakultas Pendidikan Matematika Dan Ilmu Pengetahuan Alam, Universitas Pendidikan Indonesia, Bandung, 21.Yiu-Ming Cheung (2003). Pattern Recognition Letters. K-Means: A New Generalized K-Means Clustering Algorithm. 24. 1-11 22.Yudi Agusta (2007), Sistem dan
Informatika. K-Means Penerapan, Permasalahan dan Metode Terkait. 3. 4760.