Artikel Skripsi Universitas Nusantara PGRI Kediri
IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA
SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Teknik Informatika
OLEH : NISIA YUANITA NPM : 12.1.03.02.0017
FAKULTAS TEKNIK (FT) UNIVERSITAS NUSANTARA PERSATUAN GURU REPUBLIK INDONESIA UN PGRI KEDIRI 2016 Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
simki.unpkediri.ac.id || 1||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
simki.unpkediri.ac.id || 2||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
simki.unpkediri.ac.id || 3||
Artikel Skripsi Universitas Nusantara PGRI Kediri
IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA Nisia Yuanita 12.1.03.02.0017 Teknik – Teknik Informatika nesya.yuan0129 Ahmad Bagus Setiawan, S.T., M.Kom., M.M dan Risky Aswi Ramadhani, M.Kom UNIVERSITAS NUSANTARA PGRI KEDIRI
ABSTRAK
Dalam membagi kelas siswa sering kali dijumpai sistem yang digunakan masih manual sehingga pembagian kelas menjadi tidak merata. Hal tersebut memungkinkan terjadi persaingan yang tidak sehat baik antar siswa dan antar kelas sehingga dinilai kurang efektif dan efisien. Permasalahan penelitian ini adalah (1) Bagaimana cara membangun aplikasi guna membantu pengambilan keputusan untuk pengelompokan dan pembagian kelas siswa? (2) Bagaimana mengimplementasikan K-Means untuk pengelompokan dan pembagian kelas siswa secara merata ? Penelitian ini menggunakan nilai UTS siswa kelas VII semester gasal MTs Sunan Ampel yang terdiri dari nilai bidang studi matematika, bahasa indonesia, bahasa inggris, dan ilmu pengetahuan alam. Kesimpulan penelitian ini adalah (1) Dihasilkan sebuah aplikasi untuk pengelompokan kelas siswa menggunakan metode k-means. (2) Dari sampel 150 siswa, 51 siswa masuk di kelas A, 50 siswa masuk di kelas B, dan siswa dengan jumlah 49 masuk di kelas C. Berdasarkan simpulan hasil penelitian ini direkomendasikan : (1) Jumlah sampel dan penambahan variabel lebih di perbanyak. (2) Menggunakan perangkat lunak lain dan algoritma lain seperti Fuzzy Clustering dan K-Means++.
Kata Kunci : Data Mining, K-Means Clustering, Pembagian Kelas.
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
simki.unpkediri.ac.id || 4||
Artikel Skripsi Universitas Nusantara PGRI Kediri
I.
pengelompokkan
LATAR BELAKANG Ilmu
pengetahuan
dan
secara
merata
berdasarkan kriteria nilai yang sudah
teknologi mempunyai peranan yang
ditentukan.
sangat penting dalam pertumbuhan era
globalisasi.
Hal
mendorong
tersebut
upaya-upaya
pemanfaatan
teknologi
II.
METODE A. Data Mining
dalam
Data mining diartikan
berbagai bidang kehidupan, salah
sebagai pengekstrakan informasi
satunya adalah membangun suatu
baru
sistem yang dapat dimanfaatkan
bongkahan
untuk pembagian kelas siswa.
membantu dalam pengambilan
Pembagian kelas di MTs Sunan
Ampel
saat
ini
masih
yang
diambil data
dari
besar
yang
keputusan (Tan, 2006). B. K-Means
menggunakan sistem manual. Agar
K-Means
pembagian kelas dalam tiap-tiap
salah
tingkat
maka
clustering non hierarki yang
dibutuhkan sebuah alat bantu untuk
berusaha mempartisi data yang
memudahkan
dalam
ada ke dalam bentuk satu atau
pembagian kelas siswa. Data yang
lebih cluster/kelompok. (Agusta,
dibutuhkan untuk Pembagian kelas
2007).
lebih
merata,
pekerjaan
siswa berupa nilai akademik yang
satu
merupakan metode
data
Pengelompokan
data
meliputi bidang studi Matematika,
dengan metode K-Means secara
Bahasa Indonesia, Bahasa Inggris,
umum
dan Ilmu Pengetahuan Alam. Nilai-
algoritma sebagai berikut :
nilai tersebut diambilkan dari nilai
1.
Pilih jumlah klaster k.
UTS tingkat VII pada semester gasal.
2.
Inisialisasi k pusat cluster
dilakukan
dengan
Tujuan membangun sebuah
ini bisa dilakukan dengan
sistem untuk pembagian kelas agar
berbagai cara. Yang paling
dapat dijadikan sebagai alat bantu
sering
untuk mempermudah admin dalam
dengan cara random. Pusat-
pembagian kelas siswa. Agar sistem
pusat cluster diberi nilai
yang
awal dengan angka-angka
akan
diterapkan digunakan
dibangun dengan
baik,
K-Means
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
berhasil maka
dilakukan
adalah
random.
untuk simki.unpkediri.ac.id || 2||
Artikel Skripsi Universitas Nusantara PGRI Kediri
3.
Tempatkan
setiap
data/
kembali lagi ke langkah
obyek ke cluster terdekat.
nomor
Kedekatan
cluster
dua
ditentukan
obyek
berdasarkan
3
sampai tidak
pusat berubah
lagi.(Santosa, 2007).
jarak kedua objek tersebut. Demikian juga kedekatan
CONTOH KASUS :
suatu data ke cluster tertentu
pengelompokan
ditentukan jarak antara data
menggunakan
dengan pusat cluster. Dalam
Clustering,
tahap ini perlu dihitung
beberapa data siswa kelas VII
jarak tiap data ke tiap pusat
semester gasal dengan parameter-
cluster. Jarak paling dekat
parameter sebagai berikut :
antara satu data dengan satu
Jumlah Cluster : 3
cluster
akan
Jumlah data : 12
data
Jumlah atribut : 4 meliputi bidang
tertentu
menentukan
4.
suatu
siswa K-Means
maka
dibutuhkan
masuk dalam cluster mana.
studi
Hitung
Indonesia, Bahasa Inggris, dan
kembali
pusat
cluster dengan keanggotaan
data/objek
dalam
cluster
tertentu.
Jika
Nama Siswa
Mat
Bind
Bing
Ipa
Abil Oktaviano
72
84
83
86
Afif Nur Rifai
80
72
82
80
Alfredo Sundy
75
80
80
84
bisa
juga
Ahmat Nur
82
82
73
80
median
dari
Akhmad Alan
80
70
82
83
Aminiya Ulfa
82
80
87
88
dikehendaki memakai
Bahasa
Tabel 1. nilai siswa
cluster adalah rata-rata dari semua
Matematika,
IPA
cluster yang sekarang. Pusat
cluster tersebut. Jadi rata-
Anwar Azis
78
81
83
82
rata (mean) bukan satu-
Apriliani Fira
80
85
80
82
satunya ukuran yang bisa
Detik Kusuma
82
80
85
85
Devon Fahreza
72
82
83
85
Difa Galih
80
80
80
82
Difan Ade
84
82
85
86
dipakai. 5.
kelas
Tugaskan lagi setiap objek dengan
memakai
pusat
cluster yang baru. Jika pusat cluster sudah tidak berubah lagi,
maka
proses
pengclusteran selesai. Atau, Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
Iterasi ke-1 1.
Penentuan pusat awal cluster Penentuan awal pusat cluster menggunakan nilai dari beberapa data siswa secara random / acak
simki.unpkediri.ac.id || 3||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Tabel 2. Pusat Cluster
2.
C1
80
80
81
81
Anwar Azis
3,16
5
6,16
C2
82
81
80
82
Apriliani Fira
4,24
4,47
7,549
C3
76
81
80
87
Detik Kusuma
6
5,91
8,12
Perhitungan jarak pusat cluster
Devon Fahreza
9,38
10,90
5,47
Untuk pengukuran jarak antara
Difa Galih
1,41
2,236
6,48
data
dengan
digunakan
pusat
Euclidean
Difan Ade
cluster
Setiap
Distance
7,81
kolom
6,78
9,53
pada
mariks
menunjukkan nilai jarak data
dengan rumus :
terhadap
pusat
cluster.
Baris
pertama pada matriks menunjukan √∑
nilai jarak data terhadap titik pusat cluster pertama, baris kedua
: Pusat Cluster
pada matriks menunjukkan nilai
: Data
jarak data terhadap titik pusat
Berikut
adalah
perhitungan
cluster kedua dan seterusnya.
menggunakan euclidean distance
3.
Pengelompokan data
dari data ke-1 terhadap pusat
Jarak hasil dari perhitungan akan
cluster :
dilakukan
C1
dipilih jarak terdekat antara data
=
perbandingan
dan
dengan pusat cluster, jarak ini √
menunjukkan bahwa data tersebut berada
dalam
satu
kelompok
=√
dengan pusat cluster terdekat.
= √
Berikut ini akan ditampilkan data
= √
matriks pengelompokan group. GI =
yang kemudian akan didapatkan
Tabel 4. Jarak Terdekat Dengan
matriks jarak sebagai berikut :
Pusat Cluster
D1 = C1
Tabel 3. Hasil Perhitungan Jarak Nama Siswa
C1
C2
C3
Abil Oktaviano
10,44
11,57
5,91
Afif Nur Rifai
8,12
9,64
12,24
Alfredo Sundy
6,16
7,34
3,31
Ahmat Nur
8,54
7,34
11,61
Akhmad Alan
81,63
11,40
12,52
Aminiya Ulfa
81,24
9,27
9,32
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
80
72
82
C2
C3 72
84
83
86
75
80
80
84
80
78
81
83
82
80
85
80
82
82
82
73
80
80
70
82
83
82
80
87
88
simki.unpkediri.ac.id || 4||
Artikel Skripsi Universitas Nusantara PGRI Kediri
data anggota tiap-tiap 82
80
85
sesuai
85 72
80
80
80
82
83
85
anggota
82 84
82
85
dengan
cluster
rumus
cluster
pusat
sehingga
didapatkan perhitungan:
86
Tabel 5. Pusat Cluster Baru Keterangan :
C1
79,5
80
81,25
81,5
a. Jika nilai D1 lebih dekat
C2
82
79
82,4
84,4
jaraknya dengan nilai hasil
C3
73
82
82
85
perhitungan data cluster ke-1 Iterasi ke-2
(C1) atau data cluster ke-2
Ulangi langkah pertama pada
(C2) atau data cluster ke-3
iterasi ke-2 hingga iterasi ke... N
(C3) maka GI bernilai 0 dan tidak
termasuk
group
hingga
/
berikut :
dari nilai hasil perhitungan
Tabel 6. Hasil Clustering
data cluster ke-1 (C1) atau
Nama Siswa
data cluster ke-2 (C2) atau
Abil Oktaviano
data cluster ke-3 (C3) dan 0
tidak
diperoleh hasil Clustering sebagai
nilai D1 lebih jauh jaraknya
selain
data
mengalami perubahan,, sehingga
kelompok cluster baru. Jika
bernilai
posisi
Afif Nur Rifai Alfredo Sundy
maka
Ahmat Nur
termasuk kelompok cluster
Akhmad Alan Aminiya Ulfa
baru.
Anwar Azis
b. Jika DI lebih jauh jaraknya
Apriliani Fira Detik Kusuma
dari nilai hasil perhitungan
Devon Fahreza
data cluster ke-1 (C1) atau
Difa Galih
data cluster ke-2 (C2) atau
Difan Ade
Cluster C3 C1 C1 C1 C2 C2 C1 C1 C2 C3 C1 C2
data cluster ke-3 (C3) maka GI bernilai selain 0 dan termasuk group / kelompok
Setelah diketahui anggota tiapcluster,
kemudian
Berdasarkan penelitian yang
maka dihasilkan sebuah aplikasi
Penentuan pusat cluster baru
tiap
HASIL DAN KESIMPULAN
dilakukan di MTs Sunan Ampel,
cluster baru. 4.
I.
pusat
cluster baru dihitung berdasarkan
untuk pengelompokan kelas siswa menggunakan teknik data mining dengan metode k-means. Variabel yang digunakan adalah nilai UTS
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
simki.unpkediri.ac.id || 5||
Artikel Skripsi Universitas Nusantara PGRI Kediri
pada semester gasal meliputi bidang
Jogiyanto. 2010. Analisis dan Desain
studi Matematika, Bahasa Indonesia,
Sistem Informasi. Yogyakarta :
Bahasa
Andi.
Inggris,
dan
Ilmu
Pengetahuan Alam. Data siswa yang digunakan
untuk
pengelompokan
Mardiani.
2014.
Perbandingan
algoritma K-Means dan EM
kelas yaitu data siswa tingkat VII
untuk
yang berjumlah 150 data. Siswa
mahasiswa berdasarkan asal
dengan jumlah 51 menempati kelas
sekolah. STMIK GI MDP
A,
siswa
dengan
jumlah
menempati kelas B,
50
dan siswa
clusterisasi
Muzakir, Ari. 2014. Analisa dan pemanfaatan
algoritma
K-
dengan jumlah 49 menempati kelas
Means Clustering pada data
C.
nilai siswa sebagai penentu penerima
II.
nilai
Universitas
DAFTAR PUSTAKA Agusta,
Y.
2007.
Penerapan,
K-Means
–
Permasalahan,
dan Metode Terkait. Arikunto,
S.
Prosedur Pendekatan
Praktik. Jakarta : Rineka Cipta. Eka
,Fenty,
et.
Implementasi Means
al.
2015.
algoritma
untuk
K-
menentukan
Bina
Darma
Palembang. Nugroho,
B.
2005.
Relational
2013.
Penelitian-Suatu
beasiswa.
dengan
Database MySQL.
Yogyakarta : Andi Parno, 2012. Data Flow Diagram. Prasetyo, E. 2012. Data MiningKonsep
dan
Menggunakan
Aplikasi Matlab.
Yogyakarta : Andi.
kelompok pengayaan materi
Santosa, B. 2007. Data Mining-
mata pelajaran ujian nasional.
Teknik Pemanfaatan Data
Universitas
untuk
Islam
Negeri
Syarif Hidayatullah. Febriani,
Lusia.
et,
Pengelompokan
Keperluan
Bisnis.
Yogyakarta : Graha Ilmu al.
2012.
Suprihatin.
2011.
Klastering
K-
mahasiwa
Means untuk penentuan nilai
sistem informasi berdasarkan
ujian. Yogyakarta : Universitas
tingkat kompetensi akademik
Ahmad Dahlan.
dengan Fuzzy K-Means.
Nisia Yuanita | 12.1.03.02.0017 Teknik – Teknik Informatika
simki.unpkediri.ac.id || 6||