ANALISIS DATA PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK (PPA) MENGGUNAKAN METODE DATA MINING DENGAN MENERAPKAN ALGORITMA K-MEANS CLUSTERING (STUDI KASUS: UNIVERSITAS SILIWANGI) Isma Qinwan Daniah, Acep Irham Gufroni, dan Alam Rahmatulloh Teknik Informatika Fakultas Teknik Universitas Siliwangi Tasikmalaya Email :
[email protected]
ABSTRACT Siliwangi University that provide scholarships to the students who deserves a scholarship in accordance with the determined criteria. There are some variety kind of scholarships, one of them is Academic Performance Improvement Scholarship or known as PPA. Based on the obtained data from (KASUBAG) student welvare services the criteria for PPA scholarship itself i.e. an active student who take Diploma or Bachelor courses, well behaved, currently didn’t have or proposed receiving a scholarship from another parties, a poverty (parents income should be attached), the students GPA at least 3.00, at least in the third semester and maximum in the sixth semester and an active student in students activities (extracurricular). There are many advantages from the scholarships, one of them is supporting the student who have achievers. However, a lot of problem has arose regarding to the administration, whether it is in accordance with the objectives and criteria of the administration. To resolve the problem above is by using data mining method by applying the K-Means Clustering algorithm. The purposes of this research are to categorizing data of the students who received scholarships in accordance with the determined criteria, and to provide the information that can be used as rules of the scholarships grantees. The research methodology which apllied in this research are determining the required data, collecting data, preparing the tools and research materials and then entering to the process of Data Mining by using Knowledge Discovery in Databases (KDD) i.e. data cleaning, data integration, data selection and data transformation. The result from use of data mining method by applying K-Means Clustering algorithm is yield information about categorizing data of the students who accordance with the criteria which determined as rules of the scholarship grantees. Keyword: Clustering, Data mining, K-means, Scholarship, Siliwangi University.
ABSTRAK Universitas Siliwangi merupakan Universitas yang memiliki program kerja untuk memberikan beasiswa terhadap mahasiswa yang layak mendapatkan beasiswa sesuai dengan kriteria yang telah ditentukan. Berbagai sumber beasiswa diantaranya beasiswa Peningkatan Prestasi Akademik (PPA). Berdasarkan data yang didapat dari KASUBAG Kesejahteraan Mahasiswa kriteria untuk beasiswa PPA sendiri adalah mahasiswa yang aktif kuliah dalam jenjang pendidikan Diploma dan Sarjana, berkelakuan baik, tidak sedang atau diusulkan menerima beasiswa dari sumber lain, keterangan tidak mampu (lampiran penghasilan orangtua), IPK minimal 3.00, minimal duduk di semester III dan maksimal di semester VI, Aktif dalam kegiatan kemahasiswaan (ekstrakulikuler). Banyak manfaat dari beasiswa salah satunya dapat memberi bantuan bagi mahasiswa yang memiliki prestasi. Namun timbul berbagai masalah mengenai pemberiannya, apakah sudah sesuai dengan sasaran dan kriteria dalam pemberiannya. Untuk menyelesaikan permasalahan diatas adalah menggunakan metode Data Mining dengan menerapkan algoritma K-Means Clustering. Tujuan pada penelitian ini adalah mengelompokan data mahasiswa yang menerima beasiswa sesuai dengan kriteria yang telah ditentukan dan memberikan informasi yang dapat digunakan sebagai penentu penerima beasiswa. Metedologi penelitian yang dilakukan adalah menentukan kebutuhan data yang dibutuhkan, mengumpulkan data, dan mempersiapkan alat dan bahan penelitian, kemudian masuk kedalam tahapan proses Data Mining menggunakan tahapan Knowladge Discovery in databases (KDD) yang terdiri dari Data Cleaning, Data Integration, Data Selection dan Data Transformation. Dengan menerapkan metode Data Mining menggunakan Algoritma K-Means Clustering dapat menghasilkan informasi pengelompokan data mahasiswa sesuai dengan kriteria beasiswa yang telah ditentukan sebagai penentu penerima beasiswa. Kata kunci: Beasiswa, Clustering, Data Mining, K-Means, Universitas Siliwangi. I.
Pendahuluan Setiap institusi pendidikan pasti memiliki program kerja untuk memberikan beasiswa terhadap mahasiswa yang layak mendapatkan beasiswa sesuai dengan kriteria yang telah ditentukan. Menurut Kamus Besar Bahasa Indonesia Beasiswa yaitu tunjangan uang yang diberikan kepada pelajar atau
mahasiswa sebagai bantuan biaya belajar (Depdikbud, 1990). Berdasarkan hasil wawancara dengan pihak internal Universitas Siliwangi bahwa Universitas Siliwangi merupakan Universitas yang menyediakan berbagai sumber beasiswa diataranya Bantuan Belajar Mahasiswa (BBM) Dikti, Peningkatan Prestasi 1
Akademik (PPA) Dikti, BIDIKMISI, Super semar, Ibu Try Sutrisno, Kanya Dharma Ika, PT. Djarum, PT. Pikiran Rakyat, Beasiswa Bantuan Pendidikan (B2P) Dikti/KPS. BBM, Ikatan orangtua Mahasiswa (IOM) Universitas Siliwangi, Technology and Professional Skill Development Sector Project (TPSDP), PT. Indofood Sukses Makmur Tbk, Beasiswa Peningkatan Ekstrakulikuler (PPE), Beasiswa Universitas Siliwangi, Beasiswa PT. BNI 1946, dan Beasiswa PT. Bank Mandiri Syari’ah. Banyak manfaat dari beasiswa salah satunya dapat memberi bantuan bagi mahasiswa yang memiliki prestasi. Namun timbul berbagai masalah mengenai pemberiannya, apakah sudah sesuai dengan sasaran dan kriteria dalam pemberiannya. Untuk menyelesaikan permasalahan diatas adalah menggunakan metode Data Mining dengan menerapkan algoritma K-Means Clustering. Oleh karena itu pada tugas akhir ini akan digali informasi dari penumpukan data beasiswa khususnya beasiswa PPA untuk dilakukan pengelompokan terhadap kriteria beasiswa yang ada. Berdasarkan data yang didapat dari KASUBAG Kesejahteraan Mahasiswa kriteria untuk beasiswa PPA sendiri adalah mahasiswa yang aktif kuliah dalam jenjang pendidikan Diploma dan Sarjana, berkelakuan baik, tidak sedang atau diusulkan menerima beasiswa dari sumber lain, keterangan tidak mampu (penghasilan orangtua), IPK minimal 3.00, minimal duduk di semester III dan maksimal di semester VI, Aktif dalam kegiatan kemahasiswaan (ekstrakulikuler). Untuk menyelesaikan permasalahan diatas adalah menggunakan metode Data Mining dengan menerapkan algoritma K-Means Clustering. Batasan masalah pada penelitian ini adalah Data yang diolah adalah data beasiswa khusunya beasiswa PPA periode 2010/2011 s/d 2014/2015. Analisis dilakukan untuk mengelompokan data mahasiswa berdasarkan kriteria beasiswa khususnya beasiswa PPA. Analisis dilakukan dengan menggunakan teknik clustering dan menggunakan algoritma K-Means mengikuti tahapan knowledge Discovery in Database (KDD). Informasi yang ditampilkan dari tumpukan data yang ada berupa pengelompokan mahasiswa terhadap kriteria yang ada pada PPA dan grafik dari hasil perhitungan yang telah dilakukan. Tujuan pada penelitian ini adalah mengelompokan data mahasiswa yang menerima beasiswa sesuai dengan kriteria yang telah ditentukan dan memberikan informasi yang dapat digunakan sebagai penentu penerima beasiswa. Manfaat pada penelitian ini diharapkan dapat mengetahui langkah penyelesaian dengan menggunakan algoritma K-Means Clustering. Mendapatkan informasi berupa pengelompokan data mahasiswa yang mendapat beasiswa dengan kriteria beasiswa PPA yang telah ditentukan dan dapat membantu pihak-pihak yang bersangkutan mengenai pengelompokan kriteria beasiswa sebagai penetuan beasiswa.
II. A.
Landasan Teori Beasiswa Beasiswa diartikan sebagai bentuk penghargaan yang diberikan kepada individu agar dapat melanjutkan pendidikan ke jenjang yang lebih tinggi. Penghargaan itu dapat berupa akses tertentu pada suatu institusi atau penghargaan berupa bantuan keuangan. Pada dasarnya beasiswa adalah penghasilan bagi yang menerimanya (Murniasih, Erny, 2009). B. Clustering Pada dasarya clustering terhadap data adalah suatu proses untuk mengelompokkan sekumpulan data tanpa suatu atribut kelas yang telah didefinisikan sebelumnya, berdasarkan pada prinsip konseptual clustering yaitu memaksimalkan dan juga meminimalkan kemiripan intra kelas. Misalnya, sekumpulan obyek-obyek komoditi pertama-tama dapat di clustering menjadi sebuah himpunan kelaskelas dan lalu menjadi sebuah himpunan aturanaturan yang dapat diturunkan berdasarkan suatu klasifikasi tertentu (Prasetyo, Eko, 2014). C. Data Mining Menurut Han, J. Kamber, M & Jian, Pei mengatakan bahwa “Data mining merupakan disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data (Han, J. Kamber, M & Jian, Pei, 2012). Data Mining dapat diterapkan dalam berbagai bidang yang mempunyai sejumlah data, tetapi karena wilayah penelitian dengan sejarah yang belum lama dan belum melewati masa “remaja”, maka data mining masih diperdebatkan posisi bidang pengetahuan yang memilikinya. Maka, Daryl Pregibon menyatakan bahwa “data mining adalah campuran dari statistik, kecerdasan buatan, dan riset basis data” yang masih berkembang (Gorunescu, F, 2011) Han, J. Kamber, M & Jian, Pei (2012) menyebutkan bahwa Knowladge Discovery in Database (KDD), merupakan proses terstruktur, yaitu sebagai berikut: 1. Pembersihan data (Data Cleaning). 2. Integrasi Data (Data Integration). 3. Pemilihan Data (Data Selection). 4. Transformasi Data (Data Transformation). 5. Penggalian Data (Data Mining). 6. Evaluasi Pola (Pattern Evaluation). 7. Presentasi Pengetahuan (Knowledge Presentation). D. K-Means Algoritma K-Means merupakan Algoritma pengelompokan iteratif yang melakukan partisi set data kedalam sejumlah K cluster yang sudah ditetapkan di awal. Algoritma K-Means sederhana untuk diimplementasikan dan dijalankan, relative cepat, mudah beradaptasi, umum penggunaannya dalam praktek. Secara historis, K-Means menjadi salah satu algoritma yang paling pennting dalam bidang data mining (Wu, X. and Kumar, V, 2009).
2
III. Metodologi Berikut adalah tahapan penelitian yang dilakukan adalah: 1. Pra Penelitian terdiri dari: - Menentukan kebutuhan data yang digunakan - Mengumpulkan data yang dibutuhkan - Mempersiapkan alat dan bahan penelitian 2. Pengumpulan Data, dengan melakukan observasi, wawancara, dan studi literatur. 3. Persiapan Proses Data Mining dengan tahapan KDD. 4. Proses Data Mining dengan algoritma K-Means. Mulai · · ·
Menentukan kebutuhan data yang digunakan Mengumpulkan data yang di butuhkan Mempersiapkan alat dan bahan penelitian
Observasi Data Penelitian
Studi Literatur
Data Cleaning
Mencari metode clustering yang tepat
Wawancara
Data Integration Data Selection Data Transformation
Clustering Dengan menggunakan K-Means Hasil Selesai
Gambar 3.1 Tahapan dalam Penelitian Metode Pengumpulan Data Observasi Pengumpulan data dilakukan dengan melakukan pengamatan langsung dilapangan (Universitas Siliwangi) mengenai persoalan data beasiswa khususnya beasiswa PPA. Hasil dari observasi ini mendapatkan data mahasiswa yang menerima beasiswa. 2. Wawancara Untuk mendapatkan data seakurat mungkin, proses yang dilakukan selanjutnya adalah tanya jawab secara langsung dengan pihak-pihak terkait yang berhubungan dengan bidang kajiannya. Objek wawancara diantaranya adalah Staff BAK (Badan Administrasi Kemahasiswaan) bagian KASUBAG Kesejahteraan Mahasiswa selaku staff yang mengelola data beasiswa. Sehingga dari hasil wawancara tersebut didapatkan data dan informasi yang dapat membantu proses penelitian. 3. Studi Literatur Metode yang dilakukan dengan mencari dan mengumpulkan referensi yang berkaitan dengan konsep dan algoritma data mining. Seperti, bukubuku, jurnal-jurnal karya tulis ataupun sejenisnya melalui blog, website ataupun skripsi yang telah selesai dikerjakan sebelumnya. Dan mempelajari literatur berkaitan dengan teori clustering yang menggunakan algoritma K-Means. A. 1.
B. 1.
Persiapan Data Mining Data Cleaning Data Cleaning merupakan proses untuk dapat mengatasi nilai yang hilang, noise dan data yang tidak konsisten (Han, J. Kamber, M & Jian, Pei, 2012). Dari data beasiswa yang didapatkan selama empat tahun kebelakang dari tahun periode 2011/2012 sampai dengan 2014/2015 dengan jumlah data 236 record. Masing masing data tahun 2011/2012 sejumlah 40 record, tahun 2012/2013 sejumlah 53 record, tahun 2013/2014 sejumlah 43 record dan tahun 2014/2015 sejumlah 100 record data. Sesuai dengan kriteria penerima beasiswa PPA maka data yang lengkap adalah data beasiswa tahun akademik 2014/2015. Data beasiswa tahun 2014/2015 memiliki 13 atribut yaitu, NPM, KDPTI, Jenis Beasiswa, Counter, Nama_Mhs, JK, Kode_prodi, Id_jenjang, Smt, IPK, Kode_pekerjaan, Jml_Tanggungan, dan penghasilan. 2. Data Integration Data Integration merupakan proses menggabungkan data dari banyak database atau data warehouse. Proses ini dapat membantu mengurangi data redundan dan data yang tidak konsisten yang disebabkan pengambilan data dari banyak sumber data. Hal ini tentu saja akan berpengaruh terhadap kecepatan dan akurasi saat melakukan data mining (Han, J. Kamber, M & Jian, Pei, 2012). 3. Data Selection Data Selection atau Data Reduction merupakan proses meminimalkan jumlah data yang digunakan untuk proses mining dengan tetap merepresentasikan data aslinya. Mengurangi jumlah data yang digunakan untuk proses mining akan lebih efisien mengingat hasil yang didapatkan sama (atau hampir sama) secara analitikal (Han, J. Kamber, M & Jian, Pei, 2012). 4. Data Transformation Data Transformation dilakukan untuk mengubah bentuk data menjadi format data yang dapat diketahui oleh Data Mining Tools. Hal ini tentunya akan sangat membantu memudahkan pengguna dalam proses mining ataupun memahami hasil yang didapat (Han, J. Kamber, M & Jian, Pei, 2012). 5. Knowladge Presentation Setelah dilakukan pengelompokan menggunakan algoritma K-Means maka diperoleh Knowladge Presentation yang dapat mempresentasikan informasi yang telah didapatkan. C.
Proses Data Mining K-Means Langkah-langkah melakukan clustering dengan metode K-Means menurut (Santosa, 2007) adalah sebagai berikut: 1. Tentukan jumlah cluster k. 2. Alokasikan data kedalam cluster secara random. 3. Hitung centroid/rata-rata dari data yang ada di masing-masing cluster. 4. Alokasikan masing-masing data ke centroid/ratarata terdekat.
3
5.
Kembali ke step 3, apabila masih ada data yang berpindah cluster.
IV. Hasil dan Pembahasan A. Data Cleaning Berikut adalah kolom-kolom yang di cleaning beserta alas an kenapa kolom tersebut mengalami proses cleaning: a. Kolom “KDPTI”. Kolom ini dihilangkan karena sifatnya sama dari tiap data yang ada. b. Kolom “Jenis_beasiswa”. Kolom ini dihilangkan karena jenis beasiswa ini telah ditentukan sebelumnya bahwa jenis beasiswa yang akan dilakukan analisis adalah jenis beasiswa PPA. c. Kolom “JK”. Kolom ini dihilangkan karena bersifat sama dengan atribut nama mahasiswa. d. Kolom “ID_jenjang”. Kolom ini dihilangkan karena tidak berpengaruh terhadap penentuan kriteria pada data beasiswa. e. Kolom “Jumlah_Tanggungan”. Kolom ini dihilangkan karena tidak diperlukan terhadap atribut pengelompokan pada kriteria beasiswa. B. Data Integration Data set yang telah melalui proses cleaning perlu di integrasikan karena data beasiswa tahun akademik 2011/2012 sampai dengan 2014/2015 masih bisa disebut terpisah, namun setelah dilakukan data cleaning tidak ada data yang perlu di integrasikan. C. Data Selection Dari 236 data. Masing masing data tahun 2011/2012 sejumlah 40 record, tahun 2012/2013 sejumlah 53 record, tahun 2013/2014 sejumlah 43 record dan tahun 2014/2015 sejumlah 100 record data. Dari semua data yang ada data yang digunakan adalah data beasiswa tahun akademik 2014/2015 yang mendekati data lengkap sesuai dengan kriteria yang telah dilakukan. Adapun atribut yang akan digunakan adalah no, nama, prodi, semester, ipk, pekerjaan dan penghasilan. D. Data Transformation Pada tahapan transformation tidak dilakukan karena data yang ada sudah berbentuk nominal dan tidak dilakukan inisialisasi terhadap data yang ada. E. Proses Pengelompokan Algoritma K-means 1. Menentukan Jumlah Cluster Pengelompokan data beasiswa PPA tahun akademik 2014/2015 ini memiliki 3 kriteria. Kriteria pertama yaitu Indeks Prestasi Kumulatif (IPK) dengan jumlah cluster yang dibuat adalah 3 cluster, cluster pertama yaitu kelompok dengan IPK rendah, cluster 2 dengan kelompok IPK sedang dan cluster 3 dengan kelompok IPK tinggi. Kriteria kedua yaitu Semester dengan jumlah cluster 3, kelompok pertama semester rendah, kelompok kedua semester sedang, dan kelompok 3 semester tinggi diatas semester 6. Kriteria yang ketiga yaitu penghasilan orangtua dengan jumlah cluster 3, kelompok pertama penghasilan rendah, kelompok kedua penghasilan sedang dan kelompok ketiga dengan penghasilan orangtua tinggi.
2.
Menentukan Titik Pusat Awal Cluster (Centroid) Untuk menentukan titik pusat awal cluster dilakukan dengan cara menghitung hasil rata-rata dari tiap atribut. Tabel 4.1 Nilai rata-rata kelompok IPK pada data beasiswa. Cluster 1 2 3 IPK 3.375 3.620 3.765 Tabel 4.2 Nilai rata-rata kelompok Semester pada data beasiswa. Cluster 1 2 3 Semester 2 4 6 Table 4.3 Nilai rata-rata kelompok Penghasilan pada data beasiswa Cluster 1 2 3 Penghasilan 1.000.000 1.500.000 3.000.000 Pekerjaan 5 3 2 3. Menghitung Jarak ke Masing-masing Centroid Setelah didapatkan titik pusat awal cluster, kemudian menghitung jarak setiap data kepusat cluster dengan menggunakan perhitungan Euclidean. a. Indeks Prestasi Kumulatif (IPK) Hasil perhitungan jarak Euclidean pada titik pusat cluster 1 (3.375)
Lakukan perhitungan yang sama sampai data ke 100 Hasil perhitungan jarak Euclidean pada titik pusat cluster 2 (3.620)
Lakukan perhitungan yang sama sampai data ke 100 Hasil perhitungan jarak Euclidean pada titik pusat cluster 3 (3.765)
Lakukan perhitungan yang sama sampai data ke 100 Setelah dilakukan perhitungan jarak Euclidean dan mengelompokkan berdasarkan jarak terkecil selanjutnya akan didapat nilai centroid baru untuk acuan perhitungan berikutnya sampai nilai centroid sebelum dan sesudahnya bernilai sama.
4
Tabel 4.4 Nilai Centroid iterasi 1 Cluster Titik Pusat Awal Iterasi 1 Centroid IPK IPK Cluster 1 3.375 3.267 Cluster 2 3.620 3.607 Cluster 3 3.765 3.816 Pada iterasi 1 diperoleh nilai centroid baru dengan titik pusat awal tidak sama, maka perlu dilakukan perhitungan untuk iterasi ke 2 dan selanjutnya sampai centroid bernilai sama. Tabel 4.5 Nilai Centroid iterasi 11 Cluster Iterasi 10 Iterasi 11 Centroid IPK IPK Cluster 1 3.089 3.089 Cluster 2 3.453 3.453 Cluster 3 3.782 3.782 Hasil perhitungan berhenti di iterasi yang ke 11. Terlihat seperti dalam tabel diatas bahwa centroid sebelum dan sesudahnya bernilai sama. b. Semester Hasil perhitungan jarak Euclidean pada titik pusat cluster 1 (2)
Lakukan perhitungan yang sama sampai data ke 100 Hasil perhitungan jarak Euclidean pada titik pusat cluster 2 (4)
Lakukan perhitungan yang sama sampai data ke 100 Hasil perhitungan jarak Euclidean pada titik pusat cluster 3 (6)
Lakukan perhitungan yang sama sampai data ke 100 Sama halnya dengan kriteria terhadap IPK, pada kriteria semester juga dilakukan perhitungan jarak Euclidean yang sama dan mengelompokkan berdasarkan jarak terkecil selanjutnya akan didapat nilai centroid baru untuk acuan perhitungan berikutnya sampai nilai centroid sebelum dan sesudahnya bernilai sama.
Tabel 4.6 Nilai Centroid Iterasi 1 Cluster Titik Pusat Awal Iterasi 1 Centroid Semester Semester Cluster 1 2 2 Cluster 2 4 4 Cluster 3 6 6.37037037 Tabel 4.7 Nilai Centroid Iterasi 2 Cluster Iterasi 1 Iterasi 2 Centroid Semester Semester Cluster 1 2 2 Cluster 2 4 4 Cluster 3 6.37037037 6.37037037 Pada iterasi 1 diperoleh nilai centroid baru dengan titik pusat awal ada 2 cluster yang sama pada iterasi 1 yaitu pada cluster 1 dan 2, maka perlu dilakukan perhitungan untuk iterasi ke 2 dan selanjutnya sampai centroid bernilai sama. Namun pada kriteria semester ini hanya berhenti sampai iterasi ke 2 saja karena nilai pada tiap cluster bernilai sama. c. Penghasilan Orangtua Hasil perhitungan jarak Euclidean pada titik pusat cluster 1 (1000000 , 5)
Lakukan perhitungan yang sama sampai data ke 100 Hasil perhitungan jarak Euclidean pada titik pusat cluster 2 (1500000 , 3)
Lakukan perhitungan yang sama sampai data ke 100 Hasil perhitungan jarak Euclidean pada titik pusat cluster 3 (3000000 , 2)
Lakukan perhitungan yang sama sampai data ke 100 Sama halnya dengan kriteria terhadap IPK dan semester, pada kriteria penghasilan juga dilakukan perhitungan jarak Euclidean yang sama dan mengelompokkan berdasarkan jarak terkecil selanjutnya akan didapat nilai centroid baru untuk acuan perhitungan berikutnya sampai nilai centroid sebelum dan sesudahnya bernilai sama.
5
Tabel 4.8 Nilai Centroid Iterasi 1
Pada iterasi 1 diperoleh nilai centroid baru dengan titik pusat awal tidak sama, maka perlu dilakukan perhitungan untuk iterasi ke 2 dan selanjutnya sampai centroid bernilai sama. Tabel 4.9 Nilai Centroid Iterasi 7
Hasil perhitungan berhenti di iterasi yang ke 7. Terlihat seperti dalam tabel diatas bahwa centroid sebelum dan sesudahnya bernilai sama. F. Hasil K-Means Pada Data Beasiswa PPA Tahun Akademik 2014/2015 Tabel 4.10 Tabel Hasil K-Means pada Data Beasiswa KRITERIA 1 2 3 IPK 17 33 50 SEMESTER 13 33 54 PENGHASILAN 22 25 53 G. Knowladge Presentation 1. Indeks Prestasi Kumulatif (IPK) Cluster 1 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 1 ini terdapat 17 mahasiswa yang mempunyai IPK kurang. Pada kelompok ini IPK terendah yaitu 2.84 sedangkan IPK tertingginya yaitu 3.27. Berdasarkan kriteria yang telah ditentukan sebelumnya adalah IPK minimal 3.00 pada kelompok ini seharunya ada 3 orang yang IPK kurang dari 3 yaitu dengan IPK 2.84, 2.90 dan 2.94. Nilai centroid akhir pada cluster ini adalah 3.089. Cluster 2 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 2 ini terdapat 33 mahasiswa yang mempunyai IPK sedang. Pada kelompok ini IPK terendah yaitu 3.07 sedangkan IPK tertingginya yaitu 3.61. Nilai centroid akhir pada cluster ini adalah 3.453. Cluster 3 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 3 ini terdapat 50 mahasiswa yang mempunyai IPK tinggi. Pada kelompok ini IPK terendah yaitu 3.33 sedangkan IPK tertingginya yaitu 4.00. Nilai centroid akhir pada cluster ini adalah 3.782. 2. Semester Cluster 1 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 1 ini terdapat 13 mahasiswa yang mempunyai semester kurang dari kriteria yang telah ditentukan. Pada kelompok ini seluruh mahasiswa duduk di semester 2. Nilai centroid akhir pada cluster ini adalah 2.
Cluster 2 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 2 ini terdapat 33 mahasiswa yang mempunyai semester seseuai dengan kriteria yang telah ditentukan. Pada kelompok ini seluruh mahasiswa duduk di semester 4. Nilai centroid akhir pada cluster ini adalah 4. Cluster 3 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 3 ini terdapat 54 mahasiswa yang mempunyai semester lebih dari kriteria yang telah ditentukan. Pada kelompok ini seluruh mahasiswa duduk di semester 6 dan 8. Nilai centroid akhir pada cluster ini adalah 6.37037037. 3. Penghasilan Orangtua Cluster 1 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 1 ini terdapat 22 mahasiswa yang orangtuanya mempunyai penghasilan tinggi. Pada kelompok ini penghasilan orangtua yang terendah yaitu 2.000.000 sedangkan penghasilan orangtua tertingginya yaitu 5.330.600. Pada kelompok ini pekerjaan orangtua mengacu pada kode_pekerjaan 1 dan 2 yaitu PNS/Pegawai Negara dan Pegawai Swasta. Nilai centroid akhir pada cluster ini adalah (4.267.548.18 , 1.36) Cluster 2 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 2 ini terdapat 25 mahasiswa yang orangtuanya mempunyai penghasilan tinggi. Pada kelompok ini penghasilan orangtua yang terendah yaitu 1.700.000 sedangkan penghasilan orangtua tertingginya yaitu 3.168.300. Pada kelompok Nilai centroid akhir pada cluster ini adalah (2.232.548.12 , 3.00). Cluster 3 Berdasarkan hasil perhitungan algoritma KMeans pada cluster 3 ini terdapat 53 mahasiswa yang orangtuanya mempunyai penghasilan tinggi. Pada kelompok ini penghasilan orangtua yang terendah yaitu 500.000 sedangkan penghasilan orangtua tertingginya yaitu 1.500.000. Pada kelompok Nilai centroid akhir pada cluster ini adalah (1.042.641.51 , 4.57). H. Kelebihan dan Kekurangan Penelitian Kelebihan dari penelitian yang telah dilakukan adalah sebagai berikut: 1. Menentukan kriteria beasiswa sebagai penentu penerimaan beasiswa khususnya beasiswa PPA. 2. Dapat mengelompokan data mahasiswa yang menerima beasiswa sesuai dengan kriteria yang telah ditentukan. Beberapa kriteria yang ada yaitu IPK dengan ketentuan IPK mahasiswa yang mendapatkan beasiswa minimal 3.00, mahasiswa minimal duduk disemester III dan maksimal duduk di semester VI, dan keterangan tidak mampu (penghasilan orangtua). 3. Menghasilkan grafik jumlah data mahasiswa yang sesuai dengan kriteria penerima beasiswa. 6
Kekurangan dari penelitian yang telah dilakukan adalah sebagai berikut: 1. Data yang didapatkan dari KASUBAG Kesejahteraan Mahasiswa tidak lengkap sesuai dengan kriteria beasiswa PPA yang ada. 2. Ada beberapa kriteria seperti aktif kuliah, berkelakuan baik, keterangan tidak menerima beasiswa lain, dan aktif organisasi yang tidak bisa dilakukan pengelompokan seperti penghasilan orang tua, semester dan IPK. 3. Penentuan centroid (titik pusat) pada tahap awal sangat berpengaruh pada hasil cluster seperti pada hasil pengujian yang dilakukan dengan menggunakan data yang sama dengan centroid yang berbeda dan menghasilkan cluster yang berbeda juga. V. A. 1.
2.
3.
B. 1.
2.
Kesimpulan dan Saran Kesimpulan Dengan menerapkan metode Data Mining dapat mengelompokan data mahasiswa yang mendapatkan beasiswa berdasarkan kriteria yang telah ditentukan sebelumnya dengan menggunakan Algoritma K-Means. Kebanyakan mahasiswa yang mendapat beasiswa adalah IPK diatas 3.00 atau IPK tinggi dengan jumlah mahasiswa adalah sebanyak 50 orang, kriteria kedua adalah minimal duduk d semester III dan maksimal duduk di semester VI, berdasarkan hasil rata-rata mahasiswa duduk di semester 6 dengan jumlah mahasiswa adalah 54 orang, dan penghasilan orang tua yang dikatakan tidak mampu adalah sebanyak 53 orang. Jadi mahasiswa yang menerima beasiswa dikatakan telah sesuai dengan kriteria yang ada di Universitas Siliwangi. Dari hasil yang ada telah didapatkan informasi berupa kelompok mahasiswa yang layak menerima beasiswa sesuai dengan kriteria yang telah ditentukan, yang diharapakan untuk periode selanjutnya tidak ada mahasiswa yang menerima beasiswa tidak sesuai dengan kriteria. Saran Dilakukan analisis dan perhitungan yang sama dengan menggunakan metode Data Mining namun dengan menggunakan algoritma yang berbeda sehingga dapat dilakukan perbandingan terhadap hasil yang didapatkan. Hasil analisis yang ada dibuat aplikasi untuk membantu pihak yang bersangkutan sebagai penentu penerima beasiswa selanjutnya.
Gorunescu, F. 2011. Data Mining – Concepts, Models and Techniques. New York : Springer – Verlag. Han, J. Kamber,M & Jian, Pei. 2012. Data Mining Concept and Techniques, third edition. America. Morgan Kaufmann, San Fancisco. Murniasih, Erny. 2009. Buku Pintar Beasiswa. Jakarta. Gagas Media. Muzakir, Ari. 2014. Analisa dan Pemanfaatan Algoritma K-Means Clustering Pada Data Nilai Siswa sebagai penentuan Penerima Beasiswa. Fakultas Ilmu Komputer, Universitas Bina Darma Palembang. Prasetyo, Eko. 2014. DATA MINING – Mengelola Data menjadi informasi Menggunakan Matlab. Yogyakarta: CV. ANDI OFFSET. Santosa, B. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu. Wu, X. and Kumar,V. 2009. The Top Ten Algorithms in Data Mining. London:CRC Press Taylor & Francis Group.
DAFTAR PUSTAKA Depdikbud. 1990. Kamus Besar Bahasa Indonesia. Jakarta : Balai Pustaka. Direktorat Jendral Pembelajaran dan Kemahasiswaan. 2015. Pedoman Umum Beasiswa dan Bantuan Belajar Pendidikan Peningkatan Prestasi Akademik (PPA). Jakarta.
7