Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
PENENTUAN NOMINASI CALON PESERTA PROGRAM PENYIAPAN CALON KEPALA SEKOLAH MENGGUNAKAN METODE K-MEANS CLUSTERING BERBASIS WEKA Agustin Sri Murdiana1), I Ketut Eddy Purnama2), dan Surya Sumpeno3) Program Studi Teknik Elektro, Program Keahlian Telematika CIO Fakultas Teknologi Industri, ITS, Surabaya Kampus ITS Keputih, Sukolilo, Surabaya 60111, Jawa Timur e-mail: 1)
[email protected]
ABSTRAK Kepala Sekolah adalah salah satu unsur dalam komponen tenaga kependidikan yang mempunyai tumpuan dalam peningkatan mutu pendidikan secara nasional. Oleh karena itu pemerintah mencanangkan program penyiapan kepala sekolah yang meliputi nominasi rekrutmen, seleksi administratif, seleksi akademis serta pendidikan dan pelatihan calon kepala sekolah. Sistem yang selama ini dipakai dalam penentuan nominasi peserta adalah administrasi manual melalui pemilahan dengan program excell. Tetapi karena keterbatasan keterbacaan pengurutan dan melibatkan obyek data yang banyak, maka permasalahan yang sering terjadi adalah banyaknya data yang tumpang tindih serta azas keadilan terabaikan. Pada penelitian ini bertujuan untuk membuat sistem otomatisasi daftar nominasi dengan menggunakan clustering (pengklasteran) dengan metode K-Means Clustering dengan software WEKA 3.6.2 yang dianggap mampu mendukung penetapan daftar peserta nominasi rekrutmen dalam penerbitan pengambilan keputusan. Pembuatan aplikasi ini mengacu pada Permendiknas No. 28 Tahun 2010. Dataset yang dipakai adalah data pendidik pada Kota Mojokerto yang diperoleh dari database SIMNUPTK Padamu Negeri dengan menggunakan 11 (sebelas) atribut yaitu: usia, kualifikasi pendidikan, masa kerja, pangkat dan golongan, unit kerja, sertifikasi pendidik, DP3, PKG, pengembangan profesi, prestasi dan permasalahan hukum. Skema kerja penelitian ini meliputi: pengumpulan data, pemilihan data sesuai parameter, pembersihan data, konversi data ke skala numerik, proses k-means clustering sampai akhirnya terbentuk kluster pengelompokkan yang diinginkan. Dari hasil pengolahan data dihasilkan 3 (tiga) kluster yang mampu mewakili analisa data yaitu kluster tidak rekomendasi dengan jumlah anggota kluster sebanyak 44%, dan kluster direkomendasikan sebanyak 17% dan kluster paling direkomendasikan sebesar 39%. Kata kunci: Program Penyiapan Calon Kepala Sekolah, Permendiknas No. 28 Tahun 2010, SIMNUPTK Padamu Negeri, K-Means Clustering, WEKA 3.6.2.
PENDAHULUAN Kepala Sekolah adalah salah satu unsur dalam komponen tenaga kependidikan yang mempunyai peranan penting dalam menunjang proses pembelajaran di satuan pendidikan yang pada akhirnya bermuara untuk meningkatkan mutu pendidikan secara nasional. Sesuai dengan Permendiknas No. 28 Tahun 2010 bahwa guru yang mendapat tugas tambahan sebagai kepala sekolah adalah guru yang telah memenuhi persyaratan umum dan khusus serta telah mendapatkan sertifikat kelulusan program penyiapan kepala sekolah dari lembaga yang yang ditunjuk dan ditetapkan oleh menteri. Lembaga Penjaminan Mutu Pendidikan (LPMP) ISBN: 978-602-70604-2-5 C-7-1
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
sebagai unit pelaksana teknis di tiap provinsi dari Kementrian Pendidikan dan Kebudayaan mempunyai kewajiban untuk mengawal kebijakan Pemerintah Pusat dalam penentuan calon Kepala Sekolah yang kompeten dan memenuhi standar yang telah ditentukan. Dengan terlaksananya implementasi dari Permendiknas No. 28 Tahun 2010 secara keseluruhan diharapkan akan berdampak pada meningkatnya mutu pembelajaran dan mutu pendidikan secara berkelanjutan. Program penyiapan kepala sekolah adalah salah satu implementasi riil dari pelaksanaan Permendiknas No. 28 Tahun 2010. Program penyiapan kepala sekolah meliputi nominasi rekrutmen, seleksi administratif, seleksi akademis serta pendidikan dan pelatihan calon kepala sekolah. Persyaratan untuk menjadi peserta nominasi rekrutmen sesuai dengan Permendiknas No. 28 Tahun 2010 adalah sebagai berikut; 1. Persyaratan umum meliputi: a. Beriman dan bertaqwa kepadaTuhan Yang MahaEsa; b. Memiliki kualifikasi akademik paling rendah sarjana (S1) atau diploma empat (D-IV) kependidikan atau non kependidikan perguruan tinggi yang terakreditasi; c. Berusia setinggi-tingginya 56 (lima puluh enam) tahun pada waktu pengangkatan pertama sebagai kepala sekolah/madrasah; d. Sehat jasmani dan rohani berdasarkan surat keterangan dari dokter Pemerintah; e. Tidak pernah dikenakan hukuman disiplin sedang dan/atau berat sesuai dengan ketentuan yang berlaku; f. Memiliki sertifikat pendidik; h. Pengalaman mengajar sekurang-kurangnya 5 (lima) tahun menurut jenis dan jenjang sekolah/madrasah masing-masing, kecuali di taman kanak-kanak/raudhatul athfal/taman kanak-kanak luar biasa (TK/RA/TKLB) memiliki pengalaman mengajar sekurang-kurangnya 3 (tiga) tahun di TK/RA/TKLB; i. Memiliki golongan ruang serendah-rendahnya III/c bagi guru pegawai negeri sipil (PNS) dan bagi guru bukan PNS disetarakan dengan kepangkatan yang dikeluarkan oleh yayasan atau lembaga yang berwenang dibuktikan dengan SK inpasing; j. Memperoleh nilai amat baik untuk unsur kesetiaan dan nilai baik untuk unsur penilaian lainnya sebagai guru dalam daftar penilaian prestasi pegawai (DP3) bagi PNS atau penilaian yang sejenis DP3 bagi bukan PNS dalam 2 (dua) tahun terakhir; dan k. Memperoleh nilai baik untuk penilaian kinerja sebagai guru dalam 2 (dua) tahun terakhir. 2. Persyaratan khusus meliputi: a. berstatus sebagai guru pada jenis atau jenjang sekolah/madrasah yang sesuai dengan sekolah/madrasah tempat yang bersangkutan akan diberi tugas tambahan sebagai kepala sekolah/madrasah; b. memiliki sertifikat kepala sekolah/madrasah pada jenis dan jenjang yang sesuai dengan pengalamannya sebagai pendidik yang diterbitkan oleh lembaga yang ditunjuk dan ditetapkan Direktur Jenderal. TINJAUAN PUSTAKA Pengklasteran adalah proses mengelompokkan objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/klaster. Kesamaan objek diperoleh dari kedekatan nilai-nilai atribut yang menjelaskan objek-objek data, sedangkan objek-objek data direpresentasikan sebagai sebuah titik dalam ruang multidimensi. Dalam penambangan data, usaha pengklasteran difokuskan pada metodeISBN: 978-602-70604-2-5 C-7-2
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
metode penemuan untuk klaster pada basis data berukuran besar secara efektif dan efisien. Adapun kategori algoritma pengklasteran yaitu: a. Metode Partisi, dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data dites untuk dimasukkan pada salah satu partisi sehingga tidak ada data yang overlap dan satu data hanya memiliki satu klaster. Contohnya: algoritma k-means. b. Metode Hierarki, yang menghasilkan klaster yang bersarang artinya suatu data dapat memiliki klaster lebih dari satu. Metode ini terbagi menjadi dua yaitu buttom-up yang menggabungkan klaster kecil menjadi klaster lebih besar dan top-down yang memecah klaster besar menjadi klaster yang lebih kecil. Kelemahan metode ini adalah bila salah satu penggabungan atau pemecahan dilakukan pada tempat yang salah, tidak akan didapatkan klaster yang optimal. Contohnya: Agglomerative (Findit, Proclus), Divisive Hierarchical Pengklasteran (Clique, Mafia, Enclue).
Gambar 1. Algoritma Hierarchical Clustering dengan K-means Karakteristik algoritma k-means adalah sebagai berikut (Kantardzic 2003): 1. Kompleksitas algoritma k-means adalah O (nkl) dengan n adalah jumlah objek data, k adalah jumlah klaster dan l adalah banyaknya iterasi. Umumnya, k dan l adalah tetap sehingga algoritma ini memiliki kompleksitas linear terhadap ukuran data. 2. Algoritma k-means merupakan Algoritma yang tidak terpengaruh terhadap urutan data (order-independent). 3. Algoritma k-means sangat sensitive terhadap noise dan outlier karena dapat sangat mempengaruhi nilai mean. 4. Karena kompleksitasnya linear, algoritma k-means relatif lebih terukur dan efisien untuk pemrosesan data dalam jumlah besar (higher-dimensionality). ISBN: 978-602-70604-2-5 C-7-3
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
METODE PENELITIAN Berdasarkan tujuan penelitian, berikut ini akan diuraikan metode dan tahapan-tahapan penelitian yang akan dilakukan. Proses dasar pengembangan secara umum pada penelitian ini terdiri dari beberapa tahapan sesuai Gambar 2. Input data
Pemrosesan data awal : Pembersihan data
Konversi Data
Pengklasteran Memasukkan data input Menentukan jumlah k dan s k-means clustering Klaster
Output
3 klaster Calon Peserta yang dihasilkan : Sangat direkomendasikan
Direkomendasikan
Tidak direkomendasikan
Gambar 2. Blok Diagram Sistem Kerja Penelitian Pengambilan Data Masukan; Data masukan yang digunakan dalam penelitian ini adalah database SIM NUPTK Padamu Negeri Kota Mojokerto Provinsi Jawa Timur yang didalamnya terdapat informasi data individu pendidik yaitu antara lain nama, nomor unik, unit kerja, status pegawai, masa kerja, golongan/jabatan fungsional, kualifikasi pendidikan, jurusan, usia, status sertifikasi, mata pelajaran yang diampu, mata pelajaran yang disertifikasi, jumlah jam per minggu, dan pengembangan profesi serta data sekolah terkait dengan nama sekolah, alamat sekolah, jenjang sekolah, status sekolah, status akreditasi sekolah dan lain sebagainya. Pembersihan Data; Data yang telah diperoleh dibersihkan dari indikator data yang tidak diperlukan seperti misalnya data jenis kelamin, status perkawinan, mata pelajaran yang diampu, mata pelajaran sertifikasi, jabatan dalam tugas, tahun lulus, jurusan dan LPTK penyelenggara. Data-data tersebut dihapus kemudian ditambahkan kembali data yang digunakan sebagai parameter proses pengolahan data melalui metode klustering. Data yang ditambahkan adalah data nilai DP3, nilai PKG, pengembangan profesi, prestasi dalam ISBN: 978-602-70604-2-5 C-7-4
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
pelaksanaannya sebagai guru serta keterangan keterlibatan permasalahan hukum. Penambahan data dilakukan menggunakan program MS Access. Konversi Data; Untuk parameter usia, masa kerja, nilai DP3, nilai PKG bertipe numerik sedangkan parameter lainnya yaitu golongan, pendidikan terakhir, prestasi, pengembangan profesi, sertifikasi pendidik dan keterlibatan permasalahan hukum bertipe kategorik. Supaya algoritma k-means bekerja dengan baik, maka parameter yang bersifat kategorik dikonversikan menjadi nilai numerik yaitu untuk parameter golongan, kualifikasi pendidikan, pengembangan profesi, sertifikasi pendidik, permasalahan hukum dan prestasi. Kemudian data masukan yang sudah lengkap sesuai dengan parameter yang akan diujikan akan diubah formatnya dari excell menjadi bentuk arff. Proses Pengklasteran; Semua data yang menjadi data masukan dilakukan proses pengklasteran menjadi kelompok-kelompok data. Kelompok data ini mewakili setiap aspek parameter persyaratan calon peserta program. Keluaran; output dari penelitian ini adalah nominasi peserta Program Penyiapan Calon Kepala Sekolah yang terbagi dalam 3 klaster, yaitu : (1) Paling direkomendasikan; nominasi yang teratas yang dapat dijadikan sebagai sistem pengambilan keputusan yang sangat tepat, (2) Direkomendasikan; nominasi yang direkomendasikan dengan mempertimbangkan kondisi dan situasi pelaksanaan program di lapangan dan (3) Tidak direkomendasikan; nominasi yang paling terendah dan tidak dapat digunakan sebagai bahan pengambilan keputusan karena tidak memenuhi parameter penilaian yang disyaratkan. Pengujian Data Klaster; Pada bagian ini akan dilakukan analisis dan pengujian data untuk mengetahui seberapa baik hasil klasifikasi yang dilakukan dengan mengukur tingkat akurasi dari hasil klastering data nominasi calon peserta Program Penyiapan Calon Kepala Sekolah dengan metode k-means dan membandingkannya dengan metode dari sistem manual yang selama ini digunakan. HASIL DAN PEMBAHASAN Pengklasteran; Tahapan ini dilakukan klustering menggunakan algoritma K-Means dengan aplikasi Weka 3.6.2. Algoritma K-Means akan menghasilkan pusat klaster (centroid) untuk masing-masing klaster sesuai dengan atribut. Pusat klaster (centroid) untuk klaster (k) 3 dan seed (s) 20 sebagai berikut: Tabel 1. Data Pusat Centroid terhadap Atribut Atribut Masa kerja Pendidikan Pangkat/Gol Usia Sertifikasi DP3 PKG Profesi Prestasi Hukum
Full Data 11.9778 3.7526 5.0928 41.2427 0.5641 83.9002 87.6392 1.0317 0.1655 0.9917
Pusat Klaster Klaster0 Klaster1 6.9154 13.9732 3.3901 3.9784 1.1557 0.7424 33.3952 42.4068 0 1 83.5705 83.0127 87.6122 87.5464 0.9403 0.8983 0.1713 0.1515 0.9905 0.9913
ISBN: 978-602-70604-2-5 C-7-5
Klaster2 16.7461 4.0571 11.4381 49.496 1 84.6654 87.7110 1.1934 0.1654 0.9932
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
Uji Klasterisasi Semua Atribut yang dipergunakan.
Sb y ------ kuantitaftif record
x = record nilai dibawah 50,00 x = record nilai diatas 50,00
Sb x ----- cluster
Gambar 3. Uji Klasterisasi Semua Atribut Setelah proses pengklasteran, maka akan didapat jumlah anggota pada masing-masing klaster yang dapat dilihat pada Gambar 4.
Jumlah Anggota
Jumlah Anggota Tiap Klaster 1400 1200 1000 800 600 400 200 0
1154
1034
462 44% Klaster
39%
17%
0
1
2
Gambar 4. Grafik Jumlah Anggota Kluster Evaluasi Klaster; Hasil klastering dari setiap kombinasi klaster(k) dan seed(s) dievaluasi menggunakan SSE (Sum of Squared Error (SSE)). Nilai SSE tergantung pada jumlah cluster dan bagaimana data dikelompokkan ke dalam cluster-cluster tersebut. Semakin kecil nilai SSE, semakin bagus hasil clustering-nya. Tabel 2. Hasil SSE pada k=3 SEED 10 20 30
AVERAGE WITHIN DISTANCE 959.8283 959.8283 1057.9395
ISBN: 978-602-70604-2-5 C-7-6
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
SEED 40 50 60 70 80 90 100
AVERAGE WITHIN DISTANCE 1057.0944 959.8283 959.8283 959.8283 1078.2698 959.8283 959.8283
Hal ini menyatakan bahwa tidak diketemukan SSE yang paling kecil, sehingga apabila menggunakan seed 20 juga termasuk klastering pada seed terbaik. Selain itu evaluasi kluster juga dilakukan dengan penghitungan varian between kluster (Vb) yang menunjukkan rata – rata jarak pengelompokkan antar kluster. Semakin besar nilai perbedaannya, maka kluster yang terbentuk semakin baik. Tabel 3. Hasil Vb pada Kluster k=3 SEED 10 20 30 40 50 60 70 80 90 100
VARIAN BETWEEN CLUSTER 311244.981 443675.322 311244.981 285667.433 311244.981 443675.322 311244.981 285667.433 443675.322 311244.981
Pada Tabel 3 di atas menunjukkan bahwa nilai Vb terbesar yaitu 443675.322 ada pada seed 20, 60 dan 90. Sehingga bisa dikatakan bahwa pengklusteran dengan nilai seed 20 seperti dalam penelitian ini telah membentuk kluster yang terbaik. Analisa Klaster; Sedangkan untuk menguji kualitas kluster yang dihasilkan dianalisa berdasarkan nilai varian within claster (Vw) yang menunjukkan nilai perbandingan antara jarak atribut data dengan centroid klaster. Semakin kecil nilai Vw, maka klaster yang terbentuk semakin rapat dan semakin baik klaster yang dibentuk. Nilai Vw untuk 3 klaster yang terbentuk adalah sebagai berikut : Tabel 4. Hasil Vw pada Tiap Kluster KLASTER 0 1 2
VARIAN WITHIN CLUSTER 9754.087 7980.632 6256.534
Dari analisa di atas, maka dapat diasumsikan bahwa klaster 2 adalah klaster anggota yang paling direkomendasikan karena semua anggota klaster memenuhi hampir semua parameter, klaster 1 adalah yang direkomendasikan karena meski anggota klaster tersebut memenuhi parameter yang ditentukan tetapi selisih antara atribut data dengan parameter relatif jauh sedangkan klaster 0 adalah klaster dengan anggota yang tidak direkomendasikan karena anggota klaster 0 mempunyai atribut yang hampir kesemuanya tidak sesuai dengan parameter yang ditentukan.
ISBN: 978-602-70604-2-5 C-7-7
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
Pengujian Akurasi Data; bagian ini akan dilakukan pengujian kluster untuk mengetahui seberapa baik hasil clustering yang dilakukan dengan mengukur tingkat akurasi dari hasil klaster data nominasi calon peserta Program Penyiapan Calon Kepala Sekolah dengan metode k-means clustering dan membandingkannya dengan sistem manual yang dipakai selama ini. Tabel 5. Hasil Perbandingan Tingkat Akurasi 2 Metode Metode Manual K-means clustering
Data Uji 1231 2650
Akurasi 49,19 % 97,69 %
Grade Akurasi Failure Excellent
Dari Tabel 5 di atas menunjukkan bahwa metode pengelompokkan data dengan k-means clustering mempunyai tingkat akurasi jauh lebih tinggi dari sistem manual yang dipakai selama ini. KESIMPULAN Kesimpulan dari hasil penelitian ini adalah sebagai berikut: Metode clustering dengan algoritma K-Means Clustering untuk melakukan pengelompokan guna pemilihan nominasi daftar calon peserta Program Penyiapan Calon Kepala Sekolah lebih baik digunakan jika dibandingkan dengan pengelompokkan manual yang selama ini dipakai karena keakurasian datanya mempunyai kenaikan sebesar 48,5 % dari nilai akurasi sistem manual yang hanya 49,19 % menjadi 97,69 % dengan menggunakan metode k-means clustering. Teknik k-means clustering pada penelitian kali ini yang menggunakan pilihan seed 20 menghasilkan klaster terbaik dibuktikan dengan nilai SSE (Sum of Squared Error) yang terkecil yaitu 959.8283 dibandingkan nilai SSE dengan pemilihan seed lainnya serta ditunjukkan pula nilai Vb (Varian between cluster) terbesar yaitu 443675.322 dan Vw (Varian within cluster) terkecil. Hasil Klastering masing-masing atribut menunjukkan bahwa klaster 2 memiliki nilai atribut yang dominan lebih baik dibandingkan dengan klaster 0 dan klaster 1, hal ini dibuktikan dengan nilai Vw (Varian within cluster) pada klaster 2 yang paling kecil yaitu 6256.534 dibandingkan dengan nilai Vw pada klaster 0 dan 1 . Klaster 2 memiliki anggota yang mempunyai atribut memenuhi semua atau hampir semua parameter sedangkan anggota pada klaster 1 memiliki atribut yang sesuai dengan parameter tetapi selisih antara atribut dengan paramater terpaut jauh. Dan anggota klaster 0 memiliki nilai atribut acak yang jauh dari parameter yang ditentukan. Dari hasil analisa ini dapat disimpulkan bahwa klaster 2 dikategorikan dalam kriteria sangat rekomendasikan, klaster 1 adalah kelompok yang direkomendasikan serta klaster 0 adalah kriteria yang tidak direkomendasikan. Jumlah anggota klaster Anggota klaster 2 adalah sebanyak 1034 record (39% dari jumlah keseluruhan dataset yang diujikan) dengan penyimpangan data hanya 4,85%, klaster 1 beranggotakan 462 record (17% dari jumlah keseluruhan dataset yang diujikan) sedang klaster 0 mempunyai anggota 1154 record (44% dari jumlah keseluruhan dataset yang diujikan) dengan nilai penyimpangan sangat kecil yaitu 0,95%. DAFTAR PUSTAKA Fawcett, T. (2006), “An introduction to ROC analysis”, Pattern Recognition Letters, Vol. 27, hal. 861–874. ISBN: 978-602-70604-2-5 C-7-8
Prosiding Seminar Nasional Manajemen Teknologi XXIII Program Studi MMT-ITS, Surabaya 1 Agustus 2015
Hardle, W.danSimar, L. 2003. Applied Multivariate Statistical Analysis. Berlinand Louvainla-Neuve. Kantardzic m. 2003. Data mining: Concepts, Models, Methods, and Algorithm. New Jersey: John Wiley & Sons Inc. Oyelade, O. J ,Oladipupo, O. O dan Obagbuwa, I. C. 2010. Application of k-Means Clustering algorithm for prediction of Students’ Academic Performance. International Journal of Computer Science and Information Security, Vol. 7, No. 1. Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data untukKeperluanBisnis, TeoridanAplikasi. Yogyakarta: GrahaIlmu. Su, Mu-Chun danChou,Chien-Hsing. 2001. A Modified Version of the K-Means Algorithmwith a Distance Based on Cluster Symmetry. IEEE.
ISBN: 978-602-70604-2-5 C-7-9