Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
KLASIFIKASI MUTASI JABATAN STRUKTURAL PEGAWAI NEGERI SIPIL MENGGUNAKAN METODE DECISION TREE Yanti, I Ketut Edy Purnama, dan Surya Sumpeno Teknik Elektro,Institut Teknologi Sepuluh Nopember Alamat: Gedung B, C & AJ Kampus ITS Sukolilo, Surabaya, 60111, Indonesia Email:
[email protected]
ABSTRAK Pemberian rekomendasi usulan mutasi jabatan struktural selama ini membutuhkan waktu yang relatif lama karena dilakukan secara manual serta tidak memiliki pola atau belum bisa mengikuti aturan yang berlaku. Untuk mengatasi hal tersebut dibutuhkan sistem klasifikasi agar memiliki pola serta waktu yang relatif singkat dengan teknik klasifikasi data mining menggunakan metode Decision Tree C4.5, Label data sebanyak 6 kelas, pengujian sistem menggunakan data testing sebanyak 25% dari data yang ada. Dalam pengklasifikasian digunakan pemilihan kriteria atribut berdasarkan information gain, gain ratio dan gini indeks yang akan diperbandingkan untuk mengetahui tingkat akurasinya. Hasil dari penelitian ini menunjukkan bahwa sistem klasifikasi yang dibangun memiliki tingkat akurasi yang berbeda berdasarkan tabel confusion Matrix yaitu information gain sebesar 87,18%, gini indeks 86,75% dan gain ratio 82,48%, masing-masing membutuhkan waktu 3 (tiga) detik dalam pembentukan sistem klasifikasi. Melihat tingkat akurasi dari ketiga pemilihan atribut tersebut maka information gain dapat dipergunakan dalam pemberian rekomendasi mutasi jabatan struktural untuk pengambilan keputusan lebih lanjut. Kata kunci: Mutasi Jabatan Struktural, Data Mining, Decision Tree C4.5, Information Gain, Gain Ratio, Gini Indeks.
PENDAHULUAN Pemberian rekomendasi mutasi jabatan struktural masih belum berjalan dengan maksimal sesuai dengan aturan yang berlaku atau tidak memiliki pola mutasi jabatan struktural serta waktu yang relatif lama karena dilakukan secara manual. Hal ini menjadi salah satu penyebab penurunan kinerja Pegawai Negeri Sipil (PNS) dalam bekerja atau pun dalam memberikan layanan ke masyarakat sehingga dibutuhkan sistem klasifikasi yang diharapkan mampu memberikan solusi terhadap pelaksanaan mutasi jabatan struktural dengan membuat pola mutasi jabatan struktural dengan waktu yang relatif singkat. Ada beberapa penelitian sebelumnya yang membahas tentang mutasi jabatan struktural di lingkup pemerintah daerah seperti yang dilakukan oleh (Pramutoko, 2012) dan (Sriyana, 2013) namun belum ada yang penulis temukan penelitian yang membahas tentang pengklasifikasian mutasi jabatan struktural sehingga penulis anggap bahwa hal tersebut layak untuk diteliti dalam rangka membantu dalam pemberian rekomendasi usulan mutasi. Metode decision tree yang merupakan pengembangan dari algoritme ID3 (Iterative Dichotomiser 3) dan juga salah satu algoritme pohon keputusan yang terkenal karena memiliki kelebihan antara lain: mudah dimengerti serta menarik karena dapat divisualisasikan dalam bentuk gambar berupa pohon keputusan (Prabowo Pudjo Widodo, 2013) (Bhatt, 2012) . Metode klasifikasi Decision Tree merupakan metode yang masuk kelas frequency tabel yaitu suatu metode yang melihat data berdasarkan seberapa sering data itu muncul dalam tiap ISBN : 978-602-70604-1-8 A-25-1
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
fitur/variable, metode lainnya yang masuk kelas tersebut antara lain (Sayad, 2010-2012) : One R, ZeroR dan Naive Bayesian. Dengan memanfaatkan data yang berhubungan dengan kepegawaian serta melihat banyak usulan mutasi jabatan struktural struktural dari Satuan Kerja Perangkat Daerah (SKPD) setiap saat dengan jenjang dan jumlah yang relatif bervariasi, diharapkan mampu memberikan sebuah solusi untuk menjawab persolan pola mutasi jabatan struktural yang ada di daerah. Penelitian ini bukan bertujuan untuk membuat sistem pendukung keputusan mutasi jabatan struktural untuk menduduki jabatan tertentu karena keterbatasan data yang dimiliki namun hanya sebatas mendapatkan model pola klasifikasi mutasi jabatan struktural berdasarkan eselon menggunakan metode decision tree yang lebih cepat dibandingkan dengan cara manual yang di harapkan bisa dipergunakan untuk pemberian rekomendasi usulan mutasi jabatan struktural ke pengambil kebijakan sebagai pengambil keputusan lebih lanjut jika sistem klasifikasi yang dibangun memiliki akurasi di atas 70%. METODE Penelitian yang dilakukan menggunakan teknik klasifikasi data mining dengan algoritme Decision Tree C4.5 dengan pemilihan kriteria atribut berdasarkan information gain, gain ratio dan gini indeks sebagai kriteria pemilihan atribut yang terkenal dalam Decision Tree (Santosa, 2007) . Proses penelitian dapat dilihat pada blok diagram Gambar 1. Berdasarkan Gambar 1, dapat dijelaskan blok diagram tersebut sebagai berikut : Melakukan pengumpulan data dari berbagai file yang berhubungan dengan data kepegawaian yaitu gaji = 4471 data, riwayat pendidikan = 13331 data, Data PNS = 4627 data, riwayat diklat = 221 data, riwayat jabatan = 9772 data, calon latpim 2012 = 121 data, latpim III tahun 2005 = 40 data, latpim IV tahun 2004 = 40 data, calon latpim IV tahun 2004 = 49 data, Lampiran SK ijin/tubel serta bantuan ijin/tubel = 59 sheet. Tahap selanjutnya adalah menentukan parameter input dan output seperti terlihat pada Tabel 1 sebelum menyatukan dalam satu file baru sebagai database. Atribut total jabatan, masa kerja jabatan akhir, total masa kerja jabatan dan masa kerja keseluruhan tidak terdapat dalam data awal namun penulis melakukan perhitungan sendiri berdasarkan data yang telah ada. Melakukan pembersihan data untuk mengatasi data yang bermasalah seperti missing value/tidak lengkap dan noisy (Hermawati, 2013) (Bhatt, 2012) agar didapatkan data dengan kualitas yang baik sesuai kebutuhan. Total data yang didapatkan pada tahap ini adalah sebesar 934 data, masing-masing terdiri atas eselon II.b 28 data, III.a 44 data, III.b 75 data, IV.a 324 data, IV.b 55 data, dan Non eselon 408 data. Data olah terdiri atas data nominal dan numerik, tidak dilakukan metode untuk mengkategorikan data karena Decision Tree C4.5 bisa menangani data numerik. Data numerik secara otomatis akan diubah menjadi kategori dengan 2 rentang nilai tiap kategori. Melakukan training data menggunakan pemilihan kriteria atribut information gain, gain ratio dan gini indeks dalam penentuan simpul akar/cabang. Dilakukan beberapa perubahan parameter agar didapatkan hasil akurasi yang lebih tinggi dengan pre pruning data yaitu mininal jumlah data tiap daun, minimal jumlah data tiap cabang, minimal gain, kedalaman pohon, konfidensi. Melakukan pengujian sistem klasifikasi menggunakan data testing untuk mengetahui tingkat akurasi berdasarkan tabel confusion Matrix sebanyak 25% (234 data) data dengan pemilihan secara stratified. Pemilihan kriteria atribut yang paling akurat yang akan dijadikan sebagai rekomendasi usulan mutasi jabatan struktural.
ISBN : 978-602-70604-1-8 A-25-2
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
Pengumpulan Data
Pengujian Klasifikasi
Pemilihan Masukan/ keluaran
Integrasi Data
Validasi/ Pembersihan Data
Training Data
Gambar 1. Blok Diagram Tabel 1 Parameter Input Data No. 1. 2. 3. 4. 5. 6. 7. 8. 9.
Masukan Pangkat/Gol Akhir Jenjang Pendidikan Masa kerja golongan akhir Masa kerja Usia Diklat Kepemimpinan Total Jabatan Masa kerja jabatan terakhir Total masa kerja jabatan
Keterangan III/a - IV/d Jenjang Pendidikan terakhir Tahun berjalan – tahun golongan akhir Masa kerja keseluruhan PNS Usia PNS Latpim II, III, IV, - (belum latpim) Jumlah jabatan yang pernah di duduki Tahun berjalan – tahun jabatan terakhir Tahun berjalan – tahun jabatan pertama
Parameter data keluaran yang dihasilkan adalah penentuan eselon/jabatan yang diberikan kepada PNS tersebut yaitu : Non Eselon, IV.b, IV.a, III.b, III.a, II.b. Information gain Merupakan pemilihan atribut dengan mengukur seberapa baik atribut dipisahkan ke dalam kelas yang ada namun sebelumnya dihitung nilai entropy yang berfungsi mengetahui bobot suatu atribut dengan formula sebagai berikut (Bhatt, 2012) : n
Entropy (S)= � - pi .log2 pi
(1)
i=1
Dimana S adalah himpunan kasus/keputusan, n adalah jumlah partisi S dan P i adalah proporsi keputusan terhadap S. n |Si | Gain (S,A)=Entropy (S)- � *Entropy (Si ) (2 ) |S| i=1
Dimana : n adalah jumlah partisi atribut A, A adalah semua nilai yang mungkin dari atribut tersebut, |s i | adalah bagian/subset nilai S, |s| adalah jumlah kasus dalam S
Gain ratio Menghitung nilai split information untuk dipergunakan dalam menghitung nilai gain ratio. Formula untuk split information dan gain ratio adalah sebagai berikut (Bhatt, 2012) : n
SplitInformation (S,A)= - � i=1
Gini indeks
Gainratio (S,A)=
|Si | |Si | log2 |S| |S|
Gain(S,A) SplitInformation (S,A)
ISBN : 978-602-70604-1-8 A-25-3
(3) (4)
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
Formula untuk menghitung gini indeks isi setiap atribut adalah sebagai berikut (Hermawati, 2013) : n
IG(A)=1- � P2n
(5)
i=1
Dimana : P n adalah Rasio observasi dalam kotak A yang masuk kelas i, n adalah jumlah kelas/variabel dari cabang/kotak A. Langkah selanjunya adalah menghitung gini split sebagai penentuan simpul akar/cabang dengan formula sebagai berikut (Hermawati, 2013) : n
GiniSplit (A)= � i=1
|Si | IG(A) |S|
(6)
Information gain dan gain ratio menggunakna nilai tertinggi untuk menentukan simpuk akar/cabang pohon sedangkan gini indeks berdasarkan nilai terkecil. Pengujian Klasifikasi Melakukan testing klasfikasi untuk mengetahui tingkat akurasi berdasarkan tabel confusion matrix dengan formula sebagai berikut (Sayad, 2010-2012) : Akurasi= HASIL DAN PEMBAHASAN
∑ Data Benar x 100% ∑ Total Data Uji
(7)
Hasil Training Pemilihan Kriteria Atribut Berdasarkan Information Gain Pada Gambar 2 yang merupakan sebagian dari hasil pohon keputusan yang dibentuk berdasarkan pemilihan kriteria information gain. Pada Gambar tersebut dapat dilihat bahwa node yang paling atas adalah Golongan yang menjadi simpul akar karena memiliki nilai information gain tertinggi dibandingkan atribut yang lain. Golongan terbagi ke dalam 7 split sesuai jumlah golongan yang ada dalam data, dari III/a sampai dengan IV/c, sebagai contoh split untuk Gol akhir III/d yang melakukan perulangan untuk menghasilkan kelas data. Untuk melihat urutannnya, bisa dilakukan dengan melihat arah anak panah yang dihasilkan dari suatu simpul dan akhir dari simpul tersebut adalah kelas data dengan lambang berbentuk kotak. Salah satu contoh penentuan eselon IV.a berdasarkan Golongan III/d adalah sebagai berikut : Jika Golongan = III/d & Diklatpim = IV & Masa kerja jab. Akhir ≤ 3,5 Maka Eselon IV.a. Total aturan keputusan berdasarkan pemilihan kriteria information gain adalah 24 aturan keputusan yang terbagi ke dalam 6 kelas data. Hasil Training Pemilihan Kriteria Atribut Berdasarkan Gini Indeks Pada Gambar 3 yang merupakan sebagian dari hasil pohon keputusan yang dibentuk berdasarkan pemilihan kriteria gini indeks. Pada Gambar tesebut dapat dilihat bahwa node yang paling atas adalah Golongan yang menjadi simpul akar karena memiliki nilai gini indeks terkecil dibandingkan atribut yang lain. Golongan terbagi ke dalam tujuh split sesuai jumlah golongan yang ada dalam data dari III/a sampai dengan IV/c, sebagai contoh split untuk Golongan III/c yang melakukan perulangan untuk menghasilkan kelas data. Salah satu contoh penentuan eselon III.b berdasarkan Golongan akhir III/c adalah sebagai berikut : Jika Golongan = III/c & Pend. Akhir = S2 & Masa kerja Jab. Akhir = ≤1,5 & Masa kerja keseluruhan > 11,5 maka Eselon III.b. Total aturan keputusan berdasarkan gini indeks adalah 54 aturan keputusan yang terbagi ke dalam 6 kelas data.
ISBN : 978-602-70604-1-8 A-25-4
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
Golongan III/d Diklatpim -
III
IV
IV.a
III.b
Masa Kerja Jab Akhir ≤3,5
>3,5
IV.a
Usia >43,5
≤43,5
IV.a Pend. Akhir S1
S2 III.b
IV.a
Gambar 2 Bagian Pohon Keputusan Pemilihan Atribut Information Gain
Golongan III/c
Pend. Akhir S1
SLTA
Diklatpim Tot. Jabatan >0,5
IV
IV.a
>1,5
≤ 0,5
IV.a
IV.a
Masa Kerja Jab. Akhir
-
Tot. Jabatan >0,5
Non Eselon
≤ 0,5
IV.a IV.a
>2,5
≤1,5
>1,5
Masa kerja Jab. Akhir
IV.a
IV
IV
-
IV.a
IV.a
Diklatpim
Diklatpim
Masa kerja Gol. Akhir
≤ 0,5
S2
DIII
Masa kerja Keseluruhan
≤ 2,5 >11,5
IV.b III.b
Non Eselon
≤ 11,5 IV.a
Gambar 3 Bagian Pohon Keputusan Pemilihan Atribut Gini Indeks Hasil Training Pemilihan Kriteria Atribut Berdasarkan Gain Ratio Pada Gambar 4 yang merupakan sebagian dari hasil pohon keputusan yang dibentuk berdasarkan pemilihan kriteria gain rati. Pada gambar tersebut dapat dilihat bahwa node yang paling atas adalah Total jabatan yang menjadi simpul akar karena memiliki nilai gain ratio terbesar dibandingkan atribut yang lain. Total jabatan terbagi atas 2 split yaitu >0,5 dan ≤0,5. Sebagai contoh split untuk >0,5 yang melakukan perulangan untuk menghasilkan kelas data sedangkan split ≤0,5 langsung menghasilkan kelas data. ISBN : 978-602-70604-1-8 A-25-5
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
Salah satu contoh penentuan eselon III.b adalah sebagai berikut : Jika Total jabatan > 0,5 & Diklatpim = IV & Golongan = IV/a Maka Eselon III.b. Total aturan keputusan berdasarkan gain ratio adalah 22 aturan keputusan yang terbagi ke dalam 6 kelas data. Total Jabatan ≤0,5
> 0,5 Diklatpim III
≤0,5
IV
Golongan
Non Eselon
II.b IV.c
III/d III.a
IV.b IV.a
Masa kerja Keseluruhan
III.a
Golongan III.b
II.b
III/d
IV.b
IV.a
S2
IV.a III.b
IV.a III.b
Pend. Akhir
S1
≤ 17
> 17
III/c
SLTA IV.a
Masa Kerja Jab. Akhir
IV.a
≤ 1,5
> 1,5 IV.a
III.b
Gambar 4 Bagian Pohon Keputusan Pemilihan Atribut Gain Ratio Hasil Akurasi Berdasarkan Tabel Confusion Matrix Berdasarkan Tabel 2, Tabel 3 dan Tabel 4 dapat dilihat tingkat akurasi data berdasarkan data testing sebanyak 234 data dari masing-masing pemilihan atribut. Tingkat akurasi dihitung berdasarkan formula (7) dengan hasil yang berbeda-beda yaitu berdasarkan information gain sebesar 87,18%, gini indeks 86,75% dan gain ratio 82,48%. Area yang memiliki latar berwarna abu-abu merupakan nilai dari data yang di klasifikasikan secara benar. Tabel 2 Confusion Matrix berdasarkan Information Gain Akurasi Prediksi
87,18% Target Data Non Eselon 102
III.b 0
IV.a 1
IV.b 0
II.b 0
III.a 0
III.b
0
7
1
0
0
1
IV.a
0
9
75
6
0
2
IV.b
0
0
1
8
0
0
II.b
0
1
0
0
4
0
III.a
0
2
3
0
3
8
Non Eselon
ISBN : 978-602-70604-1-8 A-25-6
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
Tabel 3 Confusion Matrix berdasarkan Gini Indeks Akurasi Prediksi
86,75% Target Data Non Eselon 102
III.b 1
IV.a 1
IV.b 1
II.b 0
III.a 0
III.b
0
12
4
0
0
2
IV.a
0
4
70
4
0
2
IV.b
0
0
4
9
0
0
II.b
0
2
0
0
4
1
III.a
0
0
2
0
3
6
Non Eselon
Tabel 4 Confusion Matrix berdasarkan Gain Ratio Akurasi Prediksi
82,48 % Target Data Non Eselon
III.b
IV.a
IV.b
II.b
III.a
Non Eselon
99
0
2
1
0
0
III.b
0
1
0
0
0
0
IV.a
0
8
74
5
0
1
IV.b
3
0
1
8
0
0
II.b
0
0
0
0
1
0
III.a
99
0
2
1
0
0
Sebagai contoh pada Tabel 2 antara prediksi kelas Non Eselon dengan target data dapat dilihat bahwa yang benar/sesuai antara prediksi dan target data adalah sebanyak 102 data, sementara terdapat kesalahan klasifikasi dimana Eselon yang sebenarnya adalah IV.a namun di prediksikan salah dan masuk ke Non Eselon sebanyak 1 data, namun tidak ada kesalahan prediksi untuk target Non Eselon. Berdasarkan Tabel 5, dapat dilihat bahwa semua pemilihan kriteria atribut menghasilkan akurasi di atas 70% dan sudah melebihi dari target sebelumnya yaitu sebesar 70%, sehingga dianggap layak untuk dijadikan rekomendasi usulan mutasi jabatan struktural. Information gain memiliki tingkat akurasi tertinggi dibandingkan yang lainnya, Golongan sebagai faktor yang paling berpengaruh dengan menjadi penentu awal klasifikasi, jumlah aturan keputusan sebanyak 24. Gini indeks juga menjadikan golongan sebagai penentu awal klasifikasi, namun memiliki akurasi yang lebih rendah serta jumlah aturan keputusan yang terbanyak, dengan aturan keputusan yang lebih banyak akan membuat pengambilan keputusan lebih rumit. Gain ratio memiliki jumlah aturan keputusan dan pemakaian atribut paling sedikit namun memiliki tingkat akurasi terendah, menjadikan total jabatan sebagai atribut yang paling berpengaruh, berdasarkan split yang ada, maka sudah bisa di pastikan bahwa ketika seorang PNS belum pernah menduduki jabatan maka tidak akan pernah bisa menduduki jabatan tertentu, berbeda dengan pemilihan kriteria atribut lainnya yang memungkinkan terjadi promosi jabatan untuk PNS yang belum pernah menjabat sebelumnya. ISBN : 978-602-70604-1-8 A-25-7
Prosiding Seminar Nasional Manajemen Teknologi XXII Program Studi MMT-ITS, Surabaya 24 Januari 2015
Tabel 5 Perbandingan Algoritme Pemilihan Kriteria Atribut Decision Tree C4.5 Simpul Akar
Jumlah Aturan Keputusan
Akurasi (%)
9
Golongan
24
87,16
Gini Indeks
9
Golongan
54
86,75
Gain Ratio
7
Total Jabatan
22
82,48
No.
Algoritme
Jumlah Atribut
1
Information gain
2 3
KESIMPULAN DAN SARAN Penelitian ini menghasilkan penentuan klasifikasi mutasi jabatan struktural menggunakan metode Decision Tree C4.5, pemilihan kriteria atribut information gain berdasarkan eselon yaitu Non Eselon, II.b, III.a, III.b, IV.a, IV.b. Hasil penelitian ini, mampu menjawab persoalan mutasi jabatan struktural dalam hal waktu yang relatif lama dengan pola mutasi yang sebelumnya tidak ada. Dalam penentuan klasifikasi mutasi tersebut, atribut yang menjadi faktor utama sebagai penentu awal adalah Golongan PNS. Penentuan atribut tersebut lebih baik dibandingkan dengan pemilihan kriteria atribut lainnya. Hal tersebut juga sesuai dengan aturan, dimana faktor golongan adalah bagian yang sangat penting/utama dalam menentukan eselon PNS. Dalam penelitian ini diketahui bahwa jumlah aturan keputusan yang ada masih relatif banyak dengan melibatkan semua atribut yang ada, sehingga pemberian rekomendasi usulan mutasi untuk pengambilan keputusan lebih lanjut agak rumit. Diharapkan dalam penelitian selanjutnya supaya aturan keputusan yang dibuat lebih sederhana agar membantu dalam mempercepat proses pemberian rekomendasi tanpa harus meneliti semua atribut yang selama ini dianggap berpengaruh. DAFTAR PUSTAKA Bhatt, A. S. (2012). Comparative Analysis of Attribute Selection Measures Used for Attribute. International Conference on Radar, Communication and Computing (ICRCC), (pp. 230-234). Tiruvannamalai, TN, India. Hermawati, F. A. (2013). Data Mining. Yogyakarta: Penerbit Andi. Prabowo Pudjo Widodo, D. (2013). Penerapan Data Mining Dengan Matlab. Bandung: Penerbit Rekayasa Sains. Pramutoko, B. (2012). Pemahaman Elit Politik Terhadap Kebijakan Mutasi Pegawai di Lingkungan Pemerintah Kota Kediri. Hal. 1-29(2012). Santosa, B. (2007). Data Mining - Teknik Pemanfaatan Data untuk Keperluan Bisnis. Surabaya Indonesia: Graha Ilmu. Sayad, D. S. (2010-2012). An Introduction to Data Mining. Retrieved Juni 07, 2014, from http://www.saedsayad.com/ Sriyana. (2013). Pelaksanaan Mutasi Pejabat Struktural pada Kantor Badan Kepegawaian Daerah Kabupaten Sintang. Volume 5 Nomor 1 Hal. 135-142(Februari 2013).
ISBN : 978-602-70604-1-8 A-25-8