UNIVERSITAS INDONESIA
PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL: STUDI KASUS PEMERINTAH KOTA BOGOR
KARYA AKHIR
TOSAN WIAR RAMDHANI 1206194985
FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI JAKARTA JULI 2014
UNIVERSITAS INDONESIA
PEMANFAATAN TEKNIK DATA MINING CLASSIFICATION UNTUK POLA PENGISIAN JABATAN STRUKTURAL: STUDI KASUS PEMERINTAH KOTA BOGOR
KARYA AKHIR Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Teknologi Informasi
TOSAN WIAR RAMDHANI 1206194985
FAKULTAS ILMU KOMPUTER PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI JAKARTA JULI 2014
HALAMAN PERNYATAAN ORISINALITAS
Karya Akhir ini adalah hasil karya sendiri, dan semua sumber baik yang dikutip maupun dirujuk telah saya nyatakan dengan benar
Nama
: Tosan Wiar Ramdhani
NPM
: 1206194985
Tanda tangan: Tanggal
: 3 Juli 2014
ii
Universitas Indonesia
HALAMAN PENGESAHAN Karya Akhir ini diajukan oleh: Nama
: Tosan Wiar Ramdhani
NPM
: 1206194984
Program Studi : Magister Teknologi Informasi Judul
: Pemanfaatan Teknik Data mining classification untuk Pola Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor
Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian pernyataan yang diperlukan untuk memperoleh gelar Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Indonesia. DEWAN PENGUJI
Pembimbing I :
Betty Purwandari, Ph.D (……………………….)
Pembimbing II:
Yova Ruldeviyani, M.Kom (……………………….)
Penguji: Dr. Achmad Nizar Hidayanto, S.Kom, M.Kom (……………………….)
Penguji:
Dr. Indra Budi, S.Kom, M.Kom (……………………….)
Ditetapkan di : Jakarta Tanggal
: iii
Universitas Indonesia
KATA PENGANTAR Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena atas berkat dan rahmat-Nya, penulis dapat menyelesaikan Karya Akhir ini. Penulisan Karya Akhir dilakukan dalam rangka memenuhi salah satu syarat untuk mencapai gelar Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi, Fakultas Ilmu Komputer – Universitas Indonesia. Penulis menyadari bahwa, tanpa bantuan dan bimbingan dari berbagai pihak, dari masa perkuliahan sampai pada penyusunan karya akhir ini, sangatlah sulit bagi penulis untuk menyelesaikannya. Oleh karena itu, penulis mengucapkan terimakasih kepada: 1. Ibu Betty Purwandari, Ph.D , selaku dosen pembimbing I dan Ibu Yova Ruldeviyani, M.Kom selaku doesen pembimbing II,
yang telah
menyediakan waktu, tenaga, dan pikiran untuk mengarahkan dalam penyusunan Karya Akhir ini. 2. Dosen Penguji yang telah menguji dan memberikan saran dan perbaikan pada Karya Akhir ini. 3. Kementrian Komunikasi dan Informasi, yang telah memberikan bantuan beasiswa. 4. Istri tercinta, Dian Kusumaningrum, yang telah memberikan pengertian, perhatian, dukungan, dan semangat yang telah diberikan pada penulis. 5. Kedua orang tua tercinta, yang telah memberikan dukungan, doa, dan perhatian yang telah diberikan kepada penulis. 6. Staf di Magister Teknologi Informasi, yang telah membantu kelancaran perkuliahan dan Karya Akhir. 7. Teman – teman di MTI 2012SA, yang telah membantu dalam melewati masa-masa perkuliahan. Akhir kata, semoga Allah SWT membalas semua kebaikan dan bantuan yang telah diberikan dengan pahala yang berlipat ganda. Semoga Karya Akhir ini memberikan manfaat bagi pengembangan ilmu pada umumnya dan bagi penulis pada khususnya. Jakarta, 3 Juli 2014 Penulis iv
Universitas Indonesia
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini: Nama
: Tosan Wiar Ramdhani
NPM
: 1206194985
Program Studi
: Magister Teknologi Informasi
Fakultas
: Ilmu Komputer
Jenis Karya
: Karya Akhir
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Indonesia Hak Bebas Royalti Non-eksklusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul: Pemanfaatan Teknik Data mining classification untuk Pola Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor Dengan Hak Bebas Royalti Non-eksklusif ini Universitas Indonesia berhak menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data (database), merawat, dan mempublikasikan karya akhir saya tanpa meminta izin dari saya selama tetap mencantumkan saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Demikian pernyataan ini saya buat dengan sebenarnya. Dibuat di
: Jakarta
Pada Tanggal
: 3 Juli 2014
Yang menyatakan
(Tosan Wiar Ramdhani)
v
Universitas Indonesia
ABSTRAK
Nama Program Studi Judul
: Tosan Wiar Ramdhani : Magister Teknologi Informasi : Pemanfaatan Teknik Data Mining Classification untuk Pola Pengisian Jabatan Struktural: Studi Kasus Pemerintah Kota Bogor
Pemerintah Kota Bogor merupakan salah satu bagian dari Pemerintah Provinsi Jawa Barat yang memiliki jumlah pegawai lebih dari 9000 orang. Pengelolaan kepegawaian dilakukan oleh Badan Kepegawaian Pendidikan dan Pelatihan Kota Bogor (BKPP). BKPP membentuk tim Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat) dalam tugas pengangkatan, pemindahan dan pemberhentian PNS dalam dan dari jabatan struktural Eselon IIA ke bawah. Baperjakat mengalami masalah dalam menyusun calon pejabat struktural yang selama ini dilakukan secara manual, meskipun sudah memiliki aplikasi Sistem Informasi Manajemen Kepegawaian (SIMPEG) sebagai aplikasi pengelolaan kepegawaian. Penelitian ini melakukan identifikasi pola pengisian jabatan struktural di lingkungan Pemerintah Kota Bogor dengan menggunakan data jabatan struktural tahun 2009 hingga 2013 yang bersumber dari basis data SIMPEG. Berbagai algoritma data mining dari teknik classification diujicobakan untuk mengidentifikasi pola pengisian jabatan struktural. Dari hasil classification, algoritma Classification Rule with Unbiased Interaction Selection and Estimation (CRUISE) menjadi algoritma terbaik dalam akurasi class eselon dengan tingkat akurasi rata-rata sebesar 95,7% untuk setiap tingkat eselon. Pola yang dihasilkan dapat menjadi rules yang akan diimplementasikan sebagai modul baru dalam aplikasi SIMPEG yang berfungsi memberikan usulan dalam pengisian jabatan struktural yang ditempatkan secara otomatis. Urutan atribut yang secara dominan muncul pada setiap tingkat eselon adalah atribut jenjang jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja, serta umur.
Kata Kunci : Data Mining, Classification, Mutasi Jabatan Struktural
vi
Universitas Indonesia
ABSTRACT
Name Study Program Title
: Tosan Wiar Ramdhani : Magister of Information Technlogy : The Use of Data Mining Classification Technique for Filling Structural Positions: A Case Study in Bogor Local Government
Bogor District Government is a part of West Java Province Government, which employs more than 9,000 employees. The human resources are managed by human resources and training division that is called Badan Kepegawaian Pendidikan dan Pelatihan (BKPP). BKPP form a team called Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat), who are responsible for promoting, rotating and dismissing local government employees from structural positions below the Echelon IIA positions. Baperjakat have problems on constructing the draft of structural government positions. These processes were done manually, even though BKPP have a human resources information systems called SIMPEG. The main purpose of this research is to identify patterns of filling structural positions at Bogor Local Government using the structural position data from 2009 to 2013. The data were taken from the SIMPEG database. Various data mining classification algorithms were tested to identify filling structural position patterns. The classification process yields Classification Rule with Unbiased Interaction Selection and Estimation (CRUISE) as the best algorithm in echelon class. Its average accuracy is 95.7% for each echelon level. The discovered patterns can be applied as base rules that will be implemented as new modules of SIMPEG. These new modules can provide suggestions for automatically filling structural positions. The order of attributes, which dominantly show at each echelon, are hierarchy type, class rank, training education, level of education, working period, experience within division and age.
Keywords : Data Mining, Classification, Promotions of Government Employee in Structural Positions
vii
Universitas Indonesia
DAFTAR ISI
HALAMAN JUDUL ............................................................................................ i HALAMAN PERNYATAAN ORISINALITAS .................................................. ii HALAMAN PENGESAHAN ............................................................................. iii KATA PENGANTAR ........................................................................................ iv HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS ............................................................. v ABSTRAK ......................................................................................................... vi ABSTRACT ...................................................................................................... vii DAFTAR ISI .................................................................................................... viii DAFTAR TABEL ............................................................................................... x DAFTAR GAMBAR ......................................................................................... xii 1. PENDAHULUAN .......................................................................................... 1 1.1 Latar Belakang ................................................................................ 1 1.2 Perumusan Masalah ......................................................................... 2 1.3 Tujuan Penelitian............................................................................. 4 1.4 Manfaat Penelitian........................................................................... 5 1.5 Ruang Lingkup Penelitian ............................................................... 5 2. TINJAUAN PUSTAKA ................................................................................. 6 2.1 Data Mining .................................................................................... 6 2.2 Teknik Dasar dalam Data Mining .................................................... 8 2.2.1 Teknik Classification....................................................................... 8 2.2.2 Teknik Association Rule ................................................................ 10 2.2.3 Teknik Cluster Analysis ................................................................. 12 2.3 Pengangkatan Pegawai Negeri Sipil dalam Jabatan Struktural ....... 13 2.4 Penelitian Terdahulu ...................................................................... 14 2.4.1 Data Mining Classifcation Technique for Talent Management using SVM (S.Yashoda, P.S.Prakash, 2012) ........................................... 14 2.4.2 The Decision Tree Classifcation and Its Application Research in Personnel Management (Peng Ye, 2011) ...................................... 17 2.4.3 Data mining classification Techniques for Human Talent Forecasting (Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman, 2011) .............................................................................. 19 2.4.4 Pembandingan Tingkat Akurasi Dua Model Data mining yang Dihasilkan oleh Decision tree Dan Naïve Bayes Studi Kasus: Suatu Perusahaan Manufaktur dan Penjualan Sepeda (Afif Farisi, 2007) . 21 2.5 Theoretical Framework ................................................................. 28 3. METODOLOGI PENELITIAN .................................................................. 31 3.1 Tahapan Penelitian ........................................................................ 31 3.2 Metode Pengumpulan Data ............................................................ 33 3.3 Metode Analisis Data .................................................................... 34 4. ANALISIS DAN PEMBAHASAN............................................................... 37 4.1 Data Pre-processing ...................................................................... 37 4.1.1 Ekstraksi Data ............................................................................... 37 4.1.2 Transformasi Data ......................................................................... 47 viii
Universitas Indonesia
4.2 Data Mining dengan Classification................................................ 48 4.2.1 Classification pada Data Eselon V ................................................. 49 4.2.2 Classification pada Data Eselon IVB ............................................. 54 4.2.3 Classification pada Data Eselon IVA ............................................. 59 4.2.4 Classification pada Data Eselon IIIB ............................................. 65 4.2.5 Classification pada data Eselon IIIA .............................................. 70 4.2.6 Classification pada Data Eselon IIB .............................................. 75 4.2.7 Classification pada Data Eselon IIA .............................................. 80 4.3 Analisis Hasil Prediksi................................................................... 82 4.4 Diskusi: Pola Umum Pengisian Jabatan Struktural Setiap Eselon ... 83 4.5 Analisis Dampak ........................................................................... 84 4.5.1 Analisis Dampak Organisasi .......................................................... 84 4.5.2 Analisis Dampak Keilmuan ........................................................... 86 5. KESIMPULAN DAN SARAN ..................................................................... 87 5.1 Kesimpulan ................................................................................... 87 5.2 Saran ............................................................................................. 88 DAFTAR PUSTAKA ........................................................................................ 89 Lampiran 1 ........................................................................................................ 90 Lampiran 2 ........................................................................................................ 92 Lampiran 3 ...................................................................................................... 113 Lampiran 4 ...................................................................................................... 117
ix
Universitas Indonesia
DAFTAR TABEL
Tabel 2.1 Jenjang Pangkat Golongan untuk Setiap Tingkat Eselon................................. 13 Tabel 2.2 Atribut dengan Tipe Data Continous yang Digunakan (S.Yashoda, P.S.Prakash, 2012) ........................................................................................................... 15 Tabel 2.3 Atribut dan Variabel yang Digunakan ............................................................ 20 Tabel 2.4 Akurasi dari Model dengan Seluruh Atribut (Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman, 2011) ............................................................ 20 Tabel 2.5 Atribut yang Digunakan pada Data Pelanggan dan Penjualan ......................... 21 Tabel 2.6 Perbandingan Teknik Dasar Data Mining....................................................... 24 Tabel 2.7 Perbandingan Peneletian Sebelumnya ............................................................ 25
Tabel 3.1 Data yang Tersedia ............................................................................. 33 Tabel 3.2 Tabel Perbandingan Data Mining Tools.............................................. 35 Tabel 4.1 Atribut yang Digunakan ..................................................................... 40 Tabel 4.2 Jumlah Record Data yang Digunakan ................................................. 41 Tabel 4.3 Sebaran Data Atribut Pangkat Golongan pada Train Set ..................... 41 Tabel 4.4 Sebaran Data Atribut Pangkat Golongan pada Test Set ...................... 42 Tabel 4.5 Sebaran Data Atribut Masa Kerja pada Train Set ................................ 42 Tabel 4.6 Sebaran Data Atribut Masa Kerja pada Test Set .................................. 42 Tabel 4.7 Sebaran Data Atribut Tingkat Pendidikan pada Train Set ................... 43 Tabel 4.8 Sebaran Data Atribut Tingkat Pendidikan pada Test Set...................... 43 Tabel 4.9 Sebaran Data Atribut Pendidikan dan Pelatihan pada Train Set........... 43 Tabel 4.10 Sebaran Data Atribut Pendidikan dan Pelatihan pada Test Set ........... 44 Tabel 4.11 Sebaran Data Atribut Pengalaman Unit Kerja pada Train Set ............ 44 Tabel 4.12 Sebaran Data Atribut Pengalaman Unit Kerja pada Test Set .............. 44 Tabel 4.13 Sebaran Data Atribut Umur pada Train Set ....................................... 45 Tabel 4.14 Sebaran Data Atribut Umur pada Test Set ......................................... 45 Tabel 4.15 Sebaran Data Atribut Jenjang Jabatan pada Train Set........................ 45 Tabel 4.16 Sebaran Data Atribut Jenjang Jabatan pada Test Set .......................... 46 Tabel 4.17 Sebaran Data Atribut Eselonering pada Train Set ............................. 46 Tabel 4.18 Sebaran Data Atribut Eselonering pada Test Set................................ 46 Tabel 4.19 Penyeragaman Atribut Pendidikan dan Pelatihan .............................. 47 Tabel 4.20 Hasil Classification untuk Eselon V ................................................. 49 Tabel 4.21 Confusion Matrix untuk Algoritma AD Tree ..................................... 49 Tabel 4.22 Contoh Test Set data Eselon V .......................................................... 52 Tabel 4.23 Contoh Hasil Perhitungan Nilai untuk Setiap Atribut ........................ 52 Tabel 4.24 Confusion Matrix untuk Algoritma CRUISE untuk Eselon V ............ 52 Tabel 4.25 Hasil Classification untuk Eselon IVB .............................................. 54 Tabel 4.26 Confusion Matrix Algoritma Jrip untuk Eselon IVB ......................... 54 Tabel 4.27 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVB ........ 56 Tabel 4.28 Hasil Classification untuk Eselon IVA ............................................. 59 Tabel 4.29 Confusion Matrix Algoritma Decorate untuk Data Eselon IVA ........ 60 Tabel 4.30 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVA ........ 62 Tabel 4.31 Hasil Classification untuk Eselon IIIB .............................................. 65 Tabel 4.32 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIB ........ 65 Tabel 4.33 Confusion Matrix Algoritma Bayes NET untuk Data Eselon IIIB ...... 67 Tabel 4.34 Hasil Classification untuk Eselon IIIA.............................................. 70 x
Universitas Indonesia
Tabel 4.35 Confusion Matrix untuk Algoritma REP Tree untuk Eselon IIIA ...... 70 Tabel 4.36 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIA ........ 73 Tabel 4.37 Hasil Classification untuk Eselon IIB ............................................... 75 Tabel 4.38 Confusion Matrix Algoritma Bayes NET untuk Eselon IIB ............... 76 Tabel 4.39 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIB .......... 78 Tabel 4.40 Hasil Classification untuk Eselon IIA ............................................... 80 Tabel 4.41 Confusion Matrix Algoritma Bayes NET untuk Eselon IIA ............... 80
xi
Universitas Indonesia
DAFTAR GAMBAR
Gambar 1.1 Diagram Tulang Ikan Permasalahan Mutasi Jabatan Struktural ......... 3 Gambar 2.1 Representasi Model Classification dengan Beberapa Metode ............ 9 Gambar 2.2 Metode Data Mining untuk Pengelolaan Sumber Daya Manusia ..... 16 Gambar 2.3 Metode Penelitian untuk Data Mining Staf Pengajar ....................... 17 Gambar 2.4 Perbandingan Akurasi Decision tree dengan Naïve Bayes ............... 22 Gambar 2.5 Theoretical Framework Penelitian .................................................. 29 Gambar 3.1 Kerangka Kerja Penelitian .............................................................. 31 Gambar 3.2 Hasil Survey Kdnuggets.com Tahun 2007 ...................................... 34 Gambar 4.1 Struktur Tabel yang Digunakan....................................................... 39 Gambar 4.2 Pola Pengisian Jabatan Struktural Eselon V .................................... 50 Gambar 4.3 Pola Pengisian Jabatan Struktural Eselon IIIB ................................. 67 Gambar 4.4 Output Algoritma Bayes NET untuk Data Eselon IIB ...................... 76 Gambar 4.5 Output Agoritma Bayes NET untuk Data Eselon IIA ....................... 81 Gambar 4.6 Grafik Persentase Akurasi Prediksi Class Eselon ............................ 83
xii
Universitas Indonesia
BAB 1 PENDAHULUAN
1.1
Latar Belakang
Pemerintah Kota Bogor merupakan salah satu bagian dari Pemerintah Provinsi Jawa Barat yang memiliki jumlah pegawai lebih dari 9000 orang. Pemerintah Kota Bogor terdiri dari 11 dinas, 6 badan, 6 kecamatan, 6 kantor dan 62 kelurahan. Sesuai dengan tugas pokok dan fungsi masing-masing unit kerja, pengelolaan kepegawaian dilakukan oleh Badan Kepegawaian Pendidikan dan Pelatihan Kota Bogor (BKPP). Secara Struktur BKPP terdiri dari 1 sekretariat dan 3 bidang yang di antaranya yaitu: Bidang Formasi, Pengadaan dan Kesejahteraan Pegawai, Bidang Pendidikan dan Pelatihan, serta Bidang Mutasi dan Pengembangan karir. Bidang Mutasi dan Pengembangan karir terdiri dari dua sub bidang yaitu Sub Bidang Mutasi Pegawai dan Sub Bidang Pengembangan Karir. Secara Khusus Sub Bidang Pengembangan Karir memiliki tugas pokok dan fungsi mengelola pengembangan karir pegawai, termasuk di dalamnya tugas belajar, izin belajar, ujian dinas serta mutasi jabatan struktural. Dalam hal mutasi jabatan struktural, Sub Bidang Pengembangan Karir dibantu oleh Badan pertimbangan Jabatan dan Kepangkatan (Baperjakat). Dalam Pasal 14, 15 dan 16 Peraturan Pemerintah Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural secara rinci dijelaskan tugas pokok hingga susunan anggotanya Baperjakat. Agar pengangkatan, pemindahan dan pemberhentian PNS dalam dan dari jabatan srtuktural eselon II ke bawah terjamin kualitas dan objektifitasnya, dibentuklah Badan Pertimbangan Jabatan dan Kepangkatan (Baperjakat). Baperjakat Instansi Daerah Kabupaten/Kota, yang dibentuk dan ditetapkan oleh Pejabat Pembina Kepegawaian Daerah Kabupaten/Kota (Bupati/Walikota). Ketua Baperjakat Instansi Daerah Kabupaten/Kota adalah Sekretaris Daerah Kabupaten/Kota dengan anggota para pejabat Eselon II dan Sekretaris
1
Universitas Indonesia
2
dijabat oleh pejabat Eselon III yang membidangi kepegawaian. Jumlah anggota Baperjakat untuk menjamin objektifitas dan kepastian dalam pengambilan keputusan ditetapkan dalam jumlah ganjil. Masa keanggotaan Baperjakat paling lama 3 tahun. Dalam hal Ketua Baperjakat Insansi Pusat dan Daerah kosong, maka Pejabat Pembina Kepegawaian menunjuk salah seorang anggota yang senior untuk menjadi ketua. Baperjakat Instansi Daerah Kabupaten atau Kota bertugas memberikan pertimbangan kepada Pejabat Pembina Kepegawaian dalam: 1.
Pengangkatan, pemindahan dan pemberhentian dalam dan dari jabatan struktural Eselon II ke bawah.
2.
Pemberian kenaikan pangkat bagi yang menduduki jabatan struktural, menunjukkan prestasi kerja yang luar biasa baiknya, atau menemukan penemuan baru yang bermanfaat bagi negara.
3.
Perpanjangan batas usia pensiun bagi PNS yang menduduki jabatan struktural eselon I dan eselon II.
4.
Pengangkatan Sekretaris Kabupaten/Kota.
Dalam mendukung pengelolaan kepegawaian di lingkungan Pemerintah Kota Bogor, BKPP mengelola Sistem Informasi Manajemen Kepegawaian (SIMPEG) yang menyimpan data kepegawaian Pemerintah Kota Bogor. SIMPEG mulai dikembangkan pada tahun 2009. SIMPEG merupakan aplikasi berbasis Web yang dikembangkan menggunakan bahasa pemrograman PHP dan datanya disimpan dengan menggunakan basis data MySQL. SIMPEG secara internal digunakan oleh BKPP untuk mengelola data kepegawaian, sedangkan secara eksternal dapat digunakan oleh seluruh Pegawai Negeri Sipil Pemerintah Kota Bogor untuk mengelola data masing-masing pegawai. 1.2
Perumusan Masalah
Berdasarkan hasil wawancara dengan Sekretaris Baperjakat yang juga menjabat sebagai Kepala Bidang Mutasi dan Pengembangan Karir, diketahui terdapat permasalahan dalam penyusunan usulan draft mutasi jabatan struktural yaitu: tim Baperjakat mengalamai kesulitan dalam menyusun calon pejabat struktural yang selama ini dilakukan secara manual. Universitas Indonesia
3
Sistem yang ada (SIMPEG) belum dapat memberikan usulan secara otomatis apabila terjadi kekosongan jabatan struktural akibat pejabat pensiun maupun rotasi jabatan. Dalam hal ini tim Baperjakat melakukan penelusuran data melalui SIMPEG secara manual terhadap calon-calon yang diusulkan mengisi jabatan struktural. Di sisi lain Peraturan Pemerintah tidak secara spesifik mengatur bagaimana teknis pengisian jabatan struktural yang baik dan benar. Adapun beberapa peraturan yang mengatur pengisian jabatan struktural sifatnya umum contohnya pangkat minimum yang harus dipenuhi untuk mengisi suatu jabatan struktural. Hal-hal yang lebih spesifik seperti tingkat pendidikan, pengalaman bekerja pada suatu unit kerja, maupun pendidikan dan pelatihan yang pernah ditempuh seorang pegawai belum diatur dalam Peraturan Pemerintah yang ada. Secara umum permasalahan yang ada dapat digambarkan dalam diagram tulang ikan pada Gambar 1.1:
Gambar 1.1 Diagram Tulang Ikan Permasalahan Mutasi Jabatan Struktural Dari Gambar 1.1 terlihat beberapa faktor utama yang menyebabkan kesulitan dalam penyusunan draft mutasi jabatan struktural. 1. Berdasarkan hasil wawancara dengan sekretaris Baperjakat sebagai nara sumber (Lampiran 1, Jawaban 2), terdapat kalimat “Selain dari pada itu, akan sangat membantu tim Baperjakat jika SIMPEG mampu mengusulkan namanama calon pejabat struktural jika terjadi mutasi jabatan struktural.” Kalimat tersebut menujukkan adanya permasalahan dalam sistem, yaitu SIMPEG tidak dapat memberikan usulan calon pejabat struktural. Hal tersebut dikarenakan Universitas Indonesia
4
saat ini SIMPEG tidak dilengkapi dengan kemampuan pendukung keputusan. Untuk memiliki kemampuan tersebut, maka pola pengisian jabatan struktural harus diketahui terlebih dahulu. 2. Pada pernyataan lainnya dalam wawancara dengan nara sumber (Lampiran 1, Jawaban 1), terungkap, “Tim Baperjakat merasa kesulitan dalam menelusuri data calon pejabat struktural yang diusulkan.” Selain itu nara sumber menyatakan, “…, dan kita tetap harus menelusuri data tersebut secara manual satu per satu dengan menggunakan aplikasi SIMPEG.” Kedua pernyataan tersebut menunjukkan bahwa salah satu akar permasalahan mengenai data adalah penelusuran data calon pejabat struktural masih dilakukan secara manual satu per satu. 3. Pada pernyataan lainnya dalam wawancara dengan nara sumber (Lampiran 1, Jawaban 3), terdapat kalimat, “Peraturan Pemerintah No 13 tahun 2002 tidak secara spesifik mengatur mana komponen kepegawaian yang menjadi prioritas dalam mengisi suatu jabatan struktural.” Kalimat tersebut menunjukkan bahwa dari sisi regulasi tim Baperjakat merasa kesulitan dalam mencari panduan yang spesifik yang dapat dijadikan acuan untuk menentukan pengisian jabatan struktural. Berdasarkan akar permasalahan sistem yang ada maka dapat ditarik suatu pertanyaan riset untuk penelitian ini yaitu: “Apakah pola yang sesuai untuk melakukan pengisian jabatan struktural di setiap tingkat eselon pada Pemerintah Kota Bogor?" 1.3
Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mempelajari pola pengisian jabatan struktural yang ada (2009-2013) dari basis data SIMPEG dengan menggunakan teknik data mining classification. Dengan demikian dapat ditemukan suatu acuan yang dapat digunakan SIMPEG untuk memberikan usulan calon pejabat struktural. Teknik data mining classification adalah salah satu teknik data mining yang dapat digunakan untuk membangun model prediksi berdasarkan classifier yang akan diprediksi. Hal tersebut berbeda dengan dua teknik data mining lainnya, yaitu association rule yang digunakan untuk melihat keterkaitan atribut, Universitas Indonesia
5
dan clustering yang digunakan untuk mengelompokkan data berdasarkan kemiripan atau kedekatan data (Han dan Kamber, 2006). 1.4
Manfaat Penelitian
Hasil dari penelitian ini adalah pola pengisian jabatan struktural yang diharapkan akan memudahkan tim Baperjakat dalam menyusun draft mutasi jabatan struktural. Dengan diketahuinya pola pengisian jabatan struktural maka SIMPEG dapat memberikan usulan nama calon pejabat struktural, sehingga tim Baperjakat tidak perlu melakukan penelusuran data sefcara manual satu per satu. Hal ini juga tentunya dapat melengkapi dan memperjelas PP No 13 Tahun 2002 terkait pengisian jabatan struktural di lingkungan pemerintah. Penelitian ini juga dapat dijadikan salah satu sumber rujukan bagi penelitian lainnya khususnya dalam hal penyusunan draft mutasi jabatan struktural di lingkungan pemerintah. 1.5
Ruang Lingkup Penelitian
Ruang lingkup penelitian ini adalah melakukan penambangan data (data mining) dari data kepegawaian di lingkungan Pemerintah Kota Bogor dari basis data SIMPEG dari tahun 2009 hingga 2014. Metode yang digunakan dalam penelitian ini untuk melakukan penambangan data adalah teknik data mining classification untuk menemukan pola pengisian jabatan struktural pada Pemerintah Kota Bogor. Penelitian ini tidak akan membahas komponen lain di luar sistem seperti keterbatasan data mutasi jabatan yang ada. Data yang tersedia pada SIMPEG adalah data kepegawaian dari tahun 2009 sampai dengan 2014. Penelitian ini juga tidak akan membahas solusi bagi permasalahan terkait regulasi mengingat hal tersebut merupakan kewenangan pemerintah pusat. Data jabatan struktural yang digunakan adalah tingkat Eselon IIA ke bawah, karena eselon I hanya terdapat di tingkat pemerintah provinsi.
Universitas Indonesia
BAB 2 TINJAUAN PUSTAKA
Dalam tinjauan pustaka ini akan dibahas teori dasar, metodologi yang akan digunakan, serta penelitian terdahulu yang terkait dengan penelitian ini. Untuk mempelajari pola pengisian jabatan struktural di lingkungan Pemerintah Kota Bogor dengan sumber basis data SIMPEG, dapat digunakan teknik data mining. 2.1
Data Mining
Data mining adalah suatu proses yang menggunakan teknik statistik, matematika, kecerdasan
buatan
dan
machine-learning
untuk
mengekstraksi
dan
mengindentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai basis data besar (Turban, 2005). Dalam buku yang berjudul Decision Support System And Intelligent Systems, Turban, Aronson, dan Liang menjelaskan beberapa karakteristik utama dan sasaran data mining di antaranya sebagai berikut:
Data sering dikubur pada sebuah basis data yang sangat besar, yang kadangkadang berisi data dari beberapa tahun. Dalam banyak kasus, data dihapus dan dikonsolidasi di dalam sebuah data warehouse.
Lingkungan data mining biasanya adalah arsitektur client/server atau arsitektur berbasis Web.
Piranti baru yang canggih, meliputi visualisasi yang canggih membantu memindahkan informasi atau mengubur informasi dalam berkas-berkas perusahaan atau arsip catatan publik.
Pemilik data biasanya adalah end user yang diberdayakan oleh data drill dan alat query lainnya untuk mengajukan pertanyaan khusus dan mendapatkan jawaban secara tepat dengan sedikit atau tanpa keterampilan pemrograman.
Pemaksaan sering melibatkan penemuan hasil yang tidak diharapkan dan mengharuskan end user untuk berpikir kreatif.
Piranti data mining sudah digabung dengan spreadsheet dan piranti pengembangan perangkat lunak lainnya, sehingga data yang sudah diolah dengan data mining dapat dianalisis dan diproses dengan cepat dan mudah. 6
Universitas Indonesia
7
Karena ada sejumlah besar data dan usaha pencarian dalam skala besar, maka pemrosesan paralel untuk data mining kadang-kadang perlu digunakan.
Menurut Han dan Kamber dalam bukunya pada tahun 2006, yang berjudul Data Mining Concepts and Techniques, data mining didefinisikan sebagai ekstraksi dari pengetahuan yang menarik (aturan, pola, kebiasaan, batasan) yang bersumber dari basis data dalam skala besar. Berdasarkan dua definisi di atas dapat disimpulkan bahwa data mining adalah suatu cara yang dapat digunakan untuk mengekstraksi pengetahuan dengan beberapa teknik seperti statistik, matematika, kecerdasan buatan dan machine-learning yang bersumber dari basis data yang berskala besar. Pada umumnya data mining sering disinonimkan dengan istilah Knowledge Discovery from Data (KDD). Meskipun demikian secara khusus data mining hanyalah suatu langkah penting dalam urutan proses knowledge discovery. Proses knowledge discovery terdiri atas beberapa iterasi terurut seperti yang dapat dijelaskan sebagai berikut (Han dan Kamber, 2006): 1.
Data Cleaning: bertujuan menghapus noise dan data yang tidak konsisten.
2.
Data Integration: merupakan tahap dengan beberapa sumber data yang dikombinasikan.
3.
Data Selection: tahap pemilihan data yang relevan dari basis data yang akan digunakan untuk proses analisis.
4.
Data Transformation: Data ditransformasi dan dikonsolidasi dalam bentuk yang sesuai untuk kebutuhan data mining, misalnya dengan cara menyusun summary atau agregat.
5.
Data mining: proses penting dengan penerapan metode intelijen untuk dapat mengekstrak pola data.
6.
Pattern Evaluation: untuk mengidentifikasi pola yang merepresentasikan basis pengetahuan yang ditemukan.
7.
Knowledge Presentation: adalah suatu tahap yang menggunakan teknikteknik
visualisasi
dan
representasi
pengetahuan,
digunakan
untuk
menghasilkan pengetahuan yang dibutuhkan oleh pengguna.
Universitas Indonesia
8
2.2
Teknik Dasar dalam Data Mining
Berdasarkan kegunaannya data mining memiliki beberapa teknik dasar seperti association yang dapat digunakan untuk analisis market-basket, classification and prediction yang dapat digunakan untuk quality control, serta cluster analysis yang dapat digunakan untuk mendesain segmentasi pasar (Han dan Kamber, 2006). 2.2.1 Teknik Classification Classification adalah proses menemukan model atau fungsi yang menjelaskan konsep atau kelas data. Proses ini bertujuan agar dapat memanfaatkan model yang didapat untuk memprediksi kelas dari sebuah objek yang belum diketahui sebelumnya (Han dan Kamber, 2006). Serupa dengan asssociation rule, Classification memiliki dua tahapan utama yang terdiri dari: 1.
Mengestimasi akurasi prediktif dari model yang dibuat.
2.
Jika nilai akurasi yang didapatkan dapat diterima, model dapat digunakan untuk memprediksi kelas dari objek yang belum diketahui sebelumnya.
Terdapat beberapa metode yang dapat digunakan untuk membangun model classification seperti fungsi IF-THEN sederhana, decision tree atau neural network (dapat dilihat ilustrasinya pada Gambar 2.1).
Universitas Indonesia
9
Gambar 2.1 Representasi Model Classification dengan Beberapa Metode Sumber: Han dan Kamber (2006)
Berdasarkan Gambar 2.1, dapat dilihat bahwa model classification berdasarkan umur dan penghasilan dapat dibentuk dengan menggunakan beberapa metode seperti fungsi IF-THEN (a), decision tree (b), dan neural network (c) untuk memprediksi apakah suatu objek termasuk ke dalam kelas A, B atau C. Fungsi IF-THEN dapat digunakan untuk menyusun rule-based classifier. Bentuk umum dari fungsi IF-THEN cukup sederhana yaitu IF condition Then conclusion. Contoh sederhana penggunaan fungsi IF-THEN sebagai berikut: Rule R1: IF age = youth AND student = yes THEN buys_computer = yes. Bagian IF dari R1 disebut sebagai rule antecedent atau precondition, sedangkan bagian THEN-nya disebut rule consequent. Kondisi pada rule antecendent dapat berisi satu atau lebih attribute test (dalam hal ini sebagai contoh: age = youth AND student = yes) yang secara logika matematika terhubung dengan fungsi logika AND. Rule consequent dapat berisi prediksi kelas. Dalam hal ini kita memprediksi apakah pelanggan akan membeli sebuah komputer. Jika suatu kondisi dalam rule antecendent bernilai TRUE dalam suatu baris data transaksi, maka data transaksi tersebut memenuhi rule antecendent dan rule-nya berlaku untuk data tersebut (Han dan Kamber, 2006). Beberapa algoritma yang menggunakan teknik dasar ini di antaranya algoritma Jrip, One R, dan Classification Based on Association (Weka, 2012). Universitas Indonesia
10
Decision tree adalah diagram pohon yang bentuknya mirip dengan diagram flow chart. Pohon tersebut memiliki tiga bagian utama yaitu internal node berupa uji dari sebuah atribut, branch yang merepresentasikan hasil uji (setiap baris dari branch bernilai sama untuk atribut yang telah diuji), dan leaf node merepresentasikan label dari kelas atau distribusi dari label kelas. Untuk mengetahui kelas dari sampel yang tidak diketahui, nilai atribut dari sampel diujikan terhadap decision tree yang disusun. Decision tree dapat dengan mudah dikonversi menjadi classification rules. Beberapa algoritma yang menggunakan teknik ini di antaranya algoritma J48, AD tree, dan simple cart (Weka, 2012). Neural network menggunakan algoritma pembelajaran back propagation yang terdiri dari sekelompok input atau output yang saling berhubungan, dengan setiap hubungan memiliki bobot yang saling terkait. Pada fase pembelajaran, neural network belajar dengan cara menyesuaikan bobot sehingga memiliki kemampuan memprediksi kelas dari input baris data dengan benar. Proses pembelajaran neural network juga sering disebut connectionist learning dikarenakan adanya beberapa hubungan diantara beberapa unit data rules. Beberapa algoritma yang menggunakan teknik ini di antaranya yaitu algoritma RBF network, voted perceptron, dan multilayer perceptron (Weka, 2012). 2.2.2 Teknik Association Rule Association rule merupakan usaha untuk menemukan pola berulang (frequent pattern), keterkaitan (association), korelasi atau struktur sebab-akibat dari beberapa kumpulan data atau objek pada transaksi dalam basis data, basis data relasional, dan sumber repositori informasi lainnya. Tujuan utama association rule adalah menemukan suatu keteraturan dalam data, misalnya produk yang sering dibeli secara bersamaan dalam sebuah transaksi belanja, produk lain yang akan dibeli jika kita membeli sebuah komputer, tipe DNA yang sensitif terhadap suatu obat baru, dan otomasi klasifikasi dokumen Web (Han dan Kamber, 2006).
Universitas Indonesia
11
Data transaksi belanja seringkali digunakan sebagai contoh untuk menerangkan association rule misalnya sebagai berikut:
Diperoleh bentuk umum A→B [support,confidence].
Pembelian(x,“pembalut”) → Pembelian(x,“minuman ringan”) [0,5%;60%]
Dari dua poin di atas dapat dijelaskan bahwa nilai support dari association rule sebesar 0,5%. Hal tersebut menunjukkan bahwa 0,5% dari seluruh transaksi pembalut dan minuman ringan dibeli secara bersamaan. Nilai confident sebesar 60% menunjukkan bahwa 60% dari seluruh pelanggan yang membeli pembalut, juga membeli minuman ringan. Rule yang memenuhi nilai minimum support dan confidence threshold disebut sebagai strong rule. Secara umum nilai confidence dan support dapat ditentukan dengan persamaan berikut:
A dan B adalah sebuah itemset dari transaksi T, sedangkan itemset merupakan sekumpulan item I yang terdiri dari {I1,I2, …,Im}, dengan A
I, B
I, dan
A∩B=φ. Notasi P (A B) adalah nilai kemungkinan dari munculnya transaksi A dan B secara bersamaan. Beberapa istilah yang sering digunakan dalam association rule di antaranya yaitu itemset, yang merupakan sekelompok item dalam sebuah transaksi dalam basis data. Itemset yang berisi sejumlah k item disebut k-itemset. Misalnya {minuman ringan, pembalut}, disebut sebagai 2-itemset. Jika sebuah itemset memenuhi nilai minimum support yang ditentukan, maka itemset tersebut merupakan frequent itemset. Sekumpulan frequent k-itemsets biasanya dinotasikan sebagai Lk.
Universitas Indonesia
12
Secara umum association rule memiliki dua tahapan proses yaitu: 1.
Cari semua frequent itemsets: secara definisi setiap itemset setidaknya akan muncul sebanyak yang didefinisikan oleh jumlah minimum support atau biasa disingkat min_sup.
2.
Merumuskan association rule dari frequent itemsets: secara definisi aturan ini harus memenuhi minimum support dan minimum confidence.
Tahap kedua tentunya lebih mudah dibanding tahap pertama, seluruh performa dari Association Rule Mining sangat ditentukan oleh tahap pertama yaitu mencari semua frequent itemsets. 2.2.3 Teknik Cluster Analysis Proses pengelompokkan sekumpulan objek dalam beberapa kelas yang memiliki kemiripan disebut clustering. Sebuah cluster adalah kumpulan beberapa objek data yang memiliki kesamaan satu sama lain dalam cluster yang sama dan berbeda dengan objek lain dalam cluster yang lain (Han dan Kamber, 2006). Dengan otomasi clustering kita dapat mengidentifikasi kepadatan dan sebaran dari sebuah area yang terdiri atas beberapa objek, sehingga kita dapat menemukan pola sebaran dan korelasi yang menarik diantara atribut data. Cluster analysis sudah banyak digunakan dalam beragam aplikasi seperti riset pasar, pengenalan pola, analisis data, dan pemrosesan citra digital. Clustering sering juga disebut sebagai segmentasi data dalam berbagai aplikasi karena clustering dapat membagi sejumlah besar data ke dalam beberapa kelompok berdasarkan kesamaannya. Jenis data yang umumnya digunakan pada clustering di antaranya yaitu variabel skala interval, variabel biner, variabel nominal, ordinal, dan rasio, serta gabungan dari beberapa tipe variabel. Beberapa metode clustering yang sering digunakan di antaranya yaitu:
Algoritma partisi: menyusun beragam partisi lalu mengevaluasi hasilnya dengan menggunakan beberapa kriteria.
Universitas Indonesia
13
Algoritma hirarki: menciptakan dekomposisi hirarki dari sekelompok data atau objek dengan menggunakan beberapa kriteria. Density-based: pendekatan clustering berdasarkan konektifitas dan fungsi
density. Grid-based: pendekatan clustering berdasarkan beberapa tingkat struktur
granularity. Model-based: pendekatan clustering berdasarkan hasil hipotesis sebuah
model dari setiap cluster yang terbentuk dengan tujuan untuk mencari model terbaik yang sesuai. 2.3
Pengangkatan Pegawai Negeri Sipil dalam Jabatan Struktural
Peraturan Pemerintah yang mengatur pengisian jabatan struktural secara umum tertuang dalam Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang pengangkatan Pegawai Negeri Sipil dalam jabatan struktural yang kemudian diperbarui dengan Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002. Beberapa poin penting yang diperbarui dalam peraturan tersebut adalah jenjang pangkat golongan terendah dan tertinggi untuk masing-masing tingkat eselon seperti yang dapat dilihat pada Tabel 2.1: Tabel 2.1 Jenjang Pangkat Golongan untuk Setiap Tingkat Eselon No
Eselon
1 2
Ia Ib
3 4 5 6 7 8 9
Jenjang Pangkat, Golongan / Ruang Terendah Tertinggi Pangkat Gol / Pangkat Ruang IV/e IV/d
Pembina Utama Pembina Utama
II a
Pembina Utama Pembina Utama Madya Pembina Utama Muda
IV/c
II b III a III b IV a IV b V
Pembina Tingkat I Pembina Penata Tingkat I Penata Penata Tingkat I Penata Muda
IV/b IV/a III/d III/c III/b III/a
Pembina Utama Madya Pembina Utama Muda Pembina Tingkat I Pembina Penata Tingkat I Penata Penata Tingkat I
Gol / Ruan g IV/e IV/e IV/d IV/c IV/b IV/a III/d III/c III/b
Sumber : Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002. Universitas Indonesia
14
Berdasarkan Tabel 2.1 diketahui bahwa Baperjakat dapat menggunakan tabel tersebut sebagai acuan dasar untuk menentukan kriteria yang diperlukan dalam mengisi jabatan struktural. Dalam hal ini pangkat dan golongan merupakan suatu atribut yang nantinya akan digunakan dalam proses data mining untuk mengetahui pola pengisian jabatan struktural pada Pemerintah Kota Bogor. Beberapa atribut lain yang dapat digunakan untuk menemukan pola pengisisian jabatan struktural sebetulnya tercantum pada Pasal 6 dalam Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 yang secara eksplisit menyebutkan bahwa faktor senioritas dalam kepangkatan, usia, pendidikan dan pelatihan jabatan serta pengalaman yang dimiliki merupakan beberapa hal yang bisa menjadi bahan pertimbangan Pembina Kepegawaian Daerah dalam mengisi suatu jabatan struktural. Namun tidak ada pembobotan atau skala prioritas terhadap faktor-faktor tersebut untuk menilai kelayakan seorang pegawai mengisi jabatan struktural. Oleh karena itu pemanfaatan data mining pada penelitian ini ditujukan untuk mengetahui skala prioritas mana yang lebih didahulukan diantara beberapa faktor tersebut dengan menggunakan basis data SIMPEG sebagai sumber datanya. 2.4
Penelitian Terdahulu
Beberapa penelitian terdahulu yang pernah dilakukan terkait dengan penggunaan data mining dapat dijelaskan sebagi berikut: 2.4.1 Data Mining Classifcation Technique
for Talent Management using
SVM (S.Yashoda, P.S.Prakash, 2012) Salah satu tantangan pada pengelolaan sumber daya manusia adalah mengelola bakat yang ada pada sumber daya manusia dalam organisasi. Masalah dalam mengelola potensi bakat pada sumber daya manusia di dalam organisasi dapat diselesaikan dengan menggunakan teknik data mining classification dari beberapa teknik classification yang sering digunakan seperti: decision tree, neural network, support vector machine, dan algoritma nearest neigbour. Penelitian ini menggunakan pendekatan gabungan antara Class Attributee Contingency Coefficient (CACC) dengan support vector machine. Data yang digunakan dalam penelitian ini adalah UCI adult data set yang merupakan data Universitas Indonesia
15
sensus pendapatan tahun 1994 yang dapat diunduh pada alamat situs http://archive.ics.uci.edu/ml/machine-learning-databases/adult/. Dari 14 atribut yang tersedia (umur, bidang pekerjaan, nilai final weight, lamanya pendidikan formal yang pernah ditempuh, status nikah, pekerjaan, hubungan keluarga, suku, jenis kelamin, keuntungan modal, kerugian modal, jumlah jam kerja mingguan dan kewarganegaraan), hanya 6 atribut yang digunakan dengan tipe data continous seperti yang ditunjukkan pada Tabel 2.2: Tabel 2.2 Atribut dengan Tipe Data Continous yang Digunakan Umur
Finalweight
18,5 20,5 30 40,5 48 54,5 70,5
30609 45718 13052e+005 19275e+005 23584e+005 29367e+005 46013e+005
Tahun pendidikan yang ditempuh 3,5 5,5 9,5 10,5 12,5 13,5 15,5
Keuntungan investasi
Kerugian investasi
Jam kerja dalam seminggu
0 0 0 0 0 527,5 11356
0 0 0 0 0 0 1932
11 19 35 40 45 50,5 70
Sumber: S.Yashoda, P.S.Prakash (2012)
Data pada Tabel 2.2 merupakan hasil proses diskretisasi dengan menggunakan algoritma CACC pada atribut-atribut yang bernilai kontinu. Selanjutnya data ini yang akan dijadikan dasar untuk melakukan classification dengan menggunakan algoritma SVM. Metode yang digunakan dalam penelitian dapat dilihat pada Gambar 2.2:
Universitas Indonesia
16
Gambar 2.2 Metode Data Mining untuk Pengelolaan Sumber Daya Manusia Sumber: S.Yashoda, P.S.Prakash (2012)
Terdapat 75% data set digunakan sebagai train set dalam algoritma classification SVM dan sisanya digunakan untuk memvalidasi model. Dari 4 kernel yanga ada pada algoritma SVM (linier, polinomial, sigmoid, dan basis radial), kernel berbasis radial yang dipilih dengan beberapa alasan.Fungsi non linier yang dimiliki basis radial dapat menghasilkan pemetaan data dengan dimensi data yang lebih tinggi dibanding dengan basis linier. Basis radial memiliki hyper parameter yang lebih sedikit dibandingkan dengan kernel polynomial, terlebih lagi basis radial memiliki tingkat kesulitan numerik yang lebih rendah. Seperti yang dapat dilihat pada Gambar 2.2, penelitian ini juga menggunakan algoritma Sequential Mining Optimization (SMO), untuk menghasilkan model classification yang lebih optimal dengan menggunakan Matlab versi 7.10. Hasil dari penelitian ini berupa suatu gabungan beberapa metode yang dapat digunakan untuk melakukan classification pada data sumber daya manusia. Namun proses classification pada penelitian belum selesai dilakukan dan masih dalam proses pengerjaan. Model klasifikasi yang terbentuk diharapkan dapat digunakan untuk memprediksi potensi bakat yang sesuai untuk suatu posisi dalam organisasi.
Universitas Indonesia
17
2.4.2 The Decision Tree Classifcation and
Its Application Research
in
Personnel Management (Peng Ye, 2011) Penelitian ini berusaha menerapkan pola decision tree classification untuk melakukan prediksi dalam mengidentifikasi bakat para pengajar pada sebuah universitas. Beberapa atribut yang digunakan pada penelitian ini adalah tingkat pendidikan, jenis kelamin, nilai calon pegawai, nilai dari institusi sekolah formal yang pernah diikuti, umur, pekerjaan suami atau istri, dan gelar profesional. Penelitian menggunakan algoritma C.45 yang diimplementasikan dengan menggunakan bahasa pemrograman Visual Basic 6.0 dan memanfaatkan Microsoft ODBC Driver sebagai sarana koneksi data yang akan diolah. Langkah-langkah penelitian dapat dilihat pada Gambar 2.3.
Gambar 2.3 Metode Penelitian untuk Data Mining Staf Pengajar Sumber: Peng Ye (2011)
Sesuai dengan Gambar 2.3, tahap awal yang dilakukan pada penelitian ini yaitu mengumpulkan data (data collection) dari beberapa sekolah dan departemen yang berbeda. Misalnya informasi dasar mengenai data pengajar diperoleh dari bagian kepegawaian, sedangkan data hasil penelitian ilmiah diperoleh dari kantor administrasi kependidikan. Proses penggabungan dan pengelolaan data dari beberapa sumber dan struktur yang berbeda merupakan hal yang kompleks. Tahap
selanjutnya
adalah
pretreatment
data
yang
dilakukan
dengan
membersihkan data dari noise dan data yang tidak berhubungan. Ada beberapa data yang kosong dan duplikasi data pada atribut latar belakang pendidikan, selain itu perlu melakukan transformasi pada tipe data yang digunakan. Pada tahap ini juga dilakukan penyeragaman terhadap sinonim data, seperti kata “tidak ada”, “tidak memiliki reputasi”, “tidak bergelar”, “non-partisan”, atau bahkan ditemukan pula yang hanya diisi dengan angka 0. Tahap selanjutnya yaitu Universitas Indonesia
18
persiapan data (data preparation) dengan melakukan stratifikasi pada beberapa atribut (pemetaan) sebagai berikut:
Untuk atribut jenjang pendidikan diurutkan sebagai berikut: SMP (00), SMA (11), sekolah politeknik (01), pendidikan lebih tinggi (02), bachelor (03), double degree (33), master (04), doctor (05), postdoctoral (06).
Untuk atribut title professional atau teknis sebagai berikut: tanpa titel (0), pemula (1), menengah (2), madya (3), dan tingkat tinggi (4).
Untuk atribut jenis kelamin sebagai berikut: wanita (0), pria (1).
Untuk nilai dari institusi sekolah formal yang pernah diikuti sebagai berikut: 95-100 (A), 85-95 (B), 75-85 (C), 60-75(D), 60 (E).
Untuk atribut tipe institusi pendidikan sebagai berikut: Sekolah bergengsi (A), Sekolah umum (B), Perguruan tinggi (C), sekolah diploma (D), SMA (E), SMP (F), Sekolah luar negeri (G). Tahap selanjutnya melakukan data mining dengan algoritma classification
decision tree 4.5 yang melalui beberapa proses interaksi dasar sebagai berikut:
Decision tree dimulai dengan satu titik tunggal training samples.
Jika seluruh training samples memiliki klasifikasi yang sama, maka titik tersebut menjadi cabang dari dan diberi tanda dengan klasifikasi tersebut.
Jika tidak, algortima decision tree menggunakan pengumpulan informasi sebagai pengukuran, lalu memilih salah satu atribut yang terbaik untuk melakukan klasifikasi pada training samples.
Menyusun percabangan untuk setiap nilai atribut yang akan dijadikan dasar untuk melakukan klasifikasi pada training samples.
Penggunaan fungsi rekursi dari seluruh pembagian decision tree sample. Lakukan terus fungsi rekursi hingga memenuhi kondisi akhir fungsi rekursi.
Penghentian fungsi rekursi.
Pada saat seluruh cabang dari training samples telah terklasifikasi, tandai cabang tersebut dengan klasifikasi terkait.
Pada saat tidak ada lagi atribut yang dapat membagi training samples, hentikan proses dan tandai cabang tersebut dengan klasifikasi terkait.
Universitas Indonesia
19
Pada saat percabangan tidak lagi memiliki training samples, hentikan proses dan tandai cabang tersebut denngan mayoritas klasifikasi dari training samples yang digunakan.
Setelah dilakukan klasifikasi pada data staf pengajar ditemukan beberapa pola sebagai berikut:
Jika memiliki posisi B (division level), dengan umur (41-45), maka dapat diklasifikasikan sebagai class N (is not lost).
Jika memiliki tingkat pendidikan 05 (Ph.d), dengan pekerjaan istri C (tidak memuaskan), dengan umur B (31-40), maka dapat diklasifikasikan sebagai class Y (the loss of). Kesimpulan yang dapat ditarik dari pola data di atas adalah staf pengajar
dengan tingkat pendidikan doktoral yang berumur 30 hingga 45 cenderung merasa tidak puas atau pasangannya tidak bekerja di tempat yang sama. Selain itu pengajar yang lulus pada umur 25 hingga 35 tahun memiliki kecenderungan tidak efektif bekerja karena ingin melanjutkan studi. 2.4.3 Data mining classification Techniques for Human Talent Forecasting (Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman, 2011) Penelitian ini merupakan implementasi data mining untuk manajemen bakat sumber daya manusia khususnya menggunakan teknik
Classification
and
prediction dengan mengidentifikasi pola yang berhubungan dengan bakat sumber daya manusia. Dikarenakan alasan kerahasiaan dan keamaanan data dari bagian kepegawaian, penelitian ini menggunakan dua dataset yang dihasilkan dari dataset rule generator, dataset1 menghasilkan 100 data dan dataset2 menghasilkan 1000 data berdasarkan faktor-faktor bakat dan performa kerja. Selain itu data outlier pada dataset1 dijadikan dataset terpisah yaitu dataset3. Atribut data yang digunakan pada penelitian ini dapat dijelaskan pada Tabel 2.3.
Universitas Indonesia
20
Tabel 2.3 Atribut dan Variabel yang Digunakan Atribut Latar Belakang (7) Evaluasi kinerja sebelumnya (15) Pengetahuan dan kemampuan (20)
Kemampuan manajemen (6) Kualitias individu (5)
Nama Variabel D1, D2, D3, D5, D6, D7, D8
Keterangan Umur,jenis kelamin, masa kerja, promosi DP1, DP2, DP3, DP4, DP5, DP6, Penilaian kinerja dalam DP7, DP8, PP9, DP10, DP11, 15 tahun DP12, DP13, DP14, DP15 PQA,PQC1,PQC2, PQC3,PQD1, Kualifikasi professional PQD2,PQD3,PQE1, PQE2,PQE, (pengajar, pengawas, PQE4,PQE5,PQF1, PQF2,PQG1, peneliti) PQG2,PQH1,PQH2,PQH3,PQH4 PQB, AC1, AC2, AC3, AC4, Kemampuan AC5 administratif T1, T2, SO, AA1, AA2 Pelatihan, penghargaan
Sumber: Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman (2011)
Atribut yang digunakan pada Tabel 2.3 merupakan kombinasi dari 53 atribut yang didefinisikan dalam variabel dan 5 faktor performa kerja sumber daya manusia. Penelitian ini menggunakan 5 jenis algoritma classification yaitu (C 4.5, random forest, multi layer perceptron, radial basis function network, dan K-star) dengan menggunakan perangkat lunak WEKA (Waikato Environment Knowledge and Analysis) dan ROSSETA toolkit sebagai pengolah data. Tabel 2.4 Akurasi dari Model dengan Seluruh Atribut Algoritma Classification
Dataset 1
Dataset 2
Dataset 3
C 4.5
95,14
99,90
90,54
Random Forest
74,91
95,43
71,8
Multi Layer Perceptron Radial Basis Function Network K-Star
87,16 91,45 92,06
99,84 99,98 97,83
84,55 87,09 87,79
Sumber: Hamidah Jantan, Abdul Razak Hamdan,Zulaiha Ali Othman (2011)
Berdasarkan Tabel 2.4 dapat dilihat algoritma C.45 memiliki nilai akurasi yang lebih baik dibandingkan dengan algoritma lainnya. Dengan begitu teknik ini dapat digunakan untuk memprediksi data bakat sumber daya manusia selanjutnya dengan konstruksi classification rules yang terbentuk.
Universitas Indonesia
21
2.4.4 Pembandingan Tingkat
Akurasi Dua Model Data mining
yang
Dihasilkan oleh Decision tree Dan Naïve Bayes Studi Kasus: Suatu Perusahaan Manufaktur dan Penjualan Sepeda (Afif Farisi, 2007) Penelitian ini bertujuan melakukan simulasi pembuatan data mining model dengan mengambil dataset dari basis data dan data warehouse suatu perusahaan manufaktur
dan
penjualan
sepeda.
Implementasi
data
mining
dengan
membandingkan dua algoritma classification yang berbeda yaitu decision tree dan naïve bayes. Dataset yang digunakan dalam penelitian ini bersumber dari data pelanggan dan transaksi penjualan sepeda dengan pemilihan atribut yang dapat dilihat pada Tabel 2.5. Tabel 2.5 Atribut yang Digunakan pada Data Pelanggan dan Penjualan Atribut Ckey Mstatus Gender Kidnum Education Occupation Hstatus CarNum IPYear Region Age Bflag
Tipe Data Angka Karakter Karakter Karakter Karakter Karakter Karakter Karakter Karakter Karakter Angka Karakter
Keterangan Primary key Status perkawinan Jenis kelamin Jumlah anak Pendidikan terakhir Pekerjaan Kepemilikan rumah Jumlah kendaraan bermotor Rentang gaji Domisili Umur Membeli atau tidak membeli sepeda
Sumber: Afif Farisi (2007)
Tabel 2.7 menjelaskan atribut-atribut yang dimiliki pelanggan toko sepeda yang akan digunakan untuk mengetahui pola pelanggan yang berpotensi membeli atau tidak membeli sepeda. Dari seluruh dataset yang ada 90% dataset digunakan sebagai train set, dan 10% digunakan sebagai test set. Data mining tool yang digunakan dalam penelitian ini adalah SQL Server Analysis Service yang merupakan fitur dari Microsoft SQL Server 2005. Dengan menggunakan algoritma decision tree didapatkan 116 pola yang terbentuk dengan temuan beberapa fakta sebagai berikut:
99,99% pelanggan yang memiliki satu kendaraan bermotor, dengan rentang gaji 0 sampai dengan Rp 50.000.000 per tahun, dan umur 29 hingga 32 tahun, Universitas Indonesia
22
pada regional solo, tidak akan membeli sepeda. Namun kemungkinan munculnya seorang pelanggan dengan karakteristik tersebut hanya 0,25%.
99,99% pelanggan yang memiliki dua kendaraan bermotor, dengan rentang gaji Rp 100.000.000 sampai dengan Rp 150.000.000 per tahun, dan umur 39 hingga 41 tahun, dengan jumlah anak dua, akan membeli sepeda. Namun kemungkinan munculnya seorang pelanggan dengan karakteristik tersebut hanya 0,11%.
Dengan menggunakan algoritma naïve bayes, didapatkan 35 grup yang saling lepas, dengan fakta-fakta sebagai berikut: Kemungkinan terbesar grup yang akan membeli sepeda adalah pelangan yang tidak memiliki kendaraan bermotor, dengan persentase pembelian sebesar 63,59%. Kemungkinan munculnya seorang pelanggan dengan karakteristik tersebut adalah 22,94%. Kemungkinan terkecil grup yang akan membeli sepeda adalah pelangan umur di atas 59 tahun, dengan persentase pembelian sebesar 0,06%. Kemungkinan munculnya seorang pelanggan dengan karakteristik tersebut adalah 0,31%. Perbandingan tingkat akurasi dari dua algoritma yang digunakan dapat dilihat pada Gambar 2.4:
Gambar 2.4 Perbandingan Akurasi Decision tree dengan Naïve Bayes Sumber: Afif Farisi (2007)
Seperti yang terlihat pada Gambar 2.4, model decision tree menghasilkan tingkat akurasi 68,85% sedangkan model naïve bayes hanya menghasilkan tingkat akurasi 60,7%.
Universitas Indonesia
23
Berdasarkan tinjauan pustaka, penelitian sebelumnya, dan metodologi yang dijelaskan sebelumnya maka dapat disusun suatu perbandingan dalam bentuk tabel seperti yang terlihat pada Tabel 2.6 untuk perbandingan teori dan Tabel 2.7 untuk perbandingan penelitian terdahulu.
Universitas Indonesia
24
Tabel 2.6 Perbandingan Teknik Dasar Data Mining Perbandingan Teori
Compare
Contrast
Criticize
Synthesize
Summarize
Rujukan
Association Rule Mining
Suatu teknik
Digunakan untuk
Hanya
Suatu tahapan dalam
Suatu usaha
Jiawei Han, Michelin
dalam data
memepelajari
mempelajari
menggali
untuk
Kamber, (2006). Data
mining yang
pola keterkaitan
keterkaitan data
pengetahuan dalam
mengekstraksi
mining Concepts and
sering
yang ada dengan
tanpa
data, baik dengan
dan
Techniques. Morgan
mengelompokkan
cara mempelajari
mengindentifikasi
Kaufmann Publishers.
data
pola keterkaitan
informasi dari
antar data,
sumber basis data
digunakan untuk menggunakan
Classification
Clustering
proses
frequent itemset
Knowledge
yang muncul
Discovery in
Digunakan dalam
Kelas terbentuk
membangun model
yang besar
Data (KDD)
membangun
akibat rule yang
untuk memprediksi
dengan
model untuk
ada, bukan
klasifikasi data,
mengidentifikasi
prediksi kelas
berdaasarkan
maupun
aturan, pola,
suatu data atau
kesamaan atribut
mengelompokkan
keteraturan, dan
objek
pada data
data berdasarkan
kebiasaan yang
Digunakan untuk Pengelompokkan
kesamaan atribut
terbentuk
mengelompokkan
pada data
data cenderung
data berdasarkan berbentuk bulat kesamaan atribut akibat pendekatan data.
euclidean. Universitas Indonesia
25
Tabel 2.7 Perbandingan Peneletian Sebelumnya Perbandingan Penelitian
Compare
Contrast
Criticize
Synthesize
Summarize
Rujukan
Data mining Classifcation
Penggunaan
Menggabungkan
Pennggunaan
Gabungan algoritma
Classification
S.Yashoda, P.S.Prakash ,
Technique for Talent
beberapa teknik
algoritma CACC, data mining tool
CACC, SVM dan
digunakan untuk
(2012). Data mining
Management using SVM
dalam data
SVM dan SMO lain seharusnya
SMO untuk
menemukan
Classifcation Technique
mining yang
untuk teknik data lebih mudah
menghasilkan
model prediksi
for Talent Management
diterapkan pada
mining
dibandingkan
prediksi dengan
bakat
using SVM
data sumber
classification
menggunakan
akurasi yang lebih
kepegawaian
Matlab
baik
dalam organisasi
daya manusia The Decision tree
untuk
Implementasi
Membangun
Implementasi
Implementasi
Peng Ye. (2011). The
Classifcation And Its
menajemen
algoritma
model prediksi
algoritma C.45
Classification
Decision tree Classifcation
Application Research In
kepegawaian
Classification
tanpa melakukan
dalam antar muka
C.45 untuk
And Its Application
Personnel Management
yang lebih baik
C.45 pada data
tes prediksi
Visual Basic untuk
prediksi calon
Research In Personnel
memudahkan user
pegawai
Management
kepegawaian Data mining classification
Membandingkan
Masih banyak
Algoritma C 4.5
Membandingkan
Hamidah Jantan, Abdul
Techniques For Human
5 algoritma
algoritma lain
cukup akurat dalam
beberapa
Razak Hamdan,Zulaiha
Talent Forecasting
Classification
yang dapat
melakukan
algoritma
Ali Othman, (2011). Data
untuk
digunakan
Classification pada
diperlukan untuk mining classification
menentukan kelas
sebagai
data sumber daya
mendapatkan
Techniques For Human
pegawai
pembanding
manusia.
metode terbaik
Talent Forecasting
Universitas Indonesia
26
Perbandingan Penelitian
Compare
Contrast
Criticize
Synthesize
Summarize
Rujukan
Pembandingan Tingkat
Penerapan
Membandingkan
Tingkat akurasi
Penggunaan 2
Hasil
Afif Farisi. (2007).
Akurasi Dua Model Data
teknik data
algoritma
yang dihasilkan
algoritma
Classification
Pembandingan Tingkat
mining Yang Dihasilkan
mining
decision tree
dari Classification Classification
dapat digunakan
Akurasi Dua Model Data
Oleh Decision tree Dan
classification
dengan naive
tidak terlalu
bertujuan
untuk
mining Yang Dihasilkan
Naïve Bayes Studi Kasus:
untuk
bayes untuk data
tinggi
menghasilkan
mengidentifikasi
Oleh Decision tree Dan
Suatu Perusahaan
pengenalan pola
penjualan sepeda
alternatif akurasi
pola demografi
Naïve Bayes Studi Kasus:
Manufaktur Dan
dan prediksi
yang lebih baik
pelanggan yang
Suatu Perusahaan
potensial untuk
Manufaktur Dan Penjualan
membeli
Sepeda
Penjualan Sepeda
Universitas Indonesia
27
Berdasarkan Tabel 2.6, maka dapat dilihat bahwa dari beberapa teknik data mining yang dijelaskan oleh Jiawei Han dan Michelin Kamber dalam buku yang berjudul Data mining Concepts and Techniques tahun 2006 dapat disimpulkan bahwa teknik association rule tidak tepat digunakan pada penelitian ini dikarenakan teknik tersebut hanya untuk mempelajari pola keterkaitan yang ada dengan menggunakan frequent itemset yang muncul. Dengan demikian tidak dapat dijadikan acuan untuk melakukan prediksi pengisian jabatan struktural pada Pemerintah Kota Bogor. Teknik clustering juga tidak tepat digunakan pada penelitian ini dikarenakan teknik ini mengelompokan data berdasarkan kesamaan atribut data. Hal tersebut dapat digunakan, jika pengelompokan data belum diketahui sebelumnya. Sedangkan pada kasus jabatan struktural pengelompokan sudah terbentuk berdasarkan tingkat eselon yang ada pada setiap jabatan struktural. Oleh karena itu, teknik data mining yang tepat untuk digunakan pada penelitian ini adalah classification, mengingat teknik classification dapat mempelajari pola yang ada dari class yang sudah ditentukan sehingga dapat dibangun suatu model prediksi berdasarkan pola yang terbentuk. Penggunaan data pegawai dari tahun 2009 hingga tahun 2013 akan digunakan sebagai train set untuk mengenali pola data kepegawaian, pola yang dihasilkan akan dijadikan dasar untuk melakukan prediksi pengisian jabatan struktural pegawai di tahun 2014. Test set yang akan digunakan adalah data kepegawaian pada tanggal 10 Januari 2014, mengingat pada tanggal tersebut terjadi mutasi jabatan struktural di lingkungan Pemerintah Kota Bogor. Penelitian berujudul Data mining Classifcation Technique
for Talent
Management using SVM menujukkan bagaiman kombinasi beberapa algoritma classification seperti CACC, SVM, dan SMO dapat menghasilkan model prediksi dengan akurasi yang lebih baik dalam menggali bakat kepegawaian dalam suatu organisasi (S.Yashoda, P.S.Prakash, 2012). Penelitian berjudul Data mining classification Techniques For Human Talent Forecasting membuktikan bahwa alogirtma C4.5 memiliki akurasi yang lebih baik dibandingkan beberapa algoritma classification lainnya, untuk melakukan Universitas Indonesia
28
pengelompokkan kelas pegawai yang kemudian akan digunakan untuk meramal bakat dari sumber daya manusia yang ada (Hamidah Jantan, Abdul Razak Hamdan, Zulaiha Ali Othman, 2011). Penelitian berjudul The Decision tree Classifcation and Its Application Research In Personnel Management mencoba membangun suatu aplikasi berbasis desktop yang memiliki kemampuan memprediksi hasil perekrutan pegawai baru dengan mennggunakan teknik data mining classification (Peng Ye, 2011). Secara spesifik algoritma yang digunakan untuk melakukan classification adalah algoritma C4.5. Dalam studi kasus pengisian jabatan struktural di lingkungan Pemerintah Kota Bogor beberapa atribut data yang akan digunakan mengacu pada Peraturan Pemerintah No 13 tahun 2002 yaitu: golongan pegawai, masa kerja pegawai, tingkat pendidikan pegawai, pengalaman dalam unit kerja, umur pegawai serta pendidikan dan pelatihan yang pernah diikuti oleh pegawai. Dengan atribut tersebut maka metode data mining yang sesuai untuk menemukan pola pengisian jabatan struktural di lingkungan Pemerintah Kota bogor adalah teknik classification. Atribut tambahan yang akan digunakan adalah atribut jenjang jabatan yaitu jenjang jabatan fungsional maupun struktural, mengingat bisa saja ada pegawai dengan jenjang jabatan fungsional diangkat menjadi pejabat struktural meskipun hal tersebut jarang sekali terjadi di Pemerintah Kota Bogor. 2.5
Theoretical Framework
Untuk menyusun theoretical framework dalam penelitian ini dimulai dari beberapa teori dasar dalam data mining serta regulasi yang mengatur pengisian jabatan struktural bagi Pegawai Negeri Sipil. Berikut ini adalah theoretical framework dari penelitian ini:
Universitas Indonesia
29
Gambar 2.5 Theoretical Framework Penelitian Seperti yang dapat dilihat pada Gambar 2.5, dari beberapa teknik dasar mining yang ada, teknik classification dapat digunakan untuk mengidentifikasi pola prediksi suatu class yang belum di ketahui dari sumber data yang ada. Secara spesifik beberapa penelitian sudah memanfaatkan teknik classification untuk manajemen sumber daya manusia seperti talent management. Untuk mengetahui faktor-faktor apa saja yang dapat digunakan sebagai atribut penilaian dalam pengisian jabatan struktural bagi Pegawai Negeri Sipil, maka digunakan regulasi pemerintah yang tertuang dalam Peraturan Pemerintah No 100 Tahun 2000 dan Peraturan Pemerintah No 13 Tahun 2002. Pada pasal 6 dari peraturan tersebut disebutkan bahwa sebagai bahan pertimbangan dapat menggunakan penilaian pegawai berdasarkan pangkat dan golongan, masa kerja, umur, tingkat pendidikan, pendidikan dan pelatihan, serta pengalaman dalam unit kerja. Teknik data mining classification yang diterapkan pada manajemen sumber daya manusia dipengaruhi oleh 6 atribut yang berdasar pada Peraturan Pemerintah No 100 Tahun 2000 dan Peraturan Pemerintah No 13 Tahun 2002 serta satu atribut tambahan yaitu jenjang jabatan yang digunakan untuk melihat kecendurangan pengisian jabatan strukural pada jenjang jabatan struktural dan fungsional. Hasil data mining classification tentunya akan mempengaruhi model prediksi yang terbentuk. Model prediksi ini terdiri atas dua output yaitu pola pengisian
Universitas Indonesia
30
jabatan struktural yang terbentuk dari train set dan hasil prediksi pengisian jabatan struktural berdasarkan test set yang diprediksi.
Universitas Indonesia
BAB 3 METODOLOGI PENELITIAN
Dalam penelitian ini dilakukan eksperimen dengan menggunakan 62 algoritma cassification dengan 7 jenis data yaitu tingkat eselon yaitu Eselon V, Eselon IVB, Eselon IVA, Eselon IIIB, Eselon IIIA, Eselon IIB, dan Eselon IIA. 3.1
Tahapan Penelitian
Kerangka kerja penelitian yang digunakan berdasar pada metodologi penelitian studi kasus yang di dalamnya terdapat tahapan evaluasi dan analisis data. Objek studi kasus pada penelitian ini yaitu Pemerintah Kota Bogor. Secara bertahap kerangka kerja penelitian ini dapat dijelaskan pada Gambar 3.1:
Gambar 3.1 Kerangka Kerja Penelitian 31
Universitas Indonesia
32
Berdasarkan langkah-langkah metode penelitian seperti pada gambar 3.1, maka penelitian dimulai dengan pendefinisian masalah pengisian jabatan struktural berdasarkan hasil wawancara dengan nara sumber yaitu Sekretaris Baperjakat Pemerintah Kota Bogor, yang kemudian dapat ditarik suatu pertanyaan penelitan yaitu: “Apakah pola yang sesuai untuk melakukan pengisian jabatan struktural di setiap tingkat eselon pada Pemerintah Kota Bogor?" Untuk dapat menjawab pertanyaan penelitan tersebut tentunya diperlukan langkah untuk menentukan teknik pengumpulan data dan analisis yang diperlukan dengan cara melakukan studi literatur yang menghasilkan theoretical framework untuk penelitan ini. Langkah selanjutnya adalah mengidentifikasi proses bisnis dan data yang dibutuhkan untuk melakukan data mining dengan menggunakan atribut yang menjadi penilaian dalam jabatan struktural yang tercantum dalam Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002 tentang pengangkatan Pegawai Negeri Sipil dalam jabatan struktural. Setelah mendapatkan atribut yang diperlukan maka baru dapat dilakukan pengumpulan data dari basis data SIMPEG yang selanjutnya akan masuk ke dalam tahap pra-proses dalam data mining dengan menggunakan teknik ekstraksi data dan transformasi data. Proses tersebut akan menghasilkan train set dan test set. Train set digunakan untuk menghasilkan pola prediksi pengisian jabatan struktural. Test set digunakan untuk menguji akurasi dari pola prediksi yang terbentuk sebelumnya. Tahapan proses ini merupakan tahapan awal dalam proses Knowledge Discovery Data (KDD). Setelah data train set dan test set untuk proses data mining didapatkan, barulah proses pengolahan data dengan menggunakan classification dilakukan untuk mendapatkan pola pengisian jabatan struktural yang ada. Pola pengisian jabatan struktural yang terbentuk akan dijadikan dasar untuk memprediksi data calon pejabat struktural di tahun 2014. Hasil prediksi akan dibandingkan dengan data pejabat struktural aktual untuk mengukur akurasi dari prediksi yang dilakukan.
Universitas Indonesia
33
Setelah hasil prediksi dan nilai akurasinya diukur, maka dapat ditarik suatu kesimpulan secara umum dengan menggunakan teknik penarikan kesimpulan induktif dimana hal ini pada proses Knowledge Discovery Data (KDD) disebut juga sebagai knowledge presentation. 3.2
Metode Pengumpulan Data
Pengumpulan data pada penelitian ini dilakukan dengan menggunakan metode observasi langsung terhadap basis data kepegawaian dari Sistem Informasi Manajemen Kepegawaian (SIMPEG) Pemerintah Kota Bogor. Data yang digunakan dapat dilihat pada Tabel 3.1. Tabel 3.1 Data yang Tersedia Tujuan Mendapatkan atribut pangkat golongan pegawai pada saat menjadi pejabat struktural
Data Data SK Mutasi Jabatan Struktural Pegawai
Format Data MySQL
Rujukan 2009-2013 (sumber : SIMPEG Kota Bogor)
Mendapatkan data jabatan struktural pegawai
Data SK Mutasi Jabatan Struktural Pegawai
MySQL
2009-2013 (sumber : SIMPEG Kota Bogor)
Mendapatkan atribut tingkat pendidikan pegawai
Data Riwayat Pendidikan Pegawai
MySQL
2009-2013 (sumber : SIMPEG Bogor)
Mendapatkan atribut pendidikan dan pelatihan pegawai
Data Pendidikan dan Pelatihan Pegawai
MySQL
2009-2013 (sumber : SIMPEG Bogor)
Berdasarkan Tabel 3.1 dapat dijelaskan bahwa itemset yang akan disusun hanya akan menggunakan data mutasi jabatan struktural dengan menggunakan 7 atribut yang dibahas pada theoretical framework sebelumnya. Dari 7 atribut yang akan digunakan, 3 di antaranya sudah tersimpan didalam basis data SIMPEG yaitu: pangkat dan golongan pegawai pada saat diangkat menjadi pejabat struktural, tingkat pendidikan pegawai, dan pendidikan dan pelatihan pegawai. Sedangkan dua atribut berikutnya yaitu masa kerja pegawai dan pengalaman pegawai dalam Universitas Indonesia
34
unit kerja akan didapatkan dengan menggunakan teknik-teknik data integration, selection dan transformation yang merupakan tahap pra-proses dalam data mining. 3.3
Metode Analisis Data
Penelitian ini menggunakan pendekatan kuantitatif dalam tahap analisis data, dengan menggunakan teknik Classification untuk mendapatkan pola pengisian jabatan struktural dari basis data SIMPEG dengan menggunakan tahapan proses Knowledge Discovery Data (KDD). Pola yang teridentifikasi akan dijadikan dasar pengetahuan bagi aplikasi SIMPEG sehingga memiliki kemampuan untuk dapat memberikan usulan pengisian jabatan struktural bagi Baperjakat dalam menyusun draft mutasi jabatan struktural di lingkungan Pemerintah Kota Bogor. Beberapa perangkat lunak berbasis open source yang dapat digunakan untuk melakukan Classification di antaranya yaitu Weka, R, dan Rapidminer. Berdasarkan hasil survey tahun 2007 yang dilakukan kdnuggets.com tiga perangkat lunak inilah yang situsnya paling sering dikunjungi oleh ahli data mining (Pehlivanli,2011).
Berikut ini adalah hasil survey tahun 2007 yang
dilakukan oleh situs data mining kdnuggest.com yang dapat dilihat pada Gambar 3.2.
Gambar 3.2 Hasil Survey Kdnuggets.com Tahun 2007 Sumber: Pehlivanli (2011)
Seperti yang dapat dilihat pada Gambar 3.2, situs web Yale (Rapidminer) adalah yang paling sering dikunjungi oleh ahli data mining, selanjutnya diikuti oleh Weka dan R. Ketiga perangkat lunak ini tentunya memiliki kelebihan dan kekurangan
masing-masing
yang
dapat
dilihat
pada
Tabel
3.2.
Universitas Indonesia
35
Tabel 3.2 Tabel Perbandingan Data Mining Tools Data mining Tools
Compare
Contrast
Criticize
Synthesize
Summarize
Rujukan
Rapidminer
Aplikasi data
Memiliki fitur
Tidak cocok
Data mining tool
Aplikasi data
Ayca Cahmak Pehlivanli ,
mining gratis
lebih dari 400
untuk mengolah
gratis dengan fitur
mining untuk
(2011). The Comparison
yang sering
algoritma data
data yang
yang sangat banyak
beragam jenis
Of Data mining Tools
digunakan
mining dan
sederhana
algoritma dan
mendukung 22
mengingat fitur
format data
format basis data
yang sangat kompleks
Weka
Tampilan CLI
Algoritma yang
Data
command yang
tersedia terkesan
gratis dengan menu mining sederhana
sederhana dan
secukupnya
yang sederhana dan untuk sejumlah
muudah dipahami
mining
mudah
tool Aplikasi data
untuk format data
dipelajari R
Dapat
Menguasai bahasa Data mining tool
Aplikasi data
mengembangkan
pemrograman R
dengan
mining dengan
algoritma sendiri
merupakan
menggunakan
kebebasan
dengan bahasa
kesulitan
bahasa pemrograman mengembangkan
pemrograman R
tersendiri
sendiri
algoritma sendiri
Universitas Indonesia
36
Berdasarkan Tabel 3.2, maka untuk melakukan teknik classification pada penelitian ini cukup menggunakan perangkat lunak WEKA, mengingat penggunaan R yang cukup rumit dengan bahasa pemrograman tersendiri, dan Rapidminer yang memiliki fitur dan algoritma yang terlalu banyak dan memakan resource yang lebih besar dibandingkan WEKA. Untuk mengantisipasi algoritma classification yang tidak tersedia pada WEKA maka digunakan data mining tools lainnya yang bersifat open source seperti: CRUISE : Classification Rule with Unbiased Interaction Selection and Estimation. Data mining tool berbasis teks ini dijalankan dengan command line dengan input dan output dalam format *.txt dengan output model berupa decision tree. C5.0 : Paket implementasi algoritma C.50 dalam data mining tool R dengan dengan output model berupa decision tree.
Universitas Indonesia
BAB 4 ANALISIS DAN PEMBAHASAN
4.1
Data Pre-processing
Sebelum dapat melakukan implementasi teknik data mining classification pada atribut data kepegawaian yang dibutuhkan (pangkat dan golongan, masa kerja, tingkat pendidikan, pendidikan dan pelatihan, pengalaman pegawai dalam unit kerja, umur, jenjang jabatan), maka terlebih dahulu dilakukan tahap data preprocessing yang terdiri dari dua tahapan yaitu ekstraksi data dan transformasi data ke dalam bentuk yang dapat digunakan untuk data mining tool WEKA untuk mengidentifikasi pola dengan teknik data mining classification. 4.1.1 Ekstraksi Data Tujuh atribut yang dibahas pada bagian sebelumnya tentunya berasal dari beberapa tabel yang berbeda, bahkan beberapa atribut seperti masa kerja dan pengalaman pegawai dalam unit kerja tidak secara langsung tersimpan dalam basis data, sehingga perlu dibuat suatu fungsi untuk menghitung nilai atribut tersebut. Berikut ini adalah sumber data dari setiap atribut yang akan digunakan: Pangkat golongan pegawai diperoleh dari kolom keterangan pada tabel SK. Tidak seluruh data pada tabel SK akan digunakan, data yang digunakan sebagai training set yaitu data SK dengan kolom id_kategori_sk 10 yang berarti data mutasi jabatan, dan data SK dengan kolom id_kategori_sk 5 yang berarti kenaikan pangkat terakhir pegawai. Masa kerja pegawai yang didapatkan dari fungsi pengurangan antara kolom tmt pada tabel SK dengan kolom id_kategori_sk 10 yang berarti data mutasi jabatan dengan kolom tmt pada pada tabel SK dengan kolom id_kategori 6 yang berarti data berkas CPNS. Tingkat pendidikan pegawai pada saat menerima jabatanyang didapatkan dari kolom tingkat_pendidikan dari tabel pendidikan. Pendidikan dan pelatihan pegawai khususnya pendidikan dan pelatihan kepemimpinan yang didapatkan dari kolom nama_diklat pada tabel diklat. 37
Universitas Indonesia
38
Pengalaman pegawai dalam unit kerja yang didapatkan dari fungsi pengurangan antara kolom tmt pada tabel SK dengan kolom id_kategori_sk 10 yang berarti data mutasi jabatan dengan kolom tmt pada pada tabel SK dengan kolom id_kategori 1 yang berarti data alih tugas pegawai. Atribut yang akan dijadikan sebagai classifier adalah kolom eselonering yang didapatkan dari kolom eselon pada tabel jabatan yang terhubung dengan tabel sk melalui kolom id_j. Kolom ini akan memiliki nilai >0 jika memiliki jabatan struktural. Atribut umur pada test set didapatkan dari fungsi pengurangan antara tanggal mutasi jabatan terkahir yaitu 10-01-2014 dengan kolom tgl_lahir pada tabel pegawai, sedangkan pada train set dikurangi dari tanggal mulai terhitung SK tersebut. Atribut jenjang jabatan didapatkan dari kolom jenjab pada tabel pegawai. Train set yang akan digunakan adalah data SK mutasi jabatan dan data SK kenaikan pangkat terakhir pegawai. Untuk data calon pejabat diambil dari data pegawai yang pangkat golongannya memenuhi syarat minimum untuk mengisi suatu jabatan (lihat Tabel 2.1). Selain itu data calon pejabat juga diambil dari data pegawai dengan golongan satu tingkat di bawah minimum sesuai dengan Peraturan Pemerintah No 100 tahun 2000 tentang Pengangkatan Pegawai Negeri Sipil Dalam Jabatan Struktural yang kemudian disempurnakan dengan Peraturan Pemerintah No 13 Tahun 2002.
Universitas Indonesia
39
Berikut ini adalah struktur tabel yang akan digunakan dalam pengumpulan data:
Gambar 4.1 Struktur Basisdata SIMPEG yang Digunakan Berdasarkan Gambar 4.1, dapat dilihat bahwa tabel utama dari basis data SIMPEG adalah tabel pegawai. Meskipun demikian tabel yang akan menjadi sumber data utama untuk penelitian ini adalah tabel sk mengingat seluruh data mutasi jabatan dan kenaikan pangkat berada pada tabel tersebut. Data tingkat pendidikan berasal dari tabel pendidikan, sedangkan data pendidikan dan pelatihan berasal dari tabel diklat. Dalam hal ini tabel jabatan digunakan untuk menjelaskan tingkat eselonering yang ada pada suatu SK mutasi jabatan struktural. Dari seluruh total data pada tabel sk yang berjumlah 56.366 data hanya akan digunakan 3.265 data mutasi jabatan dan 2.404 data kenaikan pangkat pegawai yang pangkatnya memenuhi syarat minimum untuk mengisi jabatan struktural. Karena setiap eselon tentu memiliki persyaratan minimum kepangkatan yang berbeda maka untuk penelitian ini data dibagi menjadi 7 bagian sesuai dengan tingkat eselon yang ada.
Universitas Indonesia
40
Berdasarkan kebutuhan atribut yang akan digunakan, maka struktur tabel yang akan digunakan untuk teknik data mining classification dalam penelitian ini dapat dilihat pada Tabel 4.1. Tabel 4.1 Atribut yang Digunakan Atribut Pangkat golongan
Tipe Data Teks
Masa kerja Tingkat pendidikan
Desimal Teks
Pendidikan dan pelatihan
Desimal
Pengalaman dalam unit kerja Eselonering
Teks
Umur Jenjang Jabatan
Desimal Teks
Teks
Range Data / Keterangan III/a, III/b, III/c, III/d, IV/a, IV/b, IV/c, IV/d, IVe Dalam satuan tahun SD, SMP, SMA, D1, D2, D3, S1, S2, S3 Pim II, Pim III, Pim IV, Belum Mengikuti Dalam satuan tahun IIA, IIB, IIIA, IIIB, IVA, IVB, V, Staf Dalam satuan tahun Struktural, Fungsional
Seperti yang terlihat pada Tabel 4.1, atribut eselonering adalah atribut yang dijadikan classifier dalam penelitian ini sehingga dari pola atribut lainnya akan digunakan untuk menentukan tingkat eselonering yang didapatkan. Untuk atribut masa kerja dan pengalaman dalam unit kerja memiliki tipe data yang sama yaitu jumlah tahun dalam satuan desimal untuk mengantisipasi jumlah bulan dalam masa kerja, misalnya untuk pengalaman kerja sebanyak 1 tahun 6 bulan maka akan direpresentasikan ke dalam 1,5 tahun.
Universitas Indonesia
41
Berdasarkan ekstraksi data yang dilakukan pada basis data SIMPEG sesuai dengan tingkat eselon yang ada maka didapatkan jumlah training set dan test set yang dapat dilihat pada Tabel 4.2: Tabel 4.2 Jumlah Record Data yang Digunakan Tingkat Eselon
V IVB IVA IIIB IIIA IIB IIA
SK Mutasi SK Jabatan Kenaikan (train set) Pangkat (train set) 73 868 1.096 1.893 1.272 2.790 254 5.110 194 4.216 112 3.376 3 392
Kondisi Exisiting (10-01-2014) (test set) 1.001 2.363 2.368 4.223 3.694 3.046 271
Seperti yang dapat dilihat pada Tabel 4.2 di atas rendahnya jumlah train set pada tingkat Eselon IIA disebabkan hanya ada satu jabatan struktural pada tingkat eselon tersebut yaitu jabatan Sekretaris Daerah. Hal ini berbeda dengan jabatan pada eselon lain dimana seringkali mengalami rotasi jabatan struktural setidaknya 3 kali dalam 1 tahun. Jumlah sebaran data untuk tiap atribut pada setiap tingkat eselon tentunya juga berbeda baik dari train set yang akan digunakan untuk mengidentifikasi pola prediksi maupun dari test set yang digunakan untuk mengukur akurasi prediksi, seperti yang dapat dilihat pada tabel 4.3. dan 4.4 Tabel 4.3 Sebaran Data Atribut Pangkat Golongan pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
III/a 446 773 0 0 0 0 0
III/b 479 1.465 1.610 0 0 0 0
III/c 14 698 1.338 1.355 0 0 0
III/d 2 36 882 1.040 1.051 0 0
IV/a 0 12 223 2.943 3.071 3.096 0
IV/b 0 5 9 25 286 354 355
IV/c 0 0 0 1 2 35 36
IV/d 0 0 0 0 0 0 4
Universitas Indonesia
42
Tabel 4.4 Sebaran Data Atribut Pangkat Golongan pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
III/a 513 835 0 0 0 0 0
III/b 488 875 917 0 0 0 0
III/c 0 653 773 774 0 0 0
III/d 0 0 678 688 692 0 0
IV/a 0 0 0 2.761 2.777 2.777 0
IV/b 0 0 0 0 225 243 243
IV/c 0 0 0 0 0 26 26
IV/d 0 0 0 0 0 0 2
Seperti yang dapat dilihat pada tabel 4.3 dan 4.4, secara umum sebaran data train set dan test set menumpuk pada tingkat Eselon IIIB dan IIIA khusunya pada golongan IV/a. Hal ini disebabkan oleh banyaknya pegawai dengan golongan IV/a khususnya pada jenjang jabatan fungsional guru. Tabel 4.5 Sebaran Data Atribut Masa Kerja pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
Rata-Rata 8,193 12,663 15,741 24.378 21,08 21,73 25,08
Standar Deviasi 6,321 8,569 8,605 8,479 6,252 5,769 7,79
Tabel 4.6 Sebaran Data Atribut Masa Kerja pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
Rata-Rata 8,763 12,04 15,877 24.378 26,605 28 29,12
Standar Deviasi 6,154 8,122 8,831 8,479 6,857 5,807 5,679
Seperti yang dapat dilihat pada Tabel 4.5 dan Tabel 4.6, setiap tingkat eselon yang lebih tinggi tentunya memiliki rata-rata masa kerja yang lebih lama sebagai contoh untuk tingkat Eselon IIA memerlukan masa kerja sekurang-kurangnya 25 hingga 29 tahun. Universitas Indonesia
43
Tabel 4.7 Sebaran Data Atribut Tingkat Pendidikan pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
SD 0 0 0 0 0 0 0
SMP 0 0 0 0 0 0 0
SMA 81 779 848 498 286 209 8
D1 5 18 49 67 63 25 1
D2 36 53 101 1.010 1.009 943 17
D3 77 147 228 286 233 140 1
S1 729 1.891 2.362 2.913 2.271 1.703 204
S2 0 101 473 588 545 466 163
S3 0 0 1 2 3 2 1
Tabel 4.8 Sebaran Data Atribut Tingkat Pendidikan pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
SD 0 0 0 0 0 0 0
SMP 0 0 0 0 0 0 0
SMA 100 570 568 357 157 60 2
D1 4 15 35 43 40 13 1
D2 30 45 64 584 578 545 11
D3 75 157 182 196 162 88 2
S1 784 1.532 1.434 2.790 2.478 2.074 178
S2 8 44 85 252 277 264 76
S3 0 0 0 1 2 2 1
Seperti yang dapat dilihat pada tabel 4.7 dan 4.8, data tingkat pendidikan menumpuk pada D2 dan S1. Untuk tingkat D2 mayoritas adalah guru SD yang pendidikan minimalnya adalah PGSD dengan tingkat pendidikan D2, sedangkan S1 adalah formasi umum tingkat pendidikan minimum yang diminta untuk Calon Pegawai Negeri Sipil dalam 5 tahun terakhir. Tabel 4.9 Sebaran Data Atribut Pendidikan dan Pelatihan pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
Belum Mengikuti 937 2.767 3.242 4.561 3.825 3.101 263
Pim IV
Pim III
Pim II
4 212 757 678 376 155 13
0 10 61 123 205 194 78
0 0 0 0 0 38 39
Universitas Indonesia
44
Tabel 4.10 Sebaran Data Atribut Pendidikan dan Pelatihan pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
Belum Mengikuti 1.001 2210 1.918 3.761 3.369 2.883 208
Pim IV
Pim III
Pim II
0 150 434 407 236 63 8
0 3 16 55 89 88 43
0 0 0 0 0 12 0
Seperti yang dapat dilihat pada tabel 4.9 dan 4.10, banyaknya pegawai yang belum mengikuti diklat kepemimpinan dikarenakan pegawai dengan jenjang jabatan fungsional yang memang tidak pernah mengikuti pendidikan dan pelatihan kepemimpinan untuk jabatan struktural. Tabel 4.11 Sebaran Data Atribut Pengalaman Unit Kerja pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
Rata-Rata 0,06 0,353 0,608 0,329 0,138 0,093 0,241
Standar Deviasi 0,372 1,283 1,595 1,175 0,729 0,679 1,412
Tabel 4.12 Sebaran Data Atribut Pengalaman Unit Kerja pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
Rata-Rata 0,018 0,043 0,1 0,046 0,037 0,018 0,022
Standar Deviasi 0,212 0,322 0,472 0,312 0,286 0,186 0,162
Seperti yang dapat dilihat pada tabel 4.11 dan 4.12, nilai rata-rata untuk atribut pengalaman unit kerja cukup rendah. Hal ini menujukkan pengalaman dalam unit kerja tidak terlalu diperhatikan dalam pengisian jabatan struktural. Universitas Indonesia
45
Tabel 4.13 Sebaran Data Atribut Umur pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
Rata-Rata 41,77 43,035 44,45 48,98 50,559 51,621 52,492
Standar Deviasi 6,247 6,774 6,787 6,538 5,739 5,287 4,967
Tabel 4.14 Sebaran Data Atribut Umur pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
Rata-Rata 40,973 41,936 43,963 49,213 50,465 51,403 52,571
Standar Deviasi 6,505 7,,124 6,764 5,849 4,994 4,353 4,039
Seperti yang dapat dilihat pada Tabel 4.13 dan 4.14, setiap tingkat eselon memiliki rata-rata umur yang berbeda. Untuk tingkat eselon terendah yaitu Eselon V rata-rata umur adalah 40 hinnga 41 tahun sedangkan untuk tingkat eselon tertinggi yaitu Eselon IIA rata-rata umur adalah 52 tahun. Tabel 4.15 Sebaran Data Atribut Jenjang Jabatan pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
Struktural 88 1.665 2.588 1.699 1.007 623 166
Fungsional 853 1.324 1.474 3.665 3.403 2.865 229
Universitas Indonesia
46
Tabel 4.16 Sebaran Data Atribut Jenjang Jabatan pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
Struktural 92 1.010 2.588 696 424 203 67
Fungsional 909 1.353 1.474 3.527 3.270 2.843 204
Seperti yang dapat dilihat pada Tabel 4.15 dan 4.16, pegawai dengan jenjang jabatan fugsional mendominasi di setiap tingkat eselon, hal ini juga membuktikan bahwa lebih dari 50% pegawai di Pemerintah Kota Bogor memiliki jenjang jabatan fungsional. Tabel 4.17 Sebaran Data Atribut Eselonering pada Train Set Eselon V IVB IVA IIIB IIIA IIB IIA
Eselon 73 1.096 1.272 254 194 112 3
Non Eselon 868 1.893 2.790 5.110 4.216 3.376 392
Tabel 4.18 Sebaran Data Atribut Eselonering pada Test Set Eselon V IVB IVA IIIB IIIA IIB IIA
Struktural 18 363 341 63 48 29 0
Fungsional 983 2.000 2.027 4.160 3.646 3.017 271
Seperti yang dapat dilihat pada Tabel 4.17 dan 4.18, rendahnya jumlah train set pada tingkat Eselon V dan Eselon IIA dikhawatirkan akan menyebabkan rendahnya akurasi prediksi pada test set di tingkat eselon yang sama. Jumlah data secara menyeluruh untuk tiap tingkat eselon dapat dilihat pada Lampiran 2.
Universitas Indonesia
47
4.1.2 Transformasi Data Setelah atribut dan ekstraksi data dilakukan maka tahapan selanjutnya adalah melakukan transformasi data dengan melakukan validasi data untuk setiap atribut seperti menghapus record yang memiliki nilai NULL pada atribut pangkat dan golongan. Sedangkan pada atribut pendidikan dan pelatihan akan berisi ‘belum mengikuti’ apabila data yang bersangkutan tidak pernah mengikuti diklat kepemimpinan. Dari total 3.265 SK mutasi jabatan tentunya harus melalui validasi terlebih dahulu seperti validasi atribut eselonering yang menjadi classifier. Jika pada kolom id_j pada tabel SK bernilai 0, maka record tersebut tidak dapat digunakan dan harus dihapus, mengingat kolom id_j adalah foreign key ke tabel jabatan yang mengidentifikasikan jabatan dan tingkat eselonering dari suatu SK mutasi jabatan. Dari hasil validasi ini 3.004 SK yang dapat diidentifikasi tingkat eseloneringnya. Dari total 16.346 SK kenaikan pangkat juga melalui validasi terlebih dahulu. SK kenaikan pangkat yang digunakan adalah SK untuk pegawai struktural dengan pangkat dan golongan minimum untuk mengisi jabatan struktural yaitu golongan III/b ke atas yang belum pernah menjadi pejabat struktural. Untuk tingkat Eselon V menggunakan SK pegawai dengan golongan III/a ke atas khusus pada unit kerja dinas pendidikan, mengingat jabatan Eselon V hanya ada pada unit kerja tersebut. Dari hasil validasi ini diperoleh 438 SK pegawai yang memenuhi pangkat minimum untuk mengisi jabatan struktural tetapi belum mendapatkan untuk menjadi pejabat struktural. Atribut pendidikan dan pelatihan juga mengalami proses transformasi data dengan beberapa nilai memiliki makna yang sama seperti yang dapat dijelaskan pada Tabel 4.19. Tabel 4.19 Penyeragaman Atribut Pendidikan dan Pelatihan Nilai Atribut Adum, Adumla, SPADA,SPALA, Diklat Kepemimpinan Tk. IV SPAMA, Pim III, Diklat Kepemimpinan Tk. III SPAMEN, Pim II, Diklat Kepemimpinan Tk. II
Bentuk Penyeragaman Pim IV Pim III Pim II
Universitas Indonesia
48
Seperti yang dapat dilihat pada tabel 4.19, yang paling banyak memiliki keragaman adalah jenis diklat Pim IV, dengan Adum, Adumla, SPADA, SPALA dan Diklat Kepemimpian Tk. IV merupakan hal yang sama yaitu pendidikan dan pelatihan untuk pejabat eselon IV yang dalam hal ini diseragamkan dengan label Pim IV. Fungsi agregasi digunakan untuk mengisi atribut masa kerja dan atribut pengalaman dalam unit kerja. Atribut masa kerja dihitung dengan cara mengurangi kolom tmt pada SK mutasi jabatan atau SK kenaikan pangkat dengan kolom tmt pada SK CPNS. Sedangkan pada atribut pengalaman dalam unit kerja dihitung dengan cara mengurangi kolom tmt pada SK mutasi jabatan atau SK kenaikan pangkat dengan kolom tmt pada sk alih kerja. Khusus atribut pengalaman dalam unit kerja, nilainya bisa saja berbeda untuk test set di setiap tingkat eselon. Misalnya seorang pegawai pernah menjabat sebagai eselon IVA selama 1,5 tahun, maka nilai tersebut hanya akan digunakan pada saat melakukan classification untuk tingkat eselon IVA. Sedangkan nilai pengalaman unit kerja untuk dari pegawai tersebut untuk tingkat eselon di atasnya bernilai 0 tahun. Setelah semua data dari setiap atribut didapatkan dari basis data SIMPEG maka agar dapat diolah dengan menggunakan data mining tool WEKA, data tersebut dikonversi dalam format *.csv yang dikonversi lagi menjadi format file *.arff baik untuk train set maupun test set dari setiap tingkatan eselon. 4.2
Data Mining dengan Classification
Pengolahan data pada penelitian ini dibagi menjadi 7 bagian sesuai dengan jumlah tingkat eselon yang ada, dengan Eselon V sebagai jabatan dengan tingkat terendah yaitu Kepala Tata Usaha SMP dan SMA, dan Eselon IIA sebagai jabatan tertinggi yaitu Sekretaris Daerah Kota Bogor. Data mining tool yang digunakan adalah WEKA, R, dan CRUISE. Teknik data mining yang digunakan adalah classification dengan menggunakan 7 atribut yaitu umur, pangkat golongan, masa kerja, pengalaman dalam unit kerja, tingkat pendidikan, pendidikan dan pelatihan jabatan, serta tingkat eselon sebagai atribut classifier. Dalam penelitian ini seluruh algoritma classification (60 Algoritma) Universitas Indonesia
49
yang tersedia pada WEKA digunakan untuk menemukan hasil akurasi prediksi yang terbaik. 4.2.1 Classification pada Data Eselon V Pada data tingkat Eselon V terdiri atas 941 train set (73 Mutasi Jabatan dan 868 Kenaikan Pangkat) dan 1.001 test set dengan hasil classification seperti pada Tabel 4.20. Tabel 4.20 Hasil Classification untuk Eselon V Algoritma
AD Tree CRUISE
Pola prediksi ada ada
Data mining tool Weka CRUISE
Akurasi Train set 99,89% 99,15%
Akurasi Test set 94,8% 94,21%
Akurasi Eselon V 100% 100%
Akurasi Non eselon 94,71% 94,1%
Seperti yang dapat dilihat pada tabel 4.20, salah satu algoritma dengan akurasi eselon terbaik yang menghasilkan pola prediksi adalah algoritma AD tree dengan confusion matrix seperti yang dapat dilihat padaTabel 4.21. Tabel 4.21 Confusion Matrix untuk Algoritma AD Tree Eselon V Non Eselon 18 0 52 931 Tabel 4.21 menjelaskan bahwa algoritma AD tree menghasilkan nilai akurasi sebesar 94,8% pada prediksi test set Eselon V dengan tanpa kesalahan prediksi pada data Eselon V, dan 52 kesalahan dalam memprediksi data non eselon. Secara umum algoritma ini melakukan klasifikasi dengan cara menyusun decision tree dengan beberapa cabang alternatif keputusan. Dalam hal ini setiap cabang memiliki nilai yang berbeda sesuai dengan nilai yang ada pada setiap test set. Nilai pada setiap atribut tersebut akan dijumlahkan sesuai dengan data test set yang diuji. Jika total nilai bernilai negatif maka akan diklasifikasikan sebagai eselon V, sebaliknya jika total nilai bernilai positif maka akan diklasifikasikan sebagai non eselon. Pola prediksi yang terbentuk untuk data Eselon V dapat dilihat pada Gambar 4.2.
Universitas Indonesia
50
Gambar 4.2 Pola Pengisian Jabatan Struktural Eselon V
Universitas Indonesia
51
Seperti yang dapat dilihat pada Gambar 4.2, pola pengisian jabatan struktural yang terbentuk dibagi menjadi 9 rule dengan urutan sebagai berikut: 1. Nilai awal dari suatu test set adalah 1,232. Apabila suatu data memiliki jenjang jabatan fungsional maka akan diberi nilai 3,507, sebaliknya jika memiliki jenjang jabatan struktural akan diberi nilai -2,035. 2. Jika pegawai dengan jenjang struktural tersebut berumur di bawah 49,292 tahun maka akan diberi nilai 0,009, sebaliknya apabila berumur lebih dari sama dengan 49,292 akan diberi nilai -0,946. 3. Jika pegawai struktural tersebut memiliki masa kerja di bawah 23,75 tahun maka akan diberi nilai 0,112, sebaliknya jika masa kerjanya lebih dari sama dengan 23,75 maka akan diberi nilai -0,832. 4. Untuk pegawai dengan masa kerja di bawah 17,708 tahun akan diberi nilai 1,341, sebaliknya pegawai dengan masa kerja lebih dari sama dengan 17,708 akan diberi nilai -1,133. 5. Pegawai dengan masa kerja di atas 17,708 tersebut, apabila memiliki pangkat golongan III/b maka akan diberi nilai 0,549, sebaliknya jika memiliki pangkat selain III/b maka akan diberi nilai -0,726. 6. Pegawai dengan masa kerja di atas 17,708 tersebut, apabila memiliki umur di bawah 49,125 tahun maka akan diberi nilai -0,555, sebaliknya apabila memiliki umur lebih dari sama dengan 49,125 maka akan diberi nilai 0,443. 7. Untuk pegawai dengan masa kerja di bawah 12,292 tahun akan diberi nilai 1,067, sebaliknya apabila masa kerjanya lebih dari sama dengan 12,292 tahun akan diberi nilai -0,205. 8. Pegawai dengan masa kerja di atas 12,292 tahun tersebut, apabila memiliki umur di bawah 39,667 tahun maka akan diberi nilai -0,896, sebaliknya jika memiliki umur lebih dari sama dengan 39,667 tahun maka akan diberi nilai 0,27. 9. Pegawai dengan umur lebih dari sama dengan 39,667 tahun tersebut, apabila berumur di bawah 49,292 maka akan diberi nilai 0,407, sebaliknya apabila berumur lebih dari sama dengan 49,292 maka akan diberi nilai -0,418.
Universitas Indonesia
52
Sebagai contoh apabila sebuah data memilki nilai atribut seperti yang ditampilkan pada tabel 4.22, maka kita tinggal menghitung nilai atribut sesuai dengan 9 nilai atribut dari pola pengisian yang disebutkan sebelumnya. Tabel 4.22 Contoh Test Set data Eselon V Jenjang Umur Pendidikan Pengalaman Pangkat Tingkat Masa Jabatan Pelatihan Unit Kerja Golongan Pendidikan Kerja Struktural 39,667 Belum 0 III/a SMA 15,916 Mengikuti Berdasarkan contoh test set yang ada, maka dengan menggunakan pola pengisian yang terbentuk dari algoritma AD tree nilai total untuk setiap atribut dapat dihitung seperti yang ditampilkan pada Tabel 4.23. Tabel 4.23 Contoh Hasil Perhitungan Nilai untuk Setiap Atribut Rule Nilai Awal Jenjang Jabatan = Struktural Umur < 49,292 Masa Kerja < 23,75 Masa Kerja < 17,708 Masa Kerja >= 12,292 Umur >=39,667 Umur < 49,292 Total Nilai
Nilai 1,232 -2,035 0,099 0,112 1,341 -0,205 0,27 0,407 1,222
Seperti yang terlihat pada Tabel 4.23 total nilai dari contoh test set tersebut bernilai positif (1,222) sehingga diprediksi sebagai non eselon. Algoritma lain yang juga menghasilkan akurasi class Eselon V cukup tinggi adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix dapat dilihat pada Tabel 4.24. Tabel 4.24 Confusion Matrix untuk Algoritma CRUISE untuk Eselon V Eselon V Non Eselon 18 0 58 925 Tabel 4.24 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi sebesar 94,21% pada prediksi test set Eselon V dengan tanpa kesalahan prediksi Universitas Indonesia
53
pada data Eselon V, dan 58 kesalahan dalam memprediksi data non eselon. Berikut ini adalah decision tree yang terbentuk: Node 1: masakerja <= 12.2917 Node 2: Terminal Node, predicted class = non eselon Class label : V non eselon Class size : 0 793 Node 1: masakerja > 12.2917 Node 3 : jenjab = Struktural Node 6: Terminal Node, predicted class = V Class label : V non eselon Class size : 73 8 Node 3 : jenjab = Fungsional Node 7: Terminal Node, predicted class = non eselon Class label : V non eselon Class size : 0 67 Dari bentuk decision tree di atas dapat diidentifikasi pola pengisian jabatan struktural Eselon V adalah bahwa semua pejabat struktural Eselon V memiliki masa kerja lebih dari 12,2917 tahun dengan jenjang jabatan struktural. Pola pengisian jabatan struktural yang terbentuk dari algoritma AD Tree dan CRUISE memiliki beberapa persamaan sebagai berikut: 1. Atribut masa kerja dengan nilai di bawah 12,2917 dikategorikan sebagai non eselon pada algoritma CRUISE. Pada algoritma AD Tree nilai yang sama diberi nilai
positif
(1,067),
yang
berarti
memiliki
kecenderungan
untuk
diklasifikasikan sebagai non eselon. 2. Atribut masa kerja dengan nilai di atas 12,2917 dikategorikan sebagai eselon V pada algoritma CRUISE apabila didukung dengan atribut jenjang jabatan dengan nilai struktural. Pada algoritma AD Tree nilai yang sama diberi nilai negatif (-2,05 untuk atribut masa kerja dan -2,035 untuk atribut jenjang jabatan struktural), yang berarti memiliki kecendurungan untuk diklasifikasikan sebagai eselon V. Perbedaan dari dua algoritma tersebut adalah pada algoritma AD tree atribut pangkat golongan dan atribut umur ikut menentukan hasil classification. Sedangkan pada algoritma CRUISE, dua atribut tersebut tidak menentukan hasil Universitas Indonesia
54
classification. Namun dari perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon V dapat dilihat pada Lampiran 2. 4.2.2 Classification pada Data Eselon IVB Pada data tingkat Eselon IVB terdiri atas 2.989 train set (1.096 Mutasi Jabatan dan 1.893 Kenaikan Pangkat) dan 2.363 test set dengan hasil Classification dapat dilihat pada Tabel 4.25. Tabel 4.25 Hasil Classification untuk Eselon IVB Algoritma
Jrip CRUISE
Pola prediksi Ada Ada
Data mining tool Weka CRUISE
Akurasi Akurasi Akurasi Train Test set Eselon set IVB 91,36 83,15% 88,98% 92,17% 80,36% 87,33%
Akurasi Non eselon 82,10% 79,10%
Seperti yang dapat dilihat pada tabel 4.25, Salah satu algoritma dengan akurasi eselon terbaik yang menghasilkan pola prediksi yang lebih baik yaitu algoritma Jrip dengan confusion matrix yang dapat dilihat padaTabel 4.26. Tabel 4.26 Confusion Matrix Algoritma Jrip untuk Eselon IVB Eselon IVB Non Eselon 323 40 358 1642 Tabel 4.26 menjelaskan bahwa algoritma Jrip menghasilkan nilai akurasi sebesar 83,15% pada prediksi test set Eselon IVB dengan 40 kesalahan prediksi pada data Eselon IVB, dan 358 kesalahan dalam memprediksi data non eselon. Secara umum algoritma ini melakukan klasifikasi dengan cara menyusun rules dengan fungsi “jika maka” berdasarkan data train set yang ada. Berikut pola prediksi yang terbentuk untuk data Eselon IVB:
Universitas Indonesia
55
(jenjab = Struktural) and (masakerja >= 16.8333) => eselonering=IVB (jenjab = Struktural) and (masakerja <= 6.25) and (umur >= 36.0833) and (pangkat_golongan = III/b) and (umur >= 38.75) => eselonering=IVB (jenjab = Struktural) and (pangkat_golongan = III/b) and (tingkat_pendidikan = S1) and (masakerja >= 4.25) and (masakerja <= 8.08333) => eselonering=IVB (jenjab = Struktural) and (pengalaman_unitkerja >= 0.416667) => eselonering=IVB (jenjab = Struktural) and (umur <= 40.0833) and (umur >= 37.1667) and (masakerja <= 3.75) => eselonering=IVB (jenjab = Struktural) and (masakerja >= 15.75) and (masakerja <= 22.5833) => eselonering=IVB (jenjab = Struktural) and (masakerja <= 7.75) and (umur >= 31.25) and (masakerja <= 3.91667) and (masakerja >= 2) => eselonering=IVB (jenjab = Struktural) and (umur <= 40.25) and (tingkat_pendidikan = S2) and (umur >= 31.75) => eselonering=IVB (jenjab = Struktural) and (diklat = Pim IV) => eselonering=IVB (jenjab = Struktural) and (umur <= 39.9167) and (tingkat_pendidikan = D3) and (masakerja >= 8.16667) => eselonering=IVB (jenjab = Struktural) and (tingkat_pendidikan = S1) and (masakerja >= 12.75) and (masakerja >= 15) => eselonering=IVB Dari algoritma Jrip dihasilkan 11 pola pengisian jabatan struktural dengan menggunakan fungsi “jika maka” dengan rincian sebagai berikut: 1.
Pegawai dengan jenjang jabatan struktural yang memililiki masa kerja lebih dari sama dengan 16,833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
2.
Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja kurang dari 6,25 tahun, berumur lebih dari sama dengan 38,75 tahun dan memiliki pangkat golongan III/b, diklasifikasikan sebagai pejabat Eselon IVB.
3.
Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan III/b dengan tingkat pendidikan S1 dan masa kerja antara 4,25 tahun hingga 8,0833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
4.
Pegawai dengan jenjang jabatan struktural yang memiliki pengalaman unit kerja lebih dari sama dengan 0,4167 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
Universitas Indonesia
56
5.
Pegawai dengan jenjang jabatan struktural yang berumur antara 37,1667 tahun hingga 40,083 tahun dengan masa kerja kurang dari sama dengan 3,75 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
6.
Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja antara 15,75 tahun hingga 15,833 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
7.
Pegawai dengan jenjang jabatan struktural yang memiliki masa kerja antara 2 tahun hingga 3,916 tahun serta berumur lebih dari sama dengan 31,25 tahun, diklasifikasikan sebagai pejabat Eselon IVB.
8.
Pegawai dengan jenjang jabatan struktural yang berumur antara 31,75 tahun hingga 40,25 tahun dengan tingkat pendidikan S2, diklasifikasikan sebagai pejabat Eselon IVB.
9.
Pegawai dengan jenjang jabatan struktural yang telah mengikuti pendidikan pelatihan Pim IV, diklasifikasikan sebagai pejabat Eselon IVB.
10. Pegawai dengan jenjang jabatan struktural yang berumur kurang dari sama dengan 39,916 dengan tingkat pendidikan D3 serta memiliki masa kerja lebih dari sama dengan 8,166 tahun, diklasifikasikan sebagai pejabat Eselon IVB. 11. Pegawai dengan jenjang jabatan struktural yang memiliki tingkat pendidikan S1 dengan masa kerja lebih dari sama 15 tahun, diklasifikasikan sebagai pejabat Eselon IVB. Algoritma lain yang juga menghasilkan akurasi class Eselon IVB cukup tinggi adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang terbentuk dapat dilihat pada Tabel 4.27. Tabel 4.27 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVB Eselon IVB Non Eselon 317 46 418 1.582 Tabel 4.27 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi sebesar 80,36% pada prediksi test set Eselon IVB dengan 46 kesalahan prediksi pada data Eselon IVB, dan 418 kesalahan dalam memprediksi data non eselon. Dikarenakan ukuran decision tree yang terbentuk dari algoritma ini cukup besar Universitas Indonesia
57
(53 cabang), maka secara rinci decision tree yang terbentuk dapat dilihat pada Lampiran 3. Dari decision tree yang terbentuk pada data Eselon IVB dapat disimpulkan 15 pola pengisian jabatan struktural seperti: 1.
Untuk pegawai dengan masa kerja di bawah 15,7083 tahun, yang diprioritaskan untuk mengisi jabatan struktural Eselon IVB adalah pegawai dengan jenjang jabatan struktural dan telah mengikuti diklat Pim IV.
2.
Pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 1,8333 dapat mengisi jabatan struktural Eselon IVB apabila berumur di atas 26,2083 tahun.
3.
Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 3,5833 tahun, yang diprioritaskan untuk mengisi jabatan struktural adalah adalah pegawai dengan pangkat golongan di atas III/a dan memiliki pengalaman dalam unit kerja di atas 2,54167 tahun.
4.
Pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki yang memiliki masa kerja di atas 4,20833 tahun dapat mengisi jabatan struktural Eselon IVB apabila memiliki pangkat dan golongan di atas III/a.
5.
Pegawai dengan masa kerja di atas 15,7083 tahun yang diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan jenjang jabatan struktural dengan pangkat golongan di atas III/a, memiliki pengalaman unit kerja di bawah 4,125 tahun dan telah mengikuti diklat Pim IV.
6.
Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang jabatan struktural serta memiliki pangkat golongan III/a yang diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan umur di bawah 50,9167 tahun.
7.
Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 3,5833 tahun dan di bawah 4,208 tahun, yang diprioritaskan untuk mengisi jabatan struktural adalah pegawai dengan pangkat golongan III/a.
8.
Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 7,791 tahun, yang diprioritaskan Universitas Indonesia
58
untuk mengisi jabatan struktural adalah pegawai dengan pengalaman unit kerja lebih dari 0,125 tahun. 9.
Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat pendidikan D3 atau S2, dapat mengisi jabatan struktural Eselon IVB apabila berumur tidak lebih dari 42,375 tahun.
10. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon IVB apabila memiliki pangkat golongan III/d atau IV/a. 11. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang jabatan struktural serta memiliki pangkat golongan di atas III/a yang diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan pengalaman unit kerja di atas 4,125 tahun. 12. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang jabatan struktural serta memiliki pangkat golongan di atas III/a yang diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan pengalaman unit kerja di bawah 4,125 tahun yang belum pernah mengikuti pendidikan pelatihan kepemimpian dan memiliki pengalaman unit kerja di atas 2,208 tahun. 13. Untuk pegawai dengan masa kerja di atas 15,7083 yang memiliki jenjang jabatan struktural serta memiliki pangkat golongan di atas III/a yang diprioritaskan mengisi jabatan struktural Eselon IVB adalah pegawai dengan pengalaman unit kerja di bawah 4,125 tahun yang belum pernah mengikuti pendidikan pelatihan kepemimpian dan memiliki pengalaman unit kerja tidak lebih dari 1,833 tahun. 14. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon IVB apabila memiliki pendidikan S1, dengan pangkat golongan III/b serta berumur tidak lebih dari 31,125 tahun.
Universitas Indonesia
59
15. Untuk pegawai dengan masa kerja di bawah 15,7083 dan jenjang jabatan struktural yang memiliki masa kerja di atas 7,791 tahun serta memiliki tingkat pendidikan selain D3 atau selain S2, dapat mengisi jabatan struktural Eselon IVB apabila memiliki pendidikan S1, dengan pangkat golongan III/b, berumur lebih dari 31,125 tahun serta memiliki masa kerja lebih dari 12,791 tahun. Pola pengisian jabatan struktural yang terbentuk dari algoritma Jrip dan CRUISE memiliki beberapa persamaan sebagai berikut: 1.
Atribut masa kerja dan jenjang jabatan mendominasi rule yang terbentuk dari pola pengisian jabatan struktural untuk Eselon IVB.
2.
Pada beberapa rule, atribut pendidikan dan pelatihan, pangkat golongan, tingkat pendidikan, dan umur turut menentukan hasil classification untuk class Eselon IVB.
Perbedaan dari dua algoritma tersebut adalah pada algoritma Jrip atribut jenjang jabatan menjadi percabangan pertama dari rule yang terbentuk lalu diikuti oleh atribut masa kerja. Sedangkan pada algoritma CRUISE percabangan pertama ditentukan oleh atribut masa kerja, yang kemudian diikuti oleh atribut jenjang jabatan. Namun dari perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon IVB dapat dilihat pada Lampiran 2. 4.2.3 Classification pada Data Eselon IVA Pada data tingkat Eselon IVA terdiri atas 4.062 train set (1.272 Mutasi Jabatan dan 2.790 Kenaikan Pangkat) dan 2.368 test set dengan hasil classification seperti pada Tabel 4.28. Tabel 4.28 Hasil Classification untuk Eselon IVA Algoritma
Decorate CRUISE
Pola prediksi Ada Ada
Data mining tool Weka CRUISE
Akurasi Akurasi Train set Test set 91,94% 92,17%
88,04% 85,47%
Akurasi Akurasi Eselon Non IVA eselon 91,79% 87,42% 94,47% 84,08%
Universitas Indonesia
60
Seperti yang dapat dilihat pada tabel 4.28, salah satu algoritma dengan akurasi eselon terbaik yang menghasilkan pola prediksi adalah algoritma Decorate dengan confusion matrix eperti yang dapat dilihat padaTabel 4.29. Tabel 4.29 Confusion Matrix Algoritma Decorate untuk Data Eselon IVA Non Eselon Eselon IVA 28 313 1.772 255 Tabel 4.29 menjelaskan bahwa algoritma simple cart menghasilkan nilai akurasi sebesar 88,04% pada prediksi test set Eselon V dengan 28 kesalahan prediksi pada data Eselon IVA, dan 255 kesalahan dalam memprediksi data non eselon. Dikarenakan ukuran decision tree yang terbentuk dari algoritma ini cukup besar (76 cabang), maka secara rinci decision tree yang terbentuk dapat dilihat pada Lampiran 4. Dari decision tree yang terbentuk pada data Eselon IVA dapat disimpulkan 19 pola pengisian jabatan struktural seperti: 1.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/d atau III/a dapat dijadikan Eselon IVA.
2.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan S2 atau S1.
3.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/a dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan D3,S1, atau S2.
4.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/a dengan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika berumur di atas 50,916 tahun.
5.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c dapat dijadikan Eselon IVA jika memiliki pengalaman unit kerja di atas 3,583 tahun.
6.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c dengan pengalaman unit kerja tidak lebih dari 3,583 tahun dapat dijadikan Eselon IVA jika memiliki tingkat pendidikan D1 atau D3 atau S1 atau S2.
7.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S2 dapat dijadikan Eselon IVA jika memiliki masa Universitas Indonesia
61
kerja tidak lebih dari 17,083 tahun dan telah mengikuti pendidikan dan pelatihan Pim IV. 8.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c ,pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika memiliki masa kerja tidak lebih dari 27,083 tahun.
9.
Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c ,pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika memiliki masa kerja lebih dari 28,833 tahun, telah mengikuti pendidikan dan pelatihan Pim IV, dan berumur di atas 52 tahun.
10. Pegawai dengan jenjang jabatan struktural yang memiliki golongan III/c, pengalaman unit kerja tidak lebih dari 1,25 tahun dan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika memiliki masa kerja di atas 30,916 tahun meskipun berlum pernah mengikuti pendidikan dan pelatihan Pim IV. 11. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja tidak lebih dari 5,833 tahun dan berumur di bawah 36,583 tahun. 12. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja antara 5,833 tahun hingga 7,416 tahun. 13. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja lebih dari 14,916 tahun. 14. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S2 tetapi belum mengikuti pendidikan dan pelatihan Pim IV dapat dijadikan Eselon IVA jika memiliki masa kerja antara 7,416 tahun hingga 14,916 tahun dan berumur di bawah 34,083 tahun.
Universitas Indonesia
62
15. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan SMA dapat dijadikan Eselon IVA jika memiliki pengalaman unit kerja antara 0,5 tahun hingga 1,5 tahun dan berumur di atas 49,833 tahun. 16. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah 0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan pelatihan Pim IV dan berumur tidak lebih dari 28,667 tahun. 17. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah 0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan pelatihan Pim IV, berumur lebih dari 28,667 tahun serta memiliki masa kerja di atas 17,083 tahun. 18. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S1, dan memiliki pengalaman unit kerja di bawah 0,083 tahun dijadikan Eselon IVA jika telah mengikuti pendidikan dan pelatihan Pim IV, berumur lebih dari 43,583 tahun serta memiliki masa kerja tidak lebih dari 17,083 tahun. 19. Pegawai dengan jenjang jabatan struktural yang memiliki golongan IV/b dengan tingkat pendidikan S1, memiliki pengalaman unit kerja di bawah 0,083 tahun, meskipun belum mengikuti pendidikan dan pelatihan Pim IV, dijadikan Eselon IVA jika memiliki masa kerja antara 7,583 tahun hingga 7,916 tahun. Algoritma lain yang juga menghasilkan akurasi class Eselon IVA cukup tinggi adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang terbentuk dapat dilihat pada Tabel 4.30. Tabel 4.30 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IVA Eselon IVA Non Eselon 322 19 325 1.702
Universitas Indonesia
63
Tabel 4.30 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi sebesar 85,47% pada prediksi test set Eselon IVA dengan 19 kesalahan prediksi pada data Eselon IVA, dan 418 kesalahan dalam memprediksi data non eselon. Decision tree yang terbentuk tidak sebesar decision tree pada data Eselon IVB. Pada data Eselon IVA decision tree yang terbentuk hanya memiliki 19 cabang dengan 4 rule utama yang menentukkan class Eselon IVA seperti yang dapat dilihat pada decision tree berikut: Node 1 : pangkatgolongan = III/a III/c IV/a IV/b Node 2 : jenjab = Struktural Node 4: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 857 244 Node 1 : pangkatgolongan = III/b III/d Node 3 : diklatpim = Pim II Pim III Pim IV Node 6 : pangkatgolongan = III/a III/c III/d IV/a IV/b Node 12: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 162 21 Node 6 : pangkatgolongan = III/b Node 13: umur <= 44.6250 Node 26: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 27 22 Node 3 : diklatpim = belum mengikuti Node 7: pengalamanunitkerja <= 0.833335E-01 Node 14 : jenjab = Struktural Node 28 : pangkatgolongan = III/d Node 56: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 92 34 Node 7: pengalamanunitkerja > 0.833335E-01 Node 15: pengalamanunitkerja <= 3.04167 Node 30: Terminal Node, predicted class = IVA Class label : IVA non eselon Class size : 50 44
Universitas Indonesia
64
Dari decision tree tersebut, 4 pola pengisian jabatan struktural Eselon IVA yang dapat diidentifikasi adalah: 1.
Pegawai dengan pangkat golongan III/a, III/c, IV/a, dan IV/b yang diutamakan untuk mengisi jabatan struktural Eselon IVA apabila memiliki jenjang jabatan struktural.
2.
Pegawai dengan pangkat golongan III/b atau III/d yang diutamakan untuk mengisi jabatan struktural Eselon IVA adalah yang pernah mengikuti diklat Pim.
3.
Sedangkan pegawai dengan pangkat golongan III/b atau III/d yang belum pernah mengikuti diklat Pim pada golongan tersebut dapat mengisi jabatan struktural Eselon IVA apabila memiliki pengalaman unit kerja tidak lebih dari 0.8333 tahun, memiliki jenjang jabatan struktural, dan memiliki pangkat golongan III/d.
4.
Sedangkan pegawai dengan pangkat golongan III/b atau III/d yang belum pernah mengikuti diklat Pim pada golongan tersebut dapat mengisi jabatan struktural Eselon IVA apabila memiliki pengalaman unit kerja antara 0.8333 tahun hingga 3,041 tahun.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Decorate dan CRUISE memiliki beberapa persamaan sebagai berikut: 1.
Atribut pangkat golongan dan jenjang jabatan mendominasi rule yang terbentuk dari pola pengisian jabatan struktural untuk Eselon IVA.
2.
Pada beberapa rule, atribut pendidikan dan pelatihan,pangkat golongan, tingkat pendidikan, dan umur turut menentukan hasil classification untuk class Eselon IVA.
Perbedaan dari dua algoritma tersebut adalah pada algoritma Decorate atribut jenjang jabatan menjadi percabangan pertama dari rule yang terbentuk lalu diikuti oleh atribut pangkat golongan. Sedangkan pada algoritma CRUISE percabangan pertama ditentukan oleh atribut pangkat gologan, yang kemudian diikuti oleh atribut jenjang jabatan. Dari perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon IVA dapat dilihat pada Lampiran 2. Universitas Indonesia
65
4.2.4 Classification pada Data Eselon IIIB Pada data tingkat Eselon IIIB terdiri atas 5.364 train set (254 Mutasi Jabatan dan 5.110 Kenaikan Pangkat) dan 4.223 test set dengan hasil classification dapat dilihat pada Tabel 4.31. Tabel 4.31 Hasil Classification untuk Eselon IIIB Algoritma
Bayes NET CRUISE
Data Akurasi Akurasi mining Train set Test set tool Ada Weka 93,90% 96,04% Ada CRUISE 90,19% 92,92%
Pola prediksi
Akurasi Akurasi Eselon Non IIIB eselon 76,19% 96,35% 98,41% 92,84%
Seperti yang dapat dilihat pada tabel 4.31 algoritma CRUISE menunjukkan persentase akurasi test set yang tinggi (92,92%), algoritma ini menghasilkan akurasi prediksi tertinggi dari algoritma lainnya yaitu sebesar 98,41% pada class Eselon IIIB dan menghasilkan akurasi prediksi class non eselon sebesar 92,84%, dengan confusion matrix dapat dilihat pada Tabel 4.32. Tabel 4.32 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIB Eselon IIIB Non Eselon 62 1 298 3.862 Tabel 4.32 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi sebesar 92,92% pada prediksi test set Eselon IIIB dengan tanpa kesalahan prediksi pada data Eselon IIIB, dan 283 kesalahan prediksi data non eselon yang seharusnya tidak menjadi Eselon IIIB. Secara umum algoritma CRUISE adalah algoritma classification yang dapat secara simultan mengurangi ukuran decision tree, dan dapat meningkatkan akurasi prediksi dengan menyesuaikan diskriminan bivariat linier. Berikut ini adalah model prediksi decision tree yang terbentuk:
Universitas Indonesia
66
jenjab = Fungsional: non eselon (3665) jenjab = Struktural: :...pangkat_golongan = III/c: non eselon (884/3) pangkat_golongan in {III/d,IV/a,IV/b,IV/c}: :...pengalaman_unitkerja > 4.83333: IIIB (48/2) pengalaman_unitkerja <= 4.83333: :...diklat = Pim III: IIIB (82/28) diklat in {belum mengikuti,Pim II,Pim IV}: :...tingkat_pendidikan in {D1,D2,D3,S1,S3,SD,SMA, : SMP}: non eselon (449/72) tingkat_pendidikan = S2: :...umur > 53.8333: IIIB (15/3) umur <= 53.8333: :...pangkat_golongan in {IV/a,IV/c}: non eselon (138/32) pangkat_golongan = IV/b: IIIB (2/1) pangkat_golongan = III/d: :...masakerja <= 24.0833: non eselon (65/22) masakerja > 24.0833: IIIB (16/4) Dari bentuk decision tree tersebut dapat diidentifikasi 5 pola pengisian jabatan struktural Eselon IIIB sebagai berikut: 1.
Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan di atas III/c dapat dijadikan pejabat Eselon IIIB jika memiliki pengalaman unit kerja di atas 4,833 tahun.
2.
Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan di atas III/c dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun, dapat dijadikan pejabat Eselon IIIB jika telah mengikuti pendidikan dan pelatihan Pim III.
3.
Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan di atas III/c dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat Eselon IIIB jika memiliki tingkat pendidikan S2 dan berumur di atas 53,833 tahun.
4.
Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan IV/b dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat Eselon IIIB jika memiliki tingkat pendidikan S2 dan berumur tidak lebih dari 53,833 tahun . Universitas Indonesia
67
5.
Pegawai dengan jenjang jabatan struktural yang memiliki pangkat golongan III/d dan memiliki pengalaman unit kerja tidak lebih dari 4,833 tahun tetapi belum mengikuti pendidikan dan pelatihan Pim III, dapat dijadikan pejabat Eselon IIIB jika berpendidikan S2, berumur tidak lebih dari 53,833 tahun, dengan masa kerja lebih dari 24,083 tahun .
Algoritma lainnya yang juga menghasilkan pola prediksi dengan akurasi test set yang cukup tinggi adalah algoritma Bayes NET dengan nilai akurasi sebesar 96,04% dan confusion matrix dapat dilihat pada Tabel 4.33. Tabel 4.33 Confusion Matrix Algoritma Bayes NET untuk Data Eselon IIIB Eselon IIIB Non Eselon 48 15 152 4.008 Tabel 4.33 menjelaskan bahwa algoritma Bayes NET menghasilkan nilai akurasi sebesar 96,04% pada prediksi test set Eselon IIIB dengan 15 kesalahan prediksi pada data Eselon IIIB, dan 152 kesalahan dalam memprediksi data non eselon. Berikut ini adalah pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET untuk data Eselon IIIB yang dapat dilihat pada Gambar 4.3.
Gambar 4.3 Pola Pengisian Jabatan Struktural Eselon IIIB
Universitas Indonesia
68
Seperti yang dapat dilihat pada gambar 4.3 algoritma Bayes NET tidak menganggap suatu atribut lebih penting dari pada atribut lainnya, melainkan memunculkan nilai peluang munculnya suatu nilai pada atribut. Dari output algoritma Bayes NET pola pengisian jabatan struktural Eselon IIIB yang dapat diidentifikasi di antaranya yaitu: 1.
Untuk atribut pendidikan dari train set Eselon IIIB, tingkat pendidikan S2 memiliki persentase peluang sebesar 52,8% disusul dengan tingkat pendidikan S1 dengan persentase peluang sebesar 42,7% untuk menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train set non eselon tingkat pendidikan S1 memiliki persentase peluang sebesar 54,3% untuk tidak menjadi pejabat Eselon IIIB.
2.
Untuk atribut masa kerja dari train set Eselon IIB, pegawai dengan masa kerja di atas 12,458 tahun memiliki persentase peluang sebesar 93,3% untuk menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train set non eselon, pegawai dengan masa kerja di atas 12,458 tahun memiliki persentase peluang sebesar 79,99% untuk tidak menjadi pejabat Eselon IIIB.
3.
Untuk atribut pendidikan dan pelatihan dari train set Eselon IIIB, pegawai yang pernah mengikuti diklat Pim IV memiliki persentase peluang sebesar 32,6% untuk menjadi pejabat Eselon IIIB, disusul dengan Pim III dengan presentase peluang sebesar 27,1%. Hal ini didukung pula oleh train set non eselon
yang
menunjukkan
pegawai
yang
belum
mengikuti
diklat
kepemimpinan sama sekali memiliki persentase peluang sebesar 87,2% untuk tidak menjadi pejabat Eselon IIIB. 4.
Untuk atribut pangkat golongan dari train set Eselon IIIB, pegawai dengan pangkat golongan III/d memiliki persentase peluang sebesar 61% untuk menjadi pejabat Eselon IIIB disusul dengan pegawai dengan golongan IV/a dengan persentase peluang sebesar 30,6%.
5.
Untuk atribut pengalaman unit kerja dari train set Eselon IIB, pegawai dengan pengalaman unit kerja 0 hingga 0,208 tahun memiliki peluang sebesar 61,8% untuk menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train set non eselon, pegawai dengan pengalaman unit kerja 0 hingga 0,208 tahun memiliki peluang sebesar 91,78% untuk tidak menjadi pejabat Eselon IIIB. Universitas Indonesia
69
6.
Untuk atribut jenjang jabatan, dari train set Eselon IIIB, pegawai dengan jenjang jabatan struktural memiliki persentase peluang sebesar 99,8% untuk menjadi pejabat Eselon IIIB. Hal ini juga didukung oleh train set non eselon yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki persentase peluang sebesar 71,7% untuk tidak menjadi pejabat Eselon IIB.
7.
Untuk atribut umur, pegawai dengan umur maksimal 55,625 tahun memiliki persentase peluang sebesar 99,8% untuk menjadi pejabat Eselon IIIB. Meskipun demikian dari hasil train setnon eselon, pegawai dengan maksimal 55,625 tahun memiliki persentase peluang sebesar 86,3% untuk tidak menjadi pejabat Eselon IIIB.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dan CRUISE memiliki beberapa persamaan sebagai berikut: 1.
Atribut jenjang jabatan struktural memiliki peran penting dalam menentukan hasil classification. Pada Algoritma CRUISE cabang pertama decision tree ditentukan oleh atribut jenjang jabatan struktural untuk class Eselon IIIB, begitu juga pada algoritma Bayes NET jenjang jabatan struktural memiliki nilai peluang 99,8% untuk menjadi Eselon IIIB.
2.
Atribut tingkat pendidikan dengan nilai S2 dan atribut umur dengan nilai di atas 53,833 tahun menjadi penentu class Eselon IIIB pada dua algoritma ini. Pada algoritma CRUISE, pegawai dengan tingkat pendidikan S2 dan berumur di tas 53,833 tahun diklasifikasikan sebagai Eselon IIIB, begitu juga pada pada algoritma Bayes NET atribut tingkat pendidikan S2 memiliki nilai peluang sebesar 52,8% dan atribut umur dengan nilai tidak lebih dari 55,625 tahun memiliki peluang sebesar 99,8% untuk diklasifikasikan sebagai Eselon IIIB.
Perbedaan dari dua algoritma tersebut adalah pada algoritma Bayes NET penentuan rentang nilai untuk atribut dengan tipe data numerik cukup berbeda dengan algoritma CRUISE. Sebagai contoh untuk atribut umur pada algoritma CRUISE dibatasi oleh nilai 53,833 tahun sedangkan pada algoritma Bayes NET dibatasi oleh nilai 55,625 tahun. Pada atribut masa kerja juga terdapat perbedaan serupa, pada algoritma CRUISE dibatasi oleh nilai 24,083 tahun pada algoritma Bayes NET dibatasi oleh nilai 5,166 tahun dan 12,458 tahun. Contoh lainnya Universitas Indonesia
70
terdapat pada atribut pengalaman unit kerja, pada algoritma CRUISE dibatasi oleh nilai 4,833 tahun, sedangkan pada algoritma Bayes NET dibatasi oleh nilai 0,208 tahun. Dari perbedaan tersebut hanya atribut pengalaman unit kerja yang terlihat bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon IIIB dapat dilihat pada Lampiran 2. 4.2.5 Classification pada data Eselon IIIA Pada data tingkat Eselon IIIA terdiri atas 4.410 train set (194 Mutasi Jabatan dan 4.216 Kenaikan Pangkat) dan 3.694 test set dengan hasil classification seperti pada Tabel 4.34. Tabel 4.34 Hasil Classification untuk Eselon IIIA Algoritma
REP Tree CRUISE
Data mining tool Ada Weka Ada CRUISE
Pola prediksi
Akurasi Train set
Akurasi Test set
97,86% 90,98%
98,64% 95,83%
Akurasi Akurasi Eselon Non IIIA eselon 81,25% 98,88% 93,75% 95,86%
Algoritma yang menghasilkan pola prediksi class Eselon IIIA cukup tinggi adalah algoritma REP tree dengan persentase akurasi test set sebesar 98,64% dan confusion matrix dapat dilihat pada Tabel 4.35. Tabel 4.35 Confusion Matrix untuk Algoritma REP Tree untuk Eselon IIIA Eselon IIIA Non Eselon 40 8 41 3605 Tabel 4.34 menjelaskan bahwa algoritma REP tree menghasilkan nilai akurasi sebesar 98,64% pada prediksi test set Eselon IIIA dengan 8 kesalahan prediksi pada data Eselon IIIA yang seharusnya menjadi Eselon IIIA, dan 41 kesalahan prediksi data non eselon yang seharusnya tidak menjadi Eselon IIIA. Secara umum algoritma REP tree mencoba menyusun decision tree dengan menggunakan nilai yang ada pada setiap atribut lalu dikurangi dengan nilai error dengan menggunakan backlifting. Dengan algoritma ini, atribut yang memiliki nilai numerik hanya diurutkan sekali. Nilai yang kosong pada suatu atribut dipisahkan menjadi cabang-cabang tersendiri. Berikut adalah decision tree yang terbentuk dari algoritma REP tree: Universitas Indonesia
71
diklat = Pim III | pangkat_golongan = IV/a | | pengalaman_unitkerja < 2.33 | | | pengalaman_unitkerja < 1.13 | | | | tingkat_pendidikan = S1 | | | | | masakerja < 2.25 : IIIA (2/0) [0/0] | | | | | masakerja >= 2.25 | | | | | | masakerja < 20.83 : non eselon (7/1) [4/0] | | | | | | masakerja >= 20.83 : IIIA (8/3) [5/2] | | | | tingkat_pendidikan = S2 : IIIA (37/10) [16/4] | | | | tingkat_pendidikan = SMA : non eselon (0/0) [1/0] | | | | tingkat_pendidikan = D3 : IIIA (4/1) [0/0] | | | pengalaman_unitkerja >= 1.13 : non eselon (3/0) [3/0] | | pengalaman_unitkerja >= 2.33 : IIIA (12/0) [2/0] | pangkat_golongan = III/d | | masakerja < 14.46 | | | masakerja < 12.83 : non eselon (4/0) [0/0] | | | masakerja >= 12.83 : IIIA (2/0) [1/0] | | masakerja >= 14.46 : non eselon (33/1) [16/2] | pangkat_golongan = IV/b : IIIA (30/6) [13/3] | pangkat_golongan = IV/c : IIIA (2/1) [0/0] diklat = Pim IV | pangkat_golongan = IV/a | | pengalaman_unitkerja < 4.13 | | | masakerja < 16.04 : non eselon (20/0) [9/0] | | | masakerja >= 16.04 | | | | umur < 51.67 | | | | | umur < 43.63 | | | | | | umur < 42.04 : non eselon (2/0) [3/0] | | | | | | umur >= 42.04 : IIIA (6/1) [6/2] | | | | | umur >= 43.63 : non eselon (41/2) [24/5] | | | | umur >= 51.67 | | | | | tingkat_pendidikan = S1 : IIIA (10/4) [1/0] | | | | | tingkat_pendidikan = S2 : non eselon (6/1) [1/1] | | | | | tingkat_pendidikan = SMA : non eselon (1/0) [1/0] | | pengalaman_unitkerja >= 4.13 : IIIA (4/0) [2/0] | pangkat_golongan = III/d : non eselon (136/2) [92/0] | pangkat_golongan = IV/b : IIIA (4/2) [5/1] diklat = belum mengikuti | jenjab = Struktural | | masakerja < 22.17 : non eselon (138/2) [72/5] | | masakerja >= 22.17 | | | pangkat_golongan = IV/a : non eselon (52/16) [31/8] | | | pangkat_golongan = III/d : non eselon (72/2) [45/1] | | | pangkat_golongan = IV/b : IIIA (8/3) [4/1] | jenjab = Fungsional : non eselon (2291/0) [1112/0] diklat = Pim II : IIIA (3/0) [1/1] Universitas Indonesia
72
Dari output decision tree yang terbentuk untuk data Eselon IIIA, dapat diidentifikasi bahwa atribut yang paling berpengaruh untuk data Eselon IIIA adalah pendidikan dan pelatihan dengan 14 pola pengisian jabatan struktural sebagai berikut: 1.
Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim II dipastikan dapat mengisi jabatan Eselon IIIA.
2.
Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, serta memiliki tingkat pendidikan S1 dapat dijadikan Eselon IIIA jika memiliki masa kerja di bawah 2,25 tahun.
3.
Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, serta memiliki tingkat pendidikan S1 dapat dijadikan Eselon IIIA jika memiliki masa kerja di atas 20,83 tahun.
4.
Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, dapat dijadikan Eselon IIIA jika memiliki tingkat pendidikan S2.
5.
Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan pangkat golongan IV/a, dan pengalaman unit kerja di bawah 1,13 tahun, dapat dijadikan Eselon IIIA jika memiliki tingkat pendidikan D3.
6.
Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan pangkat golongan IV/a dapat dijadikan Eselon IIIA jika memiliki pengalaman unit kerja di atas 2,33 tahun.
7.
Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III, dengan pangkat golongan III/d dapat dijadikan Eselon IIIA jika memiliki masa kerja antara 12,83 tahun hingga 14,46 tahun.
8.
Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan IV/b.
9.
Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim III dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan IV/c. Universitas Indonesia
73
10. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan pangkat golongan IV/a dan masa pengalaman unit kerja di bawah 4,13 tahun, dapat mengisi jabatan Eselon IIIA jika memiliki masa kerja lebih dari 16,04 tahun dan berumur antara 42,04 tahun hingga 51,67 tahun. 11. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan pangkat golongan IV/a dan masa pengalaman unit kerja di bawah 4,13 serta memiliki masa kerja di atas 16,04 tahun, dapat mengisi jabatan Eselon IIIA jika berumur di atas 51,67 tahun dan berpendidikan S1. 12. Pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV, dengan pangkat golongan IV/a, dapat mengisi jabatan Eselon IIIA jika memiliki pengalaman unit kerja lebih daru 4,13 tahun. 13. Untuk pegawai yang pernah mengikuti pendidikan dan pelatihan Pim IV dipastikan dapat mengisi jabatan Eselon IIIA jika memiliki pangkat golongan IV/b. 14. Untuk pegawai yang belum pernah mengikuti pendidikan dan pelatihan juga dapat mengisi jabatan Eselon IIIA jika memiliki jenjang jabatan struktural, dengan masa kerja lebih dari 22,17 tahun dan memiliki pangkat golongan IV//b. Algoritma lain yang menghasilkan akurasi class Eselon IIIA cukup tinggi adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang terbentuk dapat dilihat pada Tabel 4.36. Tabel 4.36 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIIA Eselon IIIA Non Eselon 45 3 151 3.495 Tabel 4.36 menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi sebesar 95,83% pada prediksi test set Eselon IIIA dengan 3 kesalahan prediksi pada data Eselon IIIA, dan 151 kesalahan dalam memprediksi data non eselon. Berikut ini adalah decision tree yang terbentuk:
Universitas Indonesia
74
Node 1 : diklatpim = Pim II Pim III Pim IV Node 2 : pangkatgolongan = IV/a IV/b IV/c Node 4: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 144 156 Node 2 : pangkatgolongan = III/d Node 5 : diklatpim = Pim III Node 10: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 6 50 Node 1 : diklatpim = belum mengikuti Node 3 : jenjab = Struktural Node 6 : pangkatgolongan = IV/a IV/b Node 12: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 37 174 Node 6 : pangkatgolongan = III/d IV/c Node 13 : tingkatpendidikan = D1 D3 Node 26: Terminal Node, predicted class = IIIA Class label : IIIA non eselon Class size : 2 13 Dari decision tree yang terbentuk untuk data Eselon IIIA, dapat diidentifikasi 4 pola pengisian jabatan struktural sebagi berikut: 1.
Pegawai yang diprioritaskan untuk mengisi jabatan struktural Eselon IIIA adalah pegawai yang pernah mengikuti diklat Pim dengan golongan IV/a ke atas.
2.
Pegawai dengan golongan III/d yang diutamakan adalah yang pernah mengikuti diklat Pim III.
3.
Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan adalah yang memiliki jenjang jabatan struktural dengan pangkat golongan IV/a atau IV/b.
4.
Pegawai dengan pangkat golongan III/d atau IV/c dapat mengisi jabatan eselon IIIA jika memiliki tingkat pendidikan D1 atau D3.
Universitas Indonesia
75
Pola pengisian jabatan struktural yang terbentuk dari algoritma REP Tree dan CRUISE memiliki beberapa persamaan sebagai berikut: 1.
Atribut pendidikan dan pelatihan menjadi cabang pertama decision tree dari dua algoritma tersebut.
2.
Atribut pangkat golongan menjadi cabang ke-2 pada beberapa cabang dari decision tree pada dua algoritma tersebut. Perbedaan yang terlihat dari dua algoritma tersebut adalah pada algoritma
CRUISE, atribut dengan tipe data numerik (masa kerja, pengalaman dalam unit kerja, dan umur) sama sekali tidak mempengaruhi hasil classification sedangkan pada algoritma REP Tree atribut numerik seperti masa kerja dan pengalaman unit kerja turut menentukan hasil classification. Dari perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling bertentangan. Hasil classification seluruh algoritma yang tersedia secara lengkap untuk Eselon IIIA dapat dilihat pada Lampiran 2. 4.2.6 Classification pada Data Eselon IIB Pada data tingkat Eselon IIB terdiri atas 3.488 train set (112 Mutasi Jabatan dan 3.376 Kenaikan Pangkat) dan 3.046 test set dengan hasil classification dapat dilihat pada Tabel 4.37. Tabel 4.37 Hasil Classification untuk Eselon IIB Algoritma
Bayes NET CRUISE
Pola prediksi Ada Ada
Data mining tool Weka CRUISE
Akurasi Train set 96,3% 83,94%
Akurasi Akurasi Test set Eselon IIB 98,52% 100% 88,71% 100%
Akurasi Non eselon 98,51% 88,6%
Seperti yang dapat dilihat pada tabel 4.37, algoritma yang memiliki akurasi tertinggi baik untuk class Eselon IIB
dan non eselon adalah Bayes NET,
meskipun total akurasi test set-nya hanya mencapai 98,52%, tetapi mampu menghasilkan akurasi prediksi 100% pada class Eselon IIB dan menghasilkan akurasi prediksi class non eselon sebesar 98,51%, dengan confusion matrix dapat dilihat pada Tabel 4.38.
Universitas Indonesia
76
Tabel 4.38 Confusion Matrix Algoritma Bayes NET untuk Eselon IIB Eselon IIB Non Eselon 29 0 45 2972 Tabel 4.38 di atas menjelaskan bahwa algoritma Bayes NET menghasilkan nilai akurasi sebesar 98,52% pada prediksi test set Eselon IIB dengan tanpa kesalahan prediksi pada data Eselon IIB, dan 45 kesalahan prediksi data non eselon yang seharusnya tidak menjadi Eselon IIB. Secara umum algoritma Bayes NET mengidentifikasi pola data dengan menggunakan algoritma pencarian dan pengukuran kualitas. Algoritma ini menghasilkan nilai kemungkinan dari setiap nilai pada atribut yang ada. Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dapat dilihat pada Gambar 4.4.
Gambar 4.4 Output Algoritma Bayes NET untuk Data Eselon IIB Seperti yang dapat dilihat pada Gambar 4.4, algoritma Bayes NET tidak menganggap suatu atribut lebih penting dari pada atribut lainnya. Dari output algoritma Bayes NET pola pengisian jabatan struktural Eselon IIB yang dapat diidentifikasi di antaranya yaitu: 1.
Untuk atribut pendidikan dari train set Eselon IIB, tingkat pendidikan S2 memiliki persentase peluang sebesar 58,8% disusul dengan tingkat pendidikan S1 dengan persentase peluang sebesar 28,8% untuk menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train set non eselon tingkat Universitas Indonesia
77
pendidikan S1 memiliki persentase peluang sebesar 49,4%
untuk tidak
menjadi pejabat Eselon IIIB. 2.
Untuk atribut masa kerja dari train set Eselon IIB, pegawai dengan masa kerja di atas 23,625 tahun memiliki persentase peluang sebesar 56,6% untuk menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train setnon eselon, pegawai dengan masa kerja di atas 23,625 tahun memiliki persentase peluang sebesar 38,1% untuk tidak menjadi pejabat Eselon IIB.
3.
Untuk atribut pendidikan dan pelatihan dari train set Eselon IIB, pegawai yang pernah mengikuti diklat Pim III memiliki persentase peluang sebesar 39,9% untuk menjadi pejabat Eselon IIB, disusul dengan Pim II dengan presentase peluang sebesar 31,1%. Hal ini didukung pula oleh train set non eselon
yang
menunjukkan
pegawai
yang
belum
mengikuti
diklat
kepemimpinan sama sekali memiliki persentase peluang sebesar 91,1% untuk tidak menjadi pejabat Eselon IIB. 4.
Untuk atribut pangkat golongan dari train set Eselon IIB, pegawai dengan pangkat golongan IV/b memiliki persentase peluang sebesar 59,3% untuk menjadi pejabat Eselon IIB. Sedangkan dari hasil train set non eselon, pegawai dengan pangkat golongan IV/a memiliki persentase peluang sebesar 90,9% untuk tidak menjadi pejabat Eselon IIB.
5.
Untuk atribut pengalaman unit kerja dari train set Eselon IIB, pegawai dengan pengalaman unit kerja 0 hingga 0,08 tahun memiliki peluang sebesar 81% untuk menjadi pejabat Eselon IIB. Meskipun demikian dari hasil train set non eselon, pegawai dengan pengalaman unit kerja 0 hingga 0,08 tahun memiliki peluang sebesar 96,8% untuk tidak menjadi pejabat Eselon IIB.
6.
Untuk atribut jenjang jabatan, dari train set Eselon IIB, pegawai dengan jenjang jabatan struktural memiliki persentase peluang sebesar 99,6% untuk menjadi pejabat Eselon IIB. Hal ini juga didukung oleh train set non eselon yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki persentase peluang sebesar 84,9% untuk tidak menjadi pejabat Eselon IIB.
7.
Untuk atribut umur, pegawai dengan umur maksimal 56,7 tahun memiliki persentase
peluang
sebesar
99,6%
untuk
menjadi
pejabat
Eselon
IIB.Meskipun demikian dari hasil train set non eselon, pegawai dengan Universitas Indonesia
78
maksimal 56,7 tahun memiliki persentase peluang sebesar 83,5% untuk tidak menjadi pejabat Eselon IIB. Algoritma lain yang juga menghasilkan akurasi class Eselon IIB cukup tinggi adalah CRUISE yang diimplementasikan dengan menggunakan data mining tool berbasis teks dengan nama yang sama yaitu CRUISE. Hasil confusion matrix yang terbentuk dapat dilihat pada Tabel 4.39. Tabel 4.39 Confusion Matrix untuk Algoritma CRUISE untuk Eselon IIB Eselon IIB Non Eselon 29 0 344 2.673 Tabel 4.39, menjelaskan bahwa algoritma CRUISE menghasilkan nilai akurasi sebesar 88,71% pada prediksi test set Eselon IIB dengan tanpa kesalahan prediksi pada data Eselon IIB, dan 344 kesalahan dalam memprediksi data non eselon. Berikut ini adalah decision tree yang terbentuk: Node 1 : diklatpim = Pim II Pim III Pim IV Node 2: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 87 300 Node 1 : diklatpim = belum mengikuti Node 3 : pangkatgolongan = III/a III/b III/c III/d IV/b IV/c Node 6: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 22 248 Node 3 : pangkatgolongan = IV/a Node 7 : jenjab = Struktural Node 14 : tingkatpendidikan = D3 Node 28: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 1 6 Node 29: masakerja > 27.9167 Node 59 : tingkatpendidikan = S1 Node 118: Terminal Node, predicted class = IIB Class label : IIB non eselon Class size : 2 6
Universitas Indonesia
79
Dari decision tree yang terbentuk untuk data Eselon IIB di atas, 4 pola pengisian jabatan struktural yang dapat diidentifikasi: 1.
Pegawai yang diprioritaskan mengisi jabatan Eselon IIB adalah yang pernah mengikuti diklat Pim.
2.
Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan untuk mengisi jabatan struktural Eselon IIB adalah pegawai yang memiliki pangkat golongan IV/a dengan jenjang jabatan struktural, dengan tingkat pendidikan D3.
3.
Untuk pegawai yang belum pernah mengikuti diklat Pim yang diutamakan untuk mengisi jabatan struktural Eselon IIB adalah pegawai yang memiliki pangkat golongan IV/a dengan jenjang jabatan struktural, masa kerja di atas 27.9167 tahun dan tingkat pendidikan S1.
4.
Untuk pegawai di atas golongan IV/a dapat diklasifikasikan sebagai Eselon IIB.
Pola pengisian jabatan struktural yang terbentuk dari algoritma Bayes NET dan CRUISE memiliki beberapa persamaan sebagai berikut: 1. Atribut pendidikan dan pelatihan memiliki peranan penting dalam menentukan hasil classification pada dua algoritma ini. Pada algoritma CRUISE atribut pendidikan pelatihan menjadi cabang pertama dalam melakukan classification, begitu juga pada algoritma Bayes NET atribut pendidikan dan pelatihan dengan nilai yang pernah mengikuti pendidikan dan pelatihan memiliki nilai peluang sebesar 77,6% untuk menjadi Eselon IIB. 2. Atribut pangkat golongan juga memiliki peranan penting dalam menentukan hasil classification pada dua algoritma ini khususnya untuk nilai golongan di atas IV/a. Pada algoritma CRUISE atribut pangkat golongan dengan nilai di atas IV/a dipastikan dapat mengisi jabatan Eselon IIB, begitu juga pada algoritma Bayes NET nilai atribut pangkat golongan khususnya golongan di atas IV/a memiliki peluang sebesar 73,6% untuk menjadi Eselon IIB. Perbedaan yang terlihat dari dua algoritma tersebut adalah pada algoritma CRUISE, dari 3 atribut numerik hanya atribut masa kerja yang mempengaruhi hasil classification sedangkan pada algoritma Bayes NET atribut numerik seperti masa kerja dan pengalaman unit kerja turut menentukan hasil classification. Dari Universitas Indonesia
80
perbedaan tersebut tidak ditemukan pola pengisian jabatan struktural yang saling bertentangan. 4.2.7 Classification pada Data Eselon IIA Pada data tingkat Eselon IIA terdiri atas 395 train set (3 Mutasi Jabatan dan 392 Kenaikan Pangkat) dan 271 test set dengan hasil classification dapat dilihat pada Tabel 4.40. Tabel 4.40 Hasil Classification untuk Eselon IIA Algoritma
Bayes NET CRUISE
Pola prediksi Ada Ada
Data mining tool Weka CRUISE
Akurasi Train set 99,74%
Akurasi Akurasi Akurasi Test set Eselon Non IIA eselon 100% 100% 100%
0,76%
100%
100%
100%
Seperti yang dapat dilihat pada tabel 4.40, untuk data Eselon IIA hampir seluruh algoritma yang digunakan menghasilkan prediksi yang 100% akurat. Hanya 7 dari 62 algoritma yang digunakan menghasilkan akurasi di bawah 100%. Matrix confusion yang dihasilkan dapat dilihat pada Tabel 4.41. Tabel 4.41 Confusion Matrix Algoritma Bayes NET untuk Eselon IIA Eselon IIA Non Eselon 0 0 0 271 Tabel 4.41 di atas menjelaskan bahwa 55 dari 62 algoritma secara akurat memprediksi data Eselon IIA dan non eselon, Nilai 0 pada kolom Eselon IIA dan baris pertama menunjukkan tidak ada posisi eselon yang terisi. Hal ini sesuai dengan kondisi terakhir pada tanggal 10 Januari 2014, dengan jabatan Eselon IIA masih kosong karena Sekretaris Daerah Kota Bogor yang terdahulu mengajukan cuti di luar tanggungan negara karena mencalonkan diri sebagai wakil walikota pada Pemilu Kepala Daerah di akhir tahun 2013. Algoritma Bayes NET memiliki akurasi cukup tinggi di beberapa tingkat eselon, maka pada data Eselon IIA akan menggunakan contoh output model prediksi dari algoritma Bayes NET seperti pada Gambar 4.5.
Universitas Indonesia
81
Gambar 4.5 Output Agoritma Bayes NET untuk Data Eselon IIA Seperti yang dapat dilihat pada gambar 4.5, algoritma Bayes NET tidak menganggap suatu atribut lebih penting dari pada atribut lainnya, melainkan memunculkan nilai peluang munculnya suatu nilai pada atribut. Dari output algoritma Bayes NET pola pengisian jabatan struktural Eselon IIA yang dapat diidentifikasi di antaranya yaitu: 1.
Untuk atribut pendidikan dari train set Eselon IIA, tingkat pendidikan S2 memiliki persentase peluang sebesar 50% untuk menjadi pejabat Eselon IIA. Meskipun demikian dari hasil train set non eselon tingkat pendidikan S2 memiliki persentase peluang sebesar 40,5% untuk tidak menjadi pejabat Eselon IIIA.
2.
yang pernah mengikuti diklat Pim II memiliki persentase peluang sebesar 70% untuk menjadi pejabat Eselon IIA. Hal ini didukung pula oleh train set non eselon yang menunjukkan pegawai yang belum mengikuti diklat kepemimpinan sama sekali memiliki persentase peluang sebesar 66,9% untuk tidak menjadi pejabat Eselon IIA.
3.
Untuk atribut pangkat golongan dari train set Eselon IIA, pegawai dengan pangkat golongan III/c, IV/c, dan IV/d memiliki persentase peluang yang sama sebesar 30% untuk menjadi pejabat Eselon IIA. Sedangkan dari hasil Universitas Indonesia
82
train set non eselon, pegawai dengan pangkat golongan IV/b memiliki persentase peluang sebesar 90% untuk tidak menjadi pejabat Eselon IIA. 4.
Untuk atribut jenjang jabatan, dari train set Eselon IIA, pegawai dengan jenjang jabatan struktural memiliki persentase peluang sebesar 87,5% untuk menjadi pejabat Eselon IIA. Hal ini juga didukung oleh train set non eselon yang menunjukkan pegawai dengan jenjang jabatan fungsional memiliki persentase peluang sebesar 58,4% untuk tidak menjadi pejabat Eselon IIA.
5.
Untuk atribut umur, masa kerja, dan pengalaman dalam unit kerja pada data Eselon IIA, algoritma Bayes NET tidak melakukan klasifikasi berdasarkan nilai rentang tertentu dalam arti berapapun umur, masa kerja maupun pengalaman unit kerja pegawai, semuanya memiliki peluang yang sama untuk dapat menjadi pejabat Eselon IIA.
Algoritma lain yang juga memiliki persentase akurasi terbaik di beberapa tingkat eselon adalah algoritma CRUISE dengan nilai persentase dan confusion matrix yang sama dengan algoritma Bayes NET dan C5.0. Decision tree yang terbentuk dari algoritma CRUISE untuk data Eselon IIA adalah sebagai berikut: Node 1: Terminal Node, predicted class = IIA Class label : IIA non eselon Class size : 3 392 Dari decision tree yang cukup sederhana di atas dapat dilihat bahwa algoritma CRUISE tidak dapat menentukan atribut mana yang menjadi penentu class Eselon IIA mengingat ukuran class yang cukup kecil yaitu 3 record. Tidak ditemukan kesamaan pada dua algoritma ini mengingat decision tree dari algoritma CRUISE tidak dapat menentukan class Eselon IIA karena ukuran train set yang terlalu kecil. 4.3
Analisis Hasil Prediksi
Dari 21.649 train set (3.004 mutasi jabatan dan 18.645 kenaikan pangkat) dan 16.966 test set yang digunakan teknik data mining classification untuk pengisian jabatan struktural menghasilkan akurasi prediksi class eselon dan algoritma terbaik yang beragam untuk tiap tingkat eselon, seperti yang dapat dilihat pada Gambar 4.6: Universitas Indonesia
83
Gambar 4.6 Grafik Persentase Akurasi Prediksi Class Eselon Secara umum algoritma CRUISE memiliki rata-rata akurasi prediksi class eselon yang paling baik di setiap tingkat eselon dengan akurasi sebesar 95,7%. Meskipun algoritma ini hanya menjadi akurasi paling baik pada 4 tingkat eselon yaitu Eselon V,IIIB, IIB dan IIA tetapi secara umum nilai akurasinya sangat konsisten dengan nilai akurasi tertinggi 100% dan nilai akurasi terendah adalah 83,3% pada tingkat Eselon IVB. Algoritma lain yang juga menghasilkan pola prediksi dengan akurasi class eselon yang cukup baik adalah algoritma Bayes NET. Algoritma ini memiliki rata-rata akurasi sebesar 89,57% di setiap tingkat eselon dengan nilai akurasi tertinggi 100% dan nilai akurasi terendah adalah 76,19% pada tingkat Eselon IIIB. 4.4
Diskusi: Pola Umum Pengisian Jabatan Struktural Setiap Eselon
Meskipun pada pembahasan sebelumnya dapat dilihat bahwa setiap tingkat eselon memiliki pola pengisian jabatan struktural yang berbeda-beda, tetapi beberapa atribut yang sama selalu muncul di beberapa tingkat eselon di antaranya adalah: Universitas Indonesia
84
Pada semua tingkat eselon kecuali Eselon IIA, atribut jenjang jabatan selalu muncul dengan jenjang jabatan struktural yang selalu mendominasi pengisian jabatan struktural dibandingkan dengan jenjang jabatan fungsional.
Pada tingkat Eselon IIIA ,IIB, dan IIA atribut pendidikan dan pelatihan muncul sebagai atribut penentu classifier. Pada tiga tingkat eselon tersebut atribut pendidikan dan pelatihan selalu menjadi prioritas pertama.
Pada tingkat Eselon IVB,IVA,IIB, dan IIIA atribut pangkat golongan pegawai muncul sebagai atribut penentu classifier. Pada tingkat Eselon IVB atribut pangkat golongan berada pada prioritas ke-3. Pada tingkat Eselon IVA atribut pangkat golongan berada pada prioritas ke-2 setelah atribut jenjang jabatan.
Atribut pengalaman unit kerja juga menjadi atribut penentu classifier.Pada tingkat Eselon V, IIIB dan IIIA atribut pengalaman unit kerja berada pada prioritas ke-3.Pada tiga tingkat Eselon V dan IVB atribut masa kerja selalu menjadi prioritas ke-2.
Atribut masa kerja menjadi atribut penentu classifier pada beberapa tingkat eselon. Dari beberapa poin di atas sesuai dengan jumlah kemunculan atribut penentu classifier di setiap tingkat eselon maka dapat disimpulkan bahwa urutan prioritas atribut yang terbentuk dari setiap tingkat eselon adalah jenjang jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja serta umur.
4.5
Analisis Dampak
Hasil dari penelitian ini tentunya harus dapat bermanfaat bagi organisasi dan keilmuan. Dampak bagi organisasi dalam hal ini adalah tim Baperjakat Pemerintah
Kota Bogor.
Dampak keilmuan
khususnya
terkait
dengan
pemanfaatan teknik data mining classification di bidang pengelolaan sumber daya manusia. 4.5.1 Analisis Dampak Organisasi Pola pengisian jabatan struktural yang didapatkan tentunya dapat menjadi acuan untuk membentuk rules dalam modul SIMPEG. Sebagai contoh apabila terdapat Universitas Indonesia
85
kekosongan jabatan pada tingkat Eselon V, maka rule yang didapat dari algoritma CRUISE untuk Eselon V yaitu: Node 1: masakerja > 12.2917 Node 3 : jenjab = Struktural Node 6: Terminal Node, predicted class = V Class label : V non eselon Class size : 73 8 Rule tersebut akan diimplementasikan ke dalam bahasa SQL untuk mendapatkan calon kandidiat untuk mengisi kekosongan tersebut, dengan menuliskan script PHP berikut: 12.2917 order by ‘masa kerja’ desc”) while($q=mysql_fetch_array($q) print_r($q); ?> Penjelasan script PHP di atas adalah sebagai berikut:
Fungsi include(“koneksi.php”), digunakan untuk konfigurasi koneksi basis data.
Statement $q=mysql_query(“ “), digunakan untuk menulis script SQL yang akan dieksekusi.
Script SQL select nama, datediff(year, tmt, curdate()) as ‘masa kerja’ from pegawai, berfungsi mengambil kolom nama dan menghitung selisih antara tanggal hari ini dengan kolom tmt pada SK CPNS (id_kategori=6) dengan menyimpan sebagai kolom ‘masa kerja’.
Bagian inner join sk on sk.id_pegawai = pegawai.id_pegawai where id_kategori_sk=6, digunakan untuk menghubungkan table pegawai dengan table sk dan hanya mengambil SK CPNS saja (id_kategori=6).
Bagian and pangkat_gol=III/a or pangkat_gol=III/b, berfungsi mengambil data pegawai yang memiliki golongan III/a atau III/b saja, yang merupakan syarat golongan untuk eselon V. Universitas Indonesia
86
Bagian and jenjab = ‘struktural’, berfungsi mengambil data pegawai dengan jenjang jabatan structural saja.
Bagian and datediff(year, tmt, curdate()) > 12.2917 berfungsi mengambil masa kerja pegawai di atas 12.2917 tahun.
Bagian order by ‘masa kerja’ desc berfungsi mengurutkan data yang diambil berdasarkan masa kerja yang terbesar hingga masa kerja terbesar.
Pola yang dihasilkan secara rinci dapat dilihat pada Sub Bab 4.2. Rules yang diimplementasikan pada modul baru SIMPEG tentunya akan menambah kemampuan SIMPEG dalam menyusun draft pengisian jabatan struktural secara otomatis. Dengan adanya kemampuan tersebut, Baperjakat tidak perlu lagi menyusun menyusun draft pengisian jabatan struktural secara manual karena sudah dapat disusun dengan menggunakan SIMPEG. 4.5.2 Analisis Dampak Keilmuan Hasil penelitian ini menunjukkan bahwa teknik data mining classification dapat digunakan untuk membantu pengelolaan manajemen sumber daya manusia khususnya dalam lingkungan pemerintahan. Secara umum teknik ini juga dapat dimanfaatkan dalam perusahaan atau organisasi lain dengan penentuan atribut sesuai kebijakan perusahaan atau organisasi tersebut. Dengan demikian penelitian ini dapat dijadikan acuan bagi penelitan-penelitan serupa untuk menggunakan teknik yang sama dalam pengelolaan sumber daya manusia secara umum dan menempatkan sumber daya yang tepat di posisi yang tepat secara khusus.
Universitas Indonesia
BAB 5 KESIMPULAN DAN SARAN
Dari hasil analisis dan pembahasan mengenai pemanfaatan teknik data mining classification untuk pola pengisian jabatan struktural pada Pemerintah Kota Bogor dapat ditarik beberapa kesimpulan dan saran sebagai berikut: 5.1
Kesimpulan
Beberapa kesimpulan yang dapat ditarik dari hasil pada penelitian ini di antaranya yaitu:
Meskipun pada setiap tingkat eselon menghasilkan pola pengisian jabatan struktural yang berbeda, beberapa atribut selalu muncul secara dominan di setiap pola prediksi dan tingkat eselon. Urutan atribut yang terbentuk sebagai berikut: jenjang jabatan, pangkat golongan, pendidikan dan pelatihan, tingkat pendidikan, masa kerja, pengalaman dalam unit kerja serta umur. Secara rinci hasil pola pengisian yang terbentuk dapat dilihat pada Sub Bab 4.2.
Pola pengisian jabatan struktural yang terbentuk akan menjadi rule yang diimplementasikan menjadi modul baru dalam SIMPEG. Modul tersebut tentunya akan menambah kemampuan pendukung keputusan berupa draft pengisian jabatan struktural. Hal ini dapat menjawab permasalahan seperti yang dijelaskan pada Gambar 1.1.
Setiap data set tingkat eselon menghasilkan algoritma terbaik yang berbeda dan tingkat akurasi class eselon yang berbeda pula, sebagaimana dibahas pada Sub Bab 4.3. Algoritma CRUISE secara umum menghasilkan rata-rata akurasi yang paling baik dengan tingkat akurasi sebesar 95,7%, disusul oleh algoritma Bayes NET dengan akurasi 89,57%.
87
Universitas Indonesia
88
5.2
Saran
Beberapa saran yang dapat dijadikan masukan untuk penelitan serupa di masa yang akan datang di antaranya yaitu: Sejalan dengan berjalannya waktu, akan muncul algoritma baru dari teknik data mining classification. Algoritma baru tersebut dapat diimplementasikan pada berbagai data mining tools. Hal ini tentunya patut untuk dicoba untuk meningkatkan akurasi prediksi test set dari model prediksi train set. Perlu dikembangan sebuah web service yang dapat menjembatani data mining tool Weka yang berbasis JAVA dengan SIMPEG yang berbasis PHP. Web service tersebut dapat dikembangan dengan menggunakan bahasa XML dengan memanfaatkan API berbasis JAVA pada data mining tool Weka, sehingga keduanya
dapat
saling
berkomunikasi.
Web
service
tersebut
dapat
dimanfaatkan untuk memudahkan proses input data dari SIMPEG ke Weka dan output prediksi dari Weka ke SIMPEG secara otomatis. Diharapkan penelitian selanjutnya dapat menggunakan jumlah train set yang lebih banyak untuk menghasilkan model prediktif yang lebih baik. Hal tersebut mengingat penelitian ini hanya menggunakan data kepegawaian dari tahun 2009 hingga 2013 untuk memprediksi jabatan struktural di tahun 2014. Classifier yang digunakan dalam penelitian ini adalah untuk tingkat eselon, tidak secara spesifik untuk jabatan struktral tertentu dalam unit kerja. Hal ini mengingat jumlah train set untuk setiap jabatan struktural yang terlalu sedikit. Diharapkan penelitian selanjutnya dapat menggunakan atribut classifier yang lebih spesifik pada setiap jabatan struktural yang ada.
Universitas Indonesia
89
DAFTAR PUSTAKA
Farisi, Afif. (2009). Pembandingan tingkat akurasi dua model data mining yang dihasilkan oleh decision tree dan naïve bayes studi kasus: suatu perusahaan manufaktur dan penjualan sepeda. Jakarta: MTI Universitas Indonesia. Han, J., Kamber, M., (2006). Data mining concepts and techniques. San Francisco: Morgan Kaufmann Publishers. Jantan, H., Hamdan, A.R., Othman, Z.A. (2011). Data mining classification Techniques for human talent forecasting. Selangor, Malaysia: Faculty of Computer and Mathematical Sciences UTM, Terengganu and Faculty of Information Science and Technology UKM. Kementrian Sekretariat Negara Republik Indonesia. (2000). Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural. Jakarta: Kementrian Sekretariat Negara Republik Indonesia Kementrian Sekretariat Negara Republik Indonesia. (2002). Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2002 tentang Perubahan atas Peraturan Pemerintah Republik Indonesia Nomor 100 Tahun 2000 tentang Pengangkatan PNS dalam Jabatan Struktural. Jakarta: Kementrian Sekretariat Negara Republik Indonesia. Pehlivanli., Ayca, C. (2011). The comparison of data mining tool. Istanbul, Turki: Department of Computer Engineering İstanbul Kültür University. Turban, E., Aronson, J.E., Liang ,T. (2005). Decission support systems and intelligent systems. New Jersey: Pearson Education, Inc. Yashoda, E. Prakash, P.S. (2012). Data mining classifcation technique for talent management using SVM. Salem, Tamilnadu: Department of Computer science and Engineering, Sona College of Technology Ye, Peng. (2011). The Decision tree Classifcation And Its Application Research In Personnel Management. Huanggang, China: Huanggang Normal University .
Universitas Indonesia
90
Lampiran 1 Lampiran Transkrip Wawancara Transkrip Wawancara Kepala Bidang Mutasi dan Pengembangan Karir Pegawai selaku Sekretaris Badan pertimbangan Jabatan dan Kepangkatan (Baperjakat). Unit Kerja
: Badan Kepegawaian Pendidikan dan Pelatihan
Jabatan
: Kepala Bidang Mutasi dan Pengembangan Karir Pegawai
Tanggal
: 19 Desember 2013
Tempat
: Ruang Bidang Mutasi dan Pengembangan Karir Pegawai BKPP, Gedung Sekretarian Daerah Kota Bogor Lantai 2, Pemerintah Kota Bogor
TWR
: Tosan Wiar Ramdhani
NS
: Nara Sumber
1. TWR : Bisa ibu ceritakan isu-su terkait dalam pengisian jabatan struktural di lingkungan Pemerintah Kota Bogor? NS
: Wah cukup banyak di antaranya: belum tersusunya pola karir
untuk jabatan struktural dimana pada level kementrian hal ini sudah tersusun dengan baik. Tim Baperjakat juga merasa kesulitan dalam menulusuri data calon pejabat struktural yang diusulkan mengingat data jabatan struktural pada basis data SIMPEG hanya mencatat mulai tahun 2009, dan kita tetap harus menulusuri data tersebut secara manual satu per satu dengan menggunakan aplikasi SIMPEG. 2. TWR : Menurut ibu saat ini SIMPEG belum cukup membantu? NS
: Dari sisi data mungkin sudah tersedia meskipun tidak cukup
lengkap, karena kita tentunya ingin melihat riwayat jabatan seseorang sebelum 2009. Oleh karena itu saya sempat menghimbau untuk menyebarkan formulir kepada seluruh pejabat struktural untuk mengisi data riwayat jabatan dengan lengkap agar dapat dimasukkan ke dalam basis data SIMPEG. Selain dari pada itu akan sangat membantu tim Baperjakat jika SIMPEG mampu mengusulkan nama-nama calon pejabat struktural jika terjadi mutasi jabatan struktural. Universitas Indonesia
91
(Lanjutan Lampiran 1) 3. TWR : Itu bisa saja dibuat bu, hanya bagaimana dengan regulasi yang ada, apakah sudah cukup jelas teknis pelaksanaanya? NS
: Itu satu kendala lain, Peraturaturan Pemerintah No 2 Tahun
2000 yang kemudian diperbarui dengan Peraturaturan Pemerintah No 13 Tahun 2002 tidak secara spesifik mengatur mana komponen kepegawaian yang menjadi prioritas dalam mengisi suatu jabatan struktural. Syarat minimalnya hanya pangkat golongan dan untuk komponen lainnya seperti masa kerja pegawai, pendidikan dan pelatihan pegawai serta pengalaman dalam unit kerja tidak jelas pembobotannya. Jadi bagaimana pak, apakah bapak bisa membuat SIMPEG memiliki kemampuan untuk memberikan usulan dafttar jabatan secara otomatis? 4. TWR : Seperti yang saya jelaskan sebelumnya bu, hal itu bisa saja dilakukan, tapi harus jelas terlebih dahulu regulasinya. Dikarenakan tidak ada pembobotan spesifik terhadap komponen penilaian pegawai yang ibu jelaskan tadi, maka perlu dipelajari pola pengisian jabatan struktural sebelumnya dari basis data SIMPEG. Jika ibu tidak keberatan maka masalah ini yang akan saya angkat menjadi penelitian untuk karya akhir dalam masa tugas belajar saya. NS
: Silakan pak , saya sangat mendukung selama itu nantinya akan
memudahkan tugas Baperjakat dan saya juga akan bicarakan dengan anggota Baperjakat lainnya. 5. TWR : Baik bu, apakah saya nanti diperkenankan melakukan presentasi di depan tim Baperjakat? NS
: Silahkan saja, tapi menurut saya karena Baperjakat jarang sekali
mengadakan pertemuan kecuali jika ada mutasi jabatan struktural, saya sarankan bapak melakukan presentasi kepada 3 dari total 7 anggota Baperjakat yang ada di BKPP saja termasuk saya. 6. TWR : Baik bu, terima kasih banyak atas waktu dan kesempatan yang diberikan.
Universitas Indonesia
92
Lampiran 2 Hasil Akurasi Classification untuk Setiap Tingkat Eselon Tabel Hasil Classification untuk Eselon V Algoritma
K-Star AD tree LAD tree Random tree Bayes NET hyper pipes VFI C5,0 End J-48 J-48 graft NB Tree Random Forrest SMO Ridor CRUISE DTNB Decision table Threshold selector Ordinal class classifier Dagging Conjuctive rule Decision stump
Pola prediksi
Data mining tool
Akurasi Train set
Akurasi Akurasi Akurasi Test set Eselon Non V eselon
Tidak Ada Ada Ada Ada Ada Tidak Ada Tidak Ada Ada Tidak Ada Ada Ada Ada Ada
Weka
99,89%
95,3%
100%
95,21%
Weka Weka Weka Weka Weka
100% 99,89% 100% 98,93% 99,14%
94,8% 94,8% 94,8% 94,7% 94,7%
100% 100% 100% 100% 100%
94,71% 94,71% 94,71% 94,61% 94,61%
Weka
99,14%
94,7%
100%
94,61%
R Weka
99,8% 99,78%
94,6% 94,6%
100% 100%
94,51% 94,51%
Weka Weka Weka Weka
99,78% 99,78% 100% 100%
94,6% 94,6% 94,5% 94,5%
100% 100% 100% 100%
94,51% 94,51% 94,4% 94,4%
Ada Ada Ada Tidak Ada Tidak Ada Ada
Weka Weka CRUISE Weka
98,83% 100% 99,15% 99,14%
94,4% 94,3% 94,21% 94,2%
100% 100% 100% 100%
94,3% 94,2% 94,1% 94,1%
Weka
99,57%
94,06%
100%
93,9%
Weka
99,14%
93,9%
100%
93,79%
Tidak Ada Tidak Ada Ada
Weka
98,72%
93,2%
100%
93,08%
Weka
98,61%
92,8%
100%
92,68%
Weka
98,4%
92,6%
100%
92,47%
Tidak Ada
Weka
98,46%
92,6%
100%
92,47%
Universitas Indonesia
93
(Lanjutan Lampiran 2) Algoritma
LWL One R Clsasification via clustering Simple logistic Spegasos Ada boost m1 Attribut selected classifier BF tree Multiboost AB REP Tree Simple cart Part Jrip Decorate Filtered classifier Logit boost Bagging Classification via regression LMT Naïve Bayes Naïve Bayes Updateable Nnge Logisitc Multi layer perceptron Multiclass classifier
Data mining tool Weka
Akurasi Train set 98,4%
Akurasi Akurasi Akurasi Test set Eselon Non V eselon 92,6% 100% 92,47%
Weka Weka
98,4% 96,08%
92,6% 91,5%
100% 100%
92,47% 91,35%
Ada
Weka
99,36%
94,2%
94,44%
98,72%
Ada Ada Ada
Weka Weka Weka
99,46% 99,46%
95,4% 95%
94,44% 94,44%
95,42% 95,02%
99,46% 99,46%
95% 95%
94,44% 94,44%
95,02% 95,02%
99,46% 99,46% 99,46%
95% 95% 95%
94,44% 94,44% 94,44%
95,02% 95,02% 95,02%
94,9% 94,8% 94,7% 94,7%
94,44% 94,44% 94,44% 94,44%
94,91% 94,81% 94,71% 94,71%
Pola prediksi Tidak Ada Ada Ada
Ada Ada
Weka Weka
Ada Ada Tidak Ada Ada Ada Ada
Weka Weka Weka Weka Weka Weka
99,78% 99,78% 99,78% 99,68%
Ada Ada Ada
Weka Weka Weka
99,68% 99,46% 99,68%
94,7% 94,6% 94,4%
94,44% 94,44% 94,44%
94,71% 94,61% 94,4%
Ada Ada Ada
Weka Weka Weka
99,36% 97,44% 97,44%
94,2% 92,2% 92,2%
94,44% 94,44% 94,44%
94,2% 92,17% 92,17%
Ada Ada Tidak Ada Tidak Ada
Weka Weka Weka
100.00% 99,46%
96,5% 96,4%
88,89% 88,89%
96,64% 96,54%
100.00% 99,46%
96,4% 96,4%
88,89% 88,89%
96,54% 96,54%
Weka
Universitas Indonesia
94
(Lanjutan Lampiran 2) Algoritma
IB1 FT tree IBK Voted perceptron RBF Network CBA CV parameter selection Grading Multischeme Raced incremental logit boost Stacking Stacking C Vote Zero R
Pola prediksi Tidak Ada Ada Tidak Ada Tidak Ada Tidak Ada Ada Tidak Ada Tidak Ada Tidak Ada Ada
Tidak Ada Ada Tidak Ada Tidak Ada
Data mining tool Weka
Akurasi Train set
Akurasi Akurasi Akurasi Test set Eselon Non V eselon
100.00% 99,68%
95,9% 95,4%
88,89% 88,89%
96,03% 95,52%
Weka
100.00% 96,17%
95,9% 94,8%
88,89% 66,67%
95,22% 95,32%
Weka
93,94%
94,3%
16,67%
95,73%
Weka Weka
92,24%
98,2%
0%
100%
92,24%
98,2%
0%
100%
92,24%
98,2%
0%
100%
92,24%
98,2%
0%
100%
92,24%
98,2%
0%
100%
92,24% 92,24%
98,2% 98,2%
0% 0%
100% 100%
92,24%
98,2%
0%
100%
92,24%
98,2%
0%
100%
Weka Weka
Weka Weka Weka
Weka Weka Weka Weka
Universitas Indonesia
95
(Lanjutan Lampiran 2) Tabel Hasil Classification untuk Eselon IVB Pola prediksi
Data mining tool
Akurasi Train set
Akurasi Test set
Tidak Ada
Weka
81,59%
73,08%
100%
68,2%
Ada
Weka
80,96%
72,61%
100%
67,65%
Ada
Weka
80,96%
72,61%
100%
67,65%
Tidak Ada
Weka
81,06%
72,53%
99,17%
67,7%
VFI
Tidak Ada
Weka
83,67%
81,54%
92,56%
79,55%
Dagging
Tidak Ada
Weka
85,31%
85,18%
90,91%
84,15%
SMO Logisitc Multiclass classifier
Ada Ada Tidak Ada
Weka Weka Weka
85,37% 85,84% 85,84%
85,14% 85,31% 85,31%
90,36% 89,81% 89,81%
84,2% 84,5% 84,5%
Simple logistic Threshold selector Jrip FT tree LAD tree Logit boost Attribut selected classifier DTNB
Ada
Weka
85,84%
85,06%
89,81%
84,2%
Ada
Weka
86,71%
87.00%
88,98%
86,65%
Ada Ada Ada Ada Ada
Weka Weka Weka Weka Weka
91,36% 93,17% 89,82% 88,99% 90,79%
83,15% 80,7% 83,7% 82,6% 83,28%
88,98% 88,15% 86,5% 86,5% 86,23%
82,1% 79,35% 83,2% 81,9% 82,75%
Tidak Ada
Weka
89,86%
80,53%
86,23%
79,5%
Ada Ada Ada Ada Ada
Weka Weka R Weka Weka
99,83% 88,42% 93% 95,04% 91,23%
84,63% 84,51% 88,02% 81,63% 83,28%
85,4% 85,4% 85,12% 85,12% 84,85%
84,5% 84,35% 83,15% 81.00% 83.00%
Algoritma
LWL Conjuctive rule Decision stump hyper pipes
Nnge Bayes NET C5,0 BF tree Filtered classifier
Akurasi Akurasi Eselon Non IVB eselon
Universitas Indonesia
96
(Lanjutan Lampiran 2) Akurasi Train set 94,11% 93,94% 91,87%
Akurasi Test set
Ada Ada Ada
Data mining tool Weka Weka Weka
82,22% 81,71% 80,7%
Akurasi Akurasi Eselon Non IVB eselon 84,57% 81,8% 84,3% 81,25% 84,02% 80,1%
Ada
Weka
89,96%
80,44%
84,02%
79,8%
Ada
Weka
99,53%
82,86%
83,47%
82,75%
CRUISE 92,17%
80,36%
83,3%
90,08%
Algoritma
Pola prediksi
Decorate Simple cart Classification via regression Decision table Random Forrest
Ada CRUISE Multi layer perceptron AD tree Ada boost m1 Part REP Tree Bagging K-Star LMT IB1 IBK NB Tree Random tree One R Ordinal class classifier Clsasification via clustering End Naïve Bayes
Tidak Ada
Weka
90,23%
87,3%
83,2%
88,05%
Ada Ada aidak Ada
Weka Weka Weka
88,79% 86,21% 93.00%
85,95% 85,61% 82,52%
83,2% 83,2% 82,92%
86,45% 86,05% 82,45%
Ada Ada Tidak Ada
Weka Weka Weka
93,24% 93,81% 95,08%
82,43% 82,39% 83,15%
82,92% 82,69% 82,37%
82,35% 82,8% 83,3%
Ada Tidak Ada
Weka Weka
94,24% 99,83%
81,5% 84,63%
82,37% 82,09%
81,35% 85,1%
Tidak Ada
Weka
99,83%
84,63%
82,09%
85,1%
Ada Ada Ada Tidak Ada
Weka Weka Weka Weka
92,77% 99,83% 86,24% 90,49%
83,19% 83,96% 63,35% 81,71%
81,54% 81,27% 80,99% 80,72%
83,5% 84,45% 60,15% 81,9%
Ada
Weka
79,72%
78,84%
80,44%
78,55%
Tidak Ada
Weka
93,57%
80,95%
80,17%
81,1%
Ada
Weka
82,73%
87,55%
79,89%
88,95%
Universitas Indonesia
97
(Lanjutan Lampiran 2) Data mining tool Weka
Akurasi Train set 82,73%
Akurasi Test set 87,55%
Akurasi Akurasi Eselon Non IVB eselon 79,89% 88,95%
Ada Ada Ada Tidak Ada
Weka Weka Weka Weka
91,2% 93,57% 93,57% 81,79%
83,74% 80,7% 80,7% 79,13%
79,89% 79,89% 79,89% 74,38%
84,45% 80,85% 80,85% 80.00%
Ada
Weka
84,57%
83,79%
73,28%
85,7%
Ada
Weka
85,64%
84.00%
72,73%
86,15%
Tidak Ada
Weka
70,45%
80,74%
63,91%
83,8%
Ada Ada Tidak Ada
Weka Weka Weka
70,59% 63,32% 63,33%
86,33% 84,63% 84,63%
12,12% 0% 0%
99,8% 100% 100%
Weka
63,33%
84,63%
0%
100%
Grading
Tidak Ada
Weka
63,33%
84,63%
0%
100%
Multischeme
Tidak Ada Tidak Ada
Weka
63,33%
84,63%
0%
100%
Weka Weka
63,33% 63,33%
84,63% 84,63%
0% 0%
100% 100%
Vote
Ada Tidak Ada
Weka
63,3%
84,63%
0%
100%
Zero R
Tidak Ada
Algoritma
Naïve Bayes Updateable Ridor J-48 J-48 graft Voted perceptron Multiboost AB Raced incremental logit boost RBF Network Spegasos CBA CV parameter selection
Stacking Stacking C
Pola prediksi Ada
Universitas Indonesia
98
(Lanjutan Lampiran 2) Tabel Hasil Classification untuk Eselon IVA Algoritma
hyper pipes
Pola prediksi
Data mining tool
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IVA eselon
Tidak Ada
Weka
67,74% 70,39% 98,83% 65,61%
Ada CRUISE Threshold selector Decorate End J-48 J-48 graft VFI Jrip Ridor Ada boost m1 Attribut selected classifier Dagging Decision table Multiboost AB Ordinal class classifier Raced incremental logit boost SMO LMT LAD tree
CRUISE 92,17% 80,36% 94,47% 84,09%
Ada
Weka
89,09% 89,52% 93,31% 90,13%
Ada Tidak Ada
Weka Weka
91,94% 88,04% 91,79% 87,42% 91,94% 88,05% 91,79% 87,42%
Ada Ada Tidak Ada
Weka Weka Weka
91,94% 88,05% 91,79% 87,42% 91,94% 88,05% 91,5% 87,42% 86,09% 85,05% 91,5% 83,97%
Ada Tidak Ada
Weka Weka
90,62% 89,23% 88,86% 89,29% 90,62% 86,82% 88,56% 86,53%
Ada Ada
Weka Weka
89,02% 86,99% 87,68% 86,88% 89,04% 86,99% 87,68% 86,88%
Tidak Ada
Weka
89,02% 86,99% 87,68% 86,88%
Ada
Weka
89,04% 86,99% 87,68% 86,88%
Ada
Weka
89,02% 86,99% 87,68% 86,88%
Tidak Ada
Weka
89,04% 86,99% 87,68% 86,88%
Ada
Weka
89,02% 86,99% 87,68% 86,88%
Ada Ada Ada
Weka Weka Weka
89,04% 86,99% 87,68% 86,88% 91,58% 89,23% 87,39% 89,54% 89,56% 89,4% 87,1% 89,79%
Universitas Indonesia
99
(Lanjutan Lampiran 2) Algoritma
DTNB Bayes NET Logit boost Bagging Simple logistic Logisitc Multiclass classifier NB Tree FT tree Part Conjuctive rule One R RBF Network Simple cart Clsasification via clustering K-Star LWL Filtered classifier Naïve Bayes Naïve Bayes Updateable Random Forrest Multi layer perceptron
Pola prediksi Tidak Ada
Data mining tool Weka
Ada Ada Tidak Ada
Weka Weka Weka
Ada
Weka
Ada aidak Ada
Weka Weka
Ada Ada Tidak Ada
Weka Weka Weka
Ada
Weka
Tidak Ada
Weka
Tidak Ada
Weka
Ada Ada
Weka Weka
Tidak Ada
Weka
Tidak Ada
Weka
Ada
Weka
Ada Ada
Weka Weka
Ada Tidak Ada
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IVA eselon 89,63% 86,99% 86,8% 87,03% 86,7% 88,42% 89,21% 89,56%
86,22% 85,92%
88,8% 90,18%
93,18% 89,4%
85,34%
90,08%
89,41% 89,86% 89,11% 89,99%
84,75% 84,16%
90,73% 90,97%
89,11% 89,99% 91,06% 91,17% 91,23% 89,56%
84,16% 83,87% 82,09%
90,97% 92,4% 89,94%
91,3%
80,94%
91,51%
77,99% 89,9%
80,94%
91,42%
77,99%
89%
80,94%
91,42%
77,86% 89,9% 94,23% 89,35%
80,94% 79,77%
91,42% 90,97%
78,28% 85,26%
79,77%
86,19%
95,64% 92,01%
79,47%
94,13%
86,23% 87,58%
79,47%
94,13%
89,93% 88,89% 83,35% 90,92%
79,47% 79,18%
90,48% 92,9%
83,35% 90,92%
79,18%
92,9%
99,7%
88,76%
78,89%
90,43%
89,83% 91,34%
78,59%
93,49%
89,99%
Weka Weka
Universitas Indonesia
100
(Lanjutan Lampiran 2)
BF tree
Ada
Data mining tool Weka
Classification via regression REP Tree Random tree C5,0 AD tree
Ada
Weka
89,83% 89,56% 78,01% 91,51%
Ada Ada Ada Ada Tidak Ada
Weka Weka R Weka Weka
91,6% 99,92% 93% 90,15% 99,92%
Tidak Ada
Weka
99,92% 89,14% 74,78% 91,56%
Ada Tidak Ada
Weka Weka
99,92% 89,4% 73,9% 92,01% 73,83% 86,31% 18,48% 97,73%
Ada Ada Tidak Ada
Weka Weka Weka
75,13% 85,97% 63,32% 84,63% 68,68% 85,59%
3,23% 0% 0%
99,9% 100% 100%
Decision stump
Tidak Ada
Weka
68,68% 85,59%
0%
100%
Weka
68,68% 85,59%
0%
100%
Grading
Tidak Ada
Weka
68,68% 85,59%
0%
100%
Multischeme
Tidak Ada Tidak Ada
Weka
68,68% 85,59%
0%
100%
Weka Weka
68,68% 85,59% 68,68% 85,59%
0% 0%
100% 100%
Vote
Ada Tidak Ada
Weka
68,68% 85,59%
0%
100%
Zero R
Tidak Ada
Algoritma
IB1 IBK Nnge Voted perceptron Spegasos CBA CV parameter selection
Stacking Stacking C
Pola prediksi
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IVA eselon 93,18% 89,65% 78,3% 91,56%
91,08% 88,85% 88,02% 90,7% 89,41%
77,71% 76,83% 76,65% 75,37% 74,78%
93,34% 90,87% 93,88% 93,29% 91,56%
Universitas Indonesia
101
(Lanjutan Lampiran 2) Tabel Hasil Classification untuk Eselon IIIB Algoritma
CRUISE hyper pipes VFI Bayes NET Threshold selector Random Forrest Simple cart Random tree IB1 IBK REP Tree Naïve Bayes Naïve Bayes Updateable Dagging Attribut selected classifier One R AD tree SMO Decorate Classification via regression LMT LAD tree
Pola prediksi Ada Tidak Ada Tidak Ada Ada Ada
Data mining tool
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IIIB eselon
CRUISE 90,19% 92,92% 98,41% 92,84% Weka
78,74% 91,04% 96,83% 90,96%
Weka
89,91% 93,98% 88,89% 94,06%
Weka Weka
93,9% 96,04% 76,19% 96,35% 96,12% 98,34% 65,08% 98,85%
Ada
Weka
99,94% 98,62%
Ada Ada Tidak Ada Tidak Ada ada Ada Ada
Weka Weka Weka
96,73% 98,88% 58,73% 99,5% 99,98% 98,43% 57,14% 99,06% 99,98% 98,36% 57,14% 98,99%
Weka
99,98% 98,36% 57,14% 98,99%
Weka Weka Weka
97,2% 99,07% 55,56% 99,74% 91,92% 97,75% 55,56% 98,39% 91,92% 97,75% 55,56% 98,39%
Tidak Ada Ada
Weka
96,25% 98,93% 53,97% 99,62%
Weka
95,54% 98,81% 53,97%
99,5%
99,5%
61,9%
99,18%
Tidak Ada Ada Ada Ada Ada
Weka
99,54% 98,81% 53,97%
Weka Weka Weka Weka
96,71% 96,4% 97,74% 96,64%
Ada Ada
Weka Weka
96,88% 98,88% 50,79% 99,62% 96,55% 98,86% 50,79% 99,59%
98,91% 98,91% 98,88% 98,79%
52,38% 99,62% 52,38% 99,62% 52,38% 99,59% 52,38% 99,5%
Universitas Indonesia
102
(Lanjutan Lampiran 2) Data mining tool Weka
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IIIB eselon 97,14% 98,79% 49,21% 99,54%
Tidak Ada Ada ada
Weka
96,53% 98,46% 47,62% 99,23%
R Weka
96,9% 99,92% 46,03% 99,87% 96,34% 98,93% 46,03% 99,74%
Tidak Ada Tidak Ada Ada Tidak Ada Ada Ada Tidak Ada Ada
Weka
97,61% 98,93% 46,03% 99,74%
Weka
96,23% 98,83% 46,03% 99,64%
Weka Weka
97,5% 97,5%
Weka Weka Weka
97,5% 98,86% 41,27% 99,74% 96,32% 98,69% 41,27% 99,57% 96,32% 98,69% 41,27% 99,57%
Weka
96,3%
Ada Ada Tidak Ada ada Ada Tidak Ada Ada Tidak Ada Ada
Weka Weka Weka
99,98% 98,41% 41,27% 99,28% 97,2% 98,83% 39,68% 99,74% 97,55% 98,98% 38,1% 99,9%
Weka Weka Weka
97,07% 98,95% 38,1% 99,88% 97,14% 98,93% 36,51% 99,88% 98,99% 98,86% 33,33% 99,86%
Weka Weka
97,14% 98,36% 31,15% 96,42% 98,81% 26,98%
99,4% 99,9%
Weka
95,74% 98,29%
99,4%
Ada Ada
Weka Weka
96,32% 98,38% 22,22% 99,54% 65,24% 70,4% 21,15% 71,2%
Ada Ada
Weka Weka
96,15% 98,62% 95,26% 98,5%
Algoritma
Pola prediksi
Multi layer perceptron Ridor
Ada
C5,0 Decision table Part DTNB J-48 graft End J-48 Logisitc Multiclass classifier Simple logistic Nnge BF tree Bagging NB Tree FT tree K-Star Jrip Filtered classifier Raced incremental logit boost Logit boost Clsasification via clustering Spegasos Ada boost m1
98,91% 41,27% 99,78% 98,86% 41,27% 99,74%
98,69% 41,27% 99,57%
25,4%
7,94% 0%
100% 100%
Universitas Indonesia
103
(Lanjutan Lampiran 2)
CBA
Ada
Data mining tool Weka
Conjuctive rule CV parameter selection Decision stump Grading
Ada
Weka
95,26%
98,5%
0%
100%
Tidak Ada
Weka
95,26%
98,5%
0%
100%
Tidak Ada Tidak Ada Tidak Ada Ada
Weka
95,26%
98,5%
0%
100%
Weka
95,26%
98,5%
0%
100%
Weka
95,35%
98,5%
0%
100%
Weka
95,26%
98,5%
0%
100%
Weka
95,26%
98,5%
0%
100%
Weka
95,26%
98,5%
0%
100%
Weka
95,26%
98,5%
0%
100%
Weka
95,26%
98,5%
0%
100%
Weka Weka
95,26% 95,26%
98,5% 98,5%
0% 0%
100% 100%
Weka
95,26%
98,5%
0%
100%
Weka
95,26% 98,48%
0%
99,98%
Algoritma
LWL Multiboost AB Multischeme Ordinal class classifier RBF Network Stacking Stacking C Vote Zero R Voted perceptron
Pola prediksi
Tidak Ada Tidak Ada Tidak Ada Tidak Ada Ada Tidak Ada Tidak Ada Tidak Ada
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IIIB eselon 95,26% 98,5% 0% 100%
Universitas Indonesia
104
(Lanjutan Lampiran 2) Tabel Hasil Classification untuk Eselon IIIA Pola prediksi
Data mining tool
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IIIA eselon
hyper pipes
Tidak Ada
Weka
82,31%
CRUISE VFI
Ada Tidak Ada
Algoritma
Threshold selector REP Tree FT tree Decorate Random Forrest BF tree Classification via regression Random tree Bayes NET C5,0 Jrip Filtered classifier Naïve Bayes Naïve Bayes Updateable Bagging
90,3%
95,83% 90,24%
CRUISE 90,98% 95,83% 93,75% 95,86% Weka 87,12% 92,69% 87,5% 92,76%
Ada
Weka
97,07% 98,48% 83,33% 98,68%
Ada Ada Ada Ada Ada Ada
Weka Weka Weka Weka Weka Weka
97,86% 97,7% 98,16% 99,93% 98,63% 97,32%
98,64% 98,56% 98,48% 98,8% 98,61% 98,45%
81,25% 81,25% 81,25% 79,17% 79,17% 79,17%
98,88% 98,79% 98,71% 99,07% 98,88% 98,71%
Ada Ada Ada Ada Ada
Weka Weka R Weka Weka
100% 93,94% 97,8% 97,52% 96,96%
97,61% 97,29% 99,07% 98,78% 98,53%
79,17% 79,17% 77,83% 77,08% 77,08%
97,86% 97,53% 98,67% 99,07% 98,82%
Ada Ada
Weka Weka
93,58% 97,21% 77,08% 97,48% 93,58% 97,21% 77,08% 97,48%
Tidak Ada Ada Ada Ada Tidak Ada
Weka
98,14% 98,78% 75.00% 99,09%
Weka Weka Weka Weka
97,36% 96,96% 96,98% 96,96%
Ridor
Tidak Ada
Weka
97,41% 98,21% 75.00% 98,52%
Multiclass classifier
Tidak Ada
Weka
96,91% 98,61% 73,91% 98,99%
LMT Decision table Simple logistic DTNB
98,72% 98,56% 98,56% 98,26%
75.00% 75.00% 75.00% 75.00%
99,04% 98,88% 98,88% 98,57%
Universitas Indonesia
105
(Lanjutan Lampiran 2) Algoritma
Pola prediksi
LAD tree Logisitc Simple cart NB Tree End
Ada Ada Ada Ada Tidak Ada Ada Tidak Ada
J-48 IB1
Data mining tool Weka Weka Weka Weka Weka
Akurasi Train set 97,43 98,25% 98,25% 97,18% 98,04%
Weka Weka
98,04% 98,7% 66,67% 99,12% 100% 98,67% 66,67% 99,09%
Akurasi Akurasi Test set Eselon IIIA 99,05 68,75% 98,97% 68,75% 98,97% 68,75% 98,75% 66,67% 98,7% 66,67%
Akurasi Non eselon 99,45% 99,37% 99,37% 99,18% 99,12%
IBK
Tidak Ada
Weka
AD tree Ada boost m1 Dagging
Ada Ada Tidak Ada
Weka Weka Weka
97,16% 98,61% 66,67% 99,04% 96,84% 98,48% 66,67% 98,9% 96,91% 98,48% 66,67% 98,9%
SMO Attribut selected classifier
Ada Tidak Ada
Weka Weka
96,91% 98,48% 66,67% 98,9% 95,89% 98,02% 66,67% 98,44%
One R
Tidak Ada
Weka
95,89% 98,02% 66,67% 98,44%
Ada
Weka
97,52% 98,83% 64,58% 99,29%
Tidak Ada
Weka
97,89% 98,63% 60,42% 99,37%
Ada Ada Ada Ada
Weka Weka Weka Weka
98,04% 100% 96,82% 96,23%
Tidak Ada
Weka
99,56% 99,02% 52,08% 99,64%
Tidak Ada
Weka
96,73% 98,78% 47,92% 99,45%
Ada
Weka
96,25% 99,13% 45,83% 99,84%
Multi layer perceptron Part J-48 graft Nnge Logit boost Raced incremental logit boost K-Star LWL Spegasos
100%
98,67% 66,67% 99,09%
98,46% 98,53% 98,86% 99,16%
60,42% 60,42% 56,52% 54,17%
99,15% 99,04% 99,45% 99,75%
Universitas Indonesia
106
(Lanjutan Lampiran 2) Algoritma
Pola prediksi
Data mining tool Weka
Akurasi Akurasi Akurasi Akurasi Train Test set Eselon Non set IIIA eselon 62,92% 72,76% 14,58% 73,53%
Clsasification via clustering Ordinal class classifier
Tidak Ada
Weka
95,87%
98,7%
8,33%
99,89%
CBA Conjuctive rule CV parameter selection
Ada Ada Tidak Ada
Weka Weka Weka
95,6% 95,6% 95,6%
98,7% 98,7% 98,7%
0% 0% 0%
100% 100% 100%
Decision stump
Tidak Ada
Weka
95,6%
98,7%
0%
100%
Grading
Tidak Ada
Weka
95,6%
98,7%
0%
100%
Multiboost AB multischeme
Ada Tidak Ada
Weka Weka
95,6% 95,6%
98,7% 98,7%
0% 0%
100% 100%
RBF Network
Tidak Ada Tidak Ada Ada Tidak Ada Tidak Ada
Weka
95,6%
98,7%
0%
100%
Weka
95,6%
98,7%
0%
100%
Weka Weka
95,6% 95,6%
98,7% 98,7%
0% 0%
100% 100%
Weka
95,55% 98,64%
0%
100%
Tidak Ada
Weka
95,6%
0%
100%
Stacking Stacking C Vote Voted perceptron Zero R
Ada
98,7%
Universitas Indonesia
107
(Lanjutan Lampiran 2) Tabel Hasil Classification untuk Eselon IIB Pola prediksi
Data mining tool
Akurasi Akurasi Akurasi Train Test set Eselon set IIB
Akurasi Non eselon
Bayes NET VFI
Ada Tidak ada
Weka Weka
96,3% 98,52% 89,53% 95,99%
100% 100%
98,51% 95,96%
hyper pipes
Tidak ada
Weka
85,71% 94,32%
100%
94,27%
CRUISE 83,94% 88,71%
100%
88,6%
Algoritma
CRUISE
Ada
Random Forrest Naïve Bayes Naïve Bayes Updateable Random tree Bagging
Ada
Weka
99,85% 99,63%
93,1%
99,7%
Ada Ada
Weka Weka
96,12% 98,52% 96,12% 98,52%
93,1% 93,1%
98,57% 98,57%
Ada Tidak ada
Weka Weka
100% 99,27% 82,76% 98,59% 99,67% 79,31%
99,44% 99,87%
Ada
Weka
97,87% 99,57% 79,31%
99,77%
Tidak ada
Weka
98,45% 98,81% 79,31%
99,01%
IB1
Tidak ada
Weka
100%
99,17% 75,86%
99,4%
IBK
Tidak ada
Weka
100%
99,17% 75,86%
99,4%
J-48 graft Decorate End
Ada Ada Tidak ada
Weka Weka Weka
98,5% 99,63% 72,41% 98,76% 99,57% 72,41% 98,5% 99,57% 72,41%
99,9% 99,83% 99,83%
Ada Ada Ada Ada Ada Ada
Weka Weka Weka Weka Weka Weka
98,5% 98,25% 97,84% 98,56% 98,45% 98,85%
99,83% 99,77% 99,6% 99,97% 99,8% 99,77%
Threshold selector Ridor
J-48 Logit boost Ada boost m1 LAD tree NB Tree Simple cart
99,57% 99,5% 99,34% 99,67% 99,5% 99,47%
72,41% 72,41% 72,41% 68,97% 68,97% 68,97%
Universitas Indonesia
108
(Lanjutan Lampiran 2)
Ada
Data mining tool Weka
Akurasi Akurasi Akurasi Train Test set Eselon set IIB 98,62% 99,34% 68,97%
Akurasi Non eselon 99,64%
Ada
Weka
85,8%
93,89% 68,97%
94,13%
Ada Tidak ada
Weka Weka
98,48% 99,67% 65,52% 99,74% 99,57% 65,52%
100.00% 99,9%
Ada Ada Ada Ada
Weka Weka Weka Weka
98,13% 98,48% 98,48% 98,65%
62,07% 62,07% 62,07% 62,07%
99,93% 99,93% 99,93% 99,93%
Tidak ada
Weka
98,48% 99,57% 62,07%
99,93%
Ada
Weka
98,48% 99,57% 62,07%
99,93%
Tidak ada
Weka
98,5%
99,54% 62,07%
99,9%
Ada Ada Ada
Weka Weka Weka
100% 99,4% 62,07% 98,39% 99,34% 62,07% 98,16% 99,6% 58,62%
99,77% 99,7% 100%
Ada Ada
Weka Weka
98,16% 99,6% 58,62% 98,36% 99,57% 55,17%
100% 100%
Tidak ada
Weka
98,68% 99,57% 55,17%
100%
FT tree C5,0 Spegasos DTNB
Ada Ada Ada Tidak ada
Weka Weka Weka Weka
98,65% 99,44% 55,17% 98,5% 99,54% 51,72% 98,07% 99,5% 48,28% 98,27% 99,4% 48,28%
99,87% 100% 100% 99,9%
Decision table
Ada
Weka
98,3%
Algoritma
Pola prediksi
REP Tree Clsasification via clustering AD tree K-Star Jrip LMT Logisitc Multi layer perceptron Multiclass classifier Simple logistic Filtered classifier Nnge BF tree Attribute selected classifier SMO Classification via regression Part
99,57% 99,57% 99,57% 99,57%
99,47% 44,83%
100%
Universitas Indonesia
109
(Lanjutan Lampiran 2) Data mining tool Weka
Akurasi Akurasi Akurasi Train Test set Eselon set IIB 97,93% 99,44% 41,38%
Tidak ada
Weka
97,7%
99,44% 41,38%
100%
Tidak ada
Weka
97,7%
99,44% 41,38%
100%
Ada
Weka
97,7%
99,44% 41,38%
100%
Ada Ada
Weka Weka
96,78% 99,04% 10,34% 96,78% 99,04% 0%
99,9% 100%
Tidak ada
Weka
96,78% 99,04%
0%
100%
Tidak ada
Weka
96,78% 99,04%
0%
100%
Grading
Tidak ada
Weka
96,78% 99,04%
0%
100%
LWL
Tidak ada
Weka
96,98% 99,04%
0%
100%
Ada
Weka
96,78% 99,04%
0%
100%
Tidak ada
Weka
96,78% 99,04%
0%
100%
RBF Network
Tidak ada
Weka
96,78% 99,04%
0%
100%
Stacking
Tidak ada Ada Tidak ada
Weka
96,78% 99,04%
0%
100%
Weka Weka
96,78% 99,04% 96,78% 99,04%
0% 0%
100% 100%
Algoritma
Pola prediksi
Dagging
Tidak ada
One R Ordinal class classifier Raced incremental logit boost CBA Conjuctive rule CV parameter selection Decision stump
Multiboost AB multischeme
Stacking C Vote
Akurasi Non eselon 100%
Voted perceptron
Tidak ada
Weka
96,78% 99,04%
0%
100%
Zero R
Tidak ada
Weka
96,78% 99,04%
0%
100%
Universitas Indonesia
110
(Lanjutan Lampiran 2) Tabel Hasil Classification untuk Eselon IIA Algoritma
Pola prediksi
Data mining tool
Akurasi Akurasi Akurasi Train Test set Eselon set IIA
AD tree Ada boost m1 Attribute selected classifier Bagging
Ada Ada Ada
Weka Weka Weka
99,74% 99,74% 99,24%
100% 100% 100%
100% 100% 100%
100% 100% 100%
Tidak Ada
Weka
99,24%
100%
100%
100%
Ada Ada Ada ada Ada
Weka Weka R Weka Weka
99,74% 99,74% 99,7% 99,24% 99,74%
100% 100% 100% 100% 100%
100% 100% 100% 100% 100%
100% 100% 100% 100% 100%
Ada
Weka
99,24%
100%
100%
100%
Ada
CRUISE
0,76%
100%
100%
100%
CV parameter selection Dagging
Tidak Ada
Weka
99,24%
100%
100%
100%
Tidak Ada
Weka
99,24%
100%
100%
100%
Decision stump
Tidak Ada
Weka
99,74%
100%
100%
100%
Decision table Decorate DTNB
Ada
Weka
99,24%
100%
100%
100%
Ada Tidak Ada
Weka Weka
99,49% 99,24%
100% 100%
100% 100%
100% 100%
End
Tidak Ada
Weka
99,24%
100%
100%
100%
Filtered classifier
Tidak Ada
Weka
99,24%
100%
100%
100%
Ada
Weka
99,74%
100%
100%
100%
Bayes NET BF tree C5,0 CBA Classification via regression Conjuctive rule CRUISE
FT tree
Akurasi Non eselon
Universitas Indonesia
111
(Lanjutan Lampiran 2) Algoritma
Pola prediksi
Data mining tool Weka
Akurasi Akurasi Akurasi Train Test set Eselon set IIA 99,24% 100% 100%
Akurasi Non eselon 100%
Grading
Tidak Ada
IB1
Tidak Ada
Weka
99,74%
100%
100%
100%
IBK
Tidak Ada
Weka
99,74%
100%
100%
100%
J-48 J-48 graft Jrip K-Star
Ada Ada Ada Tidak Ada
Weka Weka Weka Weka
99,24% 99,24% 99,24% 99,74%
100% 100% 100% 100%
100% 100% 100% 100%
100% 100% 100% 100%
LAD tree LMT Logit boost LWL
Ada Ada Ada Tidak Ada
Weka Weka Weka Weka
99,74% 99,74% 99,74% 99,74%
100% 100% 100% 100%
100% 100% 100% 100%
100% 100% 100% 100%
Multi layer perceptron Multiboost AB multischeme
Ada
Weka
99,74%
100%
100%
100%
Ada
Weka
99,74%
100%
100%
100%
Tidak Ada
Weka
99,24%
100%
100%
100%
Ada Ada
Weka Weka
99,74% 99,49%
100% 100%
100% 100%
100% 100%
Ada Ada Tidak Ada
Weka Weka Weka
99,74% 99,74% 99,74%
100% 100% 100%
100% 100% 100%
100% 100% 100%
Ordinal class classifier
Tidak Ada
Weka
99,24%
100%
100%
100%
Part
Tidak Ada
Weka
99,24%
100%
100%
100%
Ada
Weka
99,24%
100%
100%
100%
Naïve Bayes Naïve Bayes Updateable NB Tree Nnge One R
Raced incremental logit boost
Universitas Indonesia
112
(Lanjutan Lampiran 2) Data mining tool Weka
Akurasi Akurasi Akurasi Train Test set Eselon set IIA 99,74% 100% 100%
Tidak Ada
Weka
99,24%
100%
100%
100%
Ada Tidak Ada Ada Ada
Weka Weka
99,24% 99,24%
100% 100%
100% 100%
100% 100%
Weka Weka
99,24% 99,74%
100% 100%
100% 100%
100% 100%
Ada Ada Tidak Ada
Weka Weka Weka
99,74% 99,74% 99,24%
100% 100% 100%
100% 100% 100%
100% 100% 100%
Stacking C Vote
Ada Tidak Ada
Weka Weka
99,24% 99,24%
100% 100%
100% 100%
100% 100%
Voted perceptron
Tidak Ada
Weka
99,24%
100%
100%
100%
Zero R
Tidak Ada
Weka
99,24%
100%
100%
100%
hyper pipes
Tidak Ada
Weka
99,74% 99,63%
100%
99,63%
Random tree VFI
Ada Tidak Ada
Weka Weka
99,74% 99,26% 98,22% 99,26%
100% 100%
99,26% 99,26%
Logistic Multiclass classifier Threshold selector Clsasification via clustering
Ada Ada
Weka Weka
99,74% 98,89% 99,74% 98,89%
100% 100%
98,89% 98,89%
Ada
Weka
99,74% 98,52%
100%
98,52%
Ada
Weka
64,55% 78,96%
100%
78,97%
Algoritma
Random Forrest RBF Network REP Tree Ridor Simple cart Simple logistic SMO Spegasos Stacking
Pola prediksi Ada
Akurasi Non eselon 100%
Universitas Indonesia
113
Lampiran 3 Decision Tree Algoritma CRUISE untuk Data Eselon IVB Node 1: masakerja <= 15.7083 Node 2 : jenjab = Struktural Node 4: masakerja <= 7.79167 Node 8: masakerja <= 1.83333 Node 16 : diklatpim = Pim IV Node 32: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 3 0 Node 16 : diklatpim = Pim III belum mengikuti Node 33: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 24 Node 8: masakerja > 1.83333 Node 17: masakerja <= 3.58333 Node 34: umur <= 26.2083 Node 68: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 4 Node 34: umur > 26.2083 Node 69: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 74 18 Node 17: masakerja > 3.58333 Node 35: masakerja <= 4.20833 Node 70 : pangkatgolongan = III/a Node 140: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 10 5 Node 70 : pangkatgolongan = III/b III/c III/d IV/a IV/b Node 141: pengalamanunitkerja <= 2.54167 Node 282: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 7 46 Node 141: pengalamanunitkerja > 2.54167 Node 283: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 2 0 Universitas Indonesia
114
(Lanjutan Lampiran 3) Node 35: masakerja > 4.20833 Node 71 : pangkatgolongan = III/b III/c III/d IV/a IV/b Node 142: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 120 23 Node 71 : pangkatgolongan = III/a Node 143: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 17 52 Node 4: masakerja > 7.79167 Node 9: pengalamanunitkerja <= 0.125000 Node 18 : tingkatpendidikan = D3 S2 Node 36: umur <= 42.3750 Node 72: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 13 5 Node 36: umur > 42.3750 Node 73: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 9 Node 18 : tingkatpendidikan = D1 D2 S1 SD SMA Node 37 : pangkatgolongan = III/d IV/a Node 74: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 2 0 Node 37 : pangkatgolongan = III/a III/b III/c IV/b Node 75 : tingkatpendidikan = S1 Node 150 : pangkatgolongan = III/b Node 300: umur <= 31.1250 Node 600: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 3 0 Node 300: umur > 31.1250 Node 601: masakerja <= 12.7917 Node 1202: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 3 25
Universitas Indonesia
115
(Lanjutan Lampiran 3) Node 601: masakerja > 12.7917 Node 1203: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 14 13 Node 150 : pangkatgolongan = III/a III/c III/d IV/a IV/b Node 301: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 5 70 Node 75 : tingkatpendidikan = D1 D2 D3 S2 SD SMA Node 151: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 2 106 Node 9: pengalamanunitkerja > 0.125000 Node 19: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 17 0 Node 2 : jenjab = Fungsional Node 5: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 1201 Node 1: masakerja > 15.7083 Node 3 : jenjab = Struktural Node 6 : pangkatgolongan = III/b III/c III/d IV/a IV/b Node 12: pengalamanunitkerja <= 4.12500 Node 24 : diklatpim = Pim III Pim IV Node 48: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 141 1 Node 24 : diklatpim = belum mengikuti Node 49: pengalamanunitkerja <= 1.83333 Node 98: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 465 92 Node 49: pengalamanunitkerja > 1.83333 Node 99: pengalamanunitkerja <= 2.20833 Node 198: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 1 15
Universitas Indonesia
116
(Lanjutan Lampiran 3) Node 99: pengalamanunitkerja > 2.20833 Node 199: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 24 5 Node 12: pengalamanunitkerja > 4.12500 Node 25: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 128 0 Node 6 : pangkatgolongan = III/a Node 13: umur <= 50.9167 Node 26: Terminal Node, predicted class = IVB Class label : IVB non eselon Class size : 45 37 Node 13: umur > 50.9167 Node 27: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 19 Node 3 : jenjab = Fungsional Node 7: Terminal Node, predicted class = non eselon Class label : IVB non eselon Class size : 0 123
Universitas Indonesia
117
Lampiran 4 Decision Tree Algoritma Decorate untuk Data Eselon IVA jenjab = Struktural | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
pangkat_golongan = III/c | pengalaman_unitkerja <= 3.58333 | | tingkat_pendidikan = S2: IVA (111.0/17.0) | | tingkat_pendidikan = SMA | | | pengalaman_unitkerja <= 1.25 | | | | masakerja <= 27.0833: IVA (89.0/39.0) | | | | masakerja > 27.0833 | | | | | masakerja <= 28.8333: non eselon (34.0/4.0) | | | | | masakerja > 28.8333 | | | | | | diklat = Pim IV | | | | | | | umur <= 52: non eselon (11.0/2.0) | | | | | | | umur > 52: IVA (9.0/1.0) | | | | | | diklat = belum mengikuti | | | | | | | masakerja <= 30.9167: non eselon (15.0/5.0) | | | | | | | masakerja > 30.9167: IVA (2.0) | | | | | | diklat = Pim III: IVA (2.0) | | | | | | diklat = Pim II: non eselon (0.0) | | | pengalaman_unitkerja > 1.25: non eselon (11.0) | | tingkat_pendidikan = S1: IVA (336.0/103.0) | | tingkat_pendidikan = D3: IVA (26.0/6.0) | | tingkat_pendidikan = D1: IVA (3.0/1.0) | | tingkat_pendidikan = S3: IVA (0.0) | | tingkat_pendidikan = D2: IVA (0.0) | | tingkat_pendidikan = SD: IVA (0.0) | | tingkat_pendidikan = SMP: IVA (0.0) | pengalaman_unitkerja > 3.58333: IVA (218.0) pangkat_golongan = IV/a | tingkat_pendidikan = S2: IVA (118.0) | tingkat_pendidikan = SMA | | umur <= 50.9167: non eselon (8.0/1.0) | | umur > 50.9167: IVA (6.0) | tingkat_pendidikan = S1: IVA (85.0/3.0) | tingkat_pendidikan = D3: IVA (4.0) | tingkat_pendidikan = D1: non eselon (2.0) | tingkat_pendidikan = S3: IVA (0.0) | tingkat_pendidikan = D2: IVA (0.0) | tingkat_pendidikan = SD: IVA (0.0) | tingkat_pendidikan = SMP: IVA (0.0) pangkat_golongan = III/b | tingkat_pendidikan = S2 | | masakerja <= 17.0833 | | | diklat = Pim IV: IVA (6.0/1.0) | | | diklat = belum mengikuti Universitas Indonesia
118
(Lanjutan Lampiran 4) | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
| | | masakerja <= 5.83333 | | | | umur <= 35.25: non eselon (12.0) | | | | umur > 35.25 | | | | | umur <= 36.5833: IVA (3.0) | | | | | umur > 36.5833: non eselon (12.0/4.0) | | | masakerja > 5.83333 | | | | masakerja <= 7.41667: IVA (16.0/2.0) | | | | masakerja > 7.41667 | | | | | masakerja <= 14.9167 | | | | | | umur <= 34.0833: IVA (2.0) | | | | | | umur > 34.0833: non eselon (10.0/1.0) | | | | | masakerja > 14.9167: IVA (4.0) | | diklat = Pim III: IVA (0.0) | | diklat = Pim II: IVA (0.0) | masakerja > 17.0833: non eselon (9.0) tingkat_pendidikan = SMA | pengalaman_unitkerja <= 0.5: non eselon (373.0/3.0) | pengalaman_unitkerja > 0.5 | | pengalaman_unitkerja <= 3.58333 | | | umur <= 49.8333: non eselon (18.0/1.0) | | | umur > 49.8333 | | | | pengalaman_unitkerja <= 1.5: IVA (5.0) | | | | pengalaman_unitkerja > 1.5: non eselon (12.0/2.0) | | pengalaman_unitkerja > 3.58333: non eselon (95.0) tingkat_pendidikan = S1 | pengalaman_unitkerja <= 4.33333 | | pengalaman_unitkerja <= 0.083333 | | | diklat = Pim IV | | | | umur <= 45.0833 | | | | | umur <= 28.6667: IVA (5.0) | | | | | umur > 28.6667 | | | | | | masakerja <= 17.0833 | | | | | | | umur <= 43.5833: non eselon (14.0/3.0) | | | | | | | umur > 43.5833: IVA (2.0) | | | | | | masakerja > 17.0833: IVA (4.0) | | | | umur > 45.0833: non eselon (22.0/2.0) | | | diklat = belum mengikuti | | | | masakerja <= 8.25 | | | | | masakerja <= 7.58333: non eselon (178.0/23.0) | | | | | masakerja > 7.58333 | | | | | | masakerja <= 7.91667: IVA (7.0/1.0) | | | | | | masakerja > 7.91667: non eselon (7.0/2.0) | | | | masakerja > 8.25: non eselon (200.0/22.0) | | | diklat = Pim III: non eselon (0.0) | | | diklat = Pim II: non eselon (0.0) | | pengalaman_unitkerja > 0.083333 Universitas Indonesia
119
(Lanjutan Lampiran 4) | | | | | masakerja <= 23.0833: IVA (52.0/20.0) | | | | | masakerja > 23.0833: non eselon (5.0) | | | pengalaman_unitkerja > 4.33333: non eselon (54.0) | | tingkat_pendidikan = D3: non eselon (27.0) | | tingkat_pendidikan = D1: non eselon (3.0) | | tingkat_pendidikan = S3: non eselon (0.0) | | tingkat_pendidikan = D2: non eselon (1.0) | | tingkat_pendidikan = SD: non eselon (2.0) | | tingkat_pendidikan = SMP: non eselon (0.0) | pangkat_golongan = III/d: IVA (327.0/57.0) | pangkat_golongan = III/a: IVA (2.0) | pangkat_golongan = IV/b | | tingkat_pendidikan = S2: IVA (1.0) | | tingkat_pendidikan = SMA: non eselon (4.0) | | tingkat_pendidikan = S1: IVA (4.0/1.0) | | tingkat_pendidikan = D3: non eselon (0.0) | | tingkat_pendidikan = D1: non eselon (0.0) | | tingkat_pendidikan = S3: non eselon (0.0) | | tingkat_pendidikan = D2: non eselon (0.0) | | tingkat_pendidikan = SD: non eselon (0.0) | | tingkat_pendidikan = SMP: non eselon (0.0) jenjab = Fungsional: non eselon (1474.0)
Universitas Indonesia