PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DAN C4.5
SKRIPSI AANG ADYATMA 091402011
PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
Universitas Sumatera Utara
PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DAN C4.5 SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Teknologi Informasi
AANG ADYATMA 091402011
PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
Universitas Sumatera Utara
ii PERSETUJUAN
Judul
: PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DAN C4.5
Kategori
: SKRIPSI
Nama
: AANG ADYATMA
Nomor Induk Mahasiswa
: 091402011
Program Studi
: SARJANA (S1) TEKNOLOGI INFORMASI
Departemen
: TEKNOLOGI INFORMASI
Fakultas
: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI (FASILKOMTI) UNIVERSITAS SUMATERA UTARA Diluluskan di Medan, April 2013
Komisi Pembimbing
:
Pembimbing 2
Pembimbing 1
Syahril Efendi, S.Si, M.IT NIP
Dr. Erna Budhiarti Nababan, M.IT NIP -
Diketahui/Disetujui oleh Program Studi S1 Teknologi Informasi Ketua,
Prof. Dr. Opim Salim Sitompul, M.Sc. NIP 19610817 198701 1 001
Universitas Sumatera Utara
iii PERNYATAAN
PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DAN C4.5
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, April 2013
Aang Adyatma 091402011
Universitas Sumatera Utara
iv UCAPAN TERIMA KASIH
Puji dan syukur penulis sampaikan kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi S1 Teknologi Informasi Universitas Sumatera Utara. Ucapan terima kasih penulis sampaikan kepada: 1. Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara. 2. Ucapan terima kasih juga ditujukan kepada Ketua dan Sekretaris Program Studi Teknologi Informasi, Prof. Dr. Opim Salim Sitompul, M.Sc. dan Drs. Sawaluddin, M.IT. 3. Ibu Dr. Erna Budhiarti Nababan, M.IT selaku pembimbing satu dan Bapak Syahril Efendi, S.Si, M.IT selaku pembimbing dua yang telah banyak meluangkan waktu dan pikirannya, memotivasi dan memberikan kritik dan saran kepada penulis. 4. Ucapan terima kasih juga ditujukan kepada M. Fadly Syahputra, B.Sc,M.Sc.IT dan Romi Fadillah Rahmat, B.Comp.Sc.M.Sc yang telah bersedia menjadi dosen pembanding, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi. 5. Kedua orang tua dan keluarga penulis yang telah memberikan dukungan dan motivasi baik materil dan spiritual, Ayahanda Maman Faturahman dan Ibunda Elvida yang selalu sabar dalam mendidik dan membesarkan penulis. Untuk adik penulis Dhanu Elfitrah yang selalu memberikan dorongan kepada penulis. 6. Penulis juga mengucapkan terimakasih kepada Telkomsel area Sumatera yang telah membantu dan membimbing penulis dalam melakukan riset, Pak Agus Supranowo, Bang Ivren, Pak Ardy Afriadi, Ibu Mila Sari, dan Bang Wimby. 7. Terima kasih kepada teman-teman yang selalu memberikan dukungan, Satrya Prayudi, Rizki Mulki, Wildan Afifi, Mhd. Ari Rifki, Bagus Setiadi, Mhd. Rozy Lubis, Fuzi Frilla Kurnia, Umaya Ramadhani Nst, Nanda Putra,S.Ti, Musyafa Hutagalung, S.Ti, Fithra Prawiratama, Yogi Suryo Santoso, Ranap Katili Parulian, serta seluruh angkatan 09, teman-teman SRC, teman – teman TA, teman – teman sampali, serta teman-teman mahasiswa Teknologi Informasi lainnya yang tidak dapat penulis sebutkan satu persatu, Semoga Allah SWT membalas kebaikan kalian dengan nikmat yang berlimpah. Terimakasih kepada Indi Andira Butar - Butar, atas motivasi, semangat, dan hiburan, semoga kita bisa menggapai cita- cita yang kita inginkan. Akhir kata, saya ucapkan terimakasih kepada semua pihak yang terkait dalam penyelesaian skripsi ini yang tidak bisa saya sebut satu persatu. Semoga Allah SWT membalas segala kebaikan yang sudah diberikan dan semoga Allah tetap memberi rahmat dan keberkahan kepada kita semua.
Universitas Sumatera Utara
v ABSTRAK
Pada penerimaan karyawan, sering sekali melibatkan data pelamar dalam jumlah besar, oleh sebab itu diperlukan sebuah aplikasi yang dapat memilah dan memproses data dalam jumlah besar, data dalam jumlah besar tersebut dapat memberikan informasi yang dibutuhkan. Manfaat data mining dapat diimplementasikan pada penerimaan karyawan yang melibatkan data dalam jumlah besar, teknik yang digunakan dalam aplikasi data mining ini adalah pohon keputusan, dengan algoritma C4.5, dimana data diklasifikasikan, dan dipilah sesuai variabel dan atribut yang ada. Setelah data dipilah, akan terlihat bagaimana kecenderungan pelamar yang akan diterima pada perusahaan, dengan mencari entropy dan gain tertinggi dibentuklah pohon keputusan, kemudian didapatkanlah rules yang akan dimasukkan kedalam aplikasi. Aplikasi tersebut dapat digunakan untuk memvalidasi data pelamar, apakah pelamar tersebut lulus atau tidak lulus dalam seleksi. Pengujian yang dilakukan terhadap berbagai data training menunjukkan bahwa semakin banyak data dan variasi dari data itu, akan menambah keakuratan sistem pengambilan keputusan, pengujian juga dilakukan terhadap data pelamar dari tahun 2009 sampai 2012 dengan data training terbanyak, pada suatu perusahaan diperoleh rata – rata keakuratan sebesar 70,9%. Kata kunci : data mining, pohon keputusan, algoritma C4.5, Sistem Pengambilan Keputusan, Penerimaan.
Universitas Sumatera Utara
vi
IMPLEMENTATION DATA MINING IN DECISION SUPPORT SYSTEM RECRUITMENTS NEW EMPLOYEE WITH DECISION TREE METHOD AND C4.5 ABSTRACT
In open employee recruitment, always involve the applicant data in large quantities, therefore, it need an application which can classify and process data in large numbers. It give information that we needs, the benefit of data mining can implemented in employee recruitments, technique in this application is decision tree with C4.5 algorithm, which the data classified and selectioned suitable with variable and the attribute. And will be seen how the tendency of applicants will be accepted at the company, with calculate the entropy and decision trees formed the highest gain, then found the rules will be incorporated into the application. The application can use for validate applicant data, whether the applicant passed or did not pass the selection. Tests were conducted on a variety of data indicate that the more training data and variety of the data that will increase the accuracy of decision-making system, and tests were conducted on applicant data from 2009 to 2012 the company acquired an average accuracy of 70.9%. Keywords: data mining, decision tree, C4.5 algorithm, Decision Suport Systems, Acceptance.
Universitas Sumatera Utara
vii DAFTAR ISI
PERSETUJUAN PERNYATAAN UCAPAN TERIMA KASIH ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR BAB 1 PENDAHULUAN 1.1 Latar Belakang 1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian 1.5 Manfaat Penelitian 1.6 Metodologi Penelitian 1.7 Sistematika Penulisan BAB 2 LANDASAN TEORI 2.1 Basis Data (Database) 2.1.1 DBMS (Database Management System) 2.2 Konsep dasar pengambilan keputusan 2.2.1 Tahapan Pengambilan Keputusan 2.3 Data Mining 2.3.1 Tahapan Data Mining 2.4 Pohon Keputusan 2.4.1 Konsep Pohon keputusan 2.4.2 Manfaat Metode Pohon Keputusan 2.4.3 Kelebihan Pohon Keputusan 2.4.4 Algoritma C4.5 BAB 3 ANALISIS DAN PERANCANGAN 3.1 Data 3.2 Pemrosesan Data 3.2.1 Data Cleaning (pembersihan data) 3.2.2 Data Integration 3.2.3 Data Selection 3.2.4 Data Transformation 3.2.5 Data Mining 3.2.5.1 Variabel 3.2.5.2 Pembentukan Pohon Keputusan 3.2.6 Pattern Evaluation
Hal. ii iii iv v vi vii ix x 1 1 1 3 3 3 4 4 5 6 6 6 7 7 7 8 9 11 11 12 12 13 16 16 16 20 20 24 24 26 26 26 28 45
Universitas Sumatera Utara
viii 3.2.7 Knowledge Presentation 3.3 Analisis Komponen Sistem 3.3.1 Usecase Spesification 3.3.2 Data Flow Diagram (DFD) 3.3.2.1 DFD Level 0 3.3.2.2 DFD Level 1 3.3.2.3 DFD Level 2 3.3.3 Sitemap Aplikasi 3.3.4 Flowchart Perancangan Algoritma C4.5 3.4 Database Relationship 3.5 Antarmuka Sistem 3.5.1 Form Login 3.5.2 Halaman Awal (Home) 3.5.3 Halaman Sistem Pendukung Keputusan (SPK) 3.5.4 Form Input Data Pelamar 3.5.5 Halaman Menampilkan Pelamar 3.5.6 Halaman Menampilkan Pelamar 3.5.7 Halaman Management Data Pelamar 3.5.8 Halaman Laporan 3.5.9 Halaman Control Panel 3.5.10 Halaman Ganti Password BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 4.1 Implementasi Sistem 4.1.1 Lingkungan Implementasi 4.3 Implementasi perancangan antarmuka 4.3.1 Halaman Login 4.3.2 Halaman Home 4.3.3 Halaman SPK 4.3.4 Halaman Tampil Pelamar 4.3.5 Halaman Tampil Pelamar 4.3.6 Halaman Management Data Pelamar 4.3.7 Halaman Laporan 4.3.8 Halaman Control Panel 4.4 Implementasi Data 4.5 Pengujian Sistem 4.5.1 Rencana pengujian sistem 4.5.2. Kasus dan hasil pengujian sistem 4.5.3. Pengujian kinerja sistem 4.5.4. Pengujian data BAB 5 KESIMPULAN DAN SARAN 5.1 Kesimpulan 5.2 Saran DAFTAR PUSTAKA LAMPIRAN A: Listing Program
46 48 48 49 49 51 52 56 57 59 60 60 61 62 63 64 65 66 67 68 69 70 70 70 70 71 71 72 72 77 79 80 81 82 85 85 86 87 94 107 110 110 110 111 112 114
Universitas Sumatera Utara
ix DAFTAR TABEL
Table 3.1 Jumlah data pelamar setelah tahap data integration Table 3.2 Klasifikasi data pelamar Table 3.3 klasifikasi data (Berdasarkan Variabel) Table 3.4 Sample Perhitungan Entropy (Jenjang Pendidikan) Table 3.5 Perhitungan Node Akar Table 3.6 Perhitungan Node 2 Table 3.7 Perhitungan Node 2.1 Table 3.8 Perhitungan Node 2.1.1 Table 3.9 Perhitungan Node 2.1.2 Table 3.10 Perhitungan Node 3 Table 3.11 Perhitungan Node 3.1 Table 3.12 Perhitungan Node 3.1.1 Table 3.13 Perhitungan Node 3.1.2 Table 3.14 Entitas Luar pada DFD Tabel 4.1 Rencana Pengujian Tabel 4.1 Rencana Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Tabel 4.2 Hasil Pengujian (Lanjutan) Table 4.3 perbandingan hasil proses validasi data Table 4.4 Detail perbandingan hasil proses validasi data Table 4.5 Persentase Keakuratan Berdasarkan data training
Hal. 24 25 28 30 31 32 33 35 37 39 40 42 42 50 86 87 87 88 89 90 91 92 93 94 105 106 109
Universitas Sumatera Utara
x DAFTAR GAMBAR
Gambar 2.1 Tahapan Data Mining Gambar 2.2 konsep pohon keputusan Gambar 2.2 Contoh pohon keputusan Gambar 3.1 Print Screen Data Pelamar Excel Gambar 3.2 Printscreen Data Pelamar yang Lulus Exel Gambar 3.3 Contoh Field yang tidak Konsisten Gambar 3.3 Contoh Field Kosong Gambar 3.5 Node Akar Gambar 3.6 Pembentukan Node 2 Gambar 3.7 Pembentukan Node 2.1 Gambar 3.8 Pembentukan Node 2.1.1 dan node akhir Gambar Pembentukan node 3.1.1 Gambar 3.13 Usecase Spesification Program Gambar 3.15 DFD Level 1 Program Gambar 3.16 DFD Level 2: pencarian Gambar 3.17 DFD Level 2: mengelola data pelamar Gambar 3.19 DFD Level 2: Sistem Pembentukan Rules Gambar 3.20 DFD Level 2: Mencetak Data Pelamar Gambar 3.21 DFD Level 2: Proses Login Gambar 3.22 DFD Level 2: Control Panel Sistem Gambar 3.23 Sitemap Aplikasi Gambar 3.24 Flowchart C4.5 Gambar 3.24 Flowchart C4.5 (Lanjutan) Gambar 3.25 Database Relationship Gambar 3.26 Halaman Login Gambar 3.27 Halaman Awal (Home) Gambar 3.28 Halaman Sistem Pengambilan Keputusan (SPK) Gambar 3.29 Halaman Input Data Pelamar Gambar 3.30 Halaman Pembentukan Rules Gambar 3.31 Halaman Menampilkan Pelamar Gambar 3.32 Halaman Management Pelamar Gambar 3.34 Halaman Control Panel Gambar 3.35 Halaman ganti password Gambar 4.1 Halaman Login Gambar 4.2 Halaman Home Gambar 4.3 Halaman SPK Gambar 4.4 Tutorial SPK Gambar 4.5 Form input data pelamar Gambar 4.6 Control panel tahun Gambar 4.7 Pengaturan Periode Gambar 4.8 Pratinjau input pelamar Gambar 4.9 Form SPK
Hal. 9 11 15 16 18 20 22 31 33 34 36 42 48 51 52 52 53 54 54 55 56 57 58 59 60 61 62 63 64 65 66 68 69 71 72 72 73 73 74 74 75 75
Universitas Sumatera Utara
xi Gambar 4.10 Halaman Utama SPK Gambar 4.12 Halaman Pembentukan Rules Gambar 4.13 Form data yang akan diproses Gambar 4.14 Proses pembersihan data Gambar 4.15 Klasifikasi Data Gambar 4.16 Pembentukan Rules Gambar 4.17 Form tampil data pelamar Gambar 4.18 Halaman tampil data pelamar Gambar 4.19 Halaman management data pelamar Gambar 4.20 Halaman persentase kelulusan Gambar 4.21 Halaman form laporan Gambar 4.22 Hasil laporan dalam bentuk Excel Gambar 4.23 Control Panel Sistem Gambar 4.24 Pohon Keputusan yang terbentuk Gambar 4.25 Control Panel (Jurusan) Gambar 4.26 Control Panel (User) Gambar 4.27 Ganti password Gambar 4.28 Data Testing Gambar 4.29 Submenu Menu Utama pada menu Rules Gambar 4.30 Form data training Gambar 4.31 Submenu preproses data Gambar 4.32 Preproses klasifikasi Gambar 4.33 Preproses pembentukan rules Gambar 4.34 Pengecekan rules Gambar 4.35 Pohon Keputusan Gambar 4.36 Form masukkan data pelamar Gambar 4.37 Halaman SPK Gambar 4.38 Hasil proses validasi Gambar 4.39 Halaman Persentase kelulusan Gambar 4.40 Hasil Validasi datamar dengan menggunakan aplikasi Gambar 4.41 Hasil Validasi Sebenarnya Gambar 4.42 Pengujian dari segi running time program Gambar 4.43 Pengujian dari segi keakuratan sistem pengambilan keputusan Gambar 4.44 keakuratan kelulusan berdasarkan data training pembentuk rules
76 77 77 78 78 79 79 80 80 81 81 82 82 83 84 84 85 94 96 97 97 97 98 98 99 99 100 101 102 102 102 107 108 108
Universitas Sumatera Utara