MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING DAN DECISION TREE
TESIS
Oleh
ZEFRI PAULANDA 107038004/TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2012
Universitas Sumatera Utara
MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING DAN DECISION TREE
TESIS
Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara
Oleh
ZEFRI PAULANDA 107038004/TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2012
Universitas Sumatera Utara
MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING DAN DECISION TREE
PENGESAHAN TESIS
Judul Tesis
Nama Mahasiswa Nomor Induk Mahasiwa Program Studi Fakultas
: MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL KMEAN CLUSTERING DAN DECISION TREE : ZEFRI PAULANDA : 107038004 : Magister Teknik Informatika : Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara
Menyetujui Komisi Pembimbing
Dr. Marwan Ramli, M.Si Anggota
Ketua Program Studi,
Prof. Dr. Muhammad Zarlis NIP : 195707011986011003
Prof. Dr. Tulus Ketua
Dekan,
Prof. Dr. Muhammad Zarlis NIP: 195707011986011003
Universitas Sumatera Utara
PERNYATAAN ORISINALITAS
MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING DAN DECISION TREE
TESIS
Dengan ini saya menyatakan bahwa saya mengakui semua karya tesis ini adalah hasil kerja saya sendiri kecuali kutipan dan ringkasan yang tiap satunya telah dijelaskan sumbernya dengan benar.
Medan,
Juni 2012
Zefri Paulanda NIM 107038004
Universitas Sumatera Utara
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini : Nama NIM Program Studi Jenis Karya Ilmiah
: : : :
Zefri Paulanda 107038004 Teknik Informatika Tesis
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak bebas Royalti Non-Eksklusif (non-Exlusive Royalty Free Right) atas tesis saya yang berjudul
MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING DAN DECISION TREE Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk data-base, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta. Demikian pernyataan ini dibuat dengan sebenarnya.
Medan,
Juni 2012
Zefri Paulanda NIM 107038004
Universitas Sumatera Utara
Telah diuji pada Tanggal : 19 Juni 2012
PANITIA PENGUJI TESIS Ketua
: Prof. Dr. Tulus
Anggota
: 1. Dr. Marwan Ramli, M.Si 2. Prof. Dr. Muhammad Zarlis 3. Dr. Poltak Sihombing, M.Kom 4. Prof. Dr. Herman Mawengkang
Universitas Sumatera Utara
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap berikut gelar : Zefri Paulanda, ST Tempat dan Tanggal Lahir
: Medan, 17 Juli 1977
Alamat Rumah
: Jl. Sekip Gg. Agussalim No. 19 B Medan
Telepon / HP
: 061- 4146243 / 08126455891
e-mail
:
[email protected]
Instansi Tempat Bekerja
: Guru SMP Negeri 5 Percut Sei Tuan
Alamat Kantor
: Jl. Cucak Rawa II No. 3 Perumnas Mandala
Telepon
:-
DATA PENDIDIKAN
SD
: SD Negeri No. 060841 Medan
Tamat : 1988
SMP
: SMP Negeri 6 Medan
Tamat : 1992
SMA
: SMA Methodist I Medan
Tamat : 1995
Strata-1
: Institut Sains Teknologi TD Pardede
Tamat : 2005
Strata-2
: PSMTIF PPs Fasilkom-TI USU
Tamat : 2012
Universitas Sumatera Utara
KATA PENGANTAR Pertama-tama kami panjatkan puji syukur kepada Tuhan Yang Maha Esa, atas segala limpahan rahmat dan karunia-Nya sehingga tesis ini dapat diselesaikan tepat pada waktunya. Dengan selesainya tesis ini, perkenankanlah kami mengucapkan terima kasih yang sebesar-besarnya kepada : Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada saya untuk mengikuti dan menyelesaikan pendidikan Program Magister. Dekan Fasilkom-TI (Fakultas Ilmu Komputer dan Teknologi Informasi) Universitas Sumatera Utara Prof. Dr. Muhammad Zarlis, atas kesempatan yang diberikan kepada saya menjadi mahasiswa Program Magister pada Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara. Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr. Muhammad Zarlis dan Sekretaris Program Studi
M. Andri Budiman,
S.T,
M.Comp, M.E.M beserta seluruh staff pengajar pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara, yang telah bersedia membimbing penulis sehingga dapat menyelesaikan pendidikan tepat pada waktunya. Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya saya ucapkan kepada Prof. Dr. Tulus, selaku pembimbing utama dan kepada Dr. Marwan Ramli, M.Si, selaku pembimbing Anggota yang dengan penuh kesabaran menuntun serta membimbing saya hingga selesainya tesis ini dengan baik. Terima kasih yang tak terhingga dan penghargaan setinggi-tingginya saya ucapkan kepada Prof. Dr. Muhammad Zarlis, Dr. Poltak Sihombing, M.Kom dan Prof. Dr Herman Mawengkang, sebagai pembanding yang telah memberikan saran dan masukan serta arahan yang baik demi penyelesaian tesis ini. Staff Pegawai dan Administrasi pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan terbaik kapada penulis selama mengikuti perkuliahan hingga saat ini.
Universitas Sumatera Utara
Kepada Ayahanda Alm. Drs. P. Gultom, Ibunda R. Hutabarat selaku orang tua, kepada A. Nainggolan dan M. Panjaitan selaku mertua, kepada Istri tersayang Eka Prasty Nainggolan, S.Pd, dan kepada kedua buah hatiku Slavina Mathilda Putrianda Br. Gultom dan Secilia Ananda Br. Gultom, kepada abangda dan kakanda, juga kepada adik ipar dan lae di Pakam, yang tidak dapat saya sebutkan satu persatu, terimakasih atas segala pengorbanannya, baik moril maupun materil budi baik ini tidak dapat dibalas hanya diserahkan kepada Yesus Kristus. Rekan mahasiswa/i Angkatan kedua tahun 2010 pada Program Pascasarjana Fakultas Fasilkom-TI Universitas Sumatera Utara yang telah banyak membantu penulis baik berupa dorongan semangat dan doa selama mengikuti perkuliahan. Semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terimakasih atas segala bantuan dan doa yang diberikan. Dengan segala kekurangan dan kerendahan hati, sekali lagi penulis mengucapkan terima kasih. Semoga kiranya Tuhan yang membalas segala bantuan dan kebaikan yang telah kalian berikan.
Medan,
Juni 2012
ZEFRI PAULANDA NIM 107038004
Universitas Sumatera Utara
MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING DAN DECISION TREE ABSTRAK Tesis ini merepresentasikan suatu model profil mahasiswa yang potensial drop out. Model ini disusun dengan menggunakan kernel k-mean clustering dan Decision Tree. Ini dimotivasi oleh adanya ketidakseragaman penyebab mahasiswa yang drop out dalam program D3 Tehnik Informatika FMIPA USU Medan. Oleh karena itu perlu sebuah model profil mahasiswa yang kemungkinan drop out seorang mahasiswa. Sebagai contoh kasus diambil data mahasiswa D3 Tehnik Informatika FMIPA USU Medan untuk angkatan 2009/2010 dan 2010/2011. Data yang diperoleh terlebih dahulu dikelompokkan untuk mendapatkan informasi kondisi mahasiswa secara keseluruhan. Berdasarkan analisa model yang diperoleh ditemukan Mahasiswa yang potensial drop out disebabkan oleh karena tidak ada lagi minat belajar mahasiswa, kurangnya faktor dukungan orang tua, kurangnya kepercayaan diri juga kurangnya prilaku dan waktu belajar mahasiswa.
Kata Kunci : K-mean clustering, Decision tree, Drop Out, Algoritma C-45, Indeks Prestasi
Universitas Sumatera Utara
MODEL PROFILE OF POTENTIAL STUDENTS DROP OUT TECHNIQUE USING KERNEL K-MEANS CLUSTERING AND DECISION TREE ABSTRACT This thesis presents a model profile of potential students who drop out. The model was compiled using kernel k-means clustering and Decision Tree. This is motivated by the existence of unequal causes students who drop out in the program D3 Technical Information Faculty USU Medan. Therefore need a model profile of students who drop out the possibility of a student. For example take the case of student data D3 Technical Information Faculty USU Medan to force 2009/2010 and 2010/2011. The data obtained were grouped to obtain advance information of students overall condition. Based on the analysis of models obtained are found students who drop out due to potential because there is no interest in learning of students, lack of parental support factor, a lack of confidence is also a lack of time behavior and student learning.
Keywords : K-mean clustering, Decision tree, Drop Out, Algoritma C-45, Indeks Prestasi
Universitas Sumatera Utara
DAFTAR ISI
Halaman KATA PENGANTAR ABSTRAK ABSTRACT DAFTAR ISI DAFTAR GAMBAR DAFTAR TABEL DAFTAR LAMPIRAN
i iii iv v vii viii ix
BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian 1.5 Manfaat Penelitian
1 1 6 6 7 7
BAB II 2.1 2.2 2.3
TINJAUAN PUSTAKA Penambangan Data (Data Mining) Penambangan Data Pada Pendidikan Tinggi Algoritma Clustering (Clustering Algorithm) 2.3.1 Clustering Hirarkhi (Hierarchical Clustering) 2.3.2 Clustering Partisional (Partisional Clustering) Analisis Cluster Metode Kernel Fungsi Kernel Kernel K-Means Clustering Decision Tree Algoritma C 4.5 Persamaan dengan Riset-Riset Lain Perbedaan dengan Riset-Riset Lain Kontribusi Riset
9 9 11 15 19 20 22 23 24 26 31 32 37 38 39
METODOLOGI PENELITIAN Lokasi dan Waktu Penelitian Rancangan Penelitian 3.2.1 Perhitungan dengan menggunakan Gain dan Entropy Diagram Aktivitas Penelitian Teknik Pengumpulan Data Pra Pemrosesan Data (Preprocessing Data) Clustering (Kernel k-Means)
40 40 40 41 42 43 44 47
2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12
BAB III 3.1 3.2 3.3 3.4 3.5 3.6
Universitas Sumatera Utara
3.7 3.8
BAB IV 4.1 4.2 4.3 4.4 4.5 4.6
BAB V 5.1 5.2
Model Cluster Interpretasi
47 48
HASIL DAN PEMBAHASAN Pendahuluan Hasil Penelitian Cluster Model Cluster Data Berdasarkan Predikat Prestasi Akademik Analisis Cluster Analisis Percobaan Decision Tree 4.6.1. Cara untuk menghitung atribut pada nilai Gain dan Entropy
53 53 53 55 57 58 59
KESIMPULAN DAN SARAN Kesimpulan Saran
70 70 70
DAFTAR PUSTAKA LAMPIRAN
65
71 L-1
Universitas Sumatera Utara
DAFTAR GAMBAR
Nomor Gambar 2.1 2.2 3.1 4.1 4.2 4.3 4.4 4.5 4.6 4.7
Judul
Halaman
Tahap-Tahap Menggali Pengetahuan Dari Pangkalan Data Proses Pemetaan Kernel Diagram aktivitas Kerja Penelitian Cluster Model Distribusi data antara IPK dengan minat belajar, kepercayaan diri, prilaku belajar, dukungan orangtua dan waktu belajar Anggota Cluster berdasarkan Predikat Grafik Decision Tree Model Aturan Text Decision Tree Profil Predikat Kelulusan Pohon keputusan berdasarkan urutan gain tertinggi
9 26 54 55 57
58 59 64 65 67
Universitas Sumatera Utara
DAFTAR TABEL
Nomor Tabel 3.1 3.2 3.3 3.4 4.1 4.2
Judul Tampilan Data Set Tampilan Data Kategorisasi IPK Tampilan Kategorisasi Data Data dalam bentuk XML Hasil Clustering dalam Data View
Halaman 44 45 46 46 54 56
Universitas Sumatera Utara
DAFTAR LAMPIRAN
Nomor Lampiran
Judul
Halaman
A B C D
KUESIONER Korelasi Penelitian 400 Data Data percobaan pembuatan aturan decision tree Data aturan Decision Tree berpotensial DO atau Tidak
L-1 L-5 L-10 L-19
Universitas Sumatera Utara