PENERAPAN TEKNIK DATA MINING DENGAN METODE SMOOTH SUPPORT VECTOR MACHINE (SSVM) UNTUK MEMPREDIKSI MAHASISWA YANG BERPELUANG DROP OUT (Studi Kasus Mahasiswa Politeknik Negeri Medan) TESIS Oleh HABIBI RAMDANI SAFITRI 097038022 / TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011
Universitas Sumatera Utara
PENERAPAN TEKNIK DATA MINING DENGAN METODE SMOOTH SUPPORT VECTOR MACHINE (SSVM) UNTUK MEMPREDIKSI MAHASISWA YANG BERPELUANG DROP OUT (Studi Kasus Mahasiswa Politeknik Negeri Medan)
TESIS
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Magister Komputer Dalam Program Studi Magister Teknik Informatika Pada Program Pascasarjana Fakultas MIPA Universitas Sumatera Utara
Oleh HABIBI RAMDANI SAFITRI 097038022 / TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011
Universitas Sumatera Utara
PENGESAHAN TESIS Judul Tesis
:
PENERAPAN TEKNIK DATA MINING DENGAN METODE SMOOTH SUPPORT VECTOR MACHINE (SSVM) UNTUK MEMPREDIKSI MAHASISWA YANG BERPELUANG DROP OUT (Studi Kasus Mahasisawa Politeknik Negeri Medan)
Nama Mahasiswa Nomor Induk Mahasiswa Program Studi Fakultas
: : : :
HABIBI RAMDANI SAFITRI 097038022 TEKNIK INFORMATIKA MATEMATIKA dan ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
Menyetujui Komisi Pembimbing,
Prof. Dr. Muhammad Zarlis Ketua
Ketua Program Studi
Dekan
Prof. Dr. Muhammad Zarlis NIP : 19570701 198601 1 003
Dr. Sutarman, M.Sc NIP : 19631026 199103 1 001
Universitas Sumatera Utara
PERNYATAAN ORISINALITAS PENERAPAN TEKNIK DATA MINING DENGAN METODE SMOOTH SUPPORT VECTOR MACHINE (SSVM) UNTUK MEMPREDIKSI MAHASISWA YANG BERPELUANG DROP OUT (Studi Kasus Mahasiswa Politeknik Negeri Medan)
TESIS
Dengan ini penulis nyatakan bahwa penulis mengakui semua karya tesis ini adalah hasil karya penulis sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah dijelaskan sumbernya dengan benar.
Medan, 29
Juli 2011
HABIBI RAMDANI SAFITRI NIM. 097038022
Universitas Sumatera Utara
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertandatangan di bawah ini: NamaMahasiswa
:
HABIBI RAMDANI SAFITRI
NomorIndukMahasiswa
:
097038022
Program Studi
:
Magister (S2) Teknik Informatika
JenisKaryaIlmiah
:
TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty Free Right) atas Tesis saya yang berjudul :
PENERAPAN TEKNIK DATA MINING DENGAN METODE SMOOTH SUPPORT VECTOR MACHINE (SSVM) UNTUK MEMPREDIKSI MAHASISWA YANG BERPELUANG DROP OUT (Studi Kasus Mahasiswa Politeknik Negeri Medan) Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusifini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Medan, 29
Juli 2011
HABIBI RAMDANI SAFITRI NIM. 097038022
Universitas Sumatera Utara
Telah diuji pada Tanggal : Juli 2011
PANITIA PENGUJI TESIS Ketua
: Prof. Dr. Muhammad Zarlis
Anggota
: 1. Prof. Dr. Herman Mawengkang 2. M. Andri Budiman, ST, M.Comp. Sc, M.EM
Universitas Sumatera Utara
3. Prof. Dr. Tulus
RIWAYAT HIDUP
DATA PRIBADI
NamaLengkap
Habibi Ramdani Safitri
TempatdanTanggalLahir
Medan, 17 September 1976
AlamatRumah
Jl. Pintu Air IV N0. 121 Komp. Polmed Padang Bulan Medan.
Email
Politeknik Negeri
[email protected]
InstansiTempatBekerja
Politeknik Negeri Medan
Alamat Kantor
Jl. Almamater N0.1 Kampus USU Padang Bulan Medan.
Universitas Sumatera Utara
DATA PENDIDIKAN SD NEGERI 060853
Tamat Tahun 1989
SMP NEGERI 11 MEDAN SAMPALI
Tamat Tahun 1992
SMA SWASTA PAB 1 MEDAN ESTATE
Tamat Tahun 1995
D1 PTKK POLITEKNIK USU
Tamat Tahun 1996
S1 STMIK BUDIDARMA
Tamat Tahun 2000
Universitas Sumatera Utara
KATA PENGANTAR Pertama-tama kami panjatkan puji syukur kehadirat Allah SWT atas segala limpahan rahmad dan karuniaNya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, teman mahasiswa, khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika Universitas Sumatera Utara. Tesis dengan judul : Penerapan Teknik Data Mining Dengan Metode Smooth Support Vector Machine (SSVM) Untuk Memprediksi Mahasiswa Yang Berpeluang Drop Out (Studi Kasus Mahasiswa Politeknik Negeri Medan) adalah merupakan syarat untuk memperoleh gelar Magister Komputer pada Program Pascasarjana Magister Teknik Informatika FMIPA USU. Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada: 1. Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr. Muhammad Zarlis. Sekretaris Program Studi Magister (S2) Teknik Informatika M. Andri Budiman, ST, M.Comp. Sc, M.EM, 2. Pembimbing Utama Prof. Dr. Muhammad Zarlis selaku pembimbing Utama yang dengan penuh kesabaran membimbing, memotivasi, memberikan dukungan moril, kritik dan saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini sehingga tesis ini dapat terselesaikan dengan baik. 3. Prof. Dr. Herman Mawengkang, M. Andri Budiman, ST, M.Comp. Sc, M.EM, dan Prof. Dr. Tulus, selaku pembanding yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini 4. Direktur Politeknik Negeri Medan Ir. Zulkifli Lubis, M.I.Komp, Bambang Sugianto, MP selaku Pudir I, Ir. Sahruddin, MT Selaku Pudir II, Cipta Dharma, M.Si, Selaku Pudir III, Salamat Sibarani, MT, Selaku Pudir IV, yang telah memberikan izin penulis untuk mengikuti perkuliahan i
Universitas Sumatera Utara
5. Rekan-rekan di STT-Harapan untuk segala pengertiannya dan perhatiannya, khusus Dra. Herlina Harahap,M.Si, Ratna Simatupang, MT, Yetty Meutia, MT, Rahmawati, MT, terima kasih untuk semua bantuan dan dukungan yang diberikan. 6. Rekan-rekan angkatan pertama S2 Teknik Informatika USU, khususnya buat kak Arie Santi Siregar atas dukungannya selama ini dengan segala pengalaman yang telah dilewati. umumnya untuk semua bantuan, dukungan, dan kebahagian selama perkuliahan. 7. Staf dan karyawan S2 Teknik Informatika, yang sudah membantu dalam perkuliahan ini, terima kasih atas kebaikan, keramahan semoga sukses selalu. 8. Teristimewa seluruh keluarga besar yaitu Ibunda Hj. Mariani Oesman, Alm. H. Ahmad Ridwan Nst, Bang Izul, Bang Fendi, Kak Lelan, Kak Adah, Kak Fatmah, Ponakan-ponakan atas dorongan moril dan materil yang telah diberikan selama perkuliahan sampai penulisan tesis ini. Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terima kasih atas segala bantuan yang diberikan.
Medan,
Juli 2011
HABIBI RAMDANI SAFITRI NIM 097038022
ii
Universitas Sumatera Utara
PENERAPAN TEKNIK DATA MINING DENGAN METODE SMOOTH SUPPORT VECTOR MACHINE (SSVM) UNTUK MEMPREDIKSI MAHASISWA YANG BERPELUANG DROP OUT (Studi Kasus Mahasiswa Politeknik Negeri Medan)
ABSTRAK
Support Vector Machines (SVM) adalah Algoritma baru dari Teknik data mining, meningkatnya popularitas dalam pembelajaran mesin dan statistic masyarakat. SVM telah diperkenalkan oleh Vapnik untuk memecahkan masalah pengenalan pola dan fungsi nonlinear estimasi. SVM telah menjadi alat pilihan untuk masalah klasifikasi dasar pembelajaran mesin dan data mining. Tidak seperti metode tradisional yang meminimalkan kesalahan pelatihan empiris, SVM bertujuan meminimalkan batas atas kesalahan generalisasi melalui memaksimalkan margin antara hyperplane memisahkan data. Hal ini dapat dianggap sebagai pelaksanaan perkiraan prinsip minimisasi risiko struktur,
Metode smoothing, banyak
digunakan untuk memecahkan masalah pemrograman matematis dan aplikasi penting, yang diterapkan disini untuk menghasilkan dan memecahkan sebuah reformulasi tak terbatas dari mesin vector dukungan untuk klasifikasi pola. Meskipun banyak varian SVM telah diusulkan, masih merupakan masalah penelitian aktif dalam rangka meningkatkan untuk klasifikasi yang lebih efektif. SSVM merupakan pengembangan dari SVM yang menggunakan teknik smoothing. Metode ini pertama kali diperkenalkan oleh Lee pad a tahun 2001. Ide dasar dari SSVM adalah untuk mengkonversi SVM primal formulasi untuk masalah minimisasi non mulus tanpa kendala. Penelitian Support Vector Machine (SSVM) adalah bidang aktif dalam data mining. Penulis mengembangkan metode untuk meningkatkan keakuratan hasil dari database masalah drop out mahasiswa Politeknik Negeri Medan khususnya jurusan Teknik Mesin dan Teknik Konversi Energi. Keyword : model keterhubungan, database
Universitas Sumatera Utara
APPLICATION OF DATA MINING TECHNIQUE TO VECTOR MACHINEMETHOD SMOOTH SUPPORT(SSVM) TO PREDICT STUDENTS WHO DROP OUT CHANCE (Case Study Mahasisawa Polytechnic Medan)
ABSTRACT
Support Vector Machines (SVM) is a new algorithm of data mining techniques, the increasing popularity in machine learning and statistics communities. SVM has been introduced by Vapnik to solve the problem of pattern recognition and nonlinear function estimation. SVM has become the tool of choice for the basic classification problem machine learning and data mining. Unlike traditional methods that minimize the empirical training error, SVM aims at minimizing the upper bound of generalization error through maximizing the margin between the hyperplane separating the data. This can be regarded as the implementation of the principle minimisasi risikostruktur estimates, smoothing method, widely used to solve mathematical programming problems and important applications, which are applied here to generate and solve an infinite reformulation of support vector machines for pattern classification. Although many variants of SVM have been proposed, is still an active research problem in order to improve for a more effective classification. SSVM is a development of the SVM that uses a smoothing technique. This method was first introduced by Leepad atahun 2001. The basic idea is to convert from SSVM SVM primal formulation for non-smooth minimization problem without constraint. Research Support Vector Machine (SSVM) is active in the field of data mining. The author developed a method to improve the accuracy of the results from the database drop-out problem Polytechnic students majoring in particular field of Mechanical Engineering and Energy Conversion Techniques. Keyword: connectedness model, database
Universitas Sumatera Utara
DAFTAR ISI Halaman LEMBAR PENGESAHAN ........................................................ LEMBAR PERNYATAAN ORISINALITAS .......................... LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS... KATA PENGANTAR ………………………………………….
i
ABSTRAK ……………………………………………………...
iii
ABSTRACT …………………………………………………….
iv
DAFTAR ISI ……………………………………………………
v
DAFTAR GAMBAR ……………………………………………
vii
DAFTAR TABEL ……………………………………………….
viii
BAB I PENDAHULUAN ..........................................................
1
I.1 Latar Belakang ............................................................
1
I.2 Perumusan Masalah ....................................................
3
I.3 Batasan Masalah .........................................................
3
I.4 Tujuan Penelitian ........................................................
3
I.5 Manfaat Penelitian ......................................................
4
I.6 Hipotesa ......................................................................
4
BAB II TINJAUAN PUSTAKA ................................................
5
II.1 Data Mining .............................................................
5
II.2 Pengertian Teknik Data Mining ..............................
6
II.2.1 Teknik Data Mining ...................................
7
A. Classification ..........................................
7
B. Association .............................................
8
C. Clustering ................................................
9
II.3 Definis Data Mining ...................................................
10
Universitas Sumatera Utara
II.4 Tahapan Data Mining .................................................
10
II.5 Arsitektur Sistem Data mining ..................................
14
II.6 Tugas-tugas dalam Data mining .................................
17
II.7 Pengertian SSVM (Smooth Support Vector Machine) ..
19
II.7.1 Karateristik SVM …………………………….
20
II.7.2 Kelebihan dan Kekurangan SVM ……………….
20
BAB III METODOLOGI PENELITIAN ....................................
23
III.1 Tempat dan Waktu Penelitian ..................................
23
III.2 Pelaksanaan Penelitian .............................................
24
III.3 Variabel Yang Diamati ............................................
24
III.4 Prosedure Pengumpulan Data ..................................
24
III.5 Alat Analisis Data ....................................................
23
III.6 Diagram Aktifitas Kerja Penelitian ..............................
28
BAB IV HASIL DAN PEMBAHASAN ........................................
30
IV.1 Pendahuluan ……………………………………………
30
IV.2 Hasil Percobaan Data Sample ………………………….
30
IV.3 Tampilan Hasil Program Prediksi Mahasiswa Drop Out
33
BAB V KESIMPULAN DAN SARAN ..................................
44
IV.1 Kesimpulan ......................................................................
44
IV.2 Saran ................................................................................
44
LAMPIRAN ..................................................................................... DAFTAR PUSTAKA .......................................................................
Universitas Sumatera Utara
DAFTAR GAMBAR Halaman 1. Gambar 2.1. Contoh decision tree .........................................
8
2. Gambar 2.2 Contoh klasterisasi ............................................
10
3. Gambar 2.3 Tahap-Tahap Data Mining ................................
11
4. Gambar 4.1 Diagram Alir Kerja Penelitian ..........................
24
Universitas Sumatera Utara
DAFTAR TABEL
1. Tabel 3.1 Tabel Prodi Teknik Mesin Semester A T.A 2008/2009 ......
21
2. Tabel 3.2 Tabel Prodi Teknik Konversi Energi Semester A T.A 2008/2009 ..............................................................................
21
3. Tabel 3.3 Tabel Prodi Teknik Mesin Semester B T.A 2008/2009 ......
21
4. Tabel 3.4 Tabel Prodi Teknik Konversi Energi Semester B T.A 2008/2009 ..............................................................................
22
5. Tabel 3.5 Tabel Prodi Teknik Mesin Semester A T.A 2009/2010 ......
22
6. Tabel 3.6 Tabel Prodi Teknik Konversi Energi Semester A T.A 2009/2010 ..............................................................................
22
7. Tabel 3.7 Tabel Prodi Teknik Mesin Semester B T.A 2009/2010 ......
23
8. Tabel 3.8 Tabel Prodi Teknik Konversi Energi Semester A T.A 2009/2010 ..............................................................................
23
Universitas Sumatera Utara