Kode / Nama Rumpun Ilmu: 458 / Teknik Informatika USULAN PENELITIAN DOSEN PEMULA
JUDUL PENELITIAN: PENGGUNAAN EDUCATIONAL DATA MINING (EDM)UNTUK MENDETEKSI KETERLAMBATAN MASA STUDI MAHASISWA (STUDI KASUS UDINUS)
TIM PENGUSUL: (Ketua) Defri Kurniawan, M.Kom
NIDN: 0613128502
(Anggota 1) Wibowo Wicaksono, S.T, M.Kom
NIDN: 0629107603
(Anggota 2) Yani Parti Astuti, S.Si
NIDN: 0606107401
UNIVERSITAS DIAN NUSWANTORO SEMARANG APRIL 2015
HALAMAN PENGESAHAN
ii
DAFTAR ISI HALAMAN PENGESAHAN ................................................................................................ ii DAFTAR ISI ........................................................................................................................ iii DAFTAR GAMBAR ............................................................................................................. v DAFTAR TABEL................................................................................................................. vi RINGKASAN ........................................................................................................................ 1 BAB 1. PENDAHULUAN..................................................................................................... 2 1.1 Latar Belakang Masalah.................................................................................... 2 1.2 Rumusan Masalah............................................................................................. 3 1.3 Tujuan Penelitian .............................................................................................. 4 1.4Luaran Yang Diharapkan ................................................................................... 4 1.5Ruang Lingkup Penelitian .................................................................................. 4 1.6Kontribusi Penelitian ......................................................................................... 4 BAB 2. STUDI PUSTAKA.................................................................................................... 5 2.1 Educational Data Mining (EDM) ...................................................................... 5 2.2Algoritma C4.5 .................................................................................................. 8 2.3 Penelitian Serupa yang Pernah Dilakukan Sebelumnya ................................... 10 bab 3. METODE PENELITIAN........................................................................................... 11 3.1 Metode Penelitian ........................................................................................... 11 3.2 Metode Pengumpulan Data ............................................................................. 11 3.3Metode Pengolahan Awal Data ........................................................................ 12 3.4 Metode yang Diusulkan .................................................................................. 12 3.5 Eksperimen dan Pengujian Model ................................................................... 12 3.6 Evaluasi dan Validasi...................................................................................... 12 3.7 Kerangka Pemikiran ....................................................................................... 13 BAB 4. BIAYA DAN JADWAL PENELITIAN .................................................................. 14 4.1 Biaya Penelitian .............................................................................................. 14 4.2 Jadwal Penelitian ............................................................................................ 14 iii
DAFTAR PUSTAKA .......................................................................................................... 15 LAMPIRAN-LAMPIRAN ................................................................................................... 16
iv
DAFTAR GAMBAR Gambar 1Data Mining Roots.................................................................................................. 6 Gambar 2 Contoh konsep pohon keputusan untuk menentukan pembelian komputer berdasarkan atribut age, student dan credit rating. ................................................................. 8
v
DAFTAR TABEL Tabel 1Confussion Matrix .................................................................................................... 12
vi
RINGKASAN Atribut masa studi merupakan hal penting bagi pengelola akademik, bagaimana mahasiswa dapat lulus dengan tepat waktu merupakan suatu upaya yang terus dilakukan. Masih banyaknya mahasiswa yang tidak lulus tepat waktu merupakan masalah serius bagi universitas. Data mining dapat diusulkan sebagai salah satu pendekatan yang dapat dilakukan untuk memprediksi kinerja siswa.Penerapan metode data mining dalam menganalisis data yang tersedia di lembaga pendidikan didefinisikan sebagai Educational Data Mining (EDM).Pada penelitian ini algoritma C4.5 diusulkan untuk memprediksi masa studi mahasiswa pada program studi Teknik Informatika S-1 UDINUS.Mendapatkan suatu pengetahuan (knolwledge) dari aktivitas penggalian data akademik merupakan tujuan yang dihatapkan dalam penelitian ini, sehingga dapat membantu universitas dalam proses pengambilan keputusan sebagai antisipasi kegagalan studi mahasiswa. Kata Kunci: Masa Studi Mahasiswa, Educational Data Mining, Data Mining, Algoritma C4.5
1
BAB 1. PENDAHULUAN 1.1 Latar Belakang Masalah Universitas Dian Nuswantoro (UDINUS) memiliki Fakultas Ilmu Komputer (Fasilkom) yang merupakan fakultas terbesar dari 4 (empat) fakultas yang ada.Hal ini dapat dilihat dari jumlah program studi yang ada, Fasilkom memiliki 6 (enam) program studi.Salah satu program studi dengan mahasiswa terbesar ada pada Teknik Informatika S-1.Jumlah mahasiswa yang besar tersebut harus dapat diimbangi dengan kualitas sistem pendidikan yang diberikan kepada mahasiswa. Salah satu cara untuk mencapai tingkat kualitas tertinggi dalam sistem pendidikan tinggi adalah dengan menemukan pengetahuan dari data pendidikan untuk mempelajari atribut utama yang dapat mempengaruhi kinerja siswa (Abu Tair & Al-Helees, 2012). Atribut masa studi merupakan hal penting bagi pengelola akademik, bagaimana mahasiswa dapat lulus dengan tepat waktu merupakan suatu upaya yang terus dilakukan. Masih banyaknya mahasiswa yang tidak lulus tepat waktu merupakan masalah serius bagi universitas. Dengan dapat memprediksi masa studi mahasiswa yang tidak tepat waktu, pihak universitas dapat meminimalisir kegagalan kelulusan mahasiswa dengan membuat perencanaan, pengawalan studi dan bimbingan lebih intensif. Menganalisa kinerja mahasiswa (student performance), mengidentifikasi keunikan-keunikan yang ada pada mahasiswa dan membangun suatu strategi pengembangan lebih lanjut dan tindakan-tindakan di masa depan, merupakan tantangan utama bagi universitas modern saat ini(Kabakchieva, 2013). Data miningdapat diusulkan sebagai salah satu pendekatan yang dapat dilakukan untuk memprediksi kinerja siswa (Osmanbegovic & Suljic, 2012).Hal ini didukung dengan adanya data yang melimpah pada universitas.Data mining merupakan suatu cara dalam menggali informasi dari sejumlah data yang biasanya tersimpan dalam repositori dengan menggunakan teknologi pengenalan pola, statistik dan teknik matematika(Larose, 2006).Penerapan metode data miningdalam menganalisis data yang tersedia di lembaga pendidikan didefinisikan sebagai Educational Data Mining (EDM)(Romero & Ventura, 2007). Dan merupakan suatu aliran yang relatif baru dalam penelitian data mining.EDM menggunakan beberapa teknik sepertiDecision Trees, Neural Networks, Naïve Bayes, KNearest Neighbordan lainnya(Yadav & Pal, 2012). EDM berkaitan dengan pengembangan metode untuk mengeksplorasi jenis yang unik dari data-data pada pengelolaan pendidikan dan menggunakannya
untuk
lebih
memahami
siswa
dan
pengelolaannya(Baker,
2010).Pengetahuan yang ditemukan dari data mining dapat digunakan untuk menawarkan suatu rekomendasi kepada perencana akademik di lembaga pendidikan tinggi dalam meningkatkan proses pengambilan keputusan (decision making), meningkatkan kinerja akademik dan memangkas tingkat kegagalan siswa serta lebih memahami perilaku para 2
siswa(Abu Tair &Al-Helees, 2012). Hal tersebutmerupakan tujuan-tujuan yang ingin dicapai dalam pemanfaatan data mining di bidang pendidikan. Penetian mengenai data mining pada lembaga pendidikan telah banyak dilakukan oleh para peneliti.Dorina Kabakchieva melakukan penelitian yang bertujuan untuk menganalisis kinerja algoritma klasifikasi data mining yang berbeda menggunakan Decision Tree classifier, Bayes classifiers dan Nearest Neighbour classifier pada University of National and World Economy (UNWE), Bulgaria (Kabakchieva, 2013). Hasil performa pengklasifikasi menunjukkan bahwa klasifikasi pohon keputusan / Decision Tree classifier (J48) memiliki akurasi keseluruhan tertinggi, diikuti oleh rule learner (JRip) dan k-NN classifier serta Bayes classifier kurang akurat daripada yang lain. Penelitian yang lainyaitu Marselina Silvia Suhartinah dan Ernastuti melakukan penelitian untuk memprediksi mahasiswa yang lulus atau tidak lulus sesuai dengan waktu studi menggunakan algoritma C4.5 dan Naive Bayes serta membandingkan hasil akurasi kedua algoritma tersebut(Suhartinah & Ernastuti, 2010). Hasil penelitian ini, menunjukkan bahwa akurasi algoritma C4.5 lebih baik 85,7% dari Naive Bayes80,85%. Pada penelitian Surjeet Kumar Yadav dan Saurabh Pal membandingkan metode pengklasifikasi Decision Tree ID3, CART dan C4.5 untuk memprediksi performas siswa (Yadav & Pal, 2012).Hasil penelitian menunjukkan bahwa algoritma C4.5 memiliki akurasi tertinggi dari algoritma ID3 dan CART serta algoritma C4.5 menunjukkansebagai model yang berhasil mengidentifikasi siswa yang cenderung gagal. Dari penelitian di atas, decision treemenunjukkan keunggulan dibandingkan dengan algoritma yang lain. Karena pada algoritma C4.5setiap nilai dalam suatu atribut ditelusuri dan diproses untuk mendapatkan entropi masing-masing nilai yang akan digunakan untuk mencari ukuran purity masing-masing atribut yang dinyatakan dengan information gain(Suhartinah & Ernastuti, 2010). Proses penelusuran ini akan membentuk sebuah pola berupa pohon keputusan. Dari keunggulan-keunggulan di atas, pada penelitian ini algoritma C4.5 diusulkan untuk memprediksi masa studi mahasiswa di program studi Teknik Informatika S-1 UDINUS. 1.2 Rumusan Masalah Berdasarkan latar belakang di atas, didapatkan rumusan masalahyaitu: Sulitnya memahami dan menemukan pola studi mahasiswa terhadap atribut data mahasiswa dan data perkuliahan yang berpengaruh pada masa studi mahasiswa dalam jumlah data besar. Pertanyaan penelitian: Atribut manakahyang merupakan penentu,mahasiswa dapat lulus tepat waktu atau tidak apabila algoritma C4.5 diterapkan dalam membangun pohon keputusan? 3
1.3 Tujuan Penelitian Penelitian ini bertujuan untuk: 1. Menerapkan pendekatan data mining dengan menggunakan algoritma C4.5 untuk memprediksi masa studi mahasiswa di program studi Teknik Informatika S-1 UDINUS. 2. Menemukan suatu pola berupa pohon keputusan yang dapat membantu universitas dalam
prosespengambilan
keputusan
sebagai
antisipasi
kegagalan
studi
mahasiswa.
1.4Luaran Yang Diharapkan Secara spesifik luaran yang akan dicapai pada penelitian ini, yaitu: 1. Bahan Ajar Perkuliahan Hasil penelitian ini dapat digunakan sebagai studi kasus dalam perkuliahan data mining. 2. Publikasi Ilmiah Hasil penelitian ini akan dipublikasikan secara ilmiah melalui konferensi nasional/internasional dan dalam jurnal ilmiah terakreditasi.
1.5 Ruang Lingkup Penelitian Ruang lingkup atau batasan penelitian yang dilakukan meliputi: 1. Data yang digunakan adalah dataidentitas mahasiswa Teknik Informatika S-1 dan data kartu rencana studi (krs) perkuliahantahun ajaran 2005/2006 sampai dengan tahun ajaran 2010/2011, semester 1 – 8 di UDINUS 2. Algoritma yang digunakan adalah algoritma C4.5 (decision tree). 3. Perangkat lunak untuk data mining yang digunakan adalah MatLab.
1.6 Kontribusi Penelitian Bagi Ilmu Komputer: -
Penelitian ini dapat digunakan sebagai referensi bagi peneliti lain di bidang Education Data Mining (EDM) yang relatif baru.
BagiPerguruan Tinggi: -
Mendapatkan pengetahuan (knowledge)yang dapat digunakan sebagai suatu rekomendasi kepada universitas dalam membuat kebijakan dan langkah-langkah strategis dalam upaya pengawalan kululusan mahasiswa. 4
BAB 2. STUDI PUSTAKA 2.1Educational Data Mining (EDM) Penerapan metode data miningdalam menganalisis data yang tersedia di lembaga pendidikan didefinisikan sebagai Educational Data Mining (EDM)(Romero & Ventura, 2007).Data mining merupakan suatu cara dalam penggalian informasi dari sejumlah data yang biasanya tersimpan dalam repositori dengan menggunakan teknologi pengenalan pola, statistik dan teknik matematika(Larose, 2006). Penggunaan data mining telah muncul untuk diterapkan di berbagai bidang, baik dari bidang akademis, bisnis ataupun kegiatan medis pada khususnya(Gurunescu, 2011). Secara umum, data mining dikenal dengan proses penggalian data. Data mining diperlukan untuk mengungkapkan informasi yang tersembunyi, dimana adanya
keterbatasan
kemampuan
analisis
manusia
dan
cara
tradisional
yang
dilakukan(Gurunescu, 2011). Tekanan adanya metode baru ini muncul, seiring dengan berkembangnya ilmu komputer dan kemampuan komputasi.Data mining juga dikenal sebagai "knowledgediscovery
in
databases"(KDD), memiliki
tiga akar generik
meliputi(Gurunescu, 2011): 1. Statistik Merupakan akar tertua, tanpa adanya statistik data mining tidak akan pernah ada. Pada statistik terdapat teknik analisis yaitu Exploratory Data Analysis (EDA)yang digunakan untuk mengidentifikasi hubungan antara variabel yang berbeda. Teknik EDA pada data mining bisa disebutkan dengan:
Metode Komputasi (computational methods) yaitu dengan adanya parameter statistik klasik meliputi means, median, standar deviasi, dan lain-lain. Teknik eksplorasi multivariant (analisis klaster, faktor analisis, analisis komponen utama dan klasifikasi,analisis diskriminan, pohon klasifikasi, analisis korespondensi), advanced linear / non linier models (linear / non-linear regresi, time series / peramalan dan lainlain).
Visualisasi Data (Data Visualization) bertujuan untuk mewakili informasi dalam bentuk visual. Di antara teknik-teknik visualisasi yang paling umum, dapat ditemukan: histogram dari segala jenis (kolom, silinder, kerucut, piramida, pie, bar, dan lain-lain), kotak plot, scatter plot, plot kontur, plot matriks.
2. Kecerdasan Buatan (Artificial Intelligence)
5
Kecerdasan Buatan memberikan kontribusi dengan teknik pengolahaninformasi yang mendasarkan pada penalaran model manusia terhadap pengembangan data mining. Terkait dengan Kecerdasan Buatan, Machine Learning (ML) merupakan disiplin ilmu yang sangat penting dalam pembangunan data mining. ML menggunakan teknik yang memungkinkan mesin dalam hal ini komputer untuk belajar melalui suatu proses training ataupelatihan. Dalam konteks ini, dapat dipertimbangkan pula Natural Computing (NC) sebagai akar tambahan yang kuat untuk data mining.
3. Sistem Basis Data (Database Systems) Dianggap
sebagai
akar
ketiga
pada
data
mining,
menyediakan
informasi yang akan 'ditambang' menggunakan metode-metode yang disebutkan di atas.
Artificial Intelligence Machine Learning
Statistics Natural Computing
DATA MINING
Database Systems
Gambar 1Data Mining Roots Keperluan akandata mining dapat terlihat pada area atau sektor kehidupan nyata yang membutuhkan teknik-teknik investigasi tersebut yaitu:
Ekonomi (Bisnis-Keuangan) Ada sejumlah besar data yang telah dikumpulkan di berbagai bidang seperti: data web, e-commerce, super / hypermarket data, keuangan dan transaksi perbankan, dll, siap untuk dianalisis dalam rangka mengambil keputusan yang optimal.
Perawatan Kesehatan
6
Saat ini terdapat banyak database dalam perawatan kesehatan baik dari medis maupun dari farmasi. Namun sebagian hanya dianalisis, terutama dengan adanya alat medis tertentu yang berisi informasi yang besar namun tidak cukup dieksplorasi.
Penelitian Ilmiah Ada database besar dikumpulkan selama bertahun-tahun di berbagai bidang baik pada astronomi, meteorologi, biologi, linguistik, dan lain-ainl yang tidak dapat dieksplorasi dengan cara tradisional.
Proses ‘penambangan data’ dapat diidentifikasi dengan tiga langkah karekteristik dari proses data mining yang meliputi(Gurunescu, 2011): 1. Eksplorasi Data (Exploring data) Penjelajahan data yang terdiri dari cleaning atau pembersihan data, transformasi data, dimensi pengurangan, seleksi fitur subset dan lain-lain. 2. Membangun Model dan Melakukan Validasi (Building the model and its validation) Membangun modeldan melakukan validasi yang mengacu pada analisis dari berbagai modeldan memilih yang memiliki kinerja terbaik dari perkiraan model evaluasi yang kompetitif. 3. Menerapkan (Applying) Menerapkan model data baru untuk menghasilkan perkiraan yang benar/perkiraan untuk masalah yang diselidiki.
Data mining dapat digunakan untuk menyelesaikan tugas – tugas yang paling umum, berhubungan dengan tugas seperti (Larose, 2006): 1. Description (Deskripsi) Hasil dari data mining dapat menjelaskan pola yang ditemukan dengan jelas yang mengarah pada suatu hasil yang transparan dengan berbagai metode yang dapat digunakan. 2. Estimation (Estimasi) Model yang dibagun menggunakan catatan lengkap yang memberikan nilai dari variabel sasaran serta prediktornya.Ketika ada pengamatan baru, perkiraan dari nilai variabel target yang dibuat didasarkan pada nilai-nilai prediktornya. 3. Prediction (Peramalan) Prediksi mirip dengan klasifikasi dan estimasi, hal ini dapat dilihat dari metode dan teknik yang digunakan untuk klasifikasi dapat juga digunakan untuk memprediksi suatu keadaan dengan tepat. 7
4. Classification (Klasifikasi) Pada tugas klasifikasi ada variabel target yang dibuat kategoris, misalkan variabel pendapatan dapat dikategorikan menjadi tiga kelas: pendapatan tinggi, menengah dan rendah. Ketika ada data baru untuk mengklasifikasikan data tersebut masuk kategori yang mana. Maka dengan menggunakan algoritma akan memeriksa variabel prediktor kemudian menggolongkan data baru tersebut pada suatu klasifikasi. 5. Clustering (Pengelompokan) Clustering berbeda dengan klasifikasi, dimana clustering tidak punya tujuan untuk mengklasifikasi, estimasi, atau prediksi.Clustering mencoba untuk mengelompokkan segmen dari beberapa data yang memiliki suatu kesamaan / homogen. 6. Association (Asosiasi) Tugas asosiasi adalah menemunkan suatu pola dari hubungan beberapa variabel.Dalam dunia bisnis lazim dikenal dengan Market Based Analysis.Dengan aturan dari asosiasi yaitu “if antecedent, then consequent”.
2.2Algoritma C4.5 Pohon keputusan mirip sebuah sebuah struktur pohon dimana terdapat node internal (bukan daun) yang mendeskripsikan atribut-atribut, setiap cabang menggambarkan hasil dari atribut yang diuji, dan setiap daun menggambarkan kelas. Pohon keputusan bekerja mulai dari akar paling atas, jika diberikan sejumlah data uji, misalnya X dimana kelas dari data X belum diketahui, maka pohon keputusan akan menelusuri mulai dari akar sampai node dan setiap nilai dari atribut sesuai data X diuji apakah sesuai dengan aturan pohon keputusan, kemudian pohon keputusan akan memprediksi kelas dari tupel X (Firmansyah, 2011).
Gambar 2 Contoh konsep pohon keputusan untuk menentukan pembelian komputer berdasarkan atribut age, student dan credit rating. 8
Gambar 2 menggambarkan pohon keputusan untuk memprediksi apakahseseorang membeli komputer. Node internal disimbolkan dengan persegi, cabangdisimbolkan dengan garis, dan daun disimbolkan dengan oval. Algoritma C4.5 dan pohon keputusan merupakan dua model yang takterpisahkan, karena untuk membangun sebuah pohon keputusan, dibutuhanalgoritma C4.5. Di akhir tahun 1970 hingga di awal tahun 1980-an, J. RossQuinlan seorang peneliti di bidang mesin pembelajaran mengembangkan sebuahmodel pohon keputusan yang dinamakan ID3 (Iterative Dichotomiser), walaupunsebenarnya proyek ini telah dibuat sebelumnya oleh E.B. Hunt, J. Marin, dan P.T.Stone. Kemudian Quinlan membuat algoritma dari pengembangan ID3 yangdinamakan C4.5 yang berbasis supervised learning. Ada beberapa tahap dalam membuat sebuah pohon keputusan denganalgoritma C4.5 (Kusrini & Luthfi, 2009), yaitu : 1. Menyiapkan data training. Data training biasanya diambil dari data histori yangpernah terjadi sebelumnya dan sudah dikelompokkan ke dalam kelas-kelastertentu. 2. Menentukan akar dari pohon. Akar akan diambil dari atribut yangterpilih,dengan cara menghitung nilai Gain dari masing-masing atribut, nilaiGain yang paling tinggi yang akan menjadi akar pertama. Sebelum menghitungnilai Gain dari atribut, hitung dahulu nilai entropy yaitu : ( )=
−
∗ log
)
Keterangan : S : himpunan kasus n : jumlah partisi S pi: proporsi dari Si terhadap S 3. Kemudian hitung nilai Gain dengan metode information gain : ( , )=
( )−
| | ∗ | |
( )
Keterangan : S : himpunan kasus
|Si| : jumlah kasus pada partisi ke-i
A : atribut
|S| : jumlah kasus dalam S
n : jumlah partisi atribut A 4. Ulangi langkah ke-2 hingga semua tupel terpartisi. 5. Proses partisi pohon keputusan akan berhenti saat : 9
a. Semua tupel dalam node N mendapat kelas yang sama. b. Tidak ada atribut di dalam tupel yang dipartisi lagi. c. Tidak ada tupel di dalam cabang yang kosong. 2.3 Penelitian Serupa yang Pernah Dilakukan Sebelumnya Penelitian yang dilakukan dengan menggunakan pendekatan data mining untuk memprediksi kinerja siswa (student performance) telah dilakukan oleh peneliti-peneliti sebelumnya. Berikut merupakan beberapa penelitian terkait baik international maupun nasional yang pernah dilakukan, meliputi: Tahun 2012
Peneliti
Judul Penelitian
Publikasi
Surjeet Kumar
Data Mining A Prediction forPerformance
World of Computer
Yadav
Improvement ofEngineering Students
Science and Information
danSaurabh Pal
usingClassification
Technology Journal (WCSIT)
2012
Edin
Data Mining Approach For Predicting
Economic Review –
Osmanbegović
Student Performance
Journal of Economics
dan Mirza
and Business
Suljić 2013
2010
Dorina
Predicting Student Performance by
Cybernetics And
Kabakchieva
Using Data Mining Methods for
Information
Classification
Technologies
Diana Laily
Sistem Pendukung Keputusan Untuk
Prosiding SNATIF Ke-1
Fithri dan Eko
Memprediksi KelulusanMahasiswa
Tahun 2014
Darmanto
Menggunakan Metode Naïve Bayes
10
BAB 3. METODE PENELITIAN 3.1 Metode Penelitian Metode penelitian yang dilakukan adalah metode penelitian eksperimen dengan tahapan penelitian sebagai berikut(Santoso, 2007):
PENGUMPULAN DATA Data yang dikumpulkan adalah data identitas mahasiswa dan data KRS Teknik Informatika S-1 Semester 1-8 Tahun Ajaran 2005/2006 s.d 2010/2011 UDINUS
PENGOLAHAN AWAL DATA Data yang didapatkan selanjutnya diolah (preprocessing) dengan penerapan data integrasi dan data reduction
MODEL/METODE YANG DIUSULKAN Metode menggunakan Decission Tree dengan Algoritma C4.5
EKSPERIMEN DAN PENGUJIAN MODEL Pengujian dilakukan dengan menggunakan sebagian data untuk training dansebagian lagi digunakan sebagai data testing
EVALUASI DAN VALIDASI HASIL Evaluasi dilakukan dengan mengamati hasil prediksi menggunakan Algoritma C4.5 danvalidasi dilakukan dengan mengukur hasil prediksi dibandingkan dengan data asal
3.2 Metode Pengumpulan Data Data yang digunakan dalam penelitian ini berupa data identitas mahasiswa dan kartu rencana studi (krs) mahasiswa Teknik Informatika S-1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang.Data diambil dari tahun ajaran 2005/2006 sampai dengan tahun ajaran 2010/2011. Data tersebut sengaja penulis ambil lima tahun sebelum tahun sekarang, karena untuk bisa memprediksi masa studi mahasiswa yang disesuaikan masa studi secara umum mahasiswa Strata-1 (S-1) yaitu selama 8 semester (4 tahun). 11
3.3Metode Pengolahan Awal Data Pengolahanawal data diperlukan untuk proses penyederhanaan data agar data tersebut dapat dikenali dan digunakan dalam algoritma yang diusulkan. Proses pengolahan awal data tersebut adalah: 1. Data integrasi yaitu menyatukan tempat penyimpanan. Data identitas dan krs mahasiswa yang diperoleh disatukan dalam satu media penyimpanan. 2. Data reduction yaitu untuk memperoleh data yang mempunyai atribut dan record yang lebih sedikit dengan cara mengurangirecord yang tidak diperlukan atau yang tidak terisi. 3.4 Metode yang Diusulkan Metode yang diusulkan dalam penelitian ini adalahDecision Treealgoritma C4.5 untuk memprediksi masa studi mahasiswa Teknik Informatika S-1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang.
3.5 Eksperimen dan Pengujian Model Tahapan eksperimen pada penelitian ini adalah: 1. Menyiapkan data untuk melakukan eksperimen 2. Preprocessing data dengan mereduksi data – data yang kosong 3. Eksperimen menggunakan metode C4.5 dengan MatLab 4. Menghitung akurasi dari penggunaan metode C4.5 5. Menganalisa hasil dari penggunaan metode C4.5 3.6 Evaluasi dan Validasi Pengujian terhadap model klasifikasi yang dihasilkan akan diukur dengan menggunakan confussion matrix. Confussion matrix merupakan alat ukur yang digunakan untuk mengukur performa klasifikasi. Dalam hal ini akan digunakan confussion matrix dua kelas sebagai berikut: Tabel 1Confussion Matrix Kelas Prediksi
Kelas Aktual
Kelas Tepat
Kelas Tidak Tepat
Waktu
Waktu
Kelas tepat waktu
TP (True Positive)
FN (False Negative)
Kelas tidak tepat waktu
FP(False Positive)
TN (True negative)
12
Matriks baris pertama menunjukkan data – data mahasiswa yang berada di kelas tepat waktu, di mana data yang diklasifikasikan dengan benar sejumlah TP dan jumlah data yang salah diklasifikasikan sebagai kelas tidak tepat waktu sejumlah FN. Matriks baris kedua menunjukkan data – data mahasiswa yang berada di kelas tidak tepat waktu, di mana data yang diklasifikasikan benar sejumlah TN dan jumlah data yang salah diklasifikasikan sebagai kelas tepat waktu sejumlah FP. Dari confussion matrix tersebut akan dilakukan pengukuran tentang akurasi, presisi dan recall dari model yang dihasilkan. Selanjutnya untuk dianalisa dari pengukuran tersebut.
3.7 Kerangka Pemikiran
Rumusan Masalah Sulitnya memahami dan menemukan pola studi mahasiswa terhadap atribut data mahasiswa dan data perkuliahan yang berpengaruh pada masa studi mahasiswa dalam jumlah data yang besar.
Pendekatan Data Mining dengan algoritma C4.5
Implementasi Menggunakan software MatLab untuk melakukan pekerjaan klasifikasi dan prediksi masa studi mahasiswa berdasarkan data identitas mahasiswa dan data krs
Pengukuran Menggunakan Confussion matrix untuk mendapatkan nilai akurasi dari algoritma C4.5
13
BAB 4. BIAYA DAN JADWAL PENELITIAN 4.1 Biaya Penelitian Untuk melakukan kegiatan-kegiatan dalam penelitian ini diperlukan anggaran dana untuk menunjang jalannyakegiatan tersebut. Berikut merupakan anggaran biaya secara global yang diusulkan pada penelitian ini:
No
Jenis Pengeluaran
Presentase
Biaya yang diusulkan (Rp)
1
Gaji dan Upah
30%
3.456.000
2
Bahan habis pakai dan peralatan
52%
6.044.000
3
Perjalanan
11%
1.300.000
4
Lain-lain
7%
800.000
100%
Jumlah
11.600.000,-
4.2 Jadwal Penelitian No
1 2 3
4 5 6 7
Tahap Penelitian
1
2
3
Identifikasi Masalah dan Studi Literatur Pengumpulan Data Pengolahan Awal Data a. Data Integrasi b. Data Reduction Pengusulan Metode/Model Eksperimen dan Pengujian Evaluasi dan Validasi Publikasi Hasil dan Penulisan Laporan
14
4
5
Tahun 1 6 7 8
9
10 11
12
DAFTAR PUSTAKA Abu Tair, M. M., & Al-Helees, A. M. (2012). Mining Educational Data to Improve Students’ Performance: A Case Study. International Journal of Information and Communication Technology Research, 2. Baker, R. (2010). Data Mining for Education (3rd Edition ed.). UK: Elsevier. Firmansyah. (2011). Penerapan Algoritma Klasifikasi C4.5 Untuk Penentuan Kelayakan Pemberian Kredit Koperasi. Gurunescu, F. (2011). Data Mining Consepts, Models and Techniques (Volume 12 ed.). Verlag Berlin Heidelberg, Germany: Springer. Kabakchieva, D. (2013). Predicting Student Performance by Using Data Mining. Cybernetics and Information Technologies . Kusrini, & Luthfi. (2009). Algoritma Data Mining. Yogyakarta: Andi Publishing. Larose, D. T. (2006). Data Mining Methods and Models. Hoboken, New Jersey, United State of America: John Wiley & Sons, Inc. Osmanbegovic, E., & Suljic, M. (2012). Data Mining Approach For Predicting Student Performance. Journal of Economics and Business, X (1). Romero, C., & Ventura, S. (2007). Educational Data Mining: A Review of the Stateof-the-Art. IEEE Transactions On Systems, Man, And Cybernatics . Santoso, B. (2007). Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu. Suhartinah, M. S., & Ernastuti. (2010). Graduation Prediction Of Gunadarma University Students Using C4.5 Algorithm And Naive Bayes Algorithm. Yadav, S. K., & Pal, S. (2012). Data Mining A Prediction for Performance Improvement of Engineering Students using Classification. World of Computer Science and Information Technology Journal (WCSIT), 2, 51-56.
15
LAMPIRAN-LAMPIRAN Lampiran 1. Anggaran Penelitian 1. Honor Honor
Honor/ Jam (Rp)
Waktu (Jam/Minggu)
Minggu
Honor per Tahun
Ketua
19.000,-
2 jam
32 minggu
1.216.000
Anggota 1
17.500,-
2 jam
32 minggu
1.120.000
Anggota 2
17.500,-
2 jam
32 minggu
1.120.000
Sub Total (Rp)
3.456.000
Harga total Peralatan (Rp) 873.000,-
2. Peralatan Penunjang Material
Justifikasi
Jumlah
Harddisk External 1 Tb
Pengambilan data mahasiswa dan data akademik lima tahun
1 buah
Harga Satuan (Rp) 873.000,-
Flash disk 16 GB
Perpindahan data
2 buah
55.000,-
110.000,-
Log Book
Mencatat eksperimen dan diskusi
2 buah
45.000,-
90.000,-
Soddim Memory 4 GB
Peningkatan pengolahan data dan hasil eksperimen komputasi
1 buah
400.000,-
400.000,-
Modem USB
Akses Internet di Luar Kantor
1 buah
300.000,-
300.000,-
Folder File
Penyimpanan berkas-berkas penting
3 buah
45.000,-
135.000,-
Stopmap
Manajemen berkas-berkas file
5 buah
10.000,-
50.000,-
Sub Total (Rp)
1.958.000
3. Bahan Habis pakai Material
Justifikasi
Jumlah
16
Harga Satuan (Rp)
Harga total Peralatan (Rp)
Catridge printer hitam
Mencetak laporan dan dokumentasi
2 buah
180.000,-
360.000,-
Catridge printer warna
Mencetak laporan dan dokumentasi
1 buah
200.000,-
200.000,-
Kertas A4 80gram
Mencetak laporan dan dokumentasi
3 rim
40.000,-
120.000,-
Jilid Laporan
Menjilid Laporan penelitian
6 buah
20.000,-
120.000,-
Pulsa Internet
Akses internet di luar kantor
8 bulan x 3 orang
52.000,-
1.248.000,-
Materai
Pengesahan Laporan
10 Lembar
7.000,-
70.000,-
Konsumsi
Koordinasi dan komunikasi
8 bulan x 3 orang
30.000,-
720.000,-
Pulsa HP
Koordinasi dan komunikasi
8 bulan x 3 orang
52.000,-
1.248.000,-
Sub Total (Rp)
4.086.000
4. Perjalanan Kegiatan
Justifikasi
Perjalanan publikasi
Tranportasi publikasi (pulang pergi)
Perjalanan dalam kota
Transportasi kegiatan sehari-hari
Jumlah
Harga Satuan (Rp)
Harga total Peralatan (Rp)
2 x 1 orang
200.000,-
400.000,-
3 orang
300.000,-
900.000,-
Sub Total (Rp)
1.300.000,-
5. Lain-lain Kegiatan Seminar nasional
Keterangan Publikasi hasil penelitian
Jumlah 1 kali
Harga Satuan (Rp)
Harga total Peralatan (Rp)
800.000,-
800.000,-
Sub Total (Rp)
800.000,-
TOTAL ANGGARAN YANG DIPERLUKAN SELURUH TAHUN (Rp)
11.600.000,-
17
Lampiran 2. Susunan Organisasi Tim Peneliti dan Pembagian Tugas No
Nama
Instansi
Alokasi Waktu
Bidang Ilmu
(jam/minggu)
Uraian Tugas
1
Defri Kurniawan
UDINUS
Teknik Informatika
3
Ketua Penelitian dan pengembang aplikasi
2
Wibowo Wicaksono
UDINUS
Teknik Informatika
3
Dokumentasi dan kolektor data
3
Yani Parti Astuti
UDINUS
Teknik Informatika
3
Penguji dan validasi model
18
Lampiran 3. Susunan Organisasi Tim Peneliti dan Pembagian Tugas Biodata Ketua Peneliti A. Identitas Diri 1
Nama Lengkap (dengan gelar)
Defri Kurniawan, M.Kom
2
Jenis Kelamin
L
3
Jabatan Fungsional
-
4
NIP/NIK/No. Identitas Lainnya
0686.11.2013.536
5
NIDN
0613128502
6
Tempat dan Tanggal Lahir
Semarang, 13Desember 1985
7
E-mail
[email protected]
8
Nomor Telepon / HP
085641417048
9
Alamat Kantor
Jl. Nakula I 1-5 Semarang
10 Nomor Telepon/Faks
(024) 70793727 / (024) 3547038
11 Lulusan yang Telah Dihasilkan
-
12 Mata Kuliah yang Diampu
1. 2. 3. 4. 5. 6.
Rekayasa Perangkat Lunak Rekayasa Perangkat Lunak Lanjut Object Oriented Analisa dan Desain Sistem Informasi Sistem Operasi Pengantar Teknologi Informasi
B. Riwayat Pendidikan S-1
S-2
Nama Perguruan Tinggi
UDINUS
UDINUS
Bidang Ilmu
Teknik Informatika
Teknik Informatika
Tahun Masuk-Lulus
2004-2009
2009-2012
JudulSkripsi/Thesis/Disertasi
Penerapan Metode Waterwall dalam Membangun Multimedia Pembelajaran Kelas III SMA IPA di Dipo Solution Semarang
Optimasi Algortima Support Vector Machine Menggunakan AdaBoost Untuk Penilaian Resiko Kredit
Nama Pembimbing/Promotor
Kharis Widiyatmoko, M.Kom
Dr. Abdul Syukur Catur Supriyanto, M.Cs
19
S-3
C. Pengalaman Penelitian Dalam 5 Tahun Terakhir Pendanaan No. -
Tahun -
Judul Penelitian
Sumber*
-
Jml (Juta Rp)
-
-
D. Pengalaman Pengabdian Kepada Masyarakat dalam 5 Tahun Terakhir Pendanaan No.
Tahun
Judul Pengabdian Kepada Masyarakat
Sumber*
Jml (Juta Rp)
E. Publikasi Artikel Ilmiah Dalam Jurnal alam 5 Tahun Terakhir No. 1
Judul Artikel Ilmiah
Volume/ Nomor/Tahun
Nama Jurnal
Optimasi Algortima Support Vector Machine Menggunakan AdaBoost Untuk Penilaian Resiko Kredit
Jurnal Teknologi Informasi
Vol 9/No 1/2013
F. Pemakalah Seminar Ilmiah (Oral Presentation) dalam 5 Tahun Terakhir No
Nama Pertemuan
Judul Artikel Ilmiah
Waktu dan Tempat
-
-
Seminar internasional -
-
Seminar nasional
G. Karya Buku Dalam 5 Tahun Terakhir No
Judul Buku
Tahun
20
Jumlah
Penerbit
21
Biodata Anggota Tim Peneliti A. Identitas Diri 1
Nama Lengkap (dengan gelar)
Wibowo Wicaksono, ST., M.Kom
2
Jenis Kelamin
L
3
Jabatan Fungsional
AsistenAhli
4
NPP
0686.11.2013.531
5
NIDN
0629107603
6
Tempat dan Tanggal Lahir
Semarang, 29 Oktober 1976
7
Alamat Rumah
Jl. Borobudur Selatan Rt.07 Rw.08 No. 39 Semarang
8
Nomor Telepon/Faks/ HP
08122842434
9
Alamat Kantor
Jl. Nakula I No. 5-11 Semarang
10
Nomor Telepon/Faks
024-3569684
11
Alamat e-mail
[email protected]
12
Lulusan yang Telah Dihasilkan
S-1 = 10 orang
13
Mata Kuliah yang Diampu
1. SistemOperasi 2. Organisasi dan Arsitektur Komputer 3. Sistem Terdistribusi 4. Pengolahan Citra Digital 5. Strategi Algoritma 6. Sistem Basis Data
B. Riwayat Pendidikan S1
S2
Nama Perguruan Tinggi
UniversitasIslam Indonesia
Universitas Gadjah Mada
Bidang ilmu
Teknik Sipil
Ilmu Komputer
Tahun Masuk – Lulus
1995 – 2002
2003 – 2006
Judul Skirpsi / Thesis
Perilaku Komponen Struktur Aplikasi Pengolahan Citra Lantai Balok T Komposit Kayu- Digital untuk Identifikasi Beton Biometrik Sidik Jari dengan Metode Fraktal
Nama Pembimbing
Ir. H. Susastrawan, MS. Ir. Fatkhurrohman N., MT.
22
Drs. Agus Harjoko, M.Sc., Ph.D
C. Pengalaman Penelitian Dalam 5 Tahun Terakhir Pendanaan Sumber Jumlah (Juta Rp)
No
Tahun
Judul
1
2002
Perilaku Komponen Struktur Lantai Balok T Komposit Kayu-Beton
Skripsi S1
-
2
2006
Aplikasi Pengolahan Citra Digital untuk Identifikasi Biometrik Sidik Jari dengan Metode Fraktal
Thesis S2
-
D. Pengalaman Pengabdian Masyarakat Dalam 5 Tahun Terakhir Pendanaan Sumber Jumlah (Rp)
No
Tahun
Judul
1
2009
Pelatihan Operator Komputer On Line Siaga SAT BRIMOBDA JATENG.
STMIK Himsya
1.000.000
2
2010
Pelatihan Dasar Aplikasi Office untuk Mendukung Proses Belajar Mengajar Bagi Guru-Guru SMP & SMA Tarakan Kalimantan Timur
STMIK Himsya
1.000.000
E. Pengalaman Menulis Artikel Ilmiah Dalam 5 Tahun Terakhir No
Judul Artikel
Volume / Nomor /
Nama Jurnal
Tahun 1
Keamanan Data Teks Dengan Algoritma Enkripsi Playfair
Vol. 2 No. 3 Januari 2006, ISSN: 19072074
Teknologi Informasi HIMSYATECH
2
Identifikasi Biometrik Sidik Jari Dengan Pendekatan Karakteristik Fraktal (Fingerprint Biometric Identification with Approach of Characteristic of Fractal)
Vol. 2 No. 4 Juni 2006, ISSN: 19072074
Teknologi Informasi HIMSYATECH
3
Pengolahan Citra Digital Untuk Menentukan Intensitas Citra Awan Berdasarkan Indeks Warnanya
Vol. 3 No. 6 Juni 2007, ISSN: 19072074
Teknologi Informasi HIMSYATECH
4
Pengantar Sistem Pakar
Vol. 4 No. 8 Juni 2008, ISSN: 19072074
Teknologi Informasi HIMSYATECH
5
Implementasi Sistem Scanner & ICR untuk Merekam Secara Digital Berkas Hasil Pemilu
Vol. 5 No. 10 Juni 2009, ISSN: 19072074
Teknologi Informasi HIMSYATECH
23
F. PengalamanPenyampaianMakalahSecara Ilmiahdalam 5 TahunTerakhir No Nama PertemuanIlmiah
Oral
PadaPertemuan
Judul Artikel Ilmiah
/
Seminar
Waktu dan Tempat
/ Seminar Seminar internasional -
-
-
-
-
-
Seminar nasional -
-
G. Karya Buku Dalam 5 Tahun Terakhir
No
Judul Buku
Tahun
Jumlah
Penerbit
H. Perolehan HKI Dalam 5 – 10 Tahun Terakhir No.
Judul/Tema HKI
Tahun Jenis
Nomor P/ID
-
-
-
-
-
I. Pengalaman Merumuskan Kebijakan Publik/Rekayasa Sosial Lainnya Dalam 5 Tahun Terakhir No. -
Judul/Tema/Jenis Rekayasa Sosial Lainnya yang Tahun Tempat Respon Telah Diterapkan Penerapan Masyarakat -
24
25
Biodata Anggota Tim Peneliti
A. Identitas Diri 1
Nama Lengkap (dengan gelar)
Yani Parti Astuti, S.Si
2
Jenis Kelamin
Perempuan
3
Jabatan Fungsional
-
4
NPP
0686.11.2013.532
5
NIDN
0606107401
6
Tempat dan Tanggal Lahir
Madiun, 06 Oktober 1974
7
Alamat Rumah
Perum Kandri Pesona Asri F2 no 3 RT 04 RW 04 Kelurahan Kandri kecamatan Gunungpati Semarang
8
Nomor Telepon/Faks/ HP
024-76916136 / 082133258726
9
Alamat Kantor
Jl. Nakula I No. 5-11 Semarang
10
Nomor Telepon/Faks
024-3517261/024-3569684
11
Alamat e-mail
[email protected]
13
Mata Kuliah yang Diampu
1. Kalkulus I / II 2. Matematika Diskrit 3. Vektor dan Matriks Transformasi 4. Manajemen Sains 5. Statistika dan Probabilitas 6. Logika Informatika
B. Riwayat Pendidikan S1
S2
Nama Perguruan Tinggi
UniversitasDiponegoro Semarang
Universitas Dian Nuswantoro (on going)
Bidang ilmu
Matematika FMIPA
Teknik Informatika
Tahun Masuk – Lulus
1992-1998
2013 – 2015
Judul Skirpsi / Thesis
Algoritma
Matching
Bobot
Model Prediksi Calon Nasabah dengan
Maksimum dalam Graph Bipartit Pemasaran Langsung Menggunakan Komplit Berbobot
Algoritma Naïve Bayes Berbasis Forward Selection
Pembimbing
Drs. Djuwandi, SU
Heru Agus Santoso, P.hD
Dra Widowati
Catur Supriyanto, M.CS
26
C. Pengalaman Penelitian Dalam 5 Tahun Terakhir No
Tahun
-
-
Pendanaan Sumber Jumlah (Juta Rp)
Judul -
-
-
D. Pengalaman Pengabdian Masyarakat Dalam 5 Tahun Terakhir Pendanaan No
Tahun
Judul
Sumber
Jumlah (Juta Rp)
1
2014
Pelatihan Pembelajaran Matematika bagi Siswa SMP Udinus Kartini Semarang untuk Persiapan Ujian Nasional 2014
2,7
E. Publikasi Artikel Ilmiah Dalam Jurnal alam 5 Tahun Terakhir No.
Judul Artikel Ilmiah
Volume/ Nomor/Tahun
Nama Jurnal
F. Pemakalah Seminar Ilmiah (Oral Presentation) dalam 5 Tahun Terakhir
No
Nama Pertemuan
Judul Artikel Ilmiah
Waktu dan Tempat
-
-
Seminar internasional -
-
Seminar nasional
G. Karya Buku Dalam 5 Tahun Terakhir
No
Judul Buku
Tahun
27
Jumlah
Penerbit
28
29
30