PREDIKSI NILAI MATA KULIAH BERDASARKAN NILAI PRASYARAT MENGGUNAKAN METODE SUPPORT VECTOR REGRESSION M RIZAL SYAH KARIM (NRP : 5110100138)
DOSEN PEMBIMBING : DR. TECH. IR. R. V. HARI GINARDI, M.SC DR. CHASTINE FATICHAH S.KOM., M.KOM
LATAR BELAKANG Database
pendidikan meningkat dengan pesat dan mengandung informasi penting untuk peningkatan performa siswa/mahasiswa. Mengusulkan metode Support Vector Regression (SVR) untuk mengetahui informasi penting dari data nilai prasyarat mahasiswa. Prediksi ini membantu dosen maupun mahasiswa untuk mendapatkan nilai yang lebih baik.
TUJUAN
Menerapkan
metode Support Vector Regression untuk memprediksi Nilai mata kuliah berdasarkan Nilai mata kuliah prasyarat
Analisa hubungan antara nilai mata kuliah
prasyarat dengan nilai mata kuliah yang diprasyarati
Metodologi
Pengumpulan dataset
Preposesing Data
Penerapan algoritma
Evaluasi
MATA KULIAH PRASYARAT Mata kuliah prasyarat adalah mata kuliah yang merupakan
persyaratan untuk suatu mata kuliah yang diprasyarati
Contoh Mata Kuliah Prasyarat
SUPPORT VECTOR REGRESSION (SVR) SVR merupakan pengembangan dari SVM untuk melakukan
regresi untuk memprediksi nilai keluaran dari suatu masukan Tujuan SVR adalah mencari fungsi regresi
f(x) = <w , x> + b
Yang memiliki deviasi yang besar pada rentang Ɛ sedemikian hingga mampu memprediksi nilai aktual y untuk semua data latih. Selain deviasi, SVR mencari persamaan regresi yang sedatar
mungkin, fungsi regresi yang mendekati nilai sebenarnya
KONSEP SUPPORT VECTOR REGRESSION
Konsep Support Vector Regression
KORELASI Analisis korelasi dimaksudkan untuk mengetahui
seberapa kuatkah hubungan antara satu atau beberapa variabel dengan suatu variabel lain. Nilai korelasi (r ) diukur dari korelasi Pearson untuk
2 buah variabel X dan Y dengan jumlah data sebesar N dirumuskan pada persamaan sebagai berikut
INTERPRETASI KORELASI Tabel Interpretasi korelasi Nilai Korelasi Sampel
Interpretasinya
0,00 – 0,20
Hubungan korelasinya diabaikan
0,20 – 0,40
Hubungan korelasinya rendah
0,40 – 0,70
Hubungan korelasinya sedang
0,70 – 0,90
Hubungan korelasinya kuat
> 0,90
Hubungan korelasinya sangat kuat
9
DATA Data didapatkan dari sim akademik (integra) nilai
mahasiswa Teknik Informatika angkatan 2009 – 2012 Data berupa data nilai persiswa dengan skala huruf
E – A. Nilai ini akan diubah skalanya menjadi 1 – 7 untuk memudahkan perhitungan Error. Akan
digunakan prasyarat.
beberapa
kombinasi
pohon
DATA YANG DIGUNAKAN Tabel data yang digunakan Nama Dataset
Prasyarat
Prediksi
Jumlah record
Dataset 1
STI, Basdat, BDL, PAAL, Data Mining
Data Warehouse
69
Dataset 2
Sisdig, Orkom, Sisop, Jarkom
PMJ
48
Dataset 3
ASD, Grafkom, Jarkom
Jarmul
106
Dataset 4
Sisdig, Orkom
Sisop
620
Dataset 5
RPL
APS
441 11
SEBARAN DATA BOXPLOT (DATASET 2) 7
6
5
4
3
2
1 Sisdig
Orkom
Sisop
Jarkom
PMJ
DATA REAL (DATASET 2)
SKENARIO UJICOBA Dari masing-masing dataset, digunakan 70% sebagai
data latih dan 30% sebagai data uji. Algoritma Latih yang digunakan adalah support vector
regression diuji pada semua kernel dan parameter latih c = 1 dan Ɛ = 0,001 Pengukuran error : MSE (Mean Square Error) :
HASIL UJICOBA
HASIL UJICOBA 1 (1) Tabel hasil ujicoba dataset mahasiswa pada semua kernel Nama Dataset
Linier
Polynomial
RBF
Sigmoid
Dataset 1
0.205
0.8
0.212
0.37
Dataset 2
0.5
1.24
0.32
0.45
Dataset 3
0.35
1.24
0.36
0.6
Dataset 4
0.92
0.91
0.98
1.04
Dataset 5
1.12
1.09
1.069
1.05
Rata-rata
0.61
1.05
0.58
0.70 16
HASIL UJICOBA 1 (2) Tabel hasil ujicoba dataset mahasiswa dengan nilai MSE terbaik Nama Dataset
Jumlah feature
Jumlah record
MSE terbaik
Dataset 1
5
76
0.205
Dataset 2
4
64
0.32
Dataset 3
3
110
0.35
Dataset 4
2
674
0.91
Dataset 5
1
441
1.05
17
ANALISIS HASIL UJICOBA
Grafik hubungan antara jumlah MK Prasyarat dengan nilai MSE
HASIL UJICOBA 2 Tabel hasil ujicoba korelasi Nama Dataset
MSE terbaik
Nilai Korelasi
Dataset 1
0.205
0.53
Dataset 2
0.32
0.36
Dataset 3
0.35
0.32
Dataset 4
0.91
0.26
Dataset 5
1.05
0.22 19
Rata-rata
0.56
0.34
ANALISIS HASIL UJICOBA (2)
Grafik hubungan antara korelasi dengan nilai MSE
KESIMPULAN Kernel RBF menghasilkan rata-rata nilai MSE terbaik dari semua kernel
yaitu 0,58 Dari hasil ujicoba, hubungan antara nilai prasyarat dengan nilai yang
diprasyarati adalah mempunyai korelasi meskipun rendah yakni sebesar 0,34 Semakin besar nilai korelasi, maka semakin kecil nilai MSE pada hasil
prediksi. Jumlah atribut prediktor (dalam hal ini jumlah mata kuliah prasyarat) yang
lebih banyak menghasilkan hasil prediksi yang lebih baik Persebaran data yang kurang baik dapat menyebabkan kesalahan hasil
prediksi yang cukup tinggi
TERIMA KASIH