Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016
ISSN : 2503-2844
ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE BACKPROPAGATION Muhammad Rafi Muttaqin Program Studi Teknik Informatika STT Wastukancana Jl. Raya Cikopak No.53, Sadang, Purwakarta
[email protected]
Abstrak Sekolah Tinggi Teknologi (STT) Wastukancana melaksanakan proses seleksi masuk pada calon mahasiswanya. Proses seleksi ini berdasarkan hasil ujian saringan masuk yang selalu diadakan setiap tahun. Salah satu syarat dokumen yang harus dilampirkan dalam pendaftaran adalah dokumen nilai Ujian Nasional (UN) yang terdiri dari nilai mata pelajaran Bahasa Indonesia, Bahasa Inggris, dan Matematika. Dari latar belakang tersebut, maka dibuat penelitian untuk mengetahui apakah nilai hasil ujian saringan masuk mempunyai korelasi atau hubungan dengan nilai UN yang didapatkan calon mahasiswa tesebut. Jika korelasi yang dihasilkan memiliki nilai yang tinggi, maka dapat diperkiran berapa nilai ujian saringan masuk berdaarkan nilai UN calon mahasiswa. Algoritma yang digunakan untuk penelitian ini adalah algoritma Backpropagation. Algoritma ini merupakan salah satu dari algoritma Jaringan Syaraf Tiruan (JST). Pembagian data latih dan data uji menggunakan metode k-fold cross validation. Hasil yang diperoleh dalam penelitian ini adalah nilai Root Mean Square Error (RMSE) yang terendah dan nilai akurasi yang tertinggi dihasilkan oleh kombinasi hidden layer 9 dan epoch 500 dengan rataan nilai RMSE sebesar 8,8 dan nilai akurasi sebesar 91,2. Kata kunci : Backpropagation, Validation, Epoch
K-fold
every year. One of the requirements document that must be attached to the application is a document of the National Examination (UN), which consists of the value of Indonesian Language, English, and Mathematics. From this background, it made a study to determine whether the value of the results of the entrance examination has a correlation or relationship with UN values obtained prospective student proficiency level. If the correlation is produced has a high value, it can been anticipated how much the value of the entrance examination based on the examination prospective students. The algorithm used for this study is the Backpropagation algorithm. This algorithm is one of the algorithms Artificial Neural Network (ANN). Sharing of training data and test data using methods k-fold cross validation. The results obtained in this study is the value Root Mean Square Error (RMSE) of the lowest and highest accuracy value generated by a combination of hidden layers 9 and epoch 500 with the average value of RMSE is 8.8 and accuracy value is 91.2. Keywords : Backpropagation, Validation, Epoch
K-fold
Cross
I. PENDAHULUAN
Cross
Abstract Sekolah Tinggi Teknologi (STT) Wastukancana implement the admission process to potential students. The selection process is based on the results of the entrance examination which is always held
Proses ujian masuk setiap tahun ajaran baru menjadi agenda rutin pada Sekolah Tinggi Teknik Wastukanacana. Ujian masuk ini bertujuan untuk menyaring calon mahasiswa terbaik yang akan menempuh studi di STT Wastukancana. Setiap calon mahasiswa diwajibkan melampirkan nilai ujian nasional (UN) yang mereka tempuh untuk lulus 189
Muhammad Rafi Muttaqin Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016 sekolah menengah atas. Dengan demikian, data nilai UN dan hasil nilai ujian masuk STT tersedia setiap tahunnya. Dengan tersedianya data nilai UN dan hasil ujian masuk STT, maka dapat dibuat pemodelan untuk memprediksi nilai hasil ujian masuk berdasarkan nilai UN calon mahasiswa. Apakah nilai UN memiliki pengaruh yang cukup besar dalam menentukan hasil nilai ujian masuk STT. Metode yang digunakan untuk memprediksi nilai ujian dengan metode Jaringan Saraf Tiruan Propagasi Balik (Backpropagation). Data yang digunakan sebanyak 100 mahasiswa pada tahun masuk 2013 program studi Teknik Informatika. Pembagian data latih dan data uji menggunakan metode K-fold Cross Validation. Penelitian yang sejenis dilaksananakan oleh Yunanti (2010) untuk memprediksi prestasi siswa SMU dengan Metode Backpropagation. Yunanti (2010) memakai 50 data untuk dilatih menggunakan algoritma backpropagation dan untuk penelitian ini memakai 100 data calon mahasiswa untuk dilatih menggunakan algoritma tersebut. Hidden layer yang digunakan dalam penelitian terdahulu (Yunanti, 2010) menggunakan 1 buah hidden layer sedangkan dalam penelitian ini menggunakan kombinasi jumlah hidden layer sebanyak 3, 6, dan 9 buah.
ISSN : 2503-2844
II. KAJIAN LITERATUR II.1
Jaringan Saraf Backpropagation
Tiruam
(JST)
JST Propagasi balik merupakan JST yang mempunyai topologi multilayer (multi-lapis) dengan lapis input (lapis X) , satu atau lebih lapisan hidden (lapis Z) dan satu lapis output (lapis Y) (Siang, 2005). Setiap lapis memiliki neuron-neuron yang dimodelkan dengan lingkaran (lihat gambar 1). Di antara neuron pada satu lapis dengan neuron pada lapis berikutnya dihubungkan dengan koneksi yang memiliki bobot-bobot (weights), w dan v. Lapis tersembunyi dapat memiliki bias, yang memiliki bobot sama dengan satu. II.2
Algoritma Pelatihan JST Backpropagation
Algoritma pelatihan JST propagasi balik (backpropagation) pada dasarnya dapat dibagi menjadi dua langkah, yaitu: langkah maju (feedforward) dan propagasi balik (back propagation) (Siang, 2005). Pada langkah maju, perhitungan bobot-bobot neuron hanya didasarkan pada vektor masukan, sedangkan pada propagasi balik, bobot-bobot diperhalus dengan cara memperhitungkan nilai dari target atau keluaran. Algoritma ini dapat dilihat pada gambar 2.
Ruang lingkup penelitian ini adalah sebagai berikut : 1. Proses pelatihan untuk jaringan syaraf tiruan menggunakan metode backpropagation, 2. Data yang digunakan sebanyak 100 calon mahasiswa pada tahun masuk 2013, 3. Data yang dilatih dan diuji adalah data nilai UN sebagai masukan dan data hasil nilai ujian masuk sebagai hasil keluaran, 4. Pembagian data yang dilakukan menggunakan metode 5-fold cross validation. Hasil yang diperoleh merupakan Root Mean Square Error (RMSE) dan nilai akurasinya. Tujuan dari penelitian ini yaitu mendapatkan model terbaik yang dapat digunakan untuk memprediksi hasil nilai ujian masuk berdasarkan nilai UN. Sedangkan manfaat dari penelitian ini adalah dapat memprediksi nilai hasil ujian masuk berdasarkan nilai UN.
Gambar 1. Jaringan saraf tiruan Backpropagation dengan satu hidden layer (Mei-Ling, 2012)
190 Muhammad Rafi Muttaqin Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016 Narasi:Melatih JST dengan data pelatihan(berupa vektor atau record tabel) yang diberikan sampai bobot-bobot tidak berubah lagi (atau dicapai kondisi konvergen). Input : Set data pelatihan, jumlah lapis, jumlah neuron, learning rate, epsilon Output : Model JST yang siap untuk mengklasifikasi data (vektor) baru. Algoritma : (1) Menginisialisasi bobot awal dengan nilai acak yang sangat kecil, hitung MSE dan βMSE inisialisasi. (2) Selama βMSE > epsilon lakukan: (3) Untuk setiap tupple pada set data pelatihan lakukan Feedforward: (4) Setiap unit masukan (Xi, i=1β¦n) menerima vektor masukan Xi dan mengirimkan vektor ini ke seluruh unit pada lapis diatasnya (hidden layer). (5) Setiap unit hidden (zj, j=1β¦p) menjumlahkan bobot dari vektor masukan :z_inj = π£0π + βπ π=1 π₯π π£ππ Hitung keluaran fungsi aktivasi : zj = f(z_inj). Kirimkan vektor ini ke unit-unit pada lapis diatasnya (lapis keluaran) (6) Setiap unit keluaran (Yk, k=1β¦m) menjumlahkan vektor masukan π Y_ink = π€0π + βπ=1 π§π π€ππ
Hitung keluaran dari fungsi aktivasi :
yk = f(y_ink) Propagasi balik dari error: (7) Setiap unit keluaran (Yk, k=1β¦m) menerima vektor hasil yang diinginkan (tk) untuk data masukan tersebut, hitung errornya (π‘π β π¦π ): πΏπ = (π‘π β π¦π )π β² (y_ink) Hitung nilai koreksi bobotnya dengan Ξ± sebagai learning ratenya: βπ€ππ = πΌπΏπ π§π Hitung nilai koreksi biasnya: βπ€0π = πΌπΏπ Kirimkan πΏπ ke unit pada lapis dibawahnya. (8) Setiap unit hidden (Zj, j=1β¦p) menjumlahkan delta masukannya (dari unitunit pada lapis diatasnya): πΏ_πππ = βπ π=1 πΏπ π€ππ Kalikan dengan turunan dari fungsi aktivasinya untuk menghitung errornya: πΏπ = πΏ_πππ πβ²(π§_πππ ) Hitung nilai koreksi bobotnya: βπ£ππ = πΌπΏπ π₯π Hitung nilai koreksi biasnya:
II.3
ISSN : 2503-2844
K-fold Cross Validation
K-fold cross validation dilakukan untuk membagi training set dan test set. K-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang saling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan (Refaeilzadeh, Tang, & Liu, 2007). II.4
Root Mean Square Error (RMSE)
Root Mean Square Error (RMSE) adalah bertujuan untuk mempresentasikan rata-rata kuadrat simpangan (selisih) antara nilai keluaran model terhadap nilai pengukuran atau target.Untuk menilai ketepatan peramalan tersebut maka perlu diperbandingkan RMSE dengan peramalan lain yang memakai rata-rata berjalan dengan periode-periode berbeda (Shcherbakov et al, 2013). Rumus RMSE dapat dilihat pada rumus 1. β(ππ β π
π)π ππππ = β π§
β¦ [1]
Keterangan : RMSE : Root Mean Square Error At : aktual Ft : hasil prediksi / forecast
III. METODOLOGI PENELITIAN Metodologi yang digunakan dalam penelitian ini dapat dilihat pada Gambar 3.
βπ£0π = πΌπΏπ
Perbaharui bobot dan bias: (9) Setiap unit keluaran (Yk, k=1β¦m) memperbaharui bias dan bobotnya (j=0β¦p). π€ππ (πππ€) = π€ππ (πππ) + βπ€ππ Setiap unit tersembunyi (Zj, j=1β¦p) memperbaharui bias dan bobotnya (i=0β¦n). π£ππ (πππ€) = π£ππ (πππ) + βπ£ππ MSEold = MSE. Hitung MSE, βMSE = MSE β MSEold (10) Uji kondisi berhentinya
Gambar 2. Algoritma pelatihan backpropagation
Gambar 3. Metodologi Penelitian
191 Muhammad Rafi Muttaqin Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016 Pengumpulan Data Data yang dikumpulkan didapatkan dari bagian Tata Laksana STT Wastukancana Purwakarta yaitu berupa arsip data nilai UN dan nilai hasil ujian masuk STT Wastukancana pada tahun 2013. Diambil 100 data yang memiliki nilai yang lengkap, yaitu data yang terdapat nilai UN dan nilai hasil ujian masuk. Setelah data terkumpul, maka data dilakukan pembagian untuk menjadi data latih dan data uji menggunakan 5-fold cross validation. Pembagian data menggunakan 5-fold cross validation dapat dilihat pada Tabel 1. Untuk daftar pembagian data latih dan data uji dapat dilihat pada Tabel 2. Tabel 1. Pembagian Kelompok 5-fold cross validation.
ISSN : 2503-2844
yang digunakan adalah sebanyak 3, 6, dan 9 buah hidden layer, sedangkan epoch yang digunakan adalah sebanyak 100, 500, dan 1000 kali epoch. Untuk proses pelatihan, dilakukan dengan mengkombinasikan kedua parameter tesebut untuk setiap fold. Dengan demikian pelatihan JST yang akan dilakukan sebanyak 45 kali uji coba. Karena jika setiap menjalankan pelatihan JST akan menghasilkan model yang berbeda, maka untuk setiap kombinasi dilakukan 5 kali percobaan, sehingga hasil yang akan diambil nanti merupakan rataan dari 5 kali percobaan tersebut. Jadi total pelatihan yang dilakukan sebanyak 225 kali percobaan. Pengujian
No
Kel
1 β 20
I
21 β 40
II
41 β 60
III
61 β 80
IV
81 β 100
V
Tabel 2. Pembagian Data Latih dan Data Uji Data Latih
Data Uji
I, II, III, IV
V
I,II,III,V
IV
I,II,IV,V
III
I,III,IV,V
II
II,III,IV,V
I
IV. HASIL DAN PEMBAHASAN
Setelah proses pelatihan dilakukan maka, dihasilkan sebuah model JST. Dengan model tersebut akan dilakukan proses pengujian menggunakan data uji yang telah dibagi sesuai dengan proses pembagian 5- fold cross validation. Sebagai contoh untuk pelatihan model JST dengan menggunakan fold ke-1 maka yang menjadi data latih adalah kelompok I,II,III dan IV, sedangkan kelompok V menjadi data uji untuk model yang telah dihasilkan oleh fold ke-1 tersebut. Begitu seterusnya sehingga semua percobaan dilakukan. Hasil yang diperoleh dari proses pengujian adalah berupa nilai prediksi berdasarkan model yang dihasilkan tersebut. Hasil prediksi tersebut akan dibandingkan dengan hasil real yang diperoleh dari data awal. Sehingga dapat dihitung berapa nilai errornya dan nilai akurasinya. Nilai error dihitung dengan rumus (1). Nilai akurasi dihitung dengan rumus 100- RMSE. Dari setiap kombinasi percobaan akan diulang sebanyak 5 kali, dikarenakan setiap pengujian yang dilakukan akan memperoleh hasil yang berbeda. Hal ini disebabkan ada beberapa parameter yang ditentukan program secara acak, dari 5 kali percobaan tersebut akan diambil nilai rataan untuk akurasi dan RMSE seperti pada Tabel 3. Untuk setiap kombinasi percobaan yang telah dilakukan dapat dilihat pada Tabel 4.
Dalam pelatihan algoritman backpropagation ini akan ditentukan dua buah parameter yang terdapat peluang akan menghasilkan model yang berbeda antar satu dengan yang lainnya. Dua buah parameter tersebut adalah hidden layer dan epoch. Hidden layer
192 Muhammad Rafi Muttaqin Seminar Nasional Telekomunikasi dan Informatika 2016
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016 Tabel 3. Percobaan hidden layer 3 dan epoch 100 No
RMSE
Akurasi
1
8,9
91,1
2
9,1
90,9
3
8,9
91,1
4
8,9
91,1
5
8,7
91,3
Rataan
8,9
91,1
ISSN : 2503-2844
memprediksi suatu nilai ujian masuk berdasarkan nilai NEM, dapat digunakan modal pelatihan JST dengan menggunakan parameter hidden layer sebanyak 9 buah dan nilai epoch sebanyak 500. Saran Untuk perolehan nilai akurasi yang lebih baik diperlukan data latih yang lebih banyak dari pada yang digunakan dalam penelitian ini. Hal ini dikarenakan pada pemodelan JST itu dilakukan proses pelatihan sehingga dengan banyaknya data latih maka model yang dihasilkan akan lebih baik. Pemodelan JST juga dapat digunakan untuk memprediksi masalah lain selama ada data untuk input dan outputnya.
Tabel 4. Hasil rataan dari setiap kombinasi
REFERENSI No
Hidden Layer
Epoch
rata-rata Rmse
Rata-rata Akurasi
1
3
100
8.9
91.1
2
3
500
8.9
91.1
3
3
1000
9.1
90.9
4
6
100
9.1
90.9
5
6
500
9.0
91.0
6
6
1000
8.9
91.1
7
9
100
9.1
90.9
8
9
500
8.8
91.2
9
9
1000
9.1
90.9
Yunanti, F. (2010). Aplikasi Jaringan Saraf Tiruan Untuk Memprediksi Prestasi Siswa SMU Dengan Metode Backpropagation. Digital Library UIN Sunan Kalijaga. Siang Jong Jek. (2005). Jaringan Syaraf Tiruan & Pemrograman Mengunakan MATLAB. Andi : Yogyakarta. Mei-Ling Huang & Yung-Yang Hsu. (2012). Fetal Distress Prediction Using Discriminant Analysis, Decision Tree, and Artificial Neural Network. Journal of Biomedical Science and Engineering, Vol 5, No.9. Refaeilzadeh, P., Lei Tang, Huan Liu. (2007). On Comparison of Feature Selection Algorithm. Association for the Advancement of Artificial Intellgence. Shcherbakov, M. V., Brebels, A., Shcherbakova, N. L., Tyukov, A. P., Janovsky, T. A., & Kamaev, V. A. (2013). A Survey of Forecast Error Measures. World Applied Sciences Journal 24.
V. KESIMPULAN DAN SARAN Kesimpulan Dari seluruh percobaan yang telah dilakukan, maka dapat disimpulkan bahwa nilai RMSE paling rendah dan nilai akurasi tertinggi dihasilkan oleh kombinasi hidden layer 9 dan epoch 500 dengan rataan nilai RMSE sebesar 8,8 dan nilai akurasi sebesar 91,2. Dengan demikian jika ingin
193 Muhammad Rafi Muttaqin Seminar Nasional Telekomunikasi dan Informatika 2016