19
3. METODE PENELITIAN
3.1
Diagram Alir Penelitian Kerangka pemikiran pada penelitian ini dapat digambarkan dalam suatu
bagan alir seperti pada Gambar 8.
Gambar 8 Diagram Alir Penelitian
Pengumpulan Data Penelitian dimulai dengan pengumpulan data yang berasal dari basis data „Transkrip Nilai‟ dan „Evaluasi Studi‟ yang bersumber dari Sistem Informasi Akademik Terpadu Universitas Negeri Gorontalo (SIATUNG) yang menyimpan
20
informasi mahasiswa berupa nilai mutu mata kuliah, lama studi dan IPK. Mata kuliah yang dipilih sebagai data input dalam penelitian ini berjumlah 16 (enam belas) buah mata kuliah dasar yang wajib diprogramkan pada 2 (dua) semester tahun pertama program perkuliahan sebelum mengambil program peminatan. Pada penelitian ini, data mata kuliah digunakan sebagai data input. Sedangkan data lama studi dan IPK digunakan sebagai data target. Data nilai mata kuliah yang diperoleh berupa Huruf Mutu (HM) dan dikonversi ke Angka Mutu (AM) dengan kisaran nilai 0 hingga 4. Data target lama studi dikategorikan menjadi 2 (dua), yaitu kategori mahasiwa yang lulus dengan melewati masa studi program diploma (> 3 tahun) dan kategori mahasiswa yang lulus tepat waktu (3 tahun). Data target IPK dikategorikan menjadi 3 (tiga), yaitu kategori mahasiswa yang lulus dengan predikat terpuji (IPK >3.5), kategori predikat sangat memuaskan (IPK ≥ 2.75 hingga IPK ≤3.5) dan kategori predikat memuaskan (IPK<2.75). Data mahasiswa yang digunakan dalam penelitian ini adalah data mahasiswa D3 (Diploma Tiga) Manajemen Informatika UNG angkatan 2005 hingga 2010. Pembelajaran dan pengujian JST menggunakan data mahasiwa angkatan 2005, 2006 dan 2007 (Lampiran 1), yang dibagi ke dalam 3 (tiga) komposisi data dan dibedakan ke dalam 2 (dua) kelompok data. Total jumlah data pada kelompok data pertama dan kelompok data kedua adalah sama, yakni 216 data. Pengelompokkan data dibedakan berdasarkan cara pembagian komposisi data dimana pada kelompok data pertama, setelah data mahasiswa angkatan 2005, 2006 dan 2007 diurutkan, kemudian dibagi ke dalam 3 (tiga) komposisi data. Sedangkan pada kelompok data kedua, komposisi data dibagi berdasarkan angkatan, sehingga data mahasiswa pada masing-masing angkatan dibagi ke dalam 3 (tiga) komposisi data. Komposisi data terbagi menjadi data pelatihan, data validasi dan data pengujian. Data pelatihan digunakan oleh jaringan untuk membentuk model melalui proses pembelajaran JST. Data validasi untuk melihat apakah jaringan telah memiliki kemampuan yang baik dalam mengenali data baru yang diberikan kepadanya. Data validasi digunakan juga untuk menghentikan iterasi jika error yang terjadi tidak rasional. Data pengujian digunakan untuk menguji ketepatan klasifikasi dari model yang terbentuk. Penelitian ini menetapkan besarnya
21
komposisi data adalah 70% data pelatihan, 15% data validasi dan 15% data pengujian. Prediksi tingkat kelulusan menggunakan data mahasiswa angkatan 2008, 2009 dan 2010 9 (Lampiran 2). Pembagian data mahasiswa untuk pembelajaran JST dan prediksi ditunjukkan oleh Tabel 3.
Tabel 3 Pengelompokkan dan Komposisi Data Penelitian DATA PEMBELAJARAN & PENGUJIAN Komposisi Data Kelompok Data Pertama Kelompok Data Kedua
Data Pelatihan (70%)
Data Validasi (15%)
Data Testing (15%)
Total
150
33
33
216
2005
60
2006
55
2007
35
13 12 8
13 12 8
86 79 51
33
33
216
2008
2009
2010
Total
41
52
37
130
Total
150 DATA PREDIKSI
Angkatan Jumlah
Praproses Data Sebelum data digunakan dilakukan praproses untuk meningkatkan efisiensi dan skalabilitas dari sebuah sistem prediksi. Pada penelitian ini, dilakukan beberapa praproses data, yakni pembersihan data, analisa relevansi dan tranformasi data (Han & Kember 2001). Proses transformasi data dilakukan untuk data target yang bersifat kategorikal, dengan menggunakan metode Unary Encoding, dimana data target dipresentasikan dengan kombinasi angka 0 dan 1 (numerical binary variable). Berdasarkan data kategori targetnya maka dalam penelitian ini, seluruh proses pembelajaran, pengujian hingga prediksi akan dibedakan ke dalam 2 (dua) model, yaitu Model Prediksi Lama Studi (MPLS) dan Model Prediksi Indeks Prestasi Kumulatif (MPIPK). Praproses ini dilakukan dengan menggunakan perangkat lunak Microsoft Excel 2007, sedangkan untuk proses transformasi dilakukan dengan menggunakan perangkat lunak Matlab versi 6.5.
22
Pembentukan Model JST Pembentukan model prekdiksi dimaksudkan untuk menentukan parameter dari arsitektur jaringan yang akan digunakan untuk pembelajaran. Pembentukan model
prediksi
dilakukan
dengan
menggunakan
JST
Propagasi
Balik
(Backpropagation) dengan 1 (satu) lapisan tersembunyi. Jumlah variabel input yang digunakan dalam penelitian ini sebanyak 16 buah variabel. Jumlah node untuk lapisan input sama dengan jumlah variabel input, karena data input sudah berbentuk data numerik sehingga tidak mengalami praproses data. Jumlah node pada lapisan output sama dengan jumlah kategori yang akan diklasifikasi dan hal ini berbeda untuk setiap model prediksi. Model prediksi lama studi (MPLS) memiliki 2 (dua) kategori output, sehingga jumlah node pada model prediksi ini sebanyak 2 (dua) node dan Model prediksi IPK (MPIPK) memiliki 3 (tiga) kategori output, sehingga jumlah node pada model prediksi ini menjadi 3 (tiga) node. Adapun untuk jumlah node pada lapisan tersembunyi (hidden-node), pada penelitian ini akan divariasikan untuk mendapatkan hasil yang lebih optimal. Karena diduga jumlah node pada lapisan tersembunyi berpengaruh terhadap tingkat generalisasi atau pengenalan pola. Variasi jumlah hidden-node yang digunakan adalah 5, 10 dan 15. Selain jumlah node pada tiap lapisan arsitektur JST, ditetapkan beberapa parameter yang akan diberikan pada proses pembelajaran dan diuji untuk membentuk model prediksi, antara lain adalah fungsi aktivasi, toleransi galat, jumlah epoch maksimal, laju pembelajaran (learning rate) dan fungsi pelatihan (training function). Untuk inisialisasi bobot awal digunakan inisialisasi secara random. Fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah tansigmoid, sedangkan pada lapisan output menggunakan fungsi aktivasi pure linear. Toleransi kesalahan minimum (galat) ditentukan pada 0.001. Toleransi galat yang cukup kecil diharapkan akan memberikan hasil yang cukup baik. Jumlah epoch maksimal yang ditetapkan dalam penelitian ini adalah 1000. Hal ini diperlukan sebagai kriteria henti jaringan disamping tolerasin galat untuk membatasi waktu yang disediakan bagi jaringan dalam melakukan pembelajaran. Adapun parameter yang divariasikan dalam proses pembelajaran adalah laju pembelajaran (learning rate) dan fungsi pelatihan (training function). Variasi nilai
23
laju pembelajaran yang digunakan adalah 0.01, 0.05, 0.1 dan 0.5. Laju pembelajaran
dapat
mempengaruhi
konvergensi
kecepatan
pada
proses
pembelajaran, sehingga perlu dilakukan percobaan pada laju pembelajaran yang berbeda untuk mendapatkan nilai rentang data yang sesuai.
Hasil penelitian
Purnomo (2001) menyatakan bahwa semakin kecil nilai laju pembelajarannya maka semakin kecil pula nilai dan rentang data matriks vektor hasil pelatihan, dan sebaliknya. Fungsi pelatihan yang divariasikan adalah algoritma pelatihan dengan perbaikan teknik heuristik resilent backpropagation dan perbaikan dengan teknik optimasi scaled conjugate gradient dan levenberg-marquardt. Tabel 4 Karakteristik dan Struktur JST yang digunakan KARAKTERISTIK SPESIFIKASI Arsitektur jaringan Multi-layer dengan 1 lapisan tersembunyi Algoritma Pembelajaran Propagasi balik Jumlah node input 16 Jumlah node lapisan tersembunyi 5, 10, 15 Fungsi aktivasi lapisan tersembunyi Sigmoid bipolar Jumlah node lapisan ouput : Model Prediksi Lama Studi (MPLS) 2 Model Prediksi IPK (MPIPK) 3 Fungsi aktivasi lapisan output Fungsi linier Toleransi galat 0.001 Laju Pembelajaran 0.01, 0.05, 0.1, 0.5 Maksimum epoch 1000 Pembelajaran Model Setelah model terbentuk selanjutnya dilakukan proses pembelajaran atau pelatihan, dimana pada proses ini menggunakan data pelatihan, data validasi dan data testing. Pembelajaran atau pelatihan dilakukan bertujuan untuk mengenali pola-pola dari data masukan pada data pelatihan untuk dilatih pada jaringan yang akan menghasilkan keluaran untuk dibandingan dengan data target. Selama proses pelatihan dilakukan pula proses validasi untuk menguji apakah jaringan sudah memiliki kemampuan yang baik dalam mengenali data baru yang diberikan kepadanya, yang ditunjukkan dengan nilai Mean Square Error (MSE). Pembelajaran model JST propagasi balik bersifat iterative dan didesain untuk meminimalkan MSE antara output yang dihasilkan dan output yang diinginkan (target).
24
Algoritma pembelajaran propagasi balik meliputi 3 (tiga) tahap, yaitu : prosedur umpan maju (feedforward), perhitungan serta perambatan balik kesalahan (backpropagation) dan penyesuaian bobot. Sebelum proses pelatihan terlebih dahulu ditentukan bobot-bobot awal secara random dan toleransi kesalahan minimum. Bobot-bobot awal ini nantinya akan diinisialisasi dan digunakan pada proses umpan maju awal, sedangkan proses umpan maju selanjutnya menggunakan bobot-bobot yang telah mengalami perbaikan. Toleransi kesalahan minimum berfungsi sebagai pembatas berulangnya proses iterasi dalam suatu pelatihan. Proses pelatihan akan terus berulang hingga diperoleh koreksi kesalahan yang sama atau lebih kecil dari tolerasi kesalahan minimum.
Pengujian dan Generalisasi Pengujian jaringan bertujuan untuk mengetahui apakah jaringan dapat melakukan generalisasi terhadap data baru yang dimasukkan ke dalamnya yaitu ditunjukkan dengan persentase akurasi jaringan dalam mengenali data pengujian, sehingga arsitektur jaringan yang digunakan untuk pengujian adalah arsitektur terbaik yang diperoleh dari hasil pelatihan jaringan.
Dalam penelitian ini
digunakan parameter yang disebut generalisasi untuk mengukur tingkat pengenalan jaringan pada pola yang diberikan. Dimana pola yang diberikan adalah data validasi maupun data testing. Generalisasi yang digunakan dalam Agustini (2006) adalah sebagai berikut :
Generalisasi _ test
numkenal _ test x100 jum _ pola
(6)
dengan numkel_test adalah jumlah pola yang dikenal dan jum_pola adalah jumlah pola keseluruhan. Jumlah numkel_test dan jum_pola yang ditunjukkan akan berbeda pada setiap model prediksi.
Analisis Sensitivitas Analisis sensitivitas bertujuan untuk mengetahui variabel yang lebih atau paling berpengaruh diantara variabel-variabel masukan. Metode
analisa
sensitivitas yang digunakan adalah metode yang digunakan oleh Engelbrecht
25
(2001). Analisis sensitivitas ini dilakukan pada percobaan dengan arsitektur dan parameter terbaik yang diperoleh setelah proses pelatihan dan pengujian. Hasil analisis sensitivitas dibedakan berdasarkan model prediksi.
3.2
Alat Bantu Penelitian Alat-alat Bantu yang digunakan dalam penelitian ini adalah sebagai
berikut : 1) Notebook Notebook dengan spesifikasi prosesor Intel® Pentium (TM)2 Duo CPU T5070, 2.00 GHz, Memory (RAM) 1.87 GB. 2) Sistem Operasi Windows XP Home Edition, Version 2002, Service Pack 2. 3) Aplikasi Microsoft Excel 2007 untuk melakukan praproses terhadap data sebelum digunakan sebagai input model yang dikembangkan karena tampilan data dalam bentuk data sheet unuk mempermudah dalam pengolahan data. 4) Aplikasi Matlab versi 6.5 digunakan dalam penelitian ini untuk transformasi data numerik, pengolahan data dan visualisasi hasil.
3.3
Waktu dan Tempat Penelitian Penelitian dilaksanakan mulai Februari hingga April 2011 bertempat di
Laboratorium Pascasarjana Departemen Ilmu Komputer FMIPA-IPB.
26