BAB III. METODOLOGI
3.1. Kerangka Pikir Teknik informatika yang memiliki andil yang cukup besar dalam berbagai kegiatan manusia membuat penelitian dengan domain teknik informatika merupakan hal yang menarik dilakukan. Penelitian murni maupun terapan dilakukan untuk mengembangkan serta memperkaya pengetahuan mengenai teknik informatika. Animo peneliti dalam melakukan riset di bidang teknik informatika memunculkan sebuah kebutuhan untuk mengetahui trend atau kecenderungan topik penelitian teknik informatika di masa depan. Oleh karena itu perlu adanya prediksi untuk mengetahui trend-trend topik penelitian apa saja yang berhubungan dengan teknik informatika. Adalah extreme learning machine (ELM) yang merupakan metode jaringan syaraf tiruan baru yang pertama kali diperkenalkan oleh Huang pada tahun 2004 (Huang, Zhu, & Siew, 2006). Metode pembelajaran extreme learning machine dibuat untuk mengatasi kelemahan-kelemahan dari jaringan syaraf tiruan feedforward terutama dalam hal kecepatan belajar (learning speed). Metode ini memiliki keunggulan dalam menghasilkan kinerja generalisasi yang baik. Penelitian ini akan mengimplementasikan ELM pada prediksi trend topiktopik penelitian di bidang teknik informatika dan menganalisis keakuratan algoritma ELM dalam memprediksi. Secara garis besar prediksi menggunakan ELM di bagi menjadi tiga tahap yaitu preprocessing data, training, dan testing (Agustina, Anggraeni, & Mukhlason, 2010). Gambar 3.1 menunjukkan kerangka pikir dari penelitian ini.
35
36
Secara lebih rinci, tahapan prediksi dengan menggunakan metode ELM akan dibahas pada sub bab selanjutnya.
Gambar 3.1 – Kerangka Pikir
37
3.2. Tata Laksana Penelitian 3.2.1. Tahapan Penelitian Langkah-langkah pembuatan model prediksi topik-topik penelitian teknik informatika dengan menggunakan metode ELM adalah: pengumpulan data, implementasi metode ELM untuk prediksi melalui pembagian data, training dan testing ELM, serta analisis hasil prediksi ELM. Pada tahap awal penelitian dimulai dengan menentukan latar belakang dan tujuan penelitian serta mendefinisikan ruang lingkup. Studi literatur dilakukan untuk memperdalam pemahaman mengenai cara kerja metode ELM serta tahapan-tahapan apa saja yang diperlukan untuk prediksi dengan menggunakan metode ELM. Selain itu, studi literatur juga dilakukan untuk mengetahui arah penelitian teknik informatika supaya pengumpulan data memiliki fokus yang lebih baik. Tahap ke dua dari penelitian ini adalah pengumpulan data. Tahap ke tiga adalah implementasi metode ELM melalui pembagian data, training dan testing ELM. Tahap ke empat adalah memberikan peringkat pada topik-topik penelitian, untuk menunjukkan topik-topik apa saja yang kecenderungannya naik, tetap atau turun. Lalu membandingkan hasil peringkat topik penelitian aktual dengan hasil prediksi ELM. Tahap ke lima adalah analisis hasil prediksi ELM. Kemudian tahap terakhir adalah menarik kesimpulan dan memberikan saran.
38
Gambar 3.2 – Tahapan Penelitian
39
Gambar 3.3 – Diagram Alur Prediksi dengan Metode ELM
40
3.2.2. Rencana Kegiatan Tabel 3.1 – Rencana Kegiatan No
`Kegiatan
Bulan 1 2 3 4 5 6 7 8
1.
Studi Literatur
2.
Pengumpulan Data
3.
Implementasi ELM
4.
Analisis Kinerja ELM
5.
Penulisan Tesis
3.3. Hipotesis -
Prediksi topik-topik penelitian di bidang teknik informatika menggunakan extreme learning machine memiliki tingkat akurasi dengan average precision diatas 0.7.
-
Prediksi topik-topik penelitian di bidang teknik informatika menggunakan extreme learning machine lebih akurat dan lebih cepat dibandingkan menggunakan prediksi linier dan backpropagation.
3.4. Metode Pengumpulan Data Data yang digunakan adalah data dari jurnal ilmiah yaitu IEEE Computer Society. Dimana data yang diambil adalah jumlah jurnal yang disubmit dari tahun 1996 sampai tahun 2011. Jumlah jurnalnya akan dikelompokkan berdasarkan taksonomi teknik informatika berdasarkan IEEE Computer Society.
41
Jumlah jurnal akan diperoleh dengan memanfaatkan fitur advance search pada situs web IEEE Computer Society (Gambar 3.4).
Gambar 3.4 – Advance Search IEEE Computer Society Gambar 3.5 menunjukkan hasil perncarian untuk kata kunci “Data Dependencies” pada tahun 1996. Dimana hasil pencarian tersebut menunjukkan ada 353 dokumen yang berkaitan dengan “Data Dependencies”.
42
Gambar 3.5 – Hasil Pencarian “Data Dependencies” Tahun 1996 Taksonomi teknik informatika berdasarkan IEEE Computer Society bisa digambarkan seperti pohon yang terdiri dari akar dan cabang. Agar jumlah jurnal yang ditemukan memiliki keterkaitan sesuai dengan yang diharapkan maka langkah-langkah berikut dilakukan terlebih dahulu: 1. Memastikan kata kunci yang digunakan merupakan kata kunci yang unik. Caranya adalah dengan melakukan pencarian kata kunci di dokumen taksonomi. Kata kunci yang unik artinya kata kunci tersebut ditemukan hanya satu buah pada dokumen taksonomi. Contoh: kata kunci “Data Dependecies” hanya ditemukan satu buah pada dokumen taksonomi. Jika kata kunci termasuk kata kunci unik maka pencarian langsung dapat dilakukan. Jika kata kunci ditemukan lebih dari satu buah (tidak unik) maka lakukan langkah ke dua. 2. Menambahkan kata kunci ke dua yang berasal dari akar kata kunci tersebut. Beberapa kata kunci yang ada pada taksonomi teknik informatika berdasarkan IEEE Computer Society berisi kata-kata yang
43
tidak unik. Contoh: kata kunci seperti “Standards” dan “Errorchecking” disebutkan berulang kali pada dokumen taksonomi. Oleh karena itu ditambahkan satu kata kunci lagi untuk mempersempit pencarian. Misalnya: Akar dari “Standards” adalah “Digital Libraries” maka kata kunci yang digunakan adalah “Digital Libraries Standards”. Akar dari “Error-checking” adalah “Memory Structures”, maka kata kunci “Memory Structures” digunakan pada kolom pencarian ke dua pada halaman pencarian.
3.5. Metode Prediksi dengan ELM Prediksi topik-topik penelitian teknik informatika ini akan menggunakan MATLAB sebagai tool-nya. Adapun model jaringan yang digunakan adalah univariate time series seperti pada gambar. Input Layer
Hidden Layer
Output Layer
Xt-1
Xt-2
Xt
Xt-3 … Xt-n
Gambar 3.6 – Univariate Time Series
44
Dimana outputnya adalah jumlah jurnal pada tahun Xt. Inputnya adalah jumlah jurnal pada tahun Xt-1, Xt-2, Xt-3 sampai Xt-n. Jumlah inputnya akan disesuaikan untuk mendapatkan hasil prediksi yang akurat. -
Pembagian data training dan testing Proses training dan testing mutlak diperlukan pada proses prediksi menggunakan ELM. Proses training digunakan untuk mengembangkan proses ELM sedangkan testing digunakan untuk mengevaluasi kemampuan ELM sebagai alat prediksi. Pembagian data training dan testing akan dibagi dengan komposisi sebagai berikut: 1. Data training sebanyak 75% dari total data 2. Data testing 25% dari total data
-
Training ELM Training ELM akan dilakukan dengan menggunakan tool MATLAB. Proses training ELM dibagi lagi ke dalam lima bagian, yaitu: 1. Normalisasi data training Data yang akan dimasukkan ke dalam ELM dinormalisasi sehingga mempunyai nilai dengan rentang tertentu. Hal ini diperlukan
karena
fungsi
aktivasi
yang
digunakan
akan
menghasilkan output dengan rentang data [0,1] atau [-1,1]. Berikut ini merupakan rumus yang digunakan untuk normalisasi: 2
min max
1
45
Dimana: x = nilai hasil normalisasi dengan rentang antara -1 sampai 1 = nilai data asli yang belum dinormalisasi = nilai minimum pada dataset max
= nilai maksimum pada dataset
2. Menentukan fungsi aktivasi dan jumlah hidden neuron Pada proses training jumlah hidden neuron dan fungsi aktivasi dari ELM ditentukan terlebih dahulu. Penelitian ini akan menggunakan fungsi aktivasi sigmoid tan. Menurut (Sun, Choi, Au, & Yu, 2008) ELM menghasilkan output peramalan yang stabil dengan jumlah hidden neuron 0-30. Tetapi, jika output yang dihasilkan ELM kurang optimal maka jumlah hidden neuron-nya akan diubah. 3. Menghitung bobot input, bias dari hidden neuron, dan bobot output. Output dari proses pelatihan ELM adalah bobot input, bobot output, dan bias dari hidden neuron dengan tingkat kesalahan rendah yang diukur dengan MSE. Bobot input ditentukan secara random, sedangkan bobot output merupakan invers dari matriks hidden layer dan output. Secara matematis dapat ditulis sebagai berikut:
,…,
, ,…,
,
,…,
46
.
.
.
.
4. Denormalisasi Output Output yang dihasilkan dari proses pelatihan didenormalisasi. Berikut rumus denormalisasi yang digunakan: 0.5
1
max
Dimana: x = nilai data setelah denormalisasi = nilai data asli yang belum denormalisasi = nilai minimum pada dataset sebelum normalisasi max -
= nilai maksimu pada dataset sebelum normalisasi
Testing ELM Berdasarkan bobot input dan bobot output yang didapatkan dari proses training, maka tahap selanjutnya adalah melakukan peramalan dengan ELM. Data yang digunakan adalah data testing sebanyak 20% dari data. Pada tahap ini data input dinormalisasi dan didenormalisasi dengan rentang dan rumus yang sama dengan data training.
3.6. Metode Pemberian Peringkat Topik Untuk menghitung average year of publication (rata-rata tahun publikasi), kita menjumlah seluruh hasil perkalian tahun dengan jumlah hit per tahun,
47
kemudian membaginya dengan jumlah seluruh hit pada semua tahun (Ziegle, 2009). Dalam rumus: ∑ ∑ Dimana: = tahun ke i = jumlah hit pada tahun ke i
3.7. Metode Analisis Kinerja ELM 3.7.1. Average Precision Analisis keakuratan hasil prediksi ELM dalam melakukan prediksi topik penelitian dapat diperoleh dengan menggunakan average precision. Average precision mengukur kemampuan sistem dalam pemberiam peringkat. Berikut ini adalah rumus dari average precision (Zhu, 2004):
Dimana: k = jumlah data yang relevan = precision
3.7.2. Mean Square Error Analisis keakuratan hasil prediksi kinerja ELM akan dilakukan dengan melihat apakah tingkat kesalahan Mean Square Error (MSE) yang kecil. Berikut ini adalah rumus dari MSE:
48
1
Dimana : N = jumlah data yi = data output ti = data aktual Untuk menunjukkan kecepatan proses pembelajaran dan keakuratan ELM maka kinerja ELM akan dibandingkan dengan kinerja backpropagation dan prediksi linier pada data yang sama.