SNIPTEK 2013
ISBN: 978-602-72850-4-0
PREDIKSI HARGA SAHAM PERUSAHAAN ICT BERBASIS JARINGAN SYARAF TIRUAN DENGAN PENDEKATAN MODEL SVR DAN GMDH POLYNOMIAL Windu Gata
Danang Sutrisno
Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri http://www.nusamandiri.ac.id
Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri http://www.nusamandiri.ac.id
ABSTRAK — Harga saham Volatile atau fluktuatif membuat stok tidak mudah diprediksi secara linier. Diperlukan metode yang bisa menebak harga saham secara akurat untuk membantu investor membuat keputusan untuk membeli dan menjual saham. Salah satu pendekatan yang cukup kuat untuk mengatasi masalah non linier adalah Jaringan Syaraf Tiruan (JST) JST telah banyak digunakan dalam memecahkan masalah keuangan yang memerlukan pengenalan pola. Penelitian ini bertujuan untuk membandingkan Support Vector Regression (SVR) dan Group Method Data Handling (GMDH) Polynomial untuk memprediksi harga saham harian Astra Graphia. Variabel prediktif dibedakan dalam dua model, yaitu input 6 lag dan 10 lag. Dari berbagai model yang dapat dibentuk dengan arsitektur jaringan, fungsi aktivasi, metode pembelajaran jaringan yang berbeda dan Support Vector Regressin (SVR) dan Group Method Data Handling (GMDH) Tipe polinomial, fungsi kernel dalam mendukung vectorregression (SVR) dan implementasi data. Persiapan dengan menghilangkan kecenderungan data deret waktu diikuti oleh variance stabilization, diperoleh 8 untuk SVR dan 13 model untuk GMDH pada masing-masing model prediksi. Hasil empiris menunjukkan bahwa model regresi Vector Support Vector dengan 6 variabel prediktif memberikan ketepatan prediksi terbaik dibandingkan dengan model SVR dengan 10 variabel prediktif sementara dan GMDH baik 6 lag dan 10 lag model. Kata kunci: Peramalan, Seri Waktu, Jaringan Syaraf Tiruan, Jaringan Syaraf Tiruan, MLP, SVM, SVR. ABSTRACT The Volatile or fluctuate stock price make the stock is not easily predicted by linear. required method that can accurately guess the stock price to help investor make decision to buy and sell the stock. one approach that is strong enough to overcome non linear problem is Artificial Neural Network (ANN)ANN has been widely used in solving financial problems that require pattern recognition. This research aimed to compare Support Vector Regression (SVR) and Group Method Data Handling(GMDH) Polynomial to predict Astra Graphia daily stock prices. predictive variables are distinguished in two models, namely input 6 lag and 10 lag. From various models that can be formed with the network architecture, activation function, network learning method that
different and Support Vector Regressin(SVR) and Group Method Data Handling(GMDH) Polynomial type,kernel function in support vectorregression (SVR) and implementation of data preparation by removing trend of time series data followed by variance stabilization, obtained 8 for SVR and 13 model for GMDH in each of prediction models. The empirical result show that the Support Vector Regression (SVR) model with 6 Lag predictive variables give the best prediction accuracy compared to SVR Models with 10 Lag predictive variables and to GMDH both 6 lag and 10 lag models. Key words: Forecasting, Time Series, Artificial Neural Networks, Neural Network, MLP, SVM, SVR.
PENDAHULUAN Penelitian ini akan menerapkan metode JST dalam melakukan prediksi harga saham. Objek penelitian adalah saham di bidang industri Tehnologi Informasi. Saham PT Astra Graphia adalah salah satu saham yang memiliki prospek cerah untuk kedepannya. Ekspektasi ini didasarkan atas potensi meningkatnya tingkat permintaan terhadap infrastruktur tehnologi informasi seiring dengan mulai menggeliatnya pemanfaatan tehnologi dalam informasi. JST telah banyak diaplikasikan oleh para peneliti dalam penelitian tentang memprediksi harga saham karena memiliki kemampuan dalam masalah pengenalan pola dan pembelajaran seperti klasifikasi dan prediksi. Pergerakan harga saham yang fluktuatif dan dinamis membuat saham tidak mudah diprediksi secara linier. Diperlukan metode yang bisa menduga harga saham dengan akurat untuk membantu investor mengambil keputusan membeli dan menjual saham, khususnya saham-saham industri manufaktur. Tujuan penelitian ini adalah membandingkan algoritma Support Vector Regression (SVR) dan Group Method of Data Handling(GMDH) Polynomial pada model variabel prediksi 6 lag dan 10 lag untuk mendapatkan model terbaik dalam hal ini untuk meramalkan harga saham Astra Graphia dengan data harga penutupan saham harian dari 28 Desember 2007 sampai dengan 6 mei 2013. Manfaat yang diharapkan pada penelitian ini adalah sebagai berikut:
INF-216
ISBN: 978-602-72850-4-0 a. Manfaat Praktis: Hasil penelitian ini dapat digunakan sebagai rekomendasi dan masukan bagi investor dalam membuat keputusan pembelian atau penjualan saham. b. Manfaat Teoritis: Hasil penelitian ini dapat memberikan bukti empiris mengenai penerapan metode neural network dengan algoritma Support Vector Regression (SVR) dan Group Method of Data Handling pada pendugaan harga saham harian.
SNIPTEK 2013 meyakinkan dalam memprediksi kelas suatu data baru. (Santosa, 2007)
BAHAN DAN METODE Tinjauan Pustaka Data mining Data mining menurut Gartner Group adalah proses menelusuri pengetahuan baru, pola dan tren yang dipilah dari jumlah data yang besar yang tersimpan dalam tempat penyimpanan atau repositori dengan menggunakan teknik pengenalan pola serta statistik dan teknik matematika. (Larose, 2005) Data mining adalah tentang pemecahan masalah dengan menganalisa data yang telah ada di dalam database. Data mining merupakan proses penemuan pola dalam data. Proses data mining bisa otomatis maupun semiotomatis. Pola yang ditemukan harus mempunyai arti dan manfaat, salah satunya secara ekonomis. (Witten,
Sumber: Hasil penelitian (2013) Gambar 1 Arsitektur SVM
Eibe, & Hall, 2011)
Artificial Neural Network Menurut Ripley, 1996 dan Haykin, 1998 Artificial Neural Network (ANN) adalah representasi matematik atas struktur dan mekanisme kerja otak manusia. Karakteristik ANN terletak pada topologi dan bobot yang bersesuaian. (Liao, 2007) Artificial neural networks (ANN) atau jaringan Syaraf tiruan, awalnya mendapat inspirasi dari sistem jaringan Syaraf makhluk hidup. Observasi bahwa sistem belajar dari makhluk hidup terutama manusia, terdiri dari jaringan yang sangat kompleks yang terdiri dari neuron yang saling terhubung telah memberi inspirasi ini. Dalam ANN, jaringan Syaraf makhluk hidup ditiru susunannya. ANN muncul sebagai alternatif pendekatan konvensional yang biasanya kurang fleksibel terhadap perubahan struktur masalah. (Santosa, 2007) Support Vector Machine (SVM) Support vector machine (SVM) adalah suatu teknik yang relatif baru (1995) untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang sangat populer belakangan ini. SVM berada dalam satu kelas dengan ANN dalam hal fungsi dan kondisi permasalahan yang bisa diselesaikan. Keduanya masuk dalam kelas supervised learning. SVM berusaha untuk menemukan fungsi pemisah(klasifier) yang optimal yang bisa memisahkan dua set data dari dua kelas yang berbeda. Teknik ini menarik orang dalam bidang data mining maupun machine learning karena performansinya yang
INF-217
Sumber: Hasil penelitian (2013) Gambar 2 Proses SVM
Sumber: Hasil penelitian (2013) Gambar 3 Pemetaan dari hasil proses klasifikasi
Sumber: Hasil penelitian (2013) Gambar 4 Margin dan Support Vector
SNIPTEK 2013 Support Vector Regressi SVM bisa digeneralisasi untuk melakukan pendekatan fungsi (function approximation) atau regresi. Didasarkan pada teori Structural Risk Minimization untuk mengestimasi suatu fungsi dengan cara meminimalkan batas atas dari generalization Error , SVR telah memperlihatkan sebagai metoda yang bisa mengatasi masalah overfitting. Sehingga bisa menghasilkan performansi yang lebih bagus dibanding, misalnya dengan ANN. (Santosa, 2007) Loss function adalah fungsi yang menunjukkan hubungan antara Error dengan bagaimana Error ini dikenai penalti. Perbedaan loss function akan menghasilkan formulasi SVR yang berbeda.
Sumber: Hasil penelitian (2013) Gambar 5 Penalty terhadap titik yang jauh dari hyperplane
ISBN: 978-602-72850-4-0 sama dengan item lainnya yang memiliki nilai penutupan variabel prediktor.
Sumber: Hasil penelitian (2013) Gambar 7 Grafik RBF Pada RBF network posisi satu atau lebih neuron RBF dalam sebuah ruang digambarkan dengan variable prediktor(pada contoh variable x dan y). Jarak Euclidean dihitung dari titik yang teruji(pada gambar segitiga) ketitik tengah untuk setiap neuron dan radial basis function(sering juga disebut fungsi kernel) dapat diterapkan pada jarak perhitungan bobot(yang mempengaruhi) untuk setiap neuron. Radial fungsi basis dinamakan demikian karena radius jarak argumen ke fungsi. Jika terdapat lebih dari satu variable prediktor, RBF memiliki banyak dimensi sebagai variablenya. Gambar berikut mengilustrasikan tiga nueron dalam ruang dengan dua variable perdiktor. Z adalah nilai yang dikeluarkan oleh fungsi RBF.
Sumber: Hasil penelitian (2013) Gambar 6 Plot dari data aktual dan hasil dari SVR kernel RBF Radial Basis Function(RBF) Neural Network Radial Basis Function neural network memiliki sebuah input layer, sebuah hidden layer dan sebuah output layer. Neuron pada hidden layer mengandung Gaussian Transfer Function yang outputnya adalah terbalik secara proposional terhadap jarak dari neuron pusat. RBF neural network secara konsep sama dengan K-Nearst Neighbor(KNN models). Ide dasarnya adalah bahwa nilai target prediksi tiap item cenderung hampir 1
Sumber: Hasil penelitian (2013) Gambar 8 Arsitektur Model RBF Network
INF-218
ISBN: 978-602-72850-4-0
Sumber: Hasil penelitian (2013) Gambar 11 Time Series Kerangka Konsep Pemikiran Dalam penelitian ini, pola pikir yang akan dituangkan adalah sebagai berikut :
MAE
MAPE
MAPE
MAPE
RMSE
RMSE
MSE
MSE
MSE
MAE
MAE
MAE
MAPE
MAPE
MAPE
RMSE
RMSE
RMSE
MSE
MSE
MSE
MAE
MAE
MAE
MAPE
MAPE
MAPE
INDEX KETELITIAN KESALAHAN
SUB MODEL 3
SUB MODEL 2 MAE
RMSE
DATA TRAINING
MAE
RMSE
SUB MODEL 1
MSE
SUB MODEL 1
MSE
SUB MODEL 2
RMSE
MSE
SUB MODEL 3
RMSE
SUB MODEL 2
SUB MODEL 1
GMDH
SUB MODEL 3
DATA TRAINING
SVR
INDEX KETELITIAN KESALAHAN
RMSE
RMSE
MSE
MSE
MSE
MAE
MAE
MAE
MAPE
MAPE
MAPE
SUB MODEL 1
SUB MODEL 2
SUB MODEL 3
INDEX KETELITIAN KESALAHAN
RMSE
SVR
DATA TESTING
DATA TESTING
Membandingkan nilai index kesalahan terkecil
INDEX KETELITIAN KESALAHAN
Sumber: Hasil penelitian (2013) Gambar 9 Neural Network RBF Tiga Layer 2 GMDH Polynomial Neural Networks Group Method of Data Handling Polynomial Neural Network adalah jaringan yang memiliki kemampuan pengorganisasian mandiri. Jaringan dimulai dari hanya dengan neuron-neuron input. Pada saat proses training neuron dipilih dari sekumpulan kandidat dan ditambahkan kedalam hidden layer. Pengorganisasian mandiri dari GMDH Network maksudnya adalah koneksi antar neuron dalam jaringan tidak bersifat tetap melainkan terpilih selama proses training untuk optimasi kinerja jaringan. Jumlah Layer pada jaringan juga dipilih secara outomatis untuk menghasilkan keakurasian maksimal tanpa terjadi over fitting.
SNIPTEK 2013
GMDH
MODEL TERBAIK
Sumber: Hasil penelitian (2013) Gambar 10 Jaringan Neural GMDH Polynomial Analisa Time Series Time series adalah pengamatan berdasarkan urutan kronologi pada variable fakta. Biasanya pengamatan menggunakan interval beraturan(tanggal, bulan, tahun), tetapi sample diambil tidak beraturan. Analisa time series terdiri dari dua langkah yaitu, (1) membangun model yang merepresentasikan time series, dan menggunakan model tersebut untuk mempredisi nilai mendatang. (Sherrod, 2003-2013, p. 139)
INF-219
Sumber: Hasil penelitian (2013) Gambar 12 Pola Pikir Pemecahan Masalah Metode Penelitian 1. Memilih metode data mining, dalam penelitian ini metode yang digunakan adalah prediksi, yaitu untuk memprediksi pergerakan harga saham dengan mencari pola dari pergerakan harga saham sebelumnya. 2. Pemilihan Algoritma, dalam penelitian ini algoritma yang akan digunakan untuk meramalkan harga saham yaitu SVM dan GMDH. 3. Mengumpulkan data, berupa data runtun waktu yaitu harga penutupan saham harian PT Astra Graphia(IUA.MU) periode 28 Desember 2007 sampai dengan 6 mei 2013. 4. Data Preparation, mempersiapkan data sebelum diproses dalam model, meliputi proses pengurutan data berdasarkan tanggal secara ascending, dan membuang field yang tidak dipergunakan. 5. Eksperimen, data training akan diproses menggunakan tools DTREG. Eksperimen akan dilakukan dengan variabel prediksi 6 lag dan 10 lag terhadap algoritma SVM dan GMDH untuk melihat perbedaan hasilnya. Data testing akan diumpankan kepada rule SVM dan GMDH pada kedua jenis model input, sehingga akan muncul hasil dari validasi, berupa tingkat Error dari pemrosesan data validasi terhadap algoritma SVM dan GMDH. Komparasi akan dilakukan dengan membandingkan tingkat Error dari hasil validasi, yang
SNIPTEK 2013 berupa : Maximum Error (ME), RootMean Squared Error (RMSE), Mean Absolute Error (MAE), dan Mean Absolute Percentage Error (MAPE), dan penekanan terutama pada tingkat RMSE. 6. Reporting yaitu melaporkan hasil penelitian dalam bentuk tesis dari pendahuluan sampai dengan kesimpulan dan penutup.
HASIL DAN PEMBAHASAN Komparasi Hasil Prediksi Variabel Input 6 Lag Dari hasil proses pengamatan antara dua model jaringan syaraf dengan menggunakan lag 6 dapat disimpulakan bahwa model SVR dengan sub model nomor 6 menghasilkan nilai terbaik dalam melakukan prediksi dibandingkan dengan model GMDH. Tabel 1 Komparasi Hasil Algoritma SVR dan GMDH dengan Variabel Input 6 Lag
ISBN: 978-602-72850-4-0 Analisa Hasil dan Komparasi Model Lag 6 dan Lag 10 Perbandingan antara penggunaan jumlah variabel prediksi dengan 6 lag dan 10 lag pada prediksi dengan algoritma Support Vector Regression(SVR) dan Group Method Data Handling(GMDH) Polynomial , hasilnya dapat dilihat pada tabel 3. Dalam hal keakuratan prediksi, model Neural Network algoritma Support Vector Regression (SVR) dengan variabel prediksi 6 lag sub model 6 lebih baik dari model GMDH pada lag yang sama. Pada variable prediksi dengan jumlah lag 10 model SVR tidak lebih baik dari pada model GMDH dengan sub model 5 namun hasilnya tidak lebih baik dari pada model SVR sub model 6 dengan nilai RMSE terkecil dibandingkan model lainnya. Tabel 3 Komparasi Model Lag 6 dan Lag 10 Algoritma
6 Lag
SVR* GMDH
6# 10#
24.03 24.76
SVR GMDH
6# 10#
121.83 114.52
SVR GMDH
6# 5#
24.88 24.65
SVR GMDH
6# 5#
123.28 105.10
Sumber: Hasil penelitian (2013) Komparasi Hasil Prediksi Variabel Input 10 Lag Dari hasil proses pengamatan antara dua model jaringan syaraf dengan menggunakan lag 10 dapat disimpulakan bahwa model GMDH dengan sub model nomor 10 menghasilkan nilai terbaik dalam melakukan prediksi dibandingkan dengan model SVR. Hasil dari pengujian dua model algoritma tersebut ada di tabel berikut: Tabel 2 Komparasi Hasil Algoritma SVR dan GMDH dengan Variabel Input 10 Lag
Sumber: Hasil penelitian (2013) Analisa Hasil dan Komparasi Model Lag 6 dan Lag 10 Perbandingan antara penggunaan jumlah variabel prediksi dengan 6 lag dan 10 lag pada prediksi dengan algoritma Support Vector Regression(SVR) dan Group Method Data Handling(GMDH) Polynomial , hasilnya dapat dilihat pada tabel 3. Dalam hal keakuratan prediksi, model Neural Network algoritma Support Vector Regression (SVR) dengan variabel prediksi 6 lag sub model 6 lebih baik dari model GMDH pada lag yang sama. Pada variable prediksi dengan jumlah lag 10 model SVR tidak lebih baik dari pada model GMDH dengan sub model 5 namun hasilnya tidak lebih baik dari pada model SVR sub model 6 dengan nilai RMSE terkecil dibandingkan model lainnya.
10 Lag
Model
RMSE
Variabel Input
ME
MAE
MAPE
Data Training 386.68 13.17 383.51 13.66 Data Testing 261.00 105.36 239.41 101.23 Data Training 387.32 13.62 381.83 13.79 Data Testing 268.37 104.60 200.00 92.31
2.22 2.28 6.46 6.32 2.27 2.33 6.36 6.00
Sumber: Hasil penelitian (2013)
KESIMPULAN Penelitian ini membandingkan antara dua model variabel prediksi 6 lag dan 10 lag pada algoritma Support Vector Regression (SVR) dan Group Method Data Handling (GMDH) Polynomial. untuk mendapatkan algoritma terbaik yang dapat memprediksi harga saham Astra Graphia. Pada penelitian ini kesimpulan yang dapat diambil adalah: a. Penggunaan variabel prediksi 6 lag hasilnya relatif lebih akurat dibandingkan dengan 10 lag pada Support Vector Regression (SVR). Namun pada model Group Method Data Handling (GMDH) Polynominal hasilnya relatif lebih akurat menggunakan variabel prediksi 10 lag dibandingkan 10 lag. b. Antara model variabel prediksi 6 lag dan 10 lag ternyata model 10 lag tidak selalu lebih unggul hal ini dibuktikan dari analisa hasil algoritma SVR dengan lag 6 menghasilkan nilai RMSE terkecil yaitu 24.03 di sub model 6# pada pengujian data training. c. Model Support Vector Regression (SVR) dengan variabel prediksi 6 lag lebih akurat dibandingkan model SVR dengan 10 lag. Model Support Vector Regression (SVR)dengan variabel prediksi 10 lag memberi nilai lebih baik jika dibandingkan dengan Model GMDH dengan lag 10.
INF-220
ISBN: 978-602-72850-4-0
SNIPTEK 2013
Sehingga model Support Vector Regression (SVR) dengan variabel prediksi 6 lag merupakan model terbaik yang dapat diterapkan pada peramalan harga saham Astra Graphia jika dibandingkan dengan GMDH Polynomial .
Liao, T. W. (2007). In Recent Advances in Data Mining of Enterprise Data:Algorithms and Applications. Louisiana State University, USA: World Scientific Publishing Co.Pte.Ltd.
UCAPAN TERIMA KASIH
Nordbotten, S. (2006). Data Mining with Neural Networks. Bergen: Svein Nordbotten & Associates.
Terima kasih kepada orang tua, kerabat, teman dan semua pihak yang tidak dapat disebutkan satu persatu sehingga penelitian ini selesai dilakukan.
REFERENSI O’Brien , J. (2010). Pengantar Sistem Informasi Ed. 12. Jakarta: Salemba Empat . Gorunescu, F. (2011). In Data Mining: Concepts Models and Techniques. Verlag Berlin Heidelberg, Springer. Han, J. K. (2006). Data Mining: Concepts and Technique. In M. K. Publishers. San Fransisco. Husnan, S. (2003). DasarTeori Portofolio Dan Analisis Sekuritas, Edisi Pertama. Yogyakarta: UPP-AMP YKPN. Jogiyanto, H. (2000). Teori Portofolio dan Analisis Investasi, Edisi Kedua. Yogyakarta: BPFE. Larose, D. (2005). In Discovering Knowledge in Data: An Introductio to Data Mining. New Jersey: John Willey & Son Inc.
INF-221
Purnomo, M. H. (Agustus,2002). Dasar Algoritma Cerdas. PENS ITS Surabaya. Sanjaya , I. (2011). Peramalan Harga Saham Industri Telekomunikasi. Jakarta: Puslitbang Postel. Santosa, B. (2007). In Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu. Sherrod, P. H. (2003-2013). DTREG-Predictive Modeling Software. www.dtreg.com. Soelistyani, Y. (2013). Model Peramalan Harga Saham Dengan Pendekatan Neural Network Algoritma Multilayer Perceptron(MLP) Dan Support Vector Regression (SVR). Jakarta: Universitas Budi Luhur. Wardani, G. U. (2006). Penggunaan Algoritma Genetik dan Artificial Neural Network Untuk Peramalan Harga Saham. Bandung: Institut Teknologi Bandung. Witten, I. H., Eibe, F., & Hall, M. A. (2011). Data Mining, Practical Machine Learning Tools and Techniques, 3th Edition. Elsevier.