SISFO-Jurnal Sistem Informasi
ADAPTIVE SMOOTHING NEURAL NETWORK UNTUK PERAMALAN NILAI TUKAR MATA UANG Wiwik Anggraeni Jurusan Sistem Infomasi, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember Surabaya Gedung Teknologi Informasi, Jalan Raya ITS, Kampus ITS Keputih, Surabaya, 60111 Telp : (031) 5922949, Fax : (031) 5964965 Email :
[email protected]
Abstrak Makalah ini mengajukan sebuah teknik peramalan baru, yang dinamakan ASNN (Adaptive Smoothing Neural Network) - yang digunakan untuk meramalkan perubahan valuta asing. Dalam model ini, teknik adaptive smoothing digunakan untuk mengatur nilai dari parameter pembelajaran neural network secara otomatis dengan cara melakukan tracking sinyal di lingkungan yang dinamis. Dengan menggunakan teknik ini diharapkan bisa mempercepat proses pembelajaaran dan konvergensi. serta membuat generalisasi network yang lebih bagus daripada menggunakan cara tradisional, yaitu model MLFN(Multi Layer Feedforward Network). Untuk membuktikan keefektifan dari model yang diajukan, dilakukan percobaan untuk meramal peredaran mata uang. Analisis menunjukkan bahwa hasil yang didapat menggunakan model baru mengungguli model lainnya. Dari hasil eksperimen lebih lanjut dapat disimpulkan bahwa model baru ini bisa menjadi alternatif yang efektif untuk meramalkan nilai pertukaran mata uang asing. Kata Kunci : Adaptif Smoothing, Neural Network, Peramalan, Nilai Tukar, Mata Uang
1. PENDAHULUAN Tingkat kesulitan untuk meramalkan nilai pertukaran mata uang sangatlah tinggi, hal ini dikarenakan tingginya tingkat perubahan dan kompleksitas. Hal ini menjadi pusat perhatian pada pasar finansial internasional karena masih sedikitnya metode yang bisa digunakan untuk mendapatkan hasil ramalan yang lebih baik. Beberapa penelitian untuk mendapatkan metode yang efektif untuk meramalkan nilai pertukaran mata uang telah memunculkan banyak metodemetode seperti MLFN, Recurrent Neural Network (RNN), Clustering Neural Network (CNN), General Regression Neural Network (GRNN), Error Correction Neural Network (ECNN), dan metode-metode lainnya. Beberapa literatur yang ada difokuskan pada pengembangan MLFN (Multi Layer Feedforward Network). Walaupun begitu, pada MLFN terdapat beberapa batasan, misalnya waktu untuk konvergensi pada MLFN biasanya lambat, dan juga mudah terjebak pada local minima, sehingga solusi yang didapat tidak optimal, dan menyebabkan kapabilitas dari model neural networknya melemah. Maka dari itu, metode baru menggunakan teknik adaptive smoothing ini dibentuk untuk mengatasi batasan-batasan sehingga bisa menghasilkan sebuah ramalan nilai tukar mata uang yang kokoh. dan untuk evaluasi
performanya hasil dari model Adaptive Smoothing Neural Network for Forecasting (ASNN) ini akan dibandingkan dengan model MLFN.
2.
ADAPTIVE NETWORK
SMOOTHING
NEURAL
2.1 Neural Network
ANN (Artificial Neural Network) dibangun dengan meniru sistem otak manusia, yang terdiri dari neuron dan node. Setiap node menerima sinyal input dari node lain ataupun eksternal input. Setelah memproses sinyal secara lokal melalui fungsi transfer, sinyal yang ditransformasi adalah output yang akan digunakan node lain ataupun bisa merupakan keluaran final. ANN dikarakteristikan seperti pada arsitektur jaringan, yaitu terdiri dari beberapa jumlah layer dan node dimana layer dan node saling terhubung. Pada contoh kasus MLFN, semua node dan layer diatur dengan cara feedforward. Layer pertama adalah input layer yang merupakan penerima dari masukan eksternal. Sedangkan layer terakhir adalah output layer, yaitu layer yang akan menunjukkan / menghasilkan solusi. Memungkinkan terdapat satu atau lebih hidden layer dimana sangat penting bagi ANN untuk mengidentifikasi pola
17
SISFO-Jurnal Sistem Informasi data yang kompleks. Semua node ada pada layer yang sejajar dan terkoneksi dari layer terbawah sampai layer tertinggi. ANNs merupakan suatu model yang sudah memiliki kemampuan untuk melakukan pendekatan pada berbagai macam data yang nonlinear. Hal ini juga yang menyebabkan ANN begitu populer. Bagaimanapun juga, MLFN mempunyai beberapa kekurangan seperti lambatnya proses konvergensi yang akhirnya menyebabkan lamanya waktu pembelajaran yang dibutuhkan. MLFN juga mudah terperangkap pada local minima yang menyebabkan model dari solusi yang tercipta juga lemah. Pertanyaannya, bila melihat fakta yang dijelaskan di atas, pembuatan arsitektur jaringan yang baik merupakan salah satu masalah yang masih diteliti saat ini, maka dari itu, paper ini mengajukan algoritma baru untuk meningkatkan kemampuan dari MFLN dengan memperkenalkan teknik adaptive smoothing. 2.2
Model Adaptive Network
Smoothing
Neural
Dalam pembelajaran ini, teknik adaptive smoothing digunakan untuk mengatur parameter pembelajaran (learning parameter) ANN secara otomatis berdasarkan jalannya sinyal dibawah lingkungan yang berubah secara dinamis. Hal ini menghasilkan algoritma pengaturan bobot (weight) yang baru dengan menggunakan kebijakan dalam konsep Quality Control (QC). Pada MLFN, bentuk model error yang biasa digunakan yaitu squared error atau mean square error (MSE). Akan tetapi dengan menggunakan pengukuran error ini akan sulit untuk mendapatkan deviasi antara nilai aktual dengan nilai keluaran yang diharapkan. Didalam proses pembelajaran ANN, algoritma adaptive smoothing dapat menggunakan ordinary error dan mean absolute deviation (MAD) sebagai tambahan pengukuran error untuk mengatur parameter jaringan seperti bobot pembelajaran. Dengan bantuan dari cumulative ordinary error (COE), MAD, dan derivative tracking signal (TS), algoritma adaptive smoothing neural network dapat diformulasikan. Asumsikan bahwa sebuah jaringan dengan m lapisan memiliki n node, fungsi transfer tiap node berupa fungsi sigmoid
1 ), dimana y adalah keluaran 1 + e −x dari lapisan keluaran, oi adalah keluaran dari semua unit i didalam lapisan tersembunyi, wij
(
f ( x) =
adalah bobot pada koneksi dari unit ke-j hingga unit ke i. Misalkan ada N pasangan sampel
18
( xk , y k ) ( k
= 1,2,..., N ),
unit keluaran ke-i
yang terhubung dengan sampel ke-k adalah
oik ,
unit masukan ke-j yang terhubung dengan sampel ke-k adalah
net jk = ∑iwij oik
(1)
Dan unit keluaran j yang terhubung dengan sampel ke-k adalah
o jk = f (net jk )
(2)
Fungsi error yang digunakan adalah squared error yang didefinisikan dengan
E=
1 N ( y k − yˆ k ) 2 , ∑ k =1 2
ordinary
error
(COE)
N
COE ( N ) = ∑k =1 ( y k − yˆ k ) , adalah nilai aktual dan jaringan. Jika
Ek
yˆ k
dan
cumulative adalah dimana
yk
adalah nilai keluaran
COEk
merupakan
squared error dan error biasa terhubung dengan sampel ke-k, maka
E k = ( y k − yˆ k ) 2 dan
COE k = ( y k − yˆ k ) . Oleh karena COE ( N ) = COE ( N − 1) + COE N .
itu
Kemudian mean absolute deviation (MAD) dan tracking signal (TS) didefinisikan dengan
∑ MAD( N ) = TS =
N k =1
COE ( N ) MAD( N )
y k − yˆ k N
(3)
(4)
Jika nilai TS sangat besar, hal ini berarti bahwa nilai COE(N) besar, relatif terhadap mean absolute deviation MAD(N). Jika hal ini terjadi, maka pada saat tertentu output jaringan menghasilkan error yang secara konsisten bernilai positif atau negatif. Nilai dari TS yang besar secara tidak langsung mempengaruhi jaringan untuk menghasilkan output peramalan yang konsisten lebih kecil atau konsisten lebih besar dibandingkan dengan nilai aktual yang sedang diramalkan. Karena akurasi dari sistem peramalan harus menghasilkan setengah error positif dan setengah error negatif, maka nilai TS yang besar mengindikasikan bahwa output peramalan tidaklah bagus atau tidak dapat dipercaya. Jika nilai TS (dinotasikan dengan θ ) melampaui batas control selama dua atau lebih
SISFO-Jurnal Sistem Informasi periode yang berurutan, hal tersebut dapat menyebabkan error peramalan lebih besar dibandingkan dengan hasil yang diharapkan oleh sistem peramalan. Dalam pembelajaran kami, batas control θ secara umum didapat dari 3σ untuk model ANN dengan bantuan dari yang diusulkan oleh 3σ limits theory Shewhart (Zhang, 2001). Jika sinyal error menunjukkan bahwa penyesuaian perlu dilakukan, maka akan ada beberapa kemungkinan yang terjadi. Kemungkinan pertama adalah model perlu diubah. Untuk hal ini, variabel masukan perlu ditambah atau dikurangi untuk mendapatkan representasi yang lebih baik dari periode waktu (time series). Kemungkinan yang lain adalah tidak perlu melakukan perubahan pada model yang digunakan, tetapi estimasi parameter dari model yang perlu diubah. Ketika menggunakan model ANN, hal ini diselesaikan dengan merubah parameter dari ANN tersebut misalnya bobot model dan bias. Error gradien didefinisikan
δ jk =
∂E k , ∂net jk
kemudian
∂E k ∂E k ∂net jk ∂E k = . = .oik = δ jk .oik (5) ∂Wij ∂net jk ∂Wij ∂net jk (i)
Jika j adalah node keluaran,
∂E k ∂E ∂yˆ k = k. = −( y k − ∂net jk ∂yˆ k ∂net jk
(ii) Jika j bukan node keluaran, maka
δ jk =
di propagasi kembali ke lapisan
sebelumnya sesuai rumus (6) dan (9). Saat jaringan melakukan pembelajaran, nilai dari tiap bobot telah disesuaikan dalam proporsi pada tiap kontribusi unit untuk total error dalam rumus (6) dan (9). Peningkatan perubahan dalam tiap bobot pada iterasi pembelajaran dihitung menggunakan rumus (10) dan (11) menjadi seperti berikut:
ΔWij = c1 .δ jk .oik + c 2 .ϕ jk
(10)
c1 adalah parameter pembelajaran (learning rate) dengan nilai ( 0 ≤ c1 < 1), c 2 Dimana
adalah konstanta integer positif yang nilainya kurang dari 1.0, c 2 merupakan smoothing rate untuk merubah bobot secara halus; dan
⎧0, ⎪ ϕ jk = ⎨− COE ( N ), ⎪COE ( N ), ⎩ TS ≤ θ , (θ = 3σ [6] _ atau _ θ = 4.MAD[7]) TS > θ , _ dan _ TS ≤ 0;
(11)
TS > θ , _ dan _ TS > 0.
Yang jelas ada perbedaan antara penyesuaian bobot disini dan momentum tradisional. Momentum tradisional hanya digunakan untuk meningkatkan kecepatan pembelajaran jaringan, sedangkan penyesuaian bobot kita tidak hanya kecepatan pembelajaran saja, yˆ k ). f ' (net meningkatkan jk ) (6) akan tetapi dapat juga menyesuaikan jalan pencarian jaringan dan konvergensi kecepatan jaringan dan meningkatkan kemampuan pembelajaran ANN.
∂o jk ∂E k ∂E ∂E = k . = k . f ' (net jk ) (7) ∂net jk ∂o jk ∂net jk ∂o jk
∂E k ∂E k ∂net mk ∂E k ∂ = ∑m . = ∑m . ∂o jk ∂net mk ∂o jk ∂net(8) mk ∂o jk ⎧δ jk = f ' (net jk )∑m δ mk Wmj ⎪ ⎨ ∂E k ⎪ ∂W = δ jk .oik ⎩ ij
δ jk
o jk = yˆ k ,
maka
δ jk =
Error
(9)
Untuk lebih jelasnya, algoritma untuk ASNN seperti dibawah ini: 1)
Inisialisasi bobot secara acak untuk menghindari titik jenuh dalam proses pembelajaran. ∂E k dibawah ini (dalam 2) Iterasikan proses W .oik = inggris) Wmjprosedur, = m δ mkhingga .Wmj i mibahasa m ∂netsesuai mk memenuhi goal error a. For k=1 to N i. Hitung
∑
∑
∑
oik , net jk , COE ( N ), MAD( N ) and yˆ k (forward process)
19
SISFO-Jurnal Sistem Informasi
ii.
b.
c.
Hitung
δ jk
dari layer output
ke layer sebelumnya (backward process) Hitung δ jk untuk setiap node pada layer yang sama dengan menggunakan persamaan (6) dan (9) Hitung rata-rata bobot dengan persamaan (10) and (11).
Biasanya, kita relatif mampu mendapatkan manfaat dari algoritma MLFN tradisional. Untuk pertama kali, batas error pembelajaran (learning error limits) dapat dikontrol melalui program yang berhubungan, memperkecil ruang pencarian dan meningkatkan akurasi pembelajaran. Kedua, parameter model dapat disesuaikan secara adaptif dalam kaitannya dengan tracking signal, sehingga membuat pembelajaran jaringan makin efisien. Ketiga, jalan pencarian dapat disesuaikan dengan smoothing factor hingga hal tersebut mempermudah mendapatkan solusi jaringan yang optimal dibandingkan dengan algoritma MLFN. Secara singkat, ASNN dapat menyesuaikan parameter model secara adaptif dan otomatis melalui tracking signal, membuat kecepatan pencarian sehingga konvergensi jaringan lebih cepat dan menghindari lokal minima sejauh mungkin.
nilai
pengamatan
masa
lalu
( x t −1 , x t − 2 ,..., x t − p ) hingga masa yang akan datang
x t , contoh
xt = g ( xt −1 , xt − 2 ,..., xt − p , v) + ξ t
(13)
Dimana v adalah vektor dari semua parameter dan g adalah fungsi non-linier yang ditentukan oleh struktur jaringan dan koneksi bobot. Kemudian, dalam beberapa pengertian, model ASNN ekuivalen dengan model nonlinear autoregressive (NAR) (Yu, 2004). 2.4 Uji Coba 2.4.1 Sumber Data Dalam paper ini digunakan tiga dataset yang berbeda untuk analisis kinerja peramalan. Data yang digunakan adalah data harian yang diambil dari Paciifc Exchange Rate Service. Data tersebut adalah data harga mata uang USD terhadap EUR, GBP, dan JPY. Data pada tanggal 1 Januari 2000 sampai 31 Oktober 2002 digunakan sebagai training set dan data pada 1 Nopember 2002 sampai 31 Desember 2002 sebagai test set. 2.4.2 Hasil Uji Coba Berikut ini adalah hasil dari peramalan dengan menggunakan dataset yang disediakan.
2.3 Adaptive Smoothing Neural Network untuk Peramalan Time Series ASNN dapat dilatih (train) dengan menggunakan data historis time series dalam rangka untuk mendapatkan karakteristik nonlinier dari time series yang spesifik. Parameter model (seperti koneksi bobot dan node bias) akan disesuaikan berulang-ulang melalui proses minimalisasi error peramalan (contoh: MSE). Untuk peramalan time series, bentuk komputasi model ASNN dengan tiga lapisan jaringan di ekspresikan seperti rumus dibawah ini q
p
xt = a 0 + ∑ j =1 w j f (a j + ∑i =1 wij xt −i ) + ξ t (12)
Dimana
a j ( j = 0,1,2,..., q) adalah bias pada
unit ke-j, dan
wij (i = 1,2,..., p; j = 1,2,..., q)
adalah koneksi bobot antara lapisan dari model, f(*) adalah fungsi transfer pada lapisan tersembunyi, p adalah jumlah node masukan dan q adalah jumlah node tersembunyi. Sebenarnya, model ASNN dalam (12) menyediakan fungsi pemetaan non-linier dari
20
Gambar 1: Perbandingan Hasil Peramalan dengan Data Asli untuk EUR/USD
Sebagai pembanding, diberikan juga hasil peramalan dengan menggunakan multi-layer feed-forward neural network (MLFN) serta backpropagation yang hasilnya dapat dilihat pada tabel 1 berikut. Tabel 1. Perbandingan performa hasil peramalan
MLFN
ASSN
BP
GBP/USD
0.5672
0.1165
0.2924
EUR/USD
0.2111
0.0079
0.2347
SISFO-Jurnal Sistem Informasi
USD/JPY
0.2734
0.1132
0.3697
adanya beberapa faktor yang mempengaruhi Yen Jepang. Satu alasan yang mungkin, nilai tukar USD/JPY lebih fluktuatif daripada Poundsterling Inggris. Walaupun begitu, eksperimen menunjukkan bahwa peramalan mata uang dengan ASNN layak dilakukan, dan hasilnya menjanjikan. 3. SIMPULAN
Gambar 2: Perbandingan Hasil Peramalan dengan Data Asli untuk GBP/USD
Gambar 3: Perbandingan Hasil Peramalan dengan Data Asli untuk USD/JPY
Grafik dari hasil tersebut dapat dilihat pada gambar 4 berikut
Dari penelitian ini ditemukan potensi penggunaan model ASNN untuk memprediksi nilai tukar mata uang. Hasil empiris kami menunjukkan bahwa peramalan menggunakan ASNN memberi hasil lebih baik daripada peramalan menggunakan MLFN dan backpropagation. Walaupun begitu, penelitian ini juga menyoroti beberapa permasalaha yang perlu diperhatikan lebih lanjut. Misalnya, akurasi yang masih belum memuaskan pada mata uang tertentu seperti Yen Jepang. Permasalahan diatas tentu saja memberi arah dalam riset lebih lanjut untuk memformulasikan ASNN yang lebih baik seperti berikut : (i) Karena Pasar mata uang merupakan sistem yang sangat kompleks, maka faktor-faktor yang mempengaruhinya perlu lebih banyak diperhatikan. (ii) Algortima adaptive smoothing yang telah dijelaskan di sini sebaiknya ditambahkan pada paket software, sehingga pengguna yang bekerja pada domain lain dapat dengan mudah menggunakan model baru ini untuk bidang mereka. 4. DAFTAR PUSTAKA Chen, A.S., Leung, M.T.: Regression neural network for error correction in foreign exchange forecasting and trading. Computers and Operations Research, 31, (2004) 1049-1068. Gencay, R.: Linear, nonlinear and essential foreign exchange rate prediction with simple technical trading rules. Journal of International Economics, 47, (1999) 91-107.
Gambar 4: Perbandingan Performance Hasil Peramalan
Dari Gambar 4 dan Tabel 1 terlihat bahwa: (i) dilihat dari NMSE, model ASNN secara konsisten lebih baik daripada MLFN; (ii) NMSE dari model MLFN jauh lebih besar daripada ASNN, mengindikasikan bahwa teknik adaptive smoothing dapat secara efektif mengontrol perubahan error dan secara signifikan meningkatkan kinerja jaringan. Diantara ketiga pasangan mata uang diatas, peningkatan terbesar adalah pada Poundsterling Inggris, dan peningkatan terendah adalah pada Yen Jepang. Hal ini menunjukkan kemungkinan
Leung, M.T., Chen, A.S., Daouk, H.: Forecasting exchange rates using general regression neural networks. Computers and Operations Research, 27, (2000) 1093-1110. Refenes, A.N., Azema-Barac, M., Chen, L., Karoussos, S.A.: Currency exchange rate prediction and neural network design strategies. Neural Computing and Applications, 1, (1993) 46-58. Tenti, P.: Forecasting foreign exchange rates using recurrent neural networks. Applied Artificial Intelligence, 10, (1996) 567-581.
21
SISFO-Jurnal Sistem Informasi Yao, J.T., Tan, C.L.: A case study on using neural networks to perform technical forecasting of forex. Neurocomputing, 34, (2000) 79-98. Yu, L.A., Wang, S.Y., Lai, K.K.: A novel nonlinear ensemble forecasting model incorporating GLAR and ANN for foreign exchange rates. Computers and Operations Research, (2004) In Press. Zhang, G.P., Berardi, V.L.: Time series forecasting with neural network ensembles: an application for exchange rate prediction. Journal of the Operational Research Society, 52, (2001) 652-664.
22