Bab I PENDAHULUAN
1.1 Latar Belakang Masalah Teori wavelet merupakan salah satu perkembangan yang relatif baru dalam bidang matematika. Teori wavelet merupakan suatu teori yang sangat potensial untuk digunakan dalam penyelesaian berbagai permasalahan terapan, antara lain pemrosesan sinyal, kedokteran, pemampatan data, geofisika, astronomi dan statistika nonparametrik (Ogden, 1997). Beberapa aplikasi wavelet dalam statistika, antara lain pada statistika nonparametrik. Dalam hal ini, wavelet digunakan untuk mengestimasi fungsi atau densitas dikarenakan tidak diperlukannya lagi asumsi kemulusan pada fungsi atau densitas yang akan diestimasi. Dalam model regresi nonparametrik, wavelet digunakan sebagai metode penyusutan wavelet yang dikenal dengan metode WaveShrink. Motivasi penggunaan WaveShrink untuk regresi nonparametrik adalah guna memperoleh suatu estimator fungsi yang bebas dari noise dan tetap mempertahankan ciri-ciri khas dari fungsi yang diestimasi, juga untuk mendapatkan suatu estimator yang dapat digunakan untuk mengestimasi fungsi-fungsi yang non homogen. Suatu transformasi wavelet adalah suatu teknik dekomposisi untuk time series atau sinyal yang dapat menghasilkan suatu multiresolusi di dalam domain waktu dan frekuensi yang sangat baik, serta algoritma perhitungan yang efisien. Dekomposisi multiresolusi memisahkan tren dari sinyal atau time series pada skala yang berbeda dari koefisien-koefisien wavelet dan scaling. Secara umum, transformasi wavelet merupakan suatu alat yang sangat powerful (kuat) dalam menangkap fenomena transien/peralihan (Zhang dkk., 2001). Deteksi karakteristik pola-pola yang signifikan dari data historis adalah sangat penting untuk hasil yang baik dalam peramalan time series. Analisis wavelet, yang mana memproses informasi secara efektif pada skala yang berbeda, sangat bermanfaat untuk deteksi karakteristik dari time series yang kompleks dan tidak beraturan, terutama sifatsifat wavelet lokal yang spesifik (Shin dan Han, 2000). 1
2
Salah satu metode transformasi wavelet adalah Maximal Overlap Discrete Wavelet Transform (MODWT). MODWT dapat didefinisikan pada semua ukuran sampel, tidak seperti Discrete Wavelet Transform (DWT) yang mensyaratkan data yang akan digunakan harus memenuhi kelipatan 2 J dengan J bilangan bulat positif, padahal dalam dunia real kebanyakan data time series mempunyai panjang yang tidak memenuhi kelipatan 2 J . Jika metode DWT digunakan pada data yang panjangnya tidak memenuhi kelipatan 2 J maka akan dilakukan pengurangan data sampai memenuhi kelipatan 2 J . Hal ini sangat merugikan sebab dapat menghilangkan sebagian informasi dari data. Ini berarti MODWT dapat menghindari terjadinya downsampling. Dalam MODWT juga selalu terdapat n (ukuran sampel) koefisien wavelet dan koefisien scaling pada masing-masing levelnya (Percival dan Walden, 2000). Pada tahun 1943, McCulloch dan Pitts memperkenalkan suatu model sederhana, mirip jaringan syaraf nyata dalam otak manusia seperti unit threshold yang biner. Sejak saat itu banyak aktivitas yang berkenaan dengan neural networks yang dilakukan dan dikembangkan. Mula-mula neural networks dirancang untuk memodelkan bentuk arsitektur syaraf pada otak manusia. Dalam perkembangannya, banyak penelitian-penelitian yang dilakukan dan dimotivasi oleh adanya kemungkinan untuk menggunakan neural networks sebagai suatu alat untuk menyelesaikan berbagai masalah aplikasi antara lain pattern recognition, signal processing, process control, klasifikasi dan peramalan. Neural networks merupakan suatu kumpulan dari elemen-elemen pemroses yang saling berhubungan dan disebut dengan unit-unit atau syarafsyaraf. Frase neural networks mempunyai arti luas dan bervariasi pada bidangbidang penelitian yang berbeda (Bishop, 1995). Neural networks dikenal sebagai suatu pendekatan yang fleksibel untuk memodelkan hubungan linier atau non linier. Neural networks menjadi alternatif yang banyak menarik perhatian, antara lain disebabkan karena tidak memerlukan asumsi-asumsi bentuk hubungan fungsional antar variabel yang seringkali sulit dipenuhi. Dalam keadaan ini neural networks dapat dipandang sebagai metode statistik non linier dan non parametrik (Ripley, 1996). Sebagai model non parametrik, neural networks mempunyai
3
bentuk fungsional yang fleksibel, yang memuat beberapa parameter yang tidak dapat diinterpretasikan seperti pada model parametrik. Salah satu aplikasi neural networks dalam analisis statistika adalah untuk peramalan data time series. Meski neural networks mempunyai bentuk fungsional yang fleksibel, namun untuk peramalan data time series, neural networks masih mempunyai kelemahan. Salah satu permasalahan utama dalam pemodelan neural networks adalah menentukan variabel input dari model neural networks untuk mendapatkan arsitektur model yang optimal. Salah satu metode untuk mendapatkan kandidat variabel input dari model neural networks adalah melakukan pemrosesan awal dari data (data preprocessing). Dalam perkembangannya, wavelet digunakan sebagai dasar dekomposisi untuk data preprocessing dalam pembentukan model hibrid Wavelet Neural Networks (WNN) baik yang diaplikasikan untuk tujuan klasifikasi atau estimasi regresi nonparametrik maupun untuk tujuan peramalan data time series. Secara umum, WNN merupakan neural networks dengan fungsi-fungsi wavelet yang digunakan dalam pemrosesan di fungsi transfer. Dalam kasus peramalan time series, input yang digunakan dalam WNN adalah koefisienkoefisien wavelet dan scaling pada suatu waktu dengan resolusi tertentu. Bermacam-macam transformasi wavelet dapat digunakan dalam pemodelan WNN, baik yang menggunakan domain waktu, domain frekuensi maupun gabungan domain waktu dan frekuensi. Beberapa contoh aplikasi model WNN yang menggunakan domain waktu adalah aplikasi model kombinasi antara MODWT sebagai data preprocessing dan multilayer perceptron dengan menggunakan algoritma backpropagation untuk peramalan data time series non musiman (Renaud dkk., 2003; Suhartono dan Subanar, 2009), juga untuk peramalan data time series musiman (Suhartono dkk., 2010), model kombinasi antara MODWT sebagai data preprocessing dan dynamic recurrent neural networks (Murtagh dkk., 2004). Penelitian-penelitian tersebut mengakomodasi pemilihan input lag-lag koefisien wavelet dan koefisien scaling yang diusulkan Renaud dkk. (2003). Lebih lanjut, Suhartono dan Subanar (2009) dan Suhartono dkk. (2010) juga melakukan kombinasi antara beberapa lag-lag tambahan dan
4
pemilihan input yang diusulkan Renaud dkk. (2003) yang diidentifikasi menggunakan stepwise sebagai input model WNN. Salah satu hasil kajian empiris dari penelitian-penelitian tersebut menunjukkan bahwa model WNN dapat bekerja dengan baik untuk peramalan data time series yang stasioner. Algoritma backpropagation merupakan algoritma yang sangat banyak digunakan untuk pembelajaran yang terawasi dengan multilayer Feedforward Neural Networks (FFNN). Namun terdapat permasalahan utama dari algoritma backpropagation yaitu sulitnya mendefinisikan suatu learning rate yang tepat/cocok untuk keseluruhan proses training dan networks. Pemilihan learning rate yang tepat sangat diperlukan sebab skala derivatif mempunyai pengaruh yang sangat penting terhadap waktu yang diperlukan sampai mencapai konvergen. Jika learning rate sangat kecil maka terlalu banyak step yang diperlukan sampai mencapai suatu penyelesaian yang dapat diterima, sebaliknya jika sangat besar mungkin akan mendorong ke arah osilasi sehingga menghalangi error jatuh pada suatu nilai tertentu. Algoritma resilient backpropagation merupakan salah satu algoritma yang digunakan untuk mengatasi permasalahan dari algoritma backpropagation. 1.2 Perumusan Masalah Sebagaimana yang telah dijelaskan pada latar belakang masalah, problem utama dalam pembentukan model WNN dalam kerangka pemodelan statistik adalah bagaimana menentukan arsitektur WNN yang optimal yang merupakan kombinasi antara transformasi wavelet dan multilayer FFNN untuk suatu data time series musiman. Sampai saat ini belum ada prosedur yang baku atau standar yang telah dikembangkan peneliti terdahulu, khususnya berkaitan dengan model WNN untuk pemodelan time series musiman. Hal inilah yang menjadikan motivasi untuk melakukan penelitian lebih lanjut (penelitian disertasi) tentang metode WNN untuk pemodelan time series khususnya data time series musiman. Dalam penelitian disertasi ini, digunakan transformasi wavelet metode MODWT, algoritma pembelajaran resilient backpropagation dan kombinasi pilihan input lag-lag koefisien wavelet dan koefisien scaling sesuai dengan yang diusulkan
5
Renaud dkk. (2003) dan ditambah lag-lag musiman dengan atau tanpa lag-lag yang dekat dengan lag musiman. Penambahan lag-lag musiman dengan atau tanpa lag-lag yang dekat dengan lag musiman dari koefisien wavelet dan koefisien scaling ini, dimotivasi oleh karena pilihan input usulan Renaud dkk. (2003) yang belum mengakomodasi lag-lag tersebut. Dalam rangka mendapatkan suatu prosedur pembentukan model WNN untuk pemodelan time series musiman (lebih khusus dalam disertasi ini disebut model Multiscale Seasonal Autoregressive Feedforward Neural Networks atau MSAR-FFNN) yang merupakan model hibrid baru yang pada akhirnya diharapkan dapat diterima sebagai suatu prosedur alternatif, maka fokus penelitian disertasi adalah: 1. bagaimana model MSAR-FFNN, cara menentukan estimator bobotbobotnya
serta
sifat-sifat
asimtotik
estimatornya
(konsisten
dan
normalitas). 2. bagaimana pengembangan prosedur yang tepat untuk: -
identifikasi lag-lag koefisien wavelet dan koefisien scaling yang tepat (pada suatu waktu dan resolusi tertentu) sebagai input model MSARFFNN untuk pemodelan time series musiman.
-
penentuan banyaknya neuron di lapisan tersembunyi pada MSARFFNN untuk pemodelan time series musiman.
-
pengujian lag-lag input model MSAR-FFNN.
3. bagaimana perbandingan ketepatan ramalan antara model- model MSARFFNN, Exponential Smoothing Holt-Winters dan Seasonal Autoregressive Integrated Moving Average (SARIMA). 1.3 Batasan Masalah Berdasarkan
permasalahan
pada
penelitian
ini,
terdapat
banyak
kemungkinan yang dapat dilakukan berkaitan dengan model kombinasi antara transformasi wavelet dan neural networks untuk data time series musiman. Oleh karena itu, dipandang perlu dilakukan pembatasan masalah agar penelitian
6
disertasi ini dapat lebih fokus. Berikut adalah batasan masalah yang dilakukan pada penelitian disertasi. 1. Ada banyak macam data time series musiman yang dapat diterapkan pada pemodelan wavelet baik linier maupun nonlinier. Penelitian disertasi ini fokus hanya pada data time series musiman yang mempunyai karakteristik memuat komponen sebagai berikut: musiman yang stasioner; musiman multiplicative yang stasioner; musiman nonlinier yang stasioner; tren additive dan musiman additive; tren additive dan musiman multiplicative; musiman yang nonstasioner dalam variansi. 2. Banyak macam filter wavelet yang dapat digunakan pada dekomposisi MODWT. Penelitian disertasi ini fokus hanya pada filter wavelet Haar (Daubechies 2) dan filter wavelet Daubechies 4 atau D(4) karena merupakan 2 filter wavelet yang paling sederhana dibandingkan yang lain. 3. Model neural networks yang dibahas adalah model FFNN dengan menggunakan satu lapisan tersembunyi yang mempunyai fungsi aktivasi logistik sigmoid dan fungsi aktivasi linier di lapisan output. Banyak algoritma pembelajaran yang dapat digunakan dalam model FFNN. Penelitian disertasi ini fokus hanya pada algoritma pembelajaran resilient backpropagation, karena merupakan salah satu algoritma yang dapat mengatasi kelemahan algoritma tradisional backpropagation. 1.4 Tujuan Penelitian Berdasarkan permasalahan yang berkaitan dengan model WNN untuk pemodelan time series musiman sebagaimana telah dijelaskan sebelumnya, maka secara umum tujuan penelitian adalah untuk mengkaji lebih lanjut tentang prosedur pembentukan model WNN yang sesuai pada suatu data time series musiman (lebih khusus disebut model MSAR-FFNN). Berikut adalah tujuan khusus dari penelitian disertasi: 1. Melakukan kajian tentang model MSAR-FFNN, cara menentukan estimator
bobot-bobotnya
(konsisten dan normalitas).
serta
sifat-sifat
asimtotik
estimatornya
7
2. Mengembangkan dan menemukan prosedur yang tepat untuk: -
identifikasi lag-lag koefisien wavelet dan koefisien scaling yang tepat (pada suatu waktu dan resolusi tertentu) sebagai input MSAR-FFNN untuk pemodelan time series musiman.
-
penentuan banyaknya neuron di lapisan tersembunyi pada MSARFFNN untuk pemodelan time series musiman.
-
pengujian lag-lag input model MSAR-FFNN.
3. Melakukan perbandingan ketepatan ramalan antara model- model MSARFFNN, Exponential Smoothing Holt-Winters dan Seasonal Autoregressive Integrated Moving Average (SARIMA). 1.5 Tinjauan Pustaka Berdasarkan kajian awal yang telah dilakukan peneliti, sejauh ini masih relatif sedikit artikel yang membahas secara rinci yang berkaitan dengan WNN, khususnya wavelet yang menggunakan domain waktu untuk pemodelan data time series musiman. Penelitian-penelitian untuk data time series musiman yang telah dilakukan oleh beberapa peneliti, antara lain pengembangan metode untuk peramalan time series musiman dan tren berdasarkan pada bobot pemulusan eksponensial (Holt, 1957; Winters, 1960), pemodelan SARIMA yang telah mempunyai pengaruh yang besar pada aplikasi praktis untuk pemodelan time series musiman (Box dkk., 1994). Banyak aplikasi dalam dunia nyata yang dapat dimodelkan dengan baik menggunakan SARIMA dan sampai saat ini merupakan salah satu metode peramalan musiman yang masih secara luas digunakan. Salah satu pendekatan untuk menangani faktor musiman dalam time series yaitu dengan cara mengekstraknya menggunakan prosedur dekomposisi musiman seperti metode X-11. Metode X-11 dan variannya termasuk X-12-ARIMA telah diteliti oleh Findley dkk. (1998). Penelitian yang mempertimbangkan pengaruh penggunaan peramalan sebagai bagian dari metode dekomposisi musiman antara lain penggunaan peramalan dalam X-11-ARIMA untuk mereduksi ukuran perbaikan dalam penyesuaian musiman dari data (Dagum, 1982). Metode dekomposisi musiman untuk peramalam data musiman yang disesuaikan dengan
8
cara penyusutan komponen musiman menuju nol menghasilkan ketepatan peramalan yang lebih tinggi telah ditunjukkan oleh Miller dan Williams (2003). Teori wavelet banyak diterapkan dalam analisis statistika antara lain statistika nonparametrik, khususnya model regresi nonparametrik, yaitu metode WaveShrink (Donoho dan Johnstone, 1995; Donoho dkk., 1995). Pada perkembangannya,
analisis
wavelet
telah
banyak
diaplikasikan
untuk
permasalahan-permasalahan statistika secara umum (Mallat, 1989; Daubechies, 1992; Vidakovic dan Peter, 1994). Review dan penelitian yang berkaitan dengan aplikasi analisis wavelet di dalam permasalahan statistika telah dilakukan, yakni mencakup regresi nonparametrik, estimasi densitas, permasalahan-permasalahan inverse, permasalahan titik perubahan dan beberapa aspek khusus dari analisis time series yaitu estimasi densitas spektral untuk proses yang stasioner dan tidak stasioner (Abramovich dkk., 2000). Bermacam-macam transformasi wavelet telah diaplikasikan, dalam hal ini, transformasi wavelet memberikan suatu dekomposisi yang baik dari suatu sinyal atau time series, sehingga struktur sementara yang diperoleh, selanjutnya dapat dianalisis dengan model-model parametrik atau nonparametrik. Perkembangan terbaru yang terjadi pada beberapa tahun terakhir ini menunjukkan bahwa beberapa penelitian telah dilakukan berkaitan dengan metode transformasi wavelet untuk analisis time series (Nason dan von Sachs, 1999; Percival dan Walden, 2000). Di samping itu, beberapa peneliti juga mengembangkan transformasi wavelet untuk prediksi data time series berdasarkan suatu model autoregressive (Bjorn, 1995; Soltani dkk., 2000; Renaud dkk., 2003; Sa’adah dkk., 2010). Seiring dengan perkembangan dan meningkatnya kekuatan komputasi, baik software maupun hardware maka model nonparametrik yang tidak memerlukan asumsi bentuk hubungan fungsional antar variabel telah menjadi lebih mudah untuk diaplikasikan. Pada saat ini banyak penelitian dilakukan dengan motivasi dari adanya kemungkinan untuk menggunakan model neural networks sebagai suatu alat untuk menyelesaikan berbagai masalah terapan. Ada tiga penggunaan utama dari neural networks, yaitu sebagai suatu model dari
9
sistem syaraf biologi dan kecerdasan, sebagai prosesor sinyal real-time yang adaptif atau pengontrol yang diimplementasikan dalam hardware untuk suatu terapan seperti robot, dan sebagai metode analisis data (Sarle, 1994). Arsitektur model neural networks mengandung sejumlah parameter (bobot) yang terbatas. Bagaimana mendapatkan bobot-bobot dari model neural networks yang tepat merupakan topik sentral dalam beberapa literatur neural networks yang telah banyak dibahas. Salah satu metode untuk membangun arsitektur model neural networks adalah metode pembelajaran untuk FFNN menggunakan algoritma backpropagation (Bishop, 1995; Ripley, 1996; Moller, 1997; Haykin, 1999). Algoritma backpropagation mempunyai kelemahan yaitu kesulitan dalam menentukan nilai learning rate yang tepat untuk keseluruhan proses training dan networks. Beberapa artikel tentang perbaikan untuk algoritma backpropagation dipresentasikan, salah satunya adalah tentang algoritma resilient backpropagation (Riedmiller dan Braun, 1993; Riedmiller, 1994). Fitting model FFNN berdasarkan algoritma backpropagation, resilient backpropagation dan globally convergent telah diimplementasikan oleh Günther dan Fritsch (2010) menggunakan software R dalam package “neuralnet”. Penelitian dan publikasi ilmiah yang berkaitan dengan pengembangan teori dan aplikasi dari model neural networks, antara lain White (1989a) membahas tentang hasil-hasil asimptotik untuk pembelajaran dalam FFNN lapisan tersembunyi tunggal untuk kelas model regresi nonlinier, White (1989b) membahas pembelajaran Artificial Neural Networks dipandang dari sudut statistika. Secara statistik, model neural networks merupakan suatu bagian dari kelompok pemodelan yaitu model nonlinier regresi dan model diskriminan. Referensi yang lengkap berkaitan dengan perbandingan antara beberapa model neural networks dengan model-model statistik yang klasik dan modern dapat dilihat pada Tang dkk. (1991), Cheng dan Titterington (1994), Sarle (1994). Pada beberapa dekade terakhir ini, terjadi perkembangan yang pesat dalam bidang pemodelan statistik, khususnya model-model untuk time series dan ekonometrika. Peramalan data time series merupakan salah satu bidang dari pemodelan statistik yang telah banyak menggunakan aplikasi neural networks.
10
Beberapa arsitektur model neural networks untuk peramalan data time series adalah berbagai macam arsitektur model neural networks telah dibahas oleh beberapa peneliti dalam survei yang telah dilakukan oleh Zhang dkk. (1998). Sedangkan contoh beberapa cara menentukan arsitektur model neural networks antara lain dengan cara memanfaatkan pemodelan time series tradisional (SARIMA) dalam memilih variabel-variabel lag yang tepat sebagai input untuk menentukan model neural networks yang terbaik (Faraway dan Chatfield, 1998; Zhang, 2003). Penelitian pengembangan teori untuk kelas model regresi nonlinier dengan pengamatan dependen termasuk time series di dalamnya telah dibahas oleh White dan Domowitz (1984). Khususnya pengembangan teori untuk proses Autoregressive Neural Networks (ARNN) baik yang stasioner maupun yang non stasioner telah dipresentasikan oleh Trapletti dkk. (2000) dan pengembangan model ARNN untuk kasus multivariat telah dilakukan oleh Dietz (2010). Dalam perkembangannya, untuk tujuan mendapatkan model yang akurat khususnya untuk data time series yang memuat musiman, beberapa peneliti melakukan penelitian tentang peranan atau efek dekomposisi sebagai data preprocessing dalam pembentukan model FFNN untuk peramalan. Sebagai contoh melakukan dekomposisi untuk mendapatkan komponen-komponen time series (komponen tren, siklus, musiman dan irreguler) lalu mengambil time-lag dari komponen-komponen tersebut sebagai input neural networks (Hansen dan Nelson, 2003), melakukan deseasonal sebagai data preprocessing yang selanjutnya dikombinasikan dengan FFNN menghasilkan tingkat keakuratan yang lebih tinggi dibandingkan tanpa deseasonal (Nelson dkk., 1999). Beberapa artikel membahas
tentang
pengaruh
metode
detrend-deseasonal
sebagai
data
preprocessing pada model FFNN untuk peramalan time series yang memuat fenomena tren dan musiman. Salah satu hasil penelitiannya menunjukkan bahwa kombinasi detrend-deseasonal sebagai data preprocessing dalam FFNN mempunyai pengaruh yang besar terhadap peningkatan keakuratan hasil peramalan time series yang memuat fenomena tren dan musiman (Zhang dan Qi, 2005; Suhartono dan Subanar, 2006).
11
Perkembangan selanjutnya tentang neural networks menunjukkan bahwa prosedur statistika inferensial juga diterapkan dalam penentuan model neural networks yang optimal. Hal ini ditunjukkan dengan banyaknya artikel yang membahas bagaimana mendapatkan model neural networks yang tepat atau dengan kata lain adalah bagaimana menentukan kombinasi yang tepat antara banyaknya variabel input dan banyaknya neuron di lapisan tersembunyi (yang berimplikasi pada banyaknya parameter yang optimal). Dalam hal ini konsep uji hipotesis, distribusi parameter dan penggunaan kriteria kesesuaian model diaplikasikan untuk mendapatkan model yang optimal dari neural networks. Beberapa artikel tentang pembentukan model FFNN yang optimal dengan menggunakan statistika inferensial, antara lain menggunakan uji Lagrange Multiplier (LM-test) dengan menerapkan sampling random yang bertujuan menghindari estimasi model yang tidak teridentifikasi untuk penambahan neuron di lapisan tersembunyi (White, 1989c; Anders dan Korn, 1996; Medeiros dkk., 2002), menggunakan LM-test dengan menerapkan ekspansi Taylor (Teraesvirta dan Granger, 1993; Anders dan Korn, 1996) serta menggunakan uji Wald (Anders dan Korn, 1996). Suatu prosedur “pruning” dengan mengimplementasikan tiga 2 hal, yaitu besaran kontribusi penambahan ( Rincremental ), analisis komponen utama,
dan analisis secara grafik, guna menentukan banyaknya neuron di lapisan tersembunyi dan banyaknya variabel input yang optimal dari suatu model neural networks telah dipresentasikan (Kaashoek dan Van Dijk, 2001) dan juga telah diaplikasikan untuk data Real Exchange Rate (Kaashoek dan Van Dijk, 2002). Disamping prosedur statistika inferensial, kriteria informasi yaitu networks information criterion (NIC), Akaike information criterion (AIC), Bayesian information criterion (BIC) juga diterapkan dalam beberapa artikel untuk menentukan model neural networks yang optimal, antara lain NIC dan AIC (Anders dan Korn, 1996), AIC dan BIC (Faraway dan Chatfield, 1998). Salah satu metode dekomposisi untuk data preprocessing adalah dekomposisi
berdasarkan
transformasi
wavelet.
Model
kombinasi
yang
menggabungkan teknik dekomposisi multiresolusi (transformasi wavelet) ke dalam neural networks, oleh sebagian peneliti disebut model hibrid Wavelet
12
Neural Networks (WNN). Beberapa penelitian tentang WNN telah dilakukan, baik yang diaplikasikan untuk tujuan klasifikasi (Avci, 2007; Güler dan Übeyli, 2007; Sengur dkk., 2007; Suja dan Jerome, 2007), untuk tujuan estimasi regresi nonparametrik (Zhang, 1997), maupun untuk tujuan peramalan data time series yang menggunakan dekomposisi selain MODWT (Zhang dan Benveniste, 1992; Shin dan Han, 2000; Zhang dkk., 2001; Zhang dan Dong, 2001; Cannas dkk., 2005; Chen dkk., 2006), untuk tujuan peramalan data time series yang menggunakan dekomposisi MODWT (Renaud, dkk., 2003; Murtagh dkk., 2004; Suhartono dan Subanar, 2009; Suhartono dkk., 2010; Sa’adah dkk., 2015). Suhartono dan Subanar (2009) serta Suhartono dkk. (2010) menentukan banyaknya neuron di lapisan tersembunyi dan banyaknya variabel input yang 2 optimal dari model WNN menggunakan prosedur statistika inferensial Rincremental .
Sedangkan Sa’adah dkk. (2015) menggunakan prosedur statistika inferensial kombinasi uji Wald, uji F dan AIC. Ada empat permasalahan yang harus diselesaikan dalam model kombinasi antara transformasi wavelet dan neural networks untuk peramalan data time series musiman, yaitu penentuan strategi model MSAR-FFNN berdasarkan sifat-sifat koefisien wavelet dan koefisien scaling hasil dekomposisi MODWT; identifikasi lag-lag koefisien wavelet dan koefisien scaling pada waktu dan resolusi tertentu sebagai input model MSAR-FFNN; penentuan banyaknya neuron di lapisan tersembunyi dan pengujian
lag-lag input model MSAR-FFNN. Untuk
menyelesaikan permasalahan tersebut dalam disertasi ini dihasilkan suatu prosedur yang terintegrasi yang menghasilkan empat macam model wavelet yang dapat dikategorikan menjadi dua sub prosedur. Kategori pertama adalah sub-sub prosedur yang menghasilkan model wavelet yang input-outputnya mempunyai hubungan linier, terdiri dari: 1. sub prosedur yang menghasilkan model Multiscale Autoregressive (MAR) yaitu prosedur forward dengan pemilihan input yang diusulkan Renaud dkk. (2003) dan diidentifikasi menggunakan metode stepwise sebagai input model MAR.
13
2. sub
prosedur
yang
menghasilkan
model
Multiscale
Seasonal
Autoregressive (MSAR) yaitu prosedur forward dengan kombinasi pemilihan input yang diusulkan Renaud dkk. (2003) dan lag-lag musiman dengan atau tanpa lag-lag yang dekat dengan lag musiman serta diidentifikasi menggunakan metode stepwise sebagai input model MSAR. Kategori kedua adalah sub-sub prosedur yang menghasilkan model wavelet yang input-outputnya mempunyai hubungan nonlinier, terdiri dari: 1. sub prosedur yang menghasilkan model Multiscale Autoregressive Feedforward Neural Networks (MAR-FFNN) yaitu prosedur forward menggunakan pemilihan input yang diusulkan Renaud dkk. (2003), algoritma pembelajaran resilient backpropagation,
kriteria AIC untuk
penentuan banyaknya neuron di lapisan tersembunyi serta uji Wald dan dan uji F dalam skema forward untuk mendapatkan input model MARFFNN yang optimal. 2. sub prosedur yang menghasilkan model MSAR-FFNN yaitu prosedur forward menggunakan kombinasi pemilihan input yang diusulkan Renaud dkk. (2003) dan lag-lag musiman dengan atau tanpa lag-lag yang dekat dengan lag musiman, algoritma pembelajaran resilient backpropagation, kriteria AIC untuk penentuan banyaknya neuron di lapisan tersembunyi serta uji Wald dan dan uji F dalam skema forward untuk mendapatkan input model MSAR-FFNN yang optimal. Prosedur di atas dikembangkan berdasarkan hasil-hasil teoritis tentang MODWT (Percival dan Walden, 2000), dekomposisi multiscale untuk peramalan time series (Renaud dkk., 2003), metode stepwise (Seber dan Lee, 2003), uji Wald (White, 1999), uji F (Suhartono, 2007), kriteria AIC (Anders dan Korn, 1996), algoritma pembelajaran resilient backpropagation (Riedmiller dan Braun, 1993; Riedmiller, 1994) serta hasil empiris tentang penambahan lag-lag musiman dan lag-lag yang dekat dengan lag musiman dari koefisien wavelet dan koefisien scaling untuk input FFNN (Suhartono dkk., 2010). Prosedur yang dihasilkan dapat digunakan untuk data time series univariat baik yang memuat pola musiman
14
maupun tidak. Variabel-variabel input model MAR, MSAR, MAR-FFNN dan MSAR-FFNN merupakan lag-lag dari koefisien wavelet dan koefisien scaling hasil MODWT. Dalam disertasi ini telah dihasilkan teorema-teorema yang digunakan dalam estimasi bobot-bobot model MSAR-FFNN, sifat konsistensi dan asimptotik normal. Teorema pertama digunakan untuk menentukan informasi arah gradien lokal. Teorema kedua digunakan untuk update bobot-bobot networks baik di lapisan
tersembunyi
maupun
di
lapisan
output
berdasarkan
algoritma
pembelajaran resilient backpropagation. Teorema ketiga sifat konsistensi dari estimator dan teorema keempat sifat asimptotik normal dari estimator. Hasil secara empiris khususnya dengan data simulasi yang dibangkitkan dari: 1. model non-musiman stasioner menunjukkan bahwa sub prosedur kategori pertama
bagian 1 dapat
diimplementasikan dengan baik untuk
memodelkan MAR. 2. model musiman stasioner dan model musiman multiplicative stasioner menunjukkan bahwa sub prosedur kategori pertama bagian 2 dapat diimplementasikan dengan baik untuk memodelkan MSAR. 3. model musiman nonlinier yang stasioner menunjukkan bahwa sub prosedur kategori kedua bagian 2 dapat diimplementasikan dengan baik untuk memodelkan MSAR-FFNN. Implementasi prosedur pada data simulasi dan data real menunjukkan bahwa penambahan lag-lag musiman dengan atau tanpa lag-lag yang dekat dengan lag musiman menghasilkan ketepatan prediksi yang lebih tinggi dibandingkan dengan yang tanpa penambahan baik untuk linier maupun nonlinier. Demikian pula untuk data-data yang minimal satu plot dari lag-lagnya membentuk pola nonlinier tegas maka model MSAR-FFNN mempunyai ketepatan prediksi yang lebih tinggi dibandingkan dengan model SARIMA maupun model Exponential Smoothing Holt-Winters. Hal ini ditunjukkan dari hasil-hasil yang menggunakan data time series yang mempunyai karakteristik sebagai berikut:
15
1. Data time series yang memuat komponen tren additive dan musiman additive, studi kasus data tingkat CO2. 2. Data time series yang memuat komponen tren additive dan musiman multiplicative, studi kasus data Air Passengers. 3. Data time series musiman nonlinier yang stasioner (data simulasi). 4. Data time series musiman yang nonstasioner dalam variansi, studi kasus data Traffic Fatalities. Untuk mempermudah proses pembentukan model MAR, MSAR, MAR-FFNN dan MSAR-FFNN telah dibuat beberapa modifikasi program R yang diberi nama fungsi-fungsi DataPreproc1, n.unit.hidd.sign_ok dan uji.Wald.thp0 yang telah dilampirkan pada Lampiran 3-5. 1.6 Outline Disertasi Disertasi ini terdiri dari lima bab. Dalam bab I membahas tentang gambaran umum penelitian yang dilakukan, perumusan masalah, tujuan penelitian, batasan masalah, dan hasil-hasil yang telah dicapai oleh para peneliti sebelumnya. Bab II membahas tentang dasar teori meliputi analisis data time series, stasioneritas, proses Seasonal Autoregressive Moving Average (SARMA), transformasi wavelet, khususnya filter wavelet dan filter scalling MODWT, konsep dasar MODWT, algoritma piramida untuk MODWT, kondisi boundary pada MODWT, model MAR, konvergensi paramater model MAR, FFNN dan algoritma resilient backpropagation. Di samping itu juga membahas metode stepwise untuk pemilihan variabel input model MSAR serta membahas uji Terasvirta, uji Wald, AIC, uji F dan RMSE untuk menentukan model terbaik MSAR-FFNN. Bab III membahas tentang model wavelet neural networks untuk data time series musiman (model MSAR-FFNN) yang merupakan pengembangan model MAR-FFNN. Di samping itu juga membahas tentang lemma dan teoremateorema yang digunakan untuk menentukan estimator dari parameter model MSAR-FFNN berdasarkan algoritma resilient backpropagation dan sifat-sifat asimtotik estimator serta membahas prosedur pembentukan model MSAR-FFNN. Bab IV menyajikan hasil-hasil empiris antara lain kajian strategi penentuan
16
variabel input optimal untuk model MSAR, model MSAR-FFNN, hasil prosedur pemodelan MSAR, penerapan prosedur pembentukan model MAR-FFNN dan model MSAR-FFNN yang optimal, perbandingan ketepatan ramalan antara model MSAR, model MSAR-FFNN, Exponential Smoothing Holt-Winters dan SARIMA untuk data studi kasus. Bab V memberikan kesimpulan disertasi dan masalah terbuka.