PREDIKSI AWAL MUSIM HUJAN MENGGUNAKAN DATA SOUTHERN OSCILLATION INDEX DENGAN METODE SUPPORT VECTOR REGRESSION
RETNO LARASATI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
PREDIKSI AWAL MUSIM HUJAN MENGGUNAKAN DATA SOUTHERN OSCILLATION INDEX DENGAN METODE SUPPORT VECTOR REGRESSION
RETNO LARASATI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
ABSTRACT RETNO LARASATI. Prediction of Rainy Season Onsets with Southern Oscillation Index by using Support Vector Regression. Supervised by AGUS BUONO and MUSHTHOFA. Climate is one of the important aspects in human life. The information about prediction and forecasting is required, especially in agricultural sector. However, the current prediction for rainy season onset using linear regression method is not very good.The main objective of this research is to develop a model using support vector regression to predict the onset of the rainy season, in order to get the accuracy of climate information. Rainy season onset prediction has been attempted at 1 weather stations in Indramayu. The data used in this study is the Southern Oscillation Index (SOI) from June to August and the onset of the rainy season (AMH) from 1979-2008. The domain of the SOI was selected based on the correlation. Prediction result was evaluated using the root mean squared error and squared correlation coefficient. The average squared correlation coefficient value obtained was 0.7 and the root mean squared error was 2.3 using the RBF kernel function. Keywords: Support Vector Regression, Southern Oscillation Index, predict, rainy season.
Judul Skripsi Nama NRP
: Prediksi Awal Musim Hujan Menggunakan Data Southern Oscillation Index dengan Support Vector Regression : Retno Larasati : G64080100
Menyetujui: Pembimbing I
Pembimbing II
Dr. Ir. Agus Buono, M.Si, M.Kom NIP. 196607021993021001
Mushthofa, S.Kom, M.Sc NIP. 198203252009121003
Mengetahui: Ketua Departemen Ilmu Komputer
Dr. Ir. Agus Buono, M.Si, M.Kom NIP.196607021993021001
Tanggal Lulus :
KATA PENGANTAR Puji syukur ke hadirat Allah subhanahu wata’ala atas segala limpahan rahmat serta karuniaNya sehingga penulis mampu menyelesaikan penelitian ini. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu ‘alaihi wasallam serta kepada keluarganya, sahabatnya, serta para umatnya. Penulis mengucapkan terima kasih atas bantuan dan dukungan dari semua pihak dalam pelaksanaan kuliah maupun penelitian yang telah dilaksanakan, yaitu: 1
Ayahanda Sutrisno Agus Pratjojo , Ibunda Indah Arifah Budiwati beserta Kakak-kakak Esti Wulandari, Ario Pamuji, Seto Widiarso beserta keluarganya atas nasihat, doa, kasih sayang, dukungan, serta motivasi kepada penulis selama menjalani pendidikan dan menyelesaikan kuliah di Institut Pertanian.
2
Bapak Dr. Ir. Agus Buono, M.Si, M.Kom Kom dan Bapak Mushthofa, S.Kom, M.Sc atas kesabarannya dalam membimbing dan saran serta masukan selama bimbingan.
3
Center for Climate Risk and Opportunity Management in Southeast Asia Pasific (CCROMSEAP) Institut Pertanian Bogor sebagai sumber data dalam penelitian ini.
4
Indonesia Managing Higher Education for Relevance and Effeciency (I-MHERE) Institut Pertanian Bogor yang telah membantu dalam penyelesaian penelitian ini.
5
Bapak Dr. Ahmad Faqih selaku dosen penguji yang telah memberi masukan dan saran pada penelitian dan tugas akhir penulis.
6
Sahabat-sahabat seperjuangan angkatan 45 Ilmu Komputer IPB atas segala kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama menjalani masa studi. Semoga kita bisa berjumpa kembali kelak sebagai orang-orang sukses.
7
Rekan-rekan satu kosan Ade, Arini, Emmy, Ira, ,Kak Nurul, Oji, Rara atas kebersamaan dan bantuannya selama penulis kuliah dan penelitian.
8
Rekan-rekan satu bimbingan, Abdul Rahman Halim, Ahmad Bagus Diponegoro, Alif Kurniawan, Nanda Ichsan Pratama, dan Wido Aryo Andhika semoga lancar dalam melanjutkan penelitiannya.
9
Keluarga UKM Music Agricultural X-pression!! angkatan 4,5,dan 6 atas segala kenangan dan dukungannya selama ini. Semoga ikatan silaturahmi kita selalu terjaga.
10
Semua instansi yang telah memberikan beasiswa kuliah kepada penulis selama berkuliah.
Penulis menyadari bahwa dalam penulisan skripsi ini masih banyak kekurangan. Kritik, saran dan masukan dalam penelitian ini penulis harapkan, demi baiknya penelitian ini dikemudian hari. Penulis berharap semoga penelitian ini dapat bermanfaat bagi siapapun yang membacanya.
Bogor, Juni 2012
Retno Larasati
RIWAYAT HIDUP Penulis dilahirkan di Yogyakarta pada tanggal 10 Desember 1990. Penulis merupakan anak keempat dari pasangan Sutrisno Agus Pratjojo dan Indah Arifah Budiwati. Pada tahun 2008, penulis menamatkan pendidikan di SMA Negeri 7 Yogyakarta. Penulis berkesempatan melanjutkan studi di Institut Pertanian Bogor melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negri (SNMPTN) di Depertemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Penulis aktif di berbagai organisasi kemahasiswaan seperti Himpunan Mahasiswa Ilmu Komputer, Unit Kegiatan Mahasiswa Music Agriculture X-pression!!, anggota Tanoto Scholars dan berbagai kegiatan seperti OMI (2010), IT Today (2010), IDEA (2011), dan ISEE (2011) . Penulis juga menjadi asisten praktikum pada Mata Kuliah Algoritme dan Pemrograman (2010-2011), Bahasa Pemrograman (2012), Sistem Pakar (2012), serta Pengembangan Sistem Berorientasi Objek (2012). Selama awal kuliah penulis juga pernah menjadi staf pengajar di Lembaga Bimbingan Belajar Ellips Bogor. Selain itu, penulis melaksanakan kegiatan Praktik Kerja Lapangan di Kantor PT. Telkom Indonesia Jakarta Utara pada tahun 2011. .
DAFTAR ISI Halaman DAFTAR GAMBAR .....................................................................................................................viii DAFTAR LAMPIRAN ..................................................................................................................viii PENDAHULUAN............................................................................................................................. 1 Latar Belakang .............................................................................................................................. 1 Tujuan ........................................................................................................................................... 1 Ruang Lingkup .............................................................................................................................. 1 TINJAUAN PUSTAKA .................................................................................................................... 1 Dasarian ........................................................................................................................................ 1 Awal Musim Hujan ....................................................................................................................... 1 Southern Oscillation Index ............................................................................................................ 2 Support Vector Regression ............................................................................................................ 2 Fungsi Kernel ................................................................................................................................ 3 Grid Search ................................................................................................................................... 4 K-Fold Cross-Validation ............................................................................................................... 4 METODE PENELITIAN .................................................................................................................. 4 Pengambilan Data ......................................................................................................................... 4 Pemilihan Data .............................................................................................................................. 4 Proses pada SVR ........................................................................................................................... 5 Pengujian ....................................................................................................................................... 5 Analisis dan Evaluasi .................................................................................................................... 5 HASIL DAN PEMBAHASAN ......................................................................................................... 6 Pemilihan Data .............................................................................................................................. 6 Pemilihan Parameter ..................................................................................................................... 6 Kinerja Model pada Stasiun Cuaca ............................................................................................... 6 Evaluasi Hasil Prediksi Awal Musim Hujan ................................................................................. 9 SIMPULAN DAN SARAN .............................................................................................................. 9 Simpulan ....................................................................................................................................... 9 Saran ........................................................................................................................................... 10 DAFTAR PUSTAKA ..................................................................................................................... 10 LAMPIRAN .................................................................................................................................... 11
vii
DAFTAR GAMBAR Halaman 1 Ilustrasi dasarian kedua. ..................................................................................................................... 1 2 Lima macam fase SOI ........................................................................................................................ 2 3 Nilai SOI tahun 2007-2008. ............................................................................................................... 2 4 Transformasi klasifikasi dua dimensi ke dalam ruang fitur tiga dimensi (Arjan Gijsberts,2007) ...... 4 5 Ilustrasi 4-folds cross validation ........................................................................................................ 4 6 Diagram alir proses penelitian ........................................................................................................... 5 7 Hasil korelasi SOI dengan AMH ....................................................................................................... 6 8 Grafik plot hasil prediksi dan observasi ............................................................................................. 7 9 Diagram pencar data observasi dan data prediksi dengan fungsi kernel (a) RBF (b) Linear (c) Polinomial (d) Sigmoid pada simulasi k-fold cross-validation. ....................................... 8 10 Diagram pencar data observasi dan data prediksi dengan fungsi kernel (a) RBF (b) Linear (c) Polinomial (d) Sigmoid pada simulasi peramalan ke depan. ...................................... 8 11 Grafik Nilai RMSE dari 4 kernel. ....................................................................................................... 9 12 Grafik koefisien korelasi fungsi kernel. ............................................ Error! Bookmark not defined.
DAFTAR LAMPIRAN Halaman 1 2 3 4 5 6 7 8 9 10 11
Data pengamatan awal musim hujan di pulau Jawa .......................................................................... 12 Data SOI tahun 1978-2007 ............................................................................................................... 13 Hasil analisis korelasi dengan metode pearson SOI dan data awal musim hujan tahun 1978-2007 . 14 Hasil prediksi dengan fungsi kernel RBF ......................................................................................... 15 Hasil prediksi dengan fungsi kernel Linear ...................................................................................... 16 Hasil prediksi dengan fungsi kernel Polinomial ............................................................................... 17 Hasil prediksi dengan fungsi kernel Sigmoid ................................................................................... 18 Hasil simulasi peramalan dengan fungsi kernel RBF ....................................................................... 19 Hasil simulasi peramalan dengan fungsi kernel Linear .................................................................... 20 Hasil simulasi peramalan dengan fungsi kernel Polinomial .............................................................. 21 Hasil simulasi peramalan dengan fungsi kernel Sigmoid ................................................................. 22
viii
PENDAHULUAN Latar Belakang Iklim merupakan faktor alam penting yang sangat dinamis dan sulit dikendalikan. Karena sifat iklim yang dinamis dan beragam diperlukan berbagai informasi hasil prediksi iklim sehingga lebih berdaya guna dalam bidang pertanian. Pertumbuhan dan produksi tanaman dipengaruhi oleh berbagai unsur iklim termasuk datangnya musim hujan. Kondisi iklim yang tidak menentu dapat menjadi faktor pembatas produksi pertanian. Dibutuhkan informasi prediksi awal musim hujan (AMH) untuk merencanakan pola tanam, sistem pengairan, pemupukan, pengendalian hama terpadu, dan panen. Tingkat keakuratan prediksi AMH sangat membantu petani mengurangi resiko gagal panen. Mendapatkan keakuratan prediksi dapat dilakukan melalui pengembangan sistem analisis dan teknik prediksi AMH yang lebih kuantitatif dengan model statistik dan dinamik. Pemanfaatan informasi iklim merupakan poin penting yang akan memberikan jalan petani dalam mencapai target produksi serta meningkatkan derajat petani (Artikov & Gary 2008). BMG adalah badan yang berwenang mengeluarkan prakiraan musim maupun cuaca di Indonesia. Berkaitan dengan ketepatan atau keakuratan prediksi untuk masa yang akan datang, perlu dilakukan penyempurnaan metode prediksi. Berdasarkan data prediksi awal musim hujan dari BMG pada tahun 1995-2001, keakuratan prediksi awal musim hujan berkisar antara 50-85% (Suciantini 2004). Salah satu metode prediksi musim yang sudah umum digunakan adalah metode regresi. Pendekatan regresi yang digunakan oleh BMG adalah regresi linear biasa (Irianto et al. 2000). Tetapi, regresi linear didasarkan pada beberapa asumsi sehingga tidak dapat selalu cocok dengan karakteristik data set yang ada. Asumsi ini membuat batasan pada analisis regresi statistik. Maka dari itu, Support Vector Machine (SVM) digunakan untuk mengatasi hal tersebut. SVM yang digunakan untuk kasus regresi dinamakan Support Vector Regression (SVR). Penggunaan SVR untuk prediksi sebelumnya sudah dilakukan di berbagai bidang oleh beberapa pihak. Mariana (2009) menggunakan SVR untuk prediksi sisa harga kendaraan pada permasalahan penyewaan mobil. Yang et al. (2002) juga menggunakan SVR untuk prediksi pasar modal.
Secara umum, regresi dilakukan untuk melakukan peramalan atau prediksi nilai variabel terikat berdasarkan nilai variabel terkait. Variabel terkait atau prediktor yang akan digunakan pada penelitian ini adalah Southern Oscillation Index (SOI). Naik turunnya index osilasi selatan ini banyak mempengaruhi iklim di Indonesia, terutama gejala El-Nino dan La-Nina (Boer 1999). Tujuan Tujuan dari penelitian ini adalah membangun model support vector regression untuk prediksi awal musim hujan dengan prediktor Southern Oscillation Index. Ruang Lingkup Ruang lingkup penelitian ini difokuskan pada pencarian model prediksi AMH terbaik dari hasil pembelajaran menggunakan SVR. Penelitian menggunakan data SOI yang berasal dari situs Badan Meteorologi Australia dari tahun 1978-2007 dan data awal musim hujan Penelitian menggunakan data SOI yang berasal dari situs Badan Meteorologi Australia dari tahun 1978-2007 dan data awal musim hujan yang berasal dari Badan Meteorologi dan Geofisika dari tahun 1978-2007. Pengujian akurasi yang digunakan ialah analisis korelasi sederhana dan RMSE.
TINJAUAN PUSTAKA Dasarian Dasarian adalah satuan waktu meteorologi yang lamanya adalah sepuluh hari. Istilah ini adalah gabungan dari dua kata: "dasa" dan "harian". Satuan dasarian biasa dipakai dalam analisis cuaca dan dalam metode prakiraan cuaca. Dalam setahun, terdapat 36 dasarian. Dasarian pertama adalah tanggal 1 hingga tanggal 10 bulan Januari. Dasarian kedua adalah tanggal 11 hingga 20 Januari, dan seterusnya hingga dasarian ke-36 adalah tanggal 21-31 Desember. Ilustrasi dasarian kedua dapat dilihat pada Gambar 1.
Gambar 1 Ilustrasi dasarian kedua. Awal Musim Hujan Penentuan awal musim hujan ditentukan dengan mengukur curah hujan rataan dasarian
2
pada daerah tertentu. Jika hasil pengukuran curah hujan pada suatu dasarian lebih besar atau sama dengan 50 mm, dan pada 2 dasarian berikutnya memiliki curah hujan yang sama, dasarian tersebut adalah awal musim hujan (Swarinoto & Makmur 2009). Alat untuk mengukur curah hujan pada waktu rentang tertentu ialah pluviometer.
Badan Meteorologi Australia ditunjukkan pada Gambar 3.
2007 10
Southern Oscillation Index
Badan Meteorologi Australia dalam Rainmen (Patridge & Mashum 2002) mengelompokkan SOI menjadi 5 fase. El-Nino digambarkan oleh fase konstan negatif dan fase menurun cepat (fase 1 dan 3), sedangkan LaNina oleh fase konstan positif dan fase meningkat cepat (fase 2 dan 4), dan kondisi normal oleh fase mendekati nol (fase 5). ditunjukkan pada Gambar 2.
Gambar 2 Lima macam fase SOI. Cara untuk menentukan fase SOI pada suatu bulan tertentu adalah dengan membandingkan nilai SOI bulan tersebut dengan SOI bulan sebelumnya. Nilai SOI pada bulan Maret 2007 adalah 13.8, sedangkan nilai SOI pada bulan April 2007 adalah 15.2. Perbandingan nilai SOI dari bulan Maret ke April ini bernilai serupa, karena baik bulan Maret maupun April memiliki nilai SOI yang positif. Perbandingan nilai SOI ini membuat SOI bulan April dikategorikan terdapat pada fase 2 yaitu fase kostan positif. Cara serupa jika kita ingin mengetahui fase SOI pada bulan Maret, kita harus membandingkan nilai SOI pada bulan Maret dengan bulan Februari. Hasil perhitungan SOI 2007 sampai tahun 2008 oleh
5
SOI
Southern Oscillation Index (SOI) adalah hasil perhitungan fluktuasi bulanan atau fluktuasi musiman dari perbedaan tekanan udara di antara Tahiti dan Darwin. Nilai-nilai negatif SOI sering kali menandai adanya peristiwa El Niño. Nilai-nilai positif dari SOI itu dihubungkan dengan angin pasat Pasifik yang lebih kuat dan suhu-suhu laut lebih hangat di sebelah utara Australia. Peristiwa ini yang dikenal sebagai suatu La Niña. Curah hujan di atas normal (basah) diakibatkan oleh La Niña dan curah hujan di bawah normal (kering) diakibatkan oleh El Niño.
2008
15
0 -5 -10 -15 januari april juli oktober
Tahun februari mei agustus november
maret juni september desember
Gambar 3 Nilai SOI tahun 2007-2008. Support Vector Regression Support Vector Regression (SVR) merupakan penerapan SVM untuk kasus regresi. Support Vector Machine (SVM) adalah satu kumpulan teknik klasifikasi dan regresi, yang merupakan pengembangan algoritme nonlinear dan dikembangkan di Rusia pada tahun enam puluhan (Bermolen & Rossi 2009). SVM mencoba menemukan pemisah linear (hyperplane) antara titik data dari dua kelas dalam ruang multidimensi. SVM cocok untuk berurusan dengan interaksi antara fitur dan fitur berlebihan. Metode ini terkenal sangat powefull. Beberapa tahun setelah diperkenalkan, metode ini sudah memiliki performa yang sangat baik di berbagai macam aplikasi. (Christianini & Taylor 2005). Dalam kasus regresi, output berupa bilangan nyata atau kontinu. SVR merupakan metode yang dapat mengatasi overfitting sehingga akan menghasilkan performansi yang bagus (Smola & Scholkopf 2004). Misalnya ada λ set data latih, (xj,yj) dengan j = 1,2,… λ dengan input x={x1, x2,x3}...⊆ ℜN dan output yang bersangkutan y={yt,...,yλ}⊆ℜ. Dengan SVR, akan ditemukan suatu fungsi f(x) yang mempunyai deviasi paling besar ε dari target aktual yi untuk semua data latih. Dengan SVR, manakala ε sama dengan 0, regresi yang sempurna akan didapatkan. Misalnya kita mempunyai fungsi berikut sebagai garis regresi
3
𝑓(𝑥) = 𝑤𝑇 𝜑(𝑥) + 𝑏 φ(x) menunjukkan suatu titik di dalam feature space F hasil pemetaan x di dalam input space (Bermolen & Rossi 2009). Koefisien w dan b diestimasi dengan cara meminimalkan fungsi resiko (risk function) yang didefinisikan dalam persamaan
𝟏 𝟏 ||w||2 + C min λ 𝟐
λ
𝒊=𝟏
𝑳∈(𝒚𝒊 , 𝒇 𝒙𝒊 )
Dengan kendala 𝑦𝑖 − 𝑤𝜑 𝑥𝑖 − 𝑏 ≤ 𝜀 𝑤𝜑 𝑥𝑖 − 𝑦𝑖 + 𝑏 ≤ 𝜀, 𝑖 = 1,2, … , 𝜆 Dengan 𝐿𝜀 (𝑦𝑖 , 𝑓(𝑥𝑖 )) =
𝑦𝑖 − 𝑓(𝑥𝑖 − 𝜀 𝑦𝑖 − 𝑓(𝑥𝑖 ≥ 0 0, 𝑢𝑛𝑡𝑢𝑘 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛
Faktor ||w||2 dinamakan regularisasi. Meminimalkan ||w||2 akan membuat suatu fungsi setipis mungkin sehingga bisa mengontrol kapasitas fungsi. Faktor kedua dalam fungsi tujuan adalah kesalahan empiris (empirical error) yang diukur dengan εinsensitive loss function. Menggunakan ide εinsensitive loss function harus meminimalkan norm dari w agar mendapatkan generalisasi yang baik untuk fungsi regresi f. Karena itu masalah optimasi berikut perlu diselesaikan: 1 min | 𝑤 |2 2 Dengan kendala 𝑦𝑖 − 𝑤𝜑 𝑥𝑖 − 𝑏 ≤ 𝜀 𝑤𝜑 𝑥𝑖 − 𝑦𝑖 + 𝑏 ≤ 𝜀, 𝑖 = 1,2, … , 𝜆 𝑒2 =
𝑦 − 𝑦′
2
=
𝑦 − (𝑏0 + 𝑏1 𝑥)
2
Asumsikan bahwa ada suatu fungsi f yang dapat mengaproksimasi semua titik (xi, yi), dengan presisi ε. Dalam kasus ini diasumsikan bahwa semua titik ada dalam rentang f ± ε feasible. Dalam hal infeasible, ada kemungkinan dalam beberapa titik keluar dari rentang f ± ε . Penambahan variabel slack ξ, ξ* dapat digunakan untuk mengatasi masalah infeasible constraint dalam masalah optimasi. Selanjutnya, masalah optimasi di atas bisa diformulasikan sebagai berikut:
𝟏 𝟏 min ||w||2 + C λ 𝟐
λ
∗
(𝝃𝒊 , 𝝃𝒊 )
𝒊=𝟏
Dengan kendala 𝑦𝑖 − 𝑤 𝑇 𝜑 𝑥𝑖 − 𝑏 − 𝜉𝑖 ≤ 𝜖, 𝑖 = 1,2, … , 𝜆 𝑤𝜑 𝑥𝑖 − 𝑦𝑖 + 𝑏 − 𝜉𝑖 ≤ 𝜖, 𝑖 = 1,2, … , 𝜆 𝜉𝑖 , 𝜉𝑖∗ ≥ 0 Konstanta C>0 menentukan trade off antara ketipisan fungsi f dan batas atas deviasi lebih
dari ε masih ditoleransi. Semua deviasi lebih besar daripada ε akan dikenakan pinalti sebesar C. Dalam SVR, ε sepadan dengan akurasi dari aproksimasi terhadap data latih. Nilai ε yang kecil terkait dengan nilai yang tinggi pada variabel slack ξi dan akurasi aproksimasi yang tinggi. Sebaliknya, nilai yang tinggi untuk ε berkaitan dengan nilai ξi yang kecil dan aproksimasi yang rendah. Nilai yang tinggi untuk variabel slack akan membuat kesalahan empiris mempunyai pengaruh yang besar terhadap faktor regulasi. Dalam SVR, support vector adalah data latih yang terletak pada dan di luar batas f dari fungsi keputusan, karena itu jumlah support vector menurun dengan naiknya ε (Bermolen & Rossi 2009). Dalam formulasi dual, masalah optimisasi dari SVR adalah sebagai berikut: max −
1 2
𝜆
𝜆
(𝛼𝑖 – 𝛼𝑖∗ ) 𝛼𝑗 − 𝛼𝑗∗ 𝐾 𝑥𝑖 ,𝑥𝑗 𝑖=1 𝑗 =1 𝜆
+
𝜆
( 𝛼𝑖 − 𝛼𝑖∗ )𝑦𝑖 − 𝜖 𝑖=1
( 𝛼𝑖 − 𝛼𝑖∗ ) 𝑖=1
Dengan kendala 𝜆
( 𝛼𝑖 − 𝛼𝑖∗ ) = 0 𝑖=1
0 ≤ 𝛼𝑖 ≤ 𝐶, 𝑖 = 1,2, … , 𝜆 0 ≤ 𝛼𝑖∗ ≤ 𝐶, 𝑖 = 1,2, … , 𝜆 C didefinisikan oleh pengguna, 𝐾 𝑥𝑖 , 𝑥𝑗 adalah dot-product kernel yang didefinisikan sebagai 𝐾 𝑥𝑖 , 𝑥𝑗 = 𝜑 𝑇 𝑥𝑖 𝜑 𝑥𝑗 . Dengan menggunakan langrange multiplier dan kondisi optimalitas, fungsi regresi secara eksplisit dirumuskan sebagai berikut: 𝜆
𝛼𝑖 − 𝛼𝑖∗ 𝐾 𝑥𝑖 , 𝑥 + 𝑏
𝑓 𝑥 = 𝑖=1
Fungsi Kernel Data yang kompleks pada umumnya membutuhkan fungsi yang lebih ekspresif dibandingkan dengan fungsi linear biasa. SVR metransformasikan input yang non-linear ke dalam ruang fitur yang dimensinya lebih tinggi. Pekerjaan inilah yang dilakukan oleh kernel. Setelahnya, SVR akan melakukan perhitungan linear untuk menemukan hyperplane yang optimal pada ruang fitur tersebut. Kernel akan memproyeksikan data ke dalam ruang fitur berdimensi tinggi untuk menaikkan kemampuan komputasi dari mesin pembelajaran linear.
4
Ilustrasi kernel dapat dilihat pada Gambar 4 berikut.
Gambar 4 Transformasi klasifikasi dua dimensi ke dalam ruang fitur tiga dimensi (Gijsberts 2007). Terdapat kurang-lebih 25 jenis fungsi kernel. Adapun bebeberapa bentuk fungsi kernel adalah: 1.
Fungsi Linear
Persamaan fungsi linear adalah, 𝑘 𝑥, 𝑦 = 𝑥 𝑇 𝑦 + 𝐶 2.
Fungsi Polinomial
Persamaan fungsi polinomial adalah, 𝑘 𝑥, 𝑦 = (𝛼𝑥 𝑇 𝑦 + 𝐶)𝑑 3.
Fungsi Gaussian (RBF)
Persamaan fungsi RBF adalah, 𝑘 𝑥, 𝑦 = exp(−𝛾 𝑥 − 𝑦 4.
2
)
Fungsi Sigmoid
Fungsi sigmoid persamaannya adalah, 𝑘 𝑥, 𝑦 = tanh(𝛼𝑥 𝑇 𝑦 + 𝐶) Grid Search Untuk mendapatkan parameter fungsi kernel yang optimum dilakukan metode grid search untuk mendapatkan model SVR dengan parameter yang optimal. Algoritme grid search adalah salah satu algoritme umum yang sering digunakan untuk estimasi parameter yang prinsip kerjanya dengan menentukan beberapa nilai parameter pada rentang tertentu, kemudian memilih parameter pada nilai terbaik pada rentang tersebut dan melakukan pencarian berulang pada grid (rentang nilai) yang lain. K-Fold Cross-Validation K-fold cross validation merupakan salah satu variasi dari metode cross validation. Kfold cross validation dilakukan untuk membagi data latih dan data uji. Metode k-fold cross validation membagi data menjadi k-buah subset, sebanyak k-1 buah subset digunakan sebagai data latih dan 1 buah set sebagai data
uji. Sebagai gambaran, pada Gambar 5 terdapat ilustrasi k-fold cross validation menggunakan 4 buah fold.
Gambar 5 Ilustrasi 4-folds cross validation. Jika nilai k bernilai 4, data akan dibagi menjadi 4 kelompok. Misalkan setiap kelompok diberi label angka secara berurutan. Pada tahap pertama, kelompok 1 akan bertindak sebagai data uji, sedangkan kelompok 2, kelompok 3, dan kelompok 4 bertindak sebagai data latih. Pada tahap kedua, kelompok 2 akan bertindak sebagai data uji sedangkan kelompok 1, kelompok 3, dan kelompok 4 akan bertindak sebagai data latih. Pada tahap ketiga, kelompok 3 akan bertindak sebagai data uji, sedangkan kelompok 1, kelompok 2, dan kelompok 4 akan bertindak sebagai data latih. Pada tahap keempat, kelompok 4 akan bertindak sebagai data uji sedangkan kelompok 1, kelompok 2, dan kelompok 3 akan bertindak sebagai data latih.
METODE PENELITIAN Penelitian ini akan dikembangkan melalui beberapa langkah. Diagram alir metode penelitian yang dilakukan pada penelitian ini dapat dilihat pada Gambar 6. Pengambilan Data Data yang digunakan dalam penelitian ini adalah data Southern Oscillation Index (SOI) dan data observasi dari stasiun cuaca di Indramayu. Data SOI diambil dari situs milik Badan Meteorologi Australia ,the Bureau of Meteorology (BOM 2012) ,selama 30 tahun dari tahun 1978 sampai dengan 2007. Data SOI dapat dilihat pada Lampiran 2. Untuk data observasi, digunakan data AMH dari tahun 1978-2007 dari satu stasiun cuaca di Kabupaten Indramayu. Data AMH yang berupa nilai dasarian dari suatu tahun dapat dilihat pada Lampiran 1. Pemilihan Data Data SOI dan data observasi dapat langsung digunakan tanpa melewati preprocessing. Data stasiun yang digunakan untuk penelitian ini yaitu data dari stasiun Anjatan, stasiun Indramayu, stasiun Jatibarang, stasiun
5
Kandanghaur, stasiun Lohbener, dan stasiun Sudikampiran. Untuk pemilihan bulan apa yang akan menjadi parameter, dilakukan perhitungan korelasi antara SOI dan awal musim hujan. Dengan menggunakan korelasi Pearson diambil 3 bulan dengan nilai korelasi tertinggi. Data SOI akan berperan sebagai masukan, dan data observasi berperan sebagai targetnya.
estimasi untuk keseluruhan data dengan rentang tahun periode 1979-2008.
Untuk pembagian data menjadi data latih dan data uji, digunakan teknik k-fold cross validation dan leave-one-out (LOO). Berdasarkan teknik k-fold cross validation, seluruh data baik SOI maupun observasi dibagi menjadi k subset, yaitu S1, S2,…, Sk. Karena pada penelitian ini menggunakan LOO, ditentukan nilai k sebesar 30. Masing-masing subset memiliki ukuran yang sama. Pembagian data dilakukan secara acak dengan mempertahankan perbandingan jumlah baris data setiap kelas. Pada proses pertama, S2,…, S30 dijadikan data pelatihan dan S1 sebagai data uji. Pada proses kedua S1,S3,…, S30 sebagai data pelatihan dan S2 sebagai data uji, dan seterusnya sebanyak 30 kali pengulangan. Proses pada SVR Pada tahap pelatihan dengan menggunakan metode SVR, data yang digunakan adalah data AMH sebagai masukan untuk pelatihan. Pelatihan dilakukan dengan masing-masing fungsi kernel-nya adalah kernel linear, kernel polinomial, kernel radial basis function (RBF), dan kernel sigmoid menghasilkan keluaran berupa model SVR. Dari fungsi kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter C untuk fungsi kernel linear, nilai parameter C, γ, r, dan d untuk fungsi kernel polinomial, parameter C dan γ untuk fungsi kernel RBF dan sigmoid. Penentuan parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, semakin baik model yang dihasilkan. Grid search dilakukan pada keempat jenis kernel. Interval parameter yang digunakan untuk grid search C= 2log 2 𝑥 dengan log 2 𝑥= {1,0,1,2,3}, γ= 2log 2 𝑦 dengan log 2 𝑦 = { -4,-3,2,-1,0,1}, r = {0,1,2,…100}, dan d={3,4,5}. Pengujian Pada tahap pengujian, data uji digunakan sebagai masukan bagi model SVR untuk mendapatkan ouput berupa nilai estimasi atau nilai prediksi. Proses pelatihan dan pengujian dilakukan untuk setiap data dari masing-masing stasiun cuaca dan berlangsung selama 30-fold cross validation sehingga menghasilkan nilai
Gambar 6 Diagram alir proses penelitian. Analisis dan Evaluasi RMSE dan R akan dihitung dari hasil pengujian tiap-tiap stasiun dengan keempat kernel. Nilai RMSE dan R digunakan untuk analisis kinerja dan keakuratan model yang telah diproses menggunakan SVR. RMSE digunakan untuk melihat galat dan R digunakan untuk melihat akurasi model. Dengan 24 hasil model dari 6 kelompok data, akan dicari model terbaik yang menghasilkan akurasi tertinggi untuk setiap stasiun. Pada penelitian ini, digunakan metode leave-one-out cross-validation sehingga nilai k akan sama dengan jumlah data, yaitu 30. Data dibagi menjadi 30 kelompok dengan masingmasing kelompok terdiri atas 1 data. Data yang dibagi adalah data prediktor jaringan syaraf tiruan dan data awal musim hujan daerah pengamatan kabupaten Indramayu.
6
HASIL DAN PEMBAHASAN Pemilihan Data Awal dari penelitian ini adalah dengan melakukan pemilihan prediktor dengan cara mengorelasikan antara SOI perbulan dengan data awal musim hujan dari stasiun cuaca yang digunakan. Hasil korelasi ini nantinya akan digunakan sebagai prediktor pada proses regresi dengan Support Vector Regression (SVR). Hasil yang didapatkan dengan mengorelasikan dua nilai tersebut memerlihatkan bulan dengan SOI yang memiliki nilai keterkaitan yang besar terhadap nilai awal musim hujan. Dengan menggunakan metode Pearson, didapatkan 3 bulan dengan korelasi tertinggi yaitu Juli, Agustus, September. Hasil korelasi dapat dilihat pada Gambar 7. 0,20000 apr mei jun jul agu sep okt nov des
0,00000
jan feb mar
0,10000
-0,10000 -0,20000 -0,30000
tertinggi ketiga, September, tidak digunakan sebagai prediktor karena bulan September sudah memasuki musim pancaroba. Bulan September di beberapa daerah di pulau Jawa menjadi bulan terjadinya awal musim hujan sehingga tidak mungkin digunakan untuk memprediksi awal musim hujan. Nilai korelasi tertinggi keempat didapat pada bulan Juni sehingga bulan Juni dipilih untuk menjadi prediktor ketiga. Selain ketiga bulan tersebut, ditambahkan juga selisih antara bulan Juni dan bulan Juli serta bulan Juli dan bulan Agustus. Selisih-selisih nilai SOI antarbulan ini merupakan representasi dari fasefase SOI-nya. Pemilihan Parameter Pelatihan dengan menggunakan SVR membutuhkan beberapa parameter sesuai dengan kernelnya. Untuk mengoptimalkan parameter, pada saat pelatihan dilakukan grid search. Grid search dijalankan menggunakan kfold cross validation. Untuk menentukan nilai k dicobakan pada pelatihan dengan menggunakan kernel Gaussian (RBF). Tabel 1 Parameter hasil grid search C terbaik
γ terbaik
3
8
2
10
8
2
30
8
2
Jumlah k
-0,40000 -0,50000 Gambar 7 Hasil korelasi SOI dengan AMH. Gambar 7 menunjukkan korelasi tertinggi dimiliki oleh bulan Agustus yaitu sebesar 0.4235, kemudian tertinggi kedua dimiliki oleh bulan September sebesar -0.36193. Bulan Juli, memiliki korelasi -0.36187. Hasil lengkap korelasi pearson dapat dilihat pada Lampiran 3. Hasil korelasi dengan metode pearson menunjukkan bahwa bulan Juli sampai bulan Desember memiliki korelasi yang kuat terhadap data awal musim hujan pada statsiun cuaca di Indramayu. Hasil korelasi bulan Juli-Desember semua memiliki nilai lebih kecil dari -0.3 untuk masing-masing bulan. Nilai korelasi yang negatif yang menunjukkan hubungan berbanding terbalik. Maka, semakin besar nilai SOI pada masing-masing bulan nilai dasarian awal musim hujan semakin kecil. Berdasarkan hasil korelasi di atas, penelitian ini akan menggunakan bulan Juli dan Agustus sebagai prediktor. Bulan dengan nilai korelasi
Didapatkan nilai parameter yang sama untuk semua nilai k seperti yang terlihat pada Tabel 1. Nilai k sebesar 30 diputuskan untuk digunakan karena sesuai dengan pelatihan metode leave one out (LOO) agar hasil pelatihan dengan parameternya konsisten. Kinerja Model pada Stasiun Cuaca Keenam stasiun dilatih dan diuji dengan fungsi kernel linear, kernel polinomial, kernel RBF, dan kernel sigmoid. Pengujian dilakukan pada model SVR yang dihasilkan dengan metode LOO 30-fold cross validation. Kinerja dari luaran dapat dilihat berdasarkan nilai error dan korelasinya. Luaran dikatakan memiliki kinerja yang baik apabila nilai error yang dihasilkan kecil dan nilai korelasinya besar. Hasil dari pelatihan dapat dilihat pada Tabel 2. Nilai koefisien korelasi terbesar didapat dengan menggunakan fungsi kernel RBF sebesar 0.67697. Sementara nilai koefisien korelasi kuadrat dari ketiga kernel lain yaitu
7
0.2455 pada kernel linear, 0.1316 pada kernel polinomial, dan 0.1288 pada kernel sigmoid.
Dapat dilihat juga pada gambar tersebut bahwa hasil prediksi dengan fungsi kernel linear lebih baik daripada kernel polinomial sesuai dengan nilai error dan koefisien korelasi pada Tabel 2. Penjelasan lebih lanjut untuk kinerja fungsi kernel pada model SVR diilustrasikan oleh diagram pencar pada Gambar 9.
Tabel 2 Hasil uji model dengan SVR Kernel
RMSE
R
RBF
2.321088
0.67697858
Linear
3.087639
0.24556058
Polinomial
5.597311
0.13160547
Sigmoid
12.69034
0.12884098
Diagram pencar tersebut memperlihatkan hubungan antara nilai dasarian observasi dengan nilai dasarian hasil prediksi pada stasiun Jatibarang untuk setiap fungsi kernel pada model SVR. Hubungan antara observasi dan prediksi dapat dilihat dari persamaan regresi linear sederhananya.
Akar error rata-rata kuadrat (RMSE) pada stasiun Indramayu ini menunjukkan hasil sesuai dengan koefisien korelasi kuadratnya. Karena hubungan antara R dan RMSE adalah berbanding terbalik, model dengan R terbesar memiliki RMSE terkecil yaitu model dengan kernel RBF, sebesar 2.321. Nilai RMSE terbesar didapat dari model dengan kernel sigmoid. Hal ini dikarenakan hasil prediksi dari kernel sigmoid sangat jauh berbeda dari data observasinya.
Dilihat pada gambar bahwa model SVR yang menggunakan fungsi kernel RBF memiliki hubungan prediksi dan observasi yang paling baik dibandingkan dengan model yang menggunakan fungsi kernel lainnya. Gradien dari persamaan yang menggunakan fungsi kernel RBF memiliki nilai terbesar yaitu bernilai 0.45. Gradien yang menunjukkan hubungan paling baik memiliki nilai mendekati 1 dan nilai intercept mendekati 0. Kedua nilai ini menandakan adanya hubungan yang kuat antara nilai observasi dan prediksi, ukuran kesalahan prediksi yang kecil dan ketepatan yang baik. Hasil prediksi selengkapnya dapat dilihat pada Lampiran 4-7.
Gambar 8 merupakan grafik hasil estimasi model SVR dengan fungsi kernel RBF, linear, dan polinomial yang diujicobakan terhadap stasiun cuaca di kabupaten Indramayu. Gambar tersebut menunjukkan bahwa secara umum dengan menggunakan fungsi kernel RBF nilai prediksi dasarian awal musim hujan sudah memiliki pola yang mendekati data pengamatannya, sedangkan hasil plot dari fungsi kernel sigmoid sangat jauh berbeda dengan hasil estimasi sehingga polanya juga berbeda jauh dengan data pengamatannya. sigmoid
Semua hasil prediksi yang telah dilakukan ini menggunakan metode k-fold cross validation dengan k = 30. Metode ini hanyalah digunakan untuk menguji model karena pada kenyataannya kita tidak dapat menggunakan k-fold cross validation. Seperti sudah dijelaskan diatas, bahwa metode k-fold cross validation akan
polynomial
linear
rbf
observasi
42
Nilai AMH
40 38 36 34
32 30 28 2009
2007
Gambar 8 Grafik plot hasil prediksi dan observasi.
2005
2003
2001
1999
1997
1995
1993
1991
1989
1987
1985
1983
1981
1979
Tahun
8
(a)
Prediksi
(a)
Prediksi
40 40
38
38
Prediksi
36
Prediksi
36
34
34
32
32
30
30
28
28 28
30
32
34
36
38
40
28
30
32
Observasi
36
38
40
Observasi
(b)
Prediksi
34
(b)
Prediksi 40
40
38
38
Prediksi
36
Prediksi
36
34
34 32
32
30
30
28
28 28
30
32
34
36
38
28
40
30
32
36
38
40
36
38
40
36
38
40
Observasi
Observasi
(c)
Prediksi
34
(c)
Prediksi 40
38
38
36
36
Prediksi
Prediksi
40
34
34 32
32
30
30
28
28 28
30
32
34
36
38
28
40
30
32
Observasi
Observasi
(d)
Prediksi
(d)
Prediksi
34
40
38
38
36
36
Prediksi
Prediksi
40
34
34 32
32
30
30
28
28 28
30
32
34
36
38
40
Observasi
Gambar 9 Diagram pencar data observasi dan data prediksi dengan fungsi kernel (a) RBF (b) Linear (c) Polinomial (d) Sigmoid pada simulasi k-fold cross-validation.
28
30
32
34 Observasi
Gambar 10 Diagram pencar data observasi dan data prediksi dengan fungsi kernel (a) RBF (b) Linear (c) Polinomial (d) Sigmoid pada simulasi peramalan ke depan.
9
Nilai koefisien korelasi dan RMSE dari hasil simulasi peramalan lebih baik dibandingkan dengan hasil pada simulasi menggunakan k-fold cross validation. Kernel RBF masih menunjukkan hasil korelasi terbaik dengan nilai korelasi 0.7 atau 70%. Hasil selengkapnya dapat dilihat pada Lampiran 8-11.
Nilai r dengan fungsi kernel RBF pada simulasi k-fold cross-validation bernilai 0.679. Nilai r dengan fungsi kernel RBF pada simulasi peramalan bernilai 0.704. Hal ini menunjukkan bahwa sebanyak 70% nilai observasi dapat dijelaskan oleh hubungan linearnya dengan nilai prediksi. Simulasi k-fold cross-validation 1
0,8
0,6
0,4
0,2
0 rbf
Evaluasi Hasil Prediksi Awal Musim Hujan Hasil prediksi awal musim hujan memperlihatkan variasi ukuran error dan korelasi. Nilai error dengan menggunakan fungsi kernel RBF menghasilkan RMSE terkecil sebesar 2.321 untuk simulasi dengan kfold cross validation seperti dapat dilihat pada Gambar 11. 14
12.690
12
RMSE
8
4
5.597 3.087 2.321
2 0 RBF
linear
polynomial
linear polynomial sigmoid Fungsi Kernel
Gambar 12 Grafik koefisien korelasi fungsi kernel. Nilai r dengan fungsi kernel linear pada simulasi k-fold cross-validation bernilai 0.24. Nilai r dengan fungsi kernel linear pada simulasi peramalan bernilai 0.27 menunjukkan bahwa sebanyak 27% nilai observasi dapat dijelaskan oleh hubungan linearnya dengan nilai prediksi. Nilai r dengan fungsi kernel polinomial pada simulasi k-fold cross-validation bernilai 0.13. Nilai r dengan fungsi kernel polinomial pada simulasi peramalan bernilai 0.02 menunjukkan bahwa sebanyak 2% nilai observasi dapat dijelaskan oleh hubungan linearnya dengan nilai prediksi.
10
6
Simulasi peramalan
Koefisien korelasi
membagi data menjadi data uji dan data latih, contohnya dengan satu buah data uji tahun 1990 maka data latihnya berasal dari tahun 19781989 dan 1991-2007 yang berjumlah 29 data. Praktiknya dalam prediksi, kita tidak mungkin memprediksi awal musim hujan suatu tahun dengan data tahun berikutnya. Dilakukan juga pelatihan sebagai simulasi peramalan dengan menggunakan data 20 tahun sebelumnya untuk memprediksi awal musim hujan suatu tahun. Simulasi peramalan ini dilakukan untuk mencari prediksi awal musim hujan dari tahun 1998 sampai 2007 dengan menggunakan data awal musim hujan 20 tahun sebelumnya. Hasil prediksi tanpa menggunakan metode k-fold cross validation dapat dilihat pada Gambar 10.
sigmoid
Gambar 11 Grafik Nilai RMSE dari 4 kernel. Hasil prediksi dari korelasi masing-masing stasiun cuaca memiliki kecenderungan yang sama dengan hasil ukuran error yang diperoleh, seperti terlihat pada Gambar 12.
Nilai r dengan fungsi kernel sigmoid pada simulasi k-fold cross-validation bernilai 0.12. Nilai r dengan fungsi kernel sigmoid pada simulasi peramalan bernilai 0.03 menunjukkan bahwa sebanyak 3% nilai observasi dapat dijelaskan oleh hubungan linearnya dengan nilai prediksi.
SIMPULAN DAN SARAN Simpulan Hasil penelitian ini menunjukkan bahwa:
10
1 2
3
Telah dibangun model prediksi dengan support vector regression dan data SOI. Fungsi kernel RBF memiliki kinerja yang paling baik dibandingkan dengan fungsi lainnya. Baik dari ukuran error maupun nilai korelasinya. Nilai maksimum koefisien korelasi didapat hingga mencapai 0.7 dan RMSE minimum 2.3. Fungsi kernel Sigmoid memiliki kinerja paling buruk dibandingkan fungsi lainnya. Ini mungkin disebabkan oleh bentuk fungsi yang tidak cocok dengan data atau pemilihan rentang parameter yang salah pada saat melakukan grid search.
Saran Saran untuk penelitian selanjutnya adalah: 1 Pengoptimuman parameter fungsi kernel akan lebih baik jika menggunakan metode lain seperti metode algoritma genetika. 2 Grid search dapat dicobakan dengan rentang input grid yang lebih sesuai dengan kernelkernelnya.
Gijsberts A. 2007. Evolutionary optimization of kernel [tesis]. Delft: Faculty of Electrical Engineering Mathematics and Computer Science, Delft University of Technology. Irianto G, Las I, Fagi AM. 2000. Peranan Agrometeorologi dalam Pembangunan Pertanian. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Mariana L. 2009. Support vector regression analysis for price prediction in a car leasing application [tesis]. Hamburg: Information and Media Technology, Hamburg University of Technology: Germany. Partridge IJ, Mashum M. 2002. Dampak Osilasi Selatan dan El-NINO di Indonesia. The State of Queensland: Department of Primary Industries.
UCAPAN TERIMA KASIH
Smola AJ, Scholkopf B. 2004. A tutorial on support vector regression. Statistics and Computing Kluwer Academic Pub 14:199-222.
Terimakasih kepada Indonesia Managing Higher Education for Relevance and Effeciency (I-MHERE) Institut Pertanian Bogor yang telah membantu penelitian ini dalam bentuk topik dan finansial riset.
Suciantini .2004. Evaluasi prakiraan sifat hujan dan penyusunan model prediksi musim; studi kasus Kabupaten Indramayu [tesis]. Bogor: Sekolah Pascasarjana, Institut Pertanian Bogor.
DAFTAR PUSTAKA
Swarinoto YS, Makmur EES. 2009. Simulasi prediksi probabilitas awal musim hujan dan panjang musim hujan di ambon. Buletin Meteorologi Klimatologi dan Geofisika 5(3):340-353.
Artikov I, Gary DL. 2008. Climate Change and Farm Use of Weather Information. Lincoln: Nebraska Lincoln University. Bermolen P, Rossi D. 2009. Support vector regression for link load prediction. Computer Network Journal 53:191201. [BOM].
2012. Bureau of Meteorology. Monthly Southern Oscillation Index. ftp://ftp.bom.gov.au/anon/home/ncc/w ww/sco/soi/soiplaintext.html [3Des 2011].
Boer R. 1999. Peranan Informasi Iklim dan Cuaca untuk Perdagangan Komoditas Pertanian. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Christianini N, Taylor JS. 2005. Support Vector Machine. Cambridge: Cambridge University Press.
Yang H, Chan L, King I. 2002. Support Vector Machine Regression for Volatile Stock Market Prediction. Hongkong: Department of Computer Science and Engineering, The Chinese University of Hong Kong.
LAMPIRAN
12
Lampiran 1 Data pengamatan awal musim hujan di pulau Jawa
Tahun
Menes
Cibaliung
...
Indramayu
Kendal
...
Kalianget
Pakong
1978
25
30
...
34
36
...
35
34
1979
30
34
...
34
38
...
37
35
1980
25
30
...
30
35
...
36
35
1981
24
27
...
32
32
...
37
33
1982
36
35
...
36
35
...
42
35
1983
29
29
...
29
35
...
36
40
1984
32
34
...
37
36
...
37
39
1985
28
33
...
38
34
...
44
33
1986
29
29
...
31
35
...
39
36
1987
31
33
...
39
39
...
39
33
1988
29
29
...
31
32
...
40
34
1989
33
30
...
33
32
...
34
37
1990
32
33
...
36
35
...
36
34
1991
31
32
...
34
35
...
39
32
1992
26
24
...
34
34
...
37
33
1993
30
32
...
43
37
...
37
40
1994
31
33
...
37
33
...
37
37
1995
28
28
...
40
35
...
43
30
1996
33
30
...
35
37
...
34
37
1997
33
34
...
35
41
...
39
34
1998
33
27
...
31
32
...
29
34
1999
29
29
...
38
36
...
32
30
2000
36
31
...
33
39
...
29
29
2001
28
29
...
32
34
...
33
43
2002
35
34
...
36
35
...
33
34
2003
33
33
...
32
37
...
32
33
2004
30
35
...
38
40
...
43
31
2005
34
34
...
37
35
...
33
33
2006
32
34
...
35
35
...
39
41
2007
35
34
...
34
35
...
45
34
13
Lampiran 2 Data SOI tahun 1978-2007
Tahun
Jan
Feb
Mar
Apr
Mei
Jun
Jul
Agu
Sept
Okt
Nov
Des
1978
-3.0
-24.4
-5.8
-7.9
16.3
5.8
6.1
1.4
0.8
-6.2
-2.0
-0.9
1979
-4.0
6.7
-3.0
-5.5
3.6
5.8
-8.2
-5.0
1.4
-2.5
-4.7
-7.5
1980 1981
3.2 2.7
1.1 -3.2
-8.5 -16.6
-12.9 -5.5
-3.5 7.6
-4.7 11.5
-1.7 9.4
1.4 5.9
-5.2 7.5
-1.9 -5.0
-3.4 2.6
-0.9 4.7
1982
9.4
0.6
2.4
-3.8
-8.2
-20.1
-19.3
-23.6
-21.4
-20.2
-31.1
-21.3
1983
-30.6
-33.3
-28
-17.0
6.0
-3.1
-7.6
0.1
9.9
4.2
-0.7
0.1
1984
1.3
5.8
-5.8
2.0
-0.3
-8.7
2.2
2.7
2.0
-5.0
3.9
-1.4
1985
-3.5
6.7
-2.0
14.4
2.8
-9.6
-2.3
8.5
0.2
-5.6
-1.4
2.1
1986
8.0
-10.7
0.8
1.2
-6.6
10.7
2.2
-7.6
-5.2
6.1
-13.9
-13.6
1987
-6.3
-12.6
-16.6
-24.4
-21.6
-20.1
-18.6
-14
-11.2
-5.6
-1.4
-4.5
1988
-1.1
-5.0
2.4
-1.3
10.0
-3.9
11.3
14.9
20.1
14.6
21.0
10.8
1989
13.2
9.1
6.7
21.0
14.7
7.4
9.4
-6.3
5.7
7.3
-2.0
-5.0
1990
-1.1
-17.3
-8.5
-0.5
13.1
1.0
5.5
-5.0
-7.6
1.8
-5.3
-2.4
1991
5.1
0.6
-10.6
-12.9
-19.3
-5.5
-1.7
-7.6
-16.6
-12.9
-7.3
-16.7
1992
-25.4
-9.3
-24.2
-18.7
0.5
-12.8
-6.9
1.4
0.8
-17.2
-7.3
-5.5
1993
-8.2
-7.9
-8.5
-21.1
-8.2
-16
-10.8
-14
-7.6
-13.5
0.6
1.6
1994
-1.6
0.6
-10.6
-22.8
-13
-10.4
-18
-17.2
-17.2
-14.1
-7.3
-11.6
1995
-4.0
-2.7
3.5
-16.2
-9.0
-1.5
4.2
0.8
3.2
-1.3
1.3
-5.5
1996
8.4
1.1
6.2
7.8
1.3
13.9
6.8
4.6
6.9
4.2
-0.1
7.2
1997
4.1
13.3
-8.5
-16.2
-22.4
-24.1
-9.5
-19.8
-14.8
-17.8
-15.2
-9.1
1998
-23.5
-19.2
-28.5
-24.4
0.5
9.9
14.6
9.8
11.1
10.9
12.5
13.3
1999
15.6
8.6
8.9
18.5
1.3
1.0
4.8
2.1
-0.4
9.1
13.1
12.8
2000
5.1
12.9
9.4
16.8
3.6
-5.5
-3.7
5.3
9.9
9.7
22.4
7.7
2001
8.9
11.9
6.7
0.3
-9.0
1.8
-3.0
-8.9
1.4
-1.9
7.2
-9.1
2002
2.7
7.7
-5.2
-3.8
-14.5
-6.3
-7.6
-14.6
-7.6
-7.4
-6.0
-10.6
2003
-2.0
-7.4
-6.8
-5.5
-7.4
-12.0
2.9
-1.8
-2.2
-1.9
-3.4
9.8
2004
-11.6
8.6
0.2
-15.4
13.1
-14.4
-6.9
-7.6
-2.8
-3.7
-9.3
-8.0
2005
1.8
-29.1
0.2
-11.2
-14.5
2.6
0.9
-6.9
3.9
10.9
-2.7
0.6
2006
12.7
0.1
13.8
15.2
-9.8
-5.5
-8.9
-15.9
-5.1
-15.3
-1.4
-3.0
2007
-7.3
-2.7
-1.4
-3.0
-2.7
5.0
-4.3
2.7
1.5
5.4
9.8
14.4
14
Lampiran 3 Hasil analisis korelasi dengan metode pearson SOI dan data awal musim hujan tahun 1978-2007
Koefisien korelasi No
Bulan
kuadrat
1
Januari
0.13930
2
Februari
0.16307
3
Maret
0.10247
4
April
-0.06957
5
Mei
-0.22855
6
Juni
-0.29161
7
Juli
-0.36187
8
Agustus
-0.42350
9
September
-0.36193
10
Oktober
-0.35698
11
November
-0.33419
12
Desember
-0.30352
15
Lampiran 4 Hasil prediksi dengan fungsi kernel RBF Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1978
34
35.6158
2.61
1979
34
33.1578
0.71
1980
30
34.6767
21.87
1981
32
32.9367
0.88
1982
36
37.5057
2.27
1983
29
30.4878
2.21
1984
37
34.8327
4.70
1985
38
35.6027
5.75
1986
31
34.2536
10.59
1987
39
38.3583
0.41
1988
31
36.5945
31.30
1989
33
33.0308
0.00
1990
36
36.6958
0.48
1991
34
36.2732
5.17
1992
34
34.8988
0.81
1993
43
40.1944
7.87
1994
37
35.2947
2.91
1995
40
36.9780
9.13
1996
35
32.7515
5.06
1997
35
36.3884
1.93
1998
31
31.6342
0.40
1999
38
36.4105
2.53
2000
33
32.7998
0.04
2001
32
34.5073
6.29
2002
36
35.3394
0.44
2003
32
35.8297
14.67
2004
38
37.2175
0.61
2005
37
32.7556
18.01
2006
35
35.7180
0.52
2007
34
32.7851
1.48
16
Lampiran 5 Hasil prediksi dengan fungsi kernel Linear Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1978
34
33.7140
0.0818
1979
34
34.4169
0.1738
1980
30
34.9980
24.9796
1981
32
33.0702
1.1454
1982
36
37.1497
1.3218
1983
29
35.3248
40.0030
1984
37
34.5260
6.1206
1985
38
34.3809
13.0976
1986
31
34.7323
13.9300
1987
39
36.9479
4.2109
1988
31
34.6917
13.6286
1989
33
33.5291
0.2800
1990
36
34.1892
3.2790
1991
34
35.0466
1.0953
1992
34
35.7476
3.0542
1993
43
36.2981
44.9155
1994
37
36.2584
0.5499
1995
40
34.2832
32.6824
1996
35
31.7621
10.4837
1997
35
38.1651
10.0182
1998
31
32.9228
3.6972
1999
38
34.0281
15.7762
2000
33
35.1808
4.7561
2001
32
35.0479
9.2895
2002
36
35.4485
0.3042
2003
32
35.7765
14.2623
2004
38
35.9749
4.1009
2005
37
34.0828
8.5099
2006
35
35.4577
0.2095
2007
34
34.2206
0.0487
17
Lampiran 6 Hasil prediksi dengan fungsi kernel Polinomial Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1978
34
34.4145
0.1718
1979
34
37.2129
10.3229
1980
30
34.7262
22.3371
1981
32
33.5585
2.4290
1982
36
54.1882
330.8094
1983
29
34.9425
35.3130
1984
37
33.7001
10.8896
1985
38
35.8208
4.7489
1986
31
32.8745
3.5139
1987
39
39.9547
0.9114
1988
31
40.4180
88.6993
1989
33
43.8613
117.9672
1990
36
34.6846
1.7302
1991
34
34.3912
0.1530
1992
34
36.5410
6.4568
1993
43
34.5472
71.4504
1994
37
37.2866
0.0821
1995
40
34.0411
35.5084
1996
35
32.2028
7.8246
1997
35
44.9575
99.1522
1998
31
35.0702
16.5662
1999
38
34.0703
15.4425
2000
33
34.6771
2.8127
2001
32
34.3712
5.6228
2002
36
33.3198
7.1833
2003
32
35.9267
15.4192
2004
38
34.2994
13.6941
2005
37
33.7335
10.6699
2006
35
33.8972
1.2162
2007
34
34.8937
0.7987
18
Lampiran 7 Hasil prediksi dengan fungsi kernel Sigmoid Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1978
34
34.5325
0.2836
1979
34
49.8753
252.0252
1980
30
25.2796
22.2823
1981
32
25.2543
45.5047
1982
36
19.9550
257.4407
1983
29
34.5926
31.2774
1984
37
18.7299
333.7977
1985
38
26.2212
138.7400
1986
31
45.4143
207.7725
1987
39
48.1523
83.7643
1988
31
62.6652
1002.682
1989
33
42.5369
90.9520
1990
36
26.8632
83.4818
1991
34
21.6173
153.3312
1992
34
24.1635
96.7570
1993
43
16.1869
718.9449
1994
37
28.3991
73.9748
1995
40
35.1762
23.2690
1996
35
38.6419
13.2633
1997
35
54.3405
374.0561
1998
31
35.6810
21.9120
1999
38
44.5206
42.5181
2000
33
27.8067
26.9699
2001
32
22.6627
87.1860
2002
36
26.8406
83.8955
2003
32
31.1161
0.7813
2004
38
38.9305
0.8659
2005
37
48.6946
136.7638
2006
35
23.1719
139.9031
2007
34
17.0604
286.9508
19
Lampiran 8 Hasil simulasi peramalan dengan fungsi kernel RBF Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1998
31
31.2807
0.07878
1999
38
36.0541
3.78651
2000
33
32.6167
0.14695
2001
32
31.4146
0.34272
2002
36
35.6419
0.12821
2003
32
35.4661
12.01369
2004
38
37.5636
0.19042
2005
37
33.1043
15.17647
2006
35
35.7089
0.50248
2007
34
33.3023
0.48674
20
Lampiran 9 Hasil simulasi peramalan dengan fungsi kernel Linear Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1998
31
32.9174
3.6765
1999
38
34.1468
14.8469
2000
33
35.1808
4.7560
2001
32
34.5492
6.4984
2002
36
35.1419
0.7363
2003
32
35.7386
13.9773
2004
38
36.3978
2.5669
2005
37
34.1295
8.2399
2006
35
36.1558
1.3358
2007
34
35.1881
1.4117
21
Lampiran 10 Hasil simulasi peramalan dengan fungsi kernel Polinomial Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1998
31
33.4987
6.2433
1999
38
33.4890
20.3492
2000
33
35.1259
4.5195
2001
32
33.9993
3.9971
2002
36
32.4879
12.3348
2003
32
34.1530
4.6355
2004
38
36.0059
3.9766
2005
37
33.8423
9.9709
2006
35
33.8599
1.2999
2007
34
38.1438
17.1710
22
Lampiran 11 Hasil simulasi peramalan dengan fungsi kernel Sigmoid Tahun
Observasi(x)
Prediksi(y)
Galat (x-y)2
1998
31
19.6015
129.9251
1999
38
24.5864
179.9240
2000
33
38.2103
27.1471
2001
32
55.5179
553.0906
2002
36
45.2337
85.2604
2003
32
35.6247
13.1382
2004
38
34.7147
10.7929
2005
37
40.1590
9.9790
2006
35
45.9909
120.8001
2007
34
31.3934
6.7942
23