OPTIMASI JARINGAN SYARAF TIRUAN DENGAN ALGORITMA GENETIKA UNTUK PERAMALAN CURAH HUJAN
Oleh: Novi Apriyanti G64101004
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2005
ABSTRAK NOVI APRIYANTI. Optimasi Jaringan Syaraf Tiruan dengan Algoritma Genetika untuk Peramalan Curah Hujan. Dibimbing oleh AGUS BUONO dan AZIZ KUSTIYO. Informasi tentang banyaknya curah hujan sangat berguna bagi para petani dalam mengantisipasi kemungkinan terjadinya peristiwa-peristiwa ekstrim (kekeringan dan kebanjiran) yang akan berakibat kegagalan dalam proses produksinya. Dengan demikian, ketersediaan informasi ini memerlukan suatu metode peramalan curah hujan yang akurat. Beberapa penelitian yang sudah dilakukan belum memberikan hasil yang memuaskan. Algoritma genetika standar adalah metode yang digunakan untuk optimasi konfigurasi neuron pada lapisan tersembunyi dalam Jaringan Syaraf Tiruan (JST) ini. Teknik pembelajaran JST yang digunakan dalam metode peramalan curah hujan ini adalah JST propagasi balik standar dengan arsitektur banyak lapis yaitu satu lapisan input, satu lapisan tersembunyi, dan satu lapisan output. Keakuratan hasil prediksi JST diukur berdasarkan R2 dan RMSE-nya. Ujicoba terhadap sistem telah dilakukan JST dalam peramalan curah hujan dan hasilnya dibandingkan dengan metode principal component regression (PCR) dan JST propagasi balik standar dengan hasil terbaiknya dengan jumlah neuron 9 dan laju pembelajaran 0.02. Hasil peramalan curah hujan menggunakan metode PCR menghasilkan R2 sebesar 63%, sedangkan peramalan dengan menggunakan metode jaringan syaraf tiruan propagasi balik menghasilkan R2 sebesar 74%, dan JST yang dioptimasi menjadi 87%. Hal ini menunjukkan adanya peningkatan R2. Berdasarkan ujicoba tersebut dapat diperoleh kesimpulan bahwa optimasi JST dengan algoritma genetika dapat digunakan untuk memperbaiki tingkat pendugaan curah hujan dengan menggunakan data GCM daripada metode PCR dan JST propagasi balik standar. Kata Kunci : Jaringan Syaraf Tiruan (JST), Algoritma Genetika, Principle Component Analysis (PCA), koefisien determinasi (R2), dan RMSE.
Cukuplah Allah menjadi Penolong kami dan Allah adalah sebaik-baik Pelindung, Maka mereka kembali dengan nikmat dan karunia (yang besar dari) Allah, Mereka tidak mendapat bencana apa-apa,mereka mengikuti keridhaan Allah. Dan, Allah mempunyai karunia yang besar. (Q.S. Ali ’Imran:173-174)
OPTIMASI JARINGAN SYARAF TIRUAN DENGAN ALGORITMA GENETIKA UNTUK PERAMALAN CURAH HUJAN
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer Pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Oleh: Novi Apriyanti G64101004
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2005
Judul Skripsi : OPTIMASI JARINGAN SYARAF TIRUAN DENGAN ALGORITMA GENETIKA UNTUK PERAMALAN CURAH HUJAN Nama : Novi Apriyanti NIM : G64101004
Menyetujui, Pembimbing I
Pembimbing II
Ir. Agus Buono, M.Si., M.Kom. NIP. 132 045 532
Aziz Kustiyo, S.Si., M.Kom. NIP. 132 206 241
Mengetahui, Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Dr. Ir. H. Yonny Koesmaryono, MS. NIP. 131 473 999
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT atas limpahan nikmat dan hidayah-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Sholawat serta salam semoga selalu tercurah kepada Nabi besar Nabi Muhammad SAW, keluarga, para sahabat, serta para pengikutnya yang tetap istiqomah mengemban risalah-Nya. Melalui lembar ini, penulis ingin menyampaikan penghargaan dan terima kasih kepada semua pihak atas bantuan, dorongan, saran, kritik serta koreksi yang ditujukan selama penulisan karya ilmiah ini. Ucapan terima kasih penulis ucapkan kepada : 1. Ibu, Bapak, dan adik atas doa, kasih sayang, dukungan, dan pengorbanan yang diberikan sehingga mendorong penulis untuk menyelesaikan karya ilmiah ini. Hanya Allah SWT saja yang dapat membalasnya dengan setara. 2. Bapak Ir. Agus Buono, M.Si, M.Komp. dan Bapak Aziz Kustiyo, S.Si, M.Kom. sebagai pembimbing skripsi I dan II atas segala bimbingan, saran, dan kesabarannya atas penelitian ini. 3. Bapak Irman Hermadi, S.Kom, MS atas segala bimbingannya di sela-sela kesibukan beliau dan kesediaan membimbing sebagai wujud kecintaannya terhadap ilmu dan mahasiswanya. 4. Seluruh staf pengajar yang telah memberikan bekal ilmu dan wawasan selama penulis menuntut ilmu di Departemen Ilmu Komputer IPB. 5. Seluruh staf administrasi atas bantuannya dan juga staf perpustakaan yang tidak bosan melayani kebutuhan buku untuk penulis. 6. Teman-teman kos Cidangiang 46 A Baranangsiang, Khamam yang telah memberikan bantuan banyak, teman-teman Az Zahra yang tidak bisa disebutkan satu persatu, rekanrekan Departemen Ilmu Komputer angkatan 38 dan 37 atas persaudaraan, nasehat, do’a, dorongannya yang tulus sehingga memberikan motivasi bagi penulis untuk cepat menyelesaikan penelitian ini. Semoga Allah SWT selalu memberikan petunjuk-Nya kepada kita semua. 7. Teman-teman satu penelitian : Yani, Lisa, Elmi, Kak Arif dan teman-teman pembahas seminar : Inu, Nepha, Diku. 8. Kak Pesi atas penjelasan skripsi yang tak pernah berhenti serta Kak Aris atas librarinya. 9. Semua instansi yang telah memberikan beasiswa kuliah kepada penulis selama ini. 10. Teman-teman dekat yang senantiasa memberikan do’a dan semangat kepada penulis agar tetap konsisten untuk menyelesaikan penelitian ini. 11. Setiap rakyat di negeri ini yang telah memberikan subsidi terhadap pendidikan dan setiap anak negeri ini yang tidak berkesempatan mengenyam pendidikan layak sehingga menjadikan penulis menghargai, mensyukuri serta berusaha semaksimal mungkin menjalani pendidikan selama ini. Semoga suatu saat penulis dapat memberikan kontribusi yang terbaik bagi mereka. Sebagaimana manusia yang tidak luput dari kesalahan, penulis menyadari bahwa karya ilmiah ini jauh dari sempurna namun penulis berharap semoga karya ilmiah ini dapat bermanfaat bagi siapapun yang membacanya.
Bogor, Oktober 2005
Novi Apriyanti
RIWAYAT HIDUP Penulis dilahirkan di Baturaja, Sumatera Selatan pada tanggal 25 April 1983 sebagai anak pertama dari dua bersaudara, anak dari pasangan Bapak Paino Handoko dan Ibu Tri Supriyani. Penulis menyelesaikan sekolah menengah umum di SMUN 1 Baturaja, lulus pada tahun 2001. Setelah lulus melanjutkan pendidikannya di Departemen Ilmu Komputer Institut Pertanian Bogor melalui program USMI (Undangan Seleksi Masuk IPB). Penulis aktif di berbagai kegiatan dan organisasi kemahasiswaan seperti Dewan Perwakilan Mahasiswa TPB IPB, Badan Eksekutif Mahasiswa FMIPA IPB, Badan Eksekutif Mahasiswa Keluarga Mahasiswa IPB, Kesatuan Aksi Mahasiswa Muslim Indonesia Komisariat IPB, Himpunan Mahasiswa Ilmu Komputer, Teater Garis FMIPA IPB, Kelompok Lingkar Studi Lokomotif Baranangsiang IPB, dan anggota Beswan Djarum. Selama kuliah penulis juga pernah menjadi staf pengajar di Lembaga Bimbingan Belajar Nurul Ilmi dan Nurul Hikmah Bogor. Pada tahun 2004 penulis menjadi operator data entry pada PEMILU legislatif dan eksekutif serta magang di Kantor Direktorat Kemahasiswaan Institut Pertanian Bogor. Pada tahun 2005 penulis melakukan Praktik Kerja Lapang di kantor Balai Besar Penelitian dan Pengembangan Bioteknologi dan Sumberdaya Genetik Pertanian Bogor. Bidang yang diminati penulis berkaitan dengan kecerdasan buatan, yaitu fuzzy system, neural network, dan genetic algorithm.
DAFTAR ISI Halaman DAFTAR TABEL ...............................................................................................................................viii DAFTAR GAMBAR ...........................................................................................................................viii DAFTAR LAMPIRAN .......................................................................................................................viii PENDAHULUAN Latar Belakang ............................................................................................................................... 1 Tujuan ............................................................................................................................................ 1 Ruang Lingkup Penelitian............................................................................................................... 1 TINJAUAN PUSTAKA Model Sirkulasi Umum .................................................................................................................. Curah Hujan .................................................................................................................................... Normalisasi .................................................................................................................................... Principal Component Analysis (PCA) ........................................................................................... Jaringan Syaraf Tiruan (JST) ......................................................................................................... JST Propagasi Balik Standar........................................................................................................... Algoritma Genetika ........................................................................................................................ Ketepatan Pendugaan Model Regresi Linear ..................................................................................
1 1 2 2 3 3 4 5
METODOLOGI Data ............................................................................................................................................... Faktor dan Taraf ............................................................................................................................. Preprocessing data dengan PCA ................................................................................................... Spesifikasi Algoritma Genetika yang Digunakan ......................................................................... Representasi Solusi pada Algoritma Genetika .............................................................................. Respon (Fungsi Fitness) ............................................................................................................... Perangkat Keras dan Lunak yang Digunakan ............................................................................... Perancangan Penelitian ..................................................................................................................
5 6 6 6 7 7 7 7
HASIL DAN PEMBAHASAN Perbandingan R2 dan RMSE JST Standar....................................................................................... 8 Perbandingan R2 dan RMSE JST Optimasi dengan GA ................................................................. 8 Perbandingan R2 dan RMSE JST Standar dan JST Optimasi ......................................................... 9 Arsitektur Terbaik...........................................................................................................................10 Pengaruh Laju Pembelajaran terhadap R2 .......................................................................................10 Perbandingan Waktu Testing JST Standar dan JST Optimasi ........................................................11 Perbandingan dengan Hasil Penelitian Sebelumnya .......................................................................11 KESIMPULAN DAN SARAN Kesimpulan ...................................................................................................................................12 Saran ..............................................................................................................................................12 DAFTAR PUSTAKA ..........................................................................................................................12 LAMPIRAN ........................................................................................................................................14
DAFTAR TABEL
1. 2. 3. 4. 5. 6. 7. 8.
Halaman Faktor dan taraf ........................................................................................................................... 6 Struktur jaringan syaraf tiruan yang digunakan dalam penelitian ............................................... 7 Perbandingan R2 dan RMSE JST standar ................................................................................... 8 Perbandingan R2 dan RMSE JST optimasi .................................................................................. 8 Perbandingan R2 JST standar dan JST optimasi ......................................................................... 9 Perbandingan RMSE JST standar dan JST optimasi .................................................................. 9 Perbandingan rata-rata waktu testing JST standar dan JST optimasi ........................................ 11 Perbandingan nilai R2 dan RMSE dengan penelitian sebelumnya ............................................. 11
DAFTAR GAMBAR
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
Halaman Regresi linear sederhana .............................................................................................................. 3 Grafik fungsi sigmoid biner dengan range (0,1) .......................................................................... 4 Grafik fungsi linear ..................................................................................................................... 4 Diagram proses pendugaan ......................................................................................................... 8 Perbandingan nilai R2 metode JST standar dan JST optimasi .................................................... 9 Perbandingan RMSE JST standar dan JST optimasi ................................................................. 9 Nilai prediksi dan aktual arsitektur terbaik JST standar ............................................................. 10 Nilai prediksi dan aktual arsitektur terbaik JST optimasi ............................................................ 10 Pengaruh laju pembelajaran terhadap R2 JST standar ................................................................. 10 Pengaruh laju pembelajaran terhadap R2 JST optimasi ............................................................... 11 Perbandingan rata-rata waktu testing terkecil JST standar dan JST optimasi ............................ 11 Perbandingan R2 beberapa penelitian ......................................................................................... 12 Perbandingan RMSE beberapa penelitian ................................................................................. 12
DAFTAR LAMPIRAN Halaman Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Pertama 50% Learning, 50% Testing ............................................................................................................... 2. Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Kedua 70% Learning, 30% Testing ............................................................................................................... 3. Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Ketiga 90% Learning, 10% Testing ............................................................................................................... 4. Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Keempat 95% Learning, 5% Testing ................................................................................................................. 5. Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Pertama 50% Learning, 50% Testing ........................................................................................................................................ 6. Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Kedua 70% Learning, 30% Testing ........................................................................................................................................ 7. Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Ketiga 90% Learning, 10% Testing ........................................................................................................................................ 8. Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Keempat 95% Learning, 5% Testing ........................................................................................................................................ 9. Pengaruh Laju Pembelajaran pada JST Standar terhadap Rata-Rata Nilai R2 .............................. 10. Pengaruh Laju Pembelajaran pada JST Standar terhadap Rata-Rata Nilai R2 .............................. 1.
15 16 17 18 29 20 21 22 23 23
1
PENDAHULUAN Latar Belakang Informasi tentang banyaknya curah hujan sangat berguna bagi para petani dalam mengantisipasi kemungkinan terjadinya peristiwa-peristiwa ekstrim yang tidak diinginkan seperti kekeringan dan kebanjiran yang akan berakibat kegagalan dalam proses produksinya. Informasi curah hujan yang diperlukan petani harus tersedia sebelum kegiatan proses produksi dimulai sehingga perlu diadakannya kajian tentang peramalan curah hujan. Dengan menggunakan teknologi di bidang Artificial Intellegence, yaitu teknologi Jaringan Syaraf Tiruan (JST), maka identifikasi pola data dari sistem peramalan curah hujan dapat dilakukan dengan metode pendekatan pembelajaran. Berdasarkan kemampuan belajar yang dimilikinya, maka JST dapat dilatih untuk mempelajari dan menganalisa pola data masa lalu dan berusaha mencari suatu formula atau fungsi yang akan menghubungkan pola data pada masa lalu. JST juga dapat mencari formula atau fungsi yang akan menghubungkan pola data pada masa lalu dengan keluaran yang diinginkan pada saat ini. Saat ini model-model peramalan yang ada belum menggunakan data sirkulasi atmosfir (data spasial-temporal) yang diperoleh dari luaran (output) model sirkulasi umum (General Circulation Model – GCM), untuk mengantisipasi keragaman perubahan curah hujan dalam ruang dan waktu. Penelitian yang pernah dilakukan menggunakan data GCM yaitu menggunakan Principal Component Regression (PCR) atau regresi komponen utama dalam statistical downscaling (Fitriadi 2004) dan JST propagasi balik standar (Normakristagaluh 2004). Untuk itulah dalam tugas akhir ini, penulis berusaha untuk melakukan pendugaan dengan menggunakan JST yang dioptimasi menggunakan Genetic Algorithm (GA) untuk mendukung peramalan curah hujan berdasarkan faktor-faktor dominan yang mempengaruhi curah hujan di Indonesia. Tujuan Tujuan penelitian ini adalah mengembangkan model JST dengan optimasi struktur lapis tersembunyi neuron menggunakan GA untuk peramalan curah hujan.
Ruang Lingkup Penelitian Ruang lingkup penelitian ini meliputi : 1. Dilakukan preprocessing terhadap data input yang digunakan, yaitu dengan mengelompokkan data. Setiap kelompok data dinormalisasi, kemudian dilakukan Principal Components Analysis (PCA) untuk mereduksi dimensi data spasial suhu. 2. Teknik pembelajaran JST yang digunakan adalah propagasi balik standar dengan satu lapisan input, satu lapisan tersembunyi, dan satu lapisan output. 3. Jumlah neuron pada lapis tersembunyi berjumlah 16, baik pada percobaan JST standar maupun pada percobaan JST optimasi menggunakan algoritma genetika. 4. Optimasi struktur neuron lapis tersembunyi menggunakan GA berada pada selang solusi 0-16 dan tujuan fungsi fitness-nya adalah untuk mengoptimalkan nilai R2. 5. Pada tahap postprocessing, hasil prediksi (nilai output) JST diukur berdasarkan R2 dan RMSE-nya.
TINJAUAN PUSTAKA Model Sirkulasi Umum Model sirkulasi umum merupakan model matematika yang menggambarkan hubungan atau interaksi berbagai proses fisik yang berlangsung di atmosfir, laut dan daratan (Ratag 2002 dalam Normakristagaluh 2004). Model ini menduga perubahan unsur-unsur cuaca secara regional pada grid-grid yang berukuran 3o atau 4o sampai 10o menurut lintang dan bujur, dan dapat digunakan untuk peramalan atau menilai dampak yang mungkin timbul apabila terjadi perubahan di udara, laut, dan daratan. Curah Hujan Beberapa informasi untuk menggambarkan keadaan suatu wilayah adalah data curah hujan rata-rata tahunan, hari hujan, pola musiman, dan peluang kejadian hujan. Curah hujan rata-rata tahunan sangat bervariasi menurut tempat. Di gurun, penerimaan hujan tahunan berkisar dari 70 mm per tahun, sementara di beberapa wilayah tropika basah, curah hujan dapat melebihi 4000 mm per tahun. Curah hujan dibatasi sebagai tinggi air hujan (dalam mm) yang diterima di permukaan sebelum mengalami aliran
2
permukaan, evaporasi, dan peresapan/perembesan ke dalam tanah (Handoko 1993 dalam Normakristagaluh 2004). Jumlah hari hujan umumnya dibatasi dengan jumlah hari dengan curah hujan 0.5 mm atau lebih. Jumlah hari hujan dapat dinyatakan per minggu, dekade, bulan, tahun, atau satu periode tanam (tahap pertumbuhan tanaman), dimana curah hujan rata-ratanya dapat dihitung dengan cara menjumlahkan curah hujan harian hasil pengukuran sesuai dengan periode waktu yang diperlukan dan dibagi dengan periode waktu tersebut (Hidayati 1983 dalam Normakristagaluh 2004). Data hujan mempunyai variasi yang sangat besar dibandingkan unsur-unsur iklim yang lain, baik variasi menurut tempat maupun waktu. Untuk mendapatkan gambaran wilayah diperlukan pengamatan yang cukup panjang dan kerapatan jaringan stasiun pengamatan yang memadai. Curah hujan yang diamati pada stasiun klimatologi meliputi tinggi hujan (curah hujan), jumlah hari hujan, dan intensitas hujan. Normalisasi Normalisasi data GCM dilakukan dengan mengurangi nilai setiap grid dengan nilai rataan seluruh grid dibagi standar deviasinya. grid_normali = (gridi – rataan)/stddev rataan stdev =
=
1 n 1 n
n
∑
grid
i −1 n
∑
i =1
( grid
Misalnya diberikan objek pengamatan vektor Grid dengan dimensi p (peubah), Grid=[grid1 grid2 grid3 ... gridp] yang akan direduksi menjadi vektorY=[y1 y2 y3 ... yq ], dimana q <<< p tanpa kehilangan informasi secara berarti, yang dapat dilihat sebagai berikut: grid1 grid2 T y1 = a11grid1 + a12grid2 +...+ a1pgridp = (a11 a12 ...a1p)* = a grid grid p grid1 grid2 T y2 = a21grid1 + a22grid2 +...+ a2pgridp = a21 a22 ...a2p)* = a grid grid p grid1 grid2 T yq = aq1grid1 + aq2grid2 +...+ aqpgridp = (aq1 aq2 ...aqp)* = a grid. grid p
untuk memaksimumkan ragam pada y maka harus dicari nilai a sehingga y = aT Σa dengan kendala a T a = 1 . Dengan menggunakan pengganda Lagrange dibuat suatu fungsi T T F = a Σ a − λ ( a a − 1) yang selanjutnya akan dimaksimumkan dengan cara menurunkan F terhadap parameter-parameternya dan turunannya sama dengan 0, sehingga diperoleh: δF = 2Σ a − 2λ a = 0 δa Σa = λ a
i
i
− rataan ) 2
Tujuan normalisasi adalah untuk mendapatkan nilai rataan nol dan standar deviasi satu. Principal Components Analysis (PCA) PCA atau analisis komponen utama yang disebut juga transformasi Karhunen-Loeve merupakan suatu teknik untuk mereduksi p peubah (variabel) pengamatan menjadi q peubah baru yang saling ortogonal, dimana masing-masing q peubah baru tersebut merupakan kombinasi linear dari p peubah lama. Pemilihan q peubah baru tersebut sedemikian rupa sehingga keragaman yang dimiliki oleh p peubah lama, sebagian besar dapat diterangkan atau dimiliki oleh q peubah baru. PCA akan cukup efektif jika antar p peubah asal memiliki korelasi yang cukup tinggi.
dimana Ó (covariance):
τ 11 τ 21 Σ= τ p1
adalah
τ 12 τ 22
τ 1p τ 2p τ pp
τ p2
matriks
peragam
dengan
1 p ∑ ( gridij − grid j )(gridik − grid k ) n − 1 i =1 a adalah vektor ciri (eigenvectors), λ adalah akar ciri (eigenvalue). Setelah didapatkan matriks covariance Ó selanjutnya akan dicari vektor dan akar ciri yang bersesuaian dengan matriks covariance tersebut, melalui persamaan berikut: Σa = λ a Σa − λI a = 0 (Σ − λ I ) a = 0
τ jk =
3
Dari persamaan tersebut dapat disimpulkan Σ − λI = 0 , dan akan diperoleh suatu persamaan polinom derajat p di dalam ë. Persamaan polinom tersebut akan memiliki p akar, yaitu λ1 , λ 2 , , λ p yang merupakan akar
ciri dari matriks covariance Ó. Akar-akar ciri tersebut kemudian digunakan untuk menentukan vektor-vektor cirinya. Vektorvektor ciri tersebut sebagai koefisien komponen utama. Akar-akar ciri dengan vektor ciri yang bersesuaian tersebut kemudian disusun terurut menurun sehingga memenuhi λ ≥λ ≥λ ≥ ≥λ ≥0. 1
2
3
p
Penentuan proporsi dari nilai vektor-vektor ciri yang digunakan dapat dihitung dengan persamaan: q
Proposi = ∑ λi i =1
n
∑λ i =1
i
Pada akhirnya PCA ini hanyalah akan mentransfer variabel-variabel yang berkorelasi menjadi variabel-variabel yang tidak berkorelasi. Tujuan metode PCA di atas adalah untuk menentukan faktor-faktor yang menunjukkan seluruh kemungkinan variasi pada keseluruhan data melalui sebagian kecil faktor-faktor dari keseluruhan data (Dillon dan Goldstein 1984). Jaringan syaraf tiruan (JST) JST merupakan suatu sistem pemroses informasi yang memiliki persamaan secara umum dengan cara kerja jaringan syaraf biologis. Di dalam JST, input akan diproses oleh neuron-neuron JST dengan bobot tertentu. Bobot hubungan antarelemen atau neuron pada jaringan syaraf disesuaikan berdasarkan galat hasil perbandingan antara output dengan target. Penyesuaian bobot dilakukan sampai jaringan mencapai pola target (Mathwork 2000 dalam Normakristagaluh 2004). Menurut Fauset (1994), jaringan syaraf tiruan memiliki karakteristik-karakteristik sebagai berikut: 1. Pola hubungan antar-neuron yang disebut arsitektur. 2. Metode penentuan bobot pada hubungan yang disebut pelatihan (training) atau pembelajaran (learning). 3. Fungsi aktivasi yang dijalankan masingmasing neuron pada input jaringan untuk menentukan output. JST seperti beberapa metode statistik mampu mengolah data yang besar dan
membuat suatu prediksi dimana kadangkadang keakuratannya lebih baik, tetapi biasanya lebih lambat. Meskipun beberapa model JST sama atau mirip dengan model statistik, ada beberapa istilah yang berbeda, dapat dilihat pada Gambar 1 yang mengilustrasikan model untuk regresi linear sederhana (Weisberg 1985 dan Myers 1986 dalam Normakristagaluh 2004).
Input
x
Outp ut
Targe t Y
Independe Predict Dependent nt ed Variable Gambar 1 RegresiValue linear sederhana. Variable Pada Gambar 1, tanda panah mengindikasikan adanya pembobotan untuk nilai X dimana dalam model statistik dinamakan sebagai parameter estimasi. Dua garis yang paralel mengindikasikan bahwa nilai masing-masing target dapat didekati (diduga) baik dengan metode kuadrat terkecil, maximum likelihood, atau pendekatan estimasi lainnya. Nilai output hasil pembelajaran pada model JST sama dengan suatu nilai ramalan dari suatu analisis data pada model statistik. Peramalan suatu keadaan sistem yang kompleks merupakan suatu domain aplikasi yang luas untuk JST. Sebagian besar pendekatan JST untuk masalah peramalan banyak menggunakan arsitektur jaringan lapis banyak dengan algoritma pembelajaran propagasi balik. JST Propagasi Balik Standar Menurut Fauset (1994), ada tiga tahap pelatihan pada JST propagasi balik, yaitu pelatihan input yang bersifat umpan maju (feedforward), penghitungan propagasi balik galat yang diperoleh, dan penyesuaian bobot. Jaringan ini menggunakan metode pembelajaran terbimbing (supervised learning). Adapun cara kerja JST diawali dengan inisialisasi bobot dan bias. Hal ini berpengaruh dalam kecepatan JST memperoleh kekonvergenan. Teknik inisialisasi yang digunakan dalam penelitian ini adalah inisialisasi NguyenWidrow. Inisialisasi ini umumnya mempercepat proses pembelajaran dibandingakan dengan inisialisasi acak (Fauset 1994). Inisialisasi Nguyen-Widrow didefinisikan sebagai persamaan berikut: a. Hitung harga faktor pengali β
4
β = 0 .7 p
1
n
dimana: β = faktor pengali n = jumlah neuron lapisan input p = jumlah neuron lapisan tersembunyi b. Untuk setiap unit tersembunyi (j=1, 2, ... ,p): - Hitung vij (lama) yaitu bilangan acak diantara -0.5 dan 0.5 (atau di antara -γ dan +γ). Pembaharuan bobot vij (lama) menjadi vij baru yaitu: v ij ( baru ) =
β v ij ( lama ) v ij ( lama )
- Tetapkan Bias. voj = Bobot pada bias bernilai antara -β dan β. Selanjutnya pola input (masukan) dan target dimasukkan ke dalam jaringan. Pola masukan ini akan berubah bersamaan dengan propagasi pola tersebut ke lapisan-lapisan berikutnya hingga menghasilkan output (keluaran). Keluaran ini akan dibandingkan dengan target, jika hasil perbandingan menghasilkan nilai yang sama maka proses pembelajaran akan berhenti. Namun jika berbeda maka JST mengubah bobot yang ada pada hubungan antar neuron dengan suatu aturan tertentu agar nilai keluaran lebih mendekati nilai target. Proses pengubahan bobot adalah dengan cara mempropagasikan kembali nilai koreksi galat keluaran JST ke lapisan-lapisan sebelumnya (propagasi balik). Kemudian dari lapisan masukan, pola akan diproses lagi untuk mengubah nilai bobot sampai akhirnya memperoleh keluaran JST baru. Demikian seterusnya proses ini dilakukan berulang-ulang sampai nilai yang sama atau minimal sesuai dengan galat yang telah didefinisikan. Proses penyesuaian bobot ini disebut pembelajaran. Dalam metode pembelajaran propagasi balik, fungsi pada masukan dan keluaran haruslah berbentuk fungsi yang dapat dideferensialkan karena pada proses propagasi (umpan maju atau propagasi balik) penghitungan nilai didasarkan pada fungsi yang dipakai. Pada umpan maju, fungsi yang dipakai adalah fungsi yang telah ditentukan untuk JST, sedangkan pada propagasi balik, fungsi yang digunakan adalah fungsi diferensialnya. Fungsi yang digunakan dalam penelitian ini adalah sigmoid biner pada lapisan tersembunyi dan fungsi linear pada lapisan output. Fungsi sigmoid ini memiliki daerah
hasil pada interval 0 sampai dengan 1. Turunan fungsi sigmoid biner didefinisikan sebagai persamaan berikut: f’(x) = f(x) [1 – f(x)] Grafik fungsi sigmoid biner dapat dilihat pada Gambar 2.
Gambar 2 Grafik fungsi sigmoid biner dengan range (0,1). Grafik fungsi linear dapat dilihat pada Gambar 3.
Gambar 3 Grafik fungsi linear. Algoritma Genetika Algoritma genetika merupakan evolusi/perkembangan dunia komputer dalam bidang kecerdasan buatan. Sebenarnya algoritma ini terinspirasi oleh teori evolusi Darwin. Algoritma genetika adalah algoritma pencarian yang berdasarkan pada mekanisme sistem natural, yakni genetika dan seleksi alam. Dalam aplikasi algoritma genetika, variabel solusi dikodekan ke dalam struktur string yang merepresentasikan barisan gen, yang merupakan karakteristik dari solusi problem. Berbeda dengan teknik pencarian konvensional, algoritma genetika berangkat dari himpunan solusi yang dihasilkan secara acak. Himpunan ini disebut populasi. Sedangkan setiap individu dalam populasi disebut kromosom yang merupakan representasi dari solusi. Kromosomkromosom berevolusi dalam suatu proses iterasi yang berkelanjutan yang disebut generasi. Pada setiap generasi, kromosom dievaluasi berdasarkan suatu fungsi evaluasi. Setelah beberapa generasi maka algoritma genetika akan konvergen pada kromosom terbaik, yang diharapkan merupakan solusi optimal. Di dalam algoritma genetika cara merepresentasikan permasalahan dalam kromosom merupakan suatu hal yang penting. Dasar-dasar di dalam algoritma genetika yaitu fungsi evaluasi, seleksi, dan operator genetika.
5
Struktur umum dari algoritma genetika sebagai berikut (Gen & Cheng, 1997) :
Prosedur Algoritma Genetika Begin t • 0; inisialisasi P(t) ; evaluasi P(t) ; while (kondisi berhenti belum dicapai) do rekombinasi P(t) menghasilkan C(t) ; evaluasi C(t) ; seleksi P(t + 1) dari P(t) dan C(t) ; t • t+1; end End Fungsi evaluasi merupakan dasar untuk proses seleksi. Langkah-langkahnya yaitu string dikonversi ke parameter fungsi, fungsi objektifnya dievaluasi, kemudian mengubah fungsi objektif tersebut ke dalam fitness. Di mana untuk maksimasi problem, fitness sama dengan fungsi objektifnya. Output dari fungsi fitness dipergunakan sebagai dasar untuk menyeleksi individu pada generasi berikutnya. Pada proses seleksi digunakan roulette whell yang merupakan salah satu metode seleksi yang banyak dipergunakan. Roulette whell menyeleksi populasi baru dengan distribusi probabilitas yang berdasarkan nilai fitness. Operator genetika dipergunakan untuk mengkombinasi (modifikasi) individu dalam aliran populasi guna mencetak individu pada generasi berikutnya. Ada dua operator genetika yaitu crossover dan mutasi. Crossover membangkitkan generasi baru dengan mengganti sebagian informasi dari parents (orang tua/induk). Mutasi menciptakan individu baru dengan melakukan modifikasi satu atau lebih gen dalam individu yang sama. Mutasi berfungsi untuk menggantikan gen yang hilang dari populasi selama proses seleksi serta menyediakan gen yang tidak ada dalam populasi awal, sehingga mutasi akan meningkatkan variasi populasi. Ketepatan Pendugaan Model Regresi Linear Ketepatan atau keakuratan sebuah model regresi dapat dilihat dari koefisien determinasi (R2) dan Root Mean Square Error (RMSE). R2 menunjukkan proporsi jumlah kuadrat total
yang dapat dijelaskan oleh sumber keragaman peubah bebas, sedangkan RMSE menunjukkan seberapa besar simpangan nilai dugaan terhadap nilai aktualnya. Kita juga dapat menunjukkan bahwa R2 adalah kuadrat dari korelasi antara nilai vektor observasi (the vector of observations) y dengan nilai vektor penduganya (the vector of fitted values) • (Douglas dan Elizabeth 1992 dalam Normakristagaluh 2004). Menurut Walpole (1982) R2 dan RMSE dirumuskan sebagai berikut: R
2
=
n ∑ ( yˆ i − yˆ )( y i − y ) i =1 n
∑
i =1
( yˆ i − yˆ ) 2
n
∑
i =1
2
( yi − y)2
dimana: yi = nilai-nilai aktual. • i = nilai-nilai prediksi. n
RMSE
=
∑ (X t =1
t
− Ft ) 2
n dimana: Xt = nilai aktual pada waktu ke-t Ft = nilai dugaan pada waktu ke-t Nilai R2 berada pada selang 0 sampai 1. Kecocokkan model dikatakan semakin baik jika R2 mendekati 1 dan RMSE mendekati 0.
METODOLOGI Data
Data yang penelitian ini adalah:
diperlukan
dalam
(1.) Data GCM∗ (X(t x g)) Data ini diperoleh dari NCEP/NCAR sebagai salah satu sumber luaran model GCM dengan skala (grid) 2.8o x 2.8o (1o = 110 km). Domain cakupan data GCM ini adalah 23o LU - 23o LS dan 80o BT - 160o BT, yang mencakup wilayah Indonesia dan lautan Pasifik. Pada penelitian ini, domain yang digunakan adalah 21.90 LU21.90 LS dan 82.50 BT-157.50 BT yang mencakup wilayah DAS Saguling Jawa Barat. Peubah-peubahnya akan ditentukan berdasarkan mekanisme fisik yang berkaitan erat dengan curah hujan, seperti sea surface temperature (suhu) pada 41 × 24 grid dari tahun 1986–2002. Data GCM (domain) yang digunakan dipilih berdasarkan kriteria oleh Von Storch (Bergant 1999 dalam Normakristagaluh ∗
http://www.iridl.coloumbia.edu (2-03-2003)
6
2004) yang menyatakan bahwa domain minimal 8 × 8 grid di wilayah respon. Domain yang adalah yang berkorelasi tinggi wilayah respon.
jumlah sekitar dipilih dengan
keterhubungan dari neuron yang kurang bermanfaat (Kusumoputro 2004). Pada penelitian ini digunakan pendekatan kedua yaitu membuang bobot keterhubungan dari neuron yang memberikan kontribusi R2 kecil.
(2.) Data Curah Hujan (Y(t)) Respon yang digunakan dalam penelitian ini adalah curah hujan rata-rata dari tahun 1986 – 2002 di DAS Saguling yang diperoleh dari Badan Pengkajian dan Penerapan Teknologi (BPPT).
Dalam penelitian ini jumlah perlakuan dengan menggunakan optimasi algoritma genetika dan tanpa menggunakan algoritma genetika masing-masing sebanyak 4 (faktor 1) X 5 (faktor 2) X 5 (faktor 3) yaitu 100 perlakuan dengan perulangan sebanyak 10 kali untuk tiap perlakuan dengan tujuan untuk memperoleh rata-rata R2 dan RMSE yang memiliki simpangan baku terkecil.
Faktor dan Taraf Faktor dan taraf yang digunakan dalam penelitian ini ditampilkan pada Tabel 1. Tabel 1 Faktor dan taraf No. 1.
Faktor Persentase training digunakan JST
2.
Persentase keragaman data pada data preprocessing dengan PCA (Principal Components Analysis) Laju peembelajaran (learning rate)
3
data yang
Taraf • • • • • • • • • • • • • •
95% 90 % 70 % 50 % 80 % 90 % 95 % 99% 99.8% 0.5 0.2 0.1 0.05 0.01
Penggunaan algoritma genetika dalam optimasi jaringan syaraf buatan dilakukan untuk mendapatkan struktur neuron pada lapis tersembunyi yang mendekati optimal. Tingkat pengenalan JST dalam peramalan yang tinggi akan didapat apabila seluruh neuron pada lapis tersembunyi memberikan kontribusi nilai objektif yang tinggi, dalam hal ini penulis menekankan nilai R2. Apabila neuron yang memberikan kontribusi R2 yang kecil dapat dihilangkan, sedangkan yang memberikan kontribusi R2 besar dapat dipertahankan, maka jaringan syaraf buatan ini dapat diharapkan memberikan nilai R2 yang lebih tinggi. Penghilangan neuron yang kurang bermanfaat ini dapat dilakukan dengan dua cara, yaitu dengan membuang sejumlah bobot dari setiap neuron yang memberi kontribusi R2 kecil atau dengan membuang sejumlah neuron yang berarti membuang seluruh bobot
Preprocessing data dengan PCA Pertama, dilakukan normalisasi terhadap sejumlah data training yang akan digunakan dan dihasilkan rataan dan simpangan bakunya. Kedua, dilakukan proses PCA pada data training hasil normalisasi tersebut sehingga didapatkan kombinasi linear atau komponen-komponen utamanya (principal components) yang selanjutnya disebut sebagai matriks transformasi. Dengan dilakukan perkalian antara data training dengan matriks transformasi tersebut didapatkan data training yang baru. Ketiga, dilakukan normalisasi data testing dengan menggunakan rataan dan standar deviasi yang diperoleh dari data training kemudian dilakukan perkalian dengan matriks transformasi sehingga diperoleh data testing yang baru. Selanjutnya data training dan data testing yang baru tersebut digunakan oleh proses pada JST standar dan JST optimasi menggunakan algoritma genetika. Spesifikasi Algoritma Genetika yang Digunakan Pada penelitian ini digunakan algoritma genetika dengan parameter sebagai berikut : 1. Representasi Solusi : Binary String. 2. Populasi : 60 individu. 3. Jumlah Generasi : 100 generasi. 4. Pindah Silang : Simple Crossover (0.6) 5. Mutasi : Binary Mutation (0.0333) 6. Mekanisme Seleksi : Roulette Whell. Model algoritma genetika ini berdasarkan model yang pernah dicoba oleh Kusumoputro (2004). Pengkodean kromosom yang dipakai adalah string biner, dengan tiap bit dalam string kromosom merepresentasikan sebuah neuron. Bit yang bernilai 1 merepresentasikan neuron yang dipertahankan dan bit yang bernilai 0 merepresentasikan neuron yang
7
dibuang. Penggunaan parameter seperti dijelaskan di atas dinilai mencukupi bagi algoritma genetika untuk melakukan pencarian solusi optimal bagi jumlah neuron lapis tersembunyi. Hal ini dilakukan berdasarkan hasil observasi yang dilakukan bahwa solusi yang didapat oleh algoritma genetika sudah mengalami konvergen (tidak mendapatkan solusi baru yang lebih baik). Representasi Solusi pada Algortima Genetika Pengkodean string biner sepanjang 16 bit diambil dari jumlah neuron maksimum yang ditentukan pada lapis tersembunyi. Hal ini berdasarkan penelitian oleh Kusumoputro (2004). Selanjutnya bit-bit yang panjangnya 16 tersebut (mulai dari semua bit yang bernilai 0 semua sampai dengan bit yang bernilai 1 semua) masing-masing dikonversi menjadi bilangan berbasis sepuluh sehingga diperoleh selang pencarian bilangan bulat antara 065535. Proses konversi dari deret biner sepanjang 16 bit menjadi bilangan bulat x dengan selang [0,65535] dilakukan dengan cara : 16
(< b16b15b14 b0 >)2 = (∑bi .2i )10 = x'
RMSE = besar simpangan nilai dugaan terhadap nilai aktualnya. 0,001 pada persamaan di atas merupakan suatu konstanta (bilangan) yang dianggap sangat kecil sehingga dalam proses GA fungsi fitness tersebut tidak menghasilkan nilai tak hingga (ketika RMSE bernilai 0). Nilai 0,001 merupakan nilai toleransi galat yang digunakan dalam JST standar. Penambahan nilai 1/(RMSE+0,001) dalam fungsi fitness diharapkan dapat dihasilkan sebuah nilai R2 yang optimum berpasangan dengan dengan nilai RMSE yang lebih baik. Akan tetapi dalam penelitian ini fungsi fitness yang dibuat bukan untuk meminimumkan nilai RMSE melainkan memaksimumkan nilai R2 sehingga untuk hasil RMSE dalam percobaan sangat bervariasi (bisa lebih tinggi dari pada JST standar atau lebih rendah). Tabel 2 Struktur JST yang digunakan dalam penelitian KARAKTERISTIK
SPESIFIKASI
Arsiktektur
1 layer hidden
Neuron Input
Dimensi PCA (untuk grid-grid lokal GCM)
Neuron Layer Hidden
Tanpa GA, dengan GA
Neuron Layer Output
1 (target data Curah Hujan)
Fungsi Aktivasi Layer Hidden
Sigmoid Biner
Fungsi Aktivasi Layer Output
Linear
Inisialisasi Bobot
Nguyen-Widrow
Toleransi galat
0.001
Target Epoch
1500
Laju Pembelajaran
0.01 0.05 0.1 0.2 0.5
i =0
Proses konversi bilangan berbasis sepuluh, dalam hal ini merupakan ruang pencarian [0,65535] dihitung dengan cara :
65535 x = 0 + x'. 16 2 −1
Dengan selang pencarian 0-65535 maka diambil bilangan acak untuk dikonversi menjadi bilangan berbasis dua (biner) dengan panjang 16 bit yang digunakan dalam inisialisasi populasi. Respon (Fungsi Fitness) Respon yang diambil dalam penelitian ini adalah nilai R2 yang dicapai oleh jaringan syaraf buatan setelah dilakukan optimasi oleh algoritma genetika berdasarkan persentase data training, persentase keragaman PCA yang digunakan, dan berbagai nilai learning rate yang digunakan. Sedang fungsi fitness yang dipakai adalah memaksimumkan nilai r (koefisien korelasi) yang secara otomatis memaksimumkan nilai R2. Perhitungannya dilakukan sebagai berikut. f ( r , RMSE
dimana : r
) = r +
1 RMSE
=
+ 0 , 001
koefisien korelasi.
Perangkat Keras dan Lunak yang Digunakan Penelitian ini akan menggunakan perangkat keras dan lunak, di antaranya : a. Microsoft Windows XP Professional b. Matlab 6.5 c. Microsoft Excel XP d. AMD Athlon XP 2400 GHz e. Memori DDR 256 MB f. Hardisk 80 GB Perancangan Penelitian Tahapan-tahapan yang dilakukan dalam perancangan yaitu dengan merepresentasikan
8
data mentah yang diperoleh menjadi masukan yang dapat diolah yang kemudian bermanfaat untuk menentukan metode pembelajaran dalam JST propagasi balik standar. Selanjutnya setelah dilakukan pembelajaran akan didapatkan bobot pelatihan yang akan digunakan dalam testing pada JST standar dan proses optimasi JST dengan GA. Pengambilan Data
Pemilihan/Pengelompokan Data Percobaan
Normalisasi dan PCA Data Training dan Testing
Training dengan JST Standar dan Simpan Bobot
Testing (Simulasi) dengan JST Standar
Proses optimasi JST Standar dengan GA
Hasil Testing JST Standar
Testing (Simulasi) dengan JST Optimasi
Analisis R2 dan RMSE JST Standar
Hasil Testing JST Optimasi
Analisis R2 dan RMSE JST Optimasi
Gambar 4 Diagram proses pendugaan. HASIL DAN PEMBAHASAN Data hasil seluruh percobaan dapat dilihat pada Lampiran 1- 10. Perbandingan R2 dan RMSE JST Standar Dalam percobaan JST standar , kelompok data pertama (50% data training) diperoleh R2 maksimum sebesar 0.11099 (11,099%) pada keragaman data 99,8% dan laju pembelajaran 0,1 dengan RMSE sebesar 83.512. Untuk kelompok data kedua (70% data training) diperoleh R2 maksimum sebesar 0.18374 (18.374%) pada keragaman data 95% dan laju pembelajaran 0.05 dengan RMSE 70.258.
Untuk kelompok data ketiga (90% data training) diperoleh R2 maksimum sebesar 0.42052 (42.052%) pada keragaman data 95% dan laju pembelajaran 0.5 dengan RMSE 62.125. Untuk kelompok data keempat (95% data training) diperoleh R2 maksimum sebesar 0.48179 (48.179%) pada keragaman data 95% dan laju pembelajaran 0.1 dengan RMSE 76.603. Hasil selengkapnya dapat dilihat dalam Tabel 3. Tabel 3 Perbandingan R2 dan RMSE JST standar Kelompok Data R2 RMSE 1 (50% data training) 0.11099 83.512 2 (70% data training) 0.18374 70.258 3 (90% data training) 0.42052 62.125 4 (95% data training) 0.48179 76.603 Berdasarkan Tabel 3 terlihat bahwa pembagian data menjadi data taining dan data testing sangat berpengaruh terhadap nilai R2. Semakin besar data training yang digunakan, maka semakin tinggi nilai R2. Untuk nilai RMSE terjadi penurunan ketika data training ditingkatkan akan tetapi hal ini tidak terjadi pada kelompok data keempat (95% data training) yang nilai RMSE-nya meningkat kembali. Dengan demikian, penambahan data training tidak selalu menyebabkan penurunan nilai RMSE. Perbandingan R2 dan RMSE JST Optimasi dengan GA Dalam percobaan menggunakan JST yang sudah dioptimasi dengan GA, kelompok data pertama (50% data training) diperoleh R2 maksimum sebesar 0.38732(38,732%) pada keragaman 95% dan laju pembelajaran 0,01 dengan RMSE sebesar 189.083. Kelompok data kedua (70% data training) diperoleh R2 maksimum sebesar 0.37746 (37.746%) pada keragaman 99.8% dan laju pembelajaran 0,2 dengan RMSE 61.893. Kelompok data ketiga (90% data training) diperoleh R2 maksimum sebesar 0.51598 (51.598%) pada keragaman 99% dan laju pembelajaran 0,05 dengan RMSE 132.864. Kelompok data keempat (95% data training) diperoleh R2 maksimum sebesar 0.87717 (87.717%) pada keragaman 99.8% dan laju pembelajaran 0,1 dengan RMSE 78.472. Hasil selengkapnya dapat dilihat dalam Tabel 4.
9
R2 0.38732 0.37746 0.51598 0.87717
RMSE 189.083 61.893 132.864 78.472
Berdasarkan Tabel 4 terlihat bahwa pembagian data menjadi data taining dan data testing dalam berbagai kelompok data masih relatif sangat berpengaruh terhadap nilai R2. Semakin besar data training yang digunakan, maka relatif semakin tinggi nilai R2. Akan tetapi hal ini tidak terjadi pada kelompok data kedua yang cenderung menurun. Untuk nilai RMSE terjadi perbedaaan nilai yang bervariasi ketika data training ditingkatkan. Dengan demikian, penambahan data training tidak memberikan pengaruh terhadap penurunan nilai RMSE. Perbandingan R2 dan RMSE JST Standar dan JST Optimasi Perbandingan R2 dan RMSE antara JST Standar dan JST yang dioptimasi dapat dilihat pada Tabel 5 dan Tabel 6.
Nilai R
Kelompok Data 1 (50% data training) 2 (70% data training) 3 (90% data training) 4 (95% data training)
2
Tabel 4 Perbandingan R2 dan RMSE JST optimasi
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1
2
3
4
Kelom pok Data
JS T_S tandar
JS T_Optim asi
Gambar 5 Perbandingan nilai R2 metode JST standar dan JST optimasi. Jika dibandingkan nilai R2 antara kedua metode, maka terlihat bahwa untuk semua kelompok data nilai R2 JST yang sudah dioptimasi selalu lebih tinggi dari pada nilai R2 JST standar. Berdasarkan Tabel 6 terlihat bahwa nilai RMSE untuk kedua metode cenderung bervariasi tidak tergantung pada pembagian kelompok data. Hal ini berarti bahwa pembagian data menjadi data training dan data testing tidak berpengaruh terhadap penurunan nilai RMSE. 20 0
Kelompok Data 1 (50% data training) 2 (70% data training) 3 (90% data training) 4 (95% data training)
R2 JST Standar 0.11099 0.18374 0.42052 0.48179
JST Optimasi 0.38732 0.37746 0.51598 0.87717
Tabel 6 Perbandingan RMSE JST standar dan JST optimasi Kelompok Data 1 (50% data training) 2 (70% data training) 3 (90% data training) 4 (95% data training)
RMSE JST JST Standar Optimasi 83.512 189.083 70.258 61.893 62.125 132.864 76.603 78.472
Sesuai hasil yang terdapat di dalam Tabel 5 terlihat bahwa untuk kedua metode yang digunakan, nilai R2 terbaik terletak pada kelompok data keempat (95% data training). Hal ini berarti bahwa pembagian data menjadi data training dan data testing cukup berpengaruh terhadap peningkatan nilai R2. Sedangkan untuk perbandingan nilai R2 bagi kedua metode bisa dilihat bahwa nilai R2 JST yang sudah dioptimasi lebih tinggi dari pada JST standar.
15 0 Nilai RM S E
Tabel 5 Perbandingan R2 JST standar dan JST optimasi
10 0 50 0 1
2
3
4
Ke lom pok Da ta JS T_S tanda r
JS T_O ptim a s i
Gambar 6 Perbandingan RMSE JST standar dan JSToptimasi. Jika dibandingkan nilai RMSE antara kedua metode , maka terlihat bahwa untuk semua kelompok data nilai RMSE-nya selalu bervariasi. Seperti pada kelompok data pertama terlihat perbedaan RMSE yang cenderung sangat besar. Sebagian besar JST yang sudah dioptimasi nilai RMSE-nya selalu lebih besar dibanding JST standar kecuali pada kelompok data kedua. Hal ini disebabkan karena dalam optimasi menggunakan GA fungsi fitness yang digunakan adalah memaksimumkan nilai R2 bukanlah meminimumkan nilai RMSE sehingga konfigurasi neuron yang didapat merupakan neuron-neuron yang memberikan kontribusi nilai R2 yang tinggi.
10
350 250 200 150 100 50
30 0 25 0 20 0 15 0 10 0 50 0 1
2
3
4
5
6
7
8
9
10
11
12
Bula n P redik s i
A k tual
Gambar 8 Nilai prediksi dan aktual arsitektur terbaik JST optimasi. Pada Gambar 8 terdapat beberapa bulatan nilai prediksi yang hampir berhimpit dengan nilai aktual sehingga nilai error pun bisa semakin kecil. Nilai R2 sebesar 0.87717 dapat diartikan bahwa 87.717% di antara keragaman dalam nilai-nilai prediksi dapat dijelaskan oleh hubungan linearnya dengan nilai aktual.
0 1
2
3
4
5
6
7
8
9
10
11
12
Bu lan
P redik s i
A k tual
Gambar 7 Nilai prediksi dan aktual arsitektur terbaik JST standar. Pada kasus ini, semakin banyak bulatan pada nilai prediksi yang menempel pada kotak nilai aktual, maka error pun semakin kecil. Nilai R2 sebesar 0.48179 dapat diartikan bahwa 48.179% di antara keragaman dalam nilai-nilai prediksi dapat dijelaskan oleh hubungan linearnya dengan nilai aktual. Pada grafik di atas curah hujan prediksi pada bulan Juli bernilai negatif. Hal ini dapat diartikan bahwa pada bulan tersebut curah hujan dianggap 0 atau tidak ada hujan. Pada percobaan menggunakan JST yang sudah dioptimasi menggunakan GA diperoleh arsitektur terbaik pada kelompok data keempat dengan nilai R2 sebesar 0.87717 (87.717%) dan RMSE sebesar 78.472 dengan konfigurasi struktur neuron pada lapis tersembunyi 0 1 0 1 1 1 0 0 1 0 1 1 0 1 0 0 yang berarti sebanyak delapan neuron pada lapis tersembunyi yang dibuang. Grafik pada Gambar 8 merupakan grafik pendugaan terbaik yang didapat pada percobaan menggunakan JST yang sudah dioptimasi.
Pengaruh Laju Pembelajaran terhadap R2 Berdasarkan Gambar 9 bisa dilihat bahwa nilai laju pembelajaran terhadap nilai R2 JST standar pada kelompok data dan PCA arsitektur terbaik, yaitu 95% data training dan PCA 95% sangat bervariasi. Pada grafik bisa dilihat bahwa laju pembelajaran 0.1 memiliki nilai R2 maksimum. 0.5 0.45 0.4 0.35 0.3 2
-50
Nilai R
Rata-Rata C urah Hujan
300
35 0 Rata-Rata Curah Hujan
Arsitektur Terbaik Pola ternyata sangat input berpengaruh terhadap nilai R2 dalam JST. Seperti telah dijelaskan di atas bahwa dalam penelitian ini data dikelompokkan dalam berbagai kelompok percobaan dengan membagi data menjadi data training dan data testing. Pada percobaan menggunakan JST standar diperoleh arsitektur terbaik pada kelompok data keempat dengan nilai R2 sebesar 0.48179 (48.179%) dan RMSE sebesar 76.603. Gambar 7 merupakan grafik pendugaan terbaik yang didapat pada percobaan menggunakan JST standar.
0.25 0.2 0.15 0.1 0.05 0 0.01
0.05
0.1
0.2
0.5
Nilai L aju Pe m be lajaran
Gambar 9 Pengaruh laju pembelajaran terhadap R2 JST standar. Hal yang sama juga terjadi pada JST optimasi. Pada kelompok data dan PCA arsitektur terbaik, yaitu 95% data training dan PCA 99.8%, nilai R2 yang diperoleh sangat bervariasi. Pada grafik bisa dilihat bahwa laju pembelajaran 0.1 memiliki nilai R2 maksimum.
11
tidak terlalu banyak sehingga perbedaan antara metode JST standar dan JST optimasi tidak terlalu jelas (masih bervariasi). Bahkan bisa dilihat bahwa terdapat nilai 0 yang artinya waktu yang digunakan untuk testing sangat kecil sekali sehingga nilainya menjadi 0.
1 0.9 0.8
Nilai R2
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0.01
0.05
0.1
0.2
0.5
Nilai Laju Pem belajaran
Gambar 10 Pengaruh laju pembelajaran terhadap R2 JST optimasi. Dari Gambar 9 dan Gambar 10, untuk setiap laju pembelajaran hasil R2 rata-rata pada JST optimasi selalu lebih baik dari hasil R2 rata-rata pada JST standar. Perbandingan Waktu Testing JST Standar dan JST yang Dioptimasi Perbandingan rata-rata waktu testing antara JST standar dan JST yang sudah dioptimasi dapat dilihat dalam Tabel 7. Tabel 7 Perbandingan rata-rata waktu testing JST standar dan JST optimasi
Rata-Rata Waktu Testing (detik) JST JST Standar Optimasi 0.0047 0.0048 0.0016 0.0015 0 0.0031 0.0031 0
Kelompok Data 1 (50% data training) 2 (70% data training) 3 (90% data training) 4 (95% data training)
Waktu testing pada Tabel 7 diperoleh dari waktu rata-rata testing yang paling kecil dari masing-masing kelompok data. Rata-Rata Waktu Testing
0.006 0.005 0.004 0.003 0.002 0.001 0 1
2
3
4
Kelom pok Data JS T_S tandar
JS T_Optim asi
Gambar 11 Perbandingan rata-rata waktu testing terkecil JST standar dan JST optimasi. Pada grafik diperoleh bahwa rata-rata waktu testing nilainya bervariasi antara kedua metode. Hal ini disebabkan karena data yang digunakan untuk testing masih relatif sedikit dan jumlah neuron pada lapis tersembunyi
Perbandingan dengan Hasil Penelitian Sebelumnya Hasil R2 dalam penelitian menggunakan JST yang dioptimasi lebih baik dari pada penelitian sebelumnya yang menggunakan JST propagasi balik standar dan metode PCR. Pada metode PCR, R2 yang dihasilkan sebesar 63.16% dan RMSE sebesar 74.24 sedangkan JST propagasi balik standar menghasilkan nilai R2 sebesar 74.02% dan RMSE 65.16. Sedangkan pada penelitian sekarang yang menggunakan JST yang sudah dioptimasi dengan algoritma genetika diperoleh nilai R2 yang sedikit lebih tinggi yaitu 87.717% dan RMSE sebesar 78.472. Tabel 8 Perbandingan nilai R2 dan RMSE dengan penelitian sebelumnya Metode PCR1) JST Standar2) JST Standar JST Optimasi Keterangan : 1) Fitriadi 2004. 2) Normakristagaluh 2004.
R2 63.16% 74.02% 48.179% 87.717%
RMSE 74.24 65.16 76.603 78.472
Nilai R2 74.02% pada percobaan dengan JST standar oleh Normakristagaluh (2004) terletak pada jumlah neuron lapis tersembunyi sebanyak 9 dan laju pembelajaran 0.02 yang merupakan arsitektur terbaik. Dari Tabel 8 terlihat bahwa nilai R2 penelitian ini yang menggunakan optimasi lebih besar disebabkan karena di dalam algoritma genetika terdapat pembuangan neuron yang memberikan kontribusi nilai R2 yang kecil dibuang sehingga yang tersisa adalah neuron-neuron yang memberikan kontribusi nilai R2 yang lebih besar. Untuk nilai RMSE belum terjadi penurunan dari penelitian sebelumnya. Hal ini disebabkan karena fungsi fittnes yang digunakan bukan untuk meminimumkan nilai RMSE.
12
100 90 80 70 60
Nilai R2
50 40 30 20 10 0 PCR 1)
JST Standar 2)
JST Standar
JST Optimasi
dalam %
Gambar 12 Perbandingan R2 beberapa penelitian. 90 80
N ila i R M SE
70
Saran Penelitian ini masih memiliki banyak kekurangan sehingga masih perlu pengembangan penelitian selanjutnya. Oleh sebab itu disarankan hal-hal sebagai berikut : 1. Penambahan parameter GCM selain suhu dan curah hujan, seperti kelembaban, arah angin, dan parameter lain yang berkorelasi dengan curah hujan. 2. Menambahkan mekanisme pada optimasi algoritma genetika, misalnya dengan menambahkan mekanisme elitisme dan pengunaan operator crossover yang berbeda seperti dengan n-point crossover. 3. Penelitian terhadap optimasi nilai RMSE. DAFTAR PUSTAKA
60 50 40 30 20 10 0 PCR 1 )
JST Sta nd ar 2 )
JST Sta nd ar
JST Optim as i
Dillon, WR. & Goldstein, M. 1984. Multivariate Analysis Method and Applications. John Wiley & Sons, New York.
N ila i R MSE
Gambar 13 Perbandingan RMSE beberapa penelitian.
Keterangan : 1) Fitriadi 2004. 2) Normakristagaluh 2004.
KESIMPULAN DAN SARAN Kesimpulan Berdasarkan penelitian yang telah dilakukan, maka dapat ditarik kesimpulan sebagai berikut : 1. Algoritma genetika dapat digunakan dalam optimasi salah satu parameter dalam JST, dalam hal ini struktur neuron pada satu lapis tersembunyi untuk meningkatkan nilai pendugaan berupa nilai R2, yaitu meningkat dari 48.179% menjadi 87.717% dengan RMSE 78.472. 2. Arsitektur terbaik dengan nilai R2 terbaik pada percobaan ini terjadi pada kelompok data keempat yaitu 95% data training dan 5% data testing untuk kedua percobaan dan pada learning rate 0,1, yaitu 48.179% untuk JST standar dan 87.717% untuk JST optimasi. 3. Pada penelitian ini, model JST optimasi selalu menghasilkan nilai R2 yang lebih tinggi dari pada JST standar (sekitar bertambah 9.546% sampai 38.538%).
Fauset, L. 1994. Fundamentals of Neural Networks. Prentice Hall, New Jersy. Fitriadi. 2004. Kombinasi Model Regresi Komponen Utama dan Arima dalam Skripsi. Statistical Downscaling. Departemen Statistika FMIPA IPB, Bogor. Fu, LM. 1994. Neural Networks in Computer Intellegence. Singapore : Mc Graw-Hill. Gen, M. & Runwei C. 1997. Genetics Algorithms and Engineering Design. John Wiley & Sons, Inc. Canada. Kusumadewi, S. 2004. Membangun Jaringan Syaraf Tiruan Menggunakan matlab & Excel Link. Yogyakarta : Graha Ilmu. Kusumoputro, B. 2004. Pengembangan Sistem Pengenal Wajah secara 3 Dimensi menggunakan Hemisphere Structure of Neural Networks dan Optimasi Struktur menggunakan Algoritma Genetika. Makalah Seminar Nasional dan Ilmu Komputer dan Teknologi Informasi V. Fakultas Ilmu Komputer, UI, Depok. Michalewicz, Z. 1995. Genetic Algorithms + Data Structures = Evolution Programs. W. H. Freeman and Company. New York.
13
Normakristagaluh, P. 2004. Penerapan Jaringan Syaraf Tiruan untuk Peramalan Curah Hujan dalam Statistical Downscaling. Skripsi. Departemen Ilmu Komputer FMIPA IPB. Bogor. Suyanto. 2005. Algoritma Genetika dalam Matlab. Yogyakarta : Andi Walpole, E.R. 1995. Pengantar Statistika. PT Gramedia Pustaka Utama, Jakarta.
LAMPIRAN
15
Lampiran 1 Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Pertama 50% Learning, 50% Testing PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Rata-rata Waktu Testing 0.0078 0.0062 0.0063 0.0093 0.0078 0.0079 0.0048 0.0094 0.0157 0.0062 0.0126 0.0063 0.0126 0.0093 0.0016 0.0079 0.0048 0.0125 0.0156 0.0048 0.0095 0.0095 0.0126 0.0108 0.0141
Min R2 0.0092109 0.013721 9.0434E-07 0.01034 0.00053525 0.0053582 0.0035523 0.0065063 0.020106 0.0071346 0.021596 0.031215 0.0017689 0.067776 0.0056295 0.01329 0.0034161 0.029648 0.0068526 0.0034161 0.0019591 0.059773 0.11099 0.016278 0.008764
Maks R2 0.020093 0.023601 0.015839 0.022 0.011634 0.028599 0.037631 0.095791 0.095918 0.015491 0.055472 0.10425 0.04675 0.10227 0.02734 0.023284 0.038625 0.049888 0.014276 0.038625 0.0019591 0.059773 0.11099 0.016278 0.008764
Rata-rata R2 0.0129 0.016716 0.0016057 0.01325 0.0039371 0.015897 0.024131 0.043695 0.046508 0.0097889 0.031391 0.053255 0.01286 0.079805 0.010054 0.016058 0.013431 0.03841 0.010083 0.013431 0.0019591 0.059773 0.11099 0.016278 0.008764
Proses Uji Std R2 0.0036762 0.0029671 0.0050012 0.0040742 0.0038542 0.0093617 0.009711 0.038787 0.02972 0.0031261 0.012382 0.021387 0.01281 0.014373 0.0073929 0.0026486 0.010195 0.0070779 0.0026511 0.010195 0 1.46E-13 1.46E-13 0 1.83E-14
Min RMSE 92,074 90,692 97,358 91,244 99,111 109.55 102.72 86,374 88,887 110.4 103.6 85.56 92.16 84,072 115.81 120.01 109.12 108.79 109.71 109.12 111.28 96,885 83,512 100.16 128.7
Maks RMSE 99,805 96,332 241.92 98,215 112.24 134.9 121.79 115.83 145.26 124.62 138.29 119.87 140.19 107.62 142.6 134.23 147.67 138.47 137.39 147.67 111.28 96,885 83,512 100.16 128.7
Rata-rata RMSE 96,838 93,542 186.79 96,302 105.73 116.57 108.9 100.86 122.25 119.85 126.68 106.28 118.23 97,491 135.63 131.01 132.48 126.38 126.42 132.48 111.28 96,885 83,512 100.16 128.7
Std RMSE 2.71 1.75 42.4 2.51 4.96 8.80 5.17 11,037 21.67 4.91 13.31 11.20 12.58 8.40 9.18 4.21 11.34 10.50 9.82 11.34 0 0 0 0 0
15
Lampiran 2 Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Kedua 70% Learning, 30% Testing
PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Ratarata Waktu Testing 0.0157 0.0109 0.0094 0.0125 0.003 0.0095 0.0077 0.0095 0.0139 0.0031 0.0016 0.0079 0.0078 0.0048 0.0047 0.011 0.0031 0.0079 0.0047 0.0126 0.0109 0.0109 0.0093 0.022 0.0267
Proses Uji Min R2 0.011329 8.78E-04 0.0043347 0.0082455 0.014237 0.034574 0.055524 4.84E-01 4.84E-01 0.023543 0.080758 0.094739 0.037089 0.044406 0.022531 0.045499 0.053745 0.00014048 0.022953 0.034682 0.028313 0.090509 0.13404 0.087642 0.028932
Maks R2 0.028165 0.029066 0.020212 0.020317 0.041486 0.13488 0.096117 0.058482 0.058482 0.069425 0.15584 0.18374 0.082292 0.10544 0.028115 0.063773 0.083439 0.0027308 0.049985 0.085534 0.028313 0.090509 0.13404 0.087642 0.028932
Rata-rata R2 0.020007 0.0075235 0.011106 0.013624 0.019366 0.095062 0.084826 0.021369 0.021369 0.043719 0.10165 0.11554 0.04618 0.058649 0.033556 0.052714 0.064204 0.00084128 0.029277 0.046311 0.028313 0.090509 0.13404 0.087642 0.028932
Std R2 0.0058415 0.011787 0.0059687 0.0041508 0.0080252 0.0393 0.012315 0.0257 0.0257 0.015816 0.026877 0.028832 0.014858 0.018988 0.0040015 0.0067753 0.0096127 0.00085371 0.0075626 0.01499 0 0 2.93E-13 1.46E-13 0
Min RMSE 85.8 83,192 88,531 91,592 80,852 72.74 78,485 79.43 79.43 82,788 83,032 70,258 84,106 80,834 104.02 90,196 88,945 108.61 100.22 88,079 98,814 84.97 92,518 84,293 93,472
Maks RMSE 95,861 144.48 103.73 103.28 94,117 94,059 84.15 120.36 120.36 96,167 107.01 81,695 101.04 89,682 106.7 95,369 94,453 141.98 113.09 110.6 98,814 84.97 92,518 84,293 93,472
Ratarata RMSE 91,697 112.15 97,173 98,843 90.73 79,416 80,285 97,824 97,824 89,496 100.78 79.22 96,514 87,843 105.13 93,668 93,353 129.57 109.3 102.72 98,814 84.97 92,518 84,293 93,472
Std RMSE 2.61 22.85 4.61 3.60 3.96 8.35 2.04 16.16 16,158 4.75 8.21 3.55 5.80 2.67 0.92 2.09 1.61 12.27 3.60 6.52 0 0 0 0 0
16
Lampiran 3 Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Ketiga 90% Learning, 10% Testing
PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Ratarata Waktu Testing 0.0046 0.0079 0.0108 0.0031 0.0078 0 0.0047 0.014 0.0072 0.0064 0.0048 0.0063 0.0016 0.0063 0.0048 0.0078 0.0047 0.0063 0.0047 0.0047 0.0063 0.0093 0.0031 0.0094 0.0047
Proses Uji Min R2 0.038366 0.043076 0.0064668 0.12683 0.044397 0.099053 0.0106 0.26404 0.17276 0.092578 0.27726 0.20407 0.097218 0.081276 0.24744 0.013175 0.018056 0.0029235 0.0040314 0.0085886 0.23601 0.0067029 0.013774 0.061803 0.00081824
Maks R2 0.14049 0.10707 0.088889 0.14176 0.079964 0.15767 0.087297 0.32273 0.38776 0.22598 0.31055 0.30974 0.15469 0.22928 0.42052 0.020516 0.059051 0.03257 0.006954 0.024322 0.23601 0.0067029 0.024495 0.061803 0.00081824
Rata-rata R2 0.062346 0.058713 0.021168 0.13175 0.052842 0.11155 0.040046 0.28969 0.25346 0.1748 0.29189 0.24048 0.10811 0.1133 0.37357 0.015261 0.028618 0.014906 0.0049567 0.011013 0.23601 0.0067029 0.014846 0.061803 0.00081824
Std R2 0.028905 0.020286 0.026014 0.0043996 0.010317 0.017001 0.028808 0.022475 0.086387 0.055314 0.011657 0.030052 0.018339 0.046057 0.064785 0.0022935 0.013579 0.010846 0.00079759 0.0049108 2.93E-13 9.14E-15 0.0033903 0 2.29E-15
Min RMSE 79,861 81,114 84,798 79,166 84,569 76,846 83,902 66,211 63,439 72,611 66,359 66,221 78,989 73,182 59,508 103.87 92,569 113.04 107.49 98,466 84,844 107.14 118.76 105.41 109.15
Maks RMSE 91,968 88,722 170.74 80,622 90,211 82,177 99.05 70,691 77,542 84,788 68,961 74,214 87,657 93,307 70,339 107.69 102.83 145.17 110.38 113.3 84,844 107.14 130.5 105.41 109.15
Ratarata RMSE 87.74 86,869 136.72 80,145 88.79 80,986 91,572 68,179 72,039 76,893 67,903 71,517 85,567 88.87 63,271 106.57 99,831 127.85 109.56 110.75 84,844 107.14 129.32 105.41 109.15
Std RMSE 3.29 2.50 32.22 0.43 1.64 1.52 5.39 1.35 5.79 4.99 0.95 2.27 2.82 6.41 3.61 1.18 3.40 11.62 0.92 4.40 0 0 3.71 0 0
17
Lampiran 4 Hasil Testing dengan JST Propagasi Balik Standar Kelompok Percobaan Data Keempat 95% Learning, 5% Testing
PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Rata-rata Waktu Testing 0.0047 0.0032 0.0062 0.0031 0.0031 0.0094 0.0079 0.0094 0.0047 0.0079 0.0062 0.0064 0.0109 0.0079 0.0063 0.0062 0.0063 0.0079 0.0078 0.0063 0.0109 0.0061 0.0124 0.0062 0.0079
Min R2 0.10647 0.018172 0.087714 0.0036742 0.0002852 0.26052 0.23586 0.0014037 0.034712 0.11991 0.09823 0.023353 0.40625 0.039135 0.092117 0.00019906 0.014374 0.010953 0.17543 0.017705 0.020136 0.10714 0.23982 0.0018186 0.003677
Maks R2 0.11141 0.072485 0.13054 0.062535 0.088588 0.35736 0.28043 0.2297 0.12248 0.31981 0.37378 0.038172 0.48179 0.060866 0.21072 0.011442 0.067416 0.049565 0.39562 0.065334 0.040484 0.23293 0.27352 0.0028733 0.0059727
Rata-rata R2 0.10935 0.032916 0.11507 0.020446 0.015404 0.29197 0.25377 0.090672 0.053653 0.26237 0.20531 0.030183 0.45441 0.051905 0.11557 0.0015896 0.022892 0.027013 0.34458 0.043051 0.022171 0.11972 0.24319 0.001924 0.0039066
Proses Uji Std R2 0.0016853 0.018024 0.014542 0.016377 0.027189 0.036399 0.01625 0.080378 0.02608 0.070402 0.086969 0.0062146 0.020833 0.0083316 0.034499 0.0034876 0.016453 0.0098591 0.076017 0.013653 0.0064345 0.039778 0.010656 0.00033354 0.00072594
Min RMSE 97,923 102.08 96,018 103.85 101.32 78,603 83,161 104.65 96,167 79,539 80,266 109.72 73,951 104.23 88,011 120.6 102.51 109.24 82,723 110.89 110.11 88,316 96,031 142.56 148.13
Maks RMSE 98,423 116.34 101.12 117.49 135.35 83,603 85,877 127.72 108.98 96,435 106.98 114.22 76,969 110.02 99,599 141.84 113.93 133.85 98,525 133.86 118.62 104.22 100.64 146.46 154.05
Rata-rata RMSE 98,167 110.3 97.64 111.3 120.25 81.73 84,892 104.65 105.63 84,172 95,339 112.16 75,238 106.03 97,225 137.48 111.76 126.31 87.08 125 117.77 102.63 100.18 146.07 153.46
Std RMSE 0.16 4.79 1.66 3.52 10.77 1.86 0.91 11.90 3.80 5.95 8.54 1.81 1.24 1.93 3.38 6.73 3.60 6.89 5.04 5.96 2.69 5.03 1.46 1.23 1.87
18
Lampiran 5 Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Pertama 50% Learning, 50% Testing PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Rata-rata Waktu Testing 0.0077 0.0063 0.0078 0.0109 0.0141 0.0063 0.0076 0.0062 0.0124 0.0155 0.0108 0.0127 0.0047 0.0078 0.0062 0.0061 0.0109 0.0076 0.0077 0.0062 0.0062 0.0094 0.011 0.0093 0.0124
Min R2 0.22734 0.20945 0.19129 0.20348 0.24104 0.22428 0.19038 0.24447 0.21704 0.23974 0.38732 0.33999 0.30804 0.30209 0.31392 0.11976 0.15671 0.25167 0.17433 0.28295 0.040852 0.22013 0.2388 0.1645 0.16124
Maks R2 0.2328 0.20945 0.19772 0.20348 0.25599 0.22428 0.19038 0.24447 0.21704 0.2425 0.38732 0.33999 0.30804 0.30209 0.31392 0.11976 0.15671 0.26577 0.17474 0.28295 0.040852 0.22013 0.2397 0.1645 0.16124
Rata-rata R2 0.22844 0.20945 0.19708 0.20348 0.25001 0.22428 0.19038 0.24447 0.21704 0.24002 0.38732 0.33999 0.30804 0.30209 0.31392 0.11976 0.15671 0.26154 0.17437 0.28295 0.040852 0.22013 0.23889 0.1645 0.16124
Proses Uji Std R2 0.0023022 0 0.0020339 0 0.0077178 0 0 0 0 0.00087035 0 0 0 0 0 0 0 0.0068102 0.00012807 0 0 0 0.00028474 0 0
Min RMSE 66.48 179.67 118.12 66,634 179.07 64,065 205.05 105.34 92,299 101.25 189.08 122.63 148.94 115.59 279.34 74,634 136.58 59,427 70,757 110.6 91,772 139.68 71,768 75,864 108.32
Maks RMSE 128.16 179.67 127.79 66,634 201.97 64,065 205.05 105.34 92,299 141.57 189.08 122.63 148.94 115.59 279.34 74,634 136.58 71,647 75,142 110.6 91,772 139.68 80,784 75,864 108.32
Rata-rata RMSE 78,817 179.67 126.83 66,634 192.81 64,065 205.05 105.34 92,299 105.28 189.08 122.63 148.94 115.59 279.34 74,634 136.58 63,093 71,196 110.6 91,772 139.68 72,669 75,864 108.32
Std RMSE 26,008 0 3 0 11,827 0 0 0 0 12,749 0 0 0 0 0 0 0 5,903 1 0 0 0 3 0 0
19
Lampiran 6 Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Kedua 70% Learning, 30% Testing PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Rata-rata Waktu Testing 0.0108 0.0061 0.0032 0.0061 0.0047 0.0077 0.0031 0.0094 0.0031 0.0047 0.0016 0.0047 0.0047 0.0063 0.0143 0.0077 0.0047 0.0031 0.0093 0.0031 0.0015 0.0016 0.0063 0.0015 0.0094
Min R2 0.16819 0.18448 0.16397 0.22792 0.18334 0.2825 0.29835 0.17368 0.17368 0.22817 0.30686 0.25444 0.26968 0.29134 0.37744 0.35454 0.25907 0.13094 0.33123 0.29835 0.2543 0.29519 0.17112 0.3713 0.18459
Maks R2 0.16819 0.18448 0.16776 0.23033 0.18334 0.2825 0.29835 0.17368 0.17368 0.22817 0.30686 0.28276 0.27076 0.29134 0.37744 0.35454 0.25907 0.15731 0.33123 0.29835 0.2543 0.29519 0.17112 0.37746 0.18745
Rata-rata R2 0.16819 0.18448 0.16738 0.22985 0.18334 0.2825 0.29835 0.17368 0.17368 0.22817 0.30686 0.27627 0.27065 0.29134 0.37744 0.35454 0.25907 0.15467 0.33123 0.29835 0.2543 0.29519 0.17112 0.37684 0.18545
Proses Uji Std R2
0 0 0.0012005 0.001016 0 0 0 0 0 0 0 0.010802 0.00034093 0 0 0 0 0.0083378 0 0 0 0 0 0.0019477 0.0013782
Min RMSE 92,092 114.95 81,933 69,341 132.96 66,116 100.07 89,833 89,833 80,122 62,207 67,448 86,047 71.21 63,387 61,348 61,945 68,184 58,152 100.07 63,014 113.58 68,546 61,893 71,775
Maks RMSE 92,092 114.95 82,082 73,368 132.96 66,116 100.07 89,833 89,833 80,122 62,207 120.67 88,196 71.21 63,387 61,348 61,945 125.44 58,152 100.07 63,014 113.58 68,546 72,492 79,307
Rata-rata RMSE 92,092 114.95 82,067 72,562 132.96 66,116 100.07 89,833 89,833 80,122 62,207 90.13 86,262 71.21 63,387 61,348 61,945 73,909 58,152 100.07 63,014 113.58 68,546 62,953 74,035
Std RMSE 0 0 0.047185 2 0 0 0 0 0 0 0 15 0.67954 0 0 0 0 18,105 0 0 0 0 0 3 4
20
Lampiran 7 Hasil Testing dengan Optimasi GA Kelompok Percobaan Data Ketiga 90% Learning, 10% Testing PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Rata-rata Waktu Testing 0.0047 0.0123 0.0031 0.0032 0.011 0.0063 0.0111 0.0063 0.0093 0.0078 0.0031 0.0109 0.0079 0.0063 0.0063 0.0048 0.0094 0.0063 0.0062 0.0032 0.0078 0.0093 0.0063 0.0079 0.0048
Min R2 0.23277 0.22598 0.2264 0.2265 0.12857 0.1953 0.34174 0.26997 0.46123 0.41129 0.37781 0.34129 0.28957 0.46051 0.48264 0.22276 0.47867 0.39503 0.25346 0.43089 0.46632 0.36939 0.25343 0.42554 0.42757
Maks R2 0.23277 0.22598 0.2264 0.2265 0.19533 0.1953 0.34174 0.27025 0.46123 0.41129 0.40411 0.34129 0.28957 0.46051 0.48264 0.22276 0.51598 0.39503 0.25346 0.43089 0.46632 0.36939 0.25343 0.42554 0.42757
Rata-rata R2 0.23277 0.22598 0.2264 0.2265 0.14814 0.1953 0.34174 0.27016 0.46123 0.41129 0.3857 0.34129 0.28957 0.46051 0.48264 0.22276 0.4824 0.39503 0.25346 0.43089 0.46632 0.36939 0.25343 0.42554 0.42757
Proses Uji Std R2
0 0 0 0 0.03153 0 0 0.00013637 0 0 0.012705 0 0 0 0 0 0.011799 0 0 0 0 0 0 0 0
Min RMSE 75,261 77,352 75,654 127.44 98,583 90,844 98,205 69,528 61,433 95,869 103.42 92,363 72,147 129.51 133.7 128.1 99.69 65,565 181.44 167.38 78,811 77,267 125.87 123.06 79,243
Maks RMSE 75,261 77,352 75,654 127.44 141.46 90,844 98,205 69,548 61,433 95,869 124.48 92,363 72,147 129.51 133.7 128.1 132.86 65,565 181.44 167.38 78,811 77,267 125.87 123.06 79,243
Rata-rata RMSE 75,261 77,352 75,654 127.44 129.2 90,844 98,205 69,542 61,433 95,869 109.74 92,363 72,147 129.51 133.7 128.1 103.01 65,565 181.44 167.38 78,811 77,267 125.87 123.06 79,243
Std RMSE 0 0 0 0 19.81 0 0 0.0095559 0 0 10,175 0 0 0 0 0 10,491 0 0 0 0 0 0 0 0
21
Lampiran 8. Hasil Percobaan dengan Optimasi GA Kelompok Percobaan Data Keempat 95% Learning, 5% Testing PCA
80%(0,2)
90%(0,1)
95%(0,05)
99%(0,01)
99,8%(0,002)
Laju Pembelajaran 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5 0.01 0.05 0.1 0.2 0.5
Rata-rata Waktu Testing 0 0.0079 0.0015 0.0079 0.0109 0.0063 0.0062 0.0076 0.0094 0.0046 0.0031 0.0063 0.0047 0.0061 0.0107 0.0047 0.0031 0.0094 0.0047 0.0108 0.0079 0.0078 0.0093 0.0077 0.0047
Min R2 0.18524 0.166 0.17467 0.17844 0.26135 0.22428 0.57103 0.6504 0.36297 0.45231 0.59958 0.47061 0.77199 0.65082 0.56733 0.69358 0.6213 0.52291 0.79251 0.65264 0.6979 0.60933 0.8706 0.80446 0.68616
Maks R2 0.18524 0.17201 0.17467 0.17862 0.26135 0.22428 0.57103 0.6504 0.36297 0.66702 0.59958 0.47061 0.79764 0.65082 0.58772 0.69358 0.6213 0.52291 0.79286 0.65264 0.6979 0.60933 0.87717 0.80446 0.68616
Rata-rata R2 0.18524 0.16984 0.17467 0.17858 0.26135 0.22428 0.57103 0.6504 0.36297 0.62408 0.59958 0.47061 0.78995 0.65082 0.58567 0.69358 0.6213 0.52291 0.79282 0.65264 0.6979 0.60933 0.87652 0.80446 0.68616
Proses Uji Std R2
0 0.0027491 0 1 0 0 0 0 0 0.090528 0 0 0.012391 0 0.0064432 0 0 0 0.00011098 0 0 0 0.0020796 0 0
Min RMSE 90,051 133.84 94,042 97,358 186.5 64,065 108.63 108.8 153.25 102.82 91,374 180.44 92,302 197.45 241.43 88,015 159.15 121.33 88,961 80,528 127.33 123.26 71,577 162.68 84,902
Maks RMSE 90,051 175.79 94,042 98,459 186.5 64,065 108.63 108.8 153.25 117.09 91,374 180.44 137.8 197.45 277.27 88,015 159.15 121.33 95,656 80,528 127.33 123.26 78,472 162.68 84,902
Rata-rata RMSE 90,051 150.14 94,042 98.01 186.5 64,065 108.63 108.8 153.25 114.23 91,374 180.44 105.95 197.45 245.29 88,015 159.15 121.33 89,631 80,528 127.33 123.26 77,782 162.68 84,902
Std RMSE 0 17,948 0 0.2767 0 0 0 0 0 6 0 0 21,978 0 11,239 0 0 0 2 0 0 0 2 0 0
22
23
Lampiran 9 Pengaruh Laju Pembelajaran pada JST Standar terhadap Rata-Rata Nilai R2 Kelompok data dan PCA 50% training,PCA 80% 50% training,PCA 90% 50% training,PCA 95% 50% training,PCA 99% 50% training,PCA 99.8% 70% training,PCA 80% 70% training,PCA 90% 70% training,PCA 95% 70% training,PCA 99% 70% training,PCA 99.8% 90% training,PCA 80% 90% training,PCA 90% 90% training,PCA 95% 90% training,PCA 99% 90% training,PCA 99.8% 95% training,PCA 80% 95% training,PCA 90% 95% training,PCA 95% 95% training,PCA 99% 95% training,PCA 99.8% Lampiran 10
0.01 0.0129 0.015897 0.031391 0.016058 0.0019591 0.020007 0.095062 0.10165 0.052714 0.028313 0.062346 0.11155 0.29189 0.015261 0.23601 0.10935 0.29197 0.20531 0.0015896 0.022171
Laju Pembelajaran 0.05 0.1 0.2 0.016716 0.001606 0.01325 0.024131 0.043695 0.046508 0.053255 0.01286 0.079805 0.013431 0.03841 0.010093 0.059773 0.11099 0.016278 0.007524 0.011106 0.013624 0.084826 0.021369 0.021369 0.11554 0.04618 0.058649 0.064204 0.000841 0.029277 0.090509 0.13404 0.087642 0.058713 0.021168 0.13175 0.040046 0.28969 0.25346 0.24048 0.10811 0.1133 0.028618 0.014906 0.004957 0.006703 0.024495 0.061803 0.032916 0.11507 0.020446 0.25377 0.090672 0.053653 0.030183 0.45441 0.051905 0.022892 0.027013 0.34458 0.11972 0.24319 0.001924
0.5 0.00.6371 0.009789 0.010054 0.013431 0.008764 0.019366 0.043719 0.033556 0.046311 0.028932 0.052842 0.1748 0.37357 0.011013 0.000818 0.015404 0.26237 0.11557 0.043051 0.003907
Pengaruh Laju Pembelajaran pada JST Optimasi terhadap Rata-Rata Nilai R2
Kelompok data dan PCA 50% training,PCA 80% 50% training,PCA 90% 50% training,PCA 95% 50% training,PCA 99% 50% training,PCA 99.8% 70% training,PCA 80% 70% training,PCA 90% 70% training,PCA 95% 70% training,PCA 99% 70% training,PCA 99.8% 90% training,PCA 80% 90% training,PCA 90% 90% training,PCA 95% 90% training,PCA 99% 90% training,PCA 99.8% 95% training,PCA 80% 95% training,PCA 90% 95% training,PCA 95% 95% training,PCA 99% 95% training,PCA 99.8%
0.01 0.22844 0.22428 0.38732 0.11976 0.040852 0.16819 0.2825 0.30686 0.35454 0.2543 0.23277 0.1953 0.3857 0.22276 0.46632 0.18524 0.22428 0.59958 0.69358 0.6979
Laju Pembelajaran 0.05 0.1 0.2 0.20945 0.19708 0.20348 0.19038 0.24447 0.21704 0.33999 0.30804 0.30209 0.15671 0.26154 0.17437 0.22013 0.23889 0.1645 0.18448 0.16738 0.22985 0.29835 0.17368 0.17368 0.27627 0.27065 0.29134 0.25907 0.15467 0.33123 0.29519 0.17112 0.37684 0.22598 0.2264 0.2265 0.34174 0.27016 0.46123 0.34129 0.28957 0.46051 0.4824 0.39503 0.25346 0.36939 0.25343 0.42554 0.16984 0.17467 0.17858 0.57103 0.6504 0.36297 0.47061 0.78995 0.65082 0.6213 0.52291 0.79282 0.60933 .0.87652 0.80446
0.5 0.25001 0.24002 0.31392 0.28295 0.16124 0.18334 0.22817 0.37744 0.29835 0.18545 0.14814 0.41129 0.48264 0.43089 0.42757 0.26135 0.62408 0.58567 0.65264 0.68616