17
BAB III DATA DAN METODOLOGI
3.1 Data Pada penelitian ini, ada dua jenis data yang akan digunakan. Jenis data pertama adalah data curah hujan bulanan dan yang kedua adalah data luaran GCM. 3.1.1 Data Luaran GCM (Peubah Penjelas) Data GCM yang digunakan dalam penelitian ini terdiri dari 6 luaran:
Pacific_20c3m_cgcm3.1_t47 (t-47) Peubah luaran: presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).
Pacific_20c3m_cgcm3.1_t63 (t-63) Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).
Pacific_20c3m_giss_model_er (giss-er) Peubah luaran presipitasi, subset: koordinat 18 titik bujur x 16 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).
Pacific_20c3m_gissaom (giss-aom) Peubah luaran presipitasi, subset: koordinat 23 titik bujur x 20 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).
Pacific_20c3m_miub_echo_g (miub-g) Peubah luaran presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).
Pacific_20c3m_mri_cgcm2_3_2a(mri-32a) Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000). Data luaran GCM memiliki peubah luaran salah satu contohnya adalah
presipitasi yang merupakan nilai-nilai hasil pengambaran matematis dari sejumlah besar interaksi fisika, kimia, dan dinamika atmosfer bumi. Nilai-nilai tersebut perlu dikalibrasi untuk menduga dan mengestimasi peubah-peubah iklim dan
18
cuaca seperti curah hujan, suhu, kelembapan, penutupan awan, radiasi, dan lainlain. Contoh dari luaran GCM dapat dilihat pada Gambar 9
Gambar 9 Contoh Data Luaran GCM.
3.1.2 Data Curah Hujan (Peubah Respon) Data Curah hujan yang digunakan untuk penelitian ini adalah dari data titik-titik observasi di kota Indramayu dari Januari 1979 sampai Desember 2000 Contoh data dapat dilihat pada Tabel 2. Tabel 2 Data Observasi curah hujan di Kota Indramayu NamaSta Cidempet Cikedung Indramayu Jatibarang Sudikampiran Kedokan bunder Jan-89 125 167 150 202 112 109 Feb-89 491 430 556 480 389 345 Mar-89 337 304 357 191 278 273 Apr-89 92 348 40 99 156 40 May-89 159 215 128 89 153 105 Jun-89 117 173 139 86 122 232
Terdapat 13 titik observasi curah hujan yang diamati tersebar di Kabupaten Indramayu, dengan lokasinya sebagian berada dekat dengan garis pantai/ laut dan sebagian lagi jauh dari laut. Secara umum lokasi yang menjadi titik observasi curah hujan memiliki topografi berupa dataran atau daerah landai dengan kemiringan tanahnya rata-rata 0 – 2 %. Bila curah hujan cukup tinggi, maka di daerah-daerah tertentu yang tidak mempunyai drainase yang baik akan menyebabkan terjadinya genangan air.
19
3.2 Tahapan Penelitian Tahapan penelitian ini terangkum secara lengkap pada gambar Gambar 10.
Gambar 10 Tahapan proses penelitian
20
Tahap awal yang dilakukan pada penelitian ini adalah dimulai dari pemahaman terhadap permasalahan yang akan diselesaikan. Mengacu pada tujuan, penelitian ini mencoba untuk mengembangkan model SVR yang dapat memprediksi curah hujan bulanan di wilayah Kabupaten Indramayu. Untuk mendapatkan gambaran menyeluruh tentang domain penelitian yang akan dilaksanakan, diperlukan studi literatur sehingga dapat mengukur dan melihat seberapa berbeda dan pentingnya penelitian yang akan dilakukan. Setelah memahami masalah, maka tahap yang dilakukan selanjutnya adalah
pengumpulan data. Secara keseluruhan data observasi terdiri dari 22
periode (tahun 1979 – 2000). Dengan demikian data GCM yang digunakan hanya dari tahun 1979 – 2000. Berdasarkan titik observasi hujan dilihat koordinatnya, kemudian berdasarkan titik koordinat tersebut akan digunakan untuk menentukan grid dari data luaran GCM dengan luasan grid berupa matriks 5x5. Titik koordinat observasi berada ditengah-tengah luasan grid GCM yang akan diambil. Sebagai contoh, stasiun hujan memiliki titik koordinat 112 bujur timur dan 6 derajat lintang selatan. Luasan grid yang di-cropp pada gcm merupakan grid matriks 5x5 dengan pusatnya merupakan lokasi stasiun hujan. Ilustrasi proses pengambilan data GCM dengan grid 5x5 dapat dilihat pada Gambar 11.
Gambar 11 Ilustrasi proses cropping luasan grid data GCM.
21
Dikarenakan data observasi memiliki periode 22 tahun, maka proses cropping yang dilakukan mengikuti observasi sebanyak 12x22 tahun. Luasan grid yang diperoleh dari prosis cropping keseluruhan luaran GCM adalah sebanyak 264 dari bulan Januari 1979 sampai dengan Desember 2000, sehingga jumlah keseluruhan untuk data masukan menjadi 264 (22x12) data dengan atribut sebanyak 25 (5x5) buah. Kemudian diperoleh matriks baru berdasarkan titik observasi dan luasan grid GCM seperti yang diperlihatkan oleh Tabel 3, dengan nilai adalah jumlah cropping luasan GCM dan
menunjukkan grids matriks.
Tabel 3 Matriks data GCM mengikuti data observasi Stasiun Observasi
Data GCM …
…
…
…
…
…
…
…
…
×
…
×
…
×
… ..
… ×
Kemudian, untuk mengurangi masalah ukuran pada data luaran GCM yang berdimensi besar, maka dilakukan reduksi dimensi spasial dari matriks data GCM dengan menggunakan PCA. Ilustrasi pereduksian dimensi dari data matriks GCM terlihat pada Tabel 4. Tabel 4 PCA Matriks data GCM Stasiun Observasi
PCA Data GCM … … …
…
…
…
…
…
… …
…
22
Proses analisis komponen utama/PCA adalah suatu analisis peubah ganda yang bertujuan untuk mereduksi dimensi data tanpa harus kehilangan informasi secara berarti. Pada penelitian ini proses reduksi dilakukan dengan mengambil lebih dari satu komponen utama (principal component), dengan keragaman ≥ 97%. Proses reduksi menghasilkan atribut kolom data matriks baru yang berasal dari komponen utama PCA sebesar m, dengan kearagaman/principle component score lebih besar dari 97%. Dapat dikatakan bahwa hasil reduksi dimensi menggunakan
PCA
menghasilkan
variabel
baru
sebanyak
m
yang
merepresentasikan informasi dengan tingkat kepercayaan sebesar 97% dari data matriks sebelumnya dengan atribut kolom berupa vektor berukuran nxn, dimana m jauh lebih kecil dari pada nxn (m<
23
Setelah dilakukan pembagian data maka penyusunan model SVR dapat dilakukan. Ilustrasi arsitektur dari model SVR, diperlihatkan pada Gambar 12.
Gambar 12 Struktur SVR. Pada tahap pelatihan data yang digunakan adalah data latih sebagai masukan untuk pelatihan menggunakan metode SVR dengan masing-masing fungsi kernel-nya adalah linear kernel, polynomial kernel, dan radial basis function (RBF) kernel menghasilkan keluaran berupa model SVR. Dari fungsi kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter C untuk fungsi linear kernel, nilai parameter C, γ, r, dan d untuk fungsi polynomial kernel, dan parameter C dan γ untuk fungsi RBF kernel. Penentuan parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, maka semakin baik model yang dihasilkan. Dalam penelitian ini untuk mendapatkan parameter fungsi kernel yang optimum dilakukan dengan menggunakan metode grid search didapatkan model SVR dengan parameter yang optimal. Pada tahap pengujian, data uji digunakan sebagai masukan bagi model SVR untuk mendapatkan keluaran/ouput berupa nilai estimasi atau nilai prediksi. Proses pelatihan dan pengujian dilakukan untuk setiap data GCM (DJF, MAM,
24
JJA, SON) dan berlangsung selama 5-fold cross validation sehingga menghasilkan nilai estimasi untuk keseluruhan data dengan rentang tahun periode 1979-200. Selanjutnya dilakukan proses evaluasi dan divalidasi dengan cara membandingkan nilai estimasi yang diperoleh dengan nilai dari pengamatan sesungguhnya untuk menguji kehandalan model dalam melakukan pendugaan curah hujan bulanan di wilayah Kabupaten Indramayu. Tahap terakhir dari penelitian yaitu melakukan dokumentasi dan pelaporan akhir hasil evaluasi yang menandakan penelitian yang dilakukan telah selesai. 3.3 Lingkup Pengembangan Model Spesifikasi perangkat keras dan perangkat lunak komputer yang digunakan dalam penelitian ini sebagai berikut :
Perangkat keras: processor Intel Core 2 duo 3.20 GHz, memori 2 GB, dan harddisk 250 GB.
Perangkat lunak: Windows 7 Ultimate, Matlab 7.7.1, Visual Studio 2008, Notepad++, Microsoft Excel 2007, library svm (LIBSVM 3.0).