TEKNIK STATISTICAL DOWNSCALING DENGAN REGRESI KOMPONEN UTAMA DAN REGRESI KUADRAT TERKECIL PARSIAL UNTUK PREDIKSI CURAH HUJAN PADA KONDISI EL NINO, LA NINA, DAN NORMAL Woro Estiningtyas1, Aji Hamim Wigena 2 Balitklimat, Balitbang Pertanian, Jl. Tentara Pelajar No. 1A PO. BOX. 830 Cimanggu 2 Departemen Statistika, FMIPA-IPB, Jl. Meranti Darmaga Bogor 16680 E-mail:
[email protected]
1
ABSTRAK Makalah ini menyajikan hasil validasi model prediksi curah hujan di Kabupaten Indramayu dengan pendekatan statistika untuk downscaling, yaitu Regresi Komponen Utama dan Regresi Kuadrat Terkecil Parsial, pada kondisi El Nino, La Nina, dan Normal. Data curah hujan dari 6 stasiun hujan dan data presipitasi dari Global Circulation Model ECHAM3 digunakan dalam analisis ini dengan domain grid 8x8 (1.4° LU-18.1° LS; 98.4° -118.1° BT), di atas wilayah Indramayu. Data dibagi untuk setiap kondisi anomali iklim berdasarkan pada Oceanic Nino Index (ONI) yang menggunakan data suhu permukaan laut di Nino 3.4 dari hasil analisis NOAA. Ratarata nilai RMSEP dan korelasi pada kondisi El Nino adalah 95.22 dan 0.66 untuk PCR serta 102.52 dan 0.62 untuk PLS, pada kondisi La Nina adalah 85.14 dan 0.65 untuk PCR, serta 98.43 dan 0.69 untuk PLS, sedangkan pada kondisi Normal diperoleh nilai rata-rata 91.41 dan 0.57 untuk PCR, serta 85.37 dan 0.63 untuk PLS. Secara umum pada kondisi El Nino PCR menunjukkan performa yang lebih baik daripada PLS, sedangkan pada kondisi La Nina dan Normal, PLS lebih baik daripada PCR. Pemilihan model tergantung pada cakupan wilayah yang dikaji, apakah mewakili daerah di sekitar stasiun hujan atau mewakili suatu wilayah kabupaten. Kata Kunci: Curah Hujan, Statistical Downscalling, Regresi Komponen Utama, dan Partial Least Square Regression ABSTRACT This paper presents the results of validation of rainfall prediction models in Indramayu district using statistical approaches for downscaling, i.e. Principal Component Regression and Partial Least Square Regression, during El Nino, La Nina, and Normal conditions. Rainfall data from 6 stations and the precipitation data from Global Circulation Model ECHAM3 are used in this analysis with the domain size 8x8 (1.4 ° S-18.1° S; 98.4 ° -118.1° E), over the Indramayu region. Data are classified into each climatic anomaly condition based on the Oceanic Nino Index (ONI) which uses sea surface temperature data at the Nino 3.4 as the results of NOAA analysis. The average value of RMSEP and correlation in El Nino conditions are 95.22 and 0.66 for PCR and 102.52 and 0.62 for PLS,in La Nina conditions the values are 85.14 and 0.65 for the PCR, and 98.43 and 0.69 for the PLS, and in normal conditions the values are 91.41 and 0.57 for PCR, and 85.37 and 0.63 for PLS. In general PCR shows better performance than PLS in El Nino conditions, while in La Nina and Normal conditions the PLS performance is better than PCR. The selection model depends on the coverage areas studied, whether representing the area around the rainfall station or representing a district area. Keywords: Rainfall, Statistical Downscalling, Principal Component Regression and Partial Least Square Regression
Naskah masuk : 19 Februari 2011 Nasakah diterima : 2 Mei 2011 TEKNIK STATISTICAL DOWNSCALING DENGAN REGRESI.................................................................Woro Estiningtyas et al.
65
I. PENDAHULUAN Curah hujan merupakan salah satu unsur iklim yang sangat penting, namun keberadaannya secara spasial dan temporal masih sulit diprediksi. Selain sifatnya yang dinamis, proses fisis yang terlibat juga sangat kompleks. Ketidakpastian hujan ini semakin besar ketika terjadi anomali iklim berupa El Nino dan La Nina. Berbagai kejadian bencana di Indonesia menunjukkan bahwa sebagian besar bencana terkait dengan fenomena El Nino Southern Oscilatioan (ENSO). 1 ) Variabilitas iklim khususnya curah hujan sangat terkait dengan fenomena ini. Pada umumnya El Nino membawa dampak berupa berkurangnya curah hujan bahkan kekeringan, sedangkan La Nina membawa dampak berupa meningkatnya curah hujan yang bisa menyebabkan banjir. Penurunan curah hujan yang cukup besar pada musim kemarau termasuk akibat El Nino telah membawa dampak terhadap produksi tanaman pangan. Mundurnya awal musim hujan selama 30 hari pada tahun El Nino telah menurunkan produksi beras pada musim hujan (Januari-April) sekitar 6,5% di Jawa Barat dan Jawa Tengah, dan 11,0% di Jawa Timur dan Bali.2) Menurut Las3) anomali iklim dan curah hujan berkorelasi di sebagian besar wilayah di mana lebih dari 67% diantaranya merupakan sentra produksi padi. Berdasarkan data historis tentang dampak El Nino terhadap produksi beras nasional mengindikasikan bahwa produksi beras nasional sangat rentan terhadap kejadian iklim ekstrim. Kekeringan periode 1980-1990 telah menyebabkan kehilangan produksi beras tiga kali lipat dibandingkan pada periode 1991-2000, yaitu penurunan produksi dari 100 ribu ton per tahun per kabupaten menjadi 300 ribu ton per tahun per kabupaten.4) Kebutuhan terhadap informasi prakiraan hujan sudah sangat mendesak. Keadaan inilah yang mendorong semakin berkembangnya berbagai model pendekatan untuk prakiraan curah hujan. Salah satu pendekatan untuk prediksi curah hujan adalah pemanfaatan data Global Circulation Model (GCM). Dalam kajian klimatologi jangka panjang GCM merupakan suatu model yang berorientasi spasial dan temporal, alat prediksi utama iklim secara numerik, serta sebagai sumber informasi primer untuk menilai pengaruh perubahan iklim. Namun informasi GCM masih berskala global dan tidak untuk fenomena skala lebih kecil (lokal),
sehingga sulit untuk memperoleh langsung informasi berskala lokal dari GCM. Resolusi GCM terlalu rendah untuk memprediksi iklim lokal yang dipengaruhi oleh topografi dan tataguna lahan, tetapi GCM masih mungkin digunakan untuk memperoleh informasi skala lokal bila teknik downscaling digunakan.5) Teknik downscaling adalah suatu proses transformasi data dari unit skala besar menjadi data pada unit skala yang lebih kecil. Menurut Wilby & Wigley 6) , downscaling adalah suatu cara menginterpolasi peubah-peubah prediktor atmosfir berskala besar terhadap peubah-peubah berskala lebih kecil. Salah satu jenis teknik ini adalah statistical downscaling yang menggunakan model statistik untuk menggambarkan hubungan antara data pada unit-unit berskala besar dengan data pada unit berskala lebih kecil dalam periode waktu tertentu. Metode yang umum digunakan untuk statistical downscaling adalah regresi komponen utama (Principal Component Regression, PCR) yang berdasarkan analisis komponen utama (Principal Component Analysis, PCA). Metode lain yang serupa dengan PCR, yaitu regresi kuadrat terkecil parsial (Partial Least Square Regression, PLSR), juga dapat digunakan sebagai teknik statistical downscaling.7) Makalah ini membahas penggunaan PCR dan PLSR dalam statistical downscaling serta membandingkan kedua model tersebut untuk prakiraan curah hujan bulanan pada tiga kondisi yaitu El Nino, La Nina, dan Normal. II. METODE PENELITIAN Data yang digunakan dalam kajian ini adalah data presipitasi bulanan skala global tahun 19762001 (output dari GCM ECHAM3) dan data curah hujan bulanan kabupaten Indramayu periode 19762001 yang terdiri dari 6 stasiun hujan, yaitu : Sukadana, Bondan, Jatibarang, Kedokan Bunder, Tugu dan Ujung Garis. Secara geografis kabupaten Indramayu terletak pada 6.3° -6.5° LS dan 107.8° 108.4° BT. Data curah hujan dipilah berdasarkan tiga kondisi El Nino, La Nina, dan Normal. Penentuan ketiga kondisi tersebut didasarkan pada Oceanic Nino Index (ONI) dari data suhu permukaan laut di Nino 3.4.8) Data tahun 19762000 digunakan untuk pemodelan dan data tahun 2001 untuk validasi model. Ukuran domain untuk downscaling adalah sejumlah grid GCM berukuran 8×8 pada 1.4° LU-
JURNAL METEOROLOGI DAN GEOFISIKA VOLUME 12 NOMOR 1 TAHUN 2011: 65 - 72
66
18.1° LS dan 98.4° -118.1° BT, yaitu di atas wilayah Indramayu. Pemilihan ini didasarkan pada hasil penelitian Wigena9) yang menyebutkan bahwa penggunaan domain 8x8 dan berada di atas Indramayu memberikan hasil yang lebih stabil atau konsisten dan tidak terlalu sensitif terhadap data pencilan. Analisis data dilakukan dengan PCR dan PLSR. Keduanya berbeda dalam proses pereduksian dimensi. Dalam PCR pereduksian dimensi dilakukan lebih dulu dengan PCA terhadap data presipitasi tahun 1976-2001. PCR akan menggunakan sejumlah komponen (hasil PCA) sebagai prediktor dan data curah hujan stasiun sebagai prediktan. Dalam PLSR pereduksian melibatkan data presipitasi dan data curah hujan secara bersama sehingga diperoleh penduga model. Kedua metode dibandingkan berdasarkan nilai RMSEP (Root Mean Square Error of Prediction) dan korelasi antara nilai dugaan dengan data aktual tahun 2001. Nilai RMSEP adalah:
dimana: yi = data aktual, yˆ i = nilai dugaan, np = banyaknya data untuk validasi model. Performa
model yang baik ditunjukkan dengan nilai RMSEP yang lebih kecil dan nilai korelasi yang lebih tinggi. III. HASIL DAN PEMBAHASAN 3.1. Kondisi El Nino Hasil validasi model pada kondisi El Nino dengan metode PCR memperlihatkan nilai RMSEP antara 60-140 dengan korelasi berkisar antara 0.41 hingga 0.78. Dari 6 stasiun yang divalidasi, di stasiun Sukadana dan Jatibarang PCR menunjukkan performa yang lebih baik dibandingkan dengan di 4 stasiun lainnya. Untuk model PLS, nilai RMSEP berkisar antara 68-158 dengan korelasi 0.34 sampai dengan 0.76 (Tabel 1). PLS di stasiun Sukadana memperlihatkan performa yang lebih baik dibandingkan di stasiun lainnya. Apabila dibandingkan antara kedua model ini untuk keenam stasiun hujan di Kabupaten Indramayu, maka PCR memperlihatkan performa yang sedikit lebih baik dibandingkan PLS. Ratarata RMSEP dan korelasi dengan PCR masingmasing adalah 95.2 dan 0.66, sedangkan dengan PLS rata-rata RMSEP dan rata-rata korelasi adalah sebesar 102.5 dan 0.62. Performa kedua model dapat dilihat pada grafik keeratan pola antara curah hujan aktual dengan hasil prakiraan model (Gambar 1).
Tabel 1. Hasil validasi model prakiraan hujan pada kondisi El Nino
TEKNIK STATISTICAL DOWNSCALING DENGAN REGRESI.................................................................Woro Estiningtyas et al.
67
Gambar 1. Grafik hasil validasi model prediksi hujan di 6 stasiun pada kondisi El Nino
3.2. Kondisi La Nina Validasi model prediksi hujan pada kondisi La Nina memperlihatkan hasil yang cukup beragam. Stasiun Ujung Garis yang pada kondisi El Nino performanya kurang baik, pada kondisi La Nina ini menunjukkan hasil yang sangat baik. Hal ini tercermin juga dalam grafik hasil validasi, dimana pola yang terbentuk sangat mirip dan mendekati nilai aktualnya (Gambar 2). Dengan PCR, nilai RMSEP berkisar antara 73.33-111.49
dengan nilai korelasi 0.52-0.94 sedangkan dengan PLS nilai RMSEP antara 56.39-140.46 dan korelasi antara 0.45-0.89 (Tabel 2). Apabila ditinjau dari rata-ratanya, maka PCR menghasilkan nilai RMSEP sebesar 85.14 dan korelasi 0.65, sedangkan PLS menghasilkan RMSEP 98.43 dan korelasi 0.69. Secara umum berdasarkan rata-ratanya, pada kondisi La Nina ini, PLS memperlihatkan performa yang lebih baik daripada PCR.
JURNAL METEOROLOGI DAN GEOFISIKA VOLUME 12 NOMOR 1 TAHUN 2011: 65 - 72
68
Tabel 2. Hasil validasi model prakiraan hujan pada kondisi La Nina
Gambar 2. Grafik hasil validasi model prediksi hujan di 6 stasiun pada kondisi La Nina
3.3. Kondisi Normal Pada kondisi normal, validasi dengan PCR menghasilkan kisaran nilai RMSEP 64.39-125.51 dan korelasi antara 0.31-0.76. Sedangkan dengan PLS menghasilkan nilai RMSEP berkisar antara 65.38-103.54 dan nilai korelasi 0.32-0.80 (Tabel 3).
Berdasarkan nilai RMSEP dan korelasi, PCR menunjukkan performa yang baik di stasiun Jatibarang dan sedangkan PLS di stasiun Ujung Garis. Hal ini ditunjukkan pula pada grafik pola curah hujan antara data aktual dengan hasil prediksi (Gambar 3). Grafik untuk stasiun Jatibarang dan
TEKNIK STATISTICAL DOWNSCALING DENGAN REGRESI.................................................................Woro Estiningtyas et al.
69
Ujung Garis memperlihatkan pola dengan nilai curah hujan yang hampir mendekati. Rata-rata nilai RMSEP dan korelasi untuk kedua model berturutturut adalah 91.4 dan 0.57 untuk PCR dan 85.4 dan 0.63 untuk PLS. Secara umum setiap model menunjukkan performa yang berbeda pada masingmasing kondisi (El Nino, La Nina dan Normal). Kondisi anomali iklim menyebabkan pola curah hujan yang terbentuk berbeda-beda untuk setiap tempat dan hal ini akan mempengaruhi hasil prediksi yang dibentuk oleh model-model berbasis statistika yang murni mengandalkan pola data secara deret waktu. Sebagai contoh di stasiun Sukadana, pada kondisi La Nina, hasil validasinya memperlihatkan performa model yang cukup baik, tetapi pada kondisi La Nina dan Normal performa yang dihasilkan kurang baik. Artinya apabila model ini diaplikasikan untuk prediksi hujan di daerah Sukadana dan sekitarnya untuk kondisi El Nino, maka hasilnya akan lebih baik dibandingkan untuk memprediksi hujan pada kondisi La Nina dan Normal. Pada stasiun Ujung Garis diperoleh contoh kasus yang berbeda lagi. Hasil validasi di stasiun Ujung Garis menunjukkan performa yang sangat baik pada kondisi La Nina dan Normal, tetapi kurang baik pada kondisi El Nino. Artinya model ini cukup baik apabila digunakan untuk memprediksi curah hujan pada kondisi La Nina dan Normal dibandingkan pada kondisi El Nino. Kemungkinan diperolehnya akurasi hasil prakiraan curah hujan yang lebih tinggi pada kondisi La Nina
dan Normal akan lebih besar dibandingkan pada kondisi El Nino. Performa model perlu dilihat stasiun per stasiun tergantung pada tinjauan kasus yang dianalisis. Apabila untuk mewakili daerah yang cukup kecil, maka lebih baik digunakan model hasil validasi dari stasiun di lokasi yang bersangkutan atau yang masih termasuk dalam area studi. Tetapi apabila cakupan wilayahnya cukup luas, maka dari awal analisis, data curah hujan sudah harus bisa mewakili luasaan tersebut bukan per stasiun lagi. Cara yang bisa dilakukan yaitu dengan membuat pengelompokkan hujan atau dengan poligon tiessen. Curah hujan yang termasuk dalam satu kelompok atau satu poligon memiliki pola dan karakteristik yang sama sehingga bisa mewakili wilayah yang bersangkutan. Menurut Busuioc10), hasil dari model statistical downscaling terkait langsung dengan statistik iklim pada waktu sebelumnya dan dapat memberikan hasil ramalan deret waktu yang panjang untuk studi dampak iklim. Model ini juga memerlukan data deret waktu yang homogen dalam berbagai perubahan iklim. Model statistical downscaling juga akan memberikan hasil yang baik jika ketiga syarat berikut terpenuhi, yaitu (1) Hubungan erat antara respon dengan prediktor yang menjelaskan keragaman iklim lokal dengan baik; (2) Peubah prediktor disimulasi baik oleh GCM, dan (3) Hubungan antara respon dengan prediktor tidak berubah dengan perubahan waktu dan tetap sama meskipun ada perubahan iklim.
Tabel 3. Hasil validasi model prakiraan hujan pada kondisi Normal
JURNAL METEOROLOGI DAN GEOFISIKA VOLUME 12 NOMOR 1 TAHUN 2011: 65 - 72
70
Gambar 3. Grafik hasil validasi model prediksi hujan di 6 stasiun pada kondisi Normal
Untuk implementasi model ini, maka diperlukan informasi tentang prakiraan kondisi anomali iklim beberapa waktu kedepan (minimal 1 musim ke depan). Informasi ini dapat diperoleh dengan cara mengakses hasil prakiraan ENSO yang dikeluarkan oleh lembaga internasional seperti International Research Institute for Climate and Society (IRI) dan NOAA melalui internet. Prakiraan ini didasarkan pada data suhu permukaan laut yang dianalisis sedemikian rupa sehingga diperoleh indeks yang menunjukkan apakah El Nino, La Nina, atau Normal. Dari sini akan diperoleh hasil prakiraan beberapa waktu ke depan terkait dengan lokasi studi yang akan dipilih. Apabila diperoleh bahwa beberapa waktu ke depan ada indikasi El Nino, maka untuk prakiraan curah hujan digunakan model yang didesain untuk kondisi El Nino. Apabila diperoleh informasi bahwa beberapa waktu ke depan ada indikasi La
Nina, maka dipilih model yang disusun untuk kondisi La Nina, dan seterusnya. Jadi penggunaan model disesuaikan dengan hasil prakiraan kondisi anomali iklim apakah El Nino, La Nina, atau Normal. Dengan demikian ketepatan penggunaan model prediksi curah hujan diharapkan dapat meningkatkan akurasi hasilnya. V. KESIMPULAN 1. Hasil validasi model prediksi dengan metode PCR dan PLS di Kabupaten Indramayu menghasilkan performa model yang berbeda untuk setiap stasiun hujan pada kondisi El Nino, La Nina, dan Normal. 2. Rata-rata nilai RMSEP dan korelasi pada kondisi El Nino adalah 95.22 dan 0.66 untuk model PCR serta 102.52 dan 0.62 untuk model PLS. Pada kondisi La Nina adalah 85.14 dan 0.65 untuk model PCR serta 98.43 dan 0.69
TEKNIK STATISTICAL DOWNSCALING DENGAN REGRESI.................................................................Woro Estiningtyas et al.
71
untuk model PLS. Sedangkan untuk kondisi normal diperoleh nilai rata-rata 91.41 dan 0.57 untuk model PCR serta 85.37 dan 0.63 untuk model PLS. 3. Untuk kabupaten Indramayu, secara umum model PCR menunjukkan performa yang lebih baik pada kondisi El Nino, sedangkan untuk kondisi La Nina dan Normal model PLS memperlihatkan performa model yang lebih baik daripada PCR. 4. Pemilihan model sangat ditentukan oleh cakupan wilayah yang dikaji. Apabila untuk mewakili daerah yang cukup kecil, maka lebih baik digunakan model hasil validasi dari stasiun di lokasi yang bersangkutan atau yang masih termasuk dalam area studi. Tetapi apabila cakupan wilayahnya cukup luas, maka digunakan data curah hujan yang mewakili wilayah yang bersangkutan. VI. DAFTAR PUSTAKA Boer, R, Sutardi and D. Hilman (Coordinating Lead Authors). (2007). Climate Variability and Climate Changes, and Their Implication in Indonesia. Country Report. Government of Republic of Indonesia. Jakarta. 2) Naylor, R.L, D. S. Battisti, D.J. Vimont, W.P. Falcon, & Marshall B. (2007). Assessing risk of climate variability and climate change for Indonesian rice agriculture. Proceeding of the National Academy of Sciences of the United States of America. 3) Las, I., (2006, Juli). Strategi dan Teknologi Antisipasi dan Penanggulangan Bencana Iklim (kejadian iklim ekstrim). Bahan Training Workshop Metodologi Penelitian Dalam Bidang Pengelolaan Resiko Iklim Untuk Sektor Pertanian, Bogor. 1)
4)
Boer, R dan I. Las. (2003). Sistem Produksi Padi Nasional Dalam Perspektif Kebijakan Iklim Global. Dalam B. Suprihatno, A.K. Makarim et al (eds). Kebijakan Perberasan dan Inovasi Teknologi Padi. Pusat Penelitian dan Pengembangan Tanaman Pangan, dan Litbang Pertanian, Yakarta. P:215-234. 5) Fernandez, E. (2005). On the influence of predictors area in statistical downscaling of daily parameters. Report no.09/2005. Norwegian Meteorological Institute, Oslo. 6) Wilby, R.L, T.M.L Wigley. (1997). Downscaling general circulation model output: A review of methods and limitations. Progress in Physical Geography, 21(4), 530-548. 7) Wigena, A.H. (2009, Oktober). Penggunaan regresi kuadrat terkecil parsial dalam statistical downscaling. Prosiding Seminar Nasional Sains II. Bogor. 8) NOAA. (2008). ENSO Cycle: Recent Evolution, Current Status and Predictions. Update prepared by Climate Prediction Center / NCEP 18 August 2008. 9) Wigena, A.H. (2006). Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit Untuk Peramalan Curah Hujan Bulanan. Kasus Curah Hujan Bulanan di Indramayu. Disertasi. Sekolah Pascasarjana: Institut Pertanian Bogor. 10) Busuioc A, Chen D, Hellstrom C. (2001). Performance of statistical downscaling models in GCM validation and regional climate change estimates: Application for Swedish precipitation. Int. J. of Climatol, 21, 557-578.
JURNAL METEOROLOGI DAN GEOFISIKA VOLUME 12 NOMOR 1 TAHUN 2011: 65 - 72
72