REGRESI KUADRAT TERKECIL PARSIAL UNTUK STATISTICAL DOWNSCALING
Aji Hamim Wigena Departemen Statistika, FMIPA Institut Pertanian Bogor
Jakarta, 23 Juni 2011
Pendahuluan GCM (General Circulation Model) •
model yang berorientasi spasial dan temporal
•
skala besar (global) atau resolusi rendah
•
belum memperhitungkan fenomena pada skala kecil (lokal)
•
sumber informasi primer untuk menilai pengaruh perubahan iklim di masa datang
•
diyakini sebagai model penting dalam upaya memahami iklim di masa lampau, sekarang dan masa yang akan datang
Luaran GCM Data luaran GCM bersifat curse of dimensionality ↔ dimensi atau domain semakin besar, yaitu jika pemodelan SD melibatkan banyak peubah dan lapisan‐lapisan atmosfir ► Data bersifat nonlinear dan tidak berdistribusi yang baku, seperti sebaran normal ► Korelasi spasial dan/atau multikolinearitas antar peubah ► Data luaran GCM untuk banyak peubah pada berbagai lapisan atmosfir atau ketinggian ↔ data semakin kompleks ►
DOWNSCALING •
transformasi hasil simulasi GCM pada skala besar ke skala yang lebih kecil
•
hubungan fungsional antara peubah (variable) skala besar dengan peubah skala kecil
•
menduga (meramal) nilai peubah dalam interval waktu tertentu berdasarkan karakteristik sirkulasi atmosfir skala besar
STATISTICAL DOWNSCALING • Definisi – Model Statistical Downscaling adalah suatu fungsi transfer yang menggambarkan hubungan fungsional sirkulasi atmosfir global (hasil GCM) dengan unsur-unsur iklim lokal – Pemilihan peubah-peubah prediktor dan penentuan domain (lokasi dan jumlah grid) merupakan faktor kritis yang akan mempengaruhi kestabilan peramalan (Wilby & Wigley 2000) – Model ini juga memerlukan data deret waktu yang homogen dalam berbagai perubahan iklim (Schubert & Henderson-Sellers 1997) – Model SD memberikan hasil yang baik dengan syarat berikut: • Hubungan erat antara respon dengan prediktor yang menjelaskan keragaman iklim lokal dengan baik; • Peubah prediktor disimulasi baik oleh GCM, dan • Hubungan antara respon dengan prediktor tidak berubah dengan perubahan waktu dan tetap sama meskipun ada perubahan iklim (Busuioc et al. 2001)
• Bentuk umum model SD
y = f(X) dimana: Y(b x s) curah X(b x g) GCM) b g s
= peubah skala lokal atau respon (seperti hujan bulanan) = peubah skala global atau prediktor (output = banyaknya waktu (seperti bulanan) = banyaknya grid skala global GCM = banyaknya stasiun curah hujan
►Bentuk
umum model SD
Bila fungsi f(X) diketahui, pendugaannya dapat dilakukan dengan model parametrik; bila f(X) tidak diketahui, pendugaannya dengan model nonparametrik
Tetapi pada kenyataannya bentuk fungsi ini sering tidak diketahui dan model yang tidak tepat akan memberikan hasil dugaan yang tidak tepat pula (Friedman & Stuetzle 1981)
Model SD melibatkan data deret waktu dan data spasial GCM
Banyaknya peubah y, peubah x, dan lapisan atmosfir dalam model, dan otokorelasi dan kolinearitas pada peubah y maupun pada peubah x menunjukkan tingkat kompleksitas model
• Isu-Isu Pemodelan (Wilby, 1997) – Peubah-peubah predictor Æ dari GCM (Sea Surface Temperature), Sea Level Pressure, Geopotential height, Humidity.Wind speed, Precipitable water, Presipitasi) – Ukuran (luasan) dan lokasi domain GCM – Fungsi Transfer Æ Model Hubungan Fungsional – Periode Kalibrasi Æ Data Historis
Metode SD Regresi Komponen Utama (Principal Component Regression, PCR) • berdasarkan analisis komponen utama untuk mereduksi dimensi dan mengatasi masalah multikolinieritas • digunakan untuk pendugaan satu respon (pendugaan curah hujan di suatu stasiun atau curah hujan rata-rata dari sejumlah stasiun di suatu wilayah)
Regresi Kuadrat Terkecil Parsial (Partial Least Square Regression, PLSR) • mereduksi dimensi dan mengatasi masalah multikolinearitas secara iteratif • dapat digunakan untuk pendugaan satu respon dan multi respon (lebih dari satu stasiun) • pendugaan multi respon mempertimbangkan adanya hubungan antar respon (hubunga spasial antar stasiun)
Data •Prediktor Æ presipitasi (GCM ECHAM) tahun 1966 – 2001 •Respon (prediktan) Æ curah hujan di stasiun (Sukadana, Bondan, Jatibarang, Kedokan Bunder, Tugu, Ujung Garis) kabupaten Indramayu tahun 1966 – 2001 •Domain berukuran 8×8 di atas sekitar wilayah Indramayu
Domain GCM
Indramayu
Segi8 Segi10
Segi12 Segi14
Segi16
Curah hujan aktual dan prediksi (dengan PCR dan PLSR) Jan Actual
241
Feb
Mar
Apr
May
Jun
Jul
Aug
Sep 17
Oct
248
306
238
144
105
0
0
147
PCR
245.2 180.3
147.9
67.2
11.3
11.5
9.4
37.8
53.0 32.0
PLSR
245.7
251.1 220.3
140.7
82.6
51.5
29.3
11.4
43.9
67.3
Nov 360
Dec 207
79.2 128.0 162.1
241.6
RMSEP
R
-
125 0.60 77
0.81
Nilai korelasi (r) dan RMSEP dari model PLSR Stasiun Sukadana
PLSR (satu respon) r RMSEP 0.78 84.04
PLSR (multi respon) r RMSEP 0.70 102.80
Bondan
0.61
77.69
0.64
76.50
Jatibarang
0.74
71.55
0.70
81.01
Kedokan Bunder
0.66
90.46
0.61
94.98
Tugu
0.52
125.13
0.40
138.52
Ujung Garis
0.77
76.92
0.76
74.93
Kesimpulan • PLSR lebih baik daripada PCR dan dapat dijadikan sebagai alternatif teknik statistical downscaling • PLSR untuk satu respon dan multi respon memberikan hasil dugaan yang relatif sama, namun PLSR multi respon lebih baik digunakan untuk pendugaan secara simultan
Kajian Berikutnya Teknik statistical downscaling masih terus berkembang untuk memperoleh hasil pendugaan yang lebih baik. Kajian lebih lanjut diperlukan untuk mengkaji berbagai teknik statistical downscaling sehingga diperoleh metode terbaik Kajian-kajian lainnya: • Model-model nonparametrik • Multimodel output statistical downscaling Æ MME (Kang et.al. 2007) • Statistical downscaling of extreme value Æ EVT (Friederichs, P., A. Hense, 2007)