1
Prediksi Suhu Maksimum, Suhu Minimum, dan Kelembapan Rata-Rata Relatif dalam Jangka Pendek dengan Multivariate Regression melalui PraPemrosesan Principal Component Analysis (PCA) Rizky Kusumawardani dan Sutikno Jurusan Statistika, FMIPA, ITS, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail :
[email protected] Abstrak—Mulai tahun 2004 Badan Meteorologi, Klimatologi, dan Geoofisika (BMKG) telah mengembangkan metode baru dengan memanfaatkan luaran Numerical Weather Prediction (NWP) untuk memprakirakan suhu dan kelembapan. NWP akan bias bila digunakan pada daerah yang memiliki topografi dengan vegetasi yang dominan, sehingga diperlukan suatu postproccesing menggunakan Model Output Statistics (MOS). MOS merupakan suatu metode berbasis analisis regresi dengan variabel respon observasi unsur cuaca di permukaan dan variabel prediktor adalah unsur cuaca NWP. Jumlah variabel respon yang digunakan sebanyak 3 yaitu suhu maksimum, suhu minimum, dan kelembapan rata-rata relatif. Jumlah variabel prediktor yang digunakan sebanyak 18 variabel, sebelum dimodelkan variabel prediktor direduksi terlebih dahulu menggunakan Principal Component Analysis (PCA) berdasarkan grid, sebagian besar komponen utama yang didapatkan dari masing-masing variabel sebanyak satu. Setelah didapatkan hasil reduksi dimensi berdasarkan grid, kemudian hasil ini direduksi berdasarkan variabel. Sebagian besar komponen utama yang didapatkan sebanyak 7 untuk setiap stasiun pengamatan, komponen utama ini yang digunakan sebagai variabel prediktor dalam pemodelan. Metode yang digunakan untuk pemodelan adalah regresi multivariat. Hasil yang didapatkan adalah residual dari model masih belum identik dan independen, namun prediksi yang dihasilkan mampu mengoreksi bias NWP sebesar 89,22%. Jadi dapat dikatakan pemodelan MOS melalui regresi multivariat lebih akurat dibandingkan NWP untuk menduga suhu dan kelembapan hasil observasi. Kata Kunci—MOS, NWP, PCA, regresi multivariat.
I. PENDAHULUAN alam upaya meminimalkan dampak bencana akibat perubahan cuaca/iklim maka informasi prakiraan cuaca/iklim yang cepat dan tepat sangatlah penting. Suhu dan kelembapan merupakan unsur cuaca sebagai pembentuk dan pertumbuhan awan berkaitan dengan kejadian hujan, yang tidak dapat dipisahkan dari kehidupan manusia [1]. Oleh karena itu, diperlukan suatu metode yang dapat digunakan untuk memprakirakan suhu dan kelembapan dengan tepat dan cepat, karena periode waktu perubahannya relatif singkat. Salah satu lembaga pemerintahan non departemen yang menangani masalah prakiraan suhu dan kelembapan adalah Badan Meteorologi Klimtologi dan Geofisika (BMKG). Sejak tahun 2004 BMKG telah mengembangkan suatu metode prakiraan suhu dan kelembapan yang bersifat kuantitatif dengan memanfaatkan luaran Numerical Weather Prediction (NWP). Penggunaan NWP telah memberikan hasil yang lebih
D
akurat dan lebih obyektif. Namun, pemanfaatan NWP masih membutuhkan post processing, karena data ini akan bias bila digunakan pada daerah yang memiliki topografi dengan vegetasi yang dominan. Metode yang biasanya digunakan untuk post-processing adalah Model Output Statistics (MOS). MOS merupakan suatu metode berbasis analisis regresi dengan variabel respon observasi unsur cuaca di permukaan dan variabel prediktor unsur cuaca NWP. Pengkoreksian model MOS terhadap model NWP dapat diukur dengan (Percentage Improval) atau %IM. Terdapat dua permasalahan utama dalam penggunaan metode MOS pada penelitian ini yaitu penentuan metode statistika yang sesuai dan masalah dependensi. Penelitian tentang penanganan masalah dependensi antar grid dan antar variabel menggunakan reduksi dimensi di Indonesia pernah dilakukan oleh [3] yang menyebutkan bahwa reduksi dimensi data NWP dengan menggunakan PCA akan menghasilkan nilai Root Mean Square of Prediction (RMSEP) lebih kecil daripada menggunakan reduksi dimensi kernel Slice Inverse Regression (kSIR). Oleh karena itu, pada penelitian ini digunakan metode reduksi dimensi grid dan variabel data NWP menggunakan PCA. Penelitian tentang penanganan masalah pemilihan metode statistika yang sesuai juga sudah banyak berkembang di Indonesia, [4] mengembangkan MOS dengan pendekatan Regresi Partial Least Squares (PLS) univariate dan multivariate response untuk memprediksi suhu dan kelembapan. Penelitian yang lain juga pernah dilakukan oleh [5] dengan menggunakan Projection Pursuit Regression (PPR), hasil yang didapatkan adalah MOS dapat memperbaiki model NWP sebesar 86,09%. Penelitian ini menggunakan 3 jenis data observasi cuaca permukaan yaitu suhu maksimum, suhu minimum, dan kelembapan rata-rata relatif yang diketahui memiliki hubungan/keterkaitan secara teoritis. Penelitian tentang MOS selama ini masih menggunakan metode univariate untuk memprediksikan lebih dari satu data observasi cuaca permukaan. Sebetulnya [4] sudah membahas regresi multivariat, namun hasil prediksinya masih kurang akurat daripada hasil prediksi metode SIMPLS dan PLS. Oleh karena itu, penelitian ini menggunakan metode regresi multivariat untuk mengulangi penelitian [4] dengan lokasi yang berbeda, untuk melihat kebaikan model MOS dengan regresi multivariat, mengingat respon yang digunakan mengindikasikan adanya hubungan.
2
II. TINJAUAN PUSTAKA A. PCA (Principsl Component Analysis) PCA adalah suatu metode yang berhubungan dengan struktur varian-kovarian dari sekelompok variabel dengan menggunakan kombinasi linier [7]. Penelitian ini menggunakan data output NWP yang sudah distandarisasi dan dibagi menjadi data in sample dan out sample. Bentuk standarisasinya dapat dilihat pada Persamaan (1) berikut. ̅ (1) √ Dengan, =Vektor variabel NWP ke-i yang sudah distandarisasi, =Vektor variabel NWP ke-i yang belum distandarisasi, ̅ = Rata-rata variabel NWP ke-i, = Varians variabel NWP ke-i, i = 1,2,…,q . Perhitungan komponen pada penelitian ini didasarkan pada matrik varians-kovarians. Misalkan terdapat vektor random [ ] dengan ( ̂ ̂ ) yang merupakan sepasang eigenvalue dan eigenvector dari matrik varians-kovarians , ̂ ̂ , maka komponen utama yang dimana ̂ terbentuk dapat dilihat pada Persamaan (2). ̂ ,i=1,2,…,q (2) Menurut [7] untuk menentukan jumlah komponen utama yang digunakan salah satunya dapat dilakukan dengan cara melihat nilai varians komulatif yang ≥80%. B. Regresi Multivariat Model regresi multivariat adalah model regresi dengan lebih dari satu variabel respon dan satu atau lebih variabel prediktor [7]. Misalkan terdapat p variabel respon dan q variabel prediktor maka model regresi multivariat yang terbentuk ditunjukkan pada Persamaan (3). (3) Penaksir dihitung menggunakan metode least squares estimation yang hasil akhirnya sesuai dengan Persamaan (4). ̂ (4) Hubungan antara Variabel Respon dan Prediktor Hubungan antara variabel respon dan prediktor pada regresi multivariat dapat diukur menggunakan Wilk’s Lamda. Ukuran dinyatakan dengan rumus yang ada pada Persamaan (5) [8]. | | (5) | | || Nilai berada pada interval 0 dan 1, hubungan antara variabel sangat erat apabila nilai mendekati 1.
Apabila
artinya
antar
variabel
bersifat independen. R adalah matrik korelasi antar variabel. Pendeteksian Multikolinieritas Multikolinieritas merupakan suatu kondisi dimana antar variabel prediktor dalam model regresi memiliki hubungan linier yang kuat [10]. Variance Inflation Factor (VIF) dapat digunakan untuk mendeteksi adanya kasus multikolinieritas. Rumus ada pada Persamaan (7), menunjukkan koefisien determinasi. (7) Suatu persamaan regresi dapat dikatakan terbebas dari kasus multikolinieritas jika nilai VIF≤ 10. Pengujian Asumsi Residual Identik Menurut [8] untuk k populasi multivariat pengujian kesamaan varians-kovarians dapat digunakan pengujian Box’sM. Hipotesis yang digunakan adalah H0 : ∑1 = ∑2 = .. = ∑k H1 = Minimal ada satu ∑i ≠ ∑j , i≠j (i=1,2,…,k;j=1,2,…,k) α = 0,05. Statistik uji yang digunakan = (8) Dimana ∑ ∑ | | ∑ | |, ∑ = [∑
∑
][
]
(9) atau pvalue ≥α maka varians-
Apabila
kovarians bersifat homogen. Matrik varians-kovarians dapat bersifat tidak homogen, cara mengatasi residual tidak identik salah satunya dengan menggunakan pendeteksian outlier. Pendeteksian Asumsi Residual Independen Autocorrelation Function (ACF) merupakan analisis time series yang merepresentasikan korelasi antara data waktu sekarang dengan data waktu sebelumnya atau sesudahnya [11]. Rumus umumnya adalah sebagai berikut. ̂ ̂ (10) ̂ √ √ Residual bersifat independen apabila nilai ACF nya berada pada interval
√
̂
√
. Apabila residual tidak
independen dapat dilakukan transformasi data dengan mengasumsikan nilai ̂ .
Pengujian Kebebasan antar Variabel Respon Pendeteksian Asumsi Residual Berdistribusi Normal Penguji kebebasan antar variabel respon dapat dilakukan Multivariat dengan menggunakan uji Bartlett Sphericity [9]. Pemeriksaan distribusi normal multivariat dari residual Hipotesis yang digunakan dapat dilakukan dengan cara membuat chi-square plot [7]. H0 : Antar variabel respon bersifat independen Langkah-langkah pembuatan chi-square plot adalah. H1: Antar variabel respon bersifat dependen 1. Menghitung jarak mahalanobis sesuai dengan Persamaan α = 0,05. (11). Statistik uji yang digunakan ̅ ̂ ̅ = ̂ (11) { } | |. (6) 2. Mengurutkan jarak mahalanobis dari yang terkecil hingga terbesar seperti d2(1)≤. d2(2)≤… ≤ d2(n).
3
Membual plot antara qc,p((j-0,5)/n) dengan d2(j), dimana qc,p((j-0,5)/n) adalah 100 ((j-0,5)/n) kuantil dari distribusi chi square dengan derajat bebas p. Dengan, : jarak kuadrat mahalanobis ke-i, ̂ : vektor residual ke-i, ̅ : rata-rata residual. : Matriks varians kovarians residual yang berukuran pxp. Data dikatakan berdistribusi normal multivariat jika, 1. Jumlah kurang lebih sebesar 50%. 2. Chi-square plot membentuk garis lurus dengan slop 1.
3.
C. Validasi Model Validasi model digunakan untuk menilai apakah MOS dapat menduga prakiraan dengan baik. Ukuran validasi yang digunakan adalah Root Mean Square Error Prediction RMSEP. Rumus RMSEP ditunjukkan oleh Persamaan (12). √
̂
̂
(12)
̂ adalah matriks respon taksiran, adalah matriks respon data outsample, dan adalah banyaknya data out sample. Tabel 1 Kriteria Nilai RMSEP untuk Suhu dan Kelembapan Variabel
Suhu
Kelembapan
RMSEP 0.0-0.4 0.5-0.8 0.9-1.2 1.3-1.6 >1.6 0.0-2.5 2.6-5.0 5.1-7.5 7.6-10.0 >10.0
Kriteria Baik Sekali Baik Sedang Buruk Buruk Sekali Baik Sekali Baik Sedang Buruk Buruk Sekali
D. Ukuran Pengkoreksian Bias Ukuran pengkoreksian bias dapat dihitung menggunakan Percentage Improval atau %IM.
dengan (13)
E. Suhu Udara Permukaan dan Kelembapan Udara Relatif Permukaan (RH) Suhu udara permukaan merupakan data yang dicatat berdasarkan skala thermometer bola kering yang terpasang dalam sangkar meteorologi dengan tinggi ± 1,2 meter [12]. Kelembapan udara relatif atau relative humidity (RH) adalah perbandingan (dalam persen) untuk tekanan uap yang teramati dengan tekanan uap jenuh atau saturasi (untuk kondisi air atau cair) pada suhu dan tekanan udara yang sama. G. NWP (Numerical Weather Prediction) NWP merupakan metode pendugaan cuaca secara kuantitatif yang diolah menggunakan komputer untuk membentuk model persamaan yang dapat merepresentasikan keadaan atmosfer berdasarkan sifat fisika yang selalu berubahubah. Menurut [13] model NWP cukup baik untuk prediksi jangka pendek sampai dengan 72 jam ke depan.
H. MOS(Model Output Statistics) MOS merupakan metode berbasis analisis regresi dengan variabel respon observasi unsur cuaca di permukaan dan variabel prediktor unsur cuaca NWP. III. METODOLOGI PENELITIAN A. Sumber Data Data yang digunakan merupakan data sekunder yang diperoleh dari BMKG pada periode 1 Januari 2009 sampai 31 Desember 2010. Data merupakan data harian yang berasal dari 4 stasiun pengamatan, lokasi stasiun pengamatan terdiri dari Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko. Variabel yang digunakan terdapat dua jenis yaitu variabel respon dan prediktor. Variabel respon terdiri dari suhu maksimum (TMAKS), suhu minimum (TMIN), dan kelembapan rata-rata relatif (RH). Variabel prediktor disajikan pada Tabel 2 berikut ini. Tabel 2 Variabel Prediktor yang Berasal dari Data NWP No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Variabel Surface Pressure Tendency (dpsdt) Water Mixing Ratio (mixr) Vertical Velocity (omega) PBL depth (pblh) Surface Preassure (ps) Mean Sea Level Preassure (psl) Screen Mixing ratio (qgscrn) Relative Humidity (rh) Precipitation (rnd) Temperature Maximum Screen temperature (tmaxer) Minimum Screen Temperature (tmincr) Pan Temperature (tpan) Screen Temperature (tscrn) Zonal Wind (u) Friction Velocity (ustar) Meridional Wind (v) Geopotential Height (zg)
Level Permukaan 1,2, dan 4 1,2, dan 4 Permukaan Permukaan Permukaan Permukaan 1,2, dan 4 Permukaan 1,2, dan 4 Permukaan Permukaan Permukaan Permukaan 1,2, dan 4 Permukaan 1,2, dan 4 1,2, dan 4
B. Langkah Analisis Langkah analisis yang digunakan pada penelitian ini adalah. 1. Pra-Pemrosesan. a. Membuat standarisasi data NWP & observasi cuaca permukaan. b. Membagi data menjadi data in sample dan out sample dengan perbandingan 9:1. c. Mereduksi data NWP dengan menggunakan PCA. i) Menentukan matrik varians-kovarians dari variabel NWP yang telah distandarisasi dan dibagi menjadi data in sample dan out sample. ii) Mendapatkan nilai eigenvalue dengan menggunakan ̂ | rumus | . iii) Mendapatkan nilai eigenvector dengan ̂ ) menggunakan rumus ( iv) Menghitung proposi komulatif varians dari eigenvalue yang didapatkan. v) Menentukan jumlah komponen utama yang digunakan dengan melihat nilai varians komulatif yang lebih dari 80%.
4
2.
IV. HASIL DAN PEMBAHASAN A. Pra-Pemrosesan Data yang digunakan pada penelitian ini berjumlah 708 pengamatan, yang digunakan sebagai data in sample sebanyak 637, sedangkan yang digunakan sebagai data out sample sebanyak 71. Sebelum data dibagi menjadi data in sample dan out sample, data distandarisasi terlebih dahulu. Selanjutnya data in sample direduksi dimensi menggunakan PCA. Reduksi dimensi dilakukan dua kali, yaitu: pertama berdasarkan grid dan kedua berdasarkan variabel. Sebagian besar jumlah komponen yang dihasilkan sebanyak satu untuk setiap variabel prediktor setelah direduksi berdasarkan grid. Komponen utama yang dihasilkan kemudian direduksi lagi berdasarkan variabel dan didapatkan komponen utama sebanyak 7 di Stasiun Kemayoran, Pondok Betung, Tangerang, dan 8 di Stasiun Citeko. Hasil reduksi dimensi berdasarkan variabel digunakan sebagai variabel prediktor dalam penyusunan MOS menggunakan regresi multivariat. B. Regresi Multivariat Pemodelan regresi multivariat yang dilakukan pada penelitian ini terdapat dua tahapan, pertama regresi multivariat dengan adanya kasus residual tidak identik dan independen, kedua regresi multivariat dengan penanganan kasus residual tidak identik dan independen. Berikut ini adalah hasil dari regresi multivariat dengan adanya kasus residual tidak identik dan independen. Pola Hubungan Variabel Prediktor dan Respon Pola hubungan antara variabel prediktor dan respon dapat dilihat menggunakan scatter plot. Gambar 1 berikut ini menyajikan ilustrasi hubungan antara variabel prediktor dan respon di Stasiun Kemayoran.
-30
0
30
-10
0
10
-10
0
10
TMAKS
2.0
-0.5
-3.0
TMIN
3
0
-3
2
RH
Post-Processing. Membentuk MOS dengan regresi multivariat di keempat stasiun pengamatan secara terpisah, dengan tahapan. i.) Sebelum pembentukan model regresi multivariat. a. Mendapatkan bentuk kurva regresi dengan cara membuat plot antara setiap variabel prediktor dengan variabel respon. b. Mengukur keeratan hubungan antara variabel respon dan prediktor dengan menggunakan Wilk’s Lamda. c. Menguji dependensi variabel respon dengan menggunakan Barlett Sphericity. ii.) Setelah pembentukan model regresi multivariat. a. Pendeteksian multikolinieritas model regresi. b. Pengujian asumsi residual IIDNm. 3. Mendapatkan prediksi untuk data observasi cuaca permukaan sejumlah data out sample. 4. Memvalidasi model MOS yang dihasilkan dengan menggunakan RMSEP. 5. Menghitung %IM model MOS. 6. Mendapatkan model terbaik.
0 -2
-20
0
PC1
20
-20
PC2
0
PC3
20
0
PC4
15
30
PC5
-10
PC6
0
10
PC7
Gambar 1 Pola Hubungan PC1,PC2,…,PC7 dengan Suhu Maksimum, Suhu Minimum, dan Kelembapan Rata-Rata Relatif di Stasiun Kemayoran
Sebagai ilustrasi berdasarkan Gambar 1 diambil PC1 dan PC5. PC1 memiliki pengaruh positif terhadap suhu maksimum dan minimum, sedangkan untuk kelembapan rata-rata relatif cenderung berpengaruh negatif. PC5 cenderung tidak berpengaruh untuk semua respon, karena pola hubungannya cenderung berkumpul pada satu titik disekitar 0. Pengujian Dependensi Antar Variabel Respon Pengujian dependensi antar variabel respon dapat digunakan uji Barlett Sphercity. Ringkasan hasil pengujian dependensi untuk keempat stasiun disajikan pada Tabel 3. Tabel 3 Nilai Chi-Square Pengujian Barlett Sphercity di Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko Stasiun Kemayoran Pondok Betung Tangerang Citeko
( ) 769,151 433,501 354,554 446,366
7,815 7,815 7,815 7,815
Berdasarkan Tabel 3 dapat disimpulkan bahwa terdapat dependensi antar variabel respon di keempat stasiun pengamatan, karena nilai . Hubungan antara Variabel Respon dan Prediktor Hubungan antara variabel respon dan prediktor salah satunya dapat dinilai menggunakan Wilk’s Lamda. disajikan pada Tabel 4. Rangkuman hasil nilai Berdasarkan Tabel 4 dapat disimpulkan bahwa di setiap stasiun pengamatan hubungan antara variabel respon dan prediktornya sudah cukup erat, karena nilai mendekati nilai 1. Tabel 4 Nilai
di Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko Stasiun Kemayoran Pondok Betung Tangerang Citeko
0,6236 0,6007 0,5636 0,7147
Pemodelan Regresi Multivariat Hasil estimasi parameter dapat dilihat pada Lampiran A dari nilai estimasi parameter ini dapat dihitung residualnya. Pengujian residual dapat dilihat pada Lampiran B. Residual yang dihasilkan telah berdistribusi normal multivariat, namun belum identik dan independen untuk Stasiun Kemayoran, Pondok Betung, dan Tangerang, sedangkan residual di Stasiun Citeko hanya memuat pelanggaran residual tidak independen. Oleh karena itu, perlu dilakukan pemodelan ulang dengan
5
menangani kasus pelanggaran asumsi residual identik dan independen. Pelanggaran asumsi residual yang pertama kali ditangani adalah masalah residual tidak identik. Hasil pemodelan regresi multivariat dengan penanganan kasus residual tidak identik masih menghasilkan residual yang tidak independen.
Hasil pengujian residual dapat dilihat pada Lampiran C. Selanjutnya, data yang telah dideteksi outlier ditransformasi untuk menangani kasus residual tidak independen. Residual yang dihasilkan di Stasiun Kemayoran, Pondok Betung, dan Tangerang sudah berdistribusi normal multivariat, tetapi belum identik dan independen. Residual di Stasiun Citeko sudah berdistribusi normal multivariat dan identik, tetapi belum independen. Hasil pengujian residual dapat dilihat pada Lampiran D. Model regresi multivariat yang dipilih untuk dibandingkan dengan model NWP adalah model yang memiliki nilai RMSEP paling kecil berdasarkan kriteria yang telah ditentukan oleh BMKG. Tabel 5 menyajikan nilai RMSEP untuk masing-masing variabel respon di keempat stasiun pengamatan. Tabel 5 Perbandingan Nilai RMSEP Berdasarkan Tahapan Regresi Multivariat di Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko Stasiun Pengamatan
Kemayoran
Pondok Betung
Tangerang
Citeko
Tahapan Regresi Multivariat Adanya Pelanggaran Residual Tidak Identik dan Independen
Respon
RMSEP
Kategori RMSEP
TMAKS
1,1453
Sedang
Tabel 5 memberikan informasi nilai RMSEP paling kecil di seluruh stasiun pengamatan terdapat pada regresi multivariat dengan penanganan kasus residual tidak identik dan independen, hal ini disebabkan oleh adanya transformasi data. Sebagai ilustrasi dapat dilihat di Stasiun Kemayoran. Nilai RMSEP di Stasiun Kemayoran untuk regresi multivariat dengan penanganan kasus residual tidak identik dan independen menunjukkan hasil prediksi suhu maksimum dan minimum tergolong kriteria prediksi sedang, sedangkan kelembapan rata-rata relatif tergolong kriteria prediksi baik. Selengkapnya dapat dilihat pada Tabel 5. C. Perbandingan Hasil Prediksi MOS dan NWP Terhadap Hasil Observasi. Perbandingan hasil prediksi MOS dan NWP dapat diidentifikasi secara kualitatif menggunakan gambar dan secara kuantitatif menggunakan perhitungan %IM. Sebagai ilustrasi, berikut ini disajikan Gambar 2. ℃
℃ 35 30 25 20 15 10 5 0
30 25 20 15 10 5 0
n
TMIN
0,8331
Sedang
RH
5,4586
Sedang
Penanganan Residual Tidak Identik dan Independen
TMAKS
1,0769
Sedang
TMIN
0,8118
Sedang
RH
4,7723
Baik
80
Adanya Pelanggaran Residual Tidak Identik dan Independen
TMAKS
1,2034
Buruk
60
TMIN
0,8070
Sedang
RH
5,6365
Sedang
Penanganan Residual Tidak Identik dan Independen
TMAKS
1,3117
Buruk
TMIN
0,7336
Baik
RH
5,7107
Sedang
Adanya Pelanggaran Residual Tidak Identik dan Independen
TMAKS
1,1337
Sedang
TMIN
1,0872
Sedang
RH
5,8867
Sedang
Penanganan Residual Tidak Identik dan Independen
TMAKS
1,0759
Sedang
TMIN
1,0666
Sedang
RH
5,6382
Sedang
Adanya Pelanggaran Residual Tidak Identik dan Independen
TMAKS
1,3455
Buruk
TMIN
0,5401
Baik
RH
6,0032
Sedang
Penanganan Residual Tidak Identik dan Independen
TMAKS
1,3265
Buruk
TMIN
0,5554
Baik
RH
5,8105
Sedang
1
11
21
31
41
MOS
51
61
Observasi
71
n 1
NWP
11 MOS
(b)
(a)
21
31
41
51
Observasi
61
71 NWP
% 100
40 20 n
0 1
(c)
11 MOS
21
31
41
51
Observasi
61
71 NWP
Gambar 2 Perbandingan Hasil Prediksi MOS, NWP, dan Data Observasi (a) Suhu Maksimum, (b) Suhu Minimum, (c) Kelembapan Rata-Rata Reltaif di Stasiun Citeko
Gambar 2 memberikan informasi hasil prediksi MOS untuk suhu maksimum, suhu minimum, dan kelembapan ratarata relatif di Stasiun Citeko nilainya mendekati hasil observasi, sedangkan hasil prediksi NWP menjauhi hasil observasi. Jadi, secara visual MOS lebih akurat daripada NWP, supaya lebih subjektif maka selanjutnya dilakukan perhitungan %IM. Perbandingan hasil prediksi MOS dan NWP terhadap hasil observasi berdasarkan nilai %IM disajikkan pada Tabel 6 Tabel 6 menunjukkan bahwa nilai RMSEP MOS yang dihasilkan di Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko lebih kecil dari nilai RMSEP NWP. Nilai pengkoreksian %IM MOS terhadap NWP untuk suhu maksimum berkisar antara 60,52%-68,09%, suhu minimum berkisar antara 20,40%-89,22%, dan kelembapan rata-rata
6
relatif berkisar antara 14,04%-55,48%. Interval %IM untuk suhu minimum lebih panjang dibandingkan suhu maksimum, hal ini disebabkan oleh adanya nilai %IM yang cukup besar pada suhu minimum di Stasiun Citeko mengingat lokasi stasiun ini berada di dataran tinggi. Apabila dilihat nilai %IM nya, perbaikan MOS terhadap NWP mencapai 89,22% untuk suhu minimum di Stasiun Citeko, selengkapnya dapat dilihat pada Tabel 6.
[6]
Tabel 6 Nilai RMSEP MOS, RMSEP NWP, dan %IM Variabel Suhu Maksimum, Suhu Minimum, dan Kelembapan Rata-Rata Relatif di Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko
[10]
Stasiun Pengamatan
Kemayoran
Pondok Betung
Tangerang
Citeko
Variabel
RMSEP MOS
RMSEP NWP
%IM
TMAKS
1,0769
2,9491
62,20
TMIN
0,8118
1,9110
56,17
RH
4,7723
7,1804
26,78
TMAKS
1,3117
3,3227
60,52
TMIN
0,7336
1,0812
32,15
RH
5,7107
7,5821
24,68
TMAKS
1,0759
3,1089
65,39
TMIN
1,0666
1,3400
20,40
RH
5,6382
6,5589
14,04
TMAKS
1,3265
4,1572
68,09
TMIN
0,5554
5,1505
89,22
RH
5,8105
13,0509
55,48
V. KESIMPULAN / RINGKASAN Model regresi multivariat yang digunakan menghasilkan residual yang tidak identik dan independen. Perbaikan MOS terhadap NWP mencapai 89,22% untuk suhu minimum di Stasiun Citeko, artinya MOS dengan regresi multivariat menghasilkan prediksi untuk data observasi lebih akurat dibandingkan NWP. Penelitian selanjutnya sebaiknya menggunakan metode lain yang tidak terlalu ketat asumsi atau soft modelling, karena penggunaan metode regresi multivariat masih memuat kasus residual tidak identik dan independen.
[7] [8] [9]
[11] [12]
[13]
Wardani, I. K. (2011). Manfaat Prediksi Cuaca jangka Pendek Berdasarkan Data Radiosonde dan Numerical Weather Prediction(NWP) untuk Pertanian Daerah. Competitive Advantage I "Peningkatan Daya Saing Daerah Dalam Menghadapi Pasar Tunggal". Jombang: Universitas Pesantren Tinggi Darul'Ulum . Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analisis Sixth Edition. New Jersey: Prentice Hall. Rencher, A. C. (2002). Methods of Multivariate. USA: John Wiley & Sons,Inc. Morrison, D. F. (2005). Multivariat Statistical Methods, Fourth Edition. New York: McGraw-Hill,Inc. Damondar, N. G. (2004). Basic Econometrics fourth edition. New York: MCGraw-Hill. Wei, W.W.S. (2004). Time Series Analysis Univariate and Multivariate Methods. Canada: Addison Wesley Publishing, Company. Inc. Fadholi, A. (2012). Analisis Kondisi Atmosfer pada Kejadian Cuaca Ekstrem Hujan Es(Hail) Vol 1 Nomer 2(D). Jurnal Ilmu Fisika Indonesia. Arfianto (2006). Aplikasi Model Regresi Logistik Untuk Prakiraan Kejadian Hujan. Bogor: IPB.
LAMPIRAN A. Estimasi Parameter Regresi Multivariat di Stasiun Kemayoran, Pondok Betung, Tangerang, dan Citeko Stasiun
Kemayoran
Pondok Betung
Tangerang
DAFTAR PUSTAKA [1]
Swarinoto, Y. s., & Sugiyono. (2011). Pemanfaatan Suhu Udara dan Kelembapan Udara dalam Persamaan Regresi untuk Simulasi Prediksi Total Hujan Bulanan di Bandar Lampung. Jurnal Meteorologi dan Geofisika Vol 12 Nomer 3, 271-281. [2] Bremen, L. v. (2007). Combination of Deterministic and Probabilistic Meteorological Models to enhance Wind Farm Power Forecast. Jousnal of Physics, IOP . [3] Ayuni, N. W. (2013). Reduksi Dimensi Luaran NWP Dengan Menggunakan Kernel Sliced Inverse Regression (KSIR) Sebagai PraProcessing Pada Model Output Statistics. Surabaya: ITS. [4] Sari, G. A. (2013). Pendekatan regresi Partial Least Squares Univariate dan Multivariate Response untuk Memprediksi Suhu dan Kelembapan. Surabaya: ITS. [5] Safitri, R. (2012). Model Output Statistics dengan Projection Pursuit Regression untuk Meramalkan Suhu Minimum,Suhu Maksimum, dan Kelembaban Vol 1 Nomer 1. Jurnal Sains dan Seni ITS.
Citeko
Variabel Konstanta PC1 PC2 PC3 PC4 PC5 PC6 PC7 Konstanta PC1 PC2 PC3 PC4 PC5 PC6 PC7 Konstanta PC1 PC2 PC3 PC4 PC5 PC6 PC7 Konstanta PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8
TMAKS -0,00324 0,05148 0,04466 0,03998 -0,01656 0,03312 0,02612 0,07549 0,01865 0,05952 0,03050 0,03119 0,00002 -0,02382 0,01269 -0,08896 0,00926 0,06273 0,03744 -0,02773 -0,00924 -0,01802 0,02917 -0,06715 0,02666 0,06689 -0,00463 0,04799 -0,01789 0,00422 0,02695 -0,00083 0,05495
TMIN 0,01069 0,05348 0,00648 0,03237 -0,02927 0,00890 0,01269 0,05268 0,01733 0,03832 -0,02395 0,02027 0,04788 0,01279 0,00873 -0,03580 0,01214 0,03039 -0,02924 0,00496 -0,01873 0,02468 0,01733 -0,01820 0,01311 0,00382 -0,07623 -0,00513 -0,00339 -0,05732 0,07443 -0,01086 -0,00385
RH 0,01916 -0,01739 -0,06131 -0,02470 -0,01893 -0,04375 -0,00354 -0,06351 -0,01710 -0,02619 -0,05954 -0,02309 0,02828 0,03411 0,00578 0,07143 0,01755 -0,02452 -0,05251 0,02012 -0,03131 0,01629 -0,01952 0,06307 -0,00236 -0,05196 -0,04403 -0,03872 0,01725 -0,03018 0,01409 0,00414 -0,02219
7
B. Pengujian Asumsi Residual
Identifikasi Residual Independen
Identifikasi Residual Berdistribusi Normal Multivariat Uji Normalitas (Jumlahan
Stasiun Kemayoran Pondok Betung Tangerang Citeko
0,5290 0,5746 0,5981 0,5746
Identifikasi Residual Identik Stasiun Box’s M Kemayoran 6,682 Pondok Betung 14,090 Tangerang 21,511 Citeko 3,819 Identifikasi Residual Independen Stasiun Kemayoran Pondok Betung Tangerang Citeko ̂
TMAKS 0,32822 0,27852 0,29976 0,32950
Pvalue 0,035 0,001 0,000 0,148
TMIN
RH 0,40679 0,49037 0,41569 0,42842
0,27946 0,24553 0,01616 0,37568
C. Pengujian Asumsi Residual Setelah Deteksi Outlier Identifikasi Residual Berdistribusi Normal Multivariat Uji Normalitas (Jumlahan
Stasiun Kemayoran Pondok Betung Tangerang
0,5099 0,5208 0,5450
Identifikasi Residual Identik Box’s M
Stasiun Kemayoran Pondok Betung Tangerang
Pvalue 2,530 1,149 2,746
0,282 0,563 0,254
Identifikasi Residual Independen Stasiun Kemayoran Pondok Betung Tangerang D.
TMAKS 0,26634 0,24233 0,28008
TMIN 0,27561 0,17612 0,08583
RH 0,34712 0,44408 0,37509
Pengujian Asumsi Residual Setelah Deteksi Outlier dan Transformasi Data Identifikasi Residual Berdistribusi Normal Multivariat Stasiun
Uji Normalitas (Jumlahan
Kemayoran Pondok Betung Tangerang Citeko
0,5373 0,5300 0,5659 0,5896
Identifikasi Residual Identik Stasiun Kemayoran Pondok Betung Tangerang Citeko
Box’s M 13,382 29,899 15,147 0,289
Pvalue 0,001 0,000 0,001 0,866
Stasiun Kemayoran Pondok Betung Tangerang Citeko
TMAKS -0,42870 -0,45727 -0,37371 -0,41107
TMIN -0,35986 -0,42556 -0,44578 -0,33203
RH -0,32907 -0,27677 -0,32491 -0,24535