Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan Analisis Komponen Utama Ferry Kondo Lembang Jurusan Matematika FMIPA UNPATTI
[email protected] Abstrak Reduksi dimensi adalah bagian penting bagi prosedur menganalisis data berdimensi tinggi (ukuran besar). Didalam pemodelan statistika, reduksi dimensi dikenal sebagai teknik preprocessing suatu model yang akan dikembangkan. Data luaran Global Circulation Model (GCM) memiliki ukuran dimensi data yang tinggi (besar) disebabkan GCM adalah suatu model berbasis komputer yang terdiri atas berbagai persamaan numerik dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika dimana GCM mampu menduga perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur. Oleh karena itu, pada penelitian ini digunakan metode Analisis Komponen Utama (AKU) sebagai salah satu metode reduksi dimensi yang populer dalam ilmu statistika. Metode reduksi AKU diyakini mampu mempertahankan keragaman variabel asal sehingga keaslian data asal masih tetap ada disebabkan total keragaman yang dipakai adalah 90% untuk mendapatkan komponen utama yang optimal. Adapun domain grid data luaran GCM yang dipakai sebagai sampel penelitian adalah domain grid 3x3, 8x8, dan 12x12. Hasil penelitian menunjukkan bahwa total variabel prediktor yang dihasilkan dengan metode AKU pada domain grid 3×3 adalah 17 variabel, domain 8×8 adalah 34 variabel, dan domain 12×12 adalah 48 variabel. Semakin luas domain maka semakin banyak komponen utama yang dipakai untuk memperoleh keragaman lebih dari 90%. Kata Kunci: GCM, Analisis Komponen Utama, Keragaman
1. Pendahuluan Sampai saat ini, GCM (General Circulation Models) diakui banyak pihak sebagai alat penting dalam upaya memahami sistem iklim. GCM mampu menduga perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur (von Stroch et al. 1993 dalam Sutikno, 2008). Ukuran-ukuran grid yang besar ini tentu saja seringkali menjadi masalah bagi beberapa peneliti yang berkecimpung dibidang klimatologi dalam memprediksikan iklim maupun cuaca. Untuk daerah-daerah dengan topografi yang kompleks, di sepanjang garis pantai, dan daerah-daerah dengan tutupan lahan yang sangat heterogen, seperti Indonesia model GCM hasilnya kurang sensitif. Model GCM yang sesuai diterapkan di Indonesia adalah model dengan resolusi horisontal yang tinggi dan skema konveksi yang komprehensif. Untuk itu perlu diupayakan suatu teknik reduksi dimensi untuk memperkecil ukuran grid-grid pada data luaran GCM sehingga memudahkan peneliti yang ada untuk memprediksi iklim dan cuaca secara tepat. Pada penelitian Manorang, et.al (2009) membandingkan metode AKU dan AKU Kernel untuk mereduksi dimensi data luaran GCM Kabupaten Indramayu. Berdasarkan penelitian yang dilakukan Manorang, et al, metode reduksi dimensi AKU memberikan hasil yang lebih baik dari metode AKU Kernel. Tertarik dengan penelitian Manorang, maka dalam penelitian ini digunakan metode reduksi dimensi AKU. Tujuan dari penelitian ini adalah mengkaji prosedur dan hasil metode AKU untuk mereduksi dimensi data luaran GCM stasiun Kairatu. Kriteria yang digunakan pada pereduksian adalah jumlah komponen utama optimal yang
33
Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
digunakan mampu menjelaskan lebih besar sama dengan 90% keragaman dari keragaman total. Penelitian ini diharapkan dapat digunakan BMKG untuk kajian dampak iklim dengan basis data luaran GCM, khususnya dalam penggunaan reduksi dimensi AKU. Tinjauan Pustaka Analisis Komponen Utama (AKU) Analisis Komponen Utama adalah struktur yang menjelaskan varian kovarian yang terdiri atas sedikit kombinasi linier dari variabel asal (Johnson dan Wichern, 1998). Sharma (1996) menyatakan AKU adalah teknik untuk membentuk linier komposit variabel baru dari variabel asal. Sehingga variabel baru itu nantinya merupakan ringkasan/susutan dari variabel asal dengan tetap mampu menjelaskan semaksimal mungkin variabel asalnya. Jadi secara umum AKU adalah meringkas/menyusut variabel untuk lebih mempermudah interpretasi. Variabel baru yang dihasilkan maksimal sebanyak variabel asalnya. Secara gometrik, AKU untuk menentukan sekumpulan sumbu ortogonal yang baru. Penjelasannya sebagai berikut : 1. Koordinat observasi pada sumbu akan menunjukkan nilai bagi variabel baru. Sumbu baru ini (variabel baru yang terbentuk) disebut PCs dan nilai pada PCs ini disebut principal components scores. 2. Setiap variabel baru adalah kombinasi linier dari variabel asal. 3. Variabel baru pertama (PC ke-1) memuat varian maksimum data. 4. Variabel baru kedua (PC ke-2) memuat varian maksimum yang tidak termuat oleh variabel baru pertama (PC ke-1). 5. Variabel baru ke-p (PC ke-p) memuat varian maksimum yang tidak termuat dalam variabel baru sebelumnya (PC ke-1 sampai PC ke- (p-1)). 6. Variabel baru yang terbentuk tidak berkorelasi. Secara aljabar AKU adalah kombinasi linier dari p variabel random X1, X2,…, Xp. Kombinasi linier ini adalah seleksi dari koordinat baru dari rotasi variabel asal (X1, X2,…, Xp) sebagai sumbu koordinat (Johnson dan Wichern,1998). Sumbu baru ini mampu menjelaskan variasi maksimum dan menghasilkan penjelasan yang lebih simpel dan hemat dari struktur kovarian. Global Circulation Model (GCM) GCM adalah suatu model berbasis komputer yang terdiri atas berbagai persamaan numerik dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika. Model ini menduga perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur (von Stroch et al. 1993 dalam Sutikno, 2008). GCM merupakan suatu alat penting dalam studi keragaman iklim dan perubahan iklim (Zorita dan Storch, 1999). Namun informasi GCM masih berskala global dan tidak untuk fenomena skala lebih kecil (lokal), sehingga sulit untuk memperoleh langsung informasi berskala lokal dari GCM. Resolusi GCM terlalu rendah untuk memprediksi iklim lokal yang dipengaruhi oleh sirkulasi atmosfir dan parameter lokal seperti topografi dan tataguna lahan, tetapi GCM masih mungkin digunakan untuk memperoleh informasi skala lokal atau regional bila teknik downscaling digunakan (Fernandez, 2005 dalam Wigena, 2006)
34
Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
3. Metodologi Data yang digunakan adalah data sekunder yang diperoleh dari data luaran GCM model CSIRO-Mk3. Domain GCM yang digunakan adalah domain 3x3 , pada posisi 4.660 LS- 8.39 0 LS, 106.87 0 BT– 110.64 0 BT, domain 8x8 , pada posisi 0.93 0 -13.99 0 LS, 101.120 BT - 114.380 BT; dan domain 12x12 , pada posisi 2.79 0 LU-17.72 0 LS, 97.500 BT – 118.1250 BT. Lokasi domain yang diambil adalah pada stasiun Amahai. Variabel prediktor meliputi: precipitable water (prw), tekanan permukaan laut (slp), komponen angin meridional (va), komponen zonal (ua), ketinggian geopotensial (zg), dan kelembaban spesifik (hus). Ketinggian (level) adalah 850 hPa, 500 hPa, dan 200 hPa. Tabel 1 Variabel Prediktor yang diambil dari model luaran CSIRO-Mk3 dan pengkodingan.
Tahapan analisis data dalam penelitian ini yaitu : 1. Melakukan reduksi dimensi. Metode reduksi dimensi yaitu Analisis Komponen Utama. Berikut akan diuraikan langkah-langkah analisisnya: 1. Anggap sekumpulan observasi xj, dimana j: 1,2,...,m pada input data Rn. 2. Untuk satuan variabel asal tidak sama, seringkali dilakukan pembakuan n
(stadardization) dulu sebelum dibuat matriks varian-kovarian. Sehingga
x
j
0.
j 1
3. Membuat matrik Varian Kovariansi Σ. 4. Menentukan nilai akar karakteristik (eigen value) dengan menghitung I 0 . 5. Menentukan jumlah komponen utama yang dibangkitkan (dengan melihat nilai eigen value). Keragaman yang lebih dari 90% menunjukkan banyaknya komponen utama yang harus dibangkitkan. 6. Menghitung nilai komponen utama (scores) dari model komponen utama Yi a 'i X , dimana ai adalah eigenvektor. PEMBAHASAN Pra-pemrosesan Pemodelan Statistical Downscaling Pra-pemrosesan pemodelan Statistical Downscaling (SD) adalah salah satu tahapan yang mengkaji luasan dan lokasi grid domain GCM yang optimum untuk penyusunan pemodelan SD. Pra-pemrosesan pemodelan SD berupa reduksi dimensi. Reduksi dimensi pada penelitian ini menggunakan metode AKU. Reduksi dimensi dilakukan pada variabel luaran GCM di setiap level, yaitu permukaan, 200 hPa, 500 hPa, dan 850 hPa serta dilakukan pada setiap domain. Pada setiap hasil reduksi (per
35
Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
level) diambil satu atau lebih komponen utama dengan keragaman lebih dari 90% sebagai variabel prediktor. 4.2 Hasil Reduksi Dimensi menggunakan Metode AKU Reduksi dimensi dengan metode AKU pada variabel HUSS ditunjukkan pada Tabel 2. Tabel 2 memberikan informasi kumulatif proporsi komponen utama variabel HUSS pada masing-masing grid. Tabel 2 Nilai Eigen dan Kumulatif Proporsi Metode AKU pada Variabel HUSS domain 3×3, 8×8, dan 12×12
Keterangan: Kum= Kumulatif proporsi keragaman
Tabel 2 memberikan informasi bahwa jumlah komponen utama yang mempunyai keragaman ≥ 90% pada domain 3×3, 8×8 12×12, masing-masing adalah 1, 3, dan 5. Hal ini menunjukkan semakin luas domain maka semakin banyak komponen utama (PC) yang dipakai dan sebaliknya. Situasi ini mungkin tidak berlaku bagi variabel luaran GCM yang lain. Variabel luaran GCM yang satu dengan yang lain memiliki karakteristik yang berbeda-beda. Hal ini dimungkinkan karena setiap variabel luaran GCM memiliki level/ketinggian yang berbeda-beda pula. Plot scores komponen utama variabel HUSS ditunjukkan pada gambar 1.
Gambar 1 Plot scores variabel HUSS (a) Domain 3×3,(b) Domain 8×8, dan (c) Domain 12×12.
36
Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
Gambar 1 memperlihatkan plot komponen utama masing-masing domain. Domain 3x3 dan 12x12 cenderung memiliki bentuk plot yang hampir menumpuk pada satu sisi. Sedangkan domain 8x8 memiliki bentuk plot yang menyebar secara merata. Reduksi dimensi dengan metode PCA pada berbagai variabel luaran GCM selain variabel HUSS, dapat dilakukan dengan cara yang sama dengan reduksi dimensi PCA pada variabel HUSS. Tabel 3 memperlihatkan jumlah komponen utama dengan keragaman ≥ 90% untuk setiap variabel luaran GCM pada domain 3×3, 8×8, dan 12×12. Tabel 3 Jumlah PC dan Kumulatif Proporsi dengan Metode AKU pada Berbagai Variabel Luaran GCM.
Keterangan: Kum= Kumulatif proporsi keragaman
Total variabel prediktor yang dihasilkan dengan metode AKU pada domain 3×3 adalah 17 variabel, domain 8×8 adalah 34 variabel, dan domain 12×12 adalah 48 variabel. Dapat disimpulkan bahwa semakin luas domain maka semakin banyak komponen utama yang dipakai untuk memperoleh keragaman lebih dari 90%. Semakin sedikit jumlah komponen dan mempunyai persentase keragaman yang besar menunjukkan antar variabel (grid) memiliki hubungan sangat erat dan sebaliknya. Kesimpulan dan Saran Kesimpulan Berdasarkan hasil analisis dan pembahasan didapatkan beberapa kesimpulan : Prosedur mendapatkan komponen utama (PC) pada metode AKU dengan total variabel prediktor yang dibangkitkan dengan metode PCA pada domain 3×3 adalah 17 variabel, pada domain 8×8 adalah 34 variabel, dan pada domain 12×12 adalah 48 variabel. Hal ini menunjukkan bahwa semakin luas domain maka semakin banyak komponen utama yang dipakai untuk memperoleh keragaman lebih dari 90%. Saran Beberapa saran yang dapat direkomendasikan dalam memperbaiki penelitian ini diantaranya: 1. Untuk mendapatkan reduksi variabel yang lebih baik perlu diperhatikan karakteristik dari data GCM. 2. Dapat dilanjutkan untuk memodelkan curah hujan di Amahai dengan menganalisis hubungan antara curah hujan bulanan dengan data luaran GCM.
37
Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
Daftar Pustaka
Johnson, R.A and Wichern, D.W. (1998). Applied Multivariate Statistical Analysis. 5th Ed. New Jersey: Prentice Hall. Jolliffe, I.T. (1986). Principal Component Analysis, Second Ed. New York: Springer-Verlag. Khotimah, K, Sutikno, Otok, W.B (2009). “ Reduksi Dimensi Robust Dengan Estimator MCD Untuk Pra- Pemrosesan Data Pemodelan Statistical Downscaling”. Prosiding Seminar Nasional Matematika dan Pendidikan Matematika 8 Agustus 2009 UNESA . Surabaya. Manorang Y, Sutikno, Setiawan, Otok WB, (2009). “Analisis Komponen Utama Kernel Untuk Pra Pemrosesan Pemodelan Statistical Downscaling”. Prosiding Seminar Nasional Matematika dan Pendidikan Matematika 8 Agustus 2009 UNESA . Surabaya. Sutikno. (2008). “Statistical Downscaling Luaran GCM dan Pemanfaatannya untuk Peramalan Produksi Padi” Disertasi. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Wigena, A.H. (2006). “Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan” Disertasi. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Zorita, E. and von Storch, H., (1999): “The analog method as a simple statistical downscaling technique: comparison with more complicated method”, Journal of Climate, 12, 24742489.
38
Jurnal Konvergensi Vol. 3, No. 2, Oktober, 2013
Profil Penulis Ferry Kondo Lembang Pada Tanggal 16 Februari 1984, Penulis dilahirkan di Kota Ambon sebagai anak ketiga dari empat bersaudara. Pendidikan formal penulis berawal di TK Efata Hative Kecil Kota Ambon selama satu tahun, dilanjutkan pada SDN 2 Hative Kecil Kota Ambon. SLTP negeri 3 Ambon merupakan lanjutan pendidikan formal penulis setelah menamatkan pendidilan di Sekolah Dasar. Pada Tahun 2001, setelah lulus dari SMA Negeri 5 Ambon, penulis melanjutkan pendidilan S1 di Jurusan Matematika UNPATTI. Setelah lulus S!, pada tahun 2008 penulis melanjutkan pendidikan pada Strata 2 (S2) pada Jurusan Statistika ITS Surabaya. Sampai sekarang penulis berstatus Dosen tetap pada jurusan matematika FMIPA UNPATTI dengan mengampuh beberapa mata kuliah Statistika diantaranya Metode Statistika, Statistika Matematika 1, dan Analisis Multivariat.
39