PEMANFAATAN METODE GEOGRAPHICALLY WEIGHTED REGRESSION (GWR) UNTUK MERAMALKAN DEBIT PUNCAK PADA DAERAH ALIRAN SUNGAI Nur Atikah* Abstrak : Debit puncak daerah aliran sungai dipengaruhi beberapa faktor, salah satu faktor yang mempengaruhi adalah faktor posisi geografis. Analisis regresi merupakan salah satu analisis untuk menentukan tingkat pengaruh suatu variabel independen dan variabel dependen. Masalah utama dari metode ini adalah jika metode ini diterapkan pada data spasial. Mengatasi permasalahan pada data spasial, metode statistik yang akan digunakan adalah Geographically Weighted Regression (GWR), yaitu model yang menggunakan faktor geografis sebagai variabel independen yang dapat mempengaruhi variabel dependen. Kata kunci : Regresi, Data Spasial, Geographically Weighted Regression (GWR)
PENDAHULUAN Beberapa tahun terakhir terjadi perubahan iklim dan cuaca yang tidak menentu sehingga menyebabkan musim hujan maupun musim kemarau sulit untuk diprediksi. Perubahan iklim menyebabkan perubahan pola curah hujan, sehingga sewaktu-waktu intensitas hujan bisa sangat tinggi dan terkadang juga bisa rendah. Intensitas hujan yang sangat tinggi sering menyebabkan bencana banjir, sedangkan intensitas hujan yang rendah serta berkepanjangan dapat menyebabkan bencana kekeringan. Bencana banjir hampir setiap musim penghujan melanda sebagian besar wilayah Indonesia terutama di wilayah perkotaan yang padat penduduk dan wilayah dekat Daerah Aliran Sungai (DAS). Berdasarkan nilai kerugian dan frekuensi kejadian bencana banjir terlihat adanya peningkatan yang cukup berarti dari
infiltrasi (penyerapan) dan evepotranspirasi (penguapan), sehingga nilai debit aliran permukaan menjadi lebih besar daripada kapasitas angkut debit air pada sistem drainase (alami maupun buatan). Nilai kapasitas angkut yang lebih kecil ini menyebabkan air meluap dari tanggul dan menggenangi daerah sekitarnya. Pengelolaan Daerah Aliran Sungai (DAS) yang tidak optimal menjadi salah satu penyebab utama. Daerah Aliran Sungai (DAS) merupakan suatu wilayah tempat mengumpulnya air hujan dan mengalirkan aliran sungai. Asdak (2002) menyatakan bahwa DAS merupakan wilayah daratan yang secara topografik dibatasi oleh punggung-punggung gunung yang menampung dan menyimpan air hujan untuk kemudian menyalurkannya ke laut melalui sungai utama, atau dikenal sebagai daerah tangkapan air (catchment area).
tahun ke tahun. Banjir dapat diartikan sebagai suatu keadaan dimana tinggi muka air sungai (atau debit sungai) melebihi suatu batas yang ditetapkan oleh suatu kepentingan tertentu. Banjir merupakan hasil
Menurut Sosrodarsono dan Takeda (1985), aliran sungai tergantung dari berbagai faktor. Salah satu faktor aliran sungai berhubungan dengan limpasan, yang dibagi dua elemen, yaitu elemen-
rusaknya kesetimbangan air akibat berkurangnya nilai
elemen meteorologi dan elemen-elemen daerah
* Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Malang
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
1
Pemanfaatan Metode Geographically Weighted Regression (GWR) Untuk ......
pengaliran yang menyatakan sifat-sifat fisik DAS seperti: luas, penggunaan lahan, kondisi topografi, jenis tanah, karakteristik jaringan sungai, dan lainlain. Debit puncak merupakan aliran limpasan maksimum pada saat terjadi hujan dan menjadi salah satu indikator kekuatan hujan yang berguna untuk prediksi besarnya sedimentasi. Semakin luas DAS maka semakin lama limpasan mencapai titik pengukuran dan debit puncak semakin berkurang. Analisis regresi merupakan salah satu analisis yang paling populer dan luas pemakaiannya. Regresi adalah salah satu metode untuk menentukan tingkat pengaruh suatu variabel independen dan variabel dependen. Data spasial merupakan data pengukuran dengan pengamatan di suatu lokasi yang bergantung pada pengamatan di lokasi lain yang berdekatan (neighboring). Cressie (1993) menyatakan bahwa data spasial merupakan salah satu jenis data dependen, karena data dikumpulkan dari lokasi spasial berbeda yang mengindikasikan terdapatnya ketergantungan antara pengukuran data dengan lokasi. Jika metode regresi diterapkan pada data spasial dengan metode Ordinary Least Square (OLS) untuk mengestimasi parameter model regresi dengan asumsi error identik independen dan berdistribusi normal, maka akan diperoleh suatu model taksiran untuk semua data. Hal inilah yang menyebabkan ketidaksesuaian model pada data spasial karena pada analisis regresi diasumsikan bahwa lokasi geografis tidak mempengaruhi respon model. Asumsi ini bisa menyebabkan kesimpulan yang salah dan menghasilkan error autokorelasi spasial. Metode lain yang bisa digunakan adalah Geographically Weighted Regression (GWR), yaitu metode yang menggunakan faktor geografis sebagai variabel bebas yang dapat mempengaruhi variabel respon (Fotheringham, et al, 2002). Metode GWR
2
dapat diterapkan dalam berbagai bidang, salah satunya untuk meramalkan debit puncak air.
MODEL REGRESI Persamaan regresi yang biasa didefinisikan dengan menggunakan metode pendugaan parameter Ordinary Least Square (OLS), secara umum dapat dituliskan: p
yi 0 k xik i
(1)
k 1
IID i
2
~ N (0, e )
i = 1, 2, ... , n, k = 1, 2, ... , p dengan 0 , 1 ,..., p adalah parameter model. Pada model ini, hubungan antara variabel independen dan variabel dependen dianggap sama pada setiap lokasi geografis. Dalam bentuk matriks ditulis sebagai berikut: Y = Xβ + ε
y1 1 x11 1 y 2 x 21 y n 1 x n1
x1 p 0 1 x 2 p 1 2 x np p n
Pendugaan
dilakukan dengan menggunakan
metode OLS dengan meminimumkan jumlah kuadrat error. Estimator dari parameter model didapat dari persamaan 1 βˆ XT X XT Y
(2)
dengan 1 x11 T X x1 p
1 x 21 x2 p
1 x n1 x np
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
Pemanfaatan Metode Geographically Weighted Regression (GWR) Untuk ......
βˆ X
Y
: :
:
vektor dari parameter yang ditaksir berukuran n x (p+1) matrik data berukuran n x (p+1) dari variabel
tiap wilayah geografis, maka model GWR adalah model global. Artinya tiap-tiap wilayah geografis
independen yang elemen pada kolom pertama bernilai 1
mempunyai model yang sama. Hal ini merupakan kasus spesial dari GWR. Pada model GWR diasumsikan bahwa data
vektor observasi dari variabel dependen berukuran (n x 1).
MODEL GEOGRAPHICALLY WEIGHTED REGRESSION (GWR) Metode GWR adalah suatu teknik yang membawa kerangka dari model regresi sederhana menjadi model regresi yang terboboti (Fotheringham dkk, 2002). Model ini merupakan model regresi linier lokal (locally linier regression) yang menghasilkan penaksir parameter model yang bersifat lokal untuk setiap titik atau lokasi dimana data tersebut dikumpulkan. Pada model GWR, variabel dependen diprediksi dengan variabel independen yang masingmasing nilai parameter regresinya bergantung pada lokasi dimana data tersebut diamati. Model GWR dapat ditulis sebagai berikut : p
y i 0 ui , vi k ui , vi xik i k 1
(3)
dengan yi
Jika nilai parameter regresi konstan pada tiap-
= pengamatan pada lokasi ke-i (i = 1, 2, ... , n)
xik = nilai observasi variabel independen k pada pengamatan ke-i (ui ,vi ) =koordinat (longitude, latitude) dari titik ke-i pada suatu lokasi geografis. bk (ui ,vi ) = parameter regresi pada titik ke-i
i = error yang diasumsikan identik, independen, dan berdistribusi Normal dengan mean nol dan variansi konstan e 2 .
observasi yang dekat dengan titik ke-i mempunyai pengaruh yang besar pada estimasi dari bk (ui ,vi ) daripada data yang berada jauh dari titik ke-i. Persamaan di atas mengukur hubungan model pada semua titik ke-i. Pada GWR sebuah observasi diboboti dengan nilai yang berhubungan dengan titik ke-i. Bobot wij, untuk j = 1, 2, . . . , n, pada tiap lokasi (ui ,vi) diperoleh sebagai fungsi yang kontinu dari jarak antara titik ke-i dan titik data lainnya. Misal matriks berikut merupakan matriks dari lokal parameter
β 0 u1 , v1 β 1 u1 , v1 ... β p u1 , v1 . . . . . . B . . . β 0 u n , vn β 1 u n , vn ... β p u n , vn
(4)
Estimasi tiap baris menggunakan persamaan berikut ˆ (i ) X W (i )X X W (i )Y T
1
T
(5)
dengan: X
= matrik data dari variabel independen
Y
= vektor variabel dependen
W(i) = matriks pembobot = diag [wi1, wi2, ... , win] .
(6)
Estimasi dari persamaan (5) merupakan estimasi least square tetapi matriks pembobot tidak konstan, sehingga W(i) dihitung untuk tiap i dan wij mengindikasikan kedekatan atau bobot tiap titik data dengan lokasi i. Hal ini yang membedakan GWR dengan tradisional WLS (Weighted Least Square) yang mempunyai matrik bobot yang konstan.
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
3
Pemanfaatan Metode Geographically Weighted Regression (GWR) Untuk ......
Selain menghasilkan estimasi parameter lokal untuk tiap-tiap lokasi geografis, GWR juga menghasilkan versi lokal untuk seluruh standar regression pada seluruh lokasi geografis misalnya ukuran goodness of fit. Hal ini dapat memberikan informasi pada pemahaman aplikasi dari model dan untuk penelitian lebih lanjut apakah diperlukan penambahan variabel independen pada model GWR. Hal yang penting lainnya adalah titik dimana parameter lokal diestimasi dengan model GWR tidak memerlukan titik dimana data diambil. Estimasi dari parameter dapat didapat dari semua lokasi geografis. Peran pembobot pada model GWR sangat penting karena nilai pembobot ini mewakili letak data observasi satu dengan lainnya. Oleh karena itu, sangat dibutuhkan ketepatan cara pembobotan (Chasco dkk, 2007). Skema pembobotan pada GWR dapat menggunakan beberapa metode yang berbeda, salah satu metode pembobotan yang biasa digunakan adalah kernel Gaussian dan fungsi pembobotan bisquare (Bocci dkk, 2006). Fungsi Gaussian untuk menghitung titik ke-n yang terdekat adalah
d ij / b W ij exp 2
2
(7)
dengan: j
= salah satu titik ke-n yang terdekat dari titik ke- i
b
=
dij = =
jarak titik ke-n yang terdekat merupakan jarak Euclidean
(u i u j ) 2 (v i v j ) 2 .
2
n
CV yi yˆ i* (b)
(8)
i 1
dengan i*
i dan yˆ i* (b) adalah nilai dugaan untuk
yi dengan pengamatan pada titik ke-i diabaikan dalam proses penaksiran.
UJI GOODNESS OF FIT MODEL GWR Uji hipotesis yang pertama dilakukan adalah pengujian model secara serentak untuk menguji signifikansi dari faktor geografis yang merupakan inti dari model GWR. Bentuk hipotesisnya adalah: Hipotesis: H0 :
k (u i , vi ) k
k 1, 2, ..., p
(tidak ada pengaruh faktor geografis pada model) H1 :
paling tidak ada satu k (ui , vi ) k (ada pengaruh faktor geografis pada model)
Statistik uji model GWR, berdasar pada uji F, yang dapat digunakan untuk membandingkan model GWR dan model regresi global. Uji ini berdasarkan hasil SSE dibagi dengan banyak derajat bebas yang efektif yang mendekati distribusi 2 dengan derajat bebas banyak derajat bebas yang efektif. Secara matematis dituliskan sebagai berikut: F
SSE0 / n ( p 1) SSE0 / df1 SSE1 / n 2tr (S ) tr (S T S ) SSE1 / df 2
(9)
Tolak H0 jika Fhit > Fá;(df1;df2) atau P_value < á. Setelah melakukan pengujian model secara
Kriteria untuk penentuan nilai n yang tepat dapat diperoleh dengan pendekatan least square yaitu dengan menggunakan kriteria cross-validation
serentak, selanjutnya dilakukan pengujian parameter secara parsial. Pengujian ini untuk mengetahui parameter mana saja yang signifikan mempengaruhi variabel independennya. Bentuk hipotesisnya adalah sebagai berikut:
4
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
Pemanfaatan Metode Geographically Weighted Regression (GWR) Untuk ......
Untuk menjaga akurasi hasil yang diperoleh,
Hipotesis: H0 : k (u i , vi) 0 , k = 1, 2, ..., p H1 : paling tidak ada satu k (ui , vi ) yang tidak bernilai 0 Uji ini berdasarkan penaksir parameter yang dibagi dengan SE df 2 . Secara matematis dituliskan sebagai berikut:
t
ˆ k (u i , vi )
(10)
SE ( ˆ k (u i , vi ))
Jika diberikan level keyakinan sebesar á, maka keputusan diambil dengan menolak H0 jika nilai t hitung t ( 2 ,df ) , dimana t ( 2 ,df ) didapat dari t tabel.
maka perlu dilakukan beberapa tahapan uji asumsi model. Uji asumsi model dilakukan untuk menjawab sah atau tidaknya suatu model regresi yang akan dipakai sebagai model penjelas bagi pengaruh antar variabel. Beberapa asumsi yang dibutuhkan dalam model regresi diantaranya varian homogen (homoskedastisitas), tidak ada autokorelasi antar error (independensi), dan error mengikuti distribusi normal. Apabila asumsi-asumsi sudah terpenuhi, selanjutnya dilakukan pengujian parameter model yaitu pengujian parameter secara serentak dan pengujian parameter secara parsial.
2
2
Pengujian parameter model dengan uji serentak. Bentuk hipotesisnya adalah: PEMBAHASAN
Hipotesis:
Faktor-faktor yang mempengaruhi debit puncak air antara lain panjang sungai, rata-rata curah hujan, dan kemiringan sungai. Sebelum menggunakan GWR untuk analisis data, terlebih dahulu menggunakan model regresi untuk menganalisis data. Hasil persamaan regresi diasumsikan sama dan diberlakukan untuk semua wilayah pada Daerah Aliran Sungai. Secara umum, model regresi antara debit puncak dan faktor-faktor yang mempengaruhinya adalah:
H0 :
0 1 2 3 0
H1 :
Minimal ada 1 parameter model ( 0 , 1 , 2 atau 3 ) yang tidak bernilai 0
y
=
Panjang +
Hujan + 3 Miring +
Model regresi yang layak digunakan dapat dilihat dari nilai R 2 . Nilai R 2 dikalikan 100% menunjukkan persentase keragaman di dalam variabel Y yang dapat diberikan oleh model regresi yang didapatkan. Semakin besar nilai R2, semakin baik model regresi yang diperoleh.
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
Uji ini menggunakan uji F dengan daerah penolakan H0 H0 adalah F hitung F ( ;df ,df ) . Apabila H0 ditolak, maka model regresi yang diperoleh dapat digunakan. Setelah dilakukan pengujian parameter model dengan uji serentak, selanjutnya dilakukan pengujian parameter model dengan uji parsial. 1
2
Bentuk hipotesisnya adalah:
=0 H1 : 0dimana j = 0, 1, 2, 3 H0 :
j
j
Uji parsial menggunakan uji t dengan daerah penolakan H0 adalah jika nilai t hitung t ( 2 , df ) , dimana t ( 2 ,df ) didapat dari t tabel. Apabila H0 2
2
ditolak, maka variabel independen memiliki kontribusi yang signifikan terhadap variabel dependen.
5
Pemanfaatan Metode Geographically Weighted Regression (GWR) Untuk ......
Selanjutnya dilakukan analisis dengan model GWR. Langkah-langkah untuk membangun model
Model yang digunakan dalam menduga parameter GWR adalah :
GWR adalah dengan memilih bandwidth optimum, menentukan pembobot, penaksiran parameter dan pengujian hipotesis. Penaksiran parameter model GWR diperoleh dengan memasukkan pembobot
Debit(i)= u , v + u , v Panjang(i)
spasial dalam perhitungannya. Jika pembobot yang digunakan adalah fungsi kernel maka pemilihan bandwidth ini sangatlah penting, karena bandwidth
Setelah diperoleh hasil estimasi baik model GWR dan regresi OLS, selanjutnya melakukan uji parameter model secara serentak dengan menggunakan statistik
merupakan pengontrol keseimbangan antara kesesuaian kurva terhadap data dan kemulusan data.
uji F. Adapun bentuk hipotesisnya adalah:
Salah satu metode yang digunakan untuk menentukan bandwidth optimum adalah metode Cross Validation (CV) (Fotheringham dkk, 2002). Bandwidth yang optimum diperoleh dengan meminimumkan Persamaan (8). Bandwidth optimum merupakan besarnya radius sehingga setiap titik pengamatan yang berada dalam radius tersebut dianggap memiliki pengaruh yang signifikan dalam menduga parameter GWR pada titik ke-i. Langkah awal mendapatkan matriks pembobot adalah dengan mencari jarakeuclide lokasi
ui , vi
ke semua lokasi penelitian. Matriks pembobot yang terbentuk dengan fungsi Gauss di lokasi ke-i dan nilai bandwidth tertentu dapat ditulis sebagai berikut:
d ij / b W ij exp 2
2
1 βˆ (ui , vi ) X T W(u i , vi )X X T W(ui , vi )Y
i
1i
i
i
+ 2i ui , vi Hujan(i) + u , v Miring(i)+ i 3i
i
i
H0 : k (ui , vi ) k , k = 0, 1, 2, 3 H1 : paling tidak ada satu k (ui , vi ) k Setelah dilakukan uji parameter model secara serentak, maka perlu dilakukan pengujian parameter model secara parsial. Pengujian parameter model secara parsial dimaksudkan untuk mengetahui faktorfaktor yang berpengaruh terhadap tinggi debit puncak di setiap lokasi. Bentuk hipotesisnya adalah:
H0 : H1 : Identifikasi bahwa model GWR merupakan model yang lebih baik daripada model OLS dalam menjelaskan hubungan variabel dependen dengan variabel independen, dilakukan pengujian secara global dengan menggunakan ANOVA. Nilai p yang besarnya kurang dari 5% menyatakan bahwa model GWR lebih baik dalam menjelaskan hubungan variabel dependen dengan variabel independen dibandingkan model OLS.
Matriks pembobot ini nantinya digunakan untuk menaksir parameter di lokasi menggunakan rumus:
i
0i
dengan
Salah satu indikator model yang lebih baik adalah yang menghasilkan nilai MSE terkecil. Apabila nilai MSE pada model GWR lebih kecil daripada nilai MSE pada model OLS, dapat disimpulkan bahwa model yang dihasilkan dengan metode GWR merupakan model yang lebih baik daripada model OLS.
6
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
Pemanfaatan Metode Geographically Weighted Regression (GWR) Untuk ......
DAFTAR PUSTAKA Asdak, C. 2002. Hidrologi dan Pengelolaan Daerah Aliran Sungai. Gajah Mada University Press. Yogyakarta.
Draper, N.R., Smith, H. 1998. Applied Regression Analysis. 3th ed. John Wiley & Sons, Inc. United States of America.
Bocci, C., Petrucci, A., dan Rocco, E. 2006. An
Fotheringham, A.S., Brundson, C., dan Charlton, M.
Application of Geographically Weighted Regression to Agricultural Data for Small Area Estimates. Dipartimento di Statistica “G. Parenti”. Universita degli Studi di Firenze, Italy.
2002. Geographically Weighted Regression: the analysis of spatially varying relationships. John Wiley & Sons Ltd, England.
Casella, G. dan Berger, R.L. 1990. Statistical Inference. Wadsworth, Inc. California. Chasco, C., Garcia, I., dan Vicens, J. 2007. Modeling spatial variations in household disposable income with Geographically Weighted Regression. Munich Personal RePEc Archive Paper No. 1682. Cressie, N.A.C. 1991. Statistics For Spatial Data. John Wiley & Sons, Inc. United States of America.
Magistra No. 87 Th. XXVI Maret 2014 ISSN 0215-9511
Kutner, M.H., Nachtsheim, C.J., dan J. Neter, J. 2004. Applied Linear Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc. Leung, Y. 2000. Statistical Tests for Spatial NonStationarity Based on the Geographically Weighted Regression Model. Journal, The Chinese University of Hong Kong, Hong Kong. Sosrodarsono, S. dan K. Takeda. 1985. Hidrologi untuk Pengairan. PT Pradnya Paramita. Jakarta.
7