Seminar Hasil
PENENTUAN MATRIKS PEMBOBOT YANG OPTIMUM PADA PEMODELAN GEOGRAPHICALLY WEIGHTED REGRESSION (Studi Kasus Penyusunan Model Kemiskinan di Jawa Tengah) Oleh : Iwan Fajar Prasetyawan 1309201719 Pembimbing: Dr. Sutikno, S.Si., M.Si. Dr. Ir. Setiawan, M.S.
Latar Belakang • GWR adalah salah satu metode yang cukup efektif untuk mengestimasi data yang memiliki spatial heterogeneity • Penghitungan parameter pada metode GWR memerlukan adanya matriks pembobot • Penggunaan fungsi pembobot tersebut masih bersifat trial and error • Penelitian mengenai fungsi pembobot yang terbaik untuk menghasilkan matriks pembobot yang optimum sampai saat ini masih terbatas 2
1
Latar Belakang (2) • Kemiskinan merupakan suatu fenomena spatial heterogeneity • Variasi geografis dalam adanya kemiskinan dan besarnya tingkat kemiskinan sering disebabkan oleh faktorfaktor dengan dimensi spasial • Kemiskinan di Jawa Tengah lebih tinggi daripada kemiskinan secara nasional
3
Rumusan Masalah Perlu dikaji bagaimana mendapatkan fungsi pembobot yang digunakan untuk membentuk matriks pembobot yang optimum dalam menghasilkan model yang terbaik pada pemodelan GWR
4
2
Tujuan Penelitian • Menyusun algoritma dan program untuk mendapatkan matriks pembobot yang optimum pada pemodelan GWR. • Menerapkan algoritma dan program yang telah disusun untuk memodelkan kemiskinan di Jawa Tengah dan mendapatkan matriks pembobot yang optimum pada data kemiskinan di Jawa Tengah. 5
Tinjauan Pustaka Model GWR: p
y i = β 0 (u i , vi ) + ∑ β j (u i , vi ) xij + ε i ;
i = 1, ... , n
j =1
adalah nilai variabel dependen pada pengamatan ke-i, adalah nilai variabel independen ke-i pada pengamatan ke-j, β 0 (u i , vi ) adalah konstanta/intercept pada pengamatan ke-, β j (u i , vi ) adalah nilai fungsi variabel independen pada pengamatan ke-i, p adalah jumlah variabel independen, (u i ,v i ) adalah titik kordinat lokasi pengamatan ke-i, dan ε adalah random error yang diasumsikan berdistribusi normal T ε = (ε 1 , ε 2 ,..., ε n ) yi xij
6
3
Estimasi Koefisien Regresi Lokal Memberikan pembobot yang berbeda pada setiap lokasi pengamatan
(
βˆ (u i , vi ) = X T W (u i , vi ) X
(
βˆ (u i , vi ) = βˆi 0 , βˆi1 , βˆi 2 ,..., βˆip
)
−1
X T W (u i , v i ) y
) adalah vektor koefisien regresi T
lokal dan W(u , v ) adalah matriks diagonal dengan elemen pada diagonalnya merupakan pembobot geografis pada setiap data untuk lokasi pengamatan ke-i, dan elemen lainnya merupakan angka nol i
i
7
Estimasi Koefisien Regresi Lokal (2) ⎡ β 0 (u1 , v1 ) β1 (u1 , v1 ) ⎢ β (u , v ) β (u , v ) 0 2 2 1 2 2 β=⎢ ⎢ M M ⎢ ⎢⎣ β 0 (u n , v n ) β1 (u n , v n )
(
βˆ (i ) = X T W (i ) X ⎡ wi1 ⎢0 W(i ) = ⎢ ⎢ M ⎢ ⎣0
)
L β p (u1 , v1 ) ⎤ L β p (u 2 , v 2 ) ⎥⎥ ⎥ O M ⎥ L β p (u n , v n )⎥⎦
−1
X T W(i )y
⎤ ⎥ ⎥ ⎥ ⎥ L win ⎦
0 L wi 2 L M O 0
0 0 M
8
4
Fungsi Pembobot Fungsi kernel fixed: • Fungsi kernel Gaussian ⎡ 1 ⎛ d ij wij = exp⎢− ⎜⎜ ⎢⎣ 2 ⎝ h
⎞ ⎟⎟ ⎠
2
⎤ ⎥ ⎥⎦
• Fungsi kernel Bisquare ⎧⎪[1 − (d ij / h) 2 ] 2 , wij = ⎨ , ⎪⎩0
untuk d ij < h untuk lainnya
9
Fungsi Pembobot (2) Fungsi kernel fixed memiliki bandwidth yang sama pada setiap lokasi pengamatan
X : lokasi pengamatan ke-i (regression point) ● : lokasi pengamatan lainnya (data point) GWR dengan kernel fixed (Fotheringham, 2002) 10
5
Penentuan Bandwidth Menggunakan metode Cross Validation n
2 CV = ∑ [ y i − yˆ ≠i (h )] i =1
dimana yˆ ≠i (h ) adalah nilai prediksi (fitted value) dengan pengamatan ke-i dikeluarkan dari proses prediksi
11
Penentuan Bandwidth (2) Bandwidth yang optimum diperoleh jika nilai CV yang dihasilkan adalah yang paling minimum. Proses untuk mendapatkan bandwidth yang meminimumkan nilai CV bisa dilakukan dengan menggunakan teknik Golden Section Search. 12
6
Sumber Data Data yang digunakan adalah data kemiskinan hasil Survei Sosial Ekonomi Nasional (Susenas) 2009 di Jawa Tengah yang bersumber dari Badan Pusat Statistik. Unit observasi adalah kabupaten/kota di Jawa Tengah, yaitu sebanyak 35 kabupaten/kota. Variabel-variabel yang digunakan diperoleh dari Studi Penentuan Kriteria Penduduk Miskin tahun 2000. 13
Variabel Penelitian Variabel yang digunakan: Y : persentase penduduk miskin X1 : persentase rumahtangga yang memiliki luas lantai < 8 m2 X2 : persentase rumahtangga yang memiliki lantai dengan jenis lantai terluas berupa tanah X3 : persentase rumahtangga yang menggunakan air minum yang bersumber dari air hujan atau sumur tidak terlindung X4 : persentase rumahtangga yang tidak memiliki jamban/WC X5 : persentase rumahtangga yang memiliki pendapatan < Rp. 500.000,- per bulan X6 : persentase rumahtangga yang persentase pengeluaran untuk makanan > 80% X7 : persentase rumahtangga yang tidak mengkonsumsi lauk pauk berupa daging/ikan/telur/ayam atau mengkonsumsi tapi tidak bervariasi
14
7
Tahapan Analisis 1. Menyusun algoritma & program untuk mendapatkan matriks pembobot yang optimum pada pemodelan GWR: • Penentuan triplet bandwidth untuk digunakan pada teknik Golden Section Search. • Penentuan nilai bandwidth yang dapat meminimumkan nilai CV menggunakan teknik Golden Section Search. • Estimasi parameter menggunakan bandwidth yang diperoleh. 2. Menentukan fungsi pembobot yang dapat membentuk matriks pembobot yang optimum pada pemodelan kemiskinan di Jawa Tengah menggunakan GWR.
15
Analisis dan Pembahasan • Menyusun algoritma & program untuk mendapatkan matriks pembobot yang optimum pada pemodelan GWR: • Menentukan fungsi pembobot yang dapat membentuk matriks pembobot yang optimum pada pemodelan kemiskinan di Jawa Tengah menggunakan GWR.
16
8
Penyusunan Algoritma & Program (1) 1. Menentukan triplet bandwidth yang akan digunakan pada teknik Golden Section Search. • Menentukan jarak antar lokasi pengamatan menggunakan fungsi jarak Euclidean • Menentukan jarak maksimum dan minimum antar lokasi pengamatan serta menentukan nilai tengahnya yang digunakan sebagai triplet bandwidth
17
Flowchart 1
18
9
Penyusunan Algoritma & Program (2) 2. Menentukan nilai bandwidth yang dapat meminimumkan nilai CV menggunakan teknik Golden Section Search. • Menentukan nilai bandwidth baru untuk mengevaluasi triplet bandwidth yang sudah ada. • Membentuk matriks pembobot dari masingmasing nilai bandwidth. • Menentukan nilai CV dari masing-masing nilai bandwidth. • Membandingkan nilai CV dari masing-masing bandwidth untuk menentukan triplet bandwidth yang baru. 19
Flowchart 2
20
10
Penyusunan Algoritma & Program (3) 3. Menerapkan bandwidth yang dihasilkan untuk mengestimasi parameter GWR • Membentuk matriks pembobot. • Mengestimasi parameter GWR dan menghitung nilai R2 yang dihasilkan.
21
Flowchart 3 start h; d(i,j); m=1; i=1; j=1; bdwt=h; wt(i,j) = exp(-0.5*d(i,j).^2/bdwt.^2);
j≤n
ya
j=j+1;
ya
i=i+1;
tidak i≤n tidak nzip = find(wt(i,j) >= 0.0); ys = y(nzip,1).*wt(nzip,j); xs = x(nzip,:).*wt(nzip,j); xstemp=xs'*xs; xpxi = inv(xstemp); b = xpxi*xs'*ys; yhatv=xs*b; yhat(i,1) = x(i,:)*b; resid(i,1) = y(i,1) - yhat(i,1); e = ys - yhatv; nadj = length(nzip); sige = (e'*e)/nadj; sdb = sqrt(sige*diag(xpxi)); bsave(i,:) = b'; ssave(i,:) = sdb'; sigv(i,1) = sige;
j≤n
ya
j=j+1;
ya
i=i+1;
tidak i≤n tidak result.bwidth=bdwt; result.beta=bsave; result.yhat=yhat; result.resid=resid; sigu = resid'*resid; ym = y - mean(y); rsqr1 = sigu; rsqr2 = ym'*ym; result.rsqr = 1.0 - rsqr1/rsqr2; result.bwidth; result.beta; result.yhat; result.resid; result.rsqr; stop
22
11
Penyusunan GUI
23
Deskripsi Kemiskinan Jateng
Persentase Rumahtangga miskin
24
12
Bandwidth Bandwidth yang dihasilkan yang dapat meminimumkan nilai CV menggunakan teknik Golden Section Search Fungsi
Bandwidth
Nilai CV
Kernel Gaussian
0.94022
4.9917
Kernel Bisquare
0.64861
4.9605
25
Bandwidth & Nilai CV 5.7
5.14
5.6
5.12 5.1
5.5
5.08 5.4 CV
CV
5.06 5.3
5.04
5.2 5.02 5.1
5
5 4.9 0.7
4.98
0.8
0.9
1
1.1 bandwidth
1.2
1.3
Fungsi kernel Gaussian
1.4
1.5
4.96 0.55
0.6
0.65
0.7
0.75 bandwidth
0.8
0.85
0.9
0.95
Fungsi kernel Bisquare
26
13
Ringkasan Nilai Dugaan Parameter Fungsi kernel Gaussian Koefisien
Rataan
Standar Deviasi
Min
Max
Range
b0
1.24565
1.65577
-2.04252
4.39710
6.43962
b1
-1.99069
2.46249
-6.12053
1.05095
7.17147
b2
0.13307
0.20319
-0.05608
0.63437
0.69045
b3
-0.04991
0.04907
-0.11401
0.05313
0.16713
b4
0.25058
0.10433
0.06949
0.40848
0.33899
b5
-0.06807
0.92005
-1.32159
0.84468
2.16627
b6
0.14901
0.73347
-1.21940
1.72256
2.94196
b7
0.26068
0.14711
0.02380
0.50484
0.48104
27
Ringkasan Nilai Dugaan Parameter Fungsi kernel Bisquare Koefisien
Rataan
Standar Deviasi
Min
Max
Range
b0
1.34066
2.10543
-4.11599
4.08941
8.20540
b1
-1.89215
2.72322
-8.36902
1.21672
9.58573
b2
0.14660
0.25248
-0.05073
0.80194
0.85267
b3
-0.05325
0.04368
-0.10512
0.05990
0.16501
b4
0.25874
0.11820
0.06205
0.49081
0.42876
b5
-0.02341
0.95114
-1.81068
0.84619
2.65687
b6
0.08170
0.84198
-1.58398
1.15391
2.73789
b7
0.24587
0.14152
0.02687
0.50910
0.48223
28
14
Perbandingan Model
Model
R2
GWR dengan fungsi kernel Gaussian
0.9234
GWR dengan fungsi kernel Bisquare
0.8933
29
Kesimpulan • Algoritma dan program yang telah disusun dapat digunakan untuk mendapatkan matriks pembobot yang optimum pada pemodelan GWR. • Penyusunan GUI menggunakan fasilitas GUIDE yang ada di Matlab 7.01 dapat mempermudah interaksi antara pengguna dengan program tersebut. • Pada pemodelan kemiskinan di Jawa Tengah, diperoleh bahwa fungsi pembobot kernel Gaussian dapat membentuk matriks pembobot yang optimum. 30
15
Saran • Disarankan adanya penelitian lebih lanjut menggunakan fungsi pembobot lainnya • Disarankan adanya penyusunan aplikasi GUI yang lebih interaktif dan makin mempermudah pengguna
31
Daftar Pustaka Alemu, B. (2006), “Geography of Small-holder’s Commercialization: The Case of Food Grains in Ethiopia”, International Food Policy Research Institute, Washington, DC, USA and Ethiopian Development Research Institute, Addis Ababa, Ethiopia. Anselin, L. (1988), “Spatial Econometrics: Methods and Models”, Kluwer Academic Publishers, Dordrecht. Brunsdon, C., Fotheringham, A.S., Charlton, M. (1998), “Geographically weighted regression: a method for exploring spatial nonstationarity”, Geographical Analysis 28, 281-298. Charlton, M., Fotheringham, A.S. (2009), “Geographically weighted regression: White Paper”, National Centre for Geocomputation. Chasco, C., Garcia, I., Vicens, J. (2007), “Modeling spatial variations in household disposable income with Geographically Weighted Regression”, MPRA (Munich Personal RePEC Archive) Paper No. 1682, posted 12 February 2007/14:56. Chatterjee, S. dan Hadi, A.S. (2006), “Regression Analysis by Example”, Fourth Edition, John Wiley & Sons, Inc., New Jersey. Eckey, H.F., Kosfeld, R., Türck, M. (2005), “Regional Convergence in Germany. A Geographically Weighted Regression Approach”, Fachbereich Wirtschaftswissenschaften, Volkswirtschaftliche Diskussionsbeiträge. Erenstein, O., Hellin, J., Chandna, P. (2010), “Poverty mapping based on livelihood assets: A meso-level application in the Indo-Gangetic Plains, India”, Applied Geography 30 (2010) 112-125. 32
16
Daftar Pustaka (2) Farber, S. (2007), “A Systematic Investigation of Cross-Validation in GWR Model Estimation: Empirical Analyis and Monte Carlo Simulations”, Journal of Geographic System (2007) 9:371-398. Fotheringham, A.S., Brunsdon, C., Charlton, M. (2002), “Geographically Weighted Regression: the analysis of spatially varying relationships”, John Wiley & Sons, Ltd., West Sussex, England. Jordan, L.M. (2006), “Religion and Demography in The United States: A Geographic Analysis”, Thesis, Colorado: University of Colorado. Kafadar, K. (1996), “Smoothing Geographical Data, Particularly Rates of Disease”, Statistics in Medicine, vol 15, 2539-2560. Keser, S. (2010), “Investigation of the Spatial Relationship of Municipal Solid Waste Generation in Turkey With Socio-Economic, Demographic and Climatic Factors”, Thesis, Middle East Technical University. Mennis, J.L., Jordan, L. (2005), “The Distribution of Environmental Equity: Exploring Spatial Nonstationarity in Multivariate Models of Air Toxic Releases”, Annals of the Association of American Geographers 95 (2), 2005, pp. 249-268. Mittal, V., Kamakura, W.A., Govind, R. (2004), “Geographic Patterns in Customer Service and Satisfaction: An Empirical Investigation”, Journal of Marketing vol. 68 (July 2004), 48-62.
33
Daftar Pustaka (3) Patridge, M.D., Rickman, D.S., Ali, K., Olfert, M.R. (2006), “The Geographic Diversity of U.S. Nonmetropolitan Growth Dynamics: A Geographically Weighted Regression Approach”, 53rd Annual Meetings of the North American Regional Science Association, Toronto, Ontario. Rawlings, J.O., Pantula, S.G. dan Dickey, D.A. (1998), “Applied Regression Analysis: A Research Tool”, Second Edition, Springer-Verlag New York, Inc., New York. Shi, H., Laurent, E.J., LeBouton, J., Racevskis, L., Hall, K.R., Donovan, M., Doepker, R.V., Walters, M.B., Lupi, F., Liu, J. (2005), “Local Spatial Modeling of White-tailed Deer Distribution”, Ecological Modelling 190 (2006) 171-189. Wang, Y. (2010), “Anticipating Land Use Change Using Geographically Weighted Regression Models For Discrete Response”, Transportation Research Record. Yrigoyen, C.C., Rodriguez, I.G. (2008), “Modelling Spatial Variations in House-hold Disposable Income With Geographically Weighted Regression(1)”, Estadistica Espanola vol. 50, num. 168:321-360. Zhao, F., Chow, L.F., Li, M.T.,Liu X. (2005), “A Transit Ridership Model Based on Geographically Weighted Regression and Service Quality Variables”, Lehman Center for Transportation Research, Florida International University. Zhuang, D. (2006), “Spatial Dependence and Neighborhood Effects in Mortgage Lending: A Geographically Weighted Regression Approach”, LUSK Center for Real Estate, University of Southern California, Los Angeles.
34
17
35
18