6
BAB 2
LANDASAN TEORI
2.1.
Metode Kuadrat Terkecil
Analisis regresi merupakan analisis untuk mendapatkan hubungan dan model matematis antara variabel dependen (Y) dan satu atau lebih variabel independen (X). Hubungan antara satu variabel dependen dengan satu atau lebih variabel independen dapat dinyatakan dalam model regresi linier (Draper dan Smith, 1992). Secara umum hubungan tersebut dapat dinyatakan sebagai berikut :
Y 0 1 X 1 ... p X p
(2.1)
dengan Y : variabel dependen, βi : koefisien regresi Xi : variabel bebas µ : nilai eror regresi µ~ IIDN (0, σ2I) i = 1, 2, …, p
Jika dilakukan pengamatan sebanyak n, maka model persamaan regresi linier berganda ke-i adalah (2.2) p = 1, 2, …, n
Persamaan estimasi regresi linier berganda adalah
7
(2.3)
Secara matriks, bentuk penaksir kuadrat terkecil (least square) dari parameter tersebut adalah: (2.4) dengan : vektor dari parameter yang ditaksir (p+1) x 1 X : matriks variabel bebas berukuran n x (p+1) Y : vektor observasi dari variabel respon berukuran (n x 1) k : banyaknya variabel bebas (k = 1, 2, …, p)
Uji signifikansi parsial yaitu uji untuk mengetahui variabel mana saja yang mempengaruhi variabel bergantung secara signifikan. Hipotesis yang digunakan adalah H0 : βk = 0 H1 : βk ≠ 0 dengan k = 1, 2, 3, …, p Dengan taraf signifikansi adalah α = 5% Dengan statistik uji yang digunakan adalah
t hit
ˆ k ~ t n 2k SE ( ˆ k )
Dengan keputusan tolak H0 jika |thit| > t(df,
(2.5) 1-α/2).
Variabel yang tidak berpengaruh
secara signifikan dapat dihilangkan dalam model. di mana df : n-2-k n : jumlah pengamatan k : jumlah variabel bebas
2.2.
Regresi Spasial
Regresi spasial adalah suatu metode untuk memodelkan suatu data yang memiliki unsur spasial. Model umum regresi spasial atau juga biasa disebut Spatial
8
Autoregressive Moving Average (SARMA) dalam bentuk matriks (Lesage 1999; Anselin 2004) dapat disajikan sebagai berikut: y Wy βX u
(2.6)
u Wu ε
(2.7)
dengan y
: vektor variabel dependen dengan ukuran n x 1
X
: matriks variabel independen dengan ukuran n x (k+1)
β
: vektor koefisien parameter regresi dengan ukuran (k+1) x 1
ρ
: parameter koefisien spasial lag variabel dependen
λ
: parameter koefisien spasial lag pada error
u, ε
: vektor error dengan ukuran n x 1
W
: matriks pembobot dengan ukuran n x n
n
: jumlah amatan atau lokasi ( i = 1, 2, 3, …, n )
k
: jumlah variabel independen ( k = 1, 2, …, l )
I
: matriks identitas dengan ukuran n x n
Pada persamaan (2.6) dapat dinyatakan dalam bentuk y Wy βX u atau (I W)y βX u
(2.8)
Sedangkan pada persamaan (2.7) dapat dinyatakan dalam bentuk (I W)u ε atau
u (I W) 1 ε
(2.9)
Persamaan (2.8) dan (2.9) disubtitusi ke persamaan (2.6), maka akan diperoleh bentuk persamaan yang lain yaitu: (I W)y βX (I W)1ε
(2.10)
Pendugaan parameter pada model umum persamaan regresi spasial dalam bentuk matrik (Anselin, 1988) yaitu: βˆ (XT X) 1 XT (I W)y
(2.11)
9
2.3.
Spatial Autoregresive Model (SAR)
Pada persamaan (2.6) jika nilai ρ ≠ 0 dan λ = 0 maka model regresi spasial akan menjadi model regresi spasial Mixed Regressive-Autoregressive atau Spatial Autoregressive Model (SAR) atau disebut juga Spatial lag Model (SLM) (Anselin, 1988) dengan bentuk persamaannya yaitu y Wy βX
(2.12)
Model persamaan (2.12) mengasumsikan bahwa proses autoregressive hanya pada variabel dependen. Pada persamaan tersebut, respon variabel y dimodelkan sebagai kombinasi linier dari daerah sekitarnya atau daerah yang berimpitan dengan y, tanpa adanya eksplanatori variabel yang lain. Bentuk penaksir dari metode SAR adalah βˆ (XT X) 1 XT (I W)Y
2.4.
(2.13)
Spatial Error Model (SEM)
Pada persamaan (2.6) jika nilai λ ≠ 0 atau ρ = 0 maka model regresi spasial akan menjadi model Spatial Error Model (SEM) dengan bentuk persamaannya yaitu y Wy βX Wy u
(2.14)
λW2u menunjukkan spasial terstruktur λW2 pada spatially dependent error (ε). Model SEM adalah model regresi linier yang pada peubah galatnya terdapat korelasi spasial. Bentuk parameter penduga dari model SEM adalah
1 T T βˆ X WX X WX X Wy y Wy
(2.15)
10
2.5.
Signifikansi Parameter Regresi Spasial
Anselin (2003) menyatakan bahwa salah satu prinsip dasar penduga Maksimum Likelihood adalah asymptotic normality, artinya semakin besar ukuran n maka kurva akan semakin mendekati kurva sebaran normal. Pengujian signifikansi parameter regresi (β) dan autoregresif (ρ dan λ) secara parsial yaitu didasarkan pada nilai ragam galat (σ2), sehingga statistik uji signifikansi parameter yang dipergunakan yaitu
Z hitung
ˆ s.b( )
Dimana
merupakan asymptotic standard error. Melalui uji
parsial masing-masing parameter
dengan hipotesis
H0 : 0 H1 : 0 Dimana
merupakan parameter regresi spasial ( yaitu β, λ, dan ρ), apabila
Zhitung ≥ Z(α/2) atau ρ = value < α/2, maka keputusan tolak H0, artinya koefisien regresi layak digunakan pada model.
2.6.
Efek Spasial
Pada bagian ini akan diuraikan hal-hal yang berkaitan dengan efek spasial yaitu:
2.6.1. Efek Heteroskedastisitas (Spatial Heterogenity)
Efek heterogenitas adalah efek yang menunjukkan adanya keragaman antar lokasi. Jadi setiap lokasi mempunyai struktur dan parameter hubungan yang berbeda. Pengujian efek spasial dilakukan dengan uji heterogenitas yaitu menggunakan uji Breusch- Pagan test (BP test). Pembentukan model yang dilakukan adalah dengan menggunakan pendekatan titik. Regresi spasial pendekatan titik yaitu Geographically Weighted Regression (GWR). Rumus persamaan Geographically Weighted Regression (GWR) adalah
11
dengan yi
= nilai pengamatan variabel respon ke- i
xk
= nilai pengamatan variabel prediktor k pada pengamatan ke-i
βk (ui, vi) = realisasi fungsi kontinu βk (ui, vi) pada pengamatan ke-i (ui, vi)
= titik koordinat (longitude, latitude) lokasi ke-i
εi
= eror yang diasumsikan identik, independen dan berdistribusi normal dengan mean nol dan varian konstan σ2
yang kedua adalah Geographically Weighted Poisson Regression (GWPR), adapun model GWPR adalah
Dan yang terakhir adalah Geographically Weighted Logistic Regression (GWLR), bentuk model GWLR adalah
2.6.2. Efek Dependensi Spasial (Spatial Dependence)
Dependensi spasial terjadi akibat adanya dependensi dalam data wilayah. Spatial dependence muncul berdasarkan hukum Tobler I (1979) yaitu segala sesuatu saling berhubungan dengan hal yang lain tetapi sesuatu yang lebih dekat mempunyai pengaruh yang besar. Penyelesaian yang dilakukan jika ada efek dependensi spasial, adalah dengan pendekatan area.
Anselin (1988) menyatakan bahwa uji untuk mengetahui spatial dependence di dalam error suatu model adalah dengan menggunakan statistik Moran’s I dan Langrange Multiplier (LM).
12
2.6.2.1 Moran’s I Moran’s I adalah sebuah tes statistik lokal untuk melihat nilai autokorelasi spasial, yang mana digunakan untuk mengidentifikasi suatu lokasi dari pengelompokan spasial atau autokorelasi spasial. Menurut Lembo (2006) dalam Kartika (2007) autokorelasi spasial adalah korelasi antara variabel dengan dirinya sendiri berdasarkan ruang. Cliff dan Ord (1973, 1981) menghadirkan uji statistik Moran’s I untuk sebuah vektor pada n lokasi. Rumus Moran’s I untuk matrik pembobot
observasi
(W) tidak dalam bentuk normalitas, adalah I
n n
n
w i 1 j 1
Dengan eni Yni
.
e n ' Wn e n en ' en
(2.16)
ij
1 n Yni adalah sebuah vektor deviasi untuk rata-rata sampel dan n i 1
Wn [ wnij ] adalah matrik bobot spasial. Rumus Moran’s I dengan matrik pembobot
(W) dalam bentuk normalitas, persamaan (2.16) di reduksi menjadi
I
e n 'Wn e n en ' en
(2.17)
Nilai ekspektasi dari Moran’s I ( Lee dan Wong, 2001) adalah E(I ) I o
1 n 1
(2.18)
Jika I > Io, maka nilai autokorelasi bernilai positif, hal ini berarti bahwa pola data membentuk kelompok (cluster), I = Io artinya tidak terdapat autokorelasi spasial, dan I < Io artinya nilai autokorelasi bernilai negatif, hal ini berarti pola data menyebar. Uji statistik Moran’s I, dibatasi oleh 1.0 (yang berarti klaster spasial bernilai autokorelasi positif) dan -1.0 (yang berarti klaster spasial bernilai autokorelasi negatif). Nilai autokorelasi spasial dikatakan kuat, apabila nilai tinggi dengan tinggi atau nilai rendah dengan rendah dari sebuah variabel berkelompok dengan daerah sekitarnya (common side).
13
Moran’s I scatterplot adalah sebuah diagram untuk melihat hubungan antara nilai amatan pada suatu lokasi (distandarisasi) dengan rata-rata nilai amatan dari lokasi-lokasi yang bertetanggan dengan lokasi yang bersangkutan (Lee dan Wong, 2001). Jika I > Io maka nilai autokorelasi bernilai positif, sedangkan jika I < Io maka nilai autokorelasi bernilai negatif. Pembagian kuadrannya (Perobelli dan Haddad, 2003) adalah 0.50 0 0.25 25 0.00 -0.25 -0.50
-0.50
Kuadran II
Kuadran I
Low-High
High-High
Kuadran III
Kuadran IV
Low-Low
High-Low
-0.25
0.00
0.25
0.50
Kuadran I disebut High-High, menunjukkan nilai observasi tinggi dikelilingi oleh daerah yang mempunyai nilai observasi yang tinggi berlawanan dengan Kuadran III disebut Low-Low, menunjukkan nilai observasi rendah dikelilingi oleh daerah yang mempunyai nilai observasi rendah. Kuadran II disebut Low-High menunjukan nilai observasi rendah dikelilingi oleh daerah yang mempunyai nilai observasi tinggi berkebalikan dengan kuadran IV disebut High-Low, menunjukkan nilai observasi tinggi dikelilingi oleh derah yang mempunyai nilai observasi yang rendah (Kartika, 2007).
2.6.2.2 Lagrange Multiplier (LM) Test
Uji LM (Lagrange Multiplier) adalah uji untuk menentukan apakah model memiliki efek spasial atau tidak. Lagrange Multiplier (LM) yang mana pada tes ini, nilai sisa dari kuadrat terkecil dan hitungan matrik bobot spasial W. Bentuk tes LM (Anselin, 1988), yaitu
14
(2.19)
(2.20)
Dengan e : nilai residu dari hasil OLS n : banyak observasi
Pada Uji Lagrange Multiplier (LM), ada tiga hipotesis yang dilakukan, yaitu : 1. Untuk SAR, H0 : λ = 0 dan H1 : λ ≠ 0 2. Untuk SEM, H0 : ρ = 0 dan H1 : ρ ≠ 0 3. Untuk mixture Model, H0 : ρ, λ = 0 dan H1 : ρ, λ ≠ 0 Dalam mengambil keputusan, tolak H0 jika LM > χ2(1) atau nilai probabilitas < α.
2.7.
Matrik Keterkaitan Spasial (Spatial Weight Matrices)
Bentuk umum matrik spasial (W) adalah (2.21)
Pembentukan matriks keterkaitan spasial yang sering disebut matrik W dapat menggunakan berbagai teknik pembobotan. Anselin (2002) mengusulkan 3 (tiga) pendekatan untuk mendefinisikan matriks W, yaitu contiguity, distance, dan general. Matriks W berdasarkan persentuhan batas wilayah (contiguity) menyatakan bahwa interaksi spasial terjadi antar wilayah yang bertetangga, yaitu interaksi yang memiliki
15
persentuhan batas wilayah (common boundary). Sebuah matrik W yang dibentuk adalah simetrik dan diagonal utama selalu bernilai nol seperti jika Wmn diberi nilai 1, maka Wnm bernilai 1 juga. Pada prakteknya, definisi batas wilayah tersebut memiliki beberapa alternatif. Secara umum terdapat berbagai tipe interaksi, yaitu Rook contiguity, Bishop contiguity dan Queen contiguity.
Gambar 2.1: Ilustrasi dari Contiguity Sumber : ( James P. Lesage, 1998)
a.
Rook contiguity ialah persentuhan sisi wilayah satu dengan sisi wilayah yang lain yang bertetanggaan. Pada gambar 2.1, wilayah 1 bersentuhan dengan wilayah 2 sehingga W12 = 1 dan yang lain 0 atau pada wilayah 3 bersentuhan dengan wilayah 4 dan 5 sehingga W34 = 1, W35 = 1 dan yang lain 0.
b.
Bishop contiguity ialah persentuhan titik vertek wilayah satu dengan wilayah tetangga yang lain. Pada gambar 2.1, wilayah 2 bersentuhan titik dengan wilayah 3 sehingga W23 = 1 dan yang lain 0.
c.
Queen contiguity ialah persentuhan baik sisi maupun titik vertek wilayah satu dengan wilayah yang lain yaitu gabungan rook contiguity dan bishop contiguity. Contoh W32 = 1, W34 = 1, W35 =1 dan yang lain 0.
Matriks W yang merefleksikan queen contiguity pada gambar 2.1 adalah
16
Matrik Queen contiguity atau Rook contiguity yang sudah diperoleh, dibentuk kedalam bentuk matrik normalitas, yaitu matrik dimana jumlah dari setiap barisnya adalah satu, sehingga matrik normalitas dari matrik Wqueen tersebut adalah