TINJAUAN PUSTAKA Model Regresi Berganda Regresi linier adalah persamaan matematika yang menggambarkan hubungan antara peubah respon y dan peubah bebas X = (X1, X2,…, Xp). Hubungan antara kedua peubah tersebut dinyatakan dalam bentuk persamaan:
dengan
+∑
=
+
, i = 1, 2, …, n
merupakan konstanta,
pengamatan ke-i,
(1)
merupakan nilai peubah bebas ke-p pada
merupakan nilai koefisien peubah penjelas
merupakan galat acak pengamatan ke-i.
.
dan
Persamaan (1) dinyatakan dalam bentuk matriks: ∗
=
~
+∗
( ,
)
Model SAR Model SAR dideskripsikan sebagai suatu model yang mempertimbangkan apabila suatu daerah yang dipilah-pilah menjadi subdaerah-subdaerah, dengan antara subdaerah yang satu dan subdaerah lainnya saling berhubungan secara simultan, {Ai : i = 1, 2, ..., n}, Ai melambangkan kumpulan dari subdaerahsubdaerah. Misalkan
(
):
∈(
,…,
)
adalah proses gaussian acak
dimana {A1,..., An} bentuk lattice dari D, hal tersebut berlaku jika {A1,..., An} adalah partisi sederhana dari D, dengan
∪
∪… ∪
=
dan Ai ∩ Aj = 0; ∀
i ≠ j (Oliviera dan Song 2008). Secara sederhana Wall (2004) menjelaskan bahwa
SAR adalah model spasial yang berasal dari persamaan regresi linear dengan galatnya dimodelkan dalam bentuk model otoregresif dengan peubah acak pada satu daerah dengan daerah lainnya diamati secara simultan. Peubah y(Ai) merupakan peubah respon untuk setiap subdaerah yang diobservasi dengan peubah penjelas xi = (xi1, ... , xip)’ dimana p < n. Untuk penyederhanaan, peubah y(Ai) selanjutnya dituliskan dalam notasi
yi. Model
regresi SAR dari peubah respon, y = (y1, ... , yn) dapat dituliskan dalam persamaan: =
′
+∑
−
′
+
, i = 1, ..., n
(2)
Jika dimisalkan B = (bij)nxn , maka persamaan (2) dapat dituliskan dalam bentuk matriks : =
+(
dengan β = (β1, ..., βp)’
−
)+
ε = (ε1 ,..., εn)’ diasumsikan εi ~N(0,σi2) sehingga y ~ N[X β, ( (In - B)-1 M (In - B’)-1)]
(3)
M = σ2In, dan σ2 > 0 tidak diketahui (In - B) = matriks nonsingular B=
dengan
merupakan parameter spasial yang tidak diketahui
W = (wij)nxn merupakan matriks pembobot spasial simetri yang nonnegatif. Matriks pembobot spasial pada dasarnya merupakan matriks ketergantungan spasial. Matriks ketergantungan spasial adalah matriks yang menggambarkan hubungan antar daerah. Pace dan Barry (1997) menyatakan pembobot yang diberikan pada kelompok blok sensus tergantung pada kedekatan antar daerah. Kedekatan suatu daerah berdasarkan ketergantungan spasial biner, sehingga matriks pembobot ini mempunyai aturan sebagai berikut : wij
1, untuk daerah i yang bersebelahan dengan daerah j 0, untuk lainnya
Sebagai ilustrasi, Gambar 1 merupakan contoh pembentukan matriks pembobot spasial tetangga terdekat. R1 R2
R3 R4 R5
Gambar 1. Ilustrasi Pembobot Spasial
Matriks pembobot untuk Gambar 1 di atas adalah : R 1 1 0 1 0
R 1 0 1 1 0
R 0 ⎡1 ⎢ ⎢1 ⎢0 ⎣0
R R R R R
R 0 1 1 0 1
R 0 0⎤ ⎥ 0⎥ 1⎥ 0⎦
Baris pada matriks ketergantungan spasial menunjukkan hubungan spasial suatu daerah dengan daerah lain, sehingga jumlah nilai pada baris ke-i merupakan jumlah tetangga yang dimiliki oleh daerah i (wi. = Σwij). Model SAR Bayes Misalkan yi peubah acak yang mempunyai sebaran pada persamaan (3) =( ,
maka fungsi kemungkinan dari sebagai berikut: ( | ) (∝ ) =(
dengan
−
)(
, ) berdasarkan data yang diobservasi
−(
)=(
−
Sebaran informasi awal dari η adalah : ( )∝
(
( )
,
)
−
−
)′ ( )
−
)
,
(4)
(5)
dengan Ω = Rp x (0,∞) merupakan ruang parameter yang memiliki ciri khas tergantung pada pembobotnya, a R yang nilainya ditetapkan (Gill 2002) dan
( ) merupakan informasi awal marginal dari
dalam selang (λn-1, λ1-1);
λi , untuk i = 1, ..., n adalah nilai akar ciri dari matriks pembobot W. Dalam Bayes diketahui bahwa sebaran memerlukan persyaratan yakni 0 < ∫Ω
( |) ( )
<∞ . Untuk penyederhanaan fungsi posterior dari
persamaan (4) dan (5) dinotasikan sebagai berikut: ∫
dengan
(
( ,
( |) ( )
)
| )∝ =(
=(
−
)′
)′(
′
= (
−
)
( )
|) (
)
(6)
(
| )disebut fungsi kemungkinan terintegrasi dari
(Oliviera dan Song
2008). Sebaran posterior dari dari persamaan (4) akan tepat jika fungi kemungkinan terintegrasi pada persamaan (6) dan sebaran informasi awal ( ) berada pada selang (λn-1, λ1-1).
Informasi awal noninformatif digunakan dalam situasi dimana informasi
awal yang berasal dari subjektifitas peneliti atau berdasarkan penelitian sebelumnya sukar didapatkan. Informasi awal noninformatif yang digunakan yakni Informasi awal Jeffreys dan informasi awal uniform/naive. Informasi awal uniform akan memberikan bobot nilai yang sama untuk semua nilai parameter spasial. Sedangkan informasi awal Jeffreys tidak membatasi antara λ1-1 dan λn-1, melainkan menetapkan pembobot yang penting untuk parameter spasial mendekati batas-batas antara nilai akar ciri terendah dan tertinggi. 1. Informasi awal Jeffreys Dalam informasi awal Jeffreys, informasi awal yang digunakan yaitu ( ) ∝ (det[ ( ])) , dimana
( )merupakan matriks informasi Fisher.
Bentuk matriks informasi Fisher sebagai berikut : log ( ( | ))
[ ( ]) =
log ( ( | ))
|
Dengan mempertimbangkan fungsi kemungkinan persamaan (4) dengan W simetrik serta sebaran informasi awal persamaan (5) maka akan didapatkan : (
i) untuk a = 1 maka
)∝∑
−
merupakan informasi awal independence Jeffreys ii) untuk a = 1 +
maka
(
) ∝| (
merupakan informasi awal Jeffreys-rule
−
∑
yang
) |
(
) yang
2. Informasi awal uniform Informasi awal uniform memberikan bobot nilai yang sama untuk semua nilai parameter spasial, dituliskan sebagai : ( )∝1
,
( )
Pendugaan dan Pengujian Parameter Model SAR Bayes dengan Markov Chain Monte Carlo (MCMC) Dalam tahapan pendugaan parameter model, ketika menggunakan metode bayes berhirarki, maka perhitungan yang dilakukan biasanya melalui integral multidimensi, alternatif yang dapat digunakan yakni menghitung besaran posterior melalui integrasi numerik dan salah satu metode yang digunakan adalah algoritma MCMC. Pendugaan parameter model didasarkan sampel dari sebaran posterior. Sampel posterior ini disimulasikan dengan algoritma MCMC yang didasarkan pada sebaran posterior : , , | )= ( |
(
, ) (
,
|
dari persamaan (4) dan (5) diketahui bahwa : ( |
(i)
(
(ii)
(iii) ( (
|
,
, )~
, )~
| )∝
,
(
+
− 1,
, ) (
| )
) (
(7)
)
(
Simulasi dari (i) dan (ii) untuk mendapatkan parameter
)
dan
pada
persamaan (7) dapat dibangkitkan secara langsung dengan menggunakan algoritma MCMC, sedangkan untuk mendapatkan sampel
dari (iii) persamaan
(7) diselesaikan dengan menggunakan algoritma Adaptive Rejection Metropolis Sampling (ARMS) yang diusulkan oleh Gilks et al. (1995). Untuk menguji signifikansi dari parameter digunakan uji kuasa (Kutner et al. 2005). Pengujian hipotesis untuk β : :
=0
:
≠0
i = 0, .., p
Dengan statistik uji : =
( )
kriteria penolakan Ho yaitu jika |
| >
(
;
)
Sedangkan untuk menguji signifikansi korelasi spasial ( ), hipotesis yang digunakan : :
= 0 (tidak ada korelasi spasial)
:
≠ 0 (ada korelasi spasial)
Dengan statistik uji : =
( )
kriteria penolakan Ho yaitu jika |
| >
(
;
)
Pemilihan Model Terbaik Metode yang digunakan untuk memilih model bayes terbaik menurut Gill (2002) dengan Bayesian Information Criterion (BIC) dan ragam dari penduga, sedangkan kebaikan model dapat dilihat dari nyata atau tidaknya koefisien parameter model dan nilai koefisien determinasi (R2). Untuk menghitung nilai BIC digunakan rumus sebagai berikut: BIC = -2log L + p log (n) dengan L = nilai maksimum dari fungsi kemungkinan p = banyaknya parameter dalam model n = banyaknya ulangan Model dikatakan baik jika memiliki nilai BIC yang kecil. Selain metode tersebut, nilai ragam penduga juga dapat menjadi kriteria pemilihan model terbaik. Ragam penduga adalah ukuran penyebaran penduga di sekitar nilai tengah populasi. Penduga dikatakan baik jika memiliki ragam yang kecil. Untuk menghitung ragam penduga digunakan rumus sebagai berikut: var ( ) = E(
) − [E( )]
Untuk pemilihan model yang terbaik dapat digunakan uji kebaikan model, yakni dengan menggunakan koefisien determinasi. Fungsi utama dari koefisien determinasi adalah untuk menguji ketepatan hasil analisis regresi. Koefisien determinasi dinotasikan dengan : ∑(
= ∑(
) )
Nilai koefisien determinasi berada pada 0 ≤ R2 ≤ 1. Semakin besar nilai R2 maka model dikatakan semakin tepat menjelaskan peubah respon. Jika nilai R2 bernilai nol berarti peubah bebas tidak memberikan kontribusi terhadap naik turunnya peubah respon dan apabila nilai R2 bernilai 1 maka ragam peubah respon mutlak dipengaruhi oleh peubah-peubah penjelas yang terdapat pada model.