perpustakaan.uns.ac.id
digilib.uns.ac.id
BAB IV HASIL DAN PEMBAHASAN Pada bab ini dibahas model regresi probit spasial, dan algoritme Gibbs sampling. Selanjutnya algoritme Gibbs sampling tersebut diterapkan untuk estimasi nilai parameter model regresi probit spasial menggunakan software R.
4.1
Model Regresi Probit Spasial
Model regresi probit yang merupakan model regresi linier dapat digunakan pada data kewilayahan sehingga disebut model regresi probit spasial. Pada regresi spasial, pengamatan pada suatu wilayah bergantung pada pengamatan yang berada di wilayah lain yang berdekatan. Hal tersebut mengakibatkan tidak terpenuhinya asumsi residu yang independen (Marsh [12]). Adanya pengaruh wilayah menyebabkan model probit pada persamaan (2.7) perlu dimodifikasi. Menurut LeSage dan Pace [11] model umum regresi probit spasial adalah z = ρW z + Xβ + ǫ
(4.1)
dengan z merupakan variabel dependen yang berupa vektor berukuran n × 1, X adalah matriks variabel independen yang berukuran n×k dan β adalah parameter yang berukuran k ×1. Koefisien autoregressive spasial lag dinotasikan rho dengan |ρ| < 1. Matriks W merupakan matriks ketergantungan wilayah yang digunakan untuk mengetahui hubungan antar wilayah. Himpunan pembobot dinyatakan dalam matriks pembobot W berukuran (n × n), dengan n adalah banyaknya pengamatan. Diagonal elemen utama bernialai 0, karena diasumsikan antara wilayah yang sama tidak saling berdekatan. Karakteristik dari matriks W adalah jumlah semua unsur pada setiap baris dan kolom sama dengan satu. ǫ adalah commit toberautokorelasi user residu berukuran (n × 1) yang diasumsikan yang berdistribusi 13
perpustakaan.uns.ac.id
digilib.uns.ac.id
ǫ ∼ N(0; σ 2 I). Berdasarkan persamaan (4.1), y = 1 jika z ≥ 0 untuk kejadian sukses dan y = 0 jika z < 0 untuk kejadian gagal. Variabel z pada persamaan (4.1)yang merupakan variabel dependen dikotomi mengikuti distribusi normal standar yaitu z ∼ N(0, σ 2 ) dapat dituliskan sebagai Z z −z 1 G(z) = √ exp 2 dz 2π −∞ Z ρW z+Xβ −z 1 = √ exp 2 dz. 2π −∞
4.2
Estimasi Parameter Model Regresi Probit Spasial Pembangkitan data melalui distribusi posterior memerlukan perhitungan
yang banyak dan berdimensi tinggi, oleh karena itu digunakan metode MCMC dengan algoritma Gibbs sampling yang diaplikasikan pada software R. Nilai parameter pada model regresi probit spasial yakni β dan ρ dapat ditentukan dengan terlebih dahulu diketahui distribusi posteriornya. Distribusi posterior masingmasing parameter digunakan untuk simulasi menggunakan agoritme Gibbs sampling. Berikut dipaparkan distribusi posterior masing-masing parameter menurut Wilhelm dan Godinho [19].
4.3
Distribusi Posterior
Distribusi posterior diperoleh dengan menggabungkan informasi prior dan informasi sampel. Dsitribusi posterior dihitung untuk menetukan nilai estimasi parameter. Parameter β memiliki informasi prior N(c, T ) dengan c merupakan rata-rata yang ditetapkan 0 dan T merupakan variansi untuk β yang berupa matriks T = In .1010 . Berdasarkan teori bayesian dapat dibentuk distribusi posterior
commit to user 14
perpustakaan.uns.ac.id
digilib.uns.ac.id
untuk β yaitu p(β|ρ, z, y) ∝ p(y1 , y2 , . . . , yn ).p(β) ∝ (σ n )n/2+(k/2)+1 |In + ρW | 1 ×exp− 2 (y ′|In + ρW |′ |In + ρW |y) − (c∗ )′ (T ∗ )−1 (c∗ ) 2σ +(β − c∗ )′ (T ∗ )−1 (β − c∗ ) ∼ N(c∗ , T ∗ ). ′
Parameter β berdistribusi normal dengan c∗ sebagai rata-rata yaitu c∗ = (X X + T −1 )−1 (X ′ Sz + T −1 c) dan variansi dinotasian T ∗ yaitu T ∗ = (X ′ X + T −1 )−1 dan S = (In − ρW ). Untuk melengkapi simulasi MCMC dengan algoritme Gibbs sampling terhadap parameter model regresi probit spasial, dibutuhkan juga distribusi posterior parameter ρ. Dalam menentukan distribusi posterior untuk ρ dilakukan cara yang sama dengan mengalikan informasi sampel dan informasi prior, dinyatakan dengan p(ρ|β, z, y) ∝ p(y1, y2 , . . . , yn ).p(ρ) −1 ′ ∝ [In − ρW ]exp( (Sz − Xβ) (Sz − Xβ)). 2 Proses simulasi dilakukan dengan sampling data pada variabel z yang membutuhkan distribusi posterior p(z|β, ρ, y) dinyatakan sebagai ′
z ∼ ((In − ρW )−1 Xβ, [(In − ρW ) (In − ρW )]−1 ). Berdasarkan distribusi posterior masing-masing parameter yang telah ditulis oleh LeSage dan Pace [11], pendekatan MCMC dapat diaplikasikan untuk estimasi parameter model probit spasial. Pembangkitan data melalui distribusi bersyarat dari p(β|ρ, z), p(ρ|β, z), dan p(z|β, ρ) tidak cukup hanya dengan satu kali iterasi.
4.4
Algoritme Gibbs Sampling
MCMC terdiri atas 2 algoritme yaitu algoritme Metropolis-Hastings dan commit to user algoritme Gibbs sampling (Walsh [18]). Algoritme Metropolis-Hastings diguna15
perpustakaan.uns.ac.id
digilib.uns.ac.id
kan bila terdapat satu parameter yang tidak diketahui. Algoritme Gibbs sampling merupakan kasus khusus dari algoritme Metropolis-Hastings yang memerlukan semua distribusi bersyarat dari parameter yang dicari. Algoritme Gibbs sampling digunakan bila terdapat lebih dari satu parameter yang tidak diketahui (Hastings [8]). Dalam penelitian ini digunakan Algoritme Gibbs sampling untuk mengestimasi nilai parameter pada regresi probit spasial. Algoritme Gibbs sampling diimplementasikan dengan software R untuk membangkitkan data dengan menghitung distribusi bersyarat masing-masing parameter. Karena estimasi tidak dilakukan pada data asli melainkan melalui pem′
bangkitan data, perlu ditetapkan nilai n = 400, N = 1000, β = (0, 1, −1) sebagai nilai awal parameter β dan ρ = 0.7 digunakan sebagai koefisien autoregressive spasial lag, selanjutnya ditentukan 6 daerah yang berdekatan sehingga diperoleh matriks pembobot yang sudah distandardisasi. Berikut diberikan source code estimasi parameter model regresi probit spasial (Wilhelm dan Gudinho [19]). 1. Input: nilai n, β merupakan matriks yang berukuran 3×1, ρ dengan asumsi |ρ| < 1, dan m merupakan banyaknya iterasi pada Gibbs sampling
2. For i = 1 sampai m dilakukan
(a) X := cbind(intercept = 1, x = rnorm(n), y = rnorm(n)); (b) In := sparseMatrix(i = 1 : n, j = 1 : n, x = 1); (c) nb := knn2nb(knearneigh(cbind(x = rnorm(n), y = rnorm(n)), k = 6)); (d) Listw := nb2listw(nb, style = ”W ”); (e) W := as(asd gRMatrixl istw(listw), ”CsparseMatrix”); (f) eps := rnorm(n = n, mean = 0, sd = 1); (g) z := solve(qr(In − ρ ∗ W ), X% ∗ %β + eps); (h) z := y < −as.double(z >= 0); 3. end For 4. sarprobit.fit1:=sarprobit(y ∼ Xcommit − 1,W,ndraw to user = 1000,burn.in = 200,thinning = 1,m = 10); 16
perpustakaan.uns.ac.id
digilib.uns.ac.id
5. output: nilai estimasi β dan ρ. Hasil estimasi menggunakan software R dengan algoritme Gibbs sampling untuk estimasi nilai parameter ditunjukkan pada Tabel 4.1. Tabel 4.1. Hasil estimasi dengan algoritme Gibbs sampling untuk parameter ρ dan β ρ = 0.5 Estimasi
Mean
β = −0.2
Std dev
ρ = 0.6
ρ = 0.7
Mean
Std dev
Mean
-0.21741 0.06562
-0.2062
0.06297
-0.18825 0.05946
β = 0.9
0.84787
0.10134
0.86872
0.10414
0.86537
β = −0.9
-1.093
0.11562
-1.08424 0.11745
-1.09279 0.12107
ρ
0.38936
0.08267
0.47301
0.61467
β = −0.1
-0.1373
0.06608
-0.07826 0.05501
-0.06671 0.05409
β=1
0.97707
0.10982
0.93304
0.92855
β = −1
-1.1692
0.1242
-0.17714 0.08108
-1.16015 0.08303
ρ
0.3385
0.08378
0.60833
0.06636
0.69732
0.05211
β=0
0.02316
0.05883
0.03747
0.05634
0.02108
0.05525
β = 0.7
0.56592
0.07791
0.62787
0.08242
0.64612
0.08572
β = −0.7
0.71755
0.08794
-0.66171 0.08903
-0.6561
0.09168
ρ
0.39817
0.09109
0.54347
0.07067
0.66708
0.0564
β=0
-0.02034 0.06364
-0.0554
0.0598
0.01205
0.05594
β=1
0.99255
0.97431
0.10919
0.98709
0.11345
β = −1
-1.11895 0.11953
-1.09901 0.11809
-0.9675
0.11391
ρ
0.38268
0.5012
0.68523
0.04863
0.10981
0.07838
0.07187
0.09418
0.06554
Std dev
0.10643
0.05757
0.09692
Berdasarkan Tabel 4.1 ditunjukkan bahwa penetapan nilai awal untuk β dan ρ akan mempengaruhi nilai estimasi dari hasil simulasi menggunakan software R. Nilai hasil estimasi mendekati nilai awal yang ditetapkan. Pemilihan m = 10 merupakan banyaknya iterasi Gibbs atau burn-in period yang dilakukan pada MCMC. Pengurangan nilai dari m = 10 hingga m = 1 dapat commit to user mengurangi kecepatan waktu iterasi untuk pengestimasian parameter. Menurut 17