Bab II Tinjauan Pustaka
II.1 Proses Stokastik dan Sifat-Sifatnya Suatu himpunan peubah acak {Z (t ) Z (t ) ∈ E , t ∈ T } disebut proses stokastik, yaitu
koleksi peubah acak Z (t ) dimana untuk setiap t dalam himpunan indeks T . Dalam proses stokastik ada dua himpunan yang terlibat yaitu: (1) Ruang keadaan ( E ), yaitu himpunan yang mengandung semua nilai Z yang mungkin, dan (2) himpunan indeks parameter ( T ) adalah himpunan barisan dimana peubah acak Z dibangun. Biasanya indeks parameter adalah waktu.
Data spasial dapat dinyatakan sebagai hasil observasi dari proses stokastik
{Z (t ) Z (t ) ∈ E , t ∈ T }
dimana
indeks
parameternya
adalah
lokasi.
Untuk
membedakannya dapat ditulis dengan {Z (s ) s ∈ D} dimana D adalah himpunan random di R d . Nilai data di lokasi s yaitu z (s ) disebut realisasi dari peubah acak
Z (s ) . Z (s ) disebut juga peubah teregional, yaitu peubah yang terdistribusi di dalam ruang dan menunjukkan adanya korelasi spasial. D koleksi dari peubahpeubah acak disebut fungsi acak.
Berdasarkan kestasionerannya, proses stokastik dibagi menjadi dua, yaitu strictly
stationary processes (kestasioneran kuat) dan weakly stationary processes (kestasioneran lemah) atau disebut juga stasioner orde dua. Z (s ) dikatakan stasioner kuat, yaitu jika untuk setiap h, n, s1 ,..., s n distribusi dari Z (s1 ),.., Z (s n ) dan Z (s1 + h ),.., Z (s n + h ) mempunyai distribusi gabungan yang sama. Dengan kata lain Z (s ) dikatakan stasioner kuat jika distribusi gabungannya tidak berubah karena pertambahan h . Akan tetapi karena keterbatasan data, kondisi ini seringkali tidak dipenuhi, maka biasanya hanya dua momen pertama dari Z (s ) yang diharapkan memenuhi sifat ini yaitu rataan dan variansi. Kondisi ini dinamakan stasioner lemah.
Bab II Tinjauan Pustaka
7
Menurut Armstrong (1998), proses stokastik
{Z (s ) s ∈ D}
dimana D adalah
himpunan random di R d akan memenuhi stasioner lemah jika: 1. Rataan dari Z (s ) konstan untuk setiap s ∈ D , tidak bergantung lokasi, maka, E [Z (s )] = µ (s ), ∀s ∈ D
2. Fungsi kovariansi antara dua titik lokasi s dan s + h hanya bergantung pada vektor h .
E [(Z (s ) − E[Z (s )])(Z (s + h ) − E [Z (s + h )])] = Cov[Z (s ), Z (s + h )] = C (h )
1 2 3 4 5 6 7 8 9 10 11 12 13 14
h
Gambar II.1. Rata-rata berfluktuasi pada nilai yang konstan pada jarak h, sehingga memenuhi stasioner II.2 Semivariogram
Sebelum membicarakan semivariogram kita kemukakan 3 hal penting yang merupakan bagian dasar kovariansi dan hubungannya dengan semivariogram untuk peubah acak stasioner, yaitu: 1. C (0) = σ 2 , artinya kovariansi pada jarak nol adalah variansi. Maksudnya adalah karena jarak h = 0 , maka hanya ada satu peubah acak Z (s ) yang diamati. 2. C (h ) = C (− h ) , artinya kovariansi adalah fungsi genap.
8
Bab II Tinjauan Pustaka
3. C (h ) ≤ C (0) , artinya kovariansi adalah fungsi terbatas dan kovariansi bisa juga bernilai negatif. Hal ini terjadi apabila nilai Z (s ) yang besar berkaitan dengan nilai Z (s + h ) yang kecil.
Dalam geostatistika, untuk mengukur hubungan spasial antara peubah acak di suatu titik lokasi s dan s + h masing-masing Z (s ) dan Z (s + h ) , dengan h jarak antara dua lokasi digunakan semivariogram. Variogram antara Z (s ) dan Z (s + h ) , dimana Z (s ) adalah peubah acak Z di s ∈ D dan Z (s + h ) adalah peubah acak Z di s + h ∈ D , dengan D ∈ R d
didefinisikan, 2 2 Var (Z (s ) − Z (s + h )) = E ⎣⎡ ( Z ( s ) − Z ( s + h ) ) ⎦⎤ − ( E ⎡⎣ Z ( s ) − Z ( s + h ) ⎤⎦ )
Variansi dapat dinyatakan sebagai kovariansi pada jarak nol (C (0)) . Apabila kovariansi tidak ada, peubah acak diasumsikan memenuhi hipotesis stasioner intrinsik. Proses spasial {Z (s ) s ∈ D} memenuhi stasioner intrinsik jika: 1. E [Z (s ) − Z (s + h )] = 0 2 2. Var (Z (s ) − Z (s + h )) = E ⎡⎣ ( Z ( s) − Z ( s + h) ) ⎤⎦ = 2γ (h )
Artinya rataan dan variansi Z (s ) − Z (s + h ) ada dan tidak bergantung pada lokasi s . 2γ (h ) disebut fungsi variogram. Setengah dari variogram disebut semivariogram, dinotasikan γ (h ) . Secara geometri, h adalah suatu vektor yang nilainya tergantung pada arah dan panjang vektor tersebut. Dalam praktek biasanya arah hanya ditentukan oleh mata angin saja, yaitu Utara, Timur, Selatan dan Barat. Jika semivariogram hanya tergantung pada panjang h saja disebut isotropik. Sedangkan semivariogram tergantung pada arahnya maka disebut anisotropik.
Bab II Tinjauan Pustaka
9
Menurut Armstrong (1998) apabila semivariogram yang cocok dengan semivariogram eksperimental sudah diperoleh, maka model ini dapat digunakan untuk memprediksi di lokasi-lokasi yang tidak tersampel melalui kriging.
Selanjutnya menurut Armstrong (1998) hubungan antara semivariogram dan kovariansi: 2γ (h ) = E [(Z (s ) − Z (s + h ))]
2
2γ ( h ) = E ⎡ ⎢⎣
(( Z ( s ) − µ ) − ( Z ( s + h ) − µ ))
2γ ( h ) = E ⎡ ⎢⎣
(( Z ( s ) − µ ) − 2 ( Z ( s ) − µ ) ( Z ( s + h ) − µ ) + ( Z ( s + h ) − µ ) ) ⎤⎥⎦
[
2
⎤ ⎥⎦
2
2
]
[
2γ (h ) = E (Z (s ) − µ ) − E [2(Z (s ) − µ )(Z (s + h ) − µ )] + E (Z (s + h ) − µ ) 2
2γ (h ) = 2C (0) − 2C (h )
γ (h ) = C (0) − C (h )
(2.1)
Hubungan tersebut dapat diilustrasikan sebagai berikut,
σ
γ (h ) 2
C (h )
Gambar II.2. Hubungan antara variogram dan kovariansi
Berdasarkan gambar di atas, variogram mulai dari nol dan naik menuju nilai tertentu, sedang kovariansi mulai dari variansi dan monoton turun.
2
]
10
Bab II Tinjauan Pustaka
II.2.1 Model Semivariogram
Menurut Cressie (1993) ada beberapa model yang dapat dicocokkan, yaitu: 1.
Model Linier (Linear Model) 0 h=0 ⎧ γ ( h) = ⎨ h≠0 ⎩C 0 + C h Model ini berhubungan dengan fenomena yang murni acak dengan tanpakorelasi antar nilai-nilainya.
2.
Model Bola (Spherical Model) ⎧ 0, h=0 3 ⎪ ⎛ h ⎞⎟ 3h ⎪ ⎜ γ (h) = ⎨C 0 + C − 3 , 0< h ≤a ⎜ a 2 2a ⎟ ⎪ ⎠ ⎝ h ≥a ⎪⎩ C0 + C, Model ini mengikuti model pertumbuhan yang hampir linier sampai pada jarak tertentu, kemudian tercapai stabilitas.
3.
Model Eksponensial (Exponential Model) 0, ⎧ h=0 ⎪ ⎛ ⎛ h ⎞⎞ γ ( h) = ⎨ C 0 + C ⎜1 − exp⎜⎜ − ⎟⎟ ⎟, h ≠ 0 ⎜ ⎟ ⎪ ⎝ a ⎠⎠ ⎝ ⎩ Model ini pada awalanya meningkat lebih cepat tetapi hanya mengarah pada
sill dan tidak betul-betul mencapai nilai tersebut. 4.
Model Kuadratik Rasional (Rational Quadratic Model) 0, ⎧ 2 h=0 ⎪ Ch γ ( h) = ⎨ , C + ⎪ 0 1+ h 2 / a h ≠ 0 ⎩
5.
Model Gelombang ( Hole-Effect Model) 0, ⎧ ⎪ ⎛ ⎛ h ⎞⎞ ⎜ a sin ⎜ ⎟ ⎟ h = 0 ⎪ ⎪ ⎜ a ⎟⎟ ⎜ γ ( h) = ⎨ ⎝ ⎠ , C + C ⎜1 − ⎟ ⎪ 0 h ⎜ ⎟ h≠0 ⎪ ⎜ ⎟ ⎪⎩ ⎝ ⎠ Model ini termasuk model yang langka dengan sebuah efek lubang dan berhubungan dengan struktur yang kontinyu.
11
6.
Bab II Tinjauan Pustaka
Model Kuasa (Power Model) 0, h=0 ⎧ γ ( h) = ⎨ dengan 0 < α ≤ 2 α ⎩C 0 + C h , h ≠ 0 Model ini cocok untuk semivariogram dalam Rd, d ≥ 1
(a)
(b)
(c)
(d)
(e)
(f)
Gambar II.3. (1) Model Linier, (2) Model Bola, (3) Model Eksponensial,(4) Model Kuadratik Rasional, (5) Model Gelombang, (6) Model Kuasa Keterangan a
: Range (Jangkauan), merupakan jarak maksimum dimana masih terdapat korelasi spasial antar data.
C0
: Efect Nugget (Efek Gumpal), merupakan diskontinu disekitar titik asal dimana semivariogram pada jarak sama dengan nol (pada lokasi itu sendiri) tidak sama dengan nol.
C 0 + C : Sill (ambang), merupakan nilai semivariogram yang konstan untuk h yang tidak terbatas. Biasanya nilainya mendekati variansi data. (Armstrong; 1998)
Dalam tulisan ini akan digunakan semivariogram model bola. Menurut Setyadji (2005), model bola merupakan model yang paling umum dipakai. Model ini menggunakan ekspresi polinomial yang sederhana dan bentuknya sesuai dengan berbagai jenis fenomena yang diamati. Model bola mempunyai kelakuan linier
12
Bab II Tinjauan Pustaka
disekitar titik (0,0). Pada model bola, kenaikan semivariogram pada awalnya tidak terlalu cepat atau landai. Satu pertumbuhan yang hampir linier sampai pada jarak tertentu, kemudian tercapai stabilitas.
semivarogram
teoritis eksperimen jarak
Gambar. II.4. Ilustrasi Semivariogram Model Bola dan Eksperimental Berdasarkan gambar di atas, diilustrasikan bahwa semivariogram eksperimental dapat naik maupun turun sesuai dengan data yang diperoleh. Sedangkan model bola mengikuti sebuah model linier. Untuk lebih jelasnya dapat dilihat pada perhitungan semivariogram eksperimental dari penelitian ini, yang akan dijelaskan pada bab III. Ada beberapa sifat plot semivariogram, yaitu: 1.
γ (h ) selalu berawal di titik nol (untuk h = 0), Z (s ) = Z (s + h ) mungkin terjadi diskontinu disekitar titik pangkal γ (h ) ≠ 0 .
2.
γ (h ) bertambah besar jika h membesar. Hal ini menunjukkan nilai pada dua data akan sangat bergantung pada jarak kedua data tersebut.
3.
γ (h ) naik menuju nilai tertentu setelah itu cenderung konstan. Kenaikan nilai γ (h ) akan berlangsung selama data masih berkorelasi.(Armstrong; 1998).
II.2.2 Semivariogram Eksperimental
Selanjutnya
dikenal
semivariogram
eksperimental
yang
merupakan
semivariogram yang diperoleh dari data yang diketahui. Menurut Armstrong (1998) semivariogram eksperimental didefinisikan sebagai,
13
γˆ (h ) =
Bab II Tinjauan Pustaka
1 N (h ) (Z (si ) − Z (si + h ))2 ∑ 2 N (h ) i =1
(2.2)
: lokasi sampel dengan s i Z (s i ) : nilai data pada lokasi s i . N (h ) : banyaknya pasangan (s i , s i + h ) yang mempunyai jarak h . II.3 Taksiran Model Semivariogram
Pada dasarnya taksiran model semivariogram pada semivariogram eksperimental merupakan pencarian dua nilai parameter utama pada model semivariogram teoritis yaitu C dan a.
Pedoman penting dalam melakukan penaksiran model semivariogram adalah: 1.
Efek nugget ( C 0 ) didapat dari perpotongan garis tangensial dari dua titik pertama semivariogram dengan sumbu vertikal.
2.
Sill kira-kira sama dengan atau mendekati variansi populasi. Garis tangensial di atas akan memotong garis sill pada jarak 2 a , sehingga selanjutnya 3 dapat dihitung harga a. jarak ini disebut practical range.
3.
Interpretasi efek nugget untuk semivariogram dengan sudut toleransi 1800 akan sangat membantu untuk memperkirakan besarnya efek nugget. (Darijanto, 1999).
II.4 Validasi Model
Menurut Kitanidis (1997), yang dimaksud dengan validasi model adalah melakukan uji terhadap model. Setiap model empiris harus diuji terlebih dahulu sebelum digunakan untuk melakukan prediksi.
Sebuah uji statistik adalah memadankan sebuah eksperimen yang dihubungkan pada validasi teoritis. Untuk melihat apakah model spherikal dengan parameter yang diperoleh merupakan model semivariogram yang sesuai, akan dilakukan uji galat hasil taksiran.
14
Bab II Tinjauan Pustaka
Prosedur yang digunakan dalam validasi model semivariogram adalah dengan mengevaluasi kecocokan model tersebut terhadap data dengan melihat galat taksirannya, yaitu selisih antara data dengan nilai penaksirnya. Untuk menaksir nilai data dilakukan dengan menggunakan metode kriging, yaitu dengan mengeliminasi salah satu nilai data pada masing-masing lokasi, kemudian ditaksir nilainya pada lokasi tersebut dengan kriging. Namun sebelumnya, galat hasil taksirannya dibakukan terlebih dahulu, yaitu dibagi dengan standar deviasinya. Standar deviasi galat dapat diperoleh dari akar variansi kriging masing-masing lokasi.
Uji statistik yang digunakan adalah statistik Q1 , yaitu 1 n Q1 = ∑ε s , n − 1 s=2
dimana ε s =
z (s) − z ∗ (s)
σs
(2.3)
adalah galat taksiran kriging yang telah distandarkan.
Q1 adalah variabel acak dengan rataan E [Q1 ] = 0 1 n ⎡ 1 n ⎤ E[Q1 ] = E ⎢ εk ⎥ = ∑ ∑ E[ε k ] = 0 ⎣ n − 1 k =2 ⎦ n − 1 k =2
[ ]
dan variansi E Q1 = 2
1 n −1
2 ⎡⎛ 1 n ⎡⎛ 1 ⎞ 2 n n ⎤ ⎛ 1 ⎞2 n n ⎞ ⎤ E[Q1 ] = E ⎢⎜ ε kε l ⎥ = ⎜ ⎟ ∑∑ E[ε k ε l ] ∑ ε k ⎟ ⎥ = E ⎢⎜⎝ n − 1 ⎟⎠ ∑∑ k =2 l =2 ⎣⎢ ⎦⎥ ⎝ n − 1 ⎠ k = 2 l = 2 ⎣⎢⎝ n − 1 k = 2 ⎠ ⎦⎥ 2
2
1 ⎛ 1 ⎞ =⎜ ⎟ (n − 1) = n −1 ⎝ n −1⎠ 1 ⎞ ⎛ Sehingga diperoleh Q1 ~ N ⎜ 0, ⎟. ⎝ n −1 ⎠
Model semivariogram ditolak jika Q1 >
2 n −1
.
Staistik uji lainnya yang digunakan adalah statistik Q2 , yaitu Q2 =
1 n 2 ∑ε s . n − 1 s=2
(2.4)
15
Bab II Tinjauan Pustaka
Q2 adalah variabel acak dengan rataan E [Q2 ] = 1 1 ⎡ 1 n 2⎤ ⎡ 1 n 2⎤ E[Q2 ] = E ⎢ ε = E εk ⎥ = (n − 1) = 1 ∑ ∑ k ⎥ ⎢ ⎣ n − 1 k =2 ⎦ ⎣ n − 1 k =2 ⎦ n −1
[
]
dan variansi E (Q2 − 1) = 2
2 , n −1
Sehingga diperoleh (n − 1)Q2 ~ χ 2 n −1 . Model semivariogram ditolak jika Q2 > U atau Q2 < L .
II.5 Prediksi Kriging
Kriging adalah sebuah algoritma interpolasi untuk memprediksi suatu titik atau rata-rata blok yang tidak diambil sampelnya. Metode kriging merupakan sebuah metode yang memberikan estimasi linier terbaik dari suatu titik atau rata-rata blok, yaitu memberikan nilai variansi minimum. Metode ini dikenal dengan istilah BLUE (Best Linier Unbiased Estimation). Dalam hal ini, estimator adalah sebuah fungsi linier dari data dengan bobot dihitung sesuai pada syarat ketakbiasan dan variansi minimum. Bobot ditentukan dengan menyelesaikan sebuah sistem persamaan linier dengan koefisien yang tergantung hanya pada variogram yang menggambarkan struktur sebuah keluarga fungsi.
s2 s0
s1
s3
s4
Gambar II.5. Kriging Menurut Kitanidis (1997), dalam kriging nilai estimasi pada titik s 0 akan dihampiri oleh sejumlah n titik data dari Z ( s i ) dengan i = 1,2,..., n Estimator merupakan kombinasi linier nilai fungsi pada titik data dengan bobot λi , n Zˆ (s 0 ) = ∑i =1 λi Z (si )
dengan λi , i = 1, K , n adalah koefisien atau bobot..
(2.5)
16
Bab II Tinjauan Pustaka
Estimasi galat adalah selisih antara estimasi Zˆ (s 0 ) dengan nilai sebenarnya Z (s 0 ) , n Zˆ (s 0 ) − Z (s 0 ) = ∑i =1 λi Z (si ) − Z (s 0 )
Dalam kriging, estimator memenuhi tak bias, artinya rata-rata estimasi galat adalah nol.
[
]
E ⎡⎣ Zˆ ( s0 ) − Z ( s0 ) ⎤⎦ = 0 , atau E Zˆ (s 0 ) = E [Z (s0 )]
Selanjutnya adalah variansinya minimum, artinya rata-rata kuadrat estimasi galat adalah sekecil mungkin.
(
)
) ( [(
(
)])
2 Var Zˆ (s 0 ) − Z (s 0 ) = E ⎡⎢ Zˆ (s 0 ) − Z (s 0 ) ⎤⎥ − E Zˆ (s 0 ) − Z (s 0 ) ⎣ ⎦
2
(2.6)
Karena tak bias, maka persamaan (2.6) menjadi
(
)
(
)
2 Var Zˆ (s 0 ) − Z (s 0 ) = E ⎡⎢ Zˆ (s 0 ) − Z (s 0 ) ⎤⎥ ⎣ ⎦
Perdefinisi diperoleh
(
)
2 n E ⎡⎢ Zˆ (s 0 ) − Z (s 0 ) ⎤⎥ = ∑i −1 ⎣ ⎦
∑
n j =1
λi λ j Cov (si , s j ) − 2∑i =1 λi Cov(si , s 0 ) + Cov(s0 , s 0 ) n
(2.7)
Dengan menggunakan hubungan kovariansi dan semivariogram (persamaan 2.1), dimana h adalah jarak antara dua titik lokasi, maka dari persamaan (2.7) diperoleh,
(
)
2 E ⎡⎢ Zˆ (s 0 ) − Z (s 0 ) ⎤⎥ = −γ ( s 0 − s 0 ) − ∑ ⎣ ⎦ i
∑ j
(
)
λi λ j γ s i − s j + 2∑ λi γ ( s i − s 0
)
i
(2.8)
17
Bab II Tinjauan Pustaka
(
)
2 Nilai minimum dicapai pada saat turunan pertama dari E ⎡⎢ Zˆ (s 0 ) − Z (s 0 ) ⎤⎥ = 0 . ⎦ ⎣
Perdefinisi diperoleh turunan pertama dari persamaan (2.8) terhadap λi ,
(
)
2 d ⎛⎜ E ⎡⎢ Zˆ (s 0 ) − Z (s 0 ) ⎤⎥ ⎞⎟ ⎦⎠ ⎝ ⎣ = −2∑ λ j γ si − s j + 2γ ( s i − s 0 dλi j
(
)
)
(2.9)
Dengan membuat nilai persamaan (2.9) sama dengan nol, diperoleh:
(
)
− 2∑ λ j γ s i − s j + 2γ ( s i − s 0 ) = 0 j
(
)
2∑ λ j γ s i − s j = 2γ ( s i − s 0
)
j
Himpunan berbobot yang meminimumkan variansi error dapat ditulis dengan n + 1 persamaan berikut:
∑
(
)
λ j γ si − s j = γ ( si − s0
)
∀i = 1K n
j
Dalam bentuk matriks, ⎛ γ ( s1 − s1 ⎜ M ⎜ ⎜γ ( s − s n 1 ⎝
) )
K γ ( s1 − s n ) ⎞ ⎛ λ1 ⎞ ⎛ γ ( s i − s 0 ⎟⎜ ⎟ ⎜ M O M ⎟ ⎜ M ⎟ =⎜ ⎟ ⎜ ⎜ ⎟ L γ ( s n − s n )⎠ ⎝ λ n ⎠ ⎝ γ ( s n − s 0
) ⎞⎟ ⎟ )⎟⎠
(2.10)
Bentuk matriks (2.10) di atas dapat ditulis menjadi, ⎛ λ1 ⎞ ⎛ γ ( s1 − s1 ⎜ ⎟ ⎜ M ⎜ M ⎟ =⎜ ⎜ λ ⎟ ⎜γ ( s − s n 1 ⎝ n⎠ ⎝
) )
K γ ( s1 − s n O M L γ ( sn − sn
)⎞⎟
⎛ γ ( si − s0 ⎜ M ⎟ ⎜ ⎟ ⎜ )⎠ ⎝ γ ( s n − s0 −1
) ⎞⎟ ⎟ )⎟⎠
Untuk i = 1L n ; j = 1L n ; γ (si − s j ) merupakan konstanta. Selanjutnya matriks (2.11) dapat ditulis menjadi, ⎛ λ1 ⎞ ⎛ a11 K a1n ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ M ⎟ =⎜ M O M ⎟ ⎜λ ⎟ ⎜a ⎟ ⎝ n ⎠ ⎝ n1 L a nn ⎠
⎛ γ ( si − s0 ⎜ M ⎜ ⎜γ ( s − s n 0 ⎝
) ⎞⎟ ⎟ )⎟⎠
Untuk i = 1L n ; j = 1L n ; a ij merupakan konstanta.
(2.11)
18
Bab II Tinjauan Pustaka
(
)
Sehingga dapat diperoleh nilai, λi = ∑ aij γ s i − s j , i = 1L n j
Substitusi λi dalam persamaan (2.5) , sehingga diperoleh Zˆ (s 0 ) = ∑ β i γ ( s i − s 0 i
)
dengan β i = ∑ aij Z (s j )
(2.12)
j
Dalam pengolahan data, persamaan (2.12) menyatakan bahwa dengan memasukkan nilai koordinat titik observasi, maka akan diperoleh persamaan sebanyak i . Pada akhirnya akan diperoleh data hasil prediksi Zˆ (s 0 ) untuk masing-masing titik lokasi.