TINJAUAN PUSTAKA
Bayesian Networks BNs dapat memberikan informasi yang sederhana dan padat mengenai informasi peluang. Berdasarkan komponennya BNs terdiri dari Bayesian Structure (Bs) dan Bayesian Parameter (Bp) (Cooper & Herskovits 1992). Bs merupakan sebuah graf Directed Acyclic Graph (DAG) yang menggambarkan ketergantungan antar setiap peubah, dan Bp merupakan himpunan dari parameter dari sebaran peluang bersyarat setiap peubah berdasarkan graf tersebut. Bs terdiri dari node yang merepresentasikan peubah-peubah dan edge
yang merepresentasikan
hubungan ketergantungan antar node seperti pada Gambar 1. Setiap node yang dihubungkan secara langsung, menunjukan hubungan ketergantungan. Misalkan himpunan dari node dinyatakan dengan {Y1,…,Yn}, jika terdapat edge dari node Yj ke node Yk, dikatakan bahwa Yj adalah parent dari Yk, dan Yk adalah child dari Yj. Himpunan parent dari node Yi dinotasikan sebagai Π . Sebagai contoh, berdasarkan Gambar 1 parent untuk Y2 adalah Y1 dan child untuk Y2 adalah Y3 dan Y4. Y1
Node
Edge
Y2
Y3
Y4
Gambar 1 Directed Acyclic Graph Struktur ketergantungan atau kebebasan yang digambarkan dengan DAG dapat diterjemahkan
kedalam fungsi kepekatan bersama dari peubah-peubah
dengan jalan mengalikan semua peluang berdasarkan parent-nya sebagai berikut:
P( y1 , y 2 ,..., y n ) =
n
∏ P( yi | π i ) i =1
(1)
Berdasarkan persamaan (1) dapat diketahui bahwa DAG ini mendefinisikan dekomposisi dari fungsi peluang berdimensi besar ke dalam sebaran lokal bedimensi rendah. Berdasarkan jenis peubah, ada dua tipe BNs yaitu Multinomial BNs untuk peubah diskret dan Gaussian BNs untuk peubah kontinyu.
Multinomial Bayesian Networks Dalam multinomial BNs diasumsikan bahwa semua peubah adalah diskret, di mana setiap peubah memiliki himpunan nilai yang terbatas, dan bahwa peluang bersyarat untuk setiap peubah berdasarkan parent-nya menyebar multinomial. Menurut Cooper dan Herskovits (1992) nilai harapan dari peluang bersyarat dalam jaringan didefinisikan
|
peluang bersyarat memiliki nilai dengan
sebagai berikut: Misal
dinotasikan sebagai
, yang merupakan peluang bahwa
, k=1,2,…, ri, dengan syarat parent dari xi, yang dinyatakan
memiliki nilai wij. Bila
sebagai peluang bersyarat dari jaringan
(network conditional probability), Nijk adalah banyak node ke-i yang memiliki ∑
nilai parent ke-j untuk kategori ke-k,
dan misalkan
dinotasikan
sebagai asumsi di mana : 1. Semua peubah merupakan peubah diskret 2. Setiap observasi saling bebas 3. Tidak ada data hilang dari setiap peubah 4. Fungsi kepekatan peluang f(BP|Bs) adalah uniform, maka nilai
,
,
, yang merupakan nilai harapan dari
himpunan pengamatan D, struktur jaringan Bs, dan asumsi
berdasarkan
dinyatakan sebagai
berikut:
E(θ ijk | D, BS , δ ) =
N ijk + 1 N ij + ri
(2)
sedangkan ragamnya adalah:
Var (θ ijk | D, BS , δ ) =
( N ij + 1)( N ij + ri − N ijk − 1) ( N ij + ri ) 2 ( N ij + ri + 1)
(3)
Gaussian Bayesian Networks Dalam Gaussian BNs, semua peubah diasumsikan menyebar Normal ganda, yaitu:
f ( x ) ~ N (μ , Σ )
(4)
μ adalah vektor rataan berdimensi n, Σ adalah matrik peragam berukuran n×n, |Σ| adalah determinan dari Σ, dan μT dinotasikan sebagai transpos dari μ. Peluang bersyarat untuk setiap node berdasarkan parent-nya untuk Gaussian
BNs adalah sebagai berikut (Cano et al. 2004) :
⎛ f ( xi | π i ) ~ N ⎜ μ i + ⎜ ⎝
⎞ i = 1,2,...., n (5) ⎟ j = 1,2,..., n − 1 ⎠
i −1
∑ β ij (x j − μ j ), vi ⎟; j =1
adalah koefisien regresi antara node ke-i dengan parent ke-j dan Σ Π ΣΠ ΣTΠ adalah conditional variance dari Xi, dengan syarat Π
Σ , di mana
Σ adalah unconditional variance dari Xi, Σ Π adalah vektor dari peragam antara Xi dan peubah-peubah didalam Π , dan ΣΠ adalah matrik peragam dari Π . Sebagai catatan bahwa
mengukur kekuatan hubungan antara Xi dan Xj. Jika
0, maka Xj bukan merupakan parent untuk Xi. Gaussian BNs terdiri dari kumpulan parameter
,…,
,
,…,
, dan
|
.
Pembentukan Struktur BNs Berdasarkan Data Permasalahan yang dihadapi adalah menentukan struktur yang terbaik dari semua struktur yang mungkin. Banyaknya kemungkinan struktur untuk n node diformulasikan sebagai berikut (Cooper & Herskovits 1992):
f ( n) =
n
∑ (−1) i =1
i +1 ⎛ n ⎞ i ( n −i ) ⎜ ⎟2 ⎝i⎠
f (n − i )
(6)
pada persamaan 6 terdapat batasan untuk f(0)=1, banyaknya struktur untuk beberapa n dapat dilihat pada Tabel 1: Tabel 1 Banyaknya struktur untuk n node n
Jumlah Struktur
2
3
3
25
5
29000
10
4.2 ×1018
Jika diasumsikan bahwa peubah tersebut diurut, dimana jika Yi mendahului Yj dalam urutan, maka tidak diperbolehkan terdapat tanda panah dari Yj ke Yi. Berdasarkan aturan pengurutan tersebut maka kemungkinan struktur BNs yang dapat terbentuk sebanyak 2
2
kemungkinan. sehingga perlu suatu
algortima yang memberikan struktur terbaik. Salah satu algoritma dalam mencari struktur Bayes adalah algoritma K2.
Algoritma K2 Algoritma K2 menentukan struktur jaringan BS yang memaksimalkan P(BS,D) dengan mengasumsikan bahwa peubah tersebut terurut. Algoritma ini diawali dengan mengasumsikan bahwa setiap node tersebut tidak punya parent, kemudian
dilakukan
penambahan
parent
dimana
penambahan
tersebut
meningkatkan peluang dari hasil akhir struktur. Jika penambahan perents sudah tidak lagi meningkatkan peluang dari hasil akhir struktur, maka penambahan
parent dihentikan. Adapun fungsi yang menjadi acuan peningkatan nilai dari peluang strukturnya adalah:
g (i, π i ) =
qi
(ri − 1)!
ri
∏ (N ij +ri − 1)! ∏ N ijk ! j =1
k =1
(7)
Nijk dihitung relatif terhadap πi yang merupakan parent dari yi dan relative terhadap himpunan pengamatan D. Fungsi Pred(yi) merupakan fungsi yang mengembalikan himpunan dari node yang mendahului yi dalam urutan node. Adapun algoritma K2 adalah (Cooper & Herskovits 1992): Procedure K2 For i:=1 to n do πi = φ; Pold = g(i, πi ); OKToProceed := true while OKToProceed and | πi |
Pold then Pold := Pnew ; πi :=πi ∪{v} ; else OKToProceed := false; end {while} write(“Node:”, “parent of this nodes :”, πi ); end {for} end {K2}
Autoregressive Integrated Moving Average Box dan Jenkins (1976) secara efektif telah berhasil mencapai kesepakatan mengenai informasi relevan yang diperlukan untuk memahami dan memakai model-model ARIMA untuk deret waktu peubah tunggal. Alur pendekatan BoxJenkins tercantum pada Gambar 2, yang terdiri dari tiga tahap : identifikasi,
penaksiran dan pengujian, serta penerapan (Makridakis et al. 1988). Secara umum untuk proses AR orde ke-p dapat dinyatakan sebagai berikut:
X t = μ '+φ1 X t −1 + φ 2 X t −2 + .... + φ p X t − p + et
di mana
(8)
merupakan nilai konstanta,
adalah parameter autoregressive ke-j
merupakan nilai kesalahan pada saat t. Untuk model MA secara umum
dan
dapat dinyatakan sebagai berikut:
X t = μ + et − θ 1 et −1 − θ 2 et −2 − ... − θ q et −q
(9)
dimana
sampai
pada saat t-k dan
adalah parameter-parameter MA,
adalah nilai kesalahan
adalah suatu konstanta.
Rumuskan kelompok model‐model yang umum
Tahap Identifikasi
Penetapan model untuk sementara
Penaksiran parameter pada model sementara
Tahap Penaksiran dan Pengujian Tidak
Apakah model memadai? Ya
Tahap Penerapan
Gunakan model untuk peramalan
Gambar 2 Skema pendekatan Box-Jenkins
Validasi Silang Menurut Naes et al. (2002) validasi silang merupakan langkah meramalkan nilai-nilai peubah tak bebas dengan model yang sudah dimiliki. Semakin dekat hasil peramalan dengan data aktual menunjukan semakin baiknya model. Nilai Root Mean Square Error of Prediction (RMSEP) dapat digunakan untuk melihat keeratan hubungan antara nilai amatan dengan nilai peramalan. Nilai RMSEP yang mendekati nol menunjukan kedekatan hasil ramalan dengan data aktual. Nilai RMSEP dirumuskan sebagai berikut: ⎛ ⎜ ⎜ RMSEP = ⎜ ⎜ ⎜ ⎜ ⎝
dimana serta
np
∑ (Yˆi − Yi )
2
i =1
np
merupakan data dugaan respon ke-i,
(10)
adalah data aktual respon ke-i
merupakan banyaknya pengamatan untuk peramalan.
1/ 2
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠