PENGGUNAAN METODE EMPIRICAL BEST LINEAR UNBIASED PREDICTION (EBLUP) PADA GENERAL LINEAR MIXED MODEL Tri Handhika Pusat Studi Komputasi Matematika (PSKM), Kampus D 139 Universitas Gunadarma
[email protected] Abstrak Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed Model. Parameter-parameter pada General Linear Mixed Model merupakan parameter untuk melihat efek fixed dan efek random dari variabel-variabel prediktor terhadap variabel respon. Dalam hal ini, metode yang digunakan untuk mencari taksiran parameter pada General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction (EBLUP). Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya. Metode yang digunakan untuk menaksir parameter dari variansi efek random adalah Metode Maximum Likelihood (ML). Kata kunci: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model. Abstract This paper aims to find the estimated parameters in the General Linear Mixed Model. Parameters in the General Linear Mixed Model are the parameter to see the fixed effects and the random effects of the predictor variables on the response variable. In this case, the estimation methods used to search the parameters in the General Linear Mixed Model is the Empirical Best Linear Unbiased Prediction (EBLUP) method. Unlike the Best Linear Unbiased Prediction (BLUP) method where the variance parameters of the random effects is known, the EBLUP method requires estimation of the variance parameters that in fact the value is not known. The method used to estimate the variance parameters of the random effects is the Maximum Likelihood (ML) method. Key word: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model. 1.
PENDAHULUAN
Pola hubungan antara variabel prediktor dengan variabel respon dapat dinyatakan dalam bentuk persamaan regresi di mana variabel prediktornya dapat berupa faktor fixed atau faktor random. Model regresi linier yang melibatkan lebih dari satu variabel prediktor 1
dengan satu variabel respon disebut model regresi linier berganda. Pada model ini diasumsikan bahwa variansi error spherical. Jika asumsi tersebut tidak dapat terpenuhi maka model tersebut dinamakan Generalized Linear Regression Model (GLRM) dengan asumsi variansi error nonspherical. Model GLRM yang dipengaruhi tidak hanya oleh efek fixed tetapi juga oleh efek random disebut General Linear Mixed Model. Makalah ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed Model sehingga dapat dilihat efek-efek dari variabel prediktor tersebut terhadap variabel respon. Terdapat bermacam-macam metode penaksiran parameter pada General Linear Mixed Model, di antaranya adalah Best Linear Unbiased Prediction (BLUP) dan EBLUP. Pada Makalah ini akan dibahas metode penaksiran parameter pada General Linear Mixed Model dengan Metode EBLUP yang merupakan perluasan dari Metode BLUP. Pada metode EBLUP, asumsi bahwa parameter dari variansi efek random diketahui tidak digunakan seperti halnya pada BLUP, melainkan akan diestimasi melalui Metode Maximum Likelihood (ML) yang akan dijelaskan lebih lanjut. Penaksiran ini dilakukan karena pada kenyataannya sulit untuk mengetahui parameter dari variansi efek random tersebut. 2.
MODEL Pada bagian ini diberikan General Linear Mixed Model adalah sebagai berikut: y X Zb e
(2.1)
di mana y
: vektor random dari variabel respon yang terobservasi berukuran n 1 di mana nilai observasinya disebut vektor data.
X
: matriks full rank berukuran n k dari variabel prediktor yang elemen-elemennya diketahui.
: vektor parameter bersifat fixed berukuran k 1 yang tidak diketahui dan tidak terobservasi.
Z
: matriks full rank berukuran n h dari variabel prediktor yang elemen-elemennya diketahui.
b : vektor random parameter yang tidak diketahui dan tidak terobservasi berukuran h 1 .
e
: vektor random error yang tidak terobservasi berukuran n 1 .
2
dengan asumsi
E b 0 , E e 0 , Var b E bbT G , Var e E eeT R , di mana b dan e independently distributed sedangkan G dan R adalah matriks varians kovarians yang
tergantung pada vektor parameter dari variansi efek random, yaitu 1 , 2 ,, q . T
Oleh
b
karena
cov b, e E be
T
dan
e
independen,
corr b, e 0
maka
sehingga
E eb 0 . Berikut ini diberikan bentuk dari matriks G dan R: T
g11 g12 g g 22 G 21 g h1 g h 2 r11 r12 r r22 R 21 rn1 rn 2
g1h g2h g hh r1n r2 n rnn
Prosedur penaksiran parameter dengan menggunakan Metode Best Linear Unbiasd Prediction (BLUP) dimulai dengan memisalkan nilai-nilai dari vektor random b yang dapat dinotasikan dengan di mana berbentuk vektor. Ingin diketahui pengaruh dari efek fixed dan efek random (tetapi bukan error) yang merupakan kombinasi linier dari T dan . Misalkan T y c l y adalah sembarang penaksir dari kombinasi linier
T T di mana c suatu nilai konstanta dan l suatu vektor konstanta sedangkan berukuran k 1 dan berukuran h 1 . T y dapat mengestimasi kombinasi linier
tersebut jika T y merupakan penaksir yang unbiased dan linier di mana definisi masing-
T T masingnya adalah sebagai berikut, T y disebut unbiased jika E T y E b ,
dan disebut linier jika T ay1 by 2 aT y1 bT y 2 .
T T Diketahui bahwa dapat diestimasi oleh T y jika dan hanya jika c 0 dan T merupakan kombinasi linier dari baris-baris X . Selanjutnya, ambil sembarang T T yang merupakan kombinasi linier yang dapat diestimasi kemudian 2 T T definisikan t T T b . Selain itu, definisikan pula E T y b sebagai Mean Squared Error (MSE) dari penaksir T y .
3
Dengan menggunakan Metode Best Linear Unbiased Prediction (BLUP) di mana diasumsikan diketahui, didapat ˆ y dan ˆ y sedemikian sehingga
ˆ y XT 1 X
1
X T 1 y
(2.2)
dan ˆ y G ZT 1 y Xˆ y
(2.3)
di mana
R ZGZT .
Dengan demikian, Best Linear Unbiased Predictor (BLUP) dari adalah
ˆ y T ˆ y T ˆ y
(2.4)
yang memiliki MSE terkecil dari semua taksiran yang unbiased dan linier. Detail penurunan rumus dapat dilihat pada Makalah Phydelya dengan judul “Penggunaan Metode Best Linear Unbiased Prediction pada Generalized Linear Mixed Model”.
3.
HASIL
3.1.
Penaksiran Parameter pada General Linear Mixed Model dengan Asumsi b dan e Berdistribusi Normal
Pada Bagian sebelumnya telah dijelaskan mengenai penggunaan Metode Best Linear Unbiased Prediction (BLUP) dalam penaksiran pada General Linear Mixed Model tanpa asumsi distribusi. Pada dasarnya Metode EBLUP adalah suatu metode penaksiran parameter pada General Linear Mixed Model yang merupakan perluasan dari Metode ˆ BLUP dengan menggunakan taksiran parameter dari variansi efek random yang pada
kenyataannya parameter tersebut tidak diketahui nilainya. Metode penaksiran yang digunakan pada Makalah ini adalah Metode ML yang memerlukan asumsi distribusi. Oleh sebab itu, diasumsikan bahwa b dan e berdistribusi normal. Dikarenakan taksiran parameter pada General Linear Mixed Model yang telah didapat sebelumnya ((2.2)) dan (2.3)), yaitu ˆ dan ˆ , didapat tanpa asumsi distribusi maka harus dicari taksiran parameter pada General Linear Mixed Model dengan asumsi b dan e berdistribusi normal yang dinotasikan dengan dan . 4
Dengan asumsi b dan e berdistribusi normal, parameter pada General Linear Mixed Model, yaitu dan dapat ditaksir menggunakan Metode ML. Metode ini memerlukan fungsi
likelihood
yang
joint
merupakan
pdf
dari
y y1 , y 2 ,, y n
T
dan
1 , 2 ,, h . Joint pdf tersebut dapat dinyatakan sebagai berikut: T
f y, g y | h
(3.1.1)
g y | g
(3.1.2)
di mana
Oleh sebab itu, (3.1.1) dapat ditulis sebagai
f y, g h di mana h
1
2
n
1 exp T G -1 . 2 G 2 1
2
sehingga diperoleh L , ; y f y, g h
1
2 G n
R
1
2
1 exp T R -1 T G -1 2
.
Oleh karena ingin dicari taksiran dari dan menggunakan Metode ML, agar lebih mudah dalam hal perhitungannya akan digunakan fungsi log-likelihood, yaitu: 1 ln L , ; y c (y T R -1y y T R -1X y T R -1Z T XT R -1y T XT R -1X T XT R -1Z 2 T ZT R -1y T ZT R -1X T ZT R -1Z T G -1 )
(3.1.3) dengan c ln 2
n
G R
1
2
suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut diturunkan terhadap masing-masing dan kemudian dicari penyelesaiannya sehingga didapat
5
XT R -1X XT R -1Z XT R -1y
(3.1.4)
ZT R -1X ZT R -1Z G -1 ZT R -1y.
(3.1.5)
Selanjutnya, dengan proses eliminasi didapat
XT R -1 R -1Z ZT R -1Z G -1
dan
1
X R
ZT R -1 X
1
T
-1
R -1Z ZT R -1Z G -1
1
Z T R -1 y
(3.1.6)
ZT R -1Z G -1
1
ZT R -1 y X .
(3.1.7)
Jadi, selain ˆ dan ˆ yang didapat tanpa asumsi distribusi, terdapat pula dan yang merupakan taksiran parameter pada General Linear Mixed Model dengan mengasumsikan b dan e berdistribusi normal. Selanjutnya, untuk penaksiran menggunakan Metode ML seharusnya memerlukan dan yang didapat dengan asumsi b dan e berdistribusi normal. Akan tetapi, berikutnya akan dibuktikan bahwa dan yang didapat dengan asumsi b dan e berdistribusi normal tersebut, ternyata identik dengan ˆ dan ˆ yang diperoleh tanpa asumsi distribusi. Oleh karena itu, untuk seterusnya penaksiran akan menggunakan ˆ dan ˆ .
3.2.
Memeriksa bahwa Taksiran Parameter pada General Linear Mixed Model yang didapat dengan atau tanpa Asumsi b dan e Berdistribusi Normal adalah Identik
Telah diketahui dari (2.2) dan (2.3) bahwa taksiran parameter pada General Linear Mixed Model tanpa asumsi distribusi adalah ˆ dan ˆ . Sedangkan, taksiran parameter pada General Linear Mixed Model dengan asumsi b dan e berdistribusi normal diberikan oleh (3.1.6) dan (3.1.7). Dari (3.1.6), misalkan:
W R -1 R -1Z ZT R -1Z G -1
1
ZT R -1.
(3.2.1)
Oleh karena dapat dibuktikan bahwa W I , maka terbukti pula bahwa ˆ .
6
(3.2.2)
T -1 -1 T -1 T 1 Selain itu, dapat dibuktikan pula bahwa Z R Z G Z R GZ sehingga dapat disimpulkan bahwa 1
ˆ
(3.2.3)
Berdasarkan (3.2.2) dan (3.2.3) terbukti bahwa dengan atau tanpa asumsi b dan e berdistribusi normal kedua jenis taksiran parameter pada General Linear Mixed Model tersebut identik sehingga taksiran parameter yang didapat dengan asumsi b dan e berdistribusi normal juga memiliki sifat linear, unbiased, dan best.
3.3.
Penaksiran Parameter dari Variansi Efek Random
Pada Makalah ini, Metode ML digunakan untuk menaksir pada General Linear Mixed Model. Oleh karena itu, dibutuhkan fungsi likelihood yang merupakan joint pdf dari T y y1 , y 2 ,, y n sehingga fungsi likelihood-nya adalah sebagai berikut:
L , ; y f y
1
2
n
2
T 1 exp y X -1 y X 2 (3.3.1) 2 1
Sebagaimana sebelumnya, Metode ML menggunakan fungsi log-likelihood, yaitu: 1 T ln L , ; y c ln y X -1 y X (3.3.2) 2
n dengan c ln 2 adalah suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut 2 diturunkan terhadap , dinotasikan dengan s , , sehingga untuk elemen ke-j didapat formula berikut ini:
1 1 T s j , tr -1 j y X -1 j -1 y X 2 2
dengan j
(3.3.3)
. j
Sesuai dengan Metode ML, berikutnya (3.3.3) dicari solusinya menjadi
tr -1 j y Xˆ -1 j -1 y Xˆ T
7
(3.3.4)
Terlihat dari (3.3.4) tidak dapat diselesaikan secara analitik. Oleh karena itu, taksiran dengan Metode ML kemudian diselesaikan secara numerik. Pada Makalah ini, a1 algoritma yang digunakan adalah Scoring Algorithm di mana iterasi ke- a 1 , yaitu ˆ , secara iteratif menggunakan formula sebagai berikut:
s ˆ ˆ , ˆ
ˆ a 1 ˆ a ˆ a
1
a
a
dengan
T
s ˆ , ˆ s1 ˆ , ˆ , s2 ˆ , ˆ , , sq ˆ , ˆ
T T T dan ˆ 1 ˆ 2 ˆ q ˆ
T
di mana 2 ln L , ; y 1 -1 -1 jk E tr j k 2 k j
(3.3.5)
Berdasarkan penjabaran di atas, didapatkan taksiran parameter dari variansi efek random ˆ secara numerik yang selanjutnya akan digunakan dalam penaksiran parameter
pada General Linear Mixed Model sesuai dengan Metode EBLUP. 3.4.
Penaksiran Parameter pada General Linear Mixed Model dengan Metode EBLUP
Taksiran parameter pada General Linear Mixed Model dengan menggunakan Metode EBLUP didapat dengan mensubstitusikan taksiran , dinotasikan dengan ˆ y , ke ˆ dan ˆ , yaitu:
ˆ ˆ y , y XT 1 ˆ X
1
XT 1 ˆ y dan
ˆ ˆ y , y G ˆ ZT 1 ˆ y Xˆ ˆ y , y
Berdasarkan (2.4) taksiran kombinasi linier yang baru adalah sebagai berikut:
ˆ ˆ y y T ˆ ˆ y y T ˆ ˆ y y .
8
(3.4.1)
Oleh karena ˆ ˆ y y tersebut didapat dengan mensubstitusikan ˆ y ke ˆ dan ˆ , maka perlu dibuktikan ketakbiasan dari taksiran tersebut. Sebelumnya diketahui lemma berikut ini: Lemma 3.1 Jika z adalah vektor random berdistribusi simetris di sekitar nol sedemikian sehingga z dan z identically distributed, dan f z adalah variabel random yang merupakan fungsi ganjil dari z sehingga f z f z , maka f z berdistribusi simetris di sekitar nol.
ˆ Sebelumnya diketahui bahwa E ˆ y y berhingga dan ˆ y merupakan fungsi genap serta translation-invariant dari y sehingga didapat ˆ y ˆ y X ˆ Zb e ˆ Zb e (3.4.2) ˆ Oleh karena terbukti bahwa E ˆ y y t 0 maka dapat disimpulkan bahwa
ˆ ˆ y y tetap unbiased untuk mengestimasi T T . 4.
PENERAPAN
Sebuah Waralaba makanan cepat saji ingin menambahkan produk makanan baru dalam daftar menunya. Oleh sebab itu, pihak marketing mengusulkan kepada pihak manajemen tiga pilihan bentuk promosi atau campaign X yang akan diujicobakan di
enam lokasi Waralaba atau location Z yang dipilih secara acak dari sepuluh Waralaba yang ada. Namun, selama satu bulan pertama pihak manajemen ingin melihat terlebih dahulu seberapa besar pengaruh masing-masing bentuk promosi dan lokasi Waralaba dalam meningkatkan penjualannya (sales). Diasumsikan bahwa matriks-matriks varians kovarians dari e dan b, yaitu R 0 I r dan G 1I g di mana 0 dan 1 merupakan parameter dari
variansi e dan b sedangkan I r dan I g merupakan matriks identitas berukuran 30 30 dan 6 6 . Sebelum melakukan penaksiran parameter pada General Linear Mixed Model, perlu diperiksa terlebih dahulu kenormalan dari variabel dependen (Sales). Dengan menggunakan Metode EBLUP didapatkan taksiran dari parameter-parameter tersebut, yaitu sebagai berikut. T ˆ 46.0171, 832.7489 ˆ 230.0812, 191.1613, 218.5482
T
T ˆ 53.4308, -0.2670, -38.0198, -5.1867, 11.8286, -21.7859 .
9
5.
KESIMPULAN
Dari pembahasan Makalah ini dapat disimpulkan bahwa Metode Empirical Best Linear Unbiased Prediction (EBLUP) yang merupakan perluasan dari Metode Best Linear Unbiased Prediction (BLUP) dapat digunakan untuk menaksir parameter pada General Linear Mixed Model dengan terlebih dahulu melakukan penaksiran terhadap parameter dari variansi efek random yang pada kenyataannya tidak diketahui nilainya. REFERENSI Anton, H. (2000), Dasar-Dasar Aljabar Linier, Batam: Interaksara. Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications, New York: Springer. Harville, D. A. (1997), Matrix Algebra from A Statistician’s Perspective, New York: Springer. Kackar, R. N., and Harville, D. A. (1981), Unbiasedness of Two-stage Estimation and Prediction Procedures for Mixed Linear Models, Communications in Statistics, Series A, 10, 1249-1261. McCulloch, C. E., and Searle, S. R. (2001), Generalized, Linear, and Mixed Models, New York: John Wiley and Sons. Phydelya, A. (2007), Penggunaan Metode Best Linear Unbiased Prediction pada Generalized Linear Mixed Model, Depok: Departemen Matematika FMIPA UI. Searle, S.R., Casella, G., and McCulloch, C. E. (1992), Variance Components, New York: Wiley.
10