Pendeteksian Outlier pada Pengamatan dalam Model Linear Multivariat dengan Metode Likelihood Displacement Statistic-Lagrange

62

Pendeteksian Outlier...........(Makkulau et al.)

Pendeteksian Outlier pada Pengamatan dalam Model Linear Multivariat dengan Metode Likelihood Displacement Statistic-Lagrange Outlier Detection in Observation at Multivariate Linear Models with Likelihood Displacement Statistic-Lagrange Method Makkulau 1), Susanti Linuwih 2), Purhadi 2) & Muhammad Mashuri 2) 1)

2)

Jurusan Matematika, FMIPA Universitas Haluoleo, Kendari Jurusan Statistika, FMIPA Institut Teknologi Sepuluh Nopember

ABSTRACT There are two different outliers, i.e outlier in observations and outlier in models. The existing outlier detection method in models is using common Likelihood method. The limitation of this method is the optimal value produced might be not the real optimal values. This research yields a method for outlier detection in multivariate linear models with Likelihood Displacement Statistic-Lagrange method (LDL method). This method uses multiplier Lagrange with constraint the confidence interval of parameter’s vector. This parameter’s vector is obtained from the data set which is outlier free. This parameter estimation process uses numerical method with Karush-Kuhn Tucker condition in nonlinear programming. This method compares between LDL value and the table F value that follows the distribution of F value to indentify the outlier in models. Keywords : Distribution of F, Likelihood Displacement Statistic-Lagrange, multivariate linear models, nonlinear programming, outlier detection PENDAHULUAN Outlier merupakan pengamatan yang menyimpang sedemikian jauh dari pengamatan lain (Hawkins 1980), dapat mempunyai efek bagi pengambilan suatu kesimpulan atau keputusan pada penelitian. Outlier dibedakan atas outlier pada pengamatan univariat atau multivariat dan outlier pada model linear univariat atau multivariat. Pendeteksian outlier pada model linear telah dilakukan antara lain oleh Srivastava & von Rosen (1998), Cook (2000), Adnan et al. (2003), dan Diaz-Garcia et al. (2007). Xu et al. (2005) mengembangkan jarak Cook’s univariat untuk mendeteksi outlier pada model linear multivariat. Metode yang digunakan adalah Metode Likelihood Displacement Statistic (Metode LD), yaitu suatu metode yang menghilangkan pengamatan yang outlier pada model; Metode Likelihood Ratio Statistic for a Mean Shift (Metode LR), yaitu suatu metode dengan cara pergeseran rata-rata pada model; dan Metode Multivariate Leverage yang mengguna-kan elemen dari the average diagonal

QAm untuk mengukur keekstriman

dari m pengukuran pada variabel independen. Makkulau et al. (2008) membahas prosedur Metode LD sedangkan Makkulau et al. (2009)

membahas aplikasinya di Pabrik Gula Djombang Baru Jombang Provinsi Jawa Timur. Xu et al. (2005) dalam mengestimasi parameter dengan Metode LD dari model linear multivariat bersifat umum, sehingga nilai optimal yang diperoleh dari fungsi tujuan dapat saja bukan merupakan nilai yang paling optimal. Oleh karena itu digunakan pengganda Lagrange, sehingga nilai optimal yang diperoleh merupakan nilai yang paling optimal pada daerah kepercayaan yang telah ditentukan. Penelitian ini mengkaji tentang pendeteksian outlier pada pengamatan dalam model linear multivariat sebagai pengembangan Metode LD dengan menggunakan pengganda Lagrange yang disebut Metode Likelihood Displacement Statistic-Lagrange (Metode LDL). Pengganda Lagrange yang digunakan adalah daerah kepercayaan dari vektor parameter dimana pengamatan yang diduga outlier telah dihilangkan. Model linear multivariat Model linear multivariat adalah model linear dengan variabel dependen lebih dari satu (Christensen 1991). Misalkan X 1 , X 2 , L , X p adalah variabel independen dan Y1 , Y2 , L , Yq

63


adalah variabel dependen, jika dilakukan n pengamatan yang diambil pada setiap variabel dependen yang ditulis yi1 , yi 2 , L , yiq dimana i = 1, 2, L , n, atau:

yih = β 0 h + β1 h X1i

+2 βh X2i L

+

+ βXip

ph

ih

+ε

dimana h = 1, 2, L , q. Model linear multivariat yang terdiri dari q model linear secara simultan dapat ditulis sebagai: Y = XB+ E (1) dengan

[

]

Ynxq = Y1 , Y2 , L , Y q , % % % X nx( p+ 1) = 1, X ,1 X L ,2 , X p , % % % % B ( p +1) xq = � β , β , L , β , � q �1 2 � % % % dan E nxq = ε1, ε 2, L, εq . %% %

[

E ( E ) =0

]

dan matriks varian-

*

h = 1, 2, L , q, sehingga E ~ N p ( Σ0, ￄ I ) n. Dengan mengestimasi parameter B pada (1), maka diperoleh: −1

T

X Y

.

(2)

Estimasi parameter Σ pada (1), yaitu: ˆ = 1 ( Y − XBˆ ) T ( Y − XBˆ ) Σ n

adalah estimator bias untuk Σ. Sedangkan estimasi parameter Σ yang lain adalah: 1 T S= Y ( − XB ˆ ) Y−( XB ˆ ) S n − rank( X) merupakan estimator tak bias untuk Σ. Vektorisasi matriks variabel dependen pada (1) ditulis Vec( Y ) (Christensen 1991) adalah: ˆ Σ

Vec ( Y ) = (I

q

� X Vec ) E ) B+( Vec

Dimana Vec ( E ) ~ N p ( 0Σ , ￄI

n

)

X

T

hasil

kali

) Vec (Y)

dan distribusi Vec ( Bˆ ) adalah:

(

(

T Vec ( Bˆ ) ~ N q ( p +1) Vec ( B ) , Σ ￄ X X

)

−1

)

Prosedur uji hipotesis parameter pada model linear multivariat adalah: H 0 : Λ B = 0 terhadap H 1 : Λ B ￄ 0 T

T

)

(

(

)

)

−1

(

T −1 X X ˆB

Λ

T

)

−1

) ˆΛB T

T

P M.

M MP adalah matriks proyeksi pada H .

hh

)

−1

(

( )

T

)

sifat

dimana M MP = MP P T MP

*

(

(

(

Var ( EΣ ) = Iￄ n, kovariansi-nya adalah dimana ￄ adalah perkalian Kronecker dan h = 1, 2, L , q , Σ= σ dengan

ˆ = X X B

(

T Vec ( Bˆ ) = I q ￄ X X

T T T H ￄ Y MMP Y= Λ ˆ B

Estimasi parameter dan uji hipotesis model linear multivariat Pada model linear multivariat matriks error E nxq = ( εih ) merupakan matriks acak, dimana i = 1, 2, L , ndan h = 1, 2, L , q. Diasumsikan juga bahwa

Dengan menggunakan kronecker diperoleh:

)�

dimana Λ T = PT X dan P adalah matriks ortogonal (Christensen 1991). Uji ini didasarkan pada statistik uji:

]

[

Vec( Y ) ~N nq ( ( Iq � )X Vec ( Σ) B I ,

dan

( )

(3)

(

M=X X X T

)

−1

X

T

M adalah matriks proyeksi pada ruang kolom dari X. Hipotesis nol ditolak jika nilai maksimum dari likelihood di bawah H 0 lebih besar dari nilai maksimum keseluruhan. Outlier pada pengamatan dalam model linear multivariat Outlier pada pengamatan dalam model linear multivariat dapat dibagi atas 3 kategori, yaitu outlier terhadap nilai X; outlier terhadap nilai Y; dan outlier terhadap nilai X dan Y. Outlier dapat diklasifikasikan ke dalam empat kelompok berdasarkan penyebabnya, yaitu observasi umum; titik leverage baik; outlier vertikal; dan titik leverage jelek (Rousseeuw & Hubert 1997). Metode pendeteksian Outlier pada pengamatan dalam model linear multivariat Fungsi likelihood dalam model linear multivariat ditulis sebagai berikut (Christensen 1991 serta Rencher & Schaalje 2008): nq

L ( B,Σ ) = ( 2π ) 2Σ −

dimana

(

∆= −

1 2

(

tr Σ

−1

−

n 2

exp∆

( )

( Y − XB ) ( Y − XB ) ) T

(4)

)

Pendeteksian outlier pada pengamatan dalam model linear multivariat oleh Xu et al. (2005) mengembangkan jarak Cook’s univariat

n

Jurnal ILMU DASAR Vol. 12 No. 1. 2011 : 62 - 67

dengan menggunakan Metode LD, Metode LR, dan Metode Multivariate Leverage. Pendeteksian outlier dengan Metode LD dilakukan dengan cara menghilangkan pengamatan yang outlier pada model. Misalkan ada m pengamatan dikumpulkan pada himpunan tertentu, dengan m pengamatan diduga outlier. Indeks Am adalah kumpulan dari m pengamatan yang diduga outlier. Dengan kata lain, indeks Am artinya ada outlier, sehingga: YA : himpunan dari variabel dependen dengan m

pengamatan yang ada outlier. C

YA : himpunan dari variabel dependen dengan m

pengamatan tanpa outlier. Berikut adalah definisi dari fungsi Likelihood Displacement Statistic (LD) untuk pengamatan yang ada outlier. Definisi 1 (Christensen 1991) LD dengan pengamatan yang ada outlier untuk B dengan diberikan Σ adalah: C C LDA ( BΣ ) = (2 ln L ( ˆB, ˆΣ) −ln L( ˆB A ,( ˆΣ ˆB) ) )A (5) ˆ Bˆ C dimana Σ adalah estimasi maksimum m

(

m

)

Am

m

likelihood dari Σ ketika B diestimasi oleh C Bˆ . Am

64

dan estimator dari Σ dengan pengamatan ˆ Bˆ C adalah: tanpa outlier yaitu Σ A

(

m

)

n

−1 1 T Σˆ − Eˆ A ΙQ − A E ,ˆ A n −m sehingga fungsi likelihood dalam model linear multivariat dengan pengamatan yang ada outlier adalah: C C LDA ( BΣ ) = 2 ln L ( ˆB, ˆΣ) −ln L ˆB A, ˆΣ ˆB A

( ) = n− m

C Σˆ Bˆ A

(

m

m

(

m

(

)

m

( ))) m

m

m

Optimasi nonlinear Masalah optimasi ditentukan oleh karakteristik fungsi tujuan dan fungsi kendala. Permasalahan optimasi disebut nonlinear jika fungsi tujuan dan fungsi kendalanya mempunyai bentuk nonlinear pada salah satu atau keduanya (Bazaara et al.1993). Pada optimasi dengan kendala, persamaan yang akan dioptimasi dapat dituliskan sebagai berikut: Maksimumkan (minimumkan): g ( Z ) = g ( Z1 , Z 2 ,L , Z p )

Kendala : k p ( Z ) = b p dan Z ￄ 0. Optimasi dengan kendala ini dapat diselesaikan dengan menggunakan pengganda Lagrange seperti berikut ini: L = g ( Z) −

n

￥λ ( k ( Z ) − b ) . p

p

p

p =1

Definisi 2 (Christensen 1991) LD dengan pengamatan yang ada outlier dan bersyarat adalah: ˆ B ˆ) , Σ ( Lￄ− lnￄ) ) LDA ( B1 ,Σ 1 B 2, Σ ) 2= ( 2L ( ln , m

(6) dimana:

(

(

C C ￄ = Bˆ 1 A ,Σˆ Bˆ 1 A

ￄ =

m

{ ( Bˆ

(

m

))

C ,Σˆ Bˆ 2 A

C 2 Am

{ }

m

) ) } ( Bˆ

C 1 Am

(

, Σˆ Bˆ

C

))

1 Am

menotasikan suatu fungsi C bentuknya θˆ θˆ 2

(

1 Am

yang

)

Estimator dari B dengan pengamatan tanpa outlier adalah:

(

(

)

)

−1 C T T Bˆ A = Bˆ − X X ΙX A Q m

−1

,ˆ A

−E A

m

m

m

dimana QA = m

(

(

XA

) )

−1 T X X ; EˆXA A =

T

m

Ι + Ι − QA

m

mm

−1

(

YA

m

Q A = Ι − QA m

−.XA Bˆ

T m

m

)

−1

METODE Pembahasan dalam makalah ini dilakukan dengan pendekatan teoretik. Secara garis besar, langkah pertama yang dilakukan dalam penelitian ini adalah mencari solusi persamaan Schrodinger PDM sistem osilator harmonik secara analitik, yaitu berupa nilai eigen energi (En) dan fungsi eigen (Ψn), dengan menggunakan metode transformasi. Langkah kedua adalah melakukan aproksimasi m(x)=1 dan µ(x)=x untuk melihat apakah hasilnya mereduksi menjadi hasil untuk sistem osilator harmonik dengan massa konstan. Langkah kedua ini sekaligus sebagai verifikasi apakah hasil yang didapat konsisten atau tidak. Pada bagian akhir akan ditinjau pula beberapa bentuk fungsi massa yang bergantung posisi dan potensial yang dibangkitkannya, serta interpretasinya secara fisis. Pendeteksian outlier dengan Metode LDL berdasarkan langkah-langkah: a. Mengumpulkan m pengamatan yang diduga outlier. b. Mendeteksi outlier pada model dengan asumsi V ec( E ) N ~ ( Σ0 ￄ , I ) dimulai dengan membuat p

n

65


ˆ dan Σ ˆ untuk L ( B,Σ ) , lalu menentukan B

ˆ ˆ) . mendapatkan L ( B,Σ

membuat ln L ( B,Σ ) dan menentukan Vec ( Bˆ ) dengan program nonlinear.

HASIL DAN PEMBAHASAN Nilai eigen energi En dan fungsi eigen Ψ(x) sistem osilator harmonik PDM Penelitian ini dibatasi hanya pada pendeteksian outlier pada pengamatan dalam model linear multivariat dengan Metode LDL. Pendeteksian outlier dalam model linear multivariat dimulai dengan memisalkan ada m pengamatan yang diduga outlier ( Am ) dari Y1 , Y2 , L , Yh , L , Yq % % % % , sehingga YA adalah himpunan dari variabel m

dependen dengan pengamatan yang ada outlier C

YA

m

adalah himpunan dari variabel

dependen dengan pengamatan tanpa outlier. Sebelumnya, jika dipunyai variabel independen sebanyak p dan variabel dependen sebanyak q, maka model linear multivariat (1) secara simultan dapat ditulis sebagai:

(

)

Ynxq = J nx 1 M X 1 ( ) B ( p +1 )xq+ E % = X nx ( p +1) B ( p +1) xq + Enxq nx p +1

1 = − tr 2

ￄB

c. Memaksimumkan L ( B,Σ ) dengan kendala jika ada m buah peng-amatan adalah outlier menggunakan pengganda Lagrange, lalu

dan

ￄ ln L ( B,Σ )

nxq

(7)

(

−2Σ

−1

(Y

(

T Bˆ = X X

)

−1

T

X Y

Kemudian jika (8) diturunkan terhadap disamakan dengan nol, maka: ￄ ln L ( B,Σ ) = ￄ Σ

(

1 T −1 −1 −1 = − tr nΣˆ −Σˆ Σˆ ( Y −XBˆ) 2

( Vec ( Bˆ ) − Vec( B) )

1

(

− tr Σ 2

−1

(

Y

XB −)

T

(

Y

−Vec( B) )

nonlinear. Metode ini disebut dengan Metode LDL yaitu suatu metode yang menghilangkan pengamatan yang outlier pada model dengan kendala yang menggunakan pengganda Lagrange. Fungsi likelihood untuk B yaitu (4), C sehingga fungsi likelihood untuk Bˆ adalah:

(

C

L B A ,Σ

C Am

m

) = ( 2π )

(

C

Kondisi optimal (maksimum atau minimum) dicapai bila memenuhi kondisi berikut ini: Jika logaritma natural dari fungsi likelihood (8) diturunkan terhadap B dan disama-kan dengan nol, maka:

Am

C

m

−

( n − m)

p

C

ΣA

2

( )

Vec YA

C

C

C

Am

Am

A

) ( T

−

n− m

exp( ￄ )

2

m

C C X −A ˆBA

C

YA

m

m

m

)) m

� � �

; Edan +A C

m

C

~N

m

m

(

Σ 0 ,ￄ I

p

),

−n m

dan berdasarkan (2) diperoleh: C Bˆ A =

(8)

−1

C

C

m

m

)

0,=

jika ada m buah variabel dependen adalah outlier dengan menggunakan pengganda Lagrange, dimulai dengan membuat ln L ( B,Σ ) dan menentukan Vec ( Bˆ ) dengan program

+ XB ) −

)

Vec( Bˆ)

−1

YA = X A B A

2

XB − ˆ)

Y

ˆ ( Vec( Bˆ) ) ) ( ( Var

T

ˆ . Estimasi parameter B pada (7) dengan dan Σ fungsi likelihood seperti pada (4) dengan Metode MLE dimulai dengan melogaritmanaturalkan (4), sehingga: ln ( π2)

(

Σ dan

diperoleh: ˆ = 1 ( Y − XBˆ ) T ( Y − XBˆ ) Σ n Untuk memaksimumkan fungsi likelihood L ( B,Σ ) dengan kendala

dimana �1 ￄ = �− tr ( Σ ) ( Y −X ˆB �2 Berdasarkan (7), diperoleh:

ln L ( B,Σ ) = −

0=,

diperoleh:

Pendeteksian outlier pada dalam model linear multivariat dengan asumsi seperti pada (3) dimulai dengan membuat fungsi likelihood untuk populasi L ( B,Σ ) , lalu menentukan Bˆ

n − lnΣ 2

T

Am

Dari (7) dapat ditulis dalam bentuk vektor: Vec ( Y ) = (I q � X Vec E( ) ) ) B(+ Vec

nq

)

ˆ) X −XB

((

)

)

T C

XA

m

−1

( )

T C

C

XA

C

XA

m

YA

m

m

dimana

(X ) C

T

X=A C

Am

(X ) C

Am

(

T

X X − . XA XA T

m

T

m

m

YA = X Y − XA YA C

m

T

T

m

.

m

Estimasi dari B setelah outlier dikeluarkan C ˆ B A adalah: m

)


Bˆ = C

A

m

(

T

A

m

( − X )X

= Bˆ

) ( −1

−X X

T

X X

−1

T

((

sehingga: C T Bˆ A = Bˆ − X X

(

m

(

T

ΙA X Ι m

)

)

T

X Y

A

m

−1

)

Q

−1

(

m

dan diperoleh pula: C Bˆ A ~ N m

(

(

T− 1

dimana ￄ =

( ( X X) T

−1

(

XΙAT Q m

−A

m

)

−1

)

A

m

A

(

m

)

−1

)X

)Q

Ι

Am

1

B

Am

m

T C

Am

m

A

T

Am

1

(Ι

−T A m

Q

)

)−

T 1

−

mA

−1

C

m

(

Am

m

))

( V e c( Bˆ ) − ( V e c) B) ( ( ˆ( V a r) ) V) ( e cBˆ ( ) −1

T C Am

C Am

C A

( V e)c) Bˆￄ K C A

m

m

(9) untuk Fv , v 1

2

,α

=K

dimana v1 = p dan v2 = n − p − 1 . Untuk menyelesaikan permasalahan nonlinear di atas digunakan pengganda Lagrange. Misalkan fungsi tujuan (8) dengan kendala (9), maka fungsi Lagrange-nya dapat ditulis: T F ( BΣ , , λ ) = ln L( B, Σ) − Fλ S .F . −K (10)

{

}

dimana:

(

( ) −Vec( B ) ) ˆ ( Vec ( B ˆ )) S = Var

C F = Vec Bˆ A

dan

C

Am

m

C

T

)

−1

X

T

) Vec ( Y ) .

−1

Am

Kondisi optimal dicapai bila memenuhi kondisi berikut ini: Fungsi Lagrange (10) diturunkan terhadap B dan disamakan dengan nol, maka: ￄF ( B,Σ , λ ) ￄ ln L ( B, Σ ) = =0 ￄ B ￄ B Berdasarkan (8), maka diperoleh:

(

m

(

)

−1

−1

E) ˆ ( ) ) = Vec ( B ) −1

XΙA Q− T

Am

m

(

C E Vec Bˆ A

dengan

A

)

Sehingga untuk pengamatan dalam model linear multivariat dengan m outlier dihilangkan, diperoleh: C T Bˆ A = Bˆ − X X

C

A

model dimana outlier-nya telah dihilangkan C Vec Bˆ adalah:

(

(

(

) VarE( ˆ ) ( X( X ) X

(

T Dengan menggunakan sifat hasil kali − ˆ − kronecker diperoleh:

Am

ˆ ￄ XT X ˆ ( Vec ( B ˆ)) = Σ dan Var

( ˆ V(ar V) ) ec) B(ˆ ( ) V e c( Bˆ ) ) ￄ sehingga daerah kepercayaan ( 1 − α ) 10 0 %untuk C

T

X Y

dengan E ( Vec ( Bˆ ) ) = Vec ( B )

m

Permasalahan di atas bersifat umum, sehingga nilai optimal yang diperoleh bisa saja bukan nilai yang paling optimal. Oleh karena itu digunakan pengganda Lagrange, sehingga nilai optimal yang diperoleh diharapkan merupakan nilai yang paling optimal pada daerah kepercayaan yang telah ditentukan. Secara umum daerah kepercayaan ( 1 − α ) 100% untuk Vec ( B ) adalah:

( V ec( Bˆ ) − V( ec B) )

−1

(

ˆ , A

E A

−

)

Vec ( Bˆ ) = I q ￄ X X

)

)

XΣ X� + ﾤ

B,

p

(

T Bˆ = X X

T

m

Q + YA −

Am

XΙA Q − T

X Y−

66

m

Am

C

Am

Fungsi Lagrange (10) diturunkan terhadap Σ dan disamakan dengan nol, maka: ￄ F ( B,Σ , λ ) ￄln L ( B, Σ ) = =0 ￄ Σ ￄ Σ Berdasarkan (8), maka diperoleh: 1 T FΣ ˆV ec = B ( Y− − XBˆ ) ( Y − XBˆ ) n Fungsi Lagrange (10) diturunkan terhadap λ dan disamakan dengan nol, maka diperoleh: C

1

,

2

α,

m

A

( Vec( Bˆ ) − C

Am

v

( )) C

Vec B A

m

v

T

(

( )) )(

(

−1

ˆVar Vec Bˆ C A

m

( Vec) Bˆ ( Vec ) ) − BK C

A

C A

m

m

Selanjutnya V e cCAB − menentukan nilai estimasi dari parameter yang optimal dengan metode numerik yang menggunakan kondisi KarushKuhn-Tucker (KKT) pada program nonlinear. Program nonlinear Metode LDL dengan kondisi KKT adalah: Maksimumkan: T F ( BΣ , , λ ) = ln L( B, Σ) − Fλ S .F . −K m

{

}

Kendala: T

F .S.F ￄ K

(

(

Vec ( Bˆ ) = I q ￄ X X T

)

−1

X

T

) Vec ( Y )

ˆ = 1 ( Y − XBˆ ) T ( Y − XBˆ ) Σ n

{

}

λ F .S.F − K = 0 T

Solusi terakhir akan mendapatkan X 1 , X 2 L,

,p X

yang optimal. Untuk kasus khusus θ1 dari θ , maka LD dapat dimodifikasi sebagai:

(

(

(

)))

C C LDLA ( θ1 θ 2 ) = 2 lnL ( ˆθ) − lnL ˆθ1 A ˆ,θ 2 ˆ θ1 A m

m

m

=

67


dimana θ = ( B, Σ ) , θ1 = B, θ2 = Σ , sehingga ˆ ) , dan diperoleh: θˆ = ( Bˆ , Σ

( BΣ )

LDL A

m

(

(

(

)))

C C = 2 ln L (Bˆ ,Σˆ ) − ln L Bˆ A ,Σˆ Bˆ A m

LDL. Pengganda Lagrange yang digunakan adalah daerah kepercayaan dari vektor parameter dimana pengamatan yang outlier telah dihilangkan dari model. Penentuan nilai estimasi dari parameter yang optimal dilakukan melalui metode numerik dengan menggunakan kondisi KKT pada program nonlinear. Metode ini membandingkan nilai LDL hitung dengan nilai tabel F yang akan mengikuti distribusi F.

m

Fungsi likelihood dengan kendala sebanyak m pengamatan yang diduga outlier adalah:

(

(

ˆ C ,B ˆ ˆC L BΣ A A m

m

) ) = (2 π ) Σ

(

mn

−

2

B

)

C Am

−

n

( A)

exp

2

dimana:

{ ( Σ( B ) ) 2 = Bˆ −( X X) 1

A =−

Bˆ A C

C

tr

T

m

( Y−

−1

Am

1 Σˆ + n

( )

C Σˆ BˆA = m

−1

C

C

m

m

) (Y− T

XABA

(

)

−1

m

( Eˆ Ι) T

)

QA

m

C Bˆ A

1

Ι m

)}

DAFTAR PUSTAKA

(

QA

− m

m

)

selanjutnya ditentukan fungsi Likelihood untuk pengamatan yang ada outlier yaitu: LDLA = LDLA ( BΣ m

(

)

m

=

(

(

ˆ , ˆ ) −ln L Bˆ Σ, ˆ BˆC = 2 ln L ( BΣ A A C

m

m

)))

(11)

Dengan

melogaritmanaturalkan dan C ˆ membuang B A pada (11) di atas, diperoleh: m

�nΣˆ +1 Eˆ T C Eˆ � n A A A L D LA = n � ln n Σˆ � � m

m

� � � �

m

m

dimana CΙA =Q − QA

)

LDLA

dengan

m

(

m

−1

(

Ι AQ − m

Am

)

(12)

−1

. m

m

didekati

LD LλA =

￥ %Z%, 2

i

i=1

sehingga LDLA ~F v, 1

v,α

2

,

dimana v1 = p dan v2 = n − p − 1 . Penentuan outlier dilakukan dengan membandingkan LD LA hitung pada (12) dan Ftabel dengan uji hipotesis adalah: H 0 : Am bukan outlier dan H 1 : Am adalah outlier. Jika LDL A hitung > λ .Ftabel , maka tolak H 0 , artinya pengamatan tersebut adalah outlier. KESIMPULAN Penentuan dan pendeteksian outlier pada model linear multivariat menggunakan pengganda Lagrange yang disebut Metode

Adnan R, Mohamad MN & Setan H. 2003. Multiple Outliers Detection Procedures in Linear E−ˆ A Regression. Matematika. 1:29-45. Bazaara MS, Sherali HD & Shetty CM. 1993. Nonlinear Programming: Theory and Algorithms. 2 rd edition. John Wiley & Sons. New York. Christensen R. 1991. Linear Model for Multivariate, Time Series, and Spatial Data, Springer-Verlag. New York. Cook RD. 2000. Detection of Influential Observation in Linear Regression. Technometrics. 42(1):65-68. Diaz-Garcia JA, Gonzalez-Farias G & AlvaradoCastro V. 2007. Exact Distributions for Sensitivity Analysis in Linear Regression. Applied Mathematical Sciences. 22:1083-1100. Hawkins DM. 1980. Identifications of Outliers. Chapman and Hall. New York. Makkulau, Linuwih S, Purhadi & Mashuri M. 2008. Prosedur Pendeteksian Outlier pada Model Linear Multivariat dengan Metode Likelihood Displacement Statistic. Prosiding Seminar Nasional Matematika IV. Jurusan Matematika FMIPA ITS. Desember 2008. Surabaya. Makkulau, Linuwih S, Purhadi & Mashuri M. 2009. Pendeteksian Outlier Model Linear Multivariat pada Produksi Gula dan Tetes Tebu. Prosiding Seminar Nasional Matematika. Jurusan Matematika FMIPA Universitas Jember, Februari 2009. Jember. Rencher AC & Schaalje GB. 2008. Linear Models in Statistics. 2nd edition. John Wiley & Sons. New York. Rousseeuw PJ & Hubert M. 1997. Recent Developments in PROG-RESS, dalam L1Statistical Procedure and Related Topics, edited by Y. Dodge. Institute of Mathematical Statistics Lecture Notes and Monograph Series. Hayward, California. 31:201-214. Srivastava. MS & Von Rosen D. 1998. Outliers in Multivariate Regression Models. Journal of Multivariate Analysis. 65:195-208. Xu J, Abraham B & Steiner SH. 2005. Outlier Detection Methods in Multivariate Regression Models.http://www.bisrg.uwaterloo.ca/archive/R R-06-07.pdf [4 April 2007]. m

ˆ Bˆ C , Σ A

dan

m

A

m

QA−

Am

Setelah mendapatkan

m

(

−1

C m

ˆ dan A

XΙ A Q − AE T

C

m

X AB

i


68

Pendeteksian Outlier pada Pengamatan dalam Model Linear Multivariat dengan Metode Likelihood Displacement Statistic-Lagrange

Recommend Documents