4.3 Sampling dari distribusi normal dan estimasi likelihood maksimum

Hardwiyanto Utomo 060545

4.3 Sampling dari distribusi normal dan estimasi likelihood maksimum Likelihood normal multivariat Kita asumsikan vektor X1 , X 2 ,..., X n dengan p ×1 merepresentasikan sampel acak dari populasi normal multivariat dengan rata-rata µ dan kovarian matrik ∑ . Karena X1 , X 2 ,..., X n satu sama lain independen dan berdistribusi N p ( µ, ∑ ) , fungsi kepadatan bersama dari semua observasi merupakan produk dari kepadatan normal marginal, yaitu

 kepadatan bersama  n  1 −( x j − µ ) ' ∑ −1 ( x j − µ ) / 2  e   = ∏  p/2 1/ 2  dari X1 , X 2 ,..., X n  j =1  ( 2π ) | ∑ |  =

−

1

( 2π )

np / 2

|∑|

n/2

e

(4-11)

n

∑ ( xi −µ ) ' ∑−1 ( xi −µ ) / 2 j =1

Saat nilai kuantitatif dari observasi tersedia, dan disubtitusi ke x j pada (4-11). Hasil yang diperlihatkan, diperhatikan sebagai fungsi dari µ dan ∑ untuk himpunan yang ditetapkan dari observasi x1 , x2 ,..., xn disebut likelihood. Pada bab ini kita akan banyak menggunakan trace dari suatu matrik kuadrat.

Akibat 4.9.

Diberikan A matrik k × k dan x vector k ×1 .

a. x ' Ax = tr ( x ' Ax ) = tr ( Ax ' x ) k

b. tr ( A ) = ∑ λi , dimana λi adalah nilai eigen dari A. i =1

Proof. Untuk (a) pertama kita tuliskan x ' Ax sebagai skalar, sehingga x ' Ax = tr (x ' Ax) kita

punya bahwa tr (CB) = tr (BC) untuk setiap matrik B dan C dengan m × k dan k × m . Diagonal k

elemen dari BC adalah

∑b c j =1

ij

ji

m  k  , sehingga tr (BC) = ∑  ∑ bij c ji  . Hal ini serupa dengan i =1  j =1 

m

diagonal

elemen

dari

CB

∑b c

adalah

i =1

ij

ji

,

sehingga

kita

punya

k   m  m  k tr (CB) = ∑  ∑ bij c ji  = ∑  ∑ bij c ji  = tr (BC) . Kita misalkan x ' adalah B dengan m = 1 dan j =1  i =1  i =1  j =1 

Ax adalah C, maka x ' Ax = tr ( x ' Ax ) = tr ( Ax ' x ) .

Untuk (b), misalkan A = P ' BP , dimana PP ' = I dan B adalah matrik diagonal dengan entri-entrinya

λ1 , λ2 ,..., λk .

adalah

Kita

juga

punya

tr ( A ) = tr ( P ' BP ) = tr ( BPP ') = tr ( B ) = λ1 + λ2 + ... + λk Eksponen dari kepadatan bersama pada (4-11), dapat disederhanakan.

(x

j

− µ ) ' ∑ −1 ( x j − µ ) = tr ( x j − µ ) ' ∑ −1 ( x j − µ ) 

(4-12)

= tr  ∑ −1 ( x j − µ )( x j − µ ) ' Selanjutnya

∑(x n

i =1

− µ ) ' ∑ −1 ( x j − µ ) = ∑ tr  ∑ −1 ( x j − µ )( x j − µ ) ' n

j

i =1

  n  = tr  ∑ −1  ∑ ( x j − µ )( x j − µ ) '    i =1  

(4-13)

Karena trace dari jumlah matrik sama dengan jumlah trace dari matrik tersebut, sehingga kita dapat menambah atau mengurangi dengan x pada bentuk ( x j − µ ) maka akan memberikan

∑( x n

i =1

j − x + x − µ )( x j − x + x − µ ) ' = ∑ ( x j − x )( x j − x ) ' + n ( x − µ )( x − µ ) ' (4-14) n

i =1

∑( x n

Karena cross-product dari,

i =1

j

− x ) ( x − µ ) ' dan

∑( x − µ)( x n

i =1

j

− x ) ' adalah keduanya matrik

nol, kita punya bentuk fungsi kepadatan bersama suatu sampel acak yang berasal dari populasi yang berdistribusi normal multivariat yaitu:

L(µ, ∑) =

( 2π )

np / 2

  n  − tr ∑ −1  x j − x x j − x ' + n( x −µ )( x − µ ) '   / 2     i =1  

∑(

1 | ∑ |n / 2

e

)(

)

(4-16)

Fungsi di atas lebih dikenal dengan nama fungsi likelihood (ini setelah dimasukkan nilai-nilai dari x1 , x2 ,..., xn ).

Estimasi µ dan ∑ untuk maksimum likelihood Akibat 4.10. Diberikan matrik B terbatas positif dan simetri p × p dan b > 0 skalar.

1 tr ( ∑−1 B ) / 2 1 pb e ≤ 2b ) e −bp b b ( |∑| |B| Untuk setiap ∑ terbatas positif, dengan memegang kesamaan tersebut hanya untuk p× p

∑ = (1/ 2b ) B . ˆ merupakan nilai Estimasi µ dan ∑ untuk maksimum likelihood dinotasikan µˆ dan ∑ ˆ akan tergantung pada nilai maksimum dari fungsi L ( µ, ∑ ) pada (4-16). µˆ dan ∑

x1 , x2 ,..., xn yang melewati ringkasan statistik x dan S.

Akibat 4.11. X1 , X 2 ,..., X n adalah sampel acak yang berasal dari populasi normal dengan ratarata µ dan kovarian ∑ . Maka

µˆ = X dan

∑=

( n − 1) S 1 n X j − X )( X j − X ) ' = ( ∑ n j =1 n

adalah estimator dari µ dan ∑ untuk maksimum likelihood. Nilai observasi mereka, x dan

(1/ n)∑ ( x j − x )( x j − x ) ' , dikatakan estimasi untuk µ dan ∑ pada maksimum likelihood. n

j =1

Proof. Pada persamaan likelihood (4-16) kita punya bagian dari faktor perkalian - 12 yaitu:

  n  tr  ∑ −1  ∑ ( x j − x )( x j − x ) '   + n ( x − µ ) ' ∑ −1 ( x − µ )  i =1  

( x − µ ) ' ∑−1 ( x − µ ) > 0 kecuali

Dari akibat 4.1, ∑ −1 terbatas positif, jadi jarak Sehingga

fungsi

likelihood

menjadi

maksimum

saat

µˆ = x sehingga

memaksimumkan L(µˆ , ∑) =

1

( 2π )

np / 2

|∑|

n/2

e

  − tr ∑ −1    

n



i =1



∑ ( x j − x )( x j − x ) '+   / 2

untuk µ = x . kita

tinggal

n

terhadap ∑ −1 . Dengan menggunakan akibat 4.10 dimana b = n/2 dan B = ∑ ( xi − x )( xi − x ) ', i =1

n

ˆ = (1/ n ) ( x − x )( x − x ) ' dibentuk. hasil maksimumnya saat ∑ ∑ i i i =1

Estimator pada maksimum likelihood adalah sebuah jumlah acak. Estimator ini didapat ˆ dengan dengan menggantikan pengamatan x1 , x2 ,..., xn yang merupakan ekspresi untuk µˆ dan ∑

vektor acak X1 , X 2 ,..., X n . Kita nyatakan estimator dari maksimum likelihood X sebagai vektor acak dan estimator ˆ sebagai vektor matrik. Estimasi maksimum likelihood merupakan dari maksimum likelihood ∑ nilai terpilih yang diberikan oleh suatu data. Dari penjelasan di atas kita dapatan maksimum dari fungsi likelihood adalah

( )

ˆ = L µˆ , ∑

1

( 2π )

np / 2

e− np / 2

1 ˆ |n / 2 |∑

(4-18)

Statistik cukup Diberikan X1 , X 2 ,..., X n sampel acak dari populasi normal multivariat dengan µ dan kovarian ∑ . Maka

X dan S merupakan statistik cukup

(4-21)

4.4 DISTRIBUSI SAMPLING DARI X dan S

 X11 X12 K X1n  X X 22 K X 2n  21  X= = [X1  M    X p1 X p2 K X pn 

X2 K Xn ]

X matriks dengan ordo p x n , diketahui x dan S statistic cukup univariate Merupakan sampel random dari populasi normal dengan mean µ dank kovarians matriks ∑ •

Untuk distibusi normal univariat X normal dengan mean µ = mean populasi dan variansi 1 2 variansi populasi σ = n ukuran sampel

Bukti : X berdistribusi normal univariat dengan mean µ dan variansi σ 2 . M x (t) = e

tµ +

1 2 2 t σ 2

X1 , K , X n sampel random dari populasi normal univariat dengan mean µ dan variansi σ 2 . M xi (t) = e

tµ +

M x (t) = M

∑

1 2 2 t σ 2

xi n

i = 1,2, ... , n

  t  (t) = M x i    n  

n

 t µ + 1t2 σ 2  = e n 2 n    2

 tµ + 1 t 2 σ  = e 2 n    2

n

n

Jadi X berdistribusi normal dengan mean µ dan variansi

σ2 n

•

Untuk disribusi normal multivariate

X ~ N p (µ , ∑ )  1  X ~ N p  µ, ∑   n 

Bukti :

X ~ N p (µ , ∑ )

M x (t) = e

t′ µ +

1 t′ ∑ t 2

X1 ,X 2 K , X n sampel random dari distribusi normal p variat dengan mean µ dan kovarians ∑ . M xi (t) = e

x=

t′ µ +

1 t′ ∑ t 2

i = 1,2, ..., n

1 n ∑ Xi n i =1

M x (t) = M

∑

(t)

xi n

  t  =  M x i    n  

n

 t ′ µn + 12 + t′n∑2 t =  e 

=e

t ′µ +

   

n

1 ∑ t′ t 2 n

Jadi X berdistribusi normal dengan mean µ dan variansi •

1 ∑ n

Untuk variansi sampel dari populasi normal univariat 2

∑ (x n

2

j − x ) berdistribusi

(n − 1) S 2

=

(n − 1)S 2

berdistribusi identik dengan σ 2 z1 + K + z n −1 = (σ z1 ) + K +(σ z n −1 )2 .

σ

1

σ2

j =1

(

2

2

)

2

(

Dimana zi ~ N p (µ , ∑ ) atau σ z i ~ N 0, σ 2 •

)

Untuk populasi normal multivariate Bila zj ~ N p (µ , ∑ ) n

∑z j =1

j

j = 1, … ,n

′ z j berdistribusi Wishart dengan derajat bebas n-1 diberi notasi W

1. Sifat – sifat distribusi Wishart 1. Densitas wishart tidak ada bila n ≤ p Bila ada harganya untuk matriks definit positif A adalah : 1

A2

Wn −1 ( A / ∑ ) = 2

1 p ( n −1) 2

π

( n − p −1)

p ( p −1)

4

∑

e

1 − tr A 2

( n −1)

∑ -1 p

2

1

i =1

2. A1 ~ Wm1 (A1 | ∑ )

A 2 ~ Wm2 (A 2 | ∑ ) . A1 dan A2 independen A1 + A2 ~ Wm1 + Wm2 (A1 + A 2 | ∑ ) 3. A ~ Wm (A | ∑ )

C A C′ ~ Wm (. | C ∑ C′)



∏  2 (n − i )

4.5 DISTRIBUSI X dan S UNTUK SAMPEL BESAR

Teorema Limit Pusat

X1, X 2 ,K , X n Sampel random dari distribusi dengan mean

n (X − µ ) berdistribusi mendekati N p (0, ∑ ) . Untuk n besar

µ dan kovariansi ∑ maka

Teorema Bila X mendekati normal dengan mean µ dan kovarian 1 matriks ∑ maka n ′ n(X − µ ) ∑ −1 (X − µ ) mendekati χ 2 p

4.3 Sampling dari distribusi normal dan estimasi likelihood maksimum

Recommend Documents