Statistika, Vol. 11 No. 2, 97 – 102 Nopember 2011
Modifikasi Statistik Uji-T pada Test Inferensia Mean Mereduksi Pengaruh Keasimetrikan Populasi Menggunakan Ekspansi Cornish-Fisher Joko Riyono Staf.Pengajar Fakultas Teknologi Industri Universitas Trisakti Jakarta (Kampus A Jl.Kiyai Tapa No.1,Jakarta11440)
ABSTRACT This article considers a procedure that reduces the effect of population skewness on the distribution of the variabel-t so that tests about the mean can be more correctly computed with a modification of the t variabel.A modification of the t variabel is obtained using the Cornish-Fisher expansion. Key Words:Skewness,t variable,Cornish-Fisher expansion.
ABSTRAK Paper ini membahas suatu prosedur yang mengurangi pengaruh kemiringan dari populasi pada distribusi student-t sehingga uji inferensi mean dapat terhitung lebih baik dengan suatu modifikasi variable student-t .Modifikasi dari variabel student-t diperoleh menggunakan ekspansi Cornish-Fisher. Kata Kunci :Kemiringan ,Variabel student-t,Ekspansi Cornish-Fisher.
1.
PENDAHULUAN.
Dalam Statistik inferensia mean satu populasi sering dipakai statistik :
T=
Y −μ
(S
2
/n
)
1/ 2
untuk menguji hipotesa: Ho : μ = μ0 versus satu dari tiga kemungkinan alternatif yaitu : (1)
H1 = μ ≠ μ0
(2)
H1 = μ > μ0
(3)
H1 = μ < μ0
Dengan asumsi : (i) Yi berdistribusi indepeden (ii) Populasi berdistribusi normal Hasil dalam teori statistik yang cukup baik dibuat oleh student (1908) bahwa T ∼ t(n-1) adalah distribusi student t dengan derajat kebebasan (n-1). Dengan asumsi di atas, dipunyai uji pada level α : untuk Ho : μ = μ0 vs H1 : μ ≠ μ0 tolak Ho jika |TC|> tα/2 untuk Ho : μ = μ0 vs H1 : μ > μ0 tolak Ho jika TC > tα untuk Ho : μ = μ0 vs H1 : μ < μ0 tolak Ho jika TC < - tα dengan
TC =
Y − μo
(S
2
/n
)
1/ 2
97
98
Joko Riyono
Tetapi jika asusmsi kedua tak terpenuhi yaitu populasi tidak berdistribusi normal , Cicchitelli (1989) dengan studi Monte Carlo mendapatkan bahwa kemiringan populasi mempengaruhi statistik T di atas sehingga kita tidak dapat mendekatinya dengan distribusi student t(n-1) apalagi jika ukuran sampel kecil.Johnson (1978) telah membuat modifikasi dari statistik T di atas untuk mengurangi pengaruh kemiringan populasi terhadap statistik T tersebut.Dalam tulisan ini akan dibahas modifikasi statistik T tersebut menggunakan ekspansi Cornish-Fisher.
2.
EKSPANSI CORNISH-FISHER
Andaikan diberikan Y1,Y2, ... ,Yn adalah sampel random dari suatu distribusi G dengan mean μ, variansi σ2 dan μ3,μ4, ... masing-masing adalah momen central ketiga, keempat, ... dari G. Untuk sebarang variabel random Y dengan distribusi G, bentuk ekspansi Cornish-Fisher diberikan dengan :
CF(Y) = μ + σξ +
μ3 2 (ξ − 1)+... 6σ2
(1.1)
dimana ξ adalah variabel normal standar. Var( Y )
Karena
=
σ2 n
dan
⎫ 1 ⎧n μ3 ( Y ) = E( Y − μ) = 3 E⎨ ∑ ( Yi − μ) ⎬ n ⎩i = 1 ⎭ μ 1 n = 3 ∑ E(Yi − μ)3 = 23 n i=1 n
3
3
Sehingga :
CF( Y ) = μ +
σ n
1 2
⎛ −3 ⎞ μ3 2 ξ + (ξ − 1) + O⎜n 2 ⎟ 6nσ2 ⎝ ⎠
...
(1.2)
Dari ekspansi di atas dapat dicatat bahwa kemiringan populasi μ3 adalah koefisien dari suku (ξ2-1) serta tampak dalam suku-suku lain tetapi dengan order yang lebih kecil. Kunci dalam mendapatkan modifikasi variabel T dalam pendekatan Johnson adalah mengeliminasi suku yang melibatkan μ3 dalam variabel T pembangun yang diberikan pada bagian bawah berikut: Diberikan variabel T pembangun
(Y TJ =
⎧ σ2 ⎫ 2 ⎬ − μ) + λ + γ ⎨( Y − μ) − n⎭ ⎩ 1
. . .(1.3)
⎧ S2 ⎫ 2 ⎨ ⎬ ⎩n⎭
λ dalam TJ dipilih sehingga suku konstan dalam ekspansi Cornish-Fisher dari TJ berjumlah nol sehingga bias order yang lebih rendah tereleminasi γ dipilih sehingga koefesien dari suku ξ2 dalam ekspansi Cornish-Fisher dari TJ adalah nol (dengan demikian mengeliminasi pangaruh kemiringan order yang lebih rendah). Dapat ditunjukkan bahwa sebagai berikut :
(s2 )
Karena :E
var
μ3 μ3 4 dan λ = 3σ 2nσ2
μ4 3 − n 4 + σ n n(n − 1) σ4 ⎛ μ μ 2 2 σ4 ⎞ ⎜ −1 + = 4 + + 2 +...⎟ ≈ 4 − ⎠ n n ⎝ n n n n
= σ2dan
( S2 )
γ =
var( S2 ) =
Statistika, Vol. 11, No. 2, Nopember 2011
Modifikasi Statistik Uji-T pada ...
sehingga ekspansi Cornish-Fisher dari
CF( Y ) = μ +
Y
99
dan S2, suku-suku lebih tinggi diabaikan adalah :
μ3 σ 2 ξ + − 1) 2 (ξ 6nσ n 1
⎡ μ4 − σ4 ⎤ 2 2 CF(S2)= σ + ⎢ ⎥ η n ⎣ ⎦ 1 ⎧ ⎫ 4 2 ⎪ ⎪ ⎡ ⎤ − μ σ 4 2 = σ ⎨1 + ⎢ η⎬ ⎥ 4 ⎣ nσ ⎦ ⎪ ⎪⎩ ⎭
dimana ξ dan η adalah variabel random normal standar. Gantikan nilai Y dan S2 dalam (1.3) dengan ekspansinya, maka dengan pengabaian suku O(n-1), ekspansi Cornish-Fisher dari TJ adalah :
⎛ γσ μ3 ⎞ 2 ⎟ξ CF(TJ) = ξ + ⎜ − ⎝ n 3 nσ3 ⎠ μ3 μ4 − σ4 * λ n γσ + − − − ξξ σ n 6 nσ3 2 nσ2 dengan ξ dan ξ* variabel random normal standar yang independen. Bukti : 1
− ⎧ ⎡ ⎛ σ2 ⎞⎤⎫⎛ S2 ⎞ 2 2 TJ = ⎨( Y − μ) + λ + γ⎢( Y − μ) − ⎜ ⎟⎥⎬⎜ ⎟ ⎝ n ⎠⎦⎭⎝ n ⎠ ⎣ ⎩ μ3 2 μ3 σ Y − μ = ξ + − 2 ξ 6nσ 6nσ2 n μ23 μ3 σ2 2 4 ( Y − μ) 2 = ξ + 2 4 ξ + 36n σ 36n2σ4 n μ3 μ23 μ3 3 2 ξ − + − ξ. 2 4 ξ 18n σ 3n nσ 6n nσ 1 ⎫ ⎧ 4 2 2 2 ⎪ ⎪ ⎛ ⎞ μ4 − σ σ S ⎬ ⎨1 + ⎜ η = ⎟ 4 n n ⎪ ⎝ nσ ⎠ ⎪ ⎭ ⎩
⎛ S2 ⎞ ⎜ ⎟ ⎝n⎠
−
1 2
−
1 2
=
1 ⎫ ⎧ ⎛ μ4 − σ4 ⎞ 2 ⎪ n ⎪ ⎨1 + ⎜ ⎟ η⎬ 4 σ ⎪ ⎝ nσ ⎠ ⎪ ⎭ ⎩
=
1 ⎫ ⎧ 4 2 ⎪ ⎪ ⎛ ⎞ 1 μ4 − σ 3 μ4 − σ4 2 n ⎬ ⎨1 − ⎜ + + η ... η ⎟ . ! nσ4 σ ⎪ 2 ⎝ nσ4 ⎠ 42 ⎪⎭ ⎩
Statistika, Vol. 11, No. 2, Nopember 2011
100
Joko Riyono
sehingga:
⎧ γμ 23 ⎛ μ3 γμ 3 γμ 23 ⎞ 2 γσ2 4 3 CF(TJ) = ⎨ + + + − ξ ξ ⎜ ⎟ξ 2 4 2 n 18n2σ4 ⎠ 3n nσ ⎝6nσ ⎩ 36n σ ⎛ σ γμ 3 ⎞ γμ 32 μ3 γσ2 ⎫ n ⎬ ⎟ξ + +⎜ − + − − λ ⎝ n n ⎭ σ 36n2σ4 6nσ2 6n nσ⎠ 1 ⎧ ⎫ 4 2 ⎛ ⎞ ⎪ ⎪ 1 μ4 − σ 3 μ 4 − σ4 2 ⎨1 − ⎜ ⎬ ... η η + − ⎟ .! 2 ⎝ nσ4 ⎠ 42 σ4 ⎪⎩ ⎪⎭
⎧ γμ23 ⎛ μ3 γμ 23 ⎞ 2 γμ3 3 γσ 4 ξ + ⎜ CF(TJ) = ⎨ + − ⎟ξ + 5 ξ + 3nσ2 18n nσ5 ⎠ n ⎝6 nσ3 ⎩ 36n nσ
γμ23 γμ3 ⎞ ⎛ μ3 λ n γσ ⎫ ⎬ ⎜1 − + − − 2 ⎟ξ + ⎝ σ 6nσ ⎠ 36n nσ5 6 nσ3 n⎭ 1 ⎧ ⎫ 4 2 ⎛ ⎞ ⎪ ⎪ μ4 − σ4 2 1 μ4 − σ 3 ⎨1 − ⎜ ⎬ η ... η + − ⎟ . ! nσ4 2 ⎝ nσ4 ⎠ 42 ⎪⎩ ⎪⎭
⎛ μ3 μ3 γσ γσ ⎞ 2 λ n ⎟ξ + ξ + CF(TJ) = ⎜ − 3 + 3 − ⎝6 nσ σ n⎠ n 6 nσ 1
1 ⎛ μ4 − σ4 ⎞ 2 − ⎜ ⎟ ξη 2 ⎝ nσ4 ⎠ Tulis η = ρξ+ ξ* dimana ρ adalah kolerasi antara normal independen terhadap ξ. ρ
{
X
dan S2 dan ξ* adalah variabel random
= μ3 σ2 ( μ4 − σ4 )
}
−
1 2
sehingga :
γσ ⎞ 2 γσ ⎛ μ3 μ3 λ n ⎟ξ + − CF(TJ) = ξ + ⎜ 3 + 3 − ⎝ 6 nσ σ n⎠ n 6 nσ ⎫ 1 ⎧ ⎪ μ3 1 ⎛ μ4 − σ4 ⎞ 2 ⎪ ∗ − ⎜ ⎟ ξ⎨ 1 ξ + ξ ⎬ 4 2 ⎝ nσ ⎠ ⎪ 2 ⎪ 4 2 ⎩ σ ( μ4 − σ ) ⎭
[
]
γσ ⎛ μ3 μ3 ⎞ 2 μ3 λ n λσ ⎟ξ + − − CF(TJ) = ξ + ⎜ + − 3 3 3 ⎝ 6 nσ σ 2 nσ ⎠ 6 nσ n n 1
1 ⎛ μ4 − σ4 ⎞ 2 ∗ − ⎜ ⎟ ξξ 2 ⎝ nσ4 ⎠ Dengan menyeleksi γ dan λ sehingga koefesien dari ξ2 adalah nol juga suku konstan berjumlah nol, ekspresi hasil akan mengurangi bias, didapat :
Statistika, Vol. 11, No. 2, Nopember 2011
Modifikasi Statistik Uji-T pada ...
101
γσ μ3 μ3 + − = 0 6 nσ3 n 2 nσ3 γσ μ3 − + = 0 3 n 3 nσ μ3 γ = 3σ4 γσ μ3 γ n − − = 0 dan σ 6 nσ3 n μ3 μ3 λ n − − = 0 σ 6 nσ3 3 nσ3 μ3 λ n − = 0 σ 2 nσ3 μ3 λ = 2nσ2 1
Jadi
1 ⎛ μ4 − σ4 ⎞ 2 ∗ −1 CF(TJ) = ξ − ⎜ ⎟ ξξ + O( n ) 2 ⎝ nσ4 ⎠ 1 1 = ξ − K u − 1) 2 ξξ∗ + O( n-1 ) ( 2 n
dan
2 μ3 μ3 ⎧ 2 ⎫⎛ S ⎞ ⎬ ( ) TJ = ⎨( Y − μ) + + Y − μ ⎜ ⎟ ⎭⎝ n ⎠ ⎩ 6σ2n 3σ4
−
. . .(1.4) 1 2
...(1.5)
Terlihat bahwa TJ yang diberikan oleh (1.5) tidak dapat dihitung dengan H : μ = μ0, karena μ3 dan σ2 biasanya tidak diketahui. Johnson menyarankan mengganti μ3 dan σ2 dengan estimasi n
sampel
μ$ 3 =
∑
(Y
i=1
i
− Y) n
3
dan variansi sampel S2. Ekspansi Cornish-Fisher masih (1.4)
Untuk contoh penggunaannya uji hipotesis H0 : μ = μ0 melawan satu dari tiga alternatif kemungkinan, maka dipunyai uji level α sebagai berikut : TT : untuk H0 :μ = μ0 vs H1 : μ ≠ μ0 , tolak H0 jika ⎢TJH⎢ > tα/2 . . . .(1.6) TU : untuk H0 : μ = μ0 vs H1 : μ > μ0 , tolak H0 jika TJH > tα
. . . . (1.7)
Tl : untuk H0 : μ = μ0 vs H1 : μ < μ0,
dimana
TJH =
(Y
tolak H0 jika TJH < -tα
. . . . (1.8)
− μ0 ) + μ$ 3 / (6s2n) + ( μ$ 3 / (3s4)) ( Y − μ) ⎛s ⎞ ⎜ ⎟ ⎝n⎠ n
1 2
2
(1.9)
dan tα notasi bagian atas 100α titik persentil dari distribusi t dengan derajat bebas (n-1).
Statistika, Vol. 11, No. 2, Nopember 2011
102
3.
Joko Riyono
KESIMPULAN
Dari uraian di atas terlihat bahwa statistik: −
1
2 2 μ3 μ3 ⎧ 2 ⎫⎛ S ⎞ ⎬ ( ) TJ = ⎨( Y − μ) + Y yang diperoleh melalui statistik T + − μ ⎜ ⎟ ⎭⎝ n ⎠ ⎩ 6σ2n 3σ4 ⎧ σ2 ⎫ ( Y − μ) + λ + γ ⎨( Y − μ) 2 − ⎬ n⎭ ⎩ TJ = Dengan menyeleksi γ dan λ pembangun: 1 ⎧ S2 ⎫ 2 ⎨ ⎬ ⎩n⎭
sehingga koefesien dari ξ2 & suku konstan pada ekspansi Cornish-Fisher nya berjumlah nol, ekspresi hasil akan mengurangi bias.
DAFTAR PUSTAKA [1]. Benjamini,Y(1983),”Is T-Test Really Conservative whe the Parent Distribution is LongTailed”,J.Am.Statist.Assoc.,78,645-654. [2]. Dudewicz,E.j&Mishra,S.N.(1988),Modern Mathematical Statistics,John Wiley& Sons. [3]. Hall,P.(1992),The Bootstrap and Edgeworth Expansion,Spinger-Verlag Inc. New York. [4]. Lehmann,E.L.(1983),Theory of Point Estimation,John Wiley & Sons. [5]. Johnson,Norman J.(1978),”Modified t Test and Confidence Intervals for Asymmetrical Populations”,J.Am.Statist.Assoc.,73,536-544. [6]. Wallace,DavidL.(1958),”Asymptotic Approximations to Distributions,” Annals of Mathematical Statistics,29,165-170.
Statistika, Vol. 11, No. 2, Nopember 2011