Kétmintás t-próba Két minta összehasonlítására használjuk. Általánosabb eset: származhat-e a két minta ugyanabból az alapsokaságból? (Tehát az a tény, hogy a két minta átlaga különbözik csak a mintavételi hibának tudható be, vagy pedig valamilyen szisztematikus hatásnak? Utóbbi esetben a két mintát nem tekintjük azonos alapsokaságból származónak.) Feltételek: 1) a változó normális eloszlású (Ha nem norm. elo.Æ nem-paraméteres statisztikák.) 2) a két minta függetlensége. (Ha nem függetlenek a minták: pl. párosított t-próba) 3) a varianciák azonossága. Ezt F-próbával ellenőrizzük. F-eloszlás: ha két független mintát veszünk egy alapsokaságból (n1 és n2 mintaelemszámokkal) akkor a becsült varianciák hányadosa F eloszlást követ. s12 Fs = 2 s2 Ez is statisztika! Két szab. fok: n1 -1 és n2 - 1 M(Fs) = n2 -1 / n2 - 3 , lim M(Fs) = 1 n→∞
Általában: F eloszlást kapunk akkor is, ha két normális eloszlású populációra σ12 = σ22 bár µ1 ≠ µ2 F-próba Segítségével eldönthetjük, hogy két minta becsült varianciái szignifikánsan eltérnek-e, vagyis származhat-e a két minta azonos varianciájú alapsokaságból (ha nem tér el szignifikánsan a két becsült variancia, akkor származhat). pl. kétmintás t-próba előtt ez szükséges. Ho: a varianciák azonosak, vagyis M (s12 - s22 ) = 0 H1: M (s12 - s22 ) ≠ 0 A két minta elemszámai: n1 és n2 Ö két szabadsági fok: n1 -1 és n2 - 1 Ö Fkrit ( n1 −1, n2 −1) két szabadsági foktól függ (és α-tól). Minden F eloszlás aszimmetrikus, ezért az F táblázatok küszöbértékei egyoldalas tesztre vonatkoznak. (Ha kétoldalú tesztet akarnánk, két különböző küszöbérték kellene.)
1-α = 95% 0
1
α = 5%
Fkrit ( n1 −1, n2 −1 0, 05 )
F
Ezek az Fkrit értékek közvetlenül használhatóak egyoldalú alternatív hipotézis esetén, pl. varianciaanalízisnél.
1
Az F-próba alapeseténél viszont kétoldalú alternatív hipotézist vizsgálunk (mivel az szerepel benne, hogy M(s12 - s22 ) ≠ 0, nem az, hogy M(s12 - s22 ) > 0)!
α/2 = 2,5%
1-α = 95%
α/2 = 2,5%
1
Fkrit ( n1 −1,n2 −1 0, 025 ) F
0
Ezért az F-próba alapeseténél a következőképpen járunk el: Fˆ kiszámolásánál a nagyobb varianciát írjuk felülre, a számlálóba, vagyis s12 > s22. (Figyeljünk rá, hogy n1 -1 a nagyobb varianciához tartozó szab. fok, ez nem mindegy, a táblázat nem szimmetrikus.) Ekkor mindig igaz, hogy Fˆ ≥ 1.
α = 5%
1-α = 95% 0
1
Fkrit ( n1 −1,n2 −1 0, 025 ) F
Ezért kétoldalú F próba esetén az α szignifikancia szinthez tartozó Fkrit értéket az egyoldalú próbához megadott F-táblázat α/2 jelű sorából keressük ki (nem az α feliratúból!), azaz általában 0,025-nél. (Ha külön táblázatok vannak a különböző szignifikancia-szintekhez, akkor az α=0,025-höz tartozó táblázatot kell használni.) Ha Fˆ < Fkrit akkor megtartjuk H0-t, vagyis megállapítjuk, hogy a két mintából becsült variancia nem különbözik szignifikánsan, a minták azonos varianciájú alapsokaságból származnak (elég nagy valószínűséggel). Ha Fˆ > Fkrit akkor elvetjük H0-t, vagyis megállapítjuk, hogy a két mintából becsült variancia szignifikánsan különbözik, a minták nem származnak azonos varianciájú alapsokaságból (mert ha abból származnának a véletlen csak rikán, α valószínűséggel okozna ilyen nagy eltérést a két becsült variancia között). Példa: csótányok túlélése táplálékmegvonást követően nőstény
n1=10
x1 = 8,5 nap
s12=3,6
hím
n2=10
x 2 = 4,8 nap
s22=0,9
Fˆ = 3,6 / 0,9 = 4,0
Fkrit ( 9,9, 0, 025 ) = 4,03
Ö Fˆ < Fkrit H0-t megtartjuk.
Tehát ha F-próbával a két variancia azonos Ö használhatunk kétmintás t-próbát; ha a két variancia nem azonos Ö d-próbát (Welch próbát) használunk. 2
Visszatérve a kétmintás t-próbához: Ha az F-próba eredménye az, hogy a két minta varianciája nem tér el szignifikánsan, akkor kétmintás t-próbával megvizsgálhatjuk, hogy átlagaik eltérése szignifikáns-e, x és y ugyanannak a becslése-e. (Pl. műtrágyázás, növényvédőszer, stb. hatásos-e? Ö kezelt és a kontroll csoport összehasonlítása.)
Ho: µ1 = µ2 H1: µ1 ≠ µ2 Tekintsük a két átlag különbségét, mint valószínűségi változót, ezt standardizáljuk, vagyis levonjuk belőle várható értékét és osztjuk a (két átlag különbségének) elméleti szórásával
( x − y ) − ( µ1 − µ 2 )
ez standard normális eloszlású lenne
σ x2 + σ y2 A két átlag különbségének varianciáját, σ x2 + σ y2 -t, a következőképpen kaphatjuk meg: σ x2 + σ y2 =
σ x2 n1
+
σ y2 n2
=σ2
n1 + n2 n1n2
az átalakítás elvégezhető, ha tényleg azonos szórásúak, vagyis σ = σx = σy
σ becslése a két minta alapján: 2
s2 =
n1
n2
i =1
i =1
∑ ( xi − x )2 + ∑ ( yi − y )2 n1 + n2 − 2
=
Qx + Q y n1 + n2 − 2
Qx és Qy a hibanégyzet összegek n
Qx = ∑ ( xi − x ) 2 i =1
A próbastatisztika képlete általánosan: ( x − y ) − ( µ1 − µ 2 ) t-eloszlást követ és M ( µ1 − µ 2 ) a Ho szerint 0. tˆ = Qx +Q y
(n1 + n2 ) n1 + n2 − 2 n1n2 ⋅
d.f. = n1 + n2 – 2
Ö tkrit (α, df)
tehát a szükséges próbastatisztika:
tˆ =
x−y (n1 − 1) s12 + (n2 − 1) s22 (n1 + n2 ) ⋅ n1 + n2 − 2 n1n2
Ha n1 = n2 = n x−y tˆ = 1 2 2 (sx + s y ) n
3
Ha tˆ < t krit elfogadjuk H0-t, vagyis a két mintát azonos alapsokaságból származónak tartjuk; a két átlag különbözőségét csak a véletlennek tudjuk be. Ha tˆ > t krit
elvetjük H0-t, vagyis a két mintát nem tartjuk azonos alapsokaságból
származónak; a két átlag különbözőségét szisztematikus hatásnak tudjuk be. (Túl nagy ahhoz, hogy csak a véletlen okozza, a véletlen ritkán, α%-ban okozna ilyen nagy eltérést két azonos alapsokaságból származó minta esetén.)
d-próba (Welch próba) d-próbát használhatunk két normális eloszlású valószínűségi változó várható értékének összehasonlítására, HA az elméleti szórások nem ismertek ( sx korrigált szórással becsüljük) és az F próba szignifikáns eltérést mutat (a két variancia különböző). H0: M ( x ) = M ( y )
tˆ' =
x− y s12 s22 + n1 n2
ez közelítő t-értéket ad meg.
A t’α kritikus t-érték a két minta különböző kritikus t-értékeinek súlyozott átlaga: s12 s 22 t (α , n1 − 1) ⋅ + t (α , n 2 − 1) ⋅ n1 n2 t 'α = 2 2 s1 s 2 + n1 n2 (Megj.: Mivel a súlyozott átlag mindig a két kritikus t-érték közé esik, így sokszor nem is kell pontosan kiszámolni ha a próbastatisztika értéke a kisebb t-értéknél is kisebb.)
4
Párosított t-próba (önkontrollos kísérlet) Egy kezelés hatásosságát gyakran a következő módszerrel vizsgáljuk: ugyanazokon az alanyokon végzünk két-két mérést, a kezelés előtt és után, így a két n-elemű minta összetartozó párokból áll. A két minta, a kezelés előtti és a kezelés utáni, nem független, hiszen ugyanazok az alanyok szerepelnek bennük, nem úgy mint a kétmintás t-próbánál, ahol a második minta elemeit az elsőtől függetlenül, véletlenszerűen választjuk. Ezért nem lehet kétmintás t-próbát végezni. Ehelyett minden egyes kísérleti alanynál külön kiszámítjuk a kezelés okozta különbséget (di) és a kezelés okozta különbséget tekintjük valószínűségi változónak, erre végzünk egymintás t-próbát. Természetesen H0 a kezelés hatástalanságát tételezi fel: H0: M (d ) = 0 vagy az eredeti mintaátlagokkal kifejezve: M (x − y ) = 0 H1: M (d ) ≠ 0 , ill. M (x − y ) ≠ 0 Feltételek: A változó mindkét mintában normális eloszlású legyen, a szórások szignifikánsan ne különbözzenek, és a két megfigyelés közötti különbség ne függjön az értékek nagyságától. A próbastatisztika:
d −0 tˆ = , sd
t eloszlású n-1 szab. fokkal.
sd = a di –kből szokásos módon becsült szórás, osztva
n -nel:
⎛ n ⎞ ⎜ ∑ di ⎟ n 2 di − ⎝ i =1 ⎠ ∑ s n sd = d = i =1 (n − 1) n
2
1 n
(A képletek megegyeznek az egymintás t-próbánál leírtakkal, csak itt x helyett d áll.) „Matched pairs” módszer: Végül megemlítjük, hogy előfordulnak olyan esetek, amikor azonos alanyokon nem végezhető el mindkét mérés (pl. a túlélési időt mérjük), ilyenkor két nagyon hasonló egyedből alkotunk egy párt. Pl. minden alomból veszünk két egeret, ezeket azonosnak tekintjük, egyiket a kezelés nélküli, másikat a kezelt csoportba tesszük. Ilyenkor a párosított t-próbához hasonlóan a párok két tagja közötti különbségekkel végzünk egymintás t-próbát.
5