Uvedeme obecný postup statistického testování:
1. Formulace nulové H0 a alternativní hypotézy HA . 2. Volba hladiny významnosti α. 3. Volba testační statistiky, např. . 4. Určení kritického oboru testové charakteristiky. 5. Vyčíslení testační statistiky a jejích kvantilů. 6. Rozhodnutí, zda a) Zamítnout hypotézu H0 a přijmout HA, jestliže testační statistika padne do kritického oboru, b) Nezamítnout hypotézu H0, jestliže testační statistika nepadne do kritického oboru. Výsledek testování: a) Zamítnutí hypotézy H0 neznamená, že testovaná nulová hypotéza , ale znamená, že její platnosti nevěříme, protože výsledek testu poskytl objektivní důvod. V dalším pak budeme uvažovat, že H0 neplatí a HA platí. b) Nezamítneme-li hypotézu H0, neznamená to její přijetí. Výsledek testu neukázal tak velkou neshodu mezi zjištěnou skutečností a testovanou hypotézou, která by dala dostatečný důvod k zamítnutí hypotézy. Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H 0 hypotézy Op, tj. mimo interval α/2 # s # 1α/2 a hypotéza H0 přitom platí. Platí-li H0 , je pravděpodobnost padnutí s mimo obor Op rovna právě hladině významnosti α. Velikost α určuje velikost , tj. nesprávného zamítnutí správné nulové hypotézy H0 . b) Testační statistika padne do oboru, OP, tj. mimo interval s < α/2 resp. s > 1α/2 . a přitom platí alternativní hypotéza HA. Pravděpodobnost, že představuje velikost , ß.
s
padne do oboru přijetí Op , i když H0 neplatí,
a)
vypočteme intervalový odhad parametru µ (tj. polohy či rozptýlení). Padne-li zadaná hodnota µ0 parametru µ do tohoto intervalu, nezamítá se hypotéza H0 : µ = µ 0 . Padne-li µ 0 mimo tento interval, zamítá se H0. b) ze základního souboru s rozdělením N(µ, σ2) provedeme náhodný výběr rozsahu a vypočteme výběrový průměr ¯ a směrodatnou odchylku . Jako testovou statistiku zvolíme náhodnou veličinu
¯ µ0
Kritické obory testů polohy hypotézy H0: µ = µ0 proti různým alternativám HA pro hladinu významnosti α jsou uvedeny v tabulce. Hraniční body kritického oboru představují 100α%ní kvantily známých rozdělení. Místo formálního testování, zda jsou tyto kvantily větší než testové statistiky, je možné přímo vyčíslit velikost pravděpodobnosti (1 - α) (u oboustranného testu (1 - α/2)). Nulová
Alternativní
Testační
Kritický
hypotéza H0
hypotéza HA
charakteristika
obor t $ t(1-α)(n-1)
µ > µ0 µ = µ0
µ < µ0 µ U µ0
t = (x - µ0) n /s
t < tα(n-1) *t* $ t(1-α/2)(n-1)
Porovnání dvou výběrů i = 1, ..., 1 , a j = 1, ..., 2 , patří k častým úlohám v přírodních i technických vědách, a to při (a) porovnání výsledků z různých instrumentálních metod nebo laboratoře, (b) ověřování nutnosti dělení heterogenních výběrů do homogenních podskupin, (c) hodnocení rozdílu mezi rozličnými materiály a přístroji. Někdy lze tuto úlohu převést na testování jednoho výběru. To je totiž případ, kdy mezi prvky obou výběrů existuje jistá logická vazba. Představují-li prvky i vlastnosti před úpravou materiálu a prvky i stejné vlastnosti po úpravě materiálu vzorků ( 1 2), lze utvořit jednorozměrný výběr, i = i - i , pro který lze užít klasickou statistickou analýzu. Pokud se střední hodnota µD významně neliší od nuly, znamená to, že µx = µy a efekt zpracování materiálu není pro sledovanou vlastnost statisticky významný (t.zv. . V obecnějším případě dvou výběrů lze zjistit, zda pocházejí ze stejného rozdělení pravděpodobnosti a zda se neliší v parametrech polohy a rozptýlení.
testy a statistické diagnostiky k ověření předpokladů o výběru. 2.1 Klasický Fisher-Snedecorovým -test, 2.2 Modifikovaný Fisher-Snedecorův -test, 2.3 Robustní Jackknife test J. 3.1 Klasický Studentův -test 1 pro homoskedasticitu, 3.2 Klasický Studentův -test 2 pro heteroskedasticitu, 3.3 Modifikovaný Studentův -test 3 pro výběry, odchýlené od normálního rozdělení. 3.4 Robustní Jackknife test polohy 4 pro homoskedasticitu, 3.5 Robustní Jackknife test polohy 5 pro heteroskedasticitu. Klasické testy vycházejí z předpokladů: a) výběry i = 1, ..., 1, a j = 1, ..., 2 jsou vzájemně nezávislé; 2 2 b) rozdělení obou výběrů je normální, i - N(µx, σx ) a j - N(µy, σy ). Existuje řada různých metod, které jsou použitelné i v případech, kdy jsou tyto dva předpoklady narušeny. Před vlastní statistickou analýzou je výhodné vyšetřit nejprve metodami průzkumové analýzy chování obou výběrů.
2
2
umožňuje ověření nulové hypotézy H 0: σx = σy proti alternativní
Vychází se z předpokladu, že oba výběry jsou nezávislé a pocházejí z normálního rozdělení. Testovací kritérium má tvar 2 HA: σx
2 σy .
max 2
2
2 x 2 y
,
2 y 2 x
.
Platí-li hypotéza H0 a s x kritérium -rozdělení s ν1 = 1 - 1 a ν2 = 2 - 1 stupni volnosti. V opačném s y má případě se pořadí stupňů volnosti zamění. Je-li 1-α(ν1, ν2 ), je nulová hypotéza H0 o shodnosti rozptylů zamítnuta.
předchozí klasický -test je značně citlivý na předpoklad normality. Mají-li obě výběrová rozdělení jinou špičatost než odpovídá normálnímu, je třeba užít kvantil 1-α(ν1, ν2) se stupni volnosti ν1 a ν2 , vyčíslenými podle vztahů 1
1
ν1
ˆ2c
1
2( kde
ˆ2c
2
2)
n1
(
i
i1
ˆ2c
1
n1
1
1
2
, ν2
( i1
i
n2
4
¯)
( i1
i
¯)4 2
n2
¯)2
2
( i1
3
¯)2
i
jsou-li v datech navíc odlehlé hodnoty, jeví se užitečný robustní Jackknife test. Testovací kritérium má tvar 1
J
( ¯1 ¯)2
n1
(
1i
i1
n2
2
¯1) 1
( ¯2 ¯)2
2
( i1
2i
¯2)2
2
2 nj
¯
kde
Veličiny kde
1i
se počítají podle vztahu
1 ¯1
2 ¯2
1
2
1i
2 1(i)
,
j
ji
i1
1, 2
, j
1
ln
2 x
1
1 2
(
2 1(i)
1) ln
1
n1
( jUi
j
,
¯(i))2 .
Ve vztahu se vyskytuje průměr s vynechanou -tou hodnotou, pro který platí ¯(i) 1
1 1
n1 jUi
j
. 2
= 1, ..., 2 , rozptyl y a rozsah výběru 2 . Při výpočtu 2i se ve výše uvedených vztazích dosazují hodnoty j Platí-li nulová hypotéza H0, má testovací kritérium J přibližně rozdělení s ν1 = 2, ν2 = 1 + 2 - 2 stupni volnosti. Vyjde-li, že J 1-α ν 1, ν 2), je nutné zamítnout hypotézu H0 o shodnosti obou výběrových rozptylů na hladině významnosti.
Studentův -test umožňuje testování hypotézy H0: µx = µy proti alternativní HA : µx
µy i při splnění obou uvedených předpokladů o výběrech:
2
rozdělení, má testovací kritérium tvar
Platí-li, že
1
1-α/2
1
* ¯ ¯*
1
2
: pro σx = σy a když obě rozdělení vykazují Gaussovo
1
(
1)
1
2 x
(
1 2
2
2 y
1)
1
2
1
2
(
2)
, je hypotéza H0 o shodě středních hodnot na hladině významnosti α zamítnuta.
2
2
2
pro σx
σy a když obě rozdělení vykazují Gaussovo
2
rozdělení, má testovací kritérium tvar
* ¯ ¯*
2
2 x
2 y
1
2
stupni volnosti ν
Platí-li hypotéza H0, má tato testová statistika Studentovo rozdělení s 2 x
1
ν
2
4 x 2 1
(
1)
1
2 y
4 y 2 2
(
2
1)
Platí-li, že 2 1-α/2(ν), je hypotéza H0 o shodě středních hodnot na hladině významnosti α zamítnuta. Testovací kritérium 1 není robustní vůči heteroskedasticitě, tj. případu, kdy data jsou ve výběrech měřena s různou přesností. V této situaci je správnější užít testovacího kritéria 2, které je vůči heteroskedasticitě robustnější. Na druhé straně však ekvivalentní stupně volnosti ν vycházejí menší než 1 + 2 - 2, takže síla testu 2 je nižší než síla 1. jestliže jedno z rozdělení se odchyluje od normality nebo se významně liší v šikmosti od druhého, je vhodné použít modifikované testovací kritérium 3 3
3
* ¯ ¯* 2 x 1
ˆ1x kde
1 6
2 1
3 x
ˆ1y
1
2 2
2 x
2 y
1
2
( ¯ ¯)2
2 y 2
3 y 2
ˆ1x a
,
1 3
2 1
3 x
1 2 x 1
ˆ1y 2 2
3 y 2
2 2 y 2
V těchto vztazích jsou ˆ 1x a ˆ 1y výběrové šikmosti. Aby bylo možné užít kvantilů Studentova rozdělení pro předepsanou hladinu významnosti α, je třeba přeformulovat testovací kritérium 3 do tvaru 3 2 x y, kde
3
2
gˆ1x sx 2
2
6 n1 n1 Bx
sx
n1
2
sy
2
n2 2
n1
2
sx
2
3 n2 n2
sx
a
gˆ1x s x (¯ x y¯)2
n1
sy
n2
2
sy
n2 2
2
se vyčíslí analogicky, pouze šikmost ˆ1x se nahradí hodnotou ˆ1y , rozptyl σx hodnotou σy a rozsah 1 hodnotou . Za předpokladu platnosti hypotézy H0 má testovací kritérium 3 Studentovo rozdělení s počtem stupňů volnosti 2 ν. Test založený na kritériu 3 je robustní vůči sešikmení výběrových rozdělení i vůči heteroskedasticitě a není 2 2 u něho požadována ani shoda rozptylů, σx
σy . Vůči odchylkám rozdělení od normality ve špičatosti jsou uvedené -testy 1 2 a 3 dostatečně robustní. Je možné použít i korekcí na špičatost, což však nepřináší výrazné zlepšení. y
jsou-li ve výběrech přítomna vybočující měření, 4 2 2 lze pro test hypotézy H0: µ1 = µ2, a σ1 = σ2 upravit testovací kritérium založené na uřezaném průměru na tvar ( x¯(D) y¯(D))
T4
Sw,x(D) Sw,y(D)
kde w,x( ) a w,y( ) se vyčíslí pro výběry i = 1, ..., 1 , a j přibližně Studentovo rozdělení s 2 ( - 1) stupni volnosti. Test
= 1, ..., 2 . Je-li 1 = 2 , má náhodná veličina $ 7. 4 lze použít jen pro rozsah 2
a nestejných rozsahů = µy
1
5
5
2
a s využitím kritéria ¯( ) ¯( ) 2 w ,x
2 w ,x
w ,x( 1
)
1
,
2 w ,y
w ,y (
2
)
1
2
i
5
, kde
2
pro případ nestejných rozptylů σ1
σ2 lze formulovat robustní kritérium 5 pro test hypotézy H0 : µx
2 w ,y
1
Testovací kritérium
2
4
i
2
i
100
pro
1, 2.
má přibližně Studentovo rozdělení s ν stupni volnosti, pro které platí 2
sw,x 1 ν
z2 (1 z)2 , kde h1 1 h2 1
z
h1 2
sw,x h1
2
sw,y
.
h2
Robustní testy 4 a 5 jsou výhodné také pro rozdělení s dlouhými konci, když je špičatost větší než 3. V případě normálního rozdělení však mají menší sílu než testy 1 a 2.