6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně zvolené funkce náhodného výběru (statistiky), jejíž rozdělení známe a na jejíchž hodnotách se projevují sledované vlastnosti. Rozeznáváme dva základní typy testů: Parametrické testy jsou testy o hodnotách parametrů rozdělení, ze kterého je proveden náhodný výběr. Neparametrické testy jsou testy o vlastnostech rozdělení, např. typ rozdělení, shoda dvou a více rozdělení, či symetrie rozdělení. Strategie testování. 1. Na základě hodnot náhodného výběru a charakteru úlohy zvolíme: nulovou hypotézu H0 a alternativní hypotézu H1 , kterou příjímáme v případě odmítnutí nulové hypotézy. 2. Volíme testovací kritérium. Vybereme statistiku, funkci náhodného výběru, jejíž rozdělení známe a která charakterizuje testovanou vlastnost rozdělení. 3. Stanovíme hladinu významnosti testu jako hodnotu α, číslo α je blízké nule. Obvykle z intervalu (0, 01; 0, 1), nejčastěji 0, 05, která bývá zadavaná ve statistických programech. 4. Na základě hodnoty hladiny, stanovíme kritický obor Wα testu, kdy v případě, že zvolená statistika má hodnotu z kritického oboru zamítneme nulovou hypotézu H0 a přijmeme alternativní hypotézu H1 . Chyby testu. Je-li T testovací statistika, α je hladina významnosti testu a Wα je kritický obor testu, pak při rozhodovaní nastanou následující situace. Skutečnost H0 H1 H0 T ∈ / Wα T ∈ / Wα , správně chyba 2. druhu ≤ β H1 T ∈ Wα , T ∈ Wα chyba 1. druhu ≤ α správně Stanovení kritického oboru. Požadujeme, aby chyba 1. druhu, kdy odmítneme nulovou hypotézu H0 , ačkoliv platí, byla menší než α. K 83
tomu stačí, aby byl kritický obor Wα doplňkem k (1 − α)100% intervalu spolehlivosti pro testovaný parametr rozdělení. Chybu 2. druhu můžeme pouze ve většině případů alespoň odhadnout. Při této volbě kritického oboru jsou chyby 1. a 2. druhu na sobě závislé. Je-li zvolená chyba 1. druhu α příliš malá, může být chyba 2. druhu velká. Na obrázku Obr. 6.1 znázorníme jednoduchou situaci, která ilustruje závislost velikostí chyb. • Wα
@ @ @ @ @ @ @ @ @ @ @ @ @@@ @ @ @ @ @ @@ @@ @ @ @ µ0 T tα
µ1
x
Obr. 6.1. Znázorníme si vztah chyby 1. druhu α a chyby 2. druhu β. Testujeme nulovou hypotézu H0 : µ = µ0 na hladině významnosti α pro případ výběru z normálního rozdělení N (µ; σ 2 ). Použijeme testovací statistiku √ T = (X − µ) n/S, o které víme , že má Studentovo rozdělení t(n − 1). Označme T hodnotu testovací statistiky, tα je hranicekritického oboru Wα (kritická hodnota.) Jestliže je ale ve skutečnosti µ = µ1 , pak nulová hypotéza H0 neplatí. Chyba 2. druhu β odpovídá ploše obrazce \\\\ a hodnota chyby 1. druhu α odpovídá ploše obrazce ////. Je vidět, že pokud budeme hodnotu α zmenšovat, pak se bude hranice tα kritického oboru posunovat doprava a hodnota chyby 2. druhu β se bude zvětšovat. Proto v praxi volíme hodnotu α podle charakteru úlohy. Musíme se rozhodnout, zda je pro nás přijatelnější odmítnou testovanou hypotézu H0 i když je ve skutečnosti pravdivá a nebo zda je přijatelnější ji přijmout, i když ve skutečnosti platí alternativní hypotéza. Poznámka: p−hodnota testu. V současné době se používá místo popsaného rozhodovacího procesu rozhodovaní na základě p− hodnoty testu. Je to umožněno tím, že pro většinu používaných statistik známe jeich rozdělení a dovedene určit pravděpodobnosti a kvantily v celém rozsahu a nejsme odkázáni na několik tabulkových hodnot pro vybrané hladiny významnosti. p−hodnota testu je definována jako hodnota hladiny významnosti, při které se hodnota testovací statistiky stává hraniční hodnotou kritického oboru. Situaci si znázorníme na obrázku pro jednotlivé varianty testu. Symboly tβ jsou označeny β−kvantily rozdělení 84
testovací statistiky T, které tvoří hranice kritického oboru testu. Je-li T testovací statistika a t0 je její hodnota, pak je p−hodnota testu definována jako: p = 2 min{P (T ≥ t0 ), P (T ≤ t0 )} pro oboustranný test; p/2 = P (T ≥ t0 ) Wα
t
0
α 2
• t0
t1− α2
Wα
p = P (T ≥ t0 ) pro pravostranný test; p = P (T ≥ t0 ) 0
• t0
t1−α
Wα
p = P (T ≤ t0 ) pro levostranný test. p = P (T ≤ t0 ) Wα
tα
• t0
0
Nulovou hypotézu H0 zamítáme na hladině významnosti α, jestliže je p < α. Velikost pravděpodobnosti p je přesnějším popisem rozhodovacího procesu, než je minimální „vzdálenostÿ bodu t0 od hranice kritického oboru. Testy o parametrech rozdělení. 6.1. Test o střední hodnotě, jednovýběrový t-test. Předpokládáme, X1 , X2 , . . . Xn je náhodný výběr z normálního rozdělení N (µ; σ 2 ). Jako odhad střední hodnoty µ použijeme výběrový průměr X a jako odhad rozptylu σ 2 použijeme výběrový rozptyl S 2 . a) Testujeme nulovou hypotézu (oboustranný test) H0 : µ = µ0 proti alternativní hypotéze H1 : µ 6= µ0 . Za testovou statistiku volíme T =
X − µ0 √ n, S
85
o které je známo, že má Studentovo t(n − 1) rozdělení. Je totiž T =
X−µ √0 σ0 / n
S
=
X−µ √0 σ0 / n s n X −X 2 √ P i / n σ0 i=1
=
q
−1
U , Z/(n − 1)
kde U ∼ N (0; 1) a Z ∼ χ2 (n − 1). Kritickým oborem je Wα = {T ; |T | > t1− α2 (n − 1)} doplněk k (1 − α)100% intervalu spolehlivosti pro parametr µ. Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 100α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Situace je znázorněná na obrázku. Wα
Wα 0
t α2
t1− α2
Obdobně provádíme test jednostranných hypotéz: b) H0 : µ ≤ µ0 , H1 : µ > µ0 , pak
0 c) H0 :
µ ≥ µ0 ,
Wα = {T ; T > t1−α (n)}; Wα t1−α H1 :
µ < µ0 , pak
Wα = {T ; T < tα (n)}. Wα tα
0
Kritické hodnoty testu. Krajní body intervalů, které tvoří kritické obory se nazývají kritické hodnoty testu. Označují se symbolem t(α), ačkoliv jsou to 1 − α2 kvantily. Při práci s tabulkami je třeba dávat pozor, jak je přesně kritická hodnota definována. V záhlaví tabulky je toto vždy uvedeno. Poznamenejme, že pro rozsahy výběru n ≥ 30 můžeme nahradit kvantily, či kritické hodnoty Studentova t−rozdělení hodnotami z normovaného normálního rozdělení. Obvykle bývají označeny symbolem u(α). 86
Příklad: Soubor {Xi , 1 ≤ i ≤ n} je náhodným výběrem z normálního rozdělení N (µ; σ 2 ). Testovaná hypotéza: H0 : µ = µ0 , alternativní hypotéza H1 : µ 6= µ0 . a) VS-1: n = 35, X = 182, 11, S 2 = 61, 1, S = 7, 81665. Testujeme hypotézu H0 : µ = µ0 = 180, proti alternativě H1 : µ 6= 180. Potom je 182, 11 − 180 √ 35 = 1, 5969. T = 7, 81665 Kritické hodnoty t(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) = 2, 5758. Protože je T ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . p− hodnota testu je p = 0, 12, je tedy rozhodování blízké hladině významnosti. b) VH-4: n = 27, X = 76, 74, S 2 = 59, 74, S = 7, 72916. Testujeme hypotézu H0 : µ = µ0 = 75, proti alternativě H1 : µ 6= 75. Potom je 76, 74 − 75 √ T = 27 = 1, 1698. 7, 72916 Kritické hodnoty t(0, 1) = 1, 7056, t(0, 05) = 2, 0555, t(0, 01) = 2, 7787. Protože je T ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . p− hodnota testu je p = 0, 253, můžeme tedy považovat chybu 2. druhu za malou ve srovnání s hodnotou α. 6.2. Test o rozptylu normálního rozdělení jednovýběrový F − test. Pro náhodný výběr X1 , X2 , . . . Xn je náhodný výběr z normálního rozdělení N (µ; σ 2 ) hledáme hodnotu rozptylu σ 2 . Jako jeho odhad použijeme výběrový rozptyl S 2 . a) Testujeme nulovou hypotézu H0 : σ 2 = σ02 proti alternativní hypotéze H1 : σ 2 6= σ02 . Za testovou statistiku volíme n (n − 1)S 2 X V = = σ02 i=1
87
2
X − X i , σ0
o které je známo, že má χ2 (n−1) rozdělení. Kritickým oborem je množina Wα = {V ; V < χ2α2 (n − 1) nebo V > χ21− α2 (n − 1)}, která je doplňkem k (1−α)100% intervalu spolehlivosti pro parametr σ 2 . Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 100α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Situace je znázorněná na obrázku. Wα 0
Wα
χ2α2
χ21− α2
Obdobně provádíme test jednostranných hypotéz: H1 : σ 2 > σ02 , pak b) H0 : σ 2 ≤ σ02 , Wα = {V ; V > χ21−α (n − 1)}; Wα χ21−α
0 c) H0 :
σ 2 ≥ σ02 ,
H1 :
σ 2 < σ02 , pak
Wα = {V ; V < χ2α (n − 1)}. Wα 0
χ2α
Kritické hodnoty testu. Krajní body intervalů, které tvoří kritické obory se nazývají kritické hodnoty testu. Označují se symbolem χα , ačkoliv jsou to 1 − α2 kvantily. Při práci s tabulkami je třeba dávat pozor, jak je přesně kritická hodnota definována. V záhlaví tabulky je toto vždy uvedeno. Příklad: Soubor {Xi , 1 ≤ i ≤ n} je náhodným výběrem z normálního rozdělení N (µ; σ 2 ). a) VS-2: n = 30, X = 183, S 2 = 64, 97. Testujeme hypotézu H0 : σ 2 = σ02 = 70, proti alternativě H1 : σ 2 6= 70. Potom je 29.64, 97 V = = 26, 916. 70 88
Kritické hodnoty α = 0, 1 : 17, 708, 42, 557; α = 0, 05 : 16, 047, 45, 722; α = 0, 01 : 13, 121, 52, 336. Protože je V ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . p− hodnota testu je p = 0, 848. Je p >> α, tedy závěr je poměrně spolehlivý, chyba 2. druhu je velice malá. b) VH-4: n = 27, X = 76, 74, S 2 = 59, 74. Testujeme hypotézu H0 : σ 2 = σ02 = 100, proti alternativě H1 : σ 2 6= 100. Potom je 26.59, 74 V = = 15, 532. 100 Kritické hodnoty α = 0, 1 : 15, 375, 38, 885; α = 0, 05 : 13, 844, 41, 923; α = 0, 01 : 11, 160, 48, 290. Protože je V ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . p− hodnota testu je p = 0, 106 a hodnota je velice blízká uvažovaným hladinám významnosti α = 0, 1, resp. α = 0, 05. Chyba 2. druhu může být významná. 6.3. Test pro parametr δ exponenciálního rozdělení Exp(0; δ). Pomocí hodnot náhodného výběru X1 , X2 , . . . , Xn z exponenciálního rozdělení Exp(0; δ) testujeme hypotézu o střední hodnotě δ. Nulovou hypotézou je H0 : δ = δ0 proti alternativě H1 : δ 6= δ0 . Za testovou statistiku volíme náhodnou veličinu T =
2nX , δ0
o níž jsme ukázali, že má rozdělení χ2 (2n). Kritickým oborem je Wα = {T ; T < χ2α2 (n − 1) nebo T > χ21− α2 (n − 1)}, což je doplněk k (1 − α)100% intervalu spolehlivosti pro parametr δ. Příklad: Soubor {Xi ; 1 ≤ i ≤ n} je výběrem s exponenciálního rozdělení Exp(0; 1, 5), kde n = 40. 89
Testujeme hypotézu H0 : δ = δ0 = 1, 3 proti alternativní hypotéze H1 : δ 6= δ0 . ˜ = 60, 43627. Pro testovací statistiku dostaPro data jsme dostali X neme hodnotu 2nX T = = 92, 98. δ0 Kritický obor na hladině významnosti α = 0, 1 získáme z kvantilů rozdělení χ2 (80). Je W = {T ; T < χ20,05 (80) = 60, 391, nebo T > χ20,95 (80) = 101, 88}. Protože je T ∈ / W nezamítáme nulovou hypotézu H0 . Z kvantilové funkce získáme p− hodnotu testu p = 0, 304, což je přijatelná hodnota, která signalizuje menší hodnoty chyby 2. druhu. Pro zajímavost uvedeme interval spolehlivosti (δ1 ; δ2 ) pro parametr δ, kdy jeho hranice dostaneme z rovnic 120, 873 120, 873 = 101, 88, resp. T = 60, 391. T = δ1 δ2 Odtud plyne, že pro hodnoty δ0 ∈ (1, 19; 2) nebudou hodnoty testovací statistiky v kritickém oboru, tedy nulovou hypotézu nezamítneme. 6.4. Test o rovnosti středních hodnot, dvouvýběrový t-test. Předpokládáme, že X1 , X2 , . . . , Xn je náhodný výběr z normálního rozdělení N (µ1 ; σ12 ) a Y1 , Y2 , . . . , Ym je náhodný výběr z normálního rozdělení N (µ2 ; σ22 ). Jako odhady středních hodnot µ1 a µ2 použijeme výběrové průměry X a Y a jako odhady rozptylů σ12 a σ22 použijeme výběrové 2 rozptyly SX a SY2 . Předpokládáme, že jsou výběry nezávislé a že se rozptyly rovnají, tedy σ12 = σ22 = σ 2 . Testujeme nulovou hypotézu H0 : µ1 − µ2 = ∆, obvykle ∆ = 0, proti alternativní hypotéze H1 : µ1 − µ2 6= ∆. A) Dvouvýběrový t-test. Za testovou statistiku volíme T =
q
X − Y − (µ1 − µ2 ) 2 + (m − 1)S 2 (n − 1)SX Y
v u u nm(n t
+ m − 2) , n+m
o které je známo, že má Studentovo t(n + m − 2) rozdělení. K odvození této skutečnosti postupně použijeme vlastností: σ2 X ∼ N µ1 , , n
σ2 Y ∼ N µ2 , . m
90
Dále je E(X − Y ) = E(X) − E(Y ) = µ1 − µ2 . Z nezávislosti výběrů plyne, že σ12 σ22 1 n+m 1 D(X − Y ) = D(X) + D(Y ) = + = σ2 + = σ2 . n m n m nm Výraz pro S je odhadem rozptylu obou souborů. Náhodná veličina !
2 n X + (m − 1)SY2 (n − 1)SX Z= = σ2 i=1
2
m X X − X i + σ i=1
Y −Y i σ
2
∼ χ2 (n − 1) + χ2 (m − 1) = χ2 (n + m − 2). Potom je T = kde U=
q
U , Z/(n + m − 2)
X − Y − (µ1 − µ2 ) q ∼ N (0; 1) σ n+m nm
a tedy statistika T má Studentovo rozdělení t(n + m − 2). Kritickým oborem testu je množina Wα = {T ; |T | > t1− α2 (n + m − 2)}, která je doplňkem k (1 − α)100% intervalu spolehlivosti pro parametr ∆ = µ1 − µ2 . Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 100α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Porušení normality výběru se ve výsledcích testů výrazněji neprojeví. Shodu rozptylů před výpočtem ověříme testem pro jejich rovnost. Pokud nám test pro rovnost rozptylů dá negativní výsledek, použijeme pro ověření hypotézy některou z uvedených variant testu, např. CochranůvCoxův test nebo neparametrické testy, např. dvouvýběrový Wilcoxonův test, či Kolmogorovův-Smirnovův test, nebo test dobré shody. B) Cochranův-Coxův test volíme v případě, že není splněn předpoklad o rovnosti rozptylů. Za testovou statistiku volíme T∗ =
X −Y −∆ , S
S=
√
vX + vY , 91
vX =
2 SX S2 , vY = Y . n m
Je pak T∗ =
X −Y −∆ r
2 SX n
+
SY2 m
=
X −Y −∆ r
2 +nS 2 mSX Y nm
=
q X−Y −∆ nm σ n+m r . 2 +nS 2 mSX Y σ(n+m)
Náhodná veličina v čitateli má normované normální rozdělení a ve jmenovateli χ2 . Ve jmenovateli představuje vážený průměr odhad rozptylu. Kritickým oborem je Wα = {T ∗ ; |T ∗ | > t∗ },
t∗ =
vX tn−1 (α) + vY tm−1 (α) , vX + vY
kde tk (α) je kritická hodnota jednovýběrového t−testu. Kritickou hodnotu t∗ dostaneme jako vážený průměr kritických hodnot jednovýběrových testů. Uvedený test má ještě některé jiné varianty, které pro menší rozsahy výběrů dávají poněkud jiné kritické obory. Uvedeme si na ukázku dvě z nich. C) Satterthwaite (1946). Při použití statistiky T ∗ stanovujeme kritický obore jako ∗
∗
Wα = {T ; |T | > tf (α)},
f=
S4 2 vX n−1
+
vY2 m−1
,
kde tk (α) je kritická hodnota jednovýběrového t−testu. D) Welch (1947). Pro statistiku T ∗ je kritickým oborem Wα = {T ∗ ; |T ∗ | > th (α)},
h=
S4 2 vX n
+
vY2 m
− 2,
kde tk (α) je kritická hodnota jednovýběrového t−testu. Varianty majípraktické využití při menších rozsazích výběrů. Je-li m+ n > 30 dávají všechny stejné výsledky. Kritické hodnoty se při změně počtu stupňů volnosti již nemění. Příklad: Soubor {Xi , 1 ≤ i ≤ n} je náhodným výběrem z normálního rozdělení N (µ1 ; σ12 ) a soubor {Yi , 1 ≤ i ≤ m} je náhodným výběrem z normálního rozdělení N (µ2 ; σ22 ). 92
2 = 64, 97; a) VS-2: n = 30, X = 183, SX 2 VS-4: m = 27, Y = 181, SY = 74, 77. Testujeme hypotézu H0 : µ1 = µ2 , proti alternativě H1 : µ1 6= µ2 . Potom je 183 − 181 − 0 T = 27, 9567 = 0, 90369. 61, 872 Kritické hodnoty t(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) = 2, 5758. Protože je T ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . Pro test dostaneme p− hodnotu rovnu p = 0, 37, která je výrazně větší než uvažované hladiny významnosti testu. 2 b) VH-1: n = 35, X = 75, 4, SX = 110, 78; 2 VH-3: m = 34, Y = 77, 53, SY = 134, 62. Testujeme hypotézu H0 : µ1 = µ2 , proti alternativě H1 : µ1 6= µ2 . Potom je
T =
75, 4 − 77, 53 − 0 33, 9927 = 0, 79913. 90, 6034
Kritické hodnoty t(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) = 2, 5758. Protože je T ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . Pro test dostaneme p− hodnotu rovnu p = 0, 42, která je výrazně větší než uvažované hladiny významnosti testu. 6.5. Test o rovnosti rozptylů, dvouvýběrový F-test. Předpokládáme, že X1 , X2 , . . . , Xn je náhodný výběr z normálního rozdělení N (µ1 ; σ12 ) a Y1 , Y2 , . . . , Ym je náhodný výběr z normálního rozdělení N (µ2 ; σ22 ). Jako odhady středních hodnot µ1 a µ2 použijeme výběrové průměry X a Y a jako odhady rozptylů σ12 a σ22 použijeme výběrové 2 rozptyly SX a SY2 . Předpokládáme, že jsou náhodné výběry nezávislé. Testujeme nulovou hypotézu H0 : σ12 = σ22 proti alternativě H1 : σ12 6= σ22 . 2 Jako výběr Xi označíme ten, pro který je SX > SY2 . Za testovou statistiku volíme 2 SX F = 2, SY 93
o které je známo, že má Fn−1,m−1 rozdělení. Kritickým oborem je Wα = {F ; F > Fn−1,m−1 (α), } kde Fn−1,m−1 (α) je kritická hodnota z tabulek, která je (1−α/2)−kvantilem rozdělení Fn−1,m−1 . Poznamenejme, že při této volbě označení výběrů vyjde vždy hodnota testovací statistiky větší než jedna. Kritický obor je tedy volen tak, že tento poměr nesmí přesáhnout kritickou hodnotu. Pro obecnou situaci by měl kritický obor ještě část hodnot blízkých nule. To ve zvolené variantě testu ale nemůže nastat. Testy ve statistických softwarových produktech někdy předpokládají volbu této varianty a testují obvykle pouze překročení horní kritické hodnoty. Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 100α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Příklad: Soubor {Xi , 1 ≤ i ≤ n} je náhodným výběrem z normálního rozdělení N (µ1 ; σ12 ) a soubor {Yi , 1 ≤ i ≤ m} je náhodným výběrem z normálního rozdělení N (µ2 ; σ22 ). 2 a) VH-1: X − n = 35, X = 75, 4, SX = 110, 78; 2 VH-2: Y − n = 30, Y = 77, 4, SY = 102, 59. Testujeme hypotézu H0 : σ12 = σ22 , proti alternativě H1 : σ12 6= σ 2 . Potom je 110, 78 F = = 1, 09798. 102, 59 Kritické hodnoty α = 0, 1 : 1, 79; α = 0, 05 : 2, 01. Protože je F ∈ / Wα pro všechny hladiny, přijmeme nulovou hypotézu H0 . Pro test dostaneme p−hodnotu p = 0, 8, tedy odmítnutí alternativní hypotézy je oprávněné. 2 b) VH-3: X − n = 30, X = 77, 53, SX = 134, 62; VH-4: Y − n = 27, Y = 76, 74, SY2 = 59, 74. Testujeme hypotézu H0 : σ12 = σ22 , proti alternativě H1 : σ12 6= σ 2 . Potom je 134, 62 F = = 2, 25351. 59, 74 Kritické hodnoty
94
α = 0, 1 : 1, 89; α = 0, 05 : 2, 14. Protože je F ∈ Wα pro všechny hladiny, zamítneme nulovou hypotézu H0 a přijmeme hypotézu H1 . Pro test dostaneme p−hodnotu rovnu p = 0, 04, což potvrzuje odmítnutí nulové hypotézy. Neparametrické testy V neparametrických testech má hypotéza charakter tvrzení o vlastnostech rozdělení, které nejsou odvozeny od hodnot parametrů. Testujeme hodnotu mediánu, symetrii rozdělení, shodu dvou a více rozdělení, či typ rozdělení a to nejčastěji normalitu. Uvedeme některé z nejčastěji používaných testů. 15.6. Znaménkový test je testem o mediánu rozdělení. Používáme jej jako velice jednoduchou variantu testu na symetrii rozdělení, kdy by se měl medián rovnat střední hodnotě. Test má velmi malou vypovídací hodnotu, uvádíme jej jako příklad neparametrického testu. na kterém ukážeme principy testování tohoto druhu. Předpokládáme, že X1 , X2 , . . . , Xn je náhodný výběr ze spojitého rozdělení jehož medián je x0,5 = x˜. Testujeme nulovou hypotézu H0 : x˜ = x0 , proti alternativě H1 : x˜ 6= x0 . Označme si Yi = Xi −x0 . Pokud je nulová hypotéza platná, pak by měl být počet kladných a záporných hodnot souboru Yi stejný. Označímeli Y počet kladných hodnot v souboru Yi , je pak Y realizací náhodné veličiny, která má binomické rozdělení Bi(n, 12 ). Ta nabývá hodnot z množiny {0, 1, 2, . . . , n} a hodnoty blízké nule a n se vyskytují s velmi malou pravděpodobností. Kritický obor testu je Wα = {Y ; Y ≤ k1 nebo Y ≥ k2 }, kde hodnoty k1 a k2 nalezneme v tabulkách. Pro zvolenou hladinu testu je nalezneme tak, že je k1 největší z hodnot a k2 je nejmenší z hodnot, pro které platí α α P (Y ≤ k1 ) ≤ , P (Y ≥ k2 ) ≤ , 2 2 jestliže má Y zmiňované binomické rozdělení Bi(n, 21 ). Pokud má výběr větší rozsah, n > 36, můžeme nahradit binomické rozdělení Bi(n, 21 ) normálním rozdělením N ( n2 , n4 ). Obě rozdělení mají 95
shodné střední hodnoty náhodná veličina
n 2
a shodné rozptyly n4 . Potom má normalizovaná
U=
Y − √
n 2
n 2
=
2Y − n √ n
normované normální rozdělení N (0; 1). Kritický obor je roven Wα = {U ; |U | ≥ u(α), } kde u(α) je kritická hodnota pro normální rozdělení, kterou nalezneme z tabulek. Poznamenejme, že je tato kritická hodnota u(α) = u1− α2 rovna 1 − α2 kvantilu normovaného normálního rozdělení. Snadno odvodíme i jednostranné varianty testu. Test má poměrně malou sílu a k věrohodnotnějšímu výsledku je potřeba poměrně velký rozsah náhodného výběru, v řádu n > 500.. Příklad: Soubor dat {Xi ; 1 ≤ i ≤ 6} je počet, kolikrát padne číslo {i; 1 ≤ i ≤ 6} při 150 hodech hrací kostkou. Je Xi ∈ {24, 22, 25, 22, 28, 29}. Testujeme nulovou hypotézu H0 : x˜ = x0,5 = 25 proti alternativní hypotéze H1 : x˜ 6= 25. Pro uvedená dat je Yi ∈ {−1, −3, 0, −3, 3, 4}. Počet kladných hodnot je Y = 2. Z tabulek dostaneme kritické hodnoty testu na hladině významnosti α = 0, 05 a z nich kritický obor W = {Y ; Y ≤ k1 = 0, nebo Y ≥ k2 = 6}. Protože je Y ∈ / W nezámítáme nulovou hypotézu H0 . Příklad: Soubor dat {Xi ; 1 ≤ i ≤ 6} je počet, kolikrát padne číslo {i; 1 ≤ i ≤ 6} při 300 hodech hrací kostkou. Je Xi ∈ {48, 52, 51, 40, 51, 48}. Testujeme nulovou hypotézu H0 : x˜ = x0,5 = 50 proti alternativní hypotéze H1 : x˜ 6= 50. Pro uvedená dat je Yi ∈ {−2, 2, 1, −10, 1, −2}. Počet kladných hodnot je Y = 3. Z tabulek dostaneme kritické hodnoty testu na hladině významnosti α = 0, 05 a z nich kritický obor W = {Y ; Y ≤ k1 = 0, nebo Y ≥ k2 = 6}. 96
Protože je Y ∈ / W nezámítáme nulovou hypotézu H0 . Jeste jeden p5iklad 6.7. Jednovýběrový Wilcoxonův test je testem symetrie rozdělení. Testujeme symetrii rozdělení vzhledem k hodnotě x0 , za kterou obvykle volime odhad mediánu či střední hodnoty. Testujeme skutečnost, že pro hustotu či pravděpodobnostní funkci platí f (x − x0 ) = f (x + x0 ). Nulovou hypotézu zapisujeme ve tvaru podmínky pro medián x0,5 = x˜ : H0 : x˜ = x0 , proti alternativě H1 : x˜ 6= x0 . Pro náhodný výběr X1 , X2 , . . . , Xn utvoříme soubor Yi = Xi − x0 , ve kterém vypustíme případné nulové hodnoty. Hodnoty |Yi | uspořádáme podle velikosti a označíme Ri+ jejich pořadí. Nyní je S+ =
X
S− =
Ri+ ,
Yi >0
X
Ri+ .
Yi <0
Poznamenejme, že S + + S − = 21 n(n + 1). Pokud je rozdělení symetrické, budou se vyskytovat kladné a záporné hodnoty souměrně kolem hodnoty x0 , tedy součty pořadí kladných a záporných hodnot se od sebe budou málo lišit. Kritický obor testu je stanoven jako Wα : min(S + , S − ) < w(α), kde w(α) je kritická hodnota testu, kterou nalezneme v tabulkách. Je-li splněna podmínka pro kritický obor zamítneme nulovou hypotézu, že rozdělení je symetrické. Poznamenejme, že pro náhodné veličiny S + a S − je 1 1 E(S + ) = E(S − ) = n(n + 1), a D(S + ) = D(S − ) = n(n + 1)(2n + 1). 4 24 Pro větší hodnoty rozsahu výběru nahradíme rozdělení rozdělením normálním, tedy skutečností, že má náhodná veličina S + − 41 n(n + 1) U = q1 24 n(n + 1)(2n + 1) normované normální rozdělení N (0; 1). Kritický obor testu je pak Wα = {U ; |U | > u(α), } 97
kde uα je kritická hodnota testu pro normální rozdělení, která je rovna u(α) = u1− α2 , tedy (1 − α/2−kvantilu normovaného normálního rozdělení. Příklad: Budeme testovat symetrii souboru dat, která jsou počtem studentů, kteří získali u testu stejného bodového ohodnocení. Datový soubor je Xi ∈ {2, 3, 2, 8, 5, 6, 7, 6, 4, 3, 4}. Jestliže spočteme aritmetický průměr, dostaneme x = 50 11 = 4, 55. Budeme testovat symetrii rozdělení kolem této hodnoty, tedy nulovou hypotézu H0 : x˜ = 4, 55 proti alternativní hypotéze H1 : x˜ 6= 4, 55. Pro hodnoty Xi −˜ x určíme součet pořadí kladných a záporných hodnot a dostaneme, že S + = 29,
S − = 37.
(S + + S − = 66)
Odtud je min{S + , S − } = 29. Pro kritické hodnoty w(α) testu dostaneme z tabulek hodnoty w(0, 05) = 10, w(0, 01) = 5. Pro obě hladiny významnosti je min{S + , S − } > w(α), tedy nulovou hypotézu nezamítáme. Rozdělení je symetrické kolem hodnoty x˜ = 4, 55. 6.8. Dvouvýběrový Wilcoxonův test slouží k porovnání výběrů, kdy testujeme hypotézu, že jsou oba výběry ze stejného rozdělení. Předpokládáme, že náhodný výběr {X1 , X2 , . . . , Xn } je výběrem z rozdělení s distribuční funkcí F a náhodný výběr {Y1 , Y2 , . . . , Ym } je výběrem z rozdělení s distribuční funkcí G. Testujeme hypotézu H0 : F = G proti alternativě H1 : F 6= G. Test je založen na skutečnosti, že pokud jsou obě rozdělení stejná, pak se v obou výběrech budou vyskytovat hodnoty shodné velikosti ve stejném počtu. Uvedený algoritmus je známý jako test. Algoritmus testu: 1. Vytvoříme sdružený soubor {Z1 , Z2 , . . . , Zn+m } = {X1 , X2 , . . . , Xn } ∪ {Y1 , Y2 , . . . , Ym }. 2. Stanovíme pořadí prvků souboru, který uspořádáme podle velikosti, přičemž prvkům, které mají stejnou velikost přiřadíme průměr jejich pořadí. Označme 98
T1 − je součet pořadí prvků z prvního souboru; T2 − je součet pořadí prvků z druhého souboru. Poznamenejme, že T1 + T2 = 12 (n + m)(n + m + 1). 3. Položme 1 U1 = nm + n(n + 1) − T1 2
1 a U2 = nm + m(m + 1) − T2 . 2
Poznamenejme pro kontrolu, že U1 + U2 = nm. Testovací kritérium: Kritický obor Wα :
min{U1 , U2 } ≤ w(α),
kde kritickou hodnotu w(α) testu nalezneme v tabulkách. Poznámka: Pořadí souborů volíme tak, aby n ≥ m, tabulky bývají pro rozsahy 2 ≤ m ≤ 20, 5 ≤ n ≤ 30. Pro větší rozsahy výběrů využíváme skutečnosti, že za platnosti hypotézy H0 je 1 1 E(U1 ) = E(U2 ) = nm a D(U1 ) = D(U2 ) = nm(n + m + 1). 2 12 Rozdělení obou veličin můžeme pak považovat za normální a tedy náhodná veličina U=
q
U1,2 − 21 nm 1 12 nm(n + m)(n + m + 1)
má normované normální rozdělení N (0; 1). Kritický obor testu je Wα = {U ; |U | > u(α)}, kde u(α) je kritická hodnota pro normální rozdělení, tedy u1− α2 kvantil normálního rozdělení. Příklad: Budeme testovat shodu rozdělení pro datové soubory {Xi ; 1 ≤ i ≤ 10} a {Yi ; 1 ≤ i ≤ 10}, které jsou počty výskytů 1, resp. 6 v seriích po 30 hodech hrací kostkou. Dostaneme Xi ∈ {4, 3, 3, 7, 7, 7, 2, 6, 1, 7} a Yi ∈ {6, 6, 4, 5, 8, 5, 1, 4, 4, 5}. Pro sdružené pořadí dostaneme T1 = T2 = 105, tedy U1 = U2 = 50. Kritické hodnoty w(α) testu nalezneme v tabulkách. Z nich dostaneme, 99
že w(0, 05) = 23 a w(0, 01) = 16. Protože min{U1 ; U2 } = 50 > w(α), tedy hodnota statistiky nepatří do kritického oboru, nezamítáme nulovou hypotézu H0 na obou hladinách významnosti. Poznámka. Test je citlivý na posun, tedy na situaci, kdy je F (x) = G(x − ∆). Pořadí jednotlivých dat souborů jsou vůči sobě posunuta a v součtu je pak jejich rozdíl velký. Dochází tak k zamítnutí hypotézy o shodě. Pro tyto situace a případy, kdy se soubory liší spíše rozptylem či tvarem je doporučován Kolmogorovův-Smirnovův test. 6.9. Kruskalův-Wallisův test je neparametrickou obdobou analýzy rozptylu a je rozšířením Wilcoxonova testu na větší počet výběrů. Máme k, k ≥ 3 nezávislých výběrů Xi1 , Xi2 , . . . , Xini , 1 ≤ i ≤ k. Označme n = n1 + n2 + . . . + nk počet všech prvků ve výběrech. Předpokládáme, že výběry jsou po řadě z rozdělení se spojitými distribučními funkcemi F1 , F2 , . . . , Fk . Testujeme nulovou hypotézu H0 : F1 = F2 = . . . = Fk proti alternativě H1 : H0 neplatí. Algoritmus testu: 1. Srovnáme všechny prvky výběrů podle velikosti a určíme pořadí Rij , 1 ≤ j ≤ ni , 1 ≤ i ≤ k každého z nich. 2. Určíme součet pořadí Ti =
ni X
Rij , 1 ≤ i ≤ k
j=1
prvků z každého z výběrů. Pro kontrolu je T1 + T2 + . . . + Tk = 21 n(n + 1). 3. Vypočteme hodnotu testovací statistiky k T2 X 12 i Q= − 3(n + 1). n(n + 1) i=1 ni
4. Kritický obor testu je Wα = {Q; Q > hk−1 (α)}, kde kritické hodnoty hk−1 (α) nalezneme pro menší rozsahy výběrů ve statistických tabulkách. Při větších rozsazích využíváme skutečnosti, že 100
pro ni → ∞ má statistika Q v limitě rozdělení χ2 (k − 1). Použijeme tedy . χ2 (k − 1). Jedná se o (1 − α)−kvantil rozdělení aproximace hk−1 (α) = α 2 χ (k − 1). Test je citlivý na posun, podobně jako při porovnávání dvou výběrů. V takovém případě volíme porovnávání metodou analýzy rozptylu. V případě zamítnutí nás zajímá, pro které z dvojic je rozdíl mezi Fi a Fj signifikantní. Pokud jsou rozsahy výběrů různé pak je podstatný rozdíl pro dvojice i a j, pro které je |ti − tj | >
v u u u t
1 1 1 + n(n + 1)hk−1 (α), 12 ni nj
kde ti = nTii , 1 ≤ i ≤ k a hk−1 (α) je kritická hodnota testu. Šetření je nutné provést pro všech 12 k(k − 1) dvojic výběrů. V případě stejného rozsahu výběrů používáme citlivější Neményiovy metody, která je obdobou Tukeyovy metody z analýzy rozptylu pro vyvážená třídění. Položme m = n1 = n2 = . . . = nk a n = mk. Rozdílné jsou dvojice, pro které je rozdíl |Ti − Tj | větší než kritická hodnota z tabulek. Ty uvadí hodnoty pro m ≤ 25 a k ≤ 10. Pro větší rozsahy výběrů používáme kritické hodnoty pro rozpětí. Je-li Y1 , Y2 , . . . , Yk náhodný výběr z rozdělení N (0; 1) a Y(1) ≤ Y(2) ≤ . . . ≤ Y(k) je uspořádaný výběr, pak náhodná veličina R = Y(k) − Y(1) je rozpětí. Kritická hodnota qk,∞ (α) je definována jako P (R ≥ qk,∞ (α)) = α. Rozdíl je signifikantní pro dvojice, pro které je v u u t
|ti − tj | > qk,∞ (α)
1 k(mk + 1). 12
Příklad: 6.10. Kolmogorovův-Smirnovův test. Test je založen na porovnávání maximální odchylky distribučních funkcí. Porovnáváme empirickou distribuční funkci, kterou získáme z datového souboru s teoretickou distribuční funkcí předpokládaného rozdělení. Nebo při porovnávání dvou výběrů srovnáváme obě empirické 101
distribuční funkce. Test je odvozen za předpokladu, že se jedná o výběry z normálního rozdělení. Pro jiná rozdělení, která se výrazně od něj odlišují (exponenciální) jsou v literatuře uvedeny modifikace testu. Nejprve popíšeme empirickou distribuční funkci, která se v testu používá. Je-li {X1 , X2 , . . . , Xn } náhodný výběr z rozdělení, které má distribuční funkci F, pak empirickou distribuční funkcí nazýváme funkci Fn , která je definována předpisem: n 1X Fn (x) = ξi (x), n i=1
*
kde ξi (x) =
0, x < Xi , 1, x ≥ Xi .
Potom je lim Fn (x) = F (x),
n→∞
x ∈ R.
Poznámka. Empirická distribuční funkce je po úsecích konstantní a má skoky velikosti 1 v bodech x = Xi , 1 ≤ i ≤ n. Znázorníme si průběh empirické distribuční funkce pro náhodný výběr, pro který platí: X1 < X2 < X3 = X4 < X5 . y 1− 4 5 − 2 51 − 5 −
• • c
X1
• c
F5 (x) • c
c
X 2 X 3 = X4 X5 x Obr. 12.1.
Jednovýběrový test Předpokládáme, že náhodný výběr Xi , 1 ≤ i ≤ n je výběrem z rozdělení s distribuční funkcí F. Testujeme hypotézu: H0 : výběr je z rozdělení s distribuční funkcí F proti alternativní hypotéze H1 : výběr není z rozdělení s distribuční funkcí F. Algoritmus testu: 1. Vypočteme empirickou distribuční funkce Fn a teoretickou dostribuční funkce F. 2. Určíme maximální rozdíl těchto funkcí, Dn = sup{|Fn (x) − F (x)|; x ∈ R}. 102
Platí-li hypotéza H0 je n,m→∞ lim Dn = 0. 3. Určíme testovací statistiku √ nDn , která má rozdělení určené distribuční funkcí K(λ), kde K(λ) = 1 − 2
∞ X
(−1)k+1 e−2k
2 2
λ
,
k=1
tj. lim P n,m→∞
√
nDn < λ = K(λ),
λ > 0.
4. Kritický obor testu je Wα :
√
λα nDn ≥ λα ⇔ Dn ≥ √ , n
kde kritickou hodnotu testu Dn∗ = √λαn nalezneme v tabulkách pro hodnoty 2 ≤ n ≤ 20. Pro větší rozsahy výběrů použijeme aproximace . 1 − 2e−2λ2 K(λ) = a kritickou hodnotu λα určíme z podmínky:
λα 2 P Dn < √ = K(λ) = 1−α ⇒ 1−α = 1−2e−2λα ⇒ λα = n
v u u t
1 2 − ln . 2 α
Pro kritický obor dostaneme Wα :
Dn ≥ Dn∗ =
v u u t
1 2 ln . 2n α
Příklad: Pro soubor dat {−2, −1, 5, −1, −0, 7, −0, 1, 0, 5, 1, 1, 1, 6, 2, 3} testujeme hypotézu H0 : výběr je z rovnoměrného rozdělení v intervalu (−2, 3). Podle algoritmu testu dostaneme: . 0, 1667; max{|Fn (x) − F (x)|; x ∈ h−2, 3i} = . 0, 577; hodnota statistiky Dn = kritická hodnota Dn (0, 05) = 1, 358. Protože je Dn < Dn (0, 05) nezamítáme hypotézu H0 na hladině vý. 0, 879. znamnosti α = 0, 05. Pro p−hodnotu testu dostaneme p = 103
Dvouvýběrový test Předpokládáme, že náhodný výběr {X1 , X2 , . . . , Xn } je výběrem z rozdělení s distribuční funkcí F a náhodný výběr {Y1 , Y2 , . . . , Ym } je výběrem z rozdělení s distribuční funkcí G. Testujeme hypotézu H0 : F = G proti alternativě H1 : F 6= G. Test je založen na skutečnosti, že pokud jsou obě rozdělení stejná, pak se v obou výběrech budou vyskytovat hodnoty shodné velikosti ve stejném počtu. Algoritmus testu: 1. Vypočteme empirické distribuční funkce Fn a Gm . 2. Určíme maximální rozdíl těchto funkcí, Dn,m = sup{|Fn (x) − Gm (x)|; x ∈ R}. Platí-li hypotéza H0 je n,m→∞ lim Dn,m = 0. 3. Určíme testovací statistiku √ nm M Dn,m , M = , n+m která má rozdělení určené distribuční funkcí K(λ), kde K(λ) = 1 − 2
∞ X
(−1)k+1 e−2k
2 2
λ
,
k=1
tj. lim P
√
n,m→∞
M Dn,m < λ = K(λ),
λ > 0.
4. Kritický obor testu je √ λα Wα : M Dn,m ≥ λα ⇔ Dn,m ≥ √ , M ∗ α kde kritickou hodnotu testu Dn,m = √λM nalezneme v tabulkách pro hodnoty 2 ≤ n ≤ 20, 4 ≤ m ≤ 20, n + m ≥ 8. Pro větší rozsahy výběrů použijeme aproximace . 1 − 2e−2λ2 K(λ) =
a kritickou hodnotu λα určíme z podmínky: P Dn,m
λα <√ M
!
2
= K(λ) = 1 − α ⇒ 1 − α = 1 − 2e−2λα ⇒ 104
v u u t
λα =
1 2 − ln . 2 α
Pro kritický obor dostaneme ∗ Dn,m ≥ Dn,m =
Wα :
v u u t
2 1 ln . 2M α
Příklad: Porovnáme shodu rozdělení, ze kterého pocházejí datové soubory, které jsou počtem 6, resp. 1 v seriích po 30 hodech hrací kostkou. Je Xi ∈ {1, 4, 4, 4, 5, 5, 5, 6, 6, 8} a Yi ∈ {1, 2, 3, 3, 4, 6, 7, 7, 7, 7}. Pro empirické distribuční funkce dostaneme: x F10 G10
1
2
3
4
5
6
7
8
1 10 1 10
1 10 2 10
1 10 4 10
4 10 5 10
7 10 5 10
9 10 6 10
9 10 10 10
10 10 10 10
Odtud dostaneme, že hodnota testovací statistiky je D10,10 =
3 . 10
Kritické hodnoty nalezneme v tabulkách, kde je ∗ ∗ (0, 01) = 0, 8. (0, 05) = 0, 7 a D10,10 D10,10 ∗ / Wα pro obě hodProtože je D10,10 < D10,10 , tedy hodnota D10,10 ∈ noty hladiny významnosti, nezamítáme nulovou hypotézu H0 na žádné z hladin. Pro výpočet přibližné kritické hodnoty dostaneme, že M = 100 20 = 5 a q 1 2 D ≈ 2M ln α : D ≈ 0, 607, α = 0, 05; D ≈ 0, 728, α = 0, 01. 6.11. Test shody pro binomické rozdělení. Máme dány hodnoty nezávislých náhodných veličin X ∼ Bi(n, p1 ) a Y ∼ Bi(m, p2 ). Testujeme nulovou hypotézu H0 : p1 = p2 proti alternativě H1 : Algoritmus testu. 1. Vypočteme hodnoty x = p1 ≈ x a p2 ≈ y.
X n
p1 6= p2 . ay=
105
Y m,
které jsou odhady parametrů
2. Má-li výběr dostatečně velký rozsah, pak mají náhodné veličiny x a y po řadě normální rozdělení
p1 (1 − p1 ) x ∼ N p1 ; n
p2 (1 − p2 ) a y ∼ N p2 ; . m
3. Protože jsou náhodné veličiny x a y nezávislé má náhodná veličina U=
(x − y) − (p1 − p2 ) r
p1 (1−p1 ) n
+
p2 (1−p2 ) m
normované normální rozdělení N (0; 1). 4. Pokud platí nulová hypotéza H0 , je p1 − p2 = 0 a jestliže použijeme aproximací p1 = x, p2 = y, má náhodná veličina Ua =
x−y r
x(1−x) n
+
y(1−y) m
normované normální rozdělení N (0; 1). 5. Kritický obor testu je pak α Wα = {Ua ; |Ua | ≥ u( )}, 2 kde kritická hodnota u( α2 ) je rovna 1 − α2 −kvantilu normálního rozdělení N (0; 1). Alternativní varianta testu je založena na skutečnosti, že společnou nx+my hodnotu p1 = p2 odhadujeme pomocí hodnoty z = X+Y n+m = n+m . Potom má náhodná veličina x−y Ub = r z(1 − z) n1 + m1 normované normální rozdělení N (0; 1). Kritický obor testu je pak α Wα = {Ub ; |Ub | ≥ u( )}. 2 Protože je pro n = m hodnota |Ub | ≤ |Ua | dává tato varianta častěji jako výsledek testu přijetí nulové hypotézy H0 . 106
Příklad: Budeme testovat shodu parametru v binomickém rozdělení pro soubory, které jsou počtem hodů s předepsaným počtem bodů v serii 300 hodů hrací kostkou. Je n = m = 300 a počet hodů je 1 2 3 4 5 6 47 53 51 40 61 48 Největší rozdíl dostaneme pro 1 a 5. Volíme tedy X = 47 a Y = 61. Potom je x = 0, 15666, y = 0, 2033 a z = 0, 18. Je tedy Ua = −1, 491,
Ub = −1, 4878.
Kritické hodnoty u(α) najdeme v tabulkách kvantilů normovaného normálního rozdělení. Je u(0, 1) = 1, 645 a u(0, 05) = 1, 96. Protože je |Ua | < u(α), resp. |Ub | < u(α) pro obě hodnoty α nezamítáme nulovou hypotézu H0 na obou hladinách významnosti. 6.12. Multinomické rozdělení. Rozdělení je zobecněním binomického rozdělení, kde uvažujeme více alternativních výsledků náhodného pokusu. Jako možné výsledky uvažujeme náhodné jevy Ai , 1 ≤ i ≤ k, které jsou po dvou disjunktní, P (Ai ) = pi , A1 ∪ A2 ∪ . . . ∪ Ak = U, tedy p1 + p2 + . . . + pk = 1. Opakujeme n−krát pokus, který jako výsledek dává posloupnost jevů Ai nebo Ai a sledujeme kolikrát se na i− tém místě objeví jev Ai , 1 ≤ i ≤ k, přičemž jsou jednotlivá opakování na sobě nezávislá. Je-li Yi počet výskytů náhodného jevu Ai , 1 ≤ i ≤ k, pak říkáme,že náhodný vektor (Y1 , Y2 , . . . , Yk ) má multinomické rozdělení s parametry n a (p1 , p2 , . . . , pk ). Náhodný vektor má diskrétní rozdělení a pro jeho sdruženou pravděpodobnostní funkci p dostaneme vzorec p(i1 , i2 , . . . , ik ) = P (Y1 = i1 , Y2 = i2 , . . . , Yk = ik ) = n! pi11 pi22 . . . pikk , i1 !.i2 ! . . . ik ! 0 ≤ ij , 1 ≤ j ≤ k, i1 + i2 + . . . ik = n. =
107
Marginální rozdělení každé z náhodných veličin Yj je binomické rozdělení Bi(n, pj ) a E(Yj ) = npj , D(Yj ) = npj (1 − pj ), 1 ≤ j ≤ k. Dále je koeficient korelace cov(Yi , Yj ) = −npi pj , i 6= j, 1 ≤ i, j ≤ k. Takové rozdělení dostaneme, jestliže pro náhodný výběr provedeme diskretizaci jeho hodnot pomocí zvolené škály. Parametry pi rozdělení pak odpovídají pravděpodobnostem výskytu hodnoty náhodné veličiny v příslušném intervalu škály. Nechť je X náhodná veličina, jejíž rozdělení je určeno distribuční funkcí F a X1 , X2 , . . . Xn je náhodný výběr z rozdělení s danou distribuční funkcí. Rozdělíme interval, ve kterém se může daná náhodná veličina X vyskytovat na systém k disjunktních intervalů (škálu) tvaru (a0 , a1 i, (a1 , a2 i, . . . (ak−1 , ak ). Dále označme pi = P (ai−1 < X ≤ ai ) = F (ai ) − F (ai−1 ), 1 ≤ i ≤ k pravděpodobnosti výskytu náhodné veličiny X v i−tém intervalu škály. Potom je npi teoretická četnost výskytu hodnot náhodného výběru v i−tém intervalu škály. Jestliže si označíme ni , 1 ≤ i ≤ k empirickou četnost výskytu, t.j. počet hodnot Xj z náhodného výběru, které leží v i−tém intervalu škály, pak platí tvrzení: Věta: Náhodná veličina (♠)
2
χ =
k X i=1
(ni − npi )2 npi
má přibližně rozdělení χ2 (k − 1). Poznámka: Hodnota χ2 je vlastně vážený součet čtverců odchylek empirické a teoretické četnosti, kdy je každá odchylka vážena proti své teoretické hodnotě. Pokud je náhodný výběr z rozdělení se zadanou distribuční funkcí F, pak se má tato hodnota, náhodná veličina, řídit uvedeným zákonem rozdělení. Na této skutečnosti je založen test dobré shody o druhu rozdělení, tedy o typu distribuční funkce. Uvedeme vzorec, který se někdy lépe hodí k výpočtu hodnoty χ2 . Je totiž k (n − np )2 k n2 − 2n np + (np )2 X X i i i i i i 2 χ = = = npi npi i=1 i=1 =
k X i=1
k k k n2 X X X n2i i −2 ni + npi = − n. npi np i i=1 i=1 i=1
108
6.13. Test dobré shody, test χ2 (chí kvadrát). Testujeme, že daný náhodný výběr je výběrem ze známého rozdělení. Pokud jsou parametry rozdělení (hustoty či pravděpodobnostní funkce) známy, počítáme uvedené veličiny z rozdělení, které je určeno jejich hodnotami. Pokud tyto parametry neznáme, použijeme pro ně odhady získané některou z metod hledání bodových odhadů (metoda maximální věrohodnosti či metoda momentů). Máme dán náhodný výběr X1 , X2 , . . . , Xn z rozdělení se známým typem distribuční funkce (hustoty). Testujeme nulovou hypotézu H0 : náhodný výběr je výběrem s daným rozdělením proti alternativě H1 : náhodný výběr je výběrem z jiného rozdělení. Algoritmus testu. 1. Definiční obor náhodné veličiny X rozdělíme pomocí dělících bodů na škálu k intervalů tvaru (−∞, a1 i, (a1 , a2 i, . . . (ak−2 , ak−1 i, (ak−1 , ak = ∞). 2. Vypočteme teoretické četnosti pi = P (ai−1 < X ≤ ai ), 1 ≤ i ≤ k a ověříme podmínku použitelnosti testu: npi ≥ 5, 1 ≤ i ≤ k,
nebo
npi ≥ 5q,
kde q je podíl tříd, pro které je npi < 5, v případech kdy k ≥ 3. 3. Určíme empirické četnosti ni jako počty hodnot Xj z náhodného výběru, které leží v intervalu (ai−1 , ai i, 1 ≤ i ≤ k a vypočteme hodnotu statistiky k (n − np )2 X i i 2 χ = . npi i=1 4. Pro zvolenou hladinu významnosti testu stanovíme kritický obor testu Wα = {χ2 ; χ2 ≤ χ2k−1 (α)}, kde χ2k−1 (α) je kritická hodnota testu, která je rovna 1 − α−kvantilu rozdělení χ2 (k − 1). 5. Je-li hodnota χ2 ∈ Wα zamítneme nulovou hypotézu H0 ve prospěch alternativní hypotézy H1 . V opačném případě, kdy je χ2 < χ2k−1 (α) nulovou hypotézu H0 přijmeme. 109
Poznámka: Pokud použijeme místo skutečných hodnot parametrů rozdělení jejich odhadů, pak místo k − 1 stupňů volnosti rozdělení χ2 volíme rozdělení s k − m − 1 stupni volnosti, kde m je počet neznámých parametrů rozdělení. Poznámka: Metoda minimálního χ2 se používá k zpřesnění výsledku v případě, kdy parametry roazdělení odhadujeme. Její princip je založen na tom, že hledáme hodnoty neznámých parametrů tak, aby hodnota náhodné veličiny χ2 ze vzorce (♠) byla minimální. Pravděpodobnosti pi jsou funkcemi parametrů rozdělení. Hodnota náhodné veličiny χ2 také. Hledáme, podobně jako při metodě maximální věrohodnosti, jejich hodnoty tak, aby měla funkce χ2 minimum. Řešení této úlohy je poměrně komplikované, zájemce odkazujeme na podrobnější učebnice matematické statistiky. Příklad: Budeme testovat hypotézu, že soubor dat pochází z rovnoměrného rozdělení. Datový soubor má hodnoty a je to počet studentů, kteří získali stejné bodové ohodnocení ve škále (0, 1, . . . , 12) : 158, 76, 106, 130, 135, 120, 108, 138, 124, 142, 111, 121 114, tedy 13 dat a v případě rovnoměrného rozdělení je 1 pi = 13 = 0, 076923 a npi = 1583 13 = 121, 77. Pro hodnotu statistiky χ2 dostaneme χ2 = 36, 38. Pro kritické hodnoty testu z tabulek odečteme: χ2 (0, 05) = 21, 03, χ2 (0, 025) = 23, 34, χ2 (0, 01) = 26, 22. Pro všechny hladiny významnosti je hodnota testovací statistiky větší než kritická hodnota, patří tedy do kritického oboru a tudíž nulovou hypotézu H0 zamítáme na všech hladinách. Jestliže uvažujeme podobný soubor 106, 130, 135, 120, 108, 138, 124, 142, 111, 121 114, 1 pak máme skupinu 11 dat. Pro ně je pi = 11 = 0, 090909 a npi = 1349 11 = 122, 64. V tomto případě dostaneme χ2 = 8, 68. Kritické hodnoty testu z tabulek jsou: χ2 (0, 05) = 18, 31, atd. Protože je hodnota testovací statistiky χ2 menší než kritická hodnota testu nezamítáme hypotézu H0 na žádné z hladin. Příklad: Testujeme pomocí testu dobré shody hypotézu H0 : výběr je z normálního rozdělení proti alternativě H1 : výběr není z normálního rozdělení pro soubor dat 110
X = {165, 170, 173, 178, 189, 176, 180, 175, 187, 184, 182, 200, 179, 182, 178, 175, 176, 176, 185, 185, 178, 183, 181, 175}; Pro výpočet teoretických četností použijeme odhady parametrů µ = X = 181, 64 a σ = s = 9, 766. Jako odhad pro interval hodnot dostaneme (147, 46; 215, 82). Pro počet dat n = 24 dostaneme pro počet tříd k = 6. Testovací statistika a kritická hodnota mají hodnoty: χ2 = 0, 835 a kr = χ23 (0, 05) = 7, 8147. Protože je χ2 < kr, hypotézu H0 nezamítáme. Pro test dostaneme p−hodnotu p = 0, 3179. 6.14. Test závislosti a nezávislosti. Pro náhodné veličiny X a Y se nejčastěji k popisu závislosti používá koeficient korelace ρ(X, Y ), který je definován vztahem ρ(X, Y ) =
E((X − E(X))(Y − E(Y ))) E(XY ) − E(X)E(Y ) q q = . D(X)D(Y ) D(X)D(Y )
Koeficient je roven nule pro nezávislé náhodné veličiny a je roven ±1 v případě lineární závislosti Y = aX + b. Pro normální rozdělení je úplnou charakteristikou závislosti náhodných veličin. Platí totiž: Jestliže má náhodný vektor (X, Y ) normální rozdělení, pak je jeho sdružená hustota dána vzorcem
f (x, y) =
1 √
2πσ1 σ2 1 − ρ
exp − 2
(x−µ1 )2 σ12
+
(y−µ2 )2 σ22
2ρ(x−µ1 )(y−µ2 ) σ1 σ2 , ρ2 )
−
2(1 −
kde náhodná veličina X má marginální rozdělení N (µ1 ; σ12 ) a Y má marginální rozdělení N (µ1 ; σ22 ) a ρ je koeficient korelace mezi X a Y. Náhodné veličiny X a Y jsou nezávislé právě když je ρ = 0. Podmíněné náhodné veličiny X|y, resp.Y |x mají také normální rozdělení se středními hodnotami σ1 E(X|y) = µ1 + β1,2 (y − µ2 ), β12 = ρ σ2 resp. σ2 E(Y |x) = µ2 + β21 (x − µ1 ), β21 = ρ σ1 a rozptyly D(X|y) = σ12 (1 − ρ2 ),
resp. D(Y |x) = σ22 (1 − ρ2 ). 111
Podmíněná střední hodnota je lineární funkcí y, resp. x, a její směrnice β12 , resp. β21 , je regresní koeficinet. Podmíněný rozptyl je konstantní. Odhad závislosti či nezávislosti pro náhodné výběry provádíme pomocí výběrového koeficientu korelace, který je obdobou výběrových momentů. Výběrový koeficient korelace je definován pro dvourozměrný náhodný výběr (Xi , Yi ), 1 ≤ i ≤ n jako r(X, Y ) =
SXY , SX SY
kde
n n 1 X 1 X 2 2 = (Xi − X) , SY = (Yi − Y )2 , n − 1 i=1 n − 1 i=1 n 1 X SXY = (Xi − X)(Yi − Y ). n − 1 i=1 Vztah lze úpravami, kterými jsme odvodili vyjádření pro výběrový rozptyl upravit na tvar 2 SX
n P
r(X, Y ) =
(Xi Yi ) − nXY
i=1 v u u t
n P i=1
!
Xi2
−
n(X)2
n P i=1
!
Yi2
− n(Y
)2
Test závislosti či nezávislosti je založen na tomto tvrzení: Je-li (Xi , Yi ), 1 ≤ i ≤ n náhodný výběr z dvourozměrného normálního rozdělení, pak má náhodná veličina (statistika) √ r T =√ n − 2 ∼ t(n − 2) 1 − r2 t−rozdělení s n − 2 stupni volnosti. Algoritmus testu Testovaná hypotéza: H0 : ρ = 0 nezávislost; H1 : ρ 6= 0 závislost. Kritický obor Wα = {T ; |T | > tn−2 (α)}, kde tn−2 (α) je kritická hodnota t−testu, tedy 1− α2 −kvantil Studentova t−rozdělení o n−2 stupních volnosti. Existují tabulky, které uvadějí kritické hodnoty rn (α) přímo pro hodnoty statistiky r. Kritický obor je pak 112
Wα = {r; |r| > rn (α)}. Příklad: Pro soubory X výšek a Y vah testujme lineární závislost, jestliže: X = {165, 170, 173, 178, 189, 176, 180, 175, 187, 184, 182, 200, 179, 182, 178, 175, 176, 176, 185, 185, 178, 183, 181, 175}; Y = {72, 60, 65, 75, 92, 72, 73, 65, 70, 83, 85, 93, 70, 80, 68, 75, 78, 63, 75, 87, 61, 74, 69, 75}; Podle algoritmu testu dostaneme: koeficient korelace rXY = 0, 6883; hodnota testovací statistiky T = 4, 4499; kritická hodnota t(0, 05) = 2, 073, p−hodnota testu p = 2.10−4 . Protože je |T | > t(0, 05) hypotézu o nezávislosti zamítáme a přijímáme očekávanou hypotézu, že jsou náhodné veličiny závislé. 6.15. Testy normality Náhodný výběr {Xi ; 1 ≤ i ≤ n} je výběrem z normálního rozdělení. Uvedeme test normality rozdělení, který je založen na výběrové šikmosti a špičatosti, nebo na jejich kombinaci. Vycházíme z porovnání odhadů koeficientů šikmosti a špičatosti s jejich teoretickou hodnotou. Připomeneme: n 1X Mk = (Xi − X)k , 1 ≤ k je k−tý výběrový moment. n i=1 M3 A3 = − je výběrová šikmost; (M2 )3/2 M4 M4 A∗4 = 2 , resp. A4 = 2 − 3 − je výběrová špičatost. M2 M2 Pro ně platí: E(A3 ) = 0,
D(A3 ) =
a
6(n − 2) (n + 1)(n + 3)
6 6 , resp. E(A4 ) = − , n+1 n+1 24n(n − 2)(n − 3) D(A4 ) = . (n + 1)2 (n + 3)(n + 5) Pro menší rozsahy výběru jsou kritické hodnoty pro statistiky A3 a A4 uvedeny v tabulkách. Pro větší rozsahy výběrů, n > 200 pro A3 a E(A∗4 ) = 3 −
113
n > 500 pro A4 , lze použít aproximace normálním rozdělením, které vychází z centrální limitní věty. Počítáme s tím, že náhodné veličiny U3 =
q
A3 D(A3
a U4 =
A4 − E(A4 ) D(A4 )
mají normované normální rozdělení. Kritické hodnoty testu nalezneme pomocí kvantilů normálního rozdělení. Kritickým oborem testů je Wα = {U3 ; |U3 | > uα/2 }, nebo Wα − {U4 ; |U4 | > uα/2 , kde uα je α−kvantil nornálního rozdělení N (0; 1). Existuje podstatné vylepšení postupu, které se dá použít v případě výběrů menšího rozsahu. Test založený na šikmosti: Postupně vypočteme b=
q 1 3(n2 + 27n − 70)(n + 1)(n + 3) , W 2 = 2(b − 1) − 1, δ = √ (n − 2)(n + 5)(n + 7)(n + 9) ln W
a=
v u u t
2 , W2 − 1
Z3 = δ ln
U3 + a
v u u t
U3 a
!2
+ 1.
Potom má náhodná veličina Z3 přibližně normální rozdělení N (0; 1) a hypotézu o normalitě rozdělení zamítáme v případě, že |Z3 | ≥ uα/2 . Test se dá použít pro n > 8. Test založený na špičatosti: Postupně vypočteme 2
B=
v u 2) u u 6(n t
6(n − 5n + + 3)(n + 5) , (n + 7)(n + 9) n(n − 2)(n − 3) 1− Z4 =
2 9A
A = 6+
s
− q
v u u t
8 2 4 , + 1 + 2 B B B
1− A2
3
1+U4 2 9A
√
2 A−4
.
Náhodná veličina Z4 má přibližně normální rozdělení N (0; 1) a hypotézu o normalitě zamítáme, pokud je |Z4 | ≥ uα/2 . Aproximace je použitelná pro n ≥ 20. 114
Testy založené současně na šikmosti a špičatosti: Pro výběry kde je rozsah n > 200 můžeme použít skutečnosti, že náhodná veličina U32 + U42 ∼ χ22 má rozdělení χ2 o dvou stupních volnosti. Hypotézu o normalitě zamítáme, pokud je U32 + U42 ≥ χ22 (α). Pro menší rozsahy, kde n ≥ 20 lze použít skutečnosti, že má náhodná veličina Z32 + Z42 ∼ χ22 přibližně rozdělení χ22 o dvou stupních volnosti. Hypotézu o normalitě zamítáme, pokud je Z32 + Z42 ≥ χ22 (α). Příklad: Testujeme pomocí popsaných algoritmů normalitu rozdělení pro náhodný výběr X výšek skupiny studentu. Je Testujeme nulovou hypotézu H0 : výběr je z normálního rozdělení proti alternativě H − 1 : výběr není z normálního rozdělení. Pomocí algoritmů dostaneme: n = 24- počet dat; Pro test založený na koeficientu šikmosti: U3 = 1, 547, Z3 = 1, 5663, kritická hodnota u(0, 05) = 1, 96. Je |U3 | < u(0, 05) a |Z3 | < u(0, 05), tedy v obou případech hypotézu H0 nezamítáme. Pro test založený na koeficientu špičatosti: U4 = 2, 535 Z4 = 1, 973, kritická hodnota u(0, 05) = 1, 96. V obou případech jsou hodnoty v kritickém oboru, tedy hypotézu H0 zamítáme. V prvním případě máme příliš málo hodnot, pro druhou variantu vidíme, že je hodnota testovací statistiky těsně u kritické hodnoty. Pro test založený na kombinaci obou hodnot dostaneme: U32 +U42 = 8, 81, Z32 +Z42 = 6, 345 a kritická hodnota χ22 (0, 05) = 5, 99. Obě hodnoty přesahují kritickou hodnotu, hypotézu H0 zamítáme.
115