Obsah Testování na základě jednoho výběru Hodnota p-value Testování hypotézy o střední hodnotě normálně rozděleného souboru Testování hypotézy o rozptylu normálně rozděleného souboru Testování hypotézy o parametru alternativního rozdělení
Statistika Testování hypotéz - statistická indukce – Parametrické testy
Testování na základě dvou výběrů Testování hypotézy o středních hodnotách normálně rozdělených souborů Testování hypotézy o rozptylech Testování hypotézy o parametrech alternativního rozdělení
Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz
21. února 2012
„Statistikaÿ by Birom
Statistika
Testování na základě více než dvou výběrů Testování hypotézy o shodě středních hodnot Testování hypotézy o shodě rozptylů – testy homoskedasticity Testy mnohonásobného srovnávání
Parametrické testy
1 / 45
„Statistikaÿ by Birom
Testování na základě jednoho výběru
Testování na základě jednoho výběru
Testování hypotézy o libovolném parametru rozdělení Nechť statistický znak X má v základním souboru přibližně požadované rozdělení. 1. Hypotézy H0 HA K θ ≤ θ0 θ > θ0 K = {t : t ≥ F−1 (1 − α)} θ = θ0 θ = θ0 θ 6= θ0 K = {t : t ≥ F−1 (1 − α/2) ∨ t ≤ F−1 (α/2)} θ ≥ θ0 θ < θ0 K = {t : t ≤ F−1 (α)} 2. Hladina významnosti: α, α = 0,1; 0,05; 0,01; 0,001 3. Volba testového kritéria: T = T (X1 , X2 , . . . , Xn )
4. 5. 6. 7.
testové kritérium je založeno na odchylce výběrové charakteristiky od hypotetické hodnoty parametru; za platnosti nulové hypotézy a v případě splnění předpokladů testu sleduje určité teoretické rozdělení (∼ F).
Statistika
Hodnota p-value
Čím vyšší hladina významnosti, tím se zvětšuje/í kritický/é obor/y a tím snažší je zamítnutí nulové hypotézy ve prospěch alternativní.
◮
Nejnižší taková hladina významnosti, při které lze ještě zamítnout nulovou hypotézu, se nazývá p-value.
◮
Hodnota p-value je tedy „dosaženou hladinou významnostiÿ.
◮
Hodnotu p-value lze na rozdíl od hladiny významnosti (volená před testováním) stanovit až jako výsledek testování. Hodnota p-value konstruovaná pro libovolný test se na rozdíl od hodnoty testového kritéria stává univerzálním prostředkem pro rozhodování o výsledku testování:
◮
◮
testové kritérium se porovnává s kritickou hodnotou – různá . . . hodnotu p-value leze bez ohledu na test srovnávat přímo s hladinou významnosti ◮ ◮
Parametrické testy
2 / 45
◮
◮
Vymezení kritického oboru: K = . . . Výpočet testového kritéria: t = T (x1 , x2 . . . , xn ) Zjištění zda t ∈ K a rozhodnutí: H0 vs. HA Zformulovat slovní odpověď! „Statistikaÿ by Birom
Parametrické testy
Hodnota p-value
Klasický postup
◮
Statistika
3 / 45
Nulová hypotéza se zamítá, když p-value ≤ α. Nulová hypotéza se nezamítá, když p-value > α.
„Statistikaÿ by Birom
Statistika
Parametrické testy
4 / 45
Testování na základě jednoho výběru
Hodnota p-value
Testování na základě jednoho výběru
Výpočet hodnoty p-value ◮
◮
◮ ◮
◮
◮
◮
Testování hypotézy o libovolném parametru rozdělení Postup s využitím hodnoty p-value
S ohledem na typ alternativní hypotézy (levo-, pravo-, či oboustrannou) lze z hodnoty testového kritéria vypočítat / zjistit prostřednictvím softwareu / nalézt v tabulkách hodnotu p-value. Nechť testová statistika T sleduje rozdělení F, pak pro konkrétní hodnotu t lze stanovit p-value (značeno jen p) následovně: ◮
HA : θ < θ0 HA : θ = 6 θ0 HA : θ > θ0
Nechť statistický znak X má v základním souboru přibližně požadované rozdělení. 1. H0
p = F(t) p = 2 (1 − F(|t|)) p = 1 − F(t)
Reálné (vypoč.) t t<0 t>0 p/2 1 − p/2 p
thyp < 0 thyp > 0 thyp 6= 0
p/2 1 − p/2 p
Statistika
Testování na základě jednoho výběru
HA
4. Výpočet testového kritéria a hodnoty p-value (případně modifikace hodnoty vypočtené softwarem v závislosti na HA ) 5. Porovnání p-value s hladinou významnosti a rozhodnutí: H0 vs. HA 6. Zformulovat slovní odpověď!
Reálné (vypoč.) t t<0 t>0
1 − p/2 p/2 p
„Statistikaÿ by Birom
a
2. Hladina významnosti: α, α = 0,1; 0,05; 0,01; 0,001 3. Volba testu
Náročnost výpočtu p-value obvykle zvládne software, zatímco stanovení kritické hodnoty zůstává na testujícím. Existuje-li více alternativních hypotéz je třeba vědět, ke které z nich je p-value vypočítáno (obvykle p-value příslušné oboustranné hypotéze). Modifikace oboustranného p-value:
HA : θ < θ0 HA : θ > θ0 HA : θ = 6 θ0
Hodnota p-value
1 − p/2 p/2 p Parametrické testy
5 / 45
„Statistikaÿ by Birom
Testování hypotézy o střední hodnotě normálně rozděleného souboru
Statistika
Testování na základě jednoho výběru
Parametrické testy
Testování hypotézy o střední hodnotě normálně rozděleného souboru
(Jednovýběrový) u-test
(Jednovýběrový, studentův) t-test
Testování hypotézy o střední hodnotě normálně rozděleného souboru – známý rozptyl σ 2
Testování hypotézy o střední hodnotě normálně rozděleného souboru – neznámý rozptyl
Nechť statistický ! znak X má v základním souboru přibližně normální rozdělení (X ∼ N µ; σ 2 ) se známým rozptylem σ 2 .
Nechť statistický ! znak X má v základním souboru přibližně normální rozdělení (X ∼ N µ; σ 2 ) s neznámým rozptylem odhadnutým prostřednictvím s 2 . 1. Hypotézy H0 : HA : K µ ≤ µ0 µ > µ0 K = {t : t ≥ t1−α (n − 1)} µ = µ0 µ = µ0 µ 6= µ0 K = {t : |t| ≥ t1−α/2 (n − 1)} µ ≥ µ0 µ < µ0 K = {t : t ≤ −t1−α (n − 1)} 2. Hladina významnosti: α ¯ − µ0 √ X 3. Volba testového kritéria: T = n s
1. Hypotézy H0 : HA : µ ≤ µ0 µ > µ 0 µ = µ0 µ = µ0 µ 6= µ0 µ ≥ µ0 µ < µ 0 2. Hladina významnosti: α
K K = {u : u ≥ u1−α } K = {u : |u| ≥ u1−α/2 } K = {u : u ≤ −u1−α }
3. Volba testového kritéria: U = ◮
¯ − µ0 √ X n σ
◮
4. Vymezení kritického oboru: K = . . . u=
6. Zjištění zda u ∈ K a rozhodnutí:
x¯−µ0 √ n σ
H0 vs. HA
7. Zformulovat slovní odpověď! „Statistikaÿ by Birom
Statistika
T ∼ t(n − 1) za platnosti nulové hypotézy
4. Vymezení kritického oboru: K = . . . √ 0 5. Výpočet testového kritéria: t = x¯−µ n s 6. Zjištění zda t ∈ K a rozhodnutí: H0 vs. HA 7. Zformulovat slovní odpověď! Poznámky: ◮ Pojmenováno podle Williama Sealyho Gosseta (1876–1937), který publikoval pod pseudonymem „Studentÿ.
U ∼ Z za platnosti nulové hypotézy
5. Výpočet testového kritéria:
6 / 45
Parametrické testy
7 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
8 / 45
Testování na základě jednoho výběru
Testování hypotézy o rozptylu normálně rozděleného souboru
Testování na základě jednoho výběru
Testování hypotézy o parametru alternativního rozdělení
??
??
Testování hypotézy o rozptylu normálně rozděleného souboru
Testování hypotézy o parametru alternativního rozdělení
1. Hypotézy H0 : σ 2 ≤ σ02 2 2 σ = σ0 σ 2 = σ02
HA : 2 σ > σ02 σ 2 6= σ02
σ 2 ≥ σ02 σ 2 < σ02 2. Hladina významnosti: α 3. Volba testového kritéria: χ2 = ◮
Nechť statistický znak X má v základním souboru alternativní rozdělení 9 (X ∼ A(π)) a rozsah výběru je buď n > π0 (1−π nebo n > π50 . 0)
K 2 2 K = {χ : χ ≥ χ21−α (n − 1)} K = {χ2 : χ2 ≥ χ21−α/2 (n − 1) ∨ χ2 ≤ χ2α/2 (n − 1)} 2 K = {χ : χ2 ≤ χ2α (n − 1)}
1. Hypotézy H0 : HA : π ≤ π0 π > π 0 π = π0 π = π0 π 6= π0 π ≥ π0 π < π 0 2. Hladina významnosti: α
(n − 1)s 2 σ02
3. Volba testového kritéria: U = p
χ2 ∼ χ2 (n − 1) za platnosti nulové hypotézy
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria:
2
χ =
6. Zjištění zda χ2 ∈ K a rozhodnutí:
K K = {u : u ≥ u1−α } K = {u : |u| ≥ u1−α/2 } K = {u : u ≤ −u1−α }
◮
nA n
− π0
π0 (1 − π0 )
√
n
= √ nA −nπ0
U ∼ Z (asymptoticky) za platnosti nulové hypotézy
nπ0 (1−π0 )
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria: u = √ nA −nπ0
(n−1)s 2 σ02
H0 vs. HA
nπ0 (1−π0 )
6. Zjištění zda u ∈ K a rozhodnutí:
7. Zformulovat slovní odpověď!
H0 vs. HA
7. Zformulovat slovní odpověď! „Statistikaÿ by Birom
Statistika
Parametrické testy
9 / 45
„Statistikaÿ by Birom
Testování na základě dvou výběrů
Statistika
Parametrické testy
Testování na základě dvou výběrů
Testování hypotézy o „shoděÿ parametrů dvou stejně rozdělených souborů I
Testování hypotézy o „shoděÿ parametrů dvou stejně rozdělených souborů II
Klasický postup
Klasický postup
Nechť statistické znaky X1 a X2 mají v základním souboru přibližně požadované rozdělení. 1. Hypotézy H0 HA K θ1 ≤ θ2 θ1 > θ2 K = {t : t ≥ F−1 (1 − α)} θ1 = θ2 θ1 = θ2 θ1 6= θ2 K = {t : t ≥ F−1 (1 − α/2) ∨ T ≤ F−1 (α/2)} θ1 ≥ θ2 θ1 < θ2 K = {t : t ≤ F−1 (α)} 2. Hladina významnosti: α, α = 0,1; 0,05; 0,01; 0,001 3. Volba testového kritéria: T = T (X1,1 , . . . , X1,n , X2,1 , . . . , X2,n ) ◮
◮
10 / 45
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria:
t = T (x1,1 , . . . , x1,n1 , x2,1 , . . . , x2,n2 )
6. Zjištění zda t ∈ K a rozhodnutí:
H0 vs. HA
7. Zformulovat slovní odpověď!
testové kritérium je založeno na odchylce výběrových charakteristik dvou souborů; za platnosti nulové hypotézy a v případě splnění předpokladů testu sleduje určité teoretické rozdělení (∼ F), je různé na základě toho, zda se jedná o závislé nebo nezávislé soubory.
„Statistikaÿ by Birom
Statistika
Parametrické testy
11 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
12 / 45
Testování na základě dvou výběrů
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Testování na základě dvou výběrů
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Dvouvýběrový u-test I
Dvouvýběrový u-test II
Testování hypotézy o středních hodnotách nezávislých normálně rozdělených souborů – známé rozptyly σ12 a σ22
Testování hypotézy o středních hodnotách nezávislých normálně rozdělených souborů – známé rozptyly σ12 a σ22
Nechť statistické znaky X1 a X2 mají! v základních souborech přibližně normální ! rozdělení (X1 ∼ N µ1 ; σ12 a X2 ∼ N µ2 ; σ22 ) se známými rozptyly σ12 a σ22 a jsou nezávislé. 1. Hypotézy H0 : HA : K µ1 ≤ µ2 µ1 > µ2 K = {u : u ≥ u1−α } µ1 = µ2 µ1 = µ2 µ1 6= µ2 K = {u : |u| ≥ u1−α/2 } µ1 ≥ µ2 µ1 < µ2 K = {u : u ≤ −u1−α } 2. Hladina významnosti: α ¯1 − X ¯2 X 3. Volba testového kritéria: U = q 2 σ1 σ22 n1 + n2 ◮
6. Zjištění zda u ∈ K a rozhodnutí:
H0 vs. HA
7. Zformulovat slovní odpověď!
U ∼ Z za platnosti nulové hypotézy
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria: u = rx¯1 2−¯x2 σ 1 n1
„Statistikaÿ by Birom
σ2
+ n2 2
Statistika
Testování na základě dvou výběrů
Parametrické testy
13 / 45
„Statistikaÿ by Birom
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Statistika
Testování na základě dvou výběrů
Parametrické testy
14 / 45
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Dvouvýběrový (studentův) t-test pro soubory se shodnými rozptyly I
Dvouvýběrový (studentův) t-test pro soubory se shodnými rozptyly II
Testování hypotézy o středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
Testování hypotézy o středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
Nechť statistické znaky X1 a X2 mají! v základních souborech přibližně normální ! rozdělení (X1 ∼ N µ1 ; σ12 a X2 ∼ N µ2 ; σ22 ) s neznámými rozptyly odhadnutými prostřednictvím s12 a s22 a jsou nezávislé. s12 a s22 se přibližně rovnají (viz F -test). 1. Hypotézy H0 : µ1 ≤ µ2 µ1 = µ2 µ 1 = µ 2 µ1 ≥ µ2 2. Hladina významnosti:
HA : µ 1 > µ2 µ1 6= µ2 µ 1 < µ2 α
K K = {t : t ≥ t1−α (n1 + n2 − 2)} K = {t : |t| ≥ t1−α/2 (n1 + n2 − 2)} K = {t : t ≤ −t1−α (n1 + n2 − 2)}
◮
kde s =
„Statistikaÿ by Birom
s
T ∼ t(n1 + n2 − 2) za platnosti nulové hypotézy
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria:
t=
6. Zjištění zda t ∈ K a rozhodnutí:
x¯1 −¯ x2 r
(n1 −1)s 2 +(n2 −1)s 2 2 1 n1 +n2 −2
H0 vs. HA
q
n1 n2 n1 +n2
7. Zformulovat slovní odpověď!
Poznámky: ◮ Pojmenováno podle Williama Sealyho Gosseta (1876–1937), který publikoval pod pseudonymem „Studentÿ.
¯2 r n1 n2 ¯1 − X X 3. Volba testového kritéria: T = s⋆ n1 + n2 ⋆
◮
(n1 − 1)s12 + (n2 − 1)s22 (= σ ˆ2) n1 + n2 − 2 Statistika
Parametrické testy
15 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
16 / 45
Testování na základě dvou výběrů
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Testování na základě dvou výběrů
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Dvouvýběrový (studentův) t-test pro soubory s různými rozptyly I
Dvouvýběrový (studentův) t-test pro soubory s různými rozptyly II
Testování hypotézy o středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (různé)
Testování hypotézy o středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (různé)
Nechť statistické znaky X1 a X2 mají! v základních souborech přibližně normální ! rozdělení (X1 ∼ N µ1 ; σ12 a X2 ∼ N µ2 ; σ22 ) s neznámými rozptyly odhadnutými prostřednictvím s12 a s22 a jsou nezávislé. s12 a s22 jsou průkazně odlišné (viz F -test). 1. Hypotézy H0 : µ1 ≤ µ2 µ1 = µ2 µ1 = µ2 µ1 ≥ µ2 2. Hladina významnosti:
HA : µ 1 > µ2 µ1 6= µ2 µ 1 < µ2 α
df = 1 n1 −1
s12 n1
s2 1 n1
2
s2
+ n2
2
2
+ n 1−1 2
s2 2 n2
2
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria:
K K = {t : t ≥ t1−α (df )} K = {t : |t| ≥ t1−α/2 (df )} K = {t : t ≤ −t1−α (df )}
t=
6. Zjištění zda t ∈ K a rozhodnutí:
x2 rx¯1 −¯ s2 1 n1
s2
+ n2
2
H0 vs. HA
7. Zformulovat slovní odpověď! Poznámky:
¯1 − X ¯2 X 3. Volba testového kritéria: T = q 2 s1 s22 n1 + n2 ◮
◮
◮
Pojmenováno podle Williama Sealyho Gosseta (1876–1937), který publikoval pod pseudonymem „Studentÿ.
T ∼ t(df ) (asymptoticky) za platnosti nulové hypotézy, kde
„Statistikaÿ by Birom
Statistika
Testování na základě dvou výběrů
Parametrické testy
17 / 45
„Statistikaÿ by Birom
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Statistika
Testování na základě dvou výběrů
Parametrické testy
Testování hypotézy o středních hodnotách normálně rozdělených souborů
Párový (studentův) t-test I
Párový (studentův) t-test II
Testování hypotézy o středních hodnotách závislých normálně rozdělených souborů
Testování hypotézy o středních hodnotách závislých normálně rozdělených souborů
Nechť statistické znaky X1 a X2 mají v základních souborech přibližně normální rozdělení (X1 ∼ N µ1 ; σ12 a X2 ∼ N µ2 ; σ22 ) a jsou závislé – tvoří napříč skupinami logické páry.
Poznámky:
1. Hypotézy H0 : HA : H0 : µ 1 ≤ µ 2 µ 1 > µ2 µd ≤ 0 µ1 = µ2 µ1 = µ2 µ1 6= µ2 µd = 0 µd = 0 µ 1 ≥ µ 2 µ 1 < µ2 µd ≥ 0 2. Hladina významnosti: α 3. Výpočtem diferencí di = x1i − x2i pro i = 1, . . . , n se jednovýběrový t-test s nulovou hypotézou µd = 0. ◮
◮
HA : µd > 0 µd 6= 0 µd < 0
18 / 45
◮
Není úplně chybou, pokud se nepoužije párový t-test pro závislé soubory, ale příslušný dvouvýběrový t-test. Dvouvýběrový t-test je však slabší!
◮
Pojmenováno podle Williama Sealyho Gosseta (1876–1937), který publikoval pod pseudonymem „Studentÿ.
převede situace na
Je zřejmé, že n1 = n2 , tuto společnou hodnotu označme n. n n ¯√ 1 X 1X ¯ 2 , T = d n. di , sd2 = (di − d) d¯ = n i=1 n − 1 i=1 sd
4. Dále se pokračuje tak, jako u jednovýběrového t-testu . . . „Statistikaÿ by Birom
Statistika
Parametrické testy
19 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
20 / 45
Testování na základě dvou výběrů
Testování hypotézy o rozptylech
Testování na základě dvou výběrů
Testování hypotézy o rozptylech
F -test I
F -test II
Testování hypotézy o rozptylech normálně rozděleného souboru
Testování hypotézy o rozptylech normálně rozděleného souboru
Nechť statistické znaky X1 a X2 mají! v základních souborech přibližně normální ! rozdělení (X1 ∼ N µ1 ; σ12 a X2 ∼ N µ2 ; σ22 ) s neznámými rozptyly odhadnutými prostřednictvím s12 a s22 a jsou nezávislé. 1. Hypotézy H0 : σ12 ≤ σ22 2 2 σ1 = σ2 σ12 = σ22
K = {F : F K = {F : F F K = {F : F
σ12 ≥ σ22 σ12 < σ22 2. Hladina významnosti: α
◮
K ≥ F1−α (n1 − 1; n2 − 1)} ≥ F1−α/2 (n1 − 1; n2 − 1) ∨ ≤ Fα/2 (n1 − 1; n2 − 1)} ≤ Fα (n1 − 1; n2 − 1)}
H0 vs. HA
Poznámky: ◮
HA : σ12 > σ22 σ12 6= σ22
3. Volba testového kritéria: F =
6. Zjištění zda F ∈ K a rozhodnutí: 7. Zformulovat slovní odpověď! . . .
◮
Obvyklý postup volby „pořadí souborůÿ: s12 ≥ s22 – zjednodušení ověření zda F ∈K Test je citlivý na porušení normality dat.
s12 s22
F ∼ F (n1 − 1; n2 − 1) za platnosti nulové hypotézy
4. Vymezení kritického oboru: K = . . . 5. Výpočet testového kritéria:
s12 s22
F =
„Statistikaÿ by Birom
Statistika
Testování na základě dvou výběrů
Parametrické testy
21 / 45
„Statistikaÿ by Birom
Testování hypotézy o parametrech alternativního rozdělení
Statistika
Testování na základě dvou výběrů
Parametrické testy
22 / 45
Testování hypotézy o parametrech alternativního rozdělení
?? I
?? II
Testování hypotézy o parametrech alternativního rozdělení nezávislých alternativně rozdělených souborů
Testování hypotézy o parametrech alternativního rozdělení nezávislých alternativně rozdělených souborů
Nechť statistické znaky X1 a X2 mají v základních souborech alternativní rozdělení (X1 ∼ A(π1 ) a X2 ∼ A(π2 )) a jsou nezávislé. n1 , n2 > 100 1. Hypotézy H0 : π1 ≤ π2 π1 = π2 π1 = π2 π1 ≥ π2 2. Hladina významnosti:
HA : π1 > π2 π1 6= π2 π1 < π2 α
K K = {u : u ≥ u1−α } K = {u : |u| ≥ u1−α/2 } K = {u : u ≤ −u1−α }
3. Volba testového kritéria: U = r ◮ ◮
n1A n1
−
p ⋆ (1 − p ⋆ )
n1A + n2A n1 + n2 U ∼ Z za platnosti nulové hypotézy kde p ⋆ =
5. Výpočet testového kritéria:
u=
6. Zjištění zda u ∈ K a rozhodnutí:
n1A n1
r
n1A +n2A n1 +n2
1−
H0 vs. HA
−
n2A n2
n1A +n2A n1 +n2
1 n1
+ n1
2
7. Zformulovat slovní odpověď!
n2A n2
1 n1
+
1 n2
4. Vymezení kritického oboru: K = . . . „Statistikaÿ by Birom
Statistika
Parametrické testy
23 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
24 / 45
Testování na základě více než dvou výběrů
Testování na základě více než dvou výběrů
Testování hypotézy o „shoděÿ parametrů více než dvou stejně rozdělených souborů 1. Hypotézy:
H0 : θ 1 = θ 2 = · · · = θ k
Jednofaktorová analýza rozptylu – ANOVA I Testování hypotézy o shodě středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
HA : nonH0 (¬H0 )
Nechť statistické znaky Y1 , Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro 1 = 1, . . . , k) s neznámými shodnými rozptyly odhadnutými prostřednictvím si2 , i = 1, . . . , k, a jsou nezávislé.
2. Hladina významnosti: α, α = 0,1; 0,05; 0,01; 0,001 3. Volba testového kritéria: T = T (Y11 , . . . , Yij , . . . , Yknk ), i = 1, . . . , k a j = 1, . . . , ni
1. Hypotézy:
H0 : µ1 = µ2 = · · · = µk (= µ)
4. Vymezení kritického oboru: K
2. Hladina významnosti: α
5. Výpočet testového kritéria:
3. Volba testového kritéria: F =
t = T (y11 , . . . , yknk )
6. Zjištění zda t ∈ K a rozhodnutí:
H0 vs. HA
7. Zformulovat slovní odpověď, v případě platnosti HA pokračovat v analýze pro jednotlivé soubory!
◮
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
25 / 45
HA : nonH0 (¬H0 )
sx2 MSSA = 2 sr MSSr
k
◮
◮
„Statistikaÿ by Birom
Testování hypotézy o shodě středních hodnot
1 X ¯i − Y ¯• )2 ni (Y k − 1 i=1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . rozptyl mezi skupinami ni k 1 XX 2 ¯i )2 sr = (Yij − Y n − k i=1 j=1 sx2 =
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . rozptyl uvnitř skupin (reziduální rozptyl) F ∼ F (k − 1; n − k) za platnosti nulové hypotézy
„Statistikaÿ by Birom
Testování hypotézy o shodě středních hodnot
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
Testování hypotézy o shodě středních hodnot
Jednofaktorová analýza rozptylu – ANOVA II
Jednofaktorová analýza rozptylu – poznámky I
Testování hypotézy o shodě středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
Testování hypotézy o shodě středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
4. Vymezení kritického oboru: K = {F : F ≥ F1−α (k − 1; n − k)} 5. Výpočet testového kritéria:
F =
6. Zjištění zda F ∈ K a rozhodnutí:
1 k−1
k P
26 / 45
Nechť statistické znaky Y1 , Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro 1 = 1, . . . , k) s neznámými shodnými rozptyly odhadnutými prostřednictvím si2 , i = 1, . . . , k, a jsou nezávislé. 1. ANOVA nebo dvouvýběrový t-test (k = 2)?
2
ni (¯ yi −¯ y• ) i=1 n k i PP 1 (yij −¯ yi )2 n−k i=1 j=1
H0 vs. HA
◮
7. Zformulovat slovní odpověď, v případě platnosti HA pokračovat v analýze pro jednotlivé soubory!
+/− jedno (F je v tomto případě druhou mocninou příslušného t)
2. ANOVA nebo ◮
n dvouvýběrových t-testů (k > 2)? 2
Pravděpodobnost chyby prvního druhu α se kumuluje s použitím každého z nich
3. Variabilitu mezi skupinami lze prokázat jen proti variabilitě uvnitř skupin – viz s2 F = sx2 r
4. Regresní model: Yij = µ + αi + εij ◮
„Statistikaÿ by Birom
Statistika
Parametrické testy
27 / 45
µ – společná střední hodnota, αi – posunutí i-té proti společnému ! skupiny průměru, εij je náhodná složka s rozdělením N 0; σ 2 nezávislá na αi (= viz homoskedasticita)
„Statistikaÿ by Birom
Statistika
Parametrické testy
28 / 45
Testování na základě více než dvou výběrů
Testování hypotézy o shodě středních hodnot
Testování na základě více než dvou výběrů
Testování hypotézy o shodě středních hodnot
Jednofaktorová analýza rozptylu – poznámky II
Jednofaktorová analýza rozptylu – předpoklady a síla testu
Testování hypotézy o shodě středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
Testování hypotézy o shodě středních hodnotách nezávislých normálně rozdělených souborů – neznámé rozptyly (shodné)
◮
H0 : α1 = α2 = · · · = αk = 0
5. Alternativní (volnější) formulace hypotéz jednofaktorové ANOVAy: ◮
◮
H0 : Spojitý numerický znak Y nezávisí na nominálním statistickém znaku X (efektu), který je v analýze kódován hodnotami Xi = i, pro i = 1, . . . , k. HA : Spojitý numerický znak Y závisí na nominálním statistickém znaku X .
Nechť statistické znaky Y1 ,!Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro 1 = 1, . . . , k) s neznámými shodnými rozptyly odhadnutými prostřednictvím si2 , i = 1, . . . , k, a jsou nezávislé. ◮ Předpoklady ◮
6. Analýza rozptylu: (Yij − Y• ) = (Yij − Yi ) + (Yi − Y• ) ◮
ni ni k X k X k X ! ! 2 X ! 2 X 2 ni · Yi − Y• Yij − Y• = Yij − Yi + i=1 j=1
◮
|
(n − 1)
i=1 j=1
{z
SST · sc2
}
|
◮
i=1
{z
SSr
= (n − k) · sr2 + (k − 1·)sx2
|
}
{z
◮
}
SSA
◮
◮
◮ ◮
pevné efekty – náhodnou (vnitroskupinovou/reziduální) variabilitu přináší jen statistický znak Y . náhodné efekty – na náhodné (reziduální) variabilitě se podílí jak statistický znak Y tak rozdělení do skupin, které je obrazem rozdělení nominálního znaku (X ) v populaci.
„Statistikaÿ by Birom
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
Síla testu ◮
7. Interpretace pevných a náhodných efektů – výpočet stejný, ale
◮
29 / 45
Robustnost k narušení normality stoupá s počtem pozorování ve skupině – ovlivňuje experimentátor Robustnost k narušení homoskedasticity výrazně klesá při nevyvážených počtech ve skupinách – ovlivňuje experimentátor Roste s odchylkou od H0 – neovlivňuje experimentátor Roste s počtem pozorování ve skupině – ovlivňuje experimentátor Roste s vyrovnaností/vyvážeností skupin – ovlivňuje experimentátor (pevné efekty) Klesá s počtem skupin – ovlivňuje experimentátor
„Statistikaÿ by Birom
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Statistika
Testování na základě více než dvou výběrů
Bartlettův test test na shodu rozptylů II
Testování hypotézy o shodě rozptylů více jak dvou souborů
Testování hypotézy o shodě rozptylů více jak dvou souborů
6. Zjištění zda B ∈ K a rozhodnutí:
1. Hypotézy:
H0 : σ12 = σ22 = · · · = σk2
30 / 45
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Bartlettův test test na shodu rozptylů I Nechť statistické znaky Y1 ,!Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro i = 1, . . . , k) s neznámými rozptyly odhadnutými prostřednictvím si2 , 1 = 1, . . . , k, a jsou nezávislé.
Parametrické testy
H0 vs. HA
7. Zformulovat slovní odpověď! Poznámky:
HA : nonH0 (¬H0 )
2. Hladina významnosti: α
◮
Test je citlivý na porušení normality dat a je poměrně slabý.
◮
Pojmenováno podle Mauriceho Stephensona Bartletta (1910–2002).
" # k X ln 10 3. Volba testového kritéria: B = (ni − 1) · log si2 (n − k) · log sc2 − C i=1
◮
◮
" k # X 1 1 1 − kde C = 1 + 3(k − 1) i=1 ni − 1 n−k B ∼ χ2 (k − 1) za platnosti nulové hypotézy
4. Vymezení kritického oboru: K = {B : B ≥ χ21−α (k − 1)}
5. Výpočet testového kritéria: h i Pk 2 hPln 10 i (n − k) · log s 2 − (n − 1) · log s B= i c i i=1 k 1 1 1 1+ 3(k−1)
„Statistikaÿ by Birom
i=1 ni −1 − n−k
Statistika
Parametrické testy
31 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
32 / 45
Testování na základě více než dvou výběrů
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Testování na základě více než dvou výběrů
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Cochranův C test I
Cochranův C test II
Testování hypotézy o shodě rozptylů více jak dvou souborů
Testování hypotézy o shodě rozptylů více jak dvou souborů
Nechť statistické znaky Y1 ,!Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro i = 1, . . . , k) s neznámými rozptyly odhadnutými prostřednictvím si2 , 1 = 1, . . . , k, a jsou nezávislé. Navíc se musí jednat o vyvážený pokusný plán (n1 = · · · = n2 = n).
7. Zformulovat slovní odpověď! Poznámky:
H0 : σ12 = σ22 = · · · = σk2
1. Hypotézy:
HA : nonH0 (¬H0 )
2. Hladina významnosti: α
◮
Podmínka vyváženého pokusného plánu!
◮
Test je citlivý na porušení normality dat.
◮
Pojmenováno podle Williama Gemmella Cochrana (1909–1980).
s2 3. Volba testového kritéria: C = Pkmax 2 i=1 si ◮
2 kde smax = max si2 1≤i≤k
◮
C ∼ C (k; n − 1) za platnosti nulové hypotézy – tabelováno
4. Vymezení kritického oboru: K = {C : C ≥ C1−α (k; n − 1)} 5. Výpočet testového kritéria:
2 smax k P si2
C=
i=1
6. Zjištění zda C ∈ K a rozhodnutí: „Statistikaÿ by Birom
H0 vs. HA
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
33 / 45
„Statistikaÿ by Birom
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Statistika
Testování na základě více než dvou výběrů
Hartleyův test II
Testování hypotézy o shodě rozptylů více jak dvou souborů
Testování hypotézy o shodě rozptylů více jak dvou souborů
Nechť statistické znaky Y1 ,!Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro i = 1, . . . , k) s neznámými rozptyly odhadnutými prostřednictvím si2 , 1 = 1, . . . , k, a jsou nezávislé. Navíc se musí jednat o vyvážený pokusný plán (n1 = · · · = n2 = n).
Poznámky:
H0 : σ12 = σ22 = · · · = σk2
34 / 45
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Hartleyův test I
1. Hypotézy:
Parametrické testy
◮
Podmínka vyváženého pokusného plánu!
◮
Pojmenováno podle Hermana Ottoa Hartleye (1912–1980).
HA : nonH0 (¬H0 )
2. Hladina významnosti: α
3. Volba testového kritéria: H = ◮
2 smax = max si2 , 1≤i≤k
◮
2 smax 2 smin
2 smin = min si2 1≤i≤k
2 smin = min si2 1≤i≤k
4. Vymezení kritického oboru: K = {H : H ≥ H1−α (k; n − 1)} 5. Výpočet testového kritéria:
H=
6. Zjištění zda C ∈ K a rozhodnutí:
2 smax 2 smin
H0 vs. HA
7. Zformulovat slovní odpověď! „Statistikaÿ by Birom
Statistika
Parametrické testy
35 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
36 / 45
Testování na základě více než dvou výběrů
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Testování na základě více než dvou výběrů
Testování hypotézy o shodě rozptylů – testy homoskedasticity
Levenův test I
Levenův test II
Testování hypotézy o shodě rozptylů více jak dvou souborů
Testování hypotézy o shodě rozptylů více jak dvou souborů
4. Vymezení kritického oboru: K = {F : F ≥ F1−α (k − 1; n − k)}
Nechť statistické znaky Y1 ,!Y2 , . . ., Yk mají v základních souborech přibližně normální rozdělení (Yi ∼ N µi ; σi2 pro i = 1, . . . , k) s neznámými rozptyly odhadnutými prostřednictvím si2 , 1 = 1, . . . , k, a jsou nezávislé. 1. Hypotézy H0 : σ12 = σ22 = · · · = σk2
5. Výpočet testového kritéria:
HA : nonH0 (¬H0 )
6. Zjištění zda F ∈ K a rozhodnutí:
2. Hladina významnosti: α
◮
◮
◮
◮
¯i | Rij = |Yij − Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . rezidua po rozdělení do skupin k 1 X ¯i − R ¯ • )2 sx2 = ni (R k − 1 i=1 sr2 =
H0 vs. HA
7. Zformulovat slovní odpověď!
sx2 sr2
3. Volba testového kritéria: F =
F =
k P
ni (¯ ri −¯ r• )2 i=1 ni k P P 1 (¯ rij −¯ ri )2 n−k i=1 j=1 1 k−1
Poznámky: ◮ Test není citlivý na porušení normality dat. ◮
Pojmenováno podle Howarda Leveneho (1914–2003).
ni k 1 XX ¯ i )2 (Rij − R n − k i=1 j=1
F ∼ F (k − 1; n − k) (asymptoticky) za platnosti nulové hypotézy
„Statistikaÿ by Birom
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
37 / 45
„Statistikaÿ by Birom
Testy mnohonásobného srovnávání
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
Testy mnohonásobného srovnávání
Scheffého metoda mnohonásobného srovnávání I
Scheffého metoda mnohonásobného srovnávání II
Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Nechť statistické znaky Y1 , Y2 , . . . , Yk splňují předpoklady pro použití ANOVAy. k P ni Navazují na tento test, byla-li zamítnuta nulová hypotéza. Nechť N =
Poznámky: ◮
38 / 45
Pojmenováno podle Hanryho Scheffého (1907–1977).
i=1
1. Hypotézy:
H0 : µ i = µ j
HA : µi 6= µj , pro i, j = viz i 6= j
2. Hladina významnosti: α
3. Volba testového kritéria: FS = ◮
kde sy¯i − sy¯j =
r
sr2 ·
1 ni
+
1 nj
|¯ yi − y¯j | , sy¯i − sy¯j
4. Vymezení kritického oboru: o n p K = Fs : Fs ≥ (k − 1) · F1−α (k − 1; N − k) 5. Výpočet testového kritéria:
FS =
|¯ yi −¯ yj | sy¯i −sy¯j
6. Zjištění zda platí nerovnost a rozhodnutí:
H0 vs. HA
7. Zformulovat slovní odpověď. „Statistikaÿ by Birom
Statistika
Parametrické testy
39 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
40 / 45
Testování na základě více než dvou výběrů
Testy mnohonásobného srovnávání
Testování na základě více než dvou výběrů
Testy mnohonásobného srovnávání
(Fisherova, modifikovaná) LSD metoda
Duncanův test (MRT) I
Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Nechť statistické znaky Y1 , Y2 , . . . , Yk splňují předpoklady pro použití ANOVAy. k P ni Navazují na tento test, byla-li zamítnuta nulová hypotéza. Nechť N =
Nechť statistické znaky Y1 , Y2 , . . . , Yk splňují předpoklady pro použití ANOVAy. Navazují na tento test, byla-li zamítnuta nulová hypotéza. Navíc se musí jednat o vyvážený pokusný plán (n1 = · · · = n2 = n).
i=1
1. 2. 3. 4.
Hypotézy: H0 : µ i = µ j HA : µi 6= µj , pro i, j = viz poznámka Hladina významnosti: α Volba testového kritéria: |Y¯i − Y¯j | Vymezení r kritického oboru: 1 1 2 ¯ ¯ K = |Yi − Yj | ≥ t1−α/2 (N − k) sr · ni + nj
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
H0 : µi = µ j
HA : µi 6= µj , pro i, j = viz poznámka
3. Volba testového kritéria: |Y¯i − Y¯j | n o q n +n 4. Vymezení kritického oboru: K = |Y¯i − Y¯j | ≥ sr · 2ni i njj · qα (p; n − k) ◮
5. Výpočet testového kritéria: |¯ yi − y¯j | 6. Zjištění zda platí nerovnost a rozhodnutí: H0 vs. HA 7. Zformulovat slovní odpověď. Poznámky: ◮ Symboly µi a µj v tomto testu představují výhradně sousední hodnoty (seřazeno podle velikosti y¯(1) ≤ y¯(2) ≤ . . . ≤ y¯(k) ). ◮ LSD = Least Significant Difference „Statistikaÿ by Birom
1. Hypotézy:
2. Hladina významnosti: α
◮
kde qα (p; n − k) je kritická hodnota studentizovaného rozpětí Pro výpočet se průměry seřadí podle velikosti a postupně se dosazují do výše uvedeného vzorce. Počet průměrů, které leží v uspořádané řadě mezi právě počítanými průměry y¯i a y¯j určuje hodnotu p.
5. Výpočet testového kritéria:
|¯ yi − y¯j |
6. Zjištění zda platí nerovnost a rozhodnutí:
H0 vs. HA
7. Zformulovat slovní odpověď. 41 / 45
„Statistikaÿ by Birom
Testy mnohonásobného srovnávání
Statistika
Testování na základě více než dvou výběrů
Parametrické testy
42 / 45
Testy mnohonásobného srovnávání
Duncanův test (MRT) II
Tukeyův HSD test
Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Poznámky:
Nechť statistické znaky Y1 , Y2 , . . . , Yk splňují předpoklady pro použití ANOVAy. Navazují na tento test, byla-li zamítnuta nulová hypotéza. Navíc se musí jednat o vyvážený pokusný plán (n1 = · · · = n2 = n). 1. Hypotézy: H0 : µi = µ j HA : µi 6= µj , pro i, j = 1, . . . , k, i 6= j 2. Hladina významnosti: α r |Y¯i − Y¯j | ni nj 3. Volba testového kritéria: ts = · sr ni + nj 4. Vymezení kritického oboru: K = {ts : ts ≥ qα (k; n − k)}
◮
MRT = Multiple Range Test
◮
Pojmenováno podle Davida B. Duncana (1916–2006).
◮
kde qα (k; n − k) je kritická hodnota studentizovaného rozpětí
5. Výpočet testového kritéria:
ts =
¯ i −Y ¯j | |Y sr
·
q
ni nj ni +nj
6. Zjištění zda platí nerovnost a rozhodnutí: H0 vs. HA 7. Zformulovat slovní odpověď. Poznámky: ◮ HSD = Honestly Significant Difference ◮ Pojmenováno podle Johna Wildera Tukeye (1915–2000). „Statistikaÿ by Birom
Statistika
Parametrické testy
43 / 45
„Statistikaÿ by Birom
Statistika
Parametrické testy
44 / 45
Testování na základě více než dvou výběrů
Testy mnohonásobného srovnávání
Bonferroniho metoda mnohonásobného porovnávání Následné testování hypotézy o shodě středních hodnot dvou nezávislých souborů
Nechť statistické znaky Y1 , Y2 , . . . , Yk splňují předpoklady pro použití ANOVAy. Navazují na tento test, byla-li zamítnuta nulová hypotéza. 1. Hypotézy: H0 : µ i = µ j HA : µi 6= µj , pro i, j = 1, . . . , k, i 6= j 2. Hladina významnosti: α r Y¯i − Y¯j ni nj 3. Volba testového kritéria: T = sr ni + nj ◮
◮
v u u kde sr = t
ni k 1 XX ¯i )2 (Yij − Y n − k i=1 j=1
T ∼ t(n − k) za platnosti nulové hypotézy
n o 4. Vymezení kritického oboru: K = t : |t| ≥ t1−α/(k ) (n − k) 2 q y¯ −¯ y ni nj 5. Výpočet testového kritéria: t = i sr j ni +n j
6. Zjištění zda platí nerovnost a rozhodnutí: H0 vs. HA 7. Zformulovat slovní odpověď. Poznámky: ◮ Pojmenováno podle Carlo Emilioa Bonferonniho (1892–1960). „Statistikaÿ by Birom
Statistika
Parametrické testy
45 / 45