Kurz 4st201 – cvičení č. 7
4ST201 – STATISTIKA CVIČENÍ Č. 7 • testování hypotéz – parametrické testy →
test hypotézy o střední hodnotě
→
test hypotézy o relativní četnosti
→
test o shodě středních hodnot
• testování hypotéz v MS Excel • neparametrické testy →
chí-kvadrát test dobré shody
Testování statistických hypotéz • Statistická hypotéza – určitý předpoklad o parametrech či tvaru rozdělení • Hypotézy se mohu týkat neznámých číselných parametrů rozdělení náhodné veličiny, pak jde o testy parametrické. Ostatní typy jsou testy neparametrické. • H0 – nulová (testovaná) hypotéza, hypotéza, jejíž platnost ověřujeme; např. předpoklad, že se průměr základního souboru rovná určité konkrétní hodnotě • H1 – alternativní hypotéza – popírá nulovou hypotézu: →
Dvoustranná hypotéza - dvoustranný test
→
Pravostranná hypotéza, levostranná hypotéza - jednostranný test
• Chyba I. druhu = zamítnutí ve skutečnosti platné H0 →
Pravděpodobnost chyby I. druhu = α = hladina významnosti (volí se před provedením testu, nejčastěji 0,1, 0,05, 0,01)
• Chyba II. druhu = nezamítnutí H0, ačkoliv ve skutečnosti platí H1 →
Pravděpodobnost chyby II. druhu = β; pravděpodobnost 1-β = síla testu
CHYBA I. A II. DRUHU
Závěr testu
Skutečnost
H0 platí
H0 platí
OK (1-α)
H0 neplatí
chyba II. druhu (β)
1
H0 neplatí chyba I. druhu (α) OK (1-β)
Kurz 4st201 – cvičení č. 7 • Testové kritérium = statistika, jejíž hodnotu vypočítáme na základě výběrových (napozorovaných) dat a podle jejíž hodnoty pak posuzujeme platnost testované hypotézy • Obor hodnot testového kritéria se rozděluje na dva neslučitelné obory – obor přijetí (V) a kritický obor (W), obory od sebe oddělují tzv. kritické hodnoty • Rozhodnutí činíme podle toho, jestli hodnota testového kritéria padne do kritického oboru W (zamítnutí H0), či do oboru přijetí V (nezamítnutí H0) • Doporučený postup při testování hypotéz 1) Formulace výzkumné otázky ve formě nulové a alternativní statistické hypotézy (Jakého parametru se hypotéza týká?) 2) Zvolení přijatelné úrovně chyby rozhodování (volba hladiny významnosti α) 3) Volba testovacího kritéria (ve vzorcích podle typu vhodného testu) 4) Výpočet hodnoty testovacího kritéria 5) Určení kritických hodnot testovacího kritéria (určení krajních hodnot kritického oboru W – vzorce) 6) Doporučení (nezamítnutí nebo zamítnutí nulové hypotézy H0)
Test hypotézy o střední hodnotě
: =
Testujeme nulovou hypotézu
: ≠ (oboustranná alternativní hypotéza)
proti jedné z alternativních hypotéz:
: > (pravostranná alternativní hypotéza) : < (levostranná alternativní hypotéza)
Při volbě testového kritéria a kritického oboru opět rozlišujeme podle toho, zda je rozptyl základního souboru známý a jak velký je rozsah výběru: a) Velký rozsah výběru, rozptyl v základním souboru je známý o
=
testovým kritériem je náhodná veličina
̅ √
která má při platnosti nulové hypotézy rozdělení N(0;1) o
,
kritický obor závisí na tvaru alternativní hypotézy a na zvolené hladině významnosti:
H1
Wα
≠
(−∞; − >∪< ; ∞)
<
(−∞; − >
>
< ; ∞)
b) Velký rozsah výběru, rozptyl v základním souboru není známý o
=
testovým kritériem je náhodná veličina
která má při platnosti nulové hypotézy rozdělení N(0;1) o
̅ √
,
kritické obory mají stejný tvar jako v případě známého rozptylu 2
Kurz 4st201 – cvičení č. 7 c) Malý rozsah výběru, rozptyl v základním souboru není známý o
!=
testovým kritériem je náhodná veličina
̅
která má při platnosti nulové hypotézy rozdělení t(n-1) o
√
,
kritické obory mají tvar:
H1
≠ > <
Wα
(−∞; −! >∪< ! ; ∞)
< ! ; ∞)
(−∞; −! >
Př. 7.1 V pivovaru došlo k opravě plnící linky. Po opravě se provedlo měření u 21 naplněných lahví – průměrný objem v naplněné lahvi byl 500,36 ml se směrodatnou odchylkou 1,78 (jde tedy o výběrové hodnoty). Předpokládáme, že jde o výběr z normálního rozdělení. Na hladině významnosti α = 0,05 ověřte, zda se oprava zdařila, tj. zda linka plní do láhví pivo o objemu 500ml. (Jinak řečeno chceme ověřit, zda zjištěný průměr se významně liší od požadované hodnoty 500ml) •
Stanovte nulovou a alternativní hypotézu, zvolte vhodné testové kritérium a kritické hodnoty;
•
Jak se změní postup a výsledek, pokud směrodatná odchylka objemu náplně je známa, tedy nejde o hodnotu zjištěnou z výběru, a její hodnota je 0,78?
Test hypotézy o relativní četnosti – velké výběry Testujeme nulovou hypotézu proti jedné z alternativních hypotéz:
Testovým kritériem je náhodná veličina
: " = " : " ≠ "
: " > " : " < "
#$
=
& ('(& ) %
,
která má při platnosti nulové hypotézy rozdělení N(0;1). Kritické obory:
H1
Wα
) ≠ )
(−∞; − >∪< ; ∞)
) < )
(−∞; − >
) > )
< ; ∞)
Př. 7.2 Strana pronikne do sněmovny, jestliže její volební výsledek překročí 5 %. Byl proveden průzkum, kde z 350 dotázaných respondentů by sledovanou stranu volilo 28 lidí. Můžeme na hladině významnosti 1 % předpokládat proniknutí strany do sněmovny ve volbách? 3
Kurz 4st201 – cvičení č. 7
Test o shodě středních hodnot – velké nezávislé výběry : =
Testujeme nulovou hypotézu
: ≠
proti jedné z alternativních hypotéz:
: > : <
=
Testovým kritériem je náhodná veličina
̅ ' ̅*
* * + ', * ' *
,
která má při platnosti nulové hypotézy rozdělení N(0;1) Kritické obory:
H1
Wα
- ≠ .
(−∞; − >∪< ; ∞)
- < .
(−∞; − >
- > .
< ; ∞)
Př. 7.3 Na základě zadaných dat otestujte na hladině významnosti 0,05 a 0,01 hypotézu, že chlapci a dívky dosahují u průběžného testu stejných výsledků. Data k příkladu jsou v souboru „vysledky.xlsx“.
Testování hypotéz v MS Excel • MS Excel má funkce pro testování střední hodnoty, test o relativní četnosti nikoliv o
Funkce ZTEST (matice = oblast dat; x = testovaná hodnota; [sigma] = hodnota směrodatné odchylky v základním souboru, pokud je známá) …umožňuje test o střední hodnotě pro velké výběry.
o
Funkce TTEST (matice1 = oblast dat prvního výběru; matice2 = oblast dat druhého výběru;
chvosty = volba, zda jde o jednostranný (1) nebo dvoustranný test (2); typ = volba zda jde o párové výběry (1), nezávislé výběry se stejnými rozptyly (2), nezávislé výběry s různými rozptyly (3)) …umožňuje test o shodě dvou středních hodnot, využívá kvantily t-rozdělení, protože neobsahuje předpoklad o dostatečně velkých výběrech (oba s rozsahem větším než 30). o
Modul ANALÝZA DAT umožňuje test o shodě středních hodnot pomocí voleb:
„Dvouvýběrový t-test s rovností / nerovností rozptylů“ slouží k testování shody středních hodnot dvou nezávislých výběrů (používá kvantily t-rozdělení, protože nepředpokládá velké výběry)
„Dvouvýběrový z-test na střední hodnotu“ slouží k testování shody středních hodnot dvou nezávislých výběrů, které pocházejí z normálního rozdělení, přičemž známe rozptyl v základním souboru.
„Dvouvýběrový párový t-test na střední hodnotu“ testuje shodu středních hodnot v párových výběrech. 4
Kurz 4st201 – cvičení č. 7 Výstupem testu je tzv. p-hodnota – je-li p-hodnota menší než zvolená hladina významnosti, pak testovanou hypotézu zamítáme a je-li větší, pak testovanou hypotézu nezamítáme. Zamítli bychom ji až na hladině významnosti, která by se rovnala právě p-hodnotě. Je-li p-hodnota vyšší než zvolená hladina významnosti, pak testovanou hypotézu nezamítáme. Př. 7.4 a) Uvažujte soubor deti.xlsx z příkladu 6.3. Testujte na hladině významnosti 0,05, že průměrná porodní hmotnost dítěte je 3 kg. Využijte funkci ZTEST. b) Vypočtěte příklad 7.3 v MS Excel pomocí funkce TTEST a pomocí modulu Analýza dat.
Neparametrické testy Chí-kvadrát (χ2) test dobré shody Co testujeme? •
porovnání výběrového rozdělení četností (tj. četností, které jsme skutečně vypozorovali při náhodném výběru) a teoretického rozdělení četností (tj. četností, které v základním souboru předpokládáme již před provedením náhodného výběru)
Příklad využití •
Chceme ověřit teoretický předpoklad o poměrném zastoupení skupin v základním souboru – např. předpokládáme, že z narozených dětí je 48,5 % dívek a 51,5 % chlapců. Provedeme náhodný výběr a testujeme, zda poměr narozených dívek a chlapců odpovídá našemu předpokladu.
•
Chceme ověřit, zda data, která máme k dispozici, vykazují normální rozdělení. Porovnáváme pak četnosti jednotlivých hodnot v našich datech s četnostmi, kterých by jednotlivé hodnoty nabývaly v případě normálního rozdělení.
Test •
nulová hypotéza říká, že v konečném základním souboru, roztříděném podle nějakého znaku do k skupin, jsou podíly jednotlivých variant rovny číslům π0,1, π0,2, … π0,k.
•
alternativní hypotéza nulovou popírá
H : π = π,
" = ",
…
"3 = ",3
•
: 454 0
testové kritérium G porovnává výběrové a teoretické četnosti v každé skupině (počet skupin = k) a za předpokladu velkého výběru (teoretické četnosti alespoň větší než 5 v každé skupině) má
přibližně chí-kvadrát rozdělení s ν = k-1 stupni volnosti.
5
Kurz 4st201 – cvičení č. 7
7 = ∑3=>
Testovým kritériem je náhodná veličina:
9:; :; < :;
*
,
kde ?A@ jsou teoretické (předpokládané) absolutní četnosti v základním souboru a ?@ jsou empirické
(skutečné) absolutní četnosti ve výběrovém souboru.
Testové kritérium má při platnosti nulové hypotézy rozdělení B CD − 1F.
CD G =< B − 1F; ∞)
Kritický obor: Př. 7.5
Při opakovaném házení hrací kostkou byly z 60 hodů zjištěny tyto výsledky: Hodnota (xi)
1
2
3
4
5
6
Četnost (ni)
9
8
11
12
9
11
Ověřte na hladině významnosti α = 0,01, že kostka je v pořádku tj. že má těžiště v geometrickém středu.
Chí-kvadrát test dobré shody v MS Excel • Funkce CHITEST (aktuální = skutečné napozorované četnosti, očekávané = teoretické četnosti v případě nezávislosti), výstupem je opět p-hodnota. Při interpretaci výsledku pozor na význam nulové hypotézy. Nulová hypotéza říká, že empirické rozdělení četností odpovídá předpokládanému rozdělení četností.
6