Testování hypotéz 4. přednáška 6. 3. 2010
Základní pojmy • • • •
Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne.
• Nulová hypotéza H0 • Hypotéza, jejíž platnost ověřujeme. • Značíme je H0. • Alternativní hypotéza H1 Říká, co bude platit, • když nebude platit nulová hypotéza H0. • Říkáme, že testujeme H0 proti H1.
Základní pojmy Testy jednostranné a dvoustranné záleží na formulaci alternativní hypotézy Nulová hypotéza
H 0: A = B
Dvourstranná
H 1:
Jednostranná
H 1: H 1:
Základní pojmy • • •
Statistický test Jednoznačné pravidlo, které určuje podmínky, za kterých hypotézu H0 – zamítneme nebo nezamítneme.
• • •
Testovací kritérium (Z) Je funkce náhodného výběru, jejíž tvar je závislý na: – testované hypotéze a – rozdělení pravděpodobností základního souboru.
• •
Kritická oblasti (KO) Je množina hodnot testovacího kritéria, které neptaří do oblasti přípustných hodnot.
• •
Oblast přípustných hodnot (OPH) Je množina hodnot testovacího kritéria, které nepatří do kritické oblasti.
Základní pojmy • • • • • • 1. 2. 3.
Kritická hranice (KH) Odděluje kritickou oblast od oblasti přípustných hodnot.
Hladina významnosti testu Je pravděpodobnost kritické oblasti Postup testování hypotézy získání údajů (například měřením), stanovení statistického testu s příslušnou kritickou oblastí, dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z 4. zjistíme, kam padla hodnota testovacího kritéria: 5. zda do kritické oblasti nebo 6. do oblasti přípustných hodnot.
Postup testování hypotéz 1.
získání údajů (například měřením),
2.
stanovení statistického testu s příslušnou kritickou oblastí,
3.
dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z
4.
zjistíme, kam padla hodnota testovacího kritéria: –
zda do kritické oblasti nebo = nulovou hypotézu zamítáme
–
do oblasti přípustných hodnot. = nulovou hypotézu nezamítáme
Postup testování hypotéz • Pokud Z
hypotéza H0 se zamítá Říkáme: pokud hodnota testovacího kritéria padne do kritické oblasti, hypotézu H0 zamítáme.
• Pokud Z
KO
KO
………
………
hypotéza H0 se nezamítá Říkáme: pokud hodnota testovacího kritéria padne oblasti přípustných hodnot, hypotézu H0 nezamítáme.
Dělení testů hypotéz podle toho zda známe RP • Parametrické testy – Rozdělení pravděpodobností základního souboru je známé. – Testování se týká pouze hodnot parametrů. – Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností.
• Neparametrické testy – Neznáme rozdělení pravděpodobností
Dělení testů hypotéz • Testy významnosti Rozdělení pravděpodobností je známé. Testované hypotézy se týkají pouze parametrů základního souboru. – Jednovýb. testy významnosti pro střední hodnotu N-RP • Známe δ, • Neznáme δ.
– Jednovýb. Testy významnosti pro rozptyl
• Testy shody Týkají se typu rozdělení pravděpodobností základního souboru.
Test pro střední hodnotu pokud: známe δ a soubor má normální RP • Testovací kritérium
• • n • k • δ
= = = =
aritmetický průměr náhodného výběru rozsah náhodného výběru střední hodnota (konstanta) směrodatná odchylka náhodného výběru
Test pro střední hodnotu pokud: známe δ a soubor má normální RP • Kritická oblast a) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k
W=
Příklad Podle jízdního řádu je jízdní doba nedělního posilového spoje číslo 13 mezi Strakonicemi a Prahou 100 minut. Po deset neděl byl sledován příjezd tohoto spoje do Prahy a za předpokladu, že autobus vyjel ze Strakonic včas, byly zaznamenány tyto jízdní doby:
Datum
7.3.
14.3.
21.3.
28.3
4.4.
11.4.
18.4.
25.4.
2.5.
9.5.
Doba
90
112
103
86
98
100
120
89
95
100
Na hladině významnosti testujete, zda jízdní doba uvedená v jízdním řádu odpovídá skutečnosti, jestliže víte, že hodnoty pocházejí ze základního souboru s normálním rozložením pravděpodobností se směrodatnou odchylkou δ = 10,3.
Test pro střední hodnotu pokud: neznáme δ, studentovo RP • Testovací kritérium
• • n • k • s
= = = =
aritmetický průměr náhodného výběru rozsah náhodného výběru střední hodnota (konstanta) směrodatná odchylka náhodného výběru (musí se dopočítat)
Test pro střední hodnotu pokud: neznáme δ, studentovo RP • Kritická oblast a) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k
W=
Příklad 10 majitelů vozů Škoda Octavia sledovalo spotřebu paliva, hodnoty jejich měření jsou uvedeny v tabulce. Výrobce udává průměrnou spotřebu tohoto typu automobilu Octavita 8,9 l/100km. Předpokládejme, že spotřeba má normální rozdělení pravděpodobnosti. •
a) Otestuje na hladině významnosti 0,05, zda se liší spotřeba naměřená majiteli vozů od střední hodnoty dané výrobcem.
•
b) Otestujte na hladině významnosti 0,05, zda je spotřeba naměřená majiteli vozů významně vyšší než hodnota udaná výrobcem.
Majitel 1
2
3
4
5
6
7
8
9
10
Spotř.
9,3
8,8
9,0
8,85
9,05
9,05
8,9
8,95
10,2
•
10,0
Test pro rozptyl • Testovací kritérium
• •
= =
rozptyl daný v zadání výběrový rozptyl
Test pro rozptyl • Kritická oblast a) dvoustranná alternativní hypotéza H0: DX= k2 proti H1: DX k2
W=
Příklad • Automat vyrábí pístové kroužky o daném průměru. Výrobce udává, že směrodatná odchylka průměru kroužků je 0,05 mm. K ověření této informace bylo vybráno náhodně 80 kroužků a vypočtena směrodatná odchylka jejich průměru s = 0,04 mm. • Lze tento rozdíl považovat za významný? • Na 5% hladině významnosti testujte hypotézu, že směrodatná odchylka průměru kroužků je rovna 0,05 mm.