Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA – STATISTICKÉ TESTOVÁNÍ HYPOTÉZ
22.11.2016
Opakování: CLV – příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců koaličních stran. Jaká je pravděpodobnost, že průzkum veřejného mínění o rozsahu 𝑛 = 1 500 ukáže nesprávně převahu opozice? 𝑃 𝑋 ∈ 𝑎, 𝑏
=Φ
𝑏 + 0,5 − 𝑛𝑝 𝑛𝑝(1 − 𝑝)
−Φ
𝑎 − 0,5 − 𝑛𝑝 𝑛𝑝 1 − 𝑝
Opakování: CLV – příklad 1 Řešení: 𝑋 … počet příznivců koalice Pokud by byl výběr proveden zcela náhodně, pak 𝑋 má: binomické rozdělení 𝑋~𝐵𝑖 𝑛; 𝑝 ~𝐵𝑖 1500; 0,52 , které můžeme aproximovat normálním rozdělením o parametrech: 𝜇= 𝜎2 =
Opakování: CLV – příklad 1 𝑋 … počet příznivců koalice
𝑋~𝑁 𝑛𝑝; 𝑛𝑝 1 − 𝑝
= 𝑁 780; 374,4
Průzkum ukáže nesprávně převahu opozice, jestliže 𝑋 ≤ 749, tj. 𝑃 𝑋 ≤ 749 = 0,0575 Průzkum o rozsahu 𝑛 = 1 500 ukáže nesprávně převahu opozice s pravděpodobností přibližně 0,0575.
Opakování: CLV – příklad 2 Zadání: Výletní člun má nosnost 5 000 kg. Hmotnost cestujících je náhodná veličina se střední hodnotou 70 kg a směrodatnou odchylkou 20 kg. Kolik cestujících může člunem cestovat, aby pravděpodobnost přetížení člunu byla menší než 0,1 %?
Opakování: CLV – příklad 2 Řešení: 𝑋 … celková hmotnost všech n cestujících Dle CLV má 𝑋~𝑁 𝜇 = 70 ∙ 𝑛; σ2 = 400 ∙ 𝑛 Hledáme takové maximální 𝑛, aby 𝑃 𝑋 ≥ 5 000 < 0,001. 𝒏 ≤ 𝟔𝟒
Přehled témat 1.
Pravděpodobnost (definice, využití, výpočet pravděpodobností náhodných jevů)
2.
Podmíněná pravděpodobnost
3.
Náhodná veličina
4.
Statistické charakteristiky
5.
Slabý zákon velkých čísel
6.
Centrální limitní věta (teorém)
7.
Bodový a intervalový odhad
8.
Testování hypotéz
9.
Korelace a regrese
8.1 Testování statistických hypotéz – motivační příklad Příklad – platová diskriminace Společnost v rámci vnitřního šetření uskutečnila i mapování platových podmínek za účelem zjištění, zda dochází k platové diskriminaci žen. Analýza zahrnovala 100 náhodně vybraných zaměstnanců, z toho 35
bylo žen s 𝑋35 = 20 685,5 Kč a 𝑠𝑋 = 5 179,5 Kč,
65
bylo mužů s 𝑌65 = 21 364,4 Kč a 𝑠𝑋 = 4 334,0 Kč.
Výsledný rozdíl je 𝑌 − 𝑋 = 678,9 > 0 𝐾č.
Je možné říci, že rozdíl je dostatečně průkazný na to, aby se mohlo tvrdit, že muži (v dané firmě) mají obecně vyšší platy jak ženy?
8.1 Testování statistických hypotéz – motivační příklad Spíše nás zajímá, porovnání středních hodnot platů mužů a žen – nikoliv, zda libovolný muž vydělá více než libovolná žena. Je střední hodnota platů vyšší u mužů než u žen? Již víme, že střední hodnoty odhadujeme výběrovými průměry, což je rozumné rozhodnout na základě porovnání 𝑋 a 𝑌.
Jiný
náhodný výběr by zahrnoval jiných 100 zaměstnanců, a dostali bychom tak odlišné výběrové průměry 𝑋 a 𝑌. Výběrové průměry 𝑋 a 𝑌 jsou tedy náhodné veličiny. Jejich hodnoty neodpovídají středním hodnotám 𝐸 𝑋 a 𝐸(𝑌) přesně, jsou to pouze jejich bodové odhady.
Jestliže vyšlo 𝑌 − 𝑋 = 678,9 > 0 𝐾č, je možné tvrdit, že E 𝑌 − 𝐸(𝑋) > 0 𝐾č?
8.1 Testování statistických hypotéz – motivační příklad Kdy se výběrové průměry liší „dostatečně“
Když vezmeme dva výběry z téhož rozdělení, pak výběrové průměry se budou lišit (byť jen málo), i když jsou střední hodnoty stejné. Příklad s platy: otázkou je, zda je rozdíl v průměrech jen vlivem „náhody“ nebo se skutečně liší střední hodnoty. Pokud oba výběrové průměry odhadují tutéž střední hodnotu, pak by se průměry neměly velmi lišit. Je ovšem třeba zohlednit: počet pozorování (s rostoucím počtem roste přesnost odhadů), variabilitu (vysoký rozptyl způsobuje větší nejistotu). Pokud zohledníme rozdělení 𝑌 − 𝑋, jsme schopni zjistit, jaké hodnoty jsou již „extrémní a málo pravděpodobné“. Pak je třeba aplikovat statistické testy pro správné rozhodnutí.
8.2 Testování statistických hypotéz – základní pojmy
Testováním hypotéz se chápe vyhodnocování pravdivosti výroků na základě náhodného výběru, tj. ověřování platnosti nějakého výroku. Provádí se za pomoci statistických testů.
Hypotéza je výrok, o jehož pravdivosti chceme rozhodnout.
8.2 Testování statistických hypotéz – základní pojmy
Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru).
Příklad: Střední
hodnota zakladního souboru je rovna 100.
Střední
hodnota prvního základního souboru se rovná střední hodnotě druhého základního souboru.
Statistické hypotézy dělíme na parametrické a neparametrické.
8.2 Testování statistických hypotéz – základní pojmy
Parametrická hypotéza je hypotéza o parametrech rozdělení základního souboru.
Patří sem: hypotézy
o parametru jednoho základního souboru – o střední hodnotě, mediánu, rozptylu, atd.
hypotézy
o parametrech dvou základních souborů (srovnávací testy) – rovnost středních hodnot, rovnost rozptylů, atd.
hypotézy
o parametrech tří a více základních souborů.
8.2 Testování statistických hypotéz – základní pojmy
Neparametrická hypotéza je hypotéza o jiných vlastnostech základního souboru – např. tvaru, rozdělení, závislosti proměnných, atd.
8.2 Testování statistických hypotéz – základní pojmy
Statistické testy dělíme na parametrické a neparametrické testy. Parametrickým
testem rozumíme takový test, pro jehož odvození je nutno specifikovat typ rozdělení, případně jeho parametry. Nejčastěji se setkáváme s předpokladem normality dat.
Neparametrickým
testem rozumíme takový test, pro jehož odvození není nutno specifikovat typ rozdělení.
8.2 Testování statistických hypotéz – základní pojmy
Při testování hypotéz proti sobě stojí 2 hypotézy – nulová a alternativní hypotéza. Nulová
hypotéza 𝐻0 vyjadřuje tvrzení o základním souboru, které je bráno jako předpoklad při testování (rovnovážný stav).
Alternativní
hypotéza 𝐻𝐴 stojí proti nulové hypotéze a představuje porušení rovnovážného stavu.
Existují
tři typy alternativních hypotéz:
levostranná
alternativní hypotéza,
pravostranná oboustranná
alternativní hypotéza, alternativní hypotéza.
8.2 Testování statistických hypotéz – základní pojmy
Příklad:
𝐻0 : střední hodnota základního souboru 𝜇 = 10, levostranná
𝐻𝐴 : 𝜇 < 10,
pravostranná
𝐻𝐴 : 𝜇 > 10,
oboustranná
𝐻𝐴 : 𝜇 ≠ 10.
Příslušná alternativní hypotéza se volí na základě pozorování chování výběrového souboru. Testování hypotéz je založeno na následujícím principu: Pokud výběrový soubor neukáže na statisticky významný rozpor s nulovou hypotézou, pak nesmíme nulovou hypotézu zamítnout. Jelikož na základě chování výběrového souboru (tedy jen vzorku populace) usuzujeme o chování základního souboru (tedy celé populace), můžeme se při rozhodování dopustit chyby.
8.2 Testování statistických hypotéz – základní pojmy
Platí Platí
Skutečnost
Výsledek testu
Platí 𝐻0
Platí 𝐻𝐴
Správné rozhodnutí
Chyba I. druhu
pravděpodobnost 𝟏 − 𝜶 (spolehlivost testu)
pravděpodobnost 𝜶 (hladina významnosti)
Chyba II. druhu
Správné rozhodnutí
pravděpodobnost 𝜷
pravděpodobnost 𝟏 − 𝜷 (síla testu)
8.2 Testování statistických hypotéz – základní pojmy
Snahou je minimalizovat obě chyby, což však není možné, protože snížením 𝛽 vzroste 𝛼 a naopak.
Při statistickém testování hypotéz se volí hodnota 𝛼 (nejčastěji 0,05 či 0,01), protože chyba I. druhu je významnější než chyba II. druhu.
Chybu II. druhu lze snížit volbou vhodného testu a nebo zvětšením rozsahu výběrového souboru.
8.3 Testování statistických hypotéz – klasický test
Postup při klasickém testování hypotéz je následující: 1.
Formulace nulové a alternativní hypotézy.
2.
Volba testové statistiky a jejího rozdělení při platnosti nulové hypotézy (tzv. nulového rozdělení). Testová statistika a její nulové rozdělení je dána pro konkrétní test.
8.3 Testování statistických hypotéz – klasický test
Postup při klasickém testování hypotéz je následující: 3.
Sestrojení kritického oboru a oboru přijetí – obor všech možných hodnot testové statistiky rozdělíme na dva disjunktní obory, tj. a)
obor přijetí – takové hodnoty testované statistiky, které svědčí pro nezamítnutí nulové hypotézy
b)
kritický obor – takové hodnoty testové statistiky, které svědčí pro zamítnutí nulové hypotézy
Hranice mezi obory se nazývá kritická hodnota testu. Kritický obor je tak velký, aby pravděpodobnost, že testová statistika leží v kritickém oboru při předpokladu platnosti nulové hypotézy, byla rovna 𝛼.
8.3 Testování statistických hypotéz – klasický test Levostranná alternativní hypotéza
f(x)
kritický obor: 𝜶
kritická hodnota
obor přijetí: 𝟏 − 𝜶
0
x
8.3 Testování statistických hypotéz – klasický test Pravostranná alternativní hypotéza
f(x)
kritický obor: 𝜶
obor přijetí: 𝟏 − 𝜶
0
x kritická hodnota
8.3 Testování statistických hypotéz – klasický test Oboustranná alternativní hypotéza
f(x)
obor přijetí: 𝟏 − 𝜶
𝜶 kritický obor: 𝟐
𝜶 kritický obor: 𝟐
kritická hodnota
0
x kritická hodnota
8.3 Testování statistických hypotéz – klasický test 4.
Výpočet pozorované hodnoty testové statistiky
5.
Vyhodnocení testu: a)
Je-li hodnota testové statistiky v oboru přijetí, potom nezamítneme nulovou hypotézu.
b)
Je-li však hodnota testové statistiky v kritickém oboru, pak zamítáme nulovou hypotézu ve prospěch alternativní hypotézy.
8.4 Pearsonův 𝜒 2 test dobré shody
Vzhledem k tomu, že nejpoužívanější parametrické testy předpokládají normalitu dat, je nutné se nejprve zabývat tím, jak otestovat, že tato data získaná náhodným výběrem pocházejí z populace řídicí se normálním rozdělením s parametry 𝜇 a 𝜎 2 .
K tomu se využívají různé statistické testy: Jarqueův
a Beryho test normality (JB test) – ukázali jsme
Shapirův-Wilkův,
Andersonův-Darlingův, KolmogorovůvSmirnovův, Lillieforsův, atd.
a
tzv. testy dobré shody.
8.4 Pearsonův 𝜒 2 test dobré shody
Tento test je určen k testování nulové hypotézy v obecném tvaru, tj. náhodný výběr pochází z konkrétního rozdělení pravděpodobnosti s konkrétními parametry.
Alternativní hypotéza popírá nulovou hypotézu, tj. náhodný výběr nepochází z konkrétního rozdělení pravděpodobnosti s konkrétními parametry.
Pokud neznáme parametry příslušného rozdělení, je třeba je na základě náhodného výběru odhadnout, například pomocí metody maximální věrohodnosti.
Pearsonův 𝜒 2 test dobré shody umožňuje otestovat náhodný výběr i na jiná rozdělení než jen normální rozdělení.
8.4 Pearsonův 𝜒 2 test dobré shody
Pro testovanou statistiku 𝐺 platí 𝑘
𝐺= kde
𝑖=1
𝑛𝑖 − 𝑛 ∙ 𝜋 𝑖 𝑛 ∙ 𝜋𝑖
2
2 → 𝜒𝑘−ℎ−1
𝑘 je počet tříd 𝑛 je rozsah souboru 𝑛𝑖 je počet pozorování v třídě 𝑖 (pozorované četnosti) 𝑛 ∙ 𝜋𝑖 je teoretická (očekávaná) četnost ℎ je počet odhadovaných parametrů rozdělení
Aby bylo nulové rozdělení dobře aproximováno rozdělením 𝜒 2 , je třeba, aby byly teoretické četnosti ve všech třídách větší než 5. Není-li tento předpoklad pro všechny třídy splněn, je nutno příslušné třídy vhodně sloučit (toto má za následek pokles stupňů volnosti rozdělení 𝜒 2 ).
8.4 Pearsonův 𝜒 2 test dobré shody S rostoucí hodnotou testové statistiky roste rozpor naměřených dat s nulovou hypotézou, od určité hodnoty (kritická hodnota testu) je tento rozpor statisticky významný, zamítneme tedy nulovou hypotézu ve prospěch alternativní hypotézy.
f(x) obor přijetí: 𝟏−𝜶
kritický obor: 𝜶
x
0 kritická hodnota
8.4 Pearsonův 𝜒 2 test dobré shody
Kritickou hodnotu testu získáme jako 100 ∙ 1 − 𝛼 % kvantil rozdělení 𝜒 2 s příslušným počtem stupňů volnosti.
Hodnotu můžeme odečíst z tabulek nebo pomocí softwaru.
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 1 Zadání:
V tenké vrstvě zlata se registroval počet částic zlata, které se dostaly do zorného pole mikroskopu. Pozorování se prováděla pravidelně vždy po uplynutí stejně dlouhého časového intervalu. počet částic absolutní četnost
0 112
1 168
Ověřte pomocí testu 𝜒 2 dobré shody, zda jsou data realizací náhodného výběru z Poissonova rozdělení s parametrem 𝜆 = 1,5.
2 130
3 68
4 32
5 5
6 1
7 1
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 1 Řešení: 1) Náhodná veličina se teoreticky řídí Poissonovým rozdělením: obor
hodnot rozdělíme do šesti tříd, tj. 0 , 1 , 2 , 3 , 4 , 5 𝑎 𝑣í𝑐𝑒
rozsah
výběru 𝑛 = 517
2) Pro jednotlivé třídy se porovnají skutečné četnosti 𝑛𝑖 a teoretické četnosti 𝑛 ∙ 𝜋𝑖 kde 𝑒 −1,5 1,5 𝑖 𝜋𝑖 = 𝑃 𝑋 = 𝑖 = , 𝑝𝑟𝑜 𝑖 = 0, 1, 2, 3, 4 𝑖! 𝜋5 = 𝑃 𝑋 ≥ 5 = 1 − 𝑃 𝑋 ≤ 4 = 1 −
4
𝜋𝑖
𝑖=0
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 1
počet částic
skutečná četnost 𝒏𝒊
0
112
1
168
2
130
3
68
4
32
5 a více
7
𝟐 5 a více 𝒏𝒊 −𝒏∙𝝅𝒊 Srovnání = 𝑖=0 𝒏∙𝝅𝒊 s 5% horním kvantilem 𝜒 2 o 5
𝒏𝒊 − 𝒏 ∙ 𝝅𝒊 𝒏 ∙ 𝝅𝒊
𝟐
𝐻0 : množství zlata v zorném poli mikroskopu je výběr z 𝑃𝑜 𝜆 = 1,5 𝜒2
teoretická četnost 𝒏 ∙ 𝝅𝒊
=
stupních volnosti 𝝌𝟐𝟎,𝟎𝟓 [𝟓] = Z toho vyplývá, že hodnota testové statistiky 𝜒 2 je daleko menší než 5% horní kvantil 𝜒 2 rozdělení. Závěr: hypotézu 𝐻0
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 2 Zadání: Nedokonalost výroby hrací kostky může způsobit, že hra s touto kostkou není spravedlivá. Proto se kostkou několikrát házelo. hodnota kostky četnost výskytu
Je možné prokázat na základě provedených hodů, že hra s touto kostkou je nespravedlivá?
1 979
2 1002
3 1015
4 980
5 1040
6 984
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 2 Řešení:
1)počet hodů 𝑛 = 6 000, je-li kostka spravedlivá, pak pravděpodobnost 1 𝑝𝑖 = , 𝑖 = 1, 2, … , 6 6
2) Otestujeme pomocí testu 𝜒 2 , zda empirické četnosti 𝑛𝑖 , 𝑖 = 1, 2, … , 6 se statisticky významně liší od teoretické četnosti 𝑛 ∙ 𝜋𝑖 , 𝑖 = 1, 2, … , 6
hodnota kostky 𝑛𝑖 𝑛 ∙ 𝜋𝑖 𝑛𝑖 − 𝑛 ∙ 𝜋 𝑖 2 𝑛 ∙ 𝜋𝑖
1 979
2 3 1002 1015
4 980
5 1040
6 984
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 2 hodnota kostky 𝑛𝑖 𝑛 ∙ 𝜋𝑖 𝑛𝑖 − 𝑛 ∙ 𝜋 𝑖 𝑛 ∙ 𝜋𝑖
1
2
3
4
5
6
979 1002 1015 980 1040 984 1000 1000 1000 1000 1000 1000 2
0,441 0,004 0,225 0,400 1,600 0,256
𝐻0 : kostka je spravedlivá (vyvážená)
𝒏𝒊 −𝒏∙𝝅𝒊 𝟐 6 Srovnání = 𝑖=0 = 𝒏∙𝝅𝒊 s 5% horním kvantilem 𝜒 2 o 5
𝜒2
stupních volnosti 𝝌𝟐𝟎,𝟎𝟓 [𝟓] = Z toho vyplývá, že hodnota testové statistiky 𝜒 2 není větší než 5% horní kvantil 𝜒 2 rozdělení. Závěr: hypotézu 𝐻0 Příslušná p-hodnota je 0,7114, tedy vysoká, a to svědčí o tom, že kostka je opravdu spravedlivá.
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 2 𝜒2 𝟐
=
𝒏𝒊 −𝒏∙𝝅𝒊 𝟐 6 𝑖=0 𝒏∙𝝅𝒊
𝝌𝟎,𝟎𝟓 [𝟓]
=
=
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 3 Zadání: Pracuje generátor náhodných čísel z normálního rozdělení chybně? interval 𝑛𝑖 𝑛 ∙ 𝜋𝑖 𝑛𝑖 − 𝑛 ∙ 𝜋 𝑖 𝑛 ∙ 𝜋𝑖
interval 𝑛𝑖 𝑛 ∙ 𝜋𝑖 𝑛𝑖 − 𝑛 ∙ 𝜋 𝑖 𝑛 ∙ 𝜋𝑖
−∞; −2,5
−2,5; −2,0
−2,0; −1,5
−1,5; −1,0
−1,0; −0,5
−0,5; 0,0
4 6,2
18 16,5
30 44,1
93 91,8
156 149,9
210 191,5
0,0; 0,5
0,5; 1,0
1,0; 1,5
1,5; 2,0
2,0; 2,5
2,5; ∞
165 191,5
164 149,9
103 91,8
44 44,1
8 16,5
6 6,2
2
2
8.5 Pearsonův 𝜒 2 test dobré shody – příklad 3
𝐻0 : rozdělení generovaných čísel odpovídá teoretickému normálnímu 𝜒2
𝟐 12 𝒏𝒊 −𝒏∙𝝅𝒊 𝑖=0 𝒏∙𝝅𝒊 2
Srovnání
s 5% horním kvantilem 𝜒 o 11 stupních volnosti 𝝌𝟐𝟎,𝟎𝟓 𝟏𝟏 = Hodnota testové statistiky 𝜒 2 není větší než 5% horní kvantil 𝜒 2 rozdělení.
Závěr: hypotézu 𝐻0
=
=