ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje více než 2 % nekvalitních výrobků. ……………………………………………………………………………………………………………………………………………………………
Řešení 1 Rozsah výběrového souboru je 𝑛 = 1000. Náhodná veličina 𝑋 slouží ke sledování, je-li výrobek kvalitní či nekvalitní. Daný soubor má tedy alternativní rozdělení s parametrem 𝑝 = 0,026 neboli 𝐴𝑙𝑡(0,026). Víme, že alternativní rozdělení je zvláštním případem binomického rozdělení. V tomto konkrétním případě jde tedy o rozdělení 𝐵𝑖(1000; 0,026). Podle zadání úlohy máme rozhodnout, zda lze s pravděpodobností 0,99 tvrdit, že zásilka obsahuje více než 2 % nekvalitních výrobků. Jde o úlohu, ve které budeme testovat statistickou hypotézu. Podle teorie testu o parametru 𝑝 binomického rozdělení asymptotického formulujeme nulovou a alternativní hypotézu takto: 𝐻0 : 𝑝 = 0,02, 𝐻1 : 𝑝 > 0,02 Podle Moivrovy-Laplaceovy věty pro velké 𝑛 platí 𝑋~𝑁(1000 ∙ 0,026; 1000 ∙ 0,026 ∙ (1 − 0,026)) = 𝑁(26; 25,324) Lze tedy konstatovat, že při platnosti 𝐻0 je náhodná veličina 𝑋 − 1000 ∙ 0,020 𝑋 − 20 𝑋 − 20 𝑈= = = ~𝑁(0,1) 4,427189 √16,6 √1000 ∙ 0,020 ∙ (1 − 0,020) Podle teorie na hladině 𝛼 = 0,01 zamítáme hypotézu 𝐻0 : 𝑝 = 0,02 a přikloníme se k alternativní hypotéze 𝐻1 : 𝑝 > 0,02, pokud 𝛼 |𝑈| ≥ 𝛷−1 (1 − ) 2 Dosadíme do obou stran nerovnice (za 𝑋 v 𝑈 odsadíme jeho střední hodnotu) a dostaneme 26 − 20 0,01 ) | | ≥ 𝛷−1 (1 − 4,427189 2 6 | | ≥ 𝛷−1 (1 − 0,005) 4,427189 |1,355262| ≥ 𝛷−1 (0,995) V tabulce kvantilů normovaného normálního rozdělení vyhledáme příslušnou hodnotu. Dostaneme 1,355262 ≥ 1,645 Je zřejmé, že tato nerovnice neplatí. Zjištěná hodnota testovacího kritéria je v oboru přijetí nulové hypotézy. Není tedy prokázána platnost alternativní hypotézy. Není tedy možné na dané hladině významnosti tvrdit, že v zásilce je více než 2 % nekvalitních výrobků. ……………………………………………………………………………………………………………………………………………………………
∀𝑑∃𝑏
1
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 2 Speciální cvičení na paměťové počítání bylo testováno na 11 žácích. V následující tabulce jsou uvedeny časy v sekundách, za které vyřešili kontrolní úlohy před cvičením a po cvičení. Můžeme tvrdit, že tato cvičení zlepšují schopnost žáků při řešení úloh na hladině α = 0,05? Před cvičením 87, 61, 98, 90, 93, 74, 83, 72, 81, 75, 83 Po cvičení 50, 45, 79, 90, 88, 65, 52, 79, 84, 61, 52 ……………………………………………………………………………………………………………………………………………………………
Řešení 2 Stejnou úlohu jsme už řešili v MV2 – 11 – příklad 2 metodou znaménkového testu. Tentokrát využijeme Wilcoxonův test. Nejprve vypočítáme rozdíly (před minus po) 37, 16, 19, 0, 5, 9, 29, −7, −3, 14, 31 Jednotlivým členům tohoto seznamu přiřadíme pořadí jejich absolutních hodnot. Dostaneme 11, 7, 8, 1, 3, 5, 9, 4, 2, 6, 10 Testujeme nulovou hypotézu (cvičení nemá vliv na schopnost řešení úloh) proti alternativní hypotéze (cvičení má vliv na schopnost řešení úloh). 𝐻0 : 𝑥̃ = 0, 𝐻1 : 𝑥̃ ≠ 0 Vypočteme součet pořadí kladných hodnot rozdílů a součet pořadí záporných hodnot rozdílů. 𝑆 + = 1 + 3 + 5 + 6 + 7 + 8 + 9 + 10 + 11 = 60 𝑆− = 2 + 4 = 6 Podle teorie platí, že pokud min(𝑆 + , 𝑆 − ) < 𝑤𝑛 (𝛼), pak můžeme zamítnout na hladině významnosti 𝛼 nulovou hypotézu. Přitom kritickou hodnotu pravé strany nerovnice nalezneme v tabulce kritických hodnot párového Wilcoxonova testu. Zkusíme do podmínky testu dosadit. Dostaneme min(60, 6) < 𝑤11 (0,05) Neboli 6 < 10 Protože poslední nerovnice je pravdivá, zamítáme nulovou hypotézu na hladině významnosti 0,05. Poznámka Všimněme si, že na hladině významnosti 0,01 bychom nulovou hypotézu nemohli zamítnout, protože 𝑤11 (0,05) = 5. Stanovení hladiny významnosti tedy má zásadní vliv na výsledek úlohy. Poznámka Vrátíme-li se k řešení téže úlohy v MV2 – 11 – Příklad 2, vidíme, že jsme dostali rozdílné výsledky obou testů. Znaménkový test nemá dostatek informací pro zamítnutí nulové hypotézy, protože využívá pouze počtu záporných hodnot, zatímco u Wilcoxonova testu využijeme navíc znalosti toho, že záporné hodnoty jsou poměrně malé. Říkáme, že Wilcoxonův test je silnější než znaménkový test. ……………………………………………………………………………………………………………………………………………………………
∀𝑑∃𝑏
2
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 3 V průběhu deseti za sebou jdoucích dnů si pacient měřil 10 krát tep. Můžeme na základě těchto měření prohlásit, že medián naměřených hodnot je roven 75 tepům? Hodnoty jednotlivých měření byly 76, 76, 74, 77, 79, 81, 83, 67, 65, 90 ……………………………………………………………………………………………………………………………………………………………
Řešení 3a Úlohu budeme řešit pomocí jednovýběrového Wilcoxonova testu asymptotického na hladině významnosti 0,05. Chceme testovat hypotézu 𝐻0 : 𝑥̃ = 75 proti alternativní hypotéze 𝐻1 : 𝑥̃ ≠ 75. Pokud by medián hodnoty tepů byl 75, pak vypočteme následující hodnoty 𝑌𝑖 = 𝑋𝑖 − 75, kde 𝑋𝑖 jsou výsledky jednotlivých měření, takto seřazeny podle velikosti jejich absolutní hodnoty. 1, 1, −1, 2, 4, 6, 8, −8, −10, 15 Vypočteme součet pořadí kladných hodnot z tohoto seznamu. Dostaneme 𝑆 = 1 + 2 + 4 + 5 + 6 + 7 + 10 = 35 Vypočteme statistiku, která má za platnosti hypotézy 𝐻0 : 𝑥̃ = 75 asymptoticky normované normální rozdělení. Takovou statistikou je (ihned dosadíme) 𝑛 ∙ (𝑛 + 1) 10 ∙ (10 + 1) 10 ∙ 11 110 𝑆− 35 − 35 − 35 − 4 4 4 4 𝑈= = = = √𝑛 ∙ (𝑛 + 1) ∙ (2𝑛 + 1) √10 ∙ (10 + 1) ∙ (2 ∙ 10 + 1) √10 ∙ 11 ∙ 21 √2310 24 24 24 24 35 − 27,5 7,5 = = = 0,764471 9,810708 √96,25 Na hladině 𝛼 zamítáme hypotézu 𝐻0 : 𝑥̃ = 75 a přikloníme se k alternativní hypotéze 𝐻1 : 𝑥̃ ≠ 75, pokud 0,05 |𝑈| ≥ 𝛷−1 (1 − ) 2 Hodnotu z pravé strany nalezneme v tabulce kvantilů normovaného normálního rozdělení 𝑁(0, 1). Dostaneme |0,764471| = 0,764471 ≥ 1,960 Je zřejmé, že poslední nerovnost neplatí. Nemůžeme tedy zamítnout nulovou hypotézu.
Řešení 3b Úlohu budeme řešit pomocí jednovýběrového Wilcoxonova testu asymptotického na hladině významnosti 0,05. Chceme testovat hypotézu 𝐻0 : 𝑥̃ = 75 proti alternativní hypotéze 𝐻1 : 𝑥̃ ≠ 75. Pokud by medián hodnoty tepů byl 75, pak vypočteme následující hodnoty 𝑌𝑖 = 𝑋𝑖 − 75, kde 𝑋𝑖 jsou výsledky jednotlivých měření, takto seřazeny podle velikosti jejich absolutní hodnoty. 1, 1, −1, 2, 4, 6, 8, −8, −10, 15 Vypočteme dále součet pořadí kladných hodnot a součet pořadí záporných hodnot z tohoto seznamu. 𝑆 + = 35, 𝑆 − = 20 Podle teorie platí, že pokud min(𝑆 + , 𝑆 − ) < 𝑤𝑛 (𝛼), pak můžeme zamítnout na hladině významnosti 𝛼 nulovou hypotézu. Přitom kritickou hodnotu pravé strany nerovnice nalezneme v tabulce kritických hodnot párového Wilcoxonova testu. Zkusíme do podmínky testu dosadit. Dostaneme min(35, 20) < 𝑤10 (0,05) Neboli 20 < 8 Protože poslední nerovnice je nepravdivá, nemůžeme na dané hladině nulovou hypotézu zamítnout. …………………………………………………………………………………………………………………………………………………………… ∀𝑑∃𝑏
3
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 4 Označme 𝑝 pravděpodobnost, že při hodu danou hrací kostkou padne šestka. Testujme nulovou hypotézu (šestka padne v jedné šestině případů) proti alternativní hypotéze (šestka nepadne v jedné šestině případů) 1 1 𝐻0 : 𝑝 = , 𝐻1 : 𝑝 ≠ 6 6 Testování provedeme na hladině 0,05 základě pokusu, v němž ze sto dvaceti hodů padla šestka: a) dvacet devětkrát, b) dvacet osmkrát, c) devětkrát. ……………………………………………………………………………………………………………………………………………………………
Řešení 4 Označme 𝑋 zaznamenaný počet šestek v sérii 120 hodů. Veličina 𝑋 má rozdělení 𝐵𝑖(𝑝, 120). 1
Předpokládáme, že hypotéza 𝐻0 je správná, neboli že 𝑝 = 6 . Uvědomme si, že jde o oboustranný případ, neboli hladinu významnosti 𝛼 = 0,05 musíme brát na obou stranách poloviční. Potom nalezneme pravděpodobnosti v bezprostředním okolí poloviční hladiny významnosti (řešíme oboustranný případ). To může být trochu pracnější. Nakonec ale nalezneme 𝑃(𝑋 ≤ 11) = 0,014, 𝑃(𝑋 ≤ 12) = 0,027 𝑃(𝑋 ≥ 28) = 0,037, 𝑃(𝑋 ≥ 29) = 0,022 To znamená, že kritické hodnoty rozdělení 𝐵𝑖(1⁄6 , 120), jimiž se veličina 𝑋 řídí za předpokladu, že nulová hypotéza je správná jsou 𝛼 0,05 𝛼 0,05 𝑘1 = 𝑘1 ( ) = 𝑘1 ( ) = 𝑘1 (0,025) = 11, 𝑘2 = 𝑘2 ( ) = 𝑘2 ( ) = 𝑘2 (0,025) = 29 2 2 2 2 Rozhodnutí o tom, zda hypotézu zamítneme či nikoliv závisí na empiricky zaznamenaném počtu šestek v sérii. Konkrétně pro jednotlivé zadané případy: a) Šestka hozená ve 29 případech ze 120 je kritickou hodnotou zkoumaného rozdělení těsně za hladinou významnosti. Proto se v tomto případě nulová hypotéza zamítá na hladině významnosti 𝛼 = 0,05. b) Šestka hozená ve 28 případech ze 120 leží v intervalu kritických hodnot. Proto se v tomto případě nulová hypotéza nezamítá 𝛼 = 0,05. c) Šestka hozená v 9 případech ze 120 leží mimo interval kritických hodnot. Proto se v tomto případě nulová hypotéza zamítá 𝛼 = 0,05. Poznámka Formulace „hypotéza se zamítá na hladině významnosti 𝛼 “ znamená, že skutečná hladina významnosti testu, tedy pravděpodobnost, s níž může dojít k zamítnutí správné hypotézy, je menší než 𝛼 . Hladinu významnosti nemůžeme volit extrémně malou, protože jinak by příslušný test měl jen velmi malou sílu. Na druhou stranu případné zamítnutí nulové hypotézy má mnohem větší váhu, jestliže víme, že pravděpodobnost zamítnutí správné hypotézy je dokonce menší než 0,01 či 0,001. Z těchto důvodů může být zajímavé vědět, zda se nulová hypotéza bude zamítat i na hladině významnosti 𝛼 = 0,01. V tomto případě jsou kritickými hodnotami 9 a 32. Tudíž v případě a) se nulová hypotéza nezamítá (přestože byla zamítnuta na hladině významnosti 0,05). V případě b) se nulová hypotéza nezamítá a v případě c) se zamítá. Pro hladinu významnosti 0,001 jsou kritickými hodnotami 7 a 35. …………………………………………………………………………………………………………………………………………………………… ∀𝑑∃𝑏
4
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 5 Označme 𝑝 pravděpodobnost, že při hodu danou hrací kostkou padne šestka. Existuje podezření, že tato kostka je záměrně vyrobena tak, aby šestka padala častěji než ostatní hodnoty. Testujme hypotézu, že tomu tak není, a to na základě pokusu, v němž ze sto dvaceti hodů padla šestka dvacet osmkrát. ……………………………………………………………………………………………………………………………………………………………
Řešení 5 Budeme testovat nulovou hypotézu (šestka padne právě v jedné šestině pokusů) proti jednostranné alternativě (šestka padne častěji než v jedné šestině pokusů). 1 1 𝐻0 : 𝑝 = , 𝐻1 : 𝑝 > 6 6 Zvolíme hladinu významnosti 𝛼 = 0,05. Hypotézu zamítneme tehdy, když zaznamenaný počet šestek X je příliš veliký (větší než kritická hodnota). Malý počet šestek nyní důvodem k zamítnutí hypotézy není. Kritická hodnota 𝑘2 pro test naší hypotézy je nejmenší nezáporné celé číslo takové, že 1 𝑃 (𝑋 ≥ 𝑘2 |𝑝 = ) < 0,05 6 Po troše práce zjistíme, že 𝑘2 = 28 Nulová hypotéza se tedy proti alternativní hypotéze zamítá na hladině významnosti 0,05. Poznámka Všimněme si, že v této jednostranné variantě byla nulová hypotéza zamítnuta, přestože v oboustranné variantě téže úlohy (vit předchozí příklad) by zamítnuta nebyla. Vidíme, že zúžením oboustranné alternativy na jednostrannou se zvýšila síla testu. ……………………………………………………………………………………………………………………………………………………………
∀𝑑∃𝑏
5
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 6 Pěstujeme hrách s bílými a fialovými květy. Podle druhého Mendelova zákona je pravděpodobnost 𝑝, že rostlina vykvete fialově, rovna 3⁄4 . Testujme platnost tohoto zákona na základě pokusu, v němž ze čtyřiceti náhodně vybraných rostlin jich fialově vykvetlo třicet pět. ……………………………………………………………………………………………………………………………………………………………
Řešení 6 Testujeme nulovou hypotézu (fialově vykvetou tři čtvrtiny rostlin) proti alternativní hypotéze (fialově pokvete jiné množství než tři čtvrtiny rostlin). 3 3 𝐻0 : 𝑝 = , 𝐻1 : 𝑝 ≠ 4 4 Dle zadání je zřejmé, že náhodná veličina 𝑋, se kterou budeme pracovat, má za předpokladu platnosti nulové hypotézy rozdělení 𝐵𝑖(3⁄4 , 120). Zvolíme hladinu významnosti 𝛼 = 0,05. Jasně vidíme, že jde o oboustranná případ. Budeme tedy hledat kritické hodnoty 𝑘1 , 𝑘2 pro test naší hypotézy jako největší (pro 𝑘1 ) a nejmenší (pro 𝑘2 ) nezáporná celá čísla taková, že 𝛼 𝛼 3 3 𝑃 (𝑋 ≤ 𝑘1|𝑝 = 4) < , 𝑃 (𝑋 ≥ 𝑘2 |𝑝 = 4) > 1 − 2 2 Kritické hodnoty budeme hledat pomocí výpočtu pravděpodobností dle daného rozdělení s jejich následným sčítáním. Přitom využijeme vzorec 𝑛 𝑃(𝑋 = 𝑖) = ( ) ∙ 𝑝𝑖 ∙ (1 − 𝑝)𝑛−𝑖 𝑖 Výpočet můžeme velmi snadno realizovat třeba pomocí tabulky v MS Excel. n
i 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40
∀𝑑∃𝑏
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
p 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75
n_i
p˄i
1 40 780 9880 91390 658008 3838380 18643560 76904685 2,73E+08 8,48E+08 2,31E+09 5,59E+09 1,2E+10 2,32E+10 4,02E+10 6,29E+10 8,87E+10 1,13E+11 1,31E+11 1,38E+11 1,31E+11 1,13E+11
1 0,75 0,5625 0,421875 0,316406 0,237305 0,177979 0,133484 0,100113 0,075085 0,056314 0,042235 0,031676 0,023757 0,017818 0,013363 0,010023 0,007517 0,005638 0,004228 0,003171 0,002378 0,001784
(1-p)˄(n-i) 8,27181E-25 3,30872E-24 1,32349E-23 5,29396E-23 2,11758E-22 8,47033E-22 3,38813E-21 1,35525E-20 5,42101E-20 2,1684E-19 8,67362E-19 3,46945E-18 1,38778E-17 5,55112E-17 2,22045E-16 8,88178E-16 3,55271E-15 1,42109E-14 5,68434E-14 2,27374E-13 9,09495E-13 3,63798E-12 1,45519E-11
P(x=i) 8,27181E-25 9,92617E-23 5,80681E-21 2,20659E-19 6,12328E-18 1,32263E-16 2,3146E-15 3,3727E-14 4,17372E-13 4,45197E-12 4,14033E-11 3,38754E-10 2,45597E-09 1,58693E-08 9,18154E-08 4,7744E-07 2,238E-06 9,47859E-06 3,63346E-05 0,000126215 0,000397577 0,001135934 0,002943103
P(x<=i) 8,27181E-25 1,00089E-22 5,9069E-21 2,26566E-19 6,34984E-18 1,38613E-16 2,45321E-15 3,61802E-14 4,53552E-13 4,90552E-12 4,63088E-11 3,85063E-10 2,84103E-09 1,87104E-08 1,10526E-07 5,87966E-07 2,82597E-06 1,23046E-05 4,86392E-05 0,000174854 0,000572431 0,001708365 0,004651468 6
ŘEŠENÉ PŘÍKLADY Z MV2 n
i 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40 40
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
ČÁST 12 p 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75
n_i 8,87E+10 6,29E+10 4,02E+10 2,32E+10 1,2E+10 5,59E+09 2,31E+09 8,48E+08 2,73E+08 76904685 18643560 3838380 658008 91390 9880 780 40 1
p˄i 0,001338 0,001003 0,000753 0,000564 0,000423 0,000317 0,000238 0,000179 0,000134 0,0001 7,53E-05 5,65E-05 4,24E-05 3,18E-05 2,38E-05 1,79E-05 1,34E-05 1,01E-05
(1-p)˄(n-i) 5,82077E-11 2,32831E-10 9,31323E-10 3,72529E-09 1,49012E-08 5,96046E-08 2,38419E-07 9,53674E-07 3,8147E-06 1,52588E-05 6,10352E-05 0,000244141 0,000976563 0,00390625 0,015625 0,0625 0,25 1
P(x=i) 0,006909893 0,014683523 0,028192364 0,048794476 0,075902518 0,105721365 0,131240315 0,144364346 0,139707432 0,117878146 0,085729561 0,052950611 0,027231743 0,011346559 0,003679965 0,000871571 0,000134088 1,00566E-05
P(x<=i) 0,011561361 0,026244884 0,054437248 0,103231724 0,179134242 0,284855607 0,416095922 0,560460268 0,7001677 0,818045846 0,903775407 0,956726017 0,98395776 0,99530432 0,998984285 0,999855856 0,999989943 1
Řádky s kritickými hodnotami jsou podbarveny oranžově. Nalezli jsme tedy kritické hodnoty 𝑘1 = 23, 𝑘2 = 35 Fialově vykvetlo 35 rostlin. To je právě kritická hodnota ležící již mimo stanovenou hladinu významnosti. Hypotéza se na hladině významnosti 𝛼 = 0,05 proto zamítá. ……………………………………………………………………………………………………………………………………………………………
∀𝑑∃𝑏
7
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 7 Realizace náhodného výběru byla roztříděna následovně: Třída Třída 𝒏𝒊 1 1,0–1,5 1 4 2 1,5–2,0 4 5 3 2,0–2,5 5 6
2,5–3,0 3,0–3,5 3,5–4,0
𝒏𝒊 6 6 18
Ověřte, zda realizace pochází z rozdělení s hustotou 2 𝑓(𝑥) = (𝑥 − 1) pro 𝑥 ∈ 〈1, 4〉 9 Riziko přípustného omylu je maximálně 5%. ……………………………………………………………………………………………………………………………………………………………
Řešení 7 Budeme na hladině významnosti 𝛼 = 0,05 testovat hypotézu 𝐻0 ∶ 𝑋~𝑓(𝑥) 𝑝𝑟𝑜𝑡𝑖 ℎ𝑦𝑝𝑜𝑡é𝑧𝑒 𝐻 ∶ 𝑋 ≁ 𝑓(𝑥) 2 Použijeme 𝜒 -test dobré shody. Sestavíme tabulku Třída 𝒏𝒋 𝒑𝒋 𝒏𝒑𝒋 1 2 3 4 5 6 Součet
1,0-1,5 1,5-2,0 2,0-2,5 2,5-3,0 3,0-3,5 3,5-4,0 x
1 4 5 6 6 18 40
0,027778 0,083333 0,138889 0,194444 0,25 0,305556 1
1,111111 3,333333 5,555556 7,777778 10 12,22222 40
𝟐
(𝒏𝒋 − 𝒏𝒑𝒋 ) 𝒏𝒑𝒋 0,011111 0,133333 0,055556 0,406349 1,6 2,731313 4,937662
První sloupec je pro identifikaci jednotlivých tříd. Druhý sloupec uvádí hozené hodnoty v příslušné třídě. Třetí sloupec je pro zadání četnosti výskytu výsledku v realizaci náhodného pokusu. Čtvrtý sloupec je teoretická četnost dle testovaného rozdělení (v tomto případě je třeba je vypočítat). Pátý sloupec je součinem teoretické četnosti s celkovým počtem realizovaných pokusů. Poslední šestý sloupec je hodnotou Pearsonovy statistiky pro příslušnou třídu. Poslední řádek je určen pro součty (kontrolní a výsledné). Hodnoty ve čtvrtém sloupci jsme vypočítali integrací hustoty takto (𝑑𝑗 je dolní hranice j-té třídy): 𝑑𝑗 +0,5
𝑝𝑗 = ∫ 𝑑𝑗
𝑑 +0,5
𝑗 2 2 𝑥2 (𝑥 − 1) 𝑑𝑥 = ∙ [ − 𝑥] 9 9 2 𝑑 𝑗
2
𝑑𝑗 2 2 (𝑑𝑗 + 0,5) = [( − (𝑑𝑗 + 0,5)) − ( − 𝑑𝑗 )] 9 2 2
2
𝑑𝑗 2 𝑑𝑗 − 0,75 2 𝑑𝑗 + 𝑑𝑗 + 0,25 2 𝑑𝑗 + 0,25 − 1 = [ − 𝑑𝑗 − 0,5 − + 𝑑𝑗 ] = [ ]= 9 2 2 9 2 9 Dosazením dolních hranic do posledního výrazu jsme vypočítali potřebné pravděpodobnosti. Hodnota vpravo dole je realizací 𝑡 testové statistiky 6
(𝑛𝑗 − 𝑛𝑝𝑗 ) 𝑇=∑ 𝑛𝑝𝑗
2
𝑗=1
Konkrétně v našem případě máme 𝑡 = 4,937662 ∀𝑑∃𝑏
8
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Kritický obor 𝑊 pro Pearsonův test dobré shody na hladině významnosti 𝛼 = 0,05 je 𝑊 = {𝑡; 𝑡 > 𝜒 2 (𝑘 − 𝑚 − 1; 1 − 𝛼)} Zde 𝑘 = 6 je počet tříd, 𝑚 = 0 je počet neznámých parametrů. Potřebnou hodnotu vyhledáme v tabulkách. 𝑊 = {𝑡; 𝑡 > 𝜒 2 (6 − 0 − 1; 1 − 0,05)} = {𝑡; 𝑡 > 𝜒 2 (5; 0,95)} = {𝑡; 𝑡 > 11,07} Protože 𝑡 ∉ 𝑊, nezamítáme na hladině významnosti 0,05 hypotézu 𝐻0 ∶ 𝑋~𝑓(𝑥). Realizace pochází z rozdělení s uvedenou hustotou. Riziko omylu je 5%. ……………………………………………………………………………………………………………………………………………………………
∀𝑑∃𝑏
9
ŘEŠENÉ PŘÍKLADY Z MV2
ČÁST 12
Příklad 8 Realizace náhodného výběru byla roztříděna následovně: Třída Třída 𝒏𝒊 1 0,0–0,1 0 6 2 0,1–0,2 0 7 3 0,2–0,3 0 8 4 0,3–0,4 1 9 5 0,4–0,5 1 10
0,5–0,6 0,6–0,7 0,7–0,8 0,8–0,9 0,9–1,0
𝒏𝒊 2 6 35 60 95
Ověřte na hladině významnosti 0,05, zda realizace pochází z rozdělení s hustotou 𝑓(𝑥) = 𝑎𝑥 2 pro 𝑥 ∈ 〈0, 1〉 ……………………………………………………………………………………………………………………………………………………………
Řešení 8 Budeme na hladině významnosti 𝛼 = 0,05 testovat hypotézu 𝐻0 ∶ 𝑋~𝑓(𝑥) 𝑝𝑟𝑜𝑡𝑖 ℎ𝑦𝑝𝑜𝑡é𝑧𝑒 𝐻 ∶ 𝑋 ≁ 𝑓(𝑥) Použijeme 𝜒 2 -test dobré shody. Sestavíme tabulku Třída 𝒏𝒋 𝒑𝒋 𝒏𝒑𝒋 1 2 3 4 5 6 7 8 9 10 Součet
0,0–0,1 0,1–0,2 0,2–0,3 0,3–0,4 0,4–0,5 0,5–0,6 0,6–0,7 0,7–0,8 0,8–0,9 0,9–1,0 x
0 0 0 1 1 2 6 35 60 95 200
0,001 0,007 0,019 0,037 0,061 0,091 0,127 0,169 0,217 0,271 1
0,2 1,4 3,8 7,4 12,2 18,2 25,4 33,8 43,4 54,2 200
𝟐
(𝒏𝒋 − 𝒏𝒑𝒋 ) 𝒏𝒑𝒋 0,2 1,4 3,8 5,535135 10,28197 14,41978 14,81732 0,042604 6,349309 30,71292 87,55903
První sloupec je pro identifikaci jednotlivých tříd. Druhý sloupec uvádí hozené hodnoty v příslušné třídě. Třetí sloupec je pro zadání četnosti výskytu výsledku v realizaci náhodného pokusu. Čtvrtý sloupec je teoretická četnost dle testovaného rozdělení (v tomto případě je třeba je vypočítat). Pátý sloupec je součinem teoretické četnosti s celkovým počtem realizovaných pokusů. Poslední šestý sloupec je hodnotou Pearsonovy statistiky pro příslušnou třídu. Poslední řádek je určen pro součty (kontrolní a výsledné). Abychom mohli vypočítat teoretické hodnoty pravděpodobnosti do čtvrtého sloupce, musíme nejprve určit hodnotu konstanty 𝑎 v předpisu hustoty. Musí platit: 1
1
1
𝑥3 𝑥3 13 0 3 1 0 1 1 𝑎 1 = ∫ 𝑎𝑥 𝑑𝑥 = [𝑎 ] = 𝑎 [ ] = 𝑎 [ − ] = 𝑎 [ − ] = 𝑎 [ − 0] = 𝑎 ∙ = 3 0 3 0 3 3 3 3 3 3 3 2
0
Odtud 𝑎=3 Nyní víme, že daná hustota má tvar 𝑓(𝑥) = 3𝑥 2 pro 𝑥 ∈ 〈0, 1〉 Hodnoty ve čtvrtém sloupci jsme vypočítali integrací hustoty takto (𝑑𝑗 je dolní hranice j-té třídy): ∀𝑑∃𝑏
10
ŘEŠENÉ PŘÍKLADY Z MV2 𝑑𝑗 +0,1
𝑝𝑗 = ∫ 𝑑𝑗
ČÁST 12 𝑑 +0,1
𝑥3 𝑗 3𝑥 𝑑𝑥 = [3 ] 3 𝑑 2
𝑑 +0,1
= [𝑥 3 ]𝑑𝑗 𝑗
= 𝑑𝑗 3 + 0,3𝑑𝑗 2 + 0,03𝑑𝑗 + 0,0,01 − 𝑑𝑗 3
𝑗
2
= 0,3𝑑𝑗 + 0,03𝑑𝑗 + 0,001 Dosazením dolních hranic do posledního výrazu jsme vypočítali potřebné pravděpodobnosti. Hodnota vpravo dole je realizací 𝑡 testové statistiky 6
(𝑛𝑗 − 𝑛𝑝𝑗 ) 𝑇=∑ 𝑛𝑝𝑗
2
𝑗=1
Konkrétně v našem případě máme 𝑡 = 87,55903 Kritický obor 𝑊 pro Pearsonův test dobré shody na hladině významnosti 𝛼 = 0,05 je 𝑊 = {𝑡; 𝑡 > 𝜒 2 (𝑘 − 𝑚 − 1; 1 − 𝛼)} Zde 𝑘 = 10 je počet tříd, 𝑚 = 0 je počet neznámých parametrů. Potřebnou hodnotu vyhledáme v tabulkách. 𝑊 = {𝑡; 𝑡 > 𝜒 2 (10 − 0 − 1; 1 − 0,05)} = {𝑡; 𝑡 > 𝜒 2 (9; 0,95)} = {𝑡; 𝑡 > 16,92} Protože 𝑡 ∈ 𝑊, zamítáme na hladině významnosti 0,05 hypotézu 𝐻0 ∶ 𝑋~𝑓(𝑥). Realizace nepochází z rozdělení s uvedenou hustotou. Riziko omylu je 5%. ……………………………………………………………………………………………………………………………………………………………
∀𝑑∃𝑏
11