c 2007 Kompost
MSI LS 2006/2007 – Ing. Pavla Hošková, Ph.D., 2. test • Jestliže při testování výsledek (hodnota testového kritéria) padne do kritického oboru: a) musíme nově formulovat nulovou hypotézu, b) je třeba vybrat jiný test, c) nelze učinit žádné rozhodnutí, d) zamítneme nulovou hypotézu, e) ani jedna odpověď není správná. • Jestliže při testování výsledek (hodnota testového kritéria) nepadne do oboru přijetí: a) musíme nově formulovat nulovou hypotézu, b) je třeba vybrat jiný test, c) nelze učinit žádné rozhodnutí, d) zamítneme nulovou hypotézu, e) ani jedna odpověď není správná. • Jestliže při testování hodnota testového kritéria padne do oboru přijetí: a) přijmeme nulovou hypotézu, b) je třeba vybrat jiný test, c) nelze učinit žádné rozhodnutí, d) zamítneme nulovou hypotézu, e) ani jedna odpověď není správná. • Jestliže při testování hodnota testového kritéria nepadne do kritického oboru: a) přijmeme nulovou hypotézu, b) je třeba vybrat jiný test, c) nelze učinit žádné rozhodnutí, d) zamítneme nulovou hypotézu, e) ani jedna odpověď není správná. • Obor přijetí je: a) množina, kde se přijímá nulová hypotéza a zamítá hypotéza alternativní, b) chyba II. druhu, c) množina, kde se zamítá nulová hypotéza a přijímá hypotéza alternativní, d) průnik chyby I. druhu a chyby II. druhu, e) ani jedna odpověď není správná. • Wilcoxonův test lze použít jako neparametrickou obdobu: a) F-testu, b) dvouvýběrového t-testu, c) párového testu, d) jednovýběrového testu,
1
c 2007 Kompost
e) ani jedna odpověď není správná. • Dvouvýběrový Wilcoxonův test lze použít jako neparametrickou obdobu: a) F-testu, b) dvouvýběrového t-testu, c) párového testu, d) jednovýběrového testu, e) ani jedna odpověď není správná. • Neparametrická obdoba analýzy rozptylu je: a) Wilcoxon-Whiteův test, b) Wilcoxonův test, c) Kruskal-Wallisův test, d) Dixonův test, e) ani jedna odpověď není správná. • Pro jaký test se ověřuje hypotéza H0 : µd = 0? a) F-test, b) dvouvýběrový t-test, c) párový test, d) Behrens-Fisherův test, e) ani jedna odpověď není správná. • Do jaké skupiny metod řadíme pořadové testy? a) intervalové odhady, b) parameterické testy, c) testy dobré shody, d) neparametrické testy, e) ani jedna odpověď není správná. • Jak velkou chybu II. druhu volíme obvykle při testování? a) 0,05, b) 0,01, c) 0,90, d) neurčuje se, e) ani jedna odpověď není správná. • F-test slouží: a) k testování významnosti rozdílu dvou výběrových rozptylů, b) k testování významnosti rozdílu dvou výběrových průměrů, c) k testování významnosti rozdílu dvou výběrových relativních četností, d) k testování významnosti hodnoty rozptylu, e) ani jedna odpověď není správná.
2
c 2007 Kompost
• Chyba 1. druhu při testování je: a) zamítnutí H0 , i když je tato správná, b) číselné vyjádření hladiny významnosti, c) nazamítnutí H0 , i když není správná, d) vyjádření síly testu, e) ani jedna odpověď není správná. • Chyba 2. druhu při testování je: a) nezamítnutí H0 , i když není správná, b) vyjádření síly testu, c) zamítnutí H0 , i když je tato správná, d) číselné vyjádření hladiny významnosti, e) ani jedna odpověď není správná. • Alternativní hypotéza je: a) vyjádření rozdílu mezi sledovanými jevy, b) číselné vyjádření testovacího kritéria, c) negace nulové hypotézy, d) pravděpodobnost výskytu chyby, e) ani jedna odpověď není správná. • Welchův test lze použít místo: a) párového testu, b) dvouvýběrového t-testu, c) F-testu, d) Behrens-Fisherova testu, e) ani jedna odpověď není správná. • Neparametrické testy se používají: a) když známe typ a parametry rozdělení, b) hodnotíme kvalitativní znaky, c) když neznáme typ a parametry rozdělení, d) máme dostatečný rozsah souboru, e) ani jedna odpověď není správná. • Jestliže snižujeme pravděpodobnost chyby prvního druhu, síla testu, a) se snižuje, b) se zvyšuje, c) nemění se, d) nedá se určit, e) ani jedna odpověď není správná. • Jestliže zvyšujeme pravděpodobnost chyby prvního druhu, síla testu,
3
c 2007 Kompost
a) se snižuje, b) se zvyšuje, c) nemění se, d) nedá se určit, e) ani jedna odpověď není správná. • Pomocí párového testu testujeme: a) shodu rozptylů, b) shodu průměrů, c) shodu diferencí, d) shodu relativních četností, e) ani jedna odpověď není správná. • Ortogonální model představuje model: a) nevyvážený, b) intervalového rozdělení četností, c) vyvážený, d) prostého rozdělení četností, e) ani jedna odpověď není správná. • Testové kritérium je: a) tabulková hodnota příslušného testu, b) veličina vypočítaná z výběrových hodnot, c) číselné vyjádření nulové hypotézy, d) vyjádření rozdílu mezi sledovanými jevy, e) ani jedna odpověď není správná. • Nulová hypotéza je: a) vyjádření rozdílu mezi sledovanými jevy, b) číselné vyjádření testovacího kritéria, c) mezi sledovanými jevy není rozdíl, d) pravděpodobnost výskytu chyby, e) ani jedna odpověď není správná. • Nulová hypotéza je: a) tvrzení, že rozdíl mezi sledovanými jevy neexistuje, b) číselné vyjádření testovacího kritéria, c) tvrzení o nulové pravděpodobnosti výskytu chyby, d) negativní výsledek testu, e) ani jedna odpověď není správná. • Rozdělení testů na dvoustranné a jednostranné je určeno: a) formulací nulové hypotézy,
4
c 2007 Kompost
5
b) volbou hladiny významnosti, c) formulací alternativní hypotézy, d) tabulkovou hodnotou příslušného testu, e) ani jedna odpověď není správná. • Nutná podmínka parametrických testů je: a) dostatečný rozsah souboru, b) normalita rozdělení, c) velká síla testu, d) znalost parametrů, e) ani jedna odpověď není správná. • Pokud chceme ověřit významnost rozdílu dvou průměrů a víme, že soubory jsou závislé, potom použijeme: a) F-test, b) párový t-test, c) F-test a následně t-test, d) pouze t-test, e) ani jedna odpověď není správná. • Znaménkový test lze použít místo: a) F-testu, b) dvouvýběrového t-testu, c) párového testu, d) jednovýběrového t-testu, e) ani jedna odpověď není správná. • Hladina významnosti α znamená: a) pravděpodobnost chyby 1. druhu, b) spolehlivost odhadu, c) chybu 1. druhu, d) pravděpodobnost alternativní hypotézy, e) ani jedna odpověď není správná. • Hladina významnosti α charakterizuje: a) chybu prvního druhu, b) pravděpodobnost chyby druhého druhu, c) chybu druhého druhu, d) pravděpodobnost chyby prvního druhu, e) ani jedna odpověď není správná. • Hypotézu „rozptyly dvou souborů jsou shodnéÿ testujeme pomocí: a) t-testu,
c 2007 Kompost
6
b) Welchova testu, c) F-testu, d) Behrens-Fisherova testu, e) ani jedna odpověď není správná. • Hypotézu „rozptyly dvou souborů jsou shodnéÿ testujeme pomocí: a) t-testu, b) Welchova testu, c) F-testu, d) Behrens-Fisherova testu, e) ani jedna odpověď není správná. • Pro test hypotézy „průměry dvou závislých výběrů jsou shodnéÿ použijeme: a) F-test, b) dvouvýběrový t-test, c) párový test, d) Behrens-Fisherův test, e) ani jedna odpověď není správná. • Složka Sr v analýze rozptylu: a) hodnotí vliv faktoru na sledovaný znak, b) hodnotí vliv náhodných příčin, c) hodnotí vliv interakce v modelu, d) hodnotí vzájemný vztah faktoru a znaku, e) ani jedna odpověď není správná. • Složka S1 v analýze rozptylu: a) hodnotí vliv faktoru na sledovaný znak, b) hodnotí vliv náhodných příčin, c) hodnotí vliv interakce v modelu, d) hodnotí vzájemný vztah faktoru a znaku, e) ani jedna odpověď není správná. • V čem se odlišuje model analýzy rozptylu jednoduchého třídění od modelu analýzy rozptylu dvojného třídění? a) v počtu znaků, b) v počtu opakování, c) v počtu faktorů, d) není mezi nimi rozdíl, e) ani jedna odpověď není správná.
c 2007 Kompost
7
1. (8) Zástupci ekologického hnutí aktivně vystupují proti výstavbě nové elektrárny v oblasti, jejíž životní prostředí je již tak dost poznamenané průmyslovou činností. Jedním z argumentů je mimo jiné nízká porodní váha novorozenců dané oblasti. U 40 náhodně vybraných novorozenců této oblasti naměřili váhu 3010 g. Má smysl, aby použili nižší porodní váhu novorozenců této oblasti jako argumentu proti výstavbě nové elektrárny, když ví, že porodní váha zdravé populace má průměrnou váhu 3300 g a směrodatnou odchylku 476 g? 2. (8) Při zavádění kabelové televize na jednom velkém sídlišti projevilo ze 70 náhodně vybraných domácností – členů bytových družstev zájem o kabelovou televizi 25 domácností a ze 60 domácností obývajících jiné domy než družstevní 18. Ověřte na 5% hladině významnosti, zda je větší zájem o kabelovou televizi u členů bytových družstev. 3. (8) Určitá cestovní kancelář organizuje zahraniční zájezdy podle individuálních přání zákazníků. Z několika minulých let ví, že 30 % všech takto organizovaných zájezdů má za cíl zemi X. Po zhoršení postojů místního obyvatelstva (v oné zemi) k cizincům se obává, že se zájem o tuto zemi mezi zákazníky sníží. Ze 150 náhodně vybraných zákazníků v tomto roce má 38 za cíl právě zemi X. Potvrzují nejnovější data pokles zájmu o onu zemi? 4. (8) Sledovala se spotřeba nafty na 100 ujetých km. Posuďte pomocí neparametrického testu daný soubor. 46,1 28,5
31,8 33,4
30,9 29,6
33,1 24,8
30,5 36,7
32,0 25,4
31,5 33,2
20,2 38,1
33,6 27,9
36,1 39,2
5. (8) Při zavádění kabelové televize na jednom velkém sídlišti se předpokládá zájem 40 % domácností. Ze 70 náhodně vybraných domácností projevilo zájem o kabelovou televizi 25. Soukromá společnost provozující kabelovou televizi nás pověřila ověřením předpokládaného zájmu na 5% hladině významnosti. 6. (8) Pomocí experimentu byly zkoumány rozdíly mezi klávesnicemi tří značek. Experiment, jehož se zúčastnilo 12 osob, spočíval v psaní podobného textu po dobu 10 minut. Přitom se zaznamenával počet slov za minutu. Výsledky jsou zaznamenány v tabulce. Zjistěte pomocí neparametrického testu, zda se průměrný počet slov, dosažený na klávesnicích různých značek, významně liší. Klávesnice A B C
77 67 63
Počet slov 71 74 67 62 63 57 59 59 54
75 60 57
7. (8) U 10 dobrovolníků bylo sledováno, zda určitý typ makrobiotické diety má vliv na snížení hmotnosti. Otestujte, zda dieta má vliv na snížení hmotnosti (α = 0, 05). před dietou po dietě
78 72
58 59
75 74
Hmotnost v kg 64 54 72 69 60 57 70 65
48 49
55 50
59 54
8. (8) Měření intenzity osvětlení školní učebny bylo provedeno dvěma přístroji luxmetr Krochmann a Mavolux. Porovnejte vhodným neparametrickým testem, zda oba luxmetry naměřily stejné hodnoty. Krochmann Mavolux
211 208
247 249
255 251
264 257
273 279
255 261
211 209
242 234
291 283
297 296
9. (8) Dva výběry automobilů byly vybrány pro zjištění počtu ujetých mil v tis. do výměny brzdového obložení. S pomocí neparametrického testu vyhodnoťte, zda existuje rozdíl mezi sérií A a B.
c 2007 Kompost
Série A Série B
8
61 26
30 32
49 22
48 39
41 24
57 28
62 34
49
38
10. (8) Byly sledovány údaje o měsíční spotřebě elektrické energie (kWh) v 25 bytech. Pomocí neparametrického testu popište daný soubor. 169 74 58
108 205 96
26 62 295
43 320 138
114 85 42
68 487
35 120
183 148
103 91
266 18
11. (10) Je porovnáván obsah vitaminu C v mg u tří rozličných způsobů přípravy pomerančového džusu. Z každého způsobu přípravy A až C bylo provedeno pět opakovaných měření obsahu vitaminu. Je obsah vitaminu C závislý na způsobu přípravy? volte α = 0, 05. Způsob A B C
Počet pozorování 5 5 5
Průměr 90 120 78
Bylo vypočteno: S1 = 4680 Sr = 130. Dokončete analýzu (včetně následného vyhodnocení). Volte α = 0, 05. 12. (10) V nedávné době omezila provoz v menším městě továrna, která z větší části zaměstnává pracovníky dojíždějící z okolí. Společnost provozující osobní přepravu se obává, že klesne průměrný počet přepravovaných osob jedním autobusem na určitých linkách. Z tohoto důvodu provedla šetření ve 40 náhodně vybraných autobusech a příslušných linkách v době přepravní špičky s těmito výsledky: Počet cestujících v jednom autobusu Počet případů
25 2
28 4
29 7
34 10
35 6
38 5
40 3
42 2
45 1
Z minulých let je známo, že průměrný počet cestujících v jednom autobusu za srovnatelných podmínek byl 36 osob. V případě, že by se prokázalo, že počet přepravovaných osob klesl, bude přepravní společnost muset omezit provoz. Jak se rozhodne? 13. (10) Při testování spotřeby benzínu určitého typu automobilů při rychlosti 90 km/hod. byly u 20 náhodně vybraných automobilů zjištěny tyto hodnoty (v l/100 km): 6,5 6,3
6,8 6,2
6,7 6,3
6,0 5,9
5,6 5,8
6,6 6,4
5,5 6,5
6,4 6,3
5,5 5,7
6,5 6,1
Výrobce tvrdí, že průměrná spotřeba benzínu (v l/100 km) při rychlosti 90 km za hodinu je 6 (předpokládáme, že daný soubor se řídí normálním rozdělením). 14. (12) V různých lokalitách australského lesa A1 až A5 bylo v nastražených pastích odchytnuto několik divokých králíků. Králíci dosahovali rozličné hmotnosti, uvedené v librách. Ověřte pomocí vhodného neparametrického testu, zda lokalita lesa má vliv na hmotnost chytaných králíků. Lokalita Hmotnost králíků v librách A1 37 40 46 44 A2 29 33 34 31 A3 49 47 46 47 A4 40 38 42 39 A5 50 46 49 47 15. (12) Byla sledována chybovost počítačového programátora. V náhodně vybraných dnech byl počítán počet chyb při sestavování programu u čtyř testovaných programátorů. Zjistěte vhodným neparametrickým testem, zda chybovost testovaných programátorů je shodná, či zda se liší.
c 2007 Kompost
Programátor A B C D
9
14 3 16 16
Počet chyb 16 18 14 5 12 8 17 20 22 18 20 17
22 7 24 21
16. (12) Je třeba zjistit, zda se liší spotřeba automobilu při použití různých druhů benzínu. Zkouší se čtyři typy benzínu lišící se chemickým složením. Testovací jízdy se provádějí se 16 auty stejného modelu tak, že vždy čtyři auta použijí stejný benzín. Výsledky měření spotřeby v l/100 km při jednotlivých jízdách jsou uvedeny v tabulce. Rozhodněte pomocí parametrického testu, zda složení benzínu ovlivňuje jeho spotřebu. Typ A B C D
Počet pozorování 4 4 4 4
Průměr 6,0425 6,1975 5,9550 5,9450
Dále bylo vypočteno: S1 = 0, 16385 Sr = 0, 11515. Dokončete analýzu (včetně následného vyhodnocení). Volte α = 0, 05. 17. (14) Je třeba zjistit, zda se liší spotřeba automobilu při použití různých druhů benzínu. Zkouší se čtyři typy benzínu lišící se chemickým složením. Testovací jízdy se provádějí se 16 auty stejného modelu tak, že vždy čtyři auta použijí stejný benzín. Výsledky měření spotřeby v l/100 km při jednotlivých jízdách jsou uvedeny v tabulce. Rozhodněte pomocí parametrického testu, zda složení benzínu ovlivňuje jeho spotřebu (α = 0, 05). Typ Typ Typ Typ
A B C D
6,10 6,13 5,96 6,08
5,95 6,10 6,00 5,99
6,00 6,11 5,82 5,80
6,12 6,15 6,04 5,91
18. (14) Při normování určitého druhu strojové operace se má rozhodnout, zda je třeba rozlišovat zpracování na jednotlivých strojích. Hodinový výkon těchto strojů značně kolísá vlivem lidské obsluhy a vlivem dalších neodstranitelných příčin. Na náhodně vybraných strojích byly zjištěny hodinové výkony (ks). Na hladině významnosti 0,05 vyšetřete, zda se hodinové výkony na jednotlivých typech strojů významně liší. Stroj 1 2 3 4
Počet pozorování 9 7 9 5
Průměr 670 700 605 805
Dále bylo vypočteno: S1 = 132450
Sr = 174450.
19. (14) Ve 20 úplných rodinách se dvěma dětmi byly sledovány roční výdaje na průmyslové zboží v tis. Kč. Z tohoto počtu bylo 10 domácností zemědělců a 10 domácností dělníků. Pomocí vhodného testu ověřte, zda rozdíly v ročních výdajích za průmyslové zboží mezi oběma sociálními skupinami lze považovat za statisticky významné. Domácnost dělníků zemědělců
46,2 47,2
Roční výdaje rodiny za průmyslové zboží v tis. Kč 52,2 49,5 48,8 50,0 48,2 51,0 47,7 50,7 47,9 40,0 48,6 53,2 50,6 49,2 58,8 51,4
53,2 49,5