Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení!
Tomáš Karel - 4ST201
14.11.2013
2
cv.
Program cvičení
1.
Úvod, popisná statistika
2.
Popisná statistika
3.
Míry variability, pravděpodobnost
4.
Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5.
Diskrétní pravděpodobnostní rozdělení
6.
Spojitá pravděpodobnostní rozdělení
7.
TEST – statistické odhady
8.
Testování statistických hypotéz
9.
Regrese
10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy) 12. Časové řady 13. Indexní analýza
Byla změřena výška 6 žen s následujícími výsledky 163 cm, 175 cm, 177 cm, 165 cm, 171 cm, 174 cm a.) Nalezněte bodový odhad průměrné výšky žen v celé republice.
b.) Sestrojte 95% oboustranný interval spolehlivosti pro odhad průměrné výšky žen v celé republice. c.) Výšku kolika žen bychom museli změřit, abychom přiíustnou chybu
intervalového odhadu průměrné výšky žen v celé republice snížili pod 1 cm. Předpokládejte, že výška jedné náhodně vybrané ženy má normální rozdělení s neznámou střední hodnotou (tu právě odhadujeme) a s rozptylem stejným jako byl rozptyl výšky jednoho náhodně vybraného muže (z 5. cvičení), neboli 2 = 49..
Bodový odhad průměrné výšky žen v celé republice je 170,83 cm.
Pokud budeme chtít přípustnou chybu odhadu snížit pod 1 cm (s předem zvolenou pravděpodobností 0,95),museli bychom změřit výšku alespoň 189 žen.
Z velké zásilky balení brambůrků Bohemia Chips bylo vybráno 5 balení a byla zjištěna jejich hmotnost. Výsledky jsou: 163 g, 159 g, 161 g, 157 g, 158 g a)
b)
c)
nalezněte bodový odhad pro průměrnou hmotnost jednoho balení v celé zásilce sestrojte 99% oboustranný interval spolehlivosti pro průměrnou hmotnost jednoho balení v celé zásilce odhadněte, kolik váží celá zásilka, pokud víte, že obsahuje 90 balení.
Předpokládejme, že rozdělení hmotnosti balení v zásilce je normální, se známým rozptylem 25.
Z velké zásilky balení s kukuřičnými vločkami jsme vybrali celkem 5 balení a zjistili jsme jejich hmotnost. Zde jsou výsledky: 460 gramů, 520 gramů, 490 gramů, 560 gramů, 510 gramů. a.) Nalezněte bodový odhad pro průměrnou hmotnost jednoho balení v celé zásilce. b.) Sestrojte 99% oboustranný interval spolehlivosti pro průměrnou hmotnost jednoho balení v celé zásilce. c.) Odhadněte, kolik váží celá zásilka pokud víte, že obsahuje celkem 2400 balení. Předpokládejme přitom, že rozdělení hmotností balení v zásilce je normální.
Bodový odhad průměrné hmotnosti zásilky s čokoládovými kuličkami je 508 g.
99% interval spolehlivosti pro hmotnost celé zásilky
Dne 25. a 26. ledna 2013 se v České republice konalo druhé kolo prezidentské volby. V závěrečném duelu se utkal Karel Schwarzenberg se pozdějším vítězem volby Milošem Zemanem. Představme si hypotetickou situaci. 200 náhodně vybraných voličů, po té co vhodilo svůj hlas do urny, bylo dotázáno, koho volilo. 110 z nich odpovědělo, že Miloše Zemana.
Předpokládejme, že odpovědi jsou pravdivé, že vybraný vzorek dotázaných voličů je reprezentativním vzorkem voličů ČR a že k dispozici nejsou žádné jiné dodatečné průzkumy nebo indicie nasvědčující vítězství M. Zemana případně K. Schwarzenberga v daném místě.
a.) Bodově odhadněte podíl voličů Miloše Zemana v kraji Vysočina.
b.) Nalezněte 95% oboustranný interval spolehlivosti pro podíl voličů
Miloše Zemana v kraji Vysočina.
Bodový odhad procentuelního zastoupení voličů, kteří volí M. Zemana v kraji Vysočina je 55%.
Zdroj: idnes.cz
statistická hypotéza je určitý předpoklad o parametrech nebo tvaru určitého rozdělení. test statistické hypotézy = postup, kterým na základě výběrových dat ověřujeme platnost dané hypotézy
A) právní systém demokrat. Státu = presumpce neviny - status quo B) alternat. Hypotéza: vina C) test. Kritériem: počet hlasů poroty D) kritický obor – shoda všech 12 E) náhodný výběr poroty F) závěr – jednomyslný – vinen – zamítnuto H0 -> jednomyslnost – malá pravděpodobnost chybného zamítnutí H0 B) nebyla prokázána vina (potřeba nových dat, výběru) -> není výrok nevinen. Status quo – nevina se nemusí prokazovat – pravděpodobnost chybného výroku velká) - nízká pst. Justičních omylů
Chceme otestovat, zda je mince symetrická (tj. zda orel i hlava padají se stejnou pravděpodobností). Při 150 hodech touto mincí padl 90-krát orel.
Proveďte test hypotézy o symetrii mince na hladině významnosti 1 %.
Mediálně známý ředitel velkého podniku tvrdí, že průměrná mzda v jeho zaměstnanců je 25000 korun. Chceme ověřit toto ředitelovo tvrzení, neboť ho podezíráme, že průměrnou mzdu nadhodnocuje. Zjistili jsme tedy mzdy 49 náhodně vybraných zaměstnanců podniku, a napočetli průměr těchto 49 mezd: 23500 korun, a výběrovou směrodatnou odchylku těchto 49 mezd: 5500 korun. Na 5 % hladině významnosti ověřte, zda je možné na základě těchto údajů zamítnout hypotézu o průměrně mzdě 25000 korun v celém podniku (tj. řečeno neformálně: „vyvrátit tvrzení ředitele“.)
Bylo vybráno 73 polí stejné kvality. Na 38 z nich se zkoušel nový způsob hnojení, zbývajících 35 bylo ošetřeno běžným způsobem. Průměrné výnosy pšenice při novém způsobu hnojení (tzn. průměrné výnosy napočtené z 38 polí pohnojených novým hnojivem) byly 5,3875 tun na hektar a výběrový rozptyl (výnosů napočtený z 38 polí pohnojených novým hnojivem) byl 0,2698. Průměrné výnosy pšenice při běžném způsobu hnojení (tzn. průměrné výnosy napočtené z 35 polí pohnojených běžným hnojivem) byly 4,7 tun na hektar a výběrový rozptyl (výnosů napočtený z 35 polí pohnojených běžným hnojivem) byl 0,24. Je třeba zjistit, zda nový způsob hnojení má vliv na výnosy pšenice.
MODIFIKACE příkladu z: Anděl, J: Statistické metody, 1998, matfyzpress, Vydavatelství Matematicko-fyzikální fakulty UK
Čím více se budou lišit výběrové průměry výnosů u nového a běžného způsobu hnojení, tím „větší je šance“, že nový způsob hnojení má vliv na výnosy.
ROVNOST STŘEDNÍCH HODNOT DVOU ROZDĚLENÍ
Při sledování životnosti nových baterií VTEC 3000 bylo ze souboru 50000 baterií vybráno 30 a u nich byl vypočten průměr 195 dnů. Směrodatná odchylka v základním souboru je známá a její hodnota je 20. Předpokládáme, že životnost baterií se řídí normálním rozdělením. a) b)
c)
sestrojte 95% oboustranný interval spolehlivosti (IS) Vypočtěte, jak se změní IS, pokud zvýšíme rozsah výběru na 100 baterií Jak se změní IS, pokud nebudeme požadovat spolehlivost 95 %, ale 99 %?
Prodejna potravin odebírá uzenářské výrobky od dvou dodavatelů a za důležitou považuje dobu, která uplyne od předání objednávky dodavatelům do okamžiku dodání objednaného zboží. První dodavatel byl testován ve 14 případech, průměrná doba čekání na objednané zboží byla 58 hodin při rozptylu 8,5. U druhého dodavatele uzenin bylo provedeno 11 pozorování, s průměrnou dobou 56 hodin s rozptylem 5. Na hladině významnosti 5 % ověřte hypotézu, zda mezi oběma dodavateli existuje takový rozdíl v rychlosti dodávek uzenin, který by byl pro vedení prodejny potravin podstatný.