Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení!
Tomáš Karel - 4ST201
14.11.2013
2
cv.
Program cvičení
1.
Úvod, popisná statistika
2.
Popisná statistika
3.
Míry variability, pravděpodobnost
4.
Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5.
Diskrétní pravděpodobnostní rozdělení
6.
Spojitá pravděpodobnostní rozdělení
7.
TEST – statistické odhady
8.
Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA
9.
Regrese
10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy) 12. Časové řady 13. Indexní analýza
Odchylka rozměru výrobku od požadované hodnoty má normální rozdělení se střední hodnotou 0 mm a se směrodatnou odchylkou 5mm. Jaká musí být šířka intervalu normy (symetrického kolem požadované hodnoty) pro velikost výrobku, aby rozměr výrobku nepřekročil interval s pravděpodobností 0,95?
Hodnoty kvantilů normovaného normálního rozdělení jsou naleznete např. na stránce http://statistika.vse.cz/download/materialy/tabulky.pdf
Náhodná veličina X má normální rozdělení s parametry μ = 10 a
s2 = 25. Určete následující pravděpodobnosti a kvantily: a.) P(X < 5) b.) P(9 < X < 11) c.) P(X > 20) d.) P(X = 5 nebo X = 10 nebo X = 15) e.) x0,975 f.) x0,05
Pravděpodobnost jediné hodnoty (bodu) je u spojitých rozdělení rovna nule.
Nejprve nalezneme v tabulkách kvantil normovaného norm. rozdělení u0,975
Platí:
Po dosazení konkrétních hodnot
5% kvantil normovaného norm. rozdělení u0,05 v tabulkách není
Platí ale, že kvantil u0,05 je roven kvantilu u0,95 až na znaménko, tedy:
Dále pokračujeme obdobně, jako v příkladu 1e)
x 0,05 u 0,05 .5 10 u 0,95 .5 10 1,645.5 10 1,775
Statistické odhady - metody odhadování neznámých parametrů základního souboru na základě informací o charakteristikách náhodného výběru Testování statistických hypotéz –induktivní postupy, které vedou k zamítnutí nebo potvrzení určitých tvrzení (hypotéz) o základním souboru
Biolog, matematik, informatik a statistik jsou na safari. Zastaví džíp a pozorují dalekohledem. •
Biolog: Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! Existují bílé zebry! Budeme slavní!
•
Matematik: Ve skutečnosti pouze víme, že existuje zebra, která je na jedné straně bílá.
•
Informatik: Ale kdepak! To je výjimka!
•
Statistik: To mě nezajímá, není významné. Hypotézu, že bílé zebry neexistují nemůžeme na rozumné hladině významnosti zamítnout!
Základním souborem mohou být např.:
• Domácnosti v ČR. Zkoumaným znakem mohou být např. finanční výdaje domácností za říjen 09. Některými z parametrů tohoto základního souboru mohou být průměrné výdaje (μ ), rozptyl těchto výdajů (σ2) apod. • Velká zásilka konzerv. Zkoumaným znakem muže být např. kvalita konzerv. Jedním z parametrů tohoto základního souboru může být relativní četnost zkažených konzerv (p ) apod. • „Velký“ (příp. nekonečný) soubor hodnot pocházející z jistého pravděpodobnostního rozdělení se střední hodnotou μ a rozptylem σ2 atd.
Výběrovým souborem k základním souborům z předchozího slajdu může být : • 1000 náhodně vybraných domácnosti v ČR. Parametry tohoto výběrového souboru jsou průměrné výdaje ( ), výběrový rozptyl těchto výdajů ( ) v tomto výběrovémsouboru apod. Rozsah výběru je n = 1000. • 100 konzerv náhodně vybraných z celé zásilky. Jedním z parametrů tohoto výběrového souboru je relativní četnost zkažených konzerv (p) v tomto výběrové m souboru. Rozsah výběru je n = 100 • Několik hodnot „tažených“ z jistého pravděpodobnostního rozdělení. Parametrem tohoto výběrového souboru je průměr, rozptyl tohoto výběrového souboru apod.
Bodový odhad
pomocí vhodné výběrové statistiky odhadujeme skutečnou hodnotu parametru rozdělení, ze kterého hodnoty pocházejí
Intervalový odhad
konstruujeme co nejužší interval, který se zvolenou spolehlivostí obsahuje odhadovaný parametr
interval, který s předem danou spolehlivostí bude obsahovat skutečnou hodnotu některého z parametrů základního souboru
Sestrojme nyní interval, ve kterém bude s předem danou pravděpodobností ležet námi hledaný parametr Výběrový průměr (z normálního rozdělení) má následující rozdělení.
Interval je náhodný! Jeho význam je takový, že v (1 – α).100 % případů konstrukce tohoto intervalu (pokud bychom jeho konstrukci mnohokrát opakovali z více výběrů), tento interval v sobě bude zahrnovat skutečnou hodnotu μ . Jeden konkrétní interval skutečnou hodnotu μ buď zahrnuje anebo nezahrnuje. Snižuji-li α , zvyšuji spolehlivost odhadu (pravděpodobnost, že teoretická hodnota bude v intervalu ležet), ale snižuji přesnost odhadu (neboť dostanu širší interval spolehlivosti).