Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení!
Tomáš Karel - 4ST201
15.10.2013
2
cv.
Program cvičení
1.
Úvod, popisná statistika
2.
Popisná statistika
3.
Míry variability, pravděpodobnost
4.
Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5.
Pravděpodobnostní rozdělení
6.
TEST, odhady parametrů
7.
Testování hypotéz
8.
Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA
9.
Regrese
10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy) 12. Časové řady 13. Indexní analýza
Absolutní
◦ Rozptyl – kvadratická odchylka od průměru (Klasický) rozptyl – známe všechny hodnoty všech jednotek
(v každém městě je pouze 10 obyvatel)
n
1 s (x i x) 2 n i 1 2 x
Výběrový rozptyl –
známe pouze některé hodnoty ze souboru (v každém městě je víc jak 10 obyvatel)
1 n s´ (x i x) 2 n 1 i 1 2 x
◦ Směrodatná odchylka – je druhá odmocnina z rozptylu s x nebo s´x ◦ Variační rozpětí
- nejvyšší hodnota mínus nejnižší
R x max x min
Relativní
◦ Variační koeficient –
směrodatná odchylka dělená průměrem
Vx
sx s´ ,nebo V´x x x x
Máme informace o • skupinových četnostech • skupinových průměrech • skupinových rozptylech Celkový průměr
k
x
n x i
i 1
k
s 2x
(x
n
i 1
x) n i
k
n i 1
i
Meziskupinová variabilita
i
s2x s2x s2 k
2
i
i
k
i 1
Celkový rozptyl
ni xi s 2ix
s2
s i 1 k
ix
ni
n i 1
i
Vnitroskupinová variabilita
Pokud místo skupinových absolutních četností ni máme k dispozici skupinové relativní četnosti pi, používáme pro výpočet celkového rozptylu
místo vzorce k
s 2 x
(x i 1
x) n i
i k
ni i 1
k
2
s i 1 k
ix
ni
ni
k
vzorec
s (x i x) pi 2 x
2
i 1
k
2
2 s ix pi i 1
i 1
Výpočet rozptylu z variačního koeficientu a průměru
s2x (Vx x)2
resp. sm. odchylky z variačního koeficintu a průměru
s x Vx x
Obchodní řetězec odebírá určitý výrobek, jehož cena v průběhu roku sezónně kolísá, od dvou stálých dodavatelů (A a B). Průměrná cena za celý rok od dodavatele A je 9 CZK, její směrodatná odchylka činí 2 CZK, od dodavatele A se nakoupilo 1000 kusů. U dodavatele B činí průměrná cena 10 CZK při směrodatné odchylce 1 CZK, nákup od dodavatele B byl 4000 kusů. Určete a.) variační koeficient vyjadřující variabilitu kolísání nákupní ceny během roku souhrnně za oba dva dodavatele dohromady. b.) zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.
xi
ni
s ix2
Výrobce A
9
1 000
22=4
Výrobce B
10
4 000
12=1
Celkový průměr:
x
Meziskupinová variabilita:
k
s 2x
(x i 1
n1x1 n 2 x 2 1000 9 4000 10 9,8 n1 n 2 5000 x) 2 n i
i k
n i 1
Vnitroskupinová variabilita:
(9 9,8) 2 1000 (10 9,8) 2 4000 640 160 8 1000 4000 5000 50
i k
s 2
s i 1 k
ni
n i 1
Celkový rozptyl:
2 ix
22 1000 12 4000 8 5000 5
i
s 2x smeziskup. s vnitroskup. s 2x s 2
Variační koeficient:
8 8 88 1, 76 50 5 50
Vx
sx 1, 76 0,135 x 9,8
B) zjistěte, zda se na celkové variabilitě nákupní ceny větší měrou podílí průběžné sezónní kolísání cen výrobku u jednotlivých dodavatelů v rámci roku nebo zda jsou důležitější rozdíly mezi průměrnými cenami jednotlivých dodavatelů.
protože
8 8 je s 2 s 2x 5 50
Vnitroskupinová variabilita je větší, než meziskupinová
=> Sezónní kolísání cen je důležitější
Soubor o 6 hodnotách má průměr 12 a rozptyl 4,667. Jak se změní průměr a rozptyl souboru, pokud do souboru přibude hodnota 15?
x starý 12 s 2x starý 4, 667 6 x starý 15
6 12 15 x nový 12, 43 7 7 6 7 2 2 2 x 15 x i i 2 s 2x nový i 1 x nový i 1 12, 432 7 7 6 (4, 667 122 ) 152 12, 432 5, 07 7
Náhodný pokus pokus, jehož výsledek se i při dodržení podmínek mění, tj. jehož výsledek závisí na náhodě (např. hod kostkou). Náhodný jev výsledek náhodného pokusu (např. na kostce padla šestka). Náhodný jev budeme značit většinou velkými písmeny, např. A, B atd. Pravděpodobnost náhodného jevu A budeme označovat jako P(A). Jev jistý (označíme např. jako nebo E) Jev, jež nastane vždy, tj. při každém opakování náhod. pokusu (např. na kostce padne nějaké číslo z 1, 2, 3, 4, 5, 6), P() =1 Jev nemožný (označíme jako Ø) Jev, jež nikdy nenastane (např. na kostce padne číslo 7), P(Ø ) = 0
Elementární jev nelze vyjádřit jako sjednocení (viz. další slide) dvou jevů, jež jsou různé od tohoto jevu. Doplňkový (opačný) jev k jevu A (označíme A) Jev jež nastane právě, když nenastane jev A, P( A ) = 1 - P( A )
Jednou hodíme klasickou hrací kostkou. Znázorněte pomocí Vennových diagramů následující jevy: a)
jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček
b)
jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček dělitelných třemi
c)
jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček
d)
jev D spočívající v padnutí více než šesti teček (jev jistý značíme E a jev nemožný Ø)
a)
jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček
b)
jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček dělitelných třemi
c)
jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček
d)
jev D spočívající v padnutí více než šesti teček
KLASICKÁ DEFINICE PRAVDĚPODOBNOSTI ◦ říká, že pravděpodobnost nějakého jevu je rovna podílu počtu výsledků, jež jsou danému jevu příznivé, ku celkovému (konečnému) počtu výsledků, jež jsou apriori stejně pravděpodobné.
STATISTICKÁ DEFINICE PRAVDĚPODOBNOSTI ◦ říká, že pravděpodobnost nějakého jevu je relativní četností výskytu tohoto jevu v souboru o velké velikosti (v limitě blížící se k nekonečnu).
P( A B) P( A) P( B) Příklad nezávislých jevů při hodu dvěma kostkami:
A = na první kostce padne 1, B = na druhé kostce padne 1.
1 1 1 P( A B) P( A) P( B) 6 6 36
Příklad závislých jevů při hodu dvěma kostkami:
A = na první kostce padne 1, B = součet na obou kostkách bude 10. Jev je jevem nemožným (nemůže na první kostce padnou 1 a zároveň být součet 10), proto:
1 3 0 P( A B) P( A) P( B) 6 36
P( A B) P( A) P( B) P( A B)
plocha průniku je při součtu P(A)+P(B) započítána 2x, proto jí musíme 1x odečíst pokud jevy A a B nemají průnik, nazýváme je neslučitelné (disjunktní)
pokud jevy A a B jsou neslučitelné, přechází pravidlo o sčítání PP. na:
P( A B) P( A) P( B)
Příklad neslučitelných jevů při hodu jednou kostkou: A = padne liché číslo B = padne sudé číslo
P(A B) P(A) P(B)
3 3 1 6 6
Příklad jevů, které nejsou neslučitelné při hodu jednou kostkou: A = padne některé z čísel 1, 2, 3 nebo 4 B = padne 4, 5 nebo 6
P(A B) P(A) P(B) P(A B)
4 3 1 1 6 6 6
Jaká je pravděpodobnost, že při hodu dvěma kostkami padne: a) b)
c) d)
e)
na obou kostkách šestka alespoň jedna šestka právě jedna šestka žádná šestka na obou kostkách sudé číslo Jev Jev Jev Jev
A . . . padla šestka na první kostce B . . . padla šestka na druhé kostce C . . . padlo sudé číslo na první kostce D . . . padlo sudé číslo na druhé kostce
Z publikací Českého statistického úřadu byl převzat počet narozených chlapců a děvčat v letech 1990 – 1997. Vypočítejte přibližnou pravděpodobnost, že narozené dítě bude chlapec a přibližnou pravděpodobnost, že narozené dítě bude děvče. Absolutní četnosti Rok
Chlapci
Děvčata
Celkem
1990
67 234
63 860
131 094
1991
66 895
62 955
129 850
1992
62 946
59 196
122 142
1993
62 362
59 108
121 470
1994
54 887
52 028
106 915
1995
49 570
46 827
96 397
1996
46 605
44 158
90 763
1997
46 705
44 225
90 930
Celkem
457 204
432 357
889 561
P(chlapec) 457 204 P(chlapec) 0,514 P(celkem) 889 561 P(dívka) 432 357 P(dívka) 0, 486 P(celkem) 889 561
Na viděnou na příštím cvičení. Pokud jste něčemu nerozuměli, nebo Vám je něco nejasné, zastavte se v konzultačních hodinách nebo mi pošlete e-mail. Rád Vám nejasnosti vysvětlím. Email:
[email protected]