Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení!
Tomáš Karel - 4ST201
24.10.2013
2
cv.
Program cvičení
1.
Úvod, popisná statistika
2.
Popisná statistika
3.
Míry variability, pravděpodobnost
4.
Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5.
Pravděpodobnostní rozdělení
6.
TEST, odhady parametrů
7.
Testování hypotéz
8.
Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA
9.
Regrese
10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy) 12. Časové řady 13. Indexní analýza
V tombole na maturitním večírku je celkem 120 lístků. Výherních jich je 36. Z osudí vytahujeme celkem 5 lístků, přičemž vždy lístek vracíme zpět (výběr s vracením): A) nevyhraji žádnou cenu, B) vyhraji právě jednu cenu C) vyhraji alespoň jednu cenu D) všech 5 zakoupených lístků bude výherních
N = 120 M = 36
M 36 0,3 N 120
Praha a vraždy – 2011 ZDE 29 vražd za rok 3 vraždy za tento týden !!! -> Co se to děje ?
Co je „náhodné“?
Počet vražd v Praze 29/rok -> 0,56/týden 0,017 -> jednou za 59 týdnů
Týden bez jediné vraždy -> 0,57
2/3 oslavy v jeden den 2 mizerní řidiči během několika minut 5 lidí s vámi bude jednat neurvale v jeden den 3 telefonní omyly během jednoho večera Po 25 minutách čekání 3 autobusy za sebou
Udává pravděpodobnost výskytu náhodného jevu v určitém časovém intervalu Mají ho například ◦ Veličiny, které představují výskyt x událostí v pevném časovém intervalu, přičemž události musejí nastávat nezávisle od okamžiku poslední události ◦ veličiny, které mají rozdělení binomické a zároveň počet pozorování velký (n>30) a п je malé (п<0,1)
pravděpodobnostní funkce
P( x)
x x!
střední hodnota
E(X)
rozptyl
D(X)
e
Poissonovo rozdělení mají např. následující 2 typy náhodných veličin: 1.) Veličiny, které mají rozdělení binomické a zároveň parametr n tohoto binomického rozdělení je velký (n>30) a parametr p tohoto binomického rozdělení je malý (p<0,1). Takováto binomická veličina má přibližně také Poissonovo rozdělení, přičemž pro parametr l tohoto Poissonova rozdělení platí = np. 2.) Veličiny, jež představují výskyt x událostí v pevném časovém (případně plošném, prostorovém) intervalu, pokud známe průměrný počet událostí l, které v tomto intervalu nastávají. Navíc události musejí nastávat nezávisle od okamžiku (případně místa výskytu) poslední události.
P( x)
x x!
e
E(X) D(X)
Při kontrole účetních dokladů v určitém velkém průmyslovém podniku auditor, ze zkušenosti ví, že lze předpokládat formální chyby u 2 % účetních dokladů. Jestliže ze souboru účetních dokladů jich auditor vybere 100, jaká je pravděpodobnost, že
a) mezi nimi budou právě 2 chybné? b) ani jeden chybný? c) maximálně dva chybné?
Učebnice (2.6 / str. 102, neřešený)
Student ze zkušenosti ví, že v době od 15:00 do 19:00 obdrží v průměru 3 SMSky od svých kamarádů. Dnes měl v době od 16:00 do 18:00 rozbitý mobil. a.) Jaká je pravděpodobnost, že mu kamarádi během těchto dvou hodin neposlali žádnou SMS? b.) Jaká je střední hodnota a rozptyl počtu náhodné veličiny „počet příchozích SMSek v době od 16:00 do 18:00“?
Modifikace příkladu z učebnice (2.7 / str. 103, neřešený)
Na povrchu skla se v průměru vyskytuje 5 kazů na metr čtvereční. Jaká je pravděpodobnost, že na skleněné desce o ploše 2 metry čtvereční bude přesně 7 kazů?
Pravděpodobnost, že na 2 m2 bude přesně 7 kazů je 0,09.
máme-li soubor N jednotek, z nichž M má určitou vlastnost a ze souboru vybíráme bez vracení n jednotek ( x výběr s vracením binomické rozdělení)
pravděpodobnostní funkce
střední hodnota
rozptyl
M N M x nx P( x) N n
E(X) n
M N
M M Nn D(X) n 1 N N N 1
V osudí je 30 míčků modrých a 20 červených. Náhodně vybereme 10 míčků. Jaká je pravděpodobnost, že mezi vybranými míčky bude právě 6 červených, jestliže: a)
b)
vybíráme s vracením vybíráme bez vracení?
a)
vybíráme s vracením (-> binomické rozdělení) 6 10 6 10 n x 2 2 P(x) (1 ) n x 1 0,111 x 6 5 5
b)
vybíráme bez vracení? (-> hypergeometrické rozdělení)
Výběr bez vracení z malého (!!) osudí. V „osudí“ je M prvků s danou vlastností a N – M prvků bez této vlastnosti. Vybíráme celkem n objektů a ptáme se, jaká je pravděpodobnost, že prvků s danou vlastností jsme vybrali právě x.
n = 10;
N = 50;
M = 20;
x=6
M N M 20 50 20 x n x 6 10 6 0,103 P(x) N 50 n 10
Určitý typ součástek je dodáván v sériích po 100 kusech. Při přejímací kontrole je z každé série náhodně vybráno 10 výrobků. Série je přijata, jestliže mezi kontrolovanými výrobky je maximálně 1 zmetek. Jaká je pravděpodobnost, že série bude přijata, jestliže obsahuje 8 zmetků. Kontrola je přitom prováděna tak, že kontrolovaný výrobek je podroben destrukční zkoušce. Jedná se o příklad typu „výběr bez vracení z malého osudí“ => hypergeometrické rozdělení
Příklady spojitých náhodných veličin: • X = výška náhodně vybraného studenta, 100 cm < x < 220 cm; • X = čas, který náhodně vybraný student stráví denně na facebooku, 0 ≤ x ≤ 24 hodin; • X = doba, kterou musíme čekat na obsluhu u baru v El magicu • X = maximální rychlost automobilu, kterou automobil dosáhne na dálnici Jednotlivé náhodné veličiny mají různá pravděpodobnostní rozdělení
Jak popsat rozdělení pravděpodobnosti pro spojitou náhodnou veličinu?
Distribuční funkce F(x)
Distribuční funkce F(x) udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší nebo rovné hodnotě x
Hustota pravděpodobnosti f(x) b
f (x)dx P(a X b) F(b) F(a) a
Hustota pravděpodobnosti f(x) je taková funkce, že pro
libovolné a < b platí:
“Sumace byla u spojité NV zaměněna za integraci, pravděpodobnostní funkce za hustotu pravděpodobnosti”
Střední hodnota
Rozptyl
Kvantily
(pouze pro spojité NV) 100p% kvantil pravd. rozdělení spojité NV je takové číslo xp pro které platí: xp
P(X x p )
f (x)dx F(x
p
)p
30 minut (na konci hodiny) 3 početní příklady (žádná teorie) možno používat: kalkulačku, Excel, vzorce, tabulky, SAS absence na testu musí být předem omluvena (když ne 0 bodů) na test je 1 pokus (žádné opravy)
Obsah 1. – 5. cvičení (včetně)
Četnosti (absolutní, relativní, kumulativní)
Míry polohy a variability + jejich vlastnosti
Rozklad rozptylu
Výpočet změněných charakteristik souboru (průměru, rozptylu, apod.) pokud do souboru přidáme nebo z něho odebereme hodnoty
Náhodné jevy a pravděpodobnost
Náhodné veličiny a jejich rozdělení ◦
Pravděpodobnostní funkce, distribuční funkce, hustota pravděpodobnosti
◦
Charakteristiky náhodných veličin
◦
Alternativní, Binomické, Poissonovo, Hypergeometrické a Normální rozdělení