Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení ze 4ST201.
Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je také učebnice, cvičebnice a poznámky z přednášek a cvičení!
Tomáš Karel - 4ST201
25.9.2013
2
Ing. Tomáš Karel
email:
[email protected]
místnost: NB171 A
konzultační hodiny:
čtvrtek 10.15 – 12.15)
(jinak dle dohody)
materiály ke cvičení: Průběžně na
web Katedry statistiky a pravděpodobnosti: http://kstp.vse.cz/
web předmětu: http://statistika.vse.cz/predmety/4st201.php
25.9.2013
www.tomaskarel.cz/vse
Tomáš Karel - 4ST201
3
Statistika pro ekonomy Hindls R., Hronová S., Seger J., Fischer,J. (1. – 8. vydání)
Statistika v příkladech
– Marek L. a kolektiv
25.9.2013
Seznam kapitol a příkladů z učebnice a cvičebnice, které jsou náplní kurzu 4ST201:
http://statistika.vse.cz/download/materialy/4ST201_co_se_ucit.pdf
Tomáš Karel - 4ST201
4
kstp.vse.cz statistika.vse.cz ◦ obsah přednášek a látka ke studiu ◦ požadavky k ukončení předmětu Vzorce: http://statistika.vse.cz/download/materialy/4ST201_vzorce.pdf
Tabulky: http://statistika.vse.cz/download/materialy/tabulky.pdf
Vzorce a tabulky (bez individuálních úprav) z těchto webových stránek LZE používat jak na přůběžných testech na cvičení, tak i na závěrečném zkouškovém testu. Vzorce a tabulky si proto prosím vytiskněte a noste je prosím na cvičení, ať se s nimi naučíte pracovat.
25.9.2013
Tomáš Karel - 4ST201
5
1. průběžný test 2. průběžný test Celkem ze cvičení
20b 20b
40b
Zkouškový test
60 b
Celkem - maximum Hodnocení:
90 – 100% 75 – 89% 60 – 74% 50 – 59% pod 50%
=> 1 => 2 => 3 => 4+ => 4
100 b
1. test - 6. týden
2. test – 11. týden
• Za každý ze dvou průběžných testů lze získat maximálně 20 bodů. Celkem lze tedy získat maximálně 40 bodů ze cvičení. • Na každý průběžný test je pouze jeden pokus. Nebudete-li se moci testu zúčastnit, je třeba donést omluvenku studijní referentce a budete psát test náhradní. • Neomluvená absence na testu znamená 0 bodů z daného testu. • Možné minimum ze cvičení je 16 b !!!
25.9.2013
Tomáš Karel - 4ST201
6
30 minut (na konci cvičení) pouze početní příklady Možnost využití počítače, kalkulačky a vzorců, tabulek
1. test - 6. týden (popř. 7. týden) 2. test – 11. týden (popř. 12. týden)
60 minut, 60 bodů
ve zkouškovém období
obsahuje teorii i příklady
teorie (50% - 30b)
◦ zaškrtávací (1 správná odpověď, 5 × 4b) (pozn. správná odpověď +4b, špatná odpověď -2b, žádná odpověď 0b) ◦ výroky (ano × ne, 5 × 2b) (pozn. správná odpověď +2b, špatná odpověď -2b, žádná odpověď 0b)
◦ z teoretické části není možné získat záporný počet bodů, minimum je nula příklady (50% - 30b) ◦
25.9.2013
3 příklady po 10 bodech Tomáš Karel - 4ST201
7
statistika má v dnešní době četná uplatnění v mnoha odvětvích, včetně ekonomie vzhledem k možné rozsáhlosti vstupních dat a náročnosti operací spojených s jejich klasifikací a analýzou je v dnešní době často využíván statistický software:
25.9.2013
SAS R Statistica Statgraphics SPSS Matlab
Na tomto cvičení MS EXCEL – běžnou součástí většiny systémů MS Windows
Tomáš Karel - 4ST201
8
1.
Úvod, popisná statistika
2.
Popisná statistika
3.
Míry variability, pravděpodobnost
4.
Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5.
Pravděpodobnostní rozdělení
6.
TEST, odhady parametrů
7.
Testování hypotéz
8.
Chí – kvadrát test dobré shody, kontingenční tabulky, ANOVA
9.
Regrese
10. Regrese, korelace 11. TEST, časové řady (bazické a řetězové indexy) 12. Časové řady 13. Indexní analýza 25.9.2013
Tomáš Karel - 4ST201
9
kombinační čísla
n n! k (n k )!k!
25.9.2013
Využití např. počet pravděpodobnosti (binomické rozdělení – další cvičení)
kombinační číslo „en nad ká“ vyjadřuje, kolik různých k-tic lze vytvořit z n prvků, přičemž na pořadí prvků v dané k-tici nezáleží a každý prvek se v dané k-tici smí vyskytnout maximálně jednou n! – „faktoriál“, na kalkulačce „x!“
Tomáš Karel - 4ST201
10
Vypočítejte:
8 ? 3 10 ? 9
25.9.2013
Tomáš Karel - 4ST201
11
V populárním seriálu The Big Bang Theory (Teorie velkého třesku) jedna z hlavních postav tohoto seriálu, Sheldon Cooper, uvádí rozšíření tradiční hry kámen – nůžky – papír o další dva symboly tapíra a Spocka (postava ze Star Treku) celkem na pětici symbolů
kámen – nůžky – papír – tapír – Spock http://www.youtube.com/watch?v=_F0pszFyQqI
Kolik musí být ve hře s pěti symboly stanoveno pravidel, podle kterých se vůči sobě jednotlivé symboly chovají?
Např. 1) Papír balí kámen, 2) nůžky stříhají papír …
Tomáš Karel - 4ST201
25.9.2013
12
Statistické znaky
kvantitativní
ordinální (pořadové)
25.9.2013
měřitelné
kvalitativní
alternativní (binomické)
Tomáš Karel - 4ST201
množné
13
Pomocí metody dotazování získáme údaje o 10 studentech v této třídě: ◦ ◦ ◦ ◦ ◦ ◦
25.9.2013
pohlaví studenta (x1) věk studenta (x2) studovaná fakulta (x3) semestr (x4) založení facebook účtu (x5) počet přátel na facebooku (x6)
Tomáš Karel - 4ST201
14
Získaná data uspořádáme do přehledné tabulky tzv. datové matice (viz soubor cviceni_1.xlsx na ISISu v sekci dokumenty ) číslo i 1 2 3 4 5 6 7 8 9 10
25.9.2013
pohlaví x1
věk x2
fakulta x3
semestr facebook x4 x5
Tomáš Karel - 4ST201
Fb přátelé x6
15
1)
Určete typy proměnných x1 – x6
dle výše uvedeného schématu na jednom z předchozích slidů
x1…pohlaví studenta x2…věk studenta x3…studovaná fakulta x4…semestr ve kterém jste si zapsali tento předmět x5…založení facebooku x6…počet „přátel“ na Vašem facebooku
2)
25.9.2013
Pro proměnnou x2 – věk studenta sestrojte tabulku rozdělení četností (absolutních, relativních, kumulativních absolutních a kumulativních relativních)
Tomáš Karel - 4ST201
16
absolutní četnosti
ni , i 1,2,..., k
relativní četnosti
pi
kumulativní absolutní četnosti platí:
k
n i 1
k
p i 1
i
n1 n2 ...
n
kumulativní relativní četnosti platí:
25.9.2013
i
ni n
p1 p2 ...
1
Tomáš Karel - 4ST201
17
3) Sestrojte tabulku rozdělení četností pro proměnnou x6 – počet facebookových „přátel“ ◦ proměnná x4 nabývá mnoha obměn (tabulka četností i graf by nevypadaly dobře) vhodnější je intervalové rozdělení četností ◦ musíme zvolit vhodný počet a šířku intervalu
25.9.2013
Tomáš Karel - 4ST201
18
Sturgesovo pravidlo pro počet intervalů
šířka jednoho intervalu: variační rozpětí:
R xmax xmin
25.9.2013
Tomáš Karel - 4ST201
19
průměr (aritmetický, geometrický, harmonický, kvadratický)
modus = hodnota s nejvyšší četností
a%-ní kvantil = dělí soubor uspořádaný podle velikosti (od nejnižších hodnot po nejvyšší) na prvních a% hodnot a zbývajících (100-a)%
medián = prostřední hodnota v souboru uspořádaném podle velikosti = 50% kvantil
dolní kvartil = 25% kvantil
horní kvartil = 75% kvantil
25.9.2013
Tomáš Karel - 4ST201
20
25.9.2013
Tomáš Karel - 4ST201
21
Jaký je průměrný počet facebookových přátel? (vypočtěte dvojím způsobem - nejdříve ze základní tabulky a poté z tabulky rozdělení četností) n
ze základní tabulky
x
(prostý aritmetický průměr)
x i 1
i
n k
z tabulky rozdělení četností
(vážený aritmetický průměr)
x
xn i 1 k
i
n i 1
25.9.2013
i
Tomáš Karel - 4ST201
i
22
Závodní okruh Sosnová má délku základní trasy 1,075 km. Testovací závodník projel tento okruh celkem třikrát. V prvním kole byla jeho průměrná rychlost 60 km/h, v druhém kole už 72 km/h a ve třetím kole dosáhl průměrné rychlosti 80 km/h. Vypočítejte průměrnou rychlost jezdce za celou dobu jízdy, definovanou jako podílcelkové dráhy za celkový čas www.autodrom.cz
s = 1,075 km 25.9.2013
Tomáš Karel - 4ST201
23
Pro proměnnou x2 - věk určete následující kvantily: a) medián x0,5 b) horní kvartil x0,25 c) dolní kvartil x0,75
25.9.2013
Tomáš Karel - 4ST201
24
DÚ: Učebnice, cvičebnice – příklady
Tomáš Karel - 4ST201
25.9.2013
25