cvičící Ing. Jana Fenclová
3. cvičení 4ST201
☺
Obsah: Míry variability Rozptyl ☺ Směrodatná odchylka ☺ Variační koeficient ☺ Rozklad rozptylu na meziskupinovou a vnitroskupinovou variabilitu ☺ Změna rozptylu ☺
Vysoká škola ekonomická
VŠE kurz 4ST201
1
Ing. Jana Fenclová
Míry variability Příklad 3.1.: V menze jsme sledovali dva stoly, u kterých sedělo shodně 6 strávníků. Sledovali jsme počet snězených ovocných knedlíků. U prvního stolu jsme zjistili hodnoty: 2,2,5,5,8,8. U druhého stolu jsme zjistili hodnoty 5,5,5,5,5,5. Co byste řekli o obou stolech?
Uveďte jak se od sebe liší míry polohy a míry variability? Proč u datových souborů sledujeme tyto míry, jaké nám udávají informace? Ilustrujte na předchozím příkladě.
2
VŠE kurz 4ST201
Ing. Jana Fenclová
Míry variability
Vše naleznete na www.statistika.vse.cz
Najděte si ve vzorcích následující statistiky:
3
VŠE kurz 4ST201
Ing. Jana Fenclová
Míry variability Absolutní míry variability 1. Variační rozpětí: 2. Rozptyl:
R = xmax − xmin 1 n 2 s = ∑ ( xi − x ) n i =1 2 x
3. Směrodatná odchylka:
s x = s x2
Relativní míry variability 4. Variační koeficient:
Vx =
sx x 4
VŠE kurz 4ST201
Ing. Jana Fenclová
Míry variability – základní příklad Příklad 3.2.: Sledovali jsme dva studenty Adama a Evu. Oba se připravovali na 1.test ze statistiky celkem 5 dní. Zajímalo nás, kolik hodin denně se na test připravovali. U Adama jsme zjistili následující hodiny: 1,1,2,1,10 a u Evy 2,4,3,4,2. Pokuste se popsat přípravu na test Adama a Evy. Pro každého spočítejte následující míry : 1. Průměr 2. Medián 3. Rozptyl 4. Variační rozpětí 5. Variační koeficient Z výsledků popište, jak se Adam a Eva připravují na test. Zkuste využít vše, co jste vypočítali. 5
VŠE kurz 4ST201
Ing. Jana Fenclová
Podívejte se do vzorců!
Rozptyl Základní tvar n
Z nesetříděných dat
Ze setříděných dat – pomocí absolutních četností
s x2 =
s =
2
i =1
n
∑ (x − x ) i =1
2
i
∗ ni
n
k
___
s x2 = x 2 − x 2 =
∑n n
i
i =1
∑ xi2 ∗ ni i =1
k
∑n
i
i =1
s x2 = ∑ ( xi − x ) ∗ pi 2
2
2 i
i
i =1
Ze setříděných dat – pomocí relativních četností
n x ∑ xi ∑ ___ 2 2 2 i =1 sx = x − x = − i =1 n n n
∑ (x − x )
n
2 x
Výpočtový tvar
k ∑ xi * ni − i =1 k ∑ ni i =1
2
k s = x − x = ∑ x ∗ pi − ∑ xi ∗ pi i =1 i =1 2 x
___ 2
k
2
2
2 i
6
VŠE kurz 4ST201
Ing. Jana Fenclová
Rozptyl - příklad Příklad 3.3.: Opět budeme počítat rozptyl hodin, které věnuje přípravě ke studiu Adam. Použijte jiný tvar rozptylu než ten, který jsme užívali při prvním výpočtu. Vyjdou rozptyly stejně? Vypočítejte rozptyl i v SASu. Příklad 3.4.: V internetové kavárně jsme sledovali dobu, po kterou setrvali návštěvníci na internetu v průběhu jednoho dne. Zjistili jsme, že ze všech pondělních zákazníků byla: 1/5 zákazníků na internetu 1 hodinu 2/5 zákazníků na internetu 2 hodiny 1/4 zákazníků na internetu 4 hodiny Zbytek zákazníků byl na internetu 30 minut. Jaká je směrodatná odchylka hodin, které stráví zákazníci na internetu?
7
VŠE kurz 4ST201
Ing. Jana Fenclová
Rozklad rozptylu Máme-li datový soubor, který je rozdělen na skupiny a jsou-li zadané skupinové četnosti, skupinové průměry a skupinové rozptyly, počítáme celkový rozptyl pomocí rozkladu rozptylu na meziskupinovou a vnitroskupinovou variabilitu.
A
Meziskupinová AB
2,2,2,2,2 M ez
Vnitroskupinová A
i sk
u AC pin ov á Vnitroskupinová C
B -1,0,2,0,1
C 5,5,5,5,5
vá no i p ku B Vnitroskupinová s i z C B Me
8
VŠE kurz 4ST201
Ing. Jana Fenclová
Rozklad rozptylu - vzorec Pokud máme statistický soubor o n jednotek rozdělen do k dílčích podsouborů, kde známe dílčí rozptyly , dílčí průměry a dílčí četnosti, potom rozptyl celého souboru je dán součtem rozptylu skupinových průměrů a průměru ze skupinových rozptylů. Podívejte se do vzorců!
∑ (x − x ) * n k
s = 2
2
i
i =1
k
xˆ
s =s +s s =
2
ni
x
x
ij
x
k
∑n i =1
i
i =1
2
i =1 j =1
∑n
2
∑ ∑ (x − x ) k
2
2
i
k
s =
i
2
∑s * n 2
ix
i =1
i
k
∑n i =1
i
9
VŠE kurz 4ST201
Ing. Jana Fenclová
Rozklad rozptylu – základní příklad Příklad 3.5.: Sledujeme dvě cukrárny , které vyrábějí stejný zákusek, který se jmenuje „Dokonalé potěšení“. Cukrárna „Na růžku“ vyrábí ročně 2000 těchto zákusků, průměrná cena za rok je 12 Kč, cena má směrodatnou odchylku 1. Cukrárna „U Jakuba“ vyrábí ročně 1500 těchto zákusků, průměrná cena za rok 15 Kč, cena má směrodatnou odchylku 2. Spočítejte relativní variabilitu (variační koeficient) ceny zákusku „Dokonalé potěšení“ za obě dvě cukrárny, který bude vyjadřovat, jak variabilita ceny zákusku kolísá během celého roku. 10
VŠE kurz 4ST201
Ing. Jana Fenclová
Rozklad rozptylu – těžší příklad Příklad . 3.6.: Byla vypracována studie vývoje tělesné váhy mužů a žen ve věku 21-24 let. Ze studie byly uveřejněny následující výsledky. Potvrďte či vyvraťte představu autorů o tom, že váha žen má menší relativní variabilitu než váha mužů. •
Nápověda: Relativní variabilitu určujeme variačním koeficientem jako podíl celkové směrodatné odchylky a celkového průměru. Jsou li data zadána jako v tomto příkladě (tj. průměry a směrodatné odchylky v jednotlivých skupinách) musíme použít k výpočtu celkový rozptyl, který složíme ze dvou částí (vnitroskupinovou a meziskupinovou). K řešení využijte rozklad rozptylu na vnitroskupinový a meziskupinový. Pokud nestihneme na cvičení vypočítat, spočítejte si doma, postup je stejný, jako v předchozím příkladu. 11
VŠE kurz 4ST201
Ing. Jana Fenclová
Příklad . 3.6. - data: Zadání:
Výsledky:
Muži : x = 73 ,089
Ženy : x = 60 ,132
s = 69 ,329 s = 0 ,545
s = 61,799 s = 0 ,066
s = 69 ,874
s = 61,865
s = 8 ,359
s = 7 ,865
v = 0 ,114
v = 0 ,131
2
2
x
2
x
x
x
2
2
x
2
x
x
x
12
VŠE kurz 4ST201
Ing. Jana Fenclová
Výpočet změny rozptylu Příklad 3.7.: Zeptali jsme se 20 lidí, kolik utratí na svátek svatého Valentýna za dárky pro své drahé polovičky. Zjistili jsme průměrnou cenu 250 Kč a směrodatná odchylka ceny 100 Kč. Vypočítejte: 1. Zjistili jsme u dvou lidí špatně zapsanou cenu. Místo ceny 500Kč měla být zaznamenána cena 450 s místo ceny 300 mělo být zapsáno 400. Jak se změní sledovaný průměr a rozptyl? 2. Pokud se zeptáme navíc ještě tří lidí, kteří odpověděli 500 Kč, 1500 Kč a 2500 Kč. Jak se tentokrát změní průměr a cena?
13
VŠE kurz 4ST201
Ing. Jana Fenclová
Rychlé opakování popisné statistiky na doma: Př. 3.8.:
U studentů z VŠE a UK bylo zkoumáno kolik času věnují týdně studiu. V souboru data_cv03_opakovani.sas7bdat jsou uvedená zjištěná data.
1.
Vytvořte tabulku četnostní pro celý souboru(ručně i v SASu)
2.
Vytvořte tabulku četností pro každou vysokou školu zvlášť(ručně i v SASu)
3.
Vypočítejte průměrný čas věnovaný studiu za celek i za jednotlivé školy(ručně i v SASu).
4.
Vypočítejte celkový průměrný čas pomocí průměrů v jednotlivých školách.(ručně)
5.
Spočítejte medián, horní a dolní kvartil za celý soubor.(ručně i v SASu)
6.
Spočítejte rozptyl a směrodatné odchylky pro každou školu zvlášť (ručně i v SASu) a to:
7.
a)
Pro VŠE počítejte z neroztříděných dat (bez použití tabulky četností)
b)
Pro UK počítejte z roztříděných dat (s použitím tabulky četností) Spočítejte variační a kvartilové rozpětí pro celý soubor. A jdeme z popisné statistiky na pravděpodobnost….☺ 14
VŠE kurz 4ST201
Ing. Jana Fenclová
Děkuji za pozornost! Pokud budete mít jakékoliv dotazy či připomínky, pište mi na mail
[email protected] nebo přijďte do konzultačních hodin každý pátek 9:00-11:00 JM317.
15