Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,....) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru dat) – tabulka rozdělení četností (absolutní četnost, relativní četnost, kumulativní četnost, relativní kumulativní četnost) - grafické znázornění dat (polygon četností a součtová křivka pro bodové rozdělení četností, histogram a součtový histogram pro intervalové rozdělení četností) - výpočet charakteristik (k výpočtu použijte aplikaci STAT1 případně statistické funkce EXCELu), ke každé číselné charakteristice uveďte její definici, její vypočítanou hodnotu a slovní komentář – interpretaci – získaného výsledku. Určete následující charakteristiky: rozsah, minimum, maximum, aritmetický průměr, modus medián, dolní a horní kvartil, dolní a horní decil, průměrnou odchylku od průměru, momentovou a výběrovou směrodatnou odchylku, momentový a výběrový rozptyl, variační koeficient, variační rozpětí, kvartilové a decilové rozpětí, kvartilovou a decilovou odchylku, koeficient šikmosti a špičatosti. - výsledky shrňte do tabulky v následujícím formátu rozsah minimum maximum průměr modus medián dolní kvartil horní kvartil dolní decil horní decil průměrná odchylka směrodatná odchylka výběrová směrodatná odchylka rozptyl výběrový rozptyl variační koeficient variační rozpětí kvartilové rozpětí decilové rozpětí kvartilová odchylka decilová odchylka koeficient šikmosti koeficient špičatosti -
60,000 67,000 78,000 72,083 72,000 72,000 71,000 74,000 69,000 75,000 1,672 2,092 2,110 4,376 4,451 0,029 11,000 3,000 6,000 1,500 0,750 0,217 –0,079
proveďte testy normality (test nulovosti koeficientu šikmosti a špičatosti, kombinovaný test koeficientu šikmosti a špičatost – C-test, případně uveďte i výsledky modifikovaných testů) určete intervaly spolehlivosti prostřední hodnotu (oboustranný, levostranný, pravostranný), v případě normality určete dále intervaly spolehlivosti pro rozptyl a směrodatnou odchylku zformulujte věcný problém a vyřešte jej pomocí jednovýběrových testů hypotéz
Univerzita Obrany v Brně Fakulta ekonomiky a managementu UO
Zápočtová práce ze statistiky
Vypracoval: XY Studijní skupina: xy
Charakteristika datového souboru Zde uveďte, kde byla data získána, co vyjadřují a proč jste se rozhodl(a) tato data zpracovávat apod. Základní soubor: popište, co je základním souborem Výběrový soubor: popište, co je základním souborem Statistický znak: popište, co je zkoumaným statistickým znakem
Tabulka získaných hodnot 75 70 72 75 75 72 74 75 70 73
75 76 73 75 73 72 75 73 73 75
77 74 73 73 76 72 74 72 73 75
76 75 75 74 72 74 74 75 74 73
76 75 73 75 75 77 73 75 74 75
75 73 75 74 73 73 75 75 72 73
Základní charakteristiky datového souboru: n = 60, xmin = 70, xmax = 77 Bodové rozdělení četností xi
ni
pi
Ni
Fi
70 71 72 73 74 75 76 77 78
2 0 7 15 9 21 4 2 0
0,03 0,00 0,12 0,25 0,15 0,35 0,07 0,03 0,00
2 2 9 24 33 54 58 60 60
0,03 0,03 0,15 0,40 0,55 0,90 0,97 1,00 1,00
Σ
60
1,00
x
x
Legenda k tabulce: ni – absolutní četnost: definice pi – relativní četnost: definice Ni – kumulativní četnost: definice Fi – relativní kumulativní četnost: definice
Grafické zobrazení rozdělení četností Součtová křivka
Polygon četností 70
25
60
20
50 15
ni
Ni
10
40 30 20
5
10
0
0 70
71
72
73
74
75
xi
76
77
78
70
71
72
73
74
75
76
77
xi
Charakteristiky polohy Aritmetický průměr je definován jako součet všech hodnot znaku dělený jejich počtem 1 n x = ∑ xi = 73,967 n i =1 Doplňte slovní vysvětlení – interpretaci – získaného výsledku.
Modus je …. Kvantil je … Medián … Dolní kvartil … Horní kvartil … Dolní decil … Horní decil …
Charakteristiky variability Variační rozpětí … Kvartilové rozpětí … Decilové rozpětí … Kvartilová odchylka … Decilová odchylka … Průměrná odchylka … Rozptyl …
78
Směrodatná odchylka … Výběrový rozptyl … Výběrová směrodatná odchylka … Variační koeficient … Charakteristiky šikmosti a špičatosti Koeficient šikmosti … Koeficient špičatosti …
Číselné charakteristiky rozsah minimum maximum průměr modus medián dolní kvartil horní kvartil dolní decil horní decil průměrná odchylka směrodatná odchylka výběrová směrodatná odchylka rozptyl výběrový rozptyl variační koeficient variační rozpětí kvartilové rozpětí decilové rozpětí kvartilová odchylka decilová odchylka koeficient šikmosti koeficient špičatosti
60,000 70,000 77,000 73,967 75,000 74,000 73,000 75,000 72,000 75,100 1,207 1,472 1,484 2,166 2,202 0,020 7,000 2,000 3,100 1,000 0,387 -0,413 0,108
Testy normality Test o nulové šikmosti Formulujeme hypotézu a alternativu: H :α3 = 0 → A :α3 ≠ 0 a3 − 0,413 Testové kritérium u 3 = = = −1,373 D(a3 ) 0,091 kde D(a 3 ) =
6( n − 2) 6(60 − 2) = = 0,091 (n + 1)(n + 3) (60 + 1)(60 + 3)
Kritický obor: Wα = u 3 , u 3 ≥ u α , kde u α je kvantil rozdělení N (0,1). 1− 1− 2 2 W0, 05 : − 1,737 ≥ u 0,975 1,737 ≥ 1,960 (neplatí) – nulová šikmost je přijatelná Hodnota testového kritéria nepadne do kritického oboru, hypotézu o nulovosti koeficientu šikmosti na hladině významnosti 0,05 nemůžeme zamítnout.
Test o nulové špičatosti Formulujeme hypotézu a alternativu: H :α4 = 0 → A :α4 ≠ 0 …
Kombinovaný test koeficientu šikmosti a špičatosti C – test normality H: náhodná veličina X má normální rozdělení → A: náhodná veličina X nemá normální rozdělení. … Pozn. Můžete určit i modifikované varianty daných testů Závěr: Na základě předchozích testů je – není normalita přijatelná. Pozn. Uvedené testy normalitu nezamítly, budeme tedy předpokládat, že pracujeme s výběrem z normálního rozdělení. Budeme tedy konstruovat intervaly spolehlivosti pro střední hodnotu (parametr µ) a rozptyl (parametr σ2). Pokud by se normalita zamítla, určili bychom pouze intervaly spolehlivosti pro střední hodnotu (pro výběry velkého rozsahu).
Odhady charakteristik základního souboru Intervalové odhady pro střední hodnotu µ
Oboustranný interval spolehlivosti …doplňte odpovídající vzorec Parametr µ se s 95% spolehlivostí nalézá v intervalu…. Levostranný interval spolehlivosti …doplňte odpovídající vzorec Parametr µ je s 95% spolehlivostí větší než … Pravostranný interval spolehlivosti …doplňte odpovídající vzorec Parametr µ je s 95% spolehlivostí menší než … Intervalové odhady pro rozptyl σ2 Oboustranný interval spolehlivosti …doplňte odpovídající vzorec Parametr σ2 se s 95% spolehlivostí nalézá v intervalu …. Levostranný interval spolehlivosti …doplňte odpovídající vzorec S 95% spolehlivostí je parametr σ2 větší než …. Pravostranný interval spolehlivosti …doplňte odpovídající vzorec S 95% spolehlivostí je parametr σ2 menší než …. Intervalové odhady pro směrodatnou odchylku σ Oboustranný interval spolehlivosti Parametr σ se s 95% spolehlivostí nalézá v intervalu…. Levostranný interval spolehlivosti S 95% spolehlivostí je parametr σ větší než …. Pravostranný interval spolehlivosti S 95% spolehlivostí je parametr σ menší než ….
Jednovýběrové testy Zadání….. Základní charakteristiky: n = ..., x = ..., s = ..., α = ... H: µ = ... A: µ > ... (například) Testové kritérium
Kritický obor: Závěr: ….
t=
x − µ0 n = ... s
Wα = {t , t ≥ t1−α ( n − 1)} , kde t1−α ( n − 1) je kvantil Studentova rozdělení