Statistika B (151-0303) Marek Pomp ZS 2014
[email protected] http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp
Podmínky pro úspěšné ukončení
I
zápočet 45 bodů, min. 23 bodů, I
I I
I
dvě zápočtové písemky, max. 15 + 15 bodů, min. 8 + 8 bodů, projekt max. 12 bodů, min. 7 bodů, aktivita na cv. 3 body,
zkouška, max. 55 bodů, min. 28 bodů, I I
výpočtová část, max. 40 bodů, min. 20 bodů, teoretická část, max. 15 bodů, min. 8 bodů,
100–86 výborně
85–66 velmi dobře
65–51 dobře
méně než 51 neuspěl
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
I Přednáška Úvod Soubor s jedním argumentem Charakteristiky polohy Charakteristiky variability Charakteristiky tvaru Typy rozdělení SNP
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Literatura [1] Hendl, J. Přehled statistických metod zpracování dat. Portál, Praha, 2006. [2] Hradecký, P., Madryová, A., Turčan, M. Pravděpodobnost. VŠB–TU, Ostrava, 2004. [3] Litschmannová, M. Úvod do statistiky. http://mi21.vsb.cz/modul/uvod-do-statistiky, 2011. [4] Turčan, M., Hradecký, P., Madryová, A., Harbichová, I., Holčapek, M. Statistika. VŠB–TU, Ostrava, 2002. [5] Šalounová, D. Úvod do pravděpodobnosti a statistiky. EKF, VŠB–TU, Ostrava, 2013. I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Statistika
Vědní obor, která se věnuje soupisu a zpracování dat (status – stát) 1. sběr dat 2. popisná statistika 3. induktivní statistika, statistická inference, statistické usuzování
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Historie na našem území I
soupisy obyvatel, majetku, poddaných (vrubovka z Dolních Věstonic(?),daně, vojsko, mapovaní epidemií apod.)
I
Marie Terezie 13. října 1753, dekret o pravidelném sčítání lidu,
I
30. listopadu 1856 ústřední výbor pro statistiku polního a lesního hospodářství
I
1919 byl založen Státní úřad statistický
I
Dnes Český statistický úřad a Zákon 89/1995 Sb., o státní statistické službě (poslední sčítání lidu 2011), zpravodajská povinnost ekonomických subjektů (Program statistických zjišťování na rok. . . ).
I
statistika v „každodenním“ životě
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Statistický soubor
I
statistická jednotka
I
statistický znak, ukazatel
I
statistický soubor populace, zákl. soubor ˆ výběr
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Statistický znak
1. kvalitativní (kategoriální) 2. kvantitativní (numerické) I
nominální
I
ordinální (pořadové)
I
intervalové
I
poměrové
I
diskrétní
I
spojité
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
I I I
Poloha
Variabilita
Tvar
Typy rozdělení SNP
rozsah souboru — N, variační int. — hxmin ; xmax i variační rozpětí — R = xmax ` xmin variační řada — seřazené navzájem různé hodnoty ze ZS a jejich absolutní četnosti výskytu x1 < ´ ´ ´ < xr x1 f1 F1 ’1 ˘1 r X X .. .. .. .. .. f = N; F = fk i i . . . . . xr
fr
Fr
’r
˘r
i=1
k»i
absolutní kumulativní četnosti — Fi , Fr = N relativní četnost — ’i , relativní kumulativní četnost — ˘i , ˘r = 1 fi ’i = ; N
r X i=1
I I. Přednáška
’i = 1
˘i =
X
’k
k»i
bodový a úsečkový graf, ogivní křivka, Paretův diagram Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Třídní rozdělení dat
„počet tříd“ (Sturgesovo pravidlo) k = 1 + log2 N ’ 1 + 3;3 log10 N
šířka třídy, h0 =
xmax ` xmin k
h nejbližší liché, zástupce první třídy = minimum souboru (Krajní body intervalů patří vlevo.) Histogram, stem-and-leaf (lodyha s listy)
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Charakteristiky polohy
I
N 1 X xi , aritmetický průměr — x —= N i=1
I I I
I I
I. Přednáška
modus x ^ — hodnota s největší četností (diskrétní veličina) medián x ~ — hodnota „uprostřed“ , dělí seřazený statistický soubor na poloviny p-kvantil (100p-percentil) hodnota xi , pro niž 100p % hodnot je menších než xi , i = Np + 0;5 a interpolujeme kvartily — 0,25-kvantil, 0,75-kvantil (25-percentil a 75-percentil) boxplot, box with whiskers, krabička s vousy délka vousu max. 1,5 mezikvartilového rozpětí, odlehlé hodnoty. Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Variance/Rozptyl/Disperze
Populační rozptyl N N N „ X «2 1 1 X 1 X 2 2 (xi ` x —) = xi ` xi s = = N N N 2
=
1 N
i=1 N X
i=1
i=1
xi2 ` x —2
i=1
Směrodatná odchylka s =
I. Přednáška
p s 2 , má stejnou jednotku jako data
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Variační koeficient
3
12
21
6
24
42
Různé jednotky, jak srovnat směrodatné odchylky?
Variační koeficient Vx =
I. Přednáška
s , směr. odchylka v násobcích průměru x —
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Centrální momenty
k-tý centrální moment N 1 X (xi ` x — )k Mk = N i=1 I
M1 = 0
I
M2 – 0 — populační rozptyl
I
M3
I
M4 – 0
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Šikmost
14
20
26
14
20
26
14
Šikmost nulová
záporná
20
26
kladná
Koeficient šikmosti M3 M3 g1 = q = q M23 M2 M2 Obvykle: I
g1 < 0, pak průměr < medián
I
0 < g1 , pak medián < průměr
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Špičatost
14
20
26
14
20
26
Špičatost nulová
záporná
14
20
26
kladná
Koeficient špičatosti g2 =
I. Přednáška
M4 M22
`3
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Normální rozdělení N(—; ff 2 )
1 σ 2π 1 σ 2πe
0 µ − 2σ
µ−σ
µ
µ+σ
µ + 2σ
8σ 1000 4σ 1000 0 µ + 3σ I. Přednáška
µ + 4σ Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Plocha omezená Gaussovou křivkou
100%
− 4σ
0
4σ
V intervalu h`4ff; 4ffi přibližně 99:99367 % hodnot.
50%
− 4σ
I. Přednáška
0
4σ
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
68–95–99
68.3%
−σ
0
σ
95.4%
− 2σ
I. Přednáška
0
99.7%
2σ
− 3σ
0
3σ
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
0.8
Volba parametrů — a ff
0
0.2
0.4
0.6
µ = 0, σ = 1 µ = 2, σ = 1 µ = 0, σ = 2 µ = 0, σ = 0.5
0.8
−4 I. Přednáška
−2
0
2
4 Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
0
0.5
0.84 1
Graf distribuční funkce
0
µ
µ+σ
: F (— + ff) = 0;5 + 0;68=2 = 0;84
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Normované normální rozdělení, N(0; 1)
Normální rozdělení — = 0, ff 2 = 1 Ať X má rozdělení N(—; ff 2 ), potom X0 =
X `— ff
má rozložení N(0; 1) — standardizace.
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Pearsonovo rozdělení ffl2 (n)
Součet druhých mocnin náhodných veličin s normálním rozdělením, X1 ; : : : ; Xn mají rozdělení N(0; 1) X = X12 + ´ ´ ´ + Xn2 I
n stupně volnosti (nezávislé sčítance)
I
D = (0; 1),
I
f (x ) a F (X ) jsou pro různé stupně volnosti tabelovány,
I
E (X ) = n;
I
var(X ) = 2n;
I. Přednáška
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
0.15
Pearsonovo rozdělení ffl2 (n)
0
0.05
0.1
n = 20 n = 10 n=6
0
I. Přednáška
5
10
15
20
25
30
35
40
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Pearsonovo rozdělení ffl2 (n) Pro rostoucí n se ffl2 (n) blíží N(n; 2n) ffl2 (20); N(20; 40)
0
0
0.05
0.05
0.1
ffl2 (10); N(10; 20)
10
20
0
10
20
30
40
0.05
0
0
ffl2 (40); N(40; 80)
20 I. Přednáška
40
60 Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Studentovo rozdělení t(n) N má rozdělení N(0; 1) X má rozdělení ffl2 (n) N p T = p n X I
n stupně volnosti,
I
f (x ) a F (X ) jsou pro různé stupně volnosti tabelovány,
I
f (x ) je sudá,
I
E (T ) = 0;
I
var(T ) =
I. Přednáška
n ; n`2
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Studentovo rozdělení t(n)
0.4
pro n > 30 platí t(n) ‰ N(0; 1)
0.0
0.1
0.2
0.3
N(0, 1) ν=5 ν=2 ν=1
−4
I. Přednáška
−3
−2
−1
0
1
2
3
4
Statistika B (ZS 2014)
Úvod
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
Fischer-Snedecorovo rozdělení F (m; n)
X1 má rozdělení ffl2 (m) X2 má rozdělení ffl2 (n) F =
X1 m X2 n
I
m; n stupně volnosti,
I
D = (0; 1),
I
hodnoty jsou pro různé stupně volnosti tabelovány,
I. Přednáška
Statistika B (ZS 2014)
Soubor s jedním argumentem
Poloha
Variabilita
Tvar
Typy rozdělení SNP
(5,5) (10,30) (40,40)
0
0.5
1
Úvod
0
I. Přednáška
1
2
3
Statistika B (ZS 2014)