2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.
Kvantitativní metody B
Co se dozvíte Jednostupňové třídění, rozdělení četností. Absolutní a relativní četnosti. Grafy rozdělení četností – histogram a polygon. Třídění metrických znaků, intervalové rozdělení četností. Dvoustupňové třídění, kontingenční tabulky. Klasifikace ekonomických veličin.
Kvantitativní metody B
2
Proces třídění statistických dat
výchozí údaje
tabulka a graf četností
30
25
20
15
10
jednoduchá datová tabulka
5
0 ZŠ
SOŠ
USV
VŠ
číselné charakteristiky průměr šikmost
Kvantitativní metody B
odchylka
3
Jednostupňové třídění tabulka rozdělení četností výskyty jednotlivých obměn (hodnot) nominálních nebo ordinálních znaků jednoduché třídění – třídění podle jednoho znaku řádky tabulky představují obměny tříděného znaku sloupce tabulky vyjadřují četnosti (počty jednotek) legenda slouží k označení obměn tříděného znaku
Kvantitativní metody B
4
Četnosti obměn absolutní četnost ni počet výskytů i-té obměny
relativní četnost pi poměrné zastoupení obměny (v %) x 100% Kvantitativní metody B
5
Kumulativní četnosti pouze u ordinálních a metrických znaků kumulativní četnost kni počet hodnot menších nebo rovných dané obměně
relativní kumulativní četnost kpi x 100% Kvantitativní metody B
6
Tabulka četností – příklad
ZNÁMKA ZE STATISTIKY
KUMULATIVNÍ ČETNOSTI
ČETNOSTI ni
pi
kni
kpi
1
12
0,095
12
0,095
2
35
0,278
47
0,373
3
61
0,484
108
0,857
4
18
0,143
126
1,000
CELKEM
126
1,000
x
x
47 studentů má nejvýše dvojku Kvantitativní metody B
7
Grafy k tabulce četností sloupcový graf četností (histogram)
spojnicový graf četností (polygon)
výsečový graf četností
vhodné zejména pro nominální proměnné
vhodné zejména pro ordinální proměnné
vhodné zejména pro nominální proměnné
10
10
9
9
8
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
0
VŠ 17% ZŠ 29% USV 17%
SOŠ 37%
0 ZŠ
SOŠ
USV
VŠ
Kvantitativní metody B
ZŠ
SOŠ
USV
VŠ
8
Rozdělení četností kvantitativního znaku vlastnosti metrických znaků velké množství obměn malé četnosti obměn (často pouze 1)
klasifikace (třídění) metrický znak ordinální znak (třídy jsou intervaly) ordinální znak nominální znak (třídy jsou kategorie) metrický (věk)
Kvantitativní metody B
ordinální (věková skupina)
nominální (děti, důchodci, ostatní)
9
Pravidla pro klasifikaci počet tříd (intervalů) v rozmezí 5 až 20 malý počet tříd – malá informační hodnota velký počet tříd – nepřehledná tabulka
hranice intervalů dobře zapamatovatelná čísla dělitelná 5, 10, 20, …
intervaly jednoznačně pokrývají celý obor hodnot hraniční body intervalů patří pouze jednomu z nich
intervaly stejně široké srovnatelnost intervalů mezi sebou
oba krajní intervaly mají nenulové četnosti
Kvantitativní metody B
10
Odhad počtu tříd Sturgesovo pravidlo pro odhad počtu tříd k:
odhad šířky intervalu h:
vypočtené hodnoty jsou pouze doporučením skutečné hodnoty přehlednost tabulky (zaokrouhlené hranice a šířky tříd) Kvantitativní metody B
11
Příklad – tabulka četností VĚK 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 Celkem
četnosti abs. rel. 6 25,0% 5 20,8% 3 12,5% 5 20,8% 2 8,3% 2 8,3% 1 4,2% 24 100,0%
Kvantitativní metody B
kumul. četnosti abs. rel. 6 25,0% 11 45,8% 14 58,3% 19 79,2% 21 87,5% 23 95,8% 24 100,0% x x 12
Dvoustupňové třídění zkoumáme výskyt hodnot a závislost dvou statistických znaků pocházejících ze stejného základního souboru (např. výška a hmotnost, věk a plat, cena a prodané množství, …) kontingenční tabulka znaků X a Y X \ Y
y1
y2
…
celkem
x1
n11
n12
…
n10
x2
n21
n22
…
n20
…
…
…
…
…
celkem
n01
n02
…
n
Kvantitativní metody B
13
Sdružené a marginální četnosti
sdružené četnosti rozdělení znaků X a Y X \ Y
y1
y2
…
celkem
x1
n11
n12
…
n10
x2
n21
n22
…
n20
…
…
…
…
…
celkem
n01
n02
…
n
marginální četnosti rozdělení znaku Y Kvantitativní metody B
počet prvků s vlastností y2
počet prvků s vlastnostmi x1 a y2
marginální četnosti rozdělení znaku X index 0 představuje „všechny prvky“
počet prvků s vlastností x2 počet prvků souboru
14
Dvoustupňové třídění - příklad Tabulka vyjadřuje závislost mezi vzděláním a politickou orientací u vzorku osob: orientace
vzdělání
levice
střed
pravice
Σ
ZŠ
5
5
2
12
SŠ
3
13
8
24
VŠ
1
10
3
14
9
28
13
50
Σ Kvantitativní metody B
15
Dvourozměrný soubor grafické vyjádření souboru Bodový diagram
Histogram 3D 105 100
18
95
16
90
12
85 Y
14
10
80
četnosti 8
75
6 70
4 4
2
3
0 1
2 2
3
x
5
y
1 4
5
3D histogram obraz kontingenční tabulky Kvantitativní metody B
65 60 174
176
178
180
182
184
186
188
190
192
X
dot plot obraz datové tabulky 16
Klasifikace ekonomických veličin odvětvová klasifikace ekonomických činností (OKEČ) standardní klasifikace produkce (SKP) klasifikace zaměstnání (KZAM) standardní klasifikace pro mezinárodní obchod (SITC) klasifikace konečné spotřeby domácností (COICOP) klasifikace územních celků (NUTS)
Kvantitativní metody B
17
Příklad: klasifikace činností Stupeň
1
2
3
4
5
6
Počet znaků
1
1
2
3
4
5
Název
kategorie
sub kategorie
oddíl
pododdíl
skupina
pod skupina
Příklad
D
B
17
160
…
…
D - Zpracovatelský průmysl DB - Textilní a oděvní průmysl DB 17 - Textilní průmysl DB 17160 - Výroba nití Kvantitativní metody B
18
Co se naučíte příště 2.2 Číselné charakteristiky statistických dat Míry polohy, střední hodnoty. Míry variability, rozptyl a směrodatná odchylka. Střední poloha a variabilita nečíselných znaků. Normované hodnoty, míry tvaru rozdělení. Kvantily, explorační analýza dat. Lorenzova křivka, Giniho koeficient.
Kvantitativní metody B
19