PŘÍKLAD NA TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI Pracovník, který spravuje podnikovou databázi, exportoval do tabulkového procesoru všechny pracovníky podniku Alfa Blatná s některými sledovanými atributy vypsanými a) Do skupinové tabulky roztřídíme pracovníky dle třídícího číselného znaku hrubá měsíční přiměřený počet tříd neboli intervalů mezd. Pak doplníme procento pracovníků s daným intervalem Dále vytvoříme graficky histogram rozdělení četnosti pracovníků podle intervalů mezd. Jde o tzv. intervalové rozdělení četnosti. b) Do skupinové tabulky doplníme kumulativní četnost. Tzn. počet pracovníků, kteří mají první interval mezd, první až druhý interval mezd, první až třetí interval mezd atd. Dále vytvoříme graf kumulativní četnosti pracovníků v závislosti na postupně se zvyšujícím intervalu mezd.
c) Do skupinové tabulky doplníme poměrné zastoupení pro kumulativní četnosti. d) Uvedeme slovní popis pro první, druhý a třetí řádek tabulky. Tabulka 9.1: Zaměstnanci malé organizace Alfa Blatná k 30. 6. 2012
Číslo prac.
Příjmení
Pohlaví
Titul
Stav
Počet vyživovaných dětí
Pracovní kategorie
Hrubá měsíční mzda za červen
Zbývá dní dovolené
1
Adam
1
1
0
Dělník
15 000
4
2
Bartoš
1
2
1
Dělník
12 000
8
3
Beneš
1
2
4
Dělník
24 000
9
4
Berka
1
3
0
Provozní
23 000
6
5
Bláha
1
2
2
Technický
27 000
5
6
Bohuš
1
2
0
Dělník
18 000
7
7
Bouše
1
2
1
Dělník
17 000
4
8
Boušová
2
2
2
Hospodářský
32 000
5
9
Bůbal
1
2
1
Dělník
18 000
6
10
Bureš
1
2
4
Technický
20 000
9
11
Burešová
2
2
0
Provozní
24 000
5
12
Burgerová
2
2
2
Dělník
24 000
7
13
Černá
2
1
0
Dělník
14 000
3
Ing.
14
Daněk
1
1
1
Dělník
19 000
6
15
Dlask
1
2
0
Dělník
18 000
6
16
Dobeš
1
2
3
Dělník
18 000
4
17
Drobník
1
2
2
Hospodářský
40 000
9
18
Erb
1
1
2
Dělník
16 000
3
19
Fichtner
1
2
1
Dělník
16 000
6
20
Gál
1
2
1
Hospodářský
14 000
4
21
Gott
1
2
6
Dělník
29 000
5
22
Havel
1
2
0
Hospodářský
28 000
4
23
Házová
2
2
0
Dělník
10 000
3
24
Hejral
1
2
0
Technický
19 000
6
25
Hrubín
1
2
4
Dělník
18 000
3
26
Hubač
1
2
2
Dělník
18 000
8
27
Hupová
2
2
2
Provozní
17 000
4
28
Hus
1
2
3
Hospodářský
34 000
5
29
Janda
1
2
1
Dělník
19 000
8
30
Janků
1
2
0
Dělník
18 000
4
31
Janků
2
3
3
Provozní
14 000
3
32
Jarý
1
2
1
Dělník
19 000
6
33
Jiřinec
1
2
2
Dělník
18 000
4
34
Jonáš
1
2
3
Dělník
27 000
8
35
Kobosil
1
2
1
Hospodářský
30 000
5
RNDr. Bc.
JUDr.
36
Korousová
2
2
2
Dělník
14 000
8
37
Kos
1
2
2
Dělník
21 000
7
38
Koucký
1
2
2
Dělník
23 000
7
39
Kulíšek
1
2
1
Dělník
16 000
6
40
Lahodný
1
2
1
Dělník
24 000
4
41
Lahodová
2
2
3
Dělník
14 000
3
42
Líbenková
2
2
0
Hospodářský
12 000
5
43
Lín
1
2
3
Dělník
12 000
6
44
Linka
1
Doc.
2
2
Hospodářský
23 000
7
45
Líný
1
Mgr.
2
1
Technický
24 000
8
46
Mahel
1
2
2
Dělník
20 000
6
47
Masaryk
1
2
1
Dělník
18 000
6
48
Mocová
2
2
3
Dělník
17 000
5
49
Moravec
1
2
2
Technický
22 500
5
50
Nezval
1
2
3
Dělník
17 000
7
51
Nohavica
1
2
2
Technický
23 000
6
52
Novák
1
2
5
Dělník
19 000
6
53
Novák
1
2
2
Dělník
21 000
7
54
Nováková
2
2
0
Dělník
17 000
6
55
Ondráš
1
2
4
Dělník
17 000
5
56
Prádler
1
2
1
Hospodářský
19 000
5
57
Rus
1
3
2
Technický
20 000
7
Mgr.
58
Svoboda
1
1
2
Technický
21 000
7
59
Tatar
1
1
2
Technický
16 000
5
60
Tomšů
1
4
3
Technický
17 000
9
x
106
1 194 500
x
Pohlaví
Kód
Celkem
x
x
x
Legenda: Stav
Kód
svobodný/á
1
muž
1
vdaná/ženatý
2
žena
2
vdova/vdovec
3
rozvedený/á
4
Řešení: Ad a) Do skupinové tabulky roztřídíme pracovníky dle třídícího číselného znaku hrubá měsíční přiměřený počet tříd, neboli intervalů mezd. Pak doplníme procento pracovníků s daným Dále vytvoříme graficky histogram rozdělení četnosti pracovníků podle intervalů mezd. Ad b) Do skupinové tabulky doplníme kumulativní četnost. Tzn. počet pracovníků, kteří mají interval mezd, první až druhý interval mezd, první až třetí interval mezd atd. Dále vytvoříme
graf kumulativní četnosti pracovníků v závislosti na postupně se zvyšujícím intervalu mezd.
U spojitého číselného znaku neznáme počet tříd. i) Jednak nevíme, od jaké minimální do jaké maximální hrubé měsíční mzdy se budeme Proto musíme ve sloupci "Hrubá měsíční mzda" nejprve zjistit minimum a maximum. Výpočet: Na sloupec "Hrubá měsíční mzda" užijeme funkci min a max. =MIN(H24:H83) =MAX(H24:H83) Výsledek první funkce, minimální hrubá měsíční mzda pracovníka, je 10 000 Kč: 10 000 Výsledek druhé funkce, maximální hrubá měsíční mzda pracovníka, je 40 000 Kč: 40 000
ii) Dalším problémem je, že znak hrubá měsíční mzda lze považovat za spojitý nebo částečně (Mzdu lze vyplácet na účet pracovníka s přesností na setiny Kč.) Proto musíme třídit rozpětí znaku, u nás mezd, od minimální po maximální mzdu na několik intervalů mezd. Pro tvorbu intervalů spojitého znaku platí několik základních pravidel a doporučení: • Intervaly mohou být stejně dlouhé. I když nutně to není třeba. • Všechny intervaly musejí pokrýt variační rozpětí znaku, tj. u nás mezd od minima po • Je doporučeno, aby interval byl polouzavřený, tj. aby jedna mez každého intervalu byla otevřená a druhá mez každého intervalu uzavřená, aby hodnota krajního znaku (meze intervalu) jednoznačně patřila do právě jednoho Jinými slovy, aby hodnota znaku nebyla započítána dvakrát nebo ani jednou. • Počet intervalů k může být podle potřeby libovolný, je doporučeno, aby byl mezi 4 až 20. Ale je zřejmé, že čím větší je počet statistických jednotek souboru n , tím více intervalů k může být. • Pro počet intervalů k je doporučený jeden z následujících vzorců. První je Sturgessovo Yuleho vzorec. Oba vedou k přibližně stejnému výsledku, stačí pracovat jen s jedním z nich:
k 1 3,322. log(n)
k 1 3,322. log(n) k 2,5.4 n Výpočet: V našem příkladě máme n = 60 pracovníků. Podle Sturgessova pravidla je počet intervalů mezd: k = 1 + 3,322.log(60) Vzorec v Excelu vypadá následovně: = 1 + 3,322*LOG(60) Výsledek je: 6,907018454 Podle Yuleho vzorce je počet intervalů mezd: k = 2,5*(60)1/4 Vzorec v Excelu vypadá následovně: = 2,5*(60 )^(1/4)
Výsledek je: 6,957894209 Vidíme, že oba vzorce vedou vedou k téměř stejnému výsledku. Počet intervalů musí být přirozené číslo. Zvolíme počet intervalů k = 7. Délka intervalu d se přibližně stanoví jako podíl variačního rozpětí R a počtu intervalů k . Variační rozpětí R je rozdíl mezi maximální a minimální mzdou:
R X max X min Variační rozpětí je u nás R = 40 000 - 10 000 = 30 000 Kč. Délka intervalu d je:
d
X
max
X k
V našem příkladě je délka intervalu: =(40000-10000)/7 Výsledek je:
min
R k
4286 Je doporučeno kvůli přehlednosti budoucí tabulky rozumně zaokrouhlit délku intervalu: • Například zaokrouhlit nahoru na pětistovky na číslo 4 500 Kč. Počet intervalů zůstane k = 7. • Nebo zaokrouhlit dolů na tisíce na číslo 4 000 Kč, pak ale musíme počet intervalů zvýšit třeba na k = 8. Zvolíme zaokrouhlení nahoru na pětistovky na číslo 4 500 Kč. Počet intervalů zůstane k = 7. Zkontrolujeme si, jaké rozpětí mezd pokryjeme tímto zaokrouhleným intervalem 4 500 Kč při počtu intervalů k = 7: =4500*7 Výsledek je: 31 500 Vidíme, že variační rozpětí R = 30 000 Kč je překročeno o 1 500 Kč = 31 500 Kč - 30 000 Kč. Proto můžeme začít mzdu například o 1 000 Kč níže, než je minimum, tj. od 10 000 - 1 000 = 9 000 Kč. A můžeme zakončit o 500 Kč nad maximem, maximální mzdou tj. do 40 000 + 500 = 40 500 Kč. V tabulce 9.5 vytvoříme legendu "Interval mezd", kdy dolní mez volíme uzavřenou a horní mez volíme otevřenou. První interval bude 9 000 až 13 500 Kč a tyto meze zvyšujeme o 4 Další interval bude 13 500 Kč až 18 000 Kč, další 18 000 Kč až 22 500 Kč atd., jak vidíme v tabulce 9.5.
V tabulce 9.5 vytvoříme hlavičku "Počet pracovníků", a to "absolutně", "v %", "kumulativně" a "kumulativně v %". Při využití MS Excel je tabulku nejvýhodnější vyplňovat od sloupce "Počet pracovníků kumulativně". Do buňky F282 v tabulce 9.5 napíšeme: =COUNTIF(H$24:H$83;"<13500") Vzorec znamená, že v oblasti H24 až H83 tabulky 9.1 načítáme všechny mzdy, které jsou nižší, než 13 500 Kč. Výsledek je 4. Takže jsou 4 pracovníci, kteří mají mzdu pod 13 500 Kč. Protože minimální vyplacená mzda je 10 000 Kč, zjistíme tím, že v intervalu 9 000 Kč až 13 500 Kč jsou mzdy 4 pracovníků. Proto do buňky D282 napíšeme číslo 4. Do buňky F283 napíšeme: =COUNTIF(H$24:H$83;"<18000") Vzorec znamená, že v oblasti H24 až H83 tabulky 9.1 načítáme všechny mzdy, které jsou nižší, než 18 000 Kč.
Výsledek je 21. Takže je 21 pracovníků, kteří mají mzdu pod 18 000 Kč. Protože mzdu pod 13 500 Kč mají 4 pracovníci, pokud tyto vyloučíme, zjistíme tím zároveň, že v intervalu 13 500 Kč až 18 000 Kč jsou mzdy 21 - 4 = 17 pracovníků. Proto do buňky D283 =F283-F282
Do buňky F284 napíšeme: =COUNTIF(H$24:H$83;"<22500") Vzorec lze zkopírovat ve sloupci F až do konce tabulky kromě řádku "Celkem". Jen vždy upravíme horní mez z intervalu z řádku, ve kterém se pohybujeme. Poslední vzorec znamená, že v oblasti H24 až H83 tabulky 9.1 načítáme všechny mzdy, které jsou nižší, než 22 500 Kč. Výsledek je 42. Takže je 42 pracovníků, kteří mají mzdu pod 22 500 Kč. Protože mzdu pod 18 000 Kč má 21 pracovníků, zjistíme tím zároveň, že v intervalu 18 000 Kč až Kč jsou mzdy 42 - 21 = 21 pracovníků. Proto do buňky D284 napíšeme vzorec =F231-F230 Vzorec můžeme rozkopírovat dál ve sloupci D kromě řádku "Celkem".
Sečteme všechny pracovníky s různými intervaly mezd, do buňky D289 napíšeme vzorec: =SUMA(D282:D288)
Ve sloupci "Počet pracovníků v %" jde o známá poměrná čísla strukury. Do buňky E282 =D282/D$289*100 Vzorec lze zkopírovat ve sloupci E až do konce tabulky včetně řádku "Celkem".
V řádku "Celkem" dáme v buňce F289 i G289 symbol "x", neboť hodnota v tomto řádku nemá Tabulka vypadá takto:
Tab. 9.5: Třídění pracovníků firmy Alfa Blatná podle hrubé mzdy za červen 2012 Interval mezd dolní mez horní mez absolut uzavřená otevřená ně 9 000 13 500 4
Počet pracovníků v% 6,7
kumulativně 4
kumulativně v % 6,7
13 500 18 000 22 500 27 000 31 500 36 000 Celkem
18 000 22 500 27 000 31 500 36 000 40 500
17 21 10 5 2 1 60
28,3 35,0 16,7 8,3 3,3 1,7 100
21 42 52 57 59 60
x
35,0 70,0 86,7 95,0 98,3 100,0
x
Histogram absolutní četnosti vytvoříme sloupcovým grafem ze sloupce "Počet pracovníků Na ose "x" budou hodnoty z legendy tabulky 9.5, kde je "dolní mez uzavřená" a "horní mez
Graf 9.5: Četnosti pracovníků firmy Alfa Blatná v závislosti na výši hrubé mzdy za červen 25 21
počet pracovníků
20
17
15 10
počet pracovníků
10
10 5
5
4
2
1
0 13 500
18 000
22 500
27 000
31 500
36 000
40 500
9 000
13 500
18 000
22 500
27 000
31 500
36 000
intervaly hrubé mzdy v Kč
Z grafu vidíme, že počet pracovníků narůstá s výší mzdy až do intervalu mezd 18 000 Kč až 22 500 Nejvyšší počet pracovníků má mzdu 18 000 Kč až 22 500 Kč s tím, že do intervalu dolní mez 18 000 Kč patří a horní mez 22 500 Kč nepatří. Od intervalu 18 000 Kč až 22 500 Kč počet pracovníků klesá. Tzn., že nejčetnější jsou střední mzdy. Intervaly nižších i vyšších mezd má již menší počet S tím souvisí obálka grafu, která připomíná tvarem horu nebo zvon. Jedná se o asymetrickou Gaussovu křivku, o které se zmíníme ještě později.
Histogram relativní četnosti vytvoříme sloupcovým grafem ze sloupce "Počet pracovníků v %". Na ose "x" budou hodnoty z legendy tabulky 9.5, kde je "dolní mez uzavřená" a "horní mez
Histogram rozdělení relativní četnosti pracovníků v závislosti na mzdě je v grafu 9.6. Tvar grafu s relativní četností je stejný, jako u grafu s absolutní četností. Jen místo počtů je procentuální zastoupení pracovníků.
Graf 9.6: Relativní četnosti pracovníků firmy Alfa Blatná v závislosti na výši hrubé mzdy za červen 40,0
35,0
35,0 28,3
počet pracovníků v %
30,0 25,0 20,0
16,7
15,0 10,0
8,3
6,7
5,0
3,3
1,7
0,0 13 500
18 000
22 500
27 000
31 500
36 000
40 500
9 000
13 500
18 000
22 500
27 000
31 500
36 000
intervaly hrubé mzdy v Kč
Graf kumulativní četnosti pracovníků v závislosti na mzdě vytvoříme
sloupcovým grafem ze sloupce tabulky 9.5 "Počet pracovníků kumulativně". Na ose "x" budou hodnoty ze sloupců K a L vedle tabulky 9.5.
Graf 9.7: Kumulativní četnosti pracovníků firmy Alfa Blatná v závislosti na výši hrubé mzdy za červen 70
počet pracovníků
60
57
59
60
52
50
42
40 30
21
20 10
4
0 13 500
18 000
22 500
27 000
31 500
36 000
40 500
9 000
9 000
9 000
9 000
9 000
9 000
9 000
intervaly hrubé mzdy v Kč
Z grafu vidíme, že počet pracovníků, kteří mají mzdu od intervalu 9 000 Kč až 13 500 Kč s rozšiřujícím se intervalem narůstá nejprve rychleji, pak pomaleji k hodnotě 60, kdy mzdu 9 000 Kč až 40 500 Kč má všech 60 pracovníků.
Ad c) Do skupinové tabulky doplníme poměrné zastoupení pro kumulativní četnosti. V buňce G282 je, kolik procent jsou 4 pracovníci, kteří mají mzdu od 9 000 Kč do 13 500 Kč, ze 60 pracovníků. Podle poměrných čísel struktury je v buňce G282 vzorec: =F282/F$288*100 Tento vzorec můžeme rozkopírovat ve sloupci G do buňky G288. Vzorec je správně. V další buňce G256 má zkopírovaný vzorec tvar: =F283/F$288*100 V buňce G256 je, kolik je 21 pracovníků, kteří mají mzdu 9000 Kč až 18 000 Kč, procent ze 60
Graf relativní kumulativní četnosti pracovníků v závislosti na mzdě vytvoříme sloupcovým grafem ze sloupce tabulky 9.5 "Počet pracovníků kumulativně v %". Na ose "x" budou hodnoty ze sloupců K a L vedle tabulky 9.5.
relativní četnost pracovníků v %
Graf 9.8: Relativní kumulativní četnosti pracovníků firmy Alfa Blatná v závislosti na výši hrubé mzdy za červen 120,0 100,0
95,0
98,3
100,0
86,7
80,0
70,0
60,0 35,0
40,0 20,0
6,7
0,0
13 500
18 000
22 500
27 000
31 500
36 000
40 500
9 000
9 000
9 000
9 000
9 000
9 000
9 000
intervaly hrubé mzdy v Kč
Tvar grafu s relativní kumulativní četností je stejný, jako u grafu s kumulativní četností. Jen místo je procentuální zastoupení pracovníků.
Ad d) Uvedeme slovní popis pro první, druhý a třetí řádek tabulky. Slovní popis pro první řádek tabulky:
Mzdu od 9000 Kč včetně do 13 500 Kč mají 4 pracovníci ze 60, což je 6,7 % pracovníků.
Slovní popis pro druhý řádek tabulky: Mzdu od 13 500 Kč včetně do 18 000 Kč má 17 pracovníků ze 60, což je 28,3 % pracovníků. Mzdu od 9 000 Kč včetně do 18 000 Kč má 21 pracovníků ze 60, což je 35 % pracovníků.
Slovní popis pro třetí řádek tabulky: Mzdu od 18 000 Kč včetně do 22 500 Kč má 21 pracovníků ze 60, což je 35 % pracovníků. Mzdu od 9 000 Kč včetně do 22 500 Kč má 42 pracovníků ze 60, což je 70 % pracovníků.
9 000
13 500
9 000 9 000 9 000 9 000 9 000 9 000
18 000 22 500 27 000 31 500 36 000 40 500