4. Třídění statistických dat – pořádek v datech Základní členění statistických řad: řada časová, řada prostorová, řada věcná věcná slovní řada, věcná číselná řada. Základem statistického třídění je uspořádání hodnot jednoho statistického znaku. Z tohoto pohledu rozeznáváme: x1 , x2 ,..., xi ,...xn , řada neuspořádaná (původní naměřená řada) řada uspořádaná (variační) podle velikosti,
x(1) , x( 2) ,..., x(i ) ,..., x( n)
řada tříděná, - jednoduché (prosté) třídění, - skupinové (intervalové) třídění. Index i souvisí s pořadím zjišťování, index (i) souvisí s velikostí hodnot, přičemž x(1) x( 2) ,... x(i ) ...x( n ) a x(1) xmin , x( n) xmax . Výsledkem všech druhů třídění je řada rozdělení četností v tabulkové nebo grafické podobě. Prosté (jednoduché) třídění je třídění prováděné podle každé hodnoty (obměny) znaku samostatně. Výhodné je v situaci, kdy statistický znak dosahuje jen omezeného počtu obměn. Prosté třídění prezentujeme: v tabulkové podobě — tabulky rozdělení četností, v grafické podobě — sloupcové a výsečové grafy, polygony rozdělení četností. Skupinové (intervalové) třídění je rozdělení statistických jednotek podle hodnot (obměn) statistického znaku shrnutých do společné skupiny (třídy, intervalu) tak, aby co nejlépe vynikli charakteristické vlastnosti zkoumaných jevů. Skupinové třídění prezentujeme: v tabulkové podobě — tabulky rozdělení četností, v grafické podobě — histogramy a výsečové grafy rozdělení četností.
1
4.1.
Jednoduché (prosté) třídění
Jednoduché třídění je typické pro: třídění kvalitativních (slovních) znaků, kvantitativních diskrétních (nespojitých) číselných znaků s malou obměnou hodnot statistického znaku. 4.1.1. Třídění kvalitativních (slovních) znaků Třídění kvalitativních (slovních) znaků se uskutečňuje podle obměn statistického znaku Na třídění požíváme třídící tabulku (5.1), která má standardní strukturu. Pořadí obměn volíme prvotně podle následujících možností: – obměny je možné seřadit podle významu (např. podle úrovně školy) – obměny je možné vystupňovat (např. hodnocení studentů) – obměny seřadíme podle abecedy, – obměny seřadíme náhodně (barvy aut), – obměny seřadíme náhodně podle subjektivního názoru řešitele. Obměny můžeme seřadit druhotně podle absolutní početnosti sestupně anebo vzestupně Jednotlivým obměnám přiřadíme: – příslušný počet výskytů v souboru — absolutní četnost ni – podíl na celkovém rozsahu souboru — relativní četnost pi – součtový počet od prvé po poslední třídu — kumulativní abs. četnost kni – součtový podíl od prvé po poslední třídu — kumulativní rel. četnost kpi Tabulka se doplňuje součtovým řádkem, který slouží na křížovou kontrolu správnosti třídění. Příklad na jednoduché třídění 155 studentů středních škol. Tab. 4.1 Třídění studentů podle typu střední školy
Třída k
Třídící znak
(pořadové číslo)
(typ střední školy)
1 2 3 4 5 SUMA
OU OUM SŠ G RG X
Absolutní četnost ni (počet studentů)
36 29 29 30 31 155
Relativní četnost pi [%] (podíl studentů)
23,2 18,7 18,7 19,4 20,0 100,0 2
Kumulativní četnost
kni (Součtový počet studentů) 36 65 94 124 155 X
Kumulativní relativní četnost kpi [%] (Součtový podíl studentů) 23,2 41,9 60,6 80,0 100,0 X
Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se doplňuje většinou: – sloupcovým grafem1 absolutních početností anebo, – kruhovým2 výsečovým grafem relativních četností vyjádřených v %. Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou.
Počet absolventů
Sloupcový graf početností absolventů středních škol 36
40 30
29
29
30
31
OUM
SŠ
G
RG
20 10 0 OU
Typ střední školy
Obr. 4.1. Počty absolventů středních škol podle typu střední školy
Výsečový graf podielu absolventů středních škol
20%
23%
OU OUM SŠ
19%
19%
G RG
19%
Obr. 4.2. Podíl absolventů středních škol podle typu střední školy
1
Sloupcové grafy poskytují jednoduchý a srozumitelný způsob zobrazování nominálních a ordinálních dat, které chceme zařadit do tříd. Četnost třídy se zobrazuje jako plocha sloupce sestrojeného nad příslušným intervalem (třídou). Třídění může být podle jednoho znaku (kritéria) anebo podle dvou znaků (kritérií). 2 2. Kruhový výsečový diagram rozdělí kruh na více částí podle počtu tříd. Četnost třídy je vyjádřená velikostí plochy kruhového výseku.
3
4.1.2. Třídění kvantitativních (číselných) diskrétních (nespojitých) znaků V případě, že má kvantitativní (číselný) diskrétní (nespojitý) znak málo obměn (obecně k) používá se jednoduché třídění. Třídíme podle každé hodnoty znaku xi, přičemž hodnoty znaku v tabulce uvedeme ve vzestupném pořadí. Obměny můžeme seřadit stejně jako u slovních znaků druhotně podle absolutní početnosti sestupně anebo vzestupně Ke každé hodnotě xi přiřadíme příslušný počet výskytů v souboru — četnost ni. Tab. 4.2 Třídění rodin podle počtu dětí
Třída p.č. k 1 2 3 4 5 SUMA
Třídící znak xi
(počet dětí)
1 2 3 4 5 a více X
Absolutní četnost ni
(počet rodin)
460 404 101 30 5 1000
Relativní četnost pi [%] (podíl rodin)
46,0 40,4 10,1 3,0 0,5 100,0
Kumulativní četnost
kni (Součtový počet rodin) 460 864 965 995 1000 X
Kumulativní relativní četnost kpi [%] (Součtový podíl rodin) 46,0 86,4 96,5 99,5 100,0 X
Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se doplňuje většinou: – sloupcovým grafem3 absolutních početností anebo, – kruhovým4 výsečovým grafem relativních četností vyjádřených v %. Grafy mohou být i v podobě nepravých trojrozměrných grafů (pseudo 3G). Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou.
3
Sloupcové grafy poskytují jednoduchý a srozumitelný způsob zobrazování nominálních a ordinálních dat, které chceme zařadit do tříd. Četnost třídy se zobrazuje jako plocha sloupce sestrojeného nad příslušným intervalem (třídou). Třídění může být podle jednoho znaku (kritéria) anebo podle dvou znaků (kritérií). 4 2. Kruhový výsečový diagram rozdělí kruh na více částí podle počtu tříd. Četnost třídy je vyjádřená velikostí plochy kruhového výseku.
4
Sloupcový graf počtu detí ve zkoumané skupině 1000 rodin P o č e t
460
r 500 o 400 d i 300 n 200
404
101 30
100
5
0 1
2
3
4 5 a viac Počet dětí v rodině
Obr. 4.3. Počty rodin podle počtu dětí v rodině
Výsečový pseudo 3G graf počtu detí ve zkoumané skupině 1000 rodin 101
30 5
460
404
Obr. 4.4. Podíl rodin podle počtu dětí v rodině
Kruhový graf je potřebné doplnit vysvětlující legendou.
5
Všeobecný postup tvorby tabulkové formy jednoduchého (prostého) třídění je uvedený v následující přehledné tabulce. Třída p.č.
Třídící Absolutní znak četnost xi ni
1. 2.
x1 x2
n1 n2
:
:
:
i
xi
ni
:
:
Relativní četnost pi p1
Kumulativní Kumulativní absolutní četnost relativní četnost kni kpi kn1 kp1
p2
kn2
kp2
:
:
:
ni n
pi
:
i
kni
i
nj
kpi
j 1
:
:
:
k
xk
k Součet
k
k
nj = n
kpk
pj
j 1
j 1
1
k
ni = n
knk
pk
nk
pj j 1
i 1
pi
1
i 1
Absolutní četnost ni je číslo, které určuje kolik jednotek souboru má určitou hodnotu k
přičemž platí
ni
n,
i 1
Relativní četnost pi je podíl absolutní četnosti ni a rozsahu souboru n
ni n
pi
k
přičemž
platí
pi
1,
anebo
alternativně
v procentech
i 1
k
100 pi
100 (%) ,
i 1
Kumulativní (součtová) absolutní četnost kni udává postupný součet četností od i
1. třídy až po danou třídu — kni
nj . j 1
Kumulativní (součtová) relativní četnost kpi udává postupný podíl četností od 1. i
třídy až po danou třídu — kpi
p j , alternativně opět v %. j 1
6
4.1.3. Skupinové (intervalové) třídění Skupinové (intervalové) třídění používáme v případě, že číselné znaky (spojité i nespojité) vykazují velké množství obměn. Skupinové třídění spočívá ve vytvoření k tříd (skupin, intervalů) ve variačním rozpětí R souboru od minimální xi, min až po maximální ximax, hodnotu znaku. Původní data se zařazují do těchto tříd (skupin, intervalů) a zjišťují se početnosti jednotlivých tříd, čím se vytvoří rozdělení četností. Vzniká tak tabulka četností podle základní úpravy na následujícím obrázku. Třída
k
Hranice třídy dolní xd
horní xh
Střed třídy (třídní znak) xi
Absolutní četnost
Relativní četnost
ni
pi
Kumulativní četnost absolutní relativní kni kpi
Tabulky četností mohou mít i jinou úpravu při zachování uvedených hodnot. Příklady úprav jsou uvedeny v následujících příkladech. Zásady platné pro skupinové třídění: třídy mají vždy konstantní šířku, počet tříd k musí být v rozmezí 6 až 15, počet intervalů nemá být ani příliš malý (vede k hrubému, zjednodušenému pohledu), ani příliš velký (dělá třídění nepřehledným), všechny obměny znaku, které jsme zařadili do příslušné třídy nahrazujeme tzv. reprezentativní hodnotou, za kterou se většinou volí střed intervalu xi, tzv. třídní znak, šířku h, dolní hranici xd, horní hranici xh a středy tříd xi volíme s ohledem na maximální přehlednost, hranice tříd musí mít nesporné (jednoznačné) vymezení, Vymezení celočíselný znak hranic tříd do 100 do 100 <15 až 20) 101—200 100—200 NEVHODNÉ <20 až 25) 201—….. 200—….. <25 až 30) <30 až 35) spojitý znak Hranice třídy <35 až 40) dolní horní <40 až 45) <15 20) <20 25) <25 30) <30 35) <35 40) <40 45)
7
Tvorba tabulky četností se skládá z těchto kroků: 1. Určete počet tříd k, které bude tabulka četností obsahovat. Počet tříd volíme intuitivně v rozpětí 6-15 anebo vypočítáme podle Sturgersovho pravidla vzorce k = 1 + 3,322 log n, kde vypočítané číslo zaokrouhlujeme nahoru. 2. Vypočítejte variační rozpětí Rv jako rozdíl mezi největší a nejmenší hodnotou variační řady Rv = xmax - xmin. 3. Vypočítejte šířku třídy h dělením variačního rozpětí počtem tříd h = Rv / k. Výsledek se zaokrouhlí směrem nahoru tak, aby se dala do tabulky zařadit každá hodnota znaku. 4. Vypočítáme středy tříd xi (i =1, 2, …, k). 5. Přiřaďte dolní a horní hranice jednotlivým třídám. Dolní hranice první třídy xd bude rovná xmin. Horní hranice poslední třídy xh bude rovná xmax. Dbáme na „nesporné vymezení“ hranic jednotlivých tříd. 6. Zařaďte jednotlivé hodnoty statistického znaku do příslušné třídy např. s využitím čárkovací metody, čím dostanete absolutní četnosti jednotlivých tříd ni. 7. Vypočítejte relativní četnosti pi a kumulativní četnosti absolutní kni relativní kpi a zapište je do dalších sloupců.
a
Absolutní četnost ni u skupinového (intervalového) třídění je číslo, které určuje kolik jednotek souboru má hodnotu, která padá do stanoveného rozpětí příslušné třídy, k
přičemž platí
ni
n
i 1
Relativní četnost pi u skupinového (intervalového) třídění je stejně jako u jednoduchého třídění podíl absolutní četnosti ni a rozsahu souboru n. pi = ni / n. k
Opět platí
k
pi
1 , alternativně v procentech
100 pi
100 (%) ,;
i 1
i 1
Kumulativní četnost (absolutní, relativní) kni u skupinového (intervalového) třídění dává informaci, kolik jednotek souboru resp. jaká poměrná část souboru má hodnotu znaku menší nebo rovnou jako je střed třídy (třídní znak). i
kni
i
n j , kpi j 1
pj j 1
k
Úhrn hodnot znaku u skupinového třídění lze jen odhadovat jako
xi ni , i 1
kde xi jsou středy tříd.
8
Příklad skupinového třídění: Třídit soubor 80 tříčlenných zaměstnaneckých domácností podle výše měsíčních příjmů v tis. Kč. Neuspořádaná řada: Uspořádaná (variační) řada:
x1 33,5, x2 24,7,....., x80 27,7 x(1) 15,9, x( 2) 17,3,....., x(80 ) 47,1
xmin = 15,9, xmax = 47,1 Počet tříd stanovený intuitivně
k = 6.
Rozpětí třídy
h = (47,1 - 15,9)/6 = 5,2, zaokrouhleně 5.
Tab. 4.3 Rozdělení domácností podle příjmových skupin
Střed Počet Podíl Součtová četnost Třída Hranice měsíčních příjmové domácností domácností domácností příjmů [Čk] hranice [%] absolutní relativní [Čk] [%] k xd - xh xi ni pi kni kpi 1. <15 až 20) 17,5 12 15 12 15,0 2. <20 až 25) 22,5 32 40 44 55,0 3. <25 až 30) 27,5 20 25 64 80,0 4. <30 až 35) 32,5 8 10 72 90,0 5. <35 až 40) 37,5 6 8 78 98,0 6. <40 až 45) 42,5 2 2 80 100,0 80 100
9
Tabulková forma skupinového třídění se doplňuje: histogramem nebo polygonem absolutních četností, výsečovým grafem relativních četností vyjádřených v %, polygonem absolutních nebo relativních početností Histogram skupinového (intervalového) třídění je sloupcový graf tvořený pravidelnými rovnoběžníky, kterých obsah (i nulový) je úměrný úhrnu hodnot znaku příslušné třídy. Základy sloupců na ose x mají délku zvolených intervalů (šířky třídy) h, pro všechny stejnou a příslušné výšky mají velikost odpovídající třídní četnosti. Polygon absolutních četností je možné odvodit z histogramu. Spojuje třídní znaky jednotlivých tříd (intervalů). Polygon začíná a končí na vodorovné souřadnicové ose ve středu sousedních prázdných tříd. Polygon kumulativních absolutních nebo relativních početností začíná na ose x u dolní hranice prvé třídy a pokračuje jako spojnice horních hranic jednotlivých tříd.
Relativní součtový počet domácností kpi
Grafy skupinového rozdělení četností (příklady)
100
32
Počet domácností
24
16
8
15
20 25 30 35 40
75
50
25
15
45
20 25 30 35 40
45
Příjmové rozpětí rodin [Čk]
Příjmové rozpětí rodin [Čk]
Obr. 4.5. Počet domácností v jednotlivých příjmových intervalech
10
Různé typické tvary histogramů:
symetrické modální
extrémně pravostranné
tvar “U”
levostranně nesouměrné
rovnoměrné
dvouvrcholové
11
4.1.4. Řešení extrémů v datech – otevřená třída Při statistickém zjišťování se můžeme často setkat s případy, že některá (některé) hodnota (hodnoty) zkoumaného statistického znaku se vymyká ze zjištěných hodnot směrem dolu anebo nahoru - extrém. Příklad Ve zkoumaném souboru 1000 mužů se vyskytl jeden, který měl hmotnost 42 kg a jeden, který měl hmotnost 200 kg, přičemž další bližší hodnoty hmotnosti byly 65 kg a 110 kg. Uspořádaná x(1) 42,0, x( 2 )
řada hmotnosti statistického 65,0,....., x 999 110,0, x 1000 200
vzorku
1000
mužů:
Je zřejmé, že tyto hodnoty v podobě lokálních extrémů by zkreslili všechny další výpočty. Tato situace se řeší tak, že při výpočtech počtu tříd k a rozpětí třídy h se tyto hodnoty zanedbají a v tabulce rozdělení četnosti se neuvede dolní hranice xd první třídy a horní hranice xh poslední třídy. Forma zápisu takto upravené tabulky může být různorodá, ale vždy nám napovídá o tom, že v zkoumaném statistickém souboru se takový extrém vyskytl Vymezení hranic tříd do 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40 a více
Hranice třídy dolní horní do 20) <20 25) <25 30) <30 35) <35 40) <40 a více
Vymezení hranic tříd - 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40
Hranice třídy dolní horní 20 21 25 26 30 31 35 36 40 41
Otevřenou dolní a horní třídu můžeme použít i samostatně, pokud se extrém vyskytl jenom na jedné straně. Otevřenou třídu můžeme použít i v případě, že se extrém nevyskytl, ale chceme zdůraznit, že se ve spojitém prostředí mohou při zkoumání rozsáhlejšího souboru vyskytnout hodnoty nižší nebo větší než byly zjištěné. V tomto případě je, ale problematické správné stanovení dolní hranice 1. třídy xd resp. horní hranice poslední třídy xd.
12
4.2. Třídění podle více statistických znaků Klasifikace třídění podle více znaků: Hierarchické třídění — třídění podle libovolného počtu znaků, prováděné v libovolném pořadí. Uvnitř tříd jednoho znaku jsou vytvářeny třídy dalšího (podřízeného znaku). Typickým výsledkem třídění je hierarchický strom — dendrogram (evoluční strom).
Např. studenti jsou nejprve tříděni podle počtu absolvovaných zkušebních termínů a uvnitř každého termínu jsou tříděni podle dosažené klasifikace, ale možno třídit i při opačném pořadí tříděných znaků. Kombinační třídění — současné třídění podle dvou znaků. Typickým výsledkem třídění jsou kombinační tabulky. Podle charakteru tříděných znaků rozlišujeme tyto kombinační tabulky: korelační tabulka — třídění podle dvou číselných znaků, kontingenční tabulka — třídění podle dvou slovních znaků, asociační tabulka — třídění podle dvou alternativních slovních znaků. Kombinační třídění se používá zejména při zkoumání závislostí mezi dvěma znaky. Např. respondenti jsou současně tříděni podle stupně dosaženého vzdělání a jimi preferované televizní stanice. Kombinační třídění můžeme použít např. při zkoumání závislosti preferované televizní stanice na vzdělání respondentů.
13
4.2.1. Třídění dvou číselných (kvantitativních) znaků – korelační tabulka Při malém počtu statistických jednotek je základem třídění číselných (kvantitativních) znaků pracovní (základní) tabulka, do které zaznamenáváme hodnoty statistických znaků pro všechny statistické jednotky od i = 1 až po i = n. Statistická jednotka
Hodnoty statistických znaků Znak xi
Znak yi
1
x1
y1
2
x2
y2
.
.
.
n
xn
yn
V této podobě jde jen o záznam výsledků zjišťování za n členný statistický soubor. Při velkém rozsahu dat je pracovní tabulka nepraktická a nepřehledná. Výhodnější je v této situaci tzv. korelační tabulka, v které jsou uvedeny četnosti kombinací obměn hodnot obou statistických znaků. Pokud jde o nezávislé statistické znaky je možné proměnné x a y v tabulce i grafu zaměnit. Pokud je možné identifikovat jeden statistický znak jako nezávislý a druhý jako závislý použijeme obměny nezávislého znaku jako záhlaví sloupců. Znak xi
Znak yi
ni
y1
y2
…….
yl
x1
n11
n12
…….
n1l
nx1
x2
n12
n22
…….
n2l
nx2
x3
n13
n23
…….
n3l
nx3
.
.
.
…….
.
.
ny1
ny2
…….
.
n
V případě, že je počet obměn některého číselného (kvantitativního) statistického znaku velký, musí být konkrétní obměny nahrazeny skupinami (intervaly). Konstrukce intervalů je identická jako u skupinového třídění (4.1.3)
14
Příklad: Za 10 rodin máme údaje o počtu dětí v rodině (proměnná x) a velikosti bytu (proměnná y) vyjádřené počtem místností. Pracovní (základní) tabulka Rodina Počet dětí v rodině (proměnná x) Počet místností (proměnná y)
1 1
2 1
3 0
4 2
5 0
6 1
7 2
8 0
9 3
10 2
2
3
3
3
1
2
3
2
4
4
Korelační tabulka absolutních početností Počet dětí (proměnná x) 0 1 2 3 Celkem
Počet rodin podle počtu místností (proměnná y) 1 2 3 4 1 1 1 2 1 2 1 1 1 3 4 2
Celkem
3 3 3 1 10
Korelační tabulka relativních početností (podíl v [%]) Počet dětí (proměnná x) 0 1 2 3 Celkem
Podíl rodin podle počtu místností [%] (proměnná y) 1 2 3 4 10 10 10 20 10 20 10 10 10 30 40 20
Celkem
30 30 30 10 100
Sdružená korelační tabulka absolutních a relativních početností (podíl v [%]) Počet dětí (proměnná x)
0 1 2 3 Celkem
1 1/10 1/10
Počet/podíl [%] rodin podle počtu místností (proměnná y) 2 3 1/10 1/10 2/20 1/10 2/20 3/30 4/40
15
Celkem
4 1/10 1/10 2/20
3/30 3/30 3/30 1/10 10/100
Prostředkem grafické prezentace úloh o měření závislostí číselných znaků je korelační diagram. Základním korelačním diagramem je korelační (bodový) diagram. Body v grafu představují jednotlivé statistické jednotky. Každému bodu (statistické jednotce) odpovídají hodnoty na osách (x, y): prvá proměnná určuje souřadnici na svislé ose (y) – konkrétní obměna prvého statistického znaku, druhá proměnná určuje souřadnici na vodorovné ose (x) – konkrétní obměna druhého statistického znaku, Obměny nezávislého statistického znaku patří na osu x. Obměny závislého statistického znaku patří na osu y. Pokud jde o nezávislé statistické znaky je možné proměnné x a y v grafu zaměnit.
Počet letokruhů
Příklad: U nařezaných prken můžeme zkoumat závislost jejich síly a počtu letokruhů. K interpretaci údajů může sloužit např. bodový korelační diagram.
12 10 8 6 4 2 0
1,0
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
Síla prkna [cm] Obr. 4.6 Příklad bodového korelačního diagramu
Bodový korelační znak má nevýhodu v tom, že statistické jednotky se stejnými obměnami statistických znaků se překrývají. V tomto případě je výhodnější použít pseudo 3-D graf, kde jsou na osách x a z obměny statistických znaků a na ose y počty statistických jednotek. Příklad je uvedený u třídění dvou slovních znaků (4.2.2)
16
4.2.2. Třídění dvou slovních (kvalitativních) znaků – kontingenční tabulka Na třídění statistických jednotek podle dvou statistických slovních (kvalitativních) znaků se používá stejný postup jako u číselných znaků, s výjimkou intervalové konstrukce obměn statistických znaků. Pořadí obměn statistických znaků v záhlaví sloupců a řádku se řídí stejnými zásadami jako u jednoduchého třídění (4.1.1) Tabulka třídění statistických jednotek podle dvou statistických slovních (kvalitativních) znaků se nazývá kontingenční tabulka. Je základem na řešení kontingenční úlohy a kontingenční závislosti. Příklad: Tab.4.4 Třídění domů v obci XY za posledních 50 let podle druhu zabezpečovacího zařízení a počtu vykradení Počet vykradených domů podle počtu vykradení Typ zabezpečení domu 0x 1x 2x 3x 4x 5x
Celkem domů
Bez zabezpečení
94
25
5
2
2
1
129
Bezpečnostní zámek
30
5
3
1
1
1
41
Bezpečnostní dveře
10
3
2
0
0
0
15
Bezpečnostní okna a dveře
4
1
1
0
0
0
6
Kamerový systém
4
1
0
0
0
0
5
Komplexní zabezpečení Celkem domů
4
0
0
0
0
0
4
146
35
11
3
3
2
200
Na grafické zobrazení kontingenční tabulky používáme nejčastěji pseudo 3-D graf, kde jsou na osách x a z obměny statistických znaků a na ose y počty statistických jednotek.
Obr. 4.7 Počet domov v obci XY za posledných 50 rokov rozdelených podľa typu zabezpečenia a počtu vykradnutí domu
17
4.2.3. Třídění dvou slovních (kvalitativních) znaků – asociační tabulka Speciálním případem třídění podle dvou statistických znaků je asociační tabulka, kterou používáme v případě, že oba statistické znaky dosahují jen dvou obměn alternativ. Příklad: Soubor pracovníků podniku „B“, rok 2001, n = 450 alternativní znaky: A … očkování, B … onemocnění Tab.4.5 Třídění pracovníků podle účinnosti očkování
Onemocnění (B) Očkování (A)
ano ne
ano 12 53 65
ne 323 62 385
4.2.4. Třídění podle tří a více statistických znaků Třídění podle tří a více statistických znaků není předmětem předmětu.
18
335 115 450