4. Třídění statistických dat pořádek v datech

4. Třídění statistických dat – pořádek v datech Základní členění statistických řad: řada časová, řada prostorová, řada věcná věcná slovní řada, věcná číselná řada. Základem statistického třídění je uspořádání hodnot jednoho statistického znaku. Z tohoto pohledu rozeznáváme: x1 , x2 ,..., xi ,...xn , řada neuspořádaná (původní naměřená řada) řada uspořádaná (variační) podle velikosti,

x(1) , x( 2) ,..., x(i ) ,..., x( n)

řada tříděná, - jednoduché (prosté) třídění, - skupinové (intervalové) třídění. Index i souvisí s pořadím zjišťování, index (i) souvisí s velikostí hodnot, přičemž x(1) x( 2) ,... x(i ) ...x( n ) a x(1) xmin , x( n) xmax . Výsledkem všech druhů třídění je řada rozdělení četností v tabulkové nebo grafické podobě. Prosté (jednoduché) třídění je třídění prováděné podle každé hodnoty (obměny) znaku samostatně. Výhodné je v situaci, kdy statistický znak dosahuje jen omezeného počtu obměn. Prosté třídění prezentujeme: v tabulkové podobě — tabulky rozdělení četností, v grafické podobě — sloupcové a výsečové grafy, polygony rozdělení četností. Skupinové (intervalové) třídění je rozdělení statistických jednotek podle hodnot (obměn) statistického znaku shrnutých do společné skupiny (třídy, intervalu) tak, aby co nejlépe vynikli charakteristické vlastnosti zkoumaných jevů. Skupinové třídění prezentujeme: v tabulkové podobě — tabulky rozdělení četností, v grafické podobě — histogramy a výsečové grafy rozdělení četností.

1

4.1.

Jednoduché (prosté) třídění

Jednoduché třídění je typické pro: třídění kvalitativních (slovních) znaků, kvantitativních diskrétních (nespojitých) číselných znaků s malou obměnou hodnot statistického znaku. 4.1.1. Třídění kvalitativních (slovních) znaků Třídění kvalitativních (slovních) znaků se uskutečňuje podle obměn statistického znaku Na třídění požíváme třídící tabulku (5.1), která má standardní strukturu. Pořadí obměn volíme prvotně podle následujících možností: – obměny je možné seřadit podle významu (např. podle úrovně školy) – obměny je možné vystupňovat (např. hodnocení studentů) – obměny seřadíme podle abecedy, – obměny seřadíme náhodně (barvy aut), – obměny seřadíme náhodně podle subjektivního názoru řešitele. Obměny můžeme seřadit druhotně podle absolutní početnosti sestupně anebo vzestupně Jednotlivým obměnám přiřadíme: – příslušný počet výskytů v souboru — absolutní četnost ni – podíl na celkovém rozsahu souboru — relativní četnost pi – součtový počet od prvé po poslední třídu — kumulativní abs. četnost kni – součtový podíl od prvé po poslední třídu — kumulativní rel. četnost kpi Tabulka se doplňuje součtovým řádkem, který slouží na křížovou kontrolu správnosti třídění. Příklad na jednoduché třídění 155 studentů středních škol. Tab. 4.1 Třídění studentů podle typu střední školy

Třída k

Třídící znak

(pořadové číslo)

(typ střední školy)

1 2 3 4 5 SUMA

OU OUM SŠ G RG X

Absolutní četnost ni (počet studentů)

36 29 29 30 31 155

Relativní četnost pi [%] (podíl studentů)

23,2 18,7 18,7 19,4 20,0 100,0 2

Kumulativní četnost

kni (Součtový počet studentů) 36 65 94 124 155 X

Kumulativní relativní četnost kpi [%] (Součtový podíl studentů) 23,2 41,9 60,6 80,0 100,0 X

Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se doplňuje většinou: – sloupcovým grafem1 absolutních početností anebo, – kruhovým2 výsečovým grafem relativních četností vyjádřených v %. Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou.

Počet absolventů

Sloupcový graf početností absolventů středních škol 36

40 30

29

29

30

31

OUM

SŠ

G

RG

20 10 0 OU

Typ střední školy

Obr. 4.1. Počty absolventů středních škol podle typu střední školy

Výsečový graf podielu absolventů středních škol

20%

23%

OU OUM SŠ

19%

19%

G RG

19%

Obr. 4.2. Podíl absolventů středních škol podle typu střední školy

1

Sloupcové grafy poskytují jednoduchý a srozumitelný způsob zobrazování nominálních a ordinálních dat, které chceme zařadit do tříd. Četnost třídy se zobrazuje jako plocha sloupce sestrojeného nad příslušným intervalem (třídou). Třídění může být podle jednoho znaku (kritéria) anebo podle dvou znaků (kritérií). 2 2. Kruhový výsečový diagram rozdělí kruh na více částí podle počtu tříd. Četnost třídy je vyjádřená velikostí plochy kruhového výseku.

3

4.1.2. Třídění kvantitativních (číselných) diskrétních (nespojitých) znaků V případě, že má kvantitativní (číselný) diskrétní (nespojitý) znak málo obměn (obecně k) používá se jednoduché třídění. Třídíme podle každé hodnoty znaku xi, přičemž hodnoty znaku v tabulce uvedeme ve vzestupném pořadí. Obměny můžeme seřadit stejně jako u slovních znaků druhotně podle absolutní početnosti sestupně anebo vzestupně Ke každé hodnotě xi přiřadíme příslušný počet výskytů v souboru — četnost ni. Tab. 4.2 Třídění rodin podle počtu dětí

Třída p.č. k 1 2 3 4 5 SUMA

Třídící znak xi

(počet dětí)

1 2 3 4 5 a více X

Absolutní četnost ni

(počet rodin)

460 404 101 30 5 1000

Relativní četnost pi [%] (podíl rodin)

46,0 40,4 10,1 3,0 0,5 100,0

Kumulativní četnost

kni (Součtový počet rodin) 460 864 965 995 1000 X

Kumulativní relativní četnost kpi [%] (Součtový podíl rodin) 46,0 86,4 96,5 99,5 100,0 X

Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se doplňuje většinou: – sloupcovým grafem3 absolutních početností anebo, – kruhovým4 výsečovým grafem relativních četností vyjádřených v %. Grafy mohou být i v podobě nepravých trojrozměrných grafů (pseudo 3G). Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou.

3

Sloupcové grafy poskytují jednoduchý a srozumitelný způsob zobrazování nominálních a ordinálních dat, které chceme zařadit do tříd. Četnost třídy se zobrazuje jako plocha sloupce sestrojeného nad příslušným intervalem (třídou). Třídění může být podle jednoho znaku (kritéria) anebo podle dvou znaků (kritérií). 4 2. Kruhový výsečový diagram rozdělí kruh na více částí podle počtu tříd. Četnost třídy je vyjádřená velikostí plochy kruhového výseku.

4

Sloupcový graf počtu detí ve zkoumané skupině 1000 rodin P o č e t

460

r 500 o 400 d i 300 n 200

404

101 30

100

5

0 1

2

3

4 5 a viac Počet dětí v rodině

Obr. 4.3. Počty rodin podle počtu dětí v rodině

Výsečový pseudo 3G graf počtu detí ve zkoumané skupině 1000 rodin 101

30 5

460

404

Obr. 4.4. Podíl rodin podle počtu dětí v rodině

Kruhový graf je potřebné doplnit vysvětlující legendou.

5

Všeobecný postup tvorby tabulkové formy jednoduchého (prostého) třídění je uvedený v následující přehledné tabulce. Třída p.č.

Třídící Absolutní znak četnost xi ni

1. 2.

x1 x2

n1 n2

:

:

:

i

xi

ni

:

:

Relativní četnost pi p1

Kumulativní Kumulativní absolutní četnost relativní četnost kni kpi kn1 kp1

p2

kn2

kp2

:

:

:

ni n

pi

:

i

kni

i

nj

kpi

j 1

:

:

:

k

xk

k Součet

k

k

nj = n

kpk

pj

j 1

j 1





1

k

ni = n



knk

pk

nk

pj j 1

i 1

pi

1

i 1

Absolutní četnost ni je číslo, které určuje kolik jednotek souboru má určitou hodnotu k

přičemž platí

ni

n,

i 1

Relativní četnost pi je podíl absolutní četnosti ni a rozsahu souboru n

ni n

pi

k

přičemž

platí

pi

1,

anebo

alternativně

v procentech

i 1

k

100 pi

100 (%) ,

i 1

Kumulativní (součtová) absolutní četnost kni udává postupný součet četností od i

1. třídy až po danou třídu — kni

nj . j 1

Kumulativní (součtová) relativní četnost kpi udává postupný podíl četností od 1. i

třídy až po danou třídu — kpi

p j , alternativně opět v %. j 1

6

4.1.3. Skupinové (intervalové) třídění Skupinové (intervalové) třídění používáme v případě, že číselné znaky (spojité i nespojité) vykazují velké množství obměn. Skupinové třídění spočívá ve vytvoření k tříd (skupin, intervalů) ve variačním rozpětí R souboru od minimální xi, min až po maximální ximax, hodnotu znaku. Původní data se zařazují do těchto tříd (skupin, intervalů) a zjišťují se početnosti jednotlivých tříd, čím se vytvoří rozdělení četností. Vzniká tak tabulka četností podle základní úpravy na následujícím obrázku. Třída

k

Hranice třídy dolní xd

horní xh

Střed třídy (třídní znak) xi

Absolutní četnost

Relativní četnost

ni

pi

Kumulativní četnost absolutní relativní kni kpi

Tabulky četností mohou mít i jinou úpravu při zachování uvedených hodnot. Příklady úprav jsou uvedeny v následujících příkladech. Zásady platné pro skupinové třídění: třídy mají vždy konstantní šířku, počet tříd k musí být v rozmezí 6 až 15, počet intervalů nemá být ani příliš malý (vede k hrubému, zjednodušenému pohledu), ani příliš velký (dělá třídění nepřehledným), všechny obměny znaku, které jsme zařadili do příslušné třídy nahrazujeme tzv. reprezentativní hodnotou, za kterou se většinou volí střed intervalu xi, tzv. třídní znak, šířku h, dolní hranici xd, horní hranici xh a středy tříd xi volíme s ohledem na maximální přehlednost, hranice tříd musí mít nesporné (jednoznačné) vymezení, Vymezení celočíselný znak hranic tříd do 100 do 100 <15 až 20) 101—200 100—200 NEVHODNÉ <20 až 25) 201—….. 200—….. <25 až 30) <30 až 35) spojitý znak Hranice třídy <35 až 40) dolní horní <40 až 45) <15 20)  <20 25) <25 30) <30 35) <35 40) <40 45) 

7

Tvorba tabulky četností se skládá z těchto kroků: 1. Určete počet tříd k, které bude tabulka četností obsahovat. Počet tříd volíme intuitivně v rozpětí 6-15 anebo vypočítáme podle Sturgersovho pravidla vzorce k = 1 + 3,322 log n, kde vypočítané číslo zaokrouhlujeme nahoru. 2. Vypočítejte variační rozpětí Rv jako rozdíl mezi největší a nejmenší hodnotou variační řady Rv = xmax - xmin. 3. Vypočítejte šířku třídy h dělením variačního rozpětí počtem tříd h = Rv / k. Výsledek se zaokrouhlí směrem nahoru tak, aby se dala do tabulky zařadit každá hodnota znaku. 4. Vypočítáme středy tříd xi (i =1, 2, …, k). 5. Přiřaďte dolní a horní hranice jednotlivým třídám. Dolní hranice první třídy xd bude rovná xmin. Horní hranice poslední třídy xh bude rovná xmax. Dbáme na „nesporné vymezení“ hranic jednotlivých tříd. 6. Zařaďte jednotlivé hodnoty statistického znaku do příslušné třídy např. s využitím čárkovací metody, čím dostanete absolutní četnosti jednotlivých tříd ni. 7. Vypočítejte relativní četnosti pi a kumulativní četnosti absolutní kni relativní kpi a zapište je do dalších sloupců.

a

Absolutní četnost ni u skupinového (intervalového) třídění je číslo, které určuje kolik jednotek souboru má hodnotu, která padá do stanoveného rozpětí příslušné třídy, k

přičemž platí

ni

n

i 1

Relativní četnost pi u skupinového (intervalového) třídění je stejně jako u jednoduchého třídění podíl absolutní četnosti ni a rozsahu souboru n. pi = ni / n. k

Opět platí

k

pi

1 , alternativně v procentech

100 pi

100 (%) ,;

i 1

i 1

Kumulativní četnost (absolutní, relativní) kni u skupinového (intervalového) třídění dává informaci, kolik jednotek souboru resp. jaká poměrná část souboru má hodnotu znaku menší nebo rovnou jako je střed třídy (třídní znak). i

kni

i

n j , kpi j 1

pj j 1

k

Úhrn hodnot znaku u skupinového třídění lze jen odhadovat jako

xi ni , i 1

kde xi jsou středy tříd.

8

Příklad skupinového třídění: Třídit soubor 80 tříčlenných zaměstnaneckých domácností podle výše měsíčních příjmů v tis. Kč. Neuspořádaná řada: Uspořádaná (variační) řada:

x1 33,5, x2 24,7,....., x80 27,7 x(1) 15,9, x( 2) 17,3,....., x(80 ) 47,1

xmin = 15,9, xmax = 47,1 Počet tříd stanovený intuitivně

k = 6.

Rozpětí třídy

h = (47,1 - 15,9)/6 = 5,2, zaokrouhleně 5.

Tab. 4.3 Rozdělení domácností podle příjmových skupin

Střed Počet Podíl Součtová četnost Třída Hranice měsíčních příjmové domácností domácností domácností příjmů [Čk] hranice [%] absolutní relativní [Čk] [%] k xd - xh xi ni pi kni kpi 1. <15 až 20) 17,5 12 15 12 15,0 2. <20 až 25) 22,5 32 40 44 55,0 3. <25 až 30) 27,5 20 25 64 80,0 4. <30 až 35) 32,5 8 10 72 90,0 5. <35 až 40) 37,5 6 8 78 98,0 6. <40 až 45) 42,5 2 2 80 100,0     80 100

9

Tabulková forma skupinového třídění se doplňuje: histogramem nebo polygonem absolutních četností, výsečovým grafem relativních četností vyjádřených v %, polygonem absolutních nebo relativních početností Histogram skupinového (intervalového) třídění je sloupcový graf tvořený pravidelnými rovnoběžníky, kterých obsah (i nulový) je úměrný úhrnu hodnot znaku příslušné třídy. Základy sloupců na ose x mají délku zvolených intervalů (šířky třídy) h, pro všechny stejnou a příslušné výšky mají velikost odpovídající třídní četnosti. Polygon absolutních četností je možné odvodit z histogramu. Spojuje třídní znaky jednotlivých tříd (intervalů). Polygon začíná a končí na vodorovné souřadnicové ose ve středu sousedních prázdných tříd. Polygon kumulativních absolutních nebo relativních početností začíná na ose x u dolní hranice prvé třídy a pokračuje jako spojnice horních hranic jednotlivých tříd.

Relativní součtový počet domácností kpi

Grafy skupinového rozdělení četností (příklady)

100

32

Počet domácností

24

16

8

15

20 25 30 35 40

75

50

25

15

45

20 25 30 35 40

45

Příjmové rozpětí rodin [Čk]

Příjmové rozpětí rodin [Čk]

Obr. 4.5. Počet domácností v jednotlivých příjmových intervalech

10

Různé typické tvary histogramů:

symetrické modální

extrémně pravostranné

tvar “U”

levostranně nesouměrné

rovnoměrné

dvouvrcholové

11

4.1.4. Řešení extrémů v datech – otevřená třída Při statistickém zjišťování se můžeme často setkat s případy, že některá (některé) hodnota (hodnoty) zkoumaného statistického znaku se vymyká ze zjištěných hodnot směrem dolu anebo nahoru - extrém. Příklad Ve zkoumaném souboru 1000 mužů se vyskytl jeden, který měl hmotnost 42 kg a jeden, který měl hmotnost 200 kg, přičemž další bližší hodnoty hmotnosti byly 65 kg a 110 kg. Uspořádaná x(1) 42,0, x( 2 )

řada hmotnosti statistického 65,0,....., x 999 110,0, x 1000 200

vzorku

1000

mužů:

Je zřejmé, že tyto hodnoty v podobě lokálních extrémů by zkreslili všechny další výpočty. Tato situace se řeší tak, že při výpočtech počtu tříd k a rozpětí třídy h se tyto hodnoty zanedbají a v tabulce rozdělení četnosti se neuvede dolní hranice xd první třídy a horní hranice xh poslední třídy. Forma zápisu takto upravené tabulky může být různorodá, ale vždy nám napovídá o tom, že v zkoumaném statistickém souboru se takový extrém vyskytl Vymezení hranic tříd do 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40 a více 

Hranice třídy dolní horní do 20) <20 25) <25 30) <30 35) <35 40) <40 a více 

Vymezení hranic tříd - 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40 

Hranice třídy dolní horní 20 21 25 26 30 31 35 36 40 41 

Otevřenou dolní a horní třídu můžeme použít i samostatně, pokud se extrém vyskytl jenom na jedné straně. Otevřenou třídu můžeme použít i v případě, že se extrém nevyskytl, ale chceme zdůraznit, že se ve spojitém prostředí mohou při zkoumání rozsáhlejšího souboru vyskytnout hodnoty nižší nebo větší než byly zjištěné. V tomto případě je, ale problematické správné stanovení dolní hranice 1. třídy xd resp. horní hranice poslední třídy xd.

12

4.2. Třídění podle více statistických znaků Klasifikace třídění podle více znaků: Hierarchické třídění — třídění podle libovolného počtu znaků, prováděné v libovolném pořadí. Uvnitř tříd jednoho znaku jsou vytvářeny třídy dalšího (podřízeného znaku). Typickým výsledkem třídění je hierarchický strom — dendrogram (evoluční strom).

Např. studenti jsou nejprve tříděni podle počtu absolvovaných zkušebních termínů a uvnitř každého termínu jsou tříděni podle dosažené klasifikace, ale možno třídit i při opačném pořadí tříděných znaků. Kombinační třídění — současné třídění podle dvou znaků. Typickým výsledkem třídění jsou kombinační tabulky. Podle charakteru tříděných znaků rozlišujeme tyto kombinační tabulky: korelační tabulka — třídění podle dvou číselných znaků, kontingenční tabulka — třídění podle dvou slovních znaků, asociační tabulka — třídění podle dvou alternativních slovních znaků. Kombinační třídění se používá zejména při zkoumání závislostí mezi dvěma znaky. Např. respondenti jsou současně tříděni podle stupně dosaženého vzdělání a jimi preferované televizní stanice. Kombinační třídění můžeme použít např. při zkoumání závislosti preferované televizní stanice na vzdělání respondentů.

13

4.2.1. Třídění dvou číselných (kvantitativních) znaků – korelační tabulka Při malém počtu statistických jednotek je základem třídění číselných (kvantitativních) znaků pracovní (základní) tabulka, do které zaznamenáváme hodnoty statistických znaků pro všechny statistické jednotky od i = 1 až po i = n. Statistická jednotka

Hodnoty statistických znaků Znak xi

Znak yi

1

x1

y1

2

x2

y2

.

.

.

n

xn

yn

V této podobě jde jen o záznam výsledků zjišťování za n členný statistický soubor. Při velkém rozsahu dat je pracovní tabulka nepraktická a nepřehledná. Výhodnější je v této situaci tzv. korelační tabulka, v které jsou uvedeny četnosti kombinací obměn hodnot obou statistických znaků. Pokud jde o nezávislé statistické znaky je možné proměnné x a y v tabulce i grafu zaměnit. Pokud je možné identifikovat jeden statistický znak jako nezávislý a druhý jako závislý použijeme obměny nezávislého znaku jako záhlaví sloupců. Znak xi

Znak yi

ni

y1

y2

…….

yl

x1

n11

n12

…….

n1l

nx1

x2

n12

n22

…….

n2l

nx2

x3

n13

n23

…….

n3l

nx3

.

.

.

…….

.

.

ny1

ny2

…….

.

n

V případě, že je počet obměn některého číselného (kvantitativního) statistického znaku velký, musí být konkrétní obměny nahrazeny skupinami (intervaly). Konstrukce intervalů je identická jako u skupinového třídění (4.1.3)

14

Příklad: Za 10 rodin máme údaje o počtu dětí v rodině (proměnná x) a velikosti bytu (proměnná y) vyjádřené počtem místností. Pracovní (základní) tabulka Rodina Počet dětí v rodině (proměnná x) Počet místností (proměnná y)

1 1

2 1

3 0

4 2

5 0

6 1

7 2

8 0

9 3

10 2

2

3

3

3

1

2

3

2

4

4

Korelační tabulka absolutních početností Počet dětí (proměnná x) 0 1 2 3 Celkem

Počet rodin podle počtu místností (proměnná y) 1 2 3 4 1 1 1 2 1 2 1 1 1 3 4 2

Celkem

3 3 3 1 10

Korelační tabulka relativních početností (podíl v [%]) Počet dětí (proměnná x) 0 1 2 3 Celkem

Podíl rodin podle počtu místností [%] (proměnná y) 1 2 3 4 10 10 10 20 10 20 10 10 10 30 40 20

Celkem

30 30 30 10 100

Sdružená korelační tabulka absolutních a relativních početností (podíl v [%]) Počet dětí (proměnná x)

0 1 2 3 Celkem

1 1/10 1/10

Počet/podíl [%] rodin podle počtu místností (proměnná y) 2 3 1/10 1/10 2/20 1/10 2/20 3/30 4/40

15

Celkem

4 1/10 1/10 2/20

3/30 3/30 3/30 1/10 10/100

Prostředkem grafické prezentace úloh o měření závislostí číselných znaků je korelační diagram. Základním korelačním diagramem je korelační (bodový) diagram. Body v grafu představují jednotlivé statistické jednotky. Každému bodu (statistické jednotce) odpovídají hodnoty na osách (x, y): prvá proměnná určuje souřadnici na svislé ose (y) – konkrétní obměna prvého statistického znaku, druhá proměnná určuje souřadnici na vodorovné ose (x) – konkrétní obměna druhého statistického znaku, Obměny nezávislého statistického znaku patří na osu x. Obměny závislého statistického znaku patří na osu y. Pokud jde o nezávislé statistické znaky je možné proměnné x a y v grafu zaměnit.

Počet letokruhů

Příklad: U nařezaných prken můžeme zkoumat závislost jejich síly a počtu letokruhů. K interpretaci údajů může sloužit např. bodový korelační diagram.

12 10 8 6 4 2 0

1,0

1,2

1,4

1,6

1,8

2,0

2,2

2,4

2,6

Síla prkna [cm] Obr. 4.6 Příklad bodového korelačního diagramu

Bodový korelační znak má nevýhodu v tom, že statistické jednotky se stejnými obměnami statistických znaků se překrývají. V tomto případě je výhodnější použít pseudo 3-D graf, kde jsou na osách x a z obměny statistických znaků a na ose y počty statistických jednotek. Příklad je uvedený u třídění dvou slovních znaků (4.2.2)

16

4.2.2. Třídění dvou slovních (kvalitativních) znaků – kontingenční tabulka Na třídění statistických jednotek podle dvou statistických slovních (kvalitativních) znaků se používá stejný postup jako u číselných znaků, s výjimkou intervalové konstrukce obměn statistických znaků. Pořadí obměn statistických znaků v záhlaví sloupců a řádku se řídí stejnými zásadami jako u jednoduchého třídění (4.1.1) Tabulka třídění statistických jednotek podle dvou statistických slovních (kvalitativních) znaků se nazývá kontingenční tabulka. Je základem na řešení kontingenční úlohy a kontingenční závislosti. Příklad: Tab.4.4 Třídění domů v obci XY za posledních 50 let podle druhu zabezpečovacího zařízení a počtu vykradení Počet vykradených domů podle počtu vykradení Typ zabezpečení domu 0x 1x 2x 3x 4x 5x

Celkem domů

Bez zabezpečení

94

25

5

2

2

1

129

Bezpečnostní zámek

30

5

3

1

1

1

41

Bezpečnostní dveře

10

3

2

0

0

0

15

Bezpečnostní okna a dveře

4

1

1

0

0

0

6

Kamerový systém

4

1

0

0

0

0

5

Komplexní zabezpečení Celkem domů

4

0

0

0

0

0

4

146

35

11

3

3

2

200

Na grafické zobrazení kontingenční tabulky používáme nejčastěji pseudo 3-D graf, kde jsou na osách x a z obměny statistických znaků a na ose y počty statistických jednotek.

Obr. 4.7 Počet domov v obci XY za posledných 50 rokov rozdelených podľa typu zabezpečenia a počtu vykradnutí domu

17

4.2.3. Třídění dvou slovních (kvalitativních) znaků – asociační tabulka Speciálním případem třídění podle dvou statistických znaků je asociační tabulka, kterou používáme v případě, že oba statistické znaky dosahují jen dvou obměn alternativ. Příklad: Soubor pracovníků podniku „B“, rok 2001, n = 450 alternativní znaky: A … očkování, B … onemocnění Tab.4.5 Třídění pracovníků podle účinnosti očkování

Onemocnění (B) Očkování (A)

ano ne

ano 12 53 65

ne 323 62 385

4.2.4. Třídění podle tří a více statistických znaků Třídění podle tří a více statistických znaků není předmětem předmětu.

18

335 115 450

4. Třídění statistických dat pořádek v datech

Recommend Documents