5. Základní statistický rozbor Základní statistický rozbor spočívá ve výpočtech a prezentaci číselných charakteristik statistického souboru hodnot zkoumaného číselného (kvantitativního) statistického znaku. Číselné charakteristiky jsou číselné hodnoty, které zhuštěním údajů souboru souhrnně charakterizují základní vlastnosti souboru z hlediska zkoumaného statistického znaku: a) absolutní úroveň (poloha, obecná výše) střední hodnoty b) variabilitu (proměnlivost) míry variace c) nesouměrnost (šikmost) míry nesouměrnosti (šikmosti) d) špičatost (koncentraci) míry špičatosti (koncentrace) Nejčastěji se používají charakteristiky úrovně a charakteristiky variability.
Početnost
ni
D A C
B Hodnoty číselného statistického znaku
xi
Obr. 6.1 Rozdělení početnosti hodnot zkoumaného znaku vybraných souborů
Soubor A má zhruba střední absolutní úroveň (střední hodnotu) z uvedených čtyř souborů a je symetrický. Soubor B má absolutní úroveň prakticky stejnou, je rovněž symetrický, vykazuje však větší variabilitu (šířku). Soubor C má absolutní úroveň nižší, variabilitu vyšší než soubor A a zhruba stejnou jako soubor B, je ale levostranně nesouměrný. Soubor D má nejvyšší úroveň, velkou variabilitu, je zešikmený doprava při vysoké špičatosti.
48
5.1. Charakteristiky úrovně (polohy) Úroveň (poloha) je nejzákladnější a nejjednodušší vlastností statistických dat. Úroveň měříme ji pomocí charakteristik úrovně. Základními charakteristikami úrovně (polohy) jsou tzv. střední hodnoty: - průměr (mocninný, aritmetický, harmonický, geometrický, kvadratický
-
xh xg x xk ), x 0,50 ~ x. medián (50% kvantil)
-
modus – modální (typická hodnota)
Střední hodnoty
x ˆ,
průměry
aritmetický kvadratický harmonický geometrický
ostatní střední hodnoty
medián modus
x xQ xH xG ~ x
ˆ x
Charakteristiky úrovně se zjišťují jako: funkce všech hodnot číselného statistického znaku (průměry). funkce významných hodnot (medián a modus), Průměry jsou střední hodnoty, které jsou počítané ze všech hodnot statistického znaku. Zjišťování mediánu a módusu nezávisí na hodnotách znaku, závisí na rozdělení početnosti znaku. Tyto střední hodnoty jsou typické svou polohou a podle toho jsou i pojmenovány.
Početnost
ni
Následující příklad ukazuje dvě tříděné datové řady lišící se pouze polohou na ose x:
modus
modus medián
medián průměr
průměr Hodnoty číselného statistického znaku
Obr. 6.2 Dva soubory odlišující se úrovní - polohou
49
xi
5.2. Kvantily a medián Medián se řadí mezi tzv. kvantily. Kvantily rozdělují vzestupně uspořádanou variační řadu v poměru četností
P:(1-P), kde
0 P 1 , alternativně 100P : (100 100P) .
Hovoříme o
P – kvantilu nebo 100P% kvantilu.
Příklady:
Medián
~ x
— 50% kvantil - rozděluje soubor na dvě poloviny ( x 0,50 ~ x ),
Kvartily
— 25%, 50% a 75% kvantil
Decily
— 9 kvantilů
( x0, 25 , x0,50 , x0,75 ), ( x0,10 , x0, 20 ,...,x0,90 ),
Percentily — 99 kvantilů, které rozdělují soubor na 100 dílů po 1 %, Oktily, sedecily — rozdělují soubor na osminy, resp. šestnáctiny U dat tříděných skupinovým tříděním určujeme pouze třídy, které obsahují příslušné kvantily, hrubou aproximaci pro kvantily představuje střed příslušné třídy. Používáme však i přesnější aproximace, které jsou založeny na předpokladu rovnoměrného rozdělení hodnot ve třídách. Medián je tedy prostřední hodnotou uspořádané řady hodnot a jako takový dělí tuto řadu na dvě stejně poloviny co do počtu členů. To znamená, že 50 % hodnot je menších a 50 % větších. Při lichém počtu členů variačnej rady je medián prostřední člen. U uspořádané řady 5, 7, 8, 8, 8, 11, 13, 16, 17, 17, 20, 20, 22 je medián .
~ x 13 V případě sudého počtu členů variačnej rady je mediánem průměr hodnot dvou prostředních členů řady. U uspořádané řady hodnot 5 , 7, 8, 8, 8, 11, 13, 16, 17, 17, 20, 20, 22 je medián
~ x 14,5
50
Aproximace kvantilů:
x P xdp kde
P 100kpP 1 h 100 p P
xdp je dolní mez třídy obsahující příslušný P- kvantil, p P je relativní četnost této třídy, 100 kpP 1 je součtová relativní četnost předcházející třídy, h je šířka třídy součtová relativní početnosť 100kp i
P pP 100kpP 1
xdp xP třídní znaky xi Obr. 6.3 Příklad na aproximaci kvantilů
U tříděného souboru, daného skupinovým (intervalovým) rozdělením četností, lze určit pouze mediální interval, tj. interval, ve kterém se medián nachází. Medián se odhaduje podle vzorce
n 1 k nm1 2 ~ x a hm nm
kde:
a - hranice mezi předmediálním a mediálním intervalem (třídou), n - rozsah souboru, knm-1- kumulativní četnost předmediálního intervalu, nm - četnost mediálního intervalu (třídy), hm - šířka mediálního intervalu (třídy).
Medián lze stanovit rovněž graficky, a to spuštěním kolmice z průsečíku grafu kumulativní četnosti vzestupné a sestupné na osu x, na které jsou vyneseny hranice třídícího znaku
51
5.3. Modus
xˆ
Modus je charakterizován jako nejčetnější hodnota kvantitativního znaku zkoumaného souboru, je to tedy hodnota, která se v souboru vyskytuje nejčastěji. Např. u souboru s hodnotami znaku 8, 9, 9, 12, 12, 12, 15, 15, 15, 15, 15, 16, 16, 17, 17, 17, 20 je nejčetnější hodnotou 15, takže modus je roven x ˆ 15 . Graficky lze modus odvodit i z rozdělení četnosti spojitého statistického znaku. Odpovídá hodnotě znaku pod vrcholem frekvenční křivky. U dat tříděných skupinovým tříděním určujeme modální interval (typickou třídu) přičemž modálním intervalem je interval s největší četností (tab. 6.1). Při určitém zjednodušení můžeme za modus považovat střední hodnotu (třídní znak) tohoto intervalu. Tab. 6.1 Rozdělení domácností podle příjmových skupin
Třída k
Hranice měsíčních příjmů (Čk)
xd - xh 1. 2. 3. 4. 5. 6.
do 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40 a více
Střed příjmové hranice (Čk)
Počet domácností
ni
xi
Relativní Kumulativní četnost počet domácností domácností pi absolutní relativní
kni
17,5 22,5 27,5 32,5 37,5 42,5
12 32 20 8 6 2 80
0,15 0,40 0,25 0,10 0,08 0,02 1,00
12 44 64 72 78 80
100kpi 15,0 55,0 80,0 90,0 98,0 100,0
Přesněji můžeme modus odhadován na základě modálního intervalu a intervalů sousedních.
xˆ L
1 h 1 2
kde: L … dolní hranice modálního intervalu, 1…rozdíl četností modálního a předcházejícího intervalu 2 …rozdíl četností modálního a následujícího intervalu h … délka modálního intervalu
52
Přesnější aproximace je založená na předpokladu rovnoměrného rozdělení hodnot ve třídách histogramu absolutní početnosti.
xˆ xdm
nm nm1 h 2nm nm1 nm1
kde:
xdm ….. nm , nm1 , nm1
je dolní mez modální třídy, je četnost modální, předcházející a následující třídy,
h …..
je šířka třídy
Početnost
ni
nm nm 1
nm 1
h xdm xˆ
třídní znaky xi
Obr. 6.3 Příklad na aproximaci módusu
53
5.4. Průměry Ve statistice rozlišujeme: všeobecný druh průměru – průměr mocninný, průměry aritmetický, kvadratický, geometrický a harmonický. Rozlišují se dvě formy výpočtu – prostá a vážená. Prostá forma je využívána u netříděných hodnot znaku (obvykle jde o málo rozsáhlé soubory), Vážená forma u hodnot tříděných (při rozdělení četností resp. intervalovém rozdělení četností). 5.4.1. Určující vlastnosti průměry Obecné vlastnosti průměrů: jsou funkcemi všech hodnot variační řady, leží vždy mezi minimální a maximální hodnotou variační řady, změní-li se kterákoli z hodnot variační řady, změní se i průměr stejným směrem (ne však o stejnou hodnotu!). Specifické vlastnosti průměrů:
aritmetický průměr – je založený na stálosti součtu hodnot
x1 x2 ... xn x x ... x
n
x i 1
kvadratický průměr – je založený na stálost součtu čtverců hodnot
x x ... x x x ... x 2 1
2 2
2 n
2 Q
2 Q
2 Q
n
x
2 i
i 1
n xQ2
harmonický průměr – je založený na stálost součtu převrácených hodnot
1 1 1 1 1 1 ... ... x1 x2 xn xH xH xH
nx
i
n
1
x i 1
i
1 xH
geometrický průměr – je založený na stálost součinu hodnot n
x1 x2 ... xn xG xG ... xG
x
i
xG
n
i 1
Při porovnávání velikosti uvedených průměrů počítaných ze stejných hodnot platí, že čím větší je stupeň mocninového průměru, tedy čím je větší s, tím má průměr vyšší úroveň:
xH xG x xQ 54
5.4.2. Mocninný průměr Skupinu průměrů lze charakterizovat obecným vzorcem jako s-tou odmocninu z aritmetického průměru s-tých mocnin hodnot číselného (kvantitativního) znaku: Mocninný průměr stupně s: v prosté formě (netříděné údaje)
xs s kde:
Platí:
ve vážené formě (tříděné údaje)
1 n s xi n i 1
xs s
1 k s xi ni n i 1
x i - hodnota znaku n - rozsah souboru s - stupeň mocninového průměru (celé číslo)
1
s 1
s2
s 1
1 xi x 1 1 xi n n 1 2
x
1 2 xi n
s0 pomocí log
2
i
xQ
n
1 1 1
1 xi n
aritmetický průměr
n 1 x i
n
xH
x
i
55
kvadratický průměr
harmonický průměr
xG
geometrický průměr
5.4.3. Aritmetický průměr Na měření průměru se nejvíce používá aritmetický průměr, který zjednodušeně označujeme jako průměr. Aritmetický průměr je mocninný průměr 1 stupně.
s 1
Aritmetický průměr by se neměl brát do úvahy, když je rozdělení vícevrcholové rozdělení je asymetrické. jsou okrajové třídy otevřené výber obsahuje extrémne málo prvkov Příklad: Soubor jednotek o rozsahu n = 12 Hodnoty kvant. znaku: 4, 4, 8, 8, 8, 9, 9, 9, 9, 9, 11, 14 n
Prostá forma výpočtu:
x
4 4 8 8 8 9 9 9 9 9 11 14 102 8,5 12 12
Vážená forma výpočtu:
x
xi x1 x2 xn i 1 x n n
x n x n x n xk nk x 1 1 2 2 3 3 n1 n2 n3 nk
4 2 8 3 9 5 111 14 1 102 8,5 2 3 5 11 12
k
x n i 1 k
i
i
n i 1
i
Při vážené formě výpočtu mohou být použity nejen absolutní četnosti, ale i četnosti relativní: k
x p x p xk p k x 1 1 2 2 p1 p2 pk
x p i 1 k
i
p i 1
x
i
i
4 16, 6 8 25 9 41, 6 11 8, 3 14 8, 3 850 8,5 16, 6 25 41, 6 8, 3 8, 3 100
56
Vážená forma musí být uplatňována při výpočtu aritmetického průměru z rozdělení četností či intervalového rozdělení četností, z dílčích průměrů, z poměrných čísel nebo procent Příklad. Známky z matematiky v určité třídě jsou uvedené v tabulce. Vypočítejte průměrnou známku z matematiky. Statistický znak Početnost
Známka Počet známek
1 14
Průměrná známka je vážený průměr.
2 6 xw
3 5
4 4
5 1
14 1 6 2 5 3 4 4 1 5 62 2,06 14 6 5 4 1 30
Vlastnosti aritmetického průměru Součet hodnot všech hodnot statistického znaku (xi) je stejný jako součin aritmetického průměru a rozsahu souboru n: n
xi x1 x2 ... xn x x ... x nx
i 1
Součet rozdílů jednotlivých hodnot statistického znaku (xi) a jejich aritmetického průměru je roven nule :
x
x 0
i
Součet čtverců rozdílů jednotlivých hodnot statistického znaku od jejich aritmetického průměru je minimální :
x
x min 2
i
Připočtení (odečtení) stejné konstanty ke (od) každé hodnotě statistického znaku (xi) má za následek zvýšení ( snížení ) aritmetického průměru o tuto konstantu.
x
a
i
n
xa
Násobením (dělením) všech hodnot statistického znaku (xi) stejnou konstantou se aritmetický průměr zvýší (sníží) konstantou-krát.
x c c x i
n
Násobením (dělením) všech četností stejnou konstantou se aritmetický průměr nemění.
xnc x n c i i i
Aritmetický průměr součtu (rozdílu) hodnot dvou statistických znaků je roven součtu (rozdílu) jejich aritmetických průměrů :
xi yi x y 57
5.4.4. Harmonický průměr Pro
s 1
bude harmonický průměr v prosté, resp. vážené formě k
n xh n 1 i 1 xi
xh
ni
í 1 k
pro
ni i 1 xi
xi 0
Určující vlastnost:
1 1 1 1 1 1 1 n ... ... x1 x2 xn xh xh xh xh i 1 xi n
Použití: Harmonický průměr se často používá na charakteristiku hodnot, které představují například výkonové limity, anebo k průměrování znaků, které mají charakter rozměrných či bezrozměrných poměrných čísel, přičemž váha je veličina z čitatele zlomku — např. výpočet průměrné rychlosti (dráha/čas), kde vahami jsou dráhy, výpočet průměrné nemocnosti (počet nemocných/počet všech), kde vahami jsou počty nemocných, výpočet průměrné ziskové marže (zisk/tržba), kde vahami jsou zisky. Je-li vahou veličina ze jmenovatele zlomku, použijeme aritmetický průměr. 5.4.5. Geometrický průměr Pro
s 0
bude geometrický průměr (uvedeme pouze prostou formu):
n
x g n xi , pro xi 0 i 1
Určující vlastnost: n
n xi x1 x2 ... xn xg xg ... xg xg i 1
Použití: Geometrický průměr se často používá v ekonomických a obchodních výpočtech jako ukazatel růstu nebo podílu (zisku). Používá se také k průměrování bezrozměrných růstových charakteristik zřetězených v čase (koeficientů růstu, řetězových indexů), kdy celková změna je dána jako součin dílčích změn — např. průměrná měsíční inflace vypočtená z údajů za několik pro sobě jdoucích měsíců (cenová hladina daného měsíce/cenová hladina předcházejícího měsíce):
p p p2 p3 ... n n . p1 p2 pn 1 p1
58
5.4.6. Kvadratický průměr Pro
s2 xk
bude kvadratický průměr v prosté, resp. vážené formě
1 n 2 xi n i 1
xk
1 k 2 xi ni n i 1
Použití: Kvadratický průměr se obyčejně používá ve fyzikálních aplikacích.
5.4.7. Vztahy mezi charakteristikami úrovně Vzhledem k tomu, že mocninný průměr stupně s je neklesající funkcí čísla s, platilo by při výpočtu ze stejných dat
xh xg x xk .
Vzájemná poloha aritmetického průměru, mediánu a modu vypovídá o asymetrii rozdělení hodnot znaku je-li x x x jde o souměrné (symetrické) rozdělení hodnot znaku, ˆ~ ~ je-li x ˆ x x jde o levostrannou (kladnou) asymetrii, je-li x ~ x xˆ jde o pravostrannou (zápornou) asymetrii.
59
5.5. Charakteristiky variability (proměnlivosti) 5.5.1. Pojem variability, zdroje variability Variabilita = proměnlivost, kolísavost (např. v časové řadě) číselných dat. Charakteristiky variability jsou významnou skupinou jednorozměrných souhrnných číselných charakteristik. Zatímco střední hodnoty dávají informaci o absolutní úrovni nic nevypovídají o rozkolísanosti dat. Charakteristiky variability rozšiřují tuto informaci tím, že charakterizují proměnlivost (variabilitu) zkoumaného kvantitativního znaku v daném souboru. Příklad: Dvě skupiny studentů píšou stejný test s následujícími výsledky: 1. skupina 2. skupina
65 66 67 68 71 73 74 77 77 77 42 54 58 62 67 77 77 85 93 100
Po vypočítání průměrů dostaneme:
1. skupina 71,5 72,1 77,0
x ~ x xˆ
2. skupina 71,5 72,0 77,0
Na první pohled není z uvedených průměrů vidět rozdíl mezi skupinami. Podrobnější studium, ale ukáže, že rozdíl mezi skupinami je v tom, že výsledky 2. skupiny jsou mnohem rozptýlenější (rozkolísanější) – variabilnější. Variabilita mezi daty je jednou z charakteristik, vůči kterým jsou průměry necitlivé. Čím je větší variabilita, tím je rovněž větší hodnota charakteristiky variability. Homogennější soubory mají tedy menší variabilitu a to má ve svém důsledku vliv na lepší vypovídací schopnost střední hodnoty. Kde se setkáme s variabilitou: 1. mezi různými statistickými jednotkami téhož souboru, 2. u jedné statistické jednotky v různých časových intervalech nebo okamžicích zjišťování, 3. u jedné statistické jednotky při opakovaném zjišťování téže konstantní hodnoty — náhodné chyby měření, 4. defekty v datech — hrubé chyby, heterogenita dat. Zatímco první dva body reprezentují přirozenou variabilitu, jejímž zdrojem je různost podmínek v prostoru a čase, další dva představují chybovou variabilitu, jejíž přítomnost v datech je nežádoucí.
60
ni Početnost
variační rozpětí rozpětí kvartilů
variační rozpětí rozpětí kvartilů třídní znaky xi
Obr. 6.4 Dvě tříděné datové řady lišící se mj. ve variabilitě:
Přehled základních charakteristik variability: variační rozpětí R kvantilové odchylky (kvartilová Q, decilová D, percentilová P ) průměrná odchylka absolutní průměrná odchylka relativní
d d
rozptyl (variance) sx2 směrodatná odchylka sx variační koeficient Vx Základními charakteristikami variability, významnými hodnotami jsou: variační rozpětí Rv, rozptyl , směrodatná odchylka.
61
5.5.2. Variační rozpětí Variační rozpětí je rychlou, jednoduchou, ale jen orientační charakteristikou variability založenou na informaci o rozdílu mezi maximální a minimální hodnotou souboru. R = xmax - xmin Při použití variačního rozpětí si musíme vždy být vědomi toho, že hodnoty minima a maxima v souboru mohou mít charakter nahodilých extrémů a tím nepřiměřeně zvětší naši představu o míře variability ve zkoumaném souboru.
5.5.3. Průměrné odchylky Průměrná odchylka je založena na rozdílu mezi naměřenými hodnotami znaku a určité stanovené hodnoty.
~ Veličinami ke, které průměrné odchylky vztahujeme zpravidla na medián x a aritmetický průměr x . Průměrné odchylky lze stanovit jak v absolutní, tak v relativní podobě. Relativní průměrná odchylka může nabývat hodnot od 0 % do 100 %. Čím více se blíží nule, tím více je zkoumaný soubor homogenní, a tedy s tím větší přesností a věrohodností jej lze vyjádřit pomocí průměru, modusu nebo mediánu. Průměrná absolutní odchylka d kolem aritmetického průměru je definovaná jako absolutní hodnota odchylek jednotlivých hodnot souboru x i od aritmetického průměru x . V případě netříděných souborů má podobu:
1 n d ~x xi x n i 1 V případě tříděných souborů má tvar:
1 k d ~x xi x ni n i 1 Při výpočtu průměrná absolutní v uvedených vzorcích medián.
odchylky kolem
62
mediánu
používáme
5.5.4. Rozptyl Rozptyl je definován jako aritmetický průměr ze čtverců odchylek jednotlivých hodnot od aritmetického průměru (průměrná čtvercová odchylka kolem aritmetického průměru). V případě netříděných souborů má podobu:
1 n s ( xi x ) 2 n i 1 2 x
V případě tříděných souborů má tvar:
1 k s ( xi x ) 2 ni n i 1 2 x
Rozptyl je tzv. rozměrná charakteristika variability, rozměr rozptylu odpovídá čtverci rozměru dat. Vlastnosti rozptylu: rozptyl je nezáporný, rozptyl konstanty je roven nule, rozptyl je nejmenší průměrná čtvercová odchylka (viz vlastnosti průměru), 5.5.5. Směrodatná odchylka Rozptyl sám o sobě není dobře interpretovatelnou veličinou, protože výsledek je dán ve čtvercích měrných jednotek. Proto se při hodnocení variability dává přednost druhé odmocnině rozptylu tzv. směrodatné odchylce sx. Směrodatná odchylka —
s x s x2 — druhá odmocnina rozptylu.
Její rozměr odpovídá rozměru dat, je vždy větší než průměrná absolutní odchylka od aritmetického průměru. Nelze stanovit směrodatnou odchylku součtu ani rozložit společnou směrodatnou odchylku na složky. O variabilitě souboru rozhodujeme porovnáním s aritmetickým průměrem. Čím větší rozdíl tím větší variabilita. Při hodnotě 0 jsou všechny obměny statistického znaku stejné. Při rovnosti hodnot hovoříme o průměrné variabilitě. Když je průměrná odchylka přibližně dvakrát větší než aritmetický průměr hovoříme o velké variabilitě. Když je průměrná odchylka třikrát a více větší než aritmetický průměr hovoříme o extrémní variabilitě a daný soubor nemá praktický význam zkoumat. Přistupujeme k jiným možnostem, jako je například odstranění extrémů, rozdělení souboru na dílčí soubory apod.
63
5.5.6. Variační koeficient Variační koeficient —
vx
sx x
pro
x 0 (eventuálně
v %) — bezrozměrná
charakteristika variability. Patří mezi relativní míry variability, protože nevyjadřuje variabilitu v původních měrných jednotkách, ale poměr směrodatné odchylky a aritmetického průměru. Obvykle tento poměr prezentujeme v procentech. Pak udává, z kolika procent se v průměru odchylují jednotlivé hodnoty od aritmetického průměru. Doporučuje se používat pouze pro kladné hodnoty znaku.
5.6. Paretova analýza Data je možné analyzovat pomocí Paretovy analýzy. Pomocí Paretova diagramu můžeme vizuálně zobrazit výsledek. Paretův diagram je typ grafu, který je kombinací sloupcového a čárového grafu kde sloupce znázorňující četnost pro jednotlivé kategorie jsou seřazeny podle velikosti (nejvyšší sloupec vlevo, nejnižší vpravo) a linie představuje kumulativní četnost v procentech. Diagram je pojmenovaný podle Vilfreda Pareta. Paretův diagram se používá k znázornění důležitosti jednotlivých kategorií.[1] Příklad: Dejme tomu, že máme k dispozici chronologický výpis závad, vzniklých na pracovišti, tak jak byly zaznamenávány v období posledních deseti dní. Naším úkolem je tyto závady analyzovat a pomocí Paretova diagramu a Lorenzovy křivky navrhnout ty závady, jejichž odstraněním se dosáhne požadované snížení poruchovosti zařízení.
64
5.7. Analýza struktury (koncentrace) Platí pro sčitatelný znak, bez ohledu na to, zda je tříděný nebo ne. V tomto případě lze hodnotit současně podíl jednotlivých případů na rozsahu souboru (relativní četnost), podíl jednotlivých případů na celkovém úhrnu hodnot znaku, obojí v kumulativní (součtové) podobě. Grafickým vyjádřením vztahu těchto dvou veličin je Lorenzova koncentrační křivka. Pro soubor měsíčního příjmu 80 domácností můžeme sestavit tuto tabulku Třída
Příjmové skupiny
k
xd - xh [tis Čk] do 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40 a více
1. 2. 3. 4. 5. 6.
Střed příjmové skupiny xi [tis Čk] 17,5 22,5 27,5 32,5 37,5 42,5
Počet rodin ni 12 32 20 8 6 2 80
pravá osa y
Součtový podíl rodin 100 kpi [%]
Giniův index
Součtový podíl rodin 100kpi [%]
15 55 80 90 98 100
Celkový příjem všech rodin [tis Čk] xi ni 210 720 550 260 225 85 2050
levá osa y
Podíl příjmové skupiny na celkovém příjmu všech rodin [%] 10,2 45,4 72,2 84,9 95,9 100,0
vodorovná osa x
100
40 35
80
30
Příjem rodin [horní hranice příjmových skupin v tis Čk]
60 25 Mediál
40 Lorenzova koncentrační křivka
Medián 20 20 0 0
20
40
60
65
80
100
Podíl příjmu rodin na celkovém příjmu všech rodin [%]