1(173)
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Lorenzova křivka s vážením
63(173)
charakteristiky polohy v geografii/demografii
Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008
◮
◮
Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/∼zvara
často známe jen průměry v dílčích souborech a četnosti: průměry se použijí jako xj∗ , četnosti standardně příklad: věk nových profesorů a docentů UK 2002: 41 profesorů, průměrný věk 51,1 (n1 = 41, x1∗ = 51,1) 77 docentů, průměrný věk 47,8 (n2 = 77, x2∗ = 47,8) celkový průměr (vážený průměr): [weighted.mean(c(51.1,47.8),c(41,77))] 41 · 51,1 + 77 · 47,8 = 48,9 41 + 77
16. října 2007
[mean(c(51.1,47.8))]
nikoliv 51,1 + 47,8 = 49,4 2 Úvod
1. října 2007
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Statistika
3. přednáška
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
64(173)
charakteristiky polohy v geografii/demografii (2)
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
geografický střed ◮ ◮
◮
bod průsečík průměrné zeměpisné šířky a průměrné zeměpisné délky; průměry vážené velikostí sledovaného jevu
geografický medián – obdoba mediánu, ◮
◮ ◮
◮ ◮
◮
čára, která rozděluje geografické objekty do dvou disjunktních skupin hodnocená vlastnost určí váhy objektů uspořádání hodnocení znaků dáno zvolenou geografickou vlastností (např. zeměpisnou délkou)
15. října 2007
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
65(173)
Giniho index charakterizuje nerovnoměrnost rozdělení bohatství (příjmů, . . . ) jediným číslem G = ∆/(2¯ x) průměrný rozdíl v bohatství vztažený k dvojnásobku průměru mají-li všichni stejně (x(1) = . . . = x(n) > 0), je nutně ∆ = 0 a tedy G = 0 má-li jeden všechno, ostatní nic (0 = x(1) = . . . = x(n−1) < x(n) = a), pak je a n 2(n − 1)a n n−1 G= · = n2 2a n x¯ =
◮
3. přednáška
Statistika
míry nerovnoměrnosti ◮
◮
15. října 2007
∆=
2(n − 1)a n2
Lorenzova křivka je jemnějším nástrojem 3. přednáška
15. října 2007
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Lorenzova křivka s vážením
66(173)
příklad: tolary (rozdělení příjmů)
12 16 24 3
13 10 26 1
14 6 27 2
15 3 28 1
16 9 32 1
17 3 35 1
18 1 36 2
19 5 40 1
20 3 43 1
45 1
jaké procento nejchudších získá polovinu celkového bohatství? četnosti (celkový měsíční příjem je 1687) xj nj xj nj
47 1
sčítejme příjmy nejchudších, dokud nenasčítáme 10 % z 1687
15 3 28 1
16 9 32 1
17 3 35 1
18 1 36 2
19 5 40 1
20 3 43 1
45 1
(7 + . . . + 9 + 1)/99 = 66/99 = 0,6667 = 66,67 %
(7 + 9)/99 = 16/99 = 0,162 = 16,2 %
(7 + . . . + 9 + 2)/99 = 67/99 = 0,6768 = 67,68 %
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
68(173)
16 9 32 1
69(173)
17 3 35 1
18 1 36 2
19 5 40 1
20 3 43 1
45 1
Lorenzova křivka pro tolary (Gini=0.228)
47 1
sečteme příjmy oněch čtyř nejbohatších (47 + 45 + 43 + 40)/1687 = 175/1687 = 0,1037 = 10,37 % čtyři nejbohatší tedy dostanou přes 10 % bohatství, kdežto čtyři nejchudší dostanou (4 · 10)/1687 = 40/1687 = 0,0237 = 2,37 % 15. října 2007
Lorenzova křivka s vážením
1.0
15 3 28 1
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
0.8
14 6 27 2
Statistika
0.6
13 10 26 1
15. října 2007
Lorenzova křivka (Tolary)
jaké procento získají čtyři (tj. asi 4 %) nejbohatší resp. nejchudší? četnosti (celkový měsíční příjem je 1687) 12 16 24 3
3. přednáška
0.4
15. října 2007
47 1
u jaké části z 99 osob jsme sčítali příjmy?
příklad: tolary (rozdělení příjmů)
3. přednáška
14 6 27 2
(7 + 8)/99 = 15/99 = 0,152 = 15,2 %
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
11 14 22 3
13 10 26 1
(7 · 10 + . . . + 9 · 16 + 2 · 17)/1687 = 853/1687 = 0,5056 = 50,56 %
u jaké části z 99 osob jsme sčítali příjmy?
10 7 21 4
12 16 24 3
(7 · 10 + . . . + 9 · 16 + 17)/1687 = 836/1687 = 0,4956 = 49,56 %
(7 · 10 + 9 · 11)/1687 = 169/1687 = 0,1002 = 10,02 %
xj nj xj nj
11 14 22 3
sčítejme příjmy nejchudších, dokud nenasčítáme 50 % z 1687
(7 · 10 + 8 · 11)/1687 = 158/1687 = 0,0937 = 9,37 %
3. přednáška
10 7 21 4
0.2
11 14 22 3
67(173)
0.0
10 7 21 4
Lorenzova křivka s vážením
příklad: tolary (rozdělení příjmů)
jaké procento nejchudších získá desetinu celkového bohatství? četnosti 99 osob (celkový měsíční příjem je 1687) xj nj xj nj
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
0.0
0.2
3. přednáška
15. října 2007
0.4
0.6 Statistika
0.8
1.0
(MD360P03Z, MD360P03U)ak. rok 2007/2008
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Lorenzova křivka s vážením
70(173)
Lorenzova křivka variační řada: 0 < x(1) ≤ x(2) ≤ . . . ≤ x(n)
[sort(x)]
Lorenzova křivka pro 1:5 (Gini=0.267) 1.0
[cumsum(sort(x))]
i =1
◮ ◮
úsečkami spojit body [j/n; Xj /Xn ],
0≤j ≤n
zajímá nás plocha nad touto lomenou čarou a pod úhlopříčkou jednotkového čtverce
◮
plocha měří nerovnoměrnost rozdělení nějakého zdroje
◮
kdyby dostal každý stejně, bude velikost plochy nulová
◮
Giniho koeficient koncentrace je dvojnásobkem této plochy 3. přednáška
15. října 2007
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Statistika
72(173)
příklad - pokračování
1 2 3 4 5
3. přednáška
+ + +
+
15. října 2007
0.2
Statistika
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
◮
52 · ∆ = |1 − 1| + |1 − 2| + |1 − 3| + |1 − 4| + |1 − 5|
◮
+ |2 − 1| + |2 − 2| + |2 − 3| + |2 − 4| + |2 − 5|
◮
+ |3 − 1| + |3 − 2| + |3 − 3| + |3 − 4| + |3 − 5| + |4 − 1| + |4 − 2| + |4 − 3| + |4 − 4| + |4 − 5| + |5 − 1| + |5 − 2| + |5 − 3| + |5 − 4| + |5 − 5|
0.4
0.6
0.8
1.0
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
73(173)
v každém kraji je stejně hejtmanů, proto postupné součty rovnoměrně rostou, totéž platí pro Xj /Xn lomená čára Lorenzovy křivky přejde v úsečku a plocha zmizí průměrná diference je nulová (všechny rozdíly |xi − xj | u počtu hejtmanů jsou nulové) Lorenzova křivka pro hejtmanu (Gini=0)
0.6
= 10 + 7 + 6 + 7 + 10
0.4
∆ = 40/25 = 1,6
0.0
0.2
x¯ = 3 1,6 1,6 G= = = 0,267 2·3 6
+ 0.0
15. října 2007
+
Lorenzova křivka počet hejtmanů v krajích ČR
výpočet Giniho koeficientu (n = 5)
3. přednáška
Xj /Xn 0,000 0,067 0,200 0,400 0,667 1,000
Xj 0 1 3 6 10 15
0.0
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
x(j)
0.6
x(i )
j/n 0,0 0,2 0,4 0,6 0,8 1,0
0.4
j 0 1 2 3 4 5
0.2
Xj = x(1) + x(2) + . . . + x(j) =
j X
+
0.8
x1 , . . . , x5 : 1, 2, 3, 4, 5
0.0
kumulativní součty pro j = 0, 1, . . . , n (kolik patří celkem j nejchudším) X0 = 0
71(173)
umělý příklad
1.0
◮
Lorenzova křivka s vážením
0.8
◮
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
3. přednáška
+
+
+
+
0.2
15. října 2007
+
+
0.4
+
+
+
0.6
+
+
+
0.8
Statistika
+
+
1.0
(MD360P03Z, MD360P03U)ak. rok 2007/2008
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Lorenzova křivka s vážením
74(173)
Jdi zpět
Jdi zpět ke grafu
3. přednáška
hustota na km2 xi 2 395,0 106,7 62,6 73,3 91,9 154,3 136,2 115,5 112,4 75,3 157,4 121,5 148,8 230,2 130,4
15. října 2007
Statistika
◮ ◮ ◮
Lorenzova křivka s vážením
0.0
1.0 0.8 0.6 0.4
+ 0.2
0.4
1.0 0.8 0.6
+ + + + +
+
0.2
+
0.4
0.6
0.8
1.0
+
+
+
0.6
+
0.8
1.0
0.2
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
77(173)
případ s vahami - příklad
+ ++ +++ + + +++ ++++ ++++ + + + + +++ +++++ ++++++ + + + + + ++++ +++++++ +++++++ + + + + + + + ++++ ++++++++ +++++++++ + + + + + + + + ++++ 0.0
15. října 2007
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
◮
◮
◮ ◮
Lorenzova křivka pro tolary (Gini=0.228)
0.0
0.2 0.0
+ +
+++
++
++ +++ + + + +++ ++
0.2
0.4
0.6
0.8
1.0
Lorenzova křivka pro xj * nj(nj) (Gini=0.228)
+ ++
+
0.4 76(173)
o 10*7=70 tolarů se rozdělilo 7 „nejchudšíchÿ osob o 11*14=154 tolarů se rozdělilo 14 druhých „nejchudšíchÿ ... posledních 47 tolarů připadlo jedinému nejbohatšímu
+
+
3. přednáška
(MD360P03Z, MD360P03U)ak. rok 2007/2008
spousta hodnot proměnné tolary se opakuje, mohli jsme použít četnosti hodnota x(j) se vyskytuje nj krát ◮
+
0.0
Lorenzova křivka pro tolary ještě jinak
◮
+
Jdi zpět k teorii
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
◮
75(173)
Lorenzova křivka pro obyvatel (Gini=0.227)
0.2
rozloha[km2 ] ni 496,1 11 014,7 10 056,9 7 561,1 3 314,6 5 334,5 3 163,0 4 758,4 4 518,6 6 795,6 7 196,3 5 266,8 3 963,5 5 427,0 78 867,0
0.0
obyvatel yi 1 188 126 1 175 254 630 006 554 537 304 602 823 265 430 774 549 643 507 751 511 645 1 132 563 639 894 589 839 1 249 290 1 0287 189
Lorenzova křivka s vážením
Lorenzova křivka (obyvatelé – kraje)
příklad: kraje ČR ke konci roku 2006 kraj i Hlavní město Praha Středočeský kraj Jihočeský kraj Plzeňský kraj Karlovarský kraj Ústecký kraj Liberecký kraj Královéhradecký kraj Pardubický kraj Vysočina Jihomoravský kraj Olomoucký kraj Zlínský kraj Moravskoslezský kraj celkem
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
0.4
0.6
0.8
1.0
◮ ◮ ◮
nerovnoměrnost rozmístění obyvatel v republice, ale údaje jen podle krajů potřebovali bychom pro každý jednotlivý km2 znát počet obyvatel zde žijících známe jen počty obyvatel yi v krajích a rozlohu krajů ni předpokládáme rovnoměrné rozmístění uvnitř kraje, tedy xi = yi /ni obyvatel na každý km2 v i -tém kraji každou takovou hustotu xi musíme započítat ni krát celková plocha n = n1 + . . . + n14 (= N14 ) průměrný počet obyvatel na km2 P P P ni (yi /ni ) ni xi yi = i x¯ = Pi = i = y¯ n n n i i
Jdi zpět k tabulce 3. přednáška
15. října 2007
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
3. přednáška
15. října 2007
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
Lorenzova křivka s vážením
78(173)
Lorenzova křivka: obyvatelé krajů, vztaženo k rozloze
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
1.0 0.8
1.0 0.8
++
0.0
Jdi ke grafu okresů 3. přednáška
+
0.6 0.2
+ + +
0.0
+
+
+
0.4
0.4
0.6
+
0.2 0.0
Lorenzova křivka pro obyvatel(rozloha) (Gini=0.334)
+ +
++
0.2
0.4
0.6
0.8
1.0
0.0
Jdi zpět k tabulce 15. října 2007
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
◮ ◮
◮ ◮
Statistika
3. přednáška
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
0.4
0.6
0.8
1.0
80(173)
15. října 2007
Statistika
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
(MD360P03Z, MD360P03U)ak. rok 2007/2008
Lorenzova křivka s vážením
81(173)
výpočet v případě vah
hrubší hodnocení (kraje, nikoliv okresy) znamená menší hodnotu Giniho indexu!
kumulativní součty Ni =
◮
střední diference průměrných počtů obyvatel
pro zajímavost: Nk = n, rozděluje se bohatství Yk
=
Pk
j=1 Yj na km2 (hustot)
i =1 j=1
k k k−1 1 XX 2 X |n y − n y | = (Ni Yi +1 − Ni +1 Yi ) j i i j n2 n2 i =1 j=1
Pi
j=1 yj
ve všech případech je pořadí sčítanců dáno pořadím „hustotÿ xi = nyii (např. obyvatel/rozloha)
Yi =
i =1 j=1
na svislé ose jde o podíl na bohatství
◮
j=1 nj ,
k k k k X X yi yj 1 1 XX ni nj |xi − xj | = P 2 ni nj − ∆= 2 n ( nt ) ni nj
na vodorovné ose jde o umístění v řadě od nejchudších k nejbohatším P označme kumulativní součty Ni = kj=1 nj označme kumulativní součty od nejchudších Yi =
Pk
◮
nezáleží na zvolených jednotkách
◮
◮
0.2
Jdi zpět ke grafu krajů
poznámky ◮
79(173)
Lorenzova křivka: obyvatelé okresů, vztaženo k rozloze
Lorenzova křivka pro obyvatel(rozloha) (Gini=0.29)
+
Lorenzova křivka s vážením
∆ G= = 2¯ y ◮
k−1 X i =1
i =1
Ni Yi +1 Ni +1 Yi − Nk Yk Nk Yk
Lorenzova křivka spojuje body
h
Ni Yi Nk ; Yk
i
Jdi zpět k tabulce dat 3. přednáška
15. října 2007
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
3. přednáška
15. října 2007
Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
3. přednáška
15. října 2007
obyvatel yi 88288 56489 106266 81890 109766 94377 79764 99408 77940 96104 94328 154445 1175522 2314587
hustota na km2 xi 61,2 60,7 65,2 87,4 102,9 107,1 120,5 121,4 122,9 134,8 158,0 223,2 2370,0 201,3 Statistika
(MD360P03Z, MD360P03U)ak. rok 2007/2008
příklad Pavlík, Kühnl: str. 114 Lorenzova křivka pro obyvatel(rozloha) (Gini=0.566)
+
1.0
plocha [km2 ] ni 1443 930 1629 937 1067 881 662 819 634 713 597 692 496 11500
83(173)
0.8
Okres i BN RA PB KH MB NB BE KO PZ ME PH KL AB celkem
Lorenzova křivka s vážením
0.6
příklad Pavlík, Kühnl: str. 114 (okresy středočeského kraje)
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
0.4
82(173)
0.2
Lorenzova křivka s vážením
0.0
char. polohy v geogr./demogr. Giniho index Lorenzova křivka
+ +
+
0.0
0.2
3. přednáška
15. října 2007
+ +
++ + + + + +
0.4
0.6
Statistika
0.8
+
1.0
(MD360P03Z, MD360P03U)ak. rok 2007/2008