Eötvös Loránd Tudományegyetem Természettudományi Kar
Annár Zsolt Egyenlőtlenségi mértékek statisztikai értékelése BSc Szakdolgozat
Témavezető: Pröhle Tamás Valószínűségelémelti és Statisztikai Tanszék
Budapest, 2015
Köszönetnyilvánítás Először is, ezúton szeretném kifejezni köszönetemet témavezetőmnek, Pröhle Tamásnak, türelméért, tanácsaiért, a tőle kapott sok-sok szakirodalomért, és a számos konzultációs lehetőségért. Szeretnék köszönetet mondani családomnak, barátaimnak, évfolyamtársaimnak, és mindazoknak, akik végig mellettem álltak és hozzájárultak ahhoz, hogy idáig eljussak.
2
Tartalomjegyzék 1. Bevezetés
5
2. Lorenz görbe
6
2.1. Lorenz görbe elméleti értéke . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.1.1. Lorenz görbe abszolút folytonos esetben . . . . . . . . . . . . . . .
8
2.1.2. Lorenz görbe tulajdonságai . . . . . . . . . . . . . . . . . . . . . . .
8
2.2. A Lorenz görbe kiértékelése . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2.1. A g() leképezés tulajdonságai . . . . . . . . . . . . . . . . . . . . . 10 2.2.2. Néhány állítás az axiómákkal kapcsolatban . . . . . . . . . . . . . . 11 3. Gini index
13
3.1. Gini index értelmezései . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.1.1. Abszolút differencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.2. Ekvidisztánstól vett távolság . . . . . . . . . . . . . . . . . . . . . . 15 3.1.3. Reverz távolság . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.4. Ekvidisztánssal vett távolság . . . . . . . . . . . . . . . . . . . . . . 16 3.2. Gini-index diszkrét eloszlás esetén . . . . . . . . . . . . . . . . . . . . . . . 16 3.3. Gini index kiszámítása Hoover index segítségével . . . . . . . . . . . . . . . 17 3.3.1. Második kör . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.3.2. Általános eset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.4. Gini index hibája . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4. További gazdasági mérőszámok
25
4.1. Jövedelmi egyenlőtlenség további mérőszámai . . . . . . . . . . . . . . . . 25 4.2. Koncentrálódás mérőszámai . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.2.1. Helyi hányados (LQ) index . . . . . . . . . . . . . . . . . . . . . . . 28
3
4.2.2. Herfindahl index . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.2.3. Ellison - Glaeser index . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.2.4. Ellison - Glaeser γ mutató . . . . . . . . . . . . . . . . . . . . . . . 29 5. Az INEQ programcsomag ismertetése
31
5.1. theorLc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 5.2. Dagum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 5.2.1. Tesztek R-ben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.3. Lognormális eloszlás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 5.3.1. Minta program: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 5.4. Pareto eloszlás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 5.4.1. Pareto elv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 5.5. Burr-eloszlás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.6. Az exponenciális eloszlás . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4
1. fejezet Bevezetés A mai világban fontos szerepe van, a gazdasági jelenségek, valamint a gazdasági folyamatok, események megfigyelésének. Ezen folyamatok feltérképezésére már régebb óta rendelkezésre állnak mérőszámok, amelyeket szép számmal használnak is, arra a célra, hogy az országokat (területeket) hasonlítsanak össze, mind gazdasági, mind vagyon eloszlási, vagy akár földrajzi szempontból. De arra is hasznosak, hogy országok (területek), több év alatt lezajlott folyamatait vizsgálják. Ebben a szakdolgozatban, én elsősorban a nagyon közkedvelt Lorenz görbével, illetve a Gini együtthatóval fogok foglalkozni. De említésre kerül — a teljesség igénye nélkül — jó néhány gazdasági, területi eloszlást mérő mérőszám is.
5
2. fejezet Lorenz görbe Először definiáljuk a Lorenz görbét. A Lorenz görbe egy eszköz arra, hogy ábrázolja egy mennyiség eloszlását a társadalomban. Tegyük fel, hogy ez a mennyiség Q, ami lehet vagyon, jövedelem, vagy egyes generációk, családok jövedelme, vagy akár a Föld, élelem eloszlása a világban. Ezt a sort a végtelenségig lehetne sorolni, most csak pár példa került megemlítésre.
2.1. ábra. Brazília jövedelemeloszlásának alakulása 2002-től 2012-ig. Képzeljük el, hogy a népességet növekvő sorrendbe állítjuk valamely Q szerint, például a jövedelem alapján. Majd ezt a sort csoportokra bontjuk, azaz felosztjuk intervallumokra. Ez azt eredményezi, hogy az első csoport fogja tartalmazni Q szerint a legszegényebbeket. Legyen p ∈ [0, 1] közötti szám, ami a k-adik és az az alatt lévő csoportok összességének 6
aránya, a teljes populációhoz képest, azaz 100 · p%. Ezt mostantól L(p) - nek nevezzük. Tehát a Lorenz görbe egy bizonyos Q-ra felírható ilyen alakban: y = L(p). Így tehát a fenti 2.1-es ábra
1
alapján, amit 2002-ben mértek Brazíliában, leolvasható
például, hogy L(0.6) = 0.2. Azaz a népesség 60%-a mindössze a teljes jövedelem 20%-át keresi meg. Szélsőséges esetek az életben nem fordulnak elő egy normál társadalomban, de érdemes szót ejteni róla. Legyen a példa kedvéért Q a jövedelem. Az első eset amikor a görbe egybeesik a 45◦ -os egyenessel. Ebben az esetben a legszegényebb 20%-a a vagyon 20%-át, míg a 80%-a a jövedelem 80%-át kapja meg. Ezt úgy nevezik, hogy teljes egyenlőség, hiszen a rendelkezésre álló vagyon egyenletesen oszlik el a társadalomban. A másik eset amikor a görbe egybeesik a négyzet oldalával. Ez elég extrém, mert ilyenkor a teljes népességnek — egy embert leszámítva — nincs jövedelme, míg az az egy ember egyeduralkodóként megkap minden vagyont.
2.1. Lorenz görbe elméleti értéke A Lorenz görbét a (pi , xi ) diszkrét eloszlásra, az (li , si ) pontokat összekötő szakaszok alkotják, ahol:
li =
i X
pj
j=1
Ei =
i X
p j xj
j=1
Si = Ei /En . Vegyünk egy példát amiben áruházakat vizsgálunk a forgalmuk alapján. Ebben az esetben az li az áruházak relatív gyakorisága, az Ei az i. osztályig az összforgalom, si pedig az i. kumulatív érték. Ezeket a pontokat ábrázolva megkapjuk a tapasztalati Lorenz görbét. 1
Istanbul International Community School, IICS since 1911, http://deniseo.iics-k12.com/2014/08/
7
2.1.1. Lorenz görbe abszolút folytonos esetben Az eredeti Lorenz görbe definíciója két egyenletből áll. Az első meghatároz egy bizonyos qp kvantilist. A qp kvantilis az a z érték, melyre qp a valószínűsége annak, hogy a valószínűségi változó nála kisebb. Ebben az esetben ez azt jelenti, hogy z-re meg kell oldani a következő egyenletet: Z
z
f (t)dt.
p = F (z) = 0
Az első egyenlet alapján nyert z értékből felírható a második egyenlet: 1 L(p) = µ
Z
z
t · f (t)dt. 0
Gastwirth jegyezte fel először 1971-ben azt az összefüggést, hogy a z értéke felírható z = F −1 (p) alakban. Tehát ebből következik: 1 L(p) = µ Mivel tudjuk, hogy µ =
R1 0
Z
p
F −1 (t)dt.
0
F −1 (t)dt, így az előző egyenletből megkapjuk hogy: L(p) =
Rp
F −1 (t)dt 0 . R1 F −1 (t)dt 0
1 µ
2.1.1. Tétel. Tegyük fel, hogy L(p) létezik, és L00 (p) második derivált folytonos [0, 1] intervallumban. L(p) függvény Lorenz görbe akkor és csak akkor, ha L(0) = 0, L(1) = 1, L0 (0+) ≥ 0és L00 (p) ≥ 0(0, 1) intervallumon.
2.1.2. Lorenz görbe tulajdonságai • Ez teljes egészében négyzet alakú, mert p[0, 1] intervallumon mozog és az L(p) is [0, 1] intervallum értékeket vehet fel. Így mind az x-tengely mind y-tengely százalékos
• A Lorenz görbe nincs definiálva sem µ = 0, sem µ =
8
értékek. -ben. Ha az alap változó
pozitív és van sűrűsége, a Lorenz görbe folytonos függvény. Ezért ez mindig a 45◦ -os egyenes alatt helyezkedik el, vagy éppen egybeesik a 45◦ -os egyenessel.
8
• L(p) egy növekvő konvex függvénye p-nek Az első derivált: dL(p) F −1 (p) x = = dp µ µ
ahol x = F −1 (p).
Ez mindig pozitív abban az esetben, ha a jövedelem pozitív. Ez így van a másodrendű deriválttal is, ebből adódik a konvexitás. Ráadásul növekvő, mivel p növekszik, ez abból adódik, hogy F −1 (p) pozitív értékű. • A Lorenz görbét nem befolyásolja egy skalárszoros, így X és c∗X ugyanazt a Lorenz görbét adja vissza. • Az átlagjövedelem a népességben azon percentilisnél található meg, ahol az L(p) függvény meredeksége egyenlő 1-el, azaz, ahol F −1 (p) = µ és így az átlagjövedelem értéke p = F (µ)-ben van. Ez könnyen belátható, mert a Lorenz görbe első deriváltja egyenlő
F −1 (p) µ
-vel.
• A medián a p = 0.5-ben található és általában a várható értéktől balra helyezkedik el, tehát a medián kereset értékű embernek kevesebb jövedelme van, mint az átlag jövedelem.
2.2. ábra. A fenti tulajdonságokat szemléltető ábra.
9
2.2. A Lorenz görbe kiértékelése Az L függvényhalmazt a Lorenz görbék családjának nevezzük, ha az L olyan nem-csökkenő, konvex [0, 1] intervallumon értelmezett függvények halmaza, amelyekre a 0-beli jobbhatárérték 0 és az 1-beli bal-határérték 1 és amelyeknek az értéke 0-ban 0, 1-ben pedig 1. Legyen g() az L egy leképezése az R-re, azaz legyen g : ϑ 7−→ R. Tehát a g() minden L ∈ L-beli görbéhez hozzárendel egy g(L) ∈ R pozitív számot. A mondott feltételnek eleget tevő g(), egy teljes, tranzitív rendezést indukál az L halmazon. Ugyanis tetszőleges L1 , L2 , L3 ∈ L-re egyrészt, vagy g(L1 ) ≤ g(L2 ), vagy g(L1 ) ≥ g(L2 ). Másrészt, ha g(L1 ) ≤ g(L2 ) és g(L2 ) ≤ g(L3 ), akkor g(L1 ) ≤ g(L3 ).
2.2.1. A g() leképezés tulajdonságai Keressük az L azon g leképezéseit, amelyek a következő axiómák szerinti tulajdonságokkal bírnak:
2.2.1.1. Axióma. (dominancia) Legyen L1 , L2 ∈ L azaz L-ból vett elemek és g(L1 ), g(L2 ) ∈ Ω. Ha L1 (u) ≥ L2 (u) minden u ∈ [0, 1] akkor g(L1 ) ≤ g(L2 ). 2.2.1.2. Axióma. (folytonosság) Legyen {L : L ∈ L és L∗ ∈ L
g(L) < g(L∗ )} zárt.
2.2.1.3. Axióma. (invariancia) L1 , L2 és L3 elemei ϑ-nak. Legyen α ∈ [0, 1]közötti szám. Ha g(L1 ) ≤ g(L2 ) akkor: g(αL1 + (1 − α)L3 ) < g(αL2 + (1 − α)L3 ). A 3. axiómát, kicsit szemléletesebben a következőképpen tudjuk leírni. Legyen F1 és F2 jövedelem eloszlási függvények µ1 , µ2 várható értékkel és legyen L1 , L2 a hozzájuk tartozó Lorenz görbe. Először vezessünk be egy 1 − α adókulcsot, amit vonjunk le az L1 és az L2 polgáraitól egyaránt. Majd a befolyt adónak vegyük egy olyan L3 szerinti szétosztását, amelyik a polgárok jövedelem szerinti sorrendjét nem változtatja meg. 10
2.2.1.4. Axióma. (duális invariancia) L1 , L2 és L3 elemei ϑ-nak. Legyen α ∈ [0, 1] közötti szám. Ha g(L1 ) ≤ g(L2 ) akkor: −1 −1 −1 −1 < g(αL−1 g(αL−1 2 + (1 − α)L3 ) . 1 + (1 − α)L3 )
A felsorolt 4 axióma — mint látható — olyan feltételeket szab meg a Lorenz görbék értékelésével kapcsolatban, amelyek teljesítésének megkövetelése egy egyenlőtlenségi mértékkkel kapcsolatban nyilvánvalóan indokolható.
2.2.2. Néhány állítás az axiómákkal kapcsolatban A következő állítás sor azt mutatja, hogy a fenti követelményeknek lényegében csak a Gini féle együttható felel meg. 2.2.2.1. Állítás. A preferencia reláció reprodukálható. Vagyis egy olyan p() függvény, amelyre tetszőleges L1 , L2 ∈ ϑ esetén: Z 1 Z 1 p(u)dL2 (u). p(u)dL1 (u) ≥ g(L1 ) ≥ g(L2 ) ⇔ 0
0
2.2.2.2. Állítás. Egy g() függvény által generált preferencia reláció pontosan akkor tesz eleget az 1-2. és 4. axiómáknak, ha létezik egy olyan folytonos, nem csökkenő, a [0, 1] intervallumon definiált q() valós függvény, amely segítségével a preferencia reláció reprodukálható. Vagyis egy olyan q() függvény, amelyre tetszőleges L1 , L2 ∈ ϑ esetén: Z 1 Z 1 g(L1 ) ≥ g(L2 ) ⇔ q(L1 (u))du ≥ q(L2 (u))du. 0
0
2.2.2.3. Állítás. Egy g() függvény által generált preferencia reláció pontosan akkor tesz eleget az 1-4-ig axiómáknak, ha a g() minden L ∈ L-re g(L) az L görbéhez tartozó Gini együtthatóval egyenlő.
11
Megjegyzés. A fenti állítások értékelésekor figyelembe veendő, ha egy tetszőleges a fenti feltételeknek megfelelő g() függvényt egy h : [0, 1] 7→ [0, 1] monoton növekedő függvénnyel komponálunk, akkor a h ◦ g nyilván ugyanazt a rendezést generálja, mint a g. Továbbá, ha olyan egyenlőtlenség mértékekkel akarunk foglalkozni, amelyek a jövedelem eloszlás egyenlőtlenségét, a különböző jövedelem kategóriákban különböző súllyal akarják mérni, akkor a 3.-4. axiómák megkötései indokolatlanok.
12
3. fejezet Gini index A Gini index egy statisztikai mérőszám, amely méri, mennyire egyenletes a vagyon eloszlása egy társadalomban. Matematikai megfogalmazásban a Gini index egy gazdasági mérőszám, amely a statisztikai eloszlások egyenlőtlenségét méri. Az index mértéke [0, 1] intervallumon mozog. A nulla értéket akkor veszi fel, ha a Lorenz görbe egybeesik az átlóval (lásd teljes egyenlőség). Az 1 értéknek akkor felel meg, ha a Lorenz görbe egybeesik a négyzet oldalával ( lásd egy ember kezében van minden jövedelem). Az egyből adódik, hogy nagyobb index értékhez, nagyobb egyenlőtlenségi mérték társul. Nevét egy olasz statisztikusról Corrado Gini (1884-1965) -ről kapta. 1905-ben M. O. Lorenz jelentetett meg egy tanulmányt a ma is ismert Lorenz görbéről, majd ez alapján dolgozta ki Gini a vagyoneloszlási mértéket, a Gini indexet, amit 1912-ben Olaszországban publikáltak először. Sokszor lehet hallani, hogy a Föld népességének legszegényebb 20%-a, mindössze a teljes vagyon 1%-át keresi meg, vagy, hogy a teljes népesség 20%-a fogyasztja el az összes fogyasztási javak 86%-át, vagy, hogy az amerikai népesség 3% -a birtokolja a magántulajdonban lévő földterületek 95%-át. A Gini index lehetővé teszi, hogy ezeket a gazdasági adatokat egyetlen egy mérőszámmal jellemezzük, így könnyebben össze tudunk hasonlítani országokat. Illetve lehetővé teszi, hogy évekre visszamenőleg gazdasági folyamatokat vizsgáljunk. Mint például, hogy egy ország vagyoneloszlása javult vagy romlott az évek alatt. Az 2.1-es ábrán jól látható az a folyamat ami Brazíliában zajlott le 10 év alatt. Míg 2002-ben a népességük legszegényebb 60%-a, mindössze a jövedelem 20%-át kereste meg, ami vészjóslóan kevés, addig ez a szám 2012-re már majdnem eléri a 40%-ot. Ez egy erőteljes javulási folyamat. 13
3.1. Gini index értelmezései Legyen xk , ahol k = 1, ..., n a megfigyelt jövedelem érték, mindegyik 1-szeres multip+ licitással. Az x− k , a jövedelmek csökkenő sorrendben, míg az xk , a jövedelmek növekvő
sorrendben. Legyen s+ k a növekvő sorrendben vett jövedelmek összege, azaz a jövedelmek szukcesszív összege. Így az első k legkisebb szám összege a következő: s+ k
k X
=
x+ j .
j=1
Legyen s− k a csökkenő sorrendben vett jövedelmek összege. Így az első k legnagyobb szám összege a következő: s− k
=
k X
x− j
j=1 − ekkor teljesül, hogy s+ n = sn = sn és az átlag jövedelem x =
sn n
lesz. Képezzük a szuk-
cesszív összegek relatív értékét: s+ k sn s− = k sn
rk+ =
k = 1, . . . , n
rk−
k = 1, . . . , n
Ezután két "létrát" fogunk használni, mely egymás lineáris transzformáltja — azaz valószínűleg az egyik fölösleges — de ezek segítségével közvetlenebb a Gini index értelmezése. Tehát legyen: k n k − .5 = − .5 n
ek = `k
ahol mindekettő egy 1/n lépésközű n hosszú létra. Az első 1-ig tartó, a második 0-ra szimmetrikus.
14
3.1.1. Abszolút differencia Az első értelmezés a Gini index egyenlő az abszolút differenciák összegével, azaz: P P 2 i j |xi − xj | A= . nsn Ha a számlálóban lévő összegtagok nem csak abszolút értékben volnának, hanem négyzetre is emelnénk, akkor az összeg egy tapasztalati szórásnégyzettel arányos összeget adna. Vagyis a Gini index egyfajta szóródási mérőszámként is felfogható.
3.1.2. Ekvidisztánstól vett távolság A Gini index értelmezhető olyan távolság differencia összeggel, amely a növekvő keresetek szukcesszív összegsorozata, és az 1-ig tartó ekvidisztáns 1/n közű létra között tapasztalható, azaz: n
G=
2X (ek − rk+ ). n k=1
Itt a szummán belüli rész sosem negatív és az utolsó tagja mindig nulla, ezért nem kell abszolút érték jel sem. Az is jól látható, hogy az összeg nulla lenne teljes egyenlőség esetén, hiszen ekkor rk+ sorozat is egy 1/n közű létra lenne 1-ig. Az ekvidisztánstól vett távolság azt méri, hogy a szegényebb rétegek átlagosan mennyivel maradnak le, ahhoz viszonyítva, mint amennyi az egyenlő keresetek mellett nekik jutna. Ez a felírás felel meg leginkább a Lorenz görbe értelmezésnek.
3.1.3. Reverz távolság További értelmezések közé tartozik, az ellentétesen rendezett normált szukcesszív összegek differencia átlaga, amely képlettel megadva a következő: Pn (r− − rk+ ) R = k=0 k . n Ez valójában következménye az előzőnek, ugyanakkor egy teljesen más értelmezést nyújt. Ugyanis az rk− − rk+ differencia minden k = 1, . . . , n-re megmutatja, hogy mekkora a különbség a k fő legszegényebb és a k fő leggazdagabb összkereset hányada között. Azaz a Gini index felfogható úgy is, hogy a leggazdagabb és a legszegényebb rétegek összkereseti hányada közötti átlagkülönbség.
15
A reverz távolság szerinti felírásban nem a 45◦ -os egyenes és a Lorenz görbe közötti területet vesszük, hanem azt, amit a Lorenz görbe és az a görbe határol, amelyet a Lorenz görbének, az (1/2, 1/2) pontra vett középpontos tükrözése ad. A centrális tükrözés utáni görbe és az eredeti Lorenz görbe közötti területet vizsgáljuk.
3.1.4. Ekvidisztánssal vett távolság A Gini index a proporciótól való növekvő eltérés sorozatnak, a 0-ra vett szimmetrikus 1/n közű létrának a skalárszorzata: I=2
X
x+ 1 `k ( k − ) sn n
ahol az lk egy nullára szimmetrikus 1 hosszú létra. Az
x+ k sn
azt adja meg, hogy egy-egy
ember az összjövedelem hányad részét kapja meg. Vagyis az első tag azt méri, hogy az alkalmazottak, az átlagos 1/n jövedelemhányadtól mennyire térnek el. Tehát itt azt a különbséget vizsgáljuk, amely a szimmetrikus létra és a jövedelmek átlagostól való eltérése között van.
3.2. Gini-index diszkrét eloszlás esetén Legyen (X, P ) = ([x1 , x2 , . . . , xk , . . .], [p1 , p2 , . . . , pk , . . .]) egy tetszőleges diszkrét eloszlás.
D(X, P ) =
8
8
Ezen eloszlás várható differenciája: XX
pi pj |xi − xj .|.
i=1 j=1
Vagyis a (X, P ) eloszlás várható differenciája, annyi mint két független ξ1 , ξ2 ∼ (X, P ) eloszlású véletlen mennyiség. Ez esetben a képlet, így módosul: D(X, P ) = E |ξ1 − ξ2 | .
16
3.3. Gini index kiszámítása Hoover index segítségével
3.1. ábra. B − E szakasz, az első körös Hoover index
Kum.
Kum.
Teljes
Átlag
Jövedelem
Jövedelem/Fő
Népesség %
Jövedelem %
A
25
10
25
10
100 000
4 000
B
25
20
50
30
200 000
8 000
C
25
30
75
60
300 000
12 000
D
25
40
100
100
400 000
16 000
Csoport
Népesség %
Jövedelem %
3.1. táblázat. Népesség és jövedelemeloszlási mintaadatok
A Gini indexet gyakran magyarázzák a Lorenz görbével, amely a kumulatív jövedelem eloszlást ábrázolja a népesség kumulatív arányával szemben (ahol a jövedelmi adatok növekvő sorrendben állnak). Most nézzünk egy megoldási folyamatot, ahol a Gini együtthatót a Roobin Hood index segítségével számoljuk ki. A 3.1-es táblázatban látható egy fiktív népesség adatai. Az emberek jövedelem alapján növekvő sorrendben vannak, és ezt a sort felosztjuk az egyszerű példa kedvéért négy egyenlő csoportra (A, B, C, D). Így leolvasható a táblázatból, hogy a népesség legszegényebb 50%-a kapja a teljes jövedelem 30%-át és így tovább. 17
A jól ismert Gini együttható, azaz a jövedelem egyenlőtlenségi mértéke a 45◦ -os egyenes és a Lorenz görbe által bezárt területnek felel meg. De felfogható úgy is, hogy fele az átlagos relatív eltérésnek, vagy másképpen megfelel a páronként vett abszolút különbség átlagának. Képlettel leírva:
Pn Pn
|xi − xj | . n2 Ahol xi az i. ember jövedelme, n pedig a vizsgált népesség egyedszáma. i
Akkor igaz:
j
Pn Pn
|xi − xj | . 2xn2 Nézzük újra a példánkat. Ha kielemezzük a táblázatot, adódik, hogy a legnagyobb G=
i
j
eltérés a népesség kumulatív aránya és a jövedelem kumulatív aránya között 20%. Bontsuk két csoportra a teljes populációt. Az első csoport a szegényebb réteg (A, B csoportok vannak benne), a másik a felső, gazdag réteg (C,D csoportokat tartalmazza). Így szétszedtük a társadalmat egy szegény és egy gazdag rétegre. A maximális különbség a két kumulatív arány között maga a Hoover index, vagy más néven a Robin Hood index. Ez megegyezik a maximális függőleges eltéréssel a Lorenz görbe, és a 45◦ -os egyenes között. Jelen esetben ez a B-E szakasz. Tehát adódik, hogy mekkora pénzt kell átcsoportosítani a gazdag rétegtől a szegény réteghez, hogy elérjük a két csoport között az egyenlőséget. A példámban a Hoover index 20, amely azt jelenti hogy a gazdagok csoportjának a teljes jövedelem 20%-át kell átadnia a szegények csoportjának, amely 200 000 egység, hogy a két csoport között létrejöjjön az egyenlőség. Tehát az átcsoportosítás után a népesség 50%, a teljes vagyoni javak 50%-át kapja meg.
18
3.3.1. Második kör
3.2. ábra. A második körös Robin Hood indexek (A − F , C − G szakaszok)
Csoport
Népesség %
Kum.
Kum.
Teljes
Átlag
Népesség %
Jövedelem %
Jövedelem
Jövedelem/Fő
Jövedelem %
A
25
10
25
20
200 000
8 000
B
25
20
50
50
300 000
12 000
C
25
30
75
70
200 000
8 000
D
25
40
100
100
300 000
12 000
3.2. táblázat. A második körös, átszámított jövedelemeloszlási értékek
Alcsoportok Roobin Hood indexénk kiszámítása: Az előző példát folytatva, feltételezzük, hogy a szegény réteg megkapta a 200 000 egységet, amelyet a gazdagoktól vontunk le, így létrejött az egyenlőség köztük. Habár a szegény és a gazdag réteg között már egyenlően oszlanak el a javak, az egyes csoportokon belül még nem. Így például jelenleg is a népesség 25%-a, még mindig csak a vagyon 20%-át kapja, vagy a szegényebb 75%-a a javak 70%-át szerzi meg. Tehát a teljes társadalmon belüli totális egyenlőségről továbbra sem beszélhetünk. Ahhoz, hogy ezt elérjük a B csoportnak a teljes jövedelem 5%-át, azaz 50 000 egységet át kell adni az A-ban lévő 19
embereknek, és D csoportnak a teljes jövedelem 5%-át oda kell adnia a C csoportnak. Ez abból adódik, hogy mind a két esetben a Hoover index 5. Amit a második 3.2-es ábrán is láthatunk (A-F egyenes és C-G egyenes). Ha megnézzük a második körben a várható átcsoportosítás méretét, akkor azt kapjuk, hogy (0.5 · 0.05) + (0.5 · 0.05) · 100 = 5%. Az első része a B-ből A-ba való kifizetés, az összeg másik része a D-ből C-be való kifizetés. Így megkapjuk a második körös átcsoportosítás százalékos Gini értékét. Amennyiben összeadjuk az első és második kör eredményét, akkor megkapjuk a Gini együttható értékét. Jelen esetben 20% + 5% = 25%, azaz a Gini index 0.25. Ellenőrizzük le R program segítségével: library(ineq) data <- c(10,20,30,40) ineq(data,type="Gini") Az eredmény ebben az esetben is 0.25!
3.3.2. Általános eset Most nézzük meg a fentiekben kiszámolt Gini index általános esetét. A megoldott példa alapján rögtön adódik a képlet:
G = H1 +
Si R X X
αij Hij0 .
i=2 j=1
Ahol a H1 az első körös Hoover index, az R a körök maximális száma, Si csoportok száma, Hij a j. csoport Hoover index mértéke az i. körben, αij pedig a j. csoport súlya a i. körben. Ebben az esetben minden körre igaz, hogy: X
αij = 1.
j
A példában már kifejtettem, hogy a H1 a maximum különbség a népesség kumulatív aránya és a jövedelem kumulatív aránya között. Így felírható a képlet: H1 =
max |CPk − CIk |
k=1,. . . ,G
ahol a CPk a populáció kumulatív aránya, a CIk a jövedelem kumulatív aránya és k pedig a csoportok száma. 20
3.3. ábra. CPk , CIk pontok értelmezése a Lorenz görbén
A k ∗ jelentse az alcsoport maximális elemszámát a második körben. Ugyanis az első körben az egyetlen nagy csoportunkat két csoportra osztottuk H1 mentén. Egyik csoport a k1 = k ∗ + 1, . . . , G, a másik a k2 = 1, . . . , k ∗ alcsoportokat foglalja magába. Ezek után nyilvánvaló, hogy a k1 csoport fogja átadni a jövedelmének egy részét a k2 csoportnak. Ezen két csoport minden alcsoportjának új jövedelme a következőképpen határozható meg: H1 I ∗ Pm (1) Im = Im + Pk∗ ; m = 1, . . . , k ∗ k=1 Pk H1 I ∗ Pm (1) Im = Im − PG ; m = (k ∗ + 1), . . . , G k∗ +1 Pk ahol I a jövedelem, P a népesség és az I ∗ jelenti a teljes jövedelmet. A felső indexben lévő 1-es szám jelöli azt, hogy az első kör utáni újraszámolt jövedelmi értéket határoztuk meg. Most nézzük meg mindezeket a második körben. Első lépésként itt is megkeressük a Hoover idexet mind a két csoportban. Azaz képlettel leírva:
21
(1) max ∗ CPk − CIk
0
H21 =
k=1. . . ,k
0
H22 =
max
k=k∗ +1,...,G
(1) CPk − CIk .
A hozzá tartozó súlyok a második körben, ahol P ∗ jelentse a teljes populációt: Pk ∗
k=1 P∗
α21 =
PG
Pk
k∗ +1 P∗
α22 =
Pk
.
Most nézzük meg, hogy az i. körben hogyan néznek ki ezek a képletek. Először ki kell számolni az i. kör új jövedelemértékét, minden egyes kettévágott csoportra. Legyen Si az i. kört megelőző körben talált Hoover indexek száma. Ezek mentén minden csoport újra ketté lett vágva az i. körben. Ekkor minden j. csoport nj alcsoportot tartalmaz, tehát kj∗ -ra igaz, hogy 1 ≤ kj∗ ≤ nj − 1. Akkor a j. csoport alcsoportjainak új jövedelem értéke a következőképpen írható fel: 0
(i) Im
=
i−1 Im
Hi,j I ∗ Pm + Pk ∗ ; m = 1, . . . , kj∗ ; j = 1, . . . , Si k=1 Pk
=
i−1 Im
Hi,j I ∗ Pm + Pnj ; m = k ∗ + 1, . . . , n∗j ; j = 1, . . . , Si . P ∗ k k +1
0
(i) Im
Majd ezek után minden csoportban megkeressük a Hoover indexet:
0
Hi+1,j = 0
Hi+1,Si +j =
(i) max ∗ CPk − CIk ; j = 1, . . . , Si
k=1...,k
max ∗
k=k +1,...,nj
(i) CPk − CIk ; j = 1, . . . , Si .
22
A hozzájuk tartozó súlyok pedig: Pk∗
k=1 P∗
αij =
Pk
Pnj
k∗ +1 P∗
αi+1,Si +k =
; j = 1, . . . , Si
Pk
; j = 1, . . . , Si .
A fentiek alapján a Gini együttható zárt alakban a következőképpen írható fel: G = H1
Si R X X
2 αij Hij
i=1 j=1
ahol H1 az első kör Hoover index értéke, R a lehetséges körök száma amire igaz, hogy: R = G − 1.
3.4. Gini index hibája Most, hogy már részletesen ismerjük a Gini indexet, adódik a kérdés miért van az, hogy azon túl, hogy talán a leghíresebb egyenlőtlenségi mutató, mégis az egyik legvitatottabb mérőszám. Ennek az az oka, hogy számos hiányossága és hátrányos tulajdonsága van. Nézzünk egy társadalmat, ahol a populáció felének egyáltalán nincs jövedelme, míg a társadalom másik felében egyenletesen oszlanak el a jövedelmek. Ebben az esetben a Gini együttható 0.5. Egy másik esetben, amikor a társadalom 3/4-e birtokolja a teljes vagyon 1/4-ét, és a maradék 1/4-e birtokolja az összjövedelem 3/4-ét. Ebben az esetben is a Gini értéke 0.5. Mégis az utóbb említett társadalom vagyoneloszlása sokkal egyenlőbb, mint az első, ellenben ez a Gini együtthatóban nem jelenik meg. Ezt a 3.4 ábra szemlélteti. A Gini és a hozzá hasonló statisztikai mérőszámok általában egy nagy és összetett adathalmazokat jellemeznek egyetlen számmal, ez adatveszteséget okozhat. Ha nem figyelünk, könnyen félrevezethetnek minket ezek az értékek. Ugyanis egy adott Gini indexhez biztosan tartozik két Lorenz görbe, hiszen ha például a népesség 70%-a csupán a javak 30%-át szerzi meg, ezzel szemben lehet az is, hogy a népesség 30% -a rendelkezik a vagyon 70%-val. A Gini index nem tesz különbséget abban, hogy egy adott egyenlőtlenség az alacsony, vagy a magas jövedelmi osztályban jelenik-e meg. Erre az Atkinson a megfelelő. 23
3.4. ábra. A 0.5 értékű Gini indexhez tartozó Lorenz görbék. Valójában azonban egy Gini indexhez végtelen sok Lorenz görbe tartozhat. Így fordulhat elő az is, hogy két országnak közel hasonló a Gini együtthatója, azaz elvileg a vagyoneloszlás ugyanannyira jó, vagy rossz. De mégis, ha a számok mögé nézünk, akkor ez nem teljesül. Ez a helyzet például USA és Kína esetében is. Ha több országot hasonlítunk össze, akkor nagyon figyelni kell, hogy a Gini-index kiszámítása mindig azonos felosztással történjen, mert durvább felosztás esetén kisebb, ezzel szemben finomabb felosztás esetén nagyobb egyenlőtlenséget kapunk. Ha a felosztás durvább, adatvesztés következhet be, hiszen a finomabb felosztás olyan egyenlőtlenségeket is figyelembe vesz, amelyeket a durvább felosztás nem. Gini indexnél figyelni kell a kiszámítás módjára és annak háttértartalmára is, mert ha ezeket nem ismerjük, könnyen hibás következtetéseket vonhatunk le.
24
4. fejezet További gazdasági mérőszámok 4.1. Jövedelmi egyenlőtlenség további mérőszámai Jövedelem egyenlőtlenséget nem csak a már korábban bemutatott Gini együtthatóval mérhetünk. Vannak még ugyanerre a célra kidolgozott mérőszámok. Az egyenlőtlenségi mutatókat két fő csoportra oszthatjuk. Az egyik az eloszlás típusú mérőszámok, a másik a szóródás típusúak. Persze ezek az egyes mutatók eltérő módon reagálnak a különböző rétegekben végbemenő jövedelemváltozásokra. Tóth István György jövedelem vizsgálatai alapján [Tóth István György: Jövedelemeloszlás], megállapítható, hogy általában a jövedelemskála felső tizedének változására legérzékenyebbek ezek az indexek. Illetve az is, hogy az előbb említett felső tized jövedelemváltozása a Theil index mértéket erőteljesen, míg a Gini index értékét kevésbé befolyásolja. Ha viszont az alacsonyabb osztályban történik a jövedelemváltozás, akkor a Gini index nagyon, míg a Theil index kevésbé tér ki. A Gini indexen kívül további egyenlőtlenségi mérőszámok: • Relatív szórás százalékban: σ ∗ 100 x ahol a σ az egy főre jutó jövedelmek súlyozott szórása. ν=
• A q10 – a felső és az alsó tized átlagának hányadosa: q10 =
25
d10 . d1
• A q5 – a felső és az alsó jövedelmi ötöd átlagának hányadosa: q5 =
d9 + d10 . d1 + d2
• Éltető Frigyes-féle egyenlőtlenségi mutató: υ=
xf xa
ahol xf az átlagjövedelem feletti jövedelemátlag, míg a xa az átlag alatti jövedelemátlag. Illetve, felírható az eloszlás felső részének egyenlőtlensége, amely a következőnek felel meg: υf = is: υa =
x . xa
xf x
és felírható az eloszlás alsó részének egyenlőtlensége
Ha ezt a két értéket összeszorozzuk, akkor így is megkapjuk Éltető
Frigyes-féle egyenlőtlenségi indexet: υ = υf ∗ υa . • A jövedelmek logaritmusainak szórásnégyzete: Pn wi ei (ln(xi ) − ln(x))2 2 σln = i=1 Pn i=1 wi ei ahol az xi az i. háztartás egy főre jutó jövedelme, az ln(x) a logaritmikus jövedelmek átlaga, n a minta elemszáma, ei az i. háztartás tagjainak száma és végül a wi az i. háztartás súlya. • Theil-féle egyenlőtlenségi index: T = ahol N =
P
1 X xi xi Wi ni ln( ) N x x
Wi ni , Wi az i. háztartásnál használt felszorzó faktor, ni az i. háztartás
taglétszáma, xi az i. háztartás egy főre jutó jövedelme.
26
4.2. Koncentrálódás mérőszámai Mérőszámok nemcsak a vagyonegyenlőtlenség mérésére valók, hanem például szokták mérni a gazdasági tevékenységek térbeli eloszlásának, vagy éppen területi fejlődésének mértékét. Ezekre több fajta mérőszámot dogoztak ki. Ilyen a Moran index, vagy az Ellison Glaeser-féle γ mutató, akár az LQ index. Főleg napjainkban nagyon fontossá vált a nagy piaci versenyben a térbeli differenciáltság, illetve a földrajzi, vagy a térbeli sűrűsödés mérése. Hiszen például egy földrajzi sűrűsödésnek többféle oka lehet, mint a helyi adottságok, vagy a népesség száma, ezt a koncentrációt a szaknyelvben úgy is hívják, hogy agglomeráció. Így egy kezdő vállalkozás mérni tudja, hogy a piac amit ő kiszemelt és amiben teret akar hódítani, mennyire telített. Azaz van-e értelme az adott szektorban vállalkozást indítani, vagy az már annyira telített, hogy nem lenne felvásárlópiac. Ugyanígy nem elhanyagolható az sem, hogy mely területen, mekkora koncentráltsággal van jelen egy gazdasági ágazat. Ha például egy alumíniumfeldolgozó üzemet szeretnénk létesíteni, akkor elsősorban az ilyen földrajzi sűrűsödési pontokat keressük. Hiszen ez azt jelzi nekünk, hogy a közelben található alumíniumkitermelő, és kellő infrastruktúrával rendelkezik a terület, ahhoz, hogy minél olcsóbban hozzájussunk a feldolgozandó nyersanyaghoz. Ellenben, ha egy éttermet szeretnénk nyitni, akkor nem feltétlen jó, ha egy ilyen sűrűsödési ponton nyitunk vendéglátó helyet. Hiszen – a példánál maradva – ha egy utcában három étterem közé még nyitunk egy negyediket is, akkor négyen fognak osztozni a teljes piacon, így persze megoszlik a jövedelem is. Elsődleges cél, hogy legyen felvevőpiac, és fontos a célközönség egyedlétszáma is. Összefoglalva a vállalkozás telephelyének megválasztásakor fontos és befolyásoló tényező, hogy a többi vállalkozás hol működik (azaz sűrűsödési pontot keresünk), esetenként számít a többi vállalkozástól mért optimális távolság. A koncentrálódás mérőszámai két fő csoportra osztható: • Független területi egységek: bizonyos térfelosztási szint mellett az egyes területi egységekbe jutó gazdasági tevékenység kirívóan magas, illetve alacsony értékeit vizsgálják. Földrajzi elhelyezkedéstől függetlenül. • Területi autokorreláció: itt is a cél a tömörülések feltérképezése, viszont már számít az egységek földrajzi közelsége és a szomszédossági viszonyok is fontos szerepet játszanak. 27
4.2.1. Helyi hányados (LQ) index Leggyakrabban használt térbeli sűrűsödés vizsgálati mutató. Egy bizonyos gazdasági tevékenység, ágazat, alágazat, egy adott térségben való alul, vagy túlreprezentáltságát méri. A nemzetgazdaság egészéhez, vagy kisebb tevékenységi körhöz viszonyított. Így az alábbi képlet írható fel: LQi =
ei E ei e
=
si xi
ahol ei az i. területi egységben, az adott ágazatban foglalkoztatottak száma, ei az i. területi egységben foglalkoztatottak száma, E az adott ágazatban országos szinten foglalkoztatottak száma. Végül E, az összes foglalkoztatott országosan. Tehát si az az érték, hogy egy adott ágazatban dolgozók, mekkora hányada dolgozik az i. terültei egységben. Valamint xi jelenti, hogy az összfoglalkoztatottak mekkora hányada dolgozik az i. területi egységben. Ha egy térségben a mutató értéke 1-nél nagyobb, akkor az egész országhoz képest az adott térség, relatív több foglalkoztatottat tud felmutatni. A térségi specializáció feltárásában hasznos.
4.2.2. Herfindahl index Ágazati koncentráció mérésére szolgáló mutató, tehát egy tevékenységkörbe tartozó vállalkozások létszámeloszlását méri.
H=
N X
zk2
k=1
ahol, N az adott ágazatban működő vállalkozások száma, míg zk egy adott ágazatban a foglalkoztatottak számának a k. vállalkozásra jutó hányada. Különböző ágazatokat csak akkor tudunk összehasonlítani a Herfindahl mutató alapján, ha a két ágazatban azonos a működő vállalkozások száma. Ezért a mutató normalizált formáját használják: H − N1 H = . 1 − N1 ∗
28
A Helfindahl indexnél a következő minősítéseket határozták meg: • H ∗ < 0, 01 — ebben az esetben az ágazat erősen elaprózott, • 0, 01 < H ∗ < 0, 1 — ez már egy kevésbé, de még mindig elaprózott ágazatot mutat, • 0, 1 < H ∗ < 0, 18 — gyengén koncentrált ágazat, • 0, 18 < H ∗ — erősen koncentrált ágazat. Tehát az index értéke minél közelebb van a nullához, annál elaprózottabb az ágazat, minél távolabb van a nullától, annál koncentráltabb szektorról beszélhetünk.
4.2.3. Ellison - Glaeser index Gini-mutatóhoz hasonló differenciáltságot jellemző mérőszám. A foglalkoztatottság térbeli eloszlásához hasonlítja, az i. ágazatbeli foglalkoztatottság térbeli eloszlását: PM
G=
2 i=1 di P 2 1− M i=1 xi
ahol M a vizsgált területek száma, si és xi az LQ indexnél definiált értékek, valamint di = si − xi . Nulla körüli érték esetén, az ágazatbeli foglalkoztatottság térbeli eloszlása hasonlít a foglalkoztatottság eredeti térbeli eloszlásához. Ha viszont 1-hez közeli értéket vesz fel, akkor az ágazat térben nagymértékben koncentrált.
4.2.4. Ellison - Glaeser γ mutató Az Ellison - Glaeser indexet módosíthatjuk Herfindahl index értékének segítségével. Hiszen lényeges kérdés lehet, hogy miért koncentrálódik egy ágazat egy területre. Vajon csak azért, mert egyetlen egy nagy vállalatból áll, vagy sok kisebb ágazat települt ugyanarra a területre. Erre ad becslést a Ellison - Glaeser γ mutató, melynek képlete: γ=
G−H . 1−H
29
Az Ellison - Glaeser γ mutató esetén a következő minősítéseket határozták meg: • γ < 0 — az ágazat térben szórt, • 0 ≤ γ < 0, 02 — az ágazat gyengén koncentrálódott, • 0, 02 ≤ γ < 0, 05 — az ágazat közepesen koncentrálódott, • 0, 05 ≤ γ — az ágazat erősen koncentrálódott. Sok hasonló mutatót lehetne még részletezni, mint a Moran index, Geary-féle c mutató, LISA (ami a lokális Moran index), vagy ide sorolható még a Lokális G∗i statisztika is.
30
5. fejezet Az INEQ programcsomag ismertetése Az R statisztikai program1 kiegészítései között megtalálható egy programcsalád, melynek neve INEQ. Ez tartalmaz jó néhány olyan függvényt, amivel egyszerűen és gyorsan tudunk Lorenz görbét (tapasztalati és elméleti), egyenlőtlenségi mértéket, koncentrációt számolni. Pár eloszlásfüggvény elméleti Lorenz görbéje is megtalálható a programcsomagban. Továbbiakban ezeket fogom részletezni. Először mindig meg fogom nézni magát az eloszlás tulajdonságait, majd megmutatom, hogy az ineq milyen megoldást ad az adott elméleti eloszlásra.
5.1. theorLc A theorLc függvény kiszámolja az elméleti Lorenz görbéjét a jövedelem eloszlásnak. Három paramétert vár. Az első a típusa. Itt azon eloszlások közül választhatunk amit a csomag támogat. Mint például a Singh-Maddala, Dagum, lognorm, Pareto és az exponenciális eloszlás. A másik argumentuma egy vektor, amely az adott eloszlás függvényparaméterei. Végül vár egy p értéket [0, 1] intervallumon. Ez lesz a felosztás, azaz a felosztás finomságának mértéke. Most mutatok egy általános példát a theorLc használatára, a későbbiekben pedig részletesen végigmegyek az egyes eloszlásfüggvényeken.
1
R Core Team (2015). R: A language and environment for statistical computing.
R Foundation for Statistical Computing, Vienna, Austria. URL http://www.R-project.org/
31
Továbbiakban a három paraméter jelölése a következő lesz: • type — típus (Singh-Maddala, Dagum, lognorm stb.), • param — eloszlásfüggvény paraméter vektora, • p — felosztás "finomsága" [0, 1] intervallumon. Ez alapján a következő meghívási képletet tudjuk felírni: Lc.type(p, param)
5.2. Dagum A Dagum eloszlás egy folytonos valószínűségi eloszlás, egy előre meghatározott intervallumon. Nevét Camilo Dagum után kapta, aki 1970-ben alkotta meg. A Dagum eloszlást leggyakrabban a jövedelem megoszlás elemzésére használják. Három pozitív értékű paramétere van a, b és p. Az a és p paraméterek egy úgynevezett shape paraméterek, melynek értékeitől függően a Dagum eloszlás sűrűségfüggvénye lehet monoton csökkenő is. A b érték a scale érték, amely meghatározza a sűrűségfüggvény teljes magasságát. Ha a magasság növekszik akkor a b értéke csökken nulla felé. Sűrűség függvénye: ap f (x) = x Eloszlás függvénye:
!
x ap b xa b
+1
p+1
x −a −p F (x) = 1 + . b
32
.
5.2.1. Tesztek R-ben shape1.a <- 2; shape2.p <- 1; dscale.b<-1 x <- seq(-0.01, 5, len = 401); plot(x,dexp(x),type="l",col=1,ylab="",las=1,ylim=c(0,1)); lines(x,ddagum( x, scale=dscale.b, shape1.a=shape1.a, shape2.p=1), col=2);
5.1. ábra. Dagum eloszlásfüggvény változásának vizsgálata lerögzített a és scale paraméterekkel, miközben p értékét növeljük.
Első esetben p paraméter értéket növelem, míg eközben a másik két argumentumot lerögzítem egy adott értéken. Megfigyelhető, hogy míg p = 1-nél a görbénk még elég csúcsos 33
addig p = 3-nál már kezd kisimulni. Minél nagyobb számot veszünk p-re, annál jobban kezd simulni az x tengelyhez. A következő tesztben a értékét növelem, míg a többit fixen hagyom. Jól látható, hogy itt ellentétben az előző esettel a függvényünk elkezd növekedni és csúcsosodni.
5.2. ábra. Dagum eloszlásfüggvény változásának vizsgálata lerögzített p és scale paraméterekkel, miközben a értékét növeljük.
Az utolsó tesztben a scale értéket növelem, a többit rögzítem egy adott értéken. Az eredmény azt mutatja, — hasonlóan mint az első esetben — hogy a görbék elkezdenek csökkenni és kisimulni. Tehát, ha minél nagyobb b értéket veszek, akkor a görbe egyre jobban simulni fog az x tengelyhez.
34
5.3. ábra. Dagum eloszlásfüggvény változásának vizsgálata lerögzített p és a paraméterekkel, miközben scale értékét növeljük.
5.3. Lognormális eloszlás Egy valószínűségi változó, mely kizárólag csak pozitív értékeket vesz fel, logaritmikus normális eloszlásnak nevezzük. Tehát igaz rá, hogy η = ln . Ahol η valószínűségi változó, normális eloszlású. Ekkor az eloszlásfüggvény definíciója a következő lesz:
F (x) = P ( < x) = P (η < ln(x)) Z ln(x) (t−m)2 1 √ = e− 2σ2 dt. σ 2π − inf Ezt differenciálva megkapjuk: f (x) = √
1 ln(x − m)2 exp(− ). 2σ 2 2πσx
35
Ebből integrálás segítségével kiszámítható a várható értéke és a szórása:
M () = em+
σ2 2 2
2
σ()2 = e2m+σ (eσ − 1).
5.4. ábra. Lognormális eloszlás eloszlásfüggvénye különböző paraméterértékekre.
Gyakorlatban ez sokszor előfordul, mint például a jövedelmek eloszlása is logaritmikus normális eloszlást követ. Hasonló példa lehet az emberek testsúlya, hiszen viszonylag kicsi várható értékhez, magas szórás tartozik. Az értékek nem lehetnek negatívak, tehát nulla az alsó korlát, viszont a felső korlát akár végtelen is lehetne. Ilyen persze a valóságban nincs, de ritkán előfordulhat akár 200 kg-os ember is, amellett, hogy az átlag 60 − 70 kg. Ebből is már érezhető, hogy a testsúly egy elég széles skálán mozog. Ehhez a skálához képest képest kicsi a várható érték, így torzul az y tengely irányába (a normál eloszláshoz képest). Ugyanezt a logikát átvezethetjük egy ország polgárainak jövedelmére is. Itt is nyilvánvaló, hogy negatív jövedelem nincs és az is látható, hogy nem igazán tudunk felső korlátot adni. Ez alapján feltételezhetjük, hogy lognormális eloszlást követ.
36
5.5. ábra. Emberek súlyának eloszlása
5.3.1. Minta program: x<- seq(0,220,by=10) plot(x, dlnorm(x,4.2484952,0.4), type="o",xlim=c(0,200) )
5.6. ábra. Lognormális eloszlás Lorenz görbéje
37
5.4. Pareto eloszlás A Pareto eloszlás egy olasz közgazdász Vilferdo Pareto (1848 − 1923) nevéhez fűződik. Nagyon hasonlít a lognormális eloszlásra, viszont Pareto valószínűleg nem tudott a lognormális eloszlás létezéséről. Bár a Pareto és a lognormális eloszlás képlete teljesen más, mind a kettő remekül közelíti a tapasztalati jövedelem eloszlást. A Pareto nagy jövedelmek esetén elég jó közelítést ad, viszont az átlag alatti jövedelmeket a görbe nagyon rosszul esztimál. Sok vita van arról is , hogy a magas jövedelmek tényleges eloszlását melyik írja le jobban. A Pareto eloszlás az első olyan modellek egyike volt, amely jól közelíti a jövedelemeloszlást. Használják még a népesség területi eloszlásának mérésére, illetve sok más gazdasági területen is. 5.4.1. Definíció. Legyen X egy valószínűségi változó ami Pareto eloszlást követ. Ha X értéke 1 valószínűséggel nagyobb vagy egyenlő k akkor igaz hogy: ( α k ha x ≥ k x P r(X > x) = . 1 ha x < k Ahol k az X lehetséges legkisebb értéke.
f (x, α, k) =
αk α ; k ≤ x < ; α, k > 0. xα+1 8
Sűrűségfüggvénye:
Eloszlás függvénye: ka ; k ≤ x < ; α, k > 0. x 8
F (x, α, k) = 1 − Az eloszlás várható értéke:
E(X) = Szórás: V ar(X) =
αk ; α > 1. α−1
αk 2 ; α > 2. (α − 1)2 (α − 2)
38
5.4.1. Pareto elv A Pareto elv, más néven a 80 − 20 szabály. Számos gazdaság, terület, népesség eloszlási jelenségre igaz, hogy a következmények 80%-a, az okok 20%-ára vezethető vissza. Pareto azt állította, hogy ez a jelenség mindenhol ott van a világban. Például, hogy a Földünk népességének 20%-a kapja a fizetések 80%-át, vagy a vevők 20%-a vesz részt az eladások 80%-ban. De meg lehet említeni azt is, hogy egy hirdetésre fordított erőfeszítés 20%-a hozza meg a profit 80 %-át. Talán még ennél is szemléletesebb, hogy a fogyasztói panaszok 80%-át a termékek vagy szolgáltatások 20%-a okozza. A listát a végtelenségig lehetne sorolni, most csak egy párat említettem meg. Ezt a jelenséget először Pareto vette észre és kezdte el tanulmányozni.
5.7. ábra. Pareto eloszlás Lorenz görbéje
39
5.5. Burr-eloszlás Más néven úgy is ismert, hogy Singh–Maddala eloszlás.Burr-eloszlás egy folytonos valószínűségű eloszlás, csak és kizárólag nem negatív változókra. A modellt Irving W. Burr amerikai matematikus 1942-ben dolgozta ki. Általában háztartási bevételek modellezésére használják. Sűrűségfüggvénye: xc−1 . (1 + xc )k+1
f (x; c, k) = ck Eloszlás függvénye:
F (x; c, k) = 1 − (1 + xc )−k . Az eloszlás várható értéke:
1 1 E(X) = µ1 = kB k − , 1 + c c
ahol B a béta függvény. Szórás: V ar(X) = −µ21 + µ2 . Speciális esetben, ha c = 1 akkor II típusú Pareto eloszlást kapunk, ha k = 1 akkor Champernowne eloszlás lesz, amit gyakran Fisk eloszlásnak is hívnak. 5.5.1. Megjegyzés. Burr-eloszlás inverze a Dagum-eloszlás.
5.6. Az exponenciális eloszlás 5.6.1. Definíció. A ξ valószínűségi változót λ paraméterű exponenciális eloszlásúnak nevezzük, ha eloszlásfüggvénye: ( F (x) =
0 ha x ≤ 0 1 − e−λx ha x > 0
ahol λ > 0 rögzített. Az exponenciális eloszlás sűrűségfüggvénye: ( 0 ha x ≤ 0 f (x) = . λe−λx ha x > 0 40
5.8. ábra. Burr-eloszlás Lorenz görbéje Ha X exponenciális eloszlású λ paraméterrel, akkor várható értéke: Z ∞ Z ∞ 1 −λy −λy ∞ e−λy dy = . λye dy = −ye + E(X) = 0 λ 0 0 Szórása: V ar(X) =
41
1 . λ2
Irodalomjegyzék [1] Frank A. Farris, The Gini Index and Measures of Inequality, MAA, 2010 [2] Fernando G. De Maio, Income inequality measures, 2007 [3] Peter A. Rogerson, The Gini coefficient of inequality: a new interpretation, SpringerVerlag Berlin Heidelberg, 2013 [4] Robert T. Jantzen & Klaus Volpert, On the Mathematics of Income Inequality: Splitting thi Gini Index in Two, MAA, 2012 [5] Rolf Aaberge, Theoretical Foundations of Lorenz Curve Orderings, 1993 [6] Éltető Ödön & Havasi Éva, A hazai jövedelemegyenlőtlenség főbb jellemzői az elmúlt fél évszázad jövedelmi felvételei alapján, KSH, 2009 [7] Szakálné Kanó Izabella, A gazdasági aktivitás térbeli eloszlásának vizsgálati lehetőségei, KSH, 2011 [8] Michel Lubrano, The econometrics of inequality and poverty: Lorenz curves, the Gini coefficient and parametric distributions, 2015 [9] INEQ documentation, https://cran.r-project.org/web/packages/ineq/ineq.pdf [10] https://en.wikipedia.org/wiki/Dagum_distribution [11] https://en.wikipedia.org/wiki/Log-normal_distribution [12] https://en.wikipedia.org/wiki/Pareto_distribution [13] https://en.wikipedia.org/wiki/Burr_distribution [14] https://en.wikipedia.org/wiki/Exponential_distribution 42
Név: Annár Zsolt ELTE Természettudományi Kar, Szak: Matematika BSc NEPTUN kód: IQTLZO Szakdolgozat címe: Egyenlőtlenségi mértékek statisztikai értékelése
A szakdolgozat szerzőjeként fegyelmi felelősségem tudatában kijelentem, hogy a dolgozatom önálló munkám eredménye, saját szellemi termékem, abban a hivatkozások és idézések standard szabályait következetesen alkalmaztam, mások által írt részeket a megfelelő idézés nélkül nem használtam fel.
Budapest, 2015. december 29.
................................. a hallgató aláírása
43