Tanulmányok
Többváltozós-többdimenziós egyenlõtlenség és a szegénység Hajdu Ottó, a Budapesti Corvinus Egyetem tanszékvezető egyetemi docense E-mail:
[email protected]
A tanulmány célja egy új, terminológiánk szerint GVIP (generalized variance inequality and poverty) többváltozós módszer definiálása az egyenlőtlenség többdimenziós mérésében, majd szegmentált társadalomra megadni annak külső-belső csoportközi felbontását, és az elvet a szegénység mérésében is alkalmazni. A módszer a szóródás többváltozós, általánosított variancia mértékén alapul. A csoportközi dekompozíció a Wilks’ lambda hányadost alkalmazza, lehetővé téve a numerikus számítások standard statisztikai programmal történő kalkulálását. A GVIP elv a szerző által definiált új mátrix, nevezetesen a Theil-kovarianciamátrix determinánsára épül, amit a tanulmány általánosított Theil-varianciaként nevez el. A szegénység mérésében transzformált eloszlásokra alkalmazva a GVIP mint szegénységi mérték adódik. A GVIP figyelembe veszi a dimenziók korrelációs rendszerét és aszimmetrikus eloszlását, és egydimenziós esetben is többváltozós technikát alkalmaz, kihasználva annak előnyeit. TÁRGYSZÓ: Általánosított entrópia és variancia. Többdimenziós egyenlőtlenség és szegénység. Diszkriminancia analízis, Wilks’ lambda.
Statisztikai Szemle, 90. évfolyam 9. szám
790
Hajdu Ottó
A
tanulmány gazdasági-társadalmi jelenségek (dimenziók) egyenlőtlenségét vizsgálja, amit szóródásként értelmez és ennek megfelelően méri azt. Célunk több dimenzió tekintetében egyidejűleg és kompozit módon mérni az egyenlőtlenség fokát, figyelembe véve a dimenziók korrelációs kapcsolatait és aszimmetrikus eloszlását, majd szegmentált társadalomra megadni az egyenlőtlenség külső-belső arányát, végül pedig rangsorolni a csoporthatásokat a belső egyenlőtlenséghez való százalékos hozzájárulásuk alapján. A módszertani mondandó bemutatása, tárgyalása érdekében – illusztratív céllal – a tanulmány a jövedelem, fogyasztás, vagyoni helyzet dimenziókört alkalmazza. A cikk egy új egyenlőtlenségi módszertant vezet tehát be, mely más területeken, például a szegénység mérésében (mint jelen tanulmányban is), tovább alkalmazható. A javasolt módszertan az egydimenziós, általánosított entrópia mértékből indul ki, mely vagy csak a jövedelem, vagy csak a fogyasztás, vagy csak a vagyon esetére, esetleg ezek valamely egydimenziós kombinációjára vonatkozik. Az entrópia azonban – statisztikai értelemben – egydimenziós esetben is kétváltozós számítás, mert formulája (például a jövedelem esetén) igényli magát a jövedelmet és a jövedelem logaritmusát is. Ebben a megközelítésben a jövedelem egy latens dimenzió, melynek két manifeszt változója valamely konkrét jövedelmi tétel és annak logaritmusa. Az entrópia jellegű logaritmus-megalapozás figyelembe veszi a vizsgált eloszlás (jövedelem) aszimmetrikus voltát, közelebb hozva a szimmetrikus (normális) eloszlás esetét, lehetővé téve így statisztikai tesztek alkalmazását is. Különbséget teszünk tehát dimenziószám és változószám között: ha a vizsgált dimenziók száma p, az alkalmazott változószám 2p. Ezért az egydimenziós vizsgálat is értelemszerűen kétváltozós. A tanulmány új eredményként a dimenziókból és a logaritmusaikból képezi a Theil-féle kovarianciamátrixot, melynek determinánsa adja a Theil-variancia egyenlőtlenségi mértéket. A Theil-mátrix rendje (2p, 2p), és elemeinek jelentését nevezetes (elsősorban információelméleti alapú) egyenlőtlenségi mértékek adják. A Theilvariancia figyelembe veszi mind a dimenziók, mind a változók korrelációs kapcsolatait az egyenlőtlenség fokában. Analógiaként hozva az euklideszi vs. Mahalanobistávolságot, míg az előbbi korrelálatlan, addig az utóbbi korrelált koordinátatengelyeket feltételez. Jelen cikk ebben az értelemben a Mahalanobis-jellegű egyenlőtlenségi mértékek irányában lép tovább. A társadalom csoportosítása esetén – alapvetően gazdasági-társadalmi jellegű csoportosításra gondolva (például település, régió, háztartástípus, szegény volt) – a kovarianciamátrix külső és belső komponensek összegére bontható, ahol a totális általánosított Theil-variancia mértékében a belső egyenlőtlenség arányát a Wilks’ lambda jellemzi. Így a Wilks’ hányados lehetővé teszi az alkalmazott csoportosítás Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
791
százalékos hozzájárulásának az elemzését az egyenlőtlenség forrása tekintetében. Transzformált adatokra alkalmazva, az általánosított variancia mint általánosított szegénységi mérték is értelmezhető. Egyféle megfelelő transzformáció a cenzorálás, ahol a szegénységi küszöb feletti értékeket a küszöb szintje helyettesíti. Ezáltal a szegénységi mérték érzéketlen a küszöb fölötti átrendeződésekre. A cikk felépítése a következő. Az 1. fejezet röviden áttekinti az entrópia fogalmát, majd definiálja a Theil-kovariancia CT mértéket, és megadja kapcsolatát a nevezetes Theil-féle T1 és T2 entrópia alapú indexekkel.1 A 2. fejezet definiálja a Theilmátrixot, és javasolja a determinánsát mint új egyenlőtlenségi mértéket Theil általánosított variancia (röviden Theil-variancia) elnevezéssel, majd példán keresztül bemutatja számításának menetét. A 3. fejezet ismerteti a Theil-variancia csoportközi felbontását, illusztrálja a számításokat, és értelmezi az eredményeket. A 4. fejezet kiterjeszti a módszertant a többdimenziós esetre is. Az 5. fejezet végül a Theilvarianciát cenzorált eloszlásra alkalmazva, értékét szegénységi mérőszámként értelmezi, és adott csoportosításra vonatkozóan dezaggregálja. A tanulmány a számítások részleteinek bemutatásához, az eredmények könnyű ellenőrzése céljából egyfelől egy modellpélda jellegű illusztratív adatállományt használ, másfelől – az eredmények valós nagyságrendjének és a gyakorlati alkalmazás lehetőségeinek érzékeltetése érdekében – az új módszertan a magyar háztartásokat jellemző költségvetési felmérés – az ún. Háztartási Költségvetési Felvétel (HKF) – adatain is alkalmazásra kerül (KSH [2003]).
1. A Theil-kovariancia entrópia-felbontása Mivel a központi mondanivaló a Theil-kovarianciamátrix elemeire épül, ezért a tárgyalást a Theil-kovariancia fogalmi bevezetésével és értelmezésével kezdjük.
1.1. Az entrópia jelölésrendszere és pszeudo-R2 tartalma Legyen az n tagú társadalom relatív jövedelmi eloszlása az átlagos jövedelem bázisában
ri = 1
Yi Y
( i = 1, 2,...,n ) ,
Innen ered a cikk által alkalmazott elnevezés, a Theil-kovariancia.
Statisztikai Szemle, 90. évfolyam 9. szám
/1/
792
Hajdu Ottó
ahol Yi az i egyén jövedelme. A relatív jövedelem az átlagos „1” jövedelemhez viszonyítva a di = ri − 1
( d = 0)
/2/
hozamot eredményezi, melynek logaritmikus közelítését a relatív jövedelem logaritmusa adja2
Di = ln ( ri ) ≈ di
( ahol: D ≤ 0) .
/3/
Ez a közelítés annál pontosabb, minél közelebb áll a di tényleges hozam a zéróhoz, vagyis a jövedelmi átlagpont szűk környezetében. Totális egyenlőség esetén a D-hozam és a d-hozam egybe esik, növekvő egyenlőtlenség esetén pedig távolodnak egymástól. A Shannon- [1948] entrópia eredetileg a kapott hír alapján történő előrejelzés bizonytalanságának a mértéke
1 n H( r ) = ln ( n) − ∑ ri Di . n i =1
/4/
Ha a jövedelmek eloszlását magyarázó prediktor változók információja üres, akkor az információ zéró többletet ad az egyedi jövedelmek eloszlásáról, az információ hiányában az a priori előrejelzés egy mindenkire egyaránt vonatkozó konstans jövedelem, és a hír bizonytalansága maximális. Ha a hír információja nem üres, és ezt mindenki ismeri, akkor a jövedelmi modell előrejelzése maga az aktuális eloszlás, a posteriori csökkentve az előrejelzés bizonytalanságát az információ birtokában. Végül, ha létezik „a tökéletes információ”, akkor ezt értelemszerűen csak egyvalaki ismerheti, így övé a totális jövedelem, a modell előrejelzése pedig egyértelmű, zéró bizonytalanság mellett. A klasszikus Shannon-entrópia növekvő értékkel egyre egyenletesebb eloszlást jelez, tehát egyenlőségi mutató. A bizonytalanság csökkenését, közeledését a hír hatására a totális bizonyosság irányába – a lehetséges maximális és minimális szint közötti terjedelmen – az ún. pszeudo-R2 illeszkedési mutató számszerűsíti relatív (százalékosan értelmezendő) formában: R 2 = 1 − H ( r ) / ln ( n ) . 2
A közelítés a logaritmus függvény r = 1 pontban történő Taylor-sorának lineáris tagját használja: ln ( r ) ≈ ( r − 1) = d . Ha például r = 1,01, akkor az egzakt hozam d = r − 1 = 0 , 01 , azaz 1 százalék hozam, a kö-
zelítő hozam pedig D=ln(1,01)=0,00995.
Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
793
Az egyenlőtlenség mérésére azonban – szemben a Shannon-entrópiával – célszerű olyan mutatót alkalmazni, mely növekvőleg az egyenlőtlenség emelkedését jelzi, és több hangsúlyt helyez az eloszlás szegényebb, alsó szegmensén történő változásokra. Ezeket a szempontokat teljesíti a jól ismert generalized entropy (GE) mérték, mely egy α paraméterrel figyelembe veszi az egyenlőtlenséggel szemben érzett averzió mértékét is. Ezek értelmében az α paraméterű általánosított entrópia (Cowell [1977]; Bourguignon [1979]; Shorrocks [1980]; Cowell-Cuga [1981a], [1981b]) formulája az /1/ és /3/ jelölésekkel
GE ( α ) =
n 1 α ∑ ⎡⎣⎢( ri ) − 1⎤⎦⎥ , α ≠ 0,α ≠ 1 , nα ( α − 1) i =1
/5/
ahol L’Hospital-határértékben – és /4/ alapján
GE (1) =
1 n ∑ ri Di = ln ( n ) − H ( r ) , n i =1
1 n GE ( 0) = − ∑ Di = −D . n i =1
/6/
/7/
A GE( α ) index az egyenlőtlenség mutatója, növekvő értékkel az egyenletes eloszlástól való távolodást jelezve. Alacsonyabb α nagyobb súlyt ad az eloszlás alsóbb szegmensén, mint a felső szegmensen történő transzferváltozásra.3 Értelmüket tekintve a két α -specifikus GE-index a két nevezetes Theilegyenlőtlenségi indexet jelenti, rendre: – GE(1): a redundancia Theil1-indexe (Theil [1967]) és – GE(0): a mean logarithmic deviation (MLD), avagy Theil2-index 4 (Theil [1967] 125. old.).
1.2. A Theil-kovariancia A cikk a relatív jövedelem és a log-hozam közti kovarianciát Theil-kovariancia elnevezéssel vezeti be, és definiálja az alábbi módon
CT = Cov ( r,D ) . 3
/8/
A GE-index egy további paraméterrel történő kiterjesztését lásd Cowell [2005]. GE(1) megszokott jelölése az irodalomban T1, míg GE(0) jelölése T2. Az MLD mérőszám magyar jövedelmi adatokra való egy alkalmazását lásd Tóth István György [2003]. 4
Statisztikai Szemle, 90. évfolyam 9. szám
794
Hajdu Ottó
A Theil-kovariancia tartalmát a GE felbontása adja /1/, /3/, /6/, /7/ alapján, mely (tekintve, hogy r = 1 )5 CT =
1 n ∑ ri Di − r ⋅ D = GE (1) + GE ( 0 ) . n i =1
/9/
A Theil-kovariancia jelentése: az MLD eltéréssel növelt Theil-redundancia index, és CT eleget tesz mindazon kritériumoknak melyeket MLD és T1 teljesít, így a Pigou– 6 Dalton-transzfer érzékenységi kritériumnak is. A CT kovariancia növekvő értéke emelkedő korrelációt mérve azt jelzi, hogy a D log-hozam egyre redundánsabbá válik mert d egzakt ismerete önmagában tartalmazza a releváns szóródási információt.
2. A Theil-mátrix és a Theil-variancia definiálása Az egyenlőtlenséget a tanulmány mint a szóródás egy megjelenési formáját tekinti, ezért fokát is mint a szóródás fokát méri. Többváltozós megközelítésben a szóródás klasszikus mértéke az ún. generalized variance (általánosított variancia – GV) mutató, formálisan az aktuális változók kovarianciamátrixának a determinánsa.7 Kulcskérdés tehát a megfelelő kovarianciamátrix megadása.
2.1. A Theil-mátrix A tanulmány által bevezetett új egyenlőtlenségi mátrix – terminológiánk szerint – a Theil-mátrix. Az egyszerűség kedvéért az egydimenziós-kétváltozós (r, D) esetben a Theil-(kovariancia) mátrix definíciója
Változó r CT = r Varr D CT
D CT , VarD
/10/
Bár a ⎡⎣GE (1) + GE ( 0 ) ⎤⎦ / 2 átlagot az irodalom szimmetria tulajdonsága miatt használja, a GE(1)+GE(0) összeg kovarianciatartalmának felismerése és a kovarianciamátrix alkalmazásáig való továbbvezetése a szerző önálló eredménye. Szimmetria esetén a mutató invariáns az (x), vagy (1/x) argumentum használatára. 6 Érzékeny a regresszív transzfer mértékére és helyzetére az eloszlásban: a regresszív transzfer egy adott jövedelmi tételt elvesz, és egy gazdagabbhoz csoportosítja át. További, az egyenlőtlenségi indexekkel szemben támasztott általános axiomatikus kritériumok tárgyalását lásd például Cowell [2009]. 7 Az általánosított variancia két- és többváltozós bemutatását lásd például Hajdu [2003] (59–60. old.). 5
Statisztikai Szemle, 90. évfolyam 9. szám
795
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
ahol Var a relatív jövedelem és a log-hozam varianciákat jelöli és CT a Theilkovariancia.
2.2. A Theil-variancia Az egyenlőtlenség mértéke definíciónk szerint a Theil-mátrix determinánsa, a cikk terminológiájában a Theil- (általánosított) variancia, melynek formulája kétváltozós esetben
TGV = det ( CT ) = VarrVarD − CT2 .
/11/
Ha r a D log-hozammal gyengén korrelál – vagyis a relatív jövedelem és a loghozam között alacsony a redundancia –, akkor Varr és VarD együttes információja szükséges a szóródás méréséhez, ha viszont a redundancia jelentős, akkor a VarrVarD felső korlát a redundancia mértékében redukálandó. Lévén TGV szóródást mér, így értéke az egyenlőtlenség növekedésével nő, alsó és felső korlátai pedig rendre
0 ≤ TGV ≤ VarrVarD .
/12/
Az egyenlőtlenség növekedésével a Varr variancia és vele VarD emelkedik, a TGV rés tágul, de a tágulást a Theil-kovariancia (összetevőinek megfelelő növekedésén keresztül) mérsékli. A felső korlátot az „1” értékhez igazítva, a pszeudo-R2 tartalmú normalizált érték 2 RGV =
TGV CT2 =1− = 1 − Corr 2 ( r,D ) , VarrVarD VarrVarD
/13/
mely a Pearson-determináció komplementereként az eloszlás egyenletességének a csökkenését adja az aktuális eloszlás ismeretében. A Theil-mátrix elemeinek értelmezését segítik a felismerések, miszerint Varr = 2GE ( 2 ) az Y jövedelmek VY relatív szórásának a négyzete és VarD = VarlnY . Ezzel a Theil-mátrix tartalma Változó CT =
r D
r
D
= 2GE ( 2) GE (1) + GE ( 0) . GE (1) + GE ( 0) VarlnY VY2
Statisztikai Szemle, 90. évfolyam 9. szám
/14/
796
Hajdu Ottó
A Theil-variancia tehát egyidejűleg négy egyenlőtlenségi index hatását is magában foglalja, nevezetesen:8
1. VY : a jövedelem variációs koefficiense (relatív szórása), 2. VarlnY: a logaritmikus jövedelmek varianciája, 3. GE(1): a Theil-redundanciaindex, 4. GE(0): a Theil-mean-logarithmic-deviation index. Újra hangsúlyozzuk, hogy a 2., 3., 4. indexek logaritmus alapúak, tehát hatásuk tompítja az aszimmetriából eredő torzítást statisztikai tesztek alkalmazásakor. Geometriai interpretációban TGV annak a paralelogrammának a négyzetes területe, melyet az n-dimenziós O origóból az r és a D pontokba mutató vektorok feszítenek ki, ahol σr és σD a megfelelő vektor hossza, γ pedig a két vektor hajlásszöge:
(
)
TGV = ( σ r σ D sin γ ) = VarrVarD 1 − cos 2 γ = 2
= VarrVarD − VarrVarD Corr 2 ( r,D ) = VarrVarD − Cov 2 ( r,D ) .
/15/
1. ábra. A Theil-variancia geometriai interpretációja
r σr O
T2 = TGV σD
D
Az 1. ábra felhívja a figyelmet, hogy a többváltozós egyenlőtlenség mértékében a változók korrelációjának (ferde szögű „oblique” tengelyeknek) az alkalmazása – akár egy, akár több dimenzióban – elengedhetetlen. Az 1. ábra mutatja, hogy ha Corr(r,D) emelkedik, vagyis a hajlásszög csökken, akkor a redundancia növekedésének hatására az általánosított variancia mértéke csökken és megfordítva. Egy dimenzióról kettőre térve az ábrázolás már nem lehetséges, mert a változók (tengelyek) száma négyre emelkedik. Modellpélda
A kalkulációk könnyű ellenőrizhetősége érdekében tekintsünk egy száztagú társadalmat, ahol a rendezett jövedelmi konfiguráció: Y = [1,2,3,…,98,99,100]. Az át8 Itt jegyezzük meg, hogy GE(2) egyben a Hirschman–Herfindahl-indexet adja. A négy index tulajdonságainak részleteit lásd Cowell [2009].
Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
797
lag és a medián egyaránt 50,5, GE(1) = 0,18827, GE(0) = 0,28458, VY2 = 0,32673, VarlnY = 0,85267.9 A Theil-kovarianci a GE-felbontása az előbbi adatokkal
CT = 0,18827 + 0,28458 = 0,47285 ,
/16/
Változó r D CTheil = r 0,32673 0,47285 D 0,47285 0,85267
/17/
majd a Theil-mátrix
és végül az általánosított Theil-variancia
TGV = 0,32673 ⋅ 0,85267 − 0,472852 = 0,05501 ,
/18/
melynek normált pszeudo-R2 értéke 2 RGV =
0 ,05501 = 0,19744 . 0,32673 ⋅ 0 ,85267
/19/
Az egyenlőtlenség abszolút mértéke 0,05501, ami az aktuális eloszlás 19,744 százalékos távolságát jelzi a totális egyenlőség – a totális bizonytalanság – állapotától. Mindezek alapján az egyenlőtlenség intenzitása mint pszeudo-R érték adódik
RGV = 0 ,19744 = 0 , 44434 .
/20/
3. A Theil-variancia diszkriminanciaanalízise10 A kategória kimenetű, diszkriminátor változó egyenlőtlenségre gyakorolt diszkriminatív hatásának jellemzésére, a társadalmat g = 1,2,…,G csoportra bontjuk. A csoportok száma és kialakításuk módja tetszőleges lehet. Az egyszerűség kedvéért e 9
A Gini-index értéke összehasonlításul: 0,33333. Összehasonlításul a Gini- és a generalized entropy (GE) -felbontások összefoglalását lásd például Mussard–Seyte–Terraza [2003]. 10
Statisztikai Szemle, 90. évfolyam 9. szám
798
Hajdu Ottó
fejezetben előbb csak két szomszédos csoportra, szegényekre és nem szegényekre, tehát egy alsó és egy felső szegmensre tagolunk, adott szegénységi küszöb alapján.
3.1. A Theil-mátrix külső-belső felbontása és a Wilks’ lambda-hányados A csoporthatások számításának alapja a Theil-mátrix külső-belső dekompozíciója (a variancia külső-belső felbontásának az analógiájára)
CTheil = CKülső + CBelső ,
/21/
ahol CKülső a külső, CBelső pedig a belső kovarianciamátrix jelölése. Tartalmilag a külső kovarianciamátrix a csoportátlagokkal kisimított változók kovarianciamátrixa, míg a belső kovarianciamátrix az átlagos csoporton belüli kovarianciamátrix.11 A belső kovarianciamátrix formálisan a G
CBelső = ∑ ng CTg g =1
/22/
súlyozott átlag, ahol ng a g csoport népességaránya (összegük = 1), CTg pedig a g csoport átlagolandó Theil-mátrixa. A belső kovarianciamátrix elemei rendre a szegény és a nem szegény kovarianciamátrixok megfelelő elemeinek a súlyozott átlagai, súlyként a népességi arányokat használva. Legyen a szegénységi küszöb a medián jövedelem 60 százaléka, ami az alsó 30 százalék népességet klasszifikálja szegényként. A küszöb tehát 30-70 százalék arányban bontja ketté a társadalmat, így a belső Theil-mátrix Változó r D CBelső = 0,3 ⋅ CSzegény + 0,7 ⋅ CNemszegény = r 0,12087 0,13163 , D 0,13163 0,28708
/23/
ahol az átlagolandó csoporton belüli Theil-mátrixok Változó r D CSzegény = r 0,02938 0,13194 és D 0,13194 0,69913
/24/
11 A kovarianciamátrix külső-belső felbontására, és a Wilks’ lambda származtatására egy számpéldát ad Hajdu ([2003] 101–105. old.).
Statisztikai Szemle, 90. évfolyam 9. szám
799
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
CNemszegény
Változó r D = r 0,16008 0,13150 . D 0,13150 0,11049
/25/
A totális Theil-mátrix felbontása tehát (a külső Theil-mátrixot kivonással határozva meg):
CTheil =
Totális r D 0,32673 0,47285 = r 0,47285 0,85267 D
Külső Belső r D r D = r 0,20586 0,34122 + r 0,12087 0,13163 . D
0,34122 0,56559
D
/26/
0,13163 0,28708
A csoportosítás irrelevanciáját a többváltozós statisztikai irodalom szerint a Wilks’ lambda-hányados méri, mely a belső általánosított variancia és a totális általánosított variancia hányadosa, tehát a belső és a totális kovarianciamátrixok determinánsainak a hányadosa
Wilks’ lambda =
det CBelső . det CTheil
/27/
A Wilks’ lambda értelme a kategóriák által a totális varianciából meg nem magyarázott rész, ezért komplementere tartalmilag varianciahányados (variance explained) típusú VE mutató. A belső Theil-mátrixból a Wilks’ lambda értéke12 Wilks’ lambda =
0,12087 ⋅ 0,28708 − 0,131632 = 0,31585 , 0,05501
/28/
ahonnan a VE mutató alapján az alkalmazott szegmentáció (jelenleg a szegénységi küszöb) diszkrimináló ereje
VE = 1 − 0,31585 = 0,68415 .
/29/
0 ,131632 = 0 , 4993 . E szerint a 0 ,12087 ⋅ 0 , 28708 belső variancia 49,93 százalékban közelítette meg a lehetséges maximális értékét. 12
A belső általánosított variancia pszeudo-R2 normálása: R 2 =
Statisztikai Szemle, 90. évfolyam 9. szám
800
Hajdu Ottó
A szegénységi küszöb 68,415 százalékban magyarázza az egyenlőtlenséget, és kapcsolata az egyenlőtlenséggel VE = 0 ,82714 intenzitású.
3.2. A kanonikus korreláció megközelítés Bár VE a külső egyenlőtlenség hatását méri, számításához a külső Theildetermináns értékén keresztül nem vezet út, mert
1. a Theil-mátrix additív felbontása a komponensek determinánsaira nem érvényes
det CTheil ≠ det CKülső + det CBelső .
/30/
2. Ha a csoportok száma megegyezik a változók számával (mint példánkban könnyen ellenőrizhető), akkor a külső determináns értéke mindig zéró, akkor is, ha a külső varianciák-kovarianciák nem zérók.13 Mindazonáltal a komplementer Wilks’ hányados külső tartalma és külső számítási módja megadható a következő alternatív megközelítésben. Tekintsük az r relatív jövedelem és a D log-hozam lineáris kombinációját
Δ = w1r + w2 D .
/31/
A w súlyokat úgy választjuk meg, hogy Δ belső varianciája legyen az „1” értéken normált és hozzá képest a külső variancia értéke maximált. A külső variancia maxi14 1 mált értéke nem más, mint a C −Belső C Külső ANOVA-mátrix pozitív λ sajátértéke. Esetünkben λ = 2,16609, tehát Δ varianciája (1 + 2,16609), a külső variancia aránya pedig definíció szerint a négyzetes kanonikus korreláció15 Rho2 =
2,16609 = 0,68415 , 3,16609
/32/
ami a 0,31585 Wilks’ hányados VE komplementere, aminek pozitív gyöke a Rhokanonikus korreláció16 13
Például két csoport két „külső” pontja maradék nélkül magyarázható két változóval, azaz két paraméterrel. A kanonikus korreláció és a diszkriminanciaanalízis kapcsolatának elméleti és számítási részleteit illetően lásd például Hajdu ([2003], [2010]). A maximált külső varianciát biztosító w súlyokkal Δ szokásos megnevezése: kanonikus diszkriminanciaváltozó. 15 Ez az eredmény értelemszerűen megegyezik a /29/ szerint számítottal. 16 E korreláció másik megközelítésben a szegény és nemszegény dummy változó, valamint az r és D változók által adott két változókör közötti kapcsolat szorosságát méri. 14
Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
Rho = 0,68415 = 0,82714 .
801
/33/
Egydimenziós-kétváltozós esetben hangsúlyozzuk, hogy két olyan csoportra, melyek belül nem szóródnak, Rho értéke mindig 1.17 Ez a helyzet akkor is, ha mindenki jövedelme egyenlő, kivéve egyetlen outliert. Így Rho = 1 akkor is, mikor az egyetlen outlier kap mindent.
3.3. Homogenitásvizsgálat A klasszikus Box-M-statisztika alapján a sokasági kovarianciamátrixok egyezőségének a tesztelésére is lehetőség nyílik. Szegényekre és nem szegényekre bontva a társadalmat, a hipotézis
H 0 : ΣSzegény = Σ Nemszegény ,
/34/
ahol Σ a sokasági csoporton belüli kovarianciamátrix jelölése. A hipotézis tesztelésére szolgáló Box-M-statisztika likelihood-arány (LR) próba, melynek formulája:18 G
(
)
Box-M = ∑ ng − 1 ⎡⎣ln det C Belső − ln det C g ⎤⎦ , g =1
/35/
ahol példánkban (a kovarianciákat itt korrigáltan számítva és egy tizedesre kerekítve19): 1. ln det(CBelső) ≈ –4,0, 2. ln det(CSzegény) ≈ –5,7, 3. ln det(CNemszegény) ≈ –7,8.
A homogenitás-tesztstatisztika értéke a fenti eredményekkel M = 29 ⋅ ( −4,0 + 5,7 ) + 69 ⋅ ( −4,0 + 7 ,8 ) = 311,5 ,
/36/
amelynek szignifikanciaértéke F-tesztet alkalmazva és kerekítve 0,000, tehát a csoporton belüli Theil-varianciák minden szokásos szignifikanciaszinten különböznek egymástól. 17
Visszautalunk a 13. lábjegyzetre. Az M-statisztika tesztelését lásd Michaleczky ([1986] 67–68. old.), az LR-teszt elv leírását pedig Hunyadi ([2001] 369–376. old.). 19 A kovariancia nevezőjében a mintaméretet itt 1-gyel csökkentve, a belső kovarianciamátrixban az ún. pooled kovarianciákat számítjuk. 18
Statisztikai Szemle, 90. évfolyam 9. szám
802
Hajdu Ottó
Az M-statisztika additív struktúrája lehetővé teszi végül az egyes „kategóriák” százalékos hozzájárulásainak megadását is a belső egyenlőtlenség mértékén belül: MSzegény =
29 ⋅ ( −4.0 + 5.7)
29 ⋅ ( −4.0 + 5.7) + 69 ⋅ ( −4.0 + 7.8)
MNemszegény =
69 ⋅ ( −4,0 + 7,8)
= 15.8% ,
29 ⋅ ( −4,0 + 5,7) + 69 ⋅ ( −4,0 + 7,8)
/37/
= 84,2% .
/38/
Ezek szerint a szegények köre 15,8 százalék arányban járul hozzá a belső egyenlőtlenség mértékéhez.
4. A Theil-mátrix többdimenziós kiterjesztése Bővítsük a dimenziók számát háromra: jövedelem, kiadás, vagyon.20 Jelölésünk szerint: – a relatív jövedelmek rendre j = rjövedelem , k = rkiadás, v = rvagyon , – a log-hozamok pedig J = Djövedelem, K = Dkiadás, V = Dvagyon. A p = 3 dimenziós vizsgálat egy hatváltozós esethez vezet, ahol a C(6,6) Theilkovarianciamátrix: Változó j j C jj CT 6 ,6 = (
)
k C jk
v C jv
J C jJ
K C jK
V C jV
k
Ckj
Ckk
Ckv
CkJ
CkK
CkV
v
Cvj
Cvk
Cvv
CvJ
CvK
CvV .
J
C Jj
C Jk
C Jv
C JJ
C JK
C JV
K
CKj
CKk
CKv
CKJ
CKK
CKV
V
CVj
CVk
CVv
CVJ
CVK
CVV
20
/39/
Irodalmi összehasonlításul: A GE-index többdimenziós kiterjesztéseinek különféle módjai olvashatók többek között: Maasoumi [1986], [1998] Tsui [1995], [1999], Vega-Urrutia–Volij [2011], Lugo [2005]. Egy másik, a Gini-index többdimenziós általánosítását adja Gajdos–Weymark [2003]. Egy új, ún. „hybrid” többdimenziós egyenlőtlenségi mértéket definiál Araar [2009], míg a többdimenziós egyenlőtlenségi összehasonlítások kérdését Duclos–Sahn–Younger [2009] tárgyalja.
Statisztikai Szemle, 90. évfolyam 9. szám
803
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
Általában p-dimenziós esetben a Theil-mátrix C(2p,2p), melynek determinánsa értelemszerűen a „kiterjesztett” Theil-variancia egyenlőtlenségi mérték
(
TGV = det CT 2 p,2 p (
)
)
.
/40/
Az elemi kovarianciák értelmezése (a többi kovariancia értelmezése analóg): 1. Cjj: a relatív jövedelem varianciája, 2. Ckj : a relatív kiadás és a relatív jövedelem kovarianciája, 3. CJj : a jövedelmi változók kovarianciája, 4. CKj : a kiadási log-hozam és a relatív jövedelem kovarianciája, 5. CJJ : a jövedelmi log-hozam varianciája, 6. CKJ : a kiadási és jövedelmi log-hozamok kovarianciája. TGV mint determináns maximális értékét korrelálatlanság esetén veszi fel, ekkor a kovarianciamátrix diagonális, determinánsa a diagonális varianciák szorzata. Ezzel a (0,1) intervallumra való normálása 2 RGV =
TGV p
p
t =1
t =1
.
/41/
∏ Varrt ∏ VarDt
Kiemelendő, hogy többdimenziós esetben a TGV(2p, 2p) kiterjesztett Theil-variancia nemcsak a változóközi, hanem a dimenzióközi és a keresztkorrelációkat is figyelembe veszi. Csoportosítás esetén a
1 C −Belső C Külső
ANOVA-mátrixnak általánosságban
m = min {2 p,G − 1} pozitív λδ sajátértéke van, melyek a Δδ változók külső varianciái. A Δδ dimenziók relevanciája standard diszkriminanciaanalízis (discriminant analysis) eljárással tesztelhető, és a dimenziók stepwise algoritmussal szelektálhatók. A Wilks’ lambda struktúrája a p-dimenziós esetben (lásd például Hajdu [2010]):21
1 . 1 λδ + δ =1 m
Wilks’ lambda = ∏
/42/
21 A többdimenziós egyenlőtlenségi dekompozíció módszertani kérdéseit lásd például Zheng [2005], Cowell–Fiorio [2010], Kobus [2011].
Statisztikai Szemle, 90. évfolyam 9. szám
804
Hajdu Ottó
4.1. Háztartási költségvetési példa, településtípus szerinti dekompozícióval Illusztratív céllal háztartásokat tekintünk, melyeknél most: j az évi nettó jövedelmet, k az évi kiadást, v pedig tulajdont (lakás+gépkocsi) jelent. Az alkalmazott csoportosítás példánkban a település típusa: Budapest, Nagyváros, Többi város, Községek. A Theil-variancia értéke22
(
TGV = det CT 6 ,6 (
)
) = 0,0000198526
/43/
és a településtípus szerint csoportosítva az ANOVA-mátrix három pozitív sajátértéke rendre λ1=0,13671,
λ2=0,01977,
λ3=0,00220.
A Wilks’ lambda ebből Wilks’ lambda =
1 = 0 ,8608 . 1,13671 ⋅ 1,01977 ⋅ 1,00220
/44/
Így a településtípus a jövedelem, kiadás, vagyon együttes egyenlőtlenségből 13,92 százalékot magyaráz, kapcsolata pedig az „oblique pontfelhők” külső szóródásával a globális pontfelhő körül Rho = 0,1392 = 0,3731 intenzitású.
4.2. Homogenitásvizsgálat Kettőnél több (a példabeli négy) sokasági kovarianciamátrix azonosságát állító hipotézis:
H 0 : Σ Budapest = Σ Nagyváros = ΣTöbbiváros = Σ Község ,
/45/
ahol Σ a sokasági kovarianciamátrixot jelöli. A megfelelő mintabeli statisztikák (településtípus szerinti log-determinánsok) értékei következők:23 22
Ennek normáló tényezője (a Theil-mátrix főátló elemek szorzata) 0,0123, de a csoporthatás elemzése szempontjából a nagyságrendnek nincs jelentősége. 23 ln det(CBelső) = –10,975, ami az ún. „pooled” kovarianciamátrix log-determinánsa!
Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
805
ln det(CBudapest) = –8,183 , ln det(CBelső) – ln det(CBudapest) = –2,792 , ln det(CNagyváros) = –11,865 , ln det(CBelső) – ln det(CNagyváros) = 0,890 , ln det(CTöbbiváros) = –12,355 , ln det(CBelső) – ln det(CTöbbiváros) = 1,380 , ln det(CKözségek) = –12,616 , ln det(CBelső) – ln det(CKözségek) = 1,641 . A településtípusok népességarányai a mintában rendre 0,158, 0,228, 0,272, 0,342. Box-M = 4907 , 486 , az F-teszten alapuló 0,000 szignifikanciaértékkel, tehát a csoporton belüli Theil-varianciák minden szokásos szignifikanciaszinten különböznek egymástól. Egyedül Budapest hatása negatív –2,792, erősen átlag alatti. Valamennyi településtípus hatását pozitív értékű skálán rangsorolandó, Budapest hatását pozitív előjellel minimális értékként rögzítve, a távolságőrző transzformált skála értékei: – Budapest = 2,792, – Nagyváros = 6,474, – Többi város = 6,964, – Község = 7,225, ahol például 7,225 = 1,641 + 2abs(–2,792). A településtípusok súlyozott, relatív hozzájárulásai a belső egyenlőtlenséghez rendre: MBudapest =
0,158 ⋅ 2,792 = 11,9% , 0,158 ⋅ 2,792 + 0,228 ⋅ 6,474 + 0,272 ⋅ 6,964 + 0,342 ⋅ 7,225
/46/
MNagyváros =
0,228 ⋅ 6,474 = 27,6% , 0,158 ⋅ 2,792 + 0,228 ⋅ 6,474 + 0,272 ⋅ 6,964 + 0,342 ⋅ 7,225
/47/
MTöbbiváros =
0,272 ⋅ 6,964 = 29,7% , 0,158 ⋅ 2,792 + 0,228 ⋅ 6,474 + 0,272 ⋅ 6,964 + 0,342 ⋅ 7,225
/48/
MKözség =
0,342 ⋅ 7,225 = 30,8% . 0,158 ⋅ 2,792 + 0,228 ⋅ 6,474 + 0,272 ⋅ 6,964 + 0,342 ⋅ 7,225
/49/
A belső egyenlőtlenséghez Budapest járul hozzá a legkisebb (11,9%) mértékben, és a községek a legnagyobb (30,8%) mértékben. Statisztikai Szemle, 90. évfolyam 9. szám
806
Hajdu Ottó
5. Theil-variancia alapú szegénységi mértékek A szegénységi P mérték általánosságban a szegénység kiterjedtségének, intenzitásának és az eloszlásának az eredője. A mérőszám formális „P” megadása – adott z küszöb mellett – vagy a csonkolt, vagy a cenzorált eloszlásra épül. Míg a csonkolt eloszlás elhagyja a küszöb fölötti tagokat, addig a cenzorált eloszlás megtartja, de értékeiket a küszöb szintjével helyettesíti. A Zj dimenzió cenzorálása a zj küszöb mellett:
{
}
y ji = min Z ji ,z j , i = 1, 2,...,n .
/50/
Jelen cikk a cenzorált elvre építve definiál többváltozós-többdimenziós P mértéket:24 A szegénység többváltozós, többdimenziós mértéke definíciónk szerint a cenzorált y eloszlások együttes, többdimenziós Theil-varianciája. Speciálisan egydi25 menziós-kétváltozós esetben az y eloszlás cenzorált Theil-mátrixa
CTc = CT ( y ) =
Változó
rc
Dc
rc
Varrc
CTc
Dc
CTC
VarDC
,
/51/
melynek determinánsa
( )
2
c TGV = det CTc = Varrc ⋅ VarDc − CTc ,
/52/
ami normált pszeudo-R2 változatban 24 A cenzorált eloszlás szegénységi alkalmazását Hamada–Takayama [1978] és Takayama [1979] vezette be az irodalomba. A Sen–Shorrocks–Thon (SST) (Shorrocks [1995] módon korrigált Sen-index) a legismertebb egydimenziós, és az Alkire–Foster [2009] módon korrigált Foster–Greer–Thorbecke- (FGT-) index), illetve a Lugo–Maasoumi [2008] -indexek a többdimenziós alkalmazások. A Lugo–Maasoumi-indexcsalád információelméleti megalapozottságú, mely speciális esetként tartalmazza a Tsui [2002] és a Bourgougni–Chakravarty [2003] indexeket is. A többdimenziós szegénységi indexek összefoglaló áttekintését egyébként lásd Ravallion [2011]. A többdimenziós témakörben meghatározó további tanulmányok: Anand–Sen [1997], Chakravarty– Mukherjee–Renade [1998], Atkinson [2003], Thorbecke [2008], Chakravarty–Silber [2008], Kakwani–Silber [2008]. 25 A klasszikus egydimenziós szegénységi index-elvek összefoglaló bemutatását lásd Foster–Sen [1997], Zheng [1997]. A módszertan fejlődését illetően a következő indexeket emeljük ki: Watts [1968], Sen [1976], Anand [1977], Hamada–Takayama [1978], Thon [1979], Kakwani [1980], Takayama [1979], Clark–Hemming– Ulph [1981], Chakravarty [1983], Blackorby–Donaldson [1980], Foster–Greer–Thorbecke [1984], Hagenaars [1987], Atkinson [1987], Shorrocks [1995].
Statisztikai Szemle, 90. évfolyam 9. szám
807
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
RP2
=1−
CTc
2
Varrc ⋅ VarDc
.
/53/
Mivel a cenzorált eloszlás csak a szegényjövedelmeket és a küszöb szintjét ismeri, így csak az aktuális küszöbalattiság információit tükrözi. A cenzorált eloszlás általánosított varianciája tehát növekvő értékkel a szegénység növekvő fokát jelzi. Az RP2 szegénységi mérték örökli a Theil-variancia tulajdonságait, és a cenzorált eloszláson történő kalkulálásából eredő további jellemzői a következők: 1. Az RP2 szegénységi mérték eliminálja az index formulájából a szegények explicit létszámarányát, mivel ez a hatás implicit módon az értékében érvényesül. 2. A „z” küszöb emelése több szegénységet indukál, több szegénységi információval, melynek cenzorált VarrVarD felső határa együtt nő a küszöbbel. 3. A cenzorálás a társadalmat küszöb alattiakra és éppen a küszöb szintjén levőkre bontja, így a külső-belső kovariancia-felbontás szegény vs. küszöb tekintetben értendő. 4. A belső varianciát csak a küszöb alattiak szóródása és létszámaránya mozgatja. 5. A külső variancia a küszöb alatti átlagos szegény és a küszöbszint varianciáját méri, így jelentése az átlagos szegény által a küszöb szintjén élőkkel szembeni depriváció mértéke. 6. A társadalmat exogén változók szerint csoportosítva (városvidék, férfi-nő, aktív-inaktív) a szegénység foka külső-belső szempontból és a belső szegénységhez való hozzájárulás mértéke tekintetében is dezaggregálható, jellemezhető. 7. A szegénységi küszöb megadható dimenziókra szeparáltan, vagy az egyes dimenziók valamely súlyozott kombinációjára aggregáltan is. 8. Az RP2 szegénységi mérték figyeli a dimenziók korrelációit és aszimmetrikus voltát is. Modellpélda A százfős példában a cenzorált eloszlás: y = {1,2,…,29,30|30,30,…,30}, melyre a Theil-mátrix Statisztikai Szemle, 90. évfolyam 9. szám
808
Hajdu Ottó
Változó CTc =
rc
Dc
rc
0,10127 0,18627
c
0,18627 0,38463
D
/54/
a cenzorált Theil-variancia c TGV = 0,10127 ⋅ 0,38463 − 0,186272 = 0,004257 ,
/55/
melynek pszeudo-R2 értéke RP2 = 1 −
0,186272 = 0,10929 , 0,10127 ⋅ 0,38463
/56/
ahonnan RP = 0,10929 = 0,3306 .
/57/
Az alkalmazott szegénységi küszöb szintje által az aktuális eloszlás szegénységi mértékéből megmagyarázott hányad 10,929 százalék, és a szegénység 0,3306 intenzitással valósul meg. A szegénységi mérték szegény vs. küszöb csoportközi elemzése a cenzorált Theil-mátrix
C cTheil = C cKülső + C cBelső
/58/
felbontásán alapulva, egy általánosított szegénységi arány és egy általánosított deprivációarány-mutatóhoz vezet el, a következő úton. Példánkban a küszöb kettébontja a társadalmat 30-70 százalék arányban, ahol a belső Theil-mátrix Változó CcBelső = 0,3 ⋅ CSzegény + 0,7 ⋅ 0 z =
rc D
c
rc
Dc
0,03416 0,07793 , 0,07793 0, 20974
ahol az átlagolandó csoporton belüli Theil-mátrixok Statisztikai Szemle, 90. évfolyam 9. szám
/59/
809
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
rc
Változó CSzegény =
rc
Dc
0,11387 0,25976 és
c
D
/60/
0,25976 0,69913
Változó r c Dc 0z =
rc
0
0 .
c
0
0
D
/61/
Így a cenzorált belső Theil-variancia
(
)
c TGV = det CcBelső = 0,03416 ⋅ 0, 20974 − 0,077932 = 0,001092 , Belső
/62/
mellyel a cenzorált belső pszeudo-R2 értéke 2 RBelső =
0 , 001092 = 15 , 241% . 0 , 03416 ⋅ 0 , 20974
/63/
Értelmét tekintve a cenzorált belső R2 általánosított szegénységi arány. Ugyanis a belső variancia átlagos csoporton belüli variancia, ahol a cenzorált eloszlásban a nem szegények kovarianciamátrixa definíció szerint zéró értéken rögzített (0z), ezért a belső variancia nő, ha a) emelkedik a szegények aránya, vagy ha b) nő a szegények körében a Theil-variancia. Az általánosított szegénységi arány példánkban 15,241 százalék, ami kisebb mint a H = 30 százalék standard „head-count-ratio” létszámarány. Tekintsük most a szegénység harmadik tényezőjeként c) a szegények szegénységi küszöbbel szemben érzett deprivációjának a fokát azzal a követelménnyel, hogy legyen érzékeny a nem szegények népességi arányára is, akik nem depriváltak a küszöbbel szemben. Jelölje e hatást az IG (implicit gap, azaz implicít rés), és tételezzünk fel multiplikatív kapcsolatot a szegénységi komponensek között. Ekkor implicit módon a küszöbbel szembeni IG depriváció definíciónk szerint 2 RP2 = RBelső ⋅ IGKülső .
/64/
10 , 2 = 72% inflátor (deflátor) a szegények szegénységi küszöbbel 15,9 szemben érzett deprivációjának a foka.
Az IGKülső =
Statisztikai Szemle, 90. évfolyam 9. szám
810
Hajdu Ottó
Többdimenziós szegénységi dekompozíció A dimenziók számát többre – a háztartási költségvetési példánkban már alkalmazott háromra (jövedelem, kiadás, vagyon) – bővítve, a szegénységi mérték kalkulálása és településtípusok szerinti felbontása kiterjesztett cenzorált Theil-mátrix alkalmazásával a következő. A dimenziókat a mediánérték 60 százalékánál cenzorálva a Budapest, Nagyváros, Többi város, Községek csoportosítás hatváltozós diszkriminanciaanalízisének három sajátértéke rendre: 0,1090, 0,0067, 0,0006, amiből a Wilks’ lambda = 0,8952, komplementerének a gyöke pedig a kanonikus korreláció: Rho = 0,32373. A településtípus tehát 89,52 százalékban nem magyarázza a háromdimenziós szegénységet és kapcsolata a szegénységi „kockával” Rho = 0,32373 intenzitású. Az eddigiekben a háztartások éves összes kiadását és jövedelmét, valamint a teljes vagyonát tekintettük. Áttérve az egy fogyasztási egységre vetített szintre, az eredmények az alábbiak szerint módosulnak. Továbbra is a mediánérték 60 százalékánál cenzorálva a Budapest, Nagyváros, Többi város, Községek csoportok hatváltozós diszkriminanciaanalízisének három sajátértéke rendre: 0,1238, 0,0054, 0,0005, amiből a Wilks’ lambda = 0,8847, a kanonikus korreláció pedig Rho = 0,33956. A településtípus tehát 88,47 százalékban nem magyarázza az egy fogyasztási egységre jutó háromdimenziós szegénységet, és kapcsolata e szegénységi „kockával” 0,33956 intenzitású. * A tanulmány egy új egyenlőtlenségi módszertant javasol, melynek alkalmazása más területeken (például a szegénységi elemzésekben, a relatív depriváció és a társadalmi kirekesztés mérésében, de az információelméletben, vagy az adatbányászatban) is új módszertant eredményezhet. Az eljárás lényegében egy sokdimenziós „oblique térben” húzódó pontfelhő varianciáját méri kompozit módon, egyenlőtlenségi tartalommal, entrópiaelméleti alapokon. A kulcsformula a többváltozós statisztika „generalized variance” mértéke, mely esetünkben egy speciális entrópia tartalmú kovarianciamátrixra vonatkozik. Mivel a kovarianciamátrix általánosságban csoportok esetén dezaggregálható belső és külső faktorok összegére, ezért a javasolt egyenlőtlenségi mutató is megadható külső és belső hatások eredőjeként. Így a javasolt módszerrel vizsgálható a különböző dimenziójú szegénységi küszöbök diszkriminatív hatása a szegénységi mérték tekintetében vagy az adott társadalmi-gazdasági csoportosítás prediktív ereje. Mindezen túl az egyes csoportok relatív hozzájárulása a belső egyenlőtlenséghez is elemezhető.
Irodalom ALKIRE, S. – FOSTER, J. E. [2009]: Counting and Multidimensional Poverty Measurement. Working Paper 32. Oxford Poverty & Human Development Initiative. Oxford. Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
811
ANAND, S. [1977]: Aspects of Poverty in Malaysia. Review of Income and Wealth. Vol. 23. No. 1. pp. 1–16. ANAND, S. – SEN, A. [1997]: Concepts of Human Development and Poverty: A Multidimensional Perspective. Human Development Papers. United Nation. New York. ARAAR, A. [2009]: The Hybrid Multidimensional Index of Inequality. Centre interuniversitaire sur le risque, les polititiques économiques et l’emploi. Working Paper 09-45. October. ARISTONDO, O. – VEGA, L. – URRUTIA, A. [2008]: A New Multiplicative Decomposition for the Foster-Greer-Thorbecke Poverty Indices. Bulletin of Economic Research. Vol. 62. No. 3. pp. 259–167. ATKINSON, A. B. [1987]: On the Measurement of Poverty. Econometrica. Vol. 55. No. 3. pp. 749– 764. ATKINSON, A. B. [2003]: Multidimensional Deprivation: Contrasting Social Welfare and Counting Approaches. Journal of Economic Inequality. Vol. 1. No. 1. pp. 51–65. BLACKORBY, C. – DONALDSON, D. [1980]: Ethical Indices for the Measurement of Poverty. Econometrica. Vol. 48. No. 4. pp. 1053–1060. BLACKORBY, C. – DONALDSON, D. [1984]: Ethically Significant Ordinal Indexes of Relative Inequality. Advances in Econometrics. Vol. 3. No. 4. pp. 131–147. BOSSERT,W. – CHAKRAVARTY, S. R. – D’AMBROSIO, C. [2009]: Measuring Multidimensional Poverty: The Generalized Counting Approach. www.ecineq.org/ecineq_ba/papers/ Dambrosio.pdf BOURGUIGNON, F. [1979]: Decomposable Income Inequality Measures. Econometrica. Vol. 47. No. 4. pp. 901–920. BOURGUIGNON, F. – CHAKRAVARTY, S. R. [2003]: The Measurement of Multidimensional Poverty. Journal of Economic Inequality. Vol. 1. No. 1. pp. 25–49. CHAKRAVARTY, S. R. [1983]: Ethically Flexible Measures of Poverty. Canadian Journal of Economics. Vol. 16. No. 1. pp. 74–85. CHAKRAVARTY, S. R. [1997]: On Shorroks Reinvestigation of the Sen Poverty Index. Econometrica. Vol. 65. No. 5. pp. 1241–1242. CHAKRAVARTY, S. R. – MUKHERJEE, D. – RENADE, R. R. [1998]: On the Family of Subgroup and Factor Decomposable Measures of Multidimensional Poverty. Research on Economic Inequality. Vol. 8. pp. 175–194. CHAKRAVARTY, S. – DEUTSCH, J. – SILBER, J. [2008]: On the Watts Multidimensional Poverty Index and its Decomposition. World Development. Vol. 36. No. 6. pp. 1067–1078. CLARK, S. – HEMMING, R. – ULPH, D. [1981]: On Indices or for the Measurement of Poverty. The Economic Journal. Vol. 91. No. 362. pp. 515–526. COWELL, F. [2005]: Theil, Inequality Indices and Decomposition. ECINEQ 2005-1. Working Paper. ECINEQ Society for the Study of Ecomonic Inequality. London. COWELL, F. A. [1977]: Measuring Inequality. Phillip Allan. Oxford. COWELL, F. A. [2009]: Measuring Inequality. Part of the series LSE Perspectives in Economic Analysis. Oxford University Press. Oxford. COWELL, F. A. – KUGA, K. [1981a]: Additivity and the Entropy Concept: An Axiomatic Approach to Inequality Measurement. Journal of Economic Theory. Vol. 25. No. 1. pp. 131–143. COWELL, F. A. – KUGA, K. [1981b]: Inequality Measurement: An Axiomatic Approach. European Economic Review. Vol. 15. No. 3. pp. 287–305.
Statisztikai Szemle, 90. évfolyam 9. szám
812
Hajdu Ottó
COWELL, F. – FIORIO, C. [2010]: Inequality Decompositions. Gini Discussion Paper 4, December. Growing Inequalities’ Impacts. University of Amsterdam. Amsterdam. DAGUM, C. [1997]: A New Approach to the Decomposition of the Gini Income Inequality Ratio. Empirical Economics. Vol. 22. No. 4. pp. 515–531. DARDANONI, V. [1996]: On Multidimensional Inequality Measurement. In: Dagum, C. – Lemmi, A. (eds.): Research on Economic Inequality: Income Distribution. Social Welfare, Inequality and Poverty. Vol. 6 of Research on Economic Inequality. JAI Press Inc. pp. 201–205. DUCLOS, J.-Y. – SAHN, D. E. – YOUNGER, S. D. [2006]: Robust Multidimensional Poverty Comparisons. The Economic Journal. Vol. 116. No. 514. pp. 943–968. ÉLTETŐ, Ö. – FRIGYES, E. [1968]: New Inequality Measures as Efficient Tools for Causal Analysis and Planning. Econometrica. Vol. 36. No. 2. pp. 383–396. ÉLTETŐ Ö. – HAVASI É. [2009]: A hazai jövedelemegyenlőtlenség főbb jellemzői az elmúlt fél évszázad jövedelmi felvételei alapján. Statisztikai Szemle. 87. évf. 1. sz. 5–40. old. FERGE ZS. [1969]: Társadalmunk rétegződése: elvek és tények. Közgazdasági és Jogi Könyvkiadó. Budapest. FOSTER, J. E. – SHNEYEROV, A. A. [1999]: A General Class of Additively Decomposable Inequality Measures. Economic Theory. Vol. 14. No. 1. pp. 89–111. FOSTER, J. E. [2007]: A Class of Chronic Poverty Measures. Working Paper No. 07-W01. Vanderbilt University. Nashville. FOSTER, J. E. – GREER, J. – THORBECKE, E. [1984]: A Class of Decomposable Poverty Measures. Econometrica. Vol. 52. No. 3. pp. 761–767. FOSTER, J. E. – SEN, A. [1997]: On Economic Inequality After a Quarter Century. Calendron Press. Oxford. GAJDOS,T. – WEYMARK, J. [2003]: Multidimensional Generalized Gini Indices. Working Paper No. 16. Applied Mathematics Working Paper Series. Vanderbilt University. Nashville. HAGENAARS, A. [1987]: A Class of Poverty Indices. International Economic Review. Vol. 28. No. 3. pp. 583–607. HAJDU O. [1997]: A szegénység mérőszámai. KSH Könyvtár és Dokumentációs Szolgálat. Budapest. HAJDU, O. [1999]: On the Deprivation-Sensitive Measurement of Poverty. Hungarian Statistical Review. Special number 3. pp. 15–22. HAJDU O. [2003]: Többváltozós statisztikai számítások. Központi Statisztikai Hivatal. Budapest. HAJDU, O. [2009]: Poverty, Deprivation, Exclusion: A Structural Equations Modelling Approach. Hungarian Statistical Review. Special number 13. pp. 90–102. HAJDU O. [2010]: Sajátértékek a statisztikában. Statisztikai Szemle. 88. évf. 7–8. sz. 773–788. old. HAMADA, K. – TAKAYAMA, N. [1978]: Censored Income Distributions and the Measurement of Poverty. Bulletin of the International Statistical Institute. Vol. 47. No. 1. pp. 617–623. HUNYADI L. [2001]: Statisztikai következtetéselmélet közgazdászoknak. Központi Statisztikai Hivatal. Budapest. KAKWANI, N. C. [1980]: On a Class of Poverty Measures. Econometrica. Vol. 48. No. 2. pp. 437– 446. KAKWANI, N. C. – SILBER, J. [2008]: Quantitative Approaches to Multidimensional Poverty Measurement. Palgrave MacMillan. Basingstoke. KOBUS, M. [2011]: Attribute Decomposability of Inequality Indices via Copula, http:/coin.wne.uw.edu.pl/mkobus/Attribute.pdf Statisztikai Szemle, 90. évfolyam 9. szám
Többváltozós-többdimenziós egyenlõtlenség és a szegénység
813
LUGO, M. A. [2005]: Comparing Multidimensional Indices of Inequality: Methods and Application. ECINEQ WP 2005-14. ECINEQ Society for the Study of Ecomonic Inequality. LUGO, M. A. – MAASOUMI, E. [2008]: Multidimensional Poverty Measures from an Information Theory Perspective. ECINEC 85. ECINEQ Society for the Study of Ecomonic Inequality. MAASOUMI, E. [1986]: The Measurement and Decomposition of Multidimensional Inequality, Econometrica. Vol. 54. No. 4. pp. 991–997. MIHALECZKY GY. [1986]: A többdimenziós normális eloszlás várhatóérték-vektorára és szórásmátrixára vonatkozó becslés és hipotézisvizsgálat. In: Móri F. T. – Székely J. G. (szerk.): Többváltozós statisztikai analízis. Műszaki Könyvkiadó. Budapest. pp. 49–69. MUSSARD, S. – SEYTE, F. – TERRAZA, M. [2003]: Decomposition of Gini and the Generalized Entropy Inequality Measures. Economics Bulletin. Vol. 4. No. 7. pp. 1−6. RAVALLION, M. [2011]: On Multidimensional Indices of Poverty. Policy Research Working Paper 5580. The World Bank Development Research Group Director’s Office. February. SEN, A. K. [1976]: Poverty: An Ordinal Approach to Measurement. Econometrica. Vol. 44. No. 2. pp. 219–231. SHANNON, C. E. [1948]: A Mathematical Theory of Communication. The Bell System Technical Journal. Vol. 27. July pp. 379–423; October pp. 623–656. SHORROCKS, A. F. [1980]: The Class of Additively Decomposable Inequality Measures. Econometrica. Vol. 48. No. 3. pp. 613–625. SHORROCKS, A. F. [1995]: Revisiting the Sen Poverty Index. Econometrica. Vol. 63. No. 5. pp. 1225–1230. SPÉDER, ZS. [2002]: A szegénység változó arcai. Századvég Kiadó. Budapest. SZIVÓS P. – TÓTH ISTVÁN GY. [2001]: A jövedelmi szegénység: trend és profil 2000-ben. Statisztikai Szemle. 79. évf. 10–11. sz. 848–861. old. TAKAYAMA, N. [1979]: Poverty, Income Inequality and Their Measures: Professor Sen’s Axiomatic Approach Reconsidered. Econometrica. Vol. 47. No. 3. pp. 747–759. THEIL, H. [1967]: Economics and Information Theory. North-Holland Publishing Company. Amsterdam. THON, D. [1979]: On Measuring Poverty. Review of Income and Wealth. Vol. 25. No. 4. pp 429– 440. THORBECKE, E. [2008]: Multidimensional Poverty: Conceptual and Measurement Issues. In: Kakwani, N. – Silber, J. (eds.): The Many Dimensions of Poverty. Palgrave Macmillan. New York. TÓTH ISTVÁN GY. [2003]: Jövedelemegyenlőtlenségek – tényleg növekszenek, vagy csak úgy látjuk? Közgazdasági Szemle. 50. évf. 3. sz. 209–234. old. TSUI, K. Y. [1995]: Multidimensional Generalizations of the Relative and Absolute Inequality Indices: The Atkinson-Kolm-Sen Approach. Journal of Economic Theory. Vol. 67. No. 1. pp. 251–265. TSUI, K. Y. [1999]: Multidimensional Inequality and Multidimensional Generalized Entropy Measures: An Axiomatic Derivation. Social Choice and Welfare. Vol. 16. No. 1. pp. 145–157. TSUI, K. Y. [2002]: Multidimensional Poverty Indices. Social Choice and Welfare. Vol. 19. No. 1. pp. 69–93. VEGA, C. L. – URRUTIA, A. – DIEZ, H. [2009]: The Bourguignon and Chakravarty Multidimensional Poverty Family: A Characterization. ECINEQ WP 2009–109. ECINEQ Society for the Study of Ecomonic Inequality. Statisztikai Szemle, 90. évfolyam 9. szám
814
Hajdu: Többváltozós-többdimenziós egyenlõtlenség és a szegénység
VEGA, C. L. – URRUTIA, A. – VOLIJ, O. [2011]: An Axiomatic Characterization of the Theil Inequality Ordering. Monaster Center for Economic Research. Ben-Gurion University of the Negev. Beer Sheva. WATTS, H. W. [1968]: An Economic Definition of Poverty. In: Moynihan, D. P. (ed.): On Understanding Poverty. Basic Books. New York. ZHENG, B. [1997]: Aggregate Poverty Measures. Journal of Economic Surveys. Vol. 11. No. 2. pp. 123–162. ZHENG, B. [2005]: Unit-Consistent Decomposable Inequality Measures. Working Paper No. 05-02. University of Colorado. Denver.
Summary The paper introduces a new multivariate methodology for measuring multidimensional inequality. The method proposed is based on the information theory generalized entropy indices and gives a composite inequality measure of a multivariate oblique space. The key formula is the so-called generalized variance metric applied to the special Theil covariance matrix yielding a betweenwithin effects decomposable index of the total inequality. Even in the case of only one dimension, the new approach is multi (two) variate based. In addition, given a (socio-economic) segmentation of the population, the contribution of an individual group to the ”within-groups” inequality can also be quantified and ranked. Finally, the new inequality approach applied to a censored distribution yields a multivariate-multidimensional poverty measurement. Dimension-specific poverty lines or aggregate attribute poverty lines are also allowed.
Statisztikai Szemle, 90. évfolyam 9. szám