Statisztikai
Szemle
A KÖZPONTI STATISZTIKAI HIVATAL TUDOMÁNYOS FOLYÓIRATA
SZERKESZTŐBIZOTTSÁG:
DR. BOZSONYI KÁROLY, ÉLTETŐ ÖDÖN, DR. HARCSA ISTVÁN, DR. HUNYADI LÁSZLÓ, DR. HÜTTL ANTÓNIA (főszerkesztő), DR. JÓZAN PÉTER, DR. LAKATOS MIKLÓS, DR. MELLÁR TAMÁS, DR. RAPPAI GÁBOR, SÁNDORNÉ DR. KRISZT ÉVA, DR. SIPOS BÉLA, DR. SPÉDER ZSOLT, SZABÓ PÉTER, DR. VARGHA ANDRÁS, DR. VITA LÁSZLÓ, DR. VUKOVICH GABRIELLA (a Szerkesztőbizottság elnöke)
91. ÉVFOLYAM 10. SZÁM
2013. OKTÓBER
A Statisztikai Szemlében megjelenő tanulmányok kutatói véleményeket tükröznek, amelyek nem esnek szükségképp egybe a KSH vagy a szerzők által képviselt intézmények hivatalos álláspontjával. Utánnyomás csak a forrás megjelölésével!
ISSN 0039 0690 Megjelenik havonta egyszer Főszerkesztő: dr. Hüttl Antónia Osztályvezető: Dobokayné Szabó Orsolya Kiadja: a Központi Statisztikai Hivatal A kiadásért felel: dr. Vukovich Gabriella 2013.138 – Xerox Magyarország Kft. Szakreferensek: dr. Németh Zsolt, dr. Laczka Éva Szerkesztők: Bartha Éva, dr. Kondora Cosette, Visi Lakatos Mária Tördelőszerkesztők: Bartha Éva, Simonné Káli Ágnes Szerkesztőség: Budapest II., Keleti Károly utca 5–7. Postacím: Budapest, 1525. Postafiók 51. Telefon: 345-6908, 345-6546 Internet: www.ksh.hu/statszemle E-mail:
[email protected] Kiadó: Központi Statisztikai Hivatal, Budapest II., Keleti Károly utca 5–7. Postacím: Postafiók 51. Budapest, 1525. Telefon: 345-6000 Előfizetésben terjeszti a Magyar Posta Rt. Hírlap Üzlet (1089 Budapest, Orczy tér 1.). Előfizethető közvetlen a postai kézbesítőknél, az ország bármely postáján, valamint e-mailen (
[email protected]) és faxon (303-3440). További információ: 06-80-444-444 Előfizetési díj: fél évre 6 000 Ft, egy évre 10 800 Ft Beszerezhető a KSH Információszolgálatán (Budapest II., Fényes Elek u. 14–18. Telefon: 345-6789)
Tartalom Tanulmányok Hány év múlva? – A konvergencia természetéről és időigényéről – Oblath Gábor .......................................... Védett táblázatok morfológiája – Optimális másodlagos cellaelnyomás számítógép nélkül – Faragó Miklós ... A modern bayesi elemzések eszköztára és alkalmazása – Kehl Dániel – Várpalotai Viktor ................................ Az egyetemi-főiskolai hallgatók vállalkozói attitűdkutatásának módszertani sajátosságai – Farkas Szilveszter – S. Gubik Andrea ................................................
925 947 971
993
Fórum Beszélgetés Rappai Gáborral – Dr. Hunyadi László ........ Hírek, események .............................................................
1013 1021
Szakirodalom Könyvszemle Pontossági követelmények és varianciabecslés az Európai Statisztikai Rendszer háztartás-statisztikai felvételeihez. Kézikönyv – (Mihályffy László) ..... Folyóiratszemle Mecatti, F. – Crippa, F. – Farina, P.: A statisztika új ága: a genderstatisztika – (Hajnal Béla) ...............
1028
Feng W. – Cai Y.– Baochang G.: Népesség, elvek és politika: hogyan fogja megítélni a történelem Kína egykepolitikáját? – (Kajdi László) ..................
1031
A szerzői jogi ágazatok teljesítménye Ausztráliában, 1996–2011 – (Nádudvari Zoltán) ........................ Kiadók ajánlata ................................................................ Társfolyóiratok ................................................................
1034 1037 1039
1023
Tanulmányok
Hány év múlva? — A konvergencia természetérõl és idõigényérõl* Oblath Gábor, az MTA KRTK Közgazdaságtudományi Intézetének és az ELTE TÁTK Közgazdaságtudományi Tanszékének tudományos főmunkatársa E-mail:
[email protected]
A dolgozat az egyes statisztikai mutatókhoz kötött, numerikus gazdaságpolitikai kritériumok kérdéseivel foglalkozik. Azt vizsgálja, hogy melyek lehetnek bizonyos célállapotok elérésének feltételei, továbbá hozzávetőlegesen mekkora lehet egyes kritériumok elérésének a feltevésektől függő időigénye. Ezek a kérdések a konvergencia problémájához kapcsolódnak, amelyet az írás egyrészt a hazai gazdasági felzárkózás, másrészt az állami adósságráta-csökkentés kilátásainak – illusztratív forgatókönyvekre támaszkodó – áttekintése alapján elemez. Az elemzés reflektálni igyekszik arra, hogy az euróbevezetés jelenlegi hazai feltétele az euróövezethez viszonyított 90 százalékos fejlettségi szint elérése, az ún. válságadók kivezetésének pedig az, hogy 50 százaléknál alacsonyabb legyen az államadósság-ráta. Az írás fő következetése szerint – a realitások határain belül mozgó feltevések és alkalmas kivetítési módszerek mellett – lényegesen nagyobb a kritériumok elérésének időigénye, mint azt kitűzőik vélik. Emellett maguk a kritériumok, illetve azok kölcsönhatásai is jelentősen befolyásolhatják azokat a gazdasági folyamatokat, amelyek célállapotához a numerikus kritériumok kötődnek. TÁRGYSZÓ: Európai Unió. Visegrádi országok. Gazdasági fejlettség.
* A cikk alapjául szolgáló kutatást az Országos Tudományos Kutatási Alprogramok – OTKA 105660-K számú kutatási pályázata támogatta. Jelen írás két elektronikus formában megjelent korábbi cikk (Oblath [2012a], [2012b]) jelentősen átdolgozott és kibővített változata.
Statisztikai Szemle, 91. évfolyam 10. szám
926
Oblath Gábor
Az Európai Unió (EU) működésének fontos jellegzetességei közé tartozik, hogy
egyes eljárásait bizonyos küszöbökhöz köti, amelyek statisztikai mutatók GDParányos értékéhez, illetve a gazdaság relatív (az Unió átlagához viszonyított) fejlettség szintjéhez egyaránt kapcsolódhatnak. Az előbbire a legismertebb példát az euróövezeti csatlakozás két fontos kritériuma – a GDP arányában 3 százalékos költségvetési deficit és 60 százalékos államadósság – kínálja, az utóbbira pedig az a körülmény, hogy egyes uniós források igénybevételének feltétele az EU százalékát nem meghaladó regionális fejlettségi szint. Írásom az ilyen természetű küszöbértékek megközelítésének és elérésének feltételeivel, valamint az ehhez szorosan kötődő konvergencia problémájának statisztikai és közgazdasági kérdéseivel foglalkozik. A témakör azért is érdemel figyelmet, mert hasonló típusú kritériumok Magyarországon is megfogalmazódtak. Ilyen volt például az, hogy az euró hazai bevezetésének feltétele a GDP-arányos államadósság 50 százalékos szintjének elérése.1 Az ország euróövezeti csatlakozásának hivatalosan bejelentett kritériuma utóbb módosult: e cikk írásának idején az a feltétel hatályos, hogy a hazai egy főre jutó GDP szintje elérje az eurózóna átlagának 90 százalékát.2 Az 50 százalékos adósságráta-küszöb azonban nem vált érvénytelenné, csak a hatóköre változott. Egy, a The Wall Street Journalban megjelent interjú szerint ennél alacsonyabb állami adósságráta elérése teszi lehetővé az ún. válságadók (egyes szektorokra kivetett különadók) kivezetését (Fehér [2013]), továbbá Magyarország Alaptörvénye (Magyar Közlöny [2011] 37. cikk (4) szakasz) értelmében az Alkotmánybíróság gazdasági tárgyú ítélkezési jogköre akkor válik majd teljessé, ha az adósságráta e küszöbértéket elérte. Ezek a példák arról tanúskodnak, hogy az írás címében feltett kérdés nemcsak az EU által támasztott, az említett egyes feltételek, hanem az itthon megszabottak szempontjából is érdeklődésre tarthatnak számot. Az ilyen típusú numerikus kritériumokat illetően többféle kérdés is megfogalmazható. Felmerülhet például, hogy mi lehet a mögöttük meghúzódó közgazdasági vagy más természetű logika. Ezt azonban csak röviden érintem, ehelyett arra a kérdésre keresek választ, hogy vajon mekkora lehet az ilyesfajta küszöbök elérésének – egyes feltevésektől függő – hozzávetőleges időigénye. Elemzésem azonban nem arra irányul, hogy meghatározza bizonyos kritériumok teljesítéséhez (teljesüléséhez) szükséges évek számát – ez nyilvánvalóan értelmetlen vállalkozás lenne. Éppen ellenkezőleg, azt kívánom bemutatni, hogy a fel1
„Az euró bevezetésére akkor van esély, ha Magyarország 50 százalékra viszi le a bruttó hazai termék arányában mért államadósságot” (Origo.hu [2011]). 2 „Magyarországnak komolyan az euróhoz való csatlakozással nem szabad foglalkoznia egészen addig, míg Magyarország általános fejlettségi szintje el nem éri az eurózóna fejlettségének a 90%-át” (Portfolio.hu [2012]).
Statisztikai Szemle, 91. évfolyam 10. szám
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
927
tevésektől és a kivetítési módszerektől függően, hatalmas különbségek mutatkoznak egyes célértékek elérésének időigényében. Úgy vélem, fontos, hogy a szakma e tekintetben is segítse mind a feltételeket/célokat kitűző politikusok, mind pedig a széles közvélemény tájékozódását. Írásom első része a reálgazdasági felzárkózásról szól, és ahhoz az elgondoláshoz kapcsolódik, hogy Magyarországon akkor vezethető be az euró, ha fejlettségi szintünk eléri az euróövezet 90 százalékát. Ebben a részben kitérek a felzárkózás alternatív értelmezéseire, mérésére, a hazai felzárkózás elmúlt másfél évtizedére, a hazai és a visegrádi országokat jellemző folyamatok összehasonlítására, valamint a 90 százalékos szint elérésének lehetséges időigényére. A második rész a konvergencia időigényének egy másik példájával foglakozik, azt vizsgálja, hogy – alternatív feltevések mellett – hozzávetőlegesen mikor érhetjük el a GDP-hez viszonyított 50 százalék alatti államadósságot. Az összegző részben arra hívom fel a figyelmet, hogy az írásban vizsgált hazai numerikus feltételek nem semlegesek: önmagukban is, egymással kölcsönhatásban pedig kiváltképpen a gátolhatják a megjelölt célok elérhetőségét.
1. Felzárkózás – A kilencven százalékos relatív fejlettségi szint elérhetősége és az euró bevezetése Az euró hazai bevezetéséről Neményi Judittal írt cikkünkben (Neményi–Oblath [2012]) számos – a csatlakozni szándékozó országra nézve kötelező, ún. maastrichti kritériumok teljesítésénél szigorúbb – feltételt fogalmaztunk meg arra vonatkozóan, hogy Magyarország kihasználhassa az euróövezeti csatlakozásból eredő előnyöket, s elkerülje a más országokban realizálódott kockázatokat. E feltételek közül azonban nem feledékenységből hagytuk ki az euróövezethez mért fejlettség valamely kitüntetett szintjét. Hanem azért, mert nincsenek olyan meggyőző közgazdasági érvek vagy tapasztalati eredmények, amelyek alátámasztanák, hogy a kockázatok realizálódása a relatív fejlettségi szinttől függne. Például Írországban az egy főre jutó GDP (vásárlóerőparitáson mért) szintje 10 százalékkal meghaladta az euróövezet átlagát, amikor az eurót bevezette, és 33 százalékkal volt az átlag felett, amikor a nemzetközi válság idején súlyos bajba került. Spanyolország pedig, amely relatív fejlettségét tekintve 95 százalékon állt a válság kitörésekor, csaknem pontosan ugyanazokkal – a hitelezési buborék szétpattanását követő – nehézségekkel szembesült, mint Írország. Ez a két ország nem azért került bajba, mert az egy főre jutó GDP szintje eltért az euróövezet átlagától, hanem azért, mert sem a hitelezés szabályozása, sem a költségvetési politika nem reagált időben a gazdaság túlfűtöttségére. Hasonló okok vezettek oda, hogy Szlovénia (a legfejlettebb új EU-tagország) is válságba került az euróbevezetést követően. Szlovákia Statisztikai Szemle, 91. évfolyam 10. szám
928
Oblath Gábor
viszont, amelynek fejlettsége jelentősen elmarad az említett országokétól, és éppen a válság évében, 2009-ben vezette be az eurót, sikerként könyvelheti el az euróövezeti csatlakozást. Ezek a példák érzékeltetik, hogy nem a fejlettségi szint, hanem más, sokkal fontosabb körülmények és feltételek határozzák meg az euró bevezetésének sikerét. Ha azonban a relatív fejlettségi szint a hivatalos kritérium, akkor éppen a releváns közgazdasági feltételek felől tolódik el a figyelem egy olyan felé, amelyik az euróövezeti csatlakozás sikere szempontjából másodlagos jelentőségű.
1.1. „Utolérés” vagy konvergencia? A következőkben azt vizsgálom, hogy alternatív feltevések mellett mekkora lehet az euróövezet 90 százalékos fejlettségi szintje elérésének időigénye. A kérdésről a porfolio.hu internetoldal már közölt egy tanulságos cikket (Portfolio.hu [2012]), amelynek következtetései hasonlók azokhoz, amelyekre magam jutottam. A lényeges különbség nem az illusztratív számítások „eredményeiben”, hanem a felzárkózási folyamat szemléletében van. A felzárkózás időigényéről szóló illusztratív szcenáriók kialakításakor ugyanis a konvergencia működésmódjáról kétféleképpen lehet gondolkodni. Az egyik lehetőség az, hogy kiválasztunk egyes múltbeli periódusokat, amelyeket gyors/lassú felzárkózás jellemzett, és a GDP/fő múltban tapasztalt növekedési ütemeit, illetve azok különbségét (esetleg a közeledés évi átlagos, százalékpontban kifejezett mértékét) – a mai relatív fejlettségi színből kiindulva – kivetítjük a jövőbe. Ez a módszer garantálja, hogy a fejletlen ország valamikor biztosan utolérje, majd meghaladja a fejlettebb térség színvonalát, így mellesleg azt is, hogy elérje annak 90 százalékát. Ha adott az induló relatív szint, akkor az, hogy hány év múlva éri el a 90 százalékot, a fejlett térség egy főre jutó GDP-jének növekedésére és a fejletlen ország afeletti többletnövekedésére vonatkozó feltevésből adódik. Ezzel a megközelítéssel az a fő probléma, hogy a „felzárkózást” (vagyis a konvergenciát), valamint az „utolérést” azonos értelmű fogalmakként kezeli, s így fel sem merül az a fontos kérdés, hogy vajon milyen relatív szint felé konvergálhat a gazdaság. Az alternatív gondolkodási keretnek fontos építőeleme, hogy a gazdasági felzárkózás közeledést jelent, nem pedig utolérést, s kiváltképpen nem „túlszárnyalást”. Egészen pontosan azt jelenti, hogy csökken a gazdaság mindenkori helyzete és hoszszú távú fejlődési pályája közötti távolság.3 Természetesen lehet azzal a feltevéssel élni, hogy Magyarország hosszú távú fejlődési pályája megegyezik a fejlett térségével (esetünkben az euróövezetével), de ez nagyon távol áll bármiféle szükségszerűségtől. E feltevés alapján beszélhetünk abszolút konvergenciáról az euróövezet szint3
A gazdasági felzárkózásként értelmezett konvergenciáról, továbbá az abszolút és a feltételes konvergencia jelentéséről lásd például Barro [2005] magyarul megjelent könyvét.
Statisztikai Szemle, 91. évfolyam 10. szám
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
929
jéhez, és végezhetünk illusztratív számításokat a 90 százalék elérésének időigényére, a konvergencia alternatív (hipotetikus) ütemei mellett. Csakhogy az előbbinél nem kevésbé kézenfekvő az a feltevés, hogy Magyarország – tartós sajátosságai folytán – hosszú távon nem az eurózóna 100, hanem például 80, vagy 90 százaléka felé konvergál a mai 60 százalékos szintről. Ez esetben lehetne feltételes konvergenciáról beszélni, ellenben semmiféle illusztratív számítást nem lehetne végezni a 90 százalék elérésének időigényéről, lévén az első esetben soha, a másodikban pedig a végtelenben érnénk el a megcélzott szintet. Mivel azonban írásom célja éppen az, hogy számszerűen is illusztráljam a konvergencia lehetséges időigényét, a következőkben abszolút konvergenciát feltételezek (vagyis azt, hogy a hazai GDP/fő hosszú távon az eurózóna átlagának 100 százaléka felé közelít).
1.2. Magyarország gazdasági felzárkózásának közelmúltja – összehasonlítás a visegrádi országokkal Mielőtt a hazai gazdaság hosszú távú felzárkózásának kilátásait vizsgálnám, érdemes kitérni az 1995 és 2012 között tapasztalt felzárkózásunk profiljára és annak összehasonlítására a visegrádi országokkal. Ehhez azonban – a gyakori félreértések miatt – fontos tisztázni, hogy a nemzetközi statisztikákban közölt vásárlóerőparitások csak keresztmetszeti összehasonlításban (egy-egy évben) alkalmasak a viszonylagos fejlettség alapmutatójának, az egy főre jutó GDP relatív volumenének meghatározására. Az így számított mutató évek közötti változását azonban nemcsak a relatív volumenek, hanem a relatív árak változása is befolyásolja (csakúgy, mint a vásárlóerő-paritáson mért összehasonlítások módszertanában történt váltások), ezért alkalmatlan a relatív reálszintekben bekövetkezett változások mérésére. Ahhoz, hogy a relatív fejlettség reálszintjének időbeni alakulásáról képet kapjunk (idősort készítsünk), valamely kiválasztott év vásárlóerő-paritásán és árain kell a többi év relatív szintjeit meghatározni (a kiválasztott év folyó vásárlóerő-paritáson mért relatív szintjének és az egy főre jutó GDP relatív volumenindexeinek összekapcsolásával).4 Az 1. ábra arról ad képet, hogyan alakultak az euróövezethez viszonyított éves szintek egyrészt folyó, másrészt 1995. évi, illetve 2012. évi konstans vásárlóerőparitáson (és árakon) 1995 és 2012 között. A folyó vásárlóerő-paritáson számított szinteket oszlopok jelzik, utalva arra, hogy azok tartalma évenként változik. Látható, az, hogy az időszak kezdő vagy záró évét választjuk a reálszint-összehasonlítás referenciaévének, nem befolyásolja a felzárkózási folyamat profilját, csupán 5 százalékponttal eltolja az éves szinteket. Ez nagyjából úgy értelmezhető, hogy Magyarország 1995 és 2012 közötti, az euróövezethez 4
Lásd erről az Eurostat–OECD [2012] módszertani útmutatóját. 18. old.
Statisztikai Szemle, 91. évfolyam 10. szám
930
Oblath Gábor
45-ről 60 százalékra történt, folyó vásárlóerő-paritáson mért 15 százalékpontnyi felzárkózásához mintegy 10 százalékponttal járult hozzá a relatív volumenváltozás és 5 százalékponttal a relatív árváltozás, illetve egyéb hatás. (A növekedési ütemeket tekintve, folyó vásárlóerő-paritáson évi átlagban 1,7 százalékkal nőtt az eurózónához viszonyított GDP/fő, amihez a relatív volumennövekedés évi 1,1, a relatív árhatás 0,6 százalékponttal járult hozzá – erről az 1. táblázat ad majd képet.) A reáljövedelmi felzárkózás, s így az illusztratív kivetítések szempontjából természetesen a relatív volumenváltozások az érdekesek.5 1. ábra. Az egy főre jutó GDP Magyarországon a mai eurózóna (EZ) százalékában, folyó, valamint 1995., illetve 2012. évi változatlan vásárlóerő-paritáson (1995–2012)
Százalék 65% 65 60% 60 55 55% 50 50% 45 45%
GDP/fő (HU/EZ) (folyó PPP)
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
40 40%
év
GDP/fő (HU/EZ) (2012. évi PPP)
GDP/fő (HU/EZ) (1995. évi PPP) Forrás: Saját számítás az EU-Bizottság AMECO-adatbázisa alapján.
Az 1990-es évek elején tapasztalt visszaesést és az 1995. évi stabilizációt követően, 1996 után bontakozott ki az 1. ábrán bemutatott felzárkózási folyamat, amely 2001-ben váltott nagy sebességre és egészen 2006-ig tartott.6 Azóta Magyarország relatív fejlettségi szintje, kisebb elmozdulásokkal, csökkenő. Voltaképpen az elmúlt 17 évből 11 évben zárkóztunk fel, ebből 6 évben volt gyors a felzárkózás (2001– 2007-ig), éppen azokban az években, amelyeket jelentős belső és külső egyensúlyhi5
Persze az is izgalmas kérdés, hogy egyes periódusokban miért válnak el egymástól markánsan a folyó, illetve konstans vásárlóerő-paritáson (és árakon) mért változások (például 2000–2002-ben vagy 2008–2009-ben), de ennek tárgyalása túlmenne írásom keretein. 6 A hazai GDP nominális és változatlan áron mért szintjére vonatkozó – 1995-ig visszamenő – adatok az elmúlt években revízió alá kerültek, s az új idősorok alapján kirajzolódó folyamatok esetenként ütköznek az egyes időszakokra vonatkozó korábbi közgazdasági percepciókkal (Oblath [2012]). Az írásban természetesen a jelenleg érvényes hivatalos adatokra támaszkodom.
Statisztikai Szemle, 91. évfolyam 10. szám
931
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
ányok jellemeztek, és a GDP-arányos államadósság, valamint a nettó külföldi adósság fenntarthatatlan sebességgel emelkedett. Azok a gazdaságpolitikai lépések és külgazdasági sokkok pedig, amelyek az eladósodási folyamatot megfékezték, a felzárkózást is megakasztották. Mindebből korai lenne olyan következtetést levonni, hogy Magyarország csak fenntarthatatlan egyensúlyhiányok mellett képes (s így hosszú távon képtelen) felzárkózni, de a múltbeli tapasztalatok a jövőre vonatkozó felzárkózási forgatókönyvek közül az óvatosabbak mellett szólnak. Abban az időszakban ugyanis, amelyet viszonylagos makrogazdasági stabilitás jellemzett (1996–2000), a felzárkózás igen lassú volt: üteme nagyjából megegyezik a teljes 17 éves perióduséval, amelynek utolsó 6 évében egyáltalán nem mutatkozott felzárkózás. Éppen az elmúlt hat év relatív stagnálása indokolja, hogy kissé szélesebb összefüggésben, nevezetesen a visegrádi országokkal (Csehországgal, Lengyelországgal és Szlovákiával) összehasonlítva is képet kapjunk az euróövezethez történt hazai felzárkózásról. (Lásd a 2. ábrát.) 2. ábra. Az egy főre jutó GDP a négy visegrádi országban az euróövezeti (EZ 17) átlag százalékában, 2012. évi vásárlóerő-paritáson és árakon
Százalék 75 75% 70 70% 65 65% 60 60% 55 55% 50 50% 45 45%
Csehország
Magyarország
Lengyelország
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
40 40% 35 35%
év
Szlovákia
Forrás. Saját számítás az EU-Bizottság AMECO-adatbázisa alapján.
A 2. ábra értelmezéséhez figyelembe kell venni, hogy csak az utolsó évben (2012-ben) jelzi a relatív fejlettségi szinteket; az időszak egészét tekintve viszont jól mutatja a felzárkózás relatív dinamikáját. (Azért 2012 a referenciaév, mert az erre vonatkozó adtat pontok jelzik a legutolsó keresztmetszeti összehasonlítás eredményeit, amelyek vélhetően a legpontosabbak , és a jelenlegi relatív pozíciók szempontjából közvetlenül is értelmezhetők.) Mind a négy országnak voltak jobb és rosszabb időszakai, a 2002 és 2006 közötti szakasz azonban valamennyi ország felzárkózásáStatisztikai Szemle, 91. évfolyam 10. szám
932
Oblath Gábor
nak gyorsulását hozta magával. Magyarországnak – Csehországgal és Szlovákiával ellentétben – 2006-ig nem voltak leszakadási szakaszai. A 2. ábrán jól látható, hogy 2006 után a pályák egyértelműen elválnak egymástól: a hazai elakadást követően is folytatódott a másik három ország felzárkózása (Csehországban két évvel később és lényegesen magasabb relatív szinten akadt meg a felzárkózás.) A felzárkózási pályák eltérései aligha érthetők meg anélkül, hogy az időközben kialakult makrogazdasági egyensúlyhiányok nyomán eltérő pályákra kerültek az országok államadósság-rátái, amelyekről a 3. ábra ad képet. Ez az indikátor az egyensúlyhiányok felhalmozódása és a felzárkózás fenntarthatósága közötti kapcsolatnak csupán egyik metszetét jelzi (nem mutatja a magánszektor, s így az ország egésze külső eladósodást), de fontos adalék a felzárkózási pályák közötti divergencia értelmezéséhez. 3. ábra. A GDP-arányos államadósság alakulása a visegrádi országokban 1995 és 2012 között
Százalék 90% 90 80% 80 70 70% 60 60% 50 50% 40 40% 30 30% 20 20%
Csehország
Magyarország
Lengyelország
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
10 10%
év
Szlovákia
Forrás: Eurostat-adatok.
Különösen tanulságos Magyarország és Szlovákia felzárkózási, illetve állami adósságpályájának összehasonlítása. (Lásd a 2. és 3. ábrát.) Amíg Magyarországon a felzárkózás 2001 és 2006 között tapasztalt gyorsulását az állami eladósodás gyors, és fenntarthatatlannak bizonyult emelkedése kísérte, Szlovákiában a felgyorsult felzárkózás a GDP-arányos államadósság tartós csökkenését alapozta meg. Ehhez a fontos különbséghez is köthető, hogy miközben Magyarországon 2007-ben – az adósságráta emelkedését fékezni hivatott költségvetési konszolidáció hatására – megállt a felzárkózás, Szlovákia fejlettségi szintje jelenleg is közeledik a fejlett EUtagországokéhoz. Bár a felzárkózás dinamikája szempontjából a változatlan áron és vásárlóerő-paritáson mért változások a lényegesek – ezeket mutatja a 2. ábra – érdeStatisztikai Szemle, 91. évfolyam 10. szám
933
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
mes azt is megvizsgálni, hogy melyek a folyó vásárlóerő-paritáson mért GDP/fő relatív változásának összetevői egyes periódusokban. Erről ad áttekintést az 1. táblázat, amely 1. a GDP/fő folyó vásárlóerő-paritáson mért, eurózóna feletti évi átlagos növekedési többletét évi átlagos, 2. relatív árarányváltozásra és 3. volumenváltozásra bontja, majd az utóbbit tovább bontja, mégpedig 4. a GDP és 5. a népesség eurózónához viszonyított évi átlagos változására. 1. táblázat Az euróövezethez viszonyított, folyó vásárlóerő-paritáson (PPP-n) mért GDP/fő 1995 és 2012 közötti átlagos évi növekedésének dekompozíciója egyes periódusokban Mutató
Ország*
1996–2012
1996–2001
1. GDP/fő változás folyó
CZ
0,6
PPP-n (1 = 2 + 3)
HU
1,7
2,4
2,1
1,3
0,2
PL
2,9
2,1
2,3
5,4
3,3
–0,5
2002–2006
2007–2009
2,4
1,1
2010–2012
–0,8
SK
3,1
2,0
4,4
4,8
1,6
2. Relatív árváltozás
CZ
–0,8
–0,4
–1,2
–0,4
–1,1
(+egyéb hatás)
HU
0,6
1,4
–1,1
2,2
0,2
PL
–0,2
–0,3
–0,7
0,0
0,9
SK
0,1
0,9
–0,3
0,6
–1,0
3. GDP/fő volumen-
CZ
1,4
0,0
3,6
1,5
0,3
változás (3 = 4–5)
HU
1,1
1,0
3,3
–0,9
0,0
PL
3,1
2,4
3,0
5,4
2,4
SK
3,0
1,1
4,7
4,3
2,6
4. GDP
CZ
1,0
–0,5
3,1
1,7
0,1
volumenváltozás
HU
0,5
0,5
2,4
–1,6
–0,5
PL
2,7
2,1
2,3
4,9
2,5
SK
2,6
0,8
4,1
3,9
2,3
CZ
–0,3
–0,5
–0,5
0,2
–0,2
HU
–0,6
–0,5
–0,8
–0,7
–0,6
PL
–0,4
–0,3
–0,6
–0,5
0,1
SK
–0,4
–0,3
–0,5
–0,3
–0,4
5. Népességváltozás
* CZ: Csehország, HU: Magyarország, PL: Lengyelország, SK: Szlovákia. Megjegyzés. A kerekítések miatt az összetevők esetenként nem pontosan adják ki az összegeket, illetetve különbségeket. A harmadik oszlopban (1996–2012) az elmúlt 17 esztendő átlagos évi relatív (az euróövezethez viszonyított) változásai, a negyedikben a hazai felzárkózás felgyorsulásáig tartó időszak (1996–2001), az ötödikben a gyors hazai felzárkózás időszakának (2002–2006), a hatodikban a hazai költségvetési konszolidáció – a nemzetközi válság évét is magába foglaló – periódusának (2007–2009), végül az hetedikben az elmúlt három év relatív növekedési ütemei szerepelnek. Tájékoztatóul, 2012-ben az eurózónához viszonyított GDP/fő szintjek, folyó vásárlóerő-paritáson számítva a következők voltak: CZ 74, HU 60, PL 61, SK 70 százalék. Forrás: Saját számítás az EU-Bizottság AMECO-adatbázisa alapján.
Statisztikai Szemle, 91. évfolyam 10. szám
934
Oblath Gábor
Az 1. táblázat azt mutatja, hogy Magyarország felzárkózása – mind az időszak egészében, mind pedig egyes részperiódusokban – több tekintetben is különbözik a másik három országétól. Az időszak egészét nézve szembetűnő, hogy nálunk a GDP/fő volumenváltozása számottevően elmarad a folyó vásárlóerő-paritáson mért változástól. Csehországban éppen fordított a helyzet, a másik két országban pedig nincs számottevő eltérés a folyó, illetve konstans vásárlóerő-paritáson mért változások között. További sajátosság, hogy Magyarországon a relatív GDP/fő növekedését a másik három országnál nagyobb mértékben emelte az euróövezethez viszonyított népességcsökkenés (a GDP/fő növekedési többletének több mint a fele ebből adódott). Így a GDP hosszabb távú relatív volumenváltozását tekintve lényegesen kedvezőtlenebb az ország viszonylagos pozíciója (Magyarországon évi 0,5 százalékos, Csehországban 1 százalékos, Lengyelországban és Szlovákiában 2,5 százalék feletti növekedési többlet az eurózóna felett), mint amit akár a folyó, akár a konstans vásárlóerő-paritáson mért összehasonlítások sugallnak (vesd össze az első négy sort a harmadik, illetve negyedik blokk négy sorával). 4. ábra. A GDP/fő növekedési üteme az eurózónában és Magyarországon (százalékos változás), valamint az éves növekedési ütemkülönbségek (százalékpont)
Százalék 6%6 4%4 2%2 0%0 –2 -2% –4 -4% –6 -6%
HU-EZ
EZ GDP/fő növ.
EZ átlag
HU átlag
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
–8 -8%
év
HU GDP/fő növ.
Forrás: Eurostat-, KSH-adatok és saját számítás.
E helyt nincs mód az egyes periódusok sajátosságainak részletes elemzésére, néhány körülményre azonban érdemes felhívni a figyelmet. Először is arra, hogy a hazai viszonylagos makrogazdasági stabilitás időszakában (1996–2001) mind a GDP/fő, mind pedig a GDP eurózóna feletti többletnövekedése nagyjából megegyeStatisztikai Szemle, 91. évfolyam 10. szám
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
935
zett az időszak egészét jellemző értékekkel (ebben a periódusban ezek a mutatók a többi országban a hosszabb távú átlag alatt voltak). Másodszor arra, hogy abban az időszakban, amelyben saját 17 éves átlagához mérten kiemelkedően gyors volt Magyarország felzárkózása (2002 és 2006 között), a másik három országhoz viszonyítva távolról sem volt kiemelkedő a hazai gazdasági növekedés (Szlovákiában és Csehországban gyorsabb volt, Lengyelországban nagyjából azonos volt a növekedési ütem). Harmadrészt pedig, az elmúlt három évben lényegesen rosszabbul teljesítettünk, mint a többi visegrádi ország: a GDP/fő eurózónához viszonyított változatlan szintje kizárólag a hazai relatív népesség-csökkenéshez köthető. Maga a GDP bővülése nálunk évi átlagban 0,5 százalékkal elmaradt az euróövezet ütemétől, Csehországban megegyezett azzal, Lengyelországban és Szlovákiában pedig évi 2,5 százalékkal magasabb volt annál. Azt is érdemes áttekinteni, hogy a felzárkózást előmozdító növekedési ütemkülönbségeket milyen hazai, illetve euróövezeti növekedési ütemek alapoztak meg. A 4. ábrán látható, hogy az igazán gyors felzárkózás évei egybeestek az euróövezeti dekonjunktúrájával, illetve lassú növekedéssel (2001–2005), amikor a külső kereslet visszafogó hatását a fenntarthatatlannak bizonyult fiskális élénkítés erősen túlkompenzálta.
1.3. A 90 százalékos szint elérésének időigénye: illusztratív forgatókönyvek Három feltevés alapján és kétféle módszerrel illusztrálom a 90 százalékos fejlettségi szint elérésének lehetséges időigényét. A feltevések ahhoz kapcsolódnak, hogy az 1995 és 2012 közötti időszak melyik szakaszának „átlagos” folyamatait hosszabbítjuk meg: 1. a teljes időszakét; 2. a nemzetközi válság kitöréséig tartó periódusét (1995–2008); 3. a felzárkózás csúcspontjáig tartó szakaszét (1995–2006). Lehetne más feltevéseket is választani, továbbá fontos hangsúlyozni, hogy ezek nem valószínű vagy lehetséges kimenetek, hanem illusztratív példák. E feltevések alapján egymástól lényegesen eltérő pályák rajzolódnak ki, pedig mindössze évi 0,5 százalékpontnyi hazai növekedési többletben különböznek egymástól. A hazai és az euróövezet egy főre jutó GDP-növekedésének évi átlagos üteme a három időszakban rendre a következőképpen alakult: 2,2, illetve 1,2 százalék; 3,3, illetve 1,7 százalék és 3,8, illetve 1,8, százalék. Ami a szcenáriók előállításának kétféle módszerét illeti, az egyikbe – konstrukciójánál fogva – bele van építve az utolérés (+ „túlszárnyalás”) víziója, mivel konstans növekedési ütemkülönbségeket feltételez. A másik technika ettől csak két aprónak látszó mozzanatban különbözik. Egyrészt a példaként választott periódusokban tapasztalt konvergenciasebességet tekinti konstansnak, másrészt merész ugyan, de az Statisztikai Szemle, 91. évfolyam 10. szám
936
Oblath Gábor
előbbinél kevésbé: abszolút konvergenciát (hosszú távon 100 százalékos felzárkózást) feltételez, ám ezzel kizárja a „túlszárnyalást”. Az 5. ábra az utolérés, a 6. a konvergencia feltevésén alapuló szcenáriókat illusztrál. 5. ábra. Az euróövezethez viszonyított GDP/fő hosszú távú illusztratív pályái konstans növekedési ütemkülönbséget feltételezve
Százalék 100% 100 95 95% 90 90% 85 85% 80 80% 75 75% 70 70%
(EZ:1,2%; HU:2,2%)
(EZ:1,7%; HU:3,3%)
2059
2057
2055
2053
2051
2049
2047
2045
2043
2041
2039
2037
2035
2033
2031
2029
2027
2025
2023
2021
2019
2017
2015
2013
65 65% 60 60%
év
(EU:1,8; HU:3,8)
Forrás: Saját számítás. 6. ábra. Az euróövezethez viszonyított GDP/fő hosszú távú illusztratív pályái a konvergencia konstans ütemét feltételezve
Százalék 100% 100 95% 95 90 90% 85 85% 80 80% 75 75% 70 70% 65 65%
Béta = –1,4%
Béta = –1,8%
Forrás. Saját számítás.
Statisztikai Szemle, 91. évfolyam 10. szám
Béta = –2,2%
2108
2103
2098
2093
2088
2083
2078
2073
2068
2063
2058
2053
2048
2043
2038
2033
2028
2023
2018
2013
60 60%
év
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
937
Az 5. és 6. ábra igen eltérő pályákat mutat be, jóllehet azonos múltbeli időszakok folyamatait vetíti a jövőbe. A különbség abban van, hogy amíg az első a növekedési ütemeket, a második a fejlettségi rés csökkenésének éves ütemét tekinti változatlannak (a konvergencia ütemét béta értéke jelzi). A konvergencia változatlan üteme azzal jár, hogy a távolság csökkenésével együtt zsugorodik a fejlett térség és az utolérő ország közötti növekedési ütemkülönbség. Amíg az előbbi megközelítés értelmesnek látszó választ ad arra a kérdésre, hogy hány év múlva érjük utol az eurózóna fejlettségi szintjét, az utóbbi esetében csak annak a kérdésnek van értelme, hogy hány év alatt tehetjük meg a fejlettségi rés záródásához szükséges út felét (ez az ún. felezési idő; az ábrán szaggatott vonal jelzi a félutat a 100 százalékos felzárkózás felé).7 Az 5. és a 6. ábrák egyrészt azt üzenik, hogy a) csak nagyon optimista feltevésekkel és a felzárkózási folyamat természetének alapvető félreértésén alapuló technikával hozható ki az euróövezet 90 százalékos szintjének körülbelül 21 éven belüli elérése; b) józanabb feltevések és módszer szerint ugyanehhez mintegy 50-100 évre lenne szükség (ha abszolút konvergenciát feltételezünk, amely feltevésben okkal kételkedhetünk). Másrészt azonban azt is üzenik, hogy olyan kritérium, amely teljesítésének becsült időigénye ennyire tág határok között mozoghat, valójában nem tekinthető kritériumnak.
2. Az 50 százalék alatti állami adósságráta elérésének kilátásai A továbbiakban a statisztikai mutatókhoz kapcsolt numerikus kritériumoknak a konvergencia jelenségével összefüggő másik példájával foglalkozom. Azt vizsgálom, hogy – alternatív feltevések mellett – hozzávetőlegesen mekkora lehet az 50 százalék alatti államadósság/GDP arány elérésének időigénye. Amint a bevezetőben jeleztem, a kérdés hazai szempontból azért érdekes, mert a GDP fele alá süllyedő államadósság-ráta igen fontos szabályozási változások – köztük a válságadók kivezetése – feltételeként került megjelölésre. Egyfajta hivatalosnak tekintendő becslés is megjelent a kritérium elérésének időigényéről: a kormányfő az eurózóna jó, illetve jobb teljesítményétől függően 5-10 évre tette a feltétel elérhetőségét.8 Ennek ellenére is kérdés 7
A konvergencia ütemét a következő formulával számítottam: béta = log[(1–YRt)/(1–YR0)]/t, ahol t és 0 index a tárgy, illetve bázisidőszakot jelöli, így t az eltelt évek száma, YR (a relatív jövedelemszint) = (GDP/népesség)HU/(GDP/népesség)EZ ; HU Magyarország, EZ az eurózóna jele. A meghatározásból következik, hogy konvergencia esetén béta előjele negatív. A felezési idő = log(2)/béta. 8 Arra a kérdésre, hogy a válságadók meddig maradnak fenn, kétféle választ olvashattunk a The Wall Street Journalban megjelent interjúban (Fehér [2013]). Egyrészt azt, hogy mindaddig megmaradnak, amíg az állami adósságráta nem csökken 50 százalék alá. Arról pedig, hogy ez mikorra várható, azt olvashattuk, hogy „Ha az eurózóna jobban tejesítene (could do better) ez tíz év múlva bekövetkezhet, ha rendkívül jól teljesítene (could do extremely well), hat vagy akár öt év múlva is”.
Statisztikai Szemle, 91. évfolyam 10. szám
938
Oblath Gábor
marad azonban, hogy a hazai gazdaság várható hosszú távú növekedését és az államháztartás lehetséges egyenlegeit tekintetbe véve, hozzávetőlegesen milyen időtávon érhető el az 50 százalékos adósságráta. Ennek nyomán adódik a második kérdés: mennyire valószerű, hogy az állami adósságráta egyáltalán eléri az 50 százalékot? Végül azt is érdemes megbecsülni, hogy a gazdasági növekedést, illetve az államháztartási egyenleg/GDP-rátát tekintve milyen feltevésekkel kell élni ahhoz, hogy a konvergencia programban szereplő, ez év végi 78 százalékról 10, esetleg 6 év alatt 50 százalék alá kerüljön az adósságráta.9
2.1. A deficitráta, a gazdasági növekedés és az adósságráta kapcsolata Mielőtt az összefüggésekről szó esnék, fel kell tenni a kérdést: létezik-e az államadósság-rátához kötött 50 százalékos limitnek valamilyen közgazdasági megalapozása? Hiába is keresnénk, nem találnánk olyan – ortodox vagy „unortodox” – közgazdasági teóriát vagy tapasztalati eredményt, amely szerint a GDP-arányos államadósság 50 százalék feletti/alatti szintje bármiféle szempontból vízválasztó lenne. Ellenben létezik egy fontos összefüggés, amelyre a később bemutatásra számszerű illusztrációk támaszkodnak. E szerint hosszú távon, változatlan nominális gazdasági növekedési ütemet és állami deficit/GDP-arányt feltételezve, az adósság/GDP-ráta egy stabil szint felé konvergál, amelyet a deficitráta és a nominális gazdasági növekedés ütemének hányadosa határoz meg. Ezért egy rögzített számszerű deficitszabály és adósságszabály csak akkor lehet konzisztens egymással, ha mögöttük a valósághoz közeli feltevések állnak a gazdaság nominális növekedésére nézve.10 Például a maastrichti 3 százalékos deficit- és 60 százalékos adósság-kritérium 5 százalékos hosszú távú nominális növekedés (így körülbelül 2,5 százalékos reálnövekedés és 2,5 százalékos infláció) esetén konzisztens egymással (0,03/0,05 = 0,6). Ha az infláció és a reálnövekedés ütemének csökkenése hosszabb távon például 4 százalékra lassítaná a nominális növekedést, akkor a 3 százalékos deficitkritériummal egy 75 százalékos adósságkritérium vagy a 60 százalékos adósságkritériummal egy 2,4 százalékos deficitkritérium lenne konzisztens. (Más kérdés, hogy az utóbbi tovább lassíthatná a nominális növekedést, és így tovább.)11 9 Az EU-Bizottság tavaszi előrejelzése szerint 2013 végén 79,7 százalék lesz az adósságráta, de a szerző a kormány prognózisát veszi alapul. 10 Lásd erről Buiter–Corsetti–Roubini [1993]. 11 Mindebből az is következik, hogy permanens költségvetési egyensúly esetén az adósság hosszú távon nullához konvergál, többlet esetén pedig idővel elfogy (az állam nettó követelővé válik), hacsak a növekedés nem negatív, az utóbbi esetben viszont kérdés, hogy az adósságrátából mi szűnik meg előbb: a számláló vagy a nevező.
Statisztikai Szemle, 91. évfolyam 10. szám
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
939
2.2. A hazai adósságráta alakulása alternatív feltevések mellett Abból a kérdésből célszerű kiindulni, hogy milyen tényezők hatására változik az állami adósságráta. A bruttó államadósság/GDP éves változása alapvetően az éves deficittől (az adósság nominális emelkedésétől) és a GDP változásától függ. Az adósság nominális változását azonban a deficiten kívül számos egyéb tényező is befolyásolhatja. Ilyen az árfolyam alakulása, amely az adósság devizarészét értékeli át; a deficitet meghaladó, vagy attól elmaradó hitelfelvétel (az állam likvid eszközeinek gyarapodása, illetve azok felhasználása), s nálunk különösen jelentékeny „egyéb tényező” volt a magánnyugdíj-pénztáraktól átvett vagyon. Az ilyen tényezőkkel a továbbiakban nem foglalkozom, mert vagy nincs tartós hatásuk, vagy ha van, nem tudható, hogy az milyen irányú és mértékű.12 Az említett két fő tényező közül a deficit az úgynevezett elsődleges egyenlegre és a kamatfizetési részre, a GDP változása pedig ár- és reálváltozásra bontható. Az adósságdinamika alapos elemzéséhez és valóságos előrejelzések készítéséhez az alábbinál részletesebb, olyan felbontás indokolt, amely figyelembe veszi az elsődleges egyenleg, a reálnövekedés, a reálkamat és a reálárfolyam-alakulás hatását. A további nagyvonalú szcenárióelemzéshez azonban az alábbi egyszerű formulák is elegendők. Az első képlet azt mutatja, hogy az adósságráta mitől változik az egyik évről a másikra, a második pedig azt jelzi, hogy a tárgyidőszakban milyen szintre jut. ⎛ y ⎞ bt − bt −1 = dt − bt −1 ⎜ ⎟, ⎝1+ y ⎠ ⎛ b ⎞ bt = ⎜ t −1 ⎟ + dt , ⎝1+ y ⎠ ahol b az adósság/GDP-t, d a deficit/GDP-t, y a folyóáras GDP növekedési ütemét, t és t–1 indexek pedig a tárgy-, illetve bázisidőszakot jelölik. Az első formula szerint az adósságrátát emeli a tárgyévi deficit GDP-hez viszonyított aránya, és csökkenti a tárgyévi nominális gazdasági növekedésnek a bázisévi adósságrátával képzett szorzata. A második képlet az előbbinek az átrendezése, amely felhasználható bármely év adósságrátájának meghatározására a bázisévi adósságráta, a nominális GDP tárgyévi változása, valamint a tárgyévi deficit/GDP arány ismeretében – feltéve, hogy a ko12 Náray László hívta fel a figyelmemet arra, hogy a deficiten és az árfolyam változásán kívüli egyéb tényezők hosszabb távon is jelentős hatást gyakorolnak egyes EU-tagországok adósságváltozására. Ebből az a tanulság, hogy országspecifikus előrejelzéseket nem lehet általános formulákra alapozni; a tartós specifikumoknak is alaposan utána kell nézni. Magyarország esetében azonban – a magánnyugdíj-pénztári vagyon átvételétől eltekintve – nem mutatkozik jelentős eltérés az árfolyamváltozással nem megmagyarázott állományváltozás és a deficit között.
Statisztikai Szemle, 91. évfolyam 10. szám
940
Oblath Gábor
rábban említett tényezők (az árfolyam változása és egyebek) nem befolyásolják az adósság változását. Ha bt–1 helyére 0,78-at (a kormány által az idei év végére prognosztizált adósságrátát) helyettesítjük be, akkor a d-re és az y-ra vonatkozó feltevések meghatározzák bt értékét (2014-re), és egy Excel táblában b későbbi értékei bármely 2014 + n. évre „manuálisan” kiszámíthatók. Létezik azonban általános formula is a (t + n)-edik év adósságrátájának meghatározásához konstans növekedési ütem és deficitráta feltevése mellett:13 bt + n =
bt
(1 + y )n
+
d⎛ 1 ⎜1 − y ⎜ (1 + y )n ⎝
⎞ ⎟ . ⎟ ⎠
Ahogyan az évek száma (n) növekszik, egyre kisebb lesz a jobb oldalon az első tag, csakúgy, mint a zárójelben szereplő tört értéke, így az adósságráta tart d/y felé. Ez megegyezik azzal a korábbi megállapítással, hogy konstans növekedési ütem és deficitráta esetén az adósságráta a deficitráta és a nominális növekedés hányadosa felé konvergál. Az itt bemutatott szcenáriók mindvégig konstans nominális növekedést (y) és deficitrátát (d) feltételeznek, és teljesen mechanikusak: nem tartalmaznak semmiféle előfeltevést a kettő egymásra gyakorolt hatásáról. Lehet persze úgy érvelni, hogy a magasabb növekedési ütem alacsonyabb deficitet, vagy az alacsonyabb deficit (a nagyobb bizalom és alacsonyabb kamat folytán) magasabb növekedést tesz lehetővé. De fordított kapcsolat is lehetséges: ha az alacsonyabb deficit úgy jön létre, hogy az állami beruházások elmaradnak, az infrastruktúra, az oktatási és egészségügyi rendszer leromlik, illetve az által, hogy az adóztatás szintje/szerkezete megbénítja a gazdaságot, akkor a kisebb deficit lassúbb növekedést (vagy stagnálást) von magával. Nincs tehát semmi ok arra, hogy a kettő kapcsolatát illetően bármiféle előfeltevéssel éljünk. Egy fontos feltevésre azonban szükség van ahhoz, hogy a szcenáriókat össze lehessen hasonlítani: az infláció üteme mindegyikben azonos (legegyszerűbb a hazai 3 százalékos inflációs célra gondolni), így a nominális növekedési ütemkülönbségek a reálnövekedés eltéréseiből adódnak. Ez azért fontos, mert ha a nominális gazdasági növekedés az infláció ütemétől függően is változhat, akkor a deficit a kamatokon keresztül a nominális növekedés függvényévé válik, és ez feleslegesen bonyolítaná illusztratív számításainkat. A változatlan infláció feltevését alátámasztó tartalmi érv az, hogy adott reálkamat esetén, a magasabb infláció növeli ugyan a deficitrátát, de nem befolyásolja az adósságrátát. Az infláció akkor tudja a reálkamatot lenyomni, ha 13
Valentinyi Ákosnak tartozom köszönettel a formula levezésért. A képlet nem egészen pontosan azt adja vissza, mint amivel számoltam, mert az adósságráta változására vonatkozó formula nem t-re, hanem, t + 1-re van felírva, de ez a lényegen nem változtat, és a számszerű eltérés sem számottevő.
Statisztikai Szemle, 91. évfolyam 10. szám
941
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
váratlanul emelkedik. A folyton váratlannak szánt emelkedés azonban hosszú távon hiperinflációt jelent, ettől a lehetőségtől pedig inkább eltekintek. A 7. ábra hatféle konstans deficitnövekedés-pár feltevése mellett mutatja az adósságráta alakulását. Az induló szint 78 százalék (2013); a hipotetikus folyamatok ábrázolása 2113-ban szakad meg. A feltételezett deficitráták: 2, 2,5 és 3 százalék, a növekedés pedig 4 és 6 százalék között változik (ez 3 százalékos infláció mellett körülbelül 1 és 3 százalék közötti reálnövekedés). 7. ábra. A 78 százalékról induló adósságráta alakulása konstans deficitráta és nominális GDP-növekedés egyes kombinációi mellet
Százalék 80 80% 75 75% 70 70% 65 65% 60 60% 55 55% 50 50% 45 45%
2108
2103
2098
2093
2088
2083
2078
2073
2068
2063
2058
2053
2048
2043
2038
2033
2028
2023
2018
2013
40 40%
2; yy == 4 dd == 2;
d = 2; y = 5
d = 2,5; yy==55
2,5; yy = 5,5 dd == 2,5;
d = 3; y = 5
d = 3; yy == 66
év
Forrás. Saját számítás.
Az adósságráta ábrázolt pályáit csak abban az értelemben kell komolyan venni, hogy korántsem magától értetődő az 50 százalékos szinthez való konvergencia, s az utóbbi sem azt jelenti, hogy az adósságráta egyszer 50 százalék alá kerül. Az illusztrált pályák közül kettő csúszik 50 százalék alá (tartós 2 százalékos deficit és körülbelül 3 százalékos reálnövekedés esetén 30 év múlva; 2,5 százalékos deficit és körülbelül 2,5 százalékos reálnövekedés esetén 50 év múlva), a többi esetben az adósságráta vagy 50 százaléknál magasabb szint felé tart, vagy a végtelenben éri el az 50 százalékot. A 2. táblázat az 1. táblázathoz hasonló, illusztratív számításokat tartalmaz arról, hogy alternatív deficitnövekedés-párok mellett hány év múlva kerülhet a hazai adósságráta 50 százalék alá. A beszínezett terület olyan kombinációkat tartalmaz, amelyek estében soha (zárójelben az az érték szerepel, amely felé az adósságráta hosszú távon tart). 3 százalék feletti deficitrátákkal nem számoltam. Statisztikai Szemle, 91. évfolyam 10. szám
942
Oblath Gábor
2. táblázat Az 50 százalék alatti adósságráta elérésének időigénye (évek száma) alternatív konstans deficitrák és nominális GDP-növekedési ütemek mellett (induló érték: 78 százalék) Deficit/GDP (százalék)
GDP reálnövekedés 3 százalékos infláció mellett (százalékos változás)
1,0
4
1,0
21
34
(50)
(63)
(75)
4,5
1,5
18
25
51
(56)
(67)
5
1,9
15
20
32
(50)
(60)
5,5
2,4
14
17
24
52
(55)
6
2,9
12
15
20
32
(50)
6,5
3,4
11
13
17
24
59
7
3,9
10
12
15
20
32
7,5
4,4
9
11
13
17
24
8
4,9
9
10
12
15
19
Nominális GDPnövekedés (százalékos változás)
1,5
2,0
2,5
3,0
Az 50 százalék alatti szint eléréséhez szükséges évek száma
* A zárójelben levő adatok azt mutatják, hogy milyen szint felé tart az adósságráta, ha nem süllyed 50 százalék alá. Megjegyzés. A táblázat adatai illusztratív számítások.
A 2. táblázat segítségével bárki kikeresheti, hogy – az általa valószínűsített növekedésdeficit-kombinációtól függően – hány év múlva kerülhet az állami adósságráta 50 százalék alá, (illetve egyáltalán az alá kerülhet-e). Az mindenesetre látható, hogy nem kell kifejezetten borúlátó feltevésekkel élni ahhoz, hogy az adósságráta ne érje el az 50 százalékot, ellenben túlzottan derűlátó feltevések kellenek ahhoz, hogy a megcélzott szint 20-25 évnél gyorsabban legyen elérhető. A személyes derűlátó változatom a deficitrátára nézve 2,5-3 százalék, a nominális növekedésre pedig 5-5,5 százalék (körülbelül 2-2,5 százalékos reálnövekedés); ebben a tartományban van esély arra, hogy az adósságráta mintegy 50 év múlva 50 százalék alá kerüljön. A 2,5 százalék alatti tartós deficitráta és a 6 százalék feletti tartós nominális (3 százalék feletti reál-) növekedés kombinációja szerintem valószínűtlen, ellenben lehetséges, hogy hosszabb távon a deficitráta 3 százalékhoz közeli, a nominális növekedés pedig 5,5 százalék alatti lesz – ez esetben az adósságráta nem érheti el az 50 százalékot. 14 14 Balatoni András írásom korábbi változatához azt az észrevételt fűzte, hogy a stabilitási törvényben szereplő, 2015-től hatályos adósságszabály rendkívül gyors adósságráta-csökkentést kényszerít ki, ezért a szabály betartása az illusztratív számításaim által jelzettnél gyorsabban vezet az 50 százalékos ráta eléréséhez (Balatoni [2013]). Mellár Tamás [2013] viszont kimutatta, hogy Balatoni és saját számításaim között nincs érdemi eltérés. A szakmai szempontból ígéretes eszmecsere relevanciáját az a körülmény szüntette meg, hogy az eleve hibás, prociklikus adósságszabály kiiktatásra került.
Statisztikai Szemle, 91. évfolyam 10. szám
943
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
Végül arra is érdemes röviden kitérni, hogy a deficitre és növekedésre nézve milyen feltevéseket foglalnak magukban a The Wall Street Journalból idézettek. Ez akár 5-6 év múlva is bekövetkezhet, ha az euróövezet kimagaslóan teljesítene. A jövőbeli hazai és euróövezeti teljesítmény ilyen szoros összekötése persze azt a kérdést is felveti, hogy az eddigi tapasztalatok szerint az eurózóna növekedése csakugyan meghatározza-e a hazait. A 8. ábra bal és jobb oldalának összehasonlításából látható, hogy – a jelenlegi adatok szerint – 1996-tól 2008-ig alig volt összefüggés a kettő között; a kapcsolat csak a 2009. évi nemzetközi válság és az azt követő három év adatai folytán mutatható ki. 8. ábra. Magyarország és az eurózóna éves gazdasági növekedésének kapcsolata a) 1996 és 2008 között
HU növ. (%) 5,0 4,5 4,0 3,5 3,0 2,5 2,0 1,5 1,0 0,5 0,0 0,0
2004
2002 2003
1998
2005 2001 1997
2006
2000
1999 y = 0,248x + 2,5946 R 2 = 0,0254
2008 2007
1996 1,0
2,0
3,0
4,0
5,0
EZ növ. (%)
b) 1996 és 2012 között
HU növ. (%) 6,0
2004 1998 2000 2005 2006 2003 2001 1999 1997 2010 2008 2011 2002
4,0 2,0 0,0
1996
-2,0
2012
y = 1,2432x + 0,1428
-4,0 -6,0 -8,0 -6,0
2007 R 2 = 0,6378
2009 -4,0
-2,0
0,0
2,0
4,0
Forrás: AMECO-adatbázis.
Statisztikai Szemle, 91. évfolyam 10. szám
6,0
EZ növ. (%)
944
Oblath Gábor
Tegyük azonban fel, hogy az elmúlt négy évben keletkezett szoros kapcsolat tartósan fennmarad. Ha az eurózóna gazdasága a jelenlegi 0,5 százalék körüli zsugorodásról például 2,5 százalékos növekedésre (az 1998–2002-es időszak átlagára) váltana, az feltétlenül jobb teljesítmény lenne, ha pedig a ritka években tapasztalt 3 százalékra, az valóban kimagaslónak nevezhető. Az 3. táblázat azokat a hazai 2, 2,5, illetve 2,9 százalékos deficitrátához tartozó gazdasági növekedési ütemeket tartalmazza, amelyek ahhoz szükségesek, hogy az adósságráta 10, illetve 6 év alatt 50 százalék alá kerüljön (az 5 évet elhagytam). Az utolsó előtti oszlopban szerepel az euróövezet feltételezett reálnövekedése, az utolsóban pedig a hazai növekedés afeletti többlete. 3. táblázat A deficitrátára és a gazdasági növekedésre vonatkozó mely feltevések mellett süllyedhet 10, illetve 6 év múlva 50 százalék alá az államadósság-ráta?
Idő (év)
10
6
Hazai deficit/GDP (százalék)
Hazai GDP nominális növekedése (százalék)
Hazai GDP reálnövekedése, ha az infláció 3 százalékos (százalék)
Eurózóna GDP reálnövekedése (százalék)
Eurózóna feletti hazai reálnövekedés (százalékpont)
2,0
8,0
4,9
2,5
2,4
2,5
8,5
5,3
2,5
2,8
2,9
10,0
6,8
2,5
4,3
2,0
11,5
8,3
3,0
5,3
2,5
12,5
9,2
3,0
6,2
2,9
13,0
9,7
3,0
6,7
Megjegyzés. A táblázat adatai illusztratív számítások.
Az 50 százalékos adósságráta 10, illetve 6 éves időhorizonton való eléréséhez 2 százalékos konstans deficitráta mellett (végig 3 százalékos inflációt feltételezve), megközelítően évi 5 százalékos, illetve 8 százalék feletti reálnövekedés szükséges. Ha a deficitráta 2,5 százalék, a szükséges reálnövekedés 5,3 százalék, illetve több, mint 9 százalék évente. A 2,9 százalékos deficitrátákhoz tartozó növekedési ütemeket már le sem írom (a táblázatban megtalálhatók, az eurózónához viszonyított növekedési többletekkel együtt). Röviden: csak a realitásoktól való teljes elszakadásként értelmezhető az az elképzelés, hogy az állami adósságráta 10, illetve 6 (5) év alatt 50 százalék alá csökkenhet.
Statisztikai Szemle, 91. évfolyam 10. szám
Hány év múlva? — A konvergencia természetérõl és idõigényérõl
945
3. Összegzés és kitekintés Írásom két, szakmai indoklás nélkül bejelentett, statisztikai mutatókhoz kötött, számszerű kritérium teljesítésének lehetséges időigényét firtatta. Az áttekintett illusztratív szcenáriók szerint meglehetően rosszak az esélyek arra, hogy az ún. válságadók (kiválasztott szektorokra kivetett különadók) megszüntetése feltételeként megjelölt 50 százalék alatti államadósság-ráta, valamint az euróövezeti csatlakozás feltételeként megszabott 90 százalékos felzárkózási szint három évtizeden belül elérhető legyen. Realisztikusabb feltevések mellett e szintek eléréséhez lényegesen több idő szükséges. Az is lehetséges, hogy hosszú távon az adósságráta 50 százaléknál magasabb, relatív fejlettségünk pedig az eurózóna 90 százalékánál alacsonyabb szint felé konvergál; ez esetben a megkívánt feltételek a végtelenben sem teljesülnek. Ellenben – a realitások határain belül mozgó feltevések mellett – nem lehetséges, hogy az állami adósságráta 5-6-10 év alatt 50 százalék alá süllyedjen. Láthattuk, hogy a 10 évhez is kifejezetten extrém feltétevések tartoznak, az 5-6 évhez tartozók pedig mérlegelést sem érdemelnek. Fontos azonban, hogy a közvélemény és a gazdaságpolitikusok egyaránt megértsék: az ilyen típusú statisztikai kritériumok közgazdasági szempontból távolról sem semlegesek. Figyelembe kell ugyanis venni két problémát, amelyeket az előzőkben csupán érintettem. Az egyik a feltételek és a célok, a másik a kétféle feltétel kapcsolatát érinti. Egyrészt alaposan végig kellene gondolni (és számolni), hogy mennyiben akadályozhatja a válságadók fenntartása az 50 százalékos adósságráta és a 90 százalékos fejlettségi szint megközelíthetőségét. Másrészt az a kérdés is beható elemzést érdemel, hogy ha egy stagnáló gazdaságban erőltetni kezdik a 80 százalékos adósságráta 50 százalékra történő leszorítást, az vajon nem blokkolja-e a gazdaság fejlődését, és nem tolja-e folyamatosan maga előtt a 90 százalékos relatív fejlettségi szint elérhetőségét.
Irodalom BARRO, R. [2005]: A gazdasági növekedést meghatározó tényezők. Nemzeti Tankönyvkiadó. Budapest. BALATONI A. [2013]: Mikor vezethetők ki a válságadók? Portfolio.hu. augusztus 29. http://www.portfolio.hu/gazdasag/mikor_vezethetok_ki_a_valsagadok.188363.html BUITER, W. – CORSETTI, G – ROUBINI, N. [1993]: Excessive Deficits: Sense and Nonsense in the Treaty of Maastricht. Economic Policy. Vol. 16. April. pp. 57–100. EUROSTAT–OECD (ORGANIZATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT) [2012]: Methodological Manual on Purchasing Power Parities. Methodologies and Working Papers. Publication Office of the European Union. Luxembourg. FEHÉR, M. [2013]: Hungary’s PM Orban Says Sectoral Taxes to Remain for Several Years. The Wall Street Journal. July 18. http://blogs.wsj.com/emergingeurope/2013/07/18/hungarys-pmorban-says-sectoral-taxes-to-remain-for-several-years/
Statisztikai Szemle, 91. évfolyam 10. szám
946
Oblath: Hány év múlva? — A konvergencia természetérõl és idõigényérõl
MAGYAR KÖZLÖNY [2011]: Magyarország Alaptörvénye. 43. sz. 10656–10681. old. http://www.kormany.hu/download/0/d9/30000/Alapt%C3%B6rv%C3%A9ny.pdf MELLÁR T. [2013]: Kellemetlen tények, avagy mi jön ki az államadósság-matekból? Porfolio.hu. Szeptember 4. http://www.portfolio.hu/gazdasag/kellemetlen_tenyek_avagy_mi_jon_ki_az_ allamadossag-matekbol.4.188550.html NEMÉNYI J. – OBLATH G. [2012]: Az euró magyarországi bevezetésének újragondolása. Közgazdasági Szemle. LIX. évf. 6. sz. 569–571. old. OBLATH G. [2012]: Ezentúl minden másképpen volt? – Gondolatok a GDP-adatok legutóbbi revízióiról. Statisztikai Szemle. 90. évf. 6. sz. 559–570. old. OBLATH G. [2013a]: Mikor vezethetők ki a válságadók és mikor vezethető be az euró? Az MTA KRTK Közgazdaság-tudományi Intézetének blogja. http://blog.mtakti.hu/blog_cikk/?cikk[cikk] [keyvalue]=345 OBLATH G. [2013b]: Nem jön ki a matek. Kellemetlen tények a magyar gazdaságról (I. és II. rész). Portfolio.hu. Augusztus 6. és 7. http://www.portfolio.hu/gazdasag/nem_jon_ki_a_matek_ kenyelmetlen_tenyek_a_magyar_gazdasagrol.187586.html ORIGO.HU [2011]: Hatalmas adósságcsökkentés kell a magyar euróhoz Matolcsy szerint. Március 3. http://www.origo.hu/gazdasag/hirek/20110303-matolcsy-gyorgy-2020-elott-nem-erdekesmagyarorszag-szamara-az-euro.html# PORTFOLIO.HU [2013]: Mit jelent Orbán 90 százalékos szabálya? Április 29. http://www.portfolio.hu/gazdasag/mit_jelent_orban_90_szazalekos_szabalya.183253.html
Summary The article addresses issues of numerical economic policy criteria relying on statistical indicators. It analyses the conditions of reaching certain numerical targets as well the time required for reaching them, depending on alternative assumptions. These questions concern the problem of convergence, the discussion of which is based on two Hungarian examples. One is the catching up to the more advanced countries of the EU in terms of per capita income; the other relates to the prospects of a significant decrease in public debt in percent of GDP. The analysis is motivated by two announcements. First, the condition of Hungary’s joining the Eurozone is to reach 90 percent of the region’s income level, and second, the debt-to-GDP ratio should fall below 50 percent in order that the so-called crisis taxes be withdrawn. The article finds that, relying on realistic assumptions and adequate projection techniques, the time required for meeting these criteria is considerably longer than often assumed. Moreover, prospective economic developments may be significantly influenced by the numerical criteria themselves and interactions between the two criteria.
Statisztikai Szemle, 91. évfolyam 10. szám
Védett táblázatok morfológiája — Optimális másodlagos cellaelnyomás számítógép nélkül Faragó Miklós, a Központi Statisztikai Hivatal vezető főtanácsosa E-mail:
[email protected]
A statisztikai felfedés elleni védelem egyik legnehezebb problémája áll elő, amikor egy számokat tartalmazó táblázat kibocsátója a táblázat néhány celláját nem kívánja közölni és ezért azokat letakarja („elnyomja”), azaz egy egyezményes karaktert ír a helyükbe. Mivel a sorok, illetve oszlopok összegét hiánytalanul mellékeli, ezekből a letakart számok gyakran mégis kiszámíthatók, hiszen minden letakart cellát tartalmazó sorra és oszlopra fel lehet írni egy-egy egyenletet. A cél, mint általában az adatvédelemben, az egyértelműség megakadályozása. Ha a letakart cella csupán egyetlen értéket vehet fel az adott összesenek mellett, a letakarás értelmetlen. Ezt nevezzük a cellaérték rekonstruálhatóságának, melyet viszont meg lehet akadályozni újabb, másodlagosan kiválasztott cellák letakarásával, ezzel „megvédve” az eredeti számokat, azaz elérve, hogy mind az elsődlegesen, mind a másodlagosan letakart cellák több lehetséges értékkel is kiadják az összeseneket. Megfontolandó, hogy a másodlagos cellaelnyomás problémája fel sem merül, ha a kiadott táblázat nem tartalmaz összeseneket. A szerző fő célja egy olyan egyszerű, akár papíron is elvégezhető módszer elterjesztése, amellyel a statisztikus két problémát is megold: egyrészt az elsődlegesen letakart cellák közül – némi intuícióval – könnyen felismeri a rekonstruálhatókat, másrészt megtalálja a másodlagosan letakarandó cellák egy minimális számosságú halmazát – kétdimenziós táblázatokra. A cikk ezenkívül feltérképezi a védett, azaz a letakarásból rekonstruálhatatlan cellákból álló cellaegyüttesek „szép” geometriai tulajdonságait. TÁRGYSZÓ: Adatvédelem. Másodlagos cellaelnyomás. Páros gráfok, augmentáció.
Statisztikai Szemle, 91. évfolyam 10. szám
948
Faragó Miklós
A statisztikai felfedés elleni védelem (statistical diclosure control – SDC) má-
sodlagos cellaelnyomás („secondary cell suppression”) néven ismert, a jogszabályok értelmében önmagában is megoldandó, klasszikus problémájának megoldását két tény teszi sürgetővé. Egyrészt az Eurostat gyakran a tagállamokra hárítja a szolgáltatott adatok védelmét, beleértve a táblázatok másodlagos cellaelnyomását is. Másrészt a több mint egy évtizede ismert, és immár ingyenesen használható Argus nevű komplex adatvédelmi szoftverpárnak a másodlagos cellaelnyomást megvalósító modulja az egyetlen, amelynek használatáért fizetni kell. A modulban alkalmazott – egészértékű programozási feladatot megoldó – algoritmus (Fischetti–Salazar [2000]) nagy előnye, hogy tetszőleges dimenziójú táblázatokra működik (a gyakorlatban négy dimenzióra korlátozták), a jelen cikkben ismertetett viszont csupán kétdimenziósokra érvényes. (Például egy megyés táblasor valójában háromdimenziós táblázat.) Az esetek többségét azonban az utóbbiak teszik ki, és ezekben – átlagos méretű táblázatok esetén – a 3. fejezetben ismertetett egyszerű módszerrel az adatszolgáltató bármelyik dolgozója elvégezheti a másodlagos cellaelnyomás feladatát. A probléma előélete: az ún. bővítési feladatot, az elsődlegesen letakarásra kijelölt cellák rekonstruálhatatlanságát, azaz tartalmuk többértelműségét biztosító minimális számú másodlagosan letakarandó cella megtalálását Gusfield [1987], 1988] két dimenzióban már huszonöt éve megoldotta úgy, hogy az elsődlegesen letakarandó cellahalmazokat kölcsönösen egyértelműen megfeleltette páros gráfoknak, és az így előállt feladatra – „bővítsünk egy páros gráfot minimális számú él hozzáadásával hídélmentes páros gráffá” – adott gyors (lineáris idejű) algoritmust. (Ugyanis a cellahelyeknek élek felelnek meg a gráfban.) A következőkben ismertetett „kézi” módszer – bár egy másik gráfelméleti eszközöket használó, szintén lineáris idejű algoritmus (Faragó [2010]) megalkotásának melléktermékeként keletkezett, nem használ gráfelméletet – csupán a letakarandó cellák elhelyezkedését veszi figyelembe. Kiderül ugyanis, hogy a cellák tartalmának rekonstruálhatósága nem függ a cellák értékeitől, csak a cellahelyek halmazának „alakjától”, tehát nem kell számolni! Megjegyezzük még, hogy a bővítési feladat értelmes általánosítása az, ha a másodlagosan letakarandó cellák száma helyett a hozzájuk rendelt valamilyen – fontosságot (például információtartalmat) mérő – súlyok összegét minimalizáljuk. Ez az opció működik az Argusban is. Ennek a feladatnak már nincs gyors megoldása, ugyanis Esweran és Tarjan [1976] belátták, hogy már két különböző súly esetén is a probléma (gráfelméleti megfelelője) NP-teljes. Cellahelyek egy halmazát védettnek nevezzük, ha azt letakarva egyik értéke sem rekonstruálható, azaz egynél több értékkel is kielégítik az összeseneket. (A pontos definíciót az 2. fejezetben adjuk meg.)
Statisztikai Szemle, 91. évfolyam 10. szám
949
Védett táblázatok morfológiája
A 2. fejezet a védett cellahalmazok geometriai jellemzésével, hierarchiájuk feltárásával és érdekes tulajdonságaik feltérképezésével foglalkozik, ezenkívül a védettségre több szükséges és elégséges feltételt is ad. Az állítások és tételek egy-egy tulajdonságot írnak le. A 3. fejezetben bemutatjuk a letakarás ellenére védetlen, azaz rekonstruálható cellákat felismerő és a letakart cellahalmazt minimális bővítéssel védetté tevő „kézi” eljárást. A 4. fejezetre halasztottuk a gyakorlatban túlnyomórészt előforduló nemnegatív értékű táblák vizsgálatát, amelyek körében a halmazok védettségének szigorúbb feltételei vannak. Itt mondjuk ki a védett halmazok szigorúbb karakterizációs tételét és ennek megfelelően módosítjuk a bővítési eljárást. A Függelék az egyik bizonyítást, majd a védett cellahalmazok és a páros gráfok közötti kapcsolatot mutatja be, ezután röviden vázolja az „igazi” bővítési algoritmust, végül példát mutat arra a fontos tényre, hogy egy magasabb dimenziós táblázat letakart cellái hiába védettek síkmetszetenként két dimenzióban, mégis lehetnek közöttük rekonstruálhatók.
1. Adatvédelmi bevezetés Vizsgálatunk tárgya, a „másodlagos cellaelnyomás”, a statisztikai felfedés elleni védelem egyik tevékenységláncának végén helyezkedik el, ezért röviden vázoljuk az oda vezető utat, kezdvén az adatvédelem alapfogalmaival. Felfedés: egy adathalmaz valamely megfigyelési egységének (például egy személy, vállalat, embercsoport) beazonosítása és valamilyen érzékeny adat, azaz olyan információ hozzákapcsolása, amelyet ő nem szeretne. Az statisztikai felfedés elleni védelem célja ennek megakadályozása úgy, hogy e két esemény közül már az elsőt, az azonosítást teszi lehetetlenné. Az érzékeny adat nem jogszabályban meghatározott fogalom, nem definiálható korrektül, mert mindenki másra érzékeny. Mindazonáltal az érzékeny adatok egy részét, az ún. „különleges adatokat” nevesíti az adatvédelmi törvény (vallás, faji eredet, egészségi állapot stb.). A közvélekedéssel ellentétben nincs akadálya érzékeny adatok közlésének, ha a mögötte álló egyén vagy vállalat stb. nem azonosítható. A statisztikai felfedés elleni védelem a „védelem” fogalmát ekvivalensnek tekinti az „azonosíthatatlansággal”: egy védett adathalmaz nem tartalmaz azonosítható megfigyelési egységet. Tehát már csak a azonosítás fogalmának definiálása hiányzik. Azonosítás vagy egyedi adat megtalálása: a) Mikroadathalmaz esetén (ilyenkor az adathalmaz megfigyelési egységenkénti ismérveket tartalmaz) egy adathalmaz egyedi adata: olyan ismérvegyüttese egy megfigyelési egységnek, amellyel más megfigyelési egység nem rendelkezik – a vizsgált Statisztikai Szemle, 91. évfolyam 10. szám
950
Faragó Miklós
populációban. Például, ha Veszprém megye férfi népességében egyetlen 30 éves matematikus végzettségű pék van, és őt tartalmazza az adatbázis, akkor a (Veszprém, férfi, 30, matematikus, pék) értékötös – ún. 5 hosszúságú kulcs – egy egyedi adat. Világos, hogy ha egy értékötös egyszer fordul elő az adathalmazban, a populációban még előfordulhat többször is, amennyiben az adathalmaz nem teljes körű. Teljes körűség esetén a populációbeli és az adathalmazbeli egyediség ekvivalens. Mindenesetre az azonosítás megakadályozásának elégséges feltétele, hogy a kulcs már az adathalmazban is egynél többször forduljon elő. Valójában ennek minden kulcsra (érték k-ra) teljesülnie kellene, ami többnyire – például 100 fölötti számú ismérveket tartalmazó mikroadatbázis esetén – gyakorlatilag lehetetlen. Ezért az adatvédelem „alább adja”, és megelégszik csupán „elég rövid” kulcsokra előírni az egynél (esetleg szigorításképp a 2-nél, 3-nál) több előfordulást. A triviális, ám tökéletes megoldástól – amikor az adatvédő egyszerűen nem engedélyezi az adathalmaz kiadását – eltekintve ilyenkor módosítani kell az adatbázist, például az ismérvek összevonásával (aggregáció) vagy módosításával (perturbáció), esetleg az adat elnyomásával. A módosítással szemben támasztott minimális követelmény, hogy kis mértékű legyen, kis torzítással járjon, és hogy bizonyos átlagok megmaradjanak. b) Táblázat esetén az egyedi adat egy olyan cellaérték, amely „mögött” egyetlen megfigyelési egység áll. Meggondolható, hogy ez a definíció analóg a mikroadathalmaz esetén használttal: minden táblázat egy mikroadathalmazból képződik – táblázással. Például egy kétdimenziós táblázat: vagy 2 hosszúságú kulcs értékpárjainak előfordulási számait tartalmazza a cellákban – ezeket gyakoriság tábláknak hívják – (például sorok = végzettségek, oszlopok = foglalkozás, a matematikuspék cella tartalma = 2) vagy egy harmadik, számértékű ismérv összértékét a párra nézve. (Például a matematikus pékek összkeresetét.) Ezek az ún. értékösszeg táblák. Az első esetben az 1-est tartalmazó cella tekintendő egyedi adatnak, a másodikban pedig az összfizetés (Ft), ha egyetlen matematikus pék van a vizsgált populációban. Tehát mindkét eset egy 2 hosszúságú kulcshoz tartozó egyedi adatszolgáltató-előfordulást jelent a „mögöttes” adatbázisban. A gyakorlatban azonban nemcsak az egyedi előfordulást tiltja az adatvédő, hanem a „nagyon ritkát” is. Például a közismert és kormányrendeletben előírt „hármas szabály” minden, 3-nál kevesebb adatszolgáltatóval „rendelkező” cella kiadását tiltja. (Megjegyzés: ha egy faluban az 50 éves férfiak között 0 a büntetlen előéletűek száma, akkor ez a nulla az összes falubeli 50 éves férfiról mindjárt érzékeny adatot is közöl.) A előírt „ritkaság” tehát paraméterezhető (a felfedési kockázathoz, ezen belül többek között a az adatkérő „veszélyességi” kategóriájához igazítva), a 3-as szabály 3-asa nem természeti állandó. Az értékösszeg táblák esetén a statisztikai felfedés elleni védelem bevezetett egy új eszközt: az egyedi vagy kevés adat összegét tartalmazó cellák tiltását kiterjeszti az „orrnehéz” cellákra is, azaz azokra, melyekre a cellaértékhez történő néhány legnagyobb hozzájárulás összege kiadja a cella nagy százalékát. Ez az ún. dominancia Statisztikai Szemle, 91. évfolyam 10. szám
951
Védett táblázatok morfológiája
szabály. (A tiltás tehát tetszőleges számú hozzájáruló esetén is áll.) Például letakarandó a cella, ha a három legnagyobb hozzájárulás kiadja a cella 85 százalékát. Ez tehát a két paraméterrel – esetünkben (3; 85%) – leírható szabály. Világos, hogy az előző, a „ritka” előfordulást tiltó szabály ennek speciális esete: például a „hármas szabály” megfelel a (2; 100%) paraméterezésnek. (A statisztikai felfedés elleni védelem módszertanáról és alkalmazott eljárásairól ad aktuális összefoglalót a Handbook on Statistical Disclosure Control (Statistics Netherlands [2010]).) Az adatvédelmi akció szokásos formái táblázatok esetén is az aggregáció (például két oszlop összeadása: a „pék” oszlopból és a „cukrász” oszlopból „pék vagy cukrász”), a cella tartalmának módosítása (például kerekítéssel vagy véletlenszerűen) vagy cellaelnyomás. Az első megoldás jár általában a legtöbb információvesztéssel (egy-két cella miatt teljes oszlopokat vonunk össze) és egyben ez a legnépszerűbb. A perturbáció ugyanis a statisztikában kevéssé jártas felhasználók körében általános riadalmat kelt, a cellaelnyomás pedig „csúnya látvány”. Mi az utóbbival fogunk foglalkozni, mégpedig azért, mert az igény az alkalmazására egyre nő, és mert valóban felvet egy problémát, a már vázolt felismerési és optimalizációs feladatot.
2. Védett cellahalmazok Egy 2 × 2-es táblázaton már bemutatható a probléma természete. 1. ábra. A legegyszerűbb eset
200
200
200
100
100 200
101
99 200
200
100
100 200
99
101 200
200
200
200
200
Világos egyrészt, hogy ha a négy belső cella valamelyikét nem takarjuk le, akkor a letakartak mind egyértelműen kiszámíthatók egy-egy kivonással. Másrészt, ha mindet letakarjuk, akkor egyiket sem lehet egyértelműen kiszámítani, ugyanis ha egy számnégyes „kiadja” az összeseneket, akkor az a számnégyes is, amelyet úgy kapunk, hogy az eredeti egyik „átlóját” alkotó két cellát megnöveljük egy tetszőleges c konstanssal, a másik kettőt pedig –c-vel.
Statisztikai Szemle, 91. évfolyam 10. szám
952
Faragó Miklós
Ez az észrevétel módszerünk kiindulópontja. A 2. a) ábra általánosan mutatja a problémát. Jó lenne, ha a letakart, szürkével jelzett számok egyikét sem lehetne rekonstruálni a többiből. 2. ábra. Az általános probléma a)
10 5 10 12 10
b)
10 6 12 5 8
4 13 8 13 4
12 7 1 1 9
2 6 12 15 14
6 12 13 9 13
14 4 14 76 1 7 16 73 6 16 3 81 2 5 13 75 2 7 10 77
2 7 10 60
6 13 7 68
15 8 9 62
7 8 4 9 5 13 69 7 11 15 11 7 9 88 15 14 13 1 15 5 89 78 80 85 46 66 83
13
5 12
13 26
17
18 2
14
11
24
13
A szürke cellák tartalmának egyértelműségéhez elegendő vizsgálni a 2. b) ábrát, a többi szám nyilván redundáns. Amint az később látható lesz, az összeseneket rögzítve, a letakart hat cella mindegyike felvehet több értéket, azonban ha a 11-est tartalmazó cellát nem takarnánk le (ekkor a 24 és 13 összesen értékek helyett rendre 13 és 2 állna), akkor a többi cella csupán egyetlen értéket vehetne fel, azt, amelyet tartalmaz. Valójában a hat cellából bármelyiket felfedve, a másik öt egyértelműen adódik. A b) ábra ráadásul már tükrözi azt a geometriai szemléletet, amelyet alkalmazni fogunk, ugyanis hamarosan kiderül, hogy a b) ábrán megmaradt számok is érdektelenek: csak a cellák egymáshoz viszonyított helyzetétől függ, hogy tartalmuk egyértelmű-e vagy sem – bármilyen összesenek esetén. Egyelőre nem teszünk megkötéseket a letakart cellák tartalmának előjelére. Ezt majd a 4. fejezetben tesszük meg. A továbbiakban a nagyon egyszerű tételek esetében „Tétel” helyett „Állítás”-t írunk. Bizonyításuk többnyire kimondásukkal „egy lélegzetre” történik. A többi tétel bizonyítását viszont elhagytuk (ezek megtalálhatók Faragó [2010]-ben), egyetlen kivétellel: a 6. Tétel érdekes bizonyítása a Függelékben található. A következő definíció a 2. b) ábrán is látható cellahalmaz-kitöltéseket, és az azokhoz tartozó peremeket (összeseneket) formalizálja. 1. Definíció. Egy adott méretű m × n-es táblázat ( m, n > 1) cellahelyeiből vagy röviden celláiból álló halmazokat fogunk vizsgálni, azaz az
X = {( u , v ) : u = 1, 2,..., m; v = 1, 2,..., n}
Statisztikai Szemle, 91. évfolyam 10. szám
953
Védett táblázatok morfológiája
halmaz részhalmazait. Egy A ⊆ X cellahalmaz kitöltése celláinak valós számokkal való feltöltése, azaz a következő függvény: f A : A → R. Az f A (a) (a ∈ A) valós szám az a cella értéke. Gyakran elhagyjuk a felső indexet, ha A egyértelműen adott. Az A cellahalmaz egy f A kitöltésének peremoszlopa, illetve peremsora (a „sor és oszlop összesenek”) az egy sorba, illetve oszlopba eső értékek összegéből álló egy-egy vektor. A belőlük álló P = ( P1 , P2 ) rendezett pár az f A kitöltés pereme. P 0 peremű, ha zérusvektorokból áll. Természetesen bizonyos cellahalmazokra bizonyos összesenek semmilyen kitöltésnek nem peremei, mások meg többnek is. Mi a másokat kedveljük. Hiszen ha egy peremhez egy cellának több különböző értéke is tartozik, akkor a cellahalmaz letakarásakor e cella értéke nem rekonstruálható. Ezentúl cellahalmaz alatt letakart cellákból álló halmazt értünk. Vizsgálatunk annak eldöntésére irányul, hogy vannak-e egy ilyen halmaznak a letakarás ellenére rekonstruálható elemei, és ha igen, melyek ezek. Továbbá, hogy milyen tulajdonságúak, és hogyan ismerhetők fel a „védett” cellahalmazok, azaz amelyeknek nincsenek rekonstruálható elemei. Most definiáljuk a legfontosabb fogalmat, mely az 1. Állítással kiegészítve a cella értékének rekonstruálhatatlanságát fejezi. Az 1. Állítás szerint egy letakart cellahalmaz valamely cellájának értéke vagy rekonstruálható, vagy nem, függetlenül a táblázatba írt számoktól. 2. Definíció. Az a ∈ A cella védett a P perem mellett, ha van A-nak legalább két P peremű kitöltése úgy, hogy a különbözőképpen van kitöltve.
A következő állításból kiderül, hogy a védelem mindig „univerzális”. 1. Állítás. Ha az a ∈ A cella védett valamely P perem mellett, akkor bármely másik P’ perem mellett is. Valóban, legyen f1 és f 2 két P peremű kitöltése A-nak, melyekre f1 (a ) ≠ f 2 (a ) , továbbá legyen valamely g1 kitöltés pereme P′ ≠ P.
Akkor g 2 = g1 + f 2 − f1 is P’ peremű kitöltés, mivel f 2 − f1 0 peremű, és nyilván g 2 (a) ≠ g1 (a) . Értelmes tehát a következő – a 2. Definícióval ekvivalens – definíció.
Statisztikai Szemle, 91. évfolyam 10. szám
954
Faragó Miklós
2’. Definíció. Az a ∈ A cella védett, ha van A-nak legalább két azonos peremű kitöltése úgy, hogy a különbözőképpen van kitöltve. Azt is mondjuk ilyenkor, hogy az A cellahalmaz védi a-t. Az A cellahalmaz védi B egy részhalmazát, ha B minden celláját védi. Ha tehát a-t védi A, és az X táblázatban A-t „letakarjuk”, akkor a-t nem lehet egyértelműen kiszámítani semmilyen peremből. 2. Állítás. Az a ∈ A cella akkor és csak akkor védett, ha létezik Anak 0 peremű kitöltése úgy, hogy a helyére egy 0-tól különböző számot írunk. Ha van ilyen szám, akkor bármely más 0-tól különböző számmal is kielégíthető a feltétel. Valóban, ha f1 és f 2 a 2’. Definícióban szereplő két kitöltése Anak, azaz megegyező pereműek, és f1 (a) ≠ f 2 (a) , akkor f = c( f1 − f 2 ) /[ f1 (a) − f1 (a)] ( c ∈ R ) egy 0 peremű kitöltés, melyre f ( a ) = c. Fordítva pedig, ha f egy 0 peremű kitöltése A-nak, melyre f (a) ≠ 0 , akkor bármely c ≠ 1 -re cf is 0 peremű kitöltése A-nak és cf (a) ≠ f (a). 3. Definíció. Az A cellahalmaz védett, ha minden eleme védett.
Ez azt jelenti, hogy letakarásával egyik eleme sem számítható ki a peremből. A 3. ábra két cellahalmazának összes eleme védett egy kivétellel, a ?-lel jelölt cellák ugyanis egyetlen értéket vehetnek csupán fel, akárhogyan töltjük ki a többit. Például bármely 0 peremű kitöltése esetén, ha a *-gal jelölt cella értéke c, akkor a **-gal jelölté csak –c lehet, tehát a ? helyére mindig csak 0 kerülhet. A 3. a) ábra ?lel jelölt cellájának értéke triviálisan rekonstruálható, hiszen a cella függőleges irányban „huzatos”. A 3. b) ábra halmaza a legegyszerűbb példa huzatos elemet nem tartalmazó halmazra, melynek mégis van rekonstruálható cellája. 3. ábra. Védett és védetlen cellák a)
− c **
?
b)
*c
**
?
c
−c
−c
c
Statisztikai Szemle, 91. évfolyam 10. szám
*
c −c
955
Védett táblázatok morfológiája
Nyilvánvalók továbbá a következő állítások: 3. Állítás. Ha az a cella egyedüli A-beliként áll egy sorban vagy oszlopban, akkor nem védett. Tehát kell, hogy legyen még vele egy sorban és egy oszlopban is egy-egy cella.
Sőt, ezeket is védeni kell, ezért: 4. Állítás. Legalább 4 cellából kell állnia A-nak ahhoz, hogy legyen védett eleme. 5. Állítás. Ha a ∈ A védett, akkor a-t bármely A-nál bővebb cellahalmaz is védi. Ha a-t védi A, de b-t ( b ∈ A ) nem védi, akkor A {b} A is védi a-t.
Az állítás első feléből következik: 6. Állítás. Védett cellahalmazok uniója is védett, mert ha A és B egyaránt védi minden saját elemét, akkor az 5. Állítás miatt A ∪ B is védi őket. 4. Definíció. Téglalapnak nevezzük azt a cellanégyest, amelynek elemei pontosan két sorba és két oszlopba esnek. Téglalaprácsnak nevezzük azt a kl cellából álló ( k , l > 1) cellahalmazt, amelynek elemei k számú sorban és l számú oszlopban helyezkednek el. 4. ábra. Téglalap és téglalaprács a)
b)
7. Állítás. Minden téglalap és téglalaprács védett.
Tekintsük ugyanis egy téglalap egy kitöltését. Ekkor, ha két átlósan elhelyezkedő cella értékét egy tetszőleges c-vel megnöveljük, a másik kettőét pedig c-vel csökkentjük, akkor a perem nem változik. Egy téglalaprács is védett, mivel téglalapok uniója. A téglalap általánosításaként bevezetünk egy alapvető cellahalmaz típust. 5. Definíció. Egy A cellahalmaz ciklus, ha cellái a1 , a1 ,..., a n
( an +1 = a1 )
ismétlődés nélküli sorozatba rendezhetők úgy, hogy bár-
mely egymást követő (ai , ai +1 , ai + 2 ) elemhármasára Statisztikai Szemle, 91. évfolyam 10. szám
( i = 1,..., n − 1)
956
Faragó Miklós
fennáll, hogy ai és ai +1 egy sorban (oszlopban) van, ai +1 és ai + 2 pedig egy oszlopban (sorban). Ha nem kötjük ki an +1 = a1 -et, akkor az A cellahalmaz út a1 és a n között. Azaz a ciklus egy gráfnak tekinthető, mégpedig egy olyan körnek, amelynek egymást követő élei – melyek az egymást követő cellákat kötik össze – a táblázatban merőlegesek egymásra. 5. ábra. Ciklusok a)
b)
1. Tétel. Ha egy cellahalmaz ciklus, akkor védett.
Bizonyítás: Legyen adott A egy f1 kitöltése, azaz adottak az f1 (ai ) értékek
( ai ∈ A, i = 1,..., n ) .
Most konstruálunk egy másik ugyanolyan peremű kitöltését A-
nak, amely minden ai -hoz egy másik értéket rendel. Adjunk hozzá A értékeihez – a kör mentén haladva – váltakozva c-t és f 2 (ai ) = f1 (ai ) + c(−1)
i +1
,
( i = 1,..., n ) .
− c -t (c > 0), azaz legyen
Könnyen látható, hogy az előjelváltás a
„megérkezéskor” is érvényes, azaz f 2 (a1 ) = f1 (a1 ) + c és f 2 (an ) = f1 (an ) − c . És mivel A peremoszlopának minden eleme f 2 (a2 k +1 ) + f 2 (a2 k + 2 ) alakú kifejezések – azaz f1 (a2 k +1 ) + f1 (a2 k + 2 ) + c − c értékűek – összegeként áll elő (ha például vízszintesen indultunk el a1 -ből), tehát a peremoszlop (és hasonlóan a peremsor) értéke megegyezik a két kitöltés esetén. 6. Definíció. Az A cellahalmaz f kitöltése tökéletes kitöltése A-nak, ha 0 peremű, és minden cellaérték 0-tól különböző: f (a) ≠ 0 , ∀a ∈ A .
Most megadjuk a védett halmazok első karakterizációját, bár ez még nem az ígért geometriai. A következő két tétel a kettőnél magasabb dimenziókban is érvényes. Statisztikai Szemle, 91. évfolyam 10. szám
957
Védett táblázatok morfológiája
2. Tétel. Egy A cellahalmaz akkor és csak akkor védett, ha van tökéletes kitöltése. 7. Definíció. Egy védett cellahalmaz minimális védett cellahalmaz, ha nincs védett valódi részhalmaza. 3. Tétel. Egy védett cellahalmaz akkor és csak akkor minimális védett cellahalmaz, ha minden tökéletes kitöltése egyetlen tökéletes kitöltés skalárszorosa. 8. Definíció. Az A és B cellahalmazokat független cellahalmazoknak nevezzük, ha A elemei „nem látják” B elemeit, azaz nincs olyan a ∈ A és b ∈ B, amelyek egy sorba vagy egy oszlopba esnek. Egy cellahalmaz összefüggő, ha nem bontható fel független cellahalmazok uniójára.
Független cellahalmazok tehát diszjunktak is. Nyilvánvaló, hogy az A cellahalmaz akkor és csak összefüggő, ha bármely két cellája között van A celláiból álló út. (Lásd az 5. definíció végét.) 9. Definíció. Egy cellahalmazt páros cellahalmaznak nevezünk, ha az X táblázat minden sorából és oszlopából páros számú elemet tartalmaz. 8. Állítás. Minden ciklus konstrukciójából adódóan összefüggő és páros.
A következő tétel azt mutatja, hogy a „ciklus” és a „páros” tulajdonság lényegében ekvivalensek. 4. Tétel. Egy cellahalmaz akkor és csak akkor páros, ha előáll diszjunkt ciklusok uniójaként. Tehát minden páros halmaz védett.
A következő definíció a legegyszerűbb ciklustípust definiálja, melyről kiderül, hogy „bázis” tulajdonságokkal is rendelkezik, ugyanis minden ciklus felbontható ilyenek uniójára, sőt az is kiderül, hogy ezek éppen a minimális védett cellahalmazok. 10. Definíció. Ha egy ciklus minden sora és oszlopa pontosan két elemet tartalmaz, akkor a ciklus C 2 típusú. Statisztikai Szemle, 91. évfolyam 10. szám
958
Faragó Miklós
Megjegyzés: minden C 2 típusú ciklus alkalmas sor- és oszlopcserékkel lépcső alakú ortogonális sokszögekbe vihető. (A 6. a) ábra ciklusa például az 5. a) ábra lépcsőjébe.) 6. ábra. Lépcső és ciklus lépcsőkre bontása a)
b)
5. Tétel. Egy ciklus akkor és csak akkor bontható fel két diszjunkt ciklus uniójára, ha nem C 2 típusú.
Azaz minden nem C 2 típusú ciklus felbontható C 2 típusúak uniójára, amelyek már nem bonthatók további ciklusok uniójára. A 6. b) ábra ciklusa például két téglalapra bontható. Megjegyzés: Ha egy ciklusból elhagyunk egy ciklust, nem biztos, hogy a megmaradt rész is ciklus, azonban a maradék nyilván diszjunkt ciklusok uniója, hiszen páros cellahalmazból párosat vettünk el. Következmény. A minimális védett cellahalmazok pontosan a C 2 típusú ciklusok.
A következő, a védettségre szükséges és elégséges feltételt adó tétel a legfontosabb eredmény, ugyanis geometriailag jellemzi a védett cellahalmazokat, ami lehetővé teszi felismerésüket és a rájuk történő bővítést. 6. Tétel. (felbontási/karakterizációs tétel) Egy táblázat valamely cellahalmaza akkor és csak akkor védett, ha előáll ciklusok uniójaként. (Bizonyítás: a Függelékben.) Következmény 1. Egy cellahalmaz akkor és csak akkor védett, ha előáll C 2 típusú ciklusok uniójaként. (Az 5. Tétel alapján.)
Tehát a védett cellahalmazok „tulajdonképpeni lépcsők” uniói (lásd a 10. Definíció utáni megjegyzést). Statisztikai Szemle, 91. évfolyam 10. szám
959
Védett táblázatok morfológiája
A felbontási tétel meglepő következménye a védett halmazok újabb karakterizációja (bizonyítás nélkül): Következmény 2. Egy A cellahalmaz akkor és csak akkor védett, ha van egész értékű tökéletes kitöltése.
A különböző tulajdonságú védett cellahalmazok hierarchiáját összefoglalja a következő következési séma: téglalap ⇒ téglalaprács ⇒ ⇒ C2 halmaz ( ⇔ minimális védett cellahalmaz ⇔ lényegében egy tökéletes kitöltése van) ⇒ ⇒ ciklus ( ⇔ diszjunkt C2 halmazok uniója, összefüggő) ⇒ ⇒ páros cellahalmaz ( ⇔ diszjunkt C2 halmazok uniója) ⇒ ⇒ védett cellahalmaz ( ⇔ C2 halmazok uniója ⇔ van tökéletes kitöltése)
3. A bővítési eljárás Az eddigiek alapján könnyen lehet gyors és „nem túl pazarló” algoritmusokat előállítani a bővítési feladat megoldására, azaz egy tetszőleges A cellahalmaz védett cellahalmazokká bővítésére. Például lefedve őket téglalapok uniójával vagy egy páros halmazzal, illetve a kettő kombinációjával. Ezek ráadásul gyorsan kódolható eljárások. Van-e azonban gyors algoritmus a bővítési probléma optimális megoldására, azaz a másodlagosan letakart cellák számának minimalizálására? Egy ilyen optimális algoritmus egyben eldönti, hogy A védett-e, ugyanis ha az optimális bővítés maga az A halmaz, akkor védett, egyébként nem. Gusfield [1987] adott először optimális algoritmust a bővítési feladatra, gráfelméleti eszközökkel. Felismerte ugyanis, hogy egy kétdimenziós táblázat cellahalmazai kölcsönösen egyértelműen megfeleltethetők páros gráfoknak, speciálisan a védett cellahalmazok – a ciklusok uniói – a kétszeresen élösszefüggő páros gráfoknak. A „gráfkapcsolatot” a Függelékben mutatjuk be, majd ott fogalmazzuk meg az előállt optimális gráfbővítési feladatot és adjuk meg rövid leírását. Az elsődlegesen védendő cellák minimális számú másodlagos letakarással történő védelme tehát már két dimenzióban is számítógépet (és gráfelméletet) igényel, azonban a karakterizációs 6. tétel geometriai megfogalmazása lehetőséget nyújt egy kisebb méretű táblázatok védelmének optimális vagy legalábbis optimumközeli „kézi” megoldására. Statisztikai Szemle, 91. évfolyam 10. szám
960
Faragó Miklós
Az eljárás (és nem algoritmus, mert intuitív lépéseket is igényel) így foglalható össze: 1. meg kell találni a letakart cellák alkotta ciklusokat, 2. a cikluson kívülieket „be kell kötni” a ciklusokba, minél kevesebb új cella letakarásával. Az eljárást a következő példán mutatjuk be. A 7. ábrán a szürkével jelzett cellákat akarjuk elsődlegesen letakarni. A cél olyan ciklusokat találni, amelyeknek minél több szürke cella az eleme (sarokcellája). Látható, hogy két cella, a keretezett 90 és 32 értékű kivételével mindegyik cella eleme valamely ciklusnak. Tehát ez és csak ez a két cella védetlen. Egyetlen cella (a körrel jelzett) felvételével, azaz egy új cella letakarásával azonban ezek is bevonhatók egy harmadik ciklusba, amelynek negyedik cellája a 85 értékű cella. Ezzel tehát minden szürke cella védetté válik, az újjal együtt. 7. ábra. Egy példa az optimális bővítésre 52
25
48
60
48
9
65
24
33
43
36
89
34
38
90
49
17
68
66
66
57
1
85
66
4
67
99
0
1
66
89
23
59
95
77
4
32
49
28
65
47
18
76
27
72
39
77
31
21
43
72
80
42
85
89
26
39
19
32
19
15
8
87
86
46
89
12
31
74
34
52
65
28
29
49
51
69
35
95
88
61
80
34
7
64
12
15
1
58
35
77
73
85
42
15
19
22
35
20
20
73
43
59
78
95
20
40
61
35
19
3
84
8
30
4
8
89
61
52
65
32
27
57
15
18
68
57
17
25
34
10
34
21
89
96
57
87
54
0
60
59
18
32
73
3
48
61
85
7
50
17
73
2
24
61
47
52
25
48
60
48
9
65
24
33
43
36
89
52
25
48
60
48
9
65
24
33
43
36
89
34
38
90
49
17
68
66
66
57
1
85
66
34
38
90
49
17
68
66
66
57
1
85
66
4
67
99
0
1
66
89
23
59
95
77
4
4
67
99
0
1
66
89
23
59
95
77
4
32
49
28
65
47
18
76
27
72
39
77
31
32
49
28
65
47
18
76
27
72
39
77
31
21
43
72
80
42
85
89
26
39
19
32
19
21
43
72
80
42
85
89
26
39
19
32
19
15
8
87
86
46
89
12
31
74
34
52
65
15
8
87
86
46
89
12
31
74
34
52
65
28
29
49
51
69
35
95
88
61
80
34
7
28
29
49
51
69
35
95
88
61
80
34
7
64
12
15
1
58
35
77
73
85
42
15
19
64
12
15
1
58
35
77
73
85
42
15
19
22
35
20
20
73
43
59
78
95
20
40
61
22
35
20
20
73
43
59
78
95
20
40
61
35
19
3
84
8
30
4
8
89
61
52
65
35
19
3
84
8
30
4
8
89
61
52
65
32
27
57
15
18
68
57
17
25
34
10
34
32
27
57
15
18
68
57
17
25
34
10
34
21
89
96
57
87
54
0
60
59
18
32
73
21
89
96
57
87
54
0
60
59
18
32
73
3
48
61
85
7
50
17
73
2
24
61
47
3
48
61
85
7
50
17
73
2
24
61
47
Statisztikai Szemle, 91. évfolyam 10. szám
961
Védett táblázatok morfológiája
Az eljárást leírjuk egy kicsit részletesebben. A 0. lépést praktikus kiegészítésként iktattuk be. Látható, hogy egy statisztikai hivatal bármely dolgozója, papíron, számolás nélkül képes végrehajtani. START A kiinduló állapot: Adottak (valamilyen szabály, például a dominancia szabály alapján) az elsődlegesen védendő/letakarandó cellái a táblázatnak. 0. lépés. Megjelöljük az „érinthetetlen” cellákat (a 7. ábrán ilyenek nincsenek): azokat, amelyeket nem akarunk később, másodlagosan sem letakarni, mert valamiért fontosnak tartjuk őket. 1. lépés. Minél több olyan ciklust keresünk, amelynek minden (sarok-!) cellája védendő cella. Az ilyen ciklusok cellái biztosan védettek letakarás esetén. Szerencsés esetben megtaláltuk az összes ilyen ciklust, és ekkor a többi védendő cella (a 7. ábrán a két keretezett) biztosan védetlen. 2. lépés. Ha maradtak még védendő cellák a ciklusokon kívül, akkor új ciklusokat kell keresni, melyeknek sarkaiban ezek ülnek, a többi sarokban pedig már védettek vagy új, másodlagosan letakarandó cellák vannak, utóbbiak minél kisebb számban, ráadásul ezeket nem választhatjuk az érinthetetlen cellák közül. E lépést a végállapot bekövetkezéséig ismételgetjük. A végállapot: Ha a kezdetben kijelölt, elsődlegesen védendő cellák, és az újonnan, a 2. lépésben másodlagosan kijelöltek mindegyike sarokcellája valamelyik ciklusnak, akkor minden letakart cella védett, azaz az eljárásnak VÉGE Megjegyzés: A végállapot eléréséhez esetleg fel kell oldani bizonyos cellák érinthetetlenségét. Ha nincs érinthetetlen cella, akkor a végállapot biztosan bekövetkezik, ugyanis a teljes táblázat védett halmaz, hiszen téglalaprács. Az eljárás finomítható: az érinthetetlenség különböző szintjeit vezethetjük be – a letakarással előállt információveszteségnek vagy egyéb szempontoknak megfelelően – amelyeket fokozatosan feloldhatunk, ha a 2. lépésben túl sok másodlagos letakarásra támad szükség. Szerencsés esetben optimális megoldást találhatunk, azaz minimális számú cellát takarunk le másodlagosan. Az itt bemutatott példa megoldása – egyetlen új másodlagosan elnyomott cellával – nyilván optimális.
Statisztikai Szemle, 91. évfolyam 10. szám
962
Faragó Miklós
4. Nemnegatív táblázatok Az eddigiekben nem vettük figyelembe, hogy a táblázatok az esetek túlnyomó részében kizárólag nemnegatív számokat tartalmaznak, pedig ez a tény a behatoló kezére játszik. Eddig egy letakart cellahalmaz cellája vagy egyetlen olyan értéket vehetett fel (a letakartat), mely kielégítette a peremeket, ellenkező esetben, azaz ha védett volt, felvehette értékül az összes valós számot. Előjel megkötés esetén azonban egy letakart cella lehetséges értékei mindig egy véges intervallumba esnek, melynek mindkét végpontja nyilvánvalóan 0 és az érintett sor-, illetve oszlopösszesen minimuma közé esik. Ha e két végpont egybeesik, akkor a cella védetlen. Megjegyezzük, hogy amennyiben a táblázat ráadásul csak egész számokat tartalmaz, akkor már az is egyértelművé teszi a letakart cella értékét, ha a két végpont különbsége kisebb egynél. Természetesen minél tágabb a lehetséges értékek intervalluma, annál pontatlanabb a behatolónak a cella tartalmára vonatkozó becslése. A lehetséges intervallumok növelése (például cellánként előírt értékekre) a másodlagosan elnyomott elemek alkalmas megválasztásával azonban már egy másik problémakör, nem tárgya e cikknek. Mindenesetre a behatoló megtalálhatja a lehetséges értékintervallumok végpontjait, és így a védetlen cellák pontos értékét is, ha minden letakart cellára megold két LP-feladatot: a cella értékét jelölő egyetlen változóból álló célfüggvényt maximalizálja, illetve minimalizálja. (A mellékfeltételek a sor-, illetve oszopösszesenekre vonatkozó egyenletek.) Ahhoz, hogy egy letakart cella értéke növelhető legyen változatlan perem mellett, egy másik letakart cella értékének csökkennie kell. Az eddigi eredményeink alkalmazása tehát akkor ütközik akadályba, ha a letakart cellák között egynél több 0 értékű van, és az egyik növelése épp a másik csökkentésével érhető csak el. (Ez az a pillanat, amikor dolgozatunkban a cellák tartalma először jelentőséget kap.) Ekkor olyan cellák, melyek az előjelmegkötés nélkül védettnek bizonyultak – nem csak a 0 értékűek –, védetlenek lehetnek. A karakterizációs tétel feltételei csupán szükséges feltételei lesznek a halmaz védettségének. A nemnegatív táblák védettségére vonatkozó szigorúbb szükséges és elégséges feltételt a 7. tétel és következménye fogalmazza meg. A védettség definíciója változatlan (2’. és 3. Definíció), csak már tudjuk, hogy a védett cella lehetséges értékei egy véges intervallumba esnek. A következő alapvető definíció a ciklus fogalmának általánosítása nemnegatív táblázatokra. 11. Definíció. Egy ciklus kitöltése helyes paritású (röviden: a „ciklus helyes paritású”), ha vagy legfeljebb egy zérust tartalmaz, vagy a ciklus körüljárásakor bármely két egymást követő zérus értékű cella közé páratlan számú nemzérus értékű ékelődik.
Statisztikai Szemle, 91. évfolyam 10. szám
963
Védett táblázatok morfológiája
A 8. ábra négy helyes paritású ciklust tartalmaz. A bal alsó téglalapja nem tartalmaz zérus értékű cellát, a jobb alsó egyet tartalmaz. A szaggatott vonallal jelölt téglalap kettőt, a nyolc cellából álló folytonos vonallal jelölt ciklus pedig hármat. 7. Tétel. Egy nemnegatív értékű cellákat tartalmazó táblázatban egy letakart A halmaz cellája akkor és csak akkor védett, ha eleme legalább egy A-beli helyes paritású ciklusnak.
Az elégségesség könnyen belátható. Legyen C tetszőleges részciklusa A-nak. Jelölje C0 a C ciklus egyik minimális értékű eleméből és C tőle indított körüljárásakor érintett minden második elemből álló halmazt (bármelyik irányban, hiszen C páros halmaz). A minimális értéket jelölje a, C \ C0 ben pedig b ≥ a . Vegyük észre, hogy b > 0 ekvivalens azzal, hogy C helyes paritású ciklus. Ha C0 -ban minden cella értékéhez hozzáadunk egy [ −a, b ] -be eső tetszőleges rögzített számot, a C \ C0 -
beli cellák értékeiből pedig levonjuk ugyanezt, és az A halmaz C -n kívüli celláinak értékét változatlanul hagyjuk, akkor A pereme változatlan marad. Tehát C elemei védettek b > 0 esetén, azaz ha C helyes paritású. Látható, hogy ha [ −a, b ] hossza legalább 1 (tehát már a ≥ 1/2-re is), akkor C összes cellája legalább két egész értéket felvehet változatlan perem mellett: pontosan ⎢⎣ a + b ⎥⎦ + 1 számút, ekkor tehát C az egész számok körében is védett. A szükségesség bizonyítása (gráfelméleti eszközökkel) megtalálható Gusfield [1988]-ban. Következmény. (Nemnegatív felbontási/karakterizációs tétel.) Egy nemnegatív értékű cellákat tartalmazó táblázat A cellahalmaza akkor és csak akkor védett, ha előáll helyes paritású ciklusok uniójaként.
Az elégségesség nyilvánvaló: ha A helyes paritású ciklusok uniója, akkor bármelyik ciklusán elvégezve a fenti két transzformáció közül a megfelelőt, A többi celláját változatlanul hagyva, a ciklus elemeinek értéke megváltozik, A elemei nemnegatívak maradnak, változatlan perem mellett. Tehát A összes eleme védett. A szükségesség következik Gusfield [1988] bizonyításából. A 8. ábra összes letakart (szürke) cellája előáll négy helyes paritású ciklus uniójaként, tehát védett halmazt alkot. A 9. ábra kizárólag 0 értékű cellákból álló halmazok optimális letakarását mutatja. Feltételezzük, hogy a többi cella értéke pozitív.
Statisztikai Szemle, 91. évfolyam 10. szám
964
Faragó Miklós
8. ábra. Példa az optimális bővítésre nemnegatív táblázat esetén
52
25
48
60
48
9
65
24
33
43
36
89
34
38
90
49
17
68
66
66
57
1
0
66
4 32
67 49
99 28
0 65
1 47
66 18
89 76
23 27
59 72
95 39
77 77
4 31
21
43
0
80
42
85
89
26
39
19
32
19
15
8
87
86
46
89
12
31
74
34
52
65
28
0
49
51
69
35
95
88
61
80
34
7
64 22
12 35
15 20
1 20
58 73
35 43
77 59
73 78
85 95
42 20
15 40
19 61
35
19
3
84
8
30
4
0
89
61
52
65
32
27
57
15
18
68
57
17
25
34
10
34
21
89
96
57
87
54
0
60
59
18
32
0
3
48
61
85
7
50
17
73
2
24
61
47
9. ábra. Néhány speciális eset
0
0
0
0
0
0 0
0
0
0
0
0
A 7. tételből kiderül, hogy nemnegatív táblák esetén egy letakart A halmaz elemeinek védett vagy védetlen mivolta ugyanaz, mint előjelmegkötés nélkül, ha e cellák mind határozottan pozitív értéket tartalmaznak, vagy egyetlen zérus értékű cella van közöttük. Ha viszont van közöttük egynél több, abban az esetben a cellák, és így A védettsége akkor sem függ a (nem zérus értékű) cellák tartalmától, csupán – mint eddig is – A „alakjától” és a zérus értékű cellák elhelyezkedésétől. A tétel következménye, hogy a bővítési eljárás nemnegatív táblázat esetén így módosul: 1. meg kell találni a letakart cellák alkotta helyes paritású ciklusokat, 2. az azon kívüli letakart cellákat „be kell kötni” e ciklusokba vagy új helyes paritású ciklusokba, minél kevesebb új cella letakarásával.
Statisztikai Szemle, 91. évfolyam 10. szám
965
Védett táblázatok morfológiája
És hasonlóan, az eljárás részletesebb leírásában is a „ciklus” szó minden előfordulása „helyes paritású ciklus”-ra cserélendő.
Függelék a) A 6. Tétel bizonyítása 6. Tétel. (Felbontási/karakterizációs tétel.) Egy táblázat valamely A cellahalmaza akkor és csak akkor védett, ha előáll ciklusok uniójaként. Bizonyítás. Mivel a ciklusok védett halmazok, és mivel védett cellahalmazok uniója védett cellahalmaz, ezért elég belátni, hogy egy védett A cellahalmaz minden celláját tartalmazza A-nak valamely részciklusa (vagy képszerűen: átmegy rajta egy ciklus). Sőt elegendő belátni a következő lemmát. LEMMA: Ha a-t védi A, akkor a-t tartalmazza A-nak egy részciklusa. Tegyük fel, hogy a nem eleme A egyetlen ciklusának sem. Ekkor legyen A1, illetve A2 az a-tól különböző összes olyan A-beli cellák halmaza, melyek az a-val egy oszlopba, illetve egy sorba eső cellákból (ilyenekből a 3. Állítás szerint legalább egy-egy van) elérhetők olyan úttal, amely nem tartalmazza a-t. Ekkor az összefüggő A′ = A1 ∪ A2 ∪ {a} ⊆ A a feltétel szerint három diszjunkt halmaz uniója, ahol A1 és A2 függetlenek is, mivel ellenkező esetben a-t tartalmazná egy ciklus. Könnyű elképzelni – bár a bizonyításhoz nem szükséges –, hogy A′ sor- és oszlopcserékkel az F1. ábrán látható helyzetbe hozható (a két téglalap A1 és A2 „téglalap burkát” jelöli, a „határcellákat” feltüntettük, a „belső” cellákat nem; A A′ nem látszik az ábrán, hiszen nincs szerepe). Ha most belátjuk, hogy A′ minden 0 peremű f kitöltésére f (a ) = 0, akkor a 2. Állítás szerint A′ nem védi at, tehát A sem védi (mivel A A′ és A′ függetlenek) és így igaz a lemma. Legyen tehát f egy 0 pe-
remű kitöltése A′-nek. Ekkor az A1 halmaz a-val egy oszlopba eső elemeinek értékösszege s = 0 , hiszen ez az érték előáll úgy, hogy A1 elemei sorösszegeinek (mind 0) összegéből kivonjuk az a-t nem tartalmazó oszlopok oszlopösszegeit (mind 0). Mivel f 0-peremű kitöltés, így s + f (a) = 0 is fennáll, azaz f (a ) = 0. Tehát a lemma és így a tétel is igaz. F1. ábra. A bizonyítás szemléltetése 0
0
0
0
0
0
0
0
A1
A2
a
Statisztikai Szemle, 91. évfolyam 10. szám
0
0
0
0 0 0 0 0 0 0 0 0 0
966
Faragó Miklós
b) Kapcsolat gráfokkal
Most megmutatjuk, hogy az eddig bevezetett fogalmak és kimondott állítások átfogalmazhatók gráfelméleti fogalmakká és állításokká. Amint a 3. pontban is utaltunk rá, a „gráfkapcsolat” nem csupán matematikai objektum, jelentősége abban áll, hogy a cellahalmaz bővítési feladat optimális megoldására így már ismert gráfelméleti tételek és algoritmusok állnak rendelkezésünkre. Gusfield [1987] és Faragó [2010] lényegesen különböző, lineáris idejű algoritmusa (utóbbit alább vázoljuk röviden) egyaránt gráf bővítési feladatot old meg. Egy táblázat A cellahalmazaihoz kölcsönösen egyértelműen páros gráfok rendelhetők úgy, hogy a celláknak éleket feleltetünk meg: 12. Definíció. Feleltessük meg egy táblázat A cellahalmazának a GA = GA(U,V,E) páros gráfot, ahol U és V diszjunkt nemüres halmazok a következő tulajdonságokkal: Álljon U azon ui elemekből (pontokból), amelyek a táblázat i-edik sorának felelnek meg, feltéve, ha az tartalmaz A-beli cellát. Hasonlóan, V álljon az A-beli cellákat tartalmazó oszlopoknak megfeleltetett vj pontokból. Az élek E halmazát pedig definiálja a következő: ui és vi között pontosan akkor van él, ha a táblázat i-edik sorának j-edik eleme A-beli cella. Azt mondjuk, hogy GA az A cellahalmaz gráfja.
Világos, hogy GA nem tartalmaz izolált pontot, továbbá, hogy A akkor és csak akkor áll elő egy táblázatbeli B halmazból a táblázaton végrehajtott elemi sor-, illetve oszlopcserék valamely sorozatával, ha GA és GB izomorf gráfok. 12. Állítás. Közvetlenül GA definíciójából adódik, hogy az alábbiak ekvivalensek: a) az A cellahalmaz összefüggő; b) GA összefüggő gráf.
Minden gráf egyértelműen felbontható maximális (tovább nem bővíthető) összefüggő, páronként független komponensek uniójára. Ismert gráfelméleti tétel (például Hajnal [2003]) a következő: egy G gráf valamely e éle akkor és csak akkor nem éle egyetlen G-beli körnek sem, ha e-t elhagyva a gráfból, a kapott gráfnak több komponense lesz, mint G-nek. Ekkor e-t hídélnek nevezik. Ha az összefüggő, legalább három szögpontú G gráfnak minden éle valamely körnek éle („körél”), akkor G-t kétszeresen élösszefüggőnek nevezik. Belátható, hogy a következő három állítás ekvivalens: a) G kétszeresen élösszefüggő; b) G-nek nincs hídéle; c) G bármely két pontját összeköti két út, amelyeknek nincs közös éle. Mivel az A-beli C2 halmazoknak a GA gráf körei felelnek meg és fordítva, ezért a felbontási tétel szerint: 13. Állítás. Egy A halmaz akkor és csak akkor védett, ha GA minden éle körél. Ekkor GA páronként független, kétszeresen élösszefüggő komponensekre bontható.
Az F2. ábra páros gráfjának (páros, ugyanis csúcsai kétszínezhetők) szaggatottal jelzett hídélei védetlen celláknak felelnek meg az eredeti táblázatban, a többi él körél, tehát valamely védett cella képe.
Statisztikai Szemle, 91. évfolyam 10. szám
967
Védett táblázatok morfológiája
F2. ábra. Komponensekre bontás
Érdemes felsorolni az A cellahalmaz és a neki megfeleltetett GA gráf néhány egymásnak megfelelő „objektumát”. Emlékeztetünk arra, hogy egy gráf vonala nem tartalmazhat élismétlődést, egy útja vagy egy köre pedig még pontismétlődést sem. Táblázatok halmazai
(páros) Gráfok
Cellahalmaz (a táblázatban)
Páros gráf
Cella
Él
Cellák száma az i-edik sorban
ui fokszáma
Páros halmaz
Minden fokszám páros a gráfban
Ciklus (mindig páros)
Zárt vonal (mindig páros fokszámú pontokból áll)
C2 típusú halmaz
Kör (fokszám ≡ 2)
Téglalaprács
Teljes gráf
Független halmazok
Független gráfok
Összefüggő halmaz
Összefüggő gráf (bármely két pont között van út)
Összefüggő páros halmaz
Összefüggő Euler-gráf
⇔ van zárt Euler vonala
(minden fokszám páros) Védett cella /nem védett cella Védett halmaz
Körél/hídél
Hídélmentes gráf ⇔ minden éle körél
Érdekes analógia, hogy a 4. Tétel annak a klasszikus gráfelméleti tételnek a „táblázat nyelvi” megfelelője, hogy „egy gráfban akkor és csak akkor van zárt Euler-vonal, ha minden csúcs fokszáma páros.” c) A kétdimenziós táblák optimális másodlagos cellaelnyomását végző algoritmus rövid leírása
1. Először előállítjuk az elsődlegesen letakarásra kijelölt cellahalmazhoz tartozó G páros gráfot, melyről feltesszük, hogy összefüggő (azaz ősképe összefüggő cellahalmaz), ellenkező esetben öszszefüggő komponensenként elvégezzük a továbbiakat. Ezután pontjait beszínezzük két szín, mondjuk a zöld és kék egyikével úgy, hogy él csak különböző színű pontokat köthet össze. Ez megtehető páros gráfokkal. A cél olyan algoritmust adni, amely G-be úgy húz be eme „színszabály” betartásával minimális számú élt, hogy a kapott páros gráfban minden él körél lesz.
Statisztikai Szemle, 91. évfolyam 10. szám
968
Faragó Miklós
2. Meghatározzuk G kétszeresen élösszefüggő alkomponenseit (ezek védett cellákhoz tartozó éleket tartalmaznak, lásd az F2. ábrát), melyeket „összehúzzuk” egy-egy ponttá. Azaz az új T(G) gráfban minden pont egy-egyértelműen megfelel G egy (esetleg egy pontból álló) alkomponensének, és a pontok közt pontosan akkor húzunk élt, ha a megfelelő alkomponensek között volt (híd-) él. T(G) egy fa. Ez lineáris időben megoldható (Cormen–Leiserson–Rivest [1999]). A valóban összehúzott, azaz egynél több pontból álló alkomponensekből (ezek legalább két kék és két zöld pontot tartalmaznak) keletkezett T(G)-beli pontok színe legyen kékesszöld, a többi pont pedig örökölje G-beli színét. T(G)-re tehát egy általánosított színszabály teljesül: kék pont kékkel, zöld pont zölddel nincs összekötve. (Kékeszöld pont hiányában a két színszabály ugyanazt jelenti.) 3. Nyilván elegendő most már a T(G) fát minimális számú él behúzásával kétszeresen élösszefüggővé bővíteni – a színszabály betartásával. Megjegyzés: fontos észrevenni, hogy T(G) minden leveléből, azaz elsőfokú pontjából ki kell indulnia egy újonnan behúzott élnek ahhoz, hogy T(G) minden éléből körél legyen. A fabővítő algoritmust nem részletezzük (lásd Faragó [2010]), de belátható, hogy max(|K|,|Z|) új él behúzása elegendő, ahol K és Z a fa kék, illetve zöld leveleinek halmaza, és ennyi mindig szükséges – ha nincsenek kékeszöld levelek. Ha vannak, akkor némi korrekció szükséges. Belátható, hogy az algoritmus O ( V + E ) futásidejű, ahol V és E a G gráf csúcsainak és éleinek a száma, ezen belül a 3. lépés futásideje O ( T ) , ahol T a fa mérete (pontjainak vagy éleinek száma). Tehát a futásidő az elsődleges letakarásra kijelölt pontok számának lineáris függvénye, azaz a leggyorsabb algoritmus osztályba esik. d) Magasabb dimenziós táblák F3. ábra. Háromdimenziós táblázatok a) általános
b) békából királyfi
Egy háromdimenziós táblázat síkmetszetenkénti kétdimenziós táblákból áll. (Lásd az F3. a) ábrát.) Az összesenek három oldallapon helyezkednek el. Az F3. b) ábra poliéderének minden sarokcellája le van takarva, kivéve egyet, a körrel jelölt „köldökcellát”. A tábla mindhárom irányú síkmetszetei kizárólag lépcsőket tartalmaznak (a három „hátsó” lap L alakú, van még három téglalap,
Statisztikai Szemle, 91. évfolyam 10. szám
969
Védett táblázatok morfológiája
és három „8-as”), azaz a saját síkjukon belül védett cellákat. Mégis minden (!) sarokcella rekonstruálható az összesenekből. Ha ugyanis a sarokcellák halmazának tökéletes kitöltéséhez (2. Tétel) például az egyik „+”-szal jelölt cellának c ≠ 0 értéket adunk, akkor a 0 perem kikényszeríti a többi cella c vagy –c értékét is, az ábra előjeleinek megfelelően. Mégis lesz három – a „köldökcellát” tartalmazó – sor, melynek összesenje –2c, azaz nincs tökéletes kitöltés, sőt, a 0 peremhez minden cellának 0 értéket kell kapnia, azaz minden cella felfedhető. Ha azonban a „köldökcellát” is letakarjuk, 2c értéket adva neki, előáll a tökéletes kitöltés. Ekkor tehát már egyik cella értéke sem (!) egyértelmű – a békából királyfi lesz. A kettőnél magasabb dimenziókban a védett halmazok geometriai karakterizálása ez idáig nem történt meg, azonban belátták (Irving–Jerrum [1994]), hogy a (rájuk való) bővítésre nem létezik polinomiális idejű algoritmus. Tehát maradnak a lassú megoldások, mint amilyen az Argus egészértékű programozási módszere.
Irodalom CORMEN, T. H. – LEISERSON, C. E. – RIVEST, R. L. [1999]: Algoritmusok. Műszaki Kiadó. Budapest. ESWARAN, K. P. – TARJAN, R. E. [1976]: Augmentation Problems. SIAM Journal on Computing. Vol. 5. No. 4. pp. 653–665. FARAGÓ M. [2010]: Táblázatok adatvédelme és gráf optimalizáció. Szigma. XLI. évf. 3–4. sz. 99– 120. old. FISCHETTI, M. – SALAZAR, J. J. [2000]: Models and Algorithms for Optimizing Cell Suppression Problem in Tabular Data with Linear Constraints. Journal of the American Statistical Association. Vol. 95. No. 451. pp. 916–928. FRANK, A. [2006]: Edge-Connection of Graphs, Digraphs, and Hypergraphs. In: Győri, E. – Katona, G. – Lovász, L. (eds.): More Sets, Graphs and Numbers. Bolyai Mathematical Society Math. Studies 15. Springer Verlag. pp. 93–142. GABOW, H. N. [2000]. Path-Based Depth-First Search for Strong and Biconnected Component. Information Processing Letters. Vol. 74. pp. 107–114. GUSFIELD, D. [1987]: Optimal Mixed Graph Augmentation. SIAM Journal on Computing. Vol. 16. No. 4. pp. 599–612. GUSFIELD, D. [1988]: A Graph Theoretic Approach to Statistical data Security. SIAM Journal on Computing. Vol. 17. No. 3. pp. 552–571. HAJNAL, P. [2003]: Gráfelmélet. Polygon Kiadó, SZTE Bolyai Intézet. Szeged. STATISTICS NETHERLANDS [2010]: Handbook on Statistical Disclosure Control. http://neon.vb.cbs.nl/casc/handbook.htm IRVING, R. W. – JERRUM, M. R. [1994]: Three-Dimensional Statistical Data Security Problems. SIAM Journal on Computing. Vol. 23. No. 1. pp. 170–184. TARJAN, R. E. [1972]: Depth-First Search and Linear Graph Algorithms. SIAM Journal on Computing. Vol. 1. No. 2. pp. 146–160. TSAN-SHENG HSU – MING-YANG KAO [2005]: Optimal Augmentation for Bipartite Componentwise Biconnectivity in Linear Time. SIAM Journal on Discrete Mathematics. Vol. 19. No. 2. pp. 345–362.
Statisztikai Szemle, 91. évfolyam 10. szám
970
Faragó: Védett táblázatok morfológiája
Summary The most difficult problem of statistical disclosure control is the secondary suppression of cells in a table to be released. Though a set of sensitive cells of published two-dimensional tables are “covered” by the data providers, the content of some of these suppressed cells might be computed using the available cell values and the sums of rows and columns. We call a set of cell locations protected, if none of the exact cell values can be uniquely computed. When a set is not protected, we consider the problem of suppressing the fewest additional cells to protect the sensitive cells. Gusfield [1988] and others solved the optimization problem by establishing a bijection between the sets of cell locations and bipartite graphs. They gave a linear time algorithm for the corresponding graph augmentation problem: making a bipartite graph edge-biconnected by adding a minimum number of new edges. In this article the author gives several necessary and sufficient conditions for being protected, explores the hierarchy of protected sets and their interesting geometric properties. Based on these properties, he describes a very simple practical method a statistician can use to solve the optimal augmentation problem in two-dimensional tables of usual size without using a computer.
Statisztikai Szemle, 91. évfolyam 10. szám
A modern bayesi elemzések eszköztára és alkalmazása* Kehl Dániel PhD, a Pécsi Tudományegyetem adjunktusa E-mail:
[email protected]
Várpalotai Viktor PhD, a Nemzetgazdasági Minisztérium főosztályvezetőhelyettese, a Pécsi Tudományegyetem tudományos főmunkatársa E-mail:
[email protected]
A tanulmány a modern bayesi elemzések eszköztárának egyik leggyakrabban alkalmazott elemét, a Gibbs-mintavételt mutatja be. Az elméleti alapok, majd az algoritmus bemutatása után rövid számszerű példa illusztrálja az eljárást, valamint a konvergencia gyorsaságát. A gyakorlati felhasználást egy klasszikus, jól ismert feladat bayesi eszköztár segítségével történő megoldása mutatja be, amely egyben lehetőséget teremt a klasszikus szemlélettel közös és attól eltérő eredmények, illetve előnyök és hátrányok bemutatására is. TÁRGYSZÓ: Bayes. Ökonometria. MCMC.
* A tanulmány a TÁMOP 4.2.2.C-11/1/KONV-2012-0005 sz. („Jól-lét az információs társadalomban” című) pályázat támogatásával készült. Írásunk korábbi változataihoz fűzött számos értékes észrevételéért köszönetet mondunk Hunyadi László professzornak és a Statisztikai Szemle lektorának. Statisztikai Szemle, 91. évfolyam 10. szám
972
Kehl Dániel — Várpalotai Viktor
A
bayesi statisztika és ökonometria az utóbbi évtizedekben széles körben elterjedt, egyre intenzívebben alkalmazott,1 hatékony elemzési eszköztárrá gyarapodott. A bayesi statisztika és ökonometria növekvő alkalmazásának több oka van. Az elméleti egyszerűség mellett egyfelől számos kiváló kézikönyv2 jelent meg az utóbbi évtizedben, amelyek a bayesi elemzések gyakorlati alkalmazásához szükséges ismerteket gyűjtik össze, másfelől a számítógépes véletlenszám-generálás területén bekövetkezett módszertani fejlődés ledöntötte a bayesi eszköztár gyakorlati alkalmazhatóságának korlátait. A bayesi elemzések egyre növekvő száma, valamint az ezzel járó ismeretterjesztő hatás azzal is párosult, hogy a hagyományos (más néven frekventista vagy klasszikus) és bayesi statisztika szembenállása napjainkra enyhült. A legtöbb kutató véleménye, hogy vannak problémák, melyek esetén a klasszikus vagy a bayesi megközelítés célravezetőbb, így optimális az lenne, ha a statisztikával foglalkozó kutatók mindkét megközelítéssel tisztában lennének (Casella [2007], Hunyadi [2011]). Sajnos egyelőre kevés olyan szakember van, aki mindkét módszertanban elmélyült ismeretekkel rendelkezik, cikkünk ezen is próbál változtatni, a bayesi szemlélet népszerűsítésével. A bayesi elemzések egy rendkívül egyszerű összefüggésen, a Bayes-tételen alapulnak, a megközelítés filozófiájáról, alapfogalmairól a témakörben nem elmélyült Olvasó Hunyadi [2011] művében és az irodalomjegyzék tételeiben talál további értékes információt. A bayesi módszertanban a prior és a likelihood segítségével a (kvázi) poszterior előállítása nem okoz problémát, hiszen ehhez csupán egy szorzást kell elvégezni. Az igazi problémát a poszteriorban (sokváltozós együttes sűrűségfüggvényben) rejlő (marginális) információ kinyerése jelenti. Ezzel el is érkeztünk a módszer egyik fő sajátosságához, annak számításigényességéhez, hisz az ehhez szükséges integrálás gyakran analitikusan nem, csak numerikusan végezhető el. A felhasznált numerikus módszerek ugyan ismertek voltak, legalábbis alapjaikban már korábban is (Metropolis et al. [1953]), nagy lendületet azonban a számítógépek, valamint az egyszerűbb programozási nyelvek elterjedése adott a területnek a 80-as évek második felében és a 90-es évek elején.3 Jelen cikkünk első részében 1
A bayesi statisztika növekvő népszerűségét a bayesi tanulmányok számának növekedése is jól mutatja a nemzetközi szakirodalomban (Várpalotai [2008]). 2 A kézikönyvek közül kiemelünk néhányat, melyeket jelen tanulmány elkészítése és egyéb bayesi kötődésű munkáink során felhasználtunk (Albert [2009], Congdon [2005], Gelman et al. [2004], Geweke [2005], Koop [2003], Koop et al. [2007], Robert–Casella [2004]). 3 Ma a leggyakrabban alkalmazott, bayesi statisztikát (is) támogató szoftverek a MATLAB, az R, valamint a BUGS (Bayesian inference Using Gibbs Sampling) különböző verziói, mint a WinBUGS és az OpenBUGS.
Statisztikai Szemle, 91. évfolyam 10. szám
A modern bayesi elemzések eszköztára és alkalmazása
973
az ún. Markov-lánc Monte-Carlo (Markov Chain Monte Carlo – MCMC) forradalom egyik „zászlóshajóját”, a Gibbs-mintavételt, valamint konvergenciájának intuícióját mutatjuk be röviden, majd a második részben egy olyan példát, amelynél a klasszikus és bayesi ökonometriai elemzés jellegét tekintve hasonlít egymásra, ugyanakkor míg a klasszikus elemzéssel a paraméterbecslés egzakt bizonytalansága csak körülményesen határozható meg, addig a bayesi elemzésben ez egyszerűen kiszámítható.
1. Markov-lánc Monte-Carlo-módszerek Az MCMC-módszerek napjainkra a legfontosabb, leggyakrabban használt algoritmusok közé kerültek (Hunyadi [2011]), sikertörténetükről, fejlődésükről rövid öszszefoglalót ad Casella és Berger [2011],4 illetve megemlítjük Metropolis et al. [1953], Hastings [1970], Geman és Geman [1984], valamint Gelfand és Smith [1990] alapvető jelentőségű tanulmányait. A MCMC-módszerek célja, hogy mintát tudjunk venni egy (jellemzően összetett, többdimenziós) sűrűségfüggvénnyel adott, akár ismeretlen valószínűség-eloszlásból. Szakítva a független azonos eloszlású véletlen értékeket generáló algoritmusokkal, az MCMC-technikák közös jellemzője, hogy olyan Markov-lánco(ka)t állítanak fel, melyek egyensúlyi eloszlása megegyezik a kívánt eloszlással. Ezután minden lépés utáni állapotot a céleloszlásból származó mintaelemnek tekintünk, amik azonban a Markov-tulajdonság miatt nem lesznek függetlenek. A Markov-lánc konstruálása jellemzően nem okoz különösebb nehézséget, a gyakorlati alkalmazások esetén a probléma inkább a konvergencia megállapításában rejlik. A Gibbs-algoritmus lehetővé teszi a bonyolult, sokdimenziós problémák lebontását kisebb, egyszerűbb feladatokra, Markov-láncok felhasználásával. A megoldandó probléma egy együttes eloszlás (a poszterior) marginális eloszlásainak (az egyes paraméterek), jellemzőinek meghatározása. A legkézenfekvőbb eljárás az együttes eloszlás integrálása lenne, ez azonban sok esetben analitikusan nem oldható meg. Szintén lehetséges numerikus integrálási módszereket alkalmazni, magas dimenziószámban, ez azonban nehézkes és lassú. Ilyen esetekben nyújthat segítséget a Gibbs mintavételi technika, ami lehetőséget ad a kívánt együttes eloszlásból való mintavételre, méghozzá indirekt módon, a feltételes eloszlások segítségével. A módszert leggyakrabban a bayesi megközelítés használja, de összetett likelihoodokkal kapcsolatos számítások esetén a klasszikus statisztikában is alkalmazható. 4
Magyar nyelvű ismertetését lásd a Statisztikai Szemle hasábjain (Kehl [2012]).
Statisztikai Szemle, 91. évfolyam 10. szám
974
Kehl Dániel — Várpalotai Viktor
1.1. Markov-láncok néhány fontos tulajdonsága, jelölések Elsőként röviden tekintsük át a Markov-láncok azon jellemzőit, melyek az MCMC-módszerek szempontjából jelentőséggel bírnak. A véges ( k ) állapotterű diszkrét Markov-lánc egy speciális sztochasztikus folyamat t ≥ 0 indexszel, amely X 0 indulási érték, kezdeti állapot után X 1 , X 2 ,… , X t ,… állapotokba kerül, ha
P ( X t +1 = a X = b ) = P ( X t +1 = a X t = bt ) minden ( a , b ) párra és t ≥ 0 -ra, ahol X = ( X 0
X1 … X t ) a megelőző és a jelen ál-
lapotok vektora és b = ( b0 b1 … bt ) . Mindez azt jelenti, hogy a következő állapot alakulása csak a jelenlegi állapoton múlik, a múltbeli állapotok nem befolyásolják azt. Ha ezek a feltételes valószínűségek időben állandók, azokat gyakran jelöljük a pba = P ( X t +1 = a X t = b ) módon, melyeket kézenfekvő egy ún. átmenetmátrixba rendezni: ⎡ p11 ⎢p P = ⎢ 21 ⎢ ⎢ ⎣ pk 1
p12 p22
… …
pk 2 …
p1k ⎤ p2 k ⎥⎥ . ⎥ ⎥ pkk ⎦
Az átmenetmátrix definíciójából következik néhány tulajdonsága: négyzetes, minden eleme nemnegatív, illetve minden sora egy feltételes eloszlás, azaz sorösszegei egyet adnak,5 a b. sor a. oszlopa a b állapotból a állapotba kerülés valószínűségét mutatja meg. Az átmenetmátrix segítségével meghatározható az egylépéses átmenetek mellett a többlépéses átmenetek valószínűsége is, méghozzá m lépés esetén P m módon, amely mátrix sorai X t + m feltételes eloszlásait adják meg adott X t állapotok mellett. Az átmenetek valószínűségei mellett szólnunk kell a kezdeti állapotok valószínűségét leíró vektorról ( v ) , kezdeti eloszlásról is, hiszen a Markov-lánc együttes eloszlásának meghatározásához az átmenetmátrixon kívül erre is szükségünk van. Az együttes eloszlásból pedig meghatározható a t. időpont marginális eloszlása, méghozzá vP t módon. Markov-láncok esetén létezik olyan speciális kezdeti eloszlás, mely teljesíti a vP = v egyenlőséget, az ilyen vektorokat a Markov-lánc egyensúlyi eloszlásának hívjuk. 5
Az ilyen mátrixokat sztochasztikus mátrixoknak nevezzük.
Statisztikai Szemle, 91. évfolyam 10. szám
A modern bayesi elemzések eszköztára és alkalmazása
975
Bizonyos esetekben ez a speciális kezdeti eloszlás egyedi és fontos tulajdonságokkal rendelkezik (DeGroot–Schervish [2012]): ha létezik olyan m , melyre P m valamennyi eleme szigorúan pozitív,6 akkor – a Markov-lánc egyetlen v egyensúlyi eloszlással rendelkezik, – lim Pt egy olyan mátrix, melynek minden sora v , és t →∞
– függetlenül attól, hogy a Markov-lánc milyen kezdeti eloszlásból indul, t lépés után az eloszlása v -hez tart, ahogy t → ∞ . A harmadik pont különösen fontos, hiszen azt mondja, hogy bárhonnan indítva a láncot, azt elegendően hosszú ideig futtatva a t. lépésben kapott érték tulajdonképp egy v -ből származó véletlen változó. Mindezek végtelen állapottérrel rendelkező Markov-láncokra is igazak, a Gibbs-mintavétel pedig tulajdonképp ezt használja ki úgy, hogy olyan Markov-láncot állít fel, melynek egyensúlyi eloszlása épp a generálni kívánt eloszlás. A módszert és a konvergencia intuícióját előbb egy könnyen átlátható diszkrét példán mutatjuk be, majd ezután az általános algoritmust adjuk meg.
1.2. Kétváltozós Gibbs-mintavétel Tekintsünk elsőként egy egyszerű, kétváltozós esetet, az ( X , Y ) együttes eloszlást. A Gibbs-mintavétel X marginális eloszlásból úgy vesz mintát, hogy magát a marginális eloszlást nem, csupán az X Y és az Y X feltételes eloszlásokat használja, méghozzá a következő módon. Adott y0 kezdeti érték segítségével váltakozva generálunk az X i ∼ f1 ( x Yi = yi ) , Yi +1 ∼ f 2 ( y X i = xi )
/1/
eloszlásokból, ahol f1 (.) és f 2 (.) a megfelelő feltételes eloszlások sűrűségfüggvényei. Ebben a véletlen számokból álló „Gibbs-sorozatban” elég nagy k esetén X k = xk egy f ( x ) -ből származó mintaelemnek tekinthető. A legegyszerűbb esetben X és Y is bináris valószínűségi változók a következő együttes eloszlással (a példa Casella–George [1992] tanulmánya alapján készült): 6
Amennyiben a Markov-lánc irreducibilis (az állapotok egymásból kölcsönösen elérhetők, azaz kommunikálnak egymással), aperiodikus, véges állapotterű, akkor létezik ilyen m. Az ilyen Markov-láncokat gyakran ergodikusnak nevezik.
Statisztikai Szemle, 91. évfolyam 10. szám
976
Kehl Dániel — Várpalotai Viktor
X Y
0
1
0
p00
p01
1
p10
p11
ahol a valószínűségek egyre összegződnek. Természetesen a marginális eloszlások ebben az egyszerű esetben triviálisan adódnak, azt kívánjuk illusztrálni, hogy csak a feltételes eloszlások segítségével is generálhatók olyan véletlen értékek, melyek eloszlása pontosan a kívánt peremeloszlás. A feltételes eloszlásokat sztochasztikus mátrixokkal írhatjuk le:
Ay x
⎡ p00 ⎢p + p 00 10 =⎢ ⎢ p01 ⎢ ⎣ p01 + p11
p10 ⎤ ⎡ p00 ⎥ ⎢p + p p00 + p10 01 ⎥ , illetve A = ⎢ 00 xy ⎢ p10 p11 ⎥ ⎥ ⎢ p01 + p11 ⎦ ⎣ p10 + p11
p01 ⎤ p00 + p01 ⎥ ⎥. p11 ⎥ ⎥ p10 + p11 ⎦
/2/
A két mátrix egy-egy Markov-lánc átmenetmátrixa, melyek azt mutatják meg, hogy adott x állapotból milyen valószínűséggel jutunk adott y állapotba. Jellemzően azonban nem ezekre a valószínűségekre, hanem adott x állapotból egy újabb x állapotba kerülés valószínűségére vagyunk kíváncsiak vagy épp ugyanerre az y -ra vonatkozóan. Ezek a lépések nem közvetlenül, hanem a másik változón keresztül történnek meg, de könnyen meghatározhatjuk az egylépéses átmenet-valószínűségeket, méghozzá
Ax x = Ay x Ax y , illetve Ay y = Ax y Ay x
/3/
formában. A többlépéses átmenetmátrixok pedig a /3/-ban meghatározott mátrixok megfelelő hatványaiként állíthatók elő. A Markov-láncok tulajdonságainál említett tétel szerint pedig ahogy k → ∞ a k . állapot eloszlása épp a marginális eloszlás lesz. Könnyen beláthatóan a marginális eloszlás kielégíti a vP = v
(f A x
xx
)
= f x Ay x Ax y = f x feltételt, azaz a Markov-lánc egyensúlyi eloszlása:
[ p00 + p10
⎡ p00 ⎢p + p 00 10 p01 + p11 ] ⎢ ⎢ p01 ⎢ ⎣ p01 + p11
p10 ⎤ ⎡ p00 p00 + p10 ⎥ ⎢ p00 + p01 ⎥⎢ p11 ⎥ ⎢ p10 ⎥⎢ p01 + p11 ⎦ ⎣ p10 + p11
p01 ⎤ p00 + p01 ⎥ ⎥= p11 ⎥ ⎥ p10 + p11 ⎦
= [ p00 + p10
p01 + p11 ].
Statisztikai Szemle, 91. évfolyam 10. szám
977
A modern bayesi elemzések eszköztára és alkalmazása
A 2 × 2 -es mátrixhoz hasonlóan írható fel az általánosabb, de továbbra is csupán két változót tartalmazó, n × m -es eset, ahol egy rövid számpéldán keresztül a konvergenciát mutatjuk be. Legyen az együttes eloszlás például: ⎡ 0,10 ⎢0, 20 ⎢ ⎢ 0,10 ⎢ ⎢ 0,01 ⎢⎣ 0,05
0,15 0,10 0,01 0,01 0,05
0,05 0 ⎤ 0 0,02 ⎥⎥ 0,01 0,07 ⎥ , ⎥ 0,04 0 ⎥ 0,03 0 ⎥⎦
/4/
amiből a /2/ és /3/ képlettel analóg módon képezhető az Ax x egylépéses átmenetmátrix: ⎡0,504 ⎢0, 433 Ax x = ⎢ ⎢0,309 ⎢ ⎣ 0,548
0,301 0,399 0,336 0,110
0,087 0,137 0,327 0,041
0,107 ⎤ 0,031⎥⎥ . 0,028⎥ ⎥ 0,300 ⎦
Az átmenetmátrix hatványainak elemeit az 1. ábra mutatja be k függvényében, a vízszintes vonalak a marginális valószínűségeket reprezentálják, a különböző jelzések a különböző induló állapotokból adott állapotba jutás valószínűségeit mutatják. 1. ábra. Az egyes állapotokba kerülés valószínűsége k lépés után az egyes kezdeti állapotokból
k
k
k
k
Statisztikai Szemle, 91. évfolyam 10. szám
978
Kehl Dániel — Várpalotai Viktor
Az ábra alapján az látható, hogy néhány lépés után, bárhonnan is indítjuk útjára a Markov-láncot, annak a valószínűsége, hogy egy adott állapotba jutunk, éppen az adott állapot marginális valószínűsége, illetve az, hogy ebben az egyszerű példában a konvergencia rendkívül gyors. Természetesen ez a példa csupán az intuíciót kívánja bemutatni. Bizonyítani nem kívánjuk, csupán megemlítjük, hogy „folytonos állapottér esetén a Markov-láncok matematikája sokkal összetettebb, de hasonlóan kell elképzelni a folyamatot egy végtelen átmenetmátrixszal” (Casella–George [1992]).
1.3. Többváltozós Gibbs-mintavétel Tegyük fel, hogy X = ( X 1 , X 2 ,… , X p ) véletlen vektorváltozó, ahol az X j -k egyvagy többdimenziós komponensek (blokkok), valamint azt is, hogy képesek vagyunk a következő f1 , f 2 ,… , f p feltételes sűrűségfüggvényekkel adott eloszlásokból véletlen számo(ka)t generálni, ismerjük, azaz ismert eloszlásként azonosítani tudjuk a
(
)
f j x j x1 , x2 ,…, x j −1 , x j +1 ,…, x p ,
/5/
ún. teljes feltételes (full conditional) eloszlásokat minden j = 1, 2,… , p -re. Ekkor a Gibbs-algoritmus:7 1. Válasszunk X( ) = x( 0
0)
kezdőértékeket ( m = 0 ) .
2. Ismételjük a következő lépéseket, amíg a lánc az egyensúlyi eloszlásához nem konvergál:
( ) ∼ f (x ) ∼ f (x
a) X 1(
m +1)
b) X 2(
m +1
c) X 3( m +1 d) …
∼ f1 x1 x2( ) , x3( ) ,… , x(p 2
2
3
3
(
m
x1( x1(
m +1)
m +1)
m)
m
).
). ) ,… , x ( ) ) .
, x3( ) ,… , x(p m
, x2(
m +1
m)
m p
)
e) X (pm +1) ∼ f p x p x1( m +1) , x2( m +1) ,… , x(pm−1+1) . f) Növeljük m értékét. 3. A konvergencia előtti értékeket (burn in period) levágva a lánc elejéről megkapjuk a kívánt eloszlásból származó véletlen mintát. 7 Érdemes megjegyezni, hogy az algoritmus nagyon hasonlít az egyenletrendszerek megoldására alkalmas Gauss–Siedel iterációs eljáráshoz.
Statisztikai Szemle, 91. évfolyam 10. szám
979
A modern bayesi elemzések eszköztára és alkalmazása
Az átláthatóság érdekében m felsőindexként szerepel, azaz x(j
m)
a j. komponens
m. lépésben (iterációban) felvett értékét jelöli. Az algoritmus jelentősége rögtön
(
)
szembetűnő, amennyiben azt az f θ1 ,θ 2 ,… ,θ p y poszterior sűrűségfüggvényre írjuk fel. Bár első látásra az összes feltételes eloszlás ismerete erős feltételezésnek tűnik, de megfelelő (konjugált) priorok választása esetén a gyakorlatban használt ökonometriai modellek túlnyomó részénél (például lineáris regresszió, vektor autoregresszív modellek, látens változós modellek) az összes feltételes eloszlás beazonosítható, azok könnyen generálhatók. Miután a lánc konvergált (az ehhez szükséges gyenge feltételeket lásd Gelfand– Smith [1990]) az m∗ lépésben, egy újabb lépés a kívánt együttes eloszlásból származó véletlen értékként tekinthető. A szükséges számú ( M ) véletlen érték generálására több eljárás létezik. Az első lehetőség, hogy az algoritmust m∗ + 1. lépésig futtatjuk M alkalommal, minden esetben megtartva az utolsó értéket. Sokkal gyakrabban alkalmazott technika, hogy a láncot hagyjuk futni m∗ + M lépésig, majd a konvergenciáig szükséges iterációk eredményeit elhagyva kapjuk a szükséges számú mintaelemet. Az első eljárás hátránya, hogy lassú, hiszen az összes iteráció száma magas, a másodiké pedig az, hogy a véletlen értékek autokorreláltak lesznek. Ennek kivédésére szokás a lánc csak minden r. értékét megtartani, ezzel csökkentve ezt a negatív hatást, ekkor m∗ + rM iteráció szükséges. Ezen eljárás szakirodalmi elnevezése thinning vagy ritkítás. A konvergencia megállapítása nem egyszerű feladat. Geweke [1992] egyetlen Markov-láncon alapuló, idősor-elemzési eszköztárra támaszkodó diagnosztikai módszert javasol. Alapötlete, hogy a sorozat elejének (például az értékek első 10 százalékának) és végének (például az értékek 50 százalékának) átlagait hasonlítja össze. Gelman és Rubin [1992] módszere több lánc különböző kezdő értékekről való indításával, majd láncokon belüli és láncok közötti varianciák összehasonlításával dolgozik. Szintén gyakori a láncok egymás utáni értékeinek ábrázolása (trace), kumulatív módon számolt átlagok állandóságának, valamint a generált véletlen értékek alapján becsült sűrűségfüggvények vizuális vizsgálata. Cowles és Carlin [1996] a ’90-es évek nagy MCMC hullámának 13 diagnosztikai eszközét elemzi jellegük, az igényelt láncok száma, elméleti hátterük, alkalmazhatóságuk és összetettségük szerint, következtetésükben pedig arra jutnak, hogy minden eszköznek vannak hátrányai, így érdemes több diagnosztikai eljárást alkalmazni. Mivel ezek a diagnosztikai eszközök nem tévedhetetlenek, így soha nem lehetünk biztosak benne, hogy a lánc ténylegesen konvergált-e a kívánt eloszláshoz, a gyakran használt ökonometriai modellek esetén azonban ez nem szokott problémát okozni, főként, ha a konvergenciát vizsgáló eszközök nem jeleznek problémát.
Statisztikai Szemle, 91. évfolyam 10. szám
980
Kehl Dániel — Várpalotai Viktor
2. Szívkoszorúér-megbetegedések miatti halálozás modellezése klasszikus és bayesi MCMC-eljáráson alapuló ökonometriai eszközökkel Ebben a részben bemutatjuk, hogy az előző fejezetben ismertetett MCMCmódszer miként használható az empirikus elemzésekben. A következő példa elsősorban a Gibbs mintageneráló algoritmus illusztrálására szolgál, de emellett arra is rámutat, hogy adott esetben a klasszikus ökonometria elemzési eszköze igen hasonló a bayesi elemzéseknél használt Gibbs mintavételi eljáráshoz. Míg azonban a klasszikus ökonometriai elemzés elsődlegesen pontbecsléseket szolgáltat, addig a bayesi ökonometriai eszköztárral a paraméterbecslés bizonytalansága is közvetlenül meghatározható.8 Választott példánk Ramanathan [2003] könyvének 4-7 számmal jelölt adatállományát használja, mely a szívkoszorúér-megbetegedések miatti halálozási rátát és annak lehetséges magyarázóváltozóit tartalmazza az 1947–1980 időszakra (34 megfigyelés).9 Azért választottuk ezt az adatállományt, mert a klasszikus és ökonometriai eszközök által szolgáltatott eredmények összevetésekor hivatkozni tudunk Ramanathan klasszikus ökonometriai számításaira. Az adatállomány változói (lásd Ramanathan [2003] 664. old.): – CHD: 100 000 főre jutó szívkoszorúér-megbetegedés miatt elhunytak száma, – CAL: egy főre jutó napi kálciumfogyasztás grammban, – UNEMP: munkanélküliek a 16 éves és idősebb munkavállalók százalékában, – CIG: egy főre jutó cigarettafogyasztás a 18 évesek és idősebbek körében (font), – EDFAT: egy főre jutó étkezési zsír- és olajfogyasztás (font), – MEAT: egy főre jutó húsfogyasztás (font), – SPIRITS: egy főre jutó égetettszesz-fogyasztás a 18 évesek és idősebbek körében (gallon), – BEER: egy főre jutó sörfogyasztás a 18 évesek és idősebbek körében (gallon), – WINE: egy főre jutó borfogyasztás a 18 évesek és idősebbek körében (gallon).
8 9
A bayesi elemzéshez felhasznált MATLAB-kódokat megkeresés esetén szívesen rendelkezésre bocsátjuk. Az adatok letölthetők a http://econweb.ucsd.edu/~rramanathan/XLDATA/DATA4-7.XLS címről.
Statisztikai Szemle, 91. évfolyam 10. szám
A modern bayesi elemzések eszköztára és alkalmazása
981
2.1. Autokorrelált hibatagú lineáris regressziós modell elemzése klasszikus ökonometriai eszközökkel A rendelkezésre álló összes változó felhasználásával felírt lineáris regressziós modellből a nem szignifikáns változók elhagyása után a következő, az információs kritériumok által is preferált modellváltozat adódott (Ramanathan [2003] 221. old.):
CHDt = β 0 + β1 ⋅ CIGt + β 2 ⋅ EDFATt + β3 ⋅ SPIRITSt + β 4 ⋅ BEERt + ut ,
/6/
ahol β0 a konstans, β i az egyes magyarázóváltozókhoz tartozó együttható, ut a modell hibatagja. A becslés eredményei a táblázatban találhatók. A lineáris regressziós modellben az eltérésváltozók a Lagrange multiplikátor próba alapján autokorreláltnak bizonyultak (Ramanathan [2003] 408. old.). A hibatagok autokorreláltságának következménye (lásd például Ramanathan [2003] 404. old.), hogy a legkisebb négyzetek módszerével becsült együtthatók bár továbbra is torzítatlanok és konzisztensek, de nem lesznek hatásosak. Továbbá az együtthatók becsült varianciái torzítottak és inkonzisztensek lesznek, így a hipotézisvizsgálatok is érvényüket vesztik. Ezek a következmények egyrészt azt jelentik, hogy a /6/ regresszió alapján tett megállapítás a becsült együtthatók nullától szignifikánsan különböző voltára önmagában érvénytelen. Másrészt célszerű olyan becslési eljárást alkalmaznunk, mint a Cochrane–Orcutt-féle iteratív eljárás,10 amely a hibatagok autokorreláltságának megfelelő figyelembe vételével a korábbi negatív következményeket kiküszöböli. Így a példában szereplő lineáris regresszió a hibatagok autokorreláltságát is szem előtt tartva a következőképpen írható fel:
CHDt = β 0 + β1 ⋅ CIGt + β 2 ⋅ EDFATt + β3 ⋅ SPIRITSt + β 4 ⋅ BEERt + ut , ut = ρ1ut −1 + ε t ,
/7/ /8/
ahol ε t hibatagról már feltehető, hogy autokorrelálatlan.11 A /7/–/8/ modell becslése a Cochrane–Orcutt-féle iteratív eljárással a következő:
1. Becsüljük meg a /7/ modellt a legkisebb négyzetek módszerével. 2. A becsült βˆi együtthatók segítségével számítsuk ki az uˆt reziduumokat az 10
A módszer leírását lásd például Dufour et al. [1980] vagy Ramanathan [2003] 469. old. A hibatag autokorreláltságának figyelembe vételéhez elegendő egy késleltetést szerepeltetni, mivel a tesztek szerint a becsült εt hibatag már autokorrelálatlan (Ramanathan [2003] 413. old.) 11
Statisztikai Szemle, 91. évfolyam 10. szám
982
Kehl Dániel — Várpalotai Viktor
uˆt = CHDt − βˆ0 − βˆ1 ⋅ CIGt − βˆ2 ⋅ EDFATt − βˆ3 ⋅ SPIRITSt − βˆ4 ⋅ BEERt kifejezés felhasználásával. 3. Az uˆt reziduumokra legkisebb négyzetek módszerével illesszük a /8/ modellt. 4. Az előző lépésben becsült ρˆ együttható segítségével definiáljuk CHDt∗ = CHDt − ρˆ ⋅ CHDt −1 változót, illetve ezzel analóg módon a CIGt∗ , EDFATt ∗ , SPIRITSt∗ és BEERt∗ idősorokat. Ezt követően, a ρˆ együtthatót adottnak véve, a legkisebb négyzetek módszerével becsüljük meg /7/ modellt, de az eredeti változók helyett mindenütt a csillagozott változókat használva: CHDt* = β0 ⋅ (1 − ρ ) + β1 ⋅ CIGt* + β 2 ⋅ EDFATt* + + β3 ⋅ SPIRITSt* + β 4 ⋅ BEERt* + ut . 5. Menjünk vissza a második lépéshez mindaddig, amíg a becsült együtthatók nem konvergálnak. Az iteráció eredményeként kapott βˆi és ρˆ együtthatók becslése továbbra is torzítatlan és konzisztens, illetve az együtthatók varianciái is konzisztensen meghatározhatók. A Cochrane–Orcutt-féle együtthatóbecslés eredményeit a táblázat második blokkja mutatja.12 Mint látható, a reziduumok autokorreláltságának figyelembe vétele érdemben megváltoztatta a pontbecsléseket miközben a standard hibák lényegesen nem módosultak. Az eredmények alapján a korábban szignifikánsnak tűnő együtthatók egy kivétellel (BEER) inszignifikánssá váltak.
2.2. Autokorrelált hibatagú lineáris regressziós modell elemzése bayesi ökonometriai eszközökkel A klasszikus ökonometria eredményeit követően a bayesi ökonometria MCMC családjába tartózó Gibbs mintavételi eljárással becsüljük meg a /7/–/8/ egyenletekkel adott modellspecifikáció együtthatóit.13 A tanulmány első részében bemutatott Gibbs-mintavétel alkalmazásához a priorok, a modell likelihoodja és a poszterior felírását követően meg kell határoznunk az együtthatók feltételes poszterior eloszlásait. Amennyiben – a klasszikus ökonometriai megközelítéshez hasonlóan – feltételezzük, hogy az ε t hibatagok normális eloszlásúak, akkor az ismeretlen együtthatók konjugált prior eloszlásai a következők.14 12
A közölt eredmények megegyeznek Ramanathan [2003] 413. oldalon leírt eredményével. Autoregresszív hibatagú lineáris modellek bayesi becsléséről lásd Chib [1993]. 14 Lásd például Koop [2003] 134. old. 13
Statisztikai Szemle, 91. évfolyam 10. szám
983
A modern bayesi elemzések eszköztára és alkalmazása
β ~ N ( B0 ,V0 ) ,
/9/
ρ ~ N ( R0 , W0 ) ,
/10/
σ 2 ~ IG ( S 0 , T0 ) ,
/11/
β1 β 2 β3 β 4 ]′ , σ 2 = Var ( ut ) . Továbbá N ( R0 , W0 ) (illetve N ( B0 , V0 ) ) jelöli az R0 ( B0 ) várható értékű és W0 (V0 ) variancia-kovarianciamátrixú
ahol β = [ β 0
(többváltozós) normális, IG ( S0 , T0 ) pedig az S0 lokációs paraméterű és T0 szabadságfokú inverz gamma eloszlást. A /7/–/8/ egyenletekkel adott modell likelihoodja, feltételezve, hogy ε t független azonos normális eloszlású:
(
f ( y, X | β , ρ , σ 2 ) = σ 2π
)
−T
′ ⎛ 1 ⎞ exp ⎜ − 2 ( y* ( ρ ) − X * ( ρ ) β ) ( y* ( ρ ) − X * ( ρ )β ) ⎟ , /12/ σ 2 ⎝ ⎠
ahol T a megfigyelések száma,15 y * ( ρ ) a CHDt* ( ρ ) = CHDt − ρ ⋅ CHDt −1 megfigyelésekből képzett oszlopvektor. y * ( ρ ) -vel analóg módon definiáljuk CIG* ( ρ ) , EDFAT * ( ρ ) , SPIRITS * ( ρ ) és BEER* ( ρ ) oszlopvektorokat a CIGt , EDFATt , SPIRITSt
és
BEERt
idősorokból. Ezek felhasználásával legyen
X ∗ (ρ )
a
X ( ρ ) = ⎡⎣1 CIG ( ρ ) EDFAT ( ρ ) SPIRITS ( ρ ) BEER ( ρ ) ⎤⎦ megfigyelésekből kép* t
*
*
*
*
zett T × 4 -es mátrix. Bayes tételét használva a poszterior a /9/–/11/ priorok és a /12/ likelihood felhasználásával a következő: f ( β , ρ , σ 2 | y , X ) ∝ f ( y , X | β , ρ , σ 2 ) f ( β ) f ( ρ ) f (σ 2 ) .
ges
/13/
A tanulmány függeléke alapján meghatározhatók a Gibbs mintavételhez szükséfeltételes poszterior eloszlások β | ρ , σ 2 , y , X ~ N ( B1 , V1 ) ,
ρ | β , σ 2 , y , X ~ N ( R1 , W1 ) , σ 2 | β , ρ , y , X ~ IG ( S1 , T1 ) , ahol B1 ,V1 , R1 ,W1 , S1 és T1 értékeit a Függelék /F8/, /F9/, /F12/, /F13/, /F15/ és /F16/ képletei határozzák meg.16 15
Esetünkben a késleltetések szerepeltetése miatt szükséges mintakorreció után T = 33. Vegyük észre, hogy a feltételes poszterior eloszlások azonos típusúak a megfelelő prior eloszlásokkal, azaz ténylegesen konjugált priorokkal dolgozunk. 16
Statisztikai Szemle, 91. évfolyam 10. szám
984
Kehl Dániel — Várpalotai Viktor
A Gibbs-algoritmus alkalmazása során a kezdeti értékek megadása után a bemutatott feltételes eloszlásokból kell ismételten véletlen mintát generálnunk.17 Az algoritmus lépései esetünkben a következők: 0 1. A kezdeti értékek legyenek ρ ( ) = 0 és σ ( ) = 1 . Legyen m = 0 . 2. Legyenek y * ρ ( m ) és X * ρ ( m ) elemei a következők: 2 0
( ) ( ) CHD ( ρ ( ) ) = CHD − ρ ( ) CHD m
* t
(
X t* ρ (
m
m)
3. Generáljunk
⎡ ⎢ CIGt ⎢ ⎢ = ⎢ EDFATt ⎢ ⎢ SPIRITSt ⎢ BEER t ⎣
)
t −1
1
t
⎤′ ⎥ m − ρ ( ) ⋅ CIGt −1 ⎥ ⎥ ( m) − ρ ⋅ EDFATt −1 ⎥ . ⎥ m − ρ ( ) ⋅ SPIRITSt −1 ⎥ m − ρ ( ) ⋅ BEERt −1 ⎥⎦ 1− ρ(
β ( m +1)
egy
m)
véletlen
vektort
a
β ρ ( m) ,σ 2( m) ~ N ( B1 ,V1 ) feltételes eloszlásból, ahol: −1
⎛ 1 1 m ′ m ⎞ ⎛ m ′ m ⎞ B1 = ⎜ V0−1 + 2( m ) X ∗ ρ ( ) X ∗ ρ ( ) ⎟ ⎜ V0−1 B0 + 2( m ) X ∗ ρ ( ) y ∗ ρ ( ) ⎟ , σ σ ⎝ ⎠ ⎝ ⎠
(
) (
)
(
) (
)
−1
⎛ 1 m ′ m ⎞ V1 = ⎜ V0−1 + 2( m ) X ∗ ρ ( ) X ∗ ρ ( ) ⎟ . σ ⎝ ⎠
(
) (
(
4. Legyenek u β (
(
ut β (
(
Ut β (
m +1)
m +1)
)
) és U ( β ( ) ) elemei a következők: m +1
) = CHD − β ( t
m +1)
0
⋅EDFATt − β 3(
m +1)
) = u ( β ( ) ).
− β1(
m +1)
m +1)
⋅ CIGt − β 2(
⋅ SPIRITSt − β 4(
m +1)
m +1)
,
⋅ BEERt ,
m +1
t −1
5. Generáljunk egy σ ( ) véletlen számot ( m +1) (m) σ |β , ρ ~ IG ( S1 , T1 ) feltételes eloszlásból, ahol: 2 m +1
a
2
17
A normális és inverz gamma eloszlásokból történő mintavételt a Függelék 2. pontjában ismertetjük.
Statisztikai Szemle, 91. évfolyam 10. szám
985
A modern bayesi elemzések eszköztára és alkalmazása
(
S1 = S0 + u ( β ( m +1) ) − U ( β ( m +1) ) ρ ( m )
′
) (u ( β
( m +1)
) −U (β
( m +1)
) ρ ), (m)
T1 = T0 + T .
6. Generáljunk
ρβ
( m +1)
,σ
2( m +1)
egy
ρ ( m +1)
véletlen
vektort
a
N ( R1 ,W1 ) feltételes eloszlásból, ahol: −1
⎛ 1 1 m +1 ′ m +1 ⎞ ⎛ m +1 ′ m +1 ⎞ R1 = ⎜ W0−1 + 2( m +1) U β ( ) U β ( ) ⎟ ⎜ W0−1 R0 + 2( m +1) U β ( ) u β ( ) ⎟ , σ σ ⎝ ⎠ ⎝ ⎠
(
) (
)
(
) (
−1
⎛ 1 m +1 ′ m +1 ⎞ W1 = ⎜ W0−1 + 2( m +1) U β ( ) U β ( ) ⎟ . σ ⎝ ⎠
(
) (
)
)
7. Tároljuk el a generált β ( m +1) , ρ ( m +1) és σ ( ) véletlen vektort és számokat, legyen m = m + 1 és menjünk vissza a 3. lépéshez. 2 m +1
A bayesi becslés megvalósításához az eredményeket alig vagy egyáltalán nem befolyásoló (nem informatív) priorokat választottunk:18 B0 = [ 0 0 0 0 0 ]′ , V0 = 100 I 5 , R0 = 0, W0 = 100, S0 = 0 és T0 = 0 .
Az iterációt a rendelkezésünkre álló adatokon 101 000-szer ismételtük, eredményeink az első 1 000 minta elhagyásával kapott 100 000-es mintán alapulnak. Az együtthatók poszterior eloszlását a 2. ábra hisztogramjai szemléltetik, illetve a poszterior eloszlás jellemző értékeiről a táblázat harmadik blokkja tartalmaz további információt. Az eredmények értékelése előtt a klasszikus és bayesi elemzés módszertanát vetjük össze. A Cochrane–Orcutt-féle iteratív eljárás és a Gibbs-algoritmus jellegét tekintve igen hasonló egymáshoz. Mindkét eljárás az együtthatók egy halmazát adottnak feltételezve határozza meg a többi együtthatót úgy, hogy folyamatosan felcseréli az adottnak feltételezett és a meghatározandó együtthatókat. A jellegében hasonló eljárásokban ugyanakkor lényeges különbségek is vannak. A Cochrane–Orcutt-féle eljárás – lineáris modellek esetén – tulajdonképpen a feltételes poszterior móduszokat adja becslésül és egyetlen pontbecsléshez konvergál, addig a Gibbs-eljárás a feltételes poszterior módusz körül választ megfelelő értékeket úgy, hogy az ismétlések révén a paraméterek együttes poszterior eloszlása bontakozzon ki. A Gibbs-eljárásnak ezen felül az is előnye, hogy nem egyetlen fixpont értékeket keres meg, amelynek 18 Ez β paraméterre vonatkozó prior esetén úgy érthető el, hogy a V0 és W0 kovarianciák főátlóiban szereplő értékeket kellően nagynak választjuk.
Statisztikai Szemle, 91. évfolyam 10. szám
986
Kehl Dániel — Várpalotai Viktor
meghatározása főleg sok együtthatós, nemlineáris modellek esetén okozhat numerikus problémát.19 A poszterior eloszlásokat szemlélve feltűnő, hogy a bayesi megközelítés a /7/ egyenletben szereplő késleltetett endogén változóhoz tartozó együtthatóra ferde poszterior peremeloszlást eredményezett. Ez első látásra meglepő lehet, hiszen a Gibbs mintavételi eljárásban a /7/ egyenletben szereplő együtthatók feltételes eloszlása szimmetrikus. Ugyanakkor tudjuk, hogy a klasszikus ökonometria – némileg hosszadalmas levezetést igénylő – eredménye is hasonló: a késleltetett endogén változóhoz tartozó együttható legkisebb négyzetek elvével történő becslése nem a szokásos t-eloszlást követi. Valójában a bayesi becslés során ezt az eredményt látjuk viszont a levezetések bonyodalmai nélkül. Becslési eredmények: klasszikus és bayesi ökonometriai eszközökkel OLS /6/
Cochrane–Orcutt /7/–/8/
Bayes /7/–/8/
Módszer
β0 (konstans)
β1 (CIG) β 2 (EDFAT) β3 (SPIRITS)
β 4 (BEER)
ρ ( ut −1 )
Pontbecslés
CI 95 százalék
Pontbecslés
CI 95 százalék
Pontbecslés
HPD 95 százalék
139,678
–18,548 (a)
341,120
170,182 (a)
309,925
(77,944)
297,904 (f)
(84,206)
512,059 (f)
(85,065)
140,452 (a) 474,504 (f)
10,706
1,388 (a)
2,902
–6,724 (a)
4,523
–4,7736 (a)
(4,590)
20,024 (f)
(4,742)
12,529 (f)
(4,759)
13,973 (f)
3,380
1,417 (a)
0,371
–1,748 (a)
0,732
–1,339 (a)
(0,967)
5,343 (f)
(1,044)
2,491 (f)
(1,079)
2,901 (f)
26,749
12,464 (a)
12,005
–4,081 (a)
12,837
–3,771 (a)
(7,037)
41,034 (f)
(7,924)
28,092 (f)
(8,895)
31,133 (f)
–4,132
–5,884 (a)
–2,202
–4,143 (a)
–2,289
–4,468 (a)
(0,863)
–2,380 (f)
(0,956)
–0,261 (f)
(1,080)
–0,222 (f)
0,614
0,333 (a)
0,509
0,197 (a)
(0,138)
0,895 (f)
(0,171)
0,876 (f)
Megjegyzés. A klasszikus becsléseknél a CI a konfidencia intervallumot, a bayesi becsléseknél a pontbecslés a poszterior várható értéket, a HPD (highest posterior density) pedig a legnagyobb valószínűségi intervallumot jelöli, vagyis azt a legszűkebb intervallumot, ahová a poszterior eloszlás adott százaléka esik. Az (a) és (f) az intervallumok alsó és felső értékeire utal. A pontbecslés alatt zárójelben az együttható szórása szerepel. 19 Az MCMC-módszereknek ez általános előnye minden pontbecslési, így például a maximum likelihood eljárással szemben: egyetlen maximumhely megkeresése helyett, mely összetett, nemlineáris ökonometriai modellek esetén numerikusan igen nehéz feladat lehet, a teljes poszterior eloszlást szimulálja, amiből a paraméterek jellemző értékei már könnyen meghatározhatók.
Statisztikai Szemle, 91. évfolyam 10. szám
987
A modern bayesi elemzések eszköztára és alkalmazása
A /7/–/8/ egyenletek együtthatóinak becsült értékeit tekintve elmondható, hogy a klasszikus és a bayesi becslés numerikusan hasonló eredményekhez vezetett, ami természetes, hiszen a bayesi becsléshez alacsony információ tartalmú (praktikusan nem informatívnak is tekinthető) priorokat használtunk. A numerikus különbségeket alapvetően az okozza, hogy a bayesi becslésben a poszterior átlagot számítottuk ki, ami ferde eloszlások esetén különbözik a klasszikus megközelítés módusz becslésétől. 2. ábra. A /7/–/8/ egyenletekkel adott modell együtthatóinak poszterior hisztogramja
ββ 0
β β 1
0
ββ 2
1
ββ 3
2
3
15000
15000
15000
15000
10000
10000
10000
10000
5000
5000
5000
5000
0 -500
0
500
0
-10
0
ββ 4
10
20
30
0 -4
ρρ
4
15000
15000
10000
10000
10000
5000
5000
5000
-6
-4
-2
0
2
0
0
0.5
0
2
4
6
0
-20
0
20
40
σσ 2 2
15000
0
-2
1
0
50
100
150
200
3. Összefoglalás A tanulmányban bemutattuk a modern bayesi ökonometriai elemzések egyik gyakran alkalmazott MCMC-módszerét, a Gibbs-mintavételt, mely lehetővé teszi, hogy a bayesi elemzés során a poszterior együttes sűrűségfüggvényben levő információkat a megszokott statisztikai fogalmakba (várható érték, módusz, szórás stb.) tömörítsük. Az MCMC-eljárások forradalmasították a bayesi elemzések eszköztárát, segítségükkel napjainkra olyan problémák is megoldhatóvá váltak, melyek klasszikus módszerekkel egyáltalán nem, vagy csak körülményesen kezelhetők. A tanulmány empirikus része olyan példát mutat be, ahol a klasszikus és a bayesi elemzés módszertanilag igen hasonló. Amellett, hogy a két megközelítés numerikusan hasonló becsléseket eredményezett, a bayesi becslés azzal az előnnyel járt, hogy a késleltetett endogén változóhoz tartozó becsült együttható nem standard (ferde) eloszlására automatikusan rámutatott. A bemutatott példa tanulsága általánosítható: Statisztikai Szemle, 91. évfolyam 10. szám
988
Kehl Dániel — Várpalotai Viktor
míg a klasszikus megközelítésben a becslési módszerek elsődlegesen pontbecsléseket eredményeznek, amelyek bizonytalansága általában csak mély valószínűségelméletistatisztikai tudás alapján vezethető le, addig a bayesi elemzés minden esetben az ismeretlen együtthatók együttes eloszlását határozza meg, melyből az elemző tetszőleges, az eloszlást jellemző mutatókat határozhat meg.
Függelék 1. Feltételes poszterior eloszlások meghatározása a Gibbs-mintavételhez A 2.2. alfejezetben szereplő /9/–/11/ priorok sűrűségfüggvényei:
f ( β ) = ( 2π ) f ( ρ ) = ( 2π )
−
−
kβ 2
kρ 2
V0 W0
−
1 2
′ ⎛ 1 ⎞ exp ⎜ − ( B0 − β ) V0−1 ( B0 − β ) ⎟ , 2 ⎝ ⎠
/F1/
1 2
′ ⎛ 1 ⎞ exp ⎜ − ( R0 − ρ ) W0−1 ( R0 − ρ ) ⎟ , ⎝ 2 ⎠
/F2/
−
T0
( )
f σ2
⎛ S0 ⎞ 2 ⎜ ⎟ 2 ⎛ 1 ⎞ − T +2 = ⎝ ⎠ σ ( 0 ) exp ⎜ − 2 S0 ⎟ , T ⎛ 0⎞ 2σ ⎝ ⎠ Γ⎜ ⎟ ⎝ 2⎠
/F3/
ahol k β és k ρ a /7/ és /8/ egyenletben szereplő együtthatók száma, azaz a példában k β = 5 és kρ = 1 .
A főszövegben a /13/ képlettel adott poszterior az /F1/–/F3/ sűrűségfüggvények és a /12/ likelihood felhasználásával a következő:
(
)
f β , ρ ,σ 2 | y, X ∝ ( 2π ) × ( 2π )
−
−
kβ 2 kρ 2
V0 W0
−
1 2
′ ⎛ 1 ⎞ exp ⎜ − ( B0 − β ) V0−1 ( B0 − β ) ⎟ × 2 ⎝ ⎠
1 2
′ ⎛ 1 ⎞ exp ⎜ − ( R0 − ρ ) W0−1 ( R0 − ρ ) ⎟ × 2 ⎝ ⎠
−
T0
⎛ S0 ⎞ 2 ⎜ ⎟ 2 ⎛ 1 ⎞ − T +2 × ⎝ ⎠ σ ( 0 ) exp ⎜ − 2 S0 ⎟ × T ⎛ 0⎞ 2σ ⎝ ⎠ Γ⎜ ⎟ ⎝ 2⎠ −T ′ ⎛ 1 ⎞ exp ⎜ − 2 y* ( ρ ) − X * ( ρ ) β y* ( ρ ) − X * ( ρ ) β ⎟ . × σ 2π 2 σ ⎝ ⎠
(
)
(
)(
Statisztikai Szemle, 91. évfolyam 10. szám
)
/F4/
989
A modern bayesi elemzések eszköztára és alkalmazása
A Gibbs-mintavétel alkalmazásához az ismeretlen együtthatók feltételes poszterior eloszlásait a következőkben vezetjük le. β | ρ ,σ 2 , y, X feltételes poszterior sűrűségfüggvénye /F4/ alapján: ′ 1 ⎛ 1 ⎞ ′ f β | ρ ,σ 2 , y, X ∝ exp ⎜ − ( B0 − β ) V0−1 ( B0 − β ) − 2 y* ( ρ ) − X * ( ρ ) β y* ( ρ ) − X * ( ρ ) β ⎟ , /F5/ 2 2 σ ⎝ ⎠
(
)
(
)(
)
ahol kihasználtuk, hogy ρ és σ 2 értékei a feltételes eloszlásban rögzítettek. ′
Cholesky-felbontás segítségével ( B0 − β )
alakra, ahol
1 1 − V0 = V0 2 ′V0 2 −
V0−1
1 ⎞′ ⎛ 1 1 ⎞ ⎛ −1 − − − 2 ( B0 − β ) átírható ⎜⎜V0 B0 − V0 2 β ⎟⎟ ⎜⎜V0 2 B0 − V0 2 β ⎟⎟ ⎝ ⎠⎝ ⎠
⎡ y* ( ρ ) ⎤ ⎡ X * ( ρ )⎤ ⎢ ⎥ ⎥ jelöléseket, /F5/ átírható . Bevezetve a z = és Z = ⎢ 1 1 ⎢ −2 ⎥ ⎢ −2 ⎥ ⎢⎣σ V0 B0 ⎥⎦ ⎢⎣σ V0 ⎥⎦
tömörebb formára: ′ ⎛ 1 ⎞ f β | ρ ,σ 2 , y, X ∝ exp ⎜ − 2 ( z − Z β ) ( z − Z β ) ⎟ . ⎝ 2σ ⎠
(
)
/F6/
A dekompozíciós szabály20 segítségével /F6/ így is írható:
′ ⎛ 1 ⎞ f β | ρ ,σ 2 , y, X ∝ exp ⎜ − 2 β − βˆ Z ′Z β − βˆ ⎟ , ⎝ 2σ ⎠
(
(
)
)
(
)
/F7/
ami egy konstans tényezőtől eltekintve egy többváltozós normális eloszlás sűrűségfüggvénye, azaz −1 β | ρ ,σ 2 , y, X ~N βˆ ,σ 2 ( Z ′Z ) . Tehát β feltételes eloszlása normális B várható érték vektorral
(
)
1
és V1 kovarianciamátrixszal, ahol: −1
1 1 ⎛ ⎞ ⎛ ⎞ B1 = ⎜ V0−1 + 2 X * ( ρ )′ X * ( ρ ) ⎟ ⎜ V0−1B0 + 2 X * ( ρ )′ y* ( ρ ) ⎟ , σ σ ⎝ ⎠ ⎝ ⎠ −1
1 ⎛ ⎞ V1 = ⎜ V0−1 + 2 X * ( ρ )′ y* ( ρ ) ⎟ . σ ⎝ ⎠
/F8–F9/
Hasonlóképpen ρ | β ,σ 2 , y, X feltételes sűrűségfüggvénye /F4/ alapján: 20
Dekompozíciós szabálynak hívjuk a következő azonosságot: ′ ′ −1 ′ ( z − Z β ) ( z − Z β ) = z − Z βˆ z − Z βˆ + β − βˆ Z ′Z β − βˆ , ahol βˆ = ( Z ′Z ) Z ′z , ami nem más mint a
(
)(
) (
)
(
)
legkisebb négyzetek (vagy maximum likelihood) becslőfüggvény.
Statisztikai Szemle, 91. évfolyam 10. szám
990
Kehl Dániel — Várpalotai Viktor
′ ⎞ ′ ⎛ 1 ⎞ ⎛ 1 f ρ | β ,σ 2 , y, X ∝ exp⎜ − ( R0 − ρ ) W0−1 ( R0 − ρ ) ⎟ exp⎜ − 2 y* ( ρ ) − X * ( ρ ) β y*( ρ) − X * ( ρ ) β ⎟ , /F10/ ⎝ 2 ⎠ ⎝ 2σ ⎠
(
)
(
)(
)
ahol kihasználtuk, hogy β és σ 2 értékei a feltételes eloszlásban rögzítettek. Használva ut = CHDt − β0 − β1 ⋅ CIGt − β2 ⋅ EDFATt − β3 ⋅ SPIRITSt − β4 ⋅ BEERt definícióját, legyen u ( β ) az ut -ből álló oszlopvektor, U ( β ) pedig az ut −1 megfigyelésekből álló T × 1 méretű mátrix (vektor). Ekkor y * ( ρ ) − X * ( ρ ) β = u ( β ) − U ( β ) ρ . Ez utóbbi segítségével ρ | β ,σ 2 , y, X feltételes sűrűségfüggvénye: ′ ′ ⎛ 1 ⎞ ⎛ 1 ⎞ f ρ | β ,σ 2 , y, X ∝ exp ⎜ − ( R0 − ρ ) W0−1 ( R0 − ρ ) ⎟ exp ⎜ − 2 ( u ( β ) − U ( β ) ρ ) ( u ( β ) − U ( β ) ρ ) ⎟ . /F11/ 2 σ 2 ⎝ ⎠ ⎝ ⎠
(
)
Az /F11/ feltételes sűrűségfüggvény formáját tekintve megegyezik az /F5/ feltételes sűrűségfüggvénnyel, így megismételve az előzőkben leírt lépéseket kapjuk, hogy ρ | β ,σ 2 , y, X feltételes sűrűségfüggvénye normális eloszlású R1 várható érték vektorral és W1 kovarianciamátrixszal, ahol: −1
1 1 ⎛ ⎞ ⎛ ⎞ R1 = ⎜ W0−1 + 2 U ( β )′ U ( β ) ⎟ ⎜ W0−1R0 + 2 U ( β )′ u ( β ) ⎟ , σ σ ⎝ ⎠ ⎝ ⎠
/F12–13/
−1
1 ⎛ ⎞ W1 = ⎜ W0−1 + 2 U ( β )′ U ( β ) ⎟ . σ ⎝ ⎠ Végül σ 2 | β , ρ , y, X feltételes sűrűségfüggvénye /F4/ alapján:
′ ⎞ ⎛ 1 ⎞ ⎛ 1 − T +T + 2 f σ 2 | β , ρ , y, X ∝ σ ( 0 ) exp ⎜ − 2 S0 ⎟ exp ⎜ − 2 y* ( ρ ) − X * ( ρ ) β y* ( ρ ) − X * ( ρ ) β ⎟ = 2 2 σ σ ⎝ ⎠ ⎝ ⎠ ′ ⎛ 1 ⎡ ⎞ ⎤ −(T +T0 + 2) /F14/ exp ⎜ − 2 ⎢S0 + y* ( ρ ) − X * ( ρ ) β y* ( ρ ) − X * ( ρ ) β ⎥ ⎟ = =σ ⎦⎠ ⎝ 2σ ⎣ ′ ⎛ 1 ⎞ − T +T + 2 = σ ( 0 ) exp ⎜ − 2 ⎢⎡S0 + ( u ( β ) − U ( β ) ρ ) ( u ( β ) − U ( β ) ρ ) ⎥⎤ ⎟. 2 ⎣ ⎦ σ ⎝ ⎠
(
)
(
(
)(
)(
)
)
ahol kihasználtuk, hogy β és ρ értékei a feltételes eloszlásban rögzítettek. Az /F13/ kifejezés egy konstanstól eltekintve egy IG ( S1 , T1 ) eloszlás sűrűségfüggvénye, ahol: ′ S1 = S0 + ( u ( β ) − U ( β ) ρ ) ( u ( β ) − U ( β ) ρ ) , T1 = T0 + T .
Statisztikai Szemle, 91. évfolyam 10. szám
/F15–F16/
A modern bayesi elemzések eszköztára és alkalmazása
991
2. Véletlen vektorok generálása adott paraméterű normál és inverz gamma eloszlásokból a) Véletlen vektor generálása N ( B ,V ) paraméterű normális eloszlásból A matematikai-statisztikai programcsomagok általában rendelkeznek olyan véletlenszámgenerátorral, amely képes független, standard normális eloszlást követő véletlen számokat előállítani. Jelölje B az előállítani kívánt normális eloszlás várható értékének oszlopvektorát (sorainak száma k ), V pedig a kovarianciamátrixát. Állítsunk elő egy k sorú független, standard normális eloszlást követő véletlen u vektort. Ekkor z = B + V 1 2u módon definiált z véletlen vektor B várható érték vektorú, V kovarianciájú normális eloszlást fog követni. b) Véletlen vektor generálása IG ( S , T ) paraméterű inverz gamma eloszlásból
S skála paraméter és T szabadságfokú inverz gamma eloszlást követő véletlen szám előállításához generáljunk egy T sorú véletlen u oszlopvektort a standard normális eloszlásból. Ekkor S módon definiált z véletlen változó S skála paraméterű és T szabadságfokú inverz z= u ′u gamma eloszlást fog követni.
Irodalom ALBERT, J. H. [2009]: Bayesian Computation with R. 2nd Edition. Springer. New York. CASELLA, G. [2007]: Why (Not) Frequentist Inference (Too)? Boletin de Estadística e Investigación Operativa. Vol. 23. No. 1. pp. 5–6. CASELLA, G. – BERGER, R. L. [2011]: A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data. Statistical Science. Vol. 26. No. 1. pp. 102–115. CASELLA, G. – GEORGE, E. I. [1992]: Explaining the Gibbs Sampler. The American Statistician. Vol. 46. No. 3. pp. 167–174. CHIB, S. [1993]: Bayes Regression with Autoregressive Errors: A Gibbs Sampling Approach. Journal of Econometrics. Vol. 58. Issue 3. pp. 275–294. CHIB, S. – GREENBERG, E. [1995]: Understanding the Metropolis-Hastings Algorithm. The American Statistician. Vol. 49. No. 4. pp. 327–335. CONGDON, P. [2005]: Bayesian Models for Categorical Data. Wiley. New York. COWLES, M. K. – CARLIN, B. P. [1996]: Markov Chain Monte Carlo Convergence Diagnostics: A Comparative Review. Journal of the American Statistical Association. Vol. 91. No. 434. pp. 883–904. DEGROOT, M. H. – SCHERVIS, M. J. [2012]: Probability and Statistics. Fourth edition. Pearson. Boston. DUFOUR, J. M. – GAUDRY, M. – LIEM, T. C. [1980]: The Cochrane-Orcutt Procedure Numerical Example of Multipe Admissible Minima. Economics Letters. Vol. 6. No. 1. pp. 43–48.
Statisztikai Szemle, 91. évfolyam 10. szám
992
Kehl—Várpalotai: A modern bayesi elemzések eszköztára és alkalmazása
GELFAND, A. E. – SMITH, A. F. M. [1990]: Sampling-Based Approaches to Calculating Marginal Densities. Journal of the American Statistical Association. Vol. 85. Issue 410. pp. 398–409. GELMAN, A. – CARLIN, J. B. – STERN, H. S. – RUBIN, D. B. [2004]: Bayesian Data Analysis. Chapman & Hall/CRC. Boca Raton. GELMAN, A. – RUBIN, D. B. [1992]: Inference from Iterative Simulation Using Multiple Sequences. Statistical Science. Vol. 7. No. 4. pp. 457–472. GEMAN, S. – GEMAN, D. [1984]: Stochastic Relaxation, Gibbs Distributions and the Bayesian Restoration of Images. IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 6. Issue 6. pp. 721–741. GEWEKE, J. [1992]: Evaluating the Accuracy of Sampling-Based Approaches to the Calculation of Posterior Moments. In: Bernardo, J. M. – Berger, J. O. – Dawid, A. P. – Smith, A. F. M. (eds.): Bayesian Statistics 4. Clarendon Press. Oxford. GEWEKE, J. [2005]: Contemporary Bayesian Econometrics and Statistics. Wiley. New York. HASTINGS, W. K. [1970]: Monte Carlo Sampling Methods Using Markov Chains and Their Application. Biometrika. Vol. 57. Issue 1. pp. 97–109. HUNYADI L. [2011]: Bayesi gondolkodás a statisztikában. Statisztikai Szemle. 89. évf. 10–11. sz. 1150–1171. old. KEHL D. [2012]: Robert, C. – Casella, G.: Szemelvények a Markov-lánc Monte-Carlo módszerek történetéből. Statisztikai Szemle. 90. évf. 4. sz. 352–354. old. KOOP, G. [2003]: Bayesian Econometrics. Wiley. New York. KOOP, G. – POIRIER, D. J. – TOBIAS, J. L. [2007]: Bayesian Econometric Methods. Econometric Exercises 7. Cambridge University Press. Cambridge. METROPOLIS, N. – ROSENBLUTH, A. – ROSENBLUTH, M. – TELLER, A. – TELLER, E. [1953]: Equations of State Calculations by Fast Computing Machines. Journal of Chemical Physics. Vol. 21. No. 6. pp. 1087–1092. RAMANATHAN, R. [2003]: Bevezetés az ökonometriába alkalmazásokkal. Panem Kiadó. Budapest. ROBERT, C. P. – CASELLA, G. [2004]: Monte Carlo Statistical Methods. 2nd Edition. Springer. New York. ROBERT, C. P. – CASELLA, G. [2011]: A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data. Statistical Science. Vol. 26. No. 1. pp. 102–115. VÁRPALOTAI V. [2008]: Modern Bayes-i ökonometriai elemzések. Simasági priorok alkalmazása az üzleti ciklusok szinkronizációjának mérésére és az infláció előrejelzése. PhD-értekezés. Budapesti Corvinus Egyetem. Budapest.
Summary This study demonstrates one of the most widely used members of modern bayesian computations, Gibbs sampling. After introducing the theoretical background and the algorithm itself, a short numerical example illustrates the procedure and the speed of convergence. The practical usefulness is proven through the solution of a well-known problem with bayesian methods. This also enables the authors to show similarities and differences of the classical frequentist theory and the bayesian framework.
Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-fõiskolai hallgatók vállalkozói attitûdkutatásának módszertani sajátosságai∗ Farkas Szilveszter, a Budapesti Gazdasági Főiskola egyetemi docense E-mail:
[email protected]
S. Gubik Andrea, a Miskolci Egyetem egyetemi docense E-mail:
[email protected]
Magyarország 2006-ban csatlakozott a svájci Szt. Galleni Egyetem által koordinált, a hallgatói vállalkozási erő felmérését célzó nemzetközi egyetemi kutatáshoz (Global University Entrepreneurial Spirit Students’ Survey – GUESSS), amely az egyetemi hallgatók vállalkozásindítással kapcsolatos elképzeléseit és vállalkozási tevékenységét kérdőíves adatfelvétel segítségével vizsgálja. Az online megkérdezésnek köszönhetően Magyarország esetében 2011-ben 5 677 hallgató válaszai alapján lehetett értékelni a vállalkozásindítási szándékot és annak legfontosabb alakító tényezőit. Egy kérdőíves felmérés csak abban az esetben képes a kutatási kérdésekre helyes választ adni, ha a kérdőív összeállítása, a megfelelő célcsoporthoz történő eljuttatása és a kitöltés motiválása, valamint a pontos adatelemzés egyaránt megvalósul. A kutatás nemzetközi jellegéből adódóan további kihívások jelentkeznek, mint például a kérdőív interpretálhatóságának eltérő kulturális hatásai. A cikk célja, hogy a GUESS módszertani sajátosságait a kutatás elméleti alapjaként szolgáló tervezett magatartás-elméleten (theory of planned behavior) keresztül mutassa be. TÁRGYSZÓ: Vállalkozás. Felsőfokú oktatási intézmény. Adatfelvétel.
∗ A tanulmány elkészítését az OTKA K 109839 programja támogatta.
Statisztikai Szemle, 91. évfolyam 10. szám
994
Farkas Szilveszter — S. Gubik Andrea
A vállalkozóvá válás, a vállalkozói tevékenység ösztönzése kiemelt gazdaság-
politikai kérdések a munkahelyteremtésre és a gazdasági növekedésre gyakorolt hatásuk miatt. Elsősorban a gyors növekedést produkáló „gazellák” játszanak ezeken a területeken meghatározó szerepet. Egy felmérés eredményei szerint a vállalatok leggyorsabban növekvő 5 százaléka 45,8, a leggyorsabban növekvő 1 százaléka pedig 20 százalékban járult hozzá a munkahelyteremtéshez 2002 és 2005 között Magyarországon (Békés–Muraközy [2011]). Ezek a vállalkozások fogékonyabbak az innovációra a gyors növekedést nem produkáló társaikhoz képest (OECD [2002], Autio– Kronlund–Kovalainen [2007], Papanek [2010]). Autio [2005] szerint érdemi növekedési potenciállal rendelkező vállalkozásokat leginkább a jó anyagi körülmények között élő, magasan képzett és egy jó üzleti lehetőség megvalósítása érdekében vállalkozó fiatalok hoznak létre. Azaz a jelenleg felsőfokú tanulmányaikat folytatók vállalkozási aktivitását befolyásoló tényezők feltárása és a lehetséges beavatkozási területek beazonosítása kritikus jelentőségű lehet az elkövetkező évek gazdasági növekedése és munkahelyteremtése szempontjából. Tanulmányunk alapvetően leíró jellegű. Célja, hogy átfogó képet adjon a hallgatói vállalkozási erő felmérését célzó nemzetközi egyetemi kutatási projektről (Global University Entrepreneurial Spirit Students’ Survey – GUESSS), elsősorban annak módszertani kérdései szemszögéből. Lépésről lépésre haladva mutatjuk be a kutatás sajátosságait, buktatóit, a felmerülő torzító tényezőket, valamint azoknak a kutatási eredményekre gyakorolt esetleges hatásait. Első lépésben a GUESSS célkitűzéseit írjuk le. Ezt követően a kutatási program elméleti koncepcióját foglaljuk össze, ismertetjük az általunk választott megoldások mellett a szakirodalomban fellelhető leggyakoribb operacionalizálási lehetőségeket. Kitérünk a kérdőív szerkezetére, az eddigi adatfelvételek és az adatgyűjtés speciális kérdéseire. Végül az alkalmazott modell tesztelési lehetőségeit ismertetjük.
1. A kutatás célkitűzései A GUESSS1 hallgatók megkérdezésével azok vállalkozásindítással kapcsolatos elképzeléseit és vállalkozási tevékenységét vizsgálja. A vállalkozásindítási folyamat mélyebb megértése érdekében elemzi a diákok karrierelképzeléseit a diploma meg1
A kutatási projekt honlapja: http://guesssurvey.org.
Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
995
szerzése után és néhány év elteltével, a családi és saját vállalkozásokat, valamint a jövőbeli vállalkozási terveket. Szisztematikus és hosszú távú vizsgálatokkal segíti felderíteni azokat a folyamatokat és tényezőket, amelyek döntőek lehetnek a vállalkozásindítási szándék alakulásában. A kutatás legfontosabb célja, hogy azonosítsa azokat az egyéni motívumokat és személyes háttérbeli jellemzőket, amelyek a vállalkozóvá válási folyamatot érdemben befolyásolhatják. Emellett mód van a kulturális és intézményi tényezők vállalkozásindítási elképzelésekre gyakorolt hatásának vizsgálatára is. Kideríthető, hogy az egyes felsőoktatási intézmények milyen szolgáltatásokkal és kurzusokkal támogatják a hallgatók vállalkozási elképzeléseit, és hogy mennyire képesek vállalkozásbarát légkör kialakítására. A kutatás nemzetközi jellegéből adódóan az egyetemek nem csak nemzeti, de nemzetközi összehasonlítására is lehetőség nyílik. A projekt a szűken vett kutatási kérdések mellett közösségi célokat is szolgál. Az adatfelvétel és -feldolgozás segítségével a részt vevő országok a vállalkozásindítás egy fontos területéről kaphatnak átfogó képet. A hallgatói vállalkozói attitűdök közép- és hosszú távon hatással lesznek az egyes országok vállalkozói aktivitására és így a társadalmi-gazdasági fejlődésre. A társadalmi döntéshozatal, a gazdaságpolitika különböző területei (például a vállalkozásfejlesztési politika) számára ajánlások fogalmazhatók meg a kutatások során feltárt eredmények értő felhasználásával. A felmérések alapján kidolgozásra kerülő oktatási, vállalkozásfejlesztési programok a hallgatók karriercéljait támogathatják. A kutatás a svájci University of St. Gallen egyik intézetének, a Swiss Institute for Small Business and Entrepreneurship (Svájc Kisvállalkozásokat és a Vállalkozói Kedvet Kutató Intézetének) szervezésében folyik. Az ő feladatuk az adatfeldolgozás és az adatok harmonizálása. A kutatásban résztvevők ezt az elemzésre kész adatbázist kapják kézhez.
2. A kutatás koncepciója és operacionalizálási lehetőségei A GUESSS kutatási koncepciója Ajzen [1991] tervezett magatartás-elméletén nyugszik. Eszerint az attitűdök, a szubjektív normák és az észlelt magatartási kontroll együttesen befolyásolják a vállalkozóvá válás szándékát, amely elvezet a tényleges cselekvéshez. Az ábra Ajzen tervezett magatartás-elméletét mutatja. Az Ajzen-modell egyik központi gondolata a szándék és a cselekvés megkülönböztetése. A komoly vállalkozói szándék még nem jelenti azt, hogy az adott cselekvés ténylegesen meg is valósul, azaz sor kerül a vállalkozásindításra. A szándék az attitűdök, a szubjektív normák és az észlelt magatartási kontroll függvénye. Komoly Statisztikai Szemle, 91. évfolyam 10. szám
996
Farkas Szilveszter — S. Gubik Andrea
szándék nélkül nem várható tényleges cselekvés. Ugyanakkor a tényleges cselekvést befolyásolják olyan objektíve rendelkezésre álló tényezők, mint például a szükséges források, lehetőségek elérése (pénz, idő stb.), amelyek az adott szándék megvalósításához szükségesek. Ezt a tényezőt a modell aktuális magatartási kontrollnak nevezi, és Ajzen modelljének újabb változata tartalmazza csupán (Ajzen [2006]). A vállalkozásindítási szándék alakítói
Attitűdök
Szubjektív normák
Szándék
Cselekvés
Észlelt magatartási kontroll Aktuális magatartási kontroll Forrás: Ajzen [2006].
A modell szerint a vállalkozásindításra irányuló attitűd és a vállalkozási szándék között pozitív irányú összefüggés van. Minél kedvezőbb az egyén vállalkozásindítással összefüggő beállítottsága, várhatóan annál nagyobb lesz a vállalkozásindítási szándéka is. A támogató szociális környezet, a társadalmi normák ugyancsak pozitívan hathatnak a vállalkozásindítási szándékra. Minél inkább úgy észleli az egyén, hogy környezete pozitívan viszonyul vállalkozásindítási elképzeléseihez, annál inkább várható, hogy szándékot mutat majd saját vállalkozás megvalósítására. A harmadik tényező, az események feletti kontroll szintén közvetlenül befolyásolja a vállalkozásindítási szándékot, de a tényleges cselekvésre is hatást gyakorolhat. Az észlelt magatartási kontroll kétféle módon befolyásolja a szándékot és a cselekvést. Egyrészt minél inkább úgy érzi az egyén, hogy képes kontrollálni az eseményeket, annál inkább szándékában állhat saját vállalkozási tevékenységbe fogni. Másrészt az énhatékonyság szintén pozitív irányba tolja a vállalkozási szándékot. Minél inkább azt hiszi az egyén, hogy birtokában áll a vállalkozásindításhoz szükséges képességeknek és tudásnak, annál inkább elképzelhetőnek tartja saját vállalkozásának beindítását. A szándékot befolyásoló tényezők egymással is összefüggnek, illetve az észlelt magatartási kontroll két dimenziója, a kontrollálhatóság és az énhatékonyság között szintén létezik kapcsolat, mely lehet egymást erősítő, de ellentétes irányú is. Elképzelhető, hogy az az egyén, aki azt gondolja, rendelkezik a szükséges képességekkel Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
997
és tapasztalatokkal, egyúttal úgy is érzi, hogy képes kontrollálni is az eseményeket. Ugyanakkor lehetséges, hogy mindezek ellenére azt érzékeli, az események kicsúszhatnak a kezei közül. A kérdőív egyaránt lehetőséget ad a modell tényezőinek és azok legfontosabb befolyásolóinak a vizsgálatára. A fogalmak operacionalizálása során a szakirodalomra hagyatkoztunk, maga a kérdőív is a bevett mérési módszereknek megfelelő kérdéseket tartalmazza. Azonban, mint a legtöbb, kvalitatív tényezőket mérni próbáló kutatásnál, itt is felmerül az érvényesség kérdése, azaz, hogy valóban a mérni kívánt változó mérése történt-e meg. A következőkben megvizsgáljuk a szakirodalomban található ajánlásokat a modell tényezőinek mérésére, illetve bemutatjuk, hogy mi hogyan valósítottuk azt meg.
2.1. Vállalkozási szándék A vállalkozási szándék mérésére bevett lehetőség a Likert-skálás kérdések alkalmazása. A válaszadókat leggyakrabban a vállalkozásindítással összefüggő állítások értékelésére kérik. Krueger [1993] egyszerű eldöntendő kérdéssel (igen/nem válaszlehetőséget adva) igyekezett megragadni a fogalmat, a „Gondolod, hogy fogsz valaha vállalkozni?” kérdés segítségével. Autio et al. [2001] annak a valószínűségét próbálták mérni, hogy az egyén a kérdőív kitöltésétől számított egy vagy öt éven belül indít-e saját vállalkozást. Négy darab, ötfokozatú Likert-skálán megfogalmazott kérdést alkalmaztak, ebből kettő a teljes állásban folytatott vállalkozásra, kettő a részmunkaidőben végzett vállalkozói tevékenységre vonatkozott (egy, illetve öt éven belül). Ajzen [2002b] hangsúlyozza, hogy a szándék mérésére alkalmazott minden szempontnak ugyanazt a jelenséget kell vizsgálnia, azaz erős korrelációt kell mutatniuk (fontos a belső konzisztencia érvényesülése). Ő maga a szándékot és a tényezőket is hétfokozatú szemantikus differenciálskálán méri. A GUESSS-kérdőívben több lehetőség is adódik a szándék mérésére. Az egyik, Autio megoldásához hasonló, de a tanulmányokhoz pontosabban köti a vállalkozásindítási szándékot a „Milyen karriert tervezel közvetlenül a tanulmányok befejezése után és milyen karriert 5 évvel a végzés után?” kérdés segítségével (a válaszadás táblázatos formában történik). A tizenhárom válaszlehetőség alapvetően az alkalmazotti, vállalatalapítói, követői/örökösi és egyéb életpályákat különíti el. A másik kérdés pedig a „Gondoltál-e már komolyan arra, hogy saját vállalkozást indíts?”. Itt kilenc válaszlehetőség közül kellett a válaszadóknak a rájuk leginkább megfelelőt megadni. Ezek: Soha; Esetlegesen, néha; Újra meg újra (ismétlődően); Viszonylag konkrétan; Határozottan döntöttem egy vállalkozás alapításáról; Konkrét ütemtervvel rendelkezem, hogy mikor, milyen lépéseket tegyek az alapításért; Már elkezdtem a megvalóStatisztikai Szemle, 91. évfolyam 10. szám
998
Farkas Szilveszter — S. Gubik Andrea
sítást; Az általam alapított vállalat alkalmazottja vagyok; Egy vállalatnál többet alapítottam és legalább egyben aktív szerepet töltök be.
2.2. Attitűdök Az attitűd mérésére Ajzen [2002a] szerint bármilyen standard attitűdskála alkalmas. Módszertani jellegű cikkében szemantikus differenciálskálára hoz példákat, de a Likert- és a Thurstone-skála alkalmazását is felveti. Lehetőség nyílik az attitűdök közvetlen és közvetett mérésére egyaránt. Az első a személy cselekvése egészére vonatkozó megítélésre vonatkozik. A közvetett mérés pedig azt igyekszik megragadni, hogy mennyire hisz az egyén egy adott esemény bekövetkezésében, és azt mennyire tartja fontosnak. Ekkor azt próbálják a kérdések megragadni, hogy miért vélekednek a válaszadók egy bizonyos módon. Mivel az attitűdök mögött álló mozgatóerők sokszor ambivalensek, Ajzen [2002a] hangsúlyozza, hogy a belső konzisztencia itt nem szükségszerűen érvényesül. Kutatásunkban a korábbi tesztek gyakorlatának megfelelően (például Autio et al. [2001], Krueger–Reilly–Carsrud [2000]) az attitűdöt a vállalkozás karriercélként történő elfogadottságaként határoztuk meg, ám a korábbi vizsgálatoktól eltérően nem egy, hanem négy változó együttes hatásával mértük. Ehhez a 9. kérdést használtuk fel, ahol a válaszadóknak a következő négy, vállalkozásindítással összefüggésben megfogalmazott, hétfokozatú Likert-skálán mért állítást kellett értékelniük: – A vállalkozóvá válás számomra több előnyt jelent, mint hátrányt. – A vállalkozói karrier számomra vonzó. – Ha lenne lehetőségem, vállalkozó lennék. – Vállalkozónak lenni számomra nagy megelégedettséget jelentene.
2.3. Szubjektív normák A szubjektív normák mérésére több megközelítés is található a szakirodalomban. Kolvereid [1996] három szempont alapján mérte a válaszadó szerint meghatározó csoportok (szűk család, barátok, egyéb olyan személyek, akiknek fontos a véleménye) vélekedését az esetleges vállalkozási tevékenységről. Krueger, Reilly és Carsrud [2000] szintén ezt a megközelítést alkalmazták, de a kapott válaszokat aszerint is súlyozták, hogy a válaszadó mennyire ad az egyes csoportok véleményére. Autio et al. [2001]) egy további szempontot is megvizsgáltak, mégpedig azt, hogy a megkérdezettek mennyire érzik úgy, hogy az egyetemi környezetük ösztönző a vállalkozás szempontjából. Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
999
A GUESSS-kérdőív mindhárom megközelítés tesztelésére lehetőséget ad. A 10. kérdés („Ha vállalkozó lennél, mit szólnának, hogyan vélekednének erről az emberek a környezetedben?”) esetén a válaszadók azt jelölték meg, hogy megítélésük szerint mennyire lenne negatív vagy pozitív környezetük vélekedése, ha vállalkozásba fognának. A szülők/családtagok, a barátok/diáktársak és a megkérdezettek számára fontos emberek véleményét kellett értékelni. A 11. kérdés („Kérjük, jelöld meg, hogy mennyire adsz az alábbi személyek véleményére!”) pedig azt mutatja meg, mennyire tartják a válaszadók fontosnak az egyes csoportok véleményét. A támogató egyetemi klímát a kérdőív 2.6. kérdése deríti fel. Mindhárom kérdéscsoportnál 1-től 7-ig terjedő Likert-skálán kellett a válaszadóknak a véleményüket árnyalni.
2.4. Észlelt magatartási kontroll A legtöbb kutatás változó számú állítás Likert-skálán történő mérésével értékeli az észlelt magatartási kontrollt. Autio et al. [2001] négy állítást fogalmaztak meg (Biztos vagyok benne, hogy sikeres lennék, mint vállalkozó; Könnyű lenne számomra egy vállalkozás elindítása; Egy saját vállalkozás indítása valószínűleg a legjobb módja lenne, hogy az oktatásom előnyeit kiaknázzam; Rendelkezem a szükséges képességekkel ahhoz, hogy sikeres vállalkozó lehessek), amelyeket 1-től 5-ig terjedő Likert-skálán kellett a válaszadóknak értékelni. Ajzen [2002a] szerint az észlelt magatartási kontroll mérésének a kontrollálhatóságra és az énhatékonyságra egyaránt ki kell terjednie, és itt is figyelembe kell venni a szempontok belső konzisztenciáját. Mi az észlelt magatartási kontrollt Ajzen [2002a] ajánlásainak megfelelően, két változó segítségével mértük. A kérdőív 12. kérdése a kontrollálhatóság, 13. kérdése pedig az énhatékonyság mérésére alkalmas. Mindkettő esetén hétfokozatú Likertskálán kellett értékelni az egyes állításokat, illetve a tényezők jelentőségét. A 12. kérdés („Kérjük, jelöld meg, hogy mennyire vagy biztos az alábbi szerepek/feladatok végrehajtásában!”) kilenc olyan állítást tartalmazott, amely alapján eldönthető volt, hogy mennyire érzi úgy az egyén, képes kézben tartani, irányítani az eseményeket, hogy érzékel-e mások általi kontrollt saját döntéseiben: – Általában képes vagyok meghatározni, hogy mi történjen az életemben. – Általában képes vagyok védeni saját érdekeimet. – Amikor terveket készítek, majdnem biztos vagyok abban, hogy elvégzem azokat. – Annak érdekében, hogy a terveim beváljanak, gondoskodom arról, hogy az én elképzeléseim összhangban legyenek azoknak az embereknek az elképzeléseivel, akiknek hatalma van fölöttem. Statisztikai Szemle, 91. évfolyam 10. szám
1000
Farkas Szilveszter — S. Gubik Andrea
– Életemet elsősorban más, erős egyéniségek irányítják. – Ha megkapok valamit, amit szeretnék, az azért van, mert szerencsés vagyok. – Nem mindig okos dolog hosszú távra terveznem, mert sok dolog válhat a jó vagy rossz szerencse kérdésévé. – Sokszor úgy találom, hogy aminek meg kell történnie, az meg fog történni. – Úgy érzem, hogy ami az életemben történik, azt gyakran mások befolyásolják/határozzák meg. A 13. kérdés az énhatékonyságot mérte: „Kérjük, jelöld meg, hogy mennyire vagy biztos az alábbi szerepek/feladatok végrehajtásában!”. Itt tizenkét tényezőt kellett értékelniük a válaszadóknak, ebből tizenegy a kockázatviselő képességükre, innovativitásukra vonatkozik, valamint arra, hogy mennyire következetesek a döntéseikben: – célok kijelölése és megvalósítása; – célokhoz igazított időbeosztás; – döntéshozatal bizonytalanság és kockázat mellett; – felelősségvállalás az ötletekért és döntésekért; – kockázat és bizonytalanság csökkentése; – pénzügyi elemzés készítése; – saját vállalat indítása; – saját vállalkozásomat sikeressé teszem; – számított kockázatok figyelembe vétele; – új ötletek kitalálása; – új termékek és szolgáltatások fejlesztése.
3. A kérdőív felépítése Az Ajzen-modell tesztelésén túl a GUESSS-kérdőív számos további, a hallgatók vállalkozási szándékával, azok befolyásolóival foglalkozó kérdést is tartalmaz. Alapvetően négy kérdéscsoport köré szerveződik, ezek a karrierelképzelésekben tetten érhető vállalkozói szándék, az egyetemi-főiskolai környezet hatása, a vállalkozói szándék Ajzen tervezett magatartás-elméletére alapozott feltérképezése és a családi vállalkozások befolyásoló szerepe. A négy kérdéskör tizenhat kérdéscsoportja többségében zárt kérdéseket tartalmaz, alternatívakat és szelektíveket egyaránt. A kérdőív öt esetben kínál fel „Egyéb” válaszlehetőséget. Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
1001
Az első kérdéscsoport a személyes adatokat tudakolja. A második a tanulmányokkal kapcsolatos, a képzési szintre, a tanulmányok időtartamára és területére vonatkozik, valamint kitér az egyetem által kínált vállalkozói kurzusok, szolgáltatások és azok hallgatók általi kihasználásának felmérésére. A vállalkozói szándék egyik legfontosabb elemére, a tervezett karrierre – közvetlenül a tanulmányok befejezését követően, illetve öt évvel a végzés után – kérdez rá a 3. és a 4. kérdés. Az 5. pedig a megjelölt karrierválasztás motívumait deríti fel. A 6. és 7. kérdés a válaszadó családi hátterére, egyrészt a családi vállalkozásokra, másrészt a családi kapcsolatok fontosságára vonatkozik. A 8. kérdésre adott válaszokból állapítható meg, hogy a hallgató vállalkozói motivációi milyenek. A felkínált kilenc válasz alapján súlyozással egy indexváltozó készült, amely a hallgatói vállalkozói szándékot méri, és amely nemzetközi és intézményi szintű összehasonlításra ad lehetőséget.2 (Lásd Sieger–Fueglistaller–Zellweger [2011] 37. old.) A 9. kérdés a vállalkozói attitűd, a 10. és a 11. kérdések az észlelt társadalmi normák mérésére alkalmasak. A 12. és a 13. kérdés a válaszadó által értékelt magatartási jellemzőkre vonatkozik. Az utóbbi részletesen igyekszik feltárni a vállalkozói szándékot, tizenkét alkérdés méri a potenciális vállalkozó hallgatók legfontosabb jellemzőit. (A 13.1-től a 13.12-ig alkérdésre csak azok a potenciális vállalkozók válaszolhattak, akik a 8. kérdésnél a 3–7. válaszokat jelölték meg.) A 14. kérdés az aktív vállalkozó hallgatók vállalkozásaira kérdez rá, az alapítás részleteiről, az alapítótársak számáról, az alkalmazotti létszámról, a tevékenységi területről (ágazatról), a családi támogatás mértékéről, a vállalkozói tapasztalatokról, az alapítás pénzügyi forrásairól és az eredményességről szóló kérdéseket kellett megválaszolni. A 15. és 16. kérdés a családi vállalkozás átvételével kapcsolatos, további hat alkérdés pedig az átvétel helyzetére, a családi vállalkozással kapcsolatos attitűdökre vonatkozik.
4. Az adatfelvételek és az adatgyűjtés speciális kérdései A Főiskolai Hallgatók Vállalkozókedvét Vizsgáló Nemzetközi Felmérésre (International Survey on Collegiate Entrepreneurship – ISCE), majd a GUESSS adatfelvételeire általában kétévente kerül sor. Az első lekérdezés 2003-ban történt, ekkor még csak két ország részvételével. Az 1. táblázat mutatja a kutatás nemzetközivé válását és a megkérdezettek számának alakulását. A legutolsó adatfelvétel 2011-ben volt, ekkor már 26 ország bevonásával. 2
Az indexváltozó elnevezése 2008-ban index of students’ entrepreneurship power (hallgatói vállalkozóerő/-képesség), 2011-ben entrepreneurship index (vállalkozási index). A különböző elnevezések mögött azonban azonos a módszertan és a tartalom.
Statisztikai Szemle, 91. évfolyam 10. szám
1002
Farkas Szilveszter — S. Gubik Andrea
1. táblázat A kutatásban részt vevő országok és hallgatók száma Év
Részt vevő országok száma
Kérdőívet kitöltő hallgatók száma*
A kutatás címe
2003
2
..
2004
2
5 000
START ISCE
2006
14
37 000
ISCE
2008
19
63 000
GUESSS
2011
26
93 000
GUESSS
* Kerekített adatok. Forrás: http://www.guesssurvey.org/e_project_history.html.
A kutatásban részt vevő országok és egyetemek köre folyamatosan bővül, elsősorban a téma időszerűségének köszönhetően. Az ismétlődő adatfelvételek és a folyamatos visszajelzések eredményeképpen a kutatás folyamatos fejlődésen megy keresztül. Ennek megfelelően alakul a kérdőív is, aktualitást nyert kérdések, országspecifikus kérdéscsoportok kerülhetnek bele, de a fő kérdéscsoportok változatlanok maradnak. Ezáltal a kérdőív módot ad a folyamatok időbeli változásának nyomon követésére és az ezek mögötti mozgatórugók megértésére. Az országok és a részt vevő egyetemek számának bővülésével pedig a földrajzi összehasonlításra is egyre több lehetőség van. A 2011. évi, 5. felmérésben összesen 93 265 hallgató vett részt 502 felsőoktatási intézményből. Magyarországon 5 677 hallgató töltötte ki az elektronikus kérdőívet (8 százalékos átlagos válaszadási aránnyal). A 2. táblázat a magyarországi résztvevők megoszlását tartalmazza a válaszadók felsőoktatási intézménye szerint. A kutatás során arra törekedtünk, hogy a kérdőívvel valamennyi hallgatót elérjük. A kérdőív elektronikus elérhetősége azonban korlátozta a kérdezésbe ténylegesen bevont magyarországi felsőoktatási intézmények számát, kimaradtak a kérdezésből a néhány tucat vagy néhány száz hallgatóval rendelkező alapítványi és egyházi intézmények. Az állami felsőoktatási intézmények mindegyikét megkerestük. Felkérő levélben vettük fel a kapcsolatot a téma iránt érdeklődő oktató kollégákkal (a nemzetközi háttér bemutatásával és személyes referencia nyújtásával), akiket a kérdőív linkje kiküldésének megszervezésére kértünk. Cserébe a teljes magyarországi adatbázist az intézményi együttműködő partnerek rendelkezésére bocsátottuk. Ahol nem volt oktatói kapcsolatunk, ott a tanulmányi osztály vagy az annak szerepét betöltő szervezeti egység vezetőjével vettük fel a kapcsolatot. Mivel a hallgatókat sok helyütt a tanulmányi rendszeren keresztül már számtalan hasonló kéréssel keresték meg, néhány intézményben a hallgatói önkormányzattal külön kellett egyeztetnünk. Statisztikai Szemle, 91. évfolyam 10. szám
1003
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
2. táblázat A 2011. évi GUESSS-ben résztvevők megoszlása felsőoktatási intézmény szerint 2009/2010- Beiratkozott es tanévre hallgatók beiratkozott száma szerinti hallgatók megoszlás száma (százalék)
Felsőoktatási intézmény neve
Kiküldött felhívás (link)
Beérkezett kérdőív
Beérkezett Válaszadási kérdőívek arány megoszlása (százalék) (százalék)
Budapesti Műszaki és Gazdaságtu23 219
dományi Egyetem
8,0
0
5
0,1
Budapesti Corvinus Egyetem
17 422
6,0
4 800
201
3,5
4,2
Széchenyi István Egyetem
10 786
3,7
8 900
681
12,0
7,7
Debreceni Tudományegyetem
30 728
10,6
n.a.
538
9,5
Miskolci Egyetem
13 940
4,8
14 055
620
10,9
4,4
Pécsi Tudományegyetem
29 032
10,0
8 400
757
13,3
9,0
Szegedi Tudományegyetem
27 436
9,5
n.a.
254
4,5
Pannon Egyetem
10 125
3,5
0
1
0,0
3 244
1,1
n.a.
38
0,7
Kaposvári Egyetem Nyugat-magyarországi Egyetem
14 261
4,9
7 600
291
5,1
Eötvös Loránd Tudományegyetem
30 767
10,6
n.a.
175
3,1
Szent István Egyetem
10 786
3,7
n.a.
166
2,9
Budapesti Gazdasági Főiskola
17 911
6,2
13 622
620
10,9
Óbudai Egyetem
11 438
4,0
0
5
0,1
3,8
4,6
Dunaújvárosi Főiskola
4 312
1,5
2 460
158
2,8
6,4
Károly Róbert Főiskola
11 530
4,0
8 000
97
1,7
1,2
Általános Vállalkozási Főiskola
2 949
1,0
n.a.
147
2,6
Gábor Dénes Főiskola
2 720
0,9
n.a.
182
3,2
Eötvös József Főiskola
1 634
0,6
1 350
65
1,1
4,8
Budapesti Kommunikációs és Üzleti Főiskola Kodolányi János Főiskola
2 353
0,8
0
1
0,0
6 673
2,3
n.a.
423
7,5
2 073
0,7
1 200
145
2,6
12,1
1,1
330
19,7
Modern Üzleti Tudományok Főiskolája Semmelweis Egyetem, Egészségtudományi Kar
3 173
Egyéb
0,0 Összesen
288 512
100,0
70 717
65
1,1
42
0,7
5 677
100
8,0*
* Átlag. Megjegyzés. A „Kiküldött felhívás (link)” oszlop mutatja, hogy hány hallgató kapta meg a 2011. évi GUESSS-kérdőív kitöltésének internetes elérhetőségét. Nulla azt jelenti, hogy az intézmény sem a tanulmányi rendszerben, sem más módon nem jutatta el azt a hallgatóknak. Forrás: 2011. évi GUESSS adatbázisa.
Statisztikai Szemle, 91. évfolyam 10. szám
1004
Farkas Szilveszter — S. Gubik Andrea
Azt tapasztaltuk, hogy egyre nagyobb akadályba ütközik a válaszadók számának növelése, habár a hallgatói tanulmányi rendszerek (Neptun, ETR) bevezetésével és a közösségi portálok terjedésével a hallgatók elviekben egyre egyszerűbben érhetők el. Ennek oka többnyire az elektronikus adatforgalom gyors növekedése, az elektronikus reklámok, megkeresések, felhívások gyarapodása. Annak ellenére, hogy verseny kiírásával, buzdító levelek megfogalmazásával igyekeztünk a hallgatóknak kedvet adni a kérdőívek kitöltéséhez, a nemválaszolás mértéke magas maradt. A kiküldött felhívásoknak (ahol erre vonatkozóan rendelkezésre állt adat) átlagosan 8 százalékában kaptunk választ. Jelentős intézményi eltérések adódtak. A legaktívabbnak a Semmelweis Egyetem mutatkozott, 19 százalékot meghaladó válaszadási aránnyal. A nemválaszolás pontos megállapítását az nehezíti, hogy több esetben nem sikerült beazonosítani, hány hallgatóhoz jutott el a kitöltésre buzdító felhívás. Elvileg az elektronikus hallgatói tanulmányi rendszerekből ez az adat könnyen lekérdezhető. Amennyiben a felsőoktatási intézmény ezt az utat választotta, minden hallgatót elértünk, és számszerűsíthető az is, hogy hány kitöltött kérdőív jut az összes kiküldött felhívásra. Néhány intézménynél azonban eltérő módon szólították meg a hallgatókat (az Eötvös Loránd Tudomnyegyetemen például a hallgatói facebookoldalon); ezekben az esetekben vállalható becslést sem kaptunk az elért hallgatók számára vonatkozóan. (Lásd az 1. táblázat „Kiküldött felhívás (link)” oszlopfejléce alatti adatokat.) A 2010/2011-es tanévben összesen 361 347 hallgató iratkozott be magyar felsőoktatási intézménybe, az intézményi megkeresés során potenciálisan 288 512 hallgató tölthette ki a 2011. évi GUESSS-kérdőívet; ez a beiratkozott diákok 80 százaléka. Azt biztosan tudjuk, hogy 70 717 hallgatóhoz eljutott a kérdőív linkje, ami 24,4 százalékos elérést jelent. Az adatgyűjtéssel kapcsolatos egyik fontos kérdés annak reprezentativitása. A kapott eredmények általánosíthatósága miatt szükséges lenne az intézmények szerinti reprezentativitás megvalósulása, de képzési területek, esetleg képzési szintek szerint is lehet ilyen elvárásunk. Esetünkben az adatbázisban szereplő hallgatók intézményi megoszlása nem követi pontosan a beiratkozott hallgatók száma szerinti intézményi megoszlást. A mintában felülreprezentáltak a Széchenyi István Egyetem, a Miskolci Egyetem, a Pécsi Tudományegyetem és a Budapesti Gazdasági Főiskola hallgatói. A képzési szintek és a nemek szerinti megoszlás jórészt megfelel az országos felsőoktatási adatoknak. A reprezentativitás megítélését egyes esetekben nehezíti, hogy a nemzetközi gyakorlat nem egységes, sokszor az azonos elnevezések mögött is eltérő tartalmakat találunk. Például a BSc alap- és az MSc mesterszakok képzési ideje változó országonként, ugyancsak különbözik, hogy hány évesen és milyen tapasztalatokkal léphet be egy diák a felsőoktatásba. Így ha a képzési szint szerinti reprezentativitás meg is valósul, a nemzeti gyakorlatok eltérése miatt ennek gyakorlati haszna nemzetközi öszszehasonlításokban nem realizálódik. Hasonló okok miatt a képzési területek sem feleltethetők meg maradéktalanul egymásnak. Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
1005
Egy további, gyakran felmerülő kérdés a nemzetközi felméréseknél a kérdőív fordítása és ebből fakadóan a kérdések eltérő interpretálása. Egy egyébként minden módszertani ajánlásnak megfelelő felmérés is elbukhat a rosszul fordított kérdőíven, de megfelelő fordítás mellett is óhatatlanul elveszhet vagy hozzáadódhat olyan tartalom/jelentés az egyes kérdésekhez, ami a kérdőívek nemzeti eltéréseihez vezet. Ez főként kognitív tartalmat, attitűdöket elemző kérdőíveknél jelenthet problémát. A nemzetközi gyakorlatban ismert eljárás szerint a kérdőívet az eredeti nyelvről célnyelvre történő fordítás után újra az eredeti nyelvre fordítják le, majd ellenőrzik, hogy annak tartalma a kiinduló változattól eltér-e. Más ajánlások szerint az odavisszafordítás helyett érdemes alaposabb fordításra törekedni, amit azonnal értékelni, tesztelni kell. Ilyen módszer a többszörös fordítás, azaz a kérdőívet többen is lefordítják egymástól függetlenül, majd ezeket a változatokat vetik össze. Megoldás lehet a kérdőív tesztelése, érthetőségének ellenőrzése. Más ajánlás szerint pedig, amelyet magunk is követtünk, a kérdőív fordítását nem egy személynek kell végeznie, fontos, hogy abban egyszerre vegyen részt a szakterületben, illetve a kérdőívszerkesztésben jártas személy is a fordító mellett (Harkness–Schoua-Glusberg [2003]). A nemzetközi kérdőívek további problémája a kérdések értelmezésének kulturális különbségei. Példaként említjük a „Cultural studies” és az „Other social sciences” (egyéb társadalomtudományok) képzési területek megkülönböztetését. Ez a magyar képzési szerkezetben nehezen értelmezhető még az egy-kétszavas magyarázatok ellenére is. Így a „Társadalomtudomány, kulturális orientációval (ideértve: vallás, filozófia, pszichológia)”, illetve az „Egyéb társadalomtudományok (például szociológia, politikatudomány, kommunikáció)” megoldást választottuk. Az 5. kérdésre sem könnyű válaszolni, hiszen nehezen értelmezhető, értékelhető a „Társadalmi küldetés követése” vagy a „Környezeti küldetés követése”, mint munkával, karrierrel kapcsolatos indíték. A kérdőív önkitöltős jellegéből adódóan értelmezési gondok léphetnek fel, magyarázat, instrukció híján előállhat, hogy a válaszadók a kérdőív összeállítóitól eltérő módon értelmeznek egyes kérdéseket. Ezt egy esetben, a tanulmányokra vonatkozó kérdések egyikében („Hány évet tanultál eddig összesen?”) mi is tapasztaltuk, így azt ki kellett hagynunk a feldolgozásból.3
5. Az adatelemzés sajátosságai A kutatás során feltett kérdésekre adandó válaszok megfogalmazása lehetetlen megfelelő matematikai-statisztikai módszerek alkalmazása nélkül. A vizsgált jelen3
Volt, aki ezt az általános iskolától kezdve értelmezte, és volt, aki csak a felsőfokú tanulmányokra vonatkoztatta.
Statisztikai Szemle, 91. évfolyam 10. szám
1006
Farkas Szilveszter — S. Gubik Andrea
séget leíró változók és a válaszadók nagy száma igényli a változók közötti kapcsolat jellegét és erősségét számszerűsítő módszerek használatát. A kérdések jellegétől függnek a választott módszerek, amit modellépítésnek is nevezhetünk. Általános kutatói gyakorlat, hogy az adatbázis változói önmagukban nem kerülnek felhasználásra, valamilyen szintű összevonás történik, például faktorelemzéssel a változók, klaszterelemzéssel a válaszadók számát redukáljuk. A következőkben nem a szokásos, általános problémákat soroljuk fel, hanem a GUESSS-szel összefüggésben felmerülő kérdéseket vizsgáljuk.
5.1. Alternatív modellek és a tesztelés alternatívái Számos tanulmány központi témája az Ajzen-féle [1991], [2006] modell tesztelése, annak megállapítása, hogy az attitűdök, szubjektív normák és az észlelt magatartási kontroll milyen mértékben határozzák meg a vállalkozásindítási szándékot és magát a tényleges cselekvést. Gyakran találkozhatunk olyan vizsgálatokkal is, amelyek más modellekkel vetik össze, versenyeztetik Ajzen modelljét, és sok esetben a modell kiterjesztésével, további tényezők bevonásával növelik a modell magyarázóerejét. A leggyakrabban a szakirodalomban korrelációs együtthatók útján értékelik a változók közötti kapcsolatot, valamint többváltozós regressziós modellek alkalmazásával igazolják a kutatók által feltételezett ok-okozati összefüggéseket, illetve határozzák meg az elmélet magyarázóerejét. Autio et al. [2001] 3 445 finn, svéd és amerikai hallgató, Gird és Bagraim [2008] 247 dél-afrikai hallgató, Carr és Sequeira [2007] 308 amerikai hallgató vizsgálatával tesztelte ilyen módon a modellt. Krueger munkáiban több alkalommal is tesztelt vállalkozásindítási szándékra vonatkozó modelleket. 1993-ban 126, 2000-ben 97 diák adatait használta fel, és mindkét alkalommal hasonló módszertant alkalmazott, azzal a kivétellel, hogy az 1993-as munkában dichotóm változóval mérte a vállalkozásindítási szándékot, 2000-ben azonban már folytonos változót használt. Első lépésben páronként vizsgálta a modell egyes tényezői közötti kapcsolat erősségét lineáris korrelációs együtthatókkal, a dichotóm változó esetében pedig biszeriális korrelációval. Ezt követően pedig útelemzéssel kalkulálta a vizsgált független változók teljes hatását a vállalkozásindítási szándékra. Tette ezt 1993-ban is, annak ellenére, hogy a szándék mérésére dichotóm változót használt. Multinomiális logisztikus regresszióval dolgoztak Zellweger, Sieger és Halter [2011], valamint Szerb és Márkus [2007] is. A módszer erénye, hogy alacsony mérési szintű, nem normális eloszlású változók esetén is jól alkalmazható. Találunk példát a strukturális egyenlőségek módszerének (structural equation modeling – SEM) alkalmazására is, amelynek célja a változók közötti oksági kapcsolatok minél pontosabb leírása. Ilyen elemzés lelhető fel Kolvereid [1996], Plant és Ren [2010] munkáiban. Statisztikai Szemle, 91. évfolyam 10. szám
1007
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
A vizsgálatokhoz leggyakrabban SPSS szoftvercsomagot használnak, a SEM pedig RISREL vagy AMOS programokból futtatható. Mi a GUESSS-adatbázis elemzése során Ajzen tervezett magatartás-elméletét multinomiális logisztikus regresszió segítségével teszteltük. Ennek oka az volt, hogy a vállalkozási szándék kifejezésére alacsony mérési szintű változót használtunk. A modell alacsony interpretálhatósága mellett is képes a vállalkozásindítási szándékot ténylegesen befolyásoló legfontosabb tényezőket beazonosítani és magyarázóerejük mértékét megadni.
5.2. Multinomiális logisztikus regresszió A kutatás során egyik fő célunk a vállalkozói magatartásra ható tényezők feltárása és hatásuk erősségének számszerűsítése volt. Erre kiválóan alkalmas a regresszióelemzés, egész pontosan annak az adatbázis-változóinak jellegéhez igazított változata, a multinomiális logisztikus regresszió. A regressziós modell természetesen igazodik az elméleti alapvetéshez, a függő változó a „Gondoltál-e már arra, hogy saját vállalkozást indíts?” kérdésre adott válaszok három kategóriába sűrített változata (1. Nem tervez vállalkozást; 2. Vállalkozásindítást tervez; 3. Már vállalkozó). Az eredeti változó kilenc lehetőséget kínál fel. A független modellbeli változók mérésére (attitűdök, észlelt magatartási kontroll és szubjektív normák) összesen 28 változó állt rendelkezésre. Ezek számának tömörítésére főkomponens-elemzést végeztünk. A transzformált változók kerültek végül a modellbe, amelynek legfontosabb adatait a 3. táblázat tartalmazza.4 3. táblázat A változóredukció eredménye Változó száma
Faktorok száma
Faktorok magyarázó ereje (százalék)
Attitűd
4
1
84,42
Szubjektív normák
3
1
82,91
Jellemző
Kontrollálhatóság (észlelt magatartási kontroll) Énhatékonyság (észlelt magatartási kontroll)
9
3
65,83
12
3
69,09
Forrás: A 2011. évi GUESSS adatbázisa alapján, SPSS programcsomaggal végzett számítások. 4
A 2011. évi GUESSS részletes eredményeit bemutató tanulmány megjelenés előtt áll „S. Gubik A.: A magyar hallgatók vállalkozásindítási szándékát befolyásoló tényezők modellje – Ajzen tervezett magatartás elméletének kiterjesztése” címmel.
Statisztikai Szemle, 91. évfolyam 10. szám
1008
Farkas Szilveszter — S. Gubik Andrea
A szükségszerű összevonás a főkomponens-elemzés során az egyes változócsoportokban 15,6 és 34,2 százalék közötti „információvesztéssel” járt. A faktorelemzés még egy problémát felvet, a faktorok függetlenségének problémáját (Czirfusz [2010]). Az első két jellemző esetében ez a probléma elhanyagolható, a harmadiknál és a negyediknél azonban a faktorváltozók további felhasználása során nem hagyhatjuk figyelmen kívül. 4. táblázat A vállalkozásindítási szándék endogén tényezőinek hatása Változó
B
Standard hiba
Wald-teszt
Szignifikancia
Exp(B)
–0,265
0,036
53,379
0,000
–0,177
0,037
23,351
0,000
0,838
–0,369
0,038
93,185
0,000
0,691
0,009
0,039
0,054
0,816
1,009
0,938
0,050
356,364
0,000
2,556
1,205
0,052
536,131
0,000
3,338
–3,840
0,166
537,769
0,000
–0,369
0,099
13,937
0,000
0,691
–0,702
0,090
60,947
0,000
0,495
0,290
0,107
7,288
0,007
1,336
1,791
0,160
125,857
0,000
5,994
1,042
0,147
50,449
0,000
2,835
Vállalkozásindítást tervez Konstans Defenzivitás (észlelt magatartási kontroll – kontrollálhatóság) Passzivitás (észlelt magatartási kontroll – kontrollálhatóság) Kockázattűrés (észlelt magatartási kontroll – énhatékonyság) Innovativitás (észlelt magatartási kontroll – énhatékonyság) Attitűd
Már vállalkozó Konstans Defenzivitás (észlelt magatartási kontroll – kontrollálhatóság) Passzivitás (észlelt magatartási kontroll – kontrollálhatóság) Kockázattűrés (észlelt magatartási kontroll – énhatékonyság) Innovativitás (észlelt magatartási kontroll – énhatékonyság) Attitűd
Megjegyzés. Nagelkerke-féle R2 = 0,47. Forrás: A 2011. évi GUESSS adatbázisa alapján, SPSS programcsomaggal végzett számítás.
A vállalkozásindítási szándék elemzésének következő lépése a magyarázótényezők hatásának vizsgálata. Az adatbázis előbb leírt sajátosságai miatt a multinomiális logisztikus regresszió kínálkozott a legjobb választásnak. Az esélyhányadosok értelmezése olykor nem egyértelmű, mert nem engedik meg eltérő hatások pontos összehaStatisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
1009
sonlítását (Bartus [2003]). A szerző szerint bonyolultabb modellekben az is előfordulhat, hogy az irányt is rosszul állapítják meg. Mi az elemzések során ezért csak a modell együttes magyarázóerejét vettük figyelembe, és a változók egyenkénti szignifikáns hatásáról győződtünk meg. A regresszióelemzés eredményét a 4. táblázat mutatja. A modell szignifikanciájáról a khí-négyzet próba, magyarázóerejéről a Nagelkerke-féle R2 érték ad információt. A változók egyenkénti szignifikáns voltáról a Wald-statisztika segítségével bizonyosodhatunk meg, az esélyhányadosok pedig az egyes váltók parciális hatásának nagyságát mutatják. A vizsgálat eredményei szerint a vállalkozásindítási szándék legfontosabb meghatározói a vállalkozásindítással öszszefüggésben kialakult attitűdök és az énhatékonyság. Mindkét esetben pozitív irányú az összefüggés, ami azt jelenti, hogy minél inkább pozitív az egyén vállalkozásindítással kapcsolatos attitűdje, és minél inkább hisz abban, hogy rendelkezik a szükséges kompetenciákkal, annál nagyobb eséllyel mutat szándékot saját vállalkozás létrehozatalára. A kontrollálhatóság mérésére alkalmazott két változó negatív irányú kapcsolatban van a vállalkozásindítási szándékkal. Ez azt jelenti, hogy minél inkább úgy érzi az egyén, hogy képes irányítani a jövőjét, annál nagyobb eséllyel válhat vállalkozóvá. A vizsgálatok megerősítették, hogy az attitűdök és az észlelt magatartási kontroll valóban meghatározó szerepet játszanak a vállalkozásindítási szándék alakulásában. A szubjektív normák szerepét azonban nem sikerült alátámasztani. Elemzésünk, annak felvetett korlátai ellenére, hasonló eredménnyel végződött, mint a vizsgált modell szakirodalomban fellelhető egyéb tesztjei. Valamennyi vizsgálat (bármilyen operacionalizálási és tesztelési megoldást választottak a kutatók) alátámasztotta az attitűdök és az észlelt magatartási kontroll szignifikáns hatását a vállalkozási szándékra.5 Ugyanakkor a szubjektív normák szerepét nem sikerült egyértelműen alátámasztani. Egyes kutatások szerint szignifikáns hatással van a vállalkozásindítási elképzelésekre (lásd például Kolvereid [1997], Gird–Bagraim [2008]), mások ugyanakkor nem tudták ezt igazolni (pédául Autio et al. [2001], Krueger–Reilly–Carsrud [2000]). A vitatott eredmények a változó újragondolását igénylik. Megoldás lehet annak eltávolítása a modellből. Egyes szerzők a szubjektív norma konceptualizálási hibájaként fogják fel az egymásnak ellentmondó eredményeket (Conner–Armitage [1998]), és ilyen jellegű további finomítást javasolnak a modellen.
6. Összefoglalás Egy módszertanilag jól kidolgozott kérdőíves felmérésbe kapcsolódhattunk be 2006-ban, amely alkalmas a magyarországi egyetemi és főiskolai hallgatók vállalko5
Conner és Armitage [2001] a szakirodalomban fellelhető empirikus munkák közül 185-öt tekintett át és értékelt.
Statisztikai Szemle, 91. évfolyam 10. szám
1010
Farkas Szilveszter — S. Gubik Andrea
zói magatartásának feltáró elemzésére. Ebben a cikkben néhány olyan fontos kérdésre tértünk ki, amelyek a kutatás eredményeire érdemi hatással vannak. A kutatás Ajzen tervezett magatartás-elméletén alapuló koncepciója kiforrottnak tekinthető, alkalmas kiindulási alap következtetéseink levonásához. A kérdések operacionalizálásának módja szintén megfelel a nemzetközi gyakorlatnak és a szerző ajánlásainak. A kérdőív felépítésében és tartalmában egyaránt alkalmas a szükséges adatok begyűjtésére, a visszajelzések hatására a felszínre került hibák korrekciója folyamatosan megtörténik. A kutatás nemzetközi jellegénél fogva a magyar eredmények jól elhelyezhetők a további 25 részt vevő ország „mezőnyében”. 2011-ben már több mint 500 intézmény közel 100 ezer hallgatóját tartalmazó adatbázis adott erre lehetőséget. Az ismétlődő adatfelvételek pedig az elmozdulások irányát és okait is segítenek feltárni. A lekérdezés valamennyi állami felsőoktatási intézményre kiterjed, a néhány tucat vagy néhány száz hallgatóval rendelkező alapítványi és egyházi intézmények kivételével. Az adatfelvételek igazodnak a válaszadás körülményeihez és a válaszadók elérhetőségéhez, noha a hallgatók aktivitásának, a válaszadási hajlandóságnak a növelése egyre nagyobb kihívást jelent. Az adatelemzés során az oksági kapcsolatok meghatározása miatt nem kerülhető ki a matematikai-statisztikai módszerek alkalmazása. Megválasztásukkor szem előtt kell tartanunk az egyes módszerek alkalmazásának feltételeit és következményeit. A módszerek sajátosságából számos torzítási lehetőség következik (információvesztés a változók számának redukciója következtében a faktoranalízisben vagy az oksági kapcsolatok értelmezése miatt a multinomiális logisztikus regresszióban), amelyek a kapott eredményekre is hatással vannak. Bármilyen irányban folynak majd a további kutatások, valós eredmények csak akkor érhetők el, ha segítségükkel meg tudjuk határozni, hogy mely fronton és milyen jellegű beavatkozással lehet a hallgatók vélekedésében és tényleges magatartásában érdemi változást előidézni, azaz ha megtaláljuk a modell három tényezőjének mögöttes mozgatóit, és megértjük azok működését.
Irodalom AJZEN, I. [1991]: The Theory of Planned Behavior. Behavior and Human Decision Processes. Vol. 50. No. 2. pp. 179–211. AJZEN, I. [2002a]: Perceived Behavioral Control, Self-Efficacy, Locus of Control, and the Theory of Planned Behavior. Journal of Applied Social Psychology. Vol. 32. No. 4. pp. 665–683. AJZEN, I. [2002b]: Constructing a TpB Questionnaire: Conceptual and Methodological Considerations. http://www.uni-bielefeld.de/ikg/zick/ajzen%20construction%20a%20tpb%20 questionnaire.pdf
Statisztikai Szemle, 91. évfolyam 10. szám
Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
1011
AJZEN, I. [2006]: Constructing a Theory of Planned Behavior Questionnaire – Brief Description of the Theory of Planned Behavior. http://people.umass.edu/aizen/pdf/tpb.measurement.pdf AUTIO, E. – KEELEY, R. H. – KLOFSTEN, M. – PARKER, G. C. – HAY, M. [2001]: Entrepreneurial Intent among Students in Scandinavia and in the USA. Enterprise and Innovation Management Studies. Vol. 2. No. 2. pp. 145–160. AUTIO, E. [2005]: Report on High-Expectation Entrepreneurship. Global Entrepreneurship Monitor. London Business School. London. http://new.gemconsortium.org/assets/uploads/ 1313506401GEM_2005_High_Growth_Report.pdf AUTIO, E. – KRONLUND, M. – KOVALAINEN, A. [2007]: High-Growth SME Support Initiatives in Nine Countries: Analysis, Categorization, and Recommendations. Edita Publishing Ltd. Helsinki. BÉKÉS G. – MURAKÖZY B. [2011]: Magyar gazellák: gyors növekedésű vállalatok jellemzői és kialakulásuk elemzése Magyarországon. MTA Közgazdaságtudományi Intézet. Budapest. http://media.coauthors.net/konferencia/conferences/5/Gazellak_final.pdf BARTUS T. [2003]: Logisztikus regressziós eredmények értelmezése. Statisztikai Szemle. 81. évf. 4. sz. 328–347. old. CARR, J. C. – SEQUEIRA, J. M. [2007]: Prior Family Business Exposure as Intergenerational Influence and Entrepreneurial Intent: A Theory of Planned Behavior Approach. Journal of Business Research. Vol. 60. No. 10. pp. 1090–1098. CONNER, M. – ARMITAGE, C. J. [1998]: Extending the Theory of Planned Behavior: A Review and Avenues for Further Research. Journal of Applied Social Psychology. Vol. 28. No. 15. pp. 1429–1464. CZIRFUSZ M. [2010]: Faktoranalízis, a látszatmegoldás. Tér és Társadalom. 24. évf. 1. sz. 37–49. old. GIRD, A. – BAGRAIM, J. J. [2008]: The Theory of Planned Behaviour as Predictor of Entrepreneurial Intent Amongst Final-Year University Students. South African Journal of Psychology. Vol. 38. No. 4. pp. 711–724. HARKNESS, J. – SCHOUA-GLUSBERG, A. [2003] Questionnaires in Translation. In: Harkness, J. A. – Van De Vijver, I. R. – Mohler, P. Ph.: Cross-Cultural Survey Methods. Wiley. New York. KOLVEREID, L. [1996]: Prediction of Employment Status Choice Intentions. Entrepreneurs. Entrepreneurship: Theory and Practice. Vol. 21. No. 1. pp. 47–56. KRUEGER, N. F. – REILLY, M. D. – CARSRUD, A. L. [2000]: Competing Models of Entrepreneurial Intentions. Journal of Business Venturing. Vol. 15. No. 5. pp. 411–432. KRUEGER, N. F. [1993]: The Impact of Prior Entrepreneurial Exposure on Perceptions of New Venture Feasibility and Desirability. Entrepreneurship Theory and Practice. Vol. 18. No. 1. pp. 5–21. OECD (ORGANIZATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT) [2002]: High-Growth SMEs and Employment. http://www.oecd.org/dataoecd/18/28/2493092.pdf PAPANEK G. [2010]: A gyorsan növekvő magyar kis- és középvállalatok a gazdaság motorjai. Közgazdasági Szemle. LVII. évf. 4. sz. 354–370. old. PLANT, R. – REN, J. [2010]: A Comparative Study of Motivation and Entrepreneurial Intentionality: Chinese and American Perspectives. Journal of Developmental Entrepreneurship. Vol. 15. No. 2. pp. 187–204.
Statisztikai Szemle, 91. évfolyam 10. szám
1012
Farkas—S. Gubik: Az egyetemi-főiskolai hallgatók vállalkozói attitûdkutatása
SIEGER, PH. – FUEGLISTALLER, U. – ZELLWEGER, TH. [2011]: Entrepreneurial Intentions and Activities of Students Across the World. International Report of the GUESSS Project 2011. Swiss Research Institute of Small Business and Entrepreneurship, University of St.Gallen. St.Gallen. SZERB L. – MÁRKUS G. [2007]: A felsőoktatási környezet hatása a vállalkozói életpálya választására. Nemzetközi összehasonlító elemzés, 2006. Közgazdasági Szemle. LIV. évf. 3. sz. 248–273. old. ZELLWEGER, T. – SIEGER, P. – HALTER, F. [2011]: Should I Stay or Should I Go? Career Choice Intentions of Students with Family Business Background. Journal of Business Venturing. Vol. 26. No. 5. pp. 521–536.
Summary Hungary joined the “Global University Entrepreneurial Spirit Students’ Survey” (GUESSS) research project coordinated and led by the University of St. Gallen, Switzerland in 2006. It evaluates students’ entrepreneurial intentions and activities. In 2011 an online survey addressing 5 677 students was conducted in Hungary. They were asked about their business start-up activities and intentions as well as about the most important factors shaping them. Surveys provide accurate answers to research questions only if their conduct, the motivation of the target groups, the way they are reached and the data analysis are adequate and consistent. Further challenges also arose from the international nature of the research, for example, the cultural interpretation of the questionnaire. The aim of this paper is to highlight the methodological peculiarities of the GUESSS carried out in Hungary by means of Ajzen’s theory of planned behaviour.
Statisztikai Szemle, 91. évfolyam 10. szám
Fórum
Beszélgetés Rappai Gáborral Rappai Gábor 49 éves, statisztikus, a Pécsi Tudományegyetem (PTE) Közgazdaságtudományi Kar Gazdaság-módszertani Intézetének igazgatója. Eddigi életének szinte minden fontosabb momentuma szülővárosához, Pécshez kötődik. Itt végezte általános és középiskolai tanulmányait, a PTE Közgazdaságtudományi Karán szerzett diplomát 1987-ben és doktori címet 1989-ben, itt habilitált 2004ben, és az egyetemen dolgozik a kezdetektől fogva. Az, hogy valakinek manapság szokatlan módon csak egyetlen munkahelye volt, valami unalmas szakmai pályafutást sejtet, ami messze nem valós. Rappai Gábor fiatal kora és látszólag eseménytelen munkahelyi múltja ellenére igen gazdag pályát tudhat maga mögött, hiszen kivételesen magas szintű és sokoldalú tevékenységet folytat az oktatás, az oktatásszervezés, a tudományos kutatások, a gyakorlati munka és a statisztikaiökonometriai szakmai közélet terén. A különböző területeken elért figyelemre méltó eredményei mára a statisztikai szakma megkerülhetetlen személyiségévé tették. Ez, valamint színes egyénisége indokolják, hogy a szokásosnál részletesebb, kimerítőbb beszélgetésben próbáljuk megismerni saját tapasztalatait, terveit, és egyben mértékadó véleményt kapni a magyar statisztika szinte minden létkérdéséről. Kezdjük az elején. Oktatóként indultál, most is az vagy. Melyek voltak eddigi oktatói pályád legfontosabb állomásai? Amikor 1987-ben végeztem, két tanszékre is hívtak oktatónak: az egyik a politikai gazdaságtan volt, a másik a statisztika. Mindkét tárgyat szerettem, mindkettőt szívesen műveltem volna, de döntenem kellett, és a statisztikát választottam. Ennek döntő mód két oka volt: egyrészt úgy gondoltam, hogy a statisztika politikasemleges volta számomra vonzóbb, másrészt nagy hatással volt rám akkori statisztikatanárom, Pintér József, akinek sokat köszönhetek, egyebek közt ezt a – mai szemmel helyesnek tűnő – döntést is. Pályámat nagyban meghatározta az, hogy viszonylag fiatalon, 1990-ben elnyertem egy
DAAD-ösztöndíjat, amellyel a Hamburgi Egyetemen tanulhattam egy évet. A helyzet sajátos volt, mert kutatási témám, a disequilibrium modellek ökonometriája tudvalévő, hogy elsősorban Kornai János munkássága nyomán, szorosan kötődött a szocialista tervgazdálkodáshoz. Az pedig kiérkezésem után néhány nappal, az NDK megszűnésével végleg összeomlott. Ott álltam hát egy semmire se jó témával tanácstalan és tapasztalatlan fiatal kutatóként, amikor mentorom, Heinz Gollnick professzor azt javasolta, hogy kezdjek el pénzügyi idősorokkal foglalkozni, hiszen azok mindig kurrens kutatási témát biztosítanak a piacgazdaságról áttérő gazdaságok elemzői számára, adataik pedig könnyen, gyorsan elérhetők és kezelhetők. Tanácsait megfogadtam, és azóta is a pénzügyi idősorok
Statisztikai Szemle, 91. évfolyam 10. szám
1014
Fórum
elemzését, annak számos vetületét tekintem fő profilomnak. 1992-ben adjunktusnak neveztek ki, majd 1993 és 1995 között levelező aspirantúra keretében készültem fel kandidátusi értekezésem megvédésére. A témám természetesen a pénzügyi idősorok modellezése volt. A védést, melyre 1996-ban került sor, sikerrel teljesítettem. Ezt követően, 1997-ben kineveztek docensnek és 1998-tól kezdve már részt vettem a PTE Közgazdaságtudományi Karának vezetésében. Először dékánhelyettes voltam, majd két és fél ciklus leszolgálása után, 2005-ben dékánná választottak. Két cikluson keresztül, 2005-től 2011-ig voltam az, majd visszatértem a statisztikához, és 2012-től a kar Gazdaságmódszertani Intézetének igazgatója vagyok. Ehhez az intézethez három tanszék (matematika, statisztika és informatika), valamint egy, a szakfordítói képzést irányító csoport tartozik. Eddigi oktatói pályafutásom legszebb eredményének egyébként azt tartom, hogy öt hallgatót sikerült elkormányoznom (témavezetői minőségben) a PhD-fokozatig. Saját tapasztalataid tükrében hogyan látod a magyar statisztikaoktatás problémáit? Sajnos sok problémát látok, sőt úgy is mondhatnám, hogy a statisztika oktatása alapvetően nincs a helyén. Az okok sokrétűek: a statisztika tudományági besorolása, akadémiai szintű kezelése tisztázatlan, rendezetlen, a közoktatásban a statisztika csak minimálisan, és akkor se igazán jó helyen jelenik meg. A köztudatban a statisztika sem úgy, mint az adatokra támaszkodó gondolkodás és érvelés, sem úgy, mint a sztochasztikus gondolkodás és világlátás nem jelenik meg. Ehelyett a köznapi életben rosszízű, a statisztikát dehonesztáló nézetek, vélemények forognak közszájon, amelyek terjedéséhez olykor sajnos a politika is megfelelő táptalajt biztosít. Ez a deformáló-
dott köztudat aztán rányomja bélyegét a felsőoktatásra is, ami pedig szintén nem tudja helyén kezelni a statisztikát: erőlteti a következtetéses statisztikai módszereket, ami viszont a matematikailag egyre kevésbé képzett hallgatótömeg passzív ellenállásába ütközik, így az oktatás jellemző módon öncélú és eredménytelen lesz. Az informatikai támogatást, amely egyre fontosabb szerepet játszik a statisztikában, szintén nem tudjuk jól kezelni: nagyon nehezen lehet megtalálni a helyes utat a minden tartalmi értelmet nélkülöző gombnyomogatás és a passzív szemlélődő demonstrációk közt. Ennek eredménye aztán az lesz, hogy a társadalmi és gazdasági elemzésekben méltatlanul kevés és többnyire nem túl igényes statisztikai módszert használunk, az üzleti, gazdálkodási tudományok területén pedig még ennél is kevesebbet. Pedig a statisztika, mint a társadalomtudományok matematikája, gyorsan fejlődő világunkban, az információs társadalom kiteljesedésével ennél többet érdemel. Tudomásom szerint többször is megkerestek azzal, hogy vállalj el olyan politikai szerepet, amelyben a magyar felsőoktatás legmagasabb szintű irányításában vettél volna részt. Miért utasítottad ezeket vissza? Ezeket a megkereséseket mindig nagyon komolyan megfontoltam, hiszen teljes mértékig tisztában vagyok azzal, hogy a magyar felsőoktatás reformra szorul. Egy ilyen reform különböző oldalakról indulhat, és sok jó megközelítést el lehet képzelni. Magam is tudnék ilyet vagy ilyeneket felvázolni. Mindazonáltal valamennyi reformkísérletnek van egy kritikus pontja: az, hogy a szakmai, oktatásstratégiai szempontokat vagy a politikai, közelebbről területfejlesztési szempontokat tartjuk-e elsődlegesnek. Máshogy megfogalmazva ugyanezt, evidencia, hogy a szétaprózott intézményi
Statisztikai Szemle, 91. évfolyam 10. szám
1015
Fórum
struktúra nyilván nem szolgálja a minőséget, ugyanakkor, ha a felsőoktatás-politika lépéseket fontolgat a koncentráció fokozása érdekében, a politika kihátrál a támogatásából, és egyébként gyakran jogos partikuláris érdekek hangsúlyozásával akadályozza ezeket. Ez aztán odavezet, hogy gyakorlatilag lehetetlen feladatra vállalkozik az, aki ezeket a felsőoktatási intézményi reformokat következetesen végig akarja vinni. Koncepciók, tervek, munkaanyagok készülhetnek, de ezek mind előbbutóbb az íróasztal fiókjában végzik. Én pedig nem akarok az íróasztalfióknak dolgozni. Az oktatás gyakorlása és szervezése mellett folyamatosan részt veszel az egyetem életének irányításában. Ezt mennyire tekinted szívügyednek, illetőleg mennyire olyan tevékenységnek, amit meg kell csinálni, de eltávolít a szűkebb szakmádtól? Úgy gondolom, hogy az a tevékenység, amit ezen a téren kifejtettem, hozzá tartozik a szakmámhoz, hiszen közgazdász végzettségem van, és ez egyebek közt azt is jelenti, hogy a vállalatirányítás, a vállalatszervezés, a projektmenedzsment, az intézményfejlesztés mind a szakmámhoz tartozik. Egyébként az e téren elvégzett munka nagyon érdekes, izgalmas és sokszínű volt, hiszen többek között irányítottam a kar épületegyüttesének teljes felújítását, ami többmilliárdos beruházás kezelését jelentette, levezényeltem a kar oktatásának Bologna-rendszerre való átállását, és vezetőtársaim támogatásával bevezettem az új komplex teljesítményértékelési rendszert, amely három tényezőt (oktatás, kutatás és intézménymenedzsment) vesz figyelembe. Összességében azt mondhatom, hogy a kar méretét, tevékenységét tekintve nagyjából megfelel egy középvállalatnak, így irányítása egy középvállalati vezérigazgató munkájával hasonlítható össze. Visszatérve a kérdésre, a szűkebb szakmámtól
valóban eltávolodtam, de eközben egy sor olyan új tapasztalatra, ismeretre tettem szert, amit nagyon sok helyen tudtam és tudok hasznosítani. „Aki tudja, csinálja, aki nem tudja, oktatja.” Te alighanem valóban tudod, mert az oktatás mellett gyakorlati munkákban is részt vettél/veszel. Kérlek, mutass be néhány gyakorlati feladatot ezek közül! Valóban sok gyakorlati munkában vettem részt. Még kezdő oktató koromban, elsősorban fizetéskiegészítés céljából, bekapcsolódtam a területi szülészfőorvosi hivatal munkájába statisztikusként. A születéssel kapcsolatos rendellenességek csökkentése és kiszűrése érdekében igen nagy adatbázist hoztak létre: a kismamákról 140, a született babákról egyenként 15 kérdést tartalmazó kérdőíveket rögzítettek, így nagyon hamar több tízezer adatot tartalmazó adatbázishoz juthattam. Ennek elemzését az akkori technikának megfelelően a BMDPprogramcsomaggal végeztem. A munka eredményei egyebek közt tizenkét publikációban testesültek meg. Számomra ez a feladat a megjelent cikkeken túl azért volt fontos, mert ezen keresztül alaposan megismerkedtem a sokváltozós elemzések elméleti és gyakorlati problémáival. Ezt követően a DAIWA MKB befektetési bankban végeztem értékpapír-elemzéseket. Nem kis büszkeséggel tölt el az, hogy a DWIX állampapírhozam-index kialakításában, amely hosszú ideig a gyakorlatban is jól működött, az én statisztikusi munkám is fontos szerepet játszott. A harmadik feladatcsoport, amelyben részt vettem, még ma is tart. Elsősorban térségfejlesztési cégek, alapítványok igazgatótanácsaiban, felügyelőbizottságaiban és kuratóriumaiban vagyok jelen, és tanácsaimmal igyekszem segíteni ezek munkáját. Itt főként persze az
Statisztikai Szemle, 91. évfolyam 10. szám
1016
Fórum
irányításban, menedzselésben szerzett tapasztalataimat tudom hasznosítani, de előfordul, hogy becslési, előrejelzési feladatokban a statisztikus véleménye is fontos lehet. Az említett három fő vonulat mellett voltak még további munkáim is, amelyek szinte mindegyike hozzájárult ahhoz, hogy az oktatásban az elméleti igényesség mellett a gyakorlati tapasztalatokat is egyre jobban tudjam érvényesíteni. Egy egyetemi oktató előmenetelének fontos eleme a tudományos pálya. Te időben megszerezted a doktori címet, a kandidátusi fokozatot, habilitáltál, és most az MTA doktori cím megszerzése a következő feladat. Ezzel kapcsolatban felmerül az a kérdés, hogy milyen területen, milyen témában lehet ma egy magunkfajta statisztikusnak esélye a doktori címre, másként szólva az MTA hierarchiájában hol van a statisztika helye? Önálló, tudományok feletti diszciplína-e vagy csak valamely tudományág kiszolgálója? Szerinted miért nem lehet önálló statisztikai doktori címet szerezni, egyáltalán ki és mit tehetne annak érdekében, hogy a mostani, nehézkes, nem ritkán a jelöltek számára megalázó processzusok helyett egy, a teljesítményeket jobban tükröző rendszer alakuljon ki? Ezekről a kérdésekről még 1999-ben közösen írtunk cikket a Statisztikai Szemlében, ám azóta 14 év eltelt, sok új benyomás hatására bizonyára új elemeket tudsz említeni. A lényeg azt hiszem, nem változott. Felfogásom szerint a statisztika transzdiszciplináris tudomány, és legalábbis, mint tudományos módszer, lényegileg független a vizsgálat tárgyától. A statisztikának ez a státusa az, ami elsősorban gondot okoz, ugyanis egy ilyen területen, ha valaki új eredményt akar elérni, két lehetősége van. Vagy módszertani fejlesztést végez, új eljárást, módszert fejleszt ki, ami tudjuk, ezen a területen nagyon nehéz, és jó-
részt a matematika világába tartozik. A másik út új eredmények elérésére az, hogy az alkalmazott szaktudomány, az alkalmazás terén nyújtson újat. Ez azért nehéz, mert a statisztikustól az adott szaktárgyban olyan elmélyülést követel meg, amit a szakma más képviselői (akik nem statisztikusok) mintegy főfoglalkozásban elérnek. A gazdaságtudományban alkalmazott statisztikusoknak a gazdaságtudományokban kell újat mondaniuk. A mostani akadémiai minősítési rendszer nem ismeri el azt a munkát, amit egy statisztikus több különböző feladaton kisegítőként végez. A statisztika, mint szolgálólány nincs megbecsülve, elismerve, még akkor se, ha a statisztikus mint ökonométer olyan elemeket tud belevinni egy gazdasági-társadalmi téma kutatásába, amelyektől az lényegesen jobb, pontosabb, korrektebb lesz. Horribile dictu, a statisztikus adhat érdemi keretet egy-egy kutatásnak, a végén mégis csak „technikai segédmunkának” ítélik meg tevékenységét. Ezen a szemléleten változatni kellene, és nagyobb tudományos elismerést kellene adni az ilyen tevékenységeknek. Az, hogy a Statisztikai Szemlét A kategóriás folyóirattá minősítették, sokat segít a helyzeten, hiszen az említett hiányzó szemlélet így talán egy kicsit több teret nyer. Ami a doktori iskolákat illeti, közismert, hogy főfoglalkozású statisztikusokat képző doktori iskola nincs, jóllehet van néhány, ahol mintegy szakirányként magas színvonalú statisztikusképzés folyik. Úgy gondolom, hogy az önálló statisztikai doktori iskola létrehozásának legfőbb akadálya a meglehetősen kemény és olykor bürokratikus szabályozás mellett az, hogy a statisztikának valójában nincs helye az MTA struktúrájában. Ilyen körülmények között nagyon nehéz lenne egy ilyen iskolát létrehozni. Talán több egyetem és egyéb intézmény összefogásával lehetne valamit kezdeni, de egyrészt az egyetemek most bőven el vannak foglalva saját bajaikkal, másrészt az sem
Statisztikai Szemle, 91. évfolyam 10. szám
1017
Fórum
világos, hogy lenne-e valós kereslet ilyen képzési formára. Az imént említetted a publikációkat. Többen vagyunk, akik oktatási alapmunkákat (tankönyv, szakkönyv) készítettünk, és joggal reméljük, hogy ezek olyan hatást gyakoroltak a szakmára, mely a hivatkozásokon keresztül a minősítéseknél is komolyan esik latba. Szerintem ez nem egészen így van. Mi a véleményed erről? A tudományos minősítési rendszer egyik leglényegesebb eleme, egyben a tudományos teljesítmény jól megragadható fokmérője kétségtelenül a publikáció és természetesen a publikációkra történő hivatkozás. Ezzel mérhető le, hogy egy szerző vagy egy mű milyen hatással van a szakmai környezetére. Sajnos ma Magyarországon a mi szakmánkban az a helytelen gyakorlat kezd kialakulni, hogy a módszertani ismereteket köztudottnak tekintik, az azokat tartalmazó alapmunkákat, szak- és tankönyveket meg sem hivatkozzák. Az is gyakori, hogy hivatkozásul olyan idegen, jellemző módon angol nyelvű tankönyveket adnak meg, amelyeknél esetenként színvonalasabb, a hazai sajátosságokat jobban figyelembe vevő, kényelmesebben hozzáférhető magyar könyv is létezik. Valahogy a szakma mintha szándékosan negligálná azokat az alapmunkákat, amelyeken felnevelkedett. Sajnos ez a szemlélet a Statisztikai Szemlében is egyre inkább teret nyer. Ez pedig együtt azzal, hogy a tudományos teljesítmények értékelésekor az ezekre való hivatkozások kisebb súllyal esnek latba, méltatlanul hátrányos helyzetbe hozzák azokat, akik ebbe a műfajba sok munkát fektettek. Tevékenységed elengedhetetlen része az is, hogy aktív szerepet vállalsz a szakmai társadalmi életben. Ez a munka olyan sokrétű, hogy
szinte fel se lehet minden elemét sorolni. Arra kérlek, emelj ki ebből egy-két fontosat, és azokról ossz meg velünk néhány gondolatot! Már igen korán, fiatalon ért az a nagy megtiszteltetés, hogy az MTA Statisztikai Bizottsága tagjai sorába választott. Emellett megalakulása óta tagja vagyok a Gazdaságmodellezési Társaságnak és a rendszerváltás utáni újjáalakulása óta a Magyar Statisztikai Társaságnak. Az utóbbi választotta meg az Etikai Kódex (EK) által életre hívott Etikai Testületet (ET), majd ez a testület választott meg engem elnökének 2010-ben. 1999 óta vagyok tagja a Statisztikai Szemle Szerkesztőbizottságának, és ehhez kapcsolódott az a tevékenység, amely során a KSH keblén belül a szakkönyvkiadás újraélesztését vettük tervbe. Az ezt irányító Kiadói Tanács elnökévé neveztek ki, és itt kell elmondanom, hogy a sajnálatosan rövid életű szakkönyvkiadás máig is sikertörténet: néhány év alatt öt színvonalas statisztikai szakkönyvet adtunk ki, amelyek széles körben használatosak a szakmában, ugyanakkor számottevő üzleti eredményt is hoztak a KSH-nak. Ez a Kiadói Tanács formálisan ma is létezik, de közel egy évtizede sajnos csak papíron. Ami a folyóiratokat illeti, társszerkesztője vagyok ma is a SZIGMA-nak és két külföldi (egy szlovén és egy horvát) egyetemi szakmai folyóiratnak. Végezetül megemlítem, hogy 2005-től két cikluson keresztül egyike lehettem a tudomány képviselőinek az Országos Statisztikai Tanácsban. Gondolom, ezeket a tevékenységeket kellően elismerte a szakma. Igen, sok díjat, kitüntetést kaptam. Ha csak a szakmai elismerésekről beszélünk, 2000-ben megkaptam a KSH alapította Fényes Elek Emlékérmet, 2010-ben a Magyar Statisztikai Tár-
Statisztikai Szemle, 91. évfolyam 10. szám
1018
Fórum
saság Keleti Károly Emlékérmét, 2011-ben pedig a Fényes Elek-díjat, amit az illetékes minisztérium ad ki a statisztika szolgálatáért.
lene foglalkoznunk, hanem inkább egyfajta felvilágosító munkával. Kérlek, mondj valamit az ET munkájáról!
Ez lényegileg minden, amit egy statisztikus a szakmától kaphat, de térjünk vissza az Etikai Testületre. Elárulhatom neked, hogy ennek az interjúnak az ötlete elsősorban annak kapcsán merült fel, hogy te vagy ennek a testületnek a vezetője, és egy veled készülő, a statisztikai etika kérdéseit, illetőleg az ET munkáját boncolgató interjú a szakma előterébe állítaná ezt a fontos kérdést. Először talán azt kérdezem, hogy szerinted melyek a statisztika etikájának legfontosabb kérdései? Nagyon nehéz erre a kérdésre válaszolni, s magam is egyre többet töprengek ezen. Hol végződik a szabálytalan és hol kezdődik a szabályos, de etikátlan magatartás? Meddig tart a szakma, és hol kezdődik a politika – egy enynyire átpolitizált világban, mint amilyenben élünk, ez szinte kulcskérdés. Meddig tart a nem hivatásos statisztikusok esetén a jó szándékú hozzá nem értés, és hol kezdődik az etikátlan sandaság? Ezek nagyon nehezen megválaszolható kérdések, pedig lényegesek a valódi etikus magatartás megítélésekor. Megítélésed szerint az MST Etikai Kódexe alkalmas-e arra, hogy ezekre a kérdésekre választ adjon, illetőleg az ezekkel kapcsolatos problémákat helyes mederbe terelje? Ezt sem tudom igazán megítélni. Jó, hogy a magyar statisztikának van egy érvényes és hatályos Etikai Kódexe, de abban már nem vagyok biztos, hogy ez hibátlan, és jól szolgálja a kitűzött célokat. Egyre inkább hajlok arra a véleményre, hogy az etikátlan magatartás alapvető okát a statisztikai kultúra hiányában keressem. Ha pedig ez így van, akkor elsősorban nem a szankciókkal és a szankcionálással kel-
Az ET a megalakulását követő első évben arra törekedett, hogy kialakítsa a maga munkarendjét és -módszerét. Ezért ebben az időszakban régen megtörtént, illetőleg fiktív („megtörténhetett volna”) eseteket képeztünk, és azokat tárgyaltuk meg. Ez a munka hasznos volt, hiszen sok problémára fényt derített, és eredményeképp javaslatokat is megfogalmaztunk az MST-választmány felé az Etikai Kódex pontosítására, illetve módosítására. Amikor azonban befejeződött ez a munkaszakasz, és vártuk a valódi ügyeket, nem történt semmi, az ET-hez mindezidáig egyetlen érdemi ügy sem került. Véleményed szerint hogyan lehetne hatékonyabbá tenni az etikai problémák megoldására irányuló munkát? Valószínűleg lehetne módosítani az EK néhány rendelkezésén. Így például alighanem hatékonyabbá tenné a munkát egy kisebb létszámú testület, amelynek nem lennének előírva kötelező foglalkozások. Az is lehet, hogy a munkamódszert kellene megváltoztatni, hiszen jelenleg az ET csak a hozzá beérkező panaszokkal foglalkozik, nem tud elé menni a dolgoknak. Az teljesen rendben van, hogy nincs nyomozati jogköre, de jelen helyzetében teljes passzivitásra van ítélve. Meggondolandó lenne például a svájci modell bevezetése, ahol az ottani etikai testület rendszerességgel ad ki a mindenkori legkomolyabbnak ítélt esetekről általános, a szereplőket meg nem nevező, inkább elvinek tekinthető állásfoglalást. Hol merülhetnek fel etikai problémák? A köznapi életben aligha, hiszen itt elsősorban a tudatlanság vezet(het) etikátlan magatartásra. A hivatalos statisztikában szintén nem való-
Statisztikai Szemle, 91. évfolyam 10. szám
1019
Fórum
színű, hiszen az adatelőállító-folyamat és az adatközlés olyan, a jogszabályokra épülő minőségi szűrőkön megy keresztül, annyira transzparens, hogy aligha merülhet fel az etikátlanság gyanúja. Az etikai kérdések – felfogásom szerint – leginkább az adatelemző, -felhasználó, -modellező szférában, a profi alkalmazók körében vetődhetnek fel olyan pontokon, mint az egyes eljárások, modellek helyes használata, az alkalmazási feltételek korrekt kezelése, a modellezőnek, alkalmazónak nem tetsző eredmények közlése vagy elrejtése stb. Ezek valódi etikai kérdések, de nagyon nehéz, gyakorlatilag lehetetlen a tettenérésük. Mindenesetre a modellezés vagy általánosabban az alkalmazások etikai kérdései olyan bonyolultak, ellentmondásosak, hogy szinte külön tanulmányt igényelnének. Látva ezeket a nehézségeket, az EK-val és az ET-vel kapcsolatos gondokat, valamint azt, hogy még te is elbizonytalanodsz ezen problémák láttán, újra fel kell tennem, immár szinte kétségbeesetten a kérdést, mit lehet tenni annak érdekében, hogy a statisztika etikusabbá váljék? A helyzet valóban nem jó. Szomorúnak tartom, hogy azon az MST választmányi ülésen, ahol ezek a problémák már kirajzolódtak, a választmány tudomásul vette a problémákat, de érdemben nem foglalkozott vele. Mit lehetne tenni? Bizonyára kellene javítani a EK megfelelő rendelkezésein, alighanem valamit segítene az ET-re vonatkozó szabályozás felülvizsgálata, de hosszú távon csak a statisztikai kultúra javulása hozhat érdemi eredményt. Ez pedig nem fog egy-két év alatt lényegesen megváltozni. Addig nem marad más, mint az, hogy a témáról minél többet beszéljünk szakmai fórumokon: az MTA-bizottságban, az MST rendezvényein, más szakmai-társadalmi fórumokon tartsuk melegen a témát, próbáljuk
meg a szakmai közvéleményt oda formálni, hogy aktívabban lépjen fel az esetleg tapasztalt etikátlan magatartással szemben, keressük a legjobb gyakorlatot, tanulmányozzuk más országok és más szakmák tapasztalatait, azaz próbáljunk meg kis lépésekkel előrehaladni. Jóllehet igyekeztem miden területre, tevékenységre kitérni, megkérdezem, hogy maradte olyan téma a statisztikán belül, amelyről még szívesen beszélnél. Igen, bár erről részben már beszéltünk. Úgy gondolom az egész statisztika nincs a helyén sem a közgondolkodásban, sem az alkalmazásokban, sem a tudományos struktúrában, sem az oktatásban. Két vetületére szeretnék utalni. Egyrészt a sztochasztikus szemléletre, amit már kiskorban jó lenne a gyerekekbe nevelni. Meg kell mutatni azt, hogy a világ nem determinisztikus, ugyanaz az ok esetenként és látszólag megmagyarázhatatlanul más okozatokhoz vezet. A világ tele van véletlennel, amiket kiküszöbölni nem lehet, de a véletlennel együtt kell élni. Készülni kell minden cselekedetünkben, minden tervezéskor a véletlenre, úgy, hogy azt igazán nem ismerjük. Tudatában kell lennünk annak, hogy a statisztika valójában a véletlent akarja modellezni, megismerhetővé tenni, megragadni. Nem kiküszöbölni, hanem kezelhetővé tenni. Ez a szemlélet szerintem nagyon hiányzik a társadalomból. A statisztika másik oldala, arca nem kevésbé fontos. Arra gondolok, hogy a gyakorlati statisztika alapja az, hogy adatokat, tényeket, információkat gyűjt, rendez, és azokból von le következtetéseket. A statisztika megteremti a tényeken, az adatokon alapuló érvelés lehetőségét, ami szerintem ismét csak nagyon hiányzik a közgondolkodásból. A példákon, analógiákon, „blikkfangos” mondásokon alapuló újságírói stílusú érvelést fel kellene váltani az
Statisztikai Szemle, 91. évfolyam 10. szám
1020
Fórum
említett adatalapú, statisztikai természetű vitákkal. Manapság elsősorban a telekommunikáció és az informatika fejlődése nagyon megkönnyítette az adatokhoz való hozzájutást, sőt az azok feldolgozásához szükséges eszközöket is szinte minden érdeklődő kezébe adta. Szélesebb körben kellene ezzel élni, mert azt látjuk, hogy bár a műszaki, orvosi, biológiai, meteorológiai stb. gyakorlatban a statisztika domináns módszertanná válik, és a társadalmigazdasági életben is a nagyvállalatok, bankok, központi állami szervek kiterjedten és magas színvonalon alkalmazzák a statisztikát, a kis és középvállalati szektorban jó, ha az elemzések során eljutnak a legegyszerűbb statisztikai eszközökig, a viszonyszámokig, statisztikai ábrákig, esetleg a kereszttábla-elemzésekig. A köznapi ember pedig jószerivel csak rosszízű adomákat tud mondani a statisztika kapcsán. A statisztika ilyetén polarizálódása pedig nem segít a korábban említett szemléleti kérdések megoldásában. Befejezésül kérlek, mondj néhány szót arról, mik a terveid a jövőre, hogyan képzeled az elkövetkező évekre saját munkádat, pályádat! Gondolom, az eddigiekből kiderül, hogy pályámat egyetemi oktatóként képzelem el a jövőben is. Természeten nem zárkózom el az egyetemi, illetőleg szakmai társadalmi feladatoktól vagy éppen a gazdasági-társadalmi életben való tanácsadói közreműködéstől, de alapvetően kötődök az egyetemhez. Ahhoz pedig, hogy ezen a területen tovább tudjak haladni, mielőbb lépnem kell egyet a tudományos hierarchiában, azaz meg kell szereznem az MTA doktora címet. Erre tudatosan készülök egyfelől a szükséges feltételek (publikáció, társa-
dalmi-szakmai munka) megteremtésével, másrészt a dolgozat írásával. Tervezett témám a gazdasági idősorok modellezése az információs társadalomban. A dolgozat címe még nem végleges, de mindenképpen szeretnék benne foglalkozni azokkal a problémákkal, amelyekkel egy statisztikus-elemző a XXI. század elején a gyakorlati problémák megoldása során konfrontálódik. Így foglalkozom a nemekvidisztans idősorok kezelésével, az időbeli aggregálás és a volatilitás becslésének kérdéseivel, általánosabban a „big data” problémával, az informatikai eszközök statisztikai alkalmazásával, az adatbányászat aktuális vonatkozásaival, ezeken túl pedig a modellező etikai felelősségével, valamint a szakmai és etikai szempontok összeegyeztethetőségének kérdéseivel. A tudományos előmenetel számomra ahhoz szükséges, hogy megvalósítsam régi álmomat, kinevezzenek a PTE egyetemi tanárának. Az, hogy erre törekszem, nem öncélú, hanem abban bízom, hogy egyetemi tanárként nagyobb befolyással fogok rendelkezni mind egyetemen belül, mind a statisztikus szakmában, és talán jobban figyelnek majd rám akkor, amikor a statisztikus szemlélet elterjesztését, a statisztikatudomány állapotát, a statisztikaoktatás megreformálását teszem szóvá. Meggyőződésem ugyanis az, hogy a magam választott szakterületén így tudok a leginkább hasznára válni az országnak. Mindehhez erőt, jó egészséget és sok sikert kívánok, és köszönöm a beszélgetést. Dr. Hunyadi László, egyetemi tanár E-mail: E-mail:
[email protected]
Statisztikai Szemle, 91. évfolyam 10. szám
1021
Fórum
Hírek, események Kinevezés. Dr. Németh Zsolt, a KSH társadalomstatisztikai elnökhelyettese 2013. szeptember 15-ei hatállyal Pajtásné Gál Erikát a hivatal Miskolci főosztálya Egri osztályának osztályvezetőjévé nevezte ki. A Nemzetközi Statisztikai Intézet 59. Statisztikai Világkongresszusát a hongkongi Kongresszusi és Kiállítási Központban rendezte 2013. augusztus 25. és 30. között. A rendezvény lehetőséget nyújtott a nemzetközi statisztikai közösségnek, hogy megosszák egymással legújabb ismereteiket. A tudományos program számos kérdést ölelt fel, így különböző statisztikai területek szakértői és gyakorlati szakemberei cserélhettek tapasztalatot. A tematikus napon a résztvevők a „Fiatalok” témával és az ehhez kapcsolódó kérdésekkel foglalkoztak különböző statisztikai szempontok alapján. Magyarországot tíz fő képviselte. Előadást tartott dr. Laczka Éva, a KSH gazdaságstatisztikai elnökhelyettese, Bánhegyi Péter, a Magyar Nemzeti Bank vezető statisztikai elemzője, dr. Kovács Péter, a Szegedi Tudományegyetem tanszékvezető egyetemi docense és Lengyel György, a KSH főosztályvezetőhelyettese; posztert állított ki Gerencsér Ákos főtanácsos, Kovács Benedek főtanácsos, Ritzlné Kazimír Ildikó vezető-tanácsos és Varsányi Tamás tanácsos. A témák fontosságára való tekintettel a Journal of Mathematics and System Science folyóirat dr. Laczka Éva előadását (Integration of Agricultural Census and Population Data (A mezőgazdasági összeírási és a népességi adatok integrálása)), míg a Statistical Journal of the IAOS a dr. Laczka Éva által szervezett és elnökölt, „Role of Population and Housing and Agricultural Censuses in the National Statistical Systems” (A népszámlálás, a lakás- és a mezőgazdasági összeírás szerepe a nemzeti statisztikai rend-
szerekben) elnevezésű szekció teljes anyagát fogja közzétenni. Hongkongban került sor az Európai Statisztikai Társaságok Szövetségének soros tanácsi ülésére is, ahol a Magyar Statisztikai Társaság már teljes jogú tagként vett részt. „Szegénység térkép 2005” címmel rendezett a Központi Statisztikai Hivatal műhelybeszélgetést 2013. szeptember 10-én az Árvay János-teremben. Nyílt napot tartott a Központi Statisztikai Hivatal 2013. szeptember 20. és 22. között a Kulturális Örökség Napjai és a Statisztika nemzetközi éve, 2013 programsorozat keretében. Az első nap meghívott vendégei és a hivatal dolgozói pódiumbeszélgetést hallhattak a GDP modernizációjáról és a jóllétről. A következő két napon pedig bárki körbejárhatott a műemlék épületben, érdekes információkat tudhatott meg a hivatal 145 éves történetéből, bepillanthatott a statisztika kulisszatitkaiba, a KSH Könyvtár működésébe, kipróbálhatta a vizualizációs technikákat és néhány percig statisztikussá válhatott. Ezeken túl többek között „vény nélkül kapható adatok,” szakdolgozat-tanácsadás, plakátkiállítás, filmvetítés és kedvezményes könyvvásár is várta a betérőket. „Másfél évszázad a statisztika szolgálatában” címmel tartott konferenciát a KSH Könyvtár 2013. szeptember 10-én a „Statisztika nemzetközi éve, 2013” programsorozat keretében a hivatal Keleti Károly-termében. A résztvevők, akiket dr. Vukovich Gabriella, a KSH elnöke köszöntött, a következő előadásokat hallhatták: 1. A Központi Statisztikai Hivatal könyvtárának első harminc éve (Lencsés Ákos, a KSH Könyvtár osztályvezető-
Statisztikai Szemle, 91. évfolyam 10. szám
1022
Fórum
je), 2. Másfél évszázad – élő örökség. A Központi Statisztikai Hivatal könyvtára és könyvtárosai (Rózsa Dávid, a KSH Könyvtár osztályvezetője), 3. A Történeti Statisztikai Kutatócsoport vázlatos története (1954–1985) (dr. Faragó Tamás, a Budapesti Corvinus Egyetem egyetemi tanára) és 4. Statisztika és történelem
mezsgyéjén: Thirring Lajos munkássága és életútja a KSH Könyvtár kézirattárának iratanyaga alapján (Kovács Csaba, a KSH Könyvtár kézirattárosa). A konferencia moderátora Fülöp Ágnes, a könyvtár főigazgatója volt. Az előadásokat követően portrégaléria avatására került sor az intézmény folyosóján.
A Nemzetközi Statisztikai Intézet (International Statistical Institute – ISI) fontosabb konferenciaajánlatai (A teljes ajánlatlista megtalálható a http//:isi.cbs.nl/calendar.htm honlapon.) Moszkva, Oroszország. 2013. december 2–6. „Oroszország gazdasági és társadalmi területeinek modernizálása: kvantitatív kutatási módszerek” nemzetközi konferencia. (International conference “Modernization of Economics and Social Spheres in Russia: Quantitative Research Methods”.) Kapcsolat: Elena Fedotova Telefon: (499)-237-95-03 E-mail:
[email protected] Honlap: www.rea.ru
Ulm, Németország. 2014. március 6–8. Gazdaságmatematikai modellezési, elemzé-
si és szimulációs konferencia. (Conference on Modelling, Analysis and Simulation in Economathematics.) Honlap: http://graduiertenkolleg.gpsd-ulm2014.de
Dallas, Egyesült Államok. 2014. március 7–9. Rendezett adatok elemzése, modellek és egészségügyi kutatási módszerek. (Ordered Data Analysis, Models and Health Research Methods.) E-mail:
[email protected] Honlap: faculty.smu.edu/ngh/hnnconf.html
Statisztikai Szemle, 91. évfolyam 10. szám
Szakirodalom
Könyvszemle Pontossági követelmények és varianciabecslés az Európai Statisztikai Rendszer háztartás-statisztikai felvételeihez. Kézikönyv. Handbook on Precision Requirements and Variance Estimation for ESS Households Surveys. Publication Office of the European Union. 2013. Luxembourg. A kézikönyv letölthető: http://epp.eurostat.ec.europa.eu/portal/page/port al/product_details/publication?p_product_code=KSRA-13-029
A kézikönyv az Európai Statisztikai Rendszerhez (European Statistical System – ESS) tartozó nemzeti statisztikai intézetek módszertanért felelős vezetői (ESS Methodology Directors’ Group – DIME), valamint az Eurostat Módszertani Igazgatósága által létrehozott, nemzetközi összetételű munkacsoport tevékenységének eredményeként készült el. Az első változatot egymástól függetlenül öt lektor olvasta át 2011 utolsó hónapjaiban; őket olyan országok nemzeti statisztikai intézetétől kérték fel, ahonnan nem delegáltak tagot a munkacsoportba. A lektorok egyhangúan az első változat „kisebb módosítások” melletti elfogadását terjesztették elő. Javaslataikat további szakértők bevonásával a DIME és a munkacsoport tagjai a lehetőségek határain belül a legjobb eredmény elérésére törekedve vitatták meg. A kézikönyv végül 2013 júliusában jelent meg az Eurostat honlapján. A kötet célja olyan standard fogalmak kialakítása a varianciabecslésen alapuló pontossági követelmények területén, amelyek egyértelművé teszik a mintavételes eljárásokból
(Leslie Kish amerikai statisztikus szóhasználatával élve reprezentatív megfigyelésekből) származó adatok használatát az Európai Unióban, ezen belül az Eurostat és a nemzeti statisztikai intézetek közötti együttműködésben. Ehhez a szándékhoz szorosan kapcsolódik a varianciabecslés céljára jelenleg rendelkezésre álló módszerek és szoftverek áttekintése, valamint ezzel összefüggésben, ajánlások megfogalmazása a „jó módszerek” használatára, illetve a „rosszak” kerülésére. Tekintettel a számottevő különbségekre az egyes uniós tagállamokban használt mintavételi tervek és becslési eljárások között, a kézikönyv ajánlásokat tartalmaz a módszerek harmonizálására és ahol lehet, az integrálásra is, de nem hiányoznak belőle azok a javaslatok sem, amelyek a tagországok statisztikai intézetei számára megkönnyítik a pontossági követelmények teljesítését. Az ESS háztartás-statisztikai felvételei között kitüntetett szerepet játszik a munkaerőfelmérés (Labour Force Survey – LFS), illetve a jövedelem- és életkörülmények-felvétel (EU Statistics on Income and Living Conditions – EU-SILC), ami rányomja bélyegét a kézikönyvre is: az ajánlások és az illusztrációként bemutatott példák többsége e két felvétel valamelyikéhez kapcsolódik. Ennek következtében a kötetet azok forgathatják a legnagyobb haszonnal, akik ezek valamelyikével foglalkoznak. Ugyanakkor a tárgyalt fogalmak és módszerek – a könyv címével összhangban – az ESS további háztartás-statisztikai felvételeire is alkalmazhatók. A kötet a következő szerkezeti egységekre tagolódik: 1. Bevezetés; 2. Pontossági követelmények; 3. Ajánlott eljárások a szórásnégy-
Statisztikai Szemle, 91. évfolyam 10. szám
1024
Szakirodalom
zet becslésére; 4. A standard hiba számszerűsítése országos szinten és az európai statisztikákban; 5. A pontossági követelmények teljesítésének lehetőségei; 6. Irodalom; 7. Függelék; Tárgymutató. (A 2–5. fejezetek alfejezetekből állnak, ezek tartalmazzák a fejezetek témájával kapcsolatos ajánlásokat.) A továbbiakban a kézikönyv fejezeteinek és egyéb szerkezeti egységeinek tartalmát ebben a sorrendben mutatjuk be. Jelen ismertetés eddigi része már tárgyalta a Bevezetésben leírt legfontosabb célokat és elveket. A „Pontossági követelmények” című fejezet azt a kétféle lehetőséget ismerteti, amelyekkel ezeket a követelményeket megfogalmazhatjuk, tehát a (relatív) standard hiba és a minimális effektív mintanagyság alkalmazását. A kétféle megközelítés között a mintanagyság és a becsült standard hiba összefüggése teremt kapcsolatot, amihez azonban a Leslie Kish által bevezetett design effect (a.m. a mintavételi terv hatása) mutatóra is szükség van, hacsak nem visszatevés nélküli, egyszerű véletlen mintával van dolgunk – tehát gyakorlatilag mindig. (A design effectről részletes ismertetés található a Függelékben). A fejezetben találunk ajánlásokat arra vonatkozóan, hogy mikor célszerű és mikor nem relatív standard hibát alkalmazni a pontossági küszöb minőségében, tehát például akkor nem, ha nullához közeli aránnyal van dolgunk, amikor a relatív standard hiba abszolút értéke nem korlátos. A tekintett populáción belüli tartományok mutatóival kapcsolatos pontossági határokra nézve is kapunk javaslatokat, például arra, hogy lehetőleg ne alkalmazzunk pontossági követelményeket olyan tartományoknál, amelyek nagyságáról csupán a felvétel végrehajtása után szerzünk információt. A 3. fejezet az ESS háztartás-statisztikai mintáiban alkalmazott mintavételi eljárásokról és varianciabecslő módszerekről nyújt átfogó képet. A minták végső mintavételi egysége ál-
talában a személy vagy a háztartás, az alkalmazott mintavételi eljárások többsége közismert – egyszerű véletlen kiválasztás visszatevés nélkül, csoportos mintavétel, szisztematikus mintavétel, mindez rétegzéssel vagy rétegzés nélkül; egy- és többlépcsős mintavétel stb. Az olvasó megfelelő képet kap a pontosság és a torzítatlanság, a közvetlen és a közvetett mintavétel, valamint a többlépcsős és a többfázisú kiválasztás közötti különbségről. A kevésbé ismert módszerek közül a fejezet bemutatja a kiegyenlített mintavétel (balanced sampling) alapelveit is. Ennek a résznek – vagy talán a kézikönyv egészének – a gerincét a varianciabecslő módszerek tárgyalása adja; a 3.3–3.5. alfejezetek nagyjából lefedik azt, amit ez a tudományág napjainkban a felhasználóknak kínál. A kulcsszavak itt a következők: analitikus módszerek (ezeken belül egzakt és közelítő módszerek); linearizáláson alapuló módszerek; a minta másodlagos feldolgozásán alapuló módszerek (replication methods: jackknife, bootstrap, kiegyensúlyozott félminták stb.); általánosított varianciafüggvények (generalized variance functions). Ajánlások segítik a felhasználókat abban, hogy adott számítógépes környezet esetén miképp mérlegeljenek, figyelembe véve a kívánt pontosság és a számítási költségek egymással ellentétes szempontjait, továbbá, hogy milyen varianciabecslő módszert válaszszanak, ha a becslések ingadozásának bizonyos összetevői, illetve ezek forrásai azonosíthatók (például közvetett mintavétel, rekordvagy kérdésszintű meghiúsulás, imputálás és – nem várt esetként – a kalibrálás). Külön alfejezetben találunk egy ugyancsak átfogó összeállítást, természetesen megfelelő ajánlásokkal arról, hogy varianciabecslés céljából milyen szoftvereszközök közül válogathatnak az ESS háztartás-statisztikusai. Az ajánlott varianciabecslő eljárásokat és a hozzájuk tartozó szoftvereszközöket tárgyaló alfejezeteket a Függe-
Statisztikai Szemle, 91. évfolyam 10. szám
1025
Szakirodalom
lék 7.4. és 7.5. alfejezetei táblázatos formában egészítik ki; a táblázatok azt mutatják, hogy egyes gyakran használt mintavételi tervek milyen típusú mutatók becslését és varianciabecslő eljárások, illetve kész szoftvereszközök alkalmazását teszik lehetővé. Két megjegyzés a 3. fejezet eddigiekben ismertetett részéhez. 1. Közismert tény, hogy napjainkban a háztartás-statisztikai felvételekben kalibrált becsléseket használnak, és ezeknél sima statisztikák esetén, egyszerű feltételek mellett a varianciabecslés leggazdaságosabb módja annak a becsült szórásnégyzetnek a közelítő jelleggel való használata, melyet a tekintett mutatóhoz az általánosított regressziós módszer mint kalibrálási eljárás mellett kaptunk volna. A háztartás-statisztikákra jellemző populációk és mintanagyságok mellett ezt a közelítést akkor alkalmazhatjuk, ha a kalibrálás segédváltozói a regressziós becslésnél ugyanazok, mint a tekintett felvétel végleges mintasúlyainak meghatározásához használt eljárásban. Ennek a varianciabecslési eljárásnak tipikus alkalmazási területe a munkaerőfelmérés, amelynél mind a létszámadatok, mind pedig a ráták esetén olyan általánosított regressziós becslésen alapuló közelítés alkalmazható, ami Taylor-linearizáláson alapuló eljárásnak is tekinthető. Nemlineáris statisztikák, például kvantilisek esetén azonban ez az út nem járható, viszont a linearizálás két, viszonylag új keletű, a „becslő egyenleteken” (estimation equations), valamint a „hatás egyenletén” (influence equations)1 alapuló módja átveszi azt a szerepet, amelyet sima statisztikák esetén a Taylor-linearizálás játszik a varianciabecslésben. Konkrét alkalmazásra az EU SILC-ben találunk példát. Ezek a linearizálási módszerek és alkalmazásuk 1997 és 2009 között megjelent publikációkban lát1
Ismeretem szerint általánosan elfogadott, megfelelő magyar kifejezés még nincsen.
tak napvilágot. Célszerű lenne ezt az eljárást beilleszteni a KSH eszköztárába. 2. A kézikönyv az R programozási nyelv és az abban készült programcsomagok használatát a „jó módszerek” közé sorolja, ami középtávon a nemzeti statisztikai intézmények szintjén is korlátozhatja a nagy kereskedelmi szoftverek (SAS, SPSS, Stata) hegemóniáját. A 3.6. alfejezetben néhány EU-tagállam (Lettország, Olaszország, Luxemburg és Franciaország) nemzeti statisztikai intézete varianciabecslésének gyakorlatából származó példákkal találkozunk. Lettország háztartásstatisztikai felvételeiben saját fejlesztésű, Rnyelvben írt varianciabecslő programot használnak, amely Osiernek egy 2012-ben (!) publikált eredményén alapul. A 3. fejezet utolsó részének tárgya az időbeni változások mérése és az ehhez tartozó varianciabecslési módszerek. Itt az időbeni változások megfigyelésére használt minták – többségükben panelminták – típusainak áttekintése mellett három témakör részletes kifejtésével találkozunk: az éves átlagok, valamint az időbeni nettó és bruttó változások becslésének feladatával, ideértve az ezekhez tartozó varianciabecslés módszerét is. Figyelemre méltó, hogy az utolsó két témakörben az irodalmi hivatkozások többsége 2000 utáni. A 4. fejezetben az Eurostat és a nemzeti statisztikai intézetek, tehát a tagállamok közötti együttműködés három lehetséges stratégiájával ismerkedhetünk meg, amelyek olyan kiemelt fontosságú folyamatos felvételek szempontjából játszanak lényeges szerepet, mint például a munkaerő-felmérés, illetve a jövedelem- és életkörülmények-felvétel. A jelenlegi gyakorlatban decentralizált stratégia valósul meg. A nemzeti statisztikai intézetek meghatározzák az Eurostat által megadott mutatók becslését a hozzájuk tartozó standard hibával, adott részletezésben. Az Eurostat a tagállamokat technikai rétegekként kezelve, ezek-
Statisztikai Szemle, 91. évfolyam 10. szám
1026
Szakirodalom
ből az adatokból állítja elő a megfelelő európai statisztikákat a hozzájuk tartozó standard hibával együtt. Ennél a stratégiánál a nemzeti statisztikai intézetek csupán aggregátumokat adnak át az Eurostatnak, elemi adatok átadására nincs szükség. Ez az út komoly szakmai felelősséget ró az egyes tagállamok nemzeti statisztikai intézeteire, és a sokféle mintavételi terv, illetve a különböző varianciabecslési módszerek miatt az Eurostat nem tudja ellenőrizni, hogy az alkalmazott módszerek a „jók” körébe tartoznak-e vagy sem. További hátrány, hogy a rendszer nem rugalmas, csak előre megadott bontásokat tud kezelni. A teljesen centralizált stratégia esetén mind az egyes nemzeti statisztikák, mind pedig az európai statisztika számára az Eurostat állítaná elő a szükséges mutatók standard hibáját egy egységes módszerrel – feltehetően bootstrap, jackknife vagy hasonló technika alkalmazásával. Ehhez a nemzeti statisztikai intézeteknek a felvétel elemi adatait az Eurostat rendelkezésére kellene bocsátaniuk mindazokkal az információkkal együtt, amelyek a minta struktúráját leírják és a varianciabecsléshez szükségesek (a mintavétel lépcsőinek száma, a kiválasztás módja az egyes lépcsőkben, a rétegek azonosítója, elsődleges és végső mintavételi egységek kódja stb.). Szükség van a végleges (kalibrált) súlyokra is. Ennek a stratégiának az előnyei nyilvánvalók, viszont túl sok terhet jelentene az Eurostat számára, és nem zárná ki saját fejlesztésű programokkal előállított standard hibák használatát az egyes tagországokban. Az integrált stratégia egyik lehetősége feltételezi, hogy az Unió nemzeti statisztikai intézetei elfogadnak egy közös varianciabecslő eljárást, éspedig a minta másodlagos feldolgozásán alapuló módszerek egyikét; ez lehet például a bootstrap. Ebben az esetben az egyes nemzeti statisztikai intézetek feladata a megadott mutatók kiszámítása lenne a meghatározott részletezésben, továbbá az Eurostat rendelkezésére kellene bocsátaniuk a következő
információkat: a felvétel teljes állományát a végleges mintasúlyokkal; a varianciabecsléshez szükséges információkat a minta struktúrájával kapcsolatban (a rétegeket, az elsődleges és a végső mintavételi egységek kódját stb.); a „replicate” módszerhez tartozó minták súlyrendszerét, más szóval, a másodlagos mintasúlyokat. Az Eurostat ezeknek az adatoknak a birtokában elő tudná állítani a mutatószámokhoz tartozó standard hibákat a megfelelő részletezésben, országos és Európai Uniós szinten. A stratégia jelentős előnye a módszer egységessége, ennélfogva a standard hibák becslésének jó minősége, továbbá a rugalmasság az ad hoc modulokhoz tartozó standard hibák becslésének szempontjából. Az Eurostat hosszú távon ennek a stratégiának az elfogadását látná szívesen a nemzeti statisztikai intézetek részéről, jóllehet ez utóbbiak számára a másodlagos mintasúlyok előállítása nem csekély feladat. Az integrált stratégia másik lehetősége az általánosított varianciafüggvények alkalmazására épül. Ebben az esetben a nemzeti statisztikai intézeteknek elemi adatok helyett aggregátumokat kellene átadniuk az Eurostat számára, továbbá az egyes mutatókhoz tartozó varianciafüggvények paramétereit. Bár a replicate módszeren alapuló stratégia előnyösebbnek látszik, mint a keresett standard hibák általánosított varianciafüggvény segítségével meghatározott becslése, egyelőre nem kizárt, hogy idővel mégis csak az utóbbi lesz az általánosan elfogadott közös módszer az Európai Unióban. Erre való tekintettel a 4. fejezet tartalmazza az általánosított varianciafüggvények módszerének tankönyvbe illő részletességű leírását is, így a potenciális felhasználó ezen a téren ugyancsak szinte kész eszközt kap a munkájához. Az 5. fejezet útmutatóul szolgál a nemzeti statisztikai intézetek számára a pontossági követelmények teljesítéséhez. Az Eurostat azok
Statisztikai Szemle, 91. évfolyam 10. szám
1027
Szakirodalom
erre irányuló tevékenységét folyamatosan követi, ennek módját illetően három stratégia áll rendelkezésre. 1. Adott időszakra vonatkozóan rögzített paraméterű képlet(ek) segítségével végrehajtott ellenőrzés. Mivel becsült standard hibák ellenőrzéséről van szó, ennél a stratégiánál általában a design effect mutatóra is szükség van, ami problematikus lehet. A kézikönyv mindenesetre kellő támpontot nyújt a design effect becslésére. 2. Minőségi riportok készítése – ezt a stratégiát a munkaerő-felméréssel és az EU-SILC-kel összefüggésben az Unió tagállamaiban már mindenütt ismerik. 3. A pontossági követelmények automatikusan teljesülnének, amennyiben a nemzeti statisztikai intézetek valamennyien elfogadnák és a gyakorlatban is bevezetnék azt a varianciabecslő módszert, amelyet az előző fejezetben integrált stratégiaként ismertünk meg. Ez azonban csak a távolabbi jövőben várható. A kézikönyv 6. egysége az Irodalomjegyzék, ami 162 hivatkozott publikáció adatait tartalmazza. A Függelék – a kötet hetedik egysége – fontos információkkal egészíti ki a 2–5. fejezetek anyagát. Hat részből, alfejezetből áll. A 7.1. alfejezet statisztikai szakkifejezések gyűjteményét, glosszáriumát tartalmazza, különös tekintettel a varianciabecslés témaköréhez tartozó fogalmakra. A 7.2. alfejezetben a design effect mutató ismertetése szerepel tankönyvbe illő részletességgel, a témához kapcsolódó néhány újabb eredményt is tárgyalva.
A 7.3. alfejezet olyan általános sablont mutat be, amelynek segítségével könnyen lehet minőségi riportok kérdőívét megtervezni. Azok a kollégák, akiknek a feladata a munkaerőfelmérés negyedéves minőségi riportjának elkészítése és elküldése az Eurostatnak, egykettőre felismerik ennek azokat az elemeit, amelyekre válaszolniuk kell a végrehajtott negyedéves munkaerő-felmérés alapján. A sablon elsősorban háztartás-statisztikai felvételeknél alkalmazható, kérdéseit/ rovatait természetesen mindig a konkrét felvételhez kell igazítani. A 7.4–7.5. alfejezetek, mint már az előzőkben is említettük, a mintavételi tervek, eljárások és a varianciabecslő módszerek, valamint az ezekhez tartozó szoftvereszközök közötti kompatibilitást mutatják táblázatos formában. A táblázatok segítségével azonosíthatók a jó és a rossz módszerek. A rövid 7.6. alfejezet a minimális effektív mintanagyság kérdésére ad választ longitudinális felvételek esetén. Ezt az alfejezetet követi a Tárgymutató mint a könyv utolsó egysége. A recenzió szerzőjének nem feladata az ismertetett mű értékelése, azzal azonban valószínűleg mindenki egyetérthet, hogy a XXI. század második évtizedében a kézikönyv kellő áttekintést nyújt a háztartás-statisztikai felvételeknél használható varianciabecslő módszerekről, valamint az ezekhez tartozó szoftvereszközökről. Mihályffy László, a KSH ny. statisztikai főtanácsadója E-mail:
[email protected]
Statisztikai Szemle, 91. évfolyam 10. szám
1028
Szakirodalom
Folyóiratszemle Mecatti, F. — Crippa, F. — Farina, P.: A statisztika új ága: a genderstatisztika (A Special Gen(d)re of Statistics: Roots, Development and Methodological Prospects of Gender Statistics.) – International Stastistical Review. 2012. 80. évf. 3. sz. 452–467. old.
Az utóbbi évtizedekben növekvő igény mutatkozott a társadalmi nem (gender) szenzitív információi iránt a gazdaság, a társadalom és a hivatalos szervek részéről egyaránt. A genderstatisztika nem a nők és a férfiak közötti biológiai eltérésekkel, sőt nem is a minden társadalomban megfigyelhető magatartási különbségekkel foglalkozik, hanem a nemek közötti olyan egyenlőtlenségekkel, amelyek kapcsolatba hozhatók valamilyen diszkriminációval, előítélettel, jogtalansággal, méltánytalansággal vagy a tolerancia hiányával. A statisztika eme új ágának célja, hogy vizsgálja, felfedje, középpontba állítsa, értékelje és megértse a társadalomban kialakult nemek közötti eltéréseket és az ebből adódó problémákat. A nőkkel kapcsolatos statisztikai adatok gyűjtésének és elemzésének fontosságára először 1975-ben hívták fel a figyelmet, amikor az ENSZ a nők nemzetközi éve alkalmából megrendezte első világkonferenciájukat Mexikóban. A következő világkonferenciák (Koppenhága 1980, Nairobi 1985, Peking 1995) megerősítették a statisztika művelésének a gyengébb nem lehetőségeivel való kiegészítését. A Svéd Statisztikai Hivatal (Statistics Sweden) volt az első a világon, amely 1983-ban a genderstatisztika művelésére egy külön csoportot hozott létre. Az 1990-es évek elejére alapvető változás következett be a nőkről folytatott vitában, mivel ettől az
időszaktól kezdve vált természetessé a róluk szóló statisztikai vizsgálatok elterjesztése. A genderstatisztika további megerősödését hozta a nők 1995. évi pekingi világkonferenciája és az ENSZ 2000. évi millenniumi deklarációja, melynek az volt a lényege, hogy nemzetközi standardok szerint kell adatokat gyűjteni és tájékoztatást adni a nemek közötti egyenlőtlenségekről. A kormányok ünnepélyes kötelezettséget vállaltak arra, hogy korlátozzák a férfiak és nők közötti megkülönböztetéseket, folyamatosan figyelemmel kísérik az ezzel kapcsolatos változásokat és időszakonként jelentéseket adnak ki róla. Ennek egyik következményeként létrehozták a hivatalos statisztika új és termékeny ágát: a genderstatisztikát (Engendering Statistical System). A millenniumi deklaráció a világ egyik legfontosabb célját fogalmazta meg: meg kell szüntetni az emberi szenvedést és a szegénységet, amelyet az akkor elfogadott nyolc fő cél megvalósításának igényével tűztek ki 2015-re. Az ENSZ főtitkársága jelentési kötelezettséget írt elő a tagországok számára, hogy 1990-hez viszonyítva adjanak számot a fejlődés mértékéről. A nyolc fő cél: 1. az extrém szegénység és az éhezés megszüntetése, 2. az általános iskolai oktatás egyetemessé tétele, 3. a nemek közötti egyenlőség fokozása, a női foglalkoztatottsági szint emelése, 4. a csecsemőhalandóság csökkentése, 5. a kisgyermekes anyák egészségi állapotának javítása, 6. a HIV/AIDS, a malária és más fertőző betegségek elleni küzdelem fokozása, 7. a környezeti fenntarthatóság biztosítása, 8. globális partnerség a fejlesztési célok megvalósításában. E célokat 21 operatív céllal jelölték ki, amihez 60 statisztikai mutatószám alakulásának megfigyelését írták elő.
Megjegyzés. A Folyóiratszemlét a KSH Könyvtár (Lencsés Ákos) állítja össze.
Statisztikai Szemle, 91. évfolyam 10. szám
1029
Szakirodalom
A harmadik fő célnak például egyetlen operatív célja van: 2005-re megszüntetni a nemek közötti különbségeket az általános és a középiskolai oktatásban (ez nem mindenütt valósult meg!), 2015-re pedig a felsőoktatásban. Ezek teljesítését négy statisztikai mutató nyomon követésével figyelik meg: 1. a lányok aránya a fiúkéhoz viszonyítva az általános, a közép- és a felsőoktatásban; 2. a 15–24 éves írni-olvasni tudó nők aránya a megfelelő korú férfiak százalékában; 3. a nők aránya a nem mezőgazdasági szektor foglalkoztatottjai között; 4. a nők aránya a nemzeti parlament képviselői között. 2007-ben, a 2015-ös határidő félidejében általános felülvizsgálatot tartottak a fő cél, az operatív célok, a statisztikai mutatók rendszerének megvalósítását illetően, bevezetve két új (megszüntetve négy régi) operatív célt, hogy a fő célok közül még jobban a legfontosabbra (a szegénység és az éhezés megszüntetésére) koncentrálhasson minden erőfeszítés. A gendertényező bár döntő szerepet játszik a globális fejlődésben, még sem kellően érvényesül a hetedik (környezeti fejlődés) és a nyolcadik (fejlesztési együttműködés) fő cél teljesítésében. A jelenlegi (2010. évi ENSZ-) adatok szerint például a harmadik fő cél (a női foglalkoztatottsági szint emelése) megvalósításában nincs kellő előrehaladás a nemek közötti kiegyenlítődésben. Egy 2009-es jelentésben az áll, hogy az ötödik fő célt (a kisgyermekes anyák egészségi állapotának javítását) a nemzeti források kiegészítésével kívánják megoldani. A hatodik fő cél a HIV/AIDS, a malária és más fertőző betegségek visszaszorításában elért eredmények ékes példái a genderelemzések hasznosságának. A legfrissebb becslések szerint a HIV/AIDS-fertőzés stabilizálódása figyelhető meg. Talán meglepő, hogy a 15–24
éves nők HIV/AIDS-szel való fertőzöttsége 23-szor nagyobb gyakoriságú, mint a hasonló korú férfiaké. Az eddig elmondottak jól mutatják, hogy egyre nagyobb szükség van genderszenzitív statisztikai módszerekre. A genderstatisztikai vizsgálatokban nagy tere van olyan egyszerű mutatóknak, mint a különbség, a viszonyszám és az arány, melyeket egydimenziós mikrotémák bemutatásánál alkalmaznak. Az összetett mutatószámoknak többdimenziós szintézisekben van szerepe, amikben a változók körét körültekintően választják ki egy-egy makrotéma vizsgálatához. E mutatószámokkal főleg a politikai és a gazdasági tartalmú elemzéseknél találkozunk, mint például a fejlesztés, a globalizáció, a versenyképesség és az innováció. Ezek az indikátorok akkor is nélkülözhetetlenek, ha országok rangsorát készítik el valamilyen makrotémában. A mutatószámok kalkulálásához felhasználják az adatszerkesztést, az imputálást, a transzformációkat (mint a standardizálást és a normalizálást), az adatrendezést, az aggregálási funkciók definiálását és a súlyozási rendszert. A keletkező alindexek lineáris kombinációjával számítják ki az összetett mutatószámot. Eddig hat fő gendervizsgálatra alkalmas összetett mutatószámot alkottak meg, az elsőt 1995-ben, az utolsót 2010-ben. Az első GDI-t (gender-related development index – társadalmi nemek szerinti fejlődési index) az ENSZ Fejlesztési Programja (United Nations Development Program – UNDP) is felhasználja az évenként kiadott emberi fejlődés című jelentésében (human development report – HDR), mivel e folyamat egyik kulcseleme a nemek közötti egyenlőség közelítése. A GEM(gender empowerment measure – társadalmi nemi hatalomképesség) index (ugyancsak 1995-ből) azt vizsgálja, hogy a férfiak és a nők milyen mértékben vesznek részt a politikai életben és a döntéshozatalban. A GDI- és a GEM-mutatók egyik nagy problémája, hogy
Statisztikai Szemle, 91. évfolyam 10. szám
1030
Szakirodalom
sok fejlődő országban hiányoznak a két nemre külön számított adatok, emiatt sokszor csak durva becslést alkalmaznak. A GDI- és a GEM-mutatók megalkotásának 10. évfordulóján műhelykonferenciát rendeztek, melyen megállapították, hogy az indexeket gyakran félreértelmezik, ezért körvonalaztak egy alternatív értékelési eljárást a nemek közötti egyenlőség mérésére. A GEI (gender equity index – társadalmi nem egyenlőség index) létrejöttét 2000-ben a civil társadalom igénye motiválta, mely mintegy 400 nem kormányzati szervezetet képvisel több mint 80 országból. Ennek az indexnek a segítségével kísérik figyelemmel a gendermutatókat és állítják össze a világ országainak rangsorát. Míg e három index a vizsgált jelenség pozitív aspektusát (a nemi egyenlőség mértékét méri), ezzel szemben a negyedik, a GGGI (global gender gap index) a nemek közötti egyenlőtlenséget méri. Ezt az indexet a svájci alapítású Világgazdasági Fórum kezdeményezésére alkották meg és tették ismertté az üzleti világban, mivel felismerték, hogy a gazdasági fejlődés egyik előfeltétele a nemek közötti egyenlőség érvényesítése. A 2009-es gazdasági válságban ez még jobban felerősödött. „A nők és a lányok adják a világ emberi erőforrásának a felét, ezért fontos, hogy a válságból való kiláboláshoz képzettek, foglalkoztatottak és teljes egyenjogúságot élvező polgárok legyenek” – ahogy egy davosi felszólaló ezt 2010-ben megfogalmazta. A GGGI-index egyes fejlődő vagy átmeneti országot a rangsorban a vártnál jobb helyre sorolhat be, mert bár náluk sem a férfiak, sem a nők jólétéről nem lehet beszélni, de a két nem közötti egyenlőtlenség esetenként minimális. Míg a magasabb életszínvonalú, ám a nemek között nagyobb egyenlőtlenséget eltűrő országok hátrább kerülnek a rangsorban. Ez az index rávilágított arra, hogy az oktatásban és az egészségügyben a világ igen közel jutott a nemek közötti teljes egyenlőséghez, de csak fél úton van
a nők gazdaságban betöltött szerepében és igen messze az azonos mértékű politikai részvételtől. Ez még a gazdag Észak-Amerikára és Európára is igaz, egyetlen kivételt képeznek a fejlett demokráciát képviselő skandináv országok. A 2009 óta számított SIGI (social institutions and gender index – társadalmi intézmények és nemek indexe) szintén a gender egyenlőtlenséget, annak okait térképezi fel a világ mintegy száz fejlődő országára. A mutatóban érvényesülnek az intézményi változók, a háztartások belső szokásai és a szociális normák is. Az UNDP 2010-ben megalkotta a GII-t (gender inequity index – társadalmi nem egyenlőtlenség indexe), ami a GDI- és a GEMindexek kritikájaként is felfogható. A GII-index például nem ragaszkodik az imputálás-hoz, de magába foglalja a nőkre jellemző betegségek gyakoriságát. A GII-t egy asszociációérzékeny egyenlőtlenségi mérőszámnak nevezhetjük. Ez a SIGI komplementerének is tekinthető, ahol 0 a teljes egyenlőséget, míg 1 az egyenlőtlenség maximumát jelenti. A kormányoknak, a civil és a nemzetközi szervezeteknek (például a Nemzetközi Munkaügyi Szervezetnek, a Világbanknak) köszönhetően az 1990-es évek óta növekvő arányú a genderaspektusú tanulmányok száma. A fejlődő országokban azonban még ma is gond az adatok nőkre és férfiakra vonatkozó szétválasztása, pedig az ilyen szempontú vizsgálatokra éppen a fejlődésben elmaradt országokban lenne a legnagyobb szükség. Emiatt a genderstatisztikában „kétsebességűre” osztható a világ. A Dél-afrikai Köztársaság egyik parlamenti képviselője így fogalmazott: „Ha meg akarjuk ismerni egy ország haladási irányát, csak azt kell megnézni, hogy a költségvetéséből mennyit költ a nőkre és a gyermekekre.” A tanulmány szerzői a dolgozat végén gyakorlati példákkal mutatják be a genderstatisztika hasznosságát. Vizsgálták például a versenyképesség és a nemek egyenlősége közötti korrelá-
Statisztikai Szemle, 91. évfolyam 10. szám
1031
Szakirodalom
ciós kapcsolatot országonként. Talán nem véletlen, hogy a legversenyképesebb skandináv országokban legkisebb a nemek közötti egyenlőtlenség és a legkevésbé versenyképes országokban (például Csádban, Pakisztánban) vannak a nők leginkább elnyomva. Érdekes az összefüggés az OECDországokra számított termékenység és a női foglalkoztatottsági arány között. Korábban ott volt legmagasabb a termékenység, ahol a nők kevésbé voltak bevonva a fizetett munkába, de újabban ennek a fordítottja az igaz. A magas női foglalkoztatottsági arányt elérő skandináv országokban és az Egyesült Államokban legmagasabb a termékenység, míg ott, ahol a nők részvételi aránya nyomott a munkaerőpiacon (például Spanyolországban, Olaszországban), a termékenységi arány is igen alacsony. Nem meglepetés, ha a genderstatisztika mai eredményei újabb kutatásokat indítanak el. Számos kutató szerint a nők fogják megmenteni a válságból a világot, mert a férfiaknál megfontoltabb (gazdasági, társadalmi, politikai) döntéseikre már ma is nagy szükség lenne. Hajnal Béla kandidátus, a Debreceni Egyetem és a Nemzeti Közszolgálati Egyetem habilitált főiskolai tanára E-mail:
[email protected]
Feng W. — Cai Y. — Baochang G.: Népesség, elvek és politika: hogyan fogja megítélni a történelem Kína egykepolitikáját? (Population, Policy, and Politics: How Will History Judge China’s One-Child Policy?) – Population and Development Review. 2012. évi 38. sz. 115–129. old.
A modernkori szociológia- és társadalomtörténet egyik nagy kérdése, hogy a XX. század második felében gyors népességnöveke-
déssel szembenéző országok között miért választott Kína olyan radikális megoldást, mint az egy gyermek politika bevezetése. Egy másik felmerülő kérdés, hogy a sok nem kívánt társadalmi következmény ellenére miért tartanak ki ilyen hosszú időn át (még a kitalálói által eltervezett perióduson túl is) alkalmazása mellett? A XX. század második felében, elsősorban a meghosszabbodott várható élettartamnak köszönhetően, a világ népessége robbanásszerű növekedésnek indult. Ez a folyamat ugyanakkor számos új kihívást is jelentett, többek között társadalmi szinten is. A születésszabályozó intézkedések története az 1950-es évekig nyúlik vissza, és alapvetően két irányzat alakult ki: az egyik a fogamzásgátló módszerek elterjedését propagálta, a döntést az egyénre bízva, amíg a másik állami beavatkozás által szűkítette az egyén mozgásterét. A 60-as évektől világszervezetek, mint például az ENSZ is bekapcsolódott a születésszabályozás népszerűsítésébe, a gazdasági növekedés egyik fő hátráltatójaként meghatározva a nagymértékű népességnövekedést. Kínában már 10 évvel az 1974-es bukaresti ENSZ népesedési konferencia előtt létrehozták a Születésszabályozási Bizottságot azzal a hosszú távú céllal, hogy 2000-re 1 százalék alá csökkenjen a népességnövekedés. 1971-ben a negyedik ötéves terv részeként célként határozták meg, hogy 1975-re a városokban 1, míg vidéken 1,5 százalék alá essen a népességnövekedés. A világ több országában (például Indiában, Bangladesben, Indonéziában) hoztak hasonló intézkedéseket, de sehol sem ilyen drasztikus mértékben és hosszú ideig. Ennek alapvetően három oka lehet: a kínai államfelfogás, amely a polgárokat az állam tulajdonának tekinti; egy forradalom utáni rezsim, amely a születésszabályozást politikai legitimációjának központi kérdéseként kezeli; végül a politikai döntésho-
Statisztikai Szemle, 91. évfolyam 10. szám
1032
Szakirodalom
zatal módja, amelynél átláthatatlan hatalmi érdekek dominálnak. A Mao halála után bevezetett egykepolitika nagyban a politikai háttérnek volt köszönhető. Az új politikai elit a kulturális forradalom pusztítását még ki sem heverő országban már nem a fegyveres forradalomra kívánta alapozni a hatalmat. Ebben az időszakban vált elsődleges céllá a gazdasági növekedés és jólét, aminek fő mutatójaként az egy főre jutó GDP-t határozták meg. 1978-ban még csak úgy fogalmazódott meg az elv, hogy az egygyermekes családokat jutalmazni, míg a kétgyermekeseket büntetni kell, 1980-ban azonban már célértékként határozták meg, hogy a városi párok 95, a vidékiek 90 százalékánál legfeljebb egy gyermek legyen, és 2000-re Kína népessége ne haladja meg az 1,2 milliárdot. Különös módon az egykepolitikát sosem formalizálták jogszabályban, csupán egy nyílt levélben jelentették be a Kommunista Párt tagsága számára, amelyben kifejezték, hogy a vezetők „támogatják” ezt a célt, a konkrét megvalósítás és a mentességek feltételeinek kidolgozása ugyanakkor a tartományokra maradt. Érdekesség ebben a levélben, hogy maga a pártvezetés is elismerte, aggodalomra adhat okot a későbbiekben a népesség elöregedése, a munkaerőhiány, a nemek közötti egyensúly felborulása, így egyúttal egy ígéretet is megfogalmaztak, miszerint 25–30 év után feloldható lesz a korlátozás. Az egy gyermek elv bejelentésének idejében a tervezők számoltak olyan káros hatásokkal, mint például a népesség gyorsabb elöregedése. Azonban számos előre nem várt hátrány is felmerült a későbbiekben, mint a szexuális zaklatások, a születendő gyermek neme szerinti szelekció az abortuszoknál és egy olyan alacsony termékenységi arány, amely visszafordíthatatlanná válhat hosszú időre, munkaerőhiányt és gazdasági visszaesést okozva. Ezekkel az ellenérvekkel szemben a hivatalos álláspont az, hogy a politika 400 millió
születést akadályozott meg, ezáltal világszinten is enyhítve a túlnépesedési nyomáson és lehetővé téve a gazdaság látványos fellendülését. Eszerint az intézkedések nemcsak egy, a gazdasági növekedés számára előnyös korstruktúrát hoztak létre, de még a klímaváltozás globális méretű kezelésében is jelentős szerepet játszottak. A 400 milliós becslést ugyanakkor számos szakember megkérdőjelezi. Ez a szám egy (egyébként állami Családtervezési Bizottság finanszírozású) projekt kalkulációja volt 1998ban, ugyanakkor feltehetően több módszertani hibát is elkövettek: a legfontosabb, a termékenységi mutatók esetében már 1970-től vizsgálták a politika hatását, annak ellenére, hogy az intézkedést ténylegesen csak 1980-ban vezették be, az előző tíz év gyors termékenységi csökkenése attól függetlenül történt. A legnagyobb mértékű visszaesés a születéseknél ugyanis már 1970 és 1979 között lezajlott (a teljes termékenységi arányszám 5,8-ról 2,8-ra esett vissza), még az egykepolitika bevezetése előtt. A projekt során ezzel a „hozzáadott” időszakkal (1970–1979) 338 millió megelőzött születést kalkuláltak, és ez a szám torzult el a későbbiekben egészen addig, hogy végül 400 millió elkerült születésről beszélnek a hivatalos szakmai anyagokban. Az egykepolitika mellőzését is érdemes megvizsgálni, ugyanis az ENSZ által is alkalmazott számítási módszer alapján 2010-re az intézkedések bevezetése nélkül is lecsökkent volna a termékenységi arány a jelenlegi 1,5 százalékra. Érdekes még, hogy egyes tanulmányok szerint, két gyermek engedélyezése esetén ugyanúgy elérhető lett volna a kitűzött népességszint (2000-re 1,2 milliárd fő), ám sokkal kedvezőbb korstruktúrában. A jelenlegi helyzetben pedig a számítások azt mutatják, hogy a politika feloldása nem lenne jelentős hatással a népességre. Más országok tapasztalatai alapján ugyanis sokkal nagyobb
Statisztikai Szemle, 91. évfolyam 10. szám
1033
Szakirodalom
kihívás növelni a termékenységet, mint csökkenteni azt. Az egykepolitikát – ami nem is hatékony, és a hivatalos becsléseknél jóval kisebb volt a hatása – sokan kritizálták. A népességnövekedést fékező ereje nem volt olyan jelentős, mint azt a hivatalos álláspont propagálta, ám számottevően befolyásolta a kínai társadalmat. Az eltorzult nemi arányok és az egyénekre-családokra gyakorolt hatás jelentősnek tekinthető. Ha mérni akarjuk, hogy az egykepolitika hogyan befolyásolta a népesedési folyamatokat, az egygyermekes családok arányát kell vizsgálnunk. Ennek során az 1961 és 1970 között született nőket érdemes figyelembe venni. Az ő reprodukciós időszakuk jelentős része az egykepolitika idejére esett, mostanra viszont már majdnem mind elérték a szülőképes kor végét. Ez nagyjából 110 milliós női populációt jelent, akik 40 százalékának volt egy gyermeke 2005-ös adatok szerint. A magasan fejlett városokban, mint például Peking, ez az arány 80, az elmaradottabb nyugati régiókban 20 százalék körül van. Kína 31 tartományából 11ben van a vizsgált női populáció több mint felének egy gyermeke. A városi népességnél ráadásul sokkal jelentősebb az egygyermekes családok aránya. Amíg vidéken, a mezőgazdasági területeken könnyebben engedélyeztek második gyermeket, addig egy városi szülőnek második gyermek esetén nemcsak magas bírsággal, de esetlegesen a munkanélküliséggel is szembe kellett néznie, valamint azzal, hogy gyermekét nem tudja regisztrálni a városi oktatási és egészségügyi rendszerben. A népességnövekedést fékező hatás így nem mondható olyan jelentősnek ahhoz képest, hogy családok millióinak életébe szólt bele az állam közvetlenül, illetve – mivel az egy gyermek politika alatt születettek között az átlagosnál alacsonyabb a termékenység – rendkívül kedvezőtlen és nehezen megfordítható demográfiai folyamatokat indítottak be.
A XX. század folyamán a túlnépesedés miatti problémákat a világ sok országában az alacsony termékenység miatti aggodalmak váltották fel. Amíg 1976-ban még csupán 16 állam kormánya gondolta úgy, hogy túl alacsony a termékenységi ráta az országában, addig 2006-ban ez a szám már 48 lett. Számos európai és ázsiai országban hoznak termékenységet javító intézkedéseket, hogy megfordítsák a jelenlegi folyamatokat. Kínában az elmúlt 35 évben, mióta az egy gyermek politikát bevezették, hatalmas változások zajlottak le mind demográfiai, mind gazdasági téren. A kitűzött gazdasági célokat nem csupán elérték, de túl is szárnyalták, az ország gazdasága a második legnagyobb a világon az Egyesült Államok mögött. Népesedés terén ugyanakkor a drákói szigorral bevezetett intézkedések nem hozták meg a kívánt eredményt, a 2000. évi népszámlálás adatai szerint a népesség 60 millióval meghaladta a meghatározott 1,2 milliárdos határt. Habár a döntési mechanizmusok rendkívül lassan működnek Kínában, aminek eredménye, hogy még jelenleg is érvényben van a politika, mégis azt mondhatjuk, nem az a kérdés, megszüntetik-e a drasztikus születésszabályozást, hanem az, mikor. Az intézkedések által legjobban érintett, az 1980-as és 1990-es években – az egykepolitika alatt – született, magasan kvalifikált és mobil generáció lett ennek a politikának a leghangosabb kritikusa. Ehhez társulnak még a legújabb szociológiai kutatások eredményei is, amelyek egyhangúan azt bizonyítják, hogy nem racionális az ilyen jellegű születésszabályozás további fenntartása. A kínai egykepolitika így valószínűleg az emberi reprodukcióba történő legextrémebb állami beavatkozásként fog majd a történelemkönyvekbe kerülni. Kajdi László, a KSH tanácsosa E-mail:
[email protected]
Statisztikai Szemle, 91. évfolyam 10. szám
1034
Szakirodalom
A szerzõi jogi ágazatok teljesítményei Ausztráliában, 1996—2011 (The Economic Contribution of Australia’s Copyright Industries 1996–1997 to 2010–2011.) – PricewaterhouseCoopers (PwC). 2012. August. 38 p. A kiadvány letölthető: http://www.copyright.org.au/pdf/PwC-Report2012.pdf
Ausztrália Szerzői Jogi Tanácsa (Australian Copyright Council – ACC) felkérésére a Pricewaterhouse Coopers (PwC) tanácsadó cég elemzéssorozatot készített az ország szerzői jogi ágazatai utóbbi másfél évtized során elért eredményeiről. A nemzetközi összehasonlításra alkalmas módszertan alapja az ENSZ Szellemi Tulajdon Világszervezete (World Intellectual Property Organization – WIPO) 2003ban megjelent irányelve. A WIPO ajánlásai a szerzői jogi tevékenységek négy összefoglaló ágát tartalmazzák, ezeken belül részletesen azonosítják a fontosabb kiemelt termékek, szolgáltatások kereteit. A kiadvány ismerteti az elsődleges és leginkább védett, továbbá a szellemi termékekkel részlegesen kapcsolódó szerzői jogi tevékenységeket. Harmadikként az ún. háttérágazatokat, amelyek kibocsátása a létrehozott művektől függ. Negyedikként elemzi az ún. kiszolgáló ágazatokat, amelyeket az előző három ág kifejezetten nem tartalmaz ugyan, de a tevékenységeik támogatják, szolgáltatásaikkal érvényesítik a szerzői joggal védhető termékek, szolgáltatások hasznosítását, terjesztését, forgalmazását. A magyarországi adatok 2002., 2006. és legutóbb 2009. tárgyévi elemzése ezeket az ágakat „primer szerzői jogi ágazatok”, „részlegesen szerzői jogi ágazatok”, „technikai háttérágazatok” és „egyéb kiszolgáló ágazatok” kategóriákkal azonosítja. (A Szellemi Tulajdon Nemzeti Hivatala, illetve jogelődje a Magyar Szabadalmi Hivatal kiadványsorozata
2005-ben, 2010-ben és 2012-ben „A szerzői jogi ágazatok gazdasági súlya Magyarországon” címmel jelent meg a WIPO-ajánlás szerinti szerzői jogi ágak fontosabb magyarországi adataival. Ezek a tanulmányok kifejtik az itt hivatkozott harmonizált osztályozást, a számítások, becslések módszertanát.)1 Az ausztrál szerzői jogi ágazatok statisztikai alapadatai az 1996–1997. időszaktól kezdve a 2010–2011. záróévig érhetők el. Az elemzés bemutatja azok kibocsátását, hozzáadott értékét, munkaügyi mutatóit, a kivitel és a behozatal alakulását. A kiadvány a másfél évtizedes ausztráliai adatsorok alapján közli a szerkezeti átalakulás mutatóit, amelyre a digitális hordozón, interneten terjesztett művek gyors térhódítása, ugyanakkor a hagyományos zeneműkiadás, játék és televíziós műsorforgalom, nyomtatott könyv és sajtótermék részesedésének csökkenése jellemző. Az ausztrál kibocsátás versenyezni kényszerül a globális mértékűre kiterjesztett kínálattal. Ez alakítja a piaci ártól (ezen belül a nemzeti valuta árfolyamától) erősen függő értékesítéseket, megváltozik a jogi oltalommal kibocsátott termék, szolgáltatás versenyképessége. A szerzői jogi gazdasági tevékenységek új összetétele a belföldi foglalkoztatásra is hatással van. A tanulmány bemutatja a szerzői joggal elsődlegesen védett művek példáit, az ún. primer szerzői jogi ágazatokba tartozó termékeket, szolgáltatásokat. A vizsgálat ezeket standard 1
http://www.sztnh.gov.hu/letolt/szerzoi_jog_ga zdasag.pdf, http://host.hu/projects/kip/system/files/Szerzoi_j ogi_agazatok_2010.pdf, http://www.hamisitasellen.hu/hu/hirek/2012/nov ekvo-merteku-a-szerzoi-jogi-agazatok-sulyamagyarorszagon, http://www.hamisitasellen.hu/hu/system/files/A _szerzoi_jogi_agazatok_nemzetgazdasagi_sulya_Ma gyarorszagon_Penyigey_Krisztina.pdf.
Statisztikai Szemle, 91. évfolyam 10. szám
1035
Szakirodalom
nemzetközi jegyzék alapján sorolja be. Az ENSZ statisztikai osztályozásai alapján azonosíthatók azok a fontosabb gazdasági tevékenységek, illetve árucsoportok, amelyek a másik három szerzői jogi ághoz kapcsolhatók, mint részlegesen szerzői jogi jellegűek vagy azok technikai háttérágazatai, illetve általános jellegű kiszolgálói. Az elemzés a WIPO-ajánlások szerinti tartalmi meghatározásokat követi. A primer szerzői jogi ágazatok körébe sorolhatók a sajtótermékek, a könyvek, a zenei, a színházi, az operai és hasonló produkciók, a hangfelvételen, mozgóképen, videón rögzített, a rádióban, televízióban sugárzott művek, a fényképészet védett művei, az informatikai jellegű (például szoftver, adatbázis) alkotások, a grafikai, egyéb vizuális művek, valamint a reklámok védett alkotásai. Az elérhető adatok tartalmazzák ezek kibocsátásait, illetve a kapcsolódó egyéb gazdaságstatisztikai mutatóikat. A technikai háttérágazatok lényegében a mű létrehozásához és hasznosításához alkalmazott tárgyi eszközt, valamint üzleti szolgáltatást bocsátják ki. Ide sorolhatók a piacra termelők, továbbá a fogyasztókkal kapcsolatban levők, például kereskedelmi, kölcsönző, szolgáltató gazdasági egységek. Az ilyen gazdasági szervezetek kibocsátásának fontosabb tételei az információs, kommunikációs technológia, a szórakoztatóelektronika, a fényképészet és mozgókép vetítése, a zenélés eszközei, a papír és a digitális információhordozó, valamint a mű fénymásolásának eszköze. A részlegesen szerzői jogi ágazatok körébe tartoznak a jogilag védhető ipari termékek, különösen az ékszer, érme, kézművestermék, formatervezett ruházati cikk, kerámia- és üvegáru, lakástextil és egyéb dísztárgy, játék (ezen belül elektronikus kivitelben is), valamint a belsőépítészeti, egyéb műszaki (építészeti) művek. Az alkotásokat közösségi térben bemutató intézmény (múzeum) is ilyen besorolással végzi a tevékenységét.
A negyedik, általános kiszolgáló ágazati kör tartalmazza például a telefonok, az internet szolgáltatásait, a szállító és a kereskedelmi tevékenységeket, amelyek (nem célhoz kötötten) szükségesek a szerzői jogi művek terjesztéséhez, és a termelés, fogyasztás folyamataihoz igénybe vehetők. A vizsgálatokat a nemzeti statisztikai adatgyűjtés eredményei alapozzák meg, az elérhető feldolgozási eljárásokkal, mutatósorozatokkal. Az elemzés standard osztályozásokkal állítja össze a szerzői jogi ágazatok mutatóit, a WIPO-módszertan ajánlásainak megfelelő fordítótáblázatokkal. A feldolgozott sokféle adatsor összekapcsolása a kódkapcsolatok nemzetközi összehasonlításával lehetséges. Ilyen megfeleltetés szükséges például az említett ágazatok szintjén, illetve a vámeljárás és a szolgáltatások külkereskedelme áruleíró kódrendszerével. Az ausztrál elemzés a volumenváltozások mértékeit a kiválasztott bázisidőszak (itt a 2011. év) árain határozza meg. Ezt a reálértéket a „szerzői jogi arány” becsült mértékeivel korrigálják. A kiigazítás ilyen tényezője a primer szerzői jogi ágazatokban maximális (rendszerint egységnyi), a legkisebb a telefon, az internet vagy a szállítás ágazataiban. Az ágak teljesítményének egyik viszonyítási alapja az ország bruttó hazai terméke. Az elemzés mutatósorozata a folyó termelő felhasználást levonja, és nem veszi figyelembe a nempiaci értékesítésre szánt (nem hasznosított) szerzői műveket (például a szerző tulajdonaként megtartott alkotásokat). A vizsgálat nem tartalmazza a művek nem jogosított hasznosítását (például kalózmásolatként), bár annak jelentős az anyagi, foglalkoztatási hatása, azonban hiányzik az ilyen tételek adatainak hivatalos, konzisztens módszerrel megalapozható becslése. Az oktatás intézményei sajátos helyzetűek a „copyright” gyűjtőfogalom értelmezésében. Elszámolhatók többek között az egyes tan-
Statisztikai Szemle, 91. évfolyam 10. szám
1036
Szakirodalom
anyagok a WIPO valamelyik kategóriájában (tankönyvként, demonstrációs eszközként). Az elemzés az egyéb szerzői alkotások között, a piaci forgalmazású művektől eltérően kezeli, például a zárt terjesztéssel, a részvételi díjban elszámolt tananyagot. Az elemzés szerint a kiemelt ágak 2011. évi (összesen 93,2 milliárd AUD) bruttó hozzáadott értéke nem éri el a 2007. évit (100,2 milliárd AUD) a válság miatti recesszió jeleként, de nagyobb, mint a szerzői jogi ágak 1997. évi (69,0 milliárd AUD) teljesítménye. Az ausztráliai GDP egészében ezek az ágazatok csak 6,6 százalékkal részesedtek 2011-ben, de 1997-ben 8,3, 2000-ben már 9,0 százalék volt ez az arány. A primer szerzői jogi ágazatok teljesítménynövekedés átlagos évi üteme egymástól eltérő, és az 1997–2007, illetve 2007–2011 közötti trendek különbségei is jelzik a válság differenciált hatásait ezekre az ágazatokra. A 2011. évi bruttó hozzáadott érték a szerzői jogi ágakban közel egyező az ausztrál feldolgozóiparéval, kissé meghaladja a kiskereskedelmét, és jóval nagyobb a teljesítményük, mint az építőipar, illetve szállítás, tárolás ágazataié. Ausztrália vizsgált szerzői jogi ágazataiban a foglalkoztatottak száma 2011-ben meghaladja a 900 ezer főt (2007-ben 30 ezer fővel több volt). A négy ágból a primer szerzői jogi ágazatok foglalkoztatási hatása a legnagyobb a 15 év során (2011-ben 613 ezer fővel). A vizsgált szerző jogi ágazatok az ausztráliai nemzetgazdaság összes foglalkoztatottjának 8,0 százalékát alkalmazták 2011-ben (1997-ben 9,1 százalékát), a válság előtt a legnagyobb arány (2000-ben) 9,8 százalék volt. A munkajövedelmek értékaránya a primer szerzői jogi ágazatok hozzáadott értékében 50 százalék körül ingadozott a 15 év során, és a négy vizsgált ág átlaga is ehhez közeli. A létszámváltozásokhoz igazodik a szerzői jogi ágakban kifizetett munkajövedelem aránya is
Ausztrália összes nemzetgazdasági ágához mérten: a 2011-ben 7,6 százalékos részesedés kisebb a 2001. évi csúcsnál (9,9%), illetve az 1997-es 9,0 százaléknál. A szerzői jogi ágazatokban az egy foglalkoztatottra jutó hozzáadott érték mutatósorozata (2011. évi árakon) viszonylag szűk sávban alakul, és a záróév termelékenysége három ágban nagyobb, mint 1997-ben, a kivétel a technikai háttérágazatok határozottan csökkenő trendje. Az elemzés kiterjed a termékek, szolgáltatások behozatalára és kivitelére, itt a szerzői jogi ágazatokhoz tartozó áruk arányát a kódmegfeleltetésekkel számítják mindkét irányban. Ausztrália 2011. évi behozatala ebben a négy ágban együtt a 2000. évi volumennel közel azonos (2011. évi árakon mintegy 30 milliárd AUD). A technikai háttérágazatok termékeinek, szolgáltatásainak részesedése közel 80 százalék a vizsgált behozatalból. A vizsgált importtételek reálnövekedése az 1997–2011 közötti években átlagosan évi 1,3 százalék. Ezen belül például a szoftverek és adatbázisszolgáltatások importja 2007-ig átlagosan évi 8,3, 2007–2011. között lassabban, évi 7,7 százalékkal nőtt. Az ország importjában a szerzői jogi ágazatokhoz tartozó áruk 2011. évi részesedése (14,4%) kisebb, mint a 2007. előtti években (1997-ben például 21,9 százalék). Az ország exportjában a szerzői jogi ágazatokhoz tartozó áruk 2011. évi részesedése (2,9%) kevesebb, mint a korábbi években (1997-ben például 6,8 százalék). A vizsgált árucsoportok együttes importtöbblete 2011-ben közel 24 milliárd AUD (1997-ben mintegy 18 milliárd AUD), ez jelzi a szerzői jogi ágazatokhoz tartozó ausztrál áruk romló nemzetközi versenyképességét. Nádudvari Zoltán, a KSH ny. főtanácsosa E-mail:
[email protected]
Statisztikai Szemle, 91. évfolyam 10. szám
1037
Szakirodalom
Kiadók ajánlata BOERI, T. – OURS, VAN J. [2013]: The Economics of Imperfect Labor Markets. Second Edition. (A nem tökéletes munkaerőpiac közgazdaságtana. Második kiadás.) Princeton University Press. Princeton. A legtöbb munka-gazdaságtani könyv nem sok figyelmet fordít a tényleges munkaerőpiacokra, mert olyan tökéletesen kompetitív piacot feltételez, amiben az állások elvesztése „nem nagy ügy”. Ez az egyetlen tankönyv, ami a nem tökéletes munkaerőpiacokra összpontosít, és ami szisztematikus keretet nyújt a munkaerőpiaci intézmények működésének elemzéséhez. Az átfogó, naprakész, alaposan átdolgozott második kiadásban a következők szerepelnek: egy új fejezet a munkaerő-piaci megkülönböztetésről; kvantitatív példák; adatok és programozási fájlok, amikkel lehetővé válik a felhasználóknak a szakirodalom kulcseredményeinek reprodukálása; gyakorlatok minden fejezet végén és kibővített szakmai függelékek. A kötet áttekint sok olyan gyakorlatot, amelyek hatással vannak a munkavállalók és a munkaadó viselkedésére a nem tökéletes piacokon. Ilyenek a minimálbérek, a foglalkoztatás védelmében hozott jogszabályok, a munkanélküli ellátások, az aktív munkaerő-piaci politikák, a munkaidő-szabályozás, a családpolitikák, az esélyegyenlőségi jogszabályok, a kollektív tárgyalások, a korai nyugdíjazási programok, az oktatási és migrációs politikák, a munkáltatói adók és a foglalkoztatási feltételekre irányuló ösztönzők. A kötet a hatások pontos jellemzése érdekében körültekintéssel határozza meg és méri fel ezeket az intézményeket, valamint bemutatja a politikai és a gazdasági erők hatására végbement változásokat. SALKIND, N. J. [2013]: Statistics for People Who (Think They) Hate Statistics. Fifth
Edition. (Statisztika azoknak, akik (azt gondolják, hogy) utálják a statisztikát. Ötödik kiadás.) SAGE Publications, Inc. Thousand Oaks, London. A sikerlistás kötet ötödik kiadása az előzőkhöz hasonlóan humorosan oktató, világos megközelítésben segít a diákoknak egy általuk gyakran félelmetesnek és nehéznek vélt tantárgy megértésében. A szerző különböző statisztikai eljárásokat mutat be az olvasóknak a korrelációtól és az adatok grafikai ábrázolásától kezdve a következtetési technikákig és a varianciaelemzésig. Emellett az SPSS-t is és az olyan bonyolultabb technikákat is tárgyalja, mint a megbízhatóság, az érvényesség és a bevezető nemparaméteres statisztikák. Az ötödik kiadás az eddigieknél több példát, valamint a fejezetek végén egy újdonságot, „valós statisztikákat” kínál. A kötet interaktív ebook kiadása (ami 2014 tavaszától lesz elérhető) mindezeken túl animált ábrákat, rövid kvízeket, videóklippeket és még sok egyebet is tartalmaz. EVERGREEN, S. D. H. [2013]: Presenting Data Effectively. (Az adatok hatékony bemutatása.) SAGE Publications, Inc. Thousand Oaks, London. A szerző új, izgalmas, az adatok bemutatásának vezérelveit középpontba állító könyve a legjobb kommunikációs stratégiákat kínálja mindenkinek, aki adatokkal dolgozik. Valójában ezzel a nagyon könnyen érthető, lépésenként építkező ismertetővel bárki – az iskolai projektek keretében posztert készítő diákoktól kezdve az eredményeiket konferencián előadni kívánó egyetemi tanárokig és kutatókig – megtanulhatja, miképp mutassa be és közölje kutatási eredményeit érdekes, célravezető módon. A szerző először a kutatási jelentések készíté-
Statisztikai Szemle, 91. évfolyam 10. szám
1038
Szakirodalom
sének vizsgálata, az interdiszciplináris értékelés és az adatok képi megjelenítése terén szerzett széleskörű tapasztalatából merít. Majd megtanítja az olvasóknak, hogy miképp kell ezeket a vezérelveket az adatok bemutatásának tervezése során alkalmazni, hogy a hallgatóság számára könnyebbé váljon azok megértése, felidézése és használata. LICHTMAN, M. [2013]: Qualitative Research for the Social Sciences. (Minőségi társadalomtudományi kutatás.) SAGE Publications, Inc. Thousand Oaks, London. A kutatók integráló szerepét előtérbe helyezve, a kötet leíró stílusban vezeti be az olvasókat a kutatási folyamat izgalmába. A szerző kiegyensúlyozott, árnyalt megközelítést kínál, a szakterület minőségi metodikáinak és szempontjainak teljes körét lefedve, beleértve a közösségi médiát mint a kutatás megkönnyítésének egyik eszközét is. Az elméleti fogalmak bemutatása és a történelmi áttekintés után a szerző lépésről lépésre, adatelemzési kérdéseket tárgyalva, a befejezett kutatást bemutatva és értékelve kalauzolja át az olvasókat a kutatási folyamaton. Az életből vett társadalomtudományi példák gyakorlati és elméleti információt nyújtanak, segítve az olvasókat a fogalmak megértésében és kutatásaikban való felhasználásában. KOVÁCS K. [2013]: Kutatási és publikálási kézikönyv nem csak közgazdászoknak. Akadémiai Kiadó. Budapest. A könyv célja, hogy segítséget nyújtson a tudományos kutatómunkához és a kutatás eredményeit közlő publikációk elkészítéséhez. Bár elsősorban a közgazdaság-tudomány és az üzleti tudományok területén kutatóknak szól, részletesen foglalkozik a természet- és társadalomtudományos kutatás és publikálás sajátosságaival, így más tudományágak művelői is nagy haszonnal forgathatják. A fiatal kutatók számára
átfogó, egyben elmélyült áttekintést ad mind a kutatásról, mind a szakmai közlemények megírásáról, ugyanakkor a tapasztalt szakemberek számára is sok fontos és újszerű kutatásmódszertani ismeretet tartalmaz. Külön fejezetben tárgyalja a szakdolgozat-készítés módszertanát, így a végzős főiskolai, egyetemi hallgatók nélkülözhetetlen kézikönyve. A kötet a tudományos kutatómunkát és publikálást azok összetett jellegére fókuszálva alaposan és részletesen mutatja be, valamint a nemzetközi szakirodalomban fellelhető tudásanyagot és elfogadott elveket közvetíti. Ebből következően egyedülálló a hazai kiadványok között. Mintegy 35 magyarázó ábra és egy több mint 400 kifejezést tartalmazó angolmagyar szószedet teszi teljessé. BÁLINT J. [2013]: Magyarország nemzeti vagyonvesztése 1941–1947. Agroinform Kiadó. Budapest. Bálint József, a Központi Statisztikai Hivatal egykori elnökének könyve korabeli dokumentumok és hiteles visszaemlékezések közreadásával tárgyalja Magyarország második világháborús nemzeti vagyonvesztését. Többek között külön fejezet foglalkozik a Magyar Királyi Honvédséget, a honi mezőgazdaságot, az ipart, a széntermelést és a közlekedést ért háborús károkkal, veszteségekkel, ahogy a nyugatra hurcolt magyar javakkal, köztük a Magyar Nemzeti Bank értékeivel is. Ugyanakkor nem marad érintetlenül az 1945 utáni restitúció, illetve a Vörös Hadsereg magyarországi elhelyezésének és ellátásának meglehetősen tág problémaköre sem. A felhasznált gazdag forrásanyag sok, korábban sosem publikált dokumentumot és képet tartalmaz. A könyv egyben tiszteletadás azon nemzedéknek, amely túlélve a második világháború pusztítását, nagy nélkülözések közepette építette újjá a magyar nemzetgazdaságot s vele együtt a lerombolt országot is.
Statisztikai Szemle, 91. évfolyam 10. szám
1039
Szakirodalom
Társfolyóiratok
A FRANCIA GAZDASÁGI ÉS PÉNZÜGYMINISZTÉRIUM, VALAMINT A STATISZTIKAI ÉS GAZDASÁGKUTATÓ INTÉZET FOLYÓIRATA 2012. ÉVI 457–458. SZÁM
Grimal, R.: A mobilitás egyre homogénebb vagy egyre összetettebb jelenség? Hubert, J. et al.: Ebédszünet – kulcsfontosságú tényező a mobilitás alakulásában Franciaországban az elmúlt 35 évben. Coulombel, N. – Leurent, F.: Mérlegelik-e a háztartások egymással szemben a lakásköltségeket és a közlekedésre fordított kiadásokat? Válasz a párizsi agglomerációból. Gerber, P. – Carpentier, S.: A külföldi lakóhelyválasztás hatása a mindennapi élet színtereire a dolgozó lakosság körében Luxemburgban. Coulangeon, P.– Petev, I. D.: Személygépjármű-tulajdonlás a mobilitási kényszer és a társadalmi különbségek függvényében. Collet, R. – Madre, J. – Hivert, L.: A személygépjárművek terjedése Franciaországban: mik az autótulajdonlás és -használat határai? Pirotte, A. – Madre, J.: A magán személygépjármű-közlekedés meghatározó tényezői és rugalmassága – területi megközelítés regionális francia adatok alapján. Nicolas, J. – Verry, D. – Longuar, Z.: A francia mobilitás okozta széndioxidkibocsátásnövekedés. A munkahelyi közlekedés mint növekedési tényező elemzése az 1994. és 2008. évi nemzeti közlekedési adatfelvételek alapján.
AZ OSZTRÁK KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA 2013. ÉVI 6. SZÁM
Gyorsjelentés a regiszteralapú statisztikáról – bevezetés. A magasabb iskolai végzettség jobb helyzetet biztosít a munkaerőpiacon? – Adminisztratív forrásból származó munkaerő-piaci statisztikák 2010-ből és népszámlálási adatok 2001-ből. Fogyasztói árindex 2013 áprilisában. Lakásbérleti díjak 2012-ben – éves és negyedéves átlagok a mikrocenzus adataiból. A növénytermesztési szektor ellátási mérlege 2011/2012-ben. Baromfiállomány 2012-ben. Az ipar és az építőipar rövid távú statisztikái 2012-ben – előzetes adatok. Gépjárműállomány 2012-ben. 2013. ÉVI 7. SZÁM
Az alacsony bérezésű munka színvonala és szerkezete Ausztriában 2010-ben. Fakitermelés 2012-ben. Vágóhídi statisztikák 2012-ben. Környezetvédelmi kiadások Ausztriában 2010-ben. Rövid távú mutatók az iparban és az építőiparban – új, 2010-es bázison. A vállalkozások Osztrák Statisztikai Hivatalnak történő adatszolgáltatási kötelezettségéből fakadó terhe 2001 és 2012 között a terhelés alakulásának indikátorai alapján. Integrált munkabér- és jövedelemadóstatisztika 2010-ben.
Statisztikai Szemle, 91. évfolyam 10. szám
1040
Szakirodalom
Külkereskedelem 2013. január és március között – előzetes adatok.
AZ OROSZ ÁLLAMI STATISZTIKAI BIZOTTSÁG FOLYÓIRATA 2013. ÉVI 2. SZÁM
Egorenko, S.: Az integrált gazdaságstatisztika gyakorlati alkalmazásának jellemzői az orosz statisztikai gyakorlatban. Veliev, A.: Azerbajdzsán hivatalos statisztikai adatai és a nemzetközi intézetek hasonló adatai közötti kapcsolat. Sokolin, V.: Népszámlálások a FÁK országaiban. A társadalmi és gazdasági folyamatok követésének nélkülözhetetlen eszköze. Malyutin, V.: A népszámlálások végrehajtásának sajátos jellemzői nagyvárosi környezetben. Taranova, O.: A demográfiai adatgyűjtés módszertanának tökéletesítése és új adatgyűjtési módszerek alkalmazása az információs technológia fejlődésének korában. Kuznetsova, I. – Gracheva, G. – Fridlyanova, S.: A kisvállalkozások innovációs tevékenységének statisztikai becslése: fejlesztés, alkalmazás és a tudományos-technikai eredmények közvetítése. Gorodnikova, N. – Ratay, T. – Rosovetskaya, L.: A kutatás és az oktatás integrálása a hivatalos statisztikában: az új módszertani megközelítés kérdései és fejlesztési lehetőségei. Zaichenko, S. – Martynova, S.: Az orosz egyetemek kutatási és innovációs tevékenységének statisztikai elemzési eszközei.
Gershman, M.: Orosz mérnöki szervezetek: az azonosítás és a teljesítményértékelés megközelítései. Koloskova, I.: A bűncselekmény-áldozatok számba vételének módszertani és szervezeti alapelvei. Ovcharov, A.: Kapcsolatok statisztikája: az elemzés minőségi szempontjai. Zherebin, V.: A társadalmi-gazdasági egyenlőtlenségekkel kapcsolatos indexek, mutatók és becslések. Karmanov, M.: Statisztika és korrupció napjaink Oroszországában.
A LENGYEL STATISZTIKAI FŐHIVATAL FOLYÓIRATA 2013. ÉVI 7. SZÁM
Łazowska, B.: A Lengyel Központi Statisztikai Hivatal 1918 és 1939 között. Kordos, J.: Fél évszázadom a statisztikával. Antczak, E.: A fejlődés térbeli mérése taxonómiai alapokon. Lichota, W.: A vállalatok pénzügyi helyzetének értékelési módszerei a mieleci EuroPark Kiemelt Gazdasági Övezet vállalkozásainál. Staszek, A. – Weszczak, A.: A foglalkozási megbetegedések területi különbségei. Baszyński, A.: A bankszektor átalakulása Közép-, Kelet- és Délkelet-Európában. Lengyelország társadalmi-gazdasági helyzete 2013 májusában.
Statisztikai Szemle, 91. évfolyam 10. szám