Szakirodalom
Könyvszemle Pontossági követelmények és varianciabecslés az Európai Statisztikai Rendszer háztartás-statisztikai felvételeihez. Kézikönyv. Handbook on Precision Requirements and Variance Estimation for ESS Households Surveys. Publication Office of the European Union. 2013. Luxembourg. A kézikönyv letölthető: http://epp.eurostat.ec.europa.eu/portal/page/port al/product_details/publication?p_product_code=KSRA-13-029
A kézikönyv az Európai Statisztikai Rendszerhez (European Statistical System – ESS) tartozó nemzeti statisztikai intézetek módszertanért felelős vezetői (ESS Methodology Directors’ Group – DIME), valamint az Eurostat Módszertani Igazgatósága által létrehozott, nemzetközi összetételű munkacsoport tevékenységének eredményeként készült el. Az első változatot egymástól függetlenül öt lektor olvasta át 2011 utolsó hónapjaiban; őket olyan országok nemzeti statisztikai intézetétől kérték fel, ahonnan nem delegáltak tagot a munkacsoportba. A lektorok egyhangúan az első változat „kisebb módosítások” melletti elfogadását terjesztették elő. Javaslataikat további szakértők bevonásával a DIME és a munkacsoport tagjai a lehetőségek határain belül a legjobb eredmény elérésére törekedve vitatták meg. A kézikönyv végül 2013 júliusában jelent meg az Eurostat honlapján. A kötet célja olyan standard fogalmak kialakítása a varianciabecslésen alapuló pontossági követelmények területén, amelyek egyértelművé teszik a mintavételes eljárásokból
(Leslie Kish amerikai statisztikus szóhasználatával élve reprezentatív megfigyelésekből) származó adatok használatát az Európai Unióban, ezen belül az Eurostat és a nemzeti statisztikai intézetek közötti együttműködésben. Ehhez a szándékhoz szorosan kapcsolódik a varianciabecslés céljára jelenleg rendelkezésre álló módszerek és szoftverek áttekintése, valamint ezzel összefüggésben, ajánlások megfogalmazása a „jó módszerek” használatára, illetve a „rosszak” kerülésére. Tekintettel a számottevő különbségekre az egyes uniós tagállamokban használt mintavételi tervek és becslési eljárások között, a kézikönyv ajánlásokat tartalmaz a módszerek harmonizálására és ahol lehet, az integrálásra is, de nem hiányoznak belőle azok a javaslatok sem, amelyek a tagországok statisztikai intézetei számára megkönnyítik a pontossági követelmények teljesítését. Az ESS háztartás-statisztikai felvételei között kitüntetett szerepet játszik a munkaerőfelmérés (Labour Force Survey – LFS), illetve a jövedelem- és életkörülmények-felvétel (EU Statistics on Income and Living Conditions – EU-SILC), ami rányomja bélyegét a kézikönyvre is: az ajánlások és az illusztrációként bemutatott példák többsége e két felvétel valamelyikéhez kapcsolódik. Ennek következtében a kötetet azok forgathatják a legnagyobb haszonnal, akik ezek valamelyikével foglalkoznak. Ugyanakkor a tárgyalt fogalmak és módszerek – a könyv címével összhangban – az ESS további háztartás-statisztikai felvételeire is alkalmazhatók. A kötet a következő szerkezeti egységekre tagolódik: 1. Bevezetés; 2. Pontossági követelmények; 3. Ajánlott eljárások a szórásnégy-
Statisztikai Szemle, 91. évfolyam 10. szám
1024
Szakirodalom
zet becslésére; 4. A standard hiba számszerűsítése országos szinten és az európai statisztikákban; 5. A pontossági követelmények teljesítésének lehetőségei; 6. Irodalom; 7. Függelék; Tárgymutató. (A 2–5. fejezetek alfejezetekből állnak, ezek tartalmazzák a fejezetek témájával kapcsolatos ajánlásokat.) A továbbiakban a kézikönyv fejezeteinek és egyéb szerkezeti egységeinek tartalmát ebben a sorrendben mutatjuk be. Jelen ismertetés eddigi része már tárgyalta a Bevezetésben leírt legfontosabb célokat és elveket. A „Pontossági követelmények” című fejezet azt a kétféle lehetőséget ismerteti, amelyekkel ezeket a követelményeket megfogalmazhatjuk, tehát a (relatív) standard hiba és a minimális effektív mintanagyság alkalmazását. A kétféle megközelítés között a mintanagyság és a becsült standard hiba összefüggése teremt kapcsolatot, amihez azonban a Leslie Kish által bevezetett design effect (a.m. a mintavételi terv hatása) mutatóra is szükség van, hacsak nem visszatevés nélküli, egyszerű véletlen mintával van dolgunk – tehát gyakorlatilag mindig. (A design effectről részletes ismertetés található a Függelékben). A fejezetben találunk ajánlásokat arra vonatkozóan, hogy mikor célszerű és mikor nem relatív standard hibát alkalmazni a pontossági küszöb minőségében, tehát például akkor nem, ha nullához közeli aránnyal van dolgunk, amikor a relatív standard hiba abszolút értéke nem korlátos. A tekintett populáción belüli tartományok mutatóival kapcsolatos pontossági határokra nézve is kapunk javaslatokat, például arra, hogy lehetőleg ne alkalmazzunk pontossági követelményeket olyan tartományoknál, amelyek nagyságáról csupán a felvétel végrehajtása után szerzünk információt. A 3. fejezet az ESS háztartás-statisztikai mintáiban alkalmazott mintavételi eljárásokról és varianciabecslő módszerekről nyújt átfogó képet. A minták végső mintavételi egysége ál-
talában a személy vagy a háztartás, az alkalmazott mintavételi eljárások többsége közismert – egyszerű véletlen kiválasztás visszatevés nélkül, csoportos mintavétel, szisztematikus mintavétel, mindez rétegzéssel vagy rétegzés nélkül; egy- és többlépcsős mintavétel stb. Az olvasó megfelelő képet kap a pontosság és a torzítatlanság, a közvetlen és a közvetett mintavétel, valamint a többlépcsős és a többfázisú kiválasztás közötti különbségről. A kevésbé ismert módszerek közül a fejezet bemutatja a kiegyenlített mintavétel (balanced sampling) alapelveit is. Ennek a résznek – vagy talán a kézikönyv egészének – a gerincét a varianciabecslő módszerek tárgyalása adja; a 3.3–3.5. alfejezetek nagyjából lefedik azt, amit ez a tudományág napjainkban a felhasználóknak kínál. A kulcsszavak itt a következők: analitikus módszerek (ezeken belül egzakt és közelítő módszerek); linearizáláson alapuló módszerek; a minta másodlagos feldolgozásán alapuló módszerek (replication methods: jackknife, bootstrap, kiegyensúlyozott félminták stb.); általánosított varianciafüggvények (generalized variance functions). Ajánlások segítik a felhasználókat abban, hogy adott számítógépes környezet esetén miképp mérlegeljenek, figyelembe véve a kívánt pontosság és a számítási költségek egymással ellentétes szempontjait, továbbá, hogy milyen varianciabecslő módszert válaszszanak, ha a becslések ingadozásának bizonyos összetevői, illetve ezek forrásai azonosíthatók (például közvetett mintavétel, rekordvagy kérdésszintű meghiúsulás, imputálás és – nem várt esetként – a kalibrálás). Külön alfejezetben találunk egy ugyancsak átfogó összeállítást, természetesen megfelelő ajánlásokkal arról, hogy varianciabecslés céljából milyen szoftvereszközök közül válogathatnak az ESS háztartás-statisztikusai. Az ajánlott varianciabecslő eljárásokat és a hozzájuk tartozó szoftvereszközöket tárgyaló alfejezeteket a Függe-
Statisztikai Szemle, 91. évfolyam 10. szám
1025
Szakirodalom
lék 7.4. és 7.5. alfejezetei táblázatos formában egészítik ki; a táblázatok azt mutatják, hogy egyes gyakran használt mintavételi tervek milyen típusú mutatók becslését és varianciabecslő eljárások, illetve kész szoftvereszközök alkalmazását teszik lehetővé. Két megjegyzés a 3. fejezet eddigiekben ismertetett részéhez. 1. Közismert tény, hogy napjainkban a háztartás-statisztikai felvételekben kalibrált becsléseket használnak, és ezeknél sima statisztikák esetén, egyszerű feltételek mellett a varianciabecslés leggazdaságosabb módja annak a becsült szórásnégyzetnek a közelítő jelleggel való használata, melyet a tekintett mutatóhoz az általánosított regressziós módszer mint kalibrálási eljárás mellett kaptunk volna. A háztartás-statisztikákra jellemző populációk és mintanagyságok mellett ezt a közelítést akkor alkalmazhatjuk, ha a kalibrálás segédváltozói a regressziós becslésnél ugyanazok, mint a tekintett felvétel végleges mintasúlyainak meghatározásához használt eljárásban. Ennek a varianciabecslési eljárásnak tipikus alkalmazási területe a munkaerőfelmérés, amelynél mind a létszámadatok, mind pedig a ráták esetén olyan általánosított regressziós becslésen alapuló közelítés alkalmazható, ami Taylor-linearizáláson alapuló eljárásnak is tekinthető. Nemlineáris statisztikák, például kvantilisek esetén azonban ez az út nem járható, viszont a linearizálás két, viszonylag új keletű, a „becslő egyenleteken” (estimation equations), valamint a „hatás egyenletén” (influence equations)1 alapuló módja átveszi azt a szerepet, amelyet sima statisztikák esetén a Taylor-linearizálás játszik a varianciabecslésben. Konkrét alkalmazásra az EU SILC-ben találunk példát. Ezek a linearizálási módszerek és alkalmazásuk 1997 és 2009 között megjelent publikációkban lát1
Ismeretem szerint általánosan elfogadott, megfelelő magyar kifejezés még nincsen.
tak napvilágot. Célszerű lenne ezt az eljárást beilleszteni a KSH eszköztárába. 2. A kézikönyv az R programozási nyelv és az abban készült programcsomagok használatát a „jó módszerek” közé sorolja, ami középtávon a nemzeti statisztikai intézmények szintjén is korlátozhatja a nagy kereskedelmi szoftverek (SAS, SPSS, Stata) hegemóniáját. A 3.6. alfejezetben néhány EU-tagállam (Lettország, Olaszország, Luxemburg és Franciaország) nemzeti statisztikai intézete varianciabecslésének gyakorlatából származó példákkal találkozunk. Lettország háztartásstatisztikai felvételeiben saját fejlesztésű, Rnyelvben írt varianciabecslő programot használnak, amely Osiernek egy 2012-ben (!) publikált eredményén alapul. A 3. fejezet utolsó részének tárgya az időbeni változások mérése és az ehhez tartozó varianciabecslési módszerek. Itt az időbeni változások megfigyelésére használt minták – többségükben panelminták – típusainak áttekintése mellett három témakör részletes kifejtésével találkozunk: az éves átlagok, valamint az időbeni nettó és bruttó változások becslésének feladatával, ideértve az ezekhez tartozó varianciabecslés módszerét is. Figyelemre méltó, hogy az utolsó két témakörben az irodalmi hivatkozások többsége 2000 utáni. A 4. fejezetben az Eurostat és a nemzeti statisztikai intézetek, tehát a tagállamok közötti együttműködés három lehetséges stratégiájával ismerkedhetünk meg, amelyek olyan kiemelt fontosságú folyamatos felvételek szempontjából játszanak lényeges szerepet, mint például a munkaerő-felmérés, illetve a jövedelem- és életkörülmények-felvétel. A jelenlegi gyakorlatban decentralizált stratégia valósul meg. A nemzeti statisztikai intézetek meghatározzák az Eurostat által megadott mutatók becslését a hozzájuk tartozó standard hibával, adott részletezésben. Az Eurostat a tagállamokat technikai rétegekként kezelve, ezek-
Statisztikai Szemle, 91. évfolyam 10. szám
1026
Szakirodalom
ből az adatokból állítja elő a megfelelő európai statisztikákat a hozzájuk tartozó standard hibával együtt. Ennél a stratégiánál a nemzeti statisztikai intézetek csupán aggregátumokat adnak át az Eurostatnak, elemi adatok átadására nincs szükség. Ez az út komoly szakmai felelősséget ró az egyes tagállamok nemzeti statisztikai intézeteire, és a sokféle mintavételi terv, illetve a különböző varianciabecslési módszerek miatt az Eurostat nem tudja ellenőrizni, hogy az alkalmazott módszerek a „jók” körébe tartoznak-e vagy sem. További hátrány, hogy a rendszer nem rugalmas, csak előre megadott bontásokat tud kezelni. A teljesen centralizált stratégia esetén mind az egyes nemzeti statisztikák, mind pedig az európai statisztika számára az Eurostat állítaná elő a szükséges mutatók standard hibáját egy egységes módszerrel – feltehetően bootstrap, jackknife vagy hasonló technika alkalmazásával. Ehhez a nemzeti statisztikai intézeteknek a felvétel elemi adatait az Eurostat rendelkezésére kellene bocsátaniuk mindazokkal az információkkal együtt, amelyek a minta struktúráját leírják és a varianciabecsléshez szükségesek (a mintavétel lépcsőinek száma, a kiválasztás módja az egyes lépcsőkben, a rétegek azonosítója, elsődleges és végső mintavételi egységek kódja stb.). Szükség van a végleges (kalibrált) súlyokra is. Ennek a stratégiának az előnyei nyilvánvalók, viszont túl sok terhet jelentene az Eurostat számára, és nem zárná ki saját fejlesztésű programokkal előállított standard hibák használatát az egyes tagországokban. Az integrált stratégia egyik lehetősége feltételezi, hogy az Unió nemzeti statisztikai intézetei elfogadnak egy közös varianciabecslő eljárást, éspedig a minta másodlagos feldolgozásán alapuló módszerek egyikét; ez lehet például a bootstrap. Ebben az esetben az egyes nemzeti statisztikai intézetek feladata a megadott mutatók kiszámítása lenne a meghatározott részletezésben, továbbá az Eurostat rendelkezésére kellene bocsátaniuk a következő
információkat: a felvétel teljes állományát a végleges mintasúlyokkal; a varianciabecsléshez szükséges információkat a minta struktúrájával kapcsolatban (a rétegeket, az elsődleges és a végső mintavételi egységek kódját stb.); a „replicate” módszerhez tartozó minták súlyrendszerét, más szóval, a másodlagos mintasúlyokat. Az Eurostat ezeknek az adatoknak a birtokában elő tudná állítani a mutatószámokhoz tartozó standard hibákat a megfelelő részletezésben, országos és Európai Uniós szinten. A stratégia jelentős előnye a módszer egységessége, ennélfogva a standard hibák becslésének jó minősége, továbbá a rugalmasság az ad hoc modulokhoz tartozó standard hibák becslésének szempontjából. Az Eurostat hosszú távon ennek a stratégiának az elfogadását látná szívesen a nemzeti statisztikai intézetek részéről, jóllehet ez utóbbiak számára a másodlagos mintasúlyok előállítása nem csekély feladat. Az integrált stratégia másik lehetősége az általánosított varianciafüggvények alkalmazására épül. Ebben az esetben a nemzeti statisztikai intézeteknek elemi adatok helyett aggregátumokat kellene átadniuk az Eurostat számára, továbbá az egyes mutatókhoz tartozó varianciafüggvények paramétereit. Bár a replicate módszeren alapuló stratégia előnyösebbnek látszik, mint a keresett standard hibák általánosított varianciafüggvény segítségével meghatározott becslése, egyelőre nem kizárt, hogy idővel mégis csak az utóbbi lesz az általánosan elfogadott közös módszer az Európai Unióban. Erre való tekintettel a 4. fejezet tartalmazza az általánosított varianciafüggvények módszerének tankönyvbe illő részletességű leírását is, így a potenciális felhasználó ezen a téren ugyancsak szinte kész eszközt kap a munkájához. Az 5. fejezet útmutatóul szolgál a nemzeti statisztikai intézetek számára a pontossági követelmények teljesítéséhez. Az Eurostat azok
Statisztikai Szemle, 91. évfolyam 10. szám
1027
Szakirodalom
erre irányuló tevékenységét folyamatosan követi, ennek módját illetően három stratégia áll rendelkezésre. 1. Adott időszakra vonatkozóan rögzített paraméterű képlet(ek) segítségével végrehajtott ellenőrzés. Mivel becsült standard hibák ellenőrzéséről van szó, ennél a stratégiánál általában a design effect mutatóra is szükség van, ami problematikus lehet. A kézikönyv mindenesetre kellő támpontot nyújt a design effect becslésére. 2. Minőségi riportok készítése – ezt a stratégiát a munkaerő-felméréssel és az EU-SILC-kel összefüggésben az Unió tagállamaiban már mindenütt ismerik. 3. A pontossági követelmények automatikusan teljesülnének, amennyiben a nemzeti statisztikai intézetek valamennyien elfogadnák és a gyakorlatban is bevezetnék azt a varianciabecslő módszert, amelyet az előző fejezetben integrált stratégiaként ismertünk meg. Ez azonban csak a távolabbi jövőben várható. A kézikönyv 6. egysége az Irodalomjegyzék, ami 162 hivatkozott publikáció adatait tartalmazza. A Függelék – a kötet hetedik egysége – fontos információkkal egészíti ki a 2–5. fejezetek anyagát. Hat részből, alfejezetből áll. A 7.1. alfejezet statisztikai szakkifejezések gyűjteményét, glosszáriumát tartalmazza, különös tekintettel a varianciabecslés témaköréhez tartozó fogalmakra. A 7.2. alfejezetben a design effect mutató ismertetése szerepel tankönyvbe illő részletességgel, a témához kapcsolódó néhány újabb eredményt is tárgyalva.
A 7.3. alfejezet olyan általános sablont mutat be, amelynek segítségével könnyen lehet minőségi riportok kérdőívét megtervezni. Azok a kollégák, akiknek a feladata a munkaerőfelmérés negyedéves minőségi riportjának elkészítése és elküldése az Eurostatnak, egykettőre felismerik ennek azokat az elemeit, amelyekre válaszolniuk kell a végrehajtott negyedéves munkaerő-felmérés alapján. A sablon elsősorban háztartás-statisztikai felvételeknél alkalmazható, kérdéseit/ rovatait természetesen mindig a konkrét felvételhez kell igazítani. A 7.4–7.5. alfejezetek, mint már az előzőkben is említettük, a mintavételi tervek, eljárások és a varianciabecslő módszerek, valamint az ezekhez tartozó szoftvereszközök közötti kompatibilitást mutatják táblázatos formában. A táblázatok segítségével azonosíthatók a jó és a rossz módszerek. A rövid 7.6. alfejezet a minimális effektív mintanagyság kérdésére ad választ longitudinális felvételek esetén. Ezt az alfejezetet követi a Tárgymutató mint a könyv utolsó egysége. A recenzió szerzőjének nem feladata az ismertetett mű értékelése, azzal azonban valószínűleg mindenki egyetérthet, hogy a XXI. század második évtizedében a kézikönyv kellő áttekintést nyújt a háztartás-statisztikai felvételeknél használható varianciabecslő módszerekről, valamint az ezekhez tartozó szoftvereszközökről. Mihályffy László, a KSH ny. statisztikai főtanácsadója E-mail:
[email protected]
Statisztikai Szemle, 91. évfolyam 10. szám