Fórum
Beszámoló a „Hatékony mintavételi és felvétel tervezési megoldások — Leslie Kish nyomdokain” címû konferenciáról A Fényes Elek Műhely, a Magyar Statisztikai Társaság, valamint a Magyar Szociológiai Társaság Társadalomstatisztikai szakosztálya és a Károli Gáspár Református Egyetem (KRE) Leslie Kish munkásságához kapcsolódóan, 2012. november 28-án műhelykonferenciát szervezett a hatékony mintavételi és felvételtervezési megoldásokról. A műhelykonferencia egyrészt tisztelegni kívánt a száz éve született, magyar származású Leslie Kish mintavételi eljárásokkal kapcsolatos munkássága előtt, másrészt bemutatta az általa kidolgozott mintavételi módszerek felhasználását a mai kutatási gyakorlatban. A konferencia kezdetén a házigazda, Bozsonyi Károly, a KRE rektorhelyettese mondott rövid köszöntőt, majd Marton Ádám, a KSH ny. osztályvezetője nyitóelőadásában összefoglalta Kish pályájának legfontosabb momentumait, illetve hozzájárulását a mintavétel különböző elméleti és gyakorlati területeihez. Leslie Kish (vagy ahogy több felszólaló is hivatkozott rá, Laci bácsi) nem csak tudományos eredményeiért érdemel kitüntetett figyelmet, hiszen a magyar statisztikai kultúra fejlesztésében is jelentős szerepet játszott: nem egy magyar kollégáját segítette ösztöndíjakkal amerikai tanulmányutakhoz. A konferencia második előadásában Németh Renáta (Eötvös Loránd Tudományegyetem – ELTE) a „Kish-kulcs” magyarországi alkalmazásának lehetőségeit és korlátait mutatta be. Kish a háztartáson belüli véletlen személykiválasztásra fejlesztette ki ezt a kulcsrendszert. A kulcs azonban az amerikai háztartás-
tipológiából indult ki (ahol a felnőtt háztartások jellemzően kétfősek), és a módszer nem kezeli a különböző háztartásnagyságból adódó torzításokat. Ebből következően a magyarországi alkalmazása során a nők – ezen belül is főleg az idős nők – felülreprezentálódnak azokban a kutatásokban, amelyek a Kish-kulcsot használták. Németh Renáta háromféle lehetőséget sorolt fel a probléma megoldására. A leggyakrabban alkalmazott megoldás az utólagos rétegzés. Szóba jöhet még a Kish-kulcsnak a magyarországi háztartásszerkezethez illeszkedő átdolgozása. Végül – és ez a leginkább ajánlható megoldás – a mintavétel módját beépíthetjük az elemzésbe is, vagyis az eltérő mintavételi valószínűségek reciprokával súlyozó Horvitz–Thompsonbecslést alkalmazhatjuk, amire a mai statisztikai szoftverek többsége már fel van készítve. Az előadás társszerzője, Rácz Attila (Szegedi Tudományegyetem – SZTE) hozzászólásában kifejtette, hogy maguk is több kutatásban használták már a Németh Renáta és Rudas Tamás által átdolgozott Kish-kulcsot. Hozzátette, bár mintavételi szempontból sikeresek voltak ezek a kutatások, a gyakorlati tapasztalatok arra hívják fel a figyelmet, hogy nagyobb figyelmet kell fordítani a kulcs pontos használatára az adatfelvételre való felkészítéskor, helyes alkalmazásának ellenőrzésére pedig az adatfelvétel után. A konferencia következő előadását Tóth Gergely (ELTE) tartotta, aki Rudas Tamás társszerzőségével a „design” effektről, azaz a mintavételi hatásról beszélt. Az előadás több
Statisztikai Szemle, 91. évfolyam 2. szám
208
Fórum
oldalról is körbejárta a mintavételi hatás jelenségét. Először elméleti szinten közelítette meg a kérdést: bemutatta, hogy az effekt miért is jelenik meg a mintavételi adatok elemzése során, és rámutatott arra, hogy a várható értékek becslésénél milyen természetű hiba származhat belőle. Az előadás következő részében egy népszámlálási adatokon alapuló szimulációs eljárás eredményeivel ismertette meg a hallgatóságot, amely révén láthatóvá vált, hogy még egy olyan kiemelt szociológiai változó esetében is, mint az iskolai végzettség, figyelembe kell venni a mintavételi hatás megjelenését. A továbbiakban két – a szimuláció eredményein alapuló – állítás fogalmazódott meg: – a többlépcsős és főként nagymintás adatfelvételek esetében kritikusan fontos az elsődleges mintavételi egységek (primer sample unit – PSU) számának helyes megválasztása, mivel azok alacsony volta drasztikusan csökkentheti az effektív mintaméretet, ezáltal növelve a várható érték konfidencia-intervallumát; – a mintavételi hatás mértéke, az alappopuláció önmagában vett klaszterezett jellege miatt, a közelítő képletekkel várhatóan felülbecsült, azaz a konkrét megvalósult mintavételek esetén a valódi design effekt mértékének meghatározása nem triviális, és a valóságban várhatóan kisebb. Az előadás zárásaként, a pártszimpátiáról kérdező mintavételen alapuló több adatfelvétel eredményeinek elemzését mutatta be az előadó a mintavételi hatás szempontjából, ami arra hívta fel a figyelmet, hogy a mintavételi adatokból következő pártpreferencia-eredmények hibahatára, főként a kisebb pártok esetében, várhatóan nagyobb, mint amit a bevett közelítő eljárások indokolnának. Manchin Róbert (Gallup) is megerősítette az előadáson elhangzottak fontosságát és a design effekt vizsgálatának szükségességét. Az el-
hangzottakat azzal egészítette ki, hogy a mintavétel során a design effekt csak az egyik probléma, de legalább ennyire lényeges a nemválaszolás minél hatékonyabb kezelése vagy a mintavételi keret szintjén megvalósuló kiesés (coverage error) minimalizálása. Az előadások utolsó blokkja a gördülő minták (rolling sample) kérdésköréről szólt. Tardos Róbert (Budapesti Corvinus Egyetem – BCE/ELTE) előadásában bemutatta a Kish és Alexander által kifejlesztett gördülő mintás adatfelvételek elméleti alapjait. A módszer elsődleges célja az volt, hogy a népszámlálások között is lehessen olyan megbízható népességadatokat szolgáltatni, amelyek mind időbeli, mind térbeli bontásban használhatók. Ez az 1980–90-es évekre kibontakozott kutatási cél nem nélkülözött minden előzményt: a népszámlálási adatok folyamatos, évenkénti, mintákon alapuló átalakítását Ph. Hauser még a negyvenes években szorgalmazta, majd a minták kumulálásának, kombinálásának elveit sok tekintetben W. Cochran alapozta meg. Kish volt azonban az, aki összegyűjtötte e különböző, részben még ötletszerű elgondolásokat, és pályafutásának a 90-es évekbe nyúló (végső) szakaszában tanulmányok hosszú során keresztül bontotta ki gyakorlati implikációikat és megvalósítási feltételeiket. A gördülő minták módszerére épülő Amerikai Közösségi Adatfelvétel (American Community Survey – ACS) 2010 óta már az amerikai népszámlálás részévé vált, míg Franciaországban a rolling cenzus 2005 óta a hagyományos népszámlálás helyére lépett. Az első tapasztalatok átfogó értékelése még folyamatban van, miközben a népszámlálások egész rendszerének általános átalakulása során olyan újabb országokban kezdtek – részben akadémiai előkészületek közt – a gördülő modellhez kapcsolódó „rolling census” tervekbe, mint Nagy-Britannia vagy Új-Zéland. Kmetty Zoltán (KRE/ELTE) a gördülő mintás adatfelvételek egy speciális változatát a „rolling cross section” (RCS) módszerét mu-
Statisztikai Szemle, 91. évfolyam 2. szám
209
Fórum
tatta be, amely lehetővé teszi a rövid távú kampányok dinamikai elemzését. A legjobban telefonos kutatásokban használható módszer a mintavételt állítja az adatfelvétel középpontjába, és a lekérdezési folyamat során a napi mintavételi szeletek (replikátumok) reprezentativitásának biztosítását tűzi ki célul. Mindegyik replikátum egy miniatürizált formája a mintának. A replikák lényegükből fakadóan éppúgy véletlenek, mint ahogy a teljes minta kezdeti kiválasztása is. Előadásában a szerző bemutatta az RCS-módszer eddigi magyarországi alkalmazásait azok lehetőségeivel és korlátaival. A módszer egyik nagy hátránya, hogy csak igen szigorú naponkénti rétegezési korlátokkal valósítható meg az adatfelvétel, ami a „hagyományos” adatfelvételhez képest csökkenti a napi lekérdezhető esetszámot. Az előadás végén a módszerhez kapcsolható lehetséges hibabecslési eljárásokat vizsgálta az előadó. Az adatfelvétel speciális jellege miatt a paraméteres eljárások torzított becslésekhez vezethetnek, tehát a hibabecsléseknél „re-sampling” technikák használhatók, mint például a bootstrap- vagy a jackknife-módszerek. A műhelykonferencia második részében a meghívott szakértők kerekasztal-beszélgetést folytattak a növekvő válaszmegtagadás reprezentativitást érintő problémáiról és a lehetséges kezelési eljárásokról a felvételtervezés, a kutatási terepmunka és az utólagos korrekciók terén. A kerekasztal-beszélgetést Bozsonyi Károly vezette, a résztvevők Feleky Gábor (SZTE), Kurucz Imre (NRC), Letenyei László (BCE), Manchin Róbert, Rudas Tamás (ELTE) és Závecz Tibor (Ipsos) voltak. A beszélgetést Bozsonyi Károly nyitotta azzal a kérdéssel, hogy jelenleg mekkora probléma Magyarországon a válaszmegtagadás az elmúlt tíz évhez képest, milyen trendek várhatók, és hogyan lehet ezekre felkészülni. Feleky Gábor nyitotta a válaszolók sorát. A 2000 óta minden évben (2006-ot kivéve) lezajló (és Leslie Kish
bátorításával beindított) „Szeged Studies” vizsgálatsorozatban (2007 óta szisztematikusan mintavételi szempontból) követik a kérdezőbiztosok tevékenységét. Az ő adataik nem igazolják a válaszmegtagadási arány növekedését (ami jelenleg 50 százalék körüli). Ennek Szeged kulturális sajátosságai is okai lehetnek. A kérdezést végző diákok visszajelzései alapján azonban az elutasítás módja változott: évről évre radikálisabb a korábbiakhoz képest. Ugyanakkor a magas válaszadási aránynak többek között az is oka lehet, hogy az adatfelvétel előtt minden potenciális válaszadónak kiküldenek egy levelet a kutatásról, továbbá, hogy Szegeden magas a kutatás társadalmi elfogadottsága, ezért a felkeresett személyek szívesen válaszolnak. Závecz Tibor az Ipsosban (korábban Szonda-Ipsos) végzett közvélemény-kutatásoknak az elmúlt húsz évben szerzett tapasztalatait osztotta meg a hallgatósággal. Az Ipsosban 1990 óta végeznek havi, személyes kérdezéses omnibuszkutatásokat. A módszertani alapelvek (főcím-, majd kvótaeljárás) végig állandók voltak. A romlás az elmúlt húsz esztendőben radikális volt: 50–70 százalék közötti volt a főcímen lekérdezettek aránya a 90-es évek kezdetén, a 2000-es évekre azonban ez 30 százalékra (Budapesten 20 százalékra) csökkent. Ezt azzal tudják korrigálni, hogy a kérdezőbiztos valamekkora döntési szabadságot kap a pótcímezés során. Mindemellett a kérdezők szakmai felkészültsége is romlik, így egyre nehezebb tőlük elvárni az önállóságot. Mivel a megoldási kulcs egyre inkább a kérdezők kezébe kerül, Závecz Tibor véleménye szerint többet kellene költeni kérdezői tréningre, illetve ellenőrzésre. Rudas Tamás az elhangzottakat azzal egészítette ki, hogy önmagában nem a válaszmegtagadás a legfontosabb kérdés, hanem az, hogy a ténylegesen begyűjtött válaszok hasonlók-e ahhoz, mint amit a főcímen szereplő személyek lekérdezése esetén kaptunk volna. Ki-
Statisztikai Szemle, 91. évfolyam 2. szám
210
Fórum
emelte, hogy a nemválaszolók szelekciója az igazán kérdésfüggő. Ezt az „utánfutóhatás” (bandwagon effect) problematikája kapcsán fejtette ki bővebben. A politikai kutatásokban gyakran látható, hogy a választások után hirtelen jelentősen megugrik a győztes párt támogatottsága. Ezt általában azzal magyarázzák, hogy a megkérdezettek egy része megváltoztatja „valós” pártpreferenciáját és azt nyilatkozza, hogy a győztes pártra szavazott. Rudas Tamás azonban kiemelte, hogy ezek a kutatások nem feltétlenül emiatt adnak hamis eredményt, hanem az is közrejátszhat, hogy a győztes pártok hívei szívesebben vesznek részt egy választás utáni politikai közvéleménykutatásban, mint a vesztes pártokra szavazók. Ez átvezet az adatpótlás és a súlyozás kérdéskörére, amely szintén számos elméleti és gyakorlati problémát vet fel. Kurucz Imre az online kutatások oldaláról közelítette meg a kérdést. Ezek alap esetben „bemeneti panelekből” dolgoznak, így az önkéntesség már a panelba való regisztrációnál eldől, már ott megfigyelhető egyfajta kizáró hatás. Ezen túl a regisztráltak körében is van válaszmegtagadás, de ezekben az esetekben nem tudható, hogy a megkeresett nem akar válaszolni, nem látta az e-mailt, esetleg nem volt ideje a rövid válaszadási időszak alatt kitölteni a kérdőívet. A tendencia egyrészről az, hogy egyre nehezebb bemeneti panelt gyűjteni. Másrészt a válaszadók aránya kérdőívenként és időben is változik, aminek oka lehet a panelfáradás is (azaz, hogy sok kutatással keresik meg a panelban levőket). A kérdőív hossza és nehézsége, illetve témája is sokat számít a válaszadási arány szempontjából. Nehezebb és hosszabb kutatásoknál a kitöltés aránya 10 százalék körüli is lehet, de ugyanez egy két-három perces kérdőívnél akár 40-50 százalékra is felugrik. Az online kutatásokban az a specifikus, hogy a kérdezőbiztos hiánya miatt a kitöltés közben is erős a lemorzsolódás. Ez általában 10 százalék körüli,
de rosszul megszerkesztett, hosszú kutatások esetében akár 50 százalék is lehet. Manchin Róbert nemzetközi keretbe helyezte a nemválaszolási trendeket. A válaszadás tapasztalatai szerint minden országban lineárisan csökken, de a jelenlegi szintek erősen kultúrafüggők. Koreában és Japánban 8-10 százalék, Németországban 15 százalék, míg a Balti-országokban 50-60 százalék körül van a válaszadási arány. Manchin Róbert is kiemelte, hogy nem elsősorban a válaszadási arány a fontos, hanem a válaszmegtagadás torzítása. Azt szerinte is nehéz elhinni, hogy az a 8-10 százaléknyi japán válaszadó ugyanolyan jellegű válaszokat ad, mint a nemválaszoló 90 százalék adna. Letenyei László a korábban elmondottakhoz képest egy új szempontot vezetett be. Véleménye szerint a legfontosabb kérdés az, hogyan lehet lassítani a válaszmegtagadás csökkenésének folyamatát. A válaszmegtagadás mértékét befolyásolhatja a kérdezőbiztosok külső megjelenése, kora, a kutatócég neve vagy az adott kutatás ismertsége. Véleménye szerint a fő probléma a kérdőívezés standard jellege, mivel az emberek kétirányú kommunikációra szocializálódnak. A kutatások elején a következő varázsszavak szoktak elhangzani: „A válaszadás névtelen és önkéntes, és az eredményeket csak aggregált formában adjuk közre.” Egyes válaszadóknál éppen ez a probléma, mivel nem feltétlen akarnak anonimak lenni, szívesen vállalják a véleményüket. Ha azt akarjuk, hogy a válaszadó jó partner legyen a kutatás során, akkor kétoldalúvá kell alakítani a kommunikációt úgy, hogy a kérdezettnek módja legyen kiszakadni a kérdezési szituációból. Ilyen például az a módszer, amikor a kérdezett pontosíthatja a kérdést olyan szempontból, hogy ő mit értett rajta. A kerekasztal-beszélgetés következő körkérdése arra vonatkozott, hogy vajon érdemes-e fizetni (akár ajándék formájában a válaszadók-
Statisztikai Szemle, 91. évfolyam 2. szám
211
Fórum
nak), ahogy ez egyes országokban már bevett gyakorlat. Rudas Tamás válaszában arra mutatott rá, hogy ha fizetünk a válaszadónak, akkor ezt úgy kellene kikalkulálni, hogy mindenki az órabérének megfelelően kapjon juttatást. Az inhall tesztek példája jól mutatja, hogy minél több pénzt ajánlunk fel a részvételért, annál magasabb társadalmi státusú embereket tudunk bevonni a kutatásba. Tehát a kérdezetteknek kifizetett pénzösszeg nagysága mintaszelekciós szempontból további torzítást okozhat. Závecz Tibor hozzáfűzte, hogy a piac ezt úgysem tudja megfinanszírozni, tehát nem érdemes sokat gondolkodni ezen a kérdésen. Cserébe a kérdezők jutalmazását kellene növelni és jobb kérdezőkkel nagyobb mintajavulást lehetne elérni. Azonban a kutatócégek közötti versenyhelyzet letöri az árakat, és a megbízók gyakran ár, nem pedig a szakmaiság alapján döntenek. Kurucz Imre az online panelek kapcsán megjegyezte, hogy mindig is voltak a kitöltéshez köthető jutalmak. Az NRC időnként nagyobb tárgynyereményt, havonta kisebb nyereményeket is kisorsol. Azonban a válaszadási arány fenntartásához lassan minden kutatáshoz ajándéksorsolást kell tartaniuk. Végül Manchin Róbert megjegyezte, hogy a hagyományos kérdőív-készítési és mintavételi technikák lassan el fognak tűnni és más módszerek kerülnek előtérbe, köztük olyanok
is, amelyeket korábban nem tartottunk szakmai szempontból korrektnek, mint például a kvótás lekérdezés vagy a bemeneti panelek. A műhelykonferencia tanulságait Harcsa István (KSH) összegezte. A korábbi időszakokhoz képest a jövőben még nagyobb szükség lesz a hatékony mintavételi és felvételtervezési eljárások kidolgozására. A lakossági vizsgálatokon alapuló tapasztalatok ugyanis azt mutatják, hogy jelentősen megnehezült a valósághoz közel álló, releváns adatok begyűjtése, és a felmerülő problémák kezelését szolgáló, eddig bevált eljárások egyre kevésbé hoznak kielégítő eredményt. A nehezülő adatfelvételi körülmények tehát a megfelelő eljárások kidolgozását követelik, aminek csak széles körű szakmai összefogással lehet hatékonyan eleget tenni. A tét meglehetősen nagy, hiszen végső soron a reprezentatív adatgyűjtések szavahihetősége forog kockán, ezért célszerű lenne a jövőben rendszeressé tenni a témakörrel foglalkozó – hasonló jellegű – műhelybeszélgetéseket, továbbá az is megfontolandó, hogy az érintett kutatóintézetek közreműködésével a jövőben közös módszertani fejlesztések induljanak el. Kmetty Zoltán, az Eötvös Loránd Tudományegyetem és a Károli Gáspár Református Egyetem tanársegéde E‐mail:
[email protected]
Horváth Piroska (1936—2012) Horváth Piroska Nagykátán született, középiskolás évei jelentős részét Jászberényben töltötte, majd Budapestre került, ahol munkába állt. Első munkahelyeinek egyike a Magyar Nemzeti Bank volt. Munka mellett végezte el a
közgazdaság-tudományi egyetemet, s a végzést követően, 1967-től kezdett el dolgozni a Központi Statisztikai Hivatalban (KSH), ahol a hetvenes-nyolcvanas években a nemzeti számlák – akkori szóhasználattal a népgazdasági mérlegek
Statisztikai Szemle, 91. évfolyam 2. szám