EÖTVÖS LORÁND TUDOMÁNYEGYETEM TÁRSADALOMTUDOMÁNYI KAR SZOCIOLÓGIA DOKTORI ISKOLA
Az elhanyagolt tényező, avagy nem mintavételi hibák a kérdőíves adatfelvételekben
Doktori disszertáció
Pillók Péter
Témavezető: Székelyi Mária
2010
1
2
Bevezetés ............................................................................................................................ 4 1.1
A kérdőíves kutatások helyzete és fejlődési irányai ................................................................ 5
1.2
Az értekezés témaválasztása ................................................................................................... 9
1.3
Az értekezés felépítése .......................................................................................................... 14
A nem mintavételi hibák a korábbi kutatások tükrében ................................................... 16 2.1
2.1.1
Sokaság definíciók és a fedési hiba típusai .................................................................... 16
2.1.2
Fedési hiba modellezése................................................................................................ 20
2.1.3
A fedési hiba mértékének becslése empirikus vizsgálatokban ..................................... 26
2.1.4
Fedési hiba kezelése a kutatási tervben ........................................................................ 38
2.1.5
Fedési hiba – összegzésképpen ..................................................................................... 41
2.2
Teljes nem válaszolás ............................................................................................................ 42
2.2.1
A nem válaszolás jelensége és vizsgálata ...................................................................... 42
2.2.2
Statisztikai modellezés és nem válaszolási arányszámítás ............................................ 47
2.2.3
A nem válaszolás társadalmi okai és komponensei....................................................... 54
2.2.4
A felmérések számára nem látható társadalmi csoportok ............................................ 59
2.2.5
A visszautasítók ösztönzése és ennek hatásai ............................................................... 73
2.2.6
A visszautasítás kezelése a kutatási tervben ................................................................. 76
2.2.7
Teljes nem válaszolás – összegzésképpen ..................................................................... 83
2.3
3
Fedési hiba............................................................................................................................. 16
Mérési hibák .......................................................................................................................... 85
2.3.1
Válaszadói hiba .............................................................................................................. 85
2.3.2
A kérdezőbiztos hatása.................................................................................................. 86
2.3.3
Adatgyűjtés módjának hatása a válaszokra................................................................. 103
2.3.4
A kérdőív és a kérdések hatása ................................................................................... 130
2.3.5
Részleges nem válaszolás ............................................................................................ 139
Nem mintavételi hibák az Ifjúság2008 kutatásban ........................................................ 149 3.1
A kutatás bemutatása.......................................................................................................... 149
3.1.1
A kutatás előzménye és célja ...................................................................................... 149
3.1.2
A kérdőív témakörei és a minta kialakítása ................................................................. 150
3.2
Fedési hiba „nyomai” .......................................................................................................... 156
3.3
Teljes nem válaszolás – nem válaszolók, nehezen elérhetők.............................................. 159
3.3.1
Nem-válaszolási arányok az Ifjúság2008 kutatásban .................................................. 159
3.3.2
Visszautasítók és nem elérhetők ................................................................................. 161
2
3.3.3 3.4
Nehezen elérhetők demográfiai különbségei ............................................................. 164
Mérési hibák ........................................................................................................................ 167
3.4.1
Kérdezőbiztosi hatás.................................................................................................... 167
3.4.2
Kérdőív hatása ............................................................................................................. 185
3.4.3
Részleges válaszmegtagadás ....................................................................................... 192
3.5
Összegzés............................................................................................................................. 209
4
Záró megjegyzések ......................................................................................................... 216
5
Függelék ......................................................................................................................... 218 5.1
Teljes nem válaszolás - nehezen elérhetők demográfiai különbségei ................................ 218
5.2
Az Ifjúság2008 kutatás témái és almintái ............................................................................ 219
5.2.1
A kérdőív témái........................................................................................................... 219
5.2.2
Az egyes almintákon kérdezett témák ........................................................................ 220
5.3
6
Mérési hibák ........................................................................................................................ 222
5.3.1
Kérdezőbiztosi hatások................................................................................................ 222
5.3.2
A kérdőív vizsgálata ..................................................................................................... 232
5.3.3
Item nem válaszolás – változó szettek kialakítása ...................................................... 240
5.4
Hiányzó értékeke – nem, településtípus, korkategória szerint ........................................... 245
5.5
Demográfiai változók alapmegoszlása az Ifjúság2008 súlyozatlan mintában ..................... 246
Irodalomjegyzék ............................................................................................................. 248
3
1 Bevezetés Már az egyetemi tanulmányaim utolsó szemeszterében, mint érdeklődő szociológus hallgató
figyelemmel
kísértem
a
társadalomkutatásokkal
foglalkozó
kiadványokat,
műhelyeket és kutatásokat. Így figyeltem fel az Ifjúság2000 kutatás beszámolói kapcsán arra a félmondatra, amely szerint a kutatás adatfelvétele során a budapesti fiatalok nagyjából fele tagadta meg a válaszadást. Felébredt bennem a kétség, hogy vajon egy ekkora válaszmegtagadási arány mellett hogyan is gondolhatjuk, hogy ennek a kutatásnak reprezentatív a megvalósult mintája. Természetesen a mintavétel során – bizonyos korrekciós eljárásokkal – a kieső válaszolók helyett lehet válaszolásra hajlandó alanyt találni. Így elérhető, hogy összességében a reprezentativitás megítélésekor vizsgált dimenziók mentén – kor, nem, településtípus – statisztikai értelemben korrekt marginálisokat kapunk. Felmerült azonban – nem csak bennem – a kérdés, hogy a „pót-válaszolók” vajon mindenben reprezentálják-e a kieső válaszolókat. Szélsőségesen fogalmazva, úgy gondoltam kezdő kutatóként, hogy bizony nagy-nagy „mázli”, ha ezek után egy ilyen felmérésből készült elemzés közel kerül a valósághoz. Nem sokkal később, a válaszmegtagadással kapcsolatos korábbi tapasztalatok után kutatva láttam, hogy a szakirodalom a kérdőíves felmérések torzítási lehetőségei között a mintavételen és a válaszmegtagadási hibán kívül még számtalan, valójában evidens torzítási lehetőséget ismertet. Úgy találtam, hogy ezen témaköröknek csak meglehetősen hiányos a publikált irodalma Magyarországon. Ez persze nem feltétlen jelenti azt, hogy nem végeznek ilyen jellegű módszertani kísérleteket, de a tudományos szférában meglehetősen ritka. A profitorientált szektorban
jelenlévő
intézmények
az
adatfelvételek
során
dolgoznak
valamiféle
minőségbiztosítási és ellenőrzési rendszerrel, amellyel az ismertetett hibák és torzítási lehetőségek egy részét lefedik, kontroll alatt tartják. Némely esetben a több országban jelenlévő kutatási cégek átveszik a már más országban bevált eljárásokat. A módszerek implementálása során azonban rengeteg eltérés, országokra, kultúrákra jellemző sajátosság lehetséges. Ezeknek az eredményei azonban csak a legritkább esetben, esetleg egy-egy konferencián kapnak publicitást, rendszerezve nem érhetők el. Ez egy meglehetősen látens terület; vannak olyan lehetséges torzítási hatások, amelyekkel a kutatók nem csak nem számolnak, hanem még az ismereteik is hiányosak. 4
Legtöbbször a gyakorlatban a kutatások során az elkészült adatfelvételekről nem lehet ilyen jellegű információkat megtudni. A legszélesebb publicitásra igényt tartó, politikai jellegű közvélemény-kutatások esetében sem közölnek a nem mintavételi torzításokkal összefüggő paramétereket, csak a mintavételi hibából fakadó elméleti konfidencia intervallumot. A kutató oldaláról pedig a legtöbb kérdőíves kutatás során az a gyakorlat, hogy a kutató elkészíti a kutatási tervet, amely tartalmazza a mintavételi tervet, eljárást, az adatfelvétel módszerét, valamint elkészíti a kutatás kérdőívét. A kutató az adatfelvétel elkészülte után kap egy tisztított és – a mintavételi terv szerint – súlyozott adat-szettet, de általában nem kap semmilyen, az adatfelvételre és az adatok minőségére utaló információt. Egy kis gyakorlattal mindösszesen
csak
a
súlyok
mértékéből
és
eloszlásából
lehet
erre
vonatkozó
következtetéseket levonni. A véletlen úgy hozta, hogy évekkel később lehetőségem nyílt részt venni az Ifjúság2008 kutatás tervezésében és bonyolításában. Adódott a lehetőség, hogy egy, az átlagos kutatásnál precízebb leírást és dokumentációt készítsünk a kutatásról módszertani elemzés céljára. Összekötve a kellemest a hasznossal, kézenfekvő volt az ötlet, hogy a kutatás módszertani elemzésének vezérfonala a nem mintavételi hibák köré rendeződjön. A dolgozatban tehát a nem mintavételi hibákkal kapcsolatos korábbi kutatásokat rendszerezem, majd pedig ismertetem saját eredményeimet az Ifjúság2008 kutatás módszertani elemzése kapcsán. Elemzésem remélhetőleg a hibák szempontjából igencsak tanulságos lehet. Ilyen és ehhez hasonló elemzések mentén eljuthatunk oda, hogy egyfajta módszertani eljárás kristályosodjon ki az adatfelvételi gyakorlatban, akár mint a „legjobb gyakorlat”.
1.1 A kérdőíves kutatások helyzete és fejlődési irányai A disszertációban a kérdőíves kutatások jellemzőit, illetve az azokban megjelenő torzító tényezőket vizsgáljuk. Elsőként tekintsük át, hogy a kérdőíves kutatásoknak milyen fejlődési irányai voltak az elmúlt 30 évben. Kvalitatív kutatási módszerekkel dolgozók inkább sajnálkozva, a statisztikusok pedig inkább elégedetten veszik tudomásul a kérdőíves kutatások kulcsfontosságú szerepét, mondhatni dominanciáját. Az ESOMAR (World Association of Opinion and Marketing Research Professionals, formálisan European Society for Opinion and Marketing Research) évről évre közli 50 különböző ország kutatási költéseit módszerenként és kutatástípusonként. 5
A 2007. évre vonatkozó Global Market Research iparági jelentés1 szerint 2007-ben a globális (50 ország alapján számolt) kutatási költések 84%-át jelentették a kvantitatív jellegű kutatások, 14%-ot tettek ki a költésekből a kvalitatív jellegű kutatások, a maradék 2%-t pedig „desk research” és másodelemzés jellegű vizsgálatokra fordították. Természetesen a kvantitatív kutatásoknak más jellegű költségelemei és költségigénye van, sok esetben ez jóval magasabb, mint a kvalitatív kutatások esetében, ennyiben tehát a ráfordítások nem tükrözik a különböző módszerekkel készült különböző kutatások számát. Ha csak a kvantitatív kutatások egyes konkrét típusaira elköltött összeget vizsgáljuk, akkor az online felmérés részesedett globális szinten a legnagyobb költéssel (25%), ezt követte a telefonos (19%), majd a személyes megkérdezések (12%) és végül a postai megkeresések (6%) aránya, az egyéb kvantitatív módszerek költési részesedése pedig (38%). A Magyarországon a kvalitatív és kvantitatív kutatások aránya megegyezik a nemzetközi arányokkal2: 2007-ben az összes iparági ráfordítás 84%-a kvantitatív. Ugyanakkor a kvantitatív kutatások konkrét típusainak megoszlása már más képet mutatott: 54%-a személyes, 19%-a telefonos, 16%-a online, 6%-a egyéb kvantitatív és 5%-a pedig postai kérdőíves módszert használ. Hazánkban a globálisan tapasztalt trendekhez képest a személyes lekérdezések dominanciája még nem dőlt meg, de érezhető az egyes kvantitatív módszerek költési arányaiban egy átstrukturálódási folyamat. Ennek lényege, hogy általában egy növekvő összes költési szint mellett a személyes lekérdezések aránya csökken az online felvételek illetve az egyéb kvantitatív kutatási ráfordítások
(megfigyelés jellegű
adatfelvételek, adatbányászat, másodelemzések) aránya pedig megnő. Tekintsük át Kalton3 alapján, hogy az elmúlt évtizedekben milyen tényezők vezettek a kérdőíves módszerek tapasztalt mértékű elterjedéséhez, és hogyan változott az egyre precízebb módszertani apparátussal együtt a felvételekben tapasztalt hibalehetőségek becslése, illetve elkerülésének lehetősége. Kalton szerint az első legfontosabb változás a kérdőíves felvételek körüli „szakma” kialakulása, professzionalizálódása. A folyamat jócskán az 1930-as években kezdődött, de a II. világháború után soha nem látott fejlődésnek indultak világszerte a módszerek, a ’60-as 1
Global Market Research 2008, ESOMAR industry report, ESOMAR, 2008
2
Global Market Research 2008, ESOMAR industry report, ESOMAR, 2008
3
Graham Kalton: Development in survey research in the past 25 years, Survey Methodology, 2000, június, vol. 26. pp 5-10
6
évektől pedig különösen nagy lökést kaptak. Egyrészt kialakult a kérdőíves felvételek felhasználói köre: a stratégiai tervezők, politikai döntéshozók is megtanulták értékelni a survey adatok és elemzések fontosságát. Másrészt a gyors növekedés tetten érhető a kutatási témák expanziójában is: egyre több olyan kutatási téma és terület jelent és jelenik meg, ahol már a gondolkodás kiindulópontja feltételezi az ilyen adatok meglétét. Az intézményesülés további jelzőszámai is alátámasztják az expanziót: a survey kutatásokkal foglalkozó szaklapok megjelenése, majd számuk növekedése, szakmai társaságok alapítása és működése, a nemzetközi szintű konferenciák számának növekedése. Ennek egyik következménye a survey kutatási szakma nemzetközivé válása, valamint multidiszciplináris jellegének kialakulása. A kutatásmódszertannal foglalkozók egyaránt támaszkodnak szociológiai, pszichológiai, antropológia elméletekre, valamint a számítástudományi és számítástechnikai módszerekre. A közelmúlt másik fontos eseménye a módszerek fejlődése: a számítógép-forradalom erős hatással volt a felmérések módszertanára: jóval nagyobb – és egyre növekvő – műveletvégző képesség és kapacitás áll az adatelemzés rendelkezésére. A kifinomultabb statisztikai módszereknek, elemzőprogramoknak és eszközöknek köszönhetően az adatkezelés és elemzés nemcsak kapacitásában, hanem minőségében is jóval fejlettebb. Természetesen ezek a folyamatok visszahatottak a kutatási dizájnra is: a kérdőíves felvételek során a módszerek kognitív aspektusait előtérbe helyező mozgalomnak köszönhetően az egyes kérdőíveket egyre gyakrabban módszeres és előzetes tesztelésnek vetik alá (fókuszcsoportok, viselkedés megfigyelése az előzetes tesztek során). Összességében a kérdezési folyamat során jóval nagyobb mértékben veszik figyelembe a válaszoló igényeit és elvárásait, mint korábban. A számítástechnikai forradalom másik következménye, hogy egyre részletesebb adatokat ismerünk az adatfelvétel előtt a mintavételi, illetve elemzési egységről, ezek némely esetben akár képesek is lehetnek kiváltani felvételeket. Az egyre komplexebb és rendszeresen gyűjtendő adatokhoz igyekeznek más forrásokat is találni, ezek akár „intézményesülnek” a köz és államigazgatás rendszerébe beépülve. Így a közigazgatási adatok sok esetben kiváltották a válaszadóktól gyűjtendő adatokat, ennek következtében csökkennek – valójában a kutatások folyamatos expanziója miatt nem növekednek – a válaszadói terhek, jobb lehet az adatminőség, rendszeresebbé válhat az eredmények közlése és csökkennek az adatok megszerzésével járó költségek.
7
Az adatgyűjtési módszerek terén a fő hangsúly a személyes interjúkról áttevődött a telefonos adatfelvételre, napjainkban pedig már egyre több kutatás esetében az internetre. Természetesen az egyes módszerek során használt kommunikációs eszközök lefedettsége és a nem válaszolás aránya más és más okokra vezethető vissza, amely külön kihívásokat rejt. Fontos változás ezen a területen a számítógéppel segített (computer assisted) módszerek elterjedése: ilyenek a CAPI, a CATI, CASI és a CAWI4. Ezek az eszközök a korábbiaknál sokkal komplexebb kérdőív-kitöltési folyamatot tudnak támogatni. Ahogy azt már említettük, az elmúlt 30 évben a szakma globalizációjának következményeképpen különféle témákban és területeken nő a nemzetközi szintű összehasonlító vizsgálatok népszerűsége. Ezeket a kutatásokat nemzetközi ügynökségek vagy konzorciumok koordinálják és legfőbb erősségük, hogy nemzetek közötti összehasonlítást tesznek lehetővé. Emellett ugyanakkor számtalan, eddig nem tapasztalt igényt támasztanak a kutatókkal szemben: a kutatástervezés első pillanatától problémát jelent az eltérő kultúrák kezelése, gondoljunk csak például a kérdések tartalmának megfogalmazására az eltérő nyelvi verziókban. Nő az igény az egyre finomabb módszerekkel dolgozó másodelemzések és longitudinális elemzések iránt is. A longitudinális adatokból nyerhető megfigyelések előnyeit már nagyon régóta felismerték, a számítástechnika terén érezhető fejlődés azonban megváltoztatta a helyzetet: dinamikus növekedés volt megfigyelhető az elmúlt 30 évben a panel kutatások esetében. Azonban meg kell jegyezni azt is, hogy a longitudinális adatok elemzésének komplexitása – különösképpen az adathiány kezelése – még mindig jelentős probléma, amelynek megnyugtató kezelése még nem minden területen megoldott. Sokkal közelebb áll a témánkhoz, hogy Kalton állítása, ami szerint a kérdőíves felmérésekben az elmúlt 35 évben a nem válaszolók aránya emelkedett (erről részletesebben lásd a „Teljes nem válaszolás” fejezetet). Ezzel együtt változott a részleges visszautasítás kezelése is, korábban – kockáztatva a minta reprezentativitását – az elemzések csak az elérhető válaszokat tartalmazták, napjainkban pedig egyre gyakrabban alkalmaznak imputációs eljárásokat a nem válaszolás kezelésére. Régebben is alkalmaztak ilyen eljárásokat a részleges nem válaszolás kezelésére, de csak a számítási kapacitás növekedésével vált elképzelhetővé szélesebb körű elterjedésük. 4
CAPI: Computer Assisted Personal Interview, CATI: Computer Assisted Telephone Interview, CASI: Computer Assisted Self Interview, CAWI: Computer Assisted Web Interview
8
A számítási erő növekedése elősegítette a súlyozás elterjedését, a mintavételi dizájn főbb eljárásait – rétegzés, többlépcsős mintavétel és nem egyenlő valószínűségű kiválasztás – az elmúlt években fejlesztették ki, de már az 1970-es években feltűntek a szakirodalomban. A komplexebb
és
hatékonyabb
mintavételek
megvalósítását
elősegítette
a
véletlen
számtárcsázás (RDD) illetve a számítógéppel támogatott kérdezések megjelenése. A mintavétel terén újnak mondható a ritka populációk kutatása, amely nagyon sokat fejlődött az elmúlt időszakban Kalton szerint. Kalton több olyan területet is említ ugyanakkor, ahol nem igazán történt jelentős változás. Az egyik ilyen terület maga a survey minőségének ismerete. A survey adatokból történő becslések használóinak és azoknak, akik másodelemzésre használják az adatokat, ismerniük kellene az adatminőség leíró paramétereit, például a mintavételi hiba pontos mértékét, a nem válaszolási arányt, a fedési hiba mértékét. Ennek szükségességét ugyan már felismerték, de ezen a téren nem történt változás az elmúlt időszakban. A másik ilyen terület a teljes survey hiba becslése. Kalton úgy véli, hogy nem tudunk biztosat állítani még a mértékéről illetve természetéről sem, így még sokat kell tanulmányozni ezt a területet. A survey módszerek előtt álló legnagyobb változások és kihívások között említette Kalton a technikai változások folyamatosságát: a számítógép forradalma megváltoztatta a survey kutatások természetét az elmúlt időszakban és ezek alapvető változások még mindig tartanak. A mai kérdőív-felvételi technikák, folyamatok számtalan aspektusában még várhatók változások. Kalton szerint az is valószínűnek látszik, hogy a jövőben a többféle adatfelvételi módszert egyszerre használó dizájnokat (mixed mode) fognak használni azért, hogy minél jobban el tudják érni a válaszolókat, a jövőre vonatkozó legnagyobb kihívás a válaszolók részvételi szándékának fokozása.
1.2 Az értekezés témaválasztása Látható volt az imént, hogy bár a survey-módszerek számtalan szempontból sokat fejlődtek az elmúlt évtizedekben, továbbra sem tudjuk az egész survey hibát megbecsülni, komoly nehézséget jelent a válaszolási kedv csökkenése és Kalton szerint a jövőben a legnagyobb kihívás a válaszolók elérése lesz. A nem mintavételi hibák jelensége ugyan már régebbről ismert probléma, sokan szembesültek és szembesülnek egyes elemeivel, ennek ellenére minimalizálásának koránt sincsen kiforrott irodalma, eljárásai vagy gyakorlata. Maga 9
az elnevezés is – amelyik a mintavételi hibákkal szemben definiálja a nem mintavételi hibákat – egy gyűjtőfogalom. Nagyon sokféle, eltérő hatást és hatás-együttest foglal magában, definíció szerint a mintavételi hibákon kívül minden egyéb torzító tényezőt magában foglal, amely az egész kutatási esemény környezetét adja (részletesebben definiáljuk majd a típusait illetve ezek viszonyait). A többféle tudományágban fellelhető kvantitatív empirikus kutatásokkal foglalkozók a survey-módszertannak inkább a statisztikai, mint a társadalomtudományi aspektusait helyezik előtérbe. Sok jó mintavétellel kapcsolatos eljárás és módszer létezik, de ezek nem foglalkoznak a nem mintavételi hibával.5 Ennek egyik oka – megelőlegezve a nem mintavételi hibákról majdan elmondandókat – hogy a mintavételi hibákhoz képest a nem mintavételi hibákat nehezebb megbecsülni, variabilitásuk jóval nagyobb, kiszámíthatatlanabb, egyes komponenseik pedig kultúrafüggőek vagy a megkérdezettek beállítottságától, pszichológiai alkatától is nagymértékben függenek.6 A dolgozatban ezt a nemzetközi szinten is alulkutatott, de a kérdőíves kutatások eredményeinek értelmezése szempontjából kulcsfontosságú témát járjuk körül: áttekintjük és elemezzük a nem mintavételi hibákat. A dolgozat célja a nem mintavételi hibák keletkezésének és meghatározó faktorainak áttekintése. Bemutatjuk, hogy ezek a hibák miből állnak, hogyan keletkeznek, és milyen a kapcsolatuk egymással. Célunk, hogy a ténylegesen alkalmazott kutatási eljárásokat jellemezzük, feltárjuk közös attribútumaikat, s mindazt, amit érdemes belőlük a jövőben figyelembe venni. Egy konkrét kutatás elemzése kapcsán a gyakorlatban is megvizsgáljuk, hogy hogyan jelennek meg, milyen torzításokat tulajdoníthatunk nekik, illetve hogyan kalkulálhatók ezek a hibák: az Ifjúság2008 kutatás eredményeit, adatfelvételi dokumentációját és metaadatait tekintjük át és elemezzük, illetve inkább csak egy vázat szolgáltatunk a további mélyebb elemzések számára. Az elemzési témák mélységét még biztosan lehetne növelni, de azt is látni kell, hogy a legtöbb, a nem-mintavételi hibákat elemző vizsgálatban a módszertani kísérlet szempontjából készül a kutatási dizájn. Az Ifjúság2008 kutatás során a kutatási dizájn készítésekor erre nem volt lehetőség, pusztán az adatfelvételi dokumentáció és az adatok utólagos elemzésének lehetősége áll rendelkezésre.
5
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York
6
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York
10
Tekintsük át, hogy milyen torzítási lehetőségek keletkezhetnek egy kérdőíves felmérés során. A szakirodalom a mintavételi és nem mintavételi hibák csoportját különbözteti meg. Ebben az alapvető felosztásban mindegyik kérdőíves vizsgálat a következő torzítási lehetőségeknek van kitéve (Groves (1989), Fischer (2001) és Waffenschmidt (2002) alapján): Mintavételi hiba 1. mintavételi hiba: a mintavételi hiba abból fakad, hogy a kutatás során használt minta nem tükrözi teljes mértékben a reprezentálni kívánt alapsokaságot Nem mintavételi hibák 2. fedési hiba: azaz a mintavételi keret hibája: amely abból fakad, hogy nem mindenkinek van egyáltalán esélye a mintavételi keretbe kerülésre 3. nem válaszolási hiba: az abból fakadó hiba, hogy nem mindenki válaszol a mintába kerültek közül 4. mérési hiba: azaz az eszközök hibája, a válaszok hiteltelensége, mely abból fakad, hogy nem közvetlenül mérjük a tudattartalmakat, hanem valamilyen mérőeszközzel, reprezentációval: a) válaszadói hatás – a válaszoló értelmi és pszichológiai faktorai – azaz mennyire érti meg és mennyire tudja jól artikulálni a válaszait b) kérdezőbiztos hatása c) kérdőív hatás – a kérdőív jellemzőiből, gyengeségeiből fakadó hiba d) az adatgyűjtés módja – azaz a kommunikáció típusa e) item nem válaszolás – azaz részleges nem válaszolás 5. feldolgozási/elemzési hiba Több nem mintavételi hiba-klasszifikációban a részleges nem válaszolást a teljes nem válaszolással egyben kezelik. Az általunk alkalmazott logikai sémában az item nem válaszolást a mérési hibáknál vizsgáljuk. Ennek oka, hogy a részleges nem válaszolás inkább
11
a mérési folyamat egy másik torzító tényezőjének következménye, nagymértékben más tényezők okozzák, mint a teljes visszautasítást. A lehetséges hibák közül ugyan a mintavételi hibának kiterjedt szakirodalma van, de a gyakorlatban az erőforrások korlátozottsága miatt nem lehet mindig kompromisszumok nélkül megvalósítani a mintavételi hiba minimalizálására optimalizált kutatási tervet. A továbbiakban a mintavételi hibák okozta torzítási lehetőségekkel nem kívánunk foglalkozni, figyelmünket a nem mintavételi hibák okozta torzítás ábrázolására fordítjuk. 1. ábra
A survey hibák torzító hatásának szemléltetése – az információs tölcsér modell7
A kutatások egyes fázisait egy információs tölcsérként elképzelve jól látható válik az adatfelvételek egyes fázisainak torzító hatása. A modellben az egyes fázisok az előző kutatási fázis információtartalmát megszűrik, ennek eredménye, hogy a survey statisztika az eredeti információnak csak egy részét tartalmazza.
7
Wayne Enanoria, PhD, MPH: Sampling Frames www.idready.org/courses/2005/spring/survey_SamplingFrames.pdf
12
and
Coverage
Error,
2. ábra
A survey-hibák torzító hatása a kutatásból kinyerhető információra8
Az adatfelvétel egyes fázisaiban tehát válaszolók vesznek el a felmérés szempontjából. Így a mintavételi keret összeállításával kiesnek a keret által nem lefedettek, a mintavétellel kiesnek a mintavételi keret mintába nem került tagjai, valamint az egyéb okok miatt alkalmatlanok (pl. intézményi háztartásban élők), a következő fázisban pedig kiesnek azok, akik nem elérhetők vagy megtagadják a válaszolást. A válaszolók súlyozott halmazán számolt survey statisztikát ugyanakkor vonatkoztatják az egész célpopulációra. Groves szerint az adatgyűjtés minőségét alapvetően az adatszolgáltatók határozzák meg, ennek következtében sok esetben elképzelhető, hogy a nem mintavételi hiba nagyobb, mint a mintavételi hiba, ráadásul ezek interakciós hatását is figyelembe kell venni. Éppen ezért Groves definíciója szerint az összes survey hiba a mintavételi és nem mintavételi hibák eredője (nem pedig összege). Assale és Keon (1982) az is megfogalmazzák, hogy a nem mintavételi hibák nagyobb mértékben járulnak hozzá a teljes survey hibához, mint a mintavételi hiba.9
8
Wayne Enanoria, PhD, MPH: Sampling Frames www.idready.org/courses/2005/spring/survey_SamplingFrames.pdf 9
and
Coverage
Error,
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002.Survey nonresponse – Chapter 10 Effect of Item Nonresponse on Nonresponse Error and Inference
13
1.3 Az értekezés felépítése A dolgozat alapvetően három részre osztható. Az első részben a nem mintavételi hibák ismérveit tárgyaljuk a szakirodalom alapján (2. fejezet: Nem mintavételi hibák a korábbi kutatások tükrében). Ebben a részben elsőként a fedési hibákat mutatjuk be, ahogy a nem mintavételi hibák típusainál tettük. Ezt követően a kérdőív-válaszolást egészében visszautasítók – a teljes visszautasítók – okozta torzításokat, illetve a magát a jelenséget vizsgáljuk. A következő fejezetekben a mérési hibákat vesszük sorba a klasszifikáció alapján, a válaszadói hiba eltérő jellegét, majd a kérdezőbiztos hatását mutatjuk be. Az adatgyűjtés módjának hatását elemezzük két vizsgálati szempont szerint, az egyik szempontot egy esettanulmánnyal szemléltetve. Ezt követően a mérőeszköz, azaz a kérdőív és a kérdések okozta torzítási lehetőségeket tekintjük át, végül a részleges nem válaszolás jellemzőit vizsgáljuk. A dolgozat második részében (3. fejezet: Nem mintavételi hibák az Ifjúság2008 kutatásban) az Ifjúság2008 kutatás kapcsán konkrétan megvizsgáljuk a nem mintavételi hibákból fakadó torzítási lehetőségeket az első részben megismert struktúra szerint. Végül pedig a dolgozat harmadik részében (4. fejezet: Összefoglalás) röviden összefoglaljuk tapasztalatinkat a nem mintavételi hibák kapcsán. Ez a dolgozat főleg a nemzetközi – elsősorban az egyesült államokbeli vonatkozásokat tartja szem előtt, ahol lehetett, ott természetesen kiegészítettük a magyarországi eredményekkel. Az ismert szakirodalomban legátfogóbban, legtöbb dimenzióját kibontva az egyes torzítási lehetőségeknek Robert M. Groves: Survey errors and survey costs 10 című műve dolgozta fel, az egyes témák feldolgozása során sok esetben mi is Groves könyvének gondolatmenetén haladunk. Alapvetően kérdezőbiztossal segített kérdőív-interjú – személyes vagy telefonos – módszerekkel készült felméréseket vizsgálunk. A lakossági felmérések állnak a vizsgálat fókuszában, vállalati vagy intézményi felméréseket, illetve egyéb, nem személyes megkérdezéseket nem vizsgálunk. Ezek a kutatások egészen más megközelítési módokat igényelnének a lakossági kutatásokhoz képest, amelyet e dolgozatban nem tárgyalunk. Végezetül, csak olyan felméréseket tárgyalunk az értekezésben, amelyek „ad hoc” kutatási
10
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York
14
dizájnnal rendelkeznek, tehát a panel adatfelvételeket illetve a longitudinális, több hullámot magukban foglaló adatfelvételeket nem vizsgáljuk, csak bizonyos speciális esetekben hivatkozunk ezekre a kutatási elrendezésekre. Ennek legfőbb oka, hogy ezen kutatások jóval komplexebb paraméterekkel írhatók csak le, mint egy egyedi adatfelvétel, speciális hibákat és tévedési lehetőségeket vetnek fel. Nem témája a dolgozatnak a mintavételi hibák mellett az sem, ami az adatgyűjtés lezárulta után az adatokkal történik. A súlyozás és adatelemzés során alkalmazott eljárások ugyan nagy hibaforrások lehetnek, de ezek a hibák javíthatók a mintavételi egység újra kontaktálása nélkül is.
15
2 A nem mintavételi hibák a korábbi kutatások tükrében 2.1 Fedési hiba A fedési hibák teljes megértéséhez elsőként definiáljuk a lehetséges sokaságokat, amelyeket egy felmérés során figyelembe kell venni, majd az egyes lehetséges sokaságok típusait és magát a fedési hibát elemezzük. Groves alapján a fedési hiba statisztikai modelljét és becslésének módját mutatjuk be, majd áttekintjük az empirikus vizsgálatokat, illetve a fedési hibák csökkentésének lehetőségeit. Végül pedig példákat hozunk a fedési hiba kezelésére a kutatási tervben. 2.1.1 Sokaság definíciók és a fedési hiba típusai Ahhoz hogy tisztán lássuk, mi az a fedési hiba és milyen megjelenési formái vannak, fontos elsőként tisztáznunk Groves11 alapján, hogy pontosan milyen populációkról és válaszolói halmazokról beszélhetünk egy kérdőíves felmérés során. A survey felmérések és elemzések immanens jellegzetessége, hogy mintát használnak, azaz egy rögzített válaszolói készlettel dolgoznak, és ebből egy jóval nagyobb populációra próbálnak meg érvényes kijelentéseket tenni. Az ideális survey-felmérés tervezésekor, de különösen az elemzés során explicitté kell tenni, hogy milyen populáció van a kutató érdeklődésének középpontjában. Kish (197912) definíciói alapján nézzük, hogy milyen populációkat lehet definiálni egy felmérésben és ezek a bevezetett fogalmak hogyan segítenek abban, hogy megértsük a fedési hiba problémáját. A legtágabb halmazt a vonatkoztatott populáció (population of inference) jelenti, amely azon jól lehatárolt személyek halmazát jelenti, akikre a kutatás vonatkozik. A célpopuláció (target population) azon meghatározott számú személyek összessége, akiket konkrétan vizsgálunk. Groves13 ezen a ponton megjegyzi, hogy a vonatkoztatott populáció és a célpopuláció közötti különbséget a kutató hozza létre − explicit vagy implicit módon − azzal, hogy a 11
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp 81.
12
Kish, L. „Populations for Survey Sampling.” Survey Statistician, No. 1. February, 1979, pp. 14-15.
13
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp 83
16
célpopulációt teszi meg a kutatás vonatkoztatási populációjává vagy pedig azzal, hogy semmit nem tesz azért, hogy a vonatkoztatott populáció tagjai (mind) bekerüljenek a célcsoportba. Keret-populációnak (frame population) azon elemek összességét nevezzük, amelyek listájából a survey-felmérés mintáját lehet kiválasztani. Egyszerű esetben ez a mintavételi keret, egyéb esetben ez a területi egységek listája, amelyekhez direkt módon lehet a személyeket kötni (mint lakóhely), vagy a háztartások listája. Egy sokkal formálisabb definíció szerint (Wright és Tsao, 198314) a keretet olyan tárgyak és eszközök jelenítik meg, amelyek határolják, azonosítják a célpopuláció egyes elemeit és hozzáférést engednek azokhoz. A keret egyéb információkat is tartalmazhat (méret, demográfiai információk), amelyeket speciális mintavételi technikák esetén használnak (rétegzés vagy valószínűségi arányok), vagy a kiértékelés során használhatják fel ezeket. Groves hasznos megjegyzése szerint a statisztika- könyvekben a keret jelenti az univerzumot, mivel általában eltekintenek a vonatkoztatott és a célpopuláció fogalmának beemelésétől. A vizsgálati népesség (survey population) egy olyan absztrakt populáció, amelyet – paradox módon – éppen a survey-felmérések segítségével nem lehet megismerni. Elvileg azon személyek összességét jelenti, akiket ha a mintába választanak, akkor válaszolók lesznek. Egyszóval elérhetők a survey interjúk számára, tudnak és akarnak válaszolni a survey felkérésre. Ez azt jelenti, hogy már a mintavételi fázis előtt eldőlne, hogy ki az, aki akar és ki az, aki nem akar válaszolni a megkeresésre, az eddig bevezetett fogalmakkal demonstrálva: vizsgálati népesség = (keretpopuláció-nem válaszolók). Ezen gondolatmenet folytatásaképpen tehát a fedési hiba (coverage error) alatt általában azt a különbséget értjük, ami a keretpopuláción (frame population) számolt statisztika és a célpopuláción számolt statisztika között fennáll. Adott esetben elképzelhető az is, hogy a célcsoportot egyes tagjainak esélye sincs arra, hogy részt vegyenek a kutatásban, de elképzelhető az is, hogy egyes személyek többször szerepelnek a keretben. Ha ezek a kihagyott vagy többször szereplő egyének megkülönböztető jellemzőkkel bírnak a vizsgálat szempontjából az alapsokasághoz képest, akkor torzítani fogják a statisztikákat, sőt, az összes további survey felmérés torzítani fog, amelyik ugyanezt a keret és célpopulációt használja. Ebből a gondolatmenetből következik az is, hogy a fedési hibát sok esetben úgy
14
Wright T., and Tsao, H.J., „A Frame on Frames: An Annotated Bibliography”, in T. Wright (Ed.) Statistical Methods and the Improvement of Data Quality, New York, Academic Press, 1983, pp. 25-72, pp 26.
17
konceptualizálják, mint eltérést a teljes populáció paraméterétől, amely konstans hasonló dizájnú survey felmérések esetében. 3. ábra
A keret fedése a célpopulációban15
Létezik többféle szóhasználat is az imént körüljárt fogalmakra: van, aki az „eredeti populáció” (original population) kifejezést használja a célpopulációra, valamint a „kiválasztott populáció” (selected population) kifejezést arra, akik elérhetők a felmérés számára. Ebben a terminológiában pedig a „kiválasztási torzítás” (selection bias) kifejezést használják, ha a kiválasztott populáció és az eredeti populáció eltér egymástól. 16 Groves bemutatja17 Yates (1948) és Kish (1965) tiszta tipológiáját a fedési problémákra. Az ábránkon a K reprezentálja a keretpopuláció elemeit, amelyek a listázottak a keretben. A C pedig azon célpopuláció egyik tagja, akit a survey felmérés tanulmányozni szeretne. A tökéletes illeszkedés esetén kölcsönös és kizáró megfeleltetés tapasztalható a keret és a célpopuláció között (A eset). 4. ábra
A keret és célpopuláció viszonya – „A” eset K K . . . K
-------------------------------
C C
----------------
C
A fedési hiba akkor következik be, amikor az egyezés nem létezik, vagy nem kölcsönös és kizáró. Az egyik leggyakoribb fedési hiba, amikor a célpopuláció nem minden egyes eleme jelenik meg a keretpopulációban (B eset). Így például Groves szerint az Egyesült Államokban található háztartások 7%-a nem eleme semmilyen keretpopulációnak. 15
Wayne Enanoria, PhD, MPH: Sampling www.idready.org/courses/2005/spring/survey_SamplingFrames.pdf
Frames
and
Coverage
16
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 83.
17
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 95.
18
Error,
5. ábra
A keret és célpopuláció viszonya – „B” eset K . . . K
-------------------------------
C C
----------------
C
A C esetben a keretpopuláció egyes tagjai nem tagjai a célpopulációnak. Ezek az úgynevezett „idegen esetek”, amelyek teoretikusan nem állnak a kutató érdeklődésének középpontjában. Ilyen helyzet áll elő akkor például, ha a személyes megkérdezés során használt címlista nem csak háztartások, hanem vállalatok, intézmények címeit is tartalmazza. Ha egy ilyen esetben a minta kiválasztása során ezeket az idegen elemeket nem lehet kiválasztani (gyakori helyzet, hogy nem áll elegendő információ rendelkezésre az egyes kerettagokról), akkor a keretpopuláción számolt statisztika eltérhet a célpopuláció statisztikájától. 6. ábra
A keret és célpopuláció viszonya – „C” eset K K . . . K
-------------------------------
C
----------------
C
A „D” eset azt illusztrálja, hogy a keretpopuláció több eleme van a célpopuláció egy bizonyos eleméhez csatolva. Sok esetben ez a „hiba” tervezett következménye a kutatási dizájnnak (az overcoverage szándékolt esete), így a hibának a hatása is attól függ, hogy a mintavételi dizájn illetve az elemzés kezeli-e ezt a hatást. 7. ábra
A keret és célpopuláció viszonya – „D” eset K K . . . K
-------------------------------
C
----------------
C
Az „E” esetben pedig a keretpopuláció egy eleméhez több elem is tartozik a célpopulációból. Erre a nem egyértelmű megfeleltetésre jó példa lehet egy olyan címlista, ahol egy címen akár több felnőtt is elérhető. Ha a kutatási dizájn számol ezzel a lehetőséggel, akkor lehet ezt a hibát korrigálni többféleképpen is: az iménti példánknál maradva, mindegyik felnőttnek egyforma mintába kerülési esélyt adhatunk (ha ismert előre a probléma), de
19
lehetséges az is, hogy véletlenszerűen kiválasztunk egy felnőttet a háztartáson belül és az elemzés során súlyozzuk az eredményeket a háztartásmérettel. 8. ábra
A keret és célpopuláció viszonya – „E” eset K . . . K
-------------------------------
C C
----------------
C
2.1.2 Fedési hiba modellezése A lehetséges típusok bemutatása után tekintsük át a fedési hiba modelljét leíró statisztikában. Amennyiben becsülni kívánjuk az Y lineáris statisztikát,18 a kihagyott célpopuláció elemeinek hatása a következőképpen fejezhető ki Groves19 alapján:
1. egyenlet
ahol: = = = = =
a statisztika értéke a teljes célpopuláción a célpopuláció azon tagjainak száma, akiket lefed a keretpopuláció a célpopuláció azon tagjainak száma, akiket nem fed le a keretpopuláció a célpopuláció tagjainak száma a keretpopuláció statisztikájának értéke a keretpopuláció által nem lefedettek statisztikája A fenti kifejezést megváltoztatva szeretnénk érzékeltetni a lefedetlenségi hiba
természetét, ezért mindkét oldalhoz hozzáadjuk a (
)
kifejezést, mely a következő
egyenletet eredményezi:
2. egyenlet
18
Lineáris statisztika: a survey megfigyelések és véletlen hatások súlyozott összege.
19
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 84.
20
Definíció szerint
+
1), ezért a kifejezés redukálható:
3. egyenlet
Tehát a keretpopuláció értéke = célpopuláció értéke + (a nem lefedettek aránya) x (keretpopuláció értéke – a nem lefedettek értéke), azaz a már bevezetett jelölésekkel:
4. egyenlet
Az így számított statisztikai korrekciós képlet furcsán, de lekezeli azt az extrém esetet is, amikor nincs fedetlen populáció ha a következőképpen behelyettesítjük a képletbe: = = 0 = , akkor azt kapjuk elsőként:
5. egyenlet
Tehát összességében:
6. egyenlet
Összegezve tehát a lefedési hiba két tényezőtől függ, egyrészt a keret által nem lefedett célpopuláció arányától, másrészt a fedett és nem fedett populáció statisztikájának különbségétől. Azaz, extrém helyzetben, még ha nagy is a nem lefedett populáció, de a számított statisztikában nincs különbség, akkor nem okoz a fedési hiba torzítást.
21
Másrészről, lehet, hogy csak kicsiny célpopuláció marad ki a keretpopulációból, de ha annak számított survey statisztikái markánsan különböznek a célpopulációtól, akkor nagy lesz a torzítás. Legtöbb esetben azonban a nem lefedettek aránya a populációban ismeretlen, (Nnc/N ismeretlen), és a lefedett és nem lefedett populáció statisztikái közötti különbségek sem ismertek. Ráadásul, jóllehet a nem lefedett populáció arányát (Nnc/N) mint konstans számolják minden alcsoport esetében, ennek értéke ingadozhat az egyes alcsoportokban, ahogy a lefedettség is variabilitást mutathat. A regressziós modellbeli ábrázolás során Groves összefoglalva mutatja be a fedési hiba leíró statisztikája és a paraméter-becslés közötti kapcsolatot. Tegyük fel, hogy van egy egyszerű regressziós modell, ahol:
7. egyenlet
ahol:
=
a függő változó i-dik elemre számított értéke a célpopulációban metszéspont az y tengelyen a független változó regressziós együtthatója a független változó értéke i-dik személy esetében a célpopulációban reziduális A következő ábra egy speciális esetét mutatja a fedési hibának, itt a keretpopuláció
szisztematikusan kihagyja a célpopuláció egy részét.
22
9. ábra
A minta torzulásának hatása a becsült regressziós egyenesre a minta lefedett részére, amikor minden yi
Az ábrázolt helyzet egy olyan speciális konstelláció, amelyben a célpopuláció egyes elemei nem kerülnek be a keretpopulációba. Azok az elemek maradnak ki a mintából, amelyekre igaz, hogy minden
. A célpopulációban az összes
-re számolva – tehát a
nem fedett esetekkel együtt – a regressziós egyenes meredeksége más képet mutat. A szaggatott vonallal jelzett regressziós egyenes – azaz amelyik a fedett célpopuláció becsléséből származik – kisebb meredekséggel és a becsült B együttható negatív torzításával rendelkezik. Gordberger (1981)21 kimutatta, hogy a célpopulációra jellemző
együttható és a
becsült β együttható közötti kapcsolat a következőképpen alakul:
8. egyenlet
20
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 92.
21
Goldberger, A.S., „Linear Regression After Selection,” Journal of Econometrics, Vol. 15, No. 2, 1981, pp. 357-366.
23
ahol: a lefedett populációban becsült együttható a célpopulációban található valós együttható = az endogén változó varianciája a keretpopulációban = az endogén változó varianciája a célpopulációban a regressziós modell determinációs együtthatója a célpopulációban =
= =
Amint azt láttuk, az egyszerű leíró statisztika esetében a torzítás mértéke a hiányzó esetek arányától, illetve a statisztikák eltérésétől függött. A regressziós együttható esetében a torzítás a cél és a keretpopulációban mért függő változó relatív szórásának és a célpopulációs modell illeszkedésének függvénye. Berk és Ray (1982)22 kiválasztási torzításokat bemutató modellje jól illusztrálja az esetleges kiválasztás logikáját. 10. ábra Listázó változó alapján történő kimaradás23
Az ábrán látható fedési modell egy mintavételi keret konstruálásának folyamatát mutatja be, ahol
a listázó változó, amely egy külső változó függvénye. A vonal alatti, azaz
„Z” értéknél kisebb elemek kimaradnak, nem lefedettek (a 10. ábrán a körrel jelölt elemek). 22
Berk, R.A., and Ray, S.C. „Selection Biases in Sociological Data,” Social Science Research, Vol. 11, 1982, pp. 352-398. 23
Berk, R.A., and Ray, S.C. „Selection Biases in Sociological Data,” Social Science Research, Vol. 11, 1982, pp. 352-398.
24
11. ábra A kizárt esetek okozta torzítás hatása egy regressziós becslésben. 24
A 11. ábra érzékelteti, hogy a 10. ábrán bemutatott kiválasztási folyamatnak milyen hatása van a fő változók kapcsolatán (
az endogén (függő) változó,
a regresszor). A
karikázott elemek kiesnek, mert a listázhatósági küszöb alá esnek, azaz nem kerülnek be a mintába. Attól függően, hogy ezek az elemek hova esnek a szórás képen (scatterplot), a regressziós együttható különbözni fog a teljes populáción mért együtthatótól. Groves25 alapján a 10. ábrát a következőképpen írhatjuk le:
9. egyenlet
A 11. ábrát pedig a következőképpen:
10. egyenlet
24
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 94.
25
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 93.
25
Ezek alapján a célcsoportban számolt
és keretpopulációban becsült
kapcsolata
többváltozós normalitás esetén Groves26 szerint:
11. egyenlet
ahol:
a fedett populációban becsült együttható az endogén változó varianciája a keretpopulációban az endogén változó varianciája a célpopulációban determinációs együttható, y2=a2+β2χ2 a célpopulációban a fedési egyenlet és a tényleges egyenlet hibájának, ε1 és ε2 kovarianciája A
érték és a
is pozitív és negatív értéket is felvehet, így a
.alul és felülbecslése
is lehetséges a valós B értéknek. Fontos megjegyezni, hogy a lefedő egyenlet ( ) és a valós egyenlet ( ) között eltérés korrelálatlan. 2.1.3 A fedési hiba mértékének becslése empirikus vizsgálatokban Először megnézzük a háztartások, majd pedig az egyes személyek kiválasztásakor felmerülő fedési problémákat. Abban az esetben, ha a mintavételi keret nem személyekből, hanem lakóegységekből áll, akkor a lakossági megkérdezések során sok esetben eltér a keret és a célpopuláció: a célpopuláció az összes, adott területen élő személyt takarja, a keretpopuláció pedig azokat, akik valamilyen (ismert) lakóegységben élnek. Ilyen esetekben – ahogy már a hibák tipológiájánál említettük – felettébb hasznos ismerni a lakóegységek és a benne lakó személyek együttes eloszlását. Az eloszlás meghatározásához alapvetően két alternatív eljárás kínálkozik: az úgynevezett „de jure”, amely minden személyt ahhoz a lakóegységhez köti, ahol hivatalosan él; illetve a „de facto”, amely mindegyik személyt ahhoz a lakóegységhez köti, ahol éppen az adott időben tartózkodik. Azonban ezek definiálása – mint azt majd látni fogjuk a személyek fedési hibájának tárgyalásakor – közel sem annyira egyszerű. A lakóegységek fedésének becslése ezen felül függ attól, hogy a mintavételi terv mennyire kidolgozott és természetesen attól is, hogy mennyire pontosan fedi a valóságot a lakóegységeket tartalmazó lista. 26
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 94.
26
Általánosságban elmondható, − ahogy Groves27 is megerősíti − hogy a népesség döntő többsége a lakóegységek fedése szempontjából jól kalkulálható. Ebből a szempontból azok okoznak nehézséget, akik nem szokványos, nem általános körülmények között élnek, ilyenek lehetnek például a boltjukban élő tulajdonosok, a telken álló második házban vagy vendégházban lakók, a leromlott, elhagyatott épületekben élők. Ezekben a speciális esetekben nehéz definiálni, hogy lakóegységnek tekintsük-e ezeket a mintavétel szempontjából. Különösen azokban az esetekben fontos az egy adott területen található háztartások fedése, ahol területi kerettel terveznek az adatfelvétel során (area frame survey). Ezek a területi keretek nagyon vonzóak a háztartási adatfelvételek tervezői számára, mert teoretikusan teljes lefedettséget ígérnek az adott területen élő háztartás populáció számára, ahogy azonban Groves28 is megjegyzi, ez közel sem minden esetben teljesül a gyakorlatban. Az ilyen jellegű fedési problémákat kevéssé reflektálják a szakirodalomban, ennek egyik – ha nem a legfőbb – oka az, hogy a fedési hiba vizsgálati módszerei – mint azt már említettük – igen költségesek és csak külsődleges listával vagy újabb adatfelvétellel lehetne egyáltalán megállapítani a fedési hiba mértékét. Groves29 és munkatársai 1970-ben az Egyesül Államokban a 10 évenként lebonyolításra kerülő népszámlálás (U. S. Census of Population and Housing) során más módszert használtak, mint a legtöbb területi alapú (area frame) felmérés esetében. A postahivatalok által készített és üzleti vállalkozások segítségével naprakésszé tett címlistára küldtek ki népszámlálási kérdőíveket postai úton. Többszöri megkeresés után az így kiküldött kérdőívek 83%-a érkezett vissza, így személyesen – az eljárásnak köszönhetően – csak a kimaradó háztartásokat kell számba venni. A kimaradók számossága – ha megfelelő minőségűek a nyilvántartások – jól becsülhető a ki- és bevándorlási, születési és halálozási adatok segítségével. Ezek a becslési eljárások azonban csak az egész populáció számosságát képesek jól becsülni, az egyes populációs alcsoportok méretét illetve a népességstruktúrát nem lehet megnyugtató módon ezzel a módszerrel becsülni. A probléma kezelésére az 1980-as népszámlálás után készült egy ún. Post Enumeration Survey (PES), melynek lényege, hogy jobban felkészített kérdezőbiztosok és sokkal intenzívebb keresési módszerek segítségével beazonosítják, hogy hány olyan 27
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 103.
28
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 105.
29
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 106.
27
személy található a kérdőíves felvételben, aki nincs a népszámlálásban. Erre, a népszámlálás előbb ismertetett módszeréhez képest költséges eljárásra területi alapú mintavételt használtak. A PES eredményei szerint a lakóegységek besorolását problémásnak értékelték: az 1970-es népszámlálás a lakóegységek 16,5%-át minősítette úgy lakatlannak, hogy az a számlálást követő számbavételi kérdőív idején már lakott volt. A téves számbavétel legfőbb oka az volt Groves30 szerint, hogy ezek a lakóegységek két számolási zóna határán helyezkedtek el. Kish és Hess (195831) leír egy területi alapú keret fedésére vonatkozó vizsgálatot, amelynek egyik célja az volt, hogy külső paraméterek segítségével egy általános becslő képletet dolgozzanak ki a fedési hiba nagyságának becslésére. A fedési hibát a Survey Research Center (SRC) egy adatfelvétele és az 1950-es népszámlálás alapján és az 1950-es népszámlálás alapján létrehozott lakóegység listák segítségével becsülték meg. A kutatók a következő indikátort dolgozták ki:
12. egyenlet
Ennek a hányadosnak a becslése során két erős feltevéssel éltek a szerzők: az első szerint a címmel rendelkező lakások aránya állandó (homogén) az adott területen; a másik feltevés szerint pedig a városban lévő lakóegységek növekedése állandó (homogén) az egyes tömbök között, azaz a város növekedési faktora egyformán vonatkozik mindegyik területre. A szerzők ezt a számítási eljárást inkább a relatív fedettség becslésére javasolják, mint egyféle abszolút mérőszámnak. A képletet több eltérő méretű településen tesztelték, az eredmények szerint – az előzetes elvárásaikkal ellenében – nem a legnagyobb városokban tapasztalták a legnagyobb fedési hibát, hanem a szegényebbnek mondható területeken magasabb volt a fedési hiba mértéke. Magyarországon is hasonló mértékű a lakóegységek esetében tapasztalt fedési probléma. Lakatos Miklós beszámol32 egy 1989-es vizsgálatról, amely során az Állami Népességnyilvántartó Hivatal (ÁNH) nyilvántartását evaluálták az 1990. évi népszámlálás 30
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 107.
31
Kish, L., and Hess, I., “On Noncoverage of Sample Dwellings,” Journal of the American Statistical Association, Vol. 53, June, 1958, pp. 509-524. 32
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2
28
előkészületei
során.
1989-ben
a
számlálókörzetek
kialakításakor
az
Állami
Népességnyilvántartó Hivatal (ÁNH) készítette el saját adatállományából településenként az aktuális utca-, házszám- és lakásjegyzéket. Az elkészített jegyzéket pontosították, majd számlálókörzetenként a felülvizsgált utca- és házszámjegyzéket – a bejelentett személyek legfontosabb adataival – kiosztották a számlálóbiztosoknak. A számlálóbiztosoknak a címjegyzéken jelezniük kellett, ha az ott feltüntetett adatok az összeíráskor bemondott adatokkal nem egyeztek, az eltérésekről készült egy nem reprezentatív, öt megyére, ezen belül főleg a legnagyobb eltéréseket mutató 263 számlálókörzetre kiterjedt vizsgálat. 12. ábra A címjegyzék és az összeírás szerinti lakásszám eltérései (7. ábra újraközlése)33 16000 14000 12000
Címjegyzékben nem szereplő cím
3958
10000 8000 6000
991 Össze nem írt (nem talált) lakás
5243
5274 Címeltéréssel összeírt lakás
4000 2000
4689
4889 Címeltérés nélkül összeírt lakás
0 címjegyzék
összeírás
Ezek alapján az állapítható meg, hogy a népszámlálás kevesebb lakott lakást írt össze, mint amennyit az ÁNH nyilvántartása szerinti címállomány tartalmazott, és az összeírt személyek száma is alacsonyabb volt a népesség-nyilvántartás szerinti népességszámnál. A lakások esetében közel 20 százalékos, a népességnél mintegy 15 százalékos alulszámlálás volt tapasztalható.
33
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2
29
13. ábra Az eltérések okai (7. ábra újraközlése)34 90%
6%
3%
1%
Másik számlálókörzetbe tartozik a cím Nem lakás található a címen Többször is szerepelt az adott cím Egyéb ok
Az össze nem írt lakások viszonylag jelentős része (15%) megállapíthatóan a címjegyzéktől eltérő, másik számlálókörzetbe tartozott. A címjegyzéken szereplő, de össze nem írt lakások többségéről (76%-áról) csupán annyi információval rendelkeztek a vizsgálatban, hogy az adott lakást nem találta meg a számlálóbiztos. Nagyon valószínű a szerző
szerint,
hogy
a
duplikátumként
szereplő
címek
egy részét
egy másik
számlálókörzetben megtalálták, és mint a címjegyzéken nem szereplő lakást írták össze. A címjegyzékben önálló lakásként szereplő, de össze nem írt címek 6 százaléka üres telek volt, vagy olyan középület, amelyben nincs lakás. Az összeírásra került címjegyzék-elemek valamivel több, mint 90 százalékát teszik ki a népszámlálásnál regisztrált lakásoknak, ugyanakkor a népszámlálásnál összeírt lakások csaknem egytizede egyáltalán nem szerepelt az adott számlálókörzethez készült címjegyzéken. A háztartás lakóinak számbavétele legtöbbször egyértelmű, de az esetek egy részében ennek az egyszerűnek tűnő kérdésnek az eldöntése is komoly fejtörést okozhat a kérdezőbiztos számára a terepen. Ennek a kérdésnek különösen kiemelt fontossága van, amikor a háztartási felvételek második lépéseként a válaszoló személy(ek) kiválasztása történik a háztartáson belül. Groves és a Survey Research Center a következő kérdésmátrixot dolgozta ki a háztartás tagjainak meghatározásához:
34
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2
30
1. táblázat
Kérdésmátrix a háztartás tagjainak felmérése35
Itt van a Van máshol Tagja a lehetséges csoportok például lakóhelye? lakóhelye? háztartásnak személyek, akik a mintavételi egységben tartózkodnak az adatfelvétel idején csak itt él igen nem igen cseléd, szolgáló téli/nyári szállás igen igen igen itt lakik, amíg iskola van vidéki/városi háza van az új lakása elkészülésére vár nem nem igen átmenetileg itt tartózkodik gyerekénél vagy szülőnél kisegítő betegség vagy születés miatt nem igen nem baráti vagy rokon látogató itt dolgozik vagy eszik, máshol alszik személyek, akik nincsenek otthon a kapcsolatfelvétel idején utazó ügynökök vasutasok igen nem igen általában kórházban tartózkodók nyaral vagy látogat üzlet miatt távollévő téli/nyári szállás itt lakik, amíg iskola van igen igen nem vidéki/városi háza van börtönben vagy speciális kórházban van
Az instrukció szerint ha a kérdező ezek alapján nem tudja besorolni a kérdéses személyt, akkor a háztartás tagjának kell jelölni. A fedési hiba mértéke a háztartáson belül azonban már nagy mértékben az interjúkészítő viselkedésén és a háztartásfő információ-szolgáltatási szándékán múlik. Brooks és Bailar36 (1978) megállapították, hogy a Current Popular Survey fedési hibájának nagy része nem a lakások, hanem a lakásokon belül a személyek nem lefedéséből ered. Korns 37 (1977) úgy értékelte, hogy ezek a fedési problémák a szegények illetve férfiak esetében jelennek meg többször. 35
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 109.
36
Brooks, C.A., and Bailar, B., An Error Profile: Employment as Measured by the Current Population Survey, Statistical Policy Working Paper 3, Washington, DC, Office of Federal Statistical Policy and Standards, U.S. Department of Commerce, 1978. 37
Korn, A., “Coverage Issues Raised by Comparisons Between CPS and Establishment Employment,” Proceedings of the Social Statistics Section, American Statistical Association, 1977, pp. 60-69.
31
Talán az egyik legérdekesebb kutatás a személyek fedési hibájának becslésére kifejezetten nem kvantitatív kutatási módszerrel, hanem résztvevő megfigyeléssel készült. Valentine és Valentine (1971)38 egy feketékből és spanyolajkúakból álló belvárosi közösségben éltek, mint résztvevő megfigyelők, hogy vizsgálják társadalmi, gazdasági helyzetüket, táplálkozási szokásaikat. A Census Bureau 33 háztartást vett számba abban a tömbben, ahol az antropológusok a vizsgálatot végezték, így lehetőség nyílt egy kettős-vak összehasonlításra a vizsgálatok együttes ideje és helye miatt. Jóllehet a vizsgálat nem terjedt ki nagy populációra, de mégis jól érzékelteti a fedési hiba természetét. Összességében 153 személyt és 25 háztartást számoltak a felmérésben, a legnagyobb fedési hiba a 19 évesnél idősebb férfiak esetében volt tapasztalható: 61%-ukat „elvétette” a kérdezőbiztos. A két eltérő vizsgálati módszer miatti eltérések abból adódtak például, hogy az antropológusok egy egyedül élő bérlőt nem tekintettek önálló háztartásnak (de amelyik háztartásba besorolták, az kívül esett a mintavételi körzeten), de előfordult az is, hogy egy nemrég odaköltözött családról nem tudtak semmilyen etnográfiai jellegű információval szolgálni mert nem volt még személyes kapcsolatuk. A tapasztalatok szerint az ilyen és ehhez hasonló definíciós eltérések miatt a „minden itt élő személy” kifejezés inkább a családokat, mint a háztartásokat vette számba. A módszerek okozta különbségeken túl az összeírásbeli torzítások okai között fontos említeni azt az életmódbeli körülményt, hogy a jövedelemszerzés szempontjából bizonyos szubkultúrákban előnyei vannak annak, ha nincs „hivatalosan” a háztartásban felnőtt férfi. Ezek a háztartások többféle úton szerzett jövedelemmel rendelkeztek: volt köztük nem legális jövedelem is, illetve olyan segélyek és juttatások, amelyek jövedelemhez és háztartásösszetételhez kötöttek. A torzítások másik oka, hogy nehéz volt átadni a megkérdezettnek az operacionalizált háztartás-fogalom tartalmát. A személyek fedési problémájának egy másik konkrét kezelése egy olyan kérdőívblokk kidolgozása, amely nagyon körültekintően, több kérdéssel és ismétlő/megerősítő kérdéssel próbálja meg felmérni a háztartás tagjainak számát. Tenebaum 39 (1971) a Census Employment Survey keretein belül egy olyan nyolckérdéses formuláról számol be, amelynek
38
Valentine, C.A., and Valentine, B.L., Missing Men, report to the U:S: Bureau of the Census, mimeo, 1971.
39
Tenebaum, M., “Results of the CES Coverage Question Evaluation,” Washington, DC, U.S., Bureau of the Census, memorandum, June 21, 1971.
32
segítségével körültekintően meg lehet állapítani a háztartásban élők számát. Az általuk használt kérdésblokk kérdései: 1. Mi a háztartásfő neve? 2. Mi az itt élők vagy itt tartózkodók neve? 3. Kihagytam
csecsemőt vagy kisgyermeket?
bérlőt vagy bentlakót?
valakit, aki általában itt tartózkodik, de most éppen utazik valahol, iskolában vagy kórházban van?
valaki mást, aki itt tartózkodik?
4. Általában mennyi egyéb ember tartózkodik itt? 5. Ezek közül van-e valaki most itthon? (igen, akkor számba venni, aki még nincs listázva) 6. Van-e valaki, aki most nincs itthon, de ezt a helyet otthonának tekinti? 7. Van-e valaki, aki valamilyen másik helyen tartózkodik általában? 8. Van-e valaki, aki várhatóan vissza fog térni az elkövetkező 2 hónapban? Tenebaum40 beszámol egy vizsgálatról, amely során 60 városi és 7 vidéki mintavételi körzetben több mint 6000 mintába került háztartásban vizsgálták azt, hogy hány addicionális háztartástagot hoz a nyolc új kérdés. Az első két kérdéssel összesen 19861 személyt számoltak, a következő kérdésekkel összesen még 152 személyt írtak össze, bár a szerzők megjegyzése szerint, ezen személyek közel sem mindegyike teljesítette a háztartás tagjával szemben támasztott követelményeket. Az így hozzáadott személyek közül 56 fő háztartástag, ezek a háztartástagok legtöbbször a háztartásfő rokonai, általában 30 év alattiak és inkább fehér bőrűek. A vizsgálatban kimutatták, hogy a hozzáadott kérdések eredményeképpen a lefedettség kevesebb, mint 0,3%-ot emelkedett. Ahogy a szerzők is megjegyzik, ez a kérdéscsoport önmagában nem jelent átütő megoldást a háztartáson belüli fedési problémákra. A háztartáson belüli személyek fedési hibájának mértéke a népszámlálásokkal kapcsolatos vizsgálatokban érhető tetten. A már említett PES survey alapján az 1980-as USA40
Tenebaum, M., “Results of the CES Coverage Question Evaluation,” Washington, DC, U.S., Bureau of the Census, memorandum, June 21, 1971.
33
beli népszámlálás jobb lefedettséggel dolgozott a demográfiai mutatók mentén, mint az 1970es. Passel és Robinson (1984) közlése szerint az általános becslés szerinti alulszámolást 1980ban 1%, míg 1970-ben 2,6% volt. A szerzők megjegyzik azonban, hogy ha társadalmi csoportok mentén vizsgálták ezeket az arányokat, akkor láthatóvá vált, hogy az összesített arányok elrejtik a fekete férfiak (8,8% alulszámolás) és nem fekete nők (0,0%) egészen eltérő értékeit. Jól érzékelteti a fedési hiba komplexitását az a kísérlet, amelyről Hogan41 számol be. Az Egyesült Államokban a 2000. évi népszámláláskor a fedési hiba mértékét szerették volna megbecsülni, majd a becsélést felhasználva az eredmények egyfajta korrekcióját elkészíteni. Az ismertetett módszer – a fedési hiba becslésére a mások által is használt – a kettős rendszerű becslés (dual system estimaton, DSE) eljárás. Lényege, hogy a teljes népességet érintő népszámlálással párhuzamosan egy országos szintű mintavételen alapuló vizsgálatot (Accuracy
and
Coverage
Evaluation)
is
végrehajtottak,
amelynek
eredményeit
összehasonlították a népszámlálás eredményeivel, így elvileg láthatóvá válik, hogy milyen csoportok összeírása nem volt teljes42. Hogan43 által használt sztenderd DSE esetén a teljes populáció becslése kifejezhető úgy, mint a népszámlálásban lévők száma szorozva a survey felvételben és mindkét mérésben szereplők arányával, azaz:
13. egyenlet
41
Howard Hogan: The Accuracy and Coverage Evaluation: Theory and Design, Survey Methodology, Vol. 29. 2003 december 42
Pakot Levente: A 2000. évi amerikai népszámlálás jellegzetességei és kihatása az amerikai magyarok számbavételére; online verzió, http://www.mtaki.hu/docs/papp_z_attila_amerikai_magyarok/papp_z_attila_beszedbol_vilag_nepszamlalas.pdf 43
Howard Hogan: The Accuracy and Coverage Evaluation: Theory and Design, Survey Methodology, Vol. 29. 2003 december
34
ahol: = a népszámlálásban és a felmérésben is megszámoltak száma; =a népszámlálásban helyesen számoltak száma; =a felmérésben számoltak száma; =a teljes populáció becslése. Hogan a fedési hiba becsléséhez meghatározta a korrekt összeíráshoz szükséges és elégséges feltételeket. Az első ilyen feltétel az alkalmasság, azaz hogy az adott személynek benne kell lennie a népszámlálásban. Elengedhetetlen további feltétel az, hogy a népszámlálás felvételében az 1 személy = 1 rekord elvnek kell érvényesülnie, valamint hogy a rekordnak képesnek kell lennie beazonosítani a személyt, ellenkező esetben nem lehet eldönteni, hogy szerepelt-e a felmérésben vagy a népszámlálásban. És végül fontos a földrajzi korrektség, azaz ott kell szerepelniük a rekordoknak a cenzusban, ahova valóságosan tartoznak. Mint ahogy arról Hogan cikkében beszámol, dacára a magas szintű elméleti felkészültségnek és statisztikai modellnek, az átgondolt kutatási dizájnnak és kontrollált végrehajtásnak összességében nem sikerült a 2000-es cenzus fedési hibáját a szerzőknek megbecsülni. A kudarc fő oka az volt, hogy nem tudták biztosan a több lakóhellyel rendelkező esetekben, hogy a népszámlálás napján melyik lakóhelyen voltak, így a modell nem tudott korrekt becslést adni. Az Egyesült Államokhoz képest a magyar források jóval nagyobb fedési hibáról számolnak be a népszámlálásokkal kapcsolatban. Lakatos44 már idézett tanulmányából kitűnik, hogy a népszámlálás amellett, hogy kevesebb lakott lakást írt össze, mint amennyit az ÁNH nyilvántartása szerinti címállomány tartalmazott, az összeírt személyek száma is alacsonyabb volt a népesség-nyilvántartás szerinti népességszámnál, a népesség esetében mintegy 15 százalékos alulszámlálás volt tapasztalható.
44
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2
35
14. ábra A címjegyzéken szereplő és össze is írt személyek adatainak eltérései (százalék) (8. ábra újraközlése45) a szülési (azonosító) adatok a máshol lévő lakásra vonatkozó adatok a lakcímbejentés jellege az ajtószám a földszint, emelet megjelölése a lépcsőház megjelölése az épület megjelölése a házszám, helyrajzi szám a közterület megnevezése
0%
10%
20%
30%
40%
50%
60%
Az összeírásra nem kerültek legnagyobb része (45%-a) már nem lakott azon a címen: elköltözött vagy meghalt. Több, mint egyötödük azért nem került összeírásra, mert egyáltalán nem ismerték őket azon a címen, amelyet a címjegyzék (állandó vagy ideiglenes) lakhelyükként megjelölt. Valamivel kisebb arányban (18%) szerepeltek a címjegyzéken − az adott számlálókörzetbe tévesen besorolt lakásokban − más számlálókörzetekhez tartozó személyek. Közel 4 ezer olyan személyt írtak össze a vizsgált körzetekben, akik a címjegyzéken nem szerepeltek. A népszámlálásnál összeírtak túlnyomó többsége (87%-a) szerepelt ugyan címjegyzéken, a népesség-nyilvántartás által közölt adatok azonban náluk is sok esetben pontosításra, javításra szorultak. A vizsgált számlálókörzetek címjegyzékeire felvett több mint 36 ezer személyből alig 27 ezret (74%-ot) írtak össze a számlálóbiztosok. A mintavételi keret érdekes vizsgálatáról számol be Zakariás Ildikó és Németh Renáta a Mintavételi keretek összehasonlítása Magyarországon című cikkben46. Ebben két mintavételi elrendezés realizálását hasonlítják össze, az egyik egy populációs regiszteren alapuló minta („A dizájn”), a másik pedig egy olyan minta, amiben a háztartásokat véletlen sétával választják ki, majd a háztartáson belül véletlenszerűen választják ki a válaszolót („B dizájn”). A szerzők megállapították, hogy a B dizájn nincs tekintettel a magyar háztartásstruktúrára, különösen az idős nők és a fiatal férfiak tekintetében tapasztaltak nagyobb 45
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2 46
Ildikó Zakariás, Renáta Németh2: Comparing samling frames, konferencia előadás, International Conference on Logic and Methodology, Hollandia, Amszterdami egyetem, 2004.
36
eltéréseket a minta és a mintavételi keretpopulációja között az „A dizájnnal” vett és realizált mintához képest. Megállapították továbbá, hogy a „B dizájn” alulreprezentálja a férfiakat és felülreprezentálja az időseket a kérdőív kivitelezéséből származó praktikus okokból kifolyólag, azaz a férfiakat nehezebb otthon találni és kevésbé akarnak válaszolni. Az A dizájn esetében a választási regiszterek használata sok esetben ellenjavallt a mobilitással kapcsolatos alacsony regisztrációk száma miatt. A „B mintavételi dizájn” esetében a legnagyobb ismert probléma a háztartáson belüli alulprezentáltság, azaz a háztartástagok rendelkezésre álló listája nem kielégítő, és így sok esetben a kérdezőbiztos manipulálhatja a jegyzéket. Összességében így több olyan hiba keletkezik, amelyben a tervezett és a valós minta nem választható el egymástól, és így nem lehet súlyozással korrigálni sem. A telefonos adatfelvételek esetében kiemelt figyelmet kap a háztartás összetétele. Ennek oka az adatfelvételi csatorna jellegzetességeiből adódik: sok esetben a visszautasítás még azelőtt megtörténik, hogy a háztartás tagjainak számbavételére sor kerülne. A telefonos felvételek esetén ezért a kérdezőbiztos valamilyen randomizált eljárással választja ki a válaszolót, sok esetben – ahogy Groves47 is bemutatja – a korhoz és/vagy a nemhez kötik a kiválasztást, például „Beszélhetnék a második legidősebb nővel”? Groves48 kísérletében a kérdezőbiztos a háztartás tagjainak listázása helyett csak ezt kérdezte azt interjúkészítő, hogy meg tudná mondani hogy hány 18 évnél idősebb ember él itt a háztartásban, majd utána azt, hogy „Hány ezek közül nő”? A felmérés során a két kérdéses módszer segítségével választották ki a válaszolót, majd az interjú végén a háztartás tagjait felsoroltatták a válaszolókkal. A háztartások 9%-ában találtak valamilyen eltérést a két lista között, a szerzők megjegyezték, hogy a fiatal felnőttel rendelkező háztartások relatív többször hibáztak. Megállapítható, hogy a nagyobb háztartások kisebbnek, a kisebb háztartások pedig nagyobbnak látszanak ezzel a két kérdéses módszerrel. Groves szerint az így tapasztalt különbség az „itt él” kifejezés értelmezésének különbségeire vezethetők vissza. Összességében a becslési pontatlanságokkal együtt a háztartásokban élő felnőttek létszáma nagyon hasonlít egymáshoz a kérdezés elején és a végén feltett kérdések esetében.
47
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 114.
48
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 114.
37
2.1.4 Fedési hiba kezelése a kutatási tervben A fedési hiba becslése – a torzítás természetéből adódóan – csak olyan adatokkal lehetséges, amelyek magához a felméréshez képest külsődlegesek. Speciális, a fedést ellenőrző vizsgálatok során képzettebb kérdezőbiztosokat, és/vagy részletesebben kidolgozott módszereket használnak a megfelelő keret elkészítéséhez, így ezeknek a vizsgálatoknak általában magas a költségigényük. A következőkben a fedési hiba redukálására mutatunk be három módszert, amely még a mintaalkotás illetve az adatfelvétel fázisában próbálja kezelni a fedési hibát, továbbá bemutatunk egy lehetőséget a fedési hiba adatfelvétel utáni kezelésére. 2.1.4.1 „Multiplicity/network” mintavétel és mérés A multiplicity vagy network mintavétel olyan módszer, amely során a célpopuláció elemeit konceptuálisan összekötik egymással (Sirken, 197049). Jóllehet, általában úgy hivatkoznak a módszerre, mint egyféle mintavételi eljárásra, de gyakorlatilag az eljárás a mintavételi keret egyféle speciális, fordított irányú konstruálását jelenti. Lényege, hogy a háztartások populációjának mintavétele során minden egyes személyt úgy tekintenek, mint a nukleáris család egy tagját, azaz szülőt vagy testvért. A korábban bevezetett jelölésekkel: 15. ábra
„Multiplicity” mintavétel – keret és célpopuláció viszonya -------------------------------------------------------------------------------------------------------------------------
ahol = a keretpopulációba tartozó j-dik személy az i-dik családban =a j-dik személy az i-dik családban a cél populációban. Tehát az i=1 családnak ugyan a célcsoportban öt tagja van, ezek közül ketten nincsenek a keretben, hárman pedig a keret tagjai a családi hálózatból. A keretpopulációból hiányzó két családtag tulajdonképpen úgy tud bekerülni a keretpopulációba, hogy maguk meg sem 49
Sirken, M., „Household Surveys With Multiplicity,” Journal of the American Statistical Association, March, 1970, pp. 257-266.
38
jelennek ott. A bekerülési esélyük pedig nagyban összefügg a családtagok számával a keretpopulációban: annyiszor kerülhetnek be, ahány tag a családjukból a keretben szerepel, ezért hívják ezt az eljárást „multiplicitynek” (többszörözőnek), így ezzel az eljárással növekedhetnek a fedési arányok is. Az eljárás logikáját, először, mint becslési technikát alkalmazták (Nathan50, 1976), amikor is egy populációban a születéseket akarták megbecsülni, a jelentett születéseket a keretbe került anya családjában található nők számával fordítottan arányosan súlyozták. Ezzel próbálták azt korrigálni, hogy a területi keret felülreprezentálja a nagycsaládos nőket. 2.1.4.2 Többszörös keret módszere (multiple frame method) Sok esetben szembesül a felmérést végző szakember azzal, hogy a kutatási terv készítése során nehéz a célcsoport pontos koncepcionális definíciója. Ilyen helyzetekben ajánlott a kétszeres vagy többszörös keret dizájn alkalmazása, amely során két vagy több nem teljesen adekvát keret kombinációjából magasabb fedési arány érhető el, mint bármelyikükből egyesével. A módszer alkalmas lehet a kutatási költségek optimalizálására is: a gyakorlatban a költségek nagymértékben meghatározzák a kutatási elrendezést, így a többszörös keret módszerével elképzelhető, hogy az egyik mintavételi keret teoretikusan teljes lefedettséget kínál extrém magas költségek mellett, míg a másik lehetőség az olcsó, de gyenge lefedettséget hordozó keret. Ebben az esetben egyidejűleg mintát kell venni mindkét keretből, az interjúfelvétel során azonosítani, hogy ki melyik listán került be, majd súlyozás segítségével az adott kerethez tartozónak elszámolni.
50
Nathan, G., „An Empirical Study of Response and Sampling Errors for Multiplicity Estimates with Different Counting Rules,” Journal of the American Statistical Association, Vol. 71, No. 356, December 1976, pp. 808815.
39
16. ábra Kettős keret minta dizájn51
Groves és Lepkowski52 (1985) kettős keret dizájnt alkalmaztak háztartási felmérések esetében: egyszerre alkalmazták a telefon illetve a területi alapú keretet. Ebben az esetben különösen vonzó volt a kettős keret alkalmazása, mert a telefonos adatfelvétel olcsóbb ugyan, de nem fedi le az Egyesült Államok háztartásainak 7%-át. A telefonos adatfelvétel során véletlen szám tárcsázással hívták a háztartásokat, ezzel párhuzamosan pedig folyt a személyes kérdőívinterjúk felvétele, amely során megkérdezték azt is, hogy a háztartás rendelkezik-e vezetékes telefonnal. Ezek alapján a végleges átlagra történő survey becslés így alakult:
14. egyenlet
ahol is telefon nélküli háztartások aránya a mintában telefon nélküli háztartások mintaátlaga telefonnal rendelkező és a területi keretbe (area frame) bekerült háztartások átlaga RDD frame-be került háztartások átlaga keverési paraméter Látható, hogy a teljes átlag a telefonnal rendelkező és nem rendelkező háztartások súlyozott átlaga. A többszörös keret módszer esetén a legnagyobb problémák egyike, hogy mi legyen a két keret aránya a mintában: ezt a (jelen esetben) két keret felhasználásából származó költségek és a várható hibák egyensúlya határozza meg. 51
Wayne Enanoria, PhD, MPH: Sampling www.idready.org/courses/2005/spring/survey_SamplingFrames.pdf 52
Frames
and
Coverage
Error,
Lepkowski, J.M. and Groves, R.M., “A Mean Squared Error Model for Dual Frame , Mixed Mode Survey Design,” Journal of the American Statistical Association, Vol. 81, No. 396, 1986, pp. 930-937.
40
Amellett, hogy növeli a lefedettséget, a többszörös keret módszerének alkalmazása esetén olyan adminisztratív problémák is felmerülnek, amelyek nem fordulnak elő egy sima keret alkalmazása esetén. Az egyik legfontosabb veszély Groves szerint, hogy néhány személy többszörösen megjelenik az egyes keretekben, ennek kezelésére mindenképpen fel kell készülni. A többszörös keret dizájn maga után vonja továbbá az eltérő módszerekkel történt adatfelvétel közös kezelésének kérdését is. Ezekre most nem térnénk ki részletesen, csak megemlítjük, hogy gyakorlati szempontból rengeteg nehézséget rejt a többféle forrásból származó adatok integrálása, együttes elemzése és nem utolsósorban értelmezése is. Hasonló gyakorlati probléma Groves szerint, hogy az adatgyűjtés során használt többszörös listázás miatt nagyon ritkán történik adattisztítás. Az értelmezést és becslések készítését nagyon megnehezíti, hogy a célpopuláció egyes alcsoportjait a keretek különböző kombinációi fedik le. 2.1.5 Fedési hiba – összegzésképpen Bemutattuk, hogy mennyire fontos tisztán látni a sokaságdefiníciók terén, hogy milyen típusai lehetségesek a fedési hibáknak. A háztartások fedési hibája kevésbé jellemző, csak bizonyos mintavételi eljárások során lehet hangsúlyos. Magyarországon a népességnyilvántartások alulbecsülik a lakott lakások és a személyek számát is egyes eredmények szerint53. Az minden bizonnyal elmondható, hogy sok esetben a fedési hiba láthatatlan. Ez két értelemben is találó lehet, egyrészt a hiba jellegéből fakadóan nagyon magas a látencia, külön erőfeszítések nélkül nagyon ritkán lehet érzékelni torzító hatását. Másrészt a láthatatlansága abban is megmutatkozik, hogy kevésbé vizsgált terület a módszertannal foglalkozók között, sok estben a kutatók mintegy külső, megváltozhatatlan adottságot kezelik. Ezt némiképpen erősíti az a tapasztalat is, hogy az eljárások csak nagyon kis mértékben tudnak beavatkozni a fedési hiba alakulásába. Azonban léteznek olyan mintavételi tervek, amelyek figyelembe veszik az eltérő fedéssel rendelkező populációkat.
53
Ildikó Zakariás, Renáta Németh2: Comparing samling frames, konferencia előadás, International Conference on Logic and Methodology, Hollandia, Amszterdami egyetem, 2004.
41
2.2 Teljes nem válaszolás A következőkben a kérdőív megválaszolását egészében visszautasítók okozta torzításokat, illetve a nem válaszolás jelenségét vizsgáljuk, elsőként a nem válaszolás jelenségét, jelentőségét és definíciója körüljárva. Áttekintjük a szakirodalomban fellelhető statisztikai becsléseket a hiba nagyságára és kezelésére, ezzel együtt bemutatunk néhány nem válaszolási arányszámítási módszert. A visszautasítás társadalmi okainak áttekintése után megvizsgáljuk, hogy mely társadalmi csoportok viselkednek eltérően a felmérésekben való részvétel tekintetében. A teljes nem válaszolás kezelési eljárásai közül elsőként a visszautasítók meggyőzésének torzító hatására mutatunk példát, majd azt járjuk körül, hogy milyen lehetőségek állnak rendelkezésre akkor, ha tudatosan és tervezetten kezelni szeretnénk a nem válaszolás problémáját. Többek között szót ejtünk az előzetes kapcsolatfelvétel szerepéről és a válaszolók részére adott ösztönzőkről. 2.2.1 A nem válaszolás jelensége és vizsgálata Láttuk, hogy ha a fedésben hiba keletkezik, akkor lesznek olyan válaszolók, akiknek esélyük sem lesz a mintába kerülésre, vagy éppen ellenkezőleg: lesznek olyan csoportok, akik a kívánatosnál nagyobb eséllyel kerülnek a mintavételi keretbe. A következő általunk vizsgált torzítási lehetőség a nem válaszolás, amelynek következménye már valamilyen szintű adathiány. Máder54 alapján az ilyen szintű adathiányok kétféleképpen keletkezhetnek: amikor a mintakeretből kijelölt kérdezett teljes adat-dokumentációja hiányzik, (unit nonresponse), illetve amikor csak bizonyos kérdésekre adott válaszok hiányoznak (item nonresponse), amelyet jellege és a többi mérési hibával való erős kapcsolata miatt a mérési hibák fejezetben tárgyalunk. Teljes nem válaszolásról akkor beszélünk, ha a kérdezettet nem tudták utolérni, nem volt elérhető, illetve ha nem volt hajlandó részt venni a vizsgálatban és így az egész kérdőív kitöltetlen marad. A teljes nem válaszolás gyakran demográfiai szempontból mintákba rendeződik, mint azt majd látni fogjuk, ezért ennek a torzítási lehetőségnek kedvelt kezelési módszere a gyakorlatban a súlyozás. Természetesen ez csak abban az esetben lehetséges, ha a kérdőív tervezése során szem előtt tartott változók, mint például a területi vagy a koreloszlás
54
Máder Miklós Péter: Hiányos adatbázisok statisztikai kezelése, Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar Szociológiai, Szociálpolitikai Intézet és Továbbképző Központ, Nappali tagozat, szociológia szak, Survey-statisztika szakirány konzulens: Dr. Rudas Tamás, 2001. pp 10.
42
adottak, valamint a sikeresen megtalált, és válaszolni is hajlandó emberek alkotta minta megfelelő számosságú. Talán a nem válaszolás jelensége a leginkább „szem előtt lévő” hibalehetőség az általunk tárgyalt hibák közül. Nagymértékben különbözik a fedési hibától, amelyet csak a „beavatottak” ismerhetnek. Az empirikus (társadalomtudományi) kutatási univerzumból leginkább a közvéleménykutatások, és azon belül is leginkább a pártpreferencia-vizsgálatok láthatók a szélesebb közönség számára. A szakmai közönség mellett a szélesebb közönség is minden bizonnyal emlékszik a 2002-es magyarországi országgyűlési választások eredményének előrejelzési pontatlanságára, sokak szerint kudarcára. A becslés pontatlanságának okait szinte mindegyik nagy közvélemény-kutató intézet kereste és valamilyen szinten megnevezte. Mind a Magyar Gallup Intézet, mind a TÁRKI a rossz becslés legfőbb okának55 a válaszmegtagadók és a bizonytalanok párpreferenciáinak nem kellő ismeretét nevezte meg. Az okok keresésében és az elemzésekben jól elvált, jól elkülönült egymástól a válaszmegtagadók illetve a „nem tudja” választ adók köre: a nem tudja választ adók alacsonyabb státuszúak, kevésbé iskolázottak, nagyobb valószínűséggel nyugdíjasok, mint a nyíltan válaszmegtagadók. A magyarországi nem válaszolás mértékét és alakulását jól demonstrálja Angelusz és Tardos56 elemzése, amelyben idézik Tóth István János vizsgálatát.
55
Tóth István János Előrejelzési kudarcok és kollektív tévedések: becsülhettek volna pontosan a közvélemény kutatók? Magyarország politikai évkönyve, Demokrácia Kutatások Magyar Központja Alapítvány, 2003. 56
Angelusz Róbert – Tardos Róbert: Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás, és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006
43
17. ábra A főcímen elért megkérdezettek arányának alakulása 1994 és 2003 között két közvélemény-kutató intézet (Szonda Ipsos, Tárki) felvételeinek egyesített adatbázisa alapján57
Jól látható, ahogy csökken a főcímen elértek aránya, mely már a vizsgált periódus elején sem érte el a 2/3-ot, 10 év alatt pedig közel 10 százalékpontot csökkent. AngeluszTardos saját vizsgálatának eredményei is hasonló képet festenek a hazai arányok változásáról. A DKMKA politikai tagolódás-kutatás 2003-as alapfelvételének 3000 fős mintáján a megkérdezettek 67%-a nyilvánította ki készségét újabb felkeresésre, 19% egyértelmű nemmel válaszolt, 14%-uk bizonytalannak mutatkozott. 2005 júniusában egy 2000 fős felvétel esetében már csak 53% az igenlők, 26% az elutasítók aránya, 20% pedig a bizonytalannak mutatkozók aránya. 2. táblázat
A további megkérdezésre vonatkozó kooperációs készség alakulása 1993 és 2005 között (százalékban) (Angelusz-Tardos)
kooperációs készség hajlandó újbóli válaszolásra bizonytalan nem hajlandó
1993
2003 teljes minta
2005
70 17 12
71 11 18
53 22 26
Ezek alapján egyértelmű a válaszadói kooperáció csökkenése, sőt a szerzők megállapítása szerint ennek az üteme is erősödik az elmúlt pár évben. Véleményük szerint ez 57
Forrás: A DKMKA választáskutatási projekt, Tóth István János által összeállított adatbázis másodlagos elemzése, közli Angelusz-Tardos, 2006.
44
a változás a módszer presztízsveszteségét is sugallja, azaz nemcsak a válaszolói attitűdök megváltozásáról van szó, hanem az objektív körülmények változásáról is (a későbbiekben még részletesen kitérünk a lehetséges mögöttes okokra). Az igazi gondot tehát az okozza, hogy a nem válaszolás nem véletlenszerűen oszlik meg a mintaelemek között, jellegzetes csoportok utasítják vissza, tagadják meg a válaszolást. Angelusz
és
Tardos58
szerint
a
nem
válaszolás
következményeképpen
létrejövő
mintanagyság- csökkenés önmagában problémát jelent, mert növeli a mintával kapcsolatos hibahatárt, és finomabb elemzéseket lehetetlenné tesz, de a szerzők szerint ezt a problémát különböző alminták összekapcsolásával mérsékelni lehetne. Az igazi gond, hogy a lemorzsolódás amúgy is csoport specifikus jellege ilyen esetekben még erősebb lehet. Angelusz és Tardos megállapítja, hogy növekvő nehézségek az elérhetőség és a válaszadói készség
tekintetében
nemzetközi
szinten
is
tapasztalhatók,
a
reprezentativitás
érvényesülésének egyes társadalmi rétegekben nagy akadályai vannak. A nemzetközi tapasztalatok beszámolnak olyan esetekről, amikor 50%, vagy alacsonyabb a főcímen elértek aránya, tehát a főcímek kisebbségben vannak a mintában, ez pedig súlyozási és interpretációs problémákat vet fel. A nem válaszolás jelensége nagyon sok országban probléma, így Stoop59 is arról számol be, hogy Hollandiában a kormány által finanszírozott személyes interjúk esetén a válaszadási arány 55% körül mozog. Hollandiában az alacsony válaszadási arány nemcsak akadémiai körökben kelt aggályokat, hanem már „megrendelői” és politikusi körökben is kétségeket támaszt az adatok megbízhatóságával kapcsolatban. Ahogy Stoop beszámol róla, a probléma kezelésére a holland piackutató cégek a webpaneleket favorizálják, ahol ugyan garantált a magas kitöltési arány az úgynevezett „access” paneleken60, de számos egyéb problémát felvet a nem válaszolás ilyen módon való kezelése. Az ilyen „access” paneleken tulajdonképpen azt mondhatjuk, hogy a nem válaszolás jelensége egyszerűen csak nem látszik az adatfelvétel 58
Angelusz Róbert – Tardos Róbert: Az elérhetőség és a válaszadói készség gyenge közegeti – mintalemorzsolódás, és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 59
Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; 23, Sage Publications
60
Az online panelek két fajtáját különböztethetjük meg. Az úgynevezett „access panel” fogalma kissé eltér a megszokott panel fogalomtól: az online panelek egy olyan fajtája, amelyek egy viszonylag nagyméretű – gyakran több tízezres – válaszadói körrel rendelkezik, amelynek tagjaiból különböző szempontok szerint potenciális válaszadói köröket meghatároznak, és több-kevesebb gyakorisággal kutatják a legkülönbözőbb témákban. Ebben az esetben tehát a panel szó nem egy longitudinális felmérések módszerét jelenti, hanem a válaszolók előzetes szűrésére vonatkozik, akiket ad hoc kutatásokra invitálnak.
45
során: a válaszadói halmaz rekrutálása során, a kiválasztási folyamat egy korábbi szakaszában jelentkezik a nem válaszolás szelekciós hatása. A nem válaszolás jelenségét a fedési hiba vizsgálatánál könnyebben elérhető módszerekkel lehet vizsgálni. Groves61 számba vette, hogy milyen lehetséges vizsgálati elrendezések lehetségesek ezen a kutatási területen. Elsőként említik a szerzők, hogy a mintavételi keret – mint a felvétel populációjának teljes regisztere – sok esetben tartalmaz szociodemográfiai adatokat a feltételezhető válaszolókról, amely alapján megállapíthatók a válaszolók és nem válaszolók közötti különbségek. Látnunk kell azonban, hogy ez a megközelítés – amellett, hogy alacsony költségekkel jár – összességében csak annyi információt szolgáltat, amennyi a mintavételi keretben rendelkezésre áll. Egy másik lehetséges terület a felmérésben részt vett „vonakodó” válaszadók tanulmányozása, amely elképzelés abból a feltételezésből ered, hogy a vonakodó válaszadók hasonlóak a visszautasítókhoz, így projektálhatók az általuk szerzett ismeretek a nem válaszolókra. Teoretikusan és a gyakorlatban is látni fogjuk, hogy ez az álláspont nem egészen állja meg a helyét, ez a két csoport – a vonakodó válaszolók és a nem válaszolók – nem ugyanazokat a válaszadói csoportokat illetve válaszolói attitűdöket fedik. Ezt a két vizsgálati lehetőséget használtuk az Ifjúság2008 nem válaszolóinak elemzésekor, melyek legfőbb előnye, hogy ha jól dokumentált a kutatás, akkor minden különösebb erőforrás- ráfordítás nélkül végrehajthatók ezek a vizsgálatok. Hasonló információkkal szolgálhat a panelkutatásokban a nem válaszolás illetve a lemorzsolódás vizsgálata. A panelkutatások területe – mint azt már jeleztük – meglehetősen speciális kutatási eszköz mind a kutatók, mind a válaszolók szempontjából. Csökkenti tehát a témánk szempontjából a panelkutatások magyarázóértékét, hogy a panelkutatásokban részt vevő válaszolók – még ha csak egy hullámban is vesznek részt aktívan – több szempontból eltérnek az egyszeri adatfelvételek válaszolóitól. Ennél jóval bonyolultabb és költségesebb, speciálisan a nem válaszolókat vizsgáló kutatási elrendezéseket is ismertet többek között Groves62. Ilyen adatgyűjtési lehetőség a válaszadó-kérdezőbiztos interakció részletes megfigyelése, leírása vagy a nem válaszolók megkérdezése azzal kapcsolatban, hogy miért nem akarnak részt venni, miért nem akarnak válaszolni a megkeresésre. Amellett, hogy a nem válaszolók válaszolásra késztetése ebben a 61
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 186.
62
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 188.
46
témában komoly kutatástervezést és erőforrásokat igényel63, az adatfelvétel és elemzés során komoly reprezentativitási gondok merülhetnek fel, hiszen ez a célcsoport – definíció szerint – nem kooperál a felmérésekben. Tehát még abban az esetben is, ha a nem válaszolók nagy részét sikerül legalább arról a korántsem semlegesnek mondható témáról megkérdezni, hogy miért nem tettek eleget az első felkérésnek, akkor is lesznek olyan tipikus (nem)válaszolói halmazok, amelyek ennek a „második” felkérésnek sem tesznek eleget. Szélsőséges – de egyáltalán nem elképzelhetetlen esetben – a második körös visszautasítók is mintákba rendeződnek, ezért lehetnek olyan nem válaszolók, akik véleménye teljes mértékben ismeretlen marad a survey-felmérések számára. Fontos információkkal szolgálhat magának a felvételnek, az ebben való részvételnek a megítélése, bár ebben az esetben is csak a felmérésben részt vevők válaszaiból próbálhatjuk megismerni ezt a véleményklímát. Lehetséges megközelítés a nem válaszolók vizsgálatára az is, ha a válaszolók jellemzőit összehasonlítjuk a kutatáshoz képest külsődleges adatforrással, mondjuk népszámlálással. Fontos azonban itt megjegyezni, hogy a gyakorlatban az ilyen adatokkal, adatbázisokkal való összehasonlítás további feladatok elé állítják a kutatót, mert az adatforrások gyakran jóval korábbi elméleti időpontra vonatkoznak, és könnyen előfordulhat, hogy nem a megfelelő változókat vagy nem megfelelő részletességgel, vagy nem az elvárt aggregáltsági szinten tartalmazzák. Ebben a fejezetben mindegyik vizsgálati módszerre láthatunk példát. 2.2.2 Statisztikai modellezés és nem válaszolási arányszámítás A nem válaszolás a nem-megfigyelésből adódó hiba, amely abból ered, hogy nem figyeljük meg a teljes mintát. Minden nem mintavételi hiba közül ez kapja a legtöbb figyelmet, nem utolsó sorban azért, mert viszonylag jól dokumentált, hogy hányan nem válaszolnak a mintából. A nem válaszolási rátákat sokszor azonban tévesen a survey statisztika minőségi mutatójának tartják (Groves64). A nem válaszolási arány csak egy komponense a teljes nem-válaszolási hibának, ráadásul nem is méri teljesen a nem válaszolási hibát. Maga a nem válaszolási hiba is két komponensre bontható, mint ahogy azt a fedési hiba esetén Groves bemutatta: egyrészt a nem válaszolás arányára, másrészt a válaszolók és nem válaszolók közötti különbségre, tehát:
63
De nem lehetetlen, később látunk rá példát.
64
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 134.
47
15. 15.egyenlet egyenlet
ahol válaszolóktól származó statisztika mindegyik n mintaelemtól származó statisztika a nem válaszolóktól származó statisztika Ebből az következik, hogy a nem válaszolási hiba a nem válaszolási arány és a válaszolók és nem válaszolók közötti értékek különbségének szorzata. A fejezet elején áttekintettük, hogy a mintatag hiányzó statisztikájának alapvetően több oka lehet: vagy nem tudják elérni, vagy fizikailag, mentálisan nem tud válaszolni, vagy azért, mert visszautasítja a részvételt. Ezeket is számításba véve egy sokkal részletesebb formája az előző egyenletnek Groves65 alapján:
16. egyenlet
ahol = a nem kontaktált mintaelemek statisztikája =azon mintaesetek statisztikája, akik inkompetensek voltak az interjú szempontjából =azon mintaesetek statisztikája, akik visszautasították az interjút Ez persze egy statisztikát feltételez, ahol az összes megfigyelés értéke az egyes egyedi megfigyelések súlyozott összegét adja, ilyen például a mintaátlag. Groves66 szerint a nem válaszolásból eredő hibának szintén van változékonysága, mintáról mintára ingadozik még akkor is, ha megegyező mintavételi eljárást alkalmazunk. Ezt az ingadozást olyan dolgok is magyarázzák, amelyeket nem lehet konceptualizálni, ilyen a válaszadók pillanatnyi lelki állapota vagy a pillanatnyi élethelyzete.
65
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 134.
66
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 135.
48
A nem válaszolás komponensei után vizsgáljuk meg, hogy hogyan lehet megállapítani a nem válaszolás arányát egy felmérésben. A kérdés egyszerűnek tűnik, pedig korántsem egyértelmű a megközelítés: Smith67 a nem válaszolási sztenderdek fejlődéséről írt tanulmányában kifejti, hogy már az 1960-as évek óta léteznek ugyan sztenderdek, mégis rengeteg megközelítés lehetséges. Smith vizsgálatában 18 különböző szervezet kutatásaiban próbálta összefoglalni a nem válaszolás kezelését, de azt találta, hogy nincs egységes hozzáállás ezen a területen: mindegyik szervezet máshogy és más szinten kezeli a nem válaszolást. Megvizsgálta azt is, hogy mennyire dokumentálják, illetve közlik-e egyáltalán a nem válaszolás mértékét a kutatási beszámolókban, a tudományos folyóiratokban, a kormányzati jelentésekben és újságokban. Smith ezek alapján nagyon hiányosnak találta a publikáláskor a nem válaszolás közlésének módját és típusát, sok esetben maga a közlés is elmaradt. W. Smith ezek alapján azt a következtetést vonja le, hogy professzionalizálódnia kell a felmérések módszertanának, illetve a közléseknek, és fontos lenne, hogy a különböző típusú szervezeteknél egységes nem válaszolási sztenderdeket alkalmazzanak. Groves68 szerint is nagy a módszertani és értelmezési sokszínűség a válaszadási arány számolásakor, de általában elmondható, hogy mindegyik számolási mód a sikerességnek valamelyik komponensére reflektál a teljes mintán belül. Léteznek alternatív számítási módok, léteznek ugyan ajánlások is, de nincsenek kiforrott, általánosan használt számítási formák: különböző statisztikusok, különböző célokra, különböző módszerekkel számolnak, és különböző méréseket alkalmaznak az adatgyűjtés teljességére vonatkozóan. Groves szerint – a konkrét számítási módtól függetlenül – a kutatási dizájn négy olyan aspektusát érdemes figyelembe venni, amelyek direkt hatással vannak a válaszolási arány számolására. A mintavételi keret mindegyik eleme elérhető-e a felvétel számára, például lehetnek olyan címek, amelyek nem háztartásokat takarnak. Fontos továbbá, hogy a mintába került egységek egy vagy több mintaelemet tartalmaznak, például lehetséges, hogy egy háztartás mindegyik tagjával kell kérdőívinterjút készíteni, vagy csak egy válaszolót – reprezentánst – kell kiválasztani. Harmadszor, a mintába került személyeknek egyenlő esélye van-e a kiválasztásra, vagy némely csoportokat felülreprezentálnak speciális elemzések céljából. És végül, a mintavételi terv megengedi-e a cserét a mintaelemek megfelelő szintjén: elképzelhető
67
Smith, T.: Developing Nonresponse Standards, Chapter 2,in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 68
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 135.
49
olyan dizájn, hogy a nem elérhető háztartások helyett választható hasonló vagy bizonyos paraméterek mentén egybevágó háztartás. Groves69 alapján bemutatunk néhány válaszadási arányszámolási módszert, amelyek szempontjából egy felmérésben a következő kimenetelek relevánsak: I P NC R NE NI
= = = = = =
teljes interjúk száma részleges interjúk száma nem-kontaktált, de ismert, elérhető egységek száma visszautasító elérhető egységek száma nem elérhető egységek száma egyéb nem interjúvolt egységek száma
A legegyszerűbb, számunkra érdeklődésre számot tartó válaszadási számítási mód az úgynevezett kooperációs arány, amelynek számítása:
17. egyenlet
A kooperációs arány az összes elkészült interjú és az összes elért eset arányát jelenti, leginkább akkor használható, ha az interjúkészítők meggyőzőképességét, sikerességét szeretnénk jellemezni. Egy másik mutatószám számolása esetén a nevezőhöz hozzáadjuk még a nem elérhető esetek számát, a számlálóban pedig összegezzük az elkezdett interjúk számát.
18. egyenlet
Ezzel a számítással kizártuk azokat az eseteket, akik valamilyen mentális vagy fizikai károsodásból, vagy egyéb okból (pl. nyelvtudás hiánya) kifolyólag képtelenek válaszolni a kérdőívre, így például a magyarul nem beszélőket ebben az esetben tipikusan nem számoljuk bele a válaszolási arányba. Ez a számolási mód interpretálható úgy, hogy az összes, a felmérésre rendelkezésre álló esetet milyen arányban sikerült meginterjúvolni. Fontos megjegyezni, hogy ez a becslés valamelyest alábecsüli a terepmunka sikerességét, mert nem minden nem elérhető esetre vonatkoznak a fenti korlátok, de mégis számolunk ezzel.
69
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 140.
50
A legteljesebb körben jóváhagyott válaszadási arány számítás esetében a teljes interjúk arányában vizsgáljuk az összes definiált kimenetet a nem elérhető egységek számosságán kívül:
19. egyenlet
Ebben a képletben a nevező tartalmaz minden olyan esetet, ahol az interjú elkészülhetett volna, Groves szerint ez méri a legjobban sikeresen elért személyek arányát. A terepmunkát végzők ellenőrzésére használható a már bemutatott kooperációs arány mellett az úgynevezett meggyőzési arány, amely azok aránya, akik visszautasították az interjút, de később beleegyeztek a részvételbe; illetve használható még a kapcsolat-felvételi arány, amelyet a következőképpen számol Groves:
20. egyenlet
Ez az arány azt mutatja meg, hogy mennyire sikerült mozgósítani a mintatagokat a felmérésre. A válaszadási arány szempontjából jóval összetettebb számolási problémák vetődnek fel bizonyos – a mintavétel szempontjából – speciális felmérések esetében. Az egyik ilyen eset, amikor a mintába kerülésnek nem egyforma esélye van minden mintavételi egység számára, ez akkor lehetséges például, ha a mintavétel során egy alcsoportot szeretnénk felülreprezentálni a mintában. Ebben az esetben egy sima, súlyozatlan válaszadási arány nem túl
informatív,
helyette
az
egyes
csoportok
esetében
a
különböző
kiválasztási
valószínűségekkel számoló válaszadási aránnyal érdemes számolni. Első lépésként tehát a csoportonkénti arány a következő szerint:
21. egyenlet
51
Ebben az esetben feltettük, hogy az egyes csoportok külön vizsgálata megfelel a céloknak, így külön-külön kapunk információkat ezekre. Az egész mintára vonatkozó válaszadási ráta esetében súlyozni kell a kiválasztási valószínűség reciprokával, azaz:
22. egyenlet
ahol: = a h-dik terület kiválasztási valószínűségének reciproka A másik, komplexebb számolást igénylő minta dizájn, amikor egy közbeeső kiválasztási egységhez – praktikusan háztartáshoz – változó számosságú célcsoporttag kapcsolódik. Azokban az esetekben, ahol egy háztartáshoz több válaszoló tartozik, bizonyos felmérések esetében egyes statisztikák egyéni szinten (például orvoshoz látogatás gyakorisága), másokat pedig háztartás szinten számolnak (például 5 év alatti gyerekkel rendelkező vagy 5 év alatti gyerek nélküli háztartások gyógyszerköltése). Vannak olyan válaszadási arányszámítások, amelyek képesek a háztartásszintű válaszolást és az egyéni nem válaszolást figyelembe venni. A következőképpen definiálhatunk egy háztartás szintű válaszadási rátát:
23. egyenlet
A személyi szintű válaszadási arány pedig a következő:
24. egyenlet
52
Ahol: = teljes személyi interjú = háztartások legalább egy teljes személyi interjúval = háztartások, ahol teljes a taglista, de nincs kész interjú = nem teljes személyi interjú = nem kontaktált személy = elfoglalt háztartás, nem tudtak elérni háztartástagot = visszautasító, de számba vett háztartások = a személy vagy maga, vagy valaki más a háztartásban visszautasította = egyéb, el nem készült interjú a háztartás számbavétele nélkül = egyéb, egyéni el nem készült interjú = a személyek átlagos száma a háztartásokban, amelyet a következőképpen becsülhetünk: 25. egyenlet
A mutatószámok számolása nagymértékben függ a kutatás dokumentációjától illetve dokumentáltsági fokától. Azt azonban könnyű belátni, hogy módszertani szempontból szükség van egy egységesen elfogadott és számított mutatószámra, amely lehetővé tenné a nem válaszolás jelenségének térbeli és időbeli összehasonlítását, lehetővé téve a probléma mélyebb megértését, a trendek pontos felvázolását. Az egységes mutatószám előállításának egyszerűnek és könnyen dokumentálhatónak kell lennie, hogy valóban elterjedjen és alkalmazzák. Ugyanakkor ahhoz, hogy a mutatószámunk kellőképpen érzékeny és jól összehasonlítható legyen, szükséges, hogy az arány számolása több szempontot is figyelembe vegyen. A két alapvető szempont mentén elfogadható kompromisszum az a számítási mód, amelyben a teljes interjúk arányában vizsgáljuk az összes lehetséges kimenetelt a nem elérhető egységeken kivételével. Így a nevező tartalmaz minden olyan esetet, amelyben az interjú elkészülhetett volna, azaz tartalmazza a részleges interjúk számát, a nem kontaktált egységek számát, a visszautasítók számát, valamint az egyéb okokból kifolyólag el nem készült interjúk számát (ezt a számítási módot nevezi egyébként Groves a legelterjedtebbnek). 53
Mindent egybevetve – ahogy azt a későbbiekben majd bemutatjuk – a főbb arányszámítási módszerek között egy „átlagos” adatfelvétel esetén nem mutathatók ki nagyságrendi különbségek, a számított értékek meglehetősen közel esnek egymáshoz. 2.2.3 A nem válaszolás társadalmi okai és komponensei A felmérések válaszmegtagadóival foglalkozók alapvető célja a legtöbb esetben, hogy csökkentsék a nem válaszolást70, ennek hátterében kiemelt fontosságú az a kérdés, hogy milyen faktorok okozzák a nem válaszolást. Az okok keresésének – Groves-al71 egyetértésben – azt mondhatjuk, hogy nincs kiterjedt szociológiai irodalma. A kézenfekvő elméleti koncepciók leginkább burkoltan jelennek meg, mint más területek mikro és mezoszintű elméleteinek egy-egy speciális esete. Ilyen elméletek lehetnek a foglalkozási és társas szerepek, a válaszoló társas hálózatának erőssége, vagy a magánélet védelmének erősödése, a válaszoló viszonya a felmérés témájához, vagy a költség-haszon egyensúly mérlegelése mind hatást gyakorolhatnak arra, hogy a részvételi döntés megszületik. Ezek a megközelítések leginkább az egyént, azaz az individuális szintjén mozgó hatásokat vizsgálják, amelyek befolyásolják a részvételi döntést, és nem érzékenyek a kutatási dizájnból következő befolyásoló tényezőkre. Ebben a fejezetben röviden ismertetjük, hogy milyen elméleti koncepciók mentén lehet megközelíteni a nem válaszolás jelenségét. A survey felmérések legtöbbször a társadalom egy-egy nagy intézményének támogatásával jönnek létre, ezek lehetnek kormányzati, akadémiai intézetek vagy üzleti szervezetek. A hatalmi struktúrák szempontjából lehet úgy szemlélni a survey felméréseket, mint a pillanatnyilag hatalmon lévők megfigyelése, hatalomgyakorlása a társadalmi események széles köre felett. Ahogy Marsh72 (1982) megállapította, „azok, akik egyedül birtokolnak információkat a társadalomról, sok előnyre tehetnek szert a személyek és események kontrollálásával”. Míg a survey vizsgálatok korai korszakára jellemző volt, hogy a demokratizálódási törekvéseket erősítését látták bennük (Gallup73, 1948) azzal, hogy minden hangnak lehetőséget adnak, teret 70
A helyzet korántsem ennyire egyszerű, nem biztos, hogy az első felkérést megtagadók meggyőzése javítja a felmérés nem válaszolási hibáját, mint azt látni fogjuk a következő fejezetekben. 71
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 219.
72
Marsh, C., The Survey Method: The Contribution of Surveys to Sociological Explanation, London, Allen and Unwin, 1982. 73
Gallup, G.H., A Guide to Public Opinion Polls, Princeton, Princeton University Press, 1948.
54
nyitnak, addig napjainkban egy alternatív értelmezés szerint a hatalmon lévők pozícióját erősítik ezekkel a felmérésekkel. A hatalmi viszonyok megközelítéséhez hasonló logikai séma alapján lehet vizsgálni a válaszoló centrális pozícióját. Goyder74 (1987) hipotézise szerint, minél inkább perifériális helyzetben van valaki egy társadalomban, annál kevésbé szeretne részt venni survey-ben. A legtöbb survey témái, kérdései irrelevánsak azok számára, akik saját percepciójuk szerint nem a fő sodrásban érzik magukat. Egyre fontosabb szempont a válaszolók oldaláról a magánélet védelmének teljesülése (privacy). Kanadai és egyesült államokbeli újságok szerkesztőinek írt levelekből készített tartalomelemzést Goyder (1987), és ezek alapján elmondható, hogy a magánélet védelmét gyakran említették ellenérvként a felmérésékben és cenzusokban való részvétellel szemben. A survey részvétel egyik legépszerűbb magyarázata a társas csereelmélet (social exchange theory). Először Dillman (1976)75 alkalmazta felvételek résztvevőivel kapcsolatban a társas csere elméletet, amely abból indul ki, hogy az emberek mérlegelik tetteik költségeit és előnyeit, mielőtt cselekszenek. Általában az interakciók költségeit megpróbálják az elvárt jutalom/előny alatt tartani és bíznak benne, hogy a jutalom felülmúlja a költségeiket. Ennek alapján a mintába került személy a költségek és előnyök mérlegelése után döntést hoz arról, hogy kooperáljon-e avagy sem a felmérésben. A költségek oldaláról megjelenik a válaszoló számára a kitöltési idő, a magánjellegű információk kiadása, az információk feletti kontroll elvesztése, vagy az, hogy érzékeny attitűdöket tár fel magáról, és részt vesz egy olyan interakcióban, amelyben az ellenőrzés nem a válaszolónál van. Az előnyök oldaláról megjelenik a szolgáltatott információ társadalmi hasznosságának érzete, magának a kérdezőbiztosnak nyújtott segítség, önmagában az a lehetőség, hogy valamilyen érdekes témáról fejtheti ki véleményét, szerencsés esetben pedig egy másik emberrel folytatott interakció öröme. Praktikusan az elméletből következik, hogy manapság már nem elégszenek meg a válaszadók azzal, hogy válaszaikkal hozzájárulnak a közösségi javakhoz vagy segítenek másokon, egyre inkább valami kézzelfoghatót (leginkább anyagi ösztönzést) várnak cserébe. Természetesen az elvárt anyagi ösztönzök mérete eltér szegmensenként, konkrét
74
Goyder, J., The Silent Minority: Nonrespondents in Sample Surveys, Boulder, Colorado, Westview Press, 1987. 75
Dillman, D., Gallegos, J.G., and Frey, J.H., “Reducing Refusal Rates for Telephone Interviews,“ Public Opinion Quarterly, Vol. 40, No. 1, Spring, 1976, pp. 66-78.
55
esetben a jobb anyagi helyzetben élők számára a válaszadás honorálásra felajánlott kulcstartó és toll kevésbé motiváló. Az biztos azonban, hogy a csere természete megváltozik, társas dimenzióból gazdasági dimenzióba kerül át, a minta tagjait az érdekli, hogy nekik milyen előnyük származik a részvételből és erre fel kell készülni. A telefonos kutatások esetében tapasztalható nehézségek egyik oka, hogy a társadalom egyre inkább individualizálódik, legalábbis technikai eszközök szintjén: a háztartásokhoz köthető vonalas telefont fölváltotta a mobiltelefon-használat és ez összességében a telefonos felmérésekben való részvétel csökkenését eredményezte. Ennek a csökkenésnek az oka lehet egyrészt a telefonálási kultúra átalakulása, azaz a hívások már az egyénhez kapcsolódnak és nem a háztartáshoz, egy személyhez több telefonszám is kapcsolódhat és ezek a számok sok esetben nem beazonosíthatóak, továbbá a felméréssel kapcsolatos telefonhívások nem az otthoni környezetben érik a válaszolókat, hanem meglehetősen kiszámíthatatlan viszonyok között, amelyik növelik a visszautasítás valószínűségét. Egy másik, – nemcsak a telefonos felmérésekre kiható – társadalmi változás a reklám és ügynöki kereskedelem, valamint a telemarketing elburjánzása. Erre mintegy válaszul az Egyesült Államokban a Szövetségi Kereskedelmi Bizottság (Federal Trade Commission) bevezette (2002 októberében) a „donotcall” jegyzéket. (National Do Not Call Registry), amelyre az FTC-adata szerint 60 millió ember iratkozott fel (2004-ig). A Do Not Call listát kifejezetten a telemarketinggel szemben hozták létre, de ez a telefonos survey kutatást nem korlátozza, és azokat a cégeket sem, akiknek már van üzleti kapcsolata az adott fogyasztóval. Magyarországon a helyzetet jól jellemzi a Direkt Marketing Szövetség (DMSZ) DM Analízis 2007 elnevezésű felmérése76. A kutatás a lakosság attitűdjeit vizsgálta a direkt marketing eszközökkel szemben, a lakossági megkérdezést 2006-ban a Szonda Ipsos végezte. Az elemzésben azt vizsgálták, hogy a fogyasztók milyen személyes adatát adnák meg, ha biztosak lennének abban, hogy nem élnek vissza vele. A megadott adatok között az életkor, a családi állapot és a lakcím szerepel az első három helyen, a válaszolókat az elemzés során különböző csoportokra bontották aszerint, hogy milyen személyi adatokat adnának meg. A lakosság 47 százaléka az „elzárkózók” csoportjába tartozik, közöttük inkább idősebbek, kistelepülésen élők és alacsonyabb iskolai végzettségűek szerepelnek. A „személyi igazolvány” típusúak között az alapadatot megadók szerepelnek, a 36 százalékos csoportot
76
http://www.kreativ.hu/cikk/dmsz___a_dm_eszkozok_hatekonysagat_kutatta_/index.php, 2007-12-14 10:26
56
jellemzően inkább magasabban képzett, az ESOMAR szocio-ökonómiai státuszbesorolás alapján ABC státuszú városi fiatalok alkotják. A 16 százalékos „nyitott” – vagyis minden adatot megadó – csoportban inkább fiatalok vannak, akik a múltban is rendszeresen megosztották adataikat. Végül, jó néhányan gondolják azt, hogy az alacsony válaszolási arányoknak az az oka, hogy a társadalmat „túlkutatják”. Sokan megjegyzik, hogy a népesség egyszerűen telítődik a kérdőívektől, a piackutatásoktól és a közvélemény felmérésektől. Sokan a válaszolók közül nem tudják megkülönböztetni a direkt marketing telefonhívásokat a társadalmi célú kutatásoktól. Goyder77 (1987) egy kanadai városi kutatás során kimutatta, hogy a felmérésekben való részvételi kérések számával arányosan nőtt a visszautasított felmérések száma, ez erősíti ezt a telítődési vagy irritációs hipotézist. Létezik egy olyan erősen gyakorlatias megközelítés, amely szerint amellett, hogy az élet tempója gyorsul, a válaszolók diszkrecionális ideje csökken. Az interjúzóknak emiatt kell tudniuk reagálni a mintatag azon állítására, hogy „nincs időm a részvételre”. A felmérésekben való részvétellel kapcsolatban kevés az átfogó megközelítés, az egyes magyarázó koncepciók legtöbbször csak egy-egy momentumot emelnek ki. Az egyik ilyen átfogó megközelítés Stoop78) a survey-részvétel faktorait a kutatói kontroll szempontjából három jól elkülönülő részre osztja. Ebben a megközelítésben léteznek a kutatói kontrollon kívüli faktorok, amelyeket a kutató nem tud befolyásolni, ugyanakkor mindenképpen számításba kell, hogy vegye a kutatás során. Ilyen faktor a makrogazdaság pillanatnyi állapota, amely meghatározza a kérdezőbiztosi munka gazdasági vonzerejét és társadalmi presztízsét. Befolyásolhatatlan faktor a kutatói oldalról, ha a válaszadó olyan környéken él, amely lepusztult, elhanyagolt; vagy ha a kérdezettnek túl szoros az időbeosztása, túl sok elfoglaltsága van ahhoz, hogy válaszoljon, vagy a kérdezett olyan egyéni zavaró körülményekkel bír, amelyek akadályozhatják a válaszolásban (például hangos gyerekek). Végül pedig a konkrét kutatás során gyakorlatilag független faktor a válaszadónak a kormányzati intézkedések, szervek, a felmérést végző intézmények és általában a felmérések iránti bizalma. A két szerző a kérdezőbiztosok és a válaszoló közötti interakció paramétereit úgy határozza meg, mint amelyeket a kutató indirekt módon, de befolyásolni tud. Ilyen 77
Goyder, J., The Silent Minority: Nonrespondents in Sample Surveys, Boulder, Colorado, Westview Press, 1987. 78
Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; 23, Sage Publications
57
faktorok a beköszönő szöveg tartalma, az el nem elért válaszolókhoz való visszatérés lehetősége és protokollja, az időpont egyeztetésének lehetősége, a címek újbóli kiadásának lehetősége és protokollja, valamint az egész kérdezési folyamat válaszolóra adaptálása. A harmadik csoportba tartoznak azok a faktorok, amelyekre a kutató direkt módon hatással lehet. Ide tartoznak a kérdőív paraméterei (a kérdőív témája és hossza és struktúrája), a kiválasztás menete illetve az esetleges ösztönzők alkalmazása. A kutatón kívül eső faktorokat nem lehet közvetlen módon befolyásolni, de a válaszadási arány növelése céljából mindenképpen számolni kell velük és a kutatási dizájnban reflektálni kell ezekre a faktorokra. A kutatói kontroll alatt álló faktorok kézben tartása mindenképpen szükséges (például jól definiált kapcsolat-felvételi stratégia, a nem válaszolók újbóli megkeresésének módszere, a kérdezőbiztosi felkészítés, a kérdezési folyamat monitorozása és felügyelete), De Heer szerint ezeket be kell építeni a kutatási elrendezésbe, de mindenképpen kell egy szemléletváltás is, a válaszadók igényeinek, elvárásainak jobb megértése, elfogadása és az erre való reagálás. Az egyes országok és kultúrák és a nem válaszolás közötti elméleti összefüggéseket összegezte 2002-ben P. Johnson, O’Rourke, Burris, Owens79. Nemcsak rendszerbe foglalták a nem válaszolás szempontjából fontos kulturális paramétereket, hanem hipotéziseket is megfogalmaztak ezek mentén. Összegezzük először, hogy a nem válaszolás szempontjából milyen kulturális paramétereket tartanak fontosnak. Elsőként említik az adott kultúrán belül az individualista – kollektivista orientációk meglétét, illetve azok súlyát. Fontos paramétere egy adott kultúrának a hatalmi távolság, amely a hierarchia eltérő szintjein elhelyezkedőket választja el egymástól, valamint az, hogy egy kultúra kevesebb hatalommal bíró tagjai mennyire fogadják el a hatalom egyenlőtlen elosztását, miként alkalmazkodnak a kultúra tagjai az egymás között megnyilvánuló egyenlőtlenségekhez. Fontos paraméter a nem válaszolás szempontjából, hogy az adott társadalomra a horizontális vagy inkább a vertikális kapcsolatok túlsúlya jellemző. A szerzők a kultúrákra jellemző kommunikációs normák közül vizsgálták azt, hogy a kommunikáció során mennyire jellemző a környezeti elvárásoknak való megfelelés, milyen a nonverbális viselkedés, illetve milyenek az önreprezentációs minták. A nem válaszolás szempontjából megneveztek olyan kulturálisan közvetített társadalmi folyamatokat, amelyek befolyásolhatják a nem válaszolást. Ilyen társadalmi folyamat a
79
Johnson, T. et al.: Culture and Survey Nonresponse, Chapter 4, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002.
58
kisebbségi csoportok elnyomása, diszkriminációja valamint a kisebbségi és többségi csoportok közötti ellentétek, de a társadalmi folyamatok közé sorolják a szerzők a társadalmi egyenlőtlenségek percepcióját illetve a társadalmi szolidaritás mértékét egy adott társadalomban. A szerzők a felmérések fogadtatásáról többek között az alábbiakat feltételezik: a legnagyobb együttműködési készség akkor nyilvánul meg, ha egy mérsékelt egyenlőtlenségek által szegmentált, erősen kollektivista kultúrákban a felkérés az „ingroup”tól érkezik; és minimális az együttműködési készség ugyanezeknél a kultúráknál, amikor a felkérés az „outgrouptól” érkezik. Közepes vagy még gyengébb együttműködési készség olyan hatalmi egyenlőtlenségekkel jellemezhető kultúráknál tapasztalható, ahol erős az individualizmus. 2.2.4 A felmérések számára nem látható társadalmi csoportok Elsőként tekintsük át, hogy milyen motivációk mentén vesznek részt a válaszolók a felmérésekben. A válaszolók motivációival nagyon kevés kutatás és elemzés foglalkozik, és valóban nagyon kevés ismerettel rendelkezünk ezen a téren, ahogy arra Mason, Lesser, W. Trangott80) is rámutatott. Az általuk idézett kutatás során a felmérésre válaszolók motivációit firtató nyitott kérdésekre adott válaszokat elemezték. Három tisztán kirajzolódó típust tudtak megkülönböztetni a részvétel vonatkozó magyarázatok alapján. Az altruisztikus válaszolók a felmérés hasznosságával, fontosságával, illetve a „társas kötelezettséggel” magyarázták részvételüket. Ilyen magyarázattal rendelkezett a válaszolók 31 %-a. A válaszolók 38%-a a részvételét azzal magyarázta, hogy szimpatikus számára a kérdezőbiztos. A válaszolók további harmada – 30%-a – személyes okok miatt érezte úgy, hogy válaszolnia kell a kérdezésre, a legtöbb említett személyes ok, hogy megígérték a kérdezőbiztosnak a válaszolást. A kapcsolatfelvétel lehetőségét alapvetően befolyásolja, hogy hogyan, milyen mintázatokban rendeződnek a potenciális válaszolók elérési mintázatai. A válaszolás motivációinak rövid áttekintése után vizsgáljuk meg a kapcsolatba lépési nehézségekkel kapcsolatos tapasztalatokat, azaz azokat az eseteket, amikor még kapcsolatba sem sikerül lépni a válaszolóval. Ezt nyilvánvalóan befolyásolják az egy háztartásban élők és a válaszoló otthon tartózkodási mintázatai. Többen elemezték az Egyesült Államokban az interjú
80
Robert Mason, Virginia Lesser, Michael W. Trangott: The Use of Incentives to Reduce Nonresponse in Household Surveys, in Survey nonresponse
59
elkészültének időpontját (Weber és Burt81 (1972), Weeks et al.82 (1980), Vigderhous83 (1981), Groves84 (1989)). Több elemzés adatai szerint az otthon lévők aránya 17 óra után a legmagasabb (óránként 5-10%-al magasabb, mint egyéb időpontokban).85 Természetesen az ilyen jellegű vizsgálatok esetében a mért eredményeket nagyban befolyásolja a kutatási dizájnban alkalmazott kapcsolat-felvételi protokoll. Ebből a szempontból más jellegű vizsgálati módszer, amikor maguk a megkérdezettek számolnak be arról, hogy mit csináltak az előző napon. Ilyen módszerrel készült Hill86 vizsgálata is, amely az alváson kívüli elfoglaltságot végzők indexét (index of wakeful occupancy) használja, amely az éppen otthon lévő, de nem alvók arányát mutatja. Az előző napi tevékenységek saját bevallása alapján az otthonlét kétmóduszú eloszlást mutat egy reggeli és esti csúcsponttal. A felmérésekre rendelkezésre állás lehetőségét nehezíti, hogy éppen ezek azok az időszakok, amikor a potenciális válaszolók kevésbé fogékonyak a kérdőív felkérés elfogadására, mert minden bizonnyal napi rutin-tevékenységeikkel vannak elfoglalva. A motivációkkal és az elérhetőségei mintázatokkal szemben a nem válaszolók vizsgálata esetében jóval nagyobb hangsúlyt kapnak a demográfiai változók. Talán a legkönnyebben elérhető demográfiai ismérv a válaszoló nemének hatása, amellyel kapcsolatban Lindstrom87 (1983) a Svéd Munkaerő Felmérés (Swedish Labor Force Survey) során a férfiak, különösen az egyedülálló férfiak között magasabb nem válaszolási arányt talált. Hasonlóan Lindstrom eredményeihez, T. Smith88 (1979) a válaszolók között a férfiak csökkenő arányát mutatta ki a General Social Survey (USA) esetében 1972 és 1978 között: a vizsgált időszakban 51%-ról 43%-ra csökkent a férfiak aránya ebben a körben. A férfi
81
Weber, D., and Burt, R.C., Who’s Home When, Washington, DC, U.S. Bureau of the Census, 1972.
82
Weeks, M., Jones B.L., Folsom, R.E., Jr., and Benrud, C.H., “Optimal Times to Contact Sample Households,“ Public Opinion Quarterly, Vol. 44, No. 1, Spring, 1980, pp. 101-114. 83
Vigderhous, G., “Sheduling Telephone Interviews: A Study of Seasonal Patterns,” Public Opinion Quarterly, Vol. 45, pp. 250-259. 84
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp 236.
85
A szombat és a vasárnap mintázata otthonlét szempontjából különbözött más napoktól: szombaton nagyjából ugyanannyian érhetők el este, mint délután vagy délelőtt, vasárnap reggel pedig alacsonyabb az otthon levők aránya még a hétköznapoknál is, ugyanakkor nagyon magas a 18 óra utáni időszakban. 86
Hill, D.H., “Home Production and the Residential Electric Load Curve,” Resources and Energy, Vol. 1, 1978, pp. 339-358. 87
Lindstrom, H., “Non-Response Errors in Sample Surveys,” Urval, No. 16, 1983.
88
Smith, T.W., “Nonattitudes: A Review and Evaluation.” in C.F. Turner and E. Martin (Eds.), Surveying Subjective Phenomena, New York, Russell Sage Foundation, 1984, pp. 215-255.
60
válaszolók arányának csökkenése olyan nagy mértékű volt, hogy a korábban alkalmazott valószínűségi mintavétel helyett áttértek kvótás mintavételre, ezzel rontva a minta alapján az alapsokaságra tett becslés pontosságát. Hazánkban, Angelusz és Tardos89 vizsgálatában a nem mérsékelt, nem egyértelmű hatását mutatták ki: 2003-ban nőtt a válaszoló nők aránya, a tapasztalatok szerint több gondot okoz a férfiak pótcímen való elérése. A mintába kerültek életkorát sokan kapcsolatba hozzák a nem válaszolással, de nem teljesen egybehangzóak ezek a következtetések. DeMaio90 szerint a CPS91-ben a 30 éven felüliek között nagyobb arányban vannak a válaszolást visszautasítók, mint a 30 évnél fiatalabbak között. Ezzel szemben azonban Herzog és Rodgers92 (1988) személyes interjúval készült felmérése esetében a visszautasítás korcsoportok szerint nem mutatott monoton emelkedést a korral. Mercer és Butler93 szintén tesztelte azt a hipotézist, hogy a korral együtt emelkedik a visszautasítók aránya is. Eredményei alapján az idősebbek között nem látszott semmilyen tendencia: sem a férfiak, sem a jómódúak nem voltak sokkal jobban visszautasítók. Kristiansson94 (1980) Svédországban nem talált magasabb válaszmegtagadási arányokat az idősebbek között. Ugyanakkor a telefonos kutatásokkal foglalkozó vizsgálatokban az idősebbek között nagyobb arányban találunk nem válaszolókat. Groves95 által idézett kutatásban (1978) egy városi munkások körében végzett telefonos kutatás során kifejezetten a visszautasítók
89
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 90
DeMaio, T.J., “Refusals: Who, Where, and Why?” Public Opinion Quarterly, 9 1980, pp. 223-233.
91
Current Population Survey
92
Herczog, A.R., and Rodgers, W.L. “Age and Response Rates to Interview Sample Surveys,” Journal of Gerontology: Social Sciences, Vol. 43, No. 6, 1988, pp. S200-205. 93
Mercer, J.R., and Butler, E.W., “Disengagement of the Aged Population and Response Differentials in Survey Research,” Social Forces, Vol. 46, No. 1, 1967, pp. 89-96. 94
Kristiansson, K.E., “A Non-Response Study in the Swedish Labour Force Surveys,” in Methodological Studies From the Research Institute for Statistics on Living Conditions, National Central Bureau of Statistics, Stockholm, Sweden, No. 10E, 1980. 95
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp. 204.
61
jellemzőit vizsgálták: az egész mintára számolva a visszautasítási arány 10,9% volt, az 50 évnél idősebbek között ez az arány azonban 17,2%. Brown és Bishop96 is magasabb ellenállást tapasztaltak az idősek körében egy Cincinnati körzetében végzett telefonos kutatás során. Az általuk használt elérési csoportokban azok a megközelíthetőek, akik elsőre válaszoltak, azok az ellenállók, akik először visszautasították az interjút, majd mégis beleegyeztek. 3. táblázat
A válaszolók megoszlása a kooperáció típusa szerint koronként Brown és Bishop kutatásában97
kooperáció típusa
18-39
40-59
megközelíthető ellenálló visszautasító összesen n
88% 10,2 1,8 100 4219
83,8% 13,2 3,0 100 2157
60 és felette összesen 75,8% 16,7 7,5 100 1726
84,3% 12,4 3,3 100 8102
Az eredményeik azt mutatják, hogy a 60 évnél idősebbek között kevesebben egyeznek bele az első felkérésre, valamint több közöttük az ellenálló és a visszautasító. Fontos azonban megjegyezni, hogy a telefonos és a személyes megkérdezés „aurája” meglehetősen eltér egymástól. Látnunk kell, hogy az ellentmondó következtetések nem a kor hatását tagadják a válaszmegtagadásra, hanem egyszerűen a vizsgált összefüggés mélyebb, legalább 2 dimenziós elemzést kíván meg. Hazánkban éppen fordított hatása mutatható ki az életkornak: Varga98 az 1996-os mikrocenzus mintájának negyedén futott jövedelmi felmérések eredményeit vizsgálta. Összességében 16,5%-os volt a válaszmegtagadás, a háztartás kortípusát tekintve a legalacsonyabb megtagadási arány a csak idősekből álló háztartásokat jellemezte (4,5%). Ha a háztartásban fiatal korosztályokból is kerültek ki tagok, akkor az rontotta a válaszadási hajlandóságot.
96
Brown, P.R., and Bishop, G.F., “Who Refuses and Resists in Telephone Surveys? Some New Evidence,” University of Cincinnati, 1982. 97
Brown, P.R., and Bishop, G.F., “Who Refuses and Resists in Telephone Surveys? Some New Evidence,” University of Cincinnati, 1982. 98
Varga Sára: A jövedelem-felvétel hiányzó adatainak pótlása. Statisztikai szemle. 77. 1999. 2-3. 112-130.
62
Panel kutatások tapasztalati alapján Angelusz és Tardos99 azt találták, hogy a felvételekben a 30 év alattiak lemorzsolódása, elérhetőségi problémája egyértelművé vált, ezzel együtt pedig a középkorúak és idősebbek „többlete” tapasztalható a felmérésekben. A háztartások mérete és összetétele az életkorhoz hasonló képet mutat, azaz némiképpen eltérnek egymástól a hazai és a nemzetközi tapasztalatok. Brown és Bishop100 nyolc telefonos felmérés elemzése alapján azt találták, hogy az egy személyből álló háztartások esetében sokkal gyakoribb a visszautasítás vagy az interjú megszakítása, mint a nagyobb háztartásokban élő válaszolók esetében. Hasonló eredményre jutott Kemsley101 (1976) aki két személyes adatfelvétel válaszolóinak háztartás-összetételét hasonlította a brit népszámlálás adataihoz, és úgy találta, hogy a kisebb háztartások esetében alacsonyabb a válaszadási arány. Ami a magyarországi helyzetet illeti, Varga102 elemzése szerint a háztartás taglétszámának emelkedése növeli a megtagadási valószínűséget, elsősorban a háztartás keresői számának növekedése révén. Hasonló tapasztalatokról számol be Havasi 103 is: az egyedülállók válaszadási készsége igen jó (megtagadók aránya 9,2%), majd a taglétszám növekedésével a megtagadási arányok is növekszenek: kéttagú háztartások esetében 13,3%; háromtagú háztartásoknál 21,6%, háromnál főnél nagyobb háztartások esetében pedig 20% százalék feletti a válaszmegtagadók aránya. Könnyen belátható, hogy a háztartás mérete nem önmagában befolyásolja a válaszadási hajlandóságot: az említett felvételben szereplő egyfős háztartások 78 százaléka nyugdíjas, és ahogy már az életkor hatásának vizsgálatakor láttuk, az idősebb korosztályok tagjai között Magyarországon magasabb a válaszolási kedv. A háztartásmérettől nem független attribútum a válaszoló családi állapota, ezzel kapcsolatban Angelusz és Tardos104 megjegyzése szerint a nem hagyományos családi 99
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 100
Brown, P.R., and Bishop, G.F., “Who Refuses and Resists in Telephone Surveys? Some New Evidence,” University of Cincinnati, 1982. 101
Kemsley, W.F.F., “National Food Survey. A Study of Differential Response Based on a Comparison of the 1971 Sample with the Census,” Statistical News, Nov. 1976, No. 35, pp. 35.18-35.22. 102
Varga Sára: A jövedelem-felvétel hiányzó adatainak pótlása. Statisztikai szemle. 77. 1999. 2-3. 112-130.
103
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
104
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani
63
keretek között élők hamarabb lemorzsolódnak, nehezebben elérhetők, mint a családosok. Ennek nyilvánvaló oka, hogy a nem hagyományos családi keretek között élők minden szempontból mobilabbak, kevésbé mondható stabilnak munkaerőpiaci helyzetük, baráti és partnerkapcsolataik,
lakáshelyzetük,
és
ezzel
összefüggésben
életmódjuk
is
jóval
változatosabb. Az iskolai végzettség és a válaszolási arány kapcsolata viszonylag jól dokumentált. A kérdezőbiztos nélküli technikák esetén (levélben küldött kérdőív) azt figyelték meg, hogy a magasabb végzettségűek nagyobb arányban küldik vissza a kérdőíveket (Dillmann105, 1978). Hasonló eredményt tapasztaltak telefonos és személyes kérdőívezés esetében is. O’Neil106 szerint magasabb ellenállási arányt mutatnak a kevésbé képzett válaszadók. Robins 107 (1963) egy követéses vizsgálatában a nem diplomázottak között 12%-al magasabb volt a visszautasítási arány, mint a diplomások között. Cannel et al. 108 (1987) 58%-os válaszadási arányt becsültek azok között, akiknek középiskolai végzettségük van, 96%-ot pedig azok között, akik legalább 13 évet töltöttek iskolában. Wilcox109 (1977) vizsgálatában elkülöníti egymástól a kapcsolatfelvételt és a visszautasítást, így azt a megállapítást tette, hogy az alacsonyabb iskolai végzettségűek nem válaszolása sokkal inkább a visszautasításból ered, mintsem az elérhetőség hiányából. A magyarországi eredmények ugyanakkor más képet mutatnak (Angelusz és Tardos110). A szerzőpáros a magasabb iskolai végzettségűek mérsékeltebb kooperációjáról számolt be, bár a regresszió elemzés alapján a kulturális háttér befolyása volt erősebb, ennek kiszűrése után viszont eltűntek a magasabb iskolázottságúak elérésének nehézségei. Varga111 kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 105
Dillman, D., Mail and Telephone Surveys, New York, John Wiley & Sons, 1978.
106
O’Neil, M., “Estimating the Nonresponse Bias due to Refusals in Telephone Surveys,” Public Opinion Quarterly, 1979, pp. 218-232. 107
Robins, L.N., “The Reluctant Respondent,” Public Opinion Quarterly, Vol. 27, No.2, 1963, pp. 129-156.
108
Cannel, C.F., Groves, R.M., Magilavy, L., Mathiowetz, N., Miller, P.V., An Experimental Comparison of Telephone and Personal Health Surveys, National Center Health Statistics, Technical Series 2, No. 106, 1987 109
Wilcox, J.B., “The Interaction of Refusal and Not-at-home Sources of Nonresponse Bias,” Journal of Marketing Research, Vol. XIV, 1977, pp. 592-597. 110
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 111
Varga Sára: A jövedelem-felvétel hiányzó adatainak pótlása. Statisztikai szemle. 77. 1999. 2-3. 112-130.
64
elemzésében hasonlóképpen bemutatta, hogy a megtagadási arány az iskolai végzettség szintjével párhuzamosan nő (a 8 osztálynál kevesebbet végzettek megtagadási aránya 5,2%, az egyetemi végzettségűeké 31,5% százalék). Havasi112 eredményei is a korábbi kutatások eredményeit erősítik Magyarországon, azaz az iskolai végzettség hatása egyértelmű tendenciát mutat: minél magasabb valakinek az iskolai végzettsége, annál nagyobb valószínűséggel tagadja meg a válaszadást. Havasi vizsgálatában kimutatta, hogy a településtípus és az iskolai végzettség együttes hatása is hasonlóan erős: a legfeljebb 8 általánost végzett budapestiek megtagadási aránya nagyobb, mint a legfeljebb 8 általánost végzett vidékieké. Gazdasági aktivitás szempontjából is vizsgálta a nem válaszolókat Angelusz és Tardos113. Megállapításaik szerint jellemző a panelfelvételek során az aktív keresők és a tanulók lemorzsolódása, különösen a 30 év alatti dolgozók nehezen érhetők el a kutatások számára, ugyanakkor a munkanélküliek és nyugdíjasok tartósan a mintában maradnak. A kutatás során a válaszolók kulcstartók kaptak. Varga114 elemzése szerint a gazdasági aktivitás mentén tapasztalható a legnagyobb szóródás a megtagadási arányokat tekintve. Egyrészt az aktívak és inaktívak közti különbség szembetűnő: az aktívak 22%-a, az inaktívak 9%-a válaszmegtagadó. Másrészről Varga tapasztalatai szerint a vállalkozói lét az alkalmazottak számának függvényében erőteljesen rontja a válaszadási valószínűséget: az alkalmazott nélküli vállalkozók válaszmegtagadási aránya 22%, az egy-két alkalmazottal rendelkezőké 33%, a 3-20 alkalmazottal rendelkezőké 46%, a 20 alkalmazottnál többel rendelkezők valamint a szellemi szabadfoglalkozásúak válaszmegtagadási aránya 40%. Ennek kézenfekvő oka egyrészt, hogy ezekben a szegmensekben, hogy a válaszolóknak nagyon feszes az időbeosztása. Azonban akár az is megbújhat a magasabb válaszmegtagadási arány mögött, hogy ezeknek a potenciális válaszolóknak az átlagosnál erősebb ellenérzéseik vannak a „hivatalos” megkérdezésekkel és az ilyen jellegű kérdezésekkel kapcsolatban.
112
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
113
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 114
Varga Sára: A jövedelem-felvétel hiányzó adatainak pótlása. Statisztikai szemle. 77. 1999. 2-3. 112-130.
65
Hasonló eredményeket talált Havasi115 elemzésében, amelyben egyes társadalmifoglalkozási csoportok válaszmegtagadási arányát hasonlította össze. 4. táblázat
Egyes a társadalmi-foglalkozási csoportok megtagadási aránya, 1996. mikrocenzus jövedelem-felvétele alapján116
társadalmi-foglalkozási csoport
válaszmegtagadási arány
Fizikai foglalkozású Irodai foglalkozású Egyéb felsőfokú végzettségű Önálló alkotómunkát végző felsőfokú végzettségű Vezetők
20% 21% 23% 29% 31%
Havasi kimutatta, hogy az aktív keresők számának növekedésével csökken a válaszadási
hajlandóság
a
háztartásban,
a
társadalmi-foglalkozási
csoportok
válaszmegtagadási arányai a társadalmi hierarchia mentén felfelé haladva viszonylag egyenletesen növekednek. A válaszolók társadalmi státusza és a válaszolási hajlandóság közötti összefüggést vizsgálta Angelusz és Tardos117 2003-2006 közötti panelvizsgálatok alapfelvételeinek összehasonlítása segítségével. A szerzőpáros szerint a szakirodalomban fellelhető hagyományos minta szerint az iskolázottabb, társadalmi, munkahelyi és családi kapcsolataikba beágyazottabb, politikailag involváltabb közönségrétegek megközelíthetőbbek voltak a felmérések, különösen a több hullámot magukba foglaló felvételsorozatok számára. Ez a hatás jelentős mértékben a kulturális, társadalmi és politikai erőforrások szintjeit követte, nagyjából szinkronban a státuszfokok emelkedésével. A hagyományos modellben a státusztudat csak a magasabb státuszú társadalmi rétegeket motiválja a részvételre, számukra jár elfogadható áldozattal. A kutatók eredményei ezt a modellt nem támasztották alá, és csak részben erősítették meg. A modell érvényesülése több ponton is tetten érhető (családi, életkori, lakóhelyi vagy szocializációs összefüggésben), azonban a státusztudathoz köthető elérhetőségi hatás csak részben jelenik meg, sőt ellentétes jegyeket is mutat. Vizsgálatuk alapján megállapították, 115
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
116
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
117
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006
66
hogy a magasabb lakóhelyi, iskolázottsági és szubjektív társadalmi státusz, illetve kedvezőbb családi háttér inkább csökkenti a válaszadás valószínűségét, mintsem növelné azt. További fontos megállapításuk, hogy a rendelkezésre álló időkeret rövidsége úgy befolyásolja a mintaösszetételt, hogy az aktív keresők és a tanulók között erőteljesebb a lemorzsolódás, ezzel együtt pedig az inaktívak és a munkanélküliek hozzáférhetőbbek a felmérések számára. A szerzők összehasonlítják eredményeiket az 1993-1994-es választási kutatásokkal118 és megállapítják, hogy 1993-ban és 1994-ben a fővárosi, valamint a magasabb végzettségű, illetve a kedvezőbb kulturális háttérrel rendelkező csoportok a lejjebb elhelyezkedőkhöz képest még megközelíthetőbbek voltak. Ezzel egybecsengő eredményre jutott Havasi119 is, amikor a lakás jellemzőinek hatását vizsgálta a nem válaszolásra. Azt találta, hogy a jó lakáselemek minden egyes jellemzője (például magas alapterület, telefon megléte) csökkenti a válaszadási hajlandóságot, míg a rossz lakásjellemzők (például lakáson kívüli WC, alapozás nélküli ház) minden eleme növeli a válaszadási hajlandóságot. Összegezve és komplexen kezelve ezeket a jellemzőket megállapítja, hogy a nagyon jó lakáskörülmények között élők megtagadási aránya 33,9%, ezzel szemben a nagyon rossz lakásjellemzők megtagadási aránya 9,8% százalék. A nem válaszolás területi jellemzői közül elsőként a település típusának hatását vizsgáljuk. House és Wolf120 (1978) a National Election Studies válaszadási arányát vizsgálta 1960-1972 között. A kutatás során a háztartás volt az elemzési egység és az elsődleges mintavételi egység (PSU121) is. A szerzők azt találták, hogy a nagyvárosokban található körzetek konzisztensen alacsonyabb válaszolási aránnyal rendelkeznek, mint a kisebb városokban találhatók. A nagyvárosokban tapasztalt magasabb a válaszmegtagadási arány Havasi122 szerint Magyarországon csak Budapest esetében igaz.
118
Választási Kutatások, 2000 fős adatfelvétel 1993 november, 1994 április, majd egy kisebb mintán 1994 szeptember, MTA-ELTE Kommunikációelméleti Kutatócsoport 119
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
120
House, J., and Wolf, S., “Effects of Urban Residence and Interpersonal Trust and Helping Behavior,” Journal of Personality and Social Psychology, Vol. 36, No.9, 1978, pp. 1029-1043. 121
Primary Sampling Unit
122
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
67
5. táblázat
Településtípus kategóriák válaszmegtagadási aránya, 1996. évi mikrocenzus jövedelem-felvétele alapján123 településtípus
Megtagadók aránya
kisközségek közepes községek nagyközségek vidéki városok Budapest
12% 12,5% 20,5% 14% 28,5%
A vizsgálat eredményei szerint a megyei jogú városokban tapasztalt válaszmegtagadási arányok jóval alacsonyabbak, a válaszmegtagadási arány alakulása részben követi a területi hierarchiát, azonban a nagyközségek megtagadási aránya kiugróan magas. Ennek oka Havasi szerint elsősorban a budapesti agglomerációba tartozó – jelentős részben a fővárosból induló szuburbanizációs folyamatok révén – felduzzadt falvakban élők magas válaszmegtagadási aránya. Természetesen – ahogy azt Havasi is megjegyzi – a városhatárok önmagukban nem idéznek elő különbségeket a válaszadási hajlandóságban, viszont jól tükrözik az ott élők megélhetési lehetőségeit, jövedelmi viszonyait, iskolázottságát, munkaerőpiaci helyzetét és ezek azok a faktorok, amelyek összefüggnek a válaszolási hajlandósággal. A vizsgálatok szerint nem egységes a válaszmegtagadás aránya Magyarországon területi egységeként vizsgálva. Havasi124 azt találta, hogy a Dunántúlon általában véve magasabbak a megtagadási arányok, mint Észak-Magyarországon, az Alföldön élők pedig a legkisebb arányban utasítják vissza a válaszolást. A budapesti kerületi adatok is hasonló tendenciát mutatnak: a budapesti átlag felett van így például a II. (42%), a III. (39,6%), és a XIV. (36,3%) kerület meghiúsulási aránya. Havasi megállapítása szerint a területi hierarchia és a lakáshierarchia is összekapcsolódik, azaz a budapesti jó lakásban élők visszautasítási aránya magasabb, mint a vidéki jó lakásban élőké. Gyakorlatilag egybevág ezzel Varga125 elemzése, amely szerint a válaszmegtagadók elsősorban budapestiek és Budapest vonzáskörzetében élők. Az általa tapasztalt meghiúsulási
123
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
124
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
125
Varga Sára: A jövedelem-felvétel hiányzó adatainak pótlása. Statisztikai szemle. 77. 1999. 2-3. 112-130.
68
arány Budapesten 29,5%, amely jelentősen meghaladja az országos átlagot (16,5%). Hasonló eredményekre jutott Angelusz és Tardos is126. A válaszadási hajlandóságot a kérdezetten kívül a felvételek tárgya is befolyásolja (Havasi127, Groves128). Ezt jól példázza, hogy míg az 1996-os kötelező mikrocenzushoz kapcsolódó jövedelmi felvétel esetében 16,5 százalék tagadta meg a válaszadást, addig az ugyancsak a mikrocenzushoz kapcsolt másik, utazási szokásokról szóló felvétel esetében a megtagadó háztartások aránya csak 6,8 százalék volt. A felmérés témájának hatása természetesen nem csak a hagyományosan szenzitív jövedelmi kérdések esetében mutatható ki. Miután a Kanadai Egészségfelmérésben (National Health Survey) 1990 és 2004 között 4%-ról 13%-ra emelkedett a nem válaszolók aránya, Smilie és Dahlhamer129 megvizsgálták, hogy milyen különbség van a válaszolók és a nem válaszolók között. A probléma vizsgálata során a nehezen elérhető, vagy a részvételtől először elzárkózó, majd meggyőzött személyekről feltételezték, hogy hasonlítanak azokra, akik egyáltalán nem válaszoltak. Ezeket a háztartásokat a kapcsolatfelvételek száma, a látogatások száma, illetve a kérdezőbiztosi benyomások alapján csoportokba sorolták. Összességében, ezen háztartások aránya viszonylag alacsony arányú volt, 4-6% között mozgott az egyes felvételekben, ugyanakkor a válaszolói illetve a vonakodó háztartások között vannak szignifikáns eltérések bizonyos egészségügyi kockázatok és betegségek előfordulását illetően. Stoop130 kifejezetten a nem válaszolókat vizsgáló, nagyon érdekes tanulmányában a kérdezőbiztosi beszámolók segítségével komplex élethelyzet illetve életmód alapján határozta meg a visszautasítók tipikus csoportjait illetve a visszautasítás lehetséges okait. Így például az idős, egyedül élő hölgyek gyakori visszautasítók lehetnek azért, mer félnek attól, hogy valakit – azaz a kérdezőbiztost – beengedjenek a lakásukba. A következő tipikus visszautasító csoportot azok a háztartások alkotják, ahol két kereső lakik egy vagy több kisgyerekkel. Esetükben minden bizonnyal az időhiány a fő magyarázó oka a visszautasításnak. 126
Angelusz Róbert – Tardos Róbert: Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás, és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 127
Havasi Éva: Válaszmegtagadó háztartások
128
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York
129
Cathrine M. Smilie – James M. Dahlhamer (2005): Evaluating High Effort Measures for Studying Nonresponse Bias, Symposium 2005 : Methodological Challenges for Future Information needs 130
Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; 23, Sage Publications
69
Hasonlóképpen időhiánnyal magyarázható gazdag, jómódú családok és háztartások nem válaszolása, ők azok, akik „túl elfoglaltak” a válaszoláshoz és ezt az attitűdöt a projektben alkalmazott ösztönzők sem tudják kikezdeni. Az alsó-osztálybeli csoportok közül a nem válaszolás okaként legtöbbször az fordul elő, hogy nem bíznak a kormányzati intézményekben, és közülük többen érzik egyszerűen zaklatásnak a felkérést. Külön csoportként jelent meg a kérdezőbiztosi beszámolók alapján a magasan képzett felső osztálybeli visszautasítók csoportja, akikkel egészen más jellegű problémák vannak. Ha önkéntesen nem kooperálnak, akkor a kérdezőbiztosok szerint nincsen hatása a vizsgálatban használt ösztönzőnek: határozottan, de barátságosan visszautasítják a részvételt és nem érzik szükségét annak, hogy mentegetőzzenek. A hazai eredményeket nemzetközi összehasonlításban vizsgálva érdemes megemlíteni Havasi Éva tanulmányát, aki a magyar mikrocenzus visszautasítási adatait hasonlítja össze az 1995-ös nagy-britanniai mikrocenzus vonatkozó, K. Foster által elemzett visszautasítási adataival. A brit és a magyar válaszmegtagadó háztartások jellemzőit a következőképpen foglalta össze: 6. táblázat
Magas nem válaszolási arányokat képviselő háztartástípusok (1995) (az adott ország átlagos megtagadását 1-nek véve)131 háztartástípus
Nagy-Britannia
Magyarország
3 vagy több keresős háztartás Házaspár eltartott gyerek nélkül A háztartásfő etnikai kisebbséghez tartozik 3 vagy több felnőtt tagból álló háztartás A háztartásfő vállalkozó A háztartásfő alapfokú végzettségű
1,52 1,49 1,45 1,33 1,18 1,05
1,48 1,55 1,13 2,09 0,70
Foster adatait a magyar adatokkal összehasonlítva hasonlóságokat is, de szembetűnő különbségeket is találunk. A magas keresőszámú családok esetén mindkét országban magas a megtagadók aránya, hasonlóan a gyerek nélküli házaspárokhoz. Havasi szerint a nemzetközi tapasztalat azt mutatja, hogy azok a háztartások, ahol ellátásra szoruló kisgyerek van a legjobb válaszadói csoportba tartoznak, és ez Magyarországon is így van. Az egyszemélyes háztartások a nyugat-európai országokban kifejezetten rossz válaszadói hajlandósággal rendelkező csoportnak számítanak. Magyarországon ez éppen fordítva van, mivel nálunk az egyszemélyes háztartások döntő része egyedülálló nyugdíjast jelent, ellentétben Nyugat131
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
70
Európával, ahol a családalapítás előtt álló fiatalok nagy számban önálló lakással rendelkeznek. Legfontosabb különbség, hogy míg a nyugat-európai országokban az alacsony iskolázottság átlagot meghaladó válaszmegtagadást eredményez, addig Magyarországon éppen ennek a fordítottja igaz. Hasonlóképpen alakul a háztartásfő társadalmi-foglalkozási csoportja alapján kirajzolódó mintázat is: a vállalkozók megtagadási aránya Angliában alacsony, Magyarországon magas. A nemzetközi összehasonlítások a hazai gyakorlatban nyilvánvalónak tekintett megtagadási sajátosságokat új megvilágításba helyezik: a magyarországi tapasztalatok alapján nem egyértelműen működött az a nemzetközi szakirodalomban evidenciaként kezelt feltételezés, hogy a „társadalom szélső pólusain” illetve a társadalom perifériáján élők megtagadási hajlandósága nagyobb, mint az „átlagpolgáré”. Hasonló eredményeket mutat be Horváth Gergely a háztartási költségvetési felvételek kapcsán. Ezek a felvételek Nyugat-Európában és a 2004-ben az Európai Unióhoz csatlakozó tíz országban is a nagy nem válaszolási arányú vizsgálatok közé tartoznak, bár az egyes országok között jelentős eltéréseket találhatunk.132 7. táblázat Háztartási költségvetés-felvételek válaszadási aránya és az alulreprezentált csoportok az Európai Unió 2004-ben csatlakozott országaiban.133 Ország Ciprus
Válaszadási arány (%) 93,9
Csehország
Nincs adat
Észtország
54
Magyarország
57,6 (1998)
Lettország
76
Litvánia
77
Málta
38
Lengyelország
60,1
Alulreprezentált csoportok Nincs ilyen csoport Nincs adat A leggazdagabb háztartások Nagyon fiatalokból és nagyon idősekből álló háztartások A leggazdagabb háztartások Városi háztartások Vállalkozók háztartásai Vállalkozók háztartásai Leggazdagabbak háztartásai Fiatal egyedülállók háztartásai, a leggazdagabbak és a legszegényebbek Nincs adat Nincs adat
Szlovákia
Nincs adat
A legmagasabb és a legalacsonyabb jövedelmű háztartások
Szlovénia
74% (2000)
Nincs adat
132
Horváth Gergely: A nem-válaszolás jelensége a KSH Háztartási Költségvetési Felvételében szakdolgozat, Eötvös Loránd Tudományegyetem Társadalomtudományi Kar Nappali tagozat, szociológia szak, surveystatisztika szakirány, konzulens: Rudas Tamás, 2004, Március 133
Forrás: Horváth Gergely: A nem válaszolás jelensége a KSH felvételekben
71
A legtöbb országban a viszonylag magas nem-válaszolási arány mellé hasonló reprezentativitási problémák is kapcsolódnak, a leggazdagabbak, a fiatalok, a vállalkozók és a nagyon szegények a legnehezebben elérhető csoportok. De Leeuw és de Heer egy nemzetközi projekt keretein belül különböző,felmérések adatait gyűjtötték össze abból a célból, hogy longitudinális, nemzetközi összehasonlítható adatokkal rendelkezzenek a nem válaszolás jelenségének vizsgálatához134. Külön figyelmet fordítottak a „válaszolás” és „nem válaszolás” definíciójára, a projekt keretein belül az adatgyűjtő kérdőíveket állami adatgyűjtő szerveknek küldték ki olyan vizsgálatokra vonatkozóan, amelyekben rendszeres adatfelvétel folyik. Összesen tíz témában 16 ország vett részt a vizsgálatban
135
, az elemzés során pedig három függő változót használtak a kutatók: a
válaszok részaránya, elutasítások részaránya, és azok aránya, akikkel nem sikerült kapcsolatot teremteni. Összegezve a szerzők megállapításait, annyi elmondható, hogy a válaszolási arány eltér a vizsgált országokban és mindenhol alapvetően csökken a válaszadók aránya az évek múlásával, ám a trend meredeksége országonként eltérő. Ugyanakkor megállapítható, hogy nincs különbség az országok között az el nem értek arányának alakulásában, tehát a válaszadási trendek közötti különbséget a visszautasítási arányok közötti különbség okozza. A visszautasítási arány különbségei kapcsolatban voltak az ország gazdasági mutatóival, nagyobb munkanélküliségi arány alacsonyabb visszautasítási aránnyal járt a munkaerőpiaccal kapcsolatos vizsgálatban (Labour Force Survey) és a magasabb inflációs rátával rendelkező országokban magasabb a visszautasítási arány. Az el nem értek aránya kapcsolatban van a háztartás méretével és a háztartásban élő gyerekek számával, ami a szerzők szerint az egyes országok közötti otthonlét-béli minták különbségére utal. Azokban az országokban, ahol megengedőbbek a szabályok a mintavétellel és a válaszolók kiválasztásával kapcsolatban, szintén alacsonyabb a nem elértek aránya, mint a szigorúbb kritériumokkal dolgozó országokban.
134
de Leeuw E. and de Heer W.: Trends in Household Survey Nonresponse: A Longitudinal and International Comparison, Chapter 3, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 135
Ausztrália, Belgium, Kanada, Németország, Dánia, Finnország, Franciaország, Magyarország, Olaszország, Hollandia, Lengyelország, Svédország, Szlovénia, Spanyolország, Egyesült Királyság és Egyesült Államok
72
2.2.5 A visszautasítók ösztönzése és ennek hatásai Marquits136 (1979) egy tanulmányában bizonyítékokat vonultatott fel amellett, hogy az USÁ-ban csökkentek a válaszadási arányok a háztartási felmérések esetében. Az egyik általa említett vizsgálat a National Health Interview Survey volt, amely egy havonta felvett keresztmetszeti vizsgálat, ennek adatai szerint a kezdeti válaszadási arány gyakorlatilag nem változott: 1975-ben 97% volt és 1985-ig is 95-97% között mozgott. Azonban Marquits remek meglátása szerint, a teljes mintára és az összes nem válaszolási eseményre mért arány elrejti az egyes nem válaszolói csoportok közötti különbségeket. Valójában a visszautasítók aránya emelkedik, és minden egyéb nem válaszoló kategória aránya csökken: miközben 1960-ban 2,5 százalék a visszautasítók aránya, az 1980-as évek közepére 6 százalék ugyanez a szám. Groves hozzáteszi, hogy ez a változás két szempontból is kedvezőtlen a felmérések szempontjából: egyrészt a költségeket, másrészt a torzítás mértékét is növeli. Jól látjuk, hogy a nem válaszolás jelenségének komponensei nem egyformán viselkednek. Vizsgáljuk meg Groves alapján egy szimuláción, hogy vajon ez az eltérés milyen hatással lehet a válaszadási hibára. Ezzel a szimulációval azonban egy még izgalmasabb kérdést is körüljárhatunk, nevezetesen pedig azt, hogy érdemes-e emelni a válaszadási rátát úgy, hogy minden nem elért mintatagot meginterjúvolunk. A következő esetet képzeljük el: a kezdeti 70 százalék válaszolóból 10% volt orvosnál az elmúlt 6 hónapban, a nem elértek közül 5%, az el nem készült interjúk esetében 40%, a visszautasítók között pedig 30%. A következő táblázatban bemutatjuk, hogy hogyan változik a nem válaszolási hiba nagysága, ha az elkészült interjúk alapján próbáljuk megbecsülni a teljes mintában az orvoshoz járás gyakoriságát úgy, hogy közben az először el nem érteket próbáljuk újra interjúzni.
136
Marquis, K., “Survey Response Rates: Some Trends, Causes, and Correlates,” paper presented at the 2 nd Biennial Health Survey Methods Research Conference, Washington, DC, National Center for Health Services Research, 1979.
73
8. táblázat
Kizárólag a nem kontaktálási arány csökkentésével növekedő válaszadási arány hatása a teljes nem válaszolási hibára137
1
2
3
4
5
6
7
válaszadók aránya
nem elértek aránya
el nem készült interjúk aránya
visszautasítók aránya
becslés a válaszolók alapján
arány a teljes mintában
nem válaszolási hiba (5)-(6)
70%
20%
5%
5%
0,10000
0,115
-0,01500
75%
15%
5%
5%
0,09667
0,115
-0,01833
80%
10%
5%
5%
0,09375
0,115
-0,02125
85%
5%
5%
5%
0,09118
0,115
-0,02382
90%
0%
5%
5%
0,08889
0,115
-0,02611
Ha a survey megállna a kezdeti 70%-os válaszolási arány mellett, akkor a becslés 10% lenne, a teljes mintaérték és a válaszolókból becsült mintaérték közötti eltérés pedig -0,015. Ha a válaszolási arányt a nem elértek bevonásával 80%-ig emeljük, akkor a hiba -0,018 lesz és így tovább. Ez a modellezés jól példázza, hogy a magasabb válaszolási arány akár magasabb nem válaszolási hibához is vezethet akkor, ha a kezdeti nem válaszolók, akiket sikerült elérni vagy meggyőzni, atipikusak a kezdeti nem válaszolók együtteséhez képest. Egyszerűen fogalmazva: a visszautasítással nem „törődve” csak a nem kontaktáltak arányának csökkentésével elért stabil válaszadási arány növelésével, az egész populációra nézve atipikus válaszolókat kapunk miközben sokkal tipikusabb visszautasítókat vesztünk. Stoop138 a vonakodó, azaz a meggyőzhető visszautasítókat vizsgálta saját kutatásában. Arra a megállapításra jutott, hogy a nagyvárosok lakói, a fiatalok, a magasan képzettek és a magas jövedelemmel rendelkezők sokkal inkább vonakodnak részt venni a felmérésekben, a férfiak és az egyedülállók pedig – ha nem is olyan mértékben, mint az előző csoport, de az átlagosnál nehezebben megközelíthetők. A kapcsolatfelvétel első fázisában az egyedülálló férfiak kevésbé vonakodtak a kooperációtól, ennek ellenére alulreprezentáltak a mintában. Ennek az okát Stoop abban találta meg, hogy az első megkeresés visszautasítói között ugyan dominánsak a nők, de későbbi megkereséskor nagyobb arányban hajlanak a válaszolásra. Az általa „keménynek” nevezett visszautasítók, akik minden erőfeszítés dacára sem válaszolnak a kérdőívre, nagyobb arányban kerülnek ki férfiak közül. Praktikusan ebből következik, hogy egy a visszautasítók meggyőzését célzó stratégia sokkal eredményesebb lehet egy női 137
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp. 148. 4.1. táblázat alapján újraszámolva. 138
Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; 23, Sage Publications
74
válaszoló esetében, mint egy férfi esetében. A meggyőzhető válaszolók annyiban nagyon hasonlók a visszautasítókhoz és a nehezen elérhetőkhöz, hogy sokkal nagyobb arányban élnek nagyvárosokban, mint a könnyen válaszolók, ugyanakkor a tényleges visszautasítók csoportja nem különbözik szignifikánsan semmilyen háttérváltozó mentén az első megkeresésre válaszolóktól, illetve a meggyőzhető válaszolóktól. Néhány apró különbség mellett – a sportaktivitás kisebb, klasszikus kultúra iránti elkötelezettség nagyobb a nem válaszolók között – az igazi és egyetlen nagy különbséget a számítógép-tulajdonlásban találták. A tényleges visszautasítók háztartásaiban kisebb arányban volt személyi számítógép és valamelyest különböztek az internet és email-használati szokásaikban is. Összességében Stoop szerint a tényleges visszautasítók nem különböznek alapvető demográfiájukban a többi válaszadói csoporttól, azaz ezek között a csoportok között kulturális különbségről van szó, de ezek alapján feltételezhetjük – összhangban egyéb, általa idézett vizsgálatokkal – hogy a meggyőzhető nem válaszolók nem egyeznek meg teljes mértékben a visszautasítókkal. Mason, Lesser, W. Traugott139 az Oregon államra kiterjedő postai választás140 adatait elemezve összességében megállapították, hogy a válaszadási arány javítása érdekében tett erőfeszítések – az elutasítók meggyőzésével – növelték a hiányzó értékek gyakoriságát az egyes itemeknél. A kutatásban véletlen szám-tárcsázással (RDD) választották ki a háztartásokat, majd a háztartáson belül véletlenszerűen választották ki az egyes válaszolókat, összesen 1483 interjú készült el. Ahol nem találtak otthon senkit, addig telefonáltak, amíg el nem értek valakit a háztartásból, az elutasítókat pedig követő (follow-up) hívások során próbálták meggyőzni a válaszadásról. Összesen 377 személyt, az elutasítók 49%-át sikerült meggyőzni a részvételről, ez a minta 25,4%-át jelentette. A kutatás során a megemelkedett költségeknek két oka volt: egyrészt növelni kellett a kapcsolatfelvételek számát az interjúk kitöltéshez, valamint magasabb költséggel járt az elutasítók meggyőzésében jártas, tapasztalt kérdezőbiztosi csapat. A meggyőzött visszautasítóknál átlagosan 7,56 hívás kellett a kitöltött kérdőívhez, míg a válaszolóknál átlagosan 4 hívásra volt szükség. Az elkészült interjúnkénti marginális költség a meggyőzött elutasítók esetében 36,58 USD, az eleve együttműködő válaszolók esetében ez 22,69 USD volt, azaz az interjúnkénti fajlagos költségekben több, mint másfélszeres különbség tapasztalható. Összességében a meggyőzött elutasítók a kutatás 139
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 140
1996 január 30-án, a lemondott Bob Packwood helyére a demokrata Ron Wyden szoros eredmény mellett legyőzte a republikánus Gordon Smith-t.
75
költségének 35%-át emésztették föl, míg az adatoknak csupán 25%-ával járultak hozzá a teljes adatkészlethez. A konkrét költségeken kívül még az adatfelvételi időszakot is ki kellett tolni, hogy újra kapcsolatba tudjanak lépni az elutasítókkal. Ezzel kapcsolatban a szerzők felvetnek egy minden kutatási dizájn esetében mérlegelendő szempontot, mégpedig azt, hogy a nem válaszolók csökkentésére fordított erőforrások mennyire hatékonyak, van-e valamilyen más módszer a becslések pontosságának növelésére? Így például lehet nagyobb mintán indítani az adatfelvételt, a kérdőív előtesztek lehetnek alaposabbak, szerteágazóbbak, szemben azzal az idővel és költséggel, hogy a visszautasításokat és a „nem tudom” válaszokat csökkentsék a kérdezőbiztosok kiválasztásával és felkészítésével. 2.2.6 A visszautasítás kezelése a kutatási tervben A továbbiakban tekintsük át, hogy a gyakorlatban milyen lehetőségek léteznek a nem válaszolás hatásának csökkentésére. Fontos megjegyezni, hogy bármelyik eljárás gyakorlati alkalmazása komoly költségelem lehet a felmérés teljes költségeihez képest, valamint adott esetben logisztikai és ütemezésbeli következményei vannak. Kiegészítve Fischert141 a következő módszerek használatosak: az előzetes kapcsolatfelvétel (előzetes felkeresés levélben, időpont kérés, értesítés hagyása); a válaszolók részére ösztönzők biztosítása; a kérdezőbiztosi meggyőzés erősítése; a cég imázsa; a nem válaszolók helyett pótcímek biztosítása és a súlyozás. A cég, azaz a megbízó illetve az adatfelvételt végző intézmények és cégek imázsának hatásáról nem rendelkezünk ismertethető kutatási eredménnyel. 2.2.6.1 Előzetes kapcsolatfelvétel Elsőként vizsgáljuk meg az előzetes kapcsolatfelvétel hatását. Groves142 szerint két egymásnak ellentmondó hipotézis létezik arra vonatkozóan, hogy a válaszoló kontaktálása segít vagy árt a kooperáció tekintetében. Az első vélekedés szerint az elkövetkező látogatásra való figyelmeztetés megengedi, hogy a háztartás és a válaszoló felkészüljön a látogatásra, és csökkentse a felvétel kommunikációs terheit, tehát kedvezően befolyásolja a kooperációs hajlandóságot. A másik megközelítés szerint az előzetes kapcsolatfelvétel teret hagy arra, hogy a háztartás tagjai már előzetesen racionalizálják visszautasításuk okait anélkül, hogy a
141
Fischer György: Hihetünk-e a közvélemény-kutatásoknak? Bagolyvár Könyvkiadó, Budapest, 2001
142
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp. 208.
76
kérdezőbiztostól bármilyen egyéb érvet, ellentétes érvelést hallanának, azaz inkább árt, mint használ a válaszadási hajlandóság szempontjából. A legtöbb dokumentált kutatás az előzetes levélírással kapcsolatos, amelyben leírják a kutatás célját, és hogy kérdezőbiztos fog érkezni. A szándék szerint a levélben található intézmény presztízsén keresztül legitimálják a felmérést, eloszlatják a félelmet és felhívják a figyelmet a válaszolás értékére és társadalmi fontosságára. Talán a legfontosabb vizsgálandó kérdés a felkérő levelekkel kapcsolatban a levélolvasási gyakoriság. Groves143 által idézett kutatásban azt találták, hogy a kiküldött felkérő levélre a címzettek 44%-a nem is emlékezett, az összes válaszoló 33%-a részletesen, 16% pedig átfutotta azt, azaz a levelet olvasók aránya 49% volt. Ugyanakkor nem minden címzett bizonyult elérhetőnek: a szerzők becslése szerint a levelek 73%-át megkapták a címzettek. A levelet biztosan megkapók körében a levelet elolvasók aránya 58% volt. Dillman, Gallegos, and Frey144 egy telefonos kutatásban háromféle tartalmú felkérő levéllel kísérletezett. A legrövidebb verzióban megemlítette a kutatást és felhívta a figyelmet a jövőbeli felkeresésre. A második verzióban ezen felül még további információkat szolgáltatott a felmérésről, leírta a mintavételi eljárását, és felkérte a személyeket, hogy válaszoljanak a kérdésekre. A harmadik, leghosszabb verzióban pedig az előző két levél tartalma mellett hangsúlyozta a válaszadás társadalmi hasznosságát, az anonimitást, röviden megemlítette, hogy milyen kérdésekre kell válaszolni és az elemzés majdani eredményéből felajánlott egy példányt. A felkérő levélben a neveket nyomtatva írták, az aláírás kézzel írott volt. Az eredmények nem mutatnak nagy eltéréseket, de összességében a levelet kapók között nagyobb kooperációt tapasztaltak: a levelet kapók 90%-a, a levelet nem kapók 85%-a válaszolt a kérdőívre. A három különböző levélverzió közül – nagyon kis különbséggel – a legeredményesebbnek a középső megoldást tűnt, a szerző szerint a harmadik levél úgy tűnik, hogy túl hosszú lett ahhoz, hogy figyelmesen elolvassák.
143
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp. 209.
144
Dillman, D., Gallegos, J.G., and Frey, J.H., “Reducing Refusal Rates for Telephone Interviews,“ Public Opinion Quarterly, Vol. 40, No. 1, Spring, 1976, pp. 66-78.
77
2.2.6.2 Az ösztönzők: kit, mennyivel és mivel Az együtt nem működők növekvő aránya miatt a felméréseket végző szervezetek egyre gyakrabban használnak ösztönzőket vagy már eleve a felmérés kezdetekor, vagy pedig csak az első visszautasítás után a kooperáció növelése céljából. Az ösztönzőknek általában pozitív hatást tulajdonítanak a válaszadási hajlandóságra, de manipulatív hatására többen felhívják a figyelmet. Kormányzati kutatás során ritkán ajánlanak fel kompenzációt, ezzel szemben a piackutató ügynökségek gyakrabban adnak ösztönzőt a segítségért cserébe, mintegy megosztják az általuk realizált hasznot. Az ösztönzők hatásáról szóló kísérleti irodalom meta analízisét idézi Mason, Lesser, W. Trangott
145
, amelyben két dimenzió mentén osztályozza az ösztönzőket, egyrészt aszerint,
hogy az ösztönző pénzbeli juttatás vagy sem, illetve aszerint, hogy már az első levél kiküldésekor fölajánlották, vagy csak a visszaérkezésektől függően alkalmazták. Összesen 38 vizsgálatot elemezve Church a következőkre megállapításokat tette: először is, az előre kifizetett ösztönző szignifikánsan nagyobb válaszolási arányt teremtett, ellentétben az előre beígért ösztönzővel. Másodszor, az előre kifizetett pénzbeli ösztönző sokkal nagyobb válaszolási arányt teremtett, mint a felajánlott ajándékok. Mason, Lesser, W. Trangott146 a második állítás alátámasztására egy 1993-as elemzésében vizsgálta az előre kifizetett pénzbeli ösztönzőket (prepaid moneteary incentives) és azt találták, hogy 19,1 százalékponttal növelték a válaszadási arányt, ezzel szemben az utólag átadott ajándékok csak 7,9 százalékpontos növekedést eredményeztek. A pénzbeli ösztönző átlagos értéke 1.38 dollár volt, az ajándékok értékét nem lehet meghatározni. Hasonló megállapításra jutott Chomny és Horvitz147 (1978), akik a National Assessment of Education Progress keretein belül az ösztönzők hatását vizsgálták 26-35 évesek mintáján. A kísérletben összesen négy különböző ösztönző módszer hatását vizsgálták: a válaszolók vagy nem kaptak pénzbeli ösztönzőt, vagy garantált 5 USD-t, vagy garantált 10 USD-t kaptak, illetve a 4. csoport a kitöltés teljességétől függő összeget (0-20 USD között). Az eredmények alapján jól nyomon követhető, hogy a nagyobb értékű ösztönzők nagyobb 145
Robert Mason, Virginia Lesser, Michael W. Trangott: The Use of Incentives to Reduce Nonresponse in Household Surveys, in Survey nonresponse 146
Robert Mason, Virginia Lesser, Michael W. Trangott: The Use of Incentives to Reduce Nonresponse in Household Surveys, in Survey nonresponse 147
Chromy, J., and Horvitz, D., “The Use of Monetary Incentives in National Assessment Household Surveys,” Journal of the American Statistical Association, No. 363, September, 1978, pp. 473-478.
78
válaszolási arányt is jelentettek, a legjobb válaszolási arányt (85,3%) a garantált 10 USD esetén tapasztalták. Néhány kutató meg van győződve az ösztönzők előnyeiről, de elutasítja, hogy minden válaszolónak előre fizessen. A válaszadás stimulálására gyakran alkalmazzák a sorsolásjelleggel nyerhető ösztönzőket. Az irodalom részét képező tanulmányok ellentmondó eredményekről számolnak be: kimutattak pozitív és semleges hatást is148. Az is elmondható, hogy az ösztönzők növelik a válaszolási arányt telefonos és személyes felmérések esetében is, mozgósító hatásuk nem függ a felvétel módjától (Groves149). A gyakorlatban azonban tapasztalhatók eltérések demográfiai és egyéb, finomabb változók mentén is az ajándékkal megnyerhetők illetve az „altruista” válaszolók között. Többen arról számolnak be, ami persze logikusak is mondható, hogy a pénzbeli ösztönzők különösen hatékonyak lehetnek, ha olyan alacsonyjövedelmű és kisebbségi csoportokat akarunk toborozni a mintába, amelyek egyébként alulreprezentáltak volnának Groves150 által idézett kutatók azt találták, hogy 20 dolláros ösztönzővel egy panelkutatás első hullámában hatékonyabban toboroztak fekete és szegénységben élő háztartásokat, mint nem feketéket és jómódúakat. Más kutatásban jelezték, hogy egy minta véletlenül kiválasztott egyik felének fizetett 5 dolláros ösztönző egy telefonos (RDD) felmérésben azt eredményezte, hogy aránytalanul nagy volt az alacsony végzettségűek száma, miközben más demográfiai jellemzőkben nem volt szignifikáns eltérés a két csoport között. Vicky Stroms – Geert Loosveldt151 tanulmányának kiinduló problémája, hogy a Flemish Survey of Cultural Shifts két hulláma (2001 és 2002) között 14%-kal (14-ről 28%-ra) nőtt azoknak az aránya, akik pénzért töltenék ki a kérdőívet. A fő kérdésük ezzel kapcsolatban az volt, hogy ennek oka a „kérdőívben”, vagy inkább a „válaszadókban” rejlik-e. Az individuális jellemzőkkel kapcsolatban megállapították, hogy a jövedelemnek nem volt hatása arra, hogy valaki szerint pénzt kéne-e adni a kitöltésért, avagy sem, ugyanakkor kimutatták annak a hatását, hogy valaki utilitárius vagy individualista értékeket vall-e.
148
bővebben: Robert Mason, Virginia Lesser, Michael W. Trangott: The Use of Incentives to Reduce Nonresponse in Household Surveys, in Survey nonresponse 149
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp. 218.
150
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 409.
151
Vicky Stroms – Geert Loosveldt (2004): Who Repond to incentives, Field Methods, Vol. 16, No.4
79
2.2.6.3 A kérdezőbiztosi viselkedés szerepe A fő kérdés, hogy az ösztönzők hatása vajon egy az egyben a válaszadókra gyakorolt hatásnak tulajdonítható, vagy esetleg a kérdezőbiztos közvetítésének köszönhető a magasabb válaszadási arány? Lehetséges például, hogy az interjúzók elvárják az ösztönzőben részesült válaszadótól, hogy együttműködőbbek legyenek, úgy viselkedjenek, hogy teljesítsék az interjúzók elvárásait, és ezt metakommunikáció szintjén közvetítik is. Singer, Van Hoewyk, és Maher (2000) ezt a kérdést járta körül kísérletében, amelyben az egyes válaszolókról nem tudta a kérdezőbiztos, hogy kap-e pénzbeli ösztönzőt, avagy sem. Ebben a kísérletben nem tudták a kérdezőbiztos ilyen jellegű hatását kimutatni. Dijstra, Smit152 telefonos felvételek esetében vizsgálták, hogy az interjúzók hogyan próbálják meggyőzni a hívott felet a válaszadásról, hogy milyen meggyőzési módszereket és tartalmakat használnak, és ezek mennyire hatékonyak. A vizsgálatban egy CATI adatfelvétel kapcsán rögzítették a z interjú menetét. Az adatfelvételt három napon át készítették este 18.00 és 22.00 óra között, a válaszolókat véletlenszám-tárcsázással hívták, összesen 2740 kapcsolás létesült, ebből 71 esetben a hívott fél megszakította a hívást a bemutatkozó szöveg alatt. Komoly nyelvi problémák merültek föl 74 esetben, 274 esetben nem háztartást hívtak, 166 esetben pedig a bemutatkozó részt nem rögzítették vagy nagyon rossz minőségű lett a felvétel. Így összesen 2155 bemutatkozás maradt további feldolgozásra, ebből 1189 elutasító és 966 együttműködő végkimenetellel. Az interjúk bevezető szakaszának interakció-analízise alapján a következőket állapították meg a kérdezőbiztosi meggyőzési módszerekkel kapcsolatban: azt mondani, hogy az interjú 10 percig tart, kisebb elutasításhoz vezet, mint azt mondani, hogy 15 percig, de az időtartam közlésének elmulasztása még kisebb elutasításhoz vezet. Az interjú időtartama csökkentésének/mérséklésének említése („talán gyorsabban is végzünk”) kisebb elutasításhoz vezet, mint a 15 percről szóló közlés. Úgy találták, hogy ha az interjúzó gyakran idézi a kérdezett kifogásait, az növeli az elutasítások számát. A vártnál kevésbé hatékony a „hatalmi” engedelmességgel érvelni és az egyetemre és tudományos célokra hivatkozni, ennél sokkal hatékonyabb bevetni a személyes vonzerőt („nagyon szeretném, ha együttműködne velem”). A társas megerősítés elmélete szerint a résztvevőnek jobban együtt kellene működnie, ha azt hiszi, mások is együttműködtek. Ugyanakkor a kérdezőbiztosok hiába hivatkoznak a meggyőzés során arra, hogy a legtöbben élvezik az interjúkat, ez nem bizonyult hatékonynak, sőt, a szerzők szerint akár negatív hatással is lehet a részvételi arányra.
152
Wil Dijstra, Johannes H. Smit: Persuading Reluctant Recipients in Telephone Surveys, in Nonsresponse
80
2.2.6.4 Az ösztönző módszerek együttes alkalmazása Többen is készítettek olyan kutatási tervet, amely az eljárások együttes alkalmazásával próbálja maximalizálni a válaszolók számát. Erre szolgál tanulságos példával Soop153, aki tanulmányában a válaszadói ösztönzés szempontjából két érdekes kutatásról is beszámol. A holland háztartásokat célzó, négyévente megismételt AVO felmérés esetén a válaszadási arány egészen 1987-ig 60% körül ingadozott, 1991-ben azonban 43%-ra csökkent. Erre reagálva az 1995-ös kutatás terepmunkáját a GfK készítette, amely integrált felügyeleti rendszerrel dolgozott. Ennek segítségével egészen széles körben tudták emelni a válaszadási hajlandóságot. Ez azt is jelentette, hogy a kapcsolatfelvételek nagyon nagy számát felügyelték, szigorúan monitorozták a válaszadási időket, a napszakokat, valamint a kérdezőbiztosi jellemzőket, úgy, mint nem, kor, sikerességi arány. Feljegyezték még emellett a visszautasítás okát, és a visszautasítót másik kérdezőbiztoshoz irányították át. Mielőtt az első kapcsolatfelvétel megtörtént, rövid levelet küldtek ki a válaszolóknak a majdani felkérésről. A címeket telefonregiszterből írták ki, ezeket névvel és telefonszámmal is személyessé tették, és lehetővé tették a telefonos időpont egyeztetést, ha már három személyes felkeresés nem sikerült. A teljes minta 25%-ának nem volt ismert telefonszáma, ezzel a csoporttal sem levélben, sem telefonon nem tudtak előzetesen kapcsolatot teremteni. Az adatfelvétel kellőképpen hosszú ideig tartott ahhoz, hogy lehetőség legyen időpont egyeztetésre, és a korábban általánosnak mondható három felkereséssel szemben többször is fel lehetett keresni a válaszolót. Ezekkel az eljárásokkal együtt a válaszolók 70%-a válaszolt, de azon háztartások aránya, akiket nem tudtak kontaktálni az 1991-es 12%-ról 1995-ben 2%ra csökkent. A visszautasítás viszont nagyjából nem változott: 25,6% volt 1991-ben és 23,6% 1995-ben. A másik, talán ennél is tanulságosabb az a kutatás, amelyben az előző felmérés nem válaszolóival készítettek egy követéses vizsgálatot. A cél annak a kiderítése volt, hogy a később válaszolók mennyiben különböznek a korábban válaszolóktól, valamint hogy megtudják, a később válaszolók mennyire hasonlítanak a nem válaszolókhoz. A nem válaszolók mintájába összesen 350 visszautasítót választottak ki, ebből 21-et eleve kizártak, mert 12 felkeresésre sem tudták elérni, összességében tehát 329 fő volt a mintanagyság. Ebben az egyszer már nem válaszolók között zajló felmérésben a válaszadási arány szintén 70% volt, de ehhez rengeteg erőfeszítést tettek a kérdezőbiztosok. A projekt során a 153
Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; 23, Sage Publications
81
legeredményesebb kérdezőbiztosokat választották ki, akik magasan motiváltak voltak, korábban magas válaszadási aránnyal rendelkeztek, ezeket a kiválasztási szempontokat meg is mondták nekik, munkájukat konzultációval és szupervízorral támogatták. A képzés mellett addicionális ösztönzőkben is részesültek, a sikeres interjú után pedig bónuszt kaptak. A kérdezőbiztosok
22,5 eurót
kaptak, hogy fizethessenek, ajándékot
adhassanak
a
válaszolóknak. Az esetek 70%-ában pénzügyi ösztönzőket is adtak személyre szabottan átlagosan 15 euró értékben. A válaszolók megválaszthatták a válaszolás módját is, így a mintába kerültek 70%-a személyesen, 20% a telefonon, 8%-a levélben, 1%-a pedig interneten válaszolt. A jutalmak széles köre állt rendelkezésre a pénzügyi ösztönzőkön felül, a válaszoló kapott egy kutatási eredményekre épülő kiadványt, valamint felajánlották azt is, hogy ha kooperál, akkor kiveszik a direktmarketing-adatbázisból, hogy több megkeresést ne kaphasson (a válaszolók 10%-a kérte törlését az adatbázisból). A kutatás során a visszautasítók 30%-át nem lehetett rábeszélni a kooperációra. Fontos azonban megjegyezni, hogy mindkét kutatási elrendezés esetén a szokásos ráfordítások többszörösét tették ki az adatfelvétel költségei. 2.2.6.5 A pótcímek és a súlyozás Egyik eljárást sem vizsgáljuk most részletesen. A pótcímek kérdése sokkal inkább fedési és mintavételi kérdéseket vet fel, a súlyozás pedig már az adatfelvételi szakasz lezárulta utáni adatfeldolgozás első lépése és a disszertáció fő gondolatmenetétől és témájától külön kezelendő terület. A módszerek használatáról annyit azonban érdemes megjegyezni, hogy megítélésük nem egyértelmű. Rudas154 például elutasítja őket, mert szerinte ezek az eljárások inkább elkendőzik a nem válaszolás problémáját, a válaszolók valós demográfiai profilját, Angelusz és Tardos155 szerint is csak látszólagos gyógyírt jelentenek a minta torzulásainak korrigálására, gyakorlati kivitelezésük ritkán problémamentes.
154
Rudas Tamás, (1998) Hogyan olvassunk közvélemény-kutatásokat? Új Mandátum Könyvkiadó, Budapest
155
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006
82
2.2.7 Teljes nem válaszolás – összegzésképpen A visszautasítás általában véve erősödik az elmúlt 20 évben, de már előtte is tapasztalható volt némi erősödés nemzetközi szinten és hazánkban is. A tisztánlátást nehezíti, hogy nincs egységesen elfogadott nem válaszolási arányszámítási modell, és a jó vizsgálati módszerek nehezen kivitelezhetők és költségigényesek. A visszautasítók demográfiai összetételét mindig az adott kutatás megfelelő célcsoportjához képest érdemes vizsgálni, de általában elmondható, hogy kevésbé szívesen válaszolnak a felmérésekre a férfiak. Az életkor hatása már nem ennyire egyöntetű, hazánkban inkább az idősebbek vállalkoznak többször részvételre, a fiatalok között pedig sokkal több a visszautasító. Hasonlóképpen ellentétesek magyarországi és a nemzetközi tapasztalatok az iskolai végzettség hatása terén: Magyarországon a visszautasítási arány az iskolai végzettség szintjével nő. A munkanélküliek és nyugdíjasok nálunk felülreprezentáltak a lakossági mintákban, a gazdaságilag aktívak között jóval több a megtagadó, a nagyobb városokban és a fővárosban is magasabb a visszautasítók aránya. A kutatási tervben többféleképpen lehet redukálni a visszautasítást. Az előzetes kapcsolatfelvételnek nem egyértelműen pozitív a hatása. A másik lehetséges eljárás a válaszolók
részére
ösztönzők
biztosítása.
Ezt
erősíti
a
survey-részvétel
elméleti
megközelítései közül a legnépszerűbb, a társas csereelmélet. Az elmélet szerint az emberek mérlegelik tetteik költségeit és előnyeit, mielőtt cselekszenek. Általában az interakciók költségeit megpróbálják az elvárt jutalom/előny alatt tartani és bíznak benne, hogy a jutalom felülmúlja a költségeiket. Ebből következik, hogy a részvétel előnyeinek fokozása, ösztönző nyújtása fokozhatja a válaszadási kedvet. Annyi azért biztosan megfogalmazható, hogy az ösztönzők növelik a válaszolási arányt és nincsenek negatív hatással az adatminőségre. Egyáltalán nem biztos azonban, hogy minden társadalmi csoportban egyforma az adott ösztönző megítélése, valamint hogy az ösztönző hatására meggyőzöttek nem különböznek-e a visszautasítóktól. Összességében – ahogy Groves is értékeli – kevés a komplex modell, a rendelkezésre álló kutatások legtöbbje nem többváltozós elemzésekkel, hanem egyedülálló attribútumok alapján próbál állításokat megfogalmazni a válaszmegtagadókról. A kérdőíves felméréseknek sok faktora van, amely kapcsolatba hozható a válaszmegtagadással, de ezeket még nem vizsgálták (ilyen például a kérdezési módszer, a kérdőív témája, a felkeresések száma).
83
Többféle út van még egy survey kutató számára, hogy emelje a válaszolási hajlandóságot, többek között a tömegmédia nyilvánossága, igénybe vehet meghatalmazott válaszolót, többféle adatgyűjtési módot alkalmazhat egyszerre, vagy egymás után, hogy elérje a vonakodókat, ki tudja képezni a kérdezőbiztosokat meggyőzési technikákra, vagy létrehozhat egy kérdezői „elit alakulatot”, hogy meggyőzze az elutasítókat. Általában véve azonban tekintettel kell lenni arra, hogy a visszautasítás „mindenek feletti” redukálása ártalmas lehet, figyelemmel kell lenni a nehezen meggyőzhető és az azonnal kötélnek álló válaszolók közötti különbségekre is. A visszautasítás csökkentéséhez szükséges a reakciók homogenitásának feltevése, azaz az a feltevés, hogy mindenki egyformán lesz motivált az alkalmazott ösztönzőktől.
84
2.3 Mérési hibák A már ismertetett sorrend szerint elsőként a válaszadói hibával foglalkozunk a mérési hibák közül, majd megvizsgáljuk a kérdezőbiztosok hatását. A kérdőív hatásának illetve az adatgyűjtés módjának vizsgálata után pedig a részleges visszautasítás, azaz az item nem válaszolás jelenségét vizsgáljuk. Azt érdemes előrebocsájtani, hogy ezeket a hibalehetőségek mérése nagy kihívások elé állítják a kutatókat, mert a survey interjúnak meglehetősen kontrollálhatatlanok a feltételei. 2.3.1 Válaszadói hiba A válaszadói hiba vizsgálata szintén egy olyan külön terület, amelyet nem kívánunk mélyebben körüljárni, ezen dolgozat keretei között vizsgálni. Ennek oka, hogy a válaszadói hiba szakterülete jóval inkább a kísérleti pszichológia és szociálpszichológia területén helyezkedik el. Groves szerint alapvetően kétféle elmélethalmaz köthető össze a válaszoló okozta hibával és a válaszadási folyamattal. Az egyik elmélethalmaz, a kognitív pszichológia vonatkozó elméletei olyan konceptuális struktúrákat tartalmaznak, amelyek segítségével megérthetjük a válaszadási folyamatot és döntéseket. Az ezzel kapcsolatos kutatások arra vonatkoznak, hogy milyen feltételek mentén tudja előhívni a válaszokat a válaszoló, hogyan tudja megmagyarázni a válaszokat. Sokféle elméleti irányultságú és nagyon sok irányzatból álló hipotézist ismertetnek a válaszolói hibáról, de minden esetben a saját maguk konceptuális határaik között. A másik elmélet-halmaz, a szociálpszichológiai irányzatok a társas kontextus hatása felől közelítenek, a társadalmilag elvárt válaszoknak való megfeleléssel magyarázzák a válaszolói hibákat a felmérésekben, de ezzel magyarázzák a szavazásra, könyvolvasásra vonatkozó kérdések esetén tapasztalható beszámolói hibákat is. Groves156 szerint a válaszadói hibák mérésének nehézsége, hogy nagyon nehezen lehet egymástól megkülönböztetni a válaszolói és a kérdezőbiztosi hibát. Az interjú egy társas interakció, amiben a kérdések jelentése szociális kontextusban determinált, ebben a helyzetben a kérdezőbiztos definiálja a kérdéseket, a feltételeknek megfelelő választ begyűjti és fenntartja a válaszoló figyelmét a kérdezés során.
156
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 408.
85
2.3.2 A kérdezőbiztos hatása A kérdezőbiztosi hatás vizsgálatát magának a kérdezőbiztosi szerepkörnek a meghatározásával kezdjük. A kérdezőbiztosi variancia mérési eljárását illetve a befolyásoló faktorokat tekintjük át a következő alfejezetben. Megvizsgáljuk, hogy a kérdezőbiztosok személyes tulajdonságai, demográfiai tulajdonságai és beállítódásai hogyan befolyásolják az eredményeket. Utána sorra vesszük a kutatás dizájn paramétereit, elsőként a kapcsolatfelvétel szerepét, majd a vezérfonal betartásának hatását, a kérdés tartalmának és formájának hatását vizsgáljuk, illetve szót ejtünk a kérdezőbiztosok képzésének és gyakorlatának befolyásoló hatásáról, a korábbi munkatapasztalatok fontosságáról. A kérdezőbiztosi hatás redukálásának két megközelítését mutatjuk be a fejezet végén, az egyik a CATI rendszerek nyújtotta erősebb standardizációt és rotációt támogatja, a másik pedig inkább a kérdezőbiztoshoz delegálja a döntésköröket, mintsem elveszi tőle. 2.3.2.1 A kérdezőbiztos szerepe A kérdezőbiztosnak kettős jellegű a munkája157: egyrészt a válaszolót rá kell vennie az interjúra, kellemes interjúszituációt kell biztosítania, másrészt a kérdések szó szerinti felolvasásával minél több információt kell szállítania a kutatónak. Ugyanakkor viszont nincsen semmilyen kapcsolatuk a kutatókkal, nem látják az adatfeldolgozás eredményeit. Ez jelentheti egyrészről, hogy kevésbé motiváltak, de jelenti azt is, hogy nincsenek teljes mértékig tisztában a kutatás céljával és lehetséges kimeneteivel, így a kérdezőbiztosok gyakran ezen információk hiányában válaszolnak a kérdezett tisztázó kérdésekeire. A kérdezési helyzet alapvetően: egy társas interakció, (Berekoven, Sprecht, Walthelm, Wimmer158 1975), amelyben két idegen ember lép egymással kapcsolatba, az egyik hivatásból, a másik önkéntesen. A kommunikáció menetét a kérdezőbiztos határozza meg, amely azonban nagyrészt már előre lefektetett és standardizált szabályok szerint történik, az interjút készítőnek alapvetően általában semleges információtovábbító szerep jut. Fisher is levonja ugyanakkor azt a következtetést, hogy a kérdezőbiztos személye alapvetően befolyásolja a válaszokat, a válaszolók pedig akaratlanul is igyekeznek megfelelni a kérdezőbiztos elvárásainak. A kérdezőbiztosoktól elvárt interjúviselkedés három eltérő
157
Róbert Péter: A szociológia peremén. Foglalkozásuk kérdezőbiztos. Valóság 1980. 3. szám. 70-77. old.
158
Berekoven, Sprecht, Walthelm, Wimmer: Zur Genauigkeit mündlicher Befragungen in der Sozialforschung, 1975, Herbert Lang Bern, Peter Lang Frankfurt
86
megközelítési módja különböztethető meg (Mácsai159, Scheuch 160). Lágy (puha) interjútechnika az, amikor a kérdezőbiztos szoros, empatikus, bátorító kapcsolatot épít ki a megkérdezettel. Minden módon kimutatja, érezteti rokonszenvét a válaszolóval, egyetértését, a célja, hogy a válaszadó olyan személynek érezze őt, akinek a szívét is kiöntheti, és úgy irányítja a beszélgetést, hogy a kérdezett teljes bizalmát elnyerje. Semleges interjútechnikának azt a hozzáállást nevezzük, amikor a válaszolót a kérdezőbiztos partnerként kezeli, aki nem akar feltétlen kitérni az őszinte válaszok elől, és aki együttműködik a közös feladat megoldási helyzetben. A kérdezőbiztosnak figyelnie kell arra, hogy ne jöjjön létre az érzelmeket mozgósító szituáció, a válaszadó és közte kialakuló emocionális kapcsolat sem negatív, sem pozitív irányba nem befolyásolhatja a válaszadást. A szerzők megállapítják, hogy kezd előtérbe kerülni a semleges technika, mert feltevésük szerint ez produkálhatja a legőszintébb válaszokat. Kemény interjútechnika az, amelyik a gyakorlatban kimondottan tekintélyi helyzetet teremt a kérdezőbiztosnak a kérdezettel szemben. A kérdező nem engedi elkalandozni a kérdezetett, a lehető legjobban ragaszkodik a kérdőívhez és a kérdezési útmutatóhoz. A kérdezőbiztos – kis túlzással – nem egyéb, mint a kutatás eszköze, egy – sajnos – nem nélkülözhető ingerközvetítő és ingerregisztráló, a válaszoló pedig nem a kutató társa, hanem potenciális veszély és hibaforrás. Akármelyik szerepkört is gondoljuk a kutatás során a kérdezőbiztosnak, az joggal feltételezhető, hogy nagymértékben felelős az adatfelvétel megvalósulásáért, ugyanakkor fontos azt is látni, hogy hatása a survey hibák esetében nehezen elválasztható a fedési hibáktól, valamint a teljes és item nem válaszolás jelenségétől. 2.3.2.2 Kérdezőbiztosi hatások és a kérdezőbiztosi variancia mérése Összegezve Groves-t, a kérdezőbiztos alapvetően négy módon lehet a hatással a survey mérésre. Egyrészt szociálpszichológiai szempontból vizsgálva, az interjú egy strukturált társas interakció, amely számtalan társas befolyásolásra való lehetőség formáját hordozza, így
159
Mácsai Tamás: Kérdezői kézikönyv, http://www.pmsz.org/download/KerdezoiKezikonyv.pdf, létrehozás dátuma: 2005. február 28. 160
Scheuch, Erwin K.: Das Interview ind der Sozialforschung, in René König (Hrsg.) Handbuch der empirischen Sikeres kérdezőbiztosi taktikák Sozialforschung, Erster Band, - Ferdinand Enke Verlag, Stuttgart, 1962. 152166p III.8. A kérdezés elméletein.: Cseh-Szombaty László, Ferge Zsuzsa szerk.: A szociológiai felvétel módszerei, Közgazdasági és Jogi Könyvkiadó, 1975
87
például a kérdezőbiztos demográfiai vagy szocio-ökonómiai háttere befolyásolhatja a válaszolót. Másodrészt, a kérdezőbiztos lekérdezheti a kérdőívet többféleképpen, azaz eltérhet a kérdezői útmutatótól egy pár kérdés kapcsán, kimaradhatnak kérdések, rosszul rögzíthet válaszokat. Harmadrészt előfordulhat, hogy a kérdezőbiztos ugyan a kérdést az instrukcióknak megfelelően adja vissza tartalmi szempontból, de szóhasználattal, nem verbális jelekkel, vagy csak intonációval megváltoztathatja azok értelmét, szándékolt tartalmát. És végül fontos megemlíteni azokat a helyzeteket, amikor a kérdezőbiztosnak közbe kell avatkozni, azaz a válaszoló igényli a segítségét, mert számára érthetetlen, nem jól megfogalmazott a kérdés, vagy a válaszlehetőségek. A kérdezőbiztosi szerepkör egyik fontos eleme a közbelépés mértéke, szabályozottsága, amelynek mértékében még meg is oszlanak a vélemények. Az biztos viszont, hogy, az efféle segítségnyújtás eltérő reakciókat implikálhat és ez minden bizonnyal megjelenik a válaszok diverzitásában is. Groves szerint tehát ez a négy faktor okozza a kérdezőbiztosi hibák nagyfokú változékonyságát. Könnyű belátni, hogy ezek a hibák nagyon ritkán állandóak: kérdezőbiztosonként, válaszolónként és kérdőívenként eltérnek. De elmondhatjuk azt is ezek alapján, hogy igen kicsi az esélye annak, hogy két kérdezőbiztos ugyanazt a hibát követi el. Annak ellenére, hogy survey kutatások ezreit hajtják végre egy évben, csak egy maroknyi kutatás vonatkozik a kérdezőbiztosok által okozott ingadozás komponenseire. A legtöbb vizsgálat hiányosan dokumentálja a kérdezőbiztos attribútumait, a vezérfonal jellegzetességeit, a kérdezési folyamat felügyeletét illetve a kérdezőbiztosok értékelését. Ezen jellegzetességek mentén – kiegészítve további aspektusokkal – lehet tanulmányozni a kérdezőbiztos okozta variabilitást. Groves161 a kérdezőbiztos hatásának mérésére a Kish féle statisztikát javasolja, mert a kérdezőbiztosi variancia és a teljes variancia hányadosa egy mértékegységmentes számítás:
27. 26.egyenlet egyenlet
ahol 161
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 364.
88
egyutas ANOVA-ban a kérdezőbiztosok által lefedett csoportok közötti négyzetes eltérés csoportokon belüli négyzetes eltérés a kérdezőbiztosok által felvett kérdőívek száma A szerzők összehasonlítanak tíz személyes lekérdezést (1961-1985 között), a legtöbb esetben a kérdezőbiztosi variancia értéke 0,01 és 0,02 között ingadozik. Elfogadott értéknek tekintik, ha 0,02 értéknél kisebb, ebben az esetben a demográfiai változók kevésbé befolyásoltak a kérdezőbiztos viselkedését. Ha ez az érték 0,02 felett van, akkor a kérdőívben szenzitív téma fordult elő, vagy olyan kérdések, amelyeket nehéz volt megérteni, vagy pedig nem voltak eléggé képzettek a kérdezőbiztosok. A
értéke erősen szóródik, a kérdezőbiztosi hatás mérésének standard hibája
gyakran nagyobb, mint a becslés maga, ebből az következik, hogy a
értéke egy másik
kérdezőbiztosi összeállításban is várhatóan sokkal magasabb vagy alacsonyabb lenne. 2.3.2.3 Demográfia, személyes tulajdonságok Az Egyesült Államokban Groves szerint a legnagyobb irodalommal a kérdezőbiztosok rasszának vizsgálata rendelkezik. Hyman 1954162-ben Memphisben és New Yorkban azt találta, hogy a fekete válaszolók inkább hazafias válaszokat adnak külpolitikai kérdésekre, ha a kérdezőbiztos fehér. Ezzel ellentétben a feketék inkább hajlottak arra, hogy magasabb társadalmi státuszúnak állítsák be magukat, ha a kérdezőbiztos fekete volt. A vizsgálatban szereplő, a faji előítéletekkel kapcsolatos kérdéssor és a kérdezőbiztos rassza – nem meglepő módon – szignifikáns különbséget mutatott.
Schuman és Converse163 17 fehér
kérdezőbiztoshoz és 25 fekete kérdezőbiztoshoz véletlenszerűen rendelték a válaszolókat egy csoportos mintavétel során egy detroiti feketék által lakott háztömböket tartalmazó területen. Hatchett, Schuman és Scheafer164 a kérdezőbiztos rasszának hatását nézték fehér válaszolókon, véletlenszerűsítették a kérdezőbiztosok eloszlását egy detroiti mintán és azt figyelték meg, hogy a fehérek liberálisabb válaszokat adnak a faji előítélettel és rasszal kapcsolatos kérdéseken, ha fekete a kérdezőbiztos. 162
Hyman, H., Interviewing in Social Research, Chicago, University of Chicago Press, 1954.
163
Schuman, H., and Converse, J.M., „The Effects of Black and White Interviewers on Black Responses in 1968,” Public Opinion Quarterly, Vol. 35, No. 1, 1971, pp.44-68. 164
Hatchett, S., and Schuman, H., “Race of Interviewer Effects Upon White Respondents,” Public Opinion Quarterly, Vol. 39, No. 4, 1975-76, pp. 523-528.
89
Egy másik fontos kérdezőbiztosi tulajdonság, − ami szintén befolyásolhatja a válaszokat − a kérdezőbiztos neme. Landis et all.165 (1973) eredményei szerint a női tanulók sokkal inkább feminista álláspontra helyezkedtek a nőket megillető jogokkal kapcsolatban, ha nők kérdezték őket, mintha férfiak, a férfi válaszolók pedig sokkal inkább konzervatív véleményen voltak, ha férfi kérdezte őket. Groves és Fultz166 (1985) a havonta készített Consumer Attitude Survey két évnyi CATI felvételeinek adatait elemezte vizsgálatában, ahol 40 férfi és 80 női kérdezőbiztoshoz véletlenszerűen rendelték a címeket. A ténykérdéseken nem volt magyarázó különbség a nem szempontjából, az attitűd kérdéseknél azt találták, hogy a férfi és a női válaszadók egyaránt sokkal optimistább beszámolót adnak férfi kérdezőbiztosoknak. Az SRC Health and TV kutatásában (Groves és Magilavy167), vizsgálták a kérdezőbiztos nemét, végzettségét, és korát. A túlnyomórészt női telefonos kérdezőbiztosok és a női válaszolókkal kapcsolatban érzékelhető különbség alapján azt feltételezték, hogy különbség lehet a kérdezőbiztos hatásában a válaszoló neme szerint is. Erre azonban nem találtak bizonyítékot. Jóllehet mindegyik kérdés esetében a női válaszolóknál a kérdezőbiztosi variancia értéke valamelyest magasabb volt, az egyes kérdések típusának vizsgálata esetében azonban már nem egyértelműek az eredmények: bizonyos kérdések esetében a férfi válaszolók, más kérdések esetében pedig a női válaszolók értéke volt magasabb. Összességében a különbségek nagyon kicsik voltak. Oksenberg, Coleman és Cannell (1986)168 kimutatták, hogy az attraktív hangú kérdezőbiztosoknak nagyobb a válaszadási arányuk. A részvételi döntésre a kérdezőbiztosoknak nagy hatása van, Haunberger
169
szerint a
kérdezőbiztosok korának és korábbi munkatapasztalatainak hatása számottevő. A fiatalabb kérdezőbiztosoknak és a legalább egyéves tapasztalattal rendelkező kérdezőbiztosoknak
165
Landis, J.R., et al. “Feminist Attitudes as Related to Sex of the Interviewer” Pacific Sociological Review, Vol. 16, No. 3, July, 1973, pp. 305-314. 166
Groves, R.M., and Fultz, N.H., “Gender Effects Among Telephone Interviewers in a Survey of Economic Attitudes,” Sociological Methods and Research, Vol. 14, No. 1, August, 1985, pp. 31-52. 167
Groves, R.M., and Magilavy, L.J., “Measuring and Explaining Interviewer Effects in Centralized Telephone Surveys,” Public Opinion Quarterly, Vol. 50, No. 2, 1986, pp. 251-266. 168
Oksenberg, L., Coleman, L., and Cannell, C.F., “Interviewers’ Voices and Refusal Rates in Telephone Surveys,” Public Opinion Quarterly, Vol. 50, No. 1, 1986, pp.97-111. 169
Haunberger, Sigrid: The Effect of Interviewer and Respondent Characteristics on Response Behavior in Panel Survey: A Multilevel Approach, QUALITY & QUANTITY, Volume 44, Number 5, 957-969.
90
magasabb volt a válaszadási rátája. A kérdezőbiztosok hasonló területen szerzett korábbi munkatapasztalata pozitívan befolyásolja a válaszadást (bővebben: Hox és de Leeuw170). Tu és Liao171 a társadalmi távolság és az interjú „harmóniájának” hatását vizsgálta a válaszhiányok mennyiségére és minőségére. A társadalmi távolságot azzal mérték, hogy különböző szocio-demográfiai változók szerint a kérdező és a válaszoló milyen mértékben hasonlít, vagy különbözik, ezek a szocio-demográfiai változók a nem, a családi állapot, a kor, az iskolázottság és a már említett etnikai hovatartozás. Az interjú harmóniája alatt a szerzők az interjú lefolyását értették, azaz hogy milyen volt a kérdezett és a kérdezőbiztos viselkedése. Az eredmények alapján a kor, az iskolázottság és a harmónia minden modellben erős hatással volt az adatminőségre: jobb volt, ha a kérdező fiatalabb és iskolázottabb volt, mint a válaszoló, és minél harmonikusabb volt az interjú, annál jobb lett az adatminőség. A nem és a családi állapot csak a nem tudom válaszokra (részleges visszautasításra), az etnikai hovatartozás pedig csak a teljes visszautasításra volt hatással. Magyarországon nincsen különösebb információ illetve kutatás a kérdezőbiztosok demográfiai összetételéről, Róbert Péter172 jóvoltából csak az 1980-as évek elejéről van egy pillanatfelvételünk. Az akkori helyzetet úgy észlelte Róbert, hogy a ’70-es évek elején a profi kérdezőbiztosok többsége még érettségivel rendelkezett, a ’80-as években már egyetemi végzettségűek, olyan fiatalok voltak, akik hátat fordítottak eredetileg tanult szakmájuknak, vagy akik diplomával a kezükben nem tudták eldönteni, hogy mihez kezdjenek. A kérdezőbiztosok egy kisebb részének határozott célja volt, szociológus, vagy író akart lenni, voltak, akikben ez az érdeklődés nem volt meg, őket a pénz, és az egyedi munkakörülmények vonzották, de a többségnek nem volt ilyen konkrét célja. 2.3.2.4 Elvárások, stílus és attitűdök Groves szakirodalmi áttekintése szerint a kérdezőbiztosi hiba egyik forrása a kérdezőbiztos erős prekoncepciója a válaszolóról, tehát a kérdezőbiztosnak még a felmérés megkezdése előtt van valamiféle elképzelése a válaszok megoszlásáról és viselkedésével ebbe 170
Joop Hox, Edit de Leeuw: The Influence of Interviewers Attitude and Behavior on Household Survey Nonresponse: An international Comparison, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, 2002, John Wiley & Sons, Inc, New York 171
Su-hao Tu – Pei-shan Liao (2004):Socail Distance, Interview Rapport, and Invalid Responses, Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Methodology: Recent Developments and Applications in Social Research (ISA RC33), Amsterdam August, 16-20, 2004 172
Róbert Péter: A szociológia peremén. Foglalkozásuk kérdezőbiztos. Valóság 1980. 3. szám. 70-77. old.
91
az irányba „tolja” a válaszokat. Sudman et.al173 (1977) munkájában a kérdezőbiztosoknak a felmérés előtt egy kérdőívet kellett kitölteni arról, hogy szerintük mennyire lesz nehéz majd a kérdőív interjú, mekkora részét utasítják majd vissza a kérdéseknek, és milyen lesz a szenzitív adatok esetében a látencia. Összesen 56 kérdezőbiztos munkáját elemezték, akik 1077 kérdőív interjút végeztek. Singer és Kohnke-Aguirre (1979)174 részben megismételték ezt a kísérleti elrendezést. Mindkét vizsgálat eredményei azt mutatják, hogy az adminisztrációs nehézségek és a kérdezőbiztosi elvárások összességében nem befolyásolták erősen a válaszolói viselkedést. Dijkstra175 hipotézise szerint a kérdés-válasz folyamatban, az interjúra a kérdezőbiztos személyes stílusa két különböző módon hathat: először is, az a kérdezőbiztos, aki nagyon „személyeskedik” és kimutatja érdeklődését az iránt, hogy megértse a válaszolót, egyszerűen túlteljesíti a feladatát. Másodszor, ha a válaszoló azt érzi, hogy a kérdezőbiztos személyesen ő utána érdeklődik, igyekezhet majd magát jó színben feltüntetni a kérdezőbiztos előtt, konform módon viselkedhet, társadalmilag elvárt válaszokat fog adni. Dijkstra176 kísérlete során a válaszolókat véletlenszerűen sorsolták ki, a kiválasztottak kaptak egy felkérő levelet, amelyben az állt, hogy a lakással, lakhatással való elégedettséget fogja mérni a felmérés. Az interjúkat magnószalagra rögzítették, a kérdezés után a válaszolóknak ki kellett tölteni egy kérdőívet, amelyben az interjúzóval kapcsolatos attitűdállítások voltak, amit egy zárt borítékban átadták a kérdezőbiztosnak. Megpróbálták mérni a releváns, nem releváns információ mennyiségét, a társadalmi elvárásoknak való megfelelést (20 item-es Marlowe-Crowne skálával) illetve a konformitást. A kísérleti dizájnban négy férfi és négy női kérdezőbiztos esetében a személyes, négy férfi és négy női kérdezőbiztos esetében pedig a formális stílusban történő kérdezést rendelték el, így összesen 105 formális, 98 személyes stílusú interjú készült. A kérdezőbiztosokat randomizáltan rendelték hozzá a válaszolókhoz, a kérdezőbiztosok 21-33 év közöttiek voltak, és őket a kutatás valódi céljáról nem informálták. A kutató szerint erre azért volt szükség, hogy ne 173
Sudman, S., et. al, “Modest Expectations: The Effects of Interviewers’ Prior Expectations on Responses,“ Sociological Methods and Research, Vol. 6, No. 2, November, 1977, pp. 171-182. 174
Singer, E., and Kohnke-Aguirre, L., „Interviewer Expectation Effects: A Replication and Extension,” Public Opinion Quarterly, Vol. 43, No. 2, 1979, pp.245-260. 175
Dijkstra, W: Interviewing Syle and Respondent Behavior: An Experimental Study of the Survey-Interview, Sociological Methods & Research, Vol 16. No. 2, 1987 november 176
Dijkstra, W: Interviewing Syle and Respondent Behavior: An Experimental Study of the Survey-Interview, Sociological Methods & Research, Vol 16. No. 2, 1987 november
92
befolyásolja az eredményeket a kutatás eredeti céljának ismerete. A kutatáshoz komoly kiscsoportos felkészítő tréninget tartottak. A kérdezőbiztosok az összes csoportban nagyon pozitív értékelést kaptak a válaszolóktól, a személyes stílus esetében még kedvezőbbet. A feladat részét képező várostérképet a személyes interjústílussal válaszolók pontosabban tudták felvázolni, pontosabban becsülték a távolságokat, de a különbség nem volt szignifikáns. Dijkstra a motivációs hipotézist igazoltnak látja, azaz egy magasabb motivációs szint magával hoz egyfajta éberségi szint emelkedést, azaz a jobb motiváció magasabb aktivizációs szinthez vezet a válaszoló részéről, amely egyszerűen több beszédet jelent, azaz több – releváns és irreleváns – információt ad. Természetesen ezek az eredmények nem kérdőjelezik meg a behízelgő, megnyerő kérdezőbiztosi stílus fontosságát a survey interjúkban. Elmondható, hogy az erős válaszolói motiváció pozitív hatással van az adatminőségre, ezért sokkal nagyobb kihívás a válaszoló motivációjának emelése. A kérdezőbiztosi attitűdök és elvárások is nagyban hozzájárulnak az interjú sikerességéhez, azok, akik pozitív attitűddel és elvárásokkal indulnak, nagyobb válaszolási arányt produkálnak (Link177). A kapcsolatfelvételtől a kérdezés megkezdéséig tartó utat vizsgálta Juhász és Sterk (1975)178. Részletesen tanulmányozták, hogy mit szabad és mit nem szabad tartalmazni a bemutatkozó szövegnek, de álláspontjuk szerint nem lehetséges a teljes bemutatkozó szöveget standardizálni, mert az nagymértékben az adott kérdező-válaszoló interakciónak és szituációnak függvénye. Tapasztalataik alapján a bevezető szövegnek – a kötelező tartalmakon felül (kérdező neve, intézmény, jövetelének célja) tartalmaznia kell azt, hogy a kérdezőbiztos hogyan jutott el a válaszolóhoz, miért kereste fel, mi fog történni azzal, amit válaszoló. A bevezető szöveget a kutatók nem mindig tekintik a kérdőív szerves részének, de – ahogy azt a szerzőpáros megállapítja – a bevezető szöveg sosem lehet független a kérdőívtől.
177
Michael W. Link: Predicting the Persistence and Performance of Newly Recruited Telephone Interviewers, Field Methods, 2006 18, No. 3. August 178
Juhász Krisztina – Sterk Péter: A bemutatkozásról, bevezető szövegről és indító kérdésekről a kérdőíves adatfelvételnél. Tömegkommunikációs Kutatóközpont Füzetek, 6. évfolyam, 10. szám, 1975. 03. 27.
93
A bevezető szövegnek alkalmazkodnia kell a felmérés jellegéhez, témájához és a mintához, adott esetben az első kérdést bele is szövik a bevezetőbe.. Hox és de Leeuw179 által idézett kutatásban a bevezető beszélgetések felvételeit elemezve állapítottak meg sikeres stratégiákat. A legeredményesebbnek a „hitelesnek látszani” stratégiát emelték ki, amelynek elemei az azonnali bemutatkozás; az, ha a kérdező az interakció során végig barátságosnak tűnik, mosolyog, valamint rugalmasan, udvariasan alkalmazkodik az ajtóban kialakult helyzethez; reagál a válaszadóra. Szintén Hox de Leeuw180) számol be arról, hogy igazolták Groves és Couper főbb következtetéseit, amely szerint a szakmai kompetencia, a társas készségek, a bemutatkozás testre szabása valamit az interakció fenntartása voltak a jó taktikák a sikeres interjúzóknál. 2.3.2.5 A kutatási dizájn komponensei és a kérdezőbiztos Az egyik ok tehát, amiért a kérdezőbiztosi variabilitás fennáll, hogy egyes kérdezőbiztosok ragaszkodnak a kérdezés vezérfonalához, más kérdezőbiztosok pedig részben vagy teljesen fellazítják a vezérfonalat, eltérnek a kérdezés tervezett menetétől. Ennek mérése igen bonyolult és időigényes folyamat, gyakorlatilag csak kétféleképpen lehetséges: egyrészt egyszerűen rögzítik az interjút és utólag, kódolás után elemzik vagy az interjúval egy időben hallgatják az interjút és monitorozzák a folyamatot. A második lehetőség a személyes interjúk esetében csak a megfigyelés formájában képzelhető el, ill. CATI rendszeren készült adatfelvételek esetében, ahol rögzítik a kérdőív interjúkat.
179
Joop Hox, Edit de Leeuw: The Influence of Interviewers Attitude and Behavior on Household Survey Nonresponse: An international Comparison, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, 2002, John Wiley & Sons, Inc, New York, p. 103 180
Joop Hox, Edit de Leeuw: The Influence of Interviewers Attitude and Behavior on Household Survey Nonresponse: An international Comparison, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, 2002, John Wiley & Sons, Inc, New York
94
Interakciós kódok181
9. táblázat Kérdezés
1. felolvassa, ahogy nyomtatva van 2. felolvassa kis eltéréssel 3. felolvassa nagy eltéréssel 4. kihagyja Kérdés ismétlése 1. ismétli jól 2. ismétli feleslegesen 3. felolvassa, nem jól 4. nem ismétli Definiálás, tisztázás 1. jól definiál 2. feleslegesen definiál 3. nem jól definiál 4. nem definiál Rövid visszajelzés 1. jók a rövid visszajelzések 2. rövid visszajelzések feleslegesen 3. rövid visszajelzések nem jól 4. nem ad rövid visszajelzéseket Hosszú visszajelzés 1. jók a hosszabb visszajelzések 2. hosszabb visszajelzések feleslegesen 3. hosszabb visszajelzések nem jól 4. nem ad hosszabb visszajelzéseket Tempó/időzítés 1. túl lassan vagy túl gyorsan olvassa az itemeket 2. az egyes itemek közötti időzítés túl gyors 3. az egyes itemek közötti időzítés túl lassú Érthetőség általában 1. nem természetes olvasás 2. rossz kiejtés, ami félreértéshez vezethet
Ezt a kódolási sémát használta Mathiowetz és Cannell182 1980-ban CATI interjúkra, de a fenti kategóriákat magnóval rögzített interjúkon is dokumentálták. Talán az egyes 181
Mathiowetz, N., and Cannell, C., “Coding Interviewer Behavior as a Method of Evaluating Performance,” Proceedings of the American Statistical Association, 1980, pp. 525-528. 182
Mathiowetz, N., and Cannell, C., “Coding Interviewer Behavior as a Method of Evaluating Performance,” Proceedings of the American Statistical Association, 1980, pp. 525-528.
95
kategóriák közül érdemes tisztázni néhány jelentését. Az ismétlés alatt azt értik, hogy hogyan ítéli meg a kérdezőbiztos, meg kell-e újra ismételni a kérdést, avagy sem. Néha a kérdezőbiztos az interjúalany felé olyan szóhasználattal él, ami nincs a kérdőívben, tehát újradefiniálja vagy tisztázza a kérdést. Néha – rövidebb-hosszabb – verbális visszajelzéseket, reakciókat kell adni, akár szerepel az instrukciók között, akár nem. Összességében a kérdések 30-95%-át olvasták fel a kérdőívnek megfelelő módon. Létezik egy olyan feltételezés, hogy a különböző kérdéstípusok más és más kommunikációs kihívások elé állítják a kérdezőbiztosokat, amelyek komplexitásukban is eltérnek egymástól. Így például a ténykérdések kevesebb szubjektív elemet tartalmaznak, másképp kell őket kommunikálni, mint az attitűd jellegű kérdéseket. Összehasonlítva a kérdezőbiztosi hatást a tény illetve az attitűd kérdéseken, a múltbeli kutatások és tanulmányok vegyes képet rajzolnak ki. Kish183 (1962) nem talált fontos különbséget a kérdezőbiztos hatásában kérdéstípusonként, de számos egyéb kutatás (részletesebben lásd Groves184) azt állapította meg, hogy a ténykérdések kevésbé vannak kitéve a kérdezőbiztosi hatásnak. Nagyobb kérdezőbiztosi hatást figyeltek meg az attitűdkérdéseknél, különösen a nyitott kérdések esetében (O’Muirchearhaught, 1976),185 az érzelmi töltöttséggel rendelkező kérdéseknél (Fellegi186, 1964), valamint az olyan itemeknél mint a jövedelem és foglalkozás (Hansen et all187 1964). A Groves a Survey Research Center felméréseiben 155 ténykérdésen és 149 attitűdkérdésen számolt statisztikát hasonlított össze: néhány kérdés esetében volt arra lehetőség, hogy replikációs összehasonlítást is végezzenek, mert több kérdőívben is szerepelt a kérdés. Az eredmények nem szolgáltattak arra bizonyítékot, hogy a tény illetve az attitűdkérdések között lenne valamilyen kimutatható kérdezőbiztosi hatás. Voltak azonban olyan eredmények is, amelyek különböztek kérdezőbiztosonként, mégpedig azon kérdések esetében, amikor több válaszlehetőség is adható volt. Ebben az esetben a kérdezőbiztosonként
183
Kish, L., “Studies of Interviewer Variance for Attitudinal Variables,” Journal of the American Statistical Association, Vol. 57, March, 1962, pp. 92-115. 184
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, 8. fejezet
185
O’Muirchearhaught, C.A., “Response Errors in an Attitudinal Sample Survey,” Quality and Quantity, Vol. 10, 1976, pp. 97-115. 186
Fellegi, I.P., “Response Variance and Its Estimation,” Journal of the American Statistical Association, Vol. 59, December, 1964, pp. 1016-1041. 187
Hansen, M.H., Hurwitz, W.N., and Pritzkes, L., “Response Variance and Its Estimation,” Journal of the American Statistical Association, Vol. 59, 1964, pp. 1016-1041
96
mért különbség oka a kérdezőbiztosok proaktív magatartása, azaz hogy mennyire igyekeztek segítő kérdésekkel katalizálni a válaszadást. A kérdezőbiztosi tréning közvetlen módon próbálja befolyásolni a kérdezőbiztosi hibát azzal, hogy a kérdezőbiztosi folyamatok univerzalizáltsága, standardizáltsága minél magasabb szinten legyen az adatgyűjtés folyamatában. A gyakorlatban mindegyik felmérésekkel, adatfelvételekkel foglalkozó intézmény rendelkezik valamilyen iránymutatással, vezérfonallal a kérdezőbiztosai részére. Ez a formális utasításkészlet azonban formájában, tartalmában, módszereiben, és részletességében nagy heterogenitást mutat. Groves188 szerint eltérések lehetnek abban, hogy mennyire kell ragaszkodnia a kérdezőbiztosnak a leírt kérdőívszöveghez a kérdezés során, hogy mennyire kell adminisztratív szempontból rögzíteni a ténykérdéseket, vagy hogy mennyire kell a válaszadást erőltetni, de eltérhetnek abban is, hogy mennyi ideig tartson a tréning a kérdezőbiztosi munka megkezdése előtt. Fowler és Mangiurne189 (1985) vizsgálatukban úgy fogalmazták át a kérdést, hogy milyen hosszú képzési időszak van pozitív hatással a kérdezőbiztosi munkára. A vizsgálatban 57 kérdezőbiztos munkáját vizsgálták Boston és Massachussets elővárosi területein. A kérdezőbiztosokat véletlenszerűen négy különböző tréningcsoportba osztották. Az első csoport egy fél napos tréningen vett részt, ami egy, a felmérésekről szóló kétórás előadást, egy interjúdemonstrációt és a kérdezőbiztosi instrukciók megismerését foglalta magába. A második csoport két napos tréningje a fél napos tréning anyagán túl egy beszélgetést tartalmazott az interjúzás alapszabályairól, ezen felül egy két órás felügyelt kérdezési gyakorlatot magnóhasználattal, és kérdezőbiztosi tennivalók gyakorlását. A harmadik csoport, − egy öt napos tréningen − a kétnapos tréning anyagán felül szerepjátékokkal, helyzetgyakorlatokkal, kérdések rögzítésével ismerkedett, valamint a kérdezőbiztosok ezen csoportja gyakorlati tanácsokat kapott a válaszolói kooperáció elnyerése érdekében. A negyedik csoport tananyaga − egy tíznapos tréningen − tartalmazta az ötnapos tréning elemeit, ezen felül pedig terepen felügyelet melletti próbainterjúzást, gyakorlati értékelést az interakció elemzésével, és a felmérés módszertani megbeszélését. Megállapítható, hogy az adatok minősége nagymértékben javult, ha a tréning legalább kétnapos volt: a kérdések szó szerint olvasása, a zárt és nyitott kérdések kitapogatása és rögzítése is jobban sikerült a több napos tréningen áteső kérdezőbiztosoknak. 188
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 390
189
Fowler, F.J., Jr., and Mangione, T.W., The Value of Interviewer Training and Supervision, Final Report to the National Center for Health Services Research, Grant #3-R18-HS04189, 1985.
97
Groves által idézett kutatásban Rustemeyer (1977) 200 interjú elemzése során megkülönböztette a képzett kérdezőbiztosokat (akik már több hónapos tereptapasztalattal rendelkeznek), a frissen képzetteket (akik már néhány interjúk készítettek), illetve az új kérdezőbiztosokat (akik most fejezték be a tréninget és nincs terepgyakorlatuk). Rustemeyer nem talált különbséget a három csoport között abban, hogy mennyire pontosan olvasták fel a kérdőívet, az egyetlen említésre méltó különbség, hogy a kihagyott kérdések száma a középső csoportban – a frissen végzettek között – volt a legnagyobb (8,9%), ezzel szemben a gyakorlott kérdezőbiztosok között 3,3% és az új kérdezőbiztosok között pedig 6% volt. Ezek alapján nem tűnik úgy, hogy a gyakorlottság és a vezérfonal be nem tartása összefüggene, viszont más vizsgálatok azt mutatják, hogy ebben nagy a szórás. Oksenberg190 1981-ben megmutatta, hogy a legjobb kérdezőbiztosok a kérdéseknek átlagosan 11%-át, a legrosszabb kérdezőbiztosok pedig 67%-át adták át kis változtatással a válaszolóknak. W. Link tanulmányában különféle tényezők hatását vizsgálta a kérdezőbiztosi hatékonyságra. Természetesen a kérdezőbiztosi hatékonyság egy mennyiségi mutatója a kérdezőbiztosi munkának, mégis a W. Link vizsgálatában tapasztalt meghatározó faktorok nagy valószínűséggel hatással vannak az interjú minőségi jellemzőire is191. A tanulmányban egy olyan vizsgálatról számol be, amely az újonnan alkalmazásba vett telefonos kérdezőbiztosok teljesítményének és munkakörülményeinek hatását vizsgálta a munkájuk hatékonyságára. Konkrétan azt vizsgálta, hogy a kérdezőbiztosok szocio-demográfiájának, korábbi tapasztalatainak, releváns készségeinek, attitűdjeinek valamint a munkahelynek milyen hatása van hatékonyságukra. 2000-ben több mint 400 újonnan képzett kérdezőbiztos segítségével két nagy felmérést készítettek. A kutatás eredményei szerint a kérdezőbiztosok 64%-a maradt a kérdezőbiztosi munkánál, 36%-uk kilépett 100, munkában töltött óra előtt. Az egyéni faktorok közül (kor, nem, rassz, korábbi tapasztalatok, készségek vagy attitűdök) egyik sem volt hatással erre, ugyanakkor a munkakörnyezet egyértelműen determináló faktor volt. Azok, akik az éjszakai vagy hétvégi váltásban dolgoztak, sokkal nagyobb arányban kiléptek 100 óra letelte előtt, mint azok, akik a nappali váltásban dolgoztak. Hasonló hatása volt még a munkavégzés helyének, ugyanis két különböző call-centert használtak a felvétel során és nem volt egyformán jól képzett és tapasztalt a két felügyelő csapat. A vizsgálat eredményeképpen
190
Oksenberg, L., Analysis of Monitored Telephone Interviews, Report to the U.S. Bureau of the Census for JSA 80-23, Ann Arbor, Survey Research Center, The University of Michigan, May, 1981. 191
Michael W. Link: Predicting the Persistence and Performance of Newly Recruited Telephone Interviewers, Field Methods, 2006 18, No. 3. August
98
azt fogalmazták meg, hogy nem egyedi faktorok, hanem a személyiségi és munka faktorok összessége az, ami sikeressé teszi a kérdezőbiztos munkáját. 2.3.2.6 A kérdezőbiztosi szerepkör változása –CATI versus „rugalmas kérdőív” Két egymásnak csak látszólag ellentmondó megközelítés tapintható ki a kérdezőbiztosi hatás megközelítésére. Az egyik elgondolás szerint a kérdezőbiztosi munka minőségének javítása a szabályozottság, kontrollálhatóság és ellenőrzés fogalmakkal írható le röviden. Ez a megközelítés úgy gondolja, hogy a kérdezőbiztosi viselkedést és reagálásokat a lehető legteljesebb mértékben szabályozni kell, minden lehetséges körülményt kontrollálni kell valamint rendszeresen kell ellenőrizni a munka menetét, az interjúk minőségét. A másik megközelítés szerint a kérdezőbiztos inkább partner, akinek – természetesen megfelelő képzettség megszerzése után – a lehető legszélesebb döntési és értelmezési jogkört kell kapnia, hogy az adatminőség jó legyen. A következőkben megvizsgáljuk, hogy a két eltérő megközelítés milyen hatással van a kérdezőbiztosi hibára illetve az adatfelvétel folyamatára. A CATI rendszerek a számítógép-támogatás miatt jobban kézben tudják tartani a kérdezőbiztosi hatásokat, mint a személyes lekérdezések. A Health in America vizsgálatban (Groves192) a CATI felvétel során az egyes kérdezőbiztosokhoz véletlenszerűen rendeltek eseteket, és így tettek a papír alapú kérdőív esetében is. A személyes lekérdezésben és a telefonos lekérdezésben is részt vett mindegyik kérdezőbiztos, és mindkét esetben ugyanazt a kérdőívet használták. A vizsgálatban 25 változót hasonlítottak össze, tapasztalataik szerint a CATI esetében alacsonyabb volt a
értéke 18 változó esetében. A CATI felmérések esetén
az átlagos érték -0,0031, a személyes lekérdezés esetében pedig 0,0048 volt. A központosított telefonos survey legnagyobb vonzereje alkalmazásának korai időszakában az volt, hogy folyamatosan ellenőrizni lehetett a kérdezés vezérfonalának követését (Groves193). Ezt támasztja alá Tucker194 vizsgálata is, amelyben a szerző összesen 11 nemzetközi CATI vizsgálatot elemzett, mindegyik vizsgálatban legalább 11, legfeljebb 18 változón vizsgálták a kérdezőbiztosi variabilitást. A
értéke -0003-0,008 között
ingadozott, az átlagos értéke 0,004 volt, alacsonyabb, mint a szerzők személyes lekérdezések esetében tapaszalt értékei. 192
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 377.
193
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 365
194
Tucker, C., “Interviewer Effects in Telephone Surveys,” Public Opinion Quarterly, Vol. 47, No. 1, 1983, pp. 84-95.
99
Grooves és Magilavy195 a Survey Research Center-ben végzett kilenc CATI kutatás eredményeit elemezték. Kilencből nyolc esetben kétlépcsős rétegzett mintát vettek, amelyben véletlenszerűen generálták a telefonszámokat. A kilencedik felmérés – a National Election Study (NES) – egy megismételt felvétel, amely a gyakorlatban az előző felvétel mintájának újbóli lekérdezését jelentette. A vizsgálatban a kutatók arra voltak kíváncsiak, hogy hogyan alakul az egyes felvételekben a kérdezőbiztosi hatás, a kérdezőbiztosokhoz minden egyes esetben véletlenszerűen rendelték a telefonszámot, a nem véletlenszerű hozzárendeléseket kizárták az elemzésből. Minden egyes interjúhoz a háztartásból egy személyt választottak ki, így követhető volt a kérdezőbiztosok száma és átlagos terhelésük is. A válaszolási arányok 59-87% között voltak, a NES esetében tapasztaltak 87%-ot. Az SRC elemzése szerint a tipikus
érték CATI esetében 0,01 körüli, valamivel kisebb, mint a személyes
lekérdezésekben, ahol 0,02 környékén van. Összességében a CATI rendszerekkel csökkenteni lehet a kérdezőbiztosi hatást, mert azok a teljes kérdezési folyamatot és a kérdezőbiztosok sorrendjét is behatárolják. Letenyei és Nagy 2007-es cikkükben megjegyzik196, hogy a standard kérdőívfelvétel során sok esetben a nem elég körültekintően elkészített kérdőív a kutatók véleményét tükrözi, és így a válaszok is a kutató sztereotípiáit erősítik meg. Ennek a kiküszöbölésére megfelelő eszköz lehetne a kvalitatív és kvantitatív kutatások szorosabb összekapcsolása, együttes alkalmazása, amely növelheti a vizsgálatok érvényességét. A standardizáltság pártján állók szerint azért kell a standardizálás, hogy a kérdezőbiztosok által okozott hiba és befolyásolási lehetőség a lehető legkisebb legyen. A probléma, hogy ez a megközelítés nem teszi lehetővé a kérdések jelentésének pontos tisztázását, ennek megoldása az lenne, ha nem a kérdés szövegét, hanem jelentését standardizálják. Letenyei és Nagy meglátása szerint tehát a standard kérdésekkel dolgozó kérdőív a terep-távoli habitusú kutatók illúziója, a valóságban a kérdéseket a kérdezőbiztosok nem standard módon teszik fel. A standard iskolával szemben a kérdezőbiztosok hozzáállásán az általuk „rugalmasnak” nevezett kérdőívezési eljárás alapvetően nem kíván változtatni, sőt, azt helyesnek tartja. Ugyanakkor elvárja, hogy a standardtól való eltérés ellenőrizhető legyen, és hogyha szükséges, akkor ez az információ bevonható legyen az elemzésbe. A terephez 195
Groves, R.M., and Magilavy, L.J., “Measuring and Explaining Interviewer Effects in Centralized Telephone Surveys,” Public Opinion Quarterly, Vol. 50, No. 2, 1986, pp. 251-266. 196
Letenyei László, Nagy Gábor: Rugalmas kérdőív, Szociológiai Szemle, 2007/1-2, 29-46. oldal
100
alkalmazkodás célja az a szerzők szerint, hogy az információt jó érvényességgel tudjuk begyűjteni. Ezzel megengedjük a kérdezőbiztosnak azt, amit egyébként is tenne, azaz, hogy a kérdést a helyben adekvát módon tegye fel, a kérdések cserélhetősége jelenti a kérdőív rugalmasságát. A kérdezőbiztos ráadásul szükség esetén menet közben további kérdésvariációval, vagy kisegítő információval teheti adekváttá a kérdőívet. Ezeket a rugalmas megoldásokat azonban „rugalmatlanul” rögzíteni kell, hogy amennyiben a kutató végül szükségesnek látja, bevonhassa az elemzésbe. A rugalmas kérdőívezési technika a szerzők szerint gyorsítja a kérdőívezés folyamatát, javítja az eredmények pontosságát, a válaszok érvényességét növeli úgy, hogy nem csökkenti a megbízhatóságot. Fontos, hogy a kutató maga is kérdőívezzen, mert közben alakul ki a terepen a kérdőív. A válaszolóval ebben a megközelítésben szorosabb, partneri a viszony, a kérdezőbiztos szerepe nagy, ő biztosítja a terep-közeli jelleget. Az eljárással kapcsolatban maguk a szerzők is említik a legfőbb kritikát, amely szerint a terep-közeli jelleg az összehasonlíthatóság rovására megy az adatelemzés során. Valóban, a rugalmas kérdőívben ugyan lehetnek úgynevezett „rugalmatlan blokkok” is, de mindenképpen fennáll a koherens adatbázis felbomlásának veszélye. A gyakorlatban egy ilyen adatfelvétel adattisztítása, esetleges súlyozása és elemzése további kezelendő kérdéseket vet fel. 2.3.2.7 A kérdezőbiztos hatása – összegzésképpen A kérdezőbiztos egyértelmű és közvetlen hatással bír a kérdezés menetére és az eredményeire is. Vannak azonban olyan személyes tulajdonságok is, amelyek látens módon fejtik ki hatásukat a kérdezés során, ilyenek az etnikai hovatartozás, amely például még a kérdés témájának ismeretében és kellő körültekintéssel sem biztos, hogy hatékonyan kiküszöbölhető torzító hatást jelent. Hasonló lehet még a válaszadó és a kérdezőbiztos neme közötti eltérés, de a kérdezés tartalmának ismeretében ezt jóval könnyebb kontrollálni. Láthattuk, hogy a kérdezőbiztosok részéről tapasztalt kifejezetten pozitív hozzáállás, valamint a személyes stílus valamelyest növeli az adatfelvétel sikerességét és az adatminőséget. Általánosságban elmondhatjuk azt is, hogy a ténykérdések kevésbé vannak kitéve a kérdezőbiztosi hatásnak. A kutatási dizájn egyes komponensei közül a vezérfonal betartása illetve az attól való eltérés alapvetően befolyásolja a kérdezőbiztosi variabilitást, ezt – és sok egyéb körülményt – a kérdezőbiztosok képzésével lehet kontrollálni. A kérdezőbiztosi szerepkör változása kapcsán említett két alternatíva közül értékelhető adatok a CATI rendszerekből vannak, ezek alapján a CATI-nak kimutatható a kérdezőbiztosi hatás 101
redukálásának irányába mutató pozitív hatása. A rugalmas kérdőív kivitelezése számtalan egyéb kérdést is felvet, nincs még kidolgozott módszertana. Ezek a vizsgálatok amellett, hogy közvetlenül mutatják a kérdezőbiztosi befolyásolás egyes jellemzőit, segítséget nyújtanak egyféle minőségbiztosításra azzal, hogy azonosítják a kérdezőbiztosok vagy a válaszolók szempontjából nem megfelelő kérdéseket illetve azonosítani lehet azokat a kérdezőbiztosokat is, akik nem jó módszerrel kérdezik a kérdőívet.
102
2.3.3 Adatgyűjtés módjának hatása a válaszokra Alapvetően két megközelítés szerint vizsgáljuk az adatgyűjtés hatását, az egyik hogy magának az adatgyűjtésnek van-e kimutatható hatása, ha minden egyéb eljárás megegyezik, másrészt a ugyanarra az eredményre jutnak-e az eltérő módszerrel készült adatfelvételek az utómunkálatok során. 1940-től 1970-ig a domináns adatgyűjtési mód az Egyesült Államokban – és máshol is – a személyes látogatáson alapuló kérdőív interjú volt, amiben a kérdezőbiztos tipikusan az otthonában látogatja meg a mintába került válaszolót, leül a válaszoló mellé, a konyhaasztalhoz vagy a nappali kanapéjára és kérdéseket tesz fel a válaszolónak197. Manapság már a telefonos interjúval készült kutatások aránya is visszaszorulóban van és egyre több kutatás használ online kérdőíves módszereket. Természetesen ezek az eltérő kommunikációs módszerek nagyban befolyásolják a kutatási dizájnt is, a személyes lekérdezéshez képest például a CATI rendszerrel dolgozó kérdezőbiztosoknak nagyobb a munkaterhelése, kevesebb időt töltenek el bizonyos dolgokkal: nem utaznak, nincsenek a területileg szétszórt kérdezőbiztosokkal koordinációs terhek, összességében kisebb költségek mellett. Két kérdés vizsgálata érdekes Groves szerint, az egyik az, hogy az adatgyűjtésnek van-e kimutatható hatása, ha minden egyéb eljárás megegyezik a kétféle lekérdezési mód esetében. A másik kérdés pedig, hogy a telefonos felvétel vajon ugyanarra az eredményre jut-e, mint a személyes felvétel, ha minden egyéb körülmény megegyezik. A második kérdés esetében önmagában a mód definiálásával együtt a kutató sok egyéb körülményt is rögzít illetve választ,
meghatározza
az
újra-felkeresési/visszahívási
szabályokat,
dönt
a
tréning
folyamatáról és a kérdezőbiztosokról. Az egyes adatfelvételi módok közötti különbség mérése azért is problematikus, mert ezek a módszerek minden más körülmény egyezősége mellett is más eredményeket tudnak produkálni, mert magában a kommunikáció módjában különböznek. Emellett a tapasztalt különbségek eredhetnek a két módszer közötti eltérő fedési, nem válaszolási, mintavételi és egyéb mérési hibákból is. 2.3.3.1 Az adatgyűjtés hatása Elsőként vizsgáljuk meg az első kérdést, mégpedig azt, hogy az adatgyűjtésnek van-e kimutatható hatása, ha minden egyéb eljárás megegyezik a két felvétel esetén. 197
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York
103
2.3.3.1.1 Preferált adatgyűjtési csatornák Vizsgáljuk meg elsőként, hogy a válaszolók milyen adatfelvételi (kommunikációs) formákat preferálnak. A National Academy of Science (Groves198) 1979-ben egy survey kutatás során megkérdezte erről a válaszolókat. 10. táblázat preferált személyes telefon levél egyéb összesen nem válaszolt interjúk száma
A kérdezés módjának preferenciája a kérdezés módja szerint NAS (személyes) 51% 7 30 12 100 14 fő 1187
Survey Research Center Survey Research Center (személyes) (telefon) 78% 23% 2 39 17 28 3 10 100 100 14 fő 69 fő 1437 1696
A válaszolók fele preferálta a személyes interjút, 30% a levélben történő adatfelvételt, 7% pedig a telefoninterjút. Groves és Kahn199 (1979) ugyanezt a kérdésfeltevést alkalmazta egy osztott mintás adatfelvételben, méghozzá úgy, hogy a minta fele személyes, a másik fele pedig telefonos módszerrel adott válaszokat. A személyesen lekérdezettek 78%-a a személyes lekérdezést részesítette előnyben, a telefonos kérdezés során a válaszolók 39%-a pedig a telefonos lekérdezést preferálta. A válaszolók azért preferálták a személyes lekérdezést, mert sokkal személyesebb és jobb válaszokat tudtak adni, másrészről a telefonost pedig azért preferálták, mert gyorsabb és könnyebb, nem kell a kérdezőt vendégül látni. Ez azt sugallja, hogy az alacsony motivációjú válaszolók inkább a telefonos lekérdezést preferálják. Stoop, (2004)200 kifejezetten a nem válaszolókat célzó kutatása során, a „nem válaszolóknak” lehetőséget adott arra, hogy kiválasszák azt a csatornát, amin keresztül szívesen megválaszolják a kérdéseket. A válaszolók 70%-a személyesen, 20%-a telefonon, 8%-a levélben, 1% pedig internet segítségével válaszolt. Groves és Kahn201 (1979) egy nagy kísérletben a főbb demográfiai csoportok mentén hasonlították össze a válaszolási módokat. Az egyik hipotézis a kognitív szintet vizsgálta, a 198
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 513.
199
Groves, R.M., and Kahn, R.L., Surveys by Telephone, New York, Academic Press, 1979.
200
Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; 23, Sage Publications
201
Groves, R.M., and Kahn, R.L., Surveys by Telephone, New York, Academic Press, 1979.
104
kognitív képességeket a képzettségi szinttel mérve. Eszerint a részvételben nem volt kimutatható interpretálható különbség az egyes adatgyűjtési módok és képzettségi szintek között. A második vizsgált hipotézisük szerint az idősebbeket jobban befolyásolja az adatgyűjtés módja, mint a fiatalabbakat. Néhány kutató azt gondolja, hogy e mögött a pszichológiai gyengülés vagy idősödés, ezzel összefüggésben a hallás gyengülése (és az ebből fakadó frusztráltság) áll, amely a telefonos kérdezés során félreértésekhez és válaszadási hibákhoz vezethet. Groves és Kahn ezt a hipotézist sem találta bizonyítottnak. Vegyük most sorra, hogy milyen dimenziók mentén várunk mérhető különbségeket a két adatfelvételi mód között. 2.3.3.1.2 A társas jelenlét hatása A telefonos illetve a személyes lekérdezések nagymértékben különböznek abban, hogy mekkora a csatornák kapacitása, továbbá abban, hogy mi az intimitás foka, amely meghatározza a beszélgetés minőségét és távolságát. Groves szerint a nem verbális üzenetek egy ilyen kommunikációban nagyon hatékonyan tudnak jeleket továbbítani, de alapvetően azért egy kérdőíves kutatás a verbalitásra épül. Ráadásul ezek a nem verbális jelek különbözhetnek szubkultúránként is, ezért a kérdezőbiztosokat is inkább arra készítik fel, hogy ne adjanak nonverbális jeleket a megkérdezett irányába. A személyes mód jobban hasonlít az interperszonális kommunikáció természetes módjához, de egyáltalán nem biztos, hogy ez növeli a válaszoló érdekeltségét a kérdőív kitöltésében. Sőt, a nonverbális jelek hiánya ösztönzőleg hathat olyan témák megválaszolásakor, amelyekben előfordulhatnak társadalmilag nem támogatott álláspontok is. Ezekben a szenzitív kérdésekben – így például a droghasználat, vagy a szexuális szokások témájában – kevesebb csatornán kaphat visszajelzést a válaszadó, ha nem a társadalmilag elfogadott választ adja. Több kutató egyetért abban, hogy a telefonon keresztüli kommunikáció során nagyobb a társadalmi távolság, mint a személyes kommunikáció esetén (részletesebben: Groves). Tény, hogy a telefon kevésbé személyes, mint a szemtől szembeni kérdezési helyzet, de ez nem biztos, hogy hátránya az interjúhelyzetnek. Mehrabian202 (1968) azt találta, hogy nem csak a médium fajtájától, hanem az elvégzendő feladat típusától is függ az intimitás foka. Állítása szerint felesleges túlságosan meghitt, bizalmas kapcsolatot kiépíteni a válaszolóval, ha nincs rá szükség a kérdezési helyzet szempontjából. 202
Mehrabian, A., Silent Messages, Belmont, Wadsworth, 1968.
105
A társas elvárás hatása nem egyértelmű, az azonban biztos, hogy nagymértékben függ a kérdés témájától. Groves és Kahn203 (1979) szerint viszont a telefonos válaszolók optimistábban fejezik ki magukat a gazdasággal és a saját életükkel kapcsolatban. Más esetben ugyanakkor nem találták megerősítettnek ezt a hipotézist. Colombotos
204
két vizsgálatban telefonos, illetve személyes interjú során nem talált ilyen jellegű összefüggést, Kormendi205 (1988) nem talált adatfelvételi módonkénti különbséget a házassági státuszban és egyéb szenzitív témákban. Sykes és Hoinville206 (1985) szintén nem fedeztek fel különbségeket az adatfelvétel módjában a szenzitív itemeken. Ugyanakkor a válaszok között a telefonos mintában több hiányzó adat keletkezett a jövedelemre vonatkozó kérdések kapcsán. Groves szerint a személyes kontaktus magasabb legitimációjából fakad a magasabb válaszolási arány. Ebben szerepet játszik, hogy a személyes lekérdezésben a kérdezőbiztosok általában „helyi” – vagy legalábbis közeli – lakosok, akik saját lakóhelyük környezetében vesznek fel interjúkat, ezzel ellentétben a telefonos adatfelvételek, CATI rendszerek esetében a kérdezőbiztosok a válaszolótól fizikailag is távol, egy központi helyen dolgoznak. 2.3.3.1.3 Kérdezés tempója és hossza Ennél is jobban érzékelhető és mérhető különbségek a két interjúmód között az interjú tempója és hossza. Több kutató összehasonlította a telefonos interjúk és a személyes lekérdezések idejét percben. Groves207 kutatásában ugyanolyan kérdésblokkal a személyes lekérdezés esetén az interjú átlagos hossza 13,7 perc, a telefonos lekérdezés esetén pedig 11,8 perc volt, de hasonlóképpen Kormendi208 (1988) egy dán kísérletről beszámoló tanulmányában 36,5 perc volt a személyes, 32,1 perc a telefonos lekérdezés átlagos ideje. Groves szerint maga a csatorna sajátossága, hogy gyorsabb az interjú tempója, a telefonos interakció „nem bírja el a nagy hallgatásokat”. A felgyorsult tempó úgy tűnik, hogy nem okoz 203
Groves, R.M., and Kahn, R.L., Surveys by Telephone, New York, Academic Press, 1979.
204
Colombotos, J., “The Effects of Personal vs. Telephone Interviews on Socially Acceptable Responses,” Public Opinion Quarterly, Vol. 29, No. 3, Fall, 1965, pp. 457-458. 205
Kormendi, E., “The Quality of Income in Telephone and Face to Face Surveys,” in R.M., Groves et al. (Eds.) Telephone Survey Methodology, New York, John Wiley & Sons, 1988. 206
Sykes, W., and Hoinville, G., Telephone Interviewing on a Survey of Social Attitudes: A Comparison With Face-to-face Procedures, London, Social and Community Planning Research, 1985. 207
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 523.
208
Kormendi, E., “The Quality of Income in Telephone and Face to Face Surveys,” in R.M., Groves et al. (Eds.) Telephone Survey Methodology, New York, John Wiley & Sons, 1988.
106
a mérési folyamatban hibát, elvileg akár felületes válaszokat is eredményezhetne, de ezt az eredmények nem támasztották alá. Általában elmondható, hogy a telefonos kérdőív kérdéseinek rövidebbnek és érthetőbbnek kell lennie, mert összességében kevesebb figyelmet várunk el a kérdezettől. 2.3.3.1.4 Kérdéstípusok Nem minden kérdéstípus alkalmazható telefonos megkeresések esetében, vannak bizonyos kérdezéstechnikai korlátai a személyes lekérdezésekhez képest a telefonos módszereknek209. Így például a vizuális méréssel kapcsolatos információk elvesznek a telefonos kutatásokban, így például nem lehet vizuális eszközökkel támogatni a válaszolási folyamatot, például válaszlapokat nem lehet alkalmazni. Léteznek olyan – akár sztenderdnek mondható – kérdések is, amelyek esetén a kérdezőbiztosnak vizuális megfigyelésre van szükség, így például a kérdezőbiztos feladata a lakás állapotának megítélése. Ezek a vizuális ingerek telefonos kérdezés esetén ugyan elvesznek, de azt is látni kell, hogy ezek a vizuális ingerek mérési hibájukkal és torzításukkal együtt vesznek el, így például a kérdezőbiztos nemzeti/etnikai hovatartozása (rassza) is jelentőségét veszti. Történtek azért próbálkozások a személyes kérdezésben igen, telefonos kérdezésben azonban nehezen alkalmazható kérdések adaptálására, jó példa erre a jövedelmi kategóriák szekvenciális kérdezése. A jövedelmi kérdésre adott válaszokat a személyes interjúhelyzetben 10-20 jövedelmi kategóriára osztják, amit válaszolói lapon mutatnak meg, a telefonban azonban erre nincs lehetőség. Az eltérő kérdezés okozta különbség csökkentésének egyik módja az, hogy a telefonos kérdezés során a jövedelmet több kérdéssel, a kategóriák alsó vagy felső vége felől indítva folyamatosan, szekvenciálisan kérdezik, míg el nem érik azt a jövedelmi szinten, ahova már beleesik a válaszoló jövedelme. Locander és Burton210 (1976), egy osztott mintás felvételben három módon kérdezték a válaszoló jövedelmi szintjét. Elsőként a legfelső kategóriától kezdték a kérdezést: „Kevesebb, mint 25.000 USD?”, majd, addig lépkedtek vissza a jövedelmi szintek között, míg azt nem mondta a válaszoló, hogy az adott szintnél nem kevesebb a jövedelme. A másik módszer szerint a legalsó jövedelmi szinttől kezdtek felfele lépkedni, „Több, mint 5000 USD?”, egészen addig lépkedtek, míg a válaszoló aztán nem mondta, hogy az adott szintnél nem több a jövedelme. A harmadik 209
Robert M. Groves: Survey errors and survey costs, John Wiley and Sons, 1989. New York, pp. 520.
210
Locander, W.B., and Burton, J.P., “The Effect of Question Form on Gathering Income Data By Telephone,” Journal of Marketing Research, Vol. 13, 1976, pp. 189-192.
107
kérdezési módszer esetében pedig a jövedelmi skála középpontjának kijelölése után (15000 USD) megkérdezik a válaszadótól, hogy ennél több vagy kevesebb a jövedelme. 11. táblázat
A családok jövedelmi arányai a kérdezés módja és a kérdés formája szerint211 telefon emelkedő sorrend 9,3
telefon csökkenő sorrend 22,7
telefon középen kezdő 8,1
5000-9999
13,6
21,4
18,0
20,3
10000-14999
23,4
19,1
17,6
19,2
15000-24999
28,5
25,0
28,8
25,3
25000 vagy több
25,2
11,9
27,5
19,2
13,5%
11,4%
18,1%
8,9%
428
388
295
18680
jövedelmi kategóriák kevesebb, mint 5000
hiányzó adat az összes interjú arányában összes interjú
személyes 16,2
Ezek alapján elmondható, hogy a válaszok meglehetősen különböznek egymástól és két kérdezési mód a háromból a magasabb jövedelmi szinttel rendelkezőket becsli felül. Hogy melyik a legjobb, ezt nem lehet egyértelműen megmondani, az egyetlen, amihez lehet hasonlítani, az a személyes lekérdezés eredménye, amelyhez a csökkenő kérdezési technika van legközelebb. A torzítások egyik oka lehet azonban, hogy a telefonos kísérletben használt kérdezési technikák esetében fellép az úgynevezett „igen effektus”. Ennek lényege, hogy a válaszolók sokkal szívesebben mondanak az adott kérdésre igen, mint nemet, ez a preferencia pedig nagy mértékben eltérítheti a jövedelmek eloszlását a személyes kérdezési mód esetén használt kérdéssel szemben. Ha a tényeket összegezzük, akkor megállapítható, hogy nagyon kevés dologban különböznek egymástól, azaz nem számottevő a két módszer közötti eltérés. Azt mondhatjuk, hogy ha populációs átlagot vagy arányt veszünk, akkor ugyanarra a következtetésre juthatunk a két módszer alapján (Groves és Kahn 1979212). Általánosságban megállapítható, hogy az adatfelvételi módnak nincs hatása az egész mintát vizsgálva, de az elképzelhető, hogy vannak a populációnak olyan alcsoportjai, ahol vannak különbségek a két módszer között.
211
Locander, W.B., and Burton, J.P., “The Effect of Question Form on Gathering Income Data By Telephone,” Journal of Marketing Research, Vol. 13, 1976, pp. 189-192. 212
Groves, R.M., and Kahn, R.L., Surveys by Telephone, New York, Academic Press, 1979.
108
2.3.3.2 Adatfelvételi módszerek eredményeinek összehasonlítása Groves másik fontos kérdése az adatfelvétel hatásával kapcsolatban úgy hangzott, hogy a telefonos felvétel vajon ugyanarra az eredményre jut-e, mint a személyes felvétel, ha minden egyéb körülmény megegyezik. A módszerek közötti eltérések két dimenzió mentén értelmezhetőek. A kutatásmódszertani megközelítés szerint az a kérdésfeltevés világítja meg a módszerek közötti eltéréseket, amelyek megegyező populációban vizsgálja az egyes felvételi módszerekben mutatkozó különbségeket. Gyakorlati oldalról megjelenik kérdésként, hogy vajon átgondolt mintavételi terv és kutatási dizájn mellett van-e eltérés az eredményekben még akkor is, ha más a populáció. Ennek hátterében természetesen az a praktikus kérdés bújik meg, hogy kiválthatók-e ezek a módszerek egymással, mert a költségigényük eltérő. A következőkben ismertetünk egy esettanulmányt, amely hasznos adalékul szolgálhat az adatfelvételi módszerek közötti különbségek feltáráshoz. Az esettanulmányban kísérletet teszünk három adatfelvételi módszer – a személyes (CAPI), a telefonos (CATI) és az online (CAWI) módszer – és eredményeik összehasonlító elemzésére. A kutatási projekt adatbázisában nincsenek olyan lehetséges kapcsolódó változók, amelyek mentén a mintákban az egymásnak megfeleltethető alcsoportokat külön lehetne vizsgálni.213, ezért inkább gyengébb bizonyító értékű, de érdekes adalékkal és aspektussal szolgálhat a módszerek közötti eltérések vizsgálatában. 2.3.3.2.1 A kutatási projekt A gyakorlati életben a kutatói oldalon komoly kérdésként merült fel, hogy vajon az online kutatások számtalan hangoztatott előnye mit is jelent a valóságban, és hogy kezelhető mértékűek és jellegűek-e az adatfelvétel során tapasztalt hátrányok. Jóllehet egyre több esettanulmányban mutatnak be online kutatási módszerekkel végzett kutatást vagy „innovatív” online kutatási módszereket, kevés az olyan elemzés, amely egyazon kutatás keretei között veti egybe a hagyományos módszereket az online módszerekkel. Legtöbbször ezek az összehasonlító jellegű elemzések nem lakossági adatfelvételeket elemeznek, hanem valamilyen speciális – például vállalati – kutatási projektekkel foglalkoznak, és az így szerzett tapasztalatok nem minden esetben általánosíthatók a lakossági adatfelvételekre. 213
Máth András – Pillók Péter: Miben más? Eredmények és eltérések személyes- , telefonos- és online kutatás esetén, kézirat, 2010
109
Alkalmunk nyílt a Ringier Kiadó Kft. piackutatásán részt venni egy olyan projektben, amelyik a három felvételi formát hasonlítja össze gyakorlati és módszertani szempontok szerint. A kutatás egy napilap piackutatásával volt kapcsolatos: célja az volt, hogy megismerje, mérje a hazai lakosságnak a Blikk 2007. március 26-tól indult imázs kampányára214 adott reakcióit, tetszését. A kutatás fő kérdései a következők voltak: hányan látták a kampányt, tetszett-e nekik, mit gondolnak róla, illetve a Blikkről. A három kérdőív kérdéseket tartalmazott egyrészt – a célcsoportok kialakításhoz – az újságolvasási szokásokról.
Külön
kérdésblokk
vizsgálta
általában
véve
az
egyes
újságok
reklámpercepcióját, valamint természetesen hangsúlyos elem volt a Blikk reklámokkal kapcsolatos – spontán és segített – ismeret, felidézés és értékelés. A kérdőívben szerepeltek még a Blikk napilappal kapcsolatos attitűdök, és szociodemográfiai kérdések is. Az online adatfelvétel az NRC Kft. nagyjából 60.000 fős online access paneljén215 futott, a személyes megkérdezést a Taylor Nelson Sofres Hungary Kft. készítette, a telefonos adatfelvételt pedig az Első Pesti Telefontársaság Nyrt. végezte. Az adatfelvételek mintanagysága a CATI és a CAWI esetében is 1000 fő, a CAPI esetében a kitűzött mintanagyság szintén 1000 fő volt, de végül az elemzés 985 sikeres interjú alapján készült el. Az egyes adatfelvételek mintái különböző eljárásokkal készültek. A telefonos mintát nem, korcsoport, településnagyság-kategória és megye szerinti kvóták alapján töltötték fel. Az online adatfelvétel mintája access panelből származott, amely minta súlyozás után marginális eloszlásaiban megegyezik a legalább heti gyakorisággal internetező 18-69 éves lakosság korcsoport-, nem-, településtípus-, végzettség-, illetve internetezés helye szerinti eloszlásaival. A CAPI adatfelvétel során véletlen sétás mintavételi technikát alkalmaztak, majd nem, életkor, iskolai végzettség, településtípus és régió szerinti súlyozták az adatokat. A három különböző módszerrel indított adatfelvétel során igyekeztünk minden döntő körülményt a lehető legteljesebb mértékben hasonlóan kezelni, így például a három
214
A kampány a Blikk megkülönböztető értékeire, a szókimondásra, bátorságra, pártatlanságra épít. A kampány fő üzenete szerint a Blikk felvállalja, hogy megmutatja mindenkinek és mindennek az "igazi arcát", őszinte, szókimondó társa lesz az olvasóknak, segít eligazodni a világ dolgaiban. A szlogen: Egy őszinte világban nem lenne ránk szükség. Blikk. Vége a képmutatásnak. 215
Az online panelek két fajtáját különböztethetjük meg. Az úgynevezett „access panel” fogalma kissé eltér a megszokott panel fogalomtól: az online panelek egy olyan fajtája, amelyek egy viszonylag nagyméretű – gyakran több tízezres – válaszadói körrel rendelkezik, amelynek tagjaiból különböző szempontok szerint potenciális válaszadói köröket meghatároznak és több-kevesebb gyakorisággal kutatják a legkülönbözőbb témákban. Ebben az esetben tehát a panel szó nem egy longitudinális felmérések módszerét jelenti, hanem a válaszolók előzetes szűrésére vonatkozik, akiket ad hoc kutatásokra invitálnak.
110
kérdőívben megegyezett a kérdések sorrendje, valamint a kérdések megfogalmazása 216 is. Természetesen a különböző adatfelvételi módszerek más és más körülményeket, illetve kérdezéstechnikai támogatást tudtak biztosítani a lekérdezés folyamatának. Az egyes adatfelvételek során a reklámok felidézését segítettük a reklámok egyes részleteinek bemutatásával. A CATI adatfelvételben vizuális ingeranyagot nem tudtunk bemutatni a kérdezéstechnikai korlátok miatt, csak a reklámok szlogene hangzott el, a CAWI és a CAPI kérdezés során azonban volt lehetőség arra, hogy a TV reklámspotokat (állóképként) és az újságban illetve hirdetőtáblákon megjelent hirdetéseket lássa a válaszoló. A kutatási költségeket – a konkrét összeg említése nélkül – a legolcsóbb módszer arányaiban fejezzük ki. A három adatfelvételi technika közül a legkevésbé költséges az online adatfelvétel volt (100), nagyságrendileg 50%-al több költséggel járt a telefonos adatfelvétel (összköltsége 150%) és 150%-al többe került a személyes adatfelvétel (összköltsége 250%). 2.3.3.2.2 A súlyozatlan minta összetétele A súlyozatlan minta vizsgálata közelebb visz minket ahhoz, hogy megismerjük az egyes adatfelvételi módszerekben rejlő „torzítási” hatásokat. A kutatás célcsoportja a 18 éves és idősebb magyarországi lakosság volt. A CAPI esetében a teljes 18 évnél idősebb lakónépesség tekinthető mintavételi keretnek, ez nagyjából 8,1 millió fő. Az internet eléréssel (bárhol) rendelkezők – a 2007. első félévi Nemzeti Média Analízis adatai szerint – a 18 éven felüli lakosság 43%-át, a vezetékes telefonnal rendelkezők a lakosság 51%-át, a mobiltelefonnal rendelkezők pedig 70%-át teszik ki. A súlyozatlan minta összetételének vizsgálatakor a nemek arányát legközelebb a népességben elvárt lakossági arányokhoz a CAWI esetében találtuk (50%-50%)217, a személyes és a telefonos adatfelvételek esetében nőtöbbletet tapasztalunk: a válaszolók súlyozatlan mintájának 60%-a nő (CATI:60%, CAPI:62%). Az életkor vizsgálata már jobban utal az egyes módszerek válaszolói csoportjainak jellegzetességeire. A személyes adatfelvételben inkább az idősebb korcsoportok – különösen a 60 évnél idősebbek – felülreprezentáltak, és a vártnál kisebb arányban képviseltetik magukat a legfiatalabbak. Hasonló összetételt figyelhetünk meg a telefonos adatfelvétel mintájában 216
Természetesen a módszerek adta keretek között feleltethetőek meg egymásnak szövegileg a kérdőívek, azaz némely esetben más megfogalmazásra volt szükség a személyes, az online (önkitöltő) és a telefonos kérdőív esetében. 217
A hetente internetezők között ez az arány némiképpen a férfiak javára billen: 51% férfi, 49% nő.
111
annyi különbséggel, hogy a legfiatalabbak és a legidősebbek aránya is kisebb a súlyozatlan mintában. Az online adatfelvétel súlyozatlan mintája nagymértékben különbözik a két előző módszer mintájától: a fiatalok – különösen a legfiatalabbak – aránya megduplázódott, ugyanakkor az idősebb – különösen a legidősebb – korcsoportok aránya tizedére csökkent. Ha azonban az online adatfelvétel korösszetételét hasonlítjuk össze a legalább hetente internetezők korcsoportmegoszlásával, már jóval kisebb eltéréseket tapasztalunk: a CAWI súlyozatlan mintájában a vártnál valamivel kevesebb a 29 évnél fiatalabb és valamivel több a 30-39 éves, de a korcsoportos arányok a két vizsgált adatsor esetében nagyjából megegyeznek. 18. ábra Életkori csoportok az egyes súlyozatlan mintákban és az alapsokaságokban 18-29 éves CAPI
17%
CAWI
CATI
népesség 18+
30-39 éves 16%
15%
hetente internetezők
35%
29%
20%
17%
17%
20%
60 éves vagy idősebb
18%
18%
40%
50%
25%
18% 60%
3%
30%
17%
23% 30%
12%
17%
16%
41% 10%
50-59 éves
14%
38%
21%
0%
40-49 éves
70%
14% 80%
90%
4% 100%
A válaszolók átlagéletkora a személyes adatfelvétel esetében 45 év, az online felvétel esetében 35 év, de a legidősebbek átlagosan a telefon lekérdezettek, az átlagéletkoruk 48 év. A válaszolók településtípusainak vizsgálatakor a két szélsőérték alapján tudjuk jól jellemezni az egyes adatfelvételeket. A telefonos és az online adatfelvételek preferálják a budapestieket: a személyes lekérdezés esetében a budapestiek aránya 16%, a telefonos és az online esetében a budapestiek súlyozatlan mintaaránya 30%. A CAWI esetében a budapesti mintatöbblet a községekben élők arányának erősebb csökkenését hozta a másik két mintában tapasztalt arányokhoz képest. A válaszolók gazdasági aktivitása kapcsán két jellegzetes eltérést kell kiemelnünk. Egyrészt meg kell említeni a nyugdíjasok alacsony arányát az online mintában, ugyanakkor a 112
telefonos és a személyes adatfelvétel mintájában arányuk felülreprezentált olyannyira, hogy a személyes adatfelvétel esetében még a másik kiemelendő csoport, az aktív keresők arányát is meghaladják. Az aktív keresők aránya ugyanakkor az online felvétel esetében kimagasló, a CAWI súlyozatlan mintában a heti internetezőkhöz képest is felülreprezentáltak. 19. ábra A nyugdíjasok és az aktív keresők aránya az egyes súlyozatlan mintákban és az alapsokaságokban CAPI CAWI CATI népesség 18+ heti internetezők
44% 7%
Nyugdíjas
33% 33% 7% 41%
69%
Aktív kereső
57% 43% 59%
0%
20%
40%
60%
A válaszoló befejezett iskolai végzettsége szerinti mintastruktúra egymástól eltérő képet mutat gyakorlatilag mindhárom adatfelvételi módszer esetében. Az online minta a legképzettebb – még az internetezőkhöz képest is – a befejezett iskolai végzettség szerint, a személyes adatfelvétel mintája pedig a legkevésbé iskolázott. 20. ábra Befejezett iskolai végzettség az egyes súlyozatlan mintákban és az alapsokaságokban
Maximum 8 általános
CAPI
Szakmunkásképző
33%
CAWI 2% CATI
28%
12% 11%
19% 0%
30%
9%
42%
31%
21% 14%
20%
NT/NV
39%
38%
heti internetezők
Főiskola, egyetem
48% 16%
népesség 18+
Érettségi
28%
13%
41% 40%
0,5%
26% 60%
80%
100%
A CAPI adatfelvétel esetében legtöbben (legfeljebb) 8 általános iskolai végzettséggel rendelkeznek, a CAWI esetében pedig az érettségivel rendelkezők a legnépesebb csoport az
113
iskolai végzettség szerint. A telefonos adatfelvétel arányaiban inkább az online adatfelvételhez hasonlít. Összefoglalóan elmondható, hogy a három eszköz jelentősen más célcsoportok hatékony elérését biztosítja, hiszen az online megoldás a fiatalabb, képzettebb csoportok esetén adekvát, míg a személyes inkább a teljes népességre vonatkozó adatok esetén jó megoldás. Meglepetés volt számunkra a telefonos eszköz „elöregedése” – ami leginkább abból fakadhat, hogy az adatfelvételek vezetékes vonalakat alkalmaznak. Az egyes eszközök által elért különböző mintakeret és összetétel az egyik oka annak, hogy érdemes a három adatfelvételi technika hibrid alkalmazásában gondolkodni. 2.3.3.2.3 Adatfelvételi időszak Az adatfelvételek terepmunkájának pontos időzítése jól nyomon követhető az interjú elkészülésének napja alapján. Az online kutatás terepmunkája mindösszesen két napot vett igénybe, a telefonos terepmunka sem volt túlságosan hosszabb, mindösszesen az interjúk 3%a „csúszott át” a terepmunka harmadik napjára. A CAPI adatfelvétel esetében azonban 16 napig készültek a terepen a kérdőív interjúk két aktívabb időszakkal. 21. ábra A három módszer kész interjúi felvételének napja az adott módszer mintájának arányában CAWI
CATI
április 20. péntek
CAPI
0%
április 21. szombat
3%
április 22. vasárnap
5%
április 23. hétfő
42%
67%
április 24. kedd április 25. szerda
6%
58%
30%
14% 12%
3%
április 26. csütörtök
5%
április 27. péntek
1%
április 28. szombat
1%
április 29. vasárnap
4%
április 30. hétfő
6%
május 1. kedd
10%
május 2. szerda
11%
május 3. csütörtök
10%
május 4. péntek
7%
május 5. szombat
5% 0%
10% 20% 30% 40% 50% 60% 70%
0%
10%
20%
114
30%
40%
50%
60%
70% 0%
10% 20% 30% 40% 50% 60% 70%
Az online kutatások egyik sokat hangoztatott előnye, hogy a hét minden napján, minden időpontban rendelkezésre állnak (7/24), azaz a válaszoló a neki legmegfelelőbb időpontban tudja kitölteni a kérdőívet. Az interjú befejezésének időpontját vizsgálva azt láthatjuk, hogy az online adatfelvétel esetében a megkérdezettek nagy része élt is a másik két adatfelvételhez képest extrém kitöltési időpont lehetőségével: este 20 óra után és reggel 8 óra előtt összesen az interjúk 36%-a készült el az online mintában. A telefonos megkeresésekre legtöbben délben és kora délután válaszoltak, a személyes megkeresések pedig a kora esti órákban találták meg a legtöbb válaszadót. Ez a tapasztalat fontos szempont lehet a későbbiekben a kérdőív kialakítása szempontjából is (szórakoztatás). Kiemelt szempont a kutatói oldalról, hogy milyen a teljes projekt időzítése, azaz a kialakított kérdőívből összességében milyen gyorsan kaphat tisztított adatfájlt a kutatás majdani elemzője. Természetesen egy kutatási projekt hosszát alapvetően a terepmunka ideje determinálja, de a többi munkafázis – ellenőrzés, adattisztítás, rögzítés – időigénye szintén nagy lehet. Az adatfelvétel ideje szempontjából a leggyorsabb adatfelvételi módszer a CAWI volt: összességében négy nap telt el a kérdőív átadása és az adatfájl megérkezése között. A CATI adatfelvétel esetében ez hét napot, a CAPI adatfelvételnél pedig összesen 20 napot vett igénybe. Mivel mindhárom módszernél számítógéppel támogatott adatfelvétel került alkalmazásra, ez az oka annak, hogy a személyes adatfelvétel lezárását követő három nappal már rendelkezésre állt teljes eredmény – papíralapú megkérdezésnél ez további hat-nyolc munkanapot eredményezhet a kész adatbázis elkészültéig. Fontos azonban, hogy az adatfelvétel gyorsasága csak egy bizonyos fokig lehet előny, mert a minta struktúrájának torzulásához vezethet. A CAWI kutatási műveletek gyorsulásával párhuzamosan Schaefer és Dillman szerint csökken a válaszadóktól elvárt válaszolási idő is.218Tapasztalataik szerint abban az esetben, ha rövid idő áll rendelkezésre a válaszolásra, vannak olyan válaszadói csoportok, akiknek egyszerűen nincs ideje válaszolni. Egy konkrét kísérleti elrendezésben Wydra és Davies vizsgálták az online adatfelvétel hosszúságának hatását.219Az összes válaszolót felosztották annak függvényében, hogy mikor válaszolt a kérdőívre a meghívástól számítva (1-2 nap, 3-4 nap, illetve 5 napnál később válaszolók). Az egyes válaszadói csoportok válaszai között a korreláció általában 0,9 körül mozgott. A csoportok összetétele kapcsán megállapították, hogy a korai válaszolóknak kevesebb 218
Schaefer - Dillman: Development of a Standard E-Mail Methodology: Results of an Experiment
219
Wydra - Davies: An examination of online sampling techniques
115
gyermekük van, általában idősebbek, és kevesebb közöttük az alkalmazott, mint a később válaszolók között. Természetesen a korai kitöltők vagy gyakrabban használják az internetet, vagy több szabadidővel rendelkeznek a kérdőív kitöltésére. 2.3.3.2.4 Válaszmegtagadás A CATI adatfelvétel során véletlen-szám tárcsázást alkalmaztak (RDD), amely során összesen nagyságrendileg 7500 telefonszámot hívtak fel. Ezek közül a számok közül összesen megközelítőleg 3400 kapcsolatfelvétel történt, azaz az RDD segítségével tárcsázott számok 55%-ánál nem volt még kapcsolatfelvétel sem (nem veszik fel, nincs előfizető stb.). a felhívott számok és elkészült interjúk aránya (13%) átlagosnak mondható, hasonló (14%) arányról számol be Deutschmann és Faulbaum220 is, akik németországi CATI adatfelvételük mintáját véletlen szám tárcsázás segítségével vették. Ők összesen 14300 telefonszámot hívtak és összesen 2026 kérdőív interjút készítettek a németországi magánháztartásban élő 16 évnél idősebb lakosok között. Ha a CATI esetében is – ahogy a másik két módszer esetében – vizsgáljuk a kész interjúk és a létrejövő kontaktusok arányát, akkor azt találjuk, hogy 3400 kontaktusból készült el az 1000 interjú, azaz a válaszolási arány 29%-os. A CAWI esetében a válaszolási arány 20%-os, tehát több kontaktus kellett az 1000 fős mintanagyság eléréséhez, mint a CATI esetében. A CAPI esetében találjuk a legkedvezőbb válaszadási arányt, amely 50%-os, azaz minden második kontaktusból kész interjú várható. Nagymértékben árnyalhatjuk a kialakult sorrendet, ha figyelembe vesszük az egyes módszerek esetében a kontaktusok költségét. Ez a költség az online felvétel esetében nagyjából konstans, amelyből két dolog biztosan következik a költségeket illetően: a kapcsolatteremtés teljes költsége független a kontaktusok számától, és egy újabb kontaktus létrehozásának (egy email kiküldése) fajlagos költsége közelít a nullához. A CATI és a CAPI esetében azonban azt tapasztaljuk, hogy minden egyes újabb vagy pótlólagos kontaktus addicionális anyagi és időbeli ráfordítást eredményez.
220
Deutschmann M, Faulbaum F. 2001. The recruitment of online samples by CATI-screening: problems of nonresponse. Paper presented at conference of the Association for Survey Computing (The Challenge of the Internet). May 2001, London, England.
116
22. ábra A három módszer válaszolási arányszáma
2.3.3.2.5 Részleges válaszmegtagadás Az adatfelvételek adatminőségét többféleképpen vizsgáltuk. Az egyes adatfelvételeket elsőként a hiányzó értékek jellemző eloszlásával szeretnénk jellemezni, a hiányzó értékeket három különböző típusú változó-készleten összesítve vizsgáltuk mindhárom adatfelvételi módszer esetében. 23. ábra Hiányzó értékek átlagos száma egyes változó-szetteken CATI
CAWI
CAPI
3,00
2,50 2,50
2,00
1,79
1,50
1,33
1,00
0,50
0,02
0,01
0,00
0,00
demográfiai kérdések
0,02
0,04
0,13
olvasási szokások
117
attitűdkérdések
Az adatelemzés szempontjából mindenképpen negatív momentum, ha hiányoznak bizonyos válaszolóknál bizonyos kérdésekre adott válaszok, de adathiány és adathiány között nagy különbség lehet attól függően, hogy milyen típusú kérdésnél tapasztaljuk és persze az is fontos, hogy milyen a nem válaszolás mintázata. Az adathiány szempontjából leginkább kritikus változókészlet a demográfiai kérdések, azonban tapasztalataink szerint egyik adatfelvételi módszer sem hagyott cserben a demográfiai kérdések teljessége esetében. Ez leginkább az online (önkitöltős) adatfelvételnél jelenhet meg, de mivel itt a mintába csak a teljesen kitöltött válaszadók eredményei kerülnek be, így nem meglepő az eredmény. A CAWI adatfelvétel esetében meg kell jegyeznünk, hogy panelen folyt az adatfelvétel, amely esetében a demográfiai kérdések legnagyobb részét, már egy korábbi adatfelvétel során rögzítették. A kutatások eredeti témájának szempontjából hasonlóan magas prioritással rendelkező változókészlet az olvasási szokások vizsgálata volt, amely esetében a hiányzó értékek száma már a CAPI esetében megnő, de mindenképpen kezelhető mértékű marad. Az attitűdkérdések esetében megállapítható, hogy a személyes megkérdezés hozta a legtöbb hiányzó értéket, a 8 kérdésből átlagosan 2,5 kérdésre nem regisztráltak értékelhető választ a kérdezőbiztosok, a legkevesebb hiányzó választ az online adatfelvétel során tapasztaltuk. Az adatminőség további indikátorának tekintettük a nyitott kérdésekre való válaszadási kedvet is. Ennek két elemét vizsgáltuk, egyrészt a válaszadási hajlandóságot, másrészt a kérdésre adott érdemi válaszok hosszát. A három adatfelvételben összehasonlítható módon két különböző nyitott kérdés szerepelt, amelyek alapján az átlagos válaszadási hajlandóság a telefonos adatfelvétel esetében volt a legalacsonyabb, a válaszolók összesen 11%-a, az online adatfelvétel esetében 14,5%-uk, a személyes megkérdezés esetében pedig a válaszolók 17,5%-a válaszolt érdemben a nyitott kérdésekre.
118
24. ábra Az érdemi válaszok hosszúsága karakterben (a „nem tudom”, „nem tudja”, „nem emlékszem”, stb. válaszok nélkül)
CATI 70 65
CAWI
CAPI
60,98
60 55 50 45 40 35 30
44,74
30,75
33,46 28,34
25,17
25 20 15 10 5 0
Milyen elemet emelne ki a reklámból?
Mire emlékszik az adott hirdetésből?
Az érdemi válaszok hossza alapján már más sorrendet tapasztalunk. A három adatfelvételi mód közül leghosszabban a CAWI interjúalanyok válaszoltak mindkét nyitott kérdésre, főleg a második kérdés esetén szembetűnő a különbség. Összességében a személyes válaszolók, majd a telefonon megkeresettek a sorrend a válaszok hossza alapján. Comley221 egy innovatív módszertani kísérlet során az általunk tapasztalttal megegyező válaszadási mintázatot talált a CATI és a CAWI módszert összevetve. 12. táblázat
Nyitott kérdésre adott válaszok átlagos hossza szavakban Comley adatfelvételei során módszer CAWI CATI
Q13 18,21 10,19
Q13A 4,94 5,4
Q21 12,03 7,05
Q21A Q30 3,53 12,05 3,53 12,05
Az eredményei alapján elmondható, hogy az online adatfelvétel során összességében átlagosan hosszabb szabadszavas válaszok születtek, mint a telefonos adatfelvétel során.
221
www.humanvoice.com
119
25. ábra A nyitott kérdésekre adott válaszok átlagos hosszúsága a különböző adatfelvételekben a Blikk kutatásban és Comley adatfelvételeiben (CATI kutatás=100%) CATI
CAWI
CAPI
156%
160% 140%
133% 125%
120% 100%
100%
100%
80% 60% 40% 20% 0% Blikk kutatás
Comley adatfelvételei
Az adatfelvételek során a nyitott kérdésekre adott átlagos válaszhosszúságokat egymáshoz viszonyítva megállapítható, hogy a CAWI válaszadói jóval hosszabb érdemi válaszokat adtak: a CATI adatfelvétel során tapasztalt átlagos válaszhosszúságot alapul véve a CAWI válaszai 33%-al hosszabbak Comley adatfelvételeiben, 56%-al hosszabbak a Blikk kutatás esetében. A nyitott kérdésekre adott szabadszavas válaszok esetében a tapasztalt eltérés egyik oka lehet a kérdezőbiztosi jelenlét is. A CATI vagy CAPI módszer esetében a kérdezőbiztos – akaratlanul is – tömörítheti és akár át is fogalmazhatja a válaszoló mondanivalóját, amikor lejegyzi a választ a kérdőívbe. Az adatminőség egyik jellemzőjének tekintettük a skálás kérdések szélsőértékvizsgálatát. A szélsőértékek minél magasabb aránya a válaszok között gyakorlati elvárás elemzéstechnikai szempontból, mert ez fejezi ki legjobban a „válaszok középre húzásának” mértékét, amikor is a legtöbb válaszadó a páratlan skála közepén csoportosul. Ismert gyakorlati probléma, hogy a középre húzó eloszlású attitűdskála kérdéssort jóval nehezebb értelmezni és az egész attitűdskálát összefüggéseiben kezelni. A gyakori középre húzás takarhat válaszálcázást, de interpretálhatjuk úgy is, hogy a válaszoló nem mutat érdeklődést 120
vagy kompetenciát a kérdésben való határozott állásfoglalásra, nem involvált a kérdésben, csak a kérdezési helyzetnek megfelelve válaszol „se nem jót, se nem rosszat”. Ebből a szempontból megállapíthatjuk, hogy a legnagyobb arányú a középre húzás a személyes lekérdezésben, ahol mindkét esetben legalább 76% és a szélsőértékek két pólusának aránya is megegyezik és állandó. 26. ábra Extrém értékek - 5 fokú skála összevont értékei egyes kérdéssorokon, összesen, átlagosan alsó érték (1) CATI
5%
23% 76%
18%
CATI
0%
17% 66%
12%
CAPI
12%
64%
24%
CAWI
40%
Blikk attitűdök
10%
77% 20%
Mennyire tetszenek a bemutatott reklámok, mennyire illik a Blikkhez?
24%
67%
12%
CAPI
felső érték (5)
71%
11%
CAWI
középértékek (2-3-4)
12% 60%
80%
100%
Az online felvétel esetében is közel azonos – és a három módszer közül a legkisebb – a két kérdéssor esetében tapasztalt átlagos középérték arány (~66%), a CATI esetében pedig csak annyi állapítható meg bizonyosan, hogy ennél a módszernél válaszolták a legnagyobb arányban a felső értéket (5) mindkét vizsgált kérdéssoron. Másik oldalról ugyanakkor egy átgondoltan szerkesztett skálasor esetében az egyoldalúan magas szélsőértékekkel rendelkező mintázatok magas aránya (mondjuk 5 fokú skála esetében a csak 1-es vagy csak 5-os kitöltői sorozatok) gyanút kell, hogy ébresszen a skála jól szerkesztettségét és/vagy a terepmunka gondos kivitelezését illetően. A CAWI kérdőívek esetében az önkitöltő-jellegből és az online kérdőív vizuális megjelenéséből fakadóan hasonló sorozatokat eredményezhet az a kevésbé motivált válaszadó is, aki egy kérdésmátrixban a kérdések értelmezése nélkül az egymás alatti válaszokat jelöli meg a mihamarabbi befejezés reményében (ezek lehetnek, mondjuk mind középértékek).
121
27. ábra Két lehetséges kitöltési sorozat mintázat CAWI kérdőív esetében színekkel jelölve az online kérdőív képernyőrészletén
Megvizsgáltuk tehát az egyes adatfelvételekben található attitűdskála válaszmintázatai között a sorozatok hosszát is. Az említett sajátosságok miatt az összehasonlítás eredményeképpen azt vártuk, hogy az online adatfelvételben lesznek legnagyobb arányban azok, akik a nyolc skálakérdés közül több egymás alatti sorozatot jelöltek. 28. ábra Megegyező értékek száma a nyolc item-ből álló attitűdskálára adott válaszokban, az egyes adatfelvételekben
8
CAPI
CAWI
7
5% 2%
4% 2%
CATI 2% 3%
0%
9%
6
12%
9%
8%
5
21%
17%
15%
20%
rövidebb sorozatok
4
51,0%
25%
43,0%
23%
48,0%
40%
60%
122
80%
100%
Az eredmények ezt az elvárást csak részben támasztották alá: a legalább hat megegyező választ adók aránya – kis eltéréssel – gyakorlatilag megegyezik a három különböző adatfelvételben. Az ötös illetve négyes sorozatokat adók aránya azonban már a CAWI esetében a legmagasabb, és CAPI esetében a legalacsonyabb (CAWI 42%, CATI 38%, CAPI 33%). 2.3.3.2.6 A kapott eredmények vizsgálata Megvizsgáltuk, hogy milyen szisztematikus eltérések fedezhetők fel az egyes módszerek eredményei között a kutatás témája szempontjából. Az adatfeldolgozás és elemzés során a mintákat több célcsoportra bontva vizsgáltuk, általánosságban pedig a személyes lekérdezés eredményeit fogadtuk el a valósághoz leginkább közel állónak. A lapolvasási szokások esetében a módszerek közötti eltérésként talán annyi említhető, hogy a telefonos megkérdezés válaszolói a legaktívabb lapolvasók mindegyik napilap esetében, és a napilapok egymáshoz viszonyított sorrendje nem változik az egyes módszerek esetében, csak az értékek nagysága ingadozik. Ez alól egyedül a Metro városi ingyenes napilap online adata jelentett kivételt, amely esetében a CAWI kérdőívek kitöltői voltak a leggyakoribb olvasóik. A három adatfelvétel közül a lapolvasottság vizsgálata esetén úgy tűnik, hogy a telefonos jobban eltér a személyes adatfelvételtől, mint az online adatfelvétel. 29. ábra Az olvasott lapok száma átlagosan az elmúlt 7 napban CATI
CAWI
CAPI
2,5 2,14
2,0 1,71
1,59
1,5 1,14
1,0
1,05 0,90
0,80
0,75 0,61 0,44
0,5
0,64 0,34
0,48
0,40 0,37 0,18
0,40 0,39
0,15 0,12 0,08
0,0 Blikk
Metro
Népszabadság
Bors
Napi Ász
Nemzeti Sport
Helyi napilap
A kutatás szempontjából kiemelkedően fontos kérdés volt, hogy találkozott-e a kérdezett a reklámmal. Ebből a szempontból kiemelkedőnek mondhatjuk a CAWI adatfelvételben a reklámkampánnyal találkozók arányát a másik két adatfelvételhez képest. Előzetes elvárásunk szerint, az adatfelvételek összehasonlítása során az online és a személyes 123
adatfelvételben kell egymáshoz közeli értékeket találunk, mert a három módszer esetében más elemekkel tudták csak bemutatni a reklámot: telefonon csak a szlogennel, a másik két esetben pedig a szlogennel és képekkel is emlékeztették a válaszolókat a reklámkampányra. A CAPI és a CATI adatfelvételben ugyanakkor a reklámkampánnyal találkozók aránya jóval közelebb helyezkedik el egymáshoz képest (10% különbséggel), a CAWI esetében pedig a reklámmal találkozók aránya 79%, ami közel 30%-al magasabb arány, mint amit a személyes megkérdezés esetén tapasztalunk. 30. ábra A reklámmal bármilyen formában találkozók (online és személyes megkérdezés) illetve a szlogenre emlékezők aránya (telefon) CATI
CAWI
CAPI
100%
79%
80%
60%
51% 41%
40%
20%
0%
Látott reklámot, hallott szlogent
A magasabb pozitív arányt feltehetően a reklámok korlátlan megfigyelése okozhatta, hiszen a személyes adatfelvételben a bemutatást követő 1-2 másodpercben már meg kellett adni a választ, míg az online kérdéssorban akkor ment tovább a válaszadó, amikor neki tetszett. Nem meglepő, hogy ezen torzítás kivédésére a reklámtesztekben az utóbbi időben „időzáras” kérdezést vezettünk be annak érdekében, hogy csupán előre meghatározott ideig legyen módja a válaszadónak megfigyelni a kreatív anyagokat. A már ismert nyolc kérdésből álló attitűdskála átlagainak esetében azt tapasztaljuk, hogy két eset kivételével a CAWI átlagértékek a legalacsonyabbak. A két kivétel érdekes módon a két igazi negatív állítás a Blikkre vonatkozóan, az eredmények alapján az online kitöltők valamennyivel erősebben „mertek” negatív állításokkal is egyetérteni a kérdezett napilappal kapcsolatban, mint a másik két adatfelvétel során válaszolók. Ennek magyarázata lehet többek között, hogy a kérdezőbiztos jelenléte a személyes és telefonos megkérdezés során egyféle akadály lehetett a negatív tartalmak kinyilvánításának, tehát a válaszolók kevésbé „mertek” negatívabb értékelést adni. Az online kérdőív arculatából nem lehetett
124
következtetni egyik kérdezésben sem a megbízóra, de a kérdések tartalma és sorrendje egyértelműen orientálhatta a válaszadókat, mint a másik két felvétel esetében is. Az attitűdskála egyes kérdéseinek átlaga a CATI és CAPI esetében szinte együtt mozog, van, amikor a személyes, de van, amikor a telefonos átlag magasabb valamennyivel. 31. ábra Blikk attitűdök és Blikk reklámtetszés, átlagértékek, 5 fokú skála, 5=pozitív maximum CATI
CAWI
CAPI
5,0 4,5 3,94
4,0 3,5 3,0 2,5
3,25
3,20
3,39
3,32
3,23 2,99
2,88
2,71
2,81 2,26
2,38
2,77 2,53
2,72 2,40
2,47
2,57
3,15
2,99
3,77 3,31
2,72 2,38
2,0 1,5 1,0 0,5 0,0
segít eligazodni
dolgok "igazi arcát"
őszinte, szókimondó
képmutató
hazudik
hiteles
pártatlan
bátor
2.3.3.2.7 Összegzésképpen – a gyakorlatban tapasztalt előnyök és hátrányok Az online kérdezés során lehetőség nyílt képekkel is segíteni a kérdezést, az adatminőség állandónak és jónak volt mondható a többi vizsgált adatfelvételi módhoz viszonyítva, ebben bizonyára szerepet játszott, hogy a kitöltés időpontja a válaszolók szempontjából szabadon választható volt. Az adatfelvétel nagyon gyorsan lezajlik (2 nap), és maga az adatfelvételi projekt teljes ideje is a legrövidebb a három adatfelvételi módszer közül (CAWI: 4 nap, CATI: 7 nap, CAPI: 20 nap). A vizsgált adatfelvételi formák közül a legolcsóbbnak a CAWI mondható, a tapasztalatok szerint a személyes lekérdezés összköltsége két és félszerese az online adatfelvétel költségeinek. Azt mondhatjuk, hogy ez a költséghatékonyság talán a legtöbbet emlegetett előnye az online módszerekkel végzett kutatások terjedésének, a legerősebb mozgatórugó az elemzői/megrendelői oldalról. A kutatási költségeket – a konkrét összeg említése nélkül – a legolcsóbb módszer arányaiban fejezzük ki. A három adatfelvételi technika közül a legkevésbé költséges az online adatfelvétel volt (100), nagyságrendileg 50%-al több költséggel járt a telefonos adatfelvétel 125
(összköltsége 150%) és 150%-al többe került a személyes adatfelvétel (összköltsége 250%). Az egyes régi és új költségelemek alakulására most nem térnénk ki222, de azt mindenképpen fontos kiemelni, hogy amellett, hogy a különböző adatfelvételi módszerek hasonló költségelemekkel rendelkeznek, az online panelkutatások esetében a másik két módszerhez képest változik a válaszadói szerepfelfogás és belép egy új költségelem: a válaszoló érdekeltté tétele a válaszolásban, azaz az ösztönzők. Az NRC Panelben az ösztönzők legtöbbször nagy értékű műszaki cikkek és eszközök, amelyeket az adott kutatás kitöltői között kisorsolnak. Az online adatfelvétel hátrányait úgy összegezhetnénk, hogy nem minden szegmensben elég magas a lakossági internet használók aránya. Egy adott kutatás tervezésre előtt fontos feltérképezni, hogy az adatfelvétel során a célcsoport szempontjából a tapasztalt előnyök mellett milyen mértékű torzító hatást okozhatnak a mintavétel során az internet elérésben és az internet használatban tapasztalható egyenlőtlenségeknek. A telefonos adatfelvétel előnye a személyes adatfelvétellel szemben, hogy kisebb a költségigénye (3/5-e a személyes költségének), valamint rövidebb az adatfelvételi projekt hossza (7 nap szemben a személyes esetében tapasztalt 20 nappal), azonban a többi vizsgált dimenzió mentén nem emelhető ki egyéb egyértelmű pozitívuma. Ugyanakkor
a
CATI
adatfelvételben
kifejezett
hátrányt
jelentett
a
kutatás
szempontjából, hogy nincsen vizuális kapcsolat a kérdezett és a kutatási interfész (interjú készítő vagy kérdőív) között, a gyakorlatban tehát nem tudtuk a kérdezést képekkel támogatni, ez közrejátszott abban, hogy eltérő arányban ismerték fel a bemutatott reklámokat. Hátránya továbbá tapasztalataink szerint, hogy a telefonos felvétel mintájában– leginkább a telefonpenetráció miatt –, hogy olyan torzításokat tapasztaltunk a hazai lakosság elvárt alapeloszlásaihoz képest, amelyek egyre erősebben strukturális jellegű torzulásokat mutatnak (idősebb korcsportok aránya magasabb, öregségi nyugdíjasok aránya magasabb). A személyes megkérdezések fő előnye a másik két ismertetett módszerrel szemben az, hogy kevesebb torzítás mellett képes reprezentálni a kutatás célcsoportját, ez esetben a 18 év feletti magyar lakosságot. A kérdezés során a kérdezéstechnikai eszközök alkalmazásának lehetőségei még az online kutatás esetében tapasztalt lehetőségeknél is tágabb skálán mozognak, hiszen a számítógéppel támogatott személyes kérdezés során elvileg minden olyan 222
A hagyományos és új költségelemek alakulásáról az online kutatásokkal kapcsolatban részletesebben: Darvas – Pillók: Online adatfelvételi módszerek és felhasználásuk Magyarországon. Szakdolgozat, ELTE BTK Szociológiai Szak 2001, konzulens: Máth András
126
lehetőség és felület rendelkezésre áll, mint az online kérdezés esetében, de még interaktív és személyes a kérdezési helyzet is. Az adatminőség a vizsgált dimenziók mentén nem volt a legjobb. A személyes adatfelvétel két legfőbb hátránya a magas költségek és a projekt, valamint a terepmunka hossza volt. 2.3.3.3 Trendek a módszerek használatában – összegzésképpen A reprezentativitás és a mintavételi keret szempontja felől közelítve az eddig vizsgált három módszert két csoportba oszthatjuk. A személyes megkérdezés képes volt mintavételi keretként kezelni az egész populációt223, a telefonos és az online pedig csak a populáció egy részhalmazát, azaz az adott eszközzel – telefon vagy internet eléréssel – rendelkezőket tekintik mintavételi keretüknek. Ebből a szempontból tehát alapvető kérdés, hogy milyen összetételű és arányú a mintavételi keret és a populáció eltérése. Közismert tény, hogy a lakosság vezetékes telefonellátottsága folyamatosan csökken, ennek egyik legfőbb oka a mobiltelefon-ellátottság rohamos emelkedése (ez jelenleg nagyjából 70% körüli a magyar lakosságban), a csökkenés másik – jóval kisebb súlyú – okozója pedig újabban az internet ellátottság növekedése. 32. ábra Internet és telefon penetráció korcsoportonként224 otthoni telefon
internetezik
100% 90% 80%
75%
70% 58%
60% 50%
49%
48% 41%
40% 30% 20%
13%
10% 0%
15-17 éves
18-49 éves
223
Mindezeket a szempontokat amelyeket a mintakerettel foglalkozó részben tárgyaltunk.
224
Nemzeti Média Analízis, 2008. I. 15+ korcsoportok
127
50-69 éves
Elmondhatjuk tehát, hogy amíg az internet-ellátottság egyre általánosabbá válik, és csökken a klasszikus digitális egyenlőtlenséget kijelölő magyarázó változók (vagyoni-anyagi helyzet, státusz és kulturális változók) magyarázó értéke, addig a vezetékes telefon, amely korábban széles körben elterjedt kommunikációs eszköz volt, egyre inkább jól meghatározható társadalmi csoportok sajátosságává válik. A jövőbeli kilátásokat még inkább rontja a vezetékes telefon segítségével végzett kutatások szempontjából az, hogy a fogyasztói és véleménykutatási célcsoportok esetében még gyorsabb az online kommunikációs formák térnyerése és a vezetékes telefonellátottság pozícióvesztése. A telefonos kutatások fontos kérdése, hogy hogyan és milyen hatékonysággal tudják integrálni a csak mobiltelefonnal rendelkezőket a mintavételi és kiválasztási eljárásokba, és persze ennek milyen költségvonzata van a kutatás egésze szempontjából. Kérdés a jövőre vonatkozóan, hogy milyen hangsúlyeltolódás lesz megfigyelhető a CAWI és a CATI adatfelvételek között akkor, amikor is majd az egyes eszközök segítségével elérthetők aránya megfordul, azaz többen érhetők el internet segítségével (is), mint vezetékes telefonvonalon. (Egyes célcsoportokban ez a helyzet már bekövetkezett, így ott az online eszközök alkalmazása mindinkább gyakorlattá válik.) A másik látható trend az adatfelvételek együttes alkalmazása, így például az online mintavétel során tapasztalt torzítások csökkentésére jó módszer lehet, hogy az online területen alulreprezentált csoportokat személyes lekérdezéssel pótolják a kutatás mintájában, de az online adatfelvétel során tapasztalt torzító hatásokat több módszertani kísérletben is próbálták redukálni úgy, hogy többféle adatfelvételi technikával is megkeresték ugyanazokat a válaszolókat, e tekintetben az eredmények nem egységesek. Batagelj, Manfreda, Vehovar225 alapfeltevése szerint többféle adatfelvételi technika együttes alkalmazásával elérhetők azok a csoportok, akik online módszerekkel nem elérhetők. Véleményük szerint optimalizálni lehet az adatfelvételi költségeket úgy, hogy először az legolcsóbb, majd a drágább módszerrel tesznek kísérletet a mintába került válaszoló megkérdezésére, és így csökkenthető a nem válaszolók száma. A vizsgálat során három csoportot alakítottak ki, az egyik csoport esetében csak postai úton küldtek ki kérdőíveket, a második csoportban először küldtek egy levelet, amely linket is tartalmazott az interneten lévő
225
Lozar Manfreda, K., Vehovar, V., Batagelj, Z: Web versus Mail Questionnaire for an Institutional Survey, 2nd ASC International Conference on Survey Research Methods: The Challenge of the Internet, 2001
128
kérdőívre, majd később kiküldték a papír alapú kérdőívet. A harmadik csoport esetében azonban csak az interneten tették elérhetővé a kérdőívet. Összességében a kutatók szerint a különböző technikák együttes alkalmazása nem hozott annyival több választ, mint amennyivel költségesebb volt ugyanazon válaszolók több csatornán történő megkeresése. Hasonló Dillman és társai226alapfelvetése, amely szintén az volt, hogy a többféle adatfelvételi módszerrel felvett kérdőíveknél magasabb a válaszolási hajlandóság. Egy bonyolult kísérleti elrendezésben négy adatfelvételi módszer – a CATI, a postai, a CAWI és az IVR (interactive voice response, azaz a telefonkészülék nyomógombjaival segített válaszolás) – együttes megkereséseinek válaszolási arányait hasonlították össze. A kutatók azt találták, hogy a különböző adatfelvételi technikák együttes alkalmazásának „ereje” nem meggyőző, nem bizonyosodott be, hogy a válaszadási arányokat emeli, inkább a mérési hibák elkerülését szolgálja.
226
Berck – Dillman – Kohrell – Phelps – Tortora – Swift: Response Rate and Measurement Differences in Mixed Mode Surveys
129
2.3.4 A kérdőív és a kérdések hatása A következőkben elsőként a kérdőívben szereplő szavak tulajdonságaival foglalkozunk, majd a kérdések, kérdésformák tulajdonságait, végezetül pedig a kérdések sorrendjének hatását mutatjuk be. A kérdőív az eszköz, amely a mérési hibák kiküszöbölésére jött létre az empirikus társadalomtudományi kutatásokban, ahol is elvárás volt, hogy a tudományos mérés egyik alapja, maga a mérést végző eszköz standardizált227 legyen. A nehézség – mint a társadalomtudományokban általában – hogy a mérés tárgya is résztvevője a mérési folyamatnak, ellentétben a fizikai vagy természettudományos méréssel, ahol néha nincs is direkt kapcsolat a mérési eszköz és a mérés tárgya között228. A kérdőíves adatfelvételekben ezzel szemben a mérési eszközzel minden válaszolónak érintkeznie kell, meg kell értenie az egyes kérdéseket, így előfordulhat az is, hogy a „standardizált” kérdéseket különbözőképpen értelmezik a válaszolók. A kérdőíves felvétel során a mérési folyamatban a nyelv az az eszköz, amelyik a mérést „végrehajtja”, a kutatók szándékai szerint ugyan a felmérések nyelve erősen standardizált, nincs garancia arra vonatkozóan, hogy az értelmezés, a jelentés megértése is megegyező módon működik válaszolóként. 2.3.4.1 A kérdőívben szereplő szavak tulajdonságai Elméletileg három különböző mérési hiba tulajdonítható a szavak és jelentésük összefüggésének Groves szerint, az első lehetőség, ha nincs jelentése a kérdésben szereplő kifejezésnek a válaszoló számára; a második lehetőség, ha mást jelent az válaszoló számára a kifejezés, mint a kutató szándéka; illetve az is lehetséges, hogy a használt kifejezés mást és mást jelent minden egyes válaszoló számára. A három lehetséges hibalehetőség nem egymást kizáró kategória, a kérdezőbiztosi instrukciók között sok esetben található a jelentésre utaló leírás, finomítás, de ezeket sok esetben a kérdezőbiztosok csak akkor osztják meg a válaszolóval, ha ők visszakérdeznek. Ez egy meglehetősen bonyolult mérést igénylő helyzet, a kérdőívből fakadó mérési hibákat nagyon nehéz láthatóvá tenni, igazán kevésnek mondható az ebben a témában elérhető
227
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York
228
Természetesen ennek a témának komoly ismeretelméleti és tudományfilozófiai háttere és szakirodalma van, erre most itt hely hiányában nem térünk ki mélyebben.
130
kutatás, szisztematikus összefoglaló. Az egyik ilyen kísérletben, amelyről Belson229 (1981) számolt be, a kérdezés során először feljegyezték a kérdésre adott válaszokat. Ezután visszakérdezett a kérdezőbiztos, hogy pontosan hogyan is értelmezték a kérdésben szereplő bizonyos szavakat a válaszolók. A kísérletben olyan hétköznapi és sok jelentéssel rendelkező szavakra kérdeztek rá, mint a „you”, a „weekday”, vagy a „children”. 13. táblázat
Hányszor vált csatornát átlagosan egy hétköznapi estén? – kérdésfeltevés esetén a you értelmezési köre230 Jelentés
esetek aránya (%)
a kérdezett, önmaga egyedül nem kifejezve a kérdezett és a házastársa a kérdezett és a családja a kérdezett és még egy vagy több családtag a kérdezett és mások a kérdezett és barátai a kérdezett vagy a felesége a kérdezett vagy a családja legalább 1 családtag a családja (nem feltétlen a kérdezett) a kérdezett férje a kifejezést kihagyta, elnézte nincs válasz említések száma összesen
87,4 0,9 2,0 2,5 1,0 0,3 0,5 0,2 0,3 0,2 0,4 0,2 3,5 0,6 1225
Látható, hogy olyan hétköznapi szónak, mint a „you” számtalan értelmezési lehetséges egy sztenderd módon fogalmazott kérdés esetében is. A kérdezett és a kérdőív kapcsolatát mutatja be Martin231 (1986) kísérlete, aki a National Crime Survey-ben megkérdezte a válaszolóktól, hogy az interjút megelőző hat hónapban váltak-e valamilyen bűncselekmény áldozatává, majd a kérdésfeltevés után néhány perccel megkérdezték, hogy értette-e, emlékszik-e milyen periódusra vonatkozott a kérdés. Összesen a válaszolók 5%-a helytelenül idézte fel a kérdésben szereplő hathónapos időintervallumot, 15%-uk pedig egyáltalán nem tudta a választ.
229
Belson, W., The Design and Understanding of Survey Questions, London, Gower, 1981.
230
Belson, W., The Design and Understanding of Survey Questions, London, Gower, 1981.
231
Martin, E., Report, on the Development of Alternative Screening Procedures for the National Crime Survey, Washington, DC, Bureau of Social Science Research, 1986.
131
Bradburn és Miles (1979)232 kísérletükben először az unalmas illetve izgatott érzelmi helyzetekkel kapcsolatban kérdezték meg, hogy milyen gyakran tapasztalják azokat, a kérdés során a következő válaszlehetőségeket adták meg: soha, nem túl gyakran, elég gyakran, nagyon gyakran. Később a kérdezés folyamán a kérdezőbiztos megkérte a válaszolót, hogy specifikálja korábbi válaszában az általa megjelölt válaszlehetőséget. A válaszolók először vonakodtak megválaszolni a kérdést, de a kérdezőbiztosi meggyőzés hatására végül összesen csak a válaszolók 5%-a utasította vissza a válaszolást. 14. táblázat
Az adott érzeti állapotok gyakorisága szerinti havi átlagok (alkalom/hónap)
választott kategória az Érzeti állapotok Helyzet (Feeling State) kérdésre nem túl gyakran (not too often) elég gyakran (pretty often) nagyon gyakran (very often)
válaszkategória definíciója (alkalom/hónap) izgatott unatkozó 6,65 (0,47) 4,15 (0,24) 12,95 (0,54) 13,72 (0,94) 17,73 (0,95) 17,39 (1,31)
A nem túl gyakran válaszkategória esetében eltér egymástól a két átlag, ami jól mutatja, hogy mekkora variabilitás is lehet ugyanazon válaszolók között, akik a két kérdésre ugyanazt a válaszkategóriát jelölik meg. Az egyes kérdések megegyező válaszlehetőségeinek értelmezése esetén eltérő mentális értelmezési skálákat használnak az emberek, ezt bizonyítja Pepper és Pryulak233 (1974) vizsgálata is, amelyben bemutatták, hogy sok esetben eltér egymástól a nagyon gyakran jelentése, így például más a gyakoriság jelentése földrengések illetve a reggelizés elmaradása esetén. 2.3.4.2 A kérdések tulajdonságai Egy másik megközelítése a kérdőívet mint megértendő szöveget kezeli és egy objektív mérőszámhoz viszonyítja. A szavak komplexitásának mérésre használják a Flesch skálát, (Flesch Reading Ease Readability Score)234, amelyik jellemzi a szavak és mondatok hosszúságának segítségével a szöveg olvashatóságát.
232
Bradburn, N.M., and Miles, C., “Vague Quantifiers,” Public Opinion Quarterly, Vol. 43, No. 1, Spring, 1979, pp. 92-101. 233
Pepper, S., and Pryulak, L.S., “Sometimes Frequently Means Seldom: Context Effect in the Interpretation of Quantitative Expression,” Journal of Research in Personality, Vol. 8, 1974, pp. 95-101. 234
http://en.wikipedia.org/wiki/Flesch%E2%80%93Kincaid_readability_test
132
28. egyenlet
ahol: Flesch Reading Ease Readability Score átlagos mondat-hosszúság szavakban kifejezve (szavak száma/mondatok száma a szövegben) átlagos szótagszám szavanként (szótagok száma osztva a szavak számával)
A FRE skála értéke szerinti alacsony értékeket kapott szöveget nehezebb, a magas pontszámú szövegeket pedig könnyebb megérteni. A pontszámokat úgy lehet interpretálni, hogy a 90-100 pont közötti értékek könnyen érthetők egy 11 éves diák számára, a 60-70 pont közötti szöveg könnyen érthető egy 13-15 éves diák számára, a 30 pont alatti szöveget pedig legjobban egyetemi végzettséggel lehet megérteni. Az Egyesült Államokban az iskolai medián (12,1 iskolai év) számára az 50-60 FRE érték közötti olvasási pontszám jelenti a könnyű szöveget (Groves235). Converse és Schuman236 (1984) több kutatócég kérdőíveiben több száz kérdést értékeltek a Flesch skála szerint. 15. táblázat A Flesch olvasási nehézség pontszámok (a nyelvi nehézség átlagos szintje, az alacsony pontszámok bonyolultabb nyelvhasználatot jelentenek)
Átlag Szórás Kérdések száma
Gallup (1969-71)
Harris 1970
ISR-NES 1972
NORC-GSS 1972-74
62,1 18,1 206
58,7 18,6 196
72,7 20,5 157
63,6 22,6 200
Az eredmények szerint a Harris kérdőíveit volt a legnehezebb olvasni, a legkönnyebben olvashatónak pedig a National Election Survey kérdőívét találták, de egyik vizsgált kérdőív sem ment az átlagosan érthető tartomány alá. A FRE ugyan az olvasási nehézséget jellemzi és nem a hallott szöveg megértési nehézségét, de az feltételezhetjük, hogy a nehezebben olvasható szöveget a válaszolónak nehezebb megérteni. A szavak és jelentések mellett erős hatással lehetnek a válaszokra a kérdések illetve a kérdésstruktúra egyes elemei. Az egyik ilyen meghatározó jellemző a kérdés „optimális” 235
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 452.
236
Converse, J., and Schuman, H., „The Manner of Inquiry: An Analysis of Survey Question Form Across Organizations and Time,” in C.F. and E. Martin (Eds.), Surveying Subjective Phenomena, Vol. 2, New York, Russell Sage Foundation, 1984.
133
hossza. Elvileg a hosszabb kérdésnek számtalan előnye van a rövidebb kérdéssel szemben, részletesebben lehet kibontani a pontos körülményeket, amelyekre vonatkozik a kérdés, jobban tudja a kérdés kontextusát vázolni, pontosabb jelentést tud kommunikálni, azaz egyszerűen nagyobb eséllyel tudja megértetni a kérdést. Másrészről, a hosszú kérdés rengeteg információt tartalmaz, a válaszadó befogadási kapacitása pedig véges. Munkaügyi interjúk során Matarazzo et al237 (1963) azt találták, hogy kérdezőbiztos beszédidejéhez alkalmazkodott a válaszolók beszédideje is. Abban az esetben, amikor a kérdezőbiztos általában öt másodpercig kérdezett, akkor a válaszadó általában 30 másodpercig válaszolt, amikor a kérdezőbiztos átlagban 15 másodpercig kérdezett, akkor a válaszadó több, mint 1 percig válaszolt. Groves szerint, ha a kérdés tartalmától és típusától eltekintünk, annyi biztosan megállapítható, hogy a kérdezés hossza hatással van a válaszoló viselkedésére. A másik fontos befolyásoló tényező a kérdés típusa, amely lehet nyitott vagy zárt kérdés. Nyitott kérdések esetében a válaszolónak a saját szavaival kell megfogalmaznia a választ és a kérdezőbiztos az elhangzottakat rögzíti, a zárt kérdések esetén pedig a válaszolót megkérik, hogy válasszon ki egy válaszlehetőséget a felsoroltak közül. A két kérdés közötti kompromisszum a mérésben az a kérdéstípus, amely az előre rögzített válaszkategóriák mellett az egyéb, éspedig válaszlehetőséget is tartalmazza. A vonal alatti (field coded) kérdések esetében a szabad-szavas válaszlehetőséget a helyszínen rögzítik előre rögzített válaszkategóriákba, amelyet ugyanakkor nem bocsátanak a válaszoló rendelkezésére. Bradburn és Sudman238 (1979) azt találták, hogy a nyitott kérdések sokkal produktívabbnak bizonyultak olyan viselkedésformák említésénél, ahol érvényesülhetnek a társadalmi elvárások. Ennek egyik oka lehet a szerzők szerint, hogy a nyitott kérdések esetében a válaszoló a saját szavaival írja le saját viselkedését a saját kontextusában, és nem kell szembesülnie viselkedésének társadalmi kategóriáival, mint egy zárt kérdés esetében. Az előző fejezetekben láthattuk, hogy ezeket a társadalmilag nem kívánatos/kellemetlen beállítódásokat, témákat alulbecslik a felmérések. Léteznek azonban olyan kérdezésstratégiák is, amelyek ezt az alulbecslést képesek csökkenteni. Az egyik ilyen lehetőség – kézenfekvő
237
Matarazzo, J.D., Weitman, M., Saslow, G., and Wiens, A.N., “Interviewer Influence on Durations of the Interviewee Speech,” Journal of Verbal Learning and Verbal Behavior,Vol. 1, 1963, pp. 451-458. 238
Bradburn, N.M, Sudman, S., and Accociates, Improving Interview Method and Questionnaire Design San Francisco, Jossey–Bass, 1979.
134
módon – a nyitott kérdések használata. Ahogy arról Bradburn és Sudman239 (1979) beszámolnak, nyitott kérdések használatával csökkentették a társadalmilag nem elvárt viselkedések látenciáját: a válaszolók a saját szavas válaszaik alapján nagyobb hajlandóságot mutattak ilyen viselkedések jelzésére. Fontos megemlíteni ugyanakkor, hogy a szabad szavas kérdések válaszainak kódolása során nem zárhatók ki azok a hibák, amelyek a társadalmilag elvárt irányba tolhatják a létrejövő válaszkategóriákat. A másik lehetséges eljárás olyan kérdezési technika alkalmazása, amely - a kérdezett számára is meggyőzően - kizárja az azonosíthatóságot (Csepeli, Bornemisza240). Ez a kritérium különböző véletlenítési technikákkal teljesíthető, amelyek közös kiindulópontja, hogy a kérdezettnek egy véletlen kísérlettel kell eldöntenie, hogy az érzékeny kérdésre vagy a semleges kérdésre válaszol-e. Természetesen a kérdezőbiztos nem látja a véletlen kimenetelt, így biztosított az anonimitás. A kutató ugyanakkor ismeri a véletlen kísérlet kimeneteleinek valószínűségi megoszlását, akkor torzítatlan becslést adhat az érzékeny kérdésre kapott válaszok mintabeli megoszlására. Az eljárás hátránya Csepeli-Bornemissza szerint egyrészt az, hogy a becslés szórása lényegesen megnövekszik, másrészt az, hogy az érzékeny kérdésekre adott válaszokat nem ismerjük pontosan, értéküket csak bizonyos valószínűséggel tudjuk, így a szokásos többváltozós elemzések nem, vagy csak nagyon korlátozott mértékben alkalmazhatók a véletlenített kérdezési technikával kapott adatokra. Csepeli, Bornemisza241 a Warner féle kérdéselrendezést használták fel egy kísérletben. A véletlenítési módszerek legelső, Warner242 által kidolgozott eljárásában a kérdezett két kérdést kapott, amelyek közül az egyik volt az érzékeny kérdés, a másik ennek a logikai ellentéte. A kísérletben véletlenszerűen sorsolták ki a kérdést, amire válaszolni kellett úgy, hogy csak a válaszoló látta az eredményt. Ha kék labdát lát, akkor arra válaszoljon, hogy volte abortusza, ha viszont sárga labdát lát, akkor azt kérdezik: szeptemberben született-e, mindkét esetben csak egy igent vagy egy nemet kellett mondania a kérdezőbiztosnak. A válaszok alapján egyéni szinten nem lehet beazonosítani, hogy kinek volt abortusza, de 239
Bradburn, N.M, Sudman, S., and Accociates, Improving Interview Method and Questionnaire Design San Francisco, Jossey–Bass, 1979. 240
Bornemisza Eszter-Csepeli György: A válaszálcázás kiküszöbölése (Hibával mért diszkrét adatok statisztikai elemzése a társadalomtudományokban), http://www.socio.mta.hu/mszt/19982/bornemis.htm 241
Bornemisza Eszter-Csepeli György: A válaszálcázás kiküszöbölése (Hibával mért diszkrét adatok statisztikai elemzése a társadalomtudományokban), http://www.socio.mta.hu/mszt/19982/bornemis.htm 242
Warner, S.L., “Randomized Response: A Survey Technique for Eliminating Evasive Answer Bias,” Journal of the American Statistical Association, Vol. 60, 1965, pp. 63-69.
135
aggregált szinten lehet becslést adni, hiszen ismerjük a kék és a sárga golyók eloszlását, valamint a szeptemberben születettek számát is, ebből pedig becslést lehet adni az abortuszon átesettek arányára. Csepeli, Bornemissza243 eredményei szerint a módszer alkalmas érzékenynek minősülő kérdések vizsgálatára, és számottevően mérsékelni tudja a bizalmatlanságból, konformitásból, önprezentációs feszültségekből adódó őszinteséghiányt. Vizsgálatukban a büntetett előélet előfordulását vizsgálták, és megállapították, hogy az általuk biztosan tudott büntetett előéletűek őszintén válaszoltak, azaz sikerült elhárítani a hamis válasz adásának kísértését. A kérdőívben használt skálák hosszúságának illetve középpontjának meghatározása visszatérő dilemma. Elmondható, hogy ebben a témában általában a legtöbb kérdőívvel foglalkozó kutatónak kikristályosodott álláspontja van, ugyanakkor ezek az álláspontok inkább hitvitáknak látszanak. Groves244 szerint a középpont kijelölésének jelentősége a több, mint három kategóriával rendelkező skálák esetében gyakorlatilag elveszik, ezeknél a kérdéseknél kevés különbség figyelhető meg a válaszolók által használt kategóriák arányában. Groves megállapítja, hogy a válaszolók kisebb arányban választják a közepes, semleges kategóriákat ha részletesebb a skála, de nincs különbség megbízhatóságban, validitásban a különböző skálák esetében. 2.3.4.3 A kérdésstruktúra tulajdonságai A kérdésstruktúra vizsgálatának elsődleges szempontja a kontextus-hatás vizsgálat. Kontextus-hatásnak egy kérdőív esetén az nevezzük, amikor a kérdőívben a kérdésre adott válaszok nem függetlenek a megelőző kérdésektől. Bizonyára van valami hatás, de az a kérdés, hogy ez a hatás kimutatható, mérhető-e. Angelus-Tardos245 szerint nagyon fontos a kontextus, amely a kérdések, blokkok logikai egymásra utaltságát, konnotációját jelenti. A szerzőpáros szerint a kutatási tervek általában nem számolnak a kontextus-hatással, legjobb példa erre, hogy a kontextus érzékeny adatok esetében az idősoros összehasonlítás a kontextus homogenitását feltételezi. Kutatási 243
Bornemisza Eszter-Csepeli György: A válaszálcázás kiküszöbölése (Hibával mért diszkrét adatok statisztikai elemzése a társadalomtudományokban), http://www.socio.mta.hu/mszt/19982/bornemis.htm 244
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 467.
245
Angelusz Róbert – Tardos Róbert:A kérdőív kontextus-hatás - a nem mintavételi hibák egy efemer, mindennapos esete, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006
136
eredményeik többé-kevésbé arra utalnak, hogy a kulturális centrumban lévők, fővárosi, de városi diplomások érzékenyebbek voltak az ilyen típusú külső hatások, szimbolikus befolyásolók irányába egy politikai kutatás során. Szerintük a kérdőív kérdéseinek elképzelhető egy olyan tipizálása, amely a kontextust befolyásoló illetve az azt nem befolyásoló csoportokra osztja a kérdőív kérdéseit. Talán ezt a felosztást érdemes kiegészíteni egy harmadik csoporttal, a kontextus-érzékeny kérdésekkel. Az attitűdelemzés módszerivel kapcsolatban folytatott vizsgálatokban érhető tetten legkönnyebben a kontextus-hatás. Groves246 által idézett kutatásban az elemzés során azt találták, hogy a fiatal vezetők vezetési képességeit firtató kérdés után a saját vezetési gyakorlatot kedvezőbben ítélték meg a válaszolók. Hasonló eredményre jutottak egy másik kutatásban is, amikor az abortusz megítélésére vonatkozó kérdés a születési rendellenességgel születendő gyermekek abortuszára vonatkozó kérdés után következett. A kérdések sorrendje befolyásolta a válaszokat ebben az esetben is: ebben a kérdéssorrendben, többen bizonyultak elfogadónak az abortusszal szemben mint olyan kérdés-elrendezés esetén, ahol nem szerepelt ilyen megelőző kérdés. Minden egyes kérdőív készítése esetében szembesül azzal a kutató, hogy hány kérdés szerepeljen, és hol legyen az adott kérdés helye a kérdezés menetének szempontjából. Alapvetően két versengő hipotézist említ Groves247 az adott kérdés helyével kapcsolatban az interjú menetében. Az egyik megközelítés szerint a kérdezőbiztosnak és a válaszolónak kell egy kis idő, amíg összehangolódnak, ebből a szempontból jobb, ha a könnyebb, egyszerűbb kérdésekkel kezdődik a kérdőív. Ez abból a praktikus elgondolásból is szerencsés, hogy kedvet csinálhat a kérdezéshez azzal, hogy az interjút kevésbé fárasztónak mutatja be. A könnyebb, egyszerűbb kérdések a bonyolultabb témák esetében képesek lehetnek megteremteni a téma kontextusát a megterhelőbb kérdések számára, így könnyebb előhívni a releváns információkat a memóriából. Az ellentétes érvelés ha a kérdőív bonyolult, a válaszolóra nagy kognitív terhet rovó kérdésekkel kezdődik, akkor a megkérdezettek elveszthetik motivációjukat és érezhetik úgy, hogy nincs kontrolljuk a kérdezési folyamat felett. A kérdezőbiztos szerepe megnő, a belső motiváció szerepét átveszi a külső kényszer, azaz egyre jobban kell erőltetetni a válaszolást. Ebből kifolyólag a kérdések a kérdőív végén nagyobb válaszadási hibával rendelkeznek, mint a kérdőív elején. Nagyon kevés vizsgálat volt 246
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 479.
247
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 481.
137
a két hipotézissel kapcsolatban, Clamty és Wachsler248 (1971) nem talált különbséget abban, hogy a kérdés a kérdőív elején vagy vége fele volt. Sudman és Bradburn249 (1974) sem talált a survey-módszertani irodalom alapján ilyen jellegű hatásra példát. 2.3.4.4 A kérdőív hatása – összegzésképpen Láthattuk, hogy a lehető leghétköznapibb kifejezéseknek is eltérhet az értelmezési tartománya a válaszolók számára, de ezek a hibák kellő odafigyeléssel kiküszöbölhetők. Hasonlóképpen, körültekintő tervezéssel és teszteléssel ki lehet zárni a kérdések szövegéből a többes jelentéseket és a lehető legegyszerűbben kell fogalmazni. Mind a nyitott mind a zárt kérdések alkalmazása esetén léteznek jó gyakorlatok, és a szenzitív kérdések esetén is vannak módszerek a torzítás csökkentésére. A kontextus-hatást is lehet minimalizálni, érdemes a kérdések esetében tisztázni, hogy kontextus-érzékeny vagy azt befolyásoló kérdésről van-e szó.
248
Clancy, K.J., and Wachsler, R.A., “Positional Effects in Shared-Cost Surveys” Public Opinion Quarterly, Vol. 35, No. 2, 1971, pp. 258-265. 249
Sudman, S., and Bradburn, N., Response Effects in Surveys, Chicago, Aldine, 1974.
138
2.3.5 Részleges nem válaszolás Elsőként bemutatjuk, hogy módszertani szempontból milyen dilemmákat, döntéseket kell hozni a részleges nem válaszolás esetén, körüljárjuk, hogy pontosan mit is takar a fogalom. Majd megvizsgáljuk, hogy milyen hatással van a nem tudom válaszkategória szerepeltetése a részleges nem válaszolásra és sorra vesszük az egyéb kutatási dizájnból illetve a pszichológiai faktorokból származó tényezőket. Végezetül pedig bemutatjuk a részleges nem válaszolás kognitív modelljét, amely gyakorlati segítséget jelenthet a kérdőív kérdéseinek tervezésekor. 2.3.5.1 A részleges nem válaszolás jelensége Az item nonresponse azt jelenti, hogy egyes survey itemekre nem sikerül választ kapni. Ilyen eset, például amikor a válaszadó visszautasít egy kérdést, vagy ha “nem tudom” választ kapunk egy adott kérdésre. Mason, Lesser, W. Traugott250) úgy jellemzik az item nem válaszolást, mint a nem mintavételi hibák komoly, eddig fel nem ismert forrását. Hiányzó adat akkor fordul elő, ha a válaszoló már beleegyezett az interjúba, így sokkal inkább a mérési folyamat résznek tekinthető, mint a teljes nem válaszolás. Ráadásul kognitív és érzelmi, pszichológiai hatások is vezethetnek az item meg nem válaszolásához, ebből kifolyólag ez inkább a mérési hibához tartozik. Sok esetben nem is lehet a válaszolói hiba, a kérdezőbiztosi hiba, a kérdőív esetleges hibájának hatását szétválasztani, mindegyik ezek közül okozhat részleges nem válaszolást. Vegyük végig részletesen, hogy milyen események eredményeképpen jöhet létre részleges nem válaszolás. Elsőként lehetséges, hogy az interjúkészítő nem teszi fel a kérdést 251
. Ez adódhat egyrészt figyelmetlenségből, azaz a kérdezőbiztos hibázott, de lehet, hogy egy
előzőleg már feltett kérdésre adott válasz okán jogosan szerepel adathiány (Máder
252
).
Például, ha megkérdeznek valakit arról, hogy szokott-e gépjárművet vezetni, és a kérdezett nemmel válaszolt, akkor illogikus egy a vezetési szokásokat firtató további kérdést feltenni, a válaszolót „átugratják” az adott itemen. 250
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 251
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 156.
252
Máder Miklós Péter: Hiányos adatbázisok statisztikai kezelése, Eötvös Loránd Tudomány Egyetem Bölcsészettudományi Kar Szociológiai, Szociálpolitikai Intézet és Továbbképző Központ, Nappali tagozat, szociológia szak, Survey-statisztika szakirány konzulens: Dr. Rudas Tamás, 2001.
139
Másodszor elképzelhető az is, hogy az interjú alatt vagy a feldolgozás során hiba történik. Gyakori eset, hogy a kérdezőbiztos felteszi a kérdést, de nem jegyzi fel a választ, de ok lehet a kódolás alatt előforduló mulasztás, pontatlanság is, így például ha a kérdezőbiztos által a kérdőív adott rubrikájába írt szám nem olvasható pontosan, a kódolás ugyanúgy torzíthat mintha item-nem válaszolás történt volna (Máder253). Ilyen esetekben az item nem válaszolást gyakran megpróbálják „feltöltéssel” pótolni, vagy egyszerűen missing kódon hagyják az adatmátrixban. Végül elképzelhető az is, hogy a kérdezett egyszerűen nem tudta a választ, lehetnek olyan ténykérdések, amelyekre egyszerűen nem képes és tud mindenki válaszolni (mint pl. a távolsági hívások aránya a fél évvel ezelőtti telefonszámlában). De az is elképzelhető, hogy a kérdezett valamilyen szubjektív oknál fogva nem akart válaszolni a kérdésre. Groves 254 szerint a hiba szempontjából sokkal rosszabb, ha a hiányzó adat oka maga a válaszoló. Így előfordulhat az is, hogy a kérdőívet ugyan teljes egészében lekérdezték, de néhány kérdésre a kérdezett megtagadta a választ. A kérdőívezési protokoll a válaszoló számára természetesen engedi a válaszmegtagadást, és akik élnek a lehetőséggel egyes kérdések esetében, azok item nem válaszolóként jelennek meg a nem mintavételi hibák között. Vannak olyan kérdéscsoportok, amelyet a válaszolók túl diszkrétnek, tolakodónak éreznek, ilyenek lehetnek a jövedelemre vonatkozó, a szexuális szokásokat vagy az alkoholfogyasztást firtató kérdések, de az is lehetséges, hogy az interjúalany egyszerűen nem meri elmondani az általa kisebbséginek ítélt, vagy a társadalmi normák által elítéltnek tartott viselkedésre, beállítódásokra vonatkozó válaszait (illegális cselekmények, droghasználat). A nem válaszolás kezelésére alapvetően három megközelítés látszik kikristályosodni. Az egyik – inkább a gyakorlatban érvényesülő – eljárás szerint az egyes kérdések alapeloszlását a válaszokkal együtt kell bemutatni, azaz közölni kell az egyes kérdésekre adott nem tudom és adathiány válaszok nyers arányát.
253
Máder Miklós Péter: Hiányos adatbázisok statisztikai kezelése, Eötvös Loránd Tudomány Egyetem Bölcsészettudományi Kar Szociológiai, Szociálpolitikai Intézet és Továbbképző Központ, Nappali tagozat, szociológia szak, Survey-statisztika szakirány konzulens: Dr. Rudas Tamás, 2001. 254
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 156.
140
A másik két megközelítés inkább arra helyezi a hangsúlyt Mason, Lesser, W. Traugott255szerint, hogy hogyan kezeljük a részleges nem válaszolás problémáját, úgy, mint ha a minta minden tagjától megkaptuk volna a szükséges információt. Ez a két módszer a súlyozási módszerek, illetve az imputációs megközelítések (Mason, Lesser, W. Traugott 256). A teljes nem válaszolási arányszámítások érvényesek a részleges nem válaszolás esetén is. A válaszadási arányok kiszámítására alkalmazott szabályok kétségesek item nem válaszolási esetekben (Mason, Lesser, W. Traugott257). Az AAPOR258 Standard Definitons (2001) arányszámítása úgy tartalmazza az item-nem válaszolásokat, mint befejezett interjú (as an interview completion); más definíciók azonban nem veszik figyelembe ezeket az eseteket a válaszadási arány számításakor (lásd még: Groves259). Fontos tudni, − amit többen is megjegyeznek a szerzők közül, − hogy különböző pszichológiai hatások hívják életre a két adathiány típust. Több információ áll rendelkezésre arról, aki csak a felvétel egy részére nem válaszolt, mint a teljes nem válaszolókról. 2.3.5.2 Explicit nem tudom válaszkategória szerepeltetésének hatása Groves szerint ha a válaszolók úgy értelmezik a kérdőív-helyzetet, hogy mindegyik kérdésre kell válaszolni, akkor ezeket a szabályokat is fogják követni. Ha többféle jelentéssel találkoznak, akkor azt fogják választani, amelyik számukra leginkább készre formázott, azaz azt a minimális kognitív erőbefektetéssel járó lehetőséget fogják választani, ami a kérdezőbiztosnak „még” elfogadható. Tehát a válaszoló a kielégítő válaszlehetőséget keresi és nem pedig az optimálist. A nem tudom válaszkategória választása klasszikus megjelenési formája annak, amikor a válaszadó nem rendelkezik attitűddel a vizsgált kérdésről. Régi dilemma a kutatók körében, hogy kell-e egyáltalán szerepeltetni ezt a válaszlehetőséget, és ha igen, akkor hogyan. Egy
255
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 256
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 257
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 258
American Association for Public Opinion Research (AAPOR)
259
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York,
141
kutatás szerint, ha egy kérdés explicit módon nem tartalmazza a „nincs véleményem/nem tudom” válaszkategóriát, akkor ebből a válaszadók arra következtethetnek, hogy elvárják tőlük, hogy legyen véleményük. Ezzel arra bíztatjuk a válaszadókat, hogy valamilyen attitűdöt jelezzenek akkor is, ha valójában nincs ilyen. Amikor explicit módon szerepel a „nincs véleményem” kategória, akkor a válaszolók szignifikánsan nagyobb aránya ismeri el, hogy nincs véleménye (A. Krosnick260). Krosnick261 beszámol egy kutatásról, amelyben diákokkal 29 itemes önkitöltős kérdőívet töltetett ki, amely különböző nemzeti és etnikai csoportokkal kapcsolatos sztereotípiákat mért. A válaszolók véletlenszerűen kapták a két fajta kérdőív egyikét, az egyikben explicit módon szerepeltek a „nincs véleménye” és a „nem tudja eldönteni” válaszlehetőségek, míg a másikban ilyenek nem voltak. A nincs véleménye válaszok aránya az első típus nullájáról a jelentős 22%-ra növekedett. Mind a 29 itemet nézve szignifikánsan csökkent azon válaszolók aránya, akik érvényes választ adtak, amikor a kérdőívben szerepeltek a nem tudom/nincs véleményem válaszlehetőségek. A
„nincs
véleményem”
válaszok
megbízhatóságának
vizsgálatába
Krosnick
longitudinális adatokat is bevont. Különböző attitűdökről kérdezték a válaszadókat két külön alkalommal, két hónap különbséggel. A kutatási dizájnban a kérdések vagy tartalmaztak nincs véleményem opciót vagy nem tartalmaztak. A szerzők nem találtak szignifikáns különbséget az attitűdök következetességében aszerint, hogy jelen volt a nincs véleményem válaszlehetőség, avagy sem. Ezt az eredményt erősítik Krosnick által idézett szerzők (Poe et al. 1988) is. Ugyanezt az eredményt találták egy panel felmérésben tényadatok esetében: a válaszok hosszú távú megbízhatósága megegyezett, függetlenül attól, hogy fölajánlották a „nincs véleményem” opciót, avagy sem. Elvileg, amikor valaki körültekintően, pontosan fölmérve tárgybeli tudását, „nincs véleményem”-et válaszol egy többszörös választás vagy egy igaz/hamis kérdésre, akkor ha válaszadásra kényszerítik, nem tud mást tenni mint tippelni. A Krosnick által idézett másik kutatásban nem tudták alátámasztani ezt az állítást. A vizsgálatban a válaszolók egy adag
260
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So 261
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So
142
igaz/hamis ismereti kérdést válaszoltak meg két alkalommal. Egyszer úgy utasították őket, hogy minden kérdést hagyjanak üresen, amelyikhez nem tudják a választ, és másszor pedig úgy hogy találgassanak az ilyen kérdéseknél. A bináris kérdésfeltevés esetén a találgatásnak nem kéne növelnie az elért pontszámot amennyiben a kérdezett nem tudta a kérdésre a helyes választ. A kutatók szerint a találgatás növelte az elért pontszámot, ami azt jelenti, hogy az ember több ismerettel rendelkezik, mint amit akkor hív elő, ha van lehetősége üresen hagyni egy kérdést. A nincs véleményem opció meglétének adatelemzésre gyakorolt hatásával kapcsolatban Krosnick262 egy vizsgálatot emel ki, amelyben az általa hivatkozott kutatók azt találták, hogy a nincs véleményem választás jelenlétének variálása (van/nincs ilyen lehetőség) három esetben változtatta meg szignifikánsan az attitűdök közötti kapcsolatot, ebből két esetben a nincs véleményem válasz felajánlása erősítette az attitűdök között megfigyelhető összefüggést, egy másik esetben pedig gyengítette azt. Hasonlóképpen Krosnick saját vizsgálataiban sem talált kapcsolatot az attitűdök, a különböző attitűd jellegű, valamint a demográfiai perdikciós változók között, amikor az attitűdöket olyan kérdésekkel mérték, amelyek vagy tartalmazták a nincs véleményem opciót avagy sem. A ténykérdések és az attitűdkérdések esetében másféle kezelést igényel a nem tudom válaszlehetőség. Ennek oka, hogy az attitűd kérdések esetében azt gondolhatjuk, hogy a válaszadók sokszor ténylegesen nem rendelkeznek véleménnyel a kérdésben, a ténykérdések esetében a legtöbb kutató egyetért abban, hogy minimalizálni kell a nem tudom válaszlehetőségeket
263
. Ennek a minimalizálásnak egyik módja, amit Cannel et al264 (1979)
egy kísérlet során bemutattak. A szerzők egy olyan kérdésformulát dolgoztak ki, amelyik egy követő kérdéssel próbálja tisztázni a „nem tudom” válaszokat. Elsőként azt kérdezik: Mondja meg, mikor volt utoljára fogorvosnál? Ha erre „nem tudom” választ kapnak, akkor a következő kérdés: Ha egy kicsit jobban belegondol, akkor biztosan emlékezni fog arra, hogy mikor volt utoljára fogorvosnál! A második kérdés sokkal részletesebb válaszokat eredményezett, nagyban nőtt a dátum precizitása.
262
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So 263
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 469.
264
Cannel , C.F., Oksenberg, L., and Converse, J.M., Experiments in Interviewing Techniques, Ann Arbor, Institute for Social Research, The University of Michigan, 1979.
143
Másik lehetőség a nem tudom válaszlehetőség tisztázására a Groves által idézett kísérlet, amelyben a bűnelkövetéseket és áldozattá válást vizsgálták. A kutatás során megkérték az áldozatokat, hogy mondják el, mikor történt az ellenük elkövetett bűncselekmény. Ha a válaszoló azt mondta, hogy nem emlékszik, akkor megkérdezték: Gondoljon arra, hogy mikor történt, valamilyen jeles esemény előtt, vagy utána? Milyen módon lehetne kitalálni, hogy mikor történt? Ha ez sem vezetett eredményre, akkor feltették a következő kérdést: Úgy véli, hogy a leghidegebb hónapokban, decemberben, januárban vagy februárban, vagy inkább ősszel, tavasszal vagy nyáron történt? Majd utána: Mit gondol, ez hálaadás előtt vagy után történt? Az így alkalmazott kérdezési sorrend és struktúra nagy mértékben megnövelte az érdemi válaszok arányát. 2.3.5.3 Kutatási dizájn és pszichológiai tényezők szerepe A vizsgálatok egy másik része azt sugallja, hogy a „nincs véleményem” válasz gyakran nem a valódi véleményhiányból fakad, hanem inkább kutatási design-béli, vagy pszichológiai és kognitív tényezők befolyásolják. Ilyen tényező lehet a kérdés hosszúsága, bonyolultsága. Krosnick265 úgy véli, hogy azok a kérdések, amelyek hosszú magyarázatokat tartalmaznak egy témáról, vagy jövőbeni események jóslását várják el, magasabb nincs véleményem válaszadási aránnyal rendelkeznek, mint a rövidebb magyarázattal bíró kérdések, vagy a múlt vagy jelen események leírását igénylő kérdések. Különösen igaz lehet ez a hatás alacsony képzettségű válaszolóknál. A „nincs véleményem” válaszlehetőség erőteljes hangsúlyozása eltántoríthat a tényleges attitűdök kifejezésétől. A Krosnick266 azt veti fel, hogy egy erősen fogalmazott „nincs véleményem” válaszlehetőség azt sugallhatja a válaszadóknak, hogy nagy adag tudás szükségeltetik egy attitűdkérdés megválaszolásához, ezzel mintegy „megfélemlítik” azokat a válaszolókat, akik úgy érzi, nem képesek adekvátan alátámasztani véleményüket. Krosnick267 265
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So 266
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So 267
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So
144
beszámol egy kutatásról (Berger és Sulivan, 1970), amelyben a válaszolók egy részének külön instrukciókat adtak, amivel a körültekintő válaszadásra próbálták sarkallni őket, míg más válaszolókat nem. Az útmutató kihangsúlyozta, hogy ők egy jól kiválasztott reprezentatív minta, és hogy nagyon fontos hogy minden egyes kérdésre válaszoljanak. Meglepő módon ezek az instrukciók növekvő nincs véleményem válaszadási aránnyal párosultak. A kutatók szerint ennek az az oka, hogy a tanulmány fontosságának kihangsúlyozása nagyobb idegenkedéshez vezetett a vélemények kifejezésével kapcsolatban. Az énkép védelmeként azonosította Krosnick268 egy kutatás eredményeit, amely szerint általánosabbak voltak a nincs véleményem válaszok akkor, amikor a válaszadóknak hangosan kellett a kérdésekre válaszolni, mint amikor maguk beírhatták a választ anonim módon. Így például nagyobb nincs véleményem válaszarányt találtak személyes interjúknál az önkitöltős kérdőívekhez képest. Az item nem válaszolás erősen összefügghet a kérdőív témájával. Erről számol be Mason, Lesser, W. Traugott269, amikor egy egészséggel kapcsolatos kutatás kapcsán személyes kérdőívinterjúkat készítettek idős emberekkel (1155 férfival és 1942 nővel) a fizikai kognitív és pszichológiai funkcióikkal kapcsolatban. A „nem tudom” válaszok aránya nőtt a válaszoló korával, rosszabb egészségi állapotával, rosszabb fizikai állapotával, érzelmi tünetekkel, és gyenge kognitív funkcióval összefüggően. Egy másik lehetséges magyarázat arra, hogy a „nincs véleményem” válaszlehetőség nem tesz egyértelműen jót az adatminőségnek az, hogy sok olyan attitűd van, amit leginkább „látensként” lehetne címkézni (Krosnick270). Ez azt jelenti, hogy a kérdezettek nincsenek egyből tudatában, hogy rendelkeznek-e ezekkel a véleményekkel. Ezen vélemények és beállítódások tudatosítása, előhívása és kifejezése jelentős kognitív erőfeszítést igényel. Ebből következik, hogy a „nincs véleményem” opció különösen vonzó azon válaszolók számára, akiknél alacsony a motiváció, bonyolultnak látszik a feladat. Ezzel összhangban, a „nincs
268
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So 269
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 270
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So
145
véleményem” válaszok vonzzák az alacsony képzettségűeket (ami a kognitív képességre vonatkozó indirekt indikátor) és azokat, akik gyengébbek a közvetlenebb módon megállapított kognitív képességekben, valamint azon válaszadókat, akik relatíve kisebb a tudása illetve kisebb a kitettsége a témával kapcsolatos tudásnak és információknak. Krosnick szerint nincs véleményem válaszokat a legkevésbé adnak a magasabb képzettséggel rendelkezők; a fejlettebb kognitív képességekkel rendelkezők; akik többet tudnak a szóban forgó témáról; akiket jobban érdekel a téma; akiket érint a téma; azok, akinek több a témával kapcsolatos releváns viselkedési tapasztalatuk (behavioral experience); akik úgy érzik, hogy jobb képességekkel rendelkeznek a téma megértéséhez; és akik úgy érzik hogy másokat érdekel a témával kapcsolatos véleményük. A statisztikai elemző módszerek egy része a teljes adatkészletet feltevésével operál, ezért azok a megfigyelések, amelyek hiányzó értékeket tartalmaznak, elvesznek az elemzés számára. Ha a részleges nem válaszolás szintje növekszik, miközben erőfeszítések történnek a teljes nem válaszolási arány javítására, az a kutatókban azt a téves érzetet keltheti, hogy növelik a pontosságot, a valóságban pedig egyáltalán nem növekedett a rendelkezésükre álló minta nagysága (Mason, Lesser, W. Traugott271). Több kutatás alátámasztja, hogy a nem válaszolási kedv különbözik a minta egyes válaszolási csoportjai között. (mint azt már a nem válaszolás fejezetben részletesen tárgyaltuk). O’Neil272 azt találta, hogy a meggyőzött elutasítók (converted refusal) szignifikánsan különböztek a nem elutasítóktól (nonrefusal) kor, foglalkozás, végzettség, gyerek léte a háztartásban, és lakóhely típusa szerint, és még nagyobb különbséget tapasztaltak tartalmi változóknál. Hasonló tapasztalatokról számoltak be Mason, Lesser, W. Traugott273
egy
dél-dakotai
farmerekkel
készült
felmérés
esetében.
Azok,
akik
visszautasították a részvételt a felmérésben, majd mégis beleegyeztek a részvételbe, nagyobb gyakorisággal válaszoltak „nem tudom” válaszkategóriát.
271
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 272
O’Neil, M., “Estimating the Nonresponse Bias due to Refusals in Telephone Surveys,” Public Opinion Quarterly, 1979, pp. 218-232. 273
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002.
146
2.3.5.4 A részleges nem válaszolás kognitív modellje Krosnick274 beszámolt több vizsgálatról, amelyek bizonyítják, hogy „nem tudom” választ adhat gyorsan és lassan is a válaszoló attól függően, hogy a valamilyen releváns információ előhívható-e az emlékezetből vagy sem. Ezek alapján a következő modellt állították fel: Fokozat előtt: lehetségesnek tűnik, hogy néhány nincs véleményem válasz a kezdeti pillanatban következik be, még mielőtt a válaszadó egyáltalán nekiállna megpróbálni releváns információt előhívni. Például ha egy válaszoló nem is érti a kérdést és nem akar válaszolni, amíg nem magyarázták el neki, feltehetőleg „nem tudom”-ot mond. Első fokozat: a legáltalánosabban feltételezett ok az, hogy a válaszolónak nincs attitűdje vagy a válaszoló nem rendelkezik a szükséges információval és/vagy nincs tapasztalata abban, hogyan fogalmazza meg attitűdjét. Második fokozat: itt a válaszok már az ambivalencia miatt keletkezhetnek, vannak olyan válaszolók, akik sokat tudnak a tárgyról és/vagy erős érzelmeik vannak azzal kapcsolatban, de a gondolataik és/vagy érzéseik esetleg nagyon ellentmondásosak, ami megnehezítheti az egyszerű válasz melletti döntést. Harmadik fokozat: az a pont, amikor a válaszoló megpróbálja lefordítani a végiggondolt, fejében keletkezett választ valamelyik kérdőíven megadott választási lehetőségre és nem talál megfelelő kategóriát. Ilyen például az a válaszoló, akinek van információja a tárgyról, semleges a beállítottsága azzal kapcsolatban, és úgy teszik föl a kérdést, hogy nincs semleges válaszlehetőség, amit válaszolni szeretne. 2.3.5.5 A részleges nem válaszolás – összegzésképpen A részleges nem válaszolás okozat jellegű hiba, sok esetben más mérési hibák manifesztációja. Végigvettük, hogy milyen események hívhatják életre ezt a kimenetelt, bemutattuk továbbá, hogy az explicit nem tudom válaszkategória szerepeltetése hatással van a válaszokra, de tudjuk azt is, hogy a ténykérdések és az attitűd-kérdések esetében másféle kezelést igényel a nem tudom válaszlehetőség. Ennek oka, hogy az attitűd-kérdések esetében
274
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So
147
azt gondolhatjuk, hogy sokszor alulinformáltak a válaszolók, nincs véleményük a kérdésben, de a ténykérdések esetében a legtöbb kutató egyetért abban, hogy minimalizálni kell a nem tudom válaszlehetőségeket. A nincs vélemény válaszlehetőség nem tesz egyértelműen jót az adatminőségnek, mert sok olyan attitűd van, amit leginkább “látensként” lehetne címkézni, tehát nincs kiforrott álláspontja a válaszolónak. A vizsgálatok egy másik része azt sugallja, hogy a „nincs véleményem” válaszok gyakran nem a valódi véleményhiányból fakadnak, hanem inkább kutatási design-béli, vagy pszichológiai és kognitív tényezők okozzák őket.
148
3 Nem mintavételi hibák az Ifjúság2008 kutatásban275 A következőkben a rendelkezésre álló Ifjúság2008 adatbázisán és az adatfelvételi dokumentáció másodelemzése segítségével megvizsgáljuk a nem mintavételi hibák előfordulását. Megvizsgáljuk, hogy egyáltalán tapasztalható-e valamilyen eltérés az egyes lehetséges torzítási lehetőségekkel kapcsolatban és ahol lehetséges, megpróbáljuk a hatás irányát és nagyságát is megbecsülni. Természetesen a kutatás célja nem módszertani jellegű volt, azonban az átlagosnál jobban dokumentált adatfelvétel és a nagy mintanagyság – bizonyos megkötésekkel – lehetővé teszi a módszertani másodelemzést. Elsőként bemutatjuk az Ifjúság2008 kutatás módszertani szempontból, majd megvizsgáljuk, hogy a teljes fedési hibának milyen eseteit láthatjuk az adatfelvételben. A kapcsolatfelvételekre vonatkozó adatbázis alapján a teljes elutasítókat vizsgáljuk, elsőként meghatározzuk a visszautasítási arányokat. A teljes válaszmegtagadók demográfiáját elemezzük, majd összehasonlítjuk azokkal az esetekkel, ahol többszöri felkeresésre jöhetett csak létre a kérdőív interjú. A mérési hibák közül elsőként a kérdezőbiztosi szórást számoljuk ki két kérdéssoron, majd a kérdezőbiztos és a válaszoló társadalmi távolságának hatását elemezzük. A kérdőív hatását próbáljuk demonstrálni a FRE értékének meghatározásával, illetve a kontextus hatás érzékeltetésével, de erőfeszítéseink kevés kézzelfogható eredményt hoztak. A részleges válaszmegtagadás esetén vizsgáltuk az egyes kérdéstípusok hatását, a részleges
válaszmegtagadók
demográfiáját
és
kísérletet
teszünk
klasztercsoportok
létrehozására a válaszmegtagadási dimenziók mentén kifeszített térben.
3.1 A kutatás bemutatása 3.1.1 A kutatás előzménye és célja Az Ifjusag2008 kutatás a harmadik olyan kísérlet – a rendszerváltás folyamatának kezdete óta –, amely megpróbálja a társadalomtudomány, a szociológia eszközeivel leírni azokat
a
társadalmi,
gazdasági
átalakulásoknak
(is)
köszönhető
változásokat
és
jellegzetességeket, amelyek a 15-29 éves fiatalokat érintik. A 2000 óta négyévente lefolytatott nagymintás, a 15–29 eves korosztályt vizsgáló ifjúsági adatfelvétel egyik célja annak rögzítése, hogy az előző felvétel(ek)hez képest mennyiben, milyen módon változtak az 275
Ifjúság2008 Gyorsjelentés, szerkesztette: Bauer Béla, Szabó Andrea, 2009. Budapest,
149
ifjúsági korosztályok iskoláztatását, elhelyezkedését, karrierjét, önállósodását és boldogulási esélyeit befolyásoló társadalmi tényezők, továbbá hogy ezek a hatások hogyan tükröződnek a fiatalok életmódjában, szabadidős tevékenységében, kulturális fogyasztásban. A kutatás további céljai többek között, hogy a magyarországi fiatalok anyagi es kulturális erőforrásairól, életmódjáról es értékrendszeréről horizontálisan es vertikálisan is képet kapjunk, területi és időbeli összehasonlításokat tehessünk. További kitőzött cél, hogy Magyarország polgárai, döntéshozói, szervezetei, kutatóműhelyei részére összehasonlító adatokkal szolgáljanak; mind módszertani (empirikus szociológia), mind tartalmi (vizsgált dimenziók) szempontjából lehetőséget adjunk a későbbi összehasonlíthatóság, illetve a helyi, megyei illetve regionális kutatásokra, gyakorlati használatban való alkalmazásokra (pl.: ifjúsági koncepciók kidolgozására). Az előző nagymintás vizsgálatokhoz képest a 2008-ban elvégzett survey vizsgálat kvalitatív (fókuszcsoportos) szakasszal bővült, amelynek funkciója az volt, hogy pontosabban fel lehessen tárni a fiatalok életmenetére hatást gyakorló döntéseket. Az Ifjusag2008 kutatási programot a Szociális es Munkaügyi Minisztérium rendelte meg, és a Munkaerő-piaci Alap Képzési Alap illetve a Munkaerő-piaci Alap Foglalkoztatási Alap finanszírozta, vezető kutatói a Szociálpolitikai és Munkaügyi Intézet Gyermek és Ifjúságkutatási főosztályának dolgozói, a kutatás vezetője Bauer Béla. Az adatfelvételt a Marketing Centrum Országos Piackutató Intézet készítette. 3.1.2 A kérdőív témakörei és a minta kialakítása A kérdőív összesen 14 igen szerteágazó témakört tartalmazott. A legfontosabb, kiemelten kezelt témakör a munkaerőpiaci jellemzők (első munkába állás, jelenlegi es korábbi munkahelyek, munkavállalási tervek) voltak. Az ifjúságkutatásokban hagyományosan fontos témakörök – iskolázottság, családi háttér, szabadidő eltöltés – mellett hangsúlyos téma volt az ifjúsági szolgáltatások igénybevétele. Az Ifjúság2008 kutatás első szakaszához, a survey vizsgálathoz 8076 fős (négy 2000 fős), a 15–29 éves korosztályt országosan reprezentáló mintát készített a Marketing Centrum.
150
33. ábra Az Ifjúság2008 mintájának kompozíciója
A mintának területileg (régiók), településnagyság (településtípusok), korcsoportok és nemek szerint kellett tükröznie a vizsgált népességet. A minta készítéséhez a Közigazgatási és Elektronikus Közszolgáltatások Központi Hivatala276 2007. december 31-én érvényes adatállományát használták fel, amely településenként tartalmazza az érvényes lakóhellyel rendelkező és az adott korosztályba tartozó lakosság létszámát férfiakra és nőkre vonatkozóan, születési évenkénti bontásban. A mintavétel során a 15–29 éves korosztályt 3 korcsoportba sorolták. A 15–18 éves korcsoport az 1990–1993 években, a 19–24 éves korcsoport az 1984–1989 években, a 25–29 éves korcsoport az 1979–1983 években születetteket jelenti. A települések besorolása a következő 6 településnagyság-kategória szerint történt: Budapest, megyei jogú város, 5000 fő feletti település (Budapest és a megyei jogú városok kivételével), 2000 és 4999 fő közötti település, 500 és 1999 fő közötti település, 500 fő alatti település. A kutatás tervezés során külön szempont volt a régiók szerinti összehasonlítás lehetősége, különös biztosította a mintavételi terv, hogy Magyarország 7 régiója (1. Közép-Magyarország, 2. Közép-Dunántúl, 3. Nyugat-Dunántúl, 4. Dél-Dunántúl, 5. Észak-Magyarország, 6. Észak-Alföld, 7. DélAlföld) szerint is reprezentatív legyen az adatfelvétel. A mintavétel tervezése során cél volt, 276
BM Központi Nyilvántartó és Választási Hivatal jogutódja.
151
hogy – az elemszámok által korlátozott mértékben – megyei szintű elemzéseket is lehessen végezni, ennek érdekében a minta a megyéken belüli településnagyságok szerinti népességarányokat is követi. A kutatócsoport úgy döntött, hogy az Ifjúság2008 kutatás mintáját 4x2000 fős és 2x4000 fős mintára bontva a négy, illetve a két almintán egymástól részben különböző kérdőívet kérdeznek le. Ennek a döntésnek a legfőbb oka az volt, hogy néhány fontosnak ítélt altéma elemzéséhez elegendő a 2000 fős, illetve a 4000 fős országos minta, és így lehetőség nyílt arra, hogy az eredetileg tervezett interjúidő jelentős túllépése nélkül lényegesen több témát járhasson körül a vizsgálat. A mintavétel két szakaszból állt. Először az e célra kifejlesztett speciális Telepbank nevű program segítségével elkészítette a Marketing Centrum a települések mintáját, összesen négyet (4x2.000), melyek külön-külön is leképezik az ország településstruktúráját regionális elhelyezkedés és településnagyság szerint. A következő lépésben a Közigazgatási és Elektronikus Közszolgáltatások Központi Hivatala adatállománya alapján a négy almintára külön-külön megyénként arányosították a megkérdezendők demográfiai jellemzőit két demográfiai szempont: neme (férfi, nő), illetve életkora (15–18 év, 19–24 év, 25–29 év) szerint. Ezek után az arányok és az előzőleg elkészített településminta alapján meghatároztuk, hogy egyes településeken pontosan hány, és milyen demográfiai jellemzőkkel bíró személyt kell megkérdezni. Az arányosítás során a kerekítések miatt természetesen kisebb torzulások keletkeztek. Például az elméletileg kiszámított 3,4 férfi helyett az adott településen 3 vagy 4 férfit kérdeztek meg. Ezeket a torzulásokat megyei szinten korrigálták. A demográfiai jellemzők és a kapott településminta alapján a Közigazgatási és Elektronikus Közszolgáltatások Központi Hivatala véletlenszerűen választotta ki azokat a személyeket, akik a mintába kerültek. Az eljárást követően összesen 552 település került a mintába. A négy 2000 fős alminta különkülön is reprezentatívnak tekinthető, és a négy almintában a fővárosi kerületeket és a megyei jogú városokat leszámítva más-más települések kerültek. Egy ilyen típusú vizsgálatnál számítani kell arra, hogy a címlistában szereplő személyek közül nem lehet mindenkit megtalálni, és nem mindenkivel sikerül kérdőíves interjút készíteni, ezért az eredeti címek mellé szigorú szabályok szerint használandó pótcímlistákat biztosítottak, minden főcímhez 3 pótcímet rendelve. 152
A címlistához a címeket 3 korcsoportra bontva nemenként külön kértük. A települések neve mellett feltüntették, hogy ott pontosan hány adott korú és nemű fiatalt kell megkérdezni. Az összesen nagyjából 34 000 címet 24 különálló adatállomány tartalmazta. A minta kialakításánál az elméleti meggondolásokon túl olyan praktikus szempontokat is figyelembe kellett venni, amelyek segítették az adatfelvétel racionális megszervezését. A mintát ennek érdekében úgy alakították ki, hogy egy településen (az 500 fő alatti településeket kivéve) legalább 5 főt kelljen megkérdezni. Az adatfelvétel közben azzal az – előre látható és előre kalkulált – problémával szembesültek, hogy a megvalósult megkérdezések nagyjából 28 százalékában a mintában szereplő főcímeken és a hozzájuk rendelt pótcímeken sem lehetett elkészíteni az interjút, így az eredeti és optimális mintavételi terv korrekcióra szorult. Az adatfelvétel során a kiesők esetében kvótás pótlásról gondoskodtak, azaz ugyanolyan településnagyságú településen, ugyanolyan nemű és ugyanolyan korcsoportba tartózó, de a címlistában nem szereplő személlyel készült el a kérdőíves interjú. 34. ábra A vizsgált korosztály korévenként, 2000-ben, 2004-ben és 2008-ban (fő) 200000 180000 160000 140000 120000 100000 80000 60000 40000 20000 0 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 2000
2004
2008
Az alminták készítésmódjából következően, illetve az adatfelvétel során kisebb eltérések keletkeztek az elméletileg várható mintamegoszlástól. Ezeket a kisebb aránytalanságokat több szempontos súlyozással korrigálták. A súlyozás szempontjai: nemek,
153
korcsoportok és településnagyság. Az így kialakított minta összesen 2 031 735 fő 15–29 éves magyarországi lakost reprezentál. 16. táblázat
A sikeres megkérdezések és meghiúsulási okok összefoglalása Összesen
Főcím
1. pótcím
2. pótcím
3. pótcím
Kvóta
a kérdőív elkészült alkalmatlan (pl. beteg) válaszmegtagadás szülő nem engedélyezi elhunyt nem elérhető elköltözött, nem elérhető elköltözött, elérhető egyéb rossz cím felkeresett címek összesen
8068 174 6904 339 5 3629 1101 38 116 70 20444
3247 80 2302 196 2 1326 599 23 61 40 7876
1324 36 1734 76 0 1111 283 13 30 15 4622
925 25 1337 46 2 771 163 1 21 10 3301
297 33 1531 21 1 421 56 1 4 5 2370
2275 0 0 0 0 0 0 0 0 0 2275
a címlistákban összesen
34395
8030
8030
8029
8031
2275
nem keresték
13951
0
3408
4728
5661
Az adatfelvétel során a kérdezőbiztosi instrukciókban és magában a kutatási dizájnban is kiemelkedő szerepet tulajdonítottak a válaszolók főcímen való elérésére. A kérdezőbiztosok elsőként csak a főcímeket kapták meg, majd egy viszonylag hosszabb – 6 hetes – adatfelvételi periódus után osztották ki számukra a pótcímeket, így a kérdezőbiztosok a főcímek elérésére jóval több időt és energiát áldoztak. Ennek hatását több esetben is látni fogjuk, amikor az adatfelvétel egyes paramétereit vizsgáljuk majd a címtípus tükrében. Összességében tehát az adatfelvétel során a 8068 kész interjúhoz 20444 címet kellett felkeresni. Természetesen az egyes felkeresési statisztikák változhatnak az egyes címtípusonként, illetve nem értelmezhetők a kvótás kérdezés körülményeire vonatkozóan.
154
Elsőként nézzük át az összes elkészült interjú címstatisztikáját részletesen. A sikeres megkérdezések több, mint 40%-a készült el főcímen,közel harmaduk (28,20%) esetében pedig elfogytak a dedikált pótcímek és kvótás mintapótlást kellett alkalmazni. 17. táblázat Főcím befejezett interjúk aránya felkeresett címek aránya felkeresésre jutó interjúszám interjúra jutó felkeresés szám
40,25% 38,52% 0,41 2,43
Az egyes címtípusok statisztikái 1. pótcím
2. pótcím
3. pótcím
16,41% 22,61% 0,29 3,49
11,47% 16,15% 0,28 3,57
3,68% 11,59% 0,13 7,98
Kvóta 28,20% 11,13% -
Összesen 100% 100%
Az egyes címtípusokat illetően elmondható, hogy a pótcímek esetében jóval több felkeresés volt szükséges egy elkészült interjúhoz, mint a főcímek esetében. A főcímek esetében közel két és fél megkeresésre készül el egy kérdőív, ugyanakkor a 3. pótcím esetében ez az arány már közel nyolcszoros megkeresés kell egy elkészült kérdőívhez. Ennek legfőbb oka lehet, hogy a könnyebben elérhető, nagyon válaszadási kedvvel rendelkező csoportok már az első (fő)címen válaszolnak a kérdőívre, így a pótcímeket csak a problémásabbnak nevezhető válaszadók esetében keresik fel. Ebből kifolyólag érthető, hogy ezek a címek sokkal rosszabb visszautasítási és nem válaszolási arányokat produkálnak. Fontos megjegyezni, hogy a kvótás minta esetében mindegyik felkeresés a dokumentációs gyakorlat szerint sikeresnek minősül, így a kapcsolatfelvétel sikerességi aránya teljes (100%).
155
3.2 Fedési hiba „nyomai” Az Ifjúság2008 kutatás mintavétele során címlistás megkeresést alkalmaztak, a fedési hiba szempontjából tehát kulcsfontosságú mozzanat a címlista pontossága. A kutatás dokumentációja és megkeresési statisztikái alapján csak azokat az elemeket tudjuk bevonni a vizsgálatba, akik legalább a mintakeretbe bekerültek. Fedési hibáról akkor beszélhetünk ebben az esetben, ha a személy bekerül a mintakeretbe, pedig nem kellett volna kerettaggá válni, valamint azokban az esetekben, ahol a nyilvántartás pontatlansága miatt nem elérhető a mintatag. A kutatási dizájn és az alkalmazott mintavételi eljárásból fakadóan sajnos alkalmatlan a rendelkezésre álló módszerünk arra, hogy a nem lefedettekről állításokat fogalmazzunk meg. Az így végzett elemzésünk alapján meg tudjuk becsülni, hogy a minta forrásában – azaz a Közigazgatási és Elektronikus Közszolgáltatások Központi Hivatalának adatállományában – mekkora az elavult címek aránya a kutatás célcsoportjában, azaz a 15-29 évesek között. Fontos megjegyezni, hogy a kapott eredmények koránt sem auditálják vagy validálják a Hivatal teljes címállományát, a kapott eredményeket nem lehet általánosítani a teljes magyar lakosság címnyilvántartásának minősítésére. Ennek legfőbb oka, hogy a korosztályra egyszerre jellemző a lakóhely állandósága (középiskolások, szülői háztartásban élők, saját családdal rendelkezők) illetve az akár az országhatárokon túlra is irányuló nagyfokú mobilitás (egyetemisták, fiatal felnőttek, pályakezdők). A fedési hiba elemzése során tehát a státusz kódok közül a következőket vonjuk be az elemzésbe: 18. táblázat Státuszkódok
Átlagosan a kérdőív elkészült
fedési hiba
A fedési hiba státuszkódjai
elhunyt elköltözött, nem elérhető elköltözött, elérhető rossz cím összesen teljes alkalmatlan (pl. beteg) nem válaszolás válaszmegtagadás szülő nem engedélyezi nem elérhető egyéb összesen
39,46% 0,02% 5,39% 0,19% 0,34% 5,94% 0,85% 33,77% 1,66% 17,75% 0,57% 54,60%
156
Főcím 41,23% 0,03% 7,61% 0,29% 0,51% 8,43% 1,02% 29,23% 2,49% 16,84% 0,77% 50,34%
1. pótcím 28,65% 0,00% 6,12% 0,28% 0,32% 6,73% 0,78% 37,52% 1,64% 24,04% 0,65% 64,63%
2. pótcím 28,02% 0,06% 4,94% 0,03% 0,30% 5,33% 0,76% 40,50% 1,39% 23,36% 0,64% 66,65%
3. pótcím 12,53% 0,04% 2,36% 0,04% 0,21% 5,94% 1,39% 64,60% 0,89% 17,76% 0,17% 84,81%
Összesen tehát a felkeresések 5,94%-a hozható kapcsolatba a mintavételi keret pontatlanságával. Az egyes hullámok közötti eltéréseket vizsgálva a meghiúsulási okok fedési hibával kapcsolatba hozható arányában összességében csökkenés tapasztalható, amely elvileg nem lehet a „pontosság növekedésének” javára írni, hiszen a minta kialakítása során az egyes címek véletlenszerűen kapták a főcím illetve a pótcím státuszt. Nehéz a fedési hiba esetében interpretálni az egyes címhullámok közötti eltéréseket. A kódkategóriák közül az ingadozás (csökkenés) legnagyobb részét az elköltözött, nem elérhetők illetve az elérhető elköltözöttek arányának csökkenése teszi ki. Elképzelhető, hogy a kérdezőbiztosok nagyobb erőfeszítést tesznek azért, hogy legalább a kapcsolatfelvételig eljussanak. Az egyes hibakódok alacsony számossága miatt részletesebb elemzést – a nem túl sok rendelkezésre álló változó mentén –csak azokban az esetekben tudunk végezni, ahol a címen keresett fiatal elköltözött és nem elérhető (összesen 1101 kapcsolatfelvétel esetében). Ezek alapján megállapítható, hogy nemenként nem mutathatók ki szignifikáns eltérések (Chi négyzet próbával), ugyanakkor a válaszoló korcsoportja már összefüggött a meghiúsulás ezen okával. 19. táblázat
Az elköltözött, nem elérhető meghiúsulási kódok előfordulási aránya korcsoportonként
Korkategóriák 25-29 19-24 15-18 összesen
Átlagosan 10,25% 7,76% 3,64% 7,61%
Főcím 7,71% 6,68% 2,41% 6,12%
1. pótcím 5,81% 5,30% 2,68% 4,94%
2. pótcím 2,71% 3,03% 0,41% 2,36%
3. pótcím 6,80% 5,70% 2,50% 5,39%
Az eredmények alapján elmondhatjuk, hogy a nem elérhető elköltözöttek a fiatalabb korcsoportban (15-18 évesek között) kisebb arányban találhatók, mint a két idősebb korcsoportban. Ennek egyik kézenfekvő oka – ahogy a bevezetőben már erre felhívtuk a figyelmet – hogy az ebbe a korosztályba tartozók közül még a szülői háztartásban élnek a legtöbben, tehát a hivatalos nyilvántartások számára rendezettebb, kevésbé gyorsan változó körülmények között. Az is megállapítható, hogy mindhárom korcsport esetén az első főcím esetén tapasztalt arányok csökkenek az 1. és 2. pótcímen, ugyanakkor a 3. pótcímen a főcímhez hasonló arányokat tapasztalunk. Ezek azonban nem szignifikáns eltérésnek tekinthetők, hiszen a fő és pótcímeket eltérő módon kezelték a kutatási dizájn során.
157
35. ábra Az elköltözött, nem elérhető meghiúsulási kódok előfordulási aránya megyénként
Az elköltözöttek aránya megyénként nagy különbségeket mutat. Kiemelkedően magas arányban találhatóak ilyen meghiúsulási okok Békésben, majd követi Csongrád és GyőrMoson-Sopron megye. Jóval átlag alatti az elköltözöttek aránya ugyanakkor Budapesten és Pest megyében. Ezek az értékek nem tisztán az egyes területi nyilvántartásokat minősítik, természetesen magukban foglalják a meghiúsulási kódot kiosztó kérdezőbiztos szubjektív megítélését, valamint olyan területenként eltérő makro gazdasági és társadalmi hatásokat is, amelyek jóval túlmutatnak a felvétel horizontján. 158
3.3 Teljes nem válaszolás – nem válaszolók, nehezen elérhetők A teljes nem válaszolás vizsgálatakor a kutatás dokumentáció közül ismét a megkeresési statisztikákat vizsgáljuk. A már ismert összefoglaló táblázatban bemutatjuk státuszkódok szerint, hogy milyen kimenetelekkel definiáltuk a teljes nem válaszolás eseményét. 20. táblázat
A teljes nem válaszolás státuszkódjai
Státuszkódok
Átlagosan a kérdőív elkészült
teljes alkalmatlan (pl. beteg) nem válaszolás válaszmegtagadás szülő nem engedélyezi nem elérhető egyéb összesen fedési hiba elhunyt elköltözött, nem elérhető elköltözött, elérhető rossz cím összesen
39,46% 0,85% 33,77% 1,66% 17,75% 0,57% 54,60% 0,02% 5,39% 0,19% 0,34% 5,94%
Főcím 41,23% 1,02% 29,23% 2,49% 16,84% 0,77% 50,34% 0,03% 7,61% 0,29% 0,51% 8,43%
1. pótcím 28,65% 0,78% 37,52% 1,64% 24,04% 0,65% 64,63% 0,00% 6,12% 0,28% 0,32% 6,73%
2. pótcím 28,02% 0,76% 40,50% 1,39% 23,36% 0,64% 66,65% 0,06% 4,94% 0,03% 0,30% 5,33%
3. pótcím 12,53% 1,39% 64,60% 0,89% 17,76% 0,17% 84,81% 0,04% 2,36% 0,04% 0,21% 5,94%
Összesen tehát a kapcsolatfelvételek 39,46%-át sikerült lekérdezni. A teljes nem válaszolás eseményterében a legmarkánsabban megjelenő – és összességében a megkeresések több, mint 1/3-ára jellemző – meghiúsulási ok a válaszmegtagadás. Az Ifjúság2008 kutatás válaszolói között a fiatalkorúak esetében szükséges volt, hogy a válaszadásba a szülői is beleegyezzen. A szülői belegyezéssel hiányát is a válaszmegtagadókhoz számoljuk, akkor összesen a felkeresésesek összesen 35,43%-a végződött a kooperáció megtagadásával. 3.3.1 Nem-válaszolási arányok az Ifjúság2008 kutatásban Elsőként vizsgáljuk meg, hogy az Ifjúság2008 kutatás esetén hogyan alakulnak a nem válaszolási arányok. A Groves alapján bemutatott válaszadási arányszámítások szerint az Ifjúság2008 felmérésben a következő kimenetelek definiáltak:
159
21. táblázat kimenetel
Ifjúság2008 kimenetelek és jelöléseik
jelölés Összesen
teljes interjú részleges interjú (nincs adat) nem-kontaktált, de ismert, elérhető egység visszautasító elérhető egység (válaszmegtagadók és szülői engedély hiánya) nem elérhető egység egyéb nem interjúvolt egység
1. 2. pótcím pótcím 3247 1324 925 0 0 0
Főcím
3. Kvóta pótcím 297 2275 0 0
I P
8068 0
NC
174
80
36
25
33
0
R
7243
2498
1810
1383
1552
0
NE NI
3629 290
1326 141
1111 66
771 46
421 37
0 0
19404
7292
4347
3150
összesen
2340 2275
A részleges interjút jelen esetben csak nagyon komplex módon lehetne definiálni, elvileg az adatbázis csak teljes interjúkat tartalmaz. Groves alapján a kooperációs arány az összes elkészült interjú és az összes kontaktált eset arányát jelenti és leginkább akkor használható, ha az interjúkészítők meggyőzőképességét, sikerességét szeretnénk jellemezni. Jelen esetben az egész adatfelvételre és az egyes hullámokra számolva a következőképpen alakul277: 22. táblázat
Kooperációs arány az Ifjúság2008 felmérésben
Összesen
Főcím
1. pótcím
2. pótcím
3. pótcím
0,53
0,57
0,42
0,40
0,16
Az egész adatfelvételre számolva ez az arány 0,53, de jól tetten érhető a már tapaszalt átstrukturálódás a meghiúsulási okok esetében: a főcímen tapasztalt 0,57-es kooperációs arány a 3. pótcím esetében már csak 0,16. A csökkenés oka ebben az esetben valószínűleg a hatékonyabban lebonyolítható kvótás felvételt preferáló kérdezőbiztosok alulmotiváltsága, illetve a már említett főcímek és pótcímek eltérő kezelése az adatfelvétel során. Esetünkben gyakorlatilag nem változtat az arányok értékein, ha egy másik számítás szerint a nevezőhöz hozzáadjuk még a nem kontaktált esetek számát (0,51 az értéke az egész
277
A kooperációs aránya az I/(I+P+R) képlettel számolva.
160
mintára számolva), de az általánosabban, teljesebb körben jóváhagyott válaszadási arányt számoljuk, akkor sem kapunk nagyságrendekkel különböző értékeket. 278 23. táblázat
Válaszadási arány az Ifjúság2008 felmérésben
Összesen
Főcím
1. pótcím
2. pótcím
3. pótcím
0,51
0,54
0,41
0,39
0,15
Ebben a képletben a nevező tartalmaz minden olyan esetet, ahol az interjú elkészülhetett volna, Groves szerint ez méri a legjobban az elérhető személyek arányát. 3.3.2 Visszautasítók és nem elérhetők Elsőként a kapcsolatfelvételek között megvizsgáljuk, hogy az egyes demográfiai csoportokon belül az egyes kimenetelek milyen arányban képviseltetik magukat. A kapcsolatfelvételi adatbázisban összesen 20375 kapcsolatfelvételt vontunk be a vizsgálatunkba. A meghiúsulási kódok alapján az összes kapcsolatfelvételt 4 kategóriára bontottuk. 24. táblázat
Teljes nem válaszolás meghiúsulási kódok alapján
A kérdőív elkészült válaszmegtagadás, szülő nem engedélyezi nem elérhető egyéb Összesen
kapcsolatfelvételek kapcsolatfelvételek száma aránya (%) 8068 39,46 7243 35,42 3629 17,75 1504 7,35 20444 100,0
Az elemzésben, a továbbiakban a 7243 válaszmegtagadás és 3629 nem elérhető meghiúsulási kódokat vizsgáljuk az elérhető néhány változó mentén, de a teljesség kedvéért bemutatjuk az elkészült kérdőívek illetve az egyéb ok miatt el nem készült interjúk megoszlását is.279.
278
Válaszadási arány az I/(I+P+NC+R+NI) képlettel számolva.
279
Chi négyzet, szignifikáns eltérések, PASW 18 (SPSS 18) programcsomaggal
161
25. táblázat
Budapest Komárom Hajdú-Bihar Baranya Győr Pest Csongrád Békés Bács-Kiskun BAZ Szabolcs Veszprém Nógrád Fejér Vas Heves Zala Tolna Somogy Szolnok átlagosan
a kérdőív elkészült 33,50% 33,90% 34,30% 36,10% 36,60% 37,60% 40,10% 40,30% 40,70% 41,00% 41,20% 42,00% 42,60% 42,90% 42,90% 44,00% 46,90% 51,60% 57,40% 59,50% 39,46%
A meghiúsulási kódok aránya megyénként válaszmegtagadás, szülő nem engedélyezi 48,80% 34,40% 35,20% 20,70% 22,40% 43,70% 33,30% 16,20% 36,70% 28,80% 46,70% 20,40% 36,30% 42,40% 35,40% 29,10% 23,20% 27,30% 24,50% 27,90% 35,42%
nem elérhető 13,90% 24,30% 22,00% 33,40% 31,20% 13,00% 16,30% 31,20% 14,40% 22,50% 6,40% 30,70% 12,50% 8,30% 11,50% 17,80% 24,10% 15,30% 12,80% 7,30% 17,75%
egyéb
összesen
3,80% 7,50% 8,50% 9,80% 9,70% 5,70% 10,30% 12,30% 8,20% 7,70% 5,70% 6,90% 8,60% 6,50% 10,30% 9,20% 5,80% 5,80% 5,30% 5,40% 7,35%
100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00%
A befejezett kérdőívek aránya Jász-Nagykun-Szolnok megyében a legkedvezőbb, ami csak valamivel magasabb mint Somogyban. A válaszmegtagadás leginkább Budapestre jellemző, ahol is közel minden második megkeresés végződik válaszmegtagadással (48,80%). Kiemelkedően magas arányokat találunk még Szabolcsban (46,70%), valamint Pest (43,70%) és Fejér (42,40%) megyében is. A nem elérhetők aránya kiemelkedően magas Baranya (33,40%), Győr (31,20%), Békés (31,20%) és Veszprém (30,70%) megyében. Ezekben a megyékben a többi megyéhez képest extrém magas a nem elérhetők és ezzel együtt párhuzamosan extrém módon alacsony a válaszmegtagadók aránya.
162
36. ábra Válaszmegtagadási arányok – régiónkénti átlagok280
A válaszmegtagadási arányokat régiónként vizsgálva kiemelkedik Budapest és Pest megye, és jól láthatóan elkülönülnek alacsonyabb válaszmegtagadási arányuk a déli, illetve a nyugati régiók. Nem találtunk érdemleges eltéréseket a férfiak és a nők között a válaszmegtagadás és az elkészült kérdőívek arányában: a férfiak esetében 39%, a nők esetében 40,2% az elkészült kérdőívek aránya, és ezzel szinkronban a férfiak között a válaszmegtagadók aránya 36%, a nők esetében pedig 35%. 26. táblázat
A meghiúsulási kódok korcsoportonként
a kérdőív elkészült
válaszmegtagadás, szülő nem engedélyezi
nem elérhető
egyéb
összesen
25-29
37,4%
35,2%
18,9%
8,5%
100,00%
19-24
39,3%
34,9%
18,6%
7,3%
100,00%
15-18 átlagosan
43,7% 39,5%
37,3% 35,4%
14,8% 17,8%
4,2% 7,4%
100,00%
korcsoport
280
Kép forrása: http://www.terport.hu/showimg.php?id=2491
163
100,00%
A válaszoló korcsoportja szerint vizsgálva megállapítható, hogy minél fiatalabb a válaszoló, annál nagyobb az esélye, hogy elkészül a kérdőív, de ennek oka nem a magasabb kooperációs szándékban, inkább a jobb elérhetőségben keresendő. A fiatalok korcsoportjában a legmagasabb a válaszmegtagadók aránya is, ugyanakkor a nem elérhetők itt vannak arányaiban a legkevesebben. Vizsgáljuk meg, hogy van-e különbség a korcsoport tapasztalt hatásában, ha nemenként vizsgáljuk. 27. táblázat
A meghiúsulási kódok kor és nem szerint
nem
korcsoport
a kérdőív elkészült
válaszmegtagadás, szülő nem engedélyezi
nem elérhető
egyéb
összesen
férfiak
25-29 19-24 15-18
36,9% 38,6% 43,1%
35,5% 35,6% 37,6%
19,3% 18,9% 15,8%
8,3% 6,8% 3,5%
100,0% 100,0% 100,0%
38,0% 40,0% 44,4% 39,5%
34,9% 34,1% 36,9% 35,4%
18,4% 18,2% 13,8% 17,8%
8,7% 7,8% 4,9% 7,4%
100,0% 100,0% 100,0% 100,0%
nők
25-29 19-24 15-18 átlagosan
Mindkét nem esetén megfigyelhető a korcsoport már ismert hatása, azaz a fiatalabb korcsoport esetén több elkészült kérdőív, magasabb visszautasítás, idősebbek korcsportok esetén pedig kevesebb elérhető mintatag. Ezek a hatások valamelyest erősebbek a férfiak esetében, mint a nőknél, a különbség szignifikáns281, tehát a legmagasabb válaszmegtagadás a fiatal férfiak között tapasztalható, a legmagasabb kooperáció pedig a fiatal nők között tapasztalható. 3.3.3 Nehezen elérhetők demográfiai különbségei Az Ifjúság2008 elkészült interjúi esetében feljegyezték, hogy hány felkeresésre készült el az interjú. Röviden megvizsgáljuk, hogy az alapvető demográfiai változók mentén milyen eltérések tapasztalhatók. Alapvető kérdésünk, hogy milyen hasonlóság, együtt járás tapasztalható a nem válaszolókat és a nehezen elérhető válaszolók között. Összességében tehát a 8076 interjú esetében a következőképpen alakulnak a felkeresések megoszlása:
281
Chi négyzet, szignifikáns eltérések, PASW 18 (SPSS 18) programcsomaggal
164
28. táblázat
A sikeres interjúhoz szükséges felkeresések száma
felkeresések száma
esetek száma
arány (%)
1
6493
80,4
2
1075
13,3
3 vagy több
508
6,3
összesen
8076
100,0
A korral és a legmagasabb befejezett iskolai végzettséggel a felkeresések száma nem mutatott értékelhető összefüggést, a településtípus hatása azonban nagyon érdekesen alakul. 29. táblázat településtípus
Felkeresések száma településtípusonként 1
2
3 vagy több
összesen
főváros
86,5%
10,4%
3,1%
100,0%
megyei jogú város
82,9%
10,4%
6,7%
100,0%
város
78,6%
14,3%
7,1%
100,0%
község átlagosan
78,0%
15,2%
6,7%
100,0%
80,4%
13,3%
6,3%
100,0%
A nagyobb városokban és a fővárosban az interjúk nagyobb része készült el az első felkeresésre, mint a községekben és a városokban élők esetében. Ennek egyik lehetséges oka, hogy más a kérdezőbiztos viszonya a helyi lakosokkal, tehát a községekben nagyobb eséllyel próbálkozik a kérdezőbiztos másodszorra és akár harmadszorra. Ezzel szemben a nagyobb városokban, és különösen Budapesten, ha nem sikeres az első felkeresés, a kérdezőbiztosok nem is adnak esélyt a második vagy harmadik próbálkozásnak. A nemek szerint vizsgálva a férfiak között magasabb a 3 vagy többszöri felkérésre elértek aránya és valamelyest alacsonyabb az első felkeresésre sikeres interjút adók aránya.
165
30. táblázat
A felkeresések száma a mintába kerülés hulláma szerint
címazonosító
1
2
3 vagy több
összesen
főcím
63,8%
23,7%
12,5%
100,0%
1 pótcím
82,9%
13,1%
4,1%
100,0%
2. pótcím
84,2%
12,2%
3,6%
100,0%
3. pótcím
88,6%
6,1%
5,4%
100,0%
kvótás ID átlagosan
100,0% 80,4%
100,0% 13,3%
6,3%
100,0%
A főcímen elkészült interjúk esetében jóval kisebb arányban találunk első felkérésre elkészült interjúkat. Ez a hatás egyértelműen a főcím preferálásának hatása, a főcímek esetében „rámenősebbek” voltak a kérdezőbiztos a kérdezés folyamán. A nehezen elérhető válaszolók esetében – szemben a válaszmegtagadókkal – nem játszott szignifikáns szerepet a korcsoport és a nem sem volt meghatározó, ugyanakkor a nagyobb városokban és a fővárosban az interjúk nagyobb arányban készültek el az első felkeresésre, mint a községekben és a városokban élők esetében. Ennek egyik oka – mint már említettük – maga a kérdezőbiztos lehet azzal, hogy nem ad esélyt a második illetve harmadik megkeresésnek. A nem válaszolók esetében láttuk ugyanakkor, hogy a legmagasabb a visszautasítás, ez ellentmondani látszik annak az elképzelésnek, amely szerint a nehezen elérhetők hasonlítanak a válaszolást teljesen megtagadókhoz.
166
3.4 Mérési hibák A mérési hibák közül elsőként a kérdezőbiztosi torzítás jelenlétét vizsgáljuk, majd a kérdőív és a kérdések torzító hatását, végül pedig a részleges válaszmegtagadás mintázatait és demográfiáját elemezzük. 3.4.1 Kérdezőbiztosi hatás A kérdezőbiztosi hatást két szempont szerint közelítjük meg. Egyrészt megvizsgáljuk, hogy a már ismertetett kérdezőbiztosi szórás számítási módszer milyen eredményhez vezet az Ifjúság2008 bizonyos kérdésein számolva. Másrészt megvizsgáljuk, hogy a kérdezőbiztos és a válaszoló társadalmi távolságának van-e kimutatható hatása. 3.4.1.1 A kérdezőbiztosi szórás A kérdőív összetettsége és bonyolultsága miatt a teljes adatbázis változói közül két kérdéscsoportot választottunk ki, melynél teszteltük, hogy a Kish féle statisztikával kimutatható-e a kérdezőbiztosok hatása. Az első csoport kérdései az elmúlt 10 év életszínvonalbeli változásra, illetve a következő 10 év várható életszínvonalbeli változásra vonatkoztak. Négy, háromértékű változóból épült fel ez a rész, melyeknél a „nem tudom” válaszokat a missing kategóriába soroltuk. A második csoportban szereplő kérdések arra vonatkoznak, hogy a fiatalok mennyire szólhatnak bele a politikába továbbá, hogy a politikusok mennyire figyelnek a fiatalok véleményére. A második kérdéscsoportba tartozó változók négyértékűek, ahol az „nem tudom” válaszok missing értéket kaptak. Mivel a
számítási képletben jelentős szerepe van a kérdezőbiztos által felvett
kérdőívek számának, nem hagyhattuk figyelmen kívül azt a tényt, hogy bizonyos kérdezőbiztosok csak 1-2 kérdőívet készítettek. Az alacsony elemszám torzította volna a képletet, így azokat a fiatalokat kiemeltük az adatbázisból, akiket olyan kérdezőbiztosok kérdeztek, akik 15 kérdőívnél kevesebbet vettek fel. A vizsgált kérdéscsoportoknál a missing értékek miatt a felvett kérdőívek száma tovább csökken, ezt viszont már nem vettük figyelembe, mivel kérdésenként külön számoltuk a
értékeket, így nem zárhattunk ki
olyan személyt, akinek legalább az egyik változónál érvényes értéke volt. A szűrés után 6860 fiatal maradt az adatbázisban. A
értéket minden kérdezőbiztosra külön számoltuk minden változónál. Majd
változónként átlagoltuk a kérdezőbiztosok értékeit. Az így kapott átlagok alapján elmondható, 167
hogy mind a nyolc vizsgált változót szenzitív változónak tekinthetjük, hisz értékeik 0,02 felett helyezkednek el. A
érték lehet negatív előjelű és pozitív előjelű is, ami annak
köszönhető, hogy ez az érték azt is megmutatja, hogy milyen irányban tér el a megfigyelt kérdezőbiztos az átlagos értéktől. Ha az előjellel rendelkező értékek abszolút értékét átlagoljuk, azt kapjuk meg, hogy átlagosan milyen erős az eltérés. Ez az átlagos eltérés az első csoportnál volt magasabb, vagyis az, hogy hogyan értékelik az ország, illetve a saját életszínvonalukat, szenzitívebb témának bizonyult, mint az a csoport, ahol a politikusok hozzáállásáról és a politikába való beleszólásról érdeklődnek. A
értékek a következő
képen alakultak: 31. táblázat
Az egyes kérdések átlagos
Kérdés
értékei átlagos értéke
1. Az elmúlt 10 évben hogyan alakult az ország gazdasági helyzete?
0,17
2. Az elmúlt 10 évben hogyan alakult az emberek életszínvonala?
0,14
3. A következő 10 évben hogyan fog alakulni az ország gazdasági helyzete?
0,1
4. A következő 10 évben hogyan fog alakulni az emberek életszínvonala?
0,11
5. Mennyire érdekli a helyi politikusokat a fiatalok véleménye?
0,08
6. Mennyire érdekli az országos politikusokat a fiatalok véleménye?
0,08
7. Mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe?
0,08
8. Mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe?
0,09
A kérdezőbiztosokról három változó áll a rendelkezésünkre: a kérdezőbiztos neme, életkora és iskolai végzettsége. E három változó mentén vizsgáltuk, hogy milyen összefüggés mutatható ki a kérdezőbiztosok
értékei szerint (itt a
A kérdezőbiztos neme és a
abszolút értékét vizsgáltuk).
érték között egyetlen változónál mutatható ki
szignifikáns összefüggés (0,01), a negyedik kérdésnél (A következő 10 évben hogyan fog alakulni az emberek életszínvonala?). A megmagyarázott hányad 2,9% volt. A férfiak átlagos értékei hat századdal magasabbak voltak, mint a nőké (férfiak: 0,152; nők: 0,0925), ami azt jelenti, hogy a férfi kérdezőbiztosok teljesítménye rosszabb volt. A kérdezőbiztos iskolai végzettsége és a
érték között egyetlen változónál sem
mutatható ki szignifikáns összefüggés. A kérdezőbiztosok korát mutató változó bekategorizálásával egy olyan változó alakult ki, melynek 10 értéke van, a legfiatalabb csoport a 15-20 évesek csoportja, míg a 168
legidősebbek a 60 éven felüliek. A 21-59 évesek 5 éves bontásban helyezkednek el. Szignifikáns összefüggés mutatható ki a korcsoport és az első csoport változói között annál a két kérdésnél, amely az elkövetkező 10 évre vonatkozik. A korosztály által megmagyarázott hányad mindkét változó esetében 9%. Az összefüggés iránya és jellege a két változónál azonos. Legjobb viselkedés (ahol a legkisebb volt a kérdezőbiztosi befolyásolás) a 26-30 évesek, illetve a 40 éven felüliek csoportjára volt jellemző. A legfiatalabb korosztály, vagyis a 15-20 évesek kérdezőinek viselkedése volt a kritikusabb, itt a
átlagos értéke elérte a 0,28-
at (a 26-30 évesek körében ez az érték 0,07 volt). A második kérdéscsoport közül három változónál mutatható ki szignifikáns összefüggés a korcsoport és a
értéke között. A három változó a következő volt:
1: Ön szerint mennyire érdekli az országos politikusokat a fiatalok véleménye? 2: Ön szerint mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe? 3: És mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe? (Ezen a településen.) Az első kérdésnél volt a legmagasabb a megmagyarázott hányad: 17%. Érdekes módon az előző csoporttal szemben itt a legmagasabb
értékeket a 26-30 éves kérdezőbiztosok
produkálták, átlagos értékük elérte a 0,42-t. A legalacsonyabb értékek összességében itt is az idősebb korosztályokra volt jellemző (56-60 évesek: 0,05). A második kérdésnél, mely az országos közügyekbe való beleszólásra vonatkozik, a megmagyarázott hányad 13,4%, a legmagasabb értékeket 16-20 évesek, illetve a 31-35 évesek értek el (0,17), míg a legalacsonyabb
értékkel a 25-30 évesek büszkélkedhettek (0,05).
Az utolsó kérdésnél, mely a helyi közügyekbe való beleszólásról szól, a korcsoport által megmagyarázott hányad 9,5%. A
értéke a legfiatalabb (0,13) illetve a 31-35 éves (0,18)
kérdezőbiztosok körében volt a legmagasabb, míg a legalacsonyabb értéket a 26-30 éves kérdezőbiztosok értek el (0,05). Összességében elmondható, hogy a kérdezőbiztosok kora összefüggésben van a második körben vizsgált változókkal és a 16-20 évesek mutatták a leghelytelenebb kérdezői viselkedést. Úgy tűnik ez egy olyan kérdéscsoport volt, melynél szükség volt a kérdezőbiztos értettségére, hozzáértésére. 169
3.4.1.2 „Társadalmi távolság” A társadalmi távolság hatását nem a bogardusi értelemben vett és operacionalizált módon definiáltuk, hanem a kérdezőbiztos és a válaszoló bizonyos demográfiai változók mentén mért távolságát értettük alatta. Úgy gondoljuk, hogy bizonyos társadalmi paraméterek, tulajdonságok, látható csoportjelzések alapján vett eltérés – azaz a társadalmi távolság – alapvetően meghatározza az interjú menetét. A túlzottan eltérő nagy különbség a kérdező és a válaszoló között nem csak egyes kérdések esetében képest direkt hatást kifejteni, hanem hatással lehet egyéb kérdésekre adott válaszokban látens módon, és meghatározhatja az interjú intimitási szintjét is. A következő elemzésben konkrét kérdések esetében vizsgáltuk a kérdezőbiztos és a válaszoló társadalmi távolságának hatását. 3.4.1.2.1 A kérdezőbiztos és a kérdezett társadalmi távolságának definíciója282 Az Ifjúság2008 kész és teljes interjúkat tartalmazó adatbázisa 8.076 fő válaszaiból áll, amelyet 366 kérdezőbiztos segítségével gyűjtöttek. A kérdezőbiztosok által felvett kérdőívek száma erősen ingadozó volt, jó néhány kérdezőbiztos mindösszesen 1 kérdőívet kérdezett, de volt, aki 145 kérdőívet vett fel. A kérdezőbiztosi hatás elemzése szempontjából nem éreztük az elemzésbe bevonhatónak azokat a kérdőíveket, amelyeket olyan kérdezők vettek fel, akik csak kevés kérdőívet készítettek el. Ezeknek a kérdezőbiztosok az adott kérdőív kérdezésének elsajátításához optimálisnak tartott kérdőívmennyiséget sem kérdezték le a kutatásban, valamint egyenként olyan kevés kérdőívvel rendelkeznek, hogy esetükben nem különíthető el az egyes kérdezőbiztosi tulajdonságok hatása a kezdeti betanulási fázisban szükségszerűen vétett hibáktól és torzításoktól. A további elemzésbe ezért itt sem vontuk be a 15 kérdőívnél kevesebb kérdőívet lekérdezők eseteit, így a vizsgált adatbázis 6.885 esetet tartalmaz, amelyeket összesen 205 kérdezőbiztos készített el. A kérdezőbiztosokról három adat állt a rendelkezésre: a nemük, a befejezett iskolai végzettségük illetve az életkoruk, tehát a kérdezőbiztos és a válaszoló közötti bárminemű különbséget csupán e három változó mentén lehetett megragadni. Feltételeztük, hogy a válaszoló és a kérdezett közötti társadalmi távolságnak van befolyásoló hatása a válaszokra, és feltételeztük továbbá azt is, hogy minél nagyobb a különbség, annál nagyobb a befolyásoló hatás is. Az első különbség a két személy nemének eltérésből adódhat. A „nem” területén az eltérés két különböző iránya más és más viselkedést eredményezhet, így létrehoztunk egy
282
Közös elemzés Bogáromi Eszterrel
170
olyan változót, amely megmutatja a két személy nemét együttesen, így az új változó négy értéket tartalmaz. 32. táblázat
A válaszoló és a kérdezőbiztos neme változó megoszlása (Ifjúság2008 adatbázis)
Változó értéke
Kérdező neme
Válaszoló neme
Esetszám
Arány
1
Férfi
Férfi
848
12,32%
2
Férfi
Nő
782
11,36%
3
Nő
Férfi
2621
38,07%
4
Nő
Nő
2634
38,26%
A kérdező és a kérdezett közötti különbözőség egy markáns mutatója a korkülönbség. Mivel mindkét személy kora folytonos változóként adott volt, az elemzés során egyszerűen egy különbséget számoltunk283. Általánosságban elmondható, hogy a kérdezőbiztosok életkorának átlaga 46 év volt, a kérdezők fele 47 éves, vagy annál idősebb és csupán 14,4%uk 30 éves, vagy annál fiatalabb. Mivel a mintába kerültek maximális életkora 30 év, a korkülönbség rendkívül magas, a minta felénél ez az érték 25 évnél magasabb. A korkülönbséget bemutató változó értékei 12 és 52 között definiáltak, e változó értékeit 7 kategóriába vontuk össze. 33. táblázat
A válaszoló és a kérdezőbiztos korkülönbsége változó
A korkülönbsége változó (ordinális mérési szint)
Korkülönbség (mennyivel idősebb a kérdezőbiztos a válaszolónál)
Esetszám
Arány
min 6 évvel fiatalabb
71
1,04%
0 – kis korkülönbség
-/+5 év
646
9,43%
1 – legalább 6 évvel idősebb kb.
6-15 év
1202
17,55%
2 – legalább 16 évvel idősebb kb.
16-25 év
1643
23,99%
3 – legalább 26 évvel idősebb kb.
26-35 év
1880
27,45%
4 – legalább 36 évvel idősebb kb.
36-45 év
1249
18,24%
5 – legalább 46 évvel idősebb kb.
46-52 év
158
2,31%
-1 – sokkal fiatalabb kb.
A kategorizálásnál nem az esetek egyenletes eloszlása volt az elsődleges szempont, hanem olyan csoportok létrehozása, amelyek jól elhatárolhatók viselkedésük és habitusuk 283
A kérdezőbiztosi adatbázisban szereplő kérdezőbiztosok között volt egy személy, aki 1937-ben született (az adatfelvétel évében 71 éves volt) és volt egy személy, aki 1998-ban született (az adatfelvétel évében 10 éves volt), egyik születési év sem tűnik reálisnak, ezeket az extrém értékeket kizártuk az elemzésből a kérdezőbiztosi életkor vizsgálatánál.
171
szerint. Véleményünk szerint teljesen más az interjú menete, hangulata és körülményei, ha a kérdezőbiztos 30 évvel idősebb az interjúalanynál és akkor, amikor 3 évvel fiatalabb. A befejezett iskolai végzettségben megmutatkozó eltérés megragadása volt a legkomplikáltabb feladat a változók létrehozása alkalmával. A nehézség a minta alaptulajdonságának volt köszönhető: a kutatás a fiatalokat szólította meg, akiknek az iskolai végzettsége korántsem annyira „befejezett”, mint a kérdezőbiztosoké284. Feltettük tehát a kérdést, hogy mit is akarunk „megfogni” az iskolai végzettséggel? Arra voltunk kíváncsiak hogy mekkora a kulturális és társadalmi távolság a felkeresett fiatal és a kérdezőbiztos között. Abból indultunk ki, hogy bizonyos esetekben a „válaszoló-kérdezőbiztos távolságának” indikátora a válaszoló szüleinek iskolai végzettsége, amely egyrészről a mért változók szintjén erős együtt járást mutat a fiatal (majdani) befejezett iskolai végzettségével, másrészről pedig behatárolja azt a kulturális mezőt, amelyben a válaszoló szocializációja végbement285. Ennek fényében három változót alakítottunk ki az iskolai végzettség hatásának mérésére. Az első változó oly módon mutatja meg a válaszoló befejezett iskolai végzettségét, hogy a folyamatban lévő tanulmányait megelőlegezi neki. Természetesen nem mindenki fogja befejezni az adott iskoláját, de a korosztályi sajátosságoknak köszönhetően ettől a ténytől eltekintünk. További két változó pedig a szülők iskolai végzettségének kategóriáit hangolja össze a kérdezőbiztos befejezett iskolai végzettségét bemutató változó kategóriáival. A négy változó értékei a következőek: maximum 8 általános – szakmunkás – érettségi – érettségi utáni képzés – diploma vagy annál magasabb fokozat. Mind a fiatal, mind az apa és mind az anya iskolai végzettségét összehasonlítottuk a kérdezőbiztos iskolai végzettségével, minden összehasonlításnál két változót alakítottunk ki. A nembeli különbséghez hasonlóan, itt is létrejött egy olyan változó, ami azt mutatja meg, hogy van-e különbség az iskolai végzettségek között, és létrejött egy olyan változó is, ami az eltérés irányát is mutatja.
284
Ennek megfelelően a 15-29 évesek között voltak olyan fiatalok, aki még a 8 általánost végezték, és voltak olyanok is akik már a doktori iskola befejezése után is folytatják iskolai pályafutásukat. 285
A szülők iskolai végzettségének hatásáról akkor beszélhetünk, ha a válaszoló a szüleivel együtt élt. A válaszolók 96,6% az édesanyját, 85,1%-a pedig az édesapját említi, mint akik 14 éves koráig nevelték.
172
34. táblázat
A válaszoló, apa, anya és a kérdezőbiztos iskolai végzettsége változó
Eltérés mértéke a kérdezőbiztos iskolai végzettségéhez képest (oktatási szintek)
Válaszoló
Anya
Apa
0 – megegyezik
29%
21%
17%
1 szint eltérés
24%
26%
32%
2 szint eltérés
33%
31%
26%
3 szint eltérés
9%
13%
19%
4 szint eltérés
4%
9%
6%
Az apa és a kérdezőbiztos befejezett iskolai végzetsége között volt a legjelentősebb eltérés. A válaszolók 29%-ának iskolai végzettsége megegyezett a kérdezőbiztos iskolai végzettségével, az anya és a kérdezőbiztos iskolai végzettségének egyezése a válaszolók 21%ra volt jellemző, míg az apa és a kérdező végzettségének azonossága a válaszolók 17%-a. Az apa és a kérdező iskolai végzettsége 3 vagy 4 szinttel tér el a válaszolók negyedénél, ez az arány az anya és a kérdezőbiztos esetében 22% volt. 3.4.1.2.2 A társadalmi távolság hatása elégedettség kérdéssor esetében Az általánosan elfogadott egyik megközelítés szerint a jó kérdőív-interjúban a kérdezőbiztos hatását amennyire lehet, minimalizálni kell, tehát szavai, viselkedése és megjelenése a lehető legkevesebb befolyásolást kell, hogy okozzon. Mivel az adatbázisban a kérdezőbiztosok jellemezésére csupán három változó állt a rendelkezésünkre – nem, kor, iskolai végzettség –, e változók mentén néztük meg a különböző kérdések eloszlását. Ahogy azt már említettük, a kutatás több almintára oszlott, a kérdőívkérdéseknek csak egy részét kérdezték a teljes, 8000 fős mintán. Azért, hogy az elemzés során a lehető legtöbb kérdezőbiztost és elkészült interjút használni tudjuk, a kérdezőbiztosi hatást azokon a kérdéseken vizsgáltuk, amelyeke minden mintába került válaszolónak meg kellett válaszolnia. A kutatás kitér a kérdezett saját életével, lehetőségeivel való elégedettségére. A blokkban található tíz kérdés, többek között, rákérdez az életszínvonalra, az anyagi helyzetre, a jövőbeli kilátásokra. Minden kérdés megválaszolásánál egy ötfokú skálát kellett használni melyek két szélső értéke a következő: 1 – teljesen elégedett; 5 – teljesen elégedetlen.286 Az 286
Összességében a válaszolók a baráti kapcsolataikkal (86%) és a partnerkapcsolataikkal (72%) a legelégedettebbek és a jövőbeli lehetőségeikkel (33%) és a munkavállalási lehetőségeikkel (32%) a legelégedetlenebbek. A jelennel elégedettek, de tartanak a jövőtől. Mindent egybevetve a kérdezettek 41%-a elégedett azzal, ahogy él.
173
anyagi helyzet, a boldogság megítélése szubjektív folyamat, melyet a környezet, az elvárások könnyen befolyásolhatnak, feltételezésünk szerint a kérdezettek megpróbálnak – akár akaratlanul is – megfelelni a kérdezőbiztos elvárásainak, illetve a kérdezőbiztos jelenlétével kialakult viszonyítási rendszernek. Az eddig már bemutatott három változó állt a rendelkezésünkre, hogy bemutassuk a kérdezőbiztos és a válaszoló közötti társadalmi távolság befolyásolja-e az elégedettség mértékét. Először a nembeli különbség szerint vizsgáltuk a tíz kérdést. A kérdezett és a kérdezőbiztos nemének eltérése és a megjelölt kérdések közötti összefüggés három kérdésnél mutatható ki. A párkapcsolat, a baráti kapcsolatok és munkavállalási lehetőségek azok a területek, melyeknél a nembeli különbség szignifikáns részt magyaráz az elégedettség heterogenitásából. Az összefüggések kimutathatóak, a magyarázóerő viszont elenyésző mindhárom kérdésnél (0,2%). Azok a személyek, akiknek a neme megegyezett a kérdezőbiztos nemével, elégedettebbnek mondták magukat a párkapcsolat illetve a baráti kapcsolatok területén. A munkavállalás kérdésénél az összefüggés iránya ellenkező, a különböző nemnél figyelhető meg magasabb elégedettség. 35. táblázat Megegyezik-e a kérdező és a válaszoló neme
Az adott kérdés válaszátlagok a kérdező és a válaszoló neme szerint Menyire elégedett Ön partnerkapcsolataival?
Menyire elégedett Ön baráti kapcsolataival
Menyire elégedett Ön munkavállalási lehetőségeivel?
Átlag
N
Átlag
N
Átlag
N
megegyezik
1,94
3048
1,62
3427
3,19
2929
eltér
2,06
2944
1,67
3357
3,09
2874
összesen
2,00
5992
1,65
6784
3,14
5803
Ha a válaszoló és a kérdezőbiztos nembeli eltérésnél az eltérés irányát is figyelembe vesszük, láthatjuk, hogy a három változónál más és más irány figyelhető meg. A partnerkapcsolatokra és a baráti kapcsolatokra vonatkozó kérdéseknél egyaránt ott figyelhető meg alacsonyabb átlagérték (tehát a megkérdezettek elégedettebbek), ahol a kérdezőbiztos és a megkérdezett neme megegyezett. A két kérdésnél a nembeli eltérésnél az irány ellentétes. A partnerkapcsolatokra vonatkozó kérdésnél a férfiak voltak elégedetlenebbek (ahol a kérdezőbiztos nő volt), a baráti kapcsolatokra vonatkozó kérdésnél pedig a nők voltak elégedetlenebbek (itt férfi volt a kérdezőbiztos). A harmadik kérdésnél, mely a munkavállalási lehetőségekre vonatkozott, érdekes sorrend alakult ki az átlagértékek versenyénél. Míg a
174
legalacsonyabb értéket azon nők csoportja érte el, ahol a kérdezőbiztos férfi volt, addig a legmagasabb értéket azon férfiak csoportja kapta, ahol a kérdezőbiztos nő volt. 36. táblázat
Megegyezik-e a kérdező és a válaszoló neme?
Egyes kérdések értékelés átlagai a kérdezőbiztos és a válaszoló nemének különbsége szerint Mennyire elégedett Ön partnerkapcsolataival?
Mennyire elégedett Ön baráti kapcsolataival?
Mennyire elégedett Ön munkavállalási lehetőségeivel?
Kérdező – alany
Átlag
N
Átlag
N
Átlag
N
Férfi-nő
1,98
715
1,73
773
3,22
680
Megegyezik
1,94
3048
1,62
3427
3,19
2929
Nő-férfi
2,08
2229
1,66
2584
3,05
2194
Összesen
2,00
5992
1,65
6784
3,14
5803
Ez az összefüggés nem csak a nembeli eltérést tükrözi, hanem a válaszolók nemének hatását is. A nők átlagos értéke ennél a változónál két tizeddel volt magasabb, mint a férfiaké. Ez annyira jelentős eltérés, hogy a kérdezőbiztos nemének különbségét mutató változó vizsgálatánál is markánsan jelentkezik (Férfi átlag: 3,04, Nő átlag: 3,24). Hasonló nagyságú és irányú eltérés figyelhető meg az első kérdésnél is, ott a nembeli eltérésnél az irány mégis ellentétes. 37. táblázat A válaszoló neme
Egyes kérdések értékelés átlagai a válaszoló neme szerint Mennyire elégedett Ön baráti kapcsolataival?
Mennyire elégedett Ön partnerkapcsolataival? Átlag
N
Férfi
2,09
2967
Nő
1,91
3025
Összesen
2,00
5992
nincs szignifikáns összefüggés
Mennyire elégedett Ön munkavállalási lehetőségeivel? Átlag
N
3,04
2930
3,24
2873
3,14
5803
Ahhoz, hogy a kérdezőbiztos nemét, mint magyarázóerőt ki tudjuk vonni, négyértékű változóra van szükségünk. Az eredeti állítás, miszerint válaszaik szerint elégedettebbek azok a megkérdezettek, kiknek a kérdezőbiztosai velük megegyező neműek, két csoportnál nem helytálló. A partnerkapcsolatról szóló kérdésnél a férfiakra, a munkavállalásról szóló kérdésnél pedig a nőkre nem igaz az állítás.
175
38. táblázat
Megegyezik-e a kérdező és a válaszoló neme?
Egyes kérdések értékelés átlagai a kérdezőbiztos és a válaszoló neme szerint Mennyire elégedett Ön partnerkapcsolataival?
Mennyire elégedett Ön baráti kapcsolataival?
Mennyire elégedett Ön munkavállalási lehetőségeivel?
Kérdező – alany
Átlag
N
Átlag
N
Átlag
N
Férfi-férfi
2,10
738
1,62
841
3,03
736
Nő-férfi
2,08
2229
1,66
2584
3,05
2194
Nő-nő
1,89
2310
1,62
2586
3,25
2193
Férfi-nő
1,98
715
1,73
773
3,22
680
Összesen
2,00
5992
1,65
6784
3,14
5803
Miután láttuk, hogy a nem különbsége nem magyaráz megfelelő hányadot a kérdések heterogenitásából, vizsgálat alá vontuk a végzettségeket. Három változó alapján fogható meg a kérdezőbiztos és a kérdezett, illetve a kérdezett családja közötti végzettségbeli különbség. A kérdések többségénél szignifikáns összefüggés mutatható ki az iskolai végzettségek különbségei és az elégedettségek között. A megmagyarázott hányad változónként eltérő, átlagosan 3%-ot magyaráz az elégedettség változók eloszlásából a válaszoló és a kérdezőbiztos végzettségbeli különbsége. Legnagyobb magyarázott hányadot az életszínvonal és az anyagi helyzet287 megítélésénél figyeltünk meg. Itt a válaszoló iskolai végzettségének eltérése 4%-ot, illetve 4,2%-ot magyarázott, az összefüggés iránya azt mutatja, hogy minél inkább azonos a két személy végzettsége, annál inkább vallotta magát elégedettnek a kérdezett. Mivel a vizsgálat alá vont célcsoport életkora alacsony, a befejezett iskolai végzettségük még változhat. A független változó megelőlegezi a folyamatban lévő iskola befejezését. Ez a megelőlegezés van, akinél elhibázott döntés – a felsőoktatásban tanulóknál jelentős azok aránya, akik nem szereztek diplomát –, és van, akinél alulbecsült – azokra gondolunk, akik jelenleg középiskolába járnak és később diplomások lesznek. A kérdezés pillanatában egyik fél sem tud többet a jövőről, se a válaszoló, se a kérdezőbiztos nem tudhatja mi lesz a megkérdezett legmagasabb befejezett iskolai végzettsége. Az interjú alkalmával látható végzettségbeli különbség adódhat a válaszoló neveltetéséből, családi hátteréből. Jól tudjuk, hogy a diplomás szülők gyerekeinek szóhasználata, tudáskészlete, életfelfogása jelentősen 287
Mennyire elégedett Ön a következő dolgokkal? A jelenlegi életszínvonalával? Anyagi helyzetével?
176
eltérhet azon társaik gondolkodásától, akiknek a szülei alacsonyabb végzettségűek. Ez az eltérés mind a megkérdezett, mind a kérdezőbiztos számára láthatóvá válhat az interjú alkalmával. A kérdőív elég hosszú és szerteágazó ahhoz, hogy mindkét fél számára körvonalazódjon a két család különbsége. Ezt a különbséget próbáltuk megragadni a szülők és a kérdezőbiztos befejezett iskolai végzettségének különbségével. A kérdésblokk kilenc kérdésénél figyelhető meg szignifikáns összefüggés az apa és a kérdezőbiztos, illetve az anya és a kérdezőbiztos iskolai végzettsége közötti eltérés és az elégedettség között. A baráti kapcsolatokkal, a tanulási lehetőségekkel és a megszerzett ismeretmennyiséggel való elégedettség esetében a szóródás megmagyarázott hányada nem éri el a két százalékot. A további hat változónál figyelemre méltó kapcsolatot találtunk a szülők iskolai végzettsége és a kiválasztott válaszok között.288 A kiválasztott hat változónál minden esetben az anya végzettségének hatása megegyező, vagy hangsúlyosabb volt, mint az apa végzettségének hatása. A megmagyarázott hányadok 1,8% és 3,2% között mozognak. Az anya végzettségének különbsége a legkisebb arányban a mostani életükkel való elégedettséget mérő változóra van hatással, míg a legmagasabb megmagyarázott hányadot az anyagi helyzetnél találtuk. Jól látható, hogy léteznek olyan témák és kérdések, melyek heterogenitásából szignifikáns részt magyaráznak a kérdezőbiztos és a válaszoló szocio-demográfiai tulajdonságainak eltérései. A javak birtoklása és a javak megszerzésének lehetőségei olyan területek, melyeknél minél nagyobb eltérés figyelhető meg a válaszoló és a kérdezőbiztos végzettsége között, annál inkább jellemző az elégedetlenség. Az anyagi helyzet kérdésénél a válaszolók átlagosan 2,97-re értékelték az elégedettségüket. Ahol a kérdezőbiztos és a válaszoló a végzettségüket tekintve a skála két végén helyezkedik el – bármelyikük is az, akinek a végzettsége maximum 8 általános – a válaszok átlaga 3,74 volt (elégedetlen), vagyis a végzettségbeli feszültség majdnem egy egységgel negatívabb választ eredményez. Az anya és a kérdező iskolai végzettsége közti eltérés kevésbé növeli az elégedetlenséget (átlag fél ponttal). 3.4.1.2.3 A társadalmi távolság hatása a válaszoló direkt jellemzése esetén A kérdőív egy részét a kérdezőbiztosnak kell kitöltenie. A sorozat kitér a lakáskörülményekre – állapotára, ellátottságára -, a válaszadó jellemzésére és a válaszadás 288
Ez a hat terület a következő: a munkavállalási esélyek, az életszínvonal, az anyagi helyzet, az élettervei megvalósításának esélyei, a jövőbeli kilátások és a jelenlegi helyzettel való elégedettség.
177
körülményeire. Ezek közül megvizsgáljuk a válaszoló személyének értékelését a már ismertetett szempontok szerint. A kérdezőbiztosnak a válaszadó öt tulajdonságát kellett értékelnie egy-egy hétfokozatú skála segítségével. A kérdőív kitért a válaszadó politikai tájékozottságára, műveltségére, rákérdezett a kérdések gyors megértésére és a válaszolások ütemére és utolsó sorban a megkérdezett együttműködésére. A skála egyes értéke mutatta a pozitív tulajdonságot – a politika területén tájékozott, művelt, gyorsan válaszolt a kérdésekre -, a hetes értéke pedig a negatívakat – tájékozatlan, műveletlen -, a köztes értékekkel árnyalhatták véleményüket. Az átlagok kettő és négy között helyezkednek el, a legalacsonyabb átlagot az együttműködést bemutató változó érte el, ami azt jelenti, ez volt az a tulajdonság, aminél a leginkább pozitív értékelést adtak a válaszolókról. Leghiányosabb tulajdonságnak a politikai tájékozottságot igen alacsonynak találták a kérdezőbiztosok, itt az átlag 3,89 volt, vagyis a kérdezettek többsége tájékozatlan a politika területén. Sorra vizsgáltuk az öt jellemzőt a nem, az iskolai végzettség, illetve a kor szerint, minden szempontnál megnéztük az adott változó összefüggését a válaszoló tulajdonságával és a kérdezőbiztostól vett távolságával. A megmagyarázott hányadok szerint az öt értékelési dimenzió sorrendje minden magyarázó változó mentén azonos volt. A legnagyobb megmagyarázott hányad minden szempontnál a műveltségre vonatkozó változónál volt megfigyelhető, a további négy változó sorrendben a következő volt: válaszolás könnyedsége, a kérések megértése, politikai tájékozottság és az együttműködés. A vizsgált magyarázó változók szignifikáns részt magyaráztak az öt jellemző változó heterogenitásából. A válaszoló neme elenyésző hányadot magyarázott a változók szóródásából, a legmagasabb értéket a műveltség (q7.3) változónál tapasztaltunk, 0,4%-ot. A válaszadás körülményeire vonatkozó kérdések hétértékűek (irányultságuk: 1 – nagyon pozitív, 7 – nagyon negatív), ezek alapján a kérdezőbiztosok a lányokat műveltebbnek értékelték. A kérdezőbiztos nemével való egyezés, illetve eltérés viselkedése a nem változóhoz volt hasonló. Itt is a legnagyobb megmagyarázott hányadot a műveltségnél tapasztaltunk (1,4%). Mind a válaszoló neme, mind a kérdezőbiztos neme szignifikáns részt magyaráz a változó szóródásából. A kérdezőbiztos nemével való egyezés, illetve eltérés az előbb említett két változó hatását képviseli, vagyis nem az eltérésnek köszönhető az átlagértékek eltérése, hanem annak, hogy a női kérdezőbiztosok hajlamosabbak voltak pozitív értékelést adni a válaszolókról és a lányokat műveltebbnek tartották a kérdezőbiztosok. Ennek megfelelően 178
azok a lányok kapták a legjobb értékeléseket, akiket nők értékeltek és azok a fiúk kapták a legrosszabb minősítést, akiket férfiak kérdeztek. A kérdezőbiztos neme nagyobb százalékot magyaráz a változó szóródásából, mint a válaszoló nemét bemutató változó, ennek megfelelően az eltérő nemű pároknál a női kérdezőbiztosok csoportjánál alacsonyabb az átlagérték. A korkülönbség dimenziója mentén is megvizsgáltuk az öt változót. Ezeknél a kapcsolatoknál is szignifikáns összefüggéseket tapasztaltunk, viszont a megmagyarázott hányad – a nemhez hasonlóan – alacsony volt. A legnagyobb megmagyarázott hányadot a negyedik kérdésnél találtuk, itt ez az érték 1,6% volt. Az átlagos értékek alapján elmondható, hogy azok a kérdezőbiztosok adtak jó értékelést a változókra, akik fiatalabbak, vagy azonos korúak voltak a válaszolókkal. Azok a megkérdezettek, akiknél a korkülönbség több volt, mint 46 év, ott a politikai tájékozottságra kapott átlagos érték 4,29 volt. A megmagyarázott hányad alacsony szintje miatt a részletesebb elemzésre nem térünk ki. A válaszolók és a kérdezőbiztosok iskolai végzettségének különbsége jelentősebb magyarázó erővel rendelkezett, így ezt a dimenziót részletesebben elemeztük. Minden változónál szignifikáns összefüggés volt kimutatható mind a válaszoló, mind a válaszoló apja és mind a válaszoló anyjának iskolai végzettsége és a változó között. Ugyanilyen szignifikancia volt megfigyelhető a válaszoló megelőlegezett iskolai végzettsége és a kérdezőbiztos végzettségbeli eltérésénél. 39. táblázat
A válaszadó műveltségének jellemzése a válaszadó megelőlegezett iskolai végzettsége szerint
jellemezd a válaszadót: mennyire művelt
legfeljebb 8 általános
szakmunkásképző
érettségi
érettségi utáni képzés
diploma
összesen
művelt, intelligens
3,5%
11,3%
24,7%
35,4%
51,3%
25,9%
2
8,2%
20,7%
29,9%
30,0%
28,6%
25,3%
3
17,4%
25,8%
24,3%
20,2%
12,3%
21,1%
4
20,5%
28,3%
15,7%
11,0%
4,6%
16,2%
5
20,3%
10,0%
4,2%
2,3%
1,9%
6,5%
6
19,0%
3,2%
1,0%
,8%
1,0%
3,4%
tanulatlan, műveletlen
11,1%
,7%
,1%
,4%
,4%
1,5%
összesen
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
A kérdezett iskolai végzettsége által megmagyarázott hányad 27,3% volt a műveltség kérdésénél és csupán 3,2% volt az együttműködés kérdésénél. A változók mindegyikénél 179
azonos az összefüggés iránya, vagyis minél alacsonyabb a válaszoló iskolai végzettsége, annál jellemzőbb rá a tájékozatlanság, a műveletlenség és többek között a gyanakvás. A megmagyarázott hányad magas értékét jól mutatják a műveltségre vonatkozó változó átlagértékei az iskolai végzettség kategóriáinál. A maximum 8 általános iskolai végzettséggel rendelkező válaszolókra jellemző érték átlagos 4,47 volt, 11,1%-ukat ítélte a kérdezőbiztos tanulatlannak, műveletlennek. A diplomával rendelkezőknél a változó átlaga 1,82 volt, vagyis a válaszolók 51,3%-ánál választotta a kérdezőbiztos a legjobb osztályzatot. 40. táblázat
mostani iskola megelőlegezve
A válaszadói jellemzések átlagai a válaszadó megelőlegezett iskolai végzettsége szerint jellemezd a válaszadót: jellemezd a válaszadót: jellemezd a válaszadót: mennyire művelt? tájékozott-e a politikában? mennyire volt együttműködő? Átlag
N
Átlag
N
Átlag
N
max 8 általános
4,47
711
5,04
711
2,49
711
szakmunkásképző
3,18
1355
4,25
1354
2,21
1355
érettségi
2,48
2555
3,97
2554
1,99
2554
érettségi utáni képzés
2,19
526
3,31
525
1,87
526
diploma
1,82
1327
3,03
1325
1,72
1327
összesen
2,69
6474
3,90
6469
2,02
6473
A válaszoló iskolai végzettségénél az együttműködést bemutató változó átlagainak eltérése volt a legkisebb. A két szélsőértéknél figyelhető meg a legalacsonyabb, illetve a legmagasabb átlagérték, a 8 általánossal rendelkezőknél ez az átlag 2,49 volt, míg a diplomával rendelkezőknél 1,72. Ez volt egyben az a változó, ahol az alacsonyabb iskolai végzettséggel rendelkezők a legmagasabb értékeket kapták, vagyis az alacsonyabb iskolai végzettséggel rendelkező válaszolókat kevésbé érezték együttműködőnek, mint a diplomával rendelkezőket. A legrosszabb értékelést minden végzettségnél a politikai tájékozottság területén kapták. A maximum nyolc általánossal rendelkező válaszolók átlagosan 5,04-et kaptak a hétfokú skálán, ahol a hetes érték a tájékozatlan minősítést jelenti.
180
41. táblázat
A válaszoló iskolai végzettsége által megmagyarázott hányad Kérdés
Megmagyarázott hányad
mennyire művelt?
27,30%
mennyire válaszolt könnyen?
18,30%
milyen gyorsan értette meg a kérdéseket?
17,50%
tájékozott-e a politikában?
12,10%
mennyire volt együttműködő?
3,20%
A válaszoló és a kérdezőbiztos iskolai végzettségének különbségét két változó mutatja be. Az első változó értékei -4 és 4 között helyezkednek el, ahol a -4-es értéket azok a válaszolók kapták, akik maximum 8 általánossal rendelkeznek és a kérdezőbiztosuk diplomás. Négyes értéket pedig a fordított helyzetűek kaptak, a válaszoló rendelkezett diplomával, míg a kérdezőbiztosnak maximum általános iskolai végzettsége volt. A második, a végzettségbeli különbséget bemutató változó csupán a végzettség szintjének eltérését mutatja meg, az irányát nem. Ennél a változónál nullás értéket kapnak azok a személyek, akiknél azonos a két személy iskolai végzettsége és négyes értéket, ahol az egyik személy az iskolai végzettség egyik, míg a másik személy a másik végén található. Az öt változó mindegyikénél szignifikáns összefüggés mutatkozott mindkét magyarázó változó szerint. A megmagyarázott hányad tekintetében az öt változó sorrendje megegyezik az előzővel. A heterogenitás 15,3%át magyarázza az iskolai végzettség különbsége a műveltséget megítélő változónál. 42. táblázat
A válaszoló és a kérdezett végzettségének különbsége (-4;4 skála) által megmagyarázott hányad Kérdés
Megmagyarázott hányad
mennyire művelt?
15,30%
mennyire válaszolt könnyen?
9,70%
milyen gyorsan értette meg a kérdéseket?
9,40%
tájékozott-e a politikában?
6,30%
mennyire volt együttműködő?
1,20%
Ahol a kérdezőbiztos befejezett iskolai végzettsége négy szinttel magasabb, mint a válaszadó iskolai végzettsége, ott a kérdező átlagosan 4,51-es értéket adott. Ahol a válaszoló rendelkezik három szinttel magasabb iskolai végzettséggel, ott az átlagos érték csupán 1,41. Vagyis minél nagyobb az eltérés a kérdezőbiztos javára, annál hajlamosabb a kérdező 181
műveletlennek értékelni a válaszolót (5.3.1. számú függelékben bemutatjuk a részletes megoszlásokat). 43. táblázat
A válaszoló és a kérdezett végzettségének abszolút különbsége (0;4 skála) által megmagyarázott hányad Kérdés
Megmagyarázott hányad
mennyire művelt?
9,60%
mennyire válaszolt könnyen?
5,80%
milyen gyorsan értette meg a kérdéseket?
5,30%
tájékozott-e a politikában?
2,40%
mennyire volt együttműködő?
0,50%
Az anya és az apa befejezett iskolai végzettsége is szignifikáns összefüggést mutatott a kérdezőbiztosi értékeléssel. Az irány a válaszoló iskolai végzettségénél megfigyelt iránnyal megegyező volt, vagyis minél képzettebb a szülő, annál jellemzőbb, hogy a kérdezőbiztos kiváló osztályzatot ad a jellemző tulajdonságokra. Amikor a szülő és a kérdezőbiztos végzettségének különbségét vizsgáltuk, akkor szignifikáns összefüggést tapasztaltunk. Ennél az összefüggésnél a kérdezőbiztos elképzeléseit, benyomásait láthatjuk, azt, miként tekintett a válaszolóra, mennyire tudott azonosulni a kérdezettel, vagy éppenséggel mennyire érezte magától eltérőnek. A megmagyarázott hányad alacsony volt az öt változó többségénél. A képzettségbeli távolság bemutató mindkét változó szignifikáns összefüggést mutatott, mi az abszolút eltérés kapcsolatát mutatjuk be az öt változóval. 44. táblázat A válaszoló anyja és a kérdezett végzettségének abszolút különbsége (0;4 skála) által megmagyarázott hányad Kérdés
Megmagyarázott hányad
mennyire művelt?
7,20%
mennyire válaszolt könnyen?
4,40%
milyen gyorsan értette meg a kérdéseket?
4,40%
tájékozott-e a politikában?
1,90%
mennyire volt együttműködő?
0,50%
Legerősebb, legnagyobb megmagyarázott hányadot bemutató változó ebben az esetben is a harmadik kérdés volt, mely a válaszoló műveltségére tér ki. Az anya és a kérdezőbiztos végzettségének különbsége a változó heterogenitásából 7,2%-ot magyarázott. Az összefüggés iránya az eddig bemutatott trendekkel megegyező, a jelentős eltérés a két személy iskolai 182
végzetségénél magasabb átlagértéket mutat, vagyis műveletlenebbnek érezték a válaszolókat. Jellemzően rosszabbul értékelik a válaszoló műveltségének szintjét – átlagos érték 3,65 – azok a kérdezőbiztosok, akiknél több szintes eltérés mutatkozik az anya és a saját képzettsége között. Azok a személyek adták a legpozitívabb értékelést – átlag 2,19 –, akiknek végzettsége megegyezik az anya befejezett iskolai végzettségével. A két véglet átlagértékei közötti különbség 1,46 volt a hét fokozatú skálán. Jobb értékelést kaptak azok a fiatalok, akiknek az édesanya magasabb iskolai végzettséggel rendelkezett, mint a kérdezőbiztos (2,18). Illetve a legrosszabb minősítést az a csoport kapta, ahol az anyának maximum 8 általános a befejezett iskolai végzettsége, a kérdezőbiztos pedig diplomás (3,67). Az apa és a kérdezőbiztos végzettsége közötti különbségnél a kapcsolat az előzőhöz hasonló volt. Legerősebb összefüggést itt is a műveltségi szintnél tapasztaltunk. Az első változó volt az egyetlen, ahol az apa és a kérdezőbiztos képzettsége közötti különbség magasabb megmagyarázott hányadot mutatott, mint az anya és a kérdező közötti különbség. A politikai tájékozottság megítélésére inkább az apa képzettségének függvényeként áll elő. Ez az eltérés a változók között vélhetően annak köszönhető, hogy a politika jellemzően a férfiakat érdeklő téma, így az apa az, aki inkább formálhatja, inkább képezheti gyermeke politikai tájékozottságát. A többi változónál azért jelentősebb az anya iskolai végzettségének különbsége, mert általában az anya iskolai végzettsége az, ami alacsonyabb a két szülő képzettsége közül, vagyis alulról az anya végzettsége az, ami emelheti a család végzettségének szintjét. Tehát ilyen értelemben az anya iskolázottsága „alulbecsüli” a család státusát Részletes alapmegoszlások az 5.3.1.-es függelékben találhatók). 45. táblázat
A válaszoló apja és a kérdezett végzettségének abszolút különbsége (0;4 skála) által megmagyarázott hányad Kérdés
Megmagyarázott hányad
mennyire művelt?
6,50%
mennyire válaszolt könnyen?
3,90%
milyen gyorsan értette meg a kérdéseket?
4,20%
tájékozott-e a politikában?
2,50%
mennyire volt együttműködő?
0,40%
Az apa befejezett iskolai végzettségének eltérésénél az irány megegyezik az eddig bemutatott összefüggésekével, a két szélső kategória átlagértékének eltérése nagyobb, mint az anya végzettségénél tapasztalt. Azoknál a válaszolóknál, ahol az apa és a kérdezőbiztos iskolai végzettsége megegyező volt, ott átlagosan 2,19-re értékelték a válaszoló műveltségi 183
szintjét, míg ahol a végzettség szintje között 4 szintnyi eltérés volt a jellemző, ott a válaszolók átlagos értéke 3,92 volt, vagyis a két szélsőérték közötti különbség 1,74 volt (alapmegoszlások az 5.3.1.-es függelékben). 46. táblázat
A válaszoló apja és anyja és a kérdezett végzettségének abszolút különbsége (0;4 skála) által megmagyarázott hányad Kérdés
Megmagyarázott hányad
mennyire művelt?
8,70%
mennyire válaszolt könnyen?
5,40%
milyen gyorsan értette meg a kérdéseket?
5,50%
tájékozott-e a politikában?
2,80%
mennyire volt együttműködő?
0,80%
Ha a szülők iskolai végzettségének a kérdezőbiztos képzettségétől való eltérését együtt vizsgáltuk, a megmagyarázott hányad tovább emelkedett (8,7%). Közel 10%-ot magyaráz a műveltséget bemutató változó heterogenitásából az a tény, hogy mekkora a szülők és a kérdezőbiztos befejezett iskolai végzettségének különbsége. Ebből arra következtethetünk, hogy a válaszoló jellemzése erősen szubjektív döntés volt, ahol a kérdezőbiztos – lehet, hogy nem tudatosan – a saját képzettségét figyelembe véve hozta meg a döntését. A nagyobb eltérések, feszültségek szigorúbb döntést eredményeztek. Az átlagos értékeket vizsgálva azt láthatjuk, hogy azokat a válaszolókat mondták inkább műveltnek, akiknek vagy az anyjuk vagy az apjuk iskolai végzettsége megegyezett a kérdezőbiztos befejezett iskolai végzettségével, és azok a válaszolók kaptak inkább műveletlen minősítést, akiknek az egyik szülőjének végzettsége négy szinttel tért el a kérdezőbiztos befejezett iskolai végzettségének szintjétől.
Az
összefüggés
szignifikánsnak
(alapmegoszlásokat az 5.3.1. számú függelékben).
184
bizonyult
minden
kapcsolatban
3.4.2 Kérdőív hatása 3.4.2.1 A kérdőív, mint szöveg vizsgálata FRE értékek segítségével Az Ifjúság2008 kérdőívét megpróbáltuk az ismertetett irodalomban felelhető szempontok szerint vizsgálni, hogy szeparálni tudjuk a kérdőív esetleges torzító, befolyásoló hatását. A kutatás során felhasznált kérdőív meglehetősen bonyolult volt, a komplikált kutatási elrendezés rengeteg ugratást is tartalmazott, ennek következményeképpen a kitöltők egészen eltérő kérdőívvel találkoztak attól függően, hogy melyik almintába tartoztak. Elsőként tettünk egy kísérletet az Ifjúság2008 kérdőív egyes kérdései nyelvezetének jellemzésére, azaz a Flesch Reading Ease Readability (FRE) pontszámuk meghatározására. A FRE pontok kiszámítása során vizsgált kérdések megegyeznek a már a korábbi elemzésekbe bevont, a teljes mintán kérdezett kérdésekkel. Több nehézséggel is találkoztunk a pontszámok meghatározása során. A legnagyobb probléma talán az, hogy nincs a pontszámok meghatározásáról, alkalmazásáról a magyar nyelvben fellelhető tapasztalat. Úgy gondoljuk – a saját eredményeink alapján – hogy ez az olvasási nehézség ilyen módszerrel való meghatározása erősen az adott nyelv függvénye. A számolás módszere alapján is arra kell gondolnunk, hogy a képlet angol nyelvi környezetben „működik”, más nyelv számolása esetén más értékekkel kellene korrigálni a képletet, ugyanis a FRE pontérték meghatározása során figyelembe veszi a mondatok száma mellett a szavak és a szótagok számát is, amely erősen nyelvfüggő lehet. A másik felmerülő nehézséget műfaji jellegzetességnek nevezhetjük, amely a kérdőívek speciális szövegezését jelenti. Ezt az egyediséget ráadásul tovább bonyolítja, hogy ezt a szöveget – legtöbbször – felolvassák, tehát nem a válaszoló magának, a saját tempójában olvassa fel. Ebből kifolyólag vizsgáltuk a FRE értékét néhány olyan kérdés esetén is, amelyik az önkitöltő kérdőívben szerepelt. A meghatározás során nem a kérdőívben szerepelt szöveget vettük figyelembe, mivel a ténylegesen elhangzott szöveget nem ismertük. A kérdések ilyen módszerrel való számolása minden bizonnyal torzítási lehetőséget hordoz magában, ennek kiküszöbölésére azonban az interjúkat rögzíteni kellett volna. Az önkitöltő kérdések esetén ilyen torzítási lehetőségről természetesen nem beszélhetünk. A szövegek meghatározásakor a válaszlehetőségeket is figyelembe vettük, az egyszerűbb, néhány válaszlehetőséggel rendelkező kérdések esetében a válaszlehetőségeket a kérdés részének tekintettük, azaz nem számoltuk külön mondatnak. A 185
pontértékek meghatározásánál úgy jártunk el ahogy, azt a 29. egyenletben meghatároztuk, így tehát számoltunk átlagos mondathosszúságot (ASL), és átlagos szótagszámot (ASW), valamint ezek alapján határoztuk meg a FRE értékét. Az elemzés során találkoztunk olyan kérdésekkel, amelyek esetében a FRE értéke az elfogadási tartományon kívülre esett. Ennek oka minden bizonnyal a már korábban említett nyelvi kötöttség a FRE meghatározása során. Említettük már, hogy magyar nyelvvel kapcsolatos elemzést, interpretációt nem leltünk, így meglehetősen esetlegesnek éreztük a kapott eredményeket (már ahol a számított pontérték nem volt az elfogadási tartományon kívüli eleve). Ebből kifolyólag a FRE értékekkel kapcsolatos további elemzéseket nem végeztünk, a kapott FRE értékeket, valamint a meghatározásához szükséges egyéb paraméterek értékeit kérdésenként az 5.3.2. számú függelékben mutatjuk be. 3.4.2.2 A kérdések egyes paramétereinek hatása a részleges nem válaszolásra Megpróbáltunk a kérdőív és a kérdések hatását egy összetett modell keretében vizsgálni. Célunk egy lineáris regressziós modell építése, amelyben a kérdések egyes paramétereivel próbáljuk magyarázni a hiányzó értékek arányát. Első lépésként készítettünk egy olyan – meta – adatfájlt, amely a már korábban is vizsgált kérdések esetében tartalmazza a kérdésben található szavak számát, a mondatok számát, szótagok számát, a kérdés helyét a kérdőívben, a kérdés hosszát, témáját és az adott kérdés nem válaszolási arányát. A kérdésekben található szavak, szótagok, karakterek számosságánál minden esetben csak a kérdést magát vettük figyelembe, a válaszokat nem számoltuk. A kérdés hosszát karakterben adtuk meg, amely tartalmazta a szóközöket is. Az átlagokat (átlagos mondathosszúság szavakban és átlagos szótagszám szavanként) a szavak, mondatok és szótagok értékeiből számoltuk. A kérdés helyét a kérdőívben a kérdés sorszámával mértük, a hiányzóérték arányok számolásakor a kérdésmátrixok esetében az első válaszra adott hiányzóértékkel számoltunk.
186
szavak száma
mondatok száma
szótagok száma
karakterek száma szóközökkel
kérdés helye a kérdőívben
szenzitív
faktuális
attitűd
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
kérdés helye
karakterek száma
szótagok száma
mondatok száma
szavak száma
nt/nv arány (%)
47. táblázat A modell alapváltozóinak korrelációja (a legalább 0,05 szinten szignifikáns értékek jelölve)
-,011 ,956 27 ,138 ,200 ,492 ,318 27 27 -,006 ,976 ,298 ,976 ,000 ,131 27 27 27 -,030 ,986 ,233 ,991 ,882 ,000 ,242 ,000 27 27 27 27 -,251 -,169 -,318 -,129 -,106 ,207 ,399 ,106 ,520 ,599 27 27 27 27 27 ,702 -,248 ,029 -,288 -,264 -,023 ,000 ,213 ,887 ,145 ,184 ,907 27 27 27 27 27 27 -,680 -,124 -,316 -,089 -,076 ,706 ,000 ,539 ,108 ,659 ,705 ,000 27 27 27 27 27 27 ,040 ,398 ,329 ,401 ,361 -,776 ,845 ,040 ,094 ,038 ,064 ,000 27 27 27 27 27 27
Alapvetően három típusú változó csoporttal dolgoztunk a modell kialakításakor. Az első csoportban a kérdés hosszúságát illetve összetettségét mérő változókat találunk (mondatok, szótagok, karakterek száma). Ezek között a tulajdonságok között – mindenféle statisztikai eszköztár mellőzésével – könnyen belátható módon lineáris kapcsolat feltételezhető. A korreláció – legalább részben – megerősít minket ebben a feltevésben: a karakterek száma, szavak száma és szótagok száma között szinte teljes az együtt járás, a mondatok száma ugyanakkor nem mutat lineáris kapcsolatot egyetlen változóval sem
289
.
Minden olyan egyéb, bevonni próbált paraméter esetében, amely a kérdés komplexitását próbálta meg jellemezni, az eddig tapasztalttal megegyező erősségű együtt járást találtunk a kérdés hosszát leíró paraméterekkel úgy, hogy a magyarázni kívánt válaszmegtagadási 289
A 27 vizsgált kérdésből 24 esetben a mondatok száma a kérdésben 1, mindössze 3 esetben találtunk 2 mondatból álló kérdést.
187
aránnyal korrelálatlanok voltak (főnevek száma, jelzős szerkezetek száma, igék száma): Ebből kifolyólag, ezeket a változókat külön nem vontuk be a modellbe, hatásuk csak implicit módon jelenik meg a kérdés hosszát leíró változókban. Összességében a változókészletben szereplő változókból egy komplex, a kérdés hosszát mérő változót képeztünk főkomponens segítségével
290
A kérdés helye a kérdőívben nem mutat lineáris kapcsolatot egyik változóval
sem. A szenzitív, faktuális és attitűd elnevezésű változók a kérdés témáját próbálták megragadni „dummy” változóként, így ezek korrelációja nem értelmezhető. A szenzitív kérdések esetében azonban nem szabad arról megfeledkeznünk, hogy azok az önkitöltő kérdőív részben voltak megtalálhatók, így ezek egyesítik a szenzitív kérdések és az önkitöltés által elvárt magasabb válaszmegtagadási arányokat is, ezeket a hatásokat így nem tudjuk szeparálni. A modellben tehát összesen 4 változó szerepelt, a hely, a kérdés hossza, a témára vonatkozó két dummy változó, a faktuális és a szenzitív témájú kérdéseket jelölik. Az egyes kérdések jellemzőit részletesen ismertetjük az 5.3.2.5. számú függelékben. Lineáris regresszió elemzést végeztünk ezen, (SPSS 18 programcsomag, stepwise módszerrel), egyik változónak sincs bérelt helye, ha egy új változó beléptetésével a magyarázóereje annyira lecsökken, hogy már nem szignifikáns magyarázatot jelez a hozzá tartozó t-érték, akkor kilépteti az eljárás a modellből, elsőként a függő változóval legerősebben korreláló változó lép be a modellbe. A modellből kihagyott változók tolerancia291 értékeinek vizsgálata alapján a kérdés helyét mérő változót a multikollinearitás elkerülése érdekében eltávolítottuk a modellből (kérdés helye: tolerancia értéke: 0,277). Ezzel gyakorlatilag nem változtak a modell értékei (hiszen nem is volt szignifikáns hatása eddig sem).
290
A létrejött főkomponens majdnem tökéletesen ragadta meg a három változó információtartalmát, ami a korrelációk alapján nem volt meglepő (98,94% a magyarázott variancia, az eges komponensek súlya: a szavak száma 0,992, szótagok száma 0,994, karakterek száma 0,998). 291
A tolerancia értéke 1, ha az adott független változó nem hordoz magas multikollinearitást, 0-hoz közeli értékei pedig ennek jelenlétét jelzik.
188
48. táblázat
A modell összegzése (SPSS output alapján) R
R Square
Adjusted R Square
Std. Error of the Estimate
0,702a
0,493
0,473
4,68383
0,778b
0,605
0,572
4,2188
Modell 1 (Predictors: (Constant), szenzitív) 2 (Predictors: (Constant), szenzitív, faktuális)
A két lépésben kialakult modell a teljes variancia 57,2%-át magyarázza, az eljárás során pedig csak a szenzitív, illetve a faktuális kérdést jelölő dummy változók maradtak a modellben, azaz a kérdés témája bizonyult egyedül szignifikánsan meghatározónak. 49. táblázat A modell együtthatói (függő változó: nt/nv arány (%), SPSS output alapján) Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
4,196
0
4,932
0
4,902
0
B
Std. Error
Beta
1 (Constant)
4,509
1,075
szenzitív
9,736
1,974
2 (Constant)
7,817
1,595
szenzitív
6,428
2,183
0,464
2,944
0,007
faktuális
-5,238
2,006
-0,411
-2,611
0,015
0,702
A konstans értéke – a dummy modell miatt – az attitűd kérdések átlagos hiányzóérték százalékát jeleníti meg. A regressziós együtthatók szerint a szenzitív kérdések átlagosan 6,4-el magasabb válaszmegtagadási arányt értek el az attitűd átlagához képest. A faktuális kérdések pedig
az
attitűd
kérdések
során
tapasztalt
átlaghoz
képest
5,237-el
kevesebb
válaszmegtagadási aránnyal rendelkeznek átlagosan. Annak, hogy a modellbe bevont egyéb kérdőív-paraméterek nem voltak hatással a válaszmegtagadási arányokra, több oka is lehet. A sorrend esetében a kérdések „elméleti” sorrendjével számoltunk, ami nem tökéletesen fejezi ki a valós sorrendet és a kérdések relatív pozícióját. A kérdőív szövegének vizsgálata során nem szabad elfelejteni, hogy nem az elhangzott kérdés komplexitását tudjuk megragadni, csupán a kérdőív leírt szövegét elemezhetjük, azaz nem tudhatjuk, hogy a kérdezőbiztos hogyan és miként kérdezett, hogyan interpretált a helyszínen, hogyan segített a kérdőív kitöltésénél, hogyan és mennyire tért el a felolvasott szövegtől. Fontos tényező az is – mint azt már említettük – hogy a szenzitív 189
kérdések esetében nem tudjuk szeparálni az önkitöltés hatását a szenzitív téma hatásától. Ez a kettős hatás lehet az oka, hogy ez a legerősebb magyarázó erővel rendelkező változó a modellben. Az, hogy nem mutatható ki a válaszolók összességére az ismertetett módon kapcsolat a kérdés helye, szövegezése és a válaszmegtagadás között, nem zárja ki, hogy bizonyos szegmensekre nagy mértékben, bizonyos más szegmensekben pedig egyáltalán nem jellemzőek ezen tényezők hatásai. Ennek vizsgálatára további mélyebb elemzések szükségesek az egyes szocio-demográfiai változók mentén, jelen dolgozat keretei között erre nem vállalkoztunk. Tettünk egy kísérletet arra, hogy – hasonlóan az eredeti regressziós modellhez – az egyes kérdéstípusok esetében meghatározzuk a kérdés egyes paramétereinek befolyásoló hatását. Az eredeti modellhez képest már csak két potenciális magyarázó változónk maradt a kérdés típusának „kiesése” után: a kérdés helye és a kérdés hossza. A két tényező hatását megvizsgáltuk a szenzitív és a faktuális kérdések esetében, de egyik tényező sem befolyásolta szignifikánsan a válaszmegtagadás arányát. A szenzitív kérdések esetében nem volt meglepő, hogy a kérdés helyén „sűrűn”, a kérdőív egy jól elkülönült helyén koncentrálva követték egymást. 50. táblázat
Az attitűd kérdések esetén szignifikáns magyarázó modell összegzése (SPSS output alapján)
Modell 1 Predictors: (Constant), hely kérdés helye a kérdőívben
R
R Square
Adjusted R Square
Std. Error of the Estimate
,856
,732
,679
1,68795
Az attitűdnél a kérdések esetében a kérdés helye erős magyarázóértékkel szignifikánsan befolyásolta a válaszmegtagadási arányokat ebben a kérdéscsoportban. A modellben szereplő egyetlen változó a teljes variancia 67,9%-át magyarázza, a kérdés hossza változó bevonása csökkenti a modell magyarázóértékét.
190
51. táblázat Az attitűd kérdések esetén szignifikáns magyarázó modell együtthatói (függő változó: nt/nv arány (%), SPSS output alapján) Model
Unstandardized Coefficients B
Std. Error
(Constant)
-,895
2,442
hely kérdés helye a kérdőívben
,240
,065
Standardized Coefficients
t
Sig.
-,367
,729
3,697
,014
Beta
,856
Ha a kérdőív általunk elemzett kérdéseit mint szöveget hasonlítjuk más szövegekhez, akkor két kutatás adatai alapján a korosztály számára könnyen érthető szövegnek jellemezhetjük. A 70 feletti betűhely hosszúságú mondatok számának emelkedése egy adott szövegben gondot jelent a tartalom megértésében a 14 és 16 éves tanulók esetében (Kojanitz László292 idézett adatai szerint). Az általunk vizsgált kérdések 21 és 160 karakter hosszúságúak voltak, az átlag karakterszám 79,26 (a medián 79). Egy másik felmérés szerint a kilencedik osztályos gimnazisták fogalmazásaiban egy mondat átlagos hossza 12,9 szó volt (Vallent Brigitta293 alapján). Az általunk vizsgált kérdésekben a legkevesebb 3, a leghosszabb mondat pedig 25 szóból állt, az átlagos mondathosszúság 10,85 szó (a medián 11). 3.4.2.3 Kontextus hatás Ahogy azt a kutatási dizájn leírásában láthattuk, a kutatás közös, teljes mintára vonatkozó kérdései kiváló vizsgálati lehetőséget nyújtanak a kontextus-hatás tesztelésére, mert az egyes alminták kérdései a közös kérdések közé „ékelődnek” be. Mivel az összesen 8000 fős mintában almintánként eltér a kérdések sorrendje, elképzelhető, hogy ennek az eltérésnek kimutatható hatása van a válaszokra. A lehetséges blokkok megvizsgálása után a kontextus hatást a kérdőívben minden olyan kérdéssoron próbáltuk tetten érni, ahol a legkisebb logikai összefüggés fellelhető volt. Így vizsgáltuk politikai és közéleti kérdéssoron, tanfolyam és idegen nyelvtudást vizsgáló kérdéseken, illetve vizsgáltuk, hogy a sportolási szokások részletes kérdezésének van-e hatása a fogyasztási kérdésekre (a kérdések részletes sorrendje megtalálható az 5.3.2. számú függelékben). Összességében azonban, minden erőfeszítés ellenére, a vizsgált kérdéssorok egyikén sem sikerült eltérést kimutatni az alminták között. 292
Kojanitz László: A tankönyvek használhatóságát meghatározó minőségi összetevők elemzése és összehasonlítása, http://www.okm.gov.hu/letolt/kozokt/tankonyvkutatasok/cd1_kojanitz/vizsgalat_eredmenyeinek_bemutatasa.pdf 293
Vallent Brigitta: Beszélt nyelvi http://www.c3.hu/~nyelvor/period/1322/132205.pdf
hatások
191
a
középiskolások
fogalmazásaiban,
3.4.3 Részleges válaszmegtagadás Az Ifjúság2008 kutatás adatbázisában megvizsgáltuk a „nem tudom/nem válaszolok” kimenetelek mértéket egyes kijelölt változó-szetteken. Az elemzésbe csak olyan kérdéseket vontunk be, amelyekre minden válaszoló válaszolt (elvileg), tehát a közös kérdőív blokkban találhatók, és nem vonatkoznak rájuk semmilyen logikai szűrés vagy ugratás. A szakirodalom alapján feltéteztük, hogy különbözni fog a nem válaszolás mértéke a kérdés tartalma szerint is, így tehát megkülönböztettük faktuális, azaz tényszerű, nagy biztonsággal objektív eldönthető válasszal rendelkező kérdéseket; attitűd jellegű kérdéseket; az önkitöltő kérdőív elemeit; és megkülönböztettünk a kérdezőbiztosnak szóló kérdéseket. Részletesen az 5.3.3. számú függelékben mutatjuk be, hogy melyik változók alkotják az egyes indexeket. 3.4.3.1 Az egyes kérdéstípusok nem válaszolását mérő indexek kialakítása Fontos megjegyezni természetesen, hogy a faktuálisnak sorolt kérdések nagy része nem nélkülözi a válaszadói szubjektív elemeket: ezeknél a kérdéseknél torzíthat a válaszoló saját önképéhez való viszonyulás. A faktuális kérdések egyik speciális fajtáját jelentik az úgynevezett demográfiai kérdések. Az ilyen típusú kérdések döntő többsége – mondhatni definíció szerint – kulcsfontosságú szerepet játszik mind az adatfelvétel, mind pedig a terepmunkát követő adatelemezés szempontjából. A minta kialakítása, pótlása, súlyozása során elengedhetetlen, hogy az alapvető demográfiai ismérveket megismerjék és hiánytalanul rögzítsék. Az elengedhetetlen szerepnek köszönhetően ezek a kérdések és változók sokkal nagyobb szerepet, több utómunkát és figyelmet kapnak, mint a kevésbé fontos kérdések és változók. A faktuális kérdéseket mérő összevont index a gazdasági státusszal összefüggő kérdések (üdülés, internet és mobiltelefon, idegennyelvtudás), fogyasztási kérdésekből, szabadidő eltöltéssel kapcsolatos kérdések nem válaszolóit összesítette. A másik jellemző típus az attitűdökre vonatkozó kérdések vizsgálata. Az összevont, az attitűdkérdések nem válaszolóit aggregáló index két, különálló területtel kapcsolatos attitűdcsoportból áll, egyrészt a politikai, közéleti kérdésekkel kapcsolatos attitűdöket, másrészt a saját helyzettel való elégedettséggel kapcsolatos attitűdöket mérő kérdésekből áll. A harmadik típusú kérdéssor, amely esetében vizsgáltuk a nem válaszolást az önkitöltő kérdőív egyes kérdéseire. Az önkitöltő kérdőívben szereplő kérdések legtöbbje valamilyen okból szenzitív minősítést kapott, és pontosan a nagyobb látencia elkerülése érdekében került 192
az önkitöltő kérdőív blokkba. Az önkitöltő kérdések közül aggregáltuk a túlzott alkoholfogyasztással, kábítószer fogyasztással és szerelmi/szexuális élettel összefüggő kérdések nem válaszolóit, valamint a szavazási hajlandóságot firtató kérdésre nem válaszolókat. A kérdezőbiztosok számára kialakított kérdéssoron is vizsgáltuk a részleges nem válaszolás jelenségét. Esetükben a saját benyomásait illetve a kérdezés körülményeit rögzítő kérdéseket vizsgáltuk, ez volt a válaszadó jellemzésére vonatkozó kérdéssor (a válaszadás körülményeire kérdező, a ház és környék jellemzésére szolgáló kérdések, valamint a lakás jellemzésére szolgáló kérdések). 3.4.3.2 Az egyes kérdéstípusok hatása Nézzük
először
részletesen,
hogyan
alakul
a
válaszmegtagadás
az
egyes
kérdéscsoportokban, milyen hatása van a kérdéstípusoknak, illetve az egyes kérdéstípusokon belül tapasztalhatók-e eltérések. Ahhoz, hogy megtudjuk, hogy van-e különbség, elvégeztünk egy összehasonlítást, amelyben a válaszhiányok és az összes válasz arányát vizsgáljuk meg az egyes kérdéscsoportok szerint.
193
52. táblázat
Átlagos item missing szám alakulása változók száma
átlag
Std. Deviation
nt/nv válaszok aránya
faktuális kérdéseknél összesen
32
0,447746
1,793312
1,40%
gazdasági státuszfüggő kérdéseknél
6
0,072932
0,38902
1,22%
fogyasztási kérdéseknél
11
0,084819
0,740755
0,77%
szabadidő kérdéseknél
15
0,289995
1,133822
1,93%
attitűd kérdéseknél összesen
21
1,030832
1,950893
4,91%
politikai, közéleti kérdéseknél
9
0,515354
1,245629
5,73%
saját helyzettel való elégedettség kérdéseknél
12
0,515478
1,140586
4,30%
önkitöltő szenzitív kérdéseknél
16
2,040367
4,72397
12,75%
Hiányzó válaszok száma összes vizsgált kérdésen összesen
69
3,5189
5,65504
5,10%
kérdezőbiztosi kérdéseknél 4 kérdéscsoportból összesen
21
0,425211
1,571094
2,02%
válaszadó jellemzése kérdezőbiztosi kérdéseknél
6
0,118252
0,456677
1,97%
válaszadás körülményei kérdezőbiztosi kérdéseknél
5
0,215206
0,88454
4,30%
ház és környék jellemzése kérdezőbiztosi kérdéseknél
6
0,054111
0,502791
0,90%
lakás jellemzése kérdezőbiztosi kérdéseknél
4
0,037642
0,382036
0,94%
Az egyes indexek
A legmagasabb nem válaszolási arányt az önkitöltő kérdések esetében tapasztaltuk, azt mondhatjuk, hogy a vizsgált önkitöltő kérdések közel 13%-át kihagyták a kitöltők, ráadásul úgy, hogy a kérdezőbiztos jelen volt. Az attitűd típusú kérdések esetében tapasztaljuk a második legmagasabb nem válaszolási értékeket. Ha megvizsgáljuk a két különböző attitűdváltozó készletet, akkor azt tapasztaljuk, hogy a politikával kapcsolatos kérdések esetében magasabb a nem válaszolás aránya, mint a saját helyzettel való elégedettséget mérő kérdéssor esetén. A faktuális kérdések esetében jól látható a részleges nem válaszolás alacsonyabb szintje, amely ugyanakkor eltér az egyes faktuális tartalmak esetében. A viszonylag semlegesnek mondható élelmiszer fogyasztási kérdéssoron a legalacsonyabb a nem válaszolók száma, némiképpen magasabb a gazdasági státusszal összefüggő kérdéseken mért hiányzó értékeket átlagos száma, legmagasabb pedig szabadidő és kultúra eltöltésre vonatkozó kérdések esetében. 194
A kérdezőbiztosok esetében nem volt kimutatható szignifikáns összefüggés a rendelkezésre álló változókkal (kor, nem, befejezett iskolai végzettség), így esetükben nem tudtunk részletesebb elemzést készíteni. A továbbiakban vizsgáljuk meg részletesen, milyen jellegzetességek, eltérések tapasztalhatók az egyes demográfiai változók mentén. 3.4.3.3 A részlegesen nem válaszolók demográfiája Nemek szerint vizsgálva294 a lányok esetében magasabb a nem válaszolás átlaga a szabadidő-kulturális kérdéscsoportban. A hiányzó válaszok száma faktuális szabadidő kérdéseknél fiúk esetében 0,2604, lányok esetében 0,3201. Az összevont faktuális nem válaszolást aggregáló mutatószám is szignifikánsan eltér (fiúk esetében 0,3986, lányok esetében pedig 0,4978 a nem válaszolás átlaga). A korcsport vizsgálata során azt tapasztaltuk, hogy minél idősebb valaki, annál nagyobb eséllyel nem adott választ a szabadidő-kultúra kérdéssor kérdéseire (15-19 évesek esetében 0,2189, a 25-29 évesek esetében 0,3666 az item missingek átlagos száma). 53. táblázat
Átlagos hiányzó értékeinek száma a válaszoló korcsoportja szerint (csak szignifikáns dimenziók)
válaszoló életkora
Hiányzó válaszok száma attitűd politikai, közügyi kérdéseknél
15-19 éves
,7030
Hiányzó válaszok száma attitűd saját helyzettel való elégedettség kérdéseknél ,8833
20-24 éves
,3939
25-29 éves
,4508
Hiányzó válaszok száma attitűd kérdéseknél összesen
Hiányzó válaszok száma összes vizsgált kérdésen összesen
1,5864
3,9992
,3474
,7412
3,1749
,3276
,7784
3,3828
Általában elmondható, hogy a legfiatalabbak – azaz a 15-19 évesek – között a legnagyobb a „nem tudom/nem válaszolok” kimenetelek aránya. Különösen igaz ez az attitűd jellegű kérdéssorok esetében, ahol közel kétszeres a legfiatalabb korcsoport átlaga a két idősebb
korcsoport
átlagához
képest.
Hasonlóan
településtípusának.
294
ANOVA és F próba segítségével teszteltük az eltérést.
195
erős
hatása
van
a
válaszoló
Hiányzó válaszok száma faktuális fogyasztási kérdéseknél
Hiányzó válaszok száma faktuális szabadidő kérdéseknél
Hiányzó válaszok száma attitűd kérdéseknél összesen
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél
Hiányzó válaszok száma attitűd politikai, közügyi kérdéseknél
Hiányzó válaszok száma attitűd saját helyzettel való elégedettség kérdéseknél
Hiányzó válaszok száma attitűd kérdéseknél összesen
Hiányzó válaszok száma összes vizsgált kérdésen összesen
Átlagos missing száma a válaszoló településtípusa szerint (csak szignifikáns dimenziók)
Hiányzó válaszok száma faktuális státuszfüggő kérdéseknél
54. táblázat
főváros
,1051
,2144
,5686
,8881
3,5246
,7415
,6390
1,3805
5,7932
megyei jogú város
,0602
,0472
,2434
,3508
1,4408
,5036
,5061
1,0097
2,8013
város
,0560
,0508
,2212
,3280
1,9524
,4664
,4620
,9284
3,2088
község
,0814
,0814
,2603
,4230
1,8281
,4711
,5163
,9874
3,2385
településtípus
Itt az látható, hogy a fővárosban válaszolók jóval magasabb nem válaszoló átlagokat érnek el az összes vizsgált kérdéscsoportban. A legszembetűnőbb különbség az átlagos válaszhiányok mértékében a fogyasztási kérdéssor, valamint a szabadidő-kultúra kérdéssoron tapasztalható. 55. táblázat
A szignifikáns kérdéscsoportok átlagos hiányzó értékeinek száma a szubjektív anyagi helyzet szerint Hiányzó válaszok száma faktuális szabadidő kérdéseknél
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél
gondok nélkül élnek,
,2294
1,6338
kijönnek,
,2389
2,0238
nélkülözések között élnek
,5845
2,1546
Átlagosan
,2474
2,0027
Összességében hogy érzi, Önök anyagilag
A saját anyagi helyzetüket nélkülözések között levőnek leírók között jóval nagyobb arányban találunk válaszmegtagadó válaszokat, mint a többi szubjektív anyagi helyzetet leíró csoportban. A saját magukat legjobb (gondok nélkül élnek) kategóriába sorolók között összességében alacsonyabb az item nem válaszolás aránya és a szubjektív anyagi helyzet romlásával nő a válaszmegtagadás. 196
Hiányzó válaszok száma faktuális szabadidő kérdéseknél
Hiányzó válaszok száma attitűd kérdéseknél összesen
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél
Hiányzó válaszok száma attitűd politikai, közügyi kérdéseknél
Hiányzó válaszok száma attitűd saját helyzettel való elégedettség kérdéseknél
Hiányzó válaszok száma attitűd kérdéseknél összesen
Hiányzó válaszok száma összes vizsgált kérdésen összesen
56. táblázat A kérdéscsoportok átlagos hiányzó értékeinek száma a válaszoló legmagasabb iskolai végzettsége szerint (csak szignifikáns összefüggések)
legfeljebb 8 általános
,2096
,3323
2,1223
,7170
,8332
1,5502
4,0047
szakmunkásképző
,3190
,4974
1,6112
,4171
,3167
,7338
2,8424
érettségi
,2774
,4117
2,1630
,3903
,3810
,7713
3,3461
diploma
,3777
,5227
1,8866
,4181
,2663
,6844
3,0937
Átlagosan
,2736
,4126
2,0217
,5114
,5123
1,0236
3,4579
Legmagasabb befejezett iskolai végzettség
Az iskolai végzettség – a már korábban említett értelmezési nehézségek ellenére is – nagyon érdekes képet rajzol elénk. Az iskolai végzettséggel párhuzamosan nő a meg nem válaszolt kérdések átlagos száma a kulturális-szabadidő kérdéseken összességében. Az önkitöltő kérdéssor esetében azt tapasztaljuk, hogy a diplomások között alacsonyabb a nem válaszolás mértéke. A politikai és személyes helyzettel való elégedettséget kifejező attitűdök esetében is az alacsonyabb iskolai végzettséggel rendelkezők nem válaszolnak meg több kérdést és összességében is magasabbak a meg nem válaszolt kérdéseik száma. Az alacsonyabb iskolai végzettséggel rendelkezők nyílván még fiatalabbak, kevésbé tapasztaltak a politikai vélemények artikulálása terén, de közismert körükben az erős politika érdektelenség a 15-29 évesek között.
197
,2289
,3540
2,0060
,6312
,8307
1,4619
3,8219
dolgozik
,2934
,4504
2,2182
,4025
,2794
,6820
3,3506
tanul és dolgozik
,2987
,4046
1,4355
,3141
,2139
,5279
2,3680
egyik sem
,3517
,5445
1,9264
,5515
,3943
,9458
3,4167
Átlagosan
,2775
,4242
2,0359
,5119
,5133
1,0252
3,4853
Hiányzó válaszok száma összes vizsgált kérdésen összesen
Hiányzó válaszok száma attitűd saját helyzettel való elégedettség kérdéseknél
Hiányzó válaszok száma attitűd kérdéseknél összesen
Hiányzó válaszok száma attitűd politikai, közügyi kérdéseknél
tanul
Tanul-e, dolgozik v. mindkettő v. egyik sem
Hiányzó válaszok száma faktuális szabadidő kérdéseknél
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél
Hiányzó válaszok száma attitűd kérdéseknél összesen
57. táblázat A kérdéscsoportok átlagos hiányzó értékeinek száma a válaszoló gazdasági aktivitása szerint (csak szignifikáns összefüggések)
A kulturális szabadidő kérdéseken alacsonyabb a tanulók értéke átlagosan, az önkitöltő kérdőíven a tanulók és dolgozók átlagosan jóval kevesebb item-et hagytak ki. A két attitűd kérdéssoron a dolgozók hagyták ki a legkevesebb kérdést. Az inaktívak a faktuális és attitűd kérdéssorokon átlagosan több kérdésre nem válaszoltak, ugyanakkor a többi kérdéssoron átlagos a kihagyott kérdéseik száma. Összességében azonban a tanulók és dolgozók hagyták ki a legkevesebb kérdést. 58. táblázat
hányan élnek a családban - 6+ összevonva
A kérdéscsoportok átlagos hiányzó értékeinek száma a család mérete szerint (csak szignifikáns összefüggések)
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél
Hiányzó válaszok száma Hiányzó válaszok száma attitűd attitűd saját helyzettel való kérdéseknél összesen elégedettség kérdéseknél
1 fő
2,1130
,3640
,9582
2 fő
2,2259
,3060
,7569
3 fő
2,2166
,4645
,9497
4 fő
1,9506
,6077
1,1283
5 fő
1,7043
,5906
1,1331
hatan vagy többen
1,8289
,5675
1,1516
Átlagosan
2,0261
,5106
1,0220
198
Az önkitöltős kérdések esetében, minél többen élnek egy háztartásban, annál kevesebb a hiányzó itemek száma átlagosan. Az attitűd kérdések esetében azt tapasztaljuk, hogy valamelyest nagyobb arányban nem adnak válaszokat a nagyobb háztartásokban élők. 3.4.3.4 A részleges válaszmegtagadás a kérdőív felvételének jellemzői tükrében A részleges nem válaszolás jelenségét megvizsgáltuk az adott válaszolóról illetve kérdezésről rendelkezésre álló két metaadat, a felkeresések száma illetve a cím típusa szempontjából is. 59. táblázat A kérdéscsoportok átlagos hiányzó értékeinek száma a válaszadó felkeresésének száma szerint (csak szignifikáns összefüggések) Hiányzó válaszok száma faktuális státuszfüggő kérdéseknél
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél
Hiányzó válaszok száma összes vizsgált kérdésen összesen
egyszeri
,0789
2,1214
3,6191
kétszeri
,0474
1,7879
3,2167
3 vagy többszöri
,0512
1,5394
2,8780
Átlagosan
,0729
2,0404
3,5189
felkeresések száma
Nagyon érdekes módon annyi megállapítható, hogy a sokadik felkeresések esetében átlagosan kevesebb a hiányzó érték a státuszfüggő kérdéssoron, az önkitöltő kérdéssor esetében és összességében az összes vizsgált kérdéssoron általában. Ez talán azzal függhet össze, hogy a többszöri felkeresés miatti lelkiismeret furdalás miatt nagyobb a lojalitása a válaszolónak a kérdezőbiztos irányába. 60. táblázat
A kérdéscsoportok átlagos hiányzó értékeinek száma a mintába kerülés hulláma szerint (csak szignifikáns összefüggések)
Hiányzó válaszok száma faktuális szabadidő kérdéseknél ,3015
Hiányzó válaszok száma önkitöltő szenzitív kérdéseknél 1,8220
Hiányzó válaszok száma attitűd politikai, közügyi kérdéseknél ,4690
Hiányzó válaszok száma attitűd kérdéseknél összesen ,9707
Hiányzó válaszok száma összes vizsgált kérdésen összesen 3,2572
1 pótcím
,3157
1,9403
,5204
1,0151
3,4358
2. pótcím
,1959
1,8842
,5639
1,1201
3,3463
3. pótcím
,2020
1,8215
,7340
1,3502
3,5219
kvótás ID
,3082
2,5004
,5302
1,0477
4,0088
Átlagosan
,2900
2,0404
,5154
1,0308
3,5189
Mintába kerülés hulláma főcím
199
A faktuális kérdéseket leszámítva mindegyik index esetében a főcímen elértek hiányzó értéke közel a legalacsonyabb, összességében is körükben a legalacsonyabb összesen a hiányzó értékek száma. Úgy tűnik tehát, hogy a pótcímek „erőltetése” pozitív hatással volt az adatminőségre is a visszautasítási arányok javulása mellett. 3.4.3.5 Nem válaszolási mintázatok – válaszmegtagadói típusok Elsőként megvizsgáljuk a kor, nem és településtípus együttes hatását abból a célból, hogy e három dimenzió mentén tipikus válaszadói illetve válaszmegtagadói csoportokat különítsünk el. Ezek alapján elmondható, hogy a fővárosban élők esetében az önkitöltő kérdőívnél jóval magasabb a nem megválaszolt kérdések átlaga, Különösen érdekes összehasonlítani a megyeszékhelyeken élők által kitöltött kérdőívek nem válaszolási arányaival, akik jóval kisebb arányban tagadták meg a válaszolást (fővárosban 20% feletti, a megyeszékhelyeken 9% körüli átlagosan). Ez a megállapítás igaz a nőkre és a férfiakra is egyaránt. A korosztályok szerint vizsgálva jól látható, hogy a fővároson belül is a legmagasabb válaszmegtagadási átlagokat a 19 évnél fiatalabbak érték el a vizsgált kérdések mentén, megint csak mindkét nem esetében. 3.4.3.5.1 Válaszmegtagadási tipológia Szerettük volna látni, hogy a nem válaszolás mérésére használt dimenziók mentén milyen jellemző együtt járásokat lehet felfedezni a válaszmegtagadás terén, valamint hogy az egyes válaszmegtagadási csoportok milyen jellemzőkkel hozhatók összefüggésbe. A jellemző válaszmegtagadó csoportok feltérképezéséhez klaszterelemzést végeztünk, a meglehetősen nagy mintanagyság miatt nem is próbálkoztunk hierarchikus klaszterezési eljárással, így Kmeans klasztert használtunk295. Ez az eljárás nem nélkülözi a kutató szubjektív döntéseit, ezért inkább tekintjük ezt egy gondolat kísérletnek, mint jól alátámasztott statisztikai eljárás során egzakt eredményt produkáló lépéssorozatnak. A K-means eljárás egyik hátránya viszont, hogy nem ugyanazt az 295
Az elemzést SPSS 18 K means cluster eljárással megfelelő klaszterszám keresésével végeztük. Az eljárás során az a K-means algoritmus minden egyes elemet ahhoz a klaszterhez sorol, amelyiknek a középpontja a legközelebb esik az adott elemhez. Az algoritmus lépései a következők: kiválasztja a klaszterek számát (k), majd létrehoz k véletlenszerű klaszter középpontot. Minden egyes pontot abba a klaszterbe sorol, amelynek középpontjához a legközelebb helyezkedik el, majd kiszámolja az új klaszter középpontokat. Addig ismétli az előző két lépést (iterál), amíg valamilyen konvergencia kritérium nem teljesül (általában az, hogy a besorolás nem változik).
200
eredményt adja különböző futtatások után, mert befolyásolja a kezdeti random besorolás. Azért, hogy a fájlsorrend hatását kiküszöböljük, a kialakult klaszterstruktúrát létrehoztuk több fájlsorrend mellett is. A klaszterek kialakításához csak azokat a válaszolókat vettük figyelembe, amik a vizsgált kérdéssorok esetében rendelkeztek adathiánnyal. A válaszolók közül összesen 2696an mindegyik vizsgált kérdésére válaszoltak, egyetlen hiányzó értékkel sem rendelkeztek, így összesen 5380 eset szerepel a klaszterelemzésben. A klasztereket a már bemutatott változók mentén képeztük, amelyek az egyes kérdéscsoportokat összegzik típusonként. A klaszterezés során teszteltük a 3 aggregált változó, illetve a 6 eredeti változó szerinti csoportképzést. Mivel a kétféle modellben történt csoportosítás egymáshoz hasonló modellekhez vezetett, a kétféle klaszterképzés közül a 3 aggregált változó szerinti modellel dolgoztunk tovább. Azt látnunk kell azonban, hogy ezzel a döntéssel a csoportosító modellben nagyobb súllyal vesszük figyelembe a kevesebb kérdéscsoportból álló típusokat, így például az önkitöltő kérdőív egy változójához képest a faktuális kérdéssorok 3 változója egyetlen aggregált változóként szerepel. A klaszterező változókat átalakítottuk az előző fejezetben bemutatott változókhoz képest: a 3 klaszterképző változó százalékos arányban fejezi ki az adott kérdéscsoportban kihagyott kérdések számát, így mintegy „standardizálja” a változók eltérő terjedelmét. A klaszterezési eljárásban a változókat kategorizálva használtuk, a megfelelő típusok keresése során a következő klaszter-struktúrát fogadtuk el. 61. táblázat
Kihagyott kérdések aránya az egyes klasztercsoportokban (átlagosan, %) klaszterképző változók szerinti kihagyott kérdések aránya
klaszter csoportok
faktuális válaszmegtagadó önkitöltő válaszmegtagadó attitűd válaszmegtagadó notórius válaszmegtagadó átlagosan (N=5380) átlagosan (N=8076)
faktuális kérdéseken
önkitöltő kérdéseken
attitűd kérdéseken
6,9065 0,1046 0,1509 10,9146 2,1004 1,3992
8,0074 39,1184 0,9514 23,6890 19,1427 12,7522
,8649 3,5974 12,3435 18,5366 7,3686 4,9087
Az első csoportra legnagyobb mértékben a faktuális kérdéseken tapasztalható válaszmegtagadás jellemző. Hasonlóképpen, a második csoport profilja is viszonylagosan egyértelmű, ebbe a csoportba sorolódtak azok, akik az önkitöltő kérdések 39%-át kihagyták átlagosan. Az attitűd kérdésekre érzékenyebbeket tömöríti a harmadik klaszter, a negyedik
201
klaszterbe pedig azok kerültek, akik mindegyik kérdéssor esetében jóval gyakrabban tagadtak meg választ. A végleges tipológiába beépítettük azokat is, akiknél nem tapasztaltunk a vizsgált kérdéseken válaszmegtagadást. 37. ábra A válaszmegtagadás típusai az Ifjúság2008 kutatásban
Elmondható tehát, hogy a kialakított klaszterek segítségével felrajzolható egyféle tipológiai a válaszadási kedv tekintetében. Ezek szerint a válaszolók 33%-a a vizsgált kérdések mindegyikére adott választ, 5%-uk pedig az átlagnál jóval többször élt a válaszmegtagadás lehetőségével. A válaszolók többsége a vizsgált 3 kérdéscsoport valamelyikén gyakrabban tagadott meg válaszokat, a legtöbben a kérdezőbiztosi kontroll nélküli és szenzitív kérdéseket tartalmazó önkitöltő kérdőív blokk esetében (27%). Az attitűd kérdéssor esetében a válaszolók 24%-a bizonyult válaszmegtagadónak, a faktuális kérdések esetében pedig 11%-uk. 3.4.3.5.2 Az egyes válaszmegtagadói típusok jellemzői Az egyes csoportok összetételét, szociológiai és demográfiai jellemzőit multinomiális logisztikus regressziós modellben vizsgáltuk, amelyben a függő változó a válaszmegtagadási tipológia volt. A modell kialakítása és az elemzés során szerettük volna minél több irányból 202
megragadni az egyes válaszmegtagadási típusok közötti különbségeket, ezért a lehetséges hatások széles körével indítottuk az elemzést. A lehetséges befolyásoló tényezők meghatározása azonban meglehetősen szigorú korlátokkal rendelkezett. Egyrészt behatárolták a kutatás során már felvett kérdések, amelyek kialakításakor nem módszertani szempontok játszották a főszerepet. Másrészt korlátot jelentett az is, hogy a már meglévő változókból csak azokat volt érdemes egyáltalán tesztelni, amelyeket a teljes minta megkapott válaszolásra. Ezen megfontolások mellett tehát bizonyos lehetséges befolyásoló hatásokat – így például az értékek, értékrend hatását, vagy a társadalmi pozíció, a rétegződésben elfoglalt helyzet hatását – eleve nem tudtuk tesztelni. Más esetekben pedig a tesztelni kívánt hatás csak részmintán állt rendelkezésre, amely az elemzés során alacsony elemszámokhoz vezetett volna (ilyen volt például a különböző társadalmi és állami intézményekbe vetett bizalmat firtató kérdéssor). A demográfiai jellemzők között hatással lehet a válaszmegtagadásra a nem, a kor, a településtípus, a vallásosság és a befejezett iskolai végzettség (minden korábban említett hátránya ellenére). A jövedelmi helyzetet a modellben a háztartás egy főjére eső ekvivalens jövedelemével, a háztartás vagyoni helyzetét pedig a háztartásban található tartós fogyasztási eszközök számával mértük. Beemeltük a független változók közé a kérdezett fő tevékenységét, azaz hogy tanul, dolgozik, vagy inaktív. Fontos szerepet játszik a fiatalok értékorientációban a szülői és családi szocializációs közeg, ezért úgy gondoltuk, hogy hatással lehet a válaszmegtagadásra a szülőkkel való azonosulás mértéke is, azaz a szülők életének megítélése, és a szülőkkel való egyetértés politikai kérdésekben. A szocializációs közeg másik fontos ismérve a szülők iskolai végzettsége, ezért az apa és az anya befejezett iskolai végzettségéből képzett főkomponenst is beemeltük be296 a modellbe. Vizsgáljuk továbbá azt, hogy a vallásos nevelésnek milyen szerepe lehet a válaszmegtagadásban. Bizonyos
életmód
jellemzők
direkt
és
indirekt
módon
befolyásolhatják
a
válaszmegtagadást, esetünkben vizsgáltuk a sportolást, illetve hogy van-e szabadideje, van-e baráti társasága a válaszolónak. A tájékozottságot, a társadalmi életről, közéletről való tájékozódás alapvetően befolyásolhatja bizonyos kérdésekben a válaszolási kedvet, és jobb minőségű válaszokat
296
SPSS PASW 18. programcsomag segítségével főkomponens elemzés, a teljes magyarázott variancia 83,329%.
203
eredményezhet. A tájékozódás intenzitását a használt médiumok számával mértük a modellben.297 Összefügghet a válaszmegtagadással az is, hogy egyébként a válaszoló mennyire aktív a közért való tevékenységekben, azaz kiveszi-e a részét civil szervezetek munkájából, illetve részt vesz-e a formális demokrácia működtetésében. A civil szervezettel való kapcsolat és a választási részvételi hajlandóság alapján képeztünk egy indexet, amelyik a közéleti aktivitást igyekszik aggregálni. A kérdezőbiztos és a kérdezett társadalmi távolságát mérő változó a már említett három demográfiai jellegű egyenlőtlenség mentén jellemzi az interjúkban részt vevők távolságát. A társadalmi távolság változók kialakításánál úgy húztuk meg a távolságok bináris változóinak határát, hogy bizonyos kismértékű távolságot még nem tartottunk az interjú szempontjából meghatározó eltérésnek. Az iskolai végzettség esetén 2 szint eltéréstől tekintettük különbözőnek, a kor esetében pedig az 5 évnél nagyobb különbséget tekintettük befolyásoló mértékűnek. A kérdező és a kérdezett társadalmi távolságát mérő három egyenlőtlenségi dimenziót összegeztük egy indexben úgy, hogy nem voltunk tekintettel a különbség irányára, pusztán az eltérést regisztráltuk. A multinomiális logisztikus regressziós modell lehetővé teszi, hogy a többféle mérési szintű magyarázó változó mindegyikét szerepeltessük, a nominális mérési szintű függő változónkhoz bármilyen mérési szintű, több független változót használhattunk298. A modellépítés első lépéseként minden lehetséges magyarázóváltozó magyarázó erejét a
statisztika
segítségével meghatároztuk, amelyik azt jelzi, hogy mennyire sikerült a függő változóra vonatkozó becslés pontosságát javítanunk a független változók bevonásával.299
297
Ezek a csatornák az internet, a televízió, a rádió, a napilapok és a hetilapok.
298
Az árát is megfizetjük ennek az engedménynek, ha logisztikus regressziót, akkor valamennyi információ veszteségünk lesz a lineáris regresszióhoz képest. 299
Székelyi-Barna: 413. oldal, fenntartásokkal, de tekinthetjük a megmagyarázott hányadnak,.
204
29. egyenlet
ahol: a függő változó bevonása utáni csökkenés mértéke a -2LL értékében a kezdeti -2LL értékét Mindegyik vizsgált hatás szignifikánsnak mutatkozott az egyváltozós multinomiális logisztikus regressziós modellekben. A becslésben a legnagyobb pontosságjavulást a szabadidővel rendelkezés illetve a fő tevékenységként a tanulás megjelölők esetében tapasztalható, de viszonylag nagy magyarázóérték jellemezte a befejezett iskolai végzettséget is. A modellépítés során a lehető legnagyobb magyarázó erő mellett szerettük volna a lehetséges
független
változók körét
szélesen értelmezni.
Elsőként
a legnagyobb
magyarázóértékkel rendelkező változókkal építettünk modellt, majd az így kialakított változókhoz próbáltunk még bevonni szerényebb önálló magyarázóértékkel rendelkező változókat úgy, hogy a változók szignifikancia szintjét és a magyarázóérték változását figyelemmel kísértük. Az így kialakított modellünkben összesen 5 változó szerepelt, a több változós modellek esetében már nagyon kismértékűek voltak az egyéni hatások és nagymértékben csökkent az
mutató értéke. A végleges modell
205
értéke 46,03%.
62. táblázat A végleges multinomiális logisztikus regressziós modell esélyhányadosai és a hozzá tartozó szignifikancia-szintek (referencia csoport: minden kérdésre válaszolók) tipológia
faktuális válaszmegtagadó
önkitöltő válaszmegtagadó
attitűd válaszmegtagadó
notórius válaszmegtagadó
Sig. Intercept szabadidő befejezett iskolai végzettség közügyek [l_tanul=,00] [l_tanul=1,00] [nem=1] [nem=2] Intercept szabadidő befejezett iskolai végzettség közügyek [l_tanul=,00] [l_tanul=1,00] [nem=1] [nem=2] Intercept szabadidő befejezett iskolai végzettség közügyek [l_tanul=,00] [l_tanul=1,00] [nem=1] [nem=2] Intercept szabadidő befejezett iskolai végzettség közügyek [l_tanul=,00] [l_tanul=1,00] [nem=1] [nem=2]
,000 ,000 ,400 ,017 ,535 . ,229 . ,526 ,769 ,000 ,006 ,808 . ,003 ,526 ,001 ,008 ,000 ,327 ,000 . ,359 ,001 ,000 ,000 ,002 ,006 ,635 . ,885 ,000
Exp(B) ,057 ,960 ,839 1,069 . ,893 . 1,111 ,725 1,184 1,021 . 1,250
,515 ,777 ,950 ,482 . 1,062
,086 ,786 ,727 ,924 . 1,022
A szabadidő, az iskolai végzettség és a közéleti aktivitás 3 típus esetében szignifikáns, a tanulási főtevékenység és a nem pedig mindösszesen egy típust választ el a minden kérdésre válaszolóktól. A minden kérdésre válaszolókhoz képest a szabadidőről és az iskolai végzettségről elmondható, hogy ahol szignifikáns hatást mutat a többi változó szinten tartása mellett, a válaszmegtagadók kevesebb szabadidővel és alacsonyabb iskolai végzettséggel rendelkeznek. 206
A többi változó hatásának kiszűrése nem változtatta meg alapvetően a már tapasztalt összefüggést. Hasonlóan viselkedett a tanulási főtevékenységet jelző változónk is, a nem esetében pedig jól láthatóan az önkitöltő válaszmegtagadók esetében tapasztalható férfi többlet miatt jelent meg szignifikáns hatásként a modellben. A közügyekben való aktivitás esetében azt tapasztaljuk, hogy a többi változó szinten tartása mellett alapvetően megváltozott az egyéni multinomiális logisztikus regressziós modellben tapasztalt hatása (ahol is az attitűd és a notórius válaszmegtagadó esetében mutatkozott szignifikáns hatás, az aktívak csökkenő arányát mutatva). A modell esetében azt látjuk, hogy a közügyekben való aktivitás növekedésével együtt csökken a faktuális és notórius válaszmegtagadóvá válás esélye, ugyanakkor az önkitöltő válaszmegtagadók esetében a hatás fordított: a közügyekben aktívabbak nagyobb eséllyel hagytak ki önkitöltő kérdéseket. A faktuális válaszmegtagadók esetében, ahogy nő a szabadidő mértéke, 0,57-szorosára csökken az esélye annak, hogy ebbe a kategóriába tartozzanak. A közéleti aktivitás esetében hasonló hatást látunk, azok, akik jobban involváltak, 16%-al kisebb eséllyel tartoznak ebbe a kategóriába. Úgy tűnik, hogy minden, a modellben szereplő változó hatását kiszűrve a teljes válaszolókhoz képest kevesebb szabadidővel rendelkeznek, és kevésbé vesznek részt a közügyekben. Az önkitöltő válaszmegtagadók között a magasabb iskolai végzettséggel rendelkezők kevésbé találhatók meg (az esélyhányados értéke 0,73), ugyanakkor közöttük nagyobb eséllyel találunk a közügyekben való aktivitás szerint szerepet vállalókat. A férfiak a nőkhöz képest 25%-al nagyobb eséllyel tartoznak ebbe a kategóriába. Az önkitöltő válaszmegtagadók esetében tehát azt látjuk, hogy minden, a modellben szereplő változó hatását kiszűrve a teljes válaszolókhoz képest alacsonyabb iskolai végzettséggel rendelkeznek, nagyobb eséllyel férfiak, és jobban involváltak a közügyekben. Az attitűd válaszmegtagadók esetében ahogy nő a szabadidő mértéke, 0,52-szorosára csökken az esélye annak, hogy ebbe a kategóriába tartozzanak. A befejezett iskolai végzettség esetében hasonló hatást látunk, azok, akiknek magasabb az iskolai végzettsége 23%-al kisebb eséllyel tartoznak ebbe a kategóriába. A tanulókhoz képest a nem tanulók 52%-al kisebb eséllyel tartoznak ebbe a kategóriába. Az attitűd válaszmegtagadók minden a modellben szereplő változó hatását kiszűrve a teljes válaszolókhoz képest kevesebb szabadidővel rendelkeznek, alacsonyabb az iskolai végzettségük, ugyanakkor nagyobb közöttük a tanulók aránya. 207
A notórius válaszmegtagadók esetében a szabadidő megléte 14%-al, a magasabb befejezett iskolai végzettség 21%-al, a közéleti aktivitás pedig 28%-al csökkentette a kategóriába kerülés esélyét. Minden a modellben szereplő változó hatását kiszűrve a teljes válaszolókhoz
képest
tehát
a
notórius
válaszmegtagadók
kevesebb
szabadidővel
rendelkeznek, alacsonyabb a befejezett iskolai végzettségük és a legkisebb eséllyel vesznek részt közügyekben a vizsgált csoportok közül. 63. táblázat
A végleges multinomiális logisztikus regressziós modell esélyhányadosai változók szerint (referencia csoport: minden kérdésre válaszolók) faktuális
önkitöltő
attitűd
notórius
szabadidő
0,057
1,111
0,515
0,086
befejezett iskolai végzettség
0,96
0,725
0,777
0,786
közügyek
0,839
1,184
0,95
0,727
[l_tanul=,00]
1,069
1,021
0,482
0,924
[l_tanul=1,00]
.
.
.
.
[nem=1]
0,893
1,25
1,062
1,022
[nem=2]
.
Összességében azt mondhatjuk, hogy a befejezett iskolai végzettség, a szabadidővel rendelkezés, a közügyekben való aktivitás, a válaszadó neme és az, hogy tanuló-e bizonyultak relevánsnak egy multinomiális logisztikus regressziós modellben. A teljes válaszolókhoz képest biztosan megállapíthatjuk, hogy a válaszmegtagadók csoportjaiban alacsonyabb az iskolai végzettség és a szabadidő rendelkezésre állása. A notórius válaszmegtagadók a három meghatározó ismérv mellett alacsonyabb pozíciót foglalnak el a teljes válaszolókhoz képest, az attitűd válaszmegtagadók esetében a tanulók erősebb jelenléte adja a fő különbséget. Az önkitöltő válaszmegtagadók esetében férfi többletet tapasztaltunk és a közügyekkel való foglalkozás csak ebben a csoportban növeli a kategóriába tartozás esélyét a teljes válaszolókhoz
képest.
A
faktuális
válaszmegtagadók
hasonlítanak
a
notórius
válaszmegtagadókra, de nem jelenik meg szignifikáns hatásként a befejezett iskolai végzettség a minden kérdésre válaszolókhoz képest.
208
3.5 Összegzés A fedési hiba komponenseként az Ifjúság2008 kutatás kapcsán azokat az eseteket definiáltuk, amikor a személy bekerül a mintakeretbe, pedig nem kellett volna kerettaggá válnia, illetve azokat az eseteket, ahol a nyilvántartás pontatlansága miatt nem elérhető a mintatag. Összesen tehát a felkeresések 5,94%-a hozható kapcsolatba a mintavételi keret pontatlanságával. Természetesen ezzel a fedési hiba csak egy részét tudtuk azonosítani, Lakatos alapján megállapítottuk,
300
hogy a népszámláláskor az összeírt személyek száma
alacsonyabb volt a népesség-nyilvántartás szerinti népességszámnál, mintegy 15 százalékos alulszámlálás volt tapasztalható. A címen keresett, elköltözött és nem elérhető fiatal (összesen 1101 kapcsolatfelvétel esetében) a fiatalabb korcsoportban (15-18 évesek között) kisebb arányban volt található, mint a két idősebb korcsoportban. Ennek oka nagyrészt életmódjukban keresendő. Az elköltözöttek aránya megyénként nagy különbségeket mutat. Kiemelkedően magas arányban találhatóak ilyen meghiúsulási okok Békésben, amit Csongrád és Győr-Moson-Sopron megye követ. Ugyanakkor jóval átlag alatti az elköltözöttek aránya Budapesten és Pest megyében. A korábbi kutatások szerint rosszabb a fedés a fiatalok, különösen a fiatal férfiak között, ezt mi csak részben tudjuk az eredmények alapján megerősíteni, azzal egészítenénk ki, hogy a legfiatalabbak között jobbnak mondható a fedés. Lakatos kutatásából tudjuk, hogy a népszámlálás során az összeírásra nem kerültek legnagyobb része (45%-a) már nem lakott azon a címen: elköltözött vagy meghalt. 301 Ugyanakkor az, hogy „az elköltözött és nem elérhető” válaszmegtagadási ok a leggyakoribb, erősíti Zakariás és Németh302 megállapítását, amely szerint problémát jelent a populációs regiszteren alapuló mintavétel a mobilitással kapcsolatos alacsony regisztrációk száma miatt. A fedési hiba esetében már beszámoltunk a magas látenciáról, nekünk sem sikerült csak a fedési hiba egy részét megmutatnunk.
300
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2 301
Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2 302
Ildikó Zakariás, Renáta Németh2: Comparing samling frames, konferencia előadás, International Conference on Logic and Methodology, Hollandia, Amszterdami egyetem, 2004.
209
Az általunk elemzett kutatásban tehát a kapcsolatfelvételek 39,46%-át sikerült lekérdezni. A megkeresések több, mint 1/3-ára jellemző meghiúsulási ok a válaszmegtagadás: a felkeresésesek összesen 35,43%-a végződött a kooperáció megtagadásával. Az egész adatfelvételre számolva a kooperációs aránya 0,53, azaz 53% a számolt válaszadási arány. Annak ellenére, hogy többféle számítási módot teszteltünk, a többi számolt mutatószám esetében sem térnek el az eredmények nagymértékben ettől az értéktől. Ennek minden bizonnyal az is az oka, hogy nem állt rendelkezésre minden elvárt mutatószám, azaz nem kellő részletességű volt ebből a szempontból a kutatás dokumentációja. A visszautasítók demográfiai összetételét mindig az adott kutatás megfelelő célcsoportjához képest érdemes vizsgálni, de általában elmondható, hogy kevésbé szívesen válaszolnak a felmérésekre a férfiak. Tapasztalataink szerint is minél fiatalabb a válaszoló, annál nagyobb az esélye, hogy elkészül a kérdőív, de ennek oka nem a magasabb kooperációs szándékban, inkább a jobb elérhetőségben keresendő. Jól látható, hogy a fiatalok korcsoportjában
a
legmagasabb
a
válaszmegtagadók
aránya
is.
A
legmagasabb
válaszmegtagadás a fiatal férfiak között, a legmagasabb kooperáció pedig a fiatal nők között tapasztalható. A nemzetközi eredményekkel inkább egyező az a megállapításunk, hogy az idősebbek válaszolnak kevésbé ezekben a korcsoportokban (DeMaio303, Groves304, Brown és Bishop305), ugyanakkor
eredményeink
látszólag
ellentmondanak
Angelusz
és
Tardos306
megállapításainak. Azt azonban fontos kiemelnünk, hogy az Ifjúság2008 kutatás mintájában csak 15-29 évesek találhatók, így a kapott eredmények nem feleltethetők meg egyértelműen a lakossági felvételek szélesebb korosztályait felölelő vizsgálatoknak. Az adatok területi megoszlása alapján annyi biztosan megállapítható, hogy a válaszmegtagadás leginkább Budapestre jellemző, ahol közel minden második megkeresés végződik válaszmegtagadással (48,80%). Nem tudjuk több vizsgálat (Havasi307, Varga308, 303
DeMaio, T.J., “Refusals: Who, Where, and Why?” Public Opinion Quarterly, 9 1980, pp. 223-233.
304
Robert M. Groves: Survey errors and survey costs, John Wiley and és Sons, 1989. New York, pp. 204.
305
Brown, P.R., and Bishop, G.F., “Who Refuses and Resists in Telephone Surveys? Some New Evidence,” University of Cincinnati, 1982. 306
Angelusz Róbert – Tardos Róbert:Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 307
Havasi Éva: Válaszmegtagadó háztartások, 1996-os mikrocenzus jövedelem-felvételének elemzése
210
Angelusz és Tardos309) megállapításait alátámasztani, amely szerint a Dunántúlon általában véve magasabbak a megtagadási arányok, mint Észak-Magyarországon. Azt a korábbi megállapítást sem tudjuk megerősíteni, hogy az Alföldön élők a legkisebb arányban utasítják vissza a válaszolást. Az Ifjúság2008 alapján a földrajzi elhelyezkedés mentén két részre osztottuk a régiókat. Jól látszik a két déli és a nyugati régiókban tapasztalható alacsonyabb válaszmegtagadás. A tőlük észak-keletre található régiókban (gyakorlatilag az összes többi, beleértve Budapestet is), jóval magasabb a válaszmegtagadás. A felkeresések számával definiált nehezen elérhetőket vizsgálva a nagyobb városokban és a fővárosban az interjúk nagyobb része készült el az első felkeresésre, mint a községekben és a városokban élők esetében. A nemek szerint vizsgálva a férfiak között magasabb a 3 vagy többszöri felkérésre elértek aránya és valamelyest alacsonyabb az első felkeresésre sikeres interjút adók aránya, és úgy találtuk, hogy a nehezen elérhetők nem hasonlítanak a teljes válaszmegtagadókhoz. A kérdezőbiztosi hatások vizsgálatakor a
értékek alapján elmondható, hogy a
vizsgált változót szenzitívnek tekinthetjük, hisz értékeik 0,02 felett helyezkednek el. A két vizsgált kérdéscsoport esetében a tapasztalt értékek az ország és a saját életszínvonal értékelésénél voltak magasabbak. A kérdezőbiztos neme és a
érték között egyetlen változónál mutatható ki
szignifikáns összefüggés (0,01) (A következő 10 évben hogyan fog alakulni az emberek életszínvonala?). A megmagyarázott hányad 2,9% volt, a nem hatása kimutatható volt, de korántsem annyira egyértelmű a hatás iránya és mértéke, mint amiről mások beszámoltak (Landis et all.310 Groves és Fultz311).
308
Varga Sára: A jövedelem-felvétel hiányzó adatainak pótlása. Statisztikai szemle. 77. 1999. 2-3. 112-130.
309
Angelusz Róbert – Tardos Róbert: Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás, és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 310
Landis, J.R., et al. “Feminist Attitudes as Related to Sex of the Interviewer” Pacific Sociological Review, Vol. 16, No. 3, July, 1973, pp. 305-314. 311
Groves, R.M., and Fultz, N.H., “Gender Effects Among Telephone Interviewers in a Survey of Economic Attitudes,” Sociological Methods and Research, Vol. 14, No. 1, August, 1985, pp. 31-52.
211
A kérdezőbiztos és a válaszoló társadalmi távolságát – hasonlóan Tu és Liao312 vizsgálatához – három változó mentén definiáltuk (kor, nem, befejezett iskolai végzettség). Az összefüggéseket, azaz az inkonzisztens pozíciók hatását két különböző kérdéskészleten vizsgáltuk. Az eredmények alapján egyes kérdéscsoportok esetében sikerült kimutatni a nembeli eltérések és az iskolai végzettségek különbségeinek hatását. A kérdezőbiztosi direkt jellemzések esetében is szignifikánsan befolyásolta a kérdezőbiztos és a kérdezett nemének és korának különbsége a válaszokat, de az iskolai végzettségek különbsége is jelentősebb megmagyarázott hányaddal rendelkezett. Elmondható, hogy a kérdezőbiztos személye hatással van mind a megkérdezett egyes válaszaira, mind a kérdezőbiztos által önállóan kitöltött kérdésekre, különösen érdekes ez egy ilyen speciális célpopulációnál, mint az ifjúságkutatások során használt 15-29 éves korosztályok. Az adatfelvételi módszerek vizsgálata után elmondhatjuk, hogy az eredmények azért mutatnak különbözőséget módszerenként, mert eltérő a potenciális válaszadói populációjuk. A személyes megkérdezés képes volt mintavételi keretként kezelni az egész populációt (lakóhellyel rendelkező…stb.), a telefonos és az online pedig csak a populáció egy részhalmazát, azaz az adott eszközzel – telefon vagy internet eléréssel – rendelkezőket tekintik mintavételi keretüknek. Kérdés a jövőre vonatkozóan, hogy milyen hangsúlyeltolódás lesz megfigyelhető az online módszerek irányába a telefonos és a személyes lekérdezések számának együttes csökkenésével, valamint kérdéses, hogy milyen mintavételi eljárások, gyakorlatok alakulnak ki az adatfelvételek együttes alkalmazására. A kérdőív vizsgálata során elsőként a kérdőívet, mint szöveget vizsgáltuk a FRE olvasási nehézség mérő pontrendszer segítségével, amely – mint azt tapasztaltuk – nem kezeli a magyar nyelv sajátosságait. Így fordulhatott az elő, hogy az elemzés során találkoztunk olyan kérdésekkel, amelyek esetében a FRE értéke az elfogadási tartományon kívülre esett, így a FRE elemzés eredményeire nem volt érdemes a továbbiakban támaszkodnunk. Ugyanakkor, ha a kérdőív általunk elemzett kérdéseit, mint szöveget hasonlítjuk más szövegekhez, akkor két kutatás adatai alapján a korosztály számára könnyen érthető szövegnek jellemezhetjük.
312
Su-hao Tu – Pei-shan Liao (2004):Socail Distance, Interview Rapport, and Invalid Responses, Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Methodology: Recent Developments and Applications in Social Research (ISA RC33), Amsterdam August, 16-20, 2004
212
Megpróbáltuk a kérdőív és a kérdések hatását egy lineáris regressziós magyarázó modellben vizsgálni, amelyben a kérdések egyes paramétereivel kíséreltük meg magyarázni a hiányzó értékek arányát. A két lépésben kialakult modell a teljes variancia 57,2%-át magyarázza, az eljárás során pedig csak a szenzitív, illetve a faktuális kérdést jelölő dummy változók maradtak a modellben, azaz a kérdés témája bizonyult egyedül szignifikánsan meghatározónak. Az adatfelvétel speciális jellege miatt lehetőség nyílt egyes kérdéssorokon vizsgálni a kérdés kontextusának lehetséges hatását. A lehetséges blokkok megvizsgálása után a kontextus hatást a kérdőívben minden olyan kérdéssoron próbáltuk tetten érni, ahol a legkisebb logikai összefüggés felellhető volt, de összességében a vizsgált kérdéssorok egyikén sem sikerült eltérést kimutatni, azaz nem találtunk kontextus hatásra utaló jeleket. A részleges válaszmegtagadás kapcsán fontos kiemelnünk, hogy nagy ugyan a hasonlóság a teljes és a részleges válaszmegtagadás között ami a demográfiai jellemzőket illeti, azonban különböző pszichológiai hatások hívják életre a két adathiány típust és több információ áll rendelkezésre arról, aki csak a felvétel egy részére nem válaszolt, mint a teljes válaszmegtagadókról. Az item nem válaszolás és a kérdőív témájának összefüggésére hívja fel a figyelmet Mason, Lesser, W. Traugott313. Esetünkben azonban a kérdőív témáját összességében nem lehet egyértelműen meghatározni, mert annyira szerteágazó témákat érintett. Több kérdéscsoportot vontuk így vizsgálat alá, hogy a kérdés típusát és témáját vizsgáljuk. Az eredmények alapján alá tudjuk támasztani a ténykérdések, illetve az attitűdkérdések válaszmegtagadása közötti különbséget314. Az elemzés során azt tapasztaltuk, hogy a részleges válaszmegtagadás függ a kérdés típusától. A legmagasabb nem válaszolási arányt az önkitöltő kérdések esetében tapasztaltuk: azt mondhatjuk, hogy a vizsgált önkitöltő kérdések közel 13%-át kihagyták a kitöltők, az attitűd típusú kérdések esetében tapasztaljuk a második legmagasabb nem válaszolási értékeket. A faktuális kérdések esetében jól látható a részleges nem válaszolás alacsonyabb szintje, amely ugyanakkor eltér az egyes faktuális tartalmak esetében. 313
Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. 314
Robert M. Groves: Survey erorrs and survey costs, John Wiley and Sons, 1989. New York, pp. 469.
213
A válaszmegtagadást nemek szerint vizsgálva a lányok esetében magasabb a nem válaszolás átlaga a szabadidő-kulturális dimenzióban, általában elmondható, hogy a legfiatalabbak – azaz a 15-19 évesek – között a legnagyobb a nem tudom/nem válaszolok kimenetelek aránya. Különösen igaz ez az attitűd jellegű kérdéssorok esetében, ahol közel kétszerese a legfiatalabb korcsoport átlaga a két idősebb korcsoport átlagához viszonyítva. Hasonlóan átütő hatása van a válaszoló településtípusának. Itt az látható, hogy a fővárosban válaszolók jóval magasabb nem válaszoló átlagokat érnek el az összes vizsgált dimenzióban. A magasabb iskolai végzettség illetve a kérdés szenzitív jellege együtt jár a magasabb válaszmegtagadással, ez két ponton ellentmondani látszik a Krosnick315 által megállapított demográfiai profilnak. Egyrészt Krosnick szerint, a magasabb képzettség, a fejlettebb kognitív képességek, valamint a témában való érdekeltség, érintettség is csökkenti a válaszmegtagadás esélyét. Esetünkben azonban az iskolai végzettség inkább növeli a válaszmegtagadás esélyét egyes kérdéssorokon. A kérdés témájában való érintettség hatása egyes válaszadói csoportokban pedig egyértelműen negatív irányba befolyásolja a válaszadási arányt, mert esetükben ez egy szenzitív témának számíthat. A Krosnick316 által megállapított kérdés bonyolultsága és a részleges válaszmegtagadás közötti együtt járást nem sikerült bizonyítanunk a FRE pontszámok segítségével. A válaszmegtagadást nem, kor és településtípus szerint vizsgálva elmondható, hogy a fővárosban élők esetében az önkitöltő kérdőívnél jóval magasabb a nem megválaszolt kérdések átlaga. Különösen érdekes összehasonlítani a megyeszékhelyeken élők által kitöltött kérdőívek nem válaszolási arányaival, akik jóval kisebb arányban tagadták meg a válaszolást (fővárosban 20% feletti, a megyeszékhelyeken 9% körüli átlagosan). Ez a megállapítás igaz a nőkre és a férfiakra is egyaránt. A korosztályok szerint vizsgálva jól látható, hogy a fővároson belül is a legmagasabb válaszmegtagadási átlagokat a 19 évnél fiatalabbak érték el a vizsgált kérdések mentén, megint csak mindkét nem esetében. A jellemző válaszmegtagadó csoportok feltérképezéséhez klaszterelemzést végeztünk. Ezek szerint a válaszolók 33%-a a vizsgált kérdések mindegyikére adott választ, 5%-uk pedig 315
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So 316
Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & So
214
az átlagnál jóval többször élt a válaszmegtagadás lehetőségével. A válaszolók többsége a vizsgált 3 kérdéscsoport valamelyikén gyakrabban tagadott meg válaszokat, a legtöbben a kérdezőbiztosi kontroll nélküli és szenzitív kérdéseket tartalmazó önkitöltő kérdőív blokk esetében
(27%).
Az
attitűd
kérdéssor
esetében
a
válaszolók
24%-a
bizonyult
válaszmegtagadónak, a faktuális kérdések esetében pedig 11%-uk. Az egyes csoportok összetételét, szociológiai és demográfiai jellemzőit multinomiális logisztikus regressziós modellben vizsgáltuk. Összességében azt mondhatjuk, hogy a befejezett iskolai végzettség, a szabadidővel rendelkezés, a közügyekben való aktivitás, a válaszadó neme és az, hogy tanuló-e bizonyultak relevánsnak egy multinomiális logisztikus regressziós modellben. A teljes válaszolókhoz képest biztosan megállapíthatjuk, hogy a válaszmegtagadók csoportjaiban alacsonyabb az iskolai végzettség és a szabadidő rendelkezésre állása.
215
4 Záró megjegyzések Az Ifjúság2008 kutatás módszertani másodelemzése olyan próbálkozásnak fogható fel, amely során megpróbáltuk a már korábbi kutatások eredményeit, eljárásait tesztelni. Fontos hangsúlyozni, hogy sok esetben nem tudtuk reprodukálni az eredményeket vagy csak egészen más jellegű megállapításokat tudtunk tenni az elemzés alapján, de az biztosan kijelenthetjük, hogy a legtöbb torzításra könnyen mutatható fel empirikus bizonyíték. Több szerző is hangoztatta, hogy a nem mintavételi hiba sok esetben felülmúlhatja a mintavételi hiba nagyságát, ráadásul még több olyan torzítási lehetőség is létezik, amelyek nem voltak témái a dolgozatnak, ilyen például a rögzítési, adatfeldolgozási hiba. Láthattuk azt is, hogy a legtöbb esetben illúzió lenne azt gondolni, hogy teljes mértékben ki lehet küszöbölni ezeket a torzítási lehetőségeket. Marad tehát a másik lehetséges taktika: a lehető legnagyobb mértékben figyelembe kell venni a kutatási terv készítésekor a torzítások minimalizálásának lehetőségeit, az egyes nem mintavételi hibák sajátosságait. A kutatási terv kialakítása során tehát fontos, hogy nem egy-egy hibalehetőség minimalizálására kell törekedni, hanem a teljes hiba minimalizálására. Sok esetben nem is lehet általános megoldást javasolni a torzítások kiküszöbölésére, azonban pusztán a torzítás természetének ismerete is hozzásegíthet az elemzés pontosabbá tételéhez. Hosszabb távon pedig ez az első lépés ahhoz, hogy az elemzésbe is beépíthetőek legyen ezek a torzító hatások. Az egyes torzítások csökkentésére több módszer kínálkozik, vannak nagyon jó példák és eljárások, de vannak olyan kutatások is, ahol a hiba csökkentésére alkalmazott eljárást nem lehet általánosítani speciális, problémára szabott jellege miatt. Nem szabad azonban szem elől téveszteni, hogy amellett, hogy ezek az eljárások is magukban hordoznak bizonyos torzítási lehetőségeket, nagy erőforrás-ráfordítást igényelnek. Ez az egyik legfőbb oka – az ismerethiány mellett –, hogy egy átlagos adatfelvétel a gyakorlatban csak a mintavételi hiba okozta torzítással számol, nem tűzi ki célul a nem mintavételi hibák minimalizálását. Másik fontos oka még, hogy sok esetben a konkrét ráfordítások mellett a nem mintavételi hiba okozta torzítás csökkentése korántsem jelenik meg látványosan vagy direkt módon az eredményekben, legtöbbször „csak” az adatminőség javítása lehet a legfontosabb cél. Ahhoz pedig, hogy a nem mintavételi hibákat kellő mélységben vizsgáljuk, speciális kutatási terv és módszertan szükséges, ennek addicionális anyagi és egyéb erőforrás igényeivel együtt.
216
A nem mintavételi hibák elnevezései arra utalnak, hogy a kijelölt elemek nem, vagy csak részlegesen figyelhetők meg, azaz információhiány lép fel, a valószínűségi minta elméleti jó tulajdonságai sérülnek. Ezért azt mondhatjuk, hogy ezek a torzítások a mintavételeken alapuló becslések egyik központi jellegű gyakorlati kérdései. Azt gondolom, hogy a nem mintavételi hibák jelentősége nőni fog, a nem mintavételi hibákról folyó diskurzusok pedig erősödni fognak a közeljövőben. Az biztos azonban, hogy az elemzések és a publikált tapasztalatok Magyarországon erősen hiányosak, de nemzetközi szinten sem kezelik a mintavételi hibákhoz hasonló egységes protokollok szerint. Reméljük jelen dolgozat támpontot nyújtott a nem mintavételi hibák többféle és igen összetett jelenségének megismeréséhez, így optimistán azt gondoljuk, hogy pontosabb, a valóságot jobban becslő felméréseket készülhetnek ezen jellemzők ismeretében.
217
5 Függelék 5.1 Teljes nem válaszolás - nehezen elérhetők demográfiai különbségei 64. táblázat
A felkeresések száma a sportolás végzése szerint
sportolási aktivitás
1
2
3 vagy több
összesen
igen, végez testmozgást, sportol
76,1%
15,8%
8,1%
100,0%
nem, nem végez testmozgást, nem sportol átlagosan
82,9%
12,0%
5,2%
100,0%
80,3%
13,4%
6,3%
100,0%
65. táblázat
A felkeresések száma a kérdezett neme szerint
településtípus
1
2
3 vagy több
összesen
fiú
80,1%
12,9%
6,9%
100,0%
lány átlagosan
80,7%
13,7%
5,6%
100,0%
80,4%
13,3%
6,3%
100,0%
66. táblázat
A felkeresések száma gazdasági aktivitás szerint
gazdasági aktivitás
1
2
3 vagy több
összesen
tanul
79,0%
14,6%
6,4%
100,0%
dolgozik
81,6%
11,9%
6,5%
100,0%
tanul és dolgozik
78,8%
12,7%
8,5%
100,0%
egyéb átlagosan
81,4%
13,9%
4,7%
100,0%
80,4%
13,3%
6,3%
100,0%
67. táblázat
A felkeresések száma a háztartás mérete szerint
háztartás mérete (fő)
1
2
3 vagy több
összesen
1,00
87,0%
9,6%
3,3%
100,0%
2,00
79,8%
12,8%
7,3%
100,0%
3,00
80,6%
13,1%
6,4%
100,0%
4,00
81,7%
12,4%
5,9%
100,0%
5,00
77,5%
16,0%
6,5%
100,0%
6+ átlagosan
78,4%
15,0%
6,5%
100,0%
80,4%
13,3%
6,3%
100,0%
218
5.2 Az Ifjúság2008 kutatás témái és almintái 5.2.1 A kérdőív témái 1. Társadalmi mobilitás
a család kulturális tőkéje, szülők iskolai végzettsége, foglakozása
2. Iskolázottság
iskolai végzettség, jelenlegi iskolai helyzet, továbbtanulási tervek;
3. Egzisztenciális helyzet
tartós fogyasztási ászkozok, jövedelem, gazdálkodás
4. Családi helyzet
együttélés típusai, párkapcsolatok, elköltözés
5. Munkaerő-piaci jellemzők
első munkába állás, jelenlegi es korábbi munkahelyek, munkavállalási tervek
6. Társadalmi közérzet, közéleti attitűdök
társadalmi problémák, intézmények megítélése, politikához való viszony es attitűdök,
7. szervezeti aktivitás; a szülői értékrendhez való viszony 8. Helyi közélet és helyi politika
helyi közélet iránti érdeklődés, részvétel a helyi politikában
9. Ifjúsági szolgálatok
ifjúsági referens, ifjúsági irodák, ifjúsági szervezetek
10. Vallásosság
vállasosság, felekezeti hovatartozás
11. Kulturális fogyasztás 219
szabadidő, médiafogyasztás, kulturálódási, művelődési szokások
12. Egészség, életmód, szexualitás
egészségi állapot, életmód jellemzői, szexuális szokások, fogamzásgátlás , dohányzás, alkohol-es drogfogyasztás
13. Sporthoz való viszony
sportolási szokások, sportágak elismertsége, nézettsége
14. Informatikai ismeretek
informatikai ismeretek, számítógép-használati szokások
5.2.2 Az egyes almintákon kérdezett témák A 2000-2000-es mintákon vizsgált kérdéscsoportok a következők voltak:
gyermekneveléssel, gyermekvállalással kapcsolatos attitűdök;
állampolgári tudat, a demokratikus intézményrendszerbe vetett bizalom;
a tanulással, illetve a hasznosítható tudással kapcsolatos attitűdök;
infokommunikációs eszközökkel való ellátottság;
médiafogyasztás;
az információs társadalomra vonatkozó kérdések.
A 4000-es almintákon vizsgált kérdéscsoportban
a kulturális fogyasztással, szabadidős tevékenységgel kapcsolatos kérdések szerepeltek.
A 8000 főnek átadott önkitöltős kérdőíven szereplő kérdéskörök:
droghasználat;
szexuális szokások; 220
alkohol ás dohányzás;
pártpreferencia;
tiltakozásokon való részvétel.
221
5.3 Mérési hibák 5.3.1 Kérdezőbiztosi hatások 5.3.1.1 Felhasznált kérdések k37. Mennyire elégedett Ön a következő dolgokkal? Teljesen elégedett, inkább elégedett, is-is, inkább elégedetlen vagy egyáltalán nem elégedett? 1 – teljesen elégedett; 2 – inkább elégedett; 3 – is-is; 4 – inkább elégedetlen; 5 – teljesen elégedetlen 0 – nt. X – nv. 1. partnerkapcsolataival? 2. baráti kapcsolataival? 3. munkavállalási lehetőségeivel? 4. jelenlegi életszínvonalával? 5. anyagi helyzetével 6. tanulás lehetőségeivel? 7. azzal az ismeretmennyiséggel, amit idáig megszerzett 8. személyes élettervei megvalósításának esélyeivel 9. jövőbeli kilátásaival? 10. Mindent egybevetve azzal, ahogyan most él?
5.3.1.2 Kérdezőbiztosi válaszok részleges nem válaszolása 5.3.1.2.1 Válaszadó jellemzése q7.1 jellemezd a válaszadót: tájékozott-e a politikában? q7.2 jellemezd a válaszadót: milyen gyorsan értette meg a kérdéseket? q7.3 jellemezd a válaszadót: mennyire művelt? q7.4 jellemezd a válaszadót: mennyire válaszolt könnyen? q7.5 jellemezd a válaszadót: mennyire volt együttműködő? q8 Kellett-e segíteni a válaszadónak az önkitöltő kérdőív kitöltése során? 5.3.1.2.2 Válaszadás körülményei q6.1 a válaszadás körülményei: egyedül válaszolt q6.2 a válaszadás körülményei: a szülei, nevelőszülei is hallották a válaszokat q6.3 a válaszadás körülményei: a házastárs, élettárs is hallotta a válaszokat q6.4 a válaszadás körülményei: más személy is halotta a válaszokat, éspedig (van-e)
222
q6.5 a válaszadás körülményei: más személy is beleszólt a válaszokba, éspedig (van-e) 5.3.1.2.3 Ház és környék jellemzése q1 kérdezőhöz: Milyen jellegű épületben van a lakás? q2 A ház helye a településen belül: q3.1 láttál-e aládúcolást az épületen kívül, vagy belül? q3.2 láttál-e jelentősebb vakolatomlást az épületen belül? q3.3 láttál-e jelentősebb vakolatomlást az épületen kívül? q3.4 láttál-e liftet? 5.3.1.2.4 Lakás jellemzése q4.1 jellemezd a lakást! - sötét/világos q4.2 jellemezd a lakást! - elhanyagolt/ápolt q4.3 jellemezd a lakást! - szűk/tágas q4.4 jellemezd a lakást! - új/régi építésű
223
5.3.1.3 Elégedettség kérdéssor vizsgálata – SPSS output Cell Means(b) Menyire elégedett Ön anyagi helyzetével befisk_v ,00
Mean 2,74
N 1868
1,00
3,02
1576
2,00
2,94
2109
3,00
3,30
591
4,00
3,74
279
Total
2,97(a)
6423
a Grand Mean b Mennyire elégedett Ön anyagi helyzetével by befisk_v ANOVA(a)
Sum of Squares Menyire elégedett Ön anyagi helyzetével
Main Effects
Hierarchical Method Mean Square F
df
Sig.
befisk_v 339,496
Model
4
84,874
71,107
,000
71,107
,000
339,496
4
84,874
Residual
7660,573
6418
1,194
Total
8000,069
6422
1,246
a Menyire elégedett Ön anyagi helyzetével by befisk_v MCA(a)
N
Predicted Mean
Deviation Adjusted for Unadjusted Factors
Unadjust ed
Adjusted for Factors
1868
2,74
2,74
1,00
1576
3,02
3,02
,053
,053
2,00
2109
2,94
2,94
-,031
-,031
3,00
591
3,30
3,30
,334
,334
279 3,74 a Menyire elégedett Ön anyagi helyzetével by befisk_v
3,74
,775
,775
Menyire elégedett Ön anyagi helyzetével
befisk_v
,00
4,00
-,231
Factor Summary(a)
Eta
Beta Adjusted for Factors
Menyire elégedett Ön anyagi befisk_v helyzetével a Menyire elégedett Ön anyagi helyzetével by befisk_v
224
,206
,206
-,231
Model Goodness of Fit R Menyire elégedett Ön anyagi helyzetével by befisk_v
R Squared ,206
,042
********************************************************************************************** Cell Means(b) Menyire elégedett Ön anyagi helyzetével befisk_anya ,00
Mean
N
2,74
1374
1,00
2,87
1732
2,00
2,98
2042
3,00
3,11
888
4,00
3,49
570
Total
2,96(a)
6606
a Grand Mean b Menyire elégedett Ön anyagi helyzetével by befisk_anya ANOVA(a)
Hierarchical Method Mean df Square
Sum of Squares Menyire elégedett Ön anyagi helyzetével
Main Effects
F
Sig.
befisk_anya 264,920
Model
4
66,230
54,822
,000
54,822
,000
264,920
4
66,230
7974,543
6601
1,208
8239,463 a Menyire elégedett Ön anyagi helyzetével by befisk_anya
6605
1,247
Residual Total
MCA(a)
N
Menyire elégedett Ön anyagi helyzetével
befisk_any a
Predicted Mean
Deviation Adjusted Unadjust for ed Factors
Unadjus ted
Adjusted for Factors
1374
2,74
2,74
-,225
-,225
1,00
1732
2,87
2,87
-,095
-,095
2,00
2042
2,98
2,98
,019
,019
3,00
888
3,11
3,11
,148
,148
4,00
570
3,49
3,49
,529
,529
,00
a Menyire elégedett Ön anyagi helyzetével by befisk_anya
225
Factor Summary(a) Beta Adjusted for Factors
Eta
Menyire elégedett Ön anyagi helyzetével
befisk_anya
,179
,179
a Menyire elégedett Ön anyagi helyzetével by befisk_anya Model Goodness of Fit R Menyire elégedett Ön anyagi helyzetével by befisk_anya
R Squared ,179
,032
5.3.1.3.1 Kérdezőbiztos a válaszadóról 5.3.1.3.1.1 Iskolai végzettségek különbsége Cell Means(b)
A kérdezett és a kérdező iskolai végzettségének különbsége kérdező magasabb befisk
jellemezd a válaszadót: mennyire művelt? Mean 4,51
N 272
-3,00
3,36
554
-2,00
3,00
1506
-1,00
2,79
1198
,00
2,29
1891
1,00
2,20
383
2,00
1,91
622
3,00
1,41
41
2,29
7
2,69(a)
6474
kérdezett magasabb befisk Total
a Grand Mean b jellemezd a válaszadót: mennyire művelt? by A kérdezett és a kérdező iskolai végzettségének különbsége
226
Cell Means(b) jellemezd a válaszadót: mennyire művelt? befisk_v ,00
Mean 2,29
N 1891
1,00
2,65
1581
2,00
2,68
2128
3,00
3,23
595
4,00
4,46
279
Total
2,69(a) 6474 a Grand Mean b jellemezd a válaszadót: mennyire művelt? by befisk_v
5.3.1.3.1.2 Anya befejezett iskolai végzettsége Cell Means(b) jellemezd a válaszadót: mennyire művelt? befisk_anya ,00
Mean 2,19
N 1390
1,00
2,45
1743
2,00
2,83
2067
3,00
2,87
894
4,00
3,65
571
Total
2,67(a) 6665 a Grand Mean b jellemezd a válaszadót: mennyire művelt? by befisk_anya ANOVA(a)
Sum of Squares jellemezd a válaszadót: mennyire művelt?
Main Effects
Sig.
4
259,436
128,909
,000
128,909
,000
1037,746
4
259,436
13403,630
6660
2,013
14441,375 a jellemezd a válaszadót: mennyire művelt? by befisk_anya
6664
2,167
Residual
F
befisk_anya 1037,746
Model
Hierarchical Method Mean df Square
Total
227
MCA(a)
N
Unadjusted jellemezd a válaszadót: mennyire művelt?
befisk_anya
Predicted Mean Adjusted for Factors Unadjusted
,00 1390
2,19
2,19
-,479
-,479
1,00
1743
2,45
2,45
-,223
-,223
2,00
2067
2,83
2,83
,155
,155
3,00
894
2,87
2,87
,195
,195
4,00
571
3,65
3,65
,980
,980
a jellemezd a válaszadót: mennyire művelt? by befisk_anya Factor Summary(a)
jellemezd a válaszadót: mennyire művelt?
befisk_anya
Eta Adjusted for Factors
Beta Adjusted for Factors
,268
,268
a jellemezd a válaszadót: mennyire művelt? by befisk_anya Model Goodness of Fit R jellemezd a válaszadót: mennyire művelt? by befisk_anya
R Squared ,268
,072
5.3.1.3.1.3 Apa befejezett iskolai végzettsége Cell Means(b) jellemezd a válaszadót: mennyire művelt? befisk_apa ,00
Deviation Adjuste d for Unadjus Factors ted
Mean 2,19
N 1113
1,00
2,55
2066
2,00
2,73
1692
3,00
2,79
1240
4,00
3,92
376
Total
2,66(a) 6487 a Grand Mean b jellemezd a válaszadót: mennyire művelt? by befisk_apa
228
ANOVA(a)
Hierarchical Method Mean df Square F
Sum of Squares jellemezd a válaszadót: mennyire művelt?
Main Effects
Sig.
befisk_apa 902,727
4
225,682
112,316
,000
902,727
4
225,682
112,316
,000
13024,522
6482
2,009
13927,248 a jellemezd a válaszadót: mennyire művelt? by befisk_apa
6486
2,147
Model Residual Total
MCA(a)
N
Predicted Mean Adjusted for Factors
Unadjusted jellemezd a válaszadót: mennyire művelt?
befisk_apa
Unadjust ed
,00 1113
2,19
2,19
-,473
-,473
1,00
2066
2,55
2,55
-,110
-,110
2,00
1692
2,73
2,73
,069
,069
3,00
1240
2,79
2,79
,132
,132
4,00
376
3,92
3,92
1,262
1,262
a jellemezd a válaszadót: mennyire művelt? by befisk_apa Factor Summary(a)
jellemezd a válaszadót: mennyire művelt?
Eta Adjusted for Factors
Beta Adjusted for Factors
,255
,255
befisk_apa
a jellemezd a válaszadót: mennyire művelt? by befisk_apa Model Goodness of Fit R jellemezd a válaszadót: mennyire művelt? by befisk_apa
R Squared ,255
,065
5.3.1.3.1.4 Apa és anya legmagasabb befejezett iskolai végzettsége
Case Processing Summary(a) Cases Included N 6426
Excluded
Percent 93,8%
Deviation Adjusted for Factors Unadjusted
N
Total
Percent 423
N
6,2%
6849
229
Percent 100,0%
a jellemezd a válaszadót: mennyire művelt? by befisk_apa, befisk_anya Cell Means(b) jellemezd a válaszadót: mennyire művelt? befisk_apa ,00
1,00
2,00
3,00
4,00
Total
befisk_anya ,00
Mean
N
2,14
656
1,00
2,30
244
2,00
2,20
181
3,00
2,52
21
4,00
1,75
4
Total
2,19
1106
,00
2,32
425
1,00
2,46
1104
2,00
2,95
491
3,00
2,44
25
4,00
2,67
9
Total
2,55
2054
,00
2,03
189
1,00
2,40
270
2,00
2,97
1013
3,00
2,60
169
4,00
2,91
32
Total
2,73
1673
,00
2,28
69
1,00
2,54
63
2,00
2,40
282
3,00
2,91
599
4,00
3,19
209
Total
2,78
1222
,00
3,50
4
1,00
3,00
7
2,00
2,91
23
3,00
3,34
47
4,00
4,14
290
Total
3,94
371
,00
2,19
1343
1,00
2,44
1688
2,00
2,81
1990
3,00
2,85
861
4,00
3,66
544
Total
2,66(a)
6426
a Grand Mean b jellemezd a válaszadót: mennyire művelt? by befisk_apa, befisk_anya
230
ANOVA(a)
Sum of Squares jellemezd a válaszadót: mennyire művelt?
Main Effects
Hierarchical Method Mean df Square
F
Sig.
(Combined)
2-Way Interactions
1200,811
8
150,101
77,071
,000
befisk_apa
900,815
4
225,204
115,633
,000
befisk_anya
299,996
4
74,999
38,509
,000
befisk_apa * befisk_anya
167,524
16
10,470
5,376
,000
1368,336
24
57,014
29,274
,000
12466,428
6401
1,948
6425
2,153
Model Residual Total
13834,763 a jellemezd a válaszadót: mennyire művelt? by befisk_apa, befisk_anya MCA(a)
N Unadjuste d jellemezd a válaszadót: mennyire művelt?
befisk_apa
Predicted Mean Adjusted Unadjus for Factors ted
,00
befisk_anya
1106
2,19
2,42
-,472
-,241
1,00
2054
2,55
2,70
-,109
,040
2,00
1673
2,73
2,68
,072
,017
3,00
1222
2,78
2,56
,124
-,098
4,00
371
3,94
3,41
1,275
,745
,00
1343
2,19
2,30
-,469
-,364
1,00
1688
2,44
2,44
-,225
-,218
2,00
1990
2,81
2,82
,152
,161
3,00
861
2,85
2,88
,190
,218
3,66
3,30
,999
,640
4,00
544 a jellemezd a válaszadót: mennyire művelt? by befisk_apa, befisk_anya Factor Summary(a)
jellemezd a válaszadót: mennyire művelt?
befisk_apa befisk_anya
Eta Adjusted for Factors ,255
Beta Adjusted for Factors ,144
,269
,204
a jellemezd a válaszadót: mennyire művelt? by befisk_apa, befisk_anya Model Goodness of Fit R jellemezd a válaszadót: mennyire művelt? by befisk_apa, befisk_anya
Deviation Adjusted Unadjus for Factors ted
R Squared ,295
,087
231
5.3.1.4 A kérdezőbiztosi szórás változó-készlete Első készlet:
Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az ország gazdasági helyzete: javult, nem változott vagy romlott?
Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az emberek életszínvonala: javult, nem változott vagy romlott?
És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az ország gazdasági helyzete: javul, nem változik vagy romlik?
És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az emberek életszínvonala: javul, nem változik vagy romlik?
Második készlet:
Ön szerint mennyire érdekli a helyi politikusokat /az önkormányzati képviselőket, a polgármestert/ a fiatalok véleménye? /Itt, ezen a településen./
Ön szerint mennyire érdekli az országos politikusokat a fiatalok véleménye?
Ön szerint mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe?
És mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe? /Ezen a településen./
5.3.2 A kérdőív vizsgálata 5.3.2.1 Politikai és közéleti kérdéssor A jelű kérdőívben szerepelt:
a1. Kérem, jellemezze Önmagát a LAPON látható tulajdonság-párok segítségével! o liberális / konzervatív o baloldali / jobboldali 232
o mérsékelt / radikális o hagyománykövető / modern Közös kérdések:
k20. Az ember különbözőképpen ítélheti meg azt, amilyen elvek szerint szülei élnek. Megfelel-e az Ön eszményeinek szülei élete?
k21. Politikai kérdésekben egyetért-e Ön szüleivel?
k22. Kapcsolódik-e Ön valamilyen módon a LAPON látható szervezetekhez?
k27. Ön szerint mennyire érdekli a helyi politikusokat (az önkormányzati képviselőket, a polgármestert) a fiatalok véleménye? (Itt, ezen a településen.)
k28. És Ön szerint mennyire érdekli az országos politikusokat a fiatalok véleménye?
k29. Ön szerint mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe?
k30. És mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe? (Ezen a településen.)
5.3.2.2 Tanfolyam és idegennyelv tudás B jelű kérdőívben szerepelt:
b1. Milyen különórákra, magántanárhoz, szakkörre járt Ön általános iskolai, illetve középiskolai tanulmányai során a korrepetálásokat nem számítva? (ADDITÍV!)
Közös kérdések:
k84. Szeretne-e továbbtanulni, tanfolyamot végezni, tanulni még valamit?
b2. Mit szeretne még tanulni? Kérem, sorolja fel az összes olyan iskolát, tanfolyamot, amit a jövőben el szeretne még végezni!
233
k85. Beszél Ön idegen nyelvet?
5.3.2.3 Sportolás részletes kérdezése D jelű kérdőívben szerepelt:
Miért sportol ön rendszeresen? - Edzett legyek
Miért sportol ön rendszeresen? - Egészséges legyek
Miért sportol ön rendszeresen? - Fogyni szeretnék
Miért sportol ön rendszeresen? - Jó legyen a közérzetem
Miért sportol ön rendszeresen? - A jó társaság kedvéért
Miért sportol ön rendszeresen? - Szüleim javaslatára
Miért sportol ön rendszeresen? - Jól nézzek ki
Miért sportol ön rendszeresen? - Hogy jól nézzek ki
Miért sportol ön rendszeresen? - Örömet okoz
Miért sportol ön rendszeresen? - egyéb, éspedig: (van-e)
Miért sportol ön rendszeresen? - egyéb, éspedig: (szöv.)
Közös kérdések:
Összesen hány napot üdült 2007-ben külföldön?
Összesen hány napot üdült 2007-ben belföldön?
Milyen gyakran fogyasztja: kávé
Milyen gyakran fogyasztja: kóla
Milyen gyakran fogyasztja: tea
Milyen gyakran fogyasztja: más szénsavas üdítők
234
Milyen gyakran fogyasztja: ásványvíz /szénsavas vagy szénsavmentes/
Milyen gyakran fogyasztja: energiaital
Milyen gyakran fogyasztja: sör
Milyen gyakran fogyasztja: bor
Milyen gyakran fogyasztja: égetett szeszesital
Milyen gyakran fogyasztja: csokoládé
Milyen gyakran fogyasztja: tej
235
mondatok száma
o17
Volt-e már Ön szerelmes?
20
5
28
4,00
1,40
84,34
11%
o18
És viszont szerették?
19
5
27
3,80
1,42
82,76
12%
83
13
132
6,38
1,59
65,81
12%
39
4
61
9,75
1,56
64,62
4%
44
4
69
11,00
1,57
63,00
7%
kérdés száma
kérdés szövege (kivonat)
szótagok száma
szavak száma
5.3.2.4 FRE értékek az egyes kérdések esetében 68. táblázat FRE értékek és item nem válaszolás a vizsgált kérdések esetében
ASL
ASW
FRE
nt/nv arány (%)
k33
Kipróbálta-e, használta-e Ön a következő szereket? Hány éves volt, amikor kipróbálta? Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az ország gazdasági helyzete: javult, nem változott vagy romlott? És... És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az ország gazdasági helyzete: javul, nem változik vagy romlik? És... Szokott-e Ön a helyi közügyekben tájékozódni?
11
2
18
5,50
1,64
62,82
1%
k149
Összesen hány napot üdült 2007-ben külföldön?
7
1
12
7,00
1,71
54,70
3%
k150.
Összesen hány napot üdült 2007-ben belföldön?
o2 k17
k18
7
1
12
7,00
1,71
54,70
2%
k85
Beszél Ön idegen nyelvet?
6
2
11
3,00
1,83
48,69
0%
k99
Eddigi élete során végzett-e olyan munkát, amiért pénzt kapott?
13
2
24
6,50
1,85
44,05
1%
44
12
86
3,67
1,95
37,76
2%
29
4
56
7,25
1,93
36,11
28%
6
2
12
3,00
2,00
34,59
0%
32
7
64
4,57
2,00
33,00
11%
30
5
62
6,00
2,07
25,91
15%
38
7
80
5,43
2,11
23,22
11%
8
2
17
4,00
2,13
23,00
1%
24
2
49
12,00
2,04
21,93
8%
60
13
135
4,62
2,25
11,80
2%
31
3
68
10,33
2,19
10,77
8%
32
3
71
10,67
2,22
8,30
10%
29
2
64
14,50
2,21
5,41
7%
612
101
1158
6,06
1,89
40,61
1,89%
k151 o1 k152 o5 o36 o6. k158 k28 k166 k30 k27 k29
Milyen gyakran fogyasztja Ön a következő termékeket: naponta, hetente többször, hetente, havonta többször, havonta, ritkábban vagy soha? A barátai, ismerősei között van-e olyan, aki használt már valamilyen kábítószert? Használ-e Ön számítógépet? Körülbelül milyen gyakran fogyasztott Ön alkoholt az elmúlt évben? Ha most vasárnap parlamenti választást tartanának (és jogosult volna szavazni), Ön: Az elmúlt évben előfordult-e Önnel, hogy többet ivott a kelleténél, és emiatt erősen ittas állapotba került? Van Önnek saját használatú mobiltelefonja? És Ön szerint mennyire érdekli az országos politikusokat a fiatalok véleménye? Milyen gyakran jár Ön a következő helyekre: hetente többször, hetente, havonta többször, havonta, félévente, évente többször, évente, ritkábban vagy szinte soha És mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe? (Ezen a településen.) Ön szerint mennyire érdekli a helyi politikusokat (az önkormányzati képviselőket, a polgármestert) a fiatalok véleménye? (Itt, ezen a településen.) Ön szerint mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe? Összesen átlagosan
236
mondatok száma
szótagok száma
Interpretálhatatlan FRE pontértéket kapó kérdések
szavak száma
69. táblázat
k37
Mennyire elégedett Ön a következő dolgokkal?
56
12
167
-50,19
o19
Hogyan jellemezné Önmagát?
11
5
39
-95,34
k160
Meg tudná-e mondani, hogy mennyi szabadideje marad egy 20 átlagos napon a munka, tanulás, háztartási és ház körüli munkák elvégzése után? És mennyi szabadideje marad a hétvégeken, amelyet 13 tetszése szerint pihenéssel vagy szórakozással tölthet? Van-e olyan baráti köre, társasága, amellyel gyakran van 12 együtt szabadidejében?
1
48
-16,51
1
35
-34,13
1
30
-16,85
kérdés száma
k161 k167
kérdés szövege (kivonat)
237
FRE
5.3.2.5 Az egyes kérdések jellemzői 70. táblázat
Az egyes kérdések jellemzői a magyarázó modellben 1. szavak száma
mondatok száma
szótagok száma
ASL
ASW
nt/nv arány (%)
kérdés helye
kérdés hossza
Összesen hány napot üdült 2007-ben külföldön?
6
1
15
6,00
2,50
2,77
216
45
0
1
0
Összesen hány napot üdült 2007-ben belföldön? Milyen gyakran fogyasztja Ön a következő termékeket: naponta, hetente többször, hetente, havonta többször, havonta, ritkábban vagy soha? Használ-e Ön számítógépet?
6
1
15
6,00
2,50
2,41
217
45
0
1
0
17
1
42
17,00
2,47
0,83
218
136
0
1
0
3
1
9
3,00
3,00
0,23
219
26
0
1
0
5
1
15
5,00
3,00
0,59
225
42
0
1
0
20
1
46
20,00
2,30
11,42
233
134
0
1
0
13
1
35
13,00
2,69
8,47
234
105
0
1
0
21
1
50
21,00
2,38
0,50
241
160
0
1
0
10
1
27
10,00
2,70
0,51
242
79
0
1
0
20
1
43
20,00
2,15
3,42
21
143
0
0
1
25
1
48
25,00
1,92
5,57
22
154
0
0
1
kérdés szövege
Van Önnek saját használatú mobiltelefonja? Meg tudná-e mondani, hogy mennyi szabadideje marad egy átlagos napon a munka, tanulás, háztartási és ház körüli munkák elvégzése után? És mennyi szabadideje marad a hétvégeken, amelyet tetszése szerint pihenéssel vagy szórakozással tölthet? Milyen gyakran jár Ön a következő helyekre: hetente többször, hetente, havonta többször, havonta, félévente, évente többször, évente, ritkábban vagy szinte soha Van-e olyan baráti köre, társasága, amellyel gyakran van együtt szabadidejében? Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az ország gazdasági helyzete: javult, nem változott vagy romlott? És... És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az ország gazdasági helyzete: javul, nem változik vagy romlik? És...
szen- faktu zitív -ális
attitűd
71. táblázat
Az egyes kérdések jellemzői a magyarázó modellben 2. szavak száma
mondatok száma
szótagok száma
ASL
ASW
nt/nv arány (%)
kérdés helye
kérdés hossza
19
2
51
9,50
2,68
10,24
39
147
0
0
1
11
1
29
11,00
2,64
8,35
40
78
0
0
1
11
1
29
11,00
2,64
6,53
41
82
0
0
1
13
2
34
6,50
2,62
8,23
42
91
0
0
1
6
1
16
6,00
2,67
1,97
45
46
0
1
0
Mennyire elégedett Ön a következő dolgokkal?
6
1
16
6,00
2,67
12,38
49
44
0
0
1
Beszél Ön idegen nyelvet?
4
1
8
4,00
2,00
0,40
107
26
0
1
0
Eddigi élete során végzett-e olyan munkát, amiért pénzt kapott? A barátai, ismerősei között van-e olyan, aki használt már valamilyen kábítószert? Volt-e már Ön szerelmes?
9
1
21
9,00
2,33
0,85
160
63
0
1
0
11
1
27
11,00
2,45
27,59
121
81
1
0
0
4
1
7
4,00
1,75
11,12
138
24
1
0
0
És viszont szerették?
3
1
6
3,00
2,00
12,41
139
21
1
0
0
Hogyan jellemezné Önmagát? Kipróbálta-e, használta-e Ön a következő szereket? Hány éves volt, amikor kipróbálta? Ha most vasárnap parlamenti választást tartanának (és jogosult volna szavazni), Ön: Körülbelül milyen gyakran fogyasztott Ön alkoholt az elmúlt évben?
3
1
9
3,00
3,00
15,55
140
26
1
0
0
11
2
29
5,50
2,64
11,13
122
85
1
0
0
11
1
26
11,00
2,36
15,19
157
83
1
0
0
9
1
20
9,00
2,22
10,49
125
66
1
0
0
16
1
37
16,00
2,31
10,48
126
108
1
0
0
kérdés szövege Ön szerint mennyire érdekli a helyi politikusokat (az önkormányzati képviselőket, a polgármestert) a fiatalok véleménye? (Itt, ezen a településen.) És Ön szerint mennyire érdekli az országos politikusokat a fiatalok véleménye? Ön szerint mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe? És mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe? (Ezen a településen.) Szokott-e Ön a helyi közügyekben tájékozódni?
Az elmúlt évben előfordult-e Önnel, hogy többet ivott a kelleténél, és emiatt erősen ittas állapotba került?
239
szen- faktu zitív -ális
attitűd
5.3.3 Item nem válaszolás – változó szettek kialakítása 5.3.3.1 Faktuális kérdések 5.3.3.1.1 Státusszal összefüggő kérdések k85 Beszél Ön idegen nyelvet? k99 Eddigi élete során végzett-e olyan munkát, amiért pénzt kapott? k149 Összesen hány napot üdült 2007-ben külföldön? k150 Összesen hány napot üdült 2007-ben belföldön? k152 Használ-e Ön számítógépet? k158 Van Önnek saját használatú mobiltelefonja? 5.3.3.1.2 Fogyasztási gyakoriságot mérő index: k151.1 Milyen gyakran fogyasztja: kávé k151.2 Milyen gyakran fogyasztja: kóla k151.3 Milyen gyakran fogyasztja: tea k151.4 Milyen gyakran fogyasztja: más szénsavas üdítők k151.5 Milyen gyakran fogyasztja: ásványvíz /szénsavas vagy szénsavmentes/ k151.6 Milyen gyakran fogyasztja: energiaital k151.7 Milyen gyakran fogyasztja: sör k151.8 Milyen gyakran fogyasztja: bor k151.9 Milyen gyakran fogyasztja: égetett szeszesital k151.10 Milyen gyakran fogyasztja: csokoládé k151.11 Milyen gyakran fogyasztja: tej 5.3.3.1.3 Szabadidő és kulturális intézmények látogatása
k160 mennyi szabadideje marad egy átlagos napon a munka, tanulás, háztartási és ház körüli munkák elvégzése után? /órában/ k161 És mennyi szabadideje marad a hétvégeken, amelyet tetszése szerint pihenéssel vagy szórakozással tölthet? /órában/ k167 Van-e olyan baráti köre, társasága, amellyel gyakran van együtt szabadidejében? k166.1 Milyen gyakran jár színházba k166.2 Milyen gyakran jár art moziba, néz művészfilmeket moziban? k166.3 Milyen gyakran jár más moziba vagy multiplexbe? k166.4 Milyen gyakran jár könyvtárba? k166.5 Milyen gyakran jár komolyzenei hangversenyre? k166.6 Milyen gyakran jár könyvesboltba? k166.7 Milyen gyakran jár kiállításra, múzeumba? k166.8 Milyen gyakran jár videó-, dvd-kölcsönzőbe? k166.9 Milyen gyakran jár operába? k166.10 Milyen gyakran jár kávéházba, teázóba, presszóba? k166.11 Milyen gyakran jár sörözőbe, borozóba, kocsmába? k166.12 Milyen gyakran jár étterembe? 5.3.3.2 Önkitöltő kérdések o1 A barátai, ismerősei között van-e olyan, aki használt már valamilyen kábítószert? o2.1.1 előfordult életében, hogy használta már: altató, nyugtató nem gyógyászati célból? o2.1.2 előfordult életében, hogy használta már: marihuána, hasis /fű, spangli/?
241
o2.1.3 előfordult életében, hogy használta már: LSD, gomba, meszkalin, más halucinogének? o2.1.4 előfordult életében, hogy használta már: anfetamin, metanfetamin /party drogok, extazi, stb./? o2.1.5 előfordult életében, hogy használta már: kokain? o2.1.6 előfordult életében, hogy használta már: máktea? o2.1.7 előfordult életében, hogy használta már: morfium, heroin? o2.1.8 előfordult életében, hogy használta már: szerves oldószer /szipuzás/? o5 Körülbelül milyen gyakran fogyasztott Ön alkoholt az elmúlt évben? o6 Az elmúlt évben előfordult-e Önnel, hogy többet ivott a kelleténél, és emiatt erősen ittas állapotba került? o10 Szokott-e Ön akárcsak alkalmanként dohányozni? o17 Volt-e már Ön szerelmes? o18 És viszont szerették? o19 Hogyan jellemezné Önmagát? /szexuális irányultság/ o36 Ha most vasárnap parlamenti választást tartanának /és jogosult volna szavazni/, Ön elmenne-e szavazni? 5.3.3.3 Attitűd kérdések 5.3.3.3.1 Politikai kérdések k17.1 Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az ország gazdasági helyzete: javult, nem változott vagy romlott? k17.2 Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az emberek életszínvonala: javult, nem változott vagy romlott?
242
k18.1 És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az ország gazdasági helyzete: javul, nem változik vagy romlik? k18.2 És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az emberek életszínvonala: javul, nem változik vagy romlik? k27 Ön szerint mennyire érdekli a helyi politikusokat /az önkormányzati képviselőket, a polgármestert/ a fiatalok véleménye? /Itt, ezen a településen./ k28 És Ön szerint mennyire érdekli az országos politikusokat a fiatalok véleménye? k29 Ön szerint mennyi lehetőségük van a fiataloknak beleszólni az országos közügyekbe? k30 És mennyi lehetősége van a fiataloknak beleszólni a helyi közügyekbe? /Ezen a településen./ k33 Szokott-e Ön a helyi közügyekben tájékozódni? 5.3.3.3.2 Saját élet, élethelyzet k37.1 Menyire elégedett Ön partnerkapcsolataival? k37.2 Menyire elégedett Ön baráti kapcsolataival? k37.3 Menyire elégedett Ön munkavállalási lehetőségeivel? k37.4 Menyire elégedett Ön jelenlegi életszínvonalával? k37.5 Menyire elégedett Ön anyagi helyzetével k37.6 Menyire elégedett Ön tanulás lehetőségeivel? k37.7 Menyire elégedett Ön azzal az ismeretmennyiséggel, amit idáig megszerzett k37.8 Menyire elégedett Ön személyes élettervei megvalósításának esélyeivel k37.9 Menyire elégedett Ön jövőbeli kilátásaival? k37.10 Menyire elégedett Ön Mindent egybevetve azzal, ahogyan most él?
243
k17.3 Mindent egybevetve, véleménye szerint az elmúlt 10 évben hogyan alakult az Ön családjának anyagi helyzete: javult, nem változott vagy romlott? k18.3 És ha a jövőre gondol, mit tart valószínűnek a következő 10 évben hogyan fog alakulni az Ön családjának anyagi helyzete: javul, nem változik vagy romlik?
244
5.4 Hiányzó értékeke – nem, településtípus, korkategória szerint 72. táblázat
Hiányzó értékek aránya az egyes kérdéscsoportban nem, településtípus és korcsoport szerint kihagyott kérdések aránya (%)
nem település típus fiú főváros
megyei jogú város
város
község
Total
lány
főváros
megyei jogú város
város
község
Total
Korkategória 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total 15-19 éves 20-24 éves 25-29 éves Total
faktuális
önkitöltő
attitűd
összesen
2,30 2,34 3,30 2,70 0,75 1,01 1,19 1,00 0,76 0,78 1,20 0,92 0,92 1,15 1,26 1,10 1,01 1,17 1,53 1,25 2,78 1,93 3,54 2,85 1,01 1,14 1,39 1,19 0,67 1,10 1,60 1,13 1,23 1,69 1,74 1,55 1,23 1,44 1,95 1,56
19,72 24,20 23,03 22,42 12,27 6,12 9,11 9,18 15,17 12,61 11,62 13,08 11,43 12,78 11,50 11,87 13,75 13,09 12,78 13,20 20,88 24,55 20,22 21,67 9,10 8,01 9,26 8,83 10,02 12,32 11,54 11,29 11,59 9,10 12,16 10,96 11,91 12,10 12,82 12,30
9,72 5,40 4,54 6,35 7,47 4,72 3,85 5,26 7,14 3,34 3,40 4,58 7,70 3,22 3,33 4,86 7,74 3,84 3,63 5,05 10,67 4,68 5,53 6,77 6,24 3,55 3,46 4,37 6,52 2,68 3,55 4,26 7,42 2,90 3,22 4,53 7,36 3,21 3,78 4,76
8,60 8,34 8,25 8,38 5,47 3,32 3,84 4,19 6,04 4,30 4,28 4,85 5,42 4,48 4,26 4,74 6,01 4,75 4,78 5,18 9,38 8,01 8,01 8,41 4,48 3,47 3,84 3,93 4,62 4,19 4,50 4,44 5,52 3,78 4,61 4,64 5,57 4,45 5,03 5,02
245
5.5 Demográfiai változók alapmegoszlása az Ifjúság2008 súlyozatlan mintában 73. táblázat Korcsoport
Korcsoport
Válaszolók száma
Válaszolók aránya (%)
15-19 éves
2640
32,7
20-24 éves
2539
31,4
25-29 éves
2897
35,9
Total
8076
100,0
74. táblázat Nem
Válaszolók száma
Nem Válaszolók aránya (%)
fiú
4074
50,4
lány
4002
49,6
fiú
4074
50,4
Total
8076
100,0
75. táblázat Településtípus
Településtípus
Válaszolók száma
Válaszolók aránya (%)
főváros
1180
14,6
megyei jogú város
1545
19,1
város
2500
31,0
Total
8076
100,0
76. táblázat
Befejezett iskolai végzettség
Legmagasabb befejezett iskolai végzettség
Válaszolók száma
Válaszolók aránya (%)
legfeljebb 8 általános
2781
34,6
szakmunkásképző
1345
16,7
érettségi
2895
36,0
diploma
1014
12,6
Total
8035
100,0
246
77. táblázat Gazdasági aktivitás
Gazdasági aktivitás
Válaszolók száma
Válaszolók aránya (%)
tanul
3189
39,8
dolgozik
3006
37,6
519
6,5
egyéb
1291
16,1
Total
8005
100,0
tanul és dolgozik
78. táblázat Háztartás mérete (fő)
Háztartás méret
Válaszolók száma
Válaszolók aránya (%)
1,00
239
3,0
2,00
1160
14,4
3,00
2267
28,2
4,00
2572
32,0
5,00
1082
13,5
719
8,9
8039
100,0
hatan vagy többen Total
247
6 Irodalomjegyzék Angelusz Róbert: Optikai csalódások, Pesti Szalon Könyvkiadó. Budapest, 1996. Angelusz Róbert: Kommunikáló társadalom, Ferenczy Könyvkiadó, Budapest, 1995. Angelusz Róbert – Tardos Róbert: A kérdőíves kontextus-hatás − a nem mintavételi hibák egy efemer, mindennapos esete, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006. Angelusz Róbert – Tardos Róbert: Az elérhetőség és a válaszadói készség gyenge közegei – mintalemorzsolódás, és trendszerű erózió panelfelvételek példáján, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006. Babbie, E.: A társadalomtudományi kutatás gyakorlata, Balassi Kiadó és az ELTE Szociológiai Intézetének közös kiadása, Budapest, 1995. Batagelj, Zenel – Manfreda, Katja Lozar – Vehovar, Vasja – Zaletel, Metka: Cost and Errors of Web Surveys in Establishment Surveys, http://surveys.over.net/method Batagelj, Zenel – Manfreda, Katja Lozar –Vehovar, Vasja: Design Issues in.: WWW Surveys http://surveys.over.net/method Barna Ildikó – Székelyi Mária: Túlélőkészlet az SPSS-hez, Többváltozós elemzési technikáról társadalomkutatók számára, Typotex, 2002 Beatty P. and Herrmann D.: To Answer or not to Answer: Decision Processes Related to Survey Item Nonresponse, Chapter 5, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Belson, W.: The Design and Understanding of Survey Questions, London, Gower, 1981.
248
Berck, Jodi; Dillman, Don A.; Kohrell, Julie; Phelps Glenn; Tortora, Robert; Swift, Karen Chadwick;
Brainerd,
Terry:
How
to
Conduct
Research
on
the
Internet,
http://www.tbchad.com/resrch.html#oview Berk, R.A., and Ray, S.C.: Selection Biases in Sociological Data, Social Science Research, Vol. 11, 1982, pp. 352-398. Berekoven, Sprecht, Walthelm, Wimmer Zur Genauigkeit mündlicher Befragungen in der Sozialforschung, 1975, Herbert Lang Bern, Peter Lang Frankfurt Blaskovits László: Kérdés – kérdőív, megkérdezés a piackutatási gyakorlatában, KJK, Budapest, 1975. Bódi Anikó – Závecz Tibor: A telefonos kérdezés, mint a választói viselkedés mérésének eszköze, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006 Bornemisza Eszter, Csepeli György: A válaszálcázás kiküszöbölése, in.: Szociológiai szemle, 1998/2. Bradburn, N.M., and Miles, C.: Vague Quantifiers, Public Opinion Quarterly, Vol. 43, No. 1, Spring, 1979, pp. 92-101. Brooks, C.A., and Bailar, B.: An Error Profile: Employment as Measured by the Current Population Survey, Statistical Policy Working Paper 3, Washington, DC, Office of Federal Statistical Policy and Standards, U.S. Department of Commerce, 1978. Brown, P.R., and Bishop, G.F.: Who Refuses and Resists in Telephone Surveys? Some New Evidence, University of Cincinnati, 1982. Brunner, G.A, and Carrol, S.J., Jr.: The Effect of Prior Telephone Appointments in Completion Rates and Response Content, Public Opinion Quarterly, Vol. 31, 1967, pp. 652-654. Cannel, C.F., Groves, R.M., Magilavy, L., Mathiowetz, N., Miller, P.V.: An Experimental Comparison of Telephone and Personal Health Surveys, National Center Health Statistics, Technical Series 2, No. 106, 1987. 249
Callegaro, M., Buskirk, T. D., Piekarski, L., Kuusela, V., Vehovar, V., Steeh, C. G.: Calculating outcome rates for mobile phone surveys. A proposal of a modified AAPOR standard RC33
and 6th
its
International
application Conference
to on
three
case
Social
Science
studies,
on:
Methodology:
Recent Developments and Applications in Social Research Methodology, 2004. http://mariocallegaro.info/pdf/papers/Callegaro_et_al_Calculating%20outcome%20rates %20for%20mobile%20phone%20surveys_RC33.pdf Chen – Hilton: Realtime Interviewing Using the World Wide Web, http://www.socresonline.org.uk/socresonline/4/3/chen.html Chromy, J., and Horvitz, D.: The Use of Monetary Incentives in National Assessment Household Surveys, Journal of the American Statistical Association, No. 363, September, 1978, pp. 473-478. Clancy, K.J., and Wachsler, R.A.: Positional Effects in Shared-Cost Surveys, Public Opinion Quarterly, Vol. 35, No. 2, 1971, pp. 258-265. Colombotos, J.: The Effects of Personal vs. Telephone Interviews on Socially Acceptable Responses, Public Opinion Quarterly, Vol. 29, No. 3, Fall, 1965, pp. 457-458. Converse, J., and Schuman, H.: The Manner of Inquiry: An Analysis of Survey Question Form Across Organizations and Time, in.: C.F. and E. Martin (Eds.), Surveying Subjective Phenomena, Vol. 2, New York, Russell Sage Foundation, 1984. Converse, Philip E.: A közvélemény-kutatás térnyerése és a politikai kutatások, in.: Média, nyilvánosság, közvélemény szöveggyűjtemény, Gondolat Kiadó, 2007 Comley, Pete: Pop-up surveys: what works, what doesn't work, and what will work in the future?, Proceedings of the ESOMAR worldwide Internet conference Net Effects 3.; Publication series; Vol. 37.; Dublin, 2000. Cseh-Szombaty László, Ferge Zsuzsa szerk.: A szociológiai felvétel módszerei, Közgazdasági és Jogi Könyvkiadó, 1975. Csíkos Csaba: Mintavétel a kvantitatív pedagógiai kutatásban, Kutatás-módszertani Kiskönyvtár, Gondolat, Budapest, 2009.
250
Darvas
Péter
–
Pillók
Péter:
Online
adatfelvételi
módszerek
és
felhasználásuk
Magyarországon, in: ITTK kutatási jelentés 15-16, BME-UNESCO Információs Társadalom és Trendkutató Központ, Budapest, 2002. Davies, Ted - Wydra, Donna: An examination of online sampling techniques, "Net Effects 3" Esomar Konferencia , Dublin, 2000. Deutschmann M, Faulbaum F.: The recruitment of online samples by CATI-screening: problems of non-response. Paper presented at conference of the Association for Survey Computing (The Challenge of the Internet). May 2001, London, England. Dillman, D.: Mail and Telephone Surveys, New York, John Wiley & Sons, 1978. Dillman, D., Gallegos, J.G., and Frey, J.H.: Reducing Refusal Rates for Telephone Interviews, Public Opinion Quarterly, Vol. 40, No. 1, Spring, 1976, pp. 66-78. Dillman, D. - Schaefer, David R.: Development of a Standard E-Mail Methodology: Results of an Experiment, http://survey.sesrc.wsu.edu/dillman/papers.htm Dillman, D. et al.: Survey Nonresponese in Design, Data Collection and Analysis, Chapter 1, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Direkt
marketing
ágazati
kutatás,
előadás,
Budapest,
2006.
október
25.
http://www.marketinginfo.hu/file/download.php?sitename=mediainfo&id=72&redirect=/t anulmanyok/essay.php?id=448 Dirk Heerwegh, Tim Vanhove, Geert Loosveldt, Koen Matthijs: Effects of personalization on web survey response rates and data quality Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Social
Methodology: Research
(ISA
Recent
Developments
and
Applications
Amsterdam
August,
16-20,
RC33),
in 2004.,
https://perswww.kuleuven.be/~u0034437/public/Files/ProceedingsRC33.pdf Dijkstra, Wil: Interviewing Syle and Respondent Behavior: An Experimental Study of the Survey-Interview, Sociological Methods & Research, Vol 16. No. 2, 1987. november
251
Dijkstra, Wil – Smit, H. Johannes: Persuading Reluctant Recipients in Telephone Surveys, Chapter 8, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. DMSZ - a DM-eszközök hatékonyságát kutatta, Kreatív Online, 2007. december 14. http://www.kreativ.hu/cikk/dmsz___a_dm_eszkozok_hatekonysagat_kutatta_/index.php Duncan, Kristin Blenk, Stasny, Elizabeth A.: Using Propensity to Control Coverages Bias in Telephone Survey, Survey Methodology, 2001 december, vol. 27. no.2 ESOMAR
státusz
besorolás
kialakítása,
http://www.esomar.org/index.php/codes-
guidelines.html Feld, Karl G. - Wygant, Steven A.: Using e-Interviewers Improves Web Survey Data Quality http://www.asc.org.uk/Events/Sep00/Feld.ppt Fellegi, I.P.: Response Variance and Its Estimation, Journal of the American Statistical Association, Vol. 59, December, 1964, pp. 1016-1041. Fischer György: Hihetünk-e a közvélemény-kutatásoknak? Bagolyvár Könyvkiadó, Budapest, 2001. Fishkin, James S.: A virtuális demokrácia lehetőségei az internet korában, in.: Média, nyilvánosság, közvélemény szöveggyűjtemény, Gondolat Kiadó, 2007., pp. 674-697 Flesch Reading Ease Readability Score, http://rfptemplates.technologyevaluation.com/Readability-Scores/Flesch-Reading-EaseReadability-Score.html Fowler, F.J., Jr., and Mangione, T.W.: The Value of Interviewer Training and Supervision, Final Report to the National Center for Health Services Research, Grant #3-R18HS04189, 1985. Gallup, G.H.: A Guide to Public Opinion Polls, Princeton, Princeton University Press, 1948. Gerő Zsuzsa, Hrubos Ildikó: Az empirikus szociológiai kutatás módszerei, Budapest: Tankönyvkiadó, 1977.
252
Global Market Research 2008, ESOMAR industry report, ESOMAR, 2008 Goldberger, A.S.: Linear Regression After Selection, Journal of Econometrics, Vol. 15, No. 2, 1981, pp. 357-366. Göritz, Anja S., Moser, Klaus: Repräsentativität im Online-Panel, Der Markt, 2000/4, 39. évfolyam, Nr. 155, Goyder, J.: The Silent Minority: Nonrespondents in Sample Surveys, Boulder, Colorado, Westview Press, 1987. Graham Kalton: Development in survey research in the past 25 years, Survey Methodology, 2000, június, vol. 26. Groves, R.M., and Magilavy, L.J.: Measuring and Explaining Interviewer Effects in Centralized Telephone Surveys, Public Opinion Quarterly, Vol. 50, No. 2, 1986, pp. 251266. Groves, R.M., and Kahn, R.L.: Surveys by Telephone, New York, Academic Press, 1979. Groves, R.M., and Fultz, N.H.: Gender Effects Among Telephone Interviewers in a Survey of Economic Attitudes, Sociological Methods and Research, Vol. 14, No. 1, August, 1985, pp. 31-52. Hajdu Mária: A közvélemény kutatások hitelessége és manipulatív szerepe, szakdolgozat, Budapesti Gazdasági Főiskola, külkereskedelmi főiskolai kar, nemzetközi kommunikáció szak, public relations szakirány, Budapest, 2005. Hansen, M.H., Hurwitz, W.N., and Pritzkes, L.: Response Variance and Its Estimation, Journal of the American Statistical Association, Vol. 59, 1964, pp. 1016-1041. Hatchett, S., and Schuman, H.: Race of Interviewer Effects Upon White Respondents, Public Opinion Quarterly, Vol. 39, No. 4, 1975-76, pp. 523-528. Héra Gábor – Ligeti György: Módszertan – Bevezetés a társadalmi jelenségek kutatásába, Osiris Kiadó 2005.
253
Haunberger, Sigrid: The Effect of Interviewer and Respondent Characteristics on Response Behavior in Panel Survey: A Multilevel Approach, QUALITY & QUANTITY, Volume 44, Number 5, 957-969. Herczog, A.R., and Rodgers, W.L.: Age and Response Rates to Interview Sample Surveys, Journal of Gerontology: Social Sciences, Vol. 43, No. 6, 1988, pp. 200-205. Hidiroglou; M.A.: Double Sampling, Survey Methodology, 2001, Vol. 27. December, pp. 143157. Hill, D.H.: Home Production and the Residential Electric Load Curve, Resources and Energy, Vol.
1,
1978,
pp.
339-358.,
North-Holland
Publishing
Company,
http://deepblue.lib.umich.edu/bitstream/2027.42/22473/1/0000014.pdf Hoffman Márta - Kozák Ákos - Veres Zoltán szerk.: Piackutatás, Műszaki Könyvkiadó, Budapest, 2000. Hogan; Howard: The Accuracy and Coverage Evaluation: Theory and Design, Survey Methodology, Vol. 29. 2003. december Horváth Gergely: A nem-válaszolás jelensége a KSH Háztartási Költségvetési Felvételében szakdolgozat, Eötvös Loránd Tudományegyetem Társadalomtudományi Kar, 2004. Horváth György: A kérdőíves módszer, Műszaki Könyvkiadó, Budapest, 2004. Hunyadi László (2001): A mintavétel alapjai. Számalk Kiadó, Budapest. House, J., and Wolf, S.: Effects of Urban Residence and Interpersonal Trust and Helping Behavior, Journal of Personality and Social Psychology, Vol. 36, No.9, 1978, pp. 10291043. Hox, Joop; de Leeuw, Edit: The Influence of Interviewers Attitude and Behavior on Household Survey Nonresponse: An international Comparison, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, 2002, John Wiley & Sons, Inc, New York HVG 2002: A köz a kutatókról, HVG, 2002. március 2. 62. p. Hyman, H., Interviewing in Social Research, Chicago, University of Chicago Press, 1954. 254
H. Öztas Ayhan, Sühendan Ekni: Coverage error in Population Censuses: The Case of Turkey, Survey Methodology, 2003. december, vol. 29, no. 2. Ineke A.L. Stoop: Surveying nonrespondents, Field Methods, 2004, vol. 16; pp. 23-54. Interviewer Training: Responding to Changes in Telephone Survey Methodology, Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Methodology: Recent Developments and Applications in, Social Research (ISA RC33), Amsterdam August, 16-20, 2004. Jo Lindsay: Getting the numbers: the unacknowledged work in recruiting for survey research, Field Methods, Vol. 17. 2005. No. 1. pp. 119-128. Johnson, T. et al.: Culture and Survey Nonresponse, Chapter 4, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Juhász Krisztina – Sterk Péter: A bemutatkozásról, bevezető szövegről és indító kérdésekről a kérdőíves adatfelvételnél, Tömegkommunikációs Kutatóközpont, 6. évfolyam, 10. szám, 1975. 03. 27. Jun Shao: Handling survey nonresponse in cluster sampling, 2007. június, vol. 33, no 1. Karácsony Gergely – Lakatos Zsuzsa: Választási előrejelzések Magyarországon, 1990–2006. Sikerek, tévedések és tanulságok, In: Angelusz Róbert-Tardos Róbert (szerk.):Mérésről mérésre. A választáskutatás módszertani kérdései. DKMKA. Budapest, 2006. Kay, E.; Tisdall, M., Davis, John M., Gallagher; Michael: Researching with Children and Young People, Sage, Los Angeles, New Delhi, Singapore, Washington DC, 2009. Kemsley, W.F.F.: National Food Survey. A Study of Differential Response Based on a Comparison of the 1971 Sample with the Census, Statistical News, Nov. 1976, No. 35, pp. 18-22. Kish, L.: Kutatások statisztikai tervezése, Statisztikai Kiadó. Budapest, 1989. Kish, L.: Teljes körű adatfelvételek és gördülő minták, Jel-Kép 1995/2.
255
Kish, L.: New Paradigms (Models) for Probability Samping, Survey Methodology, 2002 june, Vol. 28. No. 1, http://www.statcan.gc.ca/ads-annonces/12-001-x/6488-eng.pdf Kish, L.: Populations for Survey Sampling, Survey Statistician, No. 1. February, 1979, pp. 1415. Kish, L., and Hess, I.: On Noncoverage of Sample Dwellings, Journal of the American Statistical Association, Vol. 53, June, 1958, pp. 509-524. Kish, L.: Studies of Interviewer Variance for Attitudinal Variables, Journal of the American Statistical Association, Vol. 57, March, 1962, pp. 92-115. Klenovszki János – Máth András: Az online kutatás helye a hazai piackutatásban, 2007. december
4.
Online
Kutatás
2007
konferencián
elhangzott
előadás,
http://www.onlinekutatas.info/letoltesek Kolosi Tamás – Tóth István György: Egy tévedés története, elektronikus verzió, 2006, www.tarki.hu/adatbank-h/kutjel/pdf/a838.pdf Korn, A.: Coverage Issues Raised by Comparisons Between CPS and Establishment Employment, Proceedings of the Social Statistics Section, American Statistical Association, 1977, pp. 60-69. Kormendi, E.: The Quality of Income in Telephone and Face to Face Surveys, in R.M., Groves et al. (Eds.) Telephone Survey Methodology, New York, John Wiley & Sons, 1988. Körmendi Zsófia: Online adatfelvétel a közvélemény-kutatásban: Egy 2009-es európai parlamenti választásokkal kapcsolatos online és offline kutatássorozat eredményeinek összehasonlítása, szakdolgozat Eötvös Loránd Tudományegyetem Társadalomtudományi Kar, 2009. Kojanitz László: A tankönyvek használhatóságát meghatározó minőségi összetevők elemzése és összehasonlítása, http://www.okm.gov.hu/letolt/kozokt/tankonyvkutatasok/cd1_kojanitz/vizsgalat_eredmen yeinek_bemutatasa.pdf
256
Kristiansson, K.E.: A Non-Response Study in the Swedish Labour Force Surveys, in Methodological Studies From the Research Institute for Statistics on Living Conditions, National Central Bureau of Statistics, Stockholm, Sweden, No. 10E, 1980. Krosnick, J.: The Causes of No-Opininon Responses to Attiutude Measures in Surveys: They Are Rarely What They Appear to Be, Chapter 6, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Landis, J.R., et al.: Feminist Attitudes as Related to Sex of the Interviewer, Pacific Sociological Review, Vol. 16, No. 3, July, 1973, pp. 305-314. Lapos András (Sík Endre): A longitudinális cigány Replika, 17-18. szám, 1995. június pp. 246-251. Lakatos Miklós: A lakossági nyilvántartások (regiszterek) szerepe a népszámlálási felvételekben, Szociológiai Szemle, 1999/2., pp. 123-150. Lavrakas; Paul J.: Encyclopedia of Survey Research Methods, 1-2, 2008, Sage Publications Inc. Lazarsfeld; Paul F.: A közvélemény és a klasszikus hagyomány, in.: Média, nyilvánosság, közvélemény szöveggyűjtemény, Gondolat Kiadó, 2007 Lepkowski, J.M. and Groves, R.M.: A Mean Squared Error Model for Dual Frame , Mixed Mode Survey Design, Journal of the American Statistical Association, Vol. 81, No. 396, 1986, pp. 930-937. Letenyei László, Nagy Gábor: Rugalmas kérdőív, Szociológiai Szemle, 2007/1-2, pp. 29-46. Léderer P.: A társadalomtudományi mérés természetéről, In Léderer P.: A szociológus, a módszerei, meg a szövege, Budapest: Új Mandátum, 2002, pp. 38–47. Léderer Pál: A módszertan csapdái, Replika, 1991 2–3. szám pp. 18-29. de Leeuw E. and de Heer W.: Trends in Household Survey Nonresponse: A Longitudinal and International Comparison, Chapter 3, in: Survey Nonresponse, szerk.: Robert M. Groves,
257
Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Lindstrom, H.: Non-Response Errors in Sample Surveys, Urval, No. 16, 1983. Locander, W.B., and Burton, J.P.: The Effect of Question Form on Gathering Income Data By Telephone, Journal of Marketing Research, Vol. 13, 1976, pp. 189-192. Lozar Manfreda, K., Vehovar, V., Batagelj, Z. Batagelj – Manfreda – Vehovar: Web versus Mail Questionnaire for an Institutional Survey, 2nd ASC International Conference on Survey Research Methods: The Challenge of the Internet, 2001 Lynn P., et al.: The Effects of Extended Interviewer Efforts on Nonresponse Bias, Chapter 9, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Lynn, Peter, Buck, Nicholas; Burton, Jonathan, Jäckle, Annette, Laurie, Heather: A review of methodological research pertinent to longitudinal survey design and data collection, ISER Working Papers, Number 2005-29, http://www.iser.essex.ac.uk/files/iser_working_papers/2005-29.pdf Mácsai Tamás: Kérdezői kézikönyv, http://www.pmsz.org/download/KerdezoiKezikonyv.pdf, létrehozás dátuma: 2005. február 28. Mansour Fahimi1, Roy Whitmore, James Chromy, Peter Siegel, and Margaret Cahalan: Efficacy of Incentives in Increasing Response Rates, Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Methodology: Recent Developments and Applications in Social Research (ISA RC33), Amsterdam August, 16-20, 2004. Marquis, K.: Survey Response Rates: Some Trends, Causes, and Correlates, paper presented at the 2nd Biennial Health Survey Methods Research Conference, Washington, DC, National Center for Health Services Research, 1979. Marsh, C.: The Survey Method: The Contribution of Surveys to Sociological Explanation, London, Allen and Unwin, 1982.
258
Martin, E.: Report, on the Development of Alternative Screening Procedures for the National Crime Survey, Washington, DC, Bureau of Social Science Research, 1986. Marton Ádám dr.: A nem mintavételi hiba a statisztikai felvételekben Statisztikai Szemle, 1989. 10. pp. 901-913. Mathiowetz, N., and Cannell, C.: Coding Interviewer Behavior as a Method of Evaluating Performance, Proceedings of the American Statistical Association, 1980, pp. 525-528. Máder Miklós Péter: Hiányos adatbázisok statisztikai kezelése, Eötvös Loránd Tudomány Egyetem Bölcsészettudományi Kar Szociológiai, Szociálpolitikai Intézet és Továbbképző Központ, 2001. Marton Ádám (1994): A nem mintavételi hiba az ipari kisszervezetek megfigyelésénél. Statisztikai szemle, 72. évfolyam 2. szám, 141 – 153. oldal. Mason R., et al.: Effect of Item Nonresponse on Nonresponse Error and Inference, Chapter 10, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Mehrabian, A.: Silent Messages, Belmont, Wadsworth, 1968. Mercer, J.R., and Butler, E.W.: Disengagement of the Aged Population and Response Differentials in Survey Research, Social Forces, Vol. 46, No. 1, 1967, pp. 89-96. Merkle D. and Edelman M.: Nonresponse in Exit Polls: A Comprehensive Analysis, Chapter 16, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Michael W. Link: Predicting the Persistence and Performance of Newly Recruited Telephone Interviewers, Field Methods, 2006 18, No. 3. August Milsom,
Paul:
Designing
and
Managing
Internet
Panels
http://www.asc.org.uk/Events/May01/Resource/Milsom2.pps Moksony Ferenc: Fogalomalkotás és tudományos felfedezés, Szociológiai Szemle, 2002/1.
259
Monsees, M.L., and Massey, J.T.: Adapting Producers for Collecting Demographic Data in a Personal Interview to a Telephone Interview, Proceeding of the Section on Survey Research Methods, American Statistical Association, 1979, pp. 130-135. Moore, D. and J. Tarnai: Evaluating Nonresponse Error in Mail Survey, Chapter 13, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Nathan, G.: An Empirical Study of Response and Sampling Errors for Multiplicity Estimates with Different Counting Rules, Journal of the American Statistical Association, Vol. 71, No. 356, December 1976, pp. 808-815. Nemzeti Média Analízis, 2007. II. félév Nicole Schoebi , Christophe Müller, Dominique Joye, Max Bergman: Some Ideas to Encrease the Response Rate in Large Scale Social Surveys , Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Methodology: Recent Developments and Applications in Social Research (ISA RC33), Amsterdam August, 16-20, 2004. Norman A. Bradburn: Understanding the Question-Answer Process, Statistics Canada, Vol. 30, No. 1. pp: 5-15. 2004. Oksenberg, L.: Analysis of Monitored Telephone Interviews, Research Report to the U.S. Bureau of the Census for JSA 80-23, Ann Arbor, 1981. O’Neil, M.: Estimating the Nonresponse Bias due to Refusals in Telephone Surveys, Public Opinion Quarterly, 1979, pp. 218-232. O’Muirchearhtaight, C.A.: Response Errors in an Attitudinal Sample Survey, Quality and Quantity, Vol. 10, 1976, pp. 97-115. Oksenberg, L., Coleman, L., and Cannell, C.F.: Interviewers’ Voices and Refusal Rates in Telephone Surveys, Public Opinion Quarterly, Vol. 50, No. 1, 1986, pp. 97-111. Pepper, S., and Pryulak, L.S.: Sometimes Frequently Means Seldom: Context Effect in the Interpretation of Quantitative Expression, Journal of Research in Personality, Vol. 8, 1974, pp. 95-101. 260
Response Rate and Measurement Differences in Mixed Mode Surveys Using Mail, Telephone, Interactive Voice Response and the Internet, http://survey.sesrc.wsu.edu/dillman/papers.htm Rudas Tamás: A hibahatár a becsült mennyiség függvényében, in.: Mérésről mérésre, a válaszkutatás módszertani kérdései, szerk.: Angelusz Róbert – Tardos Róbert, Demokrácia Kutatások Magyar Központja Közhasznú Alapítvány, Budapesti Corvinus Egyetem Politikatudományi Intézet, 2006. Rudas Tamás: Hogyan olvassunk közvélemény-kutatásokat? Új Mandátum Könyvkiadó, Budapest, 1998. Rudas Tamás: Mixture models of missing data, Eötvös Loránd University and TÁRKI Social Research Institute, http://statisztika.tatk.elte.hu/tanszeki_honlap/RT_Q&Q.pdf Róbert Péter: Nemzetiségi és etnikai csoportok társadalmi észlelése, Replika, 17-18. szám, 1995. június, pp. 274-281. Róbert Péter: A szociológia peremén. Foglalkozásuk kérdezőbiztos. Valóság 1980. 3. szám. pp. 70-77. Robins, L.N.: The Reluctant Respondent, Public Opinion Quarterly, Vol. 27, No.2, 1963, pp. 129-156. Sajtos László – Mitev Ariel: SPSS – kutatási és adatelemzési kézikönyv, Alinea Kiadó, 2007 Scheuch, Erwin K.: Das Interview ind der Sozialforschung, in René König (Hrsg.) Handbuch der empirischen Sozialforschung, Erster Band, - Ferdinand Enke Verlag, Stuttgart, 1962. 152-166 p. Schuman, H., and Converse, J.M.: The Effects of Black and White Interviewers on Black Responses in 1968, Public Opinion Quarterly, Vol. 35, No. 1, 1971, pp. 44-68. Schwarz, N. (1995): What respondents learn from questionnaires: The survey interview and the logic of conversation. International Statistical Review, 1995/2. Ismerteti Marton Ádám a Statisztikai szemle 74. évfolyamának 1. számában, 85 – 87. oldal.
261
Singer, E., and Kohnke-Aguirre, L.: Interviewer Expectation Effects: A Replication and Extension, Public Opinion Quarterly, Vol. 43, No. 2, 1979, pp.245-260. Singer E.: The Use of Incentives to Reduce Nonresponse in Household Surveys, Chapter 11, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Sirken, M.: Household Surveys With Multiplicity, Journal of the American Statistical Association, March, 1970, pp. 257-266. Smith, T.: Developing Nonresponse Standards, Chapter 2,in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Smith, T: Nonattitudes: A Review and Evaluation, in C.F. Turner and E. Martin (Eds.), Surveying Subjective Phenomena, New York, Russell Sage Foundation, 1984, pp. 215255. Stroms, Vicky –Loosveldt, Geert: Who Repond to incentives, Field Methods, Vol. 16, No.4, 2004. Sudman, S., and Bradburn, N.: Response Effects in Surveys, Chicago, Aldine, 1974. Su-hao Tu – Pei-shan Liao: Socail Distance, Interview Rapport, and Invalid Responses, Paper presented in Session: Preventing, Diagnosing, and Analyzing Missing Data of the Sixth International Conference on Social Science Methodology: Recent Developments and Applications in Social Research (ISA RC33), Amsterdam, August, 16-20, 2004. Sykes, W., and Hoinville, G.: Telephone Interviewing on a Survey of Social Attitudes: A Comparison With Face-to-face Procedures, London, Social and Community Planning Research, 1985. Tarjányi József: Egy kérdező dilemmái, Jel-Kép 1980. 4. Tarjányi József: Módszertani problémák a telefonos közvélemény-kutatásokban Replika, 1995., 19–20., december, p. 181-196.
262
Tóth István János: Melyik közvélemény-kutató intézetre szavazna Ön, ha most vasárnap lennének a választások? Közvélemény-kutatók és pártpreferenciák 1994-2002, WARGO Institute of Economic Research, Budapest, 2002. Tóth István János: Előrejelzési kudarcok és kollektív tévedések: becsülhettek volna pontosan a közvélemény kutatók? Magyarország politikai évkönyve, II. köt. Demokrácia Kutatások Magyar Központja Alapítvány, 2003., pp. 1559-1594. Tucker, C.: Interviewer Effects in Telephone Surveys, Public Opinion Quarterly, Vol. 47, No. 1, 1983, pp. 84-95. Vallent Brigitta: Beszélt nyelvi hatások a középiskolások fogalmazásaiban, http://www.c3.hu/~nyelvor/period/1322/132205.pdf Varga István szerk.: Kutatástervezés, adatgyűjtés, mérés, szöveggyűjtemény az empirikus szociológia módszertanához, Budapesti Közgazdaságtudományi Egyetem Szociológia és Szociálpolitikai Tanszék, Budapest, 1996 Varga Sára: A jövedelemfelvétel hiányzó adatainak pótlása, in.: Statisztikai szemle. 77. 1999. 2-3. 112-130. Váradi László szerk.: A panel, módszertani szöveggyűjtemény, Tömegkommunikácós Kutatóközpont, 18. évfolyam, 9. szám, 1987. Vehovar, V., et al.: Nonresponse in Web Survey, Chapter 15, in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Vigderhous, G.: Sheduling Telephone Interviews: A Study of Seasonal Patterns, Public Opinion Quarterly, Vol. 45, pp. 250-259. Vincent F. Price – Peter Neijens: A deliberatív közvélemény-kutatás, in.: Média, nyilvánosság, közvélemény. Szöveggyűjtemény, Gondolat Kiadó, 2007. pp. 698-732. Virtual Surveys Limited: The Use of the Internet as a Data Collection Method, http://virtualsurveys.com/papers/email.htm
263
Vita a telefonos közvélemény-kutatásokról (TÁRKI) (résztvevők: Angelusz Róbert – ELTE, Beck László – Medián Kft., Fischer György – Magyar Gallup Intézet, Hann Endre – Medián Kft., Molnár D. László – SzocioMed KFT., Sterk Péter – Szonda Ipsos, Tarjányi József – Tárki, Tordai Nándor – Országos Piackutató Intézet, Török László – Országos Piackutató Intézet, Závecz Tibor – Szonda Ipsos. A vitát Rudas Tamás vezette) Replika, 1995. december, 19–20, http://www.c3.hu/scripta/scripta0/replika/1920/14vita.htm Waffenschmidt Jánosné: Adatgyűjtés és adatok minősége, Statisztikai Szemle 2001. 79. é 9. sz. pp. 741-751. www.ksh.hu/statszemle_archive/ Warner, S.L.: Randomized Response: A Survey Technique for Eliminating Evasive Answer Bias, Journal of the American Statistical Association, Vol. 60, 1965, pp. 63-69. Watt,
James:
Using
the
Internet
for
quantitative
survey
research,
http://www.quirks.com/articles/article.asp?arg_ArticleId=248 Wayne
Enanoria,
PhD,
MPH:
Sampling
Frames
and
Coverage
Error
www.idready.org/courses/2005/spring/survey_SamplingFrames.pdf Weber, D., and Burt, R.C.: Who’s Home When, Washington, DC, U.S. Bureau of the Census, 1972. Weeks, M., Jones B.L., Folsom, R.E., Jr., and Benrud, C.H.: Optimal Times to Contact Sample Households, Public Opinion Quarterly, Vol. 44, No. 1, Spring, 1980, pp. 101114. Wilcox, J.B.: The Interaction of Refusal and Not-at-home Sources of Nonresponse Bias, Journal of Marketing Research, Vol. XIV, 1977, pp. 592-597. Willimack, D. et al.: Understanding Unit and Item Nonresponse in Business Surveys, Chapter 14 in: Survey Nonresponse, szerk.: Robert M. Groves, Don A. Dillman, John L. Eltinge, Roderick J.A. Little, John Wiley & Sons, Inc, New York, 2002. Wright T., and Tsao, H.J.: A Frame on Frames: An Annotated Bibliography, in T. Wright (Ed.) Statistical Methods and the Improvement of Data Quality, New York, Academic Press, 1983, pp. 25-72.
264
Zakariás Ildikó, Németh Renáta: Comparing samling frames, konferencia előadás, International Conference on Logic and Methodology, Hollandia, Amszterdami egyetem, 2004.
265