Közvélemény-kutatás Rudas, Tamás
Közvélemény-kutatás Rudas, Tamás v 1.0 Publication date 2006 Szerzői jog © 2006 Corvina Kiadó
Tartalom Közvélemény-kutatás ............................................................................................................. 1 Az első kiadás előszavából ................................................................................................... 2 A második kiadás előszava ................................................................................................... 4 1. Megismerhető-e a közvélemény? (Megbízhatóság és érvényesség) ................................. 5 Összefoglalás ................................................................................................................. 8 2. Kit képviselnek a megkérdezettek? (Reprezentativitás) ................................................. 10 Összefoglalás ............................................................................................................... 16 3. Hány embert kell megkérdezni? (Mintanagyság) ........................................................... 17 Összefoglalás ............................................................................................................... 27 4. Hogyan választják ki a megkérdezetteket? (Mintavétel) ................................................ 28 Összefoglalás ............................................................................................................... 35 5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) ...................... 36 Összefoglalás ............................................................................................................... 44 6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) ..................... 45 Összefoglalás ............................................................................................................... 50 7. Egyformán fontos minden válasz? (Súlyozás) ................................................................ 52 Összefoglalás ............................................................................................................... 65 8. Hogyan értelmezzük az eredményeket? .......................................................................... 67 Összefoglalás ............................................................................................................... 75 9. Minden adatra érvényes a vizsgálat hibahatára? ............................................................ 76 Összefoglalás ............................................................................................................... 83 10. Összehasonlítók-e a különböző közvélemény-kutatások eredményei? ......................... 85 Összefoglalás ............................................................................................................... 92 11. Miért jók a közvélemény-kutatások? ............................................................................ 93 Összefoglalás ............................................................................................................... 96
iii
Közvélemény-kutatás
Értelmezés és kritika Rudas Tamás Corvina A könyv első kiadása Hogyan olvassunk közvélemény-kutatásokat? címen jelent meg (Budapest, Új Mandátum Kiadó, 1998). Második, bővített kiadás © Rudas Tamás, 2006 Sorozatterv: Kiss István Jelen kiadvány a jogtulajdonos írásos engedélye nélkül sem részben, sem egészben nem másolható, sem elektronikus, sem mechanikus eljárással, ideértve a fénymásolást, számítógépes rögzítést vagy adatbankban való felhasználást is. Kiadja a Corvina Kiadó kft., az 1795-ben alapított Magyar Könyvkiadók és Könyvterjesztők Egyesülésének tagja
1072 Budapest, Rákóczi út 16. e-mail:
[email protected] www.corvinakiado.hu Felelős kiadó: Kúnos László, a Corvina igazgatója Felelős szerkesztő: Blaschtik Éva Műszaki vezető: Illyés Éva ISBN 963 13 5501 2 ISSN 1787–4629
1
Az első kiadás előszavából 1936-ban az Amerikai Egyesült Államok elnöke, Franklin Delano Roosevelt másodszori megválasztásáért küzdött. Ellenfele a republikánus párti Alfred Landon volt. A szavazópolgároknak nemcsak két elnökjelölt vagy két párt, hanem két gazdaságpolitika között is választaniuk kellett. FDR a gazdaság óvatos élénkítésével akarta az országot kivezetni a válságból, Landon további takarékoskodást javasolt. A választás eredményének előrejelzésére a Literary Digest című magazin a történelem minden bizonnyal legnagyobb közvéleménykutatását hajtotta végre. Tízmillió címre küldtek ki a választási szándékra vonatkozó kérdőívet. Kétmillió négyszázezer választ kaptak, és ezek alapján teljes bizonyossággal állították, hogy a választás nyertese Alfred Landon lesz. Előrejelzésük téves volt, és ez az olvasók bizalmának és érdeklődésének olyan mértékű csökkenéséhez vezetett, hogy a lap hamarosan csődbe ment. Az 1936-os elnökválasztás nemcsak az USA, hanem a közvélemény-kutatások történetének is jelentős állomása. A kutatók megértették, hogy önmagában a nagy mintaelemszám nem garantálja az előrejelzés pontosságát. Amekkora kudarc volt a Literary Digest számára az 1936-os amerikai elnökválasztás eredményeinek előrejelzése, ugyanakkora volt a siker George Gallup számára. Előrejelzésének sikere alapján úgy tűnt, ő tudta, mire van szükség ahhoz, hogy viszonylag kisebb mintákra alapozva is sikeres előrejelzést lehessen adni. A megkérdezetteket úgy választotta ki, hogy a teljes minta összetétele néhány lényeges szempontból – mint a nem, az iskolai végzettség, a jövedelem – hasonló legyen a választópolgárok összességéhez. Ezzel a módszerrel nemcsak az 1936-os elnökválasztás eredményét tudta helyesen megjósolni, de 1948-ig mindig sikeres előrejelzést adott. 1948-ban azonban az ő előrejelzése is tévesnek bizonyult, éppúgy, mint versenytársaié, akik akkor már mind hasonló elvek alapján választották mintáikat. A negyvenes évek második fele óta az elemzők többsége egyetért abban, hogy nem elegendő, ha a mintát úgy választjuk, hogy bizonyos, könnyen ellenőrizhető szempontokból hasonlítson az összes szavazópolgárból álló népességre. A jó előrejelzéshez az is szükséges, hogy az igazán lényeges szempontból, ti. a szavazási szándék szerint is hasonlítson a minta a szavazópolgárok összességére. Az utóbbi hasonlóság pedig nem feltétel nélküli következménye az előbbinek. Az első feltétel úgy is teljesülhet, hogy a mintába kerültek szavazási szándékai erősen különböznek a teljes népességétől. Csak akkor remélhetjük, hogy a minta a szavazási szándék szerint is jól reprezentálja a népességet, ha kiválasztásában nem kedvezünk egyik társadalmi csoportnak sem, legyen ez akár felismerhető (például iskolai végzettség), akár pedig felismerhetetlen jegyek által meghatározott (például a különböző jelöltekre szavazók). Ezt csak úgy valósíthatjuk meg, ha mindenkinek egyforma esélyt biztosítunk arra, hogy a mintába kerüljön, azaz a mintát véletlenszerűen választjuk. Ezzel a felismeréssel megszületett a mintavétel, és vele a közvélemény-kutatások modern elmélete. Az utóbbi évtizedekben a közvélemény-kutatások, és különösen a politikai közvéleménykutatások, minden demokratikus ország közéletében fontos szerepet játszanak, és ezért célszerű ezen kutatások alapvető módszereinek megismerése. 2
Az első kiadás előszavából
Ezzel a könyvvel a közvélemény-kutatások iránt érdeklődő olvasóknak szeretnék segítséget nyújtani úgy, hogy bemutatom a közvélemény-kutatásokkal kapcsolatos legfontosabb fogalmak jelentését és a közvélemény-kutatások azon jellemzőit, amelyek az eredmények megbízhatóságára és érvényességére a legnagyobb hatással vannak. Részletesen lesz szó a közvéleménykutatások eredményeinek értelmezéséről és a különböző közvélemény-kutatások eredményeinek összehasonlításáról. Nem azt tárgyaljuk, hogy hogyan tervezzünk és hajtsunk végre közvéleménykutatásokat, hanem olyan ismereteket mutatunk be, amelyek egy közvélemény-kutatás minőségének megítélésében és eredményeinek értelmezésében a leglényegesebbek. Ezek az ismeretek hasznosak lehetnek azoknak, akik politikusként, döntéshozóként vagy újságíróként közvélemény-kutatásokat rendelnek meg, és azoknak is, akik a közvélemény-kutatások eredményeit akár hivatásszerűen, akár csak érdeklődő újságolvasóként szeretnék pontosan megérteni. A szerző
3
A második kiadás előszava A könyv első kiadása a megjelenése óta eltelt nyolc évben elfogyott, köszönhetően talán annak is, hogy az ország számos egyetemén tankönyvként használják. A közvélemény-kutatások fontossága és az irántuk megnyilvánuló érdeklődés azonban nem csökkent az elmúlt időben. Az új kiadás a szöveg átfésülésén és néhány szóhasználati változtatáson túlmenően számos helyen részletesebb magyarázatokkal szolgál, mint az első. A bővítések nem érintik az eredeti könyv célját és szemléletét: ebből a könyvből nem lehet megtanulni közvélemény-kutatások készítését, de – szándékaim szerint – meg lehet tudni, hogy a közvélemény-kutatások eredményeit hogyan lehet értő és kritikus módon értelmezni. A szerző
4
1. Megismerhető-e a közvélemény? (Megbízhatóság és érvényesség) Hihetünk-e a közvélemény-kutatások eredményeinek? Pontos képet kaphatunk-e egy egész ország vagy akár csak egy városrész lakosságának véleményéről pusztán néhány száz vagy néhány ezer embernek feltett kérdésekre kapott válaszok alapján? Valójában olyan sikeresek és pontosak-e a közvélemény-kutatások, mint ahogyan azt készítőik gyakran állítják? Vagy talán a közvéleménykutatások készítőik szándékait, az általuk várt eredményeket tükrözik? Ezekre a kérdésekre nehéz lenne általánosan érvényes válaszokat adni. A közvéleménykutatások nagy részét olyan problémákkal kapcsolatban végzik, amelyekről a lakosság „pontos” véleménye sohasem lesz ismert. Ezeknek a közvélemény-kutatásoknak az eredményeit nincs mivel összehasonlítani, ezért nem lehet teljes bizonyossággal megállapítani, hogy milyen mértékben tükrözték a valóságot. A közvélemény-kutatások egy része azonban olyan kérdéseket vizsgál, amelyekkel kapcsolatban a teljes lakosság pontos álláspontja később ismertté válik, és ezekben az esetekben az előrejelzések összehasonlíthatóak a tényleges eredményekkel. A legfontosabb ilyen jellegű közvélemény-kutatások választási eredmények előrejelzését szolgálják. Ezek eredményei összehasonlíthatóak a tényleges választási eredményekkel, és így pontosságuk megállapítható. Természetesen ez az összehasonlítás csak akkor helyénvaló, ha a közvélemény-kutatás ideje és a tényleges választás között az emberek nem változtatják meg szavazási szándékukat. Mivel ez teljes mértékben sohasem teljesül, a ténylegesen elvégezhető összehasonlítások a közvéleménykutatásokat a valóságnál némileg kedvezőtlenebb színben tüntetik fel. Ezt figyelembe véve még meglepőbb lehet az a tény, hogy sok ország számos választása esetében az előre jelzett eredmények csak igen kis mértékben tértek el a valódi eredményektől. Mivel a közvélemény-kutatások eredményeinek pontosságát (legalábbis közvetlenül elkészültük után) nem lehet megítélni, az egyetlen alkalmazható minőségi kritérium a kutatásban alkalmazott módszerekre vonatkozhat. Nem tudjuk, hogy milyen pontosak az eredmények, de tudjuk, hogy a megfelelően megválasztott módszerek jó eséllyel meglepően pontos eredményekre vezetnek, azaz több közvélemény-kutatás közül a nagy hibát eredményezők hányada kicsi. Azokat a módszereket, amelyeket a közvélemény-kutatás tervezése és végrehajtása során alkalmaztak, meg lehet ítélni, és megfelelő ismeretek birtokában jó képet alkothatunk az eredmények várható pontosságáról. A közvélemény-kutatások eredményeinek hibáját (azaz eltérésüket a valóságtól) kétféle oknak lehet betudni. A hibák egyik lehetséges fajtája azzal van kapcsolatban, hogy a közvélemény-kutatás nem a teljes népességnek, hanem csak egy részének, nevezetesen a mintába került embereknek a megkérdezésén alapul. Az ebből származó hibákat mintavételi hibának nevezik. A mintavételi hiba nagyságát úgy határozhatjuk meg, mint a közvélemény-kutatás eredményének az eltérését attól az eredménytől, amelyet akkor kapnánk, ha a vizsgált népességből mindenkit kikérdeznénk, méghozzá ugyanazokat az eszközöket (kérdőíveket, telefonos vagy személyes megkérdezést, kérdezőbiztosokat) használva, mint az adott közvélemény-kutatásban. Ennek a hibának a nagysága 5
1. Megismerhetőe a közvélemény? (Megbízhatóság és érvényesség) tehát kizárólag azon múlik, hogy a mintába került és ténylegesen megkérdezett emberek véleménye (amennyire az adott eszközökkel megtudható) mennyire tér el a teljes népesség véleményétől. Hangsúlyozzuk, hogy a mintavételi hiba nagysága nem kizárólag a jó mintaválasztáson (ez elméleti kérdés) múlik, hanem azon is, hogy a mintába választott személyeket milyen mértékben sikerül ténylegesen megkérdezni (ami gyakorlati kérdés). A hibák másik csoportja azáltal jön létre, hogy az emberek véleményét mindig csak korlátozott mértékben lehet megismerni egy kikérdezés során. Hiába kérjük a megkérdezettet: képzelje el, hogy most tartják a választásokat, és ezt feltételezve mondja meg, hogy kire szavazna; a megkérdezett jól tudja, hogy a választásokat nem most tartják, ő most valójában nem szavaz, hanem egy ettől jelentősen eltérő helyzetben van (nevezetesen a véleményét kérdezik, és ez a vélemény – összesített formában – hamarosan megjelenik az újságban vagy egy döntéshozó asztalán), és emiatt nem feltétlenül pont azt a pártot nevezi meg, amelyikre tervei szerint szavazni fog. Például – különösen a valódi választásoktól időben távol – üzenetet küld az aktuális kormánynak arról, hogy elégedett-e. Az azonban, ha a megkérdezett nem elégedett, még nem jelenti azt, hogy feltétlenül egy másik pártot választ majd, ha szavazásra kerül a sor. Azokat a hibákat, amelyek abból származnak, hogy a felhasznált módszerekkel a vizsgálat tárgyát nem lehet teljesen felderíteni (ami lehet a módszerek hibáinak vagy más körülményeknek a következménye), még akkor sem, ha az egész népességet kikérdezik, nem mintavételi hibának nevezik. A közvélemény-kutatás eredményeinek teljes hibája a mintavételi és nem mintavételi hibáknak az eredője, de ez nem feltétlenül jelent egyszerű összeadást. Néha a mintavételi és nem mintavételi hibák kioltják vagy csökkentik egymást, hiszen mindkét hiba lehet pozitív és negatív is abban az értelemben, hogy eredményünk a valódi értéknél lehet nagyobb (pozitív hiba) és lehet kisebb (negatív hiba) is. Mindenesetre a teljes hiba nem lehet nagyobb, mint a mintavételi és nem mintavételi hiba (abszolút értékének) összege. Ezért egy jó kutatásban mindkét hibafajtát csökkenteni kell. Ezeknek a hibáknak a nagysága – és ez különösen igaz a nem mintavételi hibára – többnyire nem kvantifikálható, ezért egy konkrét kutatás esetén a hiba nagysága nem állapítható meg. A kutatás végrehajtására olyan eljárásokat kell választani, amelyek ezeknek a hibáknak a nagyságát várhatóan csökkentik, és ez a legjobb biztosíték arra, hogy az eredmények várhatóan nem lesznek túl rosszak. A mintavételi és nem mintavételi hibák a közvélemény-kutatás megbízhatóságával és érvényességével vannak kapcsolatban. Egy közvélemény-kutatás annál megbízhatóbb, minél kevésbé esetleges az eredménye. Ez azt jelenti, hogy ha a vizsgálatot azonos módszereket alkalmazva megismételnék (a mintavételtől kezdve), akkor mennyire kapnának más eredményeket. Minél eltérőbbek lennének az ismétlés eredményei az eredetiektől, annál esetlegesebbeknek tekinthetőek az eredmények, annál kevésbé megbízhatóak. Némileg paradoxnak tűnhet az, hogy véletlen mintavételt alkalmazva azt kívánjuk, hogy az eredmények ne legyenek esetlegesek. Mi mást adhatna a véletlen mintavétel, mint a véletlentől függő, azaz esetleges eredményeket? Mint később látni fogjuk, a véletlen mintavétel – néhány egyszerű szabály betartása és kellően nagy mintanagyság esetén – éppenséggel nem ad jellemzően a véletlentől nagy mértékben függő eredményeket. Az eredmények csak kis mértékben fognak a véletlen hatásán múlni, 6
1. Megismerhetőe a közvélemény? (Megbízhatóság és érvényesség) és még ez a függés is jól kvantifikálható. Más (nem véletlen) mintaválasztási eljárások esetén ennek a függésnek a mértéke nem ismert. A véletlen mintavétel ismert megbízhatóságú eredményekre vezet. Természetesen, amikor egy eljárás megbízhatóságáról beszélünk, a (feltételezett) megismétlésnél feltesszük, hogy a valódi helyzet, amelyet a közvélemény-kutatással szeretnénk megismerni, nem változott. Ezt a valóságban ritkán hihetjük. Például két egymást követő közvélemény-kutatás eredményeinek eltérése egyaránt lehet a megbízhatóság alacsony mértékének és az időközben megváltozott véleményeknek a következménye. Következésképpen megismételt közvélemény-kutatások eredményeinek összehasonlításából nem lehet a kutatások megbízhatóságára következtetni. A közvélemény-kutatás eredményeinek érvényessége azt jelenti, hogy a kapott válaszok tényleg arra vonatkoznak, amiről a közvélemény-kutatás szól. Ha a közvélemény-kutatás célja a szavazópolgárok választási szándékainak előrejelzése, akkor ha a megkérdezettek ahelyett, hogy az általuk majdan választandó pártot megneveznék, válaszaikban a hatalmon lévő pártnak vagy az egyébként általuk megválasztani szándékolt pártnak a párt pillanatnyi politikáját megerősítő vagy ellenző üzeneteket küldenek, akkor a vizsgálat érvényessége kicsi, mert az eredmények nem arra vonatkoznak, mint amit a készítők várnak. Az emberek jelentős része szavazhat egy pártra anélkül, hogy annak politikájával teljesen egyetértene (ha más pártokéval még kevésbé ért egyet), de egy megkérdezés alkalmával adott válasza kifejezheti azt is, hogy egy éppen aktuális kérdéssel kapcsolatban egy másik párt álláspontját helyesli. Az érvényességet azonban nemcsak a közvélemény-kutatás készítői által nehezen befolyásolható szempontok csökkenthetik, hanem a feltett kérdések pontatlansága, nehéz értelmezhetősége vagy az esetlegesen sugallt válaszok is. Hasonlóan csökkenti a vizsgálat érvényességét, ha a kérdőív nem nehezíti meg azt, hogy a megkérdezett bizonyos tényekről a valóságnak nem megfelelő állításokat tegyen. Például stigmatizáló tényekről (például családon belüli erőszak vagy kábítószer-használat) az emberek nem szívesen számolnak be. Az őszinte válaszadást a kérdések megfogalmazásának (a stigmatizáló jelleg csökkentésével) meg kell könnyítenie, és ennek letagadását (kiegészítő kérdések feltevésével) meg kell nehezítenie. Természetesen mindez csak akkor hatásos, ha a kérdezőbiztos személyisége és viselkedése megkönnyíti az esetleg kellemetlen valóság feltárását. A közvélemény-kutatások megbízhatóságát és érvényességét a kutatás végzői által választott módszerek alapvetően befolyásolják. A mintavételi hibát csökkenteni, és ezzel a megbízhatóságot növelni elsősorban a gondos mintaválasztással, a megfelelő mintanagysággal, a minta minél nagyobb hányadának tényleges lekérdezésével lehet (a lekérdezés a szakzsargonban sikerrel végrehajtott megkérdezést jelent). A nem mintavételi hibát csökkenteni, és ezáltal az érvényességet növelni elsősorban a kérdezés helyes módjának megválasztásával, a kérdőív megfelelő szerkesztésével, a kérdezőbiztosok alapos kiképzésével és ellenőrzésével lehet. Ez a felsorolás csak vázlatosan tartalmazza a legfontosabb szempontokat. A kérdezés helyes módjának megválasztása például magában foglalja a döntést a kérdezés helyéről és idejéről és arról is, hogy az adatgyűjtést kérdezőbiztosok végezzék, vagy pedig úgynevezett önkitöltéses kérdőíveket használjanak; ha kérdezőbiztosokat alkalmaznak, az adatgyűjtés személyes megkeresésen alapuljon, vagy telefonon keresztül történjen, esetleg postán juttassák el a kérdőíveket a megkérdezettekhez (amely esetben természetesen nincsenek kérdezőbiztosok). Mindezen eldöntendő szempontokat a közvélemény7
1. Megismerhetőe a közvélemény? (Megbízhatóság és érvényesség) kutatás tervezőjének együttesen kell mérlegelnie, nem feledkezve meg az egyes módszerek költségés időigényéről sem. A cél adott költségkereten belül a legmegbízhatóbb és legérvényesebb adatok gyűjtése. Ezt az optimalizálási feladatot általában nem lehet teljesen egzaktul megoldani, és bár bizonyos választások egy adott esetben minden bizonnyal jobbak más választásoknál, a vizsgálat tervének kialakításakor a tapasztalatból származó intuícióra is szükség lehet. A fenti szempontok közül a közvélemény-kutatás megrendelője vagy eredményeinek olvasója néhányat könnyen megítélhet, és ebben a könyvben elsősorban ezekről lesz szó. A mintanagyságot, a mintaválasztás módját, a nemválaszolók arányát a legtöbb vizsgálatról szóló beszámoló közli. Ritkábban lehet olvasni a kérdőívben szereplő azon kérdésekről, amelyekkel megpróbálták kideríteni, hogy például a megkérdezett szándékozik-e szavazni (márpedig azok pártpreferenciái nem fogják befolyásolni a választások eredményeit, akik el sem mennek szavazni, és nem biztos, hogy azok, akik nem kívánnak szavazni, ezt előre meg is mondják). Arról pedig, hogy kik voltak a kérdezőbiztosok, milyen képzésen vettek részt, hogyan ellenőrizték a munkájukat, hogyan biztosították például azt, hogy nagyjából hasonlóan legyenek öltözve, vagy volt-e lényeges eltérés korban vagy képzettségben közöttük, szinte soha nem tudunk meg semmit. Egy jó közvélemény-kutatás (amelyről joggal remélhetjük, hogy hibája kicsi) nagy figyelmet fordít mindezekre a szempontokra. Egy jó közvélemény-kutatási beszámoló valamilyen szinten utal is ezekre a szempontokra. Ebből az is következik, hogy egy bizonyos terjedelem alatt nem lehet érdemben beszámolni egy közvélemény-kutatásról. A közvélemény-kutatás eredményei nem értékelhetők a módszerek ismerete nélkül, amelyekkel az eredmények születtek. A módszerek ismerete nélkül az eredményeknek sem a megbízhatósága sem az érvényessége nem ítélhető meg. Sőt, az eredmények egyáltalán nem értelmezhetőek azoknak a módszereknek az ismerete nélkül, amelyeknek alkalmazásával születtek. A magyar sajtóban kialakult gyakorlat (a közvéleménykutatások módszereinek rövid összefoglalása egy úgynevezett keretben) sokkal jobb, mint ha az olvasót az alkalmazott módszerekről egyáltalán nem tájékoztatnák. Ugyanakkor a szokásos tájékoztató méretek nem teszik lehetővé valamennyi szükséges információ közlését, még vázlatos formában sem. Pedig ez nagyon hasznos lenne, mivel a sajtóban megjelenő közlemények sok különböző módon végrehajtott, részleteikben erősen eltérő közvélemény-kutatásokon alapulnak. Egy – a valóságot némileg leegyszerűsítő – példaként tegyük fel, hogy a vizsgálat eredménye szerint egy pártra a szavazók 15%-a szavazna. Ez nem sokat jelent, ha nem tudjuk a következőket: az összes szavazásra jogosult, vagy pedig a valószínűleg valóban szavazók 15%-áról van-e szó; hogyan és mennyire pontosan állapították meg, hogy kik a valószínű szavazók és kik a valószínűleg nem szavazók (érvényesség); a minta nagyságától, a mintavétel módjától és egyéb szempontoktól függően mit várhatunk a mintában talált arány és az egész népességre jellemző arány eltérésének nagyságával kapcsolatban (megbízhatóság).
Összefoglalás Egy közvélemény-kutatás eredményeinek eltérése a valóságtól, azaz hibája, a mintavételi és a nem mintavételi hibákból ered. 8
1. Megismerhetőe a közvélemény? (Megbízhatóság és érvényesség) A mintavételi hibák a megbízhatóságot, a nem mintavételi hibák az érvényességet csökkentik. E hibák várható nagyságának csökkentésére számos módszer áll a közvélemény-kutatás készítőinek rendelkezésére. Egy jó közvélemény-kutatás él ezekkel a lehetőségekkel, és az alkalmazott módszerekről be is számol olyan részletesen, hogy érvényessége és megbízhatósága megítélhető legyen.
9
2. Kit képviselnek a megkérdezettek? (Reprezentativitás) A reprezentativitás a közvélemény-kutatások mintáinak legkívánatosabb tulajdonsága. Egyes közvélemény-kutató cégek azt állítják saját mintáikról, hogy azok „reprezentatívak”, mások csak annyit, hogy mintáik valamilyen szempontokból jól reprezentálják a vizsgálni kívánt sokaságot. Természetesen a közvélemény-kutatás céljaira egy olyan minta lenne a jó, amely a vizsgálni kívánt változó szerint reprezentatív. Ha például arra vagyunk kíváncsiak, hogy egy bizonyos politikai párt a szavazatok hány százalékát kapná, ha most tartanák a választásokat, akkor egy olyan minta lenne jó, amelyben a párt szavazóinak aránya megegyezik a párt szavazóinak a populációbeli arányával. Ha a párt az összes szavazat 14%-át kapná, akkor olyan mintára lenne szükségünk, amelyben a párt szavazóinak aránya szintén 14%. Ha például a közvélemény-kutatás 1000 fő megkérdezésén alapul, azaz a mintanagyság 1000, akkor egy olyan minta lenne jó számunkra, amelyben a párt szavazóinak száma 140. Ebből a mintából a párt szavazóinak arányára olyan becslést kapnánk (140/1000=14%), amely megegyezik a populációbeli értékkel. A vizsgált párt szavazóinak száma vagy aránya szempontjából ez a minta reprezentatív lenne, mert pontosan tükrözné a populációbeli arányokat. Sajnálatos módon azt sohasem tudhatjuk, hogy a mintánk a minket érdeklő szempontból reprezentatív-e. Ennek eldöntéséhez a mintában tapasztalt értéket össze kellene hasonlítani a populációra jellemző értékekkel. A populációra jellemző értékek azonban nem ismeretesek. Ha ezeket az értékeket ismernénk, például tudnánk egy párt szavazóinak arányát az összes szavazó között, akkor a vizsgálatra nem is lenne szükség. A közvélemény-kutatás mindig olyan témáról szól, amellyel kapcsolatban a lakosság álláspontja nem ismert kellő pontossággal, ezért az sem eldönthető, hogy a vizsgálat alapjául szolgáló minta reprezentatív-e. Más a helyzet olyan jellemzőkkel, amelyek a Központi Statisztikai Hivatal által gyűjtött adatok alapján jól ismertek. Ilyenek például a felnőtt népesség megoszlása nemek szerint, az iskolai végzettség különböző szintjei szerint vagy pedig a Budapesten, egyéb városokban, illetve községekben lakók aránya. Ezeknek az információknak a forrása a tízévenkénti népszámlálás és a közbülső időben végrehajtott úgynevezett mikrocenzus, amely ugyan nem teljes körű adatfelvétel, de még mindig olyan nagy mintán végzett és megbízható adatgyűjtés, amelynek eredményei a közvélemény-kutatások számára viszonyítási alapként szolgálhatnak. Ezen változók szempontjából a minta reprezentativitása ellenőrizhető és szerencsés esetben megállapítható (ha a mintabeli érték nem tér el nagymértékben a populációra jellemző értéktől). Könnyen előfordulhat, hogy a minta valamely szempontból reprezentatív, de egy más szempont szerint már nem az. Egy mintát akkor nevezhetnénk minden további nélkül reprezentatívnak, ha valamennyi, a vizsgálatban feltett kérdés szerint reprezentálná a teljes populációt. Azt, hogy a reprezentativitás teljesül-e, éppen a legfontosabb (a kutatás tárgyát képező) változók 10
2. Kit képviselnek a megkérdezettek? (Reprezentativitás) szempontjából lehetetlen ellenőrizni. Ezért ebben az általános értelemben reprezentatív mintáról nem beszélhetünk. A minta csak bizonyos változók szerint lehet reprezentatív. A vizsgálat tárgyát képező változó(k) szempontjából a reprezentativitás kérdése nem dönthető el. Ennek illusztrálására képzeljünk el egy egész pici országot, amelyben csak tíz szavazásra jogosult él (ez a populáció), közülük öt nő és öt férfi. Tegyük fel még azt is, hogy a választáson, amelynek eredményét szeretnénk előre jelezni, csak két párt indul, A és B. A nők közül egy szavaz az A pártra, a férfiak közül pedig 4, a többiek a B pártra szavaznak. Eszerint a lakosság fele az A pártra szavazna, a lakosság fele a B pártra. Ez a valóság. De milyen eredménnyel járna egy közvélemény-kutatás? Ennek illusztrálására feltesszük, hogy minden megkérdezett válaszol szavazási szándékát firtató kérdésünkre, a megkérdezettek pártpreferenciái léteznek, határozottak és őszintén is válaszolnak. A valóságban természetesen ezek közül a feltevések közül egyetlen sem teljesül, de most csak a minták lehetséges tulajdonságait vizsgáljuk, és az egyéb problémákat későbbi fejezetekben tárgyaljuk. Tegyük még fel, úgy döntünk, hogy a közvélemény-kutatást két fő megkérdezésére alapozzuk, azaz a mintanagyság kettő. Ki lehet számolni, hogy ebben az esetben negyvenöt darab különböző mintával találkozhatunk. (Bár annak belátása, hogy éppen 45 különböző minta lehetséges ebben az esetben, nem szükséges a továbbiak megértéséhez, bemutatjuk azt az egyszerű gondolatmenetet, amelyen ez az eredmény alapul: Válasszuk ki először az első személyt a mintába. Mivel a populációban 10-en vannak, a választás tízféle módon lehetséges. Akárkit választottunk is az első alkalommal, a második személy kiválasztására még 9 különböző lehetőség maradt, hiszen a 10 emberből egyet már kiválasztottunk. Így a két fő kiválasztására 10*9 = 90 lehetőség van. Ha azonban 90 lehetőségre gondolunk, akkor ebbe beleszámítottuk azt a mintavételt, amelynek során az első választás az x ember és a második választás az y ember, és egy másik mintavételként azt is, amelyben y az elsőként kiválasztott ember és x a másodszorra kiválasztott. Valójában ezek a választások ugyanarra a mintára vezettek, nevezetesen arra, amelyben x és y szerepel, függetlenül attól, hogy milyen sorrendben választottuk ki őket. Hasonlóan minden lehetséges mintát kétféle sorrendben választhatunk ki, és előbbi eredményünk, a 90, minden mintát kétszer tartalmaz. Tehát ténylegesen 90/2 = 45 különböző minta van. Megjegyezzük, hogy a későbbiekben ennél sokkal bonyolultabb számítások eredményeit közöljük majd, anélkül, hogy utalnánk azokra a módszerekre, ahogy a közölt eredményeket megkaphatjuk.) Az, hogy a 45 lehetséges minta közül éppen melyiket választjuk, véletlentől függő eljáráson alapul és nem befolyásolható. Az egész populáció és valamennyi lehetséges minta is egy úgynevezett 2×2-es táblázatba helyezhető. Ez a táblázat minden embert két szempontból csoportosít: a neme és a pártpreferenciája szerint. Ezekből a szempontokból az ország lakosságának megoszlását az 1. táblázat tartalmazza.
11
2. Kit képviselnek a megkérdezettek? (Reprezentativitás)
Az egyik lehetséges minta két férfiból áll, akik közül egy az A pártra, egy pedig a B pártra szavaz. A negyvenöt lehetséges mintából négy lesz ilyen, hiszen B-re szavazó férfi egy van és ehhez négyféleképpen választhatunk egy A-ra szavazót. Egy ilyen mintából a pártpreferenciát helyesen becsülnénk (mert a minta fele szavazna az A pártra), tehát a pártpreferencia szempontjából ez a minta reprezentatív. Ugyanakkor a minta nem reprezentatív a nemek szerinti eloszlás szempontjából, mert csupa férfiból áll. Ez utóbbi tényt meg tudnánk állapítani a mintának a népszámlálás adataival való összehasonlításából, az előbbit nem. Ez a minta tehát nem tűnik reprezentatívnak a nemek szerint, de ennek ellenére reprezentatív a pártpreferenciák szerint. Léteznek olyan minták is, amelyek csak a nemek szerinti megoszlást mutatják helyesen (például egy A-ra szavazó férfit és egy A-ra szavazó nőt tartalmaznak), valamint olyan minták, amelyek mindkét szempontból reprezentatívak vagy egyikből sem. Az összes minta besorolható ezen szempontok szerint. A 2. táblázat azt mutatja, hogy a 45 lehetséges minta hogyan oszlik meg a reprezentativitás szempontjából.
Azt látjuk, hogy a 45 lehetséges minta közül 17 olyan, amely a nemek és a pártpreferencia szerint is reprezentatív, további 8 a pártpreferencia szerint reprezentatív, a nemek szerint nem. Ezen minták bármelyikét választjuk is, a pártpreferenciák előrejelzése helyes lesz. Vannak 12
2. Kit képviselnek a megkérdezettek? (Reprezentativitás) tehát olyan minták, amelyek a pártpreferenciák pontos előrejelzésére kitűnően használhatóak, annak ellenére, hogy a nemek szerinti megoszlás szempontjából torzítanak. A pártpreferenciák pontos előrejelzésének nem feltétele az, hogy a minta pontosan tükrözze a populáció nemek szerinti megoszlását. Ugyanakkor azon 25 minta között, amelyek a nemek szerinti megoszlást pontosan reprezentálják, 8 olyan van, amely a pártpreferenciák szerint nem reprezentatív, azaz az ellenőrizhető reprezentativitás a nemek szerinti megoszlás szempontjából egyáltalán nem garantálja a reprezentativitást a pártpreferenciák szempontjából. Összefoglalóan megállapíthatjuk, hogy egy ellenőrizhető szempont (nemek) szerinti megoszlásnak a pontos vagy pontatlan volta a mintában nem garantálja, hogy a minta a vizsgálat célja (pártpreferencia) szerint reprezentatív. Ezért azok a mintavételi eljárások, amelyek csak arra ügyelnek, hogy a mintában bizonyos társadalmi csoportok a populációbeli arányuknak megfelelően szerepeljenek (természetesen itt csak ellenőrizhető szempontokról lehet szó), de ezen belül a kérdezőbiztosokra bízzák a megkérdezettek kiválasztását, nem megfelelőek. Az ilyen eljárásokat kvótás mintavételnek nevezik. Ezek olyan mintákat eredményeznek, amelyek néhány ellenőrizhető szempontból reprezentatívak, de ez nem jelent biztosítékot arra nézve, hogy a vizsgálat tárgyát képező szempontból is reprezentatívak lennének. A valóságban a kvótás mintavételi eljárások rosszabb eredményeket adnak, mint azt a fentiek alapján hihetnénk. Gyakran lényeges torzításokhoz vezet az, hogy a kérdezőbiztosok a megadott kereteken belül maguk választják ki a megkérdezetteket. Ez azért van így, mert a kérdezőbiztosoknak könnyebb megkérdezniük bizonyos csoportok tagjait, mint másokat. A kérdezőbiztosok gyakran saját környezetükből választják ki a megkérdezetteket kvótás mintavétel esetén, ami torzításokhoz vezethet. Vagy például könnyen feltételezhető, hogy a rendszerint fiatal kérdezőbiztosok minden társadalmi csoportból a „fiatalosabbakat” fogják előnyben részesíteni, aminek egy politikai közvélemény-kutatás esetén jelentős torzító hatása lehet. A kvótás mintavétel tehát annak ellenére, hogy bizonyos ellenőrizhető szempontokból biztosítja a minta reprezentativitását, a vizsgálat tárgyát képező szempontokból gyakran torz mintához vezet. Ez a torzítás a körülményektől függően többé vagy kevésbé fontos. Ha csak arra vagyunk kíváncsiak hogy ki nyeri a választásokat, és az egyik párt lényegesen népszerűbb, mint bármely másik párt, akkor a választások eredményét kissé torz minta alapján is pontosan előre jelezhetjük. Ha azonban az eredmény szoros, akkor már egy kissé torz minta alapján is tévedhetünk. Ezért kvótás mintavételt ma már általában nem használnak. A kvótás mintavételi eljárás hiányossága úgy is megfogalmazható, hogy a kérdezőbiztosok által preferált társadalmi csoportok nagyobb mértékben kerülnek a mintába, mint az egyéb csoportok, még akkor is, ha a csoportképző szempontok egy része – az előírt kvóta miatt – nem is torzul. Ezt úgy lehet kiküszöbölni, hogy a populáció minden tagjának egyforma esélyt adunk a mintába kerülésre. Az ezen az elven alapuló mintavételi eljárásokat véletlen mintavételnek nevezik. A véletlen mintavétel legegyszerűbb formája egy olyan listát használ fel, amely a populáció minden egyedét tartalmazza. Közvélemény-kutatásoknál a vizsgált populáció emberekből áll, például a 13
2. Kit képviselnek a megkérdezettek? (Reprezentativitás) budapesti hajléktalanokból, ha azt szeretnénk megtudni, hogy mennyire elégedettek bizonyos szociális ellátásokkal, vagy az összes szavazásra jogosultból egy választási előrejelzésnél, vagy a város egy bizonyos területének összes lakójából, ha a buszmegálló kívánatos elhelyezésének felderítése a cél, vagy egy iskola tanulóiból, ha a legnépszerűbb tanárt akarjuk kiválasztani. Ezekben az esetekben a teljes populációt felsoroló lista előállítása különböző (az előbbi felsorolásban csökkenő) mértékben nehéz feladat. Az egyszerű véletlen mintavétel a populáció minden tagjának ugyanakkora esélyt ad a mintába kerülésre. Ha a minta nagysága előre rögzített és a populáció nagysága is ismert, akkor egy személy bekerülési valószínűsége e két szám hányadosa. Ha teljes listával rendelkezünk a populációról, akkor az egyszerű véletlen mintavételt úgy képzelhetjük el, hogy a populáció minden tagjának a nevét felírjuk egy papírlapra, ezeket belehelyezzük egy nagy dobozba, jól megkeverjük a cédulákat, és addig húzunk ki neveket (a már kihúzottak visszatevése nélkül), amíg el nem érjük a kívánt mintanagyságot. Ez a mintavételi eljárás azt is eredményezi, hogy rögzített mintanagyság mellett az összes lehetséges ekkora méretű minta azonos valószínűséggel kerül kiválasztásra. A korábbi példában szereplő tíz fős populáció esetén az egyszerű véletlen mintavételt úgy hajtanánk végre (kételemű mintákkal), hogy előbb kiválasztanánk egy személyt a tízből, és utána még egyet a fennmaradó kilencből. A mintába kerülő személyek kiválasztásánál azonban semmilyen szubjektív tényező nem játszhatna szerepet, kizárólag a pártatlan véletlen. Mint említettük, ebben az esetben 45 különböző kételemű minta lehetséges, és ezek mindegyike ugyanakkora valószínűséggel kerülne kiválasztásra. Ez azt jelenti, hogy ha például kilencezerszer vennénk mintát ebből a populációból, akkor várhatóan valamennyi mintát nagyjából kétszáz alkalommal választanánk. Mit nyerünk, és mit veszítünk a véletlen mintavétel alkalmazásával? Az egyik veszteség az, hogy véletlen mintavétel esetén nincs garancia arra, hogy a kapott minta bármilyen fontos jellemző szerint reprezentatív legyen. Előfordulhat, hogy a minta torz még olyan alapvető szempontból is, mint a nemek szerinti megoszlás. További veszteségnek tűnhet az, hogy a véletlen mintavétel eredménye felett nem gyakorlunk kontrollt, „ki vagyunk szolgáltatva a véletlennek”. A véletlennek való kiszolgáltatottság azonban nem is olyan rossz. Mindenesetre sokkal jobb, mint ha a kérdezőbiztosok vagy a vizsgálat egyéb résztvevőinek önkéntelen preferenciái befolyásolnák a minta összetételét. A véletlen pártatlan és – legalábbis hosszú távon – kiegyensúlyozott mintaválasztást eredményez. Semmilyen mintavételi eljárás esetén sem tudjuk megmondani, hogy az aktuális minta reprezentatív-e a vizsgálandó szempontokból. Véletlen mintavétel esetén azt remélhetjük, hogy ez a reprezentativitás – hosszú távon és átlagosan – teljesül. Az előző példánkban szereplő negyvenöt különböző kételemű minta közül huszonöt reprezentatív volt, azaz azt mutatják, hogy a szavazók fele az A pártra, másik fele pedig a B pártra szavaz. A fennmaradó húsz minta közül tízben mindenki az A pártra szavazna, tízben pedig mindenki a B pártra. Ha az összes mintából számítanánk ki az A pártra szavazók arányát, ötven százalékot kapnánk, hiszen (25*50%+10*100%+10*0%)/(25+10+10)=50%. Ebből az is következik, hogy véletlen mintavétel esetén a mintából az A párt szavazóira kapható becslések átlaga a mintavételi 14
2. Kit képviselnek a megkérdezettek? (Reprezentativitás) és becslési eljárás sokszori alkalmazása után szintén 50% lesz. Átlagosan tehát helyesen fogjuk megbecsülni a két párt szavazóinak arányát. Természetesen ez nem jelenti azt, hogy véletlen mintavétel esetén minden minta alapján pontos becslést adnánk. Azonban olyan mintát, amely alapján a becslés nagyon rossz lenne, ritkán kapunk. Kicsit pontosabban: minél jobban eltér egy mintában az A párt szavazóinak aránya a teljes népességen belüli arányuktól, annál kisebb valószínűséggel, annál ritkábban fogjuk ezt a mintát megfigyelni. Az a tendencia, hogy rossz becslést adó mintákat csak ritkán fogunk megfigyelni, sokkal erősebb, mint azt gondolnánk. Ha például a párt szavazóinak aránya a népességben 50%, a mintanagyság pedig 2500, akkor az összes lehetséges minta 68%-a annyira jó, hogy a párt szavazóinak aránya a mintában (és ezzel együtt a populációbeli arányukra vonatkozó becslésünk) 49% és 51% között lesz. Az összes 2500 személyt tartalmazó mintáknak a fennmaradó nagyjából egyharmad része egyformán oszlik meg olyan minták között, amelyekben a párt szavazóinak aránya több, mint 51%, és olyan minták között, amelyekben a párt szavazóinak aránya kisebb, mint 49 %. Más szavakkal: ha véletlenszerűen választunk egy 2500 elemű mintát, akkor az eseteknek több mint kétharmad részében a mintánk annyira jó lesz, hogy a párt szavazóinak arányát illetően a mintára és a populációra jellemző értékek eltérése kisebb, mint 1 százalékpont, és csak a mintáknak kevesebb, mint egy harmada fog olyan becslést adni, amelynek hibája nagyobb, mint 1 százalékpont. Ezek az eredmények a véletlen mintákra vonatkozó matematikai megfontolásokból származnak. Ezeknek a jó tulajdonságoknak a teljesüléséhez nem kell mást tenni, mint a véletlen mintaválasztás szabályait betartani, és akkor „automatikusan” teljesülnek. Ugyanebben a helyzetben azon minták aránya, amelyekből a párt szavazóinak arányát 48% és 52% közé tennénk, 95% lenne, azaz húsz minta közül tizenkilenc esetében legfeljebb két százalékpontot tévednénk. Azon minták aránya, amelyben legfeljebb három százalékpontot tévednénk, azaz a pártra szavazók becsült aránya 47% és 53% között lenne, az összes lehetséges minták 99,7%-a. Ez azt jelenti, hogy 300 mintaválasztás közül mindössze egy lenne – várhatóan – annyira balszerencsés, hogy három százalékpontnál nagyobb hibát vétsünk. Tehát a véletlen mintavételen alapuló eljárások nagy biztonsággal olyan mintákat eredményeznek, amelyekből egy párt szavazóinak arányát kis hibával meg lehet becsülni. Természeten a fenti eredmények matematikaiak, és csak megszorítással alkalmazhatóak a valóságra. Azt kell feltennünk, hogy a népességben mindenkinek van határozott pártpreferenciája, a mintát valóban egyszerű véletlen mintavétellel választották ki, mindenki válaszolt, aki eredetileg a mintába került, és mindenki őszintén válaszolt. Ezen szempontok közül valamennyi szerint jónak kell lennie a közvélemény-kutatásnak ahhoz, hogy a fenti – igen kedvező – eredmények a pontosságra vonatkozóan akár csak közelítőleg is igazak legyenek. Ez azt mutatja, hogy egy közvéleménykutatás minőségének és ezen keresztül az eredmények érvényességének és megbízhatóságának a megítéléséhez számos részlettel kell tisztában lennünk.
15
2. Kit képviselnek a megkérdezettek? (Reprezentativitás)
Összefoglalás A véletlen mintavétel átlagosan pontos és megfelelő mintanagyság mellett az esetek többségében egyedileg is igen pontos becsléseket tesz lehetővé. A véletlen minták az esetek többségében jól reprezentálják a népességet a vizsgált szempontból; ennek nem feltétele az, hogy a minta valamely ellenőrizhető szempontból reprezentatív legyen. Azt, hogy egy minta jó-e, nem lehet eldönteni. Egy mintát akkor tekintünk jónak, ha helyes módszerrel választották. Ne higgyünk azoknak a közvélemény-kutatásoknak, amelyek készítői azt állítják, hogy mintájuk „reprezentatív”. Ezek a kutatók összekeverik vágyaikat a tényekkel.
16
3. Hány embert kell megkérdezni? (Mintanagyság) Minél nagyobb a minta, annál megbízhatóbbak az eredmények. Ezt mindenki tudni véli, bár nem biztos, hogy mindenki ugyanazt érti ezen az állításon. Mielőtt azonban megkeresnénk azt a jelentést, amely helyes, emlékezzünk a Literary Digest kudarcára. Ha egy mintát rossz módon választanak, a nagyobb létszám nem segít. Ez ugyanis csak nagyobb léptékben lesz rossz. Tehát a nagy mintalétszám csak akkor kívánatos, ha egyébként a mintát helyesen választották. A minta nagy voltának egyik szokásos értelmezése az, hogy a minta elemszáma nagy. Annak megállapításához, hogy a minta elég nagy-e ebben az értelemben, olyan kritériumokat kellene felállítani, amelyeket bármilyen populáció esetén alkalmazhatunk. A másik szokásos értelmezés az, hogy a minta a vizsgált sokaságnak nagy hányadát képviseli. Annak eldöntéséhez, hogy egy ilyen típusú kritérium teljesül-e, ismerni kell a vizsgált populáció létszámát. Sok esetben ez a létszám nem ismert (gondoljunk csak a hajléktalanok véleményével foglalkozó vizsgálatra). Az, hogy a minta milyen mértékben közelíti az egész népességet, sok tényezőtől függ, de matematikai szempontból lényegében csak háromtól: a populáció becsülni kívánt jellemzőjétől, a mintavétel módjától és a minta elemszámától. A populáció becsülni kívánt jellemzője lehet egy arányszám, melyet gyakran százalékos formában fejezünk ki (például egy pártra adott szavazatok aránya az összes szavazaton belül) vagy egy átlag (például egy politikus rokonszenv-osztályzatainak átlaga). Első látásra úgy tűnhet, hogy ez a két eset nem különbözhet nagyon: az arány is egy átlag. Ennek belátásához arra az egyszerű trükkre van szükség, hogy a párt szavazóihoz rendeljük az 1 értéket, azokhoz pedig, akik nem erre a pártra szavaznának, rendeljük a 0-t. Így minden megfigyelést egy értékkel jellemzünk, és ezeknek összege éppen a vizsgált párt szavazóinak száma. A keresett arány ez az érték osztva a minta teljes elemszámával. De ha egy összeget (a 0-k és 1-ek összegét) elosztjuk a tagok számával, az átlagot kapjuk. Ezért a párt szavazóinak aránya a mintában a megfigyelt 0-k és 1-ek átlaga lesz. E könnyű azonosíthatóság ellenére a két eset eltérő. Feltéve, hogy a párt szavazóinak népességbeli arányát ismerjük, a szavazóknak a különböző mintákban vett számát vagy arányát illetően hasznos állításokat tehetünk pusztán ezt az információt felhasználva. Az átlagos rokonszenv osztályzat esetében a különböző mintákban megfigyelt értékek eloszlása a népességbeli átlagon túlmenően még mástól is függ. Ennek a különbségnek az az oka, hogy ha a szavazóknak a populációbeli aránya adott, például, ha egy nyolcmilliós népességben a párt szavazóinak aránya 15%, akkor ez – természetesen – csak úgy fordulhat elő, hogy a népességben egymillió-kétszázezren erre a pártra szavaznak és hatmillió-nyolcszázezren nem erre a pártra szavaznak. Tehát a minket érdeklő jellemző ebben az esetben meghatározza az egész populációt jellemző viszonyokat. Ezzel szemben, ha egy politikus rokonszenv-átlaga 4, akkor ez úgy is előfordulhat, hogy a népesség fele hármas, fele pedig ötös osztályzatot ad, vagy úgy, hogy a népesség kétharmada ötös, egyharmada pedig 17
3. Hány embert kell megkérdezni? (Mintanagyság)
kettes osztályzatot. Tehát ebben az esetben a minket érdeklő jellemző nem határozza meg az egész népesség értékeit. Emiatt a minták jó vagy rossz voltának mértékét nemcsak az a tény határozza meg, hogy a népesség átlagos osztályzata négyes, hanem az is, hogy milyen osztályzatokból jön össze ez a négyes. Ha például a népességben mindenki négyes osztályzatot ad, akkor ezt minden minta híven tükrözi, de ha a népesség fele hármas, fele ötös osztályzatot ad, akkor lesznek jobb és rosszabb minták (amelyek többé vagy kevésbé pontosan tükrözik ezt). A mintavétel módját most csak idealizált, matematikai szemszögből tárgyaljuk. Később lesz szó azokról a mintavételi eljárásokról, amelyek a gyakorlatban is kivitelezhetők, és elméleti szempontból is kielégítő eredményeket adnak. Az egyszerű véletlen mintavétel technikailag pontos jelentése az, hogy a vizsgálandó népességből a mintába kerülőket egymás után választjuk, egyik választás sem függ az előző eredményétől, és minden húzás alkalmával a vizsgálandó népesség minden (addig ki nem választott) tagjának egyforma esélye van a mintába kerülésre. A mintavételi módszerek aszerint is csoportosíthatók, hogy a mintavétel visszatevéssel vagy anélkül történik. Ennek a különbségnek a megértéséhez tegyük fel, hogy a vizsgálandó népesség minden egyedének a neve fel van írva egy cédulára, ezek a cédulák egy dobozba vannak elhelyezve, és alapos keverés után kihúzzuk az első mintába került személy nevét. Visszatevés nélküli mintavétel esetén ezután újra keverünk, és utána kihúzzuk a második nevet. Visszatevéses mintavétel esetén az első nevet tartalmazó cédulát visszatesszük, mielőtt újra kevernénk és húznánk. Ez azt jelenti, hogy visszatevéses mintavételnél, legalábbis elvileg, fennáll annak a lehetősége, hogy ugyanazt a személyt kétszer válasszuk. Ezért közvélemény-kutatásnál sohasem alkalmaznak visszatevéses mintavételt. Értelmetlen lenne ugyanazt a személyt kétszer is megkérdezni. Visszatevéses és visszatevés nélküli mintavétel esetén a keletkező minták statisztikai viselkedése némileg eltér. Ez az eltérés annál kisebb, minél kisebb hányada a mintanagyság a populáció méretének. Ha a populáció nagy a mintához képest, akkor ugyanazon személy kétszeri mintába kerülésének a valószínűsége kicsi, és ezért a visszatevéses és visszatevés nélküli mintavétel közötti különbség is kicsi. Egy olyan közvélemény-kutatásban, ahol egy többmilliós népességet egy néhány ezres minta alapján vizsgálunk, a kétféle mintavétel közötti különbség elhanyagolható, ezért a továbbiakban ezzel nem is foglalkozunk. A minta elemszámának a növelése ténylegesen csökkenti a népességbeli érték és a megfelelő mintabeli érték várható eltérését. Ebben az értelemben a nagyobb minta jobb. Mindaddig, amíg az előző bekezdésben tett feltevés (hogy a mintanagyság kicsi a populáció nagyságához képest) igaz, a minta relatív nagysága (a mintaelemszám és a populáció nagyságának hányadosa) nem befolyásolja a mintából nyerhető becslés jóságát, ez csak a minta elemszámától függ. A 3–7. táblázatok ezt a függést illusztrálják. Különböző mintanagyságokra és különböző valós, a népességre jellemző értékekre azt mutatják, hogy különféle bizonyossággal mekkora eltérést várhatunk a becsült értékek és a valódi értékek között.
18
3. Hány embert kell megkérdezni? (Mintanagyság)
19
3. Hány embert kell megkérdezni? (Mintanagyság)
20
3. Hány embert kell megkérdezni? (Mintanagyság)
21
3. Hány embert kell megkérdezni? (Mintanagyság)
22
3. Hány embert kell megkérdezni? (Mintanagyság)
Ezekben a táblázatokban az látható, hogy különböző valós (tehát az egész népességre vonatkozó) értékek esetén, 100, 500, 1000, 2000 és 3000 nagyságú minták esetén a mintából becsült érték várhatóan mekkora lesz. A táblázatok megadják azt, hogy 99%-os, 95%-os, 90%-os és 75%os bizonyossággal a becsült értékek milyen intervallumokban helyezkednek el. Ha például a populációban az érték 20%, akkor egy 2000 nagyságú mintát használva, a mintából becsült érték 95%-os valószínűséggel 18,2% és 21,8% között lesz. Ez azt jelenti, hogy ha egy közvéleménykutató cég működése során ugyanabból a népességből többször választ azonos véletlen módszerrel 2000 elemű mintát, akkor várhatóan húsz alkalom közül tizenkilencszer a becslése nem fog jobban eltérni a valódi 20%-tól, mint 1,8%. A 2000 elemű mintákra vonatkozó táblázat azt is mutatja, hogy a mintából becsült érték 99%-os valószínűséggel, azaz várhatóan 100 eset közül 99-szer, 17,7% és 22,3% között lesz, ha a valódi érték 20%. Azonos mintanagyságon belül, az 50%-hoz közelebbi értékeket kissé kisebb pontossággal lehet eltalálni, mint az attól távolabb levőket. A mintanagyság növelésével a becslés várható pontossága nő. Egy 3000 főt tartalmazó minta esetén, akármi is a populációban érvényes arány, ezt húsz esetből tizenkilencben kevesebb, mint két százalékpontnyi hibával megtudhatjuk, sőt 99%-os biztonsággal a hiba kevesebb lesz, mint két és fél százalékpont. (Bár a mindennapi beszédben ez nincs feltétlenül így, a százalék és százalékpont 23
3. Hány embert kell megkérdezni? (Mintanagyság)
kifejezések eltérő jelentésűek. Ha a valódi arány 50% és becslésünk hibája nem több mint 10 százalék, akkor a becsült érték 45% és 55% között lesz. A 10 százalékpontnyi hiba pedig 40% és 60% közötti becslést jelent. A százalékpont tehát az egész bizonyos százalékát jelenti anélkül, hogy erre külön utalnánk, a százalék pedig egy másik, az adott szövegkörnyezetben definiálandó mennyiség százalékát.) A táblázatok alkalmasak arra is, hogy bennük nem szereplő értékekre vonjunk le következtetéseket. Például, ha a valódi érték 23%, a mintanagyság pedig 2000, akkor a megfelelő táblázatból kiolvashatjuk, hogy 20%-os arány esetén a 95%-os biztonsághoz legfeljebb 1,8%-os hiba tartozik, 30%-os arány esetén pedig ugyanehhez a megbízhatósághoz legfeljebb 2%-os hiba. Ezért 23%-os valódi arányhoz és 95%-os megbízhatósághoz a hiba nagyjából 1,9%-os lehet. Hasonló, úgynevezett interpoláció végezhető, ha itt nem bemutatott mintanagyság esetére akarunk hibahatárokat megállapítani. A fenti táblázatokból kiolvasható pontosságok helyes értelmezéséhez azt is figyelembe kell venni, hogy a megadott határok között a tényleges becslések nem egyenletesen oszlanak meg, hanem kisebb hibájú becsléseket gyakrabban fogunk megfigyelni. Például egy 1000 fős minta esetén, ha a valódi arány, amelyet szeretnénk a felmérésből megbecsülni, 40%, akkor az esetek 99%-ában a minta alapján becsült érték 36% és 44% között lesz. Ugyanakkor a minták 90%-ában a becsült érték 37,5% és 42,5% között lesz. Ebből az következik, hogy a 36% és 37,5%, illetve a 42,5% és 44% közötti becslések aránya csak 9%. Más szavakkal, a becslések 99%-a egy 8 százalékpont hosszúságú intervallumban lesz (36% és 44% között), de ezek közül csak 9% lesz az intervallum két szélén lévő összesen 3 százalékpont méretű tartományban (36% és 37,5% között, illetve 42,5% és 44% között), és 90% az intervallum középső, 5 százalékpont méretű részén (37,5% és 42,5% között) lesz. Sőt, még ez utóbbi intervallumon belül is a kisebb hibájú becslések jellemzőbbek, mint a nagy hibájúak, hiszen a becslések 75%-a 38,2% és 41,8% között lesz. A táblázatok egy további felhasználása az, ha egy közvélemény-kutatásból rendelkezésünkre áll egy becsült érték, és arra vagyunk kíváncsiak, hogy a népességre jellemző értékről mit mondhatunk ennek alapján. Ebben az esetben megnézzük, hogy ha a becsült érték lenne a valódi érték, akkor adott biztonsággal, például 95%-os valószínűséggel, mekkora lenne a hiba. Ha a mintanagyság 2000 és a becsült érték a minta alapján 20%, akkor jó közelítéssel azt mondhatjuk, hogy a táblázatból kiolvasható intervallum (18,2%– 21,8%) olyan eljárással keletkezett, amely az esetek 95%-ában tartalmazza a valódi arányt. Ezt úgy fejezzük ki, hogy az ehhez az intervallumhoz tartozó megbízhatósági szint 95%. A megbízhatósági szint és a valószínűség egymással rokon, de határozottan eltérő fogalom. Értelmetlen lenne az állítás, hogy a 18,2%–21,8% intervallum 95%-os valószínűséggel tartalmazza a valódi értéket. A valószínűség fogalmát csak véletlen jelenségekkel kapcsolatban használhatjuk. A valódi érték nem véletlen mennyiség, hanem rögzített, bár előttünk ismeretlen. A szóban forgó intervallum szintén nem véletlen, miután a 20%-ot már megfigyeltük. Ennek megfigyelése előtt az intervallum előre pontosan nem meghatározható helyzetű, tehát véletlen, hiszen csak annyit tudunk, hogy az intervallum végpontjai a mintából származó becslés értékénél 1,8 százalékponttal kisebb, illetve annyival nagyobb számok lesznek. A megfigyelés után azonban a véletlen jelleg elvész. Ezért az a helyes állítás, hogy a 18,2%–21,8%-ig terjedő 24
3. Hány embert kell megkérdezni? (Mintanagyság)
intervallum egy olyan eljárás eredménye, amely az esetek 95%-ában olyan intervallumot ad, amely tartalmazza a valódi értéket. A közvélemény-kutatások eredményeinek publikálásakor a fenti táblázatokban közölt információkra általában az úgynevezett hibahatár megadásával utalnak. Ennek szokásos formája az, hogy a hibahatár például +/–3%. Néha azt közlik, hogy a hibahatár a vizsgált jellemző valódi értékétől függően legfeljebb három százalékpont. A megadott hibahatár jelentése az, hogy ha egy bizonyos tulajdonság a vizsgált népesség felére volna jellemző, akkor ezt az adott mintanagyság mellett a vizsgálatok 95%-ában ekkora pontossággal meg tudnánk becsülni, tehát a becslésünk 47% és 53% között lenne. Mint a táblázatokból láttuk, azonos valószínűségi szint mellett az 50% eltalálásához kapcsolódó hiba a legnagyobb, és erre utal az a kitétel, hogy a hibahatár legfeljebb az adott érték. Más valódi arányokhoz – azonos valószínűségi szinten – ennél kisebb hiba tartozik. Azt is látjuk a táblázatokból, hogy a rögzített valószínűséghez tartozó hibahatár csak a mintanagyságtól függ. A 8. táblázat az ebben az értelemben vett maximális hibahatárt adja meg különböző mintanagyságokra. Ne feledjük, ez csak annyit jelent, hogy az esetek 95%ában várhatóan ennél nem nagyobb az eltérés a valódi és a becsült érték között. A hibahatár semmiképpen sem értelmezhető úgy, mint a hiba lehetséges legnagyobb értéke. A véletlen mintavétel következtében a hiba nagyságára vonatkozóan csak valószínűségi állításokat tehetünk (megjegyezzük, hogy nem véletlen mintavétel esetén még ilyeneket sem tehetünk), és a hibahatár kifejezésnek nem valószínűségi értelmezése az alapvető közvélemény-kutatási ismeretek hiányáról árulkodik.
25
3. Hány embert kell megkérdezni? (Mintanagyság)
Az ebben a táblázatban közölt hibahatárok a „hibahatárnál nem nagyobb a hiba az esetek 95%ában” szabályon túlmenően még egyéb megbízhatósági állításokat is lehetővé tesznek. A hibahatár felénél nem lesz nagyobb a hiba a minták 68%-ában, és a hibahatár másfélszeresénél nem lesz nagyobb a hiba a minták 99,7%-ában. A mintanagyság szerepének megítélésében a 68%, 95%, 99,7% szabály ismerete a legfontosabb, ezek a leglényegesebb mutatószámok arra nézve, hogy egy mintától milyen pontosságú becsléseket várhatunk. Az összes lehetséges adott elemszámú mintának ekkora hányada ad rendre a valódi értéktől a hibahatár felénél, a hibahatárnál, illetve másfél hibahatárnál kevésbé eltérő becslést. Természetesen a legfeljebb 1 hibahatárnyit eltérő minták egyúttal másfél hibahatárnyinál is kisebb eltérésűek, és a legfeljebb 1 hibahatárnyi hibájú minták is szerepelnek a másfél hibahatárnál kisebb eltérésű minták között, így kapjuk az egyre növekvő hányadokat. A hibahatár a mintanagyságtól függ, és amint azt a fenti táblázat mutatja, 2500 elemszámú mintáknál éppen két százalékpont; ennél kisebb létszámú mintáknál ennél nagyobb a hibahatár, ennél nagyobb elemszámú minták esetén pedig ennél kisebb. Ha tehát a mintanagyság legalább 2500, akkor a minták 95%-a, azaz húsz minta közül várhatóan tizenkilenc a valóságos értéktől nem fog két százalékpontnál jobban eltérni. Ha a mintanagyság 1000, akkor húsz mintából tizenkilenc várhatóan annyira jó, hogy a becsült érték és a valódi érték eltérése nem több, mint 3,2% (ahol a % pontos jelentése százalékpont). 26
3. Hány embert kell megkérdezni? (Mintanagyság)
A fenti táblázatokban közölt értékek a becslés hibájának csak egyetlen komponensére vonatkoznak. Ez a komponens abból származik, hogy véletlen mintavételt alkalmaztunk. Ha a vizsgált populáció mérete sokkal nagyobb, mint a mintanagyság, akkor a véletlen hiba nagyságát kiolvashatjuk a táblázatokból. Az előrejelzések hibájának másik két összetevője abból származik, hogy egyrészt a mintaválasztás gyakorlati módja (lásd a következő fejezetet) eltér az itt feltételezett ideálistól, másrészt pedig a megkérdezettek közül nem mindenkinek van határozott álláspontja a vizsgált kérdésről, vagy nem is válaszol. Azt a pontatlanságot, amelyet e két tényező okoz, nem lehet könnyen kvantifikálni, de nehéz elképzelni, hogy egy-két százaléknál kisebb lenne. Ezért a közvélemény-kutatások mintáját nem érdemes túl nagyra választani, a 3000-nél nagyobb mintanagyság semmiképpen sem tűnik indokoltnak: a gyakorlati mintavételből és a nemválaszolókból, valamint a bizonytalankodókból származó hibák ekkor már dominánssá válnak. Ha a vizsgálatra annyi pénz is rendelkezésre áll, hogy akár négy- vagy ötezer embert is meg lehetne kérdezni, akkor jobb ennek a pénznek egy részét a válaszhiány csökkentésére és a valódi véleménnyel rendelkezőknek az elkülönítésére fordítani. Így még egy viszonylag kisebb mintán alapuló közvélemény-kutatás is megbízhatóbb lehet. Abban az esetben, ha nem csak egyszerűen százalékos arányokat (például különböző pártok szavazóinak arányát) akarjuk megbecsülni a minta alapján, hanem más, összetettebb jellemzőket is, illetve ha bizonyos szempontok közötti összefüggésekre is kíváncsiak vagyunk, akkor a fent javasoltnál nagyobb létszámú minták is szükségesek lehetnek, mert a hibahatár – a most tárgyalt tényezőkön túlmenően – még attól is függ, hogy mit kívánunk becsülni. Ennek a kérdésnek a részletes tárgyalására később visszatérünk. Az ebben a fejezetben leírt szabályok egy egyszerű arány becslésére vonatkoznak.
Összefoglalás Egyszerű véletlen mintavétel esetén már néhány ezres minta is nagy valószínűséggel egy-két százalékpontos pontossággal teszi lehetővé a népességen belüli arányok becslését. A más okból származó hibák ennél feltehetőleg nagyobbak. Ne költsük pénzünket öt- vagy tízezres mintanagyságú közvélemény-kutatásra, mert a becslések pontatlansága sokkal nagyobb lesz, mint amit a mintanagyságra alapozó képletek alapján várnánk. Ha a deklarált mintanagyságnak nem felel meg a közölt hibahatár, akkor valószínűleg sok a válaszhiány, ami erősen csökkenti az eredmények általánosíthatóságát.
27
4. Hogyan választják ki a megkérdezetteket? (Mintavétel) Az előző fejezetekben láttuk, hogy egy egy- vagy kétezer embert tartalmazó mintából a mintavételi hiba szempontjából már igen jó becsléseket kaphatunk a vizsgált népesség jellemzőire nézve. Ezek az eredmények azonban csak akkor igazak, ha a minta kiválasztása bizonyos alapelvek pontos betartásával történt. Ezeknek a mintaválasztási elveknek nem megfelelő minták esetén nem csak a korábban bemutatott megbízhatósági eredmények nem igazak, de az is könnyen előfordulhat, hogy nincs mód a mintából származó becslések megbízhatóságának megítélésére. Ezért egy közvélemény-kutatás eredményeinek megfelelő értékeléséhez elengedhetetlen a mintaválasztás módjának pontos ismerete. A közvélemény-kutatásokhoz felhasznált minták általában egy kompromisszum eredményeként jönnek létre, amelyben egyrészről az optimális mintaválasztás elmélete, másrészről pedig gyakorlati szempontok játszanak szerepet. Hangsúlyozni kell, hogy ebben a fejezetben csak a közvélemény-kutatás céljaira kiválasztott mintáról lesz szó, és nem azokról a személyekről, akiket ténylegesen megkérdeztek. Általában nem sikerül a mintába került minden személyt megkérdezni, és időnként olyanokat is megkérdeznek, akik eredetileg nem is voltak a mintában. Ezekről a problémákról később lesz szó; most csak a kiválasztott mintával foglalkozunk. Amint azt már korábban is többször érintettük, a közvélemény-kutatások túlnyomó többsége véletlen eljárással választott mintán alapul. A legtöbb kutató egyetért abban, hogy egyedül a véletlen kiválasztás pártatlansága adhat egyforma esélyt a társadalomban jelenlévő valamennyi véleménynek, hogy valódi súlyának megfelelő arányban szerepeljen a mintában. Természetesen nem lehetetlen, hogy egy más eljárással választott minta is pontosan tükrözze a vélemények megoszlását, azt azonban, hogy ez így van-e, vagy sem egy adott esetben, nem tudhatjuk. A véletlen mintáknál viszont, legalábbis átlagos értelemben, bizton számíthatunk a pontos becslésekre. További előnye a véletlen mintáknak, hogy a mintavételi hiba és az ebből származó pontatlanság nagysága kvantifikálható. A véletlen mintavétellel kapcsolatban a véletlen fogalmát annak köznapi értelmétől némileg eltérően használjuk. Ha a közvélemény-kutatás készítői lemennek az irodájukhoz legközelebbi utcasarokra, és kikérdezik az arra járó embereket, az nem véletlen mintavétel, még akkor sem, ha nem tudhatjuk előre, kik fognak arra járni, és emiatt a mintába kerülni, tehát bizonyos értelemben a véletlenen múlik, kiket kérdezünk meg. Az sem véletlen mintavétel, ha a kérdezőbiztosoknak adott számú és bizonyos társadalmi csoportokba tarozó embereket kell kiválasztaniuk, de ezt a kiválasztást saját maguk végzik, például úgy, hogy ismerőseik vagy a járókelők közül választják ki a „megfelelő” embereket. Ezekben az esetekben sem lehet tudni előre, hogy kik lesznek a megkérdezettek, és bizonyos értelemben a véletlenen múlik, hogy ismerőseik közül kikkel találkoznak előbb a kérdezőbiztosok, vagy hogy ki jön szembe először az utcán. 28
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
Ezekben a mintavételi eljárásokban valóban vannak véletlen (azaz előre nem látható) elemek, de ez nem az a fajta véletlen, amelyre a mintavételnél szükség van. Itt ugyanis a véletlen ellenőrizhetetlen és ezért hatásaiban kvantifikálhatatlan módon játszik szerepet. Igazi véletlen mintavételnél a véletlen egy jól definiált eljárás alkalmazásán keresztül fejti ki hatását. A véletlen mintavétel megvalósításához tehát nem elegendő, hogy a minta kiválasztói nem kívánják egyik társadalmi csoportot sem előnyben részesíteni a mintába kerüléskor. Véletlen mintavételről akkor beszélünk, ha a minta készítői egy megfelelő eljárás alkalmazásával biztosítják, hogy egyik társadalmi csoport tagjai se kapjanak a többieknél nagyobb esélyt a mintába kerülésre. Az az eljárás tehát, hogy bárki is jöjjön az utcasarkon, beválasztjuk a mintába (azaz a diszkrimináció szándékának hiánya) nem valósít meg véletlen mintavételt. Véletlen mintavételhez az kell, hogy még ha valaki nem is jár arra egyáltalán, akkor is ugyanakkora esélye legyen a mintába kerülésre, mint az éppen arra járóknak. A véletlen szerepe a véletlen mintavételnél nem annyira a bizonytalanság becsempészése, mint annak biztosítása, hogy mindenkinek ugyanakkora esélye legyen a mintába kerülésre. Emiatt a (kontrollált) véletlen mintavételi eljárásokkal keletkező minták átlagos tulajdonságai az egyedi bizonytalanság ellenére nagy biztonsággal megjósolhatók. A fenti általános mintavételi követelményeknek úgy felelhet meg a mintaválasztás módja a legegyszerűbben, ha például egy ezer elemű mintát úgy választanak ki, hogy a vizsgált népesség valamennyi ezer főt tartalmazó csoportjának egyforma esélyt adnak arra, hogy éppen ez a csoport legyen a vizsgálat mintája. Ez az eljárás biztosítja azt, hogy minden, a vizsgált népességbe tartozó személynek ugyanakkora legyen az esélye a mintába kerülésre. Az ilyen mintavételi eljárást egyszerű véletlen mintaválasztásnak, egy ilyen eljárással keletkezett mintát egyszerű véletlen mintának neveznek. Ezeknek az egyszerű véletlen mintáknak a tulajdonságait tárgyalta az előző fejezet. Eddig az elmélet, de annak a kutatónak, aki közvélemény-kutatását egy egyszerű véletlen mintára szeretné alapozni, bizonyos nehézségekkel kell szembenéznie. A populáció jellegétől függően ezek a nehézségek akár rendkívül komolyak is lehetnek. Először is egy egyszerű véletlen mintavétel végrehajtásához szükség van egy listára, amely a vizsgálandó népességbe tartozó minden személyt felsorol, méghozzá olyan információval együtt, amely lehetővé teszi a személy felkeresését abban az esetben, ha a mintába kerül. Ha egy iskola legnépszerűbb tanárát akarjuk közvéleménykutatással kiválasztani, akkor bátran támaszkodhatunk arra a – minden bizonnyal létező – listára, amely az iskola összes tanulóját (tehát a vizsgált népességet) tartalmazza. Ráadásul ez a lista azt is megmondja, hogy az egyes tanulók melyik osztályba járnak, így ha akarjuk, könnyen megtaláljuk őket. Ebben az esetben egy egyszerű véletlen minta előállítása rutinszerű számítógépes feladat. Hasonló, bár kissé bonyolultabb feladat, ha a telefon-előfizetők képezik a vizsgálat mintáját. Ilyenkor használhatjuk az elektronikus telefonkönyvek adatait. Legfeljebb azon kell elgondolkodnunk, hogy a legutóbbi telefonkönyv készítése óta eltelt idő alatt mennyire változott meg a telefon-előfizetők összessége: Hány új telefont kapcsoltak be és hány embernek nincs már telefonja, akinek akkor még volt? Hány telefonszám változott meg? Ez utóbbi természetesen nem befolyásolja a telefon-előfizetők összességét, de ne feledjük, a listának valamilyen elérési lehetőséget is biztosítania kell. A telefon-előfizetőket egyszerű lenne telefonon megkérdezni, de 29
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
az érvénytelen telefonszámok a minta egy részénél ezt lehetetlenné tehetik. További nehézség, amelyre gondolnunk kell, hogy vannak titkos, tehát a listán nem szereplő telefonszámok. Nehéz lenne általános érvénnyel megmondani, hogy az új telefontulajdonosok vagy a titkos telefonszámmal rendelkezők különböznek-e a többi telefontulajdonostól, és ha igen, hogyan. A kutatás tárgyától függő mértékű, de nehezen kvantifikálható nagyságú torzításhoz vezet tehát, ha az aktuális telefonkönyvben felsoroltakat azonosnak tekintjük az aktuális telefontulajdonosokkal. További, talán még az eddigieknél is súlyosabb probléma, hogy a földi (rögzített) és mobiltelefonok nagyon eltérőek abból a szempontból, hogy a földi telefonok általában egy háztartáshoz, míg a mobiltelefonok általában egy személyhez tartoznak, ugyanakkor az előbbiek esetében a háztartás más tagjai is „telefonnal rendelkezők”, csak éppen nem (feltétlenül) szerepelnek a telefonkönyvben. Ráadásul, a telefonok egy része közületekhez tartozik, és ezek szintén szerepelnek a telefonkönyvben. Az előbb tárgyalt kérdéseket, nevezetesen, hogy a rendelkezésre álló lista naprakész-e, illetve, hogy teljes-e, mindig fel kell tenni, mielőtt a népesség egy listája alapján mintát választanánk. Így van ez akkor is, ha az ország egész lakosságából szeretnénk mintát választani a lakcímnyilvántartás adatai alapján, vagy ha a választásra jogosultakból a választói névjegyzék alapján. Még rosszabb a helyzet akkor, ha nem is számíthatunk olyan listára, amely tartalmazná a vizsgálni kívánt népesség teljes felsorolását. Sok esetben ilyen listák nem léteznek (például a fővárosi hajléktalanok esetében), vagy pedig adatvédelmi okokból nem állnak a közvélemény-kutatás készítőinek rendelkezésére (például egy bizonyos betegség miatt kezelés alatt állók listája). Azokban az esetekben, amikor a teljes népességet tartalmazó megfelelő pontosságú lista nem áll rendelkezésre, az egyszerű véletlen mintavételnél bonyolultabb mintavételi eljárásokat kell alkalmazni. Az egyszerű véletlen mintavételt néha olyan esetekben sem alkalmazzák, amikor az ehhez szükséges információk rendelkezésre állnak. Ha egy kétezer elemű mintára van szükségünk az ország lakóiból, akkor ez a minta nagy valószínűséggel több száz településről tartalmazna embereket. A kérdezőbiztosoknak ezekre a településekre el kellene utazniuk, ha a keresett személyt nem találják otthon, akkor vagy ott kell maradniuk, vagy később visszatérniük. Mindez jelentősen növelné a kutatás költségeit és időigényét. Ha a kutatás készítői ragaszkodnak viszonylag kis létszámú, de jól képzett kérdező alkalmazásához – ami a tapasztalatok szerint jobb minőségű adatokhoz vezet, mint több és emiatt kevésbé képzett kérdező közreműködése –, akkor a kutatás a sok utazás miatt időben is elhúzódik, és eközben a megkérdezettek véleménye megváltozhat. Ezért a területileg túlzottan szétszórt minták nem kedvezőek, és gyakran az ilyenekre vezető egyszerű véletlen mintavételi eljárások helyett más módszereket alkalmaznak. Az egyszerű véletlen mintavétel helyett más módszerek alkalmazása annyiban elfogadható, amennyiben ezek biztosítani tudják, hogy mindenkinek egyforma esélye legyen a mintába kerülésre (vagy legalábbis ha különböző társadalmi csoportok mintába kerülési valószínűsége eltérő, akkor ezek a valószínűségek meghatározhatók legyenek, hogy a megfelelő korrekciót el lehessen végezni). Szerencsére ilyen alternatív eljárások léteznek, és sok szempontból az egyszerű 30
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
véletlen mintáknál kedvezőbb tulajdonságú mintákhoz vezetnek. Ezeknek az eljárásoknak közös jellemzője, hogy a véletlen mintát nem közvetlenül az egész populációból választják, hanem közbülső lépésekkel lecsökkentik a népességet, és a mintát ebből a lecsökkentett populációból veszik. Az egyik szokásos eljárás szerint először meghatározzák, hogy például ötven településről kerüljenek a mintába emberek. Ennek eldöntésében az játszik szerepet, hogy az ötven település a később részletezendő szempontok szerint megfelelő mintához vezethet, de a szám a kérdezés lebonyolíthatósága szempontjából még nem túl nagy. Önmagában az a tény, hogy a mintát eleve csak ötven településről választják, még nem jelenti a véletlen mintavétel fő szabályának – nevezetesen, hogy mindenkinek egyforma esélye legyen a mintába kerülésre – a megsértését. Csak arra van szükség, hogy az ötven települést véletlenszerűen válasszák ki az ország összes települése közül, és az ötven településen az emberek kiválasztásában megfelelő véletlen módon járjanak el. Ezt a mintavételi eljárást kétlépcsős mintavételnek nevezik. Az első lépcsőben az ország összes településéből választják ki a mintába kerülőket, a második lépcsőben pedig a mintába került településekről a mintába kerülő embereket. Ha például az első lépcsőben az ország valamennyi településének egyforma esélyt adnak a mintába kerülésre, akkor az egyes településekről a mintába kerülők számát a települések lélekszámával arányosan kell megállapítani, és így összességében az ország valamennyi lakójának egyforma esélye van a mintába kerülésre. A fenti kétlépcsős mintavételi eljárás joggal kritizálható abból a szempontból, hogy a véletlenen múlik, hogy mely települések kerülnek a mintába. Ez egy olyan követelmény, amely kívánatos a mintába kerülő személyekre nézve. De vajon kívánatos-e ugyanez a tulajdonság a mintába kerülő településekre is? Az egyforma bekerülési esély azért kívánatos az emberekre nézve, mert minden ember véleménye egyforma súllyal szerepel az egész népesség véleményében. Az emberek egyforma súlyát a populációban egyforma bekerülési eséllyel ültetjük át a mintába. Az ország települései azonban nem egyforma súllyal szerepelnek a népesség véleményének meghatározásában. Az egész népesség átlagos véleményének meghatározásában egy nagyobb lélekszámú település „fontosabb”, mint egy kisebb lélekszámú. (Valóban, a fenti eljárás ezt úgy érvényesítette, hogy egy nagyobb településről – ha az bekerült a mintába – több személyt választott ki, mint egy kisebb településről. Most azonban a kérdést úgy tesszük fel, hogy megengedhető-e, hogy a véletlenen múljon az, hogy vannak-e a mintában például budapestiek.) Továbbá még az is feltehető, hogy nagy településen elő emberek véleménye esetleg más lehet, mint kis településen élőké. Ezért nemcsak indokolatlan lenne minden településnek egyforma esélyt adni a mintába kerülésre, hanem még az is fontos, hogy mindenféle nagyságú települések legyenek a mintában. Ezeket az elveket egy úgynevezett kétlépcsős rétegzett mintavételi eljárással valósítják meg. Az első lépcsőben továbbra is a településeket választják ki, a másodikban pedig ezekről a településekről a megkérdezetteket. A mintavétel első lépcsőjében az ország településeit nagyságuk alapján csoportokba osztják. Általában három–tíz csoportot szoktak használni, amelyek közül Budapest egyedül alkot egy csoportot. Általában figyelembe veszik azt a tényt is, hogy az ország keleti és nyugati felében élő emberek részben történeti, részben pedig gazdasági okokból eltérő környezetben élnek és ennek megfelelően két azonos országrészben élő ember nagyobb eséllyel 31
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
lehet azonos véleményen, mint két ember, akik különböző országrészekben élnek,ha egyébként más szempontokból azonos párokat hasonlítunk is össze. Az országon belül az egyes régiók közötti különbségekről és hasonlóságokról természetesen ennél sokkal részletesebb információk állnak rendelkezésre, és ezek alapján az országot öt–tíz régióra szokás osztani. A településnagyság és a régiók szempontjait együttesen alkalmazva az ország településeit rétegekbe sorolják. Egy rétegen belül a település nagysága és az országon belül elfoglalt helyzet szempontjából hasonló települések vannak, különböző rétegekben pedig különbözőek. Egy rétegzést például úgy kaphatunk, hogy a következő nagyság-kategóriákat használjuk: 1000 fő alatt, 1000–5000 fő, 5000–10000 fő, 10000–50000 fő, 50000–150000 fő, 150000 fő felett. Régióként külön kezelhetjük a Dunántúlnak, a Duna-Tisza közének és a Tiszántúlnak északi, középső és déli területeit, és így kilenc régiót kapunk. A településnagyság és a régió kombinálásával 6×9=54 réteget kapunk. Budapestet célszerű külön rétegként kezelni. Az így kapott 55 rétegből néhány üres lesz, például nincs 150000 lakosnál nagyobb lélekszámú település a Duna-Tisza köze déli részén. Ezek a rétegek a vizsgálandó populációban léteznek, és külön részpopulációknak tekinthetőek. Ha belőlük külön véletlen mintákat veszünk, azok együttese az egész népességből származó véletlen mintának tekinthető. Minden rétegben kétlépcsős mintavételt hajtanak végre úgy, hogy a rétegenkénti mintanagyságot az illető réteg populáción belüli nagyságával (azaz az ott élő emberek számával) arányosan állapítják meg. Ennek a kétlépcsős mintavételnek az első lépcsőjében minden rétegből véletlenszerűen néhány települést választanak. A nagyobb lélekszámú településeket tartalmazó rétegekből általában 1 települést, a kisebb lélekszámú településeket tartalmazó rétegekből 3–5-öt. Így általában mintegy hetven–száz települést határoznak meg. Az ezek lakosaiból választott minták együttesen adják a kétlépcsős rétegzett mintavétel eredményét. A legtöbb országos közvélemény-kutatás a fent leírt elveket alkalmazza. Bizonyos közvéleménykutató cégek a rétegek kialakításában, illetve az egyes rétegekből a települések kiválasztásában figyelembe veszik, hogy hol rendelkeznek megbízható kérdezőkkel. Ez a minta véletlen jellegét rontja, és így a mintavételi hibát növelheti, ugyanakkor a nem mintavételi hibát és a költségeket csökkentheti. Általában kényelmi mintáknak szokás az olyan mintákat nevezni, amelyek kiválasztásánál a fő szempont a felmérés egyszerű végrehajthatósága. Természetesen egy minta bizonyos települések preferálása miatt, ha egyébként véletlen minta, még nem válik kényelmi mintává. Ez utóbbiak legszélsőségesebb példáit azok a vizsgálatok adják, amelyek mintája a kutató kollégáiból vagy egyetemi hallgatóiból áll. Ilyen mintákat közvélemény-kutatásokban nem használnak, de előfordulnak például pszichológiai vizsgálatokban. Visszatérve a kétlépcsős rétegzett mintavételhez, a kiválasztott települések nevét és a településenként megkérdezendő emberek számát tartalmazó listát mintakeretnek nevezik (bár a mintakeret kifejezésnek létezik másik szokásos jelentése is). A mintakeret kitöltése a megkérdezendő emberek tényleges kiválasztása. Mint láttuk, a mintakeret elkészítésénél bizonyos nem véletlen lépések is történtek, például a rétegek definíciója nem véletlenítésen alapult, hanem a kutató ismeretein és döntésein. Ez azonban a minta véletlen voltát nem befolyásolja, 32
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
ha a mintakeret kitöltése, tehát a megkérdezendő személyek meghatározása véletlen módon történik. A mintaválasztás utolsó lépésében (a jelen esetben a második lépcsőben) a véletlenítés elengedhetetlen követelmény. A mintakeret kitöltésére két eljárást szoktak alkalmazni. Mindkettőnek vannak előnyei és hátrányai, egyik sem jobb a másiknál, ezért mindkettő használata elfogadható. Az egyik eljárás az, hogy a közvélemény-kutató cég a mintakeretben meghatározott településekről a mintakeretben meghatározott számú személy címét megvásárolja egy nyilvántartásból. Ezen a ponton néha további rétegző szempontokat is figyelembe szoktak venni (természetesen csak olyan rétegző szempont lehetséges, amely a nyilvántartásban szerepel), például a közvélemény-kutató cég meghatározhatja ezen személyek között a férfiak és nők arányát úgy, hogy az pontosan tükrözze a nemeknek a népességen belüli arányát. Ez az eljárás éppen annyira jó mintát eredményez, mint amilyen pontosan tartalmazza a felhasznált nyilvántartás a népességet és a lakcímeket (a véletlen kiválasztás végrehajtása lényegében hibamentesnek tekinthető). Amint azt korábban tárgyaltuk, egy ilyen lista sohasem lehet teljesen pontos, valamekkora mértékű elmaradás a valóságtól mindig van, és mindig van a populációnak egy olyan része, amelyik nem szerepel a listán. A mintakeret kitöltésének másik módja további két lépcsőt alkalmaz. Először lakásokat választanak ki a településeken (mindenhol annyit, ahány embert meg kívánnak kérdezni), utána pedig lakásonként egy-egy embert. A lakások kiválasztása a településnek egy véletlenszerűen kiválasztott pontjáról indított sétával történik, amelynek során a kérdező előre (véletlenszerűen) meghatározott irányban sétál, míg el nem jut egy lakásba. Itt ismét egy előre meghatározott utasítást követve dönti el, hogy kit kell megkérdeznie. Minden lakásban csak egy embert kérdez meg. Ezt az embert egy előre kidolgozott utasítás alapján választja ki. Ez a szabályrendszer úgy van kidolgozva, hogy minden demográfiai csoportnak hasonló esélye legyen a megkérdezésre, tehát például az a tény, hogy az egyszemélyes háztartások nagyobb részében egy nő lakik, ne eredményezzen túl sok megkérdezett nőt és túl kevés megkérdezett férfit. Természetesen ez a demográfiai korrekció nem lehet teljes, például a nagyobb családban élőknek kisebb esélye lesz a mintába kerülésre, mint a kisebb családban élőknek. Ezen túlmenően ennek az eljárásnak a jósága azon múlik, hogy a bolyongási utasítás mennyire pontosan követhető, és hogy az adott településen az utasítás valóban eléri-e célját, nevezetesen hogy minden lakást egyforma eséllyel kereshessen fel a kérdező. Látjuk tehát, hogy mindkét eljárás lakásokkal, illetve címekkel dolgozik, akinek ilyen nincs, annak esélye sincs a mintába kerülésre. Ezért és az egyes módszereknél külön tárgyalt problémák miatt ezek az eljárások csak közelítik az egyszerű véletlen mintavétel eredményét. Ennek következtében az egyszerű véletlen minták megbízhatóságáról (a várható hiba nagyságáról) az előző fejezetekben közölt eredmények csak fenntartásokkal alkalmazhatóak. Mivel a most leírt mintavételi eljárásoknak az egyszerű véletlen mintavételtől való eltérésének nagyságára nézve nem áll rendelkezésre információ, nem lehet megmondani, hogy a közvélemény-kutató cégek által használt minták hibája várhatóan mekkora. Az esetek többségében feltehető, hogy a tényleges mintavételi hiba nagyobb, mint ami egyszerű véletlen mintavétel esetén lenne, ezért az előző fejezetek eredményei általában csak a hiba alsó korlátjának tekinthetők. 33
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
Ugyanakkor a személyek kiválasztásában a rétegzés alkalmazása – szerencsés esetben – csökkentheti a várható hiba nagyságát. Például a nemek szerinti rétegzésnél meghatározzuk, hogy a mintába hány nőt és hány férfit kívánunk beválasztani a populáció ismert nemek szerinti összetétele alapján. Ha tudjuk, hogy a populációban 52% nő és 48% férfi van, akkor egy 1000 fős mintát választhatunk úgy, hogy választunk egy 520 elemű mintát a nők közül, egy 480 elemű mintát a férfiak közül, és ezeket együtt tekintjük egy mintának. Az eljárásnak előnye, hogy a minta pontosan tükrözi majd a populáció nemek szerinti összetételét és ebben az értelemben – amellett, hogy véletlen minta – a kvótás minták előnyeit is nyújtja. Ne feledjük azonban, hogy erre csak akkor van lehetőség, ha a populáció nemek szerinti összetételét ismerjük, tehát egy bizonyos információt beépítünk a mintába. Nyilván egy ilyen minta nem is alkalmas arra, hogy felhasználásával megbecsüljük a populáció nemek szerinti összetételét. Hogyan befolyásolja a rétegzés más ismérvek becsléseinek jóságát? Általában azt mondhatjuk, hogy ha a jellemző kapcsolatban van a megkérdezett nemével, akkor a rétegzés a becslést javítja. Például, ha a nők jövedelme általában kisebb a férfiakénál, akkor a nemek szerinti rétegzés a jövedelem becslését javítja. Ha a vizsgált szempont nincs kapcsolatban a megkérdezett nemével, akkor a nem szerinti rétegzés nem javítja ennek becslését. Ugyanakkor nehéz lenne olyan attitűdöt vagy véleményt megnevezni, amellyel kapcsolatban biztosan lehetne állítani, hogy nem függ össze a megkérdezett nemével, tehát ez a rétegzés általában javasolható, de nem mindig megvalósítható. Ilyen esetekben utólagos súlyozást alkalmaznak (lásd később). Mit is jelent pontosan a rétegzési szempont és a vizsgált jellemző kapcsolata, amely szükséges ahhoz, hogy a rétegzés javítsa a becslést? Általában úgy fogalmazhatunk, hogy akkor beszélünk kapcsolatról, ha a rétegzőszempont kategóriáin belül a vizsgált változó értékei kevésbé térnek el egymástól, mint az egész populációban. Más szavakkal, a vizsgált jellemző szempontjából a rétegeknek viszonylag homogéneknek kell lenniük. A rétegzés lehetséges hasznának illusztrálására térjünk vissza az 1. Táblázatban bemutatott kis ország adataihoz. Mivel a populációban a férfiak és nők száma azonos, a nemek szerinti kételemű minták egy férfit és egy nőt tartalmaznak. Olyan minta, amely két nőből vagy két férfiból áll, nem fordulhat elő. Azaz a 2. Táblázatban bemutatott összes lehetséges minta közül csak az első oszlopban szereplő, nemek szerint reprezentatív minták fordulhatnak elő rétegzéskor. Összesen 25 ilyen minta van, amelyek közül 17 a pártpreferencia szerint is reprezentatív, azaz a pártpreferenciára vonatkozóan pontos becslést ad, és 8 olyan van, amely a pártpreferenciára vonatkozóan pontatlan becslést ad. Azaz a rétegzett minták közül 17/25=68% ad pontos becslést a pártpreferenciára. Az összes minta közül (amint az a 2. Táblázatból látható) 25 ad pontos becslést a pártpreferenciára, azaz az ilyen minták aránya 25/45=56%. A rétegzett mintavétel alkalmazásából származó nyereség tehát ebben az esetben az, hogy a szóba jövő minták 68%-ából várhatunk pontos becslést, szemben az 56%-kal, ami egyszerű véletlen mintavétel esetén mutatja a pontos becslést adó minták arányát. A fenti példa esetében a becslés bizonytalansága, várható hibája, kisebb rétegzett mintavétel esetén, mint egyszerű véletlen mintavétel esetén.
34
4. Hogyan választják ki a megkérdezetteket? (Mintavétel)
Összefoglalás A közvélemény-kutatás megbízhatóságát alapvetően befolyásolja a mintaválasztás módja; ennek ismerete nélkül az eredmények nem értelmezhetőek. Az elméletileg legkedvezőbb helyzet az egyszerű véletlen mintavétel, de ez a gyakorlatban sokszor megvalósíthatatlan. Egyszerű véletlen mintavétel esetén az előző fejezetekben leírt kedvező megbízhatóságra és kis hibára számíthatunk. A gyakorlatban legtöbbször használt lépcsős és rétegzett mintavételi eljárások, ha a mintakeretet egyszerű véletlen mintával töltik ki, nem feltétlenül rosszabbak az egyszerű véletlen mintáknál. Ezen eljárások pontos minősítéséhez a rétegzési szempontokat és az első lépcsőben kiválasztott települések számát kell ismerni. A mintakeretek kitöltése általában nem valósítható meg egyszerű véletlen mintával. Az ehhez közel álló, címlistán alapuló mintavétel megbízhatósága a felhasznált címlista pontosságán és teljességén múlik. A bolyongásos mintavétel egy kis demográfiai torzítást eredményez, de jól képzett kérdezőkkel jobb mintát eredményezhet, mint amilyet egy rossz minőségű címlista alapján lehet választani. A mintavétel során alkalmazott rétegzés általában javítja a mintából származó becsléseket.
35
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) A közvélemény-kutatás adatgyűjtésének a következő fontos követelményeknek kell megfelelnie: mindenkit kérdezzenek meg, aki a mintába került; csak a mintába került embereket kérdezzék meg; a kérdezés módja minél kevésbé torzítsa a válaszokat; az adatgyűjtést rövid idő alatt végezzék el. Ezeknek a feltételeknek a minél pontosabb teljesítése alapvető fontosságú az eredmények megbízhatósága és érvényessége szempontjából. Természetesen a gyakorlatban ezek a követelmények nem teljesülhetnek teljes mértékben, és egyesek teljesülésének ellenőrzése könnyebb, mint másoké. Ezek közül a követelmények közül egyesek esetében kvantifikálható, hogy milyen mértékben teljesülnek, míg másoknál nem. Ha nem kerül sor a teljes minta lekérdezésére, az egyrészt a mintanagyságot csökkenti, másrészt pedig kérdésessé teszi, hogy a ténylegesen megkérdezettek mennyire tekinthetők a vizsgálandó népességből származó véletlen mintának. Ehhez szorosan kapcsolódó probléma, hogy a megkérdezettek egy része különböző okoknál fogva nem válaszol minden kérdésre. Ez utóbbi problémával a következő fejezetben fogunk foglalkozni, most csak az abból származó nehézségeket vizsgáljuk, hogy egyesektől egyáltalán nem sikerült adatot gyűjteni. Az adatgyűjtés konkrét módjától függően ennek számos oka lehet, például az illetőt nem találták otthon, vagy otthon volt, de nem akart vagy nem tudott egyetlen kérdésre sem válaszolni. Gyakran előfordul, hogy a mintavételi terv például 1000 ember megkérdezését írta elő, de ténylegesen ezek közül csak 800-at sikerült lekérdezni. Annak megítélésére, hogy ez súlyos probléma-e, azt kell meggondolni, vajon a ténylegesen megkérdezett 800 ember tekinthető-e egy 800 elemű minta tagjaiként, akiket ugyanabból a populációból választottak. Ha ez így van, akkor a veszteségünk csupán annyi, hogy a mintanagyság kisebb, tehát a várható hibahatár kissé nagyobb lett, de a becslések továbbra is torzítatlanok (azaz átlagosan pontosak). Ha ez így lenne, akkor tapasztalatból ismerve a meg nem kérdezhetők szokásos arányát, egy közvélemény-kutató cég választhatna egy nagyobb, mondjuk 1250 főt tartalmazó mintát. Ha ezeknek is húsz százaléka nem válaszol, akkor éppen egy 1000 fős mintát kérdeznek le, megegyezően az eredeti tervvel. Abban az esetben tekinthetnénk a ténylegesen válaszoló 800 embert egy véletlen mintának abból a populációból, amelyből az eredeti, 1000 fős mintát választották, ha egy véletlen eljárás válogatná ki az 1000 emberből azt a 200-at, aki nem válaszol. Itt a véletlen eljárás azt jelenti, hogy mind az 1000 embernek egyforma valószínűsége van a 200 nemválaszoló közé kerülésre, és az emberekről egymástól függetlenül határozódik el, hogy a válaszolók vagy a nemválaszolók közé kerülnek. Ugyanezt úgy is megfogalmazhatnánk, hogy az 1000 fős minta minden 200 fős részhalmazának egyforma esélye van arra, hogy éppen ők legyenek a nemválaszolók. Azaz, ha a 200 nemválaszoló az 1000 fős mintából vett véletlen minta lenne. Ekkor a 800 válaszoló az eredeti populációból vett véletlen mintának lenne tekinthető. 36
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) Reális-e az előző bekezdésben szereplő feltevés? Gondolhatjuk-e, hogy bármely embernek egyforma esélye van arra, hogy ha már belekerült a mintába, akkor a nemválaszolók közé kerüljön? Nem kell-e inkább azt gondolnunk, hogy egy személyes megkérdezésnél a fiatalabb, gyermektelen, magasabb jövedelmű emberek nagyobb valószínűséggel nem találhatóak otthon, mint például az idősebb, kisebb jövedelműek? Egy levélben történő megkérdezésnél nem kell-e azt gondolnunk, hogy azok az emberek, akik nehezen tudják magukat írásban kifejezni, nagyobb eséllyel kerülnek a nemválaszolók közé? Általában tehát azt kell gondolnunk, hogy a válaszolók nem képeznek ugyanolyan jó mintát a populációból, mint az eredetileg kiválasztott minta, ezért egy közvéleménykutatás minőségének megítélésében nagyon fontos szempont az, hogy a nemválaszolás arányát miként igyekeznek csökkenteni, és ez az igyekezet mennyire eredményes. A fenti példákból világos, hogy a mintába kerülő személyek megkeresésének módja nagyban befolyásolja a nemválaszolók arányát. A megkeresési mód hatásának megértéséhez külön kell választanunk azokat, akiket nem találnak meg, bár a mintában vannak, és azokat, akiket megtalálnak, de nem hajlandóak részt venni a közvélemény-kutatásban. A megtalálási arány növelésére, ha a megkérdezés személyes, a kérdezőbiztosok többször visszatérnek a kérdezett lakására, ha korábbi alkalmakkor nem találták otthon. Telefonos megkérdezésnél is többször ismétlik a telefonhívást, ha ez szükséges. Levélben történő megkérdezés esetén, ha a mintában lévő cím helyes, a kérdezett nagy valószínűséggel megkapja a levelet. Ebből a szempontból tehát a levélben történő kérdezés a legbiztonságosabb. Azonban nem mindig áll rendelkezésre egy címlista alapján választott minta, továbbá más szempontokból (például a mintába került személyek válaszolási hajlandóságának növelése vagy annak biztosítása, hogy a válaszok ténylegesen és kizárólag a mintába került személyektől származzanak) ez a megkérdezési mód kevésbé előnyös. A megtalált, de nem válaszoló emberek aránya a levélben történő megkérdezés esetén a legnagyobb. Ugyanakkor bizonyos speciális témákban elképzelhető, hogy érvényesebb adatot lehet gyűjteni levélben, mint személyesen. A megtalált, de nem válaszoló emberek aránya általában személyes megkérdezés esetén a legkisebb. Gyakran a megkérdezettek együttműködési készségének javítására a személyes felkeresés előtt tájékoztató levelet küldenek nekik. A nemválaszolók arányának csökkentése szempontjából tehát a három leggyakoribb adatgyűjtési módszer között nagy különbségek vannak, de nincs olyan, amely minden szempontból és minden esetben jobb lenne a másik kettőnél. A jó munkát végző közvélemény-kutató cégek nagy erőfeszítéseket tesznek a nemválaszolók arányának csökkentésére. Nincsen olyan eljárás, amely ezt a problémát teljes mértékben megoldaná. Leginkább azok az aprólékos munkát igénylő, de csak részleges sikert ígérő eljárások hasznosak, amelyekre már korábban utaltunk: a minta gondos kiválasztása, a mintába került személyek ismételt felkeresése, alternatív kapcsolat-felvételi módok alkalmazása (például telefonhívás vagy levélküldés abban az esetben, ha a mintába került személyt nem találják, esetleges előzetes értesítés a személyes megkérdezésről). A megkérdezendő személyek válaszolási hajlandóságát a kérdezés ideje, a kérdezőbiztosok megjelenési és beszédmódja, az a bevezető 37
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) szöveg, amellyel bemutatják a vizsgálatot és válaszokat kérnek a kérdéseikre, éppen úgy befolyásolják, mint a kérdezést végző intézményről kialakult kép. Ezeket a tényezőket a közvélemény-kutató intézetek befolyásolhatják. Nem befolyásolható annak hatása, hogy egyes témákban a megkérdezettek nagyobb válaszolási hajlandóságot mutatnak, mint más témákban. A nemválaszolók számának csökkentése érdekében gyakran használnak két olyan eljárást, amelyeknek helyessége erősen kérdéses. Az egyik elterjedt módszer az – amint erre már korábban utaltunk –, hogy a kutatás tervezett mintanagyságánál eleve nagyobb mintát választanak és megkísérlik ezt a nagyobb mintát lekérdezni. Természetesen lesznek nemválaszolók, és a ténylegesen válaszolók eredményeit úgy közlik, mintha eredetileg csak ők alkották volna a vizsgálat mintáját. Ez az eljárás előre megbecsülhető nemválaszolási arány esetén biztosítja a kívánatos mintanagyságot, de ha ezt a nemválaszolás tényének elkendőzésére használják, akkor félrevezető. Ha vannak nemválaszolók, akkor a válaszolók nem tekinthetőek az egész populációból vett véletlen mintának, csak a populáció azon részéből vett mintának, amely válaszolna, ha a mintába kerülne. Mivel a nemválaszolók általában különböznek a válaszolóktól, a teljes populáció és a válaszolni hajlandó emberek populációja is különbözőek. A ténylegesen válaszoló emberektől nem várhatjuk, hogy valamennyi ember véleményét képviseljék. A másik gyakran használt – és megkérdőjelezhető – eljárás, az úgynevezett pótcímek alkalmazása. Az elérhetetlenség vagy az együttműködési szándék hiánya miatt nem válaszolók helyett másokat kérdeznek meg. Ezeket az embereket bizonyos esetekben egy pótlólagos mintából veszik ki. Ha ezt a pótlólagos mintát ugyanúgy választják ki, mint az eredetit, akkor ez az eljárás nem különbözik attól, amely eleve nagyobb létszámú mintából indul ki. Kicsit jobbnak tűnik az a módszer, amikor egy nemválaszoló helyett egy hozzá demográfiai szempontból hasonló másik embert választanak. Ezt az eljárást illesztett pótcímek alkalmazásának nevezik. Természetesen erre csak akkor van lehetőség, ha a megfelelő információval már a minta készítésekor rendelkeznek. Ha igaz lenne, hogy a felhasznált demográfiai adatok meghatározzák a véleményt, akkor ez az eljárás helyes lenne. Ez azonban nyilván nem igaz, a válaszolók és a nemválaszolók között mindenképpen fel kell tételeznünk különbségeket. Az eljárás tehát minden jó szándéka ellenére még rosszabb eredményre vezethet, mint az előző, mert elkendőzi a válaszolók és nemválaszolók közötti demográfiai különbségeket, amelyeket esetleg egy gondos elemzésben a nemválaszolás hatásának vagy okainak felderítésére használhatnánk. Ha például a kutatók azt tapasztalják, hogy bár a mintába azonos arányban választottak férfiakat és nőket, a válaszolók között a nők nagy többségben vannak, akkor ennek az eltérésnek az okai megvizsgálhatók és az esetleg ebből esetleg származó torzulás korrigálható. Az első kérdés ilyen esetben az, hogy vajon a ténylegesen megtaláltak között is nagy többségben vannak-e a nők. Ha igen, akkor a mintába került személyek felkeresési módja okozza a torzítást, és az eddig alkalmazottaktól eltérő módokon kell megpróbálni a mintába került személyek megkeresését. Ha azt tapasztalják, hogy a mintába került férfiakat és nőket nagyjából egyforma arányban találták meg, de a megtalált férfiak közül sokkal többen nem voltak hajlandók részt venni a felmérésben, mint a megtalált nők közül, akkor a probléma lehet a kérdezőbiztosok megválasztásában és kiképzésében vagy pedig a vizsgálat témájában. Előfordulhat, hogy a vizsgálat témája kevésbé 38
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) érdekes a férfiaknak, de az is, hogy a téma kényesebbnek számít a férfiak számára, mint a nőknek. Amennyiben ez a helyzet, akkor ezt a vizsgálat eredményei között közölni kell. A férfiak és nők eltérő megtalálási aránya és válaszolási hajlandósága kvantifikálható, és további elemzések is végezhetők ennek alapján. Egy gondosan végrehajtott, illesztett pótcímes eljárás során ezek az eredmények nem vesznek el, de ha az illesztett pótcímeket megfelelő kontroll nélkül alkalmazzák, akkor ezek a minden bizonnyal fontos információk nem jelennek meg az eredmények között. Nincs biztosíték arra, hogy a válaszolók és a nemválaszolók ellenőrizhető demográfiai szempontokból különbözzenek, de ha ez így van, és a nemválaszolási arány jelentős, akkor a mintánk demográfiai szempontból torzabb lesz, mint amekkora eltérést a populációra jellemző arányoktól betudhatnánk a mintavételi hibának, és így becsléseket tehetünk a nemválaszolók jellemzőire. A pótcímek használatához látszólag hasonló eljárás az, ha a kérdezőbiztosok az otthon nem talált személy helyett egy másikat kérdeznek meg, de ez a másik személy nincs előre kiválasztva. Különösen csábító lehet ez azokban az esetekben, amikor a minta nem személyek nevét és címét tartalmazó lista, hanem például véletlen séta (bolyongás) eredményeként jön létre. Ha a kérdezők maguk lecserélik a mintába került személyeket, az súlyosan károsítja a minta véletlen jellegét, és nagy valószínűséggel torzításhoz vezet. Ez az eljárás sokkal rosszabb, mint a pótcímek használata, mert nemcsak hogy a nem megtalálható vagy válaszolni nem hajlandó emberek közé tartozó személyt helyettesít egy válaszolni hajlandó személlyel, hanem még ráadásul a válaszolni hajlandó személyek közül sem véletlenszerűen választ. A mintának egy részét a közvélemény-kutatás készítőinek minden erőfeszítése ellenére sem lehet lekérdezni. A tapasztalható nemválaszolási arány településtípusonként és társadalmi csoportonként különböző. Budapesten például 40%–50% közötti nemválaszolási arányt is lehet tapasztalni (ez az arány nem tér el lényegesen a más európai nagyvárosokban tapasztalt értéktől.) Ez az arány csökkenthető, de nem tehető nullává. A közvélemény-kutatások eredményeinek közlésekor a nemválaszolásból származó mintaveszteség mértékét közölni kell, mert e nélkül nem tudható, hogy a ténylegesen lekérdezett emberek a populációnak mekkora részéből származó mintának tekinthetők. Ennek fontosságát érzékeltethetjük, ha feltesszük, hogy az eredetileg a mintába került emberek 25%-át nem sikerült lekérdezni, vagy azért, mert nem találták meg, vagy azért, mert nem volt hajlandó válaszolni. A példa kedvéért feltesszük, hogy azok, akiket sikerült lekérdezni, valamennyien válaszoltak a vizsgálat szempontjából érdekes kérdésre, tehát például arra, hogy melyik pártra szándékoznak szavazni. Ez a feltevés természetesen a gyakorlatban nem igaz, de a részlegesen nem válaszolók aránya általában kisebb az egyáltalán nem válaszolókénál, továbbá, mivel ezekről az emberekről a többi válaszuk alapján valamilyen ismeretekkel rendelkezünk, a részleges válaszhiányok némileg másképpen értékelendők, mint a teljes válaszhiány. A részleges válaszhiány problémájáról a következő fejezetben lesz szó. Visszatérve a példához, a minta 75%-át sikerült lekérdezni, 25%-át nem. Tegyük fel, hogy a mintanagyság 1000 fő volt, és a válaszoló 750 közül 150 mondja, hogy egy bizonyos pártra fog szavazni. Becsülhetjük-e a párt szavazóinak arányát úgy, hogy 150/750=20%? Amint azt 39
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) már korábban láttuk, a válaszoló 750 fő nem tekinthető a népességből vett véletlen mintának. A valóságot azzal a feltevéssel közelíthetjük a legjobban, hogy a népesség két részből áll, az egyikből a mintába kerülők válaszolnak a kérdésekre, a másikból a mintába kerülők nem. A legszerencsésebb esetben a 750 fő véletlen minta a válaszolni hajlandókból, a fennmaradó 250 fő pedig véletlen minta a válaszolni nem hajlandókból. A 20% tehát jó becslés a válaszolni hajlandók szavazási szándékaira, de hogy az egész népesség szavazási szándékát megbecsüljük, figyelembe kell venni azok szavazási szándékait is, akik a nemválaszolók csoportjába tartoznak. Ez utóbbira nézve nem szolgáltat információt a közvélemény-kutatás. Mielőtt ennek hatását számszerűsítenénk, megjegyezzük, hogy ezzel az egész problémával nem kell foglalkozni, ha a nemválaszolók éppen egybeesnek a nemszavazókkal, mert akkor a válaszolók a szavazók, és úgyis a szavazás eredményét akarjuk előre jelezni. Szociológiai okokból a nemválaszolók és nemszavazók népessége között erős átfedés van, de ennek a két csoportnak az azonossága nem tételezhető fel. Talán gondolhatjuk, hogy a válaszolás elől elzárkózók között többen vannak a politika iránt nem érdeklődő, és esetleg nem szavazó emberek, de azt nem tételezhetjük fel, hogy azok között, akiket nem sikerült megtalálni, nagyobb arányban lennének nemszavazók, mint a teljes népességben. Ha a közvélemény-kutatás eredményeként a vizsgált párt szavazóira 20% adódott, akkor mi lehet a teljes népességben a párt szavazóinak az aránya? A válaszolók populációjában a valódi szavazási szándék eltérhet a 20%-tól, és a nemválaszolók populációjában ez a szavazási arány egészen más érték lehet. Ennek a két tényezőnek a hatása vagy csökkenti vagy növeli egymást. Ha például a válaszolók népességében 18% szavazna a vizsgált pártra, a nemválaszolók népességében 24%, akkor az egész populációban a párt szavazóinak aránya 0,75×18%+0,25×24%=19,5%, tehát a becslés nem túl rossz, pontosabban a becslés közelebb van a valódi szavazási arányhoz, mint a válaszolók szavazási arányához. Ha viszont a válaszolásra nem hajlandóknak 15%-a szavazna a vizsgált pártra, akkor a valódi teljes szavazási arány 0,75×18%+0,25×15%=17,25%, tehát a becslés rosszabb az egész népességre nézve, mint amilyen a válaszolni hajlandók népességére nézve lenne. Minél nagyobb a szavazati arányok különbsége a válaszolni hajlandók és nem hajlandók között, annál nagyobb lesz annak a jelentősége, hogy nem sikerült mindenkit lekérdezni. A 9–12. táblázatok azt mutatják, hogy a minta nem teljes lekérdezése milyen mértékben rontja a mintából származó becslés teljesítményét. Korábban láttuk, hogy véletlen minták esetén a mintából származó becsült érték nagy valószínűséggel nem tér el túlzottan a valódi értéktől. Ennek illusztrálására, a mintanagyságról szóló fejezetben úgynevezett megbízhatósági intervallumokat mutattunk be. Ezeknek legegyszerűbb formája azt állította, hogy a valódi érték 68%-os biztonsággal nem tér el jobban a mintából becsült értéktől, mint a hibahatár értékének fele; 95%-os biztonsággal mondhatjuk, hogy az eltérés nem nagyobb, mint a hibahatár; és 99,7%-os biztonsággal mondhatjuk, hogy az eltérés a valódi és becsült érték között nem több, mint a hibahatár másfélszerese. A hibahatár a mintanagyságtól és a becsülni kívánt valódi aránytól egyaránt függő mennyiség, és különböző mintanagyságokhoz tartozó lehetséges maximális értékeit táblázatban mutattuk be. Ha nem sikerült a teljes mintát lekérdezni, akkor a hibahatár és a megbízhatóság között a kapcsolat egész más jellegű, és ezt mutatjuk be az alábbi táblázatokban. 40
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) Ha arra való tekintet nélkül használjuk a megbízhatósági állításokat, hogy nem sikerült a teljes mintát lekérdezni, akkor az adott eltéréshez tartozó megbízhatósági szint más lesz, mint gondolnánk. A tényleges megbízhatósági szint a valójában megkérdezettek arányától és a megkérdezettek és meg nem kérdezettek véleményének eltérésének a nagyságától is függ. A 9–12. táblázatok azt mutatják, hogy mekkora biztonsággal lesz a valódi és a becsült érték közötti eltérés kisebb, mint az adott mintanagysághoz tartozó maximális hibahatár (a teljes minta lekérdezésekor érvényes legalább 95% helyett). Az adott mintanagysághoz tartozó maximális hibahatár használatát az indokolja, hogy a valóságban általában sem a válaszolni hajlandók populációjában érvényes valódi értéket, sem pedig a tényleges lekérdezési arányt nem ismerjük. A 9–12. táblázatok azzal a feltevéssel adják meg a megbízhatósági szinteket, hogy a populációnak abban a részében, amely a lekérdezhető személyeket tartalmazza (azokat, akik közül a mintába kerülők ténylegesen válaszolnak is a kérdésekre), a vizsgált arány valódi értéke 50%. Ha a vizsgált arány valódi értéke a lekérdezhető személyek között eltér ettől az értéktől, akkor a lefedési megbízhatóságok az itt megadott értékeknél nagyobbak.
41
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés)
42
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés)
A 9–12. táblázatokat a következőképpen lehet használni: Ha tudjuk például, hogy a mintanagyság 2000 fő volt, de ennek csak 80%-át sikerült lekérdezni, és ennek alapján a becsült érték, mondjuk egy párt szavazóinak arányára nézve 22%, akkor a 19,8%–24,2% tartomány a valódi, az egész populációra jellemző értéket attól függő biztonsággal tartalmazza, hogy a populációnak abban a részében, amelybe a le nem kérdezhető emberek tartoznak, mekkora lenne a párt szavazóinak aránya. Ha ez az arány megegyezik a populáció lekérdezhető részében érvényes aránnyal, akkor a megbízhatóság 92%. Ha azonban az arány 10%-kal eltér, tehát a rá vonatkozó becslésünk 12% vagy 32% lenne azok között, akiket nem sikerült megkérdezni, ha mégis meg tudtuk volna kérdezni őket, akkor a megbízhatóság csak 56%. Ez azt jelenti, hogy a valóban elvégzett felméréshez hasonlóan végrehajtott felmérések csak mintegy az esetek felében produkálnának olyan intervallumokat (a becsült érték plusz–mínusz egy hibahatár szabály alkalmazásával, ahol a hibahatár értékét a 2000 főt tartalmazó eredeti mintanagyság alapján határoztuk meg), amelyek ténylegesen tartalmaznák a valódi értéket. Figyelemreméltó, hogy a fenti szempontból a nagyobb létszámú minták rosszabbak, mint a kisebb elemszámúak. Ennek az az oka, hogy ugyanakkora, például 10%-os eltérés relatíve nagyobbnak számít a nagyobb mintához tartozó kisebb hibahatárhoz, mint egy kisebb mintához tartozó nagyobb hibahatárhoz képest. A fentiek ismét csak azt sugallják, hogy a mintanagyság túlzott növelése helyett a közvélemény-kutatásra rendelkezésre álló erőforrásoknak egy jelentős részét a minta minél teljesebb lekérdezésére kell fordítani. A későbbiekben szó lesz a minta súlyozásáról, amely kis véletlen hibák korrigálására szolgáló eljárás. Itt csak annyit bocsátunk előre, hogy a nemválaszolás problémájának kezelésére ez a 43
5. Hogyan befolyásolja a kérdezés módja az eredményeket? (Adatgyűjtés) módszer érdemben nem használható, még akkor sem, ha egyes közvélemény-kutatók meg is próbálják ezt. A kérdezés módszereinek és a kérdőív szerkezetének, amint arra már korábban utaltunk, a kapott válaszok validitása (azaz érvényessége) szempontjából is nagy jelentőségük van. A kérdéseknek világosaknak, mindenki által érthetőknek kell lenniük, ugyanakkor mentesnek a túlzott egyszerűsítésektől. Bár ezek a követelmények kézenfekvőnek tűnhetnek, megvalósításuk bizonyos nehézségekbe ütközhet. Könnyen lehet, hogy egy kérdés, amely érthető és világos az egyik megkérdezettnek, elfogadhatatlanul egyszerűsítő megfogalmazásokat tartalmaz egy másiknak. Hasonlóan lehetséges, hogy egy kérdés, amely reális alternatívák közötti választást kér az utóbbi válaszolótól, értelmetlenül bonyolultnak tűnik az előbbi számára. Nyilvánvaló követelmény, hogy a kérdések megfogalmazása, sorrendje, a kérdezők viselkedése ne sugalljon válaszokat. Ezeknek a követelményeknek a megvalósításához csak aprólékos munkával kerülhetnek közel a közvélemény-kutatás készítői. A közvélemény-kutatás olvasói – szerencsés esetben – megismerhetik a kérdőív kérdéseit, de a kérdezői munka minősége utólag nehezen ellenőrizhető.
Összefoglalás A mintába került valamennyi embernek, de csak a mintába került embereknek a lekérdezése a közvélemény-kutatás eredményeinek megbízhatósága és érvényessége szempontjából ugyanannyira fontos, mint a mintaválasztás helyes módja. A mintacsökkénésből származó hibákat a pótcímek használata inkább elkendőzi, mint megoldja. A mintába kerülés esetén lekérdezhető és nem lekérdezhető emberek csoportjainak véleményei eltérhetnek egymástól. Minél nagyobb ez az eltérés és minél nagyobb a nemválaszolók aránya, annál torzítottabb lesz az adatokból kapható becslés. A szokásos megbízhatósági állítások jelentős számú nemválaszoló esetén érvényüket vesztik. Az eredmények megbízhatóságának, és ezen keresztül a kutatás minőségének egyik legfontosabb mutatószáma a nemválaszolók aránya az eredeti mintában.
44
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) Ebben a fejezetben a válaszhiány kifejezést a korábbitól eltérő tartalommal fogjuk használni, és azt értjük alatta, hogy valaki, akinek feltették a kérdőív kérdéseit (tehát lekérdezték), bizonyos kérdésekre nem válaszolt. Ez az adatok elemzésénél nehézségeket okoz. Hasonló, bár sokkal súlyosabb problémákhoz vezet az, ha valaki ugyan válaszol a kérdésekre, de egyes válaszai nem tükrözik véleményét. Ennek egyik oka lehet, hogy az adott kérdésről nincs véleménye, és válasza véletlenszerű, vagy pedig a kérdőív vagy a kérdező által sugallt választ adja. A másik ok az lehet, hogy a megkérdezett szándékosan el akarja titkolni véleményét. Ez utóbbi esetekben tehát formálisan van válasz, de a valódi véleményre nézve nincs információ az adott válaszban. Ezek közül a problémák közül a válaszhiányok a legegyszerűbbek. A válaszhiányok jelentőségével és az eredményekre gyakorolt hatásával kapcsolatban ugyanazt mondhatjuk, mint a mintának azzal a hányadával kapcsolatban, amelyet egyáltalán nem sikerült megkérdezni. A válaszolók és nem válaszolók véleménye feltehetőleg eltér az adott kérdésben. Ennek az eltérésnek a nagyságától és a nemválaszolók arányától függ az, hogy a válaszok alapján adott becslés mennyire torzított. Ennek megítéléséhez az előző fejezetben szereplő táblázatok használhatók. Azokról a megkérdezettekről, akik egy adott kérdésre nem válaszoltak, azon kérdések alapján, amelyekre választ adtak, a közvélemény-kutatás készítői rendelkeznek bizonyos információkkal. Ezeket az információkat fel lehet használni a hiányzó válaszok „pótlására”. Ez a valóságban természetesen csak annyit jelent, hogy a hiányzó válaszról feltesszük, hogy ugyanaz, vagy hasonló, mint amit a nemválaszoló személyhez hasonló válaszolók adtak. A nemválaszoló személyhez hasonló személyeket azon kérdések alapján választják ki, amelyekre a nemválaszoló személy is válaszolt. Mindaddig, amíg a kutatás publikált eredményei százalékarányok vagy átlagok, az ezekkel a módszerekkel kapható eredmények azonosak azokkal, amelyeket akkor kapnánk, ha az adatok közül elhagynánk a részlegesen válaszolókat és ezután az adatok úgynevezett súlyozása segítségével próbálnánk korrigálni az adathiányt, ha a súlyozáshoz ugyanazokat a változókat használnánk, amelyeket a hiányzó adatok pótlására. A gyakran alkalmazott súlyozási eljárást részletesen tárgyaljuk a következő fejezetben. Ha az elemzés eredményei ennél összetettebb mutatószámok, akkor a hiányzó adatok helyettesítése (a szakmai zsargonban: imputálása) azzal a negatív következménnyel jár, hogy a kiegészített adatállományban a válaszok egyformábbnak tűnnek, mint amilyenek a valóságban. Ennek röviden az az oka, hogy egyébként egyforma emberekről, ha az egyik válaszolt egy kérdésre, a másik pedig nem, lényegében azt tesszük fel az imputálás során, hogy a nemválaszoló is ugyanazt a választ adta volna, mint a válaszoló, ami nem feltétlenül igaz. A hiányzó megfigyelések pótlásának léteznek olyan, az itt vázoltnál összetettebb módjai is, amelyek nem rendelkeznek ezzel a hiányossággal, de mindenképpen igaz, hogy a hiányzó információ nem pótolható érdemben. Az imputálással történő pótlás legfeljebb 45
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) közelítést adhat, amelynek jóságához az szükséges, hogy a tényleges (nem teljesen megfigyelt) adatok bizonyos előnyös tulajdonsággal rendelkezzenek. A valótlan válaszok kiszűrésére, legalábbis számuk csökkentésére, bizonyos kérdőív-szerkesztési eljárásokkal néha van lehetőség. Ennek legfőbb módszere az, hogy azokat a kérdéseket, amelyekkel kapcsolatban a legerősebb a valótlan válaszok gyanúja, kissé eltérő formában többször is felteszik, és megvizsgálják a válaszok konzisztenciáját. A valótlan válasz adásának egyik fontos fajtája az, amikor a megkérdezett saját véleményeként egy véletlenszerűen, vagy rosszabb esetben a kérdőív vagy a kérdező sugallatára választott alternatíváról számol be. Ennek esélye csökkenthető, ha a kérdőív, mielőtt a véleményre vonatkozó kérdést feltenné, előbb megpróbálja azt megtudakolni, hogy a megkérdezettnek van-e véleménye a kérdéssel kapcsolatban. Célszerű arra vonatkozó kérdéseket is feltenni, hogy a megkérdezett mire alapozza véleményét (ha azt állítja, hogy van véleménye), és azt is megtudakolni, hogy a kérdezett véleményét kinyilvánította-e valamilyen formában, vagy tervezi-e ezt. Az ezekre a kérdésekre adott válaszok önmagukban nehezen értelmezhetők, de lehetőséget adnak a megkérdezettnek arra, hogy végiggondolja, véleménye vajon mennyire állandó, illetve megalapozott. Azoknak a megkérdezetteknek, akik először azt állították, hogy van véleményük, de az utóbbi két kérdés hatására elbizonytalanodtak saját véleményük komolyságát illetően, lehetőséget kell adni a „visszatáncolásra”, például annak megkérdezésével, hogy mit gondolnak, változhat-e véleményük a közeljövőben. Mindezeket a kérdéseket úgy kell megfogalmazni, hogy se a vélemény léte, se határozott volta, se hiánya ne tűnjék a megkérdezett számára valamilyen okból elkerülendő válasznak, mert ha ezt nem sikerül teljesíteni, akkor a válaszok torzítani fognak. Ilyen, bizonyos válaszok elkerülésére serkentő ok lehet a kérdőív szerkesztői által sugallt vélemény, a korábbi válaszokra alapozott, számon kérő jellegű ellenőrző kérdés vagy meggondolatlan kérdezői reakció („de hát Ön az előbb azt mondta, hogy ...!?”), de még az is, ha egy bizonyos válasz nagy számú további kérdésre vezet. Sajnálatos módon a közvélemény-kutatások eredményeinek közlésekor általában nagyon keveset lehet megtudni azokról a technikákról, amelyeket a nemválaszolás és a valótlan válaszok elkerülésére alkalmaztak a kérdőív szerkesztői. Ezen technikák alkalmazásának szükségessége ugyanakkor azt is maga után vonja, hogy egy kérdőívbe nem lehet egy kérdést minden további nélkül beilleszteni, azaz egy fontos kérdéssel együtt bizonyos bevezető és ellenőrző kérdéseket is fel kell tenni az eredmények megbízhatósága és érvényessége érdekében. Összességében számos ok vezet arra, hogy egy közvélemény-kutatás érdemi kérdésére (például a szavazási szándékra vonatkozó kérdésre) csak lényegesen kevesebb embertől rendelkezünk válasszal, mint amennyien eredetileg a mintába kerültek. Ha például azt tesszük fel, hogy a lemorzsolódás valamennyi lehetséges szinten 15%, akkor ez azt jelenti, hogy az eredeti mintának 15%-át nem sikerült megtalálni, tehát egy 1000 fős mintából 850 fő maradt. Ha ezekből ismét 15% nem hajlandó részt venni a vizsgálatban, akkor 723 embert sikerült lekérdezni. Ha ezek közül ismét 15% nem árulja el pártpreferenciáját, akkor a lényeges információ 625 megkérdezett esetében áll rendelkezésre. Ha mindhárom kiválasztás véletlenszerű lenne, akkor ez a 625 fő az egész 46
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) népességből származó véletlen minta lenne. Amint ezt az előző fejezetben részletesen tárgyaltuk, az a feltevés nem tartható, és általában azt kell feltennünk, hogy a végül is ismeretlen pártpreferenciájú 375 ember véleménye erősen eltérhet az ismert véleményű 625 ember pártpreferenciájától. Ennek a helyzetnek az elemzéséhez még azt is fel kell tételeznünk, hogy a 625 ember egy része, mondjuk ismét 15%, azt válaszolja a kérdésre, hogy még nem döntött arról, melyik pártot támogatja. Így 531 embernek van valamilyen ismert pártpreferenciája, és ebből az 531-ből 30 mondja, hogy egy adott pártra szavazna. Milyen következtetéseket vonhatunk le ezután a párt szavazatainak várható arányára nézve? Az adatok alapján azt mondhatjuk, hogy a valamilyen pártot választók körében 30/531=5,6% szavazna a vizsgált pártra. Ez a becslés azonban a szokásos mintavételi és nem mintavételi hibákon túlmenően két szempontból is kétséges. Egyrészt az eredetileg tervezett 1000 helyett csak 531 ember pártpreferenciája ismert. Másrészt pedig igazából nem a teljes választásra jogosult népesség, hanem csak a szavazáson ténylegesen résztvevők szavazatainak eloszlását akarjuk megbecsülni, hiszen a szavazás eredménye csak a ténylegesen leadott szavazatokon múlik. Ezért azt a kérdést is fel kell tenni, hogy a megkérdezett szándékozik-e szavazni, és egy jó kérdőív különböző eszközökkel ellenőrizni igyekszik az erre a kérdésre adott válasz valóságtartalmát. Tegyük még fel, hogy ennek alapján a kutatók arra a következtetésre jutnak, hogy a válaszoló 625 emberből 500 fog szavazni. Természetesen ez az 500 ember csak részben fedi le azt az 531-et, akiknek határozott pártpreferenciájuk volt, hiszen lehetnek emberek, akik azt állítják, hogy biztosan fognak szavazni, de még nem tudják, kire, és lehetnek olyan emberek is, akiknek határozott pártpreferenciájuk van, de nem fognak szavazni. Mindezek eredményeként a 13. táblázatban látható kép tárul a kutatók elé:
47
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány)
Sokkal jobban áttekinthető a kép, ha megvizsgáljuk, hogy az a 723 ember, aki hajlandó volt részt venni a vizsgálatban, hogyan oszlott meg a szavazási szándék és pártpreferencia kombinált kategóriái között. Ezt mutatja a 14. táblázat.
48
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) A 14. táblázatból a 13. táblázatban szereplő értékek megkaphatók, például az A párt 30 szavazója az A pártot választó és szavazni is szándékozó 25-ből, a szavazni nem szándékozó 3-ból és a szavazási szándékát illetően bizonytalan 2-ből jön össze. Milyen becslést lehet ezen adatok ismeretében adni az A párt várható szavazatarányára? Egy lehetséges becslés, amint azt korábban említettük, a 30/531=5,6%, ami a határozott pártpreferenciával rendelkező megkérdezettek között az A pártot választók aránya. Feltehető, hogy a pillanatnyilag pártpreferenciát nem nyilvánító 94 ember közül is számosan fognak végül is pártot választani. Ezek közül szélső (és csak elméletileg lehetséges) esetben akár mindenki, vagy senki sem fogja az A pártot választani. Ezek a szélsőséges feltevések a (30+94)/723=17,2% és a (30+0)/723=4,1% becslésekhez vezetnek. Ezen szélsőséges lehetőségek között az eltérés annál nagyobb, minél nagyobb a pártpreferenciát nem nyilvánítók száma. Természetesen teljességgel elképzelhetetlen, hogy ha az 531 válaszoló közül 30 választja az A pártot, akkor a 94 nem nyilatkozó közül mind azt választja. Az a lehetőség azonban nem tűnik teljesen kizárhatónak, hogy a 94 nem nyilatkozó közül végül egyik sem választja az A pártot. Ha például elképzelhetőnek tartjuk, hogy a 94 nem nyilatkozó között az A pártot választók aránya négyszerese legyen az 531 nyilatkozó között érvényes aránynak, azaz a 94 nem nyilatkozó 22,4%-a szavazzon az A pártra, akkor közülük 21 fog az A pártra szavazni, és így a helyes becslés (30+21)/723=7,1%. Ekkor tehát a mintánk alapján adható becslés 4,1% és 7,1% között van. Hangsúlyozni kell, hogy most azzal a kérdéssel foglalkozunk, hogy ha mindenkinek lenne deklarált pártpreferenciája azok között, akik részt vettek a vizsgálatban, akkor mi lenne a mintából származó becslés. Azaz a minta alapján adható becslést mennyire befolyásolhatja az, hogy nem mindenki válaszolt a pártpreferenciára vonatkozó kérdésre, illetve az, hogy a válaszolók egy része azt mondta, hogy nincs határozott pártpreferenciája. Ha még azt is figyelembe vesszük, hogy a 723 megkérdezett ember mellett van még 277, akiket nem sikerült megkérdezni, mert vagy nem találtuk meg őket, vagy nem voltak hajlandók részt venni a felmérésben, akkor tovább kell tágítani azt a tartományt, amelyben az 1000 emberen alapuló becslés, ha rendelkezésünkre állna, elhelyezkedne. Ha csak azzal a visszafogott feltételezéssel élünk, hogy a 277 nem megkérdezett ember között az A pártot választók aránya az 5,4% fele és kétszerese között helyezkedhet el, akkor ezzel a 277 ember között az A pártot preferálók számát 7 és 30 közé tesszük. Ebből az 1000 ember között az A pártot választók számára a következő két szélsőséges becslés adható: A ténylegesen megkérdezettek között van legalább 30 ember és legfeljebb 51 ember, tehát összesen legalább 37 és legfeljebb 81, aki az A pártot preferálja, azaz az A pártot az emberek 3,7% és 8,1% közötti hányada preferálja. A válasz- és véleményhiányból eredő bizonytalanság (amely az 1000 ember teljes lekérdezése esetén kapható becslés értékére vonatkozik) összehasonlítható a mintavételi hiba jellemző értékével. Egy 1000 főt tartalmazó minta esetében a mintavételi hiba (amely az 1000 ember adatai alapján adható becslés és a teljes populációra jellemző érték közötti eltérést jelenti) az esetek 95 %-ában nem lesz több, mint 3,2%. Azt mondhatjuk tehát, hogy a mintavételi hiba egy ekkora mintánál hasonló nagyságrendű, mint az a hiba (pontatlanság), amelyet a válaszhiánynak tulajdoníthatunk. Nagyobb mintanagyságok esetén a mintavételi hiba kisebb lesz, de a nemválaszolásból eredő hiba nem csökken. Ezen nem változtat az, ha a becslést csak a 723, 625 vagy akár az 531 emberre vonatkozóan adjuk meg. Ekkor kissé nagyobb mintavételi hibára fogunk gondolni (mivel a mintanagyság kisebb, mint 1000), de 49
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) ennek hatása nem összemérhető a nemválaszolók miatt fellépő bizonytalanság mértékével, és nem oldja meg azt a problémát, hogy a becslést így egy nem véletlen mintára alapozzuk, és emiatt nem várhatjuk, hogy legalább átlagosan pontos legyen. Hangsúlyozni kell, hogy a mintavételi hiba nagysága egzakt matematikai eredmény, míg a válaszhiányból származó hiba nagyságára adott becslés feltevéseken alapuló hipotetikus érték. Abban az esetben, ha a közvélemény-kutatók olyan becslést tesznek közzé, amely az itt bemutatott feltevéseken vagy ehhez hasonlókon is alapul, akkor meg kell mondaniuk, hogy becslésük úgynevezett szakértői becslés. Egy ilyen becslés az adatokon kívül még egyéb ismereteken és feltevéseken is alapul, és jelentése egész más, mint egy olyan becslésé, amely kizárólag az adatokon és ezek statisztikai elemzésén alapul, és nem használ feltevéseket a hiányzó információk helyettesítésére. Ezt a fajta becslést statisztikai becslésnek nevezzük. A szakértői és statisztikai becslések közül egyik sem jobb általában a másiknál, ezek egyszerűen teljesen különböző és nem összehasonlítható elemzési eredmények. Figyelembe véve, hogy a választás eredményének előrejelzésére nem a teljes népességből kell az A pártot választók arányát megbecsülni, hanem azok közül, akik ténylegesen szavazni fognak, még nehezebb feladattal találják magukat szemben a közvélemény-kutatás készítői. Nem csak azzal kapcsolatban bizonytalanok az ismereteik, hogy hányan szavaznának az A pártra, hanem még azt sem tudják biztosan, hogy hány ember közül, hiszen ekkor a hányados nevezőjébe a ténylegesen szavazók számát kellene tenniük. A fenti táblázatban azt látjuk, hogy a magát biztosan szavazónak minősítő 500 ember közül 25 preferálja az A pártot, ami 5%-os becslést eredményez a szavazatokra. Még ha eltekintünk is attól, hogy emberek, akik magukat jelenleg biztos szavazóknak vagy biztos nemszavazóknak minősítik, ténylegesen nem feltétlenül fognak ennek megfelelően részt venni vagy nem részt venni a szavazáson, és csak arra gondolunk, hogy a jelenleg bizonytalan 24 ember közül hány fog szavazni, továbbá arra, hogy a pillanatnyilag meg nem kérdezett 277 emberből hány fog szavazni, akkor az előző bekezdésben adott becslések hányadosait lényegesen meg kell változtatnunk. Ráadásul további problémát jelent, hogy a mostani bizonytalanok vagy egyáltalán nem válaszolók közül azok fognak-e inkább szavazni, akik az A pártot preferálják, vagy inkább azok, akik más pártokat választanak. Erre nézve már különböző feltevéseket megfogalmazni sem egyszerű, nem is beszélve arról, hogy milyen nehéz lenne ezeket a feltevéseket ellenőrizni. Mindenesetre nem tűnik túlzásnak azt mondani, hogy ezeket a tényezőket figyelembe véve az 1000 ember alapján ténylegesen adható becslés 2% és 13% között lehet. Mindez ismételten megerősíti azt a korábban már megfogalmazott tanulságot, hogy az adott közvélemény-kutatásra fordítható pénzt csak mértékkel érdemes a mintanagyság növelésére fordítani. Néhány ezres mintanagyság felett inkább a választott minta minél pontosabb és teljesebb lekérdezésére kell az erőforrásokat fordítani.
Összefoglalás A nem megtalálhatók, a megkérdezést visszautasítók, a véleményt nem nyilvánítók valóságos véleménye jelentősen eltérhet azok véleményétől, akik végül is érdemi válaszokat adtak. Ezért a 50
6. Mi történik azokkal, akik nem válaszolnak? (Válasz- és véleményhiány) válaszhiányok tényét és súlyát nem szabad elfedni a minta kiegészítésével vagy a nemválaszolás tényének elhallgatásával. A közvélemény-kutatás végrehajtásának minőségére vonatkozó legfontosabb számszerűsíthető mutató az eredeti mintából ténylegesen válaszolók aránya. Ennek ismerete nélkül az eredmények megbízhatóságára nézve még csak becsléseket sem lehet tenni. Az estelegesen hiányzó válaszok csak szerencsés esetekben pótolhatók a tényleges válaszok alapján. Ezeknek a pótlásoknak a közvélemény-kutatás minőségére gyakorolt hatása hasonló az egyáltalán nem lekérdezettek számából és eltérő véleményéből származó torzításhoz. Ha a hiányzó információk pótlására feltételezéseket alkalmaznak, a kapott eredményeket szakértői becslésnek nevezik.
51
7. Egyformán fontos minden válasz? (Súlyozás) A korábbi fejezetekben láttuk, hogy a véletlen mintavételi eljárások átlagosan olyan mintákhoz vezetnek, amelyek hűen reprezentálják azt a sokaságot, amelyikből a mintát választották, és a hiba nagyságára nézve valószínűségi jellegű állításokat tehetünk. Ezek azt mondják ki, hogy a mintából kapható becslés hibája adott valószínűséggel egy hibahatár alatt marad. Természetesen minél kisebb hibahatárra gondolunk, annál kisebb valószínűséggel lesz a becslés ezen belül. Ebben a fejezetben azzal a kérdéssel foglalkozunk, hogy mit szokás tenni olyankor, amikor a közvélemény-kutatás készítői azt tapasztalják, hogy mintájuk valamely ellenőrizhető szempontból eltér a populációra jellemző értékektől. Ennek a helyzetnek az illusztrálására vizsgáljuk ismét azt a pici országot, amelyet már a 2. fejezetben is használtunk. Ebben az országban tíz választásra jogosult ember él, öt férfi és öt nő. A választáson két párt indul, A és B, és mindenki választ pártot. A férfiak közül négyen szavaznak az A pártra, a nők közül egy. Az ország lakóinak nemek szerinti megoszlása ismert a kutatás készítői előtt, a pártpreferenciák azonban nem. A valódi helyzetet a 15. táblázat tartalmazza.
Tegyük fel, hogy a közvélemény-kutatók a rendelkezésükre álló pénz és a becslés pontosságára vonatkozó igény alapján egy négy főt tartalmazó minta szavazási szándékait vizsgálják. A kutatók a véletlen eljárás eredményétől függően vagy olyan mintát kapnak, amely a nemek szerinti eloszlás szempontjából reprezentatív, vagy olyat, amelyik nem reprezentatív. Ha a minta a nemek szerinti eloszlást pontosan tükrözi, azaz a mintában két nő és két férfi van, a kutatók örülhetnek, mert a véletlen mintavétel ezen ismert szempontból reprezentatív mintát eredményezett. Ha a nemek szerinti eloszlás eltér a nemeknek a populációban ismert eloszlásától, akkor sem kell elkeseredni, mert attól, hogy a nemek szerinti arány szempontjából a minta nem reprezentatív, a valóban érdekes szempont, a pártpreferencia szerint még lehet reprezentatív. Összesen 210 különböző minta lehetséges, amelyek a 16. táblázatban látható típusokba sorolhatók:
52
7. Egyformán fontos minden válasz? (Súlyozás)
53
7. Egyformán fontos minden válasz? (Súlyozás)
54
7. Egyformán fontos minden válasz? (Súlyozás)
Összesen tehát 210 különböző minta lehetséges, amelyek a 16. táblázatban felsorolt tizenhat típus valamelyikébe tartoznak. A mintából kapott szavazati arányokat használhatjuk a populációban érvényes szavazati arányok becsléseként. Például az első típusú mintából azt becsülnénk, hogy az A párt szavazóinak aránya 100%, a harmadik típusú minták akármelyikét megfigyelve pedig az A 55
7. Egyformán fontos minden válasz? (Súlyozás)
párt szavazóinak arányát 75%-ra becsülnénk. Az ötödik típusú minták valamelyikét megfigyelve az A párt szavazóinak arányát szintén 75%-ra becsülnénk. Ez utóbbi éppen egy olyan minta, amely nem tükrözi pontosan a nemek közötti arányokat, hiszen a kutatók tudják, hogy a populációban ugyanannyi nő van, mint férfi, a mintában pedig a megkérdezettek háromnegyede férfi. Ezt úgy is mondjuk, hogy a férfiak túl vagy felül vannak reprezentálva a mintában. Ennek megfelelően a nők alulreprezentáltak. Ezen a ponton a gondos kutató valószínűleg megnézné a az A párt népszerűségét külön a nők és külön a férfiak között. Az itt használt példa túl kis számokkal dolgozik ahhoz, hogy reális becslést lehessen adni az A párt népszerűségére nemenként, de egy valódi közvéleménykutatásnál, ahol még az egyik csoport jelentős alulreprezentáltsága esetén is több száz megfigyelés lenne csoportonként, ez lehetséges. Ha a kutató azt tapasztalja, hogy a párt népszerűsége különböző nemenként, akkor azt gondolhatja, hogy az egész minta talán nem ad pontos becslést az A párt népszerűségére, ha a minta nem tükrözi helyesen a nemek arányát a népességben. A jelen példában a kutató azt tapasztalná, hogy a férfiak kétharmada, a nők közül pedig mindenki az A pártra szavazna (egy ötödik típusú mintában). Ha ezek a becslések pontosak, akkor az egész populációban, ahol az emberek 50%-a férfi, 50%-a nő, az A párt szavazóinak aránya 0,5×2/3+0,5×1=5/6 lenne. Ez utóbbi érték az A párt szavazóinak súlyozott becslése. Ebben a becslésben az ismert nagyságú társadalmi csoportok (férfiak és nők a példában) valódi súlyuknak megfelelően szerepelnek, azaz a férfiaknak a mintában talált szavazási arányát (2/3) a férfiak valódi arányával (50%) vesszük figyelembe, nem pedig a mintabeli arányukkal, és hasonlóképpen a nők esetében. A fenti példában a súlyozás nem volt szerencsés. A súlyozatlan (nyers) becslés az A párt szavazóinak arányára 3/4, és ez közelebb van a valódi értékhez (1/2), mint a súlyozott becslés (5/6). Ezt persze a kutatók nem tudják megállapítani, hiszen ők nem ismerik az A párt szavazóinak tényleges arányát. Ha ez ismert lenne számukra, nem végeznének közvélemény-kutatást. Más esetekben a súlyozott becslés közelebb visz a helyes értékhez. Például a negyedik típusú minta megfigyelése esetén a nyers becslés az A párt szavazóinak arányára 75%, a súlyozott becslés pedig 0,5×1+0,5×0=0,5=50%, mert ebben a mintában minden férfi az A pártra szavaz és minden nő a B pártra. Annak érdekében, hogy a súlyozás alkalmazásáról vagy elvetéséről döntsünk, nem azt kell megnézni, hogy egyes esetekben az eljárás előnyös, vagy hátrányos, mert azt úgysem lehetne eldönteni, hogy az aktuális esetben éppen hasznos-e. Ehelyett annak megvizsgálására van szükség, hogy általában a súlyozott becslések jobbak, vagy rosszabbak-e, mint a súlyozatlan becslések. Intuitíve azt mondhatjuk, hogy ha a súlyozás szempontja szerint az eltérések lényegesek (például a férfiak és nők szavazási szándékai erősen eltérnek), akkor a súlyozott becslések alkalmazása előnyösnek tűnik, ha azonban a vizsgált kérdés nem függ a súlyozásra használható változótól, akkor a súlyozás nem szükséges. A fenti példa esetében a 17. táblázat a 16 lehetséges minta- fajtára tartalmazza az A párt szavazóinak arányára vonatkozó súlyozatlan és súlyozott becsléseket.
56
7. Egyformán fontos minden válasz? (Súlyozás)
A 210 lehetséges minta közül 118-ban a súlyozott és súlyozatlan becslés azonos eredményt ad, 32ben a súlyozott becslés jobb és 60-ban rosszabb eredményt ad, mint a súlyozatlan becslés. Annak megítéléséhez, hogy a súlyozott, vagy a súlyozatlan becslés a jobb, nem elegendő azt megnézni, hogy melyik hányszor jobb, hanem azt is figyelembe kell venni, hogy az eltérések mekkorák. 57
7. Egyformán fontos minden válasz? (Súlyozás)
Valamennyi esetben, amikor a súlyozott becslés jobb, mint a súlyozatlan, a súlyozott becslés 1/4del jobb, mint a súlyozatlan (1/2 a súlyozott becslés, 1/4-del, illetve 3/4-del szemben). Azon esetek közül, amikor a súlyozatlan becslés jobb, 12 alkalommal a nyereség 1/12 (az 5. és a 13. típusú mintáknál), és 48 alkalommal 1/6 (a 7. és a 10. típusú mintáknál). Ezeknek az úgynevezett hibaeloszlásoknak az összehasonlítására többféle eljárás kínálkozik. A leggyakrabban használt az, amelyikben az eltérések négyzeteinek összegét számítjuk ki és hasonlítjuk össze. Azért használjuk a négyzeteket, hogy a nagyobb eltéréseket arányosan jobban büntessük, mint a kicsiket. Ha például két eljárást szeretnénk összehasonlítani, amelyek közül az egyik csak egy hibát vét és annak nagysága 5, a másik pedig két hibát, és azoknak nagysága 2 és 3, akkor az első eljárás négyzetes hibája 5*5=25, a második eljárás négyzetes hibája pedig 2*2+3*3=13. Ezért a második eljárást tartjuk jobbnak, annak ellenére, hogy a hibák (nem négyzetes) összege azonos a két eljárásnál (5=2+3), sőt a második eljárás kétszer hibázik, míg az első csak egyszer. Ahhoz, hogy ezt a módszert a súlyozott és súlyozatlan becslések összehasonlítására alkalmazhassuk, meg kell határozni minden lehetséges minta esetében a kétféle becslési eljárás négyzetes hibáját. Ennek részleteit mutatjuk be a 18. táblázatban. Ne feledjük, hogy a valódi érték, amelyet becsülni szeretnénk, 1/2, és ehhez képest számítjuk a négyzetes eltéréseket.
58
7. Egyformán fontos minden válasz? (Súlyozás)
Az eljárások négyzetes hibájának összehasonlítására ezután a különböző mintatípusokra vonatkozó négyzetes hibákat a megfelelő minták számával súlyozva össze kell adni, és a kapott eredményeket összehasonlítani. A számítást egyszerűsíthetjük, ha azokban az esetekben nem adjuk össze a hibákat, amelyekben a két eljárás hibája azonos, hiszen ezek a tagok nem befolyásolják azt, hogy 59
7. Egyformán fontos minden válasz? (Súlyozás)
melyik eljárás négyzetes hibája nagyobb és melyiké kisebb. Csak a különböző tagokat összegezve (és egyszerűsítve) a súlyozatlan becslésekre a 11/4, a súlyozott becslésekre a 8/3 értéket kapjuk. Az előbbi érték kettő egész és háromnegyed, az utóbbi kettő egész és kétharmad, tehát kisebb. Emiatt a súlyozott becslések négyzetes hibája kisebb, mint a súlyozatlanoké. Az eltérés kicsinek tűnik, de valódi becslési feladatokban az itteninél nagyobb lehet, ráadásul a súlyozott becslésekből származó előny nagyságát a mintavételi hibahatárhoz kell viszonyítani – amely érték szintén kicsi. Az eltérés mértéke azon múlik, hogy milyen jellegű a kapcsolat a súlyozásra használt változó és a megbecsülni kívánt szempont között. Mielőtt ennek az összefüggésnek a részleteit megvizsgálnánk, bemutatjuk a súlyozáson alapuló becslés egy másik értelmezését. A súlyozott becslés azt a hibát korrigálja, amely abból keletkezik, hogy bizonyos társadalmi csoportok nem a populációbeli arányaiknak megfelelően kerültek a mintába, azaz a minta ezek szempontjából nem reprezentatív. Ha például a 10. típusú mintát figyeljük meg, akkor ebben 1 férfit és 3 nőt találunk, holott tudjuk, hogy a populációban ugyanannyi nő van, mint férfi. A mintánkban ezért két nőt és két férfit várunk. Ahhoz, hogy ezt megközelítsük, az egyetlen megfigyelt férfit valamilyen módon kettőnek kellene tekintenünk, és a három megfigyelt nőt valamilyen módon szintén kettőnek kellene tekinteni. Ezt úgy érhetjük el, hogy minden megfigyeléshez egy súlyt rendelünk úgy, hogy a férfiak súlyainak és a nők súlyainak összege is kettő legyen. A férfiakon belül és a nőkön belül természetesen nem kívánjuk az arányokat megváltoztatni. Ezért az egyetlen megfigyelt férfi súlya 2 lesz, és minden megfigyelt nő súlya 2/3. Így a férfiak összes súlya 2 és a nők összes súlya is 2. Az alulreprezentált csoport tagjainak súlya egynél nagyobb, a felülreprezentált csoport tagjainak súlya egynél kisebb. Súlyozás után ebben a mintában lesz az A pártnak egy 2 és egy 2/3 súlyú szavazója, a B pártnak pedig két 2/3 súlyú szavazója. Ezért az A párt szavazóinak aránya (2+2/3)/4=2/3. Ez megegyezik az ebből a mintából kapható súlyozott becsléssel. A súlyozott becsléseket tehát úgy is megkaphatjuk, hogy a megfigyelésekhez rendelünk súlyokat, és az így súlyozott mintából számítunk (súlyozatlan) becslést. Egy megfigyelés súlyát úgy határozzuk meg, hogy elosztjuk az őt tartalmazó csoport populációbeli arányát a mintabeli arányával. Ez a hányados a megfigyelés súlya. A 19. táblázatban mind a 16 lehetséges mintatípusra megadjuk a minta súlyozott változatát. Minden cellába az ottani megfigyelések súlyának összege kerül.
60
7. Egyformán fontos minden válasz? (Súlyozás)
61
7. Egyformán fontos minden válasz? (Súlyozás)
62
7. Egyformán fontos minden válasz? (Súlyozás)
Azok a minták, amelyek nem tartalmaznak nőt vagy nem tartalmaznak férfit, nem súlyozhatók abban az értelemben, hogy a nem megfigyelt csoport tagjainak akármekkora súlyt is adnánk, ezek összege nem lehetne kettő. (A valóságban természetesen nem találkozunk olyan mintákkal, amelyek ne tartalmaznának férfiakat és nőket is. A jelen esetben ez a jelenség a nagyon kicsi mintanagyság következménye.) Azoknál a mintáknál, amelyeknél két nőt és két férfit figyeltünk meg, azaz a minta a nemek szerinti megoszlás szempontjából reprezentatív, a súlyozás nem
63
7. Egyformán fontos minden válasz? (Súlyozás)
változtat semmit, minden megfigyelés súlya továbbra is 1. A súlyozás a többi (súlyozható) mintát is reprezentatívvá tette a nemek szerint. A gyakorlatban általában nem egyetlen szempont, hanem több szempont kombinációja szerint súlyoznak. A súlyozáshoz használt szempontok kiválasztásában szerepet játszik az, hogy milyen változók lehetnek egyáltalán súlyozás alapjai, és az, hogy mely változókról gondoljuk, hogy az ezeket felhasználó súlyozás jobb becslésekhez vezet. Súlyozáshoz azokat a változókat lehet használni, amelyek megoszlása a vizsgálni kívánt népességben ismert. Ilyen változók a nem, az iskolai végzettség, a kor, a településtípus, ahol a megkérdezett lakik. Ezeknek a változóknak a megoszlása nem csak egyenként ismert, hanem együttesen is, azaz lehet tudni, hogy az ország lakosságának mekkora hányada esik ezen változók kategóriáinak egy-egy kombinációjába. A súlyozás akkor hasznos, ha a súlyozásra használt változó által definiált csoportokban a vizsgált változó homogénebb, mint általában, és ilyenkor előfordulhat, hogy a becslések közelebb lesznek a tényleges értékhez, mint amit a hibahatár alapján várnánk. Előző példánkhoz visszatérve, ha a nők pártpreferenciái eltérnek a férfiak pártpreferenciáitól, akkor a nemek szerinti súlyozás jobb becslésekre vezet. Ez volt a helyzet a példában. Ha a nők és a férfiak pártpreferenciái azonosak, azaz a pártpreferencia független a nemtől, akkor érdektelen, hogy a minta pontosan reprezentáljae a nemek közötti arányokat. Mikor várhatjuk, hogy azok az emberek, akik valamilyen szempontból ugyanabba a csoportba tartoznak, a vizsgált változó (például pártpreferencia) szerint hasonlóbbnak mutatkozzanak egymáshoz, mint az egész népességbe tartozó összes ember? Egy tetszőleges változó kategóriái által definiált csoportok annál homogénebbek (azaz saját magukon belül hasonlóak) a vizsgált változó szerint, minél jobban eltérnek egymástól a vizsgált változó szerint azok az emberek, akik különböző csoportokba tartoznak. Tehát például a nem által definiált csoportok (nők és férfiak) annál homogénebbek szavazási szándékaik szerint, minél jobban eltérnek a nők és a férfiak szavazási szándékai egymástól. Ez az állítás matematikailag is megfogalmazható és bizonyítható, természetesen a homogenitás és eltérés megfelelő definíciója mellett. Súlyozás alapjául olyan változókat érdemes választani, amelyeknél a különböző kategóriáiba tartozás feltehetőleg különbségeket fog okozni a vizsgálandó változó eloszlásában. Az előző bekezdésben felsorolt demográfiai változók éppen ilyenek, és ezért ezek kombinációját szokás használni súlyozásra, bár nyilvánvaló, hogy ezek hatása különböző érdemi kérdések esetén más és más lehet. A gyakorlatban a súlyozást úgy valósítják meg, hogy a fenti négy szempont (nem, iskolai végzettség, kor, településtípus) szerinti keresztosztályozást elkészítik a mintában is és a populációban is. Ez utóbbi táblázat a KSH adataiból származik. Ezt a két táblázatot hasonlítják össze a súlyok megállapítására, éppen úgy, ahogy mi hasonlítottuk össze a nemek megfigyelt arányát a mintában a nemeknek a populációban ismert arányával. Minden megfigyelésnek, aki az előbbi táblázatban azonos helyzetű (azaz négy változó szerint ugyanabban a kategóriakombinációban van), ugyanaz lesz a súlya, éppúgy, ahogy példánkban minden férfinak ugyanakkora a súlya, és minden nőnek ugyanakkora a súlya. Ez a súly egyenlő a megfelelő kombinált kategóriának a populációban érvényes százalékos arányának és a mintában megfigyelt százalékos arányának a hányadosával. 64
7. Egyformán fontos minden válasz? (Súlyozás)
Ha minden megfigyelést az így meghatározott súllyal vesznek számításba, akkor olyan mintához jutnak, amely a négy súlyozó változó szerint reprezentatív. Hangsúlyozni kell, hogy ezen manipuláció után a minta még véletlen marad, és jellemzői hasonlóak lesznek egy olyan minta jellemzőihez, amelynek kiválasztásánál a nem, kor, iskolai végzettség és településtípus változók együttes rétegző szempont voltak, ha a súlyok egyike sem tér el nagyon 1-től. (A minta itt tárgyalt súlyozását pontosabban utólagos rétegzésnek is nevezik.) A súlyozás nem olyan eljárás, amelyet minden korlát nélkül alkalmazhatunk. Az eddig bemutatott előnyös tulajdonságok csak addig jellemzik a súlyozást, amíg azt a véletlen mintavétel következtében keletkező kis pontatlanságok helyesbítésére használják. A harmadik fejezetben közölt táblázatok információt adnak arra, hogy egy helyesen választott és megfelelő méretű minta esetén a populációra jellemző arányok és a mintabeli arányok között mekkora eltérést várhatunk. Ha a vizsgálat mintanagysága 2000, és a populációban 53% a nők aránya, de a mintában csak 42% a nő, akkor ezt a hibát látszólag korrigálhatjuk súlyozással, mégpedig úgy, hogy minden nő súlya 0.53/0.42 lesz, és a férfiak súlyait is megfelelően megváltoztatjuk. Ezzel egy olyan súlyozott mintát kapunk, amely 50% nőt tartalmaz. De jó-e ez a minta? Egy 2000 nagyságú mintánál 53% nő helyett 42% nőt megfigyelni rendkívül valószínűtlen, és helyesebb, ha azt gondoljuk, hogy a mintavételi eljárás rossz volt, mint azt, hogy éppen nem volt szerencsénk. Ha a mintavételi eljárás rossz, akkor a mintát semmilyen transzformáció nem javítja meg. Ha a mintavételi eljárás annyira rossz volt, a férfiak és nők arányát illetően ilyen óriási – a véletlennek nem betudható mértékű – hibát vétettünk, akkor nem számíthatunk arra sem, hogy külön a férfiak között és külön a nők között sikerült reprodukálni a pártpreferenciákat. Márpedig ezt az információt a súlyozott minta is megőrzi az eredeti adatokból. Ilyenkor a súlyozás sem segít. Elkendőzheti a mintaválasztás hibáit, de nem javítja ki azokat. Pontosabban fogalmazva, ezekben az esetekben a súlyozás megszüntetheti a rossz mintából származó torzítást, de azon az áron, hogy a hibahatárt nagyon megnöveli és összességében a becslések pontatlansága meg is nőhet. A minta súlyozása csak akkor helyes eljárás, ha a minta amúgy is majdnem reprezentatív a súlyozásra használt változók szempontjából, az eltérés nem valószínűtlenül nagy az adott mintanagyság mellett. Ilyenkor viszont a súlyozás tényleg javítja a becsléseket. Ezért a súlyozás helyes vagy helytelen voltának megítéléséhez tudni kell azt is, hogy mekkora változtatásokat eredményezett a mintában. Ebben az értelemben csak kis változtatások fogadhatók el.
Összefoglalás A minta súlyozása olyan eljárás, amellyel a mintát néhány ellenőrizhető szempontból reprezentatívvá lehet tenni. A mintában a populációhoz képest alulreprezentált csoportok tagjai 1nél nagyobb súlyt, a felülreprezentált csoportok tagjai 1-nél kisebb súlyt kapnak. A súlyozást a minta valószínűtlenül nagy hibáinak eltüntetésére nem szabad használni, ilyenkor inkább azt kell feltenni, hogy hibás volt a mintavételi eljárás. A súlyozás csak a minta kicsi, a véletlen mintavételnek betudható hibáinak korrigálására használható. Ilyenkor a súlyozott mintából adott becslések, amelyek azonosak az eredeti mintából adható súlyozott becslésekkel, jobbak, mint a súlyozatlan becslések. 65
7. Egyformán fontos minden válasz? (Súlyozás)
A súlyozás elfogadhatóságának megítéléséhez ismerni kell a legnagyobb és legkisebb súlyokat, mert ezek mutatják a legerősebb alul- és felülreprezentáltság mértékét.
66
8. Hogyan értelmezzük az eredményeket? Egy közvélemény-kutatás publikált eredményei többnyire százalékok és átlagértékek. Például a választásokon szavazni szándékozók aránya a szavazásra jogosultak között, egy pártra szavazók aránya a szavazni szándékozók között, egy politikus népszerűségi pontszámainak átlaga. Amint már arra korábban is utaltunk, technikai értelemben a százalékértékek is átlagok: a vizsgált alternatívát választóknak adott 100 és a többieknek adott 0 értékek átlaga. Az eredmények továbbá gyakran tartalmaznak összehasonlításokat. Például az A párt szavazóinak száma meghaladja a B párt szavazóinak számát vagy X politikus népszerűbb, mint Y politikus. Ebben a fejezetben ezeknek az eredményeknek az értelmezéséről lesz szó. Létezik még kétféle releváns összehasonlítás, nevezetesen az, amely a közvélemény-kutatás készítőinek korábbi eredményeit hasonlítja össze a mostani eredményeikkel (például, az A párt népszerűsége az elmúlt időszakban 3%-kal növekedett), és az, amelyben a közvéleménykutatások eredményei iránt érdeklődő olvasó különböző közvélemény-kutató cégeknek nagyjából egy időben, ugyanabban a témában végzett felméréseinek eredményeit hasonlítja össze. Ezeknek az összehasonlításoknak a kombinációja is lehetséges, tehát kíváncsiak lehetünk különböző cégek által különböző időpontokban készített közvélemény-kutatások eredményeinek az összehasonlító elemzésére is. Ezek az összehasonlítások eltérnek az előzőktől, és később lesz majd szó az alkalmazható módszerekről. A könyv korábbi fejezeteiben részletesen tárgyaltuk azokat az eljárásokat, ahogyan egy átlagra vagy százalékértékre vonatkozó becsléshez a közvélemény-kutatás készítői eljutnak. Helyesen megtervezett és végrehajtott mintavétel esetén ezek a becslések átlagosan pontosak és kis hibahatár tartozik hozzájuk, azaz nagy megbízhatósággal nem térnek el jelentős mértékben az egész populációra jellemző valódi értéktől. Ennek az elméletnek az alkalmazhatóságát jelentősen ronthatják a mintaválasztás hibái, a kérdezés felületes végrehajtása, a rosszul szerkesztett kérdőív. A hibák kétféle értelemben ronthatják el a becsléseket. Egyrészt előfordulhat, hogy egy közvélemény-kutató cég, az alkalmazott módszereket állandónak feltételezve, ugyanabban a témában több közvélemény-kutatást végrehajtva, rendszeresen, és ezért átlagosan is, a valódi értéknél nagyobb (vagy rendszeresen kisebb) becslést ad. Például egy cég a politikai pártok népszerűségét rendszeresen vizsgálja. Előfordulhat, hogy az A párt népszerűségére nézve valamennyi becslése a valódi értéknél nagyobb lesz, és a B párt népszerűségére adott becslése pedig minden esetben kisebb lesz a valódi értéknél. Az ilyen szisztematikusan jelentkező eltérést torzításnak nevezzük. Ennek többféle oka lehet. Például a minta készítésére használt címlistában felülreprezentáltak az A párt szimpatizánsai (és alulreprezentáltak a B párt szavazói). Vagy a közvélemény-kutató cégről a lakosság egy részében kialakult kép miatt az A párt szavazói nagyobb arányban hajlandóak részt venni a megkérdezésben, mint a B párt szavazói. (Megjegyezzük, hogy egy felmérés, amely a magyar lakosság körében azt vizsgálta, hogy létezhet-e ilyen hatás, nem talált érdemi különbséget a legnagyobb közvélemény-kutató cégek lakossági megítélésében.) Vagy 67
8. Hogyan értelmezzük az eredményeket?
a kérdőív szerencsétlen szerkezete miatt a bizonytalan pártpreferenciájú válaszolók egy része az A pártot választja, esetleg a B párt szavazói kisebb arányban számolnak be pártpreferenciájukról, mint az A párt szavazói. Az ilyen jellegű torzítások egy része nem elkerülhető. Például, ha az A párt kormányzati szerepet játszik, a B párt ellenzékben van, a C párt pedig nincs is képviselve a parlamentben, akkor elkerülhetetlen, hogy a közvetlen szavazási szándékon kívül még más szempontok is szerepet játsszanak a válaszokban. Még ha a kérdések, a mintavétel és a felmérés egyéb körülményei teljesen azonos esélyeket biztosítanak is ezeknek a pártoknak, azaz általános értelemben azonos kérdéseket tesznek fel ezekre vonatkozóan, az azonos kérdések mégis némileg különböző dolgokra vonatkoznak, mivel ezeknek a pártoknak a helyzete lényegesen különbözik. Ugyanakkor feltehető, hogy ennek a torzításnak a mértéke a választások időpontjának közeledésével csökken. A becslések elméleti tulajdonságaitól való eltérés másik lehetséges fajtája az, amelynek következtében a becslések ugyan torzítatlanok, azaz hosszabb távon átlagosan helyesek, de az egyes becsléseknek a helyes értéktől számított eltérései átlagosan meghaladják azt a mértéket, amely a véletlen mintavételből következne. Általában ezt eredményezik a felmérés végrehajtásának esetleges elemei, amelyek a mintavételi hibára rárakódnak. Ilyen esetleges hibák a közvéleménykutatás módszereinek (beleértve a mintavételi eljárást, a kérdezőbiztosokat, az adatgyűjtés módját, a kérdőívet) nem kellő pontossággal definiált voltából (például rosszul képzett, nem ellenőrzött kérdezők) származnak. A módszerek (még ha önmagukban jók is) gyakori változtatása szintén a hiba növekedésének irányába hat. Hasonló lehet a következménye az előző fejezetben tárgyalt súlyozás „mértéktelen” alkalmazásának is. Az előző bekezdésekben tárgyalt szempontok egyszerűen kiterjeszthetők arra az esetre, amikor az ismételt közvélemény-kutatásoknak nem ugyanazt az értéket kellene előrejeleznie, például azért, mert a pártok népszerűsége időközben változik. A fenti szempontok érvényesek maradnak úgy, hogy a populációra jellemző érték helyett a populációra aktuálisan jellemző értéket kell érteni. A torzítás és a nagy hibahatár (a köznapi beszéd mindkettőt pontatlanságnak hívná) határozottan megkülönböztetendő veszélyek. Nagy hibahatár esetén is lehetnek az eredmények torzításmentesek. Például az A párt szavazóinak valódi aránya tíz egymást követő felvétel idején a népességben 10%, 13%, 14%, 12%, 11%, 14%, 11%, 11%, 12%, 12%. Tegyük fel, hogy a közvélemény-kutató cég minden alkalommal 2000 embert kérdez meg, és a következő becsléseket kapja: 15%, 17%, 10%, 8%, 15%, 10%, 14%, 10%, 7%, 14%. Ha most megnézzük, hogy a becslések hogyan tértek el a valódi értékektől, akkor a következő különbségeket kapjuk: +5%, +4%, –4%, –4%, +4%, –4%, +3%, –1%,-5%, +2%. Ezeknek a különbségeknek az átlaga nulla, tehát a tíz felvétel során a közvélemény-kutató cég eljárása torzítatlannak mutatkozik, mert becslései átlagosan helyesek voltak (amiből nem feltétlenül következik, hogy húsz vagy harminc felmérés is átlagosan torzítatlan lenne). Ugyanakkor az esetek többségében az eltérés a becslés és a valódi érték között sokkal nagyobb, mint amekkorát (itt nem részletezett matematikai megfontolások alapján) egy 2000 nagyságú minta tízszeri megfigyelésénél hihetőnek tartanánk, tehát a hibahatár feltehetőleg nagyobb, mint amit a mintanagyság alapján várnánk. 68
8. Hogyan értelmezzük az eredményeket?
Hasonlóképpen lehetséges, hogy a hibahatár megfelel a mintanagyság alapján várhatónak, de a becslés torzított. Például egy másik közvélemény-kutató cég is készít 2000 személy megkérdezésén alapuló felméréseket ugyanazokban az időpontokban, amikor az előző, és a következő becsléseket adja az A párt szavazóinak arányára: 8%, 12%, 13%, 10%, 14%, 9%, 12%, 10%, 10%, 12%. Ebben az esetben a hibák a következők: –2%, –1%, –1%, –1%, –1%, –1%, +1%, –1%, –1%, 0%. A hibák átlagos értéke –0,8%. A hibák átlagosan nem túl nagyok, nem valószínűtlenek egy 2000 nagyságú minta esetén, tehát – legalábbis ebből a szempontból – a közvélemény-kutatás készítői jó munkát végeztek, a tényleges hiba lényegében akkora, mint a várható mintavételi hiba. Ugyanakkor a tíz esetből nyolcszor a párt szavazóinak számát alulbecsülték a kutatás készítői és csak egyetlen alkalommal becsülték túl. Ez arra utal, hogy az eljárás esetleg torzított, hiszen kis mértékben ugyan, de rendszeresen alulbecsüli a párt szavazóinak arányát. (Ismét megjegyezzük, hogy az, hogy tíz esetben torzítás látszik, nem feltétlenül jelenti azt, hogy az eljárás tényleg torzított.) A legrosszabbak azok az eredmények, amelyek túlnyomórészt egyirányú és nagy hibákat vétenek, például 15%, 18%, 17%, 15%, 18%, 16%, 15%, 16%, 15%, 16%. Ezek az eredmények rendszeresen és nagymértékben felülbecsülik a valódi értékeket. Hangsúlyozni kell, hogy a fenti számítások a valóságban nem végezhetőek el, mert a populációra jellemző valódi érték nem ismert. Ezért az adatok pontosságára nézve csak az eljárás módszereinek minőségére alapozva tehetünk állításokat. A politikai közvélemény-kutatások esetében kivételt képeznek ez alól a választást vagy népszavazást közvetlenül megelőző felmérések eredményei és a közvetlenül a szavazás után készülő közvélemény-kutatások. A közvélemény-kutatások eredményeinek értelmezésében lényeges szerepet játszanak az összehasonlítások, vagy az adott felmérés adatai között, vagy pedig korábbi felmérések adataival. Abban, hogy egy becsült érték eltérhet a populációra jellemző valódi értéktől, sokféle ok játszik szerepet. Ezért ugyanannak a felmérésnek különböző eredményei általában nem ugyanakkora mértékben hibásak. Ha az eredmények azt mutatják, hogy az A párt szavazóinak aránya 11%, a B párt szavazóinak aránya 15%, akkor ebből nem lehet teljes bizonyossággal arra következtetni, hogy a teljes populációban többen szavaznának a B pártra, mint az A pártra. Mindkét becsült érték tartalmazhat hibát (azaz eltérést a valódi értékhez képest), és ennek irányától és nagyságától függ, hogy a megfigyelt értékek alapján milyen állítást tehetünk a populációban érvényes értékekre nézve. Azt természetesen nem tudhatjuk, hogy a hibák milyen előjelűek, tehát az történik-e, hogy felülbecsüljük az A párt szavazóinak számát, és alulbecsüljük a B párt szavazóinak számát, avagy alulbecsüljük az A párt szavazóinak számát, és felülbecsüljük a B párt szavazóinak számát, avagy esetleg mindkét párt esetében azonos előjelű a hiba. Az első esetben a populációban még nagyobb az eltérés a két párt szavazóinak aránya között, a második esetben nehéz következtetéseket levonni a populációra nézve, hiszen ekkor a két párt szavazótábora között a különbség a becsült értéknél kisebb, esetleg nulla, sőt az sem lehetetlen, hogy az A pártra többen szavaznának, mint a B pártra. A döntést azzal kapcsolatban, hogy vajon a B pártra többen szavaznának-e a teljes népességben, mint az A pártra, nem alapozhatjuk a hibák irányára, mert az nem ismert. Egyedül abban lehetünk biztosak, hogy ha van is hiba, akkor az adott megbízhatósággal (azaz az esetek adott százalékában) 69
8. Hogyan értelmezzük az eredményeket?
nem nagyobb, mint a mintanagyságtól függő, valamilyen érték. Például, ha a mintanagyság 2500, akkor, feltéve, hogy a mintanagyságtól függő hibahatár helyesen jellemzi a hiba valószínű nagyságát, 95%-os biztonsággal hihetjük, hogy az A párt szavazóinak valódi hányada 9% és 13% között van, a B párt szavazóinak tényleges aránya pedig 13% és 17% között. Ezért közelítőleg 95%-os megbízhatósággal állíthatjuk, hogy az A és B párt szavazóinak hányada különböző, és a B pártra többen szavaznának, mint az A pártra. A fenti számítás nem pontos, de nagyjából érzékelteti azt a gondolatmenetet, amellyel dönthetünk arról, hogy százalékos becsült értékek különbsége eléggé nagy-e ahhoz, hogy ebből nagy biztonsággal a megfelelő értékeknek a populációban ténylegesen eltérő voltára következtethessünk. Az ilyen típusú döntésekhez a 20–23. táblázatokat használhatjuk. A táblázatok azt mutatják meg különböző mintanagyságok mellett, hogy legalább mekkora eltérésnek kell lennie két becsült százalékos arány között ahhoz, hogy a populációban érvényes megfelelő százalékos értékeket 95%-os megbízhatósággal különbözőnek minősíthessük. A táblázatokat úgy használhatjuk, hogy kikeressük a két becsült érték átlagának megfelelő sort a táblázatok első oszlopában. Ha a két érték közül a kisebbik kisebb, mint a második oszlopban álló érték (és ezzel együtt a nagyobbik nagyobb, mint a harmadik oszlopban álló érték), akkor a megfelelő populációbeli értékeket eltérőnek minősíthetjük.
70
8. Hogyan értelmezzük az eredményeket?
71
8. Hogyan értelmezzük az eredményeket?
72
8. Hogyan értelmezzük az eredményeket?
Ezek közül a táblázatok közül azt kell használni, amelyik az adatfelvételre jellemző mintanagyságra vonatkozik. Ha ez nem szerepel a táblázatokban, közelítünk. Ha például a mintanagyság 2500, akkor a 2000 elemű és 3000 elemű mintákra vonatkozó táblázatok értékeiből átlagolunk. Ha két párt becsült százalékos szavazataránya 17% és 23%, akkor a 20%-os sort választjuk. Ahhoz, hogy a 20%-tól eltérő becsült értékek alapján 95%-os biztonsággal arra következtethessünk, hogy a teljes populációban is eltérés van a két párt szavazóinak aránya (és száma) között, az kell, hogy a nagyobb becsült érték 2000 nagyságú minta esetén több legyen, mint 21,4% és egy 3000 nagyságú minta esetén több legyen, mint 21,2%. Eszerint egy 2500 nagyságú mintánál, a nagyobb értéknek többnek kell lennie, mint egy 21,4% és 21,2% közötti érték, amelynek közelítő értékeként elfogadhatjuk e két szám átlagát, ami 21,3%. Ennél a két aktuális érték közül a nagyobbik (23%) nagyobb, és ezért 95%-os biztonsággal állíthatjuk, hogy a 23%-ot kapott pártnak ténylegesen több szavazója van, mint a 17%-ot kapott pártnak. A 95%-os biztonság azt jelenti, hogy ha a két párt szavazóinak száma azonos lenne a népességben, akkor az itt alkalmazott eljárást sokszor ismételve, az esetek 95%ában ezt helyesen felismernénk, és csak az esetek 5%-ában, azaz 20 alkalmazás közül átlagosan egy alkalommal jutnánk tévesen arra a következtetésre, hogy a két párt szavazóinak száma különbözik. Az 5%-os tévedési valószínűség megnyugtatóan kicsinek tűnhet, de ez nem jelenti azt, hogy megfeledkezhetünk róla. Nem szabad azt hinnünk, hogy a 20–23. táblázatok vagy más hasonló táblázatok alapján teljes bizonyossággal megállapítható egy véletlen mintán alapuló közvéleménykutatás eredményeiből, hogy a két párt szavazóinak aránya különbözik-e. A véletlen viselkedésével 73
8. Hogyan értelmezzük az eredményeket?
kapcsolatos matematikai ismeretek lehetővé teszik, hogy a véletlen hatását, a következtetéseinkben meglévő bizonytalanságot mérjük és korlátozzuk, de megszüntetni nem tudjuk. Megjegyezzük, hogy ha a mintavétel nem véletlen módszerekkel történik, akkor még a bizonytalanság mérése sem lehetséges – nem is beszélve annak korlátozásáról. A 20–23. táblázatok akkor is használhatóak, ha a két becsült százalékos érték átlaga nem egyezik meg a táblázatok első oszlopaiban szereplő értékekkel. Ha a mintanagyság 1000, és a becsült értékek 20% és 24%, akkor az átlag 22%. A 21. táblázatból látjuk, hogy ha az átlag 20%, akkor ennél a kisebb értéknek legalább 2,0%-kal kell kisebbnek lennie (20–18,0=2,0), ha pedig az átlag 25%, akkor a kisebb értéknek ennél legalább 2,2%-kal kell kisebbnek lennie (25–22,8=2,2). Ezért 22%-os átlag esetén a kisebb értéknek egy 2,0% és 2,2% közötti értékkel kell kisebbnek lennie, mint 22%. Közelítőleg feltehetjük, hogy ez az érték nincs messze a 2,0% és a 2,2% átlagától, ami 2,1%. Ennek alapján a döntési eljárás az, hogy ha a kisebbik érték jobban eltér az átlagtól, mint 2,1%, akkor a két populációbeli értéket ténylegesen eltérőnek minősítjük. Példánkban a kisebb érték 20%, ami kevésbé tér el a 22%-től, mint 2,1%, ezért az adott mintanagyság mellett a megfigyelésekből nem következtethetünk 95%-os megbízhatósággal arra, hogy a megfelelő populációbeli értékek is eltérnek. Megjegyezzük, hogy ez a gondolatmenet látszólag csak a kisebbik értéket hasonlította az átlagos értékhez, és a döntést erre az eltérésre alapoztuk. Valójában a nagyobbik érték éppen annyira tér el az átlagtól, mint a kisebbik érték, és ezért az egyik eltérésre alapozott döntési eljárás megegyezik azzal a döntési eljárással, amelyet a másikra alapozhatnánk (vagy mindkettőre egyszerre). A táblázatokat vizsgálva arra a következtetésre juthatunk, hogy egy bizonyos nagyságú eltérés a becslések között kisebb mintanagyságnál esetleg nem vezet arra a döntésre, hogy a populációra jellemző tényleges értékek között is eltérés van, míg nagyobb mintanagyság esetén már igen. Például 33% és 37% megfigyelése után, ha ezek a megfigyelések egy 1000 fős mintából származnak, még nem következtethetünk 95%-os megbízhatósággal arra, hogy valódi különbség van a teljes populációra jellemző értékek között, míg ha a becslések egy 3000 fős mintából származnának, ez a következtetés már indokolt lenne. A fenti táblázatok természetesen matematikai eljárások eredményei és akkor érvényesek, ha a mintát teljes egészében sikerült lekérdezni, és azon a feltételezésen alapulnak, hogy a hibahatár az egyszerű véletlen mintavételi eljárásra vonatkozó értékekkel azonos. A tényleges mintavételi eljárásra jellemző hibahatár eltérhet ezektől az értékektől. Továbbá, korábban láttuk, hogy azok, akik ténylegesen válaszolnak a közvélemény-kutatásban feltett kérdésekre, általában nem tekinthetők a populációból vett véletlen mintának. Ezért a valódi közvélemény-kutatások eredményeire érvényes hibahatárok általában nagyobbak, mint azt az elmélet a megcélzott vagy akár a ténylegesen lekérdezett mintanagyság alapján adná. Ezeket a hatásokat úgy vehetjük – közelítőleg – figyelembe, hogy úgy teszünk, mintha a kutatás kevesebb ember megfigyelésén alapulna, mint a ténylegesen megkérdezettek száma. Nagyon sok és nehezen kvantifikálható tényező hatását kellene figyelembe venni annak eldöntéséhez, hogy vajon egy adott kutatásra jellemző hibahatár mekkora mintanagyság esetén érvényes elméleti hibahatárral lehet azonos. Nem szabad elfelejteni azonban azt, hogy a tényleges válaszolók és a mintába kerültek véleményei 74
8. Hogyan értelmezzük az eredményeket?
közötti eltérések nem csak azt eredményezik, hogy a hibahatár változik (nő), hanem azt is, hogy a becslések némileg torzítani fognak, azaz szisztematikusan eltérnek a valóságtól. Ez azt jelenti, hogy esetleg még sok felmérés eredményének az átlaga sem lesz közel a valódi értékhez. Ez utóbbi hibát pedig nem lehet azzal orvosolni, hogy a mintanagyságot úgy tekintjük, mintha kisebb lenne a valóságosnál. Hasonló elemzésnek vethetnénk alá a politikusok népszerűségi osztályzatait, de ehhez olyan információkra lenne szükség, amelyeket nem szoktak a közvélemény-kutatás eredményei között közölni. Annak megítéléséhez, hogy ha X politikus például 3,7-es átlagot ér el a mintában, Y politikus pedig 4,2-t, akkor ebből mekkora megbízhatósággal következik, hogy az egész populációban számított átlagértékeik is különböznek, ezeken a számokon és a mintanagyságon kívül még azoknak az osztályzatoknak bizonyos jellemzőit is ismerni kellene, amelyekből ezek az átlagok keletkeztek. Amint arra már korábban utaltunk, a pártpreferenciára vonatkozó százalékos értékek tartalmaznak minden releváns információt a mintából, a preferencia átlagok nem, hiszen ugyanaz az átlag többféleképpen is előállhat. A pontos osztályzatokra vonatkozó információ nélkül a különbségek értékeléséhez olyan feltevésekre és közelítésekre lenne szükség, amelyek akkora bizonytalanságot eredményeznének, hogy az megkérdőjelezné az egész következtetés használhatóságát. Ezért ilyen típusú döntésekre csak a közvélemény-kutatás készítőinek van lehetőségük, az olvasónak általában nem.
Összefoglalás A közvélemény-kutatások publikált eredményei többnyire százalékos értékek vagy átlagok. Jól elvégzett kutatás esetén ezek a populációban érvényes értékeknek torzítatlan (azaz átlagosan pontos) becslései, és a hiba 95%-os biztonsággal várható maximális mértéke elméletileg a hibahatárral jellemezhető, bár a tényleges közvélemény-kutatások esetében torzítások és az elméletileg vártnál nagyobb hibahatárok is előfordulhatnak. Két becsült érték különbözősége nem vonja maga után minden feltétel nélkül azt, hogy azok a populációban érvényes értékek, amelyeknek ezen becslései ténylegesen különböznek. Erre megfelelő biztonsággal csak akkor következtethetünk, ha a becsült értékek eltérése meghalad egy bizonyos küszöböt, amely ezeknek az értékeknek az átlagától és a mintanagyságtól is függ. Ezeknél a számításoknál a ténylegesen lekérdezett minta nagyságát kell használni, és még ezt is célszerű a vizsgálat minőségétől függő mértékben csökkenteni.
75
9. Minden adatra érvényes a vizsgálat hibahatára? A könyv eddigi részeiben többnyire a közvélemény-kutatás mintájából becsült százalékos arányokkal foglalkoztunk. Bemutattuk, hogy különböző megbízhatóságú becslések érdekében mekkora mintanagyságokra van szükség, illetve azt, hogy különböző mintanagyságokhoz legfeljebb mekkora hibahatár tartozik (3. fejezet). Azt is megvizsgáltuk, hogy két ilyen becsült érték eltérése alapján hogyan lehet a populációban valóban érvényes eltérésekre következtetni (8. fejezet). Ilyen becsült értékekkel találkozunk akkor, amikor például egy párt szavazóinak arányát becsüljük meg. Erre az a kézenfekvő eljárás kínálkozik, hogy a mintából például egy adott pártot választók számát elosztjuk a minta nagyságával. Ha egy 1000 fős mintából 271-en szavaznának az A pártra, akkor az A párt várható szavazóinak arányára a becslés 271/1000=0,271 vagy 27,1%. A fenti értéknél azonban sokszor érdekesebb az, hogy a valószínű szavazóknak mekkora hányada szavazna az A pártra. Ez különösen akkor van így, ha a közvélemény-kutatás célja – mint oly sokszor – a választások eredményének előrejelzése. A választás eredménye csak a ténylegesen szavazók szavazataitól függ, ezért a közvélemény-kutatások készítőinek gyakran célja a valószínűleg szavazó és a valószínűleg nem szavazó személyek elkülönítése. Ha az előbbi példában azt találják, hogy az 1000 megkérdezett közül csak 635 szándékozik szavazni, és az A pártot választó 271 ember közül 217 tartozik közéjük, és a fennmaradó 54 szimpatizánsa az A pártnak nem szándékozik szavazni, akkor az A párt várható szavazatarányára a 217/635= 0,342 vagy 34,2% becslést adnánk. (Megjegyzendő, hogy a valószínűleg szavazók és a szavazási szándékról beszámoló megkérdezettek nem feltétlenül azonosak.) Azt gondolhatnánk, hogy a becslés tulajdonságai szempontjából nem lényeges, hogy a teljes (lekérdezett) mintanagysághoz vagy pedig azokhoz viszonyítjuk az A párt szavazóinak számát, akik valószínűleg elmennek szavazni. A 6. fejezetben egy másik problémával kapcsolatban bemutattuk, hogy a viszonyítási arány, azaz a nevező megváltoztatása mennyire megváltoztathatja a becsült értékeket. A fenti példában láttuk, hogy az A párt szavazóinak arányára vonatkozó becslés 27,1%-ról 34,2%-ra nőtt. Valójában azonban a valószínű szavazókhoz való viszonyítás az összes megkérdezetthez való viszonyítástól egy sokkal lényegesebb szempontból is eltér, mint azt az eddigiek mutatták: a valószínű szavazók arányában kifejezett százalékos becslésekre egészen más hibahatárok vonatkoznak, mint a teljes mintanagyság arányában kifejezett becslésekre. Két becsült százalékos értékre, amelyek igen hasonlónak tűnnek, és amelyeket a közvélemény-kutatások készítői gyakran egymás mellett mutatnak be, egészen más szabályok érvényesek. A hibahatárok különbözősége a két becslés következő eltéréséből adódik. A mintanagyság százalékában kifejezett becslés egy olyan hányados, amelynek számlálójában egy véletlentől (is) függő mennyiség szerepel (hányan kerültek a mintába olyanok, akik az A pártot választanák), a 76
9. Minden adatra érvényes a vizsgálat hibahatára?
nevező egy mintavételi ingadozások által nem befolyásolt érték, nevezetesen a felmérés készítői által választott mintanagyság. Különösen így van ez, ha a felmérés készítői addig egészítik ki a mintát pótcímekkel, amíg nem sikerül lekérdezni az előre tervezett számú embert. Ezzel szemben a valószínű szavazókon belüli becsült arány egy olyan hányados, amelynek számlálóját is és nevezőjét is terhelheti mintavételi hiba. A számlálót – éppúgy mint az előbbi esetben – azért, mert a véletlenen (is) múlik, hogy az A párt szavazói mekkora arányban kerülnek a mintába, a nevezőt pedig azért, mert a véletlenen (is) múlik, hogy a valószínű szavazók mekkora arányban kerülnek a mintába. Azt mondhatjuk, hogy az előbbi arány egy becsült mennyiségnek és egy pontosan ismert mennyiségnek a hányadosa, míg az utóbbi arány két becsült mennyiség hányadosa. A hányados lehetséges hibájához a számláló és a nevező lehetséges hibája is hozzájárul, ezért a mintanagyság százalékában kifejezett arány hibahatára kisebb, mint a valószínű szavazók százalékában kifejezett becslés hibahatára. Lényegében ugyanez a helyzet akkor is, amikor a közvélemény-kutatás készítői egy párt szavazóinak arányát nem az összes megkérdezetthez képest, hanem a valamilyen pártot választók számához képest adják meg. Ehhez hasonló helyzet nem csak politikai közvélemény-kutatásokban fordul elő. Például megbecsülhetjük azoknak az arányát egy mintából, akik önkéntes szakmai továbbképzésben vesznek részt, és megbecsülhetjük ugyanezeknek az arányát azok közül, akik a közeljövőben állást szeretnének változtatni. Az első becsült értékhez tartozó hibahatár itt is kisebb lesz, mint a második becsült értékhez tartozó. Az alábbiakban a hányadosokhoz tartozó közelítő hibahatárt különböző mintanagyságokra azzal a feltételezéssel adjuk meg, hogy a számlálóban mindig olyan érték szerepel, amely kisebb a nevezőnél, és a számlálóban lévő mennyiség része a nevezőben lévőnek. Ez a helyzet például akkor, amikor egy adott párt szavazóinak számát a valamilyen pártpreferenciát nyilvánítók számához vagy pedig a szavazni szándékozók számához viszonyítják. A 24–28. táblázatokban a hányadosok hibahatárának közelítő értékeit adjuk meg a mintanagyság, illetve a számlálóban és a nevezőben lévő mennyiségek valódi, népességbeli nagyságának függvényében.
77
9. Minden adatra érvényes a vizsgálat hibahatára?
78
9. Minden adatra érvényes a vizsgálat hibahatára?
79
9. Minden adatra érvényes a vizsgálat hibahatára?
80
9. Minden adatra érvényes a vizsgálat hibahatára?
81
9. Minden adatra érvényes a vizsgálat hibahatára?
Amint azt a könyv 3. fejezetében részletesen tárgyaltuk, a hibahatár jelentése az, hogy a minták 95%-ában (azaz húsz eset közül tizenkilencszer) várhatóan ennél kisebb lesz az eltérés a valódi és a mintából becsült érték között. Ha például a népesség 60%-ának van pártpreferenciája, és a népesség 20%-a (akik valamennyien az előbbi 60% közé tartoznak) választ egy adott pártot, akkor a valamilyen pártot választók között ennek a pártnak a népszerűsége 20/60=33,3%. Ha 1000 főt kérdeznek meg, akkor az ilyen vizsgálatoknak 95%-ában a megfelelő becsült érték nem fog jobban eltérni ettől, mint 3,8 százalékpont (a hibahatár), azaz 29,5% és 37,1% között lesz. Más szavakkal azt is mondhatjuk, hogy a mintából becsült érték 95%-os valószínűséggel a fenti határok közé esik. A hibahatár nagyobb pontosságú közelítések várható gyakoriságának megítélésére is alkalmas. Például az előbbi esetben azt mondhatjuk, hogy a minták 68%-ában várhatóan azt találjuk, hogy a becsült érték nem tér el jobban 33,3%-tól, mint 1,9 százalékpont (a hibahatár fele), azaz 31,4% és 35,2% között lesz. Továbbá a minták 99,7%-ában a becsült érték nem tér el jobban a 33,3%-tól, mint 5,7 százalékpont (a hibahatár másfélszerese), azaz 27,6% és 39% között lesz. A 24–28. táblázatok alkalmazásában nem vétünk nagy hibát, ha úgy használjuk őket, hogy a ténylegesen nem ismert valódi értéket a mintából becsült értékkel helyettesítjük. Ennek alapján a fenti állításokat közelítőleg megfordíthatjuk. Például, ha az A párt szavazóinak aránya egy 82
9. Minden adatra érvényes a vizsgálat hibahatára?
1000 elemű mintában 20%, és a mintának 60%-a választ valamilyen pártot, akkor 68%-os megbízhatósággal állíthatjuk, hogy a valamilyen pártot választók között az A pártot választók tényleges (a populációban érvényes) aránya 31,4% és 35,2% között van. (Annak jelzésére, hogy egy bizonyos értelemben megfordított állítást tettünk, a valószínűség szót a megbízhatóság szóval helyettesítjük.) Hasonlóan, ebben a helyzetben arra következtetünk, hogy a valódi arány 95%-os megbízhatósággal 29,5% és 37,1% között van, vagy hogy 99,7%-os megbízhatósággal 27,6% és 39% között van. A táblázatok a szokásos módon használhatóak abban az esetben is, ha a megfigyelt értékek nem egyeznek a táblázatokban megadott értékekkel. Ilyenkor meg kell keresni, hogy a számláló mely értékek közé esik, és a nevező mely értékek közé esik, és ennek megfelelően kell megbecsülni a hibahatárt. Például ha a számlálóban szereplő érték 25%, a nevező 55%, a mintanagyság pedig 3000 fő, akkor a 20-as és 30-as oszlop, illetve az 50-es és 60-as sor közötti értéket kell választani hibahatárként. Ennek az ezen sorok és oszlopok metszetében álló számok között kell lennie. Ezek a számok 2,2, 2,4 és 2,5, tehát választhatjuk közelítő hibahatárként az 2,4 értéket. A ténylegesen számított hibahatár valóban 2,45 ebben az esetben. Érdemes a 24–28. táblázatokban megadott hibahatárokat összehasonlítani a 8. táblázatban szereplő maximális hibahatárokkal. Azok az értékek egy olyan arány becslésére vonatkoznak, amelynek nevezőjében a mintanagyság áll, tehát például egy párt szavazóinak aránya az egész népességen belül. A 24–28. táblázatokban hibahatárok vannak megadva olyan hányadosok becslésére vonatkozóan, amelyeknek nevezőjét szintén csak becsülni lehet, például a valamilyen pártot választók között az egy adott pártot választók aránya. Az összehasonlítás azt mutatja, hogy az utóbbi esetben a maximális hibahatár több mint kétszerese az előbbi esetre a 8. táblázatban megadott maximális hibahatárnak. Nem szabad ugyanakkor elfelejteni azt sem, hogy amíg a 8. táblázat maximális hibahatára valamennyi elméletileg lehetséges hányados becslésére vonatkozik, addig az itteni értékek csak a vizsgált, nem túl szélsőséges esetekre érvényesek. Az itt vizsgáltaknál szélsőségesebb esetekben (például a számláló értéke csak 3%) a hibahatár sokkal nagyobb lehet, azaz messze meghaladja a 8. táblázatban szereplő értéket. A fentiek alapján, nem túl szélsőséges esetekre vonatkozóan, érdemes megjegyezni azt a szabályt, hogy egy olyan hányadosra vonatkozó hibahatár, amelyben a számláló is és a nevező is becsült érték, több mint kétszerese egy felmérés hibahatárának. A felmérés hibahatáraként megadott érték olyan hányadosok becslésére vonatkozik, ahol csak a számláló becsült érték, a nevező nem az. A közvélemény-kutatások eredményeinek közlésében az a gyakorlat, hogy a teljes népesség arányában megadott becslésekkel párhuzamosan közölnek a valamilyen tulajdonsággal rendelkezők (például pártot választók) arányában megadott becsléseket, nem szerencsés, mert ezekhez a becslésekhez nagyon különböző hibahatárok és ezért eltérő értelmezések tartoznak.
Összefoglalás A teljes népességen belüli arányok és a népesség valamilyen tulajdonsággal definiált részcsoportján belüli arányok hibahatár szempontjából nagyon eltérően viselkednek. 83
9. Minden adatra érvényes a vizsgálat hibahatára?
A mintanagyságra jellemző hibahatár csak a teljes népességhez viszonyított arányszámok viselkedését jellemzi. A közvélemény-kutatás során vizsgált részcsoporton belüli arány becsléséhez tartozó hibahatár több mint kétszer nagyobb ennél az esetek többségében. A közvélemény-kutatás készítőinek erről nem szabad elfelejtkezniük, és nem szabad a kétféle arányt úgy elemezni, mintha a hibahatárok azonosak volnának.
84
10. Összehasonlítók-e a különböző közvélemény-kutatások eredményei? A közvélemény-kutatások eredményei iránt érdeklődő olvasónak néha lehetősége nyílik arra, hogy több közvélemény-kutatás eredményét, amelyek ugyanabban a témában készültek, összevesse. Politikai közvélemény-kutatások esetében azok eredményeinek rendszeres közlése kétféle összehasonlítást is lehetővé tesz. Egyrészt összehasonlíthatók a különböző közvélemény-kutató cégek nagyjából egy időben készült felméréseinek eredményei, másrészt pedig összehasonlíthatók a korábbi eredmények újabb eredményekkel. Ezekből az összehasonlításokból teljesebb képet remélhetünk, és információkat szerezhetünk olyan folyamatokról, amelyeket másként nem ismerhetnénk meg. Ezeknek az összehasonlításoknak a tárgya többféle szempontból eltérő felméréseknek az eredménye, és mielőtt az összehasonlítás módszereiről szót ejtenénk, meg kell vizsgálnunk, mit is hasonlítunk össze mivel. Különböző időpontokban készült vizsgálatok némileg eltérő valóságot tükröznek. Általában minél nagyobb idő telik el a két adatfelvétel között, annál nagyobb különbségekre számíthatunk. Ugyanakkor bizonyos események következtében az emberek véleménye, attitűdje, politikai preferenciája rövid idő alatt is jelentősen változhat. Amikor tehát két különböző időpontban végzett közvélemény-kutatás eredményei eltérnek, ennek az eltérésnek kétféle oka lehet. Az eltérés egyik oka a vizsgált vélemények időközben történt megváltozása. A másik ok az lehet, hogy feltehetőleg mindkét vizsgálat bizonyos hibával tükrözte a készítésekor érvényes véleményeket, és emiatt eredményeik valamilyen mértékben még akkor is eltérnének, ha a vizsgált populációban nem változott volna semmi. A minden közvélemény-kutatással együttjáró véletlen hiba a valóságban meglévő eltérést fel is erősítheti és le is csökkentheti. Például ha egy párt szavazóinak aránya az első közvélemény-kutatás alkalmával (ténylegesen) 15%, a második alkalommal (ténylegesen) 13%, azaz a párt népszerűsége 2%-kal csökkent, akkor lehetséges, hogy az első közvélemény-kutatás becslése 16%, a másodiké pedig 11%. Mindkét kutatás viszonylag pontos becslést adott. Mégis, a két becsült érték összehasonlítása a párt népszerűségének csökkenését eltúlozza. A valóságban 2%-ot vesztett a párt, az eredmények 5% elvesztését mutatják, tehát a veszteség mértékét két és félszer akkorának becsüljük, mint ami a valóságos érték. Ugyanebben a valódi helyzetben az is előfordulhat, hogy az első közvéleménykutatás a párt szavazóinak arányát 12%-ra becsüli, míg a második 15%-os népszerűséget talál. Ebből azt a következtetést vonhatnánk le, hogy a párt a két közvélemény-kutatás között eltelt időben növelte szavazóinak számát, pedig a valóságban éppen ennek ellenkezője történt. A fenti példákból az következik, hogy amikor valamilyen érték változását akarjuk becsülni, még óvatosabban kell eljárni, mint amikor ezt az értéket önmagában akarjuk becsülni. Ennek oka az, hogy a változások rendszerint viszonylag kisebb értékek, mint azok az értékek, amelyeknek a változását vizsgáljuk. Ezért azok a hibák, amelyek az eredeti értékekhez képest nem túl nagyok, esetleg a kisebb változásokhoz viszonyítva már jelentősek lehetnek. Egy további ok az óvatosságra, 85
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei? hogy a változás mértékének megbecsüléséhez két becsült értéket kell felhasználnunk, amelyek tartalmazhatnak hibát, és ezek a hibák akár össze is adódhatnak, tehát esetleg kétszer is akkorák lehetnek, mint azok a hibák, amelyekkel az eredeti mennyiségek becslésénél számolnunk kell. Tehát előfordulhat, hogy egy kisebb mennyiséget (a változást) nagyobb hibával becsülünk. Így összességében a változás becslésénél nagyobb hibahatár érvényes, mint az eredeti mennyiségek becslésénél. Az előbbi megfontolások az eredmények összehasonlításának másik esetére is vonatkoznak, amikor is két különböző közvélemény-kutató cég által lényegében egy időben készült vizsgálatok eredményeit hasonlítjuk össze. A korábban mondottak fényében a lényegében azonos idő azt jelenti, hogy időben olyan közel esnek egymáshoz, hogy a valódi véleményeket változatlannak tételezhetjük fel. Ha feltehetjük, hogy a két vizsgálat időpontja között a vizsgált vélemény nem változott (vagy csak elhanyagolható mértékben változott), akkor az eredmények eltérései a két adatfelvétel eltéréseinek tudhatóak be. Ezen eltéréseknek egy része a mintavételi hibából származik. Annak következtében, hogy nem mindenkit kérdeztek meg, a kapott becslések feltehetőleg eltérnek az egész populációra jellemző értéktől. A mintavételi hiba itteni hatásának illusztrálására képzeljük el, hogy ugyanaz a közvéleménykutató cég, ugyanazokkal a munkatársakkal, ugyanazzal a kérdőívvel, ugyanazokkal a kérdezői instrukciókkal, ugyanazzal az adatfeldolgozási eljárással, de két különböző mintán hajt végre közvélemény-kutatást, és ez a két kutatás még időben is egyszerre történik. Ennek a két kutatásnak várhatóan nem lesznek ugyanazok az eredményei. Mivel minden más körülmény azonos volt, az eredmények eltérése kizárólag a mintavételi hibának tudható be. Az eredmények valóságtól való eltérésének várható nagysága a mintavételből származó hibahatár nagyságán múlik. Ha ugyanis a közvélemény-kutatásból származó becslések azonosak lennének a valódi értékkel, akkor egymástól sem térnének el. A valóságban természetesen ugyanaz a cég nem készít két közvélemény-kutatást ugyanabban az időben. Két egyszerre készült közvélemény-kutatás eredményének összehasonlítása a valóságban csak olyan esetekben lehetséges, amikor ezeket a vizsgálatokat különböző cégek készítették. Az adatfelvételek eltérésének a mintavételi hibán túlmenő másik komponense abból származik, hogy a két cég feltehetőleg eltérő módszereket használ. Különböznek a kérdőívek, a kérdezőbiztosok, a kérdezőbiztosoknak adott utasítások, a két cégről a megkérdezettek körében élő kép, és még sok egyéb szempont, amelyek hatással lehetnek az eredményekre. Ennek a nem mintavételi hibának az illusztrálására képzeljük el, hogy két céget bízunk meg azzal, hogy egy általunk megadott mintán végezzenek közvélemény-kutatást egy általunk megadott témában. Ennek a gondolatkísérletnek a kedvéért tételezzük fel, hogy egy embert meg lehet kérdezni a véleményéről kétszer, anélkül, hogy ez a véleményét és válaszolási hajlandóságát befolyásolná. Ebben az esetben a két cég – annak ellenére, hogy ugyanazokat az embereket kérdeznék ugyanazokról a témákról –, ténylegesen eltérő eredményeket produkálna. Ennek oka az, hogy nem pont ugyanazokat a kérdéseket tennék fel, nem pont ugyanúgy tennék fel ezeket a kérdéseket, nem pont ugyanúgy próbálnák megtalálni a mintában szereplő személyeket, stb. A közvélemény-kutatás eredményeinek a valóságtól való eltérésének azt a részét, amely ezekre az okokra vezethető vissza, nevezzük nem mintavételi 86
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei? hibának. Akinek a kétszer lekérdezhető minta gondolata abszurdnak tűnik, az módosíthatja az előbbi gondolatkísérletet úgy, hogy a két cégnek két különböző mintát adunk, de tudjuk, hogy ezek a minták minden szempontból azonosak. A gyakorlatban a mintavételi és nem mintavételi hiba természetesen nem szétválasztható. Konkrét esetben a mintavételi és nem mintavételi hibák egymást erősíthetik vagy gyengíthetik. Annak ellenére, hogy a valóságban ezek a hibák együttesen jelentkeznek, elméleti szétválasztásuk fontos. A mintavételi hibára nézve megállapíthatjuk a hibahatár nagyságát, pusztán a mintanagyság és a mintavételi eljárás ismeretében. Ez természetesen csak akkor igaz, ha a közvéleménykutatók egyformán pontosan hajtják végre mintavételi tervüket. Ha nem, az elméleti hibahatár félrevezető lehet. A nem mintavételi hiba nagyságáról csak hozzávetőleges képe lehet a közvélemény-kutatások eredményei iránt érdeklődő olvasónak. A közvélemény-kutató cégek munkáját hosszabb távon megfigyelve felhalmozódhat ismeret arra nézve, hogy egyes cégek megbízhatóbbak (azaz kisebb hibával dolgoznak), mint más cégek. Ennek megítélésére egyrészt a publikált eredmények és a valóság (ha erre fény derül) többszöri összehasonlítása, másrészt az alkalmazott módszerek megismerése vezethet. A módszerek minőségének megítélésében az ebben a könyvben leírt szempontokat használhatjuk. Ezek a szempontok egy új kutatás várható minőségének megítélésében fontosabbak, mint egy-egy korábbi eredmény nagyon pontos vagy akár nagyon pontatlan volta, hiszen ez utóbbiak a véletlen szerencsének vagy a nagyobb tényleges mintavételi hiba alakjában megjelenő véletlen balszerencsének is lehetnek a következményei, és nem feltétlenül ismétlődnek egy újabb kutatásban. A közvélemény-kutató cégek munkájának megítélésében a nem mintavételi hiba várható nagysága nem az egyetlen szempont. Elméletileg torzításokra is fel kell készülnünk. Lehetséges, hogy például egy politikai közvélemény-kutatásban egyes cégek rendszeresen alá- vagy fölébecsülik bizonyos pártok szavazói táborának nagyságát. Ennek többféle oka lehet – még ha el is tekintünk a szándékos torzítás lehetőségétől, ami inkább a közvélemény befolyásolására irányuló kísérlet, mint a közvélemény kutatása. Ilyen ok lehet a rossz mintaválasztási technika (például egy olyan címlistából válogatott minta, amely a valóságosnál kisebb vagy nagyobb arányban tartalmazza egy párt szimpatizánsait). Oka lehet a torzításnak a közvélemény-kutató cégről kialakult kép, aminek következtében egy párt szavazói az átlagosnál kisebb vagy nagyobb mértékben fognak válaszadásra vállalkozni. Oka lehet továbbá a torzításnak az, hogy a kérdezők, rossz megválogatásuk, esetleg hiányos képzésük vagy a mintába került személyek felkeresésének helytelen módja miatt bizonyos társadalmi csoportok tagjait kisebb vagy nagyobb arányban találják meg és nyerik meg a kutatásban való részvételre, mint másokat, és az ebből származó torzítást a súlyozás nem mindig tudja korrigálni. A sikeres korrigálás akkor lenne lehetséges, ha az alulvagy felülreprezentálás a súlyozásnál figyelembe vett társadalmi csoportok szempontjából jönne létre a mintában, de erre semmi biztosíték sincs. Ha például a vad kutyák tulajdonosai pártot alapítanának, akkor könnyen lehetséges, hogy ennek a pártnak a szavazóit a kérdezőbiztosok kisebb arányban találnák meg (talán nem is térnének vissza egy címre olyan lelkesen, ha nem találták otthon a mintába került személyt, mint azokra a címekre, ahol nem kell egy vad kutya harapásától tartani). Ebből a párt szavazóinak alulbecslése, azaz torzítás származna. Ezen a torzításon nem segít a súlyozás, mert hiába érjük el, hogy a fontos társadalmi csoportok a populációbeli arányukhoz 87
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei? hasonlóan szerepeljenek a mintában (pontosabban az adatok alapján adott becslésben), a vad kutyák tulajdonosai minden társadalmi csoportban alul lesznek reprezentálva. Azt látjuk tehát, hogy torzítás a közvélemény-kutató cégek akaratától függetlenül is létrejöhet. A torzítás lehetséges okai között a nem mintavételi hibák jelenős szerepet játszanak, de a mintavétel esetleges hiányosságai (például rossz címlista használata) is torzításra vezethetnek. A közvélemény-kutató cégek esetleges szisztematikus torzítására igazából nem úgy deríthetünk fényt, hogy eredményeiket a valósággal összehasonlítjuk (ami például választások alkalmával lehetséges), hanem úgy, hogy egy cég eredményeit hosszabb időszakon keresztül összevetjük más cégek eredményeinek az átlagával. Ahhoz, hogy ez az összehasonlítás érvényes és megbízható legyen, számos apró részletre kell ügyelni, de összefoglalóan azt mondhatjuk, hogy ha esetleg egyes cégek rendszeresen torzítanának egy-egy politikai párt javára (vagy kárára), akkor ennek a többi cég által megjelentetett eredményekhez képest is fel kellene tűnnie. Hozzátesszük azonban, hogy elméletileg nem lehetetlen egy olyan helyzet kialakulása sem, amikor egyetlen cég eredményei közelebb vannak a valósághoz, mint a többiek átlaga. Amikor egy párt népszerűségére vonatkozó két, időben eltérő eredményt hasonlítunk össze, akkor a tapasztalt eltérésnek oka lehet az időközben megváltozott valódi helyzet és a két kutatási eredmény feltehetően eltérő hibája (mintavételi és nem mintavételi) is. Ha az a kérdés, hogy az A párt növeltee szavazóinak táborát két közvélemény-kutatás között, akkor ha ezeket a kutatásokat ugyanaz a cég végezte, az esetleges szisztematikus torzítással nem kell számolnunk, hiszen ez, ha van egyáltalán, várhatólag ugyanaz mindkét alkalommal, és ezért az eredmények különbségét nem befolyásolja. Például tegyük fel, hogy az A párt az első alkalommal a becslés szerint a szavazatok 15%-át kapná, a második alkalommal pedig a becslés 12%. Ha ez a két eredmény ugyanattól a cégtől származik, és azt sejtjük, hogy ez a cég például általában 2%-kal magasabb értéket becsül az A párt szavazóira nézve, mint a valóság, akkor nem 15%-ot és 12%-ot kell összehasonlítani, hanem 13%-ot és 10%ot, de ezek nem nagyon különböző feladatok. Ha két különböző cég végezte a két vizsgálatot, akkor megpróbálhatjuk az eredményeket a feltételezhető torzításnak megfelelően korrigálni. (Feltehető, hogy a torzítás a valódi értékekhez képest kicsi.) Ha az első eredmény az X cégtől származik és a második az Y cégtől, akkor az esetlegesen feltételezett torzításnak megfelelően változtatni kell az értékeket. Ha azt feltételezzük, hogy az X cég az A pártot átlagosan 2%-kal felülbecsüli, az Y cégről pedig nincs okunk rendszeres torzítást feltételezni, akkor a korrigált érték 13% és 12%. Ezeknek az értékeknek az összehasonlítása pedig egészen más eredményre vezethet, mint az eredeti 15% és 12% összehasonlítása. Ha az esetleges korrekciót végrehajtottuk, azzal a kérdéssel kerülünk szembe, hogy a két eltérő érték azért eltérő-e, mert a választók szavazási szándékai megváltoztak a két közvélemény-kutatás között eltelt időben, vagy pedig az eltérés a hiba következménye. Ha a két vizsgálat hibahatárára nézve rendelkezünk ismerettel, akkor azt mondhatjuk, hogy akkora eltérések esetén, amelyeket az adott hibahatárok mellett gyakran tapasztalhatnánk, nincs okunk valódi változásra következtetni, mert nem áll rendelkezésünkre bizonyíték arra nézve, hogy a különbség a két becsült érték között nem csak a felmérések hibáinak következménye. Ha azonban az eltérés a két érték között akkora, 88
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei? amekkora eltérés az adott hibahatárok mellett csak a mintáknak egy kis hányadában fordulna elő, feltéve a valódi értékek változatlan voltát, akkor dönthetünk úgy, hogy inkább azt a következtetést választjuk, hogy van valódi eltérés a választók szavazási szándékaiban – és nem kizárólag a hiba okozza a megfigyelt eltérést. Ezeknek a döntéseknek a megalapozására az alábbiakban olyan táblázatot közlünk, amely azt mutatja meg különböző hibahatárok mellett, hogy a minta-párok (az első és a második kutatás mintái) 95%-ában legfeljebb mekkora mértékű eltérések fordulnának elő a két mintából becsült értékek között, ha a populációra jellemző értékek változatlanok maradnának. A 29. táblázatnak az alkalmazásában a publikált becsült értékeket az esetleges torzításoknak megfelelően korrigálni kell. Hibahatárként egy olyan mennyiséget kell használnunk, amely az egyes vizsgálatok teljes hibájára vonatkozik, nem csak a mintavételi hibára. A mintavételi hiba a mintanagyság függvénye és egy erre vonatkozó táblázat szerepel ebben a könyvben is (8. táblázat). Ezt a mintanagyságtól függő hibahatárt célszerű kissé megemelni, hogy a nem mintavételi hibákat is tartalmazza. Rosszabb minőségű kutatások esetén nagyobb növelés indokolt, mint jobb minőségű kutatások esetén.
89
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei?
90
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei? A 29. táblázatot úgy használhatjuk, hogy megkeressük a két vizsgálat hibahatára alapján jellemző cellát, és az ott talált értéket összehasonlítjuk a két becslés közötti eltéréssel. Ha a két becslés közötti eltérés meghaladja a táblázatban közölt értéket, akkor 95%-os biztonsággal következtethetünk arra, hogy a populációban a két felvétel között változás történt. Itt a 95%-os megbízhatóság jelentése az, hogy ha ezt a döntési eljárást sokszor alkalmaznánk, akkor azokat az eseteket nézve, amikor valójában nincs változás a populációban (azaz a szavazati arányok ugyanazok maradtak), az alkalmazások 95%-ában erre a következtetésre jutnánk – helyesen. Például tegyük fel, hogy az első vizsgálat egy 2000 elemű mintán alapult, és az A párt szavazóinak arányára 15%-os becslést adott. A második vizsgálat egy 1000 elemű mintán alapult, és a párt szavazóinak arányát 13%-nak találta. Tegyük még fel, hogy sem az első, sem pedig a második vizsgálatot készítő közvélemény-kutató cégről nem tételezzük fel, hogy szisztematikusan torzítana az A párt szavazóinak arányát illetően. A könyvben korábban közölt táblázat szerint a 2000 fős mintához 2,2%-os hibahatár tartozik, az 1000 fős mintához 3,2%-os hibahatár. Végül tegyük fel, hogy az első közvélemény-kutatás készítőit kissé kevésbé tekintjük megbízhatónak, mint a másodikat készítő céget, és ennek megfelelően az első kutatás hibahatárát 3%-nak, a másodikét 4%nak választjuk. Az ezekhez a hibahatárokhoz tartozó érték a 29. táblázatban 5,0%. Ez azt jelenti, hogy a két becslésnek ilyen hibahatárok mellett 5,0%-kal kellene eltérnie egymástól ahhoz, hogy 95%-os biztonsággal állíthassuk, hogy a populációban is eltér a párt szavazóinak aránya abban a két időpontban, amikor a közvélemény-kutatások készültek. A jelen példában tehát a becsült értékek eltérése 95%-os megbízhatósággal nem indokolja, hogy eltérőnek tekintsük a párt szavazóinak arányát a két időpontban. Ha valaki nem kívánja az egyes közvélemény-kutatások hibahatárát a mintanagyság és a kutatás minőségére vonatkozó megfontolások alapján saját maga megbecsülni (valóban, a vizsgálat minőségéről általában rendelkezésre álló információk nem teszik lehetővé ezt a kvantifikálást), akkor hagyatkozhat a közvélemény-kutatás készítői által megadott hibahatárra, feltéve, hogy ezt az információt közlik. Ennek a hibahatárnak az összehasonlítása a mintanagyságból számítható hibahatárral (ezek megtalálhatóak ebben a könyvben táblázat formájában) információt adhat arra nézve, hogy a publikált hibahatár tartalmazza-e a nem mintavételi hiba hatását is. Ha a publikált hibahatár meghaladja a mintanagyságból következő értéket, például egy 1000 fős minta esetén a hibahatárt 5%-nak adják meg (holott a mintanagyság alapján 3,2% lenne), akkor feltehetőleg a nemválaszolók és egyéb hibanövelő tényezők miatt alkalmazott korrekcióról van szó. Ekkor használhatjuk a publikált hibahatárt. Természetesen kérdéses, hogy vajon a kutatás készítői helyesen becsülik-e meg a saját munkájukra jellemző hibahatárt. Mindenesetre a 29. táblázatban szereplő értékek azt mutatják, hogy meglehetősen nagy becsült eltérésekre van szükség ahhoz, hogy ezekből nagy biztonsággal következtethessünk a párt szavazói számának tényleges megváltozására a két felvétel között eltelt időben. Ebből az következik, hogy a gyakran újságok címoldalára kerülő állítás, mely szerint egy párt népszerűsége növekedett egy korábbi közvélemény-kutatás óta – azon az alapon, hogy 2 vagy 3 százalékkal többen állították a mintában, hogy erre a pártra szavaznának – legalábbis megkérdőjelezhető. Ekkora eltérés a politikai közvélemény-kutatásokban szokásos mintanagyságok mellett csak nagyon gyenge bizonyítékot 91
10. Összehasonlítók-e a különböző közvéleménykutatások eredményei? jelent az előbbi állítás esetén, hiszen ez meglehetősen sokszor előfordulhat a mintában akkor is, amikor a populációra jellemző érték nem változott. Amennyiben a vizsgált mennyiség nem egyszerűen a magukat egy bizonyos pártot választóknak valló válaszolók aránya a mintában, hanem ennél bonyolultabb, képzett mennyiség (például ezek aránya a szavazni szándékozók között vagy egyik párt előnye egy másik párttal szemben a szavazni szándékozók között), akkor természetesen a 24. táblázat alkalmazásában az ezekre a mennyiségekre jellemző – nagyobb – hibahatárt kell alkalmazni, ahogyan azt az előző fejezetben bemutattuk.
Összefoglalás Különböző időpontokban különböző közvélemény-kutató cégek által végzett felmérések eredményeinek összehasonlításánál az esetleges valódi eltérésre mindkét vizsgálat hibája rárakódhat. A változások valódi voltáról hozható döntés mindkét vizsgálat hibahatárától és a tapasztalt eltérés nagyságától is függ. A hibahatár valódi értékét a mintanagyság és a vizsgálat végrehajtásának minősége befolyásolja. Bizonyos közvélemény-kutató cégek eredményei rendszeresen torzíthatnak egyik vagy másik párt javára. Ha a torzításra vonatkozó ismeret rendelkezésre áll, ezt az eredmények összehasonlításában fel kell használni.
92
11. Miért jók a közvélemény-kutatások? Mindezek után az olvasó joggal teheti fel a kérdést, hogy vajon hihetünk-e a közvéleménykutatások eredményeinek. Ha ilyen sokféle hibát lehet elkövetni, ráadásul ezen hibák jelentős része nem kvantifikálható, akkor vajon érdemes-e közvélemény-kutatásokat készíteni? Másképpen fogalmazva, ha ilyen sok hibát lehet véteni a valódi közvélemény megismerésére irányuló vizsgálatokban, akkor vajon a közvélemény-kutatásoknak a közvéleményt feltáró funkciójánál nem fontosabb-e ezeknek a vizsgálatoknak a közvéleményt befolyásoló funkciója? Mások pedig azt kérdezhetik, hogy a közvélemény-kutatások sok szakmai sikere (például választások eredményeinek gyakran meglepően pontos előrejelzése) csak a véletlen különös kegyének tudhatóe be, vagy az önbeteljesítő jóslatok sok ismételgetésének (azaz a közvélemény manipulálásának) az eredménye-e. Mindezek teljesen indokolt kérdések, és az alábbiakban megpróbálom az olvasó elé tárni saját válaszaimat. Hangsúlyozni kell, hogy míg a könyv korábbi részében leírt állítások jórészt matematikai jellegű tények és ezek következményei, illetve senki által nem vitatott módszertani tapasztalatok, az itteni kérdésekre adható válaszok inkább csak vélekedések, még ha álláspontomat bizonyos tények alá is támasztják. Először is szeretném leszögezni, hogy nem minden közvélemény-kutatás eredményei jók (azaz tükrözik viszonylag pontosan a valóságot). Még a legjobban dolgozó közvélemény-kutató cégekkel is előfordulhat, hogy egy-egy vizsgálat eredményei pontatlanok. Ez a mintavételi eljárás véletlen jellege és néhány más tényező miatt elkerülhetetlen. Ugyanakkor nagyon sok olyan közvéleménykutatás eredményeit publikálták már, amelyek igen pontosan közelítették a valóságot. Választási eredményeket nemegyszer 1–2 százalékpont pontossággal jeleznek előre közvélemény-kutatások. Hogyan is lehetséges ez? A legfontosabb ok az, hogy a könyv korábbi részeiben tárgyalt különböző hibaforrások mindegyike eredményez valamekkora hibát, de ezen hibák az esetek többségében részben kiegyenlítik egymást. Egy jól végrehajtott közvélemény-kutatás esetében nagyon csekély a valószínűsége annak, hogy valamennyi hibaforrás ugyanolyan előjelű hibát produkáljon. Például az, hogy egy adott párt szavazóinak arányát vizsgálva valamennyi hibaforrás abba az irányba hasson, hogy a valóságnál nagyobb arányt adjon a vizsgálat eredménye, aligha fordul elő. Általában az történik, hogy a hibaforrások egy része pozitív (a valóságnál nagyobb), más része negatív torzítást (a valóságnál kisebb érték) eredményez. Ezek a hibák részben kiegyenlítik egymást, ahelyett, hogy összeadódnának. Például, ha egy vizsgálatban tizenegy lehetséges hiba (mintavétel, a mintába került személyek meg nem találása, nem válaszolás stb.) játszik szerepet, és valamennyi hiba 2%os eltérést eredményez, akkor sokkal valószínűbb, hogy ezek közül hat pozitív és öt negatív lesz – végül a hiba 2% –, mint az, hogy mind a tizenegy hiba pozitív lesz – ami 22% hibát eredményezne. Ez azonban csak akkor várható, ha a közvélemény-kutatás készítői szakmájuk szabályait betartják. Ha egy közvélemény-kutatás készítői – akaratlanul vagy akaratlagosan – a vizsgálat minden lépésében előnyben részesítik egy párt szavazóit, akkor a hibák könnyen összeadódhatnak. 93
11. Miért jók a közvélemény-kutatások?
Ebben a könyvben főleg arról volt szó, hogy melyek azok a veszélyek, amelyeket a közvéleménykutatások készítőinek el kell kerülniük, és arról, hogy az eredmények felhasználója hogyan ítélheti meg a végzett munka minőségét. Nagyon keveset foglalkoztunk azzal, hogy milyen konkrét eljárásokkal lehet a hibák nagyságát csökkenteni, és ezzel valószínűvé tenni a valósághoz közeli eredményeket. Éppen ezeknek az eljárásoknak az ismerete és alkalmazása biztosítja azt, hogy a különböző okokra visszavezethető hibák várhatóan egyenként is kicsik legyenek, és azt is, hogy számíthassunk közöttük a kiegyenlítődésre. Megítélésem szerint a fentiek adják a lényegében helyes választ azokra a kérdésekre, hogy hihetünk-e a közvélemény-kutatásoknak, illetve, hogy miért olyan jók a közvélemény-kutatások eredményei. Azokra a kérdésekre, hogy a közvélemény-kutatások vajon befolyásolják-e a közvéleményt, ez szerepet játszik-e eredményességükben, illetve ez a szerepük nem lényegesebbe, mint deklarált céljuk, nincs és nem is lehetséges általános érvényű válasz. Mindenesetre akármit is gondolnak a közvélemény-kutatások ellenzői és hívei ezekről a kérdésekről, vitathatatlan, hogy a közvélemény-kutatások gyakran pontos képet adnak a közvéleményről, és ezért eredményeiket figyelembe kell venni. Ebből a szempontból érdektelen, hogy ennek oka az, hogy a közvéleménykutatások jól tükrözik a közvéleményt, vagy pedig az, hogy a közvélemény-kutatások sikeresen befolyásolják azt. A közvélemény-kutatások esetleges közvéleményt befolyásoló szerepe, illetve ennek mértéke számos tényezőtől függ, amelyek közül legfontosabb az, hogy milyen kérdéssel kapcsolatban vizsgáljuk a közvéleményt. A közvélemény-befolyásoló hatás bizonyos kérdésekben erősebb lehet, míg másokban gyengébb. A közvélemény-befolyásoló szerep lehetséges nagysága erősen kultúrafüggő, és emiatt, még ha léteznének is empirikus vizsgálatok arra nézve, hogy a közvélemény-kutatások mennyire képesek befolyásolni a közvéleményt, ezek az eredmények csak erős megszorításokkal lennének átvihetőek az egyik országról a másikra. Ezen túlmenően nagyon nehéz lenne egy olyan vizsgálatot végrehajtani, amely empirikus bizonyítékkal szolgálna a közvélemény-kutatások közvéleményt befolyásoló szerepével kapcsolatban. Ehhez arra lenne szükség, hogy először megvizsgálják a közvéleményt valamely kérdésben, ezután a közvélemény egy részének tudomására hozzák az eredményeket, majd megnézzék, hogy a közvélemény-kutatás eredményeiről informáltak véleménye másként változott-e meg, mint azoké, akik nem értesültek az eredményekről. Egy ilyen vizsgálat lehetőségének elemzése előtt meg kell jegyezni, hogy a vizsgálat, még ha megvalósítható is, nem azt mérné, vajon a közvélemény-kutatás hatására változott-e az emberek véleménye, hanem azt, hogy az eredmények publikálása hatott-e a véleményekre. Elméletileg világos, hogy önmagában az a tény, hogy valakinek a véleményét megkérdezik valamiről, befolyásolhatja a véleményét (hát még az, hogy hogyan kérdezik meg a véleményét!), de ennek hatása nem mérhető, mert egy ilyen méréshez az összehasonlíthatóság érdekében a megkérdezés előtt, azaz megkérdezés nélkül is kellene ismerni az emberek véleményét, ami az ehhez a vizsgálathoz szükséges pontossággal lehetetlen. Ráadásul még ha a megkérdezés befolyásolja is a néhány ezer megkérdezett egy részének a véleményét, nyilván nem befolyásolja a populáció óriási 94
11. Miért jók a közvélemény-kutatások?
többségének (azoknak, akiket nem kérdeztek meg) a véleményét. Tehát vizsgálatunk legfeljebb azt mérheti, hogy a közvélemény-kutatás eredményeinek publikálása befolyásolja-e a közvéleményt. Próbáljuk meg megtervezni ezt a vizsgálatot! Legelőször egy olyan témát kell választani, amely kellően fontos, hogy az embereknek legyen róla véleménye, és ez a fontosság motiválja a megkérdezetteket a pontos válaszadásra. Ha azt kérdezzük, hogy a fehér, vagy a sárga színt szeretie jobban a megkérdezett, akkor ez a közvélemény-kutatást meglehetősen komolytalanná teszi a megkérdezettek szemében, és attól kell majd tartanunk, hogy sok véletlenszerű választ kapunk, ami az eredmények értékelését lehetetlenné teszi. Ezért egy fontos kérdésre van szükség, például arra, hogy melyik pártra szavazna. (Természetesen a színre vonatkozó kérdés is lehet fontos, ha például egy város lakóit kérdezik meg arról, hogy egy középületet milyen színűre fessenek.) Az eredményeket ezután közzé kell tenni a közvélemény-kutatások esetében szokásos módokon, majd újra megkérdezni az embereket ugyanarról a kérdésről, és megnézni, hogy azok véleménye, akik az eredményekről értesültek, másként változott-e, mint azoké, akik nem tudnak az eredményekről. Ha a két csoport véleménye hasonlóan változott, akkor nem következtethetünk arra, hogy a közvélemény-kutatás befolyásolta a véleményeket. Ha a két csoport véleménye eltérően változott – nos ebből sem következtethetünk a közvélemény-kutatás hatására, hiszen a két csoport másféle emberekből áll, akiknek véleménye sok más okból is eltérően változhat. A két csoport közötti különbség abból származik, hogy az egyik tagjai elolvassák az újságokban, vagy meghallgatják a rádióban a (például politikai) közvélemény-kutatások eredményeit, a másik csoport tagjai nem. Tehát az első csoport tagjai jobban érdeklődnek a politika iránt, esetleg gyakrabban olvasnak újságot, feltehetőleg magasabb az iskolai végzettségük, stb. Ezért könnyen elképzelhető, hogy véleményük a közvélemény-kutatástól függetlenül is másként változik, mint a kevésbé érdeklődő csoporté. Ezt a problémát csak úgy oldhatnák meg a kísérlet tervezői, ha ők döntenék el, hogy kik értesülnek a közvélemény-kutatás eredményeiről, és kik nem. Általános kísérlettervezési elvek ezen túlmenően még azt is megkívánják, hogy a kísérlet résztvevőit véletlenszerűen osszák az eredményekről értesülők, illetve nem értesülők csoportjaiba. Csak így remélhetjük, hogy a két csoport azonos lesz, és ha véleményük eltérően változik, akkor az kizárólag a közvéleménykutatás eredményei megismerésének tudható be. Ha a kísérletet így akarják végrehajtani, akkor nem lehet a közvélemény-kutatás eredményeit a szokásos módokon közölni (hiszen az újságot bárki elolvashatja), hanem más megoldást kell választani. Például az eredményeket nem publikálják, hanem a kiválasztottaknak levélben megküldik. Ekkor értékelhető a vélemények esetlegesen eltérő megváltozása a két csoportban. Ha a vélemények eltérő módon változnak a két csoportban, akkor az a közvélemény-kutatás eredményei megismerésének tudható be. Már csak az a kérdés marad, hogy ha egy megkérdezettel személyre szóló levélben tudatjuk azt, hogy melyik a legnépszerűbb párt, és ez esetleg a saját véleményének a megváltoztatására készteti, akkor vajon ugyanezt a hatást tételezhetjük-e fel a közvélemény-kutatás eredményeinek a sajtóban szokásos módon történő publikálásáról.
95
11. Miért jók a közvélemény-kutatások?
Mindezen nehézségek miatt a közvélemény-kutatások esetleges közvéleményt befolyásoló hatására vonatkozó empirikus bizonyíték nemigen áll rendelkezésre, és biztosan állíthatjuk, hogy Magyarországra nézve ilyen bizonyíték nincs. Érdekes adalék ezzel kapcsolatban (az Amerikai Egyesült Államokból), hogy az „Ön kire szavazna?” kérdésnél általában pontosabb előrejelzést lehet adni a választások győzteséről annak a kérdésnek az alapján, hogy „Ön szerint ki nyeri a választásokat?”. Ezt a tényt úgy is értelmezhetjük, hogy az emberek meg tudják különböztetni saját véleményüket a közvéleménytől. Ugyanakkor a választások utáni felmérések alkalmával a megkérdezetteknek nagyobb hányada állítja, hogy ő a győztes pártra szavazott, mint amekkora a győztes tényleges szavazati aránya volt. Itt nyilván befolyásolással állunk szemben, de nem a közvélemény-kutatás az, ami befolyásol, hanem a választások tényleges eredményének megismerése.
Összefoglalás Nem igaz, hogy minden közvélemény-kutatás jó eredményeket ad, de a helyesen megválasztott módszerekkel végzett közvélemény-kutatások az esetek nagy többségében majdnem pontos eredményekre vezetnek. Ennek oka azon túlmenően, hogy a különböző hibák kicsik, az, hogy a hibák kiegyenlítődnek. A gyakran igen pontos eredmények jelentik a közvélemény-kutatások hasznát. Az ellenzők fő érvét – hogy a közvélemény-kutatások befolyásolnák a közvéleményt – nem támasztja alá empirikus bizonyíték.
96