Megjelent: Vargha A. (2007). Pszichológiai statisztika dióhéjban. In: Czigler I. és Oláh A. (szerk.), Találkozás a pszichológiával. Osiris Kiadó, Budapest, 327-346.
Vargha András PSZICHOLÓGIAI STATISZTIKA DIÓHÉJBAN1 Mi az, hogy statisztika? A Magyar értelmező kéziszótár szerint a statisztika az a tudomány, amely tömeges jelenségek, folyamatok számbeli adatainak összegyűjtésével, nyilvántartásával, elemzésével és feldolgozásával foglalkozik. Bármily meglepő azonban, a statisztika művelése nemcsak a tudósok privilégiuma, ilyesfajta tevékenységet majd minden ember végez. A X.1. táblázat például Béla, egy kilencedikes középiskolás tanuló év végi bizonyítványának alapján készült.
X.1. táblázat: Egy iskolai bizonyítvány Tantárgy Magyar irodalom Magyar nyelv Angol nyelv Matematika Fizika Kémia Biológia Földrajz Ének-zene Rajz és műalkotások elemzése Testnevelés
Osztályzat Jeles Jeles Jeles Jeles Közepes Jó Jó Jó Jeles Jeles Jeles
Ha Bélától megkérdezi egy ismerőse, hogy milyen volt a bizonyítványa, Béla aligha fogja felsorolni a táblázatban összefoglalt 11 tantárgyat és a rájuk kapott jegyeket. Sokkal valószínűbb, hogy Béla ilyesformán felel: „Kaptam hét ötöst, három négyest és egy hármast.” Bár Béla ennek aligha van tudatában, az általa közölt adatok statisztikai információk, melynek elnevezése statisztikai szakszavakkal: a kilencedikes év végi bizonyítvány érdemjegyeinek gyakorisági eloszlása. Kevés olyan szülő van, aki ne próbálná gyerekének bizonyítványát egyetlen számmal, a jegyek átlagával is jellemezni, mely Béla esetében most a következőképpen néz ki (két tizedesre kerekítve):
átlag
jegyek összege 7 5 3 4 3 50 4,55. jegyek száma 7 3 1 11
Némi egyszerűsítéssel azt mondhatjuk, hogy ha valamilyen vizsgálattal vagy kutatással kapcsolatban rendelkezésre áll egy nagyobb adategyüttes, akkor gyakran statisztikai módszerekkel lehet ezekből az adatokból a szakmailag lényeges információt kiszűrni, az 1
A szerző itt szeretne köszönetet mondani Czigler Balázsnak a kézirat első változatának elolvasásáért és hasznos észrevételeiért.
1
átláthatatlan adattömeget kevés számú, de tartalmas mutatóval leírni, s ezek segítségével a vizsgált jelenségről, csoportokról érvényes következtetéseket megfogalmazni. Miért van szüksége a pszichológia tudományának statisztikára? A feltett kérdést egy valódi pszichológiai vizsgálat segítségével válaszoljuk meg. Egy emlékezettel kapcsolatos vizsgálatban a résztvevő személyeknek, akik egyetemi hallgatók voltak, három 12 betűből álló értelmetlen szót (véletlen betűsort) vetítettek ki 5-5 másodperces időtartamban. A személyeket minden szó után megkérték, hogy a náluk lévő papírra próbálják meg leírni, hogy mit láttak. Az 1. értelmetlen betűsor (alternáló szó) mássalhangzóval kezdődött és benne a magánhangzók és mássalhangzók szabályosan váltogatták egymást; a 2. értelmetlen betűsor (msh szó) csupa mássalhangzóból, a 3. pedig (mgh szó) csupa magánhangzóból állt (lásd X.2. táblázat). X.2. táblázat: Egy emlékezeti vizsgálatban vetített három értelmetlen szó 1. értelmetlen betűsor (alternáló szó) 2. értelmetlen betűsor (msh szó) 3. értelmetlen betűsor (mgh szó)
MUBÖZÚHÉKÜTA LTMJKNRBZBTH ÖAÜEÁOÍÉUÓIÜ
A vizsgálatban arra a kérdésre kerestünk választ, hogy a három szótípus különbözik-e egymástól a megjegyezhetőség tekintetében. A megjegyezhetőség egyik mértékeként minden személy esetében megnéztük, hogy a vetített szavak első hány betűjét reprodukálták, vagyis adták meg helyesen. Az ily módon definiált mennyiségeket a statisztikában változóknak nevezik. E három változóra vonatkozó adatokat a X.3. táblázat tartalmazza az összes vizsgálatban résztvevő személyre vonatkozóan. X.3. táblázat: Egy emlékezeti vizsgálat adatai Személy 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
1. szó (alternáló)
2. szó (msh)
3. szó (mgh)
6 12 12 5 6 5 5 9 3 9 7 6
5 5 0 8 5 7 5 7 1 5 3 3
2 5 6 4 5 6 3 1 5 5 1 2
Személ y 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
1. szó (alternáló)
2. szó (msh)
3. szó (mgh)
9 9 9 2 9 2 1 6 1 5 3 3
6 9 4 3 5 5 6 6 6 6 5 6
5 5 0 5 5 2 2 2 5 5 4 6
A X.3. táblázat adatait megszemlélve aligha bontakozik ki előttünk világos kép a megvizsgált jelenségről. Néhány elemi statisztikai művelet segítségével azonban hamarosan okosabbak leszünk. a) Ha szavanként megnézzük, hogy rendre hány személy reprodukálta helyesen a szó első 0, 1, 2, … , 11, 12 betűjét, majd ezekből egyszerű oszlopdiagramokat készítünk, akkor a X.1., X.2. és X.3. ábrán látható eredményre jutunk. 2
7
6
6 Gyakoriság
5
4
4
3
3
2
2 1 0
4
2
2 1
0
0
0
1
2
3
4
0 5
6
7
0
8
0
9 10 11 12
1. szó (alternáló): MUBÖZÚHÉKÜTA
X.1. ábra: Az 1. értelmetlen betűsorra vonatkozó emlékezeti teljesítmény változójának gyakorisági eloszlása a 24 fős vizsgálati mintában
9
8
8
Gyakoriság
7
6
6 5 4
3
3 2 1
2 1
1
1
1
1
8
9
0
0 0
1
2
3
4
5
6
7
2. szó (msh): LTMJKNRBZBTH
X.2. ábra: A 2. értelmetlen betűsorra vonatkozó emlékezeti teljesítmény változójának gyakorisági eloszlása a 24 fős vizsgálati mintában
3
12 10
Gyakoriság
10 8 6
5
4 2
3 2
2
1
1
0 0
1
2
3
4
5
6
0
0
0
7
8
9
3. szó (mgh): ÖAÜEÁOÍÉUÓIÜ
X.3. ábra: A 3. értelmetlen betűsorra vonatkozó emlékezeti teljesítmény változójának gyakorisági eloszlása a 24 fős vizsgálati mintában Ezekről az ábrákról, amelyeket a statisztikában hisztogramoknak neveznek, már kibontakozik egy-két vizsgálattal kapcsolatos összefüggés. Az egyik ilyen például az, hogy a csupa magánhangzóból álló 3. szó (mgh) felidézése nehezebbnek tűnik, mint az első kettőé, amit az árul el, hogy ennél a szónál érezhetően kisebb arányban fordulnak elő a jobb felidézési teljesítményt tükröző nagyobb értékek. b) Hasonló következtetésre jutunk, ha a X.3. táblázat adataiból kiszámítjuk a három szó felidézési változójának átlagát, melyeket az előforduló legkisebb és legnagyobb értékkel együtt a X.4. táblázatban foglaltunk össze. X.4. táblázat: A három szó felidézési változójának néhány alapstatisztikája Változó 1. alternáló betűsor felidézési mutatója 2. mássalhangzók felidézési mutatója 3. magánhangzók felidézési mutatója
Átlag 6,0 5,0 3,8
Minimum 1 0 0
Maximum 12 9 6
A X.1., X.2. és X.3. ábrán látható oszlopdiagramok, illetve a X.4. táblázatban összefoglalt statisztikai jellemzők a leíró statisztika eszköztárába tartoznak. A leíró statisztika fő feladata, hogy nagyobb adategyütteseket kevés számú, de tartalmas mutatóval, illetve ábrával lényegre szorítkozóan és hitelesen leírjon. Ennek segítségével a jelen esetben megállapíthatjuk például, hogy az ismertetett pszichológiai vizsgálatban a résztvevő 24 személy összességében hatékonyabban idézte fel a nyelvünk értelmes szavaira jobban hasonlító alternáló értelmetlen betűsort, mint a csupa mássalhangzóból, illetve csupa magánhangzóból állót, továbbá a csupa mássalhangzóból álló betűsor megjegyzése érezhetően nehezebbnek bizonyult, mint a csupa magánhangzóból állóé. Kérdés persze, hogy lehet-e egy ilyen vizsgálat adataiból messzemenő következtetéseket levonni. Ha mondjuk valamilyen varázslatos technika segítségével a szóban forgó vizsgálatot el tudnánk végezni az összes magyar egyetemi hallgatóval, akkor a 2. (msh) szó felidézési átlaga itt is jobb lenne, mint a 3. (mgh) szóé? Egyáltalán a mi 24 fős mintánk 4
alapján levonható valamilyen következtetés arra, hogy kb. mekkora lehet a három szó felidézési mutatójának átlaga az összes magyar egyetemi hallgató populációjában? Az ilyen és ehhez hasonló kérdések megválaszolásával a statisztikának egy másik ága, az ún. következtetési statisztika foglalkozik. Lehet-e 24 egyedről egy egész populációra megbízhatóan következtetni? Mindjárt az elején szögezzük le: statisztikai módszerekkel ez lehetséges, ha bizonyos feltételek teljesülnek. A dolog lényegét egy egyszerű pénzfeldobásos játékkal szemléltetjük. Van egy pénzérménk fej és írás oldallal, s arról szeretnénk megbizonyosodni, hogy az érme cinkelt-e, vagyis hogy szabályos véletlen dobás esetén a fej és az írás dobása egyaránt 50%-os esélyű-e. A probléma minden bizonnyal megoldható az érme alapos fizikai és kémiai elemzésével, a statisztika azonban egy másféle megoldást kínál, amelyet az alábbiakban részletezünk. 1. Dobjunk az érmével sokszor (jelöljük ezt a számot most n betűvel), egymástól függetlenül, szabályosan, tehát a véletlenre bízva, hogy hogyan esik le az érme, s számoljuk meg a fej dobások számát az n kísérlet során. 2. Határozzuk meg matematikai számítással, hogy azonos esélyű fej és írás dobás esetén n dobásból a matematika szabályai szerint hány fejnek kell előfordulnia igen nagy valószínűséggel. Ha ez nem is olyan pofon egyszerű, standard kombinatorikai vagy valószínűségszámítási módszerekkel könnyedén kiszámítható. Például n = 10 esetén a 0, 1, …, 9, 10 számú fej dobás előfordulásának százalékos esélyét a X.5. táblázatban foglaltuk össze. A X.5. táblázatból kiolvasható, hogy szabályos pénzérme esetén olyan szélsőséges szituáció, hogy mind a 10 dobás fej legyen, vagy hogy egyetlen fej se forduljon elő, az eseteknek csak a 0,1 + 0,1 = 0,2 százalékában fordul elő, vagyis 1000 dobásból átlagosan 2-szer. Ez azt jelenti, hogy a dobások kb. 99,8%-ában 1 és 9 között lesz a fejek száma, s hasonló módon az is egyszerűen adódik, hogy szabályos érme esetén a dobások kb. 97,8%-ában a fejek száma 2 és 8 közé esik. 3. Ha a kapott eredmény nagyon ellentmond annak a kiinduló feltételezésünknek, hogy az érme szabályos, akkor vessük el bátran ezt a feltételezést. Ha például 10 dobásból a fejek száma nem esik az 1–9 számok közé (a szélső értékeket is beleértve), ez ellentmond az érme szabályosságának, mert szabályos érme esetén a fejek száma szinte mindig (az esetek 99,8%-ában) 1 és 9 közé esik. Persze 10-ből 10 fej szabályos érme esetén sem lehetetlen, csak annyira parányi esélyű, hogy ilyen esetben inkább arra fogunk gondolni, hogy az érmével van valami galiba.
X.5. táblázat: A 0, 1, …, 9, 10 számú fej dobásának százalékos esélye n = 10 dobásból Fejek száma
Százalékos esély
Fejek száma
Százalékos esély
0
0,1%
6
20,5%
1
1%
7
11,7%
2
4,4%
8
4,4%
3
11,7%
9
1%
4
20,5%
10
0,1%
5
24,6%
5
Térjünk vissza most pszichológiai vizsgálatunk adataihoz. A X.4. táblázat adatainak láttán többféle gondolat is megfogalmazódhat bennünk, az egyik ilyen például az, hogy a csupa mássalhangzóból álló 12 betűs értelmetlen jelsorozatokat (msh szavakat) könnyebb megjegyezni, mint a csupa magánhangzóból állókat (mgh szavakat). Az általunk megvizsgált 24 személyből mindössze 3 olyan volt, aki az mgh szót teljesebben idézte fel, mint az msh szót. 16 személy esetében az msh szó felidézése volt a könnyebb, 5 személy pedig a két szót ugyanolyan mértékben reprodukálta (vö. X.3. táblázat). Ha a két szó esetében eltérő felidézési teljesítményt nyújtó személyekre szorítkozva (mintánkban 3 + 16 = 19 ilyen van) azzal a feltételezéssel élünk, hogy a két típusú betűsor megjegyzése ugyanolyan nehézségű, akkor bármelyik személy esetében – egyéb információ híján – ugyanakkora az esélye, hogy az illető az msh szót idézte fel jobban, mint hogy az mgh-t. Ha ez igaz, akkor az érmés példával analóg módon megállapítható, hogy ilyen esetben a 19 személyből az esetek nagy többségében hány főnél számíthatunk arra, hogy az msh szó felidézési teljesítménye jobb lesz, mint az mgh szóé. Kiszámítható például, hogy ilyen feltételek mellett (ugyanolyan felidézési nehézségű betűsor) a 19 személyből 4 és 15 közti számú esetben várható, hogy az msh szó felidézési teljesítménye jobb lesz, mint az mgh szóé. (Ez ugyanaz, mintha azt mondanánk, hogy szabályos érmét használva 19 véletlen dobásból az esetek kb. 99,6%-ában 4–15 számú fejre számíthatunk.) Minthogy a mi pszichológiai vizsgálatunkban a megfigyelt eredmény (19-ből 16 esetben msh szó fölény) erősen ellentmond az egyforma felidézési teljesítmény hipotézisének, ezt a hipotézist elvetjük és azt állapítjuk meg, hogy a két szó megjegyezhetősége eltérő nehézségű. Tekintve, hogy mintánkban az msh szóra vonatkozó felidézés volt dominánsan kedvezőbb, a különbség megállapítása után ennek fölényét jósoljuk be a populációban is. A statisztikában statisztikai próbáknak nevezik azokat a speciális eljárásokat, amelyek segítségével a fentebb részletezetthez hasonló típusú hipotézisek vizsgálatát végzik. Mennyire lehetünk biztosak abban, hogy jól döntünk, ha egy populációra vonatkozó hipotézist elfogadunk vagy elutasítunk? Abból kell kiindulnunk, hogy a megismerni kívánt populációról mindig csak részleges, korlátozott információ áll rendelkezésre: 10-20, esetleg néhány száz vagy ezer egyén adatai. Ezek alapján száz százalékos megbízhatóságú következtetés eleve lehetetlen, így a pszichológiai statisztika olyan módszereket keres, amelyek alkalmazása esetén a hibás döntés valószínűsége bizonyos előre meghatározott, viszonylag alacsony szint alatt marad. A pszichológiai statisztikában általánosan elfogadott konszenzus alapján ez a hibaszint 5%, ami azt jelenti, hogy pszichológiai adatok statisztikai elemzései során olyan következtetések levonására törekszünk, amelyek megbízhatósága minimum 95%-os. Ennek szellemében a statisztikai hipotézisvizsgálatok általános gondolatmenete egy populációra vonatkozó feltételezés tesztelése során a következő. 1. A vizsgált pszichológiai populációból kiválasztunk véletlenszerűen egy kellően nagy (ha lehetséges, minimum 20-50 fős) mintát, s ennek egyedein egymástól függetlenül elvégezzük a szóban forgó pszichológiai kérdéssel kapcsolatos mérést, vizsgálatot vagy kísérletet. 2. Kiszámítunk egy alkalmas statisztikai mutatót, mely szoros kapcsolatban van a megfogalmazott hipotézissel (a fenti emlékezetéssel kapcsolatos példában ez azon személyek száma, akik esetében az msh szó felidézése jobb, mint az mgh szóé). 3. Matematikai módszerrel, illetve alkalmas statisztikai táblázat segítségével meghatározzuk azt az értéktartományt (az ún. megtartási tartományt), ahova ennek a statisztikai mutatónak az értéke az esetek minimum 95%-ában beleesik. 4. Ha a konkrét esetben a mutató értéke beleesik a megtartási tartományba, ezt úgy értelmezzük, hogy vizsgálati adataink nem mondanak ellent kellő mértékben a megfogalmazott hipotézisnek, ezért a hipotézist nem utasítjuk el. Ha viszont a 6
mutató értéke nem esik bele a megtartási tartományba, ahova az adott hipotézis esetén nagy (minimum 95%-os) valószínűséggel esnie kell, ezt úgy értelmezzük, hogy empirikus vizsgálatunk adatai erősen ellentmondanak a megfogalmazott hipotézisnek, ezért a hipotézist elutasítjuk (elvetjük). Mivel a hipotézis igaz volta esetén a statisztikai mutató értéke igen ritkán (5%-osnál kisebb eséllyel) kerül kívül a megtartási tartomány határain (ilyenkor sajnos tévesen döntünk), ezért a hipotézis fenti kifejtett logikájú elutasítása esetén döntésünk megbízhatósága minimum 95%-os. Ha a statisztikai mutató értéke beleesik a megtartási tartományba, vagyis ha olyan eredményt kapunk, melynek alapján a hipotézist nem lehet 95%-os megbízhatósággal elutasítani (pl. amikor 10 dobásból 7 fejet kapunk), akkor nem tudunk kellő bizonyossággal semmit kijelenteni. Sem azt, hogy a hipotézis igaz, sem azt, hogy hamis. Ilyenkor nem kötelezzük el magunkat sem a hipotézis mellett, sem ellene. Inkább nem mondunk semmit, sem hogy kellő alap nélkül vonjunk le a pszichológiai vizsgálatból olyan következtetést, amely esetleg nem is igaz. Ha például barátunkkal fej vagy írást játszunk és ő 10-ből 8-szor fejet dob, kár lenne emiatt a nyakának ugrani, hogy biztosan cinkelt pénzzel játszik (kiváltképp, ha nálunk sokkal erősebb!). Ha viszont 10-ből 10-szer dob fejet, erősen javasolt, hogy hagyjuk abba vele ezt a játékot. A statisztikai hipotézisvizsgálat menete hasonlít egy igazságos bírósági eljárásra is. Ahogy a vádlottat is csak akkor ítélik el, ha a bíró vagy az esküdtek testülete egyértelműen meggyőződött a bűnösségéről, a statisztikai hipotézis elutasításáról is csak akkor hozunk döntést, ha a hipotézis igazsága ellen megfelelő súlyosságú érv szól. A statisztikában az számít egy hipotézissel szemben megfelelő súlyosságú érvnek, ha olyan esemény következik be, amely a hipotézis igaz volta esetén igen ritkán – 5%-nál kisebb eséllyel – következik be. Nem jó az átlagnak egyedül A X.6. táblázat három bizonyítványt mutat be. A három bizonyítvány átlaga hajszálra ugyanaz, mégis jól látható különbség van közöttük. Ha muszáj lenne közülük választani, a kedves olvasó melyiket részesítené előnyben? Gondolom, a 3. bizonyítványt biztos elkerülné. X.6. táblázat: Három azonos átlagú bizonyítvány Tantárgy Magyar irodalom Magyar nyelv Angol nyelv Matematika Fizika Kémia Biológia Földrajz Ének-zene Testnevelés átlag
1. bizonyítvány 3 3 3 3 3 3 3 3 3 3 3
2. bizonyítvány 4 2 4 2 4 2 4 2 4 2 3
3. bizonyítvány 5 1 5 1 5 1 5 1 5 1 3
A X.6. táblázat három bizonyítványának adatsora – statisztikai szóhasználattal a három adatminta – abban tér el egymástól, hogy az adatok eltérő mértékben szóródnak saját centrumuk, az átlag körül. Az 1. bizonyítvány esetében minden jegy megegyezik az átlaggal, 7
vagyis saját átlagától 0 távolságra van. A 2. bizonyítvány esetében minden jegy pontosan 1 egységgel különbözik az átlagtól, míg a 3. bizonyítvány esetében az átlagtól minden jegy 2 egységgel tér el. A statisztikai összességeknek és mintáknak az a tulajdonsága, hogy az adatok mennyire szóródnak az átlag körül, az átlag mellett talán a legfontosabb jellemzője. E szóródás nagyságát mérhetjük például úgy is, hogy kiszámítjuk az adatok átlagos abszolút eltérését az átlagtól, mely a X.6. táblázatban látható három bizonyítvány esetében rendre 0, 1, illetve 2 egység. További példaként az 5, 0, 2, 1, 2 minta esetében az átlag láthatóan 2, az ettől való átlagos abszolút eltérés (AE) pedig a következő: AE
5 2 0 2 2 2 1 2 2 2 5
3 2 0 1 0 6 1,2. 5 5
Egy ehhez hasonló mutatót kapunk, ha az átlagtól való átlagos négyzetes eltérést számítjuk ki, melyet a statisztikában varianciának hívnak. A fenti 5 adatból álló minta esetében ennek a mutatónak az értéke: (5 2) 2 (0 2) 2 (2 2) 2 (1 2) 2 ( 2 2) 2 9 4 0 1 0 14 Var 2,8. 5 5 5
Mivel a variancia négyzetes eltérések átlaga, négyzetgyökvonással kaphatunk belőle olyan mutatót, mely az adatok saját átlaguktól való eltérésének mértékéről tájékoztat. Ez a szórásnak nevezett és magyarul s-sel jelölt mutató esetünkben: s 2,8 1,67,
mely kis mértékben nagyobb, mint ugyanezen minta átlagos abszolút eltérése (1,20). Kvantitatív adatminták két legfontosabb és leggyakrabban használt mutatója az átlag és a szórás. Ezeket többnyire együtt szokták megadni. Az átlag tájékoztat az adatok nagyságszintjéről, a szórás pedig arról, hogy az adatok mennyire szóródnak (variálnak, ingadoznak) ezen szint körül. A rend kedvéért meg kell említenünk, hogy a pszichológiai statisztikában az adatminták varianciáját (s ennek következtében a szórást is) a fentebb leírttól parányit eltérő képlettel szokták definiálni. E kis eltérés abból áll, hogy a variancia kiszámításakor a négyzetes eltérések összegét nem az adatok számával, vagyis a mintaelemszámmal osztják le, hanem ennek 1-gyel csökkentett értékével. Ennek megfelelően például a fenti 5 elemű minta esetében a korrigált számítás: Var
14 3,5 és s 3,5 1,87. 4
Ennek a kis korrekciónak egyetlen előnye van: a korrigált mintavariancia a korrekció nélküli változatnál pontosabban, azaz kisebb hibával becsüli a minta által képviselt populáció varianciáját, mely a populációbeli összes adat átlagos négyzetes eltérése a populációátlagtól. Mi a nagyobb, 55 cm vagy 5 kg?
8
Első hallásra talán hajlamosak vagyunk azt mondani, hogy az 55 cm, mert 55 nagyobb, mint 5. Óvatosabb megközelítéssel esetleg azt válaszoljuk, hogy a feltett kérdésnek nincs értelme, mert az 55 cm más dimenzióban mér, mint az 5 kg. A válaszadást azonban nem kerülhetjük ki ilyen könnyen, ha a kérdést így pontosítjuk: egy 55 cm testhosszal és 5 kg testsúllyal született csecsemő melyik adata tekinthető nagyobbnak, a testhossza (55 cm), vagy a testsúlya (5 kg)? A testhossz és a testmagasság nagyságának megítéléséhez szükség van valamilyen viszonyítási alapra. Az átlag és a szórás ilyen mutatók. Statisztikai adatokból tudjuk, hogy Magyarországon az újszülött csecsemők testhossz átlaga kb. 50 cm, szórása pedig kb. 2,5 cm. Ez azt jelenti, hogy az 55 cm-es születési testhossz az átlagost észrevehetően meghaladó érték. Nem lehetne valahogy ennek a mértékét is meghatározni? A 2,5 cm-es testhossz szórás azt jelzi, hogy az újszülöttek testhossza átlagosan 2,5 cm-rel különbözik az 50 cm-es átlagtól, az 55 cm pedig ennek megfelelően az átlagos eltérés kétszeresével. Azt látjuk tehát, hogy ha egy adat esetében kiszámítjuk, hogy az adat hány szórásnyira van az átlagtól, akkor az adat nagyságát jól kifejező értéket kapunk. Ezt az értéket, amely most az 55 cm-es születési testhossz érték esetében z = (55–50)/2,5 = 2, az adott 55 cm-es érték standard értékének nevezzük. Az átlag standard értéke láthatóan mindig 0, az átlagnál nagyobb értékeké mindig pozitív, az átlagnál kisebb értékeké pedig mindig negatív. Tekintve, hogy jelenleg Magyarországon a születési súly átlaga kb. 3,2 kg, szórása pedig kb. 0,5 kg, az 5 kg-os testsúlyhoz tartozó standard érték: z = (5–3,2)/0,5 = 3,6. Mivel az 55 cm-es testhosszhoz tartozó standard érték 2, az 5 kg-os születési súlyhoz tartozó pedig 3,6, immár megállapíthatjuk, hogy az 55 cm-es érték itt most kisebbnek számít, mint az 5 kg-os. A standard érték szemléltetésére egy pszichológiai példát is bemutatunk. Az intelligenciát mérő Magyar Wechsler Intelligenciateszt (MAWI) úgy lett elkészítve, hogy az általa mért IQ mutató átlaga és szórása a magyar populációban rendre 100, illetve 15 legyen. A standard értékről fentebb mondottak alapján megállapíthatjuk, hogy például egy 130-as IQérték standard értéke (130–100)/15 = 2, a 80-é (80–100)/15 = –1,33. Meg tudná mondani az olvasó, hogy a –2-es standard értéknek pontosan milyen IQ-érték felel meg? Hogy lehet a pszichológiában változók kapcsolatát megvizsgálni? Kapcsolatban van-e az egyén boldogsága azzal, hogy milyen anyagi körülmények között él? Függ-e a gyermek intelligenciája szüleinek intelligenciaszintjétől? Igaz-e, hogy az énerő negatív kapcsolatban van a szorongással? A pszichológiában a legtöbb kérdés változók kapcsolatának formájában fogalmazódik meg. Ezzel összefüggésben ha van két változónk, két alapvető kérdés mindig megválaszolásra vár. 1. Van-e valamilyen kapcsolat (összefüggés, együttjárás) a vizsgált két változó között? Ennek tisztázására függetlenségük hipotézisét szokták valamilyen statisztikai próbával tesztelni. 2. Milyen szoros kapcsolatban van a vizsgált két változó egymással? Ezt a kérdést leginkább akkor célszerű feltenni, ha már kiderült, hogy a két változó nem független egymástól. Változók kapcsolatának szorosságát különböző kapcsolati, asszociációs vagy korrelációs mutatók segítségével szokták mérni. Az alábbiakban megismertetjük az olvasót a pszichológiában leggyakrabban használt kapcsolati mérőszám, a korrelációs együttható fogalmával.
9
4,5
Testsúly (kg)
4 3,5 3 2,5 2 1,5 1 38
40
42
44
46
48
50
52
54
Testhossz (cm)
X.4. ábra: 20 újszülött csecsemő testhossza és testsúlya koordinátarendszerben ábrázolva A X.4. ábrán 20 újszülött csecsemő testhosszát és testsúlyát mutatjuk be kétdimenziós koordinátarendszerben. Az ábrán minden egyes pont egy csecsemő két születési adatát képviseli. Például az ábra bal alsó sarkához közeli pont egy 1,5 kilóval és 40 cm-rel született csecsemőt képvisel. Ezen az ábrán szembeötlő a pontoknak egy emelkedő vonulata (trendje), mely abból fakad, hogy egy kisebb testhosszú csecsemőnek általában a testsúlya is kisebb, nagyobb testhosszúnak pedig nagyobb. Emiatt azt kell megállapítanunk, hogy az újszülött csecsemőknél a testhossz és a testsúly nem független egymástól, láthatóan pozitív kapcsolat van köztük. De hogy lehetne ezt a kapcsolatot valamilyen egyszerű mutató segítségével számformába önteni? A pozitív kapcsolatnak az a legfőbb jellegzetessége, hogy ha az átlagosnál nagyobb az egyik változó (esetünkben a testhossz) értéke, akkor többnyire az átlagosnál nagyobb lesz a másiké (esetünkben a testsúlyé) is. De az átlagnál nagyobb értékek standard értéke 0-nál nagyobb (lásd fentebb), így ebben az esetben a két változó standard értékének a szorzata is 0nál nagyobb, vagyis pozitív szám lesz. Ha pedig az egyik változó értéke az átlagnál kisebb, akkor pozitív kapcsolat esetén rendszerint a másiké is kisebb lesz saját átlagánál, így a standard értékek negatívak lesznek, szorzatuk (két negatív szám szorzata) viszont ismét pozitív. A X.5. ábra két másik változó, a Kaliforniai Személyiség Kérdőív Szorongás és Énerő skálájának kapcsolatát szemlélteti, a 80-as évek elején pszichológia szakra felvételiző személyek 82 fős mintája alapján. Az ábrán azt láthatjuk, hogy kisebb szorongás általában nagyobb énerővel, nagyobb szorongás pedig kisebb énerővel jár együtt, ami a két változó negatív kapcsolatáról árulkodik. Ilyen jellegű kapcsolatok esetén, ha az átlagosnál nagyobb az egyik változó értéke, akkor többnyire az átlagosnál kisebb lesz a másiké is, és fordítva. Így ebben az esetben a standard értékek általában ellentétes előjelűek, ami miatt a szorzatuk többnyire negatív szám lesz. A könnyebb érthetőség kedvéért a X.4. ábrán bemutatott 20 csecsemő adatait táblázatban is összefoglaltuk, feltüntetve az adatokhoz tartozó standard értékeket, s azok szorzatát is (lásd X.7. táblázat). 10
45 40
Énerő
35 30 25 20 15 10 0
5
10
15
20
25
Szorongás X.5. ábra: Két negatív kapcsolatban lévő változó
X.7. táblázat: 20 újszülött csecsemő testhossza és testsúlya eredeti és standard értékkel kifejezve, valamint a standard értékek szorzata Csecsem ő
Testhoss z (cm)
Testsúl y (kg)
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. Átlag: Szórás:
51 47 53 49 50 46 51 49 50 50 50 47 49 52 48 50 52 40 46 49 48,95 2,856
3,30 2,45 3,58 3,30 3,39 2,53 3,40 2,90 3,10 3,40 3,00 2,62 3,40 4,18 3,08 3,44 3,80 1,50 2,70 3,15 3,111 0,571
Testhossz (standard érték) 0,72 -0,68 1,42 0,02 0,37 -1,03 0,72 0,02 0,37 0,37 0,37 -0,68 0,02 1,07 -0,33 0,37 1,07 -3,13 -1,03 0,02 0 1
Testsúly (standard érték) 0,33 -1,16 0,82 0,33 0,49 -1,02 0,51 -0,37 -0,02 0,51 -0,19 -0,86 0,51 1,87 -0,05 0,58 1,21 -2,82 -0,72 0,07 0 1
Standard értékek szorzata 0,2376 0,7904 1,1648 0,0058 0,1796 1,0510 0,3633 -0,0065 -0,0071 0,1861 -0,0715 0,5871 0,0089 1,9993 0,0181 0,2118 1,2886 8,8415 0,7435 0,0012 0,8797
11
Mind a X.4. és a X.5. ábra, mind a X.7. táblázat alapján meggyőződhetünk arról, hogy ha két változó pozitív kapcsolatban van, akkor standard értékük szorzata általában pozitív, ha pedig negatív kapcsolat van köztük, akkor standard értékük szorzata általában negatív. Emiatt e szorzatok teljes mintára, illetve populációra vonatkozó átlaga olyan mutató, amely egyaránt jelzi a két változó kapcsolatának irányát (pozitív vagy negatív) és szorosságát. Ezt a mutatót korrelációs együtthatónak (röviden korrelációnak) nevezzük, melynek szokásos jele r. Matematikai eszközökkel igazolható, hogy r nem lehet kisebb –1-nél és nem lehet nagyobb +1-nél. Egy 0 körüli r érték azt mutatja, hogy a két változó pozitív és negatív kapcsolatát jelző adatok egyensúlyban vannak, egyik sem domináns a másikkal szemben. A +1-hez közeli r értékek a két változó vonatkozásában a pozitív kapcsolat erős dominanciáját, a –1-hez közeliek pedig a negatív kapcsolat erős dominanciáját jelzik. A X.4. ábrán szemléltetett születési testhossz és testsúly közti korreláció három tizedesre kerekítve: r = 0,880 (lásd X.7. táblázat), vagyis erősen pozitív, a X.5. ábrán látható Énerő és Szorongás skálák közti korreláció pedig r = –0,749, vagyis erősen negatív. X.8. táblázat: 500 gyermek újszülött korában és 10 évesen mért testhossz (testmagasság) és testsúly adata között páronként kiszámított korrelációk Változó Születési testsúly Születési testhossz Testsúly 10 éves korban Testmagasság 10 éves korban
Születési testsúly 1
Születési testhossz 0,788
Testsúly 10 éves korban 0,164
Testmagasság 10 éves korban 0,236
0,788
1
0,228
0,327
0,164
0,228
1
0,662
0,236
0,327
0,662
1
Ha kettőnél több változónk van és kíváncsiak vagyunk arra, hogy milyen kapcsolatban vannak, akkor a változók között páronként kiszámított korrelációkat gyakran célszerű táblázatos formában bemutatni. Ennek neve korrelációs táblázat, vagy korrelációs mátrix. Szemléltetésképpen 500 véletlenszerűen kiválasztott magyar gyermek születési súlya és testhossza, valamint 10 éves kori testsúlya és testmagassága között kiszámított korrelációk táblázatát a X.8. táblázatban mutatjuk be. Ebből kiolvasható, hogy legszorosabb kapcsolatban a születéskori testsúly és testhossz, valamint a 10 éves kori testsúly és testmagasság van. A korrelációk a többi változópár (pl. a születési testhossz és a 10 éves kori testmagasság) esetében is pozitívak, csak nem annyira erősek. E táblázatban érdemes megfigyelni, hogy egy változónak saját magával való korrelációja mindig 1 (azaz maximálisan pozitív). Mekkora IQ-vagyont öröklünk szüleinktől? Többféle intelligenciateszt is létezik. Ezek közül Magyarországon az egyik legismertebb a MAWI (lásd fentebb), melynek IQ-mutatója úgy van kalibrálva, hogy a felnőtt magyar emberek populációjában az átlaga és szórása rendre 100, illetve 15 legyen. Akinek 100-nál nagyobb az IQ-ja, az úgy érezheti magát, hogy az átlagosnál okosabb, intelligensebb, s e tekintetben valamelyest kiemelkedik a többi ember közül. Aki pedig 100-nál kisebb IQ-jú, az úgy érezheti, hogy intelligencia tekintetében a többi emberrel szemben némi deficitje van. E 12
megfontolás alapján nevezzük „IQ-vagyonnak” minden felnőtt ember esetében az IQ–100 értéket! Ez az érték pozitív az átlagosnál intelligensebb személyek csoportjában és negatív a 100-nál kisebb IQ-júak esetében. Vajon IQ-vagyonunkból mekkora részt tudunk gyerekeinknek átörökíteni? Például egy 145-ös IQ-jú apa gyermekei várhatóan mekkora IQ-júak lesznek? Egészen pontosan a kérdés arra vonatkozik, hogy ha a populációban vesszük az összes 145-ös IQ-jú felnőtt férfit, majd ezek gyermekeit megvizsgáljuk mondjuk 18 éves korukban a MAWI-teszttel, akkor ez utóbbiak IQ-átlaga mekkora lesz? A legtermészetesebb válasz az, hogy ha a szülő 145-ös IQjú, akkor várhatóan gyermeke IQ-ja is e szint körüli lesz. Érdekes módon ez a válasz nem igaz. A helyes válasz így néz ki. 1. Először is nézzük meg, hogy milyen korrelációs kapcsolat van szülők és gyermekeik IQ-ja között! Ez több empirikus vizsgálat alapján 0,6 körülinek tekinthető. 2. Határozzuk meg a szülő IQ-vagyonát! Ez egy 145-ös IQ-jú személy esetében 145– 100 = 45. 3. Szorozzuk meg a szülő IQ-vagyonát az r = 0,6 korrelációs értékkel, ez lesz a gyermek várható „IQ-öröksége”: 0,6·45 = 27. 4. Végül a gyermek várható IQ-értéke: IQgyermek = 100 + 27 = 127. Ennek a megoldásnak az a logikája, hogy ha semmit nem tudunk arról a személyről, akinek az IQ-ját meg akarjuk becsülni, ki akarjuk találni, legkevesebbet akkor tévedünk, ha IQ-ját átlagosnak jósoljuk. Ha azonban van egy olyan információnk, (jelen esetben a szülő IQ-ja), aminek köze van a megismerni kívánt mennyiséghez, ez a várható IQ-szintet ki fogja mozdítani a 100-as átlagtól. De csak olyan mértékben, amilyen mértékben a két változó: szülő és gyermeke IQ-ja összefügg. A sok ismeretlen tényező (köztük a másik szülő IQ-ja, az anyagi helyzet, felnövekedés körülményei, az iskolák, barátok stb.) az átlag felé húzza a gyermek IQ-ját, mivel ezekről nincs semmilyen információnk. A szülő IQ-ja persze maga felé húzza gyermeke IQ-ját, de ennek mértékét a szülő és a gyermek IQ-ja közti korreláció szabja meg. Ez a példa rávilágít a korrelációs együttható egyik legfontosabb jelentésére: két változó – jelöljük őket most az egyszerűség kedvéért X és Y betűvel – korrelációja megmutatja, hogy X szélsőségessége milyen mértékben „öröklődik át” Y-ra és viszont. X és Y szélsőségességét standard értékük segítségével tudjuk közös skálára hozni. Ha X standard értékét ZX-szel, Y-ét ZY-nal jelöljük, X és Y korrelációját pedig az r betűvel, akkor a fenti összefüggés formulája így néz ki: várható ZY = r·ZX és várható ZX = r·ZY. Szülő és gyermek IQ-jának kapcsolatát vizsgálva azért nem kellett a standard értékekre áttérni, mert a két változót ugyanazon a skálán mérjük (mindkettő esetében az átlag 100, a szórás pedig 15), Ha a standard értékkel számolunk, a 145-ös IQ-érték standard értéke: ZX = (145–100)/15 = 3. Mivel r = 0,6, esetünkben a várható ZY értéke: 0,6·3 = 1,8, vagyis a gyermek várható IQ-ja 1,8 szórással lesz az átlag fölött. Mivel az IQ szórása 15, ez 1,8·15 = 27 ponttal emeli az IQ-t az átlag fölé, vagyis a gyermek várható IQ-ja 127, ugyanúgy, mint fent. Fordítsuk meg most a kérdést! Ha a gyermek IQ-ja 127, akkor tudunk-e valamit mondani a szülő várható IQ-járól? A szülő nyilván nem a gyerekétől örökli az intelligenciáját, de a korreláció nem is ok-okozati összefüggést mér, hanem a két változó értékeinek statisztikai együttjárását. Egy briliáns agyjárású személy esetében joggal következtetünk arra, hogy szülei sem lehettek híján az intelligenciának. De milyen mértékben? Pontosan ugyanúgy, ahogy a szülő IQ-jából következtettünk a gyermekére. Ha a gyermek IQ-járól nem 13
tudunk semmit, a szülő IQ-ját sem jósolhatjuk az átlagostól bármilyen irányban eltérőnek. Bármilyen konkrét információ azonban a gyermek IQ-járól elhúzza maga felé a szülő várható IQ-ját az átlagtól. Mivel a korreláció két változó közös, szimmetrikus terméke, egy 127-es IQjú gyermek esetében a szülő várható IQ-ja a fentebb megindokolt szabály alkalmazásával: IQszülő 100 + 0,6·(127–100) = 100 + 16,2 = 116,2 116, vagyis egy olyan érték, amely az átlag (100) és a gyermek IQ-ja (127) között helyezkedik el. A szabály tehát nem az, hogy a gyermek várható IQ-ja mindig kisebb, mint édesapjáé (vagy édesanyjáé). Ez csak akkor lenne így, ha az adott apai (anyai) IQ mellett a gyermek IQ-jával kapcsolatos minden egyéb tényező csupán átlagos szintű lenne, ami nyilván valódi visszahúzó erőként hatna. A korrelációs együttható szignifikanciája Láttuk, hogy a korrelációs együttható fontos információt közöl két változó kapcsolatáról. A pszichológia tudományának egyik feladata, hogy a lelki élet bonyolult folyamatában különféle változók között igazolt összefüggésekre leljen. Ehhez nagy segítséget nyújt a korrelációs együttható. Kérdés azonban, hogy ha egy bizonyos mintában azt tapasztaljuk, hogy két változó között mutatkozik valamilyen lineáris trend, amit a korrelációs együttható 0-tól különböző értéke támaszt alá, akkor ez az összefüggés általánosítható-e a minta által képviselt teljes populációra? A X.8. táblázatot megszemlélve például azt láthatjuk, hogy a vizsgált 500 fős mintában a születési súly és a 10 éves kori testsúly között bár csekély, de mégis pozitív korreláció van (r = 0,164). Levonható-e ennek alapján egy olyan következtetés, hogy a teljes magyar népességben is pozitív kapcsolat van a gyermek születési súlya és 10 éves kori testsúlya között? Erre és az ehhez hasonló kérdésekre egy speciális statisztikai próba, a korrelációs együttható szignifikancia vizsgálata segítségével adhatjuk meg a választ, melynek nagy minták esetén használható változatát az alábbiakban foglaljuk össze. 1. Azt szeretnénk megbízhatóan igazolni, hogy a vizsgált két változó között a populációban is pozitív korreláció van. Ezt most indirekt módon tesszük meg. Felállítjuk azt a statisztikai nullhipotézist, hogy a populációban a korreláció 0: rpop = 0. Ha ennek a feltételezésnek a populációból véletlenszerűen kiválasztott mintában kiszámított korrelációs együttható erősen ellentmond, akkor elutasítjuk a korrelálatlanságot állító hipotézist. 2. De mikor mond ellent egy mintabeli r korreláció az rpop = 0 hipotézisnek? A statisztikusok bebizonyították, hogy ha rpop = 0 és a szóban forgó véletlen minta elég nagy (mondjuk n > 40), akkor az r korrelációs együttható segítségével kiszámítható n 2 tr 1 r2 mennyiség abszolút értéke az esetek 95%-ában nem haladja meg a 2 értéket és az esetek 99%-ában nem nagyobb, mint 2,70. Ha tehát kiszámítjuk az adott mintában a fenti képlettel definiált t értéket és az 2-nél nagyobb abszolút értékű, akkor ez minimum 95%-os bizonyossággal ellentmond az rpop = 0 hipotézisnek, így azt elutasítjuk. 3. Esetünkben 500 2 t 0,164 3,17. 1 0,164 2 Mivel ez az érték még 2,70-nél is nagyobb abszolút értékű, 99%-os megbízhatósággal elutasítjuk azt a nullhipotézist, hogy a populációban nincs 14
korreláció a születési súly és a 10 éves kori testsúly között, továbbá az adott mintában kapott korreláció előjele alapján pozitív kapcsolatot állapítunk meg a populációban a vizsgált két változó között. A pszichológiai statisztikában ezt az eredményt röviden úgy fogalmazzuk meg, hogy az r = 0,164 korreláció 1%-os szinten szignifikáns. Ezen részletesebben azt értjük, hogy az rpop = 0 hipotézist elutasító döntés megbízhatósága minimum 99%-os, vagyis a téves elutasítás esélye az 1% alatt marad. Végső szakmai konklúziónk tehát az, hogy a teljes magyar népességben is pozitív kapcsolat van a gyermek születési súlya és 10 éves kori testsúlya között. Záró gondolatok A fentiekben éppen csak ízelítőt tudtunk adni abból, hogy milyen kérdésekkel foglalkozik a pszichológiai statisztika, milyen jellegű fogalmakkal operál és milyen gondolatmenetek jellemzők rá. Hely hiányában nem volt módunk sok fontos dologról szólni, például arról, hogy a statisztikai módszerek nemcsak az érvényes pszichológiai következtetések levonásában segíthetnek, hanem a pszichológiai modellalkotásban, a személyiségtípusok feltárásában, a különféle betegségtípusok azonosítására alkalmas skálák szerkesztésében stb. A pszichológiai statisztika iránt mélyebben érdeklődők számára ajánljuk a következő könyvet: Vargha András (2000), Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal. Budapest: Pólya Kiadó. A statisztikai elemzéseket a pszichológusok szokásosan statisztikai szoftverek segítségével végzik. Ilyen szoftver például a ROPstat, melynek DEMO változata ingyenesen letölthető a www.ropstat.com honlapról. Ennek egyszerű használatáról az olvasó maga is meggyőződhet.
15