élőfej
SKÁLÁK MEGBÍZHATÓSÁGA ská skálák konstrukció konstrukciója és megbí megbízható zhatósági elemzé elemzése
Cél: segítséget adni tesztek és más tesztszerű mérőeszközök ská skáláinak megalapozott konstrukció ó konstrukci jához
Tesztelméleti alapok 1. Bevezetés A világ születésünk pillanatától kezdve különböző skálákon mér bennünket ... egy perccel a születésünk után általában már felmérik fizikai állapotunkat a néhány célszerűen kiválasztott fiziológiai mutatóból: - szívritmusból, - légzési jellemzőkből, - izomtónusból, stb. konstruált 10 fokozatú ún. Apgar-skálán, amit négy perc múlva megismételnek.
1
élőfej
Tesztelméleti alapok 2. Bevezetés Ezután pedig az élet folyamán: · a különböző képesség- és intelligencia-tesztek, · személyiségvizsgáló eljárások, · az autóvezetési tudást vagy a nyelvtudást mérő skálák, · az egyes tantárgyakban elért eredményeket tükröző pontszámok, · a különböző skálázott orvosi leletek, · a hitelképesség skálázott mutatói, · a munkahelyi teljesítményt mérő pontszámok, stb.
Tesztelméleti alapok 3. Bevezetés Azonban mi is gyakran mérjük vagy minősítjük ilyen módon a külvilágunk egyes szereplőit (más embereket), élményeinket, objektumokat (tárgyakat, termékeket, szolgáltatásokat, társadalmi jelenségeket stb.) Saját véleményünket vagy meggyőződésünket gyakran fejezzük ki különböző mások által készített (konstruált) és számunkra felkínált skálákon pszichológiai és szociológiai felmérések, piackutatások vagy a legkülönbözőbb célú közvéleménykutatások alkalmával. A pszichológus gyakran maga konstruál skálákat ...
Tesztelméleti alapok 4. A tesztek fogalma és típusai A teszt szisztematikus eljárás két vagy több személy viselkedésének az összehasonlítására. „A test is a systematic procedure for comparing the behavior of two or more persons” Cronbach (1949, 1960)
A pszichológiai tesztek típusai: • • • • • • •
intelligencia-tesztek teljesítmény-tesztek képesség-tesztek érdeklődési tesztek neuropszichológiai tesztek személyiség-tesztek viselkedési tesztek, stb.
A tesztek használata szerzői jogok által védett! Sok teszt felvétele kiképzéshez kötött!
2
élőfej
A klasszikus tesztelmé tesztelmélet alapjai A tesztek túlnyomó része világszerte egyelőre még a klasszikus tesztelmélet alapján készül. Minden egyes itemre (item: feladat, kérdés, tétel,...) adott válasz egyformán fontos a tesztérték (összpontszám) meghatározásában. Bizonyos esetekben nem az összpontszámmal, hanem átlagpontszámmal dolgozunk (pl. ugyanazon célra kifejlesztett különböző hosszúságú tesztek eredményeinek összevetése)
A klasszikus tesztelmélet alapjai A klasszikus tesztelmélet alapegyenlete: X=t+ε Azaz a megfigyelt (vagy tapasztalati úton mért) érték (X) egyenlő a valódi érték (t = true score) és a hiba (ε = error) összegével. A mérés célja a t valódi érték minél jobb közelítése az ε hiba csökkentése révén. Alapvető elvárás a környezeti tényezők figyelembe vétele és a mérés azonos körülmények közötti elvégzése. A körülmények lényeges változása a hiba nagyságának „szisztematikus” változását eredményezheti.
A klasszikus tesztelmélet alapjai Az eredményhez hozzátartozik a hiba nagyságának a becslése, ami – a fizikai mérések mintájára – ismételt mérésekkel történik (a mért érték ingadozásának nagyságából becsülhető a hiba). Ugyanakkor az ismétlések számának növelésével a véletlenszerű hiba hatása csökkenthető. Amikor – pl. tanulási hatás, elfáradás stb. miatt – a teszt felvétele nem ismételhető, akkor az ún. párhuzamos teszt-változatokat kell alkalmazni. Két teszt akkor párhuzamos, ha bármely személy esetében az egyik teszttel kapott valódi érték megegyezik a másik teszthez tartozó valódi értékkel és emellett a két teszt hibaszórása is egyenlő, azaz ugyanolyan „jól” mérnek (ha a szórások nem azonosak, akkor a tesztek „τ-ekvivalensek”).
3
élőfej
A klasszikus tesztelmélet alapjai A klasszikus tesztelmélet alapfeltevései (axiómái): (1) a hiba átlaga, pontosabban a várható értéke egyenlő 0-val, azaz: M (ε ) = 0 Ha a mérések számát minden határon túl növelnénk, akkor a mérések hibáinak az átlaga 0 lenne és a mért értékek átlaga megegyezne a valódi értékkel. Minél többször ismételjük a mérést, az átlagos hiba annál kisebb lesz. Ha a hiba nagysága a mérések sokszorozásával nem közelít a nullához, akkor biztosak lehetünk benne, hogy szisztematikus hibáról van szó. A szisztematikus hibát azonban el kell kerülnünk, mert a klasszikus tesztelmélet ezt nem tudja korrigálni.
A klasszikus tesztelmélet alapjai A klasszikus tesztelmélet alapfeltevései (axiómái): (2) A hiba és a valódi érték között semmilyen kapcsolat nincs, azaz a kapcsolat szorosságára utaló korrelációs együttható 0: korr (t, ε ) = 0 A hiba minden más esetben szisztematikus. Ez egy IQ teszt esetén azt jelentené, hogy minél intelligensebb a tesztelt személy, annál nagyobb a mérési hiba (annál kevésbé tudjuk biztosan meghatározni az IQ–ját). Ez már nem véletlenszerű, hanem szisztematikus hiba, azaz ki kell küszöbölni: ha sikerül kiküszöbölni, a korreláció már nem áll fenn.
A klasszikus tesztelmélet alapjai A klasszikus tesztelmélet alapfeltevései (axiómái): (3) Két párhuzamos teszt hibái közti korrelációs együttható 0: korr (ε1, ε2 ) = 0 Ha az egyik teszt hibája a másik – vele párhuzamos – teszt hibájával korrelál, az azt jelenti, hogy az esetleges hibák együtt változnak. Ha a korreláció pozitív, akkor ha az egyik tesztben egy adott személynél a mérési hiba nagy, akkor várhatóan a másik teszt esetében is nagy lesz a hiba értéke. Ez arra utal, hogy a tesztek között olyan kapcsolat áll fenn, aminek nincs köze a valódi értékhez, tehát a teszt értelmezését zavarja (szisztematikus hiba).
4
élőfej
A klasszikus tesztelmélet alapjai A tesztek jósági mutatói A méréseink nem csak amiatt lehetnek sikertelenek, mert nem tudjuk kellő mértékben figyelembe venni a körülmények hatásait: lehetséges az is, hogy maga a mérőeszközünk hibás. Két alapvető mutató jellemzi a teszt hatásosságát: a megbízhatóság (reliabilitás, reliability) és az érvényesség (validitás, validity).
A klasszikus tesztelmélet alapjai A megbízhatóság A megbízhatóság azt fejezi ki, hogy a teszt mennyire pontosan mér. Ezt sok esetben egyszerűen úgy vizsgálhatjuk meg, hogy a tesztet többször felvesszük: minél kisebb az eltérés a mérési eredmények közt, annál megbízhatóbb a tesztünk. Ha azonban egy olyan mérőeszközzel dolgozunk, melynek felvétele nem ismételhető, akkor a párhuzamos teszt-változatát kell alkalmaznunk: ilyenkor elvárható, hogy hasonló – de a mérési hiba miatt nem feltétlen azonos – eredményt kapjunk. A teszt megbízhatóságának mértéke a reliabilitásegyüttható, és ezt pl. lehet becsülni a teszt és annak egy párhuzamos tesztjével számított korrelációjával.
A klasszikus tesztelmélet alapjai A megbízhatóság A legáltalánosabb meghatározás szerint a megbízhatóság a megfigyelt, a valódi és a hiba értéknek, ill. ezen értékek varianciájának (ami az individuális különbségek statisztikai mérőszáma) figyelembevételével adható meg. A valódi érték és a hiba közötti korrelálatlanságnak és a variancia tulajdonságainak felhasználásával azt kapjuk, hogy: var(X) = var(t) + var(ε ) Látható, hogy a hiba varianciájának csökkenése, azaz a pontosabb mérés, a megfigyelt érték és a valódi érték közötti „azonosságot” növeli, azaz a valódi értéket így egyre jobban meg tudjuk közelíteni.
5
élőfej
A klasszikus tesztelmélet alapjai A megbízhatóság A megbízhatóságot (rel-el jelöljük) úgy értelmezzük (a párhuzamos tesztek korrelációjának bevezetése nélkül), hogy az megegyezik a valódi érték és a megfigyelt érték varianciáinak hányadosával, azaz: var(t )
rel (X) = var(t ) + var(ε ) Bizonyítható, hogy a megbízhatóság megegyezik a teszt megfigyelt értékének és a valódi értékének négyzetes korrelációjával: korr2(X, t) = rel (X) . Az előbbi formulával az a baj, hogy a valódi értéket, ill. annak varianciáját nem ismerjük, így a megbízhatóságot csak becsülni tudjuk (pl. párhuzamos tesztek korrelációjával).
A klasszikus tesztelmélet alapjai Az érvényesség Az érvényesség annak a mértéke, hogy a teszt tartalmilag, szerkezetileg és még más egyéb kritériumoknak és mérési célkitűzéseknek mennyire felel meg. Ahhoz, hogy ezt vizsgáljuk, egy viszonyítási alapra, – „etalonra” vagy másképpen „standardra” – volna szükségünk (fizikai mérések esetében ez kevésbé jelent problémát, mentális mérések esetében azonban nehezebb meghatározni az optimális viszonyítási alapot). Mivel egy teszt „jóságának” több kritériuma is lehet, több szempontból lehet az érvényességét is megítélni.
A klasszikus tesztelmélet alapjai Az érvényesség Igazolható, hogy párhuzamos tesztekre a validitás a reliabilitással azonos, és ebben az értelemben a megbízhatóság az érvényesség egy speciális eseteként is felfogható. Az ún. „konkurrens–validitás” (annak vizsgálata, hogy a tesztünk mennyire korrelál egy másik teszttel ill. kritériummal) különösen fontos, mivel megvilágítja a megbízhatósági vizsgálatok jelentőségét. Belátható, hogy a tesztértéknek egy kritérium változóval (Krit) való korrelációja mindig kisebb vagy egyenlő a tesztértéknek a valódi értékkel vett korrelációjánál, azaz: korr (X, Krit) ≤ korr (X, t)
6
élőfej
A klasszikus tesztelmélet alapjai Az érvényesség Mivel korr2(X, t) = rel (X) , így egy tesztnek a konkurens–validitása legfeljebb olyan nagy lehet, mint a megbízhatóságának négyzetgyöke. Ebből következik, hogy egy teszt validitása lehet ugyan nagyobb, mint a megbízhatósága (mivel 1nél kisebb pozitív szám négyzetgyöke nagyobb az illető számnál), azonban ha a megbízhatóság értéke kicsi, akkor a négyzetgyöke, azaz a validitása sem lesz lényegesen nagyobb. Alacsony megbízhatóságú tesztet ezek alapján nem lehet érvényes tesztnek sem tekinteni, ami előrevetíti a tesztek megbízhatóság-becslésének fontosságát.
A klasszikus tesztelmélet korlátai A KT feltételezi, hogy • a segítségével létrehozott skála értékei intervallum szintű skálát alkotnak (tehát pl. értelmes a mért értékek átlagáról, szórásáról beszélni Ö ez azonban empirikusan gyakran nem igazolható) • a teszt- és itemmutatók populáció függőek abban az értelemben, hogy értékük erősen attól függ, hogy milyen jellegű mintából nyerjük az adatokat (ez azt jelenti például, hogy egy adott teszt megbízhatósága más lesz, ha mondjuk egyetemisták, vagy ha nyugdíjasok köréből vesszük a mintát, annak ellenére, hogy pl. mindkét esetben az intelligenciát próbáltuk mérni).
A klasszikus tesztelmélet korlátai A KT keretében • vannak olyan mérési hibák, amelyeket nem tudunk sem kiküszöbölni sem korrigálni, • ebből következően a teszt a szélső tartományokban nem mér elég pontosan.
7
élőfej
A modern tesztelmélet alapgondolatai Az ún. „modern tesztelmélet” (MT) lassan terjed A MT alapjai: nem a skálán, hanem az itemeken van a hangsúly, • az itemeket véletlen változóknak tekintjük, • a p valószínűségek egyaránt függnek az item nehézségétől és a személytől, • mindkettőt közös dimenzióra hozzuk egy megfelelő kétváltozós függvényben.
Általá ltalános informá információ ciók tesztekrő tesztekről Tests in Print (1994) Mental Measurement Yearbook (1998) Test and Tests Critiques (1994) Psych INFO Health and Psychological Instruments (HAPI) MEDLINE CD adatbázisok (pl. 300 USD/év) www.uni.edu/buros www.etsi.org
Tesztek kö közreadá zreadásának szempontjai • Mit mér a teszt? • • • • • • • •
Miért van rá szükség? Honnan vannak a tételek? A teszt készítésébe bevont minták jellemzői Leíró statisztikák (tételekre, skálákra) Megbízhatósági (reliabilitási) mutatók Érvényességi (validitási) mutatók Gazdaságossági (utilitási) mutatók Maga a teszt (skálák és azok tételei)
8
élőfej
A tesztfejleszté tesztfejlesztés ajá ajánlott lé lépései • A teszt írása (előzetes tétel-együttes összeállítása) – pontos leírás a mérendőről – tételek összegyűjtése • tételek ellenőrzése • válaszadó számára arról szóljon, amit mérni akarunk (nem mindig fontos) • egyértelmű fogalmazás • ne "kavarja fel" a kitöltőt • használat előtt kisebb mintán kipróbálni
A tesztfejlesztés ajánlott lépései · · · · · · · · · ·
Előzetes verzió összeállítása Előzetes teszt-felvétel mintavétel szervezés lebonyolítás etikai szempontok figyelembe vétele Pszichometriai feldolgozás szeparációs képesség vizsgálata (szóródásjellemzők alapján) megbízhatósági elemzések érvényességi elemzések
A tesztfejlesztés ajánlott lépései · A teszt szükség szerinti módosítása a pszichometriai feldolgozás eredményei alapján · - egyes skálák vagy tételek elhagyása · - új skálák vagy tételek hozzáadása · Teszt-felvétel · Pszichometriai feldolgozás (az egyes lépések további szükség szerinti ismétlése amíg egy megbízható és érvényes tesztet kapunk)
9
élőfej
Ská Skálák megbí megbízható zhatósági analí analízise (Reliability Analysis) Analysis) Adott: egy adatbázis, amelyben az egyes változók egy több összetartozó tételből álló skála tételeinek felelnek meg. Cél: a vizsgált skála belső konzisztenciáját, valamint az egyes tételek ehhez történő hozzájárulását jellemző mutatók számítása. Az eljárás eredménye a skála egészét és az egyes tételek szerepét megalapozottan jellemző mutatók, amelyek segítségével a skála megbízhatósága megítélhető, ha szükséges egyes tételek kihagyásával vagy hozzáadásával javítható.
Skálák megbízhatósági analízise • Olyan skálákkal foglalkozunk, amelyek több összetartozó tételből - "item"-ből - állnak Ezek a tételek többnyire kérdés formájában megfogalmazottak, amelyek valamilyen módon mind az adott skálához kapcsolódnak • Egy skála lehet egyúttal egy egyetlen-skálás teszt is, de a pszichológiában szokásos tesztek többnyire egyszerre több skála mentén is mérnek • Az ismertetendő módszerek segítséget nyújthatnak az előtesztelés során a megfelelő itemek kiválasztásában is.
•
Skálák megbízhatósági analízise •
Egy tétel megbízhatósága akkor jó, ha ugyanazt méri, mint a teljes skála összpontszáma. Ennek mérése: rx(i),x = ri,t "item-total" korreláció torzít, helyette rx(i),x- x(i) = ri,ct "item-összes többi összege„ korreláció, vagy "item-összes többi" többszörös korreláció • Egy tétel szeparációs képessége akkor jó, ha szóródási mutatói (terjedelem, IF, szórás, VA) magasak
10
élőfej
Skálák megbízhatósági analízise • Skálák megbízhatóságának intuitív megragadása: 1. Egy skála megbízhatósága akkor jó, ha megismételve ugyanazt adja. Ennek mérése: teszt-reteszt korreláció: rx,x' 2. Egy megbízható skála tételei mind ugyanazt a dolgot mérik, ezért a skála egy része is hasonló dolgot mér, mint a skála egésze. Ennek mérése: a skála két fele közötti korreláció. Felezési technikák: első fél - második fél ("split-half"), páratlan és páros tételek, kisorsoljuk a feleket, elvi meggondolással osztjuk el.
Skálák megbízhatósági analízise • Egy megbízható skála tehát stabil eredményeket ad, azaz hasonlók lesznek az eredmények ha az alternatív formáját használják, ha más személyek alkalmazzák, vagy ha a mérést megismétlik. • A megbízhatóság pszichometriai jellemzése Ha az adott skála k darab tételből áll és N számú személyre alkalmazták, akkor az így kapott egyes Xji pontszámok mátrixa a következő:
Skálák megbízhatósági analízise Tételek Ö SzemélyekØ 1 2 3 ... j ... N
1
2
3
X11 X12 X13 X21 X22 X23 X31 X32 X33
...
...
i
X1i
... ... k
Sorösszegek
X1k X2k X3k
P1 P2 P3
XNi
XNk
PN
Ti
Tk
G
Xji XN1 XN2 XN3
Oszlop- T 1 összegek
T2
T3
11
élőfej
Skálák megbízhatósági analízise Tételek 1
2
3
AÖmegfelelő oszlopok adataiból Szemé- kiszámíthatók az egyes lyekØtételeket jellemző leíró 1 statisztikák X11 Xés 12a X13 tételek egymás 2 X21 közötti X22 X23 kapcsolatát 3 Xjellemző X33 31 X32 belső korrelációs együtthatók ... ("Inter-item correlation j coefficients"), ... N
XN1 XN2 XN3
Oszlop- T 1 összegek
T2
T3
...
...a "Sorösszegek" i ... ... k
feliratú utolsó oszlopból pedig a skála X1i egészénekX1k statisztikai X2k jellemzői. X3k
Sorösszegek P1 P2 P3
Xji XNi
XNk
PN
Ti
Tk
G
Skálák megbízhatósági analízise A mátrixból tehát az egyes tételek és a skála egészének a kapcsolatát jellemző Item-total summary statistics gyűjtőnévvel jelölt statisztikák is kiszámíthatók. A Scale Mean if Item Deleted azt adja meg, hogy mennyi lenne a skálaátlag, ha az adott tételre kapott pontszámokat az összesítésből kihagynánk. Erre akkor van szükség, ha a skála várható konkrét számszerű értékei érdekelnek bennünket: pl. standardok készítése esetén. A Scale Variance if Item Deleted az előzőnek megfelelő adat a varianciára, amely szintén fontos adat standardok készítéséhez.
Skálák megbízhatósági analízise A Corrected Item-Total Correlation az adott tétel pontszámai és az összes többi tételre kapott pontszámok összegeként számított "javított" teljes skála-pontszámok közötti korrelációs együtthatókat tartalmazza. Ez a tétel megbízhatóságának mértéke és alkalmas a skála egészéhez nem illeszkedő tételek kiszűrésére. Ha ugyanis ez az érték valamelyik tételre kiugróan kicsi, akkor ez azt jelenti, hogy az a tétel valami mást mér, mint az összes többi és ezért megfontolandó az átfogalmazása vagy kihagyása.
12
élőfej
Skálák megbízhatósági analízise A Squared Multiple Correlation az adott tétel pontszáma (mint függő változó) és az összes többi tételek pontszámai (mint független változók) közötti kapcsolatra felírt többszörös regressziós egyenletből számított ún. többszörös korrelációs együttható négyzete (R2). Ez szintén a tétel megbízhatóságának mértéke: azt adja meg, hogy milyen mértékben jósolható be egy adott személy pontszáma az adott tételben a személy összes többi tételre vonatkozó pontszámainak ismeretében. Az is bizonyítható, hogy R2 a regressziós kapcsolattal "megmagyarázott" variabilitás mértéke.
Skálák megbízhatósági analízise A Cronbach-féle alfa (az ún. megbízhatósági koefficiens):
α=
k cov / var 1+ ( k −1)cov / var
ahol k a tételek száma a skálában, a tételek közötti átlagos kovariancia, pedig a tételek átlagos varianciája. Ha a tételeket egységnyi standard deviációjúakra standardizáljuk az előbbi formula a következő alakot ölti: kr ahol a tételek közötti
α=
r
1+ ( k −1)r
átlagos korrelációs együttható.
Ská Skálák megbí megbízható zhatósági analí analízise α egyfajta korrelációs együttható, ezért általában 0 és 1 közötti értékeket vesz fel. Abban az esetben, ha a tételek többsége egymással negatívan korrelál negatív is lehet, ez azonban a gyakorlatban ritkán fordul elő, mert általában már az első skála verzió is valamilyen minimális - esetleg tesztként való használatra még nem elfogadható mértékben konzisztens. A kérdés ugyanis általában az, hogy elég szoros pozitív kapcsolat van-e a tételek között egy skálán belül, és nem az, hogy egyáltalán pozitív-e a kapcsolat.
13
élőfej
Ská Skálák megbí megbízható zhatósági analí analízise A Cronbach-féle alfának a következő két szokásos szemléletes interpretációja van. 1) α felfogható úgy, mint az adott konkrét skála és az azzal azonos számú hasonló tételeket tartalmazó összes lehetséges skála között páronként várható korrelációs együtthatók átlaga. Ebben az interpretációban arról van szó, hogy elvben a vizsgált skálánk mellé megkonstruálhatjuk a mérni kívánt tulajdonsághoz kapcsolódó tételek hipotetikus univerzumából az összes lehetséges azonos számú tételből álló többi skálát is, és az ezekkel való korrelációs együttható várható értéke.
Ská Skálák megbí megbízható zhatósági analí analízise 2) α felfogható úgy is, mint a személyeknek az adott konkrét skálán kapott tényleges pontszáma és az ún. "valódi pontszám" közötti korrelációs együttható négyzete. A "valódi pontszám" azt a hipotetikus pontszámot jelenti, amit akkor kapnánk, ha a személyeket az összes lehetséges tétellel letesztelnénk. Egy skála minimálisan elfogadható megbízhatóságához általában minimálisan α = 0.7 értéket szoktak megkövetelni, de természetesen az ennél is magasabb értékek a kívánatosak.
Ská Skálák megbí megbízható zhatósági analí analízise A Cronbach-féle alfa képletéből látható, hogy értéke egyaránt függ a tételek számától és a tételek közötti átlagos korrelációs együtthatótól. Ebből az következik, hogy még alacsony tételek közötti korrelációk esetén is kaphatunk viszonylag nagy megbízhatósági koefficienset, ha a tételek száma elég nagy.
14
élőfej
Ská Skálák megbí megbízható zhatósági analí analízise Így például ha a tételek közötti átlagos korrelációs együttható 0.2 és a tételek száma 10, akkor α = 0.71. Ha ezután új - és a korábbiakkal egyező minőségű tételekkel egészítjük ki a skálát és a tételek számát 25-re növeljük, akkor α = 0.86 lesz. Az Alpha if Item Deleted a tétel, a Standardized Item Alpha pedig a skála egésze megbízhatóságának jellemzésének a mutatója.
Ská Skálák megbí megbízható zhatósági analí analízise A megbízhatóságot a tételek száma (a skála hossza) mellett a következő tényezők is befolyásolják. A vizsgált minta heterogenitása növeli a megbízhatóságot: ha olyan személyekkel veszünk fel egy skálát, akik között a mért tulajdonságban jelentős különbségek vannak, nagyobb lesz a skála megbízhatósága.
Ská Skálák megbí megbízható zhatósági analí analízise •A két tesztelés között eltelt rövidebb idő nagyobb megbízhatóságot eredményez ("test-retest reliability"). •Rendszertelenségek csökkentik a skála megbízhatóságát. Ha a teszt felvételének körülményei nem világosan rögzítettek, vagy az egyébként világos és helyes előírásokat nem tartják be, vagy a fizikai feltételek alkalmilag kedvezőtlenek, vagy a személyek motivációja jelentősen eltérő, akkor alacsonyabb lesz a skála megbízhatósága.
15
élőfej
Ská Skálák megbí megbízható zhatósági analí analízise •Másik gyakran alkalmazott megbízhatósági modell az ún. "kettévágott skála" (Split-half model) módszere. •Míg a Cronbach-féle alfát egyetlen skála tételei konzisztenciájának vizsgálatára használjuk, addig a split-half módszer esetén a vizsgálandó skálát kettévágjuk két azonos - páratlan tételszám esetén közel azonos - hosszúságú skálára és ezen két skála közötti korrelációt vizsgáljuk. •Ezzel rokon módszer az, amikor két alternatív tesztet használunk, vagy ugyanazt a tesztet vesszük fel kétszer. Az utóbbi esetben szokásos bizonyos rögzített időt hagyni a két felvétel között ("test-retest reliability").
Ská Skálák megbí megbízható zhatósági analí analízise •A split-half módszer hátránya, hogy az eredmény függ attól, hogy milyen módon történik a skála kettéosztása. •Ezt a módszert kombinálni szokták a Cronbach-féle alfa számításának módszerével: egyéb mutatók mellett rendszerint az értékét is kiszámolják a két fél skálára és azokat bevonják az értékelésbe. •A főkomponens-analízis is alkalmazható (az ún. Theta megbízhatósági együtthatóval számítása útján) a skála megbízhatóságának meghatározására. Nagy előnye, hogy a tételeket nem azonos súllyal, hanem fontosságuknak megfelelően kezeli.
Ská Skálák érvé rvényessé nyességi elemzé elemzése • A megbízhatóság csak az egyik szükséges de nem elégséges összetevője a skála "jóságának". Nagyon fontos másik tulajdonság az érvényesség (validitás), amely azt jelenti, hogy az adott skála valóban azt méri, amit mérni akarunk. Ha a skála (teszt) legalább minimális mértékben nem érvényes, használhatatlan. Az érvényesség fajtái • tartalmi érvényesség (content validity): jól megválasztott tételek biztosíthatják • az arculat érvényessége (face validity): azt fejezi ki, hogy a kitöltő számára mennyire világos, hogy mit mér (nem mindig fontos)
16
élőfej
Skálák érvényességi elemzése •
kritérium érvényesség (criterion validity): bizonyos populációkra elvárjuk, hogy más értékeket adjon (ellenőrzés: pl. ANOVA) • konkurens érvényesség (concurrent validity) már létező hasonló dolgokat mérő teszttel vagy módszerrel való kapcsolat (ellenőrzés: pl. korreláció, ANOVA)
Skálák érvényességi elemzése •
prediktív érvényesség (predictive validity): az előrejelző értékre utal (ellenőrzés: pl. korreláció, ANOVA) • konstrukciós érvényesség (construction validity): a készítés elméleti kerete határozza meg (ellenőrzés: pl. korreláció, ANOVA) Adott célra érvényes skála (teszt) nem feltétlenül érvényes más vonatkozásban!
Gyakorlati alkalmazások
Példák: fizikkep.sav, haromska.sav, MBTI
17
élőfej
A MyersMyers-Briggs Típus Indiká Indikátor (MBTI)
Jung személyiségelmélete • Extraverzió - introverzió • A négy pszichikus funkció: érzékelés és intuíció (percepciós funkciók) gondolkodás és érzés (ítéletalkotási funkciók) a négy funkció nem egyformán fejlett: domináns funkció, kiegészítő funkció, harmadrendű funkció, alárendelt (csökevényes) funkció. • Ítéletalkotás vagy percepció dominanciája
A MyersMyers-Briggs Típus Indiká Indikátor Gondolkodás ítéletalkotási funkciók
Érzékelés
Intuíció
percepciós funkciók Érzés
A MyersMyers-Briggs Típus Indiká Indikátor Gondolkodás
OBJEKTÍV VILÁG PERSONA
Érzékelés
Intuíció EGO SZUBJEKTÍV VILÁG
Érzés
18
élőfej
A MyersMyers-Briggs Típus Indiká Indikátor • A teszt az ismertetett négy dimenzió mentén
jellemzi a vizsgált személyek információfeldolgozási sajátosságait: • Extraverzió - Introverzió (Extraversion Introversion) • Érzékelés - Intuíció (Sensing - INtuition) • Gondolkodás - Érzés (Thinking - Feeling) • Ítéletalkotás - Észlelés (Judgment Perception)
A MyersMyers-Briggs Típus Indiká Indikátor • 2 x 2 x 2 x 2 = 16 - alaptípus határozható meg, amelyek mindegyike egy betűkombinációval jellemezhető (pl. ESTJ, INFP, ENTJ, stb.) •A típusokon belül is vannak fokozatok az EI, SN, TF, JP dimenziókon kapott un. folytonos pontszámoktól függően: minél távolabb van a semleges pontnak megfelelő 100 pontértéktől, annál kifejezettebbek a típusjellemzők
A MyersMyers-Briggs Típus Indiká Indikátor • A teszt az Egyesült Államokban a különböző – nevelési, – pályaválasztási tanácsadó szervezetek és – konzultációs irodák – egyik alapvető vizsgáló módszerévé vált. • Több mint évi 2 millió személy adatainak feldolgozásával hatalmas mennyiségű tapasztalat halmozódott fel. • Maga a kérdőíves vizsgálóeljárás pszichometriailag mintaszerűen kidolgozott: mind az egyes skálák megbízhatóságát, mind azok validitását, mind pedig a skálák belső összefüggéseit statisztikailag meggyőzően igazolták és az eredményeket a megfelelő részletességgel publikálták.
19