1
IV. Változók és csoportok összehasonlítása
2
Tartalom
Összetartozó és független minták Csoportosító változók Két összetartozó minta összehasonlítása Két független minta összehasonlítása Több független minta átlagának egyszempontos összehasonlítása
3
Példa összetartozó mintákra
4
Hogyan juthatunk összetartozó mintákhoz?
Változás vizsgálata Önkontrollos kísérletek Ugyanazon a skálán mért változók összehasonlítása Összetartozó párok (házaspárok) vizsgálata
5
Független minták
6
Hogyan juthatunk független mintákhoz? 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint.
7
Két összetartozó minta összehasonlítása 1) Átlagok összehasonlítása
Pl. ugyanakkora-e egy párt szimpátiaszintje egy választás előtt és után? Ugyanakkora-e az X változó elméleti átlaga két helyzetben vagy időpontban? H0: μ = μ
2) Növekedés-csökkenés vizsgálata
Csökkenti-e a szorongást egy terápiás eljárás? H0: Növekedés esélye = Csökkenés esélye
8
Pulzus két helyzetben (n = 115) 120 100 80 szórás
60
átlag
40 20 0 PE
PK
9
Anya és apa testmagassága (n = 500) 190 180 170 160 150
s zórás
140
átlag
130 120 110 100 AnyaTes tm ag
ApaTes tm ag
10
Két összetartozó minta átlagának összehasonlítása
Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két helyzetben vagy időpontban? Nullhipotézis: H0: μ = μ Próbastatisztika: t = (y – x)/SEdif
11
Összetartozó mintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
12
Összetartozó mintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
13
Összetartozó mintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
14
Összetartozó mintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
15
Összetartozó mintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = n - 1). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
16
Két példa
Pulzus beavatkozás előtt és után (n = 115): – Változás átlaga (y - x) = 6,17 – t(114) = 3,987, p = 0,0001 (p < 0,001) Anya és apa testmagassága (n = 500): – anya-átlag = 161,12, apa-átlag = 173,35 – Különbség átlaga (y - x) = 12,23 (cm) – t(499) = 36,396, p = 0,000 (p < 0,001) GYAK
17
Az egymintás t-próba alkalmazási feltétele
A különbségváltozó normalitása Ha a minta kicsi? Ha a minta nagy?
Robusztus alternatívák
Johnson-próba Gayen-próba
GYAK
18
Változás vizsgálata arányskálájú változók segítségével
Szakmai kérdés: nőnek-e (csökkennek-e) az X változó értékei az egyik helyzetről a másikra? Nullhipotézis: E(Y/X) = 1 Próba: Egymintás t-próba Kiszámítandó: Változás aránya személyenként (Y/X)
19
Változás vizsgálata egy másik próba segítségével
Szakmai kérdés: nőnek-e (csökkennek-e) az X változó értékei az egyik helyzetről a másikra? Nullhipotézis: Növekedés esélye = csökkenés esélye Próba: Előjelpróba Kiszámítandó: Pozitív és negatív változások száma GYAK
20
Két független minta összehasonlítása
21
Hogyan juthatunk független mintákhoz? 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint.
22
Csoportdefiniálás a ROPstatban 1. Kódok segítségével, pl.
1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok
1. Övezetek segítségével, pl.
18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú GYAK
23
Férfiak és nők feminitása (n = 82) CPI-Feminitás skála 18 16 14 12 10
szórás
8
átlag
6 4 2 0 Nők
Férfiak
24
Apa érettségije és gyerekének matematika jegye (n = 3507) Matek-jegy a 8. osztály végén 6 5 4 szórás
3
átlag
2 1 0 Apa érettségi nélkül
Apa érettségivel
25
Két független minta átlagának összehasonlítása
Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban? Nullhipotézis: H0: μ = μ Próbastatisztika: t = (y – x)/SEdif
26
Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
27
Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
28
Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
29
Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
30
Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk.
t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
31
Két példa
CPI-Fem skála, Férfiak vs. Nők (N = 82): – X-átlag = 12,1, Y-átlag = 14,0 – t(80) = -2,95, p = 0,0041 (p < 0,01) Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507): – X-átlag = 4,06, Y-átlag = 3,82 – t(3505) = 6,38, p = 0,000 (p < 0,001) GYAK
32
A kétmintás t-próba alkalmazási feltételei
Különbségváltozó normalitása
Elméleti szórások egyenlősége: σ = σ Szóráshomogenitás tesztelése: milyen próbákkal?
Kétmintás t-próba robusztus alternatívája?
33
Példa
CPI-Fem skála, Férfiak vs. Nők (N = 82): – X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0)
Szóráshomogenitás tesztelése: – Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+
Átlagok összehasonlítása: – Kétmintás t: t(80) = -2,95 (p = 0,0041)** – Welch-féle d: d(13,1) = -2,37 (p = 0,0337)* GYAK
Kezelési hatás két független minta esetén Elméleti változás (különbség): 1 2 Cohen-féle delta (átlagok standardizált különbsége): (1 2)/ Mintabeli becslés: d = (x1x2)/se Értelmezés: 0,2: gyenge, 0,5: közepes, GYAK 0,8: erős különbség
35
Kettőnél több független minta átlagának összehasonlítása
36
GBR-csökkenés
80 60 40 20 0 -20 -40 -60
Agr1 Agr2
Agr3 Fény Verbális
Kísérleti csoport
37
Különbözik-e a minták elméleti nagyságszintje?
Két ellentétes hatás: Minél jobban szóródnak a mintaátlagok, annál jobban eltérnek egymástól a minták. Minél jobban szóródnak az adatok az egyes mintákon belül, annál nagyobb az átfedés, annál kevésbé különböztethetők meg egymástól a minták.
38
GBR-csökkenés
80 60 40 20 0 -20 -40 -60
Agr1 Agr2
Agr3 Fény Verbális
Kísérleti csoport
39
Varianciaanalízis (VA) Vark
= Átlagok varianciája = Hatásvariancia Varb = Minták átlagos varianciája = Hibavariancia Próbastatisztika: F = Vark/Varb F
= Hatásvariancia/Hibavariancia
40
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
41
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
42
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
43
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
44
Egyszempontos független mintás VA
Nullhipotézis: elméleti átlagok egyenlősége: H0: 1 = 2 = ... = I
Ha igaz H0, akkor a fenti F mennyiség közelítőleg F-eloszlású. Ha F elég nagy, akkor H0-t elutasítjuk.
F p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
45
VA alkalmazási feltételei Minták
függetlensége Normalitás Elméleti szórások egyenlősége (szóráshomogenitás): σ1 = σ2 = ... = σI
Konkrét példa Agr1 Agr2 Agr3 Fény Verb. ni
5
4
6
4
4
xi 14,50 6,75 5,20 -13,45 -30,08 s i 29,60 9,15 6,96 13,11 14,57
Szóráshomogenitás ellenőrzése Levene-próba:
F(4; 7) = 0,784 (p > 0,10, n. sz.) O’Brien-próba:
F(4; 8) = 1,318 (p > 0,10, n. sz.) GYAK
Hagyományos VA • Hatásvariancia: Vark = 1413,9 • Hibavariancia: Varb = 286,2 • F próbastatisztika: F(4; 18) = 4,940** • p-érték: p = 0,0073 (p < 0,01)
GYAK
49
Mit csináljunk, ha a szóráshomogenitás feltétele erősen sérül? Robusztus varianciaanalízisek Welch-próba James-próba Brown-Forsythe-próba
Robusztus VA-k Welch-próba:
W(4; 7,8) = 5,544* (p = 0,0203) James-próba:
U = 27,851* (p < 0,05) Brown-Forsythe-próba:
BF(4; 9) = 5,103* (p = 0,0200) GYAK
51
H0 elutasítása esetén utóelemzés: az összes átlag páronkénti összehasonlítása Ha
az elméleti átlagok különböznek, hogyan teszik ezt? Mi az eltérések mintázata? Cél: úgy végezzük el az összes páronkénti öszszehasonlítást, h. az I. fajta hiba ne nőjön meg. Szóráshomogenitás OK: Tukey-Kramer-próba Szóráshomogenitás sérül: Games-Howell-próba
A bemutatott példa utóelemzése Tukey-Kramer-próba: T12= 0,97 T14= 3,48 T23= 0,20 T25= 4,35* T35= 4,57*
T13= 1,28 T15= 5,55** T24= 2,39 T34= 2,42 T45= 1,97
GYAK
Utóelemzés konklúziói • Legszignifikánsabb különbség az 1. és az 5. minta átlaga között van (T15**) • Az 5. minta (Verbális) átlaga három másik átlagtól is szignifikánsan különbözik (T25*, T35*, T15**) • Az 5. minta (Verbális) kilógása okozza az öt átlag szignifikáns különbségét. GYAK
Kezelési hatás több független minta esetén • Megmagyarázott variancia-arány (nemlineáris determinációs együttható): eta-négyzet e2 = Hatás variabilitás/Teljes variabilitás • Korrelációs hányados (nemlineáris korrelációs együttható): eta GYAK
55
Mit csináljunk, ha a függő változó normalitása nagyon sérül? Összehasonlított
populációk homogenitásának tesztelése rangsorolásos eljárásokkal. Szakmai kérdés: kilóg-e valamelyik populáció (alulról vagy felülről) a többi közül? Nagyobbak-e (kisebbek-e) valamelyik populációban az adatok, mint a többiben?
56
Kettőnél több összetartozó minta átlagának összehasonlítása Minden nagyjából úgy történik, mint független minták esetén, csak más képletekkel.
57
Eltérések A
szóráshomogenitás a változók páronkénti különbségeire vonatkozik (szfericitás) A szóráshomogenitás sérülésének mértékét az epszilon együtthatók jelzik Robusztus alternatívák (Greenhouse-Geisser, Huynh-Feldt) Átlagok páronkénti összehasonlítása (Tukey)
Egy konkrét példa Változó
átlag
szórás
Pulzus1
91,5
22,6
Pulzus2
97,7
21,5
Pulzus3
90,7
18,6
Hagyományos VA Hatásvariancia: Vark = 1686,9 Hibavariancia: Vare = 121,4 F-érték: F(2; 226) = 13,896*** Átlagok páronkénti összehas.: T12= 6,01** T13= 0,82
T23= 6,83** GYAK
Epszilon együtthatók Geisser-Greenhouse-féle ε: ε = 0,964
Huynh-Feldt-féle ε: ε = 0,980
Szabadságfok korrekció: A robusztus próbáknál ilyen arányban csökkennek a szabadságfokok
Robusztus VA-k Geisser-Greenhouse-féle VA: F(2; 218) = 13,896*** (p = 0,0000)
Huynh-Feldt-féle VA: F(2; 222) = 13,896*** (p = 0,0000)
Konklúzió: A 2. (intervenció alatt mért) pulzus kilóg a többi közül. GYAK