College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 12 (t/m p. 255) - MM&C: Hoofdstuk 12 (t/m p. 617), p. 623 t/m p. 626 - Aanvullende tekst 6, 7 en 8
Jolien Pas ECO 2012-2013
Het Experiment: een voorbeeld Zorgt het drinken van alcohol voor een meer verstoorde subjectieve perceptie van fysieke aantrekkelijkheid? 2 condities, random ingedeeld (posttest-only design): - Geen alcohol - Wel alcohol Hoe aantrekkelijk is de geselecteerde partner aan het eind van de avond op een schaal van 0 t/m 100? Analyseren met een t-toets voor onafhankelijke steekproeven 2
Het Experiment: een voorbeeld Zorgt het drinken van alcohol voor een meer verstoorde subjectieve perceptie van fysieke aantrekkelijkheid? 3 condities, random ingedeeld (opnieuw posttest-only design): - Geen alcohol - Weinig alcohol: 2 bier in 4 uur - Veel alcohol: 8 bier in 4 uur Hoe aantrekkelijk is de geselecteerde partner aan het eind van de avond op een schaal van 0 t/m 100? Maar hoe analyseren we dit dan? 3
Vergelijken van meerdere condities We kunnen toch gewoon 3 t-toetsen doen? • Conditie 1 (geen alcohol) vs. Conditie 2 (weinig alcohol) • Conditie 3 (veel alcohol) vs. Conditie 2 (weinig alcohol) • Conditie 1 (geen alcohol) vs. Conditie 3 (veel alcohol) Probleem: kans op Type I fout wordt groter
4
Kans op Type I fout wordt groter Type I fout: H0 verwerpen terwijl deze waar was t-toets (met α = 0.05): 5% kans op een Type I fout = 95% kans op geen Type I fout 3 t-toetsen (met steeds α = 0.05): Steeds 95% kans dat het goed gaat 0.95*0.95*0.95 = 0.86; 86% kans dat het alledrie de keren goed gaat De familie-gewijze foutenkans αfam: 0.14 = 14% NB: Daarnaast zijn de t-toetsen niet onafhankelijk van elkaar door gebruik van zelfde gemiddeldes, waardoor het effect hierboven verergert. 5
Variantie-Analyse (ANOVA) Vergelijkt meerdere gemiddeldes tegelijk met elkaar H0 : µ1 = µ2 = µ3 ( = … = µI ) HA : niet alle µi’s zijn gelijk (tenminste 2 verschillen) Is een zgn. omnibus toets; de toets signaleert “of er iets aan de hand is”: is er ergens verschil? één onafhankelijke variabele
éénweg ANOVA
twee onafhankelijke variabelen
tweeweg ANOVA 6
Het idee achter ANOVA Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups) Welke situatie hieronder is overtuigender?
7
De ANOVA Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups) DATA (totaal)
= FIT (between) + RESIDUAL (within)
xij
= µi
+ εij
xij
= µ + αi
+ εij
De effectparameters αi geven aan hoeveel het groepsgemiddelde afwijkt van het groot gemiddelde
αi = µi – µ, dus Σαini = 0 8
De ANOVA Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups) DATA (totaal)
= FIT (between) + RESIDUAL (within)
xij
= µi
+ εij
xij
= µ + αi
+ εij
Assumpties: - Spreiding van de residuen is in elke populatie even groot - De residuen zijn normaalverdeeld (met een gemiddelde van 0 en standaarddeviatie σ ) - De residuen zijn onafhankelijk 9
Het model in beeld
Assumpties ANOVA Homogeniteit van de residuen Check: gebruik de vuistregel grootste sd / kleinste sd < 2 Normaalverdeelde residuen Check: bekijk pp-plot of histogram Onafhankelijke residuen Geen check, maar goed opgezet design moet hiervoor zorgen Indien eerste of tweede assumptie niet voldaan wordt: - controleer dataset op fouten en uitbijters, of - transformeer Y-variabele, of - gebruik een non-parametrische toets 11
De parameters in een éénweg ANOVA Parameter µ : Schatten mbv groot gemiddelde x Parameters µi: Schatten mbv groepgemiddelde xi Effectparameters αi : Schatten door aˆi = xi − x Parameter σ : Schatten dmv sp (gepoolde sd, wordt vervolgd) 12
De ANOVA-tabel Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups)… …door middel van een F-ratio
13
Het Experiment – de eerste resultaten
SPSS: Analyze
Compare Means
One-Way ANOVA
14
De ANOVA-tabel: Total
N = totaal aantal personen SST : variatie tussen personen (ongeacht de conditie). Procedure bekend; bekijk verschil tussen score (xij ) en groot gemiddelde ( x ). 15
Het Experiment – SST
SST = ∑ ( xij − x ) 2 = ... ? 2 totaal
s
SST 2 = → SST = ( N − 1) stotaal = 47 ×13.287 2 = 8297.917 N −1 16
De ANOVA-tabel: Between Groups
I = aantal condities SSG : variatie tussen de groepen. Voor alle personen het groepsgemiddelde ( xi ) met het groot gemiddelde ( x ) vergelijken. NB. De afstand van een groepsgemiddelde tot het groot gemiddelde is de schatting van een effectparameter ( aˆi ). 17
Het Experiment – SSG
aˆ1 = x1 − x = 63.75 − 58.54 = 5.21 aˆ 2 = x2 − x = 64.69 − 58.54 = 6.15 aˆ3 = x3 − x = 47.19 − 58.54 = −11.35 2
SSG = ∑ ni aˆ i = 16 × 5.212 + 16 × 6.152 + 16 ×11.352 = 3101.042 18
De ANOVA-tabel: Within Groups
SSE : variatie binnen de groepen. Per persoon de score ( xij ) en het groepsgemiddelde ( xi ) vergelijken ( = error). Bedenk: s = 2 i
2 ( x − x ) ∑ ij i
ni − 1
2 2 ( x − x ) = ( n − 1 ) s ∑ ij i i i
19
Het Experiment – SSE
SST = SSG + SSE SSE = SST − SSG = 8297.917 − 3101.042 = 5196.875 20
De spreiding van de residuen Spreiding van de residuen is in elke conditie even groot Deze spreiding (σ ) wordt geschat door:
MSE
Uitgeschreven: (n1 − 1) s12 + (n2 − 1) s22 + ... + (nI − 1) sI2 MSE = = sp (n1 − 1) + (n2 − 1) + ... + (nI − 1)
Logisch: als spreiding in elke conditie gelijk is, dan kunnen we de info combineren om σ te schatten en dat was het idee achter sp (zie Toetsende Statistiek) 21
De ANOVA-tabel SST = SSG + SSE en DFT = DFG + DFE Maar: MST ≠ MSG + MSE ANOVA tabel voor het voorbeeld:
22
De ANOVA H0 : µ1 = µ2 = µ3 = … = µI HA : niet alle µi’s zijn gelijk (tenminste 2 verschillen) F (DFG, DFE) = MSG / MSE p-waarde opzoeken in tabel (tweezijdige HA, maar p niet verdubbelen bij ANOVA!) p<α
H0 verwerpen
Voorbeeld: F(2, 45) = 13.426, p < 0.01 Er is verschil tussen de condities! 23
Effectmaten Toetsstatistiek = effectmaat x functie voor steekproefgrootte Proportie verklaarde variantie R2 = η 2 = COD = VAF = SSG / SST In variantie-analyse gebruiken we de η 2 benaming Voor populatieschatting:
SSG − ( DFG × MSE ) ωˆ = SST + MSE 2
Vuistregels: small = .01, medium = .06, large = .14 31
Effectmaten
η 2 = SSG / SST = 0.374
SSG − ( DFG × MSE ) ωˆ = = 0.341 SST + MSE 2
25
De ANOVA Voorbeeld: F(2, 45) = 13.426, p < 0.01 Er is verschil tussen de condities! 37.4% van de variantie van aantrekkelijkheid wordt verklaard door de 3 alcohol groepen Maar betekent dat dat alle condities van elkaar afwijken? Of zijn er maar 2 significant verschillend?
26
Interpreteer de resultaten
Contrast toetsen vs. Multipele vergelijkingen Contrast toetsen: indien van te voren specifieke hypotheses geformuleerd bespreken we volgende week Multipele vergelijkingen: achteraf bekijken welke condities verschillen (geen specifieke hypotheses van te voren) Ook wel: multiple comparisons, a posteriori toetsen, post hoc toetsen, follow-up toetsen 28
Multipele vergelijkingen Eerst bekijken of ANOVA een significant resultaat oplevert en vervolgens toch nog de aparte (tweezijdige) t-toetsen uitvoeren. Probleem: αfam groter dan α Oplossing: strenger toetsen De Bonferroni methode: Deel α door het aantal uit te voeren vergelijkingen Deze methode is enigszins conservatief, maar wordt heel veel gebruikt
29
Bonferroni correctie Kleinere α:
Consequentie:
30
Minimum Significant Difference (MSD) waarde waaraan een verschil tussen twee conditie-gemiddelden tenminste gelijk moet zijn omsignificant te zijn MSD = t s p **
1 1 met t** is een t-waarde met aangepaste a + ni n j en komt uit verdeling met df = N – I
MSD is rechtstreeks afgeleid van de eerder besproken t-toets met de gepoolde standaarddeviatie (zie TS); MSD is afhankelijk van de gebruikte/gekozen procedure vanwege de daaruit volgende waarde van t** MSD is een tweezijdige aanpak 31
MSD: weinig vs. veel alcohol α = 0.05/3 = 0.016666667 (eenzijdig) Tweezijdige toetsen bij post-hoc dus: 0.016667 / 2 = 0.008333 t** (met df = 45) = 2.704 (conservatieve keuze) MSD = t ** s p
1 1 1 1 + = 2.704 × 115.486 × + = 10.274 ni n j 16 16
Verschil in gemiddeldes groep 2 en 3: 64.69 – 47.19 = 17.5 Groter dan MSD, dus significant verschil tussen deze groepen! 32
Overige vergelijkingen Bij gelijk aantal mensen in alle condities, MSD overal gelijk: MSD = t s p **
1 1 1 1 + = 2.704 × 115.486 × + = 10.274 16 16 ni n j
verschillen tussen groepsgemiddeldes:
33
SPSS: multipele vergelijkingen
Bonferroni in SPSS
31
Overzicht analyses ECO X(-en): interval + Y: interval 1 predictor:
Lineaire regressie
enkelvoudige lineaire regressie
>1 predictor: meervoudige lineaire regressie X(-en): nominaal + Y: interval
Variantie analyse
1 onafhankelijke variabele: eenweg ANOVA >1 onafhankelijke variabele: meerweg ANOVA
36
Volgende week Tweeweg variantie-analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11
31