College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 12 (t/m p. 255) - MM&C: Hoofdstuk 12 (t/m p. 617), p. 623 t/m p. 626 - Aanvullende tekst 6, 7 en 8

Jolien Pas ECO 2012-2013

Het Experiment: een voorbeeld Zorgt het drinken van alcohol voor een meer verstoorde subjectieve perceptie van fysieke aantrekkelijkheid? 2 condities, random ingedeeld (posttest-only design): - Geen alcohol - Wel alcohol Hoe aantrekkelijk is de geselecteerde partner aan het eind van de avond op een schaal van 0 t/m 100? Analyseren met een t-toets voor onafhankelijke steekproeven 2

Het Experiment: een voorbeeld Zorgt het drinken van alcohol voor een meer verstoorde subjectieve perceptie van fysieke aantrekkelijkheid? 3 condities, random ingedeeld (opnieuw posttest-only design): - Geen alcohol - Weinig alcohol: 2 bier in 4 uur - Veel alcohol: 8 bier in 4 uur Hoe aantrekkelijk is de geselecteerde partner aan het eind van de avond op een schaal van 0 t/m 100? Maar hoe analyseren we dit dan? 3

Vergelijken van meerdere condities We kunnen toch gewoon 3 t-toetsen doen? • Conditie 1 (geen alcohol) vs. Conditie 2 (weinig alcohol) • Conditie 3 (veel alcohol) vs. Conditie 2 (weinig alcohol) • Conditie 1 (geen alcohol) vs. Conditie 3 (veel alcohol) Probleem: kans op Type I fout wordt groter

4

Kans op Type I fout wordt groter Type I fout: H0 verwerpen terwijl deze waar was t-toets (met α = 0.05): 5% kans op een Type I fout = 95% kans op geen Type I fout 3 t-toetsen (met steeds α = 0.05): Steeds 95% kans dat het goed gaat 0.95*0.95*0.95 = 0.86; 86% kans dat het alledrie de keren goed gaat De familie-gewijze foutenkans αfam: 0.14 = 14% NB: Daarnaast zijn de t-toetsen niet onafhankelijk van elkaar door gebruik van zelfde gemiddeldes, waardoor het effect hierboven verergert. 5

Variantie-Analyse (ANOVA) Vergelijkt meerdere gemiddeldes tegelijk met elkaar H0 : µ1 = µ2 = µ3 ( = … = µI ) HA : niet alle µi’s zijn gelijk (tenminste 2 verschillen) Is een zgn. omnibus toets; de toets signaleert “of er iets aan de hand is”: is er ergens verschil? één onafhankelijke variabele

éénweg ANOVA

twee onafhankelijke variabelen

tweeweg ANOVA 6

Het idee achter ANOVA Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups) Welke situatie hieronder is overtuigender?

7

De ANOVA Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups) DATA (totaal)

= FIT (between) + RESIDUAL (within)

xij

= µi

+ εij

xij

= µ + αi

+ εij

De effectparameters αi geven aan hoeveel het groepsgemiddelde afwijkt van het groot gemiddelde

αi = µi – µ, dus Σαini = 0 8

De ANOVA Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups) DATA (totaal)

= FIT (between) + RESIDUAL (within)

xij

= µi

+ εij

xij

= µ + αi

+ εij

Assumpties: - Spreiding van de residuen is in elke populatie even groot - De residuen zijn normaalverdeeld (met een gemiddelde van 0 en standaarddeviatie σ ) - De residuen zijn onafhankelijk 9

Het model in beeld

Assumpties ANOVA Homogeniteit van de residuen Check: gebruik de vuistregel grootste sd / kleinste sd < 2 Normaalverdeelde residuen Check: bekijk pp-plot of histogram Onafhankelijke residuen Geen check, maar goed opgezet design moet hiervoor zorgen Indien eerste of tweede assumptie niet voldaan wordt: - controleer dataset op fouten en uitbijters, of - transformeer Y-variabele, of - gebruik een non-parametrische toets 11

De parameters in een éénweg ANOVA Parameter µ : Schatten mbv groot gemiddelde x Parameters µi: Schatten mbv groepgemiddelde xi Effectparameters αi : Schatten door aˆi = xi − x Parameter σ : Schatten dmv sp (gepoolde sd, wordt vervolgd) 12

De ANOVA-tabel Vergelijkt de verschillen tussen de groepen (between-groups), met de verschillen binnen groepen (within-groups)… …door middel van een F-ratio

13

Het Experiment – de eerste resultaten

SPSS: Analyze

Compare Means

One-Way ANOVA

14

De ANOVA-tabel: Total

N = totaal aantal personen SST : variatie tussen personen (ongeacht de conditie). Procedure bekend; bekijk verschil tussen score (xij ) en groot gemiddelde ( x ). 15

Het Experiment – SST

SST = ∑ ( xij − x ) 2 = ... ? 2 totaal

s

SST 2 =  → SST = ( N − 1) stotaal = 47 ×13.287 2 = 8297.917 N −1 16

De ANOVA-tabel: Between Groups

I = aantal condities SSG : variatie tussen de groepen. Voor alle personen het groepsgemiddelde ( xi ) met het groot gemiddelde ( x ) vergelijken. NB. De afstand van een groepsgemiddelde tot het groot gemiddelde is de schatting van een effectparameter ( aˆi ). 17

Het Experiment – SSG

aˆ1 = x1 − x = 63.75 − 58.54 = 5.21 aˆ 2 = x2 − x = 64.69 − 58.54 = 6.15 aˆ3 = x3 − x = 47.19 − 58.54 = −11.35 2

SSG = ∑ ni aˆ i = 16 × 5.212 + 16 × 6.152 + 16 ×11.352 = 3101.042 18

De ANOVA-tabel: Within Groups

SSE : variatie binnen de groepen. Per persoon de score ( xij ) en het groepsgemiddelde ( xi ) vergelijken ( = error). Bedenk: s = 2 i

2 ( x − x ) ∑ ij i

ni − 1

2 2 ( x − x ) = ( n − 1 ) s ∑ ij i i i

19

Het Experiment – SSE

SST = SSG + SSE SSE = SST − SSG = 8297.917 − 3101.042 = 5196.875 20

De spreiding van de residuen Spreiding van de residuen is in elke conditie even groot Deze spreiding (σ ) wordt geschat door:

MSE

Uitgeschreven: (n1 − 1) s12 + (n2 − 1) s22 + ... + (nI − 1) sI2 MSE = = sp (n1 − 1) + (n2 − 1) + ... + (nI − 1)

Logisch: als spreiding in elke conditie gelijk is, dan kunnen we de info combineren om σ te schatten en dat was het idee achter sp (zie Toetsende Statistiek) 21

De ANOVA-tabel SST = SSG + SSE en DFT = DFG + DFE Maar: MST ≠ MSG + MSE ANOVA tabel voor het voorbeeld:

22

De ANOVA H0 : µ1 = µ2 = µ3 = … = µI HA : niet alle µi’s zijn gelijk (tenminste 2 verschillen) F (DFG, DFE) = MSG / MSE p-waarde opzoeken in tabel (tweezijdige HA, maar p niet verdubbelen bij ANOVA!) p<α

H0 verwerpen

Voorbeeld: F(2, 45) = 13.426, p < 0.01 Er is verschil tussen de condities! 23

Effectmaten Toetsstatistiek = effectmaat x functie voor steekproefgrootte Proportie verklaarde variantie R2 = η 2 = COD = VAF = SSG / SST In variantie-analyse gebruiken we de η 2 benaming Voor populatieschatting:

SSG − ( DFG × MSE ) ωˆ = SST + MSE 2

Vuistregels: small = .01, medium = .06, large = .14 31

Effectmaten

η 2 = SSG / SST = 0.374

SSG − ( DFG × MSE ) ωˆ = = 0.341 SST + MSE 2

25

De ANOVA Voorbeeld: F(2, 45) = 13.426, p < 0.01 Er is verschil tussen de condities! 37.4% van de variantie van aantrekkelijkheid wordt verklaard door de 3 alcohol groepen Maar betekent dat dat alle condities van elkaar afwijken? Of zijn er maar 2 significant verschillend?

26

Interpreteer de resultaten

Contrast toetsen vs. Multipele vergelijkingen Contrast toetsen: indien van te voren specifieke hypotheses geformuleerd bespreken we volgende week Multipele vergelijkingen: achteraf bekijken welke condities verschillen (geen specifieke hypotheses van te voren) Ook wel: multiple comparisons, a posteriori toetsen, post hoc toetsen, follow-up toetsen 28

Multipele vergelijkingen Eerst bekijken of ANOVA een significant resultaat oplevert en vervolgens toch nog de aparte (tweezijdige) t-toetsen uitvoeren. Probleem: αfam groter dan α Oplossing: strenger toetsen De Bonferroni methode: Deel α door het aantal uit te voeren vergelijkingen Deze methode is enigszins conservatief, maar wordt heel veel gebruikt

29

Bonferroni correctie Kleinere α:

Consequentie:

30

Minimum Significant Difference (MSD) waarde waaraan een verschil tussen twee conditie-gemiddelden tenminste gelijk moet zijn omsignificant te zijn MSD = t s p **

1 1 met t** is een t-waarde met aangepaste a + ni n j en komt uit verdeling met df = N – I

MSD is rechtstreeks afgeleid van de eerder besproken t-toets met de gepoolde standaarddeviatie (zie TS); MSD is afhankelijk van de gebruikte/gekozen procedure vanwege de daaruit volgende waarde van t** MSD is een tweezijdige aanpak 31

MSD: weinig vs. veel alcohol α = 0.05/3 = 0.016666667 (eenzijdig) Tweezijdige toetsen bij post-hoc dus: 0.016667 / 2 = 0.008333 t** (met df = 45) = 2.704 (conservatieve keuze) MSD = t ** s p

1 1 1 1 + = 2.704 × 115.486 × + = 10.274 ni n j 16 16

Verschil in gemiddeldes groep 2 en 3: 64.69 – 47.19 = 17.5 Groter dan MSD, dus significant verschil tussen deze groepen! 32

Overige vergelijkingen Bij gelijk aantal mensen in alle condities, MSD overal gelijk: MSD = t s p **

1 1 1 1 + = 2.704 × 115.486 × + = 10.274 16 16 ni n j

verschillen tussen groepsgemiddeldes:

33

SPSS: multipele vergelijkingen

Bonferroni in SPSS

31

Overzicht analyses ECO X(-en): interval + Y: interval 1 predictor:

Lineaire regressie

enkelvoudige lineaire regressie

>1 predictor: meervoudige lineaire regressie X(-en): nominaal + Y: interval

Variantie analyse

1 onafhankelijke variabele: eenweg ANOVA >1 onafhankelijke variabele: meerweg ANOVA

36

Volgende week Tweeweg variantie-analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11

31

College 6 Eenweg Variantie-Analyse

Recommend Documents