Meervoudige variantieanalyse
Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken kunnen worden. In eerdere hoofdstukken is de t-toets, waar gemiddelden van twee groepen met elkaar werden vergeleken uitvoerig aan de orde geweest. Een generalisatie van de t-toets voor twee onafhankelijke steekproeven met gepoolde varianties is variantieanalyse. Heeft men te maken met één factor die uit meer dan twee waarden bestaat dan wordt een éénweg variantieanalyse uitgevoerd. In SPSS is dit de procedure One-Way Anova. Als er sprake is van meerdere factoren dan wordt een meerweg variantieanalyse toegepast. In SPSS heet dit de Univariate procedure.
De procedure One-Way Anova Bij variantieanalyse met één factor worden op basis van één variabele groepen onderscheiden. SPSS gebruikt hiervoor de procedure One-Way ANOVA, zoals eerder besproken in hoofdstuk I-8. Aan de hand van het onderzoek waarin onderzocht werd in welke mate moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden (bestand MENTAL.SAV, zie hoofdstuk II-12 voor een beschrijving van dit onderzoek) wordt de procedure One-Way ANOVA duidelijk gemaakt. Via de menu-optie Analyze → Compare Means → One-Way ANOVA kom je in het dialoogvenster van de One-way ANOVA. Geef in het dialoogvenster onder Dependent List op voor welke variabele de gemiddelden getoetst moeten worden, in het voorbeeld is dit de variabele SCORE. De variabele met de groepsindeling wordt in het kader onder Factor geplaatst, in het voorbeeld is dit de variabele METHODE. De procedure One-Way ANOVA kent verder de drukknoppen Contrasts, Post Hoc en Options. De eerste drukknop die gebruikt wordt om specifieke hypotheses omtrent groepsgemiddelden te toetsen wordt niet besproken.
Post Hoc Multiple Comparisons Variantieanalyse toetst de nulhypothese dat de gemiddelden van alle te onderscheiden groepen aan elkaar gelijk zijn. De nulhypothese wordt verworpen als er minstens twee gemiddelden van elkaar verschillen. Als uit de variantieanalyse blijkt dat er minstens twee gemiddelden van elkaar verschillen wordt vervolgens onderzocht waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). In de theorie zijn drie van deze toetsen besproken, nl. Bonferroni, Tukey en Scheffé. Deze toetsen zijn terug te vinden in het Post Hoc dialoogvenster.
II12-1
Options Met de drukknop Options kunnen o.a. kengetallen berekend worden. Gebruik hiervoor Descriptive in het kader onder Statistics van het venster Options. SPSS vermeldt voor het totaal aantal cases en voor elke groep het aantal waarnemingen, gemiddelde, standaarddeviatie, standaardfout, 95% betrouwbaarheidsinterval voor het gemiddelde, minimum en maximum. De overige opties in dit venster worden niet behandeld. Naar aanleiding van een uitvoer van het moeder instructie onderzoek worden de belangrijkste zaken van een eenweg variantieanalye nog eens toegelicht. SPSS uitvoer One-Way ANOVA: ANOVA score
Between Groups Within Groups Total
Sum of Squares 3341.722 8727.917 12069.639
df 2 33 35
Mean Square 1670.861 264.482
F 6.317
Sig. .005
Post Hoc Tests Multiple Comparisons Dependent Variable: score
Tukey HSD
(I) methode 1.00 2.00 3.00
Scheffe
1.00 2.00 3.00
Bonferroni
1.00 2.00 3.00
(J) methode 2.00 3.00 1.00 3.00 1.00 2.00 2.00 3.00 1.00 3.00 1.00 2.00 2.00 3.00 1.00 3.00 1.00 2.00
Mean Difference (I-J) -14.25000 -23.41667* 14.25000 -9.16667 23.41667* 9.16667 -14.25000 -23.41667* 14.25000 -9.16667 23.41667* 9.16667 -14.25000 -23.41667* 14.25000 -9.16667 23.41667* 9.16667
*. The mean difference is significant at the .05 level.
II12-2
Std. Error 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931 6.63931
Sig. .096 .004 .096 .362 .004 .362 .116 .005 .116 .396 .005 .396 .118 .004 .118 .530 .004 .530
95% Confidence Interval Lower Bound Upper Bound -30.5415 2.0415 -39.7082 -7.1252 -2.0415 30.5415 -25.4582 7.1248 7.1252 39.7082 -7.1248 25.4582 -31.2677 2.7677 -40.4343 -6.3990 -2.7677 31.2677 -26.1843 7.8510 6.3990 40.4343 -7.8510 26.1843 -30.9957 2.4957 -40.1624 -6.6709 -2.4957 30.9957 -25.9124 7.5791 6.6709 40.1624 -7.5791 25.9124
Homogeneous Subsets score
Tukey HSDa
Scheffea
methode 1.00 2.00 3.00 Sig. 1.00 2.00 3.00 Sig.
N 12 12 12 12 12 12
Subset for alpha = .05 1 2 37.7500 52.0000 52.0000 61.1667 .096 .362 37.7500 52.0000 52.0000 61.1667 .116 .396
Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 12.000.
In de bovenstaande uitvoer wordt getoetst: H0 : μ1=μ2=μ3 Ha : minstens één van de gemiddelden is ongelijk aan de anderen
waarbij: μ1 = populatiegemiddelde van de standaardmethode μ2 = populatiegemiddelde van experimentele methode 1 μ3 = populatiegemiddelde van experimentele methode 2 SPSS berekent de ANOVA tabel met de kwadratensommen (SS en MS), de vrijheidsgraden (df), de F-toets (F) en de bijbehorende overschrijdingskans (Sig.). Uit de overschrijdingskans blijkt dat de nulhypothese wordt verworpen (Sig.=.005). Vervolgens wordt geanalyseerd waar de verschillen tussen de groepsgemiddelden zitten (Post Hoc Tests). De hypothesen die getoetst worden met een overall α van 5% zijn : H01 : μ1=μ2 H02 : μ1=μ3 H03 : μ2=μ3
versus Ha1 : μ1 ≠μ2 versus Ha2 : μ1 ≠μ3 versus Ha3 : μ2 ≠μ3
N.B. Als bij het toetsen van de genoemde hypothesen gebruik gemaakt zou worden van 3 afzonderlijke t-toetsen met een α van 5%, levert het vinden van minstens één significant toetsingsresultaat een overall type I fout op, groter dan 5%. Dit probleem wordt bij variantieanalyse omzeild! Uit de tabel Multiple Comparisons is af te lezen tussen welke groepen een significant verschil gevonden wordt middels de verschillende post hoc test methoden. Tukey (Honestly Significant Difference), Scheffé en Bonferroni vinden alledrie een significant verschil tussen groep 1 en 3 (Sig. < .05). In de tabel staan verder voor elke combinatie van twee groepen het gemiddelde verschil plus de standaard error, en het 95% betrouwbaarheidsinterval van het gemiddelde verschil tussen de betreffende twee groepen vermeld. Tenslotte worden combinaties van groepen (zg. subsets) die op grond van de Tukey en Scheffé methode niet van elkaar verschillen weergegeven onder Homogeneous Subsets in de uitvoer. II12-3
Met Scheffé wordt het breedste betrouwbaarheidsinterval verkregen, ga dit na! Hierdoor leidt deze methode minder snel tot het verwerpen van de nulhypothese in vergelijking met Bonferroni en Tukey. Omdat het betrouwbaarheidsinterval bij Tukey het smalst is, valt deze methode te verkiezen boven de andere methoden. Voor de verdere inhoudelijke aspecten verwijzen wij naar hoofdstuk II-12.
De procedure Univariate ANOVA: meerweg variantieanalyse Het belangrijkste verschil tussen One-Way ANOVA en Univariate ANOVA is dat met de laatsgenoemde ook meerweg variantieanalyse schema's, d.w.z. schema's met meerdere factoren (= onafhankelijke variabelen), geanalyseerd kunnen worden. Het dialoogvenster van deze procedure wordt opgeroepen via Analyze → General Linear Model → Univariate. Ter instructie maken we wederom gebruik van het voorbeeld van de instructie-methoden (Mental.sav), maar nu wordt naast de variable METHODE tevens rekening gehouden met de variabele Sociaal economische klasse van de moeders (variabele SEK met 1=laag, 2 =midden en 3 =hoog):
Evenals in het dialoogvenster van One-Way ANOVA wordt de afhankelijke variabele (hier: SCORE) geplaatst onder Dependent Variable. De groepsindeling wordt nu gevormd op basis van meerdere variabelen (hier: METHODE en SEK) die geplaatst worden onder Fixed of Random Factor(s), afhankelijk van het type (voor uitleg type factoren zie hoofdstuk II-12). In het kader onder Covariates kunnen continue variabelen worden opgegeven. Onder WLS Weight kunnen variabelen geselecteerd worden die aan de observaties een verschillend gewicht toekennen. Het dialoogvenster van de Univariate ANOVA kent 6 drukknoppen: Model, Contrasts, Plots, Post Hoc, Save en Options. De drukknoppen Contrasts (om specifieke hypotheses omtrent groepsgemiddelden te toetsen) en Save (om voorspelde waarden, residuen, Cook’s distances en andere gerelateerde maten te verkrijgen) worden hier niet besproken. II12-4
Model Met deze drukknop kan men het gewenste model specificeren: full factorial of custom. Het full factorial model bevat álle hoofdeffecten en alle factor-factor interactiemogelijkheden. Wanneer je alleen geïnteresseerd bent in de hoofdeffecten of in de hoofdeffecten plus een bepaalde subset van interactiemogelijkheden kies je voor Custom. Deze optie is dus nodig om de top-down procedure te kunnen voeren. Om een factor als hoofdeffect in het model te selecteren kies je onder Build Term(s) voor Main effects. Klik vervolgens de gewenste factor links onder Factors & Covariates aan en plaats deze via een druk op de pijl onder Build Term(s) naar rechts onder Model. Om een interactie tussen factoren te selecteren kies je eerst onder Build Term(s) voor Interaction. Vervolgens klik je de betreffende factoren links onder Factors & Covariates middels de Ctrl-knop samen aan en plaats je ze tegelijk naar rechts onder Model met een druk op de pijl. Linksonder kan men het type Sum of Squares kiezen welke default op type III staat. Dit is het meest gebruikte type SS bij modellen zonder ontbrekende cellen.
Plots Met deze optie kunnen de effecten van een bepaalde factor A op een afhankelijke variabele Y voor verschillende (storende) niveaus van factor B in een (profile-)plot worden weergegeven. Selecteer factor A op de Horizontal Axis en B onder het kopje Separate Lines. Onder Separate Plots kan eventueel een variabele geselecteerd worden waarvoor aparte plots per waarde van die variabele gemaakt moeten worden. Voorbeeld: het onderzoek naar de mate waarin moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden kan mogelijk verstoord worden door de sociaal economische klasse (SEK) van de moeders. Om dit in beeld te brengen middels een profile plot selecteer je METHODE onder Horizontale axis en SEK onder Separate Lines:
Vergeet niet op Add te klikken om de selectie actief te maken!! Het resultaat is dat er voor elk niveau van SEK een lijn getrokken wordt die het verband weergeeft tussen METHODE en SCORE (zie grafiek op II12-8).
Post Hoc Net als bij de One-Way ANOVA kan ook hier onderzocht worden waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc II12-5
kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). De in de theorie besproken toetsen Bonferroni, Tukey en Scheffé zijn terug te vinden in het Post Hoc dialoogvenster.Tevens moet nu in het kader onder Post Hoc Tests for: aangeven worden voor welke factoren de multiple comparisons uitgevoerd dienen te worden.
Options In het kader Display kan onder Descriptive statistics het gemiddelde, de standaard deviatie en de aantallen van alle cellen worden opgevraagd. De overige mogelijkheden van deze drukknop worden verder niet besproken. SPSS uitvoer Univariate ANOVA met hoofdeffecten en eerste orde interactie (full factorial): Between-Subjects Factors N methode
sek
1.00 2.00 3.00 1.00 2.00 3.00
12 12 12 12 12 12
Descriptive Statistics Dependent Variable: score methode 1.00
2.00
3.00
Total
sek 1.00 2.00 3.00 Total 1.00 2.00 3.00 Total 1.00 2.00 3.00 Total 1.00 2.00 3.00 Total
Mean 41.0000 33.7500 38.5000 37.7500 33.2500 51.0000 71.7500 52.0000 41.2500 76.0000 66.2500 61.1667 38.5000 53.5833 58.8333 50.3056
Std. Deviation 12.35584 13.04799 5.97216 10.37589 9.21502 6.32456 12.57975 18.63525 10.24288 6.58281 15.37043 18.39878 10.41415 19.93379 18.66369 18.57005
N 4 4 4 12 4 4 4 12 4 4 4 12 12 12 12 36
De uitvoer onder Descriptive Statistics (resultaat van Options…Display…Descriptive statistics) bevat het gemiddelde, de standaard deviatie en het aantal van elke cel.
II12-6
Tests of Between-Subjects Effects Dependent Variable: score Source Corrected Model Intercept methode sek methode * sek Error Total Corrected Total
Type III Sum of Squares 8990.889a 91103.361 3341.722 2674.056 2975.111 3078.750 103173.000 12069.639
df 8 1 2 2 4 27 36 35
Mean Square 1123.861 91103.361 1670.861 1337.028 743.778 114.028
F 9.856 798.958 14.653 11.725 6.523
a. R Squared = .745 (Adjusted R Squared = .669)
Uit deze ANOVA tabel (Test of Between-Subjects Effects) valt het volgende af te lezen: • • • •
Verklaarde variantie (SS(Corrected Model) = SS(METHODE) + SS(SEK) + SS(METHODE*SEK) = 3341.722 + 2674.056 + 2975.111 = 8990.889 Onverklaarde variantie (SS(Error)) = 3078.750 Totale variantie (SS(Corrected Total)) = SS(verklaard) + SS(onverklaard) = 8990.889 + 3078.75 = 12069.639 Proportie verklaarde variantie ( R Squared) = SS(verklaard)/SS(totaal) = 8990.889/12069.639 = 0.745 Verder staan in de tabel uiteraard het aantal vrijheidsgraden (df), de Mean Squares, de F-waarde (F) en de bijbehorende overschrijdingskans (Sig.) vermeld. De overige gegevens vermeld in de ANOVA tabel worden verder niet behandeld. Opm. F en Sig. kunnen alleen worden weergegeven als er sprake is van meer dan 1 waarneming per cel! Uit de variantieanalyse tabel volgt dat de interactieterm significant is op 5 % niveau (Sig.= .001).
II12-7
Sig. .000 .000 .000 .000 .001
De profile plot ziet er als volgt uit:
Estimated Marginal Means of score
sek
80,00
1.00 2.00 3.00
Estimated Marginal Means
70,00
60,00
50,00
40,00
30,00 1.00
2.00
3.00
methode
Het celgemiddelde voor de lage sociaal economische klasse bij methode 2 is aanzienlijk lager dan de gemiddelden bij methode 1 en methode 3. Bij de middenklasse is methode 3 duidelijk de beste methode en bij de hoogste klasse geeft methode 2 het beste resultaat. Het effect van de verschillende methoden is dus afhankelijk van de sociaal economische klasse (interactie).
Univariate procedure voor variantieanalyse met een continu covariaat: ANCOVA In het statistiekboek is covariantieanalyse (ANCOVA) behandeld in termen van een regressieanalyse (zie hoofdstuk II-11.9, deel 2). We zullen hier zien dat deze analyse ook kan worden uitgevoerd als een variant van variantieanalyse. De uitgangssituatie bij ANCOVA is een vergelijkende studie, waarbij er sprake is van twee of meer groepen die zich van elkaar onderscheiden op basis van een bepaalde discrete (categorische) variabele. Bovendien moet er rekening gehouden worden met een continue storende variabele (de covariaat). Als voorbeeld gaan we uit van een studie over voedingsgewoonten, waarbij o.a. wordt onderzocht of er bij kinderen een verband aanwezig is tussen voedingsgewoonten en lichaamslengte. Als indicatie voor voedingsgewoonten wordt het onderscheid tussen stads- en plattelandskinderen gehanteerd (file: NUTRITIO.SAV, zie ook hoofdstuk II-11.9 voor een beschrijving van dit onderzoek). Daarnaast moet er rekening worden gehouden met de continue variabele LEEFTIJD die de relatie tussen voedingsgewoonten en lengte kan II12-8
verstoren (covariaat). Om te kijken of er een significant verschil in lengte is tussen de stads- en plattelandskinderen zonder rekening te houden met andere variabelen, kan er een twee steekproeven t-test worden uitgevoerd. Als er echter sprake zou zijn van meer dan 2 groepen moet er een één-weg variantieanalyse uitgevoerd worden onder de aanname van gelijke varianties in alle groepen. Ook in ons voorbeeld zullen we de lengte van de stads- en plattelandskinderen vergelijken middels één-weg variantieanalyse, wat overeenkomt met de twee steekproeven t-test mits er sprake is van gelijke populatievarianties. Deze één-weg variantieanalyse kan worden uitgevoerd middels de procedure One-Way Anova of Univariate Anova. We kiezen voor de laatste optie omdat deze meer mogelijkheden biedt. Kies Analyze→ General Linear Model→ Univariate met LENGTE als afhankelijke variabele en SCHOOL als Fixed Factor. Vraag onder de drukknop Options de paarsgewijze vergelijkingen op via het aanvinken van Compare main effects en vraag om de schattingen van de regressiecoëfficiënten via het aanvinken van Parameter Estimates, zoals is aangegeven in onderstaand scherm:
Klik op Continue en vervolgens op OK. Een deel van de uitvoer staat hieronder:
II12-9
SPSS uitvoer Univariate ANOVA: Descriptive Statistics Dependent Variable: LENGTE SCHOOL .00 platteland 1.00 stad Total
Mean 141.6714 144.5444 143.2875
Std. Deviation 6.12051 8.58612 7.63112
N 14 18 32
De geobserveerde gemiddelde lengte van de plattelandskinderen is 141.67cm, met een standaard deviatie van 6.12cm (n=14) en van stadskinderen 144.54 met een standaard deviatie van 8.59 (n=18). Tests of Between-Subjects Effects Dependent Variable: LENGTE Source Corrected Model Intercept SCHOOL Error Total Corrected Total
Type III Sum of Squares 65.002a 645116.267 65.002 1740.253 658807.100 1805.255
df 1 1 1 30 32 31
Mean Square 65.002 645116.267 65.002 58.008
F 1.121 11121.077 1.121
Sig. .298 .000 .298
a. R Squared = .036 (Adjusted R Squared = .004)
Uit bovenstaande ANOVA tabel (Test of Between-Subjects Effects) blijkt dat er geen significant verschil in lengte bestaat tussen de stads- en plattelandskinderen (SCHOOL, F=1.12, Sig.= .298). Parameter Estimates Dependent Variable: LENGTE Parameter Intercept [SCHOOL=.00] [SCHOOL=1.00]
B Std. Error 144.544 1.795 -2.873 2.714 0a .
t 80.518 -1.059 .
Sig. .000 .298 .
95% Confidence Interval Lower Bound Upper Bound 140.878 148.211 -8.416 2.670 . .
a. This parameter is set to zero because it is redundant.
Uit bovenstaande tabel kunnen de gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0)→ LENGTE = 144.544 – 2.873 = 141.67 Voor stadskinderen (SCHOOL = 1) → LENGTE = 144.54. Het geschatte verschil tussen de 2 groepen bedraagt 2.873cm. De gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means:
II12-10
Estimated Marginal Means SCHOOL Estimates Dependent Variable: LENGTE SCHOOL .00 platteland 1.00 stad
Mean 141.671 144.544
Std. Error 2.036 1.795
95% Confidence Interval Lower Bound Upper Bound 137.514 145.829 140.878 148.211
In de Pairwise Comparisons tabel in de uitvoer staan alle paarsgewijze vergelijkingen (in dit geval dus alleen de vergelijking stads- en plattelandskinderen). Deze zijn zinvol wanneer de F-toets (zie bovenstaande Test of Between-Subjects Effects tabel) een significant resultaat oplevert en er meer dan 2 groepen zijn. In ons geval is deze test niet significant, dus we zullen verder niet toetsen op paarsgewijze verschillen. Vervolgens gaan we controleren voor de variabele LEEFTIJD. Aangezien dit een continue variabele is, moet deze in de analyse worden meegenomen als covariaat (covariantie-analyse, ANCOVA). Hierbij moet op de eerste plaats worden gecontroleerd of leeftijd lineair gerelateerd is aan lengte zowel bij de stads- als bij de plattelandskinderen. Daarvoor maken we een puntenwolk van LEEFTIJD tegen LENGTE voor beide groepen apart. Daartoe splitst men de datafile eerst in 2 groepen middels Data→ Split File. Kies voor de optie Organize output by groups; Groups Based on: SCHOOL, zoals hieronder is weergegeven:
Vraag nu een puntenwolk op middels: Graphs → Legacy Dialogs → Scatter/Dot. Kies voor Simple Scatter en klik op Define. Zet LEEFTIJD op de x-as en LENGTE op y-as:
II12-11
SPSS uitvoer puntenwolk: school: platteland 150,00
lengte
145,00
140,00
135,00
130,00 120,00
125,00
130,00
135,00
140,00
leeftijd school: stad 170,00
lengte
160,00
150,00
140,00
130,00 110,00
120,00
130,00
140,00
leeftijd
Alhoewel het lineaire verband bij de plattelandskinderen niet duidelijk in de puntenwolk te zien is (kleine steekproef?) nemen we toch aan dat het verband tussen leeftijd en lengte in beide groepen lineair is. Let op: Als er in het model naast LEEFTIJD nog andere variabelen waren meegenomen dan had men het lineaire verband tussen LEEFTIJD en LENGTE moeten beoordelen in partiële plots, waarin de zuivere relatie wordt weergegeven tussen de afhankelijke variabele (LENGTE) en een onafhankelijke variabele (LEEFTIJD) gecorrigeerd voor alle andere onafhankelijke variabelen die in het model zitten (zie hoofdstuk II11). Deze kunnen in SPSS alleen maar geproduceerd worden via de procedure Linear Regression. Een andere voorwaarde van covariantie-analyse is dat het verband tussen LEEFTIJD en LENGTE voor elke groep hetzelfde is (evenwijdige regressielijnen). Dit wordt onderzocht middels meervoudige variantieanalyse waarin de variabele LEEFTIJD in 3 categorieën wordt opgesplitst. We splitsen de variabele LEEFTIJD middels Analyze→Recode (zie het boek SPSS in Praktische Stappen van blok 1.2b) in 3 gelijke groepen (tertielen) en noemen deze gecategoriseerde variabele LFTCAT. Kies Analyze→ General Linear II12-12
Model→ Univariate , selecteer LENGTE als Dependent Variable en LFTCAT en SCHOOL als Fixed Factors. Klik op Model en kies het Custom model. Selecteer daarin LFTCAT en SCHOOL als hoofdeffecten door Build Terms op Main effects te zetten en de 2 onafhankelijke variabelen met de pijltoets naar de rechterbox over te brengen. Zet Build Terms vervolgens op Interaction, selecteer middels de Ctrl-knop zowel LFTCAT als SCHOOL en breng ze samen met de pijltjestoets over naar de rechterbox:
Opm. Omdat er slechts sprake is van 2 onafhankelijke variabelen (LFTCAT en SCHOOL) en we geïnteresseerd zijn in het model met beide hoofdeffecten en hun onderlinge interactie zouden we in dit geval ook gekozen kunnen hebben voor het full factorial model wat automatisch alle hoofdeffecten en alle factorfactor interactiemogelijkheden bevat. Klik op Continue. Vraag onder Plots een plot aan van LENGTE (automatisch op de y-as!) tegen LFTCAT (horizontal axis) met aparte lijnen voor SCHOOL (Separate lines). Klik op Add, Continue, en vervolgens op OK. De volgende uitvoer verschijnt: SPSS uitvoer Univariate ANOVA (controleren voorwaarden ANCOVA): Between-Subjects Factors Value Label LFTCAT
SCHOOL
II12-13
1.00 2.00 3.00 .00 1.00
platteland stad
N 11 11 10 14 18
Tests of Between-Subjects Effects Dependent Variable: LENGTE Source Corrected Model Intercept LFTCAT SCHOOL LFTCAT * SCHOOL Error Total Corrected Total
Type III Sum of Squares 686.436a 534516.839 326.582 174.645 146.274 1118.819 658807.100 1805.255
df 5 1 2 1 2 26 32 31
Mean Square 137.287 534516.839 163.291 174.645 73.137 43.031
F 3.190 12421.526 3.795 4.059 1.700
Sig. .022 .000 .036 .054 .202
a. R Squared = .380 (Adjusted R Squared = .261)
Er is geen sprake van interactie tussen LFTCAT en SCHOOL (LFTCAT*SCHOOL, F=1.7, Sig.=.202). Het verband tussen LFTCAT en LENGTE is voor beide groepen (stads- en plattelandskinderen) hetzelfde.
Estimated Marginal Means of lengte school
155,00
Estimated Marginal Means
platteland stad
150,00
145,00
140,00
135,00 1.00
2.00
3.00
lftcat
Alhoewel de lijnen in bovenstaande plot niet evenwijdig lopen, is er volgens de variantieanalyse geen interactie tussen SCHOOL en LFTCAT en mogen we dus wel uitgaan van evenwijdige regressielijnen in de populatie. Er is dus aan de voorwaarden van covariantie-analyse voldaan (lineariteit en evenwijdige regressielijnen), en kunnen we deze uitvoeren. Kies Analyze→ General Linear Model→ Univariate. Selecteer LENGTE als Dependent Variable, SCHOOL als Fixed Factor en LEEFTIJD als Covariate:
II12-14
Kies onder Model voor Full factorial en vraag onder Options om Compare main effects van de variabele SCHOOL en Parameter estimates. We krijgen de volgende resultaten: SPSS uitvoer ANCOVA: Between-Subjects Factors SCHOOL
.00 1.00
Value Label platteland stad
N 14 18
Tests of Between-Subjects Effects Dependent Variable: LENGTE Source Corrected Model Intercept LEEFTIJD SCHOOL Error Total Corrected Total
Type III Sum of Squares 467.238a 1088.957 402.236 207.933 1338.017 658807.100 1805.255
df 2 1 1 1 29 32 31
Mean Square 233.619 1088.957 402.236 207.933 46.139
F 5.063 23.602 8.718 4.507
Sig. .013 .000 .006 .042
a. R Squared = .259 (Adjusted R Squared = .208)
We zien dat er een significant verschil in lengte bestaat tussen de groepen (SCHOOL, F=4.507, Sig.=.042), wanneer er gecorrigeerd wordt voor de leeftijd van de kinderen. Parameter Estimates Dependent Variable: LENGTE Parameter Intercept LEEFTIJD [SCHOOL=.00] [SCHOOL=1.00]
B Std. Error 91.817 17.929 .416 .141 -5.466 2.575 0a .
t 5.121 2.953 -2.123 .
a. This parameter is set to zero because it is redundant.
II12-15
Sig. .000 .006 .042 .
95% Confidence Interval Lower Bound Upper Bound 55.147 128.487 .128 .704 -10.733 -.200 . .
Uit bovenstaande tabel kunnen de voor leeftijd gecorrigeerde gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0)→ LENGTE = 91.871+ 0.4161*LEEFTIJD – 5.466 = 86.405141.67 + 0.416*LEEFTIJD Voor stadskinderen (SCHOOL = 1) → LENGTE = 91.871+ 0.416*LEEFTIJD Het gemiddelde aangepaste verschil tussen de 2 groepen bij een constante leeftijd bedraagt 5.466cm, waarbij de plattelandskinderen kleiner zijn dan de stadskinderen. De voor leeftijd gecorrigeerde gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means:
Estimated Marginal Means SCHOOL Estimates Dependent Variable: LENGTE SCHOOL .00 platteland 1.00 stad
Mean Std. Error 140.213a 1.881 a 145.679 1.646
95% Confidence Interval Lower Bound Upper Bound 136.365 144.061 142.312 149.046
a. Covariates appearing in the model are evaluated at the following values: LEEFTIJD = 129.5625. Pairwise Comparisons Dependent Variable: LENGTE
(I) SCHOOL .00 platteland 1.00 stad
(J) SCHOOL 1.00 stad .00 platteland
Mean Difference (I-J) Std. Error -5.466* 2.575 5.466* 2.575
a
Sig. .042 .042
95% Confidence Interval for a Difference Lower Bound Upper Bound -10.733 -.200 .200 10.733
Based on estimated marginal means *. The mean difference is significant at the .05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
Het aangepaste verschil (5.466cm) tussen de 2 groepen is significant (Sig. =.042). Geconcludeerd kan worden dat dit lengte verschil groter is dan het niet voor leeftijd gecorrigeerde verschil van 2.873cm (zie pagina II12-10). Dus als stadsen plattelandskinderen even oud zouden zijn, bedraagt het verschil in lengte gemiddeld 5.466cm in plaats van het waargenomen verschil van 2.873cm. Merk op dat er nu dus wel sprake is van een significant effect van SCHOOL (Sig. =.042) in tegenstelling tot bij de ANOVA, waarbij niet gecorrigeerd is voor LEEFTIJD (Sig. =.298).
II12-16
Univariate (mixed model) procedure voor herhaalde metingen: eenweg within-subject design Wanneer tijdens een onderzoek dezelfde proefpersonen meerdere keren worden gemeten hebben we te maken met ‘herhaalde metingen’. Deze kunnen geanalyseerd worden via de procedure Univariate, mits de datafile univariaat is opgebouwd (zie hieronder). We gaan uit van de datafile GVO_BRUG_UNIVARIAAT.SAV. Het betreft een onderzoek naar de effectiviteit van verschillende vormen van voorlichting op het gebied van groenteconsumptie, waarbij 3 groepen met elkaar worden vergeleken. 9 Een groep die advies-op-maat heeft gekregen (advies); GROEP=2 9 Een groep die alleen algemene voorlichting heeft gekregen (brochure); GROEP=1 9 Een groep die geen voorlichting heeft gekregen (controle); GROEP=0 Deze file is univariaat van opzet, d.w.z., per persoon zijn er 3 records/rijen in het datascherm, waarbij iedere rij overeenkomt met een meettijdstip. Hieronder beschouwen wij voorlopig alleen GROEP= 0 (de controlegroep). Verder is er één voormeting (TIJD=1) en twee nametingen (TIJD=2 resp.3) wat betreft de groenteconsumptie: SPSS datavenster bij een univariate opzet van de data:
Opmerking: Middels Data -> Select Cases selecteert men de personen van GROEP= 0! In alle 3 de records per persoon is de afhankelijke variabele hetzelfde, nl. GROENTE. De variabele TIJD geeft voor elke persoon het tijdstip van de meting aan, de feitelijke within-subject (WS) factor. We hebben te maken met een eenweg within-subject (WS) design met 3 herhaalde metingen (TIJD=1 t/m II12-17
TIJD=3). De variabele TIJD kunnen wij zien als een fixed factor, de variabele PERSNO (persoonsnummer) daarentegen is een random factor waarmee we in de analyse rekening moeten houden! Vandaar dat de univariate methode ook wel wordt aangeduid als mixed model methode (ofwel een tweeweg ANOVA met een fixed en een random factor). Ter analyse van deze data kiezen we Analyze→ General Linear Model→ Univariate. In het venster dat volgt worden de afhankelijke variabele en zowel de fixed als de random factoren gedefinieerd:
Klik vervolgens op de drukknop Model, en kies voor een Custom Model met beide factoren in het model zonder interactieterm. We hebben immers maar 1 observatie per persno*tijd cel, zodat het interactie effect niet berekend kan worden. Tussen de haakjes achter de factor namen zie je een F voor Fixed en een R voor Random:
Klik op Continue, en vervolgens op de drukknop Plots. In het Profile Plots scherm vragen we een plot voor de fixed factor TIJD (Horizontal Axis). De Dependent Variable GROENTE komt automatisch op de y-as:
II12-18
Klik op Add, en Continue. Via de drukknop Options vragen we Descriptive statistics (onder Display) en Estimated Marginal Means voor de WS factor TIJD op. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (hier 3) en bijbehorende betrouwbaarheidsintervallen:
Klik op OK, en de volgende uitvoer verschijnt:
II12-19
SPSS uitvoer univariate methode eenweg within-subject design met 3 herhaalde metingen: Between-Subjects Factors TIJD
Value Label voormeting eerste nameting tweede nameting
1 2 3
PERSNO
N 219 218 215
1050 1100 1110 1120 1121 1122 1123 1125 1126 1127 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140 1141 1142
3 3 3 3 3 3 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3
Bovenstaande tabel (ingekort!) laat zien dat er sprake is van 3 tijdstippen (TIJD) met het aantal valide waarnemingen per tijdstip en persoon (N) erbij. In totaal zijn er 220 personen in de controlegroep, maar niet elke persoon is 3 keer gemeten (missing values). Tests of Between-Subjects Effects Dependent Variable: GROENTE Source Intercept TIJD PERSNO
Hypothesis Error Hypothesis Error Hypothesis Error
Type III Sum of Squares 709.244 81.380 .484 11.635 81.756 11.635
df 1 219.188 2 430 219 430
Mean Square 709.244 .371a .242 .027b .373 .027b
F 1910.278
Sig. .000
8.941
.000
13.797
.000
a. .994 MS(PERSNO) + .006 MS(Error) b. MS(Error)
Uit de bovenstaande Tests of Between-Subjects Effects tabel valt af te lezen dat de WS factor TIJD significant is (F= 8.941, Sig.= .000); De groenteconsumptie verschilt ten minste tussen 2 van de 3 tijdstippen (metingen). Welke metingen precies van elkaar verschillen kan men niet uit II12-20
deze tabel afleiden maar wel uit de Pairwise Comparisons tabel hieronder. De factor PERSNO is ook significant (F= 13.797, Sig.= .000). De groenteconsumptie (gemiddeld over de 3 tijdstippen) verschilt significant tussen de verschillende personen. Vervolgens staan in onderstaande tabel de geschatte gemiddelden van de 3 metingen, inclusief de standaard error en hun betrouwbaarheidsinterval:
Estimated Marginal Means TIJD Estimates Dependent Variable: GROENTE TIJD voormeting eerste nameting tweede nameting
Mean 1.013 1.044 1.080
Std. Error .011 .011 .011
95% Confidence Interval Lower Bound Upper Bound .992 1.035 1.023 1.066 1.058 1.103
De overall F-toets in de Tests of Between-Subjects Effects tabel laat zien dat de WS factor TIJD significant is. In de Pairwise Comparisons tabel kan men zien welke metingen significant van elkaar verschillen. In dit geval hebben we te maken met 3 metingen en dus 3 paarsgewijze vergelijkingen: Pairwise Comparisons Dependent Variable: GROENTE
(I) TIJD voormeting eerste nameting tweede nameting
(J) TIJD eerste nameting tweede nameting voormeting tweede nameting voormeting eerste nameting
Mean Difference (I-J) -.031* -.067* .031* -.036* .067* .036*
Std. Error .016 .016 .016 .016 .016 .016
a
Sig. .050 .000 .050 .024 .000 .024
95% Confidence Interval for a Difference Lower Bound Upper Bound -.062 -5.904E-05 -.098 -.036 5.904E-05 .062 -.067 -.005 .036 .098 .005 .067
Based on estimated marginal means *. The mean difference is significant at the .05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
Alle 3 de tijdstippen (metingen) verschillen significant van elkaar. De tabel laat ook zien hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference).
II12-21
Onderstaande plot geeft de situatie grafisch weer:
Estimated Marginal Means of groente
Estimated Marginal Means
1,08
1,06
1,04
1,02
voormeting
eerste nameting
tweede nameting
tijd
Zoals duidelijk te zien is, neemt de groenteconsumptie toe over de tijd. Opmerking: De vermelde standard errors van .016 zijn gelijk vanwege de aannname van sphericity (d.w.z. gelijke variantie van de verschilscores) .
Multivariate procedure voor herhaalde metingen: eenweg within-subject design In de vorige paragraaf was er sprake van een univariate opzet van de data. Deze data werden geanalyseerd middels de univariate (mixed model) methode, waarbij er sprake was van zowel een fixed als een random factor. Een belangrijke aanname bij deze methode is sphericity (= varianties van de verschilscores die voor ieder 2-tal tijdstippen berekend kunnen worden, zijn gelijk). De univariate procedure is echter wat verouderd, in de regel verdient de multivariate procedure de voorkeur. De aanname van sphericity is dan niet noodzakelijk en bovendien geeft SPSS bij de multivariate procedure dezelfde resultaten als de univariate procedure, met en zonder epsilon-correctie van de vrijheidsgraden. We analyseren dezelfde data als in de vorige paragraaf, met het verschil dat onze file, GVO_BRUG.SAV multivariaat van opzet is, d.w.z., er is één record (regel) per persoon, met aparte kolommen (variabelen) voor de verschillende (herhaalde) metingen. We gaan weer uit van GROEP= 0 (de controlegroep), éen voormeting (GROENV) en twee nametingen wat betreft de groenteconsumptie op 2 verschillende tijdstippen: GROENNA1 en GROENNA2:
II12-22
SPSS datavenster bij een multivariate opzet van de data:
Het verschil tussen de 3 metingen vormt de within-subject (WS) factor. We hebben net zoals in de vorige paragraaf weer te maken met een eenweg withinsubject (WS) design. Nu gaan we echter de multivariate procedure uitvoeren die ook meer complexe WS designs aan kan. Hiervoor kiezen we onder Analyze->General Linear Model ->Repeated Measures. Het eerste scherm dat gepresenteerd wordt vraagt een naam voor de Within-Subject Factor Name en de Number of Levels. We kiezen bijvoorbeeld de naam ‘TIJDSTIP’ voor de WS Factor Name om aan te geven dat het gaat om het verschil tussen de 3 metingen GROENV, GROENNA1 en GROENNA2, en ‘3’ voor Number of Levels omdat de WS factor 3 niveaus kent. Vervolgens klikken wij op Add:
II12-23
Als we op Define klikken krijgen we het tweede scherm, Repeated Measures, waarin we de variabelen kunnen aangeven die de WS metingen representeren (GROENV, GROENNA1 en GROENNA2). Between-Subjects (BS) Factor(s) en Covariates zijn hier (nog) niet aan de orde, dus die velden laten we leeg:
Onder aan het scherm Repeated Measures staan een zestal knoppen. Via de derde knop, Plots…, komt het venster Repeated Measures: Profile Plots te voorschijn. We kiezen voor de WS factor TIJDSTIP op de horizontale as, en klikken op Add om die keuze te actualiseren:
Met Continue keren we terug naar het voorgaande scherm. Tenslotte kunnen wij via de drukknop Options diverse aanvullende uitvoer aanvragen, zoals Descriptive statistics (onder Display) en Estimated Marginal Means voor de factor TIJDSTIP. Via Compare main effects krijgen we ook nog paarsgewijze vergelijkingen van ieder 2-tal tijdstippen (hier 3), en de bijbehorende betrouwbaarheidsintervallen.
II12-24
De belangrijkste SPSS uitvoer van de analyse zal hieronder worden besproken.
SPSS uitvoer multivariate procedure eenweg within-subject design met 3 herhaalde metingen: Within-Subjects Factors Measure: MEASURE_1 TIJDSTIP 1 2 3
Dependent Variable GROENV GROENNA1 GROENNA2
De WS factor TIJDSTIP kent 3 metingen, GROENV, GROENNA1 en GROENNA2 Descriptive Statistics GROENV GROENNA1 GROENNA2
Mean 1.0195 1.0485 1.0856
Std. Deviation .36442 .37495 .40632
N 212 212 212
Deze tabel geeft het geobserveerde gemiddelde en de standaarddeviatie weer van de metingen. II12-25
De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Multivariate Testsb Effect TIJDSTIP
Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root
Value .061 .939 .065 .065
F Hypothesis df 6.850a 2.000 6.850a 2.000 6.850a 2.000 6.850a 2.000
Error df 210.000 210.000 210.000 210.000
Sig. .001 .001 .001 .001
a. Exact statistic b. Design: Intercept Within Subjects Design: TIJDSTIP
De H0 luidt: De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. Het beste kan de toetsingsgrootheid Pillai’s Trace worden genomen, welke het meest robuust is tegen modelschendingen. Aangezien de p-waarde< .05 is, wordt de H0 verworpen (F=6.850, Sig.=.001). Er is minstens 1 paar metingen dat van elkaar verschilt. Vervolgens volgt de uitvoer van de univariate methode. Allereerst wordt er in de tabel Mauchly’s Test of Sphericity gekeken of er sprake is van sphericity. Daarbij wordt de H0: Er is sphericity (i.e. varianties van de verschilscores zijn gelijk), getest: Mauchly's Test of Sphericityb Measure: MEASURE_1 Epsilon Within Subjects Effect TIJDSTIP
Mauchly's W .940
Approx. Chi-Square 13.071
df 2
Sig. .001
Greenhous e-Geisser .943
a
Huynh-Feldt .951
Lower-bound .500
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: TIJDSTIP
De p-waarde is kleiner dan .05 (Sig.=.001) dus de H0 wordt verworpen, er is geen sprake van sphericity. Er zal een epsilon correctie moeten plaatsvinden van het aantal vrijheidsgraden. Wij zullen de Greenhouse-Geisser correctie gebruiken.
II12-26
Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP
Error(TIJDSTIP)
Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound
Type III Sum of Squares .465 .465 .465 .465 11.563 11.563 11.563 11.563
df
Mean Square .232 .246 .244 .465 .027 .029 .029 .055
2 1.886 1.903 1.000 422 397.984 401.459 211.000
F 8.478 8.478 8.478 8.478
Sig. .000 .000 .000 .004
Bovenstaande tabel test wederom de H0 : De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. We kunnen niet uitgaan van sphericity en passen de Greenhouse-Geisser correctie toe, F=8.478, Sig.=.000, de H0 wordt verworpen. We komen dus tot dezelfde conclusie als bij de multivariate analyse, dwz dat groente consumptie verschilt op minstens 2 van de tijdstippen.
Estimated Marginal Means Estimates Measure: MEASURE_1 TIJDSTIP 1 2 3
Mean 1.020 1.049 1.086
Std. Error .025 .026 .028
95% Confidence Interval Lower Bound Upper Bound .970 1.069 .998 1.099 1.031 1.141
Het gemiddelde van de metingen apart, inclusief standaard error en betrouwbaarheidsinterval. Pairwise Comparisons Measure: MEASURE_1
(I) TIJDSTIP 1 2 3
(J) TIJDSTIP 2 3 1 3 1 2
Mean Difference (I-J) -.029 -.066* .029 -.037* .066* .037*
Std. Error .015 .018 .015 .015 .018 .015
a
Sig. .059 .000 .059 .013 .000 .013
95% Confidence Interval for a Difference Lower Bound Upper Bound -.059 .001 -.101 -.031 -.001 .059 -.066 -.008 .031 .101 .008 .066
Based on estimated marginal means *. The mean difference is significant at the .05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
De Pairwise Comparisons tabel geeft de paarsgewijze vergelijkingen van de metingen. Als de overall F-toets van de WS factor significant is (zie Multivariate Tests tabel en Tests of Within-Subjects Effects tabel) kan men in deze tabel zien welke metingen van elkaar verschillen. In dit geval hebben II12-27
we te maken met 3 metingen en 3 paarsgewijze vergelijkingen. We kunnen zien dat de groenteconsumptie op tijdstip 1 en 3, en tijdstip 2 en 3 significant van elkaar verschillen (p-waarde kleiner dan .05). Tussen tijdstip 1 en 2 is er (net) geen significant verschil (Sig.=.059). Merk op dat, in tegenstelling tot bij de univariate methode, elk paar zijn eigen standaard error heeft (geen shericity aanname bij deze multivariate procedure). In deze tabel staat ook hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). Een grafische weergave van de situatie staat in onderstaande plot.
Profile Plots Estimated Marginal Means of MEASURE_1
Estimated Marginal Means
1,150
1,125
1,100
1,075
1,050
1
2
3
tijdstip
Opmerking: De univariate (mixed model) procedure zoals beschreven in de vorige paragraaf en de univariate uitvoer zoals hier verkregen middels een multivariate analyse geven niet precies hetzelfde resultaat. Dit is het gevolg van het feit dat SPSS bij de multivariate procedure zg. Listwise Deletion toepast, d.w.z. dat alleen die personen meegenomen worden in de analyse die geen ontbrekende waarden kennen voor de 3 metingen samen. Zoals je in het begin van de uitvoer kunt aflezen zijn dit 212 personen (zie pagina II12-25). In de univariate procedure van de vorige paragraaf worden net zoveel personen geanalyseerd als er beschikbaar zijn voor elke meting apart, in dit geval zijn dat 219 personen voor GROENV, 218 voor GROENNA1 en 215 voor GROENNA2 (zie paginaII1220). Zou er geen sprake zijn van ontbrekende waarden, dan zouden de resultaten van de univariate (mixed model) procedure van de vorige paragraaf en de univariate uitvoer zonder epsilon correctie binnen de multivariate procedure aan elkaar gelijk zijn.
II12-28
Multivariate procedure voor herhaalde metingen: Split-plot design met drie groepen en een voormeting In plaats van de voormeting GROENV als een nivo van de WS variabele in de analyse mee te nemen, kunnen we deze ook als covariaat beschouwen. Dan hebben we dus te maken met een model met twee herhaalde nametingen (GROENNA1 en GROENNA2, de WS factor) en een voormeting (GROENV, de Covariaat). Bovendien breiden we ons voorbeeld uit met 3 experimentele groepen (GROEP=0, GROEP= 1 en GROEP= 2, de BS factor). Men noemt dit een zg. Split-plot design met een covariaat. Kies Analyze -> General Linear Model -> Repeated Measures. In het eerste scherm (Define Factor(s)) vul je een WS factor naam in, bijv. ‘TIJDSTIP’ met Number of Levels = 2. Via Add en Define krijgen we het bekende Repeated Measures venster dat als volgt wordt ingevuld. Let op de BS factor en de covariaat!:
Van de knoppen onderaan slaan we Model, Contrasts en Save over. Onder Plots zetten we de WS factor TIJDSTIP op de horizontale as en de BS factor GROEP in het kader Separate Lines. Klik op Add:
II12-29
Met Continue keren we terug naar het voorgaande scherm. Via Options vragen we Descriptive statistics op en Estimated Marginal Means voor de factoren TIJDSTIP en GROEP. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (WS factor) en groepen (BS factor), en bijbehorende betrouwbaarheidsintervallen, maar deze zijn alleen interpreteerbaar wanneer er geen sprake is van interactie tussen de WS factor en BS factor!! (Opm. De Post-hoc knop (voor post-hoc vergelijkingen tussen groepen) is niet beschikbaar indien er een covariaat in het model zit. Maar via Options -> Compare main effects kan men deze vergelijkingen toch krijgen, eventueel met Bonferroni correctie). Hieronder volgt de belangrijkste uitvoer. SPSS uitvoer Split Plot design met drie groepen en een voormeting: Within-Subjects Factors Measure: MEASURE_1 TIJDSTIP 1 2
Dependent Variable GROENNA1 GROENNA2
De WS factor TIJDSTIP kent 2 metingen, GROENNA1 en GROENNA2. Between-Subjects Factors N GROEP
.00 1.00 2.00
212 201 205
De BS factor GROEP kent 3 groepen, 0, 1 en 2, waarbij de omvang van ieder van de 3 groepen gegeven staat in de kolom N. Descriptive Statistics GROENNA1
GROENNA2
II12-30
GROEP .00 1.00 2.00 Total .00 1.00 2.00 Total
Mean 1.0485 1.1308 1.1366 1.1045 1.0856 1.1514 1.2042 1.1463
Std. Deviation .37495 .41374 .37751 .39030 .40632 .40749 .35731 .39355
N 212 201 205 618 212 201 205 618
Deze tabel geeft verder de geobserveerde gemiddelden en standaard deviaties weer van GROENNA1 en GROENNA2 per GROEP De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Multivariate Testsb Effect TIJDSTIP
Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root TIJDSTIP * GROENV Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root TIJDSTIP * GROEP Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root
Value .019 .981 .019 .019 .006 .994 .006 .006 .007 .993 .007 .007
F Hypothesis df 11.629a 1.000 11.629a 1.000 11.629a 1.000 11.629a 1.000 3.968a 1.000 3.968a 1.000 3.968a 1.000 3.968a 1.000 2.186a 2.000 2.186a 2.000 2.186a 2.000 2.186a 2.000
Error df 614.000 614.000 614.000 614.000 614.000 614.000 614.000 614.000 614.000 614.000 614.000 614.000
a. Exact statistic b. Design: Intercept+GROENV+GROEP Within Subjects Design: TIJDSTIP
Allereerst kijken we of er sprake is van interactie tussen de WS factor en de BS factor (TIJDSTIP*GROEP). De H0 luidt: Geen interactie. De p-waarde is >.05 (F=2.186, Sig.=.113). De H0 kan niet worden verworpen, we gaan uit van geen interactie. Er is wel sprake van interactie tussen de WS factor en de voormeting (TIJDSTIP*GROENV, F=3.968, Sig. = .047). Het gevolg hiervan is dat we het effect van de WS factor (TIJDSTIP) niet kunnen interpreteren. In dit voorbeeld is er sprake van slechts 2 herhaalde metingen en dus maar 1 verschilscore. In deze situatie gaat sphericity (=gelijkheid van de varianties van de verschilscores) altijd op. Er is in dat geval geen correctie van de univariate resultaten nodig, zie onderstaande tabel, waarin de resultaten voor sphericity assumed en de Greenhouse-Geisser hetzelfde zijn:
II12-31
Sig. .001 .001 .001 .001 .047 .047 .047 .047 .113 .113 .113 .113
Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP
Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound TIJDSTIP * GROENV Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound TIJDSTIP * GROEP Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound
Type III Sum of Squares .314 .314 .314 .314 .107 .107 .107 .107 .118 .118 .118 .118 16.573 16.573 16.573 16.573
df 1 1.000 1.000 1.000 1 1.000 1.000 1.000 2 2.000 2.000 2.000 614 614.000 614.000 614.000
Mean Square .314 .314 .314 .314 .107 .107 .107 .107 .059 .059 .059 .059 .027 .027 .027 .027
F 11.629 11.629 11.629 11.629 3.968 3.968 3.968 3.968 2.186 2.186 2.186 2.186
Tests of Between-Subjects Effects Measure: MEASURE_1 Transformed Variable: Average Source Intercept GROENV GROEP Error
Type III Sum of Squares 13.962 111.528 1.140 58.856
df 1 1 2 614
Mean Square 13.962 111.528 .570 .096
F 145.659 1163.494 5.947
Sig. .000 .000 .003
Bovenstaande tabel geeft het effect van de BS factor (GROEP) weer, de H0 luidt: Er is geen verschil tussen de 3 groepen. Deze moet worden verworpen (F=5.947, Sig.=.003). Er is dus wel verschil tussen de 3 groepen wat betreft gemiddelde groenteconsumptie over beide nametingen (GROENNA1 en GROENNA2). Verder staat er ook een toets voor de relatie tussen de voormeting (GROENV) en het gemiddelde van de 2 nametingen wat betreft de groenteconsumptie. Aangezien er sprake is van een significante interactie TIJDSTIP*GROENV mogen we deze echter niet interpreteren.
Estimated Marginal Means 1. TIJDSTIP Estimates Measure: MEASURE_1 TIJDSTIP 1 2
Mean Std. Error 1.105a .009 1.147a .010
95% Confidence Interval Lower Bound Upper Bound 1.086 1.124 1.126 1.167
a. Covariates appearing in the model are evaluated at the following values: GROENV = 1.0444.
Hier zien wij het geschatte gemiddelde van beide nametingen apart, inclusief standaard error en betrouwbaarheidsinterval.
II12-32
Sig. .001 .001 .001 .001 .047 .047 .047 .047 .113 .113 .113 .113
Pairwise Comparisons Measure: MEASURE_1
(I) TIJDSTIP 1 2
(J) TIJDSTIP 2 1
Mean Difference (I-J) -.042* .042*
Std. Error .009 .009
a
Sig. .000 .000
95% Confidence Interval for a Difference Lower Bound Upper Bound -.060 -.023 .023 .060
Based on estimated marginal means *. The mean difference is significant at the .05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
Aangezien er sprake is van interactie tussen TIJDSTIP*GROENV mogen we het effect van TIJDSTIP en dus ook de paarsgewijze vergelijkingen in de tabel Pairwise Comparisons niet interpreteren.
2. conditie: aantal keren advies op maat Estimates Measure: MEASURE_1 conditie: aantal keren advies op maat .00 1.00 2.00
Mean Std. Error 1.086a .015 1.131a .015 1.160a .015
95% Confidence Interval Lower Bound Upper Bound 1.057 1.116 1.101 1.162 1.130 1.190
a. Covariates appearing in the model are evaluated at the following values: GROENV = 1.0444.
Het gemiddelde van de groenteconsumptie over beide tijdstippen (nametingen) voor de 3 groepen apart, inclusief standaard error en betrouwbaarheidsinterval. Pairwise Comparisons Measure: MEASURE_1
(I) conditie: aantal keren advies op maat .00 1.00 2.00
(J) conditie: aantal keren advies op maat 1.00 2.00 .00 2.00 .00 1.00
Mean Difference (I-J) Std. Error -.045* .022 -.073* .021 .045* .022 -.029 .022 .073* .021 .029 .022
a
Sig. .038 .001 .038 .190 .001 .190
95% Confidence Interval for a Difference Lower Bound Upper Bound -.087 -.002 -.116 -.031 .002 .087 -.071 .014 .031 .116 -.014 .071
Based on estimated marginal means *. The mean difference is significant at the .05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
Aangezien er geen sprake is van interactie tussen TIJDSTIP*GROEP en de overall F-toets van de BS factor GROEP significant is (zie Multivariate Tests tabel en Tests of Between-Subjects Effects tabel) kan men in de bovenstaande Pairwise Comparisons tabel zien hoe de groepen van elkaar verschillen. GROEP 0 en 1 en GROEP 0 en 2 verschillen significant van elkaar (Sig.<.05), terwijl er geen verschil is tussen GROEP 1 en 2 (Sig.=.19).
II12-33
Het geheel is als volgt grafisch weergegeven:
Profile Plots Estimated Marginal Means of MEASURE_1 conditie: aantal keren advies op maat
1,20
.00 1.00 2.00
Estimated Marginal Means
1,175
1,15
1,125
1,10
1,075
1
2
tijdstip
Als er sprake zou zijn van interactie tussen GROEP en TIJDSTIP, moet het groepseffect apart per tijdstip (nameting) worden geanalyseerd met een eenweg ANCOVA . Bijvoorbeeld voor de analyse op tijdstip 1 (GROENNA1): kies Analyze -> General Linear Model-> Univariate. Het scherm dat nu verschijnt, wordt als volgt ingevuld:
De variabele GROENNA1 plaatsen we onder Dependent (afhankelijke) Variable, de BS factor GROEP onder Fixed Factor, en de voormeting (GROENV) onder Covariate(s). Via de drukknop Plots wordt een profile plot aangevraagd met GROEP op de horizontale as: II12-34
Middels Continue keren we terug naar het vorige scherm. Via Options worden de Estimated Marginal Means van de variabele GROENNA1 voor elk van de drie groepen opgevraagd en tevens de paarsgewijze vergelijkingen tussen de drie groepen (Compare main effects):
Klik op Continue en OK, en de analyse verschijnt in de uitvoerfile: SPSS uitvoer Univariate ANCOVA voor GROENNA1: Between-Subjects Factors N conditie: aantal keren advies op maat
.00 1.00 2.00
217 206 208
Bovenstaande tabel geeft de groepsvariabele (GROEP) weer met de bijbehorende aantalen (N). Deze aantallen verschillen met die in de multivariate analyse (N=212, 201 en 205 resp. voor GROEP=0, 1, en 2), zie Between-Subjects Factors tabel op pagina II12-30). Door de Listwise Deletion die SPSS toepast in de multivariate procedure worden alleen die cases meegenomen in de analyse die geen missing values hebben in de 3 metingen samen (GROENV, GROENNA1 en GROENA2), i.t.t. bij deze ANCOVA II12-35
waarbij alle cases worden meegenomen met valide waarden op de betreffende variabelen (hier: GROENNA1 en GROENV). Door verschillen in aantallen zullen ook verschillen in resultaten (Pairwise Comparisons) ontstaan. Tests of Between-Subjects Effects Dependent Variable: GROENNA1 Source Corrected Model Intercept GROENV GROEP Error Total Corrected Total
Type III Sum of Squares 60.787a 5.300 59.768 .343 34.602 863.714 95.388
df 3 1 1 2 627 631 630
Mean Square 20.262 5.300 59.768 .171 .055
F 367.161 96.040 1083.026 3.106
Sig. .000 .000 .000 .045
a. R Squared = .637 (Adjusted R Squared = .636)
De variabele GROEP is significant (F=3.106, Sig.=.045). Minstens 1 paar groepen verschilt van elkaar, zoals we zullen zien in de Pairwise Comparisons tabel.
Estimated Marginal Means conditie: aantal keren advies op maat Estimates Dependent Variable: GROENNA1 conditie: aantal keren advies op maat .00 1.00 2.00
Mean Std. Error 1.071a .016 1.118a .016 1.123a .016
95% Confidence Interval Lower Bound Upper Bound 1.040 1.103 1.086 1.150 1.091 1.155
a. Covariates appearing in the model are evaluated at the following values: GROENV = 1.0462.
De geschatte gemiddelden van GROENNA1 per groep met standaard error en 95% betrouwbaarheidsinterval. Pairwise Comparisons Dependent Variable: GROENNA1
(I) conditie: aantal keren advies op maat .00 1.00 2.00
(J) conditie: aantal keren advies op maat 1.00 2.00 .00 2.00 .00 1.00
Mean Difference (I-J) -.046* -.051* .046* -.005 .051* .005
Std. Error .023 .023 .023 .023 .023 .023
a
Sig. .043 .025 .043 .829 .025 .829
95% Confidence Interval for a Difference Lower Bound Upper Bound -.091 -.002 -.096 -.007 .002 .091 -.050 .040 .007 .096 -.040 .050
Based on estimated marginal means *. The mean difference is significant at the .05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).
De variabele GROEP is significant (zie Test of Between-Subject Effects tabel). Uit bovenstaande tabel blijkt dat groep 0 en 1 (Sig.=.043) en groep 0 en 2 (Sig.=.025) significant van elkaar verschillen. Groep 1 en 2 verschillen niet significant van elkaar (Sig.=.829). Omdat er geen sprake is van interactie tussen TIJDSTIP en GROEP hebben we dit ook al geconcludeerd uit de multivariate analyse met beide nametingen.
II12-36
Grafisch kan de situatie voor GROENNA1 als volgt worden weergegeven:
Profile Plots Estimated Marginal Means of groenna1
1,13
Estimated Marginal Means
1,12
1,11
1,10
1,09
1,08
1,07 .00
1.00
2.00
conditie: aantal keren advies op maat
Dezelfde ANCOVA kan ook worden uitgevoerd voor GROENNA2.
II12-37
Opmerkingen met betrekking tot de oefeningen van hoofdstuk II-12 Lees dit hoofdstuk eerst goed door!! De gegevensbestanden voor de oefeningen van hoofdstuk II-12 zijn beschikbaar op directory J. Het zijn SPSS bestanden en zijn herkenbaar aan de extensie .SAV. Lees de beschrijving van de bestanden (zie bijlage 1 van het theorieboek deel 2)
Oefening 12.3 Open het bestand Lengte.SAV
12.3.c: Via Graphs →Legacy Dialogs→ Scatter/Dot →Simple. Daarna m.b.v. define de gewenste variabelen op de x en y-as selecteren.
12.3.d: Voer een enkelvoudige lineaire regressie uit, laat de Cook=s distances berekenen (drukknop Save). Met behulp van de drukknop Plots maak je een histogram, een normal probability plot en een residuenplot. Selecteer voor de residuenplot sresid (gestudentiseerde residuen) als Y variabele en *zpred (gestandaardiseerde voorspelde waarden) als X variabele.
Oefening 12.4 Open het bestand Nurse1.SAV 12.4a en 12.4c: Voor een meervoudige variantieanalyse uit (Analyze → General Linear Model → Univariate). Selecteer Tijd als dependent factor en Type en Leeftijd als Fixed Factors. Kies het volledige model (full factorial).
12.4 b: Als a en c, maar kies nu het custom model, met alleen hoofdeffecten voor type en leeftijd (geen interactie).
12.4 c: Open het bestand Nurse2.SAV 12.4d: Celgemiddelden kunnen worden berekend m.b.v. de drukknop Options. Onder Display kies je vervolgens Descriptive Statistics. De plot mag met de hand maar kan ook met SPSS worden gemaakt (m.b.v de drukknop Plots)
Oefening 12.5 12.5.a: Open het bestand Serum.SAV Voer een meervoudige variantieanalye uit en kies het custom model met alleen hoofdeffecten voor Ppn en Tijd (geen interactie).
12.5.b: II12-38
Gebruik de menu-optie Data → Split File om het bestand in verschillende groepen te splitsen, waarbij SPSS elke analyse voor iedere groep afzonderlijk uitvoert. Klik in het dialoogvenster Split File op Compare groups. Daarna plaats je de groepsvariabele (TIJD) in het kader onder Groups Based on. Bevestig met OK. Maak vervolgens de histogrammen (met normale curve) m.b.v. de procedure Frequencies.
Oefening 12.6 12.6.a: Voer de gegevens van de 3 variabelen in het datavenster in en voer een meervoudige variantieanalyse uit (model full factorial).
Oefening 12.7 12.7.a: Open Drug.SAV Voer een meervoudige variantieanalye uit (model full factorial).
II12-39