mlw stroom 2.2
Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart 2006 Methodologie en Statistiek | Universiteit Maastricht
1
Onderwerpen • Cross-over design: voorbeeld tennisarm – Algemene methode – Vergelijking met t-toets
• Groeicurven: voorbeeld schoolmeisjes – Random intercept model – Betekenis geschatte coëfficiënten Methodologie en Statistiek | Universiteit Maastricht
2
Cross-over design: 2 x 2 • “2 x 2”: iedere deelnemer krijgt zowel de placebo als de actieve behandeling Groep
Periode 1
Periode 2
“M – P”
Motrin
Placebo
“P – M”
Placebo
Motrin
• Analyse d.m.v. t-toets op verschil tussen periode 1 en periode 2 Methodologie en Statistiek | Universiteit Maastricht
3
Cross-over design: 3 x 3 • “3 x 3”: drie perioden, drie behandelingen (A,B,C) Groep
Periode 1
Periode 2
Periode 3
1
A
B
C
2
A
C
B
3
B
A
C
4
B
C
A
5
C
A
B
6
C
B
C
• Analyse? Methodologie en Statistiek | Universiteit Maastricht
4
Cross-over: algemene methode (1) •
2 x 2 cross-over design: Tennis2.sav id
age
sex
drug-order
overall1
overall2
701
42
2
M–P
5
3
45
1
P-M
2
4
… 706 …
•
Analyse met anova: data herschikken TENNIS2-LONG.sav id
age
sex
period
treat
overall
701
42
2
1
1 (M)
5
701
42
2
2
0 (P)
3
706
45
1
1
0 (P)
2
706
45
1
2
1 (M)
4
…
… Methodologie en Statistiek | Universiteit Maastricht
5
Cross-over: algemene methode (2) •
Gemiddelden per TREAT en PERIODE: (vgl. TENNIS2.sav) Group Statistics
• •
TREAT Placebo
overall
Motrin
overall
PERIOD eerste periode tweede periode eerste periode tweede periode
N 42 42 42 42
Mean 2,86 3,76 3,83 4,21
Std. Deviation 1,160 1,574 1,188 1,353
Std. Error Mean ,179 ,243 ,183 ,209
OVERALL = algemene indruk van effectiviteit Analyse (negeer AGE en SEX: waarom mag dat?) NIET goed: twee-steekproeven t-toets TREAT = 1 vs. = 0 WEL goed: Mixed lineair model met fixed factoren PERIOD en TREAT, en random factor ID. Methodologie en Statistiek | Universiteit Maastricht
6
Cross-over: algemene methode (3) Mixed lineair model:
Yij = α + ai + β1 Period + β2 Treat + eij α = de gemiddelde “placebo” score van subjecten in de eerste periode, ai = in hoeverre de placebo score van subject i hier vanaf wijkt, β1 = het periode effect, en β2 = het verschil tussen Motrin en Placebo, ai ~ N(0, σ2id), eij ~ N(0, σ2error); ai’s en eij’s zijn onafhankelijk Methodologie en Statistiek | Universiteit Maastricht
7
Cross-over: algemene methode (4) Uitschrijven geeft: Yij = α + ai
+ β2 + eij, in periode 1, groep = M – P
Yij = α + ai + β1
+ eij, in periode 2, groep = M – P
Yij = α + ai
+ eij, in periode 1, groep = P – M
Yij = α + ai + β1 + β2 + eij, in periode 2, groep = P – M
Mixed lineair model: - α, β “fixed” effecten - ai, eij “random” effecten Methodologie en Statistiek | Universiteit Maastricht
8
Cross-over: algemene methode (5) SPSS:
<mixed model> - OVERALL als dependent variable; - ID, PERIOD, TREAT als factoren PERIOD en TREAT ID <statistics> parameter estimates <EM Means …> TREAT Methodologie en Statistiek | Universiteit Maastricht
9
Cross-over: algemene methode (6) SPSS uitvoer: Type III Tests of Fixed Effectsa Source Intercept PERIOD TREAT
Numerator df 1 1 1
Denominator df 83 82 82
F 1006,097 13,400 16,543
Sig. ,000 ,000 ,000
a. Dependent Variable: algemene indruk van effectiviteit.
• Significantie van PERIOD? • TREAT is significant. • Hoe groot is het behandelingseffect (TREAT)? Methodologie en Statistiek | Universiteit Maastricht
10
Cross-over: algemene methode (7) Estimates of Fixed Effectsb
Parameter Intercept [PERIOD=1] [PERIOD=2] [TREAT=0] [TREAT=1]
Estimate 4,3452381 -,6428571 0a -,7142857 0a
Std. Error ,1696560 ,1756143 0 ,1756143 0
df 164,014 82 . 82 .
t 25,612 -3,661 . -4,067 .
Sig. ,000 ,000 . ,000 .
95% Confidence Interval Lower Bound Upper Bound 4,0102466 4,6802296 -,9922099 -,2935043 . . -1,0636385 -,3649329 . .
a. This parameter is set to zero because it is redundant. b. Dependent Variable: algemene indruk van effectiviteit.
• Uitkomst precies hetzelfde als met t-toets (Rosner: 5e editie, p. 644-645; 6e editie, p. 702-703) • Maar deze algemene methode gaat ook bij een 3x3 cross-over (en groter) Methodologie en Statistiek | Universiteit Maastricht
11
Cross-over: algemene methode (8) Geschatte varianties en gemiddelden: Estimates of Covariance Parametersa Parameter Residual ID Variance
Estimate 1,2952962 ,4748419
Std. Error ,2022913 ,2014733
a. Dependent Variable: algemene indruk van effectiviteit.
De geschatte waarde van de variantie σ2id is 0.475 en die van de error variantie σ2error is 1.295. Estimatesa
TREAT Placebo Motrin
Mean 3,310 4,024
Std. Error ,145 ,145
df 154,386 154,386
95% Confidence Interval Lower Bound Upper Bound 3,023 3,596 3,737 4,311
a. Dependent Variable: algemene indruk van effectiviteit.
Methodologie en Statistiek | Universiteit Maastricht
12
Cross-over: algemene methode (9) Paarsgewijze vergelijking van behandelingen: Pairwise Comparisons b
(I) TREAT Placebo Motrin
(J) TREAT Motrin Placebo
Mean Difference (I-J) -,714* ,714*
Std. Error ,176 ,176
a
df 82 82
Sig. ,000 ,000
95% Confidence Interval for a Difference Lower Bound Upper Bound -1,064 -,365 ,365 1,064
Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). b. Dependent Variable: algemene indruk van effectiviteit.
Resultaten identiek met eerdere analyse, maar deze methode - kan ook bij meer dan twee perioden - kan ook onvolledige data analyseren Methodologie en Statistiek | Universiteit Maastricht
13
Cross-over: onvolledige data Groep
Periode 1
Periode 2
Aantal
M–P
Motrin
Placebo
25
M–P
Motrin
-
17
P–M
Placebo
Motrin
21
P–M
Placebo
-
21
•
Slechts 46 van de 84 personen hebben volledige data; 38 kunnen alleen op de eerste periode vergeleken worden
•
Aangenomen dat het ontbreken niets te maken heeft met de uitkomsten Æ MIXED LINEAIR MODEL met ID als random factor is geldig
Methodologie en Statistiek | Universiteit Maastricht
14
Groeicurven: schoolmeisjes (1) Medium mother
150
150
150
140
140
140
130
110
100 5
6
7
8
AGE
9
10
11
HEIGHT
160
120
• • • • •
Tall mother
160
HEIGHT
Height
Short mother 160
130
130
120
120
110
110
100
100 5
6
7
8
9
10
11
5
6
AGE
7
8
9
10
11
AGE
Is groei gerelateerd aan lengte moeder? 1 kind per moeder! Bij benadering lineaire groei Meer verschil “tussen” dan “binnen” groepen Complete data & 5 vaste tijdstippen Methodologie en Statistiek | Universiteit Maastricht
15
Groeicurven: schoolmeisjes (2) Analyse-methoden: • Eenvoudige methoden: samenvattende maten – Gemiddelde lengte over jaren 6 t/m 10 – Regressiehelling per kind – Etc.
• Geavanceerde methoden: mixed lineair model – Random intercept model – Random slope model (valt buiten de stof) Methodologie en Statistiek | Universiteit Maastricht
16
Groeicurven: schoolmeisjes (3) Random intercept model: Veronderstel een lineair regressiemodel; voor de j-de meting per kind i (op tijdstip tj): Yij = α + β tj + eij ; eij ~ N(0,σ2error) Plaatjes tonen dat er verschillende intercepten en hellingen per groep zijn, dus Yij = α1 + β1 tj + eij in groep 1 Yij = α2 + β2 tj + eij in groep 2 Yij = α3 + β3 tj + eij in groep 3 Methodologie en Statistiek | Universiteit Maastricht
17
Groeicurven: schoolmeisjes (4) Random intercept model (2): Vorig model veronderstelt dat binnen een groep iedereen even groot is en even hard groeit, afgezien van random error. Aan de plaatjes te zien is dit niet goed Æ voeg random intercept ai (~ N(0, σ2child)) toe: Yij = α1 + ai + β1 tj + eij in groep 1 Yij = α2 + ai + β2 tj + eij in groep 2 Yij = α3 + ai + β3 tj + eij in groep 3 Random intercepten
Fixed hellingen
Methodologie en Statistiek | Universiteit Maastricht
18
Groeicurven: schoolmeisjes (5) Random intercept model (3): In SPSS is de parametrisering net iets anders:
Yij = µ + α1 + ai + (γ + β1) tj + eij in groep 1 Yij = µ + α2 + ai + (γ + β2) tj + eij in groep 2 Yij = µ + ai + γ tj + eij in groep 3 µ = gemiddelde intercept in groep 3 α1 = verschil in gemiddelde intercept tussen groep 1 en groep 3, α2 = verschil in gemiddelde intercept tussen groep 2 en groep 3, ai = random intercept, γ = gemiddelde helling in groep 3, β1 = verschil in gemiddelde helling tussen groep 1 en groep 3, β2 = verschil in gemiddelde helling tussen groep 2 en groep 3 Methodologie en Statistiek | Universiteit Maastricht
19
Groeicurven: schoolmeisjes (6) Analyse met SPSS: Type III Tests of Fixed Effects a Source Intercept GROUP AGE GROUP * AGE
Denominator df 37,895 37,895 77,000 77,000
Numerator df 1 2 1 2
F 9636,794 ,460 8385,152 21,661
Sig. ,000 ,635 ,000 ,000
Verschillende hellingen
a. Dependent Variable: HEIGHT.
Estimates of Covariance Parametersa Parameter Residual Intercept [subject = CHILD]
Variance
Estimate ,7695751 8,9603304
Std. Error ,1240283 3,1262588
a. Dependent Variable: HEIGHT.
Geschatte varianties: σ2child = 8,96 en σ2error = 0,77 Methodologie en Statistiek | Universiteit Maastricht
20
Groeicurven: schoolmeisjes (7) Geschatte waarden van de parameters Estimates of Fixed Effects b
Parameter Intercept [GROUP=1,00] [GROUP=2,00] [GROUP=3,00] AGE [GROUP=1,00] * AGE [GROUP=2,00] * AGE [GROUP=3,00] * AGE
Estimate 83,12286 -1,82286 -,1485714 0a 6,2485714 -,9785714 -,6814286 0a
Std. Error 1,4162085 2,0846025 2,0028213 0 ,1048519 ,1543379 ,1482830 0
df 37,895 37,895 37,895 . 77,000 77,000 77,000 .
t 58,694 -,874 -,074 . 59,594 -6,340 -4,595 .
Sig. ,000 ,387 ,941 . ,000 ,000 ,000 .
95% Confidence Interval Lower Bound Upper Bound 80,2556310 85,9900832 -6,0432997 2,3975854 -4,2034415 3,9062986 . . 6,0397845 6,4573583 -1,2858974 -,6712454 -,9766978 -,3861593 . .
a. This parameter is set to zero because it is redundant. b. Dependent Variable: HEIGHT.
Geschatte gemiddelden per groep: Groep 1: Y = 83,12 + (-1,82) + 6,25 Age – 0,98 Age Groep 2: Y = 83,12 + (-0,15) + 6,25 Age – 0,68 Age Groep 3: Y = 83,12 + 6,25 Age Methodologie en Statistiek | Universiteit Maastricht
21
Groeicurven: schoolmeisjes (8) Geschatte gemiddelde lengte per groep (small, medium, tall): Y = 81,30 + 5,27 Age Y = 82,97 + 5,57 Age Y = 83,12 + 6,25 Age
Geschatte intercepten hebben geen fysieke betekenis!
Methodologie en Statistiek | Universiteit Maastricht
22
Groeicurven: schoolmeisjes (9) Geschatte gemiddelde lengte van 6 t/m 10 jaar per groep: Estimates b
length of mother short medium tall
Mean 123,460a 127,511a 133,111a
Std. Error 1,232 1,141 1,141
df 17,000 17,000 17,000
95% Confidence Interval Lower Bound Upper Bound 120,860 126,060 125,104 129,919 130,704 135,519
a. Covariates appearing in the model are evaluated at the following values: AGE = 8,0000. b. Dependent Variable: HEIGHT. Pairwise Comparisons
(I) length of mother short medium tall
(J) length of mother medium tall short tall short medium
Mean Difference (I-J) -4,051* -9,651* 4,051* -5,600* 9,651* 5,600*
Std. Error 1,680 1,680 1,680 1,614 1,680 1,614
b
df 17,000 17,000 17,000 17,000 17,000 17,000
a
Sig. ,027 ,000 ,027 ,003 ,000 ,003
95% Confidence Interval for a Difference Lower Bound Upper Bound -7,595 -,508 -13,195 -6,108 ,508 7,595 -9,005 -2,195 6,108 13,195 2,195 9,005
Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). b. Dependent Variable: HEIGHT.
Methodologie en Statistiek | Universiteit Maastricht
23
Groeicurven: schoolmeisjes (10) Controle modelveronderstellingen: 1)
Lineariteit
2)
Normaal verdeelde errors en random effecten
3)
Met constante varianties
Residuenplot geeft informatie over deze veronderstellingen
Methodologie en Statistiek | Universiteit Maastricht
24
Groeicurven: schoolmeisjes (11) Medium mother
Tall mother 3
2,0
2,0
2
1,0
1,0
1
0,0
Residuals
3,0
Residuals
Residuals
Short mother 3,0
0,0
0
-1,0
-1,0
-1
-2,0
-2,0
-2
-3,0
-3,0 5
6
7
8
AGE
9
10
11
-3 5
6
7
8
9
10
AGE
11
5
6
7
8
9
10
11
AGE
• Residuen per kind gemiddeld nul • Er lijkt wat niet-lineariteit in te zitten: de groei neemt af • Residuen zijn groter voor dochters van lange moeders • Er zou ook een “random helling (slope) kunnen zijn. Methodologie en Statistiek | Universiteit Maastricht
25
Samenvatting • Cross-over design: mixed lineair model – Herschik data: een waarneming per regel – Persoonsidentificatie ID als random factor
• Groeicurve: mixed lineair model – Random intercept model: SUBJECT als random factor – Interpretatie coëfficiënten – Controle modelveronderstellingen Methodologie en Statistiek | Universiteit Maastricht
26
Volgende week: 28.03.2006 • GEEN college • WEL onderwijsgroepen – Bespreken pen en papier opgaven (onderwijsgroep 9) – Tijd om vragen te stellen over HELE STOF (inclusief OEFENTOETS 1 april 2005: www.stat.unimaas.nl) – Bestudeer dus de toetsstof en bereid vragen voor!!!
Methodologie en Statistiek | Universiteit Maastricht
27