introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets
week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 7: Inference for Distributions 7.1: Inference for the Mean of a Population 7.2: Comparing Two Means week 5: het toetsen van varianties: de F-toets week 6: het toetsen van tellingen: de χ2 -toets week 7: verdelingsvrije toetsen
Frank Busing, Universiteit Leiden 1 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
deze week: wat hebben we al geleerd? de one-sample z-toets verschillende alternatieve hypothese vormen: 1- (links of rechts) en 2-zijdig de relatie tussen toetsstatistiek en steekproevenverdeling van een statistiek de criterium waarde voor α (α = 0.05) de relatie tussen z en p tegenover z∗ en α kennis en begrip van het betrouwbaarheidsinterval de relatie tussen betrouwbaarheidsinterval en 2-zijdig toetsen
2 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
toetsen van gemiddelde een tekortkoming van de z-test is dat we de standaarddeviatie van de populatie σ moeten weten √ om de standaarddeviatie van de steekproevenverdeling σ/ n uit te rekenen echter, in de praktijk is σ meestal onbekend we kunnen dus geen z =
x−µ x−µ √ uitrekenen, maar wel t = √ σ/ n s/ n
we schatten de standaarddeviatie van de populatie σ met de standaarddeviatie van de steekproef s dus √ we schatten de standaarddeviatie van de steekproevenverdeling van x, σ/ n met de standaardfout voor het gemiddelde van de steekproef1 s SEx = √ n de standaardfout wordt doorgaans aangeduid met SE, afkorting voor standard error 3 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
t-verdeling familie √ het schatten van de standaarddeviatie van x met de standaardfout SEx = s/ n gaat beter voor een grotere n (denk aan de wet van de grote getallen) naarmate n groter wordt, wordt s een betrouwbaardere schatter van σ tot die tijd gebruiken we een andere steekproevenverdeling van x: de t-verdeling de t-verdeling is eigenlijk een hele familie van verdelingen elke lid van de familie wordt aangeduid met zijn vrijheidsgraden: df2 voor elke aantal vrijheidsgraden is er een aparte t-verdeling het aantal vrijheidsgraden hangt af van steekproefgrootte n
df = degrees of freedom 4 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
t-verdeling versus standaard normaal
t-verdeling is afhankelijk van het aantal vrijheidsgraden (df) door de dikkere staart (bij kleine df) is de t-toets convervatiever als df → ∞ dan t(df) → N(0, 1)
1 2 3
5 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
t-tabel
Table entry for p and C is the critical value t * with probability p lying to its right and probability C lying between − t * and t * .
Probability p
t*
TABLE D t distribution critical values Upper-tail probability df 1 2 3 4 5 6 7
p
.25
.20
.15
.10
.05
.025
.02
.01
1.000 0.816 0.765 0.741 0.727 0.718 0.711
1.376 1.061 0.978 0.941 0.920 0.906 0.896
1.963 1.386 1.250 1.190 1.156 1.134 1.119
3.078 1.886 1.638 1.533 1.476 1.440 1.415
6.314 2.920 2.353 2.132 2.015 1.943 1.895
12.71 4.303 3.182 2.776 2.571 2.447 2.365
15.89 4.849 3.482 2.999 2.757 2.612 2.517
31.82 6.965 4.541 3.747 3.365 3.143 2.998
.005 63.66 9.925 5.841 4.604 4.032 3.707 3.499
.0025 127.3 14.09 7.453 5.598 4.773 4.317 4.029
.001 318.3 22.33 10.21 7.173 5.893 5.208 4.785
.0005 636.6 31.60 12.92 8.610 6.869 5.959 5.408 6 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
t-tabel TABLE D t distribution critical values Upper-tail probability df 1 2 3 4 5 6 7 28 29 30 40 50 60 80 100 1000 z*
p
.25
.20
.15
.10
.05
.025
.02
.01
.005
.0025
1.000 0.816 0.765 0.741 0.727 0.718 0.711
1.376 1.061 0.978 0.941 0.920 0.906 0.896
1.963 1.386 1.250 1.190 1.156 1.134 1.119
3.078 1.886 1.638 1.533 1.476 1.440 1.415
6.314 2.920 2.353 2.132 2.015 1.943 1.895
12.71 4.303 3.182 2.776 2.571 2.447 2.365
15.89 4.849 3.482 2.999 2.757 2.612 2.517
31.82 6.965 4.541 3.747 3.365 3.143 2.998
63.66 9.925 5.841 4.604 4.032 3.707 3.499
127.3 14.09 7.453 5.598 4.773 4.317 4.029
318.3 22.33 10.21 7.173 5.893 5.208 4.785
636.6 31.60 12.92 8.610 6.869 5.959 5.408
0.683 0.683 0.683 0.681 0.679 0.679 0.678 0.677 0.675 0.674
0.855 0.854 0.854 0.851 0.849 0.848 0.846 0.845 0.842 0.841
1.056 1.055 1.055 1.050 1.047 1.045 1.043 1.042 1.037 1.036
1.313 1.311 1.310 1.303 1.299 1.296 1.292 1.290 1.282 1.282
1.701 1.699 1.697 1.684 1.676 1.671 1.664 1.660 1.646 1.645
2.048 2.045 2.042 2.021 2.009 2.000 1.990 1.984 1.962 1.960
2.154 2.150 2.147 2.123 2.109 2.099 2.088 2.081 2.056 2.054
2.467 2.462 2.457 2.423 2.403 2.390 2.374 2.364 2.330 2.326
2.763 2.756 2.750 2.704 2.678 2.660 2.639 2.626 2.581 2.576
3.047 3.038 3.030 2.971 2.937 2.915 2.887 2.871 2.813 2.807
3.408 3.396 3.385 3.307 3.261 3.232 3.195 3.174 3.098 3.091
3.674 3.659 3.646 3.551 3.496 3.460 3.416 3.390 3.300 3.291
50%
60%
70%
80%
90%
95%
96%
98%
99%
99.5%
.001
99.8%
.0005
99.9%
Confidence level C 7 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
de one-sample t-toets het toetsen van ´e´en gemiddelde met de t-toets andere steekproefgegevens: n = 10, x = 9.45 en s = 0.6996 stappenplan one-sample t-toets: 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : µ = 9 en Ha : µ 6= 9 t verdeeld met df √ = n − 1 = 10 − 1 = 9 t = (x − µ)/(s/ n) = (9.45 − 9)/0.2212 = 2.034 α = 0.05, df = 9, t∗ = 2.262 (kolom α = 0.025) t = 2.034 < 2.262 = t∗ en H0 wordt niet verworpen eekhoorns verzamelen evenveel voedsel na onthouding
merk op dat deze tweezijdige toetsing H0 niet verwerpt maar dat een ´e´enzijdige toetsing dat wel gedaan zou hebben want t∗ = 1.833 voor α = 0.05 en t = 2.034 ligt verder van nul
8 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: one-sample t-test results One-Sample Statistics N grams
Mean 9.450
10
Std. Error Mean .2212
Std. Deviation .6996
0.6996/√10
One-Sample Test Test Value = 9
grams
t 2.034
df 9
Sig. (2-tailed) .072
Mean Difference .4500
95% Confidence Interval of the Difference Lower -.050
Upper .950
(9.450-9)/0.2212 “Gemiddeld genomen verzamelen uitgehongerde eekhoorns (M=9.45, SE=.2212) niet meer of minder dan 9 gram voedsel, t(9) = 2.034, p = .072.”
9 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
conclusie one-sample t-toets de one-sample t-toets is gelijk aan de one-sample z-toets behalve dat de standaarddeviatie van de populatie σ geschat wordt met de standaarddeviatie van de steekproef s √ en de standaarddeviatie van de steekproevenverdeling van x met SEx = s/ n en dat daardoor de standaard normaal verdeling N(0, 1) vervangen wordt door de t-verdeling t(df)
10 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
voorbeeld
– – – –
we verzamelen 12 proefpersonen met extreme angst voor spinnen elke proefpersoon krijgt een echte spin te zien en dezelfde spin op een foto we meten de angst van de proefpersoon na elke spin (twee momenten) de onderzoeker verwacht meer angst voor de echte spin dan voor de foto ervan3
uit: William Wallace Denslow (1902). Denslow’s Mother Goose. 11 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
verschilscores twee afhankelijke observaties kunnen worden verkregen 1
per paar, gepaard op bepaalde eigenschappen bijvoorbeeld: medicijn met controle op sexe en leeftijd
2
per persoon, gemeten op verschillende momenten bijvoorbeeld: vooruitgang studenten bij toetsende statistiek
in het spinnen-angst-voorbeeld zijn twee gepaarde observaties: de foto- en de echte spinnenangst van ´e´en en dezelfde proefpersoon het verschil tussen de twee metingen wordt getoetst er wordt dus eerst een verschilscore bepaald: di = xi1 − xi2 (echt - foto) vervolgens wordt er een one-sample t-toets uitgevoerd op de verschilscores d de µ onder H0 is (meestal) nul, dus H0 : µ = µ1 − µ2 = 0 ofwel H0 : µ1 = µ2
12 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
de t-toets voor afhankelijke steekproeven het toetsen van twee gemiddelden uit twee afhankelijk steekproeven steekproefgegevens: n = 12, d = 7.0 en s = 9.807 stappenplan paired-samples t-toets:4 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : µ = 0 en Ha : µ > 0 t verdeeld met df = n − 1 = 11 √ t = d/(s/ n) = 7.0/(9.807/3.464) = 2.473 α = 0.05, df = 11, t∗ = 2.201 t = 2.473 > 2.201 = t∗ en H0 wordt verworpen er is een verschil: een echte spin geeft meer angst dan een foto ervan
paired-samples t-toets = dependent-samples t-toets 13 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: one-sample t-test results One-Sample Statistics N diff
12
Mean 7.0000
Std. Deviation 9.80723
One-Sample Test
Std. Error Mean 2.83110
9.80723/√12
Test Value = 0
diff
t 2.47
df 11
Sig. (2tailed) .031
Mean Difference 7.00000
95% Confidence Interval of the Difference Lower Upper .7688 13.2312
(7.0000-0)/2.83110 merk op dat SPSS de p-waarde geeft voor tweezijdige toetsing: Sig. (2-tailed) voor ´e´enzijdige toetsing deel je deze waarde door 2: 0.031/2 = 0.015 14 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: paired-samples t-test results Paired Samples Statistics
Pair 1
real picture
Mean 47.00 40.00
N 12 12
Std. Deviation 11.02889 9.293
Std. Error Mean 3.18377 2.683
Paired Samples Test Paired Differences
Pair 1
real - picture
Mean 7.00000
Std. Error Mean 2.83110
Std. Deviation 9.80723
95% Confidence Interval of the Difference Lower .76878
9.80723/√12
Upper 13.23
t 2.473
df 11
Sig. (2tailed) .031
(47.00-40.00)/2.83110
“Gemiddeld genomen ervaren proefpersonen significant meer angst voor echte spinnen (M = 47.00, SE = 3.18) dan voor foto’s van spinnen (M = 40.00, SE = 2.68), t(11) = 2.473, p = .015.”
15 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
twee onafhankelijke steekproeven twee situaties waarin twee onafhankelijke steekproeven ontstaan: 1
vanuit 1 populatie (bijvoorbeeld de studenten populatie): verzamel een aantal proefpersonen verdeel de proefpersonen at random over twee groepen geef elke groep zijn eigen interventie meet het gemiddelde voor elke groep toets het verschil in gemiddelden
2
vanuit 2 populaties (bijvoorbeeld een mannen en vrouwen populatie): trek twee random steekproeven, ´e´en uit elke populatie meet het gemiddelde voor elke groep toets het verschil in gemiddelden
16 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
two-samples t-toets de toetsstatistiek voor 2 onafhankelijke steekproeven is t-toetsstatistiek t=
x1 − x2 − (µ1 − µ2 ) standaardfout
het verschil tussen de steekproefgemiddelden x1 − x2 wordt vergeleken met het te verwachten verschil tussen de populatiegemiddelden µ1 − µ2 onder H0 de nul hypothese is meestal H0 : µ1 = µ2 , zodat (µ1 − µ2 ) wegvalt de standaardfout is een verhaal apart
17 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
standaardfout indien σ1 6= σ2 als σ1 en σ2 niet ongeveer gelijk zijn (vuistregel: σ1 6= σ2 als s1 en s2 meer dan factor 2 van elkaar verschillen) dan is de standaardfout van de steekproevenverdeling van x1 − x2 standaardfout indien σ1 6= σ2 s s22 s21 SEx1 −x2 = + n1 n2 begrip: de variantie van het verschil 1 2 3
tussen 2 observaties is σ21 plus σ22 tussen de som van n1 plus n2 observaties is n1 σ21 plus n2 σ22 tussen de gemiddelden is dan σ21 /n1 plus σ22 /n2
het aantal vrijheidsgraden is hier (conservatief) df = min(n1 − 1, n2 − 1) dus de kleinste waarde van n1 − 1 en n2 − 16 SPSS berekent het aantal vrijheidsgraden iets nauwkeuriger (zie MM&C, p.441) 18 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
standaardfout indien σ1 = σ2 als σ1 en σ2 gelijk zijn dan is de t-verdeling exact er is dan een gecombineerde schatter (pooled estimator) voor de variantie pooled variance estimator s2p
(n1 − 1)s21 + (n2 − 1)s22 = n1 + n2 − 2
de standaardfout van de steekproevenverdeling van x1 − x2 is nu standaardfout indien σ1 = σ2 s r s2p s2p 1 1 + = sp + SEx1 −x2 = n1 n2 n 1 n2 het aantal vrijheidsgraden is hier df = n1 + n2 − 2
19 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
de t-toets voor onafhankelijke steekproeven het toetsen van twee gemiddelden uit twee onafhankelijk steekproeven steekproefgegevens: n1 = 12, x1 = 47, s1 = 11.029 n2 = 12, x2 = 40, s2 = 9.293 aanname σ1 = 6 σ2 geeft p SEx1 −x2 = 11.0292 /12 + 9.2932 /12 = 4.163
stappenplan independent-samples t-toets voor σ1 6= σ2 : 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : µ1 = µ2 en Ha : µ1 > µ2 t verdeeld met df = 12 − 1 = 11 t = (x1 − x2 )/SE = (47 − 40)/4.163 = 1.681 α = 0.05, df = 11, t∗ = 1.796 t = 1.681 < 1.796 = t∗ en H0 wordt niet verworpen geen verschil tussen echte en foto spinnenangst
20 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
de t-toets voor onafhankelijke steekproeven het toetsen van twee gemiddelden uit twee onafhankelijk steekproeven steekproefgegevens: n1 = 12, x1 = 47, s1 = 11.029 n2 = 12, x2 = 40, s2 = 9.293 aanname σ1 = σ2 geeft s2p = (11 × 11.0292 + 11 × 9.2932 )/22 = 104 p √ SEx1 −x2 = 104 1/12 + 1/12 = 4.163
stappenplan independent-samples t-toets voor σ1 = σ2 : 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : µ1 = µ2 en Ha : µ1 > µ2 t verdeeld met df = 12 + 12 − 2 = 22 t = (x1 − x2 )/SE = (47 − 40)/4.163 = 1.681 α = 0.05, df = 22, t∗ = 1.717 t = 1.681 < 1.717 = t∗ en H0 wordt niet verworpen geen verschil tussen echte en foto spinnenangst 21 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: independent-samples t-test results Group Statistics
anxiety
group real picture
N 12 12
Mean 47.00 40.00
Std. Error Mean 3.184 2.683
Std. Deviation 11.029 9.293
Independent Samples Test Levene's Test for Equality of Variances
anxiety
Equal variances assumed Equal variances not assumed
F .782
Sig. .386
2 2 √(11.029 /12+9.293 /12)
t-test for Equality of Means
t 1.681
df 22
Sig. (2tailed) .107
Mean Difference 7.000
Std. Error Difference 4.163
1.681
21.39
.107
7.000
4.163
95% Confidence Interval of the Difference Lower -1.634
Upper 15.634
-1.649
15.649
(47.00-40.00)/4.163 “Gemiddeld genomen ervaren proefpersonen meer angst voor echte spinnen (M = 47.00, SE = 3.18) dan voor foto’s van spinnen (M = 40.00, SE = 2.68). Dit verschil was niet significant t(22) = 1.681, p = .0535.”
22 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
between- versus within-subject designs kies voor within-subjects designs (dependent samples of paired-samples) 1
2
de individuele variabiliteit is verwijderd uit de standaardfout (kleinere s) dus meer power er zijn minder proefpersonen nodig (maar wel wat langer)
kies voor between-subjects designs (independent samples) 1 2
geen order effects (geen counterbalancing nodig) geen carry-over effect (geen tussentijd nodig)
23 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
afhankelijke versus onafhankelijke t-toets vergelijking van de twee two-samples t-toetsen op dezelfde gegevens afhankelijke steekproef (paired-samples t-toets) 1 hypothese H0 : µ = 0 en Ha : µ > 0 2 steekproevenverdeling t verdeeld met df = n − 1 = 11 √ 3 toetsingsgrootheid t = d/(s/ n) = 7.0/2.831 = 2.473 4 verwerpingsgebied α = 0.05, df = 11, t∗ = 2.201 5 statistische conclusie t = 2.473 > 2.201 = t∗ en H0 wordt wel verworpen 6 inhoudelijke conclusie wel verschil tussen echte en foto spinnenangst onafhankelijke steekproef (independent samples t-toets) 1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2 2 steekproevenverdeling t verdeeld met df = 12 + 12 − 2 = 22 3 toetsingsgrootheid t = (x1 − x2 )/SE = 7.0/4.163 = 1.681 4 verwerpingsgebied α = 0.05, df = 22, t∗ = 1.717 5 statistische conclusie t = 1.681 < 1.717 = t∗ en H0 wordt niet verworpen 6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst een dependent-samples t-toets heeft meer power door een kleinere standaardfout 24 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
samenvatting: de t-toets 1 2
√ one-sample t-toets: t = (x − µ)/(s/ n) two-samples t-toets: 1 2
√ dependent samples t-toets: t = d/(s/ n), waarbij d = x1 − x2 independent samples t-toets: p 1 unequal variances: t = (x1 − x2 )/ s21 /n1 + s22 /n2 q 2 equal variances: t = (x1 − x2 )/ s2p /n1 + s2p /n2
25 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
vorige week een betrouwbaarheidsinterval zegt iets over de nauwkeurigheid van een schatting we schatten het populatiegemiddelde met het steekproefgemiddelde (natuurlijk) is deze schatting niet altijd precies goed, maar beter wanneer de spreiding in de populatie kleiner is de steekproef groter is het betrouwbaarheidsniveau wordt aangegeven met C een betrouwbaarheidsniveau van C = 0.95 geeft 95% zekerheid dat het gemiddelde van de populatie in het interval ligt een betrouwbaarheidsniveau van C = 0.50 geeft 50% zekerheid dat het gemiddelde van de populatie in het interval ligt: dit zal een veel kleiner interval zijn bij herhaald steekproef trekken ligt µ in 100C% van de gevallen in het interval we zijn bij ´ e´ en interval dus 100C% zeker dat µ in het interval ligt 26 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
one-sample betrouwbaarheidsinterval voor µ betrouwbaarheidinterval indien σ bekend
√ betrouwbaarheidsinterval = puntschatting ± foutenmarge = x ± z∗ σ/ n x is het gemiddelde van de steekproef, de schatting van µ z∗ wordt bepaald door het betrouwbaarheidsniveau C √ σ/ n is de spreiding van de steekproevenverdeling
echter, in de praktijk is σ meestal onbekend we schatten de standaarddeviatie van de populatie σ met de standaarddeviatie van de steekproef s betrouwbaarheidinterval indien σ onbekend
√ betrouwbaarheidsinterval = puntschatting ± foutenmarge = x ± t∗ s/ n
er zijn nu een aantal varianten mogelijk . . . 27 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
overzicht betrouwbaarheidsintervallen betrouwbaarheidsinterval = puntschatting ± foutenmarge puntschatting one sample two samples
x x1 − x2
“betrouwbaarheidsniveau” one sample σ bekend σ onbekend standaardfout
z t∗ (n − 1) ∗
two samples σ1 6= σ2 z∗ t∗ (min(n1 − 1, n2 − 1))
σ1 = σ2 z∗ t∗ (n1 + n2 − 2)
one sample
two samples σ σ p1 6= σ2 p1 = σ2 √ σ bekend σ/ n σ21 /n1 + σ22 /n2 qσ21 /n1 + σ22 /n2 p √ σ onbekend s/ n s21 /n1 + s22 /n2 s2p /n1 + s2p /n2 waarbij s2p = (n1 − 1)s21 + (n2 − 1)s22 /(n1 + n2 − 2)
28 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
voorbeeld wat is het 95% betrouwbaarheidsinterval voor µ van onze nieuwe uitgehongerde eekhoorns? steekproefgegevens: n = 10, x = 9.45 en s = 0.6996
1 2 3
er is slechts ´e´en steekproef σ is niet bekend betrouwbaarheidsniveau C = 0.95 → t∗ = 2.262 (α/2 = 0.025, df = 9)
0.6996 s = 9.45 ± 0.5004 CIµ = x ± t∗ × √ = 9.45 ± 2.262 × √ n 10 het 95% betrouwbaarheidsinterval voor µ is [8.95, 9.95]
29 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: voorbeeld het 95% betrouwbaarheidsinterval voor µ is [8.95, 9.95] 0.6996 s CIµ = x ± t∗ × √ = 9.45 ± 2.262 × √ = 9.45 ± 0.5004 n 10 SPSS bepaalt in deze gevallen het betrouwbaarheidsinterval voor µ min testwaarde s 0.6996 CIµ−9.0 = (x − 9.0) ± t∗ × √ = (9.45 − 9.0) ± 2.262 × √ = 0.45 ± 0.5004 n 10 het 95% betrouwbaarheidsinterval voor µ − 9.0 is [−0.05, 0.95]
30 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: one-sample CI results CIµ−9.0 = (9.45−9.0)±2.262×0.2212 = 0.45±0.5004 → [−0.05, 0.95] One-Sample Statistics N grams
Mean 9.450
10
Std. Error Mean .2212
Std. Deviation .6996 One-Sample Test
Test Value = 9
grams
t 2.034
df 9
Sig. (2-tailed) .072
Mean Difference .4500
9.45-9.0
95% Confidence Interval of the Difference Lower -.050
Upper .950
0.45 + 2.262 x 0.2212
31 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
voorbeeld wat is het 95% betrouwbaarheidsinterval voor µ1 − µ2 van de foto- en echte angst voor spinnen? steekproefgegevens: n1 = 12, x1 = 47, s1 = 11.029 n2 = 12, x2 = 40, s2 = 9.293 1 er zijn twee steekproeven 2 σ is niet bekend 3 s1 ≈ s2 → s2p = (n1 − 1)s21 + (n2 − 1)s22 /(n1 + n2 − 2) = 103.999 4
betrouwbaarheidsniveau C = 0.95 → t∗ = 2.074 (α/2 = 0.025, df = 22)
CIµ1 −µ2
q = (x1 − x2 ) ± t × s2p /n1 + s2p /n2 p = (47 − 40) ± 2.074 × 103.999/12 + 103.999/12 = 7 ± 8.634 ∗
het 95% betrouwbaarheidsinterval voor µ1 − µ2 is [−1.634, 15.634]
32 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
SPSS: independent-samples CI results CIµ1 −µ2 = (47 − 40) ± 2.074 × 4.163 = 7 ± 8.634 → [−1.634, 15.634] Group Statistics
anxiety
group real picture
N 12 12
Mean 47.00 40.00
Std. Error Mean 3.184 2.683
Std. Deviation 11.029 9.293
7.000-2.074 x 4.163
Independent Samples Test Levene's Test for Equality of Variances
anxiety
Equal variances assumed Equal variances not assumed
F .782
Sig. .386
t-test for Equality of Means
t 1.681
df 22
Sig. (2tailed) .107
Mean Difference 7.000
Std. Error Difference 4.163
1.681
21.39
.107
7.000
4.163
95% Confidence Interval of the Difference Lower -1.634
Upper 15.634
-1.649
15.649
47.00-40.00 nul ligt in het interval. wat betekent dat? 33 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
aannamen √ we schatten de standaarddeviatie van x met de standaardfout SEx = s/ n naarmate n groter wordt, wordt s een betere schatter van σ (ongeacht verdeling) maar hoe groot is groot genoeg? 1
de steekproef komt uit een populatie met een normale verdeling t is t∗ -verdeeld met df = n − 1 bij gelijke n is 2 keer 5 observaties al voldoende
2
de steekproef komt uit een populatie zonder normale verdeling n < 15: probleem n > 15: symmetrisch en geen uitbijters: t bij benadering t∗ -verdeeld n > 40: t bij benadering t∗ -verdeeld n groot: t bij benadering normaal verdeeld
conclusie: controleer n en de verdeling van de (verschil)scores (per groep)
34 / 36
introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
deze week: wat hebben we geleerd? de one-sample t-toets de two-samples t-toets voor on- en afhankelijke steekproeven het verschil tussen een t-toets voor on- en afhankelijke steekproeven het begrip gepoolde variantie de verschillende standaardfouten voor de independent samples t-toets betrouwbaarheidsinterval voor one- en two-samples z- en t-toets aannamen voor de t-toets
35 / 36 introductie
one-sample t-toets
dependent-samples t-toets
pauze
independent-samples t-toets
betrouwbaarheid
ten slotte
deze week: wat moeten we nog leren? het uitvoeren en beoordelen van een one-sample t-toets het uitvoeren en beoordelen van een two-samples t-toets voor zowel afhankelijke als onafhankelijke steekproeven het uitvoeren en beoordelen van een two-samples z-toets het bepalen en beoordelen van een one-sample betrouwbaarheidsinterval en een two-samples betrouwbaarheidsinterval voor bekende en onbekende σ
36 / 36