χ2 -toets voor onafhankelijkheid
introductie
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
toetsende statistiek week week week week week
1: 2: 3: 4: 5:
kansen en random variabelen de steekproevenverdeling schatten en toetsen: de z-toets het toetsen van gemiddelden: de t-toets het toetsen van varianties: de F-toets
week 6: het toetsen van tellingen: de χ2 -toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 9: Analysis of Two-Way Tables 9.1: Inference for Two-Way Tables 9.2: Formulas and Models for Two-Way Tables 9.3: Goodness of Fit week 7: verdelingsvrije toetsen
Frank Busing, Universiteit Leiden 1 / 38 introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
deze week: wat hebben we al geleerd? kennis en begrip van de 5 kansregels kennis en begrip van marginale –, gezamelijke – en conditionele kans kennis en begrip van onafhankelijkheid toelichting
columns totaal 1 2 1
gezamelijke kans: P(A en B)
2
marginale kansen: P(A) en P(B)
rows totaal
conditionele kansen: P(A|B) en P(B|A)
2 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
voorbeeld
– – – –
een onderzoeker kijkt naar de relatie tussen geslacht en geloof in astrologie hij neemt ´e´en grote steekproef van eerstejaars psychologie studenten de onderzoeker bepaalt vervolgens het geslacht en het geloof in astrologie vraag: is er een relatie tussen geslacht en geloof in de studentenpopulatie?
3 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toets voor onafhankelijkheid een chi-kwadraat toets (χ2 ) voor onafhankelijkheid wordt gebruikt om te bepalen of twee variabelen gerelateerd zijn de gegevens zijn afkomstig van ´ e´ en populatie het meetniveau van de twee variabelen is categorisch (nominaal of ordinaal) ´e´en populatie: eerstejaars psychologie studenten twee variabelen: geslacht en geloof in astrologie elke proefpersoon valt in ´e´en en slechts ´e´en categorie waarnemingen zijn onafhankelijk van elkaar de nul hypothese verwacht geen relatie tussen de twee variabelen de nul hypothese verwacht dat de variabelen onafhankelijk zijn de χ2 -toets beoordeelt het verschil tussen geobserveerde (fo ) en verwachte frequenties (fe )
4 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -toetsstatistiek χ2 -toetsstatistiek 2
χ =
X (fo − fe )2 fe
χ2 is de som over gestandaardiseerde gekwadrateerde residuen als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijn dan is de toetsstatistiek ongeveer gelijk aan nul de geobserveerde frequenties hebben we geobserveerd, gemeten, geteld de verwachte frequenties (onder H0 ) kunnen we bepalen met behulp van kansen
5 / 38 introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
herhaling: de productregel regel 5: productregel (voor onafhankelijke gebeurtenissen) P(A en B) = P(A) × P(B) voor onafhankelijke gebeurtenissen is de gezamelijke kans het produkt van twee marginale kansen voorbeeld de kans op een vrouw die gelooft in astrologie is dan gelijk aan de kans op geloof in astrologie (A) maal de kans op een vrouw (B)
6 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
verwachte celfrequenties bij onafhankelijkheid (H0 ) geobserveerde frequenties vrouw man totaal geloof 69 16 85 neutraal 90 28 118 ongeloof 242 118 360 totaal 401 162 563 als we verwachten, onder H0 , dat de aanname van onafhankelijkheid geldt dan Pe (A en B) = P(A) × P(B) fe (A en B) f(A) f(B) = × n n n f(A) × f(B) fe (A en B) = n in woorden: de verwachte celfrequentie bij onafhankelijkheid is het product van de marginale frequenties gedeeld door het totaal aantal 7 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
verwachte celfrequenties bij onafhankelijkheid (H0 ) geobserveerde frequenties vrouw man totaal geloof 6969 16 8585 neutraal 90 28 118 ongeloof 242 118118 360360 totaal 401401 162162 563 bijvoorbeeld f(A) × f(B) n f(geloof) × f(vrouw) 85 × 401 = 60.54 fe (geloof en vrouw) = = n 563 f(ongeloof) × f(man) 360 × 162 fe (ongeloof en man) = = = 103.54 n 563 etc. fe (A en B) =
8 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toetsstatistiek geobserveerde frequenties vrouw man totaal geloof 69 16 85 neutraal 90 28 118 ongeloof 242 118 360 totaal 401 162 563
verwachte frequenties vrouw man totaal 60.54 24.46 85 84.05 33.95 118 256.46 103.54 360 401 162 563
aannamen 1 voor elke cel fe > 1: geen deling door nul χ2 -toets voor onafhankelijkheid: voor elke cel fe > 5
2
9 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toetsstatistiek geobserveerde frequenties vrouw man totaal geloof 69 16 85 neutraal 90 28 118 ongeloof 242 118 360 totaal 401 162 563 2
χ =
verwachte frequenties vrouw man totaal 60.54 24.46 85 84.05 33.95 118 256.46 103.54 360 401 162 563
X (fo − fe )2
fe (118 − 103.54)2 (69 − 60.54)2 (90 − 84.05)2 = + + ... + 60.54 84.05 103.54 = 8.388
de steekproevenverdeling van χ2 heet de χ2 -verdeling net als de t- en F-verdeling betreft het hier een hele familie van verdelingen afhankelijk van het aantal vrijheidsgraden: χ2 (df) 10 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -verdeling
Probability p
( χ 2)* 1 2 3 4
(χ2 )∗ is altijd positief χ2 -verdeling is scheef naar rechts de piek ligt in de buurt van het aantal vrijheidsgraden bij een groot aantal vrijheidsgraden is χ2 normaal verdeeld 11 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -tabel
Probability p
Table entry for p is the critical value ( χ 2 )* with probability p lying to its right.
( χ 2)*
TABLE F χ2 distribution critical values Tail probability df 1 2 3 4 5
.25 1.32 2.77 4.11 5.39 6.63
.20
.15
.10
1.64 3.22 4.64 5.99 7.29
2.07 3.79 5.32 6.74 8.12
2.71 4.61 6.25 7.78 9.24
p
.05
.025
.02
.01
.005
.0025
.001
.0005
3.84 5.99 7.81 9.49 11.07
5.02 7.38 9.35 11.14 12.83
5.41 7.82 9.84 11.67 13.39
6.63 9.21 11.34 13.28 15.09
7.88 10.60 12.84 14.86 16.75
9.14 11.98 14.32 16.42 18.39
10.83 13.82 16.27 18.47 20.51
12.12 15.20 17.73 20.00 22.11
1
nb. χ2 (df = 1) = z2 12 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
vrijheidsgraden voor de r × c tabel geobserveerde frequenties vrouw man totaal geloof 69 85 neutraal 90 118 ongeloof 360 totaal 401 162 563 het aantal vrijheidsgraden is df = (r − 1) × (c − 1) ga maar na: gegeven de marginalen, hoeveel cellen kunnen er vrij ingevuld worden?
stel: α = 0.05 wat is dan de grenswaarde (χ2 )∗ ? 13 / 38 introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -tabel: grenswaarde (χ2 )∗
Probability p
Table entry for p is the critical value ( χ 2 )* with probability p lying to its right.
( χ 2)*
TABLE F χ2 distribution critical values Tail probability df 1 2 3 4 5
.25 1.32 2.77 4.11 5.39 6.63
.20
.15
.10
1.64 3.22 4.64 5.99 7.29
2.07 3.79 5.32 6.74 8.12
2.71 4.61 6.25 7.78 9.24
p
.05
.025
.02
.01
.005
.0025
.001
.0005
3.84 5.99 7.81 9.49 11.07
5.02 7.38 9.35 11.14 12.83
5.41 7.82 9.84 11.67 13.39
6.63 9.21 11.34 13.28 15.09
7.88 10.60 12.84 14.86 16.75
9.14 11.98 14.32 16.42 18.39
10.83 13.82 16.27 18.47 20.51
12.12 15.20 17.73 20.00 22.11
14 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toets voor onafhankelijkheid toets een relatie tussen variabelen met de χ2 -toets voor onafhankelijkheid steekproefgegevens: r = 3, c = 2, χ2 = 8.388 stappenplan χ2 -toets voor onafhankelijkheid:2 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : fo = fe en Ha : fo 6= fe χ2 verdeeld met df = (r − 1)(c − 1) = 2 χ2 = 8.388 df = 2, α = 0.05, (χ2 )∗ = 5.99 χ2 = 8.388 > 5.99 = (χ2 )∗ en H0 wordt verworpen geloof in astrologie en geslacht zijn afhankelijk in de studentenpopulatie
let op: bij grote n (grote power) is χ2 altijd significant 15 / 38 introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -tabel: p-waarde TABLE F χ2 distribution critical values Tail probability df
.25
1 2 3 4 5
1 2 3 4
1.32 2.77 4.11 5.39 6.63
.20
.15
.10
1.64 3.22 4.64 5.99 7.29
2.07 3.79 5.32 6.74 8.12
2.71 4.61 6.25 7.78 9.24
p
.05
.025
.02
.01
.005
.0025
.001
.0005
3.84 5.99 7.81 9.49 11.07
5.02 7.38 9.35 11.14 12.83
5.41 7.82 9.84 11.67 13.39
6.63 9.21 11.34 13.28 15.09
7.88 10.60 12.84 14.86 16.75
9.14 11.98 14.32 16.42 18.39
10.83 13.82 16.27 18.47 20.51
12.12 15.20 17.73 20.00 22.11
rij, aantal vrijheidsgraden df = 2 χ2 = 8.388 ligt tussen 7.82 en 9.21 p-waarde ligt tussen 0.01 en 0.02 conclusie: p < 0.05, H0 wordt verworpen
merk op dat de grenzen waartussen de p-waarde ligt niet verdubbeld worden: deze χ2 -tabel geeft direct en uitsluitend de tweezijdige p-waarden 16 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
SPSS: crosstabs χ2 -test results Chi-Square Tests
Pearson Chi-Square Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association
Value a 8.388 8.734 8.406 b 8.200
N of Valid Cases
df 2 2
Asymp. Sig. (2-sided) .015 .013
1
.004
Exact Sig. (2-sided) .015 .013 .015 .005
Exact Sig. (1-sided)
Point Probability
.002
.001
563
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 24.46. b. The standardized statistic is 2.864.
“Het geloof in astrologie is afhankelijk van het geslacht van de student, χ2 = 8.388, df = 2, p = .015.”
gebruik de Fisher’s exact test in plaats van de asymptotische χ2 benadering de Fisher’s exact test is met name geschikt voor kleine steekproeven 17 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
voorbeeld
– – – – – –
een onderzoeker vraagt zich af of we dieren kunnen laten line-dansen hij verzamelt 200 katten en verdeelt ze random over twee groepen hij beloont de ene groep met voedsel voor line-dans-achtig gedrag de andere groep wordt beloond met affectie aan het einde van de periode telt hij hoeveel katten konden line-dansen vraag: is er een relatie tussen line-dansen en het soort beloning? 18 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toets voor homogeniteit een chi-kwadraat toets (χ2 ) voor homogeniteit4 wordt gebruikt om te bepalen of twee of meer populaties gelijk verdeeld zijn op ´e´en variabele de gegevens zijn afkomstig van twee of meer populaties het meetniveau van de variabele is categorisch (nominaal of ordinaal) twee populaties: voedsel en affectie beloonde katten ´e´en variabele: line-dansen elke proefpersoon valt in ´e´en en slechts ´e´en categorie waarnemingen zijn onafhankelijk van elkaar de nul hypothese verwacht gelijke proporties of gelijke verdelingen de χ2 -toets beoordeelt het verschil tussen geobserveerde (fo ) en verwachte frequenties (fe ) de χ2 -verdeling heeft df = (r − 1) × (c − 1) vrijheidsgraden χ2 -toets voor homogeniteit of homogeniteit van verdelingen of homogeniteit van populaties 19 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
onafhankelijkheid versus homogeniteit χ2 -toets voor onafhankelijkheid 1 2 3 4 5
´e´en populatie: studenten twee variabelen: geslacht en geloof H0 : geslacht en geloof zijn onafhankelijk in de populatie van studenten geen onderscheid tussen verklarende en respons variabele omvang van de steekproef (n) staat vast
χ2 -toets voor homogeniteit 1 2
twee of meer populaties: mannelijke en vrouwelijke studenten ´e´en variabele: geloof
3
H0 : geloof is gelijk verdeeld in alle populaties
4
onderscheid tussen verklarende (geslacht) en respons variabele (geloof) marginalen van de verklarende variabele staan vast (maar niet per se gelijk)
5
conclusie: het onderzoeksontwerp bepaalt welke toets passend is5 echter: de verwachte frequenties worden voor beide toetsen op gelijke wijze bepaald 20 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -toetsstatistiek χ2 -toetsstatistiek 2
χ =
X (fo − fe )2 fe
χ2 is de som over gestandaardiseerde gekwadrateerde residuen als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijn dan is de toetsstatistiek ongeveer gelijk aan nul de geobserveerde frequenties hebben we geobserveerd, gemeten, geteld de verwachte frequenties (onder H0 ) kunnen we bepalen met behulp van kansen
21 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 onder H0 , bij gelijke verdelingen, geldt dat 1
de conditionele kansen gelijk zijn voor alle condities (28/38 = 48/162 en 10/38 = 114/162)
2
de conditionele kansen gelijk zijn aan de marginale kansen (28/38 = 48/162 = 76/200 en 10/38 = 114/162 = 124/200)
6
zie slides TS week 1 22 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 als we verwachten dat de conditionele gelijk zijn aan de marginale kansen dan Pe (A|B) = P(A) f(A) fe (A en B) = f(B) n f(A) × f(B) fe (A en B) = n in woorden: de verwachte celfrequentie bij homogeniteit is het product van de marginale frequenties gedeeld door het totaal aantal7 verwachte celfrequentie bij homogeniteit = verwachte celfrequentie bij onafhankelijkheid 23 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 bijvoorbeeld f(A) × f(B) n 76 × 38 f(line-dansen) × f(voedsel) = fe (line-dansen en voedsel) = = 14.44 n 200 etc. fe (A en B) =
24 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200
verwachte frequenties voedsel affectie totaal 14.44 61.56 76 23.56 100.44 124 38 162 200
aannamen voor elke cel fe > 1: geen deling door nul gemiddelde fe > 5
1 2
25 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toetsstatistiek geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 2
χ =
verwachte frequenties voedsel affectie totaal 14.44 61.56 76 23.56 100.44 124 38 162 200
X (fo − fe )2
fe (28 − 14.44)2 (48 − 61.56)2 (10 − 23.56)2 (114 − 100.44)2 = + + + 14.44 61.56 23.56 100.44 = 25.35
26 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toets voor homogeniteit het vergelijken van frequentieverdelingen met de χ2 -toets voor homogeniteit steekproefgegevens: r = 2, c = 2, χ2 = 25.35 stappenplan χ2 -toets voor homogeniteit: 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : fo = fe en Ha : fo 6= fe χ2 verdeeld met df = (r − 1)(c − 1) = 1 χ2 = 25.35 df = 1, α = 0.05, (χ2 )∗ = 3.84 χ2 = 25.35 > 3.84 = (χ2 )∗ en H0 wordt verworpen de verdelingen voor katten beloond met voedsel en met affectie zijn niet aan elkaar gelijk
27 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
SPSS: crosstabs cell results linedance * beloning Crosstabulation beloning linedance
ja nee
Total
Count Expected Count Count Expected Count Count Expected Count
voedsel 28 14.4 10 23.6 38 38.0
affectie 48 61.6 114 100.4 162 162.0
Total 76 76.0 124 124.0 200 200.0
28 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
SPSS: crosstabs χ2 -test results Chi-Square Tests Value a 25.356 23.520 24.932
Pearson Chi-Square b Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association
25.229
N of Valid Cases
1 1 1
Asymp. Sig. (2-sided) .000 .000 .000
1
.000
df
Exact Sig. (2sided)
Exact Sig. (1sided)
.000
.000
200
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 14.44. b. Computed only for a 2x2 table
“De verdeling van line-dansen is anders voor de verschillende soorten beloning die katten krijgen ter aanmoediging, χ2 = 25.35, df = 1, p < .000.”
29 / 38 introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
Pearsons r versus Pearsons χ2 voor een 2 × 2 tabel is de correlatie r tussen de (dichotome) variabelen direct gerelateerd aan χ2 Correlations
linedance
beloning
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
linedance 1 200 ** .356 .000 200
beloning .356** .000 200 1 200
**. Correlation is significant at the 0.01 level (2-tailed).
relatie tussen r en χ2 voor een 2 × 2 tabel r2 × n = χ 2 voorbeeld: 0.3562 × 200 = 25.35 30 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
voorbeeld
– – – – –
oudere mensen kijken uit naar belangrijke gebeurtenissen in een jaar zo ook naar hun verjaardag het valt een onderzoeker op dat mensen vaak vlak erna overlijden een steekproef van 348 overleden bejaarden moet duidelijkheid scheppen vraag: proberen ouderen hun verjaardag te overleven? 31 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -toets voor goodness-of-fit een chi-kwadraat toets (χ2 ) voor goodness-of-fit wordt gebruikt om te bepalen of de verdeling van ´e´en categorische variabele overeenkomt met een theoretische verdeling de gegevens zijn afkomstig van ´ e´ en populatie het meetniveau van de variabele is categorisch (nominaal of ordinaal) ´e´en populatie: ouderen ´e´en variabele: maand van overlijden elke proefpersoon valt in ´e´en en slechts ´e´en categorie waarnemingen zijn onafhankelijk van elkaar de nul hypothese verwacht een verdeling gelijk aan een theoretische verdeling de χ2 -toets beoordeelt het verschil tussen geobserveerde (fo ) en theoretische frequenties (fe ) de χ2 -verdeling heeft df = #categorieen − 1 vrijheidsgraden
32 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
χ2 -toetsstatistiek maand -6 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 totaal 2
χ =
fo 24 31 20 23 34 16 26 36 37 41 26 34 348
fe 29 29 29 29 29 29 29 29 29 29 29 29
X (fo − fe )2 fe
fo − fe -5 +2 -9 -6 +5 -13 -3 +7 +8 +12 -3 +5 0
(fo − fe )2 25 4 81 36 25 169 9 49 64 144 9 25
(fo − fe )2 /fe 0.86 0.14 2.79 1.24 0.86 5.83 0.31 1.69 2.21 4.97 0.31 0.86 22.07
= 22.07 33 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
de χ2 -toets voor goodness-of-fit het passen van een frequentieverdeling met de χ2 -toets voor goodness-of-fit steekproefgegevens: n = 12, χ2 = 22.07 stappenplan χ2 -toets voor goodness-of-fit: 1 2 3 4 5 6
hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie
H0 : fo = fe en Ha : fo 6= fe χ2 verdeeld met df = n − 1 = 11 χ2 = 22.07 df = 11, α = 0.05, (χ2 )∗ = 19.68 χ2 = 22.07 > 19.68 = (χ2 )∗ en H0 wordt verworpen mensen overlijden niet gelijkmatig over het jaar heen
34 / 38
introductie
χ2 -toets voor onafhankelijkheid
χ2 -toets voor homogeniteit
pauze
χ2 -toets voor goodness-of-fit
ten slotte
SPSS: chi-square cell results delta(maand) Observed N 24 31 20 23 34 16 26 36 37 41 26 34 348
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 Total
Expected N 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
Residual -5.0 2.0 -9.0 -6.0 5.0 -13.0 -3.0 7.0 8.0 12.0 -3.0 5.0
35 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
SPSS: chi-square test results Test Statistics
Chi-Square df Asymp. Sig.
delta(maand) a 22.069 11 .024
a. 0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell frequency is 29.0.
“De verdeling van overlijdens komt niet overeen met de verwachte uniforme verdeling, χ2 = 22.07, df = 11, p = .024. Er zijn meer ouderen die n´a hun verjaardag overlijden (fo = 35.5 per maand), dan v´ o´ or hun verjaardag (fo = 26.6 per maand).”
36 / 38
introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
deze week: wat hebben we geleerd? de verschillende χ2 -onderzoekssituaties de verwachte frequenties voor de verschillende χ2 -situaties uitvoeren en beoordelen van een χ2 -toets de relatie tussen Pearsons r en Pearsons χ2
37 / 38 introductie
χ2 -toets voor onafhankelijkheid
pauze
χ2 -toets voor homogeniteit
χ2 -toets voor goodness-of-fit
ten slotte
deze week: wat moeten we nog leren? het kunnen kiezen van de juiste toets het uitvoeren en beoordelen van een χ2 -toets
38 / 38