χ 2 -toets voor homogeniteit χ 2 -toets voor goodness-of-fit ten slotte

χ2 -toets voor onafhankelijkheid

introductie

χ2 -toets voor homogeniteit

pauze

χ2 -toets voor goodness-of-fit

ten slotte

toetsende statistiek week week week week week

1: 2: 3: 4: 5:

kansen en random variabelen de steekproevenverdeling schatten en toetsen: de z-toets het toetsen van gemiddelden: de t-toets het toetsen van varianties: de F-toets

week 6: het toetsen van tellingen: de χ2 -toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 9: Analysis of Two-Way Tables 9.1: Inference for Two-Way Tables 9.2: Formulas and Models for Two-Way Tables 9.3: Goodness of Fit week 7: verdelingsvrije toetsen

Frank Busing, Universiteit Leiden 1 / 38 introductie



pauze


ten slotte

deze week: wat hebben we al geleerd? kennis en begrip van de 5 kansregels kennis en begrip van marginale –, gezamelijke – en conditionele kans kennis en begrip van onafhankelijkheid toelichting

columns totaal 1 2 1

gezamelijke kans: P(A en B)

2

marginale kansen: P(A) en P(B)

rows totaal

conditionele kansen: P(A|B) en P(B|A)

2 / 38

introductie


pauze



ten slotte

voorbeeld

– – – –

een onderzoeker kijkt naar de relatie tussen geslacht en geloof in astrologie hij neemt één grote steekproef van eerstejaars psychologie studenten de onderzoeker bepaalt vervolgens het geslacht en het geloof in astrologie vraag: is er een relatie tussen geslacht en geloof in de studentenpopulatie?

3 / 38 introductie


pauze



ten slotte

de χ2 -toets voor onafhankelijkheid een chi-kwadraat toets (χ2 ) voor onafhankelijkheid wordt gebruikt om te bepalen of twee variabelen gerelateerd zijn de gegevens zijn afkomstig van ´ e´ en populatie het meetniveau van de twee variabelen is categorisch (nominaal of ordinaal) één populatie: eerstejaars psychologie studenten twee variabelen: geslacht en geloof in astrologie elke proefpersoon valt in één en slechts één categorie waarnemingen zijn onafhankelijk van elkaar de nul hypothese verwacht geen relatie tussen de twee variabelen de nul hypothese verwacht dat de variabelen onafhankelijk zijn de χ2 -toets beoordeelt het verschil tussen geobserveerde (fo ) en verwachte frequenties (fe )

4 / 38

introductie



pauze


ten slotte

χ2 -toetsstatistiek χ2 -toetsstatistiek 2

χ =

X (fo − fe )2 fe

χ2 is de som over gestandaardiseerde gekwadrateerde residuen als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijn dan is de toetsstatistiek ongeveer gelijk aan nul de geobserveerde frequenties hebben we geobserveerd, gemeten, geteld de verwachte frequenties (onder H0 ) kunnen we bepalen met behulp van kansen

5 / 38 introductie



pauze


ten slotte

herhaling: de productregel regel 5: productregel (voor onafhankelijke gebeurtenissen) P(A en B) = P(A) × P(B) voor onafhankelijke gebeurtenissen is de gezamelijke kans het produkt van twee marginale kansen voorbeeld de kans op een vrouw die gelooft in astrologie is dan gelijk aan de kans op geloof in astrologie (A) maal de kans op een vrouw (B)

6 / 38

introductie


pauze



ten slotte

verwachte celfrequenties bij onafhankelijkheid (H0 ) geobserveerde frequenties vrouw man totaal geloof 69 16 85 neutraal 90 28 118 ongeloof 242 118 360 totaal 401 162 563 als we verwachten, onder H0 , dat de aanname van onafhankelijkheid geldt dan Pe (A en B) = P(A) × P(B) fe (A en B) f(A) f(B) = × n n n f(A) × f(B) fe (A en B) = n in woorden: de verwachte celfrequentie bij onafhankelijkheid is het product van de marginale frequenties gedeeld door het totaal aantal 7 / 38 introductie


pauze



ten slotte

verwachte celfrequenties bij onafhankelijkheid (H0 ) geobserveerde frequenties vrouw man totaal geloof 6969 16 8585 neutraal 90 28 118 ongeloof 242 118118 360360 totaal 401401 162162 563 bijvoorbeeld f(A) × f(B) n f(geloof) × f(vrouw) 85 × 401 = 60.54 fe (geloof en vrouw) = = n 563 f(ongeloof) × f(man) 360 × 162 fe (ongeloof en man) = = = 103.54 n 563 etc. fe (A en B) =

8 / 38

introductie


pauze



ten slotte

de χ2 -toetsstatistiek geobserveerde frequenties vrouw man totaal geloof 69 16 85 neutraal 90 28 118 ongeloof 242 118 360 totaal 401 162 563

verwachte frequenties vrouw man totaal 60.54 24.46 85 84.05 33.95 118 256.46 103.54 360 401 162 563

aannamen 1 voor elke cel fe > 1: geen deling door nul χ2 -toets voor onafhankelijkheid: voor elke cel fe > 5

2

9 / 38 introductie


pauze



ten slotte

de χ2 -toetsstatistiek geobserveerde frequenties vrouw man totaal geloof 69 16 85 neutraal 90 28 118 ongeloof 242 118 360 totaal 401 162 563 2

χ =

verwachte frequenties vrouw man totaal 60.54 24.46 85 84.05 33.95 118 256.46 103.54 360 401 162 563

X (fo − fe )2

fe (118 − 103.54)2 (69 − 60.54)2 (90 − 84.05)2 = + + ... + 60.54 84.05 103.54 = 8.388

de steekproevenverdeling van χ2 heet de χ2 -verdeling net als de t- en F-verdeling betreft het hier een hele familie van verdelingen afhankelijk van het aantal vrijheidsgraden: χ2 (df) 10 / 38

introductie



pauze


ten slotte

de χ2 -verdeling

Probability p

( χ 2)* 1 2 3 4

(χ2 )∗ is altijd positief χ2 -verdeling is scheef naar rechts de piek ligt in de buurt van het aantal vrijheidsgraden bij een groot aantal vrijheidsgraden is χ2 normaal verdeeld 11 / 38

introductie



pauze


ten slotte

χ2 -tabel

Probability p

Table entry for p is the critical value ( χ 2 )* with probability p lying to its right.

( χ 2)*

TABLE F χ2 distribution critical values Tail probability df 1 2 3 4 5

.25 1.32 2.77 4.11 5.39 6.63

.20

.15

.10

1.64 3.22 4.64 5.99 7.29

2.07 3.79 5.32 6.74 8.12

2.71 4.61 6.25 7.78 9.24

p

.05

.025

.02

.01

.005

.0025

.001

.0005

3.84 5.99 7.81 9.49 11.07

5.02 7.38 9.35 11.14 12.83

5.41 7.82 9.84 11.67 13.39

6.63 9.21 11.34 13.28 15.09

7.88 10.60 12.84 14.86 16.75

9.14 11.98 14.32 16.42 18.39

10.83 13.82 16.27 18.47 20.51

12.12 15.20 17.73 20.00 22.11

1

nb. χ2 (df = 1) = z2 12 / 38

introductie



pauze


ten slotte

vrijheidsgraden voor de r × c tabel geobserveerde frequenties vrouw man totaal geloof 69 85 neutraal 90 118 ongeloof 360 totaal 401 162 563 het aantal vrijheidsgraden is df = (r − 1) × (c − 1) ga maar na: gegeven de marginalen, hoeveel cellen kunnen er vrij ingevuld worden?

stel: α = 0.05 wat is dan de grenswaarde (χ2 )∗ ? 13 / 38 introductie



pauze


ten slotte

χ2 -tabel: grenswaarde (χ2 )∗

Probability p

Table entry for p is the critical value ( χ 2 )* with probability p lying to its right.

( χ 2)*

TABLE F χ2 distribution critical values Tail probability df 1 2 3 4 5

.25 1.32 2.77 4.11 5.39 6.63

.20

.15

.10

1.64 3.22 4.64 5.99 7.29

2.07 3.79 5.32 6.74 8.12

2.71 4.61 6.25 7.78 9.24

p

.05

.025

.02

.01

.005

.0025

.001

.0005

3.84 5.99 7.81 9.49 11.07

5.02 7.38 9.35 11.14 12.83

5.41 7.82 9.84 11.67 13.39

6.63 9.21 11.34 13.28 15.09

7.88 10.60 12.84 14.86 16.75

9.14 11.98 14.32 16.42 18.39

10.83 13.82 16.27 18.47 20.51

12.12 15.20 17.73 20.00 22.11

14 / 38

introductie



pauze


ten slotte

de χ2 -toets voor onafhankelijkheid toets een relatie tussen variabelen met de χ2 -toets voor onafhankelijkheid steekproefgegevens: r = 3, c = 2, χ2 = 8.388 stappenplan χ2 -toets voor onafhankelijkheid:2 1 2 3 4 5 6

hypothese steekproevenverdeling toetsingsgrootheid verwerpingsgebied statistische conclusie inhoudelijke conclusie

H0 : fo = fe en Ha : fo 6= fe χ2 verdeeld met df = (r − 1)(c − 1) = 2 χ2 = 8.388 df = 2, α = 0.05, (χ2 )∗ = 5.99 χ2 = 8.388 > 5.99 = (χ2 )∗ en H0 wordt verworpen geloof in astrologie en geslacht zijn afhankelijk in de studentenpopulatie

let op: bij grote n (grote power) is χ2 altijd significant 15 / 38 introductie



pauze


ten slotte

χ2 -tabel: p-waarde TABLE F χ2 distribution critical values Tail probability df

.25

1 2 3 4 5

1 2 3 4

1.32 2.77 4.11 5.39 6.63

.20

.15

.10

1.64 3.22 4.64 5.99 7.29

2.07 3.79 5.32 6.74 8.12

2.71 4.61 6.25 7.78 9.24

p

.05

.025

.02

.01

.005

.0025

.001

.0005

3.84 5.99 7.81 9.49 11.07

5.02 7.38 9.35 11.14 12.83

5.41 7.82 9.84 11.67 13.39

6.63 9.21 11.34 13.28 15.09

7.88 10.60 12.84 14.86 16.75

9.14 11.98 14.32 16.42 18.39

10.83 13.82 16.27 18.47 20.51

12.12 15.20 17.73 20.00 22.11

rij, aantal vrijheidsgraden df = 2 χ2 = 8.388 ligt tussen 7.82 en 9.21 p-waarde ligt tussen 0.01 en 0.02 conclusie: p < 0.05, H0 wordt verworpen

merk op dat de grenzen waartussen de p-waarde ligt niet verdubbeld worden: deze χ2 -tabel geeft direct en uitsluitend de tweezijdige p-waarden 16 / 38

introductie



pauze


ten slotte

SPSS: crosstabs χ2 -test results Chi-Square Tests

Pearson Chi-Square Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association

Value a 8.388 8.734 8.406 b 8.200

N of Valid Cases

df 2 2

Asymp. Sig. (2-sided) .015 .013

1

.004

Exact Sig. (2-sided) .015 .013 .015 .005

Exact Sig. (1-sided)

Point Probability

.002

.001

563

a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 24.46. b. The standardized statistic is 2.864.

“Het geloof in astrologie is afhankelijk van het geslacht van de student, χ2 = 8.388, df = 2, p = .015.”

gebruik de Fisher’s exact test in plaats van de asymptotische χ2 benadering de Fisher’s exact test is met name geschikt voor kleine steekproeven 17 / 38 introductie


pauze



ten slotte

voorbeeld

– – – – – –

een onderzoeker vraagt zich af of we dieren kunnen laten line-dansen hij verzamelt 200 katten en verdeelt ze random over twee groepen hij beloont de ene groep met voedsel voor line-dans-achtig gedrag de andere groep wordt beloond met affectie aan het einde van de periode telt hij hoeveel katten konden line-dansen vraag: is er een relatie tussen line-dansen en het soort beloning? 18 / 38

introductie


pauze



ten slotte

de χ2 -toets voor homogeniteit een chi-kwadraat toets (χ2 ) voor homogeniteit4 wordt gebruikt om te bepalen of twee of meer populaties gelijk verdeeld zijn op één variabele de gegevens zijn afkomstig van twee of meer populaties het meetniveau van de variabele is categorisch (nominaal of ordinaal) twee populaties: voedsel en affectie beloonde katten één variabele: line-dansen elke proefpersoon valt in één en slechts één categorie waarnemingen zijn onafhankelijk van elkaar de nul hypothese verwacht gelijke proporties of gelijke verdelingen de χ2 -toets beoordeelt het verschil tussen geobserveerde (fo ) en verwachte frequenties (fe ) de χ2 -verdeling heeft df = (r − 1) × (c − 1) vrijheidsgraden χ2 -toets voor homogeniteit of homogeniteit van verdelingen of homogeniteit van populaties 19 / 38 introductie


pauze



ten slotte

onafhankelijkheid versus homogeniteit χ2 -toets voor onafhankelijkheid 1 2 3 4 5

één populatie: studenten twee variabelen: geslacht en geloof H0 : geslacht en geloof zijn onafhankelijk in de populatie van studenten geen onderscheid tussen verklarende en respons variabele omvang van de steekproef (n) staat vast

χ2 -toets voor homogeniteit 1 2

twee of meer populaties: mannelijke en vrouwelijke studenten één variabele: geloof

3

H0 : geloof is gelijk verdeeld in alle populaties

4

onderscheid tussen verklarende (geslacht) en respons variabele (geloof) marginalen van de verklarende variabele staan vast (maar niet per se gelijk)

5

conclusie: het onderzoeksontwerp bepaalt welke toets passend is5 echter: de verwachte frequenties worden voor beide toetsen op gelijke wijze bepaald 20 / 38

introductie


pauze



ten slotte

χ2 -toetsstatistiek χ2 -toetsstatistiek 2

χ =

X (fo − fe )2 fe

χ2 is de som over gestandaardiseerde gekwadrateerde residuen als de geobserveerde en verwachte frequenties ongeveer aan elkaar gelijk zijn dan is de toetsstatistiek ongeveer gelijk aan nul de geobserveerde frequenties hebben we geobserveerd, gemeten, geteld de verwachte frequenties (onder H0 ) kunnen we bepalen met behulp van kansen

21 / 38 introductie


pauze



ten slotte

verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 onder H0 , bij gelijke verdelingen, geldt dat 1

de conditionele kansen gelijk zijn voor alle condities (28/38 = 48/162 en 10/38 = 114/162)

2

de conditionele kansen gelijk zijn aan de marginale kansen (28/38 = 48/162 = 76/200 en 10/38 = 114/162 = 124/200)

6

zie slides TS week 1 22 / 38

introductie


pauze



ten slotte

verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 als we verwachten dat de conditionele gelijk zijn aan de marginale kansen dan Pe (A|B) = P(A) f(A) fe (A en B) = f(B) n f(A) × f(B) fe (A en B) = n in woorden: de verwachte celfrequentie bij homogeniteit is het product van de marginale frequenties gedeeld door het totaal aantal7 verwachte celfrequentie bij homogeniteit = verwachte celfrequentie bij onafhankelijkheid 23 / 38 introductie


pauze



ten slotte

verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 bijvoorbeeld f(A) × f(B) n 76 × 38 f(line-dansen) × f(voedsel) = fe (line-dansen en voedsel) = = 14.44 n 200 etc. fe (A en B) =

24 / 38

introductie


pauze



ten slotte

verwachte celfrequenties bij homogeniteit (H0 ) geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200

verwachte frequenties voedsel affectie totaal 14.44 61.56 76 23.56 100.44 124 38 162 200

aannamen voor elke cel fe > 1: geen deling door nul gemiddelde fe > 5

1 2

25 / 38 introductie


pauze



ten slotte

de χ2 -toetsstatistiek geobserveerde frequenties voedsel affectie totaal kan dansen 28 48 76 kan niet dansen 10 114 124 totaal 38 162 200 2

χ =

verwachte frequenties voedsel affectie totaal 14.44 61.56 76 23.56 100.44 124 38 162 200

X (fo − fe )2

fe (28 − 14.44)2 (48 − 61.56)2 (10 − 23.56)2 (114 − 100.44)2 = + + + 14.44 61.56 23.56 100.44 = 25.35

26 / 38

introductie



pauze


ten slotte

de χ2 -toets voor homogeniteit het vergelijken van frequentieverdelingen met de χ2 -toets voor homogeniteit steekproefgegevens: r = 2, c = 2, χ2 = 25.35 stappenplan χ2 -toets voor homogeniteit: 1 2 3 4 5 6


H0 : fo = fe en Ha : fo 6= fe χ2 verdeeld met df = (r − 1)(c − 1) = 1 χ2 = 25.35 df = 1, α = 0.05, (χ2 )∗ = 3.84 χ2 = 25.35 > 3.84 = (χ2 )∗ en H0 wordt verworpen de verdelingen voor katten beloond met voedsel en met affectie zijn niet aan elkaar gelijk

27 / 38 introductie


pauze



ten slotte

SPSS: crosstabs cell results linedance * beloning Crosstabulation beloning linedance

ja nee

Total

Count Expected Count Count Expected Count Count Expected Count

voedsel 28 14.4 10 23.6 38 38.0

affectie 48 61.6 114 100.4 162 162.0

Total 76 76.0 124 124.0 200 200.0

28 / 38

introductie



pauze


ten slotte

SPSS: crosstabs χ2 -test results Chi-Square Tests Value a 25.356 23.520 24.932

Pearson Chi-Square b Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association

25.229

N of Valid Cases

1 1 1

Asymp. Sig. (2-sided) .000 .000 .000

1

.000

df

Exact Sig. (2sided)

Exact Sig. (1sided)

.000

.000

200

a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 14.44. b. Computed only for a 2x2 table

“De verdeling van line-dansen is anders voor de verschillende soorten beloning die katten krijgen ter aanmoediging, χ2 = 25.35, df = 1, p < .000.”

29 / 38 introductie



pauze


ten slotte

Pearsons r versus Pearsons χ2 voor een 2 × 2 tabel is de correlatie r tussen de (dichotome) variabelen direct gerelateerd aan χ2 Correlations

linedance

beloning

Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N

linedance 1 200 ** .356 .000 200

beloning .356** .000 200 1 200

**. Correlation is significant at the 0.01 level (2-tailed).

relatie tussen r en χ2 voor een 2 × 2 tabel r2 × n = χ 2 voorbeeld: 0.3562 × 200 = 25.35 30 / 38

introductie


pauze



ten slotte

voorbeeld

– – – – –

oudere mensen kijken uit naar belangrijke gebeurtenissen in een jaar zo ook naar hun verjaardag het valt een onderzoeker op dat mensen vaak vlak erna overlijden een steekproef van 348 overleden bejaarden moet duidelijkheid scheppen vraag: proberen ouderen hun verjaardag te overleven? 31 / 38

introductie


pauze



ten slotte

χ2 -toets voor goodness-of-fit een chi-kwadraat toets (χ2 ) voor goodness-of-fit wordt gebruikt om te bepalen of de verdeling van één categorische variabele overeenkomt met een theoretische verdeling de gegevens zijn afkomstig van ´ e´ en populatie het meetniveau van de variabele is categorisch (nominaal of ordinaal) één populatie: ouderen één variabele: maand van overlijden elke proefpersoon valt in één en slechts één categorie waarnemingen zijn onafhankelijk van elkaar de nul hypothese verwacht een verdeling gelijk aan een theoretische verdeling de χ2 -toets beoordeelt het verschil tussen geobserveerde (fo ) en theoretische frequenties (fe ) de χ2 -verdeling heeft df = #categorieen − 1 vrijheidsgraden

32 / 38

introductie



pauze


ten slotte

χ2 -toetsstatistiek maand -6 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 totaal 2

χ =

fo 24 31 20 23 34 16 26 36 37 41 26 34 348

fe 29 29 29 29 29 29 29 29 29 29 29 29

X (fo − fe )2 fe

fo − fe -5 +2 -9 -6 +5 -13 -3 +7 +8 +12 -3 +5 0

(fo − fe )2 25 4 81 36 25 169 9 49 64 144 9 25

(fo − fe )2 /fe 0.86 0.14 2.79 1.24 0.86 5.83 0.31 1.69 2.21 4.97 0.31 0.86 22.07

= 22.07 33 / 38

introductie



pauze


ten slotte

de χ2 -toets voor goodness-of-fit het passen van een frequentieverdeling met de χ2 -toets voor goodness-of-fit steekproefgegevens: n = 12, χ2 = 22.07 stappenplan χ2 -toets voor goodness-of-fit: 1 2 3 4 5 6


H0 : fo = fe en Ha : fo 6= fe χ2 verdeeld met df = n − 1 = 11 χ2 = 22.07 df = 11, α = 0.05, (χ2 )∗ = 19.68 χ2 = 22.07 > 19.68 = (χ2 )∗ en H0 wordt verworpen mensen overlijden niet gelijkmatig over het jaar heen

34 / 38

introductie



pauze


ten slotte

SPSS: chi-square cell results delta(maand) Observed N 24 31 20 23 34 16 26 36 37 41 26 34 348

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 Total

Expected N 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0

Residual -5.0 2.0 -9.0 -6.0 5.0 -13.0 -3.0 7.0 8.0 12.0 -3.0 5.0

35 / 38 introductie


pauze



ten slotte

SPSS: chi-square test results Test Statistics

Chi-Square df Asymp. Sig.

delta(maand) a 22.069 11 .024

a. 0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell frequency is 29.0.

“De verdeling van overlijdens komt niet overeen met de verwachte uniforme verdeling, χ2 = 22.07, df = 11, p = .024. Er zijn meer ouderen die ná hun verjaardag overlijden (fo = 35.5 per maand), dan v´ o´ or hun verjaardag (fo = 26.6 per maand).”

36 / 38

introductie


pauze



ten slotte

deze week: wat hebben we geleerd? de verschillende χ2 -onderzoekssituaties de verwachte frequenties voor de verschillende χ2 -situaties uitvoeren en beoordelen van een χ2 -toets de relatie tussen Pearsons r en Pearsons χ2

37 / 38 introductie


pauze



ten slotte

deze week: wat moeten we nog leren? het kunnen kiezen van de juiste toets het uitvoeren en beoordelen van een χ2 -toets

38 / 38

χ 2 -toets voor homogeniteit χ 2 -toets voor goodness-of-fit ten slotte

Recommend Documents