HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK
1
Theorie Statistiek – Lessen 11+12
1. INLEIDING Parametrische statistiek:
Normale Verdeling
Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen
I.
Normaliteit is uitzonderlijk
II.
Voor complexe modellen (regressie, anova) bestaan alleen parametrische methoden
III. Niet-parametrische methoden mogen altijd worden gebruikt IV. Voor NV zijn parametrische methoden krachtiger (kleinere ß) V.
Parametrische methoden toelaatbaar wanneer men na transformatie NV krijgt (log, vierkantswortel, ...)
VI. Andere strategie in geval verdeling onbekend: • Pas beide methoden toe • Indien conclusie identiek: aanvaarden • Indien verschillende conclusie: zoek outliers, gebruik grafische voorstelling of toets
2
Theorie Statistiek – Lessen 11+12
2. METHODEN VOOR EEN STEEKPROEF 2.1 Schatters en betrouwbaarheidsintervallen voor de mediaan
X1, X2, ...... , Xn hebben dezelfde (onbekende) verdeling Men wenst de mediaan M van de populatie te schatten.
Schatter: mediaan van de steekproef =
3
~ X
Theorie Statistiek – Lessen 11+12
Eénvoudig betrouwbaarheidsinterval voor de mediaan: [ K1 - G1] met: K1 = kleinste element van de steekproef, G1 = grootste element van de steekproef
Bepaling van de onbetrouwbaarheidsdrempel (α): M behoort niet tot het interval indien alle metingen ofwel groter zijn dan M ofwel allemaal kleiner. De kans dat een meting groter zou zijn dan de mediaan is 1/2
De kans dat alle metingen groter zijn dan de mediaan is (1/2)ⁿ De kans dat alle metingen kleiner zijn dan de mediaan is (1/2)ⁿ
De kans dat de mediaan tot het interval behoort is: 1 - α = 1 - 2 . (1/2)ⁿ = 1 - 1 / 2n-1 (zie tabel)
4
Theorie Statistiek – Lessen 11+12
n
1-α
2
0,5000
3
0,7500
4
0,8750
5
0,9375
6
0,9688
7
0,9844
8
0,9922
9
0,9961
10
0,9980
11
0,9990
12
0,9995
Opmerkingen • De onbetrouwbaarheid α wordt afgeleid uit n, het kan niet worden opgegeven om n te berekenen • De kans stijgt vlug met stijgende n, waardoor het interval ook groter wordt en waardoor het resultaat minder bruikbaar wordt
5
Theorie Statistiek – Lessen 11+12
Men zoekt een evenwicht tussen de lengte van het interval en α, door intervallen te beschouwen van de vorm:
[Ke - Ge] met:
Ke = ede kleinste element van de steekproef, Ge = ede grootste element van de steekproef
Dit zijn de T-intervallen De kans (1-α) kan berekend worden met de binomiale verdeling Er bestaan tabellen voor T-intervallen
6
Theorie Statistiek – Lessen 11+12
Voorbeeld Van 8 toevallig gekozen personen werd de diastolische bloeddruk gemeten. Dit gaf: 77, 89, 85, 74, 75, 80, 70, 83 mmHg
Mediaan = 78,5 mm Hg
Tabel: interval [K2 - G2] heeft een betrouwbaarheid van 93% K2 = 74 en G2 = 85.
Dit is een breed interval vermits een steekproef van 8 elementen weinig informatie geeft
7
Theorie Statistiek – Lessen 11+12
Benadering voor grote steekproeven De tabel voor T-intervallen geeft waarden voor n ≤50. Voor grotere steekproeven gebruikt men de volgende benadering: e = (n + 1 - µα√n) / 2 Indien e niet geheel is moet men afronden: - als men naar beneden afrondt (e wordt kleiner): - interval wordt groter - α wordt kleiner - resultaat meer conservatief
Voorbeeld n = 100 en α = 0,05: µα = 1,960 en e = (101-19,60) / 2 = 40,70 Men neemt e = 40 om een wat groter interval te bekomen (men zou ook lineair kunnen interpoleren).
8
Theorie Statistiek – Lessen 11+12
Betrouwbaarheidsintervallen voor symmetrische variabelen Het vorig BI is geldig zonder enige veronderstelling aangaande de verdeling van de variabele. Bijkomende informatie laat soms toe een meer accurate methode toe te passen. Indien de verdeling symmetrisch is (niet noodzakelijk normaal verdeeld), vallen mediaan en symmetrie-as samen. Men kan verwachten dat de steekproef X1, X2, ...... , Xn symmetrisch gelegen is rond M. Dit is dan ook het geval voor de gemiddelden van twee elementen: Xi + Xj 2
(i, j = 1, 2, ... ,n)
Een schatting van M wordt gegeven door de mediaan te berekenen van alle gemiddelden van twee metingen. Een BI wordt gegeven door het ede kleinste en het ede grootste element van deze gemiddelden. Men noemt een dergelijk interval een: W - interval of interval van Wilcoxon.
Opmerking Het bepalen van een W-interval vraagt veel berekeningen waarvoor computerprogrammas beschikbaar zijn.
9
Theorie Statistiek – Lessen 11+12
Voorbeeld Veronderstel dat bloeddrukmetingen symmetrisch verdeeld zijn en beschouw de metingen van het vorig voorbeeld. De gemiddelden van twee metingen zijn:
70
72
72,5
73,5
75
76,5
77,5
79,5
74
74,5
75,5
77
78,5
79,5
81,5
75
76
77,5
79
80
82
77
78,5
80
81
83
80
81,5
82,5
84,5
83
84
86
85
87 89
10
Theorie Statistiek – Lessen 11+12
De schatting van de mediaan wordt gegeven door het gemiddelde te nemen van de twee middenste van deze 36 waarden: 79 en 79,5:
schatting = (79 + 79,5) /2 = 79,25
Volgens de tabel voor W-intervallen wordt een BI met betrouwbaarheid 96,1% begrensd door de 4de kleinste en de 4de grootste waarde: 73,5 en 85.
Dit geeft het interval: [73,5 - 85,0], een beetje groter dan het Tinterval met 93% betrouwbaarheid. Dit interval mag slecht gebruikt worden voor een symmetrische populatie.
11
Theorie Statistiek – Lessen 11+12
2.2 Parametertoetsen voor de mediaan
Men wenst de volgende hypothese te toetsen: H0: M = M0 met als alternatieve hypothese: H1: M ≠ M0
Hiervoor bestaan er twee toetsen: 1. De tekentoets 2. De Wilcoxon rangtoets
12
Theorie Statistiek – Lessen 11+12
2.2.1 De tekentoets
We beschouwen T-intervallen: [ Ke - Ge]. De hypothetische waarde M0 zal ‘onaanvaardbaar’ zijn wanneer het buiten het interval gelegen is: a) ofwel kleiner dan Ke minder dan e waarnemingen < M0 b) ofwel groter dan Ge minder dan e waarnemingen > M0
Definitie T- = aantal waarnemingen kleiner dan M0 T+ = aantal waarnemingen groter dan M0
Beslissing De nulhypothese wordt verworpen indien ofwel T- ofwel T+ kleiner is dan het aantal e overeenkomend met de waarde van α die in de tabel wordt gevonden, m.a.w. indien het minimum kleiner is dan e. Opmerking Men spreekt van de tekentoets omdat men nagaat hoeveel (Xi - M0) negatief zijn, en hoeveel positief.
13
Theorie Statistiek – Lessen 11+12
Eénzijdige toets Met H1: M > M0 als alternatieve hypothese verwacht men: - weinig waarnemingen kleiner dan M0 - veel waarnemingen groter dan M0 Men gebruikt als toetsveranderlijke T- (aantal kleiner dan M0)
Met H1: M < M0 als alternatieve hypothese: gebruikt men als toetsveranderlijke T+ (aantal groter dan M0)
BESLISSING: DE NULHYPOTHESE VERWERPEN INDIEN DE TOETSVERANDERLIJKE KLEINER IS DAN DE WAARDE IN DE TABEL
Opmerkingen 1. Voor de éénzijdige toetsen gebruikt men als p-waarde de waarde aangegeven in de tabel onder α/2 2. De tekentoets veronderstelt dat geen enkele waarneming gelijk is aan M0. Deze waarnemingen worden geëlimineerd vóór de toets wordt uitgevoerd (n moet aangepast worden)
14
Theorie Statistiek – Lessen 11+12
Voorbeeld In de literatuur wordt beweerd dat 50% van de patiënten die aan een bepaalde ziekte lijden na 60 dagen spontaan genezen zijn. Een arts wenst deze hypothese na te gaan en noteerde de genezingsdatum van 16 patienten: 46 56 77 35
54 41 63 50
60 38 26 59
39 71 52 48
De toets wordt tweezijdig uitgevoerd: H0: M = M0 H1: M ≠ M0 Eén van de waarnemingen is gelijk aan M0 en wordt geëlimineerd n wordt dus 15
Men berekent : T+ = 3 (71, 77, 63) en T- = 12
Min(T+ , T- ) = 3
15
Theorie Statistiek – Lessen 11+12
In de tabel vindt men voor n = 15:
e = 3:
1- α = 0.993 en α = 0,007
e = 4:
1- α = 0.965 en α = 0,035
e = 5:
1- α = 0.882 en α = 0,118
Hieruit volgt: P( T+ ≤ 3 of T+ ≥ 12) = P( T+ < 4 of T+ > 11) = 0,035
Besluit H0 verwerpen op het 5% niveau of p = 0,035
16
Theorie Statistiek – Lessen 11+12
2.2.2 De Wilcoxon rangtoets
Deze toets werkt op dezelfde manier als de tekentoets, maar met W- en W+ i.p.v. T-en T+. Men moet hiervoor veronderstellen dat de veranderlijke symmetrisch is.
Het bestaat uit de volgende stappen: I. Bereken alle verschillen Xi - M0 en hun absolute waarde II. Rangschik de absolute waarden │Xi - M0│ van klein naar groot III. Bereken: W- = som van de rangen van de metingen met negatieve Xi - M0 W+ = som van de rangen van de metingen met positieve Xi - M0
Opmerking W- + W+ = n(n+1)/2
17
Theorie Statistiek – Lessen 11+12
Voorbeeld Een machine wordt gebruikt om flessen van 100 ml syroop te vullen. Om na te gaan of de machine goed ingesteld is, wordt de inhoud van 12 flessen gemeten. Dit geeft: 102, 101, 108, 95, 106, 112, 110, 109, 103, 86, 93 en 104 ml
Men wenst de hypothese te toetsen dat de mediaan M = 100 ml t.o.v. de hypothese dat M ≠ 100 ml. Uit vorige experimenten weet men dat de verdeling van de inhoud symmetrisch is. Men berekent W- en W+.
18
Theorie Statistiek – Lessen 11+12
Xi
│Xi - 100│
Rang
102
2
2
101
1
1
108
8
8
95
5
5
106
6
6
112
12
11
110
10
10
109
9
9
103
3
3
86
14
12
93
7
7
104
4
4
W- = 5 + 12 + 7 = 24 W+ = (12 x 13) / 2 - 24 = 78 - 24 = 54 min (W-,W+) = 24 Uit de tabel voor W-intervallen volgt dat p > 0,11 zodat de nulhypothese wordt aanvaard.
19
Theorie Statistiek – Lessen 11+12
Opmerkingen • De metingen gelijk aan M0 worden weggelaten uit de analyse en n wordt aangepast • Voor gelijke absolute waarden │Xi - M0│ wordt de gemiddelde rang berekend (voorbeeld: rangen 2 en 3 worden beide vervangen door 2.5, rangen 6, 7 en 8 worden vervangen door 7). Deze procedure is conservatief: de ‘echte’ p-waarde is kleiner of gelijk aan de gevonden waarde • Het is niet toegelaten de twee toetsen te gebruiken (tekentoets en Wilcoxon) en het meest aantrekkelijk resultaat te gebruiken. Men moet de toets gebruiken waarvoor de hypothesen zo goed mogelijk met de realiteit overeenkomen
20
Theorie Statistiek – Lessen 11+12
3. METHODEN VOOR TWEE STEEKPROEVEN 3.1 Gepaarde metingen
Beschouw twee steekproeven van elk n elementen: X1, X2, ...... , Xn hebben dezelfde (onbekende) verdeling en zijn onafhankelijk Y1, Y2, ...... , Yn hebben dezelfde (onbekende) verdeling en zijn onafhankelijk Deze metingen zijn gepaard: met elke X komt een Y overeen (en omgekeerd) Men wenst na te gaan of de verdeling van de Xi dezelfde is als die van de Yi. Indien deze hypothese waar is dan zijn de verschillen Di = Xi - Yi symmetrisch verdeeld rond 0 ⇒ de mediaan = 0. Men kan deze hypothese nagaan met de tekentoets en met de Wilcoxon rangtoets:
21
Theorie Statistiek – Lessen 11+12
Tekentoets T- = aantal negatieve Di T+ = aantal positieve Di
Wilcoxon rangtoets W- = som van de rangen van de negatieve Di W+ = som van de rangen van de positieve Di
In geval van gelijke absolute waarden wordt de gemiddelde rang genomen Metingen waarvoor Xi = Yi worden weggelaten
22
Theorie Statistiek – Lessen 11+12
Voorbeeld Vergelijken van 2 leesmethoden. Een klas van 20 leerlingen wordt ingedeeld in 10 groepen van 2 (matching) In elke groep wordt toevallig de leesmethode bepaald (randomizatie) Op het einde van het jaar leggen de leerlingen een toets af:
Groep
1
2
3
4
5
6
7
8
9
10
x (methode 1) 78
81
69
86
70
66
76
63
62
74
y (methode 2) 68
99
67
97
75
86
92
75
84
66
d
10
-18 2
-11 -5
-20 -16 -12 -22 8
Rang
4
8
5
9
1
2
23
7
6
10
3
Theorie Statistiek – Lessen 11+12
Hypothesen H0: MD = 0 met als alternatieve hypothese: H1: MD ≠ 0 waar MD de mediaan is van de verschillen
Tekentoets T- = 7 en T+ = 3 ⇒ T = 3: P (T+ ≤3) + P (T+ ≥7) = P (T+ <4) + P (T+ >6) P (T+ ≤3) = P0 + P1 + P2 + P3 waar Pi = C10i (1/2)10 (binomiale verdeling) P (T+ ≤3) = 0,001 + 0,010 + 0,044 + 0,117 = 0,172 p = 0,344
Bijgevolg wordt de nulhypothese aanvaard
24
Theorie Statistiek – Lessen 11+12
Wilcoxon rangtoets W+ = 4 + 1 + 3 = 8 Men vindt in de tabel P (W+ ≤8) + P (W+ ≥47) = P (W+ <9) + P (W+ >46) = 0,049 Bijgevolg wordt de alternatieve hypothese aanvaard
25
Theorie Statistiek – Lessen 11+12
Opmerkingen • Met de tekentoets wordt de nulhypothese aanvaard en met de Wilcoxon rangtoets niet. De reden is dat de positieve verschillen meestal veel kleiner zijn (in absolute waarde), dan de negatieve verschillen. • Wanneer de verschillen niet kunnen worden gerangschikt kan men alleen gebruik maken van de tekentoets: - indien de xi en yj zelf rangorden zijn - wanneer men voor elke i alleen kan zeggen welke meting groter is en welke kleiner (ofwel dat ze gelijk zijn), maar niet hoe groot het verschil is • Wanneer de nulhypothese wordt aanvaard betekent het niet noodzakelijk dat de twee verdelingen identiek zijn, maar dat de gegevens niet toelaten het tegendeel aan te tonen
26
Theorie Statistiek – Lessen 11+12
3.2 Onafhankelijke steekproeven Meestal zijn de metingen niet gepaard en onafhankelijk. Hiervoor zijn er twee beschikbare toetsen: de mediaan toets en de Wilcoxon-MannWhitney toets.
De mediaan toets Noem M de mediaan van alle x en y metingen samen. Bepaal het aantal x metingen ≤ M en het aantal > M Bepaal het aantal y metingen ≤ M en het aantal > M Dit geeft volgende tabel:
x-metingen
y-metingen
≤M
a
b
a + b (≈ N/2)
>M
c
d
c + d (≈N/2)
n1 = a + c
n2 = b + d
27
n1 + n2 = N
Theorie Statistiek – Lessen 11+12
Indien de 2 verdelingen dezelfde zijn dan is de positie t.o.v. de mediaan M onhafhankelijk van de steekproef. ⇒ chi-kwadraat toets:
( a. d − b. c)2 . N K = n1. n2 .( a + b).(c + d ) 2
is de toetsveranderlijke. Deze heeft een chi-kwadraat verdeling met één vrijheidsgraad. Deze toets houdt geen rekening met de omvang van de afwijking t.o.v. de mediaan.
28
Theorie Statistiek – Lessen 11+12
De Wilcoxon-Mann-Whitney toets In deze toets wordt iedere x-waarde vergeleken met iedere y-waarde Definities Ux = aantal maal dat een x-waarde groter is dan een y-waarde Uy = aantal maal dat een y-waarde groter is dan een x-waarde Om Ux en Uy te berekenen maakt men n1 x n2 vergelijkingen Uit de definities volgt dat Ux + Uy = n1 x n2 Voorlopig worden gelijke waarden uitgesloten Indien de x-waarden globaal even groot zijn als de y-waarden, verwacht men ook even grote Ux en Uy De Wilcoxon-Mann-Whitney toets verwerpt de hypothese dat de Xwaarden en de Y-waarden afkomstig zijn uit dezelfde populatie indien het minimum van Ux en Uy kleiner is dan de waarde e die men in de tabel vindt (tweezijdige toets) In de tabel vindt men waarden van e voor n1 en n2 tussen 3 en 12.
29
Theorie Statistiek – Lessen 11+12
Voorbeeld Beschouw de resultaten van 2 behandelingen om cholesterol in bloed te verminderen
x = vermindering na behandeling met produkt 1 gedurende 3 maand:
58 46 45 60
47 50 52 48
70 71
(n1 = 10)
y = vermindering na behandeling met produkt 2 gedurende 3 maand:
53 38 42 35
57 44 41 56
(n2 = 8)
Ux = 8 + 5 + 5 + 8 + 5 + 5 + 5 + 5 + 8 + 8 = 62 Uy = 6 + 0 + 0 + 0 + 6 + 0 + 0 + 6 = 18 Min (Ux , Uy) = 18 ⇒ 19 opzoeken in de tabel H0: de twee verdelingen (medianen) zijn gelijk H1: de twee verdelingen (medianen) zijn verschillend Conclusie: H0 aanvaarden (p = 0,055)
30
Theorie Statistiek – Lessen 11+12
Normale benadering voor grote steekproeven Voor steekproeven met meer dan 12 waaarnemingen gebruikt men de volgende benadering: e is normaal verdeeld met : gemiddelde = (n1n2 + 1)/2 variantie = n1n2 (n1+n2 + 1)/12
Gelijke metingswaarden Eén van de hypothesen van de Wilcoxon-Mann-Whitney toets is de kontinuiteit van de verdelingen van de Xi en de Yi, waardoor de kans op gelijke metingswaarden nul is. In de praktijk is deze hypothese zelden waar en komen gelijkheden voor. De gebruikelijke procedure is In geval van gelijkheid tussen een x-waarde en een y-waarde: tel 1/2 op bij Ux en 1/2 bij Uy Met deze procedure blijft de gelijkheid Ux + Uy = n1 x n2 gelden
Opmerking (geldig voor alle vergelijkingstoetsen) Wanneer de twee steekproeven niet even groot zijn vermindert de macht van de toets (β wordt groter). Deze vermindering wordt belangrijk vanaf ongeveer tweemaal meer waarnemingen in de grootste steekproef.
31
Theorie Statistiek – Lessen 11+12
Alternatieve vorm van de Wilcoxon-Mann-Whitney toets
Rangschik de n1 + n2 waarnemingen in stijgende volgorde Noem Rx de som van de rangen die overeenkomen met x-waarden en Ry de som van de rangen van de y-waarden Wanneer twee of meer metingswaarden gelijk zijn wordt aan ieder de gemiddelde rang toegekend. Voor de toetsveranderlijken Rx en Ry bestaan tabellen voor betrouwbaarheidsintervallen en om de toets uit te voeren
32
Theorie Statistiek – Lessen 11+12
Voorbeeld Men beschouwt de vermindering in bloedconcentratie van glucose (mg/100 ml) na behandeling met geneesmiddel A en met geneesmiddel B
BEHANDELING A (x) Patiënt 1 2 3 4 5
Daling 10 15 -5 20 25
BEHANDELING B (y) Patiënt 6 7 8 9
Daling 10 5 -5 -10
33
Theorie Statistiek – Lessen 11+12
Na rangschikking bekomt men de volgende tabel
Patiënt
Meting
Behandeling
Rang
9 3 8 7 1 6 2 4 5
-10 -5 -5 5 10 10 15 20 25
B A B B A B A A A
1 2,5 2,5 4 5,5 5,5 7 8 9
Rx = 2,5 + 5,5 + 7 + 8 + 9 = 32 Ry = 1 + 2,5 + 4 + 5,5 = 13 R = min (Rx Ry) = 13
Opmerking Het gebruik van Rx en Ry maakt het mogelijk de Wilcoxon-MannWhitney toets te veralgemenen tot meer dan twee groepen (KruskallWallis toets)
34
Theorie Statistiek – Lessen 11+12