NEDERLANDS iNSTÏfÜÜf VÖÖÄ FfiAEVENTIEVE GENEESKUNDE TNO
^
LEIDEN
fy^
INLEIDING TOT DE MEDISCHE STATISTIEK I
Uit de afdeling Statistiek van het Nederlands Instituut voor Praeventieve Geneeskunde te Leiden
INLEIDING TOT DE MEDISCHE STATISTIEK, DEEL I
ERRATA EN AANVULLINGEN Blz. 12. Vôôr 1.3.3 toevoegen: In tabel CC (deel II) zijn enkele voorbeelden van lotingstabellen opgenomen. 89. Opgave 4.14: 'normale' moet zijn 'binomiale'. 95. Formule (4.18) : de P's dienen te worden voorzien van de indices 1, 2 en k. 115. Tabel 5.3, fjn moet zijn 100 //«. 117. Op de 16de, 17de en 18de regel staat 3,2; dit moet zijn 3,3. 138. Figuur 6.6: bij de werkingskrommen « = 10 en » = 30 omwisselen. 140. Op de regel na tabel 6.10 staat ' > 100', moet zijn ' < 100'. 168. In kolom B van de tabel dient te staan : 10.1. ;f2-toets voor aanpassing. 10.2. Toets van KOLMOGOROV-SMIRNOV. 194. De eerste regel van formule (9.7) moet luiden: (g + c) ! (& + d) !
P(a = a\H„) = { a ^ h ) \ { c + d)\
195. De 2 x 2 tabellen in de eerste kolom van tabel 9.8 dienen van . boven naar beneden te luiden :
116 5|0
215 4|1
314 3|2
413 2|3
512 114
611 0|5
204. In opgave 9.18 staat vijfmaal 'extra-hepatitisch' in plaats van 'extra-hepatisch'. 207. Op de zesde regel van 9.6.4 staat 'tussen 0,2 en 0.3'. Dit moet zijn 'tussen 0,2 en 0,1'. 217. Opgave 10.1 : a) 4.13 moet zijn 4.14,.6) 4.14 moet zijn 4.15. 230. Voorbeeld 10.8, tweede regel: 'sera' moet zijn 'bloedmonsters'. Tabel 10.6: 'Serum' moet zijn 'Bloedmonster'.
blz. 236. Opgave 10.10: 'fonio' moet zijn 'Fonio'. 238. 11 de regel van onder : ( 10.10) moet zijn (10.9). 241. Na formule (10.12) toevoegen: Men kan bij deze normale benadering ook uitgaan van de som van de rangnummers in één der steekproeven. Grebruikt men 5^, de som van steekproef 1, dan geldt : Vni«2 (n -I- l)/3 • 242. In de noemer van formule (10.15) dient (tussen de twee »'s) een haakje te worden aangebracht. 246. Voorbeeld 10.14, eerste en tweede regel: 21 moet zijn 15, 7 moet zijn 5. Zevende regel en tabel 10.12: 'nombutal' moet zijn 'nembutal'. 251. Zin na formule ( 10.24), achter 'gewenst' toevoegen : 'op de waarde van R'. 255. Op de regel onder de bovenste tabel staat {x^ > x^). Dit moet zijn (Xi <
Xj).
286. Derde regel van beneden: 'hy-' moet zijn 'hypo-'. 295. Tabel B: achter 0,420 moet staan —0,202. 296. Tabel C: bij v = 8 staat in de kolom ^0^75 de waarde 0,786. Deze moet luiden 0,706. 297. Tabel D: bij r = 14 staat in de kolom %*o,999 ^^ waarde 26,123; deze moet luiden 36,123. In de v-kolom rechts in de tabel staat op de laatste regels 20 en 39; dit moet zijn 29 en 30. 305. De bronvermelding van tabel H is onjuist. Deze tabel is ontleend aan een artikel van R. VAN STRIK, 'Toeval of regelmaat in het fluctuatiepatroon van opeenvolgende waamemingsuitkomsten'. Mededelingenblad Medisch-Biol. Sectie V.v.S., Nr. 7, 1959.
VERHANDELING VAN HET NEDERLANDS INSTITUUT VOOR PRAEVENTIEVE GENEESKUNDE XLI
INLEIDING TOT DE
MEDISCHE STATISTIEK DEELl FUNDAMENTELE BEGRIPPEN EN
TECHNIEKEN
VERDELINGSVRIJE METHODEN
DOOR
H.DE JONGE
1958
VOORWOORD
Dit boek is bestemd voor artsen en andere werkers op biometrisch gebied, die kennis willen nemen van de statistische technieken voor het analyseren van waamemingsuitkomsten. Het is ontstaan uit de syllabus, die gedurende enige jaren bij verschillende bio-statistische cursussen door mij werd gebruikt. Ik heb getracht de statistische gedachtengang er zodanig in weer te geven, dat de beschrijving van de statistische techmeken niet alleen behoeft te bestaan uit het geven van reeksen 'recepten', die slechts blindelings kunnen worden gevolgd. Bij deze opzet kan (en mag) de wiskunde niet achterwege blijven. De dosis wiskunde is echter bewust beperkt, zodat zij ook voor de nietmathematisch geïnteresseerde lezer verteerbaar is. Wèl is een ruim gebruik gemaakt van symbolen en formules, doch deze worden geleidelijk ingevoerd en verduidelijkt. De moeite die men zich aanvankelijk moet getroosten om met deze S37mbolen en formules vertrouwd te raken wordt echter ruimschoots vergoed door de voordelen, die het gebruik ervan oplevert. Het verdient daarom aanbeveling deel IA (fundamentele begrippen en technieken) grondig en in een kalm tempo door te nemen, de voorbeelden nauwkeurig te bestuderen en de opgaven zoveel mogelijk te maken. Men zal dan de technieken, die in de delen IB en II behandeld worden, vlot kunnen volgen. Deel IB is gewijd aan de verdelingsvrije methoden. Zoals bekend mag worden verondersteld behoeft men hierbij geen ondersteUingen te maken omtrent de vorm van de bestudeerde frequentieverdelingen, terwijl uit didactisch oogpunt van belang is dat zij merendeels betrekkelijk eenvoudig kunnen worden afgeleid en gewoonlijk weinig rekenwerk vergen. Het erkennen van deze klaarblijkelijke voordelen van de verdelingsvrije methoden behoeft echter niet in te houden, dat men de klassieke melïioden - die in deel II aan de orde komen - terzijde schuift. Er bestaan immers ook op medisch-biologisch gebied vele problemen, waarbij men voldoende omtrent de bestudeerde verdelingen weet of te weten kan komen, om tot een verantwoorde toepassing van een klassieke methode over te gaan. Men verkrijgt dan niet alleen meer in-
formatie uit het waamemingsmateriaal dan met de overeenkomstige verdelingsvrije methode, doch men kan bovendien gebruik maken van verschillende complexe, maar bijzonder doeltreffende proefopzetten, die zich (nog) niet voor een verdelingsvrije bewerking lenen. In de praktijk zal men bij elk probleem tot een bewuste keuze tussen beide soorten methoden moeten komen en in deel II zal mede worden nagegaan, welke factoren daarbij een rol spelen. Voor de medewerking die ik bij het tot stand komen van dit boek heb ondervonden, ben ik velen dank verschuldigd. Deze dank gaat in de eerste plaats uit naar het Nederlands Instituut voor Praeventieve Geneeskimde, dat mij in staat stelde deze arbeid ter hand te nemen. Voorts naar de Heer C. A. G. Nass, Hoofd van de Afdeling Statistiek van dit Instituut, die mij wegwijs maakte op het biometrische toepassingsgebied van de statistiek. Zijn lessen en zijn visie op de statistica zijn bepalend geweest voor de door mij gevolgde gedachtengang. De samenwerking biimen deze Afdeling met Dr. M. J. W. de Groot was mede van grote betekenis, daar ik veelvuldig gebruik kon maken van zijn inzichten op het terrein van de medische statistiek; verschillende voorbeelden en opgaven zijn van hem afkomstig. Ook aan de andere leden van de Afdeling Statisti'ek ben ik dank verschuldigd en wel in het bijzonder aan de dames J. S. de Graaff en V. F. Ooms en aan de Heer P. van Leeuwen, die vele berekeningen uitvoerden en mij een grote hulp zijn geweest bij de correctie. Vele medewerkers aan het Instituut en een aantal cursisten kwamen met suggesties, die tot wezenlijke verbeteringen hebben geleid. In vele opzichten is dit boek een compromis. Van opmerkingen, die tot aanvullingen en verbeteringen leiden zal ik dan ook gaarne kennis nemen. Intussen hoop ik, dat het werk reeds in de huidige vorm van nut zal kunnen zijn voor degenen, die de statistiek wiUen gebruiken bij de oplossing van problemen op medisch-biologisch gebied. Leiden, October 1958.
VI
H. DE JONGE
INHOUDSOPGAVE D E E L A: FUNDAMENTELE BEGRIPPEN EN TECHNIEKEN 1. INLEIDING 1.1. POPULATIES EN STEEKPROEVEN
1
1.1.1. Populaties 1.1.2. Variabiliteit 1.1.3. Steekproeven
1 2 5
1.2. STATISTIEK 1.3. HET TREKKEN VAN ASELECTE STEEKPROEVEN . ,
6 9
1.3.1. Aselecte getallen 1.3.2. Lotingstabellen 1.3.3. Andere Steekproeftechnieken 1.3.4. Opgaven
9 H 12 15
1.4. PROEFOPZET EN STATISTIEK
1.4.1. 1.4.2. 1.4.3. 1.4.4.
15
Inleiding Proefopzet, planning en statistiek . . . . . . . . Moeilijkheden bij detectieproblemen Opgaven
15 16 23 27
2. REDUCTIE VAN WAARNEMINGSUITKOMSTEN 2 . 1 . HET OPSTELLEN VAN EEN FREQÜENTIEVERDEUNG
2.1.1. 2.1.2. 2.1.3. 2.1.4. 2.1.5. 2.1.6.
32
Attributen Waarden Verlies bij reductie tot een frequentieverdeling. . . Het opstellen van een correlatietabel Sorteermethoden Opgaven . . . : . . . .
2.2. GRAFISCHE VOORSTELLING VAN EEN FREQUENTIEVERDELING .
2.2.1. 2.2.2. 2.2.3. 2.2.4. 2.2.5. 2.2.6.
Het kolonunendiagram De frequentiepolygoon Het spreidingsdiagram Andere grafiekvormen Wenken en waarschuwingen Opgaven
'•
2 . 3 . GEMIDDELDEN
2.3.1. Demodus 2.3.2. De mediaan 2.3.3. Het rekenkundig gemiddelde 2 . 4 . SPREIDINGSMATEN
2.4.1. 2.4.2. 2.4.3. 2.4.4. 2.4.5.
De spreidingsbreedte De gemiddelde afwijking Fractielen en het kwartideninterval De variantie en de spreiding (standaarddeviatie) . . Opgaven
32 33 37 38 39 42 43
43 45 47 48 50 53 53
53 54 54 57
57 58 58 58 62 VII
2 . 5 . VEREENVOUDIGDE BEREKENING VAN HET GEMIDDELDE EN DE SPREIDING
2.5.1. Enkde eigenschappen 2.5.2. Berekeningsmethoden 2.5.3. Opgaven
62
62 63 65
3. KANSREKENING 3 . 1 . HET BEGRIP KANS IN HET DAGELIJKS LEVEN 3.2. KANSDEFINITIE 3 . 3 . KANSVERDELINGEN
66 66 67
3.3.1. Definities 3.3.2. Gemiddelde en variantie van een kansverdeling . . . 3.4. KANSREGELS
67 68 69
3.4.1. Somregel 3.4.2. Productregel 3.4.3. Gemiddelde en variómtie van een herleide kansverdeling 3.4.4. Opgaven 3 . 5 . PARAMETERS EN STEEKPROEFFUNCTIES
69 69 71 72 73
3.5.1. Definities 3.5.2. Steekproefvefdelingen 3.5.3. Opgaven
73 74 76
3.6. HET BEGRIP OVERSCHRIJDINGSKANS
77
3.6.1. Definities 3.6.2. Opgaven
77 78
4. ENKELE DISCRETE KANSVERDELINGEN 4 . 1 . STEEKPROEVEN UIT EEN DICHOTOMIE 4 . 2 . HYPERGEOMETRISCHE VERDELINGEN
79 79
4.2.1. Afleiding, gemiddelde en variantie 4.2.2. Toepassing 4.2.3. Opgaven
79 80 81
4 . 3 . BINOMIALE VERDELINGEN
82
4.3.1. 4.3.2. 4.3.3. 4.3.4.
Afleiding, gemiddelde en variantie Berekening De best-passende binomiale verdeling Binomiale benadering van een hypergeometrische verdeling 4.3.5. Opgaven 4.4. POISSONVERDELINGEN
VIII
88 89 90
4.4.1. Een Poissonverdeling als benadering van een binomiale verdeUng 4.4.2. Berekening 4.4.3. Poissonverdelingen als exacte kansverdelingen . . . 4.4.4. De best-passende Poissonverdeling 4.4.5. Opgaven 4 . 5 . STEEKPROEVEN UIT EEN POPULATIE MET K CATEGORIEËN
82 86 87
. .
90 91 93 93 94 95
4.5.1. Algemene hypergeometrische verdeUngen 4.5.2. Multinomiale verdelingen 4.5.3. Opgaven
95 95 97
5. NORMALE VERDELINGEN 5 . 1 . EEN NORMALE VERDELING ALS LIMIET VAN EEN BINOMIALE . 5.2. NORMALE VERDELINGEN EN DE STANDAARDNORMALE VERDELING 5.3. DE STANDAARDNORMALE VERDELING
5.3.1. 5.3.2. 5.3.3. 5.3.4.
Continue kansverdelingen Linkse, rechtse en tweezijdige overschrijdingskansen Tabellen van de standaardnormale verdeling . . . Opgaven
5.4. BENADERING VAN EEN BINOMIALE VERDELING DOOR DE BEST-PASSENDE NORMALE VERDELING
5.4.1. Binomiale verdelingen met P = Ç = Va 5.4.2. Binomiale verdelingen met P # Vz 5.4.3. Opgaven 5.5. BEST-PASSENDE NORMALE VERDELINGEN
98 100 103
103 104 105 108 109
109 ''2 112 113
5.5.1. Berekening van de best-passende normale verdeling . 5.5.2. Normaal waarschijnlijkheidspapier 5!5.3. Opgaven
113 113 114
5.6. KARAKTERISERING VAN E E N FREQUENTIEVERDELING . . . .
114
5.6.1. 5.6.2. 5.6.3. 5.6.4.
Enkele verdelingstj^en 114 Karakterisering van pseudo-nonnale verdelingen . . 117 Transformaties tot pseudo-normaliteit 117 Karakterisering van andere verdelingstypen . . . . 118
6. BEGINSELEN DER TOETSINGSTHEORIE 6 . 1 . GRONDSLAGEN VAN DE TOETSINGSTHEORIE
6.1.1. Probleemstelling 6.1.2. Termen en begrippen 6.1.3. De verdelingen van de toetsingsgrootheid onder Hf, en Hl 6.1.4. Het opstellen van een beslissingsschema 6.1.5. De invloed van de steekproefomvang op de foutenkansen 6.1.6. Het vaststellen van de steekproefomvang bij gegeven Po.Pi,aen/5 6.1.7. Opgaven 6.2. TOETSING VAN DE HYPOTHESE P = l/g
6.2.1. 6.2.2. 6.2.3. 6.2.4. 6.2.5.
Algemene gang van zaken Éénzijdige of tweezijdige toetsing De werkingskromme Uitvoering van de toetsing Opgaven
6.3. TOETSING VAN DE HYPOTHESE P = P ^ 5^ ^ 2
120
120 121 121 122 127 130 133 133
133 135 136 139 142 *^^
IX
6.3.1. Exacte toetsing 6.3.2. Normale benadering 6.3.3. Opgaven
, . . , . .
6.4. SEQÜENTE TOETSING
142 143 143 144
6.4.1, Algemene gang vém zaken ,. 144 6.4.2, Rechts éénzijdige sequente binomiale toetsing , , . 145 6.4.3, Sequente binomiale toetsing met drie IbeslissingsmogeHjkheden, . , , , , , '. 152 6.5, SAMENVATTING
152
7, BEGINSELEN DER SCHATTINGSTHEORIE 7 . 1 , GRONDSLAGEN VAN DE SCHATTINGSTHEORIE
154
7.1.1, Termen en begrippen 7.1.2, Puntschattingen 7.1.3, Intervalschattingen , , . ,
154 155 155
7.2, BETROÜWBAARHEIDSGRENZEN VAN EEN FRACTIE ,,
7.2.1, 7.2.2, 7.2.3, 7.2.4, 7.2.5,
Exacte grenzen Grafieken met betrouwbaarheidsgrenzen van P . . . Tabellen met betrouwbaarheidsgrenzen van P , , , Berekening van betrouwbaarheidsgrenzen van P , , Berekening van de steekproefomvang, nodig voor het verkrijgen van een betrouwbaarheidsinterval van gegeven breedte , , , 7.2.6, Opgaven
7.3, SCHATTEN EN TOETSEN
,
156
156 160 160 162 163 164 165
D E E L B: VERDELINGSVRIJE METHODEN 8, OVERZICHT VAN DE VERDELINGSVRIJE METHODEN 8 . 1 . VERDELINGSVRIJEEN KLASSIEKE METHODEN 8.2. DE VERDELINGSVRIJE TOETSEN IN TABEL 8,1 8.3. ANDERE METHODEN
169 169 171
9, KWALITATIEVE VERDELINGSVRIJE TOETSEN 9 . 1 . INLEIDING
173
9.1.1. Exacte toetsing van de hsrpothese P^ = Pg = P , . 9.1.2. X^ als maat voor de discrepantie tussen waargenomen en verwachte frequenties 9.1.3. /^-verdelingen 9.1.4. Opgaven
173 175 178 181
9 . 2 . DE /^-BENADERING VOOR HET TOETSEN VAN HYPOTHESEN BETREFFENDE DE POPULATIEVERDELING
181
9.2.1, De populatieverdeling telt k categorieën en is onder Ä^B volledig gespecificeerd 181 9.2.2, Populatieverdelingen met 2 categorieën 183 9.2.3, Toepassing op kwantitatieve waarnemingen , . . i 184 X
9.2.4. Combinatie van : categorieën bij toepassing van de /^-benadering 184 9.2.5, Opgaven 186 9 . 3 . DE TEKENTOETS
9.3.1, 9.3.2, 9.3.3, 9.3.4, 9.3.5, 9.3.6,
188
Toepassing 188 De toetsingsgrootheid 188 De verdeling van de toetsingsgrootheid onder fl^o , , 188 Uitvoering van de toetsing 189 Toepassing op kwantitatieve waarnemingen . . , , 189 Opgaven 190
9.4. DE TOETS VAN COCHRAN
190
9.4.1, 9.4.2, 9.4.3, 9.4.4, 9.4.5,
Toepassing De toetsingsgrootheid De verdeling van de toetsingsgrootheid onder £fo, , Uitvoering van de toetsing Toepassing op kwantitatieve waarnemingen : de toets van MooD 9.4.6, Opgave 9.5. DE TOETS VAN FiSHER
,
192 193 193
9.5.1. 9.5.2. 9.5.3. 9.5.4. 9.5.5.
Toepassing De toetsingsgrootheid De verdeling van de toetsingsgrootheid onder jffo. . Uitvoering van de toetsing Toetsing voor kleine kansen met behulp van even grote steekproeven 9.5.6. Toepassing op kwantitatieve waarnemingen: de mediaantoets 9.5.7. Opgaven . 9.6. D E / * - T 0 E T S OP DE 2 X Ä TABEL
9.6.1. 9.6.2. 9.6.3. 9.6.4. 9.6.5. 9.6.6.
190 191 191 191
193 194 194 195 200 201 202 204
Toepassing 204 De toetsingsgrootheid 205 De verdeling van de toetsingsgrootheid onder H^. . 207 Uitvoering van de toetsing 207 Toepassing op kwantitatieve waarnemingen , , , , 207 Opgaven 207
9.7. DE/*-TOETS OP DE X X 2 T A B E L
208
9.7.1. Toepassing op kwalitatieve waarnemingen . . . . 208 9.7.2. Toepassing op kwantitatieve waarnemingen: de mediaantoets voor k steekproeven 208 9.8. DE %*-TOETSOPDE üfXÄTABEL
209
9.8.1. Toepassing op kwalitatieve waarnemingen . . . . 209 9.8.2, Toepassing op kwantitatieve waarnemingen , . . . 210 9 . 9 . GEBRUIK VAN DE /«-TOETSEN BIJ TOETSING VAN DE HYPOTHESE, DAT TWEE CATEGORISCHE SYSTEMEN STOCHASTISCH ONAFHANKELIJK ZIJN '.
9.9.1. Toepassing 9.9.2, De toetsingsgrootheid
211
; . 211 , , , 211 XI
9.9.3, Verdeling van de toetsingsgrootheid onder H^ en uitvoering van de toetsing 212 9.9.4, Toepassing op kwantitatieve waarnemingen . , . . 212 9.9.5, Opgaven 214 10, KWANTITATIEVE VERDELINGSVRIJE TOETSEN 10.1, DE/«-TOETS VOOR AANPASSING
10.1.1, Toepassing 10.1.2, Uitvoering van de toetsing 10.1.3, Opgaven 10.2, DE TOETS VAN KOLMOGOROV-SMIRNOV (K-S TOETS)
10.2.1, 10.2.2, 10.2.3, 10.2.4, 10.2.5,
XII
237
Toepassing 237 De toetsingsgrootheid 238 De verdeling van de toetsingsgrootheid onder Ä j . , 238 Uitvoering van de toetsing zonder gehjken . , , , 240 Uitvoering van de toetsing met gelijken 241 Berekeningsschema 242 Opgaven , , 244
10.6, DE TOETS VAN KRÜSKAL & WALLIS
10.6.1. 10.6.2. 10.6.3. 10.6.4. 10.6.5. 10.6.6.
230
Toepassing 230 De toetsingsgrootheid 231 De verdeling van de toetsingsgrootheid onder jffj- • ^ ' Uitvoering van de toetsing zonder gehjken . . . . 232 Uitvoering van de toetsing met gelijken 233 De overeenstemmingscoëfiiciënt 234 k = 2: overgang in de tekentoets 235 Opgaven 236
10.5, DE TOETS VAN WiLCOXON
10.5.1. 10.5.2. 10.5.3. 10.5.4. 10.5.5. 10.5.6. 10.5.7.
221
Toepassing 221 De toetsingsgrootheid 222 De verdeling van de toetsingsgrootheid onder Hf^. . 223 Uitvoering van de toetsing zonder gelijken . , , , 224 Uitvoering van de toetsing met gelijken 226 Opgaven 228
10.4, DE TOETS VAN FRIEDMAN
10.4.1. 10.4.2. 10.4.3. 10.4.4. 10.4.5. 10.4.6. 10.4.7. 10.4.8.
217
Toepassing 217 Uitvoering van de toetsing 217 Schatting van de populatieverdeling 219 Toepassing op discreet verdeelde waarnemingen , , 219 Opgaven 220
10.3, DE RANG-TEKENTOETS
10.3.1, 10.3.2, 10.3.3, 10.3.4. 10.3.5. 10.3.6.
215
215 215 217
246
Toepassing 246 De toetsingsgrootheid 246 De verdeling van de toetsingsgrootheid onder Hg. . 247 Uitvoering van de toetsing 248 k = 2: overgang in de toets van WILCOXON . . . . 249 Opgaven 249
10.7. DE RANGCORRELATIETOETS VAN SPEARMAN
10.7.1, 10.7.2, 10.7.3, 10.7.4, 10.7.5, 10.7.6, 10.7.7,
10.8. D E RANGCORRELATIETOETS VAN K E N D A L L
10.8.1, 10.8.2, 10.8.3, 10.8.4, 10.8.5, 10.8.6, 10.8.7,
249
Toepassing 249 De toetsingsgrootheid 250 De verdeling van de toetsingsgrootheid onder Zfo- • 250 Uitvoering van de toetsing zonder gelijken . . . . 251 Uitvoering van de toetsing met gelijken 253 De rangcorrelatiecoëfiiciënt van SPEARMAN , , . . 253 Opgaven 254 254
Toepassing 254 De toetsingsgrootheid 254 De verdeling van de toetsingsgrootheid onder H^. . 256 Uitvoering van de toetsing zonder gelijken , , . . 257 Uitvoering van de toetsing met gelijken 257 De rangcorrelatiecoëfiiciënt van KENDALL , , . . 258 Opgaven 258
10.9. KEUZE V A N E E N RANGCORRELATIETOETS
258
11. VERDELINGSVRIJE TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEKS 11.1. INLEIDING . . . , , , , 261 11.2. DE RANGCORRELATIETOETSEN ALS TOETSEN TEGEN VERLOOP . 264 11.3. DE SERIETOETS OP DE WAARNEMINGEN 265
11.3.1. 11.3.2. 11.3.3. 11.3.4. 11.3.5.
Toepassing 265 De toetsingsgrootheid 265 De verdeling van de toetsingsgrootheid onder ffo. . 266 Uitvoering van de toetsing 267 Toepassing op twee aselecte steekproeven 269
11.4. DE SERIETOETS OP VERSCHILLEN TUSSEN OPEENVOLGENDE WAARNEMINGEN
11.4.1. 11.4.2. 11.4.3. 11.4.4.
271
Toepassing 271 De toetsingsgrootheid 271 De verdeling van de toetsingsgrootheid onder H^. . 271 Uitvoering van de toetsing 272
11.5. DE TOETS OP DE TEKENS VAN DE OPEENVOLGENDE WAARNEMINGEN 272 11.6. KEUZE VAN EEN TOETS TEGEN VERLOOP 273 11.7. OPGAVEN 276
12. VERDELINGSVRIJE TOETSEN TEGEN VERLOOP IN STEEKPROEVEN 12.1. DE TOETS VAN TERPSTRA VOOR K ASELECTE STEEKPROEVEN . 278
12.1.1, 12.1.2, 12.1.3, 12.1.4, 12.1.5, 12.1.6,
Toepassing 278 De toetsingsgrootheid 279 Verdeling van de toetsingsgrootheid onder/^o • • • 280 Uitvoering van de toetsing zonder gelijken , . . . 281 Uitvoering van de toetsing met gehjken 282 Toepassing op steekpr, uit dichotome populaties . , 282 XIII
12.2. TOETS TEGEN VERLOOP VOOR K VERWANTE STEEKPROEVEN .
284
12.2.1. Toepassing 12.2.2, Uitvoering van de toetsing
284 284
12.3. TOETSEN BETREFFENDE i r 2X2 TABELLEN
286
12.3.1. Toepassing 286 12.3.2. De toetsingsgrootheid, haar verdeling onder K^ en uitvoering van de toetsing 288 12.4. OPGAVEN
291
BIJLAGEN I.
TABELLENVERZAME]LING
I I . ELEMENTAIRE ALGEBRA
1. Het gebruik van symbolen 2. Permutaties en combinaties 3. Exponenten en wortels 4. Logarithmen 5. Benaderende getallen 6. Coördinaatassen . I I I . LITERATUUROPGAVE
xrv
,
293 318
318 320 322 323 325 328 331
FUNDAMENTELE BEGRIPPEN EN T E C H N I E K E N
'It may be interesting to remark here on the origins of the theory of statistics. Certain areas of biological experimentation reached a point where what are now called statistical methods were imperative if further progress was to be made. The essentials of statistical theory were then evolved by the biologists themselves. This parallels the natural history of almost any branch of abstract knowledge, but it is nevertheless curious in the case of statistics. For the theory of statistics appears to be a very natural development of the theory of probabiUty, which is several hundred years old; somehow it was almost completely overlooked by workers in that field.' A. M. MOOD 'The statistical method is essentially a technic, which finds its justification in its usefulness in helping to solve the problems of the basic sciences. Statistics, in any proper sense, has no, or at best few, problems of its own. Its technical problems are really problems of mathematics. The statistical method is, or should be, a working tool of science, just as is the microscope or the kymograph. But it is probably of wider utility than any other single technical method which science has discovered or devised. For it has an apphcability and a useftüness, direct or indirect, in virtually every problem. It is, in short, a fundamental element of scientific methodology.' R. PEARL XV
HOOFDSTUK 1.
INLEIDING 1.1. Populaties en steekproeven In deze paragraaf behandelen wij een aantal termen en begrippen, die in de statistiek een centrale plaats innemen. Wij volgen hierbij grotendeels het normontwerp 'Statistische termen en begrippen', nr. 3117, uitgegeven door de Hoofdcommissie voor de Normalisatie in Nederland en samengesteld door de commissie 'Toepassing van statistische methoden'. 1.1.1. POPULATIES
Een populatie is een verzameling van operationeel gedefinieerde elementen, waarop de conclusies van een onderzoek betrekking zullen hebben. Een operationele definitie is een voorschrift, met behulp waarvan kan worden vastgesteld, of een element al dan niet tot de populatie behoort. De elementen van een populatie behoeven geen materiële objecten te zijn. Zij kunnen ook gebeurtenissen zijn (sterfgevallen, huwelijken, ongevallen), dan wel momentele toestanden van materiële objecten, of abstracte of denkbeeldige objecten (zoals getallen). Tevens kunnen zij deel uitmaken van een andere populatie. Het aantal elementen van een populatie noemt men de populatieomvang. Wij geven deze omvang steeds aan met de hoofdletter N. Voorbeelden 1.1. De mannen van 20 t/m 24 jaar, die op 1 januari 1958 in een bepaald bedrijf werkzaam waren, 1.2. De mannen van 20 t/m 24 jaar, die op 1 januari 1958 in de afdeling A van dat bedrijf werkzaam waren. Dit is een deelverzameling (deelpqpulatie) van de populatie in 1.1. 1.3. De gehele getallen van 1 t/m 1000. 1.4. Wegingen van een bepaald voorwerp, die waarnemer B met een bepaalde balans op voorgeschreven wijze heeft verricht of zou kunnen verrichten. 1.5. De kinderen van 6 en 7 jaar op 3 bepaalde lagere scholen in de stad R op 30 september 1957. Enkele voorbeelden, waarbij de operationele definitie ontbreekt of onvoldoende is :
1
1.1
INLEIDING
1.6. De bomen in een bepaald bos (zonder dat is aangegeven, waaneer een jonge plant een boom genoemd wordt). 1.7. De Europeanen in Indonesië (zonder dat wordt aangegeven, wanneer personen van gemengd bloed als Europeanen worden beschouwd).
Een kenmerk is een eigenschap, die de elementen van een populatie kunnen bezitten. Men spreekt van: a. Een attribuut, als het kenmerk kwaUtatief is (bv. de kleur blauw). b. Een waarde, als het kenmerk kwantitatief is (bv. de leeftijd van 20 jaar). Een combinatie van kenmerken is zelf ook een kenmerk (bv. de leeftijd van 20 t/m 24 jaar). Een categorisch systeem wordt gedefinieerd met betrekking tot een bepaalde populatie en is een zodanige verzameHng van kenmerken, dat ieder element van de populatie geacht wordt er juist één van te bezitten. Een categorisch systeem bestaande uit twee kenmerken heet een dichotomie (ook: alternatief, tweedeling). Voorbeelden 1. 8. De toevoeging 'met betrekking tot een bepaalde populatie' is noodzakelijk. Immers, een systeem (van enkelvoudige kleuren) kan categorisch zijn met betrekking tot één populatie (van efien stofEen), maar niet met betrekking tot een andere (van bonte stofien). Enige categorische systemen met betrekking tot de populatie in voorbeeld 1.1 zijn: 1. 9. Gehuwd — ongehuwd (dichotomie). 1.10. De bloedgroepen: O, A, B en AB. 1.11. De leeftijden: 20. 21, 22, 23 en 24 jaar. En met betrekking tot de populatie in voorbeeld 1.5: 1.12. De graden: goed - voldoende - matig - onvoldoende - slecht, die bij medisch onderzoek worden toegekend op grond van de fysieke conditie van de kinderen. 1.13. De hemoglobinegehalten van het bloed in g%, afgerond op 0,1 g%. De categorische S3«temen in de voorbeelden 1.9, 1.10 en 1.12 betreffen attributen, die in de voorbeelden 1.11 en 1.13 waarden. 1.1.2. VARIABILITEIT
Onder variabiliteit'verstaa-t men het verschijnsel, dat de elementen van een populatie verschillende kenmerken van een categorisch systeem bezitten. Fluctuatie is het verschijnsel van variabiliteit in een populatie, waarvan de elementen op de een of andere wijze (bv. chronologisch) zijn gerangschikt. Een variabele of veranderlijke is een grootheid, die voor ieder kenmerk van een categorisch systeem juist één waarde aanneemt. Indien de kenmerken van een categorisch systeem kwantitatief zijn (zie de voorbeelden 1,11 en 1,13), vormen hun waarden zelf een dergelijke grootheid, maar ook hun rangnummers naar opklimmende waarde, de logarithmen van hun waarden, e.d. Indien de kenmerken kwalitatief zijn (voorbeel-
POPULATIES EN STEEKPROEVEN
1.1
den 1.9, 1.10 en 1.12) kan het zin hebben, de kenmerken te nummeren en deze nummers te beschouwen als de waarden, die door een variabelie worden aangenomen (zie voorbeeld 1.12, waarbij men aan de graden resp. de nummers 5, 4, 3, 2 en I zou kunnen toekennen). Een variabele heet discreet (of discontinu) als deze uitsluitend een aantal afzonderlijke waarden kan aannemen (voorbeelden: het aantal kinderen per gezin, het aantal ziekmeldingen per arbeider per jaar). Een variabele heet continu als deze binnen zekere grenzen iedere waarde kan aannemen (voorbeelden: de lichaanislengte, de systolische bloeddruk, de tijd die verloopt tussen twee gebeurtenissen). Tengevolge van de begrensde nauwkeurigheid van iedere meettechniek kan een in principe continue variabele in werkelijkheid slechts in discrete waarden worden gemeten. Waarnemen is het proces waardoor wordt bepaald, welk kenmerk van een gegeven categorisch systeem een zéker element geacht wordt te bezitten; het waarnemen van kwantitatieve kenmerken noemt men meten. De bij het waamenlen verkregen uitkomsten worden kortweg waarnemingen genoemd. Een klasse is de verzameling van alle elementen van e^upppulatie, die een gegeven kenmerk bezitten. Als het kenmerk daaruit bestaat, dat de waarde van een gegeven variabele in een zeker interval ligt, noemt men dit interval zelf ook de klasse. De eindpunten van zo'n klasse (interval) noemt men de klassegrenzen en de afstand van deze klassegrenzen de klassebreedte. Onder de klassewaarde verstaat men het midden vaii de klasse, d.i. (bovengrens -\- benedengrens)/2. Voorbeeld 1.14. Het kenmerk: 'bloeddruk 93 t/m 97 mm Hg' vormt een klasse. Als in mm nauwkeurig gemeten is, zodat het afrondingsinterval (het kleinst mogelijke positieve verschil - nul niet meegerekend - tussen twee uitkomsten) 1 mm bedraagt, zijn de klassegrenzen resp. 92,5 en 97,5, zodat de klassebreedte 5 mm Hg en het klassemidden 95 mm Hg is.
Het aantal elementen van een populatie, dat het kenmerk A bezit (waarvoor de waarde van een variabele in de klasse A ligt) noemt men de (absolute) frequentie f^ van da.t kenmerk (van die klasse). Deze frequentie, gedeeld door de omvang van de populatie, dus de fractie /AIN, heet de relatieve frequentie (of: het frequentie-quotiënt). De verzameling van de (relatieve) frequenties van alle kenmerken van een categorisch sj^steem vormt de (relatieve) frequentieverdeling. De somfrequentie F^ van de klasse A van een variabele is het aantal elementen van een populatie, waarvan de waarde de bovengrens van deze klasse niet overschrijdt. De relatieve somfrequentie F^/iV noemt men ook wel de somfunctie. De somfrequenties van alle klassen van een
1.1
INLEIDING
variabele vormen de somfrequentieverdeling (of: cumulatieve frequentieverdeling). De frequentieverdeling van een categorisch systeem (van een variabele) op een populatie noemen wij de populatieverdeling van dat systeem (van die variabele). Voorbeelden 1.15. Categorisch systeem uit voorbeeld 1.9 op de populatie in voorbeeld 1.1: Kenmerk (attiibuut) Gehuwd Ongehuwd Totaal
Frequentie ƒ 485 615 1100 = JV
Frequentiequotiënt
f/N
485/1100 = 0,441 615/1100 = 0,559 1.000
1.16. Categorisch systeem uit voorbeeld 1.10 op de populatie in voorbeeld 1.1: Kenmerk (attribuut) Bloedgroep O Bloedgroep A Bloedgroep B Bloedgroep AB Totaal
Frequentie , ƒ 462 490 121 27 1100 = i\r
Frequentiequotiënt
f/N 462/1100 490/1100 121/1100 27/1100
= = = =
0.420 0.445 0.110 0.025 1.000
1.17. Categorisch S3^teem uit voorbeeld 1.11 op de populatie in voorbeeld 1.1: Kenmerk (waarde) 20 (jaar) 21 (jaar) 22 (jaar) 23 (jaar) 24 (jaar) Totaal
Frequentie ƒ 193 115 265 242 285 1100 = iV
Somfrequentie F 193 308 573 815 1100
Rel. somfreq. F/N 0,175 0,280 0.521 0,741 1,000
1.18. Categorisch systeem uit voorbeeld 1.13 (hemoglobinegehalte van het bloed in g%, bloed verkregen uit vingerprik, bepalingen op 1 en 2 oktober 1957, door anal3rste A met Sicca-hemometer nr. xxxx) op de populatie in voorbeeld 1.5. Het hemoglobinegehalte vormt een continue variabele, die in discrete waarden met een afrondingsinterval van 0.1 g% gemeten is. De waarden zijn bijeengebracht in klassen (intervallen) met een breedte van 0,50 g% : X, = ondergrens, Xj = bovengrens van de klasse.
l.l
POPULATIES EN STEEKPROEVEN Klassegrenzen
Klassewaarde X
15.75 — 16.25 15.25 — 15.75 14,75—15.25 14.25—14.75 • 13.76—14.25 13.25—13.75 12.75 — 13.25 12.25 —12.75 11,75—12.25 11.25—11,75 10,75—11.25 10,25 — 10.75 Totaal
•
16.0 15,5 15,0 14.5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5
ƒ
F
f/N
F/N
2 3 11 19 26 46 38 24 15 4 1 1 190
190 188 185 174 155 129 83 45 21 6 2 1 -
0,011 0,016 0.058 0.100 0,137 0.242 0,200 0.126 0.079 0.021 0,005 0.005 1.000
1,000 0,989 0,973 0,915 0.815 0,678 0,436 0,236 0,110 0,031 0,010 0.005 -
1.1.3. STEEKPROEVEN
Elk onderzoek heeft ten doel de variatie te bestuderen, die optreedt in de eigenschappen van de elementen van een populatie. In de praktijk is het slechts zelden mogelijk alle elementen van de populatie in het onderzoek te betrekken. Vaak zal de reden hiervan zijn, dat de omvang van de populatie te groot is, zodat zo'n voUedig onderzoek te tijdrovend en/of te kostbaar wordt. Ook kan het voorkomen, dat de elementen door het onderzoek zelf (gedeeltelijk) verloren gaan of onbruikbaar worden voor het doel waarvoor zij bestemd zijn. Opent men bv. een ampul met een injectievloeistof om de inhoud daarvan te analyseren, dan is deze voor verder gebruik ongeschikt. Men zal dan moeten overgaan tot het trekken van een monster of steekproef, d.i. een operationeel gedefinieerde verzameling van uit de te bestuderen populatie afkomstige elementen. Men spreekt hierbij van een aselecte trekking, als men een element uit de populatie neemt door middel van een methode, die onafhankelijk is van alle kenmerken van het element, die voor het onderzoek van belang zijn. Bij een aselecte trekking met teruglegging wordt het getrokken element, nadat hieraan waarnemingen zijn verricht, weer aan de populatie toegevoegd (het wordt 'teruggelegd'), zodat deze gedurende het trekken niet verandert. Dit element kan dus bij een volgende trekking opnieuw worden aangewezen. Bij een aselecte trekking zonder teruglegging wordt het getrokken element niet weer aan de populatie toegevoegd, zodat het bij een volgende trekking niet andermaal kan worden aangewezen. Daar een steekproef bestaat uit elementen van een populatie gelden de begrippen en termen in 1.1.1 en 1.1.2 ook voor steekproeven. De frequentieverdeling van een categorisch systeem of variabele op een steekproef noemen wij hierbij een waargenomen frequentieverdeling. Het
1.2
INLEIDING
aantal elementen in een steekproef, de steekproefomvang, duiden wij steeds aan met de kleine letter n. Een steekproefregel is een voorschrift dat aangeeft hoe een steekproef moet worden getrokken. Al naar de aard van de gegeven regel onderscheidt men verschillende t3^en van steekproeven. Als alle elementen van de steekproef worden verkregen door aselecte trekkingen uit de populatie (met of zonder teruglegging) spreekt men van een volledig aselecte of enkelvoudige steekproef (met of zonder teruglegging), of kortweg van een aselecte steekproef (wij laten voorlopig andere steekproeftypen buiten beschouwing). Waarnemingen verricht aan de elementen van een aselecte steekproef met teruglegging noemt men onafhankelijke waarnemingen. 1.2. Statistiek De beschrijvende statistiek omvat de technieken, die gebruikt kunnen worden voor het reduceren en representeren van waarnemingen. Zij betreffen : 1. De ordening van de waarnemingen door het samenstellen van tabellen, bv. betreffende de (waargenomen) frequentieverdeUng van een categorisch systeem of de relatie tussen twee grootheden. 2. Het geven van een grafische voorstelling van de waarnemingen (bv. van hun verloop in de tijd), van him frequentieverdeUng, geografische spreiding, e.d. 3. Het samenvatten van de waarnemingen of van hun verdeling door middel van gemiddelden, spreidingsmaten, e.d. Deze technieken kunnen forden toegepast op waarnemingen betreffende populaties èn op /waarnemingen betreffende steekproeven. Zij worden in hoofdstuk 2 besproken. De mathematische statistiek of statistica berust op de toepassing van de kans- of waarschijnlijkheidsrekening, een onderdeel van de wiskunde waarvan enkele aspecten in de hoofdstukken 3, 4 en 5 behandeld worden. Hiertoe behoren de technieken, waarmee men op basis van waarnemingen verricht aan de elementen van aselecte steekproeven tot uitspraken kan komen omtrent de populaties waaruit deze afkomstig zijn. Naar het karakter van deze uitspraken kan men onderscheiden: 1. Technieken voor het toetsen van hypothesen betreffende de populatieverdeUng. Bv, : Men wil voor een bepaalde populatie de juistheid onderzoeken (toetsen) van de onderstelling (hypothese), dat deze evenveel mannen als vrouwen bevat. Men trekt een aselecte steekproef zonder teruglegging van 100 personen en daarbij bevinden zich 58 mannen. Is deze uitkomst te verenigen met de te toetsen h3T)othese? De oplossing van problemen van dit type (die uiteraard aanzienlijk complexer kunnen
STATISTIEK
1.2
zijn dan dit eenvoudige voorbeeld) kan plaatsvinden met behulp van de statistische toetsingstheorie, waarvan de principes in hoofdstuk 6 worden behandeld. 2. Techmeken voor het geven van schattingen betreffende de populatieverdeling. Bv. : Men wü weten, welk percentage mannen een bepaalde populatie bevat. Men trekt daartoe aselect zonder teruglegging een steekproef van 200 personen en deze bevat 143 mannen. Welke schatting van het populatiepercentage kan men op grond van deze uitkomst geven? Problemen van dit tjrpe kunnen worden opgelost met behulp van de statistische schattingstheorie, waarop wij in hoofdstuk 7 terugkomen. Met behulp van de statistica kan men niet tot een uitspraak omtrent de populatie komen, die zonder enige reserve juist is. In dit opzicht is. een statistische uitspraak dus evenmin exact als een intmtief getrokken conclusie. De exactheid die door toepassing van de statistica wordt ingevoerd bestaat daaruit, dat men kan aangeven hoe groot de kafas is dat een bepaalde uitspraak, gebaseerd op een aselecte steekproef, foutief is. Men kan dan zelf uitmaken met welke kans op een onjuiste uitspraak men genoegen wil nemen, of zoals men vaak zegt : welke onbetrouwbaarheid van de uitspraak men aanvaardbaar acht. In de regel zal de keuze van deze onbetrouwbaarheid afhangen van de consequenties, die een onjuiste uitspraak heeft. Bij het uitvoeren van een statistische analyse van steekproefwaarnemingen zijn de beschrijvende en de mathematische statistiek meestal met elkaar verweven. Zo zal men bv. - als de steekproefomvang niet te klein is - beginnen met het opstellen van de waargenomen frequentieverdeling. Via het rekenkimdig gemiddelde en de standaarddeviatie ( = een maat voor de spreiding) van deze verdeling kan men onder bepaalde voorwaarden hypothesen betreffende het populatiegemiddelde toetsen of hiervan een sdiatting geven. Of: als men een h3/pothese heeft getoetst aangaande het gemiddelde van meerdere populaties, zal men hierna teruggrijpen naar een grafiek om daarmee bepaalde aspecten van de uitkomst der toetsing te belichten. Dit hoofdstuk en de in het voorgaande genoemde hoofdstukken 2 t/m 7 vormen tezamen deel I-A van dit boek en zij bevatten de fundamentde begrippen, termen en techmeken van de statistiek. Hierop volgt een groot aantal toetsings- en schattingsmethoden, die in twee categorieën zijn gesplitst. In I-B (de hoofdstukken 8 t/m 12) zijn de zg. verdelingsvrije methoden opgenomen. Dit zijn hoofdzakelijk methoden voor het toetsen van hjrpothesen betreffende één of meer populaties, die kunnen worden toegepast zonder dat men onderstellingen behoeft te maken betreffende de vorm van de betrokken populatieverdeUngen. Deel I wordt dan besloten met een drietal bijlagen, t.w. : I. Een tabellenverzameling (met de tabellen A t/m S), II. Enkele hoofdstukken uit de
1.2
INLEIDING
elementaire algebra, die men zo nodig ter repetitie kan naslaan, en III. Een literatuuroverzicht. In de tekst wordt Memaar verwezen door vermelding van de naam van de auteur en/of het volgnummer van de publicatie in dit overzicht. Het tweede deel van dit boek^ behandelt de zg. klassieke methoden. Deze kunnen dienen voor het toetsen van hypothesen en voor het geven van schattingen betreffende gemiddelden en standaarddeviaties van (ongeveer) normaal verdeelde populaties. Wij bespreken hierin tevens, hoe men in de praktijk tot een keuze tussen de verdeHngsvrije en klassieke methoden kan komen en wijden tenslotte een hoofdstuk aan enkele iets meer gecompliceerde schema's van proefopzet, die zich bijzonder goed voor statistische anal3^e lenen. In dit deel worden ook de - zo nodig uitgewerkte of beredeneerde - antwoorden op de opgaven en een index voor beide delen opgenomen. Tenslotte enkele opmerkingen betreffende de keuze, de presentatie en de indeling van de stof. 1°. Elke keuze uit de veelheid van statistische technieken/draagt uiteraard een subjectief karakter. Uit de voorafgaande beschouwing blijkt bv. reeds, dat de bevolkingsstatistiek niet en de beschrijvende statistiek slechts beknopt besproken wordt, zodat de nadruk valt op de statistica. Binnen het laatstgenoemde gebied hebben wij ons echter ook beperkingen moeten opleggen. Zo worden niet alle verdelingsvrij emethoden behandeld, terwijl bij het merendeel van deze methoden het schattingsaspect vrijwel achterwege is gelaten. Bij de klassieke methoden worden alleen de beginselen van de variantie-analyse en lineaire regressie-analyse behandeld: o.i. valt een uitbreiding hiervan (bv. covariantie-analyse, kromhjnige regressie, meervoudige regressie) buiten het kader van deze inleiding, In het algemeen is er naar gestreefd de technieken te geven, die voor de doorsnee-onderzoeker op medischbiologisch terrein van belang zullen zijn, zodat enkele speciale technieken ontbreken, 2°. De behandelde theorie is zoveel mogelijk voorzien van voorbeelden en opgaven. Weliswaar ontstaat op deze wijze een t3^isch 'leer'boek, maar men dringt dan zo direct mogehjk tot de kern der dingen door. Allerlei begrippen, termen en ssmibolen worden geleidelijk ingevoerd en toegeHcht, zodat men deel I-A volledig en grondig moet doorwerken om de hierop volgende toetsings- en schattingstechnieken goed te kunnen volgen. Hierbij dient men feitelijk tenminste een deel van de opgaven zelf te maken, omdat men alleen dan kan vaststellen, of de voorafgaande theorie goed begrepen is. De tabeUen, figuren, formules, voorbeelden en opgaven zijn per hoofdstuk genummerd en zij worden steeds voorafgegaan door het hoofdstuknummer. Wij spreken dus bv. van tabel 3.2 (de tweede tabel in hoofd^ Dit verschijnt voorjaar 1959.
8
HET TREKKEN VAN ASELECTE STEEKPROEVEN
1.3
stuk 3), figuur 5.1, voorbedd 1.15, enz. Bij verwijzing naar formules wordt het nummer echter tussen haakjes geplaatst: 'volgens (2.12)' betekent dus: 'volgens formule 2.12'. 1.3. Het trekken van asdecte steekproeven 1.3.1. ASELECTE GETALLEN
Men zou voor het trekken van een aselecte steekproef met teruglegging van n elementen uit een populatie van N elementen als volgt te werk kunnen gaan. Men nummert de elementen van de populatie van 1 t/m N in een volgorde, die onafhankehjk is van de te onderzoeken kenmerken. Vervolgens construeert men een modelpopulatie bestaande uit evenveel genummerde elementen, bv. kaartjes met de nummers 1 t/m N, die in hoUe kogeltjes worden geplaatst. Deze kogeltjes worden grondig gemengd (bv. in een roterende trommel) en daarna trekt men met teruglegging n kogeltjes, dus n nummers. De elementen met dezelfde nummers uit de oorspronkeHjke populatie vormen dan de gewenste steekproef. Deze 'loterijmethode' kan door een handiger procedure vervangen worden. Men kan nl. volstaan met een modelpopulatie van 10 elementen, genummerd O, 1, 2, , 9 , waaruit men met teruglegging steekproeven van één dement trekt. Deze moddpopulatie kan bestaan uit 10 genummerde fiches, een tienkantige dobbdsteen, e.d. Blijkt de trekkingsmethode aselect te zijn (hetgeen men grondig kan controleren - hoe blijft voorlopig buiten beschouwing) en wü men bv, een steekproef van 20 dementen met teruglegging trekken uit een populatie van 10.000 dementen, dan kan men dit op de volgende wijze doen. Trek 4 reeksen van 20 cijfers uit de moddpopulatie en noteer deze in vier kolommen achter elkaar. Op deze wijze verkrijgt men 20 regels met getallen Ie reeks 2e reeks 3e reeks 4e reeks 0 9
3 7
4 7
1
2
5
7 4
20 cijfers 8
< 9999. Uit de van 1 t/m 10.000 genummerde dementen van de populatie kiest men dan in de steekproef de 20 dementen, die deze nummers dragen (de uitkomst 0000 wordt daarbij gelezen als 10000). Als N niet gelijk is aan een macht van 10 moet dit procédé enigszins
1.3
INLEIDING
gewijzigd worden. Onderstel bv., dat N = 600. Men nummert dan de dementen van de populatie: 000,001, ,599. Om de cijfers van de eenheden en de tientallen uit te loten, trekt men uit de volledige modelpopulatie. Voor het uitloten van het cijfer der honderdtallen laat men daaruit de 6, 7, 8 en 9 weg. Wil men zonder teruglegging trekken, dan wordt een element waarvan het nummer meer dan een keer verschijnt slechts één keer in de steekproef opgenomen. Nu behoeft men voor het trekken van asdecte steekproeven niet zelf een moddpopulatie samen te stellen en daaruit trekkingen te verrichten, omdat reeds tabellen met een zeer groot aantal aselecte getallen (toevalcijfers. Eng. random numbers) zijn samengesteld, o.m. door KENDALL & BABINGTON SMITH (70) en door FISHER & YATES (66, tabel XXXIII). Tabd Q bevat een gedeelte van laatstgenoemde tabellen, waarmee wij het gebruik van aselecte getallen demonstreren. Voorbeeld 1.19. Onderstel, dat men via tabel Q een aselecte steekproef van 5 elementen wil trekken uit de moddpopulatie van 201 elementen in tabel R, die waarden van 10 t/m 30 bezitten. Men dient dan deze dementen eerst te nummeren van 1 t/m 201 ; dit is in tabel R reeds uitgevoerd. Vervolgens leest men uit de tabel met aselecte getallen, te beginnen op een willekeurig punt, getallen van 3 cijfers af. De eerste vijf getallen tussen O (000) en 202 die men hierbij tegenkomt zijn dan de nummers van de vijf elementen van de populatie, die in de steekproef worden opgenomen. Trekt men met teruglegging, dan wordt een element waarvan het nummer meerdere malen wordt getrokken even vaak in de steekproef opgenomen. Trekt men zonder teruglegging, dan kiest men dit dement slechts de eerste keer en slaat het daarna over. Voert men zo'n trekking zonder teruglegging uit, beginnend met kolom 4, regel 26 in tabd Q en kolomsgewijs naar beneden gaand, dan leest men af: 604 767 169 400 005 768 229 593 395 407 595 065 449 321 130 449 070 De steekproef bestaat dus uit de elementen met de nummers 5, 65, 70, 130 en 169. Uit tabel R büjkt dat deze resp. de waarden 20, 16, 24, 19 en 21 bezitten. Men kan deze trekkingsmethode bij iedere populatie- en steekproefomvang gebruiken, op d k willekeurig punt in de tabd met asdecte getallen beginnen en in dke richting aflezen (dus ook langs de rijen of diagonaalsgewijs). Ook als men N dementen op asdecte wijze wil verdden in k groepen van resp. N-^, N^, , JV^ dementen (2Vi -|- iVg -|- . . . + Nt = N), kan men gebruik maken van een tabd met aselecte getallen. 10
H E T T R E K K E N V A N ASELECTE STEEKPROEVEN
1.3
Voorbeeld 1.20. Men wil een groep van 20 dementen asdect spUtsen in drie groepen van resp. 6, 7 en 7 elementen. Men nummert nu deze elementen van 1 t/m 20 en leest vervolgens uit tabel Q zonder teruglegging getallen van 2 djfers af. De 6 getallen tussen O en 21 die het eerst verschijnen leveren de nummers van de elementen in de eerste subgroep, de daaropvolgende 7 getallen tussen O en 21 de nummers van de elementen in de tweede subgroep. De overblijvende 7 getallen bepalen de derde subgroep. Begint men bv. in tabel Q met kolom 2 en regel 8, dan vindt men regel voor regel van links naar rechts gaande de onderstaande reeks getallen. Wij hebben deze volledig opgeschreven en de getallen die achtereenvolgens de dementen in de subgroepen aanwijzen vet gedrukt. In werkelijkheid zal men alleen de getallen noteren, die men nodig heeft, d.w.z. de getallen 00 en 21 t/m 99 en de getallen, die reeds getrokken zijn en opnieuw verschijnen, weglaten: 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 2818 18 07 92 46 44 17 16 58 09 79 83 86 19 62 06 De subgroepen bevatten dus de elementen met de volgende nummers: Subgroep Volgorde van trekking Nummers der elementen 1 16 19 10 12 7 15 7 10 12 15 16 19 2 13 2 9 17 8 18 6 2 6 8 9 13 17 18 3 > l 3 4 S 11 14 20 1.3.2. LOTINGSTABELLEN
Als de populatieomvang of het aantal asdect te splitsen elementen tussen twee vedvouden van 10 Hgt, moet men bij het gebruik van aselecte getallen een deel der trekkingsuitkomsten verwaarlozen. Zo zal men bij voorbeeld 1.19 (met N = 201) en bij voorbeeld 1.20 (met N = 20) gemidddd ongeveer 80% van de getrokken asdecte getallen niet nodig hebben. Trekt men zonder teruglegging, dan kunnen herhalingen voorkomen, waarbij men alleen gebruik maakt van de eerste keer dat een bepaald getal verschijnt (zie de getallenreeks in voorbeeld 1.20). Bij het trekken zonder teruglegging of bij het asdecteren (aselect in subgroepen verdelen, Eng. to randomize) kan men voor N < 200 dan beter gebruik maken van zg. lotingstabellen, waarin de getallen van 1 t/m N in aselecte volgorde zijn opgenomen. In (76A) staan deze voor N = 100, 400, 600 en 1000 en in (28) voor N = 10,20,50,100 en 200. Voor iV = 20 vindt men in de laatstgenoemde publicatie o.m. de vol11
1.3
INLEIDING
gende tabel (41, Serie 1): 06 16 09 07 19 03 18 12 11 01 20 08 13 17 14 05 15 10 02 04 Hiermede kan men, bv. te beginnen met de eerste regel van links naar rechts gaande, de volgende asdectering in subgroepen van 6, 7 en 7 elementen verkrijgen: subgroep l: 6 16 9 7 19 3 subgroep 2: 18 12 11 1 20 8 13 subgroep 3: 17 14 5 15 10 2 4 Wü men met behulp van deze tabel bv. 16 dementen in twee aselecte subgroepen van 8 dementen spUtsen, dan verkrijgt men, met weglating van alle getaUen groter dan 16 en kolomsgewijs aflezend: subgroep 1: subgroep 2:
6 3 5 13 10 7
16 8 11 2
15 9 12 1 14 4
1.3.3. ANDERE STEEKPROEFTECHNIEKEN
Soms kan men bij het steekproeftrekken geen gebruik maken van aselecte getallen. Het kan voorkomen, dat het inventariseren en nummeren van de dementen van de te onderzoeken populatie in principe wel mogeüjk is, maar op grote praktische bezwaren stuit (bv. door de zeer grote populatie-omvang). Ook kan het nummeren onmogehjk zijn (zoals bv. bij een onderzoek betreffende de fauna in een bepaald gebied). In de industrie staan vaak niet alle dementen van de populatie ter beschikking (bij het trekken van een steekproef uit de lopende productie van een fabriek kan men geen producten nemen, die reeds afgeleverd of nog niet vervaardigd zijn). In zulke gevallen zoekt men naar een trekkingsmethode, waarvan men verwacht, dat zij een asdecte steekproef zal opleveren. Wij volstaan hier met het geven van enkele voorbeelden die demonstreren hoe men dan te werk kan gaan. Voorbeelden 1.21. Bij het zg. systematisch steekproeftrekken kiest men bv. uit de stroom van een bepaald product, die door een machine wordt afgeleverd elk i ' (bv. 25») exemplaar in de steekproef. Als de variaties in het product in de volgorde van aflevering toevallig zijn. verkrijgt men op deze wijze een aselecte steekproef. Als echter de mogeUjkheid van een systematische variatie aanwezig is levert deze methode gevaar op. Zo worden bv. vele massaprodukten vervaardigd op machines, waarin op een bepaald moment bv. 10 exemplaren in opvolgende stadia van bewerking aanwezig zijn. Het is dan mogelijk, dat een zekere afwijking telkens bij elk 10» exemplaar terugkeert (en bij { = 10 altijd of nooit wordt geconstateerd). Men kan dit bezwaar ondervangen door binnen een groep van 10 exemplaren het nummer van het te kiezen exemplaar aselect aan te wijzen, dus bv. :
12
HET TREKKEN VAN ASELECTE STEEKPROEVEN
1,3
aselect uit 1 t/m 10: het 6e exemplaar, d,i. exemplaar met volgnummer 6, uit 11 t / m 20: het 3e exemplaar, d.i, exemplaar met volgnummer 13, uit 21 t/m 30: het 9e exemplaar, d.i. exemplaar met volgnummer 29, enz. Deze trekkingsmethode kan ook worden toegepast als men beschikt over een lijst of kaartsysteem, waarin de elementen van de-populatie bv. alfabetisch-lexicografisch gerangschikt staan. Men moet er dan wel op letten, dat deze inventaris van de populatie compleet is en dat hierin geen 'systeem' verborgen zit, dat de aselectiviteit in gevaar brengt. 1.22, Aselecte trekking van sub-gebieden. Onderstel dat men het voorkomen van een bepaalde plantensoort in een gebied wü bestuderen. Dit gebied heeft een zodanige omvang, dat een volledig onderzoek onmogelijk is. Men zal dus met het onderzoek van een deel. d.i. van een 'steekproef', genoegen moeten nemen. Als nu een goede kaart van het gebied beschikbaar is, kan men dit in een groot aantal kaartvierkantjes van gelijk oppervlak verdelen. Als men deze nummert ontstaat een populatie van vierkantj es, waaruit men aselect het te onderzoeken aantal vierkantjes kan trekken. Bij deze methode kunnen echter aan de grenzen van het gebied vele incomplete vierkantjes voorkomen. Als het grensgebied van de nabijgelegen vierkantjes afwijkt (bv. aan zee, aan een meer of aan een gebergte hgt) zal men de incomplete vierkantjes niet mogen verwaarlozen. Men zou deze dan aangrenzend kunnen samenvoegen tot sub-gebieden, waarvan het oppervlak (ongeveer) gelijk is aan dat van de volledige vierkantjes.
Als men geen voUedig asdecte trekküigsmethode kan gebruiken dient het surrogaat hiervoor in ieder geval vrij te zijn van dke persoonlijke invloed bij de trekking. De ervaring heeft nl. geleerd, dat de mens een bijzonder decht instrument voor het maken van een aselecte keuze is: elke subjectieve invloed bij het steekproeftrekken blijkt tot onzuiverheid (selectie. Eng. bias) te Idden tengevolge van (on)bewuste preferenties bij de persoon die de keuze verricht. Om deze reden leidt het zg. doelbewust steekproeftrekken (Eng. purposive sampling), waarbij men tracht een steekproef te formeren die 'representatief' voor de populatie kan worden geacht, gewoonlijk tot een onzuivere steekproef. Deze methode van a priori uitzoeken van wat ts^jerend is zal immers in sterke mate gevoeUg zijn voor zekere vooroordelen van de onderzoeker. Hierbij komt nog, dat men in de regel elementen zal kiezen, die dicht bij het gemidddde liggen, zodat een onjuiste indruk wordt verkregen van de sprdding in de populatie. Voorbeeld 1.23, Uit YuLE en KENDALL (39), gegevens van YATES, Uit een proefveld met tarwe trok men in mei (voordat de aren gevormd waren) en in juni (na de vorming van de aren) resp. 58 en 56 steekproeven van 8 planten. Per steekproef werden 6 planten aselect en 2 planten, steeds door dezelfde onderzoeker, doelbewust (op het oog) gekozen. De 8 planten in elke steekproef werden naar grootte gerangschikt; hierbij konden de op het oog ge-
13
1.3
INLEIDING kozen planten dus twee van de plaatsen 1,2, . . . . 8 innemen. Als zij, evenals de overige zes planten, een aselecte keuze vormen, zullen zij bij beschouwing van aJle steekproeven deze plaatsen met ongeveer gelijke frequentie moeten bezetten. Tabel 1.1 geeft de uitkomsten van dit onderzoek. Tabel 1.1. Afmetingen van tarweplanten. Frequenties van de op het oog gekozen planten voor de rangnummers van 1 t/m 8 Datum 31 mei 28 juni
Rangnummers 1 9 9
2
3
4
5
7 11 8 19 27 23
11 15
6
7
8
18 21 5 10
31 4
Totaal 116 112
Deze uitkomsten tonen duidelijk aan, dat van een aselecte keuze geen sprake is. In mei treedt een uitgesproken preferentie voor de grotere planten op. In juni, na de vorming van de aren, geeft de onderzoeker de voorkeur aan planten van ongeveer gemiddelde grootte en vermijdt hij vooral de grote planten.
Wij dienen nog enkde algemeen verbreide misvattingen betreffende aselectivitdt te noemen. In de eerste plaats is daar de mening, dat een wiUekeurige (lukrake) keuze van elementen een aselecte steekproef oplevert. Dit is vaak niet het geval, omdat allerlei met-vermoede factoren selectief gewerkt kunnen hebben. Als men bv. uit een kooi met 25 ratten lukraak een steekproef van 5 ratten trekt, bestaat de mogelijkheid dat zich hierin juist de dieren bevinden, die in minder goede conditie zijn, daardoor tirager reageren en zich gemakkeUjker laten vangen dan hun levendiger soortgenoten. Bevat de kooi echter aUeen dieren in prima conditie, dan zou men bij zo'n lukrake trekking wel eens vnl. de zwaardere dieren in de steekproef kunnen opnemen, omdat deze indolenter zijn dan de andere. Het is daarom noodzakeUjk een aselecte trekkingsmethode te gebruiken, ook als daar oppervlakkig gezien geen redenen voor schijnen te zijn. Of zoals MAINLAND (46) zegt: 'To omit randomization because one cannot see dearly how bias could occur is Uke trusting that glassware in chemistry is clean because it does not look dirty.' Een tweede misvatting is, dat de aselectiviteit er minder op aankomt, als de steekproef van grote omvang is. Dit is onjuist : het is zelfs zo, dat een effect van selectie, waaraan men bij een kleine steekproefomvang nog geen betekenis behoeft toe te kennen, bij een grote steekproef onmiskenbaar wordt en daardoor tot foutieve conclusies Iddt. Het is in de praktijk lang niet altijd eenvoudig om een steekproeftechniek te vinden, die asdectief is. Het is echter noodzakdijk, omdat alle techmeken van de statistica berusten op de onderstelling, dat de beschouwde steekproeven asdect zijn. Is aan deze voorwaarde niet vol14
1.4
PROEFOPZET EN STATISTIEK
daan, dan zijn in het algemeen ook de uitkomsten van de statistische analyse niet meer voor een valide interpretatie vatbaar. 1.3.4. OPGAVEN 1,1,
Trek met tabel Q tien, steekproeven van 5 elementen (met teruglegging) uit de modelpopulatie in tabel R en noteer hieronder de uitkomsten (resp, het nummer van het getrokken element en zijn waarde) :
Steekproeven Volgorde van 1 2 3 5 6 4 trekking Nr * Nr * Nr * Nr X Nr X Nr 1 2 3 4 5
7 X
Nr
X
10 8 9 Nr * Nr * Nr X
1.2.
Verdeel met behulp van tabel Q een groep van 10 elementen aselect in twee groepen van 5 elementen. Begin in kolom 5, regel 2 en ga kolomsgewijs naar beneden.
1.3.
Verdeel met tabel Q een groep van 30 elementen aselect in drie groepen van 10 elementen. Begin in kolom 1, regel 20 en ga regelsgewijs naar rechts.
1.4.
Uit de voorbeelden van het examen statistisch analjrst. Men wil een dobbelexperiment (één dobbelsteen) met behulp van aselecte getallen nabootsen. Doe een keuze uit de volgende trekkingsvooischriften en motiveer deze: a. Schrijf de aselecte getallen uit de u ter beschikking staande tabel op (volgorde: regels van de tabel), met weglating van de cijfers 7, 8. 9 en 10. Beschouw de opgeschreven uitkomsten als de uitkomsten van het experiment. b. Schrijf de aselecte getallen uit de u ter beschikking staande tabel op (volgorde: kolommen van de tabel), maar verminder de getallen groter dan 6 met 6. Lees hiervoor O als 10. Beschouw de opgeschreven cijfers als de uitkomsten van het experiment.
1.4. Proefopzet en statistiek 1.4,1. INLEIDING Onder de proefopzet verstaat men de verzameling van voorsdiriften, waarin de gang van zaken bij een te verrichten onderzoek is vastgdegd. Onder planning verstaan wij de werkzaamheden die moeten plaatsvinden om tot de proefopzet te komen. In 1.4.2 gaan wij na aan welke (zeer hoge!) eisen de proefopzet moet voldoen en hoe de planning daarvoor verloopt, als men bij het trekken van condusies uit de onderzoekresultaten de statistiek wil inschakelen als bewijsmiddel. D.w.z.: als men de statistische analyse op zodanige wijze wil toepassen, dat aan de verkregen uitkomsten een ondubbd15
1.4
INLEIDING
zinnig bepaalde en bekende betrouwbaarhdd kan worden toegekend. In de praktijk is in vde gevallen niet aan deze eisen voldaan. Men kan dan wel gebruik maken van de statistiek, doch de mtkomsten van de statistische analyse bezitten slechts een formele betrouwbaarheid, aangezien zij verstoord worden door onvolmaaktheden in de proefopzet, die maken dat de werkehjke betrouwbaarheid van de uitkomsten niet bekend is. Op deze wijze benut men de statistiek dus als detectiemiddd. Hoewel de hierbij verkregen resultaten dus bewijskracht missen, kunnen zij vaak de basis vormen voor een volgend - gericht - onderzoek, wïiarmee men dan wel tot een (statistisch) bewijs kan komen. In 1.4.3 bespreken wij enkde moeüijkheden die zich hierbij kunnen voordoen en de consequenties die deze kunnen hebben. In dit hoofdstuk kunnen nog niet alle facetten van de planning en proefopzet voUedig worden behandeld. Wij menen echter, dat enig inzicht in deze materie van zo groot belang is, dat men er kennis mee dient te maken voordat men tot het bestuderen van de statistische methoden overgaat. In de eerste plaats omdat hierbij blijkt van welk eminent bdang een gedegen planning en de daaruit resulterende goede proefopzet is. Ten tweede omdat dan duiddijk wordt, dat er een symbiose behoort te zijn tussen proefopzet en statistiek. En tenslotte omdat men hieruit kan zien, hoe voorzichtig men moet zijn met het trekken van condusies uit waamemingsmateriaal, dat niet doelgericht verzameld is - zelfs als dit op adequate wijze statistisch wordt bewerkt.
1.4.2. PROEFOPZET, PLANNING EN STATISTIEK
In figuur 1.1 is een schematisch overzicht gegeven van de algemene gang van zaken bij een onderzoek. Wij bespreken de in dit schema opgenomen fasen eerst in chronologische volgorde en beschouwen daarna de rol die de statistiek bij de planning spedt. Fase I. A. Elk onderzoek vangt aan met het formiüeren van de vraagstelling en het vaststeUen en operationed definiëren van de populatie(s) waarop men deze wil betrekken. AUeen op deze popiüatie(s) kan men later de uit het onderzoek voortkomende conclusies terugvoeren. De vraagstelling moet scherp en duideUjk geformuleerd zijn, zodat zij leidt tot een proefopzet waarbij : 1, Hypothesen getoetst worden betreffende de populatie(s). Dergelijke hypothesen zullen in de regel zg. nulhypothesen zijn, d.w.z. inhouden dat de bij de steekproeven waargenomen verschillen door toevallige factoren veroorzaakt worden en dus niet wijzen op verschillen tussen hun populaties. Zo'n hypothese
16
n
g.
O
n
N
i
g
oq
ö a
"S
I ViB
Rapporteren I
CONCLUSIES I
I Vil
IA TE ONDERZOEKEN POPULATIES
VRAAGSTELLING
I
Proefgroep(en) (Placebogroep) Controlegroep
Steekproefixekken
STEEtCPROEVENl
IV A Waarnemen I
I IIIB
Steekproeftrekken
IIIA
II PROEFOPZET ONDERZOEKING I | EXPERIMENT
Literatuurstudie Voor-onderzoek
w
i
SS
i
i
1,4
INLEIDING
kan bv, zijn, dat de diëten A en B, gedurende zekere tijd toegediend aan ratten, gemiddeld dezelfde gewichtstoeneming veroorzaken. Of: dat de toepassing van therapie V hetzelfde effect heeft als de toepassing van therapie W. 2. Een schatting verkregen wordt betreffende de populatie. Men kan bv. de vraag stellen, hoe groot de gemiddelde gewichtstoeneming bij dieet A in x maanden is, of welke fractie van de mét therapie W behandelde patiënten geneest. Men bedenke hierbij, dat men beter een deel van de complexe vraagstelling goed kan aanpakken, dan het geheel oppervlakkig. Zoals MORONEY (25) zegt: 'If we can oidy carry out a Umited investigation, we had best have a strictly limited target. Many investigations are extremely loose in design. They are Uke nets which are spread wide but have a mesh so large, t h a t all but the most giant fish escape.'
B. Het is noodzakelijk, dat men de literatuur betreffende de vraagsteUing en/of verwante problemen grondig en vooral kritisch bestudeert. Het kan voorkomen, dat zich bij de.planning van een onderzoek detaüproblemen voordoen, die eerst moeten worden opgelost. Zo'n voor-onderzoek kan bv. betrekking hebben op de overeenstemming in het oordeel van verschiUende artsen bij het hanteren van een waarderingsschaal, of bedoeld zijn om na te gaan of een grootheid die bij het onderzoek gemeten wordt een dagritme vertoont. Ook aan deze punten willen wij enkele opmerkingen toevoegen. Bij de literatuurstudie dient o.i. de nadruk te liggen op een kritische instelling. Men late zich niet (mis)leiden door een met autoriteit uitgesproken conclusie of door een rookgordijn van tabellen, figuren, uitkomsten van toetsingen, e.d. die slechts verdoezelen dat van een adequate proefopzet geen sprake is. Steeds zal men in de eerste plaats de gevolgde proefopzet onder de loupe moeten nemen. Vertoont deze onvolmaaktheden, dan dient men zich zo mogelijk af te vragen, welke invloed deze op de verkregen resultaten kunnen hebben en in hoeverre deze nog waarde hebben. Verder is het ons opgevallen, dat men in een onderzoek veelvuldig meettechnieken (bv. betreffende de bepaling van het gehalte van stoffen in het bloed) en waarderingsschalen (bv. betreffende de bij een patiënt optredende verbeteringen) hanteert, zonder dat men zich voldoende heeft vergewist van hun betrouwbaarheid, het mogelijk voorkomen van systematische verschillen tussen apparaten of waarnemers, enz. Ook verricht men vaak waarnemingen in de tijd zonder dat onderzocht is, of welUcht seizoensinvloeden tot systematische verschiUen kunnen leiden. Soms zal men in de literatuur een betrouwbaar antwoord voor deze en dei^elijke problemen kunnen vinden, maar anders zal een voor-onderzoek moeten plaatsvinden - ook al kost dit tijd die men liever aan het eigenlijke onderzoek zon willen besteden.
Fase I I . De proefopzet vormt de ruggegraat van het onderzoek en dient dan ook specifieke voorschriften omtrent de uitvoering van de verschiUende onderzoekfasen te bevatten. Wij bespreken de overwegingen, die hierbij een rol spden successievelijk bij elke volgende fase. Fase I I I . Bij het steekproeftrekken dient een onderscheid te worden gemaakt tussen een onderzoeking en een experiment of proefneming. Wij 18
PROEFOPZET EN STATISTIEK
1,4
spreken van een onderzoeking, als men na het steekproeftrekken tot het verrichten van waarnemingen aan de getrokken elementen overgaat en van een experiment, als althans een deel van de dementen in de steekproef eerst aan een bepaalde behandeling wordt onderworpen. De term behandeling dient hier ruim te worden opgevat: een behandeUng kan bv. zijn het toepassen van een therapie, het geven van een bepaald dieet, het verrichten van een chirurgische ingreep, e.d. Bij een onderzoeking moet men vaststeUen hoe de steekproef (steekproeven) getrokken wordt (worden) en de steekproefomvang bepalen. Wij hebben reeds opgemerkt, dat hierbij een methode moet worden gekozen, die tot aselecte steekproeven leidt : alleen dan kan de statistiek als bewijsmiddel worden gebruikt. Bij een experiment is nog een volgende stap vereist : men dient - op grond van de vraagsteUing - te bepalen, welke behandehngen zuUen worden toegepsist, hoe en wanneer deze zuUen plaatsvinden, enz. De steekproef moet daarna aselect in twee of meer subgroepen worden verdeeld, t.w. 1. Eén of meer proef groepen, waarop de behandeUngen waarvan men het effect wü onderzoeken worden toegepast. In vde gevaUen zal men tevens moeten beschikken over: 2. Een controlegroep (blancogroep), die niet behandeld wordt. Bij sommige (bv. bij therapeutische proefnemingen) zal men nog een tweede controlegroep moeten inschakelen, nl. : 3. Een placebogroep, die een schijnbehandding ondergaat. Verder zal bv. een therapeutische proef zo moeten worden ingericht, dat zowd de proefpersoon (patiënt) als de waarnemer (behandelende arts) niet weet, wie de contrôles zijn. Men noemt dit een dubbel-blinde proef. In het bijzonder over de proefopzet bij-het therapeutisch experiment zijn in de afgelopen jaren enkele beschouwingen verschenen, waarvan o.i. iedere onderzoeker op dit terrein kennis moet nemen. Wij noemen de artikelen van DE JONGH (58, 59), R E I D (50),
BRADFORD H I L L (50A). MAINLAND (46).
RÜMKE
(62A)
en PANNEKOEK (61), Hoewel dit overzicht voomamehjk bedoeld is om in het algemeen de gang van zaken bij een onderzoek weer te geven. wUlen wij toch enkele opmerkingen van DE JONGH (59) over de noodzaak tot het gebruik van contrôles niet onvermeld laten. Deze zegt o.m. het volgende: 'De vraag of men altijd een controle-waarneming nodig heeft, moet in b ^ n s e l bevestigend beantwoord worden. Uitspraken a priori gelden immers niet in de ervaringswetenschappen. De enige wijze om te weten te komen of een factor al of niet een bepaalde werking heeft is het experiment en altijd moet men aannemelijk maken, dat datgene wat tijdens de inwerking dezer factoren gebeurt niet ook zonder deze zou zijn ingetreden. Voor het laatste is echter een blanco waarneming nodig. De enige schijnbare uitzondering op deze regel is het geval, waarin reeds zoveel controle-waarnemingen zijn verricht met een zodanig ondubbelzinnige uitkomst, dat omtrent die uitkomst praktische zekerheid bestaat. Om een voorbeeld te noemen : men behoeft aan de uiteindelijke afloop van een leu19
1.4
INLEIDING
kaemie-geval niet te twijfelen, aangezien nog nooit iemand van deze ziekte is genezen. I n de meeste gevallen is het onmogelijk betrouwbare gegevens omtrent de therapeutische werking van een geneesmiddel in handen te krijgen zonder blanco waarnemingen te doen. Dit blijkt ten duideUjkste uit het onafgebroken geharrewar in de medische literatuur over talloze medicamenten. 2o weet men bv. nog steeds niet zeker, of stoffen als khelUne. papaverine, polynitraten en purines invloed hebben op angina pectoris. E n dit is maar een willekeurig voorbeeld. De Amerikaanse auteur O. B. Ross (J.A.M.À., 145(1951). 72) laat door een anal3rse van recente literatuur zien. hoe vaak het gebeurt, dat conclusies de therapie betreffende ongeldig zijn door het ontbreken van contrôles. Hij verzamelde een 100-tal artikelen uit de 5 voornaamste Amerikaanse geneeskundige tijdschriften, die verschenen na 1 januari 1950. Zijn conclusie luidde nu, dat slechts in ruim een vierde deel van de onderzoekingen adequate contrôleproeven waren gedaan. Dit betekent dus, dat in de rest der gevallen de conclusie ongeldig is. Ongetwijfeld zijn er onder deze ongeldige tevens onjuiste conclusies die dan toch plegen voort t e bUjven bestaan in de medische literatuur. Deze krijgt dan wat ik de kookboekvorm noem. I n stede van de neerslag te vormen van betrouwbare gegevens wordt daardoor de therapeutische literatuur t o t een soort medische folklore. Wil men geldige conclusies bereiken, dan moet men dus in het algemeen op therapeutisch gebied in iedere proefneming .,. blanco waarnemingen opnemen. De betrokken zieken moeten dezelfde behandeling ondergaan als de patiënten die het medicament ontvangen, echter op dit medicament na. Men kan er evenwel niet mee volstaan (alle) contrôlepatiënten niets te geven, aangezien vast is komen te staan, dat het geven van een voor een geneesmiddel doorgaande stof als zodanig een therapeutisch effect kan hebben, het zg. placebo- of schijnmiddeleffect. Vele ziekelijke verschijnselen verdwijnen wanneer de patiënt ten onrechte gelooft, dat hij een werkzaam geneesmiddel ontvangt. Bovendien is echter gebleken, dat het invloed kan hebben op de uitslag van de proef waimeer de arts van te voren de uitkomst reeds meent te weten. Wanneer de arts welbewust aan sommige patiënten een geneesmiddel geeft en aan anderen een schijnmiddel. dan kan hij dat blijkbaar op zodanige wijze doen. dat het geneesmiddel beter werkt dan wanneer ook de behandelende geneesheer lüet weet welk middel de patiënt krijgt, het echte of de 'dummy'. Bovendien moet men aannemen dat soms het resultaat anders wordt beoordeeld wanneer het geneesmiddel dan wanneer het schijnmiddel wordt gegeven. Het is onvermijdelijk, dat de behandelende arts eerder geneigd is verbetering van de toestand te constateren wanneer hij een geneesmiddel dan wanneer hij een placebo heeft gegeven,' Een specifieke moeilijkheid van proe&emingen op medisch gebied is, dat de eisen van een goede proefopzet, betreffende de noodzaak van een contrôléen/of placebogroep, door sommee medici in strijd worden geacht met de medische ethiek. Dit onderwerp ligt buiten het kader van dit overzicht, maar het wordt besproken in de beide reeds genoemde artikelen van D E JONGH en door RÜMKE (62B).
Fase IV. In deze fase gaat men over tot het verrichten van waarnemingen aan de elementen in de getrokken steekproef of steekproeven, resp. in de verschiUende subgroepen. Bij de proefopzet dient hiertoe te worden voorgeschreven: 1°. Wat men gaat waarnemen, 2°. Op wdke wijze dit geschieden zal, 3°. Wanneer de waarnemingen verricht worden, 4°. Wie de waarnemingen verrichten. Men dient hierbij alle mogdijke maatregelen te treffen om te voorkomen, dat waarnemingen niet worden 20
PROEFOPZET EN STATISTIEK
1.4
uitgevoerd of verloren gaan, omdat daardoor de statistische analyse aanzienlijk kan worden bemoeüijkt. Vanzelfsprekend moet er voor gezorgd worden, dat de waarnemingen op uniforme wijze verkregen en geregistreerd worden. Bij een onderzoek van grotere omvang is het gewenst, de waarne* mingsuitkomsten op zodanige wijze te registreren, dat hun bewerking zo efl&dënt mogeüjk kan plaatsvinden. Ligt het in de bedoeling hierbij van ponskaarten gebruik te maken, dan verdient het aanbeveling, bv. het registratie-formulier zo in te richten, dat het tevens als ponsdocumerit kan dienen en a priori vast te steUen, hoe men de uitkomsten zal coderen. Enkele specifieke moeilijkheden doen zich voor bij het verrichten van een enquête, d.i. als men gegevens door ondervraging van de in een steekproef opgenomen personen moet verkrijgen. Wij citeren uit D E W O L F F (38) de voornaamste punten, waarop men bij iedere enquête moet letten : 'Iedere vraag moet beknopt en vooral duidelijk zijn. Begiimers zijn maar al te vaak geneigd te denken, dat een vraag, die voor hen volkomen duideüjk is, ook voor niet-ingewijden begrijpelijk zal zijn en, wat even belangrijk is. slechts één interpretatie zal toelaten. H e t stellen van dergelijke vragen is echter lastig en vereist veel ervaring. De vragen moeten liefst zo gesteld worden, dat er slechts een beperkt aantal antwoorden op gegeven kan worden, bv. ja of neen, de keuze uit een drie- of viertal alternatieven, een getal, enz Als men de vragen zo stelt, dat er met een omstandig verhaal op geantwoord kan worden, ondervindt men bij de rubricering veel ... moeite en dikwijls zal blijken dat de indeling in dat geval niet zonder willekeur kan geschieden. Indien een dergeUjke vraagsteUing slechts bereikt kan worden door één of meer vragen te spUtsen en dus door vergroting van het totale aantal vragen, dan nog moet aan deze methode de voorkeur gegeven worden, al is het verder ook een gpilden regel op het gebied der enquêtes, dat het totale aantal vragen zo klein mogelijk zij. Het grootste probleem bij een enquête is echter de vragen zo te stellen dat ze zonder vooringenomenheid beantwoord kunnen worden en verder dat ze de ondervraagde niet een bepaald antwoord suggereren.' Wij dienen met deze opmerkingen te volstaan en verwijzen voor een zeer volledige beschouwing, waarin ook alle mogelijke fouten bij enquêtes worden besproken, naar DEMING (53),
Fase V. Een belangrijk ded van de techmeken, die bij de statistische analyse van de waarnemingen ter beschikking staan, wordt in deze inldding tot de medische statistiek behandeld. Debewijskraditdie aan de uitkomsten van deze analyse kan worden toegekend is afhankelijk van de graad van volmaaktheid, die bij de opzet en uitvoering van de voorgaande onderzoekfasen berdkt wordt en van een verantwoorde keuze van de bij de analyse toegepaste statistische technieken. Bij het be^ spreken van de planning zal overigens nog blijken dat laatstgenoemde keuze hiervan een integrerend ded uitmaakt. 21
1.4
INLEIDING
Fase VI. Als de onderzoeker voldoende bekend is met de statistiek, zal de interpretatie van de uitkomsten van de statistische anal}^e hem direct leiden tot het trekken van verantwoorde conclusies t.a.v. het uitgangspunt van het onderzoek, de vraagsteUing, Is dit niet het geval, dan zal een persoonUjk contact met de statisticus, die de anal3^se heeft uitgevoerd, de onderzoeker eerst bekend moeten maken met de betekenis en de draagwijdte van de daarbij verkregen uitkomsten. . Fase VII. De sluitsteen van het onderzoek, het verslag of rapport waarin het wordt beschreven, dient voldoende informatie omtrent opzet, uitvoering en uitkomsten van het onderzoek te bevatten om de lezer in staat te steUen deze op hun merites te beoordelen. In het voorgaande overzicht is getracht, de voornaamste overwegingen bij de verschiUende onderzoekfasen naar voren te brengen. Bij de planning van een onderzoek dienen zij elk afzonderüjk en in hun onderUnge samenhang te worden beschouwd, wü men tot een sluitende en efi&dënte proefopzet en daarmee tot geldige uitspraken komen (zie nogmaals figuur 1.1). Een belangrijk ded van deze overwegingen berust op een vakkundig èn logisch doordenken van de problemen die zich bij de verschiUende stadia van het onderzoek voordoen. Tevens is echter reeds gebleken, dat bij de planning ook de statistiek voortdurend éen rol speelt. Bij de üteratuurstudie zal men de statistische manipulaties van anderen moeten begrijpen en evalueren. Bij de samenstelling van steekproeven of de spUtsirig daarvan in subgroepen moet men zo mogelijk gebruik maken van aselecte getaUen om tot aselectivitdt te komen. Onder bepaalde voorwaarden kan de statistiek hierbij een aanwijzing geven omtrent de te gebruiken steekproefomvang. Dit is van bijzonder bdang, omdat het om economische maar vooral om ethische redenen noodzakeUjk is, dat een zo klein mogelijke steekproef wordt getrokken, d.w.z. dat een zo efficiënt mogelijk gebruik van de bij patiënten te verrichten waarnemingen wordt gemaakt. Aan het waarnemingsproces zal soms een onderzoek inzake de te gebruiken meettechniek voorafgaan, waarvan de uitkomsten dan weer aan een statistische anal3^se worden onderworpen. En bij het registreren van de waarnemingen zelf doet men er goed aan, reeds rekening te houden met de fase, waarin de statistiek een hoofdrol speelt: de statistische analjrse. Er is echter meer. Als nl. de vraagsteUing tot een min of meer gecompUceerde proefopzet leidt, zal men zich daarbij a priori afvragen, welke vorm de statistische analyse van de waarnemingen t.z.t. zal aannemen. Hieruit kan voortvloeien, dat men de proefopzet bewust op een spedfieke statistische analyse-techniek, zoals bv. de variantie-analyse, richt. Hierdoor kan voorkomen worden, dat men tot onnodig complexe, dan wel tot incoherente reeksen waamemingsuitkomsten komt, die op zijn gunstigst slechts met aUerlei kunstgrepen geanalyseerd kunnen worden. 22
PROEFOPZET EN STATISTIEK
1.4
1.4.3. MOEILIJKHEDEN BIJ DETECTIEPROBLEMEN
Bij vele medische instellingen zoals ziekenhuizen, klinieken en consultatiebureaus worden vsm elke patiënt of onderzochte persoon vele gegevens vastgelegd. Naast anamnestische en algemene gegevens zijn daar de uitkomsten van allerlei metingen, notities omtrent de aard en ernst van geconstateerde afwijkingen, aantekeningen betreffende de toegepaste therapie en haar effect, enz. Het Ugt voor de hand, dat men van deze direct ter beschikking staande gegevens gebruik zal wiUen maken, bv. om het effect van twee verschiUende geneeswijzen te vergelijken of om de relatie tussen de leeftijd van de patiënt en de overlevingstijd na een chirurgische ingreep te onderzoeken. Hoewel hierbij wel een zekere planning plaatsvindt, is natuurüjk van een proefopzet zoals deze in 1.4.2 is beschreven geen sprake. Men heeft hier te doen met een uitgesproken detectieprobleem, d.w.z. de betrouwbaarhdd van de concluàes die men bij de analyse van dergeUjke gegevens verkrijgt kan in mindere of meerdere mate worden aangetast door inherente onvolmaaktheden van deze gegevens. Hiertoe behoren ó.m, : 1, Het optreden van sdectie. - De patiënten waarop de gegevens betrekking hebben, vormen gewoonüjk geen aselecte steekproef uit de bevolking. De patiënten uit een univerâtaire polikliniek bv. zuUen overwegend uit de lagere welstandsgroepen stammen. Dit kan inhouden, dat zij o.m. .qua inkomen, voedingstoestand of voedingsgewoonten, huisvesting en hygiëne een negatieve selectie t.o.v. 'de' populatie vertonen. BRADFORD HILL (42) zegt dan ook: Tt is not too much to say, that there is hardly any disease in which a hospital population must not be regarded with suspidon if it is desired to argue from the sample to the universe of all patients. No such argument should be attempted without a preliminary and rigorous examination of the possible ways in which selection may have occurred.' Als verschiUende patiënten met dezelfde aandoening op verschiUende wijze zijn behandeld (met verschiUende middelen, met verschiUende doses van hetzelfde middel, e.d.), dan is ook bij de keuze van de behandeling ongetwijfeld een sdectie opgetreden. De behandeling zal immers per individu zijn gekozen, afhankeUjk van factoren als: verloop of stadium van de aandoening, geslacht, leeftijd of gezondheidstoestand Van de patiënt» te verwachten compUcaties, enz. En als de verschiUende behandeUngen (overwegend) in verschiUende perioden hebben plaatsgevonden, kiinnen hun resultaten afwijkend zijn doordat de populatie waaruit de patiënten afkomstig zijn veranderd is, de virulentie van het ziekteverwekkende agens zich in de tijd heeft gewijzigd, de diagnostische criteria vroeger anders lagen, de kans op compUcaties in de tijd verminderd is (bv. dpor de toepassing van antibiotica), enz. Men zal dan moeten trachten het materiaal te verdden in subgroepen die uit-. 23
1.4
INLEIDING
sluitend verschülen in bdiandeling en die verder t.a.v. alle rdevante factoren overeenstemmen. Afgezien van het fdt dat men nooit zeker weet, of dke selectie inderdaad wordt uitgeschakdd, wordt zdfe materiaal van grote omvang op deze wijze meestal in zoved 'compartimenten', elk met een betrekkeUjk klein aantal waarnemingen, gesplitst dat een goede statistische analyse zeer moeiUjk of zdfs vrijwd onuitvoerbaar kan worden. Voorbeeld 1.24. Beschouw de volgende (fictieve) uitkomsten betreffende de resultaten van streptomydne-behandeUng in hoge en lage doses bij lijders aan meningitis tuberculosa: Dosering Aantal Overleden Letaliteit Laag 60 150 40% Hoog 60 100 60% De hoge dosis blijkt een grotere sterfte op t e leveren dan de la^e. H e t ligt echter voor de-hand aan te nemen, dat de dosering is aangepast aan de ernst van het ziektegeval, d.i, aan het klinisch stadium. Wordt dit mede in aanmerking genomen, dan vindt men de volgende uitkomsten: Klinisch stadium
Dosering Laag Hoog Overleden Let, Aantal Overleden Let, 20 4 20% 36 30% 20 11 55% 15 75% 60 45 75% 9 90% 100 60 60% 60 40%
Aantal 120 20 10 150 Nu blijkt in elk stadium de letaliteit bij de hoge dosis beneden die van de lage dosis te liggen,^ Zieken in het vroege stadium krijgen echter voornamelijk een lage, die in het late stadium een hoge dosis. De misleidende uitkomst van de totaalcijfers is een gevolg van de weging die optreedt, omdat de verdeling over het klinisch stadiuni bij de patiënten met de lage dosis tegei^esteld is aan die bij de patiënten met de hoge dosis. Men kan zich echter afvragen, of op deze wijze nog niet meer factoren moeten worden uitgeschakeld. Onderstel nu, dat men de patiënten in twee leeftijdsgroepen kan verdelen (in werkelijkheid zullen het er wel meer moeten zijn) en dat men dan vindt : Vroeg Middelmatig Laat Totaal
Hoge dosering Lage dosering Jong Jong Oud Oud Aant. Overl. Let. Aant. Overl. Let. Aant. OverL Let. Aant. Overl. Let. Vroeg 3 30% 80 8 10% 40 28 70% . 10 1 10% 10 Middelmatig 5 1 20% 15 5 1 20% 15 10 67% 14 93% Laat 2 1 ,50% 5 25% 40 40 100% 8 8 100% 20 Totaal 87 10 11V,% 63 50 80% 35 7 20% 65 53 81»/,% Klinisch
» Dit voorbeeld is bedoeld om het mogelijke resultaat van de uitschakeling van enkele factoren te demonstreren. Dit blijkt het duidelijkst bij een vergelijking van de procentuele letaliteit in de subgroepen. -Men dient zich hierbij echter te realiseren, dat men deze percentages, die soms op zeer kleine steekproeven berusten, in werkelijkheid niet zonder meer kan vergelijken.
24
v:c/
PROEFOPZET EN STATISTIEK
1.4
Onze mening omtrent deze uitkomst^i dient nu opnieuw een verandering t e ondergaan. Het ziet er naar uit, dat bij de jongeren de dosering weinig ter zake doet. Bij de ouderen is er in het vroege en middelmatige stadium nog wel een gunsteer efEect bij een hoge dosering t e onderkennen, maar de bäiandeling blijkt bij patiënten in het late stadium niet meer te helpen. Het is duidelijk, dat men bij een verdergaande onderverdeling deze conclusies wellicht weer zal moeten amenderen (de jonge mannen in het vroege stadium met lage dosis reageren misschien anders dan de jonge vrouwen). Men houdt dan echter tenslotte subgroepen over die zo klein zijn, d a t men er nauwelijks of niet meer mee kan werken.^
2. Tekortkomingen in de gegevens. - De gegevens die door een arts, in een polikliniek, in een ziekenhuis, e.d. van een patiënt worden geregistreerd zijn in eerste instantie bestemd voor gebruik bij het steUen van een diagnose, het maken van een prognose, het beoordden van de toestand van de patiënt gedurende een behandeling, enz. Zij zijn primair gericht op deze patiënt en behoudens een aantal algemene gegevens (zoals naam, geslacht, leeftijd, woonplaats) bevatten zij gegevens die van patiënt tot patiënt küimen verschiUen, afhankeUjk van de aard en/of ernst van de aandoening, de interesse van de onderzoekende medicus,, de tijd die voor het onderzoek en voor het registreren van de uitkomsten beschikbaar is (ten tijde van een epidemie kan het voorkomen dat men bv. bepaalde soorten patiënten noodgedwongen sneUer afhanddt of bepaalde routinebepalingen nalaat). Hierbij komt nog, dat zowd de uniformiteit als de homogenitdt van de wèl beschikbare gegevens nog al eens wat te wensen overlaten. . Deze tekortkomingen-zuUen voor de behandeling van de individuele patiënt van geen betekenis zijn, daar in de regel juist gegevens onvermdd worden gdaten die niet van betekenis of wd zonder registratie te onthouden zijn. Zij kunnen echter het gebruik van de gegevens voor wetenschappeUjke dodeinden ernstig bemodUjken, omdat men die patiënten, waarvan de gegevens op vitale punten incompleet zijn, niet in het onderzoek kan opnemen. Hierbij komt, dat het buiten beschouwing laten van deze patiënten weer tot selectie kan Idden. Zo kan juist van de minder ernstige gevaUen de registratie systematisch onvoUediger zijn, zodat deze in het materiaal dat voor bewerking in aanmerking komt niet in de juiste verhouding vertegenwoordigd zijn. En als in een bepaalde periode de aandacht spedaal gericht is op de resultaten van een nieuwe geneeswijze^ dan is het zeer goed mogelijk dat de gegevens hierover voUediger worden vastgdegd dan die van de tot dusverre gebruikeUjke therapie. ^ Zie voor een versU^ van een experiment met streptomycine dat als model voor een goede proefopzet kan dienen : Medical Research Council. Streptomycin treatment of pulmtmaiy tuberculosis. Brit. M.J. 2 (1948). 769, of de beschouwing hierover van REID in (50).
25
.J
1.4
INLEIDING
Het komt herhaaldelijk-voor, dat men conclusies baseert op onvolledige gegevens, zonder dat men zich er rekenschap van geeft dat deze misleidend kunnen zijn. Onderstaande tabel bevat-de bloedingstijd (in sec) bij 5 personen, bepaald op verschillende tijdstippen na de toediening van 2 mg adrenoxyl.' Door omstandigheden ontbreken de waarnemingen op de plaatsen, waar een streepje staat. Per tijdstip is het rekenkundig gemiddelde van de beschikbare waarnemingen berekend en deze gemiddelden zijn eveneens in de tabel opgenomen: Patiënt Tijdsverloop m uren na adrenoxyl 9 V* V« 1 3 6 _ A 120 90 110 100 85 B — — 70 75 80 75 C 140 120 95 100 115 D 100 90 100 95 95 80 E 40 35 40 30 Gem, 85 87 88 86 86 87 Men concludeert uit deze resultaten, dat de toediening van adrenoxyl geen invloed uitoefent op de bloedingstijd (de gemiddelden vertonen immers slechts geringe verschillen). Deze conclusie behoeft echter niet juist te zijn, daar de volledige uitkomaten heel goed het volgende, van patiënt tot patiënt overeeiistemmende, beeld zouden kunnen vertonen: Patiënt Tijdsverloop in uren na adrenoxyl 3 6 9 1 V« V» A 90 110 120 105 100 85 B 70 75 80 75 65 60 C 160 140 120 95 100 115 D 90 100 100 95 95 80 E 35 40 40 35 30 20 Gem. 77 88 100 90 82 68 Het voorbeeld lijkt misschien triviaal, maar deze fout bUjkt in werkeUjkheid regelmatig voor te komen. Een specifieke moeilijkheid bij klinische gegevens is het verlies van patiënten tijdens de behandeling of bij de contrôle van haar resultaten. Als een behandeling zich over geruime tijd uitstrekt of als men de resultaten daarvan pas na zekere tijd voldoende kan beoordelen (zoals bv. bij sommee operaties), zullen in de regel patiënten uitvallen. Velerlei oorzaken kunnen hiertoe leiden: de patiënt kan overUjden. tengevolge van de aandoening in kwestie of door andere oorzaken. Verder kunnen patiënten uitvallen door verhuizing, door emigratie, omdat zij zich genezen achten en een verdere behandeling of contrôle onnodig vinden, omdat de behandeling te lang duurt, omdat zij ontevreden zijn met de bereikte resultaten, enz. H e t behoeft o.i. geen betoog, dat deze uitvallers tot selectie in het overblijvende materiaal kunnen leiden, zodat het noodzakeUjk is dat hun aantal tot het onvermijdeUjke beperkt bUjft én de .oorzaak van het wegblijven bekend is. Nu kan men een proef zo inrichten, dat aan deze voorwaarden wordt
26
PROEFOPZET EN STATISTIEK
1.4
voldaan (o.m. door voor t e schrijven dat iedere patiënt die niet voor behandeling of contrôle verschijnt onmiddeUijk wordt bezocht). Bij een analyse van klinische gegevens ligt de zaak veel moeilijker, omdat men daarbij de uitvallers in de regel moet accepteren en omdat bovendien in sommige gevallen de oorzaak niét of onvoldoende nauwkeurig geregistreerd is.
De waarde van de informatie die men verkrijgt bij een detectieprobleem, d.i. dus bij het bewerken van gegevens die niet via een streng voorgeschreven proefopzet verkregen zijn, hangt af van de aard en ernst van de onvolmaaktheden van het materiaal en van de mate waarin men erin slaagt, deze te onderkennen, hun invloed mt te schakelen of te waarderen. De bewerker zal hiertoe gespeend moeten zijn van elk vooroordeel, bijzonder kritisch te werk moeten gaan en niet moeten aarzelen - waar nodig - de uit de geconstateerde onvolmaaktheden voortvloeiende reserves te maken; ook als deze ertoe Idden, dat een duideUjke of redeUjk verantwoorde uitspraak niet kan worden gegeven. De statistiek kan hierbij belangrijke diensten verlenen, maar in beginsel slechts als detectiemiddd. 1.4.4. OPGAVEN^ 1.5. Een grote industrie wil onderzoeken of het regelmatig gebruik van een Aâtamine-C preparaat gedurende de wintermaanden invloed heeft op het verzuim tengevolge van verkoudheidsziekten,.Men wil daartoe van oktober t/m maart het preparaat verstrekken aan alle arbeiders in afdeling A v a n , het bedrijf en de arbeiders in een overeenkomstige afdeling B als contrôles gebruiken. Bij elk verzuim wegens ziekte zal de diagnose door de bedrijfsarts worden gesteld, opdat aan het einde van de onderzoekperiode nauwkeurige en uniforme gegevens betrefiende het verzuim tengevolge van verkoudheidsziekten ter beschUddng staan, a. Welke bedenkingen zijn tegen deze proefopzet in te brengen? b. Geef een opzet, die naar uw mening beter is. Welke praktische bezwaren brengt deze met zich mee? 1.6. Men wil in een kraamkliniek een onderzoek instellen naar de betekenis van psychologische methoden tot bestrijding van de baringspijn: Men wil daartoe aan aanstaande moeders, die voor hun prenatale zorg onder geregelde contrôle staan, de gelegenheid openstellen om deel te nemen aan: A. Een voorlichtende cursus. B. Een voorlichtende cursus met — in aansluiting op de poUldiniekuren - lessen in zwangerschaps-gymnastiek en ontspannings\ Een deel der opgaven (en voorbeelden) is ontleend aan de Nederlandse medische literatuur van de afgelopen 5 jaar. De bedoeling hiervan is de lezer te confronteren met praktijkproblemen, die vanzelfeprekend interessanter en overtuigender zijn dan gefingeerde. Voorzover deze opgaven en voorbeelden betrekking hebben op onvolledigheden of onjuistheden bij de planning of bij de presentatie, analyse of interpretatie van de uitkomsten van een onderzoek bezit deze procedure het nadeel, dat hiermee indirect kritiek wordt geleverd op bepaalde onderzoeken. Wij zijn ons van dit nadeel bewust, maar kunnen geen andere weg kiezen als wij aan concrete voorbeelden willen demonstreren dat deze'tekortkomingen inderdaad in de praktijk voorkomen.
27
vy
1.4
INLEIDING oefeningen. Als contrôle zullen dienen de vrouwen, die zich niet voor A of B opgeven, a. Geef uw mening over deze proefopzet. b. Welke andere proefopzet is mogelijk, als men ervan uitgaat dat men een aanstaande moeder, die dit wenst, de 'behandehng' A of B niet mag onthouden. c. Met welke factoren zult u hierbij zo mogelijk rekening houden?
1,7, I n een artikel betrefEende de behandeling van een bepaalde ziekte wórdt medegedeeld, dat groep I, bestaande uit 400 patiënten, behandeling A onderging en dat de 150 patiënten in groep I I deels behandeling B, deels behandeling C Isxegea. Van groep I wordt een overzicht gegeven van de regelmaat waarmee de behandeUng gevolgd werd: Ongeregelde bezoekers Weggebleven
120 20
Trouwe bezoekers
140 260
400 Van groep I I wordt zo'n overzicht niet gegeven. De uitkomsten van de behandeling kunnen als volgt worden samengevat: Groep I (behandeUng A) Totaal Genezen % 108 Vroeg stadium 120 90 154 55 Laat stadium 280 Groep I I (behandeling B of C) Totaal f Behandeling B 10 Vroeg stadium \ Behandeling C 25 ƒ Behandeling B 70 Laat stadium \ Behandeling C 45
Genezen 9 24 28 29
% 90 96 40 63
Over welke aanvuUende gegevens betrefEende dit materiaal dient u te beschikken, om tot een geldige interpretatie van deze resultaten te kunnen overgaan? 1.8. Zie N.T.v,G,, 99 (1955), 2498-99, Bestudeer de beschrijving van het verrichte onderzoek en de presentatie van de uitkomsten. Welke vragen doen zich hierbij voor en wat is hiervan de consequentie? 1.9, Uit: N.T.v,G., 98 (1954). 1296-1298. In een artikel betrefEende het proconvertinegehalte in het bloed van vroeggeborenen wordt o.m. gezegd: 'Het is in de couveuse-afdeling... de gewoonte aan vroeggeboren kinderen gedurende de eerste drie levensdagen 10 mg. vitamine K p e r dag toe te dienen, indien het gebportegewicht meer dan 2000 gram bedraagt, terwijl kinderen met een lager geboortegewicht dezelfde dosis gedurende vijf dagen krijgen. Wij achtten ons a priori niet gerechtigd bij ons onderzoek bij een deel dezer kinderen de toediening van vitamine K geheel.weg te laten, geUjk dit bij
28
1.4
PROEFOPZET EN STATISTIEK
voldrs^en kinderen wel is geschied. Daarom hebben wij de vroeggeborenen in twee groepen verdeeld : groep A, waarvan de kinderen de eerste levensdag een intramusculaire injectie van 10 mg vitamine K kregen ... en vervolgens alleen de tweede en de derde levensdag telkens per os 10 mg vitamine K .... en groep B , waarvan de kinderen ook na de eerste drie levensdagen dageUjks 10 mg vitamine K per os kregen. Methoden. Evenals bij het vorige onderzoek, werd 0,9 cm' capillair bloed uit een hielprik in gesiliconiseerde buisjes, waarin zich 0,1 c m ' 3,8 pCt natriumd t r a a t bevond, opgevangen en het proconvertine-gèhalte in het plasma volgens de methode van OWREK bepaald. De bepalingen werden in.duplo gedaan. Als contrôle-plasma werd 'pooled' plasma van ongeveer 10 normale volwassenen gebruikt. Het onderzoek omvatte 39 vroeggeborenen met geboortegewichten tussen de 1500 en 2500 gram. In de eerste levensweek werden drie bepaUngen in duplo gedaan, daarna werd het gehalte eenmaal per week bepaald. Uitkomsten. Tabel I en I I geven de gemiddelde rekenkundige waarden voor het proconvertinegehalte, die bij het opgegeven aantal vroeggeborenen op de verschiUende levensdagen werden gevonden, en tevens de laagste en hoogste voor dit gehalte gevonden waarden. Fig. 1 (onze figuur 1.2) geeft een overzicht van de uitkomsten van alle gevallen.' Tabel I. Proconvertinegehalte bij vroeggeborenen, die alleen gedurende de eerste diie levensdagen vitamine K toegediend kregen 4e dag 21
Levensdag 5e 6e 7e
Ie
2e
3e
Levensweek 4e 5e 6e
7e
8e
Gemidd. waarde% 18i 31 22i 24i 21 26 30 37i 36 18 30 Laagsteen hoogste waarde 14-28 3-40 24-37 11-32 3-60 3-45 3-43 11-61 24-53 16-72 17-19 21-38 Aant. onderzochte 'kinderen 4 4 13 4 8 48 14 15 10 6 8 2 Tabel II. Proconvertinegehalte bij vroeggeborenen, die gedurende het gehele onderzoek dagelijks vitamine K toegediend kregen 4e dag 30
Levensdag 5e 6e 7e
Ie
2e
Levensweek 3e 4e 5e
6e
7e
8e
Gemidd. waarde % 32 37 33 26 31 31 414 41 35 67 Laagste en hoogste waarde 24-38 26-38 25-63 27-44 6-60 19-56 19-43 31-51 33-50 Aant. onderzochte kinderen 5 3 7 3 1 27 9 6 7 4 1 1
33
1
De conclusies, die uit deze gegevens worden getrokken luiden o.m. : 'Deze tabeUen en de figuur wijzen op een sterke spreiding in het proconvertinegehalte van het plasma van vroeggeborenen op verschiUendelevensdagen.... Bij de groep vroeggeborenen, die gedurende de gehele periode van waarneming dageUjks vitamine K kreeg, is het proconvertinegehalte in het algemeen een weinig hoger dan bij de vroeggeborenen, die aUeen gedurende de eerste drie levensdagen vitamine K kregen.'
29
1.4
INLEIDING
/
!
60
\
50
x^
1
.;
40
1 30
1 '20 ä. ^
,VV^
/
A:
'•••.
y<
/
..•••''
/
••'.
.-•' ' . '
•
'
/
/
S 1
^ ^ > < ^
\
^<
*^
levensdag
,./
\
/
l-^^^^ ^^^S
T^JL^CS^
»0
^^
.....-•
\
..•^y
^ \ 10
15
20 25 30 35 40 45 50 Vitamine K gedurende drie eoste levensdagen. Vitamine K gedurende gehele tijd van waarneming.
55
60
Figuur 1.2, Geef uw mening omtrent de proefopzet en de presentatie van de gegevens, 1,10. Een onderzoeker rapporteert de volgende rekenkundige gemiddelden, berekend uit hem ter beschikking gestelde gegevens betrefEende het |-gehalte in het plasma van 597 kinderen van 5 t/m 15 jaar: Leeftijd Aantal Gemidd.
5 6 7 8 9 10 11 12 13 14 15 50 25 34 104 155 82 50 59 12 16 10 4,0 4.3 4.5 4.8 4.7 4,6 6.2 6.0 6.4 4,2 4,6
Hij deelt verder mede, dat deze gegevens uit een vijftal onderzoeken stammen, t.w.: (onderzoek) A, 1952 - 72 kinderen, B, 1953 - 267 kinderen. C. 1955 - 66 kinderen, D, 1955/56 - 96 kinderen en E, 1957 - 96 kinderen. Welke conclusies kunt u uit deze gegevens trekken? 1.11. Uit N.T.V.G., 98 (1954), 2761-2774. Wij ontienen aan dit artikel de volgende gegevens betreffende het resultaat van de behandeling van 272 vrouweUjke epilepsie-patiënten op blz. 2765 : 'Het resultaat der behandeling werd uitgedrukt in de procentsgewijze vermindering van het aantal aanvallen. Men dient zich wel te realiseren, dat men zichzelf hierdoor als therapeut te kort doet, want veel patiënten gingen psychosomatisch aanzienUjk verbeterd naar huis, ofschoon zij nog- evenveel aanvallen hadden. Ook werd vaak niet naar vrijheid van aanvallen gestreefd, omdat nogal wat Ujders aan epilepsie veel beter zijn mèt. dan zonder aanvallen. Bovendien komt bij de beschrijving van het resultaat der behandeling niet tot uitdrukking hoeveel aanvallen dé patiënten hadden. Want het maakt toch wel verschil of men het aantal gevaUen tot de helft vermindert bij iemand die 2 aanvallen per jaar heeft
30
PROEFOPZET EN STATISTIEK
1.4
of 5 per dag. Het is echter schier onmogehjk de duur van de vrijheid van aanvallen, het aantal aanvallen, enz. in een resultatencontrôle statistisch te verwerken. Hiervoor zou men bovendien over een veel groter aantal patiënten moeten beschikken.' Op blz. 2772-3 : 'Resultaat van de behandeling. Van 272 patiënten waren er bij ontslag 234 verbeterd, waarvan 216 voor 50 pCt of meer. 139 (51 pCt) werden geheel aanvalsvrij (75 pCt 48, 50 pCt 29. 25 pCt 18 en O pCt 38). Van 206 patiënten was bekend hoe zij het een half tot drie jaar na het ontslag maaMen. Van haar waren er 151 nog steeds beter dan voor de opneming en 139 van haar waren voor 50 pCt of meer verbeterd. 59 van 206 patiënten (29 pCt) waren aanvalsvrij (75 pCt 42. 50 p e t 38. 25 pCt 12. O pCt 55). Het bleek dat van de 108 patiënten die vrij van aanvallen uit de kliniek waren ontslagen, de helft (55) later weer aanvallen had gehad. Vijf patiënten waren na ontslag overleden. Van 44 patiënten uit de groep 'petit mal' waren er 38 bij ontslag verbeterd, waarvan 34 voor 50 pCt of meer. 27 (61 pCt) waren vrij van aanvaUetjes (75 pCt 3. 50 pCt 4, 25 pCt 4, O pCt 6). Van 32 patiënten was bekend hoe zij het een half tot 3 jaar na het ontslag maakten. 25 van haar waren beter dan voor de opneming en 23 waren voor 50 pCt of meer verbeterd. 16 (50 pCt) waren vrij van aanvallen (75 pCt 5, 50 pCt 2, 25 pCt 2, O pCt 7). Het bleek dat er van 18 patiënten, die zonder aanvaUen waren ontslagen, 4 (22 pCt) weer aanvallen hadden gekregen. Van 193 patiënten uit de groep van 'grand mal' waren er bij ontslag 165 verbeterd, waarvan 150 voor 50 pCt of meer. 91 (47 pCt) werden vrij van aanvaUen (75 pCt 37, 50 pCt 22, 25 pCt 14, O pCt 28). Van 149 patiënten was bekend hoe zij het een half tot 3 jaar na het ontslag maakten. 105 van haar waren beter dan voor de opneming en 96 waren voor 50 pCt of meer verbeterd. 33 (23 pCt) waren vrij van aanvallen (75 pCt 30, 50 pCt 33, 25 pCt 9, O pCt 44). Van 72 patiënten die bij ontslag geen aanvaUen meer hadden, kregen er 41 (57 pCt) deze later weer t m i g . Uit de vergeUjking van deze 2 groepen bUjkt dat de prognose wat de frequentie der aanvallen betreft, bij Ujders aan 'petit mal' 2 maal zo gunstig is als die bij Ujders aan 'grand mal'. De kans, dat Ujders aan 'grand mal' weer aanvaUen krijgen na een vermeend therapeutisch succes, was 2,5 maal zo groot als die van Ujders aan 'petit mal'.' (ToeUchting: Totaal (272) = Petit mal (44) -1- Grand mal (193) -^ Patiënten met één van de andere 7 typen aanvaUen (35)) a. Breng deze gegevens in tabelvorm bijeen. b. Kunt u zich met de getrokken conclusies verenigen? Zo neen, waarom niet?
31
HOOFDSTUK 2.
REDUCTIE VAN WAARNEMINGSUITKOMSTEN Als men een aantal waarnemingen verricht en de uitkomsten daarvan noteert, bv. in de chronologische volgorde waarin zij verschijnen, verkrijgt men een reeks van attributen of waarden, die dechts weinig inzicht geeft in de frequentieverdeUng waarmee men te maken heeft. Bij een niet te klein aantal waarnemingen zal men daarom in de eerste plaats overgaan tothetopsteUen van een frequentieverdeling enin 2.1 geven wij aan, hoe men daarbij te werk kan gaan. Door middel van een grafiek verkrijgt men van een frequentieverdeling (of van het verloop van een reelis waarnemingen in de tijd) een aanschouweUjk beeld, waaruit men snel een duidelijk overzicht verkrijgt. Grafieken spden dan ook een bdangrijke rol als didactisch hulpmiddel, bij lezingen, bij propaganda en redame, e.d. Soms kunnen zij ook de statistische anal}rse vergemakkelijken of ondersteunen. In 2.2 bespreken wij enkde manieren, waarop men een grafische voorstelling kan samenstdlen. Een frequentieverdeling geeft een min of meer gedetaiUeeride beschrijving van de waarnemingen, maar soms bestaat er behoefte aan een beknopte karakterisering. Men kan hiertoe gebruik maken van de centrale maten of gemiddelden, die in 2.3 behandeld worden, en van maten voor de variabiUteit of spreidingsmaten, die in 2.4 worden besproken. Wij beperken ons hierbij echter voorlopig tot hun definitie en berekeningswijze en komen in hoofdstuk 5 terug op hun gebruik voor het karakteriseren van een frequentieverdeling. 2.1. Het opsteUen van een frequentieverdeling 2 . 1 . 1 . ATTRIBUTEN
De frequentieverdeling van een categorisch systeem van attributen (kwalitatieve kenmerken) kan worden verkregen, door aUe mogeüjke uitkomsten uit te schrijven en door middel van turven of sorteren de frequentie van dk attribuut te bepalen. Voorbeeld 2.Ï. In tabel 2.1a staan de - in alfabetische volgorde opgenomen gegevens betreffende de kerkeUjke gezindte van een steekproef van 100 arbeiders, afkomstig uit de populatie in voorbeeld 1.1. De frequentieverdeling is in tabd 2.1b opgesteld. 32
FREQUENTIEVERDELINGEN
2.1
Tabel 2.1. KerkeUjke gezindte van 100 arbeiders a. OorspronkeUjke gegevens NH NH Geen NH NH RK Geen Ov,
RK Geen NH Ger. NH Geen NH Geen
Ov. RK NH RK RK Geen Ger. RK
NH RK RK RK Ger, RK RK Ger,
RK Ger. Geen Geen RK Geen RK Ov,
Geen Ov. Geen Geen NH Geen Ov. NH
Geen Geen NH NH Ov, NH Geen Geen
b, Turftabel en Kerk, gezindte Rooms-Katholiek Ned, Hervormd Gereformeerd^ Overige Geen
Ov. Geen Geen NH NH RK NH NH
RK Ov, NH Geen Geen Geen RK Geen
NH NH Geen RK Geen RK Geen
Geen RK Geen Ov. RK Ger, NH.
Geen Ger, NH Geen RK NH RK
frequentieverdeUng Turftabel
mmmmm mmwMmi m III mill/
m m m m m m II
Totaal
RK Geen NH Ger. RK NH Geen
Freq, verd. 25 26 8 9 32 100
1 Geref, Kerken. Geief, Kerken (art. 31). Chr. Geref. Kerken. Geref. Gemeenten, 2.1.2. WAARDEN
Bij het verrichten van waarnemingen aan een variabele verkrijgt men een reeks waarden, waarvan de frequentieverdeUng eveneens door turven of sorteren kan worden opgesteld. Hierbij doen zich enkde aspecten voor, die wij aan de hand van een tweetal voorbedden bespreken. Voorbeeld 2.2. Wij beschouwen eerst de waarnemingen in tabel 2.2a, betreffende het aantal erythrocyten (in mül. per mm») bij een steekproef van 50 mannen uit de populatie in voorbedd 1.1. De discrete variabde is geteld met een afrondingsinterval van 0,1 mÜl. per mm». De hoogste waargenomen waarde is 6,3 en de laagste 4,5 imU. per mm» en in tabel 2.2b, kolom 1, zijn deze en aUe mogeüjke tussenliggende waarden opgenomen. Via de turftabel in kolom 2 verkrijgt men de waargenomen frequentieverdeling in kolom 3. De nu verkregen verdeüng is echter nog onvoldoende overzichtelijk, omdat de waarnemingen over een relatief groot gebied verspreid zijn. Dit bezwaar kan worden opgeheven, als men door het twee aan twee samen nemen van aangrenzende waarden klassen formeert met een breedte van 0,2 (mUl. per.mm»), zoals in kolom 4 is aangegeven. De hoogste klasse bevat bij de door ons gekozen groepering de waarden 6,2 en 6,3, heeft als klassegrenzen 6,15 en 6,35 (kolom 5) en als klassewaarde 6,25 (kolom 6). De klassegrenzen worden in één decimaal meer 33
2,1
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
Tabel 2.2. Aantal erythrocyten in mill, per mm* bij een steekproef van 50 mannen uit de populatie in voorbeeld 1.1 a. Waarnemingen 5,7 5.2 5,5 5,9 6.1
5.3 5.9 5.7 5.7 5,2
5.6 5,4 5,3 5,3
5.4 6,3 5.2 5.4
5.6 5,2 5,5 5.5
4.9 5.5 5,2 5.0
5,0 5.2 5,3 5.6
5,1 5,1 4,8 4,6
4.9 4,6 5,0 5.1
5,3 5,8 5,7 5.0
5,0 5.5 4,8 4.8
5,4 4.5 5,3 5.4
b. Frequentieverdelingen (2) (1) TurfWaarden tabel 6,3 / 6.2 6.1 / 6,0 5.9 // 5.8 / 5.7 //// 5.6 lil 5,5 5,4 5,3 5,2 5,1 III 5.0 4,9 II 4,8 III 4,7 4,6 II 4,5 1 (4.4) Totaal
m m m/ mi m
(3) ƒ 1 1 2 1 4 3 5 5 6 . 6 3 5 2 3 2 1
(-) 50
(4)
(7) ƒ
(8) F
Klassen
Klassegrenzen
(6) Klassewaarde
6,2 en 6,3
6.15—6.35
6.25
1
50
6.0 en 6.1
5,95—6.15
6.05
1
49
5,8 en 5,9
5,75—5,95
5.85
3
48
5.6 en 5.7
5,55—5.75
5,65
7
45
5,4 en 5.5
5.35—5.55
5,45
10
38
5.2 en 5.3
5,15—5.35
5.25
12
28
5,0 en 5.1
4.95—5.15
5,05
8
16
4.8 en 4,9
4,75—4.95
4.85
5
8
4.6 en 4.7
4.55—4.75
4.65
2
3
4.4 en 4.5
4,35—4.55
4.45
1
1
(5)
50
gegeven dan de waarnemingen en zij eindigen op een 5. Hiermee bereikt men, dat de bovengrens van een klasse tevens de benedengrens is van de naasthogere klasse en dat toch elke waarde ondubbdzinnig kan worden geklassificeerd. De gegroepeerde frequentieverdeling, die op deze wijze wordt verkregen, staat in kolom 7. Nu ziet men duidelijk, dat een groot deel der waarnemingen in enkde centraal gelegen klassen valt en dat de frequentie afneemt, naarmate een klasse verder van dit centrum verwijderd is. Men zegt dan wd, dat de verdding een centrale tendentie vertoont. Voorbeeld 2.3. Dit betreft de waarnemingen in tabd 2.3a van de systoUsche bloeddruk 34
FREQUENTIEVERDELINGEN
2.1
(in mm Hg), gemeten bij een steekproef van 60 kinderen uit de populatie in voorbeeld 1.5. Deze continu verdeelde grootheid is gemeten met een afrondingsinterval van 1 mm Hg en de waarnemingen blijken te variëren van 86 t/m 130 mm Hg. De spreidingsbreedte, d.i. het verschil tussen de hoogste en laagste waarneming, bedraagt 130-86 = 44 mm Hg en is zo groot in relatie tot het totale aantal van 60 waarnemingen, dat men beter direct tot een klasse-indeling kan overgaan. In het algemeen gelden hierbij de volgende richtUjnen : a. De klassebreedte. Kies een constante klassebreedte zodanig, dat ten minste 8 en ten hoogste 25 klassen bezet zijn. Het aantal klassen is gewoonlijk gunstig, als het van de orde van grootte is van de wortel uit het aantal waarnemingen. De klassebreedte kan dus globaal worden bepaald door de spreidingsbreedte te delen door de wortel uit het aantal waarnemingen. Kiest men de klassebreedte te klein, dan ontstaat een te fijne indeling die toch nog tot een onvoldoende overzicht leidt. Kiest men te brede klassen, dan heeft dit een onverantwoord verlies aan nauwkeurigheid ten gevolge, daar bij de latere manipulaties met de verkregen verdeUng de klassewaarde ( = het klassemidden) de waarnemingen in de klasse onvoldoende representeert. In geval van twijfel kan men echter beter een te kleine klassebreedte aanhouden, omdat men daaruit door verdere groepering altijd nog op een grovere indeling kan overgaan. Er zijn gevallen, waarin de klassebreedte bezwaarüjk constant kan worden gekozen, bv. bij verdelingen met een zeer grote variabiUteit. Een bepaalde klassebreedte kan dan bij het centrum van de verdeling goed voldoen, terwijl in de uiteinden (staarten) van de verdeling vele dun bezette of lege klassen (met frequentie 0) optreden. Kiest men echter een grotere breedte, dan gaan in het centrum details verloren. Het kan dan noodzakeUjk zijn. de klassebreedte in het centrum kleiner te kiezen dan in de uiteinden van de verdeling.
b. De ligging der klassen. Kies die groepering, waarbij zo weinig mogelijk lege klassen optreden. Als de uitkomsten de neiging vertonen zich bij bepaalde waarden op te hopen, Ugt het voor de hand de klassen zo te plaatsen, dat de klassewaarden zo ved mogeüjk met deze concentratiepunten samenvallen. De fout die men maakt, door de klassewaarde te beschouwen als representant voor alle waarnemingen in de klasse, wordt zodoende zo klein mogelijk. Leeftijdsverdelingen. Een leeftijd wordt gewoonUjk opgegeven naar de laatst gevierde verjaardag: 20 jaar betekent dan 20 tot aan 21. Heeft men nu bv. een leeftijdsklasse geformeerd van 20 t/m 24 jaar, dan is het klassemidden niet 22 jaar. maar (bijna) 22,5 jaar. Het afronden van Massewaarden. De klassewaarde is het gemiddelde van de beneden- en bovengrens van de klasse, bv. : Klassegrenzen Klassewaarde 399,5 —499.5 449.5 399.95 —499.95 449.95 399.995—499,995 449.995 Waarden als 449.95 en 449.995 kan men echter zonder bezwaar afronden tot 450.
35
2,1
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
Tabel 2.3. SystoUsche bloeddruk (mm Hg) bij een steekproef van 60 kinderen van 6 en 7 jaar uit de populatie in voorbeeld 1.5 a. Waarnemingen 100 107 110 88 105 105
111 94 107 113 89 111
105 109 86 106 115 114
126 119 110 114 95 101
112 104 119 130 109 120
96 105 116 90 121 109
110 111 103 104 108 105
114 99 118 116 103 100
115 98 102 100 109 95
99 115 125 110 105 106
b. Frequentieverdelingen (2) (1) Klassen Klassevan - t/m waarde 128-132 130 123-127 125 118-122 120 113-117 115 108-112 110 103-107 105 98-102 100 9 3 - 97 95 88- 92 90 8 3 - 87 85
(3)
(4)
Puntendiagram
ƒ 1 2 5 9 13 14 8 4 3 1 « = 60
••
Totaal
(5) ƒ « 0,0167 0,0333 0,0833 0,1500 0,2167 0,2333 0.1333 0,0667 0,0500 0,0167 1,0000
(6) F 60 59 57 52 43 30 16 8 4 1 _
(7) F n 1,0000 0,9833 0.9500 0.8667 0,7167 0,5000 0,2667 0,1334 0,0667 0.0167 —
Bij de bloeddrukwaarden in tabel 2,3a bedraagt de spreidingsbreedte 44 mm Hg, zodat er 9 à 10 klassen met een breedte van 5 mm gevormd kunnen worden. Het valt op, dat een belangrijk deel der waarnemingen (22 van dè 60) op een O of een 5 eindigt: bUjkbaar is hier bij het aflezen (onbewust) afgerond. Wij kiezen daarom de ügging van de klassen zodanig, dat de klassewaarden veelvouden van 5 zijn, dus: 85, 90, , 130. Ter verduideüjking is onderstaand de klasse met klassewaarde 95 getekend :
±
92 _J|_
4^ j S3 I
•
Bantdengrens 92.5
36
KlassebrtedtesS75-92,5=5 A
94
I 95 I
96
*
Klassemidden Klossewoardea ^^^ ^ ^ ^ -95
—T"
Bovanorens 97.5
FREQUENTIEVERDELINGEN
2.1
In tabd 2.3b is de frequentieverdding van de waargenomen bloeddrukwaarden met deze klasse-indeling opgesteld. In kolom 1 staan de waarden, die tot dke klasse behoren en in kolom 2 de klassewaarden. In kolom 3 zijn deze keer punten in plaats van turfstreepjes genoteerd; het voordeel hiervan is, dat een -puntendiagram ontstaat, dat reeds een aanschouweUjk beeld van de frequentieverdeUng geeft. In de verdere kolommen zijn de (relatieve) frequentie- en somfrequentieverdelingen geplaatst. Tenslotte een opmerking omtrent het voorkomen van uifbijters, dat zijn sporadisch voorkomende extreem hoge of lage waarden. Als men, zoals bij voorbeeld 2.3, direct tot het opstellen van een gegroepeerde frequentieverdeling overgaat, dient men de waarnemingen eerst op het voorkomen van uitbijters te inspecteren. Deze vergroten nl. de spreidingsbreedte vaak aanzienlijk en men zou dan tot een te grote klassebreedte komen, waardoor de overige waarnemingen in t e weinig klassen bijeen worden gebracht. In principe kan men daarom, als uitbijters optreden, beter de klasse-grootte op de overige waarnemingen baseren en de uitbijters in een extra toegevoegde, zg. open klasse, onderbrengen. Onderstel bv., dat aan de waarnemingen in tabel 2.3a een uitbijter ad 144 mm Hg wordt toegevoegd. Kiest men nu de klassebreedte op grond van de overige 60 waarnemingen, dan ontstaat de volgende verdeUng (vergeUjk met tabel 2.3b) : Klasse ƒ
83-87 1
88-92 3
128-132 133-137 1 0
138-142 0
143-147 1
Men vervangt nu de drie hoogste klassen door de ópen klasse: 133 en hoger+) en geeft de uitbijter in een voetnoot onder de tabel aan : +) 144 mm Hg
2.1.3. VERLIES BIJ REDUCTIE TOT EEN FREQUENTIEVERDELING
Reductie van de oorspronkeUjke waarnemingen tot een frequentieverdeling houdt in, dat men de eerste definitief door de laatste vervangt en met de overzichtelijker en beter hanteerbare verdeling verder werkt. Hierbij gaan echter gegevens verloren, t.w. : a. De volgorde der waarnemingen. Meestal heeft deze geen betekenis; de kinderen, waarop de waarnemingen in tabd 2.3 zijn verricht kunnen bv. in alfabetische volgorde gemeten zijn, of in de wülekeurige volgorde waarin zij zich voor het onderzoek hebben opgesteld. Soms kan de volgorde echter van belang zijn in verband met de aselectiviteit van de steekproef. Een tweede uitzondering treedt op, als men juist de fluctuatie van de waarnemingen (bv. de wijze waarop zij in de tijd variëren) wü onderzoeken. Wij komen hierop in hoofdstuk 11 terug. b. De identiteit der afzonderlijke waarnemingen. Bij het samensteUen van een gegroepeerde frequentieverdeling worden aJle waarnemingen 37
2.1
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
binnen een klasse a.h.w. geUjkgeschakdd: men doet, alsof zij geUjkmatig over de klasse verdeeld zijn, zodat zij gerepresenteerd kunnen worden door hun klassemidden (de klassewaarde). Fijnere nuances van de variabiUteit gaan hierdoor verloren, maar als de Idasse-indeling niet te grof is wordt het geringe verUes aan nauwkeurigheid gecompenseerd door de grotere overzichtelijkheid en de vereenvoudiging van de verdere bewerkingen. c. De samenhang tussen twee tegelijk waargenomen verschijnselen. Heeft men bv. van een aantal kinderen de leeftijd en de üchaamslengte bepaald, dan kan men uit de afzonderüjke verdeUngen van leeftijd en lengte niet meer zien, welke leeftijd en wdke lengte samengaan. Dit bezwaar kan worden ondervangen, door een correlatietabel samen te steUen, Bij een klein aantal waarnemingen kan men beter een spreidingsdiagram tekenen. Wij bespreken deze figuur in 2.2,3 bij de grafische voorstdUngen. 2,1,4. HET OPSTELLEN VAN EEN CORRELATIETABEL
Een correlatietabel bestaat uit een reeks frequentieverdelingen van de ene grootheid {x), nl. één verdeling voor iedere klasse van de tweede grootheid (y). Deze tabel bevat dus tegeUjkertijd de verdding van de grootheid y voor iedere klasse van x en ook de totale verdeUngen van af en y zijn er uit af te lezen. Voorbeeld 2.4. Onderstel, dat men beschikt over een steekproef van 262 jongens, waarvan de leeftijd (in maanden) en de üchaamslengte (in cm) bekend is. Om ruimte te sparen laten wij de oorspronkeUjke gegevens achterwege ; deze zien er echter als volgt uit: Nummer 1 2 3 enz.
Naam
Leeftijd
Lengte
A.V.W. M.G. L.K.
89mnd 103 mnd 86 mnd
132 cm 137 cm 125 cm
De uit deze gegevens samengestelde correlatietabel is in tabel 2.4 gegeven. De leeftijdsklassen hebben een breedte van 3 maanden: de klasse met de waarde 84 bevat dus de jongens van 83, 84 en 85 maanden. De lengteklassen bezitten een breedte van 3 cm : de klasse met de waarde 136 cm omvat dus de lengten 135, 136 en 137 cm. 38
2,1
FREQUENTIEVERDELINGEN Tabel 2.4. Correlatietabel: leeftijd en lichaamslengte van 262 jongens Lengte mem 151 148 145 142 139 136 133 130 127 124 121 118 115 112 Totaal
84
87
90
Leefti. d in maanden 102 93 99 96
105 1
1 1 4 3 5 4 2
1 2 4 8 7 5 1
1 2 1 8 10 7 3 2
20
28
34
1 3 5 6 6 3 1
2 4 9 11 7 4 1 1 39
25
3 5 4 6 3 2 1
24
1 2 3 6 2 1 2
17
108 1 •
1 1 3 7 6 5 1
2 4 8 15 10 6 3 1
25
50
Totaal 1 1 3 7 20 35 47 49 42 34 16 5 1 1 262
2.1.5. SORTEERMETHODEN
Bij een groot aantal waarnemingen wordt het opsteUen van een frequentieverdeling of corrdatietabd door middd van turven een vervelend werkje, waarbij fouten haast onvermijdeUjk zijn. Men kan dan beter een sorteermethode gebruiken. Dit geldt in 't bijzonder, als men aan elk element meerdere waarnemingen heeft verricht (b.v. van elk individu de lengte, het gewicht, de leeftijd, het hemoglobinegehalte, enz. heeft vastgesteld). Dit sorteren kan op verschillende manieren plaatsvinden. a. Sorteerkaartjes. Men vervaardigt kleine kaartjes, waarop aUe gegevens per element systematisch, d.i. in een vaste volgorde, worden genoteerd. Men kan deze kaartjes bv. uit miUimeterpapier knippen of ze laten drukken (het best op zg. briefkaartkarton). Met deze kaartjes. (1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
(19)
(20)
/
1 2 3 4 5 6 7
= = = = = = =:
enz. (21)
(22)
(23)
(24)
(25)
(26)
Volgnummer Geslacht Leeftijd in jaren WelstandsUasse Lichaamslengte in cm Gewicht in kg Hemoglobinegehalte in g %
(27) Figuur 2.1. Sorteerkaartje.
39
2,1
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
waarvan in figuur 2.1 een voorbeeld is gegeven, kan men dan zelf alle gewenste sorteringen verrichten. b. Randponskaarten. Dit zijn registratiekaarten, waarvan één of meer randen voorzien zijn van voorgeponste gaatjes op onderling geüjke afstanden. Wij beperken ons tot de eenvoudigste versie van dit systeem met één rij gaatjes^. Per gaatje kan men nu bv. twee kenmerken aangeven, door al dan niet een ded van de kaartrand bij dit gaatje met een tang of ponsapparaat weg te knippen (zie figuur 2.2). Laat deze kenmerken bv. 'jongen' en 'meisje' zijn en onderstd, dat bij een jongen gaatje 6 wordt ingeknipt en bij een meisje niet. Men kan dan sorteren door de kaarten in dezelfde stand te plaatsen (door het afgeknipte hoekje kan men zien of er kaarten verkeerd staan) en op 'positie' 6 een breinaald door de stapel kaarten te steken. De kaarten van de meisjes blijven dan aan de naald hangen, die van de jongens blijven staan. Men kan heel goed enige tientallen gaatjes in de randen aanbrengen, zonder dat het formaat van de kaart onhandig groot wordt.
« 7
o 8
o 9
o e e o 10 11 12 13
'oHi o3 o2
6
o 7
o 8
e 9
o o o o 10 11 12 13
Ol
a. blanco kaart
b. kaart ingdmipt op positie 6
c, stepel kaarten met doorgestoken pen, gereed voor ket sorteren op pontie 6 Figuur 2.2. Randponskaarten met naaldsortering [uit D E W O L F P (38)].
Een categorisch systeem met meer dan twee categorieën kan worden aangebracht, door twee of meer aangrenzende gaatjes te combineren: gebruikt men n posities, dan heeft men 2" mogelijkheden. Zo zou men bv. de bloedgroepen als volgt in 2 posities kunnen onderbrengen: 1 Voor verdere bijzonderheden wende men zich t o t de firma's, die deze kaartsystemen leveren, zoals N.V. Bukman & Saitorius t e Amsterdam en de fa. Ahrend-Globe t e Hilversum.
40
FREQUENTIEVERDELINGEN
Bloedgroep
Positie 1
Positie 2
0 A B AB
Open Open Öicht Dicht
Open Dicht Open Dicht
2.1
Door met meerdere naalden tegdijk te werken, kan men tegdijkertijd op meerdere posities sorteren. Voor het verwerken van grote aantaUen kaarten in één sorteergang kan een sorteerapparaat worden gebruikt. c, Ponskaarten. Het ponskaartensjreteêm is een technisch volmaakte methode, waarbij het sorteren en teUen zeer snel automatisch wordt uitgevoerd. Men maakt hierbij gebruik van een kaart met gewoonUjk 80 kolommen (posities) en in elke kolom kan door middel van éen ponsmachine één der getallen O, 1, 2, , 9 worden geponst: Hierdoor kan in één positie een categorisch systeem met ten hoogste tien categorieën (die dan de codemmimers O t/m 9 ontvangen) worden ondergebracht (zie figuur 2.3). Door tevens gebruik te maken van twee zg. bovenponsingen - boven de genummerde hokjes - kan men in een kolom ook een der letters van het alfabet vastleggen. Combineert men twee posities, dan zijn er reeds 100 mogelijkheden, enz. Bij het gebruik van ponskaarten dient men tevoren nauwkeurig vast te steUen, welke gegevens men in de kaart wü opnemen, hoeveel categorieën of klassen elk gegeven telt, hoe deze gecodeerd worden, hoeveel posities daarvoor nodig zijn, enz. Op grond hiervan wordt de kaartindeling met bijbehorende codeHjst gemaakt. Met deze lijst kunnen de ge-
WAeNoscsTArisTi EK-
NEDERLANDS INSTITUUT t m m MAEVENTIEVE GENEESKUNDE
5in-pR«Ev eeNEEsmMoc. i
Figuur 2.3. Ponskaart.
41
2.1
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
gevens in de juiste volgorde 'vercijferd' worden op een zg. ponsconcept, dat de basis voor de ponskaart vormt. Er zijn echter ook kaarten, waarop men de gegevens direct op de juiste plaats kan aanstrepen, waarna de ponsing vol-automatisch geschiedt (het zg. mark-sensing systeem). Wij kunnen hier op de vele mogeUjkheden, die het ponskaartensysteem ook voor andere bewerking biedt, niet verder ingaan. Bij inddenteel gebruik van het systeem kan men bij verschiUende instdUngen machinecapaciteit huren en deze instellingen beschikken ook over deskundigen, die kunnen beoordden of een project zich voor mechanische bewerking leent, wat de kosten hiervan zuUen zijn, enz.
2.1.6. OPGAVEN 2.1.
Stel uit onderstaande waarnemingen (hemoglobinegehalten in g% van jongens van 7 t/m 9 jaar) een frequentie- en somfrequentieverdeling samen :
lâSL 13,4 13,6 13,0 13,1 13,7 13,0 13,4 13,8 13,3 12,9 13,3 13,1 13,6 13,0 13,1 12.9 13,4 13.0 13,2 13,0 12.6 12.7 12,8 13,2 12,9 12.1 12,4 12,2 13,0 12.8 12.6 12,8 12,7 12,1 12,6 11,8 12,7 12,5 12,3 12,8 12,4 12,6 12,8 11,9 11,5 12,5 12,6 12,9 12,4
2.2.
Onderstaande waarnemingen betreffen de bezinkingssnelheid der erythrocyten na 45 minuten bij 68 vrouwen van 20 t/m 34 jaar. Maak een frequentie- en relatieve frequentieverdeling. 7 12 16 2 23 31 18 8 15 35 5 7
5 20 8 4 3 14 10 7
6 9 5 11
13 25 8 2 6 10 12 14
3 6 12 7
16 3 11 22 4 8 9 6
9 8 7 15 14 5 5 18 26 3 28 19 15 6 10 23 6 12 13 6 3 4 9 8
2.3. Gegeven zijn de volgende waarnemingen betrefEende de schedelleng[te in m m {x) en het hersengewicht ia gr (y) van 60 mannen tussen 20 en 60 jaar. Stel een correlatietabel samen.
173 193 156 188 176 160 172 '166 175 189
42
1395 1697 1222 1648 1547 1310 1444 1320 1450 1582
172 190 179 175 178 173 182 180 176 163
1341 1490 1478 1340 1556 1481 1479 1549 1656 1190
160 172 196 174 176 183 180 179 193 170
1509 1618 1810 1283 1480 1396 1480 1567 1594 1476
191 185 177 183 182 175 166 176 185 171
1752 1668 1351 1569 1745 1214 1250 1535 1392 1425
170 181 167 178 174 186 199 171 176 179
1310 1654 1434 1365 1443 1576 1865 1543 1465 1362
174 167 171 169 178 170 165 176 184 182
1456 1412 1367 1271 1425 1534 1339 1462 1469 1517
2.2
GRAFIEKEN
2.2. Grafische voorstelling van een frequentieverdeling 2.2.1. HET KOLOMMENDIAGRAM
Men kan de frequentieverdeling met constante klassebreedte van een variabele als een kolonunendiagram of histogram tekenen, door op de (horizontale) Z^-as de klassen af te zetten en op iedere klasse een rechthoek (kolom) te plaatsen, waarvan de hoogte de klassefrequentie aangeeft, gemeten volgens een schaalverdeUng op de (verticale) Y-as. Deze schaal wordt zo gekozen, dat de 'hoogte' van het kolonunendiagram (bij de klasse met de grootste frequentie) ^/a tot ^/j is van de 'breedte' (van de benedengrens van de laagste t/m de bovengrens van de hoogste klasse). Als voorbeeld is in figuur 2.4 het kolommendiagram van de frequentieverdeUng in tabel 2.2b getekend.
frequentiepolygoon
6,2516,4 51 klassewaarden
415 435 4,55 4.75 4,95 5,15 5,35 5,55 5,75 5,95 6,15 6,35 6,55 klossegienzen erythrocyten in millioenen per mm 3 Figuur 2.4. Kolommendiagram en frequentiepolygoon van de verdeling in tabel 2.2b.
Als de frequentieverdeUng een categorisch systeem van attributen betreft tekent men gewoonUjk een staafdiagram. Hierin worden de attributen aequidistant, maar van elkaar gescheiden, op de X-as afgezet en wordt op elk attribuut een smaUe kolom (staaf) opgericht, waarvan de hoogte de (relatieve) frequentie van het attribuut weergeeft (zie figuur 2.5), Als van de frequentieverdeling van een grootheid de klassebreedte niet constant is, dient men hiermee rekening te houden bij het vaststd43
2.2
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
len van de juiste kolomhoogte in het kolommendiagram. De frequenties van klassen met verschülende breedte zijn immers niet direct vergelijkbaar, zodat men dan moet werken met de frequentiedichtheid, d,i. de frequentie per eenheid van de beschouwde grootheid.
± N 0,5
0.4
0,3
Voorbeeld 2,5, In tabel 2,5 is de leeftijdsverdeling opgenomen van 488 patiënten, behandeld voor cervix cardnoom. De schrijver merkt hieromtrent o.m. op : 'It wül be noted, that almost a majority of the patients faU into the age group 40-^5, commonly known as the cancer age'.
0.2
0,1
0
A B bloedgroepen
nAB
Figuur 2.5. Staafdiagram van de verdeling van bloedgroepen in voorbeeld 1.16.
Tabel 2.5. Patiënten behandeld voor cervix carcinoom+) Aantal patiënten Leeftijd Per 5 jaar Totaal 11,25 22-30 18 30-35 45 45 35-40 79 79 40-55 75 225 55-60 63 63 22,5 60-70 45 3,25 70-90 13 Totaal 488 + Uit: Carcinoma of the Cervix Uteri, J. Am. M. Ass.. June 25. 1932.
De leeftijdsklassen dienen gelezen te worden als: 22 t/a 30, 30 t/a 35, enz. (om misverstand te voorkomen kan men dus beter schrijven: 22 t/m 29 (of 22-29), 30 t/m 34 (30-34), enz.). Wij zien, dat de leeftijdsklassen van verschiUende breedte zijn. Het grote aantal patiënten in de klasse van 40 t/m 54 jaar betreft 15 jaarklassen, terwijl de frequenties in de aangrenzende leeftijdsklassen op slechts 5 jaarklassen betrekking hebben. Men verkrijgt nu een juister beeld, door de frequentiedichtheid bv. per 5 jaar te berekenen (d.i. door te nemen: frequentie per klasse maal 5, gededd door de klassebreedte : zie de laatste kolom in tabel 2.5) en hiermee het kolommendiagram van de verdeUng te tekenen (figuur 2.6). Op deze wijze bereikt men, dat de oppervlakken der kolommen op de (ongeUjke) klassen evenredig zijn met de klassefre44
2.2
GRAFIEKEN
quenties (evenals bij het kolommendiagram van een verdeUng met constante klassebreedte). 80 -
o o
-
—
70
-
60 -
-
50 -.
•
UQ -
-
30 -
•
20 -
•
10
-
m o» o.
c O) 3
ar at
I\ 0
V
':12 20
3 30
r
40
r
'5 50 60
70
1 80
\ 90 Leeftijd in jaren
Figuur 2.6. Kolommendiagram van de verdeling in tabel 2.S. Vraag: Over welke gegevens zoudt u nu nog moeten beschikken, om de uitkomsten in tabel 2.5 verantwoord te kunnen interpreteren?
Als men uit de frequentieverdeling met constante klassebreedte van een variabele de somfrequentieverdding heeft opgestdd, kan deze grafisch worden voorgesteld door een trappenlijn. Men richt hiertoe op de X-as op de bovengrenzen van de klassen kolommen op, waarvan de hoogte evenredig is aan de somfrequentie van de klasse, waarbij de bovengrens behoort. In figuur 2.7 is de trappenUjn getekend, die behoort bij de somfrequentieverdeUng van de erythrocyten in tabel 2.2b. 2.2.2. DE FREQUENTIEPOLYGOON
Bij het tekenen van de frequentiepolygoon van een frequentieverdeUng met constante klassebreedte richt men op de X-as op elk klassemidden een loodlijn op, waarvan de hoogte de klassefrequentie weergeeft. Vervolgens verbindt men de bovenpunten van deze ordinaten tot een gebroken lijn (polygoon). Hierbij worden ook de middens betrokken van de Unks en rechts toegevoegde klassen met frequentie nul (zie figuur 2,4). Op analoge wijze verkrijgt men via de ordinaten op de bovengrenzen van de klassen de somfrequentiepolygoon (zie figuur 2.7). 45
2.2
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
50ri
40-0.8
30-0,6
2 0-0.4
10-0 2
4 / 5 4,65 4,85 5,05 ^25 ^ 5
5.65 5,85 6.05 Ç25 6iA5
X
erythrocyten in millioenen per m m ^ Figuur 2.7. Grafiek van de somfrequentieverdeling in tabel 2.2b (kolom 8).
In het algemeen verdient het kolommendiagram als grafiek van een frequentieverdeUng de voorkeur boven de frequentiepolygoon. Niet aUeen komt in het kolommendiagram het discrete karakter van de waarnemingen beter tot uitdrukking, maar verder is het bedd, dat een frequentiepolygoon geeft altijd min of meer vertekend, omdat de oppervlakken onder de polygoon boven de klassen niet predes evenredig zijn aan de klassefrequenties. Als men echter beschikt over een groot aantal waarnemingen van een continue grootheid, zodat men een frequentieverdeling kan samenstellen, die een groot aantal klassen met een relatief kleine klassebreedte bevat, kan men beter de frequentiepolygoon tekenen, Wü men twee of meer frequentieverdelingen - die berusten op een verschiUend aantal waarnemingen - grafisch vergelijken, dan dient men de relatieve frequentieverdelingen te tekenen. Men kan dan beter geen kolommendiagrammen op hetzelfde assenstelsel gebruiken, daar deze grotendeels op elkaar VEiUen en een onduidelijk beeld opleveren (zie figuur 2,8A), Men kan de (som)frequentiepolygonen tekenen of ge46
2,2
GRAFIEKEN
bruik maken van verschiUend gearceerde of gekleurde staafdiagrammen (zie figuur 2.8B). AJs de frequentieverdeUngen steekproeven betreffen, kan men overigens dechts zdden (i.e. bij zeer uitgesproken verschiUen en grote steekproefomvang) volstaan met zo'n grafische vergeUjking van deze verdeUngen, omdat daarbij het gevaar bestaat dat men betekenis toekent aan verschiUen, die nog zeer goed toevallig kunnen zijn.
A. Kolommen diagrammen
B. Staafdiagrammen
Noordholland Limburg
• •
0 1 2 3 4 S 6 2:7 aantal inwonende kinderen per huishouding
Noordhiolland Limburg
O 1 2 3 « 5 6 >7 aantal inwonende (hinderen per huishouding
Figuur 2.8, Twee grafieken van het aantal kinderen per 100 huishoudingen in de provincies NoordhoUand en Limburg per 31 Mei 1947 (gegevens: Statistisch Zakboek C.B.S., 1954). Het is duidelijk, dat figuur B de voorkeur verdient boven A. 2,2,3. HET SPREIDINGSDIAGRAM
Evenals de corrdatietabd kan het spreidingsdiagram worden samengestdd als men beschikt over de waamemingsparen {x, y), d.i. als men per element over een waarneming van de grootiidd x en over een waarneming van de grootheid y beschikt. In een assenstelsel met op de .X^-as een schaalverdeling, van de grootheid x en op de Y-as een schaalverdeling van de grootheid y tekent men dan per dement een punt met als abscis de waargenomen ^ic-waarde en als ordinaat de waargenomen y-waarde van dat element (zie bijlage 2, par. 6). Voorbeeld 2.6. Onderstaande waamemingsparen betieflfen de vleugeUengte [x) en de lengte van de tong (y), béide in mm, van 22 bijen : X y X y
9,68 6,53 9,53 6.43
9,81 6,71 9,74 6,67
9,59 6,70 9,67 6.68
9,68 6,69 9,56 6,62
9,44 6,45 9,49 6.61
9,59 6,62 9,41 6.36
9.61 6.59 9,45 6,50
9,55 6,55 9,52 6,41
9,25 6,35 9,58 6,50
9,35 6,40 9,60 6,62
9,70 6,61 9,68 6,65
De spreidingsbreedte van de vleugeUengte is 9,81 — 9,25 = 0,56 mm en die van de lengte van de tong is 6,71 — 6.35 = 0,36 mm. Men 47
2.2
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
brengt nu op de X-as, resp. op de Y-as, de schaal van. de vleugeUengte, resp. die van de lengte van de tong, zodanig aan, dat het gehele spreidingsdiagram ongeveer een vierkant vormt (zie figuur 2.9) en tekent hierin de punten {x, y).
1
1
1
1
1
1 — r -— I — • ] —
r—T
-I
•
•
6.70
• («5,^50 1
Î , 6,50 . c
«
•
•
7
• •• • • •
•
I 6.60 -
•
•
g> 6.40 o •
•
• •
.
•
:
•
•
6,30
£120
930 ^0 9.50 9.60 vleugeUengte in mm.
9.70
980
Figuur 2.9, Spreidingsdiagram (gegevens voorbeeld 2.6), 2,2,4. ANDERE GRAFIEKVORMEN
Er zijn nog verschiUende andere grafiekvormen, maar deze worden vnl. gebruikt voor pedagogische doeleinden, propaganda, redame. e.d. Wij volstaan'daarom met het geven van enkde voorbeelden. Een cirkeldiagram (zie figuur 2.11) leent zich goed voor het weergeven van een procentude samensteUing. Bij de beeldgrafieken werkt men met figuurtjes, die van toepassing zijn op de groothdd die men grafisch voorstelt. De frequentie van een kenmerk of klasse wordt dan door een aantal van deze figuurtjes weergegeven, waarbij elk figuurtje een zeker aantal personen of objecten voorstdt. Het jaarUjks verschijnende Statistisch Zakboek van het Centraal Bureau voor de Statistiek bevat altijd een aantal zeer geslaagde beeldgrafieken (figuur 2.10 is aan het zakboek 1957 ontieend). Cartogrammen worden gebruikt om de geografische spreiding van een grootheid weer te geven. Op de kaart van het betreffende gebied geeft men dan de verschiUende frequentie in de deelgebieden aan door een verschiUende arcering. Ook kan men in de deelgebieden beeldgrafieken aanbrengen (het reeds genoemde Statistisch Zakboek bevat ook hiervan in de regel enkele voorbeelden). 48
2,2
GRAFIEKEN
Aantal doden ten gevolge van verkeersongevallen op de openbare weg i in jaren
mannen
vrouwen
iHH milllir"'Mit mnilll iHH "" Mliit IIIIIIIIHIIIIIIt""(Mlf
IM««»««««««««»««""!!! It
1 . . « .
• • • t •
• I • • •
1953
• • . •
65 en ouder
Elk figuurtje stelt 20 porso
Figuur 2.10. Beeldgrafiek (Uit Statistisch Zakboek, C.B.S., 1957).
49
2.2
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
•^
X ^ \ .
/.
\
OVERIGE WEEFSELS
N.
^ ^'^
SPIER WEEFSEL 25.0
>. INGEWANDEN
'
11,1
'
>v
\ \
\
\ .
X
(ï-^ ...
1
CENTRATL""^^^«^V •> 13.4 W . ' , ' . ' .i • •
^
1 ZENUWSTELSEL ^ W » ' . ' m
\
^ ^ ^ ^ ^ B r l
HUID
BEEN-
^ ^^ ^^ ^^ V^ ^^.^^ .. ** .. WEEFSEL •„ en ^^r*I*I*I*
• %
BANDEN
*
^^*<,fc* * • •
••
•
4
a
•1«
Figuur 2.11. Cirkeldiagram van de procentuele samenstelling van het totale lichaamsgewicht van de mens bij de geboorte. Uit: CROXTON (43). 2.2.5. WENKEN EN WAARSCHUWINGEN
Voor het tekenen van grafieken gebruike men bij voorkeur grafiekenpapier, dat in grote verscheidenheid verkrijgbaar is. Behalve het gewone miUimeterpapier - met op de X- en Y-as een onderverdeling in 1 mm, met samenvattingen per 5 mm en per 10 mm - bestaan er ook papieren met afstanden van 2, 3, 4, 5 en 10 mm. Het 2 mm-papier is zeer geschikt voor reproductiedoeleinden. Het cm-papier leent zich bv. voor het maken van grote grafieken voor lezingen of tentoonstellingen. Enkel of semi-logarithmisch papier heeft een aequidistante verdeling op één as, terwijl op de andere een logarithmische verdeling is aangebracht. Men kan dit papier bv. gebruiken voor een grafische voorstelling van verschijnselen, waarbij in elke tijdseenheid ongeveer dezelfde procentuele toe- of afneming optreedt. Bovendien kan het worden gebruikt als men te maken heeft met een frequentieverdeling, waarvan de frequenties sterk uiteenlopen. Bij het gebruik van aequidistant papier worden dan de afmetingen van de grafiek onpraktisch groot, of de grafiek wordt (bij de lage frequenties) zeer onnauwkeurig. Tenslotte noemen wij nog het dubbel logarithmisch papier met op beide assen een logarithmische indeling. Voor een uitgebreide en met voorbeelden geïllustreerde bespreking van deze en andere grafiekpapieren verwijzen wij echter naar FERRO (14). 50
GRAFIEKEN
2.2
Een grafiek behoort op zichzelf leesbaar te zijn en dient daartoe een voUedige aanduiding der weergegeven grootheden, schaalverdelingen, enz. te bevatten. Soms laat men de aanduiding der schalen achterwege, waardoor de weergegeven uitkomsten zich geheel aan een verantwoorde interpretatie onttrekken (zie figuur 2.12). In advertenties treft men deze fout veel aan (zie bv. N.T.v.G., 98 (1954), advertentie naast pag. 1360). Te ved Ujnen in één grafiek Idden tot een onoverzichteUjk en ondoorziditig geheel, waaruit men weinig of niets kan aflezen (zie figuur 1.2).
Figuur 2.12. Onvolledige grafiek. Uit de bij deze figuur behorende tekst is op te maken, dat hier de leeftijdsopbouw (bij geobduœerde gevallen van longcarcinoom) van mannen en vrouwen wordt vergeleken. Een tweede fout is dus, dat de absolute in plaats van de telatieve fiequentieverdelingen in de tekening zijn opgenomen.
Van ved bdang is verder de eenhedenkeuze op de beide assen. Door de klasse-indeUng op de X-as te comprimeren en de frequentieschaal op de Y-as uit te rekken kan men de indruk wekken, dat de weergegeven verdeling een kleine variabiliteit en een sterke centrale tendentie vertoont. Doet men het tegengestelde, dan suggereert men een min of meer vlakke verdeling met een grote variabüitdt. Vandaar de in 2.2.1 gegeven aanwijzing, de 'hoogte' van de figuur op ongeveer ^/g à 8/4 van de 'breedte' te kiezen. Een bijzonder midddend beeld kan ontstaan, als men de schaalverdeling op de Y-as niet bij het nulpunt laat beginnen. Figuur 2.13 demonstreert het effect, dat hiermee kan worden bereikt. De bedoeling is een indruk te geven van de verschiUen tussen de gemiddelde lengte en het gemiddelde gewicht van groepen schoolkinderen (van 6 | t/m 13| jaar), die wèl en niet schoolmdk gebruikten. WeUswaar vertoont de schaal op de Y-as een nulpunt, maar men bedenke dat hier feiteUjk het gemiddelde gewicht, resp. de gemiddelde lengte, van 1937 zou 51
2.2
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
Figuur 2.13. Verschil in toeneming van gewicht en lengte tussen schoolmelk en nietschoolmelk drinkende kinderen in de jaren 1949 en 1950 ten opzichte van 1937. (Uit „Melk op School," Centraal Schoolmelkcommité, Den Haag).
moeten staan en dat deze gemiddelden wel in de buurt van 130 cm, resp, 27 kg zuUen liggen. Tenslotte geven wij in figuur 2.14 een voorbeeld, waarbij de indeUng op de X-as tot een onjuist beeld leidt. De afstand van 6 tot 24 uur is hier kleiner dan die van 1 tot 6 uur en gelijk aan die van 24 tot 48 uur genomen, waardoor vooral een overdreven indruk van de daling tussen het 6e en het 24e uur ontstaat. Uit de voorgaande voorbeelden bUjkt wd, dat men een grafiek met zorg moet samensteUen en dat men een gegeven grafiek altijd kritisch dient te beschouwen. Grafieken kuimen een waardevoUe steun vormen bij het bestuderen van cijfermateriaal, maar zij kunnen ook zeer misIddend zijn. 52
2,3
GEMIDDELDEN
123456 24 uren
48
120
Figuur 2,14, Verloop van een grootheid in de tijd : onjuiste schaalverdeling op de X-as. 2,2,6. OPGAVEN 2.4. Teken het kolommendiagram van de verdeling in tabel 2.3b. 2.5. Teken het kolommendia^am en het cumulatieve kolommendiagram van de verdelingen in: a. Opgave 2.1, b. Opgave 2.2. 2.6. Teken een spreidingsdiagram van onderstaande gegevens b e t i ^ e n d e het lichaamsgewicht in gr (*) en het gewicht van de kam in mg (y) van 13 I^ghom kuikens : X 85 72 69 78 69 90 88 95 92 91 75 82 76 y 54 42 29 37 18 84 56 107 90 68 31 48 41 2.7. Teken een spreidii^diagram van de gegevens in opgave 2.3,
2.3. Gemiddelden 2.3.1. DEMODUS
De modus van een frequentieverdeling van een categorisch ss^teem van kenmerken is het kenmerk met de grootste frequentie. Bij een frequentieverdeUng van een variabele met klassen van verschiUende frequentie breedte noemt men de klasse, waarin het quotiënt : ç: r — J T - het grootst is, de modale klasse en haar klassewaarde ( = het klassemidden) de modus. Bij een verdeUng met constante klassebreedte is dus de klasse met de grootste frequentie de modale klasse. Frequentieverdeddingen met één modus noemt men unimodaal. Voorbeelden 2.7. De modus van de verdeling in voorbeeld 1.16 is het kenmerk: bloedgroep A. 2.8. De modus van de verdeling in voorbeeld 1.18 is 13,5 g%. 2.9. De modus van de verdeling in tabel 2.3b is 105 mm Hg. De modale klasse is de klasse 102,5-107,5 mm Hg.
53
2.3
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
In het dageUjks leven denkt men bij het gebriük van termen als 'de gemiddelde gezinsgrootte' of 'de gemiddelde Nederlander' het eerst aan de modus, maar voor wetenschappeUjke doeleinden wordt dit gemiddelde zelden gebruikt. 2,3,2. DE MEDIAAN
De mediaan van een oneven aantal van 2» -f- 1 naar grootte geordende waarnemingen is de waarde van de (« -^ 1)» waarneming. Bij een even aantal van 2n waarnemingen is de mediaan enig getal tussen de waarde van de «» en de (« -|- 1)« waarneming; in de regel kiest men hiervoor de halve som ( = het rekenkundig gemiddelde) van deze twee middelste waarnemingen. Als men van een continu verdedde grootheid dechts over een gegroepeerde frequentieverdeling beschikt, kan men in het algemeen slechts de klasse aangeven, waarin de mediaan ligt. Voorbeelden 2.10. De mediaan van de onderstaande 9 waarnemingen is 130: 122 124 125 127 130 130 134 140 273 2.11. De mediaan van de onderstaande 8 waarnemingen is 40,5 : 2 35 38 40 t 41 42 46 52 2.12. De mediaan van de verdeling in voorbeeld 1.18 ligt in de klasse met de grenzen 13,25 en 13,75. Als men de waarnemingen ia deze klasse kent, kan men ze rangschikken en de mediaan bepalen. Als men aanneemt, dat deze waarnemingen gelijkmatig over de klasse verspreid liggen, kan men de mediaan verkrijgen door lineaire interpolatie binnen deze klasse. Men vindt dan: 95—83 mediaan = 13,25 4 77— 0,5 = 13,38 = 13,4. Men kan in dit geval de mediaan ook eenvoudig aflezen uit de somfrequentiepolygoon. Men trekt daartoe een horizontale lijn door het punt met relatieve somfrequentie 0,5 op de Y-as (zie de stippellijn in figuur 2.7). Deze lijn snijdt de polygoon in het punt, dat loodrecht lig^ boven de waarde op de A'-as, waar de mediaan ligt (controleer de uitkomst, mediaan = 5,30, door berekening). 2.13. De mediaan van de verdeling in tabel 2.3b is 107,5 (deze klassegrens blijkt de verdeling juist te halveren).
2,3.3. HET REKENKUNDIG GEMIDDELDE
2.3.3.1. Niet-gegroepeerde waarnemingen. Het rekenkundig gemidddde van een aantal waarnemingen is de som van hun waarden, gededd door hun aantal. Het wordt gewoonüjk 'het gemiddelde' genoemd en waar dit niet tot misverstand aanleiding kan geven, zullen wij deze gewoonte volgen. 54
GEMIDDELDEN
2.3
Betreffen de waarnemingen de dementen van een populatie, dan wordt hun gemiddelde aangeduid met n (de Griekse letter mu) en dan "gddti.1, (2.1)
^** Ex ^ . = '=L_ = - ^ ,
waarin N de omvang der populatie is. Betreffen de waarnemingen de elementen in een steekproef, dan wordt hun gemiddelde aangeduid met x en dan is dus: n
(2.2)
^** -X = - ^
Ex == - ^
n n waarin n de omvang van de steekproef is.
Voorbeeld. 2.14, Het gemiddelde van de 9 waarnemingen in voorbeeld 2.10 is: 122 -I- 124 + 125 -l- 127 -|- 130 + 130 + 134 + 140 -t- 273 1305 _ "^ g = -^-145.
2.3.3.2. Frequentieverddingen. Het gemidddde van de frequentieverdeling van de variabele x op een populatie (kortweg: het gemidddde van de populatieverdding van x) is, als deze verdding k klassen van constante breedte heeft : k
,5^^ (2.J)
,„1 , _ flXi -\-fspC2 + - ' • • +f*Xk _
E fX i=l j^*^ * _ j^ J^^ i .
Hierin is Xi de klassewaarde en ƒ, de frequentie van de klasse *. Berekent men het gemiddelde uit de relatieve frequentieverdeling, dan is:
(2.4)
^=1A.., = 2^4..«,.
Het gemiddelde van de frequentieverdeling van de variabele y op een steekproef ( = het gemidddde van de waargenomen verdding van x) is, bij k klassen van dezelfde breedte:
(2.5)
X =
n 1 Zie voor het gebruik van het somteken E (Griekse hoofdletter sigma) bijlage 2, par. 1.
55
2.3
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
Als de klassen van de frequentieverdeling gevormd worden door de waargenomen waarden zelf (zodat elke klasse uit één waarde bestaat en bij een continu verdeelde groothdd de klassebreedte gelijk is aan het afrondingsinterval), levert de berekening van het gemidddde uit de frequentieverdeling predes dezelfde uitkomst op als de berekening uit de ongegroepeerde waarnemingen. Als de klassen bestaan uit intervallen, die gevormd zijn door een constant aantal waarden bijeen te nemen, dan is dit niet het geval. Berekent men het gemiddelde uit zo'n gegroepeerde frequentieverdeUng, dan wordt elke klasse vertegenwoordigd door het klassemidden Xi. Dit zal gewoonUjk niet precies geUjk zijn aan het gemidddde van de klasse, waardoor bij deze berekening foutjes worden gemaakt. Als echter het aantal waarnemingen niet te klein en de gekozen klasse-indeling niet te grof is, zuUen de foutjes in positieve en in negatieve richting elkaar grotendeels opheffen, zodat hun som dicht bij nul zal Uggen. Het gemiddelde van de gegroepeerde verdeUng, - dat met de in 2,5 gegeven methode snel kan worden berekend - zal dan slechts weinig verschiUen van het gemiddelde van de ongegroepeerde waarnemingen. Voorbeelden 2.15. Beschouw onderstaande berekeningen, waarbij wij aannemen dat de gegeven frequentieverdeling een populatie betreft: Frequentieverdeling Totaal 3 4 5 6 7 8 9 25 = iV 1 2 6 8 4 3 1 3 8 30 48 28 24 9 150 = Sfx
X
f ß
150 /*« = 25 = 6
(2.3)
Relatieve frequentieverdeling X
f N
L.x
3
4
5
6
7
8
9
Totaal
0,04
0,08
0,24
0,32
0,16
0,12
0,04
1,00=
z l
0,12
0,32
1,20
1,92
1,12
0,96
0,36
6,00 =
Z ^ - x
N A*, = 6
(2.4)
2.16. Berekening van het gemiddelde van de verdeling in tabel 2.3b: X
f f»
85 90 1 3 85 270
95 4 380 (2.5)
56
100 8 800
105 14 1470
110 13 1430
115 120 5 9 1035 600
6450 = 107,5 60
125 2 250
130 1 130
Totaal 60 = » 6450 = Zfx
SPREIDINGSMATEN
2.4
Berekent men het gemiddelde via de oorspronkelijke waarnemingen in tabel 2.3a dan vindt men met (2.2) : 100-I- 111-I- 105-J- . . . -f 100-I- 106 60
6441 60
,„„_
De fout, die ontstaat door het gemiddelde uit de gegroepeerde verdeling te berekenen blijkt hier dus 0,15 te bedragen, d.i. ca. 0,14 %.
2.3,3,3. Gewogen gemiddelden. Als men beschikt over twee steekpiroeven, resp. steekproef 1 van de omvang »^ met gemidddde x^ en steekproef 2 van de omvang n^ met gemidddde x^, dan is het gewogen gemiddelde van alle n = n^-^- n^ waarnemingen : (2.6)
x=
**^*^ "^ ***** «l + «2
n _
n 1
_
n
n
8
1
i-l
i=l
n a
daar: njXi = E Xf, «a«8= E Xf en E Xt -{- E Xj = i-l
j=l
E x„. M-l
Analoog geldt voor k steekproeven : Je
(2.7)
_
E nfXf « = -^=h En,
= EWiXi (w, = - ^ . n = Ent).
<-i
2.4. Sprddingsmaten 2.4.1. DE SPREIDINGSBREEDTE
De sprddingsbreedte van een aantal waarnemingen is het verschü tussen de hoogste en laagste waarde. Wij hebben deze maat voor de variabiUteit reeds gebruikt bij het kiezen, van de klassebreedte voor een gegroepeerde frequentieverdeling. De sprddingsbreedte bezit het naded, dat zij slechts berust op twee waarnemingen en dat haar interpretatie afhangt van de steekproefomvang: hoe groter deze is, des te groter is in het algemeen de sprddingsbreedte. Voorbeeld 2,17. Beschouw de waarnemingen in tabel 2.3a. De spreidingsbreedten van de . 10 kolommen (ieder met 6 waarnemingen) zijn, van Unks naar rechts: 22 24 29 31 26 8 31 20 19 26 (gemiddelde 23,6, mediaan 25). De spreidingsbreedten van de 6 rijen (ieder met 10 waarnemingen) zijn, van boven naar beneden : 30 25 39 42 32 25 (gemiddelde 32.2. mediaan 31). De spreidingsbreedte van alle 60 waarnemingen is 44.
57
2.4
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
Voor « < 10 kan de sprddingsbreedte, die direct uit de waarnemingen kan worden afgelezen, dienen voor het schatten van de waarde van een andere spreidingsmaat, de standaarddeviatie (zie 2.4.4). Deze procedure wordt wel bij de kwaliteitscontrole in de industrie toegepast en wordt bv. beschreven in (28). 2.4.2, DE GEMIDDELDE AFWIJKING
Deze spreidingsmaat wordt tegenwoordig nog maar zelden gebruikt. Zij wordt gedefinieerd als : (2.8)
GA = ^ \ ^ < - ^ \ n en is dus het gemiddelde van de absolute waarden van de afwijkingen Xi — X, dat zijn de waarden van deze verschiUen, zonder dat daarbij op het teken wordt gdet (merk op, dat E {x, — x) = 0 ) . 2.4.3. FRACTIELEN EN HET KWARTIELENINTERVAL
Het fractid a van een naar grootte geordende reeks dementen is de waarde waarbeneden een fractie a van aUe waarnemingen ligt. Men duidt een fractid aan, door aan het S3anbool van de variabde deze fractie als index toe te kennen: zo is dus bv. x^ (*o,io) ^^^ firactid a (0,10) van de verdeling van de grootheid x (men zegt ook wel: het 10e percentid, resp. het Ie deciel). De fractiden «„ 35 ^^ ^o,7s noemt men het eerste, resp. het derde kwartid. Het tweede kwartiel, XQ^^O' ^ de mediaan. Evenals bij de mediaan doet zich bij de fractiden de modUjkheid voor, dat men bij een waargenomen verdeling meestal x^ niet predes kan aangeven. Zij kunnen echter vrij nauwkeurig (bv. door lineaire interpolatie) worden bepaald, als de verdeUng op een groot aantal waarnemingen berust en als maat voor de spreiding kan men dan gebruiken: (2.9)
K =
^W5 - %2s ^
het kwartideninterval (halve kwartielsafstand). Ook deze spreidingsmaat wordt echter zelden gebruikt. Fractielen spelen een belangrijke rol bij het tabeUeren van (theoretische) continue verdeUngen en hiervan zuUen wij in latere hoofdstukken vele voorbeelden ontmoeten. 2.4.4. DE VARIANTIE EN DE SPREIDING
2.4.4.1. Niet-gegroepeerde waarnemingen. De variantie van de popu58
SPREIDINGSMATEN
2.4
latieverdding van de grootheid x, betreffende een populatie van N dementen wordt gedefinieerd als : N
(2.10)
a,» = -^^L—^
= Mx<^,^.) ^
De wortel uit de variantie, a (de Griekse letter dgma), heet de spreiding of standaarddeviatie. Uit (2.10) blijkt, dat a^' en a^ de variabiUteit van de waarnemingen t.o.v. hun gemidddde ƒ*„ meten. Wij zuUen later zien, dat de spreiding, die in dezdfde eenheden is uitgedrukt als de waarnemingen zdf, het beste kan worden gebruikt voor het beschrijven van de variabiUteit. De variantie speelt een belangrijke rol bij mathematische manipulaties. De variantie van een steekproef van n waarnemingen van de groothdd X definiëren wij als: n
E
(2.11)
{Xi -
s„« = J=ï n ~ \
X)'
™
_ -.g
= iliïi_^. «— 1
Evenals bij het gemiddelde worden de variantie van een populatie en die van een steekproef door verschiUende symbolen («r* tegenover s*) van elkaar onderscheiden. Bij de berekening van s* wordt echter gedeeld door » — 1 (en niet door n, zoals men zou verwachten). Wij komen op dit verschü later terug. Voorbeeld 2.18. Beschouw de berekening van s* en 5 voor onderstaande steekproef van 6 waarnemingen : 24 Xi 1 3 4 5 5 6 SXi = 2 A , x = - ^ =A: Xi -
X
— 3 — 1 0 H-l -l-l + 2
[Xi -
X)*
9
1 0
1
1
Zodat: s« = J ^ = J ^ = 3,2 6— 1 5
4
S{Xi-x) = 0 S(Xi - x ) ' = 16 s = V 3,2 = 1,79
De formules (2.10) en (2.11) kunnen worden herleid tot een vorm, die geschikter is voor het uitvoeren van berekeningen. Immers (zie bijlage 2, par. 1): E{Xi - j«)2 = Ex,^ - 2fi • EXi + Nfi». 59
2.4
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
Daar /* = Exf/N en /iN = Exi, volgt hieruit :
E{Xi-;,)» = E X i ' - 2 ^ ^ ^ E X i - { - N \ ^ ^ ^ ' = Exi» -
J ^
of: E{Xi - /i)» = Exi* - 2/i {fiN) -f N/l* = Ex^ - N/i». Men kan dus voor (2.10) ook schrijven: (2.12)
Exi*--^^ ^ =
a.. =
^ - / i , » .
Op analoge wijze volgt uit (2.11) : Exi*
(2.13)
s,« =
(Exi)'
n— 1
"
Bij het gebruik van deze formules behoeft men dus niet meer alle verschiUen «< — /i, resp. Xt — x, te berekenen, maar dechts de som van de waarnemingen {EXi) en de som van de kwadraten van de waarnemingen (Exi*). Tevens vermijdt men hierdoor foutjes die ontstaan, als men bij het gebruik van (2.10) of (2.11) met een afgeronde waarde van /ix, resp. van x, werkt. Voorbeeld 2.19. Past men (2.13) toe op de waarnemingen in voorbeeld 2.18, dan is: SXi = 24, (i:xi)*/n = (24)V6 = 96, £Xi> = (1)« + (3)» . . . . -j-, (6)» = 112, zodat: 5
112-96 _
16 _ 5--3'2-
2.4,4.2. Frequentieverdelingen. De variantie van de populatieverdeling van de grootheid x (met k klassen van constante breedte) is : (2.14)
ff.2
= / i (^1 ~ /"«)' +f» (^« - / » » ) ' + • • • + ƒ * (^fc - MxY _ Efi (Xi - ^,)« ÎV •
Voor berekening van de populatievariantie kan men gebruik maken 60
2.4
SPREIDINGSMATEN van de formule: EfiXÎ, (2.15)
(^M)' N
».« =
• IL «
N
N
Berekent men deze variantie uit de rdatieve frequentieverdeling, dan geldt:
^— Y^^-'^'-^'
(2.16)
Voorbeeld 2.20. Beschouw onderstaande berekeningen betrefEende de verdeling in voorbeeld 2.15:
X
3
f
1 2
f>f
3
Frequentieverdeling 5 6 7 8 9
4
6 8
8
4
3
30 48 28 24
1
Totaal 2S = N
9 150 = Sfx
fx* 9 32 150 288 196 192 81 948 = Sfx* 948
=
25
(150)« 25 = 1,92
0. ,^ _ = :948 ^ - ( 6 ) « =1,92
1 ^
3
4
Relatieve frequentieverdeling 5 6 7 8 9
/ N
0,04 0,08 0,24 0,32 0.16 0,12 0,04
ri"
0,12 0.32 1,20 1,92 1,12 0.96 0,36
Totaal - ^ -
4^ =6
0,36 1,28 6,00 11,52 7,84 7,68 3,24 i:Z*» = 37,92 or,» = 37.92 - (6)» = 1,92
61
2,5
REDUCTIE VAN WAARNEMINGSUITKOMSTEN
De variantie s,,* van de waargenomen verdding van de groothdd x (met k klassen van constante breedte)-is:
n—\
n—\
Zie voor een voorbeeld waarin (2,17) wordt toegepast tabel 2.6 (Unkerdeel). 2.4.5. OPGAVEN 2.8.
Gegeven is de volgende steekproef: 3 2 1 1 1 3 1 4 5 1 2 4 3 2 3 5 4 2 5 1 2 Bepaal (zo mogelijk) : a. De modus, b. De mediaan, c. Het gemiddelde, d. De variantie, e. De spreiding.
2.9.
Als opgave 2.8, maar voor de steekproef: 4 5 3 4 4 6 1 6 4 2 5 4 5 3 7 4 3 5 4 6 2 5 1 3 5 4 3 6 4 2 4
2.10. Bereken het gemiddelde en de spreiding van onderstaande relatieve populatieverdeling :
* 1 //A^.
10 11 12 15 16 17 18 19 20 13 14 0.01 0.04 0,08 0,11 0,15 0,20 0,18 0,11 0,07 0,03 0.02
2.5. Vereenvoudigde berekening van het gemidddde en de spreiding 2.5.1. ENKELE EIGENSCHAPPEN Als Vi = Xi — a{a is een constante), dan is: Eigenschap 1 : v = x — a. _, , . _ ZCxi — a) SXi — rta Omdat: v = —i-i '- = — = n
n
Sx,
na
n
n
. = ^ — a.
Eigenschap 2: «„* = «„*, zodat s„ = «„. Immers: i7(t;< — v)* = 2:[{Xi - « ) — {;?- a)]» = £(Xi — x j ' .
Als Wi = Xi/b {b is een constante), dan is: Eigenschap 3 : w = xjb. Omdat: w = — ! i — = n
62
= bn
. . b
BEREKENING VAN GEMIDDELDE EN SPREIDING
2.5
Eigenschap 4: s„* = s^^/b», s„ = s„/b. Want: £{«>, - w)* = S{Xiß - x/b)' = \ * ^ ^ )
= "^^^7 ^ * •
Uit de voorgaande eigenschappen volgt, dat voor de grootheid Xi — a
Zi = - 4 o
,,..
gddt: X—a
—
—
Eigenschap 5: z = — - — , zodat x = a -\-bz. b Eigenschap 6: s,* = s^/b', s, = sjb, zodat V = ô*s,' en s^ = bs^.
2.5.2. BEREKENINGSMETHODEN
Als men het gemidddde en de spreiding van n niet-gegroepeerde waarnemingen wil berekenen, kunnen de eigenschappen 1 en 2 vaak worden toegepast ter vereenvoudiging van het rekenwerk. Voorbeeld 2.21. Van de oorspronkeUjke 12 waarden van x is 1220 afgetrokken en met de waarden van v = x — 1220 zijn de berekeningen uitgevoerd. Het kwadrateren kan hierdoor vrijwel uit het hoofd geschieden: X V V*
1220 1218 1205 1226 1220 1214 1236 12211238 1225 1221 1232 0 -2 -15 6 0 -6 16 1 18 5 1 12 i:t>=36 0 4 225 36 0 36 256 1 324 25 1 144 S v ' = 1052
Nu is: iJ = 36/12 = 3, zodat x = 3-\- 1220 = 1223. Verder is: V = s.' = ^°^" - ^ f ' " ^
= 85,8182.
s« = ^85,8182= 9,26. Beschikt men over een frequentieverdeUng met constante klassebreedte c dan kan een hulpgrootheid u worden ingevoerd, waarvan het nulpunt Ugt bij een centraal gdegen klassewaarde Xo en die in iedere hogere klasse met 1 opkUmt, resp. in iedere lagere klasse met 1 afdaalt. Tussen de grootheden « en « bestaat dan de volgende relatie: 63
2.5
REDUCTIE VAN WAARNEMINGSUITKOMSTEN Ui
=
Xi — Xo
{zodat Xi = Xo + cUi).
Uit de eigenschappen (5) en (6) volgt: (zodat x = Xt-{- cu).
«= ^ I 1 ^
(2.18) en (2.19)
(zodat Sa, = cs„ en «„* = c's„*).
s„ =
Als men dus het gemidddde en de spreiding van de hulpgroothdd u berekent, kunnen x en s„ direct worden bepaald. Tabel 2.6 demonstreert, dat door deze procedure het rekenwerk aanzienUjk wordt vereenvoudigd (vergeUjk bv. de kolommen/«* en/«*). De keuze van Xg bij een centraal gelegen klassewaarde biedt het voorded, dat zo klein mogeüjke producten fu en fu^ ontstaan, daar de frequentie afrieemt naarmate u numeriek groter wordt. Men kan éditer Xo ook elders kiezen. Tabel 2.6. Berekening van het gemiddelde en de spreiding van een frequentieverdeling met constante klassebreedte, zonder en met het gebruik van een hnlpgrootheid (verdeling uit tabel 2.2b) FrequenBerekening met hulpgrootheid Berekening waarde tie M X fx* = x.fx fu* ƒ ƒ* > 6,25 6,05 5,85 5,65 5.45 5,25 5,05 4,85 4,65 4,45 Totaal
1 1 3 7 10 12 8 5 2 1
6,25 6,05 17,55 39,55 54,50 63,00 40.40 24,25 9.30 4.45
39,0625 36.6025 102,6675 223.4575 297.0250 330,7500 204,0200 117,6125 43,2450 19,8025
+5 +4 +3 +2 +1 0 -1 -2 -3 —4
50
265,30 i^A
1414,2450 iTA'
Sf^n
_ »
e = 0,2
+ 14 Sfu
168 Sfu*
Zfu
14 „.,„
* , = 5,25
1414.245- <^'3)' * = *„ + cS = 5,25 + 0,2(0,28) = 5,31
iy.._J^!
50
~
1414,2450 - 1407,6818 49 « = VO.1339 = 0,366 = 0,37
64
+ 14 + 10 0 — 8 -10 - 6 - 4
25 16 27 28 10 0 8 20 18 16
u = -^ï—= jö = 0,28 n 50
50
»—1
+ 5 + 4 + 9
49 0,1339
Efu*-^^^
,68-<'*)* 50
"» »—1 49 = 3,3486 s„ = 1.83. s = M „ = 0.2 (1.83) = 0.366 = 0.37
BEREKENING VAN GEMIDDELDE EN SPREIDING
2.5
2 . 5 . 3 . OPGAVEN 2.11. Uit het examen statistisch analyst 1956. Een steekproef bestaat uit 11 waarnemingen. Kunt u aangeven, hoe de waarden van het gemiddelde, de mediaan en de standaardafwijking veranderen, indien achtereenvolgens: a. Alle waarnemingen met 10 worden verhoogd, b. Daarna aUe waarnemingen met 2 worden vermenigvuldigd, c. Daarna de op twee na grootste waarneming met 11 wordt verhoogd. Indien u niet over voldoende gegevens beschikt om alle vragen te kunnen beantwoorden, wordt gevraagd aan te geven welk additioneel gegeven het vraagstuk oplosbaar zou nüiken. 2.12. Bepaal van onderstaande waarnemingen de mediaan en bereken ^ en $: 388 389 393 388 391 390 387 396 392 389 386 388 383 398 388 403 378 385 387 384 387 383 381 382 374 2.13. Bepaal van de waarnemingen in opgave 2.2 de mediaan en het gemiddelde. 2.14. Bereken het gemiddelde en de spreiding van de waarnemingen in opgave 2.1 : a. Uit de waarnemingen zelf, b. Uit de door u opgestelde frequentieverdeling. 2.15. Bereken het gemiddelde en de spreiding van de frequentieverdeling in tabel 2.3b.
65
HOOFDSTUK 3
KANSREKENING 3.1. Het begrip kans in het dagelijks leven In het dageüjks leven heeft het begrip kans (synoniem : waarschijnlijkheid) een vage en in de regel subjectieve betekenis. Men zegt bv,, dat er zeer waarschijnlijk geen leven op de maan bestaat, of dat er grote kéms is dat het morgen regent. Deze en soortgelijke uitspraken hebben betrekking op gebeurtenissen, waarvan de uitkomst niet met zekerhdd bekend is. Kan zo'n gebeurtenis twee uitkomsten, A en B hebben en zeggen wij, dat de uitkomst A waarschijnlijk zal plaatsvinden, dan bedoelen wij hiermee, dat onze ervaring heeft uitgewezen dat in het verleden onder overeenkomstige omstandigheden de uitkomst A een grotere frequentie bezat dan de uitkomst B. D,w,z, in gedachten , ,, .., . aantal malen dat A is opgetreden hebben wij het quotiënt: r"; ; , ^ .—^-jr^ i ^ aantal malen dat A of i5 is voorgekomen bepaald en geconstateerd, dat dit groter dan ^2 is. De kansrekening heeft ten doel, dit waarschijnlijkheidsbegrip te objectiveren en het te predseren, door een kans in een getal uit te drukken. 3.2. Kansdefinitie De kans, dat bij een aselecte trekking uit een populatie van eindige omvang het kenmerk A optreedt (korter gezegd: de kans op (van) A) is het frequentiequotiënt van kenmerk A op de populatie. Dus
(3.1)
P{A) = 4 -
(P van het lat. probabüitas,/^ is de frequentie van kenmerk A, N ^ de populatie-omvang). Uit deze definitie volgt : O < P{A) < 1 P{A) = O, als kenmerk A niet voorkomt, P{A) = l, als kenmerk i4 uitsluitend voorkomt. Voorbeelden 3.1. Beschouw de populatie in de voorbeelden 1.15 en 1.16. Bij een aselecte trekking is de kans op een gehuwde arbeider 0,441. De kans op een arbeider met bloedgroep A is 0,445.
66
KANSVERDELINGEN
3.3
3.2. Trekt men aselect een kaart uit een spel van 52 kaarten, dan is de kans op een harten gelijk aan 13/52 = 1/4. De kans op een aas is 4/52 = 1/13. De kans op een 'zwarte' kaart is 26/52 = 1/2. Deze definitie kan ook worden toegepast als men worpen met geldstukken of dobbelstenen beschouwt. Men kan dan één worp met een geldstuk beschouwen als een aselecte trekking (met teruglegging) van één element uit een populatie van de (willekeurige) omvang N , bestaande uit denkbeeldige worpen met dat geldstuk. Als men onderstelt, dat het geldstuk 'zuiver' is, bevat deze populatie evenveel elementen met het kenmerk kruis als met het kenmerk munt. De kans op het gooien van kruis is dan volgens (3.1) : ^N/N = J. Een reeks van n worpen, onder dezelfde omstandigheden verricht, kan als een aselecte steekproef met teruglegging van n elementen uit deze populatie worden gezien. Bij vraagstukjes betreffende ideale (zuivere) geldstukken, dobbelstenen, e.d. kan men ook gebruik maken van de zg. klassieke kansdefinitie, die luidt: Als een gebeurtenis op N elkaar uitsluitende en geHjkwaardige manieren kan plaatsvinden en als a van deze uitkomsten het kenmerk A dragen, dan is de kans op A : P{A) — a/N. Voorbeeld 3.3. Als men met een dobbelsteen werpt, zijn zes uitkomsten mogelijk: elk der zes zijden kan boven liggen. Deze uitkomsten sluiten elksiar uit : twee of meer zijden kunnen niet tegelijkertijd verschijnen. E n als wij onderstellen, dat de dobbelsteen zuiver is, zijn de zes uitkomsten gelijkwaardig. De kans op het werpen van 6 ogen is dus bij een zuivere dobbelsteen 1/6.
3.3. Kansverdelingen 3.3.1. DEFINITIES
Bij aselecte trekking uit een populatie van eindige omvang noemt men de rdatieve frequentieverdeling van een categorisch sj^teem van kenmerken ( = de verdeling van de frequentiequotiënten = de verdeUng van de kansen van de kenmerken) een kansverdding. Een grootheid, die een kansverdeüng volgt, noemt men een stochastische (toevaUige) grootheid. In navolging van Prof. VAN DANTZIG geeft men het stochastische karakter van een grootheid aan door onderstreping van het sjmibool, waarmee de grootheid wordt aangeduid. Het zelfde sjTmbool zonder onderstreping dient dan om waarden aan te te geven, die deze grootheid heeft aangenomen of kan aannemen. Dan betekent bv. P{x = x): de kans dat de stochastische grootheid x de waarde x aanneemt. Wij zuUen deze notatie volgen, maar schrijven daarbij soms P{x = xi) i.p,v, P{x = x) als wij het verschü tussen de grootheid {x) en haar waarde (Xi) nog sterker wUlen accentueren. Voorbeelden 3.4. Bij aselecte trekking uit de populatie in voorbeeld 1.16 vormt de relatieve frequentieverdeUng een kansverdeling: Kenmerken Kansen
Bloedgroep O A B AB 0,420 0,445 0,110 0,025
Totaal 1,000
67
3,3
KANSREKENING
3.6. Kansverdeling van de grootheid x, het aantal ogen bij een worp met een zuivere dobbelsteen: X
P i * = X)
1
2
i
i
3 *
4 *
5 *
6
i
Totaal 1
3,3.2, GEMIDDELDE EN VARIANTIE VAN EEN KANSVERDELING
De kansverdeling van de discreet verdedde stochastische groothdd « is de relatieve frequentieverdeling van deze grootheid op de populatie. Daar volgens (3.1 ) geldt P(x = Xi) = /
^ , = ^ - ^ •Xi = E P ( x = Xi). Xi.
(Men noemt dit gemidddde ook wel de (mathematische) verwachting van X en schrijft voor ^j, dan E{x).) De variantie van de kansverdeüng van x volgt uit (2.16), door voor f i/N te substitueren P{x = Xf): (3.3)
a / = 2 - ^ - ^ i ' - i««* = ^^(2F = Xi). «,« - /z,\
Voorbeeld 3.6. Voor de kansverdeling van de grootheid x in voorbeeld 3.5. geldt: A«« = |-(1) + | - ( 2 ) + . . . . + | - ( 6 ) = ^
= 3,5.
»x' = I (1)* + I (2)« + . . . . + -i- (6)» - (3,5)« = - ^ = 2,9167. Een stochastische grootheid x gaat over in de gereduceerde grootheid X, als men haar met haar gemiddelde vermindert, dus: x = x — /i^. Volgens de eigenschappen 1 en 2 van 2.5.1 heeft de grootheid x als gemiddelde O en als spreiding Og,. Een stochastische grootheid x wordt gestandaardiseerd, door de gereduceerde grootheid x door haar spreiding te delen en heeft dus de vorm :
(3.4)
IZJ^,
Volgens de eigenschappen 3 en 4 van 2.5.1 heeft een gestandaardiseerde grootheid als gemiddelde O en als spreiding 1. 68
KANSREGELS
3.4
3.4. Kansregels 3.4.1. DE SOMREGEL
Als men een aantal kenmerken van een kansverdeling samenvoegt tot een samengesteld kenmerk, dan is de kans op dit samengestdde kenmerk gelijk aan de som van de kansen van de samensteUende kenmerken :
P{A of B) = ^ ^ ^ ^ = " ^ + W ^ ^^^^ + ^^^^' Voorbeelden 3.7. Beschouw de kansverdeling in voorbeeld 3.5. De kans op het werpen van een even aantal ogen met een zuivere dobbelsteen is : P(« = 2of 4of 6) = P{x = 2) + P{x = 4) + P{x = 6 ) = 1/6 + 1/6 + 1/6 = 1/2. , 3.8. In een bak bevinden zich 4 rode, 3 zwarte en 2 witte ballen. Bij een aselecte trekking is de kans op een rode of een witte bal gelijk aan 6/9 = 2/3.
3.4.2. DE PRODUCTREGEL
De kans op het tegelijk voorkomen van twee kenmerken, die tot verschülende, onafhankelijke kansverdelingen behoren is geUjk aan het product van de kansen op ieder der kenmerken afzonderlijk. De voorwaarde voor het toepassen van de productregel^ is dus, dat de beschouwde kansverdeüngen (stochastisch) onafhankelijk zijn. Het omgekeerde geldt echter ook: blijkt de productregel op te gaan, dan zijn beide kansverdelingen stochastisch onafhankelijk. Bewijs: Beschouw twee bakken. De eerste bevat N^ knikkers, waarvan erfz zwart enfw wit zijn. De tweede bak bevat N^ knikkers, waarvan erfz' zwart enfw' wit zijn. Trekt men uit iedere bak 1 knikker, dan zijniVi. N2 verschiUende paren mogeüjk (bij iedere knikker uit de eerste bak kan men successievelijk elke knikker van de tweede bak kiezen). Hieronder bevinden zich/z .fz' paren van zwarte knikkers. Als aselect getrokken wordt, is dus de kans op een paar zwarte knikkers fz • fz N^-N^
fz Nj,
fz iVa'
dat is juist het product van de kans op een zwarte knikker in bak 1 en de kans op een zwarte knikker in bak 2. * Deze is eigenlijk een bijzonder geval van de algemene productregel. welke wij buiten beschouwing laten.
69
3.4
KANSREKENING
Voorbeelden 3.9. Bak 1 bevat 5 rode en 10 witte ballen, bak 2 bevat 6 rode en 4 witte ballen. Men trekt aselect een bal uit iedere bak. Geef de kansverdeling van de grootheid x, het aantal witte ballen in zo'n steekproef van twee ballen. PiR) Bakl Bak 2
Pm 10/15 = 2/3 4/10 = 2/5
5/15 = 1/3 6/10 = 3/5
Aantal witte ballen, x.
Berekemng
P{x = Xi)
0
P{Ri en Äg) ^ 1/3 , 3/5 =
3/15
1 1
P{Ri en W^) ^ 1/3 , 2/5 = 2/15\ P ( W i en Ba) = 2/3 . 3/5 = 6/15/
8/15
2
P ( W i en ÏTj) == 2/3 . 2/5 =
4/15
De verdelingen zijn onafhankelijk, zodat de productregel kan worden toegepast. P ( R i en Äg) = de kans op een rode bal uit bak 1 en een rode bal uit bak 2, enz. (Al en W^ en {Wi en R^) leveren beide dezelfde waarde v a n ^ (1 witte bal) op. Volgens de somregel is dus P(x = 1 ) gelijk aan de som van de kansen op deze uitkomsten. 3.10. Men werpt met twee zuivere dobbelstenen. Geef de kansverdeling van de grootheid « = de som van het aantal ogen op beide stenen. B. Simultane verdeling van x e a y
A. Mogelijke waarden van 2 = * + y X = aantal ogen op steen I 1 2 3 4 5 6
a o o
1
2
3
4
A
ïî ^
1
2
3
4
5
6
7
1
À Ä
2
3
4
5
6
7
8
2
3
4
5
6
7
8
9
3
4
5
6
7
8
9
10
4
5
6
7
8
9
10
11
5
AÄ AAA AAÄ ^ A Ä
6
7
8
9
10
11
12
6
6 P(y=_y)
Ï 6 W ïff
i 4 4 4 4 4
i i i 4 i 4
1
^
Ä Ä Ä
P^=x)
5
36
ï ï ïff 3? Ä 3Ï W ^rs ¥ ï Tff À W 3Ï
c . Verdeling van z = x + y z
2
3
4
5
6
7
8
9
10
11
12
f
1
2
3
4
5
6
5
4
3
2
1
36
8ÏÏ
ÏÏÎ
Ä
36^
ft
Tff
1
P(z = z)
70
A
Ä Ä
h h
Totaal
KANSREGELS
3.4
Noem het aantal ogen, dat met dobbelsteen I geworpen wordt x en het aantal ogen, dat met dobbelsteen I I geworpen wordt y. Elk dezer grootheden kan de waarden 1,2,..., 6 aannemen en daar beide stenen zuiver zijn geldt voor de grootheid x en de grootheid y, dat P ( l ) = P(2) = ... = P(6)
= V.In tabel A zijn de 6 X 6 = 36 mogeüjke waarden van de grootheid z = x - ^ y gevormd. De verdelingen van xea. y zijn stochastisch onafhankelijk, zodat volgens de productregel de kans van ieder van deze mogelijkheden gelijk is aan ^^ x Vc = Vse- Deze kansen staan in tabel B, die de zg. simultane verdeling van ^ en y weergeeft. Door het herhaald toepassen van de somregel verkrijgt men de in tabel C gegeven verdeling van 2. Zo is bv. (zie de tabellen A e n B ) : P l z = S) = V,. + Vs« + Vs. + Vs. = V»«3.11. Een bak bevat 4 zwarte en 6 witte ballen. Men trekt aselect zonder teruglegging twee ballen (d.w.z. men trekt de tweede bal, zonder dat de eerste is teruggelegd, of: men trekt twee ballen tegelijkertijd). Hoe groot is de kans. dat deze verschiUend van kleur zijn? Oplossing 1. Bij trekking zonder teruglegging kan men 2 baUen op 10 X 9 manieren trekken (bij elke bal kan ieder der 9 resterende ballen worden gekozen). Een zwarte bal en vervolgens een witte bal kan men op 4 X 6 manieren verkrijgen, een witte bal en vervolgens een zwarte op 6 x 4 manieren. De gevraagde kans is dus : 4 x 6 - ^ 6X4 _ 10 X 9
48_ 8 90 15*
Oplossing 2. De productregel kan niet zonder meer worden toegepast, daar de tweede trekking niet onafiiankeUjk is van de eerste. Men kan echter de tweede trekking onafhankelijk maken, door rekening te houden met de verandering in de populatie (bak met ballen) tengevolge van de eerste trekking: P{Zi en Wj) = 4/10 . 6/9 = 24/90 P ( W i en 2j) = 6/10 . 4/9 = 24/90 P{Z en
W)=
48/90
3.4.3. GEMIDDELDE EN VARIANTIE VAN EEN HERLEIDE KANSVERDELING
Als de grootheden x e n y stochastisch onafiiankeüjke kansverdeüngen bezitten, geldt voor de verdeüng van
w= x - y :
z = x-^y: (3.5.1) (3.6.1)
/»» = /«« + /*v Oz* = o«' + o /
(3.5.2) (3.6.2)
/ l „ = /ix — /*i,
Voorbeeld 3.12. Wij volstaan met een demonstratie van de juistheid van de eigenschappen (3.5.1) en (3.6.1) bij voorbeeld 3.10.
71
3.4
KANSREKENING Volgens (3.2) is: /i, = 1/36(2) + 2/36(3) -1- . . . . -I- 1/36(12) = 252/36 = 7 Uit voorbeeld 3.6 blijkt, dat: H g = iiy = 3,5, zodat ƒ!„ + / * , = 7. Volgens (3.3) is: or,« = 1/36(2)« + 2/36(3)« - { - , . , + 1/36(12)« - (7)« = 1974/36 - 49 = 210/36 = 35/6, Uit voorbeeld 3.6 bUjkt, dat: a ^ = a,« = (17,5)/6, zodat «r,« + er,« = 35/6.
3.4.4. OPGAVEN (Het verdient aanbeveling de vraagstukken 1 t/m 7 aUe te maken, omdat daarbij pas blijkt of de voorgaande stof betrefiende de kansrekening voldoende begrepen is. De verdere opgaven kunnen desgewenst zonder bezwaar worden overgeslagen.) 3.1.
Men heeft twee dobbelstenen. De eerste heeft 2 blauwe en 4 rode zijden, de tweede heeft eveneens blauwe en rode zijden, maar de verdeling daarvan is onbekend. De kans, dat bij een worp met beide stenen dezelfde kleur boven ligt bedraagt 14/36. Hoe zijn de kleuren van de tweede steen verdeeld?
3.2.
Een bak bevat 2 zwarte, 3 witte en 4 rode ballen. Men trekt aselect zonder teruglegging twee ballen. Hoe groot is dan de kans, dat: a. De eerste bal rood en de tweede wit is? b. Beide baUen dezelfde kleur hebben?
3.3.
Een bak bevat 4 witte, 5 rode en 6 zwarte ballen. Een tweede bak bevat 5 witte, 6 rode en 7 zwarte ballen. Men trekt aselect één bal uit iedere bak. Hoe groot is de kans, dat zij dezelfde kleur hebben?
3.4.
Een bak bevat 5 zwarte en 4 witte ballen. Zij worden één voor één aselect getrokken. De eerste drie worden in een zwarte en de laatste zes in een witte doos geplaatst. Hoe groot is de kans, dat het aantal zwarte baUen in de zwarte doos plus het aantal witte baUen in de witte doos gelijk is aan 5?
3.5.
Men trekt aselect zonder teruglegging twee kaarten uit een spel met 52 kaarten. Geef de kans van eUc der volgende uitkomsten : a. Eerst een harten, vervolgens een schoppen, b. Een harten en een schoppen, c. Eerst een harten of een ruiten en vervolgens een schoppen, d. Eerst een harten of een schoppen en vervolgens een schoppen.
3.6.
In een collectie van 12 lampen bevinden zich 2 defecte exemplaren. Iemand beproeft aselect één voor één de lampen, totdat beide defecten zijn opgespoord. Hoe groot is de kans, dat hij de tweede defecte lamp bij de 10e keer vindt?
3.7.
Gegeven zijn de kansverdelingen van de stochastisch onafhankelijke grootheden 3? en j / :
*< P i £ = ^*)
2 3 4 5 6 0,1 0,2 0,3 0,2 0,2
Vi P{ï==yi)
r o i 0,6 0.3 0.1
a. Bereken /*„, fi^, o * en «r,*. b. Bepaal de kansverdeling van z = x -Y y&a. geef /i, en a^. c. Bepaal de kansverdeling van w = x — y ea geeï/t^ en a„K
72
PARAMETERS EN STEEKPROEFFUNCTIES
3,5
3.8.
Geef de verdeling van de som van het aantal ogen bij het werpen met drie zuivere dobbelstenen, alsmede het gemiddelde en de variantie van deze verdeling.
3.9.
Een bak bevat 4 witte, 3 zwarte en 2 rode ballen. Men trekt aselect zonder teruglegging 3 ballen. Hoe groot is de kans van elk der volgende uitkomsten? a. Van elke kleur één bal, b. Eén witte en twee zwarte ballen, c. Ten minste één witte bal, d. Ten minste één witte en ten minste één zwarte bal, e. Ten hoogste één witte en ten minste één zwarte bal, ƒ. Ten hoogste één witte en ten hoogste één zwarte bal.
3.10. Een bak bevat 9 zwarte en 16 witte fiches. Een tweede bak bevat 4 zwarte en 9 witte fiches. Men trekt aselect een fiche uit de eerste bak. plaatst dit in de tweede en trekt vervolgens daaruit aselect een fiche. Hoe groot is de kans, dat: a. Het laatst getrokken fiche zwart is? b. Wit is? c. Het fiche uit bak I I dezelfde kleur heeft als het fiche, dat uit bak I is getrokken? d. Deze fiches verschillend van kleur zijn? e. Beide fiches zwart zijn? ƒ. Tenminste één fiche zwart is ?g. Ten hoogste één fiche wit is? 3.11. Beschouw nogmaals de bakken met fiches in opgave 3.10. Men trekt aselect zonder teruglegging 2 fiches uit bak I en plaatst deze in bak I I . Daarna trekt men uit bak I I aselect één fiche. Hoe groot is de kans, dat: a. Het laatst getrokken fiche zwart is? è. Dit fiche wit is? c. Het fiche uit bak I I van kleur verschilt met beide fiches, die uit bak I worden getrokken? d. Alle drie fiches zwart zijn? e. Minstens één fiche zwart is?
3.5. Parameters en steekproeffuncties 3.5.1. DEFINITIES
Éen parameter is een getal waardoor een populatieverdeüng wordt gekarakteriseerd. Een steekproeffunctie (of statistische grootheid) is een groothdd, waarvan de waarde ondubbelzinnig te berekenen is uit de waarden van de elementen van een steekproef. Voorbeelden 3.13. De firactie gehuwde mannen, 0,441, is een parameter van de populatieverdeling in voorbeeld 1.15. 3.14. De klassewaarde van de klasse met de hoogste frequentie ( = de modus, 13,5 g%) is een parameter van de populatieverdeüng in voorbeeld 1.18. 3.15. Beschouw een populatie, bestaande uit 6 fiches, die resp. de waarden 1, 2 3, 4, 6 en 8 bezitten. Het rekenkundig gemiddelde, ƒ* = 4. is een parameter van deze populatie. 3.16. Uit de populatie in voorbeeld 3.15 wordt aselect zonder teruglegging een steekproef van 2 fiches getrokken..Enkele steekproeffuncties zijn: 1. Het gemiddelde van de waarden in de steekproef. 2. Het verschil van deze waarden. 3. De variantie van deze waarden.
73
3,5
KANSREKENING
3,5,2. STEEKPROEFVERDELINGEN
Onder de steekproefruimte verstaan wij de verzameüng van alle steekproeven van de omvang », die volgens een gegeven trekkingsvoorschrift uit een populatie U van de omvang N kunnen ontstaan. Deze steekproefruimte kan beschouwd worden als een populatie, waarvan dus elk dement een steekproef (van de omvang n) is. Aan elk dement (is dke steekproef) kan men de waarde toekennen, die een bepaalde steekproeffunctie u voor dat element aanneemt. De frequentieverdeling van de grootheid « op de steekproefruimte noemt men wel de steekproefoerdding van deze steekproeffimctie u. Bij asdecte trekking van een steekproef van de omvang n uit de populatie Ï7 is de relatieve steekproefverdeling van u een kansverdeling (zie 3.3.1). Voorbeelden 3.17, Men trekt zonder teruglegg^g steekproeven van 2 fiches uit de populatie in voorbeeld 3.15. Als steekproeffunctie kiest men het gemiddelde van de waarden inde steekproef. De steekproefruimte bestaat dan uit de volgende 15 steekproeven, die de daaronder vermelde waarden [x) dragen: Waaiden
1+2
X
U
STEEKPROEFRUIMTE 1+3 1+4 1 + 6 1 + 8 2 + 3 2 + 4 2 + 6 2 + 8 3 + 4 2
2i
3}
4Ï
2i
3
4
5
3+6 3+8 4+6
4+8
6+8
5i
6
7
3Ï
4i
5
De steekproefverdeling van ië en de kansverdeling van i-luiden dus: ^i
Steekpr. verd. fi Kansverdeling P ( # = *
lè
2 2i
3 3i
4 4J
5 5i
1
1 2
1 2
1 2
2
1
6 1
i ) î V A A T ^ A i ^ A A T V A
7 Tot. 1 15 1 À
3.18, Als 3,17, maar er wordt getrokken met teruglegging. Dan zijn 6 X 6 = 36 steekproeven mogeüjk, zoals uit onderstaande tabel büjkt. Hierin zijn per steekproef de som van de waarden en hun gemiddelde opgenomen, Wstóurde van het \e element
74
PARAMETERS EN STEEKPROEFFUNCTIES
3,5
De kansverdeüng van # luidt nu : Xi 1 1 1^ 2 2J 3 3J 4 4 i 5 5^ 6 7 8 P{s=Xi) 1 T ï A A f t ^ f t ^ s T f f i n f s ï a a A s i ï 3,19, De elementen van een populatie dragen de waarden 1, 2, 3, 4, 5 en 6. Men trekt aselect zonder teruglegging een steekproef van 3 elementen. Geef de kansverdeüng van S, de som van de waaiden van de elementen in de steekproef. E r zijn C% =
61
6 x 5 x 4 = ——= — = 20 verschiUende steekproeven mo-
gelijk^. "Deze zijn hieronder uitgeschreven: 123
124
125 134
126 135 234
136 145 235
146 156 236 245 246 345
256 346 356
Som
6
7
8
9
10
12
11
13
14
456 15
(Het sjrsteem in deze opsomming is duideüjk: het eerste vak bevat aUe combinaties die met 1 beginnen, met op de eerste regel alle combinaties met 1 en 2, op de tweede regel die met 1 en 3, enz.) De kansverdeling van de steekproeffunctie § is dus: Si
6
7
8
i'(5=S.)| A Ä ^
9 10 11 12 13 14 15 I Totaal •hs -êo \ 1 ^ ^
Js
Ar f s
In de voorgaande voorbedden zijn zowd de populaties als de steekproeven van kleine omvang, zodat alle mogelijke steekproeven nog vrij snel kunnen worden opgeschreven. Dit wordt echter al spoedig te tijdrovend en daardoor praktisch onuitvoerbaar. Beschouwt men bv. steekproeven van 4 elementen, die zonder teruglegging worden getrokken uit een populatie met de waarden 1, 2, 3, . . . , 8, dan zijn reeds r» 8! 8X7X6X5 ^* = T ü T ^ 4 x 3 x 2 x 1
^
- „ ^ , ,.-i Steekproeven mogdijk.
* Zie bijlage 2, par. 2.
75
3,5
KANSREKENING
Bij« = 5en2V= 10 ( « = 1 , 2 , 3 , , 10) zijnheteralC^j" = 252, enz. Men kan deze moeüijkhdd dan op verschiUende manieren oplossen : 1. Men leidt langs mathematische weg een formule af, waarmee de kans dat de steekproeffunctie u een bepaalde waarde «< aanneemt, kan worden berekend. Wij geven hiervan in het volgende hoofdstuk enige voorbeelden. 2. Men bewijst, datdekansverdeUngvan de steekproeffunctie« bevredigend door een bekend ts^pe frequentieverdeUng (bv. door de normale verdeüng) kan worden benaderd. Als deze wiskundige wegen niet te volgen zijn, zal men zijn toevlucht nemen tot de empirische methode. 3. Men trekt een groot aantal steekproeven van de gewenste grootte (») uit de te bestuderen populatie en bepaalt de waargenomen steekproefverdeling van de steekproeffunctie « (de zg. Monte Carlo methode). De grote hoeveelheid werk, die deze methode meebrengt, is sinds de uitvinding van dectronische rekenmachines niet langer onoverkomelijk. Overigens wordt de Monte Carlo methode tegenwoordig steeds meer voor opleidingsdoeleinden gebruikt, bv. voor het demonstreren van statistische wetmatigheden, waarvan een exact bewijs voor de student te lastig wordt geacht (zie bv. WALKER & LEV (35), hoofdstuk 6 en ded II, hoofdstuk 13). 3.5.3. OPGAVEN 3.12. Betreft voorbeeld 3,18.
3.13.
3.14.
3.15.
3.16. 3.17.
76
a. Bereken het populatiegemiddelde, ß^^ en het gemiddelde van de kansverdeling van X, m . Vergelijk de uitkomsten. b. Bereken de populatievariantie, a^, en de variantie van de kansverdeüng van X, a^K Vergeüjk de uitkomsten. Merk op, dat <%* = ffaV^c. Bepaal de kansverdeüng van Sj,*, de steekproefvariantie. Bereken het gemiddelde van deze kansverdeling en vergelijk dit met a^*. Bepaal de kansverdeüng van x voor een aselecte steekproef van 2 elementen uit de populatie, waarvan de elementen de waarden O, O, 1, 1 en 2 bezitten, a. Met teruglegging, b. Zonder teruglegging. Bepaal voor een aselect zonder teruglegging getrokken steekproef van 2 letters uit het woord MISSISSIPPI : a. De kansverdeüng van de steekproeffunctie z, het aantal keren dat de letter S per steekproef voorkomt. b. De kansverdeüng van de steekproeffunctie w, het aantal keren dat de letter I per steekproef voorkomt. Bepaal de kansverdeling van het gemiddelde van een aselect met teruglegging getrokken steekproef van 3 elementen uit de populatie in voorbeeld 3.15 (maak daarbij handig gebruik van voorbeeld 3.18). Bereken de variantie van de kansverdeling in opgave 3.15 en merk op, datori« = ff,V3. Een populatie bestaat uit elementen met de waarden 1,2,3, . . . , 8. Bepaal de kansverdeling van S, de som van de waarden van de elementen van een aselecte steekproef zonder teruglegging met « = 3.
OVERSCHRIJDINGSKANSEN
3.6
3.6. Het begrip overschrijdingskans 3,6.1 DEFINITIES
Beschouw de discreet verdeelde stochastische grootheid x. Wij voeren hiervoor de volgende begrippen in : a. De linkse {overschrijdings)kans van de waarde Xi is de kans, dat de grootheid x de waarde Xi of een lagere waarde aanneemt : (3.7)
P^{Xi) = P{x^Xi).
b. De rechtse {overschrijdings)kans van de waarde Xi is de kans, dat de grootheid x de waarde Xi of een hogere waarde aanneemt : (3.8)
Pj,{Xi) = P(x > Xi)..
c. De tweezijdige overschrijdingskans van de waarde Xi is geUjk aan de som van de kansen van de waarden van de grootheid x, die een hoogstens even grote kans bezitten als Xi. Wij gebruiken voor deze kans het symbool Po(Xi). Is de kansverdeling van x symmetrisch, dan is de tweezijdige overschrijdingskans van Xi de kans, dat de grootheid x de waarde Xi of een minstens even ver van /i^ gdegen waarde aanneemt, d.w.z. dan is PoiXi) = 2PiXxi) voor Xi < /ij, en Po[Xij = 2Pj5(a;<) voor Xi > /t«. Wij demonstreren dit in voorbeeld 3.21. Tezamen met deze notatie voor de overschrijdingskans maken wij in het vervolg tevens gebruik van een eenvoudige notatie voor de kans op een bepaalde waarde. Voor P{x = xi) = P{x = x) schrijven wij, als betreffende de grootheid in kwestie geen misverstand kan ontstaan, dan kortweg P{Xi). De kans, dat de grootheid x de waarde O aanneemt wordt dan aangegeven als P(0), de kans van de waarde l als P(l), enz. Voorbeelden 3.20. Gegeven is de volgende kansverdeüng: Xj I 0 1 2 3 4 5 6 7 8 9 ~ Pjx^Xj) I 0.01 0.03 0,06 0,10 0,17 0,26 0,21 0,10 0.04 0.02 Voor deze verdeling geldt : = P{x < 2) = P{x = 0) -f- P{x = 1) + P ( x = 2) = 0.01 + 0,03 -I- 0,06 = 0,10, Ps{2) = 1 - P L { 1 ) = 0,96, Pjj(6) = P{x > 6) = 0,21 + 0 , 1 0 - 1 - 0,04 + 0,02 = 0,37, PL{2)
•PD(8) = 0,04 + 0,02-1- 0,03 + 0,01 =
0,10,
P D ( 7 ) = 0,10-1- 0.04 + 0,02 -f- 0,10 + 0,06 + 0,03 + 0,01 = 0,36. 3.21. Gegeven is de volgende symmetrische kansverdeling: Xi 1 3 P(x = Xi) 1 0,01
4 0,04
5 0,10
6 0,20
7 0,30
8 0,20
9 0,10
10 • 11 0,04 0,01
77
3.6
KANSREKENING Voor deze verdeling geldt : P^(5) = P{x < 5) = 0,10 + 0,04 + 0,01 = 0,15, P R ( 9 ) = P(x > 9 ) = 0,10 + 0,04 + 0,01 = 0,15. Wegens de S3rmmetrie van de verdeling is /*j, = 7. Wij zien, dat PL{5) = Pt{^'x - 2) = Pie{9) = PÄ(/tj, + 2). Hieruit volgt: P D ( 5 ) = 2 P L ( 5 ) = P D ( 9 ) = 2 Pfi(9) =2(0,15) = 0,30.
3.6.2. OPGAVEN 3.18. Geef voor de verdeüng in voorbeeld 3.20: Pz,(3), Pie(8), P D ( 1 ) , Pfl(2). 3.19. Geef voor de verdeüng in voorbeeld 3.21 : Pi3(10), P D ( 8 ) .
78
HOOFDSTUK 4
ENKELE DISCRETE KANSVERDELINGEN 4.1. Steekproeven uit een dichotomie Een veel voorkomende populatie is de dichotomie, waarvan N^ elementen kenmerk A en N^ dementen kenmerk B dragen {N^ -{• N^ = N, de populatie-omvang). De kenmerken A e n B zijn dan meestal attributen, zoals : man - vrouw, gehuwd - ongehuwd, gezond - ziek, behandeld - niet behanddd, genezen - gestorven, gevaccineerd - niet gevaccineerd, enz. Een dichotomie bestaande uit N elementen wordt voUedig gespecificeerd door de parameter P{A) = N J N , daar P{B) = 1 — P{A). In dit hoofdstuk behandden wij eerst de kansverdeling van de steekproeffunctie X, het aantal elementen met kenmerk A in een aselecte steekproef van n elementen, resp. bij trekking zonder teruglegging (4,2) en bij trekking met teruglegging (4,3). 4.2. Hjrpergeometrische verdelingen 4.2.1. AFLEIDING, GEMIDDELDE EN VARIANTIE^
Wij beschouwen een steekproef van n elementen, die zonder teruglegging gekozen wordt uit de dichotome populatie in 4.1 en die x elementen met kenmerk A bevat. In totaal zijn C^ verschiUende steekproeven van n dementen mogeüjk. De x dementen A kunnen uit de iVj elementen A in de populatie op C^'manieren worden gekozen. De n—x dementen B kunnen op C ^ ^ manieren tot stand komen. Een steekproef met x A's en n—x B's kan dus op C^' ' C ^ , ' manieren ontstaan. Bij aselecte trekking gddt dus volgens (3.1) :
(4.1)
P{x = x) = - ' ' ' if^"-" C,
Met (4.1 ) kan men de kans op elke mogelijke waarde van x (van O t/m n) ^ Bestudeer zo nodig eerst par. 2 van bijlage 2 en maak de daarbij behorende opgaven.
79
4.2
DISCRETE KANSVERDELINGEN
berekenen, d.w.z. deze formule specificeert een kansverdeüng, die een hypergeometrische verdding wordt genoemd. Bewezen kan worden, dat voor deze verdeling gddt: (4.2)
nNj,
""AT" =
Ih,
[vfaaxin P = P { A ) = - ^ ) .
Pn
en nNi{N-Ni) (iV-w) _ ^ iV-» - = PQn N>{N-\) ^ N-\
(4.3)
(waarin Q = P(B) = 1 - P). Voorbeeld 4.1. Een populatie bestaat uit 3 jongens en 7 meisjes. Volgens (4.1) is de kansverdeüng van de grootheid x, het aantal jongens in een aselecte steekproef zonder teruglegging van 3 kinderen (bedenk d a t : N i = 3, iV = 10, N - N i = N t = 7 , n = 2. P i j ) = P = 3/10, P{M) = Q = 7/10):
p^=xi)
1
0
*< Co'-C.' C.w
35 C,» • C J C," 120
3
2 63 W ' C i > C," 120
_ 21 120
c,*-c^' C,"
1 120
Uit (4.2) volgt: /*, = Pw = 0,3(3) = 0,9, Uit (4,3) volgt: a * = PQn ~ , ~ ' ^ , = (0,3) (0,7)3 • }° ~ ^ = 0,49, 10- 1 N - 1 o, = 0.7. 4.2.2. TOEPASSING
In de praktijk is een hypergeometrische verdeüng bij grote omvang van de populatie en/of steekproef, modUjk hanteerbaar. Onderstel, dat men een steekproef van 50 exemplaren zonder teruglegging trekt uit een populatie van 1000 exemplaren, waarin 350 met kenmerk A en 650 met kenmerk B. De kans op x exemplaren A in zo'n steekproef is dan volgens (4.1): .,360
P(« = x) =
„860 'SO-B „1000 '60
Stel verder, dat men vraagt naar de kans op ten hoogste 10 exemplaren A, d.i. dus: P{^ = 0) -|- P{x = 1 ) -1- P{x = 10) (vragen van deze soort doen zich in de statistiek veel voor). Men zou dan elk dezer kansen 80
HYPERGEOMETRISCHE VERDELINGEN
4.2
afzonderüjk moeten uitrekenen. Bv. : ^360
^«60
3501
10
40
1013401
P(y = 10) =
6501 4016101
^1000
ÏÖÖÖ!
60
501950!
Het is duideUjk, dat deze procedure zoved rekenwerk vergt, dat zij praktisch onuitvoerbaar wordt. Nu trekt men in de praktijk weüswaar meestal steekproeven zonder teruglegging, maar in de regel is dan de steekproefomvang klein met betrekking tot de populatie-omvang. De elementen die tijdens het trekken uit de populatie verdwijnen brengen dan dechts een onbetekenende verandering in de populatiesamenstelling teweeg en men kan zonder bezwaar doen, alsof met teruglegging getrokken is. Wij komen hierop in 4.3.4 terug. 4.2.3. OPGAVEN 4.1.
Bereken j«, en a ^ uit de kansverdeling in voorbeeld 4.1 en verifieer, dat de gevonden waarden overeenstemmen met de volgens (4.2), resp. (4.3) berekende.
4.2.
Een bak bevat 3 zwarte en 4 witte ballen. Geef de kansverdeüng van de grootheid x, het aantal zwarte ballen in een aselecte steekproef zonder teruglegging van 3 bauen. Bepaal /*,. en Of^.
4.3.
Uit een groep van 15 personen wordt een commissie van 5 personen gevormd, die omtrent een bepaald project advies moet uitbrengen. In de groep bevinden zich 4 personen, waarvan bekend is, dat zij tegen de uitvoering van het project zijn. Van de overigen kan worden aangenomen, dat zij er voor zijn. Hoe groot is de kans, dat de commissie het project met meerderheid van stemmen aanbeveelt, als de commissie aselect wordt gekozen?
4.4.
Een groep van 30 personen bevat tweemaal zoveel mannen als vrouwen. Men trekt aselect zonder teruglegging 5 personen uit deze groep. Hoe groot is de kans, dat zich daarin bevinden: a. 3 vrouwen, b. Ten hoogste 2 vrouwen, c. Ten minste 3 vrouwen?
4.5.
a. Men heeft twee vazen. De eerste bevat 4 zwarte en 2 witte ballen, de tweede bevat 3 zwarte en 4 witte ballen. Men trekt aselect zonder teruglegging 2 baUen uit de eerste vaas en vervolgens 3 ballen uit de tweede vaas. Geef de kansverdeüng van de grootheid V, het aantal zwarte baUen in de steekproef van 5 bauen die men op deze wijze verkrijgt. b. Men trekt aselect zonder teruglegging 2 ballen uit de eerste vaas en plaatst deze ongezien in de tweede. Vervolgens trekt men aselect zonder teruglegging 5 bauen uit de tweede vaas. Geef de kansverdeüng van de grootheid w, het aantal zwarte baUen in deze steekproef. c. Men voegt alle baUen in één vaas bijeen en trekt daaruit aselect zonder teruglegging 5 ballen. Geef de kansverdeling van de grootheid z, het aantal zwarte ballen in deze steekproef.
81
4.3
DISCRETE KANSVERDELINGEN
4.3. Binomiale verdelingen 4 . 3 . 1 . AFLEIDING, GEMIDDELDE EN VARIANTIE
Wij beschouwen nogmaals de dichotome populatie in 4.1, met iV^ elementen met kenmerk A en N^ {= N — N^} dementen met kenmerk B. Onderstd, dat hieruit een asdecte steekproef van n dementen md teruglegging wordt getrokken en dat deze x elementen met kenmerk A bevat. Volgens (3.1) is bij een aselecte trekking: P{A) = P = N J N en P{B) = Q = 1—P. Er wordt nu getrokken met teruglegging, zodat een getrokken element wordt teruggdegd voordat men tot de volgende trekking overgaat. Bij dke trekking is de kans van A dus gelijk aan P en die van B gdijk aan Q. De kans, dat men bij trekking van n dementen eerst x elementen A en vervolgens n—x elementen B verkrijgt: AAA
A
BBB
x keer
B
n-x keer
is dus volgens de productregel: P'Q^-'. De dementen kunnen echter ook in een andere volgorde verschijnen, bv. als volgt : ABAABAA..A
BBABABB...B
x^2A's 2 B's
2 A's nr-x-2 B's
Elk dezer volgorden bezit volgens de productregel dezelfde kans P*Ç"-*. In totaal zijn erCjJ van deze volgorden mogeüjk (zie bijlage 2, par. 2), zodat volgens de somregel: n\ (4.4)
P{X = X ) = C I - PxQn-x =
. pxQn-x
De kansverdeüng, die door (4.4) gespedficeerd wordt noemt men een binomiale verdding.^ Bewezen kan worden, dat voor zo'n verdeüng geldt (4.5)
/ig = P n ,
en (4.6)
a,a = PQn.
^ De naam van deze verdeling is ontleend aan het feit, dat de kansen van de verdeling gelijk zijn aan de termen in de ontwikkeling van het binomium van NEWTON. Cj," noemt men de binomiaalcoêfiiciënt.
82
BINOMIALE VERDELINGEN
4,3
Als steekproeffunctie kan men ook kiezen ^ = -a, d.i. de fractie elementen met kenmerk ./l in de steekproef. De grootheid p volgt dezelfde kansverdeling als x, maai volgens de eigenschappen 3 en 4 in 2.5.1 is : (4.7) en
fl,
= P,
(4.8)
a *=
^ ,
De binomiaalcoëf&ciënten C,» kunnen direct worden afgelezen uit de bekende driehoek van PASCAL, waarvan wij in tabel 4.1 een deel weergeven. Op elke rij staan de coëf&ciënten, die behoren bij de waarde van n, die vóór de rij is gegeven en wel zo, dat men van links naar rechts (of omgekeerd) C„" kan aflezen voor resp. * = O, 1, 2 « . D e eerste en laatste coëfficiënt van een rij zijn steeds geüjk aan 1, de overige kunnen worden verkregen door de ünks en rechts erboven staande coëfi&ciënten van de voorgaande rij te sommeren. Elke rij kan zodoende uit de voorgaande worden afgeleid. Tabel 4.1. Driehoek van PASCAL n 1 2 3 4 5 6 7 8 9 enz.
2»
1 1 1 1 1 1
6 7
8 9
1 4 5
3 10
21
10
35
1 5
15 35
70 126
1 4
20
56 84
1
6 15
28 36
1 3
1 1 1 2
21 56
126
1 6
1 7
28 84
1 8
36
1 9
1
2 4 8 16 32 64 128 256 512
Voor P = Ç = i gaat (4.4) over in P(x =_x)=C^. i^)" (i)""*, zodat dan: (4.9)
p(^ = ;,) = C : - ( i ) » = - p - = C r 2 -
(P = Ç = i ) .
Daar EC^ = 2" kunnen üi dit geval de kansen direct uit de driehoek van PASCAL worden afgelezen. Voorbeelden 4.2.
Uit de populatie in voorbeeld 4.1 wordt aselect met teruglegging een steekproef van 3 kinderen getrokken. De kansverdeling van x, het aantal jon-
83
4.3
D I S C R E T E KANSVERDELINGEN gens in de steekproef (resp. van p, de fractie jongens in de steekproef), luidt volgens (4.4) :
"i
Pi
0
0
1/3
9
3
2/3
1
P { ^ = Xi) P{È = ^ , )
Berekening 1-7» JQ3
0,343
3' W " ; U/'UJ — JJ2I
3.7' jQj
0,441
"ïi 2!i!
1« . 7 10»
0,189
Co
(3/10) (7/10) -
^1
1-2
WiO) W i o )
3! Q,3,
C.» f3/10^'^7/10^» ü . • IJ/IU) 1//1U) — 3JQI . ^j
•' ^
Totaal
0,027 1,000
Uit (4.5) volgt: /i^ = 0,3 (3) = 0,9, Uit (4.7) volgt: /*„ = 0,3. Uit (4.6) volgt: er/ = (0,3) (0,7)3 = 0,63. Uit (4.8) volgt: ff,« = (0,3)(0,7)/3 = 0,07. 4.3.
In tabel 4.2 zijn voor een aantal waarden van P de binomiale verdelingen: P(x = x) = P{p = ^) = Ca," . pxQio-o) opgenomen. Dit zijn dus de kansverdelingen van X (het aantal elementen met kenmerk A), resp. van p (de fractie elementen met kenmerk A) in een met teruglegging getrokken aselecte steekproef uit een dichotome populatie, waarin de fractie elementen met kenmerk A de boven de verdeling opgenomen waarde P bezit. Merk op.
T a b e l 4.2. E n k e l e b i n o m i a l e v e r d e l i n g e n m e t n == 10 X
0 1 2 3 4 5 6 7 8 9 10
P = fractie elementen met kenmerk A in de populatie r
10
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0,01 0,90438 0,09135 0,00415 0,00011 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000
0,04 0,66483 0,27701 0,05194 0,00577 0,00042 0,00002 0,00000 0,00000 0,00000 0,00000 0,00000
0,30 0,02825 0,12106 0,23347 0,26683 0,20012 0,10292 0,03676 0,00900 0,00145 0,00014 0,00001
0,50 0,00098 0,00977 0,04395 0,11719 0,20508 0,24609 0,20508 0,11719 0,04395 0,00977 0,00098
0,60 1 0,80 1 0,90 1 0,92 0,00010 0,00000 0,00000 0,00000 0,00157 0,00000 0,00000 0,00000 0,01062 0,00007 0,00000 0,00000 0,04247 0,00079 0,00001 0,00000 0,11148 0,00551 0,00014 0,00004 0,20066 0,02642 0,00149 0,00054 0,25082 0,08808 0,01116 0,00522 0,21499 0,20133 0,05740 0,03427 0,12093 0,30199 0,19371 0,14781 0,04031 0,26844 0,38742 0,37773 0,00605 0,10737 0,34868 0,43439
Kansen in 5 decimalen nauwkeurig. De som der kansen per verdeling kan door afronding iets van 1 afwijken.
84
4.3
BINOMIALE VERDELINGEN P(X=X)
P(X=X) 0,4
u,'»
P=0,10
0.3
p=a30
0,3
. 0,2
0,2
0,1
0,1
tk^
,0
0
0 1 2 3 4 5 6 7 8 9
U,*
R.0,50
0,3
0,2
0,2
0,1
0,1
.,-PC
J=
P(X=X)
03
0
•
0 1 2 3 4 5 6 7 8 9 10 X
10 X
P(X=:X) U,4
—
Itw-10
0 1 2 3 4 5 6 7 8 9
0 X
1'-qao r-
_-
r-
-—
, , . , r-r 0 1 2 3 4 5 6 7 8 9 1 0 X
Figuur 4.1. Kolommendiagrammen van de binomiale verdelingen met n = 10 en P = 0,10, 0,30, 0,50 en 0,80. dat alleen de verdeling m e t P = -J = g symmetrisch is en dat voor P ^ Q een asymmetrie optreedt, die sterker wordt naarmate P e n Q meer verschillen. I n figuur 4.1 zijn vier binomiale verdeUngen uit tabel 4.2 grafisch voorgesiéld. Voor P = 0,1 is de verdeUng om lage waarden van x (p) geconcentreerd, met (zeer) lage kansen op hoge waarden: P{x ^ 4)~= 0,01280, P(x ^ 5) = 0,00164. Men noemt een asymmetrische verdeling van dit type • scheef naar rechts. Voor P = 0,3 is de spreiding van de verdeüng groter en . de scheefheid naar rechts reeds veel minder uitgesproken. Voor P = ^, is de spreiding het grootst: de verdeling is symmetrisch met modus = ju, = 5. Voor P = 0,8 treedt scheefheid naar links op. 4.4.
I n tabel 4.3 zijn, voor dezeUde waarden van P als in tabel 4,2, de binomiale verdelingen met « = 20: P{x = x) = P(p = ; / > ) = C/». pxQw-» gegeven. Merk op, dat bij deze grotere steekproefomvang voor een bepaalde P 5* J de scheefheid van de binomiale verdeling minder sterk is. Wij komen hierop terug in 5.1.
85
4.3
DISCRETE KANSVERDELINGEN Tabel 4.3. Enkele binomiale verdelingen met n = 20 X
X
^-20
~T1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95
1
0,01 0,81791 0,16523 0,01586 0,00096 0,00004 0,00000 0,00000 0,00000 0,00000 0.00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000
P = 0,04 0,44200 0,36834 0.14580 0,01645 0,00645 0,00086 0,00009 0,00001 0,00000 0.00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000
fractie elementen met kenmerk A in de populatie 0,90 0,92 0,30 0,50 0,60 0,80 0,00080 0,00000 0,00000 0,00000 0,00000 0,00000 0,00684 0,00002 0,00000 0,00000 0,00000 0,00000 0.02785 0,00018 0,00000 0,00000 0,00000 0,00000 0,07160 0,00109 0,00004 0,00000 0,00000 0,00000 0,13042 0,00462 0,00027 0,00000 0,00000 0,00000 0,17886 0,01479 0,00129 0,00000 0.00000 0,00000 0,19164 0,03696 0,00485 0,00000 0,00000 0,00000 0,16426 0,07393 0,01456 0,00001 0,00000 0,00000 0,11440 0,12013 O.OT.'WO 0,00009 0.00000 0,00000 0,06537 0,16018 0,07099 0.00046 0,00000 0.00000 0,03082 0,17620 0,11714 0,00203 0,00001 0,00000 0,01201 0,16018 0,15974 0,00739 0,00005 0,00001 0,00386 0,12013 0,17971 0.02216 0,00036 0,00008 0,00102 0,07393 0,16588 0,05455 0,00197 0,00055 0,00022 0,03696 0,12441 0,10910 0,00887 0,00316 0,00004 0,01479 0,07465 0,17456 0,03192 0,01454 0,00001 0,00462 0.03499 0.21820 0,08978 0.05227 0,00000 0,00109 0,01235 0,20536 0,19012 0.14144 0,00000 0,00018 0,00309 0,13691 0,28518 0.27109 0,00000 0,00002 0,00049 0,05765 0,27017 0,32816 0,00000 0,00000 0,00004 0,01153 0,12158 0,18869
4.3.2. BEREKENING VAN BINOMIALE VERDELINGEN
Als n groot is levert het berekenen van binomiale kansverdeüngen met (4.4) of (4.9) ved rekenwerk op. Dit kan althans enigszins worden verminderd, door gebruik te maken van een zg. recursieformule, die de verhouding van twee opeenvolgende kansen geeft :
(4.10)
p{x = x + i) ^ P(x = x)
cx+l :
px+1 Qn - x - 1
n —x
pxQn
7+T
p
Men berekent dan één der kansen (bij voorkeur de grootste) met (4.4) of (4.9) en de overige kansen volgen dan successieveüjk uit de verhoudingsgetallen. In vele gevaUen kan men echter beter gebruik maken van tabeUen, die voor verschiUende waarden van P en « de (cumulatieve) binomiale verdeUngen direct geven. De belangrijkste hiervan zijn : a. Voor waarden van « tot 150enP = 0,01,0,02, ...,0,99 de'Tables of the Cumulative Binomial Probabiüties, U.S.A. Ordnance Corps' (73). b. Iets minder gedetaiUeerd voor waarden van n tot 150 en geselecteerde waarden van n tot 1000: 'Tables of the Cumulative Binomial 86
BINOMIALE VERDELINGEN
c. d. e. ƒ.
4.3
ProbabiUty Distribution, Harvard University' (68). Deze tabeUen bevatten ook verdelingen voor waarden van P die een vedvoud zijn van 1/12 en 1/16. Voor « = 2, 3, ..., 49 en P = 0,01, 0,02, ..., 0,50: 'Tables of the Binomial Probabiüty Distribution, National Bureau of Standards' (72). Voor n = 50, 55, 60, ..., 100 en dezelfde waarden van P : ROMIG, '50-100 Binomial Tables' (75). Voor P = \ e n n t/m 200: de tabeUen van VAN WIJNGAARDEN (76). Voor « = 5, 10, 15, 20, 25, 30 en verschiUende waarden van P : BioMETRiKA TABLES I (74), tabel 37.
Binomiale kansen kunnen soms betrekkdijk eenvoudig bij benadering worden berekend. Wij behandelen twee benaderingsmethoden: 1. De Poisson-benadering, die kan worden toegepast als P (zeer) klein en n (zeer) groot is (zie 4.4.1). 2. De normale benadering die bruikbaar is als « (vrij) groot is en P niet te ved van \ verschUt (zie 5.5.4). 4.3.3. DE BEST-PASSENDE BINOMIALE VERDELING Het kan voorkomen, dat men vermoedt (of betwijfdt), dat een bepaalde populatie binomiaal verdeeld is. Als men over een asdecte steekproef uit deze populatie beschikt, kan de daarbij waargenomen verdeüng worden vergdeken met de zg. best-passende binomiale verdeüng, d.i. de binomiale verdeling waarvan /x^ geüjk wordt gesteld aan x, het gemiddelde van de waargenomen verdeUng. Daar /i,. = Pn, stdt men dan X = Pn, zodat P = 5é/n voor de best-passende verdeüng berekend kan worden. Het volgende voorbeeld moge dit verduidelijken. Voorbeeld 4.5.
Men beschikt over een - als aselect te beschouwen - steekproef, bestaande uit 103 nesten, elk mèt 4 pasgeboren muizen. Als per nest de kans op een vrouwtjesgeboorte constant ( = P) is, volgt het aantal vrouwtjes per nest, X, de binomiale verdeüng: P(X : = X ) = Ca,*. P'Q*-^. De parameter P is onbekend, maar wordt nu uit de waargenomen verdeüng van het aantal vrouwtjes per nest (links in tabel 4.4) geschat. Voor deze verdeling is: x = 192/103 = 1,864. SteUen wij /*„ = H, dan is P X 4 = 1,864, dus P = 1,864/4 = 0,466. De best-passende binomiale verdeling is dan: P{x = x) = C,,*. (0,466)* (0,534)*-*. Deze is in tabel 4.4 berekend. Vermenigvuldigt men de kansen van deze verdeUng met het totale aantal nesten, 103, dan verkrijgft men de verwachte frequenties, e, die met de waargenomen frequenties, ƒ, kunnen worden vergeleken. Wij zuUen later een toetsingstechniek behandelen, waarmee de overeenstemming tussen de waargenomen en de best-passende verdeUng kan worden onderzocht, de z.g. ;f*-toets voor aanpassing, zie 10.1. Zonder meer is hier echter wel in te zien, dat deze overeenstemming zeer goed is.
87
4.3
DISCRETE KANSVERDELINGEN Tabel 4.4. Muizennesten
Waargenomen verdeüng Aa.ntal Aant. vrouwtjes nesten ƒ* X ƒ 0 9 0 1 30 30 2 35 70 24 3 72 4 5 20 Totaal 192 103
Best-passende binomiale verdeUng Ca,*. (0,466)* (0,534)*-* 1 4 6 4 1
(0,534)* (0,466)» = (0,534)» (0,466)1 = (0,534)> (0,466)* = (0,534)1 (0,466)3 = (0,534)» (0,466)* =
e = 103 • P(Ar = x)
0,0813 o,2838 0,3715 o,2162 0,0472 1,0000
8,4 29,2 38,3 22,3 4,8 103,0
4.3.4. BINOMIALE BENADERING VAN EEN HYPERGEOMETRISCHE VERDELING
Als men aselect zonder teruglegging een steekproef van n elementen trekt uit een didiotome populatie, waarvan de omvang N aanzienlijk groter is dan n, veranderen P en Ç niet noemenswaard door het niet terugleggen der getrokken dementen. De hj^jergeometrische verdeüng kan dan zeer nauwkeurig benaderd worden door de binomiale verdeüng met P = N J N enQ = 1 — P [vergelijk ook (4.3) met (4.6) : bij conN - n stante n en toenemende N nadert de term - j ^ T- in (4.3) tot 1]. Voorbeeld 4.6
Een populatie bestaat uit 120 jongens en 80 meisjes. Men trekt aselect zonder teruglegging een steekproef van 3 kinderen. De grootheid x, het aantal jongens in de steekproef, volgft dan de h3rpergeometrische verdeüng: 120
80
Cg ' Ca-ll
P(^ = x)
200
c. Daar M = 3 aanzienUjk kleiner is dan N = 200, kunnen wij verwachten dat deze verdeling bevredigend wordt benaderd door de binomiale verdeling: P[x = x ) = CJ'
120 200
80 200
Beide verdelingen zijn, in vier decimalen nauwkeurig, in onderstaande tabel gegeven. De benadering büjkt inderdaad zeer goed te zijn.
Exact: hypergeometrisch P{x = x) Benaderd: binomiaal P(x = x)
88
0,2138 0,2160
0,4349 0,4320
1 0,2887 0,2880
0.0626 0,0640
BINOMIALE VERDELINGEN
4.3
4.3.5. OPGAVEN 4.6.
Geef - zo mogeüjk - voor elk der onderstaande steekproeffuncties : P{x = x), ßg, en (Tj,*. a. Het aantal 'zessen' bij 50 worpen met een zuivere dobbelsteen. b. Het aantal harten in een zonder teruglegging getrokken aselecte steekproef van 8 kaarten uit een spel van 52 kaarten. c. Het aantal jongens in een gezin met drie kinderen, aselect getrokken uit een populatie-waarin de kans op een jongensgeboorte 0,515 is. d. Het aantal kinderen met ziekte A in een aselecte steekproef van 100 kinderen, getrokken uit een populatie waarin de kans op deze ziekte 0,08is. e. Het gemiddelde van de bloeddruk van een steekproef van 20 personen die aselect getrokken is' uit een populatie van' 130.000 personen. ƒ. Het aantal personen met een bloeddruk hoger dan 150 mm Hg in de onder e genoemde steekproef. g. Het aantal defecte exemplaren in een steekproef vaji 10 exemplaren, die aselect zonder teruglegging wordt getrokken uit een partij van 20.000 stuks, waarin, zich J% defecten bevindt.
4.7.
Door welke binomiale verdeUngen kunnen de volgende hypergeometrische verdelingen worden benaderd? ' 100
200
16
«• PUf = •*) = —-505
*• P\^ = x) =
10
20
—pg u
4.8.
Men werpt met 6 zuivere geldstukken. Geef de kansverdeüng van x, het aantal malen kruis bij één worp.
4.9.
Men werpt 24 keer met twee zuivere dobbelstenen. Hoe groot is de kans dat minstens één keer dubbel zes verschijnt?
4.10. A en B spelen vijf partijen schaak. De kans dat A drie van de vijf partijen wint is even groot als de kans, dat hij er vier van de vijf wint. Hoe groot is de kans, dat B alle partijen wint? 4.11. Voor een bepaalde populatie van zeer grote omvang is-,de kans, dat een persoon binnen een jaar sterft geüjk aan 0,01. Men trekt aselect een steekproef van 10 personen. Hoe groot is de kans, dat na 1 jaar het aantal sterfgevaUen hierin bedraagt: a. Gteen, b. Eén, c. Niet meer dan één, d. Meer dan één, e. Minstens één, ƒ. Ten hoogste twee? 4.12. Van een binomiale. verdeüng is gegeven: jita, = 12,8 en
"I 3 ƒ
2
r
I 46 106 130 38
89
4.4
DISCRETE KANSVERDELINGEN
4.15. Een aselect getrokken steekproef vertoont onderstaande verdeling. Men vermoedt, d a t deze steekproef uit een binomiaal verdeelde populatie afkomstig is. Acht u deze onderstelling juist? 1 I 71 232 605 92
ƒ
4.16. Bepaal voor de binomiale verdeUng met » = 20 en P = 0,3 (zie tabel 4.3) : a. Pi(5), b. Pje(16), c. P R ( \ 2 ) , d. P D ( 2 ) . e. Pi,(13). 4.17. Bepaal voor de binomiale verdeling met « = 20 en P = 0.5 (tabel 4.3) : « . P I , ( 3 ) . Ô . P K ( 1 7 ) . C . P D ( 3 ) . d.PD(l7), e.PD(16),/.Pi.(6), g.PD(14), Ä. P Ä ( 1 5 ) .
4.18. Bepaal vervolgens voor deze verdeüng de waarde van x, waarvoor geldt: a. PL{X) < 0,10, b. PR{,X) ^
0,05, c. PD{X) < 0,05, d. PD{X) <
0,01.
4.4. Poissonverdelingen 4 . 4 . 1 . EEN POISSONVERDELING ALS BENADERING VAN EEN BINOMIALE VERDELING
Formule (4.4) voor een binomiale kansverdeüng kan ook als volgt worden geschreven (daar /ig = /i = Pn, is P = /i/n) : Ç» . pxQn-x _-
. pxQn-x
n{n — 1)
{n — X + l)
(v)''(-^)"
x\ n
(»—1)
n
(«—*-!-1)
ƒ<*
n
n
x\\
n) \
nj
Laat nu n tot oneindig en P tot nul naderen op zodanige wijze, dat hun product Pn = /i constant bUjft. Als n nadert tot oneindig, nadert eUc , ^
der termen
n— l
n
,
n —2
n
,
,
1* — x + \
n
. ^ ,
j . t ,
tot 1, zodat hun
product 1 tot ümiet heeft. Ook de term(l —^/«)-* nadert tot 1, daar /l/n tot nul nadert entius (1 — /i/n) 1 tot ümiet heeft. Wij vermelden 1 1 zonder bewijs, dat de term (1 — /«/«)" nadert tot e-l* [e = -TTJ- -|- -ry + -^ + 90
= 2,7183 is een bekend getal in de wiskunde: het grond-
4.4
POISSONVERDELINGEN
tal der natuurlijke logarithmen]. Zodoende wordt de limiet van de gehele uitdrukking (4.4) : (4.11)
P(x = x) =
/^e-f* x\
Men noemt deze kansverdeling een Poissonverdeling. Zij kan als benadering van de binomiale verdeling met /i = Pn worden gebruikt, als n groot en P klein is en uit de wijze waarop zij is afgeleid blijkt reeds, dat de benadering beter zal zijn, naarmate n groter en P kleiner is. Een demonstratie hiervan is te vinden in tabd 4.5, waarin enkele binomiale verdeUngen met /i = Pn = 3 (en met verschiUende waarden van Pen n), zijn vergeleken met de Poissonverdeling met ^ = 3. Men ziet, dat reeds voor P = 0,1 en « = 30 een redeUjke benadering verkregen wordt, dat voor P = 0,02 en « = 150 de benadering goed en vqor P = 0,01 en n = 300 de benadering uitstekend is. Tabel 4.5. Enkele binomiale verdeUngen en de Poissonverdeling met /t = P n = 3 X
0 1 2 3 4 5 6 7 8 9 10 11 12 enz.
P = 0,1 « = 30 P« = 3 0,0424 0.1413 0,2276 0,2361 0,1771 0,1023 0.0474 0,0180 0,0058 0,0016 0,0004 0,0001 0,0000
Binomiale verdelingen P = 0.02 P = 0,05 » = 150 » = 60 P» = 3 P« = 3 0.0483 0,0461 0.1455 0.1478 0,2259 0.2248 0,2263 0.2298 ' 0.1724 0,1697 0,1016 0,1011 0.0490 0.0499 0.0199 0.0209 0.0069 0,0076 0,0021 0.0025 0.0007 0,0006 0.0002 0,0001 0,0000 0.0000
P = 0,01 » = 300 P« = 3 0,0490 0,1486 0,2244 0,2252 0,1689 0.1010 0,0501 0,0213 0,0079 0.0026 0,0008 0,0002 0.0000
Poissonverdeling P n = fi = 3 0.0498 0,1494 0,2240 0.2240 0.1680 0.1008 0.0504 0.0216 0.0081 0.0027 0.0008 0,0002 0,0001
Uit het voorgaande büjkt, dat het gemiddelde van een Poissonverdeling /i = Pn is. De variantie is echter eveneens geüjk aan P n ; dit is in te zien als men bedenkt, dat als n ->oo, P steeds kleiner wordt, zodat Q nadert tot 1 en PQn-^Pn. Dus: (4.12)
/i = P n = or«.
4.4,2. BEREKENING
De recursieformule (4.10) voor de verhouding van twee opvolgende 91
4.4
DISCRETE KANSVERDELINGEN
kansen gaat voor een Poissonverdeling over in: (4.13)
P{x = x + l ) P{x = x)
/i x-\-l'
of:
P{x = X + l) = P{x = x).
x-\-l
Als /i bekend is, kan P(x = 0) — wij schrijven kortweg: P(0) — berekend worden met P(0) = — = e-M, ^' et*
(4.14) zodat bij benadering (4.15)
log P(0) =-0,4343/*.
De overige kansen volgen dan door toepassing van (4.13) : P{\) = P(0)--f^ = P{0)-/i.
P(2)=P(1).-|-=P(0).-^, dus in het algemeen uit : (4.16)
P{x)=P(0)
fL x\
In tabel 4.6 zijn voor een aantal waarden van /i de bijbehorende waarden van e-'* = P(0) gegeven. Deze tabd kan worden gebruikt bij het maken van opgaven betreffende Poissonverdelingen. Tabel 4.6. 'Waarden van «-/* = P(0)
A*
e-i«
/*
e-ß
0,1 0,2 0,3 0,4 0,5
0,9048 0.8187 0,7408 0.6703 0.6065
0,6 0.7 0,8 0,9 1,0
0,5488 0,4966 0,4493 0,4066 0.3679
92
II 1.2 1.4 1,6 1.8 2.0
e-/* 0,3012 0,2466 0.2019 0.1653 0,1353
n
2,5 3,0 3.5 4,0 4,5
e-A' 0.08208 0.04979 0.03020 0,01832 0,01111
•
i»
e-A«
5,0 6,0 7,0 8,0 9,0
0,006738 0.002479 0,000912 0,000335 0,000123
POISSONVERDELINGEN
4.4
I n d e tabeUen v a n M O L I N A (71) zijn (cumulatieve) P o i s s o n v e r d e ü n g e n m e t /i t o t 100 o p g e n o m e n . D e B I O M E T R I K A T A B L E S I (74) b e v a t t e n
P o i s s o n v e r d e ü n g e n v a n / i = 0,1 m e t 0,1 o p k ü m m e n d t / m /i = 15.
Voorbeeld 4.7. Benadering van de binomiale verdeüng P{x = x) = C„». (0,1)* (0,9)*-* door de Poissonverdeling: P{x = x) = (0,3)*e-'''*/*I Berekening: j» = P« = (0,1)3 = 0,3. Uit tabel 4.6 volgt: P(0) = 0,7408. Uit (4.16) volgt: P(l) = 0,7408(0,3) = 0,2222; P(2) = 0,7408(0,3)72! = 0,0333; P(3) = 0,7408(0,3)»/31 = 0,0033. Deze benaderende Poissonverdeling is in onderstaande tabel met de binomiale vergeleken : Binomiaal Poisson 4.4.3.
Pljf = x) P(x = X)
0,729 0,741
1 0,243 0,222
POISSONVERDELINGEN ALS EXACTE
0,027 0,033
0,001 0,003
Totaal 1,000 0,999
KANSVERDELINGEN'
Tot dusverre hebben wij Poissonverdeüngen behanddd als benadering voor een bepaald soort binomiale verdeUng. Er zijn echter situaties, waarvoor een Poissonverdding de exacte kansverdeling is, nl. als öien te doen heeft met het voorkomen van onderling onafhankelijke, geïsoleerde gebeurtenissen in een continuum van tijd of ruimte. Het totale aantal mogeüjke gebeurtenissen dient groot (feitdijk: oneindig groot) te zijn, maar de (constante) kans op het voorkomen van een individuele gebeurtenis moet klein zijn. Beschouwt men dan bv. het aantal keren x dat een bepaalde gebeurtenis in een tijdsinterval van zekere lengte voorkomt, dan is het kenmerkende van de dtuatie dat men wd kan vaststeUen hoe vaak de gebeurtenis heeft plaatsgevonden, maar dat het geen zin heeft te vragen naar het aantal malen dat de gebeurtenis niet voorkwam. Voorbeelden 4.8. Het aantal leucocjrten of erylhrocyten in één vierkantje van een hemocytometer (zie N.T.v.G., 98 (1954), 3480-3485). 4.9. Het aantal sterfgevallen per dag tengevolge van een acute hartaandoening in een grote stad. 4.10. Het aantal auto's, dat een bepaald punt van een weg gedurende een bepaalde minuut van de dag passeert. 4.11. H e t aantal aanvragen, dat een schakelbord in een telefooncentrale gedurende een bepaalde minuut van de dag te verwerken krijgt. 4.12. Het aantal garenbreuken per spindel (zie Sigma I, (1955), 78-81). 4.4.4. DE BEST-PASSENDE POISSONVERDELING
Als men beschikt over de waargenomen frequentieverdeling van een grootheid en wil onderzoeken, of deze een Poissonverdeling volgt, kan 93
4.4
DISCRETE KANSVERDELINGEN
de best-passende Poisson worden verkregen door x te berekenen en /i hieraan gdijk te steUen (bewezen kan worden, dat deze handelwijze te verkiezen is boven het schatten van /i uit s^ of uit een combinatie van ië en Sa,*). Voorbeeld 4.13. 'Wij bepalen de best-passende Poissonverdeling voor onderstaande verdeUng van het aantal gistcellen, dat werd waargenomen in 400 vierkantjes van een hemocyix)meter (data van STUDENT, Biometrika 1907) : X
ƒ ƒ*
1 143 143
0 103 0
2 98 196
3 42 126
4 8 32
5 4 20
6 2 12
7 0 0
8 Totaal 400 0 0 529 = Sfx
Berekeningen: X = 529/400 = 1,3225. Wij steUen dus: /« = 1,3225. Volgens (4.15) is dan: logP(O) = - 0 , 4 3 4 3 (1,3225) = -0,57436 = 0,42564 - 1. Hieruit volgt: P(0) = 0,2666, Met (4.16) volgen hieruit de andere kansen, bv. : P ( l ) = 0.2666 (1,3225) = 0,3526; P(2) = 0,2666 (1,3225)V2 = 0,2331; P(3) = 0,2666 (l,3225)»/6 = 0,1028, enz. (Merk op, dat men in dit geval niet de best-passende binomiale verdeling kan bepalen, daax men dan moet steUen: P = x/n terwijl de waarde van n niet vaststaat.) De best-passende Poissonverdeling is dus: « 1 0 1 2 3 4 5 6 7 P { x = x) 1 0,2666 0,3526 0,2331 0.1028 0,0340 0,0090 0,0020 0,0004 e = 400 X P\ 106,6 141,0 93,2 41,1 13,6 3,6 0,8 0,0 4.4.5. OPGAVEN 4.19. Van een Poissonverdeling is gegeven: a. P(3) = P(4). Hoe groot is de kans, dat x de waarden O of 1 aanneemt? b. P ( l ) = 3P(4). Bepaal /i en P(0). 4.20. Men werpt 64 keer met 5 geldstukken. Geef (bij benadering) de kans op O, 1,2, 3, . . . , 64 keer de uitkomst '5 kruis'. 4.21. Een massaproduct, dat 0,5% defecten vertoont, wordt verpakt in dozen van 100 stuks. 'Welk deel der dozen bevat O defecte exemplaren? Welk deel bevat er 2 of meer? 4.22. Een verzekeringsmaatschappij constateert, dat 0,004% van de bevolking per jaar sterft tengevolge van een bepaald ongeval. Hoe groot is de kans, dat deze maatschappij in één jaar tot uitkering zal moeten overgaan bij meer dan 3 van de 10.000 tegen het risico van dit ongeval gesloten verzekeringen? 4.23. Onderstaande tabel geeft het aantal sterfgevallen per week bij personen van 20 t/m 64 jaar aan kanker en andere maligne tumoren te 's-Gravenhage in de jaren 1920 t/m 1928. Bepaal de best-passende PoissonverdeUng. X
ƒ 1 94
0 1 16 50
2 3 4 5 73 101 71 70
6 47
7 8 24 10
9 3
10 1
11 —
12 1
Totaal 467
POPULATIES MET K CATEGORIEËN
4.5
4.5. Steekproeven uit een populatie met k categorieën Wij beschouwen een populatie, waarvan N-^ elementen kenmerk A, JVg dementen kenmerk B, , iVj, dementen kenmerk K bezitten (JVi -|- -iVg -|- . . . -\-N-k = N). Zo'n populatie met Ä = 4 kenmerken (attributen) is bv. gegeven in voorbedd 1.16. 4 . 5 . 1 . ALGEMENE HYPERGEOMETRISCHE VERDELINGEN
Men trekt asdect zonder teruglegging een steekproef van n dementen uit bovengenoemde populatie. Analoog aan 4.2.1 kan worden bewezen, dat de kans op een steekproefsamenstdüng met x-^^ elementen A, x^^ dementen B, , «* dementen K, gegeven wordt door:
<' x C x....x<* (4.17)
P(i»;i. X
(«fc =
^,)
'
« — * i — «2 —
...
*
—aTjb-i).
De kansverdeüng, die door (4.17) wordt gespecificeerd noemen wij een algemene hypergeomdrische verdding ((4.1) is hiervan een bijzonder geval, met Ä = 2). Voorbeeld 4.14. Men trekt 13 kaarten uit een goed geschud spel van 52 kaarten. De kans, dat zich hierin 10 schoppen, 2 harten, 1 ruiten en O klaveren bevinden is volgens (4.17): IS
C
IS
XC 10
IS
XC
s
13
X C
i
c
o
SS
u (De lezer, die de grootte van deze kans berekent zal inzien, waarom men in de praktijk niet graag met h}7pergeometrische verdelingen werkt.) 4.5.2. MULTINOMIALE VERDELINGEN
Vervolgens beschouwen wij een aselect met teruglegging getrokken steekproef van n dementen uit een populatie met k categorieën. Noem N J N = Pi, N J N = P j , , N J N = P j . Analoog aan 4,3,1 kan worden bewezen, dat de kans op x^ A's, x^ B's, . . . , « * K's, volgt uit: 4.18
P{xi, x ^ , . . . , x^) =
«! —j
j- • P*iP*.... P**
Xi 1x21 . . . «fc!
{xji = n — Xi — X2 — . . . — «*-i).
95
4.5
DISCRETE KANSVERDELINGEN
Deze kansverdeüng, waarvan de binomiale verdeüng een bijzonder geval met Ä = 2 is, heet de multinomiale verdding. Voor elke Xi gddt; (4.19) en (4.20)
/h>i = n P i a„^^ = nPjQi
{Qi=\-Pi).
AlsPi = P , = . . . = P;, = Pgaat (4.18) overin:
J '
• P».
X i ' . X z ' . . . .Xji'.
Als « -C iV kan een algemene hypergeometrische verdeling benaderd worden met de best-passende miütinomiale verdeling. Voorbeeld 4.15. Een populatie bestaat uit 10 elementen met kenmerk A, 20 elementen met kenmerk B en 30 elementen met kenmerk C, zodat P^ = Vs. ^ s = Vs^n-Ps = % . In onderstaande tabel zijn alle mogeüjke steekproeven van « ^ 3 elementen met hun kansen, berekend met (4.18), gegeven: .Aanted elementen A B C *» *i *s 0
0
3
0
1
2
0
2
I
0
3
0
1
0
2
1
1
1
1
2
0
2
0
1
2
1
0
3
0
0
Berekening «1 ;iril;i;,l;i;
„,>- ,.,,-
,.,w
P
^1 ivsr' {'i»n n»n
3! 01013! 3! 0!1!2!
(V.)" (V.)^ (V.)'
3! 3!0I01
(V.)» (V.)" (V.)"
(V.)" (V.)" ('/.)»
27 216 54 216 , 36 216 8 216 27 216 36 216 12 216 9 216 6 216 1 216 1
96
POPULATIES MET K CATEGORIEËN
4.5
4.5.3. OPGAVEN 4.24. Bereken voor voorbeeld 4.15 x^, x^ea Xt' a. Uit de kansverdeling, b. Met (4.19). 4.25. Voor een populatie met 3 categorieën is P j = Pg = P , = Vs- Men trekt aselect met teruglegging een steekproef van 6 elementen. Bepaal de kansverdeling van de uitkomsttypen 6, O. O — 5, 1, O — 4, 2. O — enz. (Tot het uitkomstt3rpe 6,0,0 behoren bv. aUe steekproeven met 6 elementen vaji één soort en O elementen van beide andere soorten, dus : 6,0, O — 0,6,0 en 0,0,6.)
97
HOOFDSTUK 5.
NORMALE VERDELINGEN 5.1. Een normale verdeling als limiet van een binomiale Beschouw een reeks binomiale verdelingen met P = J en met in grootte toenemende waarden van n. Deze verdeUngen zijn alle symmetrisch. Naarmate n toeneemt wordt het aantal mogelijke waarden van X groter ; de som van de kansen van de (n -i- 1 ) waarden van x is echter steeds geüjk aan 1, zodat de kansen op de afzonderüjke waarden vanx gelddeüjk afnemen (zie bv. de verdeUngen met P = ^ e n n = 10, resp. 20 üi de tabeUen 4.2 en 4.3). De steeds breder en vlakker wordende kansverdeüngen zijn daardoor niet goed vergeUjkbaar. Dit bezwaar kan worden ondervangen door elke verdeüng te standaardiseren, d.w.z. door dke binomiaal verdedde grootheid x met gemiddelde Pn = i n en standaarddeviatie VPQn = \ V n volgens (3.4) om te zetten in de gestandaardiseerde (binomiale) grootheid
met gemiddelde O en standaarddeviatie 1. In figuur 5.1 zijn voor twee van deze gestandaardiseerde binomiale verdeUngen met P = ^ e n n = 10, resp. 30, de kolommendiagrammen getekend. Per verdeüng is daartoe van dke waarde van x met (5.1) de corresponderende waarde van T bepaald en vervolgens is op elk der (« -1- 1) klassen met T„ als klassemidden een kolom opgericht, waarvan het oppervlak ( = klassebreedte x hoogte) de grootte van de bij Tj, behorende kans representeert. De som van de oppervlakken der (« -f 1) kolommen dient geüjk te zijn aan 1 en daar de klassebreedte van de twee verdeUngen verschiUend is (deze bedraagt nl. l/^V») nioet de hoogte van elke kolom geüjk zijn aan : (5.2)
98
y« =
Pjx = X) P{x = x)Vn j = 2 •
EEN NORMALE "VERDELING ALS LIMIET VAN EEN BINOMIALE
-6 -5 -4 -3 - 2 -1
O +1 +2 +3 +4 +5 +6
5,1
T
Figuur 5.1. Twee gestandaardiseerde binomiale verdelingen met de best-passende normale verdeling, P = Q = ^i A: n = 10, r = " ~ ^}}°^ = ", 7 / • klassebreedte: , ' , , ^ 1,58 iVio iVio
= 0.633.
1 B: n = 30. T = ^ , */^°^ = ^ ^ ~ ^ , klassebreedte: , ; „ ^ = 0,365. } V 30 2.74 iV30
99
5.2.
NORMALE VERDELINGEN
Laat men nu n steeds groter worden dan wordt het aantal kolommen ook steeds groter, maar de kolombreedte wordt voortdurend kleiner. Nadert n tot oneindig, dan nadert het aantal kolommen eveneens tot oneindig en de kolombreedte ( = klassebreedte) nadert tot nul. D.w.z. de trappenUjn van het kolommendiagram gaat over in de vlodende gebogen üjn, die in figuur 5.1 reeds is ingeschetst (en die bij » = 30 al aanzienUjk beter 'past' dan bij » = 10). Bewezen kan worden, dat deze curve een zeer bekende continue kansverdeüng, een zg. normale verdding (verdeüng van D E MOIVRE, verdeling van GAUSS-LAPLACE) representeert. Bij P = i ziet men dus, als n nadert tot oneindig, een normale verdeüng verschijnen als limiet van de binomiale verdeüng. 'Voor P # ^ is een binomiale verdeüng as3mimetrisch (scheef naar rechts voor P < J, scheef naar ünks voor P > J, zie figuur 4.1). Voor een bepaalde n is de scheeflidd sterker, naarmate P meer van ^ verschut (vergelijk bv. de verdeUngen met n = 10 en verschiUende P in tabel 4.2). Maar bij een bepaalde P ( 9^ |) neemt de scheeflidd af, naarmate n groter wordt (vergelijk bv. de binomiale verdeUngen met P = 0,3 e n n = 10, resp. 20, in de tabeUen 4.2 en 4.3). Het büjkt nu, dat ook voor P ¥= i een binomiale verdeüng bij aangroeiende n tot een S5anmetrisdie normale verdeUng nadert. Een duideUjker demonstratie Mervan levert figuur 5.2, waarin de binomiale verdeUngen met P = 0,37 en « = 5,10,20,40,80 en 160 zijn getekend^. De scheefheid naar rechts, die bij kleine n zeer duideüjk is, verdwijnt "vrijwel geheel naarmate n groter wordt. Het naderen van een (scheve) binomiale verdeüng tot een (symmetrische) normale verdeüng verloopt sneUer, naarmate P minder van ^ afSvijkt. Is P bv. zeer klein (0,001), dan is de benadering pas goed bij zeer grote n (ongeveer 10.000). Wij hebben in het voorgaande de stelüng, dat een binomiale verdeüng nadert tot een normale verdeüng als «naderttotoneüidig, dechts aannemeüjk trachten te maken; een exact bewijs hiervan valt buiten het kader van dit boek*. Wij wijden nu eerst enige paragrafen aan normale verdeUngen en bespreken daarna de wijze waarop - en de voorwaarden waaronder - een bepaalde binomiale kansverdeüng door een normale verdeüng kan worden benaderd. 5.2. Normale verdelingen en de standaardnormale verdeling In de hoofdstukken 3 en 4 hebben wij uitsluitend te maken gehad met discreet verdeelde stochastische grootheden, die dus een bepaald aantal geïsoleerde waarden konden aannemen. De normale verdeüng is ^ Deze grafieken zijn - analoog aan de kolommendiagrammen in fig. 5.1 - zo geconstrueerd, d a t na standaardisering de hoogte van de ordinaten op de klassemiddens gelijk is gesteld aan y^ (volgens (5.2)). De plaats van de verdelingen op de X-aa is zodanig, dat de gemiddelden van de onder elkaar staande verdelingen op dezelfde plaats Uggen. • Zie bv. FREUDENTH-M, (15) of NEYMAN
100
(26).
D E STANDAARDNORMALE VERDELING
5,2
o.
Ji o
§
n
g
§ 2
lO
o.
i
S
Figuur 5.2. Grafieken van de binomiaal verdeelde grootheid p = x/n voor P = 0,37 en verschillende in grootte toenemende n [uit: WALLIS &• ROBERTS (36)].
101
5.2
NORMALE VERDELINGEN
de kansverdeüng van een continu verdeelde stochastische grootheid x, die een oneindig groot aantal waarden van — oo tot -J- oo kan aannemen. Een normale verdeüng wordt gespedficeerd door een formule, waarin - behoudens een tweetal constanten - haar rekenkundig gemidddde /lie en haar sprdding Ca, voorkomen. De grafische voorstelling van een normale verdeüng (zie fig. 5.4) toont de bekende klokvormige kromme, die S3anmetrisch is t.o.v. de ordinaat op /ig. (zodat gemiddelde, mediaan en modus samenvaUen) en die aan beide zijden van /*„ steeds dichter tot de X-as nadert, zonder deze ooit te bereiken. Voor elk verschiUend paar waarden van /i^ en a^ verkrijgt men een andere normale verdeUng. De plaats van de verdeling op de X-as wordt bepaald door de waarde van /lx, haar spreiding (en vorm) door a,^ {zie figuur 5.3). Voor een normale verdeüng met gemiddelde /i en spreiding a gebruikt men de afkorting: N(ja, a) ; verdeüng A in figuur 5.3 kan dus worden aangeduid met iV(25, 3).
Een normaal verdeelde grootheid x met gemiddelde /ig en sprdding ©„ kan door standaardisering (zie 3.3.2) worden omgezet in de standaardnormaal verdeelde groothdd T met gemiddelde O en sprdding 1 : (5.3)
T =
X — fix
zodat (5.4)
X = fix + r^x In plaats van het symbool T, afkomstig van Prof. BOK (41), gebruikt men vaak u of z. De standaardnormale verdeling is in figuur 5.4 getekend. Elke normale verdeüng N{/i, a) gaat door standaardisering volgens (5.3) ia deze 102
DE STANDAARDNORMALE VERDELING
5.3
buigpunt
negatieve woorden
*,
positieve waarden
foo
X — Il
Figuur 5.4. De standaardnormale verdeling: T = -=
—, /ij. = Q, (jj. = 1.
standaardnormale verdeüng N{0,\) over. Uit (5,3) en (5,4) büjkt duidelijk, dat Ti de afstand is van Xi tot /i^, uitgedrukt in de spreiding a„. Voor Xi < n„ neemt Ti een negatieve waarde aan, voor Xf> /i„ een positieve. Beschouw bv. de verdeüng N{25,5). Wordt deze in de verdding iV(0,1) omgezet, dan "vindt men negatieve waarden van T voor waarden van X kleiner dan /*,, = 25 en positieve waarden van T voor waarden 35 25 van X groter dan 25. Voor A; = 35 volgt uit (5.3) : T = — = +2, d.w.z. deze waarde van x ügt tweemaal de sprdding boven haar gemiddelde. Beschouw vervolgens de verdeüng .ZV(100, 12). Voor »' = 124 vindt men met (5.3) T = ^^^ ~ ^ ^ = + 2 . Relatief, d,i. rekening ^ 1 2 houdend met de grotere spreiding van deze tweede normale verdeüng, ügt x' = ITA dus even ver boven haar gemiddelde als « = 35 in de eerstgenoemde normale verdeüng. 5.3. De standaardnormale verdeling 5.3.1. CONTINUE KANSVERDELINGEN^ De standaardnormale verdeüng is een continue kansverdeling. Continue kansverdeüngen wijken in enkele belangrijke opzichten van discrete kansverdeüngen af. Wij demonstreren dit met een eenvoudig voorbeeld. Onderstel, dat men een cirkelvormige schaal heeft, die één eenheid lang is en dat in het middelpunt daarvan een zorgvuldig uitgebalanceerde -wijzer is geplaatst. Als men deze wijzer laat draaien, heeft elk punt van de schaal dezelfde kans om door de punt van de wijzer te ^ Zie voor een uitvoeriger behandeling W I L K S (37), ADAMS (1).
103
5.3
NORMALE VERDELINGEN
worden aangewezen. Hoe groot is nu de kans op eenbepaalde uitkomst, zeg i? Stel dat deze uitkomst de zeer kleine kans | (bv. 0,00001) bezit. Om consequent te zijn dient men dan aan elke andere mogelijke uitkomst dezelfde kans toe te kennen - maar dan is de som van de kansen van aUe uitkomsten groter dan 1. Om dit in te zien behoeft men dechts de (beperkte) reeks uitkomsten l, J, J, J, J, te beschouwen. Neemt men nu een wiUekeurig geheel getal N > 1/1 en neemt men de eerste N leden van de voorgaande reeks, dan is de som van hun kansen groter dan 1. Hieruit volgt, dat men bij een continue kansverdeling de kans op een bepaalde uitkomst, zoals J, nul moet steUen. De niet-mathematisch geschoolde lezer komt dit weUicht "vreemd voor, maar hij dient te bedenken, dat een continue kansverdeling een mathematische conceptie is, evenals een üjn zonder dikte, een punt zonder dimensie, een perfecte drkd, e.d. In werkeUjkheid kan men het wijzer-modd niet verkrijgen, omdat dechts met beperkte nauwkeurigheid kan worden afgelezen, zodat men dan de schaal zal onderverdelen in intervallen van geüjke lengte. De kans op d k interval zal dan, als aUes zeer zorgvuldig geconstrueerd wordt, (ongeveer) geüjk zijn (denk bv. aan een roulette). In de statistiek levert het gebruik van continue kansverddingen, zoals de standaardnormale, geen moeüijkheden op, omdat meestal naar de kans op een bepaald interval gevraagd wordt. Zo'n intervalkans kan dan bepaald worden door te integreren (d.i. op bepaalde wijze te sommeren), maar zelfs dit behoeft men niet zelf te doen. Van alle continue kansverdeüngen, waarvan de statistiek gebruik maakt, zijn reeds lang uitgebrdde tabeUenverzameüngen met intervalkansen beschikbaar. Een praktische consequentie van het voorgaande is, dat men voor een continu verdeelde grootheid x geen onderscheid behoeft te maken
tassenP{x<xi)enP{x^xi),o{tassenP{xi<x<x^enP{Xi ^ x ^ x ^ , daar zowel P{x = x^) als P{x = x^) gdijk is aan nul. 5.3.2. LINKSE, R E C H T S E EN TWEEZIJDIGE OVERSCHRIJDINGSKANSEN
De standaardnormale verdeling is een kansverdeüng, zodat het totale oppervlak onder de standaardnormale kromme geüjk is aan 1. Richt men in de punten T^ en T^ ordinaten op, dan snijden deze een deel van het oppervlak onder de kromme uit (zie figuur 5.5), waarvan het oppervlak gelijk is aan de kans dat de groothdd T een waaide tus^^^^^ 55 stand^dnórmale verdeüng: gearsen Tl en T^ aanneemt, of ceerd is P (r^ < r < r j = P(T^, r j . 104
DE STANDAARDNORMALE VERDELING
5.3
korter gezegd: de kans van het interval {Ti, Tg). Hiervoor voeren wij de notatie P ( r i , Tg) in. Analoog aan 3.6 definiëren wij als linkse {overschrijdings)kans van de waarde T-^, Pjj^ij, de kans die behoort bij het interval (-00, Tj) en als rechtse {overschrijdings)kans van Ti, Pjj(ri), de kans die behoort bij het interval {T^ -\- 00) (zie figuur 5.6). gearceerd PL(TJ
1
1
+ 00
Figuur 5.6. Standaardnormale verdeling: linkse en rechtse kansen.
De tweezijdige overschrijdingskans, Pßl^i^, van de waarde Ti is de kans, dat de grootheid T een waarde aanneemt die verder dan ±7"^ van het centrum der verdeüng, /jij. = 0, verwijderd is. Wegens de symmetrie van de iV(0,l)-verdeüng geldt: voor Ti
0:Pj,{Ti) = 2Pj,{Ti). Als men één der kansen Pi.{Ti), PR{TI) of Pi){Ti) kent, kan men de bdde andere direct berekenen. Kent men de ünkse kansen van de waarden Tl en T2, dan kan men de kans van het interval (Tj, Tg) vinden door te nemen (zie figuur 5.5) : P{Ti, T2) = PdT^)
-
PL{TI).
5.3.3. TABELLEN VAN DE STANDAARDNORMALE VERDELING
Men kan dus aUe kansen betreffende een normale verdeling, die men in de praktijk nodig heeft, bepalen als men beschikt over een tabel die bv. Pi,{T) geeft voor vele waarden van T. DergeUjke tabeUen zijn reeds lang geleden berekend en in aUerlei graden van uitvoerigheid gepubUceerd. In tabel A (bijlage 1) is zo'n tabel met ünkse kansen gegeven voor een groot aantal waarden van T [van -6,9 t/m -|- 6,9, eerst met stappen van 0,01 (tabel A-1) en later met stappen van 0,1 (tabel A-2]. Uit tabel A kan men een groot aantal ünkse kansen direct aflezen. Voorbeeld (zie fig. 5.7) a. T is negatief : P L {— 1,04) = ? Zoek in de eerste kolom (T) de waarde 1,0 op en ga op de met een minleken aangegeven regel naar rechts tot in de kolom 0,04. Daar staat 0,1492, zodat: P L (— 1,04) = (LINKSE 0,1492. 5.1. /KANSEN b. T is positief: P^. (1,04) = ? Als (a), maar op de met een plusteken aangeduide regel. Men vindt dan: Pjr, (1,04) = 0,8508.
105
5.3
NORMALE VERDELINGEN
Tabel A kan echter ook worden gebruikt voor het bepalen van rechtse kansen. Voorbeeld (zie eveneens fig. 5.7) g2
\ RECHTSE te. r i s negatief: P R ( - 1,04) = P L { + 1,04), zie dus 16. ( KANSEN \d. T i s positief: Pje ( + 1,04) = P ^ ( - 1.04). zie dus la.
rechtse kans\ PR (-1,04)1
-1,04
+1.04
Figuur 5.7. Standaardnormale verdeling: Unkse en rechtse kansen.
Bij elke waarde van T kan men een kans vinden, die aangeeft welke fractie van het oppervlak onder de standaardnormale curve ünks van de ordinaat op deze waarde gelegen is. Men kan een fractid van de standaardnormale verdeüng aangeven, door deze fractie (=ünkse kans) als index aan T toe te voegen (zie 2.4.3). Voorbeelden 5.3. To „ ( = -f- 0,44) is het fractiel 0,67 (67e percentiel) van de N{0,\) — verdeUng. Dus: Pi,(ro.„) = 0,67, P R { T ^ , „ ) = 1 - 0,67 = 0,33. 5.4. Verifieer met tabel A, dat: Ta.jo = - 0 , 8 4 , To.go = O, To,,, = +1,28.
Een wiUekeurig fractiel wordt aangeduid met T^ en uit figuur 5.8 blijkt, dat : Ta. = —-^l-œ
—-* a = •' 1-a
r „ -t- Ti_^ = O P{T.. Ti_^ = 1 - 2a PjXTa) = P R { T I - ^ .
Figuur 5.8. Fractielen.
106
5.3
DE STANDAARDNORMALE VERDELING
In tabel B (bijlage 1) kunnen van verschiUende fractielen ( = ünkse kansen) de bijbehorende waarden van T worden afgelezen. Uit deze tabel blijkt o.m., dat: 10,005 — 2,576 — 1 o, 905 0.026 = -1,960 0,976 •l 0,0005 —
Hieruit volgt:
3,291 —
1 0>9986^
P(-1,960, + 1,960) = 0,95 P(-2,576, -t- 2,576) = 0,99 P(-3,291, + 3,291) = 0.999. En: Pß(-1,960) =P^(+1,960) = 1 - 0,95 = 0,05 1 - 0,99 = 0,01 P D ( - 2 , 5 7 6 ) = PB(-f 2,576) P D ( - 3 , 2 9 1 ) = Pfl(4-3,291) = 1 - 0,999 = 0,001. Hieruit volgt (zie ook (5.4)), dat voor een N{ii, a) - verdeling de kans op het interval p, ± 2,576o geüjk is aan 0,99 en dat de kans op het interval /i ± 3,29 Iff gelijk is aan 0,999. Voor een.Ar(25,5) verdeüng is de kans op het interval 25 ± (1,96) 5, d.i. het interval (15,2, 34,8), dus gelijk aan 0,95. De kans op een waarde buiten dit interval is l — 0,95 = 0,05 (zie figuur 5.9).
Figuur 5.9.
-3
-156
-1
+1
+ 156
+3 r
Voorbeelden 5.5. Hoe groot is de kans, dat de standaardnormaal verdeelde grootheid T een waarde aanneemt binnen het interval: a. (—2,52, -t- 0,25), b. ( + 0,23, +1,54)? Deze vragen zijn op te lossen met tabel A : «• Pi(+0,25) =0,5987 &. Pi(+1,54) =0,9382 Pz,(-2,52) = 0.0059 Px.(-h0,23) = 0,5910 P(-2.52.-1-0,25) = 0 , 5 9 2 8 P(-f-0,23,-f-1.64) = 0 , 3 4 7 2 5.6. Hoe groot is de kans. dat T een waarde aanneemt tussen ï'o.ao ^^ To,7o? De indices van deze fractielen geven linkse kansen aan. zodat de gevraagde kans gehjk is aan: 0.70 — 0,20 = 0,50. 5.7. Verifieer met tabel B, dat : T^ •1,645, r ,o,«s -h 1.645. 1.282, To .5 = -0,6745, r„,so = 0,842, T« . , „ = 3,719, '0,10
107
5.3 5.8.
NORMALE "VERDELINGEN De grootheid x volgt een normale verdeling met /j„ = 30 en a^ = 5. Bepaal de kans, d a t deze grootheid een waarde tussen 25 en 45 aanneemt. "Volgens (5.3) is : T j = i l = J ? ^ = + 3 , Pi(-|-3) = 0,9987 (tabel A) T = -=—;;
, zodat Tl = ^ - ^ ° = _ 1, p ^ ( _ 1) = o, 1587 (tabel A) P (25 < * < 45) = 0,8400.
5.3.4. OPGAVEN
5.1.
5.2.
5.3.
(Teken bij de opgaven steeds de (standaard) normale verdeling en arceer het oppervlak onder de kromme, waarop de opgave betrekking heeft.) Bepaal voor de standaardnormaal verdeelde grootheid T de volgende kansen: ». P B ( + 2 , 0 5 )
C. P I , ( - F 0 , 4 4 )
e. Pfl(-|-3,00)
6. Pi(4-0,44)
d. P2,(-0,44)
ƒ. P(0,+1.32) h. P ( - 1 . 8 2 , - 0 , 8 2 ) .
Als (1), v a n : a. Px,(+0,20) 6. Pjï(+2,00)
c. Pi,(-2,00) d. Pi>(+4,00)
g.
e. P ( - 0 , 4 , + 0,4) ƒ. P ( + l , 2 0 , + l,95)
P(-1.54,+0,46)
g. P ( - o o , 0 ) Ä. P ( + 0 , S , + o o ) .
Geef de waarde van :
*• Tp^gg b. Tj^jgg c. Tpj28 ^- To,ooi *• To^ojs ƒ• Tj.gs. 5.4. Geef de waarde van de volgende kansen, zonder gebruik t e maken van een tabel: «• •Pi(To.i2) rf. p ( r o , „ < r < r o , „ ) g- •PÄ(TO,2B)
b- PR{TO,S7) C. PR(T,,OI) e. P D ( r , , , 5 ) ƒ. P L ( r „ . „ ) h. P ( r o , j , > T > r o , „ ) .
5.5.
Bepaal de waarde van T voor elk der volgende vergelijkingen : «. P R { T ) = 0,16 b.~PL(T) = 0,04 c. P { - T . T) = 0,28 d. Pj){T) = 0,50.
5.6.
Een grootheid x volgt een normale verdeling, fi^ = 15,ffj^= 4. Bepaal: a . P ( ^ < 21) " 6. P ( 1 0 < 3 f < 2 0 ) c. P ( ^ > 23).
5.7.
Ontleend aan het examen 'Statistisch Analyst', 1953-54: "Wat is de kans, dat althans de grootste van drie waarden, gevonden bij drie onaihankeUjke trekkingen uit een normaal verdeelde populatie (met gemiddelde O en standaarddeviatie 1), groter is dan twee?
5.8.
Van een normaal verdeelde grootheid x is gegeven: a. a^ = 40, PD{X = 1 1 0 ) = 0,8026. Bepaal /*;,. b. /j„ = 100, PD{X = 153) = 0,0340. Bepaal a„ en Pi,{x = 60).
5.9.
Een populatie van grote omvang bestaat uit objecten, waarvan delengten bij benadering normaal verdeeld zijn. Als deze objecten in drie categorieën worden verdeeld, t.w. : I - korter dan 75 cm, I I - 75 t/m 81,2 cm, en I I I - langer dan 81,2 cm, bevatten deze categorieën de volgende percentages der objecten: I - 58''/o, I I - 38''/o, I I I - 4''/o. Bepaal het gemiddelde en de spreiding van de lengteverdeling.
108
5.4
BINOMIALE EN BEST-PASSENDE NORMALE VERDELING
5.4. Benadering van een binomiale verdeling door de best-passende normale verdeling 5.4.1. BINOMIALE VERDELINGEN MET P = Ç =
J
De S5mimetrische binomiale verdeling wordt in dit geval reeds bij kleine n goed benaderd door de best-passende normale verdeüng, d.i. de normale verdeUng met /i = Pn = ^n en a = VPQn = ^Vn. De grootheid ^ ^_ ^ (0.0) T =
Wn
is dan bij benadering standaardnormaal verdeeld, zodat voor het berekenen van binomiale kansen tabel A kan worden gebruikt. Voorbeeld 5.9. In tabel 5.1 is de berekemng opgenomen van de best-passende normale verdding bij de binomiale verdeling: P(x = x) = C„"-2^", waarvoor: /* = 5 en o = JA/I O = 1,58. Tabel 5.1. De binomiale verdeling P ( x = x) = C^-2r^^ en de best-passende normale verdeUng .2^(5, 1,58) (2) (5) • (6) (3) ! (4) (1) Bovengrens P{x = x) i ' ( * = *) 'T S - ^ PdT) = X interval Exact 1,58 = Pd'') Benaderd 10
+00
1,0000
9,5
2,84
0,9978
8,5
2,21
0,9864
7,5
1,58
0,9429
6,5
0,95
0,8289
5,5
0,32
0,6255
4,5
-0,32
0,3745
3,5
-0,95
0,1711
2.5
-1,58
0,0571
1.5
-2,21
0,0136
0,5
-2,84
0,0022
9 8 7 6 5 4 3 2 1 0
0,0022
0,0010
0,0114
0,0098
0,0435
0,0439
0,1140
0,1172
0,2034
0,2051
0,2510
0,2461
0,2034
0,2051
0,1140
0,1172
0,0435
0,0439
0,0114
0,0098
0,0022
0,0010
1.0000
1,0001
0,0000
109
5.4
NORMALE VERDELINGEN
0,3
\f
2,5
3,S
44
3,5
6,5
7,5
8,5
9,3
KLASSEGRENZEN
04
1
1,3
2
2,5
Figuur 5.10. Binomiale verdeling en best-passende normale verdeling. A - Kolommendiagram van de binomiale verdeling met P = ^ en n — 10. B - Best-passende normale verdeling: n = 5, a = 1,58. C - Vergroting van het linkerdeel van figuur A. Deze figuur demonstreert, dat de binomiale kans P{^ ^ 3) het best wordt benaderd door het oppervlak onder de bestpassende normale kromme te nemen t/a de bovengrens (x = 3^) van de klasse met ;ir = 3 als midden.
110
BINOMIALE EN BEST-PASSENDE NORMALE VERDELING
5.4
Deze berekening verloopt als volgt. De kans P{x = Xi) wordt het nauwkeurigst benaderd door het oppervlak onder de best-passende normale verdeling tussen de ordinaten op {Xi — i) en {Xi + J), behalve voor de bdde uiterste waarden van x, O en 10. Ilierbij wordt het oppervlak van — oo tot J, resp. van « — J = 9^ tot + oo genomen, omdat anders de som van de benaderende kansen idet gelijk aan 1 wordt (zie fig. 5.10). De intervalgrenzen (kolom 2) worden omgezet in waarden van T (kolom 3) en hiervan worden de linkse kansen met tabel A bepaald (kolom 4). De kansen van de intervallen (dat zijn: de benaderende kansen van de waarden van x) kunnen dan door aftrekking worden verkregen (kolom 5). Als wij deze benaderende kansen met de exacte kansen (kolom 6) vergeUjken, blijkt zelfs bij deze kleine n reeds een behoorüjke overeenstemming te bestaan (dechts in de staarten van de verdeüng komen relatief grote verschiUen voor). Als men van een waarde Xi van een binomiale verdeüng met P = J uitsluitend de linkse kans Pj:,{xj) = P { x ^ Xi) behoeft te weten, kan deze bij benadering worden bepaald door te berekenen
en de ünkse kans van Ti in tabd A op te zoeken. De rechtse kans van een waarde X2, Pje(«2) = P{x > «2), kan bij benadering worden bepaald door de rechtse kans van (57)
r
^'-^-^^
uit tabel A af te lezen. Dè 'correctie' van + J of — J, die wordt aangebracht om de discrete binomiale Verdeüng nauwkeuriger te benaderen met de continue normale verdeüng (zie nogmaals figuur 5.10c), noemt men een continuïteitscorrectie. Voorbeeld 5.10. Men verricht 30 worpen met een zuiver geldstuk. Hoe groot is de kans, dat ten hoogste 8 maal de uitkomst 'kruis' verschijnt? De binomiale verdeUng, die benaderd wordt luidt: P{x = AT) = € , ^ . 2 - ^ , zodat/*j, = ^ = 15 en <*j5 = ^ n = 2,734. Gevraagd wordt naar de kans P{x < 8) = Pz,(8), zodat volgens (5.6) : 8 + i _ 15
lii
5.4
N O R M A L E VERDELINGEN
In tabel A vinden wij: P i , ( r = —2,38) = 0,0087. De gevraagde kans is dus bij benadering hieraan geUjk (deze benadering is zeer goed, daar de exacte kans 0,0081 büjkt t e bedragen). Zonder continuïteitscorrectie vindt men: T = (8 — 15)/2,734 = — 2,56, met een overschrijdingskans die veel te klein is, nl. 0,00521 5.4.2. BINOMIALE VERDELINGEN MET P 9e J
Zoals wij in 5.1 gezien hebben, nadert ook in dit geval een binomiale verdeUng bij toenemende n tot een normale verdeüng en wel des te sneUer, naarmate P dichter bij ^ ligt. Voor enkele waarden van P vermdden wij onderstaand de Meinste waarden van n, waarbij de normale benadering zonder bezwaar kan worden toegepast (uit COCHRAN (51) ; naar onze mening zijn deze «'s wat aan de hoge kant) : p n
0,5 30
0,4 50
0,3 80
0.2 200
0,1 600
0,05 1400
Linkse, resp. rechtse kansen kan men dan bij benadering bepalen via de standaardnormaal verdeelde grootheid ,r. ^^
^
(5.8)
r =
X — Pn
y/PQn
waarbij de contimüteitscorrectie als in (5,6), resp. (5.7), kan worden aangebracht. Voorbeeld
5.11. Van een binomiale verdeling is gegeven: P = 0,4, w = 30 (« is dus kleiner dan de 'norm' voor het toepassen van de normale benadering). Men wü bepalen P R ( 1 6 ) = P ( ^ ^ 16). Uit (5.8) volgt: ^_16-i-(0,4)(30)
^ ^ ^ ^
V(0.4) (0,6) (30) Uit tabel A blijkt, dat P R { T = 1,305) ongeveer geUjk is aan 0,0960 [PÄ(1,30) = 0,0968, P R ( 1 , 3 1 ) = 0,0951, tussen deze waarden kan men zonder bezwaar lineair interpoleren]. Deze kans bUjkt goed overeen te stemmen met de exact berekende kans. die 0,0971 bedraagt. 5.4.3. OPGAVEN 5.10. Bepaal bij de binomiale verdeling met P = 0,4 en n = 20 de best-passende normale verdeUng. VergeUjk deze met de exacte verdeling in tabel 4.3. 5.11. Men werpt 500 maal met een zuiver geldstuk. Hoe groot is de kans, d a t : a. Ten hoogste 220 keer 'munt' wordt geworpen? b. Ten hoogste 220 of ten minste 280 keer 'munt' wordt waargenomen? 5.12. Men trekt een aselecte steekproef van 100 elementen uit een populatie van grote omvang, waarvan 30o/o der elementen kenmerk A draagt. Hoe groot is bij benadering de kans, dat deze steekproef:
112
5.5
BEST-PASSENDE NORMALE VERDELINGEN a. Minder dan 21 elementen met kenmerk A bevat? b. Meer dan 42 elementen met kenmerk A bevat? c. Ten minste 25 en ten hoogste 35 elemen4:en met kenmerk A bevat?
5,5. Best-passende normale verdelingen 5.5.1. BEREKENING VAN DE BEST-PASSENDE NORMALE VERDELING
Als men beschikt over een waargenomen frequentieverdeUng van een grootheid x en vermoedt, dat deze (ongeveer) normaal verdeeld is, kan men de best-passende normale verdeling (met /i = x en a — Sg) berekenen en deze met de waargenomen verddhig vergeUjken. Voorbeeld 5.12. I n tabel 5.2 is hiervan een voorbeeld gegeven, dat voor zichzelf spreekt (de verdeling is ontleend aan voorbeeld 1.18; hier wordt echter ondersteld, dat de 190 uitkomsten een steekproef betrefEen). De overeenstemming tussen de waargenomen en best-passende normale verdeling kan worden onderzocht met de ;i;'-toets voor aanpassing in 10.1. Tabel 5.2. Waargenomen verdeling en best-passende normale verdeUng Gesteld is:/i = x = 13,40, a = s = 0,95
(1)
(2)
Klassegrenzen
ƒ
15,75-16,25 15,25-15,75 14,75-15,25 14,25-14,75 13,75-14,25 13,25-13,75 12,75-13,25 12,25-12,75 11,75-12,25 11,25-11,75 10,75-11,25 10,25-10,75
2 3 11 19 26 46 38 24 15 4 1 1
(3)
(5)
(4)
Bovengrens „ g-13,4 PdT) g ~ 0,95
+ 00 15,75 15,25 14,75 14,25 13.75 13.25 12.75 12.25 11.75 11.25 10,75
2,47 1,95 1.42 0,89 0,37 -0,16 -0,68 -1.21 -1.74 -2.26 -2.79
1,0000 0,9932 0,9744 0,9222 0,8133 0,6443 0,4634 0,2483 0,1131 0,0409 0,0119 0,0026
190
(6)
(7)
P ( * = *)
190 P
0,0068 0,0188 0,0522 0,1089 0,1690 0,1809 0.2151 0,1352 0,0722 0,0290 0,0093 0,0026
1.3 3.6 9.9 20.7 32,1 34,4 40,9 25,7 13,7
5,5 1.8 0.5 190.1
5.5.2. NORMAAL WAARSCHIJNLIJKHEIDSPAPIER
Dit spedale grafiekenpapier kan worden gebruikt, als men snel wü nagaan, of een waargenomen verdeUng ongeveer normaal verdeeld is. Blijkt dit het geval te zijn dan kan men - als het aantal waarnemingen niet te klein is - met behulp van dit papier ook het gemiddelde en de spreiding van de waargenomen verdeling schatten. Voor een uitvoerige beschrijving en gebruiksaanwijzing raadplege men: VEEN (31) of EXALTO (12).
113
5.6
NORMALE
VERDELINGEN
5.5.3. OPGAVEN 5.13. Bepaal bij onderstaande waaxgenomen frequentieverdeling de best-passende normale verdeUng. Gegeven: ^ = 44,11, s = 2,64.
* ƒ
51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 |Totaal 1 8 4 19 33 31 49 47 51 28 26 18 7 4 0 1 | 327
5.14. Als opgave 5.13, voor onderstaande verdeling van de geboortegewichten (in hg) van 9651 pasgeboren jongens (gegevens uit de cursus 'Summarizing experimental data', Columbia University). Gegeven is : .* = 34,47, s = 6,32. X I g-8 »12 13-16 17-20 21-2* 25-28 29-32 35-36 37-4Ó 41-44 4^-48 49-^2 53^6 57-60 61-64 ƒ I S 39 98 136 285 897 2240 2727 2051 770 310 73 17 2 1
| |
Tötäia 9651
5.6. Karakterisering van een frequentieverdeUng De frequentieverdeling van een groothdd geeft een gedetaiUeerde beschrijving, terwijl men soms behoefte heeft aan een beknopte karakterisering van de verdeling. Hiertoe kan men gebruik maken van de in 2.3 beschreven gemiddelden en spreidingsmaten, mits men zich bewust is van hun eigenschappen en van het verües aan informatie, dat bij deze reductie optreedt. In deze paragraaf bespreken wij eerst enkele veel voorkomende typen van frequentieverdeUngen en daarna het gebruik van gemiddelden en spreidingsmaten voor hun beschrijving. 5.6.1. ENKELE VERDELINGSTYPEN
Als men een niet te klein aantal waarnemingen beschouwt, büjkt het merendeel van de grootheden, die op medisch-biologisch gebied worden waargenomen, een ééntoppige verdeUng te bezitten. Deze vertoont één klasse waarvan de frequentie hoger is dan die der andere klassen, de zg. modale klasse. Aan weerszijden zijn de frequenties lager, naarmate de klassen verder van de modale klasse verwijderd liggen. Sommige ééntoppige verdeUngen zijn ongeveer symmetrisch t.o.v. de modale klasse, terwijl zij veel op een normale verdeling gelijken: men spreekt dan van pseudo-normale verdeUngen. Een voorbeeld hiervan vormen de verdeUngen van de Uchaamslengten van drie groepen jongens in tabel 5.3, waarvan in figuur 5.11 de relatieve frequentiepolygonen zijn getekend. Men bedenke echter, dat niet aUe ééntoppige en vrijwd S3mimetrische verdelingen pseudo-normaal zijn. Zij kunnen ook te 'spits' zijn, met een te grote concentratie bij het centrum (leptokurtose), ofwel te 'vlak' met te hoge frequenties in de staarten (platykurtose). 114
5.6
KARAKTERISERING VAN EEN FREQUENTIEVERDELING
Tabel 5.3. Pseudo-normale frequentieverdelingen: Lichaamslengten van jongens in cm A B C Lengte in
cm X
151 148 145 142 139 136 133 130 127 124 121 118 115 112 109 106 Totaal X
H
f/n
ƒ 2 3 17 38 87 132 171 173 135 80 40 17 4 1 900
0,2 0,3 1.9 4,2 9,7 14,7 19,0 19,2 15.0
8,9 4,4 1.9 0.4 0.1 99,9
12.5,5 (S), 1 0
fin
f
1 2 7 68 184 298 277 154 79 20 5 1 1096
0,1 0,2 0,6 6,2 16,8 27,2 25,3 14,1
7,2 1,8 0,4 0,1 100,0
125,4 t,41
f 1 2 13 32 60 121 134 130 109 62 35 15 4 2 720
f/n 0,1 0,3 1.8 4,4 8.3 16,8 18,6 18,1 15.1
8.6 4,9 2,1 0,6 0.3 100,0 131,4 6,17
Bij andere ééntoppige verdelingen nemen de frequenties aan de hoge (d.i. grafisch gezien aan de rechter) zijde van de top langzamer af dan aan de lage (linker) zijde. Wij hebben hiervan bij de binomiale verdelingen reeds voorbeelden gezien en men spreekt dan van scheefheid naar rechts (of: podtieve scheeflidd). Het tegengestelde geval, scheeflieid naar links, büjkt in de natuur minder vaak voor te komen. Het overheersen van scheefheid naar rechts is begrijpelijk als men bedenkt, dat vele grootheden (zoals: bezinkingssnelheid der erythroc37ten, vitamine A in serum, vitamine C in urine) geen negatieve waarden kunnen aannemen, omdat het getal nul een natuurlijke grens naar ünks vormt. De scheeflieid naar rechts kan overigens ook een andere oorzaak hebben. Onderstel bv., dat men over een groot aantal knikkers beschikt, waarvan de diameter (in mm) bij benadering normaal verdeeld is. Het oppervlak, het volume en het gewicht van deze knikkers zijn dan scheef naar rechts verdedd. Wat is nu de oorzaak, dat men in de natuur zoveel ééntoppige verdeUngen aantreft? Beschouwt men de wijze waarop, de waarde van een bepaalde grootheid bij een element van een populatie tot stand gekomen is, dan blijkt dat meestal een klein aantaJ algemene factoren is opgetreden, die elk element op dezelfde wijze heeft beïnvloed. Zouden deze aUeen aanwezig zijn geweest, dan zouden zij tot dezelfde waarde voor 115
5.6
NORMALE VERDELINGEN
lenate in cm.
Figuur S.U. Drie pseudo-normale verdelingen: A : n = 900, jl = 125,5, s = 6,10; B : n = 1096, x = 125,4, s = 4.41 ; C : n = 720, * = 131.4. s = 6.17.
aUe dementen geleid hebben. Naast deze algemene factoren treedt echter meestal een (groot) aantal andere factoren op, die - althans ten dele - onafliankeüjk zijn en die nid op aUe elementen op dezelfde wijze inwerken. .Al naar gelang van de omstandigheden zal d k van deze factoren het resultaat van de algemene factoren kunnen verlagen, resp. verhogen. Het zal dechts zelden voorkomen, dat zij alle in dezdfde richting werken : gewoonüjk zuUen sommige een negatieve, andere een positieve invloed uitoefenen, zodat het totale effect van deze niet-algemene factoren in de regel klein en vrij zdden groot zal zijn. Bestaat een populatie uit een groot aantal elementen, dan zal men er dus vrij veel aantreffen met een waarde, die in de buurt Ugt van de uitkomst die alleen door de algemene factoren tot stand komt en daar zal' zich dan de top van de frequentieverdeling bevinden. Hoe verder men zich van deze top verwijdert, des te kleiner zal dan het aantal waarnemingen zijn. Het voorgaande verklaart ook, hoe een bv. tweetoppige verdeling kan optreden. Dit zal gebeuren, als niet aUe elementen van de populatie aan dezelfde algemene factoren onderhevig zijn. De uitkomsten concentreren zich dan om twee waarden en als deze niet te dicht bijeen üg116
KARAKTERISERING VAN EEN FREQUENTIEVERDELING
5.6
gen, zuUen zich twee toppen vormen. Slaagt men erin, de bdde soorten elementen van elkaar te onderscheiden, zodat de heterogeniteit in het materiaal wordt opgeheven, dan vindt men twee deelpopulaties, die zdf ééntoppige verdeUngen zuUen vertonen. 5.6.2. KARAKTERISERING VAN PSEUDO-NORMALE VERDELINGEN
Als men van een normaal verdeelde grootheid het gemiddelde en de sprdding kent, is haar verdding voUedig gespecificeerd. Bij een pseudonormale verdeling gaat echter bij reductie tot Jê en s iets verloren, nl. informatie omtrent de optredende afwijkingen van de normaalvorm. Zijn deze afwijkingen klein, dan is ook dit verUes klein en dus praktisch van wdnig betekenis. Het gemiddelde en de spreiding kunnen dan de verdeüng bevredigend beschrijven, daar ongeveer geldt (zie 5.3.3) : het interval * ± s bevat 67*/o van de waarnemingen, het interval x ± 2 s bevat 95"/o van de waarnemingen, het interval x ± 2,6s bevat 99'/o van de waarnemingen, het interval x ± 3,2s bevat (vrijwel) aUe waarnemingen. Voorbeelden 5.13. Zie verdeUng .4, tabel 5.3. Het interval;? :J; 3,2s, d.i. het interval van 125,5 - (3.2) (6,10) = 106 tot 125,5 + (3,2) (6,10) = 145, büjkt inderdaad aUe waarnemingen te omvatten. 5.14. Voor verdeUng C in tabel 5.3 zou het interval 131,4 ± 2(6,17), d.i. van 119 tot 144, 95''/o der waarnemingen moeten omvatten. Het bUjkt, dat 683 van jl de 720 waarnemingen, d.i. 94.9''/o, ia bet interval 119,5 t/m 143,5 Uggen.
De karakterisering van pseudo-normale verdeUngen door middel van hun gemidddden en spreidingen verschaft direct een overzicht van de belangrijke verschiUen tussen deze verdeUngen.^ Beschouw nogmaals de verdelingen in tabel 5.3. De verdeUngen A en B bezitten vrijwel hetzdfde gemiddelde, maar het gemiddelde van verdeUng C is duidelijk (ca. 6 cm) hoger. De verdeUngen A e n C hebben ongeveer dezelfde spreiding, maar verdeüng B vertoont een aanzienlijk kleinere variabüitdt. 5.6.3. TRANSFORMATIES TOT PSEUDO-NORMALITEIT
Vele naar rechts scheve verdelingen worden door een transformatie van het pseudo-normale t3T)e. Twee veel toegepaste transformaties zijn de: logarithmische transformatie : y = log x, de vierkantswortd transformatie: y = y/x. * Bij het vergeUjken van steekproefgemiddelden en -spreidingen dient men zich te realiseren, dat de geconstateerde verschillen wel louter toevallig kunnen zijn. Methoden om hypothesen betrefiende populatiegemiddelden en -spreidingen te toetsen op basis van aselecte steekproeven, resp. om deze verschillen te schatten, behandelen wij in deel C van dit boek.
117
5.6
NORMALE VERDELINGEN
De logarithmische transformatie kan worden toegepast als de verdeüng van een grootheid x duideüjk scheef naar rechts is en als het interval, waarin de waarden van x liggen groot is t.o.v. de afstand van hun gemiddelde tot het nulpunt van de verdeling. Dit blijkt uit de getaUenreeksen in tabel 5.4. De oorspronkeUjke getallen Uggen zowel bij A als B aequidistant. Bij A nemen de afstanden tussen him logarithmen sterk af, bij ß is de afiieming dechts gering. Tabel 5.4.
A
B
Twee getallenreeksen met hun logarithmen en de verschiUen tussen deze logarithmen
GetaUen [x)garithmen Verschillen Getallen Logarithmen VerschiUen
1 2 3 4 5 6 0,000 0.301 0,477 0.602 0.699 0.778 0.301 0.176 0,125 0.097 0,079 101 102 103 104 105 106 2,0043 2,0086 2,0128 2,0170 2,0212 2,0253 0,0043 0,0042 0,0042 0,0042 0,0041
Een indicatie tegen het nemen van logarithmen is het (mogeüjk) voorkomen van de waarde 0. Men kan dan echter een kunstgreep toepassen door te nemen: y = log {x -\- 1). Voorbeeld 5.15. De verdeUng van de bezinkingssnelheid der erythrocyten in opgave 2.2 is uitgesproken scheef naar rechts. Als men echter van elke waarneming de logarithme neemt en de frequentieverdeling van deze logarithmen opstelt, ontstaat de volgende pseudo-normale verdeling: log a;|0,15t/aO,4g| Ó,45tyaÖ,60| Ó,6Ót/a6.7g| Ù,»5t/a0.^| 0,90t/al,05|l,fl5tyal,SO|l,20t/al,35|1.35t/al,50|l,50t/al,6S ƒ I 2 1 5 I 8 I 12 I 15 I 12 I 7 | 6 | 1
Als de logarithmische transformatie niet tot het gewenste resultaat (i.e. een pseudo-normale verdeüng) leidt, kan de vierkantswortd transformatie soms uitkomst brengen. Als x = O en/of kleine waarden van X optreden, kan men nemen: y = Vx-\-\. 5.6.4. KARAKTERISERING VAN ANDERE VERDELINGSTYPEN
In 5.6.2, hebben wij gezien, hoe een (pseudo)normale verdeUng door het gemiddelde en de spreiding kan worden beschreven. Voor verdelingen van een ander type kan men echter via het gemiddelde en de spreiding ook tot een zekere - zij het zeer onscherpe - uitspraak komen en wel met de ongelijkheid van TCHEBYCHEFF, die luidt: buiten het interval /t ± Äff (^ > 1) Ugt ten hoogste een fractie \/k^ van de waarnemingen. Zo ügt dus altijd, onafhankelijk van de vorm van de verdeüng, buiten het interval ;* ± 2ff ten hoogste een fractie {\)^ = 0,25 van de waarnemingen en buiten het interval /* ± 3ff ten hoogste een fractie 118
KARAKTERISERING VAN EEN FREQUENTIEVERDELING
5.6
(1/3)* = 1/9 van de waarnemingen. Ten hoogste-want de werkelijk buiten deze grenzen liggende fractie kan v e d kleiner zijn. Indien een verdeüng ééntoppig en symmetrisch is g d d t de ongehjkheid van CAMP en MEIDELL, die inhoudt dat buiten het interval / i ^ k o t e n hoogste een fractie {2/3k) * van de waarnemingen Ugt. In dit geval ügt bv. buiten het interval ^ ± 2ff ten hoogste (^/g)« der waarnemingen en deze ongeUjkheid blijkt dus reeds aanzienlijk scherper te zijn dan die van TCHEBYCHEFF. B d d e ongeUjkheden zijn voomameUjk van theoretisch belang. Als een verdeling niet-normaal is, kan men deze met een gemidddde en een spreidingsmaat dechts zeer onvoUedig en dus onbevredigend karakteriseren. Bij ééntoppige scheve verdelingen kan men dan voor het vergelijken van de scheeflidd één van de daartoe beschikbare maatstaven gebruiken. Deze worden uitvoerig behandeld door Y U L E & K E N D A L L (39). Soms kan men niet-normale verdeUngen redeUjk beschrijven, door een aantal fractielen (bv. x^i^, Xo,is, «0.50. «0.78 en Xo,m) op te geven. Deze zeggen iets omtrent centrale tendentie èn variabiUteit. Gewoonüjk kan men dan beter de gehele verdeüng geven, zodat ieder zelf het karakter van de verdeling kan beoordelen. Het yermdden van één gemiddelde en één spreidingsmaat kan in dergeUjke gevaUen zeer mideidend zijn. H U F F (20) geeft hiervan een groot aantal voorbeelden.
119
HOOFDSTUK 6.
BEGINSELEN DER TOETSINGSTHEORIE De statistische toetsingstheorie, in 1933 ontwikkeld door J. NEYMAN en E. S. PEARSON (27, 26), houdt zich bezig met het toetsen van onderstdliugen (die hypothesen worden genoemd) omtrent niet geheel bekende populatieverddingen, op bads van aselecte steekproeven. In 6.1 zullen wij de prindpes van deze theorie aan de hand van een eenvoudig besÜssingsprobleem betreffende een dichotoom verdeelde populatie uiteenzetten. In de paragrafen 6.2 en 6.3 bespreken wij vervolgens de praktische uitvoering van de zg. binomiale toetsen betreffende een dichotomie. Tendotte volgt in 6.4 een korte beschouwing over de door WALD en zijn medewerkers gedurende de tweede wereldoorlog ontwikkelde techniek van de sequente toetsing. 6.1. Grondslagen van de toetsingstheorie 6.1. l. PROBLEEMSTELLING ^
Een arts A wordt door de Nederlandse regering uitgezonden naar Nieuw-Guinea, teneinde het voorkomen van framboesia in een bepaalde streek aldaar te bestuderen. In de ontvangen rapporten van gouvernementsambtenaren wordt vermdd, dat in deze vrij afgelegen streek ongeveer 50% van de bevolking aan manifeste huidafwijkingen tengevolge van framboeda lijdt. Een gouvemementsarts, die echter slechts een klein deel van de streek heeft bezocht, spreekt van ten hoogste 20%. Indien het percentage framboedaüjders inderdaad ongeveer 50% is, wü de regering op korte termijn aan een uitgebrdd saneringsprogramma voor deze streek preferentie geven boven andere projecten van openbare gezondheidszorg. Bedraagt het 20% of minder, dan komt zo'n programma voorlopig niet voor uitvoering in aanmerking. Bij aankomst in Nieuw-Guinea besluit A een aselecte steekproef uit de bevolking van de streek te trekken, de daarin opgenomen personen '^ Het werkelijke probleem is, om het als voorbeeld te kunnen gebruiken, uiteraard sterk vereenvoudigd. In de eerste plaats kan men zich afvragen, hóe de aselecte steekproef tot stand kan komen. Verder zal men in werkeUjkheid een veel grotere steekproef gebruiken: de kleine steekproefomvang is gekozen, om het probleem nog eenvoudig exact te kunnen oplossen.
120
GRONDSLAGEN
6.1
te onderzoeken en zijn conclusie te baseren op het aantal framboedaüjders, dat zich daarbij bevindt. Onderstel, dat deze steekproef 20 personen telt en dat zich hieronder 8 lijders bevinden. Tot wdke condusie komt hij ? 6.1.2. TERMEN EN BEGRIPPEN
Omtrent het voorkomen van framboeda bij de bevolking van de betrokken streek zijn twee hypothesen naar voren gebracht : Ho'. P = 0,5 (50% van de bevolking üjdt aan framboeda). Hl : P = 0,2 (20% van de bevolking üjdt aan framboesia). De indices O en l zijn aan deze h5rpothesen (sjmibool H )niet wiUekeurig toegekend. H^ noemt men de te todsen hypothese of nulhypothese, Hi de alternatieve hypothese of tegenhypothese. Om redenen, die wij later bespreken kiest men — zo mogdijk — als HQ die h3^othese, waarvan het ten onrechte verwerpen de ernstigste consequenties heeft. H3^othesen van dit type, waarin één waarde van P wordt gestipuleerd noemt men enkelvoudige hypothesen. Hypothesen van de vorm P < 0,2, P > 0,5, e.d., die dus samengestdd zijn uit een groot aantal waarden van P noemt men samengestelde hypothesen. Een statistisch onderzoek naar de juistheid van een hypothese wordt een todsing genoemd. Een methode waarmee een toetdng wordt uitgevoerd noemt men een toets. Elke toetdng wordt gebaseerd op een asdecte steekproef. De steekproeffunctie, waarvan gebruik wordt gemaakt bij het uitvoeren van een toetsing noemt men de toetsingsgrootheid. 6.1.3. DE VERDELINGEN VAN DE TOETSINGSGROOTHEID ONDER H^ EN H i
Bij het framboeda-probleem kiezen wij als toetsingsgrootheid vanzdfsprekend het aantal Ujders in de steekproef, x. Bij n = 20 kan de grootheid x de waarden O, 1,2, . . . , 20 aannemen : deze verzameling der mogdijke uitkomsten noemt men de steekproefruimte. Als Hg juist is (men zegt hiervoor kortweg: onder H^) volgt de grootheid X de binomiale verdeling (zie 4.3.1) : (6.1)
20' p(, = , , Ä . ) ^ _ _ _ _ . 2 - .
Onder Hi volgt de grootheid x de binomiale verdeling: (6.2)
20' P{x = x\ Hl) = ^ ^ i p ö Z I l ^ (0,2)»(0,8)«o-«.
Deze twee binomiale verddingen zijn in tabd 6.1 opgenomen. 121
6.1
TOETSINGSTHEORIE Tabel 6.1, KansverdeUngen van de grootheid se, het aantal framboesiaUjders in een aselecte steekproef van 20 personen *
H„: P = 0,5 H i : P == 0.2 Steekproefruimte X
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
P{x = x \ Ho)
P(x = x \ Hl)
0,0000 0,0000 0,0002 0,0011 0,0046 0,0148 0.0370 0,0739 0,1201 0,1602 0,1762 0,1602 0,1201 0,0739 0,0370 0.0148 0.0046 0.0011 0.0002 0.0000 0.0000
0.0000 0,0000 0.0000 0.0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0020 0,0074 0.0222 0.0545 0.1091 0.1746 0.2182 0.2054 0.1369 0.0576 0,0115
* Kansen in vier decimalen nauwkeurig. 6.1.4. HET OPSTELLEN VAN EEN BESLISSINGSSCHEMA
6.1.4.1. Kritieke zone. Op grond van de kansverdelingen in tabel 6.1 kan men nu overgaan tot het opsteUen van een beslissingsschema, waarin voor iedere waarde van x (of: voor ieder punt van de steekproefruimte) wordt aangegeven, welke besüsdng wordt genomen. Daartoe dient de steekproefruimte in twee delen gesplitst te worden: 1. Een verzameling punten (waarden van x), waarvoor Hg wordt verworpen ten gunste van .ffj . Men noemt deze verzameling de kritieke zone van de toets en gebruikt hiervoor het symbool Z. 2. De complementaire verzamding van punten, waarvoor H^ niet wordt verworpen (dus: ff^ wordt verworpen). ledere waarde van x kan zowel onder HQ als onder Hi voorkomen, maar in het algemeen zullen de kansen van een bepaalde waarde onder HQ en onder Hi verschülen. Zo zien wij bv. in tabd 6.1, dat : P{x = 5\Ho) = 0,0148 en P(5 I ffi) =0,1746, P ( x = n \ Ho) = 0,1602 en P(l 1 I Hi) = 0,0005. Dit feit wijst de richting, die men bij het opsteUen van een besüssings122
GRONDSLAGEN
6.1
schema in principe kan inslaan. Waarden van x met een kldne kans onder ff^ en een grote kans onder ffi plaatst men in de kritieke zone (zij leiden dan tot het verwerpen vanffo). Waarden van x met een grote kans onderffo en een kleine kans onder ff i vallen dan buiten deze zone (zodat zij tot het niet-verwerpen vanffo leiden). 6.1.4.2. Plaats van de kritieke zone. Bij het framboesia-probleem is ^1 < P« (onder ffi is de fractie Ujders in de populatie 0,2, onder ffo 0,5). Men zal daarom aUeen geneigd zijn tot het verwerpen vanffoten gunste van ffi, indien het in de steekproef waargenomen aantal lijders laag is, dus voor x = 0, 1,2, tot een zekere waarde. De kritieke zone wordt in zo'n geval dus uitsluitend uit lage (d.i. grafisch gezien: links gelegen) waarden van x opgebouwd. Men spreekt dan van een éénzijdige linker kritieke zone en van links éénzijdige toetsing. De bovengrens van deze linkerzone, xt, noemt men de kritieke waarde van deze zone (zie figuur 6.1). u
u . *>
I 0
I
öS
1 I i ZL r Û X^ \—^y—A Ho verwerpen
/
p
T^Ö^ / /
/ ^
j
mogelijkheden waartussen beslist moet worden
I
I
I I
I I
Tl 10 •
.
Ho niet verwerpen
Trt 20 X 1
criterium yoorde beslissing beslissing
Figuur 6.1. BesUssingsschema bij links éénzijdige toetsing: H ^ : P = 0,5, H ^ : P = 0,2, » = 20 (naar HEMELRIJK & VAN ELTEREN (93)).
Indien Pi > Po is (bv. als de te toetsen hypothese luidt H^ : P = 0,4 met als alternatief ffi : P = 0,8) zal men ffo uitsluitend willen verwerpen voor hoge waarden van x, dus voor x = n , n — l, tot een zekere waarde XR. Dan wordt een rechter kritieke zone gekozen en rechts éénzijdig getoetst. Als de te toetsen hs^othese luidt ff o : P = Po met als alternatief H i ' . P ^ P o (bv.ffo : P = 0,5,ffi : P 7^ 0,5) zal men tot verwerpen van ffo overgaan, voor lage èn voor hoge waarden van x. De kritieke zone bestaat dan uit een linker èn een rechter ded : Z = Z L - \ - ZR en men voert dus een tweezijdige toetsing uit. 123
6.1
TOETSINGSTHEORIE
6.1.4.3. Fouten bij de toetsing van hypothesen. Bij het toetsen van de hypothese ffo met als alternatief de hypothese ffj kunnen de volgende situaties optreden: I. II. III. IV.
ffo ffj ffo ffi
is juist is juist is juist is juist
-^ de beslissing luidt: ffo verwerpen. — de besüssing luidt: ff^ verwerpen. — de beslissing luidt: ffo niet verwerpen. — de beslissing luidt: ff^ niet verwerpen.
Tabel 6.2. Vier situaties bij het nemen van een beslissing Juist is de hypothese De beslissing luidt: ffj niet verwerpen = Hl verwerpen Hg verwerpen = Hl niet verwerpen
ïTo juiste beslissing FoutI
Hl
Fout I I juiste besUssing
Deze vier situaties zijn in tabd 6,2 weergegeven. In twee gevallen komt men tot een juiste uitspraak, in de twee andere tot een foutieve. De consequenties van de fout die men maakt door ffo ten onrechte te verwerpen (fout I) zijn echter in het algemeen niet geUjkwaardig aan de consequenties van het ten onrechte verwerpen van ffj (fout II). Dit blijkt uit de volgende voorbeelden. Voorbeelden 6.1.
Iemand staat terecht wegens moord. De rechtbank doet uitspraak; hierbij kunnen de volgende situaties optreden: De beslissing van de rechtbank is: Onschuldig Schuldig
De beklaagde is Onschuldig Schuldig Juist Fout I
1
Fout I I Juist
Welke van deze fouten acht ons rechtssysteem het ernstigst en waarom ? 6.2.
124
Beschouw het framboesia-probleem. Hierbij hebben wij als H^ gekozen: P = 0,5. Het maken van fout I houdt hier dus in, dat ten onrechte wordt geconcludeerd, dat (ongeveer) 20% van de bevolking £ian framboesia Üjdt. Als A dit rapporteert, zal het saneringsprogramma althans voorlopig achterwege bUjven. De werkeUjk ernstige framboesia in de streek wordt dus niet bestreden en de betrokken bevolking ondervindt hiervan de nadeUge gevolgen. Bij het maken van fout I I wordt ten onrechte geconcludeerd, dat (ongeveer) 50% van de bevolking aan framboesia Ujdt. Het rapport van A zal in dit geval leiden tot uitvoering van het hulpprogramma. Het feit, dat de kwaal minder ernstig bUjkt dan men heeft verwacht, is o.i. niet zo ernstig. De sanering zal minder tijd vergen dan begroot was, maar men zal het beschikbare medische personeel etc. welUcht bij een ander
GRONDSLAGEN
6.1
project kunnen inzetten-en de consequenties van deze fout zuUen vnl. op materieel terrein Uggen.
Fout I noemt men een fout van de eerste soort en deze wordt gemaakt, als de te toetsen hypothese ffo ten onrechte wordt verworpen. De grootte van de kans op deze fout, behorend bij een bepaalde kritieke zone, wordt aangeduid met az. Fout II noemt men een fout van de tweede soort en deze fout wordt gemaakt, als de alternatieve hypothese ffi ten onrechte wordt verworpen. De grootte van de kans op deze fout, behorend bij een bepaalde kritieke zone, wordt aangeduid met ßz. De kans, dat ff, wordt verworpen als ffi juist is, bedraagt 1 — ßzen wordt het onderscheidingsvermogen van de toets genoemd. Deze drie begrippen worden in het volgende punt aan de hand van het framboesia-voorbeeld toegelicht. 6.1.4.4. Omvang van de kritieke zone. Wij hebben reeds gezien dat de plaats van de kritieke zone wordt bepaald door de tegenhypothese. Om nog even te recapituleren: toetst men de hypothese ff o : P = Po, dan kiest men: P < Po — een linker kritieke zone {x = 0, 1,2, . . . , x ^ , n), bij ff. P > Pg — een rechter kritieke zone {X=XR, XB-{- 1, P ^ PQ — een tweezijdige kritieke zone, bestaande uit een linker- en een rechterded. Bij het framboesia-probleem dient dus een linker kritieke zone te worden gekozen. Om nu te kuimen uitmaken, welke waarden van x in deze zone dienen te worden geplaatst, hebben wij in tabel 6.4 de waarden van az, ß z e n l — ßz opgenomen, die bij verschiUende linker kritieke zones bdioren. Tabel 6.3 laat voor de kritieke zone x = O, 1, . . . , 6 zien, hoe wij aan deze waarden gekomen zijn. Uit tabel 6.3 büjkt, dat: az = de kans op een fout van de eerste soort = de kans, dat de grootheid x een tot ZL behorende waarde aanneemt, indien ffo juist is. ßz = de kans op een fout van de tweede soort = de kans, dat de grootheid x een niet tot ZL behorende waarde aanneemt, indien ff, juist is. 1 — ßz = het onderscheidingsvermogen = de kans, dat de grootheid x een tot ZL behorende waarde aanneemt, indien ff, juist is. Tabel 6,4 toont aan, dat bij een bepaalde steekproefomvang (in dit geval: n = 20) ßz toeneemt, naarmate az kleiner wordt, en omgekeerd. Men kan dus de kritieke zone wd zodanig kiezen, dat az zeer 125
6.1
TOETSINGSTHEORIE Tabel 6.3. Bepaling van az en ßz voor de kritieke zone x = O, 1, . . , , 6. Kansverdelingen uit tabel 6.1, H^ : P = 0,5, H i : P = 0,2, « = 20
1 steekpr. ruimte 20 19 18 17 16 15 14 13 12 11 10 9 8 7 XL= 6 Linker 5 kritieke 4 zone 3 2 1 0 Totaal
* = = = = = = = = = =
P ^ = x\Ho) 0,0000 0,0000 0,0002 0,0011 0,0046 0,0148 0,0370 0,0739 0,1201 0,1602 0,1762 0,1602 0,1201 0,0739 0,03701 0,0148 0,0046 az = 0,0577 0,0011 Fout I 0.0002 0.0000
o.ooooj 1,0000
P(x = x \ Hl) 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 ßz = 0,0867 0,0000 Fout I I 0,0000 0,0001 0,0005 0,0020 0,0074 0,0222 0,0545 0,10911 0,1746 1 - j8z = 0,9133 0,2182 Onderscheidings0,2054 vermogen 0,1369 0,0576 0,0115j 1,0000
Tabel 6.4. Waarden van az, ßz en ï — ßz voor verschiUende linker kritieke zones H o : P = 0,5 Hl : P = 0,2 « = 20 Ondersch. Fout I I FoutI uit az = P{x in Z L \ Ho) ßz = P(x buiten Z L j Hi) l-ßz 0 0,9885 0,0115 0,0000 0 en 1 0,0000 0,9309 0,0691 0, 1. 2 0,0002 0.7940 0,2060 0.1. ..3 0,5886 0,4114 0,0013 0. 1. . . 4 0,0059 0,3704 0,6296 0,1, .,5 0,0207 0,1958 0,8042 0,1, .,6 0,0577 0.0867 0,9133 0, 1, ., 7 0,1316 0.0322 0,9678 0, 1, . , 8 0,2517 0,0100 0,9900 0, 1, . , 9 0,4119 0,0026 0,9974
klein is, maar dan doet zich het onbevredigende fdt voor dat ßz groot is, zodat de ontworpen toets een te gering onderscheidingsvermogen bezit. D.w.z.: men heeft dechts een kleine kans om de alternatieve hj^pothese ff,, indien deze juist is, als zodanig te erkennen. Bij de keuze van de omvang van de kritieke zone zal men t.a.v. de waarden van az en ßz dus tot een compromis moeten komen. Bij het onderhavige probleem kan dit worden bereikt door de in tabel 6.3 weergegeven zone te 126
GRONDSLAGEN
6.1
kiezen. Hiervoor is oz = 0,0577 en ßz = 0,0867. De kans op het ten onrechte verwerpen van ffo (de fout met de ernstigste consequenties) is dan wat kldner dan de kans op het ten onrechte verwerpen van ff^, terwijl beide kansen — gezien de betrekkeUjk kleine steekproefomvang — nog redeüjk klein zijn. Wil men de eerstgenoemde kans nog verkleinen, dan kieze men de zone x = 0 t/m 5, met az = 0,0207; maar dan is ßz = 0,1958 en dus aanzienUjk groter. 6.1.4.5. H d beslissingsschema. Voor het framboesia-probleem komen wij dus, op grond van de voorgaande overwegingen, tot het volgende bedissmgsschema (zie figuur 6.2) : 1. Verwerp ff,, indien de waargenomen .waarde van x {Xo = het aantal lijders in de steekproef) in de kritieke zone « ' = O, 1, . . . , 6 ügt. Indien men besluit tot het verwerpen van ffo, bedraagt de kans, dat dit ten onrechte geschiedt ten hoogste 0,0577. 2. Verwerp ffo niet indien x^ buiten de kritieke zone ügt. Het niet verwerpen van ffo houdt het verwerpen van ff^ in. Komt men tot deze uitspraak, dan is de kans dat zij fout is ten hoogste geüjk aan 0,0867. Het waargenomen aantal framboesiaUjders bedraagt Xo = 8 (zie 6.1.1). Daar deze waarde buiten de kritieke zone ligt, wordt ffo niet verworpen. Merk op, dat wij niet zeggen: ffo wordt aanvaard. Hoewel deze formulering, ved gebruikt wordt, is zij onjuist. In het algemeen zal immers ff o : P = 0,5 niet de enige hs^pothese zijn, die niet verworpen kan worden (zo zal men bij het gegeven voorbeeld ook de hypothesen P = 0,51 of P = 0,48 niet kunnen verwerpen). Men kan daarom niet-verwerpen niet gdijksteUen met aanvaarden. 6.1.5. DE INVLOED VAN DE STEEKPROEFOMVANG OP DE FOUTEN-KANSEN
Onderstd, dat bij het framboeda-probleem de steekproefomvang tot 30 personen wordt vergroot. De grootheid x volgt dan één der volgende kansverdelingen : onderH.:i>fe =
« | S J - j j ( ^ , - 2 - .
30' onder ff,: P{x = x \ H i ) = ^ . ^ g ^ J ^ ^ , (0,2)«(0,8)»<'-. Deze kansverdelingen zijn in tabel 6.5 opgenomen en in tabel 6,6 hebben wij voor verschülende linker kritieke zones weer de waarden van az, jffz en 1 — /9z vermeld. Vergelijkt men tabel 6.6 (« = 30) met tabel 6.4 {n = 20), dan büjkt, dat men door het vergroten van de steekproefomvang kan bereiken, 127
s
0,10
0.20
O
2
3
U
5
I
6 I 7
8
9
o
15 16 17 18 H^ niet verwerpen
10 11 12 13 U
-
verdeling onder HjP=.Cl5
Figuur 6.2. KansverdeUngen van y onder HQ en Hi bij » = 20.
Ho verwerpen
1
f
P(x=x) verdeling onder H,:P=Q2
X
a
n w o
W H
S
ON
6.1
GRONDSLAGEN
Tabel 6.5. Verdelingen van de grootheid x voor « = 30 ffo : -P = 0,5 H i : P = 0,2. Steekproefruimte X
30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 '10 9 6 7 6 5 ZL 4 3 2 1 0 Totaal
P ( x ^ x \ Ho)
1
0,00000 0,00000 0,00000 0,00000 0,00003 0,00013 0,00055 0,00190 0,00545 0.01332 0,02798 0,05088 0,08055 0.11154 0.13544 0,14446 0,13544 0,11154 0,08055 0,05088 • 0.Ö2798 0,01332 0,00545 0,00190 0,00055 0,00013 az = 0,04936 0,00003 FoutI 0,00000 0,00000 0,00000 0,00000 1,00000
P ^ = x\Hi) 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 ßz = 0,02561 Fout I I , / 0.00000 0.00000 0.00000 0.00001 0.00004 0.00018 0.00067 0.00221 0.00638 0.01612 Ö;ci3547 0.06756 0.11056 0.15382 0.17946 0.17228 ' 1 - ^z = 0,97438 0.13252 Onderscheidings0.07853 vermogen 0.03366 0,00928 0,00124 0,99999
Tabel 6.6. Kansen op een fout van de eerste en van de tweede soort en het onderscheidingsvermogen voor verschillende Z L (ontleend aan tabel 6.5) H o : P = 0,5 H l 0,2 « = 30 Z L bestaat uit « = 0 0 0 0 0 0 0 0
t/m 5 t/m 6 t/m 7 t/m 8 t/m 9 t/m 10 t/m 11 t/m 12
FoutI az 0,00016 0.00071 0.00261 0,00806 0,02138 0,04936 0,10024 0.18079
Fout I I ßz ' 0,57249 0,39303 0,23921 0,12865 0,06109 0,02562 0,00950 0,00312
Ondersch. verm. 1-^z 0,42751 0,60697 0.76079, 0.87135 0.93891 0.97438 0.99050 0,99688
129
6,1
TOETSINGSTHEORIE
dat aan een bepaalde waarde van az een veel kleinere ßz verbonden is. Bijvoorbeeld: n = 20, ZL: X = O t/m 5, az = 0,0207, ßz = 0,1958, n = 30, Z L : X = 0 t/m 9, az = 0,0214, ßz = 0,0611. (Vergroot men de steekproefomvang tot n = 50, dan kan men bij de keuze van de zone ZL'. x = O t/m 14 bv. werken met az = 0,0130 en ßz = 0,0607.) Bij een toetsingsprobleem met twee enkelvoudige hypothesen, zoals het probleem dat wij tot dusverre hebben besproken, zou men nu ook als volgt tewerk kunnen gaan : a. Stel vast, welke foutenkansen (a èn ß) men aanvaardbaar acht. b. Bepaal op grond van PQ, P I en de voor a e n ß gekozen waarde de steekproefomvang, waarbij de kritieke zone zodanig kan worden gekozen, dat az en ßz ten hoogste gelijk zijn aan de gekozen a en ß. Voorbeeld 6.3. Onderstel, dat men wü beslissen tussen de mogelijkheden Pp = 0.9 en P j = 0,4 en dat men a = j3 = 0.05 stelt. Met behulp van tabeUen van de binomiale verdeUng kan men vaststeUen, dat bij « = 25 de linker kritieke zone x = 0 t/m 19 oplevert: az == 0.0334 en ßz = 0,0294.
Deze ideale toetsingsprocedure, waarbij men dus de kans op beide fouten a priori kan stipuleren, kan in de praktijk vaak niet worden toegepast, omdat de alternatieve h5rpothese samengesteld, d.w.z. van het type Pj < P», Pi > Pp of Pj ^ P^ is. In 6.2 bespreken wij, hoe men dan de toetsing het beste kan uitvoeren. 6.1.6. HET VASTSTELLEN VAN DE STEEKPROEFOMVANG BIJ GEGEVEN WAARDEN VAN P , , P i , a EN ß ^
Als men de in 6.1.5 genoemde toetsingsprocedure wil toepassen en dus de hypothese P = Po Avil toetsen (met een tevoren gekozen kans op een fout van de eerste soort a) met als tegenhypothese P = Pi (met een kans op een fout van de tweede soort ß), dan kan men de vereiste steekproefomvang eenvoudig bij benadering bepalen met formule (6.4). Deze formule berust op de volgende gedachtengang. Onderstel, dat P^ < Po. De toetsing is dan links éénzijdig. Noem de waarde van de toetdngsgrootheid x, die bij de steekproefomvang n de bovengrens vormt van de linker kritieke zone met az < a en ßz < ß, x„. Dan dient te gelden: P(x < x„\n, ffo) < a en P{x > x„ln, ffi) < ß. Wij onderstellen nu, dat de kansverdeling van x zowel onder ffo als i Kan bij eerste lezing zonder bezwaar worden overgeslagen.
130
6.1
GRONDSLAGEN
onder ffj bevredigend kan worden benaderd door de best-passende normale verdding. Dan gddt als men de continuïteitscorrectie verwaarloost (zie figuur 6.3) : ^ rj. -' a = — -' i - a =
Zodat (6.3.1)
x^ — P ^ n ,/^^ -
VPoÇot" «„ -
(6.3.2)
Po« = -
x^-Pin en •' 1-ß
=
VPiQin
TI.^VPOÇO»
Xn - Pin = Ti_ßVP'iQ^ _ «(Po - Pl) = Ti_yPoQon + Ti-ßVPiQin n{Po - Pl) = ^nlTi-o^y/P^o + T i - ß V P ^ ^
(6.4)
L
Po-Pi
J"
Voor Pl > Po wordt de noemer van (6.4) : Pi — Po. De tdler verandert niet. verdeling onder H i
verdeling onder Hg
Figuur 6.3. Best-passende normale verdelingen onder H^ en Hj (Pj > Pi)Voorbeeld 6.4. Stel, dat: J ï , : P = 0,6, met a = 0,01, zodat Ti_^ = To,,, = 2,33; H l : P = 0,5, met ß = 0,05, zodat Ti_ß = ro,,5 = 1,65. Volgens (6.4) geldt dan bij benadering:
n ^ r 2,33 VO.6 x 0.4 + 1.65 V O j i r ä S - l ' _ .^^^^.^ _ ^ ^ ^ _ 3g7_ L 0,6 - 0,5 J ' ' Uit (6.3.2) volgt: x^ = P i n + Ti^ß VPiQin = 193,5 + 1,65 ^ 0 , 5 x 0,5 x 387 = 209,7 = 209. (Waarom wordt hier naar beneden afgerond?) Men kan de toetsing dus als volgt uitvoeren: Trek aselect een steekproef van 387 exemplaren. Verwerp HQ voor XQ < 209. Verwerp ff, niet voor Xo > 209.
131
6.1
TOETSINGSTHEORIE
Formule (6.4) geeft aanleiding tot enkde opmerkingen: 1. De kans, dat bij een toetdng een fout (van de eerste öf van de tweede soort) wordt gemaakt, is altijd groter dan 0. Men kan deze kansen echter bij gegeven Po en P j wiUekeurig klein kiezen. Naarmate men a en/of ß kleiner maakt, wordt n groter. 2. Als men a e n ß heeft gekozen kan men altijd een zodanige steekproefomvang kiezen, dat men een besüsdng kan nemen tussen twee waarden Po en Pi, waarbij de kans op het ten onrechte verwerpen van ffo ten hoogste gdijk is aan a, resp. de kans op het ten onrechte verwerpen van ffi ten hoogste geüjk is aan ß. De steekproefomvang kan dan echter zeer groot worden, zoals blijkt uit tabd 6.7. Wordt deze Tabel 6.7. Steekproefomvang, nodig om bij a = ß == 0,05 te besüssen tussen P , = 0,5 en verschillende P j Pl
0,2 30 0,3 63 0,4 . 266
Pl
0.45 0.475 0.49
1084 3964 27225
erg groot, dan zal vaak het trekken van een steekproef, die de verlangde discriminatie oplevert, praktisch onuitvoerbaar zijn (te tijdrovend, te kostbaar). Indien men a e n ß zeer klein gekozen heeft kan men in de eerste plaats overwegen, of voor a en/of ß grotere waarden todaatbaar zijn. Wil men aan deze keuze niet tomen, dan kan men zich afvragen of een groter verschü tussen Po en Pi kan worden toegdaten, dan wd of het verschü dat men wil constateren praktisch van voldoende betekenis is om het aan te tonen. Onderstel bv., dat bij het framboesiavoorbeeld de beide hypothesen luiden: ff„ : P = 0,5 en ffi : P = 0,45. Beide fracties wijzen dan op een dusdanige ernst van de aandoening, dat een uitgebreid saneringsprogramma noodzakelijk is en dat het weinig uitmaakt, wdk van deze twee waarden nu juist is. Pas indien beide hypothetische waarden van P meer verschillen wordt het van belang, ze van elkaar te onderscheiden. Hoeveel meer is een (modüjke) vraag, die niet meer op statistisch terrein ligt. Te ved onderzoeken worden nog uitgevoerd met een min of meer lukraak gekozen steekproefomvang. Soms is de steekproef niet groot genoeg om tot een beslissing te kunnen komen. In andere gevallen is de steekproef te groot, d.w.z. men zou reeds bij een kleinere omvang (en dus efficiënter) een besüsdng bereikt kimnen hebben. Uit het voorgaande büjkt hoe belangrijk het is, dat men zich bij de opzd van een onderzoek rekenschap geeft van de factoren die bij de statistische analyse van de mtkomsten van het onderzoek een rol spelen, 132
TOETSING VAN DE HYPOTHESE P = 0,5
6.2
6.1.7. OPGAVEN 6.1. Op basis van een aselecte steekproef van 20 elementen toetst men de hypothese ff, : P = 0,6 met als alternatief ff^ : P = 0,9. Stel een besUssingsschema op, waarbij az + ßz minimaal is (hierbij kan gebruik worden gemaakt van tabel 4.3). a. Wat is de kritieke zone en hoe groot zijn az, jSz en 1 — ^z ? b. De getrokken steekproef levert op: AT, = 16. Tot weUte uitspraak leidt dit schema ? 6.2.
Als opgave 1, maar de gegevens luiden: P , = 0,7, P i = 0,3, n = 20, AT, = 8 .
6.3.
Men wil de hypothese P > 0,6 toetsen met als tegenhypothese P < 0,4. Men kan de toetsing uitvoeren met als ff, : P = 0,6 en als ff j : P = 0,4; waarom? Bepaal bij benadering de steekproefomvang die nodig is om te toetsen met onderstaande waarden van a en ß: a. a = j8 = 0,05 b. a = 6,01, ß = 0,05 c. a = ß = 0,01. Geef voor elk van deze toetsingen de kritieke waarde.
6.2. Toetsing van de hypothese P = 0,5 6.2.1. ALGEMENE GANG VAN ZAKEN
In de praktijk doet zich vaak de dtuatie voor, dat de h5rpothese P = 0,5 wordt getoetst met één der volgende samengestelde alternatieve hj^othesen : 1. P < 0,5 (links éénzijdige toetsing), 2. P > 0,5 (rechts éénzijdige toetsing), 3. P ^ 0,5 (tweezijdige toetdng; zowel P < 0,5 als P > 0,5 wordt mogelijk geacht). Het is duideüjk, dat de in 6.1 beschreven procedure niet zonder meer kan worden toegepast, daar geen specifieke waarde Pi is gegeven zodat de kansverdeling van x onder ffi niet ondubbelzinnig kan worden bepaald. De toetsing verloopt als volgt: a. Kies een kleine fractie a. Men noemt deze fractie de onbdrouwbaarheidsdrempd van de toets (Eng.: level of significance). De waarde van a representeert de (maximale) kans op een fout van de eerste soort (d.i. : het ten onrechte verwerpen van ffo) die men aanvaardbaar acht. De meest gebruikte drempelwaarden zijn 0,05, 0,01 en 0,001. Men dient zich bij de keuze van a te realiseren, dat men bij een bepaalde steekproefomvang deze drempelwaarde slechts kan verkleinen ten koste van een vergroting van de kans op een fout van de tweede soort (het ten onrechte verwerpen van ff j) : zie 6.1.4.4. Overigens is deze keuze afhankeUjk van de ernst van de consequenties, die het ten onrechte verwerpen van ff, met zich meebrengt; zie 6.1.4.3.
b. Kies de (één- of tweezijdige) kritieke zone zo, dat onder ffo de kans, dat de toetsingsgrootheid x een in Z gelegen waarde aanneemt, ten hoogste geüjk is aan a, d.w.z. az < a^ 133
6.2
TOETSINGSTHEORIE
Links éénzijdige toetsing: Kies XL zodanig, dat P{x = 0) -f- P(ar= 1) -|-
-|- P(y = XL) = PL{XI) < a is.
Rechts éénzijdige toetsing: Kies XR zodanig, dat P{x = XR) -|P{X = X R - { - \ ) - \ - . . . . -icP{x = n ) = PB{XR) < a is. Tweezijdige toetsing: De verdeüng van x onder ffo is S3anmetrisch, daar Po = 0,5. Men kiest n n Z = ZL + ZR zodanig, dat de kritieke waarden XL en XR van de sub-zones S3mimetrisch t.o.v. /ig. liggen, zodat: XR = n — XLen: PL{XI) -\- PR{XR) == 2PL{XL) = 2PR(XR) = PD{XL) = PD{XR) ten hoogste geüjk is aan a (zie figuur 6.4). H«:P-41«
n-— ^
1
P*^2
—T
^^i'
A
0 1
1
1
1 1 1
1 !
\
?
- — ^9 '
0
P mogelijkheden waartussen beslist moet worden
n criterium \ 30 X voor de beslissing - V — -J A
15
21 A
V H , verwerpen
H, niet verwerpen
H, v<»rwerpen
beslissing
Figuur 6.4. Beslissingsschema bij tweezijdige toetsing van de hypothese P = ^. met n = 30. Z bestaat uit twee even grote delen, zodanig dat PL{XL) = PB{XR) ten hoogste gelijk is aan Ja.
c. Het beslissingsschema wordt dan : 1. Verwerp ffo ten gunste van ffi, indien de waargenomen waarde van X, Xo, in Z ligt. Men zegt in dit geval wd: de uitkomst is significant bij een drempdwaarde a (bij een 100a% drempel). 2. Verwerp ffo niet, als XQ niet in Z ligt. Tabel 6.8, Kritieke zones corresponderend met de verschiUende hypothesen bij toetsing van ff, : P = 0,5 Alternatief
Kritieke zone
P l < 0,5
Links éénzijdig
P l > 0,6
Rechts éénzijdig
P l ¥= 0,5
Tweezijdig
alternatieve
Samenstelling van de zone P(0) + P ( l ) + . . . . + P{XL) ten hoogste geUjk aan a Pin) + P ( n - \ ) + . . . . + P(XR) ten hoogste geUjk aan a P(0) + P(l) + . . . , -1- P(XL) a ten hoogste gelijk a a n — P(») + P ( n - 1 ) + . . . . + P(XR) a ten hoogste geüjk aan —
134
TOETSING VAN DE HYPOTHESE P = 0.5
6,-2
In tabel 6.8 hebben wij de keuze en samenstelling van Z bij één- en tweezijdige toetsing nogmaals samengevat. Voorbeeld 6.5. Op basis van een 'steekproef' van 30 worpen wil men de hypothese toetsen, dat een geldstuk zuiver is. Men kiest a = 0,05. De proef levert op: Xo (aantal keren kruis) = 8. Tot welke uitspraak komt men? In dit geval is ff, : P(kruis) = P = 0,5 en ffi : P 9t 0.5, daar men a priori niet weet in welke richting een eventuele onzuiverheid ligt. Er dient dus tweezijdig te worden getoetst. Het beslissingsschema kan worden opgesteld met behulp van tabel 6.5, waarin de verdeUng van x onder ff, te vinden is. Passen wij het keuze-voorschrift toe, dan bUjken de (symmetrisch t.o.v. fi^ = P n = 1 5 gelegen) kritieke waarden te zijn (zie figuur 6.4) : XL = 9, Z L bestaat uit: ;ir = O, 1. 2. 9 17 _ 7 , 7 XR = 21. Z R bestaat uit: AT = 21. 22, 23 30] ^ ~ ^ i ' + ^RDe kans. dat x een waarde in deze zone aanneemt bedraagt: 2(0,00000+0,00000-1+0,00545+0,01332)=2(0,02138) = 0,04276. Voegt men links en rechts resp. de waarden 10 en 20 toe. dan verkrijgt men een zone, waarvan de onbetrouwbaarheid geUjk is aan: 2(0,02138 + 0,02798) = 2(0,04936) = 0,09872, waarmee de gekozen drempelwaarde ver overschreden zou worden. Het beslissingsschema wordt nu: 1. Verwerp ff, ten gunste van P < 0,5, a\a Xg in Z L (O t/m 9) Ugt. 2. Verwerp ff, ten gunste van P > 0,5, als ;i;, in Z^R (21 t/m 30) Ugt. 3. Verwerp ff, niet, als .», niet in Z Ugt. De waargenomen AT, = 8 ligt in ZL, zodat de hjrpothese P = 0,5 bij een 5% drempelwaarde verworpen wordt ten gunste van P < 0,5, 6.2.2. ÉÉNZIJDIGE OF TWEEZIJDIGE TOETSING
Bij bepaalde n en bepaalde drempelwaarde a is de ünker éénzijdige zone groter dan het linkerdeel van de tweezijdige zone, die bij deze n en a behoort. Men zal dan bij links éénzijdige toetsing een hogere waarde x^^ verkrijgen dan bij tweezijdige toetsing. Dientengevolge bezit de links éénzijdige toets voor P j < 0,5 een kleinere kans op een fout van de tweede soort ( = een groter onderscheidingsvermogen, men zegt ook wd: een grotere scherpte) dan de tweezijdige toets. Vóór het uitvoeren van een toetsing dient men zich daarom af te vragen of de alternatieve h37póthese één- of tweezijdig is. Als men wed, dat P > 0,5 nid kan voorkomen, is links éénzijdige toetsing vanzelfsprekend. Als echter tevoren vaststaat, dat het effect van de uitspraken P > 0,5 en P = 0,5 hetzelfde is, kan eveneens links éénzijdig worden getoetst. Uiteraard gddt m.m. hetzelfde voor de keuze tussen rechts éénzijdige en tweezijdige toetsing. Voorbeeld 6.6. Beschouw nogmaals voorbeeld 6.5. Onderstel, dat men weet, dat getracht is het geldstuk zodanig te vervalsen, dàt de uitkomst kruis te weinig
135
6.2
TOETSINGSTHEORIE optreedt. Indien deze vervalsing effect heeft, verwacht men dat P(kruis) = P kleiner dan 0,5 zal zijn. Nu zou men de hjrpothese P = 0,5 kunnen toetsen met als alternatief P < 0,5, zodat een linker éénzijdige kritieke zone wordt gekozen. Deze bUjkt te bestaan uit de waarden O t/m 10, met •PL(IO) = 0,04936 ( < 0,05); zie tabel 6.6. Deze zone is dus, bij dezelfde drempelwaarde 0,05, groter dan het linker deel van de zone, die wij bij tweezijdige toetsing verkregen en bezit daardoor een kleinere kans op een fout van de tweede soort. Dit büjkt uit onderstaande tabel, waarin deze kans voor beide zones en enkele alternatieve waarden van P is opgenomen. Kans op een font van de tweede soort ff, : P = 0,6 « = 30 Waarde onder ffi P = 0,2 0.4 0.3 0,00259 ZL: 0t/m9' 0.24464 0,04798 0,00056 Z L : Ot/m 10 0,12750 0,01716
Tenslotte beschouwen wij nog het geval, waarin de hypothese Po = 0,5 wordt getoetst niet bv, als alternatief Pi < 0,2. Hoewel de alternatieve h37pothese samengesteld is, kan men toch de toetsing baseren op de enkelvoudige waarden Po = 0,5 en Pi = 0,2. Besluit men nl. bij een drempelwaarde a tot het verwerpen van ffo ten gunste van ffi, dan kan men tevens, bij dezelfde drempel maar met een kleinere kans op een fout van de tweede soort, de andere mogelijke alternatieve waarden van P ( < 0,2) verwerpen. 6.2.3. DE WERKINGSKROMME
Als de alternatieve hypothese samengesteld is kan men een grafiek vervaardigen, waaruit bij een bepaalde steekproefomvang, resp. voor steekproeven van verschillende omvang, het onderscheidingsvermogen van de toets (en de complementaire kans op een fout van de tweede soort) bij verschillende drempelwaarden kan worden afgdezen. Onderstd, dat men de hj^iothese P = 0,5 toetst met als alternatieve hypothese P > 0,5 en het onderscheidingsvermogen bij n = 10 wil bestuderen van de rechter kritieke zones: d) x=^9, 10 en ft) « = 8, 9, 10. Wij beschouwen nu tabel 6.9, waarin voor n = 10 en een reeks met 0,05 opklimmende waarden van P de (binomiale) kansverdelingen van de toetsingsgrootheid x zijn opgenomen. Voor de zone A (« = 9, 10) lezen wij op de regel P = 0,50 de kans op een fout van de eerste soort af: a^ = P(9) -1- P(10) = 0,010 -|- 0,001 = 0,011. Voor de in de tabel voorkomende waarden van P groter dan 0,50 kan het onderscheidingsvermogen van zohe A worden bepaald door de bij zo'n waarde behorende kansen van a; = 9 e n a ; = 1 0 t e sommeren. De uitkomsten hiervan zijn rechts in tabd 6.9 opgenomen. Vervolgens is deze procedure herhaald voor de zone B (* = 8, 9, 10), met Cz = 0,055. 136
6.2
TOETSING VAN DE HYPOTHESE P = 0,5
Tabel 6.9 Kansverdelingen van x voor n = 10 en p = 0,05, . . . . 0,95 Steekproefruimte (waarden van »)
p I
0
2
3
4
6
5
8
9
10
0,075 0,194 0,276 0,302 0,282 0,233 0,176 0,121 0,076 0,044 0,023 0,011 0,004 0,001 0,000 0,000 0,000 0,000 0,000
0,315 0,387 0,347 0,268 0,188 0,121 0,072 0,040 0,021 0,010 0,004 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000
0,599 0,349 0,197 0,107 0,056 0,028 0,013 0,006 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0000 0,000 0,000
7
0,95 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,010 0,90 0,000 0,000 0,000 0,000 0,000 0,002 0,011 0,057 0,85 0,000 0,000 0,000 0,000 0,001 0,008 0,040 0,130 0,80 0,000 0.000 0,000 0,001 0,006 0,026 0,088 0,201 0.75 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,70 0,000 0,000 0,001 0,009 0,037 0,103 0,200 0,267 0,65 0,000 0,001 0,004 0,021 0,069 0,154 0,238 0,252 0,60 ' 0,000 0,002 0,011 0,042 0,111 0,201 0,251 0,215 0,55 0,000 0,004 0,023 0,075 0,160 0,234' 0,238 0,166 0,50 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0.45 0,003 0,021 0,076 0,166 0,238 0,234 0,160 0,075 0,40 0,006 0,040 0,121 0,215 0,251 0,201 0,111 0,042 0,35 0,013 0,072 0,176 0,252 0,238 0,154 0,069 0,021 0,30 0,028 0,121 0,233 0Ä>7 0,200 0,103 0,037 0,009 0,25 0,056 0,188 0,282 0,250 0.146 0,058 0,016 0,003 0,20 0,107 0,268 0,302 0,201 0,088 0,026 0,006 0,001 0,15 0,197 0,347 0,276 0,130 0,040 0,008 0,001 0,000 0,10 0,349 0,387 0,194 0,057 0,011 0,002 0,000 0,000 0,05 0,599 0,315 0,075 0,010 0,001 0,000 0,000 0,000
Som der kansen 1,000 1,000 0,999 0,999 0,999 0,999 1,000 0,999 1,000 1,000 1,000 0,999 1,000 0,999 0,999 0,999 0,999 1,000 1,000
Onderscheidingsvermogen ZR = Zs = 9 en 10 8 t/m 10 0,914 0,989 0,736 0,930 0,544 0,820 0,375 0,677 0,2U 0,526 0,149 0,382 0,085 0,261 0,046 0,167 0,024 0,100 0,011 1 0,055
De kansen zijn afgerond op drie decimalen. Tengevolge van afrondingsfoutjes is de som per verdeling (regel) niet steeds gelijk aan 1.
Uit de aldus verkregen gegevens kan een grafiek worden samengesteld, waarin langs de X-as de waarden van P en langs de Y-as het onderscheidingsvermogen (en/of de kans op een fout van de tweede soort) wordt afgezet : zie figuur 6.5. Voor dke zone kan in deze grafiek onderscheidingsvermogen
fout sfA 2 «soort
1-0
ß
1,U
^^
0,9
/
0.8
>f
/
0,7
0.5
A
O/i
A'
0,3
»
!
~ K
- , ,
__ , ,. , ,
„,
^
_
- / j
0.1 OLOSS • -
r
0011 t r 0.1
0.2
0,3
/
^
Y'
0.4 0.5 0.6 waarden van P
q2
1y /
0.5
y y rî1
/
H— a74 os
0.7
0,1
0,3
1
0,6
/
O
0.4
0.6 0,7 48 0.9
0.9
Figuur 6.5. Werkingskrommen van twee rechter kritieke zones bij n = 10, A: ZR — 9 en 10, B: ZR — % t/m 10.
137
6.2
TOETSIN GSTHEORIE
een reeks punten (P, 1 — ß) worden geplaatst en als men deze punten door een vloeiende lijn verbindt verkrijgt men de zg. werkingskromme (Eng. operating-characteristic curve, afgekort OC curve). Uit de kromme kan men voor iedere alternatieve waarde van P bij benadering het onderscheidingsvermogen van de corresponderende zone, 1 — ßz (of de kans op een fout van de tweede soort, ßz) aflezen. Voor het alternatief Pi = 0,74 vindt men bv. (zie stippellijnen) voor zone A: 1 — ßg = 0,22 en voor zone B: 1 — ßz = 0,50. Het onderscheidingsvermogen van de grotere zone (B) büjkt dus in dit geval meer dan tweemaal zo groot te zijn als dat van de kleine (A), maar aan het gebruik van B is dan ook een onbetrouwbaarheid (kans op fout van de eerste soort) verbonden, die vijfmaal zo groot is als bij A.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
waarden van P Figuixr 6.6. Werkingskrommen van kritieke zones met (ongeveer) dezelfde az bij verschillende steekproefomvang en toetsing van H,, : P = J : n = 10, Z g : 8 t/m 10, a^ = 0,055, n = 20, Z R : 14 t / m 20, a^ = 0,058, n = 30, Z R : 20 t/m 30, a^ = 0,049.
138
TOETSING VAN DE HYPOTHESE P = 0,5
6.2
Men kan ook een grafiek samenstellen, waarin de werkingskrommen bij (ongeveer) dezelfde drempdwaarde voor steekproeven van verschiUende omvang worden getekend. Hiermee kan men dan het onderscheidingsvermogen van de toets bij toenemende steekproefomvang bestuderen. In figuur 6.6 zijn als voorbeeld de werkingskrommen bij toetsing van de h3T)othese P = 0,5 voor rechter kritieke zones met (ongeveer) dezdfde az voor drie steekproefgrootten getekend. Bij tweezijdige toetsing krijgt men werkingskrommen die symmetrisch verlopen t.o.v. P = 0,5. Men tekene bv. zelf met behulp van tabel 6.9 in figuur 6.5 de kromme van de tweezijdige zone bij » = 10 en met XL = 2 en XR == 8. 6.2.4. DE UITVOERING VAN DE TOETSING
6.2.4.1. Tweezijdige todsing. In 6.2.1 hebben wij gezien, dat de kritieke waarden XL en XR bij tweezijdige toetsing zo worden gekozen, dat PD{XL) = PD{XR) = 2PL{XL) = 2PR{XR) =
a^
zo groot mogeüjk, maar ten hoogste geüjk aan de gekozen drempelwaarde a is. Hieruit volgt, dat de tweezijdige overschrijdingskans van nog verder van /*„ = \ n verwijderde waarden van x kleiner dan a is. De praktische consequentie hiervan is, dat men de kritieke zone niet volledig behoeft te bepalen, maar dat hij tweezijdige toetsing HQ kan worden verworpen, als PD{X^ gdijk aan of kleiner dan a is. Naarmate PD{X^ kleiner is, vormt x^ een sterkere aanwijzing tegen Ho (men kan immers H^ verwerpen bij iedere onbetrouwbaarhddsdrempel, die ten minste gelijk is aan PD{xoi). Men geeft daarom bij de toepassing van een toets meestal niet alleen de conclusie, maar vermddt ook Pn(«o) of de grenzen waartussen deze kans ligt. 6.2.4.2. Éénzijdige todsing. Bij links éénzijdige toetdng kan Ho : P = 0,5 bij een drempelwaarde a worden verworpen, indien PL{XO) < a is.
Bij rechts éénzijdige toetsing kan Ho bij een drempelwaarde a worden verworpen, indien PR{XO) < a is. 6.2.4.3. Bepaling van overschrijdingskansen. De overschrijdingskans van een waargenomen Xo kan als volgt worden bepaald: Exact: Met behulp van de in 4,3.2 genoemde tabeUen. Normale benadering: Voor « > 30 kan een binomiale verdeling met P = 0,5 worden benaderd door de best-passende normale verdeling (zie 5.4). De tweezijdige overschrijdingskans van «o kan dan bij benadering worden gevonden door te berekenen : 139
6.2
TOETSINGSTHEORIE
(6.5)
To =
Xo — 0,5« I — 0,5 0,5A/«
en de tweezijdige overschrijdingskans van Tg in tabel A op te zoeken. Bij links éénzijdige toetsing komt verwerping van Ho uitsluitend in aanmerking, als Xo < 0,5« is (bij Xg > 0,5« kan men direct tot niet verwerpen besluiten). Men bepaalt dan de linkse overschrijdingskans van: Xe — 0,5« -I- 0,5 (6.6.1) To = 0,5V« Bij rechts éénzijdige toetsing besluit men direct tot het niet verwerpen van Ho indien Xo < 0,5« is. Voor Xg > 0,5« bepaalt men de rechtse kans van: Xo — 0,5« — 0,5 (6.6.2) 0,5 V « Als men bij gebruik van de normale benadering uitsluitend wil vaststellen of de berekende Tg significant is bij een drempelwaarde 0,05, 0,01 of 0,001, kan men gebruik maken van tabel 6.10. Tabel 6.10. Waarden van T, waarbij Ho wordt verworpen bij tweezijdige en éénzijdige toetsing Drempel a 0,05 0,01 0,001
Tweezijdig (6.5) 1,96 < r < 2,58 2,58 < T < 3,29 T > 3.29
Links éénzijâig (6.6.1) -1,65 > T > - 2 , 3 3 -2,33 > T > - 3 , 0 9 T <.-3,09
Rechts éénzijdig (6.6.2) 1.65 < r < 2.33 2.33 < T < 3,09 T > 3,09
M d tabel I (bijlage 1) : Voor « > 100 kunnen de grenzen, waartussen de tweezijdige overschrijdingskans van Xo ügt direct uit deze tabel worden afgelezen. Tabel I bevat voor de drempelwaarden 0,01, 0,02, 0,05 en 0,10 bij tweezijdige toetsing de linker kritieke waarden XL van x. De hiermee corresponderende rechter kritieke waarden volgen uit: XR =
n — XL.
Voor « = 20 vindt men bv. : Tabel I
M = 20 XL
zodat:
XR
a 0,01
0,02
0,05
0,10
3 17
4 16
5 15
5 15
Hieruit volgt bv. : 0,02 < PD(5) < 0,05 (tabd 6.1 geeft de exacte kans: 0,0414) 0,01 < Pz)(16) < 0,02 (tabel 6.1 geeft de exacte kans: 0,0118). 140
TOETSING VAN DE HYPOTHESE P = 0,5
6.2
Tabel I kan voor éénzijdige toetsing worden gebruikt, als men de drempelwaarden halveert. Voor » = 20 leest men bv. af: PL{A) < 0,01 PB(16) < 0,01 PL{Z) < 0,005. opmerking De niet tussen haakjes geplaatste kritieke waarden, die wij in het voorgaande voorschrift omtrent tabel I hebben gebruikt, zijn zo gekozen, dat PD{XI) = PD{XR = n — XL) hoogstens geüjk aan a is. Het komt hierbij echter voor, dat deze tweezijdige overschrijdingskans aanzienlijk kleiner is dan a. Voor « = 10 is bv. de overschrijdingskans van X L = 1 in de kolom a = 0,05 gdijk aan 0,022. Het gevolg is, dat men bij toepassing van deze kritieke waarden toetst met een onbetrouwbaarheid, die vrijwel altijd (en soms vrij ver) beneden a ligt. De in sommige gevaUen tussen haakjes toegevoegde kritieke waarden bezitten een tweezijdige overschrijdingskans, die weüswaeir groter is dan a, maar die dichter bij deze drempelwaarde ligt dan de er voor staande, één lagere, waarde (zij zijn ontleend aan KLERK-GROBBEN & PRINS (95)). Gebruikt men nu — waar zij voorkomen — de tussen haakjes geplaatste kritieke waarden, dan wordt (gemiddeld) de gekozen drempelwaarde het best benaderd, terwijl het onderscheidingsvermogen van de toets groter wordt. Deze wijze van toetsen is echter — althans in Nederland — niet gebruikeUjk, zodat wij in het vervolg bij het gebruik van tabel I uitduitend met de oorspronkdijke, niet tussen haakjes geplaatste kritieke waarden zullen werken. Voorbeelden 6.7. Men toetst de hypothese P = 0,5 (alternatieve h3rpothese: P =p4 0,5). Een aselecte steekproef van 50 elementen levert op: Xo = 15. Is deze uitkomst significant bij een 5 % drempel ? (D.i. : kan men Ho verwerpen, als a = 0,05 gekozen wordt?) Er dient tweezijdig te worden getoetst. Ter illustratie wordt de tweezijdige overschrijdingsksms van Xo op drie manieren bepaald: 1. Exact. Met een tabel van de binomiale verdeling met P = 0,5 en « = 50 vindt men: P D ( 15) = 0,006598. 2. Normale benadering. Toepassing van (6.5) levert op: T =
6.8,
I 15 - 25 h - 0,5 ^ 0,5 VsÖ
9,5 ^ 2,69 3.536 PD{2,69) = 2(0,00357) = 0,00714.
3. Tabel I. Op de regel w = 50 en in de kolom 0,05 staat: XL = 17,. zodat: Pn(17) < 0,05. In de kolom 0,01 staat: XL = 15, zodat Pn(15) < 0,01. De uitspraak is dus: H , wordt verworpen ten gunste van P < 0,5. Men toetst Ho : P = 0,5 met als alternatief Hi : P > 0,5 en kiest a = 0,001. Een aselecte steekproef van 100 elementen levert op: * , = 68. Tot welke conclusie komt men ? 141
6.3
TOETSINGSTHEORIE Er wordt rechts éénzijdig getoetst. Uit tabel I blijkt, dat Pi;(32) = P B ( 1 0 0 — 32) = PB(68) < 0,005 is. Bij de gekozen onbetrouwbaarheidsdrempel (0,001) kan men dus op grond van deze tabel niet tot een uitspraak komen. Met de normale benadering vindt men echter via (6.6.2) : 68 - 50 - 0,5 17,5 3.5. O.5V10O 5 Deze uitkomst overschrijdt de kritieke waarde (T = 3.09, tabel 6.10) zodat Ho wordt verworpen.
6.2.5. OPGAVEN 6.4. Toets voor onderstaande aselecte steekproeven de hsrpothese P = 0.5. Geef uw beslissing en de overschrijdingskans van Xo (bij gebruik van tabel I : de grenzen, waartussen deze kans ligt. bij gebruik van de normale benadering: de benaderende overschrijdingskans). Steekproef
n
Alternatief
a
Xtt
a b c d e f g h i i k 1 m n
15 15 18 20 26 40 60 80 90 90 121 324 400 400 900
P ^0.5 P ?^0,5 P<0,5 P >0,5 P >0,5 P #0,5 P 9^0,5 P >0,5 P >0,5 P ?t0,5 P >0,5 P < 0,5 P #0,5 P >0,5 P #0,5
0,05 0,01 0,05 0,01 0,05 0,05 0.01 0,05 0,05 0.05 0,05 0,01 0,05 0.05 0.01
3 12 5 3 19 14 40 29 54 54 70 154 220 220 486
0
Beslissmg
Overschr. kans
'
6.3. Toetdng van de h3rpothese P = P ^ j t 0,5 Naast de in 6.2 behandelde toets voor de hypothese P = PQ = 0,5 is ook toetdng van de hypothese P = PQ ^ 0,5 mogelijk. Toetsen van deze vorm noemt men wel binomiale toetsen, omdat de kansverdeling van de toetsingsgrootheid x een binomiale verdding is. Deze toetsen worden dan ook op analoge wijze uitgevoerd en hierbij zijn twee gevallen te onderscheiden, die wij achtereenvolgens behandelen. 6.3.1. EXACTE TOETSING
Als Pp (vrij) ver van 0,5 verwijderd is en/of « betrekkelijk klein is, dient exacte toetsing plaats te vinden. De verdeling van de toetsingsgrootheid X onder H^ is dan niet symmetrisch, zodat het bepalen van tweezijdige overschrijdingskansen niet analoog aan het behandelde in 6.2 verloopt, Voorbedd 6.9 verduidelijkt dit. 142
TOETSING VAN DE HYPOTHESE P — Po¥^ 0,5
6.3
Voorbeeld 6.9. Men toetst de hypothese PQ = 0,2 met als tegenhypothese P i # 0,2 en als drempelwaarde a = 0,05. Een aselecte steekproef van 20 elementen levert op: Xo = 8. Tot welke uitspraak komt men? Er wordt tweezijdig getoetst. De verdeling van de toetsingsgrootheid g onder HQ is te vinden in tabel 6.1 (laatste kolom). Om PB(.*Q = 8) te bepalen dient men nu alle waarden van x bijeen te zoeken, die een hoogstens even grote kans bezitten als ;I;Q = 8 en de daarbij behorende kanisen te sommeren (zie 3.6.1). Dit zijn in de eerste plaats de waarden 8 t/m 20 (met als som van hun kansen 0,0322) en vervolgens de waarde O, daar P(0) = 0,0115 kleiner is dan P(8) = 0.0222. Hieruit volgt, dat Pz)(«o = 8) = 0.0322 + 0.0115 = 0.0437. PQ wordt dus verworpen ten gunste van P l > 0.2. 6.3.2. NORMALE BENADERING
Als PQ niet te ver van 0,5 verwijderd is en/of « (vrij) groot is, kan de binomiale verdeling bevredigend worden benaderd door de bestpassende normale verdeling. De tweezijdige overschrijdingskans van de waargenomen Xg is dan bij benadering geüjk aan de tweezijdige kans van :
(6.7)
To = l ^ o - ^ o « _ ^ 0 , 5 _
(Co = 1 - P«)-
VPOÇO«
Bij links éénzijdige toetsing is de gewenste kans bij benadering gelijk aan de linkse kans van : (6,8.1)
T o = *o--Po»» + 0,5 VPOÇO«
Bij rechts éénzijdige toetsing neemt men de rechtse kans van: (6.8.2)
To =
Xo — Po« — 0,5 VPoÇo«
Voorbeeld 6.10. Gegevens: H o - P < 0,6, Hi : P > 0,6, n = 400, a = 0,01. Men vindt: Xo = 264. Er wordt rechts éénzijdig getoetst. Bij deze waarden van P = 0,6 en M = 400 kan de normale benadering worden toegepast. Uit (6.8.2) volgt dan: T -
^ ^ ~ ^°'^^ ^ ^ ^ ~ °'^ = 23,5 _ ^ ^ V(0,6) (0,4) (400) 9,8 Uit tabel 6.10 blijkt, dat PB(2,4) < 0,01, zodat HQ wordt verworpen. 6.3.3. OPGAVEN 6.5. Gegevens: HQ : P > 0,35, H i : P < 0,35, n = 121, a = 0,05. Men vindt: Xo = 27. Hoe luidt de uitspraak? 6.6.
Gegevens: HQ : P < 0,45, Hi : P > 0,45, n = 100, a = 0,01. Men vindt: Xo = 60. Tot welke uitspraak komt men ?
143
6.4
TOETSINGSTHEORIE
6.4. Sequente toetsing 6.4.1. ALGEMENE GANG VAN ZAKEN
Bij de toetsen, die wij in de voorgaande paragrafen hebben behandeld, wordt een steekproef van bepaalde omvang gekozen, zonder dat daarbij acht wordt gedagen op de tijdens de trekking verschijnende uitkomsten. Gedurende de tweede wereldoorlog is echter door WALD en zijn medewerkers van de Statistical Research Group van de Columbia Universiteit de zg. sequente toetsingsmdhode ontwikkeld, waarbij slechts zoveel elementen aselect worden getrokken als er nodig zijn om bij tevoren gekozen waarden van a èn j8 tot een beslissing tussen Ho en Hl te komen. Dit aantal blijkt gemidddd vrij aanzienlijk lager te zijn dan de steekproefomvang, die men bij de gebruikeüjke toetsingsmethode op grond van deze gegevens zou voorschrijven (bv. op grond van Po, Pi, a en j8 met formule (6.4)). Deze sequente toetsing is dïiardoor vooral te prefereren, indien men zo economisch mogeüjk wil werken (bv. als de dementen die men onderzoekt daarbij verloren gaan) of als men (bv. bij een medisch onderzoek om ethische redenen) liefst zo weinig mogeüjk personen in de steekproef wil opnemen. Bij de sequente methode trekt men successievelijk asdect één element uit de populatie en verricht daaraan de waarneming. Na elke trekking komt men, op grond van de op dat moment beschikbare uitkomsten, tot één van de drie volgende besüsdngen : 1. Hl verwerpen ten gunste van Ho. 2. Ho verwerpen ten gunste van Hj, 3. Een volgende trekking verrichten. Teneinde te kunnen vaststellen welke bedissing men zal nemen, dient men bij elke steekproefomvang twee kansen te kennen: •Po.n = de kans op de verkregen uitkomst onder Ho, •Pi,n = de kans op de verkregen uitkomst onder Hi. Indien Po,„ veel groter is dan P i „ beduit men in principe tot het verwerpen van Hl. Is Po.„ veel kleiner dan P j „, dan beduit men tot het verwerpen van Ho- Verschillen Po,„ en P j „ betrekkelijk weinig, dan wordt een volgende trekking verricht. WALD (33) heeft nu bewezen, dat voor deze sequente toetdng het volgende beslissingsschema geldt : P ß (6.9) verwerp Hi, als - p ^ <-j , Po,n
(6.10)
1
^
p 1 verwerp Ho, als p^'" >
g
Po,n
, O
n
7J
(6.11) verricht een volgende trekking, als -jl - a <^ Po.„ „ '" < 144
1
o
.
SEQUENTE TOETSING
6.4
Het steekproeftrekken wordt voortgezet, totdat beslissing 1 of beslissing 2 is genomen. Opmerking: De afleiding van deze ongelijkheden bevat bepaalde benaderingen, maar daardoor wordt de som van a en /Î niet verhoogd, terwijl de toeneming van het aantal waarnemingen tengevolge van een eventuele verkleining van deze kansen gering is. 6.4,2. RECHTS ÉÉNZIJDIGE SEQUENTE BINOMIALE TOETSING
6.4.2.1. Formules. Onderstel, dat men wü bedissen tussen de hypothesen H o : P = Po en Hi : P = Pi(> P»)
[P = P{A)].
De kans op het ten onrechte verwerpen van Ho wordt gelijk gesteld aan a en de kans op het ten onrechte verwerpen van Hj aan ß. Er dient rechts éénzijdig te worden getoetst. Onder Ho is de kans, dat zich in een aselecte steekproef van « elementen x„ dementen met kenmerk A bevinden: P(x = x„ I Ho) = Po.„ = C». • Po«- • Öo"^Onder Hl geldt:
(Co = 1 - -Po).
P{x = x„ I Hl) = Pi.„ = C». • Pl». • (?i»-. Hieruit volgt, dat:
(Cl = 1 - Pl).
(6,19^ J'i.« Q„ •-Pl'" • Qi"-"- [ P i J ' rÇiT-*" ^ ' Po.» Q . . Po«» • Co"-"- I P J iQoA • De kritieke waarde, waarbij Ho juist wordt verworpen bij een steekproefomvang « noemen wij ô„. Uit (6.10) en (6.12) volgt dan
De kritieke waarde, waarbij Hj juist wordt verworpen bij een steekproefomvang «, noemen wij a„. Uit (6.9) en (6.12) volgt
Door het nemen van logarithmen gaat (6.13) over in: J „ l o g ^ + (« -
6„)log§i=logi^,
^0
, ,
-Pl,
VO
,
Cl
, 1
Cl
"
1
1 - ß
bn log p-H- « log j , — b „ log - ^ = log — — , ^0
VO
VO
"
145
6.4
TOETSINGSTHEORIE
zodat
(6.15)
6„ =
los
'-^
5
^ - «
,ogi^^
H 2i ^^
log 2!
PiÇo ' «-,
'°^ p;^i
ft i'iÇo'
'°^ p:iQi
Gebed analoog volgt uit (6.14) : , log (6.16)
a„ = ,
ß
, Qo log — ^' P^ £- o^ -h « , PxQÖ
Deze formules zien er op het eerste gezicht vervaarlijk uit, maar zij zijn eenvoudig te hanteren. Wij schrijven : 1
^
l o g ^
log i ^ i
De vergdijkingen (6.16) en (6.15) gaan dan resp. over in: (6.17)
a„ = s«-f-Äo.
en ' (6.18)
b„ = sn-\-hi.
Uit (6.17) kan men voor elke steekproefomvang « het aantal elementen a„ met kenmerk A bepalen, waarbij Hi kan worden verworpen met een kans op het ten onrechte verwerpen die ten hoogste gelijk aan ß is. Uit (6,18) volgt het aantal 6„, waarbij Hg kan worden verworpen met een kans op een foutieve uitspraak die ten hoogste geüjk aan a is. In tabel 6.11 zijn voor de regdmatig gebruikte waarden van a en jS ß ^— ß de waarden van log-j en log opgenomen. Verder behoeft men dan voor het bepalen van s, ho en hi alleen log Qo/Qi en log PiQo/PoQi te berekenen. 146
6.4
SEQUENTE TOETSING
Tabel 6.11
•-/,
log
I - ß
/-
a
ß
0,01 0,01 0,01
0,01 0,02 0.05
-1,9956 -1,6946 -1,2967
1,9956 1,9912 1,9777
0,02 0,02 0,02
O.Ol 0.02 0.05
-1,9912 -1,6902 -1,2922
1,6946 1,6902 1.6767
0,05 0,05 0,05
0,01 0.02 0,05
-1,9777 -1,6767 -1,2787
1.2967 1.2922 1.2787
6.4.2.2. Toepassing. Wij passen de zojmst beschreven sequente toetsing nu toe op de gegevens van het voorbeeld in 6,1. Daar de formules op rechts éénzijdige toetsing betrekking hebben, kiezen wij : Ho : P = 0,2 en Hl : P = 0,5. Reeds eerder is gemotiveerd, dat de gevolgen van het ten onrechte verwerpen van Hl het ernstigst worden geacht. Daarom kiezen wij ß = 0,01 en a = 0,05. Uit tabel 6,11 volgt, dat bij de gekozen waarden van a en j8: log j — ^
=, _ 1^9777 en log ^ ~ ^ = 1,2967.
Po = 0,2, Qo = 0,8, Pl = 0,5 = Qi, zodat: • log QolQi = log (0,8/0,5) = log 1,6 = 0,2041 log PiQolPoQx = log (0,5 X 0,8/0,2 X 0,5) = log4 = 0,6021. Zodoende is : 1,9777 0,2041 s= J. = 0,3390 h o = = - 3,2847 0,6021 0,6021 1,2967 Äi=2,1536 0,6021 VergeUjking (6.17) luidt dus «„ = 0,339» — 3,28 en vergelijking (6.18) wordt 6„ = 0,339«-h 2,15. Het sequente beslissingsschema kan nu op twee manieren worden samengestdd: a. De tabellarische mdhode. Voordat men tot het steekproeftrekken overgaat berekent men uit de verkregen vergeUjkingen voor 147
6.4
TOETSINGSTHEORIE
« = 1, 2, 3, tot bv. 30 de waarden van «„ en ô„. Daarna gaat men tot de sequente trekking over en schrijft voor « = 1,2,3, het aantal waargenomen framboesiaUjders x^ in de tabd met de berekende waarden van a„ en b„. Men verkrijgt dan een gdeideüjk oplopende getallenreeks. Zodra x„ geüjk is aan b„, wordt de h37pothese Po = 0,2 verworpen en zodra Xn geüjk is aan «„ verwerpt men de hypothese P i = 0,5. De grafische mdhode. Deze is sprekender dan de tabeUarische methode èn vereist minder rekenwerk. Men tekent hierbij de beide vergelijkingen in een grafiek met op de X-as de steekproefomvang « en op de Y-as het aantal framboesiaUjders «„ (zie figuur 6.7). Men verkrijgt dan de evenwijdige rechte Ujnen Lg (voor a„) en Li (voor b„).
ZET HET STEEKPROEF. TREKKEN VOORT
11 13 15 17 19 21 n steekproefomvang i , : a „ = 0,339» - 3,28 i l : 6„ = 0,339« + 2,15 Figuur 6.7. Grafiek voor het uitvoeren van een sequente analyse: Ho : P = 0.2 (o = 0,05) H i : P = 0,5 (jS = 0.01).
De uitkomsten van de sequente trekking worden als volgt in deze grafiek getekend : men gaat, te beginnen met de eerste waarneming in de oorsprong, bij iedere getrokken persoon zonder framboesia één een148
SEQUENTE TOETSING
6.4
heid naar rechts en bij iedere persoon met framboesia tevens één eenheid naar omhoog, totdat men één der begrenzingdijnen, Lo of Li, overschrijdt. Wordt Lo overschreden, dan beduit men tot het verwerpen van Hl ; bij het overschrijden van Li besluit met tot het verwerpen van Ho. Onderstd bv., dat succesdevdijk de volgende uitkomsten worden verkregen (-|- = framboesia) : Trekking Uitkomst
1 —
2
+
3 —
4
5
-
+
6 -
7 -1-
8
+
9 10 11 — + -
12 13 14 15 16
-
-
-1- + +
De lijn, die met deze uitkomsten correspondeert is in figuur 6.7 getekend. Bij de 16e trekking wordt Lj gesneden. Het steekproeftrekken wordt stopgezet en de uitspraak luidt : Ho verwerpen ten gunste van Hi. 6.4.2.3. De gemiddelde steekproefgrootte. Uit figuur 6.7 kan worden afgdezen, dat het steekproeftrekken vrij snd kan worden beëindigd, als de fractie framboesiaUjders in de populatie veel kleiner is dan Po==0,2 of veel groter is dan Pi = 0,5. Als alle personen in de populatie aan framboesia lijden, eindigt het steekproeftrekken (met de uitspraak: Ho verwerpen) bij « = 4. Deze steekproefomvang volgt ook uit de formule 1; (6.19)
« = _ J l _ = . ^ ^ = 3,3 = 4 (P=l). 1—s 0,6610 Als er in het geheel geen personen met framboesia in de populatie zijn, verloopt de steekproeflijn langs de X-as, zodat het steekproeftrekken dan bij « = 10 eindigt (met de uitspraak: Hi verwerpen). Dit aantal kan berekend worden met : (6.20)
n = - ^ = s
~ ^ ' ^ — = 9,7 = 1 0 0,3390
(P = 0). ^
Bedraagt de fractie framboedaüjders Po ( = 0,2), dan volgt « een kansverdeling, die afhangt van Po, Pi, a en ß. Bij het herhaald uitvoeren van de sequente toetsing zou men dus een reeks verschiUende waarden van « vinden. Bewezen kan worden, dat het gemiddelde van deze steekproefgrootten, de zg. gemidddde steekproefgrootte {GSG), voor P = Po geüjk is aan : (6 21) ^' '
« = ^0 + «(^1 - ^o) _ - 3,2847 -j- 0,05(2,1536 + 3,2847) ^ Po ^ 0,2 - 0,3390 = 21,7 = 22
(P = Po)-
^ Bij deze en de vier volgende formules neme men steeds het kleinste gehele getal dat groter is dan de waarde, die uit de formule volgt.
149
6.4
TOETSINGSTHEORIE
Voor P = P l i s de G5G: hi + ß{ho-hi) _ 2,1536 + 0,01(- 3,2847 - 2,1536) (6.22) « = = 13 Pi-s 0,5 - 0,3390 (P = Pi). Tenslotte geldt, dat voor P = s de GSG is: (6.23) « = - - - M l _ ^ - ( - 3.2847) (2,1536) ^ 3 ^ 6 ^ 3 3 ^ ' s(l-s) 0,3390(1-0,3390) '
(p^^), ^ '
De berekende GSG zijn in tabel 6.12 samengevat. Men kan door deze 5 punten (P, GSG) een kromme schetsen, die voor de gegeven waarden Po ( = 0,2), Pl {= 0,5), a ( = 0,05) en ß {= 0,01) ongeveer het verband tussen P en GSG aangeeft (zie figuur 6.8). Uit deze kromme büjkt, dat Tabel 6.12. GSG voor het framboesiaprobleem P 0 0,2 s = 0,339 0,5 1
GSG 10 22 32 13 4
de GSG maximaal is tussen Po en P j (meestal: dicht bij P = s) en laag in de buurt van O en 1. De kromme komt hoger boven de X-as te Uggen (de GSG neemt toe), naarmate P j en P j dichterbij elkaar komen en a en j8 kleiner worden. De kromme geeft dus een indruk van het aantal waarnemingen, dat gemiddeld verricht zal moeten worden om tot een beslissing te komen. BUjken deze gemidddden groter te zijn, dan men praktisch te verwezenlijken acht, dan kan men voor de aanvang van het steekproeftrekken overwegen, of een andere keuze van
0.2
OA
0,6
0.8
Figuur 6.8. G.S.G.-kromme.
150
1 P
SEQUENTE TOETSING
6;4
PQ, P I , a of ß mogeüjk is. Overigens büjkt de G5G steeds kleiner te zijn dan de (vaste) steekproefomvang, die men zou moeten kiezen om bij dezelfde P^, Pi, a en )8 de toetsing op de gebruikeüjke wijze (d.i. niet-sequent) uit te voeren. Opmerking: Hoewel de GSG van de sequente binomiale toets relatief klein is, loopt men toch het risico dat het aantal waarnemingen groot wordt, voordat een beslissing kan worden genomen. Uit praktische overwegingen kan het noodzakelijk zijn een maximum « „ te stellen voor het aantal waarnemingen dat men wil verrichten. Indien men dit maximum bereikt, voordat Lg of L, overschreden is, neemt men toch een besUssing, bv. als: (6.24)
xn„ > —ï——- + sn, verwerpt men Ho,
en als Jt.
(6.25)
Xn„ <
-4— h
° — - + sn. verwerpt men Hi.
Dit procédé noemt men afknotting van de sequente toetsing. Men verhoogt hiermee de kans op een foutieve conclusie. Als « „ echter niet te klein wordt gekozen (minstens 2 à 3 maal de maximale waarde van de GSG wordt gesteld), is de invloed op de kans op een foutieve conclusie slechts klein.
6.4.2.4. Een steekproefexperiment. Het volgende experiment, waarbij sequente toetsing wordt toegepast, leent zich goed voor klassikale toepassing. a. ledere deelnemer tekent een grafiek voor het uitvoeren van een sequente toetsing, gebaseerd op de volgende gegevens: Po = 0,5, Pl > 0,9, a = ß = 0,05. P = de kans op kenmerk A. (Ter controle vermelden wij, dat voor deze gegevens geldt: s = 0,7325, h o = — 1,34, hi = 1,34. Merk op, dat voor a = ß geldt dat Ao = — Al.) b. Het steekproeftrekken wordt nagebootst door te werpen met een geldstuk (kruis = kenmerk .4) of beter nog: met een dobbelsteen ( 1,2 of 3 ogen = A). ledere deelnemer werpt voor zichzelf en tekent de uitkomsten stuk voor stuk aan in de grafiek. Het aantal worpen (trekkingen) waarbij een uitspraak wordt bereikt, noteert men. Als de gebruikte geldstukken (dobbelstenen) zuiver zijn, wordt getrokken uit een populatie met P = 0,5. Daar o = 0,05 is gekozen, verwachten wij dat er op de 100 uitspraken ongeveer 5 onjuist zullen zijn (luiden: Ho verwerpen). De verkregen steekproefgrootten kunnen voor alle uitgevoerde toetsingen in een frequentieverdding worden samengevat. Het gemiddelde van deze verdeüng kan worden vergeleken met de verwachte GSG volgens (6.21). De in (a) gegeven waarden zijn zo gekozen, dat in de regel reeds bij een betrekkelijk klein aantal trekkingen een uitspraak wordt bereikt, zodat men eventueel ook individueel meerdere toetsingen kan ver151
6.5
TOETSINGSTHEORIE
richten, zonder dat het teveel tijd kost. Desgewenst kan men a en/of ß en/of Pl kldner kiezen. 6.4.2.5. OPGAVEN 6.7. Teken in één grafiek de Ujnen Z,Q en Li .die corresponderen met onderstaande gegevens : a. Po = 0,5, P l = 0,9, a = ß = 0.05 c. Po = 0.5, P l = 0,8, a = ß = 0,05 6.8. 6.9.
b. Als (a), maar a = ß = 0,01 d. Als (c), maar a = ß = 0,01
Bepaal voor de vier situaties in opgave 6.7 bij benadering de GSG krommen en vergelijk deze. Uit DixoN en MASSEY (8).
Men toetst de hjrpothese, dat de fractie defecten in een grote partij van een bepaald artikel Po = 0,1 bedraagt, met als alternatief: P , = 0,3. Men kiest a = 0,05 en /Î = 0.10. Een aselecte steekproef levert - in volgorde van trekking - de volgende uitkomsten op (D = defect) :
G G D G D G G G D D GGGDGGGGDG
GGGGGDGGGG
a. Toets op de gebruikeUjke wijze. Tot welke uitspraak komt u ? b. Pas de sequente analyse toe. Bij welk aantal waarnemingen komt u tot een uitspraak en hoe luidt deze? 6.4.3. SEQUENTE BINOMIALE TOETSING MET DRIE BESLISSINGSMOGELIJKHEDEN
Deze sequente toets komt overeen met de tweezijdige binomiale toets. Het principe van de sequente toets met drie besüsdngsmogeüjkheden is eenvoudig: zij is samengesteld uit twee sequente binomiale toetsen T en T' met bepalende grootheden: PQ, P I , a en ß, resp. PQ', Pl', a' en ß', waarbij Po < Pi < Po' < Pi'. Wij behandelen deze toets niet. Zij is duidelijk beschreven en met voorbeelden toegeücht door VAN ELTEREN & RÜMKE (84) en door D E BOER (78). 6.5 Samenvatting Dit hoofdstuk bevat een betrekkelijk groot aantal 'technische' details betreffende het uitvoeren van een toetsing. Het lijkt ons daarom nuttig de algemene gang van zaken bij het toetsen van een hypothese nog eens in enkele punten samen te vatten en daaraan enige opmerkingen te verbinden. Wij gaan daarbij uit van de situatie die in de praktijk het meest voorkomt, nl. die waarin een enkelvoudige hypothese Ho (zoals P = 0,6) wordt getoetst met als alternatief een samengestelde hypothese Hi (van het type P < 0,6, P > 0,6.of P ^ 0,6). Elke toetsing berust op een asdecte steekproef van « elementen en verloopt als volgt: 1. Stipuleer de te todsen hypothese Ho en de tegenhypothese Hi. Ook als men geen specifieke alternatieve hj^othese kan aangeven, dient men a priori te overwegen, welke mogeüjke hypothesen men wil 152
SAMENVATTING
2. 3.
4.
5.
6.5
todaten (om te kunnen uitmaken, of één- of tweezijdig wordt getoetst). Kies een toetsingsgrootheid u, waarvan de kansverdeling onder Ho (bij benadering) kan worden berekend. Kies de onbdrouwbaarheidsdrempd a, waarbij wordt getoetst. Deze keuze van de maximaal toelaatbaar geachte kans op het ten onrechte verwerpen van Ho is een zaak voor de onderzoeker en hangt af van de risico's, die een foutieve uitspraak t.a.v. Ho met zich mee brengt. Bepaal op grond van de kansverdeüng van u onder Ho een zodanige kritieke zone Z (één- of tweezijdig, afhankelijk van H J , dat de kans dat u een in Z gelegen waarde aanneemt onder Ho hoogstens gelijk is aan a. Verwerp Ho op grond van de getrokken steekproef, als de daarbij behorende waarde «o van u i n Z ligt. Men zegt dan wel: de waargenomen uitkomst is significant bij een drempelwaarde a (met een onbetrouwbaarheid a). Verwerp Hg nid, als «o ^^^ ^^ ^ l^gt-
Deze punten geven aanleiding tot de volgende opmerkingen: a. Als men, bv. op grond van de praktische mogeUjkheden, de steekproefomvang van tevoren kiest, dient men fdtdijk door middel van de werkingskromme van de toets te onderzoeken, hoe groot voor verschillende alternatieve hypothesen de kans op een fout van de tweede soort, d.i. de kans op het ten onrechte verwerpen van deze hjrpothesen, is. Door de keuze van a heeft men immers de kans op het ten onrechte verwerpen van Ho in de hand. Bij een gegeven steekproefomvang kan echter voor een Hi, die van praktische betekenis is, de kans op een fout van de tweede soort ß wel zo groot worden, dat men Hi, ook als deze juist is, slechts zelden als zodanig zal erkennen. Anderzijds zou ook kunnen blijken, dat men een aanvaardbare ß reeds bij veel kleinere steekproefomvang kan verkrijgen. b. Evenmin als bij een intuïtief getrokken conclusie (in de trant van : de steekproef bevat slechts 29,1% mannen, dus het is onwaarschijnlijk dat de populatie er 50% bevat) kan men via een statistische toetsing tot een zonder enige reserve zekere uitspraak komen. De exactheid en objectiviteit die door het toepassen van een toets worden verkregen, bestaan daarin, dat men zelf kan bepalen met welke kans(en) op een foutieve uitspraak men genoegen wil nemen.
153
HOOFDSTUK 7.
BEGINSELEN DER SCHATTINGSTHEORIE Bij vele praktijkproblemen beschikt men niet over (een) hypothese(n) betreffende de waarde van de parameter van de populatieverdeling, die wordt bestudeerd. Men wenst deze waarde dan zo goed mogelijk te schatten uit de getrokken steekproef. Het volgende voorbeeld bevat een ts^perend schattingsprobleem. Voorbedd 7.1. Een arts wordt uitgezonden naar Nieuw-Guinea, teneinde het voorkomen van framboesia in een bepaalde streek te bestuderen. Men vermoedt, dat in deze streek betrekkelijk veel personen aan manifeste huidafwijkingen tengevolge van framboesia lijden, maar uit de schaarse beschikbare gegevens kan men i zich geen oordeel vormen, dat voldoende betrouwbaar is om tot een verantwoorde bestrijding van het probleem te komen. A bezoekt de streek en besluit zijn oordeel omtrent de fractie framboesiaUjders in de populatie te baseren op een aselecte steekproef van « personen. De fractie lijders in deze steekproef, po = xjn, moet nu dienen om de populatiefractie, P, te schatten. ^ In dit hoofdstuk geven wij eerst de grondslagen van de schattingstheorie. Vervolgens passen wij deze toe voor het geven van een schatting van de parameter P van een dichotomie. 7.1. Gronddagen van de schattingstheorie 7.1.1. TERMEN EN BEGRIPPEN
Een schatter is een steekproeffunctie, die gebruikt wordt om de waarde van een onbekende parameter te schatten. De waarde, die een schatter voor een bepaalde steekproef aanneemt, heet een schatting van die parameter. Een schatter heet zuiver, als het gemidddde van zijn kansverdeling ^ Het is duidelijk, dat het probleem in deze vorm beter met de realiteit zal overeenstemmen dan het overeenkomstige toetsingsprobleem in 6.1.
154
GRONDSLAGEN
7.1
geüjk is aan de parameter. Een schatter heet bruikbaar, indien de spreiding van zijn kansverdeling afneemt, naarmate « toeneemt ; vrijwel alle gebruikelijke schatters zijn bruikbaar. Een schatter heet doeltreffend, als hij zuiver èn bruikbaar is en het doeltreffendst, als hij van alle doeltreffende schatters van een parameter de kleinste spreiding bezit. Voorbeelden 7.2. De steekproeffunctie p = x/n is een schatter van de parameter P van een dichotomie. De in een aselecte steekproef waargenomen fractie />„ is een schatting van P . De kansverdeUng van p is een binomiale verdeling met gemiddelde /«j, = P en spreiding Oj, = V p Q / n (zie 4.3.1), zodat de schatter p zuiver en bruikbaar, dus doeltreffend, is. Beschouwt men bv. een dichotomie met P = 0,5, dan geldt: voor n = 25 . . . . a„ = 0,1 P(0,30 < p < 0,70) = 0,95 n= 100 . . . . o„ = 0,05 P(0,40 < p < 0,60) = 0,95 « = 1000 . . . .
De steekproeffunctie $ is een schatter van de parameter /i,,.
7.1.2. PUNTSCHATTINGEN
Men noemt een schatting de aannemdijkste schatting, indien de kans op de waargenomen uitkomst maximaal wordt bij substitutie van de schatting voor de parameter. Voorbeeld 7.4. Onderstel, dat men uit een dichotomie een steekproef van 10 elementen trekt, waarin Xo — 4, zodat po = 0,4. De aannemeUjkste schatting van de (onbekende) parameter P is dan die waarde van P . waarvoor de kans op de uitkomst po = 0.4. maximaal is. Bewezen kan worden, dat P{x = 4 1 « = 10) maximaal ( = 0.2508) wordt, voor P = po = 0,4; voor elke andere waarde van P büjkt deze kans kleiner te zijn. Dus: po is de aannemeUjkste schatting vam P .
Als men één waarde als schatting van de parameter wil geven (men spreekt dan van een puntschatting) ligt het voor de hand, daarvoor de aannemeUjkste schatting te geven. Als puntschatting van P geeft men dan po. Daar bij een bepaalde P de waargenomen po van steekproef tot steekproef varieert en in de regel niet geüjk is aan P, heeft deze wijze van schatten het nadeel, dat het merendeel van de schattingen die men verkrijgt onjuist is. Deze onbevredigende situatie kan " worden verbeterd door het geven van een intervalschatting. 7.1.3. INTERVALSCHATTINGEN
Een schatting van P, die in de regel juist is, kan worden verkregen 155
7.2
SCHATTINGSTHEORIE
door een schattingsinterval te geven, waarvan de benedengrens pi en de bovengrens pg zodanig worden bepaald, dat de kans op een interval dat de (onbekende) parameter niet bevat, (hoogstens) gelijk is aan a. De kans, dat het interval de parameter wel bevat is dus (minstens) gelijk aan 1 — a. Men noemt 1 — a de bdrouwbaarheidscoëfficiënt en men spreekt van een schattingsinterval met een betrouwbaarheid 1 — a, of van een 100(1 — a)% betrouwbaarheidsinterval. Is bv. a = 0,05, dar is de betrouwbaarheidscoëfficiënt 0,95 en dan verkrijgt men een 95% betrouwbaarheidsinterval. Een betrouwbaarheidsinterval is dus een stochastisch interval, berekend uit de waarnemingen. Eén der meest algemene methoden om een intervalschatting met een betrouwbaarheidscoëfficiënt 1 — a te verkrijgen is te ontlenen aan de theorie van het toetsen van h3^othesen. In principe kiest men dit schattingsinterval dan zodanig, dat het aUe waarden van de parameter bevat, die bij tweezijdige toetsing met een onbetrouwbaarheid a niet kimnen worden verworpen op grond van de in de steekproef waargenomen waarde van de schatter. In 7.2.1 geven wij aan, hoe men daarbij te werk gaat. Bij het toetsen van de hypothese Ho berust de keuze van a op de consequenties, die het ten onrechte verwerpen van Ho met zich mee brengt. Geheel analoog is bij het schatten van een parameter de keuze van a afliankeüjk van de consequenties van de fout die men maakt, als het gegeven schattingsinterval de parameter niet bevat. Of: de keuze van de betrouwbaarheidscoëfficiënt l — a is afhankeUjk van de vraag, hoe belangrijk het wordt geacht dat het interval de parameter wèl bevat. Een grotere betrouwbaarheid brengt bij een bepaalde steekproefomvang met zich mee, dat men met een groter interval (dus met een minder scherpe schatting van de parameter) genoegen moet nemen. Indien men de steekproefomvang vergroot, wordt bij een bepaalde betrouwbaarheidscoëfficiënt het schattingsinterval kleiner. 7.2. Betrouwbaarhddsgrenzen van een fractie 7.2.1. EXACTE GRENZEN
Wij behandelen nu eerst een procedure, waarmee men exacte betrouwbaarheidsgrenzen van een fractie, d.i. de parameter P van een dichotomie, kan bepalen. Dit geeft ons dan tevens de gelegenheid, de in 7.1 ingevoerde begrippen te verduidelijken en de betekenis van een schattingsinterval te demonstreren. Beschouw een populatie, bestaande uit een groot aantal zwarte en witte knikkers. De parameter P(zwart) = P is onbekend. Wij gaan nu een schema opstellen, waarmee men voor « = 10 voor elke waargenomen Po = XgßO een 95% betrouwbaarheidsinterval kan bepalen. 156
7.2
BETROUWBAARHEIDSGRENZEN VAN EEN FRACTIE
Wij gaan daarbij uit van de kansverdelingen van p = x/ïO, die voor een aantal waarden van P in tabel 7.1 zijn gegeven. Tabel 7.1, Kansverdelingen v a n / » v o o r » = 10 en verschillende waarden van P Steekproefruimte (waarden van p)
p 0 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05
0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,003 0,006 0,013 0,028 0,056 0,107 0,197 0,349 0,599
0,1
0,2
0,3
0,4
0,5
0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,004 0,010 0,021 0,040 0,072 0,121 0,188 0,268 0,347 0,387 0,315
0,000 0,000 0,000 0,000 0,000 0,001 0,004 0,011 0,023 0,044 0,076 0,121 0,176 0,233 0,282 0,302 0,276 0,194 0,075 1
0,000 0,000 0,000 0,001 0,003 0,009 0,021 0,042 0,075 0,117 0,166 0,215 0,252 0,267 0,250 0,201 0,130 0,057 0,010
0,000 0,000 0,000 0,002 0,001 0,008 0,006 10,026 0,016 0,058 0,037 0,103 0,069 0,154 0,111 0,201 0,160 0,234 0,205 0,246 0,238 0,234 0,251 0,201 0,238 0,154 0,200 0,103 0,146 0,058 0,088 0,026 0,040 0,008 0,011 0,002 0,001 0,000
0,6
0,7
0,8
0,001 0,011 0,040 0,088 0,146 0,200 0,238 0,251 0,238 0,205 0,160 0,111 0,069 0,037 0,016 0,006 0,001 0,000 0,000
0,010 0,057 0,130 0,201 0,250 0,267 0,252 0,215 0,166 0,117 0,075 0,042 0,021 0,009 0,003 0,001 0,000 0,000 0,000
0,075 0,194 0,276 0,302 0,282 0,233 0,176 0,121 0,076 0,044 0,023
0,9 0,315 0,387 0,347 0,268 0,188 0,121 0,072 0,040
1
0,599 0,349 0,197 0,107 0,056 0,028 0,013 0,006 Ö,a2Ï' 0,003 0,010 0,001 0,004 0,000 aöïï' ' 0,002 0,000 0,004 0,001 0,000 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
kansen 1,000 1,000 0,999 0,999 0,999 0,999 1,000 0,999 1,000 1,000 1,000 0,999 1,000 0,999 0,999 0,999 0,999 1,000 1,000
In tabel 7.1 bepalen wij voor iedere waarde van P een linker en een rechter kritieke zone, die ieder een onbetrouwbaarheid van ten hoogste ^a = 1(0,05) = 0,025 bezitten (zodat zij gezamenlijk een onbetrouwbaarheid van hoogstens 0,05 hebben). Voor P = 0,95 vindt men dan de ünker zone p < 0,7 (de kans van deze zone is 0,011 ; de kans van de zone p < 0,8 is 0,086 en deze zone is dus te groot). Een rechter zone kan bij P = 0,95 niet worden gekozen, daar P{p = 1) = 0,599 ver boven 0,025 ligt. Voor P = 0,9 kan eveneens slechts een linker zone {p < 0,6) worden aangegeven, enz. De verkregen zones zijn in tabel 7.1 met verticale streepjes afgescheiden. In figuur 7.1 zijn de punten {p, P) uit tabel 7.1 getekend. De waarden ( = pimten) in de zojuist bepaalde kritieke zones zijn met een kruisje gemerkt, de grenswaarden van deze zones (kritieke waarden) met een dikke stip. De zones zijn vervolgens met de trappenlijnen A en B afgebakend en langs deze trappenlijnen zijn de krommen A' en B' geschetst.^ Uit de verkregen grafiek kan men nu voor « = 10 een intervalschatting met een betrouwbaarheid van ten minste 1 — 2(0,025)=0,95 ^ Om deze trappenlijnen nauwkeurig te tekenen, dient men voor veel meer waarden van P over de kritieke waarden van de linker en rechter zones met per zone a < 0,025 te beschikken. Deze zijn in tabel 7.1 niet gegeven, maar wèl in figuur 7.1 verwerkt.
157
7.2
SCHATTINGSTHEORIE
O 0.1 0,2 0,3 O A 0J5 0.6 0.7 0.8 0;9 1
p-A 10
Figuur 7.1. 9 5 % betrouwbaarheidsgrenzen van P voor M = 10.
aflezen. Onderstel bv., dat een aselect getrokken steekproef oplevert po = 0,4. Men richt dan in het punt p = 0,4 op de Z-as een loodlijn op en leest op de Y-as de ordinaten af van de snijpunten van deze loodlijn met de krommen A' en B'. Men vindt dan bij benadering : 0,12 < P < 0,74. Wij beweren dus, met een betrouwbaarheid van ten minste 0,95, dat de (onbekende) parameter P een waarde tussen 0,12 en 0,74 bezit. De betekenis van deze uitspraak is de volgende: bij aselecte trekking van een steekproef van 10 exemplaren is de kans, dat het op basis van po uit figuur 7.1 bepaalde betrouwbaarheidsinterval P bevat, tenminste gelijk aan 0,95. D.w.z.: hoewel de juistheid van een bepaalde uitspraak (één schattingsinterval) onzeker is, zal de relatieve frequentie van het aantal juiste uitspraken bij een groot aantal steekproeven (ongeveer) 0,95 zijn. Men mag echter nid beweren : de kans, dat P in het verkregen interval ligt is 0,95. P is immers geen stochastische grootheid, maar een constante. Op welke grond berust nu deze uitspraak ? Wij demonstreren dit met 158
BETROUWBAARHEIDSGRENZEN VAN EEN FRACTIE
7.2
figuur 7.2, waarin de grenslijnen A' en B ' zijn getekend voor n = 50, eveneens met een betrouwbaarheid v a n 0,95. Evenals in figuur 7.1 zijn de punten, waardoor deze grenslijnen lopen, kritieke waarden, die zo zijn gekozen dat voor elke waarde van P de kans, dat de schatter p een waarde binnen deze grenzen aanneemt, ten minste 0,95 is. " Onderstel nu, dat wij te doen hebben met een populatie waarin P = 0,4. Uit de figuur is dan onmiddeUijk af te lezen, dat de kans, dat p een waarde tussen pa en pA inneemt, ten minste 0,95 is. Maar tevens blijkt, dat juist voor deze waarden tussen pa en pA (zoals bv. pg = 0,4) een betrouwbaarheidsinterval verkregen wordt, dat P bevat. Voor p < p a e n voor p > pA verkrijgt men een interval, waarin P niet ligt. Deze redenering geldt voor iedere waarde van P , zodat de grendijnen altijd een 9 5 % betrouwbaarheidsinterval opleveren.
0.5 j 0,6 Pb
Pa
Figuur 7.2. 95% betrouwbaarheidsgrenzen van P voor n
50.
Het gebied tussen de grenslijnen noemt men wel een bdrouwbaarheidsgordd. De gordel in figuur. 7.2 kan worden gebruikt om bij « = 50 een tweezijdig begrensd interval af te lezen met een betrouwbaarheid 159
7.2
SCHATTINGSTHEORIE
van ten minste 0,95, of voor het aflezen van een bovengrens, resp. benedengrens met een betrouwbaarheid van ten minste 0,975. 7.2.2. GRAFIEKEN MET BETROUWBAARHEIDSGRENZEN VAN P
Als « niet te klein is en als P niet te dicht bij O of 1 ligt kan men betrouwbaarheidsgrenzen van P aflezen uit een grafiek, waarin bij een bepaalde betrouwbaarheidscoëfficiënt voor verschillende waarden van n de betrouwbaarheidsgordds zijn getekend. Voor waarden van «, die niet in de grafiek zijn opgenomen dient men hierbij op het oog te interpoleren tussen de krommen met lagere en hogere n. Dergelijke grafieken zijn in verschillende leerboeken en tabeUenverzameüngen opgenomen. In de BIOMETRIKA TABLES I (74) vindt men zeer duidelijke met een betrouwbaarheid van 0,95, resp. 0,99. EISENHART C.S. (8A) geven grafieken met een betrouwbaarheid van 0,99, 0,95, 0,90 en 0,80. De Statistische tabellen en nomogrammen (76A) bevatten grenzen met een gemiddelde betrouwbaarheid van 0,90 en 0,98. * In figuur 7.3 is een grafiek met 95% betrouwbaarheidsgordds opgenomen. Om ruimte te sparen bevat deze figuur niet de gehele grafiek, maar alleen de linkerhdft. Wij demonstreren het gebruik ervan aan de hand van enkele voorbeelden. Voorbeelden 7.5. Po < 0,5: Een aselect getrokken steekproef van 100 elementen levert op Po = 0,28. Het 95% betrouwbaarheidsinterval van P wordt dan als volgt bepaald. Men richt in het punt p = 0,28 op de A'-as een loodUjn op en bepaalt van de snijpunten • van deze loodUjn met de grensUjnen voor « = 100 de ordinaten op de linker verticale schaal: 0,19 en 0,38. Het 95% betrouwbaarheidsinterval is dan bij benadering: 0,19 < P < 0,38. 7.6.
Po > 0,5: Onderstel, dat » = 50 en ^^ = 0,7. Men richt in het punt p = l — 0,7 = 0,3 op de X-as een loodUjn op, bepaalt de snijpunten met de grensUjnen voor « = 50 (deze zijn niet getekend, maar moeten tussen die voor » = 40 en » = 60 worden geïnterpoleerd, iets naar « = 60 toe). De ordinaten van deze snijpunten leest men nu ai op de rechter verticale schaal: (ongeveer) 0,82 en 0,56. Het 95% betrouwbaarheidsinterval is dus bij benadering: 0,56 < P < 0,82.
7.2.3. TABELLEN MET BETROUWBAARHEIDSGRENZEN VAN P Als « klein is en P dicht bij O of 1 ligt, zodat Xo klein is, kan men de betrouwbaarheidsgrenzen beter in een tabel opzoeken. Er zijn verschillende tabeUen, waarin voor een reeks waarden van x en n (soms voor X en n — x) 95% en 99% betrouwbaarheidsgrenzen van P wor^ Deze zijn gebaseerd op tabellen van HAMAKER en geven betrouwbaarheidsintervallen, die zo zijn samengesteld dat de fractie juiste uitspraken gemiddeld gelijk is aan de betrouwbaarheid. Zij zijn daardoor iets scherper dan de intervallen, die op de gebruikelijke (door ons beschreven) wijze zijn bepaald en waarbij de fractie juiste uitspraken ten minste gelijk is aan de onbetrouwbaarheid. Ken voordeel van de HAMAKER-grafieken is, dat zij ook voor kleine fracties kunnen worden gebruikt.
160
B E T R O U W B A A R H E I D S G R E N Z E N VAN E E N F R A C T I E
7.2
Figuur 7.3. 9 5 % betrouwbaarheidsgrenzen van P voor verschillende waarden van « [uit BIOMETRIKA TABLES I (74)].
161
7.2
SCHATTINGSTHEORIE
den gegeven. Zie bv. Appendix).
HALD
(67, tabel XI) en
MAINLAND
(45, tabel 1,
7.2.4. BEREKENING VAN BETROUWBAARHEIDSGRENZEN VAN P
Indien P niet te dicht bij O of 1 ligt en « niet te klein is, kan een benedengrens pi met een onbetrouwbaarheid ^a bij benadering worden berekend met de formule :
(7.1)
f-'-l/r»«^
Xn Pi=-
-Xg{n — Xg) Ti^«" «
n + T^J
Een bovengrens p2 met dezelfde onbetrouwbaarheid volgt uit: Xn
^ ^ - t e , 1/7.0
~Xo{» - Xg) , , r ^ - i „ ' « « + T\_i^
(7.2)
']
De te gebruiken waarden van Tj^^ volgen uit tabel B. Gemakshalve zijn zij voor de meest voorkomende waarden van a in tabel 7.2 vermeld. Tabel 7.2. Waarden van T^J = T^i-i^
ia 0,05 0,025 0,01 0,005
2"i„ -1,65 -1.96 -2,33 -2,58
Tia? = T ' t - i . 2,71 3,84 5,43 6,63
Een tweezijdig begrensd betrouwbaarheidsinterval met onbetrouwbaarheid a (betrouwbaarheid 1 — a) is te verkrijgen, door (7.1) en (7.2) tegelijk te gebruiken. Voor grote « en grote Xg kunnen de termen T^^'/2 en T^^'/A in de teUer en Tj^^* in de noemer van (7.1), resp. de hiermeiie overeenkomende termen met T \ _ i ^ in (7.2), zonder bezwaar worden verwaarloosd, zodat de formules veel eenvoudiger worden en overgaan in . ]/xo{n — Xo. X o + T: (7.3)
(7.4)
162
Pl
P2
„|/^,
= Po+T, « j. ]/Xg{n ~ XQ) Xo + r , _ , „ | / ^ .
, j , l/Mi Po -h ri_j„|^ — .
BETROUWBAARHEIDSGRENZEN VAN E E N FRACTIE
7.2
Voorbeeld 7.7. Een aselecte steekproef van 225 elementen uit een dichotomie levert op: Xo == 135 (Po = 0,6). Gevraagd wordt het 95% betrouwbaarheidsinterval van P . Nu is: 1 — a = 0.95, dus a = 0,05 en ^a = 0,025, zodat Tj^« = T^i-i^ = 3,84. Substitutie in (7.1), resp. (7.2), levert op: 135 + -3.84 "' l/-. «A r ^ ' Ê Ë l M . 3,84-1 135 + - - - |/ 3.84 l - - ^ - + ^ J t36 92 - 14.52 „^ ^' 225 + 3.84 22834 ~ °'^^' 136,92 + 14.52 f^= 228,84 = Q-^^"Het gevraagde 95% betrouwbaarheidsinterval is: 0,535 < P < 0,662. Bij toepassing van (7.3) en (7.4) vindt men : Pl = 0,6 - 1.96 j / — ^ 5 ^ = 0,536 en 1 /0,6 X 0,4 p^ = 0,6 + 1,96 |/ 22g = 0,664. Het verschil met de nauwkeuriger berekende uitkomsten is dus gering. 7.2.5. BEREKENING VAN D E STEEKPROEFOMVANG, NODIG VOOR H E T VERKRIJGEN VAN E E N BETROUWBAARHEIDSINTERVAL VAN G E GEVEN BREEDTE
Onderstel, dat men een steekproef trekt uit een dichotomie en vermoedt dat P in de buurt van p ' ligt. Hoe groot moet deze steekproef worden gekozen, indien men een betrouwbaarheidsinterval met betrouwbaarheid 1 — a wil verkrijgen, waarvan de breedte ongeveer geüjk is aan«? Uit (7.3) en (7.4) volgt, dat bij benadering:
Pi = P' + T , i, yn ^ . P.==P' + T,_i„l/-^ • n
{q' = \ - p ' ) .
zodat
.-,._,....^j/s:_...l/s:=_,r.)^. Hieruit volgt:
(7.5)
nJ^. l
Voorbeeld 7.8. Onderstel, dat men vermoedt dat P in de buurt van 0,7 Hgt en dat men een 99% betrouwbaarheidsinterval wenst te verkrijgen, dat ongeveer gelijk is aan 0,05.. Dan is: 1 — a = 0,99, a = 0,01. Ja = 0.005, zodat 163
7.2
SCHATTINGSTHEORIE rj„» = 6,63 (tabel 7.2). Verder is p ' = 0,7, q' = 0,3 en » = 0,05, zodat uit (7.5) volgt: „
4(6.63) (0.7) (0.3j ^ ^228 (0,05)«
Deze steekproefomvang is zo groot, dat men besluit met een 95% betrouwbaarheidsinterval genoegen te nemen. Als de overige gegevens ongewijzigd blijven, vindt men dan : 4(3,84) (0,7) (0,3) = (0,05)'
1291.
Men trekt een steekproef van deze omvang en deze levert op pg = 0,65, zodat het 95% betrouwbaarheidsinterval, berekend met (7.3) en (7.4), bij benadering is: 0,65 ± 0,0260. De breedte van dit interval is dus, ondanks het verschil tussen po en p', vrijwel geUjk aan de gestipuleerde breedte, 0,05. 7.2.6. OPGAVEN 7.1.
a. Hoe kan men een kleiner betrouwbaarheidsinterval met een grotere betrouwbaarheidscoëfficiënt verkrijgen ? b. Wat gebeurt er met de betrouwbaarheidscoëfficiënt, indien men bij een bepaalde steekproefomvang het betrouwbaarheidsinterval kleiner maakt?
7.2.
Betreft voorbeeld 7.1. A'trekt aselect een steekproef van 250 personen. Hierin bevinden zich 105 framboesiahjders. Geef het 95% betrouwbaarheidsinterval van P . de fractie framboesiaUjders in de populatie: a. Uit figuur 7.3 6. Met de formules (7.1) en (7.2) c. Met de formules (7.3) en (7.4).
7.3.
Betreft voorbeeld 7.1. Onderstel, dat A een steekproef van zodanige omvang wü trekken, dat het 95% betrouwbaaxheidsintervaJ. berekend op basis van deze steekproef, niet groter is dan 0,10. Hoe groot dient hij deze steekproef (ongeveer) te kiezen, als hij vermoedt dat P in de buurt ügt van : a. 0,2 b. 0,4 c. 0,5 d. 0.55 e. 0,6.
7.4.
Uit een populatie van patiënten met een bepaalde ziekte trekt men aselect een steekproef van 50 personen. Hieronder bevinden zich 10 mannen. Bereken de bovengrens van de fractie mannen in de populatie met a = 0.05: a. Met formule (7.2), b. Met formule (7.4).
7.5.
Bepaal uit onderstaande steekproefuitkomsten bij benadering de 95% en 99% betrouwbaarheidsintervallen van P : ïkproeïf
n Po 7.6,
164
d e a b c 400 900 1600 2500 225 0,4 0,6 0,8 0.2 0,5
f h g 625 900 3600 0,5 0,9 0,9
Men wU een steekproef trekken uit een dichotomie en vermoedt, dat P ongeveer geUjk is aan 0,8. Hoe groot moet deze steekproef zijn, opdat een 95% betrouwbaarheidsinterval verkregen wordt, dat niet groter is dan:, a. 0,10 6. 0,05 c. 0,02 d. 0,01.
SCHATTEN EN TOETSEN 7.7.
7.3
Uit: N.T.v.G., 1955, 706-710. 'Mijn eigen onderzoek werd verricht bij 50 schizophrenie-Ujders, verpleegden uit de Psychiatrische Inrichting 'Endegeest' te Oegstgeest. . . . . Onder de vijftig proefpersonen (25 mannen, 25 vrouwen) werden aangetroffen: 3 manifest linkshändigen (2 vrouwen en 1 man), hetgeen neerkomt op 6 ± 3.36 pet manifeste linkshandigheid HuTTER vindt een percentage manifeste linkshandigheid onder schizophrenen, dat, op veel of weinig gevallen gebaseerd, in ieder geval nul is. Het door mij gevonden percentage, 6 ± 3,36 pet, verschilt statistisch idet van nul! Immers een verschil van twee percentages is alleen dan van statistische betekenis (dat wü zeggen niet aan toeval toe te schrijven) als het groter is dan driemaal de middelbare fout ervan, waarbij de middelbare fout van het verschü (m^i") geüjk is aan de wortel uit de som der kwadraten van de middelbare fouten der twee vergeleken percentages ( . . . . ) . En in ons geval is 6 kleiner dan driemaal 3,36. Er is derhalve tussen ons beider bevindingen geen statistisch significant onderscheid. De vraag is echter, wat HUTTER onder 'ein seltenes Auftreten' verstaat. Dat is uiteraard min of meer wiUekeurig. Het door mij gevonden percentage linkshändigen varieert op grond van het toeval tussen (6 ± 3 X 3,36 = ) 16,08 pet en nul. Indien het werkeUjke percentage dicht bij 16 ligt, zal men manifeste linkshandigheid bij schizophrenen niet 'zeldzaam' wiUen noemen. Ligt het tussen nul en 1 (iets, dat mijn waarneming niet uitsluit), dan zou men wel van 'zeldzaam' kunnen spreken. Als HuTTER zegt, dat het aantal door hem onderzochte gevaUen een zeldzaam voorkomen niet uitsluit, is dat onjuist, want totaal ontbreken sluit ieder voorkomen uit. Maar hij bedoelt, dat zij toch zelden zou kunnen voorkomen, niettegenstaande hij geen linkshandigheid bij schizophrenen waarnam'. Geef hierop uw commentaar.
7.3. Schatten en toetsen Uit formule (7.5) büjkt, dat bij een schattingsprobleem de steekproefomvang afhankelijk is van drie factoren: a. De breedte van het gewenste schattingsinterval. b. De betrouwbaarheidscoëfficiënt. c. De waarde van P. Bij vele praktijkproblemen is hiervan de grootteorde wel ongeveer bekend, bv. uit de literatuur, uit eigen voorgaande onderzoeken, uit een vooronderzoek, e.d. Bij het bepalen van' een betrouwbaarheidsinterval komen in principe dezdfde kwesties aan de orde als bij het toetsen van een h5rpothese. Men kan ook twee soorten fouten onderscheiden : 1. Het interval bevat de waarde van de parameter niet. Deze fout is analoog aan een fout van de eerste soort bij het toetsen van hypothesen. De kans op het vermijden van deze fout heeft men in de hand door de keuze van de betrouwbaarheidscoëfficiënt. 2. Het interval bevat te veel waarden die onjuist zijn, d.w.z. het is te breed, waardoor de schatting onscherp wordt. Deze fout is analoog 165
7.3
SCHATTINGSTHEORIE
aan de fout van de tweede soort bij het toetsen van hjrpothesen. & ROBERTS (36) karakteriseren deze fout zeer duidelijk als volgt : 'It is of little help to know that a needle you are seeking is in a certain haystack, however precisely you may be told the location of the haystack. To know which cubic inch the needle is in, however, may be all that is needed for the practical purpose of finding if. Ook bij het schatten zal men een compromis moeten zoeken en wel tussen: a. Een klein interval, dat veel informatie geeft, maar onbetrouwbaar is (1 — a laag = kans dat het interval de parameter bevat klein), en b. Een groot interval, dat weinig pertinente informatie geeft, maar zeer betrouwbaar is (1 — a hoog = de kans, dat het interval de parameter bevat groot). Evenals bij het toetsen kan men de beste keuze maken door a priori te overwegen, hoe nauwkeurig men wenst te schatten (keuze van de breedte van het interval) en hoe betrouwbaar men wü schatten (keuze van de betrouwbaarheidscoëfficiënt). Men kan dan — eventueel voor een aantal waarden van de parameter, die men mogelijk acht — met (7.5) ongeveer de noodzakeüjke steekproefomvang bepalen. Deze handelwijze voorkomt, dat men een te grote steekproef trekt (met als uitkomst een schatting, die veel scherper is dan nodig is), of dat men een te kleine steekproef trekt (met als uitkomst een schatting die zo onscherp is, dat men er weinig of niets mee kan uitvoeren). Een betrouwbaarheidsinterval verstrekt meer informatie dan een toetsing. In plaats van een keuze tussen twee tevoren gestelde h5rpothesen leidt het tot een spütsing van alle mogeüjke hypothesen in twee groepen: een groep van h3^othesen, die (bij een bepaalde betrouwbaarheid) met de steekproefuitkomst te verenigen zijn en een groep van h3rpothesen, die dit niet zijn. De eerstgenoemde vallen binnen de betrouwbaarheidsgrenzen. Dit verschil blijkt duideüjk uit het volgende voorbeeld. WALLIS
Voorbeeld 7.9.
166
Men toetst de hypothese P = 0.5 met als alternatief P < 0,5 en kiest a = 0.025. Een aselecte steekproef van 40 elementen levert op «'o = 16 (^0 = 0.4). Uit tabel I büjkt, dat men Ho bij de gekozen drempelwaarde niet verwerpt, daar de kritieke waarde XL = ^^ is. Uit figuur 7.3 kan bij benadering het 95% betrouwbaarheidsinterval 0.25 < P < 0.57 worden afgelezen. Hieruit büjkt: 1. Eveneens, dat Ho niet kan worden verworpen. 2. Dat zelfs de hypothese P = 0,26 niet kan worden verworpen. Dwz. : de steekproef geeft, door zijn te kleine omvang, te weinig informatie. Dit onbevredigende feit komt uit de intervalschatting duidelijker naar voren dan uit de toetsing, die slechts de uitspraaJc "Hg niet verwerpen" oplevert. Het richt nogmaals onze aandacht op het feit, dat men bij het toetsen van hypothesen ook de kans op een fout van de tweede soort niet mag verwaarlozen.
B VERDELINGSVRIJE METHODEN
'Can we in any of the problems of medical statistics reach satisfactory results by means of relatively simple numerical methods only? Can we satisfactorily test hypotheses and draw deductions from data that have been analysed by means of such simple methods? Personally I believe the answer to these questions is an unqualified yes, that many of the figures included in medical papers can by rdativdy simple statistical methods be made to yield information of value, and that even the simplest statistical analysis carried out logically and carefuUy is an aid to clear thinking with regard to the meaning and limitations of the original records.' A. BRADFORD HILL (42)
167
00
Eén aselecte steekproef, mingsparen
Aselecte steekproeven
Wciamemingen
Eén steekproef, verwante
Exacte en benaderende toetsing van de hypothese P i = P^ = Pg
waame-
x*-toets ;ï2.toets x*-toetsen
9.7. 9.8.
9.9.
{k X 2 tabel) (k X r tabel)
Toets van FISHER ( 2 x 2 tabel) ;f«-toets {2 X r tabel)
9.5. 9.6.
2
k
Toets van COCHRAN
Tekentoets
9.4.
9.3.
9.2. x'-toets
9.1.
AlUibuten Waarden omgezet in attributen of gegroepeerd in klassen
A. KwaUtatief
k
2
Eén aselecte steekproef, één waarneming per element
De toetsing berust op
10.7. 10.8.
10.6.
10.5.
10.4.
Rangcorrelatietoets van SPEARMAN Rangcorrelatietoets van KENDALL
Toets van KRÜSKAL en WALLIS
Toets van WILCOXON
Toets van FRIEDMAN
Rang-tekentoets
De x'-toets en de K-S toets
10.3.
Toets van KOLMOGOROV-SMIRNOV
10.1.
Waarden Rangnummers
B. Kwantitatief
10.2.
Aard van de kenmerken
Tabel 8.1. Systematisch overzicht van de verdehngsvrije toetsen in de hoofdstukken 9 en 10
HOOFDSTUK 8.
OVERZICHT VAN DE VERDELINGSVRIJE METHODEN 8.1. Verdelingsvrije en klasdeke methoden De statistische toetsings- en schattingstechnieken kunnen in twee categorieën worden verdeeld : a. De verdelingsvrije mdhoden. Deze danken hun naam aan de eigenschap, dat zij kunnen worden toegepast zonder dat men onderstellingen behoeft te maken omtrent de vorm van de verdelingen van de populaties, waaruit de bestudeerde steekproeven stammen. Het zijn primair technieken voor het toetsen van hypothesen. b. De klassieke methoden. Deze berusten op de onderstelling, dat de bestudeerde steekproeven afkomstig zijn uit normaal verdeelde populaties en betreffen toetsingen en schattingen omtrent gemiddelden en spreidingen van de populatieverdeüngen. In de vier volgende hoofdstukken behandelen wij een aantal verdelingsvrije toetsen. In deel II komen dan de klassieke methoden aan de orde. In dit deel zullen wij ook de voor- en nadelen van deze twee soorten methoden tegen elkaar afwegen en nagaan, hoe men in de praktijk tot een verantwoorde keuze tussen deze methoden kan komen. 8.2. De verdelingsvrije toetsen in tabel 8.1 Deze tabel geeft een systematisch overzicht van de toetsen, die in de hoofstukken 9 en 10 behandeld worden. Hierbij zijn wij uitgegaan van de aard van de bestudeerde kenmerken en van het aantal der steekproeven, waarop de toetsing wordt gebaseerd. 8.2.1. AARD VAN DE KENMERKEN
In tabel 8.1 is in de eerste plaats onderscheid gemaakt tussen toetsen, die op kwalitatieve waarnemingen betrekking hebben (A, hoofdstuk 9) en toetsen, die op kwantitatieve waarnemingen kunnen worden toegepast (B, hoofdstuk 10). De 'kwantitatieve' toetsen in 10,3 t/m 10,8 kunnen worden gebruikt: 1°. Als de waarnemingen een variabele betreffen; elke toets bezit dan een klasdeke tegenhanger, die in deel II wordt behandeld, en 2°. Als men de waarnemingen naar grootte kan rangschikken. 169
8,2
VERDELINGSVRIJE METHODEN
De 'kwalitatieve' toetsen zijn toe te passen : 1 °. Als de waarnemingen attributen betreffen, en 2°. Als men kwantitatieve waarnemingen in kwalitatieve omzet, bv. door de waarden in een steekproef te splitsen in de categorieën 'boven de mediaan' en 'ten hoogste gelijk aan de mediaan'. Men doet dit wel, omdat meestal de kwalitatieve toets sneUer kan worden uitgevoerd dan de kwantitatieve. Ook kan het voorkomen, dat de kwantitatieve waarnemingen discreet verdeeld zijn over zo weinig klassen, dat men deze beter als kwalitatieve categorieën kan beschouwen. In het algemeen is echter deze omzetting niet aan te bevelen, omdat daardoor informatie verloren gaat. 8,2.2. DE STEEKPROEVEN
In tabel 8.1 zijn vier soorten steekproeven onderscheiden, die elk aan de hand van enige voorbeelden worden toegelicht : a. Eén asdecte steekproef md één waarneming per element, d.w.z. van elk element wordt bepaald, wdk kenmerk het draagt van een bepaald categorisch systeem van kenmerken (resp. welke waarde het bezit van een variabele). Op grond v£in zo'n steekproef kan men hypothesen toetsen omtrent de populatieverdeling. Voorbeelden 8.1.
Men wil - op grond van een aselecte steekproef van 360 worpen - de hypothese toetsen, dat een dobbelsteen zuiver is.
8.2.
Op basis van een aselecte steekproef van n elementen uit een bepaalde populatie wil men de hypothese toetsen, dat de grootheid x in deze populatie een Poisson-verdeUng volgt.
b. Eén {aselecte) steekproef met verwante waarnemingen. Aan elk element in de steekproef verricht men op systematische wijze twee of meer waarnemingen betreffende hetzelfde categorische systeem of dezelfde variabele (verricht men twee waarnemingen, dan spreekt men van gepaarde waarnemingen). Voorbeelden 8.3.
Men wil het effect van een behandelingswijze bestuderen. Men verricht daartoe bij een aantal aselect gekozen patiënten één waarneming vôôr en één waarneming na de behandeUng. Men meet bv. de systoUsche bloeddruk van elke patiënt vôôr en zekere tijd na de toediening van een middel, waarvan men verwacht dat het bloeddrukverlagend werkt.
8.4.
Men wü de constantheid van een meettechniek onderzoeken. Men verricht dan bepalingen in triplo, waarbij men na de eerste waarneming op latere tijdstippen aan hetzelfde object (dat geen verandering heeft ondergaan) een tweede en derde waarneming laat volgen.
8.5.
Men onderzoekt de gelijkwaardigheid van k onderzoekers bij het gebruik van dezelfde meetmethode. Men laat dan aan elk van n objecten elke onderzoeker. onafhankeUjk van de anderen, één waarneming verrichten.
170
VERDELINGSVRIJE METHODEN 8.6.
8.3
Men vergeüjkt twee behandelingen met de methode der best-passende contrôles. Tegenover ieder individu met behandeling A wordt een contrôle-individu met behandeling B (is bv. : geen behandeUng) geplaatst, dat er in vrijwel alle (resp. zoveel mogeüjk) opzichten mee overeenstemt. Men kiest hiertoe bv. tweeling-proefdieren van hetzelfde' geslacht. Per paar wordt dan door middel van een toevalsproces uitgemaakt, welk individu behandeling A ondergaat.
c. Twee of meer aselecte steekproeven. Deze kunnen tot stand komen, indien men uit iedere te onderzoeken populatie aselect een steekproef trekt. Zij kunnen ook worden verkregen, als men éen steekproef uit een bepaalde populatie aselect in twee of meer (bij voorkeur gelijke) subgroepen splitst. Voorbeelden 8.7. Men wü de hypothese toetsen, dat de hemoglobinegehalten van meisjes van 12, 13, 14, 15 en 16 jaar gemiddeld hetzelfde zijn. Men trekt daartoe aselecte steekproeven uit de 5 betrokken populaties (die uiteraard nauwkeurig operationeel gedefinieerd dienen te worden). 8.8.
Men wü onderzoeken of de frequentie van longtumoren bij muizen bij twee verschiUende behandeUngen verschillend is. Men splitst daartoe een groep van 2n muizen aselect in twee subgroepen van n muizen en geeft de ene groep behandeUng A, de andere behandeling B.
d. Eén asdecte steekproef md waarnemingsparen. Deze verkrijgt men, als men aselect een steekproef van n elementen trekt en per element een waarneming verricht aan ieder van twee categorische systemen of grootheden. Per element beschikt men dan over een waarnemingspaar. Op grond van de n waamemingsparen kan men de h3T)othese toetsen, dat de categorische systemen of grootheden stochastisch onafhankelijk zijn. Voorbeeld 8.9. Toetsing van de hypothese, dat gewicht (x) en S3rstolische bloeddruk (y) stochastisch onafhankelijk zijn. Uit de te bestuderen populatie trekt men een steekproef van n elementen en bepaalt per element het waarnemingspaar {x, y).
8.3. Andere verdelingsvrije methoden In hoofdstuk 11 worden enkele toetsen tegen verloop (trend) in één waamemingsreeks behandeld. De te toetsen hypothese luidt-hierbij, dat de waarnemingen in aselecte volgorde staan met als alternatieve hypothese, dat in de volgorde een of ander verloop optreedt. Tenslotte volgen in hoofdstuk 12 verdelingsvrije toetsen tegen verloop in k aselecte èn in k verwante steekproeven en een toets betreffende k 2 x 2 tabeUen. De verdelingsvrije methoden zijn hiermee niet volledig behandeld. 171
8.3
VERDELINGSVRIJE METHODEN
In het algemeen zijn echter alleen methoden achterwege gdaten, die men in de praktijk weinig gebruikt ^, Wij noemen hiervan bv. : a. Het geven van een verdelingsvrij betrouwbaarheidsinterval van de mediaan van een continu verdeelde populatie. Zie hiervoor DixoN & MASSEY (8) of W A L K E R & L E V (35). b. De toets van KOLMOGOROV-SMIRNOV voor twee aselecte steekproeven. Zie SIEGEL (108).
c. De hoek-toets voor onafhankelijkheid. Zie W A L K E R & L E V (35) en (102). d. Verdelingsvrije methoden in de regressie-analyse. Zie hiervoor bv. T H E I L , Rapport S 59, Mathematische Centrum, Amsterdam.
1 Vanzelfsprekend is de gemaakte keuze niet geheel objectief.
172
HOOFDSTUK 9.
KWALITATIEVE VERDELINGSVRIJE TOETSEN De toetsen in dit hoofdstuk hebben alle betrekking op kwalitatieve waamemingsuitkomsten. Zij kunnen echter ook op kwantitatieve uitkomsten worden toegepast, indien deze in kwalitatieve worden omgezet. De wijze waarop deze omzetting plaatsvindt wordt zo nodig bij de kwalitatieve methode in een afzonderüjk punt aangegeven. 9.1. Inleiding 9.1.1. EXACTE TOETSING VAN DE HYPOTHESE Pi = P 2 = Pg Beschouw een populatie, waarvan de elementen kenmerk A, B oi C dragen. De populatieverdeling kan als volgt worden weergegeven: Kenmerk Kans
A
B
C
Pl
P.
P,
\
Totaal I
(Uiteraard is de verdeling volledig gespecificeerd, indien de kansen van twee van de drie kenmerken bekend zijn.) Men wil de hypothese Pi = Pg = Pg toetsen en kiest als drempelwaarde a =^ 0,10. Men trekt aselect een steekproef van « = 6 elementen en deze bevat /i = 5 elementen .4, /g = O elementen ß en /g = 1 element C. Hoe verloopt de toetsing en tot welke uitspraak komt men? Onder Hg is P^ = Pg = Pg = ^. Intuïtief zal men dus geneigd zijn tot het verwerpen van Hg te besluiten, als in de getrokken steekproef de fracties pi = fJn, p2 = /^/n en p^ == f^jn (/a = » — /i — /a) 'duidelijk' van ^ afwijken, d.i. als de waargenomen frequenties fi, /g en /g 'duidelijk' verschillen van de verwachte frequenties onder Ho: ßi = Cg = ^s = i » = 2 (e van 'expected'). Voor M = 6 zijn de uitkomsten, die het sterkst van deze verwachtingen afwijken: fi = 6, /g = O, /g = 0; fi = 0. /g = 6, /g = 0; A = O, fa = O, /g = 6. Onder Ho kan de kans op elk dezer uitkomsten met (4.18) worden berekend. Men vindt dan: P{fi = 6,/g = 0,/g = 0) = P{fi = 0,/g = 6,/g = 0) 6!
/1\6
1
= P(/i. = 0,/g = 0,/, = 6)=-^jÖ!ÖrU) =-72 729' 173
9,1
KWALITATIEVE VERDELINGSVRIJE TOETSEN
De kans op een uitkomst van het type (6,0,0) is dus onder Hg: 3 X 7729 =
IttO-
De kans op de uitkomst /i = 5, /g = 1, /g = O is: 6! / 1 \« 6 P(/i = 5 , / g = l , / g = 0 ) = 3 ^ j ^ ( 3 ) = — . Een uitkomst van dit type kan op 6 manieren tot stand komen (t.w. 5, 1, 0; 5, O, 1 ; 1, 5, 0; 1, O, 5; O, 5, 1 ; O, 1, 5) zodat de kans op het type (5, 1, 0) gelijk is aan 6 X Vvas = 'VTZSDe kansen van de andere mogelijke uitkomsttypen kunnen op dezelfde wijze berekend worden. Men verkrijgt dan de kansverdeling in tabel 9.1, waarin de typen zijn geplaatst in volgorde van toenemende discrepantie t.a.v. het verwachte type onder Hg, (2, 2, 2). Tabel 9.1. KansverdeUng van het uitkomsttype bij aselecte trekking van 6 elementen uit een populatie van grote omvang met P i = P^ = Po = ^ Cumulatieve Type Frequentie P kans 2,2,2 0,1235 0,1235 90 3,2.1 360 0.4938 0,6173 3.3.0 60 0,0823 0,6996 4,1.1 90 0,1235 0,8231 4,2.0 90 0,1235 0,9466 5,1.0 36 0,0494 0,9960 6,0.0 3 0.0041 1,0001 Totaal 729 1.0001
Daar a = 0,10 bestaat de kritieke zone uit de uitkomsttypen (6, O, 0) en (5, 1, 0), met az = 0,0041 -f- 0,0494 = 0,0535. De waargenomen uitkomst fi = 5, /g = O, /g = 1 behoort tot het type (5, 1, 0) en ügt dus in de kritieke zone, zodat Hg wordt verworpen. In 6.2 hebben wij uiteengezet, dat men feiteUjk steeds het onderscheidingsvermogen van een toets t.o.v. de verschiUende mogeüjke alternatieve h3T)othesen dient te bestuderen. Bij toetsing van de hypothese P = Po kan men dit doen, door de werkingskromme van de toets op te stellen. Is een dergelijke procedure ook bij deze toets mogelijk ? Jammer genoeg moet het antwoord op deze vraag ontkennend luiden. Bij toetsing van de hypothese P^ = Pg = Pg = ^, is nl. het alternatief samengesteld uit mogelijkheden van verschillend karakter, zoals bv.: Pj, = 0,9, Pg = 0,05, Pg = 0,05; Pi = 0,6, Pg = 0,1, Pa = 0,3; Pl = 0,2, Pg = 0,3, Pg = 0,5, enz. Onder alternatieve hypothesen van deze vorm is de kans van bv. de uitkomst /i == 6, /g = O, /g = O niet gelijk aan de kans v£m de tot hetzelfde type behorende uitkomsten /i = O, /g = 6, /g = O en /i = O, /g = O, /g = 6. Zelfs als men één alternatief specificeert, is het hierdoor niet mogeüjk het onderscheidingsvermogen van de kritieke zone te bepalen. Men zal zich 174
INLEIDING
9.1
daarom bij het toepassen van deze toets (en bij de analoge toetsen in dit hoofdstuk) steeds moeten realiseren, dat men uitsluitend de kans op het ten onrechte verwerpen van .ffo ^^ de hand heeft en dat het onderscheidingsvermogen in hoge mate afhankelijk zal zijn van de steekproefomvang. De berekeningen die nodig zijn voor het verkrijgen van de exacte kansverdeling van de toetsingsgrootheid (het uitkomsttype) onder Ho worden bij grotere steekproefomvang en/of bij een groter aantal categorieën zo omvangrijk, dat zij praktisch onuitvoerbaar zijn. Ook in dit geval dient men daarom weer van een benaderingsmethode gebruik te maken, die wij in de volgende punten inleiden. 9.1.2. X^ ALS
MAAT VOOR DE DISCREPANTIE TUSSEN WAARGENOMEN EN VERWACHTE FREQUENTIES
Overeenkomstig 9.1.1 gebruiken wij in het vervolg de symbolen: fi = de waargenomen frequentie in categorie i. Als er k categorieën k
zijn, is dus 2J fi = n. Ci = nPi = de verwachte frequentie in categorie * onder Hg. Dus k
ook : 2 e i = n. i=l
Daar 27/» = Uct, is Z{fi — e<) = O en zodoende onbruikbaar als maat voor de discrepantie tussen het waargenomen en het verwachte uitkomsttype. Dit bezwaar kan worden opgeheven door de verschillen fi — Bi te kwadrateren. Elke waarde (/< — e^^ dient echter te worden beschouwd in betrekking tot e,, daar een verschil van bv. 10 bij Cf = 10 veel belangrijker is dan een zelfde verschil bij e^ = 1(X). Deze intuïtieve redenering brengt ons tot de grootheid Cl
fg
e^
dus
(9.1)
zs^yi^jzi^
als maat voor de discrepantie tussen de in de steekproef waargenomen en de onder Hg verwachte frequenties. X^ is een discrete grootheid, die geen negatieve waarden aanneemt. Als alle verschillen /< — c^ nul zijn (d.i. als voor elke categorie de waargenomen en de verwachte frequentie geheel overeenstemmen), is .X^* = 0. Naarmate de overeenstemming slechter wordt zijn de absolute waarden van de verschillen fi — Ci groter en neemt .X"* een grotere waarde aan. Voor het uitkomsttype (4, 1, 1) (zie 9.1.1) verloopt de berekening van de bijbehorende waarde van X^ als volgt: 175
9.1
KWALITATIEVE VERDELINGSVRIJE TOETSEN Tabel 9.2. Berekening van .y« Categorie
fi
«<
fi-^i
A B C
4 1 1
2 2 2
2 -1 -1 0
ei)'
(/* -
4 1 1
ifi - «*)' 2,0 0,5 0,5 3,0 = .y«
Van elk uitkomsttj^je kan op deze wijze de corresponderende waarde van X* worden berekend. Men vindt dan de waarden in tabel 9.3; de kans van elke waarde kan aan tabel 9.1 worden ontleend. Daar de uitkomstts^pen (4, 1, 1) en (3, 3, 0) dezelfde waarde van .X"* opleveren, zijn zij in tabel 9.3 gecombineerd. Men ziet, dat X^ = O voor het type (2, 2, 2) en dat X^ de grootste waarde aanneemt voor het tj^e (6, O, 0) dat hiervan het meest afwijkt. Tabel 9.3. Exacte kansverdeling van X* voor het probleem in par. 9.1.1 M = 6, P l = Pa = Pa = i Cumulatieve Type X' P kans 2,2,2 0,1235 0,1235 0 3,2,1 1 0,4938 0,6173 4,1,1 31 0,2058 0,8231 3,3,0 3J 4,2.0 4 0,1235 0,9466 5.1.0 7 0,0494 0,9960 6,0.0 12 0,0041 1,0001
Het blijkt nu, dat de discrete kansverdeling van X^ (zoals deze in tabel 9.3 voor het toetsingsprobleem in 9.1.1 is opgenomen) benaderd kan worden door de best-passende ;^*-verdeling (d.i. een theoretische continue kansverdding, die wij in 9.1.3 bespreken). De benadering is reeds bevredigend, als de verwachte frequenties ten minste gelijk zijn aan 5 en zij is zeer nauwkeurig voor grote steekproeven. Hoewel de exacte verdeüng van X^ in tabel 9.3 slechts betrekking heeft op een steekproef van 6 elementen met verwachte frequenties, die aanzienlijk lager zijn dan 5, vertoont de best-passende ;f*-verdeüng zelfs in dit geval reeds een vrij redeUjke overeenstemming met de verdeling van X} (zie figuur 9.1). Figuur 9.2 laat zien, dat de benadering beter wordt bij toenemende n. De (exact berekende) somfrequentieverdeling van X^ voor n = 12 is in deze figuur vergeleken met de best-passende cumulatieve ;^^verdeling. Men dient hierbij dan nog te bedenken, dat de nauwkeurigheid van de aanpassing vooral van belang is voor betrekkelijk grote waarden van X^, d.i. dus bij cumulatieve kansen tussen 0,90 en 1. 176
9.1
INLEIDING 1.0
—
-_-
0.9
"H 11 _ J I Œ T J - ^ ^ ' ^ " ^^^""^
- ^
0.8
—
•
S 0.7
~ ~S'. / -
.S
« 0.6
latiev
/ /
|0.4
r
U
0.3 0.2
— yƒ _
0.1
^
1
I
1
1
1
1
1
1
_ l 10
1 — 1 — 1 11 12
«'(z') Figuur 9.1. Cumulatieve verdeling van X* en de best-passende cumulatieve ;(*-verdeling' bij toetsing van de h}q>othese /"i = Pj = P3 = J- »2 = 6.
Bij het toetsen van h5^othesen betreffende populaties met k categorieën kan men dus, indien het aantal waarnemingen niet te kleiii is, gebruik maken van de toetsingsgrootheid X^, waarvan de exacte kansverdeling benaderd wordt met de best-passende %*-verdeling. Dit
3
4
5
6
10
11
12
Figuur 9.2. Als figuur 9.1. maar voor n = 12.
177
9,1
KWALITATIEVE VERDELINGSVRIJE TOETSEN
flüaakt hét mogelijk een benaderende overschrijdingskans van XQ* (de uit een steekproef berekende waarde van X^) direct af te lezen uit tabellen, waarin fractiden van ;f*-verdelingen zijn opgenomen. 9.1.3. X*-VERDELINGEN
9.1.3,1. H d gebruik van tabd D. Een ;f^-verdeling is een kansverdeling, die voUedig gespecificeerd wordt door één parameter, het aantal vrijheidsgraden v (de Griekse letter nu ; men gebruikt ook wel d van het Engelse 'degrees of freedom'). In tabel D zijn verschillende fractielen van de ;f "-verdelingen met j» = 1, 2, , 3 0 gegeven. Elke regel in deze tabd bevat fractielen van één ;f*-verdding. Beschouw bv. de ;f*-verdeling met j» = 4, die in figuur 9.3 is getekend. In tabel D leest men op de regel r = 4 en in de kolom, waarboven ;f%,go staat, de 40.20 0,20
1s
0.18 0.16 0,U 0.12 0.10 0.0 8 0.06
0.02
j
^
vl
1? la
•X2 t'0,80
1^.50
1 1
\ l\
1 1 1 1 1 1
V \
V
NV \
1^^ 42 1,64»
1 1 1
"i"
R'NI 1
^0.99
SS
K^
fe^
>Ó.95
1—
V>]
1 1 11
^
4-
3t
43S7
i
5
6 9^969
7
-4-
9 |10
^ 11
12
4=
13 f 14
15
16
17
13.277
Figuur 9.3. x'-"verdeling met 4 vrijheidsgraden.
waarde 1,649 af, dus kortweg: x\io{v = 4) = 1,649. Dat wil zeggen, dat voor deze ;f "-verdeüng geldt : Het fractiel 0,20 (20e percentiel, 2e deciel) is 1,649, of: 20% van het oppervlak onder de kromme in figuur 9.3 ligt links van de ordinaat in het punt 1,649 op de X-as. Men kan dus ook schrijven : P(Z«^ 1,649) = P L ( 1,649) =0,20 en P(z"> 1,649) =Piï( 1,649)=0,80. Is van deze ;K"-verdeling een waarde gegeven, dan kan men in het algemeen met tabel D de linkse of rechtse kans van deze waarde niet precies bepalen. Van x\v = 4) = 11 kan men bv. dechts zeggen, dat de linkse kans groter is dan 0,95 en kleiner dan 0,99 (zie figuur 9.3). 178
;f"-VERDELINGEN
9.1
In figuur 9.4 zijn de ;f"-verdelingen met 2, 4, 6, 8 en 10 vrijheidsgraden getekend. Deze figuur toont aan, dat de vorm van een x^verdding afhangt van de parameter v. De verdelingen met een klein aantal vrijheidsgraden zijn (zeer) scheef naar rechts, maar die met een groter aantal vrijheidsgraden neigen reeds tot S3nnmetrie.
O
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18
^2
Figuur 9.4. ;(*-verdelingen met 2, 4, 6, 8 en 10 vrijheidsgraden.
Voor V > 30 kan tabel D niet meer worden gebruikt, maar R. A. heeft aangetoond, dat men dan de rechtse overschrijdingskans van x^ bij benadering kan bepalen door te berekenen
FISHER
(9.2) To = V2zo" - V 2 v - 1 en de rechtse kans van To in tabel A op te zoeken. Deze benadering is voor j» = 30 reeds zeer goed. In tabel D leest men dan bv. af: ;^"o,96 = 43,773. Bepaalt men voor deze waarde van y^ met 30 vrijheidsgraden, die exact een overschrijdingskans van 0,05 bezit, de benaderende kans met (9.2), dan vindt men: r o = V2(43,773)- V2(30)-T= 1,675, PR{ 1,675)=0,047 (tabd A). 179
9.1
KWALITATIEVE VERDELINGSVRIJE TOETSEN
Tendotte vermdden wij, dat het gemiddelde van een ;f"-verdeling gelijk is aan v en dat haar modus v — 2 is (behoudens voor v < 2 ) . 9.1.3.2. Vrijheidsgraden. Onderstel dat men zonder enige beperking 5 getallen opschrijft. Elk der getallen kan volkomen vrij worden gekozen. Men drukt dit uit door te zeggen: er zijn 5 vrijheidsgraden. Onderstel vervolgens, dat gevraagd wordt 5 getallen op te schrijven met de restrictie, dat hun som een bepaalde waarde, zeg 50, dient te hebben. Er kunnen dan 4 getaUen vrij worden gekozen, maar daarmee is het vijfde bepaald door de gestelde voorwaarde : Xi -\- X2 •\- x^ -\-\- Xi-\- Xs = 50. Het aantal vrij te kiezen getaUen is dus 5 — 1 = 4 en men zegt dan : er zijn 4 vrijheidsgraden. Als gevraagd wordt 5 getallen op te schrijven, zodanig dat hun som geüjk is aan 50 èn de som van de eerste twee getallen gelijk is aan 20, dan zijn er twee onafhankelijke restricties: Xi-\- X2 + x^ -\- x^ -\- Xi = 50 en Xi-\- Xt=' 20. Zodra Xi gekozen is, ligt X2 vast : ;çg = 20 — Xi. En *3 + Af« -H *5 = 50 — 20 = 30, zodat hiervan slechts twee getallen vrij kunnen worden gekozen. Het aantal vrijheidsgraden is hier dus 1 4-2 = 3, d.i. het totale aantal keuzen verminderd met het aantal onafhankdijke restricties : 5 — 2 = 3. Bij elk statistisch probleem, waarbij vrijheidsgraden betrokken zijn, kan men het aantal daarvan op overeenkomstige wijze vaststellen, d.w.z. door het totale aantal 'keuzen' met het aantal daaraan verbonden onafhankelijke restricties te verminderen. Beschouw bv. het probleem in 9.1.1. De populatie bestaat uit elementen, die het kenmerk A, B of C dragen. De elementen in de steekproef behoren dus tot één der categorieën A, B ot C. De hiermede corresponderende steekproeffrequenties /i, /g en /g zijn onderhevig aan de restrictie : /i -|- /g + /s == 6, d.w.z. als de frequenties van twee categorieën bekend zijn, ligt de frequentie van de overblijvende categorie vast. Er zijn bij dit probleem dus 3 — 1 = 2 vrijheidsgraden. Als men een steekproef van 500 elementen trekt, is /i -f /g H- /g = 500 en het aantal vrijheidsgraden blijft 3 — 1 = 2 . Voor elk probleem, waarbij een hypothese wordt getoetst betreffende de samenstdüng van een populatie, die 3 categorieën telt en waarbij de enige restrictie is gelegen in de steekproefomvang, zijn er dus 2 vrijheidsgraden. Bevat in zo'n geval de populatie k categorieën, dan zijn er Ä — 1 vrijheidsgraden. In de volgende paragrafen komen echter ook problemen met k categorieën en m onafhankelijke restricties ter sprake : het aantal vrijheidsgraden is dan k — m. 9.1.3.3. De best-passende x^-^erdding. In 9.1.2 hebben wij reeds gezegd, dat de verdeling van de toetsingsgrootheid X^ bij het toetsen van de hypothese Pi = Pg = Pg = ^ onder bepaalde voorwaarden kan worden benaderd door de best-passende ;^"-verdeling. Wij kunnen 180
TOETSING VAN HYPOTHESEN BETREFFENDE POPULATIEVERDELINGEN 9.2
nu dus een stap verder gaan en zeggen : bij toetsingsproblemen van dit type (met één restrictie: de steekproefomvang) is dit de ;f"-wer«i!eZt«g met k — 1 vrijheidsgraden. De keuze van deze best-passende verdeling berust dus uitduitend op Ä en niet op n. Bij problemen, waarbij k hetzelfde is zal de %"-verdeling echter beter 'passen', naarmate de steekproefomvang n groter is. De uitvoering van de toetsing met de ;f"-benadering bespreken wij verder in 9.2. 9.1.4. OPGAVEN 9.1. Verifieer de volgende kansen met tabel D : a. P{X'<2.70b\v = 1 ) = 0 , 9 0 /. P(0,103»<5,991|»=2)=0,90 b. P(Zï'>3,841|)> = 1 ) = 0 , 0 5 g. P(?«>0,711|v = 4) = 0,95 c. P(Z«>5,991|»' =2) =0,05 h. P(Z>>9,342|v = 10) = 0,50 d. P(/a<11.070|i'=5)=0,95 i. 0,02>P{P>l6,3lv = 6)>0,0l e. P(Z«>30,578|i'=15)=0.01 ƒ. 0.02520|i'= 11)<0,05. 9.2.
9.3.
Bepaal met tabel D de grenzen, waartussen de volgende kansen Uggen: a. P ( P > 7,1 I V = 1) /. P ( P > 5,5 11. = 4) b. P i p > 7,1 I V = 2) g. P ( P < 22 I K = 10) c. P(X' > 7,1 I V = 4) h. P ( P > 42,5 | » = 25) d. P(X^ > 7,1 I » = 8) i. P(Z* < 8,75 | v = 20) e. P { P > 7,1 I v = 16) j . P ( P > 22,5 I » = 5). Bepaal bij benadering de volgende kansen : a. P { P > 57,51 11> = 35) b. PCX" > 45 | »> = 41).
9.2. De /"-benadering voor het toetsen van hypothesen betreffende de popiüatieverdeUng 9.2.1. DE POPULATIEVERDELING TELT K CATEGORIEËN EN IS ONDER Hg VOLLEDIG GESPECIFICEERD
De ;u"-benadering betreft toetdng van hs^othesen van de vorm Ho: Pi = P 2 = . . . = Pk of Pl : Pg : . . . : P» = « : 6 : . . . : m. De toetsingsgrootheid is k
(9.3)
^' = X ^ ^ ~ J ^
('* = ^*''^-
i=l
De grootheide" volgt bij benadering een ;f"-verdeling met k — 1 vrijheidsgraden, indien n niet te klein is, zodat de verwachte frequenties Ci minstens gdijk zijn aan 5. De toetsing geschiedt rechts éénzijdig, daar een dechte overeenstemming tussen de waargenomen en verwachte frequenties tot hoge waarden van 2[" Iddt. Bij een onbetrouwbaarheidsdrempd a zal men dus tot het verwerpen van .ffo besluiten voor ^o'' > z \ - „ {v = k - 1). ^0* is de uit de steekproef berekende waarde van X". De kritieke 181
9,2
KWALITATIEVE VERDELINGSVRIJE TOETSEN
waarde x \ - a kan voor verschülende waarden van a e n v = 1,2, . . . , 30 uit tabel D worden afgelezen. Bv. : a
0,05
X*i-a
X\w 5,991 7,815 11,070
»= 2 »- = 3 »- = 5
0,025 X\,ns 7,378 9,348 12,832
0,02
0,01 X'o,n 9,210 11,345 15,086
X'o.«8
7,824 9,837 13,388
0,005
0,001
Z*o.»«s 10,597 12,838 16,750
X\n» 13,815 16,268 20,517
Toetst men bv, bij een drempdwaarde 0,01 en telt de populatieverdeling 6 categorieën, dan wordt Hg verworpen indien .^o* > 15,086 [ = X\w (" = 5)] is. Voorbeelden 9.1. Men wU onderzoeken of een dobbelsteen zuiver is en werpt daartoe 360 keer met deze steen. De volgende uitkomsten worden waargenomen: Aantal ogen = Xf
1 67
fi
2 52
3 39
4 72
5 55
6 75
Totaal 360
De toetsing verloopt als volg^: «. De te toetsen hypothese luidt Hg : P ( l ) = P(2) = = P(6) = f b. Men kiest a = 0,05, d.w.z. men is bereid Hg te verwerpen, indien de overschrijdingskans van de waargenomen waarde van de toetsingsgrootheid < 0,05 is. c. Onder Ho is de verwachte frequentie per categorie (aantal ogen): e< = 360 X -J- = 60. De toetsingsgrootheid is X'
= y
ifi - ^iV _ 2[fi - ej)*
»=1
De grootheid X* volg^ dan bij benadering een x*-verdeling met 6 — 1 = 5 vrijheidsgraden. d. Er wordt rechts éénzijdig getoetst. Uit tabel D blijkt, dat Ho bij de gekozen drempelwaarde 0,05 wordt verworpen, indien Xo* > 11,07 [daar xV.sl" = 5) = 11,070], e. Bereken VS (67 - 60)' -I- (52 - 60)' + (39 - 60)' + . . . + (75-60)» ^0 = ^ö ~ '^'^• /. Verwerp Ho, daar Xo' groter is dan de kritieke waarde, 11.07. (Uit tabel D büjkt, dat de overschrijdingskans van Xo' kleiner is dan 0,01.) Opmerking: De uitkomsten betreffen een opzetteUjk vervalste dobbelsteen. In het middelste oog van het vlakje met 3 ogen werd een gaatje geboord, waarin een stukje lood werd aangebracht. 9.2.
182
Bij kruising van twee soorten erwten (met gele ronde, resp. met groene gerimpelde zaden) vond MENDEL de in tabel 9.4 onder fi vermelde frequenties voor de verschillende zaadsoorten. Volgens hét genetisch model zouden deze frequenties de verhouding 9 : 3 : 3 : 1 moeten hebben. Men wil de overeenstemming onderzoeken tussen dit model en de waarnemingen.
TOETSING VAN HYPOTHESEN BETREFFENDE POPULATIEVERDELINGEN 9.2 Tabel 9.4. Frequenties van de zaadsoorten bij kruising van, twee soorten erwten Categorie A. B. C. -D.
Rond en geel Gerimpeld en geel Rond en groen Gerimpeld en groen Totaal
Waargenomen fi 315 101 108 32 556
Verwacht
fi-^i
(fi-ei)*lei
312,75 104.25 104.25 34.75 556,00
2,25 -3,25 3,75 -2,75 0,00
0,016 0,101 0,135 0,218 Xo' = 0,470
De «. b. c.
toetsing verloopt als volgt: Ho: P(A) = »/i,, P(B) = '/i„ P{C) = Vu. P{0) = VuKies à = 0,05. Onder Ho volgt de grootheid X ' [volgens (9.3)] bij benadering een Z'-verdeUng met v = 3. d. De toetsing is rechts éénzijdig. Uit tabel D blijkt, dat Ho bij de drempelwaarde 0,05 wordt verworpen voor X ^ > 7,815. e. Bereken X ^ . Deze berekening is in tabel 9.4 uitgevoerd en levert op : Xo' = 0,470. ƒ. Ho wordt niet verworpen. De rechtse kans van X ^ Ugt tussen 0,90 en 0,95, zodat de overeenstemming tussen de waarnemingen en het genetisch model bijzonder fraai is.
Als de waarnenüngsuitkomsten in fracties (of percentages) zijn gegeven, kan men X ^ als volgt.berekenen: (9.4) i=l
waarin pi == de waargenomen fractie in categorie i. Pi = de kans van categorie i onder Hg. Uit deze formule blijkt, dat de waarde van X" bij geüjkbüjvende verhouding van de waargenomen frequenties recht evenredig is aan n. Verder toont zij, dat men de waarde van X* iiiet kan berekenen, als uitsluitend fracties of percentages bekend zijn en als n onbekend is. Voert men in zo'n geval de berekening bv. met de gegeven percentages uit, dan handelt men alsof » = 100. Is de steekproefomvang in werkeUjkheid groter, dan is de berekende Xg^ een onderschatting van de juiste waarde; bij een kleinere steekproef verkrijgt men een geflatteerde uitkomst. 9.2.2. POPULATIEVERDELINGEN MET 2 CATEGORIEËN
Als de populatieverdeüng dichotoom is en de categorieën A en B bevat, kan men de hs^jothesen omtrent deze verdeling, van de vorm ffo^ P{A) = P = Pg toetsen volgens de in 6,2 en 6.3 behandelde methoden. In plaats van de aldaar gegeven normale benadering kan men ook de in deze paragraaf besproken ;f*-benadering toepassen. De best-passende ;f"-verdeling bezit dan 2 — 1 = 1 vrijhddsgraad. 183
9.2
KWALITATIEVE VERDELINGSVRIJE TOETSEN
Onderstel bv., dat men de hj^othese P = Po toetst (dan is Co = 1 — Po) en dat een aselecte steekproef van de omvang n bestaat uit Xg elementen A e n n — Xg elementen B. Dit zijn dus de waargenomen frequenties; onder Hg zijn de verwachte frequenties Pgn elementen A en Qgn = n — Pon elementen B. Substitutie in (9.3) levert op: y g _ (^0 - Pon)' {{n - XQ) - { n - Pon)}» ' ~ Pon ^ Qon (^0 - Pon)Vo {Pon - Xo)^Po PoQon PoQon _ {XQ - Ppn)' {Po + Qo) _ (^0 - P,«)" PoQon PgQgn ' In dit geval met v = 1 kan de ;f"-benadering worden verbeterd door het aanbrengen van een continuïteitscorrectie, die bestaat uit een vermindering van de absolute waarde van Xg — Pgn met ^. Men verkrijgt dan: (95) X^ {\Xo~Pon\-i)' ^^•^^ ^^ PoQon Vergelijkt men deze formule met die voor de normale benadering in 6.3, formule (6,7), dan blijkt te gelden: Xg' = To". Voor een dichotome populatie is dus de ^"-benadering met v = 1 identiek aan de normale benadering bij tweezijdige toetsing. Wil men via de ;f"-benadering éénzijdig toetsen bij een drempelwaeirde a dan geldt bij : Hg:P < \ : Indien Xg > Pgn wordtff^overworpen voor A'o" > x\-ia h'— ' ) H g : P > \ : Indien Xg < Pgn wordtffoverworpen voor Xg» > x\-ia ^^—^) Bij éénzijdige toetsing met a = 0,05 verwerpt men dus Hg, indien Xg» > x\oo (" = 1), d.i. voor Xg» > 2,706. 9.2.3. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN
De ;f"-toets kan men ook toepassen, als men de hypothese wü toetsen dat een steekproef afkomstig is uit een populatie van een bepaald type (bv. normaal, binomiaal. Poisson). Wij bespreken deze toepassing in 10.1. 9.2.4. COMBINATIE VAN CATEGORIEËN BIJ TOEPASSING VAN DE z"-BENADERING
Om te lage verwachte frequenties te voorkomen zal men soms tot het combineren van categorieën moeten overgaan. Daar hierbij weer verües aan informatie optreedt, is het aanbevelenswaardig niet meer te combineren dan noodzakelijk is. In principe mag de combinatie van categorieën niet plaatsvinden op 184
TOETSING VAN HYPOTHESEN BETREFFENDE POPULATIEVERDELINGEN 9.2
grond van de waargenomen uitkomsten. Een voorbeeld moge dit verduideUjken. Voorbeeld 9.3. Onderstel, dat een proefpersoon de opdracht krijgt willekeurig 500 getallen van drie cijfers op te schrijven. Hierbij verkrijgt men voor het laatste cijfer van deze getallen de frequentieverdeling in tabel 9.5 (/). Men kan nu de h5rpothese toetsen, dat ieder cijfer dezelfde kans heeft om genoteerd te worden, met als tegenh5q)othese, dat bij de proefpersoon een preferentie voor sommige cijfers bestaat. Als men dit proefje verricht zal men echter normaliter niet weten, welke cijfers dit zijn. Tabel 9.5. VerdeUng van de laatste cijfers van 500 willekeurig genoteerde getaUen van drie cijfers Laatste cijfer
f e f-e
(f - e)'
0
1
2
3
4
5
6
7
8
9
Totaal
51 50 1 1
59 50 9 81
44 50 -6 36
41 50 -9 81
46 50 ~4 16
43 50 -7 49
46 50 -4 16
48 50 -2 4
60 50 10 100
62 50 12 144
500 500 0 528
528 ^o"(9) = - g ö - = 10-56 (P S 0,3) Het achter Xo' tussen haakjes geplaatste getal geeft het aantal vrijheidsgraden van de best-passende x'-verdeüng aan. Laatste cijfer 0, 1, 8, 9 2, 3, 4, 5, 6, 7
f \ e \ (lf-e\-O.S)' 232 200 1 992,25 268 1 300 1 992.25
_
992,25
= 8,27,
992.25 P < 0,01
In tabel 9.5 is eerst Xg» onder de te toetsen hypothese berekend. De uitkomst, .X'o*(9) = 10,56 geeft geen reden tot het verwerpen van ffo. Bestudeert men echter de afwijkingen /< — e,-, dan is daarin een zeker systeem te onderkennen: de cijfers 2 t/m 7 vertonen te lage waargenomen frequenties, de overige cijfers te hoge. Vormt men op grond hiervan de categorieën O, 1, 8, 9 en 2 t/m 7 en toetst men opnieuw, dan is de uitkomst Xo"(l) = 8,27, met een overschrijdingskans tussen 0,005 en 0,001, zodat men nu tot verwerpen van Hg zon beduiten. Deze handelwijze is echter niet geoorloofd, omdat men de tegenhypothese (preferentie voor O, 1, 8 en 9) heeft verkregen door selectie uit waamemingsuitkomsten, die bij toetsing met de juiste tegenhypothese (preferentie voor ?) niet significant zijn gebleken. Wil men verantwoord te werk gaan, dan dient men een nieuwe proef uit te voeren. Op basis van de daarbij verkregen uitkomsten kan men dan de hypo185
9.2
KWALITATIEVE VERDELINGSVRIJE TOETSEN
these 'geen preferentie' toetsen met als alternatief 'preferentie voor O, 1,8 en 9'. 9.2.5. OPGAVEN 9.4.
Deze opgave is bestemd voor klassikale uitvoering. Ieder trekt aselect 5 (10) steekproeven van 25 elementen Categorie \ A B C uit de nevenstaande populatie. De P I 0,4 0,4 0,2 trekking kan worden uitgevoerd met "^~~~~^~~"^"~~~^^~~~~^ een tabel met aselecte getaUen, waarbij men neemt: ^ = O, 1, 2, 3, P = 4, 5, 6, 7 en C = 8 en 9. Bereken voor elke steekproef Xo' en stel V£m aUe gevonden waarden een frequentieverdeUng op. VergeUjk A^'o,«o> -^*o,»6 ^n -^o,«9 •^^•i deze verdeling met x'o.oB. X^o.n ^^ z'o,89 van de best-passende ^'-verdeling {v = 2).
9.5.
Toets de h3rpothese, dat onderstaande steekproef afkomstig is uit een populatie met P(A) = P(B) = P(C) = P(D) = J. Kies a = 0,05. Categorie
A 65
f 9.6.
B 40
C 42
D 53
Totaal 200
Bij 300 worpen met een dobbelsteen verkrijgt men de volgende uitkomsten :
/
1 I 45
40
38
53
60
64
a. Welke hypothese toetst u ? Tot welke conclusie komt u ? Op grond van deze uitkomsten besluit men nogmaals 300 worpen te verrichten. De uitkomsten zijn :
T] f
1 41
2 36
3 44
4 63
5 56
6 60
b. Welke hypothese toetst u nu? Geef uw conclusie en commentaar. 9.7.
Uit PEARL
(48).
'When a yeUow starchy variety of maize was crossbred with a sweet variety there was produced in the first generation uniformly yeUow starchy progeny, in accordance with Mendel's law of dominance. When these first generation crossbred kernels were planted they gave rise to a second crossbred generation in which each ear bore four different kinds of kernels, in approximately the following proportions: 9 yellow starchy; 3 yeUow sweet; 3 white starchy; 1 white sweet. Fifteen trained observers were asked each to sort into these four classes and count independently the kernels on each of a number of second generation ears. The results of the count on one such ear are shown in (the) table. The fifteen observers included two plant pathologists, two professors of agronomy, one professor of philosophy (originally trained as a biologist), four biologists, one computer, one practical com breeder, and one professor and three assistants in plant physiology.'
186
TOETSING VAN HYPOTHESEN BETREFFENDE POPULATIEVERDELINGEN 9.2 Table showing the classification of the kerneis of ear no. 8 by-the different observers Observer Mendelian expectation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total Mean
Classes of kernels White White starchy sweet
YeUow starchy
YeUow sweet
299,25
99,75
99,75
352 322 298 332 305 313 308 311 327 308 311 313 308 312 333 4753 316,9
102 49 75 101 101 100 86 101 101 92 97 99 97 104 97 1402 93,5
52 82 108 71 86 90 95 92 78 95 92 91 95 91 73 1291 86,1
Total starchy
Total . sweet
33.25
399,0
133,0
26 79 51 28 40 29 43 28 26 37 32 29 32 25 29 534 35,6
404 404 406 403 391 403 403 403 405 403 403 404 403 403 406 6044 402,9
128 128 126 129 141 129 129 129 127 129 129 128 129 129 126 1936 129.1
Toets voor iedere onderzoeker de hjrpothese, dat de afwijkingen van het genetisch model toevaUig zijn (a = 0.05) : a. Op basis van de voUedige uitkomsten. b. Op basis van de sub-totalen in de laatste twee kolommen. Tot welke conslusies komt u ? W a t valt u verder op (zie ook opgave 9il0). PEARL zegt zelf over de verkregen uitkomsten o.m. het volgende: 'The results shown . . . seem to have real significance to the methodology of biology in general, apart from specifically genetic problems. It must be remembered that each individual handled, sorted, and counted the same identical kernels of corn. They were required to discriminate only with reference to the color and the form of each kernel. Yet no two of the fifteen highly trained and competent observers agreed as to the distribution of these 532 kernels. When it is recalled that pathologists, clinicians, and anthropologists have to make fine distinctions relative to color and form regularly in the course of their work, the thought suggests itself that perhaps their records of observation on.man, a more compUcated entity than a maize kernel, may not have that absolute and ultimate verity t h a t some naive persons perhaps suppose they have.' 9.8.
Uit: Certificate Examination, Royal Statistical Society, 1948. Nevenstaande tabel vermeldt het aantal dagen (/), waarop R \ 0,00 0,04 0,10 0,20 0,50 1,00 de regenval in een bepaalde f 296 246 187 119 30 3 plaats in een periode van een jaar, R inches overschreed. Toets de hypothese, dat de regenval de 'wet': logio/ = 2,47 - 1,98Ä volgt.
187
9.3
KWALITATIEVE VERDELINGSVRIJE TOETSEN
9.3. De tekentoets 9.3.1. TOEPASSING
Deze toets ontleent zijn naam aan het feit, dat hij kan worden toegepast als men aan de verschillen tussen gepaarde waarnemingen een teken kan toekennen, d.i. kan aangeven voor welk lid van een paar de verkregen uitkomst 'groter' is. De tekentoets dient voor het toetsen van de hypothese Ho, dat de verschillen afkomstig zijn uit een populatie, waarvan de mediaan gelijk is aan nul. De praktische h3^othese die op deze wijze getoetst wordt is dat de verschiUen tussen de gepaarde waarnemingen toevalüg zijn. Voorbeeld 9.4. Uit VAN ELTEREN & RIJMKE (84). Na toediening van 3 ml arachisolie ontstaat bij ratten in het bloed een troebeüng. Men wil onderzoeken, of deze zg. lipemische troebeüng bij diabetische ratten gelijk is aan die bij normale ratten. De proef wordt bij paren ratten uitgevoerd. Dikwijls was het slechts mogelijk de troebeüng op het oog te vergeUjken, omdat er te weinig serum aanwezig was om het in de cuvette van de colorimeter te brengen. In sommige gevaUen, waarin het verschil niet duidelijk was en waarin er voldoende serum was, werd dit echter wel gedaan. De proef werd uitgevoerd met « = 17 rattenparen en de uitkomst was : -\- = Diabetisch meer troebeüng dan normaal 16 keer — = Diabetisch minder troebeüng dan normaal . . . . 1 keer. 9.3.2. DE TOETSINGSGROOTHEID Als toetdngsgrootheid wordt gekozen het aantal plussen, x. Voor voorbeeld 9.4 is dus: Xg= 16. 9.3.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER ffo Onder de nulhypothese is voor elk der n onafhankelijke waamemingsparen de kans op een verschil dat groter is dan nul gelijk aan de kans op een verschil dat kleiner is dan nul, of:
H g : P { + ) = P { - ) = \. Onder Hg volgt zodoende de grootheid x, het aantal plussen bij n gepaarde waarnemingen, de binomiale verdeling : P{x = x\Hg) = Q-2-». Luidt de alternatieve hypothese, dat de mediaan van de verschillen ongelijk is aan nul, dan is P{-\-) ^ \ e n wordt tweezijdig getoetst. Voor de alternatieve hs^pothese, dat de mediaan der verschillen kleiner is dan nul, is P(-|-) < J en dan vindt links éénzijdige toetsing plaats. Voor de alternatieve hypothese, dat de mediaan der verschiUen groter is dan nul, is P{-\-) > i, zodat rechts éénzijdig wordt getoetst. 188
DE TEKENTOETS
*
9.3
9.3.4, UITVOERING VAN DE TOETSING
Hiervoor kunnen wij verwijzen naar 6.2, waarin de toets voor de hypothese Hg : P = ^ uitvoerig is behandeld. Wij volstaan hier met te memoreren, dat men : a. De overschrijdingskans van Xg exact kan bepalen (bv. uit tabellen met binomiale kansen). b. Voor « <, 100 gebruik kan maken van tabel I, waarin voor tweezijdige toetsing en de drempelwaarden 0,01, 0,02, 0,05 en 0,10 de linker kritieke waarden XL van de grootheid x zijn opgenomen {XR = n — XL). Bij halvering van deze drempelwaarden kan de tabel ook voor éénzijdige toetsing worden gebruikt. c. Voor « > 30 de normale benadering via (6.5) of (6.6) kan toepassen. Omdat tabel I ter beschikking staat zal men hiervan gewoonüjk slechts gebruik maken, wanneer « > 100 is. Bij voorbeeld 9.4 vonden wij Xg = 16. Er wordt tweezijdig getoetst en wij onderstellen, dat a = 0,05 wordt gekozen. In tabel I vinden wij bij n = 17 en a = 0,05: XL = 4, dus XR = 17 — 4 = 13. Daar Xg deze kritieke waarde overschrijdt, wordt ffo verworpen ten gunste van het edtematief dat bij de diabetische ratten meer troebeüng optreedt dan bij de normale. Opmerking: De exacte tweezijdige overschrijdingskans van Xg kan in dit geval nog snel worden berekend, daar: PD(X = 16) = 2 lP(x = 17) + P { x = ^ 16)] = 2 [ C i , " - 2 - " + Ci,"-2-i'] = 2(1 + 17)2-" = 9 x 2 - « = 0,00027.
Onbesliste gevallen. Deze ontstaan als het verschil tussen de gepaarde waarnemingen nul is of een zo kleine omvang heeft, dat er ten gevolge van de beperkte nauwkeurigheid van de waarnemingsmethode geen uitspraak 'plus' of 'min' kan plaatsvinden. In het algemeen geldt, dat men deze gevallen het beste buiten beschouwing kan laten: de toetsing wordt dan uitgevoerd met het aantal paren, waarbij wel een uitspraak mogelijk is. Deze methode is beter (d.w.z, leidt tot een toets met een groter onderscheidingsvermogen) dan die, waarbij men de helft van de onbesliste gevaUen positief en de hdft negatief telt. Er kunnen zich echter dtuaties voordoen, waarbij het aantal onbesliste gevallen relatief groot en van bijzonder karakter is, zoals bv. het aantal personen in de categorie 'geen mening' bij een opinie-onderzoek. Het kan dan noodzakelijk zijn, wèl rekening met deze gevallen te houden. Zie hiervoor HEMELRIJK & VAN ELTEREN {93, 7,4 t/m 7.6.) 9.3.5. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN
Wanneer de (relatieve) grootte van de verschülen bekend is, leidt het toepassen van de tekentoets tot een verlies aan informatie. Men kan dan beter de — eveneens verdelingsvrije — rangtekentoets gebruiken. 189
9.4
K W A L I T A T I E V E VERDELINGSVRIJE TOETSEN
9.3.6. OPGAVEN 9.9.
Uit H E M E L R I J K & VAN ELTEREN
(93).
Een dierenhandelaar krijgt een offerte van een nieuw soort kattenbrood (B). dat iets duurder is dan het kattenbrood, dat hij tevoren steeds verkocht heeft (soort A). Om te besUssen of hij soort B zal kopen neemt hij een proef met 30 katten, die hij tegeUjkertijd een bakje A en een bakje B voorzet. Hij wü soort B aUeen kopen ais blijkt, dat B beter is dan A. Bij de proef bleken 10 katten A te prefereren boven B, terwijl 20 katten meer B aten. Wat zal volgens de tekentoets de beslissing van de handelaar zijn. indien hij een kans 0.05 wU riskeren om de offerte te accepteren als A niet slechter is dan B ? 9.10.
Betreft opgave 9.7. Op welke wijze kan men de tekentoets toepassen op de gegevens in deze opgave ? Tot welke conclusie leidt deze ?
9.11.
Bepaal het aantal plussen, dat bij tweezijdige toepassing van de tekentoets nodig is, om juist tot het verwerpen van Ho over te gaan (met a = 0,05) voor de volgende waarden van n : a. n== 150 6. M = 250 c. n = 500.
9.4. De toets van Cochran 9.4.1. TOEPASSING
Deze toets kan worden toegepast als men per element van een steekproef beschikt over k verwante waarnemingen betreffende een dichotomie (bv. de uitkomst van een reactie: positief-negatief). Tabel 9.6. Koude rillingen als bloedtransfusie-reactie bij 4 verschillende manieren van bloedvoorbereiding: O = gsen rilUngen, 1 = rillingen Patiënt nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Ki K,'
190
Bereidingswijze Ri B C D A 1 2 0 0 1 0 0 0 0 1 1 2 0 1 0 2 0 1 1 0 3 1 1 0 3 1 2 0 0 1 4 1 1 1 0 1 3 0 0 0 0 1 2 0 0 0 0 0 1 0 0 0 0 0 1 1 0 3 1 0 0 0 12 29 = SRi = ZKj = S 8 6 3 144 64 253 = S K ' 36 9 3[4 X 253 - (29)'] 513 = 12,5 Qo = 4 X 29 - 75 41
Pi' 4 1 4 4 9 9 4 16 9 0 4 1 0 9 1 75 = Z R ' Ä= 4
DE TOETS VAN COCHRAN
9.4
Voorbeeld 9.5. De (fictieve) gegevens in tabel 9.6 betreffen 15 patiënten, waarop vier bloedtransfusies werden toegepast met bloed, dat op vier verschillende manieren, A, B,C enD, was voorbereid. Van elke patiënt werd genoteerd, of bij de transfusie koude rillingen optraden. Men wil de hypothese toetsen, dat het optreden van deze bloedtrandusiereactie onafhankelijk is van de wijze van voorbereiding van het toegediende bloed. 9.4.2. DE TOETSINGSGROOTHEID
Alle waarnemingen in de ene categorie worden met 1, die in de, andere met O aangeduid. COCHRAN kiest dan als toetsingsgrootheid ^: { k - ï)2:{K} - E)»
{k - 1) {k-m» - (5)"}
^ ^ ' - ^
De betekenis van de sjmibolen in deze formule blijkt uit tabel 9.6. Onder deze tabel is Qg voor de verkregen uitkomsten met (9.6) berekend. Hieruit blijkt; dat het rekenwerk bij toepassing van deze toets miniem is. 9.4.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER ffo
De te toetsen hypothese ffo luidt: de k subgroepen, elk gevormd door de uitkomsten van een kolom ( = behandeling), zijn aselecte steekproeven uit dezelfde dichotomie (of: de kans van de uitkomst 1 is voor elke kolom dezelfde). De verdeling van Q onder Hg kan worden benaderd door de x^ verdeüng met k — 1 vrijheidsgraden, mits n niet te klein is. 9.4.4. UITVOERING VAN DE TOETSING
Er dient rechts éénzijdig te worden getoetst, omdat Q = 0 voor Ki = K 2 = . . . = K^ [zie (9.6)] en hogere waarden aanneemt, naarmate de waarden van K verder uiteenlopen. Ho wordt zodoende bij een drempelwaarde a verworpen, indien Qo > x \ - a {v = k — 1), Laatstgenoemde kritieke waarde kan weer uit tabel D worden afgelezen. Kiest men bij de toetsing van de uitkomsten in tabel 9,6 een onbetrouwbaarheid 0,05, dan is de kritieke waarde X\.M{V = 3) = 7,815. De waargenomen Co = 12,5 is aanzienlijk groter (heeft een overschrijdingskans die kleiner is dan 0,01), zodat Hg wordt verworpen. ^ Een verklaring voor de keuze] van deze toetsingsgrootheid valt buiten het kader van dit boek. Wij verwijzen hiervoor naar de publicatie van COCHRAN (79A).
191
9.4
KWALITATIEVE VERDELINGSVRIJE TOETSEN
Onbesliste gevallen Deze gevallen, waarbij in elke kolom uitduitend nullen of enen voorkomen, verschaffen t.a.v. het verschil tussen de behanddingen geen aanwijzingen. Men kan ze dan ook direct weglaten, zonder dat daardoor Qo verandert. In tabel 9.6 komen 2 patiënten met 0000 en 1 patiënt met 1111 voor. Bereken zdf Qg voor de overbüj vende 12 patiënten. Voor k = 2 beschikt men over gepaarde waarnemingen. Men kan dan aan de uitkomst 01 een plus en aan de uitkomst 10 een min toekennen (00 en 11 worden weggelaten) en daarna de tekentoets toepassen. Maakt men in dit geval gebruik van (9.6). dan heeft de verkregen Qg dezelfde waarde als de T„', die men bij toepEissing van de normale benadering (zonder continuïteitscorrectie) van de tekentoets verkrijgt. De Ç-toets gaat dus voor k = 2 over in de tekentoets. 9.4.5. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN : DE TOETS VAN
MooD Als de verwante waarnemingen k waarden van een continu verdeelde grootheid of k rangnummers zijn, kan men de — eveneens verdelingsvrije — toets van FRIEDMAN toepassen (zie 10.4). Als men met een zeker verlies aan informatie genoegen wil nemen, kunnen de uitkomsten in twee categorieën worden gesplitst door van de k verwante waarnemingen per element de mediaan te bepalen en aan elke waarde groter dan de mediaan een 1 (en dus aan waarden gelijk aan of kleiner dan de mediaan een 0) toe te kennen. Op deze omgezette gegevens kan dan de toets van COCHRAN worden toegepast. Voorbeeld 9.6. Uit N.T.v.G., 1954, blz. 1745. Links in tabd 9.7 staan de penicilünespiegels per cm' plasma van 8 patiënten op 7 tijdstippen. De eerste inspuiting van 300000 I.E. almociüine werd gegeven terstond na de bloedwinning op dag O (waarop alle spiegels O waren), de tweede na de bloedwinning op dag 1, enz. Voor dit voorbeeld hebben wij slechts 7 Tabel 9.7. Penicillinespiegels van 8 patiënten op 7 opeenvolgende dagen Spiegels op dag
Pat 39 40 41 42 43 44 45 46 ^°
192
1
2
3
4
5
6
7
0,20 0,09 0,38 0,07 0,00 0,00 0,00 0,26
0,11 0,12 0,14 0,11 0,12 0,11 0,05 1,00
0,31 0,15 >1 >1 0,25 0,22 0,10 0,52
0,18 0,17 0,20 0,12 0,29 0,35 0,11 0,27
0,26 0,16 0,14 0,12 0,25 0,18 0,16 0,39
0,16 0,19 0,19 0.16 0,31 0,25 0,18 0,37
0,15 0,19 0,22 0,22 0.36 0,21 0,15 0,36
6[7 X 98 - (24)'] 6 X 110 = 6,875 7 X 24 - 72 96 X".... (v = 6) = 12,59
—
Categorieën 1 2
3
1 0 1 0 0 0 0 0
1 0 1 1 0 1 0 1
2 K,' 4
0 0 0 0 0 0 0 1 1
4 5
6
fi.
Ri'
7
0 0 0 0 0 1
1 0 1 0 1 1 1 1 1 0
0 1 1 1 I 0 1 0
3 3 3 3 3 3 3 3
9 9 9 9 9 9 9 9
5 3 3
5
5
24
72
0 1 0 0 1 1 0 0
1 25 9 9 25 25
98 * = 7
9.5
DE TOETS VAN FISHER
van de 12 dagen overgenomen. De te toetsen h37pothese is, dat de spiegels van dag tot dag toevaUig verschülen. Rechts in de tabel zijn de waarden in nullen en enen omgezet volgens het zojuist gegeven recept, waarna de toets van COCHRAN is toegepast. Door MoOD (24) is deze toets onafhankehjk van de Ç-toets ontwikkeld met als toetdngsgrootheid C. Daar echter C = Ç en de berekening van Co met de door MooD gegeven formules niet eenvoudiger is dan de berekening van Qg, laten wij deze formules achterwege. 9.4.6. OPGAVE 9.12, De volgende waamemingsuitkomsten betreffen de bloedingstijd in seconden, bepaald aan het linkeroor, na toediening van 5 verschillende bloedstelpende middelen. Toets met a = 0,05 de hypothese dat de bij de middelen waargenomen bloedingstijden toevalüg verschülen. Pat.
nr. 1 2 3 4 5 6 7 8
Middel C
A
B
106 131 193 104 107 109 142 82
121 98 118 92 105 94 106 78
60 45 134 100 90 87 119 104
Middel C
D
E
Pat. nr.
A
B
74 47 105 108 88 103 203 116
62 115 196 89 91 88 195 140
9 10 11 12 13 14 15 16
116 135 121 140 76 109 96 74
107 149 101 105 78 103 85 62
90 104 130 132 92 130 79 76
D
E
67 115 106 113 80 118 74 65
77 103 133 147 94 155 72 55
9.5. De toets van Fisher 9.5.1. TOEPASSING
Deze toets kan worden gebmikt als men de juistheid wü onderzoeken van de hypothese Hg, dat twee aselecte steekproeven uit dezelfde dichotomie stammen. Voorbedden 9.7. Een groep van twaalf muizen wordt aselect in twee even grote steekproeven, 1 en 2, verdeeld. De dieren in steekproef 1 worden intraveneus ingespoten met een bepaalde dods van stof X en de dieren in steekproef 2 krijgen een zdfde dods van stof Y. Na verloop van zekere tijd wordt vastgesteld, hoeveel dieren in elke steekproef nog in leven zijn. De uitkomsten zijn in onderstaande 2 x 2 tabel (viervddentabd) vastgelegd: Steekproeven 1 2 Stof X Stof y Uitkomst
{
Gestorven Levend
1
5 6
6 0 6
7 5 12 193
9.5
KWALITATIEVE VERDELINGSVRIJE TOETSEN
De te toetsen hypothese luidt : de twee 'behanddingen' bezitten dezelfde sterftekans (m.a.w. : het verschil in de steekproefuitkomsten is toevallig). 9.8. Bij een onderzoek heeft men uit de kinderen van 7, 8 en 9 jaar van een gemeente aselect een steekproef van 100 jongens en van 100 meisjes getrokken. In deze steekproeven worden de volgende strumafrequenties geconstateerd: Steekproeven Jongens Meisjes Struma Geen struma
31 69 100
49 51 100
80 120 200
De te toetsen hypothese is, dat struma bij jongens en meisjes even frequent voorkomt. 9.5.2. DE TOETSINGSGROOTHEID
De viervddentabd wordt in het algemeen van de volgende symbolen voorzien : Steekproeven 1 2
A Kenmerk \ _
a b a + b
c d c+ d
a+c b+d J3 n=a+b+c+d Als toetsingsgrootheid wordt gekozen a, het aantal elementen met kenmerk A in steekproef 1. 9.5.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
Onder de hypothese, dat beide steekproeven uit dezdfde dichotome populatie afkomstig zijn {Hg: P{Ai) = ^^(-42) = P} volgt de grootheid a — onder voorwaarde dat {a -|- c) de bij het onderzoek gevonden waarde aanneemt — de hypergeometrische verdeling : {a + b)l ^ {c-\-d)\ (9.7)
P{a = a\Hg) = - " C»+„ ""
n\ {a-\-c)\{b + d)l
_ {a + b)l{c -{- d)\{a + c)\{b + d)l 1 "" n\ ' a\b\c\d\ ' met gemiddelde (QR\ (g + b){a + c) (9.8) f,, = 194
9.5
DE TOETS VAN FISHER
en VcU-iantie {a + b){c + d) {a + c){b-\- d) ^'•'^
'^'=
n»{n-l)
Voor {a + b) = {c -\- d) is de verdeling van a symmetrisch. Bij toetsing van de hypothese P{Ai) = P(^g) kan de alternatieve hypothese zijn : 1. P{Ai) < P{A2). Links éénzijdige toetsing. Ho wordt verworpen indien Pi(ao) < « is. 2. P{Ai) ^ P{A^. Tweezijdige toetsing. Hg wordt verworpen indien Pi)(ao) < « is3. P{A^ > P{A^. Rechts éénzijdige toetsing. Ho wordt verworpen indien Pfi(ao) < « is. 9.5.4. UITVOERING VAN DE TOETSING
9.5.4.1. Exacte todsing. Met (9.7) kan de kansverdeüng van Q onder Hg worden berekend. In tabel 9.8 is deze berekening voor voorbeeld 9.7 uitgevoerd. Tabel 9.8. Verdeüng van de toetsingsgrootheid a onder Hg voor voorbeeld 9.7 (a + c = 7) 2x2 tabel
1|5 6|0 214 5|1 313 4|2 4|2 3|3 511 2|4 610 115
P(a = a)
Berekening 6!6!7!5! 12! 6!6!7!5! 12! 6!6!7!5! 12! 6!6!7!5! 12! 6!6!7!5! 12! 6!6!7!5!
12!
1!5!6I0! 1 2!4!5!1! 1 3!3!4!2! 1 4I2!3!31 1 511!2!4! 1 6!0!1!5!
1 l32' 15 132 50 132 50 132 15 132 1 132
= 0,0076 = 0.1136 = 0,3788 = 0,3788 = 0,1136 = 0,0076 1,0000
Uit deze tabel blijkt, dat de tweezijdige overschrijdingskans van de gevonden uitkomst, a g = \ , geüjk is aan P{a = 1) -|- P(g = 6) = 2(0,0076) = 0,0152. Hg kan dus bij tweezijdige toetsing bij een 5% drempel worden verworpen: de conclusie is, dat de sterftekans bij stof Y hoger is dan die bij stof X. Wij geven nog een tweede voorbeeld van exacte toetsing, maar nu met steekproeven van ongelijke omvang. 195
9.5
KWALITATIEVE VERDELINGSVRIJE TOETSEN
Voorbeeld Steekproeven 9.9. Onderstel, dat twee aselecte steekproe^ ^ ven de nevenstaande aantallen eleA 1 8 menten met een zekere afwijking A Niet-A 7 4 vertonen. De hypothese die men wenst 8 12 te toetsen luidt weer, dat deze steekproeven uit dezelfde dichotomie stammen; men kiest a = 0,05. Onder Hg volgt de grootheid a (het aantal elementen met kenmerk in steekproef 1) de volgende verdeling: 9!11!8!12!
P(a = a\Ho) =
2ÔT
9 11 20 A
1
-^mm
(« + - = 9)
De mogeüjke uitkomsten zijn :
©I 9 813
®1 8 @1 7 ®16 ® 1 5 ® 1 4 ® 1 3 ®| 2 ®| 1 7 1 4 6 I 5 5 1 6 4 | 7 3 | 8 2|9 1110 Olli
Met (9.7) kan nu de verdeling van a onder Ho worden berekend. Deze verdeUng büjkt te zijn :
a P(a)
1 0
Totaal 5 16 7 8 1 1 2 1 3 4 0,001 0,023 0,132 0,309 0,331 0,165 0,037 0,003 0,000 1,001
en is niet symmetrisch. Ook in dit geval wordt tweezijdig getoetst. V^ij zoeken dus alle waarden van a bijeen, die een hoogstens even grote kans bezitten als de waargenomen «„ = 1 ; dit zijn de waarden O, 1, 7 en 8. De tweezijdige overschrijdingskans van «g is nu geüjk aan de som van de bij deze waarden behorende kansen (zie 3.6) : Pfl(l) = 0.001 -t- 0.023 + 0,003 -|- 0,000 = 0,027. Deze kans is kleiner dan de gekozen onbetrouwbaarheid 0,05, zodat Hg wordt verworpen. De conclusie luidt, dat de populatie, waaruit steekproef 2 afkomstig is, een hogere fractie A's bevat dan de populatie van steekproef 1.
Het berekenen van de exacte kansen met (9.7) is reeds bij een iets grotere steekproefomvïing dan in de voorbeelden 9.7 en 9.9 een tijdrovende bezigheid. Men kan hierbij echter gebruik maken van de tabellen met binomiaalcoëfficiënten van VAN WIJNGAARDEN (76). FiNNEY (87) en LATSCHA (98) hebben tabellen samengesteld, waaruit voor kleine randfrequenties exact berekende kansen kunnen worden afgelezen. Deze tabellen zijn, met gebruiksaanwijzing, ook afzonderlijk verkrijgbaar bij 'The Biometrie Office', University CoUege, London W.C. 1. De tabellen van FINNEY zijn ook opgenomen in de BIOMETRIKA TABLES I (74, tabd 38) en (iets gewijzigd) in SIEGEL (108, tabel I). Tenslotte noemen wij de tabellen van MAINLAND & MURRAY (100). Zij gelden voor steekproeven van dezelfde omvang en kunnen ook voor grote steekproeven worden gebruikt. In 9.5.4,2 behandelen en vergelijken wij twee benaderende methoden voor de 2 x 2 verdeling. In 9.5.4.3 geven wij arm, hoe men de ;f*-benadering in de praktijk kan gebruiken. ' 196
9.5
DE TOETS VAN FISHER
9.5.4.2. De normale en de x^-benadering. De normale benadering: Voor niet te kleine n is, mits {a + c)/n niet te veel van \ afwijkt, onder Ho de grootheid (zie (9.8) en (9.9)) : {a + b){a -H c) a n (9.10) r = a—Ma Oa + b){c-\-d){a-\-c){b + d) n - 1 {ad — 6c) V « — 1 V{a -I- b){c + d){a + c){b + d) bij benadering standaardnormaal verdeeld. De overschrijdingskans van «o kan dus via Tg en tabel A bij benadering worden bepaald. Voor de uitkomsten in voorbeeld 9.8 vindt men dan:
vf'S
(31 X 51 — 49 X 69)\/l99 1800'' ^=^—= - 2,592, VlOO X 100 X 80 X 120 1000V96 Pn(-2,592) ^ 0 , 0 1 , De x^-benadering: Voor elk 'veld' van de tabel kan men, uitgaande van de randfrequenties a -\- b, c + d, a + c en b + d, de verwachte frequenties onder Hg berekenen. De met de waargenomen frequenties a , b , c e n d corresponderende verwachte frequenties worden gewoonlijk met a, ß,y en ö aangeduid (zie tabel 9.9A). Onder Ho geldt voor deze verwachtingen a : ß = y : 6 = {a + c) : {b -\- d). Eenvoudig is in te zien, dat de verwachte frequentie van een veld gelijk is aan het product van de bij dat veld behorende randfrequenties, gedeeld door n. In tabel 9.9B is deze berekening voor de uitkomsten van voorbeeld 9.8 uitgevoerd. ^ 0
=
Tabel 9.9. Waargenomen en verwachte frequenties in de 2 X 2 tabel A.
Gebruikte symbolen Waargenomen frequenties Steekproef 1 2 Ken-f A \ a \ c a + c merk \ ß \ b \ d b+ d a+b c+d n
B.
Verwachte frequenties onder Hg Steekproef 1 2 {c+d) (a+c) (a+b) {a+c) A a + c ^n n (a+b){b+d) , {c+d)(b+d) b+ d B ^n n c + d a + b
Voor voorbeeld 9.8
Struma Geen struma
Jongens 31 69 100
Meisjes 49 51 100
80 120 200
Jongens 100x80 200 ^ 1 0 0 - 4 0 = 60 100
Meisjes 80-40=40
80
1 0 0 - 4 0 = 6 0 120 100 200
197
9.5
KWALITATIEVE VERDELINGSVRIJE TOETSEN
Per veld beschikt men nu over een waargenomen en een verwachte frequentie, zodat men volgens (9.1) kan berekenen: (9.11)
Zo^ = K : ^ ^ + i È i z J ) i + i £ i I l J ^ + i^lLZlili. a ß y d Voor niet te kleine n en verwachte frequenties > 5 volgt de grootheid X» bij benadering een ;^^verdeling met I vrijheidsgraad (bij gegeven randfrequenties kan slechts van één veld de frequentie vrij worden ingevuld). Formule (9.11) kan nog worden vereenvoudigd, daar steeds (ook bij ongeüjke steekproefomvang) geldt dat | « — a | = | 6 — j8 1 = \ c — y \ = \ d — d \. Men kan dus schrijven (9.12.1)
Z o ^ = ( « o - a ) { - l + l + J- + l ] .
Met (9.12.1) vmdt men voor voorbeeld 9.8 (zie tabel 9.9B):
Z.. = (3. - « » . [ ^ + A. + J_ + A,] _ 6,75. Vergelijking van de beide benaderingen De normale benadering en de ;f^benadering blijken niet dezelfde uitkomst op te leveren. Voor (9.12.1) kan men schrijven:
Xo^ = («_i^±i)ii+_fLj\ 1 i_ 1 _^ 1 \ (a+b){a+c) + {a+b)(b+d)' '^ (c+d){a+c) "*" {c+d){b+d) \ n n n n 1 i+b){h+d) + {a+b){a+c) _ lad—bcX' I(b+d)(c+d) + [a+c)(c+d) + (a+b ~\ n ) "X (a+b)(c+d)(a+cy c){b+d) (ad—bc)' (a+b)(a+b+c+d) + (c+d)(a+b+c+d) n (a+b)(c+d)(a+c)(b+d)
zodat (9 122) X» ( ^ - ^^)'^ l • ^-^J "^^ ~ {a-\- b){c -f- d){a + c){b + d) • Vergelijkt men deze tütkomst met (9.10), dan büjkt dat
(9.13)
Xg» = Tg» ^ 4 T ' «^ ^o' = ^ ^
^o'-
Bij voorbeeld 9.8 is Xg» = 6,75 en To = — 2,592, zodat To* = ( - 2,592)* = 6,718 = "»/go« • 6,75. 9,5.4.3. H d gebruik van de x»-benadering. In de praktijk gebruikt 198
DE TOETS VAN FISHER
9.5
men meestal de ;|f*-benadering, omdat deze weinig rekenwerk vereist. Men behoeft immers slechts één verwachte frequentie te berekenen (de overige drie volgen dan door aftrekking van de marginale frequenties). Verder kunnen de reciproken van de verwachte frequenties in een tafel worden opgezocht (zeer geschikt is hiervoor de tafel van BARLOW (65)). De x*-benaàering kan reeds worden toegepast voor n > 20, mits de verwachte frequenties > 5 zijn. De benadering kan worden verbeterd door een continuïteitscorrectie aan te brengen, en Xo» te berekenen met (9.14)
Xo» = { \ a o - a \ - w { \
+ J + \
+ \).
Tweezijdige toetsing: Toetst men Hg: P{A^ = P{A^ = P met als alternatief Hi: P{Ai) i^ P{A^, dan wordt Ho bij een drempelwaarde a verworpen indien De tweezijdige overschrijdingskans van «o is dan bij benadering gelijk aan PD(ro) (tabel A), waarin Tg = V%2. Links éénzijdige toetsing: Voor het alternatief P{Ai) < P(i4g) wordt Hg bij een drempelwaarde a verworpen, indien • a < { a + b){a + c)/n en ^ o ' > X\-2a (" = !)• De linkse kans van «o is dan bij benadering geüjk aan PL{TO), waarin
r„ = - Vx;». Rechts éénzijdige todsing: Voor het alternatief P{Ai) > P{A2) wordt Ho bij een drempelwaarde a verworpen, indien a > { a + b){a + c)/n en ^o* > ;f''i_g„ {v = 1). De rechtse kans van «o is bij benadering gelijk aan PR{TO), waarin Tg = Vx;». Voorbeelden 9.10. Beschouw de 2 x 2 tabel, die Unks in tabel 9.10 staat. Men toetst de hypothese P(A,) = P ( A ^ = P met als alternatief P(Ai) > P(A2) en kiest a = 0,05. Tabel 9.10. Toepassing van de ;('-benadering op een 2 x 2 tabel, rechts éénzijdige toetsing Waargenomen frequenties Steekproeven 1 2 A I 15 15 I 14 14 I 29 29 B 5 5 I 16 16 21 21
20
30
50
Verwachte frequenties Steekproeven 1 2 A B
a = 11,6 ß = 8.4
20
y = 17.4 ô = 12.6
30
29 21 50 199
9.5
KWALITATIEVE VERDELINGSVRIJE TOETSEN Rechts in deze tabel zijn de frequenties onder Hg geplaatst; a is groter dan (a + b) (a + c)ln = a en Xg' wordt met (9.14) berekend: ^„'=(115- 11,61-0,5)"(-^+^ + - ^
+
-jI^)
= (2,9)» (0.086207 -|- 0,119048 + 0,057471 + 0,079365) = 2,88. Tg = ^ 2 1 8 8 = 1.70.
P R ( T = 1,70) = 0.045.
In tabel D vindt men als kritieke waarde: x\m(^) = 2,706, zodat Ho wordt verworpen. Via XQ is bij benadering de rechtse kans van Xo' bepaald: deze büjkt 0,045 te zijn. 9.11.
Past men (9.14) toe op voorbeeld 9.8, dan vindt men (zie tabel 9.9 B ) : Xg^ = (I 31 - 40 1 - 0.5)* (V« + V»o + V4« + VGO) = 6.02. Er wordt tweezijdig getoetst. Kiest men a = 0,05, dan is de kritieke waarde (tabel D): x'o.aÀ^) = 3.841. Daar Xo' deze waarde overschrijdt wordt Hg verworpen. De uitspraak luidt dus: bij de meisjes komt meer struma voor dan bij de jongens.
Opmerking Men kan in de formule voor de normale benadering (9.10) een continuïteitscorrectie aanbrengen door de absolute waarde van {ad — bc) in de teller met «/2 te verminderen. Ook dan geldt : n— 1 Tg» (met cont.corr.) = Xg» (met cont.corr.). Men zou verwachten, dat de nauwkeurigste benadering van de exacte overschrijdingskans verkregen wordt met één van de voorgaande formules, d.i. dus feiteUjk via To^ met continuïteitscorrectie. Dit blijkt echter niet het geval te zijn. De correctie is namelijk te groot, zodat de gecorrigeerde Tg» te laag is en een overschrijdingskans oplevert, die groter is dan de exacte kans. Deze 'overcorrectie' wordt nu grotendeels opgeheven als men de toetsing uitvoert via Xg» met (9.14) ende vermenigvuldiging met {n— \)jn achterwege laat. Bij een groot aantal gevallen, waarop wij deze procedure hebben toegepast, werd steeds een overschrijdingskans verkregen, die iets groter was dan de exacte kans. 9.5.5. TOETSING VOOR KLEINE KANSEN MET BEHULP VAN EVEN GROTE STEEKPROEVEN
Door KLERK-GROBBEN & PRINS (95) is een zeer eenvoudige toets voor de h5^othese Hg : P{A i) = P(.i4 g) = P beschreven, die kan worden uitgevoerd als men te doen heeft met kleine kansen en even grote steekproeven. Onderstel bv., dat men de h57pothese wil toetsen, dat een vrij zeldzame afwijking in twee verschillende populaties evenved voorkomt. Men trekt uit elke populatie aselect een steekproef van 1000 personen 200
DE TOETS VAN FISHER
9.5
en deze steekproeven leveren op : Afwijking Geen afwijking
1
2
a= 6 994 1000
c = 20 980 1000
26 = a + c = m 2000 = 2»
Onder Hg volgt de grootheid a bij benadering de binomiale verdeling: P{a = a) = C^-2-'», mits de omvang der steekproeven n veel groter dan m is. De grootte van n heeft overigens op de toets geen invloed. Deze toetsing kan eenvoudig met tabel I worden uitgevoerd. Uit deze tabel blijkt, dat voor m = 26 de tweezijdige overschrijdingskans van ag = 6 hoogstens gelijk is aan 0,02. Hg kan dus met een onbetrouwbaarheid < 0,02 worden verworpen. Hoewel de toets strikt genomen slechts geldig is, indien beide steekproeven dezelfde omvang n bezitten, geeft hij een goede benadering voor het geval dat «i ^ «g als n^ en ng groot zijn en slechts weinig verschillen (bv. «1 = 1000 en ng = 985). Voor verdere bijzonderheden verwijzen wij naar bovengenoemd artikel, waarin ook het onderscheidingsvermogen van de toets en de keuze van n wordt besproken. 9.5.6. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN: DE MEDIAANTOETS
Als de waarnemingen in de twee aselecte steekproeven kwantitatief zijn, kan men deze — mits men met een zeker verlies aan informatie genoegen neemt — eenvoudig in een 2 x 2 tabel omzetten en daarop de toets van FISHER toepassen. Deze methode is bekend als de mediaantoets. Voorbedd 9.12. Men wil de h3rpothese toetsen, dat twee stoffen, X en Y, indien daarvan een bepaalde letale dosis bij muizen wordt ingespoten, de levensduur van deze dieren op dezelfde wijze beïnvloeden. Men voert een proef uit, waarbij een groep van 14 muizen aselect in twee even grote subgroepen wordt gesplitst, die resp. met X en Y worden ingespoten. De levensduren der dieren (in minuten na het toedienen der injectie) bÜjken te zijn: Groep I - middel X : Xi Groep I I - middel Y: yi
40 60
45 98
58 106
70 130
75 135
90 160
123 174
De omzetting verloopt als volgt : men bepaalt de mediaan van alle n = n i -\- n2 waarnemingen en stelt voor iedere groep vast, hoeveel 201
9.5
KWALITATIEVE VERDELINGSVRIJE TOETSEN
waarnemingen groter dan, resp. gelijk aan of kleiner dan deze mediaan zijn: Groep I Groep II
40
45
58
70 75 60 Minuscategorie M—y waarnemingen
123
90 98 106 JMediaan
130 135 160 174 Pluscategorie r waarnemingen
Hieruit wordt de volgende 2 x 2 tabel verkregen : Voorbeeld Groep 1 2 1 16 6 1 1 7 7
Categorie \
Algemeen Groep 1 2 7 7 14
+
a b a +b
c a + c --=r d b + d ==n- r c+ d n
=
=
«1
«2
Onder de hypothese, dat beide steekproeven (groepen) uit dezelfde populatie afkomstig zijn, is de kans van de plus-categorie voor beide steekproeven gelijk. De toets van FISHER kan dus worden toegepast en voor voorbeeld 9.12 vindt men bij exacte tweezijdige toetsing met (9.7): PD{ag) = PD{a= 1) = 2[P{a = 0) -H P(« = 1)]
^r7!7!7!7!-|r
1
1
l
„
^
= 2 [—[4r-j L 7!Ö!7!Ör + 7!î!6!îrj = °'°292Zelfs bij deze kleine omvang der steekproeven büjkt de ;f*-benadering vrijwel raak te schieten. Met (9.14) vindt men: Xg» = (I 1 - 3,5 I - 0,5)'' ( - ^ ) = 4,57, To = V Ä ^ = 2,14. Via To en tabel A vindt men bij benadering een tweezijdige overschrijdingskans van 0,0324. 9.5.7. OPGAVEN Steekproef 1 2
A B
2 5 7 2 9 7
7 9 16
9.13.
Toets de hypothese, dat nevenstaande steekproeven uit dezelfde dichotomie stammen. Kies a = 0,05.
9.14.
Toets de hjrpothese, dat onderstaande steekproeven uit dezelfde populatie stammen. Kies a = 0.01. Vi
202
12 22 26 35 36 38 44 22 26 34 44 44 46 48
65 65
«1
70 78 95 98
n.
8 12
9.5
DE TOETS VAN FISHER
9.15.
Uit: N.T.V.G., 98(1954), 2208. Tabel I Indnrect ingeënt met gele-koorts virus
Hersensuspensie
Aantal
Overlevende
Overlevende in pet
Dengue-muizen, 3 x intraperitoneaal Contrôle-muizen
5 pet 5pct
18 10
11 3
61,1 30
'Verschil tussen percentage overlevende dengue-muizen en contrôlemuizen: 31,1%.' VerschiUen deze percentages significant bij een 5% drempel ? 9.16.
Uit: N.T.v.G., 99 (1955), 2277. Tabel I. Frequentie van longgezweUen bij muizen na inwerking van sigarettenrook Aantal Wijfjes-dieren rookproef controle B. Mannetjes-dieren rookproef controle Totaal rookproef controle
Longtumor Met Aantal Pet
Zonder Aantal
A.
17 19
13 5
76 26
4 14
12 13
10 5
83 38
2 8
29 32
23 10
79 31
6 22
Welke hypothesen toetst u ? Voer deze toetsingen uit met a = 0,05. 9,17.
Uit de kursus: Summarizing Experimental Data, Columbia University, U,S.A. The.observations in the following table are presented in a paper on the treatment of erj^ipelas in chUdren (J. Am. Med. Ass., March 10, 1934) as evidence that ultraviolet therapy gives better results than serum therapy in infants. Results of treatment of children under one year of age Treatment Ultraviolet Serum
Lived
Died
12 23
7 32
Total cases 19 55
Mortality percentage 36,8 58,2
a. What questions would you ask relative to the comparibiUty of the mortality percentages for the two forms of treatment ? b. Test the statistwal significance (a = 0,05) of the difference in mortality under the two treatments.
203
9.6 9.18.
KWALITATIEVE VERDELINGSVRIJE TOETSEN Uit: N.T.v.G.. 100 (1956), 2769-2783. Tabel I. Primaire sterfte bij shunt-operaties wegens portale hjrpertensie Aantal gevallen Schrijver en datum
Aandoening
Cirrose Blakemore Extra-hepaiti,1952 tisch block Cirrose Linton Extra-hepalii1951 tisch block Cirrose Chüd Extra-hepaK1953 tisch block Comb, v/d Cirrose geg. van Extra-hepat^3 schrijvers tisch block
portacava shunt 65
splenorenale shunt 54
LetaUteit Aantal
Procent
PCS SRS PCS SRS 13
11
20
20
4 11
27 19
0 3
1 1
0 27
4 5
4 31
27 1
0 4
6 0
0 13
22 0
107
3 74
20
0 12
19
0 16
8
57
0
7
0
12
De auteur merkt op : 'Men ziet uit bovenstaande cijfers, dat onafhankelijk van de toegepaste methode de sterfte bij levercirrose aanzienlijk hoger is dan die bij extra-hepatijisch block, een verschil dat voor de hand Ugt als men bedenkt, dat de üjder aan levercirrose wel steeds een uiterst dubieus risico vormt voor iedere grote operatie (lever-insufficiëntie!)' Kunt u zich met deze conclusie verenigen ?
9.6. De x^-toets op de 2 x r tabel 9.6.1. TOEPASSING
Deze methode kan worden gebruikt voor het toetsen van de hypothese Hg, dat twee aselecte steekproeven (van niet te kleine omvang) uit dezelfde populatie met r categorieën afkomstig zijn. Voorbeeld 9.13. Uit: N.T.v.G., 100 (1956), 3649-3652. Onderstaande tabel bevat de resultaten van één arts bij de behandeling van 189 parkinsonpatiënten met disipal (O = geen verbetering, ± = matige verbetering, .patiënt niet tevreden, -f = opmerkelijke verbetering, patiënt tevreden, -!--)-= zeer duidelijke verbetering, patiënt kan zijn werk weer doen) : Resultaat disipal bij patiënten, die aUeen disipal hadden gehad Resultaat disipal bij hen, die andere middelen hadden gehad
n
0
±
+
++
29
7%
28%
45%
17%
groep 1
160
20%
36%
34%
11%
groep 2
O.m. wordt over deze uitkomsten opgemerkt: 'Wanneer men in de groep van 189 patiënten die allen door één arts zijn behandeld, de re204
DE ;f *-TOETS OP DE 2 X Ä TABEL
9.6
sulfaten bekijkt van de groep van 160 patiënten die reeds met andere middelen zijn behandeld, vergeleken met de 29 patiënten die aüeen met didpal zijn behandeld, dan is het aantal van 29 te klein om met procenten te werken. Met alle reserves, die hieruit voortvloeien kan men toch opmerken, dat de uitkomsten van de nog niet behandelden inderdaad gunstiger schijnen te zijn dan van de groep van reeds met andere middelen behandelden.' Links in tabel 9.11 zijn de gegeven procentuele verddingen in frequentieverdelingen omgezet. De procentuele verdeüng van groep 1 komt niet op 100% uit; arbitrair hebben wij de ontbrekende 3% bij de plusgroep geteld, dus aangenomen dat deze 48% der patiënten omvat. Tabel 9.11. Uitkomsten van de behandeling met disipal bij twee groepen patiënten Resul+naf
++ + ± 0 Totaal
fij = waarg. freq. Groep 1 Groep 2 5 17 14 54 8 57 32 2 29 1 160
Tot. 22 68 65 34 189
Cij = verwachte freq. 2 1 3,4 18,6 10,4 57,6 10,0 55,0 5,2 28,8 29.0 160,0
fii — ^ii 1 2 + 1,6 - 1 , 6 +3,6 - 3 . 6 - 2 , 0 + 2.0 - 3 . 2 +3.2 0 0
(/« - ««)V«« 1 2 0,7529 0,1376 1,2462 0,2250 0,4000 0,0727 1,9692 0,3556 4,3683 0,7909 0.7909 5,1592 ==^o*(3)
Wij nemen aan dat de groepen 1 en 2 kunnen worden beschouwd als aselecte steekproeven uit hun respectieve populaties en wij toetsen de hjTpothese, dat deze dezelfde verdeling bezitten (d.w.z. dat de waargenomen verschillen tussen de groepen toevallig zijn). 9.6.2. DE TOETSINGSGROOTHEID
De waargenomen frequenties vormen een zg. 2X7* tabel, d.w.z. er zijn twee kolommen (voor de twee steekproeven) en r. rijen (de categorieën waarin beoordeeld is). Deze tabel bevat 2r velden en evenals bij de 2 X 2 tabel kan de verwachte frequentie van een veld (d.i. de frequentie onder Hg) worden berekend door te nemen : het product van de bij dat veld behorende remdfrequenties, gedeeld door n (het totale aantal waarnemingen). Als toetsingsgrootheid kan dan dienen (9.15)
X» =
y y (/«-««)' i=l î= l
««
waarin /y = de waargenomen, Cij = de verwachte frequentie van het veld op rij * en in kolom ƒ. ^0* kan op twee manieren worden berekend : a. Volledige berekening. Deze is voor voorbeeld 9.13 rechts in tabel 205
9.6
KWALITATIEVE VERDELINGSVRIJE TOETSEN
9.11 uitgevoerd en verloopt als volgt : 1. Bereken de verwachte frequenties in één kolom. Die van de tweede kolom vindt men door aftrekking van de rij-totalen. 2. Bepaal de verschillen ƒ — e. De twee verschillen op één rij zijn gelijk, doch hebben een tegengesteld teken. 3. Kwadrateer ieder verschil en deel het kwadraat door de bijbehorende verwachting (dit is in tabel 9.11 gedaan. Men kan ook per rij het kwadraat van het rij-verschU vermenigvuldigen met de som van de reciproken van de verwachte frequenties van die rij). 4. Xg» is de som van de bij (3) verkregen uitkomsten. Voor het voorbeeld is -X"o^(3) = 5,16. b. Verkorte berekening. Als men voor de waargenomen frequenties van de 2x>' tabel de in tabel 9.12 aangegeven symbolen gebruikt, dan kan men Xg» ook berekenen volgens (9.16)
•
AB 1/LJ ai + bi
n J
Daar A, B e n n direct bekend zijn, behoeft men dus slechts voor elke rij de fractie ai»l{ai -\- bi) te berekenen. rabeI9.12. 2 X r tabel Steekproef 1 2
Categorie 1 2
«1 «2
r Totaal
Uai = A
Totaal ai + bi «2 + ^2
Hbi = B
ar + b. A + B=n
Voor voorbeeld 9.13 is de som van deze fracties:
J5)^ 22
+
(14)^
68
, (8)
+•
65
+
34
1,1364-1- 2,8824 + 4-0,9846-1-0,1176 = 5,1210,
zodat X^—
(189) | ^ [ 5 , 1 2 1 0 - ^ ] =5,1680. 29 X
(Het geringe verschil met de uitkomst in tabel 9.11 is een gevolg van afrondingsfoutjes.) Het nadeel van deze rekenmethode is echter, dat men niet, zoals in tabel 9.11, categorie na categorie de verschillen tussen de waargenomen en verwachte frequenties en de bijdragen tot Xg» kan inspecteren. 206
D E ;^*-T0ETS OP D E 2 X R TABEL
9.6
9.6.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
Onder de hypothese, dat beide steekproeven uit dezelfde populatie stammen, volgt de grootheid X» bij benadering een ;^*-verdeling met r — 1 vrijheidsgraden (bij gegeven randfrequenties kunnen r — 1 velden vrij worden ingevuld). De benadering is goed, als n niet te klein is en als geen verwachtingen kleiner dan 5 voorkomen. Wil men met een wat grovere benadering genoegen nemen, dan kan bij meer dan twee vrijheidsgraden nog een verwachte frequentie van 2 in één veld worden toegelaten, mits de overige verwachtingen alle ten minste 5 zijn. 9.6.4. UITVOERING VAN DE TOETSING
Er dient rechts éénzijdig te worden getoetst. Hg wordt bij een onbetrouwbaarheidsdrempd a verworpen, indien ^o'' > z V a {v = r - 1). Bij voorbeeld 9.13 is .X'o* = 5,17 (uitkomst van de verkorte methode, die het nauwkeurigst is) en er zijn 3 vrijheidsgraden. De rechtse kans van deze uitkomst ligt blijkens tabel D tussen 0,2 en 0,3, zodat Ho niet wordt verworpen. De conclusie, dat de uitkomst van de 'aüeen disipal'groep gunstiger is dan die van de 'ook andere middelen'-groep is dus niet gerechtvaardigd.^ 9.6.5. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN
De toets kan ook worden toegepast als de uitkomsten in klassen zijn ingedeeld; zo nodig zal men de verwachte frequenties moeten verhogen, door aangrenzende klassen te combineren. De toets is gevoelig voor verschillen van allerlei aard tussen de verdelingen (in niveau, in spreiding en/of in vorm). 9.6.6. OPGAVEN 9.19. Een intelligentietest, toegeTestresultaat past op twee aselecte steekSlecht Matig Gtoed proeven, levert nevenstaande Steek- 1 | 14 7 9 uitkomsten op. Toets (met proef 2„ I 3 11 ^ 16 a = 0,05) de hypothese, dat —T^ jT 25" zij uit dezelfde populatie stammen. 9.20.
Uit: John Hopkins University. Baltimore, Kursus Biostatistics 1954-55. Number of days Number of f PenicilUn G patients | Chloromycetin
l o r less 2 3 4 5 6 7 8 9 10 17 8 5 9 7 1 2 1 2 7 15 8 8 5 3 1 0 0 0 3
30 30 60 IA,
Total 59 43
'An experiment was conducted in John Hopkins Hospital to compare the effectiveness of sodium peniciUin G with Chloromycetin in the treatment of lobar pneumonia. Patients whose history numbers ended 1 Wij laten hier de vraag, of de 'proefopzet' wel zodanig is, dat een valide conclusie kan worden getrokken, buiten beschouwing.
207
9.7
KWALITATIEVE VERDELINGSVRIJE TOETSEN in an even figure received peniciUin therapy, whUe those with an odd number received Chloromycetin. Patients with certain compUcations, defined in advance of the study, were excluded. The data in the table show the frequency distribution of the number of days duration of fever foUowing the start of the therapy. What are your conclusions about the relative effectiveness of the two therapies in bringing down the fever?'
9.7. De xMoets op de k x 2 tabd 9.7.1. TOEPASSING OP KWALITATIEVE WAARNEMINGEN
Deze toets kan worden gebruikt voor het toetsen van de hypothese Ho, dat k asdecte steekproeven uit dezelfde dichotomie afkomstig zijn. De toetsingsgrootheid is
„.,7,
^.^l'^
waEirin /,; = de waargenomen, e^ = de verwachte frequentie van het veld op rij i en in kolom ƒ. Onder Hg volgt de grootheid X» voor niet te kleine steekproeven bij benadering een ;^*-verdeüng met k — 1 vrijheidsgraden. De toetsing geschiedt rechts éénzijdig en Hg wordt bij een drempelwaarde a verworpen, indien ^0* > X \ - . {v = k - 1). De uitvoering van de toetsing verloopt analoog aan 9.6. 9.7.2. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN: DE MEDIAANTOETS VOOR kSTEEKPROEVEN
Als de uitkomsten in k aselecte steekproeven kwantitatief zijn, kan men deze in een k x 2 tabd omzetten. Men bepaalt daartoe de mediaan van alle waarnemingen en kent vervolgens aan de waarden in de steekproeven een plusteken toe als zij groter dan en een minteken als zij hoogstens geüjk aan deze mediasin zijn. Voorbeeld 9.14.
Beschouw de drie aselecte steekproeven in tabel 9.13. Tabel 9.13
Steekproef 1 1,23 1.94 1,15 2,84 0,96 0.65 1,71 1,90 1,14 0,32 1,19 1,86 », = 12 + + + + Steekproef 2 0,59 0,92 1.56 1,55 0,72 0,10 0.35 1,44 2,70 0,63 0,36 1.16 1,78 0,94 «j = 14 + + + Steekproef 3 .3,92 3,99 3,60 1,01 2.86 3.34 2.25 2.16 3,45 2,40 », = 10 + + -t+ + + + + +
+
208
9.8
DE %*-T0ETS OP DE Ä X fi TABEL
De uitkomsten, groter dan de mediaan, zijn met -j- aangegeven. Uit tabel 9.13 kan nu de volgende 3 x 2 tabel worden samengesteld:
+ = boven de mediaan — = geüjk aan of kleiner dan de mediaan Totaal
Steekproef 1 2 3 5 4 9 7 12
10 14
1 10
Tot. 18 18 36
Volgens (9.17) is dan: (5
(9 - 5)* • b)' (4 - 7)» 6 ' 7 ' 5 J +- „ ' + = 2(V. + 'U + "/«) = 9.30. E r zijn 2 vrijheidsgraden en uit tabel D bUjkt, dat X ^ een overschrijdingskans bezit die ongeveer geüjk is aan 0,01. De hypothese, dat de drie steekproeven uit dezelfde populatie stammen kan dus bij gebruik van een 1 % drempel worden verworpen. -"o
9.8. De x*-toets op de k x r tabel 9.8.1. TOEPASSING OP KWALITATIEVE WAARNEMINGEN
Deze toets kan men toepassen voor het toetsen van de hypothese Ho, dat k aselecte steekproeven uit dezelfde populatie met r categorieën stammen. De toetsingsgrootheid is
^•=ZZ^ ««
(9.18)
««)^
=17=1
Onder Ho volgt de grootheid X^ bij benadering een ;f*-verdeüng met (Ä — \){r—\) vrijheidsgraden. De toetsing geschiedt rechts éénzijdig en Ho wordt bij een drempelwaarde a verworpen voor ^o*>%V„[v=(Ä-l)(r-l)]. Formule (9.18) kan als volgt worden herleid "ZJZJ
«i.
Z J Z J Cii
^'+^=Yl!i
n.
Noemt men de bij veld (ƒ, i) behorende randfrequenties kj en ri, dan is Cij = rikj/n, zodat
"•"> ^ « - Z I ^ -"{im-^} De som tussen de grote haken kan worden verkregen, door van elk veld het kwadraat van de waargenomen frequentie te delen door het product van de bij dat veld behorende randfrequenties en deze quotiënten 209
9.8
KWALITATIEVE VERDELINGSVRIJE TOETSEN
over alle rk velden te sommeren. Deze berekening kan zeer goed op een rekenmachine worden uitgevoerd, maar heeft het nadeel, dat men niet meer veld na veld het verschil tussen de waargenomen en verwachte frequentie en de daaruit resulterende bijdrage tot X ^ kan bestuderen. Voorbeeld 9.15.
Uit: N.T.v.G., 100 (19561, 104. De uitkomsten in tabel 9.14 betreffen de wijze, waarop de baringspijn tijdens de ontsluitingsperiode werd doorstaan bij drie groepen vrouwen, elk met een verschiUende voorbereiding. Hierop is de ;^-toets toegepast via formule (9.18). De berekening verloopt analcx>g aan die bij de voorgaande ;f'-toetsen. De berekende X ^ is zeer significant (P < < 0,001), zodat de li5rpothese dat de drie steekproeven uit dezelfde populatie afkomstig zijn wordt verworpen. Aan welke v(X)rwaarden dient de proefopzet te voldoen, wil men hieruit de conclusie mogen trekken dat de psychische prophylaxis nut heeft? Zie ook opgave 1.6.
Tabel 9.14. Wijze, waarop de ontsluitingsperiode voor de baring is doorstaan bij drie groepen vrouwen A = Voorücditing en oefening
Zeer goed Goed Matig Slecht Totaal
A 168 100 50 17 335
Waargenomen frequenties /^ B C 41 114 27 107 19 81 10 66 97 368
B = Voorlichting
Tot. 323 234 150 93 800
C = Geen voorbereiding
Verwachte fii — ^ii frequenties e^, A B C A B C 135,3 39,2 148,5 32.7 1,8 - 3 4 , 5 98,0 28,4 107,6 2,0 - 1 . 4 -0,6 0.9 11,9 62.8 18,1 69,1 - 1 2 , 8 23.2 38.9 11.3 42,8 - 2 1 . 9 - 1 . 3 335,0 97,0 368,0 0.0 0.0 0,0
ifii - ««)' Zeer goed Goed Matig Slecht
A 1069.29 4,00 163.84 479.61
B
C 3.24 1,96 0.81 1,69
1190,25 0,36 141,61 538,24
^0* = 22, 8821 + 0,3460 + 22,6435 = 45.9
A 7,9031 0,0408 2,6089 12.3293 22.8821
fii - ««)'/«« . B 0,0826
C 8.0152
0,0690 o.cxm 0,0448 2,0493 0,1496 12,5757 0,3460 22,6435 z'o,«»» (v = 6) = 22,457
9.8.2. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN
De ;fMoets kan ook worden gebruikt als de waarnemingen in de k aselecte steekproeven kwantitatief zijn, mits deze in klassen zijn of worden ingedeeld en de verwachte frequenties niet te klein zijn. Evenals de toets op de 2 x y tabel (die als een speciaal geval, met k = 2 kan worden beschouwd) is de ;fMoets hierbij gevoelig voor verschillen van allerlei aard tussen de verdelingen.
210
;U*-T0ETSEN OP STOCHASTISCHE ONAFHANKELIJKHEID
9.9
9.9. Gebruik van de x'-toetsen bij toetdng van de hypothese, dat twee categorische systemen stochastisch onafhankelijk zijn 9.9.1. TOEPASSING
Als men aselect een steekproef van n elementen uit een bepaalde populatie heeft getrokken en per element een waarneming aan twee verschillende categorische systemen heeft verricht, dan verkrijgt men n waamemingsparen, waarvan de uitkomsten in een k x r tabel zijn samen te vatten. Met behulp van de in 9.8 beschreven x^-toets kan men de hypothese Ho toetsen, dat de twee categorische systemen stochastisch onafhankelijk zijn. Voorbedd 9.16. Uit: Mens en Onderneming (1952), 408. In dit artikel wordt o.m. opgemerkt : 'Van 281 gevallen van genezen longtuberculose, welke na hun kuur minstens 4 jaar onder controle hebben gestaan, is nagegaan, hoeveel recidieven er optraden na de genezing, hierbij tevens in rekening brengende het tijdsinterval na de kuur en de ernst van de doorgemaakte ziekte. De volgende tabel geeft hiervan een overzicht. Ernst v/d afwijking „ T • 1-^ Gevorderd rA ^ -^ u.- Totaal Licht Ernstig Binnen 1 jaar na de kuur T, . . . 1 — 2 jaar na de kuur Recidieven ^ ~'. , , 2—3 jaar na de kuur 3—4 jaar na de kuur Geen recidieven Totaal
11 6 3 4 62 86
27 16 10 8 105 166
9 2 2 0 16 29
47 24 15 12 183 281
Hieruit büjkt dus, dat, hoewel zelfs bij lichte processen nog een grote recidiefkans bestaat, deze recidiefkans ook afhankeUjk is van de ernst van het proces ' 9.9.2. DE TOETSINGSGROOTHEID
Onder de h3^othese, dat beide categorische systemen (i.e. : ernst van het doorgemaakte proces en het optreden van recidieven) stochastisch onafhankeUjk zijn, kunnen de verwachte frequenties op de gebruikelijke wijze worden berekend (product van de bij een veld behorende marginale frequenties, gededd door n). De toetdngsgrootheid is X» volgens (9.18). Daar in voorbeeld 9.16 bij sommige velden zeer lage frequenties optreden, hebben wij de recidiefcategorieën < 1 en 1 tot 2 jaar, resp. 2 tot 3 en 3 tot 4 jaar, gecombineerd. De berekeningen zijn in de volgende tabel uitgevoerd :
211
9.9
KWALITATIEVE VERDELINGSVRIJE TOETSEN
fii Afwijking Totaal L G E reci-ftot 2 jaar 17 43 11 71 die- 2 tot 4 jaar 7 27 18 2 ven [geen 62 105 16 183 Totaal 281 86 166 29 Xo' = (-4,7)»/21,7 + (1,0)V42 +
Afwijking fii ~ ^ii L G E 21.7 42,0 7,3 - 4 , 7 + 1 , 0 + 3 , 7 8,3 15,9 2,8 - 1 , 3 + 2 , 1 - 0 , 8 56,0 108,1 18,9 + 6 , 0 - 3 , 1 - 2 , 9 86,0 166,0 29,0 0 0 0 . . . . + (-2,9)V18,9 = 4,80
Er komt één verwachte frequentie voor die lager is dan 5, maar deze kan, gezien de grootte van de overige verwachtingen, zonder bezwaar worden toegelaten. 9.9.3. VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg EN UITVOERING VAN DE TOETSING
Onder de nulhypothese volgt de grootheid X» bij benadering een %^-verdeling met {k — l){r — 1) vrijheidsgraden. Hg wordt dus bij een drempelwaarde a verworpen, indien
Xg»>x\-.[v^{k-mr-'^)]. De rechtse kans van de waargenomen Xg» = 4,8 blijkt ongeveer 0,3 te zijn [tabel D, r = (3 — 1)(3 — 1) = 2 X 2 = 4]. Bij deze groepering luidt dus de conclusie, dat de waargenomen samenhang nog heel goed toevallig kan zijn. 9.9.4. TOEPASSING OP KWANTITATIEVE WAARNEMINGEN
Als de waarnemingsparen waarden of rangorden betreffen, kunnen zij door groepering in een k X r tabel worden omgezet. Hierbij zal men vrij grof moeten groeperen, om te lage verwachte frequenties te vermijden. In het algemeen is het nuttig, de groepen zo te kiezen, dat de verschillen tussen de k horizontale randfrequenties en die tussen de r verticale randfrequenties zo klein mogeüjk zijn. Voorbeeld 9.17. Beschouw het correlatietableau in tabel 2.4. Dit kan als volgt worden omgezet in een 3 x 3 tabel: Tabel 9.15. Relatie tussen leeftijd en lengte van jongens van 7, 8 Bn 9 jaar. Het correlatietableau uit tabel 2.4 omgezet in een 3 x 3 tabel Lengte in cm
83 t/m 91
135-152 129-134 111-128
3 21 60
Leeftijd in maanden 92 t/m 100 101 t/m 109 15 40 31
49 35 8
Totaal 67 96 99 262
86 1 92 Totaal 84 Op deze 3 x 3 tabel kan de ;f^-toets worden toegepast. Het is echter wel duideüjk, dat deze grove groepering tot een verües aan informatie (en daardoor in het algemeen tot een minder scherpe toetsing) leidt.
212
9.9
. /^-TOETSEN OP STOCHASTISCHE ONAFHANKELIJKHEID
De sterkste groepering treedt op, indien men de waarnemingsparen in een 2 x 2 tabel omzet. Men kan dit eenvoudig grafisch uitvoeren, door de waamemingsparen als punten in een rechthoekig assenstelsel te tekenen. Hierin trekt men een verticale lijn Lv en een horizontale lijn LH zodanig, dat links en rechts van Lv en boven en onder LH (ongeveer) evenveel punten liggen. Men noemt deze toetdngsmethode via een 2 x 2 tabel wel de methode der dubbele dichotomie. Voorbeeld 9.18.
In figuur 9.5 is nogmaals het spreidingsdiagram van de waamemingsparen uit voorbeeld 2.6 betreffende de vleugellengte (.*) en de lengte van de tong (y) van 22 bijen getekend. De Ujnen Lv en L H zijn verkregen, door van Unks, resp. van onder, 11 punten af te teUen. Hierdoor verkrijgt men de volgende 2 x 2 tabel : VleugeUengte
Tonglengte
9 2 11
1 +1 ^ 1 9 11
1
Ar„«= (12 - 5,51 - 0 , 5 ) « ( — j = 6,54
+
11 11 22
A,98(l) = 5.412 z%.„(l) = 6,635
1
6.70 LR
£ 6,60 E
1
_•
•
c
•
S 6.50 c
S.
. • •
• -
•
O)
§ 6.40
• .
•
•
••1
6,30
Lv . 9.20
9,30
9,40
9,50
9.60
9.70
9.80
vleugellengte In mm Figuur 9.5. Methode der dubbele dichotomie: omzetting van kwantitatieve waarnemingsparen in een 2 x 2 tabel.
213
9.9
KWALITATIEVE VERDELINGSVRIJE TOETSEN
9.9.5. OPGAVEN 9.21. Uit: RoPE. Opinion Conflict and School Support. 1941. 'Each of 1464 adult residents of Kttsburgh. Pa., was interviewed on a variety of issues related to tax support. One of the questions asked was ; 'Do you think t a x money should, or should not, be spent on nursery schools for chUdren less than four and a half years old?' The problem was to determine whether there is a relationship between type of response and age of respondents. The results were:
Favorable response No opinion Unfavorable response Total Toets (met a • hankeUjk zijn. 9.22.
20-34 153 35 377 565
Group aged 35-54 182 50 417 649
over 54 65 25 160 250
Total 400 110 954 1464
0,05) de hjrpothese. dat leeftijd en antwoordtjrpe onaf-
Uit de kursus: Summarizing Experimental Data. Columbia University. U.S.A. The American Journal of Public Health for February. 1931. ccmtains a paper on meningitis in New York City in which cases coUected over a twenty year period are tabulated as to age and etiology. The following table is a portion of this tabulation: Meningitis Cases, New York City Form Meningococcus Tuberculous Pneumococcus Streptcjcoccus Total
Under 1 195 136 28 25 384
Age in years 2 1 86 51 183 107 8 13 5 11 287 177
3&4 118 150 14 11 293
Total under 5 450 576 63 52 1 1141
Analyze the material of this table so as to evaluate the evidence it presents on the relationship between form of meningitis and age of case. 9.23.
Pas de methode der dubbele dichotomie toe op de waamemingsparen in opgave 2.3.
9.24.
Pas de x' toets toe op de gegevens intabsl 9.15.
214
HOOFDSTUK 10.
KWANTITATIEVE VERDELINGSVRIJE TOETSEN 10.1. De x'-toets voor aanpassing 10.1.1. TOEPASSING
De %Moets voor aanpassing dient voor het toetsen van de hypothese Ho, dat een aselecte steekproef van n waarden stamt uit een populatie met een bepaald verdelingsts^pe (bv. binomiaal. Poisson, normaal). 10.1.2. UITVOERING VAN DE TOETSING
De toets kan worden uitgevoerd als het aantal waarnemingen niet te klein is, zodat een frequentieverdeling kan worden opgesteld. In de regel wordt onder Ho wel het verdelingstype gespecificeerd, maar is (zijn) geen parameter(s) van de verdeling gegeven. Men kan dan deze parameter(s) uit de waargenomen frequentieverdeling schatten en vervolgens de best-passende (binomiale. Poisson, normale) verdeling berekenen,^ Op de waargenomen en best-passende ( = verwachte) verdelingen kan daarna de %*-toets uit 9.2 worden toegepast. Het aantal vrijheidsgraden is dan echter : V = k — l — m, waarin: m = het aantal uit de steekproef geschatte parameters, k = het aantal klassen. Men dient er voor te zorgen, dat de verwachte frequenties (in de best-passende verdeling) ten minste geüjk aan 5 zijn; zo nodig kan men daartoe klassen met een lage verwachting combineren. Vanzelfsprekend is k dan geüjk aan het aantal klassen, dat nà deze groepering aanwezig is.
Voor het berekenen van de best-passende binomiale verdeling en van de best-passende Poisson-verdeüng ontleent men één parameter {P, resp. /i) aan de waargenomen verdeling, zodat het aantal vrijheidsgraden bij toepassing van de %*-toets Ä — 1 — 1 = ^ — 2 bedraagt. Voor de best-passende normale verdeling schat men twee parameters {/u en a), zodat dan met k — 3 vrijheidsgraden getoetst wordt. Voorbeeld 10,1 verduiddijkt een en ander. Toetst men de hypothese, dat de steekproef afkomstig is uit een ^ Zie resp. 4.3.3, 4.4.4 en 5.5.5.
215
10.1
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
voüedig gespecificeerde verdeüng (waarvan dus de parameters eveneens gegeven zijn), dan behoeven deze rüet uit de steekproef te worden geschat en is j» = Ä — 1. Voorbeeld 10.1. In tabel 10.1 is de waargenomen en de best-passende normale verdeüng uit tabel 5.2 overgenomen. Bij de berekening van Xg' ziya, om te lage verwachte frequenties te vermijden, de twee hoogste en de drie laagste klassen gecombineerd. De toetsing verloopt aln volgt: a. Ho: De steekproef stamt uit een normaal verdeelde populatie met /i = 13,4 en <j = 0,95. Hl : De steekproef stamt niet uit deze populatie. b. Kies a = 0.05. c. Onder Ho volgt de grootheid X ' [volgens (9.3)] bij benadering een X^-verdeling met j> = 9— 1—2 = 6 (na cle groepering resteren 9 klassen, terwijl twee parameters zijn geschat). d. Uit tabel D wordt afgelezen, dat Hg bij een 5% drempel kan worden verworpen voor Xo' > 12.59 [d.i. Z'O.BSC* = 6)]. e. Bereken Xo'. Deze berekening is in tabel 10.1 uitgevoerd en levert op: Xo'== 6.19. /. Daar deze waarde aanzienlijk lager is dan 12,59 wordt Hg niet verworpen. Tabel 10.1. Toepassing van de ;f*-benadering op de waargenomen en best-passende normale verdeling van de hemoglobinewaarden in tabel 5.2 Klassegrenzen 15,75-16,25 15,25-15,75 14,75-15.25 1 4 . 2 5 - 14.75 13,75-14,25 1 3 , 2 5 - 13,75 12,75-13.25 12,25-12.75 11,75-12.25 11.25-11,75 10,75-11,25 10,25-10.75 Totaal
fi
«<
IV lih^
11 19 26 46 38 24 15
^1 U6 ij 190
9,9 20,7 32.1 34,4 40,9 25.7 13,7 5,51 1,8 7,8 0,5j 190,1
fi-^i
ifi - ei)'
(fi - ed'lei
0,1
0,01
0,0020
1,1 -1,7 -6,1 11.6 -2.9 -1,7 1,3
1,21 2,89 37,21 134,56 8,41 2,89 1,69
0,1222 0,1396 1,1592 3,9116 0,2056 0,1125 0,1234
-1.8
3,24
0,4154
-0,1
—
Xo' = 6,1915
Het is duideUjk, dat men op grond van de uitkomst van deze toetsing niet mag beweren, dat de hemoglobinewaarden van deze kinderen normaal verdeeld zijn. Vrijwel geen enkele verdeling is precies normaal en als men dus een niet-sigiüficante uitkomst vindt, komt dit doordat men niet genoeg waarnemingen verricht heeft om het zeker bestaande verschil statistisch aan te tonen. Als het aantal waarnemingen echter niet t e klein is en X ^ is verre van significant, dan is het nut van zo'n uitkomst, dat men zich de moeite kan besparen om een ander model voor de betrokken populatieverdeüng te zoeken.
216
DE TOETS VAN KOLMOGOROV-SMIRNOV
10.2
10.1.3. OPGAVEN 10.1.
Onderzoek via de ;f«-toets (a = 0,05) de overeenstemming tussen de waargenomen en best-passende verdeüng bij: a. Opgave 4.13 b. Opgave 4.14 c. Opgave 4.23 d. Opgave 5.14.
10.2. De toets van Kolmogorov-Smimov (K-S toets) 10.2.1. TOEPASSING
Deze toets kan men toepassen voor het toetsen van de hypothese Hg, dat een aselecte steekproef afkomstig is uit een populatie met een volledig gespecificeerde continue verdeling. In 10.1 hebben wij gezien, dat men voor het toetsen van deze h3rpothese ook de ;^Moets voor aanpassing kan gebruiken. Het verschil tussen de beide toetsen is echter: 1. De ;K*-toets is bruikbaar, als alleen het verdeüngstype wordt gespecificeerd en als één of meer parameters mt de steekproef worden geschat. De K-S toets kan strikt genomen alleen worden gebruikt, als ook de parameters gegeven zijn. Uit gegevens van MASSEY (103) büjkt echter, dat de toepassing van deze toets met geschatte parameters waarschijnlijk tot een uitkomst leidt, die conservatief is t.a.v. het verwerpen van Hg, d.i. een te grote overschrijdingskans oplevert. 2. Een nadeel van de ;f*-toets vergeleken met de K-S toets is, dat bij eerstgenoemde de waarnemingen in klassen moeten worden ingedeeld, zodat de uitkomst van de toetsing tot op zekere hoogte van deze indeling afhangt. Bij de K-S toets is een indeling in klassen niet nodig; deze verzwakt zelfs het onderscheidingsvermogen. Deze toets kan daardoor ook worden toegepast, als de steekproefomvang te klein is voor het gebruik van de %*-toets. 3. De K-S toets geldt strikt genomen alleen voor continu verdeelde waarden. De toets kan wel voor discreet verdeelde grootheden worden gebruikt, maar levert ook dan een te grote overschrijdingskans op. 10.2.2. UITVOERING VAN DE TOETSING
De toetdng wordt meestal grafisch uitgevoerd en wij demonstreren dit aan de hand van het volgende voorbeeld. Voorbeeld 10.2. Men wil onderzoeken of een populatie standaardnormaal verdedd is (d.i. dus: een normale verdeling volgt met ƒ* = O en ff = 1) en trekt daartoe aselect eén steekproef van 20 elementen, die de volgende waarden oplevert (naar grootte gerangschikt en afgerond op 2 decimalen) : -1,33 -1,06 -0,93 0,78 0,79 0,97
-0,45 0,15 0,40 0,44 0,55 0,59 0,68 1,10 1,32 1,69 1,91 2,06 2,44 2.75. 217
10.2
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
De toetsing heeft het volgende verloop (zie figuur 10.1): a. Teken het relatieve somfrequentie-histogram van de verkregen waarnemingen. Voor het voorbeeld is dit de trappenlijn S. b. Teken boven en onder de trappenlijn S, op een afstand Z)„, de parallel verlopende trappenlijnen Gi en Gg. In tabel S zijn voor een reeks waarden van « < 35 en een vijftal onbetrouwbaarheidsdrempels a de waarden van D^ gegeven. Voor « > 35 kunnen deze met de in tabel S opgenomen formules worden berekend. Voor het voorbeeld is » = 20 en als wij a = 0,05 kiezen, levert tabel S op: Z>o.o5(20) = 0,294. De trappenlijnen Gi en Gg m figuur 10.1 bevinden zich dus op deze afstand boven, resp. beneden, de trappenlijn S.
- 3 - 2 - 1
O
1
2
3
T
Figuur 10.1. Grafiek voor de K-S toets, zie voorbeeld 10.2. c.
Teken in de grafiek de cumulatieve kansverdding onder Hg. Bij het voorbeeld luidt Hg: de populatieverdeling is standaardnormaal. Uit tabel A kan men voor een aantal waarden van de standaardnormaal verdeelde grootheid T de linkse kansen aflezen, bv. voor : T —2.0 —1,5 —1.0 —0,5 O 0,5 1,0 1,5 2,0 Pi.(T) 0,0228 0,0668 0,1587 0,3085 0,5000 0,6915 0,8413 0.9332 0,9772
De punten [T, P L { T ) ] kunnen nu in de grafiek worden getekend en door deze punten kan de kromme van de cumulatieve populatieverdeling worden geschetst. 218
DE TOETS VAN KOLMOGOROV-SMIRNOV
10.2
d. De waarde Dg{n) is zodanig bepaald, dat Hg op grond van een steekproef van n elementen bij een drempelwaarde a kan worden verworpen, indien de kromme ergens buiten de grenslijnen G^ en Gg valt. Daar de kromme in figuur lO.l (tussen T = 0 en r = l ) buiten de grendijnen loopt, wordt Hg bij een 5% drempel verworpen.^ 10.2.3. SCHATTING VAN DE POPULATIEVERDELING
De trappenlijnen G^ en Gg, die met Z)„ uit S zijn geconstrueerd, sluiten een betrouwbaarheidsgordel voor de populatieverdeüng in met een betrouwbaarheidscoëfficiënt 1 — a. D.w.z. men kan met een betrouwbaarheid 1 — a beweren, dat de grenslijnen de cumulatieve relatieve populatieverdeling omsluiten. Tabel S kan ook worden gebruikt om de steekproefomvang te bepalen die nodig is om bij een bepaalde waarde 1 — a een betrouwbaarheidsgordel van bepaalde breedte te verkrijgen. Onderstel bv., dat men een zodanige steekproef wil trekken, dat een 95% gordel verkregen wordt, waarvan de breedte 0,05 bedraagt. Dan is .D„ = 0,05/2=0,025 en (zie tabel S) : ^
= 0.025, zodat: n = [
^
= (54.4)^ = 2960.
Wenst men een 99% betrouwbaarheidsgordel van dezelfde breedte, dan dient de steekproefomvang te zijn :
L0,025j 10.2.4. TOEPASSING OP DISCREET VERDEELDE WAARNEMINGEN
Bij een discreet verdeelde populatie is de K-S toets van belang, als de steekproefomvang zo klein is, dat men bij het gebruik van de %*toets tot een (min of meer willekeurige) groepering van klassen moet overgaan om te lage verwachte frequenties te vermijden (zie opgave 10.3). De toets kan dan meestal eenvoudiger tabellarisch worden uitgevoerd en verloopt dan op de volgende wijze: a. Bereken uit de waargenomen frequenties fi (de verwachte frequenties ß.) de somfrequenties Fi{Eij en de relatieve somfrequenties F i/n {Ei/n). b. Bepaal het maximale verschil |F» — Ei/n \ = Dg. 1 De in het voorbeeld gebruikte steekproef werd aselect getrokken uit een normaal verdeelde populatie met ^t = 0,5 en o = 1. Teken in figuur 10.1 ook de hiermede corresponderende cumulatieve verdeling.
219
10.2
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
Kies de drempdwaarde a waarbij getoetst wordt en ontleen aan tabel S :£»„(»). d. Verwerp Ho bij de gekozen drempelwaarde indien Do > •^„(M) is. Voorbeeld 10.3. In tabel 10.2 is de tabellarische uitvoering van de K-S toets gedemonstreerd voor de uitkomsten van 360 worpen met een dobbelsteen (voorbeeld 9.1). De te toetsen hypothese Hg luidt: de dobbelsteen is zuiver en men kiest a = 0,05. Tabel 10.2. Toepassing van de K-S toets op discreet verdeelde uitkomsten; 360 worpen met een dobbelsteen (voorbeeld 9.1) Aantal ogen
Waarnemingen
2 52 119 0.330 60 120 0,333
67 67 0,189 60 60 0,167
fi Fi Fi/n «i
Verwachtingen
1
Ei Ei/n
4
3 39 158 0,439 60 180 0,500
72 230 0,639 60 240 0,667
5 55 285 0,792 60 300 0,833
6 75 360 1,000 60 360 1.000
Do = max. | F J n - E J n \ = \ 0,500 - 0,439 1 = 0,061 Tabel S: i3o,o5(360) = l,36/v'360 = 1,36/18,97 = 0,072 Do = 0,061 is kleiner dan Do,o6(360) = 0,072, zodat HQ i^et wordt verworpen. 10.2.5. OPGAVEN 10.2.
Men heeft aselect de volgende steekproef getrokken: 9,19 7,62 7,53 9,04 12,02 11,70 9,16 12,26 9.37 11.06 7,34 9,07 8,95 10,62 12,22 12,60 10,41 9,06 10,52 9,90 Toets de h3rpothese, dat deze steekproef stamt uit een normaal verdeelde populatie met : a. [1 = 9, 0 = 2, 6. /t = 10, o = 3, c. /« = 10, o = 2 (Kies a = 0,05).
10.3.
De waargenomen verdeling van een discreet verdeelde grootheid is: ^i
fi
1 0
2 1
3 0
4 5
5 4
a. Toets, met a = 0,05, de hypothese ^0= •P(l) = -P{2) = . . . = P(5) = ^/i door middel van de K-S toets. SIEGEL (108) merkt naar aanleiding van deze gegevens op: 'A reanalysis by the %' test . . . wül highUght the superior power of the K-S test.' Hij past de ;(*-toets toe. na de klassen 1 en 2, resp. de klassen 3, 4 en 5 te hebben gecombineerd en vindt dan Xo'(v = 1) = 3 , 7 5 (zonder continuïteitscorrectie) . b. Kunt u zich met SIEGEL'S conclusie verenigen ? Wat toont dit voorbeeld wèl aan ? 220
DE RANG-TEKENTOETS
10.3
10.3. De rang-tekentoets^ 10.3.1. TOEPASSING
Deze toets kan men toepassen als de (relatieve) grootte van de verschillen tussen gepaarde waarnemingen Ijekend is. De te toetsen hypothese Hg luidt, dat de verschillen stammen uit een symmetrisch verdedde populatie met mediaan nul. Bij de praktische toepassing van de toets komt dit neer op de hypothese, dat de verschillen tussen de gepaarde waarnemingen toevaUig zijn. Toelichting ' . Onderstel dat men wü nagaan of een geneesmiddel invloed uitoefent op een kwantitatieve grootheid, zoals bloeddruk, gehalte van één of andere stof in het bloed. e.d. Ook reeds zonder gebruik van het middel bestaat er een individuele variabiUteit, die van persoon tot persoon kan verschillen. Beschouw nu één patiënt en wel voordat het middel is toegediend. De grcx)theid a die gemeten wordt is een variabele, die voor de beschouwde patiënt een bepaalde verdeling volgt. Men dient nu het geneesmiddel toe. Herhaalde (in gedachten of werkelijk verrichte) waarnemingen leveren dan een grootheid b. Heeft het geneesmiddel geen enkele uitwerking, dan bezitten de grootheden « en 6 dezelfde verdeUng en men kan gemakkelijk bewijzen, dat de grcxjtheid z = a — b symmetrisch verdeeld is met gemiddelde = mediaan geüjk aan nul. Heeft het middel echter enigerlei uitwerking, dan zal 6 een enigszins andere verdeling bezitten dan a en de grootheid z is dan niet meer symmetrisch verdeeld t.o.v. het nulpunt. Indien het verrichten van waarnemingen niet te lastig en voor de patiënt niet hinderlijk is, kan men aan één patiënt meerdere waarnemingen voor en na de toediening verrichten. Men kan dan, voor iedere patiënt afzonderüjk, met een toets voor twee aselecte steekproeven (bv. met de toets van W I L COXON) nagaan, of de verdeUng van q (vóór toediening) dezelfde is als die van 6 (na toediening). Daar men dit niet slechts van één patiënt wü weten, maar van zoveel mogeüjk en er ook vaak bezwaren bestaan tegen het verrichten van meerdere waarnemingen per patiënt, zal men overgaan tot het verrichten van één waarneming voor en één na de toediening bij zo veel mogeüjk patiënten. Deze opzet van het experiment heeft het grote voordeel, d a t de draagwijdte van de verkregen conclusie zo- grcxjt mogelijk wordt. Voor ieder der patiënten vindt men dan één waarde van de grootheid z, die. als het middel geen uitwerking heeft, symmetrisch verdeeld is t.o.v. het nulpunt. De grootheden z zullen echter in het algemeen niet voor aUe patiënten dezelfde verdeling bezitten. Noemt men de bij n patiënten bepaalde waarden ( = verschülen, die niet geüjk zijn aan 0) : Zl, Z2, . . . . , Zi, . . . . , z ^
en de bijbehorende stochastische grootheden :
1 De toets is het eerst aangegeven door WILCOXON (116) en wordt in de uitvoerige handleiding van BENARD & VAN EEDEN (77) de symmetrietoets van WILCOXON ge-
noemd. O.i. is de naam rang-tekentoets (die ook in de buitenlandse literatuur gebruikelijk is) sprekender en geeft deze minder kans op verwarring met de toets van WILCOXON voor twee steekproeven. 2 Wij volgen hier grotendeels het betoog van HEMELRIJK in (91).
221
10.3
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
dan stelt de rangtekentoets ons in staat de hypothese Hg te toetsen, dat de grootheden y^ alle sjmimetrisch verdeeld zijn met het nulpunt als punt van S3nnmetrie. Bij deze toets behoeft dus met te worden ondersteld, dat alle ?{ dezelfde verdeUng bezitten. Men toetst dus de praktische hypothese, dat de toediening van het geneesmiddel bij geen der patiënten invloed op de gemeten grootheid a uitoefent, of wel: dat de verschillen tussen de gepaarde metingen toevaUig zijn. Bij het onderzoek moet er voor gezorgd worden, dat alle paren van verricdite metingen onafhankeUjk zijn. Deze voorwaarde is, daar men verschiUende personen onderzoekt, gewoonUjk reeds automatisch vervuld, mits de meettechniek voldoende constant is (zie opgave 10.6). Vanzelfsprekend dient men er ook voor te zorgen, dat gedurende het onderzoek alleen de eventuele uitwerking van het middel wordt gemeten, d.w.z. dat geen andere factoren invloed op de uitkomsten (kunnen) hebben.
Voorbeeld 10.4. Men wil onderzoeken, of het calciumgehalte in het serum van konijnen door intraveneuze toediening van vitamine Dg wordt beïnvloed. Men verricht daartoe het volgende experiment: bij 5 proefdieren meet men het calciumgehalte. Vervolgens krijgt elk dier een injectie met 200.000 I.E. vitamine Dj in solubilusator. Na drie dagen worden de calciumgehalten opnieuw bepaald. De uitkomsten van dit experiment staan in tabel 10.3. Tabel 10.3. Calciumgehalte (mg%) in het serum van konijnen, A = voor, B = drie dagen na toediening van 200.000 I.E. Dj Dier nr.
A
B
B-A
1 2 3 4 5
16,2 12,9 15,8 17,0 14,6
17,3 16,5 17,7 19.2 14.4
+ 1.1 +3,6 + 1,9 +2,2 -0,2
Contrôle: iTÄ -
^ ( \ + '^ 2
- ' ^ ' - 1 5 2
Rangnummers 2 5 3 4 1 15
Rangnummers met teken + 2 + 5 + 3 + 4 -1 + 14 - 1 + 1 3 = Vo
10.3.2. DE TOETSINGSGROOTHEID
De verkregen uitkomsten worden als volgt bewerkt (zie tabel 10.3) : 1. Bepaal het verschil tussen elk stel gepaarde waarnemingen (bv
B-A). 2. Schrap alle verschiUen die geüjk zijn aan nul. Van de m verschillen blijven er dan n over (in het voorbedd komen geen verschillen met de waarde O voor, zodat n = 5). 3. Vervang de absolute waarden van de verschülen door rangnummers, te beginnen met 1 voor het verschil met de kleinste absolute waarde. De rangnummers worden dus toegekend, zonder op het teken te letten! 222
10.3
DE RANG-TEKENTOETS
4. Voorzie de rangnummers van de negatieve verschillen, R{—), van een minteken en die van de positieve verschiUen, iï(M-), van een plusteken. 5. De toetsingsgrootheid V is geüjk aan de algebraïsche som van de getallen verkregen in 4, d.i. de som van de rangnummers met een positief teken, verminderd met de som van de rangnummers met een negatief teken : V = I:R{-\-) - I:R{-). Opmerking: WILCOXON (116) gebruikt als toetsingsgrootheid 2^R{+). Het is duidelijk, dat geldt: V = 22:R{-\-)—^n{n -f 1). 10.3.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
De hjTpothese Ho die men bij voorbeeld 10.4 wenst te toetsen, luidt : de toediening van het vitaminepreparaat oefent geen invloed uit op het calciumgehalte van het serum. Als geen gelijken (verschillen met dezelfde absolute waarde) optreden, kan de verdeling van de toetsingsgrootheid V onder Ho worden verkregen, door alle 2" mogdijke uitkomsten van het experiment systematisch uit te schrijven. In tabel 10.4 is dit voor de 2* = 32 mogelijke uitkomsten van het experiment in voorbeeld 10.4 uitgevoerd. Tabel 10.4. Verdeling van V onder Ho voor n = 5 A. Rangnummers met de mogelijke tekens ingnr.
++++ 1 +++ 1 + ++ 1 ++ + 1 ++ + 1 ++++
+ + +
e(+) ï(-)
15 0
14 13 12 11 10 1 2 3 4 5
12 11 10 9 10 9 8 8 7 6 3 4 5 6 5 6 7 7 8 9
V
15
13 11 9 7 S i
V
f
+ + +
+ + +
+ + + -
+ + +
+ + +
9 7 5 3 5 3
+ + + -
+ + + + ++ + - + +
1 1-1-3
1 1 +1 1 1 1 1+1 1 1 1 1+
+ + + + +
++ 1 1 1 + 1+ 1 1 1 ++ 1 1 + 1 1+ 1 1 + 1 + 1 1 1 ++ 1 + 1 1 1+ 1+ 1 1 + 1 1 + 1 + 1 1 1 ++
Tekens
1 2 3 4 5
+
+
5 4 3 2 1 9 8 7 7 6 5 6 5 4 3 6 7 8 8 9 10 9 10 11 12 10 11 12 13 14 3
1-1-1-3-5-3-5-7-9
B. VerdeUng van V onder HQ -15 -13 -11 - 9 - 7 - 5 - 3 - 1 1 3 5 7 9 1 1 1 2 2 3 3 3 3 3 3 2 2
-« = av»
0 15
- 5 - 7 - 9 -11 -13 -15
11 13 15 1 1 1
Tot. 32
Als er geen gelijken zijn, bezit de verdding van V onder Ho de volgende eigenschappen : a. De verdeüng is discreet. V neemt aüeen even waarden aan, als « = 3, 4, 7, 8, 11, 12, enz., dus als n een 4-voud of 4-voud min 1 is. Voor andere waarden van n neemt V alleen oneven waarden aan. b. De verdding is symmetrisch t.o.v. O, dus /iv = 0. c. De variantie van de verdding is: (10.1)
-
«(»+1)(2«+1) 223
10.3
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
10.3.4. UITVOERING VAN DE TOETSING ZONDER GELIJKEN
10.3.4.1. Exacte todsing {n < 20). In de handleiding (77, tabel I) vindt men voor « = 3 t/m 20 exacte rechts éénzijdige overschrijdingskansen van V. Wegens de symmetrie van de verdeling wordt voor een waarde van F die negatief is de links éénzijdige overschrijdingskans gevonden door in de tabel de rechtse kans van —F op te zoeken. Voor het experiment in voorbeeld 10.4 is Fo = 13. Uit de kansverdeling in tabel 10.4B blijkt, dat de tweezijdige overschrijdingskans van deze uitkomst gelijk is aan: Pi,(—13)-l-PH(-f 13)=2[P(15)-(-1-P(13)] = 2 x Vs« = Vs = 0,125. Bij een 5% drempd kan Ho dus niet worden verworpen. Overigens blijkt, dat de omvang van het experiment te klein is om bij tweezijdige toetsing met a = 0,05 tot het verwerpen van Ho te kunnen overgaan: zelfs als alle verschillen podtief zijn (Fo = 15) is de tweezijdige overschrijdingskans nog groter dan 0,05, nl. 0,0625. Als echter de tegenhypothese luidt, dat de calciumgehalten tengevolge van het preparaat stijgen, zodat rechts éénzijdig wordt getoetst, kan bij de uitkomst V g = 15 de nulhypothese bij een 5% drempel worden verworpen. 10.3.4.2. Hd gebruik van tabel J {n < 100). Tabel J bevat voor n = 5 t/m 100 en tweezijdige toetsing bij de drempelwaarden 0,01, 0,02, 0,05 en 0,10 de rechter kritieke waarden VR van F . Deze zijn zo gekozen, dat P{V > VR I H^ < a is. De linker kritieke waarden bij deze onbetrouwbaarheidsdrempels zijn: V L = — VR. Voor n = \A leest men bv. in tabel J af: Tabel jJ
« = 14
1 VR zodat:
VL
a 0,01 81 -81
0,02 75 -75
0,05 63 -63
0,10 55 -55
Hieruit volgt bv.: Pfl(-63)=Pi,(63) < 0,05 0,05>P7>(70)>0,02. Toetst men tweezijdig met onbetrouwbaarheidsdrempd a, dan wordt Hg dus verworpen indien 1 Fo I > VR{a, n). Tabel J kan ook worden gebruikt bij éénzijdige todsing, mits men de drempelwaarden halveert. Zo geldt bv. voor « = 14 (zie voorgaande tabel) : < 0,01 PR{75) < 0,01 P L { - B \ ) < 0,005. Toetst men links éénzijdig (alternatieve hypothese: de mediaan van de verschiUen is kleiner dan 0), dan wordt Ho met onbetrouwbaarheidsdrempd a verworpen, indien Fo < VL {2a, n) is. Toetst men rechts éénzijdig (alternatief: de mediaan van de verschillen is groter dan 0), PL{~75)
224
DE RANG-TEKENTOETS
10.3
dan besluit men met een onbetrouwbaarheid a tot het verwerpen van Ho. indien Fo > FH(2a, n) is. Voorbeeld 10.5. Onderstaande uitkomsten betreffen het aantal er5rthrocyten (mUl. per mm") bij 12 patiënten met anémie tengevolge van bloedverües, («) onmiddeUijk voor het begin van de therapie, (b) na een intraveneuze ijzertherapie van 15 dagen: Patiënt nr. a b b - a Rangnummer Rangnummer met teken
1
2'
3
4
5
2,9 2,5 2.5 3.7 3,0 3.9 3,8 3.6 3,6 3,6 1.0 1.3 1,1 - 0 , 1 0,6 7
9
8
7
9
8
1 -1
6
7
8
9
10
11
12
3.6 3,3 2,4 3,5 3,3 2,9 1,9 3,4 3,8 4,1 4,2 3,3 3,8 3,7 - 0 , 2 0,5 1,7 0,7 0,0 0,9 1,8
4
2
3
10
5
6
11
4
-2
3
10
5
6
11
Fo=7+9+8+4+3+10+5 + 6 + l l - ( 1 + 2 ) =60
« = 1 2 - 1 = 11
Men toetst de hjrpothese Hg, dat de therapie geen uitwerking heeft op het aantal erythrocyten, met als alternatief Hi, dat de therapie tot een verhoging van het aantal erythrocyten leidt en kiest a = 0,01. Onder Hi verwacht men, dat de verschillen b ~ a i a het algemeen positief zuUen zijn met grote waarden, zodat rechts éénzijdig wordt getoetst. In tabel J staat bij n = 11 en a = 0,02 als rechter kritieke waarde VR — 52. Daar Vo = 60 deze waarde overschrijdt, wordt iïo verworpen ten gunste van ifj. (Uit tabel J büjkt verder, dat de rechtse kans van Vo kleiner is dan 0,005. De exacte rechtse kans büjkt 0,00244 te bedragen.)
10.3.4.3. De normale benadering {n > 20). Bij niet te kleine n kan men gebruik maken van het feit, dat de grootheid F bij benadering normaal verdeeld is met gemiddelde O en spreiding av{l0.l), zodat de grootheid (10.2)
T= ^ — ^ = ^ = , ^ Cv ay Vn{n -f l){2n + l)/6 bij benadering standaardnormaal verdeeld is. Daar de discrete verdeling van F benaderd wordt door de continue normale verdding, is het aanbrengen van een continuïteitscorrectie gewenst. De afstand tussen de opeenvolgende waarden van F bedraagt 2 en de correctie is gelijk aan de hdft van deze afstand, dus 1. Bij gebruik van de normale benadering berekent men zodoende: (10.3)
Tg = - — " ' ~
en PD{TO) bij tweezijdige toetsing,
Ov
225
10.3
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
of (10.4.1) To =
Vo -f 1 Ov
en Pi(ro) bij links éénzijdige toetsing,
resp. (10.4.2) To =
en PR{TO) bij rechts éénzijdige toetsing. Ov
Hg wordt verworpen, indien de gevonden overschrijdingskans kleiner dan a is. Als men uitsluitend wil vaststellen, ot de berekende Tg significant is bij een drempelwaarde 0,05, 0,01 of 0,001 kan men gebruik maken van tabd 6.10. Voorbeeld 10.6. Onderstel, dat « = 20 en dat men vindt: Vg = 124. Uit tabel J büjkt, dat de rechts éénzijdige overschrijdingskans van deze uitkomst < 0,01 is. De exacte rechtse kans büjkt 0,009617 te bedragen. De normale benadering levert op : 124 1 123 ^» = . / o ^ o, .ff. = " ^ ^ ^ 7 = 2 ' 2 9 6 PB(2.296)=0.0108 (tabel A). V20 X 21 X 41/6 53,57 Ondanks de kleine n is de benadering dus reeds zeer bevredigend. 10.3.5. UITVOERING VAN DE TOETSING MET GELIJKEN
Wanneer n klein is en er veel gelijken ( = verschillen met dezdfde absolute waarde) zijn, kan men noch van tabel J, noch van de normale benadering gebruik maken. Men moet dan de verdeling van F exact berekenen. De berekeningsmethode is beschreven in (77, par. 8). Men zal hiertoe in de praktijk niet zo snel overgaan, daar het rekenwerk vrij tijdrovend is. Indien er relatief weinig gdijken voorkomen, kan men als volgt te werk gaan: Ken aan elk verschil binnen een groep geUjken het gemiddelde toe van de rangnummers, die de gehele groep dient te bezetten en bepaal daarna op de gebruikelijke wijze Fo. Is M klein en zijn er slechts enkele groepen met weinig geüjken, dan kan men deze uitkomst nog wel bij benadering interpreteren met tabel J. Is n groter en komen er meerdere groepen geüjken van grotere omvang voor, dan kan de normale benadering worden toegepast. Als de gdijken gesplitst kunnen worden in k groepen van resp. ti, ij, . . . . t^ gelijken (zodanig, dat de absolute waarden van twee verschillen behorende tot twee verschiUende groepen nid geüjk zijn, zie tabel 10.5) en men stelt
D=j: ti\ 1=1
dan wordt deze benadering uitgevoerd met in plaats van Ov volgens (10.1) Ov' volgens: 226
10.3
DE RANG-TEKENTOETS
D
n 12 In dit geval is de afstand tussen de opeenvolgende waarden van V in het algemeen niet constant, zodat een algemene regel voor de continuïteitscorrectie niet te geven is. Met een correctie ter grootte van 1 blijft men dan aan de veiüge kant (d.w.z. corrigeert men te sterk, zodat men tot een te grote overschrijdingskans komt). Met (10.5) vindt men voor de spreiding van F onder Ho een kleinere waarde dan met (10.1). Past men dus, ondanks het optreden van gelijken, de normale benadering met (10.1) toe, dan vindt men een (iets) te lage To en dus een (iets) te grote overschrijdingskans. Is deze te grote kans reeds < a, dan kan men Ho verwerpen zonder dat men tot berekening van D en het aanbrengen van de correctie behoeft over te gaan. (10.5)
ay'» =
ay»
-
Voorbeeld 10.7. Als voorbeeld bescdiouwen wij de 16 verschülen tussen gepaarde waarnemingen in tabel 10.5. De te toetsen hypothese Hg luidt, dat deze verschillen toevalüg zijn en men kiest als drempelwaarde a = 0,05. Tabel 10.5. Toepassing van de rang-tekentoets als geUjken voorkomen Waargenomen verschillen -0.1 -0,1 +0,1 -0,2 +0.2 -0.3 -0.4 -0,5 -0.5 -0,5 +0,5 +0,7 -0,8 -0,8 -1,2 -1,5 Totaal
Geüjken
Rangnummers met tekens 2 2
+
ti
U'
tl = 3
27
h = 2 to=l t^=l
8 1 1
t, = A
64
to=\ f, = 2
1 8
/ 8 = 1
1
i,= l
1
2 4è 44 6 7
94 94 94
94
12 134 134 15 16 -108 +28 + 28 - 80 = K„
Sti = n = - \ b
•
D = 112
De eerste groep gehjken bestaat uit de drie verschiUen met absolute waarde 0,1, zodat ti = 3. Zij dienen de rangnummers 1, 2 en 3 te bezetten en krijgen dus alle het gemiddelde rangnummer l+2-f3 = 2 227
10.3
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
(met het juiste teken). De tweede groep gelijken bestaat uit de verschiUen — 0,2 en -|- 0,2, zodat ij = 2. Zij moeten de plaatsen 4 en 5 bezetten en krijgen dus beide het gemiddelde rangnummer 4^. Voor de verschillen — 0,3 en — 0,4 noteert men resp. ig = I en ij — 1, enz. De juistheid van de bewerkingen kan worden gecontroleerd, daar de som van de absolute waarden van de positieve en negatieve rangsommen geüjk dient te zijn aan ^ { n -}- 1) en 2ïj = n. Men vindt FQ = — 80. Berekent men de spreiding van de verdeling van V onder Hg met (10.1), dan is de uitkomst:
. . • = " ^ " ' ^ '6f + " = 1 4 9 6 , „ - V i 4 9 6 = 38,68. De normale benadering met (10.3) levert dan op: 801-1 79_ To = ' 38,68 .„ ;„ = ^ ^ ^ = 2,04. " ^38,68 Daar deze uitkomst groter is dan 1,96 (zie tabel 6.10) kan men Hg bij de gekozen 5% drempel verwerpen en behoeft men feiteUjk niet meer over te gaan tot de berekening met de correctie voor geUjken. Voeren wij deze volledigheidshalve uit, dan is volgens (10.5) Ov'» = 1496 -
^^^"T ^^ = 1488, ay' = VÎ488 = 38,57.
Met de normale benadering vindt men nu : 801-1 79_ To = oo L = ^ ^ ^ ^ = 2,05. 38,57 - 38,57 Het verschil met de voorgaande uitkomst is dus van weinig betekenis. opmerking: In 10.5.5 behandelen wij nog een andere berekeningsmethode voor Fo, die vooral van belang is bij een groot aantal verschülen met vrij veel geüjken. 10.3.6. OPGAVEN 10.4. Toets de hypothese, dat de volgende verschülen tussen gepaarde continu verdeelde waarnemingen toevalüg zijn. Kies a = 0,05. - 1 1 - 1 0 - 8 - 3 - 1 - 1 0 0 0 + 2 + 4 + 5 + 8 + 9 + 1 4 -f-17 + 2 0 +25 +30 +46 +67 10.5. Uit: Br. J. of Cancer (1956), 767. Table IV. The effect of plasma of control persons on the mean corpuscular volume (MCV) of erythrocytes of patients with malignant tumours, in incubated systems A — MCV before incubation. B = MCV after incubation Case A B A-B
228
1 93,02 91,08 1,94
2 90.45 91,71 -1.26
3 92.64 94.44 -1,80
4 89,48 85,01 4,47
5 91.88 88,65 3.23
6 100.00 96.66 3.34
7 90.44 87.85 2,59
8 93.54 91,93 1,61
10.3
DE RANG-TEKENTOETS Case A B A-B
15 12 13 14 94,44 89.48 88,37 87.30 88.42 94.44 88.37 87,30 1,06 0.00 0.00 0.00 Toets (met a ~ 0,05) de hypothese, dat de waargenomen verschülen op toeval berusten.
10.6.
9 80,00 80,00 0,00
10 92,68 85,36 7,32
Uit: GREENBERG
11 85.59 82,35 3.24
(57).
'In an experiment to measure the development of immunity in mice to a particular nematode (Trichinella), young mice are matched according to sex and placed in two groups, one experimental and the other control. After a series of stimulating Lafections among the experimental group only, the immunity is measured by challenging both groups with a like number of organisms. To challenge each mouse with the infecting parasites, a smaU amount of solution is prepared containing the necessary larvae. Thus, the solution might be such that 0,05 cc is supposed to contain 200 larvae. Each mouse is then given 0,05 cc by mouth from a Sjmnge. Mice from the two groups are infected alternately, in the hope that this wiU cancel variations in dosage. A systematic scheme of this kind formed by an odd-even, odd-even order of injecting the mice during chaUenge may lead to a serious bias. Following the previously described procedure, instead of inoculating mice with the larvae, thirty dosages were placed on individual sUdes for the purpose of counting the number of larvae. The odd-numbered sUdes were considered expérimentais, the even-numbered ones controls, exactly as it would have occurred in an experiment. The uniformity data for these thirty slides are presented in the table.' a. VerschiUen de beide waamemingsreeksen significant bij een drempelwaarde 0,05 ? b. W a t valt u bij deze reeksen op en wat zou daarvoor de verklaring kunnen zijn ? c. Op welke wijze zou men naar uw mening de uitvoering van de proef en de proefopzet kunnen verbeteren ? Uniformity data on numbers of larvae in 30 inocula assigned by an alternative scheme Set 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Mean
Experimental 200 204 211 211 212 220 225 238 238 238 243 251 259 275 279 233.6
Control 207 206 208 213 217 221 235 238 237 246 243 252 261 277 283 236,3
C-E + 7 + 2 - 3 + .2 + 5 + 1 + 10 0 ^ 1 + 8 0 + 1 + 2 + 2 + 4 +2.7
229
10.4 10.7.
KWANTITATIEVE VERDELINGSVRIJE TOETSEN Uit: N.T.v.G., 100 (1956), 1364. Uit tabel V I I : Natrium- en kaUumgehalte in het bloed in mEq. per liter vóór en na behandeling met Diamox:
Patiënt no. ,.^ , Voor
Natr.JNa
fVoor iNa
^
1 135 140 4,7 4,3
2 134 135 4,7 4,1
3 143 140 4,1 5,3
4 143 144 4,3 4,3
5 130 138 5,7 6.6
6 130 136 4,5 3.3
8 128 137 4,6 4,2
9 137 132 5.1 3.9
10 140 143 5.8 3,7
11 139 140 4,6 4,3
14 136 141 4,8 4,0
15 132 140 4,5 3,7
16 140 139 4,3 4,2
17 136 146 4,6 4,4
18 140 138 5,3 4,3
Anal37seer deze uitkomsten. Kies a = 0,05. 10.8.
Uit BENARD & VAN E E D E N
(77).
Om na te gaan of het aantal trombocyten per m m ' bij konijnen door reserpine wordt beïnvloed, werd dit aantal bij 12 dieren onmiddelüjk vóór en 4 uur na toediening van reserpine bepaald : Na Voor N-V
128 153 115 159 189 211 177 147 90 136 151 115 154 200 157 148 + 3 8 + 17 - 3 6 + 4 4 + 3 5 + 11 + 2 0 - 1 Toets de hypothese, dat de reserpine geen invloed tromboc3d;en. Kies a = 0,05.
126 133 -7
89 146 221 80 150 181 +9 - 4 + 4 0
heeft op het aantal
10.4. De toets van Friedman ^ 10.4.1. TOEPASSING
Deze toets kan worden toegepast als men beschikt over k verwante steekproeven (zie 8.2) en de hypothese Hg wü toetsen, dat zij zijn te beschouwen als aselecte steekproeven uit populaties met dezelfde verdeling. De toets is voornamelijk gevodig voor verschillen in niveau tussen de populatieverdelingen. Voorbedd 10.8. Men heeft een drietal analysten, onafhankelijk van elkaar, het hemoglobinegehalte van zes sera met dezelfde dcca-hemometer laten bepalen. De uitkomsten van dit onderzoekje zijn in tabel 10.6 opgenomen. De te toetsen hs^othese Hg luidt : de drie steekproeven (reeksen bepalingen) stammen uit dezelfde populatie, d.w.z. de waargenomen verschillen tussen de uitkomsten der analysten zijn toevallig. Tabel 10.6. Hemoglobinebepalingen (g%) van drie analysten Rangorde Analyst Serum B C A B A 1 14,2 2 14,5 3 14,3 2 12,4 13,4 12,3 2 3 3 13,9 13,8 13,6 3 2 4 15,4 15,2 15.1 3 2 5 10,1 9,8 9,9 3 1 6 14,9 15,0 14,7 2 3 Aant al kolommen = Ä = 3 Rangsom 15 14 Aant al rijen = n = b Si 52 ^ Ook genoemd: de methode van de m rangschikkingen.
230
C 1 1 1 1 2 1 7 Sa
DE TOETS VAN FRIEDMAN
10.4
10.4.2. DE TOETSINGSGROOTHEID
Men kent aan de op één rij staande k verwante waarnemingen van laag naar hoog de rangnummers 1,2, . . . , k toe. Vervolgens bepaalt men van elke kolom de som van de daarin voorkomende rangnummers ( = de irangsom) Sj. De som van de op één rij staande rangnummers is k{k -f l)/2, zodat de som van alle rangnummers nk{k -\- l)/2 bedraagt. Het gemiddelde van de k sommen Sj is dus: ^ _ nk{k -f l)/2 n{k -H 1) k ~ 2 • Als toetsingsgrootheid kiest men nu: k k k kn»(k 4- D» (10.6) K = ^ { S j - S ) » = ^ S j » - kS» = ' Z S j » ^/ ' . j=i
j=i
,=1
•*
Bij voorbeeld 10.8 is 5 = 6(3 -f- l)/2 = 12, zodat Kg = (15 - \2)» + (14 - 12)« + (7 - 12)« = 38. 10.4.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
Onder Hg stammen alle waarnemingen uit populaties met dezelfde verdeling. Hieruit volgt dat voor iedere rij (rangschikking) aüe k\ permutaties van de k rangnummers even waarschijnüjk zijn. De rijen zijn onderling onafhankelijk, zodat bv. de kansverdeling van K onder Hg voor Ä = 3 en « = 2 als volgt kan worden bepaald : Rijl Rij 2 Sj 5 = -?-|-Ï = 4 S,-S K = £{3, - 5 ) "
1 2 3 12 3 2 4 6 44 4
1 2 3 1 3 2 2 5 5 4 4 4
-2 0+2 8
1 2 3 2 1 3 3 3 6 4 4 4
-2+1+1 6
1 2 3 2 3 1 3 5 4 4 44
- 1 - 1 +2 6
-1+10
1 2 3 3 1 2 4 3 5 4 4 4
123 3 2 1 444 444
0-1+1 2 2
00 0 0
Verdeling van K onder Hg voor k = 3 en n = 2 K
\
P(K) 1
0
2
6
8
Totaal
V.
X
'/.
V.
1
De Verdeling van K voor k = Z en n = Z kan hieruit worden verkregen, door bij eik drietal Sj's uit de voorgaande opstelüng alle permutaties van de 3e rij rangnummers uit te schrijven. De eerste reeks Sj's (2, 4, 6) levert dan op : S,, Tij 1 en 2 Perm. rij 3 S,{n = 3) S
2
b
s,-s K = S(S, - S)'
2 4 1 2 3 6
6 3 9
66
6
- 3 0 +3 18
2 1 3
4 3 7
6 2 8
6
6
6
- 3 +1 +2 14
2 2 4
4 1 5
6 3 9
6
6
6
- 2 - 1 +3 14
2 2 4
4 3 7
6 1 7
6
6
6
- 2 +1 +1 6
2 3 S
4 1 5
6 2 8
6
6
6
- 1 - 1 +2 6
24 3 2 5 6
6 1 7
6 6
6
- 1 0 +1 2
231
10.4
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
Doet men hetzdfde voor de vijf overige reeksen, dan verkrijgt men de volgende verdeüng van K onder Hg : VerdeUng van I i onder Hg: k = 3, w = 3 K P(K)
0
2
6
8
14
18
Vs. 0,056
"/se 0,417
'/se 0,167
'/se 0,167
'/s, 0.167
Vs, 0.028
Totaal 1 1.Ó02
Het is duidelijk, dat K de waarde O aanneemt, als alle 5^ gelijk (dus gelijk aan S) zijn. Naarmate de 5, meer verschillen neemt K een hogere waarde aan. De maximale waarde wordt bereikt, als de rangschikkingen per rij een volkomen overeenstemming vertonen. Beschouw bv. het onderstaande schema, waarin B steeds de hoogste en C steeds de laagste waarnemingen heeft opgeleverd. De rangsommen zijn dan resp. 2n, 3M en n en men vindt Kg = {6 — 6)» -\-{9 — 6)» + {3 — 6)» = 18. Rangnummerschema bij volkomen overeenstemming
f
1
.
2 3
« = 3
Si
A 2 2 2 6
k = 3 B C 3 3 3 9
1 1 1 3
Als echter Hg onjuist is en de steekproeven uit populaties met verschillend niveau afkomstig zijn, kan men juist uitkomsten van dit typ^ verwachten. Bij het gebruik van de toets van FRIEDMAN zal men dus uitsluitend bij hoge waarden van K tot het verwerpen van Hg willen overgaan, zodat rechts éénzijdig dient te worden getoetst. 10.4.4. UITVOERING VAN DE TOETSING ZONDER GELIJKEN
10.4.4.1. Exacte todsing, tabel K-\. Voor k = Z en n = 2 t/m 10, voor k = A e n n = 2 t/m 6 en voor ^ = 5, « = 3 kan men voor een aantal waarden van K de exacte rechtse overschrijdingskans, indien deze kleiner is dan ongeveer 0,15, in tabel K-l aflezen. Bij voorbeeld 10.8 is ^ = 3, « = 6 en if o = 38, Uit tabel K-l blijkt, dat de exacte kans in dit geval 0,052 bedraagt. 10.4.4.2. Kritieke waarden, tabel K-2. In tabel K-2 zijn voor k < 15 en « < 15 de rechter kritieke waarden KR van K_ bij een onbetrouwbaarheidsdrempel 0,05 opgenomen. Men kan dus bij deze drempel tot het verwerpen van Hg besluiten, indien Ko > KR is. 10.4.4.3. ;^*-6e«a^m«g. Voor grotere waarden van Ä en « en bij toet232
DE TOETS VAN FRIEDMAN
10.4
sing met andere drempelwaarden kan men gebruik maken van het feit, dat de grootheid 12K 12 *
('"•'•" ^" - W+ï)" = W+Ti?.-^'' - ""'* + " bij benadering een ;K*-verdeling volgt met k — 1 vrijheidsgraden. Bij het gebruik van deze benadering kan dus Ho bij een drempelwaarde a worden verworpen, indien ^ ^0* > z^-« {v = k - 1 ) . Past men de ;f*-benadering toe op voorbeeld 10.8, dan is: 12 X 38 .X'o* == "7 r —— = 6,33, met een overschrijdingskans die iets kleiO X O X 4
ner is dan 0,05 [X%.»B (2) = 5,991]. Ondanks de kleine waarden van k en van n is de benadering dus reeds bevredigend. Opmerking Er is v
het algemeen een iets te hoge overschrijdingskans op te leveren, d.w.z. zij bUjft, wat fouten van de eerste soort betreft, aan de veilige kant. Als n relatief groot is t.o.v. k (een situatie, die in de praktijk veel zal voorkomen) is de ^'-benadering in het algemeen beter dan deze F-benadering [zie VAN ELTEREN (83)]. 10.4.5. UITVOERING VAN DE TOETSING MET GELIJKEN
Als bij een rangschikking geüjken optreden kan men deze het gemiddelde toekennen van de rangnummers, die zij moeten bezetten. Als er niet te veel gelijken zijn blijft men bij het gebruik van tabel K t.a.v. het verwerpen van Hg aan de veilige kant. Past men de x^benadering toe, dan kan een correctie voor gdijken worden aangebracht door in (10.7.1) de term nk{k -f 1) te vervangen door
waarin Ti = t^ — i^ en i< = de omvang van de *' groep gelijken. Ook in dit geval is de betekenis van de correctie in de regel gering, zodat deze zonder bezwaar achterwege kan worden gelaten als de verkregen uitkomst zonder correctie significant of duidelijk indgnificant is (zie voorbeeld 10.9). Voor een beschouwing betreffende de exacte verdeling van K bij het voorkomen van gelijken verwijzen wij naar VAN ELTEREN (83). ^ Als geen misverstand mogelijk is geven wij een waargenomen waarde van Xj^ met X ^ aan,
233
10.4
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
10.4.6. DE OVEREENSTEMMINGSCOËFFICIËNT
De methode van FRIEDMAN kan ook worden gebruikt, als men n waarnemers k objecten of individuen onafhankeUjk van elkaar heeft laten rangschikken. In dat geval kan de mate, waarin de volgorde der rangschikkingen van deze beoordelaars overeenstemt, in een getal, de overeenstemmingscoëfficiënt (coefficient of concordance) worden uitgedrukt. Voorbeeld 10.9. Men wil onderzoeken of het mogelijk is konijnen, die een zekere behandeling hebben ondergaan, te rangschikken naar de conditie van hun vacht. Men laat daartoe een vijftal personen, die op dit gebied deskundig kunnen worden geacht, een tiental dieren een rangnummer van 1 (slechte conditie) t/m 10 (goede conditie) toekennen. De uitkomsten zijn in tabel 10.7 opgenomen. Tabel 10.7. Rangschikking van tien konijnen naar conditie van de vacht door vijf personen Beoordelaars « = 5 A B C D E Si
^
Mk + 1) S j - S
1 4 3è 3 3 4 17*
2 1 2 2 3 2 10
Konijnen (k = 10) 7 5 6 3 4 2 3 8 5i 5* 1 7 5 3* 6 1 7* 4 5 6 1 9 6 3 5 4 1 10 4 6 18* 41* 6 24* 28*
27i
27i
27* 27*
-10
-m
-3
+1
Äo= 2: (Sj - S)* = (-10)» + (-17*)» +
27* 27* -21* - 9
27*
8 10 9 9 8 8 44
9 7 8 7* 7 7 36*
27* 27*
-1-14 + 16* + 9
10 9 10 10 10 9 48 27* +20*
+ (20*)» = 1929
Gelijken: A: ti =' 2, B: t^ = 2, C: t^ = 2, D: t^ = 3, £ :
18 + 48 = 66 STi/(k - 1) = 66/9 = 7,33 23148 = 42,65 (9 vrijheidsgraden) 542,67
De te toetsen h37pothese luidt, dat de verschillen tussen de toegekende rangorden toevaUig zijn. De voor de toetsing noodzakeüjke berekeningen (incl. de correctie voor de groepen gelijken in de rangschikkingen) zijn in tabel 10.7 opgenomen. Onder Hg volgt de grootheid X^» bij benadering een ;f*-verdeling met k— \ = 9 vrijheidsgraden. De rechtse kans van Xg» blijkt aanzienlijk kleiner te zijn dan 0,001, daar X 0.99»'(9) = 27,877. Hg wordt dus verworpen. De methode stelt ons, als de toetdng tot verwerpen van Hg leidt, ook 234
DE TOETS VAN FRIEDMAN
10.4
in staat tot het geven van een schatting van de objectieve volgorde der gerangschikte dieren. Deze schatting verkrijgt men, indien men de dieren rangschikt volgens de opklimmende grootte van de kolomtotalen. Dit betekent niet, dat qua conditie van de vacht bv. konijn 7 „beter" is dan konijn 9. De toets leert ons bij een significant resultaat slechts, dat de dieren niet alle in dezelfde conditie verkeren en geeft een schatting van de objectieve volgorde van de dieren naar conditie. Tenslotte vermelden wij, dat het mogelijk is de mate van eensgezindhdd van de beoordelaars in een maat uit te drukken. Als geen gelijken optreden en alle rangschikkingen op alle rijen overeenstemmen, dan zijn de rangsommen (niet noodzakeUjk in deze volgorde) : n, 2n, 3n, . . . , kn. De grootheid K bereikt dan de maximale waarde : * K^a. = i: [{n)» + {2n)» + . . . - } - {kn)»\
kn»(k +- l)» ^/ '
,=1
4
= n»{\» + 2»-\- .... +k»)-n» ^ J ' ^ k{k -f 1)(2^ -f 1) , k{k H- 1)' = «" «* 6 4 __ ^^^(^ + _1)(^ - 1) _ n»k{k» _ — 1). Indien de gevonden Kg dicht bij K^ax ligt. is de overeenstemming goed, ligt zij er ver van af, dan is de overeenstemming slecht. Men definieert zodoende als overeenstemmingscoêfficiênt
^^°-^^
^^ == : K ± = n»k{k» -1) •
Deze coëfficiënt kan variëren tussen O en 1. De overeenstemming zal beter zijn, naarmate C dichter bij 1 ligt. De toetsing kan ook worden uitgevoerd via C, daar eenvoudig te bewijzen is dat : (10.7.2) XJ» = n{k - \)C. Als groepen gelijken optreden moet men in (10.8) een correctie aanbrengen, door K^ax niet n E T i te verminderen. Op deze wijze vindt men bij voorbeeld 10.9: 12(1929) 23148 _ _ n o<; ^^ ~ (25)(10)(99) - 5(66) " ^4420" " °'^^^^ " ^'^^^ 10.4.7. k = 2 : OVERGANG IN DE TEKENTOETS
Past men de toets van FRIEDMAN toe a\s k = 2. dan is X ^ volgens (10.7) gelijk aan To*, verkregen bij het gebruik van de normale benadering van de tekentoets zonder continuïteitscorrectie. 235
10.4
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
10.4.8. OPGAVEN 10.9.
Uit: N.T.V.G., 102 (1958), 274. De adrenaüneproef geeft een inzicht in de kracht (uitgedrukt in mm Hg) waarmee de capülairen van de huid zich kunnen samentrekken. Bij vier personen in sjmcope kon aanstonds nadat zij waren gaan Uggen, deze proef worden verricht. De uitkomsten waren: Proefpersoon
Vóór syncope
Aanstonds na syncope
2 uur later
4 uur later
1 2 3 4
65 75 80 70
20 20 25 30
60 30 45 65
70 55 60 70
Toets de hjrpothese, dat de waargenomen verschiUen toevalüg zijnKies a = 0,05. 10.10.
Uit: N.T.v.G., 100 (1956), 3065. Bloedplaatjes volgens fonio bij voldragen kinderen op eerste levensdagen :
1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
le dag 195.860 219.000 235.600 148.980 173.900 149.300 171.440 284.480 280.000 161.000
3e dag 150.000 212.000 232.600 183.600 186.200 173.800 169.860 206.400 244.800 169.740
5e dag 152.600 244.800 228.800 161.280 173.900 152.800 179.580 231.840 248.160 194.000
Welke hjrpothese kan worden getoetst? Voer deze toetsing uit met a = 0,05. 10.11.
Onderstaande tabel bevat de Uchaamstemperaturen van een arbeider (gemiddelden van dinsdag t/m vrijdag, van 5 opeenvolgende weken) op 6 tijdstippen. Week
1 2 3 4 5
3.30 35,70 35,55 35,59 35,78 35,56
7.30 35,71 36,40 35,80 36,40 35,81
Tijdstip 15.30 36,71 36,80 36,67 36,69 36,59 36,70 36,72 36,58 36,62 36,74
12
19.30 37,00 37,20 36,88 36,98 36,89
23.30 36,42 36.50 36.08 36.20 36.11
a. Toets de hjrpothese, dat de temperatuur onafhankelijk is van het tijdstip van meting. b. Toets de hjrpothese, dat de tempjeratuursverschillen tussen de weken toevallig zijn. Aanwijzing: rangnummer per kolom (tijdstip) over de weken. Dan is: Ä = 5, « = 6. Kies in beide gevallen a = 0,05.
236
10.5
DE TOETS VAN WILCOXON 10.12.
Acht objecten zijn door vijf waarnemers als volgt gerangschikt: Waarnemer
A 4 7 5 6 5
1 2 3 4 5
B 2 4 2 2 3
Object D E 7 6 5 6 4 8 7 5 4 8
C 1 2 1 1 1
F 3 3 3 4 2
G 5 1 6 3 6
H 8 8 7 8 7
Toets de hjrpothese, dat de overeenstemming toevaUig is en bereken de overeenstemmingscoëfficiënt.
10.5. De toets van Wilcoxon 10.5.1. TOEPASSING
Deze toets kan worden toegepast als men de hypothese Hg wil toetsen, dat de twee aselecte steekproeven Xi, X2, . . . . , x^ en y^, y2, , y„j uit populaties met dezelfde verdeling stammen, d.w.z. P{x > y) = P{x < y) = | . Men kan ook zeggen : Hg houdt in, dat de steekproeven uit dezelfde populatie afkomstig zijn. De toets leidt tot het verwerpen van Hg, als P(^ > y) ¥= P{x < y), d.w.z. als X systematisch grotere (resp. kleinere) waarden aanneemt dan y. De toets is dus gevoelig voor verschiUen in niveau van de vergeleken verdelingen. Voorbeeld 10.10. Een steekproef van 8 ratten (van hetzelfde gedacht, van dezdfde leeftijd en met ongeveer hetzelfde gewicht) wordt aselect in twee even grote subgroepen P en C gesplitst. Groep P ondergaat een zekere behandeling, groep C dient als contrôle. De dieren ontvangen hierna gedurende zes weken dezelfde voeding, waarna zij worden gedood. Na verwijdering van kop en staart worden zij gevild, waarna karkasanalyse wordt verricht. De percentages vet in het karkas zijn in tabd 10.8 vermeld. De te toetsen hypothese luidt, dat deze percentages toevalüg verschillen. Deze proef is bedoeld als een oriënterend onderzoek, dat men op grotere schaal wil voortzetten indien de behandeling tot een vermeerdering van het vetgehalte blijkt te leiden (er wordt dus rechts éénzijdig getoetst). Men kiest a = 0,05. Tabel 10,8. Het vetgehalte van het karkas bij behandelde ratten (P) en controle-ratten (C)
X
Groep P Rangorde
35 28 21 49 «1 = 4
7 6 4 • 8 SR^ = 25
y
Groep C Rangorde
20 16 22 14 n, = 4
Ry
3 2 5 1 Z Ä , = 11
237
10.5
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
10.5.2. DE TOETSINGSGROOTHEID
Men kent aan de waarnemingen, onafhankehjk van de steekproef waarin zij voorkomen, van laag naar hoog de rangnummers 1,2, . . . . , « toe {n = ni-\- n^. Bij voorbeeld 10.10 zijn dit dus de rangnummers 1 t/m 8, die in de kolommen Rx en Ry zijn opgenomen. Als contrôle kan dienen: ERx -\- ERy = \n{n -)- 1). Als toetsingsgrootheid kiezen wij de som van de rangnummers in steekproef 1, SRx = S. Van deze grootheid 5 zuUen wij de verdeling onder Hg in het volgende punt afleiden. Bij de uitvoering van de toetsing maken wij echter gebruik van de hiervan afgeleide en door WABEKE & VAN EEDEN (114) ingevoerde grootheid : (10.9) W = 2«i«2 -I- ni{ni -\- l) — 2S. opmerking In verschillende publicaties betreffende de toets van WILCOXON wordt de door MANN & WHITNEY (101) ingevoerde toetdngsgrootheid U = ^W gebruikt. De met 5o corresponderende waarde Ug kan voor een bepaald steekproevenpaar als volgt worden bepaald : rangschik de waarnemingen van links naar rechts van laag naar hoog, onderstreep de waarnemingen van steekproef 2 (de y's) en bepaal vervolgens voor iedere waarneming in steekproef 1 {x) hoeveel y's rechts daarvan staan (dus: hoger zijn). De som van de op deze wijze verkregen getallen is dan Ug. Voor voorbeeld 10.10 vindt men op deze wijze: Steekproef Gerangschikte waarnemingen Aantal y's rechts van AT
y
y
y
X
y
X
14
16
20
21
22
28
1
+
X 35
«1 = «a = 4
X 49
0 -(- 0 -i- 0
= 1 = C/o
Hieruit volgt: Wg = 2Uo = 2. Deze uitkomst verkrijgt men eveneens met (10.10) : T^„ = 2 x 4 x 4 + 4(4 -f- 1) - 2(25) = 32 -f 20 - 50 = 2. Wil men dus Wg rechtstreeks uit de waarnemingen berekenen, dan dient men bij het voorgaande procédé bij iedere x tweemaal het aantal rechts daarvan staande y's te nemen. In de reeds genoemde handleiding (114) wordt een handige berekeningsmethode voor Wg gegeven, die vooral geschikt is als de steekproeven van vrij grote omvang zijn en als gelijke waarnemingen voorkomen. Wij bespreken deze in 10.5.5. 10.5.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Ho
10.5.3.1. De verdeling van de grootheid S. De kansverdeling van de grootheid S onder Hg kan worden bepaald op de wijze, die in voorbeeld 238
10.5
DE TOETS VAN WILCOXON
3.19 is aangegeven. Er zijn, bij het trekken van 4 uit de 8 rangnummers, in totaal C^ = 70 verschillende steekproeven mogelijk. De laagste waarde wordt verkregen bij trekking van de rangnummers 1, 2, 3 en 4 (S = 10) en deze uitkomst kan slechts op één manier tot stand komen. De uitkomst 5 = 1 1 kan eveneens slechts op één manier worden berdkt, nl. bij trekking van 1, 2, 3 en 5. De uitkomst 5 = 12 kan op twee manieren ontstaan (1 -|- 2 -f 3 -|- 6 en 1 -f- 2 -|- 4 -f- 5), enz. De kansverdeling die men zo verkrijgt staat in tabel 10.9. T a b e l 10.9. Verdeling v a n S en W' o n d e r Hg, «1 = Wj = 4
S 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10
/ 1 1 2 3 5 5 7 7 8 7 7 5 5 3 2 1 1
P ( S = S ) = P ( W = W) 0,0143 0,0143 0,0286 0,0429 0,0714 0,0714 0,1000 0,1000 0,1143 0,1000 0,1000 0,0714 0,0714 0,0429 0,0286 0,0143 0,0143
W
0 2 4 6 8 10 12 14 16 18 20 22
24 26 28 30 32
De rechts éénzijdige overschrijdingskans van de waargenomen rangsom in voorbeeld 10.10, 5o = 25, blijkt 2(0,0143) = 0,0286 te bedragen, .ffo kan dus bij de gekozen 5% drempel worden verworpen. 10.5.3.2. De verdeling van de grootheid W. In de laatste kolom van tabel 10.9 zijn de waarden opgenomen, die de grootheid W voor «1 = »a = 4 aanneemt. Daar wij verder met deze toetsingsgrootheid werken, vermelden wij de volgende eigenschappen van de verdeling van W onder Ho als geen gelijken optreden: 1. De verdeling is discreet en neemt de waarden O, 2, 4, , 2»i«2 aan. 2. De verdeüng is symmetrisch t.o.v. (10.10)
i"W =
»1«2-
3. De variantie van de verdding is : n-,nJn +- 1) (10.11) a^»= ' \ ^ '
(» = «1 + 239
10.5
K W A N T I T A T I E V E V E R D E L I N G S V R I J E TOETSEN
10.5.4, UITVOERING VAN DE TOETSING ZONDER GELIJKEN
10.5.4.1. Exacte toetsing, tabel L. In de handleiding (114, tabel I) vindt men voor »1 < «g < 10 de exacte links éénzijdige overschrijdingskansen van W. Voor een waarde van PT die > %«2 is, wordt de rechtse overschrijdingskans gevonden door in de tabel de linkse overschrijdingskans van 2«i«2 — ÏF op te zoeken. In tabel L hebben wij voor % < «g < 10 en de drempelwaarden 0,01,0,02,0,05 en 0,10 de linker en rechter kritieke waarden WL, resp. WR van W bij tweezijdige toetsing opgenomen. Toetst men dus twee-, zijdig met onbetrouwbaarheidsdrempd a, dan verwerpt men Ho indien: Wg < WL{a, n) of als Wg > WR{a, n). Voor «1 = 8 en »a = 6 leest men bv. uit tabel L af, dat Hg bij tweezijdige toetsing en een 5% drempel kan worden verworpen voor Wg<\6 of IFo > 80 ( = 2 X 8 X 6 - 16). Bij éénzijdige toetsing dient men de onbetrouwbaarheidsdrempels in tabel L te halveren. Wil men dus de hypothese Hg toetsen tegen de alternatieve hsrpothese, dat de grootheid x (van steekproef 1) systematisch grotere waarden aanneemt dan de grootheid y (van steekproef 2), d.i. tegen Hi : P{x > y) > \, dan zal men aüeen tot het verwerpen van Hg overgaan voor grote waarden van 5, d.i. voor kleine waarden van W (zie tabel 10.9). Via de grootheid W toetst men dan links éénzijdig: Hg wordt verworpen voor Wg<WL{2a,n). Luidt het alternatief P(x > V) < \ dan toetst men via W rechts éénzijdig en besluit dus tot het verwerpen van Hg voor Wg>WR{2a,n). Voorbeeld 10.11. Wij passen de toets van WILCOXON toe op de levensduren van muizen na twee verschiUende behandelingen in voorbeeld 9.12. Groep I ; xt 40 45 Groep II : jij Rangnummers; 1 2 Berekening van Wo 14 + 14
58 60 3 4 + 14
90
123
«, = 7 n, = 7
+12 + 12 + 12
+8
= 86 = Wo
70
75
5
6
98 106 9 7 8
130 135 160 174 10 11 12 13 14
Sg = de som van de rangnummers in steekproef 1 (;tr) = 1 + 2 + 3 + + 5 + 6 + 7 + 10 = 34. Uit (10.9) volgt: Wo = 2(7) (7) + 7(7 + 1) — 2(34) = 86. Deze uitkomst kan ook rechtstreeks verkregen worden, door onder iedere x tweemaal het aantal rechts er van staande y's te nemen en te sommeren. Uit tabel L bUjkt, dat de tweezijdige overschrijdingskans van Wo = 86 met «i = «a = 7 ongeveer 0,02 is. Uit de tabel met exacte kansen in (114) bUjkt, dat deze kans 0,0175 bedraagt.
10.5.4.2. De normale benadering. Voor grotere waarden van n kan, 240
DE TOETS VAN WILCOXON
10.5
mits »1 en «g niet te veel verschülen^, gebruik worden gemaakt van het fdt dat de grootheid (10.12)
r = ^ - ^ " = - ^ ^ ^ ^ Ow
ll // «» ll««g2((««_ + 1)
bij benadering standaardnormaal verdeeld is. Daar de afstand tussen de opeenvolgende waarden van deze toetsingsgrootheid gdijk is aan 2, dient de aan te brengen continuïteitscorrectie 1 te bedragen. Bij gebruik van de normale benadering berekent men dus: (10.13)
Tg = 1^» ~ ^ ^ I ~ ^ en PD{Tg) bij tweezijdige toetdng,
of (10.14.1) Tg =
o - i"w^ + ^ gjj p^(j^) bij ijj^ks éénzijdige toetsing,
resp. (10.14.2) Tg = —o — /^w—
^^ PR{TO) bij rechts éénzijdige toetsing.
Voorbeelden 10.12. Past men, ondanks de kleine waarden van «i en «j, de normale benadering toe bij voorbeeld 10.11 dan is: Tg =
186-7 X 7 1-2.^ •1/7 X 7 X 15
36 ^ ^ ,30. PÛ(2,30)=0,0214 (tabel A). 15,65
De exacte overschrijdingskans is 0,0175, zodat de benadering reeds bevredigend is. 10.13.
Onderstel dat «i = 9, «^ = 10 en S, = 115, zodat Wo = 2(9) (10) + + 9(10) - 2(115) = 40. Men toetst Ho'. P(y > y) = i met als H i .
P(x > y ) > i . Via ïT dient dus links éénzijdig getoetst te worden (zie 10.5.4.1), De normale benadering levert op: -
40-9x10+1 10 X 20
|/i^
-49 ^ _2.ooO, P.(-2,00) = 0,0228. 24,4949
3 Ook hier hebben wij kleine waarden voor Wj en «^ gekozen, om de benaderende uitkomst met de exacte kans te kunnen vergeUjken. Deze bUjkt 0,0217 te bedragen, zodat de benadering zeer goed is. 10.5.5. UITVOERING VAN DE TOETSING MET GELIJKEN
Wanneer n klein is en er veel gelijken voorkomen, kan men noch van tabel L noch van de normale benadering gebruik maken. In (114) 1 In (114, tabel II) worden voor «, + « , < 40. «1 > U en «, < w» de linker kritieke waarden WL van W gegeven, die behoren bij de drempelwaarden a = 0,01, 0,025 en 0,05. ~
241
10.5
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
is aangegeven, hoe men dan de exacte verdeling van W kan berekenen. Treden er slechts twee groepen gelijke waarnemingen op, dan verkrijgt men een 2 x 2 itabel en gaat de toets van WILCOXON over in de toets van FISHER. Als «1 en «g niet te klein zijn en onderling niet te veel verschillen en als bovendien de groepen gelijke waarnemingen niet te veel in omvang verschillen kan men aan de geüjken binnen een groep weer het gemiddelde toekennen van de rangnummers die zij moeten bezetten. Men kan dan de normale benadering toepassen met in plaats van a^ volgens (10.11) a^' volgens »,»a(«' — D )
(>°-'^)
''-"= J n - l ) '
k
waarinD = 2ti», en ti, ^g, . . . , 4 de omvang is van de 1^, 2«, . . . , i=l
k^ groep geüjken (evenals bij de rang-tekentoets, zie 10.3.5, noteert men voor elke uitkomst die niet tot een groep gelijken behoort t = \). Bevatten beide steekproeven geen gelijke waarnemingen dan wordt D = n, zodat «» — Z) = «» — « = «(» -f \){n — 1) en gaat (10.15) in (10.11) over. De afstand tussen de opeenvolgende waarden van Jf is bij het optreden van geüjken in het algemeen niet constant, maar neemt men een contimüteitscorrectie ter grootte van 1 dan blijft men aan de veilige kant t.a.v. het verwerpen van Hg. Met (10.15) vindt men voor de spreiding van W een kleinere waarde dan met (10.11). Houdt men dus bij de toepasdng van de normale benadering geen rekening met de gelijken, dan vindt men een te grote waarde voor de overschrijdingskans. Is deze < a, dan wordt Hg verworpen en behoeft men niet tot berekening van D over te gaan. 10.5.6. BEREKENINGSSCHEMA Als het aantal waarnemingen vrij groot is en/of gelijken voorkomen kan men Wg beter berekenen, zonder tot rangnummering over te gaan. Onderstel bv., dat men beschikt over de volgende waarnemingen (in beide steekproeven gerangschikt van laag naar hoog) : Steekproef 1 {x): 1,4 1,7 1,7 2,2 2,3 2,5 2,9 2,9 4,5 («1=9), Steekproef 2 (y) : 1,7 2,2 2,9 3,3 3,4 3,8 4,5 4,5 6,6 7,9(«g=10). Men handelt nu als volgt (zie tabel 10.10): 1. Rangschik de a;-waarden (steekproef 1) naar opklimmende grootte in kolom (2) van de tabel, te beginnen op de tweede regel en telkens een regel overdaand. Gelijke waarnemingen komen op dezdfde regd. 2. Noteer in kolom (3) de y-waarden (steekproef 2), die niet geüjk zijn aan de «-waarden, op de regel tussen de a;-waarden waar zij tussenin liggen. Noteer de waarden van y die wel geüjk zijn aan een xwaarde, op dezdfde regel als die waarde. 242
10.5
DE TOETS VAN WILCOXON Tabel 10.10. Toets van WILCOXON. Berekeningsschema met geUjken
(2)
(1)
1
(3)
Waamemùigen
^ 0 1 2 4 6 7 8 9 10 11 12 14 16 17 18 Totaal
y
(4) Aantal y's
(6) (5) Bijdrage Aantal tot Wg geUjken, t (4) X (1)
1,4
(7) f
1
1
1.7 1,7
1.7
1
4
3
27
2,2
2,2
1
7
2
8
2,3
1
1
2,5
1
1
2,9 2,9 4,5
2,9 3,3 3.4 3,8 4,5 4,5 6,6 7,9
«1 = 9
1 3 2 2 « j = 10
14 48 34 36 W o = 143
3 1, 1. 1 3 1.1 «=19 D==
27 3 27 2 97
Normale benadering met correctie voor geUjken : -
l ' ^ - ^ x ' O I - ' lOx 9 X (19»-97) 3 X 19 X 18 Normale benadering zonder correctie I 143 9 X 10 1 - 1
y
t
10 X 9 X 20
S2 24,35
. . , . (0,05 > f t > 0,01).
voor geUjken 52 = 2,123 24,49"
(0,05 > P D > 0,01).
3. Bepaal de getaUen in kolom (1) door voor iedere regel te nemen:
tweemaal het aantal a;-waarden erboven, vermeerderd met het aantal «-waarden op de regel. Ter contrôle dient, dat op de laatste regd in kolom (1) het getal 2«i komt te staan. De bijdrage tot Wo van iedere regd, waarop een y voorkomt wordt in kolom (5) geplaatst en is gelijk aan het aantal y-waarden in kolom (4) vermeiügvuldigd met het getal in kolom (1). Door het sommeren van de bedragen in kolom (5) verkrijgt men Wo' 5. In kolom (6) noteert men de aantallen geüjke waarnemingen (zijn er op een regel geen gelijken, dan is f == 1). Door sommatie verkrijgt men in deze kolom het totale aantal waarnemingen n. 6. De derdemachten van de getallen in kolom (6) noteert men in kolom (7). De som van deze derdemachten is D. Uit het voorbeeld in tabel 10,10 büjkt wederom, dat bij niet te grote aantallen gelijken de correctie weinig betekenis heeft. 243
10.5
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
Gebruik van hd schema bij de rang-tekentods Als men beschikt over verschiUen tussen gepaarde waarnemingen, waarop men de rang-tekentoets wil toepassen, dan kan de waargenomen waarde Vg van de toetsingsgroothdd V ook via het zo jiust gegeven schema worden berekend. Stel »i is het aantal negatieve en «g is het aantal podtieve verschiUen. Verder zij Wo de waarde van de toetsingsgrootheid van de toets van WILCOXON, toegepast op de absolute waarden van de negatieve verschillen als eerste en de podtieve verschülen als tweede steekproef. Dan bestaat de volgende betrekking tussen Fo en Wg: (10.16)
7o = W o - n , n g - ( " + ' ) ( ; - - " - ) .
In tabel 10.11 is deze berekeningsmethode toegepast op de gegevens in voorbeeld 10.7 (tabel 10.5). Tabel 10.11. Rang-tekentoets. Berekening van VgWiSiWo (1)
2 4 5 6 7 8 9 10 13 16 18 20 21 22 23 24 Totaal
(2) Negatieve waarnemingen (absoluut) 0,1 0,1 0,2
(3)
(4)
Positieve waarnemingen
Aantal
(5)
(6)
(7)
Aantal geüjken, t
<»
0,1
1
Bijdrage tot »'o (4) X (1) 2
0,2
1
0,5 0,7
1 1
(+)
3
27
5
2
8
13 16
4
64
0,3 0,4 0,5 0,5 0,5
2
0,8 0,8 1.2 1,5 «1 = 12
«, = 4
Wg = 3b
«=16
D = 112
Vg = W o - «i«a - (« + 1) («1 - «a)/2 = 36 - 12 X 4 — 17 X 8/2 = - 8 0 10.5.7. OPGAVEN 10.13.
Pas de toets van WILCOXON toe op opgave 9.14.
10.14.
Uit : Voeding ( 1953), 242. Twee groepen jonge mannelijke ratten kregen behoudens hun basisvoeding als vetbron: (A) normale levertraan, (B) idem + per os 30 mg a-tocopherolacetaat per week. Van deze dieren zijn in de volgende tabel
244
DE TOETS VAN WILCOXON
10.5
de aanvangsgewichten (1) en de gewichten na 6 weken (2), beide in grammen, opgenomen. Is er een systematisch verschil in niveau aanwezig ? Kies a = 0,05.
10.15.
10.16.
Gioep A
2
Groep B
L
32 138 32 175
30 120 38 120
Pas de toets van WILCOXON toe (a = 0,05) : Steelq)roef 1: 1,23 1,94 1,15 3,90 0,18 0,88 Steekproef 2: 0,59 0,92 1,56 0.36 1,15 1,78
30 132 32 172
38 97 32 160
35 116 38 155
32 115 37 153
op onderstaande aselecte steekproeven 2,84 2.67 1.34 0.94
0,96 1,49 0,72 1,09
0,25 0,43 0,22 0,86
1,71 0,57 0,35 0,65
1,90 1,14 0,30 2,93 1,44 1,70 0,55 0,52 0.88 0,90
Uit de kursus 'Summarizing experimental data', Columbia University, U.S.A. In an article on uric acid clearance in the Journal of Clinical Investigation, V. 22, 1943, ScHAFFER et. al. give the foUowing data on plasma uric acid (mgm per cent) in 10 antepartum cases with a diagnosis of pre-eclampsia and 12 who were clinically normal: Normal pregnancy: 4,40 4,43 3,82 3,93 3,51 4,62 2,89 3,91 3,84 2,67 4,68 3,23 Pre-eclampsia: 3,92 5,54 6,92 4,23 4,63 3,95 5,39 5,93 7,12 5,27 Toets de h3rpothese, dat het gehalte bij Ujders niet systematisch verschUt van dat bij gezonden.
10.17.
Uit: J. Appl. Phys. (1956), 5 1 9 - 5 2 3 Group A :
16 instructors at the Escape Training Tank, who had carried out 'in-the-water' instructions for an average period of 1,5 years. Mean age 30,3 years.
Group B :
16 adult male personnel from the Medical Research Laboratory. Mean age 30,4 years. The instructors are engaged almost daily in 'skin diving', that is diving without the use of any special equipment. They take a breath of air at the surface, descend in the tank to depths as great as 100 feet, and return to the surface whUe holding their breath. They also make 'free ascents', which means that while in an airlock at 25, 50 or 100 feet under water, they take a deep breath, step out of the lock into the water and float to the surface, exhaling the expanding air in their lungs as they rise. We are interested in knowing whether the instructors do adapt to the stress of skin diving by increasing their lung volumes. I = Predicted vital capacity (based on body surface area), I I = Measured vital capacity. Group B Nr. I
ni i - i
1 2 3 4 14 15 16 5 7 10 12 13 6 8 11 9 5,25 4,40 5,02 4,87 4,60 4,70 4,92 5,02 4,63 5,12 4,65 4,50 5,06 5,05 4,55 5,50 3,89 4,02 5,00 3,80 4,47 5,82 5,47 4,52 4,67 4,47 4,63 5,11 4,88 5,69 4,63 6,02 -1,36 -0,38 -0,02 -1,07 -0,13 1,12 0,55 -0,50 0,04 -0,65 -0,02 0,61 -0,18 0,64 0,08 0,52
245
10.6
KWANTITATIEVE VERDELINGSVRIJE METHODEN
Group A Nr. 1 î 4,78 II 4,43 II-I -0,35
. 2 4,38 5,00 0,62
3 4,68 5,33 0,65
4 4,80 6,33 1,53
5 5,10 6,25 1,15
6 7 4,88 4,83 5,59 5,56 0,71 0,73
13 14 15 16 8 9 10 • i T 12 5,10 4,65 5,10 4,70 5,00 5,00 5,38 4,75 5,70 5,38 4,90 5,89 5,60 6,60. 6,27 6,00 5,24 6,49 0,28 0,25 0,79 0,90 1,60 1,27 0,62 0,49 0,79
Analyseer deze uitkomsten. Kies als drempelwaarde 0,05.
10.6. De toets van Kruskal & WaUis 10.6.1. TOEPASSING
Deze toets kan men toepassen als men de hypothese Hg wil toetsen, dat Ä aselecte steekproeven uit populaties met dezelfde verdeling afkomstig zijn. De toets is voomameüjk gevoelig voor verschiUen in niveau tussen de populatieverdelingen. Voorbeeld 10.14. Een groep van 21 proefdieren werd aselect in 3 subgroepen van 7 dieren gespütst. Elk der dieren kreeg vervolgens per venam een letale dosis tetanus toxine. Bij het optreden van ernstige ssonptomen van tetanus werd als volgt gehandeld: De eerste subgroep kreeg herhaalde maar niet-letale doses avertin, die voldoende waren om de convulsies voor de duur van het experiment stop te zetten. De tweede subgroep ontving overeenkomstige doses nombutal. De derde groep werd niet behanddd. De overlevingstijden (in dagen) zijn in tabel 10.12 opgenomen. De te toetsen h37pothese Hg luidt, dat de waargenomen verschillen in overlevingstijd toevaüig zijn. Men kiest a = 0,05. Tabel 10.12. Overlevingstijd in dagen n a het optreden van symptomen van tetanus bij drie groepen proefdieren.
Rangsom: Si % Sj'/nj
1 Avertin X R„ 1.88 8 1,19 3 0,43 2 1.94 9 3.12 13
2 Nombutal y Ry 1,64 6 0,42 1 2,10 10 1,80 7 1,25 4
3 Contrôle z Rz 2,37 11 3,50 14 2,92 12 1,60 5 4,33 15
35
28
57
SSj = 120 £nj = « = 15 2:Sj>/nj = 1051,6
-.• = - ^ ^ r ^ - - " - • -
Contrôle: 15 X 16/2 = 120
10.6.2. DE TOETSINGSGROOTHEID
Evenals bij de toets van WILCOXON kent men aan alle waarnemingen, onafhankelijk van de steekproef waarin zij voorkomen, een rangnum246
DE TOETS VAN KRUSKAL EN WALLIS
10.6
mer toe, te beginnen met 1 voor de laagste waarneming t/m n — Enj voor de hoogste. In tabd 10.12 is deze rangnummering voor voorbeeld 10.14 uitgevoerd. Daarna bepaalt men de rangsommen per steekproef, Sj. Als toetdngsgrootheid is nu door KRUSKAL & WALLIS ingevoerd: k i=l 10.6.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Ho
Als Ho juist is heeft men te doen met k steekproeven die verkregen zijn door de rangnummers 1,2, n aselect in k groepen van resp. n\ «1, «2. • • • • . « * rangnummers te verdelen. Dit kan op —j—j jmanieren gebeuren. Analoog aan de toets van FRIEDMAN zou men nu als toetdngsgrootheid kunnen kiezen: -^ {Sj - Ej)», ;"=i
waarin Ej de onder Ho verwachte rangsom in steekproef ƒ voorstelt. De som van alle rangnummers is n{n -)- l)/2, dus .^ «V n(n -1-1) Men kan echter beter nemen:
(.0.18)
ff.i„,rit_iT„i„T&_^JlT
i t i 'Lftj nj J f^iLnj 2 J ^ j , Sj» n{n -\- l)» jèi nj 4 • Voor kleine k en HJ kan men alle mogeüjke steekproeven van »j, «g, . . . , «j, rangnummers systematisch uitschrijven en zodoende de kansverdeling van H' onder Ho exact berekenen. Het is duidelijk, dat H' = 0 a\s dke Sj met haar verwachting overeenstemt en dat Hl grotere waarden aanneemt, naarmate de Sj meer van hun verwachtingen afwijken. Hieruit volgt, dat rechts éénzijdig wordt getoetst. Voor % > 5 blijkt de grootheid ^ «(« -f 1)
n{n -(- 1) Z_i %
\
'
/
#=1
bij benadering een %*-verdding met k — 1 vrijheidsgraden te volgen. De benadering is beter, naarmate de omvang.der steekproeven groter is. ^ KRUSKAI. & WALLIS gebruiken i.p.v. Xi^ de letter H. De toets wordt dan ook wel de H-toets genoemd. Als geen misverstand mogelijk is geven wij een waargenomen
247
10.6
KWANTITATIEATE VERDELINGSVRIJE TOETSEN
10.6.4. UITVOERING VAN DE TOETSING
10.6.4.1. Zonder gelijken, tabel M. In tabel M zijn voor k = Zen voor elke «j < 5 de exact berekende rechtse overschrijdingskansen van een aantal waarden van XH» onder Ho opgenomen. Voor voorbeeld 10.14 is Xo» = 4,58. Uit tabel M blijkt, dat de rechtse kans van Xo» = 4,56 gelijk is aan 0,100, zodat de kans van de waargenomen uitkomst iets kleiner dan 0,100 is. Ho wordt dus niet verworpen. Bij het gebruik van de ;{*-benadering voor grotere waarden van k en nj kan Hg bij een drempelwaarde a worden verworpen, indien ^o** > X \ - . { v = = k - l),
10.6.4.2. M d gelijken. Als gelijke waarnemingen optreden kent men deze - zoals gebruikelijk - per groep het gemiddelde toe van de plaatsen, die zij moeten bezetten. Als ^ = 3 en «^ < 5 en er zijn slechts weinig gelijken, kan men tabel M nog wel bij benadering gebruiken. Voor k > 3 en nj > 5 kan men de ;f^-benadering toepassen, als niet te veel groepen gelijken van niet te sterk verschillende omvang voorkomen. Op de berekende waarde van XH» kan dan een correctie worden toegepast, door te nemen: (10.20)
Xji
XH» (gecorrigeerd) =
ETi 1 — n» — 1 waarin voor elke groep geüjken: ti = de omvang van de groep, en Ti = ti^ — ti (zoals bij de toets van FRIEDMAN). In tabel 10.13 is hiervan een voorbeeld gegeven. Daar door het aanbrengen van deze correctie XH» gedeeld wordt door een getal kleiner dan 1, is de gecorrigeerde uitkomst (iets) groter. Kan men Hg dus reeds op grond van XH» verwerpen, dan kan de correctie achterwege, worden gelaten. Tabel 10.13. Geboortegewichten van varkens (in lbs) bij vier verschiUende worpen 1
2 Rang Gewicht
Genrioht 3,3 3,6 2,6 3,1 3,2 3,3 2,9 3,4 3,2 3,2
26è 30t 13i 20 22i 26è 181 29 22i 22i
S,'l«l
10
Contrôle: SR =
2,0 2,8 3,3 3,2 4,4 3,6 1,9 3,3 2,8 1,1
2i
2}
l
(^
H
2,6 2,6 2,9 2,0 2,0 2,1
182 10
392,04
32 X 33
4 Rang Gewicht 6 16* 26i 22i 32 301 4 261 161 1
481
M(n + 1) ^
13i 11
6
5382,4
Corr.v. gelijken ' i , l
Gewicht
9i 9i
232
Si
>h
2,6 2,2 2,2 2,5 1,2 1,2
3 Rang
3312,4
Rang 13} 131 181 6 6 8
651 6
715,04
= 528 (^
(^
l
^ i •-234 12,38
12 y QA01 RR
Volgens (10.17): X , ' =
248
- , X 33 ,' 32
SSs = 528 n = 32 SSj'l»! = 9801,88
- 3 X 33 = 12,38
Volgens (10.20): X , ' •
234 32736
' 12,47
DE RANGCORRELATIETOETS VAN SPEARMAN
' 10.7
Voorbeeld 10.15. In tabel 10.13 is een voorbeeld gegeven van de toepassing van de toets op 4 aselecte steekproeven.met geUjken. Hieruit bUjkt, dat de correctie slechts tot een geringe vergroting van Xg' leidt. Als men bij een 5 % drempel toetst, is de kritieke waarde: z'i-a (» = Ä — 1) = z'o.sst'' = 3) = 7,815. Daar Xg' groter is wordt Ho verworpen. 10.6.5. k = 2 : OVERGANG IN DE TOETS VAN WiLCOXON
Past^men de toets toe met k = 2, dan is Xg» volgens (10.17) geüjk aan de Tg» die men verkrijgt bij het gebruik van de normale benadering van de toets van WILCOXON zonder continuïteitscorrectie. 10.6.6. OPGAVEN 10.18. Pas de toets van KRUSKAL & WALLIS toe op voorbeeld 9.14. 10.19.
De volgende gegevens betreffen het fosforgehalte (in mg%) in het serum van drie aselect gekozen groepen konijnen, die een verschillende behandeUng hebben ondergaan. Toets de h3rpothese, dat deze behandeUng geen invloed op het fosforgehalte heeft uitgeoefend. Kies a — 0,05. G r o e p t : 42,3 36,3 42,9 37,3 38,6 47,6 32,0 34,6 38,9 31,7 37,5 41,4 Groep S : 46,9 41,0 54,3 50,3 49,3 46,3 36,5 43,2 44,1 39,2 39,4 42,5 Groep C: 41,8 36,5 37,0 31,8 43,1 47,1 39,0 34,7 38,2 40,3 40,0 35,9
10.20.
Uit dè kursus Biostatistics 2, John Hopkins University, U.S.A. De onderstaande tabel geeft de vleugelbreedten (in mm) naar vindplaats van een op bomen levende sprinkhaansoort (katydid). Toets de hjrpothese, dat de vleugelbreedte onafhankeUjk is van de vindplaats. Kies a = 0,05.
Vindplaats Eik I Esdoorn \ Populier 8,8 6,6 9,1 9,9 9,2 9,4 5,2 10,7 12,6 8,8 | 14,1 9,3 12,1 12,5 12,4
10.7. De rangcorrdatietoets van Spearman 10.7.1. TOEPASSING
Deze toets kan worden gebruikt als men beschikt over de aselect verkregen waamemingsparen {xi, yi), {x2, y2), • • •. (««. Vn) en de hj^othese Hg wil toetsen, dat de grootheden x e n y stochastisch onafhankelijk zijn. De toets kan ook worden toegepast, als men de waargenomen waarden van x, resp. van y niet kan meten, maar wel kan rangschikken naar grootte. Voorbeeld 10.16. Van 8 konijnen, die na herhaalde intraveneuze toediening van een vitamine-D preparaat zijn gestorven, werden de calciumpercentages in de gedroogde stof van de aorta en de nieren bepaald. Deze zijn in 249
10.7
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
tabel 10.14 vermdd. De te toetsen hs^othese Hg luidt, dat de percentages in aorta en nieren onafhankehjk zijn. De tegenhypothese Hi is, dat er een positieve co(r)relatie tussen deze percentages bestaat, d.w.z. dat in het algemeen lage (hoge) percentages in de aorta samengaan met lage (hoge) percentages in de nieren (men spreekt van een negatieve correlatie, indien in het algemeen lage (hoge) waarden van de ene grootheid samengaan met hoge (lage) waarden van de andere). Men kiest a = 0,05. Tabel 10.14. Calciumpercentages in de gedroogde stof van aorta (A) en nieren (N) van konijnen na herhaalde injecties met een vitamine-D preparaat Konijn nr. 2.08 2.09 2.15 2.21 2.25 2.33 2.34 2.37
% Ca A 10,3 12,7 5,4 4,6 4,1 ' 0,7 13,4 3,6
N y 5,2 7,1 0,8 1,6 3,3 0,0 3,5 1.2 « = 8
Rangnummers A N Ry Rx 6 7 7 8 5 2 4 4 3 5 1 1 8 6 2 3
d = R ^ - Ry -1 -1
+3
0 -2 0
+2
-1 2d = 0
d' 1 1 9 0 4 0 4 1 S d ' = 20
10.7.2. DE TOETSINGSGROOTHEID
Men kent aan alle waargenomen «-waarden van laag naar hoog de rangnummers 1,2, . . . , » toe; mèn verkrijgt dan de rangnummers Rx. Vervolgens herhaalt men deze procedure voor de y-waarden; dit levert de rangnummers Rj, op. Per waamemingspaar bepaalt men dan d = Rx — Ry. Als toetsingsgrootheid wordt gekozen: (10.21) R = E{Rx - Ry)» = Ed». Voor de waarnemingen in tabel 10.14]vindt men op deze wijze : i?o=20. 10.7.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
Onder de nulh5^othese kan de kansverdeüng van R worden bepaald door aüe n ! permutaties van de rangnummers 1 t/m n uit te schrijven en voor dke permutatie en de reeks 1, 2, 3, . . . , » de waarde van R te berekenen(tabel 10.18 bevat o.m. de op deze wijze bepaalde kansverdeling van R voor « = 6). Wanneer de rangorden van de x- en ywaarden precies overeenstemmen is elke d gelijk aan nul, zodat i? = 0. Als de rangorden precies tegengesteld zijn, zodat de rangorde-paren luiden: {\,n), (2, «—1), . . . (»—1,2), («,!), blijkt te gelden R = \n{n» — 1). De verdeling van R is symmetrisch t.o.v. n{n» — 1)
(10.22) 250
^^ =
JL_J_
DE RANGCORRELATIETOETS VAN SPEARMAN
en heeft als variantie n»{n» - l){n + 1) (10.23) a^'i 36
10.7
n»{n -|- l)»{n — 1) 36
10.7.4. UITVOERING VAN DE TOETSING ZONDER GELIJKEN
10.7.4.1. Exacte todsing, tabel N-l. Voor « < 8 is de exacte kansverdding van R onder Hg berekend. In tabd N-l zijn voor n = 5 t/m 8 en de drempelwaarden 0,01, 0,02, 0,05 en 0,10 de linker en rechter kritieke waarden RL resp. RR van R bij tweezijdige toetsing opgenomen. De tabel kan gebruikt worden bij éénzijdige toetsing door deze drempelwaarden te halveren. Beschouw voorbeeld 10.16 met Rg = 20. Hg wordt getoetst met als alternatief Jï^: er bestaat een podtieve relatie. Indien Hi juist is, zullen de rangnummers per paar in de regel min of meer overeenstemmen, zodat de verschiUen tussen de rangnummers klein en de waargenomen waarde van R laag zal zijn. Men zal dus Hg uitsluitend willen verwerpen voor te lage waarden van R en dus links éénzijdig toetsen (luidt de alternatieve hypothese: er is een negatieve relatie, dan toetst men rechts éénzijdig. Luidt het alternatief: er is een relatie, dan wordt tweezijdig getoetst). Uit tabd N-1 blijkt, dat voor « = 8 en a = 0,05 de linker kritieke waarde bij éénzijdige toetdng 30 is (deze staat dus onder a = 0,10). 2?o is aanzienlijk kleiner (bezit een linkse kans, die tussen 0,025 en 0,01 ligt), zodat Hg wordt verworpen ten gunste van Hi. 10.7.4.2. Normale benadering. Voor grotere waarden van n is de exacte berekening vrijwel onuitvoerbaar (bij n — 8 zijn er reeds 8! = 40320 permutaties). Men kan dan gebruik maken van het feit, dat de grootheid n{n» — 1) R-u^ 6 6R - n{n» — 1) (10.24) T = — ^ ^ ^^ n{n -\- l)Vn — 1 \/n»{n -t- \)»{n — 1) 36 bij benadering standaardnormaal verdeeld is. Het is gewenst een continuïteitscorrectie van 1 aan te brengen. Men berekent dus: nnr>K\ ^°-^^ of
T _ | 6 J ? o - » ( « ' - 1 ) 1 - 6 en PD{TO) bij tweezijdige ^''" n{n+\)y/n-\ '^^'^^S.
nn9ft n r 6i?o -|- 6 - n{n» - 1) en PL{TO) bij Imks eenzijdige (iu.^b.1) i g ^^ ^ ^^___ toetsing (^i: positieve correlatie), 251
10.7
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
resp. tin o ^ o \ T — 6i?o — 6 — n{n» — 1) en PR{Tg) bij rechts éénzijdige (W.Zb.Z) I g ^ i)V,r31 toetsing {Hi: negatieve correlatie). 10.7.4.3. Benaderende toetsing, tabel N-2. Men kan voor n = 9 t/m 30 ook gebruik maken van tabel N-2, waarin bij de drempelwaarden 0,01,0,02,0,05 en 0,10 de ünker en rechter kritieke waarden AL resp. RR bij tweezijdige todsing staan. In deze tabel zijn bij de drempelwaarden 0,01 en 0,05 twee kritieke waarden opgenomen: a. Onder O : deze zijn via de normale benadering berekend door OLDS (106). b. Onder LW: deze zijn met een andere benaderingsmethode (nl. via de bestpassende STUDENT-verdding) berekend door LITCHFIELD & WILCOXON (99).
Wij hebben beide kritieke waarden opgenomen, omdat VAN DER (32) heeft gedemonstreerd, dat in het algemeen de waarden ad (a) t.a.v. het verwerpen van Hg aan de veiüge kant zijn, terwijl de waarden ad (i) iets te snel tot het verwerpen van Hg leiden. D.w.z. : vindt men een uitkomst, die tussen beide kritieke waarden ligt, dan heeft deze een overschrijdingskans die in de buurt van a ligt (er net boven, maar ook juist er onder kan zijn). Toetst men tweezijdig met a = 0,01 of 0,05 en gebruikt men de kritieke waarden volgens OLDS («), dan kan men er vrijwel zeker van zijn dat de overschrijdingskans van Rg kleiner is dan a, indien Rg < i?i(a, n) of Rg > RB{a, n). Voor benadering {b) zijn bij de drempelwaarden 0,01 en 0,05 en tweezijdige toetsing ook de linker en rechter kritieke waarden voor » = 31 t/m 40 berekend en in tabel N-2 vermeld. Bij éénzijdige todsing dient men de onbetrouwbaarheidsdrempels in tabel N-2 te halveren. In dat geval staan bij de drempelwaarden 0,01 en 0,05 aüeen de kritieke waarden volgens OLDS ter beschikking. WAERDEN
Voorbeeld 10.17.
In tabel 10.15 is een voorbeeld met « = 15 opgenomen. Rg = 356 en uit tabel N-2 bUjkt, dat deze uitkomst bij tweezijdige toetsing geen aanleiding geeft om tot het verwerpen van Ho over te gaan, daar de Unker kritieke waarde bij « = 15 en a = 0,05 zelfs volgens L W nog geUjk is aan 272. Ter demonstratie passen wij op dit voorbeeld ook de normale benadering met (10.24) toe: _ 6 X 356 - 15(15' - 1) -t- 6 _ - 1 2 1 8 ^ »~ 15 X 16^14 ~ 897,98 "~ ' P D (1,36) = 0,1738 (tabel A).
252
DE R A N G C O R R E L A T I E C O E F F I C I Ë N T V A N SPEARMAN
10.7
Tabel 10.15. Begingewicht en gewichtstoeneming (in grammen) van vrouwtjesratten met een proteïnerijk dieet (28^ t/a 84^ levensdag)
Rat nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Begin Toeneming Rangnummers X
50 64 76 63 74 60 69 68 56 48 57 59 46 45 65
y
Rx
Ry
128 159 158 119 133 112 82 126 132 118 107 106 96 103 104
4 10 15 9 14 8 13 12 5 3 6 7 2 1 11
11 15 14 9 13 7 1 10 12 8 6 5 2 3 4
d»
d
- 7 - 5 1 0 1 1 12 2 - 7 - 5 0 2 0 - 2 7 +26
-26
Sd^ 0
49 25 1 0 1 1 144 4 49 25 0 4 0 4 49 356 Ä0
10.7.5. UITVOERING VAN DE TOETSING MET GELIJKEN
Komen er in de reeks a:-waarden geüjken voor, dan ontvangen deze per groep het gemiddelde van de hen toekomende rangnummers. Evenzo handelt men met gelijken onder de y-waarden. Het verschü d per paar wordt daarna op de gewone wijze bepaald. Is het aantal geüjken betrekkeUjk klein en verschillen de groepen gelijken niet te veel in omvang, dan kan men tabel N nog w d bij benadering gebruiken en kan ook de normale benadering nog zonder het aanbrengen van een correctie worden toegepast. Bij grote aantallen gelijken kan een correctie worden gebruikt, die behandeld wordt door KENDALL
(94).
1 0 . 7 . 6 . D E RANGCORRELATIECOEFFICIËNT VAN SPEARMAN
Als de grootheden x e n y afhankelijk zijn spreekt men van correlatie. Als maat voor deze correfatie kan worden gebruikt de rangcorrelatiecoëfficiënt :
Het is duidelijk dat het volgende geldt: «. f« = 1, als i? = O, d.i. als de beide rangorde-reeksen precies overeenstemmen ; men spreekt dan van een volkomen podtieve corrdatie, b. y^ = O, als i? = (IR, d.i. als de xen y-waarden geheel onafhankelijk zijn, en c. r« = — 1, als iï . = n{n» — l)/3, d.i. als de twee rangorde-reeksen gehed tegengesteld verlopen: men spreekt dan van een volkomen negatieve correlatie. 253
10.8
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
Berekent men r^ uit een aselecte steekproef van n waamemingsparen {x, y), dan is de waargenomen r^ een schatting van gjj, de rangcorrelatiecoëfficiënt in de populatie.^ De toets voor de hypothese, dat X eny stochastisch onafhankelijk zijn kan ook worden gezien als toets voor de hypothese QR = 0. Onder deze hypothese geldt voor de kansverdeling van ra', /ir = O en Or» = r- en voor niet te kleine n is de grootheid " ~ (10.28)
T = - ' ' ~ ^ ' ' = rgV^r^n Or
bij benadering standaardnormaal verdeeld. (10.28) levert dezelfde uitkomst op als (10.24). 10.7.7. OPGAVEN 10.21. Pas de rangcorrelatietoets van SPEARMAN toe op de twee reeksen waarnemingen in opgave 10.8. 10.22. Betr. voorbeeld 2.6. Toets de hypothese, dat vleugellengte en tonglengte stochastisch onafhankeUjk zijn. Bepaal bij benadering de tweezijdige overschrijdingskans van Rg en vergelijk deze met de uitkomst van de j;'-toets in voorbeeld 9.18. 10.23.- Uit: N.T.v.G., 100 (1956), 557. De navolgende gegevens zijn ontieend aan tabel II (patiënten met verschillende ziekten) en betreffen de 24 van de 32 gevallen, waarvan waarnemingen beschikbaar waxen betreffende: x = calcium in de urine (mg per 24 uur) en y = calcium in het serum (mg pet) : Pat. X
y
1
2
3
4
860 775 450 360 13,8 17,4 13,4 9,9
10 11 13 15 17 19 7 5 330 280 180 170 140 130 110 95 14,4 10,0 9,7 9,7 8.7 9.1 9,7 10,0
Pat. 20 21 22 23 25 26 27 X 95 90 90 85 70 60 50 10,3 10,0 10,0 11,0 10,0 11,5 8,8 y
28
29
50 40 10,0 9,7
30
31 32 40 35 20 10,0 10,3 9,7
Toets de hjrpothese, dat de grootheden x&n^ stochastisch onafhankeUjk zijn, met als alternatieve hypothese dat zij een positieve correlatie vertonen. Kies a — 0,05.
10.8. De rangcorrelatietoets van Kendall 10.8.1. TOEPASSING
Deze toets kan eveneens worden gebruikt om de juisthdd te onderzoeken van de hypothese Hg, dat de grootheden x en y stochastisch onafhankeUjk zijn. In 10.9 vergelijken wij de toets van KENDALL met die van SPEARMAN. 10.8.2. DE TOETSINGSGROOTHEID
Ook de toets van KENDALL berust op de rangnummers van de x- en ' g = de Griekse letter rho.
254
DE RANGCORRELATIETOETS VAN KENDALL
10.8
y-waarden in de steekproef. Nu beschouwt men echter de grootheid P, d.i. het aantal der paren rangnummers in de y-reeks, waarvan de volgorde naar grootte overeenstemt met de volgorde naar grootte van de overeenkomstige rangnummerparen in de «-reeks. Beschouw bv. de volgende reeksen rangnummers, waarbij de a;-reeks van links naar rechts in opklimmende grootte-orde staat: 1 1 3 6
X yi y?.
yz
2 2 1 5
3 3 2 4
4 4 5 3
5 5 4 2
6 6 6 1
In de «-reeks kunnen naar grootte («< > Xj) de rangnummerparen (1,2), (1,3), (1,4), . . . , (2,3), (2,4), . . . , (3,4), . . . , (5,6) worden gevormd, dat zijn dus in het algemeen (M — 1) -f- (« — 2) -|-|- 1 = «(« — l)/2 paren. Indien de y-reeks voüedig met de «-reeks overeenstemt, zoals bij yi, is dus P = »(« — l)/2. Verloopt de y-reeks volledig tegengesteld aan de «-reeks, zoals bij yg, dan stemt geen enkel rangnummerpaar in de y-reeks naar grootte overeen met het overeenkomstige paar in de «-reeks, zodat P = 0. Nu bekijken wij de reeks yg. Het paar (1,2) staat in de juiste volgorde, het paar (1,3) echter met, de paren (1,4), (1,5) en (1,6) wel. Het paar (2,3) niet, de paren (2,4), (2,5) en (2,6) wel, enz. Eenvoudig is in te zien, dat men voor twee rangnummerreeksen de waarde van P kan bepalen, door voor ieder y-rangnummer vast te stellen, hoeveel hogere y-rangnummers rechts er van staan, dus bv. : Rangnummerreeksen Aantal grotere y's rechts van y^ Aantal kleinere y's rechts van y^
1 2 3 3 1 2
4 5
5 4
6 6
3 - F 4 - F 3 - F r + 1 + 0 = 12 =- P ^ 2-h0-t-0+l-t-0 + 0 = 3 Totaal = i«(M - 1) = 15
De grootheid P varieert van O t/m \n{n — 1). KENDALL voert nu als toetsingsgrootheid in (10.29)
S= 2P-
^ ^ ^ ^ .
Deze grootheid varieert van — J«(« — 1) tot en met ^«(M — 1). Uit het voorgaande volgt, dat Sg geüjk is aan het aantal paren rangnummers in de y-reeks, waarvan de volgorde naar grootte overeenstemt met de volgorde naar grootte van de overeenkomstige rangnummers in de «-reeks, verminderd met het aantal paren waarvoor dit niet het geval 255
10.8
KWANTITATIEVE VERDELINGSVRIJE METHODEN
is. Voor de y-reeks in het voorgaande voorbeeld is dus volgens (10.29) : 5o = 2(12) — 6(5)/2 = 9, of rechtstreeks uit de tabd: Sg = 12—3=9. In tabel 10.16 is de berekening van Sg voor de gegevens in voorbeeld 10.16 uitgevoerd. De waarden van x zijn zo geplaatst, dat de rangnummers in de volgorde 1,2, . . . , n staan. Tabel 10.16. Calciumpercentages in de gedroogde stof van aorta (A) en nieren (N) bij konijnen (voorbeeld 10.16) Rangnummers N Ry Rx y 1 1 0,0 2 3 1.2 5 3,3 3 4 4 1,6 5 2 0,8 5,2 6 7 7 8 7,1 3,5 8 6 S„ = 2 2 -- 6 = 16
%Ca
Konijn nr.
A
2.33 2.37 2.25 2.21 2.15 2.08 2.09 2.34
0,7 3,6 4,1 4,6 5,4 10,3 12,7 13,4
X
S-bijdragen
+ 7 5 3 3 3 1 0 0 22
0 1 2 1 0 1 1 0 6
Bij elke Ry wordt dus de positieve bijdrage tot Sg {-\- kolom) verkregen door te tellen hoeveel hogere rangnummers er onder staan. De negatieve bijdrage (— kolom) wordt per Ry verkregen door te teüen hoeveel lagere rangnummers er onder staan. SQ volgt overigens ook uit de positieve bijdragen: Sg = 2(22) — 8(7)/2 = 16. 10.8.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
Onder de hypothese, dat de grootheden x e n y stochastisch onafhankehjk zijn, is bij een gegeven «-reeks elke permutatie van de rangnummers van de y-reeks even waarschijnlijk, zodat de kansverdding van S kan worden berekend. Hierbij kan gebruik worden gemaakt van een zg. recurdeformule, d.w.z. de verdeling voor n -|- 1 waamemingsparen kan uit die voor n worden afgeleid. Voor de verdeling van S onder Hg geldt, als geen geüjken in de waargenomen reeksen voorkomen : a. Als ln{n — 1) even (oneven) is, neemt S slechts even (oneven) waarden aan. b. De verdeling is symmetrisch t.o.v. (10.30)
iMs = 0
en heeft als variantie (10.31) 256
ff«"
n{n — l){2n -\- 5) 18
D E RANGCORRELATIETOETS VAN KENDALL
10.8
10.8.4. UITVOERING VAN DE TOETSING ZONDER GELIJKEN
10.8.4.1. Exacte todsing, tabd 0. Voor « = 4 t/m 40 zijn de exacte kansverdeüngen van S onder Hg berekend en in de tabellen van KAARSEMAKER & VAN WIJNGAARDEN (69) opgenomen. In tabel O zijn voor deze waarden van n en de drempelwaarden 0,01, 0,02, 0,05 en 0,10 de rechter kritieke waarden SR van S hi] tweezijdige todsing ge:geven.'^egens de symmetrie van de verdeüng t.o.v. O geldt: S L = — SR. De tabd kan voor éénzijdige todsing worden gebruikt door de drempelwaarden te halveren. In tabel 10.16 vinden wij voor voorbeeld 10.16 met » = 8: 5o = 16. Hg wordt getoetst met als alternatief Hi. tussen de grootheden x e n y bestaat een positieve correlatie. In dat geval neemt de groothdd S overwegend positieve waarden aan, zodat rechts éénzijdig wordt getoetst. De rechter kritieke waarde bij éénzijdige toetsing met a = 0,05 en « = 8 dient te worden opgezocht in de kolom met a = 0,10 en men vindt dan S R = 16. In dit geval is 5o = SR, zodat Ho wordt verworpen t.g.v. Hi.^ 10.8.4.2. Normale benadering. Voor « > 40 kan men gebruik maken van het feit, dat de grootheid (10.32)
T =
S — /is Os
S Vn{n - l){2n -f 5)/18
bij benadering standaardnormaal verdedd is. Deze benadering is zeer goed. Een continuïteitscorrectie kan worden aangebracht door de absolute waarde van Sg met 1 te verminderen. 10.8.5. UITVOERING VAN DE TOETSING MET GELIJKEN
Aan de gelijken binnen de «- en binnen de y-reeks wordt weer per groep het gemiddelde rangnummer toegekend. Voor de bepaling van de bijdragen tot So wordt dan de volgende regd aangehouden: als van de waarnemingsparen («<, y,) en {Xj, y^ met i < j , de rangnummers van Xi en Xj, of van y^ en y^, of van «< en Xj èn y^ en y, geüjk zijn, dan is de bijdrage tot So geüjk aan nul. Dit is gebaseerd op de gedachte, dat men beide mogeüjke rangschikkingen van de twee geüjken beschouwt en het gemidddde van de daarbij verkregen S-bijdragen als bijdrage neemt : dit gemiddelde is steeds geüjk aan 0. Als voorbeeld is in tabd 10.17 de berekening van Sp uitgevoerd voor twee rangnummerreeksen met ved geüjken. 1 De uitkomst van de toets van KENDALL stemt t.a.v. de uitspraak (Hg verwerpen) overeen met die van de toets van SPEARMAN (zie 10.7.4.1 ). Via eerstgenoemde toets komt men echter tot een overschrijdingskans tussen 0,05 en 0,025 (exact: 0,031) en met laatstgenoemde tot een overschrijdingskans tussen 0,025 en 0,01. Wij komen hierop terug in 10.9.
257
10,9
KWANTITATIEVE VERDELINGSVRIJE TOETSEN Tabel 10.17. Berekening van Sg bij het optreden van gelijken Rangnummers Rx 1 2i 2* 4* 4i 6* 6i 8 94 9i
Ä.
1 2 4è 44 44 44 8 8 8 10
S-bijdragen 0 40 0 9 7 0 1 4 0 3 4 0 2 4 0 1 3 0 1 1 0 2 1 0 1 0 0 1 0 0 0 33 =- S o
Als het aantal gelijken betrekkelijk klein is en de groepen gelijken niet te veel in omvang verschillen, kan men tabel O nog wel bij benadering gebruiken, terwijl ook de normale benadering nog wel kan worden toegepast, zonder dat men een fout van betekenis maakt. Bij grote aantallen gelijken dient een correctie te worden aangebracht, die o.m. besproken wordt door KENDALL (94). 10.8.6. DE RANGCORRELATIECOEFFICIËNT VAN K E N D A L L
Deze coëfficiënt is 2S
(10.33) rg = , - ,, ^ ' -* n{n — 1) en varieert dus evenals de rangcorrelatiecoëfficiënt van SPEARMAN tussen -|-1 (volkomen positieve correlatie) en — 1 (volkomen negatieve correlatie). Berekent men r^ uit een aselecte steekproef van n waarnemingsparen, dan is de waargenomen r^ een schatting van T«, de rangcorrelatiecoëfficiënt in de populatie.^ 10.8.7. OPGAVEN 10.24. Als opgave 10.21, maar met de toets van KENDALL. 10.25. Als opgave 10.22, maar met de toets van KENDALL.
10.9. Keuze van een rangcorrelatietoets In tabel 10.18 is voor « = 6 de simultane verdeling van de grootheden R{rR) van de toets van SPEARMAN en S{rK) van de toets van KENDALL opgenomen. Deze grootheden worden verschillend gedefimeerd, zodat hun kansverdelingen verschülen. De grootheid R neemt in totaal n» = 36 en de grootheid S neemt in totaal 1 -|- |«(» — 1) = 16 verschillende waarden aan. De verdeling van S is regelmatiger van 1 T = de Griekse letter tau.
258
10.9
KEUZE VAN EEN RANGCORRELATIETOETS "3
•g
^^
"5
sS
H
C4
Sq fSä Si
s 8 S S? gs a 5Î SS 8 s ^ a 8
CM
8
s :Î
2
*^
S
•O-.
++ Ii
"S
lO
«
+°' + «S
>o m
'+%
• *
o
o>S
- S
>o
«
«
00
a
+ 5; +o
+
n loS?
-*
ss • *
QO
M
s
O
S •*
O^
• *
M
K
s
00 OO 00
S
M
PJ
+ co^
8
+ M
+ 0
?3 8
n
2
3
• *
+ £ï
'^ S 2 S St 2
Tl
M
r«
s8
-•
o
1
«
1o 1
s °
œ
00
s
T-l
Ov
1 ** Ri O «
M
^1^o
OÙ
**
p
"f.
1
1
o
sO
lo 1
.R
•o
«^
»
on ^n
• *
'Î t*«
2S
m
lO
lO.^
'^
•l'l
O
11
M
• *
«1 ir
04
o
o o o o"
o vO
oo o
11 O
cî
S §. d
5
3 d
O
i
i
CO
5§
d d o d o d d o d O d d d d o 1 1 1 1 1 1 1 1 1 1 1 1 1 1 o1 1 1
« 2; *o 2 8 ^ S ^ 8 g S n
!§
s§
Sî 5 « 9 g
•a
ï 2 sSSSSssSSR H 259
10.9
*
KWANTITATIEVE VERDELINGSVRIJE TOETSEN
vorm dan de verdeüng van R en kan beter door een normale verdeling worden benaderd. Het verband tussen de grootheden büjkt niet rechtüjnig te zijn, maar vertoont een eiügszins gebogen (S-vormig) verloop. Dit blijkt uit het feit dat de rangcorrelatiecoëffidënt van SPEARMAN in het gebied tussen -f- 1 en O en tussen O en — 1 systematisch hogere absolute waarden aanneemt dan de rangcorrelatiecoëfficiënt van KENDALL (ga dit na aan de hand van tabel 10.18). De rangcorrdatiemethoden zijn tegenwoordig vooral van betekenis, omdat zij gebruikt kunnen worden om verdelingsvrij de hypothese te toetsen, dat twee grootheden stochastisch onafhankelijk zijn.i Welke methode kan men nu in de praktijk het best gebruiken? VAN DER WAERDEN (32) toont aan, dat de toets van SPEARMAN het grootste onderscheidingsvermogen bezit en concludeert hieruit dat deze toets te prefereren is. Men kan hier tegenover stehen, dat bij deze toets van « = 9 t/m 40 slechts benaderende kritieke waarden ter beschikking staan, terwijl men dan bij de toets van KENDALL over exacte kritieke waarden kan beschikken. Dit bezwaar geldt echter alleen, als men bij het gebruik van de toets van SPEARMAN een waarde van R vindt, die dicht bij de kritieke waarde ligt. Voor « > 40 dient men voor beide toetsen een normale benadering te gebruiken en deze zal dan ook voor de toets van SPEARMAN wel voldoend nauwkeurig zijn. Een definitieve uitspraak omtrent de keuze tussen de twee toetsen is dus moeiüjk te geven. Onze voorkeur gaat echter uit naar de toets van SPEARMAN, mede omdat deze bij grotere n en vrij veel geüjken iets eenvoudiger te hanteren is.
* Voorheen was men voornamelijk geïnteresseerd in de rangcorrelatiecoëfficiënten als benadering van de Uneaire correlatiecoëfficiënt (die in deel II besproken wordt).
260
HOOFDSTUK 11
VERDELINGSVRIJE TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEES 11.1 Inldding Aüe statistische toetsings- en schattingstechnieken berusten op de onderstdüng, dat de elementen van een steekproef, waaraan de waarnemingen verricht zijn, aselect getrokken zijn uit de bestudeerde populatie. Er zijn gevaUen, waarin het van belang is te onderzoeken of aan deze onderstdüng voldaan is, bv. als men beschikt over een reeks waarnemingen, waarvan de aselectiviteit op z'n minst twijfdachtig is, of als men een steekproef heeft getrokken op een wijze waarvan men verwacht dat zij aselect is. Het kan ook voorkomen, dat men beschikt over een tijdreeks, d.i. een in chronologische volgorde verzamelde reeks waarnemingen en wil onderzoeken of daarin één of ander verloop in de tijd optreedt. In beide gevallen kan men gebruik maken van een aantal toetsen voor de h5T)othese Ä^^, dat de beschouwde waarnemingen aselect, d.i. dus onderüng onafhankehjk zijn. Onder deze hypothese vertonen de waarnemingen in de regel een onregelmatig verloop. Onder de alternatieve hjrpothese Hi, dat de waarnemingen niet aselect gespreid zijn, kunnen echter verschülende typen van verloop (Eng. 'trend') optreden. Tabel 11.1 geeft hiervan enkele voorbeelden. Deze tabel bevat vijf reeksen waarnemingen in chronologische volgorde. Wij zuüen deze (fictieve) gegevens beschouwen als de systohsche bloeddrukken (in mm Hg) van 5 patiënten, A t/m E, die op 20 achtereenvolgende dagen gemeten zijn (elke dag op hetzelfde tijdstip, door dezelfde waarnemer met hetzdjfde apparaat). Bestudeer deze reeksen voordat u verder leest en tracht uit de tabel aan te geven of zij naar uw mening aselect zijn, c.q. of zij een bepaald verloop vertonen. Bekijk eerst daarna him grafische voorstellingen in figuur 11.1. Het blijkt dan, dat de grafieken een veel beter indcht verschaffen dan de getallenreeksen. Aan de hand van figuur 11.1 valt nu omtrent de vijf tijdreeksen in tabel 11.1 het volgende op te merken: A. Deze reeks vertoont een sjretematisch stijgend verloop, d.w.z. de stijging wordt soms door een (geringe) daüng onderbroken, maar dit is begrijpelijk indien men bedenkt, dat er in de waarnemingen ook een 261
11.1
T O E T S E N T E G E N VERLOOP IN EEN WAARNEMINGSREEKS
Tabel 11.1. SystoUsche bloeddruk van 5 patiënten op 20 achtereenvolgende dagen (fictieve gegevens) Patiënt
Dag
1 2 3 4 5 6 7 8 9 10 11 .
12 13 14 15 16 17 18 19 20
A
B
C
D
E
113 115 114 117 118 120 124 125 126 131 128 134 141 143 147 148 145 149 153 157
98 101 110 105 99 106 104 109 100 102 119 123 118 116 122 130 115 124 127 114
142 137 136 132 126 119 116 112 113 110 111 115 117 123 130 124 131 135 139 140
122 105 121 114 118 115 125 112 123 109 120 111 127 117 124 108 116 113 128 110
112 126 118 124 116 109 111 125 110 121 122 123 129 115 114 127 113 120 119 108
zekere toevallige variatie zal optreden, die soms de stijging zal tegenwerken of in een daüng zal doen omdaan (bij werkelijke gegevens zal dit effect in de regel sterker zijn, dan bij deze fictieve waarnemingen). B. Deze waarnemingen geven, na de 10de dag, een plotselinge stijging te zien. De waarnemingen van de eerste èn die van de laatste tien dagen afzonderüjk maken echter een 'aselecte' indruk. C. Hier ziet men (een deel van) een cyclisch verloop, d.w.z. een geleideÜjke daüng, gevolgd door een geleidelijke stijging, die weer in een daling zal overgaan, enz. Op deze wijze zou zich bv. een seizoenseffect kunnen manifesteren. D. Deze waarnemingen vertonen geen niveauverschuiving, maar een oscillatie, d.i. een sneue periodieke fluctuatie. De door de waamemingspunten getekende polygoon bezit een typisch zaagtandpatroon. E. Slechts deze waamemingsreeks maakt in zijn geheel een 'aselecte' indruk. Er zijn op het oog geen bijzonderheden in het verloop te onderkeimen. In deze voorbeelden zijn de voornaamste verlooppatronen aangegeven. Uiteraard kunnen zij ook in combinatie voorkomen. Zo kan een stijgend of dalend verloop samengaan met oscillatie of met een plotseünge niveauverandering (bv. een verlaging tengevolge van het toedienen van een geneesmiddel). 262
C9e T U I^l'BI- ut u9S3[a3jprç^ spCTBAus^s^BJO T i l nmSij 9VQ •|
81 I
I
Z,L I
SI I—I I
Cl I
I
LI I
6 I
^
S
C
l
I — l l l l l l l l -
-OU UDDipauü
OZL
- OEI
d00iy3A 13313SV 3 •
9>fa
61 1
I
Li I
I
SI I
I
I
£1 I
II I
'
6 I
•
Z I
I
I
S
£
1 1 I
l 1 I
-Oil UDDipaui
- 021
siivnioso a
' • • ' I 9Va
61 I
I
a I
SI
I
I
I
El I
I
II 1 I
6 I
I
i I
I
s I
1 I
E I
-|oei l
I
I'
uoDipauj
d00iy3A HOSnOAO "3 •
'
•
61
9va
'
SI
LI
EI
II
6
Z,
S
E
l
1
uDDipauj
' ' "r\.^s/\"/*• / V ^ N/
_
A A .V
/
S » /
/
OOI 01 l OZl
9N19riiS 3 9 N n 3 S i 0 1 d
- OEI
8
LJL-JL O -
9Va
61 1
^l
1 I
1
SI 1 I
ei I
II
1 I
I
6 1 1
i
s
1 I
I
I
E I
l
1 1 1-
01 l OZl uoojpsuj
=jOEl 071
dOOlMBA aN39riiS V
-losi '
091
oNiaiaTNi
ru
ll.2
ToETSEN TEGEN vERLoop rN EEN wAARNEMINGSREEKS
Er zijn nu verschillende toetsen tegen verloop in een waarnemingsreeks mogelijk. Bij alle luidt de te toetsen hypothese Ho, dat de r,vaármingen in aselecte volgorde staan. De alternatieve hypothese r1r, waarvoor deze toetsen gevoelig zijn, is echter niet steeds identiek, teiwijl de toetsen tegen hetzelfde alternatief een verschillend onderscheidingsvermogen blijken te bezitten. wij komen hierop terug in I I.6, nadat wij eerst de toetsen afzonderlijk hebben besproken. 11.2. De rangcorrelatietoetsen als toetsen tegen verloop De resp. in 10.7 en 10.8 behandelde rangcorrelatietoetsen van SppanMAN en KBNner,r kunnen ook worden gebruikt als men de hypothese ¡10 wil toetsen, dat in een waarnemingsreeks geen verloop óptreedt, met als alternatieve hypothese Hr, dat er een stijgend of ãalend ver-
loop aanwezig is. , De toetsing van deze nulhypothese komt dan neer op de toetsing van
de hypothese, dat tussen de waarnemingen en de tijästipp.tr ,"ã"rop
Tabel t 1.2. Toepassing van de rangcorrelatietoets van Sppenu¡¡r op de tijdreeksen in tabel I I . I A
D"g
B
w R* d
o Rod
I
113 115
2
I \)
a
tt4
2
4
117 118
4
5
6
120 124 125 126
7 o
9
00
-1 +1
I 1
9
00 00 00 00 00 00
1l
I
5 6 7
I
10
131
11
t28 10
l2
134 12
13
t4t l3
t4
143 t4
15
t47
l6 l7
148 l7 145 15
l8
149
1B
r9
153
l9
¿U
t57 20
1ó
R.
-1 +l
1
00 00 00 I
-1 -l +24 1
00 00 00
D d,2
98 I 00 101 4-2 4 110 10 -7 49 105 7-3 9 99 2+e 9 10ó B-2 4 to4 6+1 I 109 9-1 I 100 3 +6 36 to2 5 +5 25 119 15 t6 -4 25 123 t7 -5 118 14 -l 116 13 +1 122 16 -l 16 130 20 1t5 12 -4 +5 25 12418 0 0 12719 0 0 114 lt +9 81 1 1
1
lx
Rn
142 20
137 t7 136 16 132 14 126 tl
tt9 B 116 6 tt2 3
113 4 110 I 111 2 115 5 117 7 123 9 t30 12 124 t0 131 r3
r35 r5 139 1B 140 t9
d d2 ly Ro d 122 t5 -19 361 105 -14 +1 -15 225 169 121 14 1
-13 - 10 100 tt4
8
12 -6 364 118 115 9 -2 125 18 +1 +5 25 126 +5 25 t23 t6 +9 Bl 109 3 120 13 +9 +7 49 111 5 +6 36 127 t9 +5 25 17 tl +3 9 124 17 +6 36 to8 2 +416 11ó l0 +3 9 113 7 +1 I l2B 20 +1 I 110 4 1
B1
264
112
5
-7 _?o
1
49
tt6
9
109 111
2
113
6
120 119
12
-lt 1214 125 t74 +2 49 110 3 -7 +7 49 t2t 13 4 122 14 -2 + 7 "'49 123 t5 36 t29 20 -6 +3 9 115 B 4 t14 7 -2 +t4 196 127 t9
+7 49 +lt t2t -1 +t6 256 1
11
108
1
d2
-41( -16 49 -7 144 -12 16, -4 +4 t6 +3 9 81 -9 +6 3ê -3 99 -3 -3 499 -7 +6 36 +8 64 9 -3 +lt t2t +6 36 +8 64 19C.
+19
361
1330
>0,85 * volgens (10.24)
196
lz R, d
126 lB 121 118 10 -lt -416 124 16
304
I
d.2
|
>0,95
DE SERIETOETS OP DE WAARNEMINGEN
11.3
deze betrekking hebben geen corrdatie aanwezig is, met als alternatief dat er een podtieve corrdatie (stijgend verloop) of een negatieve correlatie (dalend verloop) bestaat. De toets is in 't bijzonder gevoelig voor een min of meer regelmatig stijgend (dalend) verloop en in mindere mate voor een sprongsgewijze stijging (daüng). Merk op, dat bij deze toepasdng van de rangcorrelatietoetsen de tijdstippen van waarneming een niet-stochastische grootheid vormen. Bij bestudering van de mtkomsten in tabd 11.2 bedenke men, dat voor »=20geldt:/*je = 20(20'»— l)/6=1330en(Tjï = 20 X 21 VÏ9/6 = 305,12. Voor elke reeks is de waargenomen waarde van/jf opgenomen. Om een indruk te geven van de grootte-orde van de tweezijdige overschrijdingskans van Rg is deze via Tg met (10.24) benaderd. Duideüjk blijkt, dat de rangcorrelatietoets het stijgende verloop bij A en B signaleert, maar ongevoeüg is voor het cydische verloop bij C en de oscülatie van D. Bij reeks E met het toevalspatroon is zelfs Ro = /ijg. Merk voorts op, dat bij B het eerste en het laatste tiental waarnemingen geen stijgend of dalend verloop vertonen. Rg kan voor elk dezer reeksen met « = 10 eveneens mt tabel 11.2 worden afgelezen en büjkt 138, resp. 166 te bedragen. 11.3. De serietoets op de waarnemingen 11.3.1. TOEPASSING
De toets kan worden gebruikt als men de hjrpothese Hg wü toetsen, dat een reeks waarnemingen een aselecte volgorde bezit (aselect getrokken is) en als de alternatieve hjrpothese H i luidt, dat dit niet het geval is. De toets is gevoelig voor elk soort verloop (zie echter 11.6). 11.3.2. DE TOETSINGSGROOTHEID
Onderstel, dat men 20 maal met drie verschülende geldstukken werpt en daarbij de volgende uitkomsten verkrijgt: Geldst.I:
KK K M M M M K K K K K K M M M M M M M
Gddst. I I :
KM"
K ' M K M ' K ' M K ' M
K M ' K M ' K M ' K M ' K M "
Geldst.III: K K M J C M U K_M M M K K M M K^M K K K K
Bij reeks I zien wij betrekkelijk lange series van opeenvolgende gelijke uitkomsten, zodat het totaal aantal waargenomen series (4) vrij Mein is. Bij reeks II valt de regelmaat op, waarmee de uitkomsten K en M elkaar afwisselen: elke serie bestaat hier uit dechts één keer K of M, zodat er in totaal 20 series zijn. Bij reeks III ziet men een onregelmatige afwisseling van korte en langere series en deze steekproef met 11 series maakt intmtief een aselecte indruk. 265
11.3
TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEKS
Bij de serietoets kiest men nu als toetdngsgrootheid het aantal series u (men spreekt ook van : kettingen, iteraties. Eng. 'runs'), d.i. het aantal groepen van opeenvolgende gelijke kenmerken. Bij kwantitatieve waarnemingen kan men deze grootheid eveneens gebruiken en wel door de waarnemingen te klassLficeren als gelijk aan of groter dan de medi lan {H) en kleiner dan de mediaan (Z,). Het aantal waarnemingen met kenmerk H noemen wij dan m^ het aantal met kenmerk L Wg, zodat Wj 4Wg = M. Voor de gegevens in tabel 11.1 verkrijgt men op deze wijze de reeksen met H's en L's, die in tabel 11.3 zijn vermeld (men kan deze klassLficatie eenvoudig uitvoeren met de grafieken in figuur 11.1; als men reeds rangnummers heeft toegekend, kan men ook daarvan uitgaan). Tabel 11.3. Toepassing van de serietoets op de tijdreeksen in tabel 11.1 Reeks
Dag 3 4
A
L L
L L L L L L L H L H H H H H H H H H
4
B
L L
L L L L L L L L H H H H H H H H H H
2
C
H H H H H L L L L L L
D E
5
6
7 8
9 10 11 12 13 14 15 16 17 18 19 20
<*»
1 2
L L L H L H H H H
5
H L
H L H L H L H L H L H H H L L L H L
16
L H
L H L L L H L H H H H L L H L H H L
13
11.3.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
De toetdngsgrootheid M, het aantal series, kan de waarden 2, 3, . . ., 2 « ! {mi < »îj) aannemen. Onder Ho zijn alle mogelijke permutaties van de n waarnemingen in de steekproef even waarschijnüjk, zodat men dan de kansverdeüng van u kan berekenen. Als mi = m2 = m = ^n büjkt deze grootheid onder Hg de volgende kansverdding te volgen: m-l
2 IC« . voor even waarden van u. (11.1)
P{u^u) m-l
m—1
2 |C«+i
266
-1
C«+l . 2
voor oneven waarden van u.
11.3
DE SERIETOETS OP DE WAARNEMINGEN
De afleiding van deze formule is te vinden in MOOD (24) en BENNETT & FRANKLIN (4). Voor het geval mi ^ Wa geldt een iets gecomphceerder formule, die wij hier buiten beschouwing laten. Als voorbeeld is in tabel 11.4 de verdeüng van u onder Hg voor Wj = wtg = 5 berekend met (11.1). Tabel 11.-5\. VerdeUng van M onder HQ voor »»i = m^ = 5 M
2
3
4
6
5
7
8
9
10
P(u). Cs" 2 (Cor^2(Ci*)(Co*)\2 (Ci*)'\2(C,*) (Ci*) 2(C^*)'\2(C,*)(C^*) 2(C.*)'2(C.*)(C,*) 2(C.*)" P(M) . 252
2
8
32
48
72
48
32
8
Voor de verdeüng van u onder Hg büjkt verder te gelden : (11.2) en (11.3)
^,„ = ^ ' ' ^ 4 - 1 n 2mim2 (2»fiWg — n)
n» {n — l)
Voor mi = m2 = m = \ n is deze verdeling sjrmmetrisch t.o.v. fi en gaan de voorgaande formules resp. over in (11.4) en (11.5)
jM« = i « + 1 = W -t- 1
_ n{n — 2)
Als de altematieve hypothese Hi luidt, dat de waarnemingen niet aselect zijn, wordt tweezijdig getoetst. Wü men aüeen onderzoeken of de waarnemingen een (plotseüng of gdeideüjk) stijgend of dalend, of wel een cycüsch verloop vertonen, dan vindt ünks éénzijdige toetsing plaats, omdat men dan aüeen tot het verwerpen van Hg zal wiüen overgaan, als te weinig (lange) series optreden. Wil men nagaan, of er sneue periodieke fluctuaties (zonder verder verloop) zijn, dan toetst men rechts éénzijdig: men zal iïo immers aüeen wiüen verwerpen, als te veel (korte) series voorkomen. De toets is echter betrekkehjk ongevoeüg voor oscülaties, die tezamen met een stijgende, dalende of cydische trend voorkomen; men kan dan echter de serietoets op de opeenvolgende verschülen in U .4 gebruiken. 11.3.4. UITVOERING VAN DE TOETSING 11.3.4.1. Exacte todsing, tabel G In tabel G-1 zijn voor « < 39 en Wi < «ig < 20 (Wi ^ m^ de ünker kritieke waarden UL en de rechter kritieke waarden «u van u, die gelden 267
1 2
11.3
TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEKS
voor tweezijdige toetsing met a = 0,01 en 0,05 opgenomen (bij gebruik van deze tabel zijn mi en Wg verwisselbaar). In tabel G-2 vindt men deze kritieke waarden voor «ÏJ = «ij = J» en « = 10, 12, ..., 60 voor tweezijdige toetsing met a = 0,01, 0,02, 0,05 en 0,10. Toetst men tweezijdig met een drempelwaarde a, dan kan men dus tot het verwerpen van Hg overgaan indien «o ^ ^L («»**) ofug > Ug {a,n).
Bij éénzijdige toetsing dient men de drempelwaarden in de tabeüen G-1 en G-2 te halveren. Toetst men links éénzijdig, dan wordt Hg dus bij een drempelwaarde a verworpen als Ug < «£, (2a,») is. Toetst'men rechts éénzijdig, dan besluit men tot het verwerpen van Hg als Ug > Uj^ (2a,«) is. Voor de reeksen A t/m E in tabel ll.l is n = 20 en mi = m^. Toetst men voor elk dezer reeksen bij een 5% drempel de hjrpothese Hg, dat een aselecte volgorde aanwezig is, dan zijn volgens tabel G-2 de kritieke waarden UL = (>enug= 16. Op grond van de uitkomsten in tabel 11.3 komt men dan tot de volgende conclusies : A, B en C: Hg verwerpen, het aantal waargenomen series is dgnificant te laag, D: Hg verwerpen, het aantal waargenomen series is significant te hoog, E : Hg niet verwerpen. Voorbeeld 11.1. Uit: Statistical notes for malaria workers, WHO/HS/58, 1956. Tabel 11.5. Annual malaria morbidity per 1000 population, 1936-1951, Ceylon Jaar 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951
Rangnr.
Morbiditeit
Rangnr.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
522 403 352 543 572 533 534 348 265 390 412 196 109 99 81 58
12 10 8 15 16 13 14 7 6 9 11 5 4 3 2 1
«0 = 6
d'
d
-11 - 8 - 5
-11 -11 - 7 - 7 + 1
+ 3 + 1 0 + 7 + 9 + 11 + 13 + 15 Sd = 0
121 64 25 121 121 49 49 1 9 1 0 49 81 121 169 225 Ao = 1206
Onderstel, dat men de hypothese Hg toetst, dat in deze tijdreeks geen verloop optreedt, met als alternatief Ä^^, dat een dalend verloop aanwe268
DE SERIETOETS OP TWEE ASELECTE STEEKPROEVEN
11.3
zig is. Men kiest a = 0,05. Past men de serietoets toe, dan is «o = 6 met n = 16enwi = W2 = 8. Er dient ünks éénzijdig te worden getoetst. Uit tabel G-2 büjkt, dat Hg juist niet kan worden verworpen, daar «i (2a = 0,10) = 5. Past men echter de rangcorrelatietoets van SPEARMAN toe, dan is Rg = 1206 {rg = —0,77) met n = 16. Er dient rechts éénzijdig getoetst te worden (zie 10.7) en tabel N geeft dan als rechter kritieke waarde bij a = 0,01 : Rg = 1089 (deze tabel geldt voor tweezijdige toetsing, zodat deze waarde onder 0,02 wordt afgelezen). Rg is groter dan R^, zodat Ho bij een 1% drempel kan worden verworpen. Dit voorbeeld toont aan, dat de rangcorrelatietoets bij dit dalende verloop een veel groter onderscheidingsvermogen bezit dan de serietoets. 11.3.4.2. Normale benadering Voor niet te kleine en niet te veel mteenlopende mi en Wg kan men gebruik maken van het feit, dat de grootheid (11.6)
T = - ~ ^'' ff»
bij benadering standaardnormaal verdeeld is. Ook in dit geval is het gewenst een contimüteitscorrectie ter grootte van \ aan te brengen. Bij tweezijdige todsing neemt men dus : (11.7)
Tg =
'"•' ~ '"" I ~ ^
enP^(ro).
ff»
Bij links éénzijdige todsing: (11.8.1)
Tg= ''''~^" + ^enP^(ro), ff»
en bij rechts éénzijdige todsing: (11.8.2)
Tg = '''' ~ ^" ~ ^ , en Pg{Tg). ff»
11.3.5, TOEPASSING OP TWEE ASELECTE STEEKPROEVEN De serietoets kan ook worden gebruikt voor de toetsing van de hjrpothese HQ, dat de aselecte steekproeven JKI, X2, , *n, enyi, y2, , yn, uit dezelfde populatie stammen. In tegenstdüng tot de toets van WILCOXON voor twee aselecte steekproeven is de serietoets gevoeüg voor verschiUen van allerlei aard tussen de verdeUngen van x en y. Voorwaarde voor de toepasdng van de serietoets is, dat geüjke waarden van X eny bij uitzondering voorkomen. 269
I 1.3
TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSEEEKS
Voorbeeld 11.2. Wij beschouwen het volgende steekproevenpaar : Steekproef 1 : Xi \ 2 6 14 16 19 24 36 50 67 69 70 83 101 «1 = 13 Steekproef 2: yi 1 27 29 29 31 34 38 40 45 48 54 56 61 65 ( « j = 13
De waarnemingen worden nu in volgorde van grootte gerangschikt ; bij elke waarneming wordt aangegeven, tot welke steekproef zij behoort : x x x x x x y y y y y x y y y y x y y y y x x x x x 2 6 14 16 19 24 27 29 29 31 34 36 38 40 45 48 50 54 56 61 65 67 69 70 83 101
De toetsingsgrootheid u is het aantal series, bestaande mt opeenvolgende waarden van x of y, dat in deze naar grootte gerangschikte waarnemingsreeks voorkomt. Bij het voorbeeld is dus Ug = 7. Onder Hg volgt de grootheid u de in 11.3.3. behandelde kansverdeüng, met Wl = ni en Wj = «g. Indien Ho onjuist is en de steekproeven uit verschülende populaties afkomstig zijn, zal u in het algemeen lage waarden aannemen, zodat ünks éénzijdig wordt getoetst. Opmerking: Als bv. populatie 1 een lager gemiddelde bezit dan populatie 2, verwachten wij in de gerangschikte reeks van de waarnemingen o.m. een lange serie lage A;-waarden en een lange serie hoge jz-waarden, dus in deze trant : X X X X X X y x y y y y y 2 4 8 10 11 16 |18124|25 29 33 37 43 en dientengevolge een klein aantal series. Als de populaties een ongeveer gelijk gemiddelde hebben, maar duidelijk verscMUen in variabUiteit, zal het beeld van voorbeeld 11.2 optreden : hier vindt men eveneens relatief weinig series. VerschiUen in de vorm van de populatieverdelingen zuUen in het algemeen ook tot een te klein aantal series leiden.
Voor de uitvoering van de toetsing verwijzen wij naar 11.3.4. Voorbeeld 11.2 leverde op MQ = 7 met Wi = Wg = 13. Uit tabel G-2 büjkt, dat Hg bij een 1 % drempel kan worden verworpen. Als gelijke waarden van x en van y voorkomen, ontstaan moeiüjkheden bij het bepalen van het aantal series. Zijn er slechts weinig gelijken, dan kan men deze nog wel zo plaatsen, dat (a) zo weinig mogelijk, en (b) zo veel mogeüjk series ontstaan. Is Ug in beide gevallen significant, dan kan men Hg verwerpen. Is geen der Ug significant, dan kan men Hg niet verwerpen. Is Ug (a) wel en Ug (b) niet significant, dan kan men strikt genomen niet tot een uitspraak komen, hoewel men dan, als de steekproeven niet te klein zijn, wel weet dat men in het ongunstigste geval met een overschrijdingskans te doen heeft, die niet veel groter is dan a. 270
DE SERIETOETS OP VERSCHILLEN
11.4
11.4. De serietoets op de verschiUen tussen opeenvolgende waarnemingen 11.4.1. TOEPASSING
Deze toets kan worden gebruikt om de hjrpothese Hg te toetsen, dat een reeks waarnemingen een aselecte volgorde vertoont. In de regel zal men de toets toepassen met als altematieve hjrpothese Hi{a): de waamemingsreeks vertoont een geleidelijk stijgend (dalend) of een cycüsch verloop, dan wel met Hi{b) : de waamemingsreeks vertoont osdüatie. In tegenstelling tot de in 11.3 behandelde serietoets op de waarnemingen zelf is deze toets: («) nid gevoeüg voor een sprongsgewijze stijging (daüng), en (6) ook gevoeüg voor osdüatie, als deze tezamen met een regelmatig stijgend (dalend) of cycüsch verloop voorkomt. 11.4.2. DE TOETSINGSGROOTHEID
Men kent aan de «-1 verschiUen tussen de waarnemingen 2 en 1, 3 en 2, , i -\- 1 en *, , n en n— 1 een plusteken toe als i -|- 1 groter is dan i en een minteken als het tegendeel geldt. De toetsingsgrootheid y is het aantal series van opeenvolgende plussen of minnen. In tabel 11.6 is Vg bepaald voor de tijdreeksen in tabel 11.1. Tabel 11.6. Toepassing van de serietoets op verschillen tussen opeenvolgende waarnemingen op de gegevens in tabel 11.1 Reeks A B C D E
Dag 1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
+ - + + + + + + + + + + - + - + + + -+ - + - + - + - + - + + - + + + - + +
+ + + +
+ + + + + + + + - + +
+ + +
+ + -
+ + + +
+ + + +
+ + -
'^o 7 12 6 19 12
11.4.3. DE VERDELING VAN DE TOETSINGSGROOTHEID ONDER Hg
Onder Hg büjkt de grootheid y een verdeling te volgen met (11.9) en
^" =
(11.10)
'T»
^ 1Ä«i_90
90
271
11.5
TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEKS
11.4.4. UITVOERING VAN DE TOETSING
11.4.4.1. Exade toetsing, tabel H In tabel H zijn voor » = 11 t/m 40 de ünker en rechter kritieke waarden van y bij éénzijdige todsing met a = 0,01 en 0,05 gegeven. Toetst men Hg met als alternatief Hi{a) dan wordt ünks ééndjdig getoetst en beduit men tot het verwerpen van Hg, indien Vo < »L {a,n) is. Is het alternatief Hjif)), dan vindt rechts éénzijdige toetdng plaats, zodat Hg verworpen wordt indien Vg > Vg {a,n) is. Wij laten de interpretatie van de uitkomsten in tabel 11.6 aan de lezer over (merk echter op, dat de toets niet gevoelig is voor de sprongsgewijze stijging bij reeks 5). 11.4.4.2. Normale benadering Voor » > 40 is de groothdd (11.11)
T = - ~ ^' ff« bij benadering standaardnormaal verdeeld. Bij het gebruik van deze benadering kan weer een contimüteitscorrectie ter grootte van \ worden aangebracht. 11.4.4.3. Het optreden van gelijken Als twee opeenvolgende waarnemingen geüjk zijn, is hun verschü nul. Het aantal series kan dan niet meer ondubbelzinnig worden vastgesteld. Is echter het aantal nuüen klein, dan kan men ze eenmaal zodanig door plus- of mintekens vervangen, dat het aantal series maximaal wordt en een tweede maal zo, dat dit aantal minimaal wordt. Verkrijgt men beide keren een dgnificante uitkomst, dan wordt Hg verworpen. Zijn beide uitkomsten indgnificant, dan wordt Hg idet verworpen. Is de een het wel en de ander niet, dan kan men idet tot een uitspraak komen. Men weet dan echter wel, dat men op zijn ongunstigst met een uitkomst te doen heeft, die bijna dgnificant is. 11.5. De toets op de tekens van de opeenvolgende waarnemingen Deze toets (die wij kortweg de plus-min toets zuüen noemen) kan worden gebruikt als men de hjrpothese Hg wü toetsen, dat de reeks waarnemingen in aselecte volgorde staat, met als altematieve hjrpothese Hl, dat hij een regelmatig stijgend of dalend verloop vertoont. Deze toets is dus voor andere vormen van verloop niet gevoelig. Naar onze mening is de plus-min toets (waarbij aüeen een normale benadering ter beschikking staat) aüeen van bdang, als men voor een betrekkeUjk lange reeks waarnemingen snel wil onderzoeken, of van een gdeideüjk stijgende of dalende trend sprake is. 272
DE PLUS-MIN TOETS
11.5
De toetsingsgrootheid is het aantal plussen s in de reeks van verschiUen tussen de opeenvolgende waarnemingen. Voor de tijdreeksen in tabel 11.1 lezen wij uit tabel 11.6 af : Reeks «0
A 16
B 11
C 10
D 9
E 10
Onder Hg volgt de grootheid s een sjrmmetrische kansverdeüng met (11.12)
,,,=
n - 1
en (11.13)
o»
(11.14)
T =
12 (hierin is n het aantal waarnemingen). Voor niet te kleine n volgt onder Hg de groothdd -~'*'
bij benadering een standaardnormale verdeüng. Deze benadering kan worden verbeterd door het aanbrengen van een contimütdtscorrectie ter grootte van l. Bij een stijgend verloop zal men overwegend plussen, bij een dalend verloop overwegend minnen aantreffen. In de regel zal bij het gebruik van deze toets éénzijdige toetdng plaatsvinden. Luidt de altematieve hjrpothese, dat een geleidelijk dalend verloop optreedt, dan vindt ünks éénzijdige toetdng plaats. Houdt het altematief een gddddijk stijgend verloop in, dan dient rechts éénzijdig te worden getoetst. 20 l Voor aüe reeksen uit tabel 11.1 is » = 20, zodat ju, = — - — = 9,5 en 20-1-1 2 a,» = ——— = 1,75, a, = 1,3229. Het is zonder meer duideüjk, dat Hg niet kan worden verworpen voor de reeksen B, C, D en E. Voor reeks A levert de normale benadering op T 16 - 9,5 - 0,5 ^^ ^'>i:3229 ~'*'^Ondanks de betrekkeUjk kleine n kan men dus tot het verwerpen van Hg overgaan. 11.6. Keuze van een toets tegen verloop De vier toetsen tegen verloop in een waamemingsreeks, die in de voorgaande paragrafen zijn besproken, hebben alle als nulhjrpothese 273
11.6
TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEKS
dat de waarnemingen een aselecte volgorde vertonen. Het is echter reeds gebleken, dat de altematieve hypothesen min of meer verschülend zijn, d.w,z. de toetsen zijn met gevoeüg voor hetzelfde soort verloop, hoewd zij ook niet gehed onafhankehjk zijn daar zij elkaar gededteüjk 'overlappen'. Dit komt nog eens tot uitdrukküig in tabel 11.7, waarin voor elke toets is aangegeven welk altematief [welke soort(en) verloop] hij kan signaleren en op welke wijze dit geschiedt. Tabel 11.7. Overzicht van de verdehngsvrije toetsen tegen verloop in een waarnemingsreeks. Ho • de waarnemingen staan in aselecte volgorde
H i : de waarnemingen vertonen verloop
Rangcorrelatietoetsen 11.2
[Stijgend A. ,
gewijs
C. CycUsch
: omlaag
Pos. corr. Neg. corr.
X
^X, ^-v.
D. OsdUatie
1 Te weinig 1 1 series | 1 Te weinig 1 series
11.5
Te weinig series
"Il
1
B. Sprongs- 1
Te weinig series
Plus-min toets
11.4
11.3
jPos. corr. 1 Neg. corr. r omhooK
Toets Serietoets op Serietoets op waarneminverschiUen gen
v^
Te veel plus
Te weinig plus ^ ^| \ ^ ^^ ^ > .^
j\^^
Te weinig series
"X"
y^
^ ^
*^
1 Teveel 1 Te veel series 1 series |
\
V"--^
^"^
^^
^""^
^.-^
J>\
Bij de bespreking van deze toetsen hebben wij ze aüe op de vijf waarnemingsreeksen in tabd 11.1 toegepast. Wij konden daardoor met deze voorbeelden de verschiUen tussen de toetsen demonstreren. In werkeUjkheid kan men de volgende situaties onderscheiden: 1. Men toetst Hg met als altematieve hjrpothese Hi, dat de waarnemingen niet in aselecte volgorde staan, zonder dat men daarbij een spedfiek altematief kan aangeven. In dit geval verdient (tweezijdige) toepassing van de serietoets op de waarnemingen de voorkeur. 2. Men toetst Hg met een spedfiek altematief Hi, voortvloeiende uit theoretische overwegingen (mrf uit bestudering van de waarnemingsreeks zelf). Bv.: Men verwacht, dat bij toediening van een bloeddrukverlagend middel een geleideüjke daüng van de bloeddrak optreedt. Of: Men verwacht, dat op het geven van een anti-bioticum een plotseünge daüng van de üchaamstemperatuur volgt. Bij de navolgende Hi kieze men dan de daarbij vermelde toets(en) : a. Een gelddeüjk stijgend (resp. dalend) verloop: Een der rang274
11.6
KEUZE VAN EEN TOETS TEGEN VERLOOP
corrdatietoetsen (éénzijdig). Bij grote n kan men gemakshalve de plus-min toets gebruiken (geen rangnummering, geen rekenwerk). Men reaüsere zich echter, dat deze toets een kleiner onderscheidingsvermogen bezit dan de rangcorrelatietoetsen. Een sprongsgewijze stijging (resp. daüng): De serietoets op de waarnemingen (links éénzijdig) of een rangcorrelatietoets (éénzijdig). »
I
I
I
A. CYCLISCH VERLOOP MET OSCILLATIE (n=ï8)
H H H H H H H HJL L L L L L L u f l T ] »• ' ' . I . • . i i T* I H -
1
3
5
7
9
11
13
15 17
B. DALEND VERLOOP MET OSCILLATIE (n=16)
H H H H H H H I L H T I L L L L L L L •
1
•
•
•
'
'
'
•
11
13
15
Figuur 11.2. OsciUatie en cyclisch, resp. dalend verloop : A: Serietoets op de waarnemingen: «j = 4, Serietoets op de verschillen: c, = 16, B: Serietoets op de waarnemingen: «o = 4, Serietoets op de-verschillen: v, = 15.
275
11.7
TOETSEN TEGEN VERLOOP IN EEN WAARNEMINGSREEKS
c. Een cycüsch verloop: De serietoets op de waarnemingen (ünks éénzijdig). d. Osdüatie: De serietoets op de verschiUen (rechts éénzijdig). Bij 2.C verdient de serietoets op de waarnemingen de voorkeur boven de serietoets op de verschiUen, omdat bij het optreden van een cyclische trend mèt een zekere oscülatie de eerstgenoemde toets vrij ongevoeüg is voor deze osciUatie (zie figuur 11.2a). Bij 2.d is predes het omgekeerde van kracht, daar de serietoets op de verschiUen de osdüatie signaleert, ondanks het optreden van een stijgende, dalende of.cycüsche trend (zie figuur 11.2b). In de praktijk krijgt men soms te maken met een tjrpisch detectieprobleem, dat wü in dit geval zeggen: met een waamemingsreeks, waarvan men wü onderzoeken of er emg soort verloop (en zo ja, wdk verloop) optreedt. Als men dan de toets kiest op grond van het verloop, dat men waarneemt (of meent waar te nemen) en deze uitvoert bij een onbetrouwbaarheidsdrempd a, is de werkelijke onbetrouwbaarheid, door de selectie die reeds in deze keuze verborgen zit, niet meer geüjk aan a. Een altematief is, aüe toetsen achtereenvolgens op de waarnemingsreeks toe te passen. Deze handelwijze is eveneens niet zonder bezwaar, daar de toetsen niet onafhankehjk zijn [zover ons bekend, is echter de mate van afhankelijkheid nog niet (voldoende) onderzocht]. Past men dus noodgedwongen deze detectiemethode toe, dan moet men de uitkomsten van de toetsingen met reserve hanteren. 11.7. Opgaven 11.1.
Betreft opgave 2.1. 'Onderstel, dat de waarnemingen regel voor regel verkregen zijn. Toets de hypothese, dat de steekproef aselect is en kies a = 0,05.
11.2.
Als 11.1 maar voor opgave 2.2.
11.3.
Betreft opgave 10.6. Toets voor de beide waamemingsreeksen in deze opgave de hypothese, dat zij een aselecte volgorde vertonen met als alternatief, dat een stijgend verloop optreedt. Kies a = 0,01.
11.4.
Een steekproef heeft, in volgorde van trekking, elementen met de volgende waarden opgeleverd: 65,8 66,6 78,0 53,9 62,3 62,2 69,0 61.8 51,6 74,8 54,7 51,2 39,2 39,8 48,8 57,6 62,3 39,8 41,0 42,4 Toets de hypothese, dat de waargenomen volgorde aselect is, met als altematieve hjrpothese, dat te weinig series voorkomen. Kies a = 0,05.
11.5.
Gegeven zijn de twee volgende aselecte steekproeven : Steekproef 1: 55 64 67 68 68 70 72 74 Steekproef 2: 56 58 60 61 62 63 64 66 Toets de hypothese, dat deze uit dezelfde populatie stammen (kies daarbij o = 0,05) : a. Met de serietoets, 6. Met de toets van WILCOXON. Welk verschü bestaat er tussen deze toetsen?
276
KEUZE VAN EEN TOETS TEGEN VERLOOP
11.7
11.6. Onderstaande waarnemingen betreffen het hemoglobinegehalte (g%) van een arbeider, gemeten gedurende een jaar met tussenpozen van twee weken. Onderzoek, of deze waamemingsreeks een cyclisch verloop vertoont (a = 0,01) : Datum 4/4 Hgb. 12,2 Datum3/10 Hgb. 14,3
18/4 2/5 16/5 30/5 13/6 27/6 11/7 25/7 8/8 22/8 5/9 12,6 12.7 12,9 12,9 13.3 13.2 13,4 13.6 13,5 13,3 13,4 17/10 31/10 14/11 28/11 12/12 24/12 10/1 24/1 7/2 21/2 7/3 14,6 14,3 13,8 13,9 14,0 13,3 13,5 13.6 13,2 13,1 13,0
19/9 13,9 21/3 12,7
277
HOOFDSTUK 12
VERDELINGSVRIJE TOETSEN TEGEN VERLOOP IN STEEKPROEVEN 12.1. De toets van Terpstra voor k aselecte steekproeven 12.1.1. TOEPASSING
Deze toets kan worden gebruikt, als men beschikt over k aselecte steekproeven : 1. ^ 1 1 , * i g , Xi^, X 21» s i , X, '•'22» ' ' ' 2 3 »
•> * 2 n .
t.
Xii, Xi2, Xig,
•> ^*mi
"•
^ k l i ^ka> ^kS>
, Xm^
/Ê.
> ^Icnjc
en de hjrpothese iïo wil toetsen, dat deze uit dezelfde populatie (populaties met dezelfde verdeüng) afkomstig zijn, met als tegenhjrpothese Hl, dat zij uit verschülende populaties stammen die in de volgorde 1,2, 2,,...,k een stijgend of dalend verloop vertonen. Voorbeeld 12.1. Links in tabel 12.1 zijn opgenomen de hemoglobinegehalten in het serum van arbeiders, die (1) korter dan 1 jaar, (2) 3 tot 5 Tabel 12.1. Hemoglobinegehalte (in g%) van arbeiders in bedrijf Z Groep
Rangnummers
1
2
3
1
2
1
3
2
3
15,0 14,7 15,4 13,2 14,4 13,7 14,1
12,3 14,2 12,6 13,4 14,5
12,5 11.7 12,8 12,4 11,9 13,8
11 10 12 3 8 5 6
1 7 2 4 9
12 11 13 6 10 7 9
4 1 5 3 2 8
3 10 6 8 11
5 1 7 4 2 9
»», = 7
»2 = 5
«3 = 6
55 Si,,
38
28
278
23
68 Suz
23
^2,3
DE TOETS VAN TERPSTRA
12.1
jaar, en (3) 10 jaar of langer een zekere functie in bedrijf Z hebben vervuld. De te toetsen hjrpothese H^ Imdt, dat de gehalten van deze drie groepen toevalüg verschülen. De altematieve hypothese H i is, dat zij in de volgorde 1, 2, 3 een dalend verloop vertonen. Men kiest o. = 0,05. 12.1.2. DE TOETSINGSGROOTHEID
De toetsingsgrootheid is (12.1) w^yWi,i-^i^i, waarin Wi,j de toetsingsgrootheid van WILCOXON (zie 10. 5) is, toegepast op de waarnemingen van de steekproeven i en j . Het quotiënt achter het somteken (Üent dus te worden berekend voor alle paren steekproeven met » < j , die uit de k gegeven steekproeven kunnen worden gevormd. Is k = Z, zoals bij voorbeeld 12.1, dan zijn dit dus de paren (1, 2), (1, 3) en (2, 3). Bij 4 steekproeven neemt men de paren (1,2), (1, 3), (1, 4), (2, 3), (2, 4) en (3, 4). In het algemeen bedraagt het aantal paren ,, C* =
*
2l{k-2)\'
Uit (10.9) volgt, dat: Wi, j — n ^ j = 2«i«j + n i { n i + l) — 2Si,j — n ^ j = «<«j -I- Hi {ni -fl) — 2Si,j = ni{ni + nj-Jrl) — 2Si,j (waarin Si,j = de som van de rangnummers in steekproef», bij het vergehjken van de steekproeven i enj). Men kan dus voor (12.1) ook schrijven
_ y n i { n i + nj-\- 1) - 2g<,,
(12.2)
w= y
'
-
/_!
mnj
Voor de steekproeven in tabel 12.1 zijn rechts in deze tabel de rangsommen bepaald. Met (12.2) vindt men nu: ™ _ 7(7 + 5 + 1 ) - 2 ( 5 5 ) , 7(7-1-6-1-1)-2(68) , » T V s + ' 7 ^ 6 + 5(5 + 6 + 1) - 2(38) 5x6
19 35
38 16 = - 1,98. ^ 30
Als aüe steekproeven dezelfde omvang n bezitten, kan men schrijven:
^
(12.3) W
i<j
Wi,j
j,,j,
k(k
,^
1)
nk{k-ï){2n-^l)-4ESi,j «ƒ
2n» 279
12.1
TOETSEN TEGEN VERLOOP IN STEEKPROEVEN
Het is duidelijk, dat W podtieve waarden aanneemt bij een stijgend, en negatieve bij een dalend verloop in de steekproeven 1,2, ...,*. Voorbeeld. 12.2.
In tabel 12.2 zijn drie aselecte steekproeven van dezelfde omvang gegeven. Men toetst de hypothese Hg met als altematieve hypothese H i , dat een stijgend verloop in de volgorde 1, 2, 3 optreedt en kiest a = 0,05.
Tabel 12.2. Toepassing van de toets van TERPSTRA op drie aselecte steekproeven van dezelfde omvang Rangnummers
Steekproeven
3
2
3
1
5
2 3 4 6 8
7 9 10 11 12
1 2 3 4 6 11
5 7 8 9 10 12
54
27
51
1
2
3
1
2
1
141 146 150 169 178 182
163 171 175 176 179 193
177 180 183 185 191 197
1 2 3 5 9 11
4 6 7 8 10 12
31 Si,,
47
24
« = 6
Si,,
S u , + S i , , + S..3 = 31 + 24 + 27 = 82 =
S^S,,/
Uit (12.3) volgt voor deze steekproeven : Wg = 6 X 3 X 2 X (12 ++ 1) - 4 X 82 _ TO. = 1,944. 2(6)*
12.1.3.
VERDELING VAN DE TOETSINGSGROOTHEID ONDER H ^
Onder Hg volgt de grootheid W een bij benadering normale verdeüng met (12.4) ^^ = O en (12.5.1)
^w
l
k { k + l - 2i)» ^ L <-l
**<
1 i
******
Als aüe steekproeven dezelfde omvang n bezitten, gaat (12.5.1) over m
n E (12.5.2) 280
a„»
i-\
{k-^l-2i)»+^^^ 2
3n»
DE TOETS VAN TERPSTRA
12.1
Zo gddt bv. voor:
k-Z-a «
^ +^
R - ö . a^ -
3^jj
* = 5: a„,a =
k - A - a » - ^°^ + ^ Ä _ 4 . o«, -
40W+10 3 ^ ^
k = 6: V =
112«+21 * = ^= '^«' = — S ^ i ^
3^2 70» + 15 3^, 168»+ 28
^ = ^='^'^=
3»^ -
Uit het voorgaande volgt, dat de grootheid (12.6)
7
bij bena,dering standaardnormaal verdeeld is. Bij een stijgend (dalend) verloop zal T positieve (negatieve) waarden aannemen. 12.1.4. UITVOERING VAN DE TOETSING ZONDER GELIJKEN
Bij tweezijdige toetsing berekent men: r _ l^ol en verwerpt Hg met een onbetrouwbaarheid o, indien PD{Tg) < a is (tabel A). Toetst men Hg met als altematieve hjrpothese, dat een dalend verloop optreedt, dan vindt ünks éénzijdige toetsing plaats; men berekent dan To = Wg/ojy en verwerpt Hg als Pi(To) < a is. Luidt de altematieve hjrpothese, dat een stijgend verloop aanwezig is, dan wordt rechts éénzijdig getoetst en Hg verworpen als PR{Tg) < o is. Bij voorbeeld 12.1 dient ünks éénzijdig getoetst te worden. Wg = —1,98 en met (12.5.1) vindt men:
V =i
{3±^'^{3±^^{3±1^_^^^^_^^
*/7 + 0 + */. + V35 + V42 + V8o _ 278 _ 139 _ Q ^ ^ ^ 3 3 630 315 ajy = ^0,4413 = 0,664. Hieruit volgt: Tg = — 1,98/0,664 = — 2,98, met een ünkse kans die kleiner is dan 0,01, zodat Hg wordt verworpen en tot een sjrstematisch dalend verloop wordt gecondudeerd. 281
12.1
TOETSEN TEGEN VERLOOP IN STEEKPROEVEN
Bij voorbeeld 12.2 vindt rechts éénzijdige toetsing plaats. Wg = 1,944 en uit (12.5.2) volgt: 8» + 3 8 X 6 + 3 ^ JT^ VÏ7 = 0,6872, zodat fw ~ 36 3n» 3 X 36 Tg = 1,944/0,6872 = 2,83, met een rechtse kans die kleiner is dan 0,01. In dit geval wordt dus tot een sjrstematisch stijgend verloop geconcludeerd. aw» =
12.1.5. UITVOERING VAN DE TOETSING MET GELIJKEN
Per groep geüjken kent men - zoals gebruikeüjk - weer aan eüce waarneming een gemiddeld rangnummer toe. Fdteüjk zou men de spreiding van W dan moeten corrigeren, maar als het aantal (groepen) geüjken niet te groot is, büjkt deze correctie van geringe betekenis te zijn, zodat wij haar niet bespreken. 12.1.6. TOEPASSING OP STEEKPROEVEN UIT DICHOTOME POPULATIES
Wanneer de k aselecte steekproeven afkomstig zijn mt dichotome populaties, waarvan de dementen kenmerk A of kenmerk B dragen, kan de toets eveneens worden toegepast. De te toetsen hjrpothese Hg is dan, dat de steekproeven uit identieke dichotomieën stammen, met als altematieve hypothese H-^ dat zij uit dichotome populaties komen, waarvan de fractie P{A)i = Pi in de volgorde i = \ , 2 , 3 , ...,k een stijgend of dalend verloop vertoont. Men beschikt nu over gegevens van de volgende vorm : Kenmerk A B Steekpr.omvang
1
2
ni-xi
*2 n 2 - X2
«1
«8
Steekproeven » ...
...'
k
...
Xh Mft — Xh
...
«*
ni-Xi ...
«<
Men kan aantonen, dat dan formule (12.1) overgaat in K
W = Y^{k-{• \ -2i) *^1^:^
(12.7)
<-i
***
en dat men voor (12.5.1) kan schrijven (12.8)
a »= "'
282
A . R A ^ -' B ^
h
yy ((*^++ 1i -- 2»)« n{n — 1) »Z• =J1 «i
Totaal A =Zxt B =S{ni-Xi)
A +B = n
12.1
DE TOETS VAN TERPSTRA
Onder Hg volgt de grootheid T = W/oj^ voor luet te kleine «< volgens (12.6) bij benadering de standaardnormale verdeüng. De uitvoering van de toetdng verloopt dus verder, zoals deze in 12.1.4 beschreven is. Voorbedd 12.3. Onderstaande tabel betreft het voorkomen van folüculosis bij vier groepen kinderen, die beschouwd kunnen worden als aselecte steekproeven uit vier bevolkingsgroepen, die (gemeten volgens bepaalde criteria) van I tot en met IV in welstand afnemen^: T^*ollinilosî<î
Wd Geen Totaal
I 8 28 36
' Welstand II III 42 34 102 74 144 108
IV 16 20 36
fotâcil 100 224 324
Men wü bij een 5% drempel de hjrpothese Hg toetsen, dat de fracties folüculods in de vier bevolkingsgroepen gelijk zijn, met als tegen hjrpothese Hl, dat de fractie folüculods bij afnemende welstand toeneemt. Er vindt dus een rechts éénzijdige toetdng plaats. Volgens (12.7) is: H'. = ( 4 + l - 2 ) - g . + ( 4 + l
4)i^ + (4+.-6)^^
108
144
+ (4 + i - 8 ) ^ = .?i + i ^ - - Z l _ - : ^ = ^ '36 Met (12.8) vmdt men: (r^a =
36
144
108
100 X 224 (3)" _, (1)' I ( - 1 ) ' 324 X 323 36 108 144 100 X 224 X 223 324 X 323 X 432
36
^
+ 0,6898.
432
I (-3)=' 36
= 0,110490, (Tw' = 0,3324.
Hieruit volgt, dat Tg = 0,6898/0,3324 = 2,07 en uit tabel A blijkt dat Pg (2,07) = 0,0192, zodat Hg wordt verworpen ten gunste van H^. Opmerkingen 1. Voor twee aselecte steekproeven {k = 2) is de zojuist beschreven toets identi'ek aan de normale benadering voor de toets van FISHER met formule (9.10). 2. Voor k > 2en ni = 1 voor elke i is de toets identiek aan de rangcorrelatietoets van KENDALL. ^ Fictieve gegevens. Zie echter KAAIJK, Voeding en voedingstoestand van het schoolkind ten plattelande, 1955.
283
12.2
TOETSEN TEGEN VERLOOP IN STEEKPROEVEN
12.2. Toets tegen verloop voor k verwante steekproeven 12.2.1. TOEPASSING
De toets kan worden toegepast als men beschikt over k verwante steekproeven (elk met « waarnemingen) en de juistheid wü onderzoeken van de hjrpothese Hg, dat zij beschouwd kunnen worden als aselecte steekproeven uit populaties met dezelfde verdeüng, met als altematieve hypothese Hi, dat een dalend, resp. een stijgend verloop aanwezig is. De toets kan uitduitend éénzijdig worden uitgevoerd, zodat de richting van het verloop, waartegen Hg getoetst wordt, gegeven moet zijn. Voorbeeld 12.4. Bij acht arbeiders van een bedrijf Z heeft men het hemoglobinegehalte op 4 tijdstippen gemeten, en wel bij indiensttreding en 1,2 en 3 jaar nadien. De uitkomsten zijn ünks in tabel 12.3 opgenomen. De te toetsen hjrpothese Hg luidt, dat de vier reeksen waarnemingen uit dezelfde populatie stammen met als altematief Hi, dat een dalend verloop optreedt. Men kiest a = 0,05. Tabel 12.3, Hemoglobinegehalten (in g%) van 8 arbeiders op 4 tijdstippen Tijdstip van waarneming Arbeider
1 2 3 4 5 6 7 8
Bij m dienst Na 1 jaar treden (2) (1) 14,5 15,0 13,8 14,1 14,9 14,7 13,8 13,3 k=4
Rangnummers
Na 2 jaar
Na 3 jaar
(3)
(4)
1 2
13,8 14,3 12,6 13.4 14,1 14,0 12,6 13,0
13.7 14,2 12,4 13,0 14,3 14,1 12,3 12,8
4 4 4 4 4 4 4 3
14,0 14,1 13,0 13,9 14,5 14,5 12,8 13,4 n=8
3 1 3 3 3 3 3 4
3
4
2 3 2 2
1 2 1 1 1 2 1 2 2 1 2 1
31 23 15 11
12.2.2. UITVOERING VAN DE TOETSING
Op de verwante waarnemingen wordt eerst de toets van FRIEDMAN toegepast, d.w.z. men berekent: Kg («) met (10.6), alsÄ = 3 e n » < 9 , Ä = 4 e n « < 5 o f Ä = 5en « < 2, resp. Xg» («) met (10.7), voor grotere k en/of n. De tussen haakjes geplaatste n geeft aan, dat deze uitkomst het oorspronkeUjke rangnummerschema met n rijen betreft. Als Pg[Kg («)] > a (tabd K-l). resp. als Xo»{n) <X»i-,,{v = k - 1), wordt Hg niet verworpen. De overeenstemming tussen de rangnummers is dan immers niet dgnificant bij de gekozen onbetrouwbaarheids284
TOETS VOOR VERWANTE STEEKPROEVEN
12.2
drempel en dientengevolge heeft een verdere toetdng op een dalende, resp. stijgende trend geen zin. Als echter Pg[Kg («)] < a, resp. als Xg» {n) > z*i-a (v = Ä — 1) is, handelt men als volgt : a. Als Hl luidt, dat een dalend verloop optreedt, voegt men aan het rangnummerschema de rij k,k — l, , 2, 1 toe. b. Als Hl luidt, dat een stijgend verloop optreedt, voegt men aan het rangnummerschema de rij 1. 2, ,k — ï,k toe. Op het nu verkregen schema met n + 1 rijen past men eveneens de toets van FRIEDMAN toe. Men verkrijgt dan Kg {n + 1), resp. ^o*(*» + 1). ^0 kan dan worden verworpen met een onbetrouwbaarheid, die tussen ^a en a ligt, indien (12.9.1) resp. (12.9.2)
Pg[Kg{n-\-l)] Xg» («)].
Deze toets berust op de volgende fdten : 1. De groothdd K {XK') van de toets van FRIEDMAN verandert niet. als men de kolommen permuteert. 2. De verdeling van K {X^^) onder de hjrpothese Hg - die inhoudt, dat in iedere rangschikking (rij) aüe permutaties der rangnummers gelijke waarschijnüjkhdd bezitten en dat de rangschikkingen stochastisch onafhankelijk zijn - verandert niet. als men de kolommen permuteert. 3. Men kan dus de verdeüng van K onder Hg verkrijgen, door een schema van n rijen te beschouwen, waarvan elke rij bestaat uit de getallen 1, 2, , k, waarvan één rij vastligt (bv. in de volgorde 1. 2. ..., k), terwijl aüe permutaties van de overige rijen even waarschijnhjk en onderüng onafhankelijk zijn (zie 10.4.3). Hieruit volgt, dat incüen men aan een schema met n rijen waarvoor de hypothese Hg geldt de rij 1, 2, , k o i k , k — l, ,1 toevoegt, de groothdd K van het uitgebreide schema verdeeld zal zijn als de Ä van een schema met n + 1 rangschikkingen onder de hjrpothese Hg. Indien echter in het oorspronkdijke schema Hg niet geldt, maar een gemeenschappdijk stijgende trend aanwezig is, dan zal door de toevoeging van de rij 1, 2, , k de stijgende trend in de kolomtotalen versterkt worden, waardoor men kan verwachten dat er spoediger een significant resultaat zal optreden. Evenzo kan door toevoeging van de rij Ä, Ä — 1, , l een dalend verloop van de kolomtotalen versterkt worden.^ Passen wij de toets nu toe op voorbeeld 12.4, dan levert de toets van ^ Voor verdere bijzonderheden omtrent deze toets verwijzen wij naar memorandum S 47 (M 14) van het Mathematisch Centrum te Amsterdam.
285
12.3
TOETSEN TEGEN VERLOOP IN STEEKPROEVEN
op het oorspronkeUjke schema op (zie tabel 12.3) : Sj 31 23 15 11 ,? 20 20 20 20 Sj-S 11 3 -5 -9 zodat Kg {n) = E{Sj - S)» = {\ l)» + (3)** + (-5)* + (-9)* = 236 en hieruit volgt met (10.7) : FRIEDMAN
12 X 236 17,7. Er zijn 3 vrijhddsgraden en uit 8 X 4 X (4 + 1) tabel D blijkt, dat deze mtkomst een overschrijdingskans bezit in de buurt van 0,001. De toetsing wordt dus voortgezet, door aan de oorspronkdijke rangsommen de rij 4, 3, 2, 1 toe te voegen en opnieuw Xg» te berekenen : Sj{n) 31 23 15 11 4 3 2 1 26 17 12 Sj.{n-\-l) 35 22i S 22\ 2 2 | 22i Sj-5 \2\ 3è - 5 i - l O i Xg» {n) =
zodat üTo { n + \ ) = {\2\)» + {Z\)» + (-51)" + (-10^)« = 309. Hieruit volgt: 12 X 309 20,6. Daar X ^ (« + 1) groter is dan ^0* (« + 1) = 9x4x5 X ^ («) wordt Hg verworpen en luidt de condusie, dat de hemoglobinegehalten een dalend verloop vertonen. 12.3. Toetsen betrefiEende fe 2 x 2 tabeUen 12.3.1. TOEPASSING
Stel, dat men beschikt over Ä 2 x 2 tabeüen. Laat bv. de i' van deze tabeüen zijn: Steekproef 1 2 Categorie A
a i - \ - C i = ri bi + di = Si
ai
Ci
bi
di
at + bi
Ci + di
B
=
Ui
=
a i - \ - b i + Ci + di = ni
Vi
en noem de kans op categorie A in populatie 1 (waaruit de steekproef 1 stamt) Pii en de kans op categorie A in popiüatie 2 (waaruit de steekproef 2 stamt) Pgi- De toetsen, die wij hier behandelen betreffen de hythese Hg': P „ = P „ ( t = 1.2 ,k). 286
TOETSEN BETREFFENDE üT 2 X 2 TABELLEN
12.3
met als altematieve hjrpothese : A. H Î : de verschiUen P « — P^* hebben voor de verschiUende waarden van * overwegend hetzelfde teken, of B. H ^ : voor sommige waarden van i geldt P u < Pg^, voor andere P u > PziVoorbeeld 12.5. Bij een onderzoek van schoolkinderen in een bepaalde provinde werd voor - als aselect te beschouwen -steekproeven van j ongens en meisjes van 8 t/m 12 jaar (8 jaar = 95, 96 en 97 maanden, 9 jaar = 107, 108 en 109 maanden, enz.) vïistgesteld, hoe frequent een bepaalde afwijking A was. Hierbij werden de volgende 2 x 2 tabeüen verkregen:
Afwijking j
+
8 jaar M J 40 26 66 160 74 234 200 100 300 11 jaar M J 19 53 72 81 147 228 100 200 300
9 jaar M J
8 16 24 62 64 126 70 80 150
10 jaar M J 12 30 42 68 90 158 80 120 200
12 jaar M J 27
32 128 35 93 40 120 160 Noem de kans op het voorkomen van afwijking A bij de kinderen van 8 jaar: voor de meisjes P u en voor de jongens Pj^; bij de kinderen van 9 jaar: voor de meisjes Pi^ en voor de jongens Pgj, enz. De te toetsen hjrpothese luidt Hg' : P u = Pgt. d.w.z. voor elke leeftijdsgroep is de kans van afwijking A voor de meisjes geüjk aan die voor de jongens (deze kans kan echter van leeftijdsgroep tot leeftijdsgroep verschillend zijn). Als altematieve hjrpothese i ï / kan men kiezen : A. De verschiUen P u — Pg, hebben overwegend hetzdfde teken. d.w.z. er is in de vijf leeftijdsgroepen een systematisch verschil in dezelfde richting tussen de kans op het voorkomen van afwijking A bij meisjes en bij jongens. Figuur 12. IA geeft een voorbeeld van zo'n verschü. waarbij tevens de kans van afwijking A stijgt met toenemende leeftijd. B. P u 9^ Pjj, waarbij het teken van P u — P^^ niet voor alle i's hetzelfde behoeft te zijn. D.w.z. üi sommige leeftijdsgroepen kan de kans op het voorkomen van A bij meisjes groter zijn dan die bij jongens, in 287
TOETSEN TEGEN VERLOOP IN STEEKPROEVEN
12.3
sommige kunnen deze kansen gelijk zijn en in sommige kan de kans bij mdsjes kleiner zijn dan de kans bij jongens. Figuur 12. IB geeft van een dergdijke stituatie een beeld. P(+)
P(+) B
02
Q2
0.1
01
8 9 10 11 Leeftijdsgroepen
8
12
9
10 11
12
Leeftijdsgroepen
Figuur 12.1. Verloop van de kansen op het voorkomen van afwijking A bij jongens en meisjes onder de altematieve hypothese A en B (zie tekst). Fictieve gegevens. 12.3.2. DE T O E T S I N G S G R O O T H E I D , H A A R V E R D E L I N G O N D E R JEfo' EN UIT-
VOERING VAN DE TOETSING
Alternatieve hypothese A In dit geval berekent men : (12.10) ^ '
M g ^ y - ^ { a i - a i ) = f^^!^^^ Z J «<Wi ' A J UiVi i=-l
i-l
(a, = ^ ) . ni
Onder Hg' is de groothdd M bij benadering normaal verdeeld met gemidddde nul en variantie k
(12.11)
Z J UiVi («< — 1) '
zodat de grootheid (12.12)
T =
M Ou
dan bij benadering standaardnormaal verdeeld is. Bij tweezijdige toetdng zal men tot het verwerpen van Hg' overgaan, indien Pj, {Tg) < a. Toetst men Hg' met als altematieve hypothese, dat 288
TOETSEN BETREFFENDE K 2x2 TABELLEN
12.3
de verschülen P u — Pg^ overwegend positief zijn, dan toetst men rechts éénzijdig, zodat Hg' verworpen wordt indien Pg {To) < a is. Lmdt het altematief. dat de verschiUen P u — Pg^ overwegend negatief zijn, dan vindt ünks éénzijdige toetdng plaats en wordt Hg' verworpen indien P i (To) < a is. Voor de 5 vierveldentabellen in voorbeeld 12.5 vindt men met ( 12.10) : Mg =
8 X 150- 2 4 X 40 X 300 - 66 X 200 200 X 100 •^ 70 X 80
+
19 X 3 0 0 - 7 2 X 100 + 100 X 200
1 6 0 -• 32 X 40 40 X 120 - 0,0600 -- 0,0857 — 0,1000 - (D.0750 -- 0 , 1 0 0 0 = - 0 ,,42(
+
=
12x200--42x80 80 X: 120
'"+
5x
Uit (12.11) volgt: a= 66 X 234 ""^ ~" 200 X 100 X 299
24 X 126 70 x 80 X 149
42 X 158 80 X 120 X 199
_ 7 2 X 228 3 2 X 1 2 8 ^ 100 X 200 X 299 ^ 40 X 120 x 159 a „ = 0,1334. Hieruit volgt: Tg = —0,4207/0,1334 = —3,15. Er dient tweezijdig te worden getoetst en uit tabel A büjkt: 0,01 > Pp (—3,15) > 0,001, zodat Hg' bij een 1% drempel kan worden verworpen. De conclude luidt dus, dat de verschülen P u — P ^ overwegend een negatief teken bezitten, d.w.z. dat voor de beschouwde leeftijdsgroepen bij de meisjes een kleinere kans op het voorkomen van afwijking A aanwezig is dan bij de jongens.^ Alternatieve hypothese B Bij deze altematieve hjrpothese is de toetsingsgrootheid (12.13) Xr» = Xi» + X2»+...+X^» *
/ 1
1
1
1
= 2 (l«.-«.l-i)M—+ -^ + —+ 4<=i \ a« Pi Yi Oi 1 Door VAN EEDBN (82) worden nog een tweetal andere mogelijke toetsingsgrootheden besproken. In deze publicatie is: iVj = «j, »MJ = MJ en »j = Vj.
289
12.3
TOETSEN TEGEN VEELOOP IN STEEKPROEVEN
( |g<Wf — Uiri I — ni/2)»ni UiVfTiSi f=l
waarin, zoals reeds direct büjkt, X^* de toetsingsgrootheid is van de x^benadering van de toets van FISHER [volgens (9.14)], bij toetsing van de hjrpothese Hg:Pi = Pg voor de i* 2 x 2 tabel. Onder Hg' volgt de grootheid XJ-» bij benadering een ;u2-verdeüng met k vrijheidsgraden, zodat men deze hjrpothese bij een drempelwaarde a verweipt, indien büjkt
datXr»>x\-cciv = k)is. Om te demonstreren hoe de berekeningen verlopen, passen wij deze toets ook op voorbeeld 12.5 toe. Bij rechtstreekse berekening via «< en de randfrequenties vindt men : ^ JJ ^ (40 X 300 - 200 X 66 + 300/2)' 300 ^' ~ 200 X 100 X 66 X 234 ,
(8 X 150 - 70 X 24 + 150/2)« 150 , 70 X 80 X 24 X 126
+
(5 X 160 - 40 X 32 + 160/2)' 160 40 X 120 X 32 X 128
1,071 + 1,453 + 2,322 + 1,665 + 1,302 = 7,813. Voor de afzonderüjke 2 x 2 tabeüen vindt men de onderstaande verwachte frequenties : 8 jaar
M J Afwijking
+
44 22 156 78
9 jaar
M
J
11,2 12,8 58,8 67,2
10 jaar
11 jaar
12 jaar
M
M J
M J
J
16,8 25,2 63,2 94,8
24 48 76 152
8 24
32 96
Berekent men Xg» met (9.14) voor de eerste tabel (8 jaar), dan is: Zo' = ( 140 - 44 I - i)» (V^ + Vi56 + V22 + Vvs) = 1.071. Doet men dit eveneens voor de andere 2 x 2 tabeüen en sommeert men de uitkomsten, dan vindt men eveneens: Xj.» = 7,813. De grootheid Xj.» volgt hier onder Hg' bij benadering een %'-verdeüng met 5 vrijheidsgraden. Uit tabel D leest men af: ;f'o,96 (v = 5) = 11,07 en daar de waargenomen uitkomst beneden deze kritieke waarde ligt, wordt Hg' niet verworpen. 290
12.4
T O E T S E N B E T R E F F E N D E K 2 X 2 TABELLEN
12.4. Opgaven 12.1. Bewijs, dat voor Ä = 2 de (normale benadering van de) toets van T E R P STRA overgaat in de toets van WILCOXON.
12.2. De volgende tabel bevat de letale dosis (minus 50 eenheden) van een gift, verkregen bij langzame intraveneuze injectie bij katten en gemeten bij 4 verschillende injectiesnelheden t o t het moment van de hartstilstand [naar SNEDECOR (49)].
Inj. snelh. mg/kg/min 1000 (*) 1 9 11 13 2 15 22 25 4 30 34 38 8 51 56 59
Letale dosis — 50 (y) 14 27 40 63
16 28 46 70
17 28 50 71
20 37 58 73
22 40 60 76
28 42 60 89
31 46 65 92
Pas op deze gegevens de toets van TERPSTRA toe (a these toetst n en met welke tegenh3rpothese?
Hy
Zy'
181 310 481 700
3741 10480 24505 50981
0,05). Welke hypo-
12.3. Een aselçcte steekproef van 40 kinderen van 9 jaar uit een zekere populatie van 9-jaxige kinderen wordt naar de voedingstoestand (volgens dieetopname) gespütst in de categorieën: onvoldoende, mat%, voldoende en goed. Bij deze kinderen werden de volgende waarden van Carotinoiden (y per 10 CC serum) waaigenomen (fictieve gegevens) : 1. Onvoldoende 2. Matig 3. Voldoende
3,8 3,9 4.9 3,9 4,8 5,9 4,1 4,7 6,3 8,7 8,8 9,1 4. Goed 4,6 5,7 6,7 Analyseer deze uitkomsten. Kies a
5,8 6,4 6,3 6,5 6,8 6,9 9,7 10,8 8,7 9,4 = 0,05.
7,8 7,7 7,1 11,1 11,3
8,6 9,8 7,3 12,4 12,6
10,5 8,2 12,8 12,9 15,3
12.4. Onderstaande waarnemingen betrefien de lichaamstemperatuur van 6 personen, gemeten op vrijdag t e 9.00 uur in 7 achtereenvolgende weken. Toets (met a = 0,01) de hjrpothese, dat de waargenomen verschillen tussen de weken toevallig zijn met als altematieve hypothese, d a t een stijgend verloop optreedt: Pers.
Opeenvolgende weken
nr
I
2
3
4
5
6
7
1 2 3 4 5 6
36,27 35,90 35.78 35,95 35,81 35,70
36,20 36,04 35,85 35,74 35,99 35,49
36.47 36,18 35,70 36,26 35,97 35,78
36,54 36,12 36,10 36,10 36,08 35,68
36,58 36,17 36,23 36,31 36,17 36,00
37,00 36,40 36,20 36,20 36,28 35,88
37,12 36,22 35,98 36,24 36,25 35,93
291
12.4 12.5.
TOETSEN TEGEN VERLOOP IN STEEKPROEVEN Uit: N.T.v.G., 100 (1956), 1280-1283.
Tabel I I I . Neonatale sterfte van prematuur geborenen in Utrecht, 1950 t/m '54 Gewicht (gr)
In de kliniek geboren
In de stad geboren
Aantal
Overleden
pet
Aantal
Overleden
pot
500-1000 1001-1500 1501-2000 2001-2500
3 31 64 152
2 15 8 6
67 48 13 4
15 22 71 90
14 13 11 7
93 59 16 8
Totaal
250
31
12,7
198
45
23,0
Men trekt uit deze tabel de volgende conclusie : 'Er bUjft een aanzienhjk verschü bestaan tussen in de kliniek en in de stad geboren premature kinderen, en wel ten gunste van de eerste groep.' Tot welke uitspraak omtrent het verschü in sterfte bij de in de kliniek en de in de stad geboren premature kinderen komt u bij statistische analyse van de gegevens in deze tabel? Vermeld de getoetste en de altemanatieve hypothese. Toetst u één- of tweezijdig?
292
BIJLAGE I -
TABELLENVERZAMELING
A. 1. Linkse kansen van de standaardnormaal verdeelde grootheid T r = 0,00 (0,01)2,99 2. Idem, r = 3,0 (0,1) 6,9 B. Fractielen van de standaardnormaal verdeelde grootheid T C. Fractielen van STUDKNT-verdelingen (t) D. Fractielen van Z«-verdeUngen E. Fractielen van de verdeling van de correlatiecoëf&ciënt r voor e = O F. Fractielen van F-verdelingen 1. i^o,» 2. Foou 3. Fo',00 4. Fo,ooi G. De serietoets op de waarnemingen 1. -Linker en rechter kritieke waarden van M bij tweezijdige toetsing, »»1 5é »«2, a = 0,01 en 0,05 2. Linker en rechter kritieke waarden van « bij tweezijdige toetsing en mi = »n, = i»»,a = 0,01,0,02, 0,05en0,'l0 H. De serietoets op verschülen tussen opeenvolgende waarnemingen. Linker en rechter kritieke waarden van v bij éénzijdige toetsing, a = 0,01 en 0,05 I. De tekentoets Linker kritieke waarden van x bij tweezijdige toetsing, a = 0,01, 0,02, 0,05en0,10 " J. De rang-tekentoets (symmetrietoets van WILCOXON) Rechter kritieke waarden van V bij tweezijdige toetsing,, a = 0,01, 0,02, 0,05 en 0,10 K. De toets van FRIEDMAN (methode der m rangschikkingen) 1. Exacte rechtse overschrijdingskansen van K voor kleine waarden vanÄen« 2. Rechterkritiekewaardenvan|f, a = 0,05 L.
294 295 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309
De toets van WILCOXON
Linker en rechter kritieke waarden van W bij tweezijdige toetsing, a = 0,01, 0,02,0,05 en 0,10 310 M.
De toets van KRUSKAL & WALLIS
Exacte rechtse overschrijdingskansen van Xg» voor Ä = 3 en kleine steekproeven 311 N. De rangcorrelatietoets van SPEARMAN
Linker en rechter kritieke waarden van R bij tweezijdige toetsing, a = 0,01, 0,02,0,05 en 0,10 312 O. De rangcorrelatietoets van KENDALL
Rechter kritieke waarden van S bij tweezijdige toetsing, a = 0,01, 0,02, 0,05en0,10 .' 313 P.
De toets van HARTLEY
Rechter kritieke waarden van de grootheid Fmax = s'maxis'min. a = 0,01 en 0,05 Q. Aselecte getaUen R. Pseudo-normaal verdeelde modelpopulatie S.
314 315 316
Toets van KOLMOGOROV-SMIRNOV
Kritieke waarden van D bij tweezijdige toetsing, a = 0,01, 0,05, 0,10, 0,15en0,20 317
293
T A B E L A - 1 . L I N K S E KANSEN VAN D E S T A N D A A R D N O R M A A L V E R D E E L D E G R O O T H E I D T
T ^ * -1*
PUT)
a
r= x-n a
0,00 0,08 0,09 0,01 0,02 0,06 0,07 0,03 0,05 0,04 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 + 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 + 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 0,2 0.5793 0,5832 0,5871 0,5910 0,5948 0,5987 0.6026 0,6064 0,6103 0,6141 + 0.3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0.3483 0.3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 + 0.3446 0,3409 0,3372 0,3336 0.3300 0,3264 0,3228 0,3192 0,3156 0,3121 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 + 0,2776 0,3085 0,2912 0,2877 0,2843 0,2810 0,3050 0,3015 0,2981 0,2946 0,5 + 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 + 0.2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 0.6 + 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0.7454 0,7486 0,7517 0,7549 + 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 + 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0.8078 0,8106 0,8133 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 0,9 0.8159 0,8186 0.8212 0,8238 0,8264 0,8289 0,8315 0.8340 0,8365 0,8389 + 0,1587 0,1562 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 1,0 + 0,8413 0,8438 0,1539 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0.8599 0,8621 + 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 1,1 0.8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 + 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 + 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 + 0.0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 1.4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0.9279 0,9292 0,9306 0,9319 + 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0.0582 0,0571 0.0559 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 + 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 1,6 + 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 + 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 1,7 + 0,9554 0,9564 0,9573 0,9582 0^,9591 0,9599 0,9608 0,9616 0,9625 0,9633 + 0,0359 0,0351 0,0344 0,0336 0,0329 0.0322 0,0314 0,0307 0,0301 0,0294 1,8 + 0.9641 0,9649 0,9656' 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0.9706 + 0.0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 1.9 + 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 + 0,0228 0,022? 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 2,0 + 0,9772 0,9778 0,9783 0,9788 0,9793 0.9798 0,9803 0,9808 0,9812 0.9817 + 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 2,1 + 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0.9850 0,9854 0,9857 + 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0.0116 0,0113 0,0110 2,2 + 0.9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 + 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 2.3 + 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0.991! 0,9913 0,9916 + 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 2,4 + 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 + 0,00621 0,00604 0,00587 0,00570 0.00554 0,00539 0,00523 0.00508 0,00494 0.00480 2.5 + 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0.99492 0,99506 0,99520 + 0,00466 0,00453 0,00440 0,00427 0.00415 0,00402 0,00391 0,00379 0.00368 0.00357 2,6 + 0,99534 0,99547 0.99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643 + 0,00347 0,00336 0,00326 0,00317 0,00307 0.00298 0,00289 0,00280 0,00272 0,00264 2.7 + 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736 + 0,00256 0,00248 0,00240 0,00233 0,00226 0,00219 0,00212 0,00205 0,00199 0,00193 2,8 + 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807 0,00187 0,00181 0,00175 0,00169 0,00164 0,00159 0,00154 0,00149 0,00144 0,00139 2,9 + 0.99813 0.99819 0.99825 0.99831 0.99836 0.998
+
0,0
+ +
0,1
+
0,3
+
0,4
+
+ +
+
0,5 0,6 0,7 0,8 0,9 1,0
+ +
1,1
+ +
1.3
+
1,5
+
U i t : PEARSON en HARTLEY, Biometrika tables for statisticians. Vol. 1, (74).
294
0,2
1,2
1,4
1,6 1,7 1,S 1,9 2,0 2,1 2,2 2,3 2,4 2,6 2,6 2,7 2,8 2,9
TABEL A-2. L I N K S E KANSEN VAN D E STANDAARDNORMAAL VERDEELDE GROOTHEID T
T3 4 5 6
PL(T)
a
+ + + +
0,0 0,00135 0,99865 0,0*317 0,9*683 0,0*287 0,9*713 0,0*987 0,9*013
0,1 0,2 0,0*968 0,0*687 0,9*032 0,9*313 0,0*207 0,0*133 0,9*793 0,9*867 0,0*170 0,0'996 0,9*830 0,9'004 0,0*530 0,0*282 0,9*470 0,9,*718
0,3 0,0*483 0,9*517 0,0*854 0,9*146 0,0'579 0,9'421 0,0*149 0,9*851
0,4 0,5 0,6 0,7 0,8 0,9 0,0*337 0,0*233 0,0*159 0,0*108 0,0*723 0,0*481 0,9*663 0,9*767 0,9*841 0,9*892 0,9*277 0,9*519 0,0*541 0,0*340 0,0*211 0,0*130 0,0*793 0,0*479 0,9*459 0,9*660 0,9*789 0,9*870 0,9*207 0,9*521 0,0'333 0,0'190 0,0'107 0,0'599 0,0»332 0,0*182 0,9'667 0,9'810 0.9'893 0,9»401 0.9«668 0,98818 0,0i«7770,0i»4020,0"2060,0i«1040,0"523 0,0"260 0,9"223 0,9"598 0,9"794 0,9i»896 0,9"477 0,9"740
Voorbeeld: T = - 4 , P i ( - 4 ) = 0,0000317; T = +4, Pi:,(+4) = 0,9999683.
TABEL
B
FRACTIELEN VAN D E STANDAARDNORMAAL VERDEELDE GROOTHEID T
Opp. link.«
T
vanr 0,0001 0,0002 0,0003 0,0004 0,0005 0,001 0,002 0,003 0,004 0,005 0,006 0,007 0,008 0,009 0,010 0,015 0,020 0,025 0,030 0,035 0,040
Opp. links van
r -3,719 -3,540 -3,432 -3,353 -3,291 -3,090 -2,878 -2,748 -2,652 -2,576 -2,512 -2,457 -2,409 -2,366 -2,326 -2,170 -2,054 -1.960 -1,881 -1,812 -1,751
T
^ 0,045 0,050 0,055 0,060 0,065 0,070 0,075 0,080 0,085 0,090 0,095 0,100 0,120 0,140 0,160 0,180 0,200 0,220 0.240 0,250 0,260
-1.695 -1,645 -1,598 -1,555 -1,514 -1,476 -1,440 -1,405 -1,372 -1.341 -1,311 -1,282 -1,175 -1,080 -0,994 -0,915 -0,842 -0,772 -0,706 -0,6745 -0,643
Opp. [inks van T
r
0.280 0.300 0,320 0,340 0,360 0,380 0.400 0.420 0.440 0,460 0,480 0,500 0,520 0,540 0,560 0,580 0,600 0,620 0.640 0,660 0,680
-0,583 -0,524 -0,468 -0,412 -0,358 -0,305 -0,253 0,202 -0,151 -O.IOO -0,050 0,000 0.050 0.100 0,151 0,202 0,253 0,305 0,358 0,412 0,468
Opp. links van
r T
0.700 0,720 0,740 0,750 0,760 0,780 0,800 0,820 0,840 0.860 0,880 0,900 0.905 0,910 0,915 0,920 0,925 0,930 0,935 0,940 0,945
T
Opp. links van T
T
0,950 0,955 0.960 0.965 0.970 0.975 0.980 0,985 0,990 0,991 0,992 0,993 0,994 0,995 0,996 0,997 0,998 0,999 0.9995 0.9996 0,9999
1.645 1.695 1,751 1,812 1,881 1,960 2,054 2,170 2,326 2,366 2,409 2,457 2.512 2.576 2,652 2.748 2.878 3,090 3,291 3.353 3.719
0,524 0,583 0,643 0.6745 0.706 0,772 0,842 0,915 0,994 1,080 1,175 1,282 1,311 1.341 1.372 1.405 1,440 1,476 1,514 1,555 1,598
Uit: WALKER en LEV (35).
295
TABEL C. FRACTIELEN VAN STUDENT-VERDELINGEN V
'o,7B
1 2 3 4 5
"Cr
^0,99
^0,995
^0,999
(/)
^0,9996
V
'o,90
^0,95
1,000 0,816 0,765 0,741 0,727
3.078 1,886 1,638 1,533 1,476
6,314 2,920 2,353 2,132 2,015
12,706 4,303 3,182 2,776 2,571
6 7 8 9 10
0,718 0,711 0,786 0,703 0,700
1,440 1,415 1,397 1,383 1,372
1,943 1,895 1,860 1.833 1,812
2,447 2.365 2,306 2,262 2,228
3,143 3,707 2,998 3,499 2,896 3,355 2,821 3,250 2,764 3.169
5,208 4,785 4.501 4,297 4,144
5,959 5.408 5.041 4,781 4,587
6 7 8 9 10
11 12 13 14 15
0,697 0,695 0,694 0,692 0,691
1,363 1,356 1,350 1,345 1,341
1,796 1,782 1,771 1,761 1,753
2.201 2.718 3,106 2,179 2,681 3,055 2,160 2,650 3,012 2.145 2.624 2.977 2,131 2.602 2,947
4,075 3,930 3,852 3,787 3.733
4,437 4,318 4,221 4,140 4,073
11 12 13 14 15
16 17 18 19 20
0,690 0,689 0,688 0,688 0,687
1,337 1,333 1,330 1,328 1.325
1,746 1,740 1,734 1,729 1,725
2.120 2,110 2,101 2,093 2,086
2,583 2,921 2,567 2,898 2,552 2,878 2,539 2,861 2,528 2,845
3,686 3.646 3,610 3,579 3,552
4,015 3,965 3,922 3,883 3,850
16 17 18 19 20
21 22 23 24 25
0.686 0,686 0,685 0,684 0,684
1,323 1,321 1,319 1,318 1,316
1,721 1,717 1,714 1.711 1,708
2.080 2,074 2,069 2,064 2,060
2,518 2,831 2,508 2.819 2,500 2,807 2.492 2,797 2,485 2,787
3,527 3,505 3,485 3.467 3,450
3,819 3,792 3,767 3,745 3,725
21 22 23 24 25
26 27 28 29 30
0,684 0,684 0.683 0,683 0,683
1,315 1,314 1.313 1,311 1,310
1,706 1,703 1,701 1,699 1,697
2.056 2,479 2,779 2,052 2,473 2,771 2,048 2,467 2,763 2,045 2,462 2,756 2,042 2,457 2,750
3,435 3,421 3,408 3,396 3,385
3,707 3,690 3,674 3,659 3,646
26 27 28 29 30
40 60 120
1,303 1,296 1,289 1,282
1,684 1,671 1,658 1,645
2,021 2,000 1,980 1.960
2,423 2,704 2,390 2,660 2.358 2,617 2,326 2.576
3,307 3,232 3,160 3,090
3.551 3,460 3.373 3,291
40 60 120
CX3
0,681 0,679 0,677 0,674
PR
0,25
0,10
0,05
0.025 0.01
0.005
0,001
0,0005
PR
PD
0,50
0,20
0,10
0,05
0.01
0,002
0.001
PD
31.821 63.657 318,31 636,62 6.965 9,925 22,326 31,598 4,541 5,841 10,213 12,924 3,747 4,604 7,173 8,610 3,365 4,032 5,893 6,869
0,02
Uit: Biometrika tables f or statisticians (74).
296
1 2 3 4 5
CX)
»o ^
CO o> o — CN co • * U5 NO ^s 00 O
N . lO 00 lo r^ t~ CN IQ f^ 00 •* c> oo co r« C N . " sO vO — uj N CN t~ 00 ^o o CN CN c^ ocj co CN •* lO ^ co_ — co m CN C M n — vO o co o cd c> CN •*" vo" t C Cï^ ^* — — — CN CN CN CN CN CN C M ^ 00 O O co 00 in c> 00 t^ o o^ c> — tN c> CO vo in • * t ^ m co 00 in o — — o 00 tn 00 00 t^ incN c> in — r^ co 00 co 00 vd oc> o " —" CN t^^ ö" CN •* - ó 00 o — CN CN CN N CN CN CN co co u j o m t^ vo CN m o ^o o in t^ 00 — 00 co — Tj- r,, 00 t^ vo o CN — co •* t^ ^O CN co CN O ; 00 ^ o vO CN ts. CN ^o_ —_ in ^ o ^ . - c o i n vo'od .^\d t C o C o CN CN CN CN co (N •* ^ 00 00 co CN co c^ — 00 -«if CN co o — CN co vO 00 co N so r^ vO — m t^ t~- in •^ co 00 ^o co o vO —• vO — >q p •* 00 CN in IN c> —" cd in \ d o d c > - - C N - ^ i n N O c d « « « _ CN CN CN CN CN CN ^ co CN to co m" fC
O --cNcO'^ioUor^.oopc^ CNCNCNCNCNCNCNCNCNCO
CN o CN o lO ^ 00 00 o o CN vO co CN co o o m o, — CN — CJ^ vO (N r> CN m ^ c> co co t% pt^. co 00 co r>; CN t~ — vo_ » c> ö CN co in in 00 c> —" CN •^"in m in i co ^ ^ ^ ^ •^ -sf -^ m m 1 co ^O CN ^~ 00 ^o CN ^ —« ^O »— 00 00 ' o^ co t^v >g ~ in 00 o o o 00 in CN i c^ co ^ CN t^ " m o •* r^* — m o •* m" tC oc> c> rc3 CN co co co co co co ' in m in O c^ in »- vO CN C> 00 o •* CN co 00 00 CN ^» co c> o o o c^. co CN cd •* vd 1^" oo' o " -"" CN •* invo" •* •* in co co co co co co ^ ^ ^ "^ o^ co CN CO lO vO f». O co O^ 00 o >o co o Tj* 00 CN Tf m o r^ sO i n ••4' . - o^ o vo O CO ^ O co *û o CN i n 00 — o " o " CN co" in" so" t-." oo" cS —" "in sdf^ CN co co co co co co co • * - *
I-t
c> 00 CN >^
Tf 00 m 00 • * f. o vO f» >o o • * >0 00 o —" CN" CO" •*" vd'
co 00 in od
co o 00 c>
o CN CN — CN m — — — 00 i n -H co • * • * oc> c> —_ co o CN • * —" CN cd •*" i n vd 00 cïv
- . co • * co 00 CN cN^co m f^odc>
vO -< i n 00 >o t ^ o"—"
in tn •*t o"
sO >o ^ —< co vO Tl« co CN — 00 so m m ^ co co co co co CO_ co co co cO —" cd
00 •* — cd
co • * — CN f.-* cd —
in o — CN"
o o o cd
c> — NO • * r^ 00 ^s o • ^ r s i o co in s d o d c > co co co co
vO -^ vo cd -^
S
co — ^ co tN 00 •*• vO - " — CN tN CN c^ >o V* COCN CN CN CC) >o m co CN — o ov 00 ^*^ cd •*" ld vd tN 00 ov CJv o —
ïï vo m c> co o CN •* o c> C> ^ • * tN tN o co vO o iS • * o vo co tN CN C> oo tN 00 co vO . ^ c o o ot) m co — o\ v d t N o d o v cd cdcd-^in vd 00 m — ^ • * o ^ co o 00 m oo Tf (N o tN -H — oo vo — o co ov vO vO tN o - ^ ov v;f o CN i n o so CN 0(> Tj- — 00 c d CJ cd —" - J CN" CN" cd ^ •*" i n co o tN i n in v d t N t N od co o (O co CN — m in tN co m o m vo CN — — « • o m — ' * co vO co CN "^ o_ — co t> — vO -^tN co o tN CN CJV IN vO o cd o " cd —" —" CN" CN" cd cd m CN OC) l o CN •*" i n i n vd tN f» ^ Î2 o m ^»•<^' CN c^ vo oo 00 jco^ — ^ o. .o. gv ^ • ^ . — o .vO fv) co CN — c> m ^v co -^ 00 m o o — CN m co CN vo o m O^lCJ> —_ vOCJ_ c d cd c d cd cd cd ~" —" CN" CN" cd cd "^-vj«* i n
co 00 co co CO CO vd' tN
00 t« ts tN ^ ^ tN co co CO CO CO CO CO CO CO co_ co_ co co co oo" Ov' CN CN CN CN CN
m CN t» c^ o — CN •* in vo co co co co co vO Ov -• -< o •* —• c> vO co CN co co •* m cjC cd —" CN" CO" rvi co co co co vO co co in CN
vO vO co co co co vo" t C CN CN
CN in m — co o - ^ 00 ov — 00 vo in •* •^ -v^ - * i n co o 00 vO •* c^" o " cd —" CN" CN o OC) vO co" •*" •*" i n
CN — 00 in
vO vO co co cO co od CJv CN CN
tN tN 00 v^ tN O vo_ i n i n CN CN CN
— RcN CN CN
co o -^ vd
t« —• — in ~ OC) cdcd
m co o — co vO o vO OJ t C tN od
1
vd tvT CJV cd co co co ^
CN ^» vo 00 m - * ^ C N o p Ç3 00 i n • * o m — tN v^ ,-. 00 vO -^ o 00 M n •sf co —_ 0_ C> CN" CN" CO" •*" m " vd tN oo" od
CN CN o vo tN c^ ov vO co tNcdov
V
co t~ t~ co — co m b* — co in ^v
• * — o CN vO CN — — co tN CN C> o CN •* vO c^ -< CN co • * m vo 00 tN tN vq u i • * co_ CN — — O C> CO cvf e d - ^ i n vd CN CN CN m •""
O^ I^ O^ ^ ^
S -HtN.* %ûc>— fN00p vooiin
in in vO " •«i» vo cd -T CN CN
o o c> c^ 00 ^ ^ co co co cO cO co co CO —" CN" cd •*" i n
co •<)• — CN CN o vD CN C> ,-^-sj^ t ^ --ed-^in f ^ ^ ^ TJ*
— •* CN m CN i n t>. CN t^ -^ in 00 vO o — ^_ vO co CN" CO" in" - Ô N." co co co co co m co tN vo CN — —• o c> co vo 00 o — co in cj^ cd CN" cd •*" in CN co co co co co
o o 00 — — o co in vD o co tN o CN m t» tN c^ o ^ co -^ m vo CN" co" in" CN cvj CN c> — C> CN CVJ 00 — — C M n co CJv 00 vO CN (^ " » eg o j — — o 00 tN m co — CJv tN 00 o — CN co •^ m VÛ vo tN 00 Ov o o — •* vO tN 00 CN" •*" m" vd tN CN CN CN CN
S
I
' ^ "^ ^
:S
CN o CN o • * — • * co sO CN vO C> --cd'^icj
••B
o o
oo co CN c> co in co co O r*« *o O 00 in — \0 CN o •* •* co •* —' co CN 00 CN co co — 00 •* c> CN in ^ co — 00 •* o m o •>* (Jv co t ^ - ^ - ^ 00 —< in oo — (jC —" CN —" cd TC" \ O t C co" cd —" CN" •*" CN CN CN CN CN o ^ o — co t^ o *û o .-H o ^ CN >0 00 c> o 00 >o , oo_ o^ 00 • * o i n p m o co ^o o co ^o c> CN lO 0 0 - ^ -* c d i n t»r cjC -." CN • * i n v d c d • — CN co •* N O r C o d c d - ^ • CN CN CN CN CN CN CN co co sn t n — c> ^o i n ^ CN • * ^ in c^ CN •* IN CN C> CJV • * CN o o i n r~ co • * - - \ o 00 co t» •* —• vO o "* vO 00 o —• t-._ vO_ CN r>; CN so p c o so o CN m oo o co m tN CJV CN .^_ od c> —" CN c d - ^ i n IN od CN" •*" sd tC cK c d CN" CO" •*" in" ^ — -H _ r^ CN CN CN CN CN CN
i
5
-H c> m -^
00 co co CN
co (N Tj" — -^ tN — • * tN cd vo"
c> 00 co vO cj^tN 00 CJv -•
C> CJv in cd CN
o t» co in
00 00 CN o CJ^ tN vo tN
co c> •*, cd
— 00 —< o •* — o 00 vo co" co" •>!•'
8Ï:
— m -^ vd
tN CN vO vO Tj- 00 CJv i n vo co CJV -vt C M n CN 00 m —• co l o od CJ? o " cd —" CN CN co •* • *
c^
> 'CN "p
>ï hl g •o 8
^1 CJ
ti g >
có OCN t^ CN vo c^ tN 00 o o o CN •* vO o cd cd cd cd cd o" o
S' — f^ o —
v^ in m co •* in m — CN •>* co m o tN vö ^» o •^ co ts — vo p i n p vo « "" —" CN" CN cd cd - ^ •^" in
»-•CNco-^invotNoocjvo
t^ in •* •* • * co o C> vO Tt« co co Tf vO vi) CN 03 •* in" vd v d t C o vo CN cdodov
vO o 00 CN œ in CJv cd
o 00 — — tN vO o vO CN 00 — co •* — tN -^" —" CN co" cd
vO ts co CJV o vO ts 00 CJV o .-, « ^ cvi CNCNC3CNCN|CNNCNCNCO
s
Eb g a) S •a 1o
60
O .3 CO G
T A B E L E . F R A C T I E L E N VAN D E V E R D E L I N G V A N D E C O R R E L A T I E -
coÊFFicifiNT r VOOR 6 = 0
n - 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 125 150 175 200 300 500 1000 2000
Uit:
298
'»-0,99
''0,86
*'o,976
0,988 0.900 0,805 0,729 0,669 0,622 0.582 0,550 0,521 0,497 0.476 0.458 0,441 0.426 0.412 0,400 0,389 0,378 0.369 0.360 0.344 0.330 0.323 0,296 0.275 0.257 0.243 0.231 0,220 0.211 0,203 0,195 0,189 0,183 0,178 0.173 0.168 0.164 0,147 0,134 0,124 0,116 0.095 0.074 0,052 0.037
0,997 0,950 0.878 0,811 0,754 0.707 0.666 0,632 0,602 0.576 0,553 0.532 0,514 0.497 0.482 0,468 0,456 0,444 0.433 0,423 0,404 0.388 0.381 0.349 0,325 0.304 0,288 0.273 0,261 0.250 0.240 0.232 0,224 0,217 0,211 0.205 0,200 0,195 0,174 0.159 0.148 0,138 0.113 0,088 0.062 0,044
0.9995 0.980 0,934 0.882 0.833 0,789 0.750 0,716 0,685 0,658 0,634 0,612 0,592 0,574 0,558 0,542 0.528 0.516 0.503 0.492 0.472 0.453 0,445 0,409 0,381 0,358 0,338 0.322 0.307 0,295 0,284 0,274 0.264 0.256 0.249 0,242 0.236 0.230 0.206 0.189 0,174 0.164 0.134 0.104 0.073 0.056
-''0,05
-''o.oas
-•'0,01
'WALKER en L E V (35).
''0,996
0.9999 0.990 0,959 0.917 0.874 0,834 0,798 0.765 0.735 0.708 0.684 0,661 0,641 0,623 0.606 0,590 0,575 0,561 0,549 0,537 0.515 0,496 0,487 0.449 0,418 0,393 0,372 0.354 0,338 0.325 0,312 0.302 0.292 0.283 0,275 0.267 0.260 0,254 0,228 0,208 0,194 0.181 0,148 0,115 0.081 0.058 -''0,006
''0,9996
n - 2
1,000 0,999 , 0,991 0,974 0,951 0.925 0.898 0.872 0,847 0,823 0.801 0,780 0,760 0.742 0.725 0,708 0,693 0,679 0,665 0,652 0.629 0,607 0.597 0,554 0.519 0,490 0,465 0,443 0,424 0,408 0.393 0.380 0,368 0,357 0.347 0.338 0.329 0.321 0.288 0,264 0.248 0.235 0,188 0,148 0.104 0,074
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 125 150 175 200 300 500 1000 2000
-*'o,0006
"a
4,49 3,63 4.45 3.59 4.41 3.55 4.38 3,52 4.35 3,49
4,32 4,30 4.28 4,26 4,24
4,17 4.08 4,00 3,92 3,84
16 17 18 19 20
21 22 23 24 25
30 -40 60 120
CX3
4,84 4,75 4,67 4,60 4,54
11 12 13 14 15
225
4
3,32 3.23 3,15 3,07 3,00
3,47 3,44 3,42 3,40 3,39
3.98 3.89 3,81 3,74 3,68
5 230
6 234
7 237
8 239
9 241
'. 10 242
12 244
15
2,69 2.61 2.53 2,45 2,37
4,00 3,94 3.57 3,51 3,28 3.22 3,07 3,01 2,91 2.85
2.90 2,85 2.79 2,72 2.80 2,75 2.69 2.62 2.71 2,67 2.60 2,53 2.65 2,60 2,53 2,46 2,59 2,54 2,48 2,40
4,06 3,64 3.35 3,14 2,98
2,09 2.01 2,00 1,92 1,92 1,84 1,83 1,75 1.75 1.67
2.57 2,49 2.42 2,37 2,32 2,25 2,18 2.55 2,46 2,40 2,34 2.30 2,23 2,15 2.53 2,44 2.37 2.32 2,27 2,20 2,13 2.51 2.42 2,36 2.30 2,25 2,18 2,11 2,49 2.40 2,34 2.28 2,24 2,16 2,09
2,53 2,42 2,33 2,27 2,21 2,16 2,45 2,34 2,25 2.18 2,12 2,08 2.37 2.25 2,17 2.10 2,04 1,99 2,29 2.17 2,09 2.02 1,96 1.91 2,21 2,10 2,01 1,94 1.88 1,83
3,07 2,84 2,68 3,05 2.82 2,66 3,03 2.80 2.64 3,01 2,78 2.62 2.99 2,76 2.60
2.92 2.84 2.76 2.68 2,60
2,95 2,85 2,77 2,70 2,64
4,10 3,68 3,39 3,18 3,02
2,85 2,74 2.66 2,59 2.54 2,49 2,42 2.35 2,81 2,70 2.61 2,55 2,49 2,45 2,38 2,31 2.77 2.66 2.58 2.51 2.46 2,41 2.34 2,27 2.74 2.63 2.54 2,48 2.42 2,38 2.31 2.23 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20
3.09 3,01 3.00 2,91 2.92 2,83 2,85 2.76 2,79 2.71
4,39 4.28 4.21 4,15 3,97 3.87 3,79 3,73 3,69 3,58 3.50 3,44 3,48 3.37 3.29 3.23 3,33 3,22 3,14 3,07
3,36 3.20 3,26 3,11 3,18 3,03 3,11 2.96 3,06 2,90
3,24 3,01 3,20 2,96 3.16 .2,93 3.13 2.90 3,10 2.87
3.59 3,49 3,41 3,34 3,29
5,14 4.76 4,53 4.74 4.35 4,12 4,46 4.07 3,84 4,26 3.86 3,63 4,10 3,71 3,48
5,99 5.59 5.32 5,12 4,96
6 7 8 9 10
3 216
246 18,5 19,0 19.2 19,2 19.3 19.3 19,4 19,4 19,4 19.4 19,4 19,4 10,1 9,55 9.28 9,12 9,01 8.94 8,89 8.85 8,81 8,79 8,74 8,70 7,71 6.94 6.59 6,39 6,26 6.16 6,09 6,04 6,00 5,96 5.91 5,86 6,61 5.79 5.41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62
200
161
2
1 2 3 4 5
1 24
30
40
3,81 3,77 3.38 3,34 3,08 3,04 2.86 2,83 2,70 2,66
2,24 2.19 2,19 2,15 2,15 2.11 2,11 2,07 2,08 2.04
1,93 1,84 1,75 1,66 1,57
1,89 1.79 1,70 1,61 1,52
1,84 1,74 1,65 1.55 1.46
1,79 1,69 1,59 1,50 1,39
1,96 1,94 1.91 1,89 1.87
2,15 2,10 2,06 2,03 1,99
2,61 2.57 2,53 2,51 2.47 2,43 2,42 2,38 2,34 2,35 2,31 2.27 2,29 2.25 2,20
3.84 3.41 3.12 2.90 2,74
2,10 2,05 '2,01 2,07 2,03 1,98 2,05 2,01 1,96 2,03 1,98 1.94 2,01 1,96 1.92
2.28 2,23 2.19 2.16 2,12
2.65 2,54 2,46 2,39 2,33
3,87 3,44 3.15 2.94 2,77
248 249 250 251 19,4 19,5 19.5 19.5 8,66 8,64 8.62 8,59 5,80 5,77 5,75 5,72 4,56 4,53 4,50 4,46
20
TABEL F--1. F R A C T I E L E N V A N F - V E R D E L I N G E N : FQ,,B
1,74 1.64 1.53 1.43 1.32
1,92 1.89 1.86 1.84 1.82
2.11 2,06 2,02 1,98 1,95
2,49 2.38 2.30 2,22 2.16
3,74 3,30 3,01 2,79 2,62
19,5 8,57 5.69 4,43
60 252
120 CX3
1.68 1,58 1,47 1.35 1.22
1.87 1.84 1.81 1,79 1.77
2,06 2.01 1,97 1,93 1.90
2,45 2,34 2,25 2,18 2,11
3.70 3.27 2.97 2.75 2,58
1,62 1,51 1,39 1.25 1.00
1,81 1,78 1,76 1,73 1,71
2,01 1,96 1,92 1,88 1,84
2.40 2.30 2.21 2,13 2.07
3,67 3.23 2.93 2.71 2,54
2.53 254 19.5 19.5 8,55 8.53 5,66 5.63 4,40 4,36
"î
6.72 6.55 6,41 6,30 6,20
6,12 6,04 5,98 5,92 5,87
5,83 5,79 5.75 5.72 5,69
5,57 5,42 5,29 5,15 5,02
11 12 13 14 15
16 17 18 19 20
21 22 23 24 25
30 40 60 120 cx>
4,18 4,05 3.93 3,80 3,69
4,42 4,38 4.35 4.32 4,29
4.69 4,62 4,56 4,51 4,46
5.26 5,10 4,97 4,86 4,77
7,26 6,54 6,06 5,71 5,46
16,0 10.6 8,43
38,5 17,4 12,2 10,0
8,81 8.07 7,57 7,21 6,94
800
3,59 3.46 3.34 3.23 3,12
3,82 3,78 3.75 3,72 3.69
4,08 4,01 3,95 3,90 3.86
4,63 4,47 4,35 4,24 4,15
6,60 5,89 5,42 5,08 4,83
15,4 9,98 7,76
864
3
3,25 3.13 3.01 2,89 2,79
3,48 3,44 3,41 3,38 3,35
3,73 3,66 3,61 3,56 3,51
4,28 4,12 4,00 3,89 3,80
6,23 5,52 5,05 4,72 4.47
15,1 9,60 7,39
900
4
5 6
7 8
9
"x 10 12 15
20
24 30
40
60
120
CX3
3,03 2.90 2.79 2,67 2.57
3,25 3,22 3.18 3.15 3,13
3.50 3.44 3,38 3,33 3,29
4.04 3.89 3,77 3,66 3.58
5.99 5.29 4,82 4,48 4,24
2,87 2,74 2,63 2,52 2,41
3.09 3.05 3,02 2,99 2,97
3,34 3,28 3.22 3,17 3,13
3.88 3.73 3,60 3,50 3,41
5.82 5,12 4,65 4.32 4.07
2,75 2,62 2,51 2,39 2,29
2,97 2,93 2,90 2.87 2,85
3,22 3,16 3,10 3,05 3,01
3.76 3,61 3,48 3.38 3,29
5,70 4.99 4,53 4,20 3.95
2,65 2,53 2,41 2,30 2,19
2,87 2.84 2,81 2,78 2,75
3,12 3,06 3,01 2,96 2,91
3.66 3,51 3.39 3,29 3,20
5,60 4,90 4,43 4,10 3,85
2,57 2,45 2,33 2,22 2,11
2,80 2,76 2.73 2,70 2,68
3,05 2,98 2,93 2,88 2,84
3.59 3.44 3.31 3.21 3,12
5,52 4,82 4,36 4,03 3.78
2,51 2,39 2,27 2,16 2,05
2,73 2,70 2.67 2.64 2,61
2.99 2,92 2,87 2,82 2,77
3,53 3.37 3,25 3.15 3,06
5,46 4,76 4,30 3,96 3,72
2,53 2,50 2,47 2,44 2,41
2,79 2,72 2,67 2,62 2,57
3.33 3.18 3,05 2,95 2,86
5,27 4.57 4.10 3,77 3,52
2.42 2.39 2.36 2,33 2,30
2.68 2.62 2,56 2,51 2.46
3,23 3.07 2,95 2,84 2,76
5,17 4.47 4,00 3,67 3,42
2,37 2,33 2.30 2.27 2,24
2.63 2,56 2,50 2.45 2,41
3,17 3,02 2,89 2.79 2.70
5.12 4.42 3,95 3,61 3,37
14.2 14.1 8,56 8,51 6,33 6.28
2,31 2,27 2.24 2.21 2,18
2.57 2.50 2,44 2.39 2,35
3.12 2.96 2,84 2,73 2,64
5,07 4,36 3.89 3,56 3,31
14.1 8,46 6,23
2,25 2,21 2,18 2,15 2,12
2.51 2.44 2,38 2.33 2,29
3,06 2,91 2,78 2,67 2,59
5,01 4.31 3.84 3,51 3,26
14.0 8,41 6,18
2,41 2,31 2.20 2,14 2,07 2,01 2,29 2,18 2.07 2,01 1,94 1.88 2.17 2,06 1.94 1,88 1,82 1.74 2,05 1,94 1,82 1,76 1,69 1,61 1,94 1,83 1.71 1.64 1.57 1,48
2,64 2,60 2.57 2,54 2,51
2,89 2,82 2,77 2,72 2,68
3,43 3,28 3,15 3,05 2,96
5.37 4.67 4.20 3.87 3,62
14,9 14.7 14,6 14,5 14,5 14,4 14.3 14,3 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6.43
1,94 1.80 1.67 1,53 1,39
2,18 2,14 2.11 2.08 2,05
2,45 2.38 2,32 2.27 2.22
3.00 2,85 2.72 2,61 2,52
4,96 4.25 3,78 3.45 3,20
2,32 2,25 2,19 2,13 2,09
2.88 2,72 2,60 2,49 2,40
4,85 4,14 3,67 3,33 3,08
13.9 8,26 6.02
1.87 1.72 1,58 1,43 1.27
1.79 1,64 1,48 1,31 1.00
2,11 2.04 2,08 2,00 2.04 1.97 2,01 1.94 1.98 1.91
2.38 2.32 2.26 2,20 2,16
2.94 2,79 2.66 2.55 2,46
4,90 4,20 3,73 3,39 3.14
14,0 13.9 8,36 8,31 6,12 6,07
922 937 948 957 963 969 977 985 993 997 1001 1006 1010 1014 1018 39.0 39,2 39,2 39,3 39.3 39,4 39.4 39,4 39,4 39.4 39,4 39,4 39,5 39.5 39,5 39,5 39.5 39,5
2
648
6 7 8 9 10
1 2 3 4 5
1
T A B E L F-2. FRACTIELEN VAN F - V E R D R T . I N G E N : ^0,975
V»
10,9 9,55 8,65 8,02 ,7,66
13,7 12,2 11,3 10,6 10,0
9,65 9,33 9,07 8,86 8,68
8,53 8,40 8,29 8,18 8,10
8,02 7,95 7,88 7,82 7,77
7,56 7,31 7,08 6,85 6.63
6 7 8 9 10
11 12 13 14 15
16 17 18 19 20
21 22 23 24 25
30 40 60 120
oö
5000 99,0 30,8 18,0 13,3
1 4052 98,5 2 34,1 3 21,2 4 16,3 5
5,39 5,18 4,98 4,79 4;61
5,78 5,72 5,66 5,61 5,57
6,23 6,11 6,01 5,93 5,85
7,21 6,93 6,70 6,51 6,36
2
. 1
4,51 4,31 4,13 3,96 3,78
4,87 4,82 4,76 4,72 4,68
6,29 6,18 5,09 6,01 4,94
6,22 5,95 5,74 5,56 6,42
9,78 8,45 7,59 6,99 6,55
5403 99,2 29,5 16,7 12,1
3
4,02 3,83 3,66 3,48 3,32
4,37 4,31 4,26 4,22 4,18
4,77 4,67 4,58 4,50 4,43
6,67 6,41 5,21 5,04 4,89
9.15 7,86 7,01. 6,42 5,99
6625 99,2 28,7 16,0 11.4
4
3,70 3,51 3,34 3,17 3,02
4,04 3,99 3,94 3.90 3,86
4,44 4,34 4,25 4,17 4,10
6,32 5,06 4,86 4,69 4,66
8,75 7,46 6,63 6,06 6,64
5764 99,3 28,2 15,5 11,0
6
3,47 3.29 3,12 2,96 2,80
3,81 3,76 3,71 3,67 3,63
4,20 4,10 4,01 3,94 3,87
5.07 4,82 4,62 4,46 4,32
8,47 7,19 6,37 6,80 5,39
5869 99,3 27,9 15,2 10,7
6
3,30 3,12 2,95 2,79 2,64
3,64 3,59 3,64 3,50 3,46
4,03 3,93 3,84 3,77 3,70
4,89 4,64 4,44 4,28 4,14
8,26 6,99 6,18 6,61 5,20
6928 99,4 27,7 15,0 10,5
7
3.17 2,99 2,82 2,66 2,61
3,51 3,46 3,41 3,36 3,32
3,89 3,79 3,71 3,63 3,56
4,74 4,60 4,30 4,14 4,00
8,10 6,84 6,03 5,47 5,06
6982 99,4 27,5 14,8 10,3
8
3,07 2,89 2,72 2,56 2,41
3,40 3,35 3,30 3,26 3,22
3,78 3,68 3,60 3.52 3,46
4,63 4,39 4,19 4,03 3,89
7,98 6,72 5,91 5.36 4,94
6022 99,4 27,3 14,7 10,2
9
T A B E L F-3. F R A C T I E L E N V A N
2,98 2,80 2,63 2,47 2,32
3,31 3,26 3,21 3,17 3,13
3,69 3,59 3,61 3,43 3.37
4,54 4,30 4,10 3,94 3,80
7,87 6,62 5,81 5,26 4,85
6056 99,4 27,2 14,5 10,1
10
"i
2,84 2,66 2,60 2,34 2.18
3,17 3,12 3,07 3,03 2,99
3.55 3,46 3,37 3,30 3,23
4,40 4,16 3,96 3,80 3,67
7,72 6.47 .6,67 5,11 4,71
6106 99,4 27,1 14,4 9,89
12
2,70 2,52 2,36 2,19 2,04
3,03 2,98 2,93 2,89 2,85
3,41 3,31 3,23 3,16 3,09
4,25 4,01 3,82 3,66 3,52
7,66 6,31 5,62 4,96 4,56
6157 99,4 26,9 14.2 9.72
15
2,80 2,75 2.70 2.66 2,62
3.18 3.08 3.00 2.92 2,86
4,02 3.78 3.69 3,43 3,29
7,31 6,07 6,28 4,73 4,33
6235 99.6 26.6 13.9 9,47
24
2,72 2.67 2,62 2,58 2,54
3,10 3.00 2.92 2,84 2,78
3.94 3.70 3,51 3,36 3,21
7.23 5,99 6,20 4,66 4.25
6261 99.5 26,5 13.8 9.38
30
2,64 2.58 2.54 2,49 2,46
3.02 2.92 2,84 2,76 2,69
3.86 3,62 3.43 3,27 3,13
7,14 5,91 5,12 4,57 4,17
6287 99,6 26.4 13.7 9,29
40
2,55 2,50 2,46 2,40 2,36
2.93 2,83 2,76 2.67 2,61
3,78 3,54 3,34 3,18 3.05
7,06 6.82 6.03 4,48 4,08
6313 99.5 26,3 13,7 9,20
60
2,46 2.40 2,35 2.31 2,27
2.84 2.75 2.66 2.68 2,52
3,69 3,45 3,25 3,09 2,96
6,97 5,74 4,95 4,40 4,00
6339 99,5 26.2 13,6 9,11
120
2,36 2,31 2,26 2.21 2.17
2,75 2,65 2,57 2,49 2,42
3,60 3,36 3,17 3,00 2,87
6,88 5,65 4.86 4.31 3,91
6366 99,5 26,1 13,5 9,02
CXJ
2,55 2,47 2.39 2,30 2.21 2.11 2.01 2,37 2,29 2.20 2,11 2.02 1,92 1,80 2,20 2,12 2,03 1,94 1.84 1,73 1,60 2.03 1,95 1,86 1,76 1,66 1.53 1,38 1,88 1,79 1,70 1,59 1.47 1,32 1,00
2.88 2,83 2,78 2,74 2,70
3,26 3.16 3,08 3,00 2,94
4,10 3,86 3,66 3,51 3,37
7,40 6,16 5,36 4,81 4,41
6209 99,4 26.7 14.0 9,55
20
F - V E R D E L I N G E N pQ.at
»t
I
2
3
4
5
6
7 8
9
10
12 15
20
24 30
40 60
120
7,61 7,35 7,21 7,09 6,99
10,6 10,4 10,2 10,1 9,94
9,83 9,73 9,63 9,55 9.48
9,18 8,83 8,49 8,18 7,88
16 17 18 19 20
21 22 23 24 25
30 40 60 120 oo
6,36 6,07 5.79 6,54 5,30
6,89 6,81 6,73 6,66 6,60
12,2 8.91 11,8 8,51 11,4 8,19 Il.I 7,92 10,8 7,70
11 12 13 14 15
14,5 12.4 11,0 10,1 9,43
18,6 16,2 14,7 13,6 12,8
5,24 4,98 4.73 4,50 4,28
5,73 5,65 6,68 6,52 6,46
6.30 6,16 6,03 6,92 5,82
7,60 7,23 6,93 6,68 6,48
12,9 10,9 9,60 8,72 8,08
4,62 4,37 4,14 3,92 3.72
6,09 5,02 4,95 4,89 4,84
5,64 5,50 6,37 5,27 5,17
6,88 6,62 6,23 6.00 6,80
12,0 10,1 8,81 7,96 7,34
4,23 3,99 3,76 3,55 3,36
4,68 4,61 4,64 4,49 4,43
5,21 5,07 4,96 4,85 4,76
6,42 6,07 5,79 5,66 5,37
11,5 9,62 8,30 7,47 6,87
3,95 3,71 3,49 3,28 3,09
4,39 4,32 4,26 4,20 4,16
4,91 4,78 4,66 4,56 4,47
6,10 5,76 5,48 5,26 5,07
11.1 9,16 7,95 7,13 6,54
4,01 3,94 3,88 3,83 3,78
4,52 4,39 4,28 4.18 4,09
6,68 6,35 5,08 4,86 4,67
10,6 8,68 7,50 6,69 6,12
3,88 3,81 3,75 3,69 3,64
4.38 4,26 4,14 4,04 3,96
5,64 6,20 4.94 4,72 4,64
10,4 8,51 7,34 6,54 5,97
3,74 3,58 3.46 3,51 3,36 3,22 3,29 3,13 3,01 3,09 2,93 2,81 2,90 2,74 2,62
4,18 4,11 4,05 3,99 3,94
4,69 4,56 4,44 4,34 4,26
5,86 5,52 5,25 5,03 4,85
10,8 8,89 7,69 6,88 6,30
3,60 3,54 3,47 3,42 3,37
4,10 3,97 3,86 3,76 3,68
6,24 4,91 4,64 4.43 4,25
3,01 2,78 2,67 2,37 2,19
3,43 3,36 3,30 3,25 3,20
3,92 3,79 3,68 3,69 3,50
6,05 4,72 4,46 4,25 4,07
10,0 9,81 8,18 7,97 7,01 6,81 6,23 6,03 5,66 6,47
3,34 3,18 3,12 2,95 2,90 2,74 2,71 2,54 2,52 2,36
3.77 3,70 3,64 3,59 3,64
4,27 4,14 4,03 3,93 3,85
5,42 5,09 4,82 4,60 4,42
10,3 8,38 7,21 6,42 5,85
3,16 3,08 3,02 2,97 2,92
3.64 3,61 3,40 3,31 3,22
4,76 4,43 4,17 3,96 3,79
9.47 7,65 6,50 6.73 5,17
2,82 2,73 2,60 2,50 2,39 2,29 2,19 2,09 2,00 1,90
3,24 3,18 3,12 3,06 3,01
3,73 3,61 3,50 3,40 3,32
4,86 4,53 4.27 4,06 3,88
9,59 7,75 6,61 5,83 5,27
2,63 2,40 2,19 1,98 1.79
3,05 2,98 2,92 2,87 2,82
3,54 3,41 3,30 3,21 3,12
4,65 4,33 4.07 3,86 3,69
9,36 7,53 6,40 5.62 6,07
2.62 2,30 2,08 1,87 1.67
2.96 2,88 2.82 2,77 2,72
3,44 3,31 3,20 3,11 3,02
4.55 4,23 3.97 3,76 3,58
9,24 7,42 6,29 5,52 4,97
2,42 2,18 1,96 1,75 1,53
2.84 2,77 2.71 2,66 2,61
3,33 3.21 3,10 3.00 2,92
4,44 4.12 3.87 3,66 3,48
9,12 7.31 6.18 5,41 4,86
oo
2.61 2.55 2.48 2,43 2,38
3.11 2.98 2,87 2,78 2,69
4,23 3,90 3,65 3.44 3.26
8.88 7.08 5.95 6.19 4,64
25465 200 41,8 19.3 12,1
2,30 2,18 2,06 1,93 1.83 1,69 1,61 1,43 1,36 1,00
2.73 2.66 2.60 2,65 2,50
3,22 3.10 2,99 2,89 2.81
4.34 4,01 3,76 3.55 3,37
9,00 7,19 6.06 5,30 4,75
16211 20000 21615 ??,S00 23056 23437 23716 23925 24091 24224 24426 24630 24836 24940 25044 25148 25253 25359 199,5 198 199 199 199 199 199 199 199 199 199 199 199 199 199 199 199 199 55,6 49,8 47,5 46,2 46,4 44,8 44,4 44,1 43,9 43,7 43.4 43,1 42,8 42.6 42,5 42,3 42,1 42,0 31,3 26,3 24,3 23,2 22,5 22,0 21,6 21,4 21,1 21,0 20,7 20,4 20,2 20.0 19,9 19.8 19,6 19,6 22,8 18,3 16,5 15,6 14,9 14,6 14,2 14,0 13,8 13,6 13,4 13,1 12,9 12.8 12,7 12,5 12,4 12,3
6 7 8 9 10
1 2 3 4 5
"i
T A B E L F - 4 . F R A C T I E L E N V A N F - V E R D E L I N G E N : ^0,»»5
T A B E L G - 1 . D E SERIETOETS OP D E WAARNEMINGEN
L i n k e r en r e c h t e r k r i t i e k e w a a r d e n v a n u bij tweezijdige t o e t s i n g a = 0,05 \»«1
5
6
7
8
wX 5 \ 6 3 7 3 8 3 9 3 10 3 11 4 12 4 13 4 14 4 15 4 16 4 17 4 18 5 19 5 20 5
10 11 12 3 \ 3 4 4 4 4 5 4 5 4 5 5 5 6 5 5 6 5 6 5 6 5 6 6 .6 6 6
N
9
10 11 12 13 14 15 16 17 18 19 20
11 — — 12 13 13 13 14 14 14- 15 5 \ 16 5 5 \ 5 6 6 6 6 7 6 6 7 6 7 7 6 7 7 6 7 8 7 7 8 7 8 8 7 8 8 7 8 9
N
— 13 14 15 16 17
V7 7 8 8 8 9 9 9 9
— 13 14 16 16 17 18 \ v
8 8 8 9 9 9 10 10
— — 15 16 17 18 19 19
X9
9 9 10 10 10 10
— — — 15 15 16 16 17 18 18 18 19 19 20 20 20 21 22 \ 9 \ 10 10 10 11 10 11 11 11 11 12
— — — 17 18 19 20 21 21 22 23
X11 11 12 12
— — — — — — 17 17 18 18 19 20 20 21 21 22 22 23 23. 23 24 24 25 25 25 26 12 \ 26 12 13 \ 13 13 13
— — — 17 18 19 20 21 22 23 23 24
N
— — — 17 18 20 21 22 23 24 25 25 26 27 27 \
a = 0.01 5 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Uit:
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20
1
^11 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4
N2 3 3 3 3 3 3 4 4 4 4 4 4 4
S W E D en
13 13 14 3 3 3 3 4 4 4 4 4 4 5 4 5 4 5 5 6 5 5 5 6 6 6 5 6
N
X
— — 15 15 15 16 17 4 5 5 5 5 5 5 5 6 6 6 6 6 6 7 6 7 6 7 7 7
NX
— 15 16 17 18 \ 6 6 6 7 7 7 7 8 8
— — 17 18 19 19
N6 7 7 7 8 8 8 8
— — 17 18 19 20 21
N7 7 8 8 8 9 9
— — 17 18 19 20 21 22
N8 8 8 9 9 9
— _ _ — _ _ — — — 19 _ _ 20 21 21 22 22 22 22 23 23 23 24 24 24 25 25 25 25 26 26 26 27 9 27 27 9 9 \ 28 9 10 10 \ 10 10 1 1 \ 10 10 10 11 11 12
— — — 19 20 21 22 22 23
S
— — — 19 20 21 22 23 24 24
N
_ _ — _ 21 22 23 24 25 26 27 28 29 29 \
EISENHART (111).
303
T A B E L G-2. D E SERIETOETS OP D E WAARNEMINGEN
L i n k e r en r e c h t e r k r i t i e k e w a a r d e n v a n M bij tweezijdige toetsing. Wj = Wj :
n
Linker kritieke waarden a = 0.01
0.02
0.05
0,10
, 2 3 3 4
2 2 3 4 4
2 3 3 4 5
• 28
4 5 6 7 7
5 6 6 7 8
30 32 34 36 38
8 9 10 10 11
40 42 44 46 48
in
Rechter kritieke waarden 0,10
0.05
0.02
0.01
3 3 4 5 6
9 11 12 13 14
10 11 13 14 15
10 12 13 14 16
11 12 13 15 16
6 7 7 8 9
6 7 8 9 10
16 17 18 19 20
16 17 19 20 21
17 18 19 21 22
17 19 20 21 23
9 10 10 11 12
10 11 11 12 13
11 11 12 13 14
21 23 24 25 26
22 23 25 26 27
23 24 26 27 28
24 25 26 27 29
12 13 14 14 15
13 14 14 15 16
14 15 16 16 17
15 16 17 17 18
27 28 29 31 32
28 29 30 32 33
29 30 32 33 34
30 31 32 34 35
60 62 54 66 58
16 17 18 18 19
17 18 19 19 20
18 19 20 21 22
19 20 21 22 23
33 34 35 36 37
34 35 36 37 38
35 36 37 39 40
36 37 38 40 41
60
20
21
22
24
38
40
41
.42
10 12 14 16 • 18
20 22 24 26
Ontleend a a n : S W É D en EISENHART (111).
304
T A B E L H. D E SERIETOETS O P VERSCHILLEN TUSSEN O P E E N V O L G E N D E
WAARNEMINGEN
Linker en rechter kritieke waarden van v bij éénzijdige toetsing Linker kritieke waarden
Uit:
w
a = 0.01
11
12 13 14 15
3 4 4 5 6
16 17 18 19 20
6 6 7 7 8
21 22 23 24 25
8 9 9 10 11
26 27 28 29 30
Retihter kritieke waarden
0.05
0.05
0.01
4 4 5 6 6
10 11 12 12 13
— — 13 14
7
14 15 16 16 17
15 16 17 17 18
, 12
18 18 19 20 21
19 20 21 21 22
11 12 12 13 13
13 13 14 14 15
21 22 23 24 24
23 24 24 25 26
31 32 33 34 35
14 15 15 16 16
16 16 17 17 18
25 26 27 27 28
27 27 28 29 30
36 37 38 39 40
17 18 18 19 19
19 19 20 20 21
29 29 30 31 32
30 31 32 33 33
S W E D en
EISENHART
.
7
8 8 9 10 10 11 11
(111).
305
TABEL I.
D E TEKENTOETS
Linker kritieke waarden van X bij tweezijdige toetsing (xg = 'n Onbetrouwbaaxheidsdrempel a n l 2 3 4 5 6 7 8 9 10 11 12 13 14 15
. 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
0,01
0,02
0,05
— — _ — _ —
— — _ — _
_ — _ —
0 0 0 0(1) 1 1 1(2) 2 2 2 3 3 3(4) 4 4 4(5) 5 5(6) 6 6 6(7) 7 7 7(8) 8 8(9) 9 9 9(10) 10 10(11) 11 11 11(12) 12 12 (13) 13 13 13 (14) 14 14 (15) 15 15
0 0 0 0(1) 1 1 1(2) 2 2 2 3 3 4 4 4(5) 5 5 5(6) 6 6(7) 7 7 7(8) 8 8 8(9) 9 9(10) 10 10 10(11) 11 11(12) 12 12 (13) 13 13 13 (14) 14 14(15) 15 15 15 (16) 16
0 0 0(1) 1 1 1(2) 2 2 2 3 3 4 4 4(5) 5 5 5(6) 6 6(7) 7 7 7(8) 8 8(9) 9 9 9(10) 10 10(11) 11 11(12) 12 12 12 (13) 13 13 (14) 14 14 (15) 16 15 15 (16) 16 16 (17) 17 17 (18)
n
0,10
_ _ 0 0 0(1) 1 1 1(2) 2 2(3) 3 3 3 4 4 5 5 5(6) 6 6(7) 7 7 7(8) ' 8 8(9) 9 9 10 10 10(11)
u 11 (12) 12 12 (13) 13 13 13 (14) 14 14 (15) 15 15 (16) 16 16 16 (17) 17 17(18) 18 18 (19)
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
XL)
Onbetrouwbaarheidsdrempel a 0,01 15 (16) 16 16 (17) 17 17 17(18) 18 18 (19) 19 19 (20) 20 20 20 (21) 21 21(22) 22 22 22(23) 23 23 (24) 24 24 (25) 25 25 25(26) 26 26 (27) 27 27 (28) 28 28 28 (29) 29 29(30) 30 30 (31) 31 31 31 (32) 32 32 (33) 33 33 (34) 34 34 34 (35) 35 35 (36) 36 36 (37)
0,02
0,05
0.10
16(17) 17 17(18) 18 18 18 (19) 19 19 (20) 20 20 20(21) 21 21(22) 22 22(23) 23 23 23(24) 24 24(25) 25 25 (26) 26 26 26(27) 27 27 (28) 28 28 (29) 29 29 (30) 30 30 30 (31) 31 31 (32) 32 32 (33) 33 33 33 (34), 34 34 (35) 35 35 (36) 36 36(37) 37 37 37 (38)
18 18 18 (19) 19 19 (20) 20 20 (21) 21 21 21 (22) 22 22(23) 23 23(24) 24 24(25) 25 25 25 (26) 26 26(27) 27 27 (28) 28 28 28 (29) 29 29 (30) 30 30 (31) 31 31 (32) 32 32 32 (33) 33 33 (34) 34 34 (35) 35 35 (36) 36 36(37) 37 37 37 (38) 38 38 (39) 39 39 (40)
19 19(20) 20 20 20 (21) 21 21 (22) 22 22(23) 23 23(24) 24 24 24(25) 25 25(26) 26 26(27) 27 27 (28) 28 28 28 (29) 29 29 (30) 30 30 (31) 31 31 (32) 32 32 (33) 33 33 33 (34) 34 34 (35) 35 35 (36) 36 36 (37) 37 37 (38) 38 38 38 (39) 39 39(40) 40 40 (41) 41
Zie vooreen verklaring van de tussen haakjes geplaatste waarden de opmerking op blz. 141.
306
u*"
t^ CO iS H S O *
a
n 13 <
H ^
î I
o cd
CN •* CO m • vO tN ^s 00 in vu tN 00 < o -« CN CO CO CO CO CO < «• ^ ^ ^ —
-" r>i v^«
vO tN CO es ^ ^^^
u
î§
tN tN tN tN tN tN tN tN 00 00 00 (30 00 CO eo Qv Ov Qv Qv Ov
t« 00 p CO in vO 00 -^ CO 'W 00 Ov CO vu 00 >-« CO >o p eo tN o CN tN C> •* vo '-« m oo CN tN «-« •* oo -" CN ^ in >o tN oo es »" CN CO •«*• vO tN 00 o '- r
m m m in m 10 m "O vo «û vO vO «o vO .Ü
S
o CN in ^ o (N m c^^^ •>*tN -^ ^ 00 «-« m o ^ tN «-I vo p m CJv Tf m e^ •»!• o in c> vo o tN CO 00 •>(«'- tN rv) CO in — 00 •* -. Ov vO CN' tN 00 o CN 00 o o CN CO •«J« vO tN 00 o 00 o — CN •* — CN •* «o tN c> o Ol •* in IN e^ O Ol •* CN w ^ jn tN ^ CO -^ vO 00 CJV '«i* m in m m m m m «o «o «o «o vO vO vO tN tN tN tN tN tN tN 00 oo CO où 00 00 00 Ov Ov Ov OV ©v c^ o o o o o o ^ *- ^
m
vu ts 00 c^ o
t» •* CN C> tN •* CN -« —• CO m ts c> tN t« tN t« tN
o — CN CO •* in IN tN tN tN tN tN tN tN tN 00 00 00 00 00 00
vo ^N 00 c> o -^ CN eo ^ in >û tN 00 Ov
vO tN 00 c> o — CN eo "* in vO tN 00 CJV p oo 00 00 00 c^ Qv O« Ov O« 0v CJV CJV o v o ^ o
VO tN Ov o CN eo in CO o Ov vo vo CO CO CN p C> C> CO 00 tN tN vO vO IN tN vO 00 tN Ol Nt vo c^ -" e«j m tN o o CN 1« vO 00 o CN CO m tN Ov -^ CO m fN CJV — CO in tN CJV CN ^ «o 00 00 00 00 00 00 CT« o« Ov Ov Ovo^ o o o o o — -« — — — oq Ol CN Ol CO eo eO CO eo Ni« • * •»!• Tf« i n
S
00 CN t« CO 00 CN t» çO 00 ^ C M n CN 00 CO -- VO •* " tN •* o C M n CN o C M n •* CN «-« CJv »o vo eo eo O) O c^c^ 00 vo tN in vo vo m m -^ -^ CJV « CN «* m tN 00 c5 — CO -^ vu 00 o« — CO Nj« vO oo c> -< CO NC vO 00 o —« CO m tN c^ o O) •«* vo 00 o O) CO m tN CJV — eo in tN CJV — CO m v4« m m m m m m vo «o «o vO vO vO vO tN tN tN tN tN tN CO oo 00 00 00 Ov O^ Qv Ov Ov c^ o o o o o — —« — —• -- — CN 01 CN CN oq CO eo eo
(N CO •*
OJ oo CO •-• vO •«* —
—
-" •* o in c> CN O ) CO CO CO
«o tN tN (gv o o c«3 m vo 00 «^ CO «o 00 ~ m 00 O m tN CN vo c> eo CN Q tN m CN o Ov tN vO -^ in in ^ "^ in in vo) «o * -^ in vo tN 00 c> r v^ in »o fN 00 Ov,-. o5 eo •
vO CN t« CO o 00 m «-« 00 vo m CO o o tN tN vo •* CO eo CN Ol — -« CN CN — CO CN •* in m vo 00 O « Ol Ti« tN c^ in vo tN 00 c^ o — CN ço •* vO tN 00 o o m vo tN 00 c^ •* m m vo tN tN 00 o CJv o -« r^ eo •<* •* CN CN CN CN CN P 5 Ol CN CN Ol eo eo CO eO CO eo eo CO CO •*
CO tN Ol vO ov m oo ^ Ov CO 00 "4* o« m vO ^ CO •-• o 00 tN ^N vo vo « .- CN CN CO m vo 00 »-< CO V* 00 — eo vo m *n tN 00 Ov C> o -" CN CO m >o tN 00 c^ vO t< CJv o — CQ "if m tN 00 c> r« CN 3 m tN co o — CO S CN CN CN CN CN CN CN CO CO CO eo eo CO CO CO ^ ^ "T ^ ^ •«}• m m m
CN CO CO •
tN CN «o C M n o ^ CJV m o vO — tN Nj« o tN eo o 00 in _< CO vo m — o 00 tN m CN CN — C> 00 vO m in •* v^ CO ro CN Ol CO eo -« N CN O) CO ^ ^ v^ m vo vO tN tN 00 ov (jv o — -< CN eo eo ^ m «o tN tN 00 CJV o — CN CN CO •* in vo tN 00 ov o — es CO •«* Ol cvj CN CN 01 CN CN CN CN CN eo CO CO eo cO
-• CN CO •* m \o Vi \n ^n ifi m m in in ^ vO vO «o vO vO vo vo vo «n tN
111!^
I I
t
I vO CO c>
' CO ^
vO tN 00 ov o — CN CO •«*• m vO tN 00 Ov O vO ^« eo CJv O — CN CO ^ in vO tN 00 Ov o -• Ol CO •* m vo tN 00 c^ o - - . . - O l CN M CN CN 05 Ol Ol CN Ol CO CO eo eO cO eo eo eo cO CO ^ ^ ^ ^ "J« ^ ••«*«•*•«*• i n
I I
«-« oj CO •* in
TABEL K-l.
D E T O E T S VAN F R I E D M A N ( M E T H O D E D E R m R A N G S C H I K K I N G E N )
E x a c t e r e c h t s e overschrijdingskansen v a n K vcwr kleine w a a r d e n v a n k e n n
Ä = 3, « = 3 k = 3 , « = 8 k = 3 , « = IC k = 4 , w = S k = 4 , » = 6 K = 18 0,028 (vervolg) (vervolg) (vervolg) (vervolg) U.UUl 1 Jï=150 0,0'11 K = 61 u,uoo " """" K = Ub 0,0033 k = 3 , n = 4 ^ = 9 6 0,0*86 152 0,0*85 65 0,044 118 0,0028 98 K=\8 0,125 158 0,0*44 0,0»26 67 0,034 120 0.0023 104 24 0,069 162 0.0*20 69 0,031 122 0,0020 114 0,0*61 26 0.042 168 0.0*11 73 0,023 126 0,0015 122 0,0*61 32 0,0046 182 0,0»21 75 0,020 128 0,0»90 126 0,0*61 200 0,0'99 77 0.017 130 0,0»87 128 0,0»36 Ä = 3, « = 5 81 0.012 132 0,0»73 K = 24 0,124 134 0,0»65 83 0.0087 26 0,093 Ä = 3, n — 9 k = 4, n = 2 136 O.OMO 86 0.0067 32 0,039 K = 42 0,107 üf = 18 0,167 60 0,069 20 0,042 138 0,0»36 89 0,0055 38 0,024 rt rtrtO 1 4 J /\ /\ f \ 9 ^ \ e \ 64 0.067 42 0.0085 140 0,0*28 91 0.0031 0,048 A = 4, M = 3 0.0023 144 0,0*24 66 93 60 0,0'77 146 0.0*22 62 0,031 K = 2 9 0,148 97 0.0018 33 0,075 72 0,019 Ä = 3, « = 6 99 0.0016 148 0.0*12 i£' = 26 0,142 36 0,054 74 0,016 101 0,0014 150 0,0*95 32 0,072 37 0,033 78 0,010 105 0,0'64 162 0.0*62 38 0,062 41 0.017 86 0,0060 107 0,0»33 164 0.0*46 43 0,0017 42 0,029 96 0,0035 109 0,0»21 158 0,0*24 98 0.0029 46 0,0017 50 0,012 113 0,0»14 160 0,0*16 104 0,0013 54 0,0081 162 0,0*12 117 0,0*48 56 0.0055 114 0,0»66 k = 4, M = 4 125 0.0=30 164 0.0»80 » ** A ^^j ^^ %^\^ 62 0.0017 122 0,0»35 if = 38 0,141 170 0,0*24 40 0,106 n = b 126 0,0''20 k = 4, 72 0,0»13 180 0,0*13 128 0,0*97 42 0,094 K = : 5 6 0,127 Ä = 3, « = 7 134 0,0*54 44 0,077 68 0,114 k ==6, « = 3 46 0,068 K = 32 0,112 62 0,108 ii: = 50 0,163 146 0,0*11 38 0,085 48 0,054 64 0,089 150 0,0*11 52 0,127 42 0,051 50 0,052 66 0,088 152 0,0*11 64 0,117 50 0,027 52 0,036 68 0,073 158 0,0*11 56 0,096 54 0,021 54 0,033 70 0,066 162 0,0«60 68 0,080 66 0,016 56 0,019 72 0,060 60 0,063 74 0,056 62 0,0084 k = 3 , « = 10 58 0.014 62 0,056 , 72 0,0036 K = 42 0,136 62 0,012 76 0,043 64 0,045 . 74 0.0027 64 0,0069 60 0,092 78 0,041 66 0,038 78 0,0012 66 0,0062 54 0,078 80 0,037 68 0,028 86 0,0»32 68 0.0027 66 0.066 82 0,036 70 0,026 96 0,0''32 70 0,0027 62 0,046 84 0,032 72 0,017 98 0.0*21 72 0,0016 72 0,030 86 0,029 74 0,015 *TX f s /\^\*vn 74 0.0»94 74 0,026 88 0,023 76 0.0078 90 0,022 k = 3 . « == 8 78 0,018 76 0,0»94 78 0,0053 Ü : = 38 0,120 78 0,0»94 86 0,012 94 0,017 80 0,0040 42 0.079 0,0075 0,014 80 0,0*72 96 96 82 0,0028 f\ ^ £\ ^ \ ^ ^ \ ^ \ 50 0.047 98 0,0063 98 0,013 86 0,0*90 64 0,038 104 0,0034 k = 4 , n = 5 100 0,010 90 0,0*69 56 0,030 114 0,0020 K = 4 S 0,141 102 0,0096 49 0,123 62 0,018 122 0,0013 104 0,0085 61 0,107 72 0,0099 126 0,0»83 106 0.0073 63 0,093 74 0,0080 128 0,0*51 108 0,0061 67 0,075 78 0,0048 134 0,0»37 110 0,0057 69 0,067 86 0,0024 146 0,0M8 114 0,0040 Ontleend aan KENDALL (94), Tabel 5, Appendix; 0,0*11 = 0,00011.
308
TABEL K-2.
D E TOETS VAN F R I E D M A N
Rechter kritieke waarden van ^^ bij a = 0,05
X" 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2
3
— —
— 18 37 64
4
5
6
7
_
—
26 52
32 65
18 42 76
24.5 50
92 167 272 412 591 815
20 38 89 64 104 144 96 158 217 138 225 311 192 311 429 258 416 574
113 137 183 222 277 336 396 482 547 664 731 887 1086 336 542 747 950 1155 1410 429 691 950 1210 1469 1791 538 865 1189 1512 1831 2233 664 1063 1460 1859 2253 2740 808 1292 1770 2254 2738 3316
9
10
11
12
13
14
15
32 50
24,5 56
32 62
40,5
32
40,5
50
40,5
105 190 310 471 676 931
118 214 349 529 760
131 238 388 588 845
66 144 261 427 647 929
72 157 285 465 706
78 170 309 504 764
84 183 333 543 823
90 196 356 582 882
1047 1396 1813 2302 2871 3523 4264
1164 1551 2014 2558 3189 3914 4737
1280 1706 2216 2814 3508 4305 5211
1013 1396 1862 2417 3070 3827 4697 5685
1098 1512 2017 2618 3326 4146 5088 6159
1182 1629 2172 2820 3581 4465 5479 6632
1267 1745 2327 3021 3837 4784 5871 7106
8
1241 1612 2047 2552 3131 3790
Uit: E N T E R S (85). De cursief gedrukte waarden berusten op exacte berekemng. De overige waarden zijn volgens verschillende benaderingsmetlioden berekend door de Statistische Afdeling van het Mathematisch Centrum t e Amsterdam.
Opmerkingen 1. D e tabeUen F - 1 t / m F - 4 zijn o n t l e e n d a a n d e B I O M E T R I K A T A B L E S Vol. 1 (74). I n deze t a b e l l e n v e r z a m e l i n g v i n d t m e n o o k : Fj^g,, e n Fj^jj. 2.
Tabellen m e t kritieke w a a r d e n E e n streepje (-) i n d e z e tabeUen b e t e k e n t , d a t bij d e b e t r o k k e n d r e m p e l w a a r d e a geen significante w a a r d e v a n d e t o e t s i n g s g r o o t h e i d b e s t a a t . V o o r alle tabeUen m e t k r i t i e k e w a a r d e n bij tweezijdige t o e t s i n g geldt, d a t zij v o o r éénzijdige t o e t s i n g m e t een d r e m p e l w a a r d e a k u n n e n w o r d e n g e b r u i k t , d o o r d e k r i t i e k e w a a r d e in d é k o l o m m e t 2a af t e lezen.
309
T A B E L L. D E TOETS VAN W I L C O X O N
L i n k e r e n r e c h t e r k r i t i e k e w a a r d e n v a n W bij tweezijdige t o e t s i n g 0 = 0,05 0,10 \>tl
3 4 5
4
3
"MS 24 0 \ \30 0 2 \ 4
2
6
4
6
7
4
8
5
6
7
8
9
10
28
32
38
42
46
52
3
36
42
48
54
60
66
4
-
\42 8 \
50
58
64
72
78
5
0
\58 10 14N^ 68 12 16 \ 7 6 22\
3
4
5
6
7
8
9
10
X
-
30
34
40
44
50
54
44
50
56
64
70
54
60
68
76
84
80
88
98
92
102 112
'\g2 2i\
114 126
oX \ 384 6 2
76
84
92
6
2
4
86
96
106
7
2
6
8
6
10
16
20
\98 26 30\
9
8
12
18
24
30
36
10
8
14
22
28
34
40
4 \
\62 6 72 ION \82 10 12 16\
108 120
8
4
8
12
16
20
\120 132 42\
9
4
8
14
20
24
30 Sl28 140
6
10
16
22
28
34
48
10
&
a = 0,02 3
5
6
7
8
9
10
-
-
42
48
52
58
40
46
54
60
66
74
\—
-
4
-
\ ;
5
-
0
6
-
2
7
0
2
\48 56 2 \ 4 \66
6N
6
8
8
0
4
8
12
9
2
6
10
14
10
2
6
12
16
^
40 SlS4 46\
a = 0,01
4
3
34N
3
4
5
6
7
3
\—
-
-
-
-
4
-
-
48
56
58
68
«sN,
\
\50
64
72
80
88
5
-
76
84
94
104
6
-
0
o2\
98
108 118
7
-
0
2
SI 10 14 112 134 18\ S134 18 22 148 28\ 'S162 22 26 32 38\
9
10
54
60
62
70
76
76
84
92
8
-
\68 78 88 98 4 N \ 9 0 100 112 6
108
138
8
-
2
4
8
9
0
2
6
10
SI 14 12 126 1 ^ 14 18
10
0
4
8
12
18
' ^
22
26
122
154
at;
Ontleend aan VAN DER VAART (113). De waargenomen rangsom So kan in Wo worden omgezet m e t : W, = 2»i«, + » , («1 -t- 1) - 2 So.
310
T A B E L M. D E T O E T S VAN K R U S K A L E N W A L L I S
E x a c t e r e c h t s e overschrijdingskansen v a n X g ' v o o r Ä = 3 e n kleine s t e e k p r o e v e n Wl «a «s
Xa'
P
2 1 1 2,7000 0.500 2 2 1 3.6000 0,200 2 2 2 4.5714 0.067 3,7143 0,200 3 1 1 3.2000 0,300 3 2 1 4,2857 0,100 3,8571 0.133 3 2 2 5,3572 4,7143 4,5000 4.4643
0,029 0,048 0.067 0.105
3 3 1 5,1429 0,043 4,5714 0,100 4,0000 0,129 3 3 2 6,2500 5,3611 5,1389 4,5556 4.2600
0,011 0,032 0,061 0,100 0,121
3 3 3 7.2000 6,4889 6,6889 5,6000 5,0667 4,6222
0.004 0.011 0.029 0,050 0,086 0,100
4 1 1 3.5714 0,200 4 2 1 4,8214 0.067 4,5000 0.076 4,0179 0,114 4 2 2 6.0000 5.3333 5.1250 4.4583 4,1667
0,014 0,033 0.052 0.100 0.105
4 3 1 5,8333 5.2083 5.0000 4.0556 3.8889
0.021 0,050 0,057 0,093 0,129
« 1 Wg « 3
XH'
P
»1 «2 »3
XH'
P
4 3 2 6.4444 6.3000 5.4444 5,4000 4,5111 4,4444
0,008 0,011 0,046 0,061 0,098 0,102
6 2 2 6,5333 6.1333 5,1600 6,0400 4,3733 4,2933
0.008 0.013 0,034 0,056 0.090 0,122
4 3 3 6.7455 6,7091 5.7909 5,7273 4,7091 4,7000
0,010 0.013 0.046 0,050 0,092 0,101
5 3 1 6,4000 4,9600 4,8711 4,0178 3.8400
0,012 0,048 0,052 0.095 0,123
4 4 1 6.6667 6.1667 4,9667 4,8667 4,1667 4,0667
0.010 0.022 0.048 0,054 0,082 0,102
5 3 2 6,9091 6.8218 5.2509 5,1055 4,6509 4,4945
0,009 0,010 0,049 0.062 0,091 0,101
4 4 2 7,0364 6,8727 5.4545 5.2364 4.5545 4.4455
0,006 0,011 0,046 0,052 0,098 0,103
6 3 3 7,0788 6.9818 5.6485 5.5152 4.5333 4,4121
0,009 0,011 0,049 0,051 0,097 0,109
4 4 3 7,1439 7,1364 5,6985 5,5758 3,5455 4.4773
0,010 0,011 0,049 0,051 0,099 0,102
5 4 1 6,9545 6,8400 4,9855 4,8600 3,9873 3,9600
0.008 0,011 0.044 0,056 0,098 0,102
4 4 4 7,6538 7,5385 5,6923 5,6538 4,6539 4.5001
0,008 0,011 0,049 0,054 0,097 0,104
6 4 2 7,2045 7,1182 5.2727 5.2682 4.5409 4.5182
0.009 0,010 0,049 0,050 0,098 0,101
5 1 1 3.8571 0,143 5 2 1 5,2500 5,0000 4,4500 4.2000 4.0500
0.036 0.048 0.071 0.095 0,119
5 4 3 7,4449 0.010 7,3949 0,011 5,6564 0,049
« 1 »«a " a
Xi^
P
5,6308 0,060 4,5487 0.099 4,5231 0,103 5 4 4 7,7604 0,009 7,7440 0,011 5.6671 0,049 5.6176 0,050 4,6187 0,100 4,6527 0,102 5 6 1 - 7,3091 6,8364 5,1273 4,9091 4,1091 4,0364
0,009 0,011 0,046 0,063 0,086 0,105
6 6 2 7,3385 7,2692 5.3385 5.2462 4.6231 4,6077
0,010 0,010 0,047 0,051 0,097 0,100
6 6 3 7,5780 7,5429 5,7056 5,6264 4,5451 4,5363
0,010 0,010 0,046 0,051 0,100 0,102
6 5 4 7,8229 7,7914 5,6657 5,6429 4,5229 4,5200
0,010 0.010 0.049 0,060 0,099 0,101
6 5 6 8,0000 7,9800 5,7800 5,6600 4,6600 4,6000
0,009 0,010 0,049 0,061 0,100 0,102
N a a r : KRUSKAL en WALLIS (97), incl. latere correcties (J. Am. Stat. Ass., 48, 910).
311
T A B E L N . D E RANGCORRELATIETOETS VAN SPEARMAN
Linker en rechter kritieke waarden van R bij tweezijdige toetsing 1. E x a c t M
Linker kritieke waarden a = 0.01
5 6 7 8
0.02 0 2 6 14
0 4 10
Rechter kritieke waarden
|
0.05
0,10
0,10
0.05
0,02
0.01
0 4 12 22
2 6 16 30
38 64 96 138
40 66 100 146
40 68 106 154
70 108 158
2. Benaderende waarden O = berekend door OLDS met normale benadering+) L W = berekend door LITCHFIELD & WILCOXON met SiUDENT-benadering Linker kritieke waarden a = 0,01
O 9 10
0.05
O
24 39
26 42
11 12 13 14 15
40 58 63 84 93 115 125 154 174 201
16 17 18 19
227 257 290 322 363 398 447 484 544 583
Rechter kritieke waarden 0,10
LW
0,05
0.02
0.01
O
LW
O
LW
O
48 72
192 258
200 202 269 272
214 288
216 220 291 296
58 85 119 161 211
84 88 117 121 158 163 207 213 266 272
105 144 191 247 313
335 428 537 663 807
352 451 565 697 848
357 455 570 703 854
382 487 609 749 909
382 488 613 756 919
271 341 422 514 620
335 416 508 613 732
342 423 515 621 740
391 480 582 698 828
969 1152 1356 1582 1832
1018 1209 1423 1659 1920
1025 1216 1430 1667 1928
1089 1291 1516 1766 2040
21 22 23 24 25
653 695 738 865 775 820 872 1013 912 960 1020 1178 1064 1115 1184 1360 1233 1287 1365 1559
873 1022 1187 1370 1570
973 1135 1314 1511 1727
2107 2407 2734 3089 3473
2207 2520 2861 3230 3630
2215 2342 2529 2670 2870 3028 3240 3416 3641 3835
2385 2722 3088 3485 3913
2427 2767 3136 3536 3968
26 27 28 29 30
1418 1621 1842 2083 2345
1789 1962 2028 2219 2287 2497 2569 2797 2873 3122
3888 4333 4811 5323 5868
4061 4524 5021 5551 6117
4072 4536 5033 5564 6131
4286 4771 5290 5845 6437
4375 4871 5402 5971 6576
4432 4931 5466 6037 6645
1475 1681 1906 2149 2414
1564 1781 2018 2275 2553
38 58
0,10
40 61
20
20 34
LW
0,02
1778 2016 2275 2556 2859
400 509 635 781 946
1103 1133 1310 1342 1540 1575 1796 1833 2077 2116
31 32 33 34 35
2700 3008 3338 3693 4073
3199 3550 3926 4328 4757
6721 7362 8042 8762 9523
7220 7904 8630 9397 10207
36 37 38 39 40
4476 4908 5366 5853 6367
5213 5698 6213 6758 7334
10327 11174 12065 13002 13986
11064 11964 12912 13907 14953
+) « = 9 e n n = 10 met een nauwkeuriger benadering (PEARSON type I I verdeling).
312
T A B E L O.
D E R A N G C O R R E L A T I E T O E T S VAN K E N D A L L
R e c h t e r kritieke w a a r d e n v a n S bij tweezijdige toetsing, Sx, = —Sg Onbetrouwbaarheidsdrempel a fl
0,01
4 5 6 7 8 9
Uit:
'
—
'
0,02
0.05
0,10
—
— 10 13 15 18 20
6 8 11 13 16 18
40 43
23 27 30 34 37
21 23 26 28 33 35 38
10 13 17 20 24
16 19 22 26
10 11 12 13 14
29 33 38 44 47
15 16 17 18 19
63 68 64 69 76
49 52 58 63 67
41 46 50 63 67
20 21 22 23 24
80 86 91 99 104
72 78 83 89 94
62 66 75 80
62 56 61 65 68
25 26 27 28 29
110 117 125 130 138
100 107 113 118 126
86 91 95 100 106
72 77 81 86 90
30 31 32 33 34
145 151 160 166 175
131 137 144 152 157
111 117 122 128 133
95 99 104 108 113
36 36 37 38 39 40
181 190 198 205 213 222
165 172 178 185 193 200
139 146 152 157 163
117 122 128 133 139 144
KAARSEMAKER
27 31 .
36
& VAN WIJNGAARDEN
71
170
42 ,
45 49
^
(69).
313
T A B E L P . D E TOETS VAN H A R T L E Y
Rechter kritieke waarden van de grootheid F „ ^ =
^
a = 0.05 ~\
k
2
3
4
5
6
7
8
9
142
202
266
333
403
475
10
11
12
n ~ l \ 2
3 4 5
39,0 15,4 9,60 7,15
6 7 8 9 10
5,82 4.99 4.43 4.03 3.72
8,38 6,94 6,00 5,34 4,85
12 15 20 30 60
3.28 2.86 2.46 2.07 1.67 1,00
4,16 3,54 2,95 2,40 1,85 1,00
CXJ
87.5 27,8 15,5 10,8
39,2 20,6 13.7
50,7 25,2 16,3
62.0 29.5 18.7
72,9 33,6 20,8
83,5 37,5 22,9
550
10,4 12,1 13.7 15,0 16,3 17,5 18,6 8,44 9,70 10,8 11,8 12,7 13.5 14,3 7,18 8,12 9,03 9,78 10,5 11.1 11,7 6,31 7,11 7,80 8,41 8,95 9.45 9,91 5,67 6,34 6,92 7,42 7,87 8.28 8,66 4,79 4,01 3,29 2,61 1,96 1,00
5,30 4,37 3,54 2,78 2.04 1,00
5,72 4,68 3,76 2,91 2,11 1,00
6,09 4,95 3,94 3,02 2,17 1,00
626
704
93,9 104 114 124 41,1 44,6 48.0 51,4 24,7 26,5 28,2 29,9 19,7 20,7 15,1 15,8 12,2 12,7 10,3 10,7 9,01 9,34
6,42 5,19 4,10 3.12 2.22 1,00
6.72 5.40 4,24 3,21 2,26 1,00
7,00 5,59 4,37 3,29 2.30 1,00
7,25 5,77 4,49 3,36 2,33 1,00
7.48 5,93 4,59 3,39 2,36 1,00
8
9
10
11
12
a = 0,01
\
'
2
3
4
5
6
199
448 85 37 22
729 120 49 28
1036
1362
151 59 33
184 69 38
22
25
16,5 13,2 11,1
9,6
18,4 14,5 12,1 10,4
7,6 6,0 4,6 3,4 2,4 1,0
8,2 6,4 4,9 3,6 2,4 1,0
7
»-1\ 2 3 4 5
47,5 23,2 14,9
6 7 8 9 10
11,1 8,89 7,50 6,54 5,85
15,5 12,1
12 15 20 30 60
4,91 4,07 3,32 2,63 1,96 1,00
6,1 4,9 3,8 3,0 2,2 1,0
CX3
9,9 8,5 7,4
19,1 14,5 11,7
9,9 8,6 6,9 5,5 4,3 3,3 2,3 1,0
705 2063 2432 2813 3204 3605 216* 249* 281* 310* 337* 361*
79 42
89 46
97 50
106 54
113 57
27 20
30 22
32 23
34 24
36 26
15.8 13.1 11,1
16,9 13,9 11,8
17,9 14,7 12,4
18,9 15,3 12,9
16,0 13,4
8.7 6,7 5,1 3,7 2.5 1,0
9.1 7.1 5.3 3.8 2.5 1,0
9,5 7,3 5,5 3,9 2,6 1,0
120 60
37 27 19,8 21 16,6 13,9
9,9 10,2 10,6 7,5 7,8 8.0 5,6 5,8 5,9 4,0 4,1 4,2 2.6 2,7 2.7 1,0 1,0 1,0
Overgenomen u i t : PEARSON en HARTLEY (74), table 3 \ . ' .
s* „aij. is t h e largest and J* „ i „ is t h e smallest in a set ofk independent varianeies, each based on «—1 degrees of freedom. Values in t h e column Ä = 2 and in t h e rows « — 1 = 2 and <X3 are exact. Elsewhere t h e third digit may be in error by a few units for t h e 5 % points and several units for t h e 1 % points. The third digit figures marked * for «—1 = 3 are t h e most uncertain.
314
T A B E L Q.
1 1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
0347437386 9774246762 1676622766 1256859926 5559563564. 1622779439 8442175331 6301637859 3321123429 6760863244 1818079246 2662389775 2342406474 5236281995 3785943512 7029171213 5662183735 9949572277 1608150472 3116933243 6834301370 7457256576 2742378653 0039682961 2994989424 1690826659 1127947506 3524101620 3823168638 3196259147 6667406714 1490844511 6805511800 2046787390 6419589779 0526937060 0797108823 6871868585 2699616553 1465526875 1753775871 9026592119 41235?,S,'S99 6020508169 9125380590 3450577437 8522043943 0979137748 8875801814 9096237000
2
ASELECTE GETALLEN
3
3696473661 4698637162 4281145720 4253323732 5650267107 3290797853 9696682731 0503729315 3854824622 3162430990 4954435482 1737932378 5724550688 7704744767 1695556719 9810507175 7864560782 5242074438 0947279654 4917460962 7983861962 4417165809 8311463224 8416074499 8297777781 0745321408 5092261197 0056763138 8339500830 4234079688 1389510374 4033203826 9683508775 9712259347 8842954572 1664361600 3327143409 4559346849 5027898719 2015370049 5574307740 4422788426 5929976860 7191386754 4855906572 9657693610 6637322030 7784570329 6849691082 5375919330 8362641112 6719007174 0609197466 0294373402 33325176,38 7978450491 4238970150 877,5668141 9644334913 3486825391 6405719586 1105650968 7573880590 5227411486 3396027519 0760629355 9751401402 0402333108 15061593?Q,._ 0190107506 2235851513 9203515977 0998429964 6171629915 5487664754 7332081112 5837788070 4210506742 8759362241 2678630655 7141615072 1241949626 2352233312 9693021839 3104496996 1047484588 3199736868 3581330376 9458284136 4537590309 0977931982 9880330091 7381539479 3362468628 7382972221 0503272483 2295754249 3932822249 3900030690 5585783836
4
5
3326168045 2707360751 1355385859 5712101421 0618443253 8735209643 2176335025 1286735807 1551001342 9052847727 0676500310 2014858845 3298940772 8022025353 5442068798 1776371304 7033240354 0443186679 1272073445 5285666044 0433460952 1358182476 9646924245 1045650426 3425205727 6047212968 7670903086 1692535616 4001749162 0052434885 7683203790 2298122208 5933824390 3954164936 4078788962 5956780683 0651291693 4495926316 3217558574 1308270150 4495273699 0702183607 1341438920 2430124860 9035572912 7494800404 0831544631 7289440560 0248077037 9437306932
6011141095 2451798973 8897541410 8826498176 2383013030 8426349164 8392120676 4439523879 9966027954 0802734328 5523640505 1093728871 9385791075 8660420453 3585294839 0774211930 9777464480 9477242190 9927729514 3868881180 6807970657 1554559552 9760490491 1104966724 4048735192 0202370331 3845943038 0275509598 4851840832 2755268962 5716001166 0752749580 4937384459 4795931330 0267741733 5291057074 6805770951 2956242948 9444671694 1529393943 0296743083 2599327023 9717144917 1899107234 8262546560 4507316649 5394133847 3580399488 1604616787 9089007633
Ontleend aan FISHER en YATES (66) Table X X X I I I , Random Numbers (1).
MODELPOPULATIE
'g CO
&
SScîîQR
^-4 1-4 «-M 1>H «-4
00 00 00 00 00
?j;22?5S
ïïîîiSKÎcN
^4
0 0 o o OO 0 0 ^ ^
o • * • * 00 oo C^ ^ ( N V.H CN
lO lO lA lO lO
- » fN -< CN —
1-1 V - l v - t ^ 1
?5R}q2:2
l o m l o l o vo
2:?î?32cN
2?5CNSR2
vo ^N oo <^ o r » tN (N tN 00
Ri2£R2
î?îî§çS
<^22SS
î:j!52î:R
lîiScNÎ^C:
q:Qig5!$
{^2882
îQRî:f^?q
vo t N oo c^ Q CO CO CO CO ^
:2R2:fîiîï
vo ^ œ o> o
o o —1 l O «-• o o CN - CN -
^ M 1-4 1-t 1-1
-H ' H
- " CN CO -"ïl« l O
>0 ^*. 00 o^ O •^^ Os o^ a* c^ o o
> 0 tN> CO o ^ o >o N O > o N O r ^
RISRÏÏ«
. . . (N n
vO tN 00 CTv o O o o O »-
vO tN 00 Ov o tN IN fN t v 00
— < N r<j CN
c > ^N t N »-. • *
( ^ CN fN c^ n
CO CO CO CO CO
vo tN 00 c^ o CO CO CO CO • *
Riiq^ss: RRiR2si
l-H
%0 ^ ^0 ^ ^O
f3R2S2: — CN CO • * » « CO CO CO CO CO
t N — CO 0 0 vO
5S8S8
?:ffRSK
' - ^ 0 3 CO • * l O O^ Ov O^ Os ^ N
?îr52cN:2
c§{^SR8
î:PI2SiR
vO tN oo C> o 0^ Ov Ov Ov o
vO vO vO vO f N
î^!::2H;^
1-4
CN[^?3;^}Q
cQ CN r« 8 CN
O^ Qs 0 \ ^K Q\
2SÎ:J^CQ
\ Q %0 yQ s£) \ Q
812215} îQ S2I5SÎÎ}
v 4 1-4 « - t
RcN?322 00 00 00 00 o^
R22î5i:2
î o lO lO lO vO
RS2::?Î
«-I
ôo 00 00 00 00
CN^SgjSS
l o u> m m l o
22{Qï:?î
CNÎÎI^îSiQ
«
f5i2{îisi?3
vO t N 00 CJV o
RS22S
^M . - , . _ V.« CN
j o tN J * œ vo
5:Qi9?^
«
1 2fîiR2cN
ê
V <> l O CN t N
RicNS^:2R
- < CN) CO - ^ l O ^ 1
vO tN 00 C > Q
vo ^N OO e^ O
1-4 V-« t-H ^ 1
- " f N CO N f l O
1
4)
ê'
^
u
é
II ^
rmaal verdeeld, /i = 20, o
11
».BEL R.
n
fO
vO
T A B E L S.
D E TOETS VAN KOLMOGOROV-SMIRNOV
Kritieke waarden van D bij tweezijdige toetsing Onbetrouwbaarheidsdrempel a M
0,20
0,15
0.10
0,05
0,01
1 2 3 4 6
0,900 0,684 0,565 0,494 0,446
0,925 0,726 0,597 0,525 0,474
0,950 0.776 0.642 0,564 0,610
0,975 0,842 0,708 0,624 0,566
0,996 0,929 0,828 0,733 0,669
6 7 8 9 10
0,410 0,381 0,358 0,339 0,322
0,436 0,405 0,381 0,360 0,342
0,470 0,438 0,411 0,388 0,368
0,521 0,486 0,457 0,432 0,410
0,618 0,577 0,643 0,514 0,490
11 12 13 14 15
0,307 0,962 .0,284 0,274 0,266
0,326 0,313 0,302 0,292 0,283
0,352 0,338 0,326 0,314 0,304
0,391 0,375 0.361 0,349 0,338
0,468 0,450 0,433 0.418 0,404
16 17 18 19 20
0,258 0,250 0,244 0.237 0,231
0,274 0,266 0,259 0,252 0,246
0,295 0,286 0,278 0,272 0,264
0,328 0,318 0,309 0,301 0,294
0,392 0,381 0.371 0,363 0,356
26 30 36
0,21 0,19 0,18
0,22 0,20 0,19
0,24 0,22 0.21
0,27 0,24 0,23
0,32 0,29 0,27
1,07
1,14 y/n
1,22
1,36
1,63
V«
V«
> 35
V«
V«
N a a r M A S S E Y (103).
317
BIJLAGE II
ENKELE BEGRIPPEN UIT DE ELEMENTAIRE ALGEBRA 1. Het gebruik van symbolen Als men vijf waarnemingen aan een variabele grootheid x heeft verricht, kuimen deze door het toekennen van indices worden onderscheiden: Xl, X2, «8, «4 en x^. Zijn n waarnemingen verricht, dan schrijft men «1, «2» jXnOiXi (t = 1,2,...,»). De som van deze waarnemingen is : *i + «2 + + *«• Men kan dit compacter schrijven door gebruik te maken van het somteken E: ^1 + ^2 +
+Xn=
n E Xi. i-y.
t)e index onder het somteken geeft aan, dat de sommering begint bij Xl i die er boven deelt mede, dat moet worden gesommeerd tot en met Xn. Als men bv. slechts de eerste vier waarden van x wenst te sommeren, 4
schrijft men : E Xi. i-l
Deze notatie kan worden vereenvoudigd door af te spreken, dat de indices (gedeelteHjk) worden weggelaten als men over aUe n waarden sommeert, zodat men dan kan schrijven : » E Xi = E Xi = Ex. <=i
i
Voorbeelden 1
1. S Xi = x^ + Xi + Xo + x., i-4
6
2. 27 xffi = x^o + ^é^d + " ^ i i=% 8
S
3. s aXi = ax^ + ax, + ax, + axg = a{x^ + x, + x, + x^) = a S Xi i~i
318
<..6
SYMBOLEN
4. h {Xi - 2) = (Xi - 2 ) + (x^ - 2 ) + (Xt - 2 ) = X 2 + Xg + X i - 3(2) <»2
= hxi-b i-i 4
5. S X i - 2 = Xi + x ^ + X t - 2 <-2
6. Sfx = SfiXi ^ f i X i + / ^ , +
+ ƒ„*„
i-l
7. i (;r, 4- y^) = {Xi + yi) + (*, + y^) + (AT, i-l
-|-
y,)
= (*i -i- *2 + *») + (yi + ^2 + ya) =
-2^ * i + 2: yi i-l
i-l
8. S {Xi - a ) ' = S ( V - 2«;^, 4- «») = iJr.« - 2a-2:xt + na» i-l
i
i
i
Als een variabele de waarden Xi{i = 1,2, , Ä) heeft aangenomen, noemt men het aantal malen dat «< voorkomt, de frequentie van deze waarde: symbool ƒ<. Als er in totaal n waarnemingen verricht zijn, geldt
^"^^
h +h +
+ h = f/i = ^/= «.
Voor de som van de n waarden kan men dan schrijven : E fiXi, of alleen: T/». <=i Voorbeeld Xi "i fi h^i
\
2 1 2
3 — —
4 3 12
5S 7 35
b6 5 30
7 ~ 88 " 2 3 21 16
2:/ = M = 21 2y;v= 116
Tenslotte vermelden wij enkele tekens, die veel gebruikt worden : = : gehjk aan < : kleiner dan > : groter dan
< : ten hoogste gehjk aan ^ : ten minste gelijk aan s : bij benadering gelijk aan
5^ ; ongeHjk aan -> : nadert tot 00 : oneindig
OPGAVEN 1. Geef onderstaande sommen een compacter vorm: «• «s + •*» -F *io -I- * u + *i2 b. 4x2 + 4x3 + 4Xi + 4^5 c. a x ^ ^ + axtyt + ax^y^ d. (Xi — a) + (x^ - a) + {x^ — a) + + (*4 - «) 2. Men beschikt over de volgende reeks waarnemingen: Proefpersfxjn X
1 2 3 4 5 6 2 4 6 3. 2 3
7 8 9 4 4 7
10 11 1 6
12 13 5 4
14 6
15 3
319
BIJLAGE 11 Bepaal de numerieke waarde van : Sx a) SXi b) S { x i - 2 ) c)±^ 15 i i-l ƒ)
EXi/Z
d)
g) (EXi)'
h) S X i '
i
i
i-8
* SXi-2 i-l i)
e) E{Xi-- 2 ) » i-l
i2(Xi - 1 ) « i-l
2. Permutaties en combinaties PERMUTATIES
Zoals uit nevenstaand schema bhjkt, kunnen de letters a, b en cop 3 x 2 x 1 = 6 verschillende manieren worden gerangschikt. Men noemt deze rangschikkingen permutaties en het is duidelijk, dat het aantal permutaties van n objecten gehjk is aan : (1) n { n - l ) { n ~ 2 ) . . . { 3 ) { 2 ) { l ) .
Ie plaats 2e plaats 3e plaats ^^______b -c ^~'==^ [^ ^ b-=___'' a *=""==^b
-b a
Men kan (1) korter schrijven door gebruik te maken van de 'afkorting' nl {n faculteit). Dus: 8! = 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 40320. Per definitie stelt men : O! = 1. Vervolgens beschouwen wij het aantal permutaties dat uit n objecten kan worden gevormd als per permutatie slechts x {< n) van de objecten worden gebruikt. Men kan dan de eerste plaats op n manieren bezetten, de tweede op n— 1 manieren, enz. Als men de x' plaats bereikt, zijn X— 1 objecten gebruikt, zodat er nog n — {x—l) = n — x-{-\ voor keuze in aanmerking komen. Als wij het gevraagde aantal permutaties JPas" noemen, geldt dus : (2) P,n = n{n - 1) {n - 2) (« - * -f- 1) = -^0^. daar »! = n{n — \) {n — 2)
{n — x -{- l) {n — x)l Als wij x = n »' stellen, gaat (2) over in (1) : P„" = -—- = »! 0!
OPGAVEN
1. Schrijf systematisch alle permutaties van 3 letters uit de letters a, b, c en d op. 2. Verifieer, dat: a. 61 = 720 b. 201 = 20 X 19 X 18! c. M + ^^•' = (x + 3) {x + 2){x + 1) 101 * 10!6!41 240 rf.P,» = 20 e . P , ' = Sl f.-^=720 g.-^^^ = - ^ 3. Welke waarde heeft a in de volgende vergelijkingen? a. (n + 1)1 = «(« d. a{a + 1) (6!) = 81
320
1)1
b. 72{a\) = 91
"' ï ^ = ^
e. 141 + «(141) = 161
ƒ. 6« = 71 - «
PERMUTATIES EN COMBINATIES COMBINATIES
Met behulp van vergelijking (2) kunnen wij nu de volgende vraag beantwoorden: Op hoeveel verschillende manieren kunnen x objecten uit de n objecten worden gekozen? Hierbij gaat het dus om combinaties van X objecten, zodat hun rangschikidng niet ter zake doet. Twee combinaties zijn verschillend, indien zij niet uit dezelfde objecten bestaan. Dus: «6c en abd zijn verschillende combinaties van drie letters; abc en bca zijn verschülende permutaties van dezelfde combinatie. Voor het aanduiden van het aantal combinaties van x objecten uit n objecten zijn verschillende sjonbolen in gebruik, zoals: „C„ C{n. x) en CJ. oWij gebruiken steeds de laatstgenoemde notatie. Het is duideUjk, dat P^" = x\ • C«", daar elke combinatie van x objecten op x\ manieren gepermuteerd kan worden. Hieruit volgt: »! In — x)^
p n
' ~ ' ^ ~
W
x\
»I
~ x\{n - x)\ ~ ""^
Het aantal combinaties van 4 letters, dat men uit 7 letters kan vormen, 7'
7 V6 V 5
bedraagt dus bv. : C^ = -rprr = ' ^ , = 35. 4!3! 3x2x1 Met (3) kunnen bv. vraagstukjes worden opgelost van de volgende aard: Uit een groep van 8 mannen en 5 vrouwen wordt een commissie van 5 personen gevormd. Hierin dienen twee vrouwen zitting te hebben. Op hoeveel manieren kan deze commissie worden samengesteld? Er dienen twee handelingen verricht te worden : 1. Het kiezen van 2 uit de 5 vrouwen, 2. Het kiezen van de andere 3 leden uit de 8 mannen. Het aantal manieren, waarop men de 2 vrouwen kan kiezen is volgens 5! (3): Cg^ = • '
Ziiói
5X4 = — — = .^ X 1
10. De drie mannen kunnen op Cj*
8! 8x7x6 ^^ . , ^ „„ , . .. = ^rr-, = — = 56 mameren gekozen worden. Elke combmatie 3!5! 3x2x1 ^ van 2 vrouwen vormt met elke combinatie van 3 mannen een verschillende combinatie van 5 personen, zodat de gevraagde samenstelling op 10 X 56 = 560 manieren tot stand kan komen. OPGAVEN 1. Verifieer, dat: «. C* = 126
b. C ^ = 2300
c. C « = 1
d. C^' .01"= (210)«
321
BIJLAGE II 2. Betreft het voorgaande voorbeeld inzake de c»mmissiesainenstelling : a. Op hoeveel manieren kan de commissie worden samengesteld, als daarin ten minste 3 mannen zitting moeten hebben? b. Als omtrent de samenstelling niets wordt voorgescdireven ? 3. Een groep kinderen bestaat uit 8 jongens en 6 meisjes. E r kunnen 5 kinderen naar een vacantie-kolonie worden gezonden. Op hoeveel verschillende manieren kunnen deze worden gekozen, als er ten hoogste 3 jongens kunnen worden uitgezonden? 4. Bij een voetbalpool dient men van 15 wedstrijden aan te geven of de thuisclub wint, verliest of gelijkspeelt. Hoeveel oplossingen moet men indienen om er zeker van te zijn, dat de juiste uitkomst der 16 gespeelde wedstrijden zich daarbij bevindt?
3. Exponenten en wortels Het product of gedurig product van gelijke factoren noemt men een macht. Het getal dat aangeeft uit hoeveel gelijke factoren een macht bestaat, heet de exponent; de factor noemt men het grondtal der macht. Van de macht «" is dus a het grondtal en » de exponent. Per definitie stelt men : «" = I en «-» = Men noemt — = a-^ de reciproke van a. Een getal 6, dat tot de macht » verheven een getal « oplevert, noemt men een wortel uit a. Daar 2* = 4 is 2 de tweedemachtswortel uit 4. Daar 3^ = 27 is 3 de derdemachtswortel uit 27, enz. In het algemeen : als 6" = «, is 6 de »*» machtswortel uit a. De tweedemachtswortel uit een getal noemt men in de regel kortweg: de wortel m't dat getal. Men schrijft Va ook wel als a» en v'«'» als «». Wij brengen verder de volgende eigenschappen van exponenten in herinnering: 1. («»)(«")=«"•+» bv.:10«x 10*= 10^ 2. («")" =««» bv.:(10«)« =10". 3. («6)« =«-•6» bv.:(10 x4)*=10M«. «"* 3* 4. —- = ««-» bv,:—- = 3». «"
3*
Bij het uitvoeren van statistische berekeningen heeft men vaak de kwadraten, (tweedemachts)wortels en reciproken van getallen nodig. Voor de getallen van 1 t/m 12.500 kan men deze opzoeken in de tafel van BARLOW (65). Als men een wortel wü trekken uit een getal, dat niet in de tafel voorkomt, zoals bv. het getal 274901, kan deze toch worden gebruikt. Men zoekt dan het getal op, waarvan 274901 het kwadraat is. In de kwadratenkolom van de tafel vinden wij : « = 524 3 n = 524 4 322
, n» = 27 48 90 49, n» = 27 49 95 36.
EXPONENTEN EN W O R T E L S ; LOGARITHMEN
Afgerond op één decimaal is de gewenste wortel dus 524,3. Zo nodig kan de volgende decimaal door interpolatie worden verkregen : » n'
524,3
X
624,4 __. „ , 274901 - 274890,49 „, \ — " = ^^^'^ + 274995,36-274890,49" °'^ 274890,49 274995,36 Ar« = 274901 = 6 2 4 , 3 + (0,102) (0,1) = 5 2 4 , 3 1 .
Als men over een rekenmachine beschikt kan het worteltrekken eenvoudig plaatsvinden door herhaald te delen. Bijv.: ^78,393316 = ? Het is duideUjk, dat de gevraagde wortel tussen 8 en 9 Ugt. Kies nu 8,5 : 78,393316 ^ ^ ^ ^,5 + 9,2 ^ g g^ 78,393316 ^ g g^g 8,5 ' 2 8,85 8,85 + 8,858^ g 78,393316 ^ 2 8,854 Dus: ^78,393316 = 8,854. OPGAVEN 1. Schrijf elk der volgende vormen als een product van de getallen 2, 3, 6 en 7: a. 20».46» b. (24-36)* c. 18«"-16»-42» d. (16-9.18)» 2. Geef geHjkwaardige uitdrukkingen, waarin alle exponenten positief zijn, voor: a'b-^c'd pq-*r-'s (ai)-«c'rf-»e« , x-^'w-^sr* . b. rr:;— c. — „ , _ . , , . . d. a-'b'(fid-* st-^r a*b-'cr^(de)' ' y'x-'ur^z' 3. Schrijf elk der volgende uitdrukkingen als een wortel: c
a+c
•
a. xi b. {c + d)* c. y i d. h a e. 3 ' 4. Trek de vierkantswortel uit onderstaande getallen : a. 0,00064 b. 4000 c. 284865,20 d. (2»)* (32)« (6)-* e. 268,6321 ƒ. 0,002106 g. 1399 h. 0,07213
4. Logarithmen Definitie : De logarithme van een getal a is de exponent, die aangeeft tot welke macht men een aangenomen grondtal g moet verheffen, ova. het getal a te verkrijgen. Dus : log,«. (4) g =a. Alle getaUen met hun logarithmen, die tot een zelfde grondtal of basis behoren, vormen tezamen een logarithmenstelsel. Logarithmen met grondtal 10 worden veel gebruikt. In dat geval geldt dus: , logio a (5) 10 = a. Men laat bij deze logarithmen de index 10 meestal achterwege, zodat log « steeds betekent : logi^ «. Op grond van (5) kunnen de logarithmen 323
BIJLAGE II
van getaUen, die een macht zijn van 10, direct worden opgeschreven, zodat bv. : log 1000 = log 10« = 3 log 100 = log 10« = 2 log 10 =loglOi = 1 log 1 = log 10» = O log 0,1 = log 10-1 = -1 log 0,01 = log 10-* = -2 log 0,001 = log 10-« = -3 Negatieve getaUen en nul bezitten geen logarithme. In het algemeen bestaan logarithmen uit een aantal gehelen (de wijzer) en een onmeetbaar getal (de mantisse). De wijzer kan direct worden bepaald (zie boven) : a. Voor een getal groter dan 1 is de wijzer één minder dan het aantal cijfers, dat voor het decimaalteken is geplaatst, b. Voor een getal kleiner dan 1 is de wijzer negatief en numeriek één groter dan het aantal nuUen, dat achter het decimaalteken staat. Bv. : De wijzer van 863 is 2, de wijzer van 0,00863 is —3. De mantisse kan üit een tafel worden afgelezen. Verifieer met een logarithmentafel, dat in 5 dedmalehnauwkeurig: log 863 =2,93601, log 0,00863 =^ 0,93601 - 3, •log 3000 = 3,47712, log 3 = 0,47712 log 0,3 = 0 , 4 7 7 1 2 - 1 . Negatieve logarithmen worden, evenals de positieve, zo geschreven dat de decimalen de mantisse voorsteUen; voor —3,51268 schrijft men dus 0,48732-4. Wij vermelden de volgende eigenschappen van logarithmen, die uit de definitie volgen (deze gelden voor elk logarithmenstelsel, maar de voorbeelden betreffen het stelsel met grondtal 10) : 1. log («) (6) = log«4-log6... log (5)(10) =log5-I-log 10 = 0,69897-f-f 1 = 1,69897 = log 50. 2. log? = log « - log b log Y == log 10 - log 5 = 1 - 0,69897 = = 0,30103 = log 2. 3. log«» = 6log« Iogl0« = 21ogl0 = 2 x 1 = 2 = logl00. 4. l o g ^ =log«-» = —61oga.. log 10-2 = — 2 log 10 = —2 = log0,01.
5. log ^« = log«^ = ^-2if... log nöÖ = l ^ l l ^ = 1 = log 10.^ o
2
Als voorbeeld geven wij enkele berekeningen, die met behulp van logarithmen zijn uitgevoerd : (6,803) (0,04362) (0,512) = ? ^7922 = ? (2,91)* = ? 324
BENADERENDE GETALLEN
log6,803
=0,83270
log 7922 _ 3,89883
log 0,04362 = 0,63969 - 2 — 3 3 log 0.512 = 0 , 7 0 9 2 7 - 1 =1,29961 log product = 2,18166 — 3 wortel = 19,935 = 0,18166-1 product =0,15194
4log2,91 = 4(0,46389)
= 1,85556 vierde macht = 71,71
Logarithmen md grondtal e Deze zg.natuurüjke logarithmen hebben als grondtal ß = 2,718282..., d.i. de limiet waartoe (1 -f*)» nadert, als » nadert tot oneindig. Zij worden in de wiskunde ved gebruikt en aangeduid met In, dus In a = log, « of »log «. Natuurlijke logarithmen kunnen eveneens in een tafel worden opgezocht of uit logarithmen met grondtal 10 worden afgeleid volgens:. (6) /« « = log, « = (log, 10) (logio«) = 2,3026 logw « = 2,3026 log «. OPGAVEN 1. Verifieer met een logarithmentafel, dat in 5 decimalen nauwkeurig: a. log 9,94 = 0,99739 c. log 8510 = 3,92993 b. log 0,531 = 0,72509 - 1 d. log 0,002646 = 0,42243 - 3 2. Bepaal de logarithme van : «. 12,37 c. 0,001152 e. 20000 g. 0,0016 b. 4;03 d. 0,2354 ƒ. 5375 h. 0,0000i367 3. Bepaal.het getal, waarvan de logarithme is: «. 1,18469 c. 0 , 8 2 1 3 8 - 1 e. 0,14208 g. 8,74273-10 b. 3,62552 d. 6,74772 - 10 ƒ. 2,99996 h. 0,00432 4. Voer onderstaande berekeningen uit met behulp van logarithmen: ^ 37,62 X 4,921 52,34 682,3 • (0,631)» 9,723 X 8,46 (68,19)'/.
d. (3,32) (61,54)
0,041
5. Benaderende getallen HET AANTAL BETROUWBARE CIJFERS
Bij een discreet verdedde grootheid worden de waamemingsuitkomsten door teUen verkregen, zodat deze groothdd slechts gehele waarden kan aannemen. Het verschü tussen twee uitkomsten bedraagt dus steeds een of meer eenheden en de uitkomst is exact vast te steUen. Bij een continu verdedde groothdd worden de uitkomsten door meten of wegen verkregen. Zij kunnen een continuum van waarden doorlopen en theoretisch kan het verschil tussen twee uitkomsten wülekeurig klein worden..In de praktijk verkrijgt men echter steeds benaderende uitkomsten, waarvan de nauwkeurigheid afhankdijk is van de 325
BIJLAGE II
ter beschikking staande apparatuur en van de eisen, die de onderzoeker stdt. Meet men bv. de Üchaamslengte van kinderen, dan kan dit nog wel in mm nauwkeurig geschieden, maar dit zal bijzondere zorg en dus extra tij^ vereisen, terwijl deze nauwkeurigheid zdden noodzakelijk zal zijn. Als men de uitkomsten van zo'n meting nu in cm nauwkeurig geeft, behoeven twee kinderen met dezelfde uitkomst dus niet even lang te zijn: meestal betekent de uitkomst x = 132 cm immers 131,5 < « < 132,5, zodat bv. zowel 131,6 cm als 132,4 cm als ,132 cm genoteerd worden. Men zegt dan, dat de uitkomst 132 cm drie bdrouwbare cijfers bevat en het is duidelijk, dat dit aantal niet verandert als men een andere maateenheid gebruikt en bv. opgeeft 1,32 m of 0,00132 km. In het laatstgenoemde geval dienen de nuUen uitsluitend om de plaats van het dedmaalteken vast te leggen, zodat zij niet meeteUen ia het aantal betrouwbare cijfers. Bij getaUen als 5,09 of 60,05 teUen de nuUen vanzelfsprekend daarin wel mee, zodat zij 3, resp. 4 betrouwbare djfers bevatten. Het getal 8,5 bezit twee, maar 8,50 maakt aanspraak op drie betrouwbare cijfers. AFRONDEN
Bij het afronden houdt men zich meestal aan de volgende regels : a. Als het eerste cijfer dat vervalt kleiner is dan 5, büjft het daaraan voorafgaande cijfer onveranderd. Dus: 8,4644, afgerond op 4 betrouwbare cijfers, wordt 8,464. b. Als het eerste cijfer dat vervalt groter is dan 5 of als dit een 5 is, gevolgd door cijfers die niet aUe nul zijn, wordt het voorafgaande cijfer met 1 vermeerderd. Dus: 24,467, afgerond op 4 betrouwbare cijfers, wordt 24,47 0,61503, afgerond op 2 betrouwbare cijfers, wordt 0,62. c. Als het cijfer dat vervalt een 5 is, of een 5 is en gevolgd wordt door uitsluitend nuUen, volgt men in de regel de volgende (arbitraire) procedure: 1. Breng geen verandering in het voorgaande cijfer aan, als het even is, 2. Verhoog het met 1, als het oneven is (een nul wordt dan als even gerekend). Dus: 26,05, afgerond op 3 betrouwbare cijfers, wordt 26,0 0,875, afgerond op 2 betrouwbare cijfers, wordt 0,88. HET REKENEN MET BENADERENDE CIJFERS
Zonder naar voUedigheid te streven geven wij enkele aanwijzingen voor het rekenen met benaderende getallen. 326
BENADERENDE GETALLEN
«. Optellen en aftrekken Hierbij heeft men te maken met getallen, die aUe in dezdfde eenheid zijn uitgedrukt. Het criterium voor de betrouwbaarhdd is in dit geval dus het aantal betrouwbare dedmalen en als regel gddt : De som of het verschil van benaderende getaUen bezit niet meer be^ trouwbare dedmalen dan het kldnste aantal daarvan, dat voorkomt. Bijv.: 276,784 -f- 6,51 = 283,29 en niet 2S3,,'Z)A. 67,452 -f 56,1 — 23,43 =100,1 en niet 100,122. Men rondt pas af, als het opteUen en/of aftrekken heeft plaatsgevonden. b. Vermenigvuldigen en delen Hierbij dient men te letten op het aantal betrouwbare cijfers. Als regel gddt: Het product of quotiënt van twee benaderende getaUen heeft niet meer betrouwbare djfers, dan het kleinste aantal daarvan, dat voorkomt. Het product of quotiënt van een benaderend getal en een exact getal bevat evenved betrouwbare djfers als het benaderend getal. Bv. : Beschouw het product van 8,347 en 7,93. Als beide getaUen exact zijn, geldt: 8,347 x 7,93 = 66,19171. Als beide getaUen benaderend zijn, bevat hun product drie betrouwbare cijfers en is dus: 66,2. Als het eerste getal exact en het tweede benaderend is, verkrijgt men dezelfde uitkomst. In het omgekeerde geval bevat het product vier betrouwbare cijfers en dan wordt dit: 66,19. Beschouw vervolgens het volgende quotiënt van benaderende getaUen : 83,642 ^ ., y-
. De mtkomst is 1,2, daar het getal 72 slechts twee betrouw-
bare cijfers telt. c. Kwadrateren en worteltrekken Het kwadraat van een benaderend getal telt evenveel betrouwbare djfers als het getal zelf. Als 1,3 een benaderend getal is, geldt dus: (1,3)«= 1,7 en niet 1,69. Ook de wortel uit een benaderend getal heeft evenveel betrouwbare cijfers als dat getal. Als 30,74 een benaderend getal is, geldt dus: V30,74 = 5,544. OPGAVEN
1. Veronderstel dat alle onderstaande getallen benaderend zijn en geef de uitkomsten met het juiste aantal betrouwbare cijfers : 327
BIJLAGE II a. 56.3456 + 33,341 - 11,92 b. 6,375 + 12,5 + 3.29
e. (3,1416) (24,1) ƒ. (5,27834) (12,34) 9,2463 g. 25
c. (4,13)« d. Vb2,79 In onderstaande berekeningen is 25 een exact getal. Alle overige getallen zijn benaderend. Voer de berekeningen uit. (25) (13,57) 321,5 rf.-f^ (25)« b (36,44) (25) 3,65 25
6. Coördinaatassen HET AANGEVEN VAN PUNTEN IN HET ASSENSTELSEL
De meeste grafieken zijn gebaseerd op een assenstdsd, bestaande uit een horizontaal getrokken X-as en een loodrecht daarop staande Y-as. Het snijpunt der bdde assen noemt men de oorsprong en voor bdde assen is dit snijpunt het nulpunt. Het assenstelsel verdedt het beeldvlak in vier kwadranten (zie figuur A). In het eerste kwadrant (rechts boven) zijn xeny bdde positief, in het tweede (links boven) is x negatief en y positief, enz. De plaats van een punt t.o.v. het assenstelsd kan op ondubbelzinnige wijze met twee coördinaten worden aangeduid. Y-as
-3
328
-2 -1 O +1 +2 Figuur A. Coördinaatassen.
1." KWADRANT
+3
+4
+5
COORDINAATASSEN
Eerst vermddt men de x-coördinaat of abscis, d.i. de afstand van het punt tot de Y-as. gemeten evenwijdig aan de X-as. Vervolgens geeft men de y-coördinaat of ordinaat, d.i. de afstand van het punt tot de X-as gemeten evenwijdig aan de Y-as. Het punt Q infiguurA wordt zodoende aangegeven met (—4, -|- 4). daar voor dit punt x = —4 en y = 4. Bij de grafieken, die men in de statistiek ontmoet, wordt meestal het eerste kwadrant (-|- , -|-) gebruikt. DE RECHTE LIJN IN HET ASSENSTELSEL
Men noemt y een functie van x, als door een of andere vergeUjking aan bepaalde waarden van x bepaalde waarden van y worden gekoppeld. De meest bekende functie, de lineaire, bezit de algemene vorm: y = A-\-Bx. waarin A en B constanten zijn. Een voorbedd van een lineaire functie is dus: y = 4 -\- 2x. Beschouwt men :«; als de grootheid, waarvan de waarden worden gekozen (de primaire of onafhankeUjk variabde. ofwel het argument), dan is voor dke waarde van 'x de waarde van y (de afhankelijk variabde of functie) vastgelegd.
-5
-4 - 3
-2
-1
O +1 +2 +3 +4 +5 +6 +7 +8 X
Figuur B. Grafische voorstelling van enkele lineaire fancties.
329
BIJLAGE II
De grafische voorstelling van de Uneaire functie is de rechte lijn. In figuur B zijn een vijftal lineaire functies in hetzelfde assenstelsel getekend. Wij zien, dat de constante A in de functievergeUjking het punt aangeeft, waar de rechte de Y-as snijdt; de rechte loopt door de oorsprong, als .4 = 0. dus voor de functie y = Bx. De constante B is bepalend voor de heUing van de Ujn en wordt daarom de, hellings- of richtingscoëfficiënt genoemd. Er zijn nog vele andere functies, waarvan wij slechts de functie: y = AB' noemen. Door het nemen van logarithmen verkrijgt men: log y = logA-\-x log B, waarvan de grafische voorsteUing dus een rechte is. OPGAVEN 1. Teken op één assenstelsel de rechten met de volgende funcïtievergelijkingen : a. y = — 3 + 2;^ b. y = —3 — 2x c. y = 3 — 2x d. y = 3 + 2x 2. Stel grafisch voor: a. y = \ x b. y = b — 3x c. y = — 1 —3x d. y = i + i x e. log y = log 3 -1- (log2);ir ƒ. log y = log 10 + (log 6)* 3. Geef de vergeUjking van de rechte, die door de volgende punten loopt: a. (0,0) en ( - 6 , - 2 ) b. (0,0) en (5, - 3 ) c. ( - 2 , 3) en (0,7) d. ( - 1 , - 3 ) en (7, - 2 ) e. (2, - 9 ) en ( - 7 , - 3 )
330
BIJLAGE III
LITERATUUROPGAVE DEEL I-A Algemeen 1.
ADAMS, J . K . - Basic Statistical Concepts, McGraw-Hill Book Company, New York, 1955 2. BAKKER, A. - Hulpmiddelen bij het maken van een frequentieverdeling. Sigma 3 (1956), 62 3. BAKKER, Prof. Dr. O. - Statistiek, deel I en II, J. Muusses, Purmerend 4. BENNETT, C. A . en FRANKLIN, N . L . - Statistical Analysis in Chemistry and the Chemical Industry, John Wiley and Sons, New York, .1954 5. BROSS, IRWIN D . J. - Design for Decision, The MacMillan Company, New York, 1953 6. CROXTON, F . E , en COWDEN, D . J. - Applied General Statistics, PrenticeHall Inc., New York, 1960 7. DAVID, F . N . - Probability Theory for Statistical Methods, Cambridge University Press, New York, 1949 8. DIXON, W . J. en MASSEY, F . J. - Introduction to Statistical Analjrsis, 2nd ed., McGraw-Hill Book Company, New York, 1957 8a. EISENHART, C , C.S. - Selected Techniques of Statistical Anal3«is, Columbia University, Statistical Research Group, McGraw-Hill Book Comp., New York, 1947 9. ENTERS, J. H. - MogeUjkheden en moeilijkheden bij het toepassen van de sequentietest, Statistica (1948), 138-154 10. ENTERS, J . H . - Het aantal noodzakeUjke waarnemingen bij toepassing van voortschrijdende steekproeven, Statistica (1949), 179-200 11. ENTERS, J . H . - Het gebruik van toevalscijfers, Statistica (1951), 81-95 12. EXALTO, L . J . H . - Gebruik en toepassing van waarschijnUjkheidspapier, Statistica (1950), 121-128 13. FELLER, W . - An Introduction to Probabiüty Theory and Its AppUcations, John Wiley and Sons, New York, 1950 14. FERRO, H . - Grafiekenpapier, Statistica (1954), 123-154 15. FREUDENTHAL, Prof. Dr. H. - WaarschijnUjkheid en Statistiek, De Erven F. Bohn N.V., Haarlem, 1957 16. GRANT, E. L. - Statistical QuaUty Control, McGraw-Hill Book Company, New York, 1946 17. HAMAKER, H . C. - Toevalscijfers, Statistica (1948), 97-106 18. HEMELRIJK, Prof. Dr. J. - Cursus Elementaire Mathematische Statistiek, Mathematisch Centrum, Amsterdam, 1952/53 19.
HEMELRIJK, Prof. Dr. J. en VAART H . R . VAN DER - Het gebruik van één-
20.
en tweezijdige overschrijdingskansen voor het toetsen van hjrpothesen, Statistica (1950), 54-66 HuFF, D. - How to Lie with Statistics, Norton and Company, New York, 1954 J. R. - Hulpmiddelen bij het werk, Sigma 2 (1956), 32
21.
331
BIJLAGE III 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33; 34. 36. 36.
JOHNSON, PALHER O. - Statistical Methods in Research, Prentice-Hall Inc., New York, 1949 KENDALL, M . G . - The Advanced Theory of Statistics, Vol. I en I I , Ch. Griffin Comp., London, 1945 MOOD, A. M. - Introduction t o t h e Theory of Statistics, McGraw-Hill Book Company, New York, 1950 MoRONEV, M. J. - Facts from Figures, Penguin Books Ltd., London, 2nd ed., 1953 NEYMAN, J . - First Course in ProbabiUty and Statistics. Henry Holt and Company, New York, 1950 NEYMAN, J. en PEARSON, E . S . - On the problem of the most effi.cient tests of statistical hypotheses. Ph. Trans. Royal Society, Ser. A, VoL 231 (1933), London NORMALISATIECOMMISSIE 70 - Weergeven van Waamemingsreeksen (ontwerp), Waltinan, Delft, 1951 SPROWLS, R . C . - Elementary Statistics, McGraw-Hill Book Company, New York, 1956 STARREVELD, Prof. R. W. - Ponskaartenmachines ten behoeve van statistische bewerkingen, Sigma 2 (1956), 27 VEEN, Dr. B. - Normaal waarschijnUjkheidspapier, Sigma 2 (1956), 80-83 WAERDEN, Dr. B. L. VAN DER - Mathematische Statistik, Springer Verlag, BerUn/Göttingen/Heidelberg, 1957 WALD, A. - Sequential Analysis, John Wiley and Sons, New York, 1947 WALKER, H . M . - Mathematics Essential for Elemenfciry Statistics, Henry Holt and Company, New York, 1951 WALKER, H . M . en LEV, JOSEPH - Statistical Inference, Henry Holt and Company, New York, 1953 WALLIS, W . ALLEN, en ROBERTS, HARRY V. - Statistics, a new approach.
38.
The Free Press, Glencoe, lU., 1956 WILKS, S . S . - Elementary Statistical Analj^is, Princeton University Press, Princeton, New Jersey, 1949 WOLFF, ïtof. P . DE - Bedrijfsstatistiek, Samson N.V., Alphen
39.
Y U L E , G . U . en KENDALL, M . G . - An Introduction t o t h e Theory of
37.
Statistics, Ch. Griffin Comp., London, 13th ed., 1946 Medisch-biologisch 40. 41. 42. 43. 44. 45. 46. 47.
332
BERNSTEIN, L . en WEATHERALL, M . - Statistics for Medical and Other Biological Students, E . S. Livingstone Ltd., London, 1952 BoK, Prof. Dr. S. T. - De Gedachtengang van de Statistica, 2e dmk, Stenfert Kroese, Leiden, 1948 BRADFORD HILL, A. - Principles of Medical Statistics, The Lancet Ltd, London, 5th ed., 1952 CROXTON, FREDERICK E . - Elementary Statistics with- Applications in Medicine, Prentice-Hall Inc., New York, 1953 FISHER, R . A. - Statistical Metiiods for Research Workers, OUver and Boyd, Edinburgh, 10th ed., 1948 MAINLAND, D . - Elementary Medical Statistics, W. B. Saunders Company, Philadelphia-London, 1952 MAINLAND, D . - Statistics in Medical Research, Methods in Medical Research Vol. 6, Section I I I , The Year Book Publishers, Chic, 1954 MATHER, K . -. Statistical Analysis in Biology, Methuen and Company, London, 2nd ed., 1946
LITERATUUROPGAVE 48. 49.
PEARL, R. - Introduction t o Medical Biometry and Statistics, W. B . Saunders Company, 3rd ed., 1941 SNEDECOR, G . W . - Statistical Methods. Iowa State College Press, Ames, Iowa, 4th ed., 4th printing, 1960
Proefopzet 50. 50«. 51. 52. 53. 54. 55. 56. 57. 68. 59. 60. 61. 62«. 62&. 63. 64.
The place of statistical methods in biological and chemical experimentation. Annals of the New York Academy of Sciences, 52 (1950), 789-942 BRADFORD HILL, A. - The clinical trial, Br. Med. Bull., 7 (1951), 278 COCHRAN, W . G . - SampUng Techniques, John Wiley and Sons, New York, 1953 COCHRAN, W . G . and Cox, G. M. - Experimental Designs, John Wiley and Sons, New York, 1950 DEMING, W . E . - Some Theory of Sampling, John Wiley and Sons, New York, 1950 DBION, Dr. E . F . - Enige statistische b ^ r i p p e n , N.T.V.G., 97, 22/8/53 EDWARDS, ALLEN L . - Experimental Design in Psychological Research, Rinehart and Comp., New York, 1950 FISHER, R . A. - The Design of Experiments, OHver and Boyd, Edinburgh, 4th ed., 1947 GREENBERG, B . G. - Why Randomize? - Biometrics, 7 (1941) JONGH, Dr. D. K. D E - De betekenis van het placebo, N.T.V.G., 98 (1954), 1943-1950 JONGH, Dr. D. K. D E - Design for decision in het cUnische experiment. Mededelingen Medisch-Biologische Sectie V.v.S., 1957, nr. 2. KEMPTHORNE, O . - The Design and Analysis of Experiments, John Wiley and Sons, New York, 1962 PANNEKOEK, Dr. J. H. - Critiek bij de beoordeling van de werkzaamheid van geneesmiddelen. Medisch Contact, 26/1/66 ROMKE, Dr. CHR. L . - Kwantificering in medisch onderzoek, Statistica (1953), 223-232 RÜMKE, Dr. CHR. L . - De taak van de medische statistiek. Openbaar college, 1968 WILSON J R . , E. B. - An Introduction to Scientific Research, McGraw-Hill Book Comp., New York, 1962 YATES, F . - Sampling Methods for Censuses and Surveys, Ch. Griffin Comp, 2nd ed., 1953
Tabellenvergamelingen 65. BARLOW'S TABLES (Squares, Cubes, Square roots. Cube roots and reciprocals of all integers up to 12.600), Spon, London, 1954 66. FISHER, R . A. en YATES, F . - Statistical Tables, OUver and Boyd, Edinburgh, 4th ed., 1953 . 67. HALD, A. - Statistical Tables and Formulas, John Wiley and Sons, New York, 1962 68. HARVARD UNIVERSITY - Tables of t h e Cumulative Binomial ProbabiUty Distribution, Harvard University Press, Cambridge, Mass., 1955 69.
KAARSEMAKER, L . en WIJNGAARDEN, A. VAN - Tables for Use in Rank
70.
KENDALL, M . G . en BABINGTON SMITH, B . - Tables of Random Sampling
71.
Numbers, Cambridge University Press, 1946 MOLINA, E . C . - Poisson's Exponential Binomial Limit, Van Nostrand, New York, 1942
Correlation, Mathematisch Centrum, Amsterdam, 1952
333
BIJLAGE III 72.
NATIONAL BUREAU OF STANDARDS - Tables of the Binomial ProbabiUty
73.
OFFICE OF CHIEF OF ORDNANCE - Tables of the Cumulative Binomial
Distribution, Washington, 1950 74. 76. 76.
Probabilities, Ordnance Corps Pamphlet ORD P 201, Washington, 1952 PEARSON, E . S . en HARTLEY, H . O . - Biometrika Tables for Statisticians, Vol.1, Cambridge University Press, 1954 ROMIG, H . G . - 50-100 Binomial Tables, Wiley & Sons, New York; Chapman & Hall, London, 1953 WIJNGAARDEN, A. VAN - Table of the Cumulative Symmetric Binomial Distribution, Proc. Kon. Ned. Acad. v. Wet., 53 (1950), 857-868: Indag. Math. 12 (1950), 301-312
76«. STATISTISCHE TABELLEN EN NOMOGRAMMEN, H . E . Stenfert Kroese N.V.,
Leiden (uitgave in samenwerking met de Vereniging voor Statistiek) DEEL I-B Verdelingsvrije methoden 77. BENARD, A . en EEDEN, C. VAN - Handleiding voor de symmetrietoets van Wilcoxon, Rapport S 208 (M 76), Math. Centr., A'dam, 1956 78. BOER, J. DE - Sequential test with three possible decisions for testing an unknown probabiUty, Appl. Sc. Research B, 1953, 249-259 79«. COCHRAN, W . G . - The comparison of percentages in matched samples, Biometrika, 37 (1950), 256-266 796. COCHRAN, W . G . - The x ' test of goodness of fit, Ann. Math. Stat., 23 (1962), 315-346 80. COCHRAN, W . G . - Some methods for strengthening the common ;{«-tests. Biometrics, 10(1954), 417-451 81. DIXON, W . J. en MOOD, A. M. - The statistical sign test, J. Am. Stat. Ass., 41 (1946), 557-666 82. EEDEN, C. VAN - Methoden voor het vergelijken, toetsen en schatten van onbekende kansen. Rapport S 115 (M 45), Mathematisch Centrum, A'dam, 1953 83. ELTEREN, P H . VAN - Methode van de m rangschikkingen. Cursus Parametervrije methoden. Rapport S 59, Math. Centrum, A'dam, 1951 84.
86. 86. 87. 88. 89. 90. 91. 92. 93.
334
ELTEREN, P H . VAN, en RÜMKE, Dr. CHR. L . - De Sequente Binomiale
Toets, Mathematisch Centrum, Amsterdam, 1956 ENTERS, J . H . - De methode van de m rangschikkingen. Mededelingen Medisch-Biologische Sectie V.v.S., 1957, nr. 3 FESTINGER, L . - The significance of differences between means without reference to the frequency distribution function, Psychometrika, 11 (1946), 97 e.V. FINNEY, D . J. - The Fisher-Yates test of significance in 2 x 2 contingency tables, Biometrika, 35 (1948), 145-156 FRIEDMAN, M . - The use of ranks to avoid the assumption of normality, J. Am. Stat. Ass., 32 (1937), 675-701 FRY, T . C. - The x ' test of significance, J. Am. Stat. Ass., 33 (1938), 513 HEMELRIJK, Prof. Dr. J. - Rangcorrelatie en de schattingsproef van Varangot, Statistica (1950), 216-225 HEMELRIJK, Prof. Dr. J. - S3mimetrietoetsen, dissertatie. Den Haag, 1950 HEMELRIJK, Prof. Dr. J. - Parametrische en parametervrije methoden en hun toepassingen, Statistica (1951), 171-184 HEMELRIJK, Prof. Dr. J. en ELTEREN, P H . VAN - Cursus Toegepaste Statistiek, Mathematisch Centrum, Amsterdam, 1953
LITERATUUROPGAVE 94.
KENDALL, M. G. - Rank Correlation Methods, Ch. Griffin and Company. London, 1948 95. KLERK-GROBBEN, G . en PRINS, H . J. - Toets voor de gelijkheid van twee kleine kansen met behulp van even grote steekproeven en het onderscheidingsvermogen van deze toets, Statistica (1954), 7-20 96. KoLMOGOROv, A. - Confidence limits for an unknown distiibution function, Ann. Math. Stat. 12, (1941), 461-463 97. KRUSKAL, W . H . en W A L U S , W . A. - Use of ranks in one-criterion variance analysis, J. Am. Stat. Ass., 47, (1952), 584-618 98. LATSCHA, R . - Tests of significance in a 2 x 2 contingency table : Extension of Finney's table, Biometrika, 40 (1953), 74-86 99. IJTCHFIELD, J. T. en WILCOXON, F . - The rank correlation method. Analytical Chemistry, 27 (1955), 229-300 100. MAINLAND, D . en MURRAY, I. M. - Tables for use in fourfold contingency tests, Science. 116 (1962), 691-694 101. MANN, H . B . en WHITNEY, D . R . - On a test of whether one of two random variables is stochastically larger than the other. Annals of Math. Stat.. 18 (1947), 60-60 102. MATHEMATISCH CENTRUM - Memoranda van de Statistische Afdeling, Amsterdam, 1952 103. MASSEY, F. J. Jr. - The Kolmogorov-Smimov test for goodness of fit, J. Am. Stat. Ass., 46 (1961), 68-78 104. MOORE, G . H . en WALLIS, W . A. - Time series signfficance tests based on signs of differences, J. Am. Stat. Ass., 38 (1943), 153-164 105. MOSES, L . E . - Non-parametric statistics for psychological research. Psych. BuU., 49 (1952), 122-143 106. OLDS, E . G . - The 5% significance levels for sums of squares of rank differences and a correction. Aim. Math. Stat., 20 (1949). 117-118 107. PEARSON, K . - Karl Pearson's early statistical papers, Cambridge University Press, Cambridge, Mass., 1948 108. SIEGEL, S. - Nonparametric Statistics, McGraw-HiU Book Company, New York, 1956. 109. SMIRNOV, N . V. - Table for estimating the goodness of fit of empirical distributions, Ann. Math. Stat., 19 (1948), 279-281 110. SPEARMAN, CH. - The proof and measurement of association between two things. Am. J. of Psychology, 1904, 72-101 111. SwED, F. S. en EISENHART, C. - Tables for testing randomness of grouping in a sequence of alternatives. Ann. Math. Stat., 14 (1943), 66-87 112. TERPSTRA, T . J. A. - A generalization of Kendall's rank correlation Statistic, Proc. Kon. Ac. v. Wet., Serie A 58 en 59, 1955-56. 113. VAART, H . R . VAN DER - Gebruiksaanwijzing voor de toets van Wilcoxon. Rapport S 32 (M 4), Mathematisch Centrum, A'dam, 1950 114. WABEKE, Ir.-D. en EEDEN, C . VAN - Handleiding voor de toets van Wilcoxon, Rapport S 176 (M 65-65A), Math. Centrum, A'dam, 1955 116. WALSH, J. E . - AppUcations of some significance tests for the median which are vaUd under very general conditions, J. Am. Stat. Ass., 44 (1949), 342-355 116. WILCOXON, F . - Individual comparisons by ranking methods. Biometrics. BuU., 1 (1945), 8Ó-83 116a. WILCOXON, F . - Some rapid approximate statistical procedures, Stamford, Conn.: American Cyanamid Co., 1949 117. YATES, F . - Contingency tables involving small numbers and the x' test, Suppl. to. J. R. Stat. Soc, 1 (1934), 217-235
335