Leidraad bij het college
Kansrekening en Statistiek voor informatici Esdert Edens
februari 2006
Edens 060214-1610
–i–
Kansrekening en statistiek (Inf.)
1. Inleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2. Kansrekening en statistiek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.1 Algemene kansrekening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.2 Afgeleide kansrekening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.3 Statistiek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3. Verzamelingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3.1 Notatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3.2 Inclusie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3.3 Doorsnede. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 3.4 Vereniging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.5 Complement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3.6 Partitie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 4. Algemene kansrekening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4.1 Uitkomstenruimte, gebeurtenis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4.2 Kansbegrip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4.3 Voorbeelden (munt, dobbelsteen, n-aselector) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 5. Meervoudige experimenten. Trekkingen met en zonder teruglegging . . 11 5.1 Cartesisch product . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.2 Twee worpen met een munt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.3 Padenproductregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 5.4 Voorbeeld (vazen, ballen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 5.5 Ingewikkelde experimenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 6. Onafhankelijke gebeurtenissen. Voorwaardelijke kansen . . . . . . . . . . . . . . . . 13 6.1 Onafhankelijke gebeurtenissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.2 Definitie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.3 Vooruitlopen op voorwaardelijke kans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.4 Voorwaardelijke kansen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.5 Productregel voor voorwaardelijke kansen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 6.6 Regel van de totale kans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 6.7 Regel van Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 6.8 Voorwaardelijke kansen geven een ,,kansrekening” . . . . . . . . . . . . . . . . . . . . . . . . . . 14 6.9 Voorbeeld (knooppunten in circuit) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6.10 Raden van een getal onder de tien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6.11 Eerste zes bij dobbelsteen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6.12 Onweer, brug open, melkboer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16 6.13 Brand in bedrijf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 7. Vraagstukken over algemene kansrekening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 8. Stochastische variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 8.1 Uitkomstenruimte verbleekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 8.2 Definitie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 8.3 Discrete stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 8.4 Grafische voorstelling van een discrete verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 8.5 Sprongen in de verdelingsgrafiek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 8.6 Voorbeelden van discrete kansverdelingen, wiskundige voorbereiding. . . . . . . .22 8.7 Faculteiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 8.8 Binomiaalco¨effici¨enten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Edens 060214-1610
– ii –
Kansrekening en statistiek (Inf.)
8.9 De binomiale verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 8.10 De hypergeometrische verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 8.11 Hypergeometrische versus binomiale verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 8.12 De Poissonverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 8.13 Verband tussen binomiale en Poissonverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 8.14 Deegmachine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 8.15 Poissonproces, ongevallen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27 9. Verwachting, variantie en standaardafwijking . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 9.1 Verwachting van een discrete stochast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 9.2 Verwachtingen van enkele bekende verdelingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 9.3 Variantie en standaardafwijking van een discrete stochast . . . . . . . . . . . . . . . . . 30 9.4 Varianties van enkele bekende discrete verdelingen . . . . . . . . . . . . . . . . . . . . . . . . . 30 10. Continu-verdeelde stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 10.1 Definities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 10.2 Verwachting en variantie van continue verdelingen . . . . . . . . . . . . . . . . . . . . . . . . . 31 10.3 De (negatief)-exponenti¨ele verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 10.4 Onafhankelijkheid van stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 10.5 Voorbeeld (ongevallen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 10.6 Voorwaardelijke kansen bij stochasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 10.7 De normale verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 10.8 De standaardnormale verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 10.9 De tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 10.10 Het werken met de tabel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 10.11 Voorbeelden (normale verdeling). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .37 10.12 Berekening aan een algemene normale verdeling. . . . . . . . . . . . . . . . . . . . . . . . . . . .37 10.13 De ,,terugzoektabel” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 10.14 De Erlangverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 10.15 Verband tussen de Erlangverdeling en de Poissonverdeling . . . . . . . . . . . . . . . . . 38 11. Normale benadering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 11.1 Normale benadering van enige kansverdelingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 11.2 Verwachting en variantie van een som van stochasten . . . . . . . . . . . . . . . . . . . . . . 39 11.3 Normale benadering van de Poissonverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 11.4 Normale benadering van de Erlangverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 11.5 Normale benadering van de binomiale verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 12. Vraagstukken over kansverdelingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 13. Statistiek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 13.1 Inleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 13.2 Schatten van de verwachting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 13.3 Kwaliteit van de schatter x ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 13.4 Schatten van de standaardafwijking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 13.5 Schatten van de mediaan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 13.6 Ongevallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 13.7 Toetsen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 13.8 Vormen van toetsen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 13.9 Aanvaarden van de nulhypothese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 13.10 Samengestelde nulhypothese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Edens 060214-1610
– iii –
Kansrekening en statistiek (Inf.)
14. Enige statistische toetsen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 14.1 De normale toets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 14.2 De Studenttoets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 14.3 Het Poisson-verdeeld zijn van aantallen ongevallen (dispersietoets) . . . . . . . . . 53 14.4 De mediaantoets (tekentoets) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 14.5 Directe toets betreffende de tussentijden met de Poissonverdeling . . . . . . . . . . 54 14.6 Directe toets betreffende de tussentijden met de Erlangverdeling . . . . . . . . . . 55 14.7 Een toets betreffende de parameter van een exponenti¨ele verdeling . . . . . . . . . 55 14.8 Twee-steekproeventoets (F -toets voor ongevallen) . . . . . . . . . . . . . . . . . . . . . . . . . 56 14.9 Mann-Whitneytoets (Wilcoxontoets) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 14.10 Andere berekenwijze van Wxy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 14.11 Normale benadering van de Mann-Whitneytoets . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 14.12 Chi-kwadraattoets voor aanpassing aan een kansverdeling (Goodness of fit test) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 14.13 Aanpassing aan een Poissonverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 14.14 Aanpassing aan een exponenti¨ele verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 15. Betrouwbaarheidsintervallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 15.1 Betekenis van het betrouwbaarheidsinterval . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 15.2 Betrouwbaarheidsinterval voor λ uit ´e´en Poisson(λ)-verdeelde waarneming met grote λ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 15.3 Betrouwbaarheidsinterval voor λ uit n onafhankelijke Poisson(λ)-verdeelde tellingen (n groot). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63 15.4 Betrouwbaarheidsinterval voor λ uit n onafhankelijke exp(λ)-verdeelde waarnemingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 16. Enige termen uit bedrijfszekerheidstheorie (reliability engineering) . . . 65 17. Vraagstukken over statistiek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Tabellen Rechteroverschrijdingskansen van de standaardnormale verdeling . . . . . . . . . . . . . . . 71 Rechter kritieke waarden van de standaardnormale verdeling . . . . . . . . . . . . . . . . . . . 72 Rechter kritieke waarden van de Studentverdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Rechter kritieke waarden van de χ2 -verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Linker kritieke waarden Wilcoxon-Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Betrouwbaarheidsintervallen voor de mediaan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Rechter kritieke waarden van de F -verdeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Poissonverdeling (cumulatief) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Edens 060214-1610
–1–
Kansrekening en statistiek (Inf.)
1. Inleiding. In zeer veel vakken, vooral moderne, is enige kennis vereist omtrent kansrekening en statistiek; vooral voor toepassingen van kwantitatieve aard. Men wil voorspellingen doen, die zo betrouwbaar mogelijk moeten zijn. Anderzijds wil men uitspraken doen over voorvallen, die al hebben plaatsgevonden: stel dat op een bepaalde plek gemiddeld ´e´en ongeval per week plaats vindt. Laat daar nu vorige week drie ongevallen zijn geweest. Is dat ,,toeval”? Onze kansrekening dient dus rekenachtig, zeg wiskundig van aard te zijn. De wiskunde wordt gerekend tot de exacte wetenschappen; men gaat er uit van axiomastelsels. Dat maakt de wiskunde op zichzelf veilig; zolang niet te snel wordt overgegaan op een practisch model. Zo kan worden bewezen, dat de zwaartelijnen van een vlakke driehoek door ´e´en punt gaan. In de praktijk blijkt het zelfs met een scherp potlood nog aardig te kloppen, hoewel een zwaartepunt niet is te zien: de zwaartestrepen hebben een berg koolstof zo ongeveer gemeenschappelijk. Sterker: wat is in de praktijk een werkelijk vlakke driehoek? Toch. . . men rekent er mee en het komt vaak aardig uit. Met kansrekening en statistiek ligt de zaak ingewikkelder. Het kansgevoel is sterk subjectief. We geven enige voorbeelden. Het weer : Wanneer het weerbericht 20% regenkans vermeldt, wordt de paraplu nog al eens thuis gelaten. Russische roulette (moderne versie): Stel iemand in de gelegenheid aan de volgende loterij mee te doen: laat de persoon zes door hemzelf te bedenken cijfers opschrijven. Trek vervolgens zelf zes volkomen willekeurige cijfers, bijvoorbeeld met behulp van een computer. Indien beide zo ontstane getallen niet geheel overeenkomen, wordt de persoon f 10.000,– uitgekeerd. Indien de getallen w`el geheel overeenkomen, wordt overgegaan tot onthoofding van de persoon. Hoewel de kans op geld groot is, zullen niet veel mensen ingaan op de uitnodiging tot dit spel. Verkeersveiligheid : een kruispunt is altijd gevaarlijk. Iemand kan uit de bocht vliegen, of geen voorrang geven enz. Geef nu alvorens het kruispunt te naderen, vol gas. Indien het kruispunt op topsnelheid wordt overgestoken, is de kans op een ongeval klein: men is er immers een zeer korte tijd aanwezig. Verkeerde kansinterpretatie: neem wanneer je gaat vliegen een bom mee. Vrijwel zeker zal dan niets gebeuren, want de kans op twee bommen is toch wel erg klein. Een kansbegrip of kansgevoel waarin velen zich blijken te kunnen vinden is dat, wat in de praktijk stoelt op de zogenoemde experimentele wet der grote aantallen. Dat een mooi gemaakte munt zuiver is, betekent dan dat in een groot aantal worpen de aantallen keren kruis en munt ongeveer aan elkaar gelijk zijn. In sommige literatuur leest men wel een kansdefinitie die op dit principe berust: de kans op een bepaalde gebeurtenis wordt dan gedefinieerd als de limiet van de fractie van het aantal keren dat deze gebeurtenis optreedt; betrokken op het totaal aantal keren dat het experiment wordt uitgevoerd. Voor de limietovergang laat men dat het totale aantal naar oneindig gaan. Dit is geen juiste gang van zaken. Begrippen als limiet en oneindig behoren tot de wiskunde, die abstract is (d.w.z. afgetrokken van de werkelijkheid). In de praktijk bestaat geen oneindige rij experimenten. We volgen daarom een andere weg. Kansrekening zal een onderdeel van de (zuivere) wiskunde zijn. Het begrip ,,kans” wordt dus zuiver wiskundig gedefinieerd. Dat betekent, dat in te gebruiken wiskundige modellen de kansen aanvankelijk worden geponeerd. Dan kan (later) aan de hand van praktijkgegevens worden vastgesteld of de keuze van de kansen gelukkig was geweest of niet.
Edens 060214-1610
–2–
Kansrekening en statistiek (Inf.)
2. Kansrekening en statistiek. De kansrekening die wij behandelen is op te splitsen in twee delen, te weten een ,,algemene” en een ,,afgeleide” kansrekening. (2.1) Algemene kansrekening. Dit is een onderdeel van de zuivere wiskunde geworden. Sinds de veertiger jaren beschikt de kansrekening over een eigen axiomastelsel (opgesteld door de Russische wiskundige A.N. Kolmogorov). Twee belangrijke begrippen komen hier aan de orde: gebeurtenis en kans. Opdat de kansrekening wiskundig zal zijn, is het wenselijk deze begrippen wiskundig te funderen. De huidige wiskunde stoelt op de verzamelingenleer , nu gemeengoed op middelbare scholen (brugklas). Een gebeurtenis wordt nu beschreven als een verzameling. We moeten verder spreken over de kans op een gebeurtenis. De kans(waarde) is een getal; bij elke gebeurtenis moet dus een bepaald getal worden gevonden. De wiskunde heeft voor een dergelijke procedure een pasklare jas: het functiebegrip. Een kans is dus een functie(waarde), gedefinieerd bij elke gebeurtenis. Het is voor praktijkgevallen natuurlijk de kunst een goed passende kansfunctie te vinden; anders kloppen de resultaten niet met de werkelijkheid. Het rekenwerk zelf strekt zich uit over het werken met gebeurtenissen (al of niet gelijktijdig optreden, ontkennen, samen nemen) en het berekenen van de kanswaarden die daarvan het gevolg zijn. Het werken met gebeurtenissen is hetzelfde als het werken met verzamelingen. In de wiskunde is hierover een gigantische theorie opgebouwd. Wij hebben maar heel weinig ervan nodig; er is geen sprake van enige diepgang. De grootste moeilijkheid is nog (eventueel) de notatie. (2.2) Afgeleide kansrekening. Hier worden niet allerlei gebeurtenissen ten tonele gevoerd, maar alleen getalwaarden (die op hun beurt zijn terug te voeren tot getallen, behorend bij gebeurtenissen). De procedures worden hierdoor sterk vereenvoudigd! We beschikken uiteindelijk slechts over getallen en de kansen daarop, zoals bij het werpen met een dobbelsteen sprake is van getalsmatige uitkomsten. Bewerkingen met verzamelingen komen dan niet of practisch niet voor. De kernbegrippen in deze kansrekening zijn de stochastische variabele of kortweg stochast en de kansverdeling. Bovenstaande twee ,,soorten” kansrekening zijn in de literatuur meestal niet sterk gescheiden. In ons bestek is de scheiding wel vrij sterk door te voeren, omdat bewijzen en diepgaande redeneringen over de grondslagen toch niet aan de orde komen. Tenslotte: de hier gehanteerde termen algemene en afgeleide kansrekening zijn niet gangbaar; ze worden hier alleen gebruikt omdat ze in onze toepassingen vrij sterk zijn gescheiden: de eerste voor het rekenen met fouten– en gebeurtenissenbomen; de tweede voor het rekenen met o.a. levensduren, ongevalsstatistiek e.d. (2.3) Statistiek . Hier wordt mathematische statistiek bedoeld; niet de zogenoemde beschrijvende statistiek, die zich wel bezig houdt met de presentatie van reeksen waarnemingen, maar daarbij niet op mathematische gronden kwantitatieve uitspraken beoogt te doen betreffende de betrouwbaarheid van resultaten en voorspellingen. De mathematische statistiek wordt wel gezien als een toepassing van de kansrekening. In de huidige statistiek overheerst sterk het rekenen met stochasten (hier afgeleide kansrekening genoemd); hoewel in de laatste jaren het uitgebreid werken met algemene gebeurtenissen steeds belangrijker wordt. Wij houden ons alleen bezig met stochasten (aantallen en levensduren) en bijbehorende kansverdelingen.
Edens 060214-1610
–3–
Kansrekening en statistiek (Inf.)
3. Verzamelingen. (3.1) Notatie. We noteren verzamelingen met hoofdletters: bijvoorbeeld A, B, C, . . .. De dingen die in een verzameling zitten, heten de elementen van die verzameling. Notatie vaak met kleine letters, zoals a, b, x, y, . . . of in een opsomming a1 , a2 , . . .. Een verzameling kan vaak worden aangegeven door de elementen op te sommen. Dit doen we dan door die elementen op te schrijven, gescheiden door komma’s en het geheel tussen accoladen te plaatsen. Laat bijvoorbeeld A de verzameling kleuren in een kaartspel zijn. Dan is A = {♠, ♣, ♥, ♦}.
(1)
Deze verzameling heeft vier elementen. Als eenzelfde element meermalen wordt opgeschreven, blijft het aantal elementen vier: ook {♦, ♠, ♦, ♣, ♥, ♣, ♦} heeft vier elementen. De verzameling der natuurlijke getallen is aan te duiden met N = {1, 2, 3, . . .}. (Van oorsprong is 0 geen natuurlijk getal. Dat is het wel sind de zestiger jaren in Delft. Met de opkomst van de computer echter is in veel Nederlandse schoolboekjes 0 een natuurlijk getal geworden. Het getal 0 is echter zeer laat ontstaan, en is zeker niet ,,natuurlijk”.) Vaak wordt een verzameling aangeduid door een ,,samenbindende” eigenschap aan te geven. Als we bijvoorbeeld steeds over natuurlijke getallen spreken, is {n | n ≤ 6} de verzameling natuurlijke getallen 1,2,3,4,5,6. In plaats van het teken | wordt in de literatuur wel : gebruikt: {n : n ≤ 6} betekent hetzelfde. Als x een element is van verzameling A (,,x zit in A”), schrijven we x ∈ A. Als we het tegendeel willen aangeven, dus x behoort niet tot A, noteren we dit met x 6∈ A. Er is ´e´en speciale verzameling, dat is de lege verzameling. Daar zit niets in. We geven de lege verzameling aan met ∅. Deze is handig bij de rekenregels; waarover direct meer. (3.2) Inclusie. Als elk element van A ook tot B behoort, schrijven we A ⊂ B en zeggen: A is een deelverzameling van B. We schrijven ook wel B ⊃ A; dat is hetzelfde. In woorden: B omvat A. Zo is {♣, ♥} ⊂ {♠, ♣, ♥, ♦} en {2, 5, 6} ⊂ {1, 2, 3, 4, 5, 6}, maar ook {1, 2} ⊂ {1, 2}. Elke verzameling is dus deelverzameling van zichzelf (mathematisch spraakgebruik). Dit in tegenstelling met de ordening van getallen: het symbool < is niet hetzelfde als ≤. Soms echter komt men wel de notaties ⊆ en ⊇ tegen. Die betekenen dus w`el hetzelfde als ⊂ respectievelijk ⊃. De verzamelingstheoretische notaties zijn nog niet zo uitgekristalliseerd als die in de wiskundige analyse. Per definitie is ∅ ⊂ A voor elke willekeurige verzameling A. (3.3) Doorsnede. Alle elementen (zo die er zijn), die zowel in A als in B zitten, vormen een nieuwe verzameling; de doorsnede van A en B. We noteren die met A ∩ B of liever kortweg met AB (dat doen niet alle boeken) en spreken wel van ,,A doorsnede B” of ,,A door B”. Als A en B geen elementen gemeen hebben, heten A en B disjunct. Kortweg AB = ∅. Zie de figuur. Zo’n figuur wordt wel Venndiagram genoemd. Rechts zien we het geval A ⊂ B. Dat is hetzelfde als AB = A. (We hebben inderdaad de equivalentie (A ⊂ B) ⇐⇒ (AB = A). Dit is een voorbeeld van een (kleine) verzamelingstheoretische stelling. Dit soort formaliseringen is voor ons echter niet zo belangrijk.)
–4–
Edens 060214-1610
A
B
A
AB A,B niet disjunct
Kansrekening en statistiek (Inf.)
A
B
B A B ; AB = A
A,B disjunct
De doorsnede is eenvoudig voor meer verzamelingen op te schrijven. Voor drie dus A ∩ B ∩ C ofwel ABC. Een eenvoudige regel is (AB)C = A(BC); zo ontstaat al een begin van een ,,verzamelingen-algebra”. In onderstaande figuur is ABC aanschouwelijk voorgesteld.
A C
B (3.4) Vereniging. Alle elementen, die `of tot A, `of tot B, `of tot beide behoren, vormen een nieuwe verzameling, de vereniging van A en B, notatie A ∪ B. Zo is {2, 5} ∪ {1, 2, 4, 6} = {1, 2, 4, 5, 6}. We zeggen wel ,,A verenigd (met) B”. In onderstaande figuur is deze vereniging steeds beschaduwd aangegeven.
A
A B
A B B
Voor de ge¨ınteresseerde lezer vermelden we nog twee andere kleine ,,stellingen”, de zogenoemde distributieve wetten: A(B ∪ C) = AB ∪ AC en A ∪ (BC) = (A ∪ B)(A ∪ C).
–5–
Edens 060214-1610
Kansrekening en statistiek (Inf.)
In een figuurtje (Venndiagram) is dit eenvoudig te zien. We vermelden dit soort dingen alleen ter leesoefening (notaties!). (3.5) Complement. In zowat ieder praktijkprobleem wordt uitgegaan van een gegeven ,,universum”. Als we met een dobbelsteen werpen, krijgen we een der getallen 1,2,3,4,5,6. Ons onderhavige wereldje is dan de verzameling {1, 2, 3, 4, 5, 6}. Vaak wordt (in de kansrekening) een universum aangeduid met de letter Ω. Dus hier is Ω = {1, 2, 3, 4, 5, 6}. Laat A een deelverzameling van Ω zijn. Alle elementen van Ω, die niet in A zitten, vormen ¯ het complement van A. We noteren dit met A. In de verzamelingenleer bestaat nog een ander soort ,,complement”: als A en B twee verzamelingen zijn, vormen alle elementen van A, die niet in B zitten, het complement van B in A. De notatie is A \ B, ook wel gewoon A − B. We spreken dan ook wel van het verschil van A en B (keer die volgorde niet om!). Het gewone complement van B, dus alles uit het universum dat niet tot B behoort, is dus te schrijven als Ω \ B ofwel ¯ = Ω \ B. B
A B Ω
B AB
B
B=Ω B
AB = A B
Belangrijk zijn de zogenoemde wetten van De Morgan: ¯ ∪ C¯ ∪ · · · en A ∪ B ∪ C ∪ · · · = A¯ ∩ B ¯ ∩ C¯ ∩ · · · . A ∩ B ∩ C ∩ · · · = A¯ ∪ B
(2)
In woorden, links: alles wat niet tegelijk in A, B, C, . . . zit, zit in tenminste ´e´en ervan niet, dus wel in ´e´en van de complementen. (Ga dit na voor bv. twee; alleen A en B.) Rechts: alles wat niet zit in de vereniging, zit dus in geen enkele van A, B, . . .. Voor ieder dus in het complement, dus in de doorsnede van de complementen. Tot slot van deze paragraaf nog een voorbeeld: laat A en B twee verzamelingen zijn. De vereniging van A en B bestaat uit: 1) de elementen van A, die niet in B zitten, verenigd met 2) de elementen van A die wel in B zitten, verenigd met 3) de elementen van B die niet in A zitten. Dus: A ∪ B = (A \ B) ∪ (A ∩ B) ∪ (B \ A); de drie laatstgenoemde verzamelingen zijn disjunct. Zie onderstaande figuur.
A B AB B A
A
B
(3.6) Partitie. Laat A een gegeven verzameling zijn. Veronderstel dat A de vereniging is van de disjuncte, niet-lege verzamelingen B1 , B2 , . . . , Bn . Dan heet B1 , B2 , . . . , Bn een partitie (opsplitsing) van A. In onderstaande figuur is dit voor n = 5 aangegeven.
–6–
Edens 060214-1610
B1
B2
Kansrekening en statistiek (Inf.)
B3
B4
B5
A Voorbeelden: De drie verzamelingen {2, 5}, {1} en {3, 4, 6} vormen een partitie van {1, 2, 3, 4, 5, 6}; {n | n even} en {n | n oneven} vormen een partitie van de verzameling der natuurlijke getallen. Vaak wordt een partitie van het universum Ω genomen. We komen dat in de kansrekening herhaaldelijk tegen, zij het dat deze nogal gezwollen naamgeving meestal achterwege blijft.
Edens 060214-1610
–7–
Kansrekening en statistiek (Inf.)
4. Algemene kansrekening. (4.1) Uitkomstenruimte; gebeurtenis. We trekken ter inleiding ´e´enmaal een kaart uit een spel van 52 kaarten en letten daarbij alleen op de kleur (kleur: hier bedoeld als kaartterm). De mogelijke uitkomsten van dit experiment zijn ♠,♣,♥ en ♦; iets anders is niet mogelijk. Ons universum is dus Ω = {♠, ♣, ♥, ♦}. In de kansrekening heet zo’n universum uitkomstenruimte (Engels: sample space). Een ander woord is steekproefruimte. (In ons kleine voorbeeld trekken we een steekproef van ´e´en exemplaar; nl ´e´en kaart uit het pak.) We komen zo tot de Definitie: Alle mogelijke uitkomsten van een experiment vormen een verzameling, die uitkomstenruimte of steekproefruimte heet (Engels: sample space). Notatie meestal Ω. Elk element van Ω heet een elementaire gebeurtenis. Onze beperkte uitkomstenruimte staat niet toe dit te verfijnen: het is niet mogelijk onderscheid te maken tussen het trekken van ♣, zeg v´o´ or of na tienen. Als we dat w´el willen, hadden we Ω groter moeten maken: door elke kleur dubbel te noteren, ´e´en met vermelding voor en ´e´en met vermelding na tienen. Vandaar de term ,,elementaire gebeurtenis”. Wat is dan een ,,gewone” gebeurtenis? Stel dat iemand zegt: ,,als je een rode kaart trekt, krijg je een tientje van me”. Dat slaat op de gewone, practische gebeurtenis: ,,trek een rode kaart”. In onze mathematische context komt dit overeen met de verzameling {♥, ♦}; een deelverzameling dus van Ω. We komen zo tot de volgende Definitie: De deelverzamelingen van een uitkomstenruimte heten gebeurtenissen. Een ander woord voor gebeurtenis in de kansrekening is de ietwat verouderde, maar wellicht veel betere benaming eventualiteit. Het optreden van een gebeurtenis betekent, dat het experiment een uitkomst geeft, die in die gebeurtenis zit. Elke verzameling is deelverzameling van zichzelf, dus ook Ω ⊂ Ω. De gebeurtenis Ω kan in spreektaal als volgt worden weergegeven: ,,het geeft niet wat het resultaat van het experiment is”. De lege verzameling is ook een gebeurtenis. Deze treedt op, als het experiment geen enkele uitkomst geeft. Dat wordt in elk kanstheoretisch model onmogelijk geacht: er is altijd een uitkomst. De lege verzameling heet dan ook de onmogelijke gebeurtenis. De verzameling Ω heet de zekere gebeurtenis. Gebeurtenissen die, als verzameling opgevat, disjunct zijn (dus geen element gemeen hebben), heten elkaar uitsluitend . Dat is logisch: laat A en B disjuncte gebeurtenissen zijn. Als bv. A optreedt, betekent dat, dat een uitkomst is verkregen die element is van A. Dit kan blijkens het gegeven niet tegelijk in B zitten. Dan treedt B dus niet op. Ook in wiskundige notatie is dit duidelijk te zien: Het disjunct zijn van A en B betekent AB = ∅. In woorden: het tegelijk optreden van A en B is een onmogelijke gebeurtenis. Van gebeurtenissen A en B die een inclusierelatie hebben, zeg A ⊂ B, kan ook iets in gewone spreektaal worden gezegd. Als A optreedt, betekent dat, dat een uitkomst in A is verkregen. Als nu A ⊂ B, zit die uitkomst ook in B, want A is een deel van B. Dan treedt B dus op! Dus A ⊂ B betekent: B is een gevolg van A; ook wel: A impliceert B.
–8–
Edens 060214-1610
Kansrekening en statistiek (Inf.)
We schrijven dergelijke zegswijzen bij elkaar: A¯ A∩B A∪B A\B
is is is is
de de de de
gebeurtenis : gebeurtenis : gebeurtenis : gebeurtenis :
A A A A
treedt niet op; en B treden beide op; of B of beide treden op; treedt op, maar B niet.
(1)
(4.2) Kansbegrip. We gaan onze gebeurtenissen nu kansen geven. In plaats van de uitdrukking ,,totale kans 100%” nemen we de in de kansrekening algemeen aanvaarde uitdrukking ,,totale kans 1”. Die kanswaarde staat voor zekerheid . (Soms wordt, ook in de kansrekening, in eindpresentaties wel een procentuele kans vermeld.) In het voorbeeld van de trekking van een kaart zijn alle vier mogelijkheden op intu¨ıtieve gronden even waarschijnlijk. We defini¨eren daarom in dit geval de kans op elke elementaire gebeurtenis gelijk aan 41 . In een groot aantal herhalingen van de trekking (steeds de kaart terugleggen; dan het spel weer goed schudden!) verwachten we een fractie van ongeveer 14 voor elk der vier kleuren. Wat zal de kans op een rode kaart moeten zijn? Blijkbaar 14 + 14 , d.i. 12 . (Tel de verwachte fracties op.) We defini¨eren daarom de kans op de gebeurtenis {♥, ♦} gelijk aan 21 . De zojuist geschetste gang van zaken leert ons, dat we moeten stellen: Definitie: Een kans is een functie, die gedefinieerd is op de gebeurtenissen. De kans op een gebeurtenis A is de som van de kansen van alle elementaire gebeurtenissen, die in A zitten. De kans op een elementaire gebeurtenis ω ∈ Ω moet streng gesproken genoteerd worden als P ( {ω} ). Vaak wordt kortheidshalve p(ω) geschreven; ook wel pω . Dat laatste meestal indien de elementaire gebeurtenissen gehele getallen zijn : bv. kans p4 of p(4) als kans dat met een dobbelsteen een 4 wordt geworpen. Het begrip ,,kans” lijkt op de begrippen ,,oppervlakte” of ,,inhoud”. De kansfunctie wordt met P aangeduid. Dus P ( A ) is de kans op gebeurtenis A. We zien onmiddellijk, dat dient te gelden: P ( Ω ) = 1. Immers, het is zeker dat het experiment een uitkomst in Ω heeft. (In het kaartspel: we trekken geen joker.) Omdat ,,geen uitkomst” onmogelijk is, moet de lege gebeurtenis ∅ kans 0 hebben: P ( ∅ ) = 0. Een heel arsenaal uitspraken kan nu worden geformuleerd: 0 ≤ P ( A ) ≤ 1; P ( Ω ) = 1; (2) A1 , A2 , A3 . . . disjunct =⇒ P ( A1 ∪ A2 ∪ A3 ∪ · · · ) = P ( A1 ) + P ( A2 ) + P ( A3 ) + ·(3) ··. Dit is het axiomastelsel. Enkele gevolgen zijn: ¡ ¢ P ( ∅ ) = 0; P A¯ = 1 − P ( A ) ; A ⊂ B =⇒ P ( A ) ≤ P ( B ) ; P (A ∪ B ) = P (A) + P (B ) − P (A ∩ B ).
(4) (5)
De regel (5) heeft een belangrijke uitbreiding. We kijken eerst naar de regel zelf. Indien we P ( A ∪ B ) willen berekenen, en daarvoor P ( A )+P ( B ) zouden nemen, dan tellen we de elementaire gebeurtenissen die zowel in A als in B zitten, dubbel. Dus P ( A ∩ B ) moet worden afgetrokken. Laat nu drie gebeurtenissen gegeven zijn; A, B en C (alle natuurlijk deel van eenzelfde uitkomstenruimte Ω). In onderstaande figuur zijn de beschaduwde verzamelingen in formulevorm aangegeven.
–9–
Edens 060214-1610
B
A
Kansrekening en statistiek (Inf.)
B
C A B C
A
B
C
C
A
AB AC BC
ABC
Vrij eenvoudig is in te zien (denk aan oppervlakte!), dat moet gelden: P ( A ∪ B ∪ C ) = [P ( A ) + P ( B ) + P ( C )]+ − [P ( AB ) + P ( AC ) + P ( BC )]+ + P ( ABC ) .
(6)
In woorden; tevens uitgebreid voor willekeurig veel gebeurtenissen: de kans op een vereniging van gebeurtenissen is de som van de kansen der afzonderlijke gebeurtenissen (de enkele); verminderd met de som van de kansen der doorsneden van steeds twee (de tweetallen); vermeerderd met de som van de kansen der drietallen, enz. Het wordt alleen maar ingewikkeld; niet moeilijk. Adem diep in: voor vier gebeurtenissen is P ( A ∪ B ∪ C ∪ D ) = [P ( A ) + P ( B ) + P ( C ) + P ( D )]+ − [P ( AB ) + P ( AC ) + P ( AD ) + P ( BC ) + P ( BD ) + P ( CD )]+ + [P ( ABC ) + P ( ABD ) + P ( ACD ) + P ( BCD )]+ − P ( ABCD ) . (7) Met opzet hebben we de regel voor vier stuks ook vermeld. In sommige praktijkgevallen kan zo’n regel handig zijn! We komen er nog op terug. We benadrukken nog even de betekenis van vereniging en doorsnede van gebeurtenissen: ,,De gebeurtenis A∪B ∪C ∪D treedt op” betekent: ,,tenminste ´e´en uit A, B, C, D treedt op”; ,,de gebeurtenis ABCD treedt op” betekent: ,,A, B, C en D treden tegelijk op”. (4.3) Voorbeelden. 1. Worp met een zuivere munt. Neem Ω = {K, S}. De kansfunctie is gegeven door P ( K ) = P ( S ) = 12 . Onnodig te vermelden, dat P ( ∅ ) = 0 en P ( {K, S} ) = P ( Ω ) = 1. 2. Worp met een zuivere dobbelsteen. We kunnen Ω schrijven als Ω = { . , . . , ... , .. .. , ..... , ... ... }. We zien dat de elementen van Ω hier geen getallen zijn. Vaak schrijven we Ω = {1, 2, 3, 4, 5, 6}; de elementen van Ω zijn dan w`el getallen. Als kansverdeling nemen we hierbij p(i) = 16 ; i = 1, . . . , 6. Zo is bijvoorbeeld P ( {2, 4, 5, 6} ) = 64 = 23 .
– 10 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
3. Onzuivere dobbelsteen. Uit de vaas in onderstaande figuur wordt aselect een bal getrokken. Het nummer van de getrokken bal is de uitkomst van het experiment.
1
4
5
2
1
3
2
1
2
6
1
3
—Fig. 4.3.1— 1 . Ga Neem Ω = {1, 2, 3, 4, 5, 6} en kansen p1 = 31 , p2 = 14 , p3 = 16 , p4 = p5 = p6 = 12 1 na, dat P ( {2, 4, 5, 6} ) = 1 − P ( {1, 3} ) = 1 − p1 − p3 = 2 . 4. n-aselector . Deze trekt aselect een getal uit {1, 2, . . . , n}. Hier is Ω = {1, . . . , n} en pi = 1/n voor i = 1, . . . , n. Voor A ⊂ Ω is hier aantal elementen van A ; aantal elementen van Ω
(8)
aantal gunstige gevallen . aantal mogelijke gevallen
(9)
P (A) = een zogenoemde Laplacekans: kans =
Let wel: alle mogelijke gevallen zijn hier gelijkwaardig!
Edens 060214-1610
– 11 –
Kansrekening en statistiek (Inf.)
5. Meervoudige experimenten. Trekkingen met en zonder teruglegging. (5.1) Tot nu toe hebben we een kansruimte bij ´e´en experiment (trekking) bekeken: de kans op een bepaalde gebeurtenis (uitkomstenverzameling) A ⊂ Ω was P ( A ). Indien we nu twee trekkingen verrichten, de eerste uit Ω1 , de tweede uit Ω2 , dan beschouwen we de samengestelde trekking: deze is dan op te vatten als ´e´en bepaalde trekking uit een verzameling, die we noteren met Ω1 ×Ω2 en die bestaat uit alle tweetallen (ω1 , ω2 ) waarbij ω1 uit Ω1 wordt gekozen en ω2 uit Ω2 . Denk bv. aan het platte vlak: het is tweedimensionaal; elk punt heeft een eerste en een tweede co¨ordinaat. Onze uitkomst van het experiment bestaat uit een eerste en een tweede trekking. De eerste trekking is nu de eerste co¨ordinaat van de uitkomst; de tweede trekking is de tweede co¨ordinaat. (Het platte vlak met co¨ordinaatassen heet wel het cartesische vlak . Een notatie als Ω1 × Ω2 heet een cartesisch product. Wij zullen deze benamingen maar zelden gebruiken.) We doen dit analoog voor n trekkingen: deze kunnen worden opgevat als ´e´en trekking uit Ω1 × Ω2 × · · · × Ωn . Hier is meteen de benaming steekproef duidelijk als betiteling van een elementaire gebeurtenis. (5.2) We beginnen met het tweemaal werpen met een zuivere munt. Deze worpen worden fysisch onafhankelijk van elkaar uitgevoerd. Met fysisch onafhankelijk wordt bedoeld, dat geen redenen zijn aan te wijzen waarom het resultaat van de ene worp van invloed zou zijn op dat van de andere worp. We schrijven Ω1 = Ω2 = {K, S}; Ω1 × Ω2 = {KK, KS, SK, SS}; zie figuur 5.2.1.
1/2
Worp 1
1/2
K 1/2
Worp 2 K
S 1/2 1/2
1/2
S
S
K
—Fig. 5.2.1— Vanwege de vermeende fysische onafhankelijkheid zullen alle vier eindpunten (paden) van deze boom in een groot aantal herhalingen van deze twee worpen ongeveer even vaak voorkomen. Wij defini¨eren daarom de kansen in Ω1 × Ω2 elk 41 . Indien de munt niet zuiver is, maar kans p op kop heeft en kans q op staart (pq > 0; p + q = 1), krijgen we de boom
p
Worp 1
p
Worp 2 K
K
q
q
p
S
S K
—Fig. 5.2.2—
q
S
Edens 060214-1610
– 12 –
Kansrekening en statistiek (Inf.)
Bij een groot aantal n herhalingen van de twee worpen denken we dat we bij de eerste worp ongeveer np keer K hebben en dan ook bij de tweede worp ongeveer npp keer K en ongeveer npq keer S. Voor ons mathematisch model hanteren we daarom de regel: (5.3) Padenproductregel: Bij fysisch onafhankelijke experimenten is de kans op een pad gelijk aan het product van de kansen der afzonderlijke stappen langs dat pad . We lezen zo uit figuur 5.2.2 af: de kans op S in de tweede worp is gelijk aan p·q (linker pad naar S) + q · q (rechter pad naar S) = (p + q)q = q. Dit is niet zo verwonderlijk: het zal ons, gegeven de fysische onafhankelijkheid der worpen, een zorg zijn wat de uitkomst van de eerste worp was! De kans op S in de tweede worp moet q zijn. (5.4) Voorbeeld . We hebben drie vazen met ballen. Vaas 1 bevat vijf witte en ´e´en zwarte; vaas 2 bevat vier witte en twee zwarte en vaas 3 bevat drie witte en drie zwarte ballen. Men kiest aselect een vaas en daaruit aselect een bal. Wat is de kans dat deze wit is? Beschouw figuur 5.4.1.
1/3
1/3
1
Vaas 5/6
1/6
1/3
3
2 2/3
1/3
1/2
1/2
Bal W Z W Z W Z —Fig. 5.4.1— In de boom staan de kansen; we lezen af: P {wit} =
1 3
·
5 6
+
1 3
·
2 3
+
1 3
·
1 2
= 23 .
(5.5) Het ligt voor de hand direct wat ingewikkelder zaken te beschouwen. Zo kunnen we een vaas kiezen, daaruit een bal trekken en als deze wit is, uit dezelfde vaas nog ´e´en keer trekken (genoemde witte bal wordt niet teruggelegd). Die tweede trekking kan op zich beschouwd worden met een Ω, die van de eerste trekking afhangt. De procedure echter, het trekken zelf, geschiedt w`el onafhankelijk van de voorgeschiedenis: de trekking blijft aselect. De kansen berekenen we dan ook met de padenproductregel (5.3). Als steekproefruimte nemen we de verzameling (boom) van alle paden.
– 13 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
6. Onafhankelijke gebeurtenissen. Voorwaardelijke kansen. (6.1) Onafhankelijke gebeurtenissen. Laat twee steekproefruimten Ω1 en Ω2 gegeven zijn met kansfuncties P1 resp. P2 . Als nu A en B gebeurtenissen zijn bij Ω1 resp. Ω2 , dan geeft de padenproductregel, dat bij fysisch onafhankelijke trekkingen uit Ω1 respectievelijk Ω2 de kans, dat de eerste trekking in A zit en de tweede trekking in B, gelijk is aan P1 (A)P2 (B). Het is onhandig om met verschillende kansfuncties te werken. In de kansrekening wordt een constructie (met cartesische producten) aangegeven, waarbij tenslotte met ´e´en ,,overkoepelende” uitkomstenruimte en ´e´en ,,overkoepelende” kansfunctie P wordt gewerkt. (Het voert veel te ver hierop in te gaan.) Dan kunnen we zeggen: P (AB) = P (A)P (B);
(1)
een gelijkheid die voor di´e gebeurtenissen A en B geldt, waarbij A uitsluitend op de eerste trekking slaat en B uitsluitend op de tweede. We komen algemeen tot de (6.2) Definitie: Twee gebeurtenissen A en B heten stochastisch onafhankelijk of ook wel kortweg onafhankelijk als (1) geldt. Wij korten dit wel af tot s.o. Een stel gebeurtenissen A1 , . . . , An heet onafhankelijk als de productuitdrukking voor elk deelstelsel geldt; dus niet alleen voor de tweetallen. Voor onafhankelijkheid van A, B en C moeten we dus eisen: P ( AB ) = P ( A ) P ( B ); P ( AC ) = P ( A ) P ( C ); P ( BC ) = P ( B ) P ( C ) en P ( ABC ) = P ( A ) P ( B ) P ( C ). Voor onafhankelijkheid moet de kansfactorisering dus voor elke greep van twee, drie,. . . gebeurtenissen gelden. Bij de padenproductregel komen ook producten van kansen voor. Dat is daar niet hetzelfde als onafhankelijkheid. In feite is de padenproductregel een voorbode van het rekenen met zogenoemde voorwaardelijke kansen; waarover nu een korte inleiding volgt. (6.3) We gaan uit van het ,,getrapte” experiment uit (5.4) en vormen een steekproefruimte Ω = {(1, W), (1, Z), (2, W), (2, Z), (3, W), (3, Z)} (2) en kansen p(1, W) = p(1, Z) =
5 18 , 1 18 ,
p(2, W) = p(2, Z) =
4 18 , 2 18 ,
p(3, W) = p(3, Z) =
3 18 ; 3 18 .
) (3)
We kunnen de kans 56 uit figuur 5.4.1 terugkrijgen door p(1, W) te delen door de kans op vaas 1; laatstgenoemde kans is hier ¡ ¢ 5 1 P {vaas1} = P {(1, W), (1, Z)} = 18 + 18 = 13 . (4) De kans
5 6
is dan te schrijven als P {een witte bal `en vaas 1} . P {vaas 1}
(5)
(6.4) Voorwaardelijke kansen. Een systeem met aaneengeschakelde experimenten kan altijd beschouwd worden als ´e´en uitkomstenruimteruimte met ´e´en kansfunctie. We zullen
– 14 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
dit zeker niet bewijzen. Bovenstaande enigszins aanschouwelijke overweging met de vazen en de ballen leidt ons tot de volgende Definitie: Laat B een gebeurtenis zijn met P ( B ) > 0. We defini¨eren nu de voorwaardelijke kans op A gegeven B (d.i. gegeven dat B optreedt) door def
P ( A|B ) =
P ( AB ) . P (B )
(6)
De padenproductregel kan nu geformuleerd worden in termen van voorwaardelijke kansen. We geven niet de precieze verbanden aan, maar volstaan hier met een definitie en drie stellingen. We merken eerst nog op, dat geldt: A, B s.o., P ( A ) > 0, P ( B ) > 0 } =⇒ P ( A|B ) = P ( A ) , P ( B|A ) = P ( B ) . (7) (6.5) Productregel voor voorwaardelijke kansen. Laat A1 , . . . , An gebeurtenissen zijn. Dan is P ( A1 A2 · · · An ) = P ( A1 ) P ( A2 |A1 ) P ( A3 |A1 A2 ) · · · P ( An |A1 A2 · · · An−1 ) ;
(8)
mits P ( A1 A2 · · · An ) > 0. Deze regel strookt met de padenproductregel voor de berekening van de kans op ´e´en gegeven pad. (6.6) Regel van de totale kans. Laat B1 , B2 . . . een partitie van Ω zijn met P ( Bi ) > 0 voor alle i. Dan is voor elke gebeurtenis A: P ( A ) = P ( A|B1 ) P ( B1 ) + P ( A|B2 ) P ( B2 ) + · · · .
(9)
Deze regel strookt met de padenproductregel voor de berekening van de kans op een resultaat, dat bereikt wordt via verschillende paden. (6.7) Regel van Bayes. Laat B1 , B2 . . . een partitie van Ω zijn met P ( Bi ) > 0 voor alle i. Dan is voor elke gebeurtenis A met P ( A ) > 0: P ( Bk |A ) =
P ( A|Bk ) P ( Bk ) . P ( A|B1 ) P ( B1 ) + P ( A|B2 ) P ( B2 ) + · · ·
(10)
De regel van Bayes geeft een zogenoemde a posteriori kans: ,,gegeven het eindresultaat; wat is de kans dat dit resultaat langs een bepaalde weg is bereikt?” (nakaartkans). Het geeft de kans dat ´e´en bepaald pad is gevolgd van alle mogelijke paden die tot dit eindresultaat leiden. In feite is hier sprake van de omkering P ( B|A ) = P ( A|B )
P (B) P (A)
(P ( A ) > 0; P ( B ) > 0).
(11)
(6.8) Onder voorwaarde B met P ( B ) > 0 is een gehele kansrekening bepaald . Zo is ¢ ¡ P ( A1 ∪ A2 |B ) = P ( A1 |B ) + P ( A2 |B ) − P ( A1 A2 |B ) P A |B = 1 − P ( A|B ) ; (12)
– 15 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
enz.; kortom, vervang de kansfunctie P ( · ) door P ( · |B ) bij vaste B. (6.9) Voorbeeld : We beschouwen de punten X, Y , en Z (knooppunten). Tussen verschillende punten worden schakelaars (Si ) aangebracht en wel X, Y : S1 ; X, Z: S2 ; Z, Y : S3 ; Z, Y : S4 (S3 en S4 staan dus parallel). De schakelaar Si geleidt met kans pi ; i = 1, 2, 3, 4. De standen zijn onafhankelijk van elkaar. Bereken de kans dat tussen X en Y sprake is van geleiding.
1 3
X 2
Z
Y
4
Oplossing: Zie bovenstaande figuur. Ga uit van de mogelijke geleidingswegen 1, 23 en 24. Noem A, B resp. C de gebeurtenissen dat deze wegen geleiden. Dan is bijvoorbeeld P ( BC ) =kans dat 2 en 3 `en 2 en 4 geleiden; dus gewoon dat 2, 3 en 4 geleiden. De kans P ( BC ) is vanwege de onafhankelijke standen dus gelijk aan p2 p3 p4 . De verenigingsregel 7 in (4.2) geeft nu direct kans [p1 + p2 p3 + p2 p4 ] − [p1 p2 p3 + p1 p2 p4 + p2 p3 p4 ] + [p1 p2 p3 p4 ]. (6.10) Voorbeeld : Raden van een getal onder de tien. Stel dat een appel onder twee kindertjes moet worden verloot. Het jongste kind begint; om beurten wordt aselect gekozen uit de nog niet eerder genoemde getallen uit 1, 2, . . . , 10. De kans dat het jongste kind de appel krijgt is gelijk aan de som van de kansen dat het getal de eerste, derde, vijfde, zevende en negende beurt wordt geraden (hier ,,beurt” zonder aanzien des persoons bedoeld); dat is door steeds de padenproductregel toe te passen 1 10
+
9 10
·
8 9
·
1 8
+
9 10
·
8 9
·
7 8
·
6 7
·
1 6
+
9 10
·
8 9
·
7 8
·
6 7
·
5 6
·
4 5
·
1 4
+
9 10
·
8 9
·
7 8
·
6 7
·
5 6
·
4 5
·
3 4
·
2 3
·
1 2
= 12 .
1 . We zien dan ook, dat een dergelijke verloting onder drie Elk product is gelijk aan 10 4 kindertjes niet eerlijk is. Degene die mag beginnen, krijgt de appel met kans 10 (beurten 3 1,4,7,10); de andere twee hebben ieder gelijke kans 10 op de appel! (De ,,tweede” moet in beurt 2, 5 of 8 raden; de ,,derde” in beurt 3, 6 of 9.)
(6.11) Voorbeeld : A en B werpen om beurten met een zuivere dobbelsteen; A begint. Wat is de kans dat B de eerste zes gooit? Oplossing: De eerste zes moet vallen in de tweede, vierde, zesde,. . . worp. De kans hierop is 5 1 5 31 5 51 5 5 1 6 · 6 · + ( ) + ( ) + · · · = = 11 ; 6 6 6 6 6 6 1 − ( 56 )2 zoals met een meetkundige reeks volgt (a + ar + ar2 + · · · = a/(1 − r) voor −1 < r < 1). Een andere, aardige manier is de volgende: Stel dat B moet winnen. Dat kan alleen als A
– 16 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
in de eerste beurt geen zes gooit; de kans hierop is 56 . Als we vanuit die situatie opnieuw gaan tellen, moet B in de n` u eerste, derde,. . . beurt de eerste zes gooien. De kans daarop is de aanvankelijke winstkans voor A. Noem de winstkansen pA en pB . Dan is blijkbaar 6 5 pB = 56 pA . Tevens is pA + pB = 1. Hieruit volgt pA = 11 en pB = 11 . (6.12) Voorbeeld : De brug is open met kans 16 ; het onweert met kans 13 en als het onweert is de brug dicht. Als de brug open is, komt de melkboer v´o´or tien uur met kans 25 ; als het onweert komt hij v´o´or tien uur met kans 51 . In alle andere gevallen komt hij v´o´or tien uur met kans 45 . a) Bereken de kans dat de melkboer v´o´or tien uur komt. b) De melkboer is zojuist v´o´ or tien uur gekomen. Bereken de kans dat de brug open was. c) De melkboer is zojuist na tien uur gekomen. Bereken de kans dat de brug dicht was. Oplossing: Eerst een moeilijke manier. Schrijf B = {de brug is open}, O = {het onweert}, M = {de melkboer komt v´o´or tien uur}. Dan is in volgorde van de gegevens: ¡ ¢ P ( B ) = 61 , P ( O ) = 31 , O ⊂ B, P ( M |B ) = 52 , P ( M |O ) = 15 , P M | B ∪ O = 45 . Schrijf Z = B ∪ O. Omdat O ⊂ B, is {B, O, Z} een partitie van Ω (zie het Venndiagram in fig. 6.12.1) en P ( Z ) = 1 − P ( B ) − P ( O ) = 1 − 16 − 13 = 12 . De gevraagde kans in a is P ( M ) = P ( M |B ) P ( B ) + P ( M |O ) P ( O ) + P ( M |Z ) P ( Z ) = = 52 · 16 + 15 · 13 + 45 · 12 = =
8 15 .
Nu iets eenvoudiger en doorzichtiger: zie de bomen in figuur 6.12.1.
1/6
B 2/5
1/3
1/2
O 1/5
M
Z 4/5
1/6
B 3/5
1/3
1/2
O 4/5
M —Fig. 6.12.1—
B Z
1/5
O
Z
– 17 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
De kansen in de tweede boom volgen eenvoudig uit die in de eerste! Uit de eerste boom 8 lezen we direct P ( M ) = 52 · 16 + 15 · 13 + 45 · 12 = 15 af. We zien daarna tevens in dezelfde 8 boom, dat P ( B|M ) = 16 · 25 / 15 = 18 . Dit is de kans op pad BM gedeeld door de kans op alle paden naar M . In de tweede boom zien we eveneens direct: P
¡
B |M
¢
=
1 6
·
1 4 1 1 3 · 5 + 2 · 5 3 1 4 1 5 + 3 · 5 + 2
·
1 5
=
11 14 .
Dit is de kans op alle paden naar M , niet via B gedeeld door de kans op alle paden naar M. We konden ook direct berekenen: P
¡
B|M
¢
=1−P
¡
B|M
¢
=1−
1 6
·
3 5
+
1 6 1 3
· ·
3 5 4 5
+
1 2
·
1 5
=1−
3 14
=
11 14 .
(6.13) Voorbeeld : In een bepaald bedrijf is ’s nachts de kans op brand gelijk aan 0,5%. Het bedrijf schaft een goedkoop brandalarm aan. Statistisch onderzoek heeft het volgende uitgewezen: 1) Als er brand is, gaat het alarm af met kans 97%. 2) Als er geen brand is, zwijgt het alarm met kans 95%. In zekere nacht gaat het alarm af. De nachtwaker draait zich echter nog eens om in zijn sponde. Wat is de kans dat er geen brand is? Oplossing: In dit vraagstuk wordt een a-posteriori -kans gevraagd. Dit gaat met de regel van Bayes. Zie de boom in onderstaande figuur. De gevraagde kans is de kans op het dik aangegeven pad naar alarm, gedeeld door de kans op alle paden naar alarm. Het antwoord is dus 0, 995 · 0, 05 = 0, 91. 0, 005 · 0, 97 + 0, 995 · 0, 05
– 18 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
Start 0,005
0,995=1-0,005
Brand
Geen brand
0,97
0,05=1-0,95 Alarm
Opm.: Toepassing van de regel van Bayes ,,in formulevorm” geeft P (geen brand | alarm) P (alarm | geen brand) · P (geen brand) = P (alarm | geen brand) · P (geen brand) + P (alarm | brand) · P (brand) 0, 05 · 0, 995 = 0, 05 · 0, 995 + 0, 97 · 0, 005 = 0, 91.
– 19 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
7. Vraagstukken over algemene kansrekening. 1. Gegeven zijn A, B ⊂ Ω ¡ met P¢ ( A ) = 0.5, P ( B ) = 0, 7 en P ( A ∪ B ) = 0, 8. ¯ en P ( B|A ). Bereken P ( A ∩ B ), P A ∩ B ¯ 2. De gebeurtenissen A en B zijn stochastisch onafhankelijk (s.o.). Bewijs dat A¯ en B ¯ ¯ s.o. zijn. Zijn A en B, en ook A en B s.o.? 3. Laat een bepaald driemotorig vliegtuig alleen kunnen vliegen als `of tenminste de middenmotor, `of alleen beide zijmotoren werken. De kans dat de middenmotor uitvalt is 0,5%. Elk der andere motoren valt uit met kans 10%. Het uitvallen der motoren geschiedt onafhankelijk van elkaar. Bereken de kans dat het vliegtuig blijft vliegen. 4. In onderstaande figuur stelt elk vierkantje een schakelaar voor. De schakelaars zijn genummerd. Elke schakelaar is geleidend met kans 13 en gesperd met kans 23 . De standen van de schakelaars zijn onafhankelijk van elkaar.
1
2 Y
5
X 3
4
Bereken de kans dat tussen de punten X en Y sprake is van geleiding. 5. We hebben drie vazen met elk zes ballen. Vaas 1 bevat ´e´en zwarte bal; vaas 2 bevat twee zwarte ballen en vaas 3 bevat drie zwarte ballen. Alle overige ballen zijn wit. Aselect wordt een vaas gekozen en daaruit aselect een bal getrokken. a) Bereken de kans dat de getrokken bal wit is. b) Bij welke verdeling van de ballen over de vazen is de kans op trekking van een witte bal zo groot mogelijk? 6. De niet-transitieve dobbelstenen van Bradley Efron. We hebben vier dobbelstenen: Dobbelsteen a heeft twee zijden met een 0 en vier met een 4; Dobbelsteen b heeft zes zijden met een 3; Dobbelsteen c heeft vier zijden met een 2 en twee met een 6; Dobbelsteen d heeft drie zijden met een 1 en drie met een 5. Speler A kiest een dobbelsteen uit deze vier. Daarna kiest speler B een dobbelsteen uit de overige drie. Ieder werpt nu zijn gekozen dobbelsteen. Wie het hoogste aantal ogen gooit, wint. Bewijs dat speler B door een geschikte keus van zijn dobbelsteen wint met kans 32 . 7. Een verzameling mensen bestaat uit 30% vrouwen, 20% mannen en 50% kinderen. Van de vrouwen draagt 40% een bril; van de mannen 60% en van de kinderen 20%. Men kiest aselect een persoon uit de verzameling. Deze blijkt een bril te dragen. Bereken de kans dat de gekozen persoon een kind is.
Edens 060214-1610
– 20 –
Kansrekening en statistiek (Inf.)
8. Een serie van een miljoen zuivere munten bevat ´e´en munt met twee koppen. Alle andere munten zijn ,,goed”: deze hebben elk ´e´en kop en ´e´en staart. Aselect wordt een munt getrokken en deze wordt twintig maal geworpen. Al deze worpen resulteren in ,,kop”. Bereken de kans dat de munt goed is. 9. Van tien getallen zijn vijf positief en vijf negatief. Aselect en zonder teruglegging worden twee getallen gekozen en met elkaar vermenigvuldigd. Bereken de kans op een negatief product. 10. Een vaas bevat drie zwarte en vijf witte ballen. Achtereenvolgens worden twee ballen zonder teruglegging getrokken. Bereken de kans dat de tweede bal zwart is. 11. Als het op een dag droog is, is het de volgende dag nat met kans 15 . Als het op een dag nat is, is het de volgende dag droog met kans 52 . Het is vandaag nat. Bereken de kans dat het a) overmorgen; b) overovermorgen droog is. 12. Arend, Berend en Celestien spelen Mens-erger-je-niet; ze werpen in volgorde als genoemd. Wie de eerste zes werpt begint. Bereken voor elke speler de kans hierop.
– 21 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
8. Stochastische variabelen. (8.1) In veel gevallen wordt bij een experiment niet zozeer over de uitkomst zelf gesproken, maar over een of andere kwantitatieve meting aan die uitkomst. Zo kan bij een statistische steekproef van kogellagers van elk getrokken lager de binnendiameter worden bepaald. Op deze wijze wordt een serie getallen verkregen: dat deze uit lagers dan wel uit iets anders zijn verkregen, is voor de kanstheoretische verwerking in het geheel niet van belang. De uitkomstenruimte Ω is geheel verbleekt; er is alleen nog cijfermateriaal : bij elke uitkomst ω ∈ Ω is een getal bepaald. We kunnen natuurlijk ook meer dan ´e´en grootheid meten: als we van elk getrokken lager ook de buitendiameter bepalen, zijn bij elke uitkomst ω twee getallen bepaald. Noem de binnen– en buitendiameter van lager ω bijvoorbeeld x(ω) resp. y(ω). Dan zijn twee functies x en y op de uitkomstenruimte Ω bepaald: elk lager heeft een binnen– en een buitendiameter. We komen zo tot de (8.2) Definitie: Een stochastische variabele of kortweg stochast is een functie, door middel waarvan bij elke uitkomst een getal wordt bepaald. Wij noteren (naar Oudnederlands gebruik) stochasten met onderstreepte letters: x, y, k, n, x1 , x2 , . . .. Met stochasten wordt gerekend alsof ze (getalwaardige) uitkomsten van een nog uit te voeren experiment zijn. Een voorbeeld is de trekking van ´e´en kaart uit een kaartspel als in (3.1). Stel, dat ik f 10,– krijg als ik ♠ trek. Als ik daarentegen ♣ trek, moet ik f 5,– betalen. Als ik een rode kaart trek, moet ik f 2,50 betalen. Zo is een stochast x bepaald: Deze x kan de waarden 10, −5 en −2, 5 aannemen. Wat is de kans dat ik f 10,– krijg? Blijkbaar gebeurt dat alleen als ik een ♠ trek. De kans daarop is 41 . Zo is de kans dat ik f 5,– moet betalen ook gelijk aan 14 , maar de kans dat ik f 2,50 moet betalen is 12 ; dat is nl. de kans op een rode kaart (de gebeurtenis {♥, ♦}). We zeggen nu: x is een stochast met waarden −2 12 , −5, 10 en kansen daarop respectievelijk 12 , 14 , 14 . Een enkele stochast is bepaald door zijn waardenverzameling en de kansen daarbij . De som der kansen is steeds 1. Het maakt in het voorbeeld voor het geldspelletje niet uit of het onderliggend kansmechanisme nu uit een kaartspel komt of uit iets anders (loting uit een vaas met ballen bijvoorbeeld, of met een computer). De rij kansen van een stochast heet een kansverdeling. Een kansverdeling is in feite niets anders dan een rij niet-negatieve getallen met totale som 1. Meestal zijn de kansen in een kansverdeling alle positief; kans 0 is echter voor het gemak niet uitgesloten. Wij onderscheiden discrete en continue stochasten: (8.3) Discrete stochasten. Men spreekt van een discrete stochast als voor het waardengebied slechte sprake is van een rij specifieke getallen, zoals boven: −2 12 , −5, 10; ook 0, 1, 2, . . .; algemener een of andere rij waarden a1 , a2 , a3 , . . .. Zo’n rij mag ook afbreken. Bij elk getal uit de rij is een kans op die waarde bepaald. De kansen vormen een rij niet-negatieve getallen met totale som 1. Zo’n rij heet een discrete kansverdeling. In wat algemene notatie is te schrijven: P ( x = ai ) = pi ;
i = 1, 2, . . . .
Vaak wordt voor de ai -waarden de verzameling {0, 1, 2, . . .} genomen.
(1)
– 22 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
(8.4) Grafische voorstelling van een discrete verdeling: Op twee verschillende manieren kan een discrete verdeling worden aangegeven: cumulatief en door middel van een staafdiagram. De zogenoemde cumulatieve kans is algemeen gegeven door de functie def
Fx (x) = P ( x ≤ x ) ;
x een re¨e el getal.
(2)
Zo’n functie heet in de kansrekening een cumulatieve-verdelingsfunctie of kortweg verdelingsfunctie. Het woord ,,verdelingsfunctie” houdt altijd ,,cumulatief” in. Vaak bestaat daarover verwarring. Een staafdiagram wordt verkregen door bij elke waarde uit de waardenverzameling van de stochast een staafje te zetten, waarvan de lengte gelijk is aan (of evenredig is met) de kans op die waarde. Figuur 8.4.1 toont de cumulatieve verdeling en een staafdiagram bij de stochast x, die nu het aantal ogen voorstelt, dat met een zuivere dobbelsteen wordt geworpen.
1 5/6 4/6 3/6 2/6 1/6 0
1/6 1
2
3
4
5
6
1/6 1
1/6 2
1/6 3
1/6 4
1/6 5
6
—Fig. 8.4.1— (8.5) Een stochast met een discrete verdelingsfunctie wordt zelf ook wel discreet genoemd. In het discrete geval wordt meestal niet gerekend met de verdelingsfunctie, maar met de sprongen zelf (zie bovenstaand staafdiagram). In de grafiek links lezen we af:P ( x ≤ 4, 7 ) = 4/6 = 2/3. Dat is logisch: een aantal ogen ≤ 4, 7 is hetzelfde als een aantal ogen ≤ 4. Ga nog na: P ( x ≤ 3, 99999 ) = 1/2. Het kansgedrag van een discrete stochast X is bepaald door twee rijen: de rij der ¡ ¢ mogelijke waarden (an ) van X en de rij kansen (pn ) = p(an ) op die waarden. Een rij niet-negatieve getallen met som 1 heet een discrete kansverdeling of ook wel een discrete verdeling. Deze terminologie wordt vooral daar gebruikt waar geen verwarring bestaat omtrent de waardenverzameling van de stochast. Meestal is sprake van de verzameling {(0), 1, 2, . . .}; al of niet afbrekend; zoals het tellen van voorvallen. (8.6) Voorbeelden van discrete kansverdelingen; wiskundige voorbereiding. Alvorens enige belangrijke discrete kansverdelingen op te schrijven, is het wellicht dienstig eerst enige wiskundige zaken kort te bespreken. Het betreft hier de zogenoemde faculteiten en binomiaalco¨effici¨enten.
Edens 060214-1610
– 23 –
Kansrekening en statistiek (Inf.)
(8.7) Faculteiten. De ,,faculteit” is een uitdrukking uit de leer der permutaties. Definitie: Laat n een natuurlijk getal zijn. Dan is n! = 1 · 2 · 3 · . . . · n (n = 1, 2, . . .);
0! = 1.
(3)
Het gaat dus om het product van de eerste n natuurlijke getallen. Enkele waarden zijn 5!=120 7!=5040 10!=3628800 20!=2432902008176640000 30!=265252859812191058636308480000000 40!=815915283247897734345611269596115894272000000000 50!=30414093201713378043612608166064768844377641568960512000000000000 60!=8320987112741390144276341183223364380754172606361245952449277696409600000000000000
Net als met kinders; ze worden snel groot. Faculteiten spelen een belangrijke rol in de kansrekening. De oorzaak is, dat n! precies het aantal volgorden (permutaties) is, waarop n dingen op een rijtje kunnen worden gezet. Dat is niet moeilijk na te gaan: als we bijvoorbeeld de getallen 1,2,3,4,5 op alle mogelijke volgorden willen plaatsen, hebben we voor de eerste plaats 5 mogelijkheden. Voor de tweede plaats kunnen we kiezen uit vier stuks, want ´e´en is al geplaatst. Dit zijn nu al 5 · 4 = 20 mogelijkheden. Zo doorgaand komen we tot 5! = 120 mogelijke volgorden. De apart gekozen 0! = 1 is handig in formules. Sommigen voelen zelfs aan, dat de lege verzameling op maar ´e´en manier te ordenen is. (8.8) Binomiaalco¨effici¨enten. Ook dit is een begrip uit de permutatieleer. Binomiaalco¨effici¨enten komen voor in het zogenoemde Binomium van Newton; daar ontlenen ze hun naam aan. Voor een Binomiaalco¨effici¨ent zijn twee getallen nodig; zeg k en n met k ≤ n. De bijbehorende binomiaalco¨effici¨ent is dan het aantal mogelijke manieren waarop we een deelverzameling van k elementen kunnen kiezen uit een gegeven verzameling van n elementen. Als k = 2, kunnen we uit de verzameling {1, 2, 3, 4, 5} (n is dus 5) de volgende deelverzamelingen kiezen: {1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5} en {4, 5}. Dat zijn tien mogelijkheden; de binomiaalco¨effici¨ent is dus 10. Dit is ook direct vast te stellen: we vormen als in de vorige paragraaf een rijtje van twee. Dat gaat op 5 · 4 = 20 manieren. Maar dan komt elke deelverzameling van twee elementen twee keer voor! (bv. {2, 4} en {4, 2}). Het aantal deelverzamelingen is dus 5 · 4/(2!) = 10. De binomiaalco¨effici¨ent wordt algemeen gedefinieerd als µ ¶ n n(n − 1)(n − 2) · . . . · (n − k + 1) = k k! n! = (1 ≤ k ≤ n); (4) k!(n − k)! µ ¶ µ ¶ n n = 1; = 0 als k > n. 0 k Dit is inderdaad ook goed voor k = 0 (nl. 0! = 1); er is maar ´e´en deelverzameling van ,,nul elementen” van een verzameling van n elementen; nl. de lege verzameling. Deze is deelverzameling van elke verzameling.
Edens 060214-1610
– 24 –
Kansrekening en statistiek (Inf.)
Binomiaalco¨effici¨enten kunnen voor kleine n en k uit de zogenoemde driehoek van Pascal worden gehaald: zie hieronder.
1 2 3 4 5 6 7 8 9 10
1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 1 8 28 56 70 56 28 8 1 1 9 36 84 126 126 84 36 9 1 1 10 45 120 210 252 210 120 45 10 1
In de tabel staan de binomiaalco¨effici¨enten; n staat links verticaal. Zo is enz; algemeen is µ ¶ µ ¶ n n = . k n−k
¡8¢ 3
=
¡8¢ 5
= 56 (5)
In de driehoek van Pascal is elk getal de som der beide bovenburen (niet de eerste of laatste van een regel; die zijn automatisch 1). (8.9) De binomiale verdeling. Stel dat n keer eenzelfde soort experiment wordt uitgevoerd. De verschillende uitvoeringen geschieden onafhankelijk van elkaar. Elk experiment geeft kans p op ,,succes” en kans q = 1 − p op ,,mislukking”. Het aantal successen in de serie van n experimenten hangt van het toeval af; het is natuurlijk een getal uit {0, 1, 2, . . . , n}. Laat x het aantal successen zijn. Dan is x een stochastische variabele. De kansverdeling van x is gegeven door µ ¶ n k n−k P (x = k) = p q ; k = 0, 1, 2, . . . , n; q = 1 − p. (6) k Deze verdeling heet de binomiale verdeling met parameters n en p; kortweg Bin(n; p). We schrijven wel: x is Bin(n; p)-verdeeld. Enige voorbeelden: 1. Het aantal koppen in een serie van 100 worpen met een zuivere munt is Bin(100; 12 )verdeeld. 2. Stel dat we een vaas hebben met M ballen, waarvan K ballen rood zijn en de overige wit. Als we n keer aselect een bal uit de vaas trekken en deze steeds weer terugleggen, dan is het aantal keren dat een rode bal wordt getrokken Bin(n; K/M )verdeeld. Immers bij elke trekking is de kans op een rode bal (,,succes”) gelijk aan K/M en de trekkingen zijn onafhankelijk.
– 25 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
De binomiale verdeling speelt een belangrijke rol bij verschillende statistische toetsen, waarover later meer. In onderstaande figuur is het staafdiagram van een Bin(10; 0, 25)verdeling getekend.
0
1
2
3
4
5
6
7
8
9
10
—Bin(10; 0, 25)-verdeling— De top is aan de linkerkant. Dat is niet verwonderlijk: als de kans op succes klein is, is de kans op weinig successen (links in de grafiek) groot en de kans op veel successen (rechts in de grafiek) klein. (8.10) De hypergeometrische verdeling. In de vorige paragraaf was sprake van het n keer trekken van een bal uit een vaas. De bal werd steeds weer teruggelegd. Veronderstel nu dat we de bal niet terugleggen. Dan zijn de trekkingen ook uit te voeren door ineens ´e´en greep van n ballen uit de vaas te doen. Wat is de kans dat in de greep precies k rode ballen voorkomen? Het totaal aantal¡ mogelijke grepen is gelijk aan het aantal ¢ deelverzamelingen van n uit de vaas: dat is M . Het aantal gunstige gevallen (k rode n ¡K ¢¡M −K ¢ ¡K ¢ ballen in de steekproef) is k n−k . Immers, op k manieren zijn k rode ballen te ¡ −K ¢ pakken; bij elk van deze mogelijkheden zijn Mn−k manieren om de n − k witte ballen te kiezen. Laat nu x het aantal rode ballen in de steekproef zijn. Dan is µ ¶µ ¶ K M −K k n−k µ ¶ P (x = k) = . M n
(7)
Deze verdeling speelt voor ons niet zo’n grote rol. Bij enquˆeteringen en kwaliteitscontrˆole (aselecte steekproeven zonder teruglegging) is de hypergeometrische verdeling belangrijk. (8.11) Hypergeometrische versus binomiale verdeling. Een aardig resultaat krijgen we, als weinig ballen worden getrokken uit een vaas met erg veel ballen. Dan is dus n klein en M groot. Laat de fractie rode ballen in de vaas een ,, gewoon” getal zijn (niet practisch 0 of practisch 1). Dan maakt het niet zo veel uit of met dan wel zonder teruglegging wordt getrokken. Van een vaas zo volgeladen. . .. In dat geval lijkt de hypergeometrische
– 26 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
verdeling dan ook sterk op de binomiale verdeling. We hebben voor vaste p met 0 ≤ p ≤ 1 en n = 0, 1, 2, . . .: ¶ µ ¶µ M −K M µ ¶ n k k n−k µ ¶ lim = p (1 − p)n−k ; k = 0, . . . , n. M →∞ M k K→∞ K/M →p n (8.12) De Poissonverdeling. We komen nu tot de belangrijkste verdeling voor ons doel; de verdeling voor de ,,ongevalsstatistiek”. We voeren ter inleiding het volgende experiment uit. Ga uit van een vaas met 10.000 ballen en wel 400 zwarte en 9600 witte. We trekken nu aselect, voor de vereenvoudiging zonder teruglegging (dat maakt niet zoveel uit), honderd ballen. Laat x het aantal zwarte ballen zijn in de zo ontstane steekproef. Dan is x : Bin(100; 0, 04)-verdeeld. Zo is bijvoorbeeld µ ¶ 100 P (x = 3) = (0, 04)3 (0, 96)97 3 µ ¶99 100 · 99 · 98 4 3 (0, 04) 1 − = 3! 100 µ ¶100 3 3 (100) · (0, 04) 4 ≈ 1− 3! 100 3 4 −4 ≈ e . (8) 3! Het verschil is klein: de exacte kans is 0, 1973; de benaderende kans met de e-macht erin is 0, 1954. Voor een grotere vaas en een grotere steekproef wordt het nog beter. De verdeling met de e-macht is de Poissonverdeling. Definitie: Een stochast x heeft een Poissonverdeling met parameter λ (λ > 0) als x waardengebied 0, 1, 2, 3, . . . heeft met kansen P ( x = k ) = e −λ
λk ; k!
k = 0, 1, 2, . . . .
(9)
Het bovenstaande geeft direct aanleiding tot het volgende: (8.13) Verband tussen binomiale verdeling en Poissonverdeling. Hier is sprake van een limietovergang: bovenstaande redenering geeft aanleiding tot een wiskundige stelling. Laat λ > 0 gegeven zijn. Dan is µ ¶ n k λk lim p (1 − p)n−k = e −λ ; k = 0, 1, 2, . . . . (10) k k! n→∞ p→0 np→λ
(8.14) Voorbeeld . Neem een deegmachine die 1000 liter deeg bevat. Doe daar 3000 krenten in en roer het geheel goed door. Schep dan twee liter deeg. Het aantal krenten
– 27 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
x in de uitgeschepte hoeveelheid deeg hangt van het toeval af (,,is stochastisch”). Dit aantal heeft een Poissonverdeling met parameter 3000 1000 · 2 = 6. De kans op ten hoogste drie krenten is dus · ¸ 6 62 63 P ( x ≤ 3 ) = e −6 1 + + + = 0, 1512. (11) 1! 2! 3! Dat hier sprake is van een Poissonverdeling, kan op de volgende manier aannemelijk worden gemaakt. Laat de krenten erg klein zijn. Verdeel de deegmassa denkbeeldig in zeer kleine stukjes, zeg kubusjes en stel dat een kubusje `of uit deeg bestaat, `of uit een krent. Schep nu steeds kubusjes uit; elk kubusje is met een bepaalde, zeer kleine, constante kans een krent. Schep zoveel, dat de vereiste twee liter is bereikt. Daarvoor is een groot aantal kubusjes nodig. Het aantal krenten in de uitgeschepte twee liter heeft een binomiale verdeling met grote n en kleine p, terwijl np steeds ongeveer 6 blijft: als n toeneemt, worden de kubusjes kleiner en daarmee p; de kans p is evenredig met het volume van een kubusje. Onderstaande figuur toont een staafdiagram van de Poisson(6)-verdeling.
0
5
10
15
20
—Poisson(6)-verdeling— (8.15) Poissonproces; ongevallen. Ga uit van verschijnselen, die ten opzichte van de tijd die elk verschijnsel duurt, zelden voorkomen. Voorbeelden zijn klanten aan een loket, telefoongesprekken bij een portier of telefooncentrale en ongevallen op een bepaalde plaats. Een veel gebruikt model voor bovengenoemde situaties is het zogenoemde Poissonproces. Bij dit proces is sprake van een parameter, zeg λ, de intensiteit van het Poissonproces. Hierbij gelden de volgende eigenschappen:
Edens 060214-1610
– 28 –
Kansrekening en statistiek (Inf.)
a) Het aantal registraties (bv. ongevallen) dat plaats vindt in een tijdsinterval ter lengte ∆T is Poisson-verdeeld met parameter λ∆T . b) Aantallen registraties uit disjuncte tijdsintervallen zijn onafhankelijk. c) Geen opeenhoping: De kans op tenminste ´e´en registratie in een klein tijdsintervalletje is klein en ongeveer een constante vermenigvuldigd met de lengte van dat intervalletje (die constante is juist de parameter λ). Echter: de kans op twee of meer registraties in datzelfde tijdsintervalletje is, vergeleken met de eerstgenoemde kans, procentueel gezien verwaarloosbaar. In de praktijk komt soms w`el opeenhoping voor (een ongeluk komt nooit alleen?). Het Poissonproces geldt dus zeker niet altijd. Vaak past het goed bij wachttijden aan een loket; aankomsttijden bij niet-frequente, slecht geregelde diensten; telefooncentrales tijdens de daluren, en, inderdaad, ongevallen in een niet al te onveilige omgeving.
– 29 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
9. Verwachting, variantie en standaardafwijking. (9.1) Verwachting van een discrete stochast. De overgang van uitkomstenruimte en gebeurtenissen naar stochastische variabelen betekende een aanzienlijke vereenvoudiging voor al di´e gevallen, waarbij getalwaardige resultaten van experimenten van belang zijn. In veel gevallen echter is een kansverdeling niet precies bekend. Een nog grovere karakterisering van de (getalwaardige) resultaten van een experiment is een soort gemiddelde waarde van alle mogelijke resultaten. Daarmee is vaak een snelle indicatie te geven van de grootte-orde van die resultaten. We hebben de Definitie: Onder de verwachting van een stochastische variabele verstaan we het theoretische gewogen gemiddelde van de waarden, die die stochast kan aannemen. Elke waarde wordt daarbij gewogen met de kans op die waarde. In formulevorm E (x) = a1 · P ( x = a1 ) + a2 · P ( x = a2 ) + a3 · P ( x = a3 ) + · · · ;
(1)
hierin zijn a1 , a2 , . . . de mogelijke waarden die x kan aannemen en staat E voor ,,verwachting” (de E van lat. exspectatio). De verwachting wordt vaak aangeduid met de letter µ. Als we de kansen in een staafdiagram voorstellen door massapunten met massa = kans, dan wijst de verwachting het zwaartepunt van de massaverdeling op de as aan; zie onderstaande figuur.
Z
Z
—Zwaartepunt en verwachting— 1/2,3/8,5/4,1/4 De verwachting nog een andere eigenschap, die erg belangrijk is: in een serie onVerh.heeft stralen: Verh. 4:3:10:2 afhankelijke herhalingen van een experiment komt het gewone gemiddelde van de gemeten Absc.: 4.75,5.25,6.5,7.25 1.5874 : 1.4422 : 2.1544 : 1.2599 resultaten dicht bij de verwachting te liggen en wel dichter naarmate het aantal herhalin6.0131579 gen toeneemt. Dit wordt wel een (theoretische) wet derMu: grote aantallen genoemd; in de kansrekening komen verschillende versies hiervan voor. De verwachting van een stochast wordt ook wel slordigweg de verwachting van de bij die stochast behorende kansverdeling genoemd. Strikt genomen heet de laatste het eerste moment van de verdeling. Wij zullen dit onderscheid hier niet maken. (9.2) Verwachtingen van enkele bekende verdelingen. Voor de kansverdelingen die de revue passeerden, kunnen de verwachtingen wiskundig worden afgeleid. De resultaten zijn te raden; het is steeds inderdaad wat men verwacht:
Edens 060214-1610
– 30 –
Kansrekening en statistiek (Inf.)
1. De Bin(n; p)-verdeling heeft verwachting np. 2. De hypergeometrische verdeling met de gebruikte parameters M, K, n (aantallen rode en witte ballen enz.) heeft verwachting nK/M . Dat is logisch: we verwachten dezelfde fractie zwarte ballen in de steekproef als in de vaas; die fractie is K/M . 3. De Poisson(λ)-verdeling is een limietgeval van de binomiale verdeling; de limietovergang np → λ suggereert dat de verwachting λ zal zijn, wat ook het geval is: de verwachting is λ. (9.3) Variantie en standaardafwijking van een discrete stochast. De verwachting van een stochast geeft het ,,zwaartepunt” van de mogelijke resultaten aan. Nu volgt een maat voor de ,,gemiddelde breedte” en wel een soort gemiddelde breedte om het zwaartepunt, dus om de verwachting. Het geheel komt overeen met het begrip traagheidsmoment in de mechanica; het nieuwe iets heet ,,variantie”. Definitie: De variantie van een stochast x is het gewogen gemiddelde van de kwadraten van de afstanden tot de verwachting; in formulevorm var x = (a1 − µ)2 · P ( x = a1 ) + (a2 − µ)2 · P ( x = a2 ) + (a3 − µ)2 · P ( x = a3 ) + · · · ; (2) hier weer a1 , a2 , . . . voor de mogelijke waarden van x; de verwachting van x is µ genoemd. Het uiterlijk van de formule geeft aan dat we kunnen schrijven ¢ ¡ var x = E (x − µ)2 ;
(3)
de verwachting dus van een nieuwe stochast die uit de oude x ontstaat door ,,µ af te trekken en daarna te kwadrateren”. Hier is nog veel meer over te zeggen, maar ons bestek laat dit niet toe. De variantie is een kwadratische grootheid. Als x bijvoorbeeld in cm wordt gemeten, is var x in cm2 . De wortel uit de variantie heet de standaardafwijking. Duidelijk is nu: een kleine standaardafwijking betekent een verdeling die sterk geconcentreerd is; een grote standaardafwijking hoort bij een verdeling die gespreid ligt; in het laatste geval komen bij herhaalde experimenten grote variaties in de resultaten voor. (9.4) Varianties van enkele bekende discrete verdelingen. Zonder bewijs geven we de varianties van enkele verdelingen; de standaardafwijking is steeds de wortel uit de variantie. 1. De Bin(n; p)-verdeling heeft variantie npq ofwel np(1 − p). De standaardafwijking is √ dus npq. 2. De hypergeometrische verdeling heeft met de parameters M, K, n variantie nK(M − K)(M − n) . M 2 (M − 1) 3. De Poisson(λ)-verdeling is een limietgeval van de binomiale verdeling; de limietovergangen np → λ en p → 0 tonen aan dat de variantie np(1 − p) steeds dichter bij np komt te liggen. Inderdaad blijkt: De variantie van de Poisson(λ)-verdeling is gelijk √ aan de verwachting; dus λ. De standaardafwijking is dus λ.
– 31 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
10. Continu-verdeelde stochasten. (10.1) Definities. We gaan uit van hetzelfde begrip van stochast als eerst. Nu echter is het waardengebied een continu¨ um van re¨ele getallen. Denk bijvoorbeeld aan lengte–, tijd– of gewichtsbepalingen. Laat x zo’n stochast zijn. Dan is de cumulatieve-verdelingsfunctie Fx (x) = P ( x ≤ x ) een continue kromme; dus geen ,,trapfunctie” zoals bij discrete verdelingen. Nu echter is geen sprake van staafdiagrammen, maar van een zogenoemde kansdichtheid of kortweg dichtheid . We noemen deze laatste fx (x). De dichtheid is de afgeleide van de verdelingsfunctie. Een dichtheid fx (x) is gekarakteriseerd door Z ∞ fx (x) ≥ 0; fx (x) dx = 1. (1) −∞
Een dichtheid is kortweg een niet-negatieve functie met daaronder totale oppervlakte 1. Het rekenen met dichtheden is vaak eenvoudiger dan met discrete verdelingen: De kans dat x in een bepaald gebied terecht komt, is de oppervlakte die tussen dat gebied en de dichtheid is gelegen. In de praktijk bedient men zich hierbij van integraalrekening of van tabellen; sommige dichtheden zijn nl. niet eenvoudig te integreren. Wij gebruiken de integraalvoorstelling alleen om de oppervlakte aan te duiden; de integraalrekening zelf blijft hier buiten beschouwing. Zo is Z a Z ∞ P ( x ≤ a ) = Fx (a) = fx (x) dx; P ( x > b ) = 1 − Fx (b) = fx (x) dx; −∞ b (2) Z v P ( u < x < v ) = Fx (v) − Fx (u) = fx (x) dx; u
in onderstaande grafieken zijn deze gebieden beschaduwd aangegeven.
a
u
v
b
Merk op dat we overal binnen de haken van P ( ) naar willekeur < kunnen vervangen door ≤ en omgekeerd; net zo voor > en ≥. De oppervlakte boven een punt op de as is nul: Bij continu-verdeelde x is altijd P ( x = a ) = 0. Het wordt anders bij een heel klein intervalletje om a: voor kleine ∆x is ¡ ¢ P a − 12 ∆x < x < a + 21 ∆x ≈ fx (a) · ∆x. (3) (10.2) Verwachting en variantie van continue verdelingen. We geven volledigheidshalve alleen de formules: Laat stochast x dichtheid fx (x) hebben. Dan is Z ∞ Z ∞ E (x) = x · fx (x) dx; var x = (x − µ)2 · fx (x) dx; (4) −∞
−∞
– 32 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
hierin is µ = E (x). Nu volgen enkele continue verdelingen, die voor de praktijk belangrijk zijn. (10.3) De (negatief-)exponenti¨ele verdeling. We zeggen dat stochast x exponentieel verdeeld is met parameter λ > 0 als ½ ½ −λx −λx 1 − e x ≥ 0 x≥0 fx (x) = λ e (5) Fx (x) = 0 x<0 0 x<0 Zonder bewijs:
1 1 1 ; var x = 2 ; St.afw. = . λ λ λ Voor positieve a en b met a < b en exp(λ)-verdeelde x is dus E (x) =
P ( x < a ) = 1 − e −λa ;
P ( a < x < b ) = e −λa − e −λb ;
(6)
P ( x > b ) = e −λb . (7)
Hieronder zijn grafieken van een exponenti¨ele verdelingfunctie met dichtheid weergegeven.
1
P( a < x < b ) 0.8 0.6 0.4
P( a < x < b )
0.2 0
a
b
a
b
—Exponenti¨ele verdeling— De exponenti¨ele verdeling speelt een belangrijke rol bij het Poissonproces (zie (8.15)) als wachttijdproces, zoals telefoongesprekken, aankomsttijdstippen van klanten en tijdstippen waarop ongevallen plaats vinden. De exponenti¨ele verdeling is steeds de verdeling van de tijd, die verloopt tussen twee opeenvolgende registraties. Let wel: bij het Poissonproces. We herhalen nu de karakterisering van dit proces uit (7.15); aangevuld met de verdeling van deze ,,wachttijden”: a) Aantallen ongevallen uit disjuncte tijdsintervallen zijn onafhankelijk (zie (10.4), verderop). b) Geen opeenhoping: De kans op tenminste ´e´en ongeval in een klein tijdsintervalletje is klein en ongeveer een constante vermenigvuldigd met de lengte van dat intervalletje (die constante is juist de parameter λ). Echter: de kans op twee of meer ongevallen in datzelfde tijdsintervalletje is, vergeleken met de eerstgenoemde kans, procentueel gezien verwaarloosbaar.
Edens 060214-1610
– 33 –
Kansrekening en statistiek (Inf.)
Afgeleid kan worden, dat dan geldt: c) Het aantal ongevallen dat plaats vindt in een tijdsinterval ter lengte ∆T is Poisson-verdeeld met parameter λ∆T . Het verwachte aantal ongevallen in die spanne tijds is dus λ∆T . d) De spanne tijds tussen twee opeenvolgende ongevallen is exponentieel verdeeld met parameter λ. De gemiddelde (=verwachte) tijdsduur is dus 1/λ. Deze tussentijden zijn onafhankelijk van elkaar (zie (10.4) hieronder). e) De wachttijd, die verloopt tussen een zelf vast gekozen tijdstip en het eerstvolgende ongeval is ook exponentieel verdeeld met parameter λ. De beweringen c,d en e zijn alle het gevolg van a en b. Voor de praktijk is testen van a en b dus voldoende, maar dat ligt buiten dit bestek. (10.4) Onafhankelijkheid van stochasten. In het bovenstaande wordt onafhankelijkheid genoemd van stochastische aantallen in disjuncte tijdsintervallen (d.z. intervallen die buiten elkaar liggen). Onafhankelijkheid van stochasten is hetzelfde als onafhankelijkheid van de gebeurtenissen die door die stochasten ,,worden gemaakt”: De stochasten x en y zijn onafhankelijk als ¡ ¢ ¡ ¢ P x ≤ a, y ≤ b = P ( x ≤ a ) · P y ≤ b voor alle re¨ele a en b.
(8)
¡ ¢ ¡ ¢ Het blijkt dat dan ook P x > x, y ≤ y = P ( x > x ) · P y ≤ y ; ¡ ¢ ¡ ¢ ook P x > x, y > y = P ( x > x ) · P y > y enz.; kortom ¡ ¢ ¡ ¢ P x ∈ A, y ∈ B = P ( x ∈ A ) · P y ∈ B voor willekeurige verzamelingen A en B in de re¨ele getallen. Uitbreiding voor meer dan twee stochasten: de stochasten x1 , x2 , . . . , xn zijn onafhankelijk als voor elk n-tal re¨ele getallen c1 , c2 , . . . , cn geldt: P ( x1 ≤ c1 , x2 ≤ c2 , . . . , xn ≤ cn ) = P ( x1 ≤ c1 ) · P ( x2 ≤ c2 ) · . . . · P ( xn ≤ cn ) . (9) Ook hiervan geldt een uitbreiding voor de xi in willekeurige verzamelingen re¨ele getallen; zoals boven voor twee is aangegeven. (10.5) Voorbeeld . Laat op een bepaalde plaats het aantal ongevallen gemiddeld ´e´en per week zijn. Dan geldt: 1. De kans op meer dan twee ongevallen in een week is · ¸ 1 12 5 1 − e −1 1 + + =1− = 0, 0803. 1! 2! 2e
(10)
2. De kans dat ik vanaf een door mij gekozen vast tijdstip langer moet wachten dan tien dagen is 10 ¢ ¡ −1· 7 P tussentijd > 10 = 0, 2379. (11) 7 (week) = e
– 34 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
3. De kans dat de volgende week meer dan twee ongevallen voorkomen en tegelijk in de daaropvolgende veertien dagen geen enkel ongeval, is ¡ ¢ ¡ ¢ P x > 2, y = 0 = P ( x > 2 ) · P y = 0 ¶ · ¸ µ 20 5 = 1− · e −2 · 2e 0! = 0, 0109;
(12)
hierin is x het aantal ongevallen in de volgende week en y het aantal ongevallen in de daaropvolgende veertien dagen. Die tijdsintervallen liggen buiten elkaar, zodat x en y onafhankelijk zijn. Uit de keuze van de lengten dezer intervallen volgt, dat x : Poisson(1)-verdeeld is en y : Poisson(2). Voor uitspraken betreffende kansen op aantallen ongevallen in meer dan twee buiten elkaar liggende tijdsintervallen berekenen we het product van de afzonderlijke kansen in elk interval. De exponenti¨ele verdeling heeft nog een verrassende eigenschap, die geformuleerd wordt met voorwaardelijke kansen. We herschrijven eerst het begrip ,,voorwaardelijke kans” in stochast-notatie: (10.6) Voorwaardelijke kansen bij stochasten. Uitspraken over stochasten, die we binnen de haken van een kans tegenkomen, zijn gewone gebeurtenissen. Ze behoren dus tot een of andere ,,onderliggende” uitkonstenruimte Ω, die veelal onder de tafel is verdwenen. Zo is de kans P ( x ≤ a ) de kans op de gebeurtenis, d.i. de verzameling van di´e ω’s (uitkomsten, steekproeven) waarvoor de stochastwaarde (x-waarde) ≤ a uitvalt. Daaruit volgt, dat de gewone kansrekening voor gebeurtenissen kan worden toegepast op uitspraken over stochasten. Zo is bijvoorbeeld ¡ ¢ P x ≤ a, y > b ¡ ¢ P x ≤ a|y > b = ; P y>b ¡
¢
P (x ≤ w|x > v) =
P ( x ≤ w, x > v ) P (v < x < w) = ; P (x > v) P (x > v)
(13) enz.
(14)
Nu de eigenschap van de exponenti¨ele verdeling: als x : exp(λ)-verdeeld is, geldt voor alle positieve a en b: P (x > a + b|x > a) = P (x > b). (15) Dit is eenvoudig in te zien: P (x > a + b|x > a) =
P ( x > a + b, x > a ) ! P ( x > a + b ) = P (x > a) P (x > a)
e −λ(a+b) = e −λb e −λa = P (x > b).
=
(16)
Bij het uitroepteken is gebruikt, dat x > a overbodig is als x > a + b geldt, immers b is positief.
Edens 060214-1610
– 35 –
Kansrekening en statistiek (Inf.)
(10.7) De normale verdeling. Er is ´e´en soort verdeling, die in de kansrekening wel zeer centraal staat. Stel dat we een experiment een groot aantal keren herhalen en wel onafhankelijk. Denk bijvoorbeeld aan het werpen met een dobbelsteen of het registreren van aantallen ongevallen over een groot aantal dagen. We vragen steeds naar de som, of naar het gewone gemiddelde van zo’n serie uitkomsten. Alle afzonderlijke metingen of tellingen hebben dus dezelfde kansverdeling. Als die kansverdeling een eindige, positieve standaardafwijking heeft, lijkt de verdeling van de som of het gemiddelde van alle waarnemingen op een geheel specifieke verdeling, ongeacht de vorm van de verdeling van de afzonderlijke waarnemingen. Die specifieke verdeling heet de normale verdeling. Deze wordt vaak de Gaussverdeling genoemd, hoewel de eigenlijke ontdekker ¡ De ¢Moivre was. Definitie: De normale verdeling met parameters µ, σ 2 , afgekort N µ; σ 2 , is gegeven door de kansdichtheid " µ ¶2 # 1 x − µ f (x) = √ exp − 12 ; x re¨eel. (µ re¨el , σ > 0 vast). (17) σ σ 2π Deze functie is positief en blijkt voor elke µ en σ als aangegeven ,,tot 1 te integreren” en is dus inderdaad een dichtheid. De verwachting blijkt µ te zijn en de standaardafwijking σ. De grafiek van f is symmetrisch om de lijn x = µ en men vindt de buigpunten bij µ ± σ. Zie onderstaande figuur.
σ
σ µ
—Normale verdeling— (10.8) De standaardnormale verdeling. Zeer belangrijk is het speciale geval µ = 0, σ = 1. De N(0; 1)-verdeling heet de standaardnormale verdeling. Deze is uitvoerig getabelleerd; twee tabellen zijn bij deze leidraad opgenomen. De reden is, dat elke normale verdeling door middel van een eenvoudige transformatie omgevormd kan worden tot een standaardnormale verdeling. Deze transformatie is gegeven door ¢ ¡ def x − µ x : N µ; σ 2 ⇐⇒ x∗ = : N(0; 1). σ
(18)
Edens 060214-1610
– 36 –
Kansrekening en statistiek (Inf.)
De stochast x∗ heet de gestandaardiseerde van x. Algemeen wordt de gestandaardiseerde van een stochast verkregen door eerst de verwachting af te trekken en dan dit resultaat te delen door de standaardafwijking. Een gestandaardiseerde stochast heeft altijd verwachting 0 en standaardafwijking 1. Standaardisering is in de theorie van de normale verdeling uiterst belangrijk! We kunnen voor practische berekeningen met ´e´en ,,tabel voor de normale verdeling” volstaan. (Rekenvoorbeelden volgen nog.) De standaardnormale verdelingsfunctie wordt meestal aangegeven met de letter Φ: 1 Φ(x) = √ 2π def
Z
x
1
2
e − 2 u du.
(19)
−∞
(10.9) De tabellen. Deze leidraad bevat twee tabellen, de standaardnormale verdeling betreffende. E´en tabel geeft bij vele waarden van een positieve grootheid u de zogenoemde rechteroverschrijdingskans P ( u > u ) = 1 − Φ(u); hierin is u een of andere denkbeeldige standaardnormaal-verdeelde stochast. De andere tabel geeft bij vele waarden α met 0 < α ≤ 0, 5 di´e u, waarvoor geldt 1 − Φ(u) = α (de zogenoemde rechter kritieke waarde). De bij α passende u noteren we met uα . Een standaardnormaal verdeelde stochast wordt heel vaak met u aangeduid; indien geen verwarring mogelijk is. Dus P ( u > uα ) = α.
(20)
(10.10) Het werken met de tabel . Bij het werken met de tabel is een plaatje in het geheugen prettig; zie onderstaande figuur.
In tabel
—De rechteroverschrijdingskans— Hier zien we de standaardnormale kansdichtheid afgebeeld. De twee buigpunten hebben elk afstand 1 tot de lijn u = 0; dit is in de figuur niet te zien. Bij gegeven u geeft de tabel de waarde van de donkere oppervlakte in vier decimalen. Zo vinden we bij u = 1, 23 de waarde 0,1093. In de tabel kan lineair worden ge¨ınterpoleerd, maar dat is voor ons doel niet zo belangrijk. We voeren in de voorbeelden de lineaire interpolatie wel steeds uit. Voor de praktijk kan meestal worden volstaan met het kiezen van de dichtstbij gelegen tabelwaarde.
– 37 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
(10.11) Voorbeelden. We schrijven steeds > en <. 1. Berekening van P ( u < u ) voor willekeurige re¨ele u: Als u > 0: gebruik P ( u < u ) = 1 − P ( u > u ). Zo is bijvoorbeeld P ( u < 0, 32 ) = 1 − P ( u > 0, 32 ) = 1 − 0, 3745 = 0, 6255. Als u < 0: gebruik P ( u < u ) = P ( u > −u ) (de standaardnormale dichtheid is symmetrisch om 0). Zo is P ( u < −0, 65 ) = P ( u > 0, 65 ) = 0, 2578. 2. Berekening van P ( u > u ) voor negatieve u: Gebruik P ( u > u ) = 1 − P ( u < u ) = 1 − P ( u > −u ). Zo is P ( u > −1, 31 ) = 1 − P ( u > 1, 31 ) = 1 − 0, 0951 = 0, 9049. 3. Berekening van P ( a < u < b ) voor a < b: P ( a < u < b ) = P ( u > a ) − P ( u > b ). Daarna eventueel volgens 1 en 2. Zo is P ( 0, 24 < u < 1, 16 ) = P ( u > 0, 24 ) − P ( u > 1, 16 ) = 0, 4052 − 0, 1230 = 0, 2822; P ( −1, 02 < u < 0, 73 ) = P ( u > −1, 02 ) − P ( u > 0, 73 ) = 1 − P ( u > 1, 02 ) − P ( u > 0, 73 ) = 1 − 0, 1539 − 0, 2327 = 0, 6134. P ( −2, 08 < u < −0, 22 ) = P ( 0, 22 < u < 2, 08 ) = 0, 4129 − 0, 01876 = 0, 3941. ¡ ¢ (10.12) Berekening aan een algemene normale verdeling. Als stochast x : N µ; σ 2 verdeeld is, dan is x∗ : N (0; 1). Zo is bijvoorbeeld voor re¨ele a en b met a < b: µ P (a < x < b) = P
b−µ a−µ < x∗ < σ σ
¶
µ =P
a−µ b−µ
¶ .
(21)
Laat x : N (2, 11; 0, 27)-verdeeld zijn. Dan is µ
¶ 1, 04 − 2, 11 2, 67 − 2, 11 √ √
P ( 1, 04 < x < 2, 67 ) = P
(22)
(10.13) De ,,terugzoektabel”. Deze tabel geeft de rechter kritieke waarde als functie van de rechteroverschrijdingskans. Zo vinden we bijvoorbeeld voor α = 0, 072 de tabelwaarde uα = 1, 416. Als gegeven is P ( u < u ) = 0, 398, dan is blijkbaar u < 0 en P ( u > −u ) = 0, 398, zodat −u = 0, 259 en u = −0, 259. Lineaire interpolatie in de tabel geeft een afwijking van maximaal ´e´en eenheid in de derde decimaal. Deze tabel wordt voornamelijk gebruikt bij het statistisch toetsen van hypothesen. (10.14) De Erlangverdeling. Deze verdeling is de verdeling van de som van een aantal exponentieel verdeelde stochasten, alle met eenzelfde parameter λ. Het is de verdeling van de ,,wachttijd” tot het n-de ongeval. Het maakt bij het Poissonproces niet uit of we de tijd rekenen vanaf een bepaald ongeval, dan wel vanaf een bepaald vastgesteld tijdstip. Als het aantal ongevallen gemiddeld, zeg 0,4 per dag bedraagt, heeft de tijd t tussen ,,nu” en het tiende ongeval na ,,nu” een Erlangverdeling met parameters 10 en 0,4; kortweg
– 38 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
Erlang(10; 0, 4). Hoewel we de mathematische voorstelling van de Erlangdichtheid niet expliciet nodig hebben, geven we die voor de volledigheid: ( λn n−1 −λx e x≥0 (n−1)! x ft (x) = ; (23) 0 x<0 de verdelingsfunctie is · P (t ≤ x) = 1 − e
−λx
¸ (λx)n−1 (λx)2 ; 1 + λx + + ··· + 2! (n − 1)!
x ≥ 0.
(24)
Hieronder staan enige Erlangdichtheden afgebeeld.
1 0.8 Erlang( n;1)-verdelingen
0.6
voor n=1,2,3,4,5.
1
0.4
2 3
4
5
0.2 0
0
1
2
3
4
5
6
7
8
9
10
Zonder bewijs vermelden we, dat de Erlang(n;√λ)-verdeling verwachting n/λ heeft en variantie n/(λ2 ). De standaardafwijking is dus n/λ. (10.15) Verband tussen de Erlangverdeling en de Poissonverdeling. Bekijk een vaste tijdsperiode ter lengte T en daarbij de volgende gebeurtenissen (die al of niet optreden): 1. In genoemde tijdsperiode bedraagt het aantal ongevallen nT tenminste n. Dit aantal is Poisson(λT )-verdeeld. 2. De ,,wachttijd” sn , gerekend vanaf het begin van genoemde tijdsperiode tot het n-de daaropvolgende ongeval, is maximaal T . Die wachttijd is Erlang(n; λ)-verdeeld. Genoemde twee gebeurtenissen zijn hetzelfde. De kansen daarop dus ook: P ( nT ≥ n ) = P ( sn ≤ T ) ofwel ,,P ( Poisson(λT ) ≥ n ) = P ( Erlang(n; λ) ≤ T ) ”. (25) Dit verklaart het ,,Poissonachtige” uiterlijk (24) van de Erlang-verdelingsfunctie. In het volgende hoofdstuk zullen we enige practische berekeningen maken.
– 39 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
11. Normale benadering. (11.1) Normale benadering van enige kansverdelingen. Sommige kansverdelingen kunnen benaderd worden met een normale verdeling. Dit is in het bijzonder het geval indien het gaat om een verdeling van een som of gemiddelde van een niet te klein aantal onafhankelijke metingen; waarbij alle metingen dezelfde verdeling hebben. De standaardafwijking van zo’n enkele meting moet eindig zijn en positief. Eindige standaardafwijking: er zijn verdelingen met een oneindige standaardafwijking. Een berucht voorbeeld in de kansrekening is het aantal keren, dat met een zuivere munt moet worden geworpen totdat het aantal keren ,,kop” gelijk is aan het aantal keren ,,staart”. Zulke tellingen blijken enorme fluctuaties te hebben; met het gemiddelde van zelfs een groot aantal van zulke tellingen kan men niets aanvangen. Gelukkig behoren dergelijke gevallen tot de uitzonderingen; alle verdelingen die in het voorgaande werden behandeld, hebben een eindige standaardafwijking. Standaardafwijking nul : Een stochast met standaardafwijking nul is een constante; daar zit niets stochastisch aan. Voorbeeld: als ik ,,kop” gooi, krijg ik €1. Ook als ik ,,munt” gooi, krijg ik €1. De kans op €1 is 1. Ook de som of het gemiddelde is dan constant en zeker niet bij benadering normaal verdeeld. Om de benaderende normale verdeling te specificeren hebben we de verwachting en variantie van de gegeven verdeling nodig. We zeggen daarom eerst iets over de verwachting en de variantie van de som van waarnemingen. (11.2) Verwachting en variantie van een som van stochasten. We gaan uit van waarnemingen (stochasten) x1 , x2 , . . . , xn . Verwachtingen optellen is steeds goed: E (x1 + x2 + . . . + xn ) = E (x1 ) + E (x2 ) + · · · + E (xn ) .
(1)
Varianties (NIET: standaardafwijkingen!) optellen is niet altijd goed. W`el echter als de waarnemingen onafhankelijk zijn: x1 , x2 , . . . , xn onafhankelijk. =⇒ var x1 + x2 + . . . + xn = var x1 + var x2 + · · · + var xn .
(2)
Voor eerder genoemde relevante verdelingen geven we nu de normale benadering. Daarbij stelt u steeds een standaardnormaal verdeelde stochast voor. (11.3) Normale benadering van de Poissonverdeling. Verwachting en variantie van de Poisson(λ)-verdeling zijn beide gelijk aan λ. We vervangen ,,Poisson” eenvoudig door ,,normaal”: Poisson(λ) ≈ N(λ; λ) λ groot. (3) √ Bij berekeningen dus standaardafwijking λ gebruiken! Voorbeeld: stel x : Poisson(12). Dan is ¶ µ ¶ µ 20 − 12 20 − 12 ∗ P ( x > 20 ) = P x > √ ≈P u> √ = P ( u > 2, 3094 ) ≈ 0, 010. 12 12 (4)
– 40 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
Rechtstreekse berekening geeft 0, 0116. Als P ( x < 20 ) werd gevraagd, hadden we met bovenstaande methode 1 − 0, 010 = 0, 990 verkregen. Rechtstreekse berekening geeft in dit geval 0, 979; d.i. 1 − 0, 021. We gaan daarom steeds uit van de verdelingsfunctie P ( x ≤ x ). We benaderen dus µ ¶ 19 − 12 P ( x < 20 ) = P ( x ≤ 19 ) = P x∗ ≤ √ 12 µ ¶ 19 − 12 ≈P u≤ √ = 1 − P ( u > 2, 021 ) ≈ 0, 022. (5) 12 De normale benadering van de Poisson(λ)-verdeling werkt al goed voor λ ≥ 10. De Poissonverdeling kan worden opgevat als som van onafhankelijke verdelingen (weer Poissonverdelingen): x1 , x2 , . . . , xn onafhankelijk, elk Poisson(a) =⇒ x1 + x2 + · · · + xn : Poisson(na). Zelfs sterker: x1 , x2 , . . . , xn onafhankelijk xi : Poisson(ai ); i = 1, 2, . . . , n
(6)
) =⇒ x1 +x2 +· · ·+xn : Poisson(a1 +a2 +· · ·+an ). (7)
Dat laatste is niet zo vreemd: Het aantal ongevallen in een maand is gelijk aan de som der aantallen ongevallen in de eerste, tweede, derde en vierde week, en nog de resterende dagen. Als het gemiddeld aantal (intensiteit) bijvoorbeeld 3,5 per dag is en de maand 31 dagen heeft, is het totaal aantal ongevallen in die maand niet alleen op te vatten als ´e´en Poisson-stochast met parameter 31 · 3, 5 = 108, 5, maar ook als som van onafhankelijke Poisson-stochasten; vier met elk parameter 24, 5 en ´e´en met parameter 10, 5; totaal Poisson(108, 5). Achter in deze leidraad zijn tabellen opgenomen van cumulatieve Poissonkansen voor vele waarden van λ. Tussen twee λ-waarden kan lineair worden ge¨ınterpoleerd; een kleine inspectie leert dat al. Voor grotere λ-waarden dan die in de tabel gebruiken we de normale benadering. Hieronder staan Poissonverdelingen afgebeeld (parameters 5, 10 en 50), tezamen met de benaderende normale verdeling. De Poissonverdelingen niet als staafdiagram, maar in zogenoemde histogramvorm: rechthoeken ter breedte 1. De oppervlakte van zo’n rechthoek is evenredig met de kans op de waarde die midden op de basis van de rechthoek op de as is aangegeven.
-5
0
5
10
15
-5 0
5 10 15 20 25
20 30 40 50 60 70 80
Edens 060214-1610
– 41 –
Kansrekening en statistiek (Inf.)
(11.4) Normale benadering van de Erlangverdeling. De totale tijd die verloopt tussen n opeenvolgende ongevallen in een Poissonproces is op te vatten als een som van n onafhankelijke tijdsverschillen; elk met een exponenti¨ele verdeling met parameter λ. Hier is λ weer de intensiteit van het Poissonproces (het verwachte, gemiddeld aantal ongevallen per tijdseenheid). Voor de totale tijd geldt, dat de verwachting gelijk is aan de som der verwachtingen, dus n/λ; de variantie is de som der individuele varianties, dus n/(λ2 ). Normale benadering geeft ) ³n n ´ Som van n onafh. exp(λ) ≈N ; . (8) λ λ2 = Erlang(n; λ) √ De standaardafwijking is dus ( n)/λ. Laat bijvoorbeeld het aantal ongevallen per dag gemiddeld 0, 4 zijn en zij s10 de spanne tijds tussen een ongeval en het tiende daaropvolgende ongeval. We hebben λ = 0, 4.√ De verwachting van genoemde spanne tijds is n/λ = 25 en de standaardafwijking is n/λ = 7, 9057. Zo is bijvoorbeeld µ ¶ 15 − 25 ∗ ≈ P ( u < −1, 265 ) = P ( u > 1, 265 ) = 0, 103. P ( s10 < 15 ) = P s10 < 7, 9057 (9) Dit kan ook met de Poissonverdeling worden gevonden; immers de gevraagde kans is ook de kans dat in een spanne tijds van vijftien dagen tenminste tien ongevallen plaats hebben. Die kans is P ( x ≥ 10 ) met x : Poisson(6), dus het antwoord is 1 − P ( x ≤ 9 ) = 1 − 0, 916 = 0, 084 (Poissontabel). De normale benadering van de Erlangverdeling geeft een linkeroverschrijdingskans die iets te groot is. Voor twintig ongevallen (n = 20) is bijvoorbeeld E (s20 ) = 50 en st.afw (s20 ) = 11, 18. Dan is µ ¶ 35 − 50 P ( s20 < 35 ) = P s∗20 < ≈ P ( u < −1, 342 ) = P ( u > 1, 342 ) = 0, 090. 11, 18 (10) De Poissontabel geeft bij parameter 35·0, 4 = 14 en waarde 19 de kans 1−0, 923 = 0, 077, zodat de benaderende kans weer iets te groot is. De Erlangverdelingen zijn nogal scheef; de rechterstaart is ,,dikker” dan de linkerstaart. Toch is de normale benadering niet erg slecht. Gebruik van deze verdeling kan worden omzeild door over te gaan op aantallen ongevallen, dus door de Poissonverdeling te gebruiken. (11.5) Normale benadering van de binomiale verdeling. We geven hier alleen de formule en een voorbeeld; bij de statistiek volgt nog nadere toelichting. Bin(n; p) ≈ N(np; npq). (11) √ Let op: de standaardafwijking is npq. In een serie van 100 worpen met een zuivere munt heeft het aantal koppen x een binomiale verdeling met verwachting 100 · 21 = 50 q en standaardafwijking 100 · 12 · 12 = 5. De kans dat het aantal koppen meer dan zestig bedraagt is ¶ µ 61 − 50 ≈ P ( u > 2, 2 ) = 0, 014. P ( x > 60 ) = P ( x ≥ 61 ) = P x∗ > (12) 5
Edens 060214-1610
– 42 –
Kansrekening en statistiek (Inf.)
Rechtstreekse berekening geeft 0, 0176. Bij de binomiale verdeling ¡ kunnen 1we ¢ de normale benadering verbeteren door voor de ,,≤-kans” P ( x ≤ a ) eerst P x ≤ a + 2 te schrijven en dan verder te rekenen. In dit voorbeeld krijgen we uiteindelijk P ( u > 2, 1 ) = 0, 0179. Dat is veel beter; hoewel de benadering zonder deze zogenoemde continu¨ıteitscorrectie al vrij goed is.
– 43 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
12. Vraagstukken over kansverdelingen. 1. Van een groep van honderd mensen heeft tien procent hoge bloeddruk. Bereken de kans dat in een aselect gekozen groep van tien mensen hieruit zich tenminste twee bevinden met hoge bloeddruk. Behandel deze opgave ook met ,,honderd” vervangen door ,,schier oneindig”. Rond beide kansen op vier decimalen af. 2. Van de frisdrank, merk TVPRIK explodeert gemiddeld ´e´en op de twintig flessen. Bereken of benader de kans dat van een zending van vijftig flessen tenminste vijf flessen exploderen. 3. We werpen ´e´en keer met een zuivere dobbelsteen. Het geworpen aantal ogen is k. Vervolgens werpen we ´e´enmaal met k zuivere dobbelstenen. Het totaal aantal ogen ³ ´ ³ ´ uit die worp noemen we nk . Bereken P nk = 2 en P nk = 35 . 4. Laat x Poisson-verdeeld zijn met P ( x = 0 ) = 12 . Bereken E (x). 5. Laat x exponentieel verdeeld zijn met P ( x < 1 ) = P ( x > 1 ). Bereken E (x). 6. Laat x : N(2; 2)-verdeeld zijn. Druk P ( |x − 1| < 2 ) uit in termen van de standaardnormale verdelingsfunctie Φ. ¡ ¢ 7. Laat x : N µ; µ2 -verdeeld zijn; hier is µ > 0. Druk P ( x < −µ | x < µ ) uit in termen van de standaardnormale verdelingsfunctie Φ. 8. Beredeneer dat voor vaste n en p met n ∈ {0, 1, 2, . . .} en 0 ≤ p ≤ 1 geldt:
lim M →∞ K→∞ K/M →p
µ ¶µ ¶ K M −K µ ¶ n k k n−k µ ¶ = p (1 − p)n−k ; M k n
k = 0, 1, . . . , n.
(Een wiskundig bewijs wordt niet gevraagd.) 9. Bereken m.b.v. normale benadering de som · e
−100
¸ 10075 10076 100130 + + ··· + . 75! 76! 130!
Rond het antwoord op vier decimalen af. Dit is bijvoorbeeld de kans dat het aantal ongevallen in een bepaald jaar tussen 75 en 130 valt, als gegeven is dat het jaargemiddelde 100 bedraagt. 10. Aan een loket worden honderd klanten geholpen. De bedieningstijden zijn onafhankelijk; elk is (in minuten) exponentieel verdeeld met parameter 2. Bereken de kans dat de totale bedieningstijd langer is dan een uur. Rond het antwoord af op vier decimalen. 11. Mijn telefoon gaat gemiddeld 20 keer per uur. Bereken de kans op elk der volgende gebeurtenissen: a) Tenminste drie telefoongesprekken tussen 10.00 en 10.15. b) Tenminste drie telefoongesprekken tussen 10.00 en 10.15 en tegelijk g´e´en gesprek tussen 10.50 en 11.00.
Edens 060214-1610
– 44 –
Kansrekening en statistiek (Inf.)
c) Ten hoogste 75 telefoongesprekken in een periode van een vijf uur (benader deze kans). d) Een wachttijd van meer dan 10 minuten tussen twee opeenvolgende telefoongesprekken. e) Een wachttijd van meer dan 10 minuten tussen een telefoongesprek en het derde daaropvolgende.
Edens 060214-1610
– 45 –
Kansrekening en statistiek (Inf.)
13. Statistiek. (13.1) Inleiding. Iets concreter dan in de inleiding van deze leidraad stellen we nu, dat in ons onderdeel Statistiek twee onderwerpen aan de orde komen: het schatten van parameters en het toetsen van hypothesen. Bij het schatten van parameters willen we op grond van waarnemingsmateriaal een uitspraak doen over de grootte van een of meer parameters van de kansverdeling waaruit die waarnemingen geacht worden te zijn getrokken. Bij het toetsen van hypothesen willen we onderzoeken of bepaalde beweringen omtrent genoemde parameters houdbaar zijn. Omdat een en ander omgeven is met onzekerheden, gelden schattingen altijd met een zekere onnauwkeurigheid en getoetste uitspraken altijd behoudens een zekere onbetrouwbaarheid . Onnodig te zeggen dat de verdere onderwerpskeuze, zoals de kansverdelingen, aansluiten bij datgene wat eerder aan de orde is gekomen. (13.2) Schatten van de verwachting. We gaan uit van een stochast x met waarden a1 , a2 , . . . en kansen daarop p1 , p2 , . . .. De verwachting µ is dan p1 a1 + p2 a2 + · · ·. Stel nu dat we beschikken over een serie onafhankelijke metingen (herhalingen) van x; we schrijven x1 , x2 , . . . , xn . Als n groot is, komt in deze rij de waarde a1 met een fractie van ongeveer p1 voor. Zo ook met a2 , a3 enz. Maar dan is de som x1 + x2 + · · · + xn ook te berekenen door eerst alle a1 ’s op te tellen, dan alle a2 ’s enz.; het aantal a1 ’s is ongeveer n · p1 . Zo ook voor de andere mogelijke waarden. Het gevolg is:
dus
x1 + x2 + · · · + xn ≈ (np1 )a1 + (np2 )a2 + · · · ,
(1)
1 (x1 + x2 + · · · + xn ) ≈ p1 a1 + p2 a2 + · · · = µ. n
(2)
Het ligt dus voor de hand, dat we de verwachting µ schatten met het gemiddelde der waarnemingen. We noteren genoemd gemiddelde met x ¯ en spreken van het steekproefgemiddelde van x1 , . . . , xn . Merk op dat we nu stochast-onderstrepingen hebben gebruikt: in de theorie stellen we ons op het standpunt dat de waarnemingen nog moeten worden uitgevoerd. Een schatter is daarmee een stochastische variabele. (13.3) Kwaliteit van de schatter x ¯ . De schatter is een functie van de waarnemingen (metingen) en is dan ook een stochastische variabele. We hopen natuurlijk, dat de waarde die een schatter in de praktijk aanneemt, dicht in de buurt ligt van de (onbekende) parameter. Voor een goede schatter wordt vaak ge¨eist dat deze a) Zuiver is. Dat betekent dat de verwachting van de schatter gelijk is aan de te schatten parameter. Als dit het geval is, ligt de kansverdeling van de schatter in meer of mindere mate om die parameter geconcentreerd. Wij bedienen ons van enige schatters die in de statistiek vaste voet gekregen hebben (zoals bovenstaand steekproefgemiddelde als schatter voor de verwachting; die is inderdaad zuiver). De meest gebruikelijke schatters zijn zuiver of zijn dat ten naaste bij. b) Nauwkeurig is. Dat betekent dat de waarde die de schatter aanneemt weinig variatie vertoont. De kansverdeling van de schatter is dan erg smal en hoog.
– 46 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
Dat betekent dat de standaardafwijking van de schatter klein is. Indien de schatter ook nog zuiver is, ligt zijn verdeling dus dicht geconcentreerd om de parameter. (De standaardafwijking geeft de mate van geconcentreerdheid om de verwachting aan.) Over de standaardafwijking van een som of gemiddelde kunnen we in het algemene geval niets zeggen. Dat kan wel als de waarnemingen onafhankelijk zijn. Laat de verdeling der afzonderlijke waarnemingen standaardafwijking σ hebben; dus σ is de standaardafwijking van ´e´en waarneming. Bij de schatter x ¯ blijkt dan voor onafhankelijke waarnemingen: σ Standaardafwijking van x ¯ is √ . n
(3)
Onderstaande figuur toont de dichtheid van ´e´en resp. het gemiddelde van tien onafhankelijke waarnemingen en wel in het geval van de normale verdeling.
(13.4) Schatten van de standaardafwijking. We bekijken eerst de variantie σ 2 . Deze is gelijk aan de verwachting van (x − µ)2 ; waarin x ´e´en waarneming voorstelt. Laat de waarnemingen x1 , x2 , . . . , xn gegeven zijn. Het ligt dan voor de hand de variantie te schatten met het gemiddelde van de getallen (xi − µ)2 . In de regel is µ niet bekend; die schatten we met x ¯. Een kandidaat voor een schatter van de variantie is dus het gemiddelde der waarden (xi − x ¯)2 . Nu doet zich een verschijnsel voor: de waarde x ¯ past bij de gegeven waarnemingen. Daarom valt het gemiddelde van de (xi − x ¯)2 -waarden in de regel kleiner uit dan het gemiddelde van de (xi − µ)2 -waarden, welke µ men ook zou nemen. Aangetoond kan worden, dat om de schatter zuiver te krijgen de som der (xi − x ¯)2 -waarden niet door n gedeeld moet worden, maar door n − 1. We noemen de zo verkregen schatter s2 ; het is een zuivere schatter van de variantie: ¤ 1 £ (x1 − x ¯ )2 + (x2 − x ¯ )2 + · · · + (xn − x ¯ )2 . (4) n−1 p De standaardafwijking schatten we met s = s2 . Bij de Poisson(λ)-verdeling zijn verwachting `en variantie gelijk aan λ. Het blijkt in dat geval beter te zijn λ te schatten met x ¯ dan met s2 . s2 =
(13.5) Schatten van de mediaan. We hebben nu twee grootheden van een kansverdeling bekeken en deze geschat op grond van een serie waarnemingen; nl. de verwachting en
– 47 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
de variantie. De verwachting zet de plaats van de verdeling vast; de variantie fixeert de breedte. We noemen de verwachting daarom plaatsbepalend en de variantie verschuivingsinvariant. Deze eigenschappen blijken de schatters eveneens te hebben: indien men bij de waarnemingen eenzelfde getal c optelt, wordt het gemiddelde ook c groter en blijft s onveranderd. Er is nu nog een goede plaatsbepalende grootheid; dat is de mediaan m. Die wordt z´o gedefinieerd, dat bij een continue verdeling de oppervlakte onder de dichtheid in twee gelijke delen wordt verdeeld. Bij discrete verdelingen ten naaste bij; daar is een verdeling in twee gelijke delen niet altijd mogelijk. Voor de mediaan m geldt dus Fx (m) = 12 ; of P ( x < m ) = P ( x > m ) = 12 ; zo mogelijk.
(5)
We verwachten dus ongeveer evenveel waarnemingen kleiner als groter dan de mediaan. Hieruit halen we de mediaanschatter : Orden de waarnemingen volgens grootte. Neem in het geval van een oneven aantal de middelste; in het geval van een even aantal het gemiddelde der twee middelste waarnemingen. Dit getal, de zogenoemde steekproefmediaan, is onze mediaanschatter m. (13.6) Voorbeeld : laat bij een serie ongevallen tien opeenvolgende tussentijden zijn gemeten. De resultaten zijn (in dagen): 1, 84 1, 67
3, 53 9, 06 5, 26
1, 58 2, 36 2, 07 2, 81 2, 19;
(6)
1, 58 1, 67
1, 84 2, 07 2, 19
2, 36 2, 81 3, 53 5, 26 9, 06.
(7)
geordend:
De steekproefmediaan is (2, 19 + 2, 36)/2 = 2, 28. Veronderstel dat de metingen uit een exponenti¨ele verdeling komen met parameter λ. De mediaan is (ln 2)/λ, want het is de oplossing van (8) Fx (m) = 1 − e −λm = 12 . Dus (ln 2)/λ ≈ 2, 28 ofwel λ ≈ 0, 304, zodat de verwachte tijd tussen twee opeenvolgende ongevallen ongeveer 1/0, 304 = 3, 29 bedraagt. Met het gemiddelde: We berekenen x ¯ = 3, 24; dit is een directe schatting van de verwachting 1/λ. Vergelijk de waarde 3,29, die via de steekproefmediaan is verkregen. Interessant is te vermelden, dat de gegevens met een rekenmachientje zijn getrokken uit een exponenti¨ele verdeling met verwachting 3,5. We kunnen nog de standaardafwijking schatten en vinden s = 2, 325. Met de kennis van de verdeling moet dit ´o´ ok ongeveer de verwachting 1/λ zijn; immers bij een exp(λ)-verdeling zijn verwachting en standaardafwijking beide gelijk aan 1/λ. (Bij een Poisson(λ)-verdeling zijn verwachting en variantie beide gelijk aan λ.) Voor ,,goede” waarnemingen heeft het steekproefgemiddelde de voorkeur. Indien we echter niet zo zeker van de verdeling zijn, kan het beter zijn gebruik te maken van de steekproefmediaan. Deze laatste is nl. veel minder gevoelig voor ,,uitschieters”: als we bijvoorbeeld de grootste waarneming in dit voorbeeld verhogen met 10, wordt het steekproefgemiddelde verhoogd met 1, maar de steekproefmediaan blijft ongewijzigd! Als
– 48 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
schatter is echter de steekproefmediaan meestal iets onnauwkeuriger (heeft een grotere standaardafwijking) dan het steekproefgemiddelde. (13.7) Toetsen. Veronderstel dat we een uitspraak betreffende een of andere grootheid willen doen, of willen ontzenuwen. Als voorbeeld nemen we het geval van een serie metingen van bedrijfsongevallen. Iemand beweert dat het gemiddeld aantal ongevallen per jaar hooguit 1250 bedraagt. In 85 opeenvolgende dagen werden de aantallen ongevallen geregistreerd. De resultaten zijn: 2 3 4 4 4
4 4 4 6 1
5 2 1 5 6
4 4 0 5 2
6 2 3 2 1
1 2 4 3 6
4 2 8 4 4
1 3 6 9 1
5 5 7 1 6
3 2 5 5 5
1 3 6 6 5
5 8 2 3 5
6 5 2 5 3
7 4 5 1 4
0 4 5 4 6
5 4 5 3 4
4 2 3 3 1
We vatten deze getallen op als onafhankelijke trekkingen uit (,,realiseringen van”) een Poisson(λ)-verdeling. In een klein bedrijf is niet gauw sprake van onafhankelijkheid, want het optreden van een bedrijfsongeval kan voor de korte termijn de ongevallenintensiteit verminderen. Het gemiddelde van de gegevens bedraagt 325/85 ≈ 3, 82. Omdat het aantal waarnemingen groot is, heeft het gemiddelde ongeveer een normale verdeling. We komen daar nog op terug. De som is echter Poisson(85λ)-verdeeld. De som der waarnemingen 325 kan dus worden opgevat als ´e´en trekking uit een Poissonverdeling en wel met parameter 85λ; hier is λ het verwachte aantal ongevallen per dag. We zullen verder met die som rekenen; we kiezen S als onze zogenoemde toetsingsgrootheid . Een ruwe schatting op grond van de waarnemingen leert, dat het jaargemiddelde ongeveer (325/85) · 365 = 1395, 6 bedraagt. Dat is meer dan de vermeende (,,hypothetische”) waarde 1250. Is het ook significant meer, d.w.z. is een uitkomst 325 groot genoeg om bij een jaargemiddelde van 1250 een kleine kans te hebben? Daartoe berekenen we de rechteroverschrijdingskans P ( S ≥ 325 |parameter = 1250 · 85/365 ) ,
(9)
waarin S het aantal ongevallen in 85 dagen voorstelt; deze heeft dus als de veronderstelling waar is een Poissonverdeling met de parameter die achter de streep is aangegeven. Bij het toetsen wordt vaak gebruik gemaakt van de notatie van voorwaardelijke kans; hoewel we hier eerder moeten denken aan ,,gegeven, dat de parameter die en die waarde heeft”. De vermeende Poissonparameter van S is 291, 1. Deze aanname heet de nulhypothese H0 . De ontkenning heet de alternatieve hypothese H1 . We toetsen hier dus H0 : jaargemiddelde ≤ 1250 tegen H1 : jaargemiddelde > 1250. We berekenen de kans (9) met normale benadering: µ ¶ 325 − 291, 1 ∗ P ( S ≥ 325 ) = P S ≥ √ ≈ P ( u ≥ 1, 99 ) ≈ 0, 023. 291, 1
(10)
(11)
Omdat de kans op 325 of meer nog geen 2,5% bedraagt, zit de waarde 325 ver rechts in de staart van de Poisson(291, 1)-verdeling. Een zo kleine kans wordt meestal wel significant
Edens 060214-1610
– 49 –
Kansrekening en statistiek (Inf.)
gevonden; een jaargemiddelde van 1250 is dus een te lage aanname. In sommige andere toepassingen, zoals medicijntests, is een dergelijke overschrijdingskans soms nog te groot om de ,,nulhypothese” te verwerpen. Opmerkingen. 1. We hadden wel direct met het gemiddelde kunnen werken en wel door directe toepassing van de normale benadering: het gemiddelde heeft ongeveer een N (λ; λ/n)p verdeling; de standaardafwijking van dit gemiddelde is dus λ/n. Onder de nulhypothese is het gemiddelde dus N (3, 42; 0, 0403)-verdeeld. In deze verdeling wordt vervolgens een rechteroverschrijdingskans bepaald en wel bij de waarde 3,82. Omdat hierboven al normale benadering is toegepast, zijn de resultaten hetzelfde. Voor kleine aantallen waarnemingen en/of lage tellingen echter is gebruikmaking van de Poissonverdeelde som zelf nauwkeuriger dan de normale benadering. 2. Indien we willen aantonen dat het gemiddeld aantal ongevallen kleiner is dan een of ander beweerd (,,hypothetisch”) bedrag, berekenen we voor het gevonden totale aantal ongevallen een linkeroverschrijdingskans. De toets heet dan linkszijdig; in het andere geval, zoals boven, heet de toets rechtszijdig. In de statistiek komen ook tweezijdige toetsen voor: dan wordt de kans op een afwijking naar boven of naar beneden berekend (toleranties, gehalte aan een of andere werkzame stof o.i.d.). (13.8) Vormen van toetsen. Soms wordt niet direct een overschrijdingskans berekend, maar wordt eerst een maximale kans α afgesproken, de zogenoemde onbetrouwbaarheid van de toets. Vaak wordt 0,05 of 0,01 genomen. Van beide uiteinden (,,staarten”) van de verdeling van de toetsingsgrootheid onder de nulhypothese wordt een gebied berekend met elk kans α/2. De zo ontstane gebieden heten de linker- en rechter kritieke zˆ one. Vervolgens worden de waarnemingen gedaan en daaruit wordt een toetsingsgrootheid-waarde berekend (in bovenstaand voorbeeld de som of het gemiddelde). Als die waarde in een der kritieke zˆones terecht komt, verwerpen we de nulhypothese. Als dat niet zo is, verwerpen we de nulhypothese niet. In veel literatuur wordt gesteld, dat we de nulhypothese dan aanvaarden of aannemen. Soms wordt het gebied buiten de kritieke zˆones wel aanvaardingsgebied genoemd. Vroeger las men ook de betere term voorspellingsgebied . (We voorspellen de toetsingsgrootheid daarin.) De statistische voorspellingstheorie is uitgebouwd tot een ander en ruimer vakgebied; het gewone, ouderwetse ,,voorspellingsinterval” als complement van het kritieke gebied wordt vrijwel niet meer genoemd. Absurd, absurder . We berekenden in bovenstaand voorbeeld niet de kans op S = 325, maar de kans op S ≥ 325. Dit volgt uit een algemeen principe: voor verwerping van de nulhypothese moet de waarde 325 nl. ,,absurd groot” zijn. We zoeken nu in dezelfde richting; wat is absurder? Nog grotere waarden! Alle waarden, die ons verder van de nulhypothese verwijderd doen zijn, moeten ,,kritieke waarden” worden. We beginnen daarom bij de gevonden toetsingsgrootheid en nemen daarvan uitgaand al die mogelijkheden, die onder de nulhypothese steeds onwaarschijnlijker worden. Zo komen we in het onderhavige geval tot een rechteroverschrijdingskans; de ,,absurde” waarden vormen de kritieke zˆone. (13.9) Aanvaarden van de nulhypothese. De term ,,aanvaarden” is op zich onzin, hoewel in de literatuur soms tegelijk wordt vermeld dat de nulhypothese dan zeker niet waar behoeft te zijn. In het spraakgebruik is voor velen ,,aanvaarden” ongeveer synoniem
Edens 060214-1610
– 50 –
Kansrekening en statistiek (Inf.)
met ,,voor waar houden”. Vermenging van wiskundige en dagelijkse begrippen is alleen maar gevaarlijk. Inderdaad zijn er voorbeelden te over, waarbij absurde nulhypothesen ,,statistisch aanvaard” worden. Wij spreken liever van ,,niet verwerpen”. Een veilige werkwijze is, dat wij datgene wat wij (statistisch) willen bewijzen, als alternatieve hypothese nemen. Als de toetsingsgrootheid dan in een kritieke zˆone valt, is de kans dat de nulhypothese toch waar is, maximaal gelijk aan de gekozen onbetrouwbaarheid α. (13.10) Samengestelde nulhypothese. In bovenstaand voorbeeld luidde de nulhypothese: ,,Het jaargemiddelde is ten hoogste 1250”. Er is geen eenduidige Poissonverdeling met een parameter ≤ 1250. We kiezen uit de mogelijkheden van de nulhypothese di´e parameterwaarde uit, die het veiligst is voor degene die op het standpunt van de nulhypothese staat en die dus het minst snel wordt verworpen. We spreken wel van grenshypothese. In bovenstaand voorbeeld werkten we dan ook met de parameter 1250. Als we werkten met bijvoorbeeld 1240, zou de hypothetische verdeling naar links verschuiven; de berekende rechteroverschrijdingskans op ≥ 325 was dan alleen maar kleiner geworden. Het gunstigste geval voor de nulhypothese is dan de keuze 1250; zelfs dan is de berekende rechteroverschrijdingskans nog erg klein.
– 51 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
14. Enige statistische toetsen. We laten nu enkele statistische toetsen de revue passeren. De behandeling is sterk receptuurmatig. Het betreft hier: 1. De normale toets; 2. de Studenttoets; 3. onderzoek naar het Poisson-verdeeld zijn van aantallen ongevallen (index of dispersion test); 4. de mediaantoets (tekentoets); 5. een directe toets betreffende tussentijden met de Poissonverdeling; 6. een directe toets betreffende tussentijden met de Erlangverdeling; 7. een toets betreffende de parameter van een exponenti¨ele verdeling; 8. de verdeling van de waarnemingen (Chi-kwadraattoets); 9. de verhouding van twee intensiteiten van ongevallenprocessen; 10. het al of niet gelijk zijn van de verdelingen van twee steekproeven (Mann-Whitney- of Wilcoxontoets). De toetsen onder 5, 6 en 7 beogen hetzelfde; die onder 5 en 6 zijn in feite hetzelfde. (14.1) De normale toets. We gaan uit van een aselecte steekproef x1 , . . . , xn uit een N (µ; σ 2 )-verdeling. We veronderstellen µ onbekend en σ bekend . 1) Neem ,,nulhypothese” H0 aan (dat betekent: veronderstel µ = µ0 ) en alternatieve hypothese H1 : µ 6= µ0 . Onder de nulhypothese ligt de kansverdeling van elke waarneming xi vast (i = 1, . . . , n), dus ook de kansverdeling van het steekproefgemiddelde ¯ ligt dan ¯. Onder de nulhypothese ¡ x ¢ vast. Als toetsingsgrootheid nemen we x 2 is x ¯ : N µ0 ; σ /n -verdeeld. 2) Kies onbetrouwbaarheid α. ¡ ¢ 3) Breng in elke staart van de hypothetische x ¯ : N µ0 ; σ 2 /n -verdeling van x ¯ een zˆone 1 aan met daarboven oppervlakte 2 α. We verkrijgen hiermee de linker- en rechter kritieke zˆ one; notatie (−∞; kl ) respectievelijk (kr ; ∞). Dan is hier: σ kl = µ0 − uα/2 √ ; n
σ kr = µ0 + uα/2 √ . n
Immers onder de nulhypothese is: def
u =
x ¯ − µ0 √ is N(0; 1) − verdeeld. σ/ n
4) Doe nu pas de waarnemingen. Bereken hieruit het steekproefgemiddelde x ¯. 5) Als x ¯ in een der kritieke zˆones terecht komt verwerpen we de hypothese H0 ten gunste van de alternatieve hypothese H1 en wel ten gunste van de alternatieve deelhypothese ¯ in de linker kritieke zˆ HL one (LKZ) is gevallen en ten gunste van 1 : µ < µ0 als x de alternatieve deelhypothese HR : µ > µ als x ¯ in de rechter kritieke zˆ one (RKZ) 0 1 is gevallen. Als x ¯ niet in de kritieke zˆone valt, verwerpen we H0 niet. Dat wil niet zeggen dat we H0 aannemen, zie (13.9).
Edens 060214-1610
– 52 –
Kansrekening en statistiek (Inf.)
De hier geschetste gang van zaken is de symmetrische normale toets. Als de alternatieve √ hypothese luidt: µ < µ0 , toetsen we linkszijdig, met de kritieke grens µ0 − uα σ/ n (linkszijdige normale toets); als de alternatieve √ hypothese luidt: µ > µ0 , toetsen we rechtszijdig, met de kritieke grens µ0 + uα σ/ n (rechtszijdige normale toets). Voorbeeld Veronderstel dat een serie van 100 onafhankelijke metingen als gemiddelde de waarde 13,32 gaf en dat de waarnemingen normaal zijn met alle dezelfde onbekende µ en standaardafwijking 1,0. Laat de nulhypothese luiden: µ = 13, 50 en neem onbetrouwbaarheid 5%. We berekenen de eindpunten kl en kr van respectievelijk de linker kritieke zˆone (−∞; kl ) en de rechter kritieke zˆ one (kr ; ∞): √ kl = µ0 − u 12 α · σ/ n = 13, 50 − 1, 960 · 1/10 = 13, 30; √ kr = µ0 + u 12 α · σ/ n = 13, 50 + 1, 960 · 1/10 = 13, 70. We zien dat het steekproefgemiddelde in het voorspellingsinterval is terecht gekomen en verwerpen de hypothese dat µ gelijk zou zijn aan 13,50 dus niet. (14.2) De Studenttoets. We gaan ook nu uit van een aselecte steekproef x1 , . . . , xn uit een N (µ; σ 2 )-verdeling. We veronderstellen echter µ `en σ onbekend . 1) Neem ,,nulhypothese” H0 aan (dat betekent: veronderstel µ = µ0 ) en alternatieve hypothese H1 : µ 6= µ0 . Onder de nulhypothese ligt de kansverdeling van x ¯ nu niet meer vast. We schatten nu σ met v u n 1 X def u 2 s = t (x − x ¯) , n − 1 i=1 i zie ook (13.4). Onder H0 kan de verdeling van def
tn−1 =
x ¯ − µ0 √ s/ n
theoretisch worden afgeleid; voor de praktijk wordt gebruik gemaakt van een tabel of van de ROM van een zakrekenmachientje. Deze verdeling heet de Studentverdeling met n − 1 vrijheidsgraden. (,,Student” was het pseudoniem van W.S. Gosset.) De gehele toetsopzet geschiedt als bij de normale toets. Het enige verschil is dat we σ vervangen door s en uα/2 door tn−1;α/2 . De laatste waarde halen we uit de Studenttabel. We hebben nu dus voor de symmetrische Studenttoets: s kl = µ0 − tn−1;α/2 √ ; n
s kr = µ0 + tn−1;α/2 √ . n
√ Analoog voor de links- en rechtszijdige Studenttoets; dan wordt tn−1;α s/ n gebruikt.
– 53 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
(14.3) Het Poisson-verdeeld zijn van aantallen ongevallen (dispersietoets). We gaan uit van de steekproef x1 , . . . , xn . De nulhypothese luidt: ,,de waarnemingen zijn Poisson(λ)-verdeeld voor zekere λ”. Bij de Poisson(λ)verdeling zijn de verwachting en variantie beide gelijk aan λ. We onderzoeken of dit bij onze waarnemingen niet al te veel afwijkt. Onze toetsingsgrootheid is het quoti¨ent ¤ (n − 1)s2 1£ (x1 − x ¯)2 + · · · + (xn − x ¯)2 . (1) q= = x ¯ x ¯ We verwachten dat q ongeveer n − 1 is. Onder de nulhypothese blijkt de stochast q een zogenoemde χ2 -verdeling met n − 1 vrijheidsgraden te hebben. Kritieke waarden van deze verdeling zijn in een tabel opgenomen. Zowel te kleine als te grote waarden zijn verdacht. Omdat voor de praktijk n niet te klein moet zijn, zeg 30 of meer, volstaat een soort normale benadering: q z=
2q −
√
2n − 3 ≈ N(0; 1).
(2)
Voorbeeld : Ga uit van de gegevens in (13.7). We vinden √ met een zakrekenmachientje (Σ+, √ x ¯ en Σn−1 -knop) q = 81, 077 en z = 2 · 81, 077 − 167 = −0, 19, in de N(0; 1)-tabel totaal niet significant. Dat kan ook haast niet, want de waarnemingen zijn daadwerkelijk uit een Poissonverdeling getrokken (parameter 3,5). Opmerking. Door toevallige oorzaken kan deze toets bij een totaal andere verdeling dan de Poissonverdeling, toch niet de Poissonverdeling verwerpen; nl. als de verwachting en de variantie niet theoretisch, maar numeriek ongeveer aan elkaar gelijk zijn. Dat is jammer; dan moeten we een andere toets gebruiken (de nog te behandelen Chi-kwadraattoets). Maar in gewone gevallen, en zeker als deze dispersietoets wel tot verwerping leidt, is deze toets te verkiezen (iets scherper) dan de Chi-kwadraattoets. (14.4) De mediaantoets (tekentoets). Deze toets wordt ook wel de ,,binomiale toes met p = 12 ” genoemd. De verdeling der waarnemingen is willekeurig; de toets heet daarom ook wel verdelingsvrij . Ga uit van een steekproef x1 , . . . , xn uit een of andere willekeurige continue verdeling. Laat de nulhypothese luiden: ,,de mediaan is gelijk aan a”. Let wel, dit is de theoretische mediaan van de kansverdeling; niet de steekproefmediaan! Als de nulhypothese waar is, is elke waarneming met kans 12 kleiner dan a en ook met kans 21 groter dan a. Neem als toetsingsgrootheid bijvoorbeeld het aantal waarnemingen, groter dan a. Noem dit aantal K. Onder de nulhypothese heeft K een Bin(n; 12 )-verdeling. Als na de metingen de waarde K significant rechts in die binomiale verdeling zit (bereken een rechteroverschrijdingskans!), is dus Kerg groot: er zijn ,,teveel” waarden, groter dan de vermeende a. Conclusie: de vermeende a is te klein gekozen; de werkelijke mediaan is welhaast zeker groter dan a. Als we het aantal metingen, kleiner dan a als toetsingsgrootheid kiezen, is dit onder de nulhypothese eveneens Bin(n; 12 )-verdeeld. Echter: bij dezelfde keuze van a als boven is dit aantal, dat wij J noemen, gelijk aan n − K en dus erg klein: deze J zal in de linkerstaart van de Bin(n; 21 )-verdeling vallen. We moeten dus steeds bedacht zijn op het ,,corresponderend bewegen” van de gekozen grootheden!
Edens 060214-1610
– 54 –
Kansrekening en statistiek (Inf.)
Laat iemand zeggen: ,,De mediaan is tenminste a”. Wij willen dat op grond van ons cijfermateriaal ontzenuwen en kiezen de zojuist geuite bewering als nulhypothese. Nu nog een toetsingsgrootheid. Kies daarvoor het aantal waarnemingen, kleiner dan a; we noemen dit aantal J. Die keuze is willekeurig gedaan. Beredeneer nu: als wij gelijk hebben, is de werkelijke mediaan kleiner dan a. Onze J telt de waarnemingen, kleiner dan a; daarin zijn in dat geval de waarnemingen, kleiner dan de werkelijke (onbekende) mediaan dus inbegrepen en onze J zal in de Bin(n; 12 )-verdeling aan de grote kant uitvallen. We berekenen bij de gevonden J dus een rechter overschrijdingskans in de Bin(n; 21 )-verdeling en kijken of die kans kleiner is dan, zeg 0,05. Men neemt in sommige gevallen al genoegen met 0,10. In het volgende voorbeeld gaan we uit van een nulhypothese die net andersom is en beredeneren opnieuw. Voorbeeld . Neem de gegevens van (13.6); de tien tussentijden. Stel dat iemand beweert: ,,De gemiddelde tijd tussen twee opeenvolgende ongevallen is hooguit 2,5 dag”. Omdat de verdeling der waarnemingen exponentieel is verondersteld, is dit gelijkwaardig met de uitspraak, dat de mediaan hooguit 2, 5 · ln 2 = 1, 73 is. Wij vinden een steekproefmediaan 2,28; dat is groter. Veel groter? Kies als toetsingsgrootheid het aantal J der waarnemingen, kleiner dan 1,73 . Onder de grenshypothese ,,de mediaan is gelijk aan 1,73” heeft J een Bin(n; 12 )-verdeling. We vinden J = 2. Wij willen bewijzen, dat de werkelijke mediaan groter is dan 1,73 en hebben dus de idee dat het aantal waarnemingen, kleiner dan de kleine 1,73, zelf erg klein moet zijn. We berekenen daarom de linkeroverschrijdingskans bij de gevonden waarde 2; dat is ·µ ¶ µ ¶ µ ¶¸ 10 10 10 + + · 2−10 = 0, 055. (3) 0 1 2 Dat is nogal klein. Toch zou bij van te voren vastgestelde onbetrouwbaarheid 5% de nulhypothese (net) niet worden verworpen. (14.5) Directe toets betreffende de tussentijden met de Poissonverdeling. In het geval van het Poissonproces kunnen we ook direct toetsen: de tien tussentijden zijn samen 32,37. We stellen ons op het standpunt van de nulhypothese en daarvan de grenshypothese : neem aan dat de gemiddelde tussentijd 2,5 dag is. In dat geval is sprake van een Poissonproces met parameter 1/2, 5 = 0, 4. Het aantal ongevallen in een spanne tijds ter lengte 32,37 is negen (tel de ongevallen vanaf het eerste). Volgens onze grenshypothese heeft het aantal ongevallen in een periode van 32,37 dagen een Poissonverdeling met parameter 32, 37·0, 4 = 12, 948. We verwachten dus 12,948 ongevallen; we tellen er negen. Is dat significant klein? (We vroegen ons boven in feite af: zijn de tussentijden significant groot?) We berekenen daarom bij de Poisson(12,948)-verdeling de linkeroverschrijdingskans bij de waarde 9 (inclusief): · ¸ 12, 9482 12, 9489 e −12,948 1 + 12, 948 + + ··· + = 0, 169. (4) 2! 9! In tegenstelling tot de mediaantoets leidt de exacte toets met het onderhavige cijfermateriaal niet zo snel tot verwerpen. Dat is onverwacht; toevallig is het aantal kleine metingen zelf gering. Meestal is de exacte toets scherper. (De waarnemingen zijn in werkelijkheid exponentieel verdeld met verwachting 3,5.) Een variant van de exacte toets, dus ook met
Edens 060214-1610
– 55 –
Kansrekening en statistiek (Inf.)
hetzelfde resultaat, wordt verkregen indien men als toetsingsgrootheid de totale wachttijd neemt. Die methode vereist misschien nog wel het minste denkwerk; de wiskunde is alleen iets ingewikkelder: (14.6) Directe toets betreffende de tussentijden met de Erlangverdeling. We gaan uit van de steekproef in (13.6). Als toetsingsgrootheid nemen we de totale tijd t van tien opeenvolgende tussentijden. Dan is t Erlang(10; λ)-verdeeld; met λ de reciproke waarde van de verwachte tussentijd. In onze grenshypothese is die 2,5 dag, zodat λ = 0, 4, als in de vorige toets. In dat geval is t dus Erlang(10;0,4)-verdeeld. Gemeten is een waarde t = 32, 37. Is dat significant groot? Met formule (24) uit (10.14) volgt, dat onder de grenshypothese geldt: P ( t ≥ 32, 37 ) · ¸ (0, 4 · 32, 37)2 (0, 4 · 32, 37)10−1 −0,4·32,37 =e 1 + (0, 4 · 32, 37) + + ··· + = 0, 169.(5) 2! (10 − 1)! In plaats van de Erlangverdeling kan ook gebruik worden gemaakt van de χ2 -tabel. De χ2 -verdelingen zijn ook Erlangverdelingen. Om allerlei mathematische verbanden te omzeilen formuleren we een aparte toets betreffende de parameter van een exponenti¨ele verdeling. Deze toets kan dus in de plaats van de bovenstaande ongevallenvoorbeelden worden gebruikt. Omdat de toets algemeen is, dus niet speciaal voor gegevens uit een Poissonproces bedoeld is, nemen we eens levensduurmetingen. (14.7) Een toets betreffende de parameter van een exponenti¨ele verdeling. In de volgende toets wordt de χ2 -verdeling gebruikt. We gaan uit van een steekproef x1 , . . . , xn uit een exponenti¨ele verdeling met onbekende parameter λ. We denken nu niet in de eerste plaats aan ongevallen en Poissonprocessen, hoewel deze toets natuurlijk wel op het voorgaande van toepassing is. Denk nu bijvoorbeeld aan de levensduur van een niet-slijtend voorwerp (Mingvaas). Soms is die ongeveer exponentieel verdeeld (gewone gloeilampen hebben een levensduur die bij benadering normaal verdeeld is). Als de werkelijke parameter λ is, blijkt te gelden: 2λ(x1 + x2 + · · · + xn ) heeft een χ2 −verdeling met 2n vrijheidsgraden.
(6)
We toetsen H0 : λ ≤ λ0 tegen H1 : λ > λ0 .
(7)
De verwachte levensduur is gelijk aan 1/λ. In de zojuist genoemde toets wordt dus geprobeerd te bewijzen, dat de levensduur niet zo groot is als verondersteld. Immers de veronderstelling, dat de levensduur tenminste gelijk is aan 1/λ0 (d.i. de nulhypothese) proberen we te verwerpen ten gunste van de bewering, dat de levensduur kleiner is dan 1/λ0 (de alternatieve hypothese H1 ). In formule: H0 : (1/λ) ≥ (1/λ0 ) tegen H1 : (1/λ) < (1/λ0 ).
(8)
Voorbeeld : We beschikken over een aselecte steekproef van tien levensduren van een bepaald type apparaat. De getallen zijn: 0, 86 16, 07 12, 93 10, 98 5, 51 12, 08 2, 14 20, 29 6, 44 38, 58.
(9)
– 56 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
We proberen aan te tonen dat de verwachte levensduur tenminste 8,00 bedraagt. De onbetrouwbaarheid nemen we 5%. We noteren de som der n metingen met S. Berekening van 2λ0 S levert 2λ0 S = 2 ·
1 · (0, 86 + 16, 07 + · · · + 38, 58) = 31, 47. 8, 00
(10)
In de χ2 -tabel kijken we bij α = 0, 05 en ν = 20. Dit levert de tabelwaarde 31,4. Onze toetsingsgrootheid is 31,47. Het verschil met de tabelwaarde is niet zinvol uit te maken. We verwerpen de nulhypothese dus niet. Indien de bewering was, dat de verwachte levensduur tenminste 7,00 bedraagt, vinden we voor de toetsingsgrootheid de waarde 35,97. Dit is zeker groter dan de tabelwaarde 31,4, zodat de levensduur wel groter is dan 7,00 (uitspraak behoudens een onbetrouwbaarheid van 5%). (14.8) Tweesteekproeventoets voor de verhouding van verwachte aantallen ongevallen (exponenti¨ele verdeling). Veronderstel bijvoorbeeld dat in een bedrijf een of andere beveiliging is aangebracht. Dit teneinde het gemiddeld aantal ongevallen per tijdseenheid omlaag te brengen. Hieronder volgt een statistische toets, die, op grond van twee series ,,wachttijden” uitsluitsel kan geven omtrent de verhouding van de ongevallenintensiteit. Gegeven zijn daartoe twee steekproeven; de ´e´en (x-waarden) v´o´or, de ander (y-waarden) n´a het aanbrengen van de beveiliging: x1 , . . . , xm v´o´ or; y 1 , . . . , y n n´a de beveiliging.
(11)
Deze x- en y-waarden zijn dus tijden, die verlopen van een ongeval tot het volgende ongeval . We nemen hierbij aan, dat de x-waarnemingen exponentieel verdeeld zijn met parameter λx en de y-waarnemingen exponentieel verdeeld met parameter λy ; alle waarnemingen worden geacht onafhankelijk van elkaar te zijn. De parameters λx en λy zijn de ongevallenintensiteiten (verwachte aantallen per tijdseenheid); hun reciproke waarden 1/λx en 1/λy zijn de verwachte tijdsduren tussen twee opeenvolgende ongevallen. Deze laatste kunnen worden geschat met de steekproefgemiddelden x ¯ resp. y¯. Aangetoond kan worden, dat geldt: def
q yx =
λy · y¯ heeft een Fm,n − verdeling. λx · x ¯
(12)
Deze zogenoemde Fn,m -verdeling (naar Fisher) is een in de statistiek veel voorkomende verdeling (F -toetsen bij variantie-analyse e.d.) en is getabelleerd. Meestal gaan we uit van de nulhypothese, dat er niets veranderd is en proberen dan te bewijzen, dat de ongevallenintensiteit na het aanbrengen van de beveiliging kleiner is geworden. Dat betekent, dat de y-waarden over het algemeen groter zijn dan de x-waarden. Neem als toetsingsgrootheid q yx het quoti¨ent (12). Dan is q yx =
y¯ : Fn,m − verdeeld onder H0 : λy = λx . x ¯
(13)
De alternatieve hypothese luidt H1 : λy > λx . Nog steeds uitgaande van H0 , verwachten we grote waarden van qyx als toch H1 waar is. We zoeken dus bij een gegeven onbetrouwbaarheid een rechter kritieke waarde in de Fν1 ,ν2 -tabel bij ν1 = n en ν2 = m en verder
Edens 060214-1610
– 57 –
Kansrekening en statistiek (Inf.)
bij de gewenste onbetrouwbaarheid. (De tabel bevat alleen de onbetrouwbaarheden 5%, 1% en 0,5%.) Indien het gevonden quoti¨ent groter is dan de gevonden tabelwaarde, is qyx significant groot; het y-gemiddelde is dus wezenlijk groter dan het x-gemiddelde; de nieuwe ,,wachttijd” op een ongeval is dus in de regel groter dan de oude; de beveiliging heeft succes. Voorbeeld : We trekken met een zakrekenmachientje twintig x-waarden en twaalf ywaarden en wel met λx = 1/10 en λy = 1/15. We doen echter net of we dit niet weten. Kies onbetrouwbaarheid 5%. De resultaten zijn: x: 5,83 4,27 3,44 7,29 26,37 5,52 5,46 7,98 33,39 33,12 1,03 10,88 13,97 0,55 6,14 9,45 19,39 36,37 3,81 13,52 (14) y: 48,54 46,97 0,07 39,38 15,44 9,44 36,90 8,62 4,80 7,75 20,53 8,46 We vinden x ¯ = 12, 389 en y¯ = 20, 575. Het quoti¨ent is qyx = 1, 66. In de F -tabel vinden we bij ν1 = 20, ν2 = 12 en onbetrouwbaarheid 5% de tabelwaarde 2,34. Bij 5% onbetrouwbaarheid zijn we op grond van deze toets dus niet in staat aan te tonen, dat de y-waarnemingen significant groter zijn dan de x-waarnemingen. Dat gaat met een quoti¨ent van 1,66 pas lukken bij aanzienlijk grotere aantallen metingen; zeg 50 `a 60. De exponenti¨ele verdeling is erg wijd; er zijn vele waarnemingen die op ,,uitschieters” lijken (zowel naar boven als naar beneden) en als zodanig, meestal ten onrechte, worden weggelaten. We zullen ons cijfermateriaal nu onderwerpen aan de algemene, verdelingsvrije twee-steekproeventoets die nu volgt. (14.9) Mann-Whitneytoets (Wilcoxontoets). We gaan uit van twee steekproeven als eerder; nu behoeven de verdelingen echter niet bekend te zijn. De nulhypothese luidt: ,,beide steekproeven komen uit dezelfde verdeling”. De alternatieve hypothese is niet altijd eenvoudig te formuleren; de toets is het gevoeligst voor het ten opzichte van elkaar verschoven zijn van de twee verdelingen. Toch is de toets ook wel te gebruiken voor exponentieel-verdeelde waarnemingen. De toetsingsgrootheid is de stochast W yx , gedefinieerd door W yx = [aantal paren (xi , y j ) met xi < y j ] + 21 · [aantal paren (xi , y j ) met xi = y j ]. (15) We kunnen ook uitgaan van W xy = [aantal paren (xi , y j ) met xi > y j ] + 21 · [aantal paren (xi , y j ) met xi = y j ]. (16) Dan worden de steekproeven in feite verwisseld. Steeds is W xy + W xy = mn.
(17)
Later zullen we zien hoe W yx of W xy kan worden berekend. Voor de praktijk is vaak diegene eenvoudiger, die het kleinste bedrag oplevert, want dat geeft het minste rekenwerk. Voor een y-steekproef die onder de alternatieve hypothese wat rechts van de x-waarden ligt, is het eenvoudiger W xy te gebruiken (kleine waarde) en dan linkszijdig te toetsen.
– 58 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
Onder de nulhypothese kunnen alle waarnemingen worden opgevat als ´e´en grote continuverdeelde steekproef van omvang m + n. De stochast W xy hangt onder H0 alleen af van de plaats der y-waarden tussen de x-waarden of omgekeerd; indien we die samengestelde steekproef volgens grootte ordenen. De verdeling van W xy hangt alleen af van de steekproefgrootten m en n en is getabelleerd. Deze tabel geeft linker kritieke waarden Wl ; de rechter kritieke waarden Wr zijn hieruit te bepalen via Wl + Wr = mn. (18) De tabel heeft onbetrouwbaarheden 2,5% en 5% met waarden m en n ≤ 20 en is ingericht voor eenzijdig toetsen; voor een tweezijdige toets gelden de onbetrouwbaarheden 5% respectievelijk 10%. Let op: de tabel is zo ingericht, dat Wl tot de linker kritieke zˆ one behoort. Deze zˆone is dus het interval [0; Wl ]. De rechter kritieke zˆone is [Wr ; 2mn]. Als uit de waarnemingen blijkt, dat Wxy ≤ Wl , dan zijn de x-waarnemingen in de regel wat kleiner dan de y-waarnemingen; als Wxy ≥ Wr is, zijn de x-waarnemingen vaak wat groter dan de y-waarnemingen. In beide gevallen verwerpen we de nulhypothese, dat de steekproeven uit eenzelfde verdeling afkomstig zijn (behoudens de gekozen onbetrouwbaarheid). Voorbeeld : We gaan uit van bovenstaande metingen (14). We tellen voor elke x het aantal y’s, kleiner dan deze x `en het aantal y’s, gelijk aan de gegeven x. Het laatste aantal delen we door twee. We vinden zo Wxy = 81 (de waarde 5,83 heeft twee kleinere y’s, enz.) Met m = 20, n = 12 en ´e´enzijdig α = 0, 05 vinden we met de tabel Wl = 77. De gevonden waarde Wxy = 81 is iets groter. De grotere veiligheid is dus niet bewezen (onbetrouwbaarheid 5%). Als de y-steekproef omvang 13 had of meer, was een gelijkblijvend resultaat Wxy = 81 w`el significant geweest! Maar dan zou bijvoorbeeld ´e´en y-waarde toegevoegd moeten worden, kleiner dan alle reeds aanwezige x=waarden. (14.10) Andere berekenwijze van Wxy . Deze is gebaseerd op de rangnummers van alle waarnemingen, in ´e´en steekproef naar grootte geordend. Schrijf alle waarnemingen zo op. Let daarbij wel steeds op, of het x- of y-waarnemingen betreffen. Een groep gelijke schrijven we in willekeurige volgorde op; bijvoorbeeld eerst de x-en en dan de y’s. Schrijf vervolgens bij elke waarneming het rangnummer op (nu niet letten op x- of ywaarnemingen), dus 1, 2, . . . , m + n. Alle waarnemingen uit een groep gelijke krijgen hetzelfde nummer en wel het gemiddelde van de nummers die ze gekregen zouden hebben bij gewone, oplopende nummering. Bijvoorbeeld x 3
y 4
x 5
x 7 12
y 7 12
y 7 12
y 7 21
x 10
x 11 ;
de x en drie y’s boven de 7 12 zijn gelijk verondersteld. Tel alle rangnummers van de x-waarnemingen bij elkaar. Noem de som Rx . Voor de y’s geeft dit op analoge wijze Ry . Dan blijkt te gelden: Wxy = Rx − 12 m(m + 1);
Wyx = Ry − 12 n(n + 1).
(19)
– 59 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
De som is weer gelijk aan mn. In bovenstaand getallenvoorbeeld is de samengestelde, geordende rij: y x x x x x y x x x x x y x y y y x x x x y x y x x x x y y y y,
(20)
zodat Ry = 1 + 7 + 13 + 15 + 16 + 17 + 22 + 24 + 29 + 30 + 31 + 32 = 237, Wyx = 237 − 12 · 12 · (12 + 1) = 159 en Wxy = 20 · 12 − 159 = 81. (14.11) Normale benadering van de Mann-Whitneytoets. Voor grote waarden van m en n, zeg groter dan 20, kan gebruik worden gemaakt van normale benadering. Zonder bewijs vermelden we: W xy ≈ N
¡1
2 mn
;
1 12 mn(m
¢ + n + 1) .
(21)
Precies hetzelfde geldt voor W yx Bij toepassingen geeft een continu¨ıteitscorrectie, precies als bij de normale benadering van de binomiale verdeling (zie (11.5)) enige verscherping. Het resultaat is voor de ´e´enzijdige kritieke waarden: q Wl ≈ 12 mn −
1 2
− uα ·
1 12 mn(m
+ n + 1);
Wr = mn − Wl .
(22)
We ronden Wl af op gehele waarden naar beneden en Wr naar boven. Het getal uα is de rechter kritieke waarde uit de tabel van de standaardnormale verdeling (bv. u0,05 = 1, 645). We zullen geen voorbeeld geven met normale benadering. Voor de praktijk is de berekening van de toetsingsgrootheid al snel aan de computer voorbehouden. (14.12) Chi-kwadraattoets voor aanpassing aan een kansverdeling (Goodness of fit test). In (14.1) kwam een aanpassingstoets voor de Poissonverdeling aan de orde. Er is ook een algemene toets, waarmee elke hypothetische verdeling bij het verkregen cijfermateriaal kan worden getoetst. De opzet voor deze zogenoemde χ2 -toets is als volgt. We gaan uit van een verkregen steekproef x1 , . . . , xn . Verdeel de horizontale as in klassen I1 , . . . , Ik . Het getal k dient veel kleiner te zijn dan de steekproefomvang n. Onder de nulhypothese is de verdeling der waarnemingen bekend. Bereken met behulp van die verdeling voor elke klasse Ij de kans pj , dat een waarneming in die klasse valt. Dan is het verwachte aantal waarnemingen voor die klasse gelijk aan n · pj . Tel nu voor elke klasse Ij het aantal waarnemingen, zeg Oj uit de steekproef, die in die klasse zijn terecht gekomen. Als de hypothetische verdeling goed past, zal Oj in de buurt liggen van npj . De toetsingsgrootheid is 2
χ2 =
2
2
(O1 − np1 ) (O2 − np2 ) (Ok − npk ) + + ··· + . np1 np2 npk
(23)
Deze som is groot als de waargenomen en de verwachte aantallen per klasse veel van elkaar verschillen. Wij zijn daarom ge¨ınteresseerd in grote waarden van χ2 (de rechter kritieke
– 60 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
waarden); immers dan zal de nulhypothese worden verworpen. Na enig rekenwerk blijkt dat ook geldt: · 2 ¸ O1 O22 O2k 2 χ = + + ··· + − n. (24) np1 np2 npk Beide formules zijn te gebruiken; de laatste is soms wat gemakkelijker. Steeds is: p1 + p2 + · · · + pk = 1;
O1 + O2 + · · · + Ok = n.
(25)
Onder de nulhypothese blijkt de stochast χ2 bij benadering een χ2 -verdeling te hebben. Het aantal vrijheidsgraden wordt als volgt bepaald: Als de hypothetische verdeling geheel gespecificeerd is, is het aantal vrijheidsgraden gelijk aan k − 1. Als de hypothetische verdeling niet geheel gespecificeerd is, maar nog enkele onbekende parameters bevat, moeten deze parameters eerst worden geschat. Dit geschiedt dan op grond van dezelfde waarnemingen als waarmee nu wordt getoetst: de aanpassing aan de hypothetische kansverdeling wordt daardoor iets beter en de χ2 -waarde wordt iets kleiner, want de hypothetische kansverdeling wordt enigszins aan de waarnemingen aangepast. Hiervoor moet worden gecompenseerd en wel als volgt: Als de hypothetische verdeling nog r onbekende parameters bevat, is het aantal vrijheidsgraden gelijk aan k − r − 1. De r parameters moeten op grond van de gegeven waarnemingen zo goed mogelijk worden geschat. Dan pas kan worden overgegaan tot berekening van de pj -waarden. De keuze van de klassen is vrij willekeurig. Zorg wel zo mogelijk voor tenminste tien `a vijftien waarnemingen per klasse. Voor experimenten met veel mogelijke uitkomsten, zoals continue verdelingen of bijvoorbeeld Poissonverdelingen met grote parameters, worden de klassen vaak gevormd door aaneensluitende intervallen. De volgende vuistregel kan daarbij dienstig zijn: 1. Neem zo mogelijk minimaal vijf en maximaal twintig intervallen; kies de centraal gelegen k − 4 intervallen zo mogelijk even groot. Alleen bij zeer veel gegevens zal men zeker meer dan twintig intervallen kiezen. 2. Kies de grootte van de intervallen zodanig dat men in ieder interval zo mogelijk tenminste vijf uitkomsten verwacht, doch liefst meer dan tien `a vijftien. We geven twee voorbeelden. (14.13) Aanpassing aan een Poissonverdeling. We gaan uit van de gegevens uit (13.7) en toetsen de Poissonverdeling. De parameter is met behulp van het steekproefgemiddelde al geschat op 3,82. We kiezen de klassen: I1 = {0, 1}, I2 = {2}, I3 = {3}, I4 = {4}, I5 = {5}, I6 = {6, 7, 8, . . .}. Met de gegevens Klasse
0,1
2
3
4
5
6, 7, . . .
Aantal
12
11
11
19
17
15
(26)
– 61 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
berekenen we de tabel Klasse
Oi
pi
n · pi
χ2
0; 1 2 3 4 5 6, 7, . . .
12 11 11 19 17 15
0,10569 0,15999 0,20372 0,19455 0,14864 0,18741
8,98365 13,59915 17,31620 16,53675 12,63440 15,92985
1,013 0,497 2,304 0,367 1,508 0,054
Totaal
85
1,00000
85,00000
5,743
Toelichting: (12 − 8, 98365)2 (11 − 13, 59915)2 (15 − 15, 92985)2 + + ··· + 8, 98365 13, 59915 15, 92985 2 = 5, 74 < 11, 1 = χ5;0,05 ;
χ2 =
(27)
de kritieke waarde vinden we in de χ2 -tabel. De Poissonverdeling wordt dus niet verworpen. (14.14) Aanpassing aan een exponenti¨ele verdeling. We gaan uit van de steekproef 1, 528 2, 609 0, 731 1, 759 0, 117 2, 999 9, 052 12, 688 3, 245 9, 934
1, 074 1, 091 0, 748 3, 162 2, 405 1, 486 0, 724 1, 031 2, 843 5, 956
5, 585 1, 128 0, 256 2, 113 0, 780 2, 795 0, 530 1, 800 2, 304 0, 865
0, 182 10, 003 6, 948 0, 927 1, 179 2, 176 1, 551 1, 384 2, 202 9, 014 0, 558 2, 331 3, 158 0, 061 6, 572 0, 580 2, 115 1, 454 2, 485 4, 429
2, 873 6, 179 4, 636 1, 542 6, 533 3, 724 7, 633 1, 566 0, 618 8, 036
2, 494 4, 030 0, 338 5, 190 2, 466 6, 222 0, 148 1, 469 2, 017 2, 248
1, 090 5, 137 4, 699 3, 061 2, 642 3, 495 0, 096 0, 567 2, 700 3, 055
1, 496 2, 004 6, 031 0, 950 2, 886 2, 178 2, 097 1, 571 0, 102 1, 966
1, 348 6, 744 8, 182 0, 019 2, 774 7, 199 1, 393 2, 022 0, 105 3, 785
Zijn deze waarnemingen exp(λ)-verdeeld voor zekere λ? De omvang is 100; het steekproefgemiddelde bedraagt 2,94033. Dit is tevens een schatting voor de verwachting van ´e´en waarneming; dus van 1/λ. We schatten λ met 1/¯ x = 0, 34. Neem als klassen de intervallen (0, 1), (1, 2), (2, 3), (3, 6), (6, ∞).
(28)
De verwachte aantallen berekenen we met behulp van de vermeende verdelingsfunctie; dit is een exp(0, 34)-verdeling. Zo is bijvoorbeeld de kans dat een waarneming in de klasse (3, 6) valt, in dit geval e −0,34·3 − e −0,34·6 = 0, 2306 (29)
– 62 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
en het verwachte aantal in dit interval is 100 · 0, 2306 = 23, 06. Zo ook voor de andere klassen. We vinden Klasse
Oi
n · pi
χ2
(0, 1) (1, 2) (2, 3) (3, 6) (6, ∞)
22 21 25 16 16
28,830 20,518 14,603 23,054 12,995
1,62 0,01 7,40 2,16 0,70
Totaal
100
100,000
11,89
In de rechterkolom staat de bijdrage van elke klasse aan de χ2 -som. We zien, dat erg veel waarnemingen in het interval (2, 3) zijn gevallen. De totale χ2 -som is 11,89; groter dan de tabelwaarde χ23;0,05 = 7, 81. Bij onbetrouwbaarheid 5% wordt het exponentieel-zijn van de waarnemingen dus verworpen. N.B. Een zeer kleine χ2 -waarde duidt in het geheel niet op een juist goede aanpassing! Veeleer op ongeoorloofde afrondingen. Men zij op dit soort verschijnselen bedacht. Voorbeeld: een standaardnormaal-verdeelde waarneming u op de re¨ele as ligt ,,gemiddeld √ in 0”, terwijl de ,,gemiddelde afstand tot 0” gelijk is aan 2/ π .
– 63 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
15. Betrouwbaarheidsintervallen. (15.1) Betekenis van het betrouwbaarheidsinterval . Een betrouwbaarheidsinterval is een stochastisch interval ; het hangt van de waarnemingen af. Veronderstel dat een of andere parameter geschat is, bijvoorbeeld een verwacht aantal ongevallen per week. Zo’n schatting is bepaald op grond van een steekproef; vaak het gemiddelde, soms de steekproefmediaan, of een spreidingsschatting. Een dergelijke schatter heeft zelf ook een spreiding. Meestal is die klein (hopen we). Zo is de spreiding van het gemiddelde van een serie onafhankelijke herhalingen gelijk aan de spreiding van ´e´en waarneming, gedeeld door de wortel uit het aantal experimenten (zie (13.3)). Meestal wordt een schatting niet zonder meer opgegeven, maar wordt de standaardafwijking mede vermeld. Dit kan op verschillende manieren. E´en belangrijke methode is die van de ,,grote steekproeven”: Door de schatting te verminderen en te vermeerderen met een zeker aantal keren haar eigen standaardafwijking, ontstaan een benedengrens en een bovengrens. We streven er nu naar, dat het zo ontstane stochastische interval met grote waarschijnlijkheid de werkelijke, onbekende parameter bevat. Duidelijk is, dat hoe breder het interval, hoe groter de kans is dat de echte parameter er in zit, maar tevens hoe onbruikbaarder het interval wordt. (De re¨ele getallen zelf vormen een totaal onbruikbaar interval dat de parameter zeker bevat.) Dank zij de veelgeroemde normale benadering zijn voor niet te kleine steekproeven redelijke grenzen van het te vormen betrouwbaarheidsinterval aan te geven. Het aantal standaardafwijkingen naar beneden en naar boven wordt aan de tabel de standaardnormale verdeling ontleend (rechter kritieke waarden). Voor enige voor ons interessante gevallen geven we de resultaten; ze zien er soms wat ingewikkeld uit. Steeds wordt een onbetrouwbaarheid α gekozen, bijvoorbeeld 0, 05. Bij die onbetrouwbaarheid wordt dan het betrouwbaarheidsinterval bepaald. In dit kader spreken we liever van de betrouwbaarheid 1 − α, vaak 95%. We krijgen dan een zogenoemd 95%-betrouwbaarheidsinterval . (15.2) Betrouwbaarheidsinterval voor λ uit ´e´en Poisson(λ)-verdeelde waarneming met grote λ. Noem de waarneming x. Dan is x ≈ N(λ; λ). Dan is: ³ P
√ √ ´ λ − uα/2 λ < x < λ + uα/2 λ = 1 − α.
(2)
Enig omwerken met gebruikmaking van u0,025 ≈ 2 en x groot levert het 95%-betrouwbaarheidsinterval √ √ P ( x − 2 x < λ < x + 2 x ) ≈ 0, 95. (3)
(15.3) Betrouwbaarheidsinterval voor λ uit n onafhankelijke Poisson(λ)-verdeelde tellingen (n groot). De som S der waarnemingen is Poisson(nλ; nλ)-verdeeld. Toepassing van het voorgaande op de som S levert na deling door n het betrouwbaarheidsinterval voor λ op: ¶ µ p p 1 1 (S − uα/2 S) < λ < (S + uα/2 S) = 1 − α; (4) P n n
– 64 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
hier is S de som der waarnemingen. Voor een 95%-betrouwbaarheidsinterval nemen we weer uα/2 = 2. We krijgen dan p 1 (S ± 2 S) n
(95%; een vuistregel).
(5)
Voorbeeld : Neem de 85 tellingen uit (13.7). √ De vuistregel geeft voor het 95%-betrouw1 baarheidsinterval de grenzen 85 (325 ± 2 325) = 3, 82 ± 0, 42 (95%). (15.4) Betrouwbaarheidsinterval voor λ uit n onafhankelijke exp(λ)-verdeelde waarnemingen. Noem de som der waarnemingen S. We merkten in (14.5) op, dat 2λS een χ2 -verdeling heeft met 2n vrijheidsgraden. Door een ,,centraal gebied” in de χ2 -dichtheid af te bakenen met zowel links als rechts oppervlakte α en de χ2 -stochast te vervangen door 2λS, ontstaat het (1 − α)-betrouwbaarheidsinterval; voor 1/λ is dit à P
2S χ22n;α/2
1 2S < < 2 λ χ2n;1−α/2
! = 1 − α.
(6)
Hierin zijn χ22n;1−α/2 en χ22n;1−α/2 rechter kritieke waarden van de χ22n -verdeling; zie de tabel. Enige voorbeelden zijn χ220;0,975 = 9, 59 en χ220;0,025 = 34, 1. Het betrouwbaarheidsinterval voor λ verkrijgt men door van de grenzen de reciproke waarden te berekenen. Voorbeeld : Neem de tien levensduurmetingen uit (14.5). De som bedraagt 125,88. De χ2 -kritieke waarden zijn hierboven al aangegeven. Het 95%-betrouwbaarheidsinterval voor de verwachte levensduur 1/λ heeft ondergrens 2 · 125, 88/34, 1 = 7, 38 en bovengrens 2 · 125, 88/9, 59 = 26, 25. Dit interval is nogal wijd. De exponenti¨ele verdeling is tamelijk gespreid; ook twintig metingen is niet erg veel. In de χ2 -tabel zien we de verhouding der kritieke waarden bij toenemend aantal vrijheidsgraden slechts langzaam tot 1 naderen. Het 95%-betrouwbaarheidsinterval voor λ (,,het verwachte aantal vervangingen per tijdseenheid”) heeft ondergrens 1/26, 25 = 0, 038 en bovengrens 1/7, 38 = 0, 135. N.B. Voor grote ν (buiten de tabel) geldt à χ2ν;α ≈ ν
2 1− + uα 9ν
r
2 9ν
!3 ;
(7)
met uα de rechter kritieke waarde van de standaardnormale verdeling. Voor grote α, bijvoorbeeld 0,95, is laatstgenoemde kritieke waarde gelijk aan −u0,05 = −1, 645. Deze benaderingsformule is erg goed.
– 65 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
16. Enige termen uit bedrijfszekerheidstheorie (reliability engineering). Gewone begrippen uit de kansrekening, zoals deze in de vorige bladzijden aan de orde kwamen, hebben in sommige toegepaste wetenschappen andere, ingeburgerde namen. In de bedrijfszekerheidstheorie komen tevens zogenoemde mengverdelingen aan de orde: deze hebben continue stukken, afgewisseld door een of meer sprongen. Hier volgen kort enige formules met de bijbehorende termen. We gaan er niet dieper op in. Voor een willekeurige verdelingsfunctie F (x) (dit kan dus een mengvorm zijn van discreet en continu) geldt voor de verwachting Z
Z
0
µ=−
∞
F (x) dx + −∞
[1 − F (x)] dx;
(1)
x[1 − F (x)] dx − µ2 ;
(2)
0
mits niet ,,−∞ + ∞” ontstaat. De variantie is Z 2
Z
0
σ = −2
∞
xF (x) dx + 2 −∞
0
mits ook hier niet ,,−∞ + ∞” ontstaat. In de praktijk is dit meestal wel in orde. Laat in een systeem (bv. productieproces) de stochast t een levensduur voorstellen met verdelingsfunctie P ( t ≤ t ) = F (t). De functie F heet ook wel de levensduurverdeling of faaldistributie. De functiewaarde F (t) is een ,,sneuvelkans” en heet bedrijfsonzekerheid def
(unreliability). De tegenkans R(t) = P ( t > t ) = 1 − F (t) is een ,,overlevingskans” en heet bedrijfszekerheid (reliability). Laat tenslotte F differentieerbaar zijn voor t > 0; de afgeleide noemen we z(t). Deze afgeleide is de zogenoemde conditionele faaldichtheid (hazard rate). De integraal hiervan is R(0) = 1 − F (0) ≤ 1; in sommige gevallen inderdaad echt kleiner dan 1. De faaldichtheid is dan geen eigenlijke kansdichtheid. Als wel F (0) = 0 geldt, dan is gegeven dat het systeem op tijdstip 0 functioneert. In dat geval is z(t) w`el een kansdichtheid. In het algemeen heet de waarde R(0) de opbrengst (yield ) van het systeem. Als R(0) < 1 is F een mengverdeling! Tot zover de naamgevingen. We hebben voor positieve t en kleine positieve h: P ( falen in tijdsinterval (t, t + h) | intact op tijdstip t ) f (t) · h ! P (t < t < t + h) = P (t < t < t + h|t > t)= ≈ . P (t > t) 1 − F (t) Hieruit volgt f (t) z(t) = ; R(t)
½ Z t ¾ R(t) = R(0) exp − z(t) dt .
(3)
(4)
0
De verwachte levensduur is met gebruikmaking van (1): Z
∞
E (t) =
R(t) dt, 0
(5)
Edens 060214-1610
– 66 –
en de variantie via (2):
Kansrekening en statistiek (Inf.)
Z var t = 2
∞
tR(t) dt − µ2 .
(6)
0
In veel modellen wordt z(t) = λ constant verondersteld. Dan is F (t) = 1 − R(0)e −λt
(t ≥ 0).
(7)
Indien R(0) = 1, is in dit geval de levensduur t exponentieel verdeeld met parameter λ.
– 67 –
Edens 060214-1610
Kansrekening en statistiek (Inf.)
17. Vraagstukken over statistiek. 1. Laat in een bedrijf gemiddeld twee ongevallen per week plaats vinden. De ongevallen treden op volgens een Poissonproces. Ik kom op zeker tijdstip (,,nu”) aan en verneem dat het laatste ongeval drie dagen geleden plaats vond. Wat is de kans dat het eerstvolgende ongeval tenminste een week na ,,nu” plaats heeft? 2. De kortste en de langste wachttijd . De wachttijden x1 , . . . , xn zijn onafhankelijk en elk exponentieel verdeeld met parameter λ > 0. Zij y 1 = min{x1 , . . . , xn };
y n = max{x1 , . . . , xn }
a) Bewijs dat y 1 een exponenti¨ele verdeling heeft met parameter nλ. (Aanwijzing: y 1 > a ⇐⇒ x1 > a, . . . , xn > a. Pas nu onafhankelijkheid toe; zie (10.5).) b) Bereken de mediaan van y n . 3. Laat een bepaald bedrijfsongeval gemiddeld tien keer per jaar voorkomen. a) Bereken het tweezijdige 10%-aanvaardingsgebied. b) Iemand beweert dat de situatie veel ongunstiger is dan voorgesteld en dat het vermeende jaarlijkse gemiddelde van tien door foutieve telling is verkregen. Het daarop volgende jaar moet ,,uitsluitsel” geven: als het aantal ongevallen in dat jaar te hoog blijkt, krijgt de opponent gelijk. Als onbetrouwbaarheidsdrempel wordt 5% afgesproken; het genoemde aantal ongevallen blijkt 15 te bedragen. Wat is Uw conclusie? 4. Iemand beweert dat de gemiddelde wachttijd tussen twee opeenvolgende ongevallen ten hoogste ´e´en week bedraagt. Van dergelijke wachttijden zijn tien onafhankelijke metingen gedaan. Probeer in elk der onderstaande gevallen deze bewering te ontzenuwen; neem daarbij steeds onbetrouwbaarheidsdrempel 5%. a) De tien wachttijden hebben een gemiddelde van 12,0 dagen. b) Slechts drie van de tien wachttijden vielen korter uit dan 4,852 dagen. c) Slechts drie van de tien wachttijden vielen korter uit dan een week. 5. Bereken een 5%-betrouwbaarheidsinterval voor λ uit de volgende Poisson(λ)-verdeelde tellingen: 6 8 4 5 10
5 1 8 4 6
3 6 9 4 2
6 3 9 4 4
6 5 2 9 6
5 3 8 1 6
8 2 2 9 3
4 6 2 2 6
3 4 3 7 5
6 4 6 5 4
4 3 1 5 3
4 2 5 2 5
3 4 5 5 7
3 5 4 5 3
5 7 5 1 3
6 5 2 6 2
2 6 5 3 1
7 5 4 9 7
3 8 2 5 7
4 3 4 5 4
6. Toets of de waarnemingen uit het vorige vraagstuk inderdaad Poisson-verdeeld zijn. Neem onbetrouwbaarheid 5%. Voer de toets uit: a) Met de dispersietoets; b) Met de Chi-kwadraattoets. 7. Bereken een 95%-betrouwbaarheidsinterval voor 1/λ met de gegevens uit (14.12).
Edens 060214-1610
– 68 –
Kansrekening en statistiek (Inf.)
8. De volgende twee steekproeven zijn elk uit een exponenti¨ele verdeling. x : 5, 88 2, 21 3, 46 3, 00 11, 66 1, 14 0, 60 2, 42 5, 73 2, 49 1, 35 7, 01 4, 93 5, 18 5, 53 4, 37 0, 62 y : 10, 48 0, 30 0, 81 0, 90 3, 61 8, 38 11, 51 4, 42 2, 11 0, 57 4, 36 5, 04 Het vermoeden bestaat, dat de λ-parameter van de tweede steekproef kleiner is dan die van de eerste (de waarnemingen dus vaak wat groter). Is dit vermoeden juist? Toets dit op twee manieren: a) Met het quoti¨ent van de steekproefgemiddelden; b) Met de Mann-Whitneytoets. (In werkelijkheid zijn de x-waarnemingen exp(1/3) en de y-waarnemingen exp(1/6)verdeeld.)
Edens 060214-1610
– 69 –
Tabellen
Tabellen
Edens 060214-1610
– 70 –
Tabellen
– 71 –
Edens 060214-1610
Normale verdeling
Rechteroverschrijdingskansen van de standaardnormale verdeling
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0
0
1
2
3
4
5
6
7
8
9
(0)5000 (0)4602 (0)4207 (0)3821 (0)3446 (0)3085 (0)2743 (0)2420 (0)2119 (0)1841 (0)1587 (0)1357 (0)1151 (1)9680 (1)8076 (1)6681 (1)5480 (1)4457 (1)3593 (1)2872 (1)2275 (1)1786 (1)1390 (1)1072 (2)8198 (2)6210 (2)4661 (2)3467 (2)2555 (2)1866 (2)1350 (3)9676 (3)6871 (3)4834 (3)3369 (3)2326 (3)1591 (3)1078 (4)7235 (4)4810 (4)3167 (4)2066 (4)1335 (5)8540 (5)5413 (5)3398 (5)2112 (5)1301 (6)7933 (6)4792 (6)2867
(0)4960 (0)4562 (0)4168 (0)3783 (0)3409 (0)3050 (0)2709 (0)2389 (0)2090 (0)1814 (0)1562 (0)1335 (0)1131 (1)9510 (1)7927 (1)6552 (1)5370 (1)4363 (1)3515 (1)2807 (1)2222 (1)1743 (1)1355 (1)1044 (2)7976 (2)6037 (2)4527 (2)3364 (2)2477 (2)1807 (2)1306 (3)9354 (3)6637 (3)4665 (3)3248 (3)2241 (3)1531 (3)1036 (4)6948 (4)4615 (4)3036 (4)1978 (4)1277 (5)8163 (5)5169 (5)3241 (5)2013 (5)1239 (6)7547 (6)4554 (6)2722
(0)4920 (0)4522 (0)4129 (0)3745 (0)3372 (0)3015 (0)2676 (0)2358 (0)2061 (0)1788 (0)1539 (0)1314 (0)1112 (1)9342 (1)7780 (1)6426 (1)5262 (1)4272 (1)3438 (1)2743 (1)2169 (1)1700 (1)1321 (1)1017 (2)7760 (2)5868 (2)4396 (2)3264 (2)2401 (2)1750 (2)1264 (3)9043 (3)6410 (3)4501 (3)3131 (3)2158 (3)1473 (4)9961 (4)6673 (4)4427 (4)2910 (4)1894 (4)1222 (5)7801 (5)4935 (5)3092 (5)1919 (5)1179 (6)7178 (6)4327 (6)2584
(0)4880 (0)4483 (0)4090 (0)3707 (0)3336 (0)2981 (0)2643 (0)2327 (0)2033 (0)1762 (0)1515 (0)1292 (0)1093 (1)9176 (1)7636 (1)6301 (1)5155 (1)4182 (1)3362 (1)2680 (1)2118 (1)1659 (1)1287 (2)9903 (2)7549 (2)5703 (2)4269 (2)3167 (2)2327 (2)1695 (2)1223 (3)8740 (3)6190 (3)4342 (3)3018 (3)2078 (3)1417 (4)9574 (4)6407 (4)4247 (4)2789 (4)1814 (4)1168 (5)7455 (5)4712 (5)2949 (5)1828 (5)1123 (6)6827 (6)4111 (6)2452
(0)4840 (0)4443 (0)4052 (0)3669 (0)3300 (0)2946 (0)2611 (0)2296 (0)2005 (0)1736 (0)1492 (0)1271 (0)1075 (1)9012 (1)7493 (1)6178 (1)5050 (1)4093 (1)3288 (1)2619 (1)2068 (1)1618 (1)1255 (2)9642 (2)7344 (2)5543 (2)4145 (2)3072 (2)2256 (2)1641 (2)1183 (3)8447 (3)5976 (3)4189 (3)2909 (3)2001 (3)1363 (4)9201 (4)6152 (4)4074 (4)2673 (4)1737 (4)1118 (5)7124 (5)4498 (5)2813 (5)1742 (5)1069 (6)6492 (6)3906 (6)2328
(0)4801 (0)4404 (0)4013 (0)3632 (0)3264 (0)2912 (0)2578 (0)2266 (0)1977 (0)1711 (0)1469 (0)1251 (0)1056 (1)8851 (1)7353 (1)6057 (1)4947 (1)4006 (1)3216 (1)2559 (1)2018 (1)1578 (1)1222 (2)9387 (2)7143 (2)5386 (2)4025 (2)2980 (2)2186 (2)1589 (2)1144 (3)8164 (3)5770 (3)4041 (3)2803 (3)1926 (3)1311 (4)8842 (4)5906 (4)3908 (4)2561 (4)1662 (4)1069 (5)6807 (5)4294 (5)2682 (5)1660 (5)1017 (6)6173 (6)3711 (6)2209
(0)4761 (0)4364 (0)3974 (0)3594 (0)3228 (0)2877 (0)2546 (0)2236 (0)1949 (0)1685 (0)1446 (0)1230 (0)1038 (1)8691 (1)7215 (1)5938 (1)4846 (1)3920 (1)3144 (1)2500 (1)1970 (1)1539 (1)1191 (2)9137 (2)6947 (2)5234 (2)3907 (2)2890 (2)2118 (2)1538 (2)1107 (3)7888 (3)5571 (3)3897 (3)2701 (3)1854 (3)1261 (4)8496 (4)5669 (4)3747 (4)2454 (4)1591 (4)1022 (5)6503 (5)4098 (5)2558 (5)1581 (6)9680 (6)5869 (6)3525 (6)2096
(0)4721 (0)4325 (0)3936 (0)3557 (0)3192 (0)2843 (0)2514 (0)2206 (0)1922 (0)1660 (0)1423 (0)1210 (0)1020 (1)8534 (1)7078 (1)5821 (1)4746 (1)3836 (1)3074 (1)2442 (1)1923 (1)1500 (1)1160 (2)8894 (2)6756 (2)5085 (2)3793 (2)2803 (2)2052 (2)1489 (2)1070 (3)7622 (3)5377 (3)3758 (3)2602 (3)1785 (3)1213 (4)8162 (4)5442 (4)3594 (4)2351 (4)1523 (5)9774 (5)6212 (5)3911 (5)2439 (5)1506 (6)9211 (6)5580 (6)3348 (6)1989
(0)4681 (0)4286 (0)3897 (0)3520 (0)3156 (0)2810 (0)2483 (0)2177 (0)1894 (0)1635 (0)1401 (0)1190 (0)1003 (1)8379 (1)6944 (1)5705 (1)4648 (1)3754 (1)3005 (1)2385 (1)1876 (1)1463 (1)1130 (2)8656 (2)6569 (2)4940 (2)3681 (2)2718 (2)1988 (2)1441 (2)1035 (3)7364 (3)5190 (3)3624 (3)2507 (3)1718 (3)1166 (4)7841 (4)5223 (4)3446 (4)2252 (4)1458 (5)9345 (5)5934 (5)3732 (5)2325 (5)1434 (6)8765 (6)5304 (6)3179 (6)1887
(0)4641 (0)4247 (0)3859 (0)3483 (0)3121 (0)2776 (0)2451 (0)2148 (0)1867 (0)1611 (0)1379 (0)1170 (1)9853 (1)8226 (1)6811 (1)5592 (1)4551 (1)3673 (1)2938 (1)2330 (1)1831 (1)1426 (1)1101 (2)8424 (2)6387 (2)4799 (2)3573 (2)2635 (2)1926 (2)1395 (2)1001 (3)7114 (3)5009 (3)3495 (3)2415 (3)1653 (3)1121 (4)7532 (4)5012 (4)3304 (4)2157 (4)1395 (5)8934 (5)5668 (5)3561 (5)2216 (5)1366 (6)8339 (6)5042 (6)3019 (6)1790
Voorbeeld : (5)2439 betekent 0,000002439 (nul komma vijf nullen 2439).
– 72 –
Edens 060214-1610
Normale verdeling - RKW
Rechter kritieke waarden van de standaardnormale verdeling
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49
0
1
2
3
4
5
6
7
8
9
∞
3,090 2,290 2,034 1,866 1,739 1,635 1,546 1,468 1,398 1,335 1,276 1,221 1,170 1,122 1,076 1,032 0,990 0,950 0,912 0,874 0,838 0,803 0,769 0,736 0,703 0,671 0,640 0,610 0,580 0,550 0,522 0,493 0,465 0,437 0,410 0,383 0,356 0,329 0,303 0,277 0,251 0,225 0,199 0,174 0,148 0,123 0,098 0,073 0,048 0,023
2,878 2,257 2,014 1,852 1,728 1,626 1,538 1,461 1,392 1,329 1,270 1,216 1,165 1,117 1,071 1,028 0,986 0,946 0,908 0,871 0,835 0,799 0,765 0,732 0,700 0,668 0,637 0,607 0,577 0,548 0,519 0,490 0,462 0,434 0,407 0,380 0,353 0,327 0,300 0,274 0,248 0,222 0,197 0,171 0,146 0,121 0,095 0,070 0,045 0,020
2,748 2,226 1,995 1,838 1,717 1,616 1,530 1,454 1,385 1,323 1,265 1,211 1,160 1,112 1,067 1,024 0,982 0,942 0,904 0,867 0,831 0,796 0,762 0,729 0,697 0,665 0,634 0,604 0,574 0,545 0,516 0,487 0,459 0,432 0,404 0,377 0,350 0,324 0,298 0,272 0,246 0,220 0,194 0,169 0,143 0,118 0,093 0,068 0,043 0,018
2,652 2,197 1,977 1,825 1,706 1,607 1,522 1,447 1,379 1,317 1,259 1,206 1,155 1,108 1,063 1,019 0,978 0,938 0,900 0,863 0,827 0,793 0,759 0,726 0,693 0,662 0,631 0,601 0,571 0,542 0,513 0,485 0,457 0,429 0,402 0,375 0,348 0,321 0,295 0,269 0,243 0,217 0,192 0,166 0,141 0,116 0,090 0,065 0,040 0,015
2,576 2,170 1,960 1,812 1,695 1,598 1,514 1,440 1,372 1,311 1,254 1,200 1,150 1,103 1,058 1,015 0,974 0,935 0,896 0,860 0,824 0,789 0,755 0,722 0,690 0,659 0,628 0,598 0,568 0,539 0,510 0,482 0,454 0,426 0,399 0,372 0,345 0,319 0,292 0,266 0,240 0,215 0,189 0,164 0,138 0,113 0,088 0,063 0,038 0,013
2,512 2,144 1,943 1,799 1,685 1,589 1,506 1,433 1,366 1,305 1,248 1,195 1,146 1,098 1,054 1,011 0,970 0,931 0,893 0,856 0,820 0,786 0,752 0,719 0,687 0,656 0,625 0,595 0,565 0,536 0,507 0,479 0,451 0,423 0,396 0,369 0,342 0,316 0,290 0,264 0,238 0,212 0,187 0,161 0,136 0,111 0,085 0,060 0,035 0,010
2,457 2,120 1,927 1,787 1,675 1,580 1,499 1,426 1,359 1,299 1,243 1,190 1,141 1,094 1,049 1,007 0,966 0,927 0,889 0,852 0,817 0,782 0,749 0,716 0,684 0,653 0,622 0,592 0,562 0,533 0,504 0,476 0,448 0,421 0,393 0,366 0,340 0,313 0,287 0,261 0,235 0,210 0,184 0,159 0,133 0,108 0,083 0,058 0,033 0,008
2,409 2,097 1,911 1,774 1,665 1,572 1,491 1,419 1,353 1,293 1,237 1,185 1,136 1,089 1,045 1,003 0,962 0,923 0,885 0,849 0,813 0,779 0,745 0,713 0,681 0,650 0,619 0,589 0,559 0,530 0,502 0,473 0,445 0,418 0,391 0,364 0,337 0,311 0,285 0,259 0,233 0,207 0,181 0,156 0,131 0,105 0,080 0,055 0,030 0,005
2,366 2,075 1,896 1,762 1,655 1,563 1,483 1,412 1,347 1,287 1,232 1,180 1,131 1,085 1,041 0,999 0,958 0,919 0,882 0,845 0,810 0,776 0,742 0,710 0,678 0,646 0,616 0,586 0,556 0,527 0,499 0,471 0,443 0,415 0,388 0,361 0,335 0,308 0,282 0,256 0,230 0,204 0,179 0,154 0,128 0,103 0,078 0,053 0,028 0,003
2,326 2,054 1,881 1,751 1,645 1,555 1,476 1,405 1,341 1,282 1,227 1,175 1,126 1,080 1,036 0,994 0,954 0,915 0,878 0,842 0,806 0,772 0,739 0,706 0,674 0,643 0,613 0,583 0,553 0,524 0,496 0,468 0,440 0,412 0,385 0,358 0,332 0,305 0,279 0,253 0,228 0,202 0,176 0,151 0,126 0,100 0,075 0,050 0,025
–
Edens 060214-1610
73 –
Studentverdeling
Rechter kritieke waarden van de Studentverdeling 0,25
0,1
0,05
0,025
0,01
0,005
0,0025
0,001
0,0005
0,00025
0,0001
1 2 3 4
1,000 0,817 0,765 0,741
3,078 1,886 1,638 1,533
6,314 2,920 2,353 2,132
12,706 4,303 3,182 2,776
31,821 6,965 4,541 3,747
63,657 9,925 5,841 4,604
127,321 14,089 7,453 5,598
318,309 22,327 10,215 7,173
636,619 31,599 12,924 8,610
1273,239 44,705 16,326 10,306
3183,099 70,700 22,204 13,034
5 6 7 8 9
0,727 0,718 0,711 0,706 0,703
1,476 1,440 1,415 1,397 1,383
2,015 1,943 1,895 1,860 1,833
2,571 2,447 2,365 2,306 2,262
3,365 3,143 2,998 2,896 2,821
4,032 3,707 3,499 3,355 3,250
4,773 4,317 4,029 3,833 3,690
5,893 5,208 4,785 4,501 4,297
6,869 5,959 5,408 5,041 4,781
7,976 6,788 6,082 5,617 5,291
9,678 8,025 7,063 6,442 6,010
10 11 12 13 14
0,700 0,697 0,695 0,694 0,692
1,372 1,363 1,356 1,350 1,345
1,812 1,796 1,782 1,771 1,761
2,228 2,201 2,179 2,160 2,145
2,764 2,718 2,681 2,650 2,625
3,169 3,106 3,055 3,012 2,977
3,581 3,497 3,428 3,372 3,326
4,144 4,025 3,930 3,852 3,787
4,587 4,437 4,318 4,221 4,140
5,049 4,863 4,716 4,597 4,499
5,694 5,453 5,263 5,111 4,985
15 16 17 18 19
0,691 0,690 0,689 0,688 0,688
1,341 1,337 1,333 1,330 1,328
1,753 1,746 1,740 1,734 1,729
2,131 2,120 2,110 2,101 2,093
2,602 2,583 2,567 2,552 2,539
2,947 2,921 2,898 2,878 2,861
3,286 3,252 3,222 3,197 3,174
3,733 3,686 3,646 3,610 3,579
4,073 4,015 3,965 3,922 3,883
4,417 4,346 4,286 4,233 4,187
4,880 4,791 4,714 4,648 4,590
20 21 22 23 24
0,687 0,686 0,686 0,685 0,685
1,325 1,323 1,321 1,319 1,318
1,725 1,721 1,717 1,714 1,711
2,086 2,080 2,074 2,069 2,064
2,528 2,518 2,508 2,500 2,492
2,845 2,831 2,819 2,807 2,797
3,153 3,135 3,119 3,104 3,091
3,552 3,527 3,505 3,485 3,467
3,850 3,819 3,792 3,768 3,745
4,146 4,110 4,077 4,047 4,021
4,539 4,493 4,452 4,415 4,382
25 26 27 28 29
0,684 0,684 0,684 0,683 0,683
1,316 1,315 1,314 1,313 1,311
1,708 1,706 1,703 1,701 1,699
2,060 2,056 2,052 2,048 2,045
2,485 2,479 2,473 2,467 2,462
2,787 2,779 2,771 2,763 2,756
3,078 3,067 3,057 3,047 3,038
3,450 3,435 3,421 3,408 3,396
3,725 3,707 3,690 3,674 3,659
3,996 3,974 3,954 3,935 3,918
4,352 4,324 4,299 4,275 4,254
30 35 40 45 50
0,683 0,682 0,681 0,680 0,679
1,310 1,306 1,303 1,301 1,299
1,697 1,690 1,684 1,679 1,676
2,042 2,030 2,021 2,014 2,009
2,457 2,438 2,423 2,412 2,403
2,750 2,724 2,704 2,690 2,678
3,030 2,996 2,971 2,952 2,937
3,385 3,340 3,307 3,281 3,261
3,646 3,591 3,551 3,520 3,496
3,902 3,836 3,788 3,752 3,723
4,234 4,153 4,094 4,049 4,014
55 60 70 80 90
0,679 0,679 0,678 0,678 0,677
1,297 1,296 1,294 1,292 1,291
1,673 1,671 1,667 1,664 1,662
2,004 2,000 1,994 1,990 1,987
2,396 2,390 2,381 2,374 2,369
2,668 2,660 2,648 2,639 2,632
2,925 2,915 2,899 2,887 2,878
3,245 3,232 3,211 3,195 3,183
3,476 3,460 3,435 3,416 3,402
3,700 3,681 3,651 3,629 3,612
3,986 3,962 3,926 3,899 3,878
100 200 300 400 500
0,677 0,676 0,675 0,675 0,675
1,290 1,286 1,284 1,284 1,283
1,660 1,653 1,650 1,649 1,648
1,984 1,972 1,968 1,966 1,965
2,364 2,345 2,339 2,336 2,334
2,626 2,601 2,592 2,588 2,586
2,871 2,839 2,828 2,823 2,820
3,174 3,131 3,118 3,111 3,107
3,390 3,340 3,323 3,315 3,310
3,598 3,539 3,519 3,510 3,504
3,862 3,789 3,765 3,754 3,747
600 700 800 900 1000
0,675 0,675 0,675 0,675 0,675
1,283 1,283 1,283 1,282 1,282
1,647 1,647 1,647 1,647 1,646
1,964 1,963 1,963 1,963 1,962
2,333 2,332 2,331 2,331 2,330
2,584 2,583 2,582 2,581 2,581
2,817 2,816 2,815 2,814 2,813
3,104 3,102 3,100 3,099 3,098
3,307 3,304 3,303 3,301 3,300
3,500 3,497 3,495 3,493 3,492
3,742 3,739 3,736 3,734 3,733
∞ 0,674 1,282
1,645
1,960
2,326
2,576
2,807
3,090
3,291
3,481
3,719
–
Edens 060214-1610
χ2 -verdeling
74 –
Rechter kritieke waarden van de χ2 -verdeling
α
0,9999
0,9995
0,999
0,995
0,99
0,975
0,95
0,(3)157 0,0201 0,115 0,297 0,554
0,(3)982 0,0506 0,216 0,484 0,831
0,(2)393 0,103 0,352 0,711 1,15
0,9
0,8
0,7
0,6
0,5
ν 1 0,(7)157 0,(6)393 0,(5)157 0,(4)393 2 0,(3)200 0,(2)100 0,(2)200 0,0100 3 0,(2)521 0,0153 0,0243 0,0717 4 0,0284 0,0639 0,0908 0,207 5 0,0822 0,158 0,210 0,412
0,0158 0,0642 0,148 0,275 0,211 0,446 0,713 1,02 0,584 1,01 1,42 1,87 1,06 1,65 2,19 2,75 1,61 2,34 3,00 3,66
0,455 1,39 2,37 3,36 4,35
1 2 3 4 5
6 7 8 9 10
0,172 0,300 0,464 0,661 0,889
0,299 0,485 0,710 0,972 1,26
0,381 0,598 0,857 1,15 1,48
0,676 0,989 1,34 1,73 2,16
0,872 1,24 1,65 2,09 2,56
1,24 1,69 2,18 2,70 3,25
1,64 2,17 2,73 3,33 3,94
2,20 2,83 3,49 4,17 4,87
3,07 3,82 4,59 5,38 6,18
3,83 4,67 5,53 6,39 7,27
4,57 5,49 6,42 7,36 8,30
5,35 6,35 7,34 8,34 9,34
6 7 8 9 10
11 12 13 14 15
1,15 1,43 1,73 2,06 2,41
1,59 1,93 2,31 2,70 3,11
1,83 2,21 2,62 3,04 3,48
2,60 3,07 3,57 4,07 4,60
3,05 3,57 4,11 4,66 5,23
3,82 4,40 5,01 5,63 6,26
4,57 5,23 5,89 6,57 7,26
5,58 6,30 7,04 7,79 8,55
6,99 7,81 8,63 9,47 10,3
8,15 9,03 9,93 10,8 11,7
9,24 10,2 11,1 12,1 13,0
10,3 11,3 12,3 13,3 14,3
11 12 13 14 15
16 17 18 19 20
2,77 3,16 3,56 3,97 4,40
3,54 3,98 4,44 4,91 5,40
3,94 4,42 4,90 5,41 5,92
5,14 5,70 6,26 6,84 7,43
5,81 6,41 7,01 7,63 8,26
6,91 7,56 8,23 8,91 9,59
7,96 8,67 9,39 10,1 10,9
9,31 10,1 10,9 11,7 12,4
11,2 12,0 12,9 13,7 14,6
12,6 13,5 14,4 15,4 16,3
14,0 14,9 15,9 16,9 17,8
15,3 16,3 17,3 18,3 19,3
16 17 18 19 20
21 22 23 24 25
4,83 5,29 5,75 6,22 6,71
5,90 6,40 6,92 7,45 7,99
6,45 6,98 7,53 8,08 8,65
8,03 8,64 9,26 9,89 10,5
8,90 9,54 10,2 10,9 11,5
10,3 11,0 11,7 12,4 13,1
11,6 12,3 13,1 13,8 14,6
13,2 14,0 14,8 15,7 16,5
15,4 16,3 17,2 18,1 18,9
17,2 18,1 19,0 19,9 20,9
18,8 19,7 20,7 21,7 22,6
20,3 21,3 22,3 23,3 24,3
21 22 23 24 25
26 27 28 29 30
7,20 7,70 8,21 8,73 9,26
8,54 9,09 9,66 10,2 10,8
9,22 9,80 10,4 11,0 11,6
11,2 11,8 12,5 13,1 13,8
12,2 12,9 13,6 14,3 15,0
13,8 14,6 15,3 16,0 16,8
15,4 16,2 16,9 17,7 18,5
17,3 18,1 18,9 19,8 20,6
19,8 20,7 21,6 22,5 23,4
21,8 22,7 23,6 24,6 25,5
23,6 24,5 25,5 26,5 27,4
25,3 26,3 27,3 28,3 29,3
26 27 28 29 30
35 40 45 50 55
12,0 14,9 17,9 21,0 24,2
13,8 16,9 20,1 23,5 26,9
14,7 17,9 21,3 24,7 28,2
17,2 20,7 24,3 28,0 31,7
18,5 22,2 25,9 29,7 33,6
20,6 24,4 28,4 32,4 36,4
22,5 26,5 30,6 34,8 39,0
24,8 29,1 33,4 37,7 42,1
27,8 32,3 36,9 41,4 46,0
30,2 34,9 39,6 44,3 49,1
32,3 37,1 42,0 46,9 51,7
34,3 39,3 44,3 49,3 54,3
35 40 45 50 55
60 70 80 90 100
27,5 34,3 41,2 48,4 55,7
30,3 37,5 44,8 52,3 59,9
31,7 39,0 46,5 54,2 61,9
35,5 43,3 51,2 59,2 67,3
37,5 45,4 53,5 61,8 70,1
40,5 48,8 57,2 65,6 74,2
43,2 51,7 60,4 69,1 77,9
46,5 55,3 64,3 73,3 82,4
50,6 59,9 69,2 78,6 87,9
53,8 63,3 72,9 82,5 92,1
56,6 66,4 76,2 86,0 95,8
59,3 60 69,3 70 79,3 80 89,3 90 99,3 100
Voorbeeld : 0,(7)157 betekent 0,0000000157 (nul komma zeven nullen 157).
–
Edens 060214-1610
χ2 -verdeling
75 –
Rechter kritieke waarden van de χ2 -verdeling
α
0,4
0,3
0,2
0,1
0,05
0,025
0,01
0,005
0,001
0,0005
0,0001
1 2 3 4 5
0,708 1,833 2,946 4,045 5,132
1,074 2,408 3,665 4,878 6,064
1,642 3,219 4,642 5,989 7,289
2,706 4,605 6,251 7,779 9,236
3,841 5,991 7,815 9,488 11,070
5,024 7,378 9,348 11,143 12,833
6,635 9,210 11,345 13,277 15,086
7,879 10,597 12,838 14,860 16,750
10,828 13,815 16,266 18,467 20,515
12,116 15,202 17,730 19,997 22,105
15,137 18,421 21,108 23,513 25,745
1 2 3 4 5
6 7 8 9 10
6,211 7,283 8,351 9,414 10,473
7,231 8,383 9,524 10,656 11,781
8,558 9,803 11,030 12,242 13,442
10,645 12,017 13,362 14,684 15,987
12,592 14,067 15,507 16,919 18,307
14,449 16,013 17,535 19,023 20,483
16,812 18,475 20,090 21,666 23,209
18,548 20,278 21,955 23,589 25,188
22,458 24,322 26,124 27,877 29,588
24,103 26,018 27,868 29,666 31,420
27,856 29,878 31,828 33,720 35,564
6 7 8 9 10
11 12 13 14 15
11,530 12,584 13,636 14,685 15,733
12,899 14,011 15,119 16,222 17,322
14,631 15,812 16,985 18,151 19,310
17,275 18,549 19,812 21,064 22,307
19,675 21,026 22,362 23,685 24,996
21,920 23,337 24,736 26,119 27,488
24,725 26,217 27,688 29,141 30,578
26,757 28,300 29,819 31,319 32,801
31,264 32,909 34,528 36,123 37,697
33,137 34,821 36,478 38,109 39,719
37,367 39,134 40,871 42,579 44,263
11 12 13 14 15
16 17 18 19 20
16,780 17,824 18,868 19,910 20,951
18,418 19,511 20,601 21,689 22,775
20,465 21,615 22,760 23,900 25,038
23,542 24,769 25,989 27,204 28,412
26,296 27,587 28,869 30,144 31,410
28,845 30,191 31,526 32,852 34,170
32,000 33,409 34,805 36,191 37,566
34,267 35,718 37,156 38,582 39,997
39,252 40,790 42,312 43,820 45,315
41,308 42,879 44,434 45,973 47,498
45,925 47,566 49,189 50,795 52,386
16 17 18 19 20
21 22 23 24 25
21,991 23,031 24,069 25,106 26,143
23,858 24,939 26,018 27,096 28,172
26,171 27,301 28,429 29,553 30,675
29,615 30,813 32,007 33,196 34,382
32,671 33,924 35,172 36,415 37,652
35,479 36,781 38,076 39,364 40,646
38,932 40,289 41,638 42,980 44,314
41,401 42,796 44,181 45,559 46,928
46,797 48,268 49,728 51,179 52,620
49,011 50,511 52,000 53,479 54,947
53,962 55,525 57,075 58,613 60,140
21 22 23 24 25
26 27 28 29 30
27,179 28,214 29,249 30,283 31,316
29,246 30,319 31,391 32,461 33,530
31,795 32,912 34,027 35,139 36,250
35,563 36,741 37,916 39,087 40,256
38,885 40,113 41,337 42,557 43,773
41,923 43,195 44,461 45,722 46,979
45,642 46,963 48,278 49,588 50,892
48,290 49,645 50,993 52,336 53,672
54,052 55,476 56,892 58,301 59,703
56,407 57,858 59,300 60,735 62,162
61,657 63,164 64,662 66,152 67,633
26 27 28 29 30
35 40 45 50 55
36,475 41,622 46,761 51,892 57,016
38,859 44,165 49,452 54,723 59,980
41,778 47,269 52,729 58,164 63,577
46,059 51,805 57,505 63,167 68,796
49,802 55,758 61,656 67,505 73,311
53,203 59,342 65,410 71,420 77,380
57,342 63,691 69,957 76,154 82,292
60,275 66,766 73,166 79,490 85,749
66,619 73,402 80,077 86,661 93,168
69,199 76,095 82,876 89,561 96,163
74,926 82,062 89,070 95,969 102,776
35 40 45 50 55
ν
60 62,135 70 72,358 80 82,566 90 92,761 100 102,946
65,227 68,972 74,397 79,082 83,298 88,379 91,952 99,607 102,695 109,503 60 75,689 79,715 85,527 90,531 95,023 100,425 104,215 112,317 115,578 122,755 70 86,120 90,405 96,578 101,879 106,629 112,329 116,321 124,839 128,261 135,783 80 96,524 101,054 107,565 113,145 118,136 124,116 128,299 137,208 140,782 148,627 90 106,906 111,667 118,498 124,342 129,561 135,807 140,169 149,449 153,167 161,319 100
–
Edens 060214-1610
76 –
Wilcoxon-Mann-Whitney
Linker kritieke waarden Wl met P ( P (W < Wl ) = α. (rechter kritieke waarde Wr = mn − Wl ) Onbetrouwbaarheid
α eenzijdig 0,005; tweezijdig 0,01
n m
2 3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2 3 4 5
-
-
-
0
0 1
0 1
1 2
0 1 3
0 2 4
0 2 5
1 3 6
1 3 7
1 4 7
2 5 8
2 5 9
2 6 10
2 6 11
0 3 7 12
0 3 8 13
6 7 8 9 10
-
- 0 - 0 - 1 0 1 0 2
1 1 2 3 4
2 3 4 5 6
3 4 6 7 9
4 6 7 9 11
5 6 7 9 10 11 12 13 15 16 17 7 9 10 12 13 15 16 18 19 21 22 9 11 13 15 17 18 20 22 24 26 28 11 13 16 18 20 22 24 27 29 31 33 13 16 18 21 24 26 29 31 34 37 39
18 24 30 36 42
11 12 13 14 15
-
0 1 1 1 2
5 6 7 7 8
7 9 10 11 12
10 12 13 15 16
13 15 17 18 20
16 18 20 22 24
48 54 60 67 73
16 17 18 19 20
- 2 5 - 2 6 - 2 6 0 3 7 0 3 8
9 13 10 15 11 16 12 17 13 18
18 19 21 22 24
22 24 26 28 30
27 31 36 29 34 39 31 37 42 33 39 45 36 42 48
2 3 3 4 5
Onbetrouwbaarheid
18 21 24 26 29
21 24 27 30 33
24 27 31 34 37
27 31 34 38 42
30 34 38 42 46
33 37 42 46 51
36 41 45 50 55
39 44 49 54 60
42 47 53 58 64
45 51 57 63 69
41 45 50 55 60 65 70 74 79 44 49 54 60 65 70 75 81 86 47 53 58 64 70 75 81 87 92 51 57 63 69 74 81 87 93 99 54 60 67 73 79 86 92 99 105
α eenzijdig 0,01; tweezijdig 0,02
n m
2 3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2 3 4 5
-
-
0
0 1
1 2
0 1 3
0 2 4
1 3 5
1 3 6
1 4 7
2 5 8
0 2 5 9
0 2 6 10
0 3 8 11
0 3 8 12
0 4 8 13
0 4 9 14
1 4 9 15
1 5 10 16
6 7 8 9 10
-
0 0 1 1
1 1 2 3 3
2 3 4 5 6
3 4 6 7 8
4 6 7 6 7 9 7 9 11 9 11 14 11 13 16
8 11 13 16 19
9 11 12 14 15 17 18 21 22 24
12 16 20 23 27
13 17 22 26 30
15 19 24 28 33
16 21 26 31 36
18 23 28 33 38
19 24 30 36 41
20 26 32 38 44
22 28 34 40 47
11 12 13 14 15
0 0 0
1 2 2 2 3
4 5 5 6 7
7 9 12 15 18 22 25 28 31 34 37 41 44 8 11 14 17 21 24 28 31 35 38 42 46 49 9 12 16 20 23 27 31 35 39 43 47 51 55 10 13 17 22 26 30 34 38 43 47 51 56 60 11 15 19 24 28 33 37 42 47 51 56 61 66
47 53 59 65 70
50 56 63 69 75
53 60 67 73 80
16 17 18 19 20
0 0 0 1 1
3 4 4 4 5
7 8 9 9 10
12 13 14 15 16
76 82 87 82 88 93 88 94 100 94 101 107 100 107 114
16 18 19 20 22
21 23 24 26 28
26 28 30 32 34
31 33 36 38 40
36 38 41 44 47
41 44 47 50 53
46 49 53 56 60
51 55 59 63 67
56 60 65 69 73
61 66 70 75 80
66 71 76 82 87
71 77 82 88 93
–
Edens 060214-1610
77 –
Wilcoxon-Mann-Whitney
Linker kritieke waarden Wl met P ( P (W < Wl ) = α. (rechter kritieke waarde Wr = mn − Wl ) Onbetrouwbaarheid
α eenzijdig 0,025; tweezijdig 0,05
n m
2 3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2 3 4 5
-
0
0 1
0 1 2
1 2 3
1 3 5
0 2 4 6
0 2 4 7
0 3 5 8
0 3 6 9
1 4 7 11
1 4 8 12
1 5 9 13
1 1 5 6 10 11 14 15
2 6 11 17
2 7 12 18
2 7 13 19
2 8 14 20
6 7 8 9 10
0 0 0
1 1 2 2 3
2 3 4 4 5
3 5 6 7 8
5 6 6 8 8 10 10 12 11 14
8 10 11 13 14 16 17 19 21 10 12 14 16 18 20 22 24 26 13 15 17 19 22 24 26 29 31 15 17 20 23 26 28 31 34 37 17 20 23 26 29 33 36 39 42
22 28 34 39 45
24 30 36 42 48
25 32 38 45 52
27 34 41 48 55
11 12 13 14 15
0 1 1 1 1
3 4 4 5 5
6 7 8 9 10
9 11 12 13 14
13 14 16 17 19
16 19 23 18 22 26 20 24 28 22 26 31 24 29 34
26 30 29 33 33 37 36 40 39 44
33 37 41 45 49
37 40 44 41 45 49 45 50 54 50 55 59 54 59 64
47 53 59 64 70
51 57 63 69 75
55 61 67 74 80
58 65 72 78 85
62 69 76 83 90
16 17 18 19 20
1 2 2 2 2
6 6 7 7 8
11 11 12 13 14
15 17 18 19 20
21 22 24 25 27
26 28 30 32 34
42 45 48 52 55
53 57 61 65 69
59 63 67 72 76
75 81 86 92 98
81 86 92 98 87 93 99 105 93 99 106 112 99 106 113 119 105 112 119 127
31 34 36 38 41
37 39 42 45 48
Onbetrouwbaarheid
47 51 55 58 62
64 69 74 78 83
70 75 80 85 90
α eenzijdig 0,05; tweezijdig 0,1
n m
2
3
4
5
6
7
8
9
10
11
12
14
15
16
17
18
19
20
2 3 4 5
0
0 0 1
0 1 2
0 1 2 4
0 2 3 5
0 2 4 6
1 3 5 8
1 4 6 9
1 4 7 11
1 5 8 12
2 2 3 5 6 7 9 10 11 13 15 16
3 7 12 18
3 8 14 19
3 9 15 20
4 9 16 22
4 10 17 23
4 11 18 25
6 7 8 9 10
0 0 1 1 1
2 2 3 4 4
3 4 5 6 7
5 6 8 9 11
7 8 10 12 14
8 11 13 15 17
10 12 13 15 15 18 18 21 20 24
14 17 20 24 27
16 17 19 21 23 26 27 30 31 34
19 21 24 26 28 31 33 36 37 41
23 28 33 39 44
25 30 36 42 48
26 33 39 45 51
28 35 41 48 55
30 37 44 51 58
32 39 47 54 62
11 12 13 14 15
1 2 2 3 3
5 5 6 7 7
8 9 10 11 12
12 13 15 16 18
16 17 19 21 23
19 21 24 26 28
23 27 26 30 28 33 31 36 33 39
31 34 37 41 44
34 38 38 42 42 47 46 51 50 55
42 46 47 51 51 56 56 61 61 66
50 55 61 66 72
54 60 65 71 77
57 64 70 77 83
61 68 75 82 88
65 72 80 87 94
69 77 84 92 100
16 17 18 19 20
3 8 3 9 4 9 4 10 4 11
14 15 16 17 18
19 20 22 23 25
25 26 28 30 32
30 33 35 37 39
36 39 41 44 47
48 51 55 58 62
54 57 61 65 69
65 70 75 80 84
77 83 89 95 101 83 89 96 102 109 88 95 102 109 116 94 101 109 116 123 100 107 115 123 130
107 115 123 130 138
42 45 48 51 54
60 64 68 72 77
13
71 77 82 87 92
–
Edens 060214-1610
78 –
Betrowbaarheidsintervallen voor de mediaan
Betrouwbaarheidsintervallen voor de mediaan
%
0,05
0,1
0,25
0,5
1
2,5
5
10
25
1 1 1 1 2 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 7 8 8 8 9 9 9 10 10 11 11 11 12 12 12 13 13 14
1
1
1
1
1
1
1
1 1
n 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
2 2 2 2
2 2 2
3 3 3 3
3
4 4
4 4 4
5 5 5
5 5 5 6 7 7 7
9 9 10 10 11 12 12 13 13 14
6 6 6
6 6
8
3 3 3
2
8 8 9 9 10 10 11 11 12 12 13 13 14 14 14 15 15
7 7 7 8 8
8 8 9 9
9 10 10 10 11 11 12 12 13 13 14 14 15 15 16 16
11 11 12 13 13 14 14 15 15 16 16 17
3 3
4 4 5 5 6 6 7 7 8 8 9 9 10 10 10 11 11 12 12 13 13 13 14 14 15 15 16 16 16 17 17 18 18
4 4 4
5 5
5 6 6 6 7 7 8 8 9 9 10 10 11 11 11 12 12 13 13 14 14 14 15 15 16 16 17 17 17 18 18 19 19
7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 16 17 17 18 18 19 19 20 20 20
2 2 3 3 4 4 5 5 6 6 7 7 8 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23
–
Edens 060214-1610
79 –
Betrowbaarheidsintervallen voor de mediaan
Betrouwbaarheidsintervallen voor de mediaan
%
n
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
0,05
0,1
0,25
14 14 15 15 15 16 16 17 17 17 18 18 19 19 19 20 20 21 21 21 22 22 23 23 23 24 24 25 25 25 26 26 27 27 27 28 28 29 29 30 30 30 31 31 32 32 32 33 33 34
15 15
16 16 16 17 17 18 18 18 19 19 20 20 20 21 21 22 22 23 23 23 24 24 25 25 25 26 26 27 27 28 28 28 29 29 30 30 30 31 31 32 32 33 33 33 34 34 35 35 36 36
16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 28 29 29 30 30 31 31 32 32 33 33 33 34 34 35
0,5
17 17 18 18 19 19 20 20 21 21 21 22 22 23 23 24 24 25 25 26 26 26 27 27 28 28 29 29 29 30 30 31 31 32 32 32 33 33 34 34 35 35 35 36 36 37 37
1
2,5
5
10
25
17 18 18 19 19 19 20 20 21 21
19 19 19 20 20 21 21 22 22 22 23 23 24 24 25 25 26 26 26 27 27 28 28 29 29 29 30 30 31 31 32 32 33 33 33 34 34 35 35 36 36 37 37 38 38 38 39 39 40 40
20 20 21 21 21 22 22 23 23 24 24 25 25 25 26 26 27 27 28 28 29 29 29 30 30 31 31 32 32 33 33 34 34 34 35 35 36 36 37 37 38 38 39 39 39 40 40 41 41 42
21 21 22 22 23 23 24 24 25 25 25 26 26 27 27 28 28 29 29 30 30 31 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 38 39 39 40 40 41 41 42 42 43 43 44
23 24 24 25 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 37 38 38 39 39 40 40 41 41 42 42 43 43 44 44 45 45 46 46 47
22 22 23 23 24 24 24 25 25 26 26 27 27 27 28 28 29 29 30 30 31 31 31 32 32 33 33 34 34 34 35 35 36 36 37 37 38 38 38
–
Edens 060214-1610
80 –
F -verdeling
Rechter kritieke waarden van de Fν1 ,ν2 -verdeling (α = 0, 05 Tabelwaarden voor
ν2 ν1
2
3
4
5
6
7
8
9
α = 0, 01 α = 0, 005 10
12
15
20
30
60
120
∞
2
19,0 9,55 6,94 5,79 5,14 4,74 4,46 4,26 99,0 30,8 18,0 13,3 10,9 9,55 8,65 8,02 199 49,8 26,3 18,3 14,5 12,4 11,0 10,1
2
4,10 3,89 3,68 3,49 3,32 3,15 3,07 3,00 7,56 6,93 6,36 5,85 5,39 4,98 4,79 4,61 9,43 8,51 7,70 6,99 6,35 5,79 5,54 5,30
2
3
19,2 9,28 6,59 5,41 4,76 4,35 4,07 3,86 99,2 29,5 16,7 12,1 9,78 8,45 7,59 6,99 199 47,5 24,3 16,5 12,9 10,9 9,60 8,72
3
3,71 3,49 3,29 3,10 2,92 2,76 2,68 2,61 6,55 5,95 5,42 4,94 4,51 4,13 3,95 3,78 8,08 7,23 6,48 5,82 5,24 4,73 4,50 4,28
3
4
19,2 9,12 6,39 5,19 4,53 4,12 3,84 3,63 99,2 28,7 16,0 11,4 9,15 7,85 7,01 6,42 199 46,2 23,2 15,6 12,0 10,1 8,81 7,96
4
3,48 3,26 3,06 2,87 2,69 2,53 2,45 2,37 5,99 5,41 4,89 4,43 4,02 3,65 3,48 3,32 7,34 6,52 5,80 5,17 4,62 4,14 3,92 3,72
4
5
19,3 9,01 6,26 5,05 4,39 3,97 3,69 3,48 99,3 28,2 15,5 11,0 8,75 7,46 6,63 6,06 199 45,4 22,5 14,9 11,5 9,52 8,30 7,47
5
3,33 3,11 2,90 2,71 2,53 2,37 2,29 2,21 5,64 5,06 4,56 4,10 3,70 3,34 3,17 3,02 6,87 6,07 5,37 4,76 4,23 3,76 3,55 3,35
5
6
19,3 8,94 6,16 4,95 4,28 3,87 3,58 3,37 99,3 27,9 15,2 10,7 8,47 7,19 6,37 5,80 199 44,8 22,0 14,5 11,1 9,16 7,95 7,13
6
3,22 3,00 2,79 2,60 2,42 2,25 2,17 2,10 5,39 4,82 4,32 3,87 3,47 3,12 2,96 2,80 6,54 5,76 5,07 4,47 3,95 3,49 3,28 3,09
6
7
19,4 8,89 6,09 4,88 4,21 3,79 3,50 3,29 99,4 27,7 15,0 10,5 8,26 6,99 6,18 5,61 199 44,4 21,6 14,2 10,8 8,89 7,69 6,88
7
3,14 2,91 2,71 2,51 2,33 2,17 2,09 2,01 5,20 4,64 4,14 3,70 3,30 2,95 2,79 2,64 6,30 5,52 4,85 4,26 3,74 3,29 3,09 2,90
7
8
19,4 8,85 6,04 4,82 4,15 3,73 3,44 3,23 99,4 27,5 14,8 10,3 8,10 6,84 6,03 5,47 199 44,1 21,4 14,0 10,6 8,68 7,50 6,69
8
3,07 2,85 2,64 2,45 2,27 2,10 2,02 1,94 5,06 4,50 4,00 3,56 3,17 2,82 2,66 2,51 6,12 5,35 4,67 4,09 3,58 3,13 2,93 2,75
8
9
19,4 8,81 6,00 4,77 4,10 3,68 3,39 3,18 99,4 27,3 14,7 10,2 7,98 6,72 5,91 5,35 199 43,9 21,1 13,8 10,4 8,51 7,34 6,54
9
3,02 2,80 2,59 2,39 2,21 2,04 1,96 1,88 4,94 4,39 3,89 3,46 3,07 2,72 2,56 2,41 5,97 5,20 4,54 3,96 3,45 3,01 2,81 2,62
9
10
19,4 8,79 5,96 4,74 4,06 3,64 3,35 3,14 99,4 27,2 14,5 10,1 7,87 6,62 5,81 5,26 199 43,7 21,0 13,6 10,3 8,38 7,21 6,42
10
2,98 2,75 2,54 2,35 2,16 1,99 1,91 1,83 4,85 4,30 3,80 3,37 2,98 2,63 2,47 2,32 5,85 5,09 4,42 3,85 3,34 2,90 2,71 2,52
10
12
19,4 8,74 5,91 4,68 4,00 3,57 3,28 3,07 99,4 27,1 14,4 9,89 7,72 6,47 5,67 5,11 199 43,4 20,7 13,4 10,0 8,18 7,01 6,23
12
2,91 2,69 2,48 2,28 2,09 1,92 1,83 1,75 4,71 4,16 3,67 3,23 2,84 2,50 2,34 2,19 5,66 4,91 4,25 3,68 3,18 2,74 2,54 2,36
12
15
19,4 8,70 5,86 4,62 3,94 3,51 3,22 3,01 99,4 26,9 14,2 9,72 7,56 6,31 5,52 4,96 199 43,1 20,4 13,1 9,81 7,97 6,81 6,03
15
2,85 2,62 2,40 2,20 2,01 1,84 1,75 1,67 4,56 4,01 3,52 3,09 2,70 2,35 2,19 2,04 5,47 4,72 4,07 3,50 3,01 2,57 2,37 2,19
15
20
19,4 8,66 5,80 4,56 3,87 3,44 3,15 2,94 99,4 26,7 14,0 9,55 7,40 6,16 5,36 4,81 199 42,8 20,2 12,9 9,59 7,75 6,61 5,83
20
2,77 2,54 2,33 2,12 1,93 1,75 1,66 1,57 4,41 3,86 3,37 2,94 2,55 2,20 2,03 1,88 5,27 4,53 3,88 3,32 2,82 2,39 2,19 2,00
20
30
19,5 8,62 5,75 4,50 3,81 3,38 3,08 2,86 99,5 26,5 13,8 9,38 7,23 5,99 5,20 4,65 199 42,5 19,9 12,7 9,36 7,53 6,40 5,62
30
2,70 2,47 2,25 2,04 1,84 1,65 1,55 1,46 4,25 3,70 3,21 2,78 2,39 2,03 1,86 1,70 5,07 4,33 3,69 3,12 2,63 2,19 1,98 1,79
30
60
19,5 8,57 5,69 4,43 3,74 3,30 3,01 2,79 99,5 26,3 13,7 9,20 7,06 5,82 5,03 4,48 199 42,1 19,6 12,4 9,12 7,31 6,18 5,41
60
2,62 2,38 2,16 1,95 1,74 1,53 1,43 1,32 4,08 3,54 3,05 2,61 2,21 1,84 1,66 1,48 4,86 4,12 3,48 2,92 2,42 1,96 1,75 1,54
60
120
19,5 8,55 5,66 4,40 3,70 3,27 2,97 2,75 99,5 26,2 13,6 9,11 6,97 5,74 4,95 4,40 120 199 42,0 19,5 12,3 9,00 7,19 6,06 5,30
2,58 2,34 2,11 1,90 1,68 1,47 1,35 1,22 4,00 3,45 2,96 2,52 2,11 1,73 1,53 1,33 120 4,75 4,01 3,37 2,81 2,30 1,83 1,61 1,37
∞
19,5 8,53 5,63 4,37 3,67 3,23 2,93 2,71 99,5 26,1 13,5 9,03 6,89 5,66 4,87 4,32 199 41,8 19,3 12,2 8,89 7,09 5,96 5,20
2,54 2,30 2,07 1,84 1,62 1,39 1,26 1,03 3,91 3,36 2,87 2,42 2,01 1,60 1,38 1,05 4,64 3,91 3,26 2,69 2,18 1,69 1,43 1,05
∞
∞
–
Edens 060214-1610
81 –
Poissonverdeling
Poissonverdeling (cumulatief ) 0,1 0,2 0,3 0,4 0,5 0 0,905 0,819 0,741 0,670 0,607 1 0,995 0,982 0,963 0,938 0,910 2 1,000 0,999 0,996 0,992 0,986 3 1,000 1,000 0,999 0,998 4 1,000 1,000 5 6
0,6 0,7 0,8 0,549 0,497 0,449 0,878 0,844 0,809 0,977 0,966 0,953 0,997 0,994 0,991 1,000 0,999 0,999 1,000 1,000
0,9 0,407 0,772 0,937 0,987 0,998 1,000
1,0 0,368 0,736 0,920 0,981 0,996 0,999 1,000
0 1 2 3 4 5 6
1,6 1,7 1,8 1,9 2,0 0,202 0,183 0,165 0,150 0,135 0,525 0,493 0,463 0,434 0,406 0,783 0,757 0,731 0,704 0,677 0,921 0,907 0,891 0,875 0,857 0,976 0,970 0,964 0,956 0,947 0,994 0,992 0,990 0,987 0,983 0,999 0,998 0,997 0,997 0,995 1,000 1,000 0,999 0,999 0,999 1,000 1,000 1,000
0 1 2 3 4 5 6 7 8
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8
1,1 0,333 0,699 0,900 0,974 0,995 0,999 1,000
1,2 0,301 0,663 0,879 0,966 0,992 0,998 1,000
1,3 0,273 0,627 0,857 0,957 0,989 0,998 1,000
1,4 0,247 0,592 0,833 0,946 0,986 0,997 0,999 1,000
1,5 0,223 0,558 0,809 0,934 0,981 0,996 0,999 1,000
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10
2,1 0,122 0,380 0,650 0,839 0,938 0,980 0,994 0,999 1,000
2,2 0,111 0,355 0,623 0,819 0,928 0,975 0,993 0,998 1,000
2,3 2,4 2,5 0,100 0,091 0,082 0,331 0,308 0,287 0,596 0,570 0,544 0,799 0,779 0,758 0,916 0,904 0,891 0,970 0,964 0,958 0,991 0,988 0,986 0,997 0,997 0,996 0,999 0,999 0,999 1,000 1,000 1,000
2,6 2,7 0,074 0,067 0,267 0,249 0,518 0,494 0,736 0,714 0,877 0,863 0,951 0,943 0,983 0,979 0,995 0,993 0,999 0,998 1,000 0,999 1,000
2,8 0,061 0,231 0,469 0,692 0,848 0,935 0,976 0,992 0,998 0,999 1,000
2,9 0,055 0,215 0,446 0,670 0,832 0,926 0,971 0,990 0,997 0,999 1,000
3,0 0,050 0,199 0,423 0,647 0,815 0,916 0,966 0,988 0,996 0,999 1,000
0 1 2 3 4 5 6 7 8 9 10
3,6 3,7 3,8 3,9 4,0 0,027 0,025 0,022 0,020 0,018 0,126 0,116 0,107 0,099 0,092 0,303 0,285 0,269 0,253 0,238 0,515 0,494 0,473 0,453 0,433 0,706 0,687 0,668 0,648 0,629 0,844 0,830 0,816 0,801 0,785 0,927 0,918 0,909 0,899 0,889 0,969 0,965 0,960 0,955 0,949 0,988 0,986 0,984 0,981 0,979 0,996 0,995 0,994 0,993 0,992 0,999 0,998 0,998 0,998 0,997 1,000 1,000 0,999 0,999 0,999 1,000 1,000 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12
3,1 0,045 0,185 0,401 0,625 0,798 0,906 0,961 0,986 0,995 0,999 1,000
3,2 0,041 0,171 0,380 0,603 0,781 0,895 0,955 0,983 0,994 0,998 1,000
3,3 3,4 3,5 0,037 0,033 0,030 0,159 0,147 0,136 0,359 0,340 0,321 0,580 0,558 0,537 0,763 0,744 0,725 0,883 0,871 0,858 0,949 0,942 0,935 0,980 0,977 0,973 0,993 0,992 0,990 0,998 0,997 0,997 0,999 0,999 0,999 1,000 1,000 1,000
–
Edens 060214-1610
82 –
Poissonverdeling
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
4,1 0,017 0,085 0,224 0,414 0,609 0,769 0,879 0,943 0,976 0,990 0,997 0,999 1,000
4,2 0,015 0,078 0,210 0,395 0,590 0,753 0,867 0,936 0,972 0,989 0,996 0,999 1,000
4,3 4,4 4,5 0,014 0,012 0,011 0,072 0,066 0,061 0,197 0,185 0,174 0,377 0,359 0,342 0,570 0,551 0,532 0,737 0,720 0,703 0,856 0,844 0,831 0,929 0,921 0,913 0,968 0,964 0,960 0,987 0,985 0,983 0,995 0,994 0,993 0,998 0,998 0,998 0,999 0,999 0,999 1,000 1,000 1,000
4,6 4,7 4,8 4,9 0,010 0,009 0,008 0,007 0,056 0,052 0,048 0,044 0,163 0,152 0,143 0,133 0,326 0,310 0,294 0,279 0,513 0,495 0,476 0,458 0,686 0,668 0,651 0,634 0,818 0,805 0,791 0,777 0,905 0,896 0,887 0,877 0,955 0,950 0,944 0,938 0,980 0,978 0,975 0,972 0,992 0,991 0,990 0,988 0,997 0,997 0,996 0,995 0,999 0,999 0,999 0,998 1,000 1,000 1,000 0,999 1,000
5,0 0,007 0,040 0,125 0,265 0,440 0,616 0,762 0,867 0,932 0,968 0,986 0,995 0,998 0,999 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
5,6 5,7 5,8 5,9 6,0 0,004 0,003 0,003 0,003 0,002 0,024 0,022 0,021 0,019 0,017 0,082 0,077 0,072 0,067 0,062 0,191 0,180 0,170 0,160 0,151 0,342 0,327 0,313 0,299 0,285 0,512 0,495 0,478 0,462 0,446 0,670 0,654 0,638 0,622 0,606 0,797 0,784 0,771 0,758 0,744 0,886 0,877 0,867 0,857 0,847 0,941 0,935 0,929 0,923 0,916 0,972 0,969 0,965 0,961 0,957 0,988 0,986 0,984 0,982 0,980 0,995 0,994 0,993 0,992 0,991 0,998 0,998 0,997 0,997 0,996 0,999 0,999 0,999 0,999 0,999 1,000 1,000 1,000 1,000 0,999 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
5,1 0,006 0,037 0,116 0,251 0,423 0,598 0,747 0,856 0,925 0,964 0,984 0,994 0,998 0,999 1,000
5,2 0,006 0,034 0,109 0,238 0,406 0,581 0,732 0,845 0,918 0,960 0,982 0,993 0,997 0,999 1,000
5,3 0,005 0,031 0,102 0,225 0,390 0,563 0,717 0,833 0,911 0,956 0,980 0,992 0,997 0,999 1,000
5,4 0,005 0,029 0,095 0,213 0,373 0,546 0,702 0,822 0,903 0,951 0,977 0,990 0,996 0,999 1,000
5,5 0,004 0,027 0,088 0,202 0,358 0,529 0,686 0,809 0,894 0,946 0,975 0,989 0,996 0,998 0,999 1,000
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
6,1 0,002 0,016 0,058 0,143 0,272 0,430 0,590 0,730 0,837 0,909 0,953 0,978 0,990 0,996 0,998 0,999 1,000
6,2 0,002 0,015 0,054 0,134 0,259 0,414 0,574 0,716 0,826 0,902 0,949 0,975 0,989 0,995 0,998 0,999 1,000
6,3 0,002 0,013 0,050 0,126 0,247 0,399 0,558 0,702 0,815 0,894 0,944 0,972 0,987 0,995 0,998 0,999 1,000
6,4 0,002 0,012 0,046 0,119 0,235 0,384 0,542 0,687 0,803 0,886 0,939 0,969 0,986 0,994 0,997 0,999 1,000
6,5 0,002 0,011 0,043 0,112 0,224 0,369 0,527 0,673 0,792 0,877 0,933 0,966 0,984 0,993 0,997 0,999 1,000
6,6 0,001 0,010 0,040 0,105 0,213 0,355 0,511 0,658 0,780 0,869 0,927 0,963 0,982 0,992 0,997 0,999 0,999 1,000
6,7 6,8 6,9 7,0 0,001 0,001 0,001 0,001 0,009 0,009 0,008 0,007 0,037 0,034 0,032 0,030 0,099 0,093 0,087 0,082 0,202 0,192 0,182 0,173 0,341 0,327 0,314 0,301 0,495 0,480 0,465 0,450 0,643 0,628 0,614 0,599 0,767 0,755 0,742 0,729 0,860 0,850 0,840 0,830 0,921 0,915 0,908 0,901 0,959 0,955 0,951 0,947 0,980 0,978 0,976 0,973 0,991 0,990 0,989 0,987 0,996 0,996 0,995 0,994 0,998 0,998 0,998 0,998 0,999 0,999 0,999 0,999 1,000 1,000 1,000 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
–
Edens 060214-1610
83 –
Poissonverdeling
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
7,1 0,001 0,007 0,027 0,077 0,164 0,288 0,435 0,584 0,716 0,820 0,894 0,942 0,970 0,986 0,994 0,997 0,999 1,000
7,2 0,001 0,006 0,025 0,072 0,156 0,276 0,420 0,569 0,703 0,810 0,887 0,937 0,967 0,984 0,993 0,997 0,999 1,000
7,3 7,4 7,5 0,001 0,001 0,001 0,006 0,005 0,005 0,024 0,022 0,020 0,067 0,063 0,059 0,147 0,140 0,132 0,264 0,253 0,241 0,406 0,392 0,378 0,554 0,539 0,525 0,689 0,676 0,662 0,799 0,788 0,776 0,879 0,871 0,862 0,932 0,926 0,921 0,964 0,961 0,957 0,982 0,980 0,978 0,992 0,991 0,990 0,996 0,996 0,995 0,999 0,998 0,998 0,999 0,999 0,999 1,000 1,000 1,000
7,6 7,7 7,8 7,9 0,001 0,000 0,000 0,000 0,004 0,004 0,004 0,003 0,019 0,017 0,016 0,015 0,055 0,052 0,048 0,045 0,125 0,118 0,112 0,106 0,231 0,220 0,210 0,201 0,365 0,351 0,338 0,326 0,510 0,496 0,481 0,467 0,648 0,634 0,620 0,607 0,765 0,753 0,741 0,729 0,854 0,845 0,835 0,826 0,915 0,909 0,902 0,895 0,954 0,950 0,945 0,941 0,976 0,974 0,971 0,969 0,989 0,987 0,986 0,984 0,995 0,994 0,993 0,993 0,998 0,997 0,997 0,997 0,999 0,999 0,999 0,999 1,000 1,000 1,000 0,999 1,000
8,0 0,000 0,003 0,014 0,042 0,100 0,191 0,313 0,453 0,593 0,717 0,816 0,888 0,936 0,966 0,983 0,992 0,996 0,998 0,999 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
8,6 8,7 8,8 8,9 9,0 0,000 0,000 0,000 0,000 0,000 0,002 0,002 0,001 0,001 0,001 0,009 0,008 0,007 0,007 0,006 0,028 0,026 0,024 0,023 0,021 0,070 0,066 0,062 0,058 0,055 0,142 0,135 0,128 0,122 0,116 0,246 0,235 0,226 0,216 0,207 0,373 0,360 0,348 0,336 0,324 0,509 0,496 0,482 0,469 0,456 0,640 0,627 0,614 0,601 0,587 0,752 0,741 0,729 0,718 0,706 0,840 0,831 0,822 0,813 0,803 0,903 0,897 0,890 0,883 0,876 0,945 0,940 0,936 0,931 0,926 0,970 0,967 0,965 0,962 0,959 0,985 0,983 0,982 0,980 0,978 0,993 0,992 0,991 0,990 0,989 0,997 0,996 0,996 0,995 0,995 0,999 0,998 0,998 0,998 0,998 0,999 0,999 0,999 0,999 0,999 1,000 1,000 1,000 1,000 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
8,1 0,000 0,003 0,013 0,040 0,094 0,182 0,301 0,439 0,579 0,704 0,806 0,881 0,931 0,963 0,981 0,991 0,996 0,998 0,999 1,000
8,2 0,000 0,003 0,012 0,037 0,089 0,174 0,290 0,425 0,565 0,692 0,796 0,873 0,926 0,960 0,979 0,990 0,995 0,998 0,999 1,000
8,3 0,000 0,002 0,011 0,035 0,084 0,165 0,278 0,412 0,551 0,679 0,785 0,865 0,921 0,956 0,977 0,989 0,995 0,998 0,999 1,000
8,4 0,000 0,002 0,010 0,032 0,079 0,157 0,267 0,399 0,537 0,666 0,774 0,857 0,915 0,952 0,975 0,987 0,994 0,997 0,999 1,000
8,5 0,000 0,002 0,009 0,030 0,074 0,150 0,256 0,386 0,523 0,653 0,763 0,849 0,909 0,949 0,973 0,986 0,993 0,997 0,999 0,999 1,000
–
Edens 060214-1610
84 –
Poissonverdeling
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
9,1 0,000 0,001 0,006 0,020 0,052 0,110 0,198 0,312 0,443 0,574 0,694 0,793 0,868 0,921 0,955 0,976 0,988 0,994 0,997 0,999 0,999 1,000
9,2 0,000 0,001 0,005 0,018 0,049 0,104 0,189 0,301 0,430 0,561 0,682 0,783 0,861 0,916 0,952 0,974 0,987 0,993 0,997 0,999 0,999 1,000
9,3 0,000 0,001 0,005 0,017 0,046 0,099 0,181 0,290 0,417 0,548 0,670 0,773 0,853 0,910 0,948 0,972 0,985 0,993 0,997 0,998 0,999 1,000
9,4 0,000 0,001 0,005 0,016 0,043 0,093 0,173 0,279 0,404 0,535 0,658 0,763 0,845 0,904 0,944 0,969 0,984 0,992 0,996 0,998 0,999 1,000
9,5 0,000 0,001 0,004 0,015 0,040 0,089 0,165 0,269 0,392 0,522 0,645 0,752 0,836 0,898 0,940 0,967 0,982 0,991 0,996 0,998 0,999 1,000
9,6 0,000 0,001 0,004 0,014 0,038 0,084 0,157 0,258 0,380 0,509 0,633 0,741 0,828 0,892 0,936 0,964 0,981 0,990 0,995 0,998 0,999 1,000
9,7 0,000 0,001 0,004 0,013 0,035 0,079 0,150 0,248 0,368 0,496 0,621 0,730 0,819 0,885 0,931 0,961 0,979 0,989 0,995 0,998 0,999 1,000
9,8 9,9 10,0 0,000 0,000 0,000 0,001 0,001 0,000 0,003 0,003 0,003 0,012 0,011 0,010 0,033 0,031 0,029 0,075 0,071 0,067 0,143 0,137 0,130 0,239 0,229 0,220 0,356 0,344 0,333 0,483 0,471 0,458 0,608 0,596 0,583 0,719 0,708 0,697 0,810 0,801 0,792 0,879 0,872 0,864 0,927 0,922 0,917 0,958 0,955 0,951 0,977 0,975 0,973 0,988 0,987 0,986 0,994 0,993 0,993 0,997 0,997 0,997 0,999 0,999 0,998 0,999 0,999 0,999 1,000 1,000 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Poissonverdeling (cumulatief )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
11,0 0,000 0,000 0,001 0,005 0,015 0,038 0,079 0,143 0,232 0,341 0,460 0,579 0,689 0,781 0,854 0,907 0,944 0,968 0,982 0,991 0,995 0,998 0,999 1,000
12,0 0,000 0,000 0,001 0,002 0,008 0,020 0,046 0,090 0,155 0,242 0,347 0,462 0,576 0,682 0,772 0,844 0,899 0,937 0,963 0,979 0,988 0,994 0,997 0,999 0,999 1,000
13,0 14,0 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,000 0,004 0,002 0,011 0,006 0,026 0,014 0,054 0,032 0,100 0,062 0,166 0,109 0,252 0,176 0,353 0,260 0,463 0,358 0,573 0,464 0,675 0,570 0,764 0,669 0,835 0,756 0,890 0,827 0,930 0,883 0,957 0,923 0,975 0,952 0,986 0,971 0,992 0,983 0,996 0,991 0,998 0,995 0,999 0,997 1,000 0,999 0,999 1,000
15,0 0,000 0,000 0,000 0,000 0,001 0,003 0,008 0,018 0,037 0,070 0,118 0,185 0,268 0,363 0,466 0,568 0,664 0,749 0,819 0,875 0,917 0,947 0,967 0,981 0,989 0,994 0,997 0,998 0,999 1,000
16,0 0,000 0,000 0,000 0,000 0,000 0,001 0,004 0,010 0,022 0,043 0,077 0,127 0,193 0,275 0,368 0,467 0,566 0,659 0,742 0,812 0,868 0,911 0,942 0,963 0,978 0,987 0,993 0,996 0,998 0,999 0,999 1,000
17,0 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,005 0,013 0,026 0,049 0,085 0,135 0,201 0,281 0,371 0,468 0,564 0,655 0,736 0,805 0,861 0,905 0,937 0,959 0,975 0,985 0,991 0,995 0,997 0,999 0,999 1,000
18,0 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,003 0,007 0,015 0,030 0,055 0,092 0,143 0,208 0,287 0,375 0,469 0,562 0,651 0,731 0,799 0,855 0,899 0,932 0,955 0,972 0,983 0,990 0,994 0,997 0,998 0,999 1,000
19,0 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,004 0,009 0,018 0,035 0,061 0,098 0,150 0,215 0,292 0,378 0,469 0,561 0,647 0,725 0,793 0,849 0,893 0,927 0,951 0,969 0,980 0,988 0,993 0,996 0,998 0,999 0,999 1,000
20,0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,005 0,011 0,021 0,039 0,066 0,105 0,157 0,221 0,297 0,381 0,470 0,559 0,644 0,721 0,787 0,843 0,888 0,922 0,948 0,966 0,978 0,987 0,992 0,995 0,997 0,999 0,999 1,000
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36