De Poisson-verdeling
4b
λ = 1,5
P (k = k ) =
Doelen Geschiedenis Diagnostische toets 4.5 De Poisson-verdeling, een inleiding 4.5.1 De Poisson-verdeling 4.5.2 De tabel van de Poisson-verdeling 4.5.3 De verwachtingswaarde en de variantie van de Poisson-verdeling 4.5.4 De benadering van de binomiale verdeling door de Poisson-verdeling 4.5.5 De benadering van de Poisson-verdeling door de normale verdeling Eindtoets Bijlagen 1 – Bewijs van de formule voor de Poisson-verdeling 2 – Tabel Poisson-verdeling voor enkelvoudige k-waarden 3 – Het bewijs voor E(k) = λ en Var(k) = λ 4 – De som van onafhankelijke Poisson-verdeelde kansvariabelen 5 – De Poisson-verdeling met Excel 6 – De Poisson-verdeling met de TI-83 Uitwerkingen van de opgaven
e −λ λ k k!
Doelen Na het bestuderen van dit hoofdstuk kun je: • Een Poisson-verdeling herkennen. • De verschillen aangeven met een binomiale verdeling. • Kansvraagstukken oplossen met de Poisson-verdeling. • Kansvraagstukken die op te lossen zijn met de binomiale verdeling benaderen met de Poisson-verdeling. • Kansvraagstukken die op te lossen zijn met de Poisson-verdeling benaderen met de normale verdeling. Geschiedenis Siméon Poisson (1781-1840) was een Franse wiskundige, geboren in de gemeente Pithiviers in het departement Loiret. Hij leefde dus in de periode van de Franse revolutie 1789 – 1799 en ten tijde van andere grote Franse wiskundigen als Legendre, Laplace en Fourier. Op jeugdige leeftijd werd hij door zijn vader naar Fontainebleau gestuurd om zich bij zijn oom, die chirurg was, te wijden aan de geneeskunde. Maar omdat zijn eerste patiënt enkele uren na een door hem uitgevoerde operatie stierf, wilde hij niets meer met geneeskunde te maken hebben. Omdat hij enige aanleg in wiskunde bleek te hebben, werd hij naar de plaatselijke École Centrale gestuurd,
Siméon Denis Poisson
Pithiviers in het departement Loiret
*
2
Statistiek voor technici
waar hij zich verder bekwaamde in de wiskunde. Als 17-jarige start hij aan de École Polytechnique in Parijs. Binnen twee jaar wist hij zich door publicatie van twee wiskundige documenten toegang te verschaffen tot het wetenschappelijke wereldje met onder anderen Laplace, Legendre, bij wie hij colleges volgde, en Fourier. Naast zijn aandacht voor het wetenschappelijke werk – hij publiceerde meer dan 300 teksten over het brede gebied van de zuivere en toegepaste wiskunde – had hij veel interesse in het lesgeven. Hij blonk hierin zo uit dat zijn medestudenten na een erg moeilijk college van één van zijn collega’s vaak naar zijn kamer gingen, om hem het college nog eens uit te laten leggen en toe te lichten. In 1806 volgde hij Fourier, die naar Grenoble vertrok, op als hoogleraar aan de École Polytechnique. Naast het hoogleraarschap aan de École Polytechnique was hij astronoom aan het Bureau des Longitudes, hoogleraar aan de Faculté des Sciences in de ‘rationale mechanica' (professeur de mécanique rationelle), onderzoeker aan de militaire school (École Militaire) in Saint-Cyr, onderzoeker aan de École Polytechnique, raadsman van de universiteit, en meetkundige bij het Bureau des Longitudes als opvolger van Laplace in 1827. Ook in de statistiek heeft hij zijn sporen verdiend. De Poisson-verdeling is door hem in 1837 in slechts één pagina van zijn statistisch werk Recherches sur la probabilité des jugements en matières criminelles et matière civile beschreven. Hij leek zich ternauwernood bewust van de grote praktische bruikbaarheid van deze kansverdeling. Ladislaus Josephowitsch von Bortkiewicz was de eerste die in 1898 de belangrijkheid van de verdeling onderkende. Hij paste haar toe in zijn studie naar het aantal Pruisische soldaten dat in de jaren 1875 tot en met 1894 de dood vond door een klap met een paardenhoef, beschreven in zijn boek ‘Das Gesetz der kleinen Zahlen’.
Laplace, 1749 - 1827
Legendre, 1752 - 1833
Fourier, 1768 - 1830
Siméon Denis Poisson, 1781 – 1840
Franse Revolutie, 1789 - 1799
Diagnostische toets 1. Voor het aantal patiënten k dat per dag in een ziekenhuis binnenkomt tussen 10:00 uur en 10:30 uur nemen we als kansmodel een Poisson-verdeling met parameter λ. In 10 aselect gekozen dagen blijken in totaal 90 patiënten tussen de hiervoor genoemde tijdstippen binnen te komen. a. Geef een schatting van het gemiddelde aantal λ per dag. b. Bepaal de kans dat er per dag precies 6 patiënten binnenkomen tussen 10:00 uur en 10:30 uur. Laat m het aantal patiënten zijn dat per dag tussen 10:30 uur en 11:00 uur binnenkomt met parameter λm. Uit een steekproef is gebleken dat λm = 5,6. c. Bepaal de kans dat er op een willekeurige dag tussen 10:00 uur en 11.00 uur minder dan 16 patiënten binnenkomen. d. Geef een schatting van Var(k + m). 2. Het aantal uurwerken dat per werkdag bij een juwelier verkocht wordt, kan als een Poisson-verdeling beschouwd worden. Het aantal werkdagen per week is gelijk aan vijf. Het gemiddeld aantal uurwerken dat verkocht wordt bedraagt 4. Elke maandag wordt de voorraad van deze juwelier aangevuld tot 20 uurwerken. a. Hoe groot is de kans dat de juwelier te weinig voorraad heeft?
3
4.5 De Poisson-verdeling
b. Hoe groot moet de voorraad zijn om deze kans minder te laten zijn dan 13%? 3. In een productiebedrijf heeft men gedurende een jaar per werkdag bijgehouden hoeveel storingen er per dag aan een machine optreden. De tweede kolom in de hiernavolgende tabel geeft de waargenomen aantallen keren aan met 0, 1, 2, 3, 4 respectievelijk meer dan 5 storingen per dag aan. Het totaal aantal storingen is 333. Hier is sprake van een zeer groot aantal uitvoeringen van een kansexperiment (productiehandelingen met een machine) met een zeer kleine kans op ‘succes’ (storing).
aantal storingen per dag 0 1 2 3 4 ≥5 totaal
waargenomen aantal storingen per dag 133 122 54 20 4 0 333
het verwachte aantal storingen per dag
De verwachting is dan ook dat de waargenomen aantallen storingen goed benader kunnen worden met een Poisson-verdeling a. Bereken het gemiddelde aantal storingen per dag in één cijfer nauwkeurig achter de komma. b. Bereken in kolom drie het verwachte aantal keren met 0, 1, 2, 3, 4 respectievelijk meer dan 5 storingen per dag. c. Wat vind je van de mate waarin de Poisson-verdeling de waargenomen aantallen storingen benadert?
4.5
De Poisson-verdeling, een inleiding
In hoofdstuk 4 wordt het onderwerp kansrekening behandeld. Kansrekening gebruiken we bij het bestuderen van uitkomsten waarbij toeval een belangrijke rol speelt. Bij die uitkomsten kan de kans uitgerekend worden. Deze uitkomsten vormen samen met hun bijbehorende kansen een kansverdeling. Met een kansverdeling wordt een kansmodel vastgelegd. Er wordt onderscheid gemaakt in discrete en continue kansmodellen. In deze aanvulling van genoemd hoofdstuk, en wel op paragraaf 4.4, wordt nóg een discrete kansverdeling besproken die gebruikt wordt voor allerlei praktische toepassingen en die in de techniek bijvoorbeeld bij productieprocessen van toepassing is.
Voorbeeld 1 Dodelijke bedrijfsongevallen: recente ontwikkelingen
1
Wim van den Berg In 2005 zijn 74 personen overleden als gevolg van een dodelijk bedrijfsongeval. Dit is het laagste aantal in de afgelopen tien jaar. Het aantal personen dat jaarlijks door een bedrijfsongeval overlijdt, schommelde in de periode 1996-2005 tussen 74 en 126. Bijna alle slachtoffers zijn mannen. Het aantal 55-plussers onder hen is relatief hoog. Bekneld raken is de meest voorkomende oorzaak van 1
Vrij bewerkt naar een onderwerp op de website http://www.cbs.nl/NR/rdonlyres/102E1AD3-E129-467D8CB5-6D078F2CC3C1/0/2006k4b15p58art.pdf
4
Statistiek voor technici
een dodelijk ongeval, gevolgd door vallen. Ruim een kwart van de slachtoffers (26) werkte in de bouwnijverheid; per honderdduizend werkenden vallen de meeste slachtoffers echter in de agrarische sector.
a. Bereken de kans op 2 dodelijke bedrijfsongevallen in de bouwnijverheid in een bepaalde week van het jaar 2005. b. Bereken de kans op meer dan 1 dodelijk bedrijfsongeval in de bouwnijverheid in een bepaalde week van het jaar 2005. We gaan deze situatie eens nader bekijken. Als we het aantal dodelijke bedrijfsongevallen in de bouwnijverheid per twee weken bijhouden, dan zal in werkelijkheid het aantal dodelijke bedrijfsongevallen per twee weken gemiddeld 1 persoon zijn. Merk op dat er weken kunnen zijn dat er niet één dodelijk bedrijfsongeval te bespeuren valt, terwijl er ook weken kunnen voorkomen met 1, 2, 3 en zelfs meer dodelijke bedrijfsongevallen. Het gemiddelde aantal dodelijke bedrijfsongevallen is 1. We verdelen nu de twee weken in 14 ⋅ 24 = 336 gelijke intervallen van één uur. Stel nu dat als er een dodelijk bedrijfsongeval plaatsvindt dit in precies één uur gebeurt. Laat k het aantal dodelijke bedrijfsongevallen in de bouwnijverheid zijn Repetitie: Gegeven een Bernoulli dat in een tijdsinterval van precies één uur plaatsvindt. experiment met succeskans p. Dat betekent dus dat er in twee weken 336 Bernoulli experimenten zijn, met de kans dat er in een zo’n De kansvariabele k is het totale aantal successen in n tijdsinterval van één uur een dodelijk bedrijfsongeval in 1 onafhankelijke uitvoeringen van de bouwnijverheid plaatsvindt 336 ≈ 0, 0030 bedraagt. dat Bernoulli experiment. Dan De kans dat er geen dodelijk bedrijfsongeval in dat hebben we geleerd dat de kansvariabele k binomiaal verdeel tijdsinterval gebeurt, is dan gelijk aan 1 – 0,0030 = is met 0,9970. Omdat de experimenten onafhankelijk zijn van n n−k elkaar en elk experiment eenzelfde kans op ‘succes’ P ( k = k ) = p k (1 − p ) heeft van 0,0030 is het aantal keren dat er een k bedrijfsongeval per uur plaatsvindt dus binomiaal verdeeld met p = 0,0030. Volgens deze binomiale verdeling met n = 336 en p = 0,0030 vinden we voor de kansen k = 0, 1, 2 3 en 3: 336 0 336 P ( k = 0) = ⋅ 0, 0030 ⋅ 0,9970 = 0,3644 0 336 1 335 P ( k = 1) = ⋅ 0, 0030 ⋅ 0,9970 = 0,3684 1 336 2 334 P ( k = 2) = ⋅ 0, 0030 ⋅ 0, 9970 = 0,1857 2 336 P ( k = 3) = ⋅ 0, 00303 ⋅ 0, 9970333 = 0, 0622 3
4.5 De Poisson-verdeling
5
Verdelen we nu een etmaal in minuten dan zijn er 14 ⋅ 24 ⋅ 60 = 20.160 gelijke intervallen van één minuut. Stel dat als er een dodelijk bedrijfsongeval plaatsvindt dit in precies één minuut gebeurt. Laat k het aantal dodelijke bedrijfsongevallen in de bouwnijverheid zijn dat in een tijdsinterval van precies één minuut plaatsvindt. Dat betekent dus dat er in twee weken 20.160 Bernoulli experimenten zijn, met de kans dat er in een zo’n tijdsinterval van één minuut een 1 ≈ 0, 00005 bedraagt. De kans dodelijk bedrijfsongeval in de bouwnijverheid plaatsvindt 20.160 dat er geen dodelijk bedrijfsongeval in dat tijdsinterval gebeurt, is dan gelijk aan 1 – 0,00005 = 0,99995. Omdat de experimenten onafhankelijk zijn van elkaar en elk experiment eenzelfde kans op ‘succes’ heeft van 0,00005 is het aantal keren dat er een bedrijfsongeval per minuut plaatsvindt dus binomiaal verdeeld met p = 0,00005. Volgens deze binomiale verdeling met n = 20.160 en p = 0,00005 vinden we voor de kansen k = 0, 1, 2 3 en 3: 20160 P ( k = 0) = ⋅ 0, 000050 ⋅ 0, 9999520160 = 0,3649 0 20160 1 20159 P ( k = 1) = = 0,3679 ⋅ 0, 00005 ⋅ 0, 99995 0 20160 ⋅ 0, 000052 ⋅ 0,9999520158 = 0,1854 P ( k = 2) = 0 20160 3 20157 P ( k = 3) = = 0, 0623 ⋅ 0, 00005 ⋅ 0,99995 0 Dit levert vier kansen op die verschillend zijn van de vorige vier. Wat nu? Uit het voorgaande blijkt echter dat er een verdeling te bedenken is die het limietgeval van de binomiale verdeling is waarbij het aantal kansexperimenten n naar oneindig gaat, wiskundig genoteerd met n → ∞ , en de kans op succes p naar 0 gaat, genoteerd als p → 0 zodat n k n−k P ( k = k ) = lim p k (1 − p ) = e − λ λk ! . Voor een bewijs raadpleeg bijlage 1. n →∞ , p → 0 k Merk op dat de Poisson-verdeling een model is voor het optreden van ‘zeldzame’ gebeurtenissen. Daarmee wordt het volgende bedoeld. Als het om gebeurtenissen in de tijd gaat, dan bedoelen we met ‘zeldzame’ gebeurtenis dat de tijd die de gebeurtenis duurt kort is in vergelijking met de hoeveelheid tijd tussen twee opeenvolgende gebeurtenissen. In voorgaand voorbeeld over het aantal dodelijke bedrijfsongevallen in de bouwnijverheid dan gebeurt zo’n ongeluk in een fractie van een seconde en dus erg klein in vergelijking met de tijd die verloopt tussen twee dodelijke bedrijfsongevallen.
4.5.1 De Poisson-verdeling Als de stochastische variabele k het totale aantal successen aangeeft in een zeer groot aantal onafhankelijke uitvoeringen n van een kansexperiment met een zeer kleine k succeskans p dan is de kans op k successen P(k = k) gelijk aan e − λ ⋅ λk ! 2, met k = 0, 1, 2, …, n.
2
Voor het bewijs van de formule wordt verwezen naar de bijlage
6
Statistiek voor technici
De verzameling uitkomsten k met de bijbehorende kansen P(k = k) vormt de kansverdeling die de Poisson-verdeling heet. Kenmerken: 1. Het experiment bestaat uit het tellen van het tellen van het aantal keer dat een zekere gebeurtenis voorkomt gedurende een gegeven tijdsinterval of een lengte-eenheid of een volume-eenheid (of gewicht, afstand of enige andere meeteenheid). 2. de kans dat een gebeurtenis voorkomt in een gegeven tijds-, oppervlakte- of volumeeenheid is voor elke eenheid gelijk 3. het aantal gebeurtenissen dat voorkomt in een tijds-, oppervlakte- of volume-eenheid is onafhankelijk van het aantal dat voorkomt in andere eenheden. 4. het gemiddelde aantal gebeurtenissen in elke meeteenheid wordt aangegeven met de Griekse letter λ. In voorgaande formule is e het grondtal van de natuurlijke logaritme met e ≈ 2,71828. Merk op dat uit de formule van de kansfunctie f(k) = P(k = k) blijkt dat de kansen in de Poissonverdeling ondubbelzinnig zijn vastgelegd door de waarde van λ. Je hoeft dus niet het aantal kansexperimenten n en de succeskans p te weten. Een Poisson-verdeling vindt haar toepassing in situaties waar het gaat om het aantal voorvallen per tijdseenheid zoals het aantal storingen per uur, het aantal verkeersongevallen per jaar, het aantal klanten dat zich meldt aan het loket, het aantal brandmeldingen per maand, het aantal telefoongesprekken per dag, het aantal tikken op de geigerteller per minuut bij meting van radioactiviteit, het aantal auto’s dat per minuut een bepaald punt van een snelweg passeert. Maar ook het aantal voorvallen per oppervlakte-eenheid of per inhoudseenheid: het aantal weeffouten per m2, het aantal paardenbloemen per are weiland, het aantal voltreffers tijdens bombardementen op Londen in de tweede wereldoorlog, het aantal bacteriën in een liter water, het aantal moleculen van stof X in een liter verontreinigde vloeistof We gaan nu een antwoord geven op de vragen a en b uit de inleiding. a. Bereken de kans op 2 dodelijke bedrijfsongevallen in de bouwnijverheid in een bepaalde week van het jaar 2005. De stochastische variabele k is het aantal dodelijke bedrijfsongevallen in 2005 in de 26 bouwnijverheid in een week. Deze is Poisson verdeeld met λ = 52 = 12 . Gevraagd wordt P ( k = 2 | λ =
1 2
)=e
− 12
⋅
12 2
2!
≈ 0,0758 = 7,58% . Het aantal experimenten is niet
belangrijk, wel de waarde van λ. b. Bereken de kans op meer dan 1 dodelijk bedrijfsongeval in de bouwnijverheid in een bepaalde week van het jaar 2005. Het gevraagde is hier
P (k > 1 | λ = − 12
1− e ⋅
10 2
0!
1 2 − 12
) = 1 − P ( k ≤ 1 | λ = 12 ) = 1 − P ( k = 0 | λ = 12 ) − P ( k = 1 | λ = 12 ) =
−e ⋅
11 2
1!
= 1 − 0,6065... − 0,30326... ≈ 0, 0902 = 9,02% .
Deze waarden kunnen ook met behulp van de tabellen in bijlage 2 gevonden worden. Nog een voorbeeld:
7
4.5 De Poisson-verdeling
Voorbeeld 2 Een receptioniste van een bedrijf ontvangt gemiddeld per uur twintig telefoontjes. Wat is de kans dat ze in een kwartier minder dan vijf telefoontjes ontvangt.
Uitwerking Het aantal telefoontjes k dat de receptioniste in een kwartier ontvangt mag als Poisson verdeeld beschouwd worden met λ = 5. Gevraagd wordt 1 4 50 −5 5 −5 5 P ( k < 5 | λ = 5 ) = P ( k = 0 ) + P ( k = 1) + ... + P ( k = 4 ) = e +e + ... + e ≈ 0, 4405 0! 1! 4! −5
Met de tabel uit bijlage 2 vinden we de uitkomst direct.
4.5.2 De tabel van de Poisson-verdeling Met de formule voor de Poisson-verdeling is de tabel voor verschillende λ- en k-waarden te maken. Deze is in bijlage 2 terug te vinden, één voor de enkelvoudige k-waarden en één voorde cumulatieve waarden van k. Het opzoeken van P ( k = 3 | λ = 2 ) gaat als volgt. Raadpleeg de tabel met de verdeling voor enkelvoudige waarden van k, zie de hier navolgende tabel. 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0,0000
P (k = 3| λ = 2) =
0
1
2
3
4
5
6
7
8
e −2 ⋅
23 3!
≈ 0 ,1 8 0 4
9
k= 0 1 2 3 4 5
λ = 0,1
λ = 0,2
λ = 0,3
λ = 0,4
λ = 0,5
λ = 0,6
0,9048 0,0905 0,0045 0,0002 0,0000 0,0000
0,8187 0,1637 0,0164 0,0011 0,0001 0,0000
0,7408 0,2222 0,0333 0,0033 0,0003 0,0000
0,6703 0,2681 0,0536 0,0072 0,0007 0,0001
0,6065 0,3033 0,0758 0,0126 0,0016 0,0002
0,5488 0,3293 0,0988 0,0198 0,0030 0,0004
k= 0 1 2 3 4 5 6 7 8 9
λ = 0,7
λ = 0,8
λ = 0,9
λ = 1,0
λ = 1,5
0,4966 0,3476 0,1217 0,0284 0,0050 0,0007 0,0001 0,0000 0,0000 0,0000
0,4493 0,3595 0,1438 0,0383 0,0077 0,0012 0,0002 0,0000 0,0000 0,0000
0,4066 0,3659 0,1647 0,0494 0,0111 0,0020 0,0003 0,0000 0,0000 0,0000
0,3679 0,3679 0,1839 0,0613 0,0153 0,0031 0,0005 0,0001 0,0000 0,0000
0,2231 0,3347 0,2510 0,1255 0,0471 0,0141 0,0035 0,0008 0,0001 0,0000
λ =2 0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002
Zo zoek je P ( k = 3 | λ = 2 ) op! Zoek op λ = 2 en hetzelfde deel van de tabel k = 3. Op het kruispunt van beide waarden vind je P ( k = 3 | λ = 2 ) = 0,1804.
8
Statistiek voor technici
Voor de uitkomst van P ( k ≤ 3 | λ = 2 ) raadpleeg je de tabel met de verdeling voor cumulatieve waarden van k. In de hiernavolgende figuur staat een deel van de tabel die aangeeft hoe je de bijbehorende waarde vindt: 0,8571. k = 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
λ = 0,9
λ = 1,0
λ = 1,5
λ = 2,0
λ = 2,5
λ = 3,0
λ = 3,5
λ = 4,0
0,4066 0,7725 0,9371 0,9865 0,9977 0,9997 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,3679 0,7358 0,9197 0,9810 0,9963 0,9994 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,2231 0,5578 0,8088 0,9344 0,9814 0,9955 0,9991 0,9998 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,1353 0,4060 0,6767 0,8571 0,9473 0,9834 0,9955 0,9989 0,9998 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0,0821 0,2873 0,5438 0,7576 0,8912 0,9580 0,9858 0,9958 0,9989 0,9997 0,9999 1,0000 1,0000 1,0000 1,0000
0,0498 0,1991 0,4232 0,6472 0,8153 0,9161 0,9665 0,9881 0,9962 0,9989 0,9997 0,9999 1,0000 1,0000 1,0000
0,0302 0,1359 0,3208 0,5366 0,7254 0,8576 0,9347 0,9733 0,9901 0,9967 0,9990 0,9997 0,9999 1,0000 1,0000
0,0183 0,0916 0,2381 0,4335 0,6288 0,7851 0,8893 0,9489 0,9786 0,9919 0,9972 0,9991 0,9997 0,9999 1,0000
Zo zoek je P ( k ≤ 3 | λ = 2 ) op! De kans kan ook berekend worden met de tabel van de verdeling voor enkelvoudige waarden van k:
P ( k ≤ 3 | λ = 2 ) = P ( k = 0 ) + P ( k = 1) + ... + P ( k = 3) = 0,1353 + 0, 2707 + ... + 0,1804 = 0,8571.
Ook kan de kans berekend worden door toepassing van de formule P ( k = k ) = e − λ ⋅ λk ! . k
1 3 20 −2 2 −2 2 P ( k ≤ 3 | λ = 2) = e +e + ... + e ≈ 0,8571 0! 1! 3! −2
Opgaven
1. Het aantal computerstoringen van één computer per week k is een stochastische variabele die een Poisson-verdeling volgt. Het gemiddeld aantal storingen per week is gelijk aan 3. Wat is de kans dat deze computer gedurende twee weken geen enkele storing vertoont? 2. Het aantal ongevallen per dag op een bepaald wegvak is Poisson verdeeld met een gemiddelde van 2 per maand. a. Bereken de kans dat er precies 4 ongevallen plaatsvinden in een maand. b. Bereken de kans dat er meer dan 2 ongevallen plaatsvinden in een maand. c. Bereken de kans dat er minder dan 3 ongevallen plaatsvinden in een periode van twee manden. 3. In een productiebedrijf worden metalen platen bewerkt, waarbij fouten kunnen optreden. Gebleken is dat bij dit bewerkingsproces één fout optreedt per m2. Wat is de kans dat een bewerkte plaat van 1,5 bij 2 m maximaal één fout heeft.
4.5 De Poisson-verdeling
9
4.5.3 De verwachtingswaarde en de variantie van de Poisson verdeling We hebben al gezien dat de Poisson-verdeling de plezierige eigenschap heeft dat je niet precies hoeft te weten hoe groot het aantal experimenten is en hoe groot de succeskans is. Daarnaast heeft de Poisson-verdeling nog twee opvallende eigenschappen:
Als k Poisson verdeeld is met parameter λ, dan is de verwachtingswaarde van een Poisson-verdeling is gelijk aan λ, E(k) = λ en de variantie is eveneens gelijk aan λ, Var(k) = λ. Voor de standaardafwijking geldt dan σ = λ Opmerking: Omdat de verwachtingswaarde, het theoretische gemiddelde, bij de Poissonverdeling gelijk is λ wordt in de literatuur het symbool λ vaak vervangen door het symbool µ. Voor een bewijs van de formules voor E(k) en Var(k) verwijzen we je naar bijlage 3. In opgave 1 en 3 is zonder dat we het weten gebruik gemaakt van een belangrijke eigenschap van kansvariabelen die Poisson verdeeld zijn en wel de volgende eigenschap:
Als k en l twee onderling onafhankelijke kansvariabelen zijn die Poisson verdeeld zijn met parameters λ1 en λ2 dan is de som van de beide kansvariabelen s = k + l weer een Poisson verdeelde kansvariabele met parameter λs = λ1 + λ2; bewijs, zie bijlage 4. In opgave 1 was k het aantal computerstoringen van één computer per week met parameter λ = 3. Het gevraagde had betrekking op het aantal storingen in twee weken dus s = k1 + k2 met parameter λs = 6. In opgave 3 was sprake van k = het aantal fouten per m2 met parameter λ = 1. Het gevraagde had betrekking op een plaat van 1,5 bij 2 m. Deze plaat is opgebouwd uit 12 platen van ¼ m2 met elk een gemiddelde van ¼ fout. Dan s = k1 + k2 + … + k11 + k12 met parameter λs = 3. In het nu volgende voorbeeld komt een andere situatie aan de orde waarin eveneens gebruik gemaakt wordt van de hiervoor genoemde eigenschap.
Voorbeeld 3 Twee personen gebruiken een lasapparaat van hetzelfde merk en van hetzelfde type. Beide personen moeten statisch belaste constructies lassen. Bindingsfouten zijn dan niet toegestaan. Uit ervaring gebaseerd op de techniek van ultrasoon onderzoek is gebleken dat persoon A gemiddeld 0,05 fouten per uur maakt terwijl persoon B 0,1 fouten per uur maakt. Als beide personen gedurende acht werkuren aan een constructie werken, bepaal dan de kans dat ze samen meer dan 2 fouten gedurende die acht uur maken. Analyse: kA = het aantal lasfouten dat persoon A per uur maakt ~ Poisson (λ = 0,1) verdeeld; kB = het aantal lasfouten dat persoon B per uur maakt ~ Poisson (λ = 0,2) verdeeld; kA+B = het aantal lasfouten dat beide personen samen in 8 uur maken ~ Poisson (λ = 8∗(0,05 + 0,1) = 1,4) verdeeld. Gevraagd: P(kA+B > 2)
10
Statistiek voor technici
Oplossing: P(kA+B > 2) = 1 – P(kA+B ≤ 1) = 1 – 0,5918 = 0,4082. Opgaven
4. Op het bedrijfsterrein van een bedrijf staan drie fabrieken aangeduid met A, B en C. In alle drie fabrieken staat een volledig geautomatiseerde productiestraat. In fabriek A treedt per 4 uur gemiddeld 1 storing op in de productiestraat, terwijl dat in fabriek B en C gemiddeld respectievelijk 2 en 3 storingen zijn. a. Hoe groot is de kans dat op een dag (= 8 werkuren) meer dan 3 storingen optreden in fabriek A? b. Hoe groot is de kans dat in fabriek A en B samen precies 8 storingen optreden gedurende een werkdag? Bereken deze kans op twee manieren en wel: b1. door alle mogelijke combinaties te bepalen die samen 8 storingen opleveren en daarvan de kansen te bepalen; b2. door gebruik te maken van de hiervoor genoemde eigenschap voor de som van onafhankelijke Poisson verdeelde kansvariabelen. c. Hoe groot is de kans op tenminste 8 storingen in fabriek A, B en C samen op een dag?
4.5.4 De benadering van de binomiale verdeling door de Poissonverdeling In het begin van deze paragraaf is al opgemerkt dat de Poisson-verdeling gezien kan worden als een binomiale verdeling met zeer grote steekproefomvang n en zeer kleine succeskans p. Zonder bewijs melden we hier dat zeer grote steekproefomvang betekent n ≥ 20 en zeer kleine succeskans betekent np < 5. Omdat de grafisch rekenapparaten en de softwarepakketten voldoende krachtig zijn, hoeft er minder van benaderingen gebruik gemaakt te worden. Een goede reden echter om een discrete kansverdeling te benaderen met een andere discrete kansverdeling is het rekenwerk. Het kan een aanzienlijke besparing aan rekenwerk geven en toch een redelijk nauwkeurig resultaat opleveren. Opgaven
5. Het zaak in elektronische apparatuur verkoopt TV toestellen van een bepaald type. Het aantal dat men dagelijks verkoopt mag als een Poisson-verdeling beschouwd worden met parameter 1,8. Op maandagmiddag vindt de bevoorrading plaats terwijl de zaak op zondag sluit. Hoeveel toestellen moet men steeds op maandag in voorraad brengen om de komende week met 95% zekerheid direct te kunnen leveren?
4.5.5 De benadering van de Poisson-verdeling door de normale verdeling We lopen hier vast vooruit op de theorie van hoofdstuk 5, de normale verdeling, een kansverdeling die behoort tot de verzameling van continue verdelingen. Op basis van een belangrijke stelling, de centrale limietstelling, kan een discrete verdeling, in dit geval de Poisson-verdeling, benaderd worden door de normale verdeling, zoals opgemerkt een continue verdeling. De voorwaarde die hiervoor geldt is: µ ≥ 10.
11
4.5 De Poisson-verdeling
Schematisch kunnen we de verschillende benaderingen van de ene verdeling door de andere als volgt weergeven: Hypergeometrische verdeling
n ≥ 20 np ≥5 n(1 – p) ≥5
n N
< 0,10
Binomiale verdeling
p < 0,10 n ≥ 20
Poisson verdeling
µ ≥ 10 Normale verdeling
Eindtoets 1. De telefoonoproepen die in een telefooncentrale aankomen gedurende één minuut volgen een Poisson-verdeling met parameter λ = 6. Bereken in vier cijfers nauwkeurig achter de komma de kans dat in één minuut: a. Geen oproepen aankomen. b. Precies 6 oproepen aankomen. c. Minstens 7 oproepen aankomen. 2. In een zeker gebied treden aardbevingen bij benadering op volgens een Poisson-verdeling met een gemiddelde van 2 aardbevingen per maand. a. Bereken in vier cijfers nauwkeurig achter de komma de kans dat er de komende twee maanden minstens drie aardbevingen optreden. b. Wat is de kans in vier cijfers nauwkeurig achter de komma dat de eerstvolgende aardbeving minstens drie maanden op zich laat wachten? c. Bereken de kans in vier cijfers nauwkeurig achter de komma dat er de eerstkomende 4 maanden geen enkele aardbeving plaatsvindt. 3. In een bedrijf worden aan een lopende band bierflesjes gevuld. Daarbij gaat er zo nu en dan wel eens iets mis en valt er een flesje van de band. Men heeft geanalyseerd dat er gemiddeld 3 flesjes per dag van de band vallen. a. Bedenk een geschikt model waarmee het aantal flesjes beschreven dat per dag van de band valt beschreven kan worden. b. Bereken in het geval van vraag a de kans dat er op zekere dag geen flesje van de band valt. c. We weten dat er per dag 10.000 flessen over de band gaan. Bedenk in dit geval een geschikt model voor het aantal gevallen flessen per dag en bereken op basis van dit model de variantie en het verwachtingswaarde van het aantal gevallen flesjes op een dag. d. Benader door gebruik te maken van de centrale limietstelling zo goed mogelijk de kans dat er in een maand met 20 werkdagen maximaal 60 flessen van de band vallen.
12
Statistiek voor technici
Bijlage 1 – Bewijs van de formule voor de Poisson-verdeling Gegeven de binomiale verdeling k met n onafhankelijke uitvoeringen van een kansexperiment met twee mogelijke uitkomsten aangegeven met ‘succes’ en ‘geen succes’, waarvan de kans op ‘succes’ gelijk is aan p en de kans op ‘geen succes’ gelijk is aan (1 – p). De kans op k keer n n−k ‘succes’ is dan gelijk aan P ( k = k ) = p k (1 − p ) , met k = 0, 1, 2, …, n. formule 1 k Als het aantal kansexperimenten zeer groot wordt en de kans op ‘succes’ p erg klein en np, de verwachtingswaarde of het theoretische gemiddelde van de binomiale verdeling, is gelijk aan n k n−k λ, dan geldt: lim p k (1 − p ) = e − λ λk ! . n →∞ , p → 0 k Het bewijs verloopt als volgt. Omdat np = λ is p te schrijven als p = λn en is formule 1 te k n−k n n λ λ n−k schrijven als p k (1 − p ) = 1 − k k n n n n−k n 1 − λn ) ( n! λ en 1 − = = k k k ! n − k ! ( ) n (1 − λn )
n! λ k (1 − λn ) λk = = k !( n − k ) ! n k (1 − λn )k k! n
zit in de Poisson formule!
−k
n! λ λ 1 − k 1 − . n n ( n − k )! n n
formule 2
factor *
Omdat k een vast geheel getal is, geldt voor factor * k factoren n ( n − 1)( n − 2 ) ... ( n − k + 1)
n ( n − 1)( n − 2 ) ... ( n − k + 1)( n − k ) ...2 ⋅1 n! = = n ( n − k )! nk ( n − k )( n − k − 1) ...2 ⋅1 k
nk =1−
k −1 n
n n −1 n − 2 n − k + 1 k 1 1 2 k −1 1 2 = ... = 1 ⋅ 1 − 1 − ...1 − + = 1 − 1 − ... 1 − n n n n n n n n n n n λ Als n → ∞ dan gaat factor * naar 1. Ook de factor 1 − n
−k
gaat naar 1 voor n → ∞ .
λ Voor de factor lim 1 − geldt het volgende. In de wiskunde is aangetoond dat n →∞ n n
λ lim 1 + = e λ met e ≈ 2,71828; e is het getal van Euler, die een kei was in het bewerken n →∞ n van oneindige sommen, producten en breuken; van hem wordt wel gezegd dat hij rekende zoals anderen ademhaalden. n
λ −λ Dus lim 1 − = lim 1 + = e −λ . n →∞ n n n→∞ n n−k Ui t het voorgaande blijkt lim p k (1 − p ) = e − λ n →∞ , p → 0 k n
n
λk k!
13
4.5 De Poisson-verdeling
Bijlage 2 Tabel Poisson-verdeling voor enkelvoudige k-waarden: P(k = k) = e − λ ⋅ λk ! . k
0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0,0000
P (k = 3| λ = 2) =
e −2 ⋅
23 3!
0 1 2 3 4 5 6 7 8 9 k= 0 1 2 3 4 5
λ = 0,1
λ = 0,2
λ = 0,3
λ = 0,4
λ = 0,5
λ = 0,6
0,9048 0,0905 0,0045 0,0002 0,0000 0,0000
0,8187 0,1637 0,0164 0,0011 0,0001 0,0000
0,7408 0,2222 0,0333 0,0033 0,0003 0,0000
0,6703 0,2681 0,0536 0,0072 0,0007 0,0001
0,6065 0,3033 0,0758 0,0126 0,0016 0,0002
0,5488 0,3293 0,0988 0,0198 0,0030 0,0004
k= 0 1 2 3 4 5 6 7 8 9
λ = 0,7
λ = 0,8
λ = 0,9
λ = 1,0
λ = 1,5
0,4966 0,3476 0,1217 0,0284 0,0050 0,0007 0,0001 0,0000 0,0000 0,0000
0,4493 0,3595 0,1438 0,0383 0,0077 0,0012 0,0002 0,0000 0,0000 0,0000
0,4066 0,3659 0,1647 0,0494 0,0111 0,0020 0,0003 0,0000 0,0000 0,0000
0,3679 0,3679 0,1839 0,0613 0,0153 0,0031 0,0005 0,0001 0,0000 0,0000
0,2231 0,3347 0,2510 0,1255 0,0471 0,0141 0,0035 0,0008 0,0001 0,0000
λ =2 0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002
k= 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
λ =3 0,0498 0,1494 0,2240 0,2240 0,1680 0,1008 0,0504 0,0216 0,0081 0,0027 0,0008 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
λ =4 0,0183 0,0733 0,1465 0,1954 0,1954 0,1563 0,1042 0,0595 0,0298 0,0132 0,0053 0,0019 0,0006 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
λ =5 0,0067 0,0337 0,0842 0,1404 0,1755 0,1755 0,1462 0,1044 0,0653 0,0363 0,0181 0,0082 0,0034 0,0013 0,0005 0,0002 0,0000 0,0000 0,0000 0,0000
λ =6 0,0025 0,0149 0,0446 0,0892 0,1339 0,1606 0,1606 0,1377 0,1033 0,0688 0,0413 0,0225 0,0113 0,0052 0,0022 0,0009 0,0003 0,0001 0,0000 0,0000
λ =7 0,0009 0,0064 0,0223 0,0521 0,0912 0,1277 0,1490 0,1490 0,1304 0,1014 0,0710 0,0452 0,0263 0,0142 0,0071 0,0033 0,0014 0,0006 0,0002 0,0001
λ =8 0,0003 0,0027 0,0107 0,0286 0,0573 0,0916 0,1221 0,1396 0,1396 0,1241 0,0993 0,0722 0,0481 0,0296 0,0169 0,0090 0,0045 0,0021 0,0009 0,0007
≥ 19
≈ 0,1804
14
Statistiek voor technici
Tabel Poisson-verdeling voor cumulatieve k-waarden: P(k ≤ k) =
n
∑e
−λ
⋅
k =0
0,2 0,15 0,1 0,05 0
λk k!
.
P ( k ≤ 6 | λ = 5) = 0,7622 1
2
3
4
5
6
7
8
9
10 11 12 13 14
k = 0 1 2 3 4 5 6
λ = 0,1
λ = 0,2
λ = 0,3
λ = 0,4
λ = 0,5
λ = 0,6
λ = 0,7
λ = 0,8
0,9048 0,9953 0,9998 1,0000 1,0000 1,0000 1,0000
0,8187 0,9825 0,9989 0,9999 1,0000 1,0000 1,0000
0,7408 0,9631 0,9964 0,9997 1,0000 1,0000 1,0000
0,6703 0,9384 0,9921 0,9992 0,9999 1,0000 1,0000
0,6065 0,9098 0,9856 0,9982 0,9998 1,0000 1,0000
0,5488 0,8781 0,9769 0,9966 0,9996 1,0000 1,0000
0,4966 0,8442 0,9659 0,9942 0,9992 0,9999 1,0000
0,4493 0,8088 0,9526 0,9909 0,9986 0,9998 1,0000
k = 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
λ = 0,9
λ = 1,0
λ = 1,5
λ = 2,0
λ = 2,5
λ = 3,0
λ = 3,5
λ = 4,0
0,4066 0,7725 0,9371 0,9865 0,9977 0,9997 1,0000
0,3679 0,7358 0,9197 0,9810 0,9963 0,9994 0,9999 1,0000
0,2231 0,5578 0,8088 0,9344 0,9814 0,9955 0,9991 0,9998 1,0000
0,1353 0,4060 0,6767 0,8571 0,9473 0,9834 0,9955 0,9989 0,9998 1,0000
0,0821 0,2873 0,5438 0,7576 0,8912 0,9580 0,9858 0,9958 0,9989 0,9997 0,9999 1,0000
0,0498 0,1991 0,4232 0,6472 0,8153 0,9161 0,9665 0,9881 0,9962 0,9989 0,9997 0,9999 1,0000
0,0302 0,1359 0,3208 0,5366 0,7254 0,8576 0,9347 0,9733 0,9901 0,9967 0,9990 0,9997 0,9999 1,0000
0,0183 0,0916 0,2381 0,4335 0,6288 0,7851 0,8893 0,9489 0,9786 0,9919 0,9972 0,9991 0,9997 0,9999 1,0000
k = 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
λ = 5,0
λ = 5,5
λ = 6,0
λ = 6,5
λ = 7,0
λ = 8,0
λ = 9,0
λ = 10,0
0,0067 0,0404 0,1247 0,2650 0,4405 0,6160 0,7622 0,8666 0,9319 0,9682 0,9863 0,9945 0,9980 0,9993 0,9998 0,9999 1,0000
0,0041 0,0266 0,0884 0,2017 0,3575 0,5289 0,6860 0,8095 0,8944 0,9462 0,9747 0,9890 0,9955 0,9983 0,9994 0,9998 0,9999 1,0000
0,0025 0,0174 0,0620 0,1512 0,2851 0,4457 0,6063 0,7440 0,8472 0,9161 0,9574 0,9799 0,9912 0,9964 0,9986 0,9995 0,9998 0,9999 1,0000
0,0015 0,0113 0,0430 0,1118 0,2237 0,3690 0,5265 0,6728 0,7916 0,8774 0,9332 0,9661 0,9840 0,9929 0,9970 0,9988 0,9996 0,9998 0,9999 1,0000
0,0009 0,0073 0,0296 0,0818 0,1730 0,3007 0,4497 0,5987 0,7291 0,8305 0,9015 0,9467 0,9730 0,9872 0,9943 0,9976 0,9990 0,9996 0,9999 1,0000
0,0003 0,0030 0,0138 0,0424 0,0996 0,1912 0,3134 0,4530 0,5925 0,7166 0,8159 0,8881 0,9362 0,9658 0,9827 0,9918 0,9963 0,9984 0,9993 0,9997 0,9999 1,0000
0,0001 0,0012 0,0062 0,0212 0,0550 0,1157 0,2068 0,3239 0,4557 0,5874 0,7060 0,8030 0,8758 0,9261 0,9585 0,9780 0,9889 0,9947 0,9976 0,9989 0,9996 0,9998 0,9999 1,0000
0,0000 0,0005 0,0028 0,0103 0,0293 0,0671 0,1301 0,2202 0,3328 0,4579 0,5830 0,6968 0,7916 0,8645 0,9165 0,9513 0,9730 0,9857 0,9928 0,9965 0,9984 0,9993 0,9997 0,9999 1,0000
15
4.5 De Poisson-verdeling
Bijlage 3 – Het bewijs voor E(k) = λ en Var(k) = λ E(k) = λ ∞
λk
k =0
k!
∞
E ( k ) = ∑ k ⋅ P ( k = k ) = ∑ k ⋅ e −λ ⋅ k =0
=e
−λ
λ
∞
⋅∑k ⋅ k =0
k ⋅ ( k − 1)!
∞
= e −λ ⋅ λ ⋅ ∑ k =1
k
=e
λk
∞
⋅∑
−λ
k =1
( k − 1)!
λ k −1
( k − 1)!
Met reeksontwikkeling, een onderwerp uit de wiskunde waarbij een functie benaderd wordt ∞
door de som van een aantal termen, heeft men aangetoond dat
∑ ( k − 1)! = e λ , zodat k =1
E ( k ) = e −λ ⋅ λ ⋅ e λ = λ . Var(k) = λ
( )
(
We weten Var ( k ) = E k 2 − E ( k )
(
Uit voorgaande volgt E ( k )
)
2
). 2
= λ 2 . Verder geldt:
∞
λk
k =0
k!
∞
E ( k 2 ) = ∑ k 2 ⋅ P ( k = k ) = ∑ k 2 ⋅ e −λ ⋅ k =0
=e
−λ
∞
⋅∑k ⋅ 2
k =0
λ
k
k ⋅ ( k − 1)!
λ k −1
∞
= e −λ ⋅ λ ⋅ ∑ k ⋅ ∞
= e − λ ⋅ λ ⋅ ∑ ( k − 1) ⋅ k =1
λk
∞
⋅∑k ⋅ k =1
( k − 1)!
∞
( k − 1)!
k =1
=e
−λ
= e − λ ⋅ λ ⋅ ∑ ( k − 1 + 1) ⋅ k =1
λ k −1
∞
λ k −1
( k − 1)!
λ k −1
+ e − λ ⋅ λ ∑1 ⋅ ( k − 1)! ( k − 1)! k =1 =eλ
∞
= e − λ ⋅ λ ⋅ ∑ ( k − 1) ⋅ k =1 ∞
= e − λ ⋅ λ ⋅ ∑ ( k − 1) ⋅ k =1
=e
−λ
∞
λ k −1
( k − 1)!
−λ + e ⋅ λ ⋅ eλ =λ
λ ⋅λ
k −2
( k − 1)( k − 2 )!
+λ
λ k −2
⋅λ ⋅∑ + λ = e − λ ⋅ λ 2 ⋅ eλ + λ = λ 2 + λ k = 2 ( k − 2 )! 2
=eλ
( )
(
Dus Var ( k ) = E k 2 − E ( k )
)
2
= λ 2 + λ − λ 2 = λ.
λ k −1
16
Statistiek voor technici
Bijlage 4 – De som van onafhankelijke Poisson-verdeelde kansvariabelen Gegeven zijn de onafhankelijke Poisson verdeelde kansvariabelen k en l met respectievelijk de parameters λ1 en λ2. Laat s de som zijn van beide kansvariabelen met s = k + l. Dan is s opnieuw Poisson verdeeld met parameter λ1 + λ2. Bewijs: Voor elke willekeurige n gaan we P ( s = n ) bepalen. De uitkomsten van s bestaan dan uit alle mogelijke combinaties van k en l. Dus k = n, l = 0; k = n − 1, l = 1; ...; k = 1, l = n − 1; k = 0, l = n. Dan
P ( s = n ) = P ( k = n; l = 0 ) + P ( k = n − 1; l = 1) + ... + P ( k = 1; l = n − 1) + P ( k = 0; l = n ) = n
∑ P ( k = n − i; l = i ) . Vanwege de onafhankelijkheid van k en l is dit te schrijven als: i =0
n
= ∑ P ( k = n − i ) ⋅ P ( l = i ) = i =0
n
e − λ1 λ1 ⋅ e − λ2 ∑ ( n - i )! i =0 e − λ1 −λ2 n!
n-i
λ2 i i!
n n! 1 = e − λ1 ⋅ e − λ2 ∑ ⋅ ⋅ λ1n−i λ2 i i =0 i !⋅ ( n − i )! n!
n n−i i e −( λ1 +λ2 ) n ⋅ ( λ1 + λ2 ) . Dit is precies P ( s = n | λ = λ1 + λ2 ) ∑ i λ1 λ2 = n! i =0 n
Opmerking: er is een wiskundige formule die bekend staat als het binomium van Newton, die luidt ( x + y ) = n
n
n
∑ i x y i =0
i
n− i
:
4.5 De Poisson-verdeling
17
Bijlage 5 – De Poisson-verdeling met Excel 1. Bepaal P ( k = 2 | λ = 5 ) = 0,0842 We gaan ervan uit dat in cel B2 en B3 de getallen 2 respectievelijk 5 zijn ingevuld voor achtereenvolgens het aantal gunstige gebeurtenissen en de verwachtingswaarde λ. Kies functie invoegen fx en vervolgens uit de optie Statistisch de functie POISSON. De afbeeldingen hierna geven aan wat je vervolgens moet invullen. Uit de eerste afbeelding blijkt dat gebruik is gemaakt van de celverwijzingen B2 en B3 voor X en het gemiddelde. In plaats daarvan kun je ook in de invoervakjes 2 respectievelijk 5 invullen. Dan vindt de berekening echter niet plaats met de inhoud van de cellen, maar met de ‘harde’ getallen 2 en 5.
18 2. Bepaal P ( k ≤ 2 | λ = 5 ) = 0,1247 Dit gaat op vrijwel dezelfde manier:
Statistiek voor technici
19
4.5 De Poisson-verdeling
Bijlage 6 – De Poisson-verdeling met de TI-83 Om P(k = k) te bepalen met de TI-83 gebruik je het commando poissonpdf (λ, k) (=poisson cumulative probality density function) onder <2ND>
. Voorbeeld: P(k = 5| λ = 2,6). Druk op <2ND> ; kies B:poissonpdf; druk op <ENTER>; er verschijnt poissonpdf(; type in 2.6, 5 en ) en druk op <ENTER); uitkomst .0735. Om P(k ≤ k) te bepalen met de TI-83 gebruik je het commando poissoncdf (λ, k) (=poisson probability density function) onder <2ND> . Voorbeeld: P(k ≤ 5| λ = 2,6). Druk op <2ND> ; kies C:poissoncdf; druk op <ENTER>; er verschijnt poissoncdf(; type in 2.6, 5 en ) en druk op <ENTER); uitkomst .9510.
POISSONPDF(2.6, 5) .0735393591
Dit zie je in het scherm van je TI-83 in het geval van poissonpdf
POISSONCDF(2.6, 5) .9509628481
Dit zie je in het scherm van je TI-83 in het geval van poissoncdf
20
Statistiek voor technici
Uitwerkingen van de opgaven Diagnostische toets Opgave 1
a. k = het aantal patiënten dat per dag in een ziekenhuis binnenkomt tussen 10:00 en 10:30 90 uur. De bijbehorende parameter λ = 10 = 9. b. Gevraagd: P(k = 6| λ = 9) = 0,0911. c. m = het aantal patiënten dat per dag in dat ziekenhuis binnenkomt tussen 10:30 en 11:00 uur, met λm = 5,6. Gevraagd P(s < 16| λs = 9 + 5,6) = 0,6090, met s = het aantal patiënten dat per dag in dat ziekenhuis binnenkomt tussen 10:00 en 11:00 uur. d. Var(k + m). = 9 + 5,6 = 14,6. Opgave 2
a. k = het aantal uurwerken dat per werkdag verkocht wordt ~ Poisson (λ = 4) verdeeld. Het probleem kan als volgt vertaald worden: P(k5 > 20) = 1 – P(k5 ≤ 20) = 1 – 0,5591 = 0,4409. Hierbij is k5 = het aantal uurwerken dat per 5 dagen verkocht wordt ~ Poisson (λ = 5⋅4 = 20) verdeeld. b. We noemen de voorraad g. Dan moet gelden P(k5 > g ) < 0,1300. We maken een tabel g 21 22 23 24 25
P (k 5 > g ) 0,356302 0,279389 0,212507 0,156773 0,112185
Uit de tabel blijkt dat g gelijk moet zijn aan 25. Opgave 3
a. Het gemiddeld aantal storingen is gelijk aan (133⋅0 + 122⋅1 + 54⋅2 + 20⋅3 + 4⋅4 + 0⋅5) / 333 = 0,9. b. aantal storingen per dag 0 1 2 3 4 ≥5 totaal
waargenomen aantal storingen per dag 133 122 54 20 4 0 333
het verwachte aantal storingen per dag 135,4 121,8 54,8 16,4 3,7 0,8 333,0
c. De waargenomen aantallen storingen worden goed benaderd door een Poisson-verdeling.
21
4.5 De Poisson-verdeling
Opgaven 4.5.1 t/m 4.5.5 Opgave 1
Analyse: k = het aantal computerstoornissen van één computer per week ~ Poisson(λ = 3) verdeeld. Gevraagd: P(k2 = 0), waarbij k2 = het aantal computerstoornissen van één computer gedurende 2 weken ~ Poisson(λ = 6) verdeeld. Oplossing: k 0 −λ −6 −6 Gebruik de theorie P(k = k) = e ⋅ λk ! . Dus P(k2 = 0) = e ⋅ 60! = e ⋅1 ≈ 0,0025 Of via tabel P(k2 = 0| λ = 6) = 0,0025. Opgave 2
Analyse: k = het aantal ongevallen per maand op een bepaald wegvak ~ Poisson(λ = 2) verdeeld. Oplossing: a. Gevraagd: P(k = 4). −2 −λ P(k = k) = e ⋅ λk ! . Dus P(k = 4) = e ⋅ k
24 = 0,0902 . 4!
Met tabel P(k ≤ 4) – P(k ≤ 3) = 0,9473 – 0,8571 = 0,0902 (of in één keer met de de tabel van enkelvoudige waarden). b. Gevraagd: P(k > 2) = 1 – P(k ≤ 1) = 1 - P(k = 0) – P(k = 1) = 1 −2 2 0 −2 2 1 – e ⋅ + e ⋅ ≈ 1 − 0, 4060 = 0,5940 . 0! 1!
Met tabel, 1 – P(k ≤ 1) = 1 – 0,4060 = 0,5940. c. Gevraagd: P(k2 < 3), waarbij k2 = het aantal ongevallen gedurende 2 maanden op een bepaald wegvak ~ Poisson(λ = 4) verdeeld, 1 2 40 −4 4 −4 4 ≈ 0, 2381 . = P(k2 = 0) + P(k2 = 1) + P(k2 = 2) = e ⋅ + e ⋅ + e ⋅ 0! 1! 2! −4
Met tabel, P(k2 ≤ 2) = 0,2381.
Opgave 3
k = het aantal fouten per m2 ~ Poisson(λ = 1) verdeeld. λ=1 λ=1 Gevraagd: P(k1,5 X 2 ≤ 1| λ = 3). Oplossing: We lopen hier vooruit op theorie die in paragraaf 4.5.3 behandeld λ=½ λ=½ wordt: als k1 en k2 twee onafhankelijke kansvariabelen zijn die Poisson verdeeld zijn met parameters λ1 respectievelijk λ2, dan is de som k1 + k2 ook Poisson verdeeld met parameter λ1 + λ2; uit bijgaande figuur en de voorgaande eigenschap blijkt dat k1,5 X 2 , het aantal fouten op een oppervlakte van 2 bij 1½, ook Poisson verdeeld is met parameter 3. Dus P(k1,5 X 2 ≤ 1| λ = 3) = 0,1991.
22
Statistiek voor technici
Opgave 4
Analyse: kA = aantal storingen per 4 uur in de productiestraat van fabriek A ~ Poisson(λ = 1) verdeeld; kB = aantal storingen per 4 uur in de productiestraat van fabriek B ~ Poisson(λ = 2) verdeeld; kC = aantal storingen per 4 uur in de productiestraat van fabriek C ~ Poisson(λ = 3) verdeeld. Gevraagd opgave a: P(kA;8 uur > 3| λ = 2) Oplossing: = 1 – P(kA;8 uur ≤ 3| λ = 2) = 1 – 0,8571 = 0,1429 Gevraagd opgave b2: P(kA + B;8 uur = 8| λ = 6) = 0,1033 Gevraagd opgave b1: P(kA + B;8 uur = 8| λ = 6) = P([kA;8 uur = 8| λ = 2] en [kB;8 uur = 0| λ = 4]) + P([kA;8 uur = 7| λ = 2] en [kB;8 uur = 1| λ = 4]) + P([kA;8 uur = 6| λ = 2] en [kB;8 uur = 2| λ = 4]) + P([kA;8 uur = 5| λ = 2] en [kB;8 uur = 3| λ = 4]) + P([kA;8 uur = 4| λ = 2] en [kB;8 uur = 4| λ = 4]) + P([kA;8 uur = 3| λ = 2] en [kB;8 uur = 5| λ = 4]) + P([kA;8 uur = 2| λ = 2] en [kB;8 uur = 6| λ = 4]) + P([kA;8 uur = 1| λ = 2] en [kB;8 uur = 7| λ = 4]) + P([kA;8 uur = 0| λ = 2] en [kB;8 uur = 8| λ = 4]) = 0,000859⋅0,018316 + 0,003437⋅0,073263 + 0,01203⋅0,146525 + 0,036089⋅0,195367 + 0,090224⋅0,195367 + 0,180447⋅0,156293 + 0,270671⋅0,104196 + 0,270671⋅0,05954 + 0,135335⋅0,02977 = 0,100819 = 0,1033. Gevraagd opgave c: P(kA + B + C;8 uur > 8| λ = 12) = 1 – P(kA + B + C;8 uur ≤ 8| λ = 12) = 1 – 0,1550 = 0,8450. Opgave 5
Analyse: k = het aantal TV toestellen van een bepaald type dat dagelijks verkocht wordt ~ Poisson (λ = 1,8) verdeeld, dan k6 = het aantal TV toestellen van een bepaald type dat gedurende 6 dagen verkocht wordt ~ Poisson ( Het probleem kan vertaald worden met P(k ≤ k) ≥ 0,95. Omdat (λ6 = 10,8). Omdat λ6 = 10,8 ≥ 10 mag de Poisson-verdeling benaderd worden door een normale verdeling
x ~ N(µ = 10,8 en σ = k+
1 2
10,8 ) verdeeld. Dan geldt P(k ≤ k) ≈ P(x ≤ k + 12 ) ≥ 0,95. We vinden
≥ 16,21, dus k ≥ 16.
Als alternatief kunnen we de volgende tabel van kanswaarden in Excel maken en stoppen als de cumulatieve kans minimaal 95% bedraagt. k P (k ≥ k )
0 2E-05
1 0,0002
2 0,0014
3 0,0057
4 0,0173
5 0,0423
6 0,0872
7 0,1566
8 0,2502
9 0,3626
10 0,484
k P (k ≥ k )
11 0,6031
12 0,7104
13 0,7995
14 0,8682
15 0,9177
16 0,9511
17 0,9723
18 0,985
19 0,9923
20 0,9962
21 0,9982
De berekende k-waarde is dan eveneens gelijk aan 16.
4.5 De Poisson-verdeling
23
Eindtoets Opgave 1
a. k = het aantal telefoonoproepen dat in een telefooncentrale gedurende één minuut aankomt ~ Poisson (λ = 6) verdeeld. Gevraagd wordt P(k = 0) = 0,0025. b. P(k = 6) = 0,1606. c. P(k ≥ 7) = 1 – P(k ≤ 6) = 1 – 0,6063 = 0,3937. Opgave 2
a. k = het aantal aardbevingen dat per maand in een zeker gebied optreedt ~ Poisson (λ = 2) verdeeld. Gevraagd wordt P(k2 ≥ 3) = 1 – P(k2 ≤ 2) = 1 – 0,2381 = 0,7619, met k2 = het aantal aardbevingen dat per 2 maanden in een zeker gebied optreedt ~ Poisson (λ = 4) verdeeld b. Het gevraagde is P(k = 0) + P(k2 = 0) = 0,1353 + 0,0183 = 0,1537. c. Gevraagd wordt P(k4 = 0) = 0,0003, met k4 = het aantal aardbevingen dat per 4 maanden in een zeker gebied optreedt ~ Poisson (λ = 8) verdeeld. Opgave 3
a. Een geschikt model is de Poisson-verdeling. b. k = het aantal flessen dat per dag van de band valt ~ Poisson (λ = 3) verdeeld. Gevraagd: P(k = 0| λ = 3) = 0,0498 c. In dit geval is een geschikt model de Binomiale verdeling met steekproefaantal 10.000, 3 3 9997 kans op ‘succes’ p = 10.000 , met variantie Var(k) = np(1 – p) = 10.000⋅ 10.000 ⋅ 10.000 = 3 2,9991 en met verwachtingswaarde E(k) = 10.000⋅ 10.000 = 3. d. In dit geval geldt k = het aantal flessen dat in 20 dagen van de band valt ~ Binomiaal (n = 60 200.000; p = 200.000 ) verdeeld. Omdat n ≥ 20, np = 60 ≥ 5 en n(1 – p) = 199.940 ≥ 5, kunnen we de Binomiale verdeling benaderen door de normale verdeling x met µ = 60 en σ = 7,74. Rekening houdend met de continuïteitscorrectie wordt de kansvraag P(k ≤ 60| n 60 = 200.000 en p = 200.000 ) ≈ P(x ≤ 60,5| µ = 60 en σ = 7,74) = 0,5258. De kans uitgerekend met de binomiale verdeling bedraagt 0,5343.
Deze aanvulling hoort bij: Theo van Pelt & Marjo Stevens, Statistiek voor technici (ISBN 90 395 0582 9), Academic Service, Den Haag 2003. © 2007 Sdu Uitgevers bv, Den Haag; Academic Service is een imprint van Sdu Uitgevers bv Meer informatie over deze en andere uitgaven kunt u verkrijgen bij: Sdu Klantenservice, Postbus 20014, 2500 EA Den Haag, tel.: (070) 378 98 80, fax: (070) 378 97 83