7. A Poisson folyamat 1. Egy boltba független exponenciális időközönként érkeznek vevők, óránként átlagosan tíz. Legyen N (t), t ≥ 0 a vevőket számláló folyamat. a. Igaz-e, hogy N (t) Poisson-folyamat? Mi a folyamat λ intenzitása? b. A nyitás után várhatóan mennyi idő elteltével érkezik meg a harmadik vevő? Hány perc a bizonytalanság ebben a becslésben? Mennyi annak a valószínűsége, hogy a harmadik vevő fél órán belül megérkezik? c. Várhatóan hány vevő érkezik a nyitást követő 1 óra alatt? És a nyitást követő 2 és 4 óra között? Mekkora a bizonytalanság ezekben a becslésekben? d. Mi annak a valószínűsége, hogy az első 1 órában nem jön vevő? Mi annak, hogy 2 és 4 óra között nem jön vevő? Mekkora valószínűséggel fog 2 és 4 között legfeljebb 3 vevő érkezni? És 2-nél több? e. Milyen valószínűséggel fog az első órában pontosan 5, továbbá 2 és 4 között pontosan 10 vevő érkezni? f. Milyen valószínűséggel fog 2 és 3 között pontosan 5, továbbá 2 és 4 között pontosan 10 vevő érkezni? g. Tegyük fel, hogy az első órában 5 vevő érkezett érkezett. Adjuk meg a 2 és 4 óra között érkezett vevők számának feltételes eloszlását és feltételes várható értékét. Mennyi annak az esélye, hogy 2 és 4 között pontosan 10 vevő érkezik? h. Tegyük fel, hogy az első órában 5 vevő érkezett érkezett. Adjuk meg a nyitás utánni első 2 óraban érkezett vevők számának feltételes eloszlását és feltételes várható értékét. Megoldás a. A Poisson folyamatnak éppen az a definíciója, hogy olyan számláló folyamat, melynél a T1 , T2 , . . . érkezések közti idők független exponenciális változók azonos λ paraméterrel. Most az érkezések közti idő várható értéke 10 perc, tehát 1/6 óra. Ha időegységnek az órát választjuk, akkor az exponenciálisok paramétere λ = 1/E(Ti ) = 6. Egyben ez a folyamat intenzitása is. b. Az n. vevő érkezési ideje Sn = T1 + · · · + Tn Erlang eloszlást követ (n, λ) paraméterrel, hiszen az n = 1, 2, . . . és λ > 0 paraméterű Erlang eloszlás definíció szerint éppen n darab független λ paraméterű exponenciális összege. Most n = 3 és λ = 6, vagyis a várható√érték E[S3 ] = n/λ = 0.5 óra, tehát 30 perc, míg a bizonytalanság D[Sn ] = n/λ = 0.29 óra, vagyis körülbelül 17 perc. Mivel az Sn változó eloszlásfüggvénye −λt
Fn (t) = P (Sn < t) = 1 − e
n−1 X (λt)k k=0
1
k!
,
t > 0,
ezért −3
P (S3 < 0.5) = 1 − e
32 1+3+ 2
= 0.58 .
c. A folyamat intenzitása azt mutatja, hogy időegység alatt várhatóan hány érkezés történik, tehát az első kérdésre E[N (1)] = 6 a válasz. (Az érkezések közti idő átlagosan E[Ti ] = 1/λ, tehát egy egységnyi intervallumba várhatóan 1/E[Ti ] = λ ilyen időköz, vagyis λ érkezés fér bele.) Általában, egy [s, t) intervallumon bekövetkezett érkezések száma, vagyis az N (t) − N (s) növekmény Poisson eloszlást követ λ(t − s) paraméterrel. A becslés bizonytalanságát az eloszlás szórása fejezi ki, hiszen azt mutatja, hogy átlagosan mennyivel tér el az érkezések száma a várható értéktől. Mivel a Poisson eloszlás várható értéke és szórásnégyzete a paraméter, ezért E[N (t)−N (s)] = D2 [N (T )−N (s)] = λ(t−s). A jelen példában a 2 és 4 óra között érkező vevők számának √ várható értéke 6 = 2.45, illetve E[N (4) − N (2)] = 6(4 − 2) = 12, a bizonytalansága D[N ] = 2 √ D[N (4) − N (2)] = 12 = 3.46. d. Az [s, t) időintervallumban érkező vevők száma Poisson eloszlású λ(t − s) paraméterrel, tehát P (N (t) − N (s) = k) =
(λ(t − s))k −λ(t−s) e . k!
Most N (1) = N (1) − N (0) ∼ Po(6), vagyis P (N (1) = 0) = e−6 60 /0! = 0.0025. Hasonlóan N (4) − N (2) ∼ Po(12), tehát P (N (4) − N (2) = 0) = e−12 120 /0! = 0.000006, P P P (N (4) − N (2) ≤ 3) = 3k=0 P (Po(12) = k) = 3k=0 e−12 12k /k! = 0.002, P P (N (4) − N (2) > 2) = 1 − P (Po(12) ≤ 2) = 1 − 2k=0 e−12 12k /k! = 0.999. e. Amennyiben diszjunkt [s1 , t1 ) és [s2 , t2 ) intervallumokat vizsgálunk, akkor az N (t1 ) − N (s1 ) és N (t2 ) − N (s2 ) növekmények függetlenek. Ekkor P N (1) = 5, N (4) − N (2) = 10 = P N (1) = 5 P N (4) − N (2) = 10 = e−6 65 /5! · e−12 1210 /10! = 0.16 · 0.1 = 0.016 . f. Fontos észrevenni, hogy a most vizsgált intervallumok nem diszjunktak, így az N (3) − N (2) és N (4) − N (2) növekmények nem (feltétlenül) függetlenek. A probléma megkerülhető, ha bevonjuk a játékba a [3, 4) intervallumot, ami már diszjunkt a [2, 3) intervallumtól, tehát N (3) − N (2) és N (4) − N (3) már függetlenek. Így P N (3) − N (2) = 5, N (4) − N (2) = 10 = P N (3) − N (2) = 5, N (4) − N (3) = 5 = P N (3) − N (2) = 5 P N (3.5) − N (3) = 5 = e−9 95 /5! · e−9 95 /5! = 0.03 . 2
g. Mivel a vizsgált intervallumok diszjunktak, ezért az N (2) változó értékéből semmilyen információ nem szerezhető arra vonatkozóan, hogy mi fog történni a [2, 4) intervallumon. Tehát az N (4) − N (2) változónak az {N (1) = 5} esemény melletti feltételes eloszlása és a feltételes várható értéke a feltétel nélkülivel, ezeket pedig már kiveséztük a c. pontban. h. Most a vizsgált intervallumok nem diszjunktak, tehát a birtokunkban lévő információ nem dobható ki. Ismét az f. pontban bemutatott trükköt fogjuk alkalmazni: felbontjuk a teljes intervallumot két diszjunkt darabra, melyeket már könnyen le tudunk kezelni. Tudjuk, hogy az első órában 5 vevő érkezett. Az N (1) változó független a második órában érkezett vevők számától, melynek eloszlása N (2) − N (1) ∼ Po(6). A két óra alatt érkező vevők lehetséges száma 5, 6, . . . , ezek valószínűsége P N (2) = k + 5|N (1) = 5 = P N (2) − N (1) = k|N (1) = 5 = P N (2) − N (1) = k = e−6 6k /k! , k = 0, 1, . . . Tehát N (2) feltételes eloszlása N (2) ∼ Po(6) + 5, amiből a feltételes várható érték E[N (2)|N (1) = 5] = E[Po(6) + 5] = 6 + 5 = 11. 2. Tegyük fel, hogy egy adott útszakaszon N (t), t ≥ 0 Poisson folyamattal írható le az áthaladt autók száma, és óránként átlagosan 60 járművet számolhatunk meg. A statisztikai adatok szerint a magyarországi gépkocsik 20 százaléka német gyártmányú. Feltehető, hogy az egyes áthaladó autók származása független. Legyen N1 (t) és N2 (t) a német illetve nem-német autókat számláló folyamat. a. Poisson folyamat-e az N1 (t) és N2 (t) folyamat? Mi az intenzitásuk? b. Mekkora valószínűséggel fog az első 10 percben pontosan 3 német és az első 20 percben pontosan 11 nem-német autó elhaladni? c. Tegyük fel, hogy 10 perc alatt 100 német autó haladt el. Mi az ezen idő alatt elhaladt nem-német autók számának feltételes eloszlása és feltételes várható értéke? d. Tegyük fel, hogy 10 perc alatt 100 német autó haladt el. Mi az ezen idő alatt elhaladt összes autók számának feltételes eloszlása, várható értéke, szórása? e. Tegyük fel, hogy 10 perc alatt összesen 100 autó haladt el. Mi az ezen idő alatt elhaladt német autók számának feltételes eloszlása, feltételes várható értéke és feltételes szórása? Megoldás a. Az N (t) folyamat percekben kifejezett intenzitása λ = 1, hiszen egy perc alatt átlagosan 1 autó halad át. Az egyes érkezéseket egymástól függetlenül p = 0.2 valószínűséggel fogja az N1 (t), és 1 − p = 0.8 valószínűséggel az N2 (t) folyamat számlálni. Ez az N (t) folyamat p valószínűséghez tartozó Bernoulli felbontása. Ekkor N1 (t) és N2 (t) független Poisson folyamat, melyek intenzitása λ1 = pλ = 0.2 és λ2 = (1 − p)λ = 0.8. A továbbiakban a csak német, 3
vagy csak nem-német autókra vonatkozó kérdések az 1. feladatban bemutatott módszerekkel megválaszolhatóak, hiszen ezeket egymástól függetlenül tudjuk kezelni az N1 (t) illetve az N2 (t) Poisson folyamattal. b. Mivel az N1 (t) és az N2 (t) folyamat független, ezért az {N1 (10) = 3} és az {N2 (20) = 11} esemény független. Most N1 (10) ∼ Po(10 · 0.2) = Po(2) és N2 (20) ∼ Po(20 · 0.8) = Po(16). Ekkor P N1 (10) = 3, N2 (20) = 11 = P N1 (10) = 3 P N2 (20) = 11 = e−2 23 /3! · e−16 1611 /11! = 0.18 · 0.05 = 0.009 . c. A tíz perc alatt elhaladt német illetve nem-német autók száma N1 (10) és N2 (10). Mivel az N1 (t) és az N2 (t) folyamat független, ezért az N1 (10) = 100 információ eldobható, az N2 (10) változó feltételes eloszlása és feltételes várható értéke azonos a feltétel nélkülivel. Az N2 (10) változó feltétel nélküli eloszlása Po(10 · 0.8) = Po(8), várható értéke E[N2 (10)] = 8, amiből P N2 (10) = k|N1 (10) = 100 = e−8 8k /k!, k = 0, 1, . . . , E[N2 (10)|N1 (10)] = 8. Egy ROSSZ gondolatmenet a várható értékre: átlagosan az áthaladó autók 20 százaléka német. Most 100 német autó haladt át, tehát a nem-német autók száma várhatóan 400. Ez a megoldás azért rossz, mert Poisson folyamattal reprezentálva a német és nem-német autók száma független. d. A tíz perc alatt elhaladt autók száma N (10) = N1 (10) + N2 (10). Most N1 (10) = 100, tehát N (10) a 100, 101, . . . értékeket veheti fel. Felhasználva, hogy N1 (10) és N2 (10) független, kapjuk P N (10) = k + 100|N1 (10) = 100 = P N2 (10) = k|N1 (10) = 100 = P (N2 (10) = k) = e−8 8k /k! ,
k = 0, 1, . . .
Tehát N (10) feltételes eloszlása Po(8) + 100. A feltételes várható érték E[N (10)|N1 (10) = 100] = E[N1 (10)|N1 (10) = 100] + E[N2 (10)|N1 (10) = 100] = E[100] + E[N2 (10)] = 100 + 8 = 108 . d. Összesen n = 100 autó haladt el, melyek mindegyike egymásból függetlenül p = 0.2 valószínűséggel német és 1 − p = 0.8 valószínűséggel nem német. Ekkor a német autók száma binomiális eloszlást követ (n, p) paraméterrel, vagyis a feltételes eloszlás 100 P (N1 (10) = k|N (10) = 100) = 0.2k 0.8100−k , k = 0, 1, . . . , 100 . k p A binomiális eloszlás várható értéke np, szórása np(1 − p), tehát E[N1 (10)|N (10) = 100] = 100 · 0.2 = 20, √ D[N1 (10)|N (10) = 100] = 100 · 0.2 · 0.8 = 4. 4
3. Rudolf, a rénszarvas át akar kellni egy úton, ahol az autók érkezése percenkénti λ = 4 intenzitású Poisson folyamattal reprezentálható. Mivel Rudolf olyan öreg, mint maga a Mikulás, a szeme és a füle is rossz, így a forgalomtól függetlenül, véletlenszerűen rohan át az úton. a. Tegyük fel, hogy 10 másodperc alatt ér át az úton. Mekkora valószínűséggel ütik el, tehát mekkora valószínűséggel érkezik autó ezen 10 másodperc alatt? b. Tegyük fel, hogy Rudolf azért még elég ügyes ahhoz, hogy egyetlen autót kikerüljön, de ha a kritikus 10 másodpercben érkezik még egy autó, akkor már tényleg elütik. Mekkora valószínűséggel fogja megúszni a kalandot? c. Válaszoljunk az a. és b. pont kérdéseire, ha csak 30 másodperc alatt tud átvánszorogni az úton. 4. Szegedről és Makóról független exponenciális időközönként érkeznek telefonos hibabejelentések. Szegedről átlagosan 3, Makóról átlagosan 6 óránként érkezik bejelentés, és az egyes városokból érkező bejelentések függetlenek. Legyen N1 (t) és N2 (t), t ≥ 0 a Szegedről illetve Makóról származó bejelentéseket leíró Poisson folyamat, és legyen N (t), t ≥ 0 az összes bejelentést számláló folyamat. a. Adjuk meg az N1 (t) és az N2 (t) folyamat intenzitását, ha egy napot veszünk időegységnek. Poisson folyamat-e az N (t)? Ha igen, akkor mi az intenzitása? b. Várhatóan mennyi idő múlva fut be a 10. hívás? És a 10. makói hívás? Mekkora a bizonytalanság ezekben a becslésekben? c. Mennyi a 12 óra alatt befutó bejelentések számának várható értéke? Ezek közül várhatóan mennyi származik Szegedről és mennyi Makóról? Mekkora a bejelentések számának szórása városonként és összesen? d. Mekkora valószínűséggel fog 12 óra alatt 3-nál kevesebb bejelentés érkezni? Mekkora eséllyel fog ezen 12 óra alatt Makóról 5-nél több hívás történni? e. Feltéve, hogy az első napon nem jött bejelentés Makóról, várhatóan hány bejelentés fut be a második napon? Ezek közül mennyi érkezik Szegedről? f. Tegyük fel, hogy az első 12 órában 20 bejelentés érkezett Szegedről. Adjuk meg az első 24 órában történt szegedi bejelentések várható számát. Mit mondhatunk az első napon befutó összes hívások várható mennyiségéről? Mekkora valószínűséggel fog ezen 24 óra alatt pontosan 10 szegedi bejelentés érkezni? És 30? Mekkora eséllyel fog ezen 24 óra alatt összesen 30 bejelentés érkezni? Megoldás A folyamatok intenzitása azt mutatja, hogy várhatóan hány érkezés történik időegység alatt. Az intenzitások λ1 = 8 és λ2 = 4. Most N (t) két független Poisson folyamat összege, tehát szintén Poisson folyamat, melynek paramétere λ = λ1 + λ2 = 12. Átlagosan a bejelentések egyharmada származik Makóról, kétharmada Szegedről, tehát N1 (t) és N2 (t) tekinthető úgy, mint az N (t)-nek p = 2/3 valószínűséghez tartozó Bernoulli felbontása. Minden további kérdés megválaszolható az előző feladatok módszereivel. 5