Felsőbb Matematika Informatikusoknak D házi feladatok a „Sztochasztika 2” részhez 2012 tavasz Minden héten összesen egy pontot érnek a kitűzött feladatok. 1.HF: (Beadási határidő: 2012.02.14.) HF 1.1 A Műegyetem hallgatóinak a 80%-a fiú, 20%-a lány. A fiúknak 20%-a hosszú hajú, a lányoknak pedig 70%-a. Véletlenszerűen kiválasztva egy hosszú hajú műegyetemistát, mennyi a valószínűsége, hogy ő lány? megoldás: Jelöljük H-val azt az eseményt, hogy egy véletlenül választott hallgató hosszú hajú, L-lel azt, hogy lány, F -fel, hogy fiú. A Bayes tétel miatt P(L|H) =
P(L)P(H|L) = P(L)P(H|L) + P(F )P(H|F )
2 7 10 10 2 7 10 10
+
8 2 10 10
=
7 ≈ 46.67%. 15
HF 1.2 Elgurítunk egy piros dobókockát, és a dobott számot X-szel jelöljük. Ezután elgurítunk X darab zöld dobókockát, és Y -nal jelöljük a zöld kockákkal dobott számok összegét. Mennyi Y várható értéke? megoldás: Jelöljük m-mel egyetlen kockadobás eredményének várható értékét, vagyis m = 72 . A teljes várható érték tétel szerint EY
=
6 X k=1
=
P(X = k)E(Y |X = k) =
" 6 X k=1
#
6 X
P(X = k) [km] =
k=1
P(X = k) · k m = m · m =
49 77 = = 12.25 22 4
2.HF: (Beadási határidő: 2012.02.21.) HF 2.1 Egy szabályos dobókockával addig dobálunk, amíg ki nem jön egy hatos. Jelölje X az addig dobott számok összegét (az utolsónak dobott hatost nem beleértve). Számoljuk ki a.) X generátorfüggvényét, b.) X várható értékét, c.) X szórását. megoldás: Jelöljük N-nel a dobások számát, az utolsó 6-ost nem beleértve, vagyis X ∼ Geom(p = p 1 1 ) (pesszimista). Így N generátorfüggvénye gN (z) = 1−qz = 6−5z (a szokásos q = 1−p 6 jelöléssel). PN A keresett Y egy véletlen tagszámú összeg, éppen N taggal: X = i=1 Yi , ahol Y1 , Y2 , . . . függetlenek és azonos eloszlásúak, mégpedig egyenletes eloszlásúak az {1, 2, 3, 4, 5} halmazon. (Figyelem: az Yi -k tényleg az {1, 2, 3, 4, 5} halmazon egyenletesek, és nem az {1, 2, 3, 4, 5, 6}-on, mert az Yi eloszlása egy kockadobás eredményének feltételes eloszlása azon feltétel mellett, hogy az eredmény nem 6-os.) Ezek szerint az Yi -k generátorfüggvénye gY (z) = így
1 z − z6 z + z2 + z3 + z4 + z5 = , 5 5 1−z 1
a.) a véletlen tagszámú összeg generátorfüggvénye gX = gn ◦ gY , vagyis gX (z) = gN (gY (z)) =
6 − (z +
z2
1 1 = 6 . 3 4 5 +z +z +z ) 6 − z−z 1−z
b.) A várható értéket számolhatnánk a generátorfüggvény deriválásával is, de előadásról azt is tudjuk, hogy a véletlen tagszámú összegre EX = ENEYi . Esetünkben = 3, vagyis EX = 5 · 3 = 15. EN = 1p − 1 = 5, EYi = 1+2+3+4+5 5 c.) A szórást megintcsak számolhatnánk a generátorfüggvény deriváltjaiból, de előadásról azt is tudjuk, hogy D 2 X = D 2 N(EYi )2 + END 2 Yi . Esetünkben EN = 5, 2 EYi = 3, továbbá az eloszlástáblázat szerint D 2 N = pq2 = 30 és D 2 Yi = 5 12−1 = 2. √ Így D 2 X = 30 · 32 + 5 · 2 = 280, DX = 280 ≈ 16.73.
HF 2.2 Mócika, népes családjában, pilótajátékot szervez. A játék résztvevői nem túl kitartóak: minden egyes résztvevő addig próbál újabb és újabb résztvevőket beszervezni, amíg először kudarc nem éri (vagyis vissza nem utasítják), az első kudarc után viszont leáll. A kudarc valószínűsége pedig minden egyes beszervezési kísérletnél p, az előzményektől függetlenül. A játék első résztvevője Móricka, ő alkotja egyedül a nulladik generációt. Az első generációt a Móricka által (közvetlenül) beszervezettek alkotják, a második generációt az első generáció tagjai által beszervezettek, stb. Jelölje Zk a k-adik generáció tagjainak P a számát (k = 0, 1, 2, . . . ), N pedig a teljes játék össz-résztvevőszámát (vagyis N = ∞ k=0 Zk ). Válaszoljuk meg az alábbi kérdéseket I. p = II. p =
2 3 1 3
esetén, esetén:
a.) b.) c.) d.)
Mi Z2 generátorfüggvénye? Mennyi Z10 várható értéke? Mennyi a P(Z3 = 0) valószínűség? Mennyi a valószínűsége annak, hogy a játék előbb-utóbb elakad (vagyis hogy valamelyik generáció már üres)? e.) Mennyi N várható értéke? f.) Mi N generátorfüggvénye?
megoldás: Zk elágazó folyamat, amiben az egylépéses utódszám (X) – vagyis az egy résztvevő által beszervezettek száma – pesszimista geometriai eloszlású p paraméterrel: P(X = p k) = q k p (k = 0, 1, . . . ), ahol q = 1 − p. Ennek generátorfüggvénye g(z) = 1−qz , 1 várható értéke m := EX = p − 1. I. p = 32 esetén m = 12 , g(z) = a.) gZ2 (z) = g(g(z)) = 3− 2 2
2 . 3−z
3−z
1 b.) EZ10 = m10 = 1024 14 c.) P(Z3 = 0) = g(g(g(0))). Esetünkben g(0) = 23 , g( 32 ) = 67 , g( 76 ) = 15 , vagyis 14 P(Z3 = 0) = 15 . d.) Mivel m < 1, az elágazó folyamat szubkritikus, ezért P(kihalás) = 1. P P k e.) EN = ∞ EZk = ∞ k=0P k=0 m . Jelen esetben m < 1, ezért a sor felősszegez∞ 1 hető, EN = k=0 mk = 1−m = 2. f.) Előadásról tudjuk, hogy a G = gN (z) generátorfüggvény eleget tesz a G = zg(G) egyenletnek, ahol g(z) még mindig az egylépéses utódszám generátorp 2 . Meg kell tehát oldani a G = z 1−qG egyenletet függvénye, vagyis g(z) = 3−z
2
G-re. Ez átszorzás és átrendezés √után másodfokúra vezet: 0 = qG2 − G + pz, . Hogy a kettő közül melyik az igazi aminek a két megoldása G = 1± 1−4pqz 2q generátorfüggvény, azt eldönthetjük pl. a generátorfüggvéyn azon alaptulajdonsága alapján, hogy gN (0) = P(N = 0). Esetünkben N ≥ 1, mivel a játéknak Móricka személyében legalább egy résztvevője biztosan van, így gN (0) = P(N = 0) = 0, aminek a két gyök közül a „-”-os tesz eleget. Vagyis q 1 − 1 − 4 32 31 z gN (z) = . 2 31 II. p =
1 3
esetén m = 2, g(z) =
a.) gZ2 (z) = g(g(z)) =
1 . 3−2z
1 1 3−2 3−2z
b.) EZ10 = m10 = 1024 7 c.) P(Z3 = 0) = g(g(g(0))). Esetünkben g(0) = 31 , g( 31 ) = 37 , g( 73 ) = 15 , vagyis 7 P(Z3 = 0) = 15 . d.) A kihalás valószínűsége a z = g(z) egyenlet legkisebbik (nemnegatív) gyöke. (Mivel m > 1, az elágazó folyamat szuperkritikus, ezért előre tudjuk, hogy ez 1-nél kisebb. Azt is tudjuk előre, hogy z = 1 gyök lesz, mert g(1) = 1 minden generátorfüggvényre, de mi most nem ezt a gököt keressük.) Meg kell tehát 1 egyenletet. Ez átszorzás és átrendezés után másodfokúra oldani a z = 3−2z 2 vezet: 0 = 2z − 3z + 1, aminek a gyökei 21 és 1. A kihalás valószínűsége tehát ezek közül a kisebbik: P(kihalás) = 21 . P∞ P k e.) EN = P ∞ k=0 m . Jelen esetben m > 1, ezért a sor divergens, k=0 EZk = ∞ k EN = k=0 2 = ∞. Ezt persze onnan is lehetett tudni, hogy m > 1 miatt a folyamat szuperkritikus, vagyis pozitív valószínűséggel sose hal ki, vagyis pozitív valószínűséggel N = ∞. f.) Mivel m > 1, a folyamat szuperkritikus, és pozitív valószínűséggel N = ∞. Vagyis az N most elfajult, és nem is igazi val-változó. Ilyeneknek a generátorfüggvényéről nem beszéltünk, és ne is erőltessük. 3.HF: (Beadási határidő: 2012.02.28.) HF 3.1 Legyen X1 , X2 , . . . , Xn független, azonos Bernoulli eloszlású valószínűségi változók sorozata p = 12 paraméterrel (vagyis P(Xi = 1) = p = 1 − P(Xi = 0) = 12 ). Legyen n = 106 és Sn = X1 + X2 + · · · + Xn (vagyis Sn ∼ Bin(n = 106 ; p = 21 )).
a.) Ha valamilyen K ∈ (0; 106 )-ra a P(Sn < K) valószínűséget a centrális határeloszlás tétellel közelítjük, legfeljebb mekkora lehet a közelítás hibája a Berry-Esséen tétel szerint? (Vigyázat: a tétel legegyszerűbb formájában nulla várható értékű val.változókról szól, és a Bernoulli eloszlás nem ilyen.) (A Berry-Esséen tételben szereplő C konstans egy 2010-es eredmény szerint választható C = 0.4784-nek.) b.) A Hoeffding-egyenlőtlenség segítségével keressünk olyan K korlátot, amire biztosan igaz, hogy P(Sn ≥ K) ≤ 10−8 . Nevezzük ezt a K korlátot KH -nak. c.) Közelítsük a P(Sn ≥ KH ) valószínűséget a Cramer-tétel segítségével! Segítség: A p paraméterű Bernoulli eloszlás momentum-generáló függvénye M(λ) = 1 − p + peλ , ebből a Cramer féle rátafüggvény I(x) = x ln 3
1−p (1 − p)x − ln . p(1 − x) 1−x
megoldás: √ , ahol a.) A Berry-Esséen tétel szerint a normális közelítés hibája legfeljebb σ3Cρ n √ 1 6 3 2 C = 0.4784, n = 10 , σ = D Xi = 2 és ρ = E(|Xi − m| ), ahol m = EXi = 21 , vagyis ρ = 21 |0 − 12 |3 + 21 |1 − 12 |3 = 21 18 + 21 81 = 81 . Összerakva:
hiba ≤
0.4784 18 0.4784 18 √ = 4.784 · 10−4 . = 1 1 3 6 1000 ( 2 ) 10 8
b.) A Hoeffding egyenlőtlenség szerint 2t2 P(Sn ≥ ESn + t) ≤ exp − Pn 2 k=1 (bk − ak )
.
Esetünkben n = 106 , ESn = np = 5 · 105 , és mindegyik ak = 0, bk = 1. Legyen tehát KH = ESn + t = 5 · 105 + t és
2t2 2t2 10 = exp − Pn = exp − 6 . 2 10 (1 − 0)2 k=1 (bk − ak ) √ √ 2t2 4 · 106 ln 10 = 2000 ln 10 ≈ 3034.85. Ez utóbbiból −8 ln 10 = − 10 6 , vagyis t = Ezt visszaírva √ KH = 500000 + 2000 ln 10 ≈ 503034.85
−8
c.) A Cramer tétel szerint
P(
Sn ∈ (a, b)) ≈ en inf a<x
Célunk a P(Sn > KH ) valószínűség becslése, tehát ezt először a fent alakúra kell írni: KH Sn KH Sn > ) = P( ∈( , ∞)), P(Sn > KH ) = P( n n n n vagyis a Cramer tételt a = KnH ≈ 0.50303485, b = ∞-vel alkalmazzuk. Ekkor 1/2 x − ln 1−x , a > m = 12 , ezért inf a<x
KH ) ≈ e−18.42079 ≈ 0.9999 · 10−8. Vigyázat: aki menet közben meggondolatlanul kerekít, teljesen rossz eredményt kaphat. Pl. aki az a ≈ 0.50303485-öt dőre módon a ≈ 0.5-re cseréli, az 0.9999 · 10−8 helyett 12 -et kap végeredményül, ami nagyon nem mindegy. (Hát persze: P( Snn ∈ (0.5, ∞)) = P( Snn > m) ≈ 21 . Az egész történet arról szól, hogy az átlag kis valószínűséggel, de eltérhet a várható értéktől.) De még ha valaki a ≈ 0.50303485 heylett a ≈ 0.503 -tel számol, akkor is 1.52 · 10−8 -t kap végeredménynek, ami még mindig 50%-os hiba. Hát persze: nagyon nem mindeg, hogy az Sn -nek a várható értékétől való eltérése 3000, vagy 3034.85: A Cramer tétel pont azt mondja, hogy kicsit jobban eltérni is sokkal valószínűtlenebb. 4.HF: (Beadási határidő: 2012.03.06.) HF 4.1 Az 1. ábrán látható gráf egy diszkrét idejű, időben homogén Markov lánc pozitív valószínűségű egylépéses átmeneteit mutatja. Osztályozzuk az állapotokat aszerint, hogy melyik melyikkel érintkezik! Minden osztályról állapítsuk megy, hogy 4
∗ ∗ ∗ ∗
zárt-e vagy nyílt, lényeges-e vagy lényegtelen, visszatérő-e vagy átmeneti, mennyi a periódusa.
1
2
3
4
5
1. ábra. Markov lánc gráf-reprezentációja (valószínűségek nélkül) megoldás: osztály zártság {1} nyílt {2; 3} nyílt {4; 5} zárt
lényegesség lényegtelen lényegtelen lényeges
visszatérés átmeneti átmeneti visszatérő
periódus ∞, vagy nincs 2 1, aperiodikus
Édemes hangsúlyozni, hogy az {1} egy tisztességes egyelemű osztály: önmagával definíció szerint minden állapot kommunkiál, még akkor is, ha pozitív lépésszámban nem lehet oda önmagából (sem) visszajutni. Másképp mondva: az i ! j reláció („i kommunikál j-vel”) egy rendes ekvivalencia, és a belőle adódó osztályozásnak az állapottér minden elemét le kell fedni. Az más kérdés, hogy az {1} osztály periódusa problémás: az üreshalmaz legnagyobb közös osztója, ami ízlés szerint lehet ∞, vagy nem definiált.
HF 4.2 John megfigyelései szerint reggelente, amikor Londonban munkába autózik, háromféle lehet az időjárás: esik, zuhog vagy szakad. Tapasztalata szerint egy nap időjárásából következtetni lehet a következő nap időjárására, az alábbi valószínűségi értelemben: P(holnap esik|ma esik) = 1/10, P(holnap szakad|ma esik) = 6/10, P(holnap esik|ma szakad) = 2/10, P(holnap szakad|ma szakad) = 4/10, P(holnap szakad|ma zuhog) = 5/10, P(holnap zuhog|ma zuhog) = 4/10. Jelöljük az időjárás állapotait számokkal: 0 := „esik”, 1 := „zuhog”, 2 := „szakad”. Modellezzük John reggeli megfigyeléseinek sorozatát időben homogén Markov lánccal! a.) Írjuk fel a P Markov átmenet-mátrixot. (Vigyázat: a fenti átmenet-valószínűségek összevissza vannak megadva.) b.) Feltéve, hogy elsején esik, mi a valószínűsége a „00012” megfigyelés-sorozatnak (elsejével kezdve)? c.) Feltéve, hogy elsején esik, mi a valószínűsége, hogy harmadikán zuhog? d.) Feltéve, hogy elsején esik, mi a közelítő valószínűsége, hogy huszonkilencedikén zuhog? 5
e.) Hoszzú távon a reggelek hány százalékán zuhog? f.) Ha esik, John 20 percet autózik dugóban, ám ha zuhog, akkor 30-at, ha szakad, akkor pedig 70-et. Napi átlagban hány percet tölt reggeli dugóban autózással hosszú távon? megoldás: a.) A 0, 1, 2 állapotokat rendre a mátrix 1., 0.1 P = 0.1 0.2
2. ill, 3. sorához és oszlopához rendelve 0.3 0.6 0.4 0.5 0.4 0.4
b.) P(00012|X0 = 0) = P00 P00 P01 P12 = 0.1 · 0.1 · 0.3 · 0.5 = 0.0015 c.) 0.3 2 (P )01 = 0.1 0.3 0.6 0.4 = 0.03 + 0.12 + 0.24 = 0.39 0.4
d.) A 28 nap elteltével kialakuló valószínűségeket közelítsük a Markov lánc stacionárius eloszlásával! Ehhez a πP = π lineáris egyenletrendszert kell megoldani, ahol a π háromelemű sorvektor tartalmazza a stacionárius eloszlást. Átrendezés után (P T − I)π T = 0, ahol I a 3 × 3-as egységmátrixot, 0 pedig a három nullából álló oszlopvektort jelöli. A lineáris egyenletrendszerek szokásos mátrix-jelölésével −0.9 0.1 0.2 0 0.3 −0.6 0.4 0 . 0.6 0.5 −0.6 0 Ezt persze eliminációval oldjuk meg. Egy sor kiesik, ahogy kell, és a végén (pl.) az marad, hogy 16 1 0 − 51 0 , 42 0 1 − 51 0 T vagyis az egyenletrendzser egyik megoldása a 16 42 51 vektor. A stacionárius eloszlás ennek valószínűségi vektorrá normált változata (ahol az elemek összege 1), vagyis 16 42 51 π = 109 109 109 . Végül a feladat kérdésére a válasz:
P(X29 = 1|X1 = 0) ≈ π1 =
42 ≈ 0.38532 109
e.) A Markov láncunk véges állapotterű, irreducibilis és aperiodikus, ezért az ergodtétel szerint hosszú távon az 1-es állapot bekövetkezési gyakorisága majdnem biztosan tart a stacionárius eloszlás szerinti valószínűséghez: 1 42 #{k : 1 ≤ i ≤ n és Xk = 1} = π1 = ≈ 0.38532 n→∞ n 109 lim
f.) Jelölje S = {0; 1; 2} az állapotteret és legyen f : S → R a dugóban töltött percek száma az állapot függvényében: 20, ha i = 0 f (i) = 30, ha i = 1 , 70, ha i = 2 6
ami helyett elég egy oszlopvektort leírni: 20 f = 30 . 70
Az ergodtétel szerint f időátlaga majdnem biztosan tart a stacionárius eloszlás szerinti sokaságátlaghoz. Sokféle különböző jelöléssel leírva ugyanazt: Z n X 20 1X lim f (Xk ) = fd π = πi f (i) = πf = π0 π1 π2 30 n→∞ n i∈S k=1 70 S 5150 ≈ 47.248 = 20π0 + 30π1 + 70π2 = 109 5.HF: (Beadási határidő: 2012.03.13. Mivel cselesnek bizonyult, segítség után módosított határidő: 2012.03.20.) HF 5.1 Egy lépcsőházban 3 villanykörte van folyamatosan felkapcsolva. Mindegyik kiég időnként, mégpedig exponenciális eloszlású véletlen idő elteltével, 1 rátával. (Az időt években mérjük, vagyis a körték átlagosan egy évig bírják.) Szintén véletlen időközönként, szintén 1 rátával arra jár a gondnok, és az összes kiégett körtét jóra cseréli. Jelölje Xt a t-kor világító égők számát. Xt folytonos idejű Markov lánc. a.) Írjuk fel Xt infinitezimális generátorát! b.) Adjuk meg a folytonos idejű Markov lánc λ ráta-vektorát (vagyis az egyes állapotokból történő elugrás rátáit), és a beágyazott diszkrét idejű Markov lánc Q átmenetmátrixát! c.) Mi Xt stacionárius eloszlása? d.) Hosszú távon az idő mekkora hányadában van a lépcsőházban töksötét (vagyis nem világít egy égő se)? e.) Egy működő villanykörte villanyszámlája időegységenként (évente) 1 batka. Mennyi az összes égő egy évre eső átlagos villanyszámlája hosszú távon? f.) Feltéve, hogy t = 0-kor mindhárom égő működött, mi annak a valószínűsége, hogy t-kor is mind működik? Ezt elvileg mindenki ki tudja számolni, de megelégszem azzal, ha megadjátok ennek a függvénynek (P(Xt = 3|X0 = 3)-nak) a határértékét és az ahhoz jövő fő hibatag nagyságrendjét. megoldás: a.) Az állapottér S = {0, 1, 2, 3}, feleljen meg a 0, 1, 2, 3 állapotoknak rendre a mátrix 1., 2., 3., 4. sora és oszlopa. A generátor −1 0 0 1 1 −2 0 1 , A= 0 2 −3 1 0 0 3 −3
mert felfelé csak közvetlenül a 3 állapotba lehet ugrani, mindenhonnan 1 rátával, lefelé viszont mindig csak egyszerre 1-et lehet ugrani, és a lefelé ugrás rátája arányos a működő égők számával: ha minden égő kiégésének rátája külön-külön 1, akkor két égő egyikének kiégési rátája 2.
7
b.) A generátor alapján λ = (1 2 3 3),
0 0 0 1 1/2 0 0 1/2 Q= 0 2/3 0 1/3 . 0 0 1 0
c.) A stacionárius eloszlás π = (π0 π1 π2 π3 ) a πA = (0 0 0 0) egyenlet megoldása, vagyis AT π T = 0. A transzponálás nagyon fontos! Kiírva −1 1 0 0 0 0 −2 2 0 0 0 0 −3 3 0 1 1 1 −3 0
Ennek megoldása az (1 1 1 1) vektor. (Megjegyzés: ezt számolás helyett onnan is lehet látni, hogy az AT mátrixnak minden sorösszege nulla. Vagyis ebben az A mátrixban tökvéletlenül nem csak a sorösszegek, hanem az oszlopösszegek is nullák, ezért tökvéletlenül nem csak jobboldali sajátvektor a konstans vektor a 0 sajátértékhez, hanem baloldali is.) Ezt lenormálva π = ( 14 41 14 41 ). d.) Az ergodtétel szerint az időátlag egyenlő a stacionárius eloszlás szerinti valószínűséggel, vagyis π0 = 14 . e.) Az f (i) = i függvény időátlagát kell számolni. Az ergodtétel szerint f időátlaga majdnem biztosan tart a stacionárius eloszlás szerinti sokaságátlaghoz. Sokféle különböző jelöléssel leírva ugyanazt: 0 ZT Z X 1 1 lim f (Xt )d t = fd π = πi f (i) = πf = π0 π1 π2 π3 2 n→∞ T i∈S 0 S 3 = 0π0 + 1π1 + 2π2 + 3π3 = 1.5 f.) A határérték a stacionárius eloszlás szerinti valószínűség, vagyis π3 = 41 . Az ehhez jövő korrekciós tagok const eρi t alakúak, ahol a ρi -k a generátor nullától különböző (negatív) sajátérékei. ezek közül a főtag a legnagyobb sajátértékhez (vagyis: legkisebb abszolút értékű negatív sajátértékhez) tartozó. A konkrét esetben A sajátértékei 0, −2, −3 és −4, vagyis a legnagyobb negatívsajátérték a −2. Így P(Xt = 3 | x0 = 3) = P3 3 (t) ≈ 14 + conste−2t . Megjegyzés: Ha a konkrét példát részletesen végigszámoljuk a P (t) = exp(tA) mátrix-exponenciális kiszámolásával, akkor kiderül, hogy a P33 (t) elemben az e−2t „fő korrekciós tag” együtthatója véletlenül pont nulla, így a tényleges korrekció nagyságrendje a fenti egyszerű számolásból kijövőnél kisebb. A pontos t-idejű átmenetmátrix 1 1 1 1 6 −6 0 0 1 1 1 1 1 + e−2t 1 2 −2 0 0 P (t) = 4 1 1 1 1 4 −2 2 0 0 1 1 1 1 −6 6 0 0 −4 8 −4 0 1 −3 3 −1 1 −4 8 −4 0 + e−4t 1 1 −3 3 −1 . + e−3t 0 0 0 4 0 4 1 −3 3 −1 8 −16 8 0 −3 9 −9 3 8
6.HF: („bónusz feladatsor” +1 pontért. Beadási határidő: 2012.03.20.) HF 6.1 9-elemű mintát vettünk az X valószínűségi változóból, ami (optimista) geometriai eloszlású, számunkra ismeretlen p paraméterrel. Ezt kaptuk: 1, 8, 7, 11, 6, 5, 6, 7, 4, 3. Adjunk maximum likelyhood becslést p-re! A feladatot az is számolja rendesen végig, aki tudja, hogy mi fog kijönni. megoldás: A feladatba hiba csúszott, mert a felsorolt minta nem 9, hanem 10-elemű :(. Úgyhogy 10-elemű mintával számolok. Legyen a szokásos jelöléssel q = 1 − p, a megfigyelt adatsor pedig x1 , x2 , . . .Q xn , és n = 10. A likelyhood-függvény L(p) = P(X1 = x1 , X − 2 = x2 , . . . Xn = xn ) = ni=1 q xi −1 p. Ennek a logaritmusa, a log-likelyhood-függvény " n # n X X l(p) = [(xi − 1) log q + log p] = log(1 − p) xi − n + n log p. i=1
i=1
Ennek, mint p függvényének keressük a maximumát, amihez megnézzük, hol nulla a deriváltja: n −1 X n ′ 0 := l (p) = xi + , 1 − p i=1 p amit megoldva
n p = Pn
i=1
xi
,
ez lesz a maximum likelyhood becslés. A konkrét példában p=
10 10 = = 0.17 1 + 8 + 7 + 11 + 6 + 5 + 6 + 7 + 4 + 3 58
Megjegyzés: Hát persze, p jelentése valószínűség, ennek a maximum likelyood becslése pedig a bekövetkezési gyakoriság, és esetünkben a „siker” 10-szer következett be 58 kísérletből. HF 6.2 Egy műszer hosszúságot mér µm-ben. A mérés hibájáról tudjuk, hogy normális eloszlású: hiba ∼ N (m, σ 2 ), sőt a szórásnégyzet is ismert: σ 2 = 2. A gyártó pedig azt állítja, hogy m = 0. Ennek ellenőrzésére 6 próbamérést végeztünk pontosan ismert hosszúságokon, és a következő hibákat kaptuk (µm-ben): 0.5; 0.7; −0.9; −0.4; 0.01; 1.1. Döntsünk 99%-os konfidenciaszinten (vagyis ε = 0.01) arról a hipotézisről, hogy a gyártó igazat állít. megoldás: Egymintás u-próbát végzünk kétoldali ellenhipotézissel. A nullhipotézis: H0: m = 0. Az ellenhipotézis: H1: m 6= 0. A próbastatisztika u=
x¯ − µ √ 0.1683 − 0 √ √ n= 6 = 0.292 σ 2
A korlát, amivel ezt össze kellhasonlítani ε K = Φ−1 (1 − ) = Φ−1 (0.995) = 2.575 2 Döntés: |u| < K, ezért a nullhipotézist elfogadjuk.
9