FELTÉTELES VALÓSZÍNŰSÉG, TELJES VALÓSZÍNŰSÉG TÉTELE, BAYES TÉTELE 1. Egy alkalmassági vizsgálat adatai szerint a vizsgált személyeken 0,05 valószínűséggel mozgásszervi és 0,03 valószínűséggel érzékszervi rendellenesség figyelhető meg. Az együttes előfordulás valószínűsége 0,01. a) Mennyi a valószínűsége annak, hogy egy találomra kiválasztott személyen egyik rendellenesség sem figyelhető meg? b) Mekkora lenne az együttes előfordulás valószínűsége, ha a két rendellenesség előfordulása független lenne? c) Mekkora valószínűséggel találunk érzékszervi rendellenességet a mozgásszervi rendelleneséggel rendelkező egyéneknél és fordítva: mekkora a mozgásszervi rendellenesség valószínűsége feltéve, hogy az egyén rendelkezik érzékszervi rendellenességgel? 2. Az I. kontingenciatáblázat a tüdőrák és a dohányzás, mint rizikófaktor kapcsolatát leíró vizsgálat adatait tartalmazza. Tekintsük az események (közelítő) valószínűségeinek megfelelő relatív gyakoriságokat. a) Fejezzük ki ennek megfelelően esetszámokkal a P(C│S) és P(C│S ) feltételes valószínűségeket, illetve a P(C S) hányadosként definiált relatív kockázatot. b) Mennyi lenne a relatív P(C S) kockázat, ha a tüdőrák a dohányzástól függetlenül alakulna ki? c) Milyen esetben lenne a relatív kockázat kisebb egynél? S C 1350 1296 C I. kontingenciatáblázat S: dohányos C: tüdőrákos
S 7 61
A
A 4 10
B 9 B II. kontingenciatáblázat A: a vizsgált személy A vércsoportú B: a vizsgált személy férfi
3. A II. kontingenciatáblázat hiányos. Egészítsük ki úgy, hogy a relatív gyakoriságok a vércsoport és a nem függetlenségét tükrözzék! 4. A III. kontingenciatáblázat egy új gyógyszer bevezetésével kapcsolatos vizsgálatok eredményeit tartalmazza. A betegek egy része az új gyógyszert kapta, másik része placebót. a) Mi a valószínűsége (a relatív gyakoriságokkal a valószínűségeket egyenlőnek tekintve), hogy valaki meggyógyul, ha gyógyszert illetve ha placebót kap? b) Mekkora a gyógyulás valószínűsége az egész betegmintában? c) Egy véletlenszerűen kiválasztott gyógyult beteg milyen valószínűséggel volt a placebóval illetve az új gyógyszerrel kezelt csoportban? K K G 742 31 58 49 G III. kontingenciatáblázat K: új gyógyszert kapott K : placebót kapott G: gyógyult
F1 F2 F3 1000 100 össz. 100 71 632 23 H 3 24 4 M IV. táblázat össz: a csoport összlétszáma H: gyógyultak száma M: mellékhatás jelentkezett
F4 100 9 2
1
5. Készíts egy kontingenciatáblázatot, ami a kezelés hatástalanságát tükrözi! 100 emberből 80-at egy új gyógyszerrel, 20-at placebóval kezeltek, mindkét csoportban 30% gyógyult. 6. Az előbbihez hasonló vizsgálatban 4 csopotra osztották a betegeket: régi gyógyszert (F1), új gyógyszert (F2), placebót (F3), illetve semmit sem (F4) kaptak. A kísérlet célja a kezelés hatásosságának (H) és egy lehetséges mellékhatás (M) veszélyének a vizsgálata. (Hasonló jellegű, kezeletlen kontrollt is figyelembe vevő hosszútávú vizsgálatot végeznek az USA-ban az idős nők csontritkulás elleni hormonkezelése és a mellrák, mint lehetséges mellékhatás összefüggéseinek vizsgálatára. Az itt felhasznált adatok fiktívek.).A IV. táblázat adatai alapján becsüljük meg a következő valószínűségeket: P(H F1 ), P(H F2 ), P(H F3 ), P(H F4 ), P(F1 H), P(F2 H), P(F2 M), P(F4 M)! Abból, hogy P(F1 H) < P(F2 H) következik-e, hogy az új gyógyszer jobb mint a régi? Az új gyógyszer használata tényleg növeli a káros mellékhatásként feltételezett jelenség (pl. mellrák) kialakulásának esélyét? 7. A feniltiokarbamid keserű ízének érzékelését a T, t betűkkel jelzett allélpár határozza meg: a TT és Tt genotípusú egyének a vegyület keserű ízét érzik, a tt genotípusúak nem. Egy nem ízérző egyén szülei ízérzők, testvérének felesége pedig nem ízérző. a) Mekkora a valószínűsége annak, hogy a testvér illetve annak gyermeke ízérző? b) Az először említett egyén egy másik tesvérének férje ízérző. Ennek a férjnek a szüleiről nem tudunk semmit, de tudjuk, hogy a populációban 19% TT, 50% Tt és 31 % tt. Ennek a másik testvérnek és férjének gyermeke milyen valószínűséggel lesz ízérző? 8. A vérzékenység X kromoszómához kötött recesszív betegség. X+ és Xv legyen a vad és a mutáns típusú allélt hordozó X kromoszómák jele. Vérzékenyek tehát az XvXv és XvY genotípusú egyének. Egy családban a feleség anyai nagyapja vérzékeny volt, más senki. a)Milyen valószínűséggel lesz ennek az asszonynak az első gyermeke vérzékeny? Ha tudjuk, hogy ennek az asszonynak az első gyermeke vérzékeny fiú, milyen valószínűséggel lesz a második gyermek vérzékeny? b)Egy másik családban a feleség apai nagyapja vérzékeny, más nem. Válaszoljunk ugyanarra a két kérdésre, figyelembe véve, hogy Xv gyakorisága a populációban 0,001. 9. Recesszív autószómás betegségben szenvednek az I. pedigrén sötéttel jelölt egyének. a) 7. és 8. egyének tervezett gyermeke(10.) milyen valószínűséggel lesz beteg illetve hordozó? b) Mi a valószínűsége, hogy a 4. egyén hordozó annak ismeretében, hogy egyrészt a populációban a káros allél gyakorisága 0,053, másrészt született két egészséges gyermeke (mint a pedigrén jelöltük).Változik-e ez a valószínűség, ha születik még egy egészséges fenotípusú gyermeke (amely a pedigrén nincs feltüntetve)? (Hardy-Weinberg egyensúlyt feltételezünk.) 1
2
3
4 ?
AB
0
AA
1
2
3
5
A0
AB
4
6
?
1
7 10
8 ?
I. pedigré
9
AB
7
II. pedigré
2
B
B ?4
3
5 6
A
AB
5
6
III. pedigré
2
10. a) Milyen valószínűséggel lesz a II. pedigrén látható 6. egyén AA illetve A0 vércsoportú? b) Hogyan változik meg ez a valószínűség, ha a 6. egyénnek születik még két AB-s gyermeke (akik a pedigrén nincsenek feltüntetve), illetve, ha összesen 10 AB-s gyermeke lesz? c) És mit mondhatunk, ha ezek után a házaspár tizenegyedik gyermeke B vércsoportú lesz? (A feladat megoldása során gondoljuk meg, hogy mit is jelent az, hogy változik a 6. egyén AA vércsoportba tartozásának valószínűsége, miközben több gyermeke születik - végül is az egyén és vércsoportja változatlan marad?) 11. Milyen lehet a III. pedigrén található 4. egyén vércsoportja és milyen valószínűségekkel? 12. Az anya kék szemű (ez a recesszív jelleg), az apa barna. Milyen valószínűséggel tarthatjuk az apát homozigótának a szemszínre nézve, ha a) 1 barna szemű gyermekük születik, illetve b) ha 3 barna szemű gyermekük születik? A populációban a domináns, barna szemszínt okozó allél gyakorisága 0,6. 13. Az orvosi diagnosztikában használatos két feltételes valószínűséggel definiált fogalom:szenzitivitásnak nevezik annak a valószínűségét, hogy pozitív vizsgálati anyag esetén az eredmény is pozitív (tbc-s mintára tényleg tbc-t jelez); a specificitás annak a valószínűsége, hogy az adott vizsgálat negatív minta esetén negatív eredményt ad (az egészséges mintára egészségest jelez). Tüdőszűrés alkalmával a betegek 90%-ánál a vizsgálat kimutatja a betegséget. Egészséges embernél - hamisan - 1% gyakorisággal beteget jelez. a) Mennyi a szenzitivitás és a specificitás? b) A szűrésre kerülők között a tbc gyakorisága 5/10 000.Mennyi a valószínűsége annak, hogy valakit véletlenszerűen kiválasztva betegséget állapítunk meg és az illető valóban beteg? Mi a valószínűsége, hogy a vizsgált személy valóban tbc-s, ha betegséget állapítottak meg? 14. A tüdőrák gyakorisága az 50 éven felüli korosztályban egy felmérés szerint: a nem-dohányzók közt 5%, a passzív dohányosok között 17% és az aktív dohányosok között 28%. “A” városban az aktív, a passzív és a nem-dohányzók aránya 1/3, 1/3 és 1/3; “B” városban az intenzív propagandának köszönhetően 0,05, 0,05 és 0,9. a) Mekkora a valószínűsége, hogy egy véletlenszerűen kiválasztott egyén tüdőrákos “A” ill. “B” városban? b) Mekkora a valószínűsége, hogy egy tüdőrákos egyén az aktív, a passzív ill. a nem-dohányzók csoportjába tartozik “A” ill. “B” városban? 15. Mi a valószínűsége, hogy az emberi sejt meiózisa során az egyik haploid utódsejtbe csak anyai eredetű kromoszómák kerülnek, ill. hogy 7 anyai és 16 apai? Megoldások: 1. a) 0,93 b) 0,0015 c )0,2, 1/3. 2. a) ((1350/2646)/(7/68))= 4,96. b) 1. c) ha a nem dohányosok kapnának nagy eséllyel tüdőrákot vagy pl. ha S jelentése: tiszta levegőjű helyen lakik. 3. 3,6-nek adódna, de egy konkrét vizsgálatnál egész számnak kell lennie, 3 vagy 4, sok ilyen vizsgálat átlagában 3,6. 4. a) 0,93 ill. 0,39. b) 0,88 c) 0,04 ill. 0,96. 5. A táblázatba a következő 4 esetszám kerül: 24, 56, 6, 14. 6. 0,71, 0,632, 0,23, 0,09, 0,097, 0,86, 0,73, 0,06. Nem, az új gyógyszer rosszabb ( P( H F1 ) és P( H F2 ) viszonya számít). Az adatok alapján nem valószínű, hogy az új gyógyszer növeli a mellékhatás kockázatát, hiszen a placebós csoportban nagyobb a mellékhatás gyakorisága. (Természetesen több adatra és statisztikai próbára van szükség a pontos válaszhoz.)
3
7. a) 0,75 ill. 0,5 b) Számítsuk ki annak a valószínűségét, hogy nem ízérző, vagyis mindkét szülőtől t allélt kap! 1/2 a valószínűsége, hogy anyjától t allélt kap, hiszen anyai nagyszülei mindketten Tt genotípusúak és e négy nagyszülői allél közül mindegyiket egyforma valószínűséggel kaphatta az anyja által. Az apja 50/69 valószínűséggel Tt (és 19/69 valószínűséggel TT), tehát a gyerek 1/2 * 50/69 * 1/2 = 0,18 valószínűséggel tt. 8. a) A feleség anyja biztosan XvX+, mert apjától örökölte a mutáns allélt, de maga nem beteg, a feleség apja pedig X+Y (egészséges). A feleség tehát 1/2 valószínűséggel hordozó, vagyis 1/4 a valószínűsége, hogy mutáns allélt örökít. Ha fia születik, 1/4 valószínűséggel lesz vérzékeny, ha lánya, 1/4 valószínűséggel lesz hordozó (a lánygyerek nem lehet vérzékeny mert a férj egészséges). Ha tudjuk, hogy az asszonynak már született vérzékeny fia, akkor az asszony biztosan XvX+, tehát további fiai 1/2 valószínűséggel lesznek vérzékenyek, további lányai 1/2 valószínűséggel hordozók.b) Az apai nagyapja nem örökíthette a feleségre a mutáns allélt, azért a feleség csak 0,001 valószínűséggel hordozó, (hiszen anyjától kapott allélje ismeretlen, apjától pedig vad típusú allélt örökölt). Első fia tehát 0,0005 valószínűséggel lesz vérzékeny. Viszont ha már van vérzékeny gyermeke, akkor ugyanúgy mint az a) pontnál a feleség biztosan XvX+, stb. 9. a) 7. egyén szülei hordozók, tehát ő 2/3 valószínűséggel hordozó (Aa), 1/3 valószínűséggel AA, 8. egyén biztosan Aa. A teljes val. tétele alapján 10. egyén aa genotípusú (beteg) 1/4 * 2/3 + 0 * 1/3 = 1/6 valószínűséggel és hordozó 1/2 * 2/3 + 1/2 * 1/3 = 1/2 valószínűséggel. b) A 4. egyén lehet AA illetve Aa; ezen események a priori valószínűségeit az allélgyakoriság alapján számítjuk. Genotípusgyakoriságok a populációban: AA: 0,897, Aa: 0,100; annak a valószínűsége, hogy egy egészséges fenotípusú egyén AA: P(F1) = 0,897/(0,897+0,100) = 0,900, ill. Aa P(F2) = 0,100 valószínűséggel. Tudjuk még 4. egyénről, hogy gyermekeinek kétszer adott A allélt (E esemény); ez P(E│F1) = 1 valószínűséggel következik be ha a 4. egyén AA, és P(E│F2) = 1/4 valószínűségű ha ő Aa. Így Bayes tétele alapján annak a valószínűsége, hogy a 4. egyén hordozó: P(F2│ E) = 1/4 * 0,1 / (1 * 0,9 + 1/4 * 0,1) = 1/37. Ha még egy egészséges gyermeke van P(E│F2) = 1/8-ra változik, tehát P(F2│ E) = 1/8 * 0,1 / (1 * 0,9 + 1/8 * 0,1) = 1/73. 10. Az 5. egyén B0 genotípusú, tehát 7. az A allélt csak 6.-tól kaphatta. a) Az előző feladathoz hasonlóan: szülei alapján 6. AA genotípusú P(F1) = 1/2 valószínűséggel illetve A0 P(F2) = 1/2 valószínűséggel. E = gyermekének egyszer A allélt ad, P(E│F1) = 1, és P(E│F2) = 1/2. P(F1│E) = 1* 1/2 / (1 * 1/2 + 1/2 * 1/2) = 2/3 valószínűségű, hogy 6. egyed AA, P(F2│E)=.1/3. b) P(F1│E) = 8/9 ill. 1024/1025. c) Csak úgy lehet, ha 6. egyén 0-s allélt adott, tehát ő biztosan A0. A 6. egyén genotípusára vonatkozó valószínűségeket a következőképpen kell érteni: ha nagyon sok olyan családot megvizsgálnánk mint a II. pedigrén látható, akkor 2/3 részükben a 6. egyénnek megfelelő személy AA vércsoportú lenne, 1/3 részükben pedig A0. Ha sok olyan családot megvizsgálnánk ami a b) pontban van leírva, (tehát 3 ill. 10 AB-s gyerekük van) akkor csak 1/9 ill. 1/1024 részükben találnánk azt, hogy a 6. egyénnek megfelelő személy A0. 11. Mivel a 2. egyén csak A0 lehet, 4. egyén szülei alapján 1/4-1/4 valószínűséggel lehet AA (F1), A0 (F2), AB (F3), B0 (F4). Tudjuk, hogy gyermekének A allélt adott (E), ennek feltételes valószínűségei: P(E│F1) = 1, P(E│F2) = 1/2, P(E│F3) = 1/2, P(E│F4) = 0. Bayes tételével: P(F1│ E) = 1* 1/4 / (1 * 1/4 + 1/2 * 1/4 + 1/2 * 1/4 + 0 * 1/4) = 1/2, P(F2│ E) = 1/4, P(F3│ E) = 1/4, P(F4│ E) = 0. 12.a) Bayes tételével: P(F1│ E) = 1* 0,43 / (1 * 0,43 + 1/2 * 0,57) = 0,6. b) 0,86. 13. a) 0,9 és 0,99. b) Legyen F1: egy vizsgált szemály tbc-s, F2: egészséges; E1: a vizsgálat eredménye pozitív, E2: negatív. P(E1F1) = P(E1│F1)*P(F1) = 0,00045; P(F1│ E1) = 0,9*0,0005 / (0,9*0,0005 + 0,01*0,9995) = 0,043, tehát a pozítív eredményt kézhez kapó vizsgált személyeknek csak 4,3%-a beteg. 14. a) teljes val. tételével 1/3*0,05 + 1/3*0,17 + 1/3*0,28 = 0,167 ill. 0,0675 b) “A” városban:0,56, 0,34 és 0,1; “B” városban 0,21, 0,12 és 0,67.
4
DISZKRÉT ELOSZLÁSOK I. BINOMIÁLIS ELOSZLÁS. Egy kísérlet egyszeri végrehajtásakor az A esemény bekövetkezésének valószínűsége q. Ha a kísérletet egymás után n-szer függetlenül elvégezzük, mi a valószínűsége, hogy A éppen k-szor következik be? Urnamodell: visszatevéses mintavétel. ⎛n⎞ n−k P(ζ = k ) = p k = ⎜⎜ ⎟⎟q k (1 − q ) , E (ζ ) = nq, V (ζ ) = nq (1 − q) ⎝k ⎠ 1. Homozigóta gömbölyű és szögletes borsót kereszteztünk, az F2 nemzedéket képviselő borsókat egy urnába helyezzük. Véletlenszerűen 6 borsót kihúzunk, mindig visszatéve a kihúzott szemet az újabb húzás előtt. Mi a valószínűsége, hogy éppen 4 gömbölyű lesz köztük?
•Minden egyes sorrend valószínűsége: 4
1 4
×
3 4
3 4
×
×
3 4
1 4
×
×
⎛3⎞ ⎛1⎞ ⎜ ⎟ ⎜ ⎟ ⎝4⎠ ⎝4⎠
3 4
2
•Hányféle sorrend lehetséges ? ⎛ 6⎞ ⎜⎜ ⎟⎟ ⎝ 4⎠
3 4
×
1 4
1 4
×
×
3 4
3 4
×
×
3 4
Tehát annak a valószínűsége, hogy 6 kihúzott borsó között éppen 4 kerek:
#
⎛ 6 ⎞ ⎛ 3 ⎞4 ⎛ 1 ⎞2 ⎜⎜ ⎟⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 4⎠ ⎝ 4 ⎠ ⎝ 4 ⎠
Mi a valószínűsége annak, hogy 0 gömbölyű lesz; annak, hogy 1 gömbölyű, 2,...ill. 6? Mennyi a gömbölyűek számának várható értéke és varianciája? p= 0
p= p= p = 0,132 1
2
3
p
4
= 0, 297
p
5
= 0, 356
p
6
= 0,178
2. A férj apja és a feleség anyja ugyanabban a recesszív autószómás betegségben szenved, ők maguk és más nem érintett a családban. 6 gyermeket szeretnének. Mi a valószínűsége, hogy egy sem lesz beteg, hogy legfeljebb 2 beteg lesz, hogy legalább 3 egészséges lesz, ill. hogy legalább 4 egészséges lesz? Mennyi a betegek számának várható értéke és varianciája? II. POISSON ELOSZLÁS. Tudjuk, hogy a pillanatszerű A esemény egységnyi időtartam alatt átlagosan λ-szor fordul elő (egy pontszerű objektum egységnyi területen átlagosan λ-szor fordul elő). Mi a valószínűsége, hogy egy konkrét esetben éppen kszor következik be? (A Poisson eloszlást akkor használhatjuk, ha az esemény
5
pillanatszerű, tehát az egységnyi időtartam alatt az átlagnál “sokkal többször” is bekövetkezhet, persze kis valószínűséggel; azonkívül egymástól függetlenek a “bekövetkezések.”) P ( ζ = k ) = pk = e − λ
λk
E(ζ ) = λ ,
k!
V (ζ ) = λ .
3. Az előző feladatban említett betegség gyakorisága a népességben 5/10 000. Mi a valószínűsége, hogy egy 5000 lélekszámú faluban több mint 3 beteg lakik? Mennyi a betegek számának várható értéke és varianciája? 4. Salvadore Luria és Max Delbrück 1943-ban végezték el híres kísérletüket, melyben igazolták, hogy az E. coli-ban kialakuló T1 fág elleni rezisztencia nem fiziológiai változás hanem mutáció eredménye és a mutációs rátát is meghatározták. Ez utóbbi kiszámításakor T1 szenzitív baktériumokat szaporítottak 2*107 db/kémcső sűrűségig, majd a baktériumot tartalmazó szuszpenziót T1 fággal kevert táptalajon növesztve megszámlálták a kinövő rezisztens (mutáns) baktériumtelepeket. A problámát az jelenti, hogy ha találunk pl. 156 rezisztens kolóniát, nem tudhatjuk, hogy ezek hány mutációs esemény eredményeként keletkeztek, lehet hogy csak egy mutáció történt, de azóta 7-8 sejtosztódási ciklus során elszaporodtak a mutáns utódai. Mivel a mutációk átlagos száma kémcsövenként jóval kisebb mint az elvileg lehetséges (2*107) és az egyes mutációk egymástól függetlenül történnek joggal mondhatjuk a mutációk (de nem a mutáns baktériumok!) kémcsövenkénti számát Poisson eloszlásúnak. (Binomiálissal is számolhatunk, csak kissé fáradtságos...). Luria és Delbrück 20 kémcsövet vizsgáltak meg és ezek közül 11-ben nem történt mutáció (nem nőtt ki rezisztens telep), 9 kémcső tartalma változó számú rezisztens telepet eredményezett, de mint fent említettük, a telepek számából nem következtethetünk a mutációs események számára. Szerencsére azonban a mutánst nem tartalmazó kémcsövek aránya már elegendő a Poisson eloszlás átlagának meghatározásához, abból pedig könnyen kiszámítható a sejtosztódásonkénti mutációs ráta. Hogyan? III. HIPERGEOMETRIKUS ELOSZLÁS. Urnamodell: visszatevés nélküli mintavétel. Egy urnában összesen m db golyó van: ebből s piros és m-s fehér. Mi a annak a valószínűsége, hogy n db-ot kihúzva visszatevés nélkül, éppen k db lesz piros? s piros
összesen m golyó:
m-s fehér
Az összesen s pirosból ennyiféleképpen lehet éppen k-t húzni
Az összesen m-s pirosból ennyiféleképpen lehet éppen n-k-t húzni
⎛ s ⎞⎛ m − s ⎞ ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ kihúzunk n-et: k n k − ⎝ ⎠ ⎝ ⎠ n-k fehér P (ζ = k ) = pk = ⎛ m⎞ ⎜⎜ ⎟⎟ s s⎛ s ⎞⎛ n −1 ⎞ ⎝n⎠ E(ζ ) = n , V (ζ ) = n ⎜1 − ⎟⎜1 − ⎟ m m ⎝ m ⎠⎝ m − 1 ⎠ k piros
kedvező esetek száma (éppen k db pirosat húztunk)
összes lehetséges húzások sz.
5. 12 borsószem van egy urnában: 9 gömbölyű és 3 szögletes. Véletlenszerűen 6-ot húzok visszatevés nélkül. a)Mi a valószínűsége, hogy mind gömbölyű, hogy legfeljebb 2 szögletes, hogy legalább 3 illetve legalább 4 gömbölyű? Mennyi a gömbölyűek számának várható értéke és varianciája? b) Hogyan változnak ezek az eredmények, ha 60 borsó van az urnában: 45 gömbölyű és 15 szögletes (szintén 6-ot húzunk)?
6
VEGYES FELADATOK. 6. A 40 éves anyák között kb. 1/100 a Down-kóros gyermek szülésének esélye. 100 ilyen gyermek között mekkora valószínűséggel találunk több mint 4 Down-kórost? Oldjuk meg binomiális eloszlást használva és Poisson közelítéssel is. 7. A spórák eloszlása a talajban véletlenszerű (Poisson eloszlású). A minták 1/3 részében egyáltalán nem találtak spórát. Mennyi a spórák átlagos száma mintánként, és mekkora valószínűséggel találunk egy mintában legalább 2 spórát? 8. Egy bizonyos betegség a szokásos gyógykezeléssel az esetek egynegyed részében gyógyul. Új kezelést szeretnének bevezetni, amelyet előzőleg 10 betegen próbálnak ki. Ha közülük legalább 7 meggyógyul, akkor az új kezelést bevezetik, ha legfeljebb 3 gyógyul meg, akkor nem. Ha 4, 5 vagy 6 beteg gyógyul meg, akkor a kezelést további vizsgálatnak vetik alá. Mi a három eset valószínűsége, ha az új kezelés hatásossága megegyezik a régiével? 9. Egy Rh- nő 3 gyermeket szeretne. Férje Rh+, akinek anyja Rh-. Mi a valószínűsége, hogy a 3 közül legfeljebb 1 lesz Rh+? 10. Tbc szűrővizsgálaton 100 ember kap pozitív eredményről szóló papírt, de a vizsgálat specificitása kicsi, ezért közülük valójában csak 5-en betegek. 10-en mennek vissza, hogy megismételtessék a vizsgálatot egy nagy specificitású módszerrel. Mi a valószínűsége, hogy a 10 közül egyiknél sem jelez tbc-t a nagy specificitású vizsgálat? 11. Egy szűrővizsgálatra 20-an várakoznak, közülük 3-an valóban rákosok. Nyolcan mennek be először; mi a valószínűsége, hogy közülük a) legfeljebb 1 rákos, b) legalább 1 rákos? 12. Egy kórházba naponta átlagosan 2,5 embert hoznak be infarktussal, ezek száma Poisson eloszlású. Mekkora a valószínűsége, hogy 3-nál több érkezik egy nap? 13. Egy kutyafajtánál bizonyos anyagcsere-rendellenesség megjelenésének valószínűsége 0,1. Mi a valószínűsége, hogy 10 kölyök közül legfeljebb egynél lép fel a rendellenesség? Milyen közelítéseket alkalmazhatunk? 14. A Poisson eloszlással kapcsolatban tudománytörténeti jelentőségűek a következő adatok. Az 1800-as évek végén 200 megfigyelést végeztek a lórúgástól elhunytak hadtestenkénti számáról. 109 esetben nem halt meg senki lórúgástól, 65 esetben egy, 22 esetben 2, 3 esetben 3 és egy esetben 4 katona halt meg hadtestenként és évenként lórúgástól. Számítsuk ki a halálesetek átlagos számát/év/hadtest és vessük össze az ehhez tartozó Poisson eloszlás értékeit a konkrét adatokkal! 15. Egy növény magjainak száma Poisson eloszlású a talajban, átlag = 3/4 / m2. Mekkora az esély, hogy 4 m2-en egyet sem találunk? MEGOLDÁSOK: 1. p0 = 2,44*10-4, p1 = 4,39*10-3, p2 = 2,44*10-2, p3 = 0,132, E = 4,5, V = 1,125. 2. A beteg gyermekek száma binomiális eloszlású, q = 0,75, n = 6, tehát eloszlása megegyezik az 1. feladatbeli eloszlással. P(egy sem beteg) = p6 = 0,178, P(legfeljebb 2 beteg) = P(legalább 4 egészséges) = p4 +p5 + p6 = 0,831, P(legalább 3 egészséges) = p3+p4 +p5 + p6 = 0,963, E = 1,5, V = 1,125. 3. Poisson eloszlást használunk, λ = E = V = 2,5, P(ζ > 3) = 1-P(ζ ≤ 3) = 1-p0 - p1 -p2 -p3 = 10,082-0,205-0,257-0,214 = 0,242. 4. p0 =11/20 = e-λ ⎡ λ = 0,6/2*107 sejtosztódás, tehát µ = 3*10-8 /sejtosztódás. 5. a) P(mind gömbölyű) = p6 = 0,091, P(legfeljebb 2 szögletes) = P(legalább 4 gömbölyű) = p4 +p5 + p6 = 0,409+0,409+0,091 = 0,909, P(legalább 3 gömbölyű) = p3+p4 +p5 + p6 = 1 (3-nál kevesebb gömbölyűt nem lehetséges húzni). E = 4,5, V = 0,61. b) P(mind gömbölyű) = p6 = 0,163, P(legfeljebb 2 szögletes) = P(legalább 4 gömbölyű) = p4 +p5 + p6 =
7
0,312+0,366+0,163= 0,841, P(legalább 3 gömbölyű) = p3+p4 +p5 + p6 = 0,129 + 0,312+0,366+0,163 = 0,970, 6. P(ζ > 4) = 1-P(ζ ≤ 4) = 1-p0 - p1 -p2 - p3 -p4. Poisson: λ = 1, P(ζ > 4) =1- 0,368 -0,368 -0,184 - 0,061 - 0,015 = 0,004, E = V = 1. Binomiális: p=0,01, P(ζ > 4) = 1-0,366 - 0,370 -0,185 0,061 - 0,015 = 0,003. E = 1, V = 0,99. 7. λ = 1,1 P(legalább 2 spóra) = 1- p0 - p1 = 1- 1/3-0,366 = 0,301. 8. Binomiális eloszlás, n = 10, q = 0,25; p7+p8 +p9 + p610 = 0,0035, p0+p1 +p2+ p3 = 0,7759, p4 +p5 + p6 = 0,2206. 9. Binomiális n = 3, q = 0,5; p0+p1 = 1/8+3/8 = 0,5. 10. Hipergeometrikus, m = 100, s = 5, n = 10; p0 = 0,584. 11. Hipergeometrikus, m = 20, s = 3, n = 10; a) p0+p1 = 0,193 + 0,463 = 0,656 b) 1- p0 = 0,807. 12.1 - p0+p1 +p2+ p3 = 1 - 0,082 + 0,205 + 0,257 + 0,214 = 0,242. 13. Binomiális n = 10, q = 0,1; p0+p1 = 0,349 + 0,387 = 0,736. Poisson λ = 1; p0+p1 = 0,368+0,368 = 0,736. 14. λ = 0,61 haláleset/év/hadtest. x0 = 108,7 x1 = 66,3 x2 = 20,2 x3 = 4,1 x4 =0,6 lenne az olyan hadtestek száma melyben 0,1,2,3 ill. 4 lórúgásos haláleset történt, ha a a lórúgások száma pontosan Poisson eloszlású lenne. Ezek az elméleti értékek jól egyeznek az adatokkal. 15. Átszámítjuk az átlagos magszámot 4 m2-re (ezt vesszük egységnyinek), ekkor λ = 3, p0 = e-3 = 0,05. (Másképpen, ha 1 m2-t vesszük egységnyinek, p0 4= (e-3/4) 4 = 0,05. –- ez a megoldás csak p0 keresése esetén alkalmazható, különben hibás eredméynt ad.)
A következő ábrákon az figyelhető meg, hogy az egyes diszkrét eloszlások milyen körülmények között hasonlítanak egymásra. Hipergeometrikus m=12, s=9, n=6 0.4
0.3
0.2
0.1
0
Binom n=6, q=0.75 0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
1
2
3
4
5
6
1
2
3
4
5
6
4
5
6
Hipergeometrikus m=60, s=45, n=6
0
1
2
3
8
0.25
0.25
0.2
Binom n=10, q=0.25
0.15
0.1
0.1
0.05
0.05
0
2
4
6
8
Poisson λ = 2.5
0.2
0.15
10
0
2
4
6
a val. vált. legnagyobb lehetséges értéke 10
0.08
8
10
végtelenig tart igazából, vagyis a val. változó akármilyen nagy értékeket is felvehet, de nagyon kis valószínûséggel
0.08
Binom n=100, q=0.25
0.06
0.04
0.04
0.02
0.02
0
20
40
60
80
Poisson λ = 25
0.06
100
0
20
40
60
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
Binom n=100, q=0.01
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
2
4
6
8
10
a val. vált. legnagyobb lehetséges értéke 100, de itt csak 10-ig ábrázoltuk
80
100
végtelenig tart igazából, vagyis a val. változó elvben akármilyen nagy értékeket is felvehet, de nagyon kis valószínûséggel
a val. vált. legnagyobb lehetséges értéke 100
Poisson λ = 1
0
2
4
6
8
10
végtelenig tart igazából, vagyis a val. változó elvben akármilyen nagy értékeket is felvehet, de nagyon kis valószínûséggel
0.4
0.35
0.3
Binom n=10, q=0.1
0.25
0.2
0.15
0.1
0.05
0
2
4
6
8
10
a val. vált. legnagyobb lehetséges értéke 10
9
FOLYTONOS ELOSZLÁSOK I. NORMÁLIS ELOSZLÁS: A természetben gyakran fordul elő, ha egy jelenséget (méretet) sok egyszerű alternatíva dönt el (sok kis hatású gén, sokféle környezeti hatás), illetve ha csak pontatlanul, zajosan tudunk mérni. Tipikusan ilyenek az ún. poligénes vagy kvantitatív jellegek: testméretek, tejtermelés, terméshozam. Ezeket 10-100 kisgén határozza meg + ill. - allélekkel. Genetikai egyensúlyban a + allélek száma binomiális eloszlású, de a mért értékek normális eloszlásúak, mert a környezeti variancia illetve a mérési hiba miatt folytonossá válik az eloszlás. A normális eloszlás sűrűségfüggvénye: f ( x ) =
−
1
e
( x − m )2 2σ 2
, M(ξ) = m, V(ξ) = σ2.
2π σ Bármilyen normális eloszlás levezethetõ a 0 várható értékû és 1 szórású standard normális eloszlásból. Az eloszlásfüggvény: ⎛ x−m⎞ F ( x ) = Φ⎜ ⎟ ⎝ σ ⎠ Illetve igaz, hogy Φ (− x) = 1 − Φ ( x)
1. Egy tehén napi tejhozama normális eloszlású valószínűségi változó, m = 22,1 liter, σ = 1,5 liter. a) Határozzuk meg annak a valószínűségét, hogy egy adott napon a tejhozam nagyobb mint 25 liter, b) a tejhozam 20 és 21 liter közé esik, c) átlagosnál kisebb tejhozam esetén 20 és 21 liter közé esik. (Ld. ábra.) 2. Egy másik tehén szeszélyesebb: ugyanúgy m = 22.1 liter, de σ = 3 liter. Válaszoljunk ugyanazokra a kérdésekre! (Ld. ábra.) 3. Milyen valószínűséggel esik m+σ és m-σ közé a tejtermelés az 1. ill 2. feladatbeli tehénnél?
norm. elo. sûr.fv. m=22.1, σ =1.5
0.25
0.4
0.2
0.3
standard normális eloszlás sûr. fv. m = 0, σ = 1
0.15
0.2 0.1
0.1 0.05
15
20
x1=20
25
30
-4
-2
(x1-m)/σ = -1,4
x2=21
0
2
4
(x2-m)/σ = -0,73
0.25
norm. elo. sûr.fv. m=22.1, σ =3
0.2
0.15
0.1
0.05
15
20
25
Áttérés standard normális eloszlásra: F(x1), annak a valószínûsége, hogy egy tetszõleges norm. elo.-ú val. vált értéke kisebb mint x1, egyenlõ azzal, hogy a st. norm elo.-ú val. vált. értéke kisebb mint (x1-m)/σ, ez pedig Φ((x1-m)/σ)
30
10
4. Egy populációban a testsúlyt m = 60,38 kg, σ = 5,7 kg paraméterű normális eloszlású val. vált.-nak tekintjük. Az egyéneket testsúly szerint 4 osztályba szeretnénk sorolni, úgy, hogy várhatóan minden osztályba egyenlő számú egyén kerüljön. Jelöljük ki az osztályközöket (osztópontokat)! 5. Egy szántóföldön a búza termésátlaga 60 q/hektár, a szórás 15 q/hektár. Mi a valószínűsége, hogy egy adott évben a) a termés meghaladja a 38 q/hektárt? b) 80 és 90 q/hektár közé esik? 6. Egy nagy mikroorganizmus-tenyészetben a két sejtosztódás közötti nyugalmi fázis időtartama normális eloszlású, órákban mérve m = 160, σ = 20. Mi annak a valószínűsége, hogy egy 4 egyedből álló randomizáltan kiválasztott mintában egyetlen egyed nyugalmi fázisa sem lesz kisebb 180 óránál? 0.07
0.07
norm. elo. sûr.fv. m=60.38, σ =5.7
0.06
0
0.05
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
20
40
II. LOGNORMÁLIS
60
80
ELOSZLÁSÚ
100
norm. elo. sûr.fv. m=60, σ =15
0.06
0
20
40
60
80
100
egy ξ val. vált., ha lnξ normális eloszlású m és σ m+
σ2
paraméterekkel. Ekkor M(ξ) = e 2 , V(ξ) =e 2m+ σ ( e σ − 1) . 7. Bizonyos sejtpopulációban a sejtmag átmérője lognormális eloszlású, átlaga 8 mikrométer, szórása 1,1 mikrokéter. Mennyi a valószínűsége annak, hogy a sejtmagátmérő 7 és 9 mikrométer közé esik? 2
2
III. EXPONENCIÁLIS ELOSZLÁS gyakran lép fel várakozási időtartamokkal, objektumok életidejével kapcsolatban. Pontosabban ha egy adott esemény többször bekövetkezik és az egyes bekövetkezések egymástól függetlenek, akkor a bekövetkezések között eltelt idő exponenciális eloszlású. (Időegység alatt a bekövetkezések száma ekkor Poisson eloszlású - a függetlenség a kritérium). Észre kell azonban venni, hogy sokszor egyes események ismételt bekövetkezései nem függetlenek, ekkor nem exponenciális eloszlású a várakozási idő. “Örökifjú“ objektumok élettartama is exponenciális eloszlású, az ilyen élőlény azonban ritka, ugyanis ez azt jelentené, hogy a jövőbeni kilátások függetlenek a pillanatnyi kortól (nem öregszik); jó közelítéssel ilyenek a korallpolipok, ld. a köv. feladatot.
⎧ 1 − e − λx , ha x ∈ (0, ∞) = F x ( ) exp elo. val. vált. elo. fv-e: ⎨ ha x ∈ (−∞, 0] ⎩0, ⎧λe − λx , ha x ∈ (0, ∞) , M(ξ) = 1/λ, V(ξ) = 1/λ2. sűr. fv.-e: f ( x) = ⎨ ⎩0, ha x ∈ (−∞, 0] 8. Egy korallfaj polipjainak élettartama exponenciális eloszlású, átlagos életidejük 3,0 év. a) Az egyedek hány százaléka éri meg a 3 évet? b) Az egyedek hány százaléka éri meg a 4 évet? c) A két éves egyedek hány százaléka éri meg a 4 évet? d) 0 éves egyedekből kiindulva várhatóan hány év múlva következik be az, hogy éppen a fele van életben?
11
9. Egy forrásért való küzdelemben az állatok sok fajnál harc nélkül, de pózolva várakoznak, hátha a másik hamarabb megunja. A várakozási idő exponenciális eloszlású átlagát a forrás értéke szabja meg. Egy csontért átlagosan 10 percig várakoznak a kutyák, a)mi a valószínűsége, hogy egy adott kutya ennél tovább vicsorog a csont mellett? b) mekkora egy másik csont értéke, melynél ugyanakkora valószínűséggel éppen 50 percig várakoznak a kutyák? c) mi a valószínűsége, hogy az első csontért a várakozási idő 5 és 8 perc közé esik? exp.elo. sûr.fv. λ = 0.1
exp.elo. sûr.fv. λ = 1/3
MEGOLDÁSOK: 1. a) P(ξ>25) = 1-P(ξ<25) = 1-F(25) = 1 - Φ((25-22.1)/1.5) = 1 - Φ(1,93) = 0,027. b) P(20<ξ<21) = F(21) - F(20) = Φ((21-22.1)/1.5) - Φ((20-22.1)/1.5) = Φ(-0,73) - Φ(-1,4) = 1 - Φ(0,73) - (1 - Φ(1,4)) = 0,152. c) P(20<ξ<21⏐ξ<22,1) = P(20<ξ<21)/P(ξ<22,1) = 0,152/0,5 = 0,304. 2. Az 1. feladathoz hasonlóan: a)0,167, b) 0,115 c) 0,230. (extrapolálástól függően) 3. mindkét esetben P(m-σ <ξ< m+σ) = F(m+σ) - F(m-σ) = Φ( m+σ -m)/σ) - Φ( m-σ -m)/σ) = Φ( 1) - Φ( -1) = 2Φ( 1) - 1 = 0,683. 4. Legyen a három osztópont x1, x2 és x3. Nyilván x2 = m. Φ(( x3-60,38)/5,7)) = 0,75. Innen (x3-60,38)/5,7 = 0,675 tehát x3 = 64,23. Φ(( x1-60,38)/5,7)) = 0,25, mivel csak 0,5-nél nagyobb Φ(x) értékeket találunk a táblázatban: Φ(( 60,38- x1)/5,7)) = 1-0,25, innen x1 = 56,53. x1 -et egyszerűen az eloszlás szimmetrikus volta alapján is kiszámíthatjuk: x1 = m - (x3 - m). 5. a) ) P(ξ>38) = 1-P(ξ<38) = 1-F(38) = 1 - Φ((38-60)/15) = 1 - 1 + Φ(1,47) = 0,9292 b) P(80<ξ<90) = F(90) - F(80) = Φ((90-60)/15) - Φ((80-60)/15) = Φ(2) - Φ(1,33) = 0,9772 - 0,9082 = 0,069 6. P(ξ>180)4= (1 - Φ((180-160)/20)) 4 = (1- Φ(1)) 4 = 0,15874 = 0,0006. m+
σ2
7. e 2 = 8 és e 2m+ σ ( e σ − 1) = 1.12, innen a lognormális eloszláshoz tartozó normál eloszlás paraméterei: m = 2,070 és σ = 0,137. P(7<ξ<9) = P(ln7
3) = 1- F(3) = 1- (1-e-3*1/3) = e-1 = 0,37. b) P(ξ>4) = 1- F(4) = 1(1-e-4*1/3) = 0,264. c) P(ξ>4⏐ξ>2) = P(ξ>4 és ξ>2 ) / P(ξ>2) = 0,264/0,513 = 0,513 = P(ξ>2), éppen ez jelenti az “örökifjúságot”. 1 − ⋅t1 / 2 ⎞ ⎛ 1 1 − λt1/ 2 ⎜ = , P ( fele _ él ) = 1 − ⎜1 − e 3 ⎟⎟ = , ahol t1/2 a keresett év; d) F ( t1/ 2 ) = 1 − e 2 ⎝ ⎠ 2 innen t1/2 = - ln(1/2) / λ = 2,08 év. 9. ) λ = 0,1, a) P(ξ>10) = 1- F(10) = 1- (1-e-10*0,1) = e-1 = 0,37. b) e-1 = P(ξ>50) = 1- F(50) = 1- (1-e-50*λ), λ = 1/50, a forrás értéke ekkor 50, vagyis átlagosan 50 percig várakoznak. c) P(5<ξ<8) = F(8) -F(5) = 1-e-8/10 - (1-e-5/10) = 0,16. 2
2
12