1 2002. október 21. EllenÅrzÅ kérdések és gyakorlatok biometriából Elméleti kérdések 1. Ábrázolja Venn-diagramokkal: a. két esemény összegét, b. két esemény szorzatát, c. egy esemény elentett eseményét. 2. Ábrázoljon Venn-diagram segítségével: a. két egymást kizáró eseményt, b. két független eseményt, c. teljes eseményrendszert. Útm: b. Az eseményeket ábrázoló halmazok területei között összefüggés áll fenn: T(AB)/T(B)=T(A)/T(I)=T(A)/1=T(A), ahol T az argumentumban álló halmaz területe, I az alaphalmaz (teljes eseményrendszer). 3. Mondjon példát teljes eseményrendszerre. Útm: Radioaktív vegyület kiürülése a szervezetbÅl Y biológiai vagy fizikai bomlás: keff=kfiz+kbiol. Molekulák gerjesztett állapotának megszánése: k=kF+kIC+kISC, ahol kF: fluoreszcencia, kIC: belsÅ konverzió ("internal conversion"), kISC: rendszerek közötti átmenet ("intersystem crossing"). 4. Tartozhat-e két független esemény ugyanahhoz a teljes eseményrendszerhez? Útm: A teljes eseményrendszert egymást kizáró események alkotják. 5. Bizonyítsa be, hogy két egymást kizáró esemény nem lehet független. Útm: Mivel AB=i, ezért P(A*B)=0, de P(A)…0. 6. Grafikusan vagy a valószínáség addíciós tételének felhasználásával bizonyítsa be, hogy két esemény összegének valószínásége sohasem lehet nagyobb mint az események valószínáségeinek az összege, azaz: P(A+B)#P(A)+P(B). Útm: P(A+B)=P(A)+P(B)-P(AB). 7. Bizonyítsa be, hogy két esemény szorzatának valószínásége sohasem nagyobb valószínáségeik összegénél. Útm: a 6. feladat megoldása így is írható: P(AB)=P(A)+P(B)-P(A+B). 8. Bizonyítsa be, hogy független események valószínáségeinek szorzata sohasem nagyobb valószínáségeik összegénél. Útm: a 7. feladat megoldásában P(AB)=P(A)*P(B) írható. 9. Bizonyítsa be, hogy ha az A és B eseményekre fennáll a P(A)=k*P(B) viszony, akkor P(A*B)=k*P(B*A) is igaz.
2 Útm: P(A*B)=P(AB)/P(B), P(B*A)=P(AB)/P(A) Y P(A*B)/P(B*A)=P(A)/P(B)=k. 10. Bizonyítsa be, hogy ha A független B-tÅl, azaz P(A*B)=P(A) fennáll, akkor B is független Atól, azaz P(B*A)=P(B) is fennáll. (A függetlenség szimmetrikus tulajdonság.) Útm: P(A*B)=P(AB)/P(B)=P(A) Y P(B*A)=P(AB)/P(A)=P(A)P(B)/P(A)=P(B). 11. Egy esemény és az általa definiált ellentett esemény lehetnek-e egymástól függetlenek? Útm: Mivel AA=i, ezért P(A*A)=0, de P(A)…0 (A jelöli az A ellentettjét). 12. Sorolja fel a De Morgan-féle szabályokat. Útm: A+B=A*B és A*B=A+B. 13. Ábrázolja grafikusan azt a tényt, hogy egy A esemény valószínáségére: 0#P(A)#1. 14. Sorolja fel a Kolmogorov-féle axiómákat. Útm: I. 0#P(A)#1, II. P(i)=0, P(I)=1 ahol i és I a lehetetlen és biztos események, III. P(A+B)=P(A)+P(B), ahol A és B egymást kizáró események. 15. Bizonyítsa be, hogy ha egy A esemény maga után vonja a B eseményt, akkor az A esemény valószínásége sohasem lehet nagyobb a B esemény valószínáségénél, azaz ha AdB akkor P(A)#P(B). Útm: Mivel AdB, ezért B=A+A*B, továbbá A és A*B egymást kizárják Y P(B)=P(A+A*B)=P(A)+P(A*B)$P(A). 16. Definiálja a valószínáség fogalmát. Útm:1. P(A)=kedvezÅ esetek száma/összes esetek száma, 2. lim(kA/n)=P(A), ha n64; az az érték ami körül a relatív gyakoriság ingadozik (a valószínáség a relatív gyakoriságnak mint valószínáségi változónak a várható értéke). 17. Az alábbi tulajdonság párokat esemény pároknak tekintve melyeknek a tagjai tekinthetÅk egymástól függetlennek? a. szemszín és testúly, b. szemszín és nem (nÅ vagy férfi), c. vérnyomás és testsúly, d. vércsoport és nem, e. szemüveg viselés és nem, f. IQ szint és nem, g. IQ szint és testsúly, h. szemüveg viselés és életkor, i. életkor és nem, j. reflexidÅ és nem, k. reflexidÅ és életkor, l. színérzékenység (színvakság) és nem, m. vércsoport és testmagasság. Útm: a, b, d, e, f, g, j, m.
3 18. Mit nevezünk elemi eseménynek és eseménytérnek? Mondjon példát. 19. Mit nevezünk gyakoriságnak és relatív gyakoriságnak? Mondjon példát. 20. A relatív gyakoriság tekinthetÅ-e valószínáségi változónak? Ha igen, akkor mi a várható értéke? Útm: A valószínáség az az érték ami körül a relatív gyakoriság ingadozik (a valószínáség a relatív gyakoriságnak mint valószínáségi változónak a várható értéke). 21. Tudjuk, hogy egy ξ valószínáségi változó a 2-es értéket 0.5 valószínáséggel veszi fel. Mekkora valószínáséggel veszi fel az η=ξ2 valószínáségi változó a 4-es értéket? Útm: ha P(ξ=x)=p, akkor P[f(ξ)=f(x)]=p szintén igaz ahol y=f(x) tetszÅleges függvény. Tehát P(ξ=2)=0.5 Y P(ξ2=4)=0.5. 22. Egy valószínáségi változó vehet-e fel negatív értéket? Útm: Igen, pl. szerencsejátékban a nyeremény. 23. Mondjon példát olyan valószínáségi változóra melyre igaz: a. csak pozitív értékeket vehet fel, b. pozitív és negatív értékeket egyaránt felvehet, c. csak egész számok közül kerülhetnek ki értékei. 24. Igaz-e, hogy csak egész értékeket felvevÅ valószínáségi változó várható értéke is egész? Állítását illusztrálja példával. Útm: Nem igaz, pl. szabályos kockával a dobott érték várható értéke: 3.5. Legyen 1, 2, 4 egy véletlen minta, akkor az empírikus közép: <x>=7/3=2.333. 25. Igaz-e, hogy binomiális eloszlású valószínáségi változó esetén a várható érték és a szórás meghatározzák a valószínáségi változó által felvehetÅ legnagyobb értéket? Útm: Igaz, µ=np, σ2=np(1-p) két egyenlet a két ismeretlen, n és p, számára. 26. Bizonyítsa be, hogy binomiális eloszlású valószínáségi változó esetén a variancia (σ2) és a várható érték (µ) hányadosa sohasem lehet egynél nagyobb. Útm: σ2/µ=q#1. 27. Definiálja és szemléltesse a feltételes valószínáséget. Útm: Pl. ragasszunk pénzérme (vagy dobókocka) egyik oldalára rágógumit. 28. Hogyan értelmezzük a valószínáségek szorzási tételét? Útm: A feltételes valószínáség definíciójából kapjuk: P(AB)=P(A*B)*P(B). Három eseményre: P(A1A2A3)=P(A3*A1A2)*P(A2*A1)*P(A1). 29. Mit mond ki a teljes valószínáség tétele? Útm: Ha I=B1+B2+...+Bn és BiBj=i, akkor P(A)=P(A*B1)P(B1)+P(A*B2)P(B2)+...+P(A*Bn)P(Bn).
4 30. Hogyan származtatjuk Bayes tételét? Útm: P(Bi*A)=P(ABi)/P(A)=P(A*Bi)P(Bi)/P(A) és alkalmazzuk A-ra és B1, B2, ..., Bn-re a teljes valószínáség tételét. 31. Hogyan definiáljuk az események függetlenségét? Útm:1. P(A*B)=P(A), 2. P(AB)=P(A)*P(B). 32. Egy valószínáségi változó kétszeresének várható értéke 4. Mennyi a valószínáségi változó várható értéke? Útm: M(cξ)=c*M(ξ) ahol c tetszÅleges szám. 33. Zérus várható értéká valószínáségi változó szórásnégyzete egységnyi. Mennyi a valószínáségi változó négyzetének várható értéke? Útm: D2(ξ)=M(ξ2)-M2(ξ). 34. Mit nevezünk egy diszkrét valószínáségi változó eloszlásának és várható értékének? Útm:1. P(ξ=xi)=pi ahol i=1, 2, ..., n, 2. M(ξ)=x1p1+x2p2+...+xnpn. 35. Egy játékot mikor nevezünk korrektnek ill. a játékos szempontjából kedvezÅnek vagy kedvezÅtlennek? Mondjon rá példát. Útm: Legyen a ξ valószínáségi változó a nyeremény. A játék korrekt ha M(ξ)=0, kedvezÅ ha M(ξ)>0, hátrányos ha M(ξ)<0. 36. Hogyan definiáljuk egy valószínáségi változó (akár folytonos, akár diszkrét) szórásnégyzetét és szórását? Útm: D2(ξ)=M{[ξ-M(ξ)]2}, vagy D2(ξ)=M(ξ2)-M2(ξ) 37. Hogyan értelmezzük egy valószínáségi változó (akár folytonos, akár diszkrét) eloszlásfüggvényét? Útm: F(x)=P(ξ<x) 38. Milyen gyakorlati cél indokolja az eloszlásfüggvény bevezetését a biometriában? Útm: P(a#ξ
5 Útm: Egyébként a területe nem lehetne egységnyi. A növekedést csökkenés kell, hogy kísérje. 42. Definiálja a P(ξ=xi)=pi diszkrét valószínáségek segítségével a ξ diszkrét valószínáségi változó eloszlásfüggvényét. Útm: F(x)=P(ξ<x)=3xi<xP(ξ=xi)=P(ξ=x1)+P(ξ=x2)+...+P(ξ=xn)=p1+p2+...+pn ahol x1, x2, ..., xn<x. 43. Definiálja a folytonos ξ valószínáségi változó f(x) sáráségfüggvényét. Útm: P(x#ξ<x+∆x)=f(x)*∆x 44. Definiálja a folytonos ξ valószínáségi változó F(x) eloszlásfüggvényét az f(x) sáráségfüggvény segítségével. Útm: F(x)=I-4xf(t)dt 45. Mondjon példát monoton csökkenÅ (diszkrét) valószínáség eloszlásra. Útm: Tekintsük a Poisson-eloszlást ha 0<λ#1. 46. Mondjon példát maximum hellyel rendelkezÅ diszkrét és folytonos valószínáség eloszlásokra. Útm: a Poisson-eloszlás ha λ>1, normális eloszlás, binomiális eloszlás 47. Van-e olyan valószínáség eloszlás mely ugyanazt a valószínáséget rendeli a valószínáségi változó minden értékéhez? Útm: Ez az ún. egyenletes eloszlás. 48. Lehet-e egy valószínáségi eloszlásnak két (lokális) maximuma? Útm: Pl. sejtek DNS tartalom szerinti eloszlása három fázisból áll: G0/G1, S, G2/M (lásd pl. az áramlási citometriánál). 49. Van-e annak a kijelentésnek értelme, hogy egy valószínáségi változó szigorúan monoton növekvÅ? Útm: Nincs értelme. A valószínáségi változó az elemi események terén (I) értelmezett függvény (olyan függvény melynek független változói az elemi események) és az elemi események között a kisebb-nagyobb viszony nem értelmezett. Az y=f(x) függvény akkor szigorúan monoton növekvÅ, ha minden x1<x2-re f(x1)
6 Útm: Ha eloszlása: P(ξ=k)={n!/[(n-k)!k!]}pkqn-k, ahol p+q=1. 53. Mikor mondjuk egy ξ valószínáségi változóról, hogy Poisson-eloszlású? Útm: Ha eloszlása: P(ξ=k)=(λk/k!)e-λ, ahol λ>0. 54. Mikor mondjuk egy ξ valószínáségi változóról, hogy normális eloszlású? Útm: Ha sáráségfüggvénye: f(x)=(1/σ/2π)*exp[-(x-µ)2/2σ2], ahol σ>0, µ tetszÅleges szám. 55. Milyen kapcsolat van egy µ és σ paraméterá normális eloszlás és a standard normális eloszlás a. sáráségfüggvényei között, b. eloszlásfüggvényei között? Útm:a. f(x)=(1/σ)*n[(x-µ)/σ], b. F(x)=Φ[(x-µ)/σ]. 56. Hogyan lehet az empírikus középpel és az empírikus közép szórásnégyzete segítségével bizonyítani egy valószínáségi változóról, hogy Poisson-eloszlású? Útm: M(ξ)=D2(ξ)=λ Y <x>=sn2 ahol <x>=(x1+x2+...+xn)/n, sn2=[(x1-<x>)2+(x2-<x>)2+...+(xn<x>)2]/(n-1) 57. Lehet-e egy normális eloszlású valószínáségi változó szórása nagyobb mint várható értéke? Útm: Lehet. 58. Ábrázolja a két azonos várható értéká de eltérÅ szórású normális eloszlású valószínáségi változó sáráségfüggvényét azonos koordináta rendszerben. Útm: A nagyobb szóráshoz tartozó sáráségfüggvény magassága kisebb mint a kisebb szóráshoz tartozóé. 59. Ábrázolja a két azonos várható értéká de eltérÅ szórású normális eloszlású valószínáségi változó eloszlásfüggvényét azonos koordináta rendszerben. Útm: A nagyobb szóráshoz tartozó eloszlásfüggvény kevésbé meredeken "ugrik" mint a kisebb szóráshoz tartozó. 60. Ábrázolja egy normális eloszlású valószínáségi változó sáráségfüggvényét és eloszlásfüggvényét azonos koordináta rendszerben. Útm: A sáráségfüggvény harang alakú, az eloszlásfüggvény "S" alakú. Az eloszlásfüggvény ott veszi fel az 1/2 értéket, ahol a sáráségfüggvény a maximumát (normális eloszlás esetén). 61. Létezik-e olyan Poisson-eloszlás melynek várható értéke megegyezik a szórásával? Útm: M(ξ)=D2(ξ)=λ Y λ=/λ 62. Tudjuk, hogy egy valószínáségi változó várható értéke megegyezik a (-1)-szeresének várható értékével. Mennyi a várható érték? Útm: M(cξ)=c*M(ξ) 63. Két független valószínáségi változó összegének várható értéke 20, különbségük várható értéke 10. Mennyi a két valószínáségi változó várható értéke?
7 Útm: M(ξ+η)=M(ξ)+M(η), M(ξ-η)=M(ξ)-M(η) 64. A ξ valószínáségi változó várható értéke 5. Mennyi az η=ξ+3 valószínáségi változó várható értéke? Útm: M(ξ+c)=M(ξ)+c 65. A ξ valószínáségi változó szórása 10. Mennyi az η=-ξ valószínáségi változó szórása? Útm: D(cξ)=*c**D(ξ) 66. A ξ valószínáségi változó szórása 5. Mennyi az η=ξ+5 valószínáségi változó szórása? Útm: D(ξ+c)=D(ξ) 67. Milyen feltételek mellett alkalmazhatunk a binomiális eloszlás helyett Poisson-eloszlást? Útm: n64 és p60 úgy, hogy közben np=λ=konstans 68. A független eseményekre vonatkozó szorzási tétel alkalmazásával bizonyítsa be az izotópok kiürülüsét jellemzÅ felezési idÅk között fennálló ismert összefüggést: 1/Teff=1/Tfiz+1/Tbiol. Útm: Tekintsük a fizikai és biológiai módon történÅ el nem bomlások valószínáségét és alkalmazzuk a független események szorzatára vonatkozó szorzástételt: P(A)=e-λfiz*t, P(B)=eλbiol*t , P(AB)=e-λeff*t, P(AB)=P(A)*P(B) 69. Bizonyítsa be, hogy ha A és B független események, akkor A és B ellentett események is függetlenek. Útm: P(A*B)=P(A+B)=1-P(A+B)=1-[P(A)+P(B)-P(A*B)]=1-[P(A)+P(B)-P(A)*P(B)]=1-P(A)P(B)+P(A)*P(B)=1-P(B)-P(A)*[1-P(B)]=[1-P(A)]*[1-P(B)]=P(A)*P(B), Felhasznált tételek:1. ellentett esemény valószínásége: P(A)=1-P(A), 2. addíciós tétel: P(A+B)=P(A)+P(B)-P(A*B), 3. független események szorzatának valószínásége: P(A*B)=P(A)*P(B). 70. Az urna modell segítségével értelmezze a Poisson-eloszlású valószínáségi változó λ paraméterének jelentését. Útm: λ=n/N az egy dobozra esÅ átlagos golyó szám 71. Adott kísérletsorozatban két esemény relatív gyakoriságát egyformának találjuk. Következike ebbÅl, hogy a két esemény valószínásége is megegyezik? Útm: Nem feltétlenül, mert a valószínáség a relatív gyakoriság várható értéke. 72. Melyik az az esemény mely a lehetetlen eseménytÅl eltekintve minden más eseménytÅl független? Útm: A biztos esemény (I). 73. Mit nevezünk statisztikának? Útm: A mintaelemek (xi) tetszÅleges függvénye. 73. Mi a torzítatlan becslés? Útm: Amikor a statisztika várható értéke megegyezik a becsült paraméterrel.
8 74. Mondjon legalább három példát a statisztikára. Útm: <x>, sn*, sn, U, t, F 75. Mik a reprezentatív mintavétel ismérvei? Útm: függetlenség, a mintaelemek (xi) azonos valószínásége 76. Mit nevezünk sokaságnak (populációnak) és mintának? Útm:1. populáció: a vizsgálni kívánt alaphalmaz, 2. minta: a populáció részhalmaza 77. Miben különbözik a korrigált empírikus szorásnégyzet az empírikus szórásnégyzettÅl? Útm: sn2=[n/(n-1)]*sn*2 78. Definiálja az empírikus eloszlásfüggvényt. Útm: Fn(x)=0 ha x<x1*; k/n ha xk*#x<xk+1* k=1, 2, ..., n-1; 1 ha xn*#x ahol x1*, x2*, ..., xn* rendezett minta. 79. Hogyan szerkesztünk sáráséghisztogramot? Útm:1. A "range" megállapítása: R=xmax-xmin. 2. Az intervallumok számának megállapítása: k=1+3.322*log(n), ahol n a mintaelemek száma (Sturges-szabály). 3. Az intervallumok hosszának megállapítása: w=R/k. 4. Az egyes intervallumokba esÅ mintaelemek számának ill. relatív gyakoriságának megállapítása. 80. Melyek az ún. jó becslés követelményei? Útm:1. torzítatlanság, 2. hatékonyság (kis szórás) 81. Mit nevezünk nullhipotézisnek és mi az alternatív hipotézis? Útm:1. Alternatív hipotézis: amit bizonyítani akarunk. 2. Nullhipotézis: amit el akarunk vetni, az alternatív hipotézis ellentettje. 82. Hogyan értelmezzük a statisztikai próbák elfogadási és kritikus tartományát? Útm:1. Egyoldali U-próba esetén az elfogadási (konfidencia) intervallum (T) bal oldali határa -4, jobb oldali határa up, az az érték melyre P(u
9 Útm: P(tévedés)=P(elsÅfajú hiba)+P(másodfajú hiba) 85. Lehet-e nagyobb az empírikus közép szórása az elméleti szórásnál? Útm: Nem, mert s<x>=σx//n és n$1. 86. Egy minta empírikus közepének szórása 4. Az elméleti szórás 16. Mennyi a minta elemszáma? Útm: s<x>=σx//n 87. Az U- vagy a t-próba elfogadási tartománya a szélesebb? Útm: A t-próba elfogadási tartománya a szélesebb. 88. Hogyan változik az elfogadási tartomány szélessége a t-próba szabadságfokának függvényében? Útm: Csökken. 89. Mikor alkalmazhatunk U-próbát a t-próba helyett? Útm: Nagy mintaelemszám (n) esetén. 90. Mikor alkalmazhatunk normális eloszlást a binomiális eloszlás helyett? Útm: Amikor n64, de p=konstans. 91. Mikor alkalmazhatunk Poisson-eloszlást a binomiális eloszlás helyett? Útm: Amikor n64 és p60 úgy, hogy közben np=konstans=λ. 92. Mi az önkontrollos kísérlet? Útm: Amikor a kontroll csoport egyedeit kezeljük, ilyenkor kiesik a biológiai variabilitás. 93. Mikor alkalmazhatunk U-próbát? Útm: Normális eloszlásá populáció várható értékére vonatkozó nullhipotézis vizsgálatára alkalmazható, amikor a szórás ismert. 94. Mik a kétmintás t-próba (általunk tanult változatának az) alkalmazási feltételei? Útm:1. normalitás, 2. azonos szórások 95. Mikor alkalmazzuk az F-próbát? Útm: Normális eloszlásá populációk szórásának azonosságát lehet ellenÅrizni vele. A kétmintás t-próba elÅtt kell elvégezni. 96. Mi az egyoldali és a kétoldali próba közti különbség? Útm: Lásd a 82. kérdést. 97. Igaz-e az, hogy bármely eltéréshez létezik olyan szignifikancia szint mely a nullhipotézis elfogadásához vezet? Útm: Igaz, p elvileg bármilyen kis és nagy (1-hez közeli) értéket felvehet. Az már más kérdés,
10 hogy a túl kis és nagy értékek gyakorlati szempontból semmitmondóak. 98. Igaz-e az, hogy bármely eltéréshez létezik olyan szignifikancia szint mely a nullhipotézis elutasításához vezet? Útm: Igaz. 99. Befolyásolhatjuk-e a másodfajú hiba valószínáségét? Útm: Igen, a mintaelemek számával (n). 100. Befolyásolhatjuk-e az elsÅfajú hiba valószínáségét? Útm: Igen (p). 101. Az egyoldali vagy kétoldali próbával könnyebb szignifikáns eltérést kimutatni? Útm: Az egyoldalival könnyebb. 102. Normális eloszlású valószínáségi változó sáráségfüggvényének maximuma 1-gyel egyenlÅ. Mennyi a szórása? Útm: A sáráségfüggvény akkor maximális amikor az exponenciális tényezÅ egységnyi. 103. Azonos várható értéká és szórású valószínáségi változó mely értékénél veszi fel a "standardizáltja" az 1 értéket? Útm: u=(x-µ)/σ 104. Mekkora értéket vesz fel a normális eloszlású valószínáségi változó eloszlásfüggvénye a várható értéknek megfelelÅ helyen? Útm: F(x=µ)=0.5 105. Normális eloszlású valószínáségi változó sáráségfüggvénye vehet-e fel egynél nagyobb értéket? Útm: Bármekkora értéket felvehet. 106. Mennyi a folytonos eloszlású valószínáségi változó adott értékének bekövetkezési valószínásége? Útm: Zérus, mert P(x#ξ<x+∆x)=f(x)*∆x60, amikor ∆x60, függetlenül attól, hogy f(x) mekkora értéket vesz fel. 107. Mondjon példát negatív értéká valószínáségi változóra. Útm: Pl. véletlenszeráen ingadozó negatív potenciál. 108. Mi a kapcsolat a matematikai indirekt bizonyítás és a hipotézisvizsgálatok elve között? Útm: A hipotézisvizsgálatok az indirekt bizonyításon alapulnak. Számolási feladatok 1. Feladat: Tapasztalatok szerint egy hallgató szigorlata 3/5 valószínáséggel sikerül. Mennyi annak a valószínásége, hogy a mai 10 hallgató közül legalább kettÅnek sikerül leszigorlatoznia?
11 Megoldás: p=3/5=0.6, q=1-p=0.4, n=10, P(ξ$2)=?; P(ξ$2)=1-P(ξ<2)=1-0.0016777=0.9983, ahol P(ξ<2)=P(ξ=0)+P(ξ=1)=10C0x0.60x0.410+10C1x0.61x0.49=(10!/0!10!)x0.60x0.410+(10!/1!9!)x0.6 1 x0.49=0.410+10x0.6x0.49=0.0016777. 2. Feladat: A [0, b] intervallumon egyenletes eloszlású ξ valószínáségi változó várható értéke µ=M(ξ)=4. a. Számítsa ki b értékét, és adja meg a f(x) sáráségfüggvényt. b. Számítsa ki a P(ξ>4) valószínáséget. c. Mennyi az eloszlás szórása? d. Határozza meg az F(x) eloszlásfüggvényt. Megjegyzés: a ξ valószínáségi változó az [a, b] intervallumon egyenletes eloszlású, ha sáráségfüggvénye a következÅ: f(x)=1/(b-a) ha a#x#b, valamint f(x)=0, ha x
b. Megoldás: a. Mivel egyenletes eloszlás esetén µ=M(ξ)=(a+b)/2, az adatokkal 4=(0+b)/2 Y b=8. A sáráségfüggvény f(x)=1/(b-a)=1/(8-0)=1/8 ha 0#x#8, valamint f(x)=0, ha x<0 vagy x>8. b. Egyenletes eloszlás esetén annak a valószínásége, hogy a valószínáségi változó a várható értéknél nagyobb értéket vegyen fel 1/2, tehát P(ξ>4)=1/2. Azonban más úton is eljárhatunk: P(ξ>4)=1-P(ξ#4)=1-1/2=1/2, ahol P(ξ#4)=I04f(x)dx=I041/8dx=[x/8]04=4/8-0/8=1/2. c. A szórás meghatározásának legegyszerább módja: D2(ξ)=M(ξ2)-M(ξ)2=64/3-48/3=16/3 Y D(ξ)=4/%3. M(ξ2) értéke integrálással határozható meg, ha a folytonos valószínáségi változó várható értékére vonatkozó képletet alkalmazzuk: M(ξ2)=I08x2/8dx=(1/8)*I08x2dx=(1/8)*[x3/3]08=(1/8)*[83/3-03/3]=64/3. d. F(x)=I-4x f(t)dt=I0x1/8dt=x/8 ha 0#x#8, valamint F(x)=0, ha x<0 és F(x)=1 ha x>8. 3. Feladat: A majomketrechez adott órában érkezÅ látogatók várható száma 10 fÅ. Mekkora valószínáséggel érkezik 2 látogató az 5. és a 10. perc között? Megoldás: Poisson-eloszlás, λ=10/12=5/6=0.8333, P(ξ=2)=(λ2/2!)*e-λ=(0.83332/2!)*e-0.8333= =0.1509. 4. Feladat: Adott szövet esetén 10 méterre átlagosan 5 hiba jut (mivel megrágták a molyok). Mekkora valószínáséggel nem lesz hiba 20 méteres darabon? Megoldás: Poisson-eloszlás, λ=10, P(ξ=0)=(λ0/0!)*e-λ=e-10=4.53x10-5. 5. Feladat: A c paraméter milyen értékénél lehet az alábbi függvény egy folytonos valószínáségi változó sáráségfüggvénye? f(x)=c*(x-3), ha 3#x#5, valamint f(x)=0 ha x<3 vagy x>5.
12 Megoldás: f(x) csak akkor lehet sáráségfüggvény, ha csak nem-negatív értékeket vehet fel és a görbéje alatti terület egységnyi, azaz I-44 f(x)dx=1. I35 c*(x-3)dx=c*I35 (x-3)dx=c*[x2/2-3x]35=c*[(52/2-3*5)-(32/2-3*3)]=c*[(25/2-30/2)-(9/218/2)]=c*4/2=2*c. A feltétel szerint 2*c=1 amibÅl c=1/2. Tehát a keresett függvény: f(x)=(x3)/2. 6. Feladat: Egy standard normál eloszlású u valószínáségi változó milyen valószínáséggel vesz fel egy értéket 0 és 1 között? Megoldás: A keresett valószínáség P(0
13 Megoldás: µ=6, P(ξ<5)=0.35, σ=?; P(ξ<5)=P((ξ-6)/σ<(5-6)/σ)=P(u<-1/σ)=0.35. Az 1/σ=up jelöléssel: Φ(-up)=0.35, viszont a standard normális eloszlás szimmetriájából adódik, hogy Φ(up)=1-Φ(-up)=1-0.35=0.65, amihez az up érték már a táblázatból kikereshetÅ: up=0.38. Tehát 1/σ=0.38 amibÅl σ=2.6315. 11. Feladat: Az orvosi egyetemen az egyik tárgyból a hallgatók 20%-a rendre megbukik a teszt során. A pontszámok eloszlása normálisnak tekinthetÅ 72-es átlaggal és 6 pont szórással. Hány pontot kell szereznie egy hallgatónak, hogy biztosan átmenjen a vizsgán? Megoldás: µ=72, σ=6, P(ξ<xp)=F(xp)=0.2, xp=?; P(ξ<xp)=P((ξ-72)/6<(xp-72)/6)=P(u<-up)=0.2, ahol a -up=(xp-72)/6 definícióval éltünk. A standard normális eloszlás szimmetriájából adódik, hogy P(u
14 15. Feladat: Ketten lÅnek egy céltáblára. A találat valószínásége az elsÅ személy esetében 0.7, a második személy esetében 0.6. A találatok egymástól függetlenek. Ha mindketten egy-egy lövést adnak le, mennyi a valószínásége annak, hogy legalább egy találat lesz a céltáblán? Megoldás: A esemény: az elsÅ személy talál, B esemény: a második személy talál, A+B: legalább az egyik személy talál, P(A+B)=?; Az addíciós tétel értelmében P(A+B)=P(A)+P(B)-P(AB). Mivel azonban az A és B események függetlenek, P(AB)=P(A)P(B) helyettesíthetÅ, miután P(A+B)=P(A)+P(B)-P(A)P(B)=0.7+0.60.7*0.6=1.3-0.42=0.88. 16. Feladat: Egy egyetemi évfolyam matematika szakos hallgatóinak 90%-a, fizika szakos hallgatóinak 70%-a sikeresen vizsgázott. A fizika szakosok az évfolyam 18%-át teszik ki, a matematikusok a 82%-át. Mennyi a valószínásége annak, hogy egy véletlenül kiválasztott hallgató a sikeresen vizsgázottak közül való? Megoldás: B esemény: a kiválasztott hallgató sikeresen vizsgázott, M esemény: a kiválasztott hallgató matematikus, F esemény: a kiválasztott hallgató fizikus; A megfelelÅ valószínáségek: P(F)=0.18, P(M)=0.82, P(B*F)=0.7, P(B*M)=0.9. A teljes valószínáség tétele értelmében: P(B)=P(B*F)P(F)+P(B*M)P(M)=0.7*0.18+0.9*0.82.0.86. 17. Feladat: Az alábbi statisztikai adatok alapján levonhatjuk-e azt a következtetést, hogy krónikus betegségben szenvedÅ gyerekek kevésbé magabiztosak mint az egészségesek? A magabiztosság fokának osztályozására szolgáló pszichológiai tesztet 16 krónikus betegségben szenvedÅ és 21 egészséges gyerekkel végeztették el. Az összegyájtött pontok átlagát a megfelelÅ szórásokkal a következÅ táblázat tartalmazza: minta
átlag
SD
beteg gyerekek
22.5
4.1
egészséges gyerekek
26.9
3.2
Megoldás: A következtetés helyességének valószínáségét illetÅen a kétmintás t-próba elvégzésével kaphatunk információt. Azonban a kétmintás t-próba a tanult formában csak akkor alkalmazható, ha a két populáció szórása megegyezik. Ezt F-próbával ellenÅrizhetjük. Fn-1,m-1=sx2/sy2>1, ahol sz.f.=n-1 a számláló, sz.f.=m-1 a nevezÅ szabadságfoka, sx és sy a korrigált empírikus szórások (SD). Ezt a képletet a mostani adatokra alkalmazva: F16-1,212 1=F15,20=(4.1/3.2) =1.6416. A p=5%-os szignifikancia szinthez tartozó kritikus F értéket a Biometriai alapfogalmak címá jegyzet 73. oldalán találjuk a p=2.5% jelöléssel ellátott táblázatban (melynek magyarázatát lásd alább): F15,20(táblázati)=2.57. Mivel F15,20(számolt)=1.6416<2.57=F15,20(táblázati), a szórások egyformának tekinthetÅk. Megjegyzés: Az iménti számolás során lényegében két oldali próbát végeztünk p=5%-os szignifikancia szinten. Ilyenkor a nullhipotézis teljesülése esetén az F változó 0.025 valószínáséggel vesz fel olyan értéket amely a bal oldali kritikus tartományra esik és ugyancsak 0.025 valószínáséggel olyan értéket mely a jobb oldali kritikus tartományra esik, ha nem vagyunk tekintettel arra, hogy melyik szórás kerül a nevezÅbe. Ha azonban megállapodás alapján mindig a nagyobb szórást
15 osztjuk a kisebbel, akkor az F változó 0.05 valószínáséggel fog felvenni olyan értéket, mely az elÅbb meghatározott jobb oldali kritikus érték fölé esik. (A Biometriai alapfogalmak címá jegyzet 73. és 74. oldalán levÅ táblázatok egyoldali F-próbához készültek.) Mostmár a kétmintás t-próba elvégezhetÅ. Ennek képlete: tn+m-2=(<x>-)/sd, ahol sd a számláló (differencia) szórása és sz.f.=n+m-2 a szabdságfok. sd=/[(Qx+Qy)/(n+m-2)]*(1/n+1/m) (ahol a /-jel a mögötte álló teljes kifejezésre vonatkozik), Qx=(n-1)*sx2, Qy=(m-1)*sy2. Az adatok behelyettesítése után: Qx=15*4.12=252.15, Qy=20*3.22=204.8, sd=1.1989, t16+212=t35=(22.5-26.9)/1.1989=-3.669. Arra vagyunk kiváncsiak, hogy a beteg populáció várható értéke µ1 kisebb e mint az egészséges kontroll populáció µ2 várható értéke. Ezért az alternatív hipotézis amit ki akarunk mutatni: HA:µ1<µ2 (vagy µ1-µ2<0). Következésképpen a nullhipotézis amit el akarunk vetni: H0:µ1$µ2 (vagy µ1-µ2$0). Mivel azt akarjuk bizonyítani, hogy az egyik várható érték határozottan kisebb mint a másik, ezért egyoldalú t-próbát kell alkalmaznunk sz.f.=35 szabadságfok mellett, és mondjuk p=0.05 szignifikancia szinten. A táblázati kritikus érték (jegyzet 72. oldal): t35(táblázati).(t30+t40)/2=(1.697+1.684)/2=1.6905. p=0.1-hez keresünk, mivel a táblázat kétoldali próbához készült. Az átlagolás azért kell mivel a sz.f.=35 szabadságfok nem szerepel a táblázatban. Mivel t(számolt)=-3.669<-1.6905=t(táblázati), a nullhipotézist a p=0.05 szinten elvetjük és az alternatív hipotézist fogadjuk el, azt a hipotézist amit végül is alá akartunk támasztani. Tehát p=0.05 szinten az adatok nincsenek azzal ellentmodásban, hogy a beteg gyerekek kevésbé magabiztosak mint az egészségesek. Esetleges tévedésünk (az elsÅfajú hiba) valószínásége p=0.05. 18. Feladat: Személyek protoporfirin szintjét mérték két csoportban. Az egyik, 50 fÅs csoportba alkolholista férfiakat, a másik, 40 fÅs kontroll csoportba egészséges férfiakat választottak. Az átlagos protoporfirin szinteket a megfelelÅ szórásokkal az alábbi táblázat tartalmazza: minta
átlag
SD
alkoholista férfiak
340
250
egészséges férfiak
45
25
Ezen két minta alapján levonhatjuk-e azt a következtetést, hogy az alkolisták körében a protoporfirin szint magasabb az egészséges férfiaknál mért értékekhez képest? Megoldás: Kétmintás t-próbát kellene végrehajtani. A tanult képlet azonban csak akkor alkalmazható, ha a két populáció szórása megegyezik, amit F-próbával lehet ellenÅrizni. Fn-1,m2 2 2 2 1=sx /sy >1, az adatokkal: F49,39=(250/25) =10 =100. A p=0.05 szignifikancia szinten (jegyzet 73. oldal). Mivel F49,39(táblázat).(F40,40+F60,40)/2=(1.88+1.80)/2=1.84 F(számolt)>F(táblázati) az szórások azonosságát elvetjük. A kétmintás t-próbát a tanultaktól eltérÅ módon kellene végrehajtani. Azokban az esetekben is mikor a szórások nem egyenlÅk létezik t-próbán alapuló összehasonlítási eljárás, azonban a tanult változathoz képest lényegesen bonyolultabb. 19. Feladat: Gyakorol-e valamilyen hatást az ingerszegény környezet az ember α-hullám intenzitására? 20 önkéntes jelentkezÅt véletlenszeráen két egyenlÅ csoportra osztottak. Az egyik, a "kezelt" csoport tagjait ingerszegény környezetbe helyezték 10 napig. A másik, kontroll csoport tagjai ezideig normál körülmények között éltek. A kezelés végén
16 elektroenkefalográfiával megmérték a személyek α-hullám intenzitását. A következÅ adatokat kapták: Kezelt csoport: 10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4. Kontroll csoport: 11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9. Megoldás: Kétmintás t-próbát kell végezni. Mivel a változás irányára nem vagyunk kiváncsiak kétoldali próbáról van szó. Az alternatív hipotézis HA:µ1-µ2…0, a nullhipotézis H0:µ1-µ2=0. A próba "bemenÅ" paraméterei: n=10, <x>=10.28, sx=0.5978; m=10, =11.08, sy=0.4589. ElÅbb azonban a szórások azonosságát kell F-próbával ellenÅrizni. F9,9=(0.5978/0.4589)2=1.6969. A p=0.05 szinthez tartozó kritikus érték: F(táblázati)=4.03 (jegyzet 73. oldal). Mivel F(számolt)-)/sd ahol sd=/[(Qx+Qy)/(n+m-2)]*(1/n+1/m) (a /-jel a mögötte álló teljes kifejezésre vonatkozik), Qx=(n-1)*sx2, Qy=(m-1)*sy2. Az adatokkal: Qx=9*0.59782=3.2163, Qy=9*0.45892=1.8953, sd=0.2383. A számolt t érték: t10+10-2=t18=(10.28-11.08)/0.2383=-3.3571. A p=0.05 szinthez tartozó kritikus érték sz.f.=18-nál: t(táblázati)=-2.101 (jegyzet 72. oldal, kétoldali próbához készült táblázat). Mivel t(számolt)
szérum koleszterol szint
különbség (utána-elÅtte), xi
kezelés elÅtt
kezelés után
1
201
200
-1
2
231
236
5
3
221
216
-5
4
260
233
-27
5
228
224
-4
6
237
216
-21
7
326
296
-30
8
235
195
-40
9
240
207
-33
10
267
247
-20
11
284
210
-74
12
201
209
8
Megoldás: Önkontrollos kísérlet (elÅnye, hogy az adatokban meglévÅ biológiai variabilitás különbségképzéssel kiejthetÅ), egyoldali egymintás t-próba: HA:µ-µ0<0, H0:µ-µ0$0. A táblázat
17 utólsó oszlopának adatai alapján (amiket általában nekünk kell meghatároznunk különbségképzéssel) <x>=3i=111xi/n=-20.1667, sx2=3i=111(xi-<x>)2/(n-1)=535.0606, sx=23.1314, t11(számított)=(<x>-0)/(sx//n)=-20.1667/(23.1314//12)=-3.0201. A p=5%-os szignifikancia szintnek és az sz.f.=n-1=11 szabadságfoknak megfelelÅ kritikus érték: tp(táblázati)=1.796 (a jegyzet 72. oldalán p=0.1-hez kell keresni, mert ez a táblázat kétoldali próbához készült). Mivel t(számított)<-tp(táblázati), ezért az eltérés szignifikáns az 5%-os szignifikancia szinten. A nullhipotézist elvetjük. A koleszterol szint csökkenése nem a véletlennek tulajdonítható, hanem a beavatkozásnak. 21. Feladat: Egy csokoládégyár speciális 14 dkg-os csokoládészeletek gyártását kívánta megvalósítani egyik gépén, melynek szórása 2 dkg volt. A véletlenszeráen kiválasztott 25 db-os minta átlaga <x>=14.8 dkg-nak adódott. FeltételezhetÅ-e az eltérés véletlenszerásége? Megoldás: A nullhipotézis: H0:µ=µ0=14. u(számított)=(<x>-µ0)/(σ//n)=(14.814.0)/(2//25)=2.0. A p=5%-os szignifikancia szintnek megfelelÅ kritikus érték: up(táblázati)=1.96 (jegyzet 68. vagy 71. oldal). Mivel u(számított)>up(táblázati) ezért az eltérés szignifikáns az 5%-os szignifikancia szinten. 22. Feladat: Egy gyógyszer adagolóautomata 1000 mg anyag betöltésére van beállítva. Mintavétel során az alábbi értékeket kaptuk: 985, 987, 1003, 993, 996, 991, 994, 1004, 1002, 985. Vizsgáljuk meg, hogy 5%-os szignifikancia szinten teljesül-e a várható értékre az µ0=1000 mg elÅírás?, azaz a H0: µ=µ0=1000 hipotézis. Megoldás: A minta adatai alapján <x>=3i=110xi/n=994, sn2=3i=110(xi-<x>)2/(n-1)=52.222, t9(számított)=(<x>-µ0)/(sn//n)=(994-1000)/(7.226//10)=-2.626. A p=5%-os szignifikancia szintnek és az sz.f.=9 szabadságfoknak megfelelÅ kritikus érték: tp(táblázati)=2.262 (jegyzet 72. oldal). Mivel t(számított)<-tp(táblázati) ezért az eltérés szignifikáns az 5%-os szignifikancia szinten, a nullhipotézist elvetjük. 23. Feladat: Egy konzervgyár mindkét próbaüzembe állított gépén 300 grammos konzervek gyártását kezdte meg. A gépenként véletlenszeráen kiválasztott 6-6 doboz töltÅsúlya a következÅ: 1. gép: 300, 301, 303, 288, 294, 296; 2. gép: 305, 317, 308, 300, 314, 316. Az adatok alátámasztják-e azt, hogy a két gép által legyártott termékek tömegének valószínáségeloszlása azonos? Megoldás: Ha feltételezzük, hogy mindkét populáció normális eloszlású, akkor a várható értékek és a szórások azonosságát kell alátámasztani. Az adatok alapján: <x>=3i=16xi/n=297, =3j=16yj/m=310, sy2=3j=16(yj-)2/(m-1)=46; Fm-1,nsx2=3i=16(xi-<x>)2/(n-1)=30.4, 2 =F (számított)=(s /s ) =1.513. A p=5%-os szignifikancia szintnek és a sz.f.=(5, 5) 5,5 y x 1 szabadságfok párnak megfelelÅ kritikus érték: Fp(táblázati)=7.15 (jegyzet 73. oldal). Mivel F(számított)-)/sd ahol sd=/[(Qx+Qy)/(n+m-2)]*(1/n+1/m) (a /-jel a mögötte álló teljes kifejezésre vonatkozik), Qx=(n-1)*sx2, Qy=(m-1)*sy2. Az adatokkal: Qx=5*30.4=152, Qy=5*46=230, sd=3.568. A számolt t érték: t6+6-2=t10(számított)=(297-310)/3.568=-13/3.568=3.643. A p=0.05 szinthez tartozó kritikus érték az sz.f.=10 szabadságfoknál: tp(táblázati)=2.228
18 (jegyzet 72. oldal, kétoldali próbához készült táblázat). Mivel t(számolt)<-tp(táblázati), a várható értékek azonosságát kimondó nullhipotézist elvetjük. Ez viszont azt jelenti, hogy a két populáció valószínáségi eloszlása sem azonos. 24. Feladat: Legyen 1, 2, 3, 4, 5 egy ötelemá minta. Számítsa ki az empírikus közepet (<x>), az empírikus szórást (sn*), a korrigált empírikus szórást (sn=SD), és az empírikus közép szórását (s<x>=SEM). Megoldás: <x>=3i=15xi/n=3, sx*2=3i=15(xi-<x>)2/n=2, sx*=1.4142, sx2=SD2=3i=15(xi-<x>)2/(n1)=2.5, sx=SD=1.581, s<x>=SEM=sx//n=SD//n=1.581//5=0.707.