Bevezetés
1/5
file:///L:/ValSz%C3%A1mStatV%C3%A9gleges/bernoulli/Introduction...
Virtuális laboratóriumok > 10. Bernoulli kísérletek > 1 2 3 4 5 6
1. Bevezetés Alapelmélet A Bernoulli kísérlet folyamat, melynek névadója Jacob Bernoulli a valószínűségszámítás egyik legegyszerűbb, de egyben egyik legfontosabb véletlen kísérlet folyamata is. Lényegében a folyamat az érmefeldobás matematikai absztrakciója, de széleskörű alkalmazhatóságának következtében megállapodunk abban, hogy kielégíti a következő feltételeket: 1. Minden kísérletnek két lehetséges kimenetele van, melyeket a megbízhatóság vizsgálatából származó kifejezésekkel sikeresnek és sikertelennek nevezünk. 2. A kísérletek függetlenek. Egyik kísérlet kimenetele sem befolyásolja egy másik kísérlet kimenetelét. 3. Minden kísérletnél annak valószínűsége, hogy a kísérlet sikeres p és annak valószínűsége, hogy sikertelen 1 − p. Valószínűségi változók Matematikailag a Bernoulli kísérleteket egy valszínűségi változó indikátor sorozatának tekintjük: X = (X 1 , X 2 , ...) Egy indikátor változó egy valószínűségi változó, amely csak az 1 vagy 0 értéket veszi fel aszerint, hogy a kísérlet sikeres, vagy nem sikeres. Az X j indikátor változó egyszerűen a j-edik kísérlet kimenetelének az eredménye. Így az indikátor változók függetlenek és ugyanolyan eloszlású sűrűségfüggvénnyel rendelkeznek: ℙ(X i = 1) = p, ℙ(X i = 0) = 1 − p Az ezen sűrűségfüggvény által definiált eloszlás Bernoulli eloszlás néven ismeretes. Statisztikai értelemben a Bernoulli kísérletek a Benoulli eloszlásból vett mintának felelnek meg. Speciálisan, az első n (X 1 , X 2 , ..., X n ) kísérlet a Bernoulli eloszlásból vett n elemű véletlen mintát alkot. Megjegyezzük, hogy a Bernoulli kísérletek egy paraméterrel, a p valószínűséggel jellemezhetők. 1. Felhasználva az alapfeltevéseket mutassuk meg, hogy az első n kísérlet sűrűségfüggvénye az alábbi módon adható meg ℙ(X 1 = x1 , X 2 = x2 , ..., X n = xn ) = p k (1 − p) n − k , (x1 , x1 , ..., xn ) ∈ {0, 1} n ahol k = ∑in= 1 xi 2. Feltételezve, hogy X = (X 1 , X 2 , ...) egy p paraméterű Bernoulli kísérlet, mutassuk meg, hogy 1 − X = (1 − X 1 , 1 − X 2 , ...) egy 1 − p paraméterű Bernoulli kísérlet. 3. Tételezzük fel, hogy U = (U 1 , U 2 , ...) független valószínűségi változóknak egy sorozata, mindegyik egyenletes eloszlású a [0, 1] intervallumon. p ∈ [0, 1] és i ∈ Գ+ , esetén legyen X i (p) = 1(U i ≤ p) az {U i ≤ p} esemény indikátor változója. Mutassuk meg, hogy X(p) = (X 1 (p), X 2 (p), ...) p paraméterű Bernoulli kísérlet. Megjegyezzük, hogy az előző gyakorlatban a Bernoulli kísérletek a p paraméter minden lehetséges értéke esetén egy közös valószínűségi téren vannak definiálva. A konstrukció ezen típusára néha mint összekapcsolt kísérletekre hivatkozunk. Ez a gyakorlat azt is mutatja, hogyan szimuláljuk a Benoulli kísérleteket véletlen számok segítségével. Az összes többi véletlen kísérlet (folyamat), amit ebben a fejezetben tanulmányozunk a Bernoulli kísérletsorozatnak a függvényei és ezért is tudjuk szimulálni. Momentumok A későbbi hivatkozásokhoz számítsuk ki a ℙ(X = 1) = p paraméterű X általános indikátor változó várható értékét, varianciáját, és a valószínűség generáló függvényét.
2011.03.17. 14:23
Bevezetés
2/5
file:///L:/ValSz%C3%A1mStatV%C3%A9gleges/bernoulli/Introduction...
4. Mutassuk meg, hogy ॱ(X) = p. 5. Mutassuk meg, hogy var(X) = p (1 − p). 6. Mutassuk meg, hogy ॱ(t X ) = (1 − p) + p t, t ∈ Թ. 7. Vázoljuk fel az 5. gyakorlatban a varianciát, mint p függvényét. Figyeljük meg, hogy a variancia akkor a legnagyobb, amikor p = 12 és akkor a legkisebb, amikor p = 0 vagy p = 1.
Példák és alkalmazások Mint korábban megjegyeztük, a Bernoulli kísérletek egy kézenfekvő pédája a pénzérmekísérletek, ahol a síker jelenti a fej, a sikertelenség az írásdobást. A p paraméter a fejdobás valószínűsége(így általában az érme nem szabályos.). 8. Az alap érmekísérletben legyen n = 20 és p = 0.1. Végezzük el a kísérletet és figyeljük meg az eredményeket. Ismétlejük meg a kísérletet az alábbi értékekkel: p ∈ {0.3, 0.5, 0.7, 0.9}. Általános példák Egy bizonyos értelemben a Bernoulli kísérletek legáltalánosabb példája akkor fordul elő, amikor egy kísérletet megismétlünk. Speciálisan tételezzük fel, hogy van egy alapkísérletünk és egy A esemény érdekel minket. Tegyük fel, hogy egy összetett eseményt hozunk létre, ami az alapkísérlet független megismétléseiből áll. Azt mondjuk, hogy az i-edik kísérlet sikeres, ha az A esemény bekövetkezik az i-edik ismétlésre és az i-edik kísérlet sikertelen, ha az A esemény nem következik be az i -edik ismétlésre. Ez nyilvánvalóan egy p = ℙ(A) Bernoulli kísérlet sorozatot definiál. Bernoulli kísérleteket dichotom populációból is alkothatunk. Speciálisan tételezzük fel, hogy van egy populációnk, amelynek két típusú kimenetele van, amelyekre 0-val és 1-gyel hívatkozunk. Például lehet szó személyről aki vagy férfi vagy nő, vagy egy alkatrészről, ami vagy jó vagy hibás. Válasszunk ki n objektumot véletlenszerűen a populációból; definíció szerint ez azt jelenti, hogy ha egyszerre (visszatevés nélkül) történik az elemek kiválasztása, akkor a populációban mindegyik objektum egyenlő valószínűséggel választható ki. Ha a mintavétel visszatevéssel történik, akkor mindegyik objektum a következő húzás elött visszakerül a kihúzandók közé. Ebben az esetben az egymás utáni húzások függetlenek, így a mintában lévő objektumok típusai p paraméterű Bernoulli kísérleteknek egy sorozatát alkotják. Ez a paraméter a populációban lévő 1-es objektumtípusainak hányada. Ha a mintavétel visszatevés nélküli, akkor az egymás utáni húzások nem függetlenek, így a mintában lévő objektumok típusai nem alkotják Bernoulli kísérleteknek egy sorozatát. Azonban, ha a populáció mérete a mintavétel méretéhez viszonyítva nagy, a függőség elhanyagolható, így az összes gyakorlati tervben a mintában lévő objektumok típusai Bernoulli kísérletek sorozataként kezelhetők. További diszkussziók találhatók a dichotom populációból való mintavételről a Véges elemű mintamodellek c. fejezetben. 9. Tételezzük fel, hogy egy hallgató többválaszos tesztet tölt ki. A teszt 10 kérdésből áll, melyek mindegyikére 4 lehetséges válasz van (de csak 1 a helyes). Ha a hallgató vakon találgat mindegyik kérdésnél, meg tudjuk úgy csinálni a kérdéseket, hogy Bernoulli kísérletsorzatot kapjunk? Ha így áll a dolog, azonosítsuk a kísérlet kimeneteleit és a p paramétert! 10. Az A pályázó egy bizonyos körzetben indul a jelölésért. Húsz személyt kiválasztottak a szavazók közül véletlenszerűen és megkérdezték tőlük, vajon az A személyre szavaznak-e. A válaszok alkothatnak-e Bernoulli kísérletsorozatot? Ha igen, azonosítsuk a kísérlet kimeneteleit és a p paramétert! 11. Egy amerikai rulettben 38 vájat van; 18 piros, 18 fekete és 2 zöld. A játékos 15-ször rulettezik, minden egyes alkalommal a pirosra fogadva. A kimenetelek alkothatnak-e Bernoulli kísérletsorozatot? Ha igen, azonosítsuk a kísérlet kimeneteleit és a p paramétert! A Rulettet részletesebben a Szerencsejáték fejezetben elemezzük.
2011.03.17. 14:23
Bevezetés
3/5
file:///L:/ValSz%C3%A1mStatV%C3%A9gleges/bernoulli/Introduction...
12. Két tenisz játékos 6 gémből álló meccset játszik. A kimenetelek alkothatnak-e Bernoulli kísérletsorozatot? Ha igen, azonosítsuk a kísérlet kimeneteleit és a p paramétert!
Megbízhatóság Emlékeztetünk ara, hogy a szerkezeti megbízhatóság standard modelljében a rendszer n komponensből áll, amelyek egymástól függetlenül működnek. Jelölje X i az i-edik komponens állapotát, ahol 1 jelenti, hogy működik, 0 jelenti, hogy hibás a komponens. Ha a komponensek mindegyike ugyanolyan típúsú, akkor alapfeltevésünk, hogy az X = (X 1 , X 2 , ..., X n ) állapot vektor Bernoulli kísérleteknek egy sorozata. A rendszer állapota (ismét 1 jelenti, hogy működik, 0 jelenti, hogy hibás a komponens) csak a komponensek állapotától függ és így egy valószínűségi változó Y = s(X 1 , X 2 , ..., X n ) ahol s : {0, 1} n → {0, 1} a struktúra függvény. Általában annak valószínűsége, hogy az eszköz működik, az eszköz megbízhatósága, így a Bernoulli kísérletsorozat p paramétere a komponensek közös megbízhatósága. A függetlenség miatt a rendszer megbízhatósága r a komponens megbízhatóságnak egy függvénye: r(p) = ℙp (Y = 1), p ∈ [0, 1] ahol hangsúlyozzuk a p paraméteren értelmezett ℙ valószínűségi mező függetlenségét. Általában elég, ha ezt a függvényt, mint megbízhatósági függvényt ismerjük. Rendszerint az a feladatunk, hogy megtaláljuk a megbízhatósági függvényt, és megtaláljuk a struktúrafüggvényt. 13. Emlékeztetünk arra, hogy egy soros rendszer akkor és csak akkor működik, ha mindegyik komponense működik. a. Mutassuk meg, hogy a rendszer állapota Y = X 1 X 2 ··· X n = min {X 1 , X 2 , ··· , X n } b. Mutassuk meg, hogy a megbíhatósági függvény r(p) = p n p ∈ [0, 1] esetén. 14. Emlékeztetünk arra, hogy egy párhuzamos rendszer akkor és csak akkor működik, ha legalább az egyik komponense működik. a. Mutassuk meg, hogy a rendszer állapota Y = 1 − (1 − X 1 ) (1 − X 2 ) ··· (1 − X n ) = max {X 1 , X 2 , ··· , X n } b. Mutassuk meg, hogy a megbízhatósági függvény r(p) = 1 − (1 − p) n p ∈ [0, 1] esetén. Emlékeztetünk arra, hogy néhány esetben a rendszert reprezentálhatjuk, mint egy gráfot vagy hálózatot. Az élek a komponenseket, a csúcsok a komponensek közötti kapcsolatokat reprezentálják. A rendszer akkor és csak akkor működik, ha létezik két kijelölt csúcs között működő útvonal, amelyeket a-val és b-vel jelölünk. 15. Adjuk meg az alábbi Wheatstone híd hálózatának megbízhatóságát (a névadó Charles Wheatstone)
Összegyűjtött vérvizsgálat
2011.03.17. 14:23
Bevezetés
4/5
file:///L:/ValSz%C3%A1mStatV%C3%A9gleges/bernoulli/Introduction...
Tételezzük fel, hogy egy populációban minden személy, egymástól függetlenül p valószínűséggel rendelkezik egy bizonyos betegséggel. Így, a betegséget illetően a populációban lévő személyek Bernoulli kísérletsorozatot alkotnak. A betegséget egy vérvizsgálattal lehet azonosítani, aminek természetesen költsége van. Egy k létszámú csoport ( k > 1 ) esetén két stratégiát követhetünk. Az első szerint minden személyt megvizsgálunk egyenként, s ezért k személyt kell vizsgálnunk, s így k vérvizsgálatot kell végeznünk. A második stratégia szerint összegyűjtjük a k személy vérmintáját és először együtt vizsgáljuk (egyetlen egy teszttel). Feltételezzük, hogy a teszt eredménye akkor és csak akkor negatív, ha a k személy mindegyike egészséges. Ebben az esetben egy teszt elvégzése szükséges. Másrészről a teszt eredménye akkor és csak pozitív, ha legalább egy személy beteg, ekkor egyenként tesztelni kell a személyeket. Ennél a stratégiánál k + 1 teszt végrehajtása szükséges. Jelölje Y az összegyüjtött stratégia esetén a szükséges tesztek számát. 16. Mutassuk meg, hogy a. ℙ(Y = 1) = (1 − p) k , ℙ(Y = k + 1) = 1 − (1 − p) k . b. ॱ(Y) = 1 + k (1 − (1 − p) k ). c. var(Y) = k 2 (1 − p) k (1 − (1 − p) k ). 17. Mutassuk meg, hogy várható értékben megadva az összegyűjtött stratégia akkor és csak akkor jobb, mint az alapstratégia, ha 1
1 k p < 1 − k 1
A pk = 1 − ( 1k ) k kritikus érték ábráját, mint k ∈ [2, 20] -nak a függvényét mutatja az alábbi ábra:
18. Mutassuk meg, hogy a. pk maximális értéke k = 3 esetén van, és p3 ≈ 0.307. b. pk → 0 ha k → ∞. A 18. gyakorlatból következik, hogy ha p ≥ 0.307, akkor az összegyűjtésnek nincs értelme, tekintet nélkül a csoport kméretére. A másik szélsőséges esetben, ha p nagyon kicsi, a betegség igen ritka, az összegyűjtés jobb, kivéve, ha a k csoportméret nagyon nagy. Most tételezzük fel, hogy n személyünk van. Ha k|n akkor tudunk csinálni részpopulációkat,
n k
csoport van és
mindegyik csoportban k személy. Alkalmazzuk az összegyüjtött stratégiát mindegyik csoportra. Megjegyezzük, hogy k = 1 megfelelel egyetlen egy tesztnek és k = n megfelelel a teljes populációra vonatkozó összegyűjtött stratégiának. Jelölje Y i az i csoporthoz szükséges tesztek számát. 19. Bizonyítsik be, hogy (Y 1 , Y 2 , ..., Y n / k ) függetlenek és mindegyikük a 16. gyakorlatban megadott eloszlással rendelkezik.
2011.03.17. 14:23
Bevezetés
5/5
file:///L:/ValSz%C3%A1mStatV%C3%A9gleges/bernoulli/Introduction...
Az ehhez szükséges tesztek teljes számára az alábbi terv érvényes Z n, k = Y 1 + Y 2 + ··· + Y n / k 20. Mutassuk meg, hogy a tesztek teljes számának várható értéke n, ॱ(Z n, k ) = 1 k n 1 + − (1 − p) , k 21. Mutassuk meg, hogy a tesztek teljes számának varianciája 0, var(Z n, k ) = k k n k (1 − p) (1 − (1 − p) ),
k=1 k>1
k=1 k>1
Így, a várható értékkel kapcsolatban az optimális stratégia a populáció felosztása
n k
darab k fős csoportra, ahol k a
20. gyakorlatban definiált függvényt minimalizálja. Igen nehéz k optimális értékére zárt formulát adni, de ez az érték numerikusan meghatározható konkrét n és p értékekre. 22. n és p következő értékeire adjuk meg az optimális összegyűjtéshez a k értéket és a tesztek várható számát. (Szorítkozzunk k azon értékeire, amelyek osztják n értékét!) a. n = 100, p = 0.01. b. n = 1000, p = 0.05. c. n = 1000, p = 0.001.
Ha k nem osztója n-nek, akkor az n személyből álló populációt ہn / k ۂcsoportra bontjuk k személyt téve mindegyik csoportba és a “maradék” csoport n mod k személyből áll. Ez nyilvánvalóan bonyolítja az elemzést, de nem vezet be új ötletet, így ennek az esetnek a vizsgálatát az érdeklődő olvasóra bízzuk. Virtuális laboratóriumok > 10. Bernoulli kísérletek > 1 2 3 4 5 6 Tartalom | Appletek | Adathalmazok | Életrajzok | Külső forrásmunkák | Kulcsszavak | Visszacsatolás | ©
2011.03.17. 14:23