Valószínűségi változók (véletlen változók, random variables)
Példák:
tojások száma egy madárfészekben (egy adott madárfaj esetén), egy egyed testhőmérséklete (adott faj és ivar esetén),
Változó: Névvel ellátott érték. (Képzeljünk el egy fiókot. A fiók címkéje a változó neve, a fiók tartalma pedig a változó értéke.)
a következő buszon az utasok száma,
Valószínűségi változó: Olyan változó, melynek
borjú születési testtömege.
értéke szám
A formális matematikai definíció bonyolult (nem tanuljuk).
értékét véletlen tényezők is befolyásolják
A két legfontosabb kérdés:
meghatározhatóak a lehetséges értékei és azok valószínűségei Az eseményeknek a valószínűségi változók lehetséges értékei felelnek meg. Sokszori megfigyelés után sejthetjük, hogy melyik értéknek mennyi a valószínűsége, illetve
Mik a változó lehetséges értékei? (véges sok? végtelen sok? folytonos tartomány?) Hogyan adhatjuk meg a valószínűségeket az összes lehetséges eseményre? A valószínűségi változókat nagybetűkkel, a konkrét számértékeket kisbetűkkel szokás jelölni, pl. P(X=x) úgy olvasandó, hogy “annak a valószínűsége, hogy az X valószínűségi változó éppen az x értéket veszi fel”.
bizonyos értéktartományokba esésnek mennyi a valószínűsége.
A valószínűségek értékekhez vagy intervallumokhoz hozzárendelése a “modell”, amely lehet empirikus (sok madárfészek megfigyeléséből, vagy sok borjú lemázsálásából) vagy elméleti megfontolásokon alapuló (pl. a céllövésnél feltételezve, hogy minden lövés egymástól függetlenül p valószínűséggel lesz “tízes”, utána kombinatorikával továbbszámolva). Két típust különböztetünk meg, a diszkrét és folytonos változókat. Ennek csupán technikai okai vannak (másképp számolunk velük, a folytonosnál összeg helyett integrál lesz).
Diszkrét valószínűségi változó Véges sok lehetséges értéke van, vagy megszámlálhatóan végtelen sok lehetséges értéke van. Megszámlálhatóan végtelen = végtelen sok, de sorba rendezhetőek Példák véges sok értékre:
Céllövöldében 10 lövésből az eltört pálcák száma Egy fészekben a tojások száma Példák végtelen sok értékre:
A céllövöldében hányat kell lőnünk, mire eltörik az első pálca Kockadobálásnál hányadikra kapunk először hatost
Folytonos valószínűségi változó: Lehetséges értékei egy folytonos tartományt alkotnak. Minden egyes érték 0 valószínűségű, csak tartományoknak van pozitív valószínűségük Példák:
időpont 9 és 10 óra között (lehetséges értékek: 9 és 10 közötti valós számok)
Diszkrét vagy folytonos? Mindig rajtunk áll, hogy egy jelenséget diszkrét vagy folytonos változóval modellezünk. Ha például az előbbi időpontot elegendő perc pontossággal mérni, akkor választhatjuk azt a diszkrét modellt, amelyben a lehetséges értékek 9:00, 9:01, 9:02, ... 9:59, 10:00. A választás két dolgon múlik:
testhőmérséklet
melyik típus ad realisztikusabb modellt az adott jelenségre
születési testtömeg
a feltett kérdések megválaszolásához szükséges számítások melyik modellben egyszerűbbek.
A geometriai valószínűséggel kapcsolatban találkoztunk ilyen példákkal; a geometriai valószínűségi modellben feltettük, hogy az azonos hosszúságú (területű, térfogatú) tartományokhoz azonos valószínűség tartozik („egyenletes eloszlás”), de vannak olyan modellek is, amelyekben ez nem igaz
Diszkrét valószínűségi változó eloszlása Diszkrét valószínűségi változó eloszlása: a változó lehetséges értékei és a hozzájuk tartozó valószínűségek.
1. példa: jelölje az X valószínűségi változó egy kockadobás eredményét. X eloszlása: x
Az eloszlást célszerűen táblázatos formában lehet megadni. (Ha a változó értékei megszámlálhatóan végtelen halmazt alkotnak, akkor a táblázat végtelen hosszú lesz…)
P(X=x)
1 1 6
2 1 6
3 1 6
4 1 6
5 1 6
6 1 6
2. példa: most dobjunk kétszer a kockával és jelölje Y a nagyobbik számot. Y eloszlása: y P(Y=y)
1 1 36
2 3 36
3 5 36
4 7 36
5 9 36
6 11 36
Vegyük észre, hogy ha az összes valószínűséget összeadjuk, mindig 1-et kapunk. (Ezt az összefüggést számításaink ellenőrzésére is felhasználhatjuk.)
Várható érték
A várható értékre vonatkozó számolási szabályok
Diszkrét valószínűségi változó várható értéke (=átlagérték, expected value, mean value): a lehetséges értékeknek az értékekhez tartozó valószínűségekkel súlyozott összege.
Két változó összegének várható értéke:
E(S+T) = E(S) + E(T)
Két változó különbségének várható értéke:
E(S–T) = E(S) – E(T)
Jelentése: ha a változót sokszor megfigyeljük és a megfigyelt értékek átlagát vesszük, kb. ezt kapjuk (ez az érték a változónak nem feltétlenül lehetséges értéke, lásd pl. kockadobás)
Változó számszorosának várható értéke:
E(α S) = α E(S)
Változók lineáris kombinációjának várható értéke:
E(α S+β T)=αE(S)+βE(T)
Jelölése: az X változó várható értékét E(X)-szel jelöljük
Két független változó szorzatának várható értéke:
E(ST) = E(S)E(T)
Képlete a fenti definíciónak megfelelően: E(X) = Σ pi xi , ahol az xi-k jelölik a változó értékeit és a pi-k az értékekhez tartozó valószínűségeket Ha a változó értékkészlete végtelen, akkor ez az összeg is végtelen lehet
A példabeli X változó várható értéke: E(X) =
1 1 1 1 1 1 21 ⋅1 + ⋅2 + ⋅3 + ⋅4 + ⋅5 + ⋅6 = = 6 6 6 6 6 6 6
3.5
Feltételes eloszlás
Feltételes várható érték
Feltételes eloszlás: Az X változónak az F eseményre, mint feltételre vett feltételes eloszlását úgy kapjuk, hogy X-nek csak azokat az értékeit tekintjük, amelyekre az F feltétel teljesül, a hozzájuk tartozó valószínűségek pedig a P( X = xi | F ) feltételes valószínűségek lesznek.
Feltételes várható érték: ugyanúgy definiáljuk és ugyanúgy számoljuk, mint a feltétel nélküli várható értéket, de a feltételes eloszlásból.
Példa:
Dobjunk kétszer egy kockával és jelölje Y a nagyobbik számot. Y feltételes eloszlása, feltéve, hogy mindkét dobott szám páratlan: y
1
3
5
P(Y=y|F)
1 9
3 9
5 9
A feltételes eloszlásra is igaz, hogy ha az összes valószínűséget összeadjuk, 1-et kapunk (amit most is jól használhatunk számításaink ellenőrzésére).
Egy fontos összefüggés (a teljes valószínűség tételének megfelelője, nevezhetnénk akár a „teljes várható érték tételének“ is): Hogyan kaphatjuk meg egy változó feltétel nélküli várható értékét, ha ismerjük a feltételes várható értékét az Fi feltételekre, melyek együtt teljes eseményrendszert alkotnak?
E(Y) = ΣE(Y|Fi)P(Fi)
Nevezetes diszkrét eloszlások: modellek gyakorisági adatokra (count data)
Hipergeometrikus eloszlás (visszatevés nélküli mintavétel)
Diszkrét egyenletes eloszlás
N egyedből álló populációból, amelyben valamely tulajdonsággal K egyed rendelkezik, egy n különböző elemből álló véletlen mintát veszünk. Az X valószínűségi változó a mintába került, az adott tulajdonsággal rendelkező egyedek száma.
Véges sok érték, mind ugyanakkora valószínűséggel:
Hallgatólagos feltevés: minden lehetséges minta egyformán valószínű!
X : x1 , x2 ,..., xn
Példa:
1 P ( X = xi ) = , n
i = 1,2,..., n
Példák:
Kockadobás Urna-modell: cédulákra számokat írunk, és egyet kihúzunk. Várható érték: E ( X ) =
∑ xi n
Binomiális eloszlás (visszatevéses mintavétel, ismételt megfigyelések) Azonos körülmények között, egymástól függetlenül n-szer elvégzünk egy megfigyelést vagy kísérletet, amelyben egy bizonyos kimenetel valószínűsége p. Az X valószínűségi változó a szóban forgó kimenetel bekövetkezéseinek száma.
X lehetséges értékei a 0 és n közötti számok. Példák:
ötször feldobunk két pénzt és számoljuk, hányszor jön ki FF. X: a FF dobások száma, n = 5, p = 0.25. X: 7 gyermekes családban a lányok száma, n = 7, p = 0.5 n A k értékhez (k = 0, 1, 2, ... , n) tartozó valószínűség P ( X = k ) = p k (1 − p )n − k k
Egy kutyamenhely 72 lakója közül 18 fajtatiszta. X: tíz találomra választott kutya között a fajtatiszták száma. N = 72, K = 18, n = 10. X lehetséges értékei a 0 és n közötti számok. A k értékhez (k = 0, 1, 2, ... , n) tartozó valószínűség így számolható:
K N − K k n − k P( X = k ) = N n
Valójában egy eloszlás-családról van szó, annyi különböző eloszlásról, ahányféleképpen az N, K, n paraméterek megválaszthatók (ezek a megjegyzések a többi eloszlásra is vonatkoznak).
Várható érték: E ( X ) = n
K N
Speciális eset: visszatevéses mintavétel (mint a kutyamenhelyen, de a megvizsgált kutyát visszaengedjük; ekkor csak a p = K / N arány számít, pl. ha a kutyák negyede fajtatiszta, mindegy, hogy 4-ből 1, vagy 400-ból 100; és most n > K is lehetséges). A binomiális eloszlást használják – közelítő megoldásként – a visszatevés nélküli mintavétel esetén is, ha a minta kicsi a populációhoz képest, hagyományosan, ha n ≤ 0.05⋅N .
A binomiális modell érvényességéhez mindig meg kell gondolni a következőket: A megfigyelések függetlennek tekinthetők? A p valószínűség minden megfigyelésre azonos? Példa:
Egér a labirintusban, 10 futás, X: hányszor találja meg a sajtot 1 percen belül.
Az eloszlás paraméterei az n és a p (ez is eloszlás-család, a tagokat az n és a p jellemzi).
n = 10, p = ???
Várható érték: E(X) = np
p állandó? Nem hasznosítja az előző futások tapasztalatait? Talán minden futáshoz át kellene rendezi a labirintust?
Poisson eloszlás (spontán előfordulások száma egy adott tartományban) Számoljuk, hogy egy adott idő alatt, egy adott területen, térfogatban, egy adott anyagmennyiségben hányszor figyelhetünk meg egy eseményt Példák:
Az előfordulások átlagos száma arányos az időtartam, terület, stb. nagyságával (fél nap alatt átlagosan fele annyi kutya, öt adag rizibiziben átlagosan ötször annyi szem borsó, stb.), A nem átfedő időtartamokban, területrészeken, stb. megfigyelt gyakoriságok függetlenek egymástól (pl. a délelőtt és délután érkező kutyák száma).
X: hány kutya jön be a kapun egy nap alatt, Y: hány elefánt létható egy légifelvételen,
Gyakran olyan binomiális eloszlású változók közelítésére használják, amelyeknek n paramétere igen nagy, p paramétere pedig igen kicsi.
Z: hány szem borsót találunk egy adag rizibiziben, X lehetséges értékei a nem negatív számok: 0, 1, 2, 3, ... . Gyakorlati esetekben mindig van felső korlátot, de elméletileg nem érdemes korlátozni. A k értékhez (k = 0, 1, 2, 3, 4, ...) tartozó valószínűség, P ( X = k ) =
Hallgatólagos feltételezések, amelyekből a valószínűségek fenti képlete kijön:
λk k!
e −λ
Az eloszlás paramétere λ, jelentése az előfordulások átlagos száma (a Poisson eloszlás is egy család, “családtagjait” λ azonosítja).
Tehát, ha egy ritka esemény (p kicsi) bekövetkezéseit számoljuk egy kísérlet nagyszámú ismétlése során (n nagy), akkor ennek a változónak az eloszlása jól közelíthető a Poisson-eloszlással, mégpedig a λ = np paraméterű Poissonnal (mert ugyanaz az átlaguk!). Alkalmazások: baktérium ill. vérsejt számlálás, esőcseppek eloszlása, nyomdai hibák egy könyvben, kórházban születések, ill. halálozások napi száma, stb.
Várható érték: E(X) = λ
Negatív binomiális eloszlás Számoljuk, hogy (azonos körülmények között egymástól függetlenül) hányszor kell ismételni egy megfigyelést addig, amíg egy – mindegyik ismétléskor p valószínűségű – esemény k-szor bekövetkezik. A véletlen szám nem a szükséges ismétlések száma, hanem a szükséges ismétlések száma mínusz k (csak azért, hogy a lehetséges értékek itt is 0, 1, 2, ... legyenek). Az eloszlás paraméterei p és k. Bár a negatív binomiális eloszlásnak ez a szokásos származtatása, ebből egyáltalán nem látszik, hogy miért alkalmas gyakorisági adatok modellezésére. Egy másik származtatás szerint (amit precízen elég körülményes megfogalmazni) a negatív binomiális eloszlás előáll, mint különböző paraméterű Poisson eloszlások keveréke. A részleteket nem tárgyaljuk.
Binomiális eloszlás közelítése Poisson eloszlással, ha 0.1≤np≤10. Az eloszlás paramétere λ = np
Normális eloszlással, ha np≥5 és nq≥5, ahol q=1-p Az eloszlás N (np , npq )
Középértékek vagy helyzeti mutatók “Ha a véletlen változót egyetlen jellemző értékkel kellene leírni, melyik szám lenne az?” Ne felejtsük el, hogy az “egyetlen számmal jellemzés” mindig információveszteséggel jár, nem mutatja az értékek szóródását, variabilitását.
Várható érték E ( X ) = ∑ xi p ( xi )
Medián Olyan értelemben „közepes” x érték, hogy sem az x-nél kisebb, sem pedig az x-nél nagyobb értékek együttes valószínűsége nem haladja meg az 1/2-et, azaz P(X<x)≤1/2, és P(X>x)≤1/2.
Kvantilisek A p-kvantilis olyan x érték, hogy az x-nél kisebb értékek együttes valószínűsége nem haladja meg a p-t, az x-nél nagyobb értékek valószínűsége pedig nem haladja meg az (1-p)-t, azaz
A kiugró értékek nagyon el tudják húzni!
P(X<x) ≤ p
Módusz
Az 1/2-kvantilis épp a medián. Az 1/4-kvantilis az alsó kvartilis (Q1), a 3/4-kvantilis a felső kvartilis (Q3). A p-kvantilist 100p-percentilisnek is szokás nevezni.
Az az xk érték, amelyhez tartozó pk valószínűség maximális, vagyis a leggyakrabban előforduló érték. Nem mindig egyértelmű – egy eloszlás lehet unimodális, bimodális, multimodális stb. Kettőnél több módusz esetén nem használjuk.
Szóródási mutatók diszkrét változókra Ezek csak a “szóródást” mutatják, a “helyzetet” nem.
Interkvartilis terjedelem:
és
P(X>x) ≤ (1-p).
Vigyázat! Angol nyelvterületen a mean szót nem feltétlenül az átlagra használják, így aztán ugyanazokból az adatokból különböző érdekcsoportok különböző eredményeket tudnak számolni!
Szórásnégyzet vagy variancia ("átlagos négyzetes eltérés") A változó várható érték körüli koncentráltságát, illetve szóródását fejezi ki. Nemnegatív.
nagy variancia: a változó értékei erősen szórtak
Az alsó és felső kvartilis különbsége IQR = Q3-Q1 .
kis variancia: a változó a várható értéke körül koncentrálódik
Terjedelem
0 variancia: egyetlen lehetséges (nem 0 valószínűségű) érték van
A maximális és a minimális érték különbsége
Jelölés: σ 2 ( X ) vagy var(X) Matematikailag a szórásnégyzet a változó várható értékétől való négyzetes eltérésének várható értéke, vagyis var(X) = E{(X – E(X))2} = E(X 2) – E(X)2
Diszkrét változó szórásnégyzetének kiszámítása: var(X) = ∑ xi2pi – (∑ xi pi)2
A variancia tulajdonságai
Három nevezetes eloszlás várható értéke és varianciája:
var(aX) = a2 var(X)
bármely a∈R-re
var(X+Y) = var(X) + var(Y) 2
2
var(aX+bY) = a var(X) + b var(Y)
Szórás A szórás a variancia négyzetgyöke
ha X és Y függetlenek következik az előző kettőből
várható érték
variancia
binomiális
np
np(1-p)
Poisson
λ
λ
negatív binomiális
k p
k (1 − p) p2
hip.geo. és binom.: var < átlag , Poisson: var = átlag , neg.bin.: var > átlag (overdispersion)