Valószínűségi változók (véletlen változók, random variables)
Változó: Névvel ellátott érték. (Képzeljünk el egy fiókot. A fiók címkéje a változó neve, a fiók tartalma pedig a változó értéke.) Valószínűségi változó: Olyan változó, melynek értéke szám értékét véletlen tényezők is befolyásolják meghatározhatóak a lehetséges értékei és azok valószínűségei Az eseményeknek a valószínűségi változók lehetséges értékei felelnek meg. Sokszori megfigyelés után sejthetjük, hogy melyik értéknek mennyi a valószínűsége, illetve bizonyos értéktartományokba esésnek mennyi a valószínűsége.
Példák:
tojások száma egy madárfészekben (egy adott madárfaj esetén), egy egyed testhőmérséklete (adott faj és ivar esetén), a következő buszon az utasok száma, borjú születési testtömege. A formális matematikai definíció bonyolult (nem tanuljuk).
A két legfontosabb kérdés: Mik a változó lehetséges értékei? (véges sok? végtelen sok? folytonos tartomány?) Hogyan adhatjuk meg a valószínűségeket az összes lehetséges eseményre? A valószínűségi változókat nagybetűkkel, a konkrét számértékeket kisbetűkkel szokás jelölni, pl. P(X=x) úgy olvasandó, hogy “annak a valószínűsége, hogy az X valószínűségi változó éppen az x értéket veszi fel”.
A valószínűségek értékekhez vagy intervallumokhoz hozzárendelése a “modell”, amely lehet empirikus (sok madárfészek megfigyeléséből, vagy sok borjú lemázsálásából) vagy elméleti megfontolásokon alapuló (pl. a céllövésnél feltételezve, hogy minden lövés egymástól függetlenül p valószínűséggel lesz “tízes”, utána kombinatorikával továbbszámolva). Két típust különböztetünk meg, a diszkrét és folytonos változókat. Ennek csupán technikai okai vannak (másképp számolunk velük, a folytonosnál összeg helyett integrál lesz).
Diszkrét valószínűségi változó Véges sok lehetséges értéke van, vagy megszámlálhatóan végtelen sok lehetséges értéke van. Megszámlálhatóan végtelen = végtelen sok, de sorba rendezhetőek Példák véges sok értékre:
Céllövöldében 10 lövésből az eltört pálcák száma Egy fészekben a tojások száma Példák végtelen sok értékre:
A céllövöldében hányat kell lőnünk, mire eltörik az első pálca Kockadobálásnál hányadikra kapunk először hatost
Folytonos valószínűségi változó: Lehetséges értékei egy folytonos tartományt alkotnak. Minden egyes érték 0 valószínűségű, csak tartományoknak van pozitív valószínűségük Példák:
időpont 9 és 10 óra között (lehetséges értékek: 9 és 10 közötti valós számok) testhőmérséklet születési testtömeg A geometriai valószínűséggel kapcsolatban találkoztunk ilyen példákkal; a geometriai valószínűségi modellben feltettük, hogy az azonos hosszúságú (területű, térfogatú) tartományokhoz azonos valószínűség tartozik („egyenletes eloszlás”), de vannak olyan modellek is, amelyekben ez nem igaz
Diszkrét vagy folytonos? Mindig rajtunk áll, hogy egy jelenséget diszkrét vagy folytonos változóval modellezünk. Ha például az előbbi időpontot elegendő perc pontossággal mérni, akkor választhatjuk azt a diszkrét modellt, amelyben a lehetséges értékek 9:00, 9:01, 9:02, ... 9:59, 10:00. A választás két dolgon múlik: melyik típus ad realisztikusabb modellt az adott jelenségre a feltett kérdések megválaszolásához szükséges számítások melyik modellben egyszerűbbek.
Diszkrét valószínűségi változó eloszlása Diszkrét valószínűségi változó eloszlása: a változó lehetséges értékei és a hozzájuk tartozó valószínűségek. Az eloszlást célszerűen táblázatos formában lehet megadni. (Ha a változó értékei megszámlálhatóan végtelen halmazt alkotnak, akkor a táblázat végtelen hosszú lesz…)
1. példa: jelölje az X valószínűségi változó egy kockadobás eredményét. X eloszlása: x P(X=x)
1 1 6
2 1 6
3 1 6
4 1 6
5 1 6
6 1 6
2. példa: most dobjunk kétszer a kockával és jelölje Y a nagyobbik számot. Y eloszlása: y P(Y=y)
1 1 36
2 3 36
3 5 36
4 7 36
5 9 36
6 11 36
Vegyük észre, hogy ha az összes valószínűséget összeadjuk, mindig 1-et kapunk. (Ezt az összefüggést számításaink ellenőrzésére is felhasználhatjuk.)
Várható érték Diszkrét valószínűségi változó várható értéke (=átlagérték, expected value, mean value): a lehetséges értékeknek az értékekhez tartozó valószínűségekkel súlyozott összege. Jelentése: ha a változót sokszor megfigyeljük és a megfigyelt értékek átlagát vesszük, kb. ezt kapjuk (ez az érték a változónak nem feltétlenül lehetséges értéke, lásd pl. kockadobás) Jelölése: az X változó várható értékét E(X)-szel jelöljük Képlete a fenti definíciónak megfelelően: E(X) = Σ pi xi , ahol az xi-k jelölik a változó értékeit és a pi-k az értékekhez tartozó valószínűségeket Ha a változó értékkészlete végtelen, akkor ez az összeg is végtelen lehet
A példabeli X változó várható értéke: E(X) = 3.5
1 1 1 1 1 1 21 ⋅1 + ⋅2 + ⋅3 + ⋅4 + ⋅5 + ⋅6 = = 6 6 6 6 6 6 6
A várható értékre vonatkozó számolási szabályok Két változó összegének várható értéke:
E(S+T) = E(S) + E(T)
Két változó különbségének várható értéke:
E(S–T) = E(S) – E(T)
Változó számszorosának várható értéke:
E(α S) = α E(S)
Változók lineáris kombinációjának várható értéke:
E(α S+β T)=αE(S)+βE(T)
Két független változó szorzatának várható értéke:
E(ST) = E(S)E(T)
Feltételes eloszlás Feltételes eloszlás: Az X változónak az F eseményre, mint feltételre vett feltételes eloszlását úgy kapjuk, hogy X-nek csak azokat az értékeit tekintjük, amelyekre az F feltétel teljesül, a hozzájuk tartozó valószínűségek pedig a P( X = xi | F ) feltételes valószínűségek lesznek.
Példa:
Dobjunk kétszer egy kockával és jelölje Y a nagyobbik számot. Y feltételes eloszlása, feltéve, hogy mindkét dobott szám páratlan: y
1
3
5
P(Y=y|F)
1 9
3 9
5 9
A feltételes eloszlásra is igaz, hogy ha az összes valószínűséget összeadjuk, 1-et kapunk (amit most is jól használhatunk számításaink ellenőrzésére).
Feltételes várható érték Feltételes várható érték: ugyanúgy definiáljuk és ugyanúgy számoljuk, mint a feltétel nélküli várható értéket, de a feltételes eloszlásból. Egy fontos összefüggés (a teljes valószínűség tételének megfelelője, nevezhetnénk akár a „teljes várható érték tételének“ is): Hogyan kaphatjuk meg egy változó feltétel nélküli várható értékét, ha ismerjük a feltételes várható értékét az Fi feltételekre, melyek együtt teljes eseményrendszert alkotnak?
E(Y) = ΣE(Y|Fi)P(Fi)
Nevezetes diszkrét eloszlások: modellek gyakorisági adatokra (count data) Diszkrét egyenletes eloszlás Véges sok érték, mind ugyanakkora valószínűséggel:
X : x1 , x2 ,..., xn 1 P ( X = xi ) = , n
i = 1,2,..., n
Példák:
Kockadobás Urna-modell: cédulákra számokat írunk, és egyet kihúzunk. xi ∑ Várható érték: E ( X ) = n
Hipergeometrikus eloszlás (visszatevés nélküli mintavétel) N egyedből álló populációból, amelyben valamely tulajdonsággal K egyed rendelkezik, egy n különböző elemből álló véletlen mintát veszünk. Az X valószínűségi változó a mintába került, az adott tulajdonsággal rendelkező egyedek száma. Hallgatólagos feltevés: minden lehetséges minta egyformán valószínű! Példa:
Egy kutyamenhely 72 lakója közül 18 fajtatiszta. X: tíz találomra választott kutya között a fajtatiszták száma. N = 72, K = 18, n = 10. X lehetséges értékei a 0 és n közötti számok. A k értékhez (k = 0, 1, 2, ... , n) tartozó valószínűség így számolható:
K N − K k n−k P ( X = k ) = N n
Valójában egy eloszlás-családról van szó, annyi különböző eloszlásról, ahányféleképpen az N, K, n paraméterek megválaszthatók (ezek a megjegyzések a többi eloszlásra is vonatkoznak).
Várható érték: E ( X ) = n
K N
Binomiális eloszlás (visszatevéses mintavétel, ismételt megfigyelések) Azonos körülmények között, egymástól függetlenül n-szer elvégzünk egy megfigyelést vagy kísérletet, amelyben egy bizonyos kimenetel valószínűsége p. Az X valószínűségi változó a szóban forgó kimenetel bekövetkezéseinek száma.
X lehetséges értékei a 0 és n közötti számok. Példák:
ötször feldobunk két pénzt és számoljuk, hányszor jön ki FF. X: a FF dobások száma, n = 5, p = 0.25. X: 7 gyermekes családban a lányok száma, n = 7, p = 0.5 n k A k értékhez (k = 0, 1, 2, ... , n) tartozó valószínűség P ( X = k ) = p (1 − p )n − k k Az eloszlás paraméterei az n és a p (ez is eloszlás-család, a tagokat az n és a p jellemzi).
Várható érték: E(X) = np
Speciális eset: visszatevéses mintavétel (mint a kutyamenhelyen, de a megvizsgált kutyát visszaengedjük; ekkor csak a p = K / N arány számít, pl. ha a kutyák negyede fajtatiszta, mindegy, hogy 4-ből 1, vagy 400-ból 100; és most n > K is lehetséges). A binomiális eloszlást használják – közelítő megoldásként – a visszatevés nélküli mintavétel esetén is, ha a minta kicsi a populációhoz képest, hagyományosan, ha n ≤ 0.05⋅N .
A binomiális modell érvényességéhez mindig meg kell gondolni a következőket: A megfigyelések függetlennek tekinthetők? A p valószínűség minden megfigyelésre azonos? Példa:
Egér a labirintusban, 10 futás, X: hányszor találja meg a sajtot 1 percen belül.
n = 10, p = ??? p állandó? Nem hasznosítja az előző futások tapasztalatait? Talán minden futáshoz át kellene rendezi a labirintust?
Poisson eloszlás (spontán előfordulások száma egy adott tartományban) Számoljuk, hogy egy adott idő alatt, egy adott területen, térfogatban, egy adott anyagmennyiségben hányszor figyelhetünk meg egy eseményt Példák:
X: hány kutya jön be a kapun egy nap alatt, Y: hány elefánt létható egy légifelvételen, Z: hány szem borsót találunk egy adag rizibiziben, X lehetséges értékei a nem negatív számok: 0, 1, 2, 3, ... . Gyakorlati esetekben mindig van felső korlátot, de elméletileg nem érdemes korlátozni. A k értékhez (k = 0, 1, 2, 3, 4, ...) tartozó valószínűség, P ( X = k ) =
λk k!
e −λ
Az eloszlás paramétere λ, jelentése az előfordulások átlagos száma (a Poisson eloszlás is egy család, “családtagjait” λ azonosítja).
Várható érték: E(X) = λ
Hallgatólagos feltételezések, amelyekből a valószínűségek fenti képlete kijön:
Az előfordulások átlagos száma arányos az időtartam, terület, stb. nagyságával (fél nap alatt átlagosan fele annyi kutya, öt adag rizibiziben átlagosan ötször annyi szem borsó, stb.), A nem átfedő időtartamokban, területrészeken, stb. megfigyelt gyakoriságok függetlenek egymástól (pl. a délelőtt és délután érkező kutyák száma). Gyakran olyan binomiális eloszlású változók közelítésére használják, amelyeknek n paramétere igen nagy, p paramétere pedig igen kicsi. Tehát, ha egy ritka esemény (p kicsi) bekövetkezéseit számoljuk egy kísérlet nagyszámú ismétlése során (n nagy), akkor ennek a változónak az eloszlása jól közelíthető a Poisson-eloszlással, mégpedig a λ = np paraméterű Poissonnal (mert ugyanaz az átlaguk!). Alkalmazások: baktérium ill. vérsejt számlálás, esőcseppek eloszlása, nyomdai hibák egy könyvben, kórházban születések, ill. halálozások napi száma, stb.
Negatív binomiális eloszlás Számoljuk, hogy (azonos körülmények között egymástól függetlenül) hányszor kell ismételni egy megfigyelést addig, amíg egy – mindegyik ismétléskor p valószínűségű – esemény k-szor bekövetkezik. A véletlen szám nem a szükséges ismétlések száma, hanem a szükséges ismétlések száma mínusz k (csak azért, hogy a lehetséges értékek itt is 0, 1, 2, ... legyenek). Az eloszlás paraméterei p és k. Bár a negatív binomiális eloszlásnak ez a szokásos származtatása, ebből egyáltalán nem látszik, hogy miért alkalmas gyakorisági adatok modellezésére. Egy másik származtatás szerint (amit precízen elég körülményes megfogalmazni) a negatív binomiális eloszlás előáll, mint különböző paraméterű Poisson eloszlások keveréke. A részleteket nem tárgyaljuk.
Binomiális eloszlás közelítése Poisson eloszlással, ha 0.1≤np≤10. Az eloszlás paramétere λ = np
Normális eloszlással, ha np≥5 és nq≥5, ahol q=1-p Az eloszlás N (np , npq )
Középértékek vagy helyzeti mutatók “Ha a véletlen változót egyetlen jellemző értékkel kellene leírni, melyik szám lenne az?” Ne felejtsük el, hogy az “egyetlen számmal jellemzés” mindig információveszteséggel jár, nem mutatja az értékek szóródását, variabilitását.
Várható érték E ( X ) = ∑ xi p ( xi )
A kiugró értékek nagyon el tudják húzni!
Módusz Az az xk érték, amelyhez tartozó pk valószínűség maximális, vagyis a leggyakrabban előforduló érték. Nem mindig egyértelmű – egy eloszlás lehet unimodális, bimodális, multimodális stb. Kettőnél több módusz esetén nem használjuk.
Medián Olyan értelemben „közepes” x érték, hogy sem az x-nél kisebb, sem pedig az x-nél nagyobb értékek együttes valószínűsége nem haladja meg az 1/2-et, azaz P(X<x)≤1/2, és P(X>x)≤1/2.
Kvantilisek A p-kvantilis olyan x érték, hogy az x-nél kisebb értékek együttes valószínűsége nem haladja meg a p-t, az x-nél nagyobb értékek valószínűsége pedig nem haladja meg az (1-p)-t, azaz P(X<x) ≤ p
és
P(X>x) ≤ (1-p).
Az 1/2-kvantilis épp a medián. Az 1/4-kvantilis az alsó kvartilis (Q1), a 3/4-kvantilis a felső kvartilis (Q3). A p-kvantilist 100p-percentilisnek is szokás nevezni. Vigyázat! Angol nyelvterületen a mean szót nem feltétlenül az átlagra használják, így aztán ugyanazokból az adatokból különböző érdekcsoportok különböző eredményeket tudnak számolni!
Szóródási mutatók diszkrét változókra Ezek csak a “szóródást” mutatják, a “helyzetet” nem.
Interkvartilis terjedelem: Az alsó és felső kvartilis különbsége IQR = Q3-Q1 .
Terjedelem A maximális és a minimális érték különbsége
Szórásnégyzet vagy variancia ("átlagos négyzetes eltérés") A változó várható érték körüli koncentráltságát, illetve szóródását fejezi ki. Nemnegatív.
nagy variancia: a változó értékei erősen szórtak kis variancia: a változó a várható értéke körül koncentrálódik 0 variancia: egyetlen lehetséges (nem 0 valószínűségű) érték van Jelölés: σ 2 ( X ) vagy var(X) Matematikailag a szórásnégyzet a változó várható értékétől való négyzetes eltérésének várható értéke, vagyis var(X) = E{(X – E(X))2} = E(X 2) – E(X)2
Diszkrét változó szórásnégyzetének kiszámítása: var(X) = ∑ xi2pi – (∑ xi pi)2
A variancia tulajdonságai
var(aX) = a2 var(X)
bármely a∈R-re
var(X+Y) = var(X) + var(Y)
ha X és Y függetlenek
var(aX+bY) = a2 var(X) + b2 var(Y)
következik az előző kettőből
Szórás A szórás a variancia négyzetgyöke
Három nevezetes eloszlás várható értéke és varianciája: várható érték
variancia
binomiális
np
np(1-p)
Poisson
λ
λ
negatív binomiális
k p
k (1 − p) p2
hip.geo. és binom.: var < átlag , Poisson: var = átlag , neg.bin.: var > átlag (overdispersion)