Valószínűségszámítás Valószínűség (probability) 0 és 1 közötti valós szám, amely egy esemény bekövetkezésének esélyét fejezi ki: 0 - (szinte) lehetetlen, 0.5 - azonos eséllyel igen vagy nem, 1 - (szinte) biztos
Vannak más mérőszámok is esélyek számszerűsítésére!
Odds (esélyhányados)
0 - (szinte) lehetetlen, 1 - azonos eséllyel igen vagy nem, ∞ - (szinte) biztos
Logit (az odds logaritmusa, szimmetrikus)
–∞ - (szinte) lehetetlen, 0 - azonos eséllyel igen vagy nem, ∞ - (szinte) biztos
valószínűségszámítás (probability theory)
minta (sample)
Azzal foglalkozó tudományág, hogy bizonyos (egyszerűbb) események valószínűségét ismertnek feltételezve, hogyan számíthatjuk ki más (bonyolultabb) események valószínűségét.
A vizsgálandó egyedeknek vagy objektumoknak az a köre, amelyeket ténylegesen megvizsgálunk, azaz amelyeknek adatain következtetéseink alapulnak
megfigyelési egység (observational vagy experimental unit) statisztika (statistics vagy statistic) (statistics) nagyszámú megfigyelt, mért adat összegzésével, az információ kinyerésével és szemléltetésével (leíró statisztika, descriptive statistics), illetve egy minta adataiból a populáció tulajdonságaira való következtetéssel (induktív statisztika, statistical inference) foglalkozó tudományág (indukció: konkrét, egyedi ⇒ általános)
(statistic) a mintából számított mérőszám, mutató (pl. mintaátlag)
(statisztikai) populáció ~ alapsokaság (population) A vizsgálandó egyedeknek vagy objektumoknak az a (teljes) köre, amelyre a vizsgálat irányul, azaz amelyre következtetéseinket vonatkoztatni szeretnénk
A populáció, illetve a minta egy eleme, egy egyed vagy objektum, amelynek adatait feljegyezzük (lehet egy állat, egy élőhely, egy állatpopuláció, stb.)
asszociáció (association) Összefüggés két jellemző között (pl. testsúly-testmagasság, vagy hajszín-szemszín); ha két jellemző összefügg, akkor az egyik jellemző ismerete egy egyeden a másik jellemzőről is több-kevesebb információt szolgáltat
korreláció (correlation) Speciális (de gyakori) összefüggéstípus két jellemző között
sztochasztikus (stochastic) (összefüggés, törvényszerűség) Olyan összefüggés, amelyben a véletlennek is szerepe van
pozitív korreláció: "kisebbel kisebb, nagyobbal nagyobb jár együtt"
aszimptotikus (tulajdonság) (asymptotic)
negatív korreláció: "kisebbel nagyobb, nagyobbal kisebb jár együtt"
Nagy mintákra érvényes (tulajdonképpen ha a mintanagyság végtelenhez tart)
Az asszociáció általánosabb fogalom, mint a korreláció! (viszonyuk mint a rovar / bogár…)
függetlenség (independence) Két jellemző olyan viszonya, amikor nincs közöttük összefüggés: ilyenkor az egyik jellemző ismerete egy egyeden semmilyen információt nem nyújt a másik jellemzőre nézve
(statisztikailag) szignifikáns (statistically significant) A mintában megfigyelt tulajdonság (összefüggés, különbség, stb.) túllépi azt a szintet, amit még könnyű szívvel a véletlen számlájára írhatnánk. Ezért úgy gondoljuk, hogy a megfigyelt tulajdonság nem csak a mintára, hanem a populációra is jellemző. Gondoljunk rá így:
A valószínűségszámítás és a statisztika viszonya Tipikus valószínűségszámítási kérdésfeltevés: Ha egy betegség előfordulási aránya (prevalencia, prevalence) a populációban 20%, mennyi a valószínűsége, hogy 50 véletlenszerűen választott egyed között két beteget találunk?
nem szignifikáns ~ könnyen lehet, hogy a véletlen játéka (semmit sem bizonyít) szignifikáns ~ lehet ugyan, hogy véletlen, de a véletlen ilyet csak ritkán produkál Hogy szakmailag is érdekes-e, amit megfigyeltünk, az más kérdés (szakmailag releváns vagy irreleváns). Az a legszebb, ha felfedezésünk szakmailag is releváns és statisztikailag is szignifikáns.
Tipikus statisztikai kérdésfeltevések: Ha 50 véletlenszerűen választott egyed között két beteget találunk, akkor mit állíthatunk a betegség populációbeli prevalenciájáról? Ha 50 véletlenszerűen választott egyed között két beteget találunk, akkor vajon tartható-e az az elképzelés (hipotézis, hypothesis), hogy a betegség populációbeli prevalenciája 20%?
Az első statisztikai kérdésfeltevést becslésnek hipotézisvizsgálatnak (hypothesis testing) nevezzük.
(estimation),
a
másodikat
Az első kérdésre kétféle választ szokás adni. Pontbecslés (point estimation) esetén a válasz egy szám: 4%. Intervallumbecslés (interval estimation) esetén a válasz egy úgynevezett konfidencia-intervallum (confidence interval): a populációbeli prevalencia 95% valószínűséggel 0.7% és 13.7% között van. A 95% a konfidencia intervallum megbízhatósági szintje (confidence level).
A második kérdésre a válasz igen-nem jellegű. Igen, tartható, a megfigyelés nem mond ellent a hipotézisnek, eltérésük nagy valószínűséggel a véletlennek tulajdonítható. Nem tartható, a hipotézist elvetjük, mert a megfigyelés oly mértékben ellentmond neki, ami már nem írható a véletlen számlájára. (Ha a hipotézis igaz lenne, ilyen megfigyelés csak csekély valószínűséggel fordulhatna elő). "A megfigyelt adatok (50 elemű mintában 2 beteg) alapján 0.13% tévedési valószínűség mellett (~ 99.87% megbízhatósági szinten ~ P=.0013) elvetjük azt a hipotézist, hogy a betegség populációbeli prevalenciája 20%."
Ennek kiszámításához kell a valószínűségszámítás!
Megtartás-elvetés konvencionális határa: 5 vagy 1% tévedési valószínűség.
A valószínűségszámítás legfontosabb alapfogalmai Esemény alapfogalom, nem definiáljuk (mint pl. a halmaz), intuitíve egy kijelentésnek felel meg, pl. "páros számot dobtam", "esik az eső", stb., de több kijelentés is megfelelhet ugyanannak az eseménynek a megfigyeléskor egyértelműen legyen eldönthető, hogy bekövetkezett, vagy nem Műveletek eseményekkel – ugyanaz a matematikai struktúra, mint a halma¬zoknál: "Boole-algebra" (a logikában is ugyanaz a struktúra!) Definíció:
Két esemény, A és B összege az az esemény, amelyik pontosan akkor következik be, ha A és B közül valamelyik – akár mindkettő, akár csak az egyik – bekövetkezik. Az A és B események összegét A+B-vel jelöljük. „A vagy B”
Definíció:
Két esemény, A és B szorzata az az esemény, amelyik pontosan akkor következik be, ha A és B mindketten bekövetkeznek. Az A és B események szorzatát AB-vel jelöljük. „A és B” Az összeg és szorzat nem csak 2, hanem több, sőt megszámlálhatóan végtelen sok eseményre is kiterjeszthető. Definíció:
Egy A esemény ellentettje (komplementere) az az esemény, amelyik pontosan akkor következik be, ha A nem következik be. Az A esemény ellentettjét AC-vel jelöljük. „nem A”
Biztos esemény (I), lehetetlen esemény (O vagy ∅)
A műveletek tulajdonságai: Összeadás
Szorzás
A+B=B+A AB=BA (A+B)+C=A+(B+C) (AB)C=A(BC) A+A=A AA=A
Ellentett
(A )
C C
=A IC = ∅ ∅C = I
Több művelet együtt A(B+C)=AB+AC A+BC=(A+B)(A+C) A+Ac=I AAc=O (A+B)c=Ac Bc (AB)c =Ac +Bc
Relációk események között Definíció:
Ha két esemény, A és B között olyan a viszony, hogy ha A bekövetkezik, akkor biztos, hogy B is bekövetkezik, akkor azt mondjuk, hogy A maga után vonja B-t, és úgy jelöljük, hogy A⊆B A lehetetlen esemény bármelyik eseményt maga után vonja, azaz bármely A eseményre O⊆A, valamint az is, hogy bármely A eseményre A⊆I. A⊆B pontosan akkor áll fenn, amikor az alábbi összefüggések: A+B=B, illetve AB=A.
Ugyanúgy, mint a halmazoknál, az A\B=ABC összefüggéssel definiálható a kivonás művelete is. Szemléletesen fogalmazva, az A és B események különbségén azt az eseményt értjük, amelyik pontosan akkor következik be, amikor az A esemény bekövetkezik, de B nem.
Definíció:
Definíció:
Az A eseményt összetett eseménynek (vagy más szóval felbontható eseménynek) nevezzük, ha előállítható két, tőle különböző A1 és A2 esemény összegeként, azaz A=A1+A2 alakban (méghozzá úgy, hogy A1≠A, A2≠A).
Az A eseményt elemi eseménynek nevezzük, ha A nem összetett esemény.
Természetesen A=A+O alakban bármelyik esemény előállítható, ezt triviális felbontásnak nevezik, de most ezt kizártuk az A1≠A, A2≠A feltételekkel.
Az összetett eseményről mondottakból az következik, hogy ha az A esemény elemi, akkor csak A=A+O alakú összeggé bontható.
Könnyű megmutatni, hogy egy A esemény pontosan akkor összetett, ha létezik egy olyan – A-tól is és a lehetetlen eseménytől is különböző – esemény, amelyik maga után vonja A-t, azaz létezik olyan B, amelyre B⊆A, B≠O és B≠A.
Ha A elemi esemény, akkor – a lehetetlen eseményen és magán A-n kívül – nincs olyan esemény, amely A-t maga után vonná.
Gyakran találkozhatunk az alábbi rokon értelmű kifejezésekkel is: felbonthatatlan esemény, atom, kimenetel, az eseménytér egy pontja.
Definíció:
Az A és B eseményeket egymást kizáró eseményeknek nevezzük, ha nem következhetnek be egyszerre, azaz ha szorzatuk a lehetetlen esemény: AB=∅
Definíció:
Az A1, A2, A3, ... , An eseményeket teljes eseményrendszernek nevezzük, ha az Ai események páronként kizárják egymást, és az összes Ai összege a biztos esemény, azaz
Ha az eseménytér nem véges, akkor az események közötti műveleteket megszámlálhatóan végtelen sok operandusra is értelmezzük, azaz feltételezzük, hogy megszámlálhatóan végtelen sok esemény összege, illetve szorzata is esemény.
n
ha bármely i≠j-re AiAj=O, és
Ai = I. ∑ i =1
Definíció:
Az A1, A2, A3, ... Ai, ... események összegén azt az eseményt értjük, amelyik pontosan akkor következik be, ha az Ai események közül legalább egy bekövetkezik.
Példák:
egy A esemény és az ellentettje, AC
Definíció:
az összes elemi esemény
Az A1, A2, A3, ... Ai, ... események szorzatán azt az eseményt értjük, amelyik pontosan akkor következik be, ha az Ai események mindegyike bekövetkezik.
Definíció:
Egy véges sok elemi eseményből álló eseményteret véges eseménytérnek nevezünk. Minden összetett esemény előállítható elemi események összegeként, méghozzá az összeadandók sorrendjétől eltekintve egyértelműen. Az összes – elemi és összetett – események száma 2 n , ha az elemi események száma n.
ESEMÉNYEK (eseményalgebra)
HALMAZOK (halmazalgebra)
LOGIKAI KIJELENTÉSEK (kijelentéskalkulus)
összeg A+B
egyesítés (unió) A∪B
logikai "vagy" A∨B
szorzat AB
metszet A∩B
logikai "és" A∧B
ellentett esemény AC
komplementer halmaz
tagadás ¬ A
biztos esemény I
alaphalmaz H
azonosan igaz állítás i
lehetetlen esemény O
üres halmaz ∅
azonosan hamis állítás h
A maga után vonja B-t A⊆B
részhalmaz viszony A⊆B
implikáció A⇒B
A
C
Valószínűség A valószínűség – P(A) az A eseményhez rendelt 0 és 1 közötti valós szám P: {az események halmaza} → [0,1] függvény
nem negatív értékű additív: ha A és B kizárók, akkor P(A+B) = P(A) + P(B) sőt σ-additív: ha A1, A2, ... páronként kizárók, azaz Ai≠Aj, akkor P(∑Ai) = ∑P(Ai) (A valószínűség mérték: nem negatív, additív halmazfüggvény)
Az olyan eseményteret, amelyben valamilyen módon értelmeztük az események valószínűségét, valószínűségi mezőnek nevezzük.
További tulajdonságok, amelyek egyszerűen bizonyíthatók:
A valószínűség tulajdonságai:
Ha az A1, A2, A3, ... , An események teljes eseményrendszert alkotnak, akkor P(A1)+P(A2)+P(A3)+...+P(An)=1.
(axiómák, ezekből a többi tulajdonság már levezethető)
Bármely esemény valószínűsége 0 és 1 közé esik, azaz 0 ≤ P(A) ≤ 1.
Véges eseménytérben az összes elemi esemény valószínűségének összege 1. (Mert az összes elemi esemény teljes eseményrendszert alkot.)
A lehetetlen esemény valószínűsége 0, azaz P(O) = 0.
Végtelen eseménytér esetén feltesszük azt is, hogy a megszámlálhatóan végtelen összeg valószínűsége is megkapható a tagok valószínűségének összegeként, ha a tagok páronként kizáró események.
A biztos esemény valószínűsége 1, azaz P(I) = 1. Ha az A esemény maga után vonja a B eseményt, akkor B valószínűsége legalább akkora, mint A-é, azaz A ⊆ B ⇒ P(A) ≤ P(B).
Klasszikus valószínűségi mező – véges sok elemi esemény, mind egyenlő valószínűségű (események ~ az elemi események halmazának részhalmazai)
Valószínűségszámítási fogások: számolás a komplementer esemény valószínűségéből: P(A) = 1 – P(AC) felbontás kizáró részekre és azok valószínűségeinek összegzése
Ekkor egy A esemény valószínűsége úgy számítható ki, hogy azon elemi események számát, amelyek bekövetkezése esetén A is bekövetkezik, osztjuk az összes elemi események számával.
felbontása elemi eseményekre és azok valószínűségeinek összegzése
Más skálák: valószínűség (P), odds (O) és logit (L)
O=
P , 1− P
P=
Feltételes valószínűség, események függetlensége L
O , 1+ O
P=
L = ln O ,
e 1 + eL
Felmerülhet az a kérdés, hogy az A esemény esélyei növekednek vagy csökkennek-e akkor, ha a B esemény bekövetkezik. Definíció:
P O L
0 0 -∞
.01 .1 .25 .010 .111 .333 -4.60 -2.20 -1.99
.5 1 0
15
.75 3 1.99
.9 9 2.20
.99 99 4.60
odds logit
10
pozitív kapcsolatról beszélünk, ha P(A|B) > P(A),
0 0
-10
Egy E eseménynek egy F esemény bekövetkezése melletti, számszerűen kifejezett esélyét az E eseménynek F-re (mint feltételre) vonatkozó feltételes valószínűségének (conditional probability) nevezzük, és P(E|F)-fel jelöljük. (Jegyezzük meg, hogy a feltétel áll hátul!)
A és B között
5
-5
1 ∞ ∞
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8 0.9 valószínűség
1
negatív kapcsolatról beszélünk, ha P(A|B) < P(A). Abból, hogy bizonyos események gyakran együtt járnak, nem következik, hogy oksági kapcsolat lenne közöttük.
Definíció:
Ha P(A|B) = P(A), azaz a B bekövetkezése nem befolyásolja A esélyeit, akkor azt mondjuk, hogy az A és B események függetlenek (independent). Definíció:
Ha egy valószínűségi mezőben (azaz egy olyan eseménytérben, ahol az eseményekhez valószínűség is hozzá van rendelve) egy F esemény valószínűsége nem 0, akkor a P(E|F) feltételes valószínűséget az alábbi képlettel szokás definiálni: P(E F) =
P(EF) P(F)
A feltételes valószínűség definíciójából közvetlenül adódó P(AB) = P(A|B)P(B) = P(B|A)P(A)
Az F eseményre vonatkozó feltételes valószínűség tulajdonságai rendre megegyeznek a (feltétel nélküli) valószínűségével, azaz
bármely E esemény F-re vonatkozó feltételes valószínűsége 0 és 1 közötti számérték, 0 ≤ P(E|F) ≤ 1, ha az F bekövetkezése esetén a E bekövetkezése lehetetlen, akkor P(E|F) = 0, ha az F bekövetkezése esetén a E biztosan bekövetkezik, akkor P(E|F) = 1, ha az E1 maga után vonja E2-t, akkor P(E1|F) ≤ P(E2|F), ha az E1 és az E2 események kizárják egymást, akkor P((E1+E2)|F) = P(E1|F) + P(E2|F), és e tulajdonság nemcsak két, hanem akárhány (véges vagy megszámlálhatóan végtelen sok) tagú összegre is igaz.
Könnyű belátni, hogy ha A és B függetlenek, akkor A és BC, AC és B, valamint AC és BC is függetlenek.
összefüggés alapján könnyű megmutatni, hogy mind a pozitív, mind a negatív kapcsolat, mind pedig a függetlenség szimmetrikus, ugyanis
ha P(AB) ≥ P(A)P(B), akkor P(A|B) ≥ P(A) és P(B|A) ≥ P(B) is igaz, ha P(AB) ≤ P(A)P(B), akkor P(A|B) ≤ P(A) és P(B|A) ≤ P(B) is igaz, ha P(AB) = P(A)P(B), akkor P(A|B) = P(A) és P(B|A) = P(B) is igaz. Egy A eseménynek egy B eseményre vonatkozó feltételes valószínűségéből a fordított feltételes valószínűséget, vagyis B-nek A-ra vonatkozó feltételes valószínűségét az alábbi képlettel fejezhetjük ki:
P(A B)P(B) P(B A ) = P(A)
Két esemény függetlenségét általában a feltételes valószínűség fogalmát kikerülve egyenesen a P(AB) = P(A)P(B) feltétellel szokták definiálni. Ennek egyik előnye, hogy a szimmetria szemmel látható, a másik pedig, hogy a feltételes valószínűségnél az osztás miatt szükséges P(B)>0 feltételt feleslegessé teszi. Ha ezt a definíciót fogadjuk el, akkor igaz az, hogy egy 0 vagy 1 valószínűségű esemény bármely eseménytől független.
Relatív gyakoriság Ismételjünk meg egy kísérletet vagy megfigyelést azonos körülmények között N-szer és számoljuk meg, hogy valamely E esemény az N ismétlésből hányszor következett be! A bekövetkezések számát (jelöljük nE-vel) az esemény abszolút gyakoriságának n vagy egyszerűen gyakoriságának, az rE = E hányadost pedig az esemény relatív N gyakoriságának nevezzük.
Egy E eseménynek egy F esemény bekövetkezése melletti feltételes relatív gyakorisága, rE|F azt jelenti, hogy ha csak azokat az ismétléseket nézzük, amelyekben F bekövetkezett, és számoljuk, hogy ezeknek mekkora hányadában következett be E. Azaz ha nF az F bekövetkezéseinek számát jelöli, nEF pedig az E és F együttes bekövetkezéseinek számát, akkor
rE F =
nEF rEF = nF rF
A relatív gyakoriság (a feltételes is) 0 és 1 közötti szám, mint a valószínűség, sőt ugyanazok a tulajdonságai. Példa:
Ha 15-ször dobunk egy dobókockával, és ebből 3-szor dobunk hatost, akkor ebben a kísérletsorozatban a hatos dobásnak, mint eseménynek a gyakorisága 3, a relatív gyakorisága pedig 3/15=0.2.
A nagy számok gyenge törvénye
A teljes valószínűség tétele
Más néven a nagy számok Bernoulli-féle törvénye
A teljes valószínűség tétele azt mondja ki, hogy ha ismerjük egy A esemény feltételes valószínűségét egy teljes eseményrendszer valamennyi E1, E2,..., En eseménye, mint feltétel mellett, akkor ebből az A esemény feltétel nélküli valószínűségét az alábbi képlettel határozhatjuk meg:
Tétel:
Legyen A egy kísérlet egyik lehetséges eredménye, valószínűsége legyen P(A)=p. Ismételjük meg a kísérletet n-szer egymástól függetlenül, és hA(n) jelölje az A esemény relatív gyakoriságát ebben a kísérletsorozatban. Ekkor tetszőleges kis ε és δ pozitív számokhoz található olyan N, hogy n≥N esetén
P ( hA (n ) − P( A) < ε ) ≥ 1 − δ
A fenti tétel következménye: Ha az ismétlések számát, N-et növeljük (ha N→∞), akkor egy esemény relatív gyakorisága egyre kevésbé tér el az esemény valószínűségétől.
n
P(A ) = ∑ P(A E i )P(E i ). i =1
Példa:
Egy betegség előfordulásának valószínűségét korcsoportonként ismerjük. Az Ei események: a vizsgált személy fiatal (E1), középkorú (E2) vagy idős (E3), az A esemény pedig azt, hogy a szóban forgó betegségben szenved. Tehát ismerjük a P(A|E1), P(A|E2) és a P(A|E3) valószínűségeket, és ezek alapján szeretnénk meghatározni a P(A) valószínűséget, azaz annak a valószínűségét, hogy egy, a vizsgált népességből találomra (a korára való tekintet nélkül) kiválasztott személy a szóban forgó betegségben szenved.
Tegyük fel, hogy az egyes feltételes valószínűségek számszerűen a következők: P(A|E1)=0.05, P(A|E2)=0.1, P(A|E3)=0.2.
Bayes tétele Thomas Bayes (1702-1761)
Ha a kormegoszlás 60%, 30%, 10%, azaz P(E1)=0.6 P(E2)=0.3 P(E3)=0.1
A tétel akkor használható, ha ismerjük egy A esemény feltételes valószínűségét egy teljes eseményrendszer valamennyi E1, E2, ... , En eseménye, mint feltétel mellett, és ebből szeretnénk meghatározni az egyes Ei eseményeknek az A-ra vonatkozó feltételes valószínűségét. Tudjuk, hogy P(B A ) =
P(A B)P(B) P(A)
akkor a képlet szerint számolva P(A) = P(A|E1)P(E1)+P(A|E2)P(E2)+P(A|E3)P(E3) = 0.05•0.6+0.1•0.3+0.2•0.1 = 0.08,
Ezt alkalmazva most a keresett valószínűség: P(E i A ) =
P(A E i )P(E i ) P(A)
Ebből és a teljes valószínűség tételéből: P(E i A ) =
P(A E i )P(E i ) n
∑ P(A E k )P(E k ) k =1
Példa:
Definíció:
Az előző példához visszatérve azt keressük, hogy ha tudjuk valakiről, hogy beteg, de nem ismerjük a korát, akkor milyen valószínűséggel tartozik az idősek közé.
A P(E1), P(E2), ... , P(En) valószínűségeket a priori valószínűségeknek, a P(E1|A), P(E2|A), ... , P(En|A) feltételes valószínűségeket pedig a posteriori valószínűségeknek nevezik.
P(A|E1)=0.05, P(A|E2)=0.1, P(A|E3)=0.2.
P(E 3 A ) =
P(E1)=0.6 P(E2)=0.3 P(E3)=0.1
P(A E 3 )P(E 3 ) n
∑ P(A E k )P(E k )
=
P(A E 3 )P(E 3 ) = P(A E1 )P(E1 ) + P(A E 2 )P(E 2 ) + P(A E 3 )P(E 3 )
k =1
=
0.2 ⋅ 0.1 0.02 = = 0.25 0.05 ⋅ 0.6 + 0.1 ⋅ 0.3 + 0.2 ⋅ 0.1 0.08
A Bayes-tétel azért nagyon fontos a statisztikában, mert gyakran az a helyzet, hogy egy kísérlet kimenetelét (azaz, hogy az E1, E2, ... , En események közül melyik következik be) különféle okok miatt nem tudjuk megfigyelni, meg tudunk viszont figyelni egy ezzel több-kevesebb kapcsolatban lévő A eseményt, és ilyenkor az A bekövetkezéséből (vagy be nem következéséből) szeretnénk levonni valamilyen következtetést az Ei eseményekre nézve.
Geometriai valószínűségek A geometriai valószínűségek modellalkotás lehetőségeit.
segítségével
megvizsgáljuk
néhány
példán
a
Példa:
Találomra ránézek az órámra. Mennyi a valószínűsége, hogy a másodpercmutató épp valahol a 4-es és a 6-os között van? I. megoldás (klasszikus modell): Az órám másodpercmutatója „ugrik”, 60 lehetséges helyzete van, amelyek mindegyikének azonos a valószínűsége. Az, hogy „a 4-es és a 6-os között van”, 9 lehetséges helyzetet jelent, ha magát a 4-est és a 6-ost nem számítjuk (vagy számítsuk?!). Tehát a keresett valószínűség 9/60. (11/60?) II. megoldás (geometriai modell): A másodpercmutató folytonosan halad, helyzete a kör bármely pontja lehet. A lehetséges helyzetek (az elemi események) száma végtelen, sőt, nem megszámlálhatóan végtelen.
Szimmetria-okokból feltettük, hogy minden elemi esemény egyenlően valószínű, abból pedig az következik, hogy mindegyik elemi esemény 0 valószínűségű. Így az elemi események valószínűségeinek összeadogatásával mindig csak 0-t kaphatunk. Ezért választottuk a geometriai úton származó intuitív megoldást, hiszen logikus a feltevés, hogy a többi ugyanekkora rész is ugyanakkora valószínűségű. Gondoljuk végig, milyen feltevéseken alapul ez az érvelés!
Ugyanakkora részek valószínűsége egyenlő Kétszer akkora rész valószínűsége kétszer akkora, háromszor akkora rész valószínűsége háromszor akkora, stb. Egy esemény valószínűsége a neki megfelelő halmaz nagyságával (hosszával?) arányos A teljes halmaz a biztos eseménynek felel meg, tehát valószínűsége 1.
Intuitív megoldás: a 4-estől a 6-osig terjedő körív a körvonal 1/6-a, tehát a valószínűség legyen 1/6.
Összefoglalva:
Geometriai valószínűségi modell: a valószínűségek hozzárendelésének alapja nem darabszám (mint a klasszikusban), hanem geometriai mérték (a példában hosszúság volt). Feltételek:
az elemi események halmaza egy geometriai alakzat (most épp vonal volt, de lehet síkidom, test is) – neve: fázistér azonos geometriai mértékű halmazok (most épp hosszúság volt, de lehet terület, térfogat is) valószínűsége egyenlő Következmény:
Egy esemény valószínűsége arányos a neki megfelelő halmaz geometriai mértékével Következmény:
Bármely esemény valószínűsége = a neki megfelelő halmaz geometriai mértéke, osztva a teljes eseménytér (a fázistér) geometriai mértékével.
Megjegyzések:
Sokszor választhatunk, hogy egy problémát a klasszikus vagy a geometriai modellel írunk le. Szempontok: Melyik realisztikusabb (valójában milyen az órám) Melyik kezelhető könnyebben matematikailag Mindig meg kell fontolni, teljesülnek-e a modell feltételei! (Ez a klasszikus modellre is igaz!!!) A geometriai modellben vannak olyan 0 valószínűségű események, amelyek nem lehetetlenek! Tehát: „0 valószínűségű” ≠ „lehetetlen”! Az, hogy az eseménytér vonal, síkidom, vagy test, attól függ, hány független paraméter van a feladatban (amelyek egymástól függetlenül változhatnak)
Bertrand-paradoxon (Mit jelent az, hogy „találomra választani”?) (Joseph Louis Bertrand: Calcul des probabilités, 1889)
Egy körnek válasszuk ki találomra egy húrját. Mennyi a valószínűsége, hogy a húr hosszabb lesz, mint a körbe írható szabályos háromszög oldala?
I. megoldás
1. lépés: válasszuk ki a húr egyik végpontját a körvonalon. 2. lépés: ha a húr másik végpontját a körvonal jelzett részén vesszük fel, akkor lesz a húr hosszabb, mint a körbe írható szabályos háromszög oldala. Mivel a jelzett rész a körvonal 1/3-a, P(a húr hosszabb lesz) = 1/3
II. megoldás
1. lépés: válasszuk ki egy tetszőleges sugarat a körben. 2. lépés: ha a sugár egy pontjában merőlegest húzunk a sugárra, a kör egy húrját kapjuk. Ha a pontot a sugár jelzett részén vesszük fel, akkor lesz a húr hosszabb, mint a körbe írható szabályos háromszög oldala. Mivel a jelzett rész a sugár fele, P(a húr hosszabb lesz) = 1/2
A paradoxon feloldása
Ha így választunk találomra, az esetek 1/2-ében, ha amúgy, akkor az esetek 1/3-ában kapunk a szabályos háromszög oldalánál hosszabb húrokat. (Sőt, még sok megoldás van, más és más valószínűségekkel…)