Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů. V rámci přírodních věd se setkáváme s pokusy typu „za určitých podmínek vždy nastane určitý důsledek“. Např. jestliže za normálního tlaku zahřejeme vodu na 100°C, bude se přeměňovat v páru. Oproti těmto pokusům existují takové pokusy, kdy i při dodržení všech podmínek mohou nastat různé výsledky. Např. i přes sebepečlivější dodržení výrobního postupu jsou některé výrobky nekvalitní. Náhodný pokus je realizace činností nebo procesů, jejichž výsledek nelze s jistotou předpovědět. Náhodná veličina je proměnná, jejíž hodnota je určena výsledkem náhodného pokusu (náhodnou veličinu značíme velkými písmeny X, hodnoty; jichž nabývá značíme malými písmeny – x0, x1, x2, …) Příkladem takového náhodného pokusu může být hod mincí. Náhodná veličina – výsledek pokusu – má pak dvě obměny x1 = „padne rub“ x2 = „padne líc“
Náhodná veličina může být diskrétní nebo spojitá. Didkrétní náhodná veličina může nabývat pouze konečného počtu obměn (např. počet dětí v rodině). Spojitá náhodná veličina může nabývat nekonečného počtu obměn (např. výše průměrného platu). Hodnotám náhodné veličiny lze přiřazovat pravděpodobnosti. Zákon rozdělení náhodné veličiny (teoretické rozdělení) je pravidlo, které každé hodnotě náhodné veličiny (nebo každému intervalu hodnot) přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty (nebo hodnoty z tohoto intervalu). Př: Hážeme-li hrací kostkou, zákon rozdělení náhodné veličiny přiřadí hodnotě 1 pravděpodobnost 1/6, hodnotě 2 také 1/6 atd. až hodnotě 6 také 1/6. Podle povahy náhodné veličiny dělíme teoretická rozdělení na diskrétní a spojitá. Distribuční funkce F udává pravděpodobnost, že náhodná veličina nabude hodnoty menší nebo rovné, než právě zvolená hodnota x
diskrétní náhodná veličina - tato kumulativní pravděpodobnost je vyjádřena součtem dílčích pravděpodobností Př: Zvolíme-li ve zmiňovaném případě hrací kostky hodnotu x třeba 2 distibuční funkce F = 2/6, tj. 1/3 (může padnout 1 nebo 2 F = 1/6 + 1/6). spojitá náhodná veličina - tato kumulativní pravděpodobnost je vyjádřena integrálem, jehož dolní mez je obvykle -∞, horní mez odpovídá zvolené hodnotě x. Parametry teoretických rozdělení: - střední hodnota (popisuje polohu náhodné veličiny) a značí se E(X) - rozptyl (popisuje variabilitu náhodné veličiny) a značí se D(X).
Teoretická rozdělení Nejdříve se zaměříme na Diskrétní rozdělení. Nejjednoduší je Alternativní rozdělení A(p) Některé náhodné pokusy mohou mít pouze dva různé výsledky: - pokus je úspěšný - pokus je neúspěšný Příslušná náhodná veličina X se pak nazývá alternativní (dvoudobá, nula-jedničková). Vlastnosti: střední hodnota E(X) = p rozptyl D(X) = p.(1 - p) Používáme označení: P(A) = P(X = 1) = p P(A´) = P(X = 0) = 1 - p Př: Jak jsme si ukázali v předchozí kapitole je pravděpodobnost narození chlapce 51%. Označme náhodnou veličinu X ... pohlaví narozeného dítěte. Tuto náhodnou veličinu můžeme popsat alternativním rozdělením. P(A) = P(X = 1) = 0,51 ... narodí se chlapec (sledovaný jev) P(A´) = P(X = 0) = 0,49 ... narodí se děvče (alternativní jev) Máme-li sadu takovýchto náhodných pokusů (např. 3), můžeme prvděpodobnost počtu sledovaných jevů v této sadě popsat pomocí binomického rozdělení. Binomické rozdělení (n, p)
n – pčet provedených pokusů p – pravděpodobnost sledovaného jevu Náhodná veličina Y s konečným počtem oddělených hodnot: Y0 – sledovaný jev nenastane Y1 – sledovaný jev nastane 1 x . . Yn – sledovaný jev nastane n x Př: V případě, že budeme mít 3 děti, je pravděpodobnost, že mezi nimi nebude žádný chlapec rovna: Y0 = 0,49 . 0,49 . 0,49; tj. = 0, 493 = 0,1176 zhruba 11,8 %...0 chlapců, 3 děvčata Uvažujeme, že pravděpodobnost narození chlapce nebo dívky jsou nezávislé jevy (nezáleží, co nastalo v předchozím pokusu), potom se pravděpodobnost jednotlivých jevů násobí [P(A ∩ B) = P(A).P(B)]. Pravděpodobnost, že mezi 3 dětmi bude 1 chlapec je rovna: Y1 = 0,51 . 0,49 . 0,49 Chlapec však nemusí být nutně prvorozený. Musíme uvažovat, že může být na druhém nebo na třetím místě. Vytváříme vlastně jednoprvkové podmnožiny ze tří prvků. Výsledek musíme tedy vynásobit kombinačním číslem
Y1 =
3 1
0,51 . 0,49 . 0,49; tj. =
3 1 3 1
(kombinační číslo viz. Rozšiřující text).
0,51 . 0, 492 = 0,3674 zhruba 36,7 %...1 chlapec, 2 děvčata
Pravděpodobnost, že mezi 3 dětmi budou 2 chlapci je rovna: Y2 = 0,51 . 0,51 . 0,49 Opět musíme uvažovat, že chlapci mohou být na různých místech. Vytváříme dvouprvkové podmnožiny ze tří prvků. Výsledek musíme tedy vynásobit kombinačním číslem
3 2
.
Y2 =
3
0,51 . 0,51 . 0,49, tj. =
2
3 2
0,512 . 0, 49 = 0,3823 zhruba 38,2 %
A poslední možnost pravděpodobnost, že mezi 3 dětmi budou 3 chlapci je rovna: Y3 = 0,51 . 0,51 . 0,51 Vytváříme tříprvkové podmnožiny ze tří prvků. Výsledek musíme tedy vynásobit kombinačním 3
číslem
Y3 =
3 3 3
.
0,513 . 0, 490 = 0,1327 zhruba 13,3 %
Pro přehlednost si výsledky shrneme do tabulky. Yj
Pj
počet %
Y0
0, 493
11,8
Y1
3 1
Y2
3 2
Y3
3 3
36,7
0,51 . 0, 492
38,2
0,512 . 0, 49
13,3
0,513 . 0, 490
∑
100
Ve výpočtu pravděpodobnosti Y0 můžeme doplnit kombinační číslo pro nulaprvkovou podmnožinu ze tří prvků 3 0
3 0
a pravděpodobnost narození chlapce na nultou 0,510, dostáváme tak
0,510 . 0, 493.
Výsledky můžeme zobecnit. Pravděpodobnostní funkce nastane právě j - krát.
Pj =
n j
pj . (1-p)n-j určuje pravděpodobnost, že sledovaný jev
(n-j krát nenastane a je
n j
způsobů, jak může nastat)
Sečteme-li všechny pravděpodobnosti, musíme dostat 100 %. Vlastnosti: střední hodnota E(X) = n p rozptyl D(X) = n p.(1 - p)
Graf pravděpodobnostní funkce z našeho příkladu vypadá následovně:
Binomické rozdělení Bi(n=3; p=0,51)
Pj 0,5 0,4 0,3 0,2 0,1 0
0
1
2
Binomické rozdělení není obecně symetrické. Symetrické je pouze v případě, že p = 0,5.
3
j
Binomické rozdělení Bi(n=6; p=0,5)
Pj 0,5 0,4 0,3 0,2 0,1 0
0
1
2
3
4
5
6
j
V případě, že p < 0,5 binomické rozdělení je zešikmené vlevo.
Binomické rozdělení Bi(n=6; p=0,25)
Pj 0,5 0,4 0,3 0,2 0,1 0
0
1
2
3
4
5
6
j
V případě, že p > 0,5 binomické rozdělení je zešikmené vpravo.
Binomické rozdělení Bi(n=6; p=0,75)
Pj 0,5 0,4 0,3 0,2 0,1 0
0
1
2
3
4
5
6
j
j
Distribuční funkce F(Xj) =
Pi , určuje pravděpodobnost, že sledovaný jev nastane nejvýše j 0
krát. V našem příkladě můžeme např. vypočítat jaká je pravděpodobnost, že budeme mít nejvýše 2 chlapce. F(X2) dostaneme jako součet pravděpodobností, že nebudeme mít žádného, jednoho a dva chlapce. F(X2) = P0 + P1 + P2 = 0,118 + 0,367 + 0,382 = 0,867, tj. 86,7% Graf distribuční funkce pro náš příklad vypadá následovně:
Pj
Binomické rozdělení Bi(n=3; p=0,51) Distribuční funkce 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0
1
2
3 j
Hodnoty distribuční funkce můžeme hledat také ve statistických tabulkách (viz. rozšiřující text). Binomické rozdělení má velký význam v teorii pravděpodobnosti a v matematické statistice. Většina jevů má sice více možných výsledků než pouze dva alternativní výsledky, ale my se můžeme omezit na jev, který nás zajímá s pravděbodobností p a zbylé jevy mají pak pravděpodobnost (1-p). Např. při hodu kostkou je šest možných výsledků, ale my se můžeme zaměřit jenom na jeden (třeba, že padne 4) s pravděpodobností 1/6 a alternativní jev je „nepadne 4“ s pravděpodobností 5/6. Stejně tak při sledování určitého znaku v populaci, např. barva očí se můžeme zaměřt třeba na modré oči atd. Poissonovo rozdělení Po (λ) Je-li n dostatečně velké (n > 30) a blíží-li se p k 0 (p ≤ 0,1), lze binomické rozdělení aproximovat poissonovým rozdělením s jediným parametrem λ = n.p Pravděpodobnostní funkce má tvar:
x
P x
e , x
x!
0,1, 2...
e = 2,718 281... Eulerovo číslo Vlastnosti: střední hodnota E(X) = λ p rozptyl D(X) = λ p.(1 - p)
Poissonovo rozdělení je oproti Binomickému rozdělení snažší na výpočet pravděpodobnosti. Př: Při výrobě žárovek je podle zkušenosti 8% vadných. Jaká je pravděpodobnost, že v krabici se 100 ks žárovek bude právě 8 vadných? Výpočet provedeme nejprve pomocí binomického rozdělení a pak pomocí Poissonova. Bi (n; p) = Bi (100; 0,08) n = 100 ... počet ks v krabici p = 0,08 ... pravděpodobnost vadné žárovky j = 8 ... jev „vadná žárovka“ nastane právě 8x Pj =
P8 = P8 =
n
pj . (1-p)n-j
j
100 8
0,088 . (1-0,08)100-8
100 . 99 . 98 . 97 . 96 . 95 . 94 . 93 1 .2 .3 .4 .5 .6 .7 .8
. 0,088 . (0,92)92
P8 = 186087894300 . 0,000 000 001 677 72 . 0,000 466 101 = 0,1455, tj. 14,6%. Pravděpodobnost, že bude právě 8 žárovek vadných je 14,6%. Pomocí Poissonova rozdělení: λ = 100 . 0,08 = 8 Po (λ) = Po (8) x
P x
x!
e , x
0,1, 2...
P(8) =
8
8
8!
.e
8
=
16777216 40320
= 0,1396, tj. 14%.
. 0 , 000335463
Vidíme, že výsledky se liší pouze o desetiny procenta a výpočet je jednodušší.
Rozšiřující text: Kombinační čísla počítáme podle vztahu n j
n! j! n
j !
,
kde n! je faktoriál čísla n a počítá se jako součin všech čísel od 1 až do n. n! = 1.2. ... .n
(např. 5! = 1.2.3.4.5 = 120)
Rozepíšeme-li si kombinační číslo např.
10
10 !
4
4!.(10
4 )!
10 !
10 . 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1
4!. 6!
1 . 2 . 3 .4 1 .2 .3 .4 .5 .6
,
vidíme, že ve zlomku můžeme zkrátit 6 faktoriál (6!). Pro výpočet je výhodné psát kombinační číslo tak, že do jmenovatele zlomku rozepíšeme k faktoriál (k!)a do čitatele stejný počet činitelů (čísla, která násobíme) jako máme dole a začínáme od největšího. 10 4
1 . 2 . 3 .4
10
10 . 9 . 8 . 7
4
1 . 2 . 3 .4
Můžeme pak krátit ve zlomku
10
10 . 9 . 8 . 7
4
1 . 2 . 3 .4
10 . 3 . 7
210
Kombinační čísla můžeme nalézt pomocí Pascalova trojúhelníku: 0
n=0
0 1
n=1
n=2
0 2 0
1
1
2 1
1
1 1
2
1
2 2
1
3
n=3
1
0 4
n=4
0
1
4 1
3 1
4
3
4 2
3 2
6
3
4 3
3
1
3
4
4 4
1
atd. n značí kolika prvkovou máme množinu a kombinační čísla udávají kolika způsoby můžeme vytvářet podmnožiny. Např. pro n = 3 si můžeme představit tři prvky (kupříkladu ■ ♥ ☼) 3 0
1 nám říká, že prázdnou podmnožinu ze tří prvků můžeme vybrat jedním způsobem
(nevybereme nic). 3 1
3 nám říká, že jedno-prvkovou podmnožinu ze tří prvků můžeme vybrat třemi způsoby (buď
vybereme ■ nebo ♥ a nebo ☼). 3 2
3 nám říká, že dvou-prvkovou podmnožinu ze tří prvků můžeme vybrat třemi způsoby (buď
vybereme ■♥ nebo ■☼ a nebo ♥☼). 3 3
1 nám říká, že tří-prvkovou podmnožinu ze tří prvků můžeme vybrat jedním způsobem
(■♥☼). Vidíme, že Pascalův trojúhelník je symetrický: 3
3
1
2
3
Obecně platí
n
n
k
n
, což můžeme s výhodou využít při výpočtu
k
Následující řádek v Pascalově trojúhelníku dostaneme sečtením čísel nad hledaným kombinačním číslem. n=2
2 0
1
2 1
2
2 2
1
3
n=3
Tak např.
0 3
3
1
0
3
1
1
1
1
2
n
1
n
n
k
1
k
k
2
1
3
2 3
3
A tak bychom mohli pokračovat. Obecně platí
3
3
2
1
3 3
3
1
3 3
1