Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
[email protected]
Úvod do teorie pravděpodobnosti • • • • • • •
Náhoda a pravděpodobnost, náhodný jev, náhodná veličina rozdělení pravděpodobnosti a jeho souvislost s histogramem pravidla pro počítání s pravděpodobností podmíněná pravděpodobnost závislost náhodných veličin využití závislosti při stanovení pravděpodobnosti - věta o úplné pravděpodobnosti a Bayesova věta
Úvod do teorie pravděpodobnosti Náhodný pokus = činnost, která může skončit různým výsledkem a my dopředu nevíme kterým Náhodný jev = výsledek náhodného pokusu, o kterém dopředu nevíme, zda nastane či ne Pravděpodobnostní prostor (⌦, F, P ) (Kolmogorov, 1933) Ω - množina elemetárních náhodných jevů F - jevové pole (σ-algebra náhodných jevů) (a) Ø, ⌦ 2 F (b) pokud A 2 F, potom platí AC 2 F S 1 (c) pokud A1 , A2 , · · · 2 F, potom platí i=1 Ai 2 F P - pravděpodobnostní míra na F
Úvod do teorie pravděpodobnosti Definice pravděpodobnosti
µ(A) 1. Klasická definice pravděpodobnosti: P (A) = µ(⌦) µ(A) = počet elementárních jevů v jevu A µ(A) = “míra” jevu A 2. Axiomatická definice pravděpodobnosti (a) 8A 2 F : P (A) 2 h0, 1i (b) P (Ø) = 0, P (⌦) = 1 A1 , A2 , · · · 2 F, po dvou disjunktní, potom (c) jsou-li S1 P1 P ( i=1 Ai ) = i=1 P (Ai ) 3. Statistická definice pravděpodobnosti:
nA j limj!1 nj
Úvod do teorie pravděpodobnosti Pravidla pro počítání s pravděpodobností
1) P (A) 2 h0, 1i
C
2) P (Ø) = 0, P (⌦) = 1 3) P (
S1
i=1
Ai ) =
P1
i=1
P (Ai )
4) P (A [ B) = P (A) + P (B) 5) P (A
B) = P (A)
6) P (A ) = 1 C
P (A \ B) =?
P (A)
A
B ⌦
P (A \ B)
P (A \ B)
Podmíněná pravděpodobnost P (A \ B) = P (A).P (B|A) P (A \ B) P (B|A) = P (A) A
B
Příklad: Je známo, že v dlouhodobém průměru je mezi 1000 dodaných komponent 2,34% vadných výrobků výrobce A, 1,08% vadných výrobků výrobce B, 65,97% bezvadných výrobků výrobce A a zbytek (30,6%) jsou bezvadné výrobky od výrobce B. Lze považovat jev, že výrobek je vadný, za stochasticky závislý na výrobci?
⌦
Podmíněná pravděpodobnost P (A \ B) = P (A).P (B|A) P (A \ B) P (B|A) = P (A) A
B ⌦
Příklad:
Jevy A a V jsou stochasticky nezávislé právě když P (V |A) = P (V ) P (A|V ) = P (A) P (A \ V ) = P (A).P (V )
A
B
celkem
vada (V)
2,34
1,08
3,42
bez vady
65,98
30,6
96,58
celkem
68,32
31,68
100
Podmíněná pravděpodobnost P (A \ B) = P (A).P (B|A) P (A \ B) P (B|A) = P (A) A
B ⌦
Příklad:
Jev, že výrobek je vadný, lze považovat za stochasticky nezávislý na výrobci. celkem A B 2,34 = 3,42 . 68,32
1,08 = 3,42 . 31,68 65,98 = 96,58 . 68,32 30,60 = 96,58 . 31,68
o.K.
vada (V)
2,34
1,08
3,42
bez vady
65,98
30,6
96,58
celkem
68,32
31,68
100
Podmíněná pravděpodobnost P (A \ B) = P (A).P (B|A) P (A \ B) P (B|A) = P (A) A
B
Příklad: Z šetření obchodního řetězce vyplývá, že 34% zákazníků nakupuje pivo Pardál a současně dámské kalhotky. 28% zákazníků nakupuje dámské kalhotky, ale nenakupuje pivo Pardál, 19% nakupuje Pardála a nekupuje dámské kalhotky. Ostatních 19% nekupuje ani jednu z komodit. Lze považovat nákup piva Pardál stochasticky nezávislý na nákupu dámských kalhotek?
⌦
Podmíněná pravděpodobnost P (A \ B) = P (A).P (B|A) P (A \ B) P (B|A) = P (A) A
B ⌦
Příklad: 0,62 . 0,53 = 0,3286 P(K) = 0,62 P(K|P) = 0,42/0,62 = 0,677 > P(K) Nákup dámských kalhotek je stochasticky závislý na nákupu piva Pardál
P
PC
celkem
K
0,42
0,2
0,62
KC
0,19
0,19
0,38
celkem
0,53
0,47
1
Věta o úplné pravděpodobnosti A je náhodný jev, {H1 , H2 , H3 , H4 } je úplné pokrytí ⌦ Hi \ Hj = Ø, H1 [ H2 [ H3 [ H4 = ⌦ H3 H4 P (A) = P (A|H1 ).P (H1 ) H1 H2 +P (A|H2 ).P (H2 ) +P (A|H3 ).P (H3 ) +P (A|H4 ).P (H4 )
Příklad:
A ⌦
Na trhu jsou výrobky od čtyř výrobců v pořadí A, B, C a D v poměru 1:2:4:5. Zmetkovitost je u těchto výrobců po řadě 0,5%, 0,8%, 0,3% a 0,3%. Jaká je pravděpodobnost, že náhodně vybraný výrobek na trhu bude vadný? A bude-li vadný, jaká je pravděpodobnost, že byl vyroben výrobcem A?
Věta o úplné pravděpodobnosti A je náhodný jev, {H1 , H2 , H3 , H4 } je úplné pokrytí ⌦ Hi \ Hj = Ø, H1 [ H2 [ H3 [ H4 = ⌦ H3 H4 P (A) = P (A|H1 ).P (H1 ) H1 H2 +P (A|H2 ).P (H2 ) +P (A|H3 ).P (H3 )
A
+P (A|H4 ).P (H4 )
Příklad: P (H1) = 1/12, P (A|H1) = 0,005 P (H2) = 2/12, P (A|H2) = 0,008 P (H3) = 4/12, P (A|H3) = 0,003 P (H4) = 5/12, P (A|H4) = 0,003 P (A) = ( 5 + 16 + 12 + 15)/12000 = 0,004
⌦
Bayesova věta A je náhodný jev, {H1 , H2 , H3 , H4 } je úplné pokrytí ⌦ Hi \ Hj = Ø, H1 [ H2 [ H3 [ H4 = ⌦ H3 H1 H2 H4 P (H1 |A) = P (A|H1 ).P (H1 ) A P (A) ⌦
Bayesova věta A je náhodný jev, {H1 , H2 , H3 , H4 } je úplné pokrytí ⌦ Hi \ Hj = Ø, H1 [ H2 [ H3 [ H4 = ⌦ H3 H1 H2 H4 P (H1 |A) = P (A|H1 ).P (H1 ) A P4 i=1 P (A|Hi ).P (Hi ) ⌦
Příklad: P (H1) = 0,08333, P (A|H1) = 0,005 P (H2) = 0,16667, P (A|H2) = 0,008 P (H3) = 0,33333, P (A|H3) = 0,003 P (H4) = 0,41667, P (A|H4) = 0,003 P (H1|A) = 0,005.0,08333/0,004 = 0,10417
Bayesova věta Příklad: Tělo kompresoru musí být 100% hermeticky uzavřeno. V průměru jeden ze sta kompresorů trochu netěsní a je třeba jej rozložit a znovu složit. Zkouška těsnosti odhalí vadný výrobek s pravděpodobností 0,8. Naproti tomu, s pravděpodobností 0,05 označí jako vadný bezvadný výrobek. Jaká je pravděpodobnost vady u výrobku, který zkouška označila jako vadný? 0,80 + 0,008 0,008 P (V|+) = 0,008+0,0495 0,01 V 0,20 - 0,002 kompreso
0,99
B
0,05
+
0,0495
0,95
-
0,9405
Bayesova věta Příklad: Tělo kompresoru musí být 100% hermeticky uzavřeno. V průměru jeden ze sta kompresorů trochu netěsní a je třeba jej rozložit a znovu složit. Zkouška těsnosti odhalí vadný výrobek s pravděpodobností 0,8. Naproti tomu, s pravděpodobností 0,05 označí jako vadný bezvadný výrobek. Jaká je pravděpodobnost vady u výrobku, který zkouška označila jako vadný? 0,80 + 0,008 0,008 P (V|+) = 0,008+0,0495 0,01 V 0,20 - 0,002 kompreso = 0,1391 0,05 0,0495 + 0,99 B 0,95 - 0,9405
Bayesova věta Příklad: Tělo kompresoru musí být 100% hermeticky uzavřeno. V průměru jeden ze sta kompresorů trochu netěsní a je třeba jej rozložit a znovu složit. Zkouška těsnosti odhalí vadný výrobek s pravděpodobností 0,8. Naproti tomu, s pravděpodobností 0,05 označí jako vadný bezvadný výrobek. Jaká je pravděpodobnost vady u výrobku, který zkouška označila jako vadný? 0,80 + 0,0111 0,0111 P2(V|+) = 0,0111+0,0042 0,139 V 0,20 - 0,0028 kompreso = 0,7255 0,05 0,0042 + 0,861 B Při opakovaném testu 0,95 - 0,8179
Náhodná veličina Náhodná veličina je funkce X : ⌦ ! R Přesněji: měřitelná funkce 8x 2 R :
X : (⌦, F) ! (R, B)
{! 2 ⌦ : X(!) x} 2 F
P ({! 2 ⌦ : X(!) x}) = F (x), x 2 R
Distribuční funkce náhodné veličiny: F (x) = P (X x) , x 2 R
Distribuční funkce odpovídá na otázku: S jakou pravděpodobností náhodná veličina nepřekročí hodnotu x?
Náhodná veličina diskrétní náhodná Náhodná veličina je funkce z ⌦ do veličina a) spočetné podnmožiny S ⇢ R b) souvislé podnmožiny Q ⇢ R
spojitá náhodná veličina
Diskrétní náhodná veličina: obor hodnot = {x1, x2, …, xn, …} pravděpodobnostní funkce: P(xi) = pi, i=1, 2, … vždycky musí platit, že potom je
pi 2 h0, 1i,
F (x) = P (X x) =
1 X
pi = 1
i=1
X
i=:xi x
pi , x 2 R
Náhodná veličina Spojitá náhodná veličina:
hustota pravděpodobnosti
obor hodnot = (a,b) či ⟨a, ∞) nebo celé R nutně platí: P(x) = 0, 8x 2 (a, b)
zavádíme nezápornou, zpravidla spojitou funkci f(x) tak, Z x že platí:
F (x) =
1
vždycky musí platit, že
f (t)dt, 8x 2 R Z
+1
f (t)dt = 1 1
Charakteristiky náhodné veličiny Kvantily: Často se ptáme: Jakou hodnotu sledovaná náhodná veličina nepřekročí s danou pravděpodobností? … tedy pro zadané ↵ 2 (0, 1) hledáme x↵ 2 R tak, že
F (x↵ ) ↵
α - kvantil
je-li F(x) spojitá a prostá, potom je x↵ = F
1
(↵)
v případě diskrétní (po částech konstantní) F(x) je to taková maximální hodnota veličiny X, pro niž platí P (X x↵ ) ↵ a zároveň P (X < x↵ ) ↵.
Patří sem: minimum, medián, maximum, dolní a horní decily, horní a dolní kvartily, ….
Charakteristiky náhodné veličiny Momenty: střední hodnota
E(X) = E(X) =
1 X
x i pi
i=1 Z 1
1
xf (x)dx
diskrétní náhodné veličiny spojité náhodné veličiny
Vlastnosti střední hodnoty: aditivita: E(X + Y ) = E(X) + E(Y ) homogenita: E(kX) = kE(X), k 2 R
-
linearita
Střední hodnota tvoří jakési “těžiště” náhodné veličiny.
Charakteristiky náhodné veličiny Momenty: k-tý obecný moment náhodné veličiny
k
mk = E(X )
k-tý centrální moment náhodné veličiny ⌫k = E(X rozptyl (míra variability) šikmost (míra symetrie)
EX)k
V ar(X) = E(X
EX)2
E(X
3
Skew(X) =
špičatost (míra koncentrace) Kurt(X) =
EX)
3/2
(V ar(X)) E(X EX)4 (V ar(X))
2
Charakteristiky náhodné veličiny Další charakteristiky modus, rozpětí, typ rozdělení, …