Náhodná veličina Náhodnou veličinou nazýváme veličinu, která s určitými p-stmi nabývá reálných hodnot jednoznačně přiřazených výsledkům příslušných náhodných pokusů. Náhodné veličiny obvykle dělíme na dva základní druhy: a) Diskrétní náhodné veličiny, které nabývají konečně resp. spočetně mnoha hodnot. b) Spojité náhodné veličiny, které mohou nabývat libovolných hodnot z určitého (konečného popř. nekonečného) intervalu. Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka Diskrétní náhodná veličina Diskrétní náhodná veličina je určena za dvou předpokladů: (i) je dán obor hodnot, kterých nabývá, (ii) je dána p-st výskytu těchto hodnot. Zákon rozdělení p-sti Funkce p ( x ) , která každé hodnotě x náhodné veličiny ξ přiřazuje příslušnou p-st p ( x ) se nazývá zákon rozdělení (p-stní funkce, frekvenční funkce) náhodné veličiny ξ. Píšeme p ( x ) = P (ξ = x ) . Distribuční funkce Funkce F ( x ) , která každému reálnému x ∈ ( −∞, +∞ ) přiřazuje p-st toho, že ξ < x se nazývá distribuční funkce náhodné veličiny ξ . Píšeme F ( x ) = P (ξ < x ) .
Příklad: Nechť náhodnou veličinou ξ je počet padlých líců při hodu třemi mincemi. Zákon rozdělení p-sti je dán tabulkou. Nakreslete graf zákona rozdělení p-sti a graf distribuční funkce.
x
0
1
2
3
p( x)
1 8
3 8
3 8
1 8
F ( x)
p ( x)
3 8
•
D
1 7 8
•
D
4 8
1 • 8
0
D
•
•
• 1 8
1
3
2
x
Pravděpodobnostní funkce
0
D
•
•
x
Distribuční funkce
Vlastnosti distribuční funkce (i) 0 ≤ F ( x) ≤ 1 (ii)
F ( x) = ∑ p( xi ) xi < x
(iii) (iv) (v) (vi)
P (a ≤ ξ < b) = F (b) − F ( a ) pro a < b F je neklesající F ( −∞ ) = 0, F ( +∞ ) = 1 F je spojitá zleva v bodech xi a oboustranně spojitá jinde
Číselné charakteristiky diskrétní náhodné veličiny Počáteční momenty Počátečním momentem k-tého řádu náhodné veličiny ξ rozumíme hodnotu danou vztahem μk (ξ ) = ∑ xik p( xi ) xi
Speciálně μ1 (ξ ) se nazývá střední hodnota náhodné veličiny ξ . Je to hodnota, kolem níž hodnoty náhodné veličiny při opakování pokusu kolísají. Označení E (ξ ) nebo také μ . Centrální momenty Centrálním momentem k-tého řádu náhodné veličiny ξ rozumíme hodnotu danou
vztahem ν k (ξ ) = ∑ ( xi − μ ) k p ( xi ) . xi
Speciálně ν 2 (ξ ) se nazývá disperze (rozptyl) náhodné veličiny ξ . Je to míra rozptýlení náhodné veličiny ξ kolem střední hodnoty při opakování pokusu. Označení D (ξ ) nebo také σ 2 . Další užívanou charakteristikou je standardní (směrodatná) odchylka σ = D(ξ ) . Mezi počátečními a centrálními momenty platí vztahy:
ν1 = 0
ν 2 = μ 2 − μ12 ν 3 = μ3 − 3μ 2 μ1 + 2μ13 ν 4 = μ 4 − 4μ3 μ1 + 6μ 2 μ12 − 3μ14 Centrální normované momenty Centrálním normovaným momentem k-tého řádu náhodné veličiny ξ rozumíme hodnotu danou vztahem ν (ξ ) νk (ξ ) = k k σ Speciálně A = ν3 (ξ ) se nazývá koeficient asymetrie a e = ν4 (ξ ) − 3 se nazývá koeficient excesu (špičatosti).
Příklad: Určete střední hodnotu, disperzi, standardní odchylku, koeficient asymetrie a koeficient excesu náhodné veličiny ξ vyjadřující počet padlých líců při hodu třemi mincemi. p( x) x p ( x ) x 2 p( x) x3 p ( x) x 4 p( x) x 0 1 2 3 sumy
0,125 0,375 0,375 0,125 1,000
0,000 0,375 0,750 0,375 1,500
0,000 0,375 1,500 1,125 3,000
0,000 0,375 3,000 3,375 6,750
0,000 0,375 6,000 10,125 16,500
Z posledního řádku tabulky máme μ1 = 1,5 μ2 = 3 μ3 = 6, 75 μ4 = 16,5 . S použitím výše uvedených vzorců vypočteme centrální momenty ν 2 = 3 − 1,52 = 0, 75
ν 3 = 6, 75 − 3 ⋅ 3 ⋅1, 5 + 2 ⋅1, 53 = 0 ν 4 = 16, 5 − 4 ⋅ 6, 75 ⋅1, 5 + 6 ⋅ 3 ⋅1, 52 − 3 ⋅1,54 = 1, 3125 Tedy: střední hodnota E (ξ ) = μ1 = 1,5 disperze D(ξ ) = ν 2 (ξ ) = 0, 75 standardní odchylka σ = D(ξ ) = 0, 75 = 0,8660 0 koeficient asymetrie A = ν3 (ξ ) = =0 0,86603 1,3125 − 3 = 2,3333 − 3 = −0, 6667 koeficient excesu e = ν4 − 3 = ( 0, 75) 4
Některá rozdělení diskrétní náhodné veličiny Alternativní rozdělení A( p ) - má náhodná veličina s pravděpodobnostní funkcí pro x = 1 ⎧p p( x) = ⎨ ⎩1 − p pro x = 0
Obor hodnot {0,1} , charakteristiky E (ξ ) = p, D (ξ ) = 1 − p . Rovnoměrné rozdělení R ( n) -má náhodná veličina s pravděpodobnostní funkcí 1 p ( x) = , kde n je počet možných hodnot. n Binomické rozdělení Bi ( n, p ) - má náhodná veličina s pravděpodobnostní funkcí ⎛n⎞ p ( x) = ⎜ ⎟ p x (1 − p ) n − x ⎝ x⎠
Obor hodnot {0,1, 2,..., n} , charakteristiky E (ξ ) = np, D (ξ ) = np (1 − p ) . Nechť výsledkem nějakého pokusu je jev A , pravděpodobnost nastoupení jevu je P ( A) = p . Binomická náhodná veličina udává počet nastoupení jevu A v n nezávislých pokusech. Hypergeometrické rozdělení H ( N , M , n) - má náhodná veličina s pravděpodobnostní funkcí ⎛ M ⎞⎛ N − M ⎞ ⎜ ⎟⎜ ⎟ x n−x ⎠ p ( x) = ⎝ ⎠⎝ , ⎛N⎞ ⎜ ⎟ ⎝n⎠ kde N je počet prvků základního souboru; M je počet prvků v základním souboru, které mají požadovanou vlastnost; n je počet pokusů a x je počet vybraných prvků, které mají zkoumanou vlastnost. Obor hodnot max {0, M − N + n} ≤ x ≤ min {n, M } , charakteristiky E (ξ ) = n
M M ⎛ M ⎞ N −n , D (ξ ) = n ⎜1 − ⎟ N N⎝ N ⎠ N −1
Poissonovo rozdělení Po(λ ) - má náhodná veličina s pravděpodobnostní funkcí p ( x) =
λx
e− λ
x! Obor hodnot {0,1, 2,...} , charakteristiky E (ξ ) = D (ξ ) = λ . Poissonovská náhodná veličina udává počet výskytů nějakého jevu v daném jednotkovém úseku (časovém, délkovém, plošném apod.), přičemž výskyty jsou na sobě nezávislé, současně nenastane dva a více jevů a p-st výskytu jevů v daném dostatečně malém dílčím úseku je přímo úměrná velikosti tohoto úseku a je v celém jednotkovém úseku stejná.
Spojitá náhodná veličina Pro spojitou náhodnou veličinu nemá smysl definovat pojem p-stní funkce stejným způsobem jako v případě diskrétní náhodné veličiny, protože P (ξ = x ) = 0 . Zavedeme jinou funkci, kterou nazveme hustotou p-ti. Definujme, stejně jako v diskrétním případě, pojem distribuční funkce F ( x ) = P (ξ < x ) tak, aby byla zachována vlastnost (iii) P (a ≤ ξ < b) = F (b) − F ( a ) pro a < b . Tuto vlastnost můžeme zapsat jako P ( x ≤ ξ < x + h) = F ( x + h) − F ( x ) Odtud P ( x ≤ ξ < x + h) F ( x + h) − F ( x ) = h h P ( x ≤ ξ < x + h) F ( x + h) − F ( x ) lim = lim = f ( x) h→0 h →0 h h Funkci f ( x ) nazýváme hustotou p-ti náhodné veličiny ξ . Je zřejmé, že poslední limita je definicí derivace funkce F ( x ) , tedy f ( x ) = F ′( x ) a platí b
P (a ≤ ξ < b) = F (b) − F ( a ) = ∫ f ( x) dx . a
F ( x) 1
f ( x)
P ( x ≤ a < b)
a
Funkce hustoty
b
x
x
Distribuční funkce
Číselné charakteristiky spojité náhodné veličiny Počáteční momenty Počátečním momentem k-tého řádu náhodné veličiny ξ rozumíme hodnotu danou vztahem μk (ξ ) =
∞
∫x
k
f ( x) dx
−∞
Speciálně μ1 (ξ ) se nazývá střední hodnota náhodné veličiny ξ . Je to hodnota, kolem níž hodnoty náhodné veličiny při opakování pokusu kolísají. Označení E (ξ ) nebo také μ . Centrální momenty Centrálním momentem k-tého řádu náhodné veličiny ξ rozumíme hodnotu danou vztahem ν k (ξ ) =
∞
∫ (x − μ)
k
f ( x) dx .
−∞
Speciálně ν 2 (ξ ) se nazývá disperze (rozptyl) náhodné veličiny ξ . Je to míra rozptýlení náhodné veličiny ξ kolem střední hodnoty při opakování pokusu. Označení D (ξ ) nebo také σ 2 . Další užívanou charakteristikou je standardní (směrodatná) odchylka σ = D(ξ ) . Mezi počátečními a centrálními momenty platí vztahy: ν1 = 0
ν 2 = μ 2 − μ12 ν 3 = μ3 − 3μ2 μ1 + 2 μ13 ν 4 = μ4 − 4 μ3 μ1 + 6μ 2 μ12 − 3μ14 Centrální normované momenty Centrálním normovaným momentem k-tého řádu náhodné veličiny ξ rozumíme hodnotu danou vztahem ν (ξ ) νk (ξ ) = k k σ Speciálně A = ν3 (ξ ) se nazývá koeficient asymetrie a e = ν4 (ξ ) − 3 se nazývá koeficient excesu (špičatosti).
Některá rozdělení spojité náhodné veličiny Rovnoměrné rozdělení R ( a, b) -má náhodná veličina s funkcí hustoty ⎧ 1 pro x ∈ 〈 a, b〉 ⎪ f ( x) = ⎨ b − a ⎪⎩0 pro x ∉ 〈 a, b〉 a+b (b − a ) 2 , D(ξ ) = Charakteristiky E (ξ ) = . 2 12 Graf hustoty pravděpodobnosti:
Distribuční funkce ⎧0 pro x ∈ ( −∞, a ) ⎪ ⎪x−a F ( x) = ⎨ pro x ∈ a, b b − a ⎪ ⎪⎩1 pro x ∈ ( b, ∞ ) Graf distribuční funkce
F ( x) 1
a
b
x
Exponenciální rozdělení E (λ ) -má náhodná veličina s funkcí hustoty ⎧λ e − λ x pro x ≥ 0 f ( x) = ⎨ pro x < 0 ⎩0 Charakteristiky E (ξ ) =
1
λ
, D (ξ ) =
1
λ2
Graf hustoty pravděpodobnosti:
Distribuční funkce má tvar ⎧1 − e − λ x pro x ≥ 0 F ( x) = ⎨ pro x < 0 ⎩0 Graf distribuční funkce:
Toto rozdělení má spojitá náhodná veličina ξ , která představuje interval čekání na poissonovský jev resp. interval mezi dvěma poissonovskými jevy (např. doba čekání na obsluhu, vzdálenost mezi dvěma kazy v balíku látky). Závisí na parametru λ , což je převrácená hodnota střední hodnoty doby čekání do nastoupení sledovaného jevu.
Normální rozdělení N ( μ , σ 2 ) -má náhodná veličina s funkcí hustoty − 1 f ( x) = e σ 2π
( x − μ )2 2σ 2
pro x ∈ (-∞,+∞ )
Charakteristiky E (ξ ) = μ , D(ξ ) = σ 2 . Grafem hustoty pravděpodobnosti je tzv. Gaussova (Gaussova-Laplaceova, zvonová) křivka:
Graf distribuční funkce:
Normální rozdělení používáme v případě, že náhodná veličina je výsledkem působení velkého počtu nepatrných a vzájemně nezávislých vlivů. Normálním rozdělením se dají mnohá jiná používaná rozdělení nahradit.
Normované normální rozdělení N (0,1) Normální rozdělení se střední hodnotou μ = 0 a disperzí σ 2 = 1 se nazývá normované normální rozdělení. Hustota p-sti má tvar 2
1 − x2 ϕ ( x) = e 2π
pro x ∈ (-∞,+∞)
Graf funkce hustoty:
Graf distribuční funkce:
Hodnoty funkce hustoty a distribuční funkce normovaného normálního rozdělení jsou tabelovány. Dá se dokázat následující věta. Věta: Má-li náhodná veličina ξ normální rozdělení N ( μ , σ 2 ) , náhodná veličina ξ −μ má rozdělení N (0,1) . τ= σ
Příklad: Nechť náhodná veličin ξ má rozdělení N (3; 0, 64) . Určete, s jakou p-stí padne do intervalu (5,6). Řešení: Platí ⎛ 5−3 ξ −3 6−3 ⎞ P (5 < ξ < 6) = P ⎜ < < ⎟ = P (2,5 < τ < 3, 75) = Φ (3, 75) − Φ (2,5) = 0, 64 0, 64 ⎠ ⎝ 0, 64 = 0, 999912 − 0, 993790 = 0, 006122 . Hodnoty distribuční funkce Φ byly nalezeny v tabulkách.
Aproximace binomického rozdělení Vzhledem k obtížnosti výpočtu kombinačních čísel pro velká n používá se často aproximace binomického rozdělení rozdělením Poissonovým nebo rozdělením normálním. Pro p < 0, 3 nebo p>0,7 aproximujeme rozdělení Bi ( n, p ) rozdělením Po(λ ), λ = np , pro p ∈ 0,3;0, 7 pak rozdělením N ( μ , σ 2 ), μ = np, σ 2 = np(1 − p) .