TEORIE K MV2
ROZDĚLENÍ
Rozdělení Náhodná veličina Náhodná veličina je vyjádření výsledku náhodného pokusu číselnou hodnotou. Jde o reálnou funkci definovanou na množině . Rozdělení náhodné veličiny udává jakých hodnot a s jakou pravděpodobností náhodná veličina nabývá. Jde o množinovou funkci – každé podmnožině ⊂ přiřadí pravděpodobnost. Distribuční funkce náhodné veličiny určuje pro každé pravděpodobnost, že náhodná veličina je menší než číslo . , ∈ Distribuční funkce vlastně představuje kumulativní pravděpodobnost. Distribuční funkce je neklesající, zleva spojitá a platí pro ni (důsledek kumulativní pravděpodobnosti) lim 0, lim 1 →
→
Typy rozdělení Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot , , … (připouštíme konečný či dokonce až spočetný seznam) a kladných pravděpodobností , , … splňujících podmínku 1
Distribuční funkce diskrétního rozdělení je schodovitá. Spojité rozdělení Náhodná veličina má spojité rozdělení pravděpodobnosti, jestliže existuje takzvaná hustota ! taková že platí "! Pro spojité rozdělení platí • pro každý bod spojitosti funkce hustoty ! •
•
pro každý bod &
!
je
1
%
'
&( !
je !
,
# $
pro každé % ∈ je % 0 (situaci si můžeme představit jako plochu obdélníku histogramu s intervalem o nulové šíři). Distribuční funkce spojitého rozdělení je spojitá. Poznámka Při výpočtu pravděpodobnosti je důležité respektovat správný typ rozdělení. •
∀ ∃
1
TEORIE K MV2
ROZDĚLENÍ
Charakteristiky náhodných veličin Střední hodnota Střední hodnota (očekávaná hodnota) náhodné veličiny je hodnota, kolem které se kumulují hodnoty této veličiny. Počítá se různě pro oba typy rozdělení. Pro diskrétní rozdělení jde o vážený průměr možných hodnot, váhami jsou pravděpodobnosti těchto hodnot. ∙
) =
=
∙
=
=
+
∙
=
+⋯
Pro spojité rozdělení se střední hodnota počítá jako integrál všech možných hodnot přičemž váhovou funkcí je hustota. ∙!
) = "
Střední hodnota funkce . = / náhodné veličiny je hodnota, kolem které se kumulují hodnoty náhodné veličiny / . Pro diskrétní rozdělení jde o vážený průměr možných hodnot, váhami jsou pravděpodobnosti těchto hodnot. )/
=
/
∙
=
=/
∙
=
+/
∙
=
+⋯
Pro spojité rozdělení se střední hodnota počítá jako integrál všech možných hodnot přičemž váhovou funkcí je hustota. )/
= "/
∙!
Rozptyl Rozptyl náhodné veličiny udává variabilitu rozdělení náhodné veličiny kolem její střední hodnoty. Jde o střední hodnotu čtverců odchylek možných hodnot od střední hodnoty. Pro diskrétní rozdělení rozptyl počítáme jako 0%1
=)
−)
=
−)
= −) ∙ Pro spojité rozdělení rozptyl počítáme jako 0%1
=)
Směrodatná odchylka Směrodatná odchylka náhodné veličiny
−)
∙ =
= "
= + −)
−)
∙
=
+⋯
∙!
je √0%1
Nezávislost náhodných veličin Podobně jako u náhodných jevů můžeme definovat nezávislost i náhodných veličin. Říkáme, že náhodné veličiny jsou nezávislé, jestliže ∀ ,4 ∈ : < ,. < 4 = < ∙ .<4 Speciálně pro diskrétní rozdělení můžeme pracovat s podmínkou, že ∀6, 7: 8 = , . = 49 : = = ∙ . = 49 ∀ ∃
2
TEORIE K MV2
ROZDĚLENÍ
Vlastnosti střední hodnoty a rozptylu Jsou-li %, ∈ a , . jsou libovolné náhodné veličiny, pak ) %+ ∙ %+ ∙) ∙ 0%1 0%1 % + ∙ 0%1 ; 0 0%1 ) 2 ) ) +. ) + ). , . nezávislé: 0%1 + . 0%1 + 0%1 . Kvantily rozdělení Má-li náhodná veličina
distribuční funkci , potom kvantilová funkce je definována jako infimum C infE ∈ ∶ ; CG, 0 C 1 Hodnotám funkce C se říká C-kvantil (někdy též 100 ∙ C procentní kvantil. V případě spojitého rozdělení e to přímo inverzní funkce k a platí H
C I
C
C-kvantil je tedy taková hodnota, pod kterou je náhodná veličina s pravděpodobností C. Speciálně 0,5 se nazývá medián rozdělení.
Některá rozdělení diskrétních náhodných veličin Alternativní rozdělení Alt(p) Pro parametr platí
0 K 1 Náhodná veličina nabývá pouze dvou hodnot E0, 1G, toto rozdělení bývá nazýváno nula-jedničkové. Pro alternativní rozdělení je pravděpodobnostní funkce definována jako 1 K, 0 12K Zkráceně píšeme ~MN# K . Pro střední hodnotu a rozptyl platí ) 1∙ 1 +0∙ 0 K 0%1 ) 2 ) 1 ∙ 1 +0 ∙ 0 2K K2K K 12K Použití Teoretický základ pro další typy rozdělení, házení mincí.
Pravděpodobnostní funkce 1 2 K pro 0 pro 1 O K 0 jinde
∀ ∃
0 O1 2 K 1
Distribuční funkce
pro 0 pro 0 U 1 pro ; 0
3
TEORIE K MV2
ROZDĚLENÍ
Rovnoměrné diskrétní rozdělení Rd(n) Pro parametr platí
V∈W Náhodná veličina nabývá hodnot E0, 1, 2, … , VG. Pro rovnoměrné rozdělení je pravděpodobnostní funkce definována jako 1 6 V+1 Zkráceně píšeme ~ V . Pro střední hodnotu a rozptyl platí 0%1
Y
)
)
2 )
Z[
6∙
1 V+1 Y
Z
6 ∙
V∙ V+1 2 V+1
1 V 2H I V+1 2
V 2
1+V 21 12
Použití Jde o rozdělení reprezentující klasickou pravděpodobnost. Házení kostkou, tahání z balíčku karet a podobně.
Binomické rozdělení Bi(p, n) Pro parametry platí
0 K 1, V∈W Náhodná veličina nabývá hodnot E0, 1, 2, … , VG. Pro binomické rozdělení je pravděpodobnostní funkce definována jako V 6 H I∙K ∙ 12K Y 6 Zkráceně píšeme ~\6 K, V . Pro střední hodnotu a rozptyl platí 0%1
)
2 )
)
Y
Z[ Y Z[
V 6∙H I∙K ∙ 12K 6
Y
V 6 ∙H I∙K ∙ 12K 6
Y
V∙K
2 V∙K
V∙K 12K
Vlastnosti Je zřejmé, že alternativní rozdělení MN# K je totéž jako binomické rozdělení \6 K, 1 . Jsou-li , , … , Y nezávislé náhodné veličiny, ∀6 ∈ E0, 1, 2, … , VG; ~MN# K , pak Y
∀ ∃
Z
~\6 K, V
4
TEORIE K MV2
ROZDĚLENÍ
Použití Pravděpodobnost úspěchu v jednom pokusu je K, náhodná veličina ~\6 K, V charakterizuje počet úspěšných pokusů při V nezávislých opakováních. Podíl výrobků z danou vlastností v základním souboru je K, náhodná veličina ~\6 K, V charakterizuje počet výrobků s danou vlastností ve výběru rozsahu V, pokud prvky po výběru vracíme zpět.
Geometrické rozdělení Pro parametry platí
0 K 1 Náhodná veličina nabývá hodnot E0, 1, 2, … G. Pro geometrické rozdělení je pravděpodobnostní funkce definována jako 6 K∙ 12K Zkráceně píšeme ~^_ K . Pro střední hodnotu a rozptyl platí 0%1
)
)
2 )
Z[
6∙K∙ 12K Z[
12K K
12K 6 ∙K∙ 12K 2` a K
12K K
Použití Pravděpodobnost úspěchu v jednom pokusu je K, náhodná veličina ~^_ K charakterizuje počet neúspěšných pokusů předcházejících prvnímu úspěšnému pokusu.
∀ ∃
5
TEORIE K MV2
ROZDĚLENÍ
Hypergeometrické rozdělení Hg(N, M, n) Pro parametry platí 0 b W, 0 V U W, V, W, b jsou přirozená čísla Náhodná veličina nabývá hodnot E0, 1, 2, … , min b, V G. Pro hypergeometrické rozdělení je pravděpodobnostní funkce definována jako 6
8h: ∙ 8iY : 8i Y
h
:
Zkráceně píšeme ~j/ W, b, V . Pro střední hodnotu a rozptyl platí 0%1
)
)
6∙
2 )
8h: ∙ 8iY 8i : Y
h
:
V∙b W
V∙b b W2V ∙ `1 2 a ∙ W W W21
Vlastnosti Binomické rozdělení je limitním případem hypergeometrického rozdělení. Pro V → ∞, b⁄W → 0 je j/ W, b, V m \6 b⁄W , V . Použití V souboru N objektů má M objektů sledovanou vlastnost. Provedeme výběr V objektů bez vracení. Náhodná veličina ~j/ W, b, V charakterizuje počet objektů se sledovanou vlastností v tomto výběru.
Poissonovo rozdělení Po(n) Pro parametr platí
n o 0, n∈ Náhodná veličina nabývá hodnot E0, 1, 2, … G. Pro Poissonovo rozdělení je pravděpodobnostní funkce definována jako n 6 ∙_ q 6! Zkráceně píšeme ~ r n . Pro střední hodnotu a rozptyl platí ) n 0%1 n Vlastnosti Poissonovo rozdělení je limitním případem binomického rozdělení. Pro V → ∞, K → 0 je \6 K, V m r n . ∀ ∃
6
TEORIE K MV2
ROZDĚLENÍ
Použití Uvažujme náhodně se vyskytující událost, přičemž průměrný počet výskytů události za konstantní časovou jednotku je n intenzita výskytu události Náhodná veličina ~ r n charakterizuje počet výskytů události za danou časovou jednotku.
Negativní binomické rozdělení NBi(p, n) Pro parametry platí 0 < K < 1, V∈W Náhodná veličina nabývá hodnot E0, 1, 2, … G. Pro negativní binomické rozdělení je pravděpodobnostní funkce definována jako 6+V21 6 ` a ∙ KY ∙ 1 2 K V21 Zkráceně píšeme ~W\6 K, V . Pro střední hodnotu a rozptyl platí V∙ 12K ) K V∙ 12K 0%1 = ) − ) = K Vlastnosti Geometrické rozdělení ^_ K je totéž jako negativní binomické rozdělení W\6 K, 1 . Použití Pravděpodobnost úspěchu v pokusu je K, náhodná veličina ~W\6 K, V charakterizuje počet neúspěšných pokusů předcházejících V-tému úspěšnému pokusu.
∀ ∃
7
TEORIE K MV2
ROZDĚLENÍ
Některá rozdělení spojitých náhodných veličin Rovnoměrné spojité rozdělení R(a,b) Pro parametry platí % , %, ∈ Spojitá náhodná veličina nabývá libovolných hodnot z intervalu %, . Všechny její výskyty mají stejnou pravděpodobnost výskytu. Pro rovnoměrné spojité rozdělení s parametry %, je pravděpodobnostní funkce (hustota) definována jako 1 pro % ! O 2% 0 pro % a Distribuční funkce rovnoměrného spojitého s parametry %, rozdělení je 0 U% 2% % w 2% 1 ; Zkráceně píšeme ~ %, . Pro střední hodnotu a rozptyl platí %+ ) 2 2% 0%1 ) 2 ) 12 Použití Náhodná veličina značící chybu při zaokrouhlování, čekání na autobus, čekání na výrobek u automatické linky a podobně.
Exponenciální rozdělení Exp(n) Pro parametr platí
n o 0, n∈ Spojitá náhodná veličina nabývá libovolných hodnot z intervalu 2∞, ∞ . Pro exponenciální rozdělení s parametrem n je pravděpodobnostní funkce (hustota) definována jako n ∙ _ q pro ; 0 ! x 0 pro 0 Distribuční funkce exponenciálního rozdělení s parametrem n je ∀ ∃
8
TEORIE K MV2
ROZDĚLENÍ "! #
#
x
12_ 0
q
pro ; 0 pro 0
Zkráceně píšeme ~) K n . Pro střední hodnotu a rozptyl platí )
0%1
"
)
∙!
2 )
" [
" [
∙n∙_
∙n∙_
q q
1 n
1 n
Vlastnosti Exponenciální rozdělení lze chápat jako limitní spojitý případ geometrického rozdělení. Použití Popis doby čekání na událost nebo doby mezi událostmi nastávajícími v náhodných okamžicích a nezávisle (doba obsluhy a podobně). Parametr je převrácená hodnota střední doby čekání do nastoupení sledovaného jevu.
Normální (Gaussovo) rozdělení y z, {| Pro parametry platí, že jde o střední hodnotu a rozptyl tohoto rozdělení } ) , ~ 0%1 Spojitá náhodná veličina nabývá libovolných hodnot z intervalu 2∞, ∞ . Pro normální (Gaussovo) rozdělení s parametry }, ~ je pravděpodobnostní funkce (hustota) definována jako € ‚ 1 ∙H I • ! ∙_ ~√2• Distribuční funkci normálního rozdělení nelze explicitně vyjádřit "! #
#
Říkáme, že má normální (Gaussovo) rozdělení se střední hodnotou } a rozptylem ~ . Zkráceně píšeme ~W }, ~ . Vlastnosti Jde o nejdůležitější spojité rozdělení. Vzniká součtem mnoha nepatrných příspěvků. Parametr } (střední hodnota) určuje, kde má graf hustoty pravděpodobnosti maximum. Parametr ~ (směrodatná ∀ ∃
9
TEORIE K MV2
ROZDĚLENÍ
odchylka) určuje, jak jsou po obou stranách od hodnoty } vzdáleny inflexní body, neboli jak je křivka roztažena do šířky. Použití Toto rozdělení bývalo prezentováno jako zákon chyb a je velmi vhodné pro interpretaci všech měření, výsledků střelby a podobně.
Na dalším obrázku je ukázka několika grafů hustot normálního rozdělení s různými parametry. Zde je modrá W 0, 1 , zelená W 1, 1 , magenta W 22, 1 , cyan W 0, 4 a černá W 0, 0.25
Normované normální rozdělení N(0, 1) Normované normální rozdělení s parametry 0 a 1 je speciální případ obecného normálního rozdělení. Distribuční funkce tohoto rozdělení je velmi dobře tabelována. Proto bývá toto rozdělení často využíváno v praxi. Současně je i velmi vhodné pro vysvětlení některých souvislostí. Hustota pravděpodobnosti a distribuční funkce normovaného normálního rozdělení W 0,1 jsou tradičně značeny
∀ ∃
… †
1
√2•
∙_
∙ ‚
,
‡ †
ˆ
†
Š
"
1
√2•
∙_
∙‰ ‚
#,
† ∈ 2∞, ∞ 10
TEORIE K MV2
ROZDĚLENÍ
Zjišťujeme-li například hodnotu ‡ 1,56 ˆ 1,56 pak v tabulkách (jsou součástí snad každé učebnice statistiky) vidíme, že pro nejbližší nižší a nejbližší vyšší hodnotu v argumentu platí ‡ 1,50 0,9332, ‡ 1,60 0,9452 Pomocí lineární interpolace zjistíme přibližnou hodnotu distribuční funkce pro daný argument ‡ 1,60 2 ‡ 1,50 ‡ 1,56 ‡ 1,50 + 1,56 2 1,50 ∙ 1,60 2 1,50 0,9452 2 0,9332 0,0120 0,9332 + 1,56 2 1,50 ∙ 0,9332 + 0,06 ∙ 1,40 2 1,30 0,10 0,9332 + 0,06 ∙ 0,1200 0,9332 + 0,0072 0,9404 Tímto způsobem jsme vlastně vyřešili úlohu, jaká je pravděpodobnost že náhodně vybraný jev ˆ bude mít menší hodnotu než 1,56. Tato pravděpodobnost je vlastně velikostí plochy pod grafem hustoty pravděpodobnosti W 0,1 v intervalu 2∞, 1,56 . Viz obrázek
Ze symetrie normovaného normálního rozdělení W 0,1 plyne ‡ 2† 12‡ † Opět to blíže osvětlí obrázek. Pro úplné pochopení je nutné si připomenout, že plocha pod grafem hustoty je vždy rovna jedné.
Pro výpočet ‡ 21,56 tedy lze využít buď tabulek se zápornými argumenty. Pokud nejsou k dispozici, snadno vypočteme ‡ 21,56 1 2 ‡ 1,56 1 2 0,9404 0,0596 Nyní lze snadno odvodit vztah pro pravděpodobnost na intervalu % ˆ ˆ 2 ˆ % ‡ 2‡ % Pomocí tohoto vztahu z tabulek snadno dostaneme 22 ˆ 1 ‡ 1 2 ‡ 22 0,8413 2 0,0228 0,8185
∀ ∃
11
TEORIE K MV2
ROZDĚLENÍ
Vidíme, že pomocí tabulek můžeme velmi snadno počítat pravděpodobnosti pro různé situace týkající se normovaného normálního rozdělení W 0,1 .
Vztah obecného a normovaného normálního rozdělení Známý vztah z teorie nám umožňuje výhod normovaného normálního rozdělení W 0,1 užívat i pro obecné normální rozdělení W }, ~ . Platí totiž 2} ~W 0,1 ~W }, ~ ⟹ ˆ ~ Tuto větu můžeme využít takto 2} 2} 2} 2} ` a Hˆ I ‡H I ~ ~ ~ ~ A odtud dále 2} 2} 2} %2} a2 ` a % 2 % ` ~ ~ ~ ~ 2} %2} 2} %2} `ˆ a 2 Hˆ I ‡` a2‡H I ~ ~ ~ ~ Tímto způsobem veškeré výpočty týkající se obecného normálního rozdělení můžeme uskutečnit pomocí tabulek pro normované normální rozdělení.
Kvantily normovaného normálního rozdělení Kvantilovou funkci náhodné veličiny ˆ~W 0,1 značíme ‡ C . Platí C 8ˆ ‡ C : ‡ ‡ C Hodnoty kvantilové funkce můžeme najít v tabulkách ‡ inverzním postupem. Často používanými hodnotami jsou ‡ 0,95 1,65, ‡ 0,975 1,96 Situaci demonstruje obrázek
Protože v tabulkách bývají často jen kvantily pro C ; 0,5, můžeme pro C planoucího ze symetrie normovaného normálního rozdělení. ∀ ∃
0,5 využít vztahu 12
TEORIE K MV2
ROZDĚLENÍ
‡ C Například 5%-ní kvantil rozdělení W 0,1 je ‡
2‡ 0,05
12C 2‡
1 2 0,05
2‡
0,95
21,65
Kvantily obecného normálního rozdělení Již víme, že platí Odtud C-kvantil náhodné veličiny
2} ~W 0,1 ~ je taková hodnota ‘, pro kterou platí ‘ C
~W }, ~
⟹ˆ
‘2} a C ~ ‘2} `ˆ a C ~ ‘2} a C ‡` ~ ‘2} ‡ C ~ ‘ ~∙‡ C +} Tento výsledek nám umožňuje pro obecné normální rozdělení dělat výpočty podle tabulek pro normované normální rozdělení. Dále postupně odvodíme
∀ ∃
`
2} ~
13