Texty k pˇ redn´ aˇ sk´ am
Pravdˇ epodobnost
Ivan Nagy, Jitka Homolov´ a
Obsah 1 Definice pravdˇ epodobnosti
5
1.1
Z´akladn´ı pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2
Definice pravdˇepodobnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.3
Pˇr´ıklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2 Pˇ r´ıklady na pravdˇ epodobnost
10
2.1
Poˇc´ıt´an´ı s jevy
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2
Opakovan´e pokusy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.3
Pravdˇepodobnostn´ı strom . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.4
´ a pravdˇepodobnost a Bayes˚ Upln´ uv vzorec . . . . . . . . . . . . . . . . . . .
13
3 N´ ahodn´ a veliˇ cina a jej´ı popis
14
3.1
N´ahodn´a veliˇcina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3.2
Distribuˇcn´ı funkce
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
3.3
Hustota pravdˇepodobnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4 Rozdˇ elen´ı diskr´ etn´ı n´ ahodn´ e veliˇ ciny
20
4.1
Alternativn´ı rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
4.2
Binomick´e rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
4.3
Poissonovo rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
4.4
Negativn´ı binomick´e rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . .
22
4.5
Diskr´etn´ı rovnomˇern´e rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . .
23
5 Rozdˇ elen´ı spojit´ e n´ ahodn´ e veliˇ ciny
24
5.1
Rovnomˇern´e rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
5.2
Norm´aln´ı rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
5.3
Logaritmicko-norm´aln´ı rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . .
26
5.4
Exponenci´aln´ı rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
5.5
Rozdˇelen´ı gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
5.6
Rozdˇelen´ı beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5.7
Rozdˇelen´ı χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5.8
Rozdˇelen´ı t (Studentovo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5.9
Rozdˇelen´ı F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
6 N´ ahodn´ y vektor a jeho popis
29
6.1
´ y popis n´ahodn´eho vektoru . . . . . . . . . . . . . . . . . . . . . . . . . Upln´
29
6.2
Margin´aln´ı a podm´ınˇen´e rozdˇelen´ı n´ahodn´eho vektoru . . . . . . . . . . . . .
33
7 Poˇ c´ıt´ an´ı s n´ ahodn´ ymi vektory
36
8 Charakteristiky n´ ahodn´ eho vektoru
40
8.1
Stˇredn´ı hodnota a rozptyl . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
8.2
Momenty n´ahodn´e veliˇciny . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
8.3
Kvantil spojit´e n´ahodn´e veliˇciny . . . . . . . . . . . . . . . . . . . . . . . . .
44
8.4
Charakteristiky v´ıce n´ahodn´ ych veliˇcin . . . . . . . . . . . . . . . . . . . . .
44
9 Poˇ c´ıt´ an´ı charakteristik n´ ahodn´ eho vektoru
49
10 Funkce n´ ahodn´ eho vektoru
54
10.1 Funkce n´ahodn´e veliˇciny . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
10.2 Funkce n´ahodn´eho vektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
11 N´ ahodn´ y v´ ybˇ er, limitn´ı vˇ ety
61
11.1 N´ahodn´ y v´ ybˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
11.2 Pojem n´ahodn´eho v´ ybˇeru . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
11.3 Limitn´ı vˇety . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
11.4 Charakteristiky v´ ybˇeru
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
11.5 Normovan´e v´ ybˇerov´e charakteristiky . . . . . . . . . . . . . . . . . . . . . .
66
12 Bodov´ e odhady, jejich vlastnosti a konstrukce 12.1 Statistika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
69 69
12.2 Bodov´ y odhad parametru rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . .
69
12.3 Vlastnosti bodov´ ych odhad˚ u
. . . . . . . . . . . . . . . . . . . . . . . . . .
70
12.4 Konstrukce bodov´ ych odhad˚ u . . . . . . . . . . . . . . . . . . . . . . . . . .
71
13 Z´ avˇ ereˇ cn´ e opakov´ an´ı a poˇ c´ıt´ an´ı
75
4
1
Definice pravdˇ epodobnosti
Neˇz pˇristoup´ıme k definici pravdˇ epodobnosti , uvedeme z´ akladn´ı matematick´e struktury, o kter´e se definice op´ır´a.
1.1
Z´ akladn´ı pojmy
Z´akladem vˇsech u ´vah klasick´e pravdˇepodobnosti je n´ ahodn´ y pokus a jeho v´ ysledky . N´ ahodn´ y pokus je urˇcit´ y experiment, kter´ y i za relativnˇe st´al´ ych podm´ınek d´av´a r˚ uzn´e v´ ysledky. 1. Hod minc´ı s v´ysledky ”Rub” a ”L´ıc”. 2. Hod kostkou s v´ysledky z mnoˇziny {1,2,. . . ,6}. 3. Doba ˇzivotnosti pˇr´ıstroje s v´ysledky z R+ atd.
ˇ ´ı k l a d: Pr
Z´ akladn´ı prostor Ω je mnoˇzina vˇsech bezprostˇredn´ıch v´ ysledk˚ u n´ahodn´eho pokusu. Tyto v´ ysledky povaˇzujeme za d´ale nedˇeliteln´e a naz´ yv´ame je element´ arn´ı jevy . Vezmeme-li napˇr´ıklad pokus hod kostkou, budou bezprostˇredn´ımi v´ysledky pˇrirozen´ a ˇc´ısla od 1 do 6. To ale nejsou vˇsechny v´ysledky, kter´e n´ as mohou zaj´ımat. M˚ uˇzeme se pt´ at napˇr na v´ysledek ”padne sud´e ˇc´ıslo”, kter´y sice nen´ı bezprostˇredn´ım v´ysledkem, ale urˇcit´ym v´ysledkem pokusu jistˇe je. Vˇsimnˇeme si, je zm´ınˇen´y v´ysledek m˚ uˇzeme vyj´ adˇrit jako mnoˇzinu bezprostˇredn´ıch v´ysledk˚ u {2, 4, 6}, kter´e jej spln´ı (tedy nastane-li libovoln´y z nich, ˇrekneme, ˇze n´ aˇs v´ysledek nastal - padne-li 4, padlo sud´e ˇc´ıslo).
´ m k a: Pozna
N´ ahodn´ y jev je libovoln´a podmnoˇzina z´akladn´ıho prostoru Ω. ´ m k a: Pozna 1. N´ ahodn´ymi jevy jsou i pr´ azdn´ a mnoˇzina (tzv. jev nemoˇ zn´ y - v´ysledek, kter´y nem˚ uˇze nikdy nastat) a cel´ a mnoˇzina Ω (tzv. jev jist´ y - jev, kter´y nastane vˇzdy). Napˇr´ıklad: ”padne -1” a ”padne menˇs´ı neˇz 10”. 2. N´ ahodn´ymi jevy jsou i jednoprvkov´e podmnoˇziny, a tedy element´ arn´ı jevy jsou tak´e n´ ahodn´ymi jevy. 3. V´ysledek pokusu lze vyj´ adˇrit bud’ pomoc´ı v´yroku ”padne sud´e ˇc´ıslo” nebo pomoc´ı odpov´ıdaj´ıc´ı mnoˇziny element´ arn´ıch jev˚ u {2, 4, 6}. Mnoˇzinov´e vyj´ adˇren´ı je jedin´e, zat´ımco slovn´ıch (v´yrokov´ych) vyj´ adˇren´ı t´eˇze skuteˇcnosti m˚ uˇze b´yt nˇekolik. Napˇr. v´yroky ”padne necel´e ˇc´ıslo”, ”padne z´ aporn´e ˇc´ıslo”, ”padne vˇetˇs´ı neˇz 6” maj´ı jedin´e mnoˇzinov´e vyj´ adˇren´ı ∅.
Jevov´ e pole A je mnoˇzina vˇsech moˇzn´ ych jev˚ u, tedy mnoˇzina vˇsech podmnoˇzin z´akladn´ıho prostoru.
5
Po pravdˇe ˇreˇceno, jevov´e pole nemus´ı b´yt mnoˇzina u ´plnˇe vˇsech podmnoˇzin z´ akladn´ıho prostoru. Staˇc´ı, jestliˇze je to nepr´ azdn´y syst´em podmnoˇzin Ω, splˇ nuj´ıc´ı dvˇe podm´ınky
´ m k a: Pozna
1. je uzavˇren´y na doplˇ nky, tj. je-li A ∈ A pak i A0 ∈ A, 2. je uzavˇren´y na sjednocen´ı, tj. je-li spoˇcetn´y syst´em jev˚ u Ai ∈ A, pak take
S
Ai ∈ A.
Z tˇechto dvou podm´ınek plyne i uzavˇrenost na pr˚ uniky a skuteˇcnost, ˇze jevov´e pole mus´ı vˇzdy obsahovat pr´ azdnou mnoˇzinu i cel´y z´ akladn´ı prostor. (Dok´ azat!)
1.2
Definice pravdˇ epodobnosti
D e f i n i c e 1.1 (Axiomatick´ a pravdˇ epodobnost) Pravdˇepodobnost je re´aln´a funkce P : A → R definovan´a na jevov´em poli A, splˇ nuj´ıc´ı n´asleduj´ıc´ı podm´ınky: 1. je nez´aporn´a, tj. P (A) ≥ 0, ∀A ∈ A, 2. je normovan´a, tj. P (A) ≤ 1, ∀A ∈ P a P (Ω) = 1, 3. je σ aditivn´ı, tj. pro spoˇcetn´ y syst´em jev˚ u, takov´ ych ˇze Ai ∩ Aj = ∅ pro i 6= j plat´ı S P P ( k Ak ) = k P (Ak ). Koment´ aˇ r k definici
1. Uveden´a axiomatick´a definice pravdˇepodobnosti neˇr´ık´a, jak´e budou hodnoty pravdˇepodobnosti jednotliv´ ych jev˚ u, ale pouze vymezuje, jak´e vlastnosti mus´ı m´ıt funkce, aby mohla b´ yt nazv´ana pravdˇepodobnost´ı. N´avod na pˇriˇrazen´ı hodnot pravdˇepodobnost´ı d´avaj´ı definice klasick´a a statistick´a. Ty uvedeme vz´apˇet´ı. 2. Trojice objekt˚ u (Ω, A, P ) se naz´ yv´a pravdˇ epodobnostn´ı prostor a pˇredstavuje u ´pln´ y popis zkouman´eho n´ahodn´eho pokusu. 3. Vˇsimnˇete si, ˇze popisem n´ahodn´eho pokusu nen´ı urˇcen´ı spr´avn´eho v´ ysledku (jako tˇreba pˇri ˇreˇsen´ı line´arn´ı rovnice), ale pouze vyjmenov´an´ı vˇsech moˇzn´ ych v´ ysledk˚ u a pˇriˇrazen´ı pravdˇepodobnost´ı, se kterou jednotliv´e v´ ysledky (nebo jejich intervaly) nastanou. ˇ ´ı k l a d: Uvaˇzujme pokus: hod nepoˇskozenou minc´ı. Potom bude Pr Ω = {R, L},
A = {∅, {L}, {R}, {R, L}}
a pravdˇepodobnost P , kter´a je definov´ana na mnoˇzinˇe A urˇc´ıme tak, ˇze pˇriˇrad´ıme pravdˇepodobnosti jednotliv´ym prvk˚ um Ω (element´arn´ım jev˚ um, bezprostˇredn´ım v´ysledk˚ um). Vyuˇzijeme skuteˇcnosti, ˇze jsou nedˇeliteln´e (tj. nemaj´ı nic spoleˇcn´eho a tedy jsou disjunktn´ı) a podle 3. axiomu bude pravdˇepodobnost kaˇzd´eho jevu d´ana souˇctem pravdˇepodobnost´ı jeho element´arn´ıch jev˚ u, kter´e obsahuje. Tedy, je-li J ∈ A jev, pak
6
J P (J)
∅ 0
{R} 0.5
{L} 0.5
{R, L} 1
D e f i n i c e 1.2 (Klasick´ a pravdˇ epodobnost) Za pˇredpokladu, ˇze 1. n´ahodn´ y pokus m´a koneˇcn´ y poˇcet bezprostˇredn´ıch v´ ysledk˚ u, 2. kaˇzd´ y bezprostˇredn´ı v´ ysledek je stejnˇe pravdˇepodobn´ y, je pravdˇepodobnost P jevu J d´ana vzorcem P =
m , n
(1)
kde m je poˇcet moˇzn´ ych bezprostˇredn´ıch v´ ysledk˚ u, pˇri kter´ ych nastane jev J a n je poˇcet vˇsech bezprostˇredn´ıch v´ ysledk˚ u. Koment´ aˇ r k definici
1. Klasick´a definice prov´ad´ı v´ ypoˇcet hodnot pravdˇepodobnosti jednotliv´ ych jev˚ u, a to na z´akladˇe teoretick´eho rozboru pokusu. Urˇcen´e pravdˇepodobnosti jsou ”pˇresn´e” v tom smyslu, ˇze pokaˇzd´e, kdyˇz tuto pravdˇepodobnost poˇc´ıt´ame, dostaneme stejn´ y v´ ysledek. Nev´ yhodou t´eto definice je, ˇze pˇri sloˇzitˇejˇs´ım pokusu je teoretick´ y rozbor pˇr´ıliˇs sloˇzit´ y. ˇ ´ı k l a d: Pr
Urˇcete pravdˇepodobnost jevu ”padne sud´e ˇc´ıslo” pˇri jednom hodu nepoˇskozenou
kostkou. Jev ”padne sud´e ˇc´ıslo” je reprezentov´an mnoˇzinou {2, 4, 6}. Jsou tedy tˇri moˇznosti, jak tento jev nastane, a tedy m = 3. Celkov´y poˇcet bezprostˇredn´ıch v´ysledk˚ u je n = 6 (ˇsest moˇzn´ych ˇc´ısel pˇri hodu kostkou). Proto je P = m/n = 3/6 = 1/2.
D e f i n i c e 1.3 (Statistick´ a pravdˇ epodobnost) Jestliˇze provedeme N pokus˚ u a jev J pˇri nich nastane M kr´at, definujeme pravdˇepodobnost P jevu J takto M P = . (2) N Koment´ aˇ r k definici
1. Statistick´a definice se pˇri v´ ypoˇctu pravdˇepodobnosti op´ır´a o experimenty. Proto je jednoduch´a, coˇz je jej´ı velik´a v´ yhoda. V´ ysledek, kter´ y dostaneme ale nen´ı ”´ uplnˇe pˇresn´ y”. Provedeme-li dvˇe stejn´e s´erie pokus˚ u, dostaneme pokaˇzd´e jinou hodnotu pravdˇepodobnosti a ta se jeˇstˇe bude liˇsit od klasick´e. Statistick´e z´akony ale zaruˇcuj´ı, ˇze statistick´a a klasick´a hodnota pravdˇepodobnosti leˇz´ı ”bl´ızko” sebe. 7
Uvaˇzujme stejn´y pokus jako pro klasickou definici, tj. hod kostkou, a sledujme pravdˇepodobnost jevu ”padne sud´e ˇc´ıslo”.
ˇ ´ı k l a d: Pr
V tomto pˇr´ıpadˇe ale neanalyzujeme moˇznosti, jak m˚ uˇze padnout sud´e ˇc´ıslo, ale prostˇe h´az´ıme. Provedeme napˇr. N = 100 hod˚ u a jestliˇze pˇri nich padlo napˇr. N 1 = 52 kr´at sud´e ˇc´ıslo, pak ˇrekneme, ˇze statistick´a pravdˇepodobnost padnut´ı sud´eho ˇc´ısla je P = 52/100 = 0.52.
´ m k a: Pozna 1. Vztah mezi klasickou a statistickou pravdˇepodobnost´ı je formulov´ an v z´ akonu velk´ych ˇc´ısel. Ten ˇr´ık´ a, ˇze pˇri velk´em poˇctu experiment˚ u se obˇe pravdˇepodobnosti bl´ıˇz´ı. Pˇresnˇeji bude na konci semestru. 2. Podstata obou definic pravdˇepodobnosti se velmi zˇretelnˇe objev´ı ve statistice. Bude se odr´ aˇzet v pojmech soubor a v´ ybˇ er .
1.3
Pˇ r´ıklady
ˇ ´ı k l a d 1: Uvaˇzujme pokus postupn´eho losov´an´ı dvou kor´alk˚ Pr u z krabice, kde je 5 b´ıl´ych a 3 modr´e kor´alky. Losov´an´ı prov´ad´ıme s vr´acen´ım prvn´ıho vylosovan´eho kor´alku. Chceme urˇcit pravdˇepodobnost, ˇze oba vybran´e kor´alky budou b´ıl´e. ♦ Oznaˇc´ıme b b´ıl´y a m modr´y kor´alek. Potom Ω = {[b, b], [b, m], [m, b], [m, m]} A = {∅, {[b, b]}, {[b, m]}, {[m, b]}, {[m, m]}, {[b, b], [b, m]}, {[b, b], [m, b]}, {[b, b], [m, m]}, {[b, m], [m, b]}, {[b, m], [m, m]}, {[m, b], [m, m]}, {[b, b], [b, m], [m, b]}, {[b, b], [b, m], [m, m]}, {[b, b], [m, b], [m, m]}, {[b, m], [m, b], [m, m]}, {[b, b], [b, m], [m, b], [m, m]}} Pravdˇepodobnosti jednotliv´ych jev˚ u urˇc´ıme takto: Pˇri prvn´ım tahu je 5 pˇr´ızniv´ych pro b´ıl´y a 3 pˇr´ızniv´e pro modr´y, celkem je 5 + 3 = 8 moˇznost´ı, Bude tedy P (b) = 5/8 a P (m) = 3/8. Protoˇze po prvn´ım tahu kor´alek vr´at´ıme, je pˇri druh´em tahu situace zcela stejn´a, a tedy i pravdˇepodobnosti jsou stejn´e. Pouˇzit´ım pravidla souˇcinu dost´av´ame: pravdˇepodobnost b´ıl´y a b´ıl´y je P ([b, b]) = P (b)P (b) =
55 25 = . 88 64
Podobnˇe bychom urˇcili i pravdˇepodobnosti ostatn´ıch element´arn´ıch jev˚ u, tj. jednotliv´ych uspoˇr´adan´ych dvojic. Pravdˇepodobnosti dalˇs´ıch jev˚ u (tj. skupin element´arn´ıch jev˚ u) dostaneme seˇcten´ım pravdˇepodobnost´ı vˇsech element´arn´ıch jev˚ u, kter´e sledovan´y jev obsahuje. Tedy napˇr. pravdˇepodobnost jevu ”prvn´ı b´ıl´y” (kter´y obsahuje element´arn´ı jevy [b, b] a [b, m] bude P ({[b, b], [b, m]}) =
55 53 5 + = . 88 88 8
Pozn´amka: Tuto pravdˇepodobnost lze tak´e spoˇc´ıtat jako ”prvn´ı b´ıl´y” a ”druh´y cokoliv”, tj 58 ·1.
8
ˇ ´ı k l a d 2: Pr
Uvaˇzujme nyn´ı stejnou situaci jako v pˇredchoz´ım pˇr´ıkladˇe, ale s t´ım rozd´ılem, ˇze prvn´ı vytaˇzen´y kor´alek nevr´at´ıme. ♦
V tomto pˇr´ıpadˇe se bude situace v prvn´ım a druh´em tahu liˇsit (jeden kor´alek bude vybr´an a bude v druh´em tahu chybˇet). Taˇzen´ı napˇr. b´ıl´eho v prvn´ım tahu m˚ uˇzeme oznaˇcit stejnˇe jako minule b (zde jsou situace shodn´e). Taˇzen´ı b´ıl´eho v druh´em tahu mus´ıme ale oznaˇcit b|b, nebo b|m, protoˇze chyb´ı bud’ b´ıl´y, nebo modr´y kor´alek (ˇcteme: b´ıl´y, za podm´ınky, ˇze v prvn´ım tahu byl vybr´an b´ıl´y, atd.). Pravdˇepodobnosti prvn´ıho tahu budou stejn´e, jako v pˇredchoz´ım pˇr´ıkladˇe. Pravdˇepodobnosti druh´eho tahu (tzv. podm´ınˇen´e pravdˇepodobnosti) budou P (b|b) = 47 , P (b|m) = 57 , P (m|b) = 73 a P (m|m) = 37 . Pravdˇepodobnost oba b´ıl´e pak logicky bude: pravdˇepodobnost b´ıl´y v prv´em tahu a (kr´at) pravdˇepodobnost b´ıl´y v druh´em tahu, za podm´ınky b´ıl´eho v prv´em tahu, tj. P ([b, b]) = P (b)P (b|b) =
54 5 = . 87 14
Pravdˇepodobnost ”prvn´ı b´ıl´y” bychom dostali takto P ({[b, b], [b, m]}) = P (b)P (b|b) + P (b)P (m|b) =
5 54 53 + = . 87 87 8
ˇ ´ı k l a d 3: Sledujeme dobu ˇcek´an´ı na tramvaj, kter´a jezd´ı pˇresnˇe v pˇetiminutov´em intervalu, za Pr pˇredpokladu, ˇze naˇse pˇr´ıchody na zast´avku jsou zcela n´ahodn´e.
♦
V naˇsem pokuse, kter´y spoˇc´ıv´a v mˇeˇren´ı doby, kter´a uplyne od naˇseho pˇr´ıchodu do pˇr´ıjezdu tramvaje, jsou dvˇe krajn´ı situace: ”ˇcek´ame 0 minut”, kdyˇz tramvaj pr´avˇe pˇrijela a ”ˇcek´ame 5 minut”, kdyˇz tramvaj pr´avˇe ujela. Ostatn´ı doby ˇcek´an´ı mus´ı leˇzet nˇekde mezi tˇemito dvˇema mezemi. Je tedy Ω = h0, 5i. A je mnoˇzina vˇsech podmnoˇzin Ω. Jsou to jevy typu: ”budeme ˇcekat m´enˇe neˇz a”, ”budeme ˇcekat v´ıce neˇz b”, ”budeme ˇcekat m´enˇe neˇz c nebo v´ıce neˇz d” a pod. Obecnˇe jsou to tedy vˇsechny uzavˇren´e i otevˇren´e podintervaly intervalu h0, 5i, jejich sjednocen´ı a pr˚ uniky. Protoˇze naˇse pˇr´ıchody na zast´avku jsou zcela n´ahodn´e, budou ”vˇsechny moˇzn´e doby ˇcek´an´ı stejnˇe pravdˇepodobn´e”. Proto pravdˇepodobnost jevu reprezentovan´eho intervalem (nebo sjednocen´ım interval˚ u) d´ana jeho relativn´ı d´elkou, tj, jeho d´elkou (nebo souˇctem d´elek) dˇelenou maxim´aln´ı d´elkou intervalu, coˇz je 5. Tedy pravdˇepodobnost, ˇze budeme ˇcekat maxim´alnˇe jednu minutu, je P (h0, 1i) = 51 = 0.2. Posledn´ı uveden´y pˇr´ıklad se t´yk´ a ”spojit´eho pokusu”, kdy z´ akladn´ı prostor je mnoˇzina nespoˇcetn´ a. Vˇsimnˇeme si, pravdˇepodobnost kaˇzd´eho jedin´eho bezprostˇren´ıho v´ysledku je nula. Jestliˇze je nespoˇcetnˇe mnoho moˇzn´ych v´ysledk˚ u, pak skuteˇcnˇe pravdˇepodobnost, ˇze nastane pr´ avˇe jeden z nich je nulov´ a. Prakticky m´ a tedy smysl mluvit ne o pravdˇepodobnosti bodu, ale pouze o pravdˇepodobnosti intervalu.
´ m k a: Pozna
9
2
Pˇ r´ıklady na pravdˇ epodobnost
2.1
Poˇ c´ıt´ an´ı s jevy
Jevy ch´apeme jako mnoˇziny, kter´e jsou vˇsechny podmnoˇzinou z´akladn´ı mnoˇziny - z´akladn´ıho prostoru. Pokud reprezentaci z´akladn´ıho prostoru vyj´adˇr´ıme jako mnoˇzinu s jednotkovou plochou, lze plochy jednotliv´ ych jev˚ u interpretovat jako jejich pravdˇepodobnosti: (i) plocha je nez´aporn´a, (ii) podmnoˇzina jednotkov´e mnoˇziny m´a plochu menˇs´ı nebo rovnu jedn´e, (iii) plocha sjednocen´ı dvou disjunktn´ıch mnoˇzin je rovna souˇctu ploch jednotliv´ ych mnoˇzin. Z tohoto hlediska zav´ad´ıme: Jev opaˇ cn´ y ˇ Rekneme, ˇze jev J 0 je opaˇcn´ y k jevu J, jestliˇze plat´ı J 0 = Ω − J (je doplˇ nkem v z´akladn´ım prostoru Ω. Plat´ı:
P (J 0 ) = 1 − P (J). O v ˇe ˇr e n´ı: 1 = P (Ω) = P (J ∪ J 0 )
= P (J) + P (J 0 ). |{z} nesluˇciteln´e
Pr˚ unik dvou jev˚ u Jev K nazveme pr˚ unikem jev˚ u J1 a J2 , jestliˇze obsahuje pr´avˇe ty element´arn´ı jevy, kter´e jsou spoleˇcn´e jev˚ um J1 a J2 . Z mnoˇzinov´eho hlediska jde skuteˇcnˇe o pr˚ unik mnoˇzin J1 a J2 . Znaˇ c´ıme: K = J1 ∩ J2 .
Sjednocen´ı dvou jev˚ u Jev K nazveme pr˚ unikem jev˚ u J1 a J2 , jestliˇze plat´ı K = J1 ∪ J2 , tj. je sjednocen´ım jev˚ u J1 a J2 . Plat´ı:
P (J1 ∪ J2 ) = P (J1 ) + P (J2 ) − P (J1 ∩ J2 ) O v ˇe ˇr e n´ı: J1 ∪ J2 = (J1 − J2 ) + J1 ∩ J2 + (J2 − J1 ) a tyto mnoˇziny jsou disjunktn´ı. Odtud P (J1 ∪ J2 ) = P (J1 − J1 ) + P (J1 ∩ J2 ) + P (J2 − J1 ). Ale J1 = (J1 − J2 ) ∪ (J1 ∩ J2 ) pˇriˇcemˇz obˇe mnoˇziny jsou disjunktn´ı. Proto P (J1 ) = P (J1 − J2 ) + P (J1 ∩ J2 ) a tot´eˇz plat´ı pro J2 . To dosazeno v´yˇse d´av´a poˇzadovan´y vztah.
10
Podm´ınˇ en´ y jev Jev J1 |J2 , kter´ y vyjadˇruje jev J1 za podm´ınky, ˇze zn´ame v´ ysledek jevu J2 nazveme jevem podm´ınˇen´ ym (jev J1 za podm´ınky znalosti jevu J2 ). Uvaˇzujme pokus hod kostkou a jev J1 = [2, 4, 6] a J2 = [4, 5, 6]. Jev J1 |J2 je [4, 6] vyb´ır´ame z p˚ uvodn´ıch sud´ych, ale nyn´ı v´ıme (napˇr. n´am nˇekdo prozradil), ˇze m˚ uˇze padnout jen vˇetˇs´ı neˇz 3.
ˇ ´ı k l a d: Pr
Pokraˇcujme jeˇstˇe d´ale. S touto znalost´ı chceme nyn´ı urˇcit pravdˇepodobnost podm´ınˇen´eho jevu. Zjistili jsme, ˇze pˇr´ızniv´e element´arn´ı jevy jsou [4, 6], jak´e budou vˇsechny moˇzn´e (mus´ı b´yt vˇetˇs´ı neˇz 3). Jsou to [4, 5, 6], tedy vˇsechny z podm´ınky, tj. vˇsechny nyn´ı pˇr´ıpustn´e.
To je motivac´ı pro definici pravdˇepodobnosti podm´ınˇen´eho jevu: P (J1 |J2 ) =
P (J1 ∩ J2 ) P (J2 )
(Srovnat s pˇredchoz´ım pˇr´ıkladem!)
Nesluˇ citelnost jev˚ u Tento pojem jsme jiˇz zavedli a nyn´ı pouze pˇripom´ın´ame. Jevy J1 a J2 jsou nesluˇciteln´e, jestliˇze plat´ı J1 ∩ J2 = ∅. Plat´ı: P (J1 ∩ J2 ) = 0. Pozor: rozliˇsovat 0 je nula a ∅ je pr´azdn´a mnoˇzina. Jevy jsou mnoˇziny a jejich pravdˇepodobnosti ˇc´ısla!!!
Nez´ avislost jev˚ u Tento pojem je nov´ y a je definov´an pomoc´ı podm´ınˇen´e pravdˇepodobnosti takto: Jevy J1 a J2 jsou nez´avisl´e, jestliˇze plat´ı P (J1 |J2 ) = P (J1 ) - tedy jestliˇze informace o jevu J1 se s prozrazen´ım v´ ysledku jevu J2 nezmˇen´ı. Dosad´ıme-li uvedenou podm´ınku do definice podm´ınˇen´e pravdˇepodobnosti, dostaneme podm´ınku nez´avislosti ve tvaru P (J1 ∩ J2 ) = P (J1 )P (J2 ) (Zkusit.) ´ m k a: Pozna tvar
Pro nez´ avisl´e, resp., nesluˇciteln´e jevy m´ a pravdˇepodobnost sjednocen´ı speci´ aln´ı P (J1 ∪ J2 ) = P (J1 ) + P (J2 ) − P (J1 )P (J2 ) = P (J1 ) + P (J2 ) . |
{z nez´ avisl´e
}
|
Posledn´ı v´yraz nen´ı nic jin´eho neˇz tˇret´ı axiom pravdˇepodobnosti.
11
{z } nesluˇciteln´e
2.2
Opakovan´ e pokusy
ˇ Casto sledujeme celou s´erii pokus˚ u a zaj´ım´ame se o pravdˇepodobnosti v´ ysledku cel´e takov´ı s´erie. ˙ Napˇr. vyb´ır´ame v´ yrobky ze skladu a v´ıme, ˇze mezi nimi je p100% vadn´ ych. Zaj´ım´a n´as, s jakou pravdˇepodobnost´ı bude v 10 vybran´ ych pr´avˇe 8 dobr´ ych. Pokud jsou jednotliv´e pokusy navz´ ajem nez´avisl´e, hovoˇr´ıme o nez´ avisl´ ych pokusech a situace je pomˇernˇe jednoduch´a - budeme o n´ı hovoˇrit d´ale v souvislosti s binomick´ ym rozdˇelen´ım. Pokud jsou ale pokusy z´avisl´e, tj. pravdˇepodobnosti v´ ysledk˚ u v dalˇs´ıch pokusech z´avis´ı na v´ ysledc´ıch pˇredchoz´ıch pokus˚ u, mluv´ıme o z´ avisl´ ych pokusech a situace je podstatnˇe komplikovanˇejˇs´ı. Dobr´ ym pomocn´ıkem pro v´ ypoˇcet m˚ uˇze b´ yt tzv. pravdˇepodobnostn´ı strom.
2.3
Pravdˇ epodobnostn´ı strom
V pˇr´ıpadˇe, kdy opakovan´e pokusy jsou z´avisl´e, je situace sloˇzit´a, protoˇze pravdˇepodobnosti v kaˇzd´em dalˇs´ım pokusu z´avis´ı na v´ ysledc´ıch pˇredchoz´ıch pokus˚ u (viz b´ıl´e a modr´e kor´alky, dobr´e a vadn´e v´ yrobky). Pravdˇepodobnost jednoho konkr´etn´ıho stavu v´ ysledk˚ u Vi pokus˚ u je d´ana obecn´ ym rozvojem sdruˇzen´e pravdˇepodobnosti podle (??) ve tvaru P (V1 , V2 , . . . , Vn ) = P (V1 )P (V2 |V1 ) . . . P (Vn |V1 , V2 , . . . , Vn−1 ). Je tedy tˇreba zn´at vˇsechny podm´ınˇen´e pravdˇepodobnosti. Pˇri ˇreˇsen´ı takov´e u ´lohy lze s v´ yhodou pouˇz´ıt pravdˇ epodobnostn´ı strom. Vysvˇetl´ıme jej a jeho pouˇzit´ı budeme demonstrovat na pˇr´ıkladˇe. ˇ ´ı k l a d: V klobouku jsou 3 b´ıl´e (b) a 5 modr´ych (m) kor´al˚ Pr u. Postupnˇe, bez vracen´ı, vylosujeme 2 kor´alky. Jak´a je pravdˇepodobnost, ˇze druh´y kor´alek bude modr´y? ♦ ´ Ulohu budeme ˇreˇsit pomoc´ı stromu '$
P (b) =
3 8
'$
b
P (b|b) = 27 1b5m P (b, b) = 83 · 27 = '$ &% 2b5m H '$ HH &%HH 5 H 3 5 P (m|b) =
7
2b4m
3 28
P (b, m) = 8 · 7 =
15 56
&%
3b5m
'$ @ @ m &% @ P (b|m) = 3 P (m, b) = 85 · 37 = 15 56 '$7 2b4m 5 @ P (m) = 8 &% @ @ 3b4m HH '$ H &%HH P (m, m) = 58 · 47 = 10 P (m|m) = 74 H 3b3m 28 &%
ˇ ara nahoru znamen´a V tomto grafu krouˇzky znamenaj´ı jednotliv´e stavy, ˇc´ary jsou pˇrechody mezi stavy. C´ taˇzen´ı b´ıl´eho kor´alku, dol˚ u ˇcern´eho. U kaˇzd´e ˇc´ary je zaps´ana pravdˇepodobnost tohoto pˇrechodu. Je
12
to klasick´a pravdˇepodobnost, kter´a se op´ır´a vˇzdy o pˇredchoz´ı stav. V´yznam koncov´ych stav˚ u je d´an cestou, kterou jsme do nich dospˇeli (napˇr. horn´ı koncov´y stav je b,b) a jejich pravdˇepodobnosti jsou d´any souˇcinem podm´ınˇen´ych pravdˇepodobnost´ı pod´el pˇr´ısluˇsn´e cesty (napˇr. pro horn´ı koncov´y stav je to (3/8).(2/7) = 3/28). Moˇznosti, kter´e n´as v naˇsem pˇr´ıkladˇe zaj´ımaj´ı jsou or´amovan´e. Celkov´a pravdˇepodobnost je souˇctem 15 5 P (druh´y modr´y) = 56 + 10 28 = 8 .
2.4
´ Upln´ a pravdˇ epodobnost a Bayes˚ uv vzorec
Uvaˇzujeme jev (A) jehoˇz pravdˇepodobnost sledujeme a okolnosti (B1 , B2 , . . . , Bn ), za kter´ ych tento jev nast´av´a. Pro pˇrehlednost uvedeme vzorce pro n = 3. ´ ´ pravde ˇpodobnost urˇcuje pravdˇepodobnost jevu pˇri vˇsech moˇzn´ Upln a ych okolnostech. (Poˇc´ıt´ame pˇred proveden´ım pokusu.) P (A) = P (A|B1 )P (B1 ) + P (A|B2 )P (B2 ) + P (A|B3 )P (B3 )
(3)
Bayes˚ uv vzorec urˇcuje pravdˇepodobnost okolnosti, kdyˇz v´ıme, jak´ y v´ ysledek pokusu nastal. (Poˇc´ıt´ame po proveden´ı pokusu.)
P (Bi |A) =
P (A|Bi )P (Bi ) P (A|B1 )P (B1 ) + P (A|B2 )P (B2 ) + P (A|B3 )P (B3 )
(4)
Obˇe u ´lohy budeme demonstrovat na pˇr´ıkladˇe. ˇ ´ı k l a d: Na skladˇe je 70% pˇr´ıstroj˚ Pr u 1. jakosti a 30% 2. jakosti. Pravdˇepodobnost, ˇze pˇr´ıstroj 1. jakosti pracuje bez poruchy je 0.95, 2. jakosti 0.6. a) Jak´a je pravdˇepodobnost, ˇze n´ahodnˇe vybran´y pˇr´ıstroj bude bez poruchy? b) Vybereme jeden pˇr´ıstroj a zjist´ıme, ˇze je bez poruchy. Jak´a je pravdˇepodobnost, ˇze je to pˇr´ıstroj 1. jakosti? ♦ Oznaˇc´ıme: I – 1. jakost, II – 2. jakost, B – bezporuchov´y v´yrobek. Zad´ano: P (I) = 0.7, P (II) = 0.3, P (B|I) = 0.95, P (B|II) = 0.6. ´ a pravdˇepodobnost a) Upln´ P (B) = P (B|I)P (I) + P (B|II)P (II) = 0.95·0.7 + 0.6·0.3 = 0.845 b) Bayes˚ uv vzorec P (I|B) =
P (B|I)P (I) 0.95·0.7 = = 0.787 P (B|I)P (I) + P (B|II)P (II) 0.95·0.7 + 0.6·0.3
13
3
N´ ahodn´ a veliˇ cina a jej´ı popis
Pˇri definici pravdˇepodobnostn´ıho prostoru jsme pˇriˇrazovali pravdˇepodobnosti v´ ysledk˚ um n´ahodn´eho pokusu (element´arn´ım jev˚ um) a jejich skupin´am (n´ahodn´ ym jev˚ um). Vymezen´ı vˇsech moˇzn´ ych skupin v´ ysledk˚ u (jevov´e pole) a pˇriˇrazen´ı pravdˇepodobnost´ı tˇemto skupin´am pˇredstavuje u ´pln´ y popis sledovan´eho procesu. Takov´ yu ´pln´ y popis jsme ale schopni prov´est jen v nejjednoduˇsˇs´ıch pˇr´ıpadech, jako je napˇr. hod kostkou. Vˇetˇsinou, a to zejm´ena v re´aln´ ych procesech, nen´ı takov´ y u ´pln´ y popis moˇzn´ y - napˇr. kdyˇz sledujeme intenzitu provozu v dan´em m´ıstˇe komunikace. Uvaˇzov´ an´ı fyzik´aln´ı podstaty tohoto pokusu by znamenalo sledovat u ´mysly vˇsech ˇridiˇc˚ u, technick´ y stav jejich vozidla, pravdˇepodobnost, zda v˚ ubec do dan´eho m´ısta dojedou atd. Je zˇrejm´e, ˇze v takov´em pˇr´ıpadˇe lze bud’ pouze pˇredpokl´adat urˇcit´e standardn´ı ”rozdˇelen´ı” pravdˇepodobnost´ı nebo se uch´ ylit k ’ nˇejak´emu jednoduˇsˇs´ımu, byt i ne´ upln´emu, popisu takov´eho procesu. Jedna z moˇznost´ı, jak takov´ y jednoduˇsˇs´ı popis prov´est, je uvaˇzovat urˇcitou ˇc´ıselnou charakteristiku - napˇr. pr˚ umˇernou hodnotu (kter´a urˇcuje hladinu, na kter´e se data pohybuj´ı) nebo rozptyl (kter´ y ud´av´a, jak se v pr˚ umˇeru data navz´ajem liˇs´ı). To je ale moˇzn´e jen tehdy, jsou-li v´ ysledky n´ahodn´eho pokusu (data mˇeˇren´a na procesu) ˇc´ısla. Jinak je tento popis nemoˇzn´ y. Napˇr. na minci padne ”rub” nebo ”l´ıc”, oboj´ı s pravdˇepodobnost´ı 0,5. Co padne v pr˚ umˇeru? A pˇrece, pomoc je velmi jednoduch´ a. Staˇc´ı napˇr. pˇrejmenovat ”rub” na 0 a ”l´ıc” na 1. Nic z podstaty pokusu se neztratilo a pr˚ umˇer je 0,5. Ten vyjadˇruje pˇresnˇe to, co jsme chtˇeli. Jde o ”f´erovou korunu”. To, co jsme pr´avˇe popsali, zajiˇst’uje n´ ahodn´ a veliˇ cina - v´ ysledk˚ um pokusu pˇriˇrazuje re´aln´a ˇc´ısla. M´ısto s v´ ysledky pokusu, kter´e mohou m´ıt libovolnou povahu (napˇr. zelen´a, oranˇzov´a, ˇcerven´ a), pracujeme s hodnotami n´ahodn´e veliˇciny, tedy s ˇc´ısly, kter´a reprezentuj´ı p˚ uvodn´ı v´ ysledky. D´ale uvedeme definici n´ ahodn´ e veliˇ ciny (nv) a definice funkc´ı, kter´e pˇredstavuj´ı u ´pln´ y popis pro nv. V dalˇs´ı kapitole se budeme zab´ yvat charakteristikami nv, kter´e pˇredstavuj´ı ne´ upln´ y (avˇsak velmi jednoduch´ y) popis nv.
3.1
N´ ahodn´ a veliˇ cina
D e f i n i c e 3.1 (N´ ahodn´ a veliˇ cina) Uvaˇzujme pravdˇepodobnostn´ı prostor (Ω, A, P ). N´ahodn´a veliˇcina X je zobrazen´ı prostoru element´arn´ıch jev˚ u Ω do mnoˇziny re´aln´ ych ˇc´ısel X : Ω → R, kter´e splˇ nuje podm´ınku {E ∈ Ω : X(E) < x} ∈ A pro vˇsechna x ∈ R
(5)
Koment´ aˇ r k definici 1. Pokud je mnoˇzina v´ ysledk˚ u, a tedy i mnoˇzina hodnot nv, koneˇcn´a nebo spoˇcetn´a, hovoˇr´ıme o diskr´ etn´ı nv . V pˇr´ıpadˇe nespoˇcetnˇe nekoneˇcn´eho mnoˇzstv´ı hodnot se nv veliˇcina naz´ yv´ a spojit´ a nv . Pˇr´ıkladem diskr´etn´ı nv je hod minc´ı, kostkou, losov´an´ı kor´alk˚ u apod. Spojit´ a nv je spojena napˇr. s pokusem doba ˇcek´an´ı na tramvaj, bezporuchov´a doba funkce pˇr´ıstroje apod. 2. Na uveden´e definici je podstatn´e, ˇze n´ahodn´a veliˇcina je zobrazen´ı, a tedy, jak jsme v u ´vodu ˇrekli, pˇriˇrazuje v´ ysledk˚ um pokusu (element´arn´ım jev˚ um) re´aln´a ˇc´ısla. Zm´ınˇen´a podm´ınka je dosti voln´a (v naˇsich pˇr´ıkladech bude vˇzdy splnˇena). Jej´ı splnˇen´ı zaruˇcuje existenci u ´pln´eho popisu nv pomoc´ı distribuˇcn´ı funkce.
14
3. Pokud jsou v´ ysledky pokusu ˇc´ısla, lze je pˇr´ımo ponechat jako hodnoty nv. V opaˇcn´em pˇr´ıpadˇe je moˇzno ˇc´ısla v´ ysledk˚ um pˇriˇradit prakticky libovolnˇe. 4. Splnˇen´ı podm´ınky budeme ilustrovat v n´asleduj´ıc´ım pˇr´ıkladˇe. ˇ ´ı k l a d: Uvaˇzujme n´ahodn´y pokus ”hod nepoˇskozenou minc´ı” se stranami ”rub” (R) a ”l´ıc” (L), Pr pro kter´y plat´ı Z´akladn´ı prostor Jevov´e pole Pravdˇepodobnost
Ω = {R, L} A = {∅, {R}, {L}, {R, L}} P (∅) = 0, P ({R}) = P ({L}) = 1/2, P ({R, L}) = 1
Definujme n´ahodnou veliˇcinu takto X(R) = 0 a X(L) = 1 a ovˇeˇrme, zda je splnˇena podm´ınka z definice nv. Ovˇeˇren´ı zaˇcneme ”odzadu”, kde se ˇr´ık´a ... pro vˇsechna x ∈ R. 1) Re´alnou osu budeme proch´azet ve tˇrech intervalech: I1 : x ∈ (−∞, 0i, I2 : x ∈ (0, 1i a I3 : x ∈ (1, ∞), kde za hranice interval˚ u jsou schv´alnˇe voleny hodnoty nv. 2) D´ale pro jednotliv´e intervaly oznaˇc´ıme mnoˇziny Mi = {E ∈ Ω : X(E) < x} pro x ∈ Ii , i = 1, 2, 3. Bude M1 = ∅, M2 = {R} a M3 = {R, L} - nakreslete a rozmyslete. 3) Porovn´an´ım s jevov´ym polem A tohoto pˇr´ıkladu zjist´ıme, ˇze skuteˇcnˇe plat´ı Mi ∈ A pro vˇsechna i = 1, 2, 3 a tedy pro libovoln´e x ∈ R. T´ım je platnost podm´ınky dok´az´ana. ´ m k a: Je zˇrejm´e, ˇze podm´ınka bude splnˇena pro libovolnou volbu hodnot nv; bude splnˇena Pozna dokonce i pro nesmyslnou volbu X(R) = X(L) ∈ R. Podm´ınka skuteˇcnˇe ”hl´ıd´ a” jen existenci distribuˇcn´ı funkce (bude d´ ale), nikoliv smysluplnost volby. ´ m k a: Chceme-li n´ Pozna ahodnou veliˇcinu zaˇradit do kontextu jevov´e pravdˇepodobnosti, m˚ uˇzeme ji povaˇzovat za ekvivalent n´ ahodn´eho pokusu. Pokus d´ av´ a v´ysledky, nv d´ av´ a ˇc´ısla, kter´ a oznaˇcuj´ı v´ysledky. Nv je tedy jen jak´ysi ”pseudonym” pro n´ ahodn´y pokus. Pod t´ımto pseudonymem se n´ am pak s v´ysledky – ˇc´ısly l´epe pracuje.
3.2
Distribuˇ cn´ı funkce
Stejnˇe jako jsme se v pˇr´ıpadˇe n´ahodn´eho pokusu zaj´ımali o jeho u ´pln´ y popis, budeme se o nˇeho zaj´ımat i v pˇr´ıpadˇe nv. Je j´ım distribuˇ cn´ı funkce a hustota pravdˇ epodobnosti . D e f i n i c e 3.2 (Distribuˇ cn´ı funkce) Pro nv X definujeme distribuˇcn´ı funkce F (x) vztahem FX (x) = P (X < x), Koment´ aˇ r k definici
15
kde x ∈ R
(6)
1. Distribuˇcn´ı funkce je funkc´ı re´aln´e promˇenn´e x ∈ R. Index X oznaˇcuje n´ahodnou veliˇcinu, ˇ kterou distribuˇcn´ı funkce popisuje. Casto se tento index vynech´av´a a n´ahodn´a veliˇcina je oznaˇcena p´ısmenem, kter´e zvol´ıme za argument funkce. 2. Distribuˇcn´ı funkce pˇriˇrazuje pravdˇepodobnosti vˇsem interval˚ um typu (−∞, x) pro re´ aln´ a x. Pˇripomeˇ nme, ˇze v pravdˇepodobnostn´ım prostoru tomu bylo obdobnˇe. Jevov´e pole obsahovalo vˇsechny mnoˇziny element´arn´ıch jev˚ u (v´ ysledk˚ u) a funkce P (pravdˇepodobnost) jim pˇriˇrazovala jejich pravdˇepodobnosti. Tady jsou element´arn´ımi jevy (v´ ysledky) vˇsechna re´ aln´ a ˇc´ısla a jako jejich mnoˇziny vol´ıme pr´avˇe vˇsechny intervaly (−∞, x), x ∈ R. 3. Definice distribuˇcn´ı funkce je spoleˇcn´a pro diskr´etn´ı i spojitou nv. Jejich pr˚ ubˇehy se ale typicky liˇs´ı. Uk´aˇzeme si je v n´asleduj´ıc´ıch pˇr´ıkladech. ˇ ´ı k l a d: Nakreslete distribuˇcn´ı funkci n´ahodn´e veliˇciny X pro hod nepoˇskozenou minc´ı s v´ysledky Pr R a L, definovanou v´yˇctem X(R) = 0 a X(L) = 1. T´ımto pokusem jsme se jiˇz zab´yvali v pˇredchoz´ım pˇr´ıkladˇe a zjistili jsme, ˇze mnoˇziny v´ysledk˚ u Mi odpov´ıdaj´ıc´ı interval˚ um Ii pro I1 : x ∈ (−∞, 0i, I2 : x ∈ (0, 1i a I3 : x ∈ (1, ∞) jsou M1 = ∅, M2 = {R} a M3 = {R, L}. Bude tedy P (∅) = 0
pro x < 0, P ({R}) = 0, 5 pro x ∈ h0, 1), F (x) = P (X < x) = P ({R, L}) = 1 pro x ≥ 1. Protoˇze mnoˇzina vˇsech hodnot nv je koneˇcn´a (m´a jen dva prvky 0 a 1), jedn´a se o diskr´etn´ı nv. Graf jej´ı distribuˇcn´ı funkce je na obr´azku F (x)
6 u
1
0,5 u
e
e
0
-
1
x
Distribuˇcn´ı funkce diskr´etn´ı n´ahodn´e veliˇciny je po ˇc´astech konstantn´ı funkce. Ke skok˚ um doch´ az´ı jen v jej´ıch hodnot´ach a velikost skok˚ u je rovna pravdˇepodobnostem tˇechto hodnot. ˇ ´ı k l a d: Pr Nakreslete distribuˇcn´ı funkci n´ahodn´e veliˇciny popisuj´ıc´ı dobu ˇcek´an´ı na tramvaj s pˇetiminutov´ym intervalem pˇri n´ahodn´em pˇr´ıchodu na zast´avku.
16
Budeme-li uvaˇzovat zcela n´ahodn´y pˇr´ıchod, bude pravdˇepodobnost pˇr´ıjezdu pˇr´ımo u ´mˇern´a dobˇe ˇcek´an´ı a bude-li 5 minutov´y interval pˇresn´y, bude pravdˇepodobnost pˇr´ıjezdu po 5 minut´ach ˇcek´an´ı rovna jedn´e. Distribuˇcn´ı funkce tedy bude pro x < 0, 0 x/5 pro x ∈ h0, 5), F (x) = 1 pro x ≥ 5. Graf t´eto funkce je na obr´azku F (x)
6
1
! !! ! ! !! ! ! !! ! !
0
-
1
x
Uveden´e pˇr´ıklady poukazuj´ı na nˇekter´e obecn´e vlastnosti distribuˇcn´ıch funkc´ı. T v r z e n´ı 3.1 (Vlastnosti distribuˇ cn´ı funkce) 1. Distribuˇcn´ı funkce je neklesaj´ıc´ı na cel´e re´aln´e ose a 2. plat´ı F (x) → 0 pro x → −∞ a F (x) → 1 pro x → ∞. 3. Distribuˇcn´ı funkce spojit´e nv je spojit´a, distribuˇcn´ı funkce diskr´etn´ı nv m´a koneˇcn´ y (spoˇcetn´ y) poˇcet nespojitost´ı. Ty se nach´azej´ı v hodnot´ach nv.
O v ˇe ˇr e n´ı: Tvrzen´ı plyne pˇr´ımo z definice distribuˇcn´ı funkce a ze skuteˇcnosti, ˇze pravdˇepodobnost je vˇzdy nez´ aporn´ a.
3.3
Hustota pravdˇ epodobnosti
Distribuˇcn´ı funkce je u ´pln´ ym popisem nv. Jej´ı velikou pˇrednost´ı je velmi jednoduch´a definice, kter´ a je spoleˇcn´a jak pro diskr´etn´ı, tak i pro spojitou nv. Jej´ı nev´ yhodou je, ˇze nen´ı pˇr´ıliˇs vhodn´ a pro bˇeˇzn´e pouˇzit´ı. Proto se pro popis nv zav´ad´ı jeˇstˇe jedna funkce - hustota pravdˇ epodobnosti . Ta je z hlediska popisu n´ahodn´e veliˇciny prakticky ekvivalentn´ı s distribuˇcn´ı funkc´ı, je velmi vhodn´ a pro pouˇzit´ı, jej´ı definice je vˇsak trochu komplikovanˇejˇs´ı. V prv´e ˇradˇe, je definov´ana jinak pro diskr´etn´ı a jinak pro spojitou nv. V pˇr´ıpadˇe diskr´etn´ı nv se ˇcasto naz´ yv´a pravdˇ epodobnostn´ı funkce.
17
´tn´ı na ´hodna ´ velic ˇina • • Diskre D e f i n i c e 3.3 (Hustota pravdˇ epodobnosti diskr´ etn´ı nv) Pro n´ahodnou veliˇcinu X definujeme pravdˇ epodobnostn´ı funkci f (x) vztahem fX (x) = P (X = x),
kde x ∈ R
(7)
Koment´ aˇ r k definici 1. Definice pravdˇepodobnostn´ı funkce je velmi jednoduch´a. Jej´ı hodnoty jsou pˇr´ımo pravdˇepodobnosti jev˚ u, oznaˇcen´ ych hodnotami nv. 2. Diskr´etn´ı distribuˇcn´ı funkci dostaneme pomoc´ı pravdˇepodobnostn´ı funkce jako jej´ı kumulativn´ı souˇcet (postupn´e nasˇc´ıt´av´an´ı jej´ıch hodnot). Plat´ı tedy vztah F (x) =
X
f (xi ),
xi <x
kde xi jsou realizace X. ˇ ´ı k l a d: Pro jiˇz uvaˇzovan´y hod nepoˇskozenou minc´ı bude pravdˇepodobnostn´ı funkce f (0) = 0, 5 Pr a f (1) = 0, 5. Jej´ı graf je
f (x)
6
1
0,5 u
u
-
0
1
x
´ na ´hodna ´ velic ˇina • • Spojita Spojit´a n´ahodn´a veliˇcina m´a nespoˇcetnˇe mnoho hodnot. Pokud bychom chtˇeli zav´est jej´ı hustotu analogicky podle spojit´e, dostali bychom funkci identicky nulovou. To ovˇeˇr´ıme n´asleduj´ıc´ı u ´vahou: kdyˇz rozdˇel´ıme jednotku pravdˇepodobnosti mezi nespoˇcetnˇe mnoho realizac´ı nv, bude kaˇzd´ y d´ıl roven nule. Proto plat´ı: pravdˇ epodobnost kaˇ zd´ e jednotliv´ e realizace spojit´ e n´ ahodn´ e veliˇ ciny je rovna nule. Hustotu spojit´e nv proto definujeme takto.
18
D e f i n i c e 3.4 (Hustota pravdˇ epodobnosti spojit´ e nv) Pro n´ahodnou veliˇcinu X definujeme hustotu pravdˇ epodobnosti f (x) pomoc´ı distribuˇcn´ı funkce FX (x) vztahem dFX (x) fX (x) = (8) dx nebo v integr´aln´ım tvaru Z x
FX (x) =
f (τ )dτ. −∞
Koment´ aˇ r k definici 1. Druh´e vyj´adˇren´ı hustoty pravdˇepodobnosti je obecnˇejˇs´ı, protoˇze distribuˇcn´ı funkce nemus´ı b´ yt a ˇcasto neb´ yv´a v kaˇzd´em bodˇe diferencovateln´a. 2. Druh´e, integr´aln´ı, vyj´adˇren´ı hustoty pravdˇepodobnosti je pro n´as v´ yznamnˇejˇs´ı i z hlediska interpretace. Tu ukazuj´ı n´asleduj´ıc´ı vzorce: P (X ∈ (−∞, bi) = F (b) =
Z
b
f (x)dx −∞
P (X ∈ (a, bi) = P (X ≤ b) − P (x ≤ a) =
Z
b
f (x)dx −
−∞
Z
a
Z
b
f (x)dx.
f (x)dx = −∞
a
Plat´ı tedy: pravdˇ epodobnost hodnot z intervalu je rovna integr´ alu z hustoty pravdˇ epodobnosti pˇ res tento interval - tj. ploˇ se pod kˇ rivkou hustoty pravdˇ epodobnosti nad uvaˇ zovan´ ym intervalem. ˇ ´ı k l a d: Pr v´yrazem
Pro uvaˇzovan´y pˇr´ıpad doby ˇcek´an´ı na tramvaj bude hustota pravdˇepodobnosti d´ana (
f (x) =
1/5 pro x ∈ (0, 5), 0 jinde.
s grafem f (x) 6
1
1/5 -
0
1
19
x
4
Rozdˇ elen´ı diskr´ etn´ı n´ ahodn´ e veliˇ ciny
Diskr´ etn´ı n´ ahodn´ a veliˇ cina m´a koneˇcn´ y nebo spoˇcetn´ y poˇcet realizac´ı. Distribuˇ cn´ı funkce je po ˇc´astech konstantn´ı funkce se skoky v realizac´ıch. Pˇr´ır˚ ustky se rovnaj´ı pravdˇepodobnostem realizac´ı. Pravdˇ epodobnostn´ı funkce je diskr´etn´ı s hodnotami v realizac´ıch. Jej´ı hodnoty se rovnaj´ı pravdˇepodobnostem realizac´ı.
4.1
Alternativn´ı rozdˇ elen´ı
Pravdˇ epodobnostn´ı funkce f (x) = π x (1 − π)1−x
´ m k a: Pozna
pro
x = 0, 1.
(9)
To odpov´ıd´ a naˇsim pˇredstav´ am: f (0) = 1 − π a f (1) = π.
Momentov´ a funkce
mX (z) = π ez − π + 1.
O v ˇe ˇr e n´ı: Z definice - mX (z) =
P1
zx x x=0 e π (1
− π)1−x .
Stˇ redn´ı hodnota a rozptyl
E[X] = π,
D[X] = π(1 − π).
O v ˇe ˇr e n´ı: Pˇr´ımo z definice.
V´ yznam N´ahodn´a veliˇcina popisuje pokus s dvˇema v´ ysledky - ”ne´ uspˇech” → 0 a ”´ uspˇech” → 1.
Pˇ r´ıklady Hod minc´ı: ”rub” → 0, ”l´ıc” → 1. V´ ybˇer v´ yrobku ze skladu: ”vadn´ y” → 0, ”dobr´ y” → 1.
20
(10)
4.2
Binomick´ e rozdˇ elen´ı
Pravdˇ epodobnostn´ı funkce !
f (x) =
n x π (1 − π)n−x x
pro
x = 0, 1, . . . , n.
(11)
Momentov´ a funkce mX (z) = (π ez − π + 1)n .
(12)
O v ˇe ˇr e n´ı: mX (z) =
n X x=0
n X n x n z π (1 − π)n−x = (e π )x (1 − π )n−x = (e| z π +{z1 − π})n . |{z} | {z } x x x=0
!
zx
e
!
A
B
A+B
Stˇ redn´ı hodnota a rozptyl
E[X] = nπ,
D[X] = nπ(1 − π).
V´ yznam N´ahodn´a veliˇcina popisuje n kr´at opakovan´ y pokus s alternativn´ım rozdˇelen´ım s parametrem π, kdy jako v´ ysledek s´erie pokus˚ u se bere poˇcet u ´spˇech˚ u opakovan´ ych do prvn´ıho ne´ uspˇechu.
Pˇ r´ıklady N kr´at opakovan´ y hod minc´ı s v´ ysledkem ”poˇcet l´ıc˚ u”. V´ ybˇer n v´ yrobk˚ u ze skladu s v´ ysledkem ”poˇcet vadn´ ych” ve v´ ybˇeru. Poˇcet chlapc˚ u v rodin´ach se tˇremi dˇetmi.
4.3
Poissonovo rozdˇ elen´ı
Pravdˇ epodobnostn´ı funkce f (x) = e−λ
λx , x!
pro
21
x = 0, 1, 2, . . .
(13)
Momentov´ a funkce
O v ˇe ˇr e n´ı: mX (z) =
mX (z) = eλ(e
P
xe
zx λx e−λ x!
= e−λ
P
x
(ez λ)x x!
z −1)
(14)
= e−λ eλe = eλ(e z
z −1)
Stˇ redn´ı hodnota a rozptyl
E[X] = D[X] = λ.
V´ yznam N´ahodn´a veliˇcina popisuje limitn´ı pˇr´ıpad binomick´eho pokusu, ve kter´em plat´ı n → ∞ a π → 0, pˇriˇcemˇz nπ = λ je koneˇcn´e kladn´e ˇc´ıslo.
Pˇ r´ıklady 1. Sledov´an´ı provozu v pˇr´ıpadˇe mal´e intenzity, kdy vozidla proj´ıˇzd´ı osamocenˇe (nikoliv v proudu). Sledujeme v kr´atk´ ych ˇcasov´ ych okamˇzic´ıch (velk´e n) a jen obˇcas nˇeco projede (mal´e π). 2. N´ahodn´ y proces rozdˇelen´ı ˇcasov´ ych odstup˚ u vozidel na hlavn´ı komunikaci.
4.4
Negativn´ı binomick´ e rozdˇ elen´ı
Pravdˇ epodobnostn´ı funkce !
f (x) =
x+n−1 n π (1 − π)x , n−1
pro x = 1, 2, . . .
(15)
Stˇ redn´ı hodnota a rozptyl
E[X] =
n(1 − π) , π
D[X] =
n(1 − π) . π2
V´ yznam Toto rozdˇelen´ı popisuje pravdˇepodobnost, ˇze pˇri nez´avisl´ ych pokusech s pravdˇepodobnost´ı u ´spˇechu π v kaˇzd´em z pokus˚ u bude n-t´emu u ´spˇeˇsn´emu pokusu pˇredch´azet pr´avˇe x ne´ uspˇeˇsn´ ych pokus˚ u. (Jinak ˇreˇceno, pro dosaˇzen´ı n u ´spˇech˚ u s danou pravdˇepodobnost´ı je tˇreba vykonat x + n pokus˚ u.)
22
Pˇ r´ıklady 1. Pouˇz´ıv´a se v dopravn´ı problematice. 2. Modely ˇs´ıˇren´ı infekce (rozdˇelen´ı ˇcetnosti parazit˚ u v r´amci hostitelsk´e populace).
4.5
Diskr´ etn´ı rovnomˇ ern´ e rozdˇ elen´ı
Pravdˇ epodobnostn´ı funkce f (x) =
1 , n
pro x = x1 , x2 , . . . , xn
(16)
Stˇ redn´ı hodnota a rozptyl
E[X] = x,
D[X] = x2 − x2 .
V´ yznam Tato hustota pravdˇepodobnosti popisuje rozdˇelen´ı pravdˇepodobnost´ı mezi koneˇcn´ y poˇcet v´ ysledk˚ u pokusu jestliˇze mezi nimi nejsou ˇz´adn´e preference (vˇsechny jsou stejnˇe pravdˇepodobnostn´e).
Pˇ r´ıklady 1. Hod minc´ı. 2. Hod kostkou.
23
5
Rozdˇ elen´ı spojit´ e n´ ahodn´ e veliˇ ciny
Spojit´ a n´ ahodn´ a veliˇ cina m´a nespoˇcetn´ y poˇcet realizac´ı. Distribuˇ cn´ı funkce je spojit´a, neklesaj´ıc´ı, pro x → −∞ m´a hodnotu nula, pro x → ∞ jedna. Hustota pravdˇ epodobnosti je nez´aporn´a a jej´ı integr´al od −∞ do ∞ je roven 1. Jej´ı integr´ al od a do b (pro a < b) je roven pravdˇepodobnosti v´ yskytu hodnoty n´ahodn´e veliˇciny v intervalu ha, bi.
5.1
Rovnomˇ ern´ e rozdˇ elen´ı
Hustota pravdˇ epodobnosti (
f (x) =
1 2h
pro x ∈ hµ − h, µ + hi,
0
jinde.
(17)
Momentov´ a funkce mX (z) =
O v ˇe ˇr e n´ı: mX (z) =
R µ+h µ−h
1 dx = ezx 2h
1 (µ+h)z e − e(µ−h)z 2hz
1 zx 2hz [e
+ ezx ]µ+h µ−h =
1 2hz
e(µ+h)z − e(µ−h)z .
Stˇ redn´ı hodnota a rozptyl
E[X] = µ,
D[X] =
h2 3
O v ˇe ˇr e n´ı: Stˇredn´ı hodnota: E[X] =
R µ+h µ−h
1 x 2h dx =
Rozptyl: D[X] = E[X 2 ] − (E[X])2 =
1 4h
R µ+h µ−h
=
(µ + h)2 − (µ − h)2 = µ.
1 x2 2h dx − µ2 =
6µ2 h+2h3 6h
− µ2 =
1 6h
(µ + h)3 − (µ − h)3 − µ2 =
h2 3 .
V´ yznam N´ahodn´a veliˇcina s rovnomˇern´ ym rozdˇelen´ım popisuje situaci, kdy a) jej´ı hodnoty nesm´ı pˇrekroˇcit pevnˇe stanoven´e meze a b) uvnitˇr tˇechto mez´ı nen´ı d˚ uvod povaˇzovat nˇekter´e hodnoty za v´ıce a jin´e za m´enˇe pravdˇepodobn´e.
24
Pˇ r´ıklady 1. Pohyb automobilu po komunikaci, kdy n´ahodn´a veliˇcina urˇcuje pˇr´ıˇcnou polohu automobilu na jednosmˇern´e vozovce (napˇr. vzhledem k prav´emu okraji vozovky). V´ yskyt automobilu kdekoli na vozovce pˇripouˇst´ıme stejnˇe dovolen´ y (pravdˇepodobn´ y), pohyb mimo vozovku je zak´azan´ y.
5.2
Norm´ aln´ı rozdˇ elen´ı
Hustota pravdˇ epodobnosti normovan´e
obecn´e
1 2 1 f (x) = √ e− 2 x , 2π
Momentov´ a funkce
z2
mX (z) = e 2 ,
resp., f (x) = √
1 x−µ 2 1 e− 2 ( σ ) 2πσ
mX (z) = ezµ+
resp.,
z2 σ2 2
(18)
.
(19)
O v ˇe ˇr e n´ı: ∞
1 x−µ 2 1 x − µ 1 e √ =√ mX (z) = e− 2 ( σ ) = substituce : y = σ 2πσ 2π −∞ Z
zx
Z
∞
ez(yσ+µ) e−
y2 2
dy =
−∞
∞ z2 σ2 1 1 2 ezµ+ 2 e− 2 (y−zσ) dy = = | doplnˇen´ı na ˇctverec | = √ 2π −∞ Z ∞ 2 2 v2 z2 σ2 z σ 1 e− 2 dv = ezµ+ 2 . = | substituce : v = y − zσ| = √ ezµ+ 2 2π −∞
Z
´ m k a: V posledn´ım kroku pˇredchoz´ıho odvozen´ı jsme vyuˇzili skuteˇcnost, ˇze Pozna 1. Tento vztah pro norm´ aln´ı rozdˇelen´ı nyn´ı dok´ aˇzeme. Oznaˇc´ıme: I = 2
R∞
−∞ e
Z
∞
I =
e
−x2 /2 dx
−x2 /2
−∞
−∞ f (x)dx
a budeme poˇc´ıtat kvadr´at (to je trik)
2
dx
R∞
Z
∞
=
e
−x2 /2
Z
dx ·
∞
e
−∞
−y 2 /2
−∞
Z
∞
Z
∞
dy =
e−
x2 +y 2 2
dxdy
−∞ −∞
No, proˇc ne? D´ale zavedeme pol´arn´ı souˇradnice x = ρ cos(ϕ) , y = ρ sin(ϕ)
ρ = 0 : ∞, , ϕ = 0 : 2π
2
2
2
x +y =ρ ,
cos(ϕ) −ρ sin(ϕ) J = sin(ϕ) ρ cos(ϕ)
=ρ
A pokraˇcujeme 2
Z
2π
Z
I =
∞
e 0
0
−ρ2 /2
ρ2 /2 = a ρdρdϕ = ρdρ = da
a tedy
Z Z 2π 2π Z ∞ −a e dadϕ = dϕ = 2π = 0 0 0
I=
25
√
2π.
=
Stˇ redn´ı hodnota a rozptyl
E[X] = 0,
D[X] = 1,
resp.,
E[X] = µ,
D[X] = σ 2 .
O v ˇe ˇr e n´ı: Z momentov´e vˇety stˇredn´ı hodnota:
dm dz
druh´y obecn´y moment:
1
2 z2
1
2 z2
= (µ + σ 2 z)eµz+ 2 σ d2 m dz 2
= σ 2 eµz+ 2 σ
a pro z = 0 dostaneme µ. 1
+ (µ + σ 2 z)2 eµz+ 2 σ
2 z2
a pro z = 0 je to σ 2 + µ2
V´ yznam Norm´aln´ı rozdˇelen´ı je z´akladn´ım a nejˇcastˇeji se vyskytuj´ıc´ım rozdˇelen´ım spojit´e n´ahodn´e veliˇciny. Norm´aln´ı rozdˇelen´ı dostaneme v pˇr´ıpadˇe, kdy porucha v n´ahodn´em pokuse je tvoˇrena vz´ajemn´ ym p˚ usoben´ım ˇrady mal´ ych a navz´ajem nez´avisl´ ych n´ahod.
Pˇ r´ıklady 1. P´ısek, kter´ y se sype z kybl´ıˇcku na p´ıskoviˇstˇe. N´ahodn´a veliˇcina je poloha zrn´ıˇcek p´ısku → na zemi se vytvoˇr´ı kopeˇcek (gaussovka). 2. a dalˇs´ı.
5.3
Logaritmicko-norm´ aln´ı rozdˇ elen´ı
Hustota pravdˇ epodobnosti f (x) =
1
1 √
σx 2π
e− 2 (
log x−µ 2 σ
)
0
pro x > 0,
(20)
jinde.
Stˇ redn´ı hodnota a rozptyl E[X] = eµ+σ
2 /2
,
D[X] = e2µ+σ
2
2
eσ − 1
V´ yznam M´a-li n´ahodn´a veliˇcina X norm´aln´ı rozdˇelen´ı, pak veliˇcina Y = eX m´a rozdˇelen´ı logaritmickonorm´aln´ı.
26
Pˇ r´ıklady 1. Intenzita dopravn´ıho proudu pˇri stˇredn´ım a vyˇsˇs´ım provozu.
5.4
Exponenci´ aln´ı rozdˇ elen´ı
Hustota pravdˇ epodobnosti (
f (x) =
1 − x−A δ δe
0
pro x ≥ A, jinde.
(21)
Stˇ redn´ı hodnota a rozptyl
E[X] = A + δ
D[X] = δ 2
Spoˇc´ıtat doma. Kdyˇz to nep˚ ujde, spoˇc´ıt´ame pozdˇeji.
V´ yznam Exponenci´aln´ı rozdˇelen´ı m´a n´asleduj´ıc´ı charakteristiku: jestliˇze X interpretujeme jako dobu do poruchy pˇr´ıstroje a tento pˇr´ıstroj pracoval do okamˇziku a bez poruchy, pak pravdˇepodobnost poruchy pˇr´ıstroje v n´asleduj´ıc´ım ˇcasov´em intervalu ∆ (tj. v ˇcasov´em u ´seku (a, a+∆)) je stejn´a, jako v ˇcasov´em u ´seku (0, ∆), tedy u pˇr´ıstroje, kter´ y dosud nebyl v provozu. T´eto vlastnosti lze vyuˇz´ıt napˇr. pro popis doby ˇzivotnosti pˇr´ıstroje, ohroˇzen´eho vnˇejˇs´ı n´ahodnou pˇr´ıˇcinou, bez uvaˇzov´ an´ı st´arnut´ı.
Pˇ r´ıklady 1. Teorie spolehlivosti. 2. Teorie front.
5.5
Rozdˇ elen´ı gama
Hustota pravdˇ epodobnosti f (x) =
1 xm−1 e−x/δ , Γ(m)δ m
x ≥ 0,
jinak 0
kde funkce gama je definov´ana vztahem Z
Γ(m) = 0
a plat´ı pro ni
Γ(m + 1) = mΓ(m)
[= m! pro m cel´e].
27
∞
tm−1 e−t dt.
(22)
5.6
Rozdˇ elen´ı beta
Hustota pravdˇ epodobnosti 1 xm1 −1 (1 − x)m2 −1 , B(m1 , m2 ) kde funkce beta je definov´ana vztahem
x ∈ (0, 1),
f (x) =
Z
1
B(m1 , m2 ) =
jinak 0
(23)
tm1 −1 (1 − t)m2 −1 dt
0
a plat´ı pro ni B(m1 , m2 ) = Γ(m1 )Γ(m2 )/Γ(m1 + m2 ).
5.7
Rozdˇ elen´ı χ2
N´ahodnou veliˇcinu X s rozdˇelen´ım χ2 s ν stupni volnosti dostaneme takto X=
ν X
Ui2 ,
(24)
i=1
kde Ui jsou nez´avisl´e n´ahodn´e veliˇciny s rozdˇelen´ım N (0, 1). Rozdˇelen´ı t´eto n´ahodn´e veliˇciny je rozdˇelen´ı Γ pro m = ν/2 a δ = 2, kde ν je parametr rozdˇelen´ı χ2 , kter´ y se naz´ yv´a ”poˇcet stupˇ n˚ u volnosti” a jeho v´ yznam je d´an vztahem (24). Toto rozdˇelen´ı je asymetrick´e - pro x < 0 je nula. Na kladn´e poloose nejprve roste (pro ν > 1), dosahuje maxima a potom kles´a k nule. (Dˇel´a jeden hrb.)
5.8
Rozdˇ elen´ı t
(Studentovo)
N´ahodnou veliˇcinu X se studentov´ ym rozdˇelen´ım s ν stupni volnosti dostaneme takto U X=p 2 , χ (ν)/ν
(25)
kde U je n´ahodn´a veliˇcina s rozdˇelen´ım N (0, 1) a χ2 (ν) znaˇc´ı n´ahodnou veliˇcinu s rozdˇelen´ım χ2 a ν stupni volnosti. Toto rozdˇelen´ı je symetrick´e, dosti podobn´e norm´aln´ımu rozdˇelen´ı, avˇsak je v nˇem mnohem v´ıce neurˇcitosti (lze z nˇeho generovat i znaˇcnˇe odlehl´e realizace).
5.9
Rozdˇ elen´ı F
N´ahodnou veliˇcinu X s rozdˇelen´ım F a stupni volnosti ν1 a ν2 dostaneme takto X=
χ2 (ν1 )/ν1 , χ2 (ν2 )/ν2
(26)
kde χ2 (ν1 ), resp., χ2 (ν2 ) znaˇc´ı n´ahodn´e veliˇciny s rozdˇelen´ım χ2 s ν1 , resp., ν2 stupni volnosti. Tvarem se toto rozdˇelen´ı podob´a rozdˇelen´ı χ2 .
28
6
N´ ahodn´ y vektor a jeho popis
Dosud jsme se zab´ yvali jednou n´ahodnou veliˇcinou, tedy, volnˇe ˇreˇceno, pˇr´ıpadem, kdy na sledovan´em procesu mˇeˇr´ıme pouze jedna data. Napˇr. v dopravn´ı oblasti mˇeˇr´ıme data jen na jedin´em detektoru. Chceme-li z mˇeˇren´ ych dat dˇelat z´avˇery o t´eto oblasti, bude zˇrejmˇe vhodn´e mˇeˇrit data na v´ıce m´ıstech. Kaˇzd´e mˇeˇr´ıc´ı m´ısto je potom spojeno s jednou n´ahodnou veliˇcinou a v kaˇzd´em okamˇziku mˇeˇren´ı dost´av´ame cel´ y vektor hodnot mˇeˇren´ ych dat. O uvaˇzovan´ ych n´ahodn´ ych veliˇcin´ach hovoˇr´ıme jako o n´ ahodn´ em vektoru nebo o v´ıcerozmˇ ern´ e n´ ahodn´ e veliˇ cinˇ e. D e f i n i c e 6.1 (N´ ahodn´ y vektor) Uvaˇzujme n´ahodn´e veliˇciny X1 , X2 , . . . , Xn . N´ ahodn´ ym vektorem nazveme uspoˇr´adanou n-tici (vektor) X = (X1 , X2 , . . . , Xn )0 . (27) Koment´ aˇ r k definici 1. Apostrof v definici znaˇc´ı transpozici. N´ahodn´ y vektor tedy zav´ad´ıme jako sloupcov´ y vektor a budeme se t´eto konvence d´ale drˇzet. V samotn´e definici je samozˇrejmˇe jedno, zda je vektor sloupcov´ y, ale v dalˇs´ıch vzorc´ıch tato konvence pˇrin´aˇs´ı lepˇs´ı srozumitelnost.
6.1
´ Upln´ y popis n´ ahodn´ eho vektoru
D e f i n i c e 6.2 (Distribuˇ cn´ı funkce n´ ahodn´ eho vektoru) Pro n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 definujeme distribuˇ cn´ı funkci jako funkci n re´aln´ ych promˇenn´ ych vztahem F (x1 , x2 , . . . , xn ) = P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ).
(28)
Koment´ aˇ r k definici 1. Pravdˇepodobnost na prav´e stranˇe definiˇcn´ıho vztahu je sdruˇzen´a pravdˇepodobnost, a tedy pravdˇepodobnost pr˚ uniku (souˇcasn´eho nastoupen´ı) jednotliv´ ych podm´ınek v argumentu. Je to tedy pravdˇepodobnost, ˇze X1 ≤ x1 a z´aroveˇ n X2 ≤ x2 , . . . aˇz z´aroveˇ n Xn ≤ xn 2. Vlastnosti distribuˇ cn´ı funkce (a) Distribuˇcn´ı funkce F (x1 , x2 , . . . , xn ) je neklesaj´ıc´ı v kaˇzd´e sv´e promˇenn´e. (b) Plat´ı F (−∞, x2 , . . . , xn ) = F (x1 , −∞, . . . , xn ) = . . . = F (x, x2 , . . . , −∞) = 0, F (∞, ∞, . . . , ∞) = 1, kde znak ∞ je tˇreba ch´apat ve smyslu limitn´ıho pˇrechodu.
29
D e f i n i c e 6.3 (Pravdˇ epodobnostn´ı funkce n´ ahodn´ eho vektoru) Pro diskr´etn´ı n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 (tj. n´ahodn´ y vektor, jehoˇz kaˇzd´a sloˇzka m˚ uˇze nab´ yvat jen koneˇcn´eho nebo spoˇcetn´eho mnoˇzstv´ı hodnot) definujeme pravdˇ epodobnostn´ı funkci vztahem f (x1 , x2 , . . . , xn ) = P (X1 = x1 , X2 = x2 , . . . , Xn = xn ) (29) Koment´ aˇ r k definici 1. Hodnota pravdˇepodobnostn´ı funkce je tedy rovna pravdˇepodobnosti, se kterou nastane pr´ avˇe 0 hodnota (x1 , x2 , . . . , xn ) n´ahodn´eho vektoru X = (X1 , X2 , . . . , Xn ) . 2. Distribuˇcn´ı funkci je moˇzno pomoc´ı pravdˇepodobnostn´ı funkce vyj´adˇrit takto X
F (x1 , x2 , . . . , xn ) =
X
X
...
t1 ≤x1 t2 ≤x2
f (t1 , t2 , . . . , tn ).
tn ≤xn
3. Vlastnosti pravdˇ epodobnostn´ı funkce (a) f (x1 , x2 , . . . , xn ) ≥ 0, (b)
P
x1
P
x2
...
P
xn
∀ (x1 , x2 , . . . , xn ),
f (x1 , x2 , . . . , xn ) = 1.
D e f i n i c e 6.4 (Hustota pravdˇ epodobnosti n´ ahodn´ eho vektoru) Pro spojit´ y n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 (tj. n´ahodn´ y vektor, jehoˇz kaˇzd´a sloˇzka m˚ uˇze nab´ yvat nespoˇcetnˇe velk´eho mnoˇzstv´ı hodnot) definujeme hustotu pravdˇ epodobnosti vztahem f (x1 , x2 , . . . , xn ) =
∂ n F (x1 , x2 , . . . , xn ) . ∂x1 ∂x2 . . . ∂xn
(30)
Koment´ aˇ r k definici 1. Distribuˇcn´ı funkci je moˇzno pomoc´ı hustoty pravdˇepodobnosti vyj´adˇrit takto Z
F (x1 , x2 , . . . , xn ) =
x1
Z
x2
Z
xn
... −∞ −∞
−∞
f (t1 , t2 , . . . , tn )dt1 dt2 . . . dtn .
2. Vlastnosti hustoty pravdˇ epodobnosti (a) f (x1 , x2 , . . . , xn ) ≥ 0, (b)
∀ (x1 , x2 , . . . , xn ) ∈ Rn ,
R∞ R∞
R∞ −∞ −∞ . . . −∞ f (x1 , x2 , . . . , xn )dx1 dx2 . . . dxn
= 1.
ˇ ´ı k l a d: Pˇri mˇeˇren´ı rozmˇer˚ Pr u v´yrobku lze udˇelat maxim´aln´ı chybu ±e1 v ˇs´ıˇrce a ±e2 v d´elce. Tyto chyby oznaˇc´ıme X1 a X2 a povaˇzujeme je za n´ahodn´e veliˇciny. Pˇritom pˇredpokl´ad´ame, ˇze v dan´ych mez´ıch jsou chyby vˇsude stejnˇe pravdˇepodobn´e. Urˇcete hustotu pravdˇepodobnosti a distribuˇcn´ı funkci n´ahodn´eho vektoru (X1 , X2 ). ♦ Hustota pravdˇepodobnosti n´ahodn´eho vektoru bude definov´ana v rovinˇe (x1 , x2 ) re´aln´ych ˇc´ısel a nenulov´a bude na obd´eln´ıku (−e1 ; e1 ) × (−e2 ; e2 ). Protoˇze pravdˇepodobnost v´yskytu chyby je zde
30
rovnomˇern´a, bude jej´ı hustota konstantn´ı, tedy f (x1 , x2 ) = k. Z podm´ınky na jednotkov´y integr´al plyne, ˇze jej´ı hodnota bude Z
e1
−e1
Z
e2
−e2
kdx1 dx2 = k2e1 2e2 = 1
→
k=
1 . 4e1 e2
Hustota pravdˇepodobnosti je tedy f (x1 , x2 ) =
1 4e1 e2
0
pro x1 ∈ (−e1 ; e1 ) ∧ x2 ∈ (−e2 ; e2 ), jinde.
Distribuˇcn´ı funkci z´ısk´ame integrac´ı hustoty pravdˇepodobnosti
Z
F (x1 , x2 ) =
x1
Z
x2
−∞ −∞
1 dt1 dt2 = 4e1 e2
0 (x1 +e1 )(x2 +e2 ) 4e1 e2
pro x1 < −e1 ∨ x2 < −e2 , pro x1 ∈ h−e1 ; e1 ) ∧ x2 ∈ h−e2 ; e2 ),
(x1 +e1 ) 2e1
pro x1 ∈ h−e1 ; e1 ) ∧ x2 ≥ e2 ,
(x2 +e2 ) 2e2
pro x1 ≥ e1 ∧ x2 ∈ h−e2 ; e2 ),
1
pro x1 ≥ e1 ∧ x2 ≥ e2 .
Distribuˇcn´ı funkce je naznaˇcena na obr´azku
x
62
(x1 +e1 ) 2e1
1
(x1 +e1 )(x2 +e2 ) 4e1 e2
(x2 +e2 ) 2e2
x1
0
ˇ ´ı k l a d: Sledujeme hod dvˇema mincemi. Mince jsou poˇskozen´e tak, ˇze na prvn´ı je pravdˇepodobnost Pr rubu 0.6 a l´ıcu 0.4 a na druh´e padne rub s pravdˇepodobnost´ı 0.3 a l´ıc 0.7. Definujeme n´ahodnou veliˇcinu X = (X1 , X2 ), kter´a rubu pˇriˇrad´ı jedniˇcku a l´ıcu dvojku. Napiˇste pravdˇepodobnostn´ı a distribuˇcn´ı funkci t´eto n´ahodn´e veliˇciny. ♦
31
Jde o diskr´etn´ı dvourozmˇernou n´ahodnou veliˇcinu, popisuj´ıc´ı dva nez´avisl´e pokusy (hod 1. a 2. minc´ı). Hodnoty pravdˇepodobnostn´ı funkce urˇc´ıme v´yˇctem - budou to pravdˇepodobnosti jednotliv´ych (dvourozmˇern´ych) v´ysledk˚ u, kter´e obdrˇz´ıme jako souˇciny pravdˇepodobnost´ı jednotliv´ych v´ysledk˚ u, tj. P (”na prvn´ı padlo ...”).P (”na druh´e padlo ...”). Pravdˇepodobnostn´ı funkce bude d´ana tabulkou f (x1 , x2 ) x2 = 1 x2 = 2
x1 = 1 0.18 0.42
x1 = 2 0.12 0.28
a jej´ı graf je na obr´azku
f (x1 , x2 )
6
1 1
u
u u
2 -
u
x1
2 x2
0.18 0.12 0.42 0.28
Distribuˇcn´ı funkce je
F (x1 , x2 ) =
X X i≤x1 j≤x2
f (i, j) =
0 pro 0.18 pro
0.6
0.3
1
x1 x1 pro x1 pro x1 pro x1
< 1 ∨ x2 < 1, ∈ h1, 2) ∧ x2 ∈ h1, 2), ∈ h1, 2) ∧ x2 ≥ 2, ≥ 2 ∧ x2 ∈ h1, 2), ≥ 2 ∧ x2 ≥ 2.
Hodnoty distribuˇcn´ı funkce v rovinˇe (x1 , x2 ) jsou naznaˇceny na obr´azku:
32
x2 6
0.6
1
0.18
0.3
2 1 -
0
6.2
1
x1
2
Margin´ aln´ı a podm´ınˇ en´ e rozdˇ elen´ı n´ ahodn´ eho vektoru
D e f i n i c e 6.5 (Margin´ aln´ı pravdˇ epodobnostn´ı funkce) Pro diskr´etn´ı n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 s pravdˇepodobnostn´ı funkc´ı f (x1 , x2 , . . . , xn ) definujeme margin´ aln´ı pravdˇ epodobnostn´ı funkci vztahem f (x1 , x2 , . . . , xk ) =
X X xk+1 xk+2
...
X
f (x1 , x2 , . . . , xn ).
(31)
xn
D e f i n i c e 6.6 (Margin´ aln´ı hustota pravdˇ epodobnosti) Pro spojit´ y n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 s hustotou pravdˇepodobnosti f (x1 , x2 , . . . , xn ) definujeme margin´ aln´ı hustotu pravdˇ epodobnosti vztahem Z
f (x1 , x2 , . . . , xk ) =
Z
Z
... xk+1
xk+2
xn
f (x1 , x2 , . . . , xn )dxk+1 dxk+2 . . . dxn .
(32)
Koment´ aˇ r k definic´ım 1. Sumace i integrace v pˇredchoz´ıch vzorc´ıch se prov´ad´ı pˇres cel´ y obor hodnot pˇr´ısluˇsn´ ych promˇenn´ ych. 2. Definice margin´aln´ıch rozdˇelen´ı je uvedena pro prvn´ıch k sloˇzek vektoru X. Analogicky vˇsak plat´ı i pro libovolnˇe vybran´e sloˇzky n´ahodn´eho vektoru. D e f i n i c e 6.7 (Podm´ınˇ en´ e rozdˇ elen´ı) Pro n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 s rozdˇelen´ım f (x1 , x2 , . . . , xn ) definujeme podm´ınˇ enou pravdˇ epodobnostn´ı funkci nebo hustotu pravdˇ epodobnosti vztahem f (x1 , x2 , . . . , xk |xk+1 , . . . , xn ) =
33
f (x1 , x2 , . . . , xn ) . f (xk+1 , . . . , xn )
(33)
Koment´ aˇ r k definic´ım 1. Podm´ınˇen´a hustota pravdˇepodobnosti je d´ana pod´ılem sdruˇzen´e a margin´aln´ı. Stejnˇe je to i pro pravdˇepodobnostn´ı funkci. 2. Definice analogicky plat´ı i pro libovolnˇe vybran´e sloˇzky n´ahodn´eho vektoru, nikoliv jen pro prvn´ıch k sloˇzek. ˇ ´ı k l a d: Pr
Dvojrozmˇern´e norm´aln´ı rozdˇelen´ı m´a sdruˇzenou hustotu pravdˇepodobnosti f (x) =
1
n
p
2π |r|
o
exp (x − µ)0 r−1 (x − µ) ,
kde x = [x1 , x2 ]0 je dvourozmˇern´y n´ahodn´y vektor, µ = [µ1 , µ2 ]0 je stˇredn´ı hodnota x, "
r=
σ12 σ12 σ12 σ22
#
je kovarianˇcn´ı matice x a
2 znaˇ |r| = σ12 σ22 − σ12 c´ı determinant matice r.
Margin´aln´ı hustoty pravdˇepodobnosti jsou f1 (x1 ) = N (µ1 , σ12 )
a f2 (x2 ) = N (µ2 , σ22 )
Podm´ınˇen´e hustoty pravdˇepodobnosti jsou σ12 σ2 f12 (x1 |x2 ) = N µ1 + 2 (x2 − µ2 ), σ12 − 12 σ2 σ22
!
σ12 σ2 a f21 (x2 |x1 ) = N µ2 + 2 (x1 − µ1 ), σ22 − 12 σ1 σ12
!
´ m k a: Pozna Margin´ aln´ı a podm´ınˇen´e rozdˇelen´ı lze odvodit tak, ˇze v exponentu sdruˇzen´e hustoty pravdˇepodobnosti rozn´ asob´ıme a vznikl´y kvadratick´y v´yraz dopln´ıme ne ˇctverec v jedn´e z promˇenn´ych. Ten v´yraz, kter´y obsahuje jen jednu promˇennou je margin´ aln´ı hustota pravdˇepodobnosti, zbytek je margin´ aln´ı. Prov´est na cviˇcen´ı (pokud nebude na cviˇcen´ı ˇcas, tak odvozen´ı n´ asleduje). Inverze kovarianˇcn´ı matice r "
σ12 σ12 σ12 σ22
#−1
1 = 2 2 2 σ1 σ2 − σ12
"
σ22 −σ12 −σ12 σ12
#−1
Sdruˇzen´a hustota pravdˇepodobnosti 1 q
2 2π σ12 σ22 − σ12
exp −
h i 1 σ22 (x1 − µ1 )2 − 2σ12 (x1 − µ1 )(x2 − µ2 ) + σ12 (x2 − µ2 )2 2 2 2 2(σ1 σ2 − σ12 )
34
Pˇrechod na podm´ınˇenou a margin´aln´ı hustotu pravdˇepodobnosti provedeme doplnˇen´ım exponentu na ˇctverec: pokraˇcujeme s hranatou z´avorkou "
σ22
σ12 (x1 − µ1 ) − 2 2 (x1 − µ1 )(x2 − µ2 ) + σ2 2
=
σ22
2
σ12 (x2 − µ2 ) σ22 2
σ12 x1 − µ1 − 2 (x2 − µ2 ) σ2
+
σ12
#
σ2 − 12 (x2 − µ2 )2 + σ12 (x2 − µ2 )2 = σ24
σ2 − 12 σ22
!
(x2 − µ2 )2
a cel´ y exponent 2
σ22 σ12 2 2 ) x1 − µ1 − σ 2 (x2 − µ2 ) 2(σ1 σ22 − σ12 2
−
−
1 2
1 2 σ12 σ22 −σ12 σ22
x1 − µ1 +
−
2 σ12 σ22 − σ12 1 (x1 − µ1 )2 = 2 2 − σ12 ) σ2
2(σ12 σ22
2
σ12 (x2 − µ2 ) σ22
−
1 1 (x2 − µ2 )2 2 σ22
Konec odvozen´ı. To prvn´ı je exponent podm´ınˇen´e a to druh´e margin´aln´ı hustoty pravdˇepodobnosti.
35
7
Poˇ c´ıt´ an´ı s n´ ahodn´ ymi vektory
ˇ ´ı k l a d 1: Pˇr´ıstroj se skl´ad´a ze tˇr´ı, nez´avisle pracuj´ıc´ıch ˇc´ast´ı. Pravdˇepodobnost poruchy kaˇzd´e Pr ˇc´asti je 0.1. Najdˇete distribuˇcn´ı funkci n´ahodn´e veliˇciny, popisuj´ıc´ı poˇcet porouchan´ych ˇc´ast´ı. ♦ Vzhledem k nez´avislosti se poˇcet porouchan´ych souˇc´astek ˇr´ıd´ı binomickou pravdˇepodobnost´ı P3 (k) pˇri p = 0.1. P (0) = 0.93 = 0.729,
P (1) = 3 · 0.1 · 0.92 = 0.243,
P (2) = 0.027
P (3) = 0.13 = 0.001
Distribuˇcn´ı funkci dostaneme jako kumulativn´ı souˇcet pravdˇepodobnost´ı, tj.
F (x) =
0 0.729
pro pro pro pro pro
0.972
0.999
1
x<0 0≤x<1 1≤x<2 2≤x<3 x≥3
Nakreslit! ˇ ´ı k l a d 2: Zkouˇsen´ı prob´ıh´a tak, ˇze studentovi jsou kladeny ot´azky, dokud odpov´ıd´a spr´avnˇe. Pr Prvn´ı ˇspatn´a odpovˇed’ zkouˇsen´ı ukonˇc´ı a zn´amka je odvozena z poˇctu dobr´ych odpovˇed´ı. Urˇcete pravdˇepodobnostn´ı funkci a distribuˇcn´ı funkci n´ahodn´e veliˇciny ”poˇcet dobr´ych odpovˇed´ı”, jestliˇze ot´azky jsou nez´avisl´e a pravdˇepodobnost dobr´e odpovˇedi pˇri jednom dotazu je st´al´a a rovna 0.9. ♦ Protoˇze jsou ot´azky nez´avisl´e, je pravdˇepodobnost dobr´e s´erie odpovˇed´ı rovna souˇcinu pravdˇepodobnost´ı dobr´ych odpovˇed´ı. Pokud m´a tato s´erie b´yt na konci ukonˇcena, mus´ı n´asledovat ˇspatn´a odpovˇed’ – tedy na konci bude kr´at P (ˇspatnˇe) = 1 − P (dobˇre). P (0) = 0.1,
P (1) = 0.9 · 0.1,
P (2) = 0.92 · 0.1,
...
, P (x) = 0.9x · 0.1,
...
Jedn´a se tedy o nekoneˇcnou geometrickou posloupnost s prvn´ım ˇclenem rovn´ym 0.1 a kvocientem ˇ asteˇcn´y souˇcet takov´e q = 0.9. Protoˇze ˇrada zaˇc´ın´a indexem x = 0, bude ˇclen P (x) v poˇrad´ı x+prv´y. C´ ˇrady je x X 1 − q (x+1) . sx = = P (0) 1 − q k=0 Distribuˇcn´ı funkce (jako kumulativn´ı souˇcet hodnot pravdˇepodobnostn´ı funkce) je F (x) =
x X
0.1 · 0.9k = 0.1
k=0
ˇ ´ı k l a d 3: Pr
1 − 0.9x+1 = 1 − 0.9x+1 . 1−x
Je d´ana hustota pravdˇepodobnosti f (x) =
1 sin(x), 2
pro x ∈ (0, π) a 0 jinde. ♦
Urˇcete distribuˇcn´ı funkci. F (x) =
1 2 (1
0 − cos(x)) 1
36
pro x ≤ 0 pro x ∈ (0, π) pro x ≥ π
ˇ ´ı k l a d 4: Pr
Je d´ana hustota pravdˇepodobnosti f (x) =
3 − |x2 − 4x + 3| , 8
pro x ∈ (0, 4). ♦
Urˇcete distribuˇcn´ı funkci. Do 0 je F (x) = 0. Pro x ∈ (0, 1)
x
Z
F (x) = 0 + 0
F (1) =
1 1 1 1 (− t2 + t)dt = − x3 + x2 8 2 24 4
5 24
Pro x ∈ (1, 3) F (x) = F (3) =
5 + 24
x
Z 1
1 3 5 1 1 1 3 1 1 1 1 3 1 3 ( t2 − t + )dt = + x3 − x2 + x − ( − + ) = x3 − x2 + x − 8 2 4 24 24 4 4 24 4 4 24 4 4 3
19 24
Pro x ∈ (3, 4) F (x) =
19 + 24
Z 3
x
1 1 19 1 1 9 9 1 1 1 (− t2 + t)dt = − x3 + x2 − (− + ) = − x3 + x2 − 8 2 24 24 4 8 4 24 4 3
Nad 4 je F (x) = 1. Doma: spoˇc´ıtat stˇredn´ı hodnotu a rozptyl (stˇr.h.=2, rozpt.=1) ˇ ´ı k l a d 5: Pr
Je d´ana distribuˇcn´ı funkce n´ahodn´e veliˇciny X F (x) = 1 −
1 x3
pro x > 1 jinde 0. ♦
Urˇcete stˇredn´ı hodnotu, modus a medi´an tohoto rozdˇelen´ı. Hustotu pravdˇepodobnosti dostaneme derivov´an´ım distribuˇcn´ı funkce 3 , x4
f (x) = Stˇredn´ı hodnota je
∞
Z
E[X] =
jinde 0.
3 −3 dx = 4 x 2x2
x 1
x > 1,
∞ 1
3 = . 2
Modus je argument x, pro kter´y nab´yv´a hustota pravdˇepodobnosti maxima. Protoˇze derivace f 0 (x) = −12x−5 je f (x) na intervalu (1, ∞) klesaj´ıc´ı. Proto je maximum v lev´e hranici, a tedy x ˆ = 1. Medi´an je bod x ˜, pro kter´y plat´ı F (˜ x) = 1−
R x˜
= 0.5 Protoˇze je d´ana pˇr´ımo distribuˇcn´ı funkce, je
1 1 = 3 x ˜ 2
⇒
−∞ f (x)
37
x ˜=
√ 3
2.
ˇ ´ı k l a d 6: Pr
N´ahodn´a veliˇcina X m´a hustotu pravdˇepodobnosti (
1 − |x − 1| 0
f (x) =
pro x ∈ (0, 2) jinde ♦
Urˇcete jej´ı distribuˇcn´ı funkci, stˇredn´ı hodnotu a rozptyl. Rx
Distribuˇ cn´ı funkci urˇc´ıme podle obecn´eho vztahu F (x) = −∞ f (t)dt. Protoˇze je ale hustota pravdˇepodobnosti po ˇc´astech spojit´a, mus´ıme rovnˇeˇz integrovat po ˇc´astech, a to pro intervaly (−∞, 0), (0, 1), (1, 2) a (2, ∞). Na prvn´ım intervalu x ∈ (−∞, 0) je f (x) = 0, a tedy bude tak´e F (x) = 0. Na druh´em intervalu x ∈ (0, 1) je f (x) = x a tedy Z
x
Z
F (x) =
0
0
1 tdt = 0 + t2 2
Z
x
f (t)dt +
f (t)dt = −∞
x
Z
−∞
x 0
1 = x2 2
Na tˇret´ım intervalu x ∈ (1, 2) je f (x) = 2 − x Z
x
0
Z
Z
f (t)dt +
f (t)dt +
f (t)dt =
F (x) =
−∞
−∞
=
1
1
0
1 1 (2 − t)dt = 0 + + 2t − t2 2 2
x
= 1
1 1 1 1 + 2x − x2 − 2 + = 1 − (x − 2)2 2 2 2 2
Na posledn´ım intervalu x ∈ (2, ∞) je opˇet f (x) = 0. Hodnota F (x) na konci pˇredchoz´ıho intervalu je F (2) = 1 a ta z˚ ustane stejn´a pro cel´y interval. Distribuˇcn´ı funkci tedy m˚ uˇzeme zapsat po ˇc´astech
0 0.5x2 F (x) = 1 − 0.5(x − 2)2 1
pro pro pro pro
x ∈ (−∞, 0) x ∈ (0, 1) x ∈ (1, 2) x ∈ (2, ∞).
´ m k a: Pozor. Nezapomeˇ Pozna nte, ˇze v kaˇzd´em intervalu poˇc´ıt´ ame vˇzdy integr´ al od −∞, a tedy i pˇres vˇsechny minul´e intervaly (tj. intervaly vlevo). V diskr´etn´ım pˇr´ıpadˇe hovoˇr´ıme o kumulativn´ım souˇctu. Integr´ al je tak´e ”kumulativn´ı”. Stˇ redn´ı hodnota: Podle definice stˇredn´ı hodnoty a tvaru hustoty pravdˇepodobnosti je Z
∞
E[X] =
Z
xf (x)dx = −∞
1
2
Z
x dx + 0
1
2
1 x(2 − x)dx = x3 3
1
1 + x − x3 3 0
2
coˇz se dalo ˇcekat (podle grafu hustoty). Rozptyl: Z
∞
D[X] =
(x − E[x])2 f (x)dx =
−∞
Z
∞
−∞
38
x2 f (x)dx − E[X]2 =
2
= 1, 1
Z
=
1
x3 dx +
Z
2
x2 (2 − x)dx − 1 =
0
0
1 4 x 4
1
+ 0
2 3 1 4 x − x 3 4
2
−1= 1
1 6
ˇ ´ı k l a d 7: Pr Pˇri zaokrouhlov´an´ı na jedno desetinn´e m´ısto se dopouˇst´ıme chyby, rovnomˇernˇe rozdˇelen´e na intervalu (−0.05, 0.05). Jak´a je pravdˇepodobnost, ˇze se souˇcet dvou takto zaokrouhlen´ych ˇc´ısel bude od hodnoty pˇresn´e liˇsit nejv´yˇse o ±0.02? ♦ Chybu, vzniklou zaokrouhlen´ım prv´eho ˇc´ısla oznaˇc´ıme X1 a druh´eho X2 . Obˇe maj´ı rovnomˇern´e rozdˇelen´ı s hustotou pravdˇepodobnosti f (x) = 10 pro x ∈ (−0.05, 0.05) a 0 jinde. Obˇe tyto n´ahodn´e veliˇciny jsou nez´avisl´e, a tedy sdruˇzen´a hustota je f (x1 , x2 ) = f (x1 )f (x2 ) = 100,
pro
[x1 x2 ] ∈ (−0.05, 0.05) × (−0.05, 0.05),
jinde
0
Chybu souˇctu oznaˇc´ıme Y a je transformac´ı Y = X1 + X2 , Y ∈ (−0.1, 0.1). Jej´ı distribuˇcn´ı funkce spoˇcteme jako integr´al z hustoty pravdˇepodobnosti pˇres oblast x1 + x2 ≤ y, tj. x2 ≤ −x1 + y Z Z
F (y) =
f (x1 , x2 )dx1 dx2 = x1 +x2 ≤y
=
R 0.05+y R y−x 1 2 −0.05 −0.05 100dx2 dx1 = −150y + 10y + 0.5
pro y ≤ 0
1 − R 0.05 R 0.05 100dx dx = −50y 2 + 10y + 0.5 2 1 y−0.05 y−x1
pro y > 0.
Distribuˇcn´ı funkce tedy je
0 50y 2 + 10y + 0.5 F (y) = −50y 2 + 10y + 0.5 1
pro pro pro pro
y y y y
≤ −0.1 ∈ (−0.1, 0) ∈ (0, 0.1) ≥ 0.1
Pravdˇepodobnost, ˇze souˇcet dvou zaokrouhlen´ych ˇc´ısel se bude od pˇresn´e hodnoty liˇsit maxim´alnˇe o ±0.02 je roven pravdˇepodobnosti, ˇze chyba v souˇctu (tj. hodnota n´ahodn´e veliˇciny Y ) bude v intervalu (−0.02, 0.02) a tu urˇc´ıme pomoc´ı rozd´ılu distribuˇcn´ı funkce F (0.02) − F (−0.02) = −50·0.022 + 10·0.02 + 0.5 − (−150·0.022 − 10·0.02 + 0.5) = 0.36
´ m k a: Pˇri odvozen´ı distribuˇcn´ı funkce si oblast integrace nakreslete a rozdˇelte ji na doln´ı a Pozna horn´ı polovinu. Integrac´ı pˇres doln´ı polovinu obdrˇz´ıte pˇr´ımo distribuˇcn´ı funkci pro y ≤ 0, integrac´ı pˇres horn´ı polovinu dostanete P (Y > y) = 1 − F (y) a v´ysledek plat´ı pro y > 0. S podm´ınkou y ∈ (−0.1, 0.1) dostaneme v´yslednou distribuˇcn´ı funkci tak, jak je zaps´ ana.
39
8
Charakteristiky n´ ahodn´ eho vektoru
V u ´vodn´ı pˇredn´aˇsce jsme hovoˇrili o charakteristik´ach datov´eho souboru. Rovnˇeˇz jsme se zm´ınili o vztahu proces - data. Budeme-li na n´ahodnou veliˇcinu pohl´ıˇzet jako na soubor vˇsech jej´ıch moˇzn´ ych hodnot, na nichˇz je definov´ano rozdˇelen´ı pravdˇepodobnost´ı, nab´ız´ı se moˇznost popisu n´ahodn´e veliˇciny pomoc´ı obdobn´ ych charakteristik, jako jsme uvedli pro datov´ y soubor. Protoˇze pravdˇepodobnosti hodnot nejsou stejn´e, uplatn´ı se vzorce pro tˇr´ıdˇen´a data. Pro diskr´etn´ı nv jsou vzorce prakticky stejn´e, pro spojitou nv se ”sumace nahrad´ı integrac´ı”. Charakteristiky nv pˇredstavuj´ı ne´ upln´ y, avˇsak velmi jednoduch´ y, popis nv. Tento ne´ upln´ y popis v praktick´ ych pˇr´ıpadech ˇcasto zcela postaˇc´ı. Z´akladn´ımi charakteristikami nv je stˇ redn´ı hodnota a rozptyl .
8.1
Stˇ redn´ı hodnota a rozptyl
ˇedn´ı hodnota na ´hodne ´ velic ˇiny • • Str D e f i n i c e 8.1 (Stˇ redn´ı hodnota) Pro diskr´ etn´ı nv X s hodnotami {x1 , x2 , . . . , xn } s pravdˇepodobnostn´ı funkc´ı f (x), resp., spojitou nv X s hodnotami z mnoˇziny X ∗ a hustotou pravdˇepodobnosti f (x) definujeme stˇ redn´ı hodnotu E[X] vztahem E[X] =
n X
Z
xi f (xi ),
resp.,
E[X] =
i=1
X∗
xf (x)dx.
(34)
Koment´ aˇ r k definici 1. Stˇredn´ı hodnota urˇcuje ”hladinu”, na kter´e se data pohybuj´ı. 2. Jedn´a se skuteˇcnˇe o vzorce pro v´aˇzen´ y pr˚ umˇer. Pˇri tˇr´ıdˇen´ı dat urˇcujeme ˇcetnosti jednotliv´ ych hodnot; vydˇelen´ım celkov´ ym poˇctem n z´ısk´ame relativn´ı ˇcetnosti - pravdˇepodobnosti, coˇz jsou hodnoty pravdˇepodobnostn´ı funkce. d : 1, 1, 2, 1, 2, 1, 1, 3 →
xi : 1 ni : 5
2 2
3 1
→
E[X] =
1·5 + 2·2 + 3·1 5 2 1 = 1· + 2· + 3· 5+2+1 8 8 8
ˇ ´ı k l a d: Urˇcete stˇredn´ı hodnotu n´ahodn´e veliˇciny s pravdˇepodobnostn´ı funkc´ı f (x) danou tabulkou Pr xi f (xi )
3 0,22
5 0,31
7 0,19
9 0,28
Podle definice je E[X] = x1 f (x1 ) + x2 f (x2 ) + x3 f (x3 ) + x4 f (x4 ) = 3·0, 22 + 5·0, 31 + 7·0, 19 + 9·0, 28 = 6, 06.
40
♦
ˇ ´ı k l a d: Urˇcete stˇredn´ı hodnotu nv X s hodnotami x = 0, 1, . . . , ∞, s pravdˇepodobnostn´ı funkc´ı Pr x f (x) = λx! e−λ pro x = 0, 1, . . . , ∞. ♦ Opˇet podle definice je ∞ X
∞ ∞ X λx −λ X λ·λx−1 −λ λz −λ E[X] = x· e = e =λ e =λ x! (x − 1)! z! x=0 x=1 z=0
Pˇri u ´prav´ach jsme: 1) vynechali prvn´ı ˇclen sumace, protoˇze je nulov´y, 2) zkr´atili x proti faktori´alu, 3) vytkli jedno λ z mocniny v ˇcitateli, 4) substituovali x − 1 → z a 5) vyuˇzili skuteˇcnosti, ˇze souˇcet ˇclen˚ u pravdˇepodobnostn´ı funkce je roven jedn´e.
´hodne ´ velic ˇiny • • Rozptyl na D e f i n i c e 8.2 (Rozptyl) Pro n´ahodnou veliˇcinu X s pravdˇepodobnostn´ı funkc´ı, resp., s hustotou pravdˇepodobnosti f (x) definujeme rozptyl D[X] vztahem D[X] = E[(X − E[X])2 ].
(35)
Koment´ aˇ r k definici 1. Rozptyl urˇcuje m´ıru ”variability” dat, tj. jak moc jsou jednotliv´e hodnoty odch´ yleny od stˇredn´ı hodnoty. Hodnota rozptylu je pr˚ umˇer kvadratick´ ych odchylek - veliˇcina porovnateln´ a s daty je smˇ erodatn´ a odchylka, coˇz je odmocnina z rozptylu. 2. Pro diskr´etn´ı, resp., spojitou nv lze rozptyl vyj´adˇrit takto D[X] =
n X
Z
2
(xi − E[X]) f (xi ),
resp.,
D[X] =
i=1
X∗
(x − E[X])2 f (x)dx.
ˇ ´ı k l a d: Urˇc´ıme stˇredn´ı hodnotu n´ahodn´e veliˇciny pro zm´ınˇen´y pˇr´ıpad ˇcek´an´ı na tramvaj. Jej´ı Pr hustota pravdˇepodobnosti je ( 1/5 pro x ∈ (0, 5), f (x) = 0 jinde. Stˇredn´ı hodnota je podle definice (vynech´ame integraci tam, kde je f (x) = 0.) Z
E[X] =
5
Z
xf (x)dx = 0
0
5
1 1 2 x x· dx = 5 10
coˇz pˇresnˇe odpov´ıd´a naˇsim pˇredstav´am. Rozptyl opˇet podle definice Z
D[X] = 0
5
1 25 (x − 2, 5)2 dx = 5 12
41
5
= 2, 5 , 0
♦
´torove ´ vyja ´ dr ˇen´ı str ˇedn´ı hodnoty a rozptylu • • Opera Stˇ redn´ı hodnota
Pro n´ahodn´e veliˇciny X, Y a konstantu a plat´ı E[a] = a,
E[aX] = aE[X],
E[X + Y ] = E[X] + E[Y ],
ale E[X 2 ] 6= E[X]2 ,
Rozptyl
E[XY ] 6= E[X]E[Y ].
Pro n´ahodn´e veliˇciny X, Y a konstantu a plat´ı D[a] = 0,
D[a + X] = D[X],
D[aX] = a2 D[X]
a pro X, Y nekorelovan´e (bude pozdˇeji) plat´ı D[X + Y ] = D[X] + D[Y ]. Pro rozptyl plat´ı tzv. v´ ypoˇcetn´ı vzorec D[X] = E[(X − E[X])2 ] = E[X 2 ] − E[X]2 .
(36)
Odvozen´ı: E[(X − E[X])2 ] = E[X 2 − 2XE[X] + E[X]2 ] = E[X 2 ] − 2E[X]E[X] + E[X]2
8.2
Momenty n´ ahodn´ e veliˇ ciny
Zobecnˇen´ım stˇredn´ı hodnoty a rozptylu jsou momenty. Ty se dˇel´ı na obecn´ e a centr´ aln´ı. D e f i n i c e 8.3 (Momenty) K-t´ y obecn´ y, resp., centr´aln´ı moment n´ahodn´e veliˇciny X definujeme vztahem µ0k = E[X k ],
resp., µk = E[(X − E[X])k ],
pro
k = 1, 2, . . .
(37)
Koment´ aˇ r k definici 1. Z pohledu moment˚ u je stˇ redn´ı hodnota prvn´ım obecn´ ym a rozptyl druh´ ym centr´ aln´ım momentem. Pro v´ ypoˇcet moment˚ u je uˇziteˇcn´a tzv. momentov´ a funkce. D e f i n i c e 8.4 (Momentov´ a funkce) Pro n´ahodnou veliˇcinu X definujeme momentovou funkci vztahem mX (z) = E[ezX ] Pomoc´ı momentov´e funkce lze poˇc´ıtat obecn´e momenty podle n´asleduj´ıc´ıho tvrzen´ı.
42
(38)
T v r z e n´ı 8.1 (V´ ypoˇ cet moment˚ u pomoc´ı momentov´ e funkce) Jestliˇze mX (z) je momentov´a funkce n´ahodn´e veliˇciny X, pak k-t´ y obecn´ y moment X urˇc´ıme takto • momentovou funkci k-kr´at derivujeme podle promˇenn´e z, • v derivaci poloˇz´ıme z = 0. Je tedy "
µ0k
#
∂k = mX (z) ∂z k
.
(39)
z=0
O v ˇe ˇr e n´ı: Podle definice je (pro spojitou nv s oborem hodnot X ∗ - s diskr´etn´ı je to obdobn´e) h
mX (z) = E e
zX
i
Z
=
X∗
ez x f (x)dx.
Derivace k-t´eho ˇr´ adu podle z je ∂k mX (z) = ∂z k
Z X∗
xk ez x f (x)dx,
a pro z = 0 dost´ av´ ame "
#
∂k mX (z) ∂z k
Z
= z=0
X∗
xk f (x)dx = µ0k .
Koment´ aˇ r k tvrzen´ı 1. Druh´ y centr´aln´ı moment (rozptyl) lze vypoˇc´ıtat z obecn´eho pomoc´ı v´ ypoˇcetn´ıho vzorce pro rozptyl D[X] = µ02 − (µ01 )2 . ˇ ´ı k l a d: Pomoc´ı momentov´e funkce urˇcete stˇredn´ı hodnotu rozdˇelen´ı s pravdˇepodobnostn´ı funkc´ı Pr f (x), zadanou tabulkou x f (x)
1 0.5
2 0.3
3 0.2 ♦
Podle definice je mX (z) =
3 X
ezx f (x) = ez 0.5 + e2z 0.3 + e3z 0.2
x=1
Derivace podle z je
∂ 0 ∂z mX (z)
= ez 0.5 + 2e2z 0.3 + 3e3z 0.2 a pro z = 0 dostaneme
E[X] = µ01 = 0.5 + 2 · 0.3 + 3 · 0.2 = 1.7. To odpov´ıd´a stˇredn´ı hodnotˇe, vypoˇcten´e podle definice.
43
8.3
Kvantil spojit´ e n´ ahodn´ e veliˇ ciny
D e f i n i c e 8.5 (Kvantil) Kvantilem spojit´e n´ahodn´e veliˇciny X nazveme ˇc´ıslo ζα , pro kter´e plat´ı P (X ≤ ζα ) = F (ζα ) = α.
(40)
Koment´ aˇ r k definici ˇ 1. Casto (zvl´aˇstˇe v americk´e literatuˇre) se m´ısto pojmu kvantil zav´ad´ı pojem kritick´ a hodnota zα pro kter´ y plat´ı zα = 1 − ζα . Je definov´an jako ˇc´ıslo zα , pro kter´e plat´ı P (X > zα ) = α. 2. Pro diskr´etn´ı nv je kvantil definov´an jako ˇc´ıslo ζα , F (ζα ) ≤ α ∧ F (ζα + 0) ≥ α, kde v´ yraz ζα + 0 znaˇc´ı limitu zprava.
pro
kter´e
plat´ı
3. Kvantily nebo kritick´e hodnoty hled´ame v tabulk´ach. Pokud je k dispozici poˇc´ıtaˇc s nˇejak´ ym statistick´ ym programem, lze je vˇetˇsinou urˇcit v tomto programu. ˇ ´ı k l a d: Pr
Uvaˇzujme spojit´e rozdˇelen´ı s hustotou pravdˇepodobnosti f (x) = e−x
pro
x≥0
a
0
jinde. ♦
Urˇcete α procentn´ı kvantil tohoto rozdˇelen´ı. Podle definice je Z
ζα
e−x dx = 1 − e−ζα = α.
0
Odtud ζα = − ln(1 − α). Pro α = 0.05 bude ζ0.05 = 0.051.
8.4
Charakteristiky v´ıce n´ ahodn´ ych veliˇ cin
Podobnˇe, jako pro skal´arn´ı n´ahodnou veliˇcinu, zavedeme i pro n´ahodn´ y vektor nˇekter´e jeho ˇc´ıseln´e (maticov´e) charakteristiky, jako jejich sice ne´ upln´ y, ale zato jednoduch´ y popis. Ty nejz´akladnˇejˇs´ı jsou vektorov´a stˇ redn´ı hodnota a kovarianˇ cn´ı matice. Neˇz pˇrejdeme k jejich definici, zavedeme urˇcit´e pojmy, souvisej´ıc´ı se skal´arn´ı n´ahodnou veliˇcinou.
´ pojmy • • Pomocne Nejprve zobecn´ıme pojem stˇredn´ı hodnoty n´ahodn´e veliˇciny (34) a budeme definovat stˇredn´ı hodnotu funkce h(X) n´ahodn´e veliˇciny X. D e f i n i c e 8.6 (Stˇ redn´ı hodnota funkce) Uvaˇzujeme funkci h(X) n´ahodn´e veliˇciny X s pravdˇepodobnostn´ı funkc´ı, resp., hustotou pravdˇepodobnosti f (x). Stˇ redn´ı hodnotu t´eto funkce definujeme E[h(X)] =
n X
Z
h(xi )f (xi ),
resp.,
i=1
44
E[h(X)] =
X∗
h(x)f (x)dx.
(41)
Koment´ aˇ r k definici 1. Definice je prakticky stejn´a jako pro n´ahodnou veliˇcinu, jen s t´ım rozd´ılem, ˇze m´ısto x dosad´ıme celou funkci h(x). Tuto definici jsme jiˇz ”intuitivnˇe” pouˇz´ıvali, napˇr. pˇri definici rozptylu (35) nebo pˇri n´asledn´em odvozen´ı vzorc˚ u pro oper´atorov´ y poˇcet se stˇredn´ı hodnotou. ˇ ´ı k l a d: Pr
Pro line´arn´ı funkci Y = aX + b je stˇredn´ı hodnota Z
E[Y ] =
Z
X∗
(ax + b)f (x)dx = a
X∗
xf (x)dx + b = aE[X] + b,
coˇz je pˇresnˇe ve shodˇe s odvozen´ymi pravidly oper´atorov´eho poˇctu se stˇredn´ı hodnotou. D´ale si vˇsimneme speci´aln´ı funkce hi n´ahodn´eho vektoru X, kter´a tento vektor zobrazuje na jeho i-tou sloˇzku, tedy h(X) = Xi , a urˇc´ıme jej´ı stˇredn´ı hodnotu. T v r z e n´ı 8.2 (Stˇ redn´ı hodnota z prvku vektoru) Uvaˇzujme n-sloˇzkov´ y n´ahodn´ y vektor X a jeho r-tou sloˇzku Xr . Hustota pravdˇepodobnosti (hp) n´ahodn´eho vektoru je f (x1 , x2 , . . . , xn ) a f (xr ) je margin´aln´ı hp, kterou jsme dostali integrac´ı sdruˇzen´e hp pˇres vˇsechny sloˇzky n´ahodn´eho vektoru kromˇe r-t´e sloˇzky Xr . Potom pro stˇredn´ı hodnotu z Xr plat´ı Z
E[Xr ] =
Z
X1∗
X2∗
Z
Z
...
Xn∗
xr f (x1 , x2 , . . . , xn )dx1 dx2 . . . dxn =
Xr∗
xr f (xr )dxr = µr ,
kde hvˇezdiˇckou znaˇc´ıme obory hodnot jednotliv´ ych sloˇzek n´ahodn´eho vektoru.
O v ˇe ˇr e n´ı: Tento vztah plyne pˇr´ımo z definice margin´ aln´ı hp. Stˇredn´ı hodnota prvku vektoru pˇres cel´ y n´ahodn´ y vektor se tedy poˇc´ıt´a jako ”obyˇcejn´a” jednorozmˇern´a stˇredn´ı hodnota pˇres tento prvek. Odvozenou vlastnost d´ale pouˇzijeme jako motivaci pro definici stˇredn´ı hodnoty n´ahodn´eho vektoru. Dalˇs´ım d˚ uleˇzit´ ym pojmem, kter´ y vyhodnocuje vz´ajemn´ y vztah dvou n´ahodn´ ych veliˇcin, je kovariance. D e f i n i c e 8.7 (Kovariance dvou n´ ahodn´ ych veliˇ cin) Pro n´ahodn´e veliˇciny X a Y , popsan´e sdruˇzenou hustotou pravdˇepodobnosti f (x, y), definujeme kovarianci cov(X, Y ) vztahem cov(X, Y ) = E[(X − E[X])(Y − E[Y ])]. Koment´ aˇ r k definici 1. Pro X = Y kovariance pˇrech´az´ı na rozptyl. 2. V oper´atorov´em vyj´adˇren´ı charakteristik snadno odvod´ıme vzorec cov(X, Y ) = E[XY ] − E[X]E[Y ].
45
(42)
´hodny ´ch vektor˚ • Charakteristiky na u• D e f i n i c e 8.8 (Stˇ redn´ı hodnota n´ ahodn´ eho vektoru) Stˇ redn´ı hodnotu n´ahodn´eho vektoru definujeme jako vektor stˇredn´ıch hodnot jeho jednotliv´ ych sloˇzek, tj. E[X ] = (E[X1 ], E[X2 ], . . . , E[Xn ])0 , (43) kde X = (X1 , X2 , . . . , Xn )0 je n´ahodn´ y vektor. Koment´ aˇ r k definici 1. Motivac´ı k t´eto definici je Tvrzen´ı 8.2. ˇ ´ı k l a d: Sledujeme-li intenzitu dopravn´ıho proudu na pˇeti mˇeˇren´ych m´ıstech dopravn´ı s´ıtˇe (tj. Pr sledujeme pˇetirozmˇern´y n´ahodn´y vektor intenzit), pak stˇredn´ı hodnotou tohoto n´ahodn´eho vektoru bude vektor,jehoˇz sloˇzky budou stˇredn´ı hodnoty jednotliv´ych intenzit. D e f i n i c e 8.9 (Kovarianˇ cn´ı matice n´ ahodn´ eho vektoru) Pro n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn ) definujeme kovarianˇcn´ı matici C[X ] takto
C[X ] =
D[X1 ] cov(X1 , X2 ) cov(X2 , X1 ) D[X2 ] ... ... cov(Xn , X1 ) cov(Xn , X2 )
. . . cov(X1 , Xn ) . . . cov(X2 , Xn ) ... ... ... D[Xn ]
.
(44)
Koment´ aˇ r k definici 1. Kovarianˇcn´ı matice je symetrick´a a pozitivnˇe definitn´ı. 2. Ve vektorov´em z´apisu (se sloupcov´ ym vektorem X) lze kovarianˇcn´ı matici ps´at takto C[X ] = E[(X − E[X ])(X − E[X ])0 ] = E[X X 0 ] − E[X ]E[X ]0 .
(45)
Prvn´ı vztah plyne z definice n´asoben´ı vektor˚ u ve tvaru sloupce a ˇr´adky, druh´ y je obdobou zn´am´eho v´ ypoˇcetn´ıho tvaru pro rozptyl (36). 3. Podobnˇe jako kovarianˇcn´ı matici pro jeden n´ahodn´ y vektor (coˇz lze povaˇzovat za obdobu rozptylu) lze definovat i vz´ ajemnou kovarianˇ cn´ı matici (jako obdobu kovariance) vztahem Cov(X , Y ) = E[(X − E[X ])(Y − E[Y ])0 ]. (46) ˇ ´ı k l a d: Dvourozmˇern´e diskr´etn´ı rozdˇelen´ı n´ahodn´eho vektoru X = (x1 , x2 ), pro X1 = 0, 1 a Pr X2 = 0, 1, 2, lze zapsat pomoc´ı pravdˇepodobnostn´ı funkce v formˇe tabulky f (x1 , x2 ) x1 = 0 x1 = 1
x2 = 0 0.42 0.28
46
x2 = 1 0.12 0.08
x2 = 2 0.06 0.04
♦
Urˇcete stˇredn´ı hodnotu a kovarianˇcn´ı matici tohoto n´ahodn´eho vektoru.
Pro urˇcen´ı stˇredn´ı hodnoty budeme poˇc´ıtat stˇredn´ı hodnoty jednotliv´ych sloˇzek n´ahodn´eho vektoru. Proto potˇrebujeme margin´aln´ı pravdˇepodobnostn´ı funkce. Ty dostaneme ”vysˇc´ıt´an´ım” pravdˇepodobnostn´ı funkce pˇres sloupce a ˇr´adky f (x1 ) = (0.6, 0.4) a f (x2 ) = (0.7, 0.2, 0.1). a stˇredn´ı hodnoty jsou E[X1 ] = 0 × 0.6 + 1 × 0.4 = 0.4 a obdobnˇe E[X2 ] = 0.4 Stˇredn´ı hodnota n´ahodn´eho vektoru je tedy E[X] = (0.4, 0.4)0 . Pro urˇcen´ı kovarianˇcn´ı matice potˇrebujeme urˇcit rozptyly a kovariance jednotliv´ych sloˇzek n´ahodn´eho vektoru. Rozptyly urˇc´ıme opˇet z margin´aln´ıch rozloˇzen´ı D[X1 ] = (0 − 0.4)2 0.6 + (1 − 0.4)2 0.4 = 0.24,
D[X2 ] = 0.44
Kovariance cov(X1 , X2 ) =
XX
(x1 − E[X1 ])(x2 − E[X2 ])f (x1 , x2 ) =
x1 x2
= (0 − 0.4)(0 − 0.4)0.42 + (0 − 0.4)(1 − 0.4)0.12 + (0 − 0.4)(2 − 0.4)0.06+ +(1 − 0.4)(0 − 0.4)0.28 + (1 − 0.4)(1 − 0.4)0.08 + (1 − 0.4)(2 − 0.4)0.04 = 0 Kovarianˇcn´ı matice je tedy "
Cov =
ˇ ´ı k l a d: Pr
0.24 0 0 0.44
#
Uvaˇzujme spojit´y n´ahodn´y vektor X = (X1 , X2 ) s hustotou pravdˇepodobnosti 2 f (x) = (x1 + 2x2 ) 3
pro
x1 , x2 ∈ (0, 1),
jinak
0. ♦
Urˇcete stˇredn´ı hodnotu a kovarianˇcn´ı matici. Margin´aln´ı hustoty pravdˇepodobnost´ı jsou Z
1
f (x1 ) = 0
2 f (x)dx2 = (x1 + 1) 3
1
Z
a f (x2 ) = 0
1 f (x)dx1 = (1 + 4x2 ) 3
pro x1 , x2 ∈ (0, 1) jinak 0. Stˇredn´ı hodnoty Z
E[X1 ] =
1
x1 f (x1 )dx1 = 0
10 18
Z
a
E[X2 ] =
x2 f (x2 )dx2 = 0
47
1
11 . 18
Rozptyly Z
D[X1 ] = 0
1
13 (x1 − E[X1 ]) f (x1 )dx1 = 162
Z
2
Kovariance Z
1Z 1
cov(X1 , X2 ) = 0
Z
1Z 1
= 0
0
a D[X2 ] =
1
(x2 − E[X2 ])2 f (x2 )dx2 = −
0
(x1 − E[X1 ])(x2 − E[X2 ])f (x1 , x2 )dx1 dx2 =
0
10 x1 − 18
11 x2 − 18
Sami doma a porovnat mezi sebou.
48
2 (x1 + 2x2 )dx1 dx2 3
19 972
9
Poˇ c´ıt´ an´ı charakteristik n´ ahodn´ eho vektoru
ˇ ´ı k l a d 1: Pr f (x1 , x2 ) =
1 (x1 + x2 + 1) pro x1 = 0, 1, 2; 15
x2 = 0, 1
ˇ sen´ı: Reˇ Margin´aln´ı hustoty: f (x1 , x2 ) x1 = 0
x2 = 0
x2 = 1
f (x1 )
1 15 2 15 3 15 2 5
2 15 3 15 4 15 3 5
1 5 1 3 7 15
x2 = 1 x3 = 2 f (x2 )
1
Stˇredn´ı hodnota: 1 1 7 19 4 +1· +2· = =1 5 3 15 15 5 2 3 3 E(x2 ) = 0 · + 1 · = 5 5 5
E(x1 ) = 0 ·
Rozptyl: 19 2 1 19 1 19 7 134 ) + (1 − )2 + (2 − )2 = 15 5 15 3 15 15 225 3 23 24 3 22 D(x2 ) = (0 − ) + (1 − ) = 5 5 5 5 125
D(x1 ) = (0 −
Kovariance: 19 )(0 − 15 19 + (1 − )(0 − 15 19 + (2 − )(0 − 15
cov(x1 , x2 ) = (0 −
3 1 19 ) + (0 − )(1 − 5 15 15 3 2 19 ) + (1 − )(1 − 5 15 15 3 3 19 ) + (2 − )(1 − 5 15 15
3 2 ) + 5 15 3 3 ) + 5 15 3 4 2 ) =− 5 15 75
Kovarianˇcn´ı matice: "
C=
134 225 2 − 75
49
2 − 75 24 125
#
(47)
ˇ ´ı k l a d 2: Pr
1 f (x1 , x2 ) = x1 x2 4
pro x1 , x2 ∈ (0, 1)
ˇ sen´ı: Reˇ Margin´aln´ı hustoty: 1
Z
f (x1 ) = 0
f (x2 ) =
1 1 x1 x2 dx2 = x1 x22 4 8
1 0
1 = x1 8
1 x2 8
Stˇredn´ı hodnota:
Z
1
E(x1 ) = 0
E(x2 ) =
1 1 3 x1 x1 dx2 = x 8 24 1
1
= 0
1 24
1 24
Rozptyl:
Z
1
D(x1 ) = 0
D(x2 ) =
1 21 1 1 4 1 1 ) x1 dx2 = x1 − x31 + x2 24 8 8 4 36 2 · 242 1
(x1 −
1
= 0
257 1152
257 1152
Kovariance:
cov(x1 , x2 ) = =
1Z 1
1 1 1 )(x2 − ) x1 x2 dx1 x2 = 24 24 4 0 0 Z 1 1 1 1 3 1 2 1 1 5 2 25 x1 (x1 − ) x2 − x2 dx1 = = 4 0 24 3 48 4 16 1024 0
Z
(x1 −
Kovarianˇcn´ı matice: "
C=
257 1152 25 1024
50
25 1024 257 1152
#
(48)
ˇ ´ı k l a d 3: Pr f (x1 , x2 ) = x1 + x2
pro x1 , x2 ∈ (0, 1)
ˇ sen´ı: Reˇ Margin´aln´ı hustoty: 1
1 (x1 + x2 )dx2 = x1 x2 + x22 f (x1 ) = 2 0 1 f (x2 ) = x2 + 2 Z
1
= x1 + 0
1 2
Stˇredn´ı hodnota: 1
Z
E(x1 ) = 0
E(x2 ) =
1 1 1 x1 (x1 + )dx1 = x31 + x21 2 3 4
1
= 0
7 12
7 12
Rozptyl:
Z
1
D(x1 ) = 0
D(x2 ) =
7 1 1 2 35 2 49 (x1 − )2 (x1 + )dx1 = x41 − x31 − x + x1 12 2 4 9 288 1 288
1
= 0
3 16
3 16
Kovariance: 1Z 1
7 7 )(x2 − )(x1 + x2 )dx1 dx2 = 12 12 0 0 1 Z 1 7 1 1 7 7 = (x1 − ) x32 + x22 x1 − − x1 x2 dx1 = 12 3 2 12 12 0 0 1 1 3 13 2 7 1 = − x1 + x − x1 = − 36 288 1 288 144 0 Z
cov(x1 , x2 ) =
(x1 −
(49)
Kovarianˇcn´ı matice: "
C=
3 16 1 − 144
51
1 − 144 3 16
#
(50)
ˇ ´ı k l a d 4: Pr
f (x1 , x2 ) = e−x1 −x2
pro x1 , x2 ∈ (0, ∞)
ˇ sen´ı: Reˇ Margin´aln´ı hustoty: ∞
Z
e−x1 −x2 dx2 = e−x1 −e−x2
f (x1 ) = 0 −x2
∞ 0
= e−x1
f (x2 ) = e Stˇredn´ı hodnota: ∞
Z
E(x1 ) = 0
=
−e−x1
∞ 0
∞ u0 = 1 = −x1 e−x1 0 + −x 1 v = −e
u = x1 v 0 = e−x1
x1 e−x1 dx1 =
∞
Z
e−x1 dx1 =
0
=1
E(x2 ) = 1 Rozptyl: ∞
Z
D(x1 ) =
(x1 − 1)2 e−x1 dx1 =
Z 0
0 ∞
Z
= 0
=
h
∞
u = x21 v 0 = e−x1
x21 e−x1 dx1 − 1 =
−x21 e−x1
i∞ 0
∞
Z
+2
x21 e−x1 dx1 − 2
∞
Z
x1 e−x1 dx1 +
Z
∞
e−x1 dx1 =
0
0
u0
= 2x1 v = −e−x1
x1 e−x1 dx1 − 1 = 1
0
D(x2 ) = 1 Kovariance: Z
∞Z ∞
(x1 − 1)(x2 − 1)e−x1 −x2 dx1 dx2 =
cov(x1 , x2 ) = 0
Z
0
∞
−x1
(x1 − 1)e
=
∞
Z
dx1
0
(x2 − 1)e−x2 dx2 =
0
Z
=
∞
−x
xe
dx −
0
Z
∞
−x
e
2
dx
=0
0
Kovarianˇcn´ı matice: "
C=
1
0
0
1
52
#
(51)
ˇ ´ı k l a d 5: Pr f (x1 , x2 ) = (a − 1)(a − 2)(1 + x1 + x2 )−a
pro x1 , x2 ∈ (0, ∞), a > 3
ˇ sen´ı: Reˇ Margin´aln´ı hustoty: Z
f (x1 ) =
∞
(a − 1)(a − 2)(1 + x1 + x2 )−a dx2 = (a − 1)(a − 2)
0
1 (1 + x1 )1−a = (a − 2)(1 + x1 )1−a a−1 f (x2 ) = (a − 2)(1 + x2 )1−a = (a − 1)(a − 2)
53
1 (1 + x1 + x2 )1−a 1−a
∞
= 0
10
Funkce n´ ahodn´ eho vektoru
V praxi se ˇcasto setk´av´ame s urˇcit´ ymi funkcemi n´ahodn´e veliˇciny. ˇ ´ı k l a d: Opakovanˇe mˇeˇr´ıme konstantn´ı vzd´alenost a a mˇeˇr´ıc´ı pˇr´ıstroj je zat´ıˇzen n´ahodnou chybou Pr E. Pak mˇeˇren´y sign´al je Y = a + E, a tedy je funkc´ı n´ahodn´e veliˇciny E. Zaj´ım´a n´as rozdˇelen´ı (hustota pravdˇepodobnosti) funkce Y , jestliˇze zn´ame rozdˇelen´ı (hustotu pravdˇepodobnosti) argumentu funkce, tj. n´ahodn´e veliˇciny E.
10.1
Funkce n´ ahodn´ e veliˇ ciny
D e f i n i c e 10.1 (Funkce n´ ahodn´ e veliˇ ciny) Je-li X n´ahodn´a veliˇcina, pak n´ahodn´a veliˇcina Y definovan´a Y = h(X) se naz´ yv´a funkc´ı n´ahodn´e veliˇciny X. Koment´ aˇ r k definici 1. Zaveden´ı funkce n´ahodn´e veliˇciny je pr´avˇe to, co pˇrisp´ıv´a k moˇznosti praktick´eho vyuˇzit´ı pravdˇepodobnosti. V praxi totiˇz ˇcasto analyzujeme urˇcit´e (deterministick´e) vztahy, ve kter´ ych jsou nˇekter´e veliˇciny neurˇcit´e (napˇr. ovlivnˇen´e poruchou). Pracujeme tedy s funkc´ı n´ahodn´e veliˇciny. ˇ ´ı k l a d 1: Uvaˇzujme opˇet mˇeˇren´ı d´elky a. N´ahodnou veliˇcinou bude chyba mˇeˇren´ı E a jej´ı funkc´ı Pr Y bude tat´aˇz chyba, ale vyj´adˇren´a v jin´ych jednotk´ach, tedy Y = kE. Nav´ıc pˇredpokl´adejme, ˇze chybu E zaokrouhlujeme tak, ˇze m˚ uˇze nab´yvat jen koneˇcn´eho poˇctu hodnot. Ty oznaˇc´ıme −2, −1, 0, 1, 2. V´ıme, ˇze pravdˇepodobnosti tˇechto hodnot (tj. pravdˇepodobnostn´ı funkce E) je d´ana tabulkou e fE (e)
−2 0.1
−1 0.1
0 0.5
1 0.2
2 0.1 ♦
Jak´a bude pravdˇepodobnostn´ı funkce n´ahodn´e veliˇciny Y ?
Protoˇze transformaˇcn´ı funkce je vz´ajemnˇe jednoznaˇcn´a, je odpovˇed’ velmi jednoduch´a. Pravdˇepodobnosti jednotliv´ych v´ysledk˚ u se samozˇrejmˇe nezmˇen´ı, at’ je vyj´adˇr´ıme jakkoli (v centimetrech, metrech nebo kilometrech). Nov´e vyj´adˇren´ı v´ysledk˚ u z´ısk´ame z transformaˇcn´ı funkce: y = kx. Dosad´ıme do pˇredchoz´ı tabulky, pravdˇepodobnosti ponech´ame a nov´a pravdˇepodobnostn´ı funkce n´ahodn´e veliˇciny Y je y fY (y)
−2k 0.1
−k 0.1
54
0 0.5
k 0.2
2k 0.1
ˇ ´ı k l a d 2: Uvaˇzujme d´ale pˇredchoz´ı pˇr´ıklad, ale jako funkci chyby E vezmeme jej´ı absolutn´ı Pr odchylku Y = |E|. ♦ Protoˇze tato funkce nen´ı prost´a, je situace sloˇzitˇejˇs´ı. Nejprve je tˇreba urˇcit moˇzn´e realizace nov´e n´ahodn´e veliˇciny Y a zjistit, kter´e realizace mohou nastat v´ıce zp˚ usoby. Jejich pravdˇepodobnosti je tˇreba seˇc´ıst. Zjevnˇe plat´ı Y = 0, 1, 2, pˇriˇcemˇz hodnota 1 vznikla z hodnot -1 a 1; hodnota 2 z hodnot -2 a 2. V´ysledn´a tabulka pravdˇepodobnostn´ı funkce Y bude y fY (y)
0 0.5
1 0.3
2 0.2,
kde 0.3 = 0.1 + 0.2 a 0.2 = 0.1 + 0.1 z p˚ uvodn´ı tabulky. To, co jsme nyn´ı naznaˇcili na pˇr´ıkladech pro diskr´etn´ı n´ahodnou veliˇcinu, pro kterou je situace jednoduch´a, upˇresn´ıme d´ale pro spojitou n´ahodnou veliˇcinu. T v r z e n´ı 10.1 (Transformace hustoty pravdˇ epodobnosti) Je-li X spojit´a n´ahodn´a veliˇcina s realizacemi x a s hustotou pravdˇepodobnosti fX (x) a y = h(x) je ryze monot´onn´ı funkce (tj. bud’ rostouc´ı nebo klesaj´ıc´ı), m´a n´ahodn´a veliˇcina Y definovan´ a Y = h(X) hustotu pravdˇepodobnosti fY (y) urˇcenou vztahem fY (y) = fX [h
−1
dh−1 (y) (y)] , dy
(52)
kde h−1 (y) je funkce inverzn´ı k funkci y = h(x).
O v ˇe ˇr e n´ı: Pro rostouc´ı funkci h je distribuˇcn´ı funkce FY (y) FY (y) = P (Y ≤ y) = P (h(X) ≤ y) = P (X ≤ h−1 (y)) = FX (h−1 (y)) a hustota pravdˇepodobnosti fY (y) je fY (y) =
dFY (y) dFX (h−1 (y)) dh−1 (y) = = fX (h−1 (y)) dy dy dy
Pro klesaj´ıc´ı funkci h plat´ı FY (y) = 1 − P (Y ≤ y) = 1 − P (h(X) ≤ y) = 1 − P (X ≤ h−1 (y)) = 1 − FX (h−1 (y)) a hustota pravdˇepodobnosti je fY (y) = −fX (h−1 (y))
dh−1 (y) dy
Protoˇze derivace rostouc´ı funkce je kladn´ a a pro klesaj´ıc´ı funkci z´ aporn´ a, lze oba pˇr´ıpady vyj´ adˇrit pomoc´ı absolutn´ı hodnoty tak, jak jsme uvedli v (52). Koment´ aˇ r ke tvrzen´ı 10.1
55
1. Uveden´e tvrzen´ı plat´ı pro pˇr´ıpad spojit´ e n´ ahodn´ e veliˇ ciny , kdy transformaˇcn´ı funkce h je skal´ arn´ı funkc´ı skal´ arn´ıho argumentu a je na cel´em sv´em definiˇcn´ım oboru monot´ onn´ı. 2. Pˇr´ıpad diskr´etn´ı n´ahodn´e veliˇciny lze ˇreˇsit jednoduˇse podle z´akladn´ıch definiˇcn´ıch vzorc˚ u. Postup je patrn´ y z pˇredchoz´ıho pˇr´ıkladu. 3. V pˇr´ıpadˇe, kdy funkce h nen´ı monot´onn´ı, je situace komplikovanˇejˇs´ı. Pro transformovanou distribuˇcn´ı funkci FY (y) potom plat´ı FY (y) =
X
P (X ∈ Ij ) =
XZ
j
fX (x)dx,
Ij
j
kde Ij oznaˇcuje j-t´ y interval na ose x, pro kter´ y plat´ı h(x) ≤ y. Hustotu pravdˇepodobnosti fY (y) dostaneme opˇet derivac´ı distribuˇcn´ı funkce FY (y). (Pˇr´ıklad n´asleduje.) 4. O pˇr´ıpadu, kdy h je (vektorovou) funkc´ı v´ıce promˇenn´ ych, se zm´ın´ıme pozdˇeji. ˇ ´ı k l a d: Pro transformaˇcn´ı funkci Y = X 2 a zvolen´e y dostaneme pr´avˇe jeden interval I, pro Pr √ √ kter´y plat´ı x2 ≤ y. Tento interval je I = h− y, yi. Pro distribuˇcn´ı funkci FY (y) a y > 0 plat´ı √ √ FY (y) = P (Y ≤ y) = P (X ∈ h− y, yi) = Z
=
√
y
√
− y
Z
fX (x)dx =
√
y
−∞
fX (x)dx −
Z
√ − y
−∞
√ √ fX (x)dx = FX ( y) − FX (− y),
pro y ≤ 0 je FY (y) = 0. Hustotu pravdˇepodobnosti dostaneme derivac´ı distribuˇcn´ı funkce fY (y) =
dFY (y) 1 √ √ = √ [fX ( y) + fX (− y)] , dy 2 y
pro y > 0 a fY (y) = 0, pro y ≤ 0.
Pˇ r´ıklady ˇ ´ı k l a d 1: Uvaˇzujeme diskr´etn´ı n´ahodnou veliˇcinu X s hodnotami xi = i π2 pro i = 1, 2, . . . , 10. Pr Pravdˇepodobnostn´ı funkce fX (x) pˇriˇrazuje tˇemto hodnot´am pravdˇepodobnosti fX (xi ) = (11 − i)/55. Urˇcete pravdˇepodobnostn´ı funkci fY (y), jestliˇze Y = sin(X). ♦ 2 π2
3 π2
4 π2
5 π2
6 π2
7 π2
8 π2
9 π2
10 π2
fX (x)
π 2 10 55
9 55
8 55
7 55
6 55
5 55
4 55
3 55
2 55
1 55
y = sin(x)
1
0
-1
0
1
0
-1
0
1
0
x
Odtud plyne y ∈ {−1, 0, 1} a fY (−1) =
8 4 12 + = , 55 55 55
fY (0) =
9 7 5 3 1 5 + + + + = , 55 55 55 55 55 11
fY (1) =
10 6 2 18 + + = . 55 55 55 55
56
ˇ ´ı k l a d 2: Uvaˇzujme spojitou n´ahodnou veliˇcinu X s hustotou pravdˇepodobnosti fX (x) a jej´ı Pr transformaci Y = aX + b, a, b konstanty, a 6= 0. ♦
Urˇcete hustotu pravdˇepodobnosti fY (y). Funkce je monot´onn´ı, inverzn´ı funkce je x =
y−b a ,
a jej´ı derivace a1 . Tedy plat´ı
1 fX fY (y) = |a|
y−b a
ˇ ´ı k l a d 3: N´ahodn´a veliˇcina X m´a hustotu pravdˇepodobnosti fX (x) = 1/3 pro x ∈ (−1, 2) a Pr jinde rovnu nule. Napiˇste distribuˇcn´ı funkci a hustotu pravdˇepodobnosti n´ahodn´e veliˇciny Y = |X|. ♦ Transformaˇcn´ı funkce nen´ı monot´onn´ı, proto nelze pˇr´ımo pouˇz´ıt vzorec (52). Budeme postupovat podle pozn´amky 3 k tomuto vzorci. Pro dan´e y ≥ 0 hled´ame intervaly Ij hodnot x, pro kter´e plat´ı h(x) ≤ y tj. |x| ≤ y. Takov´y interval je jedin´y: I = {x : x ∈ (−y, y)}. Podle zm´ınˇen´e pozn´amky je: FY (y) = P (X ∈ (−y, y)) =
y
Z
−∞
fX (x)dx −
Z
−y
−∞
fX (x)dx
Po dosazen´ı konkr´etn´ı hustoty pravdˇepodobnosti a integraci po ˇc´astech dostaneme
FY (y) =
0 2y 3
pro y < 0 pro y ∈ h0, 1)
1 3 (y
pro y ∈ h1, 2)
+ 1)
pro y ≥ 2
1
Hustotu pravdˇepodobnosti dostaneme derivac´ı
fX (x) =
0 2
pro y < 0
pro y ∈ h1, 2)
3 1 3
0
pro y ∈ h0, 1)
pro y ≥ 2
ˇ ´ı k l a d 4: Uvaˇzujme spojitou n´ahodnou veliˇcinu X s hustotou pravdˇepodobnosti fX (x) = 1/π Pr pro x ∈ (−π/2, π/2), jinde nula. Najdˇete hustotu pravdˇepodobnosti n´ahodn´e veliˇciny Y = tg(X). ♦ Funkce je monot´onn´ı na x ∈ (−π/2, π/2) a jej´ı obor hodnot je y ∈ R. Inverzn´ı funkce je x = h−1 (y) = −1 arctg(y) a jej´ı derivace x0 = dhdy(y) = 1/(1 + y 2 ). Hledan´a hustota pravdˇepodobnosti bude fY (y) = fX (x) |x0 | =
57
1 1 . π 1 + y2
10.2
Funkce n´ ahodn´ eho vektoru
Tak, jako pro jednu n´ahodnou veliˇcinu, budeme uvaˇzovat funkci n´ahodn´eho vektoru. Nejprve budeme uvaˇzovat skal´arn´ı funkci vektorov´eho argumentu. D e f i n i c e 10.2 (Funkce v´ıce n´ ahodn´ ych veliˇ cin) Jsou-li X1 , X2 , . . . , Xn n´ahodn´e veliˇciny, pak n´ahodn´a veliˇcina Y definovan´a Y = h(X1 , X2 , . . . , Xn ) se naz´ yv´a funkc´ı n´ahodn´ ych veliˇcin X1 , X2 , . . . , Xn . Koment´ aˇ r k definici 1. Definovali jsme skal´arn´ı funkci vektorov´eho argumentu. Pokud by n´ahodn´a veliˇcina Y byla rovnˇeˇz vektor, stejnˇe bychom mohli definovat i vektorovou funkci. ˇ ´ı k l a d: Sledujme pokus ”hod kostkou” s n´ahodnou veliˇcinou ”poˇcet bod˚ Pr u”. Budeme uvaˇzovat dva hody. V´ysledku prvn´ıho pˇriˇrad´ıme n´ahodnou veliˇcinu X1 a druh´emu X2 . N´ahodnou veliˇcinu Y definujeme Y = max(X1 , X2 ), tedy jako vˇetˇs´ı z obou padl´ych ˇc´ısel. ♦ N´ahodn´a veliˇcina Y m˚ uˇze tedy nab´yvat hodnot 1, 2, 3, 4, 5, 6. Pravdˇepodobnosti jednotliv´ych hodnot urˇc´ıme podle klasick´e definice. Vˇsech moˇzn´ych dvojic hodnot obou hod˚ u je 36. Pˇr´ızniv´e moˇznosti urˇc´ıme tak, ˇze v´ysledky hod˚ u uspoˇr´ad´ame do matice a v n´ı urˇc´ıme maxima 1 2 3 4 5 6
1 1 1 1 1 1
1 2 3 4 5 6
2 2 2 2 2 2
1 2 3 4 5 6
3 3 3 3 3 3
1 2 3 4 5 6
4 4 4 4 4 4
1 2 3 4 5 6
5 5 5 5 5 5
1 2 3 4 5 6
6 6 6 6 6 6
→
max
→
1 2 3 4 5 6
2 2 3 4 5 6
3 3 3 4 5 6
4 4 4 4 5 6
5 5 5 5 5 6
6 6 6 6 6 6
Odtud lze urˇcit tabulku pravdˇepodobnost´ı, tj. pravdˇepodobnostn´ı funkci n´ahodn´e veliˇciny Y x f (x)
1 1/36
2 3/36
3 5/36
4 7/36
5 9/36
6 . 11/36
Uveden´ y pˇr´ıklad pro diskr´etn´ı n´ahodn´e veliˇciny ukazuje podstatu vˇeci. D´ale se obr´ at´ıme k sloˇzitˇejˇs´ımu a ne tak pr˚ uhledn´emu pˇr´ıpadu spojit´ ych n´ahodn´ ych veliˇcin. T v r z e n´ı 10.2 (Transformace hustoty pravdˇ epodobnosti pro skal´ arn´ı funkci) Uvaˇzujeme n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 se sdruˇzenou hustotou pravdˇepodobnosti fX (x1 , x2 , . . . , xn ) a skal´arn´ı funkci tohoto n´ahodn´eho vektoru Y = h(X). Distribuˇcn´ı funkci FY (y) n´ahodn´e veliˇciny Y urˇc´ıme takto
FY (y) = P (Y ≤ y) =
Z Z
Z
...
fX (x1 , x2 , . . . , xn )dx1 dx2 . . . dxn .
h(x1 ,x2 ,...,xn )≤y
58
(53)
Integrace se prov´ad´ı pˇres vˇsechna x, pro kter´a plat´ı, ˇze kdyˇz je dosad´ıme do transformaˇcn´ı funkce h, dostaneme ˇc´ıslo menˇs´ı neˇz y, pro kter´e poˇc´ıt´ame distribuˇcn´ı funkci. Hustotu pravdˇepodobnosti fY (y) z´ısk´ame derivac´ı distribuˇcn´ı funkce podle y. O v ˇe ˇr e n´ı: Plyne pˇr´ımo z definice distribuˇcn´ı funkce a hustoty pravdˇepodobnosti. ˇ ´ı k l a d: Pr Uvaˇzujme hustotu pravdˇepodobnosti f (x1 , x2 ) dvourozmˇern´e n´ahodn´e veliˇciny X = (X1 , X2 ) a jej´ı funkci Y = X1 + X2 . Urˇcete distribuˇcn´ı funkci a hustotu pravdˇepodobnosti n´ahodn´e veliˇciny Y . ♦ Oblast integrace podle (53) je d´ana nerovnic´ı x1 + x2 ≤ y, kde x1 a x2 jsou promˇenn´e a y je konstanta. Jedn´a se tedy o polorovinu v rovinˇe x1 , x2 , leˇz´ıc´ı pod pˇr´ımkou se smˇernicovou rovnic´ı x2 = −x1 + y. Odtud plyne Z Z ∞
FY (y) =
−∞
y−x2
fX (x1 , x2 )dx1 dx2 .
−∞
Hustotu pravdˇepodobnosti z´ısk´ame derivac´ı podle y Z
fY (y) =
∞
−∞
fX (y − x, x)dx
Uvaˇzujme nyn´ı jeˇstˇe obdobu transformace hustoty pravdˇepodobnosti podle Tvrzen´ı 10.1, a to pro n-rozmˇernou funkci n n´ahodn´ ych veliˇcin. T v r z e n´ı 10.3 (Transformace hustoty pravdˇ epodobnosti pro n funkc´ı n promˇ enn´ ych) Uvaˇzujeme n´ahodn´ y vektor X = (X1 , X2 , . . . , Xn )0 se sdruˇzenou hustotou pravdˇepodobnosti fX (x1 , x2 , . . . , xn ) a n-rozmˇernou, vz´ajemnˇe jednoznaˇcnou vektorovou funkci tohoto n´ahodn´eho vektoru Y = h(X) = [h1 (X), h2 (X), . . . , hn (X)]. Hustotu pravdˇepodobnosti fY (y) = fY (y1 , y2 , . . . , yn ) n-rozmˇern´e n´ahodn´e veliˇciny Y urˇc´ıme takto −1 −1 fY (y) = fX (h−1 1 (y), h2 (y), . . . , hn (y))|J|,
(54)
kde h−1 c´ı funkce inverzn´ı k funkc´ım hi a |J| je Jakobi´an inverzn´ı transformaˇcn´ı i , i = 1, 2, . . . , n znaˇ funkce h, tj. ∂h−1 ∂y1 1 J = . . . ∂h−1 n ∂y1
∂h−1 1 ∂y2
... ∂h−1 n ∂y2
... ... ...
∂h−1 1 ∂yn
. . . ∂h−1 n
nebo
∂h 1 ∂x1 1 = ... ∂hn J ∂x1
∂yn
∂h1 ∂x2
... ∂hn ∂x2
... ... ...
∂h1 ∂xn
... ∂hn ∂xn
O v ˇe ˇr e n´ı: Vzorec plyne z (52) a vˇety o transformaci v´ıcerozmˇern´eho integr´ alu. ˇ ´ı k l a d: Uvaˇzujme dvourozmˇern´e n´ahodn´e vektory X = [X1 , X2 ] a Y = [Y1 , Y2 ], pro kter´e plat´ı Pr Y1 = X1 + X2 a Y2 = X2 . Urˇcete hustotu pravdˇepodobnosti fY (y) n´ahodn´eho vektoru Y. ♦ −1 Inverzn´ı funkce jsou: x1 = h−1 1 (y) = y1 − y2 a x2 = h2 (y) = y2 .
59
Jakobi´an je J =
∂h−1 1 ∂y1 ∂h−1 2 ∂y1
∂h−1 1 ∂y2 ∂h−1 2 ∂y2
1 −1 = 0 1 = 1
Hustota pravdˇepodobnosti fY (y) je −1 fY (y) = fX (h−1 1 (y), h2 (y)) = fX (y1 − y2 , y2 ).
Margin´aln´ı hustota pravdˇepodobnosti fY (y1 ) = v´ysledku pˇr´ıkladu k Tvrzen´ı 10.2.
R∞
−∞ g(y)dy2
60
=
R∞
−∞ fX (y1
− y2 , y2 )dy2 , coˇz odpov´ıd´a
11 11.1
N´ ahodn´ y v´ ybˇ er, limitn´ı vˇ ety N´ ahodn´ y v´ ybˇ er
Hlavn´ım u ´kolem statistiky je rozbor dat, kter´a vykazuj´ı n´ahodn´e kol´ıs´an´ı. Jedn´a se vˇetˇsinou o data mˇeˇren´a na urˇcit´em procesu za u ´ˇcelem (lepˇs´ıho) pozn´an´ı tohoto procesu. Napˇr´ıklad: mˇeˇr´ıme hustoty a intenzity dopravn´ıho proudu na nˇekolika m´ıstech urˇcit´e dopravn´ı oblasti, abychom byli schopni (l´epe) ˇr´ıdit dopravu v t´eto oblasti.
11.2
Pojem n´ ahodn´ eho v´ ybˇ eru
Zkouman´ y proces ch´apeme jako n´ahodnou veliˇcinu s urˇcit´ ym, n´am nezn´am´ ym (nebo ne u ´plnˇe zn´am´ ym), rozdˇelen´ım a mˇeˇren´a data jako realizace t´eto n´ahodn´e veliˇciny. Pro jednoduchost a lepˇs´ı pˇredstavu se pˇri v´ ykladu omez´ıme na nejbˇeˇznˇejˇs´ı druh procesu, kter´ y nazveme z´ akladn´ım statistick´ ym pokusem a kter´ y spoˇc´ıv´a v dotazu vybran´e jednotky z dan´e mnoˇziny jednotek na urˇcitou vˇec. Mnoˇzinu vˇsech odpovˇed´ı nazveme soubor a podmnoˇzinu z´ıskan´ ych odpovˇed´ı nazveme v´ ybˇ er . Napˇr´ıklad: Sledov´an´ı spotˇreby automobil˚ u urˇcit´eho typu, vyroben´e v dan´em roce a pˇri najet´ı 5000 km. Souborem jsou spotˇreby automobil˚ u vyroben´ych v dan´em roce. V´ybˇerem jsou spotˇreby sledovan´ych automobil˚ u. Dotaz je symbolick´y n´azev pro zmˇeˇren´ı spotˇreby automobilu. Jednotka je automobil, vyroben´y v dan´em roce (prvek souboru). Mnoˇzina spotˇreb vˇsech automobil˚ u z dan´eho roku je soubor a podmnoˇzina spotˇreb sledovan´ych automobil˚ u) je v´ ybˇ er . Abychom z´ıskali objektivn´ı informace o zkouman´em procesu, je tˇreba, aby v´ ybˇer dotazovan´ ych jednotek byl nez´avisl´ y. Napˇr´ıklad: Zjiˇst’ujeme-li pr˚ umˇern´e st´aˇr´ı automobil˚ u, je nesmysln´e omezit se na autobazary. Jestliˇze v´ ybˇer, tj. s´erii dotaz˚ u, opakujeme, dostaneme jin´e odpovˇedi. Je t´ım, ˇze dotazy pˇri dalˇs´ım v´ ybˇeru zahrnou jin´e jednotky. Abstraktnˇe lze definovat n´ ahodn´ y v´ ybˇ er jako uspoˇr´adanou mnoˇzinu (vektor) n´ahodn´ ych veliˇcin, jej´ıˇz realizac´ı dostaneme jednu konkr´etn´ı realizaci v´ ybˇeru – ˇc´ıseln´ y vektor. D e f i n i c e 11.1 (N´ ahodn´ y v´ ybˇ er) N´ahodn´ y v´ ybˇer X = [X 1 , X 2 , . . . , X n ] je vektor nez´ avisl´ ych a stejnˇ e rozdˇ elen´ ych n´ahodn´ ych ˇ veliˇcin. C´ıslo n se naz´ yv´a rozsah v´ ybˇ eru. Vektor realizac´ı n´ahodn´ ych veliˇcin x = [x1 , x2 , . . . , xn ] nazveme realizac´ı n´ ahodn´ eho v´ ybˇ eru. Jedna z typick´ ych u ´loh statistiky je odhad stˇredn´ı hodnoty souboru, pˇriˇcemˇz pˇredpokl´ad´ame, ˇze typ rozdˇelen´ı souboru je zn´am´ y. Odhadujeme jeden z jeho parametr˚ u – stˇredn´ı hodnotu. O t´e vypov´ıdaj´ı vˇsechna data n´ahodn´eho v´ ybˇeru. Je proto uˇziteˇcn´e zn´at rozdˇelen´ı cel´eho n´ahodn´eho v´ ybˇeru. T v r z e n´ı 11.1 (Distribuˇ cn´ı funkce n´ ahodn´ eho v´ ybˇ eru) X = [X 1 , X 2 , . . . , X n ] je n´ahodn´ y v´ ybˇer a F (xi ), i = 1, 2, . . . , n je distribuˇcn´ı funkce, urˇcuj´ıc´ı rozdˇelen´ı jeho sloˇzek. Pak distribuˇcn´ı funkce n´ahodn´eho v´ ybˇeru H(x ) je rovna souˇcinu distribuˇcn´ıch funkc´ı jeho sloˇzek H(x ) = H(x1 , x2 , . . . , xn ) = F (x1 )F (x2 ) . . . F (xn ).
61
O v ˇe ˇr e n´ı: Plyne pˇr´ımo ze skuteˇcnosti, ˇze sloˇzky n´ ahodn´eho v´ybˇeru jsou nez´ avisl´e a distribuˇcn´ı funkce nez´ avisl´ych n´ ahodn´ych veliˇcin je rovna souˇcinu jejich distribuˇcn´ıch funkc´ı.
11.3
Limitn´ı vˇ ety
Limitn´ı vˇety vypov´ıdaj´ı o tom jak a za jak´ ych podm´ınek spolu souvis´ı charakteristiky souboru a v´ ybˇeru.
Konvergence podle pravdˇ epodobnosti Protoˇze posloupnosti n´ahodn´ ych veliˇcin jsou n´ahodn´e, nelze pro nˇe pouˇz´ıt bˇeˇznou definici konvergence. Proto se zav´ad´ı tzv. konvergence podle pravdˇ epodobnosti , kde sledujeme nikoliv samotnou konvergenci ˇclen˚ u posloupnosti, ale pravdˇepodobnost t´eto konvergence. D e f i n i c e 11.2 (Konvergence podle pravdˇ epodobnosti) Pro posloupnost n´ahodn´ ych veliˇcin {Xn }∞ rekneme, ˇze posloupnost konverguje n=1 a konstantu c ∈ R ˇ k c podle pravdˇepodobnosti, tj. Xn ,→ c, jestliˇze plat´ı lim P (|Xn − c| ≥ ) = 0,
n→∞
nebo
lim P (|Xn − c| ≤ ) = 1,
n→∞
∀
(55)
Koment´ aˇ r k definici 1. Definice ˇr´ık´a, ˇze jestliˇze posloupnost konverguje, pak pro dostateˇcnˇe velk´a n je pravdˇepodobnost hodnot Xn vnˇe -okol´ı bodu c bl´ızk´a nule, nebo uvnitˇr tohoto okol´ı bl´ızk´a jedn´e. Jej´ı v´ yznam je tedy n´azorn´ y.
Konvergence v distribuci Jedn´a se o dalˇs´ı moˇznou definici konvergence n´ahodn´e posloupnosti, tentokr´at nikoli ke konstantˇe ale k urˇcit´e n´ahodn´e veliˇcinˇe. D e f i n i c e 11.3 (Konvergence v distribuci) Uvaˇzujeme posloupnost n´ahodn´ ych veliˇcin {Xn }∞ cn´ımi funkcemi F (xn ) a n´ahodnou n=1 s distribuˇ ˇ veliˇcinu X s distribuˇcn´ı funkc´ı F (x). Rekneme, ˇze posloupnost n´ahodn´ ych veliˇcin Xn konverguje v distribuci k n´ahodn´e veliˇcinˇe X, jestliˇze plat´ı lim Fn (x) = F (x)
n→∞
ve vˇsech bodech spojitosti funkce F (x).
62
(56)
ˇ Cebyˇ sevova nerovnost Pro kaˇzdou n´ahodnou veliˇcinu plat´ı P (|X − E[X]| ≤ ) ≥ 1 −
D[X] . 2
V´ yraz |X − E[X]| pˇredstavuje vzd´alenost realizac´ı X od sv´e stˇredn´ı hodnoty. Vzorec ud´ av´ a minim´aln´ı pravdˇepodobnost, se kterou budou realizace X leˇzet v dan´em okol´ı sv´e stˇredn´ı hodnoty.
Z´ akon velk´ ych ˇ c´ısel Uvaˇzujme n´ahodnou posloupnost {Xn }∞ n=1 . a) Pro tuto posloupnost n´ahodn´ ych veliˇcin s alternativn´ım rozdˇelen´ım s parametrem π plat´ı Xn ,→ π b) Pro posloupnost spojit´ ych a nekorelovan´ ych n´ahodn´ ych veliˇcin se stˇredn´ı hodnotou µ a koneˇcn´ ym rozptylem σ 2 , podobnˇe plat´ı Xn ,→ µ. Lze shrnout: Pro empirick´e charakteristiky poˇc´ıtan´e z dostateˇcn´eho mnoˇzstv´ı zmˇeˇren´ ych hodnot plat´ı, ˇze se bl´ıˇz´ı k odpov´ıdaj´ıc´ım charakteristik´am souboru.
Centr´ aln´ı limitn´ı vˇ eta Uvaˇzujeme posloupnost vz´ajemnˇe nez´avisl´ ych n´ahodn´ ych veliˇcin se stˇredn´ı hodnotou µ a koneˇcn´ ym 2 rozptylem σ . Pak posloupnost
n X 1 √ Xj − nµ , σ n j=1
n→∞
konverguje v distribuci k rozdˇelen´ı N (0, 1) (standardn´ı norm´aln´ı rozdˇelen´ı). Lze shrnout: Pro velk´ y v´ ybˇer z libovolnˇe rozloˇzen´e n´ahodn´e veliˇciny (spojit´e i diskr´etn´ı) maj´ı P P souˇctov´e charakteristiky pˇribliˇznˇe norm´aln´ı rozdˇelen´ı, a to Xj se bl´ıˇz´ı k N (nµ, nσ 2 ) a Xj /n 2 m´a pˇribliˇznˇe rozdˇelen´ı N (µ, σ /n). ˇ ık´ ´ m k a: Tato vˇeta m´ Pozna a velik´y praktick´y v´yznam pro statistiku. R´ a, ˇze dostateˇcnˇe velk´y poˇcet namˇeˇren´ych hodnot zaruˇc´ı, ˇze dalˇs´ı zpracov´ an´ı je moˇzno prov´ adˇet za pˇredpokladu normality. S jin´ym, neˇz norm´ aln´ım rozdˇelen´ım, se totiˇz pracuje velmi tˇeˇzko, nebo v´ypoˇcty v˚ ubec nelze prov´est.
11.4
Charakteristiky v´ ybˇ eru
Realizace n´ahodn´eho v´ ybˇeru je datov´ y soubor. Ten lze popsat pomoc´ı charakteristik popisn´e statistiky. Tˇemito charakteristikami lze popsat i n´ahodn´ y v´ ybˇer, s jednou d˚ uleˇzitou odliˇsnost´ı.
63
Charakteristiky datov´eho souboru jsou konstanty (napˇr. pro stˇredn´ı hodnotu plat´ı: seˇctu-li dan´ a ˇc´ısla odpˇredu nebo odzadu, dostanu vˇzdy tot´eˇz). Charakteristiky n´ahodn´eho v´ ybˇeru jsou n´ahodn´e veliˇciny. N´ahodnost zde vznik´a vzhledem k opakovan´ ym v´ ybˇer˚ um. Provedeme-li prvn´ı v´ ybˇer a spoˇcteme charakteristiku (napˇr. pr˚ umˇer) t´eto realizace, dostaneme ˇc´ıslo. Dalˇs´ı v´ ybˇer poskytne novou realizaci a protoˇze je n´ahodn´ y, budou v n´ı jin´a ˇc´ısla. Proto i charakteristika (pr˚ umˇer) bude m´ıt jinou hodnotu. Tedy: kaˇzd´ y v´ ybˇer d´a jinou realizaci a jinou hodnotu charakteristiky – realizaci charakteristiky n´ahodn´eho v´ ybˇeru, kter´a je n´ahodnou veliˇcinou. R˚ uzn´e charakteristiky n´ahodn´eho v´ ybˇeru budou d´ale velmi d˚ uleˇzit´e. Kaˇzd´a zkouman´a vlastnost bude m´ıt svou charakteristiku, kter´e budeme ˇr´ıkat statistika. Protoˇze statistika je n´ahodn´a, m´ a sv´e rozdˇelen´ı (hustotu pravdˇepodobnosti statistiky). Ta je z´akladn´ım n´astrojem pro veˇsker´a odvozen´ı klasick´e statistiky. Nejprve se podrobnˇeji pod´ıv´ame na nejzn´amˇejˇs´ı charakteristiku v´ ybˇ erov´ y pr˚ umˇ er , v pˇr´ıˇst´ı kapitole si pak uvedeme dalˇs´ı z´akladn´ı charakteristiky a jejich vlastnosti.
V´ ybˇ erov´ y pr˚ umˇ er D e f i n i c e 11.4 (V´ ybˇ erov´ y pr˚ umˇ er) Pro v´ ybˇer X = [X 1 , X 2 , . . . , X n ] ze spojit´e n´ahodn´e veliˇciny X se stˇredn´ı hodnotou µ a rozptylem 2 σ je v´ ybˇ erov´ y pr˚ umˇ er definov´an vztahem X =
n 1X X i. n i=1
(57)
Koment´ aˇ r k definici 1. Vˇsimnˇeme si, ˇze ve vzorci pro v´ ybˇerov´ y pr˚ umˇer figuruj´ı velk´a p´ısmena. Nen´ı to tedy pr˚ umˇer z ˇc´ısel, ale form´alnˇe zapsan´ y pr˚ umˇer z n´ahodn´ ych veliˇcin.
Charakteristiky v´ ybˇ erov´ eho pr˚ umˇ eru Pro v´ ybˇerov´ y pr˚ umˇer, jako n´ahodnou veliˇcinu, uvedeme jeho stˇredn´ı hodnotu a rozptyl. Jsou to vlastnˇe charakteristiky definovan´e na charakteristice v´ ybˇerov´ y pr˚ umˇer. Tyto charakteristiky se poˇc´ıtaj´ı pro vˇsechny moˇzn´e hodnoty v´ ybˇerov´eho pr˚ umˇeru. Z´avis´ı proto na vˇsech realizac´ıch souboru. Jsou to tedy jiˇz konstanty (d˚ ukladnˇe rozmyslet). ˇ ´ı k l a d: Uvaˇzujme soubor s hodnotami {1, 2, 3} a v´ybˇer z tohoto souboru o rozsahu n = 2. Pr Vˇsechny moˇzn´e v´ybˇery jsou uvedeny jako sloupce n´asleduj´ıc´ı tabulky moˇzn´e v´ybˇery v´yb. pr˚ umˇery
1 1 1
1 2 1.5
1 3 2
2 1 1.5
2 2 2
2 3 2.5
3 1 2
3 2 2.5
3 3 3
Jestliˇze zpr˚ umˇerujeme vˇsechny v´ybˇerov´e pr˚ umˇery, dostaneme stˇredn´ı hodnotu v´ybˇerov´eho pr˚ umˇeru. Zde je to 2.
64
Stˇ redn´ı hodnota v´ ybˇ erov´ eho pr˚ umˇ eru X je rovna stˇredn´ı hodnotˇe souboru E[X] = µ n n n 1X 1X 1X 1 E[X ] = E Xi = E[X i ] = µ = nµ = µ. n i=1 n i=1 n i=1 n
"
#
(58)
Rozptyl v´ ybˇ erov´ eho pr˚ umˇ eru X je roven rozptylu souboru D[X] = σ 2 , dˇelen´emu rozsahem v´ ybˇeru n n n X 1X 1 s = D[X ] = D Xi Xi = 2D X n i=1 n i=1
"
"
#
#
2
= |{z}
nez´avislost
n 1 X σ2 1 D[X i ] = 2 nσ 2 = . 2 n i=1 n n
(59)
Rozdˇ elen´ı v´ ybˇ erov´ eho pr˚ umˇ eru Pro v´ ybˇer z n´ahodn´e veliˇciny s norm´aln´ım rozdˇelen´ım N (µ, σ 2 ), nebo pro dostateˇcnˇe velk´ y v´ ybˇer (viz Centr´aln´ı limitn´ı vˇeta) plat´ı X ∼ N (E[X ], D[X ]) = N (µ, σ 2 /n) tj, v´ ybˇerov´ y pr˚ umˇer m´a norm´aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µ a rozptylem σ 2 /n.
V´ ybˇ erov´ y rozptyl D e f i n i c e 11.5 (V´ ybˇ erov´ y rozptyl) Pro v´ ybˇer X = [X1 , X2 , . . . , Xn ] ze spojit´e n´ahodn´e veliˇciny X se stˇredn´ı hodnotou µ a rozptylem σ 2 je v´ ybˇ erov´ y rozptyl definov´an vztahem S2 =
n 1 X (Xi − X)2 . n − 1 i=1
(60)
V´ ybˇ erov´ y pod´ıl D e f i n i c e 11.6 (V´ ybˇ erov´ y pod´ıl) Pro v´ ybˇer X = [X1 , X2 , . . . , Xn ] z alternativn´ı n´ahodn´e veliˇciny X se souborov´ ym pod´ılem π je v´ ybˇ erov´ y pod´ıl definov´an vztahem n+ , (61) p= n kde n+ je poˇcet pˇr´ızniv´ ych pokus˚ u ve v´ ybˇeru a n je rozsah v´ ybˇeru.
65
11.5
Normovan´ e v´ ybˇ erov´ e charakteristiky
V´ ybˇerov´ y pr˚ umˇer je nejzn´amˇejˇs´ı, ale zdaleka ne jedinou charakteristikou v´ ybˇeru. Nyn´ı uvedeme ty charakteristiky, kter´e budeme d´ale nejˇcastˇeji pouˇz´ıvat. Mohou se t´ ykat jednoho nebo dvou v´ ybˇer˚ u.
´hodny ´ vy ´ be ˇr Jeden na Uvaˇzujeme v´ ybˇer z jednoho rozdˇelen´ı, napˇr. zjiˇst’ujeme st´aˇr´ı n´ahodnˇe vybran´ ych automobil˚ u. Budeme sledovat tˇri z´akladn´ı charakteristiky n´ahodn´eho v´ ybˇeru: v´ ybˇerov´ y pr˚ umˇ er , rozptyl a pod´ıl . Protoˇze je v´ ybˇer n´ahodn´ y, jsou i tyto charakteristiky n´ahodn´e a kaˇzd´a z nich m´ a sv´e rozdˇelen´ı.
V´ ybˇ erov´ y pr˚ umˇ er pˇ ri zn´ am´ em rozptylu souboru Normovan´ y v´ ybˇ erov´ y pr˚ umˇ er z norm´aln´ıho rozdˇelen´ı N (µ; σ 2 ), nebo dostateˇcnˇe velk´ y v´ ybˇer 2 z libovoln´eho rozdˇelen´ı se stˇredn´ı hodnotou µ a rozptylem σ je √ Z = Xσ−µ n ∼ N (0, 1)
(62)
a m´a normovan´e norm´aln´ı rozdˇelen´ı N (0; 1).
V´ ybˇ erov´ y pr˚ umˇ er pˇ ri nezn´ am´ em rozptylu souboru V pˇr´ıpadˇe nezn´am´eho rozptylu souboru, ze kter´eho je v´ ybˇer poˇr´ızen, se nezn´am´ y rozptyl odhadne pomoc´ı v´ ybˇerov´eho rozptylu (60). Normovan´ y v´ ybˇ erov´ y pr˚ umˇ er je definov´an t=
X−µ √ n S
∼ St(n − 1)
(63)
a m´a Studentovo rozdˇelen´ı s n − 1 stupni volnosti.
V´ ybˇ erov´ y rozptyl Normovan´ y v´ ybˇ erov´ y rozptyl je definov´an vztahem χ2 =
(n−1)S 2 σ2
∼ Chi2(n − 1)
a m´a rozdˇelen´ı rozdˇelen´ı χ2 s n − 1 stupni volnosti.
66
(64)
V´ ybˇ erov´ y pod´ıl Normovan´ y v´ ybˇ erov´ y pod´ıl je Z = √ p−π
√
p(1−p)
n ∼ N (0; 1)
(65)
a m´a pˇribliˇznˇe norm´aln´ı normovan´e rozdˇelen´ı N (0; 1). To plat´ı pro np > 5 a z´aroveˇ n n(1 − p) > 5.
´hodne ´ vy ´ be ˇry Dva na Uvaˇzujeme dva v´ ybˇery, tj. dvˇe n´ahodn´e veliˇciny, kter´e chceme zkoumat. Napˇr´ıklad mˇeˇr´ıme nahuˇstˇen´ı pˇredn´ıch pneumatik u n´ahodnˇe vybran´ ych automobil˚ u. Tlak v lev´e pneumatice je realizac´ı prvn´ı n´ahodn´e veliˇciny, tlak v prav´e je realizac´ı druh´e n´ahodn´e veliˇciny. Charakteristikami budou opˇet pr˚ umˇ er, rozptyl a pod´ıl a vztahuj´ı se na rozd´ıl obou n´ahodn´ ych veliˇcin. Pˇredpokl´ad´ame, ˇze rozptyl rozdˇelen´ı nen´ı zn´am a je nahrazen v´ ybˇerov´ ym rozptylem. Znaˇc´ıme: x1 , x2 v´ ybˇery, n1 , n2 rozsahy v´ ybˇer˚ u, µ1 , µ2 stˇredn´ı hodnoty v´ ybˇer˚ u a σ12 , σ22 rozptyly v´ ybˇer˚ u.
Dva v´ ybˇ erov´ e pr˚ umˇ ery 74 Normovan´ y rozd´ıl dvou v´ ybˇ erov´ ych pr˚ umˇ er˚ u pˇ ri shodn´ ych rozptylech t=
X 1 −X 2 −(µ1 −µ2 ) √ SP 1/n1 +1/n2
SP2 =
∼ St(n − 1) ,
(n1 − 1)S12 + (n2 − 1)S22 . n1 + n2 − 2
(66)
a m´a Studentovo rozdˇelen´ı s n − 1 stupni volnosti. Normovan´ y rozd´ıl dvou v´ ybˇ erov´ ych pr˚ umˇ er˚ u pˇ ri r˚ uzn´ ych rozptylech 2 −(µ1 −µ2 ) t = X√1 −X 2 2
S1 /n1 +S2 /n2
∼ St(n − 1)
(67)
a m´a Studentovo rozdˇelen´ı s δ stupni volnosti, kde δ=
(k1 + k2 )2 k12 n1 −1
+
k22 n2 −1
,
k1 =
s21 s2 , k2 = 2 n1 n2
Normovan´ y rozd´ıl dvou v´ ybˇ erov´ ych pr˚ umˇ er˚ u pˇ ri p´ arov´ ych v´ ybˇ erech t=
D−(µ1 −µ2 ) √ n SD
67
∼ St(n − 1) ,
(68)
kde D = X 1 − X 2 , D je v´ ybˇerov´ y pr˚ umˇer a SD v´ ybˇerov´ y rozptyl n´ahodn´eho vektoru D. Di = X1,i − X2,i ;
D=
n 1X Di ; n i=1
2 SD =
n 1 X (Di − D)2 n − 1 i=1
Tato charakteristika m´a Studentovo rozdˇelen´ı s n − 1 stupni volnosti. ˇ ´ı k l a d: Pr Sledujeme nahuˇstˇen´ı pˇredn´ıch pneumatik u osobn´ıch automobil˚ u. U kaˇzd´eho auta zmˇeˇr´ıme tlak v lev´e pneumatice (prvek v´ybˇeru 1) a v prav´e pneumatice (prvek v´ybˇeru 2). Tedy, pro kaˇzd´y objekt (automobil) mˇeˇr´ıme dvˇe vlastnosti (pravou a levou pneumatiku). Tak dostaneme p´arov´e v´ybˇery. ´ m k a: P´ Pozna arov´y rozd´ıl v´ybˇerov´ych pr˚ umˇer˚ u dostaneme tak, ˇze odeˇcteme poloˇzky jednotliv´ych v´ybˇer˚ u, tak dostaneme v´ybˇer D a z nˇeho sestav´ıme obyˇcejn´y normovan´y v´ybˇerov´y pr˚ umˇer (63).
Dva v´ ybˇ erov´ e rozptyly Normovan´ y pod´ıl dvou v´ ybˇ erov´ ych rozptyl˚ u F =
S12 S22
∼ F (n1 − 1, n2 − 1).
(69)
Tato charakteristika m´a F rozdˇelen´ı s n1 − 1 stupni volnosti pro ˇcitatele a n2 − 1 stupni volnosti pro jmenovatele.
Dva v´ ybˇ erov´ e pod´ıly Normovan´ y rozd´ıl dvou v´ ybˇ erov´ ych pod´ıl˚ u p1 a p2 pro dvˇe alternativn´ı rozdˇelen´ı s pod´ıly π1 a π2 je −p2 −(π1 −π1 ) Z = q πp1(1−π ) π (1−π 1
1
n1
+
2)
2
n2
a m´a pˇribliˇznˇe norm´aln´ı rozdˇelen´ı N (0; 1).
68
∼ N (0; 1)
(70)
12 12.1
Bodov´ e odhady, jejich vlastnosti a konstrukce Statistika
V´ ybˇer poˇrizujeme proto, abychom se (v´ıce) dovˇedˇeli o souboru, ze kter´eho jsme v´ ybˇer poˇr´ıdili. Zde se soustˇred´ıme na situaci, kdy zn´ame rozdˇelen´ı souboru aˇz na jeden nebo v´ıce parametr˚ u. Napˇr. v´ıme, ˇze rozdˇelen´ı souboru je norm´aln´ı, ale nezn´ame jeho stˇredn´ı hodnotu, pˇr´ıpadnˇe i rozptyl. Z v´ ybˇeru se snaˇz´ıme hodnoty tˇechto nezn´am´ ych parametr˚ u odhadnout. Pˇredpis, pomoc´ı kter´eho z v´ ybˇeru vypoˇcteme hodnotu nezn´am´eho parametru se naz´ yv´a statistika. V souladu s t´ım je i n´asleduj´ıc´ı definice. D e f i n i c e 12.1 (Statistika) Statistika T = T (X ) je funkce v´ ybˇeru X . Koment´ aˇ r k definici 1. Statistika urˇcen´a pro odhadov´an´ı se naz´ yv´a odhadov´ a statistika, pro testov´an´ı testov´ a statistika. 2. Definice neˇr´ık´a nic o tom, jak statistiku volit vzhledem k jej´ımu c´ılov´emu vyuˇzit´ı (odhad, test). Jej´ı vhodnost ˇci nevhodnost budeme zkoumat pozdˇeji.
12.2
Bodov´ y odhad parametru rozdˇ elen´ı
D e f i n i c e 12.2 (Bodov´ y odhad) Sledujeme rozdˇelen´ı s hustotou pravdˇepodobnosti f (x; θ) s nezn´am´ ym parametrem θ. Provedli jsme realizaci n´ahodn´eho v´ ybˇeru x = (x1 , x2 , . . . , xn ) z tohoto rozdˇelen´ı a definovali statistiku T (X ). Bodov´ y odhad θˆ parametru θ pro realizaci n´ahodn´eho v´ ybˇeru x je hodnota statistiky T s dosazenou realizac´ı n´ahodn´eho v´ ybˇeru x θˆ = T (x )
(71)
Koment´ aˇ r k definici 1. Pro kaˇzdou novou realizaci v´ ybˇeru obdrˇz´ıme jin´ y bodov´ y odhad. Odtud je zˇrejm´e, ˇze bodov´ y odhad nem˚ uˇze d´at u ´plnˇe pˇresnou hodnotu parametru. 2. Vlastn´ı volbu statistiky jsme zat´ım nechali stranou. Lze pro ni pouˇz´ıt metodu moment˚ u nebo maxim´aln´ı vˇerohodnosti, o kter´e se zm´ın´ıme. Statistiku je tak´e moˇzno volit heuristicky, potom je vˇsak tˇreba ovˇeˇrit jej´ı vlastnosti. ˇ ´ı k l a d: Pr
Odhadujeme parametr stˇredn´ı hodnotu µ. Provedli jsme v´ybˇer x = {x1 , x2 , . . . , xn } = {3, 5, 2, 4, 5}.
Protoˇze v´ıme, ˇze stˇredn´ı hodnotu si lze pˇribliˇznˇe pˇredstavit jako pr˚ umˇer vˇsech moˇzn´ych realizac´ı, 1 Pn usoud´ıme, ˇze jej´ım vhodn´ym odhadem bude aritmetick´y pr˚ umˇer x = n i=1 xi . Po dosazen´ı realizace v´ybˇeru dostaneme x = 19/5. Vlastnosti zvolen´e statistiky je vˇsak tˇreba ovˇeˇrit (viz d´ale).
69
12.3
Vlastnosti bodov´ ych odhad˚ u
Vlastnosti bodov´eho odhadu θˆ vypov´ıdaj´ı o vhodnosti pouˇzit´e statistiky T k odhadu hodnoty parametru θ. Uvedeme tˇri vlastnosti: nestrannost, konzistenci a vydatnost. ß
• Nestrannost • D e f i n i c e 12.3 (Nestrannost) Statistika T poskytuje nestrann´ y bodov´ y odhad parametru θ, jestliˇze jej´ı stˇredn´ı hodnota se rovn´a tomuto parametru E[T ] = θ (72) Koment´ aˇ r k definici 1. Stˇredn´ı hodnotu E[T ] je tˇreba ch´apat jako ”pr˚ umˇerov´an´ı” pˇres vˇsechny moˇzn´e v´ ybˇery. Jestliˇze bychom chtˇeli naznaˇcit v´ ypoˇcet t´eto stˇredn´ı hodnoty, bylo by tˇreba postupovat takto: provedeme prvn´ı v´ ybˇer, spoˇcteme bodov´ y odhad, provedeme druh´ y v´ ybˇer a opˇet spoˇcteme bodov´ y odhad, atd. Po proveden´ı vˇsech moˇzn´ ych v´ ybˇer˚ u udˇel´ame pr˚ umˇer ze vˇsech jednotliv´ ych bodov´ ych odhad˚ u. To je hledan´a stˇredn´ı hodnota. 2. Nestrannost ˇr´ık´a, ˇze odhad je ”v pr˚ umˇeru” (rozum´ıme pˇres vˇsechny moˇzn´e v´ ybˇery) pˇresn´ y. ˇ ´ı k l a d: Ovˇeˇr´ıme nestrannost v´ybˇerov´eho pr˚ Pr umˇeru vzhledem ke stˇredn´ı hodnotˇe. M´ame dok´azat, ˇze plat´ı E[X] = µ. Dosad´ıme definici v´ybˇerov´eho pr˚ umˇeru a manipulujeme s oper´atorem stˇredn´ı hodnoty n n n 1X 1X 1X E[X] = E Xi = E[Xi ] = µ=µ n i=1 n i=1 n i=1
"
#
Vych´ ylen´ı bodov´ eho odhadu B(θ) je definov´ano jako rozd´ıl mezi stˇredn´ı hodnotou statistiky a odhadovan´ ym parametrem B(θ) = E(T ) − θ (73)
´ m k a: Z definice nevych´ylenosti pˇr´ımo plyne, ˇze je-li statistika T pro odhad parametru Pozna θ nevych´ylen´ a, pak vych´ylen´ı B(θ) je nulov´e.
• Konzistence • D e f i n i c e 12.4 (Konzistence) Statistika T d´av´a konzistentn´ı bodov´ y odhad parametru θ, jestliˇze pro rostouc´ı rozsah v´ ybˇeru se hodnota statistiky (v pravdˇepodobnosti) neomezenˇe bl´ıˇz´ı skuteˇcn´emu parametru lim P (|T − θ| < ) = 1,
n→∞
70
∀ > 0
(74)
Koment´ aˇ r k definici Tato vlastnost je limitn´ı. Lze ji sledovat jen pˇri zvˇetˇsuj´ıc´ım se rozsahu v´ ybˇeru – napˇr. zmˇeˇr´ıme 10 hodnot, pak 100, atd. T v r z e n´ı 12.1 (Kriterium konzistence) Odhad je konzistentn´ı, jestliˇze je – asymptoticky nestrann´ y, – jeho rozptyl jde k nule s rozsahem v´ ybˇeru jdouc´ım k nekoneˇcnu. ˇ sevovy nerovnosti pro obecn´y odhad. O v ˇe ˇr e n´ı: Plyne z pouˇzit´ı Cebyˇ ˇ ´ı k l a d: Ovˇeˇr´ıme konzistenci v´ybˇerov´eho pr˚ Pr umˇeru vzhledem k odhadu stˇredn´ı hodnoty. Pro d˚ ukaz ˇ sevovu nerovnost (??), kterou zap´ıˇseme pro v´ybˇerov´a pr˚ vyuˇzijeme Cebyˇ umˇer a stˇredn´ı hodnotu P (|X − µ| < ) > 1 −
σ2 n2
σ2 = 0, je odhad konzistentn´ı. n→∞ n2
Protoˇze lim
• Vydatnost • D e f i n i c e 12.5 (Vydatnost) Pro dvˇe nestrann´e statistiky T a U definujeme jako vydatnˇejˇs´ı tu z nich, kter´a m´a menˇs´ı rozptyl D[T ] < D[U ]
=⇒
T je vydatnˇejˇs´ı neˇz U
(75)
´ m k a: Pro posouzen´ı dvou statistik, kter´e nejsou nestrann´e, je tˇreba zav´est stˇ Pozna rednˇ e kvadratickou chybu M SE definovanou vztahem M SE = E[(T − θ)2 ] = D[T ] + (B(θ))2
(76)
Jako vydatnˇejˇs´ı definujeme statistiku s menˇs´ı M SE. (Pro nestrann´e statistiky M SE pˇrech´ az´ı na rozptyl a obˇe definice jsou shodn´e.) Ze vztahu pro M SE je patrn´e, ˇze v obecn´em pˇr´ıpadˇe tato charakteristika posuzuje jak rozptyl odhadov´e statistiky, tak i jej´ı vych´ylen´ı. M SE bude minim´ aln´ı, jestliˇze bude minim´ aln´ı rozptyl i vych´ylen´ı statistiky.
12.4
Konstrukce bodov´ ych odhad˚ u
ˇ Rekli jsme co je bodov´ y odhad a jak´e u nˇeho sledujeme vlastnosti. Nyn´ı se budeme vˇenovat ot´ azce, jak lze takov´ y odhad zkonstruovat. Uk´aˇzeme dvˇe z´akladn´ı metody pro konstrukci statistiky, vhodn´e pro odhad dan´eho parametru.
71
Metoda moment˚ u Tato metoda je velmi jednoduch´a, obecnˇe vˇsak ned´av´a pˇr´ıliˇs kvalitn´ı v´ ysledky. Spoˇc´ıv´a v porovn´ an´ı obecn´ ych (nebo centr´aln´ıch) moment˚ u souboru a v´ ybˇeru. Podle toho, kolik parametr˚ u odhadujeme, tolik moment˚ u mus´ıme porovnat. Momenty souboru poˇc´ıt´ame s pomoc´ı hustoty pravdˇepodobnosti souboru f (x, θ). Budou tedy obsahovat nezn´am´ y parametr θ. V´ ybˇer je mnoˇzina zmˇeˇren´ ych hodnot. Moment v´ ybˇeru bude tedy ˇc´ıslo. Porovn´an´ım moment˚ u z´ısk´ame rovnice kde nezn´am´e budou odhadovan´e parametry. Z nich odhad vypoˇcteme. ˇ ´ı k l a d: Budeme odhadovat nezn´am´y parametr δ exponenci´aln´ıho rozdˇelen´ı s hustotou pravdˇepoPr dobnosti f (x, δ) = δ exp{−δ x}, δ > 0, x ∈ (0, ∞) z v´ybˇeru x = [x1 , x2 , . . . , xn ]. Protoˇze odhadujeme jedin´y parametr, staˇc´ı porovnat prvn´ı momenty, tj. stˇredn´ı hodnotu souboru (exponenci´aln´ıho rozdˇelen´ı) a v´ybˇerov´y pr˚ umˇer zmˇeˇren´eho v´ybˇeru. Stˇredn´ı hodnota souboru je Z
E[X] =
∞
Z
x f (x, δ) dx = 0
x δ exp{−δx}dx = 1/δ. 0
V´ybˇerov´y pr˚ umˇer je x= Porovn´an´ım dostaneme
∞
n 1X xi = ˇc´ıslo. n i=1
1 1 = x ⇒ δˆ = , x δ
kde symbolem δˆ jsme oznaˇcili bodov´y odhad parametru δ.
´ln´ı ve ˇrohodnosti Metoda maxima ´ rozde ˇlen´ı • • Odhad pro obecne Tato metoda d´av´a velmi kvalitn´ı v´ ysledky a je ˇcasto pouˇz´ıv´ana. Pro norm´aln´ı rozdˇelen´ı souboru je ekvivalentn´ı s metodou nejmenˇs´ıch ˇctverc˚ u, o kter´e budeme mluvit v regresn´ı anal´ yze. Metoda je zaloˇzena na minimalizaci tzv. vˇ erohodnostn´ı funkce nebo jej´ım logaritmu (coˇz je tot´eˇz – proˇc?). D e f i n i c e 12.6 (Vˇ erohodnostn´ı funkce) Pro rozdˇelen´ı s hustotou pravdˇepodobnosti f (x, θ) a realizaci n´ahodn´eho v´ ybˇeru x = [x1 , x2 , . . . , xn ] definujeme vˇerohodnostn´ı funkci Ln (θ) vztahem Ln (θ) =
n Y
f (xi , θ).
i=1
D e f i n i c e 12.7 (Maxim´ alnˇ e vˇ erohodn´ y odhad)
72
(77)
Maxim´ alnˇ e vˇ erohodn´ ym odhadem parametru θ rozdˇelen´ı f (x, θ) nazveme odhad θˆ ∈ θ∗ , kter´ y maximalizuje (logaritmus) vˇerohodnostn´ı funkce, tj. plat´ı ˆ ≥ log Ln (θ), ∀θ ∈ θ∗ log Ln (θ)
(78)
kde θ∗ oznaˇcuje mnoˇzinu vˇsech pˇr´ıpustn´ ych hodnot parametru θ. Obecn´ y postup pˇri urˇcen´ı maxim´alnˇe vˇerohodn´eho odhadu je n´asleduj´ıc´ı: 1. Sestav´ıme vˇerohodnostn´ı funkci tak, ˇze n´asob´ıme hustoty pravdˇepodobnosti souboru a do kaˇzd´e dosad´ıme za x jeden prvek v´ ybˇeru xi . 2. Je-li to v´ yhodn´e, vˇerohodnostn´ı funkci logaritmujeme. Protoˇze ˇrada rozdˇelen´ı m´a hustotu pravdˇepodobnosti ve tvaru exponenci´aly, b´ yv´a logaritmus uˇziteˇcn´ y pro zjednoduˇsen´ı souˇcinu. Nen´ı vˇsak nutn´ y. 3. Hled´ame maximum logaritmu vˇerohodnostn´ı funkce. V jednoduch´em pˇr´ıpadˇe napˇr. pomoc´ı derivace, ve sloˇzitˇejˇs´ım pˇr´ıpadˇe numericky. Bod, kde leˇz´ı maximum je maxim´alnˇe vˇerohodn´ y odhad.
´ln´ı tr ˇ´ıdu rozde ˇlen´ı • • Odhad pro exponencia D e f i n i c e 12.8 (Exponenci´ aln´ı tˇ r´ıda rozdˇ elen´ı) ˇ Rekneme, ˇze hustota pravdˇepodobnosti patˇr´ı do exponenci´aln´ı tˇr´ıdy, jestliˇze je moˇzno ji zapsat ve tvaru f (x, θ) = exp{Q(θ) U (x) + R(θ) + V (x)}, (79) kde Q, R jsou funkcemi jen θ (ne x) a U, V jsou funkcemi jen x (ne θ).
ˇ ´ı k l a d: Pr
Alternativn´ı rozdˇelen´ı je z exponenci´aln´ı tˇr´ıdy, nebot’ plat´ı f (x, π) = π x (1 − π)1−x = exp{log(π x (1 − π)1−x )} =
= exp{x log(π) + (1 − x) log(1 − π)} = exp{[log(π) − log(1 − π)] x + log(1 − π)}. Zde plat´ı: Q = log(π) − log(1 − π), U = x, R = log(1 − π), V = 0. Je-li rozdˇelen´ı z exponenci´aln´ı tˇr´ıdy, dost´av´ame n´asleduj´ıc´ı jednoduch´e ˇreˇsen´ı u ´lohy maxim´ alnˇe vˇerohodn´eho odhadu. T v r z e n´ı 12.2 (Max. vˇ er. odhad pro exponenci´ aln´ı tˇ r´ıdu) Pro rozdˇelen´ı s hustotou pravdˇepodobnosti f (x, θ) = exp{Q(θ) U (x) + R(θ) + V (x)} a realizaci v´ ybˇeru x = [x1 , x2 , . . . , xn ] je extr´em logaritmick´e vˇerohodnostn´ı funkce d´an ˇreˇsen´ım rovnice Q0 (θ) S(x) + n R0 (θ) = 0, kde Q0 , R0 jsou derivace podle θ a S(x) =
Pn
i=1 U (xi ).
Aby nalezen´ y extr´em byl maximum, mus´ı b´ yt jeˇstˇe splnˇena nerovnost Q00 (θ)S(x) + n R00 < 0.
73
O v ˇe ˇr e n´ı: Vˇerohodnostn´ı funkce je Ln (θ) =
n Y
exp{Q(θ) U (xi ) + R(θ) + V (xi )} = exp
i=1
( n X
)
(Q(θ) U (xi ) + R(θ) + V (xi ))
=
i=1
(
= exp Q(θ)
n X
U (xi ) + nR(θ) +
i=1
n X
)
V (xi ) .
i=1
Tento v´yraz logaritmujeme a se zaveden´ym znaˇcen´ım dostaneme log Ln (θ) = Q(θ)S(x) + nR(θ) +
n X
V (xi ).
i=1
Po derivaci podle θ posledn´ı v´yraz zmiz´ı. Anulov´ an´ım derivace dost´ av´ ame podm´ınku pro extr´em. Podm´ınka pro maximum je z´ aporn´ a druh´ a derivace. ˇ ´ı k l a d: Metodou maxim´aln´ı vˇerohodnosti urˇcete odhadovou statistiku pro parametr π alternaPr tivn´ıho rozdˇelen´ı. Uvaˇzujeme alternativn´ı rozdˇelen´ı, jehoˇz exponenci´aln´ı tvar jsme jiˇz odvodili (viz pˇr´ıklad k (79)) a zjistili jsme, ˇze plat´ı Q = log(π/(1 − π)), U = x, R = log(1 − π), V = 0. Abychom mohli pouˇz´ıt tvrzen´ı 12.2, potˇrebujeme jeˇstˇe spoˇc´ıtat funkci S pˇr´ısluˇsn´e derivace. S=
Pn
i=1 xi
= nx, Q0 =
1 π(1−π) ,
1 1 Q00 = − π22π−1 , R0 = − 1−π , R00 = − (1−π) 2 (1−π)2
Podm´ınka extr´emu Q0 S + nR0 =
1 1 nx − n =0 ⇒ π ˆ=x π(1 − π) 1−π
ˆ) Podm´ınka maxima (s dosazen´ym odhadem x = π −
2ˆ π−1 1 nˆ π−n <0 ⇒ π ˆ<1 π ˆ 2 (1 − π ˆ )2 (1 − π ˆ )2
coˇz je vˇzdy splnˇeno, nebot’ π = 1 je patologick´y pˇr´ıpad.
74
13
Z´ avˇ ereˇ cn´ e opakov´ an´ı a poˇ c´ıt´ an´ı
75