Pravdˇ epodobnost a matematick´ a statistika
Mirko Navara Centrum strojov´ eho vn´ım´ an´ı ˇ katedra kybernetiky FEL CVUT Karlovo n´ amˇ est´ı, budova G, m´ıstnost 104a http://cmp.felk.cvut.cz/˜navara/MVT http://cmp.felk.cvut.cz/˜navara/psi
7. u ´nora 2013
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001?
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c 1B. Jak vysok´ a by mˇ ela b´ yt pojistka auta pro pˇr´ıpad hav´ arie, pˇri n´ıˇz m˚ uˇze b´ yt ˇskoda r˚ uznˇ e velk´ a?
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c 1B. Jak vysok´ a by mˇ ela b´ yt pojistka auta pro pˇr´ıpad hav´ arie, pˇri n´ıˇz m˚ uˇze b´ yt ˇskoda r˚ uznˇ e velk´ a? ˇ ⇒ TEORIE PRAVDEPODOBNOSTI
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c 1B. Jak vysok´ a by mˇ ela b´ yt pojistka auta pro pˇr´ıpad hav´ arie, pˇri n´ıˇz m˚ uˇze b´ yt ˇskoda r˚ uznˇ e velk´ a? ˇ ⇒ TEORIE PRAVDEPODOBNOSTI 2. Jak odhadnout pravdˇ epodobnost kr´ adeˇze auta nebo stˇredn´ı ˇskodu pˇri hav´ arii a jak pˇresn´ y bude odhad?
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c 1B. Jak vysok´ a by mˇ ela b´ yt pojistka auta pro pˇr´ıpad hav´ arie, pˇri n´ıˇz m˚ uˇze b´ yt ˇskoda r˚ uznˇ e velk´ a? ˇ ⇒ TEORIE PRAVDEPODOBNOSTI 2. Jak odhadnout pravdˇ epodobnost kr´ adeˇze auta nebo stˇredn´ı ˇskodu pˇri hav´ arii a jak pˇresn´ y bude odhad? ⇒ STATISTIKA
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c 1B. Jak vysok´ a by mˇ ela b´ yt pojistka auta pro pˇr´ıpad hav´ arie, pˇri n´ıˇz m˚ uˇze b´ yt ˇskoda r˚ uznˇ e velk´ a? ˇ ⇒ TEORIE PRAVDEPODOBNOSTI 2. Jak odhadnout pravdˇ epodobnost kr´ adeˇze auta nebo stˇredn´ı ˇskodu pˇri hav´ arii a jak pˇresn´ y bude odhad? ⇒ STATISTIKA
3. Jak oznaˇ covat auta a jejich d´ıly, abychom je jednoznaˇ cnˇ e urˇ cili?
1
Oˇ cem to je?
1A. Jak vysok´ a by mˇ ela b´ yt pojistka auta proti kr´ adeˇzi (bez marˇze), je-li jeho cena 1 000 000 Kˇ c a riziko ukraden´ı bˇ ehem pojistn´ eho obdob´ı 0.001? 1 000 000 · 0.001 = 1 000 Kˇ c 1B. Jak vysok´ a by mˇ ela b´ yt pojistka auta pro pˇr´ıpad hav´ arie, pˇri n´ıˇz m˚ uˇze b´ yt ˇskoda r˚ uznˇ e velk´ a? ˇ ⇒ TEORIE PRAVDEPODOBNOSTI 2. Jak odhadnout pravdˇ epodobnost kr´ adeˇze auta nebo stˇredn´ı ˇskodu pˇri hav´ arii a jak pˇresn´ y bude odhad? ⇒ STATISTIKA
3. Jak oznaˇ covat auta a jejich d´ıly, abychom je jednoznaˇ cnˇ e urˇ cili?
´ ´ ´I ⇒ TEORIE INFORMACE A KODOV AN
´ ´ ´I ⇒ TEORIE INFORMACE A KODOV AN Urˇ citˇ e ne jako v rozvrhu na FEL: Cviˇ cen´ı AD0B01PSI bude v uˇ cebnˇ e KN:E-24.
1.1
Teorie pravdˇ epodobnosti
je n´ astroj pro u ´ˇ celn´ e rozhodov´ an´ı v syst´ emech, kde budouc´ı pravdivost jev˚ u z´ avis´ı na okolnostech, kter´ e zcela nezn´ ame.
1.1
Teorie pravdˇ epodobnosti
je n´ astroj pro u ´ˇ celn´ e rozhodov´ an´ı v syst´ emech, kde budouc´ı pravdivost jev˚ u z´ avis´ı na okolnostech, kter´ e zcela nezn´ ame. Poskytuje model takov´ ych syst´ em˚ u a kvantifikaci v´ ysledk˚ u.
1.1
Teorie pravdˇ epodobnosti
je n´ astroj pro u ´ˇ celn´ e rozhodov´ an´ı v syst´ emech, kde budouc´ı pravdivost jev˚ u z´ avis´ı na okolnostech, kter´ e zcela nezn´ ame. Poskytuje model takov´ ych syst´ em˚ u a kvantifikaci v´ ysledk˚ u. Pravdˇ epodobnostn´ı popis ⇒ chov´ an´ı syst´ emu
1.1
Teorie pravdˇ epodobnosti
je n´ astroj pro u ´ˇ celn´ e rozhodov´ an´ı v syst´ emech, kde budouc´ı pravdivost jev˚ u z´ avis´ı na okolnostech, kter´ e zcela nezn´ ame. Poskytuje model takov´ ych syst´ em˚ u a kvantifikaci v´ ysledk˚ u. Pravdˇ epodobnostn´ı popis ⇒ chov´ an´ı syst´ emu
1.2
Statistika
je n´ astroj pro hled´ an´ı a ovˇ eˇrov´ an´ı pravdˇ epodobnostn´ıho popisu re´ aln´ ych syst´ em˚ u na z´ akladˇ e jejich pozorov´ an´ı.
1.1
Teorie pravdˇ epodobnosti
je n´ astroj pro u ´ˇ celn´ e rozhodov´ an´ı v syst´ emech, kde budouc´ı pravdivost jev˚ u z´ avis´ı na okolnostech, kter´ e zcela nezn´ ame. Poskytuje model takov´ ych syst´ em˚ u a kvantifikaci v´ ysledk˚ u. Pravdˇ epodobnostn´ı popis ⇒ chov´ an´ı syst´ emu
1.2
Statistika
je n´ astroj pro hled´ an´ı a ovˇ eˇrov´ an´ı pravdˇ epodobnostn´ıho popisu re´ aln´ ych syst´ em˚ u na z´ akladˇ e jejich pozorov´ an´ı. Chov´ an´ı syst´ emu ⇒ pravdˇ epodobnostn´ı popis
1.1
Teorie pravdˇ epodobnosti
je n´ astroj pro u ´ˇ celn´ e rozhodov´ an´ı v syst´ emech, kde budouc´ı pravdivost jev˚ u z´ avis´ı na okolnostech, kter´ e zcela nezn´ ame. Poskytuje model takov´ ych syst´ em˚ u a kvantifikaci v´ ysledk˚ u. Pravdˇ epodobnostn´ı popis ⇒ chov´ an´ı syst´ emu
1.2
Statistika
je n´ astroj pro hled´ an´ı a ovˇ eˇrov´ an´ı pravdˇ epodobnostn´ıho popisu re´ aln´ ych syst´ em˚ u na z´ akladˇ e jejich pozorov´ an´ı. Chov´ an´ı syst´ emu ⇒ pravdˇ epodobnostn´ı popis
Poskytuje daleko v´ıc: n´ astroj pro zkoum´ an´ı svˇ eta, pro hled´ an´ı a ovˇ eˇrov´ an´ı z´ avislost´ı, kter´ e nejsou zjevn´ e.
2
2.1
Z´ akladn´ı pojmy teorie pravdˇ epodobnosti
Laplaceova (klasick´ a) definice pravdˇ epodobnosti
Pˇredpoklad: N´ ahodn´ y pokus s n ∈ N r˚ uzn´ ymi, vz´ ajemnˇ e se vyluˇ cuj´ıc´ımi v´ ysledky, kter´ e jsou stejnˇ e moˇ zn´ e. Pravdˇ epodobnost jevu, kter´ y nast´ av´ a pr´ avˇ e pˇri k z tˇ echto v´ ysledk˚ u, je k/n.
2
2.1
Z´ akladn´ı pojmy teorie pravdˇ epodobnosti
Laplaceova (klasick´ a) definice pravdˇ epodobnosti
Pˇredpoklad: N´ ahodn´ y pokus s n ∈ N r˚ uzn´ ymi, vz´ ajemnˇ e se vyluˇ cuj´ıc´ımi v´ ysledky, kter´ e jsou stejnˇ e moˇ zn´ e. Pravdˇ epodobnost jevu, kter´ y nast´ av´ a pr´ avˇ e pˇri k z tˇ echto v´ ysledk˚ u, je k/n. 1. probl´ em: stejnˇ e moˇzn´ e“= stejnˇ e pravdˇ epodobn´ e,“ ale co to znamen´ a? (definice ” ” kruhem!)
2
2.1
Z´ akladn´ı pojmy teorie pravdˇ epodobnosti
Laplaceova (klasick´ a) definice pravdˇ epodobnosti
Pˇredpoklad: N´ ahodn´ y pokus s n ∈ N r˚ uzn´ ymi, vz´ ajemnˇ e se vyluˇ cuj´ıc´ımi v´ ysledky, kter´ e jsou stejnˇ e moˇ zn´ e. Pravdˇ epodobnost jevu, kter´ y nast´ av´ a pr´ avˇ e pˇri k z tˇ echto v´ ysledk˚ u, je k/n. 1. probl´ em: stejnˇ e moˇzn´ e“= stejnˇ e pravdˇ epodobn´ e,“ ale co to znamen´ a? (definice ” ” kruhem!) Element´ arn´ı jevy jsou vˇsechny stejnˇ e moˇzn´ e“ v´ ysledky. ”
2
2.1
Z´ akladn´ı pojmy teorie pravdˇ epodobnosti
Laplaceova (klasick´ a) definice pravdˇ epodobnosti
Pˇredpoklad: N´ ahodn´ y pokus s n ∈ N r˚ uzn´ ymi, vz´ ajemnˇ e se vyluˇ cuj´ıc´ımi v´ ysledky, kter´ e jsou stejnˇ e moˇ zn´ e. Pravdˇ epodobnost jevu, kter´ y nast´ av´ a pr´ avˇ e pˇri k z tˇ echto v´ ysledk˚ u, je k/n. 1. probl´ em: stejnˇ e moˇzn´ e“= stejnˇ e pravdˇ epodobn´ e,“ ale co to znamen´ a? (definice ” ” kruhem!) Element´ arn´ı jevy jsou vˇsechny stejnˇ e moˇzn´ e“ v´ ysledky. ” Mnoˇzina vˇsech element´ arn´ıch jev˚ u: Ω
2
2.1
Z´ akladn´ı pojmy teorie pravdˇ epodobnosti
Laplaceova (klasick´ a) definice pravdˇ epodobnosti
Pˇredpoklad: N´ ahodn´ y pokus s n ∈ N r˚ uzn´ ymi, vz´ ajemnˇ e se vyluˇ cuj´ıc´ımi v´ ysledky, kter´ e jsou stejnˇ e moˇ zn´ e. Pravdˇ epodobnost jevu, kter´ y nast´ av´ a pr´ avˇ e pˇri k z tˇ echto v´ ysledk˚ u, je k/n. 1. probl´ em: stejnˇ e moˇzn´ e“= stejnˇ e pravdˇ epodobn´ e,“ ale co to znamen´ a? (definice ” ” kruhem!) Element´ arn´ı jevy jsou vˇsechny stejnˇ e moˇzn´ e“ v´ ysledky. ” Mnoˇzina vˇsech element´ arn´ıch jev˚ u: Ω Jev: A ⊆ Ω
2
2.1
Z´ akladn´ı pojmy teorie pravdˇ epodobnosti
Laplaceova (klasick´ a) definice pravdˇ epodobnosti
Pˇredpoklad: N´ ahodn´ y pokus s n ∈ N r˚ uzn´ ymi, vz´ ajemnˇ e se vyluˇ cuj´ıc´ımi v´ ysledky, kter´ e jsou stejnˇ e moˇ zn´ e. Pravdˇ epodobnost jevu, kter´ y nast´ av´ a pr´ avˇ e pˇri k z tˇ echto v´ ysledk˚ u, je k/n. 1. probl´ em: stejnˇ e moˇzn´ e“= stejnˇ e pravdˇ epodobn´ e,“ ale co to znamen´ a? (definice ” ” kruhem!) Element´ arn´ı jevy jsou vˇsechny stejnˇ e moˇzn´ e“ v´ ysledky. ” Mnoˇzina vˇsech element´ arn´ıch jev˚ u: Ω Jev: A ⊆ Ω
´ Umluva. Jevy budeme ztotoˇzn ˇovat s pˇr´ısluˇsn´ ymi mnoˇzinami element´ arn´ıch jev˚ ua pouˇz´ıvat pro nˇ e mnoˇzinov´ e operace (m´ısto v´ yrokov´ ych).
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ”
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ” Disjunkce jev˚ u ( or“): A ∪ B ”
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ” Disjunkce jev˚ u ( or“): A ∪ B ” Jev opaˇ cn´ y k A: A = Ω \ A
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ” Disjunkce jev˚ u ( or“): A ∪ B ” Jev opaˇ cn´ y k A: A = Ω \ A A ⇒ B: A ⊆ B
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ” Disjunkce jev˚ u ( or“): A ∪ B ” Jev opaˇ cn´ y k A: A = Ω \ A A ⇒ B: A ⊆ B
Jevy nesluˇ citeln´ e (=vz´ ajemnˇ e se vyluˇ cuj´ıc´ı): A1, . . . , An :
T i≤n
Ai = ∅
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ” Disjunkce jev˚ u ( or“): A ∪ B ” Jev opaˇ cn´ y k A: A = Ω \ A A ⇒ B: A ⊆ B
Jevy nesluˇ citeln´ e (=vz´ ajemnˇ e se vyluˇ cuj´ıc´ı): A1, . . . , An :
T i≤n
Ai = ∅
Jevy po dvou nesluˇ citeln´ e: A1, . . . , An : ∀i, j ∈ {1, . . . , n}, i 6= j : Ai ∩ Aj = ∅
2.1.1
Z´ akladn´ı pojmy
Jev jist´ y: Ω, 1 Jev nemoˇ zn´ y: ∅, 0 Konjunkce jev˚ u ( and“): A ∩ B ” Disjunkce jev˚ u ( or“): A ∪ B ” Jev opaˇ cn´ y k A: A = Ω \ A A ⇒ B: A ⊆ B
Jevy nesluˇ citeln´ e (=vz´ ajemnˇ e se vyluˇ cuj´ıc´ı): A1, . . . , An :
T i≤n
Ai = ∅
Jevy po dvou nesluˇ citeln´ e: A1, . . . , An : ∀i, j ∈ {1, . . . , n}, i 6= j : Ai ∩ Aj = ∅
Jevov´ e pole: vˇsechny jevy pozorovateln´ e v n´ ahodn´ em pokusu, zde exp Ω (=mnoˇzina vˇsech podmnoˇzin mnoˇziny Ω)
2.1.2
Pravdˇ epodobnost
jevu A: P (A) =
kde | . | znaˇ c´ı poˇ cet prvk˚ u mnoˇziny
|A| , | Ω|
2.1.3
N´ ahodn´ a veliˇ cina
je libovoln´ a funkce X : Ω → R
2.1.3
N´ ahodn´ a veliˇ cina
je libovoln´ a funkce X : Ω → R Stˇredn´ı hodnota: 1 X EX = X (ω ) , n ω∈Ω kde n = |Ω|.
2.1.3
N´ ahodn´ a veliˇ cina
je libovoln´ a funkce X : Ω → R Stˇredn´ı hodnota: 1 X EX = X (ω ) , n ω∈Ω kde n = |Ω|. Pˇr´ıklad: Element´ arn´ı jevy jsou moˇzn´ e v´ ysledky hry, n´ ahodn´ a veliˇ cina je v´ yˇse v´ yhry. Stˇredn´ı hodnota je spravedliv´ a cena za u ´ˇ cast ve hˇre.
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i P (0) = 0,
P (1) = 1
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i P (0) = 0,
P (1) = 1
P (A) = 1 − P (A)
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i P (0) = 0,
P (1) = 1
P (A) = 1 − P (A) A ⊆ B ⇒ P (A) ≤ P (B )
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i P (0) = 0,
P (1) = 1
P (A) = 1 − P (A) A ⊆ B ⇒ P (A) ≤ P (B ) A ⊆ B ⇒ P (B \ A) = P (B ) − P (A)
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i P (0) = 0,
P (1) = 1
P (A) = 1 − P (A) A ⊆ B ⇒ P (A) ≤ P (B ) A ⊆ B ⇒ P (B \ A) = P (B ) − P (A) A ∩ B = ∅ ⇒ P (A ∪ B ) = P (A) + P (B )
(aditivita)
2.2
Vlastnosti pravdˇ epodobnosti
P (A) ∈ h0, 1i P (0) = 0,
P (1) = 1
P (A) = 1 − P (A) A ⊆ B ⇒ P (A) ≤ P (B ) A ⊆ B ⇒ P (B \ A) = P (B ) − P (A) A ∩ B = ∅ ⇒ P (A ∪ B ) = P (A) + P (B ) P (A ∪ B ) = P (A) + P (B ) − P (A ∩ B )
(aditivita)
2.2.1
´ y syst´ Upln´ em jev˚ u
tvoˇr´ı jevy Bi, i ∈ I , jestliˇze jsou po dvou nesluˇ citeln´ ea
S i∈I
Bi = 1.
2.2.1
´ y syst´ Upln´ em jev˚ u
tvoˇr´ı jevy Bi, i ∈ I , jestliˇze jsou po dvou nesluˇ citeln´ ea Speci´ aln´ı pˇr´ıpad pro 2 jevy: {C, C}
S i∈I
Bi = 1.
2.2.1
´ y syst´ Upln´ em jev˚ u
tvoˇr´ı jevy Bi, i ∈ I , jestliˇze jsou po dvou nesluˇ citeln´ ea
S i∈I
Speci´ aln´ı pˇr´ıpad pro 2 jevy: {C, C} Je-li {B1, . . . , Bn} u ´pln´ y syst´ em jev˚ u, pak n X
P (Bi) = 1
i=1
a pro libovoln´ y jev A P (A) =
n X
P (A ∩ Bi) .
i=1
Speci´ alnˇ e:
P (A) = P (A ∩ C ) + P A ∩ C .
Bi = 1.
2.3
Probl´ emy Laplaceovy definice pravdˇ epodobnosti
2.3
Probl´ emy Laplaceovy definice pravdˇ epodobnosti
2. probl´ em: Nedovoluje nekoneˇ cn´ e mnoˇziny jev˚ u, geometrickou pravdˇ epodobnost... Nelze m´ıt nekoneˇ cnˇ e mnoho stejnˇ e pravdˇ epodobn´ ych v´ ysledk˚ u.
2.3
Probl´ emy Laplaceovy definice pravdˇ epodobnosti
2. probl´ em: Nedovoluje nekoneˇ cn´ e mnoˇziny jev˚ u, geometrickou pravdˇ epodobnost... Nelze m´ıt nekoneˇ cnˇ e mnoho stejnˇ e pravdˇ epodobn´ ych v´ ysledk˚ u. Pˇr´ıklad: Pod´ıl plochy pevniny k povrchu Zemˇ e je pravdˇ epodobnost, ˇze n´ ahodnˇ e vybran´ y bod na Zemi leˇz´ı na pevninˇ e (je-li v´ ybˇ er bod˚ u prov´ adˇ en rovnomˇ ernˇ e“). ”
2.3
Probl´ emy Laplaceovy definice pravdˇ epodobnosti
2. probl´ em: Nedovoluje nekoneˇ cn´ e mnoˇziny jev˚ u, geometrickou pravdˇ epodobnost... Nelze m´ıt nekoneˇ cnˇ e mnoho stejnˇ e pravdˇ epodobn´ ych v´ ysledk˚ u. Pˇr´ıklad: Pod´ıl plochy pevniny k povrchu Zemˇ e je pravdˇ epodobnost, ˇze n´ ahodnˇ e vybran´ y bod na Zemi leˇz´ı na pevninˇ e (je-li v´ ybˇ er bod˚ u prov´ adˇ en rovnomˇ ernˇ e“). ” Pˇr´ıklad (Buffonova u ´loha): Na linkovan´ y pap´ır hod´ıme jehlu, jej´ıˇz d´ elka je rovna vzd´ alenosti mezi linkami. Jak´ a je pravdˇ epodobnost, ˇze jehla protne nˇ ejakou linku?
2.3
Probl´ emy Laplaceovy definice pravdˇ epodobnosti
2. probl´ em: Nedovoluje nekoneˇ cn´ e mnoˇziny jev˚ u, geometrickou pravdˇ epodobnost... Nelze m´ıt nekoneˇ cnˇ e mnoho stejnˇ e pravdˇ epodobn´ ych v´ ysledk˚ u. Pˇr´ıklad: Pod´ıl plochy pevniny k povrchu Zemˇ e je pravdˇ epodobnost, ˇze n´ ahodnˇ e vybran´ y bod na Zemi leˇz´ı na pevninˇ e (je-li v´ ybˇ er bod˚ u prov´ adˇ en rovnomˇ ernˇ e“). ” Pˇr´ıklad (Buffonova u ´loha): Na linkovan´ y pap´ır hod´ıme jehlu, jej´ıˇz d´ elka je rovna vzd´ alenosti mezi linkami. Jak´ a je pravdˇ epodobnost, ˇze jehla protne nˇ ejakou linku? 3. probl´ em: Nedovoluje iracion´ aln´ı hodnoty pravdˇ epodobnosti.
2.3.1
Rozˇs´ıˇren´ı Laplaceova modelu pravdˇ epodobnosti
Pˇr´ıklad: M´ısto hrac´ı kostky h´ az´ıme krabiˇ ckou od z´ apalek, jej´ıˇz strany jsou nestejnˇ e dlouh´ e. Jak´ a je pravdˇ epodobnost moˇzn´ ych v´ ysledk˚ u?
2.3.1
Rozˇs´ıˇren´ı Laplaceova modelu pravdˇ epodobnosti
Pˇr´ıklad: M´ısto hrac´ı kostky h´ az´ıme krabiˇ ckou od z´ apalek, jej´ıˇz strany jsou nestejnˇ e dlouh´ e. Jak´ a je pravdˇ epodobnost moˇzn´ ych v´ ysledk˚ u? Pˇripust´ıme, ˇze element´ arn´ı jevy nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e.
2.3.1
Rozˇs´ıˇren´ı Laplaceova modelu pravdˇ epodobnosti
Pˇr´ıklad: M´ısto hrac´ı kostky h´ az´ıme krabiˇ ckou od z´ apalek, jej´ıˇz strany jsou nestejnˇ e dlouh´ e. Jak´ a je pravdˇ epodobnost moˇzn´ ych v´ ysledk˚ u? Pˇripust´ıme, ˇze element´ arn´ı jevy nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e. Ztr´ ac´ıme n´ avod, jak pravdˇ epodobnost stanovit. Je to funkce, kter´ a jev˚ um pˇriˇrazuje ˇ c´ısla z intervalu h0, 1i a splˇ nuje jist´ e podm´ınky. Nem´ ame n´ avod, jak z nich vybrat tu pravou.
2.3.1
Rozˇs´ıˇren´ı Laplaceova modelu pravdˇ epodobnosti
Pˇr´ıklad: M´ısto hrac´ı kostky h´ az´ıme krabiˇ ckou od z´ apalek, jej´ıˇz strany jsou nestejnˇ e dlouh´ e. Jak´ a je pravdˇ epodobnost moˇzn´ ych v´ ysledk˚ u? Pˇripust´ıme, ˇze element´ arn´ı jevy nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e. Ztr´ ac´ıme n´ avod, jak pravdˇ epodobnost stanovit. Je to funkce, kter´ a jev˚ um pˇriˇrazuje ˇ c´ısla z intervalu h0, 1i a splˇ nuje jist´ e podm´ınky. Nem´ ame n´ avod, jak z nich vybrat tu pravou. Tato nev´ yhoda je neodstraniteln´ a a je d˚ uvodem pro vznik statistiky, kter´ a k dan´ emu opakovateln´ emu pokusu hled´ a pravdˇ epodobnostn´ı model.
2.4
Kombinatorick´ e pojmy a vzorce
ˇ ep´ (Dle [Zv´ ara, Stˇ an].) V urnˇ e je n rozliˇsiteln´ ych objekt˚ u, postupnˇ e vyt´ ahneme k.
2.4
Kombinatorick´ e pojmy a vzorce
ˇ ep´ (Dle [Zv´ ara, Stˇ an].) V urnˇ e je n rozliˇsiteln´ ych objekt˚ u, postupnˇ e vyt´ ahneme k. v´ ybˇ er uspoˇr´ adan´ y neuspoˇr´ adan´ y
s vracen´ım variace s opakov´ an´ım nk kombinace an´ım s opakov´ n+k−1 k
bez vracen´ı variace bez opakov´ an´ı n! (n−k)!
kombinace bez opakov´ an´ı n n! = k k! (n−k)!
Z t´ eto tabulky pouze kombinace s opakov´ an´ım nejsou vˇsechny stejnˇ e pravdˇ epodobn´ e (odpov´ıdaj´ı r˚ uzn´ emu poˇ ctu variac´ı s opakov´ an´ım) a nedovoluj´ı proto pouˇzit´ı Laplaceova modelu pravdˇ epodobnosti. Permutace (poˇrad´ı) bez opakov´ an´ı: Tvoˇr´ıme posloupnost z n hodnot, pˇriˇ cemˇz kaˇzd´ a se vyskytne pr´ avˇ e jednou. Poˇ cet permutac´ı je n! (je to speci´ aln´ı pˇr´ıpad variac´ı bez opakov´ an´ı pro n = k).
Permutace s opakov´ an´ım: Tvoˇr´ıme posloupnost d´ elky k z n hodnot, pˇriˇ cemˇz j -t´ a P hodnota se opakuje kj -kr´ at, n cet r˚ uzn´ ych posloupnost´ı je j=1 kj = k . Poˇ k! . k1 ! · . . . · kn !
Speci´ alnˇ e pro n = 2 dost´ av´ ame k k! k! = = , k1 ! · k2 ! k1! · (k − k1)! k1 coˇz je poˇ cet kombinac´ı bez opakov´ an´ı (ovˇsem k1-prvkov´ ych z k prvk˚ u).
n poˇ cet 4-prvkov´ ych variac´ı z n prvk˚ u n! bez opakov´ an´ı, (n−4)!
poˇ cet 4-prvkov´ ych variac´ı z n prvk˚ u s opakov´ an´ım, n4 poˇ cet 4-prvkov´ ych kombinac´ı z n prvk˚ u bez opakov´ an´ı, n4 poˇ cet 4-prvkov´ ych kombinac´ı z n prvk˚ u s opakov´ an´ım, n+3 4
4
10
100
1 000
10 000
24
5 040
94 109 400
0.994 · 1012
0.9994 · 1016
256
10 000
108
1012
1016
1
210
3 921 225
41 417 124 750
4. 164 · 1014
35
715
4 421 275
41 917 125 250
4. 169 · 1014
Vˇ eta. Pro dan´ e k ∈ N a pro n → ∞ se pomˇ er poˇ ct˚ u variac´ı (resp. kombinac´ı) bez opakov´ an´ı a s opakov´ an´ım bl´ıˇz´ı jedn´ e, tj. n! = 1, n→∞ (n − k )! nk
lim
n k lim n+k−1 = 1 . n→∞ k
D˚ usledek. Pro n k je poˇ cet variac´ı (resp. kombinac´ı) s opakov´ an´ım pˇribliˇznˇ e n! . = nk , (n − k)!
. nk = . k k!
n
Jednoduˇsˇs´ı b´ yv´ a neuspoˇr´ adan´ y v´ ybˇ er bez vracen´ı nebo uspoˇr´ adan´ y v´ ybˇ er s vracen´ım.
2.5
Kolmogorovova definice pravdˇ epodobnosti
2.5
Kolmogorovova definice pravdˇ epodobnosti
Element´ arn´ıch jev˚ u (=prvk˚ u mnoˇziny Ω) m˚ uˇze b´ yt nekoneˇ cnˇ e mnoho, nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e.
2.5
Kolmogorovova definice pravdˇ epodobnosti
Element´ arn´ıch jev˚ u (=prvk˚ u mnoˇziny Ω) m˚ uˇze b´ yt nekoneˇ cnˇ e mnoho, nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e. Jevy jsou podmnoˇziny mnoˇziny Ω, ale ne nutnˇ e vˇsechny; tvoˇr´ı podmnoˇzinu A ⊆ exp Ω, kter´ a splˇ nuje n´ asleduj´ıc´ı podm´ınky:
2.5
Kolmogorovova definice pravdˇ epodobnosti
Element´ arn´ıch jev˚ u (=prvk˚ u mnoˇziny Ω) m˚ uˇze b´ yt nekoneˇ cnˇ e mnoho, nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e. Jevy jsou podmnoˇziny mnoˇziny Ω, ale ne nutnˇ e vˇsechny; tvoˇr´ı podmnoˇzinu A ⊆ exp Ω, kter´ a splˇ nuje n´ asleduj´ıc´ı podm´ınky:
(A1) ∅ ∈ A.
(A2) A ∈ A ⇒ A ∈ A.
(A3) (∀n ∈ N : An ∈ A) ⇒
S n∈N
An ∈ A .
2.5
Kolmogorovova definice pravdˇ epodobnosti
Element´ arn´ıch jev˚ u (=prvk˚ u mnoˇziny Ω) m˚ uˇze b´ yt nekoneˇ cnˇ e mnoho, nemus´ı b´ yt stejnˇ e pravdˇ epodobn´ e. Jevy jsou podmnoˇziny mnoˇziny Ω, ale ne nutnˇ e vˇsechny; tvoˇr´ı podmnoˇzinu A ⊆ exp Ω, kter´ a splˇ nuje n´ asleduj´ıc´ı podm´ınky:
(A1) ∅ ∈ A.
(A2) A ∈ A ⇒ A ∈ A.
(A3) (∀n ∈ N : An ∈ A) ⇒
S
An ∈ A .
n∈N
Syst´ em A podmnoˇzin nˇ ejak´ e mnoˇziny Ω, kter´ y splˇ nuje podm´ınky (A1-3), se naz´ yv´ a σ -algebra.
D˚ usledky:
Ω = ∅ ∈ A, (∀n ∈ N : An ∈ A) ⇒
\ n∈N
An =
[ n∈N
An ∈ A .
D˚ usledky:
Ω = ∅ ∈ A, (∀n ∈ N : An ∈ A) ⇒
\ n∈N
An =
[
An ∈ A .
n∈N
Pˇrirozen´ y n´ apad A = exp Ω vede k neˇz´ adouc´ım paradox˚ um.
D˚ usledky:
Ω = ∅ ∈ A, (∀n ∈ N : An ∈ A) ⇒
\ n∈N
An =
[
An ∈ A .
n∈N
Pˇrirozen´ y n´ apad A = exp Ω vede k neˇz´ adouc´ım paradox˚ um. (A3) je uzavˇrenost na spoˇ cetn´ a sjednocen´ı.
D˚ usledky:
Ω = ∅ ∈ A, (∀n ∈ N : An ∈ A) ⇒
\ n∈N
An =
[
An ∈ A .
n∈N
Pˇrirozen´ y n´ apad A = exp Ω vede k neˇz´ adouc´ım paradox˚ um. (A3) je uzavˇrenost na spoˇ cetn´ a sjednocen´ı. Uzavˇrenost na jak´ akoli sjednocen´ı se ukazuje jako pˇr´ıliˇs siln´ y poˇzadavek.
D˚ usledky:
Ω = ∅ ∈ A, (∀n ∈ N : An ∈ A) ⇒
\ n∈N
An =
[
An ∈ A .
n∈N
Pˇrirozen´ y n´ apad A = exp Ω vede k neˇz´ adouc´ım paradox˚ um. (A3) je uzavˇrenost na spoˇ cetn´ a sjednocen´ı. Uzavˇrenost na jak´ akoli sjednocen´ı se ukazuje jako pˇr´ıliˇs siln´ y poˇzadavek. Uzavˇrenost na koneˇ cn´ a sjednocen´ı se ukazuje jako pˇr´ıliˇs slab´ y poˇzadavek; nedovoluje napˇr. vyj´ adˇrit kruh jako sjednocen´ı obd´ eln´ık˚ u.
D˚ usledky:
Ω = ∅ ∈ A, (∀n ∈ N : An ∈ A) ⇒
\ n∈N
An =
[
An ∈ A .
n∈N
Pˇrirozen´ y n´ apad A = exp Ω vede k neˇz´ adouc´ım paradox˚ um. (A3) je uzavˇrenost na spoˇ cetn´ a sjednocen´ı. Uzavˇrenost na jak´ akoli sjednocen´ı se ukazuje jako pˇr´ıliˇs siln´ y poˇzadavek. Uzavˇrenost na koneˇ cn´ a sjednocen´ı se ukazuje jako pˇr´ıliˇs slab´ y poˇzadavek; nedovoluje napˇr. vyj´ adˇrit kruh jako sjednocen´ı obd´ eln´ık˚ u. A nemus´ı ani obsahovat vˇsechny jednobodov´ e mnoˇziny, v tom pˇr´ıpadˇ e element´ arn´ı jevy nemus´ı b´ yt jevy!
2.5.1
Borelova σ -algebra
je nejmenˇs´ı σ -algebra podmnoˇzin R, kter´ a obsahuje vˇsechny intervaly.
2.5.1
Borelova σ -algebra
je nejmenˇs´ı σ -algebra podmnoˇzin R, kter´ a obsahuje vˇsechny intervaly. Obsahuje vˇsechny intervaly otevˇren´ e, uzavˇren´ e i polouzavˇren´ e, i jejich spoˇ cetn´ a sjednocen´ı, a nˇ ekter´ e dalˇs´ı mnoˇziny, ale je menˇs´ı neˇz exp R. Jej´ı prvky naz´ yv´ ame borelovsk´ e mnoˇ ziny.
2.5.2
Pravdˇ epodobnost (=pravdˇ epodobnostn´ı m´ıra)
je funkce P : A → h0, 1i, splˇ nuj´ıc´ı podm´ınky
(P1) P (1) = 1,
(P2) P
S
An =
n∈N
nesluˇ citeln´ e.
P n∈N
P (An), pokud jsou mnoˇziny (=jevy) An, n ∈ N, po dvou
(spoˇ cetn´ a aditivita)
2.5.2
Pravdˇ epodobnost (=pravdˇ epodobnostn´ı m´ıra)
je funkce P : A → h0, 1i, splˇ nuj´ıc´ı podm´ınky
(P1) P (1) = 1,
(P2) P
S
An =
n∈N
nesluˇ citeln´ e.
P n∈N
P (An), pokud jsou mnoˇziny (=jevy) An, n ∈ N, po dvou
(spoˇ cetn´ a aditivita)
Pravdˇ epodobnostn´ı prostor je trojice (Ω, A, P ), kde Ω je nepr´ azdn´ a mnoˇzina, A je σ -algebra podmnoˇzin mnoˇziny Ω a P : A → h0, 1i je pravdˇ epodobnost.
2.5.2
Pravdˇ epodobnost (=pravdˇ epodobnostn´ı m´ıra)
je funkce P : A → h0, 1i, splˇ nuj´ıc´ı podm´ınky
(P1) P (1) = 1,
(P2) P
S
An =
n∈N
nesluˇ citeln´ e.
P n∈N
P (An), pokud jsou mnoˇziny (=jevy) An, n ∈ N, po dvou
(spoˇ cetn´ a aditivita)
Pravdˇ epodobnostn´ı prostor je trojice (Ω, A, P ), kde Ω je nepr´ azdn´ a mnoˇzina, A je σ -algebra podmnoˇzin mnoˇziny Ω a P : A → h0, 1i je pravdˇ epodobnost. Dˇr´ıve uveden´ e vlastnosti pravdˇ epodobnosti jsou d˚ usledkem (P1), (P2).
(Koneˇ cn´ a) aditivita by byla pˇr´ıliˇs slab´ a, nedovoluje napˇr. pˇrechod od obsahu obd´ eln´ıka k obsahu kruhu.
(Koneˇ cn´ a) aditivita by byla pˇr´ıliˇs slab´ a, nedovoluje napˇr. pˇrechod od obsahu obd´ eln´ıka k obsahu kruhu. Pˇr´ıklad ( nekoneˇ cn´ a ruleta“): V´ ysledkem m˚ uˇze b´ yt libovoln´ e pˇrirozen´ eˇ c´ıslo, kaˇzd´ e ” m´ a pravdˇ epodobnost 0.
(Koneˇ cn´ a) aditivita by byla pˇr´ıliˇs slab´ a, nedovoluje napˇr. pˇrechod od obsahu obd´ eln´ıka k obsahu kruhu. Pˇr´ıklad ( nekoneˇ cn´ a ruleta“): V´ ysledkem m˚ uˇze b´ yt libovoln´ e pˇrirozen´ eˇ c´ıslo, kaˇzd´ e ” m´ a pravdˇ epodobnost 0. ´ a aditivita (pro jak´ Upln´ ekoli soubory po dvou nesluˇ citeln´ ych jev˚ u) by byla pˇr´ıliˇs siln´ ym poˇzadavkem. Pak bychom nepˇripouˇstˇ eli ani rovnomˇ ern´ e rozdˇ elen´ı na intervalu nebo na ploˇse.
(Koneˇ cn´ a) aditivita by byla pˇr´ıliˇs slab´ a, nedovoluje napˇr. pˇrechod od obsahu obd´ eln´ıka k obsahu kruhu. Pˇr´ıklad ( nekoneˇ cn´ a ruleta“): V´ ysledkem m˚ uˇze b´ yt libovoln´ e pˇrirozen´ eˇ c´ıslo, kaˇzd´ e ” m´ a pravdˇ epodobnost 0. ´ a aditivita (pro jak´ Upln´ ekoli soubory po dvou nesluˇ citeln´ ych jev˚ u) by byla pˇr´ıliˇs siln´ ym poˇzadavkem. Pak bychom nepˇripouˇstˇ eli ani rovnomˇ ern´ e rozdˇ elen´ı na intervalu nebo na ploˇse. Pravdˇ epodobnost zachov´ av´ a limity monot´ onn´ıch posloupnost´ı jev˚ u (mnoˇzin): Necht’ (An)n∈N je posloupnost jev˚ u. A1 ⊆ A2 ⊆ . . . ⇒ P A1 ⊇ A2 ⊇ . . . ⇒ P
[ n∈N \ n∈N
An = lim P (An) , n→∞
An = lim P (An) . n→∞
Laplace˚ uv model Kolmogorov˚ uv model koneˇ cnˇ e mnoho jev˚ u i nekoneˇ cnˇ e mnoho jev˚ u p-sti jen racion´ aln´ı p-sti i iracion´ aln´ı P (A) = 0 ⇒ A = 0 moˇ zn´ e jevy s nulovou p-st´ı p-sti urˇ ceny strukturou jev˚ u p-sti neurˇ ceny strukturou jev˚ u
3
3.1
Nez´ avislost a podm´ınˇ en´ a pravdˇ epodobnost
Nez´ avisl´ e jevy
Motivace: Dva jevy spolu nesouvis´ı“ ”
3
3.1
Nez´ avislost a podm´ınˇ en´ a pravdˇ epodobnost
Nez´ avisl´ e jevy
Motivace: Dva jevy spolu nesouvis´ı“ ” Definice: P (A ∩ B ) = P (A) · P (B ).
3
3.1
Nez´ avislost a podm´ınˇ en´ a pravdˇ epodobnost
Nez´ avisl´ e jevy
Motivace: Dva jevy spolu nesouvis´ı“ ” Definice: P (A ∩ B ) = P (A) · P (B ). To je ovˇsem jen n´ ahraˇzka, kter´ a ˇr´ık´ a mnohem m´ enˇ e, neˇz jsme chtˇ eli! (Podobnˇ e jako P (A ∩ B ) = 0 neznamen´ a, ˇze jevy A, B jsou nesluˇ citeln´ e.)
3
3.1
Nez´ avislost a podm´ınˇ en´ a pravdˇ epodobnost
Nez´ avisl´ e jevy
Motivace: Dva jevy spolu nesouvis´ı“ ” Definice: P (A ∩ B ) = P (A) · P (B ). To je ovˇsem jen n´ ahraˇzka, kter´ a ˇr´ık´ a mnohem m´ enˇ e, neˇz jsme chtˇ eli! (Podobnˇ e jako P (A ∩ B ) = 0 neznamen´ a, ˇze jevy A, B jsou nesluˇ citeln´ e.) Pro nez´ avisl´ e jevy A, B P (A ∪ B ) = P (A) + P (B ) − P (A) · P (B ) .
Jsou-li jevy A, B nez´ avisl´ e, pak jsou nez´ avisl´ e tak´ e jevy A, B (a t´ eˇz dvojice jev˚ u A, B a A, B ).
Jsou-li jevy A, B nez´ avisl´ e, pak jsou nez´ avisl´ e tak´ e jevy A, B (a t´ eˇz dvojice jev˚ u A, B a A, B ). Jevy A1, . . . , An se naz´ yvaj´ı po dvou nez´ avisl´ e, jestliˇze kaˇzd´ e dva z nich jsou nez´ avisl´ e.
Jsou-li jevy A, B nez´ avisl´ e, pak jsou nez´ avisl´ e tak´ e jevy A, B (a t´ eˇz dvojice jev˚ u A, B a A, B ). Jevy A1, . . . , An se naz´ yvaj´ı po dvou nez´ avisl´ e, jestliˇze kaˇzd´ e dva z nich jsou nez´ avisl´ e. To je m´ alo.
Jsou-li jevy A, B nez´ avisl´ e, pak jsou nez´ avisl´ e tak´ e jevy A, B (a t´ eˇz dvojice jev˚ u A, B a A, B ). Jevy A1, . . . , An se naz´ yvaj´ı po dvou nez´ avisl´ e, jestliˇze kaˇzd´ e dva z nich jsou nez´ avisl´ e. To je m´ alo. Mnoˇzina jev˚ u M se naz´ yv´ a nez´ avisl´ a, jestliˇze P
\ A∈K
Y
A =
A∈K
pro vˇsechny koneˇ cn´ e podmnoˇziny K ⊆ M.
P (A)
3.2
Podm´ınˇ en´ a pravdˇ epodobnost
Pˇr´ıklad: Fotbalov´ a druˇzstva mohla m´ıt pˇred z´ apasem rovn´ e ˇsance na v´ıtˇ ezstv´ı. Je-li vˇsak stav z´ apasu 5 minut pˇred koncem 3 : 0, pravdˇ epodobnosti v´ yhry jsou jin´ e.
3.2
Podm´ınˇ en´ a pravdˇ epodobnost
Pˇr´ıklad: Fotbalov´ a druˇzstva mohla m´ıt pˇred z´ apasem rovn´ e ˇsance na v´ıtˇ ezstv´ı. Je-li vˇsak stav z´ apasu 5 minut pˇred koncem 3 : 0, pravdˇ epodobnosti v´ yhry jsou jin´ e. M´ ame pravdˇ epodobnostn´ı popis syst´ emu. Dostaneme-li dodateˇ cnou informaci, ˇze nastal jev B , aktualizujeme naˇsi znalost o pravdˇ epodobnosti jevu A na P (A ∩ B ) , P (A|B ) = P (B )
coˇz je podm´ınˇ en´ a pravdˇ epodobnost jevu A za podm´ınky B . Je definov´ ana pouze pro P (B ) 6= 0. (To pˇredpokl´ ad´ ame i nad´ ale.)
3.2
Podm´ınˇ en´ a pravdˇ epodobnost
Pˇr´ıklad: Fotbalov´ a druˇzstva mohla m´ıt pˇred z´ apasem rovn´ e ˇsance na v´ıtˇ ezstv´ı. Je-li vˇsak stav z´ apasu 5 minut pˇred koncem 3 : 0, pravdˇ epodobnosti v´ yhry jsou jin´ e. M´ ame pravdˇ epodobnostn´ı popis syst´ emu. Dostaneme-li dodateˇ cnou informaci, ˇze nastal jev B , aktualizujeme naˇsi znalost o pravdˇ epodobnosti jevu A na P (A ∩ B ) , P (A|B ) = P (B )
coˇz je podm´ınˇ en´ a pravdˇ epodobnost jevu A za podm´ınky B . Je definov´ ana pouze pro P (B ) 6= 0. (To pˇredpokl´ ad´ ame i nad´ ale.) V nov´ em modelu je P (B|B ) = 0, coˇz odr´ aˇz´ı naˇsi znalost, ˇze jev B nenastal.
3.2
Podm´ınˇ en´ a pravdˇ epodobnost
Pˇr´ıklad: Fotbalov´ a druˇzstva mohla m´ıt pˇred z´ apasem rovn´ e ˇsance na v´ıtˇ ezstv´ı. Je-li vˇsak stav z´ apasu 5 minut pˇred koncem 3 : 0, pravdˇ epodobnosti v´ yhry jsou jin´ e. M´ ame pravdˇ epodobnostn´ı popis syst´ emu. Dostaneme-li dodateˇ cnou informaci, ˇze nastal jev B , aktualizujeme naˇsi znalost o pravdˇ epodobnosti jevu A na P (A ∩ B ) , P (A|B ) = P (B )
coˇz je podm´ınˇ en´ a pravdˇ epodobnost jevu A za podm´ınky B . Je definov´ ana pouze pro P (B ) 6= 0. (To pˇredpokl´ ad´ ame i nad´ ale.) V nov´ em modelu je P (B|B ) = 0, coˇz odr´ aˇz´ı naˇsi znalost, ˇze jev B nenastal. Podm´ınˇ en´ a pravdˇ epodobnost je ch´ ap´ ana t´ eˇz jako funkce P (.|B ) : A → h0, 1i ,
a je to pravdˇ epodobnost v p˚ uvodn´ım smyslu.
P (A ∩ B ) A 7→ P (B )
Vlastnosti podm´ınˇ en´ e pravdˇ epodobnosti:
• P (1|B ) = 1,
P (0|B ) = 0.
• Jsou-li jevy A1, A2, . . . jsou po dvou nesluˇ citeln´ e, pak X P A n B = P (An|B ) . n∈N n∈N [
• Je-li P (A|B ) definov´ ana, jsou jevy A, B nez´ avisl´ e, pr´ avˇ e kdyˇz P (A|B ) = P (A).
• B ⊆ A ⇒ P (A|B ) = 1,
P (A ∩ B ) = 0 ⇒ P (A|B ) = 0.
Vˇ eta o u ´pln´ e pravdˇ epodobnosti: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ u a ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A plat´ı P (A) =
X i∈I
P (Bi) P (A|Bi) .
Vˇ eta o u ´pln´ e pravdˇ epodobnosti: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ u a ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A plat´ı P (A) =
X
P (Bi) P (A|Bi) .
i∈I
D˚ ukaz: P (A) = P
[
Bj ∩ A = P
j∈I
=
X i∈I
P (Bi ∩ A) =
[
Bj ∩ A
j∈I
X i∈I
P (Bi) P (A|Bi) .
=
Vˇ eta o u ´pln´ e pravdˇ epodobnosti: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ u a ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A plat´ı P (A) =
X
P (Bi) P (A|Bi) .
i∈I
D˚ ukaz: P (A) = P
[
Bj ∩ A = P
j∈I
=
X i∈I
P (Bi ∩ A) =
[
Bj ∩ A
=
j∈I
X
P (Bi) P (A|Bi) .
i∈I
Pˇr´ıklad: Test nemoci je u 1% zdrav´ ych faleˇsnˇ e pozitivn´ı a u 10% nemocn´ ych faleˇsnˇ e negativn´ı. Nemocn´ ych je v populaci 0.001. Jak´ a je pravdˇ epodobnost, ˇze pacient s pozitivn´ım testem je nemocn´ y?
Bayesova vˇ eta: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ ua ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A splˇ nuj´ıc´ı P (A) 6= 0 plat´ı P (Bi) P (A|Bi) P (Bi|A) = P . P (Bj ) P (A|Bj ) j∈I
Bayesova vˇ eta: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ ua ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A splˇ nuj´ıc´ı P (A) 6= 0 plat´ı P (Bi) P (A|Bi) P (Bi|A) = P . P (Bj ) P (A|Bj ) j∈I
D˚ ukaz (s vyuˇzit´ım vˇ ety o u ´pln´ e pravdˇ epodobnosti): P (Bi ∩ A) P (Bi) P (A|Bi) P (Bi|A) = = P . P (A) P (Bj ) P (A|Bj ) j∈I
Bayesova vˇ eta: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ ua ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A splˇ nuj´ıc´ı P (A) 6= 0 plat´ı P (Bi) P (A|Bi) P (Bi|A) = P . P (Bj ) P (A|Bj ) j∈I
D˚ ukaz (s vyuˇzit´ım vˇ ety o u ´pln´ e pravdˇ epodobnosti): P (Bi ∩ A) P (Bi) P (A|Bi) P (Bi|A) = = P . P (A) P (Bj ) P (A|Bj ) j∈I
V´ yznam: Pravdˇ epodobnosti P (A|Bi) odhadneme z pokus˚ u nebo z modelu, pomoc´ı nich urˇ c´ıme pravdˇ epodobnosti P (Bi|A), kter´ e slouˇz´ı k optim´ aln´ımu“ od” hadu, kter´ y z jev˚ u Bi nastal.
Bayesova vˇ eta: Necht’ Bi, i ∈ I , je (spoˇ cetn´ y) u ´pln´ y syst´ em jev˚ ua ∀i ∈ I : P (Bi) 6= 0. Pak pro kaˇzd´ y jev A splˇ nuj´ıc´ı P (A) 6= 0 plat´ı P (Bi) P (A|Bi) P (Bi|A) = P . P (Bj ) P (A|Bj ) j∈I
D˚ ukaz (s vyuˇzit´ım vˇ ety o u ´pln´ e pravdˇ epodobnosti): P (Bi ∩ A) P (Bi) P (A|Bi) P (Bi|A) = = P . P (A) P (Bj ) P (A|Bj ) j∈I
V´ yznam: Pravdˇ epodobnosti P (A|Bi) odhadneme z pokus˚ u nebo z modelu, pomoc´ı nich urˇ c´ıme pravdˇ epodobnosti P (Bi|A), kter´ e slouˇz´ı k optim´ aln´ımu“ od” hadu, kter´ y z jev˚ u Bi nastal. Probl´ em: Ke stanoven´ı aposteriorn´ı pravdˇ epodobnosti P (Bi|A) potˇrebujeme zn´ at i apriorn´ı pravdˇ epodobnost P (Bi).
Pˇr´ıklad: Na vstupu informaˇ cn´ıho kan´ alu mohou b´ yt znaky 1, . . . , m, v´ yskyt znaku j oznaˇ cujeme jako jev Bj . Na v´ ystupu mohou b´ yt znaky 1, . . . , k, v´ yskyt znaku i oznaˇ cujeme jako jev Ai. (Obykle k = m, ale nen´ e.) Obvykle lze odhadnout ı to nutn´ podm´ınˇ en´ e pravdˇ epodˇ epodobnosti P Ai|Bj , ˇze znak j bude pˇrijat jako i. Pokud
zn´ ame apriorn´ı pravdˇ epodobnosti (vysl´ an´ı znaku j ) P Bj , m˚ uˇzeme pravdˇ epodobnosti pˇr´ıjmu znak˚ u vypoˇ c´ıtat maticov´ ym n´ asoben´ım: h
i
P (A1) P (A2) · · · P (Ak ) =
P (A1|B1) P (A2|B1) h i P (A |B ) P (A |B ) 1 2 2 2 = P (B1) P (B2) · · · P (Bm) · . . .. .. P (A1|Bm) P (A2|Bm)
· · · P (Ak |B1) · · · P (Ak |B2) . ... ... · · · P (Ak |Bm)
Vˇsechny matice v tomto vzorci maj´ı jednotkov´ e souˇ cty ˇr´ adk˚ u (takov´ e matice naz´ yv´ ame stochastick´ e). Podm´ınˇ en´ e rozdˇ elen´ı pravdˇ epodobnosti, pokud byl pˇrijat znak i, je
P Ai|Bj P Bj P Bj |Ai = . P (Ai)
Rozdˇ elen´ı pravdˇ epodobnost´ı vyslan´ ych znak˚ u je h
i
P (B1) P (B2) · · · P (Bm) =
P (A1|B1) P (A2|B1) h i P (A |B ) P (A |B ) 1 2 2 2 = P (A1) P (A2) · · · P (Ak ) · . . .. .. P (A1|Bm) P (A2|Bm)
pokud k = m a pˇr´ısluˇsn´ a inverzn´ı matice existuje.
−1 P (Ak |B1) P (Ak |B2) , ...
··· ··· ... · · · P (Ak |Bm)
Rozdˇ elen´ı pravdˇ epodobnost´ı vyslan´ ych znak˚ u je h
i
P (B1) P (B2) · · · P (Bm) =
P (A1|B1) P (A2|B1) h i P (A |B ) P (A |B ) 1 2 2 2 = P (A1) P (A2) · · · P (Ak ) · . . .. .. P (A1|Bm) P (A2|Bm)
−1 P (Ak |B1) P (Ak |B2) , ...
··· ··· ... · · · P (Ak |Bm)
pokud k = m a pˇr´ısluˇsn´ a inverzn´ı matice existuje.
3.2.1
Podm´ınˇ en´ a nez´ avislost
N´ ahodn´ e jevy A, B jsou podm´ınˇ enˇ e nez´ avisl´ e za podm´ınky C , jestliˇze P (A ∩ B|C ) = P (A|C ) P (B|C ) .
Podobnˇ e definujeme podm´ınˇ enou nez´ avislost v´ıce jev˚ u.
4
N´ ahodn´ e veliˇ ciny a vektory
Pˇr´ıklad: Auto v cenˇ e 10 000 EUR bude do roka ukradeno s pravdˇ epodobnost´ı 1 : 1 000. Adekv´ atn´ı cena roˇ cn´ıho pojistn´ eho (bez zisku pojiˇst’ovny) je 10 000/1 000 = 10 EUR.
4
N´ ahodn´ e veliˇ ciny a vektory
Pˇr´ıklad: Auto v cenˇ e 10 000 EUR bude do roka ukradeno s pravdˇ epodobnost´ı 1 : 1 000. Adekv´ atn´ı cena roˇ cn´ıho pojistn´ eho (bez zisku pojiˇst’ovny) je 10 000/1 000 = 10 EUR. Nˇ ekdy tento jednoduch´ y postup selh´ av´ a: Pˇr´ıklad: Pro stanoven´ı havarijn´ıho pojiˇstˇ en´ı potˇrebujeme zn´ at nejen pravdˇ epodobnost hav´ arie (resp. poˇ ctu hav´ ari´ı za pojistn´ e obdob´ı), ale i pr˚ umˇ ernou“ ˇskodu pˇri jedn´ e ” hav´ arii, l´ epe pravdˇ epodobnostn´ı rozdˇ elen´ı v´ yˇse ˇskody.
4
N´ ahodn´ e veliˇ ciny a vektory
Pˇr´ıklad: Auto v cenˇ e 10 000 EUR bude do roka ukradeno s pravdˇ epodobnost´ı 1 : 1 000. Adekv´ atn´ı cena roˇ cn´ıho pojistn´ eho (bez zisku pojiˇst’ovny) je 10 000/1 000 = 10 EUR. Nˇ ekdy tento jednoduch´ y postup selh´ av´ a: Pˇr´ıklad: Pro stanoven´ı havarijn´ıho pojiˇstˇ en´ı potˇrebujeme zn´ at nejen pravdˇ epodobnost hav´ arie (resp. poˇ ctu hav´ ari´ı za pojistn´ e obdob´ı), ale i pr˚ umˇ ernou“ ˇskodu pˇri jedn´ e ” hav´ arii, l´ epe pravdˇ epodobnostn´ı rozdˇ elen´ı v´ yˇse ˇskody. ⇒ Mus´ıme studovat i n´ ahodn´ e pokusy, jejichˇz v´ ysledky nejsou jen dva (jev nastal/nenastal), ale v´ıce hodnot, vyj´ adˇren´ ych re´ aln´ ymi ˇ c´ısly.
4.1
N´ ahodn´ a veliˇ cina
na pravdˇ epodobnostn´ım prostoru (Ω, A, P ) je mˇ eˇriteln´ a funkce X : Ω → R, tj. takov´ a, ˇze pro kaˇzd´ y interval I plat´ı X −1(I ) = {ω ∈ Ω | X (ω ) ∈ I} ∈ A
4.1
N´ ahodn´ a veliˇ cina
na pravdˇ epodobnostn´ım prostoru (Ω, A, P ) je mˇ eˇriteln´ a funkce X : Ω → R, tj. takov´ a, ˇze pro kaˇzd´ y interval I plat´ı X −1(I ) = {ω ∈ Ω | X (ω ) ∈ I} ∈ A
Je popsan´ a pravdˇ epodobnostmi PX (I ) = P [X ∈ I ] = P ({ω ∈ Ω | X (ω ) ∈ I}) ,
definovan´ ymi pro libovoln´ y interval I (a tedy i pro libovoln´ e sjednocen´ı spoˇ cetnˇ e mnoha interval˚ u a pro libovolnou borelovskou mnoˇzinu). PX je pravdˇ epodobnostn´ı m´ıra na Borelovˇ e σ -algebˇre urˇ cuj´ıc´ı rozdˇ elen´ı n´ ahodn´ e veliˇ ciny X .
K tomu, aby staˇ cila znalost PX na intervalech, se potˇrebujeme omezit na tzv. perfektn´ı m´ıry ; s jin´ ymi se v praxi nesetk´ ame.
Pravdˇ epodobnostn´ı m´ıra PX splˇ nuje podm´ınky: PX (R) = 1,
PX
S n∈N
In =
P n∈N
PX (In), pokud jsou mnoˇziny In, n ∈ N, navz´ ajem disjunktn´ı.
Pravdˇ epodobnostn´ı m´ıra PX splˇ nuje podm´ınky: PX (R) = 1,
PX
S
In =
n∈N
P n∈N
PX (In), pokud jsou mnoˇziny In, n ∈ N, navz´ ajem disjunktn´ı.
Z toho vypl´ yv´ a: PX (∅) = 0,
PX (R \ I ) = 1 − PX (I ),
jestliˇze I ⊆ J , pak PX (I ) ≤ PX (J ) a PX (J \ I ) = PX (J )−PX (I ).
´ Uspornˇ ejˇs´ı reprezentace: omez´ıme se na intervaly tvaru I = (−∞, ti, t ∈ R, P [X ∈ (−∞, ti] = P [X ≤ t] = PX ((−∞, ti) = FX (t) . FX : R → h0, 1i je distribuˇ cn´ı funkce n´ ahodn´ e veliˇ ciny X . Ta staˇ c´ı, nebot’
(a, bi = (−∞, bi \ (−∞, ai , (a, ∞) = R \ (−∞, ai , S (−∞, a) = (−∞, bi , b: b
{a} = (−∞, ai \ (−∞, a) , ...
PX ((a, bi) = P [a < X ≤ b] = FX (b) − FX (a) , PX ((a, ∞)) = 1 − FX (a) , PX ((−∞, a)) = P [X < a] = lim FX (b) = FX (a−) b→a−
PX ({a}) = P [X = a] = FX (a) − FX (a−) , ...
Vlastnosti distribuˇ cn´ı funkce:
• neklesaj´ıc´ı,
• zprava spojit´ a,
•
lim FX (t) = 0,
t→−∞
lim FX (t) = 1.
t→∞
Vˇ eta: Tyto podm´ınky jsou nejen nutn´ e, ale i postaˇ cuj´ıc´ı.
Pˇr´ıklad: Re´ aln´ emu ˇ c´ıslu r odpov´ıd´ a n´ ahodn´ a veliˇ cina (znaˇ cen´ a t´ eˇz r) s Diracov´ ym rozdˇ elen´ım v r: (
Pr (I ) =
0 pro r ∈ / I, 1 pro r ∈ I ,
(Fr je posunut´ a Heavisideova funkce.)
(
Fr (t) =
0 pro t < r , 1 pro t ≥ r .
Pˇr´ıklad: Re´ aln´ emu ˇ c´ıslu r odpov´ıd´ a n´ ahodn´ a veliˇ cina (znaˇ cen´ a t´ eˇz r) s Diracov´ ym rozdˇ elen´ım v r: (
Pr (I ) =
0 pro r ∈ / I, 1 pro r ∈ I ,
(Fr je posunut´ a Heavisideova funkce.) Tvrzen´ı: X ≤ Y ⇒ FX ≥ FY .
(
Fr (t) =
0 pro t < r , 1 pro t ≥ r .
4.2
n-rozmˇ ern´ y n´ ahodn´ y vektor (n-rozmˇ ern´ a n´ ahodn´ a veliˇ cina)
na pravdˇ epodobnostn´ım prostoru (Ω, A, P ) je mˇ eˇriteln´ a funkce X : Ω → Rn, tj. takov´ a, ˇze pro kaˇzd´ y n-rozmˇ ern´ y interval I plat´ı
X −1(I ) = {ω ∈ Ω | X (ω ) ∈ I} ∈ A . Lze ps´ at
X (ω ) = (X1 (ω ) , . . . , Xn (ω )) , kde zobrazen´ı Xk : Ω → R, k = 1, . . . , n, jsou n´ ahodn´ e veliˇ ciny. N´ ahodn´ y vektor lze povaˇzovat za vektor n´ ahodn´ ych veliˇ cin X = (X1, . . . , Xn).
Je popsan´ y pravdˇ epodobnostmi PX (I1 × . . . × In) = P [X1 ∈ I1, . . . , Xn ∈ In] = = P ({ω ∈ Ω | X1 (ω ) ∈ I1, . . . , Xn (ω ) ∈ In}) ,
kde I1, . . . , In jsou intervaly v R. Z tˇ ech vypl´ yvaj´ı pravdˇ epodobnosti PX (I ) = P [X ∈ I ] = P ({ω ∈ Ω | X (ω ) ∈ I}) ,
definovan´ e pro libovolnou borelovskou mnoˇzinu I v Rn (speci´ alnˇ e pro libovoln´ e sjednocen´ı spoˇ cetnˇ e mnoha n-rozmˇ ern´ ych interval˚ u) a urˇ cuj´ıc´ı rozdˇ elen´ı n´ ahodn´ eho vektoru X .
´ Uspornˇ ejˇs´ı reprezentace: Staˇ c´ı intervaly tvaru Ik = (−∞, tk i, tk ∈ R, P [X1 ∈ (−∞, t1i, . . . , Xn ∈ (−∞, tni] = P [X1 ≤ t1, . . . , Xn ≤ tn] = = PX ((−∞, t1i × . . . × (−∞, tni) =
= FX (t1, . . . , tn) . FX : Rn → h0, 1i je distribuˇ cn´ı funkce n´ ahodn´ eho vektoru X . Je • neklesaj´ıc´ı (ve vˇsech promˇ enn´ ych),
• zprava spojit´ a (ve vˇsech promˇ enn´ ych),
•
lim
t1 →∞,...,tn →∞
FX (t1, . . . , tn) = 1,
• ∀k ∈ {1, . . . , n} ∀t1, . . . , tk−1, tk+1, . . . , tn : lim FX (t1, . . . , tn) = 0. tk →−∞
Vˇ eta: Tyto podm´ınky jsou nutn´ e, nikoli postaˇ cuj´ıc´ı.
Vˇ eta: Tyto podm´ınky jsou nutn´ e, nikoli postaˇ cuj´ıc´ı. Nestaˇ c´ı zn´ at margin´ aln´ı rozdˇ elen´ı n´ ahodn´ ych veliˇ cin X1, . . . , Xn, nebot’ ta neobsahuj´ı informace o z´ avislosti.
4.3
Nez´ avislost n´ ahodn´ ych veliˇ cin
N´ ahodn´ e veliˇ ciny X1, X2 jsou nez´ avisl´ e, pokud pro vˇsechny intervaly I1, I2 jsou jevy X1 ∈ I1, X2 ∈ I2 nez´ avisl´ e, tj. P [X1 ∈ I1, X2 ∈ I2] = P [X1 ∈ I1] · P [X2 ∈ I2] .
Staˇ c´ı se omezit na intervaly tvaru (−∞, ti, tj. P [X1 ≤ t1, X2 ≤ t2] = P [X1 ≤ t1] · P [X2 ≤ t2] ,
neboli FX1,X2 (t1, t2) = FX1 (t1) · FX2 (t2)
pro vˇsechna t1, t2 ∈ R. N´ ahodn´ e veliˇ ciny X1, . . . , Xn jsou nez´ avisl´ e, pokud pro libovoln´ e intevaly I1, . . . , In plat´ı n Y
P [X1 ∈ I1, . . . , Xn ∈ In] =
P [Xi ∈ Ii] .
i=1
Na rozd´ıl od definice nez´ avislosti v´ıce neˇz 2 jev˚ u, zde nen´ı tˇreba poˇzadovat nez´ avislost pro libovolnou podmnoˇzinu n´ ahodn´ ych veliˇ cin X1, . . . , Xn. Ta vypl´ yv´ a z toho, ˇze libovolnou n´ ahodnou veliˇ cinu Xi lze vynechat“ tak, ˇze zvol´ıme pˇr´ısluˇsn´ y interval ” Ii = R. Pak P [Xi ∈ Ii] = 1 a v souˇ cinu se tento ˇ cinitel neprojev´ı. Ekvivalentnˇ e staˇ c´ı poˇzadovat P [X1 ≤ t1, . . . , Xn ≤ tn] =
n Y
P [Xi ≤ ti]
i=1
pro vˇsechna t1, . . . , tn ∈ R, coˇz pro sdruˇzenou distribuˇ cn´ı funkci nez´ avisl´ ych n´ ahodn´ ych veliˇ cin znamen´ a FX (t1, . . . , tn) =
n Y k=1
FXk (tk ) .
N´ ahodn´ e veliˇ ciny X1, . . . , Xn jsou po dvou nez´ avisl´ e, pokud kaˇzd´ e dvˇ e (r˚ uzn´ e) z nich jsou nez´ avisl´ e. To je slabˇs´ı podm´ınka neˇz nez´ avislost veliˇ cin X1, . . . , Xn.
4.4
Obecnˇ ejˇs´ı n´ ahodn´ e veliˇ ciny
Komplexn´ı n´ ahodn´ a veliˇ cina je n´ ahodn´ y vektor se dvˇ ema sloˇzkami interpretovan´ ymi jako re´ aln´ a a imagin´ arn´ı ˇ c´ ast. Nˇ ekdy pˇripouˇst´ıme i n´ ahodn´ e veliˇ ciny“, jejichˇz hodnoty jsou jin´ e neˇz numerick´ e. ” Mohou to b´ yt napˇr. n´ ahodn´ e mnoˇziny. Jindy nab´ yvaj´ı koneˇ cnˇ e mnoha hodnot, kter´ ym ponech´ ame jejich pˇrirozen´ e oznaˇ cen´ı, napˇr. rub“, l´ıc“, k´ amen“, n˚ uˇzky“, ” ” ” ” pap´ır“ apod. ” Na tˇ echto hodnot´ ach nemus´ı b´ yt definovan´ a ˇz´ adn´ a aritmetika ani uspoˇr´ ad´ an´ı. Mohli bychom vˇsechny hodnoty oˇ c´ıslovat, ale nen´ı ˇz´ adn´ y d˚ uvod, proˇ c bychom to mˇ eli udˇ elat pr´ avˇ e urˇ cit´ ym zp˚ usobem (kter´ y by ovlivnil n´ asledn´ e numerick´ e v´ ypoˇ cty). ˇ ıslov´ (Pˇr´ıklad: C´ an´ı politick´ ych stran ve volb´ ach.)
4.5
Smˇ es n´ ahodn´ ych veliˇ cin
Pˇr´ıklad: N´ ahodn´ e veliˇ ciny U, V jsou v´ ysledky studenta pˇri odpovˇ ed´ıch na dvˇ e zkouˇskov´ e ot´ azky. Uˇ citel n´ ahodnˇ e vybere s pravdˇ epodobnost´ı c prvn´ı ot´ azku, s pravdˇ epodobnost´ı 1 −c druhou; podle odpovˇ edi na vybranou ot´ azku udˇ el´ı zn´ amku. Jak´ e rozdˇ elen´ı m´ a v´ ysledn´ a zn´ amka X ?
4.5
Smˇ es n´ ahodn´ ych veliˇ cin
Pˇr´ıklad: N´ ahodn´ e veliˇ ciny U, V jsou v´ ysledky studenta pˇri odpovˇ ed´ıch na dvˇ e zkouˇskov´ e ot´ azky. Uˇ citel n´ ahodnˇ e vybere s pravdˇ epodobnost´ı c prvn´ı ot´ azku, s pravdˇ epodobnost´ı 1 −c druhou; podle odpovˇ edi na vybranou ot´ azku udˇ el´ı zn´ amku. Jak´ e rozdˇ elen´ı m´ a v´ ysledn´ a zn´ amka X ? Matematick´ y model vyˇzaduje vytvoˇren´ı odpov´ıdaj´ıc´ıho pravdˇ epodobnostn´ıho prostoru pro tento pokus. X naz´ yv´ ame smˇ es n´ ahodn´ ych veliˇ cin U, V s koeficientem c (angl. mixture), znaˇ c´ıme Mixc(U, V ). M´ a pravdˇ epodobnostn´ı m´ıru PX = c PU + (1 − c) PV
a distribuˇ cn´ı funkci FX = c FU + (1 − c) FV .
Podobnˇ e definujeme obecnˇ eji smˇ es n´ ahodn´ ych veliˇ cin U1, . . . , Un s koeficienty n P c1, . . . , cn ∈ h0, 1i, ci = 1, znaˇ c´ıme Mix(c1,..., cn)(U1, . . . , Un) = Mixc(U1, . . . , Un), i=1
kde c = (c1, . . . , cn). M´ a pravdˇ epodobnostn´ı m´ıru n P i=1
n P i=1
ci PUi a distribuˇ cn´ı funkci
ci FUi . (Lze zobecnit i na spoˇ cetnˇ e mnoho n´ ahodn´ ych veliˇ cin.)
Pod´ıl jednotliv´ ych sloˇzek je urˇ cen vektorem koeficient˚ u c = (c1, . . . , cn). Jejich poˇ cet je stejn´ y jako poˇ cet n´ ahodn´ ych veliˇ cin ve smˇ esi. Jelikoˇz cn = 1 −
n−1 P i=1
ci ,
posledn´ı koeficient nˇ ekdy vynech´ av´ ame. Speci´ alnˇ e pro dvˇ e n´ ahodn´ e veliˇ ciny Mix(c,1−c)(U, V ) = Mixc(U, V ) (kde c je ˇ c´ıslo, nikoli vektor).
Pˇr´ıklad: Smˇ es´ı re´ aln´ ych ˇ c´ısel r1, . . . , rn s koeficienty c1, . . . , cn je n´ ahodn´ a veliˇ cina X = Mix(c1,..., cn)(r1, . . . , rn), PX (I ) = P [X ∈ I ] =
X
ci ,
FX (t) =
X
ci .
i:ri ≤t
i:ri ∈I
Lze ji popsat t´ eˇz pravdˇ epodobnostn´ı funkc´ı pX : R → h0, 1i, (
pX (t) = PX ({t}) = P [X = t] =
ci pro t = ri , 0 jinak
(pokud jsou r1, . . . , rn navz´ ajem r˚ uzn´ a). Moˇzno zobecnit i na spoˇ cetnˇ e mnoho re´ aln´ ych ˇ c´ısel.
4.6
Druhy n´ ahodn´ ych veliˇ cin
1. Diskr´ etn´ı: (z pˇredchoz´ıho pˇr´ıkladu) Existuje spoˇ cetn´ a mnoˇzina OX , pro kterou PX (R \ OX ) = P [X ∈ / OX ] = 0. Nejmenˇs´ı takov´ a mnoˇzina (pokud existuje) je ΩX = {t ∈ R : PX ({t}) 6= 0} = {t ∈ R : P [X = t] 6= 0}. Diskr´ etn´ı n´ ahodnou veliˇ cinu popisuje pravdˇ epodobnostn´ı funkce pX (t) = PX ({t}) P [X = t]. Splˇ nuje
P t∈R
pX (t) = 1.
4.6
Druhy n´ ahodn´ ych veliˇ cin
1. Diskr´ etn´ı: (z pˇredchoz´ıho pˇr´ıkladu) Existuje spoˇ cetn´ a mnoˇzina OX , pro kterou PX (R \ OX ) = P [X ∈ / OX ] = 0. Nejmenˇs´ı takov´ a mnoˇzina (pokud existuje) je ΩX = {t ∈ R : PX ({t}) 6= 0} = {t ∈ R : P [X = t] 6= 0}. Diskr´ etn´ı n´ ahodnou veliˇ cinu popisuje pravdˇ epodobnostn´ı funkce pX (t) = PX ({t}) P [X = t]. Splˇ nuje
P t∈R
pX (t) = 1.
2. Spojit´ a: M´ a spojitou distribuˇ cn´ı funkci.
4.6
Druhy n´ ahodn´ ych veliˇ cin
1. Diskr´ etn´ı: (z pˇredchoz´ıho pˇr´ıkladu) Existuje spoˇ cetn´ a mnoˇzina OX , pro kterou PX (R \ OX ) = P [X ∈ / OX ] = 0. Nejmenˇs´ı takov´ a mnoˇzina (pokud existuje) je ΩX = {t ∈ R : PX ({t}) 6= 0} = {t ∈ R : P [X = t] 6= 0}. Diskr´ etn´ı n´ ahodnou veliˇ cinu popisuje pravdˇ epodobnostn´ı funkce pX (t) = PX ({t}) P [X = t]. Splˇ nuje
P t∈R
pX (t) = 1.
2. Spojit´ a: M´ a spojitou distribuˇ cn´ı funkci.
3. Sm´ıˇsen´ a: Smˇ es pˇredchoz´ıch dvou pˇr´ıpad˚ u; ΩX 6= ∅, PX (R \ ΩX ) = P [X ∈ / ΩX ] 6= 0.
4.7
Popis spojit´ e n´ ahodn´ e veliˇ ciny
N´ ahodn´ a veliˇ cina X je absolutnˇ e spojit´ a, jestliˇze existuje nez´ aporn´ a funkce fX : R → h0, ∞) (hustota n´ ahodn´ e veliˇ ciny X ) takov´ a, ˇze FX (t) =
Hustota splˇ nuje
∞ R −∞
Z t −∞
fX (u) du .
fX (u) du = 1.
Nen´ı urˇ cena jednoznaˇ cnˇ e, ale dvˇ e hustoty fX , gX t´ eˇze n´ ahodn´ e veliˇ ciny splˇ nuj´ı R sechny intervaly I . I (fX (x) − gX (x)) dx = 0 pro vˇ Lze volit fX (t) =
dFX (t) dt ,
pokud derivace existuje.
PX ({t}) = 0 pro vˇsechna t.
4.7
Popis spojit´ e n´ ahodn´ e veliˇ ciny
N´ ahodn´ a veliˇ cina X je absolutnˇ e spojit´ a, jestliˇze existuje nez´ aporn´ a funkce fX : R → h0, ∞) (hustota n´ ahodn´ e veliˇ ciny X ) takov´ a, ˇze FX (t) =
Hustota splˇ nuje
∞ R −∞
Z t −∞
fX (u) du .
fX (u) du = 1.
Nen´ı urˇ cena jednoznaˇ cnˇ e, ale dvˇ e hustoty fX , gX t´ eˇze n´ ahodn´ e veliˇ ciny splˇ nuj´ı R sechny intervaly I . I (fX (x) − gX (x)) dx = 0 pro vˇ Lze volit fX (t) =
dFX (t) dt ,
pokud derivace existuje.
PX ({t}) = 0 pro vˇsechna t.
Nˇ ekter´ e spojit´ e n´ ahodn´ e veliˇ ciny nejsou absolutnˇ e spojit´ e; maj´ı spojitou distribuˇ cn´ı
funkci, kterou nelze vyj´ adˇrit jako integr´ al. Tyto pˇr´ıpady d´ ale neuvaˇzujeme.
4.8
Popis sm´ıˇsen´ e n´ ahodn´ e veliˇ ciny
N´ ahodnou veliˇ cinu X se sm´ıˇsen´ ym rozdˇ elen´ım nelze popsat ani pravdˇ epodobnostn´ı funkc´ı (existuje, ale neurˇ cuje cel´ e rozdˇ elen´ı) ani hustotou (neexistuje, nevych´ az´ı koneˇ cn´ a), ale lze ji jednoznaˇ cnˇ e vyj´ adˇrit ve tvaru X = Mixc(U, V ), kde U je diskr´ etn´ı, V je spojit´ a a c ∈ (0, 1): pX (t) = P [X = t] = lim FX (t) − lim FX (t) , u→t+
c=
X
u→t−
pX (t) ,
t∈R
c pU (t) = pX (t) , pX (t) pU (t) = , c c FU (t) + (1 − c) FV (t) = FX (t) , F (t) − c FU (t) FV (t) = X . 1−c (Lze jeˇstˇ e pokraˇ covat rozkladem diskr´ etn´ı ˇ c´ asti na smˇ es Diracov´ ych rozdˇ elen´ı.)
4.9
Kvantilov´ a funkce n´ ahodn´ e veliˇ ciny
Pˇr´ıklad. Pokud absolvent ˇskoly ˇr´ık´ a, ˇze patˇr´ı mezi 5 % nejlepˇs´ıch, pak tvrd´ı, ˇze distribuˇ cn´ı funkce prospˇ echu (n´ ahodnˇ e vybran´ eho absolventa) m´ a u jeho prospˇ echu hodnotu nejv´ yˇse 0.05. (Pˇredpokl´ ad´ ame, ˇze lepˇs´ımu prospˇ echu odpov´ıd´ a niˇzˇs´ı pr˚ umˇ er zn´ amek.) Neostr´ a nerovnost v definici znamen´ a, ˇze hodnota distribuˇ cn´ı funkce ud´ av´ a pod´ıl tˇ ech absolvent˚ u, kteˇr´ı mˇ eli lepˇs´ı nebo stejn´ y prospˇ ech.
4.9
Kvantilov´ a funkce n´ ahodn´ e veliˇ ciny
Pˇr´ıklad. Pokud absolvent ˇskoly ˇr´ık´ a, ˇze patˇr´ı mezi 5 % nejlepˇs´ıch, pak tvrd´ı, ˇze distribuˇ cn´ı funkce prospˇ echu (n´ ahodnˇ e vybran´ eho absolventa) m´ a u jeho prospˇ echu hodnotu nejv´ yˇse 0.05. (Pˇredpokl´ ad´ ame, ˇze lepˇs´ımu prospˇ echu odpov´ıd´ a niˇzˇs´ı pr˚ umˇ er zn´ amek.) Neostr´ a nerovnost v definici znamen´ a, ˇze hodnota distribuˇ cn´ı funkce ud´ av´ a pod´ıl tˇ ech absolvent˚ u, kteˇr´ı mˇ eli lepˇs´ı nebo stejn´ y prospˇ ech. Obr´ acenˇ e se lze pt´ at, jak´ y prospˇ ech je potˇreba k tomu, aby se absolvent dostal mezi 5 % nejlepˇs´ıch.
4.9
Kvantilov´ a funkce n´ ahodn´ e veliˇ ciny
Pˇr´ıklad. Pokud absolvent ˇskoly ˇr´ık´ a, ˇze patˇr´ı mezi 5 % nejlepˇs´ıch, pak tvrd´ı, ˇze distribuˇ cn´ı funkce prospˇ echu (n´ ahodnˇ e vybran´ eho absolventa) m´ a u jeho prospˇ echu hodnotu nejv´ yˇse 0.05. (Pˇredpokl´ ad´ ame, ˇze lepˇs´ımu prospˇ echu odpov´ıd´ a niˇzˇs´ı pr˚ umˇ er zn´ amek.) Neostr´ a nerovnost v definici znamen´ a, ˇze hodnota distribuˇ cn´ı funkce ud´ av´ a pod´ıl tˇ ech absolvent˚ u, kteˇr´ı mˇ eli lepˇs´ı nebo stejn´ y prospˇ ech. Obr´ acenˇ e se lze pt´ at, jak´ y prospˇ ech je potˇreba k tomu, aby se absolvent dostal mezi 5 % nejlepˇs´ıch.
Pro α ∈ (0, 1) hled´ ame t ∈ R takov´ e, ˇze FX (t) = α. M´ ame vˇsak zaruˇ ceno pouze, ˇze
∃t ∈ R : P [X < t] ≤ α ≤ P [X ≤ t] = FX (t) .
Vˇsechna takov´ a t tvoˇr´ı omezen´ y interval a vezmeme z nˇ ej (obvykle) stˇred, pˇresnˇ eji tedy qX (α) =
1 (sup {t ∈ R | P [X < t] ≤ α} + inf {t ∈ R | P [X ≤ t] ≥ α}) . 2
2
q(a) 1
0
0.2
0.6 a
–1
–2
1
ˇ ıslo qX (α) se naz´ C´ yv´ a α-kvantil n´ ahodn´ e veliˇ ciny X a funkce qX : (0, 1) → R je kvantilov´ a funkce n´ ahodn´ e veliˇ ciny X . Speci´ alnˇ e qX ( 12 ) je medi´ an, dalˇs´ı kvantily maj´ı tak´ e sv´ a jm´ ena – tercil, kvartil (doln´ı qX ( 14 ), horn´ı qX ( 34 )) ... decil ... centil neboli percentil .... Vlastnosti kvantilov´ e funkce: • neklesaj´ıc´ı, • qX (α) = 21 (qX (α−) + qX (α+)).
Vˇ eta: Tyto podm´ınky jsou nutn´ e i postaˇ cuj´ıc´ı. Obr´ acen´ y pˇrevod: FX (t) = inf {α ∈ (0, 1) | qX (α) > t} = sup{α ∈ (0, 1) | qX (α) ≤ t} .
Funkce FX , qX jsou navz´ ajem inverzn´ı tam, kde jsou spojit´ e a rostouc´ı (tyto podm´ınky staˇ c´ı ovˇ eˇrit pro jednu z nich).
4.10
Jak reprezentovat n´ ahodnou veliˇ cinu v poˇ c´ıtaˇ ci
1. Diskr´ etn´ı: Nab´ yv´ a-li pouze koneˇ cn´ eho poˇ ctu hodnot tk , k = 1, . . . , n, staˇ c´ı k reprezentaci tyto hodnoty a jejich pravdˇ epodobnosti pX (tk ) = PX ({tk }) = P [X = tk ], ˇ c´ımˇz je plnˇ e pops´ ana pravdˇ epodobnostn´ı funkce 2n ˇ c´ısly (aˇz na nepˇresnost zobrazen´ı re´ aln´ ych ˇ c´ısel v poˇ c´ıtaˇ ci).
Pokud diskr´ etn´ı n´ ahodn´ a veliˇ cina nab´ yv´ a (spoˇ cetnˇ e) nekoneˇ cnˇ e mnoha hodnot, mus´ıme nˇ ekter´ e vynechat, zejm´ ena ty, kter´ e jsou m´ alo pravdˇ epodobn´ e. Pro kaˇzd´ e ε > 0 lze vybrat koneˇ cnˇ e mnoho hodnot tk , k = 1, . . . , n, tak, ˇze PX (R{t1, . . . , tn}) = P [X ∈ / {t1, . . . , tn}] ≤ ε. Zb´ yv´ a vˇsak probl´ em, jakou hodnotu pˇriˇradit zb´ yvaj´ıc´ım (byt’ m´ alo pravdˇ epodobn´ ym) pˇr´ıpad˚ um.
2. (Absolutnˇ e) spojit´ a: Hustotu m˚ uˇzeme pˇribliˇznˇ e popsat hodnotami f (tk ) v dostateˇ cnˇ e mnoha“ bodech tk , k = 1, . . . , n, ale jen za pˇredpokladu, ˇze je ” dostateˇ cnˇ e hladk´ a“. Zaj´ımaj´ı n´ as z n´ı sp´ıˇse integr´ aly typu ” FX (tk+1) − FX (tk ) =
Z t k+1 tk
fX (u) du ,
z nichˇz lze pˇribliˇznˇ e zkonstruovat distribuˇ cn´ı funkci. M˚ uˇzeme pro reprezentaci pouˇz´ıt pˇr´ımo hodnoty distribuˇ cn´ı funkce FX (tk ). Tam, kde je hustota velk´ a, potˇrebujeme volit body hustˇ e. M˚ uˇzeme volit body tk , k = 1, . . . , n, tak, aby pˇr´ır˚ ustky FX (tk+1) − FX (tk ) mˇ ely zvolenou velikost. Zvol´ıme tedy αk ∈ (0, 1), k = 1, . . . , n, a k nim najdeme ˇ c´ısla tk = qX (αk ).
Pamˇ et’ov´ a n´ aroˇ cnost je velk´ a, z´ avis´ı na jemnosti ˇsk´ aly hodnot n´ ahodn´ e veliˇ ciny, resp. jej´ı distribuˇ cn´ı funkce. ˇ Casto je rozdˇ elen´ı zn´ am´ eho typu a staˇ c´ı doplnit nˇ ekolik parametr˚ u, aby bylo plnˇ e urˇ ceno. Mnoh´ e obecnˇ ejˇs´ı pˇr´ıpady se snaˇz´ıme vyj´ adˇrit alespoˇ n jako smˇ esi n´ ahodn´ ych veliˇ cin s rozdˇ elen´ımi zn´ am´ eho typu, abychom vystaˇ cili s koneˇ cnˇ e mnoha parametry.
3. Sm´ıˇsen´ a: Jako u spojit´ e n´ ahodn´ e veliˇ ciny. Tento popis je vˇsak pro diskr´ etn´ı ˇ c´ ast zbyteˇ cnˇ e nepˇresn´ y. M˚ uˇzeme pouˇz´ıt rozklad na diskr´ etn´ı a spojitou ˇ c´ ast.
4.11
Operace s n´ ahodn´ ymi veliˇ cinami
Zde I, J ⊆ R jsou intervaly nebo spoˇ cetn´ a sjednocen´ı interval˚ u. Pˇriˇ cten´ı konstanty r odpov´ıd´ a posunut´ı ve smˇ eru vodorovn´ e osy: PX+r (I + r) = PX (I ) , PX+r (J ) = PX (J − r) , FX+r (t + r) = FX (t) , FX+r (u) = FX (u − r) , qX+r (α) = qX (α) + r .
Vyn´ asoben´ı nenulovou konstantou r odpov´ıd´ a podobnost ve smˇ eru vodorovn´ e osy: PrX (rI ) = PX (I ),
PrX (J ) = PX Jr .
Pro distribuˇ cn´ı funkci mus´ıme rozliˇsit pˇr´ıpady:
• r > 0:
FrX (rt) = FX (t),
FrX (u) = FX ur ,
qrX (α) = r qX (α),
• r = −1: F−X (−t) = P−X ((−∞, −ti) = PX (ht, ∞)) = 1 − PX ((−∞, t)), v bodech spojitosti distribuˇ cn´ı funkce F−X (−t) = 1 − PX ((−∞, t)) = 1 − P [X < t] = 1 − P [X ≤ t] = 1 − PX ((−∞, ti) = 1 − FX (t), F−X (u) = 1 − FX (−u), v bodech nespojitosti limita zprava (stˇredov´ a symetrie grafu podle bodu 0, 12 s opravou na spojitost zprava), q−X (α) = −qX (1 − α),
• r < 0:
kombinace pˇredchoz´ıch pˇr´ıpad˚ u.
Zobrazen´ı spojitou rostouc´ı funkc´ı h: Ph(X)(h(I )) = PX (I ), Fh(X)(h(t)) = FX (t), Fh(X)(u) = FX (h−1(u)), qh(X)(α) = h(qX (α)) v bodech spojitosti kvantilov´ e funkce.
Zobrazen´ı neklesaj´ıc´ı, zleva spojitou funkc´ı h: Fh(X)(u) = sup{FX (t) | h(t) ≤ u}. Zobrazen´ı po ˇ c´ astech monotonn´ı, zleva spojitou funkc´ı h: M˚ uˇzeme vyj´ adˇrit h = h+ − h−, kde h+, h− jsou neklesaj´ıc´ı. X vyj´ adˇr´ıme jako smˇ es X = Mixc(U, V ), kde U nab´ yv´ a pouze hodnot, v nichˇz je h neklesaj´ıc´ı, V pouze hodnot, v nichˇz je h nerostouc´ı. V´ ysledek dostaneme jako smˇ es dvou n´ ahodn´ ych veliˇ cin, vznikl´ ych zobrazen´ım funkcemi h+, h−. Funkci h lze aplikovat na smˇ es po sloˇzk´ ach“, tj. h(Mixc(U, V )) = Mixc(h(U ), h(V )). ” Souˇ cet n´ ahodn´ ych veliˇ cin nen´ı jednoznaˇ cnˇ e urˇ cen, jedinˇ e za pˇredpokladu nez´ avislosti. Ani pak nen´ı vztah jednoduch´ y. Smˇ es n´ ahodn´ ych veliˇ cin viz v´ yˇse. Na rozd´ıl od souˇ ctu je plnˇ e urˇ cena (margin´ aln´ımi) rozdˇ elen´ımi vstupn´ıch n´ ahodn´ ych veliˇ cin a koeficienty smˇ esi.
4.12
Jak realizovat n´ ahodnou veliˇ cinu na poˇ c´ıtaˇ ci
1. Vytvoˇr´ıme n´ ahodn´ y (nebo pseudon´ ahodn´ y) gener´ ator n´ ahodn´ e veliˇ ciny X s rovnomˇ ern´ ym rozdˇ elen´ım na h0, 1i.
2. N´ ahodn´ a veliˇ cina qY (X ) m´ a stejn´ e rozdˇ elen´ı jako Y . (Staˇ c´ı tedy na kaˇzdou realizaci n´ ahodn´ e veliˇ ciny X aplikovat funkci qY .)
Vˇsechna rozdˇ elen´ı spojit´ ych n´ ahodn´ ych veliˇ cin jsou stejn´ a aˇz na (neline´ arn´ı) zmˇ enu mˇ eˇr´ıtka.
4.13
Stˇredn´ı hodnota
Znaˇ cen´ı: E. nebo µ. Je definov´ ana zvl´ aˇst’ pro
• diskr´ etn´ı n´ ahodnou veliˇ cinu U : X
EU = µU =
t · pU (t) =
t∈R
X
t · pU (t) ,
t∈ΩU
• spojitou n´ ahodnou veliˇ cinu V :
EV = µV =
Z∞
t · fV (t) dt ,
−∞
• smˇ es n´ ahodn´ ych veliˇ cin X = Mixc(U, V ), kde U je diskr´ etn´ı, V je spojit´ a:
EX = c EU + (1 − c) EV . (To nen´ı linearita stˇredn´ı hodnoty!)
Lze vyj´ıt z definice pro diskr´ etn´ı n´ ahodnou veliˇ cinu a ostatn´ı pˇr´ıpady dostat jako limitu pro aproximaci jin´ ych rozdˇ elen´ı diskr´ etn´ım.
Vˇsechny tˇri pˇr´ıpady pokr´ yv´ a univerz´ aln´ı vzorec s pouˇzit´ım kvantilov´ e funkce EX =
Z1
qX (α) dα .
0
Ten lze nav´ıc jednoduˇse zobecnit na stˇredn´ı hodnotu jak´ ekoli funkce n´ ahodn´ e veliˇ ciny: E (h(X )) =
Z1
h (qX (α)) dα .
0
Speci´ alnˇ e pro diskr´ etn´ı n´ ahodnou veliˇ cinu E (h(U )) =
X
h (t) · pU (t) ,
t∈ΩU
pro spojitou n´ ahodnou veliˇ cinu by obdobn´ y vzorec platil jen za omezuj´ıc´ıch pˇredpoklad˚ u, protoˇze spojitost n´ ahodn´ e veliˇ ciny se nemus´ı zachov´ avat. Stˇredn´ı hodnota je vodorovnou souˇradnic´ı tˇ eˇziˇstˇ e grafu distribuˇ cn´ı funkce, jsou-li jeho elementy v´ aˇzeny pˇr´ır˚ ustkem distribuˇ cn´ı funkce:
Pokud pracujeme se stˇredn´ı hodnotou, automaticky pˇredpokl´ ad´ ame, ˇze existuje (coˇz nen´ı vˇzdy splnˇ eno).
4.13.1
Vlastnosti stˇredn´ı hodnoty
Er = r ,
spec.
E (X + Y ) = E X + E Y ,
E(EX ) = EX , spec.
E (X + r) = EX + r ,
E (X − Y ) = EX − EY , E (r X ) = r EX ,
obecnˇ eji
E (r X + s Y ) = r EX + s EY .
(To je linearita stˇredn´ı hodnoty.) E (Mixc(U, V )) = c EU + (1 − c) EV . (To nen´ı linearita stˇredn´ı hodnoty.) Pouze pro nez´ avisl´ e n´ ahodn´ e veliˇ ciny E (X · Y ) = EX · EY .
4.14
Rozptyl (disperze)
Znaˇ cen´ı: σ.2, D., var .
2
DX = E (X − EX )
E
X2
=E
2 X − (EX )2 ,
= (EX )2 + DX .
Vlastnosti: DX =
Z1
(qX (α) − EX )2 dα .
0
DX ≥ 0 , Dr = 0 , D (X + r) = DX , D (r X ) = r2 DX .
(1)
D (Mixc(U, V ))
2 = E Mixc(U, V ) − (E (Mixc(U, V )))2 2 2 = c E U + (1 − c) E V − (c EU + (1 − c) EV )2 2 2 = c DU + (EU ) + (1 − c) DV + (EV ) 2 2 2 2
− c (EU ) + 2 c (1 − c) EU EV + (1 − c) (EV )
= c DU + (1 − c) DV + c (1 − c) (EU )2 − 2 c (1 − c) EU EV + c (1 − c) (EV )2
= c DU + (1 − c) DV + c (1 − c) (EU − EV )2 . Pouze pro nez´ avisl´ e n´ ahodn´ e veliˇ ciny D (X + Y ) = DX + DY,
4.15
Smˇ erodatn´ a odchylka
Znaˇ cen´ı: σ.
D (X − Y ) = D X + D Y .
√ σX =
DX =
r
2
E (X − EX )
Na rozd´ıl od rozptylu m´ a stejn´ y fyzik´ aln´ı rozmˇ er jako p˚ uvodn´ı n´ ahodn´ a veliˇ cina. Vlastnosti: v u uZ1 u 2 σX = u t (qX (α) − EX ) dα. 0
σX ≥ 0 , σr = 0 , σX+r = σX , σr X = |r| σX .
Pouze pro nez´ avisl´ e n´ ahodn´ e veliˇ ciny q √ 2 + σ2 . σX+Y = DX + DY = σX Y
4.16
Obecn´ e a centr´ aln´ı momenty
k∈N
k-t´ y obecn´ y moment (znaˇ cen´ı nezav´ ad´ıme): E X k ,
pro k = 1 :
EX,
pro k = 2 :
speci´ alnˇ e:
E X 2 = (EX )2 + DX.
Alternativn´ı znaˇ cen´ı: mk , µ0k .
k
k-t´ y centr´ aln´ı moment (znaˇ cen´ı nezav´ ad´ıme): E (X − EX )
pro k = 1 :
0,
pro k = 2 :
DX.
,
speci´ alnˇ e:
Alternativn´ı znaˇ cen´ı: µk . Pomoc´ı kvantilov´ e funkce:
Z1
0 Z1
E Xk =
k
E (X − EX )
=
0
(qX (α))k dα . (qX (α) − EX )k dα .
4.17
Normovan´ a n´ ahodn´ a veliˇ cina
je takov´ a, kter´ a m´ a nulovou stˇredn´ı hodnotu a jednotkov´ y rozptyl: norm X =
X − EX σX
(pokud m´ a vzorec smysl). Zpˇ etn´ a transformace je X = EX + σX norm X .
(2)
4.18
Z´ akladn´ı typy diskr´ etn´ıch rozdˇ elen´ı
4.18.1
Diracovo
Je jedin´ y moˇzn´ y v´ ysledek r ∈ R.
pX (r) = 1 ,
EX = r ,
DX = 0 .
Vˇsechna diskr´ etn´ı rozdˇ elen´ı jsou smˇ esi Diracov´ ych rozdˇ elen´ı.
4.18.2
Rovnomˇ ern´ e
Je m moˇzn´ ych v´ ysledk˚ u stejnˇ e pravdˇ epodobn´ ych. Speci´ alnˇ e pro obor hodnot {1, 2, . . . , m} dost´ av´ ame
1 pX (k) = , k ∈ {1, 2, . . . , m} , m 1 m+1 , DX = EX = (m + 1) (m − 1) . 2 12
4.18.3
Alternativn´ı (Bernoulliovo)
Jsou 2 moˇzn´ e v´ ysledky. (Smˇ es dvou Diracov´ ych rozdˇ elen´ı.) Pokud v´ ysledky jsou 0, 1, kde 1 m´ a pravdˇ epodobnost q ∈ (0, 1), dost´ av´ ame
pX (1) = q ,
EX = q ,
pX (0) = 1 − q ,
DX = q (1 − q ) .
4.18.4
Binomick´ e Bi(m, q )
Poˇ cet u ´spˇ ech˚ u z m nez´ avisl´ ych pokus˚ u, je-li v kaˇzd´ em stejn´ a pravdˇ epodobnost u ´spˇ echu q ∈ h0, 1i. (Souˇ cet m nez´ avisl´ ych alternativn´ıch rozdˇ elen´ı.)
pX (k) =
m
k EX = m q ,
q k (1 − q )m−k ,
k ∈ {0, 1, 2, . . . , m} ,
DX = m q (1 − q ) .
V´ ypoˇ cetn´ı sloˇzitost v´ ypoˇ ctu pX (k) je O(k), cel´ eho rozdˇ elen´ı O(m2).
4.18.5
Poissonovo Po(λ)
Limitn´ı pˇr´ıpad binomick´ eho rozdˇ elen´ı pro m → ∞ pˇri konstantn´ım m q = λ > 0 (tedy q → 0).
λk −λ pX ( k ) = e , k ∈ {0, 1, 2, . . .} . k! Jednotliv´ e pravdˇ epodobnosti se poˇ c´ıtaj´ı sn´ aze neˇz u binomick´ eho rozdˇ elen´ı (ovˇsem vˇsechny nevypoˇ c´ıt´ ame, protoˇze jich je nekoneˇ cnˇ e mnoho).
EX = λ ,
DX = λ .
Stˇredn´ı hodnota se rovn´ a rozptylu;“ jedn´ a se vˇ zdy o bezrozmˇ ern´ e celoˇ c´ıseln´ e ” n´ ahodn´ e veliˇ ciny (poˇ cet v´ yskyt˚ u).
Poissonovo rozdˇ elen´ı jako limitn´ı pˇr´ıpad binomick´ eho λ: stantn´ım m q = λ, tj. q = m
Pro m → ∞ pˇri kon-
k (1 − q )m−k = pX ( k ) = m q k
λ m−k m (m − 1) . . . (m − (k − 1)) λ k 1− = = k! m m λk 1 k−1 λ −k λ m = 1 1− ··· 1 − 1− 1− → k! | m {z m }| m m {z } | {z }
→1
λk −λ → e . k!
→1
→e−λ
4.18.6
Geometrick´ e
Poˇ cet u ´spˇ ech˚ u do prvn´ıho ne´ uspˇ echu, je-li v kaˇzd´ em pokusu stejn´ a pravdˇ epodobnost u ´spˇ echu q ∈ (0, 1).
pX (k) = q k (1 − q ) , k ∈ {0, 1, 2, . . .} , q q EX = , DX = . 2 1−q (1 − q )
4.18.7
Hypergeometrick´ e
Poˇ cet v´ yskyt˚ u v m vzorc´ıch, vybran´ ych z M objekt˚ u, v nichˇz je K v´ yskyt˚ u (1 ≤ m ≤ K ≤ M ).
K M −K k m−k pX (k) = , M m
mK , EX = M
k ∈ {0, 1, 2, . . . , m} ,
m K ( M − K ) ( M − m) DX = . M 2 (M − 1)
V´ ypoˇ cetn´ı sloˇzitost v´ ypoˇ ctu pX (k) je O(m), cel´ eho rozdˇ elen´ı O(m2).
Binomick´ e rozdˇ elen´ı jako limitn´ı pˇr´ıpad hypergeometrick´ eho Lemma: Pro m, M ∈ N, m < M , je lim M M →∞ m
m! = 1. Mm
D˚ ukaz: m! m − 1 M ( M − 1) · · · ( M − ( m − 1)) 1 M ··· 1 − → 1. =1 1− m Mm = m M M M Mm. D˚ usledek: Pro M m m˚ uˇzeme M poˇ c ´ ıtat pˇ r ibliˇ z nˇ e jako m m! K = q , tj. M −K = 1 −q Hypergeometrick´ e rozdˇ elen´ı pro M → ∞ pˇri konstantn´ım M M (s vyuˇzit´ım pˇredchoz´ıho lemmatu):
m−k K k · (M −K) K M −K k! (m−k)! k m−k pX (k) = → = Mm M m! m m! K k (M − K )m−k
=
· · k! (m − k)! M k
M m−k
k (1 − q )m−k . q = m k
4.19
Z´ akladn´ı typy spojit´ ych rozdˇ elen´ı
4.19.1
Rovnomˇ ern´ e R(a, b)
(
fX (t) = FX (u) =
1 b−a
0
pro t ∈ ha, bi, jinak,
u−a b−a pro u ∈ ha, bi ,
0 pro u < a , 1 pro u > b , qX (α) = a + (b − a) α , a+b 1 EX = , DX = (b − a)2 . 2 12
4.19.2
Norm´ aln´ı (Gaussovo) N(µ, σ 2)
A. Normovan´ e N(0, 1): 1 ϕ(t) = fN(0,1)(t) = √ exp 2π
−t2
!
2
Distribuˇ cn´ı funkce je transcendentn´ı (Gauss˚ uv integr´ al) Φ, Z u
1 √ Φ(u) = FN(0,1)(u) = exp −∞ 2π
−t2
!
2
dt ,
kvantilov´ a funkce Φ−1 je inverzn´ı k Φ. B. Obecn´ e N(µ, σ 2):
fN(µ,σ2)(t) =
1 √ exp σ 2π
−(t − µ)2
2 σ2
!
,
EX = µ ,
DX = σ 2 .
4.19.3
Logaritmickonorm´ aln´ı LN(µ, σ 2)
je rozdˇ elen´ı n´ ahodn´ e veliˇ ciny X = exp(Y ), kde Y m´ a N(µ, σ 2)
fX (u) =
uσ
1 √
2π
exp
2
(ln u−µ) − 2 σ2
=
fN(µ,σ2 ) (ln u) u
0 (
FX (u) =
pro u > 0, jinak,
FN(µ,σ2) (ln u) pro u > 0 , 0 jinak,
EX = exp µ +
σ2
2
!
,
DX = exp
2 µ + σ2
exp
2 σ −1 .
4.19.4
Exponenci´ aln´ı Ex(τ )
Napˇr. rozdˇ elen´ı ˇ casu do prvn´ı poruchy, jestliˇze (podm´ınˇ en´ a) pravdˇ epodobnost poruchy za ˇ casov´ y interval ht, t + δi z´ avis´ı jen na δ , nikoli na t:
(
fX (t) =
1 τ
exp
− τt
pro t > 0, jinak,
0 (
−u τ
1 − exp 0 qX (α) = −τ ln (1 − α) , FX (u) =
EX = τ ,
pro u > 0 , jinak,
DX = τ 2 ,
σX = τ .
4.20
N´ ahodn´ e vektory 2
N´ ahodn´ y vektor X = (X1, . . . , Xn) je popsan´ y sdruˇzenou distribuˇ cn´ı funkc´ı FX : Rn → h0, 1i FX (t1, . . . , tn) = P [X1 ≤ t1, . . . , Xn ≤ tn] .
4.20.1
Diskr´ etn´ı n´ ahodn´ y vektor
m´ a vˇsechny sloˇzky diskr´ etn´ı. Lze jej popsat t´ eˇz sdruˇ zenou pravdˇ epodobnostn´ı funkc´ı pX : Rn → h0, 1i pX (t1, . . . , tn) = P [X1 = t1, . . . , Xn = tn] ,
kter´ a je nenulov´ a jen ve spoˇ cetnˇ e mnoha bodech. Diskr´ etn´ı n´ ahodn´ e veliˇ ciny X1, . . . , Xn jsou nez´ avisl´ e, pr´ avˇ e kdyˇz P [X1 = t1, . . . , Xn = tn] =
n Y
P [Xi = ti]
i=1
pro vˇsechna t1, . . . , tn ∈ R. Ekvivalentn´ı formulace: pX (t1, . . . , tn) =
n Y i=1
pXi (ti) .
4.20.2
Spojit´ y n´ ahodn´ y vektor
m´ a vˇsechny sloˇzky spojit´ e. Lze jej popsat t´ eˇz sdruˇ zenou hustotou pravdˇ epodobnosti coˇz je (kaˇzd´ a) nez´ aporn´ a funkce fX : Rn → h0, ∞) takov´ a, ˇze FX (t1, . . . , tn) =
Z t 1 −∞
...
Z t n −∞
fX (u1, . . . , un) du1 . . . dun ,
pro vˇsechna t1, . . . , tn ∈ R. Pokud to jde, vol´ıme fX (u1, . . . , un) =
∂ ∂ ∂ ... FX (t1, . . . , tn) = D1D2 . . . DnFX (t1, . . . , tn) ∂t1 ∂t2 ∂tn
Speci´ alnˇ e pro intervaly hai, bii dost´ av´ ame P [X1 ∈ ha1, b1i, . . . , Xn ∈ han, bni] = PX (ha1, b1i × . . . × han, bni)
=
Z b 1 a1
...
Z b n an
fX (u1, . . . , un) du1 . . . dun
Spojit´ e n´ ahodn´ e veliˇ ciny X1, . . . , Xn jsou nez´ avisl´ e, pr´ avˇ e kdyˇz fX (t1, . . . , tn) =
n Y i=1
pro skoro vˇsechna t1, . . . , tn ∈ R.
fXi (ti) .
4.21
ˇ ıseln´ C´ e charakteristiky n´ ahodn´ eho vektoru
Stˇredn´ı hodnota
• n´ ahodn´ eho vektoru X = (X1, . . . , Xn):
EX := (EX1, . . . , EXn)
• komplexn´ı n´ ahodn´ e veliˇ ciny: X = <(X ) + i =(X ): i E=(X )
• nenumerick´ e n´ ahodn´ e veliˇ ciny: nem´ a smysl
EX := E<(X ) +
Rozptyl n´ ahodn´ eho vektoru X = (X1, . . . , Xn):
DX := (DX1, . . . , DXn)
Je-li U n´ ahodn´ a veliˇ cina, a, b ∈ R, pak a U + b m´ a charakteristiky E (a U + b) = a EU + b ,
D (a U + b) = a2 DU .
Na rozd´ıl od jednorozmˇ ern´ e n´ ahodn´ e veliˇ ciny, stˇredn´ı hodnota a rozptyl n´ ahodn´ eho vektoru ned´ avaj´ı dostateˇ cnou informaci pro v´ ypoˇ cet rozptylu jeho line´ arn´ıch funkc´ı. Proto zav´ ad´ıme dalˇs´ı charakteristiky. Napˇr. E (X + Y ) = E X + EY , D (X + Y ) = E (X + Y )2 − (E (X + Y ))2 = = =
2 E + Y + 2 X Y − (EX + EY )2 2 2 2 2 E X + E Y + 2 E (X Y ) − (EX ) + (EY ) + 2 EX EY 2 2 2 E X − (EX ) + E Y − (EY )2 +2 (E (X Y ) − EX EY ) | {z } {z } | {z } | cov(X,Y ) DX DY
X2
= DX + DY + 2 cov(X, Y ) , kde cov(X, Y ) := E (X Y ) − EX EY je kovariance n´ ahodn´ ych veliˇ cin X, Y . Ekvivalentnˇ e ji lze definovat cov(X, Y ) = E ((X − EX ) (Y − EY )) ,
nebot’ E ((X − EX ) (Y − EY )) = E (X Y − X EY − Y EX + EX EY ) = E (X Y ) − EX EY |−EX EY {z+ EX EY} . 0
(Prvn´ı vzorec je vhodnˇ ejˇs´ı pro v´ ypoˇ cet.) Pro existenci kovariance je postaˇ cuj´ıc´ı existence rozptyl˚ u DX, DY .
Vlastnosti kovariance: cov(X, X ) = DX ,
cov(Y, X ) = cov(X, Y ),
cov(a X + b, c Y + d) = a c cov(X, Y ) speci´ alnˇ e
(a, b, c, d ∈ R)
cov(X, −X ) = −DX .
Pro nez´ avisl´ e n´ ahodn´ e veliˇ ciny X, Y je cov(X, Y ) = 0. Pouˇzit´ım kovariance pro normovan´ e n´ ahodn´ e veliˇ ciny vyjde korelace: cov(X, Y ) = E (norm X · norm Y ) %(X, Y ) = cov(norm X, norm Y ) = σX σY Speci´ alnˇ e %(X, X ) = 1.
Vlastnosti korelace: %(X, X ) = 1,
%(X, −X ) = −1,
%(X, Y ) ∈ h−1, 1i,
%(Y, X ) = %(X, Y ), %(aX + b, cY + d) = sign (ac) %(X, Y )
(a, b, c, d ∈ R,
a 6= 0 6= c)
Jsou-li n´ ahodn´ e veliˇ ciny X, Y nez´ avisl´ e, je %(X, Y ) = 0. Obr´ acen´ a implikace vˇsak neplat´ı. N´ ahodn´ e veliˇ ciny X, Y splˇ nuj´ıc´ı %(X, Y ) = 0 naz´ yv´ ame nekorelovan´ e.
Pro n´ ahodn´ y vektor X = (X1, . . . , Xn) je definov´ ana kovarianˇ cn´ı matice
cov(X1, X1) cov(X , X ) 2 1 ΣX = . .. cov(Xn, X1) DX1 cov(X , X ) 1 2 = . .. cov(X1, Xn)
cov(X1, X2) cov(X2, X2) ... cov(Xn, X2) cov(X1, X2) DX2 ... cov(X2, Xn)
··· ··· ... ··· ··· ··· ... ···
cov(X1, Xn) cov(X2, Xn) ... cov(Xn, Xn) cov(X1, Xn) cov(X2, Xn) . ... DXn
Je symetrick´ a pozitivnˇ e semidefinitn´ı, na diagon´ ale m´ a rozptyly. Podobnˇ e je definov´ ana korelaˇ cn´ı matice
1 %(X1, X2) %(X , X ) 1 1 2 %X = ... ... %(X1, Xn) %(X2, Xn) Je symetrick´ a pozitivnˇ e semidefinitn´ı.
· · · %(X1, Xn) · · · %(X2, Xn) . ... ... ··· 1
4.21.1
V´ıcerozmˇ ern´ e norm´ aln´ı rozdˇ elen´ı N(µ, Σ)
popisuje speci´ aln´ı pˇr´ıpad n´ ahodn´ eho vektoru, jehoˇz sloˇzky maj´ı norm´ aln´ı rozdˇ elen´ı a mohou b´ yt korelovan´ e. M´ a hustotu 1
1 fN(µ,Σ)(t) := q exp − (t − µ)T T (t − µ) , 2 (2 π )n det T −1 kde t = (t1, . . . , tn) ∈ Rn, µ = (µ1, . . . , µn) ∈ Rn, ´ T ∈ Rn×n je matice, BUNO symetrick´ a.
4.21.1
V´ıcerozmˇ ern´ e norm´ aln´ı rozdˇ elen´ı N(µ, Σ)
popisuje speci´ aln´ı pˇr´ıpad n´ ahodn´ eho vektoru, jehoˇz sloˇzky maj´ı norm´ aln´ı rozdˇ elen´ı a mohou b´ yt korelovan´ e. M´ a hustotu 1
1 fN(µ,Σ)(t) := q exp − (t − µ)T T (t − µ) , 2 (2 π )n det T −1
kde t = (t1, . . . , tn) ∈ Rn, µ = (µ1, . . . , µn) ∈ Rn, ´ T ∈ Rn×n je matice, BUNO symetrick´ a. Parametry rozdˇ elen´ı: µ = (µ1, . . . , µn) ∈ Rn je stˇredn´ı hodnota n´ ahodn´ eho vektoru, Σ := T −1 je kovarianˇ cn´ı matice, speci´ alnˇ e jej´ı hlavn´ı diagon´ ala (Σ11, Σ22, . . . , Σnn) ∈ Rn je rozptyl n´ ahodn´ eho vektoru, margin´ aln´ı rozdˇ elen´ı i-t´ e sloˇzky je N(µi, Σii); pomoc´ı tˇ echto parametr˚ u p´ıˇseme 1
1 q fN(µ,Σ)(t) := exp − (t − µ)T Σ−1 (t − µ) . 2 (2 π )n det Σ
4.22
Line´ arn´ı prostor n´ ahodn´ ych veliˇ cin
(Ω, A, P ) pravdˇ epodobnostn´ı prostor, L line´ arn´ı prostor vˇsech n´ ahodn´ ych veliˇ cin na (Ω, A, P ), tj. A-mˇ eˇriteln´ ych funkc´ı Ω → R, sˇ c´ıt´ an´ı n´ ahodn´ ych veliˇ cin a jejich n´ asoben´ı re´ aln´ ym ˇ c´ıslem = operace s funkcemi (bod po bodu), L2 line´ arn´ı podprostor vˇsech n´ ahodn´ ych veliˇ cin z L, kter´ e maj´ı rozptyl, • : L2 × L2 → R, X • Y := E (X Y ) ,
je biline´ arn´ı (=line´ arn´ı v obou argumentech) a komutativn´ı operace, skal´ arn´ı souˇ cin (pokud ztotoˇzn´ıme n´ ahodn´ e veliˇ ciny X, Y , pro kter´ e P [X 6= Y ] = 0; za prvky prostoru pak povaˇzujeme tˇr´ıdy ekvivalence m´ısto jednotliv´ ych n´ ahodn´ ych veliˇ cin.),
||X|| :=
√
X •X =
r
E X2
je norma, d(X, Y ) := ||X − Y || =
r
2
E (X − Y )
je metrika (vzd´ alenost) (bez pˇredchoz´ıho ztotoˇznˇ en´ı pouze pseudometrika, mohla by b´ yt nulov´ a i pro X 6= Y .)
L2 lze rozloˇzit na 2 ortogon´ aln´ı podprostory: R = jednodimenzion´ aln´ı prostor vˇsech konstatn´ıch n´ ahodn´ ych veliˇ cin (tj. s Diracov´ ym rozdˇ elen´ım), N = prostor vˇsech n´ ahodn´ ych veliˇ cin s nulovou stˇredn´ı hodnotou.
EX je kolm´ y pr˚ umˇ et X do R, X − EX je kolm´ y pr˚ umˇ et X do N , norm X = X−EX je jednotkov´ y vektor ve smˇ eru kolm´ eho pr˚ umˇ etu X do N , σX σX = ||X − EX|| je vzd´ alenost X od R. Z kolmosti vektor˚ u X − EX ∈ N , EX ∈ R a Pythagorovy vˇ ety plyne X • X = ||X||2 = ||X − EX||2 + ||EX||2 ,
E
X2
= DX + (EX )2 .
4.22.1
Line´ arn´ı podprostor N n´ ahodn´ ych veliˇ cin s nulov´ ymi stˇredn´ımi hodnotami
Speci´ alnˇ e pro n´ ahodn´ e veliˇ ciny z N : 2 =X •X, σX
σX = ||X|| ,
cov(X, Y ) = X • Y , cov(X, Y ) X •Y %(X, Y ) = = = cos ∠(X, Y ) . σX σY ||X|| ||Y ||
Obecnˇ e v L2 %(X, Y ) je kosinus u ´hlu pr˚ umˇ et˚ u X, Y do N , cov(X, Y ) = X • Y − EX EY je skal´ arn´ı souˇ cin pr˚ umˇ et˚ u X, Y do N .
4.22.2
Line´ arn´ı regrese
´ Uloha: Je d´ an n´ ahodn´ y vektor X = (X1, . . . , Xn) a n´ ahodn´ a veliˇ cina Y . (Pˇredpokl´ ad´ ame, ˇze vˇsechny n´ ahodn´ e veliˇ ciny jsou z L2). M´ ame naj´ıt takov´ e P koeficienty c1, . . . , cn, aby line´ arn´ı kombinace ci Xi byla co nejlepˇs´ı aproximac´ı i
n´ ahodn´ e veliˇ ciny Y ve smyslu krit´ eria X ck Xk − Y . k
ˇ sen´ı: K vektoru Y hled´ Reˇ ame nejbliˇzˇs´ı bod v line´ arn´ım podprostoru, kter´ y je line´ arn´ım obalem vektor˚ u X1, . . . , Xn; ˇreˇsen´ım je kolm´ y pr˚ umˇ et. Ten je charakP terizov´ an t´ım, ˇze vektor ciXi − Y je kolm´ y na Xj , j = 1, . . . , n, i
X
ck Xk − Y
• Xj = 0 ,
k
X
ci Xi • Xj = Y • Xj .
i
To je soustava line´ arn´ıch rovnic pro nezn´ am´ e koeficienty c1, . . . , cn (soustava norm´ aln´ıch rovnic). Speci´ alnˇ e pro n´ ahodn´ e veliˇ ciny s nulov´ ymi stˇredn´ımi hodnotami: X
ci cov Xi, Xj = cov Y, Xj ,
i
takˇze matice soustavy je kovarianˇ cn´ı matice ΣX .
4.23
Reprezentace n´ ahodn´ ych vektor˚ u v poˇ c´ıtaˇ ci
Obdobn´ a jako u n´ ahodn´ ych veliˇ cin, avˇsak s rostouc´ı dimenz´ı rychle roste pamˇ et’ov´ a n´ aroˇ cnost. To by se nestalo, kdyby n´ ahodn´ e veliˇ ciny byly nez´ avisl´ e; pak by staˇ cilo zn´ at margin´ aln´ı rozdˇ elen´ı. Proto velkou u ´sporu m˚ uˇze pˇrin´ est i podm´ınˇ en´ a nez´ avislost. Pokud najdeme u ´pln´ y syst´ em jev˚ u, kter´ e zajiˇst’uj´ı podm´ınˇ enou nez´ avislost dvou n´ ahodn´ ych veliˇ cin, pak m˚ uˇzeme jejich rozdˇ elen´ı popsat jako smˇ es rozdˇ elen´ı nez´ avisl´ ych n´ ahodn´ ych veliˇ cin (a tedy u ´spornˇ eji).
4.24
ˇ Cebyˇ sevova nerovnost
Vˇ eta: 1 ∀δ > 0 : P [|norm X| < δ ] ≥ 1 − 2 , δ kde norm X = X−EX (pokud m´ a v´ yraz smysl). σ X
D˚ ukaz pomoc´ı kvantilov´ e funkce:
2
D (norm X ) = E (norm X ) |
{z 1
− (E (norm X ))2 , |
}
2
1 = E (norm X )
{z 0
}
= EY ,
kde Y = (norm X )2. Odhad pravdˇ epodobnosti β = P [|norm X| < δ ] = P [Y < δ 2] = FY (δ 2−): 1 = EY =
Z1 0
1 β ≥1− 2. δ
qY (α) dα =
Zβ
qY (α) dα +
| {z } ≥0 0
Z1
qY (α) dα ≥ (1 − β ) δ 2 ,
| {z } β ≥δ 2
D˚ ukaz pomoc´ı smˇ esi: Vyj´ adˇr´ıme Y = (norm X )2 = Mixβ (L, U ), kde L nab´ yv´ a pouze hodnot z h0, δ 2), U nab´ yv´ a pouze hodnot z hδ 2, ∞), takˇze EU ≥ δ 2, β = FY (δ 2). EU ≥ (1 − β ) δ 2 . 1 = EY = β |{z} EL + (1 − β ) |{z} ≥0
≥δ 2
Rovnost nast´ av´ a pro U = δ 2, L = 0, tj. pro diskr´ etn´ı rozdˇ elen´ı 1−β {(EX − δ σX , 1−β ) , (E X, β ) , (E X + δ σ , X 2 2 )}. Ekvivalentn´ı tvary (ε = δ σX ): " # X − EX 1 ∀δ > 0 : P , ≥δ ≤ 2 σ δ X 2 σX DX ∀ε > 0 : P [|X − EX| ≥ ε] ≤ 2 = 2 . ε ε
5
Z´ akladn´ı pojmy statistiky
5.1
Kˇ cemu potˇrebujeme statistiku
Zkoum´ an´ı spoleˇ cn´ ych vlastnost´ı velk´ eho poˇ ctu obdobn´ ych jev˚ u. Pˇritom nezkoum´ ame vˇsechny, ale jen vybran´ y vzorek (kv˚ uli cenˇ e test˚ u, jejich destruktivnosti apod.).
• Odhady parametr˚ u pravdˇ epodobnostn´ıho modelu
• Testov´ an´ı hypot´ ez
Pot´ıˇze statistick´ eho v´ yzkumu – viz [Rogalewicz].
5.2
Pojem n´ ahodn´ eho v´ ybˇ eru, odhady
Soubor
• z´ akladn´ı (=populace)
• v´ ybˇ erov´ y
N´ ahodn´ y v´ ybˇ er jednoho prvku z´ akladn´ıho souboru (s rovnomˇ ern´ ym rozdˇ elen´ım) a stanoven´ı urˇ cit´ eho parametru tohoto prvku urˇ cuje rozdˇ elen´ı n´ ahodn´ e veliˇ ciny. Opakovan´ ym v´ ybˇ erem dostaneme n´ ahodn´ y vektor, jehoˇz sloˇzky maj´ı stejn´ e rozdˇ elen´ı a jsou nez´ avisl´ e. Takto vytvoˇr´ıme v´ ybˇ erov´ y soubor rozsahu n, obvykle vˇsak vylouˇ c´ıme v´ıcen´ asobn´ y v´ ybˇ er stejn´ eho prvku (v´ ybˇ er bez vracen´ı). Jeho rozdˇ elen´ı se m˚ uˇze ponˇ ekud liˇsit od p˚ uvodn´ıho. Tento rozd´ıl se obvykle zanedb´ av´ a, nebot’
1. pro velk´ y rozsah z´ akladn´ıho souboru to nen´ı podstatn´ e,
2. rozsah z´ akladn´ıho souboru nˇ ekdy nen´ı zn´ am,
3. v´ ypoˇ cty se znaˇ cnˇ e zjednoduˇs´ı.
Pˇresnost odhadu je d´ ana velikost´ı v´ ybˇ erov´ eho souboru, nikoli populace. N´ ahodn´ y v´ ybˇ er X = (X1, . . . , Xn) je vektor n´ ahodn´ ych veliˇ cin, kter´ e jsou nez´ avisl´ e a maj´ı stejn´ e rozdˇ elen´ı. (Vynech´ av´ ame indexy, napˇr. FX m´ısto FXk .) Proveden´ım pokusu dostaneme realizaci n´ ahodn´ eho v´ ybˇ eru, x = (x1, . . . , xn) ∈ Rn, kde n je rozsah v´ ybˇ eru.
Statistika je (kaˇzd´ a) mˇ eˇriteln´ a funkce G, definovan´ a na n´ ahodn´ em v´ ybˇ eru libovoln´ eho rozsahu. (Poˇ c´ıt´ a se z n´ ahodn´ ych veliˇ cin v´ ybˇ eru, nikoli z parametr˚ u rozdˇ elen´ı.) Mˇ eˇriteln´ a“ znamen´ a, ˇze pro kaˇzd´ e t ∈ R je definov´ ana pravdˇ epodobnost ” P [G(X1, . . . , Xn) ≤ t] = FG(X1,...,Xn)(t) .
Statistika jako funkce n´ ahodn´ ych veliˇ cin je rovnˇ eˇz n´ ahodn´ a veliˇ cina. Obvykle se pouˇz´ıv´ a jako odhad parametr˚ u rozdˇ elen´ı (kter´ e n´ am z˚ ust´ avaj´ı skryt´ e). Znaˇ cen´ı: ϑ ... skuteˇ cn´ y parametr (re´ aln´ eˇ c´ıslo), b,Θ b ... jeho odhad zaloˇ Θ zen´ y na n´ ahodn´ em v´ ybˇ eru rozsahu n (n´ ahodn´ a veliˇ cina) n b ϑ b ... realizace odhadu (obvykle re´ ϑ, aln´ eˇ c´ıslo) n
ˇ adouc´ı vlastnosti odhad˚ Z´ u: b = ϑ nestrann´ • EΘ y (opak: vych´ ylen´ y) n
b = ϑ asymptoticky nestrann´ • lim EΘ y n n→∞
• eficientn´ı = s mal´ ym rozptylem, coˇz posuzujeme podle
b E (Θ n
− ϑ)2
=
2
b + E(Θ b − ϑ) , pro nestrann´ b DΘ y odhad se redukuje na DΘ n n n
• nejlepˇs´ı nestrann´ y odhad je ze vˇsech nestrann´ ych ten, kter´ y je nejv´ıce eficientn´ı (mohou vˇsak existovat v´ıce eficientn´ı vych´ ylen´ e odhady) b = ϑ, lim σ • lim EΘ n b n = 0 konzistentn´ı n→∞ n→∞ Θ
• robustn´ı, tj. odoln´ y v˚ uˇ ci ˇsumu ( i pˇri zaˇsumˇ en´ ych datech dost´ av´ ame dobr´ y ” v´ ysledek“) – zde uˇz pˇresn´ e krit´ erium chyb´ı, zato je to velmi praktick´ a vlastnost
5.3
V´ ybˇ erov´ y pr˚ umˇ er
z n´ ahodn´ eho v´ ybˇ eru X = (X1, . . . , Xn) je n 1 X X= Xj n j=1
Alternativn´ı znaˇ cen´ı: X n (pokud potˇrebujeme zd˚ uraznit rozsah v´ ybˇ eru) Jeho realizaci znaˇ c´ıme mal´ ym p´ısmenem: n 1 X x= xj . n j=1
Vˇ eta: n 1 X EX n = EX = EX , n j=1 n 1 1 X DX = DX , DX n = 2 n j=1 n
s
σX = n
1 1 DX = √ σX , n n
pokud existuj´ı. (Zde EX = EXj atd.) D˚ usledek: V´ ybˇ erov´ y pr˚ umˇ er je nestrann´ y konzistentn´ı odhad stˇredn´ı hodnoty. (Nez´ avisle na typu rozdˇ elen´ı.) ˇ Cebyˇ sevova nerovnost pro X n d´ av´ a h i DX n DX P X n − EX ≥ ε ≤ = →0 2 2 ε nε
pro n → ∞ .
To plat´ı i za obecnˇ ejˇs´ıch pˇredpoklad˚ u (Xj nemus´ı m´ıt stejn´ e rozdˇ elen´ı) – slab´ y z´ akon velk´ ych ˇ c´ısel.
Lidovˇ e se hovoˇr´ı o pˇresn´ em souˇ ctu nepˇresn´ ych ˇ c´ısel“, coˇz je chyba, nebot’ souˇ cet ” Pn a rozptyl n DX → ∞. Relativn´ı chyba souˇ ctu kles´ a, absolutn´ı roste. j=1 Xj m´ Rozdˇ elen´ı v´ ybˇ erov´ eho pr˚ umˇ eru m˚ uˇze b´ yt podstatnˇ e sloˇzitˇ ejˇs´ı neˇz p˚ uvodn´ı, jen ve speci´ aln´ıch pˇr´ıpadech je jednoduch´ a odpovˇ ed’. Vˇ eta: V´ ybˇ y pr˚ umˇ er z norm´ aln´ıho rozdˇ elen´ı N(µ, σ 2) m´ a norm´ aln´ı rozdˇ elen´ı erov´ N µ, n1 σ 2 a je nejlepˇs´ım nestrann´ ym odhadem stˇredn´ı hodnoty. Podobn´ a vˇ eta plat´ı i pro jin´ a rozdˇ elen´ı alespoˇ n asymptoticky: avisl´ e stejnˇ e rozdˇ elen´ e n´ ahodn´ e Centr´ aln´ı limitn´ı vˇ eta: Necht’ Xj , j ∈ N, jsou nez´ veliˇ ciny se stˇredn´ı hodnotou EX a smˇ erodatnou odchylkou σX 6= 0. Pak normovan´ e n´ ahodn´ e veliˇ ciny √ n Yn = norm X n = (X n − EX ) σX konverguj´ı k normovan´ emu norm´ aln´ımu rozdˇ elen´ı v n´ asleduj´ıc´ım smyslu: ∀t ∈ R : lim FYn (t) = lim Fnorm X (t) = Φ(t) . n→∞ n→∞ n
5.4
V´ ybˇ erov´ y rozptyl
n´ ahodn´ eho v´ ybˇ eru X = (X1, . . . , Xn) je statistika n X 1 2 = SX (Xj − X n)2 . n − 1 j=1
Alternativn´ı znaˇ cen´ı: S 2 (Dvojka v horn´ım indexu zde neznamen´ a kvadr´ at!) Jeho realizaci znaˇ c´ıme mal´ ym p´ısmenem: n X 1 s2x = (xj − xn)2 . n − 1 j=1
Praktiˇ ctˇ ejˇs´ı jednopr˚ uchodov´ y vzorec: X 2 n n n X X n 1 1 1 2 2 = SX Xj2 − Xn = Xj2 − Xj . n − 1 j=1 n−1 n − 1 j=1 n (n − 1) j=1
Vˇ eta: 2 = DX. ESX
2 dost´ D˚ ukaz: Z jednopr˚ uchodov´ eho vzorce pro SX av´ ame
2 n n n 2 2 2 2 ESX = EX − EX n = DX + (EX ) − DX n − EX n = n−1 n−1 n−1 1 n DX + (EX )2 − DX − (EX )2 = DX . = n−1 n
Vˇ eta: V´ ybˇ erov´ y rozptyl je nestrann´ y konzistentn´ı odhad rozptylu (pokud p˚ uvodn´ı rozdˇ elen´ı m´ a rozptyl a 4. centr´ aln´ı moment). Rozdˇ elen´ı v´ ybˇ erov´ eho rozptylu m˚ uˇze b´ yt podstatnˇ e sloˇzitˇ ejˇs´ı. Speci´ alnˇ e pro rozdˇ elen´ı N(0, 1) a n = 2: X + X2 X= 1 , 2
X1 − X2 1 X1 − X = −(X2 − X ) = m´ a rozdˇ elen´ı N 0, 2 , 2
2 = (X − X )2 + (X − X )2 = 2 SX 2 1
X1 − X2 2
2
kde U = X1√−X2 m´ a rozdˇ elen´ı N (0, 1). Tomu ˇr´ık´ ame: 2
=
X1 − X2 √ 2
!2
= U2 ,
5.4.1
Rozdˇ elen´ı χ2 s 1 stupnˇ em volnosti
= rozdˇ elen´ı n´ ahodn´ e veliˇ ciny V = U 2, kde U m´ a normovan´ e norm´ aln´ı rozdˇ elen´ı N(0, 1). Znaˇ cen´ı: χ2(1). (Toto rozdˇ elen´ı nen´ı zvykem normovat.) EV = EU 2 = D U +(E U )2 = 1 , |{z} |{z} 1
DV = 2 .
0
(bez d˚ ukazu)
Pro t > 0 vych´ az´ı distribuˇ cn´ı funkce √ √ √ FV (t) = P [V ≤ t] = P [− t ≤ U ≤ t] = 2 P [0 ≤ U ≤ t] = Z √t 2 √ − u2 = 2 Φ( t) − Φ(0) = 2 e du , 0
hustota fV (t) =
Zobecnˇ en´ı:
FV0 (t)
√ 0 √ 0 0 √ √ −t 1 1 = 2 Φ( t) = 2 ( t) Φ ( t) = √ ϕ( t) = √ e2 . t 2πt
5.4.2
Rozdˇ elen´ı χ2 s η stupni volnosti
= rozdˇ elen´ı n´ ahodn´ e veliˇ ciny Y =
η P j=1
Vj , kde Vj jsou nez´ avisl´ e n´ ahodn´ e veliˇ ciny
s rozdˇ elen´ım χ2(1) = rozdˇ elen´ı n´ ahodn´ e veliˇ ciny Y =
η P j=1
avisl´ e n´ ahodn´ e veliˇ ciny Uj2, kde Uj jsou nez´
s normovan´ ym norm´ aln´ım rozdˇ elen´ım N(0, 1). Znaˇ cen´ı: χ2(η ). EY = E
η X
Vj =
η X
EV = η , |{z}j j=1 j=1 1 η η X X DY = D Vj = DVj = 2 η . | {z } j=1 j=1 2 Vˇ eta: Necht’ X, Y jsou nez´ avisl´ e n´ ahodn´ e veliˇ ciny s rozdˇ elen´ım χ2(ξ ), resp. χ2(η ). Pak X + Y m´ a rozdˇ elen´ı χ2(ξ + η ).
Hustota η −1 −y 2 c(η ) y e2
(
fY (y ) = c(η ) =
Γ(z ) =
0 1
pro y > 0 , jinak ,
, Γ η2
η 22
Z∞
tz−1 e−t dt ,
0
speci´ alnˇ e Γ(m + 1) = m! pro vˇsechna m ∈ N. Speci´ alnˇ e pro η = 2 je c(η ) = 1/2 a dost´ av´ ame exponenci´ aln´ı rozdˇ elen´ı.
Hustoty rozdˇ elen´ı χ2 s 1, 2, . . . , 10 stupni volnosti a jeho odmocniny ( vzd´ alenost ” od stˇredu terˇ ce“).
5.4.3
V´ ybˇ erov´ y rozptyl
z norm´ aln´ıho rozdˇ elen´ı N(EX, DX ) splˇ nuje: 2 (n − 1) SX m´ a rozdˇ elen´ı χ2(n − 1) . DX
3
2 pro rozsah v´ Rozdˇ elen´ı odhadu rozptylu pomoc´ı vybˇ erov´ eho rozptylu SX ybˇ eru 2, 3, . . . , 10 a 3 = 21 + 1, 22 + 1, . . . , 27 + 1 = 129.
D˚ usledek: Rozptyl v´ ybˇ erov´ eho rozptylu z norm´ aln´ıho rozdˇ elen´ı N(EX, DX ) je 2 = DSX
2 (DX )2 . n−1
Vˇ eta: Pro n´ ahodn´ y v´ ybˇ er X = (X1, . . . , Xn) z norm´ aln´ıho rozdˇ elen´ı je X nej2 je nejlepˇ lepˇs´ı nestrann´ y odhad stˇredn´ı hodnoty, SX s´ı nestrann´ y odhad rozptylu a 2 jsou konzistentn´ı a nez´ statistiky X , SX avisl´ e. Existuje vˇsak vych´ ylen´ y odhad rozptylu, kter´ y je eficientnˇ ejˇs´ı:
5.4.4
Alternativn´ı odhad rozptylu
n X 1 n−1 2 d SX . D X= (Xj − X n)2 = n j=1 n
d Vˇ eta: D X je vych´ ylen´ y konzistentn´ı odhad rozptylu.
D˚ ukaz: d ED X=
n−1 DX → DX , n
d D X m´ a rozptyl menˇs´ı neˇz
2 , SX
a to v pomˇ eru
n−1 2 . n
Eficienci nem˚ uˇzeme porovnat obecnˇ e; aspoˇ n pro norm´ aln´ı rozdˇ elen´ı: 2 : 1. eficience odhadu SX 2 = DSX
2 (DX )2 . n−1
d 2. eficience odhadu D X (DX je konstanta): 2 2 d d d E(DX − DX ) = D DX − DX + E DX − DX = 2 1 d DX = =D D X +
=
n−1 2
n
n 2 1 2n − 1 2 , (DX )2 + 2 (DX )2 = (D X ) 2 n−1 n n
a protoˇze 2n − 1 2 2 < < , 2 n n n−1 2 (kter´ d je odhad D X v´ıce eficientn´ı neˇz SX y je nejlepˇs´ı nestrann´ y!).
5.5
V´ ybˇ erov´ a smˇ erodatn´ a odchylka
n´ ahodn´ eho v´ ybˇ eru X = (X1, . . . , Xn) je statistika v u n q u 1 X u 2 = SX = SX (Xj − X n)2. t n − 1 j=1
Alternativn´ı znaˇ cen´ı: S Jej´ı realizaci znaˇ c´ıme mal´ ym p´ısmenem: v u u sx = u t
n X 1 (xj − xn)2 . n − 1 j=1
Vˇ eta: ESX ≤ σX . Rovnost obecnˇ e nenast´ av´ a, takˇze to nen´ı nestrann´ y odhad smˇ erodatn´ e odchylky!
D˚ ukaz: 2 = (ES )2 + DS ≥ (ES )2 , DX = ESX X X X
| {z } ≥0
σX ≥ ESX .
Vˇ eta: V´ ybˇ erov´ a smˇ erodatn´ a odchylka je konzistentn´ı odhad smˇ erodatn´ e odchylky (pokud p˚ uvodn´ı rozdˇ elen´ı m´ a rozptyl a 4. centr´ aln´ı moment).
5.6
V´ ybˇ erov´ y k-t´ y obecn´ y moment
n´ ahodn´ eho v´ ybˇ eru X = (X1, . . . , Xn) je statistika n 1 X MX k = Xjk . n j=1
Alternativn´ı znaˇ cen´ı: Mk
Jeho realizaci znaˇ c´ıme mal´ ym p´ısmenem: n 1 X mX k = xkj . n j=1
Vˇ eta: EMX k = EX k . (Tj. je to nestrann´ y odhad k-t´ eho obecn´ eho momentu.) Vˇ eta: V´ ybˇ erov´ y k-t´ y obecn´ y moment je konzistentn´ı odhad k-t´ eho obecn´ eho momentu (pokud X m´ a k-t´ y a 2 k-t´ y obecn´ y moment). D˚ ukaz: 1 1 1 1 k k k 2 k 2 2 k k 2 DMX k = 2 n DX = DX = E(X ) − (EX ) = EX − (EX ) . n n n n
5.7
Histogram a empirick´ e rozdˇ elen´ı
V (nen´ ahodn´ em) vektoru x = (x1, . . . , xn) ∈ Rn (z´ıskan´ em napˇr. jako realizace n´ ahodn´ eho v´ ybˇ eru) nez´ aleˇz´ı na poˇrad´ı sloˇzek (ale z´ aleˇz´ı na jejich opakov´ an´ı). ´ Uspornˇ eji je pops´ an mnoˇzinou hodnot H = {x1, . . . , xn} (ta m´ a nejv´ yˇse n prvk˚ u, obvykle m´ enˇ e) a jejich ˇ cetnostmi nt, t ∈ H . Tato data obvykle zn´ azorˇ nujeme tabulkou ˇ cetnost´ı nebo grafem zvan´ ym histogram. Normov´ an´ım dostaneme relativn´ı ˇ cetnosti rt = nnt , t ∈ H . Jelikoˇz t∈H rt = 1, definuj´ı relativn´ı ˇ cetnosti pravdˇ epodobnostn´ı funkci pEmp(x)(t) = rt tzv. empirick´ eho rozdˇ elen´ı Emp(x). Je to diskr´ etn´ı rozdˇ elen´ı s nejv´ yˇse n hodnotami charakterizuj´ıc´ı vektor x. P
5.7.1
Vlastnosti empirick´ eho rozdˇ elen´ı
(Indexem Emp(x) oznaˇ cujeme parametry jak´ ekoli n´ ahodn´ e veliˇ ciny, kter´ a m´ a toto rozdˇ elen´ı.)
n 1 X 1 X t nt = t rt = E Emp(x) = xi = x , n t∈H n i=1 t∈H n X X X 1 1 xki . E (Emp(x))k = tk rt = tk nt = n t∈H n i=1 t∈H
X
1 X D Emp(x) = (t − E Emp(x)) rt = (t − x)2 nt n t∈H t∈H X
2
n 1 X n−1 2 2 = sx . (xi − x) = n i=1 n
Obecn´ e momenty empirick´ eho rozdˇ elen´ı se rovnaj´ı v´ ybˇ erov´ ym moment˚ um p˚ uvodn´ıho rozdˇ elen´ı. V´ ypoˇ cet z histogramu (z empirick´ eho rozdˇ elen´ı) m˚ uˇze b´ yt jednoduˇsˇs´ı neˇz z p˚ uvodn´ı realizace n´ ahodn´ eho v´ ybˇ eru (pokud se opakuj´ı stejn´ e hodnoty). 2 rozptylu p˚ d Rozptyl empirick´ eho rozdˇ elen´ı odpov´ıd´ a odhadu D X = n−1 S uvodn´ıho X n 2 . rozdˇ elen´ı, odliˇsn´ emu od SX
5.8
V´ ybˇ erov´ y medi´ an
je medi´ an empirick´ eho rozdˇ elen´ı, qEmp(x)( 12 ). Poskytuje jinou informaci neˇz v´ ybˇ erov´ y pr˚ umˇ er, mnohdy uˇziteˇ cnˇ ejˇs´ı (mj. robustnˇ ejˇs´ı – odolnˇ ejˇs´ı v˚ uˇ ci vlivu vych´ ylen´ ych hodnot, outliers). Nav´ıc v´ıme, jak se zmˇ en´ı monotonn´ı funkc´ı. Proˇ c se pouˇz´ıv´ a m´ enˇ e neˇz v´ ybˇ erov´ y pr˚ umˇ er:
• V´ ypoˇ cetn´ı n´ aroˇ cnost je vyˇsˇs´ı; seˇrazen´ı hodnot m´ a pracnost u ´mˇ ernou n ln n, zat´ımco v´ ybˇ erov´ y pr˚ umˇ er n.
• Pamˇ et’ov´ a n´ aroˇ cnost je vyˇsˇs´ı – potˇrebujeme zapamatovat vˇsechna data, u v´ ybˇ erov´ eho pr˚ umˇ eru staˇ c´ı 2 registry.
• Moˇznosti decentralizace a paralelizace v´ ypoˇ ctu v´ ybˇ erov´ eho medi´ anu jsou velmi omezen´ e.
5.9
Intervalov´ e odhady
b Dosud jsme skuteˇ cnou hodnotu parametru ϑ nahrazovali bodov´ ym odhadem Θ (coˇz je n´ ahodn´ a veliˇ cina). Nyn´ı m´ısto toho hled´ ame intervalov´ y odhad, tzv. interval spolehlivosti I , coˇz je minim´ aln´ı interval takov´ y, ˇze
P [ϑ ∈ I ] ≥ 1 − α ,
kde α ∈ (0, 21 ) je pravdˇ epodobnost, ˇze meze intervalu I budou pˇrekroˇ ceny; 1 − α je koeficient spolehlivosti. Obvykle hled´ ame horn´ı, resp. doln´ı jednostrann´ y odhad, kdy I = (−∞, qΘ b (1 − α)i, resp. I = hqΘ b (α), ∞) ,
nebo (symetrick´ y) oboustrann´ y odhad, α α , qΘ I = qΘ b 1− b 2 2
b K tomu potˇrebujeme zn´ at rozdˇ elen´ı odhadu Θ.
.
5.10
Intervalov´ e odhady parametr˚ u norm´ aln´ıho rozdˇ elen´ı N(µ, σ 2)
5.10.1
Odhad stˇredn´ı hodnoty pˇri zn´ am´ em rozptylu σ 2
σ2
µ odhadneme v´ ybˇ erov´ ym pr˚ umˇ erem X s rozdˇ elen´ım N µ, n . √
norm X =
n e σ (X − µ), stejnˇ "√
√
jako − norm X = σn (µ − X ) m´ a rozdˇ elen´ı N(0, 1); #
n P (µ − X ) ∈ (−∞, Φ−1(1 − α)i σ =1−α "√ # n =P (µ − X ) ≤ Φ−1(1 − α) σ " # σ = P µ ≤ X + √ Φ−1(1 − α) n " +# σ . = P µ ∈ −∞, X + √ Φ−1(1 − α) n
Obdobnˇ e dostaneme i dalˇs´ı intervalov´ e odhady +
σ −∞, X + √ Φ−1(1 − α) , n ! * σ X − √ Φ−1(1 − α), ∞ , n * + σ α σ α X − √ Φ−1 1 − , X + √ Φ−1 1 − , n 2 n 2
kde X − √σn Φ−1(1 − α) = X + √σn Φ−1(α) (Φ−1(α) = −Φ−1(1 − α) ovˇsem neb´ yv´ a v tabulk´ ach). Pˇri v´ ypoˇ ctu nahrad´ıme v´ ybˇ erov´ y pr˚ umˇ er X jeho realizac´ı x.
5.10.2
Odhad stˇredn´ı hodnoty pˇri nezn´ am´ em rozptylu
σ2
µ odhadneme v´ ybˇ erov´ ym pr˚ umˇ erem X s rozdˇ elen´ım N µ, n ,
σ2
odhadneme v´ ybˇ erov´ ym rozptylem
2 (n−1) SX 2 SX ; σ2
√
m´ a rozdˇ elen´ı χ2(n − 1).
Testujeme analogicky n´ ahodnou veliˇ cinu S n (X − µ), jej´ı rozdˇ elen´ı vˇsak nen´ı X avisl´ e. norm´ aln´ı, aˇ ckoli X , SX jsou nez´
5.10.3
Studentovo t-rozdˇ elen´ı (autor: Gossett)
s η stupni volnosti je rozdˇ elen´ı n´ ahodn´ e veliˇ ciny U r
kde U m´ a rozdˇ elen´ı N(0, 1), V m´ a rozdˇ elen´ı χ2(η ), U, V jsou nez´ avisl´ e.
V η
,
Znaˇ cen´ı: t(η ). Hustota: ft(η) (x) = c (η )
1+
!− 1+η 2 2 x
η
,
Γ 1+η 2 . c (η ) = √ η π Γ η2
Symetrie kolem nuly ⇒ qt(η)(1 − α) = −qt(η)(α). Pro velk´ y poˇ cet stupˇ n˚ u volnosti se nahrazuje norm´ aln´ım rozdˇ elen´ım.
Hustota normovan´ eho norm´ aln´ıho rozdˇ elen´ı a Studentova rozdˇ elen´ı s 5 stupni volnosti (p˚ uvodn´ıho a normovan´ eho).
5.10.4
Odhad stˇredn´ı hodnoty pˇri nezn´ am´ em rozptylu II
V naˇsem pˇr´ıpadˇ e: √
n U = (X − µ) m´ a N(0, 1) , σ 2 (n − 1) SX 2 (n − 1) , η = n − 1 , V = m´ a χ σ2 √ √ n (X − µ) U n r = σ r = (X − µ) m´ a t(n − 1) . 2 SX SX V η
σ2
Z toho vypl´ yvaj´ı intervalov´ e odhady +
SX −∞, X + √ qt(n−1)(1 − α) , n * ! SX X − √ qt(n−1)(1 − α), ∞ , n * + SX SX α X − √ qt(n−1)(1 − 2 ), X + √ qt(n−1)(1 − α2 ) . n n
Pˇri v´ ypoˇ ctu nahrad´ıme v´ ybˇ erov´ y pr˚ umˇ er X jeho realizac´ı x a v´ ybˇ erovou smˇ erodatnou odchylku SX jej´ı realizac´ı sx.
5.10.5
σ2
Odhad rozptylu
odhadneme v´ ybˇ erov´ ym rozptylem "
P
2 (n−1)SX 2 SX ; σ2
m´ a rozdˇ elen´ı χ2(n − 1);
# 2 (n − 1) SX ∈ (−∞, qχ2(n−1)(1 − α)i 2 σ
=1−α # 2 (n − 1) SX P ≤ qχ2(n−1)(1 − α) σ2 2 (n − 1) SX ≤ σ 2 P "
= =
qχ2(n−1)(1 − α)
= P σ 2 ∈ Dostali jsme doln´ı odhad.
*
2 (n − 1) SX
qχ2(n−1)(1 − α)
, ∞ .
Obdobnˇ e dostaneme i dalˇs´ı intervalov´ e odhady
+ 2 (n − 1) SX −∞, , qχ2(n−1)(α) * 2 (n − 1) SX , ∞ , qχ2(n−1)(1 − α) * 2 + 2 (n − 1) SX (n − 1) SX , . α qχ2(n−1) 1 − 2 qχ2(n−1) α 2 2 jeho realizac´ı s2 . Pˇri v´ ypoˇ ctu nahrad´ıme v´ ybˇ erov´ y rozptyl SX x
5.10.6
Intervalov´ e odhady spojit´ ych rozdˇ elen´ı, kter´ a nejsou norm´ aln´ı
pˇrev´ ad´ıme obvykle na norm´ aln´ı rozdˇ elen´ı neline´ arn´ı transformac´ı h(t) = Φ−1(FX (t))
(FX (X ) m´ a rovnomˇ ern´ e rozdˇ elen´ı na h0, 1i). Pouˇzijeme intervalov´ y odhad pro norm´ aln´ı rozdˇ elen´ı a transformujeme jej zpˇ et podle vzorce −1 h−1(u) = qX (Φ(u)) .
5.11
Obecn´ e odhady parametr˚ u
Rozdˇ elen´ı n´ ahodn´ e veliˇ ciny X z´ avis´ı na vektoru parametr˚ u ϑ = (ϑ1, . . . , ϑi) ∈ Π, kde Π ⊆ Ri je parametrick´ y prostor, tj. mnoˇzina vˇsech pˇr´ıpustn´ ych hodnot parametr˚ u; pravdˇ epodobnostn´ı funkci znaˇ c´ıme pX (t; ϑ) = pX (t; ϑ1, . . . , ϑi) atd. b ,...,Θ b ), resp. realizaci odhadu ϑ b = (ϑb1, . . . , ϑbi) pomoc´ı b = (Θ Hled´ ame odhad Θ 1 i realizace x = (x1, . . . , xn).
5.11.1
Metoda moment˚ u
Pro k = 1, 2, . . . je k-t´ y obecn´ y moment funkc´ı ϑ, EX k (ϑ) = EX k (ϑ1, . . . , ϑi) (z´ avislost na parametrech lze stanovit dle pravdˇ epodobnostn´ıho modelu). Lze jej t´ eˇz odhadnout pomoc´ı v´ ybˇ erov´ eho k-t´ eho obecn´ eho momentu mX k . b = (ϑb1, . . . , ϑbi) takovou, ˇze Metoda moment˚ u doporuˇ cuje realizaci odhadu ϑ EX k (ϑb1, . . . , ϑbi)
n 1 X = mX k = xkj , n j=1
k = 1, 2, . . . .
K jednoznaˇ cn´ emu urˇ cen´ı i promˇ enn´ ych obvykle potˇrebujeme (prvn´ıch) i rovnic pro k = 1, 2, . . . , i.
Pouˇ zitelnost metody moment˚ u Moˇ zn´ e probl´ emy:
ˇ sen´ı neexistuje ⇒ zkusme ubrat rovnice. 1. Reˇ
2. Je nekoneˇ cnˇ e mnoho ˇreˇsen´ı ⇒ zkusme pˇribrat dalˇs´ı rovnice.
3. Je v´ıce neˇz jedno ˇreˇsen´ı (napˇr. soustavy kvadratick´ ych rovnic).
4. Je jedin´ e ˇreˇsen´ı, ale je obt´ıˇzn´ e je nal´ ezt.
5. Soustava je ˇspatnˇ e podm´ınˇ en´ a (typicky pro velk´ y poˇ cet parametr˚ u).
b ∈ 6. Naˇsli jsme jedin´ e ˇreˇsen´ı, kter´ e vˇsak nesplˇ nuje pˇredpoklady, ϑ / Π (napˇr. parametry nemohou b´ yt libovoln´ aˇ c´ısla) ⇒ NELZE! Vˇ zdy kontrolujte ˇreˇsen´ı!
7. Vˇsem rovnic´ım je pˇrikl´ ad´ ana stejn´ a d˚ uleˇzitost, coˇz b´ yv´ a neˇz´ adouc´ı (typicky pro velk´ y poˇ cet parametr˚ u).
8. Nelze pouˇz´ıt pro nenumerick´ a data (pokud je nelze smysluplnˇ e oˇ c´ıslovat).
V´ yhoda:
1. Lze pouˇz´ıt pro diskr´ etn´ı, spojit´ e i sm´ıˇsen´ e rozdˇ elen´ı beze zmˇ en.
5.11.2
Metoda maxim´ aln´ı vˇ erohodnosti (likelihood)
Pro diskr´ etn´ı rozdˇ elen´ı Pravdˇ epodobnost realizace, pX (x; ϑ) = P [X1 = x1 ∧ . . . ∧ Xn = xn; ϑ]
=
n Y
h
i
P Xj = xj ; ϑ =
j=1
n Y
pX (xj ; ϑ) = L(ϑ) ,
j=1
je funkce L : Π → h0, 1i, Π ⊆ Ri, parametr˚ u ϑ = (ϑ1, . . . , ϑi), zvan´ a vˇ erohodnost realizace diskr´ etn´ıho rozdˇ elen´ı. b = (ϑb1, . . . , ϑbi), kter´ ˇ sen´ım jsou takov´ Reˇ e hodnoty ϑ e maximalizuj´ı vˇ erohodnost. Maximalizujeme bud’ vˇ erohodnost, nebo jej´ı logaritmus (log-likelihood), `(ϑ) = ln L(ϑ) =
n X
ln pX (xj ; ϑ) .
j=1
(Nutno vylouˇ cit pˇr´ıpad pX (xj ; ϑ) = 0, kter´ y vˇsak nevede na maximum.)
Pˇr´ıklad: Empirick´ e rozdˇ elen´ı je maxim´ alnˇ e vˇ erohodn´ y odhad diskr´ etn´ıho rozdˇ elen´ı (pokud na rozdˇ elen´ı nejsou kladeny dalˇs´ı podm´ınky). Pozn´ amka: Odhad na z´ akladˇ e maxima vˇ erohodnosti odpov´ıd´ a Bayesovsk´ emu odhadu ve speci´ aln´ım pˇr´ıpadˇ e, kdy vˇsechny hodnoty parametr˚ u maj´ı stejnou apriorn´ı pravdˇ epodobnost (resp. hustotu pravdˇ epodobnosti). Pouˇz´ıv´ a se, pokud apriorn´ı pravdˇ epodobnosti parametr˚ u nezn´ ame.
Pro spojit´ e rozdˇ elen´ı Kaˇzd´ a realizace m´ a nulovou pravdˇ epodobnost, proto m´ısto n´ı pouˇzijeme hustotu pravdˇ epodobnosti, coˇz ale vede na zcela jin´ y pojem fX (x; ϑ) =
n Y
fX (xj ; ϑ) = Λ(ϑ) .
j=1
Nicm´ enˇ e i tato funkce Λ : Π → h0, ∞), Π ⊆ Ri, se naz´ yv´ a vˇ erohodnost realizace spojit´ eho rozdˇ elen´ı. Pro korektn´ı definici potˇrebujeme spojitou hustotu (alespoˇ n na oboru hodnot, jichˇz n´ ahodn´ a veliˇ cina nab´ yv´ a); takov´ a hustota je nejv´ yˇse jedna. λ(ϑ) = ln Λ(ϑ) =
n X
ln fX (xj ; ϑ) .
j=1
(Nutno vylouˇ cit pˇr´ıpad fX (xj ; ϑ) = 0, kter´ y vˇsak nevede na maximum.)
Pro spojit´ e rozdˇ elen´ı Kaˇzd´ a realizace m´ a nulovou pravdˇ epodobnost, proto m´ısto n´ı pouˇzijeme hustotu pravdˇ epodobnosti, coˇz ale vede na zcela jin´ y pojem fX (x; ϑ) =
n Y
fX (xj ; ϑ) = Λ(ϑ) .
j=1
Nicm´ enˇ e i tato funkce Λ : Π → h0, ∞), Π ⊆ Ri, se naz´ yv´ a vˇ erohodnost realizace spojit´ eho rozdˇ elen´ı. Pro korektn´ı definici potˇrebujeme spojitou hustotu (alespoˇ n na oboru hodnot, jichˇz n´ ahodn´ a veliˇ cina nab´ yv´ a); takov´ a hustota je nejv´ yˇse jedna. λ(ϑ) = ln Λ(ϑ) =
n X
ln fX (xj ; ϑ) .
j=1
(Nutno vylouˇ cit pˇr´ıpad fX (xj ; ϑ) = 0, kter´ y vˇsak nevede na maximum.)
Pro sm´ıˇsen´ e rozdˇ elen´ı nen´ı vˇ erohodnost definov´ ana!
Pouˇ zitelnost metody maxim´ aln´ı vˇ erohodnosti Moˇ zn´ e probl´ emy:
1. Je v´ıce neˇz jedno ˇreˇsen´ı. (M˚ uˇze se st´ at, ˇze r˚ uzn´ e hodnoty parametr˚ u popisuj´ı tot´ eˇz rozdˇ elen´ı – vad´ı to?) ˇ sen´ı neexistuje (to se m˚ 2. Reˇ uˇze st´ at jedinˇ e kdyˇz vˇ erohodnostn´ı funkce je nespojit´ a nebo parametrick´ y prostor neuzavˇren´ y).
3. Je jedin´ e ˇreˇsen´ı, ale je obt´ıˇzn´ e je nal´ ezt. (Lok´ aln´ı extr´ emy nemus´ı b´ yt glob´ aln´ı.)
4. Soustava je ˇspatnˇ e podm´ınˇ en´ a.
5. Hodnoty vˇ erohodnosti mohou b´ yt velmi mal´ e.
6. Nelze pouˇ z´ıt pro sm´ıˇsen´ e rozdˇ elen´ı!
V´ yhody:
1. Hled´ an´ı optima je o nˇ eco snazˇs´ı neˇz ˇreˇsen´ı soustavy rovnic.
2. R˚ uzn´ ym dat˚ um je d´ an spoleˇ cn´ y (srovnateln´ y) v´ yznam.
3. Lze pouˇz´ıt i na nenumerick´ a data.
Pˇr ´ıklad. Z realizace n´ ahodn´ eho v´ ybˇ eru x = (x1, . . . , xn) z norm´ aln´ıho rozdˇ elen´ı N µ, σ 2 odhadnˇ ete parametry µ a r = σ 2.
ˇ sen´ı: Metoda moment˚ Reˇ u: Pouˇzijeme prvn´ı dva obecn´ e momenty, EX = µ ,
EX 2 = (EX )2 + DX = µ2 + σ 2 = µ2 + r .
ˇ sen´ı: Metoda moment˚ Reˇ u: Pouˇzijeme prvn´ı dva obecn´ e momenty, EX = µ ,
EX 2 = (EX )2 + DX = µ2 + σ 2 = µ2 + r .
b rb m´ Pro odhady µ, ame soustavu rovnic n 1 X b= µ xj , n j=1 n X 1 b 2 + rb = µ x2j . n j=1
ˇ sen´ı: Metoda moment˚ Reˇ u: Pouˇzijeme prvn´ı dva obecn´ e momenty, EX = µ ,
EX 2 = (EX )2 + DX = µ2 + σ 2 = µ2 + r .
b rb m´ Pro odhady µ, ame soustavu rovnic n 1 X b= µ xj , n j=1 n X 1 b 2 + rb = µ x2j . n j=1
ˇ sen´ı: Reˇ b = x, µ n n 1 X 1 X 2 2 b = rb = xj − µ x2j − x2 , n j=1 n j=1
coˇz je alternativn´ı (vych´ ylen´ y konzistentn´ı) odhad rozptylu n n n n 2 X X X X 1 1 1 2 2 d xj + D X= xj − x = x2 = xj − x n j=1 n j=1 n j=1 n j=1 n n 1 X 1 X 2 2 2 = xj − 2 x + x = x2j − x2 = rb . n j=1 n j=1
Metoda maxim´ aln´ı vˇ erohodnosti: Λ (µ, r) =
Y
fN(µ,r)(xj ) =
j
n Y j=1 n X
√
1 exp 2πr
−(xj − µ)2
2r
!
,
−1 n n (xj − µ)2 − ln r − ln 2 π , 2 r j=1 2 2 n n n ∂ 1 X 1 X xj − n µ = (x − µ) , λ (µ, r) = (xj − µ) = ∂µ r j=1 r j=1 r X n n ∂ 1 X n n 1 2− 2−r . λ (µ, r) = = ( x − µ ) ( x − µ ) j j ∂r 2 r2 j=1 2r 2 r2 n j=1 λ (µ, r) = ln Λ (µ, r) =
Metoda maxim´ aln´ı vˇ erohodnosti: Λ (µ, r) =
Y
fN(µ,r)(xj ) =
j
n Y j=1 n X
√
1 exp 2πr
−(xj − µ)2
2r
!
,
−1 n n (xj − µ)2 − ln r − ln 2 π , 2 r j=1 2 2 n n n ∂ 1 X 1 X xj − n µ = (x − µ) , λ (µ, r) = (xj − µ) = ∂µ r j=1 r j=1 r X n n ∂ 1 X n n 1 2− 2−r . λ (µ, r) = = ( x − µ ) ( x − µ ) j j ∂r 2 r2 j=1 2r 2 r2 n j=1 λ (µ, r) = ln Λ (µ, r) =
Maximum opˇ et nast´ av´ a pro b = x, µ n n 2 1 X 1 X 2 d (xj − µ) = rb = xj − x = D X. n j=1 n j=1
Odhad parametr˚ u smˇ esi norm´ aln´ıch rozdˇ elen´ı ´ Uloha: Z realizace n´ ahodn´ eho v´ ybˇ eru (x1, ..., xn) urˇ cete had smˇ esi norm´ aln´ıch rozdˇ elen´ı se stˇredn´ımi hodnotami zn´ am´ ym rozptylem σ 2 a koeficienty smˇ esi (v´ ahami) ck ,
maxim´ alnˇ e vˇ erohodn´ y odµk , k = 1, ..., K , stejn´ ym k = 1, ..., K .
Pokus o ˇreˇsen´ı: fX (t) =
Λ(µ, c) =
X k Y
ck fN(µ ,σ2)(t) = k fX (xj ) =
j
YX j
k
X
ck √
k
1 exp 2πσ
−(t − µk )2 2 σ2
!
ck fN(µ ,σ2)(xj ) = k
! 2 −(xj − µk ) 2 2σ
X 1 √ = = ck exp 2πσ k j !n ! 2 YX −(xj − µk ) 1 = √ ck exp , 2 2σ 2πσ j k Y
λ(µ, c) =
X
ln
X
j
= −n ln
ck fN(µ ,σ2)(xj ) = k
k √
2πσ +
X j
ln
X k
ck exp
−(xj − µk )2 2 σ2
!
.
Vˇ erohodnost se tˇ eˇzko maximalizuje pˇr´ımo, pouˇz´ıv´ a se iteraˇ cn´ı metoda:
,
EM algoritmus EM (Expectation-Maximization) [Dempster, Laird, and Rubin 1977, M.I. Schlesinger 1968, US Army ˜1950]. Stupeˇ n pˇr´ısluˇsnosti xj ke k-t´ e sloˇzce smˇ esi pop´ıˇseme koeficientem αj,k ∈ h0, 1i, pˇriˇ cemˇz K X
αj,k = 1 ,
k=1
n X
αj,k > 0 .
j=1
1. Zvol´ıme n´ ahodnˇ e r˚ uzn´ e stˇredn´ı hodnoty sloˇzek smˇ esi µk a nenulov´ e koeficienty P ck , k = 1, ..., K , splˇ nuj´ıc´ı k ck = 1. E. Stanov´ıme stupnˇ e pˇr´ısluˇsnosti
αj,k :=
ck fN(µ ,σ2)(xj ) k K P k0 =1
ck0 fN(µ 0 ,σ2)(xj ) k
(jmenovatel je normalizaˇ cn´ı faktor).
−(xj −µk 2 σ2 K P −(xj −µk0 )2 ck0 exp 2 σ2 k0 =1
ck exp
=
)2
M. Aktualizujeme koeficienty sloˇzek smˇ esi n P
ck :=
αj,k
j=1 K P n P
k0 =1 j=1
αj,k0
n 1 X = αj,k n j=1
a stˇredn´ı hodnoty sloˇzek jako tˇ eˇziˇstˇ e hodnot realizace v´ aˇzen´ ych stupni pˇr´ısluˇsnosti, n P
µk :=
n P
αj,k xj
j=1 n P
j=1
= αj,k
j=1
αj,k xj
n ck
.
2. Opakujeme EM, dokud to pˇrin´ aˇs´ı podstatnou zmˇ enu v´ ysledk˚ u.
Podobnˇ e lze postupovat i pro nezn´ am´ e rozptyly jednotliv´ ych sloˇzek smˇ esi.
M. Aktualizujeme koeficienty sloˇzek smˇ esi n P
ck :=
αj,k
j=1 K P n P
k0 =1 j=1
αj,k0
n 1 X = αj,k n j=1
a stˇredn´ı hodnoty sloˇzek jako tˇ eˇziˇstˇ e hodnot realizace v´ aˇzen´ ych stupni pˇr´ısluˇsnosti, n P
µk :=
n P
αj,k xj
j=1 n P
j=1
= αj,k
j=1
αj,k xj
n ck
.
2. Opakujeme EM, dokud to pˇrin´ aˇs´ı podstatnou zmˇ enu v´ ysledk˚ u.
Podobnˇ e lze postupovat i pro nezn´ am´ e rozptyly jednotliv´ ych sloˇzek smˇ esi. Vˇ eta: V pr˚ ubˇ ehu EM algoritmu vˇ erohodnost nekles´ a.
M. Aktualizujeme koeficienty sloˇzek smˇ esi n P
ck :=
αj,k
j=1 K P n P
k0 =1 j=1
αj,k0
n 1 X = αj,k n j=1
a stˇredn´ı hodnoty sloˇzek jako tˇ eˇziˇstˇ e hodnot realizace v´ aˇzen´ ych stupni pˇr´ısluˇsnosti, n P
µk :=
n P
αj,k xj
j=1 n P
j=1
= αj,k
j=1
αj,k xj
n ck
.
2. Opakujeme EM, dokud to pˇrin´ aˇs´ı podstatnou zmˇ enu v´ ysledk˚ u.
Podobnˇ e lze postupovat i pro nezn´ am´ e rozptyly jednotliv´ ych sloˇzek smˇ esi. Vˇ eta: V pr˚ ubˇ ehu EM algoritmu vˇ erohodnost nekles´ a.
Toto je jen velmi speci´ aln´ı uk´ azka EM algoritmu; lze jej snadno rozˇs´ıˇrit na v´ıce dimenz´ı a jin´ e typy smˇ es´ı. Pouˇzit´ı pro parametry smˇ es´ı rozdˇ elen´ı je typick´ e, ne vˇsak jedin´ e moˇzn´ e. Probl´ em: Uv´ıznut´ı v lok´ aln´ım extr´ emu. EM algoritmus rozˇsiˇruje moˇznosti pouˇzit´ı metody maxim´ aln´ı vˇ erohodnosti.
6
6.1
Testov´ an´ı hypot´ ez
Z´ akladn´ı pojmy a principy testov´ an´ı hypot´ ez
(doporuˇ cen´ a literatura: [Jaroˇs a kol.]) M´ ame posoudit hypot´ ezu o hodnotˇ e nˇ ejak´ eho parametru rozdˇ elen´ı ϑ (pomoc´ı krit´ eria ˇ cili testovac´ı statistiky T , resp. jej´ı realizace t). Pˇredpoklad: Parametr ϑ nab´ yv´ a pouze 2 hodnot, 0 pro norm´ aln´ı“ populaci, 1 pro ” anom´ aln´ı“ prvky. O prvku m´ ame rozhodnout, ke kter´ e skupinˇ e patˇr´ı (tj. odhad” nout ϑ). K tomu pouˇzijeme testovac´ı statistiku T (resp. jej´ı realizaci t). Ta z´ avis´ı na ϑ. Pˇredpokl´ adejme, ˇze obˇ e skupiny maj´ı zn´ am´ a rozdˇ elen´ı statistiky T , kter´ a pro anom´ aln´ı skupinu nab´ yv´ a vˇ etˇs´ıch“ hodnot. (Nˇ ekter´ e hodnoty statistiky T se ” mohou vyskytnout v obou skupin´ ach, takˇze klasifikace nem˚ uˇze b´ yt bezchybn´ a.) Zvol´ıme pr´ ah κ ∈ R a prvek klasifikujeme n´ asledovnˇ e: pro pro
T ≤κ T >κ
norm´ aln´ı, anom´ aln´ı.
Pˇr´ıklad: M´ ame zastavit pouˇz´ıv´ an´ı l´ eku pro podezˇren´ı z neˇz´ adouc´ıch u ´ˇ cink˚ u? Nulov´ a hypot´ eza H0: V´ yrobce je nevinen, riziko se nezvyˇsuje. Alternativn´ı hypot´ eza H1: V´ yrobce je vinen, riziko se zvyˇsuje.
Chyba 1. druhu (obvin´ıme nevinn´ eho): Zam´ıtneme nulovou hypot´ ezu, kter´ a plat´ı. Norm´ aln´ı je klasifikov´ an jako anom´ aln´ı s pravdˇ epodobnost´ı α(κ) (nerostouc´ı funkce κ). Chyba 2. druhu (osvobod´ıme vinn´ eho): Nezam´ıtneme nulovou hypot´ ezu, kter´ a neplat´ı. Anom´ aln´ı je klasifikov´ an jako norm´ aln´ı s pravdˇ epodobnost´ı β (κ) (neklesaj´ıc´ı funkce κ). ROC kˇrivka (angl. ROC curve, receiver operating characteristic) vyjadˇruje z´ avislost pravdˇ epodobnosti chyby prvn´ıho druhu α (vodorovnˇ e) a s´ıly testu 1 − β (svisle), parametrem kˇrivky je kritick´ a hodnota κ. Volbou kritick´ e hodnoty se chceme co nejv´ıce pˇribl´ıˇzit bodu (0, 1), tj. bezchybn´ e klasifikaci. Nicm´ enˇ e vybereme bod, v nˇ emˇz se pravdˇ epodobnost chyby prvn´ıho druhu rovn´ a zvolen´ emu ˇ c´ıslu α (tj. s danou vodorovnou souˇradnic´ı). 1
1-b 0.75
0.5
0.25
0 0
0.25
0.5
0.75
1
a
Obr´ azek 1: Typick´ y pr˚ ubˇ eh ROC kˇrivky
Moˇzn´ a krit´ eria pro volbu prahu κ: • α(κ) = β (κ), • min(α(κ) + β (κ)), κ
• min e(α(κ), β (κ)), napˇr. min(a α(κ)+b β (κ)), tj. minimalizace v´ yplatn´ı funkce, κ
κ
• α(κ) = pˇredem zvolen´ a mal´ a hodnota.
Vˇ etˇsinou se pouˇz´ıv´ a posledn´ı moˇznost, a to z d˚ uvod˚ u • technick´ ych (snazˇs´ı u ´loha), • nepotˇrebujeme zn´ at rozdˇ elen´ı anom´ aln´ı skupiny, • obvykle m´ ame v´ıce neˇz dvˇ e moˇzn´ e hodnoty parametru, coˇz situaci komplikuje.
Volbou pˇr´ısnosti krit´ eria sniˇzujeme riziko jedn´ e chyby na u ´kor zv´ yˇsen´ı rizika druh´ e chyby. Dohodnut´ e v´ ychodisko: Kritickou hodnotu testu κ stanov´ıme tak, aby chyba 1. druhu nast´ avala s danou pravdˇ epodobnost´ı α zvanou hladina v´ yznamnosti (nebo s menˇs´ı pravdˇ epodobnost´ı, nelze-li dos´ ahnout rovnost). Podle tradice v oboru se nejˇ castˇ eji uˇz´ıvaj´ı hodnoty 1% nebo 5% (vˇzdy α 12 ). Hodnoty krit´ eria, kter´ a pˇresahuj´ı kritickou hodnotu (odpov´ıdaj´ı v´ ysledk˚ um m´ alo pravdˇ epodobn´ ym pˇri platnosti nulov´ e hypot´ ezy) povaˇzujeme za statisticky v´ yznamn´ e a v tom pˇr´ıpadˇ e nulovou hypot´ ezu zam´ıt´ ame. V opaˇ cn´ em pˇr´ıpadˇ e nulovou hypot´ ezu nezam´ıt´ ame, ale ani nepotvrzujeme, nebot’ t´ım bychom se mohli dopustit chyby 2. druhu s bl´ıˇze neurˇ cenou pravdˇ epodobnost´ı β . S´ıla testu 1 − β .
Rozliˇsuje se
• jednoduch´ a hypot´ eza: nulov´ e hypot´ eze odpov´ıd´ a jedin´ a hodnota parametru,
• sloˇ zen´ a hypot´ eza: nulov´ e hypot´ eze odpov´ıd´ a v´ıce hodnot parametru,
a d´ ale
• jednoduch´ a alternativa: alternativn´ı hypot´ eze odpov´ıd´ a jedin´ a hodnota parametru,
• sloˇ zen´ a alternativa: alternativn´ı hypot´ eze odpov´ıd´ a v´ıce hodnot parametru.
ˇ Casto se formuluje nulov´ a a alternativn´ı hypot´ eza tak, ˇze nejsou navz´ ajem sv´ ymi negacemi a nepokr´ yvaj´ı prostor vˇsech moˇzn´ ych hodnot parametru. Vznik´ a t´ım jen chaos (viz vˇ etˇsina ostatn´ı literatury). Snadno se mu vyhneme, kdyˇz budeme formulovat nulovou hypot´ ezu jako negaci alternativn´ı hypot´ ezy. Je-li napˇr. H1 : ϑ > c, pak nevol´ıme H0 : ϑ = c, ale H0 : ϑ ≤ c. (Nejvˇ etˇs´ı riziko chyby 1. druhu obykle odpov´ıd´ a pˇr´ıpadu ϑ = c, takˇze postup je stejn´ y.) U sloˇzen´ e hypot´ ezy poˇzadujeme, aby pravdˇ epodobnost chyby 1. druhu byla nejv´ yˇse α pro vˇsechny hodnoty parametru vyhovuj´ıc´ı nulov´ e hypot´ eze. (Statistick´ a v´ yznamnost neznamen´ a v´ yznamnost praktickou.)
ˇ sen´ı: Nulovou hypot´ Reˇ ezu zam´ıtneme, pr´ avˇ e kdyˇz hodnota krit´ eria z´ıskan´ a z realizace nepadne do intervalu spolehlivosti pro koeficient spolehlivosti 1 −α, tj. kritick´ a hodnota je mez´ı intervalov´ eho odhadu. Obr´ acen´ y probl´ em: Pˇri jak´ e mezn´ı hladinˇ e v´ yznamnosti by pozorovan´ a hodnota byla kritick´ a; tomu ˇr´ık´ ame dosaˇ zen´ a v´ yznamnost; staˇ c´ı ji porovnat s pˇredem zvolenou ˇ ım niˇ hladinou v´ yznamnosti testu. (C´ zˇs´ı ˇ c´ıslo, t´ım v´ yznamnˇ ejˇs´ı v´ ysledek.) Programy obvykle d´ avaj´ı za v´ ysledek dosaˇzenou v´ yznamnost (obvykle se znaˇ c´ı P a ˇr´ık´ a se j´ı pouze significance). V´ yhody: hladinu v´ yznamnosti nen´ı tˇreba pˇredem zadat, a nav´ıc se dov´ıme, jak daleko od n´ı jsme byli. Typick´ y tvar testu: Testovac´ı statistiku T , kter´ a roste s parametrem ϑ a m´ a zn´ am´ e rozdˇ elen´ı, (pˇresnˇ eji jej´ı realizaci t) porovn´ av´ ame s kvantily pˇr´ısluˇsn´ eho rozdˇ elen´ı a zam´ıtneme pˇri extr´ emn´ıch hodnot´ ach (nepravdˇ epodobn´ ych pˇri platnosti nulov´ e hypot´ ezy): H0 ϑ≤c ϑ≥c ϑ=c
H1 ϑ>c ϑ
zam´ıt´ ame pro t > qT (1 − α) t < qT (α) α) t > qT (1 − α ) nebo t < q ( T 2 2
dosaˇzen´ a v´ yznamnost 1 − FT (t) FT (t) 2 min (FT (t), 1 − FT (t))
V literatuˇre se setk´ ame i s n´ asleduj´ıc´ımi pˇr´ıpady hypot´ ez, kter´ e se vˇsak ˇreˇs´ı stejnˇ e jako prvn´ı dva v´ yˇse uveden´ e: H0 ϑ=c ϑ=c
H1 ϑ>c ϑ
6.2 6.2.1
Testy stˇredn´ı hodnoty norm´ aln´ıho rozdˇ elen´ı Pˇri zn´ am´ em rozptylu σ 2
x−c√ t= n σ porovn´ av´ ame s kvantily normovan´ eho norm´ aln´ıho rozdˇ elen´ı: H0 µ≤c µ≥c µ=c
6.2.2
zam´ıt´ ame pro t > Φ−1(1 − α) t < −Φ−1(1 − α) = Φ−1(α) |t| > Φ−1(1 − α 2)
Pˇri nezn´ am´ em rozptylu
x−c√ t= n sx
dosaˇzen´ a v´ yznamnost 1 − Φ(t) Φ(t) 2 (1 − Φ(|t|))
porovn´ av´ ame s kvantily Studentova rozdˇ elen´ı s n − 1 stupni volnosti: H0 µ≤c µ≥c
zam´ıt´ ame pro t > qt(n−1)(1 − α) t < −qt(n−1)(1 − α)
µ=c
|t| > qt(n−1)(1 − α 2)
dosaˇzen´ a v´ yznamnost 1 − Ft(n−1)(t) Ft(n−1)(t)
2 1 − Ft(n−1)(|t|)
6.3
Testy rozptylu norm´ aln´ıho rozdˇ elen´ı (n − 1) s2x t= c
porovn´ av´ ame s kvantily χ2-rozdˇ elen´ı s n − 1 stupni volnosti: H0 σ2 ≤ c σ2 ≥ c σ2
=c
zam´ıt´ ame pro t > qχ2(n−1)(1 − α) t < qχ2(n−1)(α) t < qχ2(n−1)( α 2)
nebo t > qχ2(n−1)(1 − α 2)
dosaˇzen´ a v´ yznamnost 1 − Fχ2(n−1)(t) Fχ2(n−1)(t)
2 min Fχ2(n−1)(t), 1 − Fχ2(n−1)(t)
6.4
Porovn´ an´ı dvou norm´ aln´ıch rozdˇ elen´ı
Pˇredpoklad: Nez´ avisl´ e v´ ybˇ ery (X1, . . . , Xm) z rozdˇ elen´ı N(EX, DX ), (Y1, . . . , Yn) z rozdˇ elen´ı N(EY, DY ).
6.4.1
Testy rozptylu dvou norm´ aln´ıch rozdˇ elen´ı [Fisher]
. 2 2 = Je-li DX = DY , pak SX SY . Testovac´ı statistikou je T =
2 SX 2 SY
.
F-rozdˇ elen´ı (Fisherovo-Snedecorovo rozdˇ elen´ı) s ξ a η stupni volnosti je rozdˇ elen´ı n´ ahodn´ e veliˇ ciny F =
U ξ , V η
kde U, V jsou nez´ avisl´ e n´ ahodn´ e veliˇ ciny s rozdˇ elen´ım χ2(ξ ), resp. χ2(η ). Znaˇ cen´ı: F(ξ, η ) Hustota pro x > 0: fF(ξ,η) (x) = c (ξ, η )
ξ x 2 −1
ξ+η Γ 2 Γ 2ξ Γ η2
c (ξ, η ) =
Je-li DX = DY = σ 2, pak dosad´ıme
1+
ξ x η
ξ η
!ξ
!− ξ+η 2
2
,
U :=
2 (m − 1) SX
V :=
σ2 2 (n − 1) SY
m´ a χ2(m − 1) , m´ a χ2(n − 1) ,
σ2 ξ := m − 1, η := n − 1 , F =
U ξ V η
=
2 (m−1) SX (m−1) σ 2 2 (n−1) SY (n−1) σ 2
Testujeme realizaci s2x t= 2 sy
na rozdˇ elen´ı F(m − 1, n − 1):
=
2 SX 2 SY
=T.
H0 DX ≤ DY DX ≥ DY DX = DY
zam´ıt´ ame pro t > qF(m−1,n−1)(1 − α) t < qF(m−1,n−1)(α) t < qF(m−1,n−1)( α 2 ) nebo t > qF(m−1,n−1)(1 − α 2)
dosaˇzen´ a v´ yznamnost 1 − FF(m−1,n−1)(t) FF(m−1,n−1)(t) 2 min(FF(m−1,n−1)(t), 1 − FF(m−1,n−1)(t))
Pro kaˇzdou hladinu v´ yznamnosti potˇrebujeme dvoudimenzion´ aln´ı tabulku kvantil˚ u indexovanou ξ, η ; obvykle je tabelov´ ana jen polovina, druhou je tˇreba dopoˇ c´ıtat podle vzorce 1 qF(ξ,η)(β ) = . qF(η,ξ)(1 − β ) (Pozor na opaˇ cn´ e poˇrad´ı index˚ u!)
L´ epe je uvaˇzovat
2 SY 2 SX
m´ısto
2 SX 2 , SY
takˇze rozliˇs´ıme 2 pˇr´ıpady:
1. Pro s2x ≥ s2y testujeme s2x t= 2 ≥1 sy
na rozdˇ elen´ı F(m − 1, n − 1):
H0 DX ≤ DY DX ≥ DY DX = D Y
zam´ıt´ ame pro t > qF(m−1,n−1)(1 − α) nezam´ıt´ ame t > qF(m−1,n−1)(1 − α 2)
dosaˇzen´ a v´ yznamnost 1 − FF(m−1,n−1)(t) ˇz´ adn´ a 2 1 − FF(m−1,n−1)(t)
1. Pro s2x ≤ s2y testujeme s2y
t= 2 ≥1 sx
na rozdˇ elen´ı F(n − 1, m − 1) (pozor na poˇrad´ı poˇ ct˚ u stupˇ n˚ u volnosti!):
H0 DX ≤ DY DX ≥ DY
zam´ıt´ ame pro nezam´ıt´ ame t > qF(n−1,m−1)(1 − α)
DX = D Y
t > qF(n−1,m−1)(1 − α 2)
dosaˇzen´ a v´ yznamnost ˇz´ adn´ a 1 − FF(n−1,m−1)(t)
2 1 − FF(n−1,m−1)(t)
6.4.2
Testy stˇredn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı se zn´ am´ ym rozptylem σ 2
X m m´ a N EX,
σ2
!
,
m ! 2 σ Y n m´ a N EY, , n
1 1 2 + X m − Y n m´ a N EX − EY, σ m n Za pˇredpokladu EX = EY :
T :=
Xm − Y n σ
q
1 m
+
1 n
m´ a N (0, 1) .
Testujeme realizaci t na N (0, 1) (viz kapitola 6.2.1).
.
6.4.3
Testy stˇredn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı se (stejn´ ym) nezn´ am´ ym rozptylem
Pˇredpoklad: DX = DY = σ 2 Nejprve ovˇ eˇr´ıme tento pˇredpoklad (viz kapitola 6.4.1). (Ve skuteˇ cnosti nem˚ uˇzeme pˇredpoklad ovˇ eˇrit, jedinˇ e vyvr´ atit; pokus´ıme se o to, a pokud se to nepodaˇr´ı, pokraˇ cujeme. Bez tohoto pˇredpokladu by byl dalˇs´ı postup sloˇzitˇ ejˇs´ı, viz napˇr. [Mood a kol.].) 2 , S 2 stejn´ M´ ame dva odhady SX e hodnoty σ 2; pouˇzijeme jejich pr˚ umˇ er v´ aˇzen´ y Y rozsahy v´ ybˇ er˚ u (−1 kv˚ uli v´ ypoˇ ctu v´ ybˇ erov´ eho pr˚ umˇ eru): 2 (m − 1) SX
σ2 2 (n − 1) SY σ2 2 + (n − 1) S 2 (m − 1) SX Y σ2
m´ a χ2(m − 1) , m´ a χ2(n − 1) , m´ a χ2(m + n − 2)
se stˇredn´ı hodnotou m + n − 2, 2 + (n − 1) S 2 (m − 1) SX Y
(m + n − 2) σ 2
S2 = 2 σ
m´ a stˇredn´ı hodnotu 1 a S2
:=
2 + (n − 1) S 2 (m − 1) SX Y
m+n−2
je nestrann´ y odhad σ 2, S :=
v u u (m − 1) S 2 + (n − 1) S 2 t Y X
m+n−2
X m m´ a N EX,
σ2
.
!
,
m ! 2 σ Y n m´ a N EY, , n
1 1 2 X m − Y n m´ a N EX − EY, σ + m n
.
Za pˇredpokladu EX = EY :
Xm − Y n q
(m + n − 2) S 2 = 2 σ
1 m
σ + n1 2 + (n − 1) S 2 (m − 1) SX Y σ2
m´ a N (0, 1) , m´ a χ2(m + n − 2) ,
Xq m −Y n 1 +1 σ m Xm − Y n n r = m´ a t(m + n − 2) . T := q 1 1 2 S S m+n σ2
Testujeme realizaci t na rozdˇ elen´ı t(m + n − 2) (viz kapitola 6.2.2).
6.5
Testy stˇredn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı - p´ arov´ y pokus
(dle [SH10]) Pˇr´ıklad: M´ ame porovnat pr˚ umˇ ernou teplotu na dvou m´ıstech. Standardn´ı test stˇredn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı je slab´ y kv˚ uli velk´ emu rozptylu, kter´ y vˇsak m´ a spoleˇ cnou pˇr´ıˇ cinu a projevuje se proto synchronnˇ e v obou v´ ybˇ erech; proto v´ ybˇ ery nejsou navz´ ajem nez´ avisl´ e. Mˇ eˇr´ıme vˇzdy obˇ e veliˇ ciny souˇ casnˇ e. Pˇredpoklad: N´ ahodn´ e veliˇ ciny Xj , Yj (j = 1, . . . , n) maj´ı norm´ aln´ı rozdˇ elen´ı N(µj , σ 2) se st´ al´ ym rozptylem σ 2 a promˇ enn´ ymi stˇredn´ımi hodnotami µj = EXj = EYj . M˚ uˇzeme pouˇz´ıt n´ ahodn´ e veliˇ ciny Uj := Xj − µj , Vj := Yj − µj (j = 1, . . . , n), kter´ e jsou nez´ avisl´ e a maj´ı rozdˇ elen´ı N(0, σ 2). N´ ahodn´ e veliˇ ciny ∆j := Xj − Yj = Uj − Vj (j = 1, . . . , n) jsou nez´ avisl´ e a maj´ı rozdˇ elen´ı N(0, 2σ 2).
2σ 2
V´ ybˇ erov´ y pr˚ umˇ er ∆ m´ a N 0, n
.
6.5.1
Pro zn´ am´ y rozptyl σ 2
Nezn´ am´ e parametry sdruˇzen´ eho rozdˇ elen´ı jsou µ1, . . . , µn, ale nepotˇrebujeme je. Dle kapitoly 6.2.1 (pro c = 0) testujeme
∆ n X −Y T := = σ 2 σ r
r
n 2
na N(0, 1).
6.5.2
Pro nezn´ am´ y rozptyl
Nezn´ am´ e parametry sdruˇzen´ eho rozdˇ elen´ı jsou Θ = (σ 2, µ1, . . . , µn), potˇrebujeme z nich pouze σ 2 = DX . M˚ uˇzeme pracovat pˇr´ımo s v´ ybˇ erem (∆1, . . . , ∆n) z norm´ aln´ıho rozdˇ elen´ı. Dle kapitoly 6.2.2 (pro c = 0) testujeme
∆√ T := n S∆ na t(n − 1).
Cviˇ cen´ı: Maxim´ alnˇ e vˇ erohodn´ y odhad parametr˚ u: `(Θ) = L(Θ) =
b) ∂L(ϑ 0= = cj ∂µ =
n Y
√
1 exp 2πσ
−(xj − µj )2 2 σ2
!
·
√
1 exp 2πσ
−(yj − µj )2 2 σ2
j=1 j=1 n (x − µ )2 n (y − µ )2 √ X X j j j j − − − 2 n ln σ − 2 n ln 2 π , 2 2 2σ 2σ j=1 j=1 ! 2 2 c c (xj − µj ) (yj − µj ) ∂ − − cj ∂µ 2 σc2 2 σc2 1 1 cj ) + (yj − µ cj ) = cj , (xj − µ xj + yj − 2 µ c2 c2 σ σ
xj + yj , j = 1, . . . , n . 2 cj , (j = 1, . . . , n) nejsou konzistentn´ı. Odhady µ Po jejich dosazen´ı: cj = µ
n Y
!
,
n (x − y )2 √ X j j c2 b L(ϑ) = − − n ln σ − 2 n ln 2 π , c2 4σ j=1 n (x − y )2 b) X ∂L(ϑ 2n j j 0= = − , 2 c2 c c2 ∂ σ σ2 j=1 4 σ n n X 1 1 X c2 (xj − yj )2 = δj2 , σ = 2 n j=1 2 n j=1
kde δj je realizace ∆j . Odhad σc2 je konzistentn´ı.
6.6
χ2-test dobr´ e shody
Slouˇz´ı k testov´ an´ı hypot´ ezy, ˇze n´ ahodn´ a veliˇ cina m´ a pˇredpokl´ adan´ e rozdˇ elen´ı. Protoˇze um´ıme hypot´ ezy jen zam´ıtat, nikdy nepotvrd´ıme, ˇze takov´ e rozdˇ elen´ı opravdu m´ a. Testujeme diskr´ etn´ı rozdˇ elen´ı (mohlo vzniknout diskretizac´ı spojit´ eho). H0 : N´ ahodn´ a veliˇ cina m´ a diskr´ etn´ı rozdˇ elen´ı do k tˇr´ıd s nenulov´ ymi pravdˇ epodobnostmi p1, . . . , pk .
Testujeme pomoc´ı realizace n´ ahodn´ eho v´ ybˇ eru rozsahu n. Nen´ı d˚ uleˇzit´ e poˇrad´ı v´ ysledk˚ u, pouze jejich ˇ cetnosti ni, resp. relativn´ı ˇ cetnosti nni (i = 1, . . . , k). Porovn´ av´ ame ˇ cetnost ni s teoretickou ˇ cetnost´ı n pi. Testovac´ı statistikou je T :=
k X (ni − n pi)2
n pi
i=1 n → ∞ bl´ıˇz´ı χ2(k − 1).
.
Jej´ı rozdˇ elen´ı se pro Dosaˇzen´ a v´ yznamnost: 1 − Fχ2(k−1)(t). Nulovou hypot´ ezu zam´ıt´ ame pro t > qχ2(k−1)(1 − α), tj. 1 − Fχ2(k−1)(t) < α.
Cviˇ cen´ı. Tabulka ud´ av´ a rozdˇ elen´ı (podm´ınˇ en´ e) pravdˇ epodobnosti, ˇze voliˇ c strany zastoupen´ e v parlamentu volil danou stranu. Posud’te na 5 % hladinˇ e v´ yznamnosti hypot´ ezu, ˇze stejn´ e rozdˇ elen´ı maj´ı i poslanci. relativn´ı preference poˇ cet poslanc˚ u
0.376 81
0.344 74
0.136 26
0.077 13
0.067 6
ˇ sen´ı. Dopln´ıme tabulku (posledn´ı sloupec uv´ Reˇ ad´ı celkov´ yu ´daj): relativn´ı preference poˇ cet poslanc˚ u teor. ˇ cetnost pˇr´ıspˇ evek k χ2
0.376 81 75.2 0.447
0.344 74 68.8 0.393
0.136 26 27.2 0.052
0.077 13 15.4 0.374
0.067 6 13.4 4.086
1 200 200 5 .353
. Hodnotu krit´ eria 5.353 porovn´ ame s kvantilem qχ2(4)(0.95) = 9.4877 a hypot´ ezu nezam´ıt´ ame (ponˇ ekud pˇrekvapiv´ y z´ avˇ er vzhledem k tomu, ˇze posledn´ı dvˇ e strany maj´ı t´ emˇ eˇr stejnou podporu u voliˇ c˚ u, ale posledn´ı m´ a v´ıce neˇz 2× m´ enˇ e poslanc˚ u).
6.6.1
Modifikace
Probl´ em: Testujeme na rozdˇ elen´ı, kter´ emu se skuteˇ cn´ e jen limitnˇ e bl´ıˇz´ı. T´ım se dopouˇst´ıme bl´ıˇze neurˇ cen´ e dodateˇ cn´ e chyby. Teoretick´ e ˇ cetnosti tˇr´ıd nesm´ı b´ yt pˇr´ıliˇs mal´ e (ˇreknˇ eme aspoˇ n 5), aby n´ aˇs pˇredpoklad byl opr´ avnˇ en´ y. Modifikace: Vych´ az´ı-li teoretick´ aˇ cetnost nˇ ekter´ ych tˇr´ıd pˇr´ıliˇs mal´ a, slouˇ c´ıme je s jin´ ymi tˇr´ıdami (pokud moˇzno bl´ızk´ ymi“). ” Probl´ em: Zkouman´ e rozdˇ elen´ı m˚ uˇze z´ aviset na nezn´ am´ ych parametrech. Modifikace 1: Parametry odhadneme na z´ akladˇ e jin´ eho n´ ahodn´ eho v´ ybˇ eru. Modifikace 2: Parametry odhadneme na z´ akladˇ e stejn´ eho n´ ahodn´ eho v´ ybˇ eru, kter´ y pouˇz´ıv´ ame k testu dobr´ e shody. T´ım jsme vˇsak sn´ıˇzili poˇ cet stupˇ n˚ u volnosti, takˇze mus´ıme testovat na rozdˇ elen´ı χ2(k − 1 −q ), kde q je poˇ cet odhadnut´ ych parametr˚ u. Probl´ em: Chceme testovat shodu se spojit´ ym nebo sm´ıˇsen´ ym rozdˇ elen´ım.
Modifikace: Rozdˇ elen´ı napˇred diskretizujeme, tj. vˇsechny moˇzn´ e v´ ysledky rozdˇ el´ıme do k disjunktn´ıch tˇr´ıd. Prvky v jedn´ e tˇr´ıdˇ e si maj´ı b´ yt bl´ızk´ e“, jinak sniˇzujeme ” s´ılu testu. Vˇsechny teoretick´ eˇ cetnosti mus´ı b´ yt dostateˇ cnˇ e velk´ e a nejl´ epe zhruba stejn´ e. Pozn´ amka: Z´ asadnˇ e mus´ıme pracovat s jednotkami (objekty), z nichˇz kaˇzd´ a zvl´ aˇst’ (a nez´ avisle) je zaˇrazena do nˇ ejak´ e tˇr´ıdy. Nelze poˇ c´ıtat s tis´ıci, procenty, spojit´ ym mnoˇzstv´ım atd.
6.6.2
χ2-test dobr´ e shody dvou rozdˇ elen´ı
(dle [Mood a kol.]) H0 : Dvˇ e diskr´ etn´ı n´ ahodn´ e veliˇ ciny maj´ı stejn´ e diskr´ etn´ı rozdˇ elen´ı.
Rozsahy v´ ybˇ er˚ u jsou m, n a ˇ cetnosti v´ ysledk˚ u mi, ni (i = 1, . . . , k). Pˇredpokl´ ad´ ame rozdˇ elen´ı s nezn´ am´ ymi teoretick´ ymi pravdˇ epodobnostmi pi (i = 1, . . . , k). k X (mi − m pi)2 i=1 k X
m pi
se bl´ıˇz´ı χ2(k − 1) ,
(ni − n pi)2 se bl´ıˇz´ı χ2(k − 1) , n pi i=1
T =
k X (mi − m pi)2 i=1
m pi
+
k X (ni − n pi)2 i=1
n pi
se bl´ıˇz´ı χ2(2(k − 1)) .
Nezn´ am´ e parametry pi odhadneme pomoc´ı maxima vˇ erohodnosti, m + ni , pi = i m+n z nich je jen k − 1 nez´ avisl´ ych (nebot’
k P i=1
pi = 1), takˇze v´ ysledn´ y poˇ cet stupˇ n˚ u
volnosti je 2 (k − 1) − (k − 1) = k − 1 a testujeme T na χ2(k − 1). Nulovou hypot´ ezu zam´ıt´ ame pro t > qχ2(k−1)(1 − α), tj. 1 − Fχ2(k−1)(t) < α.
Praktiˇ ctˇ ejˇs´ı (ekvivalentn´ı) vzorec: 1 1 T = + m n
6.6.3
X k (mi − m pi)2 i=1
pi
.
χ2-test nez´ avislosti dvou rozdˇ elen´ı
(dle [Likeˇs, Machek]) H0 : Dvˇ e n´ ahodn´ e veliˇ ciny (jejichˇz rozdˇ elen´ı nezn´ ame) jsou nez´ avisl´ e. X nab´ yv´ a k hodnot s pravdˇ epodobnostmi p1, . . . , pk , Y nab´ yv´ a m hodnot s pravdˇ epodobnostmi q1, . . . , qm. Realizace dvojrozmˇ ern´ eho n´ ahodn´ eho v´ ybˇ eru ((x1, y1), . . . , (xn, yn)) obsahuje dvojice realizac´ı n´ ahodn´ ych veliˇ cin X, Y ; z v´ ysledk˚ u n´ as zaj´ımaj´ı opˇ et pouze ˇ cetnosti nij (i = 1, . . . , k; j = 1, . . . , m). Ty b´ yvaj´ı uspoˇr´ ad´ any do tzv. kontingenˇ cn´ı tabulky. Poˇ cet tˇr´ıd je k m.
Za pˇredpokladu nez´ avislosti jsou pravdˇ epodobnosti v´ ysledk˚ u pi qj (i = 1, . . . , k; j = 1, . . . , m), T :=
k X m (n − n p q )2 X ij i j
n pi qj
i=1 j=1
se bl´ıˇz´ı χ2(km − 1) .
Nezn´ am´ e parametry pi, qj odhadneme pomoc´ı maxima vˇ erohodnosti, m P
pi =
j=1
k P
nij
n
,
nij
qj = i=1 n
z nich je jen (k − 1) + (m − 1) nez´ avisl´ ych (nebot’
, k P i=1
pi = 1,
m P j=1
qj = 1),
takˇze v´ ysledn´ y poˇ cet stupˇ n˚ u volnosti je k m − 1 − (k − 1) − (m − 1) = (k − 1) (m − 1) a testujeme T na χ2((k − 1) (m − 1)). Nulovou hypot´ ezu zam´ıt´ ame pro t > qχ2((k−1) (m−1))(1 − α), tj. 1 − Fχ2((k−1) (m−1))(t) < α.
6.7
Korelace, jej´ı odhad a testov´ an´ı
(dle [Likeˇs, Machek]) Korelace %(X, Y ) n´ ahodn´ ych veliˇ cin X, Y (s nenulov´ ym rozptylem) je stˇredn´ı hodY −EY , nota souˇ cinu odpov´ıdaj´ıc´ıch normovan´ ych veliˇ cin X−EX · σ σ X
Y
E ((X − EX ) (Y − EY )) %(X, Y ) = ∈ h−1, 1i . σX σY Je nulov´ a pro nez´ avisl´ e n´ ahodn´ e veliˇ ciny, ale i pro nˇ ekter´ e jin´ e, tzv. nekorelovan´ e. Extr´ emn´ı hodnoty ±1 odpov´ıdaj´ı line´ arn´ı z´ avislosti mezi X, Y . Na z´ akladˇ e dvojrozmˇ ern´ eho n´ ahodn´ eho v´ ybˇ eru ((X1, Y1), . . . , (Xn, Yn)) m˚ uˇzeme korelaci odhadnout pomoc´ı v´ ybˇ erov´ eho koeficientu korelace
n P
R X ,Y = v u u t
(Xj − X ) (Yj − Y )
j=1
!
n P
(Xj − X )2 j=1
n P
!.
(Yj − Y )2
j=1
Jeho realizace
n P
rx,y = v u u t
(xj − x) (yj − y )
j=1 n P
(xj − x)2 j=1
!
n P
! ∈ h−1, 1i ,
(yj − y )2
j=1
nebot’ je to kosinus u ´hlu vektor˚ u (x1 − x, . . . , xn − x) , (y1 − y , . . . , yn − y ) ∈ Rn neboli korelace empirick´ eho rozdˇ elen´ı, rx,y = %(Emp(x, y )).
Pro v´ ypoˇ cet se pouˇz´ıv´ a jednopr˚ uchodov´ y vzorec:
n RX , Y = v u
n P j=1
u n P u t n x2j − j=1
xj yj −
n P
!
xj
n P
!
yj
j=1 j=1 !2 n n P P xj n yj2 − j=1 j=1
. !2 n P yj j=1
6.7.1
Test nekorelovanosti dvou norm´ aln´ıch rozdˇ elen´ı
Pˇredpoklad: Dvojrozmˇ ern´ a n´ ahodn´ a veliˇ cina (X, Y ) m´ a (dvojrozmˇ ern´ e) norm´ aln´ı rozdˇ elen´ı, n ≥ 3. H0 : %(X, Y ) = 0 (X, Y jsou nekorelovan´ e).
Testovac´ı statistikou je R X ,Y
T = q
√
n−2
2 1 − RX ,Y
,
za pˇredpokladu nekorelovanosti m´ a rozdˇ elen´ı t(n − 2), d´ ale postupujeme dle kapitoly 6.2.2.
6.8
Neparametrick´ e testy
Jsou pouˇziteln´ e bez ohledu na typ rozdˇ elen´ı, jsou vˇsak slabˇs´ı.
6.8.1
Znam´ enkov´ y test
Rozliˇsujeme pouze znam´ enko odchylky od zvolen´ e hodnoty c. T´ım ztr´ ac´ıme kvantativn´ı informaci a tedy i moˇznost testovat napˇr. stˇredn´ı hodnotu. M´ısto n´ı testujeme medi´ an qX ( 12 ). H0 : qX ( 21 ) = c
Pˇri platnosti nulov´ e hypot´ ezy by kladn´ e i z´ aporn´ e odchylky mˇ ely b´ yt stejnˇ e pravdˇ epodobn´ e. Nulov´ e odchylky z v´ ybˇ eru pˇredem vylouˇ c´ıme. Testovac´ı statistikou T je poˇ cet
kladn´ ych odchylek, kter´ y testujeme na binomick´ e rozdˇ elen´ı Bin hypot´ ezu zam´ıt´ ame pro α t
α nebo t > q 1− Bin n, 21 2
n, 12
. Nulovou
.
(Podobnˇ e pro jednostrann´ e testy.) V´ ypoˇ cet kvantil˚ u je pracn´ y, ale kritick´ e hodnoty jsou tabelov´ any (v z´ avislosti na n a hladinˇ e v´ yznamnosti). Dosaˇzen´ a v´ yznamnost se poˇ c´ıt´ a o trochu sn´ aze. Pro velk´ a n pouˇz´ıv´ ame centr´ aln´ı limitn´ı vˇ etu a testujeme T0 :=
2T − n √ n
na N(0, 1). Lze pouˇz´ıt i k porovn´ an´ı dvou medi´ an˚ u u p´ arov´ eho pokusu. Pˇr´ıklad pouˇ zit´ı: Odhad smrteln´ e d´ avky l´ atky. Na rozd´ıl od stˇredn´ı hodnoty medi´ an vˇzdy existuje (je vˇsak probl´ em, jak ho definovat, aby byl jednoznaˇ cn´ y). Jeho v´ ypoˇ cetn´ı sloˇzitost je vˇ etˇs´ı, ˇr´ adu n ln n.
6.8.2
Wilcoxon˚ uv test (jednov´ ybˇ erov´ y)
H0 : X m´ a rozdˇ elen´ı symetrick´ e kolem hodnoty c
(V tom pˇr´ıpadˇ e je c medi´ anem i stˇredn´ı hodnotou.) Z realizace (x1, . . . , xn) vypoˇ cteme posloupnost ( z1, . . . , zn), kde zj = xj − c. Seˇrad´ıme ji vzestupnˇ e podle absolutn´ıch hodnot zj = xj − c , ˇ c´ımˇz j -t´ emu prvku pˇriˇrad´ıme poˇrad´ı rj . Je-li v´ıce stejn´ ych rozd´ıl˚ u, pˇriˇrad´ıme jim stejn´ e poˇrad´ı rovn´ e aritmetick´ emu pr˚ umˇ eru. Testovac´ı statistikou je T1 :=
X
rj
j:zj >0
nebo
X X T2 := min rj , rj , j:zj >0 j:zj <0
porovn´ ame s tabulkou kritick´ ych hodnot pro tento test.
7 7.1
Co zde nebylo V´ıce o zobrazen´ı n´ ahodn´ e veliˇ ciny funkc´ı a o souˇ ctu n´ ahodn´ ych veliˇ cin
7.2
Diskretizace
7.3
Smˇ es pravdˇ epodobnost´ı
7.4
Charakteristick´ a funkce n´ ahodn´ e veliˇ ciny
7.5
D˚ ukaz centr´ aln´ı limitn´ı vˇ ety
Literatura
[Navara: PMS] Navara, M.: Pravdˇ epodobnost a matematick´ a statistika. Skriptum ˇ CVUT, Praha, 2007.
[Rogalewicz] Rogalewicz, V.: Pravdˇ epodobnost a statistika pro inˇzen´ yry. ˇ 2. pˇrepracovan´ e vyd´ an´ı, Skriptum FBMI CVUT, Praha, 2007. ˇ ep´ ˇ ep´ [Zv´ ara, Stˇ an] Zv´ ara, K., Stˇ an, J.: Pravdˇ epodobnost a matematick´ a statistika (2. vyd´ an´ı). Matfyzpress, MFF UK, Praha, 2002.
[Andˇ el: Statistick´ e metody] Andˇ el, J.: Statistick´ e metody. 2. vyd., Matfyzpress, Praha, 1998.
[Andˇ el: Matematick´ a statistika] Andˇ el, J.: Matematick´ a statistika. SNTL/Alfa, Praha, 1978.
[Disman]
Disman, M.: Jak se vyr´ ab´ı sociologick´ a znalost. Karolinum, UK, Praha, 2005.
ˇ [Jaroˇs a kol.] Jaroˇs, F. a kol.: Pravdˇ epodobnost a statistika. Skriptum VSCHT, 2. vyd´ an´ı, Praha, 1998.
[Likeˇs, Machek] Likeˇs, J., Machek, J.: Matematick´ a statistika. 2. vyd´ an´ı, SNTL, Praha, 1988.
[Nagy]
Nagy, I.: Pravdˇ epodobnost a matematick´ a statistika. Cviˇ cen´ı. Skriptum ˇ FD CVUT, Praha, 2002.
ˇ [Nˇ eniˇ ckov´ a] Nˇ eniˇ ckov´ a, A.: Matematick´ a statistika — cviˇ cen´ı. Skriptum CVUT, Praha, 1990.
[Rieˇ canov´ a a kol.] Rieˇ canov´ a, Z. a kol.: Numerick´ e met´ ody a matematick´ a ˇstatistika. Alfa/SNTL, Bratislava, 1987.
[Rieˇ can a kol.] Rieˇ can, B., Lamoˇs, F., Len´ art, C.: Pravdepodobnost’ a matematick´ a ˇstatistika. Alfa/SNTL, Bratislava, 1984.
[SH10]
Schlesinger, M.I., Hlav´ aˇ c, V.: Deset pˇredn´ aˇsek z teorie statistick´ eho a ˇ strukturn´ıho rozpozn´ av´ an´ı. CVUT, Praha, 1999.
[Swoboda] Swoboda, H.: Modern´ı statistika. Svoboda, Praha, 1977.
[Chatfield] Chatfield, C.: Statistics for Technology. 3rd ed., Chapman & Hall, London, 1992.
[Hsu]
Hsu, H.P.: Probability, Random Variables, and Random Processes. McGraw-Hill, 1996.
[Mood a kol.] Mood, A.M., Graybill, F.A., Boes, D.C.: Introduction to the Theory of Statistics. 3rd ed., McGraw-Hill, 1974.
[Papoulis]
Papoulis, A.: Probability and Statistics. Prentice-Hall, 1990.
[Papoulis, Pillai] Papoulis, A., Pillai, S.U.: Probability, Random Variables, and Stochastic Processes. 4th ed., McGraw-Hill, Boston, USA, 2002.
[Spiegel et al. 2000] Spiegel, M.R., Schiller, J.J., Srinivasan, R.A.: Probability and Statistics. McGraw-Hill, 2000.
[Wasserman] Wasserman, L.: All of Statistics. A Concise Course in Statistical Inference. Springer, 2004.