I Základní pojmy teorie pravdìpodobnosti
{ neo ciální uèební text pro pøedmìt MATEMATIKA V, FS, FM TUL, ( drobné chyby nejsou vylouèeny) P. Volf, bøezen 1999
1 Náhodný pokus, systém jevù Pøedmìtem teorie pravdìpodobnosti je vytváøení a studium matematických modelù pro náhodné dìje, tj. takové dìje, jejich¾ výsledek není pøedem jednoznaènì urèen a oèekává se pouze, ¾e výsledek bude jedním z nìjaké mno¾iny mo¾ných výsledkù. Takovému náhodnému dìji budeme øíkat náhodný pokus (i kdy¾ "experimentátorem" nejsme èasto my, ale napøíklad pøíroda). Mno¾ina v¹ech mo¾ných výsledkù daného pokusu se nìkdy té¾ nazývá výbìrovým prostorem nebo prostorem pozorování. Výsledkem pokusu mohou být èísla (poèet bodù na horní stranì hrací kostky pøi jednom vrhu; poèet vrhù hrací kostkou ne¾ padne \6", namìøené hodnoty nìjaké velièiny, napø. krevní tlak pacienta, nebo odchylka rozmìru souèástky od normy), èíselné vektory a posloupnosti, èasový prùbìh nìjaké funkce na daném intervalu, ale i libovolný kvalitativní ukazatel (napø. vyta¾ení koule dané barvy z osudí obsahující rùznobarevné koule, dosa¾ená tøída kvality výrobku, odpovìï ano èi ne u respondenta pøi prùzkumu mínìní). V teorii pravdìpodobnosti je uva¾ována mno¾ina mo¾ných výsledkù, v duchu uvedených pøíkladù, jako nìjaká neprázdná abstraktní mno¾ina. Také poèet jejích prvkù mù¾e být koneèný, spoèetný nebo i nespoèetný. Podmno¾iny mno¾iny nazýváme jevy. Øekneme, ¾e pøi daném pokusu nastal jev A , kdy¾ výsledek pokusu ! je prvkem A (tj. ! 2 A). V¹echny mo¾né výsledky pokusu ! 2 chápané jako jednobodové mno¾iny f!g nazýváme systémem elementárních jevù. Celá mno¾ina je tedy vlastnì jistým jevem. Mù¾eme uva¾ovat i prázdnou mno¾inu ;, kterou pak nazýváme nemo¾ným jevem. Napøíklad pøi jednom hodu kostkou, elementární jevy jsou jednotlivé mo¾né výsledky, tj. 1, 2, ..., 6, ale kromì nich mù¾eme uva¾ovat jevy slo¾ené z nìkolika elementárních, napø. "sudé èíslo", nebo "výsledek vìt¹í ne¾ 4" apod. Mezi jednotlivými jevy mohou platit rùzné vztahy a mù¾eme pomocí nich vytvoøit jevy dal¹í. V¹echny tyto vztahy a operace jsou stejné jako v teorii mno¾in. Jsou{li A a B jevy, pak oznaèujeme A B { situaci, která odpovídá tomu, ¾e kdykoliv nastane jev A, nastane i jev B ; A = B { platí souèasnì A B a B A; A [ B { jev, který nastane právì tehdy, kdy¾ nastane alespoò jeden z jevù A nebo B (sjednocení jevù A a B ); A\B { jev, který nastane právì tehdy, kdy¾ nastanou oba jevy A a B souèasnì (prùnik jevù A a B ); A \ B = ; { situaci, kdy nemohou nastat oba jevy A a B souèasnì (jevy A a B jsou nesluèitelné { disjunktní, neexistuje el. jev, který by byl zároveò v A i v B ); 1
A { jev, který nastane právì tehdy, kdy¾ nenastane jev A (doplnìk jevu A); A ; B {jev, který nastane právì tehdy, kdy¾ nastane jev A, ale souèasnì nenastane jev B (rozdíl jevù A a B ); A 4 B {jev, který nastane právì tehdy, kdy¾ nastane jev A nebo B , ale ne oba souèasnì (symetrická diference jevù A a B ). De nici sjednocení a prùniku dvou jevù lze zobecnit na libovolný koneèný, spoèetný, ale i nespoèetný poèet jevù. Tak napøíklad pro systém jevù fA; 2 I g, kde I je nìjaká mno¾ina indexù, znaèí S A jev, který nastane právì tehdy, kdy¾ nastane alespoò jeden z jevù A ; 2 I ; 2I T A jev, který nastane právì tehdy, kdy¾ nastanou souèasnì v¹echny jevy A ; 2 I . 2I
Pro právì zavedené pojmy sjednocení, prùniku a doplòku mù¾eme ukázat, ¾e platí následující vztahy: Jsou{li A; B; C jevy, tak A1: A [ ; = A A2: A \ ; = ; A3: A [ =
A4: A \ = A A5: A [ A = A A6: A \ A = A A7: A [ B = B [ A A8: A \ B = B \ A A9: A [ (B [ C ) = (A [ B ) [ C A10: A \ (B \ C ) = (A \ B ) \ C A11: A [ (B \ C ) = (A [ B ) [ (A [ C ) A12: A \ (B [ C ) = (A \ B ) [ (A \ C ) A13: A [ A =
A14: A \ A = ;: Z tìchto vztahù A1 { A14 je mo¾no odvodit prakticky v¹echny dal¹í vztahy, které jsou dùle¾ité v této "algebøe s jevy", která je pøevzata z mno¾inové algebry. V následujícím pøehledu uvádíme nìkteré z nich. Pøitom relaci () a operace rozdílu (;) a symetrické diference (4) de nujeme jako A B () A \ B = A A ; B = A \ B A 4 B = (A ; B ) [ (B ; A): Jsou{li A; B; C a D libovolné jevy, pak platí, kromì jiného: 1. ; A ; A A; (A B; B C ) =) A C . 2. (A ; B ) \ B = ;; (A ; B ) [ B = A [ B ; A = (A \ B ) [ (A ; B ); A ; B = A ; (A \ B ); A \ (B ; C ) = (A \ B ) ; (A \ B ). 3. A B =) A [ C B [ C a A \ C B \ C ; A B () A \ B = A () A [ B = B () A \ B = ;; Dùkazy jednotlivých vztahù jsou dobrým cvièením. 2
2 Systém náhodných jevù, pravdìpodobnost, pravdìpodobnostní prostor Uva¾ujeme-li urèitý náhodný pokus a chceme-li jej popsat, zajímají nás jen urèité elementární jevy ! a z nich slo¾ené A; B; ::: . Proto se v¾dy sna¾íme volit co nejvhodnìj¹í mno¾inu . Na druhé stranì, vhodná de nice pravdìpodobnosti musí zahrnovat i znaènì slo¾ité situace. V jednoduchém pøípadì, kdy mno¾ina v¹ech mo¾ných výsledkù náhodného pokusu
je koneèná, je z hlediska aplikací teorie pravdìpodobnosti rozumné po¾adovat, abychom byli schopni uva¾ovat jednotlivé elementární jevy jako náhodné jevy. Situace je odli¹ná, pøedev¹ím z formálního matematického hlediska, v pøípadì nespoèetného (tam, jak uvidíme v pøíkladech vìt¹inou nepracujeme ji¾ s jednotlivými elementárními jevy - body !, ale a¾ s jejich mno¾inami, náhodnými jevy A; B; :::) . Abychom tyto pøípadné tì¾kosti pøekonali a vytvoøili jediný matematický model náhodného pokusu, zavedeme tzv. systém náhodných jevù S . Je pøirozené po¾adovat, aby jistý jev a nemo¾ný jev byly náhodnými jevy, tj. prvky S , stejnì tak, aby s ka¾dými dvìma náhodnými jevy jejich sjednocení, prùnik, rozdíl apod. byly náhodnými jevy. Takový po¾adavek je rozumný i pro spoèetné sjednocení a spoèetný prùnik náhodných jevù. Formálnì matematicky zavedeme systém náhodných jevù S jako systém podmno¾in mno¾iny , pro který platí S1. 2 S ; S2. kdy¾ Ai 2 S ; i = 1; 2; : : : =) S1i=1 Ai 2 S ; S3. A 2 S =) A 2 S . Takovýto systém, chápaný jako systém mno¾in, se nazývá -algebrou (nebo -okruhem) mno¾in. Samozøejmì, celý kompletní systém v¹ech podmno¾in -oznaème jej 2 - vyhovuje v¹em tìmto po¾adavkùm, ale mù¾e být a èasto je zbyteènì rozsáhlý. Na druhé stranì v¹ak v pøípadì 'jen' spoèetné mno¾iny , kdy elementární jevy mají být náhodnými jevy, je 2 jediným systémem náhodných jevù (tj. splòujícím S1 { S3). Platí toti¾, ¾e ka¾dá podmno¾ina A nejvý¹e spoèetné mno¾iny je nejvý¹e spoèetná a dá se psát jako spoèetné sjednocení elementárních jevù, co¾ podle S2 je náhodným jevem. Uká¾eme si nyní dal¹í vlastnosti systému náhodných jevù S : 1. ; 2 S Dùkaz: 2 S =) 2 S , ale = ; 2. (A; B 2 S ) =) A \ B 2 S . B 2 S ) =) (A [ B 2 S ) =) (A [ B 2 S ), pøitom Dùkaz: (A; B 2 S ) =) (A; A [ B = A \ B . 3. (A; B ) 2 S =) (A ; B 2 S ) Dùkaz: (A; B 2 S ) =) (A; B 2 S ) =) A \ B 2 S ; ale A \ B = A ; B . 4. (A; B 2 S ) =) (A4B 2 S ) Dùkaz: (A; B 2 S ) =) (A ; B; B ; A 2 S ) =) ((A ; B ) [ (B ; A) 2 S ) 3
5. Ai 2 S ; i = 1; 2; : : : =) T1 i=1 Ai 2 S Dùkaz: Ai 2 S ; i = 1; 2; : : : =)(Ai 2 S ; i = 1; 2; : : : ; n) =) S1 S1 T1 T1 (S1 i=1 Ai 2 S ) =) i=1 Ai 2 S , ale i=1 Ai = i=1 Ai = i=1 Ai .
Jak de novat pravdìpodobnost?
Pro ka¾dý náhodný jev A 2 S chceme urèit takové èíslo P (A), které by mìlo v kvanti kovat, ocenit ¹anci, s jakou pøi provedení pøíslu¹ného náhodného pokusu nastane jev A. Mìla by to být vlastnì mno¾inová míra na systému mno¾in { jevù. De nujme proto pravdìpodobnost jako m9ru, tj. reálnou funkci P : S !< 0; 1 > zobrazující jevy ze systému náhodných jevù do intervalu h0; 1i. Budeme po této funkci po¾adovat následující:
P1. (A 2 S ) =) (P (A) 0); P2. (Ai 2 S ; i = 1; 2; : : : ; Ai \ Aj = ; pro ka¾dá i 6= j ) =) (P (S1i=1 Ai) = P1i=1 P (Ai)); P3. P ( ) = 1. Z tìchto podmínek plynou nìkteré dal¹í vlastnosti pravdìpodobnosti: 1. P (;) = 0 Dùkaz: Jeliko¾ \ ; = ; a ; ; 2 S , jsou a ; disjunktní, a tedy podle P2 P ( [ ;) = P ( ) + P (;). Ale [ ; = , a tedy 1 = 1 + P (;) neboli P (;) = 0. 2. (A; B 2 S ); A B =) (P (A) P (B )). Dùkaz: A B =) B = A [ (B ; A) =) A \ (B ; A) = ; =) P (B ) = P (A) + P (B ; A) P (A). 3. (A; B 2 S ; A B ) =) (P (B ; A) = P (B ) ; P (A)). Dùkaz: plyne z B = A [ (B ; A) a z P2. 4. (A; B 2 S ) =) (P (A [ B ) = P (Ah) + P (B ) ; Pi (A \ B )). Dùkaz: A [ B = [(A [ B ) \ B ] [ (A [ B ) \ B = B [ (A \ B ) = B [ (A ; B ) = B [ (A ; (A \ B )): Jeliko¾ B \ (A ; (A \ B )) = ;, tak z P2 máme P (A [ B ) = P (B ) + P (A ; (A \ B )) = P (B ) + P (A) ; P (A \ B ) { poslední rovnost dostaneme z 3. 5. (A; B 2 S ) =) (P (A4B ) = P (A ; B ) + P (B ; A) = P (A ; (A \ B )) + P (B ; (A \ B )) = P (A) + P (B ) ; 2P (A \ B )). 6. (A 2 S ) =) (P (A) = 1 ; P (A)). A \ A = ; =) 1 = P (A) + P (A) =) P (A) = 1 ; P (A). Dùkaz: = A [ A; Jestli¾e A je náhodný jev takový, ¾e jeho pravdìpodobnost
P (A) = 1; (co¾ je ekvivalentní tomu, ¾e P (A) = 0), øíkáme, ¾e jev A nastává skoro jistì. Pøitom je tøeba si uvìdomit, ¾e kdy¾ P (A) = 0, tak A nemusí být nemo¾ný jev, tj. A nemusí 4
být prázdná mno¾ina (v tom pøípadì ale musí existovat elementární jevy, kterým jsme pøiøadily nulovou pravdìpodobnost)! Máme nyní k dispozici trojici ( ; S ; P ), kde 6= ; je neprázdná mno¾ina, S systém náhodných jevù splòujících S1 { S3 a P pravdìpodobnost splòující P1 - P3. Tuto trojici nazýváme pravdìpodobnostním prostorem a slou¾í jako nejobecnìj¹í model libovolného náhodného pokusu. Je ov¹em tøeba pro ka¾dý náhodný pokus speci kovat ; S i P . Zatímco speci kace prvních dvou souèástí je celkem jasná a odpovídá \bohatosti" jevù, které chceme vy¹etøovat a které tedy bereme v potaz, je volba P pro konkrétní situaci slo¾itìj¹í. Hodnoty pravdìpodobnosti lze získat buï pøímo z podstaty náhodného pokusu nebo musí být odhadnuty metodami matematické statistiky z minulých na¹ich zku¹eností. V dal¹í èásti této kapitoly si uká¾eme konstrukci pravdìpodobnostních prostorù pro typické pøíklady, kdy je koneèná, spoèetná a nespoèetná mno¾ina.
3 Mo¾nosti konstrukce pravdìpodobnostních prostorù 1. je koneèná mno¾ina
Pøedpokládejme, ¾e je koneèná mno¾ina s prvky !1; !2; : : : ; !n ( = f!1; : : : ; !ng) a chceme, aby ka¾dý elementární jev f!ig byl náhodným jevem, tj. uva¾ujeme za systém náhodných jevù systém v¹ech podmno¾in mno¾iny
, tj. S = 2 . Celkový poèet v¹ech n n n náhodných jevù je 2n (tj. 0 + 1 + + n = 2n, kde nj je poèet rùzných náhodných jevù sestávajících právì z j elementárních jevù). Nech» p1; p2 ; : : : ; pn je n-tice nezáporných reálných èísel takových, ¾e n X pi = 1: i=1
Polo¾íme-li P (f!ig) = pi ; i = 1; 2; : : : ; n, dostaneme pak pro ka¾dou podmno¾inu A
P (A) =
X
fi: !i 2Ag
pi:
Potom ( ; 2 ; P ) splòuje v¹echny pøedpoklady pravdìpodobnostního prostoru. Speciální pøípad nastává, kdy¾ p1 = p2 = = pn; tj. pi = n1 . Potom
P (A) =
X 1 m(A) = n ; fi: !i 2Ag n
kde m(A) je poèet elementárních jevù, které vytváøí náhodný jev A. V tomto pøípadì dostáváme klasickou de nici pravdìpodobnosti tak, jak jsme se ji uèili na støední ¹kole, kdy pravdìpodobnost náhodného jevu byla de nována jako pomìr poètu pøípadù pøíznivých m(A) ku v¹em mo¾ným n. Pøíklady jsou nasnadì: výsledky hodù kostkami, sázky do loterie, ... .
2. je spoèetná mno¾ina
V pøípadì spoèetné mno¾iny = f!1; !2; : : :g, kdy také vìt¹inou po¾adujeme, aby elementární jevy f!ig byly pro v¹echna i náhodnými jevy, dostáváme jako systém náhodných jevù systém v¹ech podmno¾in mno¾iny , tj. S = 2 . Nyní v¹ak poèet v¹ech náhodných 5
jevù je nekoneèný. Jestli¾e pro ka¾dé i = 1; 2; : : : jsou pravdìpodobnosti elementárních P 1 jevù rovny pi (nyní po¾adujeme i=1 pi = 1), tak pro libovolnou podmno¾inu A
de nujeme stejnì jako v pøípadì koneèného
P (A) =
X
fi: !i 2Ag
pi;
trojice ( ; 2 ; P ) pak tvoøí pravdìpodobnostní prostor. Pøíkladem takových jevù je tøeba poèet nìjakých "událostí" v urèitém èasovém intervalu (napø. poèet tel. hovorù spojených ústøednou, poèet èástic zachycených pozorovacím pøístrojem, ...).
3. je nespoèetná mno¾ina
I kdy¾ i v tomto pøípadì je mo¾no konstruovat pravdìpodobnostní prostor v úplné obecnosti, omezíme se pouze na pøípad kdy = R (mno¾ina v¹ech reálných èísel), který bude pøedmìtem na¹ich úvah i v dal¹ím textu. Zobecnìní na pøípad = Rn (n-tice reálných èísel) je pak bez jakýchkoliv problémù. Pøíkladem takových náhodných pokusù je tøeba ka¾dé mìøení, které nikdy není prosto (náhodných) chyb, èi rozmìr výrobku náhodnì vybraného ke kontrole (pøeci jen se výrobek od výrobku li¹í, v rámci pøesnosti výrobního postupu) nebo tøeba doba ¾ivotnosti pøístroje (kdy ka¾dé reálné èíslo > 0 mù¾e být výsledkem, alespoò teoreticky). Jak ji¾ jsme uvedli vý¹e, nemusí být ve v¹ech pøípadech aplikací po¾adováno, aby v¹echny elementární jevy byly náhodnými jevy. Pøesto v¹ak je rozumné, aby systém náhodných jevù v pøípadì = R obsahoval takové mno¾iny jako napøíklad intervaly, otevøené mno¾iny apod. Napøíklad systém v¹ech intervalù ji¾ nesplòuje podmínky S1 { S3 (napø. sjednocení dvou disjunktních intervalù u¾ nemusí být interval). Platí v¹ak obecná vìta, která øíká, ¾e pro libovolný systém podmno¾in mno¾iny (oznaème jej A) existuje systém podmno¾in obsahující A jako svùj podsystém, který splòuje podmínky S1 { S3 a který je v jistém smyslu minimální. V pøípadì = R uva¾ujme tedy systém A, který je vytvoøen ze v¹ech intervalù ha; b) = fx : x 2 R; a x < bg, kde a; b 2 R. Potom existuje minimálním systém S (A) obsahující A, který splòuje S1 { S3. Není snad problém si alespoò základy systému budovaného ze v¹ech intervalù pøedstavit. Pøedev¹ím, ka¾dý uzavøený interval ha; bi (a; b 2 R; a b) se dá vyjádøit jako
ha; bi =
1 \
ha; b + n1 );
n=1
(1)
a tedy ha; bi 2 S (A). Obdobnì se uká¾e, ¾e i ostatní typy intervalù patøí do S . Tak i intervaly tvaru (;1; ai = fx : x 2 R; x ag resp. (a; 1) patøí do S (A), nebo» (;1; ai =
1 [
(;n; ai
n=1
a
(a; 1) = R ; (;1; ai:
Mno¾iny ze systému S (A) se nazývají borelovské mno¾iny na pøímce a oznaèíme je B resp. B(R). Z této konstrukce ov¹em plyne, ¾e ka¾dý bod je také v B(R), nebo» 6
fag = (;1; ai ; (;1; a). Èili elementárními jevy jsou pak jednotlivé hodnoty { body
reálné pøímky. V pøípadì = Rn je situace podobná, jen vycházíme ze systému An vytvoøeného v¹emi polootevøenými n-rozmìrnými intervaly, tj. mno¾inami typu
ha1; b1 ) ha2 ; b2) han; bn): Bereme tedy v pøípadì = R za systém v¹ech náhodných jevù systém v¹ech borelovských mno¾in na pøímce. Obrátíme se nyní k otázce konstrukce pravdìpodobnosti na borelovských mno¾inách na pøímce. Je tøeba poznamenat, ¾e v tomto pøípadì není mo¾né pou¾ít postup aplikovaný v koneèném nebo spoèetném pøípadì, kdy stanovujeme pravdìpodobnost elementárních jevù a z nich potom pravdìpodobnost na celém systému náhodných jevù. V nespoèetném pøípadì musíme postupovat ponìkud odli¹ným zpùsobem. Nech» F je libovolná, neklesající reálná funkce, která je v ka¾dém bodì spojitá zleva (F (x) = F (x;)) a taková, ¾e (8 x 2 R) 0 F (x) 1 a F (;1) = limx!;1 F (x) = 0; F (1) = limx!1 F (x) = 1. Pro ka¾dý interval ha; b) 2 A de nujme pravdìpodobnost
P (ha; b)) = F (b) ; F (a): Platí následující obecná vìta, kterou uvedeme bez dùkazu. Vìta. Nech» F je nezáporná, neklesající, zleva spojitá reálná funkce s limitami
F (;1) = 0;
F (+1) = 1;
de novaná na R. Potom existuje jediná pravdìpodobnost na S (A) splòující P1 { P3 taková, ¾e pro libovolný interval ha; b)
P (ha; b)) = F (b) ; F (a): Uka¾me si je¹tì, jak dostaneme pravdìpodobnost pro uzavøený interval. Ten mù¾eme napsat jeko limitu polootevøených intervalù, viz. (1), a tak 1 )) = lim F (b + 1 ) ; F (a) = F (b+) ; F (a); P (ha; bi) = nlim P ( h a; b + !1 n n kde F (b+) oznaèuje limitu zprava v bodì b. Poznamenejme jen, ¾e konstrukce pravdìpodobnosti P na borelovských mno¾inách na pøímce daná ve Vìtì je analogická konstrukci tzv. Lebesgueovy míry na pøímce, která odpovídá speciálnì funkci F (x) = x a je¾ obecnì není koneèná. Trojice (R; B; P ) je potom po¾adovaný pravdìpodobnostní prostor. Zde trochu pøedbìhnìmì a øeknìme si, ¾e funkce F se nazývá distribuèní funkce. A je to pojem univerzální v tom smyslu, ¾e je ji mo¾né pou¾ít jako základní charakteristiku pro rozdìlení pravdìpodobnosti i v pøípadech koneèné èi spoèetné R. Hned vidíme, ¾e pokud je funkce F spojitá v bodì a, je P (fag) = F (a+) ; F (a) = 0, neboli toto je pøíklad situace, kdy elementární jev má nulovou pravdìpodobnost. 7
4 Podmínìná pravdìpodobnost, nezávislost náhodných jevù Zavedení pravdìpodobnostního prostoru odpovídajícího danému náhodnému pokusu, kterému byly vìnovány úvahy v pøedcházejících odstavcích, nám umo¾òuje zavést tzv. podmínìné pravdìpodobnosti, tj. pravdìpodobnosti, ¾e nastane nìjaký náhodný jev A víme{li, ¾e nastal nìjaký náhodný jev B takový, ¾e P (B ) > 0. Instiktivnì cítíme, ¾e taková úvaha má smysl, jestli¾e jev A je nìjak na jevu B závislý. Matematicky je podmínìná pravdìpodobnost náhodného jevu A za podmínky jevu B pro P (B ) > 0 oznaèena a de nována jako \ B) : P (AjB ) = P (PA(B ) Pøímo z této de nice plyne, ¾e 1. P (B jB ) = 1; 2. P (;jB ) = 0; P ( jB ) = 1; 3. 0 P (AjB ) 1 pro ka¾dé A 2 S ; P1 4. Ai 2 S ; Ai \ Aj = ;; i 6= j; i; j = 1; 2; : : : ; =) P (S1 i=1 Ai jB ) = i=1 P (Ai jB ); 5. A 2 S =) P (AjB ) = 1 ; P (AjB ). Z uvedených vztahù vyplývá, ¾e pro xovaný náhodný jev B 2 S s P (B ) > 0 je podmínìná pravdìpodobnost P (jB ) pravdìpodobností na S , a tedy ( ; S ; P (jB )) je pravdìpodobnostní prostor. Navíc podmínìná pravdìpodobnost P (jB ) je pravdìpodobností na men¹í mno¾inì mo¾ných výsledkù pokusu a men¹ím systému náhodných jevù, a to na B a S \ B (S \ B je systém v¹ech mno¾in tvaru A \ B , kde A probíhá celé S ), tj. (B; S \ B; P (jB )) je pravdìpodobnostní prostor. Z de nice podmínìné pravdìpodobnosti plyne tzv. vìta o násobení pravdìpodobnosti. Platí toti¾ pro P (B ) > 0 vztah
P (A \ B ) = P (B ) P (AjB ); co¾ se dá zobecnit pro náhodné jevy B1; B2 ; : : : ; Bn s P (B1 \ B2 \ \ Bn) > 0 na tvar
P (B1 \ B2 \ Bn) = P (B1) P (B2jB1) P (B3jB1 \ B2) : : : : : : P (Bn j B1 \ B2 \ \ Bn;1 ) : Uva¾ujme nyní rozklad mno¾iny na sjednocení disjunktních náhodných jevù D1; D2 ; : : : ; Dn (Di 2 S ; Di \ Dj = ;; i 6= j; i; j = 1; 2; : : : ; n) s kladnými pravdìpodobnostmi, tj.
= D1 [ D2 [ [ Dn; P (Di) > 0: Potom pro jakýkoliv náhodný jev A 2 S zøejmì platí
[n ! [n A=A\ =A\ Di = (A \ Di ) i=1
8
i=1
a dle P2
P (A) =
n X i=1
P (A \ Di) :
S pou¾itím vìty o násobení pravdìpodobnosti dostáváme
P (A) =
n X i=1
P (Di) P (AjDi);
co¾ se v teorii pravdìpodobnosti nazývá vìtou o úplné pravdìpodobnosti. Jestli¾e dále pøedpokládáme, ¾e náhodné jevy A; B 2 S mají kladné pravdìpodobnosti P (A) > 0; P (B ) > 0, tak podle vìty o násobení pravdìpodobností je
P (A \ B ) = P (B ) P (AjB ); ale té¾
P (A \ B ) = P (B \ A) = P (A) P (B jA):
Odtud pak máme tzv. Bayesùv
vzorec
jB ) : P (B jA) = P (BP) P(A(A )
Pøitom, pokud je i P (B ) > 0, mù¾eme s pomocí vìty o úplné pravdìpodobnosti vyjádøit P (A) = P (AjB )P (B ) + P (AjB )P (B ): Zobecnìním Bayesovy formule pro libovolný disjunktní rozklad = D1 [ D2 [ [ Dn (Di 2 S ; Di \ Dj = ;; P (Di) > 0; i = 1; 2; : : : ; n) dostáváme pro ka¾dé i = 1; 2; : : : ; n, pøi P (A) > 0, jDi) = P P (Di) P (AjDi) : P (DijA) = P (DiP) P(A(A n P (D ) P (AjD ) ) j =1
j
j
Tento vztah nazýváme zobecnìným Bayesovým vzorcem. Jednotlivé mno¾iny rozkladu D1; D2 ; : : : ; Dn pøedstavují pro nás jevy, jejich¾ pravdìpodobnost za urèitých podmínek chceme zjistit (napøíklad stav zaøízení na základì pozorovaných vnìj¹ích projevù, nemoc pacienta na základì výsledkù testù). Dostáváme tak vlastnì "hypotézy", i s jejich pravdìpodobnostmi podmínìnými tím, co jsme zjistili pozorováním. Budeme nazývat pravdìpodobnosti P (Di) apriorními pravdìpodobnostmi hypotéz, P (AjDi) pravdìpodobnostmi jevu A, kdy¾ platí hypotéza Di a pravdìpodobnost P (DijA) aposteriorní pravdìpodobnost hypotézy Di, kdy¾ v náhodném pokusu nastal jev A. Bayesùv vzorec je pou¾íván pøedev¹ím ve statistickém rozhodování, kdy pøedem neznáme jaká hypotéza skuteènì platí a provádíme nìjaký náhodný pokus odpovídající neznámému pravdìpodobnostnímu prostoru ( ; S ; P (jDi)). Po provedení náhodného pokusu, kdy¾ nastal jev A, rozhodneme, ¾e platí ta hypotéza, pro kterou je aposteriorní pravdìpodobnost nejvìt¹í. Tento postup, který se té¾ nazývá Bayesovo rozhodovací pravidlo, je vyu¾íván v statistické analýze dat a je i základem pro konstrukci pravdìpodobnostních expertních systémù. 9
Nezávislost náhodných jevù. Øíkáme, ¾e dva náhodné jevy A a B jsou nezávislé, kdy¾
P (A \ B ) = P (A) P (B ): Odtud bezprostøednì vyplývá, ¾e kdy¾ P (A) 6= 0; P (B ) 6= 0 a A a B jsou nezávislé, tak P (AjB ) = P (A);
P (B jA) = P (B );
neboli pro nezávislé jevy A a B informace o tom, ¾e nastal jeden z nich nezmìní pravdìpodobnost druhého jevu. Platí potom následující jednoduché vztahy 1. Ka¾dý náhodný jev A 2 S je nezávislý na ; a . 2. Náhodný jev A 2 S je nezávislý na sobì právì tehdy, kdy¾ P (A) = 0 nebo P (A) = 1. 3. Jsou{li náhodné jevy A; B 2 S nezávislé, potom té¾ a) A; B jsou nezávislé, B jsou nezávislé, b) A; B jsou nezávislé. c) A; Uká¾eme platnost vztahu 3a), pak u¾ stejným zpùsobem lze dokázat i ostatní. Proto¾e A \ B = B ; A = B ; (A \ B ) a proto¾e je (A \ B ) B , tak P (A \ B ) = P (B ) ; P (A \ B ) = P (B ) ; P (A) P (B ) = P (B ) (1 ; P (A)) = P (B ) P (A): Øekneme, ¾e náhodné jevy A1 ; A2; : : : ; An jsou vzájemnì nezávislé, kdy¾ pro ka¾dé k = 1; 2; : : : ; n, 1 i1 < i2 < < ik n platí
P (Ai \ Ai \ \ Aik ) = P (Ai ) P (Ai ) P (Aik ) ; 1
2
1
2
tj. kdy¾ libovolný podsystém systému fA1; A2; : : : ; Ang tvoøí vzájemnì nezávislé jevy. V následujícím pøíkladì si uká¾eme, ¾e k vzájemné nezávislosti jevù nestaèí jen to, aby ka¾dé dva jevy byly nezávislé. Pøíklad 1. Nech» = f!1; !2; !3; !4g, S = 2 a P je dána pomocí pravdìpodobností elementárních jevù p! = p! = p! = p! = 41 . Uva¾ujme následující tøi náhodné jevy: 1
2
3
A = f!1 ; !2g ;
Potom a
4
B = f!1; !3g ;
C = f!1; !4g :
P (A) = P (B ) = P (C ) = 12
P (A \ B ) = 14 ; P (A \ C ) = 41 ; P (B \ C ) = 41 ; tj. dvojice jevù (A; B ); (A; C ); (B; C ) je ka¾dá dvojicí nezávislých náhodných jevù, ale pøesto P (A \ B \ C ) = P (f!1g) = 41 6= 18 = P (A) P (B ) P (C ): 10
Na závìr této èásti si uká¾eme pøíklad, ¾e jen z rovnosti
P (A \ B \ C ) = P (A) P (B ) P (C ) nijak neplyne, ¾e jevy A; B; C jsou vzájemnì nezávislé. Pøíklad 2. Nech»
= f! = (!1; !2) : !1; !2 = 1; 2; : : : ; 6g ; tj. elementární jevy jsou dvojice sestavené z èísel 1 a¾ 6. Je jich tedy celkem 36. Nech» S je systém v¹ech podmno¾in a pravdìpodobnost je de nována z pravdìpodobností elementárních jevù, které nech» jsou v¹echny stejné a rovny p! = 361 . Uva¾ujme následující tøi náhodné jevy:
A = f! : !1 libovolné; !2 = 1; 2 nebo 5g ; B = f! : !1 libovolné; !2 = 4; 5 nebo 6g ; C = f! : !1 + !2 = 9g : Potom zøejmì P (A) = P (B ) = 12 ; P (C ) = 19 a proto¾e jev A \ B \ C obsahuje jediný elementární jev (!1; !2) = (4; 5), tak 1 = P (A) P (B ) P (C ): P (A \ B \ C ) = 36 Ale 1 6= P (A) P (C ) = 1 P (A \ C ) = 36 18 1 1: P (B \ C ) = 12 6= P (B ) P (C ) = 18
5 Dodatek: Dvì "tradièní de nice" pravdìpodobnosti 1. Empirická, èetnostní. Pøedstavme si, ¾e za stále stejných podmínek opakujeme
(nezávisle) tentý¾ pokus n{krát a sledujeme èetnost jevu A, napø. "na kostce padlo 6" pøi n opakovaných hodech kostkou. Pøi rostoucím n bychom zjistili, ¾e èetnost jevu A (oznaème ji n(A)) roste tak, ¾e pomìr n(A)=A konverguje k urèité hodnotì v h0; 1i. Toto èíslo (p(A), øeknìme) pova¾ujeme pak za pravdìpodobnost jevu A. Napøíklad tu¹íme, ¾e p(060 na kostce) = 61 . Tato de nice je tedy opøena o pøedpoklad existence limity, kterou ov¹em samotnými pokusy nemù¾eme prokázat. A navíc, je pou¾itelná jen pro dìjì urèitého typu (mnohokrát se opakující za stejných podmínek). Na druhé stranì, uvidíme, ¾e z na¹í obecné de nice pravdìpodobnosti tato konvergence relativních èetností v tìchto speciálních pøípadech plyne (viz zákon velkých èísel). Odtud dále vyplývá dùvod, proè relativní èetnost je v tìchto pøípadech rozumným odhadem pravdìpodobnosti.
11
2. 'Klasická' pravdìpodobnost. Tato de nice je pou¾itelná v pøípadì, kdy situace
je popsána koneèným poètem M rùzných výsledù (elementárních jevù !), z nich¾ ka¾dý je "stejnì mo¾ný". Nech» nás zajímá pravdìpodobnost jevu A. Oznaème M (A) poèet tìch el. výsledkù !, které jsou jevu A "pøíznivé", tj. takové, ¾e ! 2 A. Pak de nujeme pravdìpodobnost jevu A jako P (A) = M (A)=M: Napøíklad, nech» je v tombole 100 losù, z nich¾ 5 vyhrává. Koupil jsem 3 losy. Jaká je pravdìpodobnost jevu A, ¾e ani jeden z nich nic nevyhraje? Jako elementární 100 jevy uva¾ujme v¹echny mo¾né trojice losù (které jsem mohl koupit), je 95jich M = 3 . Takových trojic, které neobsahují ani jeden vyhrávající los, je M (A) = 3 . Pøitom ka¾dá trojice mìla stejnou ¹anci, ¾e ji koupím. Tak¾e
95 95 94 93 = 0:856 : P (A) = 1003 = 100 99 98 3
Tato de nice sice u¾iteènì vede k pøímému výpoètu pravdìpodobnosti, ale je opìt pou¾itelná jen pro urèitý typ pøíkladù.
12
II Náhodné velièiny a náhodné vektory 6 Náhodná velièina Volbou pravdìpodobnostího prostoru si vytváøíme základ pro modelování náhodných dìjù. Systém elementárních jevù a systém náhodných jevù v¹ak nejsou jednoznaènì urèeny a je mo¾no je volit rùzným zpùsobem. Sna¾íme se vybrat systém co nejjednodu¹¹í a pøitom takový, který situaci dostateènì vystihne. Proto¾e cílem je matematický popis náhodných jevù, tak se pøedev¹ím sna¾íme popis "kvanti kovat", tj. vyjádøit pomocí (reálných) èísel. Napøíklad, místo jevù { odpovìdí v anketì "ano", "ne" pou¾ijeme "1", "0", místo jevu "kvalita výrobku" zavedeme oznaèení 1,2,3, ... pro tøídy kvality, a pod. Èasto je samozøejmì u¾ ná¹ základní prostor jevù èástí R a nemusíme jej transformovat (výsledky mìøení, doba bezporuchového provozu, poèet výrobkù za smìnu, ...). Proveïme formalizaci zatím nepøesné my¹lenky pøevést pravdìpodobnostní prostor na reálnou pøímku R. Mìjme nìjaký pravdìpodobnostní prostor ( ; A; P ). De nice. Náhodnou velièinou budeme nazývat zobrazení X : ;! R, které je navíc mìøitelné, tj. vzor ka¾dé borelovské mno¾iny je prvkem jevového pole A (symbolicky: 8 B 2 B je X ;1(B ) 2 A). Náhodnou velièinu si tedy nejlépe pøedstavíme jako náhodný pokus s výsledky v (R; B) { který je obrazem nìjakého náhodného pokusu na pùvodním prostoru jevù. Je výhodné numericky pracovat s takovouto èíselnou pøedstavou náhodných dìjù (mo¾nost generalizace, výpoètu rùzných èíselných charakteristik, uni kace popisu vùbec). Náhodná velièina se vyznaèuje rozdìlením pravdìpodobnosti na (R; B), co¾ není nic jiného ne¾ pùvodní pravdìpodobnost na ( ; A) pøevedená na (R; B). Budeme se sna¾it zpùsob popisu rozdìlení pravdìpodobnosti uni kovat. Rozdìlení pravdìpodobnosti náhodné velièiny lze ekvivalentnì popsat nìkolika zpùsoby. Nejjednodu¹¹í, univerzální a souèasnì nejnázornìj¹í je u¾ití distribuèní funkce náhodné velièiny. De nice. Distribuèní funkcí náhodné velièiny X budeme nazývat funkci
FX (X ) = P (X < x): Distribuèní funkce v bodì x je tedy pravdìpodobností jevu, ¾e hodnota náhodné velièiny X je men¹í ne¾ èíslo x. Distribuèní funkce má nìkolik dùle¾itých vlastností: (i) 0 F (x) 1 pro v¹echna reálná x. (ii) F je neklesající funkce, tj. F (x1) F (x2) pro ka¾dé x1 < x2 . (iii) x!;1 lim F (x) = 0 = F (;1); xlim !1 F (x) = 1 = F (+1).
(iv) F je zleva spojitá.
Vlastnost (i) vyplývá z faktu, ¾e pravdìpodobnost libovolného jevu je v h0; 1i. Monotónnost distribuèní funkce odvodíme jednoduchou úvahou. Pro x1 < x2 je
FX (x2 ) = P (X < x2 ) = P (X < x1 ) + P (x1 X < x2 ) P (X < x1 ) = FX (x1); 13
nebo» pravdìpodobnost je v¾dy nezáporná. Vlastnosti (iii), (iv) ji¾ vy¾adují hlub¹í znalost chování pravdìpodobnosti, a nebudeme je proto zde ukazovat. Uvedené vlastnosti plnì charakterizují distribuèní funkce. Tvrzení. Kdy¾ F je funkce s vlastnostmi (i), (ii), (iii), (iv), pak existuje náhodná velièina X tak, ¾e F je distribuèní funkcí rozdìlení této velièiny. Nìkdy, aby nedo¹lo k mýlce, budeme rozdìlení pravdìpodobnosti pro náhodnou velièinu X oznaèovat jako PX a budeme jím chápat pravdìpodobnost na borelovských mno¾inách de novanou vztahem PX (B ) = P (X 2 B ). Uvìdomme si, ¾e distribuèní funkce a rozdìlení pradìpodobnosti nesou ekvivalentní informaci o náhodné velièinì. Co do rozdìlení pravdìpodobnosti jsou význaèné dva typy náhodných velièin. Prvním jsou náhodné velièiny s diskrétním rozdìlením. To jsou takové náhodné velièiny, pro P které existuje nejvý¹e spoèetnì bodù xj tak, ¾e P (X = xj ) > 0; a samozøejmì j P (X = xj ) = 1. Distribuèní funkce náhodné velièiny s diskrétním rozdìlením je skokovitou funkcí. Skoky nastávají ve v¹ech tìchto bodech xj , velikost skoku je právì P (X = xj ).
Pøíklady diskrétních rozdìlení
Pøíklad 1: Nech» náhodná velièina X nabývá pouze dvou hodnot 0 a 1 a to tak, ¾e
hodnoty 1 nabývá s pravdìpodobností p (0 < p < 1) a hodnoty 0 s pravdìpodobností q = 1 ; p. Rozdìlení takovéto náhodné velièiny se nazývá 0 { 1 rozdìlení s parametrem p (nìkdy té¾ alternativní èi Bernoulliovo rozdìlení), oznaèíme je Alt(p). Pøíklad 2: Uva¾ujme náhodnou velièinu X , která nabývá hodnot x = 0; 1; 2; : : : , a to tak, ¾e P (X = x) = px(1 ; p). Parametr p 2 (0; 1). Takovéto rozdìlení se nazývá geometrické a budeme je oznaèovat Ge(p). Mù¾e popisovat napøíklad poèet "1" pøed první "0" v posloupnosti vzájemnì nezávisle opakovaných realizací alternativní náhodné velièiny s parametrem p. Pøíklad 3: Nech» náhodná velièina X nabývá hodnot 0; 1; : : : ; M s pravdìpodobnostmi P (X = x) = Mx pxqM ;x pro ka¾dé x = 0; 1; : : : ; M a q = 1 ; p; 0 < p < 1. Toto rozdìlení se nazývá rozdìlením binomickým s parametremPp, znaèíme je Bi(M; p). Takovouto náhodnou velièinu si mù¾eme pøedstavit jako X = Mj=1 Yj , kde Yj jsou vzájemnì nezávislé velièiny s alternativním rozdìlením Alt(p). Neboli X je poèet "1" z M vzájemnì nezávislých "nulajednièkových" pokusù. Pøíklad 4: Nech» xnáhodná velièina X nabývá hodnot 0; 1; 2; : : : s pravdìpodobnostmi P (X = x) = e; x! pro ka¾dé x = 0; 1; 2; : : :. Takovéto rozdìlení se nazývá Poissonovo rozdìlení s parametrem > 0. Znaèit je budeme Poiss(). Druhým význaèným typem jsou náhodné velièiny se spojitým rozdìlením. Jsou to takové náhodné velièiny, pro nì¾ existuje nezáporná reálná funkce fX taková, ¾e distribuèní funkci FX lze zapsat ve tvaru
FX (x) =
Zx
;1
fX (y) dy 14
pro ka¾dé reálné x:
(1)
Funkce fX se nazývá hustotou rozdìlení pravdìpodobnosti. Vztah (1) je vhodné po-
u¾ívat pro odvození distribuèní funkce k zadané hustotì!
Uvìdomme si, ¾e ve v¹ech bodech, kde existuje derivace distribuèní funkce FX , platí X (x) = f (x). Takto zase odvodíme hustotu z distribuèní funkce. Z de nice návztah dFdx X hodné velièiny se spojitým rozdìlením je patrné, ¾e k zadání jejího rozdìlení plnì postaèí zadat hustotu fX . R 1 f (x)dx = 1. Ze vztahu (1) dále plyne, ¾e hustota splòuje ;1 X Distribuèní funkce náhodné velièiny se spojitým rozdìlením je spojitá, co¾ je zesílení obecné vlastnosti distribuèní funkce (iv). Z toho také plyne, ¾e pravdìpodobnost toho, ¾e náhodná velièina nabývá hodnot v nìjakém intervalu (a; b), nezávisí na tom, zda krajní body a; b do intervalu patøí nebo ne:
P (a X b) = P (a < X b) = P (a X < b) = Zb = P (a < X < b) = fX (t) dt: a
Èi jinak, pravdìpodobnost jednoho (nebo koneènì, nebo i spoèetnì mnoha bodù) je 0 pro spojitou n. velièinu.
Pøíklady spojitých rozdìlení
Pøíklad 1: Nech» náhodná velièina X má hustotu (
1 a<x
O takové náhodné velièinì øekneme, ¾e má rovnomìrné spojité rozdìlení na intervalu (a; b) a budeme je oznaèovat R(a; b). Toto rozdìlení se vyznaèuje distribuèní funkcí
8 > < 0x;a x a F (x) = > b;a a < x < b : 1 x b:
Pøíklad 2: Nech» náhodná velièina X má hustotu f (x) = p21 exp ; 12 (x; ) , pak øekneme, ¾e X má normální (Gaussovo) rozdìlení se støední hodnotou a rozptylem 2. 2
2
Toto rozdìlení budeme oznaèovat N (; 2). Distribuèní funkci normálního rozdìlení nelze zapsat ¾ádnou explicitní formulí a lze ji jen pøibli¾nì odhadnout numerickou integrací. Proto existují tabulky, kde jsou hodnoty distribuèní funkce velice pøesnì tabelovány. V balících statistických programù pak existují zpùsoby, jak napoèíst hodnotu distribuèní funkce se zadanou pøesností. Pøíklad 3: Nech» náhodná velièina X má hustotu f (x) = 1 +(x;) , pak budeme øíkat, ¾e tato náhodná velièina X má Cauchyovo rozdìlení s parametry a . Pro Cauchyovo 1 x ; 1 rozdìlení lze distribuèní funkci vyjádøit ve tvaru F (x) = 2 + arctan . 2
2
Pøíklad 4: Nech» n.v. X má hustotu f (x) = ce;cx pro x 0, f (x) = 0 pro x < 0, s parametrem c > 0. Tomuto rozdìlení øíkáme exponenciální, oznaèíme je Exp(c). 15
Distribuèní funkce (odvozená pøímo pomocí (1)) je F (x) = 1 ; e;cx pro x 0, F (x) = 0 pro x < 0. Pøíklad 5: Zobecnìním je náhodná velièina s rozdìlením Weibulla, která má distribuèní funkci F (x) = 1 ; exp(;cxd ); pro x 0; =0 pro x < 0; s parametry c; d > 0. Hustota je pak 0 pro x < 0 a pro x 0 dostaneme derivací F (x) f (x) = c d xd;1 exp(;cxd ):
7 Støední hodnota a momenty náhodné velièiny Rozlo¾ení pravdìpodobnosti dává úplnou informaci o chování náhodné velièiny. Pøi vyhodnocování pokusù a sledování náhodných jevù v¹ak èasto vystaèíme se znalostí jen nìkterých zvlá¹tních charakteristik. Napøíklad støední hodnota náhodné velièiny vyjadøuje jistou prùmìrnou hodnotu. De nice. hodnotou náhodné velièiny X budeme nazývat obecný integrál E (X ) = R 1 x dF (xStøední X ): ;1 Pøedstavíme{li si tedy støední hodnotu geometricky, zjistíme, ¾e jde o tì¾i¹tì bodù reálné pøímky, pøièem¾ hmotnost bodù je urèena pravdìpodobností PX . Pro dva nejèastìji se vyskytující typy rozdìlení náhodné velièiny získáme následující vztahy: Støední hodnota diskrétní náhodné velièiny má tvar souètu pøes v¹echny hodnoty xj , kterých n.v. X mù¾e nabýt s nenulovou pravdìpodobností: X E (X ) = xj P (X = xj ): j
Støední hodnota náhodné velièina se spojitým rozdìlením a s hustotou fX má
tvar
Z +1 E (X ) = x fX (x) dx: ;1 Støední hodnota náhodné velièiny na rozdíl od distribuèní funkce nemusí v¾dy existovat. Jako pøíklad uveïme náhodnou velièinu nabývající pouze hodnot 2n pro n = 1; 2; ::: s pravdìpodobnostmi 2;n, nebo náhodnou velièinu s Cauchyho rozdìlením. Støední hodnota je zalo¾ena na obecném integrálu, a proto pøejímá i jeho základní vlastnost. Vezmeme{li lineární kombinaci koneènì mnoha náhodných velièin, pak støední hodnota této lineární kombinace je stejná lineární kombinace støedních hodnot. Tudí¾, kdy¾ Y = a0 + a1 X1 + a2 X2 + + ak Xk ; kde a1 ; a2; : : : ; ak jsou reálná èísla a X1 ; X2; : : : ; Xk jsou náhodné velièiny, potom E (Y ) = a0 + a1 E (X1 ) + a2 E (X2 ) + + ak E (Xk ): Základními charakteristikami zalo¾enými na støední hodnotì jsou momenty. Jedná se vlastnì o støední hodnotu (pokud existuje) z transformace náhodné velièiny. Moment má obecnì tvar E [h(X )], kde h(x) je nìjaká mìøitelná reálná funkce. 16
Pro diskrétní náhodnou velièinu dostaneme P E [h(X )] = xj h(xj ) P (X = xj ), pro náhodnou velièinu se spojitým rozdìlením je R + 1 E [h(x)] = ;1 h(x) f (x) dx. Speciální volbou transformaèní funkce dostáváme r-tý obecný moment 0r (X ) = E (X r ) a r-tý centrální moment r (X ) = E f[X ; E (X )]r g : Oba typy momentù jsou vzájemnì jednoznaènì pøevoditelné. Odvoïme si oba pøevody. Pov¹imnìme si, ¾e r r! X r j r ;j j [X ; E (X )] = j (;1) X [E (X )] : Odtud dostáváme
j =0
! r r (X ) = 0r;j (X )[E (X )]j : j j =0 Opaèný pøevodový vztah je dùsledkem rozpisu r r! X r r X = f[X ; E (X )] + E (X )g = [X ; E (X )]r;j [E (X )]j : j j =0
Odtud jsou
r X
(;1)j
! r (X )[E (X )]j : r;j r j =0 j Kromì støední hodnoty E (X ) = 01(X ), neju¾ívanìj¹ím momentem je X 0 (X ) = r
2(X ) = E (X 2) ; [E (X )]2; který se nazývá rozptyl náhodné velièiny X , èi variance a znaèí se také var(X ) nebo D2(X ), nebo i 2(X ). Odmocnina z rozptylu je pak (X ) { smìrodatná odchylka. Opìt, proto¾e jsou to charakteristiky zalo¾ené na integrálu, nemusí existovat (napø. znovu pro Cauchyho rozdìlení). Z dal¹ích momentù se je¹tì èasto u¾ívají centrální momenty 3(X ) a 4(X ). ©ikmost rozdìlení se posuzuje koe cientem ¹ikmosti (skewness) 3 (X ) = [(X(X)]) , který zachycuje odchylky rozdìlení od symetrie kolem støední hodnoty E (X ). Je{li rozdìlení protáhlej¹í doleva, je koe cient 3 (X ) záporný a je{li rozdìlení protáhlej¹í doprava, pak koe cient 3(X ) nabývá kladných hodnot. ©pièatost rozdìlení popisuje koe cient ¹pièatosti (excess, kurtosis) 4 (X ) = [(X(X)]) ; 3. Tento koe cient porovnává pøíspìvek vzdálených hodnot rozdìlení náhodné velièiny s pøípadem normálního rozdìlení. Pokud náhodná velièina má sama normální rozdìlení, pak 4(X ) = 0. 3
3
4
4
Cvièení: Spoètìte EX a V arX pro tato rozdìlení: Alternativní, binomické, Poissonovo,
rovnomìrné na (a; b), normální (; 2), exponenciální Exp(c). Vyu¾ijte de nice støední hodnoty a vztahu varX = E (X 2 ) ; (EX )2 . 17
7.1 Momentová vytvoøující funkce
Mìjme náhodnou velièinu X diskrétního typu, která nabývá hodnot 0,1,2, ... , s pravdìpodobnostmi P (X = i) = pi . De nujme momentovou vytvoøující funkci jako
g(t) =
1 X i=0
piti :
Tato funkce existuje v¾dy alespoò pro jtj < 1, pro velièiny nabývající jen koneènì hodnot (napø. alternativní, binomická velièina) existuje g(t) pro ka¾dé reálné t. V¹imnìme si následujících vlastností této funkce:
g(1) = Pi pi = 1; první derivace podle t je g0(t) = P1i=0 ipiti;1 , tak¾e g0(1) = Pi ipi = E (X ); druhá derivace je g"(t) = P i(i ; 1)piti;2; tak¾e g"(1) = P i2pi ; P ipi = 2 ; 1. Z toho dostaneme, ¾e var(X ) = g"(1) + g0(1) ; (g0(1))2: Podobným zpùsobem bychom odvodili i výpoèet momentù vy¹¹ích øádù.
Cvièení: Pomocí momentové vytvoøující funkce spoètìte støední hodnotu a rozptyl pro binomické, Poissonovo a geometrické rozdìlení.
8 Kvantily Distribuèní funkce plnì charakterizuje rozdìlení pravdìpodobnosti náhodné velièiny. Èasto je v¹ak tøeba øe¹it úlohu nalézt bod x tak, aby P (X < x) byla rovna urèité hodnotì 2 (0; 1), tj. FX (x) = pro pøedem zadané . Z tohoto dùvodu se zavádí kvantilová funkce, je¾ je zobecnìním inverzní funkce k FX . Problém je s body, kde funkce FX má skok, a také s body, kde F (x) neroste, èili inverzní funkce by nebyla jednoznaèná. De nice. Mìjme náhodnou velièinu X a distribuèní funkci FX ; pak kvantilovou funkcí nazveme funkci FX;1() = inf fx j FX (x) g pro 0 < < 1. Jinak øeèeno FX;1() je takový bod, ¾e FX FX;1() a pro ka¾dé x > FX;1() platí FX (x) . Pokud FX je spojitá funkce, pak FX FX;1() = pro ka¾dé 0 < < 1. Hodnota kvantilové funkce v bodì , tj. FX;1(), je nazývána kvantil rozdìlení náhodné velièiny na hladinì nebo -kvantil a bývá znaèen té¾ x (u; v nebo i jinak). Kvantily jsou velmi dùle¾ité, a proto existuje velké mno¾ství tabulek, kde jsou kvantily tabelovány. Samozøejmì ve statistických programech jsou v¾dy i procedury, je¾ doká¾í kvantily vypoèítat, alespoò pro dùle¾itá rozdìlení. Pro spojitou velièinu s rostoucí F (x) mù¾eme zkusit kvantil u vypoèíst pøímo z rovnice F (u) = . Nìkteré kvantily mají speciální názvy:
FX;1(0:5) { medián, med(X ); { vlastnì udává "støed" rozdìlení v tom smyslu, ¾e P (X < med(X )) 21 a také P (X > med(X )) 21 . ; 1 FX (0:25) { dolní kvartil, 18
FX;1(0:75) { horní kvartil; FX;1(k=10) { k-tý decil pro k = 1; 2; : : : ; 9; FX;1(k=100) { k-tý percentil pro k = 1; 2; : : : ; 99. Mezikvartilové rozpìtí FX;1(0:75) ; FX;1(0:25) slou¾í jako dal¹í míra rozptýlenosti náhodné velièiny. Jde o charakteristiku, která je v zásadì odli¹ná od smìrodatné odchylky a má nìkteré výhodné vlastnosti. Napøíklad na rozdíl od smìrodatné odchylky existuje v¾dy.
Cvièení: Spoètìte medián a mezikvartilové rozpìtí pro exponenciální rozdìlìní Exp(c).
9 Charakteristická funkce Rozdìlení pravdìpodobnosti náhodné velièiny lze plnì charakterizovat je¹tì jedním zpùsobem. De nice. Pro náhodnou velièinu X nazýváme funkci X (t) = E [exp(i t X )] charakteristickou funkcí náhodné velièiny X (i je zde imaginární jednotka). Pøipomeòme, ¾e pro diskrétní náhodnou velièinu dostáváme X (t) =
X xj
exp(i t xj ) P (X = xj )
a pro náhodnou velièinu se spojitým rozdìlením a hustotou fX je X (t) =
Z +1 ;1
exp(i t x) fX (x) dx:
Vìta. Rozdìlení pravdìpodobnosti náhodné velièiny je jednoznaènì urèeno její charak-
teristickou funkcí. Dále, i z charakteristické funkce mù¾eme jejím derivováním spoèíst momenty náhodné velièiny: Tvrzení. Nech» náhodná velièina X má prvních n obecných momentù 0r (X ). Potom existuje prvních n derivací charakteristické funkce X a platí
dr (t) = ir 0 (X ); r dtr X t=0
Navíc platí, ¾e kde
X (t) =
r = 1; : : : ; n:
n (it)r X 0r (X ) + Zn(t); r ! r=0
Zn(t) = 0: lim t!0 tn Charakteristická funkce je velmi u¾iteèná i pro limitní úvahy o náhodné velièinì, které budou studovány pozdìji. Zde uveïme jen jednu vìtu: 19
Vìta. Nech» F1; F2; : : : jsou distribuèní funkce a 1 ; 2 ; : : : odpovídající charakteristické
funkce, pak je ekvivalentní: a) Fn(x) ;! F (x) v ka¾dém bodì spojitosti F a F je distribuèní funkce. b) n (t) ;! (t) pro v¹echna reálná t a je spojitá v bodì t = 0. Pøitom je charakteristická funkce pøíslu¹ná k distribuèní funkci F . Zbývá je¹tì uvést charakteristické funkce pro nìkterá speciální rozdìlení.
Pøíklady charakteristických funkcí
Pøíklad 1: Nech» náhodná velièina X má degenerované rozdìlení (tj. soustøedìné do jednoho bodu) X = s pravdìpodobností 1. Pak
it :
X (t) = e
Pøíklad 2: Nech» náhodná velièina X má 0-1 rozdìlení s parametrem p, potom je it + q:
X (t) = p e
Pøíklad 3: Nech» náhodná velièina X má normální rozdìlení se støední hodnotou a rozptylem 2, pak její charakteristická funkce má tvar it; 22t2 :
X (t) = e
Pøíklad 4: Nech» náhodná velièina X má spojité rovnomìrné rozdìlení na intervalu (a; b), pak její charakteristická funkce je tvaru i eita ; eitb : X (t) = (b ; a)t Ve speciálním pøípadì, kdy a = ;b a b > 0, dostáváme sin bt : X (t) = bt
Pøíklad 5: Nech» náhodná velièina X má Cauchyho rozdìlení s parametry a , potom její charakteristická funkce je tvaru
it;jtj :
X (t) = e
Pøíklad 6: Pro exponenciální rozdìlení Exp(c) je charakteristická funkce X (t) =
Z1 0
eitx ce;cxdx =
20
Z1 0
cex(it;c) dx = c ;c it :
10 Náhodný vektor Dosud jsme uva¾ovali, ¾e výsledek pokusu je vyjádøen reálným èíslem. Èasto v¹ak pracujeme s n pokusy (n mìøení, n kontrolovaných výrobkù, n dotazovaných lidí pøi anketì), výsledkem je n hodnot. Tuto situaci mù¾eme chápat tak, ¾e sledujeme naráz n náhodných velièin. De nice. n-tici náhodných velièin budeme nazývat náhodný vektor o rozmìru n. Pro náhodný vektor se zavádí obdobné charakteristiky jako u jediné náhodné velièiny. Oznaème Bn Borelovský systém mno¾in v Rn, tj. systém vytvoøený z n-rozmìrných intervalù. De nice. Pro náhodný vektor X = (X1; : : : ; Xn) de nujeme rozdìlení pravdìpodobnosti jako PX (B ) = P (X 2 B ) pro ka¾dou B 2 Bn a nazýváme je sdru¾eným (simultánním) rozdìlením pravdìpodobnosti. Dále de nujeme sdru¾enou distribuèní funkci náhodného vektoru X vztahem
FX (x1 ; : : : ; xn) = P (X1 < x1 ; : : : ; Xn < xn) : Opìt lze vyèlenit dva dùle¾ité typy náhodných vektorù a to diskrétní a spojitý: De nice. Øekneme, ¾e náhodný vektor X má diskrétní rozdìlení pravdìpodobnosti, jestli¾e existuje nejvý¹e spoèetná mno¾ina Rn taková, ¾e pro ka¾dý bod (x1 ; : : : ; xn) 2
P (X1 = x1 ; : : : ; Xn = xn) > 0 a
X (x1 ;:::;xn )2
P (X1 = x1 ; : : : ; Xn = xn ) = 1:
Øekneme, ¾e náhodný vektor X má spojité rozdìlení pravdìpodobnosti jestli¾e existuje funkce fX nezáporná reálná tak, ¾e pro v¹echna (x1 ; : : : ; xn) 2 Rn platí
FX (x1 ; : : : ; xn ) =
Zx
;1 1
Z xn
;1
fX (y1; : : : ; yn) dy1 dyn:
Funkce fX se nazývá sdru¾enou hustotou (hustotou sdru¾eného rozdìlení pravdìpodobnosti) náhodného vektoru X. V bodech, kde existuje derivace FX , platí n X (x1 ; : : : ; xn ) fX (x1 ; : : : ; xn) = @ F@x : 1 @xn U náhodného vektoru vzniká nová otázka, jak vypadá rozdìlení jen èásti zadaného vektoru. Tomuto èásteènému rozdìlení se øíká marginální rozdìlení. Øe¹ení je jednoduché (uka¾me ho jen na pøípadì dvou náhodných velièin): Vezmìme náhodný vektor (X; Y ), distribuèní funkci sdru¾eného rozdìlení FX;Y (x; y) = P (X < x; Y < y). Pak marginální distribuèní funkce
FX (x) = P (X < x) = ylim !1 P (X < x; Y < y ) = ylim !1 FX;Y (x; y ): 21
Pro diskrétní náhodný vektor, který nabývá hodnot (x; y) z mno¾iny fxi; i = 1; ::; I; yj ; j = 1; ::; J g, dostáváme marginální rozdìlení pravdìpodobnosti náhodné velièiny X J X
P (X = xk ) =
j =1
P (X = xk ; Y = yj ):
Pro spojitý náhodný vektor s hustotou fX;Y (x; y) nalezene marginální hustotu pro danou èást vektoru takto: Z +1 fX (x) = fX;Y (x; y)dy: ;1
11 Momenty náhodného vektoru Obdobným zpùsobem jako pro náhodnou velièinu lze i pro náhodný vektor de novat moment v obecném tvaru E [h(X1; : : : ; Xn)], kde h je nìjaká reálná funkce. Moment pro náhodný vektor s diskrétním rozdìlením má podobu
E [h(X1; : : : ; Xn)] =
X
(x1 ;:::;xn )2
h(x1 ; : : : ; xn) P (X1 = x1 ; : : : ; Xn = xn)
a pro n. vektor se spojitým rozdìlením pøejde do tvaru
E [h(X1 ; : : : ; Xn)] = X:
Z +1 ;1
Z +1 ;1
h(x1 ; : : : ; xn) f (x1; : : : ; xn) dx1 dxn:
Významné místo mezi momenty má kovariance i-té a j -té slo¾ky náhodného vektoru
cov(Xi; Xj ) = ij = E f[Xi ; E (Xi)] [Xj ; E (Xj )]g = E (XiXj ) ; E (Xi)E (Xj ): Pov¹imnìme si, ¾e pro i = j dostáváme rozptyl i-té slo¾ky náhodného vektoru. Sestavme matici Var(X) = (cov(Xi; Xj ))ni=1; nj=1. Tato matice hraje obdobnou úlohu jako rozptyl náhodné velièiny, a proto je také u¾ívána k popsání rozptýlenosti náhodného vektoru od støední hodnoty náhodného vektoru
E (X) = (E (X1 ); : : : ; E (Xn)) : Matice Var(X) se nazývá varianèní (nìkdy té¾ kovarianèní) maticí náhodného vektoru X. Je symetrická a pozitivnì semide nitní. Kovarianci mezi slo¾kami náhodného vektoru mù¾eme vyu¾ít jako míry závislosti tìchto slo¾ek. K tomu úèelu se u¾ívá normovaná kovariance neboli koe cient korelace (Xi; Xj ) = q cov(Xi; Xj ) : var(Xi) var(Xj ) Aby koe cient mìl smysl, je tøeba, aby obì slo¾ky náhodného vektoru X mìly nenulový rozptyl. Uva¾me ale, ¾e kdy¾ náhodná velièina má nulový rozptyl, znamená to, ¾e nabývá s pravdìpodobností 1 pouze jediné hodnoty. Z praktického pohledu to znamená, ¾e jde vlastnì o nenáhodnou velièinu. 22
Koe cient korelace lze u¾ívat jako charakteristiku lineární závislosti náhodných velièin Xi a Xj . Pøedpokládejme, ¾e Xi = a Xj + b pro nìjaká reálná èísla a; b a a 6= 0. Vypoètìme rozptyl Xi var(Xi) = var(aXj + b) = E (aXj + b)2 ; [E (aXj + b)]2 = = a2 E (Xj2) + 2abEXj + b2 ; a2 [E (Xj )]2 ; 2abE (Xj ) ; b2 = n o = a2 E (Xj2) ; [E (Xj )]2 = a2 var(Xj ) a cov(Xi; Xj ) = cov(aXj + b; Xj ) = E [(aXj + b)Xj ] ; E (aXj + b)]E (Xj ) = = aE (Xj2) + bE (Xj ) ; a[E (Xj )]2 ; bE (Xj ) = n o = a E (Xj2) ; [E (Xj )]2 = a2 var(Xj ) Nyní mù¾eme vypoèíst korelaèní koe cient Xj ) = (Xi; Xj ) = q cov(Xi; Xj ) = qavar( var(Xi) var(Xj ) a2 var2 (Xj ) ( a>0 = a = 1;1 kdy¾ kdy¾ a < 0: jaj Tento pøípad je vlastnì mezním pøípadem, nebo» v¾dy platí, ¾e ;1 (Xi ; Xj ) 1 a hodnot ;1; 1 se nabývá pouze v pøípadì lineární závislosti obou náhodných velièin, tj. Xi = aXj + b; a 6= 0. Obdobnì jako jsme vytvoøili kovarianèní matici náhodného vektoru X, mù¾eme sestavit korelaèní matici náhodného vektoru X (X) = ((Xi ; Xj ))ni=1; nj=1 : Dostáváme tak symetrickou matici s jednièkami na diagonále. Øekneme, ¾e náhodné velièiny jsou nekorelované, kdy¾ cov(Xi; Xj ) = 0. Nekorelovanost ukazuje na jistý druh \nezávislosti" náhodných velièin. Pojem nezávislosti náhodných velièin bude probrán pozdìji. Zde pouze uvedeme dùle¾itou vlastnost náhodného vektoru s nekorelovanými slo¾kami. Uva¾ujme náhodnou velièinu Y = a1X1 + a2 X2 + + anXn + b, kde a1 ; : : : ; an; b jsou reálná èísla a X = (X1; X2; : : : ; Xn) je náhodný vektor. Spoètìme si støední hodnotu a rozptyl náhodné velièiny Y . E (Y ) = E (a1 X1 + anXn + b) = a1 E (X1) + + anE (Xn) + b z linearity støední hodnoty a n o var(Y ) = E [a1 X1 + anXn + b ; a1 E (X1) ; ; anE (Xn) ; b]2 = n o = E [a1 (X1 ; E (X1 )) + an(Xn ; E (Xn))]2 = = =
n XX
i;j =1 n XX i;j =1
aiaj E f[Xi ; E (Xi)][Xj ; E (Xj ]g = aiaj cov(Xi; Xj ):
Pokud navíc náhodný vektor X má vzájemnì nekorelované slo¾ky, tj. cov(Xi; Xj ) = 0, kdy¾ i 6= j , pak var(Y ) = a21 var(X1 ) + + a2nvar(Xn). 23
Pøíklady vícerozmìrných rozdìlení
Pøíklad 1: Mìjme náhodný vektor X = (X1; : : : ; Xn), kde ka¾dá náhodná velièina Xi
nabývá pouze hodnot xi = 0; 1; 2; : : : ; M s pravdìpodobností ! P (X1 = x1 ; X2 = x2 ; : : : ; Xn = xn) = x ! x M px1 px2 pxnn ; ! : : : x ! 1 2 n P P a pøitom 0 < pi < 1, ni=1 pi = 1 a ni=1 xi = M . Tomuto rozdìlení se øíká multinomické a je zobecnìním binomického rozdìlení. Pøíklad 2: Nech» náhodný vektor X = (X1 ; X2; : : : ; Xn) má hustotu 1 1 ; 1 T p exp ; 2 (x ; ) (x ; ) ; f (x1 ; x2 ; : : : ; xn) = (2) n det 1
2
2
kde x = (x1 ; x2; : : : ; xn); = (1; 2; : : : ; n) a je pozitivnì de nitní matice typu n n. Tomuto rozdìlení se øíká vícerozmìrné normální rozdìlení se støední hodnotou a varianèní maticí . Tradiènì se oznaèuje symbolem Nn(; ).
12 Podmínìná rozdìlení náhodných velièin
Ji¾ døíve jsme se seznámili s podmínìnou pravdìpodobností jevu. Pøipomeòme, ¾e P (AjB ) = P (A\B) a je de nována pouze pro P (B ) > 0. P (B ) Pokud máme dvì náhodné velièiny X; Y mù¾eme de novat zcela obdobnì podmínìné rozdìlení, které má náhodná velièina X , za podmínky, ¾e Y = y. Podmínìné rozdìlení lze de novat pro obecné náhodné velièiny X; Y , ale zde se omezíme pouze na dva pøípady, a to ¾e náhodný vektor (X; Y ) má buï diskrétní nebo spojité rozdìlení. Kdy¾ náhodný vektor (X; Y ) má diskrétní rozdìlení, pak podmínìné rozdìlení
P (X = x j Y = y) =
(
P (X =x; Y =y) P (Y =y)
0
pokud P (Y = y) > 0 jinak.
Uvìdomme si, ¾e z podmínìného rozdìlení lze zpìtnì napoèíst sdru¾ené rozdìlení náhodného vektoru (X; Y ):
Lemma.
P (X = x; Y = y) = P (X = y j Y = y) P (Y = y) = = P (Y = y j X = x) P (X = y): (1) Distribuèní funkci podmínìného rozdìlení velièiny X za podmínky Y = y budeme znaèit ( P (X<x j Y =y) pokud P (Y = y) > 0 P (Y =y) FX jY (xjy) = 0 jinak. Pro náhodný vektor (X; Y ) se spojitým rozdìlením de nujeme pøímo podmínìnou hustotu fX jY (xjy). Pokládáme 8 f (x;y) < X;Y fX jY (xjy) = : fY (y) pokud fY (y) > 0 0 jinak, (
)
24
kde
fY (y) =
Z +1 ;1
f(X;Y ) (x; y) dx
je marginální hustota. Je vidìt, ¾e fX jY (xjy) je hustota nìjakého rozdìlení pravdìpodobnosti, pokud fY (y) > 0. Pøíslu¹nou distribuèní funkci tedy získáme integrací
F(X jY ) (xjy) =
Zx
;infty
fX jY (tjy)dt:
Opìt platí odbobné vztahy jako pro podmínìné rozdìlení náhodné velièiny s diskrétním rozdìlením:
Lemma.
fX;Y (x; y) = fX (x) fY jX (yjx) = fX jY (xjy) fY (y): (2) V¹imnìme si, ¾e ze vztahù (1), (2) v lemmatech dostáváme pøímo varianty Bayesova vzorce. Dále z nich vyplývá dal¹í dùle¾itý vztah pro vztah marginálního a podmínìného rozdìlení: X P (X = x) = P (X = x j Y = y) P (Y = y) y:(x;y)2
pro diskrétní rozdìlení náhodného vektoru (X; Y ) a
fX (x) =
Z +1 ;1
fX jY (xjy) f (y) dy
pro spojité rozdìlení náhodného vektoru (X; Y ). Tyto vztahy jsou vzorce pro úplnou pravdìpodobnost pro náhodné velièiny diskrétního a spojitého typu. Proto¾e podmínìné rozdìlení pravdìpodobnosti je rozdìlením pravdìpodobnosti, odpovídá mu nìjaká náhodná velièina. Proto mù¾eme poèítat charakteristiky této podmínìné náhodné velièiny a chápeme je jako charakteristiky náhodné velièiny X za podmínky Y = y. Zde uvedeme pouze dvì neju¾ívanìj¹í charakteristiky, a to podmínìnou støední hodnotu a podmínìný rozptyl.
Z E [X jY = y] = x dFX jY (xjy)
podmínìný rozptyl je
je podmínìná støední hodnota;
n
o
var(X jY = y) = E [X ; E (X jY = y)]2j Y = y = h i = E X 2jY = y ; fE [X jY = y]g2 : Pøipomeòme, ¾e pro diskrétní rozdìlení náhodného vektoru (X; Y ) je X E [X jY = y] = x P (X = x j Y = y) x:(x;y)2
a pro spojité rozdìlení je
E [X jY = y] =
Z +1 ;1
25
x fX jY (xjy) dx:
Poznamenejme je¹tì, ¾e obì charakteristiky, jak podmínìná støední hodnota tak i podmínìný rozptyl, jsou funkcí reálného parametru y, který pøedstavuje hodnotu náhodné velièiny Y . Dostáváme tak funkcionální popis závislosti charakteristik (a tedy i rozdìlení) náhodné velièiny X na hodnotì náhodné velièiny Y , kterému budeme pozdìji øíkat model regrese (zde X na Y ).
13 Nezávislost náhodných velièin V kapitole o náhodných jevech jsme zavedli pojem nezávislosti náhodných jevù. Obdobnì, nejlépe pomocí distribuèní funkce, se zavádí nezávislost náhodných velièin. De nice. Øekneme, ¾e dvì náhodné velièiny X; Y jsou nezávislé, jestli¾e F(X;Y ) (x; y) = FX (x) FY (y); kde FX ; FY jsou marginální distribuèní funkce. Stejnì lze de novat nezávislost pro koneèný systém náhodných velièin. De nice. Øeknìme, ¾e náhodné velièiny X1 ; X2; : : : ; Xn jsou navzájem nezávislé, jestli¾e F(X ;:::;Xn) (x1; : : : ; xn) = FX (x1 ) FX (x2 ) FXn (xn ) pro ka¾dé x1 ; : : : ; xn reálné. Zavedený pojem nezávislosti odpovídá situaci pøi pokusu, kdy hodnoty jedné velièiny neovlivòují hodnoty jiné velièiny. Pov¹imnìme si, jak pro dvì náhodné velièiny X; Y jejich nezávislost zjednodu¹uje døíve odvozené formule. Nejprve si uvìdomme, ¾e pro náhodný vektor (X; Y ) s diskrétním rozdìlením je nezávislost ekvivalentní s vlastností P (X = x; Y = y) = P (X = x) P (Y = y) a pro spojité rozdìlení je ekvivalentní s vlastností f(X;Y ) (x; y) = fX (x) fY (y): Proto, kdy¾ X; Y jsou nezávislé náhodné velièiny, pak je FX jY (xjy) = FX (x): Dále, z de nice charakteristické funkce jako støední hodnoty z exp(itx) plyne, ¾e pokud jsou n.v. X a Y nezávislé, tak charakteristická funkce velièiny Z = X + Y je souèinem charakteristických funkcí pro X a Y , tj. Z (t) = X (t) Y (t): Pro obecné momenty náhodného vektoru (X; Y ) s nezávislými slo¾kami platí E (X r Y q ) = E (X r ) E (Y q ), pokud E (X r ) i E (Y q ) existují. Z tohoto speciálnì vyplývá, ¾e pokud E (X ) a E (Y ) existuje, pak cov(X; Y ) = E (XY ) ; E (X ) E (Y ) = 0: 1
1
2
Vidíme tedy, ¾e kdy¾ jsou náhodné velièiny nezávislé a existuje jejich støední hodnota, pak jsou tyto náhodné velièiny také nekorelované.
Tuto vlastnost ale nelze obecnì obrátit. Existují náhodné velièiny, je¾ jsou nekorelované, ale nejsou nezávislé. Obrácení platí napøíklad pro normální rozdìlení. 26
Tvrzení. Nech» náhodný vektor X = (X1 ; : : : ; Xn) má n-rozmìrné normální rozdìlení.
Pak je ekvivalentní a) slo¾ky náhodného vektoru jsou navzájem nezávislé; b) slo¾ky náhodného vektoru jsou po dvou nezávislé; c) slo¾ky náhodného vektoru jsou nekorelované. Dùkaz lehce plyne z tvaru hustoty normálního rozdìlení.
14 Transformace náhodné velièiny Èasto nás zajímá, jaké bude rozdìlení pravdìpodobnosti nìjaké nové náhodné velièiny, kterou jsme získali transformací náhodné velièiny X reálnou funkcí. Pøedpokládejme, ¾e Y = h(X ) a známe rozdìlení náhodné velièiny X . Omezíme se pouze na pøípad, kdy náhodná velièina X má spojité rozdìlení s hustotou fX . Vìta. Jestli¾e h je rostoucí (klesající) funkce na mno¾inì hodnot náhodné velièiny X , pak má náhodná velièina Y = h(X ) hustotu pravdìpodobnosti
fY (y) = fX
;1 (y) ; dy
h;1(y) dh
kde h;1 je inverzní funkce k h:
Dùkaz: Pro rostoucí funkci h máme
FY (y) = P (Y < y) = P (h(X ) < y) = P X < h;1 (y) = FX h;1 (y) :
Pak
;1 Y (y ) dFX ;1 dh;1 = dx h (y) dy (y) = fX h;1(y) dhdy (y); fY (y) = dFdy
kde dhdy; > 0: Obdobnì se tvrzení doká¾e pro h klesající. Mù¾eme také transformovat celý vektor: Vìta. Nech» X = (X1 ; : : : ; Xn) je náhodný vektor s hustotou fX , nech» dále h1 ; : : : ; hn : Rn ;! R jsou reálné funkce a Y = (Y1; : : : ; Yn), kde Y1 = h1 (X1; : : : ; Xn); : : : ; Yn = hn(X1; : : : ; Xn). Pøedpokládejme, ¾e pøiøazení x = (x1 ; : : : ; xn) k y = (y1; : : : ; yn) je jednoznaèné a ¾e existují funkce h;1 1 ; : : : ; h;n 1 tak, ¾e xj = h;j 1 (y1; : : : ; yn). Nech» navíc Jacobián této transformace 6= 0, tj. 1
0 @h; BB @y. ; J (y1; : : : ; yn) = det B @ @h;.. n @y ; 1
1
1
1
1
Pak má náhodný vektor Y hustotu
1 CC 6= 0: ... C A @h; @h;1 1 @yn n1
@yn
fY (y1; : : : ; yn) = fX h;1 1(y1; : : : ; yn); : : : ; h;n 1(y1; : : : ; yn) j J (y1; : : : ; yn)j : 27
Èasto lze s výhodou vyu¾ít toho, ¾e
0 @h ; @h 1 @xn C BB @x.. 1 ... C ; = det @ . A J (y1 ; : : : ; yn) @hn ; @hn @x @xn kam pak dosadíme za (x1 ; :::; xn) = h;1 1 (y1; : : : ; yn); : : : ; h;n 1(y1; : : : ; yn) : 1
1
1
1
Pøíklady:
1. Nech» n. velièina X má N (; 2) rozdìlení. Jaká je hustota rozdìlení velièiny Z = exp(X )? Na jakém de nièním oboru? (dostaneme tzv. lognormální rozdìlení). 2. Nech» náhodná velièina X má exponenciální rozdìlení s parametrem c > 0. Jaké rozdìlení má velièina Z = ln(X )? (tzv. dvojitì exponenciální). 3. Nech» náhodná velièina X má spojité rozdìlení s distribuèní funkcí FX (x). Jaké rozdìlení má náhodná velièina Y = FX (X )? (rovnomìrné R(0; 1)). 4. Nech» n.v. X má spojité rozdìlení s hustotou fX (x). Odvoïte hustotu rozdìlení n.v. Z = X 2. (Nejde ji¾ o monotónní transformaci, ale i zde lze výsledek odvodit pomocí distribuèní funkce). 5. Mìjme 2 náhodné velièiny X; Y se sdru¾enou hustotou fX;Y (x; y). Vypoètìte hustotu rozdìlení velièiny Z = X + Y . (Odvoïte nejprve rozdìlení pro dvojici (X; Z ) a pak z nìj marginální rozdìlení pro Z ).
28
III Konvergence posloupností náhodných velièin 15 Typy konvergence Známe ji¾ pojem náhodné velièiny jako mìøitelné funkce z pravdìpodobnostního prostoru (prostoru jevù) ( ; A; P ) do R. Náhodným vektorem rozumíme n-tici náhodných velièin, zpravidla de novaných na tomté¾ pravdìpodobnostním prostoru, pøi pøedstavì n rostoucího nade v¹echny meze dostáváme posloupnost náhodných velièin. Pøi praktických úlohách zpracování dat se setkáváme èasto s rozsáhlými n-ticemi náhodných velièin (a jejich realizací). Proto je u¾iteèné zabývat se chováním limit posloupností náhodných velièin. Konvergence posloupnosti èísel an k nìjakému a znamená prostì to, ¾e vzdálenost an od a se neomezenì zmen¹uje s n rostoucím, pøesnìji 8 " > 0 9 n" takové, ¾e pro n > n" platí jan ; aj < ". Pí¹eme nlim !1 an = a, nebo zkrácenì an ! a. Jen¾e náhodná velièina je charakterizovaná jednak svými hodnotami, jednak distribucí, (tj. rozdìlením pravdìpodobnosti na (R; B)). Typy konvergence posloupnosti náhodných velièin X1; : : : ; Xn k nìjaké dal¹í náhodné velièinì X proto mohou být kvalitativnì rùzné. Pøedpokládejme, ¾e v¹echny zmínìné náhodné velièiny jsou de novány na tém¾ pravdìpodobnostním prostoru ( ; A; P ) (pøipomínáme, ¾e náhodná velièina se chápe jako funkce, která jevùm z ( ; A) pøiøazuje "jevy" v (R; B)). Potom, pro ! 2 R; Xn(!); n = 1; 2; ::: vlastnì popisuje náhodný pokus v prostoru posloupností reálných èísel.
1. Konvergence skoro jistì: P f! 2 : Xn(!) ! X (!)g = 1: Znamená to vlastnì, ¾e prakticky v¹echny mo¾né realizace posloupnosti náhodných velièin Xn konvergují k odpovídajícím realizacím náhodné velièiny X . Zkrácenì pí¹eme P nlim !1 Xn = X = 1 nebo jen Xn ! X s. j..
2. Konvergence podle pravdìpodobnosti P f! 2 : jXn(!) ; X (!)j > "g ;! 0 pro ka¾dé " > 0: P Zkrácenì pí¹eme Xn ;! X . Znamená to asi tolik, ¾e s rostoucím n je stále více
realizací Xn blízko k odpovídajícím realizacím X , ale nemusejí to být tyté¾ realizace (mohou oscilovat a pod.). Tento typ konvergence je slab¹í, snadno nahlédneme, ¾e z 1 plyne 2.
3. Konvergence podle (kvadratického) støedu: E (Xn ; X )2 ;! 0 za pøedpokladu, ¾e E Xn2 < 1 pro n = 1; 2; : : :. Znamená to tedy, ¾e druhé momenty náhodných velièin (Xn ; X ) konvergují k 0, z èeho¾ lehce vyvodíme, ¾e z 3 vyplývá konvergence v pravdìpodobnosti. 29
4. Nech» Xn; X mají distribuèní funkce Fn(x); F (x), øekneme, ¾e Xn konverguje v distribuci k X , jestli¾e Fn(x) ;! F (x) v ka¾dém x 2 R1 , v nìm¾ je F (x) spojitá. Tato D X nebo L(X ) ;! L(X ) ("L" jako "law", konvergence se zkrácenì oznaèuje buï Xn ;! n
zákon rozdìlení pravdìpodobnosti). Tento typ konvergence je \nejslab¹í", plyne ze v¹ech pøedchozích. Týká se distribuèních funkcí, není proto ji¾ tøeba, aby náhodné velièiny Xn; X byly de novány na tém¾ pravdìpodobnostním prostoru. Na druhé stranì, i tento typ konvergence má znaèný význam, proto¾e umo¾òuje pøi velkých n náhodné velièiny Xn (jejich¾ rozdìlení nemusíme znát èi mù¾e být slo¾ité) pova¾ovat za velièiny s oním limitním rozdìlením F (viz napø. centrální limitní vìta). Bez dal¹ích podmínek se nedají vyslovit nìjaké dal¹í vztahy mezi typy konvergencí. Jen snad je¹tì uvedeme alternativní vyjádøení konvergence skoro jistì:
(
) P sup jXk ; X j > " ;! 0
pro ka¾dé " > 0 (pøi n ! 1);
k n
neboli
P sup jXk ; X j ;! 0: kn
Uveïme je¹tì nìkteré základní nerovnosti pro rozdìlení náhodných velièin. Nech» X je náhodná velièina s koneènou støední hodnotou EX , èíslo > 0. Pak 1. Je-li X > 0, tak P fX E X g 1= (Markovova nerovnost). Dùkaz:
Z1
Z1 1 P fX EX g = dFX (x) = dFZ (z) 1 EX EZ po substituci Z = X . Samozøejmì, pro 1 platí nerovnost automaticky (pravdìpodobnost je v¾dy 1).
Nech» D2(X ) (= X2 = var(X )) je koneèný rozptyl náhodné velièiny X , pak 2. P fjX ; E X j D(X )g 1=2 (Èeby¹evova nerovnost). Nerovnost 2 je získána aplikací nerovnosti 1 na náhodnou velièinu (X ; E X )2. Pou¾ívá se èasto ve tvaru, kdy vezmeme = "=D(X ), tj. dostaneme P fjX ; EX j "g D "(X ) : Takto dostaneme vlastnì jakýsi horní odhad pro pravdìpodobnost, ¾e X se od své støední hodnoty li¹í o více ne¾ ". Dal¹í zajímavé nerovnosti mù¾eme získat pou¾itím 1 èi 2 na vhodné transformace náhodných velièin, napøíklad aplikací 1 na (X ; E X ); > 1. Existuje{li -tý absolutní centrální moment E = E (jX ; E X j), dostaneme P fjX ; E X j D(X )g ( DE(X )) : 2
2
30
16 Zákon velkých èísel U¾ jsme vidìli, ¾e pravdìpodobnost jevu A se odhaduje pomocí pomìrné (relativní) èetnosti výskytu jevu A v opakovaných nezávislých pokusech (viz "empirická", èetnostní de nice pravdìpodobnosti). Zrovna tak jednou z nejjednodu¹¹ích statistických metod je odhad støední hodnoty náhodné velièiny tím zpùsobem, ¾e z realizace náhodného výbìru, tj. z realizace n nezávislých stejnì rozdìlených náhodných velièin X1 ; : : : ; Xn, vypoèteme aritmetický prùmìr. Chtìli bychom, aby odhad byl konzistentní v tom smyslu, ¾e konverguje k odhadovanému parametru, v tomto pøípadì ke støední hodnotì = E X1 = = E Xn. Pøedpokládejme, ¾e n.v. Xn jsou de novány na tomté¾ pravdìpodobnostním prostoru ( ; A). Øíkáme, ¾e platí silný zákon velkých èísel (ZVÈ), jestli¾e jde o konvergenci skoro jistì, pokud jde o konvergenci v pravdìpodobnosti, øíkáme, ¾e platí slabý ZVÈ. Formulujme nìkteré základní podmínky pro platnost ZVÈ: Vìta 1. Nech» Xk (k = 1; 2; : : :) jsou po dvou nezávislé náhodné velièiny s tým¾ rozdìlením, s koneènou støední hodnotou E Xk = a koneèným rozptylem var(Xk ) = 2. Potom P platí pro posloupnost náhodných velièin Xn = n1 Pnk=1 Xk , ¾e Xn ;! . Toto tvrzení lehce doká¾eme pomocí Èeby¹evovy nerovnosti, nebo» víme, ¾e E Xn = P n 1 Pn EX = a varX 1 n 2 i n 1 n n = n o 1 var Xi = n = =n, a tedy pro ka¾dé " > 0 je pravdìpodobnost P Xn ; j " n" , tj. s n rostoucím nade v¹echny meze je libovolnì malá. Samozøejmì ZVÈ platí daleko univerzálnìji pro obecnìj¹í pøípady. Pokud se omezíme na ty nejjednodu¹¹í, tak t.zv. Chinèinova vìta roz¹iøuje Vìtu 1 v tom, ¾e nepo¾aduje koneèný rozptyl, ale jen existenci koneèné støední hodnoty. Dùkaz se provede s pomocí charakteristických funkcí. Mù¾eme opustit i pøedpoklad o stejném rozdìlení náhodné velièiny Xn: Vìta 2. Nech» náhodné velièiny Xk (k = 1; 2; : : :) jsou po dvou nezávislé, nech» k = E Xk a k2 = var(Xk ) jsou koneèná èísla. Dále, nech» 1P a) existuje koneèná limita = nlim !1 n k , 2
2
2
2
2
Pn 2 Sn b) platí, ¾e nlim !1 n = 0, kde Sn = ( 1 k ) . 1 2
P Pak Xn ;! . To tedy byly nìkteré základní situace, v nich¾ platí slabý ZVÈ. Samozøejmì existují i jednoduché pøípady, pro nì¾ ZVÈ neplatí. Jsou{li napøíklad náhodné velièiny Xk nezávislé, stejnì rozdìlené s Cauchyovým rozdìlením, tj. s hustotou 1 = [(1 + x2 )], pak lze ukázat, ¾e velièina Xn má toté¾ Cauchyovo rozdìlení (nesoustøeïuje se tedy k jednomu bodu, jak by vy¾adoval ZVÈ), viz pøíklad 2, str. 34.
16.1 Silný zákon velkých èísel
K dùkazùm silného zákona velkých èísel, který vyjadøuje konvergenci skoro jistì, se pou¾ívá zesílení Èeby¹evovy nerovnosti, jeho¾ autorem je A. N. Kolmogorov: 31
Vìta. Nech» X1 ; : : : ; Xn jsou nezávislé náhodné velièiny s koneènými støedními hodno-
tami a rozptyly. Pro ka¾dé kladné èíslo " pak platí:
8 k 9 n < X = 1 X P :1max ( X ; E X ) " var Xk : j j ; "2 kn j =1 k=1
V¹imnìme si, ¾e k formulaci vìt o slabém ZVÈ staèil pøedpoklad nezávislosti Xk \po dvou". Je to proto, ¾e v dùkazu (v podstatì na základì Èeby¹evovy nerovnosti) potøebujeme pouze konvergenci variance prùmìru k nule, k èemu¾ staèí, ¾e E (Xj Xk ) = E Xj E Xk pro j 6= k. Pro platnost silného ZVÈ ji¾ tento pøedpoklad nemusí staèit. Zformulujeme nejrpve nejjednodu¹¹í pøípad. Vìta 1. Nech» Xk (k = 1; 2; : : :) jsou nezávislé náhodné velièiny s tým¾ rozdìlením, jeho¾ støední hodnota = E Xk a rozptyl 2 = var Xk jsou koneèné. Potom
P nlim !1 Xn = = 1: Jinými slovy, posloupnost náhodných velièin Xn konverguje k skoro jistì. Toto tvrzení mù¾eme hned pou¾ít pro dùkaz konvergence relativních èetností jevu A k pravdìpodobnosti tohoto jevu P (A). De nujeme{li náhodnou velièinu
(
v k-tém pokusu nastane jev A; Xk = 10 jestli¾e v opaèném pøípadì, pak Xn je relativní èetnost výskytu jevu A v prvních n pokusech, E Xk = P (A); var Xk = P (A)(1 ; P (A)), a Vìta + øíká, ¾e Xn ! P (A) s.j. I dal¹í verze silného ZVÈ pocházejí od A. N. Kolmogorova. Je mo¾né ukázat, ¾e opìt jako v pøípadì slabého ZVÈ je pøedpoklad o existenci rozptylu 2 zbyteèný. Pro platnost silného ZVÈ v situaci Vìty 1 (nezávislé, stejnì rozdìlené náhodné velièiny) staèí existence støední hodnoty . Naopak také, pokud existuje konstanta C , ¾e Xn ;! C s. j., pak C = E Xk (k = 1; 2; : : :). Pokud opustíme pøedpoklad o stejné distribuci náhodné velièiny Xk , platí: Vìta 2. Nech» Xk (k = 1; 2; : : :) je posloupnost nezávislých náhodných velièin, nech» P 1 2 2 k = E Xk a k =P var Xk existují, dále nech» øada k=1 (k jk2) konverguje. Potom, polo¾íme{li Zn = n1 kn (Xk ; k ), tak
Zn ;! 0
s. j.:
ZVÈ mù¾eme pova¾ovat za jeden ze základních výsledkù teorie pravdìpodobnosti. Je to i zákon, jeho¾ aplikace má základní význam pro matematickou statistiku, konkrétnì zaruèuje to, co intuitivnì tu¹íme, a to sice \pøesnost" odhadù pøi dostateènì velkém rozsahu náhodného výbìru. A netýká se to samozøejmì jen odhadu støední hodnoty, ale mnoha slo¾itìj¹ích situací. 32
17 Centrální limitní vìty Èasto zcela automaticky se pro praktické modelování velièin, vzniklých souètem mnoha malých odchylek (napøíklad pøi nepøesném mìøení) pou¾ívá normální distribuce. Právì centrální limitní vìty nás k takovéto aproximaci opravòují. Jeliko¾ nyní bude øeè o distribuci náhodných velièin, pøestává být podstatný pøedpoklad, ¾e v¹echny uva¾ované náhodné velièiny jsou de novány na tomté¾ základním pravdìpodobnostním prostoru. CLV (centrální limitní vìta) pro nejjednodu¹¹í pøípad zní: Vìta 1. Nech» Xk (k = 1; 2; : : :) jsou nezávislé náhodné velièiny se stejnou distribuèní funkcí, nech» existují koneèné = E (Xk ); 2 = var (Xk ) > 0. Dále polo¾me
Yn = Zn =
n X
Xk ; k=1 Yqn ; E (Yn)
Pn(X ; ) p X ; = 1 pk n = n n : var (Yn)
Potom L(Zn) ;! N (0; 1), neboli posloupnost distribuèních funkcí náhodných velièin Zn konverguje k distribuèní funkci (x) standardního normálního rozdìlení. Je¹tì jinak, posloupnost Zn konverguje v distribuci k nìjaké náhodné velièinì Z , která má standardní normální rozdìlení. Dùkazy CLV se vesmìs provádìjí pomocí konvergence charakteristických funkcí. Dal¹í verze tvrzení o konvergenci k normálnímu rozdìlení se li¹í podmínkami kladenými na distribuce náhodných velièin Xk , respektive na velikost jejich momentù. Vìta 2. Pøedpokládejme, ¾e náhodné velièiny Xk (k = 1; 2; : : :) jsou nezávislé a mají koneèné k = E Xk ; k2 = var Xk > 0. Nech» navíc existují koneèné momenty øádu pro nìjaké Pn (Xk ;>k ) 2. Oznaème Fn(x) distribuèní funkci standardizované náhodné velièiny Zn = Sn , kde 1
! ! n n X X ( ) 2 E jXk ; k j : Sn = k ; Kn = 1
1 2
k=1
k=1
Pak za pøedpokladu, ¾e limn!1 Kn( ) =Sn = 0, platí limn!1 Fn(x) = (x) pro x 2 (;1; 1). Podmínka pro = 3 je tzv. Ljapunovova podmínka. Je mimo jiné splnìna, pokud Xk jsou stejnì rozdìlené náhodné velièiny s koneènými prvními tøemi momenty, nebo» pak je p p Sn = n; Kn(3) = K1 (3) n a 3
nlim !1 Kn (3)=Sn = lim n
1 6
= 0:
Za dal¹í, je¹tì o nìco slab¹í podmínku, vdìèíme J. W. Lindebergovi (1922): Vìta 3. Pøedpokládejme, ¾e X1 ; X2; : : : ; Xk ; : : : jsou nezávislé náhodné velièiny mající koneèné støední hodnoty k a rozptyly k2. Nech» pro ka¾dé kladné " je splnìna Lindebergova podmínka XZ 1 2 nlim !1 Sn2 kn jxj>"Sn x d Gk (x) = 0; 33
kde Gk (x) jsou distribuèní funkce náhodných velièinPXk ; k . (X ; ) Potom pro standardizované náhodné velièiny Zn = knSn k k platí limitní vztah nlim !1 P fZn
< xg = (x);
x 2 (;1; 1):
Je¹tì uká¾eme, ¾e skuteènì Lindebergova podmínka je slab¹í ne¾ pøedchozí, to znamená, ¾e vyplývá z Ljapunovovy podmínky. Pro > 2 je toti¾ XZ 1 XZ 1 2 2 d G (x) ("S )( ;2) x d G x k (x) ( ;2) k n 2 Sn jxj>"Sn " Sn ! jxj>"Sn XZ 1 K n ( ) 2 ( ;2) jxj>"S x d Gk (x) S "( 1;2) : n " Sn n Tak¾e pokud pro nìjaké > 2 je limn!1 Kn( )=Sn = 0, je splnìna u¾ i podmínka Lindebergova. R 1 x2 d G (x), èili Lindebergova podmínka po¾aduje urSn2 není nic jiného ne¾ Pkn ;1 k èité stejnomìrné \soustøedìní" náhodných velièin Xk kolem støedních hodnot. Není tì¾ké aplikovat Vìtu 3 na pøípad stejnì rozdìlených náhodných velièin Xk a dospìt tak k Vìtì 1 jako k speciálnímu pøípadu. Vidìli jsme, ¾e konvergence rozdìlení náhodných velièin je vhodnì de nována pomocí konvergence distribuèních funkcí v CLV (k spojité distribuèní funkci standardního normálního rozdìlení). Tato konvergence je ekvivalentní s konvergencí charakteristických funkcí tìchto rozdìlení. Zajímavá je otázka, za jakých podmínek konvergují i hustoty rozdìlení. Je tøeba silnìj¹ích pøedpokladù, jak ukazuje i následující tvrzení. Vìta. Nech» X1; X2; : : : ; Xk jsou nezávislé náhodné velièiny se stejnou distribuèní funkcí, pøedpokládejme, ¾e mají hustotu rozdìlení f (x), která je omezená. Dále pøedpokládejme koneènost prvých dvou momentù a 2 . Pak hustoty fn(x) náhodných velièin p Zn = n Xn; konvergují k hustotì standardního normálního rozdìlení, neboli 1 exp(;x2 =2): p lim f ( x ) = n n!1 2 Tato konvergence je stejnomìrná vzhledem k x 2 (;1; 1). Dosavadní výsledky ukazují, ¾e normální rozdìlení má urèité výsadní postavení. Jistì je zajímavá otázka, zda podobnou roli limitního rozdìlení mù¾e hrát i jiný typ. Øíkáme, ¾e normální rozdìlení má ¹iroký obor pùsobnosti, kde oborem pùsobnosti normálního rozdìlení myslíme mno¾inu v¹ech distribuèních funkcí F (x) s touto vlastností: Jestli¾e X1; X2; : : : ; Xk ; : : : jsou nezávislé náhodné velièiny se stejnou distribuèníPfunkcí F (x), pak pøi vhodnì zvolených posloupnostech èísel fAng ; fSng platí pro Yn = kn Xk Yn ; An (;1 < x < 1): nlim !1 P Sn < x = (x); 34
Pokud nìjaké rozdìlení má tu vlastnost, ¾e souèet dvou nezávislých náhodných velièin má rozdìlení tého¾ typu jako je typ (stejný) rozdìlení sèítancù, øíkáme, ¾e tento typ rozdìlení je stabilní. Ka¾dé stabilní rozdìlení má svùj obor pùsobnosti, který obsahuje toto stabilní rozdìlení jako svùj prvek, mù¾e tedy hrát i roli limitního rozdìlení. Ov¹em normální rozdìlení je jediným stabilním rozdìlením s koneèným rozptylem. Pøíkladem jiného stabilního rozdìlení je rozdìlení Cauchyho (které koneèný rozptyl nemá). Dùkaz stabilnosti rozdìlení je nejlépe provést pomocí charakteristických funkcí: 1. Nech» X1; X2 jsou nezávislé náhodné velièiny s normálním rozdìlením, s parametry 1; 12 , resp. 2; 22 . Pak charakteristická funkce náhodné velièiny Y = X1 + X2 je
'(t) = '1(tn) '2(t) = ei t; t =2 ei t; ot =2 = = exp i=(1 + 2)t ; (12 + 22 )t2=2 : 1
2 2 1
2
2 2 2
Z toho plyne, ¾e náhodná velièina Y má normální rozdìlení s = 1 + 2, 2 = 12 + 22 . 2. Nech» X1 ; X2 jsou nezávislé náhodné velièiny s rozdìlením Cauchyho s parametry 1; 1 , resp. 2; 2 . To znamená, ¾e napø. hustota rozdìlení náhodné velièiny X1 je
(
)
2 ;1 f1(x) = 1 1 + x ; 1 1 pøíslu¹ná charakteristická funkce pak je '1(t) = exp (i1 t ; j1tj). Proto¾e 1 ; 2 pøedpokládáme kladná, má náhodná velièina Y = X1 + X2 charakteristickou funkci '(t) = '1(t) '2(t) = exp fi(1 + 2)t ; (1 + 2 ) jtjg : Neboli, její rozdìlení je rozdìlení Cauchyho, s parametry 1 + 2; 1 + 2 . Z toho mù¾eme odvodit i u¾ zmínìnou vlastnost, ¾e pokud X1 ; ; Xn jsou nezávislé, stejnì P 1 rozdìlené, s Cauchyho rozdìlením s parametry ; , pak Xn = n kn Xk má toté¾ rozdìlení. (Zde sice parametry ; charakterizují "støed", tj. polohu, a rozptýlenost pøíslu¹ného Cauchyova rozdìlìní, ale nejde pøímo o stø. hodnotu a rozptyl ve smyslu de nice momentù).
Na závìr je¹tì uveïme dal¹í pøíklad limitního rozdìlení pravdìpodobnosti:
Poissonovo rozdìlení sice samo není stabilní, ale také mù¾e hrát roli limitní distribuce. Nech» nezávislé náhodné velièiny X1 ; X2; : : : ; Xn; : : : jsou rozdìleny binomicky tak, ¾e X nabýt hodnot (celých) 0 a¾ n s pravdìpodobnostmi Qn;k = P fXn = kg = nn mù¾e k n;k k p (1 ; p) ; k = 0; 1; : : : ; n, p je parametr této distribuce s hodnotou v (0,1). Polo¾me nyní n = n p. Pak mù¾eme upravit !n k n n Qn;k = k! 1 ; n (n ;n! k)! (n ; n);k : Nech» nyní n ! 1; p ! 0, a to tak, ¾e n = n p ! , kde je kladná konstanta. Proto¾e !n n = e;; nlim !1 1 ; n 35
a èlen (n;n!k)! (n ; n);k má pro ka¾dé pevné k, pøi n ! 1, limitu 1, tak pro ka¾dé k = 0; 1; : : : k e;; lim Q = n!1 n;k k! co¾ je k-tý èlen Poissonova rozdìlení. Dokázali jsme, ¾e binomické rozdìlení Bi(n; p) konverguje pøi n ! 1 k Poissonovu rozdìlení se støední hodnotou , jestli¾e p konverguje k 0 tak, ¾e n p ! . Tato aproximace nám pomù¾e poèítat pravdìpodobnosti binomického rozdìlení v pøípadech, ¾e je velké n (alespoò nìkolik desítek) a hodnì malé p. Zároveò pro binomické rozdìlení platí centrální limitní vìta, nebo», jak jsme vidìli, binomickou náhodnou velièinu Y Bi(n; p) si mù¾eme pøedstavit jako souèet vzájemnì nezávislých alternativních n.v. Xi Alt(p); Y = Pni=1 Xi. Z C.L.V. pak dostaneme, ¾e pn n1qP Xi ; p = q Y ; np N (0; 1) p(1 ; p) np(1 ; p) pøibli¾nì. Neboli, pøi dost velkém n (zase aspoò nìkolik desítek) lze k výpoètu binomických pravdìpodobností pou¾ít této aproximace. Ta je nejvhodnìj¹í pro "støední" hodnoty p (podle situace, øeknìme v (0:1; 0:9)).
PØÍKLADY 1. Mìjme náhodnou velièinu X a nech» Z = aX . Uka¾te, ¾e pro charakteristické funkce je
Z (t) = X (at).
2. Pou¾ijte Èeby¹evovu nerovnost k nalezení odhadu nejmen¹ího nutného poètu hodù
korunou takového, ¾e s pravdìpodobností 90 % padne aritmetický prùmìr hodù do intervalu (0.4, 0.6). Udìlejte toté¾ s pomocí centrální limitní vìty. Chceme najít nejmen¹í n takové, aby: P jXn ; 0:5j 0:1 0:1: Proto¾e E Xn = 21 = 0:5 a varXn = 41n , tak z Èeby¹evovy nerovnosti plyne
P jXn ; 0:5j 0:1 0:112 var Xn = 0:101 41n
a to má být 0:1. Dostáváme tedy n 40:1001 = 250: p Z CLV plyne, ¾e velièina Z = n jXpn;1=04:5j má pøibli¾nì N (0; 1) rozdìlení, tak¾e
0 1 n ; 0:5j p p p j X P jXn ; 0:5j 0:1 = P @ n q 1 4n 0:1A = P (jZ j 4n 0:1); 4
36
p
a to má být 0:1. Z toho plyne, ¾e 4n 0:1 by mìl být alespoò tak velký jako horní 0:05 kvantil N (0; 1) rozdìlení, co¾ je pøibli¾nì u0:95 = 1:645. Tedy:
pn 0:2 1:645; tj. n 1:6452 =: 68: 0:04
Vidíme, ¾e Èeby¹evova nerovnost je znaènì "hrub¹í", výsledek pomocí CLV pova¾ujeme za pøesnìj¹í.
3. Uka¾te, ¾e jsou-li 2 "nulajednièkové" (tj. alternativní) náh. velièiny X; Y nekorelo-
vané, jsou i nezávislé (pøímým výpoètem sdru¾ených pravdìpodobností).
4. Bohatý obchodník s diamanty chce odmìnit syna za dobøe vykonané zkou¹ky. Dovolí
mu vybrat si ze dvou krabièek. Ka¾dá z nich obsahuje 3 kameny. V jedné jsou dva diamanty a bezcenný kámen, ve druhé jeden diamant a dva bezcenné kameny. Pokud by si syn vybral náhodnì, je pravdìpodobnost rovna 21 , ¾e dostane dva diamanty. Obchodník je sportovního ducha, a tak dovolí synovi vytáhnout jeden kámen z jedné (jen jedné) krabièky. Syn se rozhodne vzít si tu krabièku, ze které vytáhl "zku¹ební" kámen, pokud to byl diamant a naopak vzít si druhou krabièku, pokud ta¾ený kámen byl bezcenný. Jaká je pravdìpodobnost, ¾e si po této zkou¹ce vybere krabièku se dvìma diamanty? (Pravdìpodobnost je 32 . Úlohu lze øe¹it pomocí Bayesova vzorce)
5. Pøekupník se semeny urèil z velmi rozsáhlého testu, ¾e 4 % semen nevzklíèí. Prodává
semena po 50 kusech v jednom balení a garantuje 90 % klíèivosti. Jaká je pravdìpodobnost, ¾e daný sáèek semen naru¹í záruku? Oznaème pravdìpodobnost pro 1 semeno, ¾e nevzklíèí, P (X = 1) = p (= 0:04), náhodná velièina Y = poèet nevzklíèených semen z 50 má Bi(50; 0:04) rozdìlení. Zajímá nás 50 n! 5 n! X X k n ; k k n;k P (Y > 5) = k p (1 ; p) = 1 ; k p (1 ; p) k=6
k=0
a dále to chce poèítaè. A nebo Poissonovu aproximaci pro binomické rozdìlení { pak by mohla staèit kalkulaèka.
6. Nech» X1 a X2 jsou rozdìleny dle binomického rozdìlení s parametry (n; p1) a (n; p2). Je{li p1 < p2 uka¾te, ¾e
P (X1 k) P (X2 k)
pro k = 0; 1; : : : ; n. (To znamená, èím je p men¹í, tím je rozdìlení \posunuto více vlevo".)
37
k n! X Pp(X k) = pj (1 ; p)n;j j j =0 k n! n o dP = X j ;1 (1 ; p)n;j ; pj (1 ; p)n;j ;1(n ; j ) ; n(1 ; p)n;1 j p dp j =1 j k (1 ; p)n;k;1 0: = ;n k((n(n;;k1)! p ; 1)!
7. Ka¾dá ¾árovka má støední dobu ¾ivota 100 hodin a doba ¾ivota je rozdìlena dle exponenciálního rozdìlení (tj. s hustotou e;x pro x > 0; s parametrem = 1=100). Chceme{li mít jistotu na 95 %, ¾e i) z n ¾árovek alespoò jedna bude svítit 200 hodin, jak velké musí být n? ii) Chceme-li mít tuté¾ jistotu, ¾e dohromady n ¾árovek bude svítit 1 000 hodin (tj. kdy¾ praskne 1. rozsvítíme 2. atd.), jak velké musí být n? iii) Rozsvítíme-li jich 5 naráz, jaká je pravdìpodobnost, ¾e po 100 hodinách budou je¹tì svítit v¹echny?
i) Je potøeba odvodit rozdìlení pro maximum ¾ivotnosti 200 ¾árovek. ii) Velièina Z = Pn1 Xi má t.zv. gamma rozdìlení, s hustotou a distr. funkcí fn(z) = e;z (n ; 1)! (z)n;1 nX ;1 j Fn(z) = 1 ; e;z (zj !) ; j =0 a je potøeba spoèíst pøíslu¹ný kvantil. Nebo je mo¾né pou¾ít aproximaci pøes CLV: Víme, ¾e EXi = = 100; varXi = 2 = 1002: Chceme, aby aspoò s pravdìpodobností 0.95 bylo n X
Xi = nXn 1000; tj. pn Xn ; 1000 n ; pn; a proto¾e velièina vlevo má (pøibli¾nì) standardní normální rozdìlení N (0; 1), tak výraz vpravo by mìl mít nejvý¹e hodnotu pdolního 5% kvantilu N (0; 1), co¾ je -1.645. Hledáme nejmen¹í n takové, aby 1000=n; n ;1:645, co¾ splòuje n = 17: iii) Je tøeba odvodit rozdìlení pro minimum ¾ivotnosti pìti ¾árovek. i=1
38
8. Nech» X je náhodná velièina a nech» E jX j < 1. Uka¾te, ¾e E (X ; b)2 je minimalizováno pro b = E X . Nech» m je medián spojité náhodné velièiny X . Uka¾te, ¾e E jX ; bj je minimalizováno pro b = m. R 1 h(x; b)dF (x) a minimalizujte pøes b) (Vyu¾ijte de nice pro E (h(X; b)) = ;1
9. Výzkumník chce odhadnout populaèní prùmìr (tj. støední hodnotu) v koneèné, ale velmi rozsáhlé populaci pomocí výbìrového prùmìru. Kolik pozorování potøebuje, aby s pravdìpodobností 95 % byla chyba men¹í ne¾ 25 % smìrodatné odchylky? (Je mo¾né pou¾ít CLV)
39
IV. Nejdùle¾itìj¹í rozdìlení pravdìpodobnosti z hlediska matematické statistiky Vìnujme se nyní nìkolika typùm rozdìlení, které mají bohaté pou¾ití ve statistickém testování hypotéz. 1. Normální rozdìlení (gaussovské) hraje vùbec stì¾ejní roli v modelování, a» u¾ pøímo (dobøe popisuje symetrická rozdìlení náhodných odchylek), nebo pøibli¾nì, dík centrální limitní vìtì. Náhodný vektor X = (X1 ; X2; : : : ; Xk ) má k-rozmìrné normální rozdìlení Nk (; M), je-li pøíslu¹ná k-rozmìrná hustota f (x) vyjádøitelná ve tvaru f (x) = (2); k jMj; exp ; 12 (x ; )T M;1 (x ; ) x = (x1 ; x2; : : : ; xk ) 2 Rk ; M je kladnì de nitní matice, co¾ znamená 2
1 2
xT M x > 0 pro ka¾dé x 6= 0 (M je kovarianèní matice). Platí, ¾e v¹echna marginální rozdìlení pøíslu¹ná k Nk (; M) jsou opìt normální. Pro ka¾dou náhodnou velièinu X s Nk (; M) existuje taková lineární transformace, která ji pøevádí do náhodné velièiny Y s Nk (0; Ik ), kde Ik je diagonální matice s jednièkami na diagonále, tj. slo¾ky Y jsou navzájem nezávislé s rozdìlením jednorozmìrným N (0; 1). 2. Podmínìná rozdìlení pøíslu¹ná k normálnímu rozdìlení. Nech» X má Nk (0; M), nech» X = (Y; Z), kde Y je r-èlenný vektor, Z je s-èlenný vektor, r + s = k. Pak podmínìná hustota f (yjz) odpovídající podmínìnému rozdìlení vektoru Y za podmínky Z = z je rovna f (yjz) = (2); r jNj exp ; 12 (y + z PT N ;1)T N (y + z PT N ;1) kde 0 r s 1 z}|{ z}|{ BB N ... P CC g r ; 1 M = BB@ : : : : : : : : : : : CCA gs PT ... Q Odtud plyne, ¾e podmínìná støední hodnota E fYjZ = zg je lineární funkcí v podmínce z. 3. "Chi-kvadrát" { 2-rozdìlení. Nech» X1; X2; : : : ; Xn jsou vzájemnì nezávislé a stejnì rozdìlené náhodné velièiny s rozdìlením N (0; 1). Nech» n X Y = Xj2: 2
1 2
j =1
40
Pak rozdìlení náhodné velièiny Y se nazývá (centrální) 2-rozdìlení o n stupních volnosti. Hustota jeho rozdìlení je y gm(y) = m 1 m e; y m ;1 ; pro y 0; 2 ; 2 R ;(p) je gamma-funkce, = 01 xp;1 e;xdx, pro p celé > 0 je ;(p) = (p ; 1)!. Pro toto rozdìlení je E fY g = n; var(Y ) = 2n. 2
2
2
Pøíklad: Mìjme náhodný výbìr X1; : : : ; Xn z rozdìlení N (; 2). Jak víme, platí, ¾e (n ; 1) s2n=2 má 2n;1 rozdìlení (s n ; 1 stupni volnosti), kde s2n = n;1 1 P(Xi ; X n)2 . Toho vyu¾íváme k testu hypotézy o 2. Napøíklad test H0 : 0 proti
H1 : > 0 na hladinì , zalo¾íme na horním -kvantilu 2n;1() a na kritickém oboru pro zamítnutí hypotézy ve prospìch alternativy fs2n > 02 2n;1()=(n ; 1)g. Testù s 2 rozdìlením se hojnì pou¾ívá pøi testování shody napozorovaných èetností výskytu jevù s oèekávanými èetnostmi (hypotetickými) { viz kapitola o testech dobré shody a kontingenèních tabulkách. Platí: Pro dostateènì velká n (poèet stupòù volnosti) má náhodná velièina U = Yp; n 2n pøibli¾nì normální rozdìlení N (0; 1), co¾ je opìt dùsledek C. L. V. Platí: Nech» Yn ; Yn ; : : : ; Ynk jsou navzájem nezávislé náhodné velièiny s 2-rozdìlením P o n1 ; n2; : : : ; nk stupních volnosti. Pak Yn = ki=1 Yni má 2 -rozdìlení o n = Pki=1 ni stupních volnosti. 4. Studentovo t-rozdìlení Nech» U; Z jsou nezávislé náhodné velièiny, kde U je normálnípN (0; 1) a Z 2 má (centrální) 2-rozdìlení o n stupních volnosti. Pak velièina T = UZ n má (centrální) Studentovo t-rozdìlení o n stupních volnosti dané hustotou 2 !; n t 1 hn(t) = p n 1 ; 1 + n ; 1 < t < 1: nB 2 ; 2 Mimochodem, tato hustota je symetrická kolem 0 a pøi n ! 1 se blí¾í hustotì N (0; 1) distribuce. Pokud jde o momenty, je ET = 0; varT = n;n 2 a je de nován jen pro n > 2. Dùle¾itý je následující vztah, který se vyu¾ívá ke konstrukci známých t-testù: Nech» X1; X2; : : : ; Xn jsou navzájem nezávislé stejnì rozdìlené s rozdìlením N (; 2). Pak náhodná velièina n n pn; kde X = 1 X 2 = 1 X(X ; X )2 ; X ; s T =X; s n i=1 i n ; 1 i=1 i má t-rozdìlení s (n ; 1) stupni volnosti. Pomocí velièiny T tedy budeme testovat hypotézy o tom, jaká je asi hodnota v pøípadì, ¾e neznáme ani rozptyl 2, ale nahradíme ho odhadem s2 . 1
2
+1 2
41
5. Fisherovo F -rozdìlení. Nech» U; V jsou dvì nezávislé náhodné velièiny o 2 -rozdìleních o n a m stupních volnosti. Rozlo¾ení jejich podílu W = VU má spojité rozdìlení dané hustotou n ;1
; pro w 0; hn;m(w) = n mw B 2 ; 2 (1 + w) n m 2
+ 2
kde -funkce B (k; `) = ;(k) ;(`)=;(k + `). Rozdìlení náhodné velièiny Z = mn W = Un = mV se pak nazývá F -rozdìlení s n a m stupni volnosti a má hustotu
gn;m(z) = B gn;m = 0
n n2 m m2 z n2 ;1n+m ( n2 ; m2 )(m+nz) 2
pro z > 0 jinak:
Støední hodnota je EZ = mm;2 , de novaná jen pro m > 2, rozptyl varZ = n2(mm;(n2)+m(m;;2)4) , je de nován jen pro m > 4. Jak uvidíme, bohaté vyu¾ití má F -rozdìlení v analýze rozptylu, tj. pøi testování homogenity (neodli¹nosti) nìkolika skupin náhodných velièin, i pro testování shody rozptylù dvou výbìrù. 2
2
Literatura:
1. Uèební texty: Hátle J., Like¹ J.: Základy poètu pravdìpodobnosti a matematické statistiky, SNTL Praha, 1972. Like¹ J., Machek J.: Poèet pravdìpodobnosti. SNTL Praha, 1981. Like¹ J., Machek J.: Matematická statistika. SNTL Praha, 1988. Like¹, Cyhelský, Hindls: Úvod do statistiky a pravdìpodobnosti. Skripta V©E Praha, 1993. 2. Odborné publikace: Andìl J.: Matematická statistika, SNTL Praha, 1985. Andìl J.: Statistické metody, Matfyzpress Praha, 1993. Antoch J., Vorlíèková D.: Statistická analýza dat, Academia Praha, 1992. Rao C. R.: Lineární metody statistické indukce a jejich aplikace, Academia Praha, 1978. Zvára K.: Regresní analýza, Academia Praha, 1989. Wolfram S.: MATHEMATICA. A System for Doing Mathematics by Computer. AddisonWesley, Redwood City, California, 1988. 42
Wonnacot T.H., Wonnacot R.J.: Statistika pro obchod a hospodáøství, Victoria Publ. Praha, 1992. Meloun, Militký: Statistické zpracování experimentálních dat. Plus Praha, 1994. 3. Software: Koschin a kol. Statgraphics aneb statistika pro ka¾dého. Grada Praha, 1992. Hanousek J. a kol.: FamStat { Statistická nadstavba systému Famulus, KMSP MFF UK Praha, 1992. MATLAB (toolbox STATS), MATHEMATICA a jiné matematické programové produkty.
43