Kapitola 1 Z´ aklady teorie pravdˇ epodobnosti
1
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
2
1.1 1.1.1
N´ ahodn´ e jevy, pravdˇ epodobnost N´ ahoda, n´ ahodn´ y jev
ˇ Zivot je jen n´ahoda“, jak se zp´ıv´a v jedn´e obl´ıben´e p´ısni 1 . S trochou zo” becnˇen´ı m˚ uˇzeme tuto vˇetu povaˇzovat za jakousi definici“ n´ahody. Pojem ” n´ahody patˇr´ı do filosofick´ ych kategori´ı a dlouh´a l´eta se filosofov´e pˇrou o to, co to vlastnˇe ta n´ahoda je. Je to to, co nelze poznat, nebo je to to, co poznat lze, ale my to neum´ıme, nebo jej´ı pozn´an´ı je tak sloˇzit´e a n´akladn´e, ˇze se o nˇej radˇeji ani nepokouˇs´ıme? v t´eto souvislosti vzpom´ın´am jeˇstˇe na jednu definici“, kterou vyslovil krimin´aln´ı rada Vac´atko v jednom t´eˇz obl´ıben´em ” televizn´ım seri´alu: N´ahoda je B˚ uh, p´anov´e“ 2 . Jist´e je, ˇze n´ahoda je vˇsude ” kolem n´as a ovlivˇ nuje n´aˇs ˇzivot od sam´eho poˇca´tku. Pro naˇse potˇreby budeme vych´azet sp´ıˇse z pojmu n´ahodn´eho pokusu. Ten je definovan´ y zcela jasnˇe a srozumitelnˇe: n´ ahodn´ y pokus je jak´akoli naˇse ˇcinnost, kter´a skonˇc´ı nˇejak´ ym v´ ysledkem z pˇredem zn´am´e mnoˇziny vˇsech moˇzn´ ych v´ ysledk˚ u, ale jej´ıˇz konkr´etn´ı v´ ysledek nem˚ uˇzeme z nˇejak´ ych d˚ uvod˚ u pˇred zah´ajen´ım pokusu s jistotou urˇcit. Pˇ r´ıklad 1.1.1 Takov´ym pokusem je tˇreba sledov´an´ı poˇcas´ı, konkr´etnˇe teplota. Dnes nelze s jistotou ˇr´ıci, jak´a bude teplota z´ıtra r´ano v 8.00. V´ıme, ˇze v´ysledky“ tohoto pokusu mohou b´yt nˇejak´a re´aln´a ˇc´ısla (teplota ve stupn´ıch), ” ale konkr´etn´ı v´ysledek se dozv´ıme aˇz po uskuteˇcnˇen´ı“ pokusu, tedy z´ıtra r´ano ” v osm hodin na z´akladˇe mˇeˇren´ı. Pˇ r´ıklad 1.1.2 Pˇri cestˇe na poˇstovn´ı u ´ˇrad se m˚ uˇzeme pouze domn´ıvat, kolik lid´ı bude ve frontˇe u pˇrep´aˇzky pro v´ydej bal´ık˚ u. Jist´e je, ˇze to bude nˇejak´e pˇrirozen´e ˇc´ıslo, moˇzn´a i nula. Teprve pozorov´an´ım na m´ıstˇe m˚ uˇzeme urˇcit v´ysledek. Pˇ r´ıklad 1.1.3 Pˇred koup´ı nov´eho mobiln´ıho telefonu jsme vystaveni ot´azce: bude fungovat, nebo ne? M´ame pouze dva moˇzn´e v´ysledky: ano ˇci ne. Pˇresto konkr´etn´ı v´ysledek nezn´ame, dokud pˇr´ıstroj nevyzkouˇs´ıme. Takto bychom mohli pokraˇcovat donekoneˇcna3 . Pˇr´ıklad˚ u je kolem n´as nespoˇcet. A co je na tom zaj´ımav´e? Kdyˇz budeme stejn´ y pokus opakovat za pˇribliˇznˇe stejn´ ych“ podm´ınek, nejistota v´ ysledku z˚ ust´av´a. Ani velk´ y ” poˇcet opakov´an´ı n´am ned´av´a jistotu koneˇcn´eho v´ ysledku. To, co m˚ uˇzeme 1
Jan Werich, Jiˇr´ı Voskovec, Jaroslav Jeˇzek, 1932 Hˇr´ıˇsn´ı lid´e mˇesta Praˇzsk´eho, reˇzie Jiˇr´ı Sequens, podle pov´ıdek Jiˇr´ıho Marka,1968 3 Donekoneˇcna samozˇrejmˇe ne – to je nads´azka. Ale hodnˇe dlouho. 2
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
3
mnohon´asobn´ ym opakov´an´ım stejn´eho pokusu z´ıskat, je pouze m´ıra naˇseho oˇcek´av´an´ı, ˇze nastane nˇekter´ y z ˇcasto se opakuj´ıc´ıch v´ ysledk˚ u. No a t´eto m´ıˇre oˇcek´av´an´ı budeme ˇr´ıkat pravdˇepodobnost. Protˇejˇskem k n´ahodn´emu pokusu je pokus deterministick´y. v takov´em pˇr´ıpadˇe je v´ ysledek dopˇredu vˇzdy pˇresnˇe zn´am. v praktick´em ˇzivotˇe vˇsak tento typ pokusu existuje pouze v teoretick´e rovinˇe, kdy abstrahujeme od ˇrady vliv˚ u a uvaˇzujeme pouze jak´esi ide´aln´ı podm´ınky. Tedy vr´at´ıme-li se na zaˇc´atek tohoto u ´vodu a pouˇzijeme-li jeˇstˇe jednu lidovou moudrost, m˚ uˇzeme konstatovat, ˇze jedin´a jistota v ˇzivotˇe je to, ˇze vˇsechno je nejist´e. Proto je uˇziteˇcn´e rozv´ıjet takov´eto teorie, jako je teorie pravdˇepodobnosti, kter´e n´am pomohou zorientovat se v t´e nejistotˇe kolem n´as a uk´aˇz´ı n´am, co je jak pravdˇepodobn´e. ˇ aˇr m˚ Cten´ uˇze nam´ıtnout, ˇze pˇrestoˇze je nejistota vˇsude kolem n´as, pˇresto v tomto svˇetˇe ˇzijeme, aniˇz bychom k tomu potˇrebovali teorii pravdˇepodobnosti. To je pravda, ale pouze z ˇc´asti. Kaˇzd´ y z n´as v ˇzivotˇe pracuje s jakousi subjektivn´ı“ pravdˇepodobnost´ı, kter´a n´am dovoluje ˇcinit rozhodnut´ı ” aniˇz bychom si to uvˇedomovali. Probl´emy spojen´e s aplikac´ı t´eto subjektivn´ı pravdˇepodobnosti pocit’uje kaˇzd´ y, kdo se m´a rozhodnout mezi nˇekolika moˇznostmi. Snaˇz´ıme se upˇresnit“ tuto pravdˇepodobnost (rozumˇej: m´ıru ” oˇcek´av´an´ı v´ ysledku) studiem, cviˇcen´ım, z´ısk´av´an´ım dodateˇcn´ ych informac´ı a podobnˇe. Subjektivn´ı pravdˇepodobnost m´a jednu velkou nev´ yhodu: je subjektivn´ı. To znamen´a, ˇze kdyˇz se sejdou dva lid´e, zpravidla maj´ı na stejnou vˇec dva r˚ uzn´e n´azory – dvˇe r˚ uzn´e hodnoty subjektivn´ı pravdˇepodobnosti moˇzn´ ych v´ ysledk˚ u. Teorie pravˇepodobnosti je matematick´a discipl´ına, kter´a pracuje s ob” jektivn´ı“ pravdˇepodobnost´ı. Objektivn´ı pravdˇepodobnost je vyj´adˇrena matematickou funkc´ı, vych´azej´ıc´ı z matematick´e logiky a objektivnˇe uznatelnou vˇsemi, kter´ ych se t´ yk´a. Pˇ r´ıklad 1.1.4 Pˇredstavme si zn´am´y pˇr´ıklad h´azen´ı hrac´ı kostkou. Subjektivn´ı pocit, ˇze v n´asleduj´ıc´ım hodu uˇz mi urˇcitˇe padne ˇsestka“, vyjadˇruj´ıc´ı vy” sokou subjektivn´ı pravdˇepodobnost toho, ˇze mus´ım vyhr´at“ zde stoj´ı proti ob” jektivn´ı zkuˇsenosti, ˇze ˇsestka je pouze jedn´ım ze ˇsesti stejnˇe moˇzn´ych v´ysledk˚ u a objektivnˇe nen´ı d˚ uvod se domn´ıvat, ˇze by se zrovna v naˇsem pˇr´ıpadˇe mˇela st´at v´yjimka. Pˇ r´ıklad 1.1.5 Ze ˇsesti pˇr´ıstroj˚ u, mezi nimiˇz jsou dva vadn´e, vybereme n´ahodnˇe jeden. Jak´a je pravdˇepodobnost, ˇze vybereme bezvadn´y pˇr´ıstroj? ˇ sen´ı: Pokud vyb´ır´ame n´ahodnˇe, m˚ Reˇ uˇzeme pˇredpokl´adat, ˇze kaˇzd´ y pˇr´ıstroj m´a stejnou moˇznost b´ yt vybr´an a tedy objektivnˇe v jedn´e tˇretinˇe moˇzn´ ych
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
4
v´ ysledk˚ u (v´ ybˇeru konkr´etn´ıho pˇr´ıstroje) vybereme vadn´ y, ve dvou tˇretin´ach bezvadn´ y pˇr´ıstroj. Oˇcek´avan´a pravdˇepodobnost tedy bude rovna dvˇema tˇretin´am. Pˇredpoklad existence objektivn´ı pravdˇepodobnosti pˇredstavuje ovˇsem urˇcit´e zjednoduˇsen´ı, abstrakci. v pˇredchoz´ım pˇr´ıkladu pˇredpokl´ad´ame, ˇze kaˇzd´ y pˇr´ıstroj m´a stejnou ˇsanci“ b´ yt vybr´an. To samo o sobˇe je idealizace, zvl´aˇstˇe ” v pˇr´ıpadˇe, ˇze pˇr´ıstroje nejsou na jednom m´ıstˇe, nejsou vzhledovˇe u ´plnˇe totoˇzn´e, existuj´ı urˇcit´e vjemy, kter´e n´as pˇri v´ ybˇeru ovlivˇ nuj´ı. Nemluvˇe o situaci, kdy vyb´ır´ame z vˇetˇs´ıho poˇctu um´ıstˇen´eho napˇr´ıklad v nˇejak´em kontejneru. Potom ty kusy, kter´e jsou na ˇspatnˇe pˇr´ıstupn´em m´ıstˇe maj´ı re´alnˇe menˇs´ı ˇsanci b´ yt vybr´any neˇz ty, kter´e jsou dostupnˇejˇs´ı. Nicm´enˇe, jist´e zobecnˇen´ı a zjednoduˇsen´ı je nezbytn´e k tomu, abychom mohli vytv´aˇret matematick´e modely reality a na z´akladˇe tˇechto model˚ u prov´adˇet dalˇs´ı u ´vahy. Pozn´ amka: v tˇechto skriptech je uvedena ˇrada r˚ uzn´ ych pˇr´ıklad˚ u. Vˇsechny tyto pˇr´ıklady popisuj´ı jak´esi modelov´e“ situace. To znamen´a, ˇze nen´ı d˚ uleˇzit´e, ” zda se v nich hovoˇr´ı o hrac´ı kostce nebo o vadn´ ych pˇr´ıstroj´ıch. Napˇr´ıklad v´ yˇse uveden´e dva pˇr´ıklady by stejnˇe dobˇre mohly zn´ıt takto: Pˇ r´ıklad 1.1.6 Pˇredstavme si ˇsest stejn´ych pˇr´ıstroj˚ u, mezi nimiˇz je jeden vadn´y. Subjektivn´ı pocit, ˇze pˇri n´ahodn´em v´ybˇeru jednoho z nich vyberu ” urˇcitˇe ten vadn´y“, vyjadˇruj´ıc´ı vysokou subjektivn´ı pravdˇepodobnost plynouc´ı ze znalosti Murphyho z´akon˚ u4 zde stoj´ı proti objektivn´ı zkuˇsenosti, ˇze v´ybˇer vadn´eho pˇr´ıstroje je pouze jedn´ım ze ˇsesti stejnˇe moˇzn´ych v´ysledk˚ u. Pˇ r´ıklad 1.1.7 Jak´a je pravdˇepodobnost, ˇze pˇri hodu hrac´ı kostkou n´am padne ˇc´ıslo dˇeliteln´e tˇremi? Tyto pˇr´ıklady, aˇc jsou formulov´any jinak neˇz pˇredchoz´ı dva, maj´ı u ´plnˇe stejn´e ˇreˇsen´ı. Proto se nepozastavujte nad t´ım, kdyˇz v nˇekter´ ych pˇr´ıkladech tah´ame koule z urny“, ale sp´ıˇse se pokuste naj´ıt paralelu s re´aln´ ym ˇzivotem, ” formulaci t´eˇze u ´lohy v term´ınech mnohem bliˇzˇs´ıch re´aln´emu ˇzivotu. Pokud se v´am to podaˇr´ı, zaˇcneme ch´apat oˇc tu bˇeˇz´ı.
1.1.2
Speci´ aln´ı definice pravdˇ epodobnosti
Jak bylo uvedeno v pˇredchoz´ım odstavci, v´ ychodiskem pro naˇse dalˇs´ı u ´vahy bude vˇzdy nˇejak´ y n´ ahodn´ y pokus. Ten vˇzdy skonˇc´ı nˇejak´ ym konkr´etn´ım 4
http://www.cska.cz/murphy/index.htm
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
5
v´ ysledkem z pˇredem zn´am´e mnoˇziny Ω. Tyto v´ ysledky jsou navz´ajem nesluˇciteln´e, coˇz znamen´a, ˇze vˇzdy m˚ uˇze nastat pouze jeden z nich, nikoli dva z´aroveˇ n. Takov´eto v´ ysledky naz´ yv´ame element´ arn´ı v´ ysledky. Pˇ r´ıklad 1.1.8 • Pˇri mˇeˇren´ı teploty chlad´ıc´ı kapaliny je mnoˇzinou element´arn´ıch v´ysledk˚ u mnoˇzina re´aln´ych ˇc´ısel. • Pˇri sledov´an´ı poˇctu poruch zaˇr´ızen´ı za urˇcitou dobu je mnoˇzinou element´arn´ıch v´ysledk˚ u mnoˇzina nez´aporn´ych cel´ych ˇc´ısel. • V´ysledkem posuzov´an´ı kvality v´yrobku na v´ystupn´ı kontrole je jedna ze tˇr´ı jakostn´ıch kategori´ı. • Pozorovan´y v´ysledek testu odolnosti povrchu proti otˇeru m˚ uˇze b´yt bud’ obst´al nebo neobst´al. Kromˇe tˇechto element´arn´ıch v´ ysledk˚ u jsou pˇredmˇetem naˇseho studia ˇcasto v´ ysledky komplikovanˇejˇs´ı, sloˇzen´e z nˇekolika element´arn´ıch v´ ysledk˚ u. Tyto v´ ysledky uˇz nemusej´ı b´ yt nesluˇciteln´e a mohou se vyskytnout souˇcasnˇe. Zpravidla je m˚ uˇzeme vyj´adˇrit jako sjednocen´ı element´arn´ıch jev˚ u. v uveden´ ych pˇr´ıkladech to mohou b´ yt n´asleduj´ıc´ı v´ ysledky: Pˇ r´ıklad 1.1.9 • Pˇri mˇeˇren´ı teploty chlad´ıc´ı kapaliny sledujeme, zda je teplota v urˇcit´em povolen´em rozmez´ı. To je vyj´adˇreno intervalem, obsahuj´ıc´ım nekoneˇcnˇe mnoho re´aln´ych ˇc´ısel. • Pˇri sledov´an´ı poˇctu poruch zaˇr´ızen´ı za urˇcitou dobu n´as zaj´ım´a, zda tento poˇcet nepˇrekroˇc´ı povolen´y limit, ˇreknˇeme k. Tento v´ysledek obsahuje ˇc´ısla {0, 1, 2, . . . , k}. To n´as vede k n´asleduj´ıc´ı definici: N´ ahodn´ e jevy (d´ale jen jevy) jsou mnoˇziny, jejichˇz prvky jsou element´arn´ı jevy z mnoˇziny Ω. Syst´em vˇsech jev˚ u budeme naz´ yvat jevov´ e pole F. Jev Ω se naz´ yv´a jist´ y jev, ∅ pr´azdn´a mnoˇzina element´arn´ıch jev˚ u se naz´ yv´a nemoˇ zn´ y jev. Pˇri pr´aci s jevy se uˇz´ıvaj´ı mnoˇzinov´e operace s n´asleduj´ıc´ım v´ yznamem: pro jevy A, B ∈ F lze definovat • sjednocen´ı A ∪ B (nastane jev A nebo jev B),
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
6
• pr˚ unik A ∩ B (jevy A a B nastanou souˇcasnˇe)5 , • doplnˇek Ac (nenastane jev A), • rozd´ıl A − B = AB c (nastane jev A, ale nenastane jev B), • inkluzi A ⊂ B (kdyˇz nastane jev A, nastane i jev B) • disjunkci A ∩ B = ∅ (jevy A a B nemohou nastat souˇcasnˇe - jsou nesluˇ citeln´ e) V t´eto souvislosti jsou uˇziteˇcn´a takzvan´a de Morganova pravidla, kter´a plat´ı i pro sjednocen´ı ˇci pr˚ unik vˇetˇs´ıho poˇctu jev˚ u: (A ∪ B)c = Ac ∩ B c ,
(A ∩ B)c = Ac ∪ B c .
Klasick´ a definice pravdˇ epodobnosti. Uvaˇzujme n´ahodn´ y pokus s koneˇcnou mnoˇzinou element´arn´ıch jev˚ u Ω = {ω1 , ..., ωn } a nˇejak´ y jev A ⊂ Ω. Za pˇredpokladu, ˇze vˇsechny element´arn´ı v´ ysledky pokusu jsou stejnˇe moˇzn´e, pravdˇepodobnost jevu A je definov´ana jako pod´ıl P (A) =
nA , n
kde nA je poˇcet element´arn´ıch jev˚ u, pˇri nichˇz nastane jev A a n je poˇcet vˇsech element´arn´ıch jev˚ u. Pˇri v´ ypoˇctu pravdˇepodobnosti podle klasick´e definice je tˇreba zn´at poˇcty nA a n. Ktomu se ˇcasto pouˇz´ıv´a kombinatorick´ ych u ´vah. Tak napˇr´ıklad Ck (n) = nk je poˇcet kombinac´ı k-t´ e tˇ r´ıdy z n prvk˚ u. Pˇredpokl´ad´ame, ˇze pro k ≤ n. Ck (n) odpov´ıd´a poˇctu k-tic, kter´e lze vybrat z n prvk˚ u bez ohledu na poˇrad´ı. Pokud budeme rozliˇsovat i poˇrad´ı prvk˚ u ve vyb´ıran´ ych k-tic´ıch, puˇzijeme variace k-t´ e tˇ r´ıdy z n prvk˚ uVk (n) = n(n − 1)...(n − k + 1). Specielnˇe pro k = n je Pe (n) = Vn (n) = n! poˇcet permutac´ı n prvk˚ u, coˇz pˇredstavuje poˇcet vˇsech moˇzn´ ych poˇrad´ı pˇri uspoˇr´ad´an´ı n prvk˚ u. Pˇ r´ıklad 1.1.10 Deset aut zaparkuje n´ahodnˇe vedle sebe. Jak´a je pravdˇepodobnost, ˇze zvolen´a tˇri auta budou spolu sousedit? 5ˇ
Casto se m˚ uˇzete setkat se z´apisem, v nˇemˇz je pr˚ unik dvou jev˚ u zaps´an jako souˇcin (bez symbolu ∩), tedy A ∩ B = AB.
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
7
ˇ sen´ı: Oznaˇcme A sledovan´ Reˇ y jev. Celkov´ y poˇcet moˇzn´ ych rozm´ıstˇen´ı tˇr´ı aut na 10 m´ıst je roven V3 (10) = 720. Poˇcet rozm´ıstˇen´ı, kter´a vyhovuj´ı jevu A je osm moˇzn´ ych pozic kr´at poˇcet permutac´ı tˇr´ı aut v jedn´e pozici, tedy celkem 8.3! P (A) = 720 = 0, 0667. Geometrick´ a pravdˇ epodobnost. Nejjednoduˇsˇs´ı pˇr´ıklad definice pravdˇepodobnosti na nespoˇcetn´e mnoˇzinˇe element´arn´ıch jev˚ u pro Ω ⊂ Rk (Rk je k-rozmˇern´ y Eukleidovsk´ y prostor) a jev A ⊂ Ω vych´az´ı ze znalosti k-rozmˇern´eho objemu Vk (A) a klade P (A) =
Vk (A) . Vk (Ω)
Vˇsimnˇete si, ˇze pˇri t´eto definici pravdˇepodobnosti a k ≥ 1 maj´ı jednotliv´e element´arn´ı jevy pravdˇepodobnost 0, jsou to totiˇz body prostoru Rk , kter´e maj´ı nulov´ y objem. Pˇ r´ıklad 1.1.11 Na rovinu R2 pokrytou syst´emem ekvidistantn´ıch rovnobˇeˇzn´ych pˇr´ımek vzd´alen´ych od sebe o d > 0 je n´ahodnˇe vhozen a) kruh o pr˚ umˇeru r, b) u ´seˇcka o d´elce r < d. Stanovte pravdˇepodobnost jevu A = [´ utvar protne jednu z pˇr´ımek]. ˇ sen´ı: Reˇ 1. Poloha kruhu je urˇcena (x, y), jev A nez´avis´ı na souˇradnici x. Staˇc´ı zvolit Ω = h0, d/2i ⊂ R1 interval vyjadˇruj´ıc´ı vzd´alenost stˇredu od nejbliˇzˇs´ı pˇr´ımky, v tomto modelu A = h0, r/2i a tedy P (A) = dr . 2. Zde je nutno nav´ıc uvaˇzovat orientaci ϕ u ´seˇcky z intervalu h0, πi, tedy 2 Ω = h0, z podm´ınky protnut´ı jako πi x h0, d/2i ⊂ R . Jev A vyj´adˇr´Rıme π A = (ϕ, y) ∈ Ω; y ≤ 2r sinϕ . Protoˇze 0 = 2r sinϕdϕ = r, je podle 2r definice P (A) = dπ . Pˇredchoz´ı pˇr´ıklad b) je zn´am´ y Buffon˚ uv probl´em h´azen´ı jehlou, formulovan´ y v roce 1777. Je moˇzn´a ˇcetnostn´ı interpretace v´ ysledku. Na obd´eln´ıkovou oblast o stran´ach 1 a d je n´ahodnˇe vhozeno n u ´seˇcek d´elky r, np je poˇcet u ´seˇcek, kter´e protnou pˇr´ımku p˚ ul´ıc´ı obd´eln´ık, viz Obr. 1.1: Nahrad´ıme-li pravdˇepodobnost pomˇernou ˇcetnost´ı, dost´av´ame vztah nnp ≈ 2r , tedy π2 np ≈ rn . Zde np je poˇcet pr˚ useˇc´ık˚ u na jednotku d´elky pˇr´ımky, v´ yraz dπ d
8
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Obr´azek 1.1: Buffonova u ´loha na prav´e stranˇe je celkov´a d´elka u ´seˇcek v jednotce plochy. Posledn´ı vzorec lze obecnˇeji pouˇz´ıt pro odhad d´elky vl´aken s n´ahodnou orientac´ı (napˇr. hustoty dislokaˇcn´ıch ˇcar na metalografick´em sn´ımku) pomoc´ı poˇctu pr˚ useˇc´ık˚ u na testovac´ı pˇr´ımce. Statistick´ a definice pravdˇ epodobnosti. V ˇradˇe pˇr´ıpad˚ u nelze pouˇz´ıt ani jednu z pˇredchoz´ıch definic pravdˇepodobnosti. V takov´ ych pˇr´ıpadech provedeme statistick´ y pokus, pˇri kter´em mnohokr´at opakujeme n´ahodn´ y pokus za (pˇribliˇznˇe) stejn´ ych podm´ınek a pravdˇepodobnost odhadneme pomˇernou ˇcetnost´ı v´ yskytu jevu A v t´eto s´erii pokus˚ u. Tento zp˚ usob urˇcen´ı pravdˇepodobnosti je sice nejm´enˇe pˇresn´ y, pˇri r˚ uzn´ ych s´eri´ıch pokus˚ u dostaneme dokonce r˚ uzn´e v´ ysledky a nelze rozhodnout, kter´ y z nich je ten spr´avn´ y, ale na druhou stranu, je to nejˇcastˇeji pouˇz´ıvan´ y zp˚ usob odhadu pravdˇepodobnosti v re´aln´ ych aplikac´ıch.
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
1.1.3
9
Axiomatick´ a definice pravdˇ epodobnosti
Obecn´a teorie pravdˇepodobnosti, kter´a zahrnuje v´ yˇse uveden´e v´ yklady pravdˇepodobnosti, vych´az´ı z n´asleduj´ıc´ıch pˇredpoklad˚ u: 1. Je d´ana nepr´azdn´a mnoˇzina Ω, prostor element´ arn´ıch jev˚ u. 2. Je d´ano jevov´ e pole F podmnoˇzin Ω splˇ nuj´ıc´ı podm´ınky (a) nemoˇzn´ y jev ∅ ∈ F, (b) jestliˇze A ∈ F, potom Ac ∈ F, (c) jestliˇze Ai ∈ F, i ∈ N , potom Ui∈N Ai ∈ F 3. Kaˇzd´emu jevu A ∈ F je pˇriˇrazena pravdˇ epodobnost P (A) s vlastnostmi (a) P (A) ≥ 0 pro kaˇzd´e A ∈ F (b) P (Ω) = 1 P∞ S zdou posloupnost {An } po dvou (c) P ( ∞ n=1 (An ) pro kaˇ n=1 An ) = nesluˇciteln´ ych jev˚ u. Trojice (Ω, F, P ) se naz´ yv´a pravdˇ epodobnostn´ı prostor. Pravdˇepodobnostn´ı prostor je vlastnˇe matematick´ ym modelem n´ahodn´eho pokusu. Uveden´ y soubor axiom˚ u se naz´ yv´a podle jejich autora Kolmogorovova axiomatick´ a definice pravdˇ epodobnosti6 Je-li Ω koneˇcn´a nebo spoˇcetn´a mnoˇzina, potom obyˇcejnˇe F je syst´em vˇsech podmnoˇzin Ω. V pˇr´ıpadˇe nespoˇcetn´eho Ω je F nˇejak´ y dostateˇcnˇe bohat´ y syst´em jev˚ u splˇ nuj´ıc´ı podm´ınku b) z pˇredchoz´ıho odstavce, kter´ y nemus´ı obsahovat pˇr´ıliˇs komplikovan´e podmnoˇziny Ω. Re´aln´e funkci P na F se ˇr´ık´a pravdˇ epodobnostn´ı m´ıra, zkr´acenˇe pravdˇepodobnost. Z v´ yˇse uveden´ ych axiom˚ u lze odvodit n´asleduj´ıc´ı vlastnosti pravdˇepodobnosti: (1) P (∅) = 0 (2) 0 ≤ P (A) ≤ 1 pro kaˇzd´e A ∈ F, (3) jestliˇze A ⊂ B, potom P (A) ≤ P (B), 6
A.N.Kolmogorov (1903 – 1987), sovˇetsk´ y matematik, zakladatel modern´ı teorie pravdˇepodobnosti.
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
10
(4) P (A ∪ B) = P (A) + P (B) − P (A ∩ B), (5) P (A ∩ B) = P (A) + P (B) pro A, B nesluˇciteln´e, (6) P (Ac ) = 1 − P (A), (7) jestliˇze A ⊂ B, potom P (B − A) = P (B) − P (A). Vzorec pro pravdˇepodobnost sjednocen´ı jev˚ u lze indukc´ı rozˇs´ıˇrit na libovoln´ y poˇcet sˇc´ıtanc˚ u P(
n [
Ai ) =
i=1
X
X
P (Ai ) −
1≤i≤n
X
P (Ai Aj ) +
P (Ai Aj Ak )
1≤i<j
1≤i<j≤n
− . . . + (−1)
P (A1 A2 . . . An )
Pˇ r´ıklad 1.1.12 Pˇri vysl´an´ı n zpr´av urˇcen´ych po jedn´e n pˇr´ıjemc˚ um dojde k chaosu a zpr´avy jsou pˇrijaty n´ahodnˇe. Jak´a je pravdˇepodobnost jevu A = [aspoˇ n jeden pˇr´ıjemce dostane svou zpr´avu], vyˇsetˇrete i limitn´ı chov´an´ı pro n rostouc´ı nade vˇsechny meze. ˇ sen´ı: Element´arn´ı jevy jsou vˇsechny permutace, jejichˇz poˇcet je n!. Oznaˇcme Reˇ S Ai = [i-t´ y pˇr´ıjemce dostane svou zpr´avu]. Zˇrejmˇe je A = ni=1 Ai . Jevy Ai nejsou nesluˇciteln´e a tak nelze pouˇz´ıt axiom 3c) z definice pravdˇepodobnosti. Uˇzit´ım v´ yˇse uveden´eho vzorce dost´av´ame n [
n (n − 2)! n (n − 3)! (n − 1)! − + − ...+ P (A) = P ( Ai ) = n 2 3 n! n! n! i=1 (−1)n−1
1 1 1 1 = 1 − + − . . . + (−1)n−1 n! 2! 3! n!
d´ale je lim P (
n→∞
n [ i=1
Ai ) =
∞ X (−1)i−1 i=1
i!
= 1−
∞ X (−1)i i=0
i!
= 1 − e−1 = 0, 628.
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
1.1.4
11
Podm´ınˇ en´ a pravdˇ epodobnost a stochastick´ a z´ avislost jev˚ u
V nˇekter´ ych pˇr´ıpadech jsou dva v´ ysledky n´ahodn´eho pokusu takov´e, ˇze m´ıra oˇcek´av´an´ı jednoho z nich, ˇreknˇeme A, se zmˇen´ı, v´ıme-li ˇze nastal jev B. Tato pozmˇenˇen´a m´ıra oˇcek´av´an´ı se naz´ yv´a podm´ınˇ en´ a pravdˇ epodobnost a o jevech A a B ˇr´ık´ame, ˇze jsou stochasticky z´ avisl´ e. Podm´ınˇen´a pravdˇepodobnost se spoˇcte podle n´asleduj´ıc´ı definice: Je-li A, B ∈ F, P (B) > 0, potom podm´ınˇen´a pravdˇepodobnost P (A|B) jevu A za podm´ınky, ˇze nastal jev B je rovna P (A|B) =
P (A ∩ B) P (B)
Z t´eto definice dost´av´ame dalˇs´ı zaj´ımav´ y v´ ysledek. Vˇsimnˇete si, ˇze z axiom˚ u definice pravdˇepodobnosti nelze odvodit vztah pro pravdˇepodobnost pr˚ uniku dvou jev˚ u, aˇckoli se ˇcasto pouˇz´ıv´a. Z definice podm´ınˇen´e pravdˇepodobnosti vypl´ yv´a, ˇze P (A ∩ B) = P (B).P (A|B). Pokud jsou v´ ysledky pokusu A a B takov´e, ˇze m´ıra oˇcek´av´an´ı jednoho z nich, ˇreknˇeme A, se nezmˇen´ı z´ısk´an´ım informace o tom, ˇze nastal jev B, potom ˇr´ık´ame, ˇze jevy A a jsou stochasticky nez´ avisl´ e. V tomto pˇr´ıpadˇe je P (A|B) = P (A) Vˇ eta 1.1 (Krit´ erium nez´ avislosti) N´ahodn´e jevy A, B ∈ F jsou stochasticky nez´avisl´e pr´avˇe kdyˇz plat´ı P (A ∩ B) = P (A).P (B). D˚ ukaz: D˚ ukaz plyne bezprostˇrednˇe ze vzorce pro podm´ınˇenou pravdˇepodobnost a z toho, ˇze stochastick´a nez´avislost je ekvivalentn´ı vlastnosti P (A|B) = P (A). Vˇsimnˇete si, ˇze jsou-li stochasticky nez´avisl´e jevy A, B, potom jsou nez´avisl´e i jevy A a B c . Je totiˇz P (AB c ) = P (A − B) = P (A − AB) = P (A) − P (AB) = P (A) − P (A)P (B) = P (A)(1 − P (B)) = P (A)P (B c ). Pravdˇepodobnost, ˇze padne rub pˇri hodu minc´ı (jev A), povaˇzujeme za stejnou jako pravdˇepodobnost, ˇze padne rub za podm´ınky, ˇze h´az´ıme levou rukou (jev B), nebot’ v´ ysledek pokusu nez´avis´ı na tom, kterou rukou se h´az´ı. Naproti tomu v n´asleduj´ıc´ım pˇr´ıkladu tato rovnost splnˇena nebyla a z v´ ysledku vypl´ yv´a, ˇze se lze domn´ıvat, ˇze nezamˇestnanost m´ırnˇe z´avis´ı na pohlav´ı.
12
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Pˇ r´ıklad 1.1.13 Pˇri vyˇsetˇrov´an´ı nezamˇestnanosti v populaci pracovn´ıch sil byly zjiˇstˇeny pomˇern´e ˇcetnosti v tabulce. M˚ uˇzeme je interpretovat jako pravdˇepodobnosti, ˇze n´ahodnˇe vybran´y jedinec patˇr´ı k dan´e skupinˇe. Vypoˇctˇete P (N ), P (N |M ), P (N |Z) pˇri oznaˇcen´ı jev˚ u podle tabulky. Z (zamˇestnan´y) N (nezamˇestnan´y) celkem
M (muˇz) 0,519 0,039 0,558
ˇ sen´ı: Je P (N ) = 0, 072, P (N |M ) = Reˇ
0,039 0,558
Z (ˇzena) celkem 0,409 0,928 0,033 0,072 0,442 1,000 = 0, 07, P (N |Z) = 0, 075
Pˇ r´ıklad 1.1.14 Nez´avisle na sobˇe jsou vyrobeny tˇri ventil´atory, pˇritom pravdˇepodobnost, ˇze v´yrobek je vadn´y (V) resp. dobr´y (D), je vˇzdy 0,1 resp. 0,9. Jak´e jsou pravdˇepodobnosti moˇzn´ych v´ysledk˚ u tohoto pokusu? ˇ sen´ı: Lze uvaˇzovat osm moˇzn´ Reˇ ych v´ ysledk˚ u ωi tohoto pokusu (variace tˇret´ı tˇr´ıdy ze dvou prvk˚ u s opakov´an´ım). Oznaˇcme Ai = [i-t´ y ventil´ator je vadn´ y], c potom napˇr. element´arn´ı jev ω3 = [DV D], lze vyj´adˇrit jako ω3 = A1 A2 Ac3 . Vzhledem k nez´avislosti v´ yrobk˚ u je potom P (ω3 ) = 0, 92 0, 1. Pˇ r´ıklad 1.1.15 Uvaˇzujme dva n´ahodn´e jevy A a B, jejichˇz pravdˇepodobnosti jsou P (A) = P (B) = 0, 5. Spoˇctˇete pravdˇepodobnosti P (A ∪ B), P (A − B) za pˇredpokladu, ˇze a) A a B jsou nez´avisl´e jevy, b) A a B jsou stochasticky z´avisl´e a je P (A|B) = 0, 8. ˇ sen´ı: V obou pˇr´ıpadech je P (A ∪ B) = P (A) + P (B) − P (A ∩ B) a P (A − Reˇ B) = P (A) − P (A ∩ B). V pˇr´ıpadˇe a) plyne z nez´avislosti P (A ∩ B) = P (A).P (B) = 0, 25. V pˇr´ıpadˇe b) je P (A ∩ B) = P (B).P (A|B) = 0, 4. Tedy odpovˇed’ je a) P (A ∪ B) = 0, 75, P (A − B) = 0, 25 b) P (A ∪ B) = 0, 6, P (A − B) = 0, 1 Pˇ r´ıklad 1.1.16 Dva hr´aˇci h´az´ı stˇr´ıdavˇe minc´ı, vyhraje ten, komu padne prvn´ı rub mince. Urˇcete pravdˇepodobnost jevu A = [vyhraje hr´aˇc, kter´ y zaˇc´ın´a]. ˇ sen´ı: Element´arn´ı jevy v tomto pokusu jsou posloupnosti rub˚ Reˇ u (R) a l´ıc˚ u (L) tvaru ω1 = {R}, ω2 = {LR}, ω3 = {LLR}, . . . , ωn = {L . . . LR}, . . . Na kaˇzd´ y z tˇechto jev˚ u se vˇsak m˚ uˇzeme d´ıvat z hlediska konkr´etn´ıho hodu minc´ı,
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
13
jehoˇz element´arn´ı v´ ysledky jsou pouze L nebo R, kaˇzd´ y s pravdˇepodobnost´ı 21 (za pˇredpokladu symetrick´e homogenn´ı mince). Potom v´ ysledky sledovan´eho pokusu (cel´e hry) lze ch´apat jako pr˚ uniky nez´avisl´ ych jev˚ u L a R a tedy plat´ı, i P ˇze P (ωi ) = pi = 12 = 2−i . Vˇsimnˇete si, ˇze ∞ i=1 pi = 1 a jev ω∞ = [hra nikdy neskonˇc´ı] m´a pravdˇepodobnost P (ω∞ ) = 0. Jev A obsahuje pouze ty element´arn´ı v´ ysledky, jejichˇz d´elkaP je lich´a (rub padne ri 1., 3., 5., . . . hodu). S P∞ pˇ ∞ 1 −i Tedy je A = ∞ ω a P (A) = = 2 4 = 23 . Takov´ato hra i=1 2i−1 i=1 22i−1 i=1 je nespravedliv´a, protoˇze hr´aˇci nemaj´ı stejnou pravdˇepodobnost v´ yhry. Vrat’me se k pˇr´ıkladu 1.1.12 S a pokusme se ˇreˇsit ho pomoc´ı obratu z pˇredn choz´ıho pˇr´ıkladu. Lze ps´ a t A = y pˇr´ıjemce dostal svou i=1 Ai , kde Ai = [i-t´ T n c c zpr´avu], tedy A = i=1 Ai . Pravdˇepodobnost tohoto pr˚ uniku ovˇsem nelze jednoduˇse vyj´adˇrit, protoˇze jevy Ai , tedy ani jevy Aci , nejsou nez´avisl´e. Je totiˇz P (Ai ) = n1 , P (Ai )P (Aj ) = 1 1 , ale P (Ai Aj ) = (n−2)! = n(n−1) . n2 n! Vˇ eta 1.2 Necht’ A1 , . . . , An ∈ F, P (A1 ∩ A2 ∩ . . . ∩ An ) > 0, n ≥ 2. Potom P (A1 ∩A2 ∩. . .∩An ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩A2 ) . . . P (An |A1 ∩. . .∩An−1 ) D˚ ukaz: D˚ ukaz se provede matematickou indukc´ı: Pro n = 2 je z definice podm´ınˇen´e pravdˇepodobnosti P (A1 ∩ A2 ) = P (A1 )P (A2 |A1 ). D´ale je P (A1 ∩ . . . ∩ An+1 ) = P (A1 ∩ . . . ∩ An )P (An+1 |A1 ∩ . . . ∩ An ), dosazen´ım za P (A1 ∩ . . . ∩ An ) z indukˇcn´ıho pˇredpokladu je d˚ ukaz ukonˇcen. Pˇ r´ıklad 1.1.17 Ze sedmi dodan´ych televizor˚ u tˇri potˇrebuj´ı seˇr´ızen´ı. N´ahodnˇe vybereme tˇri kusy, jak´a je pravdˇepodobnost jevu A = [ˇz´adn´y vybran´y televizor nepotˇrebuje seˇr´ızen´ı]. ˇ sen´ı: Ulohu ´ Reˇ lze ˇreˇsit bud’ jako klasick´ y pravdˇepodobnostn´ı pokus, kde 7 poˇcet element´arn´ıch jev˚ u je C3 (7) = 3 = 35, 3 4 4 P (A) = 0 3 = 35 35 nebo pomoc´ı vˇety z pˇredchoz´ıho odstavce: bud’ Ai = [i-t´ y vybran´ y televizor nepotˇrebuje seˇr´ızen´ı], A = A1 A2 A3 , P (A) = P (A1 )P (A2 |A1 )P (A3 |A1 A2 ) =
432 4 = 765 35
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
14
Pˇ r´ıklad 1.1.18 Kolikr´at je tˇreba hodit hrac´ı kostkou, aby pravdˇepodobnost jevu A, ˇze padne aspoˇ n jedna ˇsestka, byla vˇetˇs´ı neˇz 0,9? ˇ sen´ı: Bud’ Ai = [v i-t´em hodu padne ˇsestka], potom Bn = Sn Ai je jev, Reˇ i=1 ˇze ˇsestka padne v nˇekter´em z prvn´ıch n hod˚ u a Bnc jev, ˇze ˇsestka v prvn´ıch n hodech nepadne. Sn Tn c c c Podle de Morganov´ ych pravidel je BQ z je n = ( i=1 Ai ) = i=1 Ai coˇ n n 5 c c pr˚ unik nez´avisl´ ych jev˚ u, tedy P (Bn ) = i=1 P (Ai ) = 6 . Z nerovnosti 5 n = 12, 63. Odpovˇed’ tedy zn´ı, P (Bn ) = 1 − 6 > 0, 9 dost´av´ame n > lnln0,1 ( 56 ) je tˇreba hodit alespoˇ n tˇrin´ackr´at. Pˇ r´ıklad 1.1.19 Vyˇsetˇrujme dva elektrick´e obvody se ˇctyˇrmi oˇc´ıslovan´ymi prvky, viz obr. 1.2. Pˇredpokl´ad´ame, ˇze jevy Ai = [dojde k poruˇse i-t´eho prvku] jsou nez´avisl´e, P (A1 ) = P (A2 ) = 0, 1, P (A3 ) = P (A4 ) = 0, 2. Jak´a je pravdˇepodobnost jevu B = [dojde k pˇreruˇsen´ı proudu v obvodu]?
Obr´azek 1.2: Z´alohov´an´ı po prvc´ıch (a), z´alohov´an´ı cel´e vˇetve (b). ˇ sen´ı: Je tˇreba kombinovat uˇzit´ı vzorc˚ Reˇ u pro pravdˇ uniku a Sepodobnost pr˚ sjednocen´ı jev˚ u. V prvn´ım obvodu a) je B = A1 A3 A2 A4 ,T P (B) = 0, T02 + 0, 02 − 0, 0004 = 0, 0396. Ve druh´em obvodu b) je B = (A1 A2 )(A3 A4 ), jevy ve sjednocen´ı nejsou nesluˇciteln´e, tedy P (B) = (0, 1 + 0, 1 − 0, 01)(0, 2 + 0, 2 − 0, 04) = 0, 0684. V´ ysledek m´a n´asleduj´ıc´ı interpretaci v teorii spolehlivosti: jsou-li 1,2 hlavn´ı prvky a 3,4 z´aloˇzn´ı prvky v obvodu, potom protoˇze P (B) je niˇzˇs´ı v obvodu a) potvrzuje se, ˇze z´alohov´an´ı jednotliv´ ych prvk˚ u je u ´ˇcinnˇejˇs´ı neˇz z´alohov´an´ı cel´e hlavn´ı vˇetve v obvodu b). Pro pevn´e B ∈ F je funkc´ı P (.|B) definov´ana na F opˇet pravdˇepodobnostn´ı m´ıra7 , pˇriˇcemˇz z´akladn´ı prostor Ω se redukuje na B. Specielnˇe bud’ Ω = {ω1 , ω2 , . . . , ωn }, B ⊂ Ω, P (B) > 0. V pojet´ı klasick´e definice pravdˇepodobnosti definujeme podm´ınˇenou pravdˇepodobnost P (ωi |B) pˇrirozenˇe jako P (ωi |B) = 7
teˇcka zde zastupuje m´ısto pro promˇennou
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
15
i) pro ωi ∈ B. V ˇcetnostn´ı interpretaci oznaˇcme 0 pro ωi ∈ / B, P (ωi |B) = PP(ω (B) ni resp. nB poˇcet v´ yskyt˚ u jevu ωi resp. B v n opakov´an´ıch pokusu. Potom je pˇribliˇznˇe ni ni P (ωi ) P (ωi |B) ≈ = nnB ≈ nB P (B) n
Potom, je-li A ⊂ Ω, je P (A|B) =
X
P (ωi |B) =
ωi ∈A
X P (ωi ) . P (B) ω ∈A∩B i
Rozˇs´ıˇr´ıme nyn´ı definici nez´avislosti na vˇetˇs´ı poˇcet jev˚ u. Jevy syst´ emu B = Bn , n ∈ M ⊂ Ω se naz´ yvaj´ı vz´ ajemnˇ e nez´ avisl´ e, jestliˇze pro kaˇzdou koneˇcnou podmnoˇzinu n1 , . . . , nk ⊂ M indexov´e mnoˇziny M pˇrirozen´ ych ˇc´ısel plat´ı P (Bn1 Bn2 . . . Bnk ) = P (Bn1 )P (Bn2 ) . . . P (Bnk )) K nez´avislosti syst´emu jev˚ u podle t´eto definice nestaˇc´ı nez´avislost po dvou. Je-li napˇr. Ω = {ω1 , ω2 , ω3 , ω4 }, P (ωi ) = 41 , i = 1, . . . , 4. Jevy A = {ω1 , ω2 }, B = {ω1 , ω3 }, C = {ω1 , ω4 } jsou po dvou nez´avisl´e podle definice I.4.1, protoˇze P (A) = P (B) = P (C) = 12 a P (AB) = P (AC) = P (BC) = 14 . Naproti tomu P (ABC) = 41 zat´ımco P (A)P (B)P (C) = 18 , tedy jevy nejsou vz´ajemnˇe nez´avisl´e.
1.1.5
Vˇ eta o u ´ pln´ e pravdˇ epodobnosti a Bayesova vˇ eta
Vz´ajemnˇe nesluˇciteln´e jevy Ai ∈ F, i = 1, . . . , n,Stvoˇr´ı u ´ pln´ y syst´ em jev˚ u, n jestliˇze P (Ai ) > 0 pro kaˇzd´e i = 1, . . . , n a P ( i=1 Ai ) = 1. Nˇekdy se t´eˇz hovoˇr´ı o u ´ pln´ em pokryt´ı mnoˇziny Ω. Vˇ eta 1.3 (o u ´ pln´ e pravdˇ epodobnosti) Necht’ {Hi }ni=1 je u ´pln´y syst´em jev˚ u, A ∈ F. Potom P (A) =
n X
P (A|Hi )P (Hi )
i=1
D˚ ukaz:
P = P (A ∩ Ω) =PP (A ∩ (∪ni=1 Hi )) = P (∪ni=1 (A ∩ Hi )) = P(A) n n i=1 P (A ∩ Hi ) = i=1 P (A|Hi )P (Hi )
16
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Pˇ r´ıklad 1.1.20 Jak´a je pravdˇepodobnost, ˇze vybran´a souˇc´astka, kter´a patˇr´ı s pravdˇepodobnost´ı 0,2; 0,3 resp. 0,5 do prvn´ı, druh´e, resp. tˇret´ı skupiny, vydrˇz´ı z´atˇeˇz, jestliˇze souˇc´astka z prvn´ı, druh´e resp. tˇret´ı skupiny vydrˇz´ı z´atˇeˇz s pravdˇepodobnost´ı 0,95; 0,9 resp. 0,85. ˇ sen´ı: Oznaˇcme jev A = [souˇca´stka vydrˇz´ı z´atˇeˇz], Hi = [souˇca´stka vybr´ana Reˇ z i-t´e skupiny]. Ze zad´an´ı plyne P (H1 ) = 0, 2, P (H2 ) = 0, 3, P (H3 ) = 0, 5, d´ale P (A|H1 ) = 0, 95, P (A|H2 ) = 0, 9, P (A|H3 ) = 0, 85. Podle vˇety o u ´pln´e pravdˇepodobnosti je tedy P (A) = 0, 885. V´ ysledn´a pravdˇepodobnost je v´aˇzen´ ym pr˚ umˇerem podm´ınˇen´ ych pravdˇepodobnost´ı, pˇriˇcemˇz v´ahy tvoˇr´ı pravdˇepodobnosti jev˚ uzu ´pln´eho syst´emu. ´pln´y syst´em jev˚ u, A ∈ F, P (A) > Vˇ eta 1.4 (Bayesova) Necht’ {Hi }ni=1 je u 0. Potom P (A|Hi P (Hi ) P (Hi |A) = P i P (A|Hi )P (Hi ) i) D˚ ukaz: Je P (Hi |A) = P (A∩H . Vyj´adˇr´ıme-li pravdˇepodobnost pr˚ uniku v ˇcitaP (A) teli podle definice podm´ınˇen´e pravdˇepodobnosti a dosad´ıme-li pravdˇepodobnost jevu A ve jmenovateli podle vˇety o u ´pln´e pravdˇepodobnosti, dost´av´ame tvrzen´ı vˇety (tzv. Bayes˚ uv vzorec).
V aplikac´ıch Bayesova vzorce z vˇety 1.4 maj´ı jevy Hi v´ yznam hypot´ez, kter´e se navz´ajem vyluˇcuj´ı a pr´avˇe jedna z nich je spr´avn´a. P (Hi ) jsou jejich pravdˇepodobnosti pˇred proveden´ım doplˇ nuj´ıc´ıho pokusu ˇci testu, ˇr´ık´a se jim apriorn´ı pravdˇepodobnosti. P (.|Hi ) je pravdˇepodobnostn´ı m´ıra v´ ysledk˚ u testu za platnosti hypot´ezy Hi , kter´a je ˇcasto zn´am´a. Vzorec umoˇzn ˇuje vypoˇc´ıtat podm´ınˇen´e pravdˇepodobnosti hypot´ez po proveden´ı testu v nˇemˇz nastal jev A, takzvan´e aposteriorn´ı pravdˇepodobnosti. Pˇ r´ıklad 1.1.21 Zam´yˇsl´ıte koupit v autobazaru v˚ uz jist´e znaˇcky, je ovˇsem zn´amo, ˇze 30 procent takov´ych nab´ızen´ych voz˚ u m´a vadn´e pˇrevodovky. Abyste z´ıskali v´ıce informac´ı, najmete si mechanika, kter´y je po proj´ıˇzd’ce schopen odhadnout stav vozu a jen s pravdˇepodobnost´ı 0,1 se zm´yl´ı. Jak´a je pravdˇepodobnost, ˇze v˚ uz, kter´y zam´yˇsl´ıte koupit, m´a vadnou pˇrevodovku a) pˇredt´ım, neˇz si najmete mechanika? b) jestliˇze mechanik pˇredpov´ı, ˇze je dobr´y? ˇ sen´ı: Oznaˇcme H1 = [v˚ Reˇ uz je vadn´ y] a H2 = [v˚ uz je dobr´ y] dvˇe hypot´ezy. Jedna z nich urˇcitˇe nastane a navz´ajem se vyluˇcuj´ı – tvoˇr´ı tedy u ´pln´e pokryt´ı. D´ale oznaˇcme v´ ysledek mechanikova testu A = [doporuˇcuji v˚ uz kou’ pit]. Odpovˇed na ot´azku a) je d´ana pod´ılem vadn´ ych voz˚ u P (H1 ) = 0, 3,
´ ´ JEVY, PRAVDEPODOBNOST ˇ 1.1. NAHODN E
17
coˇz je jedin´a informace pˇred najmut´ım mechanika. V´ ypoˇcet aposteriorn´ı pravdˇepodobnosti b) lze prov´est podle Bayesova vzorce P (H1 |A) =
P (A|H1 ).P (H1 ) P (A|H1 ).P (H1 ) + P (A|H2 ).P (H2 ) 0, 1.0, 3 0, 03 = = = 0, 045. 0, 1.0, 3 + 0, 9.0, 7 0, 63
Tedy pravdˇepodobnost koupˇe vadn´eho vozu podle doporuˇcen´ı experta se sn´ıˇz´ı na necel´ ych pˇet procent. Odhaduje-li mechanik, ˇze v˚ uz je dobr´ y, ˇsance na n´akup dobr´eho vozu se zv´ yˇsila ze 70 % na 95,5 %. Jedno z moˇzn´ ych grafick´ ych zn´azornˇen´ı v´ ysledku b) je na obr. 1.3. Celkov´a pravdˇepodobnost (plocha ˇctverce) je rozdˇelena vodorovnou pˇr´ıˇckou v pomˇeru pravdˇepodobnosti hypot´ez, d´ale svisl´ ymi pˇr´ıˇckami v pomˇeru podm´ınˇen´ ych pravdˇepodobnost´ı v´ ysledk˚ u testu. P (H1 |A) hled´ame v pravdˇepodobnostn´ım prostoru redukovan´em na vyˇsrafovanou plo´ o n´akupu auchu (t.j. za podm´ınky A) jako pod´ıl plo- Obr´azek 1.3: Uloha tomobilu chy odpov´ıdaj´ıc´ı H1 ku celkov´e ploˇse. Jin´ y zp˚ usob grafick´eho zn´azornˇen´ı v´ ypoˇctu pomoc´ı stromov´eho grafu je na obr. 1.4. Zde pravdˇepodobnost n´akupu vadn´eho vozu s doporuˇcen´ım mechanika odpov´ıd´a prvn´ı vˇetvi shora – oznaˇcme ji α. Pˇr´ıpady, kdy mechanik doporuˇc´ı koupi, jsou zahrnuty v prvn´ı a tˇret´ı vˇetvi – jejich souˇcet oznaˇcme β. Potom hledan´a pravdˇepodobnost je rovna pod´ılu αβ .
´ Obr´azek 1.4: Uloha o n´akupu automobilu
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
18
1.2 1.2.1
N´ ahodn´ a veliˇ cina Rozdˇ elen´ı n´ ahodn´ e veliˇ ciny
Pod pojmem (re´ aln´ a) n´ ahodn´ a veliˇ cina budeme rozumˇet re´alnou funkci X : Ω → R, definovanou na prostoru element´arn´ıch jev˚ u Ω a takovou, ˇze pro kaˇzd´e re´aln´e ˇc´ıslo x ∈ R je A = {ω ∈ Ω : X(ω) ≤ x} ∈ F. Pokud je obor hodnot n´ahodn´e veliˇciny podmnoˇzinou komplexn´ıch ˇc´ısel, budeme hovoˇrit o komplexn´ı n´ahodn´e veliˇcinˇe, v pˇr´ıpadˇe, ˇze hodnoty leˇz´ı ve vektorov´em prostoru Rn , budeme hovoˇrit o n´ahodn´em vektoru. V t´eto ˇca´sti se omez´ıme pouze na re´aln´e n´ahodn´e veliˇciny. Nad´ale budeme pouˇz´ıvat zkr´acen´eho z´apisu A = {X ≤ x}. Nenechte se vˇsak t´ımto zkr´acen´ ym z´apisem zm´ast: vynech´an´ım ω v z´apisu jeho vliv na hodnotu n´ahodn´e veliˇciny X nemiz´ı a je tˇreba s n´ım vˇzdy poˇc´ıtat! Podm´ınka, ˇze A je prvkem jevov´eho pole F – jin´ ymi slovy ˇze A je n´ahodn´ y jev v uvaˇzovan´em n´ahodn´em pokusu – je potˇreba k tomu, abychom mohli jevu A = {X ≤ x} pˇriˇradit jeho pravdˇepodobnost. Pˇripomeˇ nme, ˇze pravdˇepodobnost je definov´ana pr´avˇe na mnoˇzinˇe F. Je-li F syst´em vˇsech podmnoˇzin Ω, potom kaˇzd´a re´aln´a funkce X na Ω je n´ahodn´a veliˇcina. V obecn´em pˇr´ıpadˇe se m˚ uˇze st´at, ˇze nˇekter´e pˇr´ıliˇs komplikovan´e funkce nemus´ı splˇ novat podm´ınku z definice n´ahodn´e veliˇciny. S takov´ ymi funkcemi se ale v praktick´ ych aplikac´ıch nesetk´av´ame. Funkce F (x) definovan´a vztahem F (x) = P (X ≤ x) se naz´ yv´a distribuˇ cn´ı funkce n´ahodn´e veliˇciny X. (Tento z´apis je zjednoduˇsen vynech´an´ım sloˇzen´e z´avorky u jevu {X ≤ x}.) Vˇ eta 1.5 Necht’ F (x) je distribuˇcn´ı funkce n´ahodn´e veliˇciny X. Potom plat´ı (1) 0 ≤ F (x) ≤ 1 pro kaˇzd´e x ∈ R, (2) limx→−∞ F (x) = 0, lim x → ∞F (x) = 1, (3) limh→0+ F (x + h) = F (x), tj. F je zprava spojit´a8 , (4) je-li x1 ≤ x2 , potom F (x1 ) ≤ F (x2 ), tj. F je neklesaj´ıc´ı. 8
V nˇekter´ ych uˇcebnic´ıch se m˚ uˇzete setkat s ponˇekud jinou definic´ı distribuˇcn´ı funkce: F (x) = P (X < x) (s ostrou nerovnost´ı). Takov´ato distribuˇcn´ı funkce potom bude spojit´a zleva.
´ ´ VELICINA ˇ 1.2. NAHODN A
19
Tyto vlastnosti jsou t´eˇz postaˇcuj´ıc´ı pro to, aby dan´a funkce F (x) byla ˇ distribuˇcn´ı funkc´ı nˇejak´e n´ahodn´e veliˇciny. Casto se pouˇz´ıv´a dalˇs´ı vlastnost: pro re´aln´a ˇc´ısla a ≤ b plat´ı P (a < X ≤ b) = P ({X ≤ b} ∩ {X > a}) = P ({X ≤ b} − {X ≤ a}) = P (X ≤ b) − P (x ≤ a) = F (b) − F (a). Distribuˇcn´ı funkce F (x) se naz´ yv´a diskr´ etn´ı, existuje-li koneˇcn´a nebo spoˇ u {xi } a posloupnost kladn´ ych ˇc´ısel pi splˇ nuj´ıc´ıch P cetn´a posloupnost bod˚ e, ˇze i pi = 1 takov´ X F (x) = pi i:xi ≤x
pro libovoln´e re´aln´e ˇc´ıslo x ∈ R. Diskr´etn´ı distribuˇcn´ı funkce m´a schodovit´ y tvar, se skoky velikosti pi v bodech xi . M´a-li n´ahodn´a veliˇcina X diskr´etn´ı distribuˇcn´ı funkci, tj. pi = P (X = xi ), ˇr´ık´ame, ˇze X m´a diskr´ etn´ı rozdˇ elen´ı pravdˇ epodobnosti, struˇcnˇe diskr´ etn´ı rozdˇ elen´ı. Vrat’me se k n´ahodn´emu experimentu, jehoˇz reprezentace je pravdˇepodobnostn´ı prostor (Ω, F, P ). Jestliˇze je mnoˇzina element´arn´ıch v´ ysledk˚ u Ω koneˇcn´a nebo spoˇcetn´a, to znamen´a, ˇze vˇsechny moˇzn´e element´arn´ı v´ ysledky lze seˇradit do posloupnosti Ω = {ωi }∞ ahodn´a veliˇcina X definoi=1 , potom i n´ van´a pro tento experiment m´a nejv´ yˇse spoˇcetnou mnoˇzinu hodnot X(ωi ) = . Pravdˇ epodobnostn´ı rozdˇelen´ı je v tomto xi tvoˇr´ıc´ıch posloupnost {xi }∞ i=1 pˇr´ıpadˇe urˇceno jednoznaˇcnˇe pravdˇepodobnostn´ı m´ırou P , tedy pravdˇepodobnostmi {pi }∞ i=1 , kde pi = P (X = xi ). Typick´ y pr˚ ubˇeh diskr´etn´ı distribuˇcn´ı funkce je na obr. 2.1. Tato funkce je vˇzdy po ˇc´astech konstantn´ı ( schodovit´a“), s hodnotami vˇzdy na lev´e stranˇe ” schodu“ (spojitost zprava). ” Pˇ r´ıklad 1.2.1 Nez´avisle na sobˇe je vyrobena s´erie pˇeti ventil´ator˚ u, pˇriˇcemˇz pravdˇepodobnost toho, ˇze vyroben´y ventil´ator bude vadn´y, je 0, 1. Najdˇete rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny, popisuj´ıc´ı poˇcet vadn´ych v s´erii. ˇ sen´ı: Oznaˇcme Ak = [v s´erii 5 v´ Reˇ yrobk˚ u bude k vadn´ ych]. Pravdˇepodobnost toho, ˇze k v´ yrobk˚ u bude vadn´ ych a (5 − k) v´ yrobk˚ u bude bez vady je – vzhledem k nez´avislosti – rovna souˇcinu 0, 1k 0, 95−k . Kromˇe toho, k vadn´ ych 5 usoby. Tedy v´ yrobk˚ u m˚ uˇze b´ yt mezi 5 vyroben´ ymi rozdˇeleno celkem k zp˚ 5 k (5−k) P (Ak ) = k 0, 1 .0, 9 . V n´asleduj´ıc´ı tabulce jsou uspoˇr´ad´any hodnoty k a pk , k = 1, . . . , 5 a na obr.2.1 je graf pˇr´ısluˇsn´e distribuˇcn´ı funkce.
20
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI i pi
0 0,3277
1 0,4096
2 0,2048
3 0,0512
4 0,0064
5 0,0003
Obr´azek 1.5: Distribuˇcn´ı funkce diskr´etn´ı n´ahodn´e veliˇciny z pˇr´ıkladu 1.2.1. Distribuˇcn´ı funkce F (x) se naz´ yv´a absolutnˇ e spojit´ a, jestliˇze existuje spojit´a nez´aporn´a funkce f (x) naz´ yvan´a hustota pravdˇ epodobnosti, struˇcnˇe hustota, takov´a, ˇze Z x
F (x) =
f (t)dt −∞
pro kaˇzd´e x ∈ R. M´a-li n´ahodn´a veliˇcina X absolutnˇe spojitou distribuˇcn´ı funkci, ˇr´ık´ame, ˇze X m´a spojit´ e rozdˇ elen´ı pravdˇ epodobnosti, struˇcnˇe spojit´ e rozdˇ elen´ı. R Hustota pravdˇepodobnosti f (x) mus´ı splˇ novat rovnost R f (x)dx = 1. Existuje-li derivace F 0 distribuˇcn´ı funkce bodˇe x, potom je F 0 (x) = f (x). Pro a, b ∈ R, a < b, plat´ı Z b P (a < X ≤ b) = F (b) − F (a) = f (t)dt a
Tedy pravdˇepodobnost toho, ˇze spojit´a n´ahodn´a veliˇcina bude m´ıt hodnoty v nˇejak´em intervalu ha, bi je tedy plocha pod kˇrivkou hustoty nad intervalem ha, bi. Jak´a je vlastnˇe interpretace hustoty pravdˇepodobnosti? Pˇredevˇs´ım f (x) nen´ı pravdˇepodobnost jevu {X = x}! Ta je v pˇr´ıpadˇe n´ahodn´ Rex veliˇciny se spojit´ ym rozdˇelen´ım vˇzdy rovna nule. To plyne z P (X = x) = x f (t)dt = 0 pro libovoln´e x ∈ R. Uvaˇzujme interval hx, x + dx), to jest interval re´aln´ ych ˇc´ısel o d´elce dx. Potom pro velmi mal´a dx je pˇribliˇznˇe P (X ∈ hx, x + dx)) = f (x)dx .
´ ´ VELICINA ˇ 1.2. NAHODN A
21
Pˇ r´ıklad 1.2.2 Ukaˇzte, ˇze funkce F (x) = 1 − e−λx , x ≥ 0, F (x) = 0, x < 0, kde λ > 0 je re´aln´y parametr, je distribuˇcn´ı funkc´ı nˇejak´e n´ahodn´e veliˇciny Y se spojit´ym rozdˇelen´ım. Spoˇctˇete P (1 < Y ≤ 2). ˇ sen´ı: Derivace dF (x) = F 0 (x) = λe−λx existuje a je pro x ≥ 0 kladn´a, tedy Reˇ dx F (x) je rostouc´ı funkc´ı pro x ≥ 0. Nav´ıc limx→0+ F (x) = 0 a limx→∞ = 1. Z toho plynou vlastnosti (1)–(4) z vˇety 1.5 a tedy F (x) je podle pozn´amky za vˇetou 1.5 distribuˇcn´ı funkc´ı nˇejak´e n´ahodn´e veliˇciny Y . Odpov´ıdaj´ıc´ı hustota je f (x) = F 0 (x) = λe−λx , x ≥ 0, f (x) = 0, x < 0 zˇrejmˇe spojit´a funkce. R2 D´ale je P (1 < Y ≤ 2) = λ 1 e−λx dx = 1 − e−2λ − 1 + e−λ = 0, 117.
Obr´azek 1.6: Distribuˇcn´ı funkce (nahoˇre) a hustota (dole) n´ahodn´e veliˇciny z pˇr´ıkladu 1.2.2.
Pozn´amka: V dalˇs´ım v´ ykladu se budeme zab´ yvat pˇredevˇs´ım dvˇema zaveden´ ymi tˇr´ıdami n´ahodn´ ych veliˇcin, tzn. se spojit´ ym a diskr´etn´ım rozdˇelen´ım. Samozˇrejmˇe mohou existovat i n´ahodn´e veliˇciny, kter´e maj´ı sm´ıˇsen´ y charakter. Napˇr´ıklad pˇri mˇeˇren´ı doby do poruchy sloˇzit´eho zaˇr´ızen´ı je tˇreba v nˇekter´ ych pˇr´ıpadech uvaˇzovat kladnou pravdˇepodobnost, ˇze se zaˇr´ızen´ı v˚ ubec nepodaˇr´ı uv´est do chodu. Tomu m˚ uˇze odpov´ıdat distribuˇcn´ı funkce kter´a je nulov´a pro z´aporn´a x, absolutnˇe spojit´a a rostouc´ı pro x > 0 a se skokem v bodˇe x = 0.
22
1.2.2
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Z´ akladn´ı charakteristiky n´ ahodn´ ych veliˇ cin
N´ahodn´a veliˇcina je funkce n´ahodn´ ych jev˚ u. V jist´em smyslu si ji m˚ uˇzeme pˇredstavovat jako ˇc´ıselnou reprezentaci v´ ysledk˚ u n´ahodn´eho pokusu. Pr´ace s n´ahodn´ ymi veliˇcinami se vˇsak v´ yraznˇe odliˇsuje od pr´ace s matematick´ ymi funkcemi jako je sinus, exponenciela nebo mocnina. Na rozd´ıl od matematick´ ych funkc´ı nelze napˇr´ıklad nakreslit graf n´ahodn´e veliˇciny. Nelze stanovit jej´ı pr˚ ubˇeh nebo limitu. Lze pouze stanovit jej´ı pravdˇ epodobnostn´ı charakteristiky. Pravdˇepodobnostn´ı vlastnosti n´ahodn´e veliˇciny jsou plnˇe pops´any jej´ı distribuˇcn´ı funkc´ı. Pomoc´ı distribuˇcn´ı funkce lze urˇcit rozdˇelen´ı pravdˇepodobnosti {pi }∞ r´ıpadˇe diskr´etn´ı n´ahodn´e veliˇciny nebo hustotu f (x) v pˇr´ıpadˇe i=1 v pˇ spojit´e n´ahodn´e veliˇciny. To plat´ı i obr´acenˇe: zn´ame-li rozdˇelen´ı pravdˇepodobuˇzeme naj´ıt distribuˇcn´ı funkci F (x). nosti {pi }∞ i=1 nebo hustotu f (x), m˚ Kromˇe tˇechto charakteristik se ˇcasto pouˇz´ıvaj´ı i dalˇs´ı, mezi nˇeˇz patˇr´ı pˇredevˇs´ım momenty a kvantily. K-t´ y obecn´ y moment EX k n´ahodn´e veliˇciny X s diskr´etn´ım resp. spojit´ ym rozdˇelen´ım je hodnota Z ∞ ∞ X k k k E(X ) = xi pi , resp. E(X ) = xk f (x)dx. i=1
−∞
ˇ Casto budeme ps´at struˇcnˇeji pouze EX k (bez z´avorek). V´ yznamnou u ´lohu hraje prvn´ı obecn´ y moment E(X), kter´ y se naz´ yv´a stˇ redn´ı hodnota n´ahodn´e veliˇciny X (nˇekdy se m˚ uˇzete setkat i s n´azvem oˇ cek´ avan´ a hodnota). Pomoc´ı nˇeho jsou definov´any takzvan´e centr´ aln´ı momenty. K-t´ y centr´ aln´ı moment µk (X) n´ahodn´e veliˇciny X (s diskr´etn´ım nebo spojit´ ym rozdˇelen´ım) je hodnota µk (X) = E(X − E(X))k . Opˇet se ponˇekud liˇs´ı v´ ypoˇcet centr´aln´ıch moment˚ u pro diskr´etn´ı resp. spojitou n´ahodnou veliˇcinu: Z ∞ ∞ X n k k E(X −EX) = (xi −EX) pi , resp. E(X −EX) = (x−EX)k f (x)dx. i=1
−∞
Nejˇcastˇeji pouˇz´ıvan´ ym centr´aln´ım momentem je druh´ y centr´aln´ı moment, kter´ y se naz´ yv´a rozptyl n´ahodn´e veliˇciny X a ozanˇcuje se speci´aln´ım symbolem V ar(X). Druh´a odmocnina rozptylu je naz´ yv´ana smˇ erodatnou odchylkou n´ahodn´e veliˇciny X a budeme ji obvykle oznaˇcovat σ(X).
´ ´ VELICINA ˇ 1.2. NAHODN A
23
Znalost vˇsech moment˚ u (obecn´ ych nebo centr´aln´ıch) pro k = 1, 2, . . . je opˇet ekvivalentn´ı znalosti distribuˇcn´ı funkce a pod´av´a n´am plnou informaci o n´ahodn´e veliˇcinˇe. Pˇ r´ıklad 1.2.3 N´ahodn´a veliˇcina X m˚ uˇze nab´yvat nez´aporn´ych celoˇc´ıseln´ych k hodnot k = 0, 1, . . . s pravdˇepodobnostmi pk = P (X = k) = e−λ λk! . Spoˇctˇete stˇredn´ı hodnotu a rozptyl n´ahodn´e veliˇciny X. ˇ sen´ı: Protoˇze veliˇcina X nab´ Reˇ yv´a pouze spoˇcetnˇe mnoha hodnot, jedn´a se o veliˇcinu tn´ı. Pro jej´P ı stˇredn´ı hodnotu tedy ı P∞ plat´ P∞diskr´e−λ ∞ λk λk−1 λk −λ −λ EX = k=0 ke k! = e k=1 k k! = λe k=1 (k−1)! = λ. Podobnˇe pro rozptyl P P 2 −λ λk 2 2 λk V ar(X) = E(X − EX)2 = ∞ = e−λ ∞ k=0 (k − λ) e k=0 (k − 2kλ + λ ) k! . k! Po kr´atk´em poˇc´ıt´an´ı a u ´prav´ach se dostaneme k v´ ysledku V ar(X) = λ. Rozdˇelen´ı t´eto n´ahodn´e veliˇciny se naz´ yv´a Poissonovo a budeme se j´ım jeˇstˇe zab´ yvat pozdˇeji. Pˇri v´ ypoˇctu moment˚ u n´ahodn´e veliˇciny se pouˇz´ıv´a funkcion´al E, kter´ y je line´arn´ı, to znamen´a, ˇze pro libovoln´e n´ahodn´e veliˇciny X a Y a konstantu k ∈ R plat´ı: – E(X + Y ) = E(X) + E(Y ) (aditivita) – E(kX) = kE(X) (homogenita). Tyto vlastnosti jsou zˇrejm´e, kdyˇz si uvˇedom´ıme, ˇze funkcion´al E je vyj´adˇren bud’ jako souˇcet v diskr´etn´ım pˇr´ıpadˇe, nebo ve formˇe integr´alu ve spojit´em pˇr´ıpadˇe. Z druh´e vlastnosti pˇr´ımo plyne, ˇze E(k) = k. Speci´alnˇe lze uveden´e vlastnosti interpretovat jako vlastnosti stˇredn´ı hodnoty. Uvˇedom´ıme-li si, ˇze EX je ˇc´ıslo (nikoli funkce) a s vyuˇzit´ım linearity stˇredn´ı hodnoty lze pro rozptyl snadno odvodit tyto uˇziteˇcn´e vlastnosti: – V ar(X) = E(X − EX)2 = E(X 2 − 2XEX + (EX)2 ) = EX 2 − 2(EX)2 + (EX)2 = EX 2 − (EX)2 , – V ar(kX + q) = k 2 V ar(X) pro libovoln´e konstanty k, q. Prvn´ı vlastnost se ˇcasto vyuˇz´ıv´a pˇri v´ ypoˇctu rozptylu. Vˇsimnˇete si nav´ıc, ˇze tato vlastnost vlastnˇe vyjadˇruje vztah mezi druh´ ym centr´aln´ım momentem a prvn´ımi dvˇema obecn´ ymi momenty n´ahodn´e veliˇciny. Toto zjiˇstˇen´ı lze zobecnit a m˚ uˇzeme tvrdit, ˇze libovoln´ y k-t´ y centr´aln´ı moment lze vyj´adˇrit pouze pomoc´ı prvn´ıch k obecn´ ych moment˚ u. Pˇ r´ıklad 1.2.4 Vyj´adˇrete ˇctvrt´y centr´aln´ı moment n´ahodn´e veliˇciny X pomoc´ı jej´ıch prvn´ıch ˇctyˇr obecn´ych moment˚ u. ˇ sen´ı: µ4 (X) = E(X −EX)4 = E(X 4 −4X 3 EX +8X 2 (EX)2 −4X(EX)3 + Reˇ (EX)4 ) = EX 4 − 4EX 3 EX + 8EX 2 (EX)2 − 3(EX)4
24
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Pˇ r´ıklad 1.2.5 N´ahodn´a veliˇcina X m´a hustotu rozdˇelen´ı pravdˇepodobnosti f (x) = λe−λx , x ≥ 0, f (x) = 0 jinak. Spoˇctˇete jej´ı obecn´e momenty. ˇ sen´ı: X je spojit´a n´ahodn´a veliˇcina (jej´ı rozdˇelen´ı pravdˇepodobnosti je Reˇ d´ano hustotou) pro v´ ypoˇcet pouˇzijeme integr´al R ∞ na proto n −λx EX = λ R0 x e dx, kter´ y substituc´ı λx = t, λdx = dt pˇrevedeme na ∞ v´ yrazu je zn´am jako takzvan´a Gama integr´al λ1n 0 tn e−t dt. Integr´al v tomto R ∞ x−1 funkce definovan´a vztahem Γ(x) = 0 t e−t dt, x > 0. Pro funkci Γ(x) plat´ √ ı 1 nˇekolik vztah˚ u, mezi jin´ ymi t´eˇz Γ(x + 1) = xΓ(x), Γ(1) = 1, Γ( 2 ) = π. V naˇsem pˇr´ıpadˇe tedy dost´av´ame EX n = Γ(n+1) = λn!n . λn N´asleduj´ıc´ı vˇeta popisuje vztah mezi stˇredn´ı hodnotou a rozptylem n´ahodn´e veliˇciny. ˇ Vˇ eta 1.6 (Cebyˇ sevova nerovnost) Necht’ n´ahodn´a veliˇcina X m´a koneˇcn´y druh´y moment. Potom pro libovoln´e > 0 plat´ı P (|X − EX| ≥ ) ≤
V ar(X) . 2
ˇ Casto se pracuje s takzvan´ ymi normovan´ ymi momenty. Jsou to vlastnˇe obecn´e momenty normovan´ e n´ ahodn´ e veliˇ ciny U = X−E(X) . Tedy k-t´ y σ(X) normovan´ y moment n´ahodn´e veliˇciny X je νk (X) = E(U k ). V´ ypoˇcet normovan´ ych moment˚ u pro diskr´etn´ı resp. spojitou n´ahodnou veliˇcinu je n´asleduj´ıc´ı: k X k k Z ∞ ∞ xi − EX x − EX X − EX = pi , resp. f (x)dx. E σ(X) σ(X) σ(X) −∞ i=1 Z normovan´ ych moment˚ u n´ahodn´e veliˇciny jsou d˚ uleˇzit´e ν3 a ν4 , kter´e popisuj´ı tvar jej´ıho rozdˇelen´ı. Normovan´ y moment ν3 se naz´ yv´a koeficient ˇ sikmosti a je m´ırou symetrie rozdˇelen´ı. Koeficient ˇsikmosti je roven nule napˇr´ıklad pro n´ahodn´e veliˇciny, jejichˇz rozdˇelen´ı pravdˇepodobnosti je symetrick´e kolem stˇredn´ı hodnoty, je kladn´ y pro jednovrcholov´e hustoty ˇsikm´e zprava (obr.1.7), naopak z´aporn´ y pro jednovrcholov´e hustoty ˇsikm´e zleva. Normovan´ y moment ν4 je naz´ yv´an koeficientem ˇ spiˇ catosti nebo tak´e kurtoze a je m´ırou toho, jak rychle kles´a pravdˇepodobnost extr´emn´ıch hodnot (smˇerem k −∞ nebo do +∞).
´ ´ VELICINA ˇ 1.2. NAHODN A
25
Obr´azek 1.7: Hustoty nesymetrick´ ych rozdˇelen´ı a jejich koeficienty ˇsikmosti.
Pˇri studiu chov´an´ı n´ahodn´e veliˇciny si zpravidla klademe ot´azku: jak´a je pravdˇepodobnost α, ˇze sledovan´a n´ahodn´a veliˇcina X nepˇrekroˇc´ı pˇredem ˇ danou hodnotu x? Casto je vˇsak kladena i opaˇcn´a ot´azka: jakou hodnotu x nepˇrekroˇc´ı sledovan´a n´ahodn´a veliˇcina s pˇredem danou pravdˇepodobnost´ı α? Odpovˇed’ n´am d´avaj´ı kvantily rozdˇ elen´ı n´ ahodn´ e veliˇ ciny, kter´e tvoˇr´ı dalˇs´ı d˚ uleˇzitou skupinou charakteristik n´ahodn´e veliˇciny. Mˇejme nˇejak´e 0 < α < 1. Potom α-kvantilem n´ahodn´e veliˇciny X naz´ yv´ame takovou nejvˇetˇs´ı hodnotu xα , pro kterou je P (X ≤ xα ) ≤ α. M´a-li n´ahodn´a veliˇcina X absolutnˇe spojitou distribuˇcn´ı funkci F (x), kter´a je rostouc´ı pro ta x, pro kter´a 0 < F (x) < 1, potom existuje xα takov´e, ˇze P (X ≤ xα ) = α a je xRα = F −1 (α), kde F −1 je inverzn´ı funkce k F . Vyj´adˇreno xα pomoc´ı hustoty f je −∞ f (x)dx = α, viz obr.1.8. Pravdˇepodobnost se ˇcasto vyjadˇruje v procentech. Potom budeme hovoˇrit o 100α%-kvantilu n´ahodn´e veliˇciny. Podobnˇe jako v pˇr´ıpadˇe moment˚ u i zde plat´ı tvrzen´ı, ˇze zn´ame-li vˇsechny α-kvantily n´ahodn´e veliˇciny X pro vˇsechna α ∈ h0, 1i, potom m´ame u ´plnou informaci o jej´ım pravdˇepodobnostn´ım chov´an´ı. Mezi vˇsemi kvantily m´a v´ yznamn´e postaven´ı 50%-kvantil, kter´ y budeme oznaˇcovat x0,5 a budeme jej naz´ yvat medi´ an M e(X) n´ahodn´e veliˇciny X. Medi´an se tak´e nˇekdy naz´ yv´a prostˇredn´ı hodnota z hlediska pravdˇepodobnosti, nebot’ pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X nabyde hodnoty menˇs´ı neˇz M e(X) je rovna 0,5 coˇz je stejn´a hodnota jako pravdˇepodobnost, ˇze X bude m´ıt hodnotu vˇetˇs´ı neˇz M e(X). Vedle stˇredn´ı hodnoty je to dalˇs´ı takzvan´a charakteristika polohy n´ahodn´e veliˇciny X.
26
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Obr´azek 1.8: Vztah mezi pravdˇepodobnost´ı α a α-kvantilem xα . Pˇ r´ıklad 1.2.6 Urˇcete medi´an n´ahodn´e veliˇciny s hustotou f (x) = 0 pro x < 0 a f (x) = λe−λx pro x ≥ 0. R ˇ sen´ı: Medi´an je takov´a hodnota x, pro kterou m´a platit, ˇze x f (t)dt = Reˇ −∞ R∞ R x −λt −λx f (t)dt = 0, 5. Tedy v naˇ s em pˇ r ´ ıpadˇ e λe dt = 1 − e = 0, 5 a odtud x 0 ln2 dostaneme M e(X) = λ . Pˇri anal´ yze dat se ˇcasto pouˇz´ıvaj´ı takzvan´e kvartily. To jsou 25%, 50% a 75% kvantily. Pˇritom 25%-kvantil se naz´ yv´a doln´ı kvartil, 50%-kvantil je jiˇz zm´ınˇen´ y medi´an a 75%-kvantil je horn´ı kvartil. Spolu s minimem a maximem se tˇemto charakteristik´am ˇr´ık´a pˇet Tukeyho charakteristik podle zakladatele takzvan´e pr˚ uzkumov´e anal´ yzy dat“, americk´eho statistika Johna ” Tukeye. Ve statistice se d´ale pracuje s takzvan´ ym horn´ım a doln´ım 5%-kvantilem. To jsou 5%- a 95%-kvantily. Podobnˇe se m˚ uˇzete setkat i s pojmem horn´ı nebo doln´ı decil – tedy 10%- nebo 90%-kvantil.
Kromˇe jiˇz zm´ınˇen´ ych pravdˇepodobnostn´ıch charakteristik n´ahodn´e veliˇciny se pouˇz´ıvaj´ı i dalˇs´ı, kter´e nepatˇr´ı ani do jedn´e z uveden´ ych skupin. Takovou
´ ´ VELICINA ˇ 1.2. NAHODN A
27
charakteristikou je napˇr´ıklad Modus M o(X) n´ahodn´e veliˇciny X. Je to hodnota x, v n´ıˇz m´a spojit´a, resp. diskr´etn´ı n´ahodn´a veliˇcina lok´aln´ı extr´em hustoty resp. posloupnosti pravdˇepodobnost´ı pi . Rozdˇelen´ı s jedin´ ym lok´aln´ım extr´emem se naz´ yvaj´ı jednovrcholov´ a. V diskr´etn´ım pˇr´ıpadˇe jednovrcholov´eho rozdˇelen´ı lze modus interpretovat jako nejpravdˇepodobnˇejˇs´ı hodnotu n´ahodn´e veliˇciny X. Existuje vˇsak ˇrada pˇr´ıpad˚ u, kdy modus nelze jednoznaˇcnˇe urˇcit. V teorii spolehlivosti, zab´ yvaj´ıc´ı se pravdˇepodobnost´ı bezporuchov´eho chodu zaˇr´ızen´ı, se vedle distribuˇcn´ı funkce pouˇz´ıv´a tak´e funkce spolehlivosti9 R(t), definovan´a n´asleduj´ıc´ım zp˚ usobem: Je-li F (t) distribuˇcn´ı funkce n´ahodn´e veliˇciny T , popisuj´ıc´ı dobu do poruchy zaˇr´ızen´ı, potom funkce spolehlivosti je rovna R(t) = 1 − F (t). Tedy zat´ımco F (t) je pravdˇepodobnost toho, ˇze se zaˇr´ızen´ı porouch´a do doby t, R(t) je pravdˇepodobnost toho, ˇze zaˇr´ızen´ı pˇreˇzije“ dobu t. ” Dalˇs´ı charakteristikou, pouˇz´ıvanou ve spolehlivosti, je intenzita poruch10 f (t) . Jej´ı interpretace je n´asleduj´ıc´ı: h(t), kter´a je definov´ana jako h(t) = 1−F (t) pro mal´e hodnoty dt souˇcin h(t)dt ud´av´a pˇribliˇznˇe podm´ınˇenou pravdˇepodobnost toho, ˇze se zaˇr´ızen´ı neporouch´a v nejbliˇzˇs´ım ˇcasov´em intervalu d´elky dt, pokud se neporouchalo do doby t.
9
nebo t´eˇz funkce pˇ reˇ zit´ı. V literatuˇre se m˚ uˇzete setkat i s n´ azvem rizikov´ a funkce, anglicky hazard function, pˇredevˇs´ım v souvislosti s anal´ yzou doby pˇreˇz´ıv´an´ı. 10
28
1.3
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Pravdˇ epodobnostn´ı modely
Aplikace matematick´ ych metod pˇri popisu re´aln´eho svˇeta pouˇz´ıv´a matematick´e modely. Stejnˇe je tomu i v pˇr´ıpadˇe teorie pravdˇepodobnosti. V re´aln´em svˇetˇe kolem n´as existuje ˇrada standardn´ıch situac´ı, kter´e maj´ı cosi spoleˇcn´eho. Za cenu jist´eho zjednoduˇsen´ı a zanedb´an´ı nˇekter´ ych nepodstatn´ ych okolnost´ı jsme schopni tyto situace popsat pomoc´ı matematick´ ych symbol˚ u a vytvoˇrit matematick´ y model. Ten potom slouˇz´ı ke studiu chov´an´ı, z´avislost´ı, pˇredpov´ıd´an´ı budouc´ıch jev˚ u, a odhad˚ u r˚ uzn´ ych parametr˚ u. Podle stupnˇe zobecnˇen´ı dost´av´ame v´ıce ˇci m´enˇe sloˇzit´e modely. Neexistuje ide´aln´ı model11 Zde uveden´e pravdˇepodobnostn´ı modely popisuj´ı ˇradu standardn´ıch situac´ı, se kter´ ymi se m˚ uˇzeme setkat. Tak napˇr´ıklad h´azen´ı minc´ı. Samozˇrejmˇe si lze pˇredstavit, jak z dlouh´e chv´ıle h´az´ıme minc´ı a sledujeme co n´am padne. Lze si pˇredstavit i hazardn´ı hru, zaloˇzenou na h´azen´ı minc´ı. Ale mnohem praktiˇctˇejˇs´ı varianta tohoto standardn´ıho modelu je napˇr´ıklad zkouˇska jistiˇce. Pˇri kaˇzd´em pokusu bud’ sepne nebo nesepne. Zkouˇs´ıme jej tak dlouho, dokud nenastane prvn´ı porucha. Nebo vyb´ır´an´ı ˇcern´ ych a b´ıl´ ych koul´ı z urny. To je obl´ıben´a z´abava ve stˇredoˇskolsk´ ych uˇcebnic´ıch pravdˇepodobnosti. Dokonce i ve sb´ırk´ach u ´loh z teorie pravdˇepodobnosti pro vysok´e ˇskoly. Proˇc se m´ame zab´ yvat takovou naprosto absurdn´ı z´abavou? Pokud si ale nam´ısto ˇcern´ ych a b´ıl´ ych koul´ı v urnˇe pˇredstav´ıme v´ yrobky, napˇr´ıklad p´ıstky do kompresoru, ter´e bud’ odpov´ıdaj´ı poˇzadavk˚ um odbˇeratele nebo vykazuj´ı nˇejakou vadu (rozmˇery mimo toleranci nebo nepˇr´ıpustn´a drsnost povrchu) a jsou dod´any v kontejneru, ze kter´eho n´ahodnˇe vybereme urˇcit´ y poˇcet a zkoum´ame jeho 12 kvalitu , jedn´a se o stejn´ y model o jehoˇz praktiˇcnosti uˇz nepochybujeme. Klasick´ ym pˇr´ıpadem je model norm´aln´ıho rozdˇelen´ı, ke kter´emu v minulosti doˇslo nˇekolik matematik˚ u v r˚ uzn´ ych dob´ach nez´avisle na sobˇe a ’ v r˚ uzn´ ych souvislostech. At uˇz zkoumali v´ yˇsku branc˚ u pro kr´alovskou arm´adu nebo polohu nebesk´ ych tˇeles ˇci pohyb molekul, vˇzdy se dostali k t´emuˇz modelu. Kaˇzd´ y pravdˇepodobnostn´ı model pˇredstavuje urˇcit´ y typ n´ahodn´eho pokusu, se kter´ ym je spojena sledovan´a n´ahodn´a veliˇcina a nˇejak´e standardn´ı rozdˇelen´ı pravdˇepodobnosti. Tato rozdˇelen´ı zpravidla z´avis´ı na r˚ uzn´em poˇctu parametr˚ u. Pochopen´ı tˇechto model˚ u a v´ yznamu jejich parametr˚ u je velmi d˚ uleˇzit´e pro aplikaci pravdˇepodobnostn´ıch metod v praktick´ ych u ´loh´ach. N´asleduj´ıc´ı pˇrehled pravdˇepodobnostn´ıch model˚ u nen´ı zdaleka vyˇcerp´avaj´ıc´ı. Uv´ad´ıme zde pouze ty nejz´akladnˇejˇs´ı, nejˇcastˇeji pouˇz´ıvan´e modely . 11
Jak napsal zakladatel kybernetiky, Norbert Wiener: nejlepˇs´ım modelem koˇcky je ” koˇcka“ a dodal: a nejl´epe ta sam´a“. ” 12 Ve statistice tomu ˇr´ık´ ame statistick´a pˇrej´ımka“. ”
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
1.3.1
29
Diskr´ etn´ı modely
Model diskr´ etn´ıho rovnomˇ ern´ eho rozdˇ elen´ı U (n). Uvaˇzujme n´ahodn´ y pokus, kter´ y m˚ uˇze skonˇcit koneˇcn´ ym poˇctem n stejnˇe moˇzn´ ych v´ ysledk˚ u Ω = {ω1 , ω2 , . . . , ωn }. Nem´ame d˚ uvod domn´ıvat se, ˇze nˇekter´ y v´ ysledek m´a vˇetˇs´ı nadˇeji nastat neˇz jin´ y. v takov´em pˇr´ıpadˇe budou m´ıt vˇsechny stejych v´ ysledk˚ u n je parametrem tonou pravdˇepodobnost p = n1 . Poˇcet moˇzn´ hoto rozdˇelen´ı. V nˇekter´ ych pˇr´ıpadech m´a smysl definovat n´ahodnou veliˇcinu X(ωk ) = xk . Potom Pravdˇepodobnostn´ı funkce : pk = P (X P = xk ) = n1 , k = 1, 2, . . . , n n Z´akladn´ı charakteristiky : E(X) = n1 P ¯ (aritmetick´ y pr˚ umˇer) i=1 xi = x V ar(X) = n1 ni=1 x2i − x¯2 Pˇ r´ıklad 1.3.1 Pˇredstavme si deset pˇr´ıstroj˚ u, napˇr´ıklad mobiln´ıch telefon˚ u. Vybereme n´ahodnˇe jeden z nich. v takov´emto pˇr´ıpadˇe m˚ uˇzeme definovat n´ahodnou veliˇcinu r˚ uzn´ ym zp˚ usobem. Pokud veliˇcina X = [v´ yrobn´ı ˇc´ıslo telefonu], potom zˇrejmˇe nem´a smysl poˇc´ıtat stˇredn´ı hodnotu ani rozptyl. Jin´a situace je, uvaˇzujeme-li n´ahodnou veliˇcinu Y = [cena pˇr´ıstroje]. v tomto pˇr´ıpadˇe stˇredn´ı neboli oˇcek´avan´a hodnota je pr˚ umˇern´a cena spoˇcten´a z cen vˇsech deseti pˇr´ıstroj˚ u. To m´a sv˚ uj v´ yznm napˇr´ıklad chceme-li dopˇredu (pˇred v´ ybˇerem) zn´at alespoˇ n orientaˇcnˇe v´ yslednou cenu vybran´eho pˇr´ıstroje. M˚ uˇzete nam´ıtnout, co je to za n´ahodnou veliˇcinu, kdyˇz ceny pˇr´ıstroj˚ u jsou pˇredem jednoznaˇcnˇe dan´e. Nahodilost je zde opˇet tˇreba ch´apat z hlediska toho, kdo prov´ad´ı experiment: ten dopˇredu nev´ı, kter´ y z pˇr´ıstroj˚ u vybere a jak´a bude jeho cena. Stˇredn´ı hodnota nav´ıc vypov´ıd´a o cenˇe vybran´eho pˇr´ıstroje v´ıce v pˇr´ıpadˇe, ˇze se ceny jednotliv´ ych pˇr´ıstroj˚ u pˇr´ıliˇs neliˇs´ı. Jestliˇze se ceny pohybuj´ı od nˇekolika set korun do des´ıtek tis´ıc korun, potom n´am zˇrejmˇe stˇredn´ı hodnota mnoho informace nepˇrinese. Proto je tˇreba u ´daj o stˇredn´ı hodnotˇe doplnit u ´dajem o rozptylu nebo alespoˇ n smˇerodatn´e odchylce. Alternativn´ı model Alt(p). N´ahodn´ y pokus v tomto modelu m˚ uˇze skonˇcit pouze dvˇemi v´ ysledky. Nˇekdy se takov´emu pokusu tak´e ˇr´ık´a Bernoulliovsk´y13 . N´ahodnou veliˇcinu zde definujeme takto: jednomu v´ ysledku – v tomto modelu jej budeme oznaˇcovat jako u ´spˇech“ – pˇriˇrad´ıme hodnotu X = 1 a ” 13
Podle nejstarˇs´ıho ze savn´e rodiny ˇsv´ ycarsk´ ych matematik˚ u, Jacoba Bernoulli (27.12.1654 – 16.8.1705).
30
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
pravdˇepodobnost P (X = 1) = p; druh´ y v´ ysledek – ne´ uspˇech – bude m´ıt ˇc´ıselnou hodnotu 0 a nastane s pravdˇepodobnost´ı P (X = 0) = 1 − p. Hodnota p je parametrem tohoto modelu, kter´ y odpov´ıd´a pˇribliˇznˇe pomˇeru poˇctu u ´spˇech˚ u k poˇctu ne´ uspˇech˚ u pˇri velk´em poˇctu opakov´an´ı alternativn´ıho pokusu. Pokud n´ahodn´a veliˇcina bude odpov´ıdat tomuto modelu, budeme to vyj´adˇrovat struˇcnˇe X ≈ Alt(p). Pravdˇepodobnostn´ı funkce : p0 = P (X = 0) = 1 − p, p1 = P (X = 1) = p Z´akladn´ı charakteristiky : E(X) = 0.(1 − p) + 1.p = p V ar(X) = p − p2 = p.(1 − p) Pˇ r´ıklad 1.3.2 Ochrana parn´ıho turbogener´atoru neodpoj´ı pˇr´ıvod p´ary a t´ım neodstav´ı turb´ınu v pˇr´ıpadˇe poruchy, spoˇc´ıvaj´ıc´ı v pˇrekroˇcen´ı povolen´e u ´rovnˇe −4 vibrac´ı rotoru s pravdˇepodobnost´ı p = 7, 6.10 . Jedn´a se o alternativn´ı model, v nˇemˇz u ´spˇechem“ je nezastaven´ı turbo” gener´atoru v pˇr´ıpadˇe poruchy. Stˇredn´ı hodnota, parametr p zde ˇr´ık´a, ˇze lze oˇcek´avat, ˇze pˇri dlouh´em provozu za pˇribliˇznˇe stejn´ ych podm´ınek tento pˇr´ıpad nastane pˇribliˇznˇe v jednom z 1316 pˇr´ıpad˚ u poruchy (= p1 ). Pokud by k t´eto poruˇse doch´azelo v pr˚ umˇeru ˇctyˇrikr´at do roka, potom by selh´an´ı bezpeˇcnostn´ı funkce ochran selhalo pˇribliˇznˇe jednou za 329 let. Binomick´ y model Bin(n, p). Budeme-li opakovat Bernoulliovsk´e pokusy n-kr´at nez´avisle na sobˇe, bude n´as zaj´ımat poˇcet u ´spˇech˚ u“ pˇri tˇechto n ” pokusech. Kdyˇz oznaˇc´ıme v´ ysledky jednotliv´ y ch Bernoulliovsk´ ych pokus˚ u Pn jako Xi ≈ Alt(p), i = 1, . . . , n a poloˇz´ıme Y = i=1 Xi , potom Y pˇredstavuje poˇcet v´ yskyt˚ u jevu {X = 1} v n opakov´an´ıch. Y m˚ uˇze nab´ yvat hodnot 0, 1, . . . , n. Pravdˇepodobnostn´ı funkce : pk = P (Y = k) = nk pk .(1 − p)(n−k) , k = 0, . . . , n Z´akladn´ı charakteristiky : E(X) = n.p V ar(X) = n.p.(1 − p) Odvozen´ı pravdˇepodobnostn´ı funkce bylo naznaˇceno v P ˇreˇsen´ı pˇ r´ıkladu 1.2.1. Tvar t´eto funkce pˇripom´ın´a binomickou vˇetu (p+q)n = nk=0 nk pk .q (n−k) pro libovoln´a re´aln´a ˇc´ısle p, q a pˇrirozen´e n. Dosad´ıme-li za q = 1 − p, dost´av´ame dkaz Pn toho, ˇze {pk } opravdu tvoˇr´ı pravdˇepodobnostn´ı rozdˇelen´ı, neboli ˇze k=0 pk = 1. Binomick´ y model lze tak´e interpretovat jako poˇcet vybran´ ych prvk˚ u s urˇcitou vlastnost´ı pˇri n´ahodn´em v´ ybˇeru z celkov´eho poˇctu n prvk˚ u s vracen´ım. N´ ahodn´ ym v´ ybˇ erem rozum´ıme takov´ y v´ ybˇer z koneˇcn´eho souboru prvk˚ u, pˇri kter´em m´a kaˇzd´ y prvek stejnou pravdˇepodobnost b´ yt vybr´an (rovnomˇern´e rozdˇelen´ı pravdˇepodobnosti v´ ybˇeru).
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
31
Pˇ r´ıklad 1.3.3 V urnˇe je pˇet b´ıl´ych a tˇri ˇcern´e koule14 . Postupnˇe vyb´ır´ame tˇri koule s vracen´ım (to znamen´a, ˇze po kaˇzd´em v´ybˇery kouli vr´at´ıme zpˇet do urny). Jak´a je pravdˇepodobnost toho, ˇze ve v´ybˇeru bude nejv´yˇse jedna ˇcern´a koule? ˇ sen´ı: Kaˇzd´ Reˇ y v´ ybˇer koule pˇredstavuje jeden alternativn´ı pokus s pravdˇepodobnost´ı p = 83 pro vytaˇzen´ı ˇcern´e koule. Vzhledem k tomu, ˇze koule vrac´ıme zpˇet, tato pravdˇepodobnost se v pr˚ ubˇehu experimentu (= vytahov´an´ı tˇr´ı koul´ı) nemˇen´ı. T´ım dost´av´ame binomick´ y model s n = 3 a p = 83 s mnoˇzinou element´arn´ıch v´ ysledk˚ u Ω = {0, 1, 2, 3} a podle binomick´eho rozdˇelen´ı pravdˇe k (3−k) podobnosti je P (ve v´ ybˇeru budek ˇcern´ ych koul´ı) = P (Y = k) = k3 38 85 , k = 0, . . . , 3. Jev ˇze ve v´ ybˇeru nebude v´ıce neˇz jedna ˇcern´a sest´av´a ze dvou element´arn´ıch v´ ysledk˚ u {0, 1}. Proto hledan´a pravdˇepodobnost je P (Y = 2 53 0) + P (Y = 1) = 8 + 3 83 58 = 175 256 Geometrick´ y model Geom(p) Prov´adˇejme Bernoulliovsk´ y pokus se dvˇema moˇzn´ ymi v´ ysledky, kter´e nazveme u ´spˇech a ne´ uspˇech,˙ tak dlouho, dokud ne˙ ’ nastane prvn´ı u ´spˇechNecht pravdˇepodobnost u ´spˇechu je p. Poˇcet nez´avisl´ ych opakov´an´ı pokusu pˇredch´azej´ıc´ıch prvn´ımu u ´spˇechu je n´ahodn´a veliˇcina X s geometrick´ ym rozdˇ elen´ım. Pravdˇepodobnostn´ı funkce : pk = P (X = k) = (1 − p)k .p, k = 0, . . . , n Z´akladn´ı charakteristiky : E(X) = 1−p p V ar(X) = 1−p p2 V geometrick´em modelu lze definovat tak´e veliˇcinu Y jako poˇcet pokus˚ u, potˇrebn´ ych k prvn´ımu u ´spˇechu. Charakteristiky veliˇciny Y je n´asleduj´ıc´ı Pravdˇepodobnostn´ı funkce : pYm = P (Y = m) = (1−p)( m−1).p, m = 1, . . . , n Z´akladn´ı charakteristiky : E(Y ) = p1 V ar(Y ) = 1−p p2 Veliˇcina X se tak´e nˇekdy oznaˇcuje jako diskr´etn´ı doba do poruchy“, ” vyjadˇruj´ıc´ı poˇcet z´atˇeˇzov´ych cykl˚ u , kter´e zaˇr´ızen´ı vydrˇz´ı, neˇz se porouch´a, pˇriˇcemˇz pravˇepodobnost poruchy pˇri kaˇzd´em cyklu je stejn´a a je rovna p. Pˇ r´ıklad 1.3.4 Po elektrick´em jistiˇci se poˇzaduje, aby s pravdˇepodobnost´ı 0,98 vydrˇzel v´ıce neˇz 500 sepnut´ı. Jak´a m˚ uˇze b´yt maxim´aln´ı pravdˇepodobnost selh´an´ı pˇri jednom sepnut´ı? ˇ sen´ı: Budeme pˇredpokl´adat, ˇze jednotliv´a sepnut´ı jsou nez´avisl´e jevy a Reˇ pravdˇepodobnost selh´an´ı se nemˇen´ı v ˇcase. Potom m˚ uˇzeme tuto situaci popsat geometrick´ ym modelem, pˇriˇcemˇz pravdˇepodobnost pˇreˇzit´ı 500 sepnut´ı je 14
... uˇz je to tady!
32
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
P k rovna P (X ≥ 500) = ∞ zit´ım vlastnosti pravdˇepodobk=501 (1 − p) .p. S vyuˇ nostn´ıho rozdˇelen´ı a vzorce pro ˇc´asteˇcn´ y souˇcet geometrick´e ˇrady dost´av´ame P500 500 k = (1 − p)500 . Podle P (X ≥ 500) = 1 − p k=0 (1 − p) = 1 − p 1−(1−p) 1−(1−p) zad´an´ı m´a b´ yt (1 − p)500 = 0, 98. Odtud p = 1 − exp ln(0,98) = 4, 0405.10−5 . 500 To znamen´a, ˇze m´a-li b´ yt zajiˇstˇena poˇzadovan´a spolehlivost, jistiˇc se m˚ uˇze porouchat v pr˚ umˇetu jednou za 25 tis´ıc cykl˚ u, coˇz je pˇribliˇznˇe rovno stˇredn´ı hodnotˇe geometrick´eho rozdˇelen´ı s parametrem p (pˇresnˇe je to 24.749 cykl˚ u). Hypergeometrick´ y model Hyp(N, M, n) Mezi N prvky je M s urˇcitou vlastnost´ı. z tˇechto prvk˚ u prov´ad´ıme n´ahodn´ y v´ ybˇer n prvk˚ u bez vracen´ı. N´ahodn´a veliˇcina X pˇredstavuj´ıc´ı poˇcet prvk˚ u s urˇcitou vlastnost´ı ve v´ ybˇeru m´a takzvan´e hypergeometrick´ e rozdˇ elen´ı: −M (Mk )(Nn−k ) N (n) kde max(0, M + n − N ) ≤ k ≤ min(n, M ). Z´akladn´ı charakteristiky : E(X) = n M N −M )(N −n) V ar(X) = nM (N N 2 (N −1) Je-li N velk´e a n je oproti nˇemu hodnˇe mal´e (jedn´a se o mal´ y v´ ybˇer z velk´e populace, uv´ad´ı se: Nn < 0, 1), je hypergeometrick´e rozloˇzen´ı velmi bl´ızk´e binomick´emu (s parametrem p = M ), kter´e se snadnˇeji poˇc´ıt´a. N
Pravdˇepodobnostn´ı funkce : pk = P (X = k) =
Ck (M )Cn−k (N −M ) Cn (N )
=
Pˇ r´ıklad 1.3.5 Ve Sportce tipuje s´azej´ıc´ı 6 ˇc´ısel ze 49 moˇzn´ych, o ktre´ych pˇredpokl´ad´a, ˇze budou pˇri losov´an´ı Sportky taˇzena. V´yhru v V. poˇrad´ı z´ısk´a, pokud se mu podaˇr´ı uhodnout libovoln´a tˇri ˇc´ısla ze ˇsesti taˇzen´ych. Jak´a je pravdˇepodobnost v´yhry v V. poˇrad´ı? ˇ sen´ı: V tomto pˇr´ıkladˇe je N = 49 (poˇcet vˇsech ˇc´ısel), M = 6 (poˇcet Reˇ vyhr´avaj´ıc´ıch ˇc´ısel), n = 6 (poˇcet vytaˇzen´ ych ˇc´ısel) a k = 3 (poˇcet vyhr´avaˇ j´ıc´ıch ˇc´ısel, kter´a s´azej´ıc´ı uhodne). C´ısla nemohou b´ yt taˇzena dvakr´at, coˇz odpov´ıd´a modelu v´ ybˇeru bez vracen´ı. Slosov´an´ı Sportky se obvykle prov´ad´ı prostˇrednictv´ım elektromechanick´eho osud´ı, ˇc´ımˇz by mˇela b´ yt zajiˇstˇena n´ahodnost v´ ybˇeru. Hledanou pravdˇepodobnost lze potom vyj´adˇrit pomoc´ı hypergeometrick´eho rozdˇelen´ı: (6)(43) P (V. poˇrad´ı) = 3 49 3 = 0, 0177 (6) ˇ Sance na v´ yhru v V. poˇrad´ı Sportky je tedy necel´a dvˇe procenta.
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
33
Poisson˚ uv model P oiss(λT ). Uvaˇzujme ud´alosti nast´avaj´ıc´ı zcela n´ahodnˇe v ˇcase (napˇr. poruchy pˇr´ıstroje, pˇr´ıchody telefonn´ıch vol´an´ı do call-centra, rozpady atom˚ u radioaktivn´ıho prvku apod.). Pˇredpoklad n´ahodnosti lze matematicky formulovat n´asledovnˇe: Nez´avisle na tom, ke kolika ud´alostem doˇslo v ˇcasov´em intervalu h0, ti, pravdˇepodobnost toho, ˇze bˇehem kr´atk´eho intervalu (t, t + hi, kde h je velmi mal´e ˇc´ıslo, dojde k pr´avˇe jedn´e ud´alosti je d´ana pˇribliˇznˇe v´ yrazem λh15 . Pravdˇepodobnost toho, ˇze v intervalu (t, t + hi dojde k v´ıce neˇz jedn´e ud´alosti povaˇzujeme t´emˇeˇr za nulovou16 . Za tˇechto pˇredpoklad˚ u uvaˇzujeme n´ahodnou veliˇcinu NT vyjadˇruj´ıc´ı poˇcet ud´alost´ı za dobu T . Pro NT plat´ı 2
Pravdˇepodobnostn´ı funkce : pk = P (NT = k) = e−λT (λTk!) , k = 0, 1, 2, . . . Z´akladn´ı charakteristiky : E(X) = λT V ar(X) = λ Toto rozdˇelen´ı se naz´ yv´a Poissonovo17 , jeho jedin´ y parametr λ lze interpretovat jako pr˚ umˇern´ y poˇcet ud´alost´ı v tomto modelu za jednotku ˇcasu, λT je potom pr˚ umˇern´ y poˇcet ud´alost´ı za dobu T . Velk´ y v´ yznam m´a Poissonovo rozdˇelen´ı v teorii hromadn´e obsluhy, kde popisuje takov´e n´ahodn´e jevy jako jsou pˇr´ıchody z´akazn´ık˚ u. Poissonovo rozdˇelen´ı b´ yv´a oznaˇcov´ano jako rozdˇelen´ı ˇr´ıdk´ych jev˚ u, ne’ bot se podle nˇej ˇr´ıd´ı ˇcetnosti jev˚ u, kter´e maj´ı velmi malou pravdˇepodobnost ˇ v´ yskytu. Interpretace parametru T jako ˇcasu nen´ı podstatn´a. Casto se Poissonovo rozdˇelen´ı pouˇz´ıv´a i pto rozdˇelen´ı v´ yskytu zrn nebo ˇc´astic v objemu nˇejak´e l´atky ˇci materi´alu. Potom T m´a v´ yznam objemu. Poissonovo rozdˇelen´ı se nˇekdy t´eˇz pouˇz´ıv´a k aproximaci binomick´eho rozdˇelen´ı pro velk´ y poˇcet n pokus˚ u, tzn. n → ∞ a malou pravdˇepodobnost p v´ yskytu sledovan´eho jevu v jednom pokusu, tzn. p → 0. Potom pokl´ad´ame λ = np. Obvykle m˚ uˇzeme binomick´e rozdˇelen´ı aproximovat Poissonov´ ym 1 tehdy, pokud n > 30 a p ≤ 10 . Pˇ r´ıklad 1.3.6 Jak´a je pravdˇepodobnost, ˇze do autoservisu pˇrijedou a) alespoˇ n dva z´akazn´ıci bˇehem pˇeti minut, b) ˇz´adn´y z´akazn´ık bˇehem p˚ ul hodiny, jestliˇze ve sledovan´e dobˇe sem pˇrij´ıˇzd´ı pr˚ umˇernˇe ˇctyˇri z´akazn´ıci za hodinu? Pˇresnˇeji λh + o(h), kde o(h) je nekoneˇcnˇe mal´a veliˇcina splˇ nuj´ıc´ı limh→0+ o(h) h =0 . 16 Pˇresnˇeji za rovnu o(h). 17 Podle francouzsk´eho matematika, Laplaceova studenta Simeona Denise Poissona (1781-1840), kter´ y se kromˇe teorie pravdˇepodobnosti zab´ yval pˇredevˇs´ım fyzikou (elektˇrinou, magnetismem a optikou). 15
34
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
ˇ sen´ı: Pokud z´akazn´ıci pˇrij´ıˇzdˇej´ı po jednom nez´avisle na sobˇe v ˇcase, m˚ Reˇ uˇzeme na tento pˇr´ıklad pouˇz´ıt Poisson˚ uv model. Ze zad´an´ı vypl´ yv´a, ˇze je λ = 4, 1 v pˇr´ıpadˇe a) T = 12 hodiny, v pˇr´ıpadˇe b) T = 12 hodiny. Tedy 1 a) P (NT ≥ 2) = 1 − P (NT < 2) = 1 − p0 − p1 = 1 − e− 3 (1 + 13 ) = 0, 045, b) P (NT = 0) = 0, 135. Pˇ r´ıklad 1.3.7 Do 10kg tˇesta bylo pˇrid´ano 1000ks hrozinek. Jeden kus peˇciva se vyrob´ı z 10 dkg tˇesta. Jak´a je pravdˇepodobnost, ˇze v jednom kusu vyroben´eho peˇciva bude alespoˇ n 10 hrozinek? ˇ sen´ı: Je-li tˇesto s hrozinkami d˚ Reˇ ukladnˇe prom´ıch´ano, budou se jednotliv´e hrozinky v hmotnostn´ım objemu tˇesta vyskytovat n´ahodnˇe (rovnomˇernˇe), pˇriˇcemˇz zn´ame pr˚ umˇern´ y poˇcet hrozinek v 1 kg tˇesta - oznaˇcme jej λ a je λ = 100ks. Poˇcet hrozinem v peˇcivu je n´ahodn´a veliˇcina a oznaˇcme ji X. K v´ ypoˇctu poˇzadovan´e pravdˇepodobnosti pouˇzijeme Poissonovo rozdˇelen´ı s parametrem λT , kde T = 0, 1 je hmotnost tˇesta potˇrebn´eho k v´ yrobˇe ’ jednoho kusu peˇciva. Odpovˇed na ot´azku jak´a je P (X ≥ 10) dostaneme n´asleduj´ıc´ım v´ ypoˇctem: P k P (X ≥ 10) = 1 − P (X < 10) = 1 − e−10 9k=0 10k! = 0, 5421. Pˇ r´ıklad 1.3.8 Vrat’me se k jistiˇc˚ um z pˇr´ıkladu 1.3.4. Jak´a je pravdˇepodobnost, ˇze z 1000 jistiˇc˚ u nesepnou pr´avˇe 3 kusy? ˇ sen´ı: Pouˇzijeme-li binomick´ Reˇ y model (poˇcet u ´spˇech˚ u“ pˇri n nez´avisl´ ych ” pokusech), dost´av´ame P (X = 3) = 1000 (4, 0405.10−5 )3 (1 − 4, 0405.10−5 )997 = 1, 0528.10−5 . 3 Pˇri pouˇzit´ı aproximace Poissonov´ ym rozdˇelen´ım je λ = 0, 040405 a pro n´aˇs pˇr´ıklad dost´av´ame o trochu l´epe spoˇc´ıtateln´ y“ v´ yraz ” . 4,04053 −0,040405 −6 −5 P (X = 3) = 3! e 10 = 1, 0559.10 .
1.3.2
Spojit´ e pravdˇ epodobnostn´ı modely
Model rovnomˇ ern´ eho rozdˇ elen´ı na intervalu U (a, b). N´ahodn´ y pokus spoˇc´ıv´a v n´ahodn´em v´ ybˇeru jednoho ˇc´ısla z re´aln´eho intervalu ha, bi. V tomto pˇr´ıpadˇe nem´a smysl hovoˇrit o tom, ˇze kaˇzd´e ˇc´ıslo z intervalu ha, bi m´a stejnou pravdˇepodobnost b´ yt vybr´ano – to je splnˇeno trivi´alnˇe pro kaˇzd´ y spojit´ y model (rozdˇelen´ı pravdˇepodobnosti), nebot’ pro kaˇzdou spojitou n´ahodnou veliˇcinu X a kaˇzd´e x ∈ R plat´ı P (X = x) = 0. Rovnomˇernost v tomto modelu znamen´a to, ˇze vezmeme-li libovoln´ y podinterval Ix (4) = hx, x + 4i, potom
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
35
pravdˇepodobnost P (X ∈ Ix (4)) bude stejn´a pro jak´ekoli x ∈ ha, b − 4i a 4 . bude rovna b−a Hustota pravdˇepodobnosti : f (x) = Distribuˇcn´ı funkce
F (x) =
1 , pro b−a
0
x−a b−a
Z´akladn´ı charakteristiky :
a ≤ x ≤ b, f (x) = 0 jinde
1
pro x < a, pro a ≤ x ≤ b, pro x > b.
E(X) = a+b 2 2 V ar(X) = (b−a) 12
Jednou z aplikac´ı rovnomˇern´eho rozdˇelen´ı je vyˇsetˇrov´an´ı zaokrouhlovac´ıch chyb v numerick´ ych v´ ypoˇctech. Pˇri zaokrouhlen´ı na k desetinn´ ych m´ıst lze chybu povaˇzovat za n´ahodnou veliˇcinu s rovnomˇern´ ym rozdˇelen´ım na intervalu < −5.10−k−1 , 5.10−k−1 >. Exponenci´ aln´ı model Exp(λ). Uvaˇzujme n´ahodn´ y v´ yskyt ud´alost´ı v ˇcase. Jak jsme uvedli dˇr´ıve, poˇcet takov´ ychto ud´alost´ı v ˇcase t je n´ahodn´a veliˇcina X(t), kterou lze modelovat Poissonov´ ym modelem P oiss(λt), kde λ je pr˚ umˇern´ y poˇcet ud´alost´ı za jednotku ˇcasu. N´ahodn´a veliˇcina Y odpov´ıdaj´ıc´ı dobˇe mezi v´ yskytem ud´alost´ı v takov´emto modelu m´a rozdˇelen´ı pravdˇepodobnosti pro kter´e plat´ı P (Y ≤ t) = 1 − P (Y > t) = 1 − P (X(t) = 0) = 1 − e−λt . Rozdˇelen´ı n´ahodn´e veliˇciny Y se naz´ yv´a exponenci´ aln´ı rozdˇ elen´ı s parametrem λ. ( 0 pro x < 0, Hustota pravdˇepodobnosti: f (x) = λe−λx pro x ≥ 0, ( 0 pro x < 0, Distribuˇcn´ı funkce F (x) = −λx 1−e pro x ≥ 0, 1 Z´akladn´ı charakteristiky : E(X) = λ V ar(X) = λ12 V tomto modelu je stˇredn´ı doba mezi jednotliv´ ymi ud´alostmi rovna λ1 , v nˇekter´ ych aplikac´ıch se exponenci´aln´ı rozdˇelen´ı uv´ad´ı s parametrem θ = λ1 . Jedn´a se o stejn´e rozdˇelen´ı pravdˇepodobnosti, pouze jeho hustota a distribuˇcn´ı funkce jsou zaps´any v ponˇekud jin´em tvaru: ( 0 pro x < 0, Hustota pravdˇepodobnosti: f (x) = 1 − x e θ pro x ≥ 0, (θ 0 pro x < 0, Distribuˇcn´ı funkce F (x) = − xθ 1−e pro x ≥ 0, Z´akladn´ı charakteristiky : E(X) = θ V ar(X) = θ2
36
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Exponenci´aln´ı rozdˇelen´ı se pouˇz´ıv´a pˇredevˇs´ım v modelech doby mezi ud´alostmi jako jsou napˇr´ıklad poruchy zaˇr´ızen´ı, pˇr´ıchody z´akazn´ık˚ u do obsluˇzn´eho syst´emu, poˇzadavky na zpracov´an´ı n´ahodn´eho sign´alu a podobnˇe. Zaj´ımavou vlastnost´ı exponenci´aln´ıho rozdˇelen´ı je jeho ztr´ata pamˇeti“. ” Pˇredstavme si elektronick´e zaˇr´ızen´ı (napˇr´ıklad s´ıt’ovou kartu v poˇc´ıtaˇci), jehoˇz poruchy pˇrich´azej´ı n´ahodnˇe v ˇcase. Kdyˇz je zaˇr´ızen´ı nov´e, m˚ uˇzeme spoˇc´ıtat napˇr´ıklad pravdˇepodobnost p = P (Y > τ ), ˇze pˇreˇzije dobu τ . Pokud zaˇr´ızen´ı jiˇz pracovalo po nˇejakou (tˇreba i dlouhou) dobu T , pravdˇepodobnost ˇze pˇreˇzije dalˇs´ıch τ jednotek ˇcasu je stejn´a jako na poˇc´atku jeho ˇzivota, tedy p. Zaˇr´ızen´ı si nepamatuje“ jak dlouho uˇz pracuje. To lze vyj´adˇrit v n´asleduj´ıc´ım ” tvrzen´ı: Vˇ eta 1.7 M´a-li n´ahodn´a veliˇcina X exponenci´aln´ı rozdˇelen´ı s nˇejak´ym paramterem λ, potom pro libovoln´a T ≥ 0, τ > 0 plat´ı P (X > τ ) = P (X > T + τ |X ≥ T ) D˚ ukaz: D˚ ukaz zkuste prov´est sami jako cviˇcen´ı. Toto tvrzen´ı plat´ı i obr´acenˇe: pokud pro n´ahodnou veliˇcinu X a libovoln´a T ≥ 0, τ > 0 plat´ı uveden´a rovnost, potom se tato veliˇcina ˇr´ıd´ı exponenci´aln´ım rozdˇelen´ım s nˇejak´ ym parametrem λ. Vlastnost zapom´ın´an´ı“ exponenci´aln´ıho rozdˇelen´ı je velice uˇziteˇcn´a pro ” v´ ypoˇcty, ale v praxi to znamen´a, ˇze pˇri modelov´an´ı doby ˇzivota technick´eho zaˇr´ızen´ı nebereme do u ´vahy jeho st´arnut´ı“ ˇci opotˇreben´ı. Proto se v ˇradˇe ” aplikac´ı pouˇz´ıv´a obecnˇejˇs´ı modelem pro d´elku ˇzivota technick´ ych zaˇr´ızen´ı, kter´ y se naz´ yv´a Weibull˚ uv.
Weibull˚ uv model. Tento model se ˇcasto pouˇz´ıv´a jako model d´elky ˇzivota technick´eho zaˇr´ızen´ı. N´ahodn´a veliˇcina X m´a Weibullovo rozdˇ elen´ı s parametry θ, β(X ≈ W (θ, β), je-li distribuˇcn´ı funkce rovna Grafy t´eto hustoty pro pevn´e θ (parametr mˇeˇr´ıtka) a r˚ uzn´e hodnoty β (parametr tvaru) jsou na obr. 1.9. Vzhledem k rozmanitosti tvaru se ˇcasto uˇz´ıv´a jako pˇribliˇzn´ y model v technick´ ych aplikac´ıch. Pro β > 1 modeluje d´elku ˇzivota zaˇr´ızen´ı, u nˇehoˇz se pravdˇepodobnost poruchy s ˇcasem zvˇetˇsuje, v pˇr´ıpadˇe β < 1 modeluje ˇzivotnost zaˇr´ızen´ı, u nˇehoˇz se pravdˇepodobnost poruchy s ˇcasem zmenˇsuje. Je-li β = 1, dost´av´ame exponenci´aln´ı model, jehoˇz pravdˇepodobnost poruchy nez´avis´ı na st´aˇr´ı (nem´a pamˇet’).
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
37
Obr´azek 1.9: Hustoty Weibullova rozdˇelen´ı pro r˚ uzn´e hodnoty parametru β.
Hustota pravdˇepodobnosti: f (x) = Distribuˇcn´ı funkce
( 0
F (x) =
pro x < 0, β
βxβ−1 −( xθ ) e θβ
( 0
pro x ≥ 0, pro x < 0,
x β θ
1 − e−( ) pro x ≥ 0, Z´akladn´ı charakteristiky : E(X) = θΓ( β1 + 1) V ar(X) = θ2 Γ β2 + 1 − Γ2 β1 + 1 n-t´ y obecn´ y moment Weibullova rozdˇelen´ı m˚ uˇzeme vyj´adˇrit pomoc´ı Gamma 18 funkce : Z ∞ Z n β ∞ β+n−1 −( xθ )β n n n −z n β dx = θ z e dz = θ Γ EX = β x e +1 θ 0 β 0 kde jsme uˇzili substituci z =
x β θ
Uvaˇzujeme-li mnoˇzinu {Xi , i = 1, 2, . . . , n} nez´avisl´ ych n´ahodn´ ych veliˇcin, pak mini {xi } m´a za urˇcit´ ych podm´ınek pro velk´a n Weibullovo rozdˇelen´ı. Pˇ r´ıklad 1.3.9 D´eka ˇzivota Y obˇeˇzn´eho kola turbiny je d´ana ˇzivotnost´ı funkˇcnˇe nejslabˇs´ı lopatky. Necht’ ˇzivotnosti jednotliv´ych lopatek jsou nez´avisl´e n´ahodn´e veliˇciny Xi , i = 1, . . . , n, se stejn´ym Weibullov´ym rozdˇelen´ım s disx β tribuˇcn´ı funkc´ı F (x) = 1 − e(− θ ) , x ≥ 0. Najdˇete rozdˇelen´ı pravdˇepodobnosti veliˇciny Y . R∞ Funkce Γ(x) je definov´ ana jako integr´al 0 tx−1 e−t dt. Tento integr´al nelze obecnˇe (pro vˇsechna x vyj´ adˇrit koneˇcnou analytickou formul´ı a lze jej poˇc´ıtat pouze rozvojem v ˇradu. Pro Γ(x) plat´ı Γ(x + 1)√= xΓ(x). Specielnˇe pro pˇrirozen´a n je Γ(n) = (n − 1)!. Dalˇs´ı uˇziteˇcn´ y vztah je Γ( 12 ) = π. 18
38
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
ˇ sen´ı: Vypoˇcteme distribuˇcn´ı funkci G(y) n´ahodn´e doby ˇzivota Y obˇeˇzn´eho Reˇ kola turb´ıny. Zˇrejmˇe je Y = min(X1 , . . . , Xn ) a tedy G(y) = P (Y ≤ y) = P (min(X1 , . . . , Xn ) ≤ y) = 1 − P (min(X1 , . . . Xn ) > y) = 1 − P (
n \
[Xi > y]).
i=1
Minimum z n ˇc´ısel je totiˇz vˇetˇs´ı neˇz y pr´avˇe tehdy, kdyˇz vˇsechna ˇc´ısla maj´ı tuto vlastnost. D´ale vyuˇzijeme nez´avislost a dost´av´ame x β
G(y) = 1−Πni=1 P (Xi > y) = 1−Πni=1 (1−F (y)) = 1−(1−F (y))n = 1−e−n( θ ) . Exponent lze zapsat ve tvaru −n
x β θ
= −
x −1 β
β . Vzhledem k jedno-
θn
znaˇcnosti vyj´adˇren´ı distribuˇcn´ı funkce dan´eho rozdˇelen´ı ˇcin´ıme z´avˇer, ˇze 1 rozdˇelen´ı ˇzivotnosti obˇeˇzn´eho kola je tedy opˇet Weibullovo, Y ≈ W (θn− β , β) se stejn´ ym parametrem tvaru jako rozdˇelen´ı ˇzivotnosti lopatek. Norm´ aln´ı model N (µ, σ 2 ). Tento model b´ yv´a tak´e oznaˇcov´an jako model rozdˇelen´ı chyb pˇri mˇeˇren´ı. Model norm´aln´ıho rozdˇelen´ı m´a bohatou historii. Postupnˇe byl objevov´an a opˇet zapom´ın´am, aˇz se trvale dostal do poˇred´ı z´ajmu teorie pravdˇepodobnosti a pˇredevˇs´ım matematick´e statistiky. Prvn´ı, kdo popsal zvonovou kˇrivku hustoty norm´aln´ıho rozdˇelen´ı byl A. Moivre19 v roce 1733. K norm´aln´ımu modelu se dostal zobecnˇen´ım binomick´eho modelu pˇri h´azen´ı minc´ı. V t´e dobˇe mu nikdo nevˇenoval zvl´aˇstn´ı pozornost a kˇrivka i rovnice upadly v zapomenut´ı. Aˇz na pˇrelomu 18. a 19. stolet´ı ji znovu objevili“ Gauss20 a Laplace21 pˇri ” 19
Abraham de Moivre (1667–1754) byl francouzsk´ y matematik ˇzij´ıc´ı vˇetˇs´ı ˇc´ast sv´eho ˇzivota v Anglii. 20 Carl Friedrich Gauss (1777–1855)byl jeden z nejvˇetˇs´ıch matematik˚ u a fyzik˚ u vˇsech dob. Zab´ yval se teori´ı ˇc´ısel, matematickou anal´ yzou, geometri´ı, geod´ezi´ı, magnetismem, astronomi´ı, optikou. Nˇekdy b´ yv´a oznaˇcov´an za kn´ıˇzete matematiky“ nebo nejvˇetˇs´ıho ” ” matematika od dob antiky“ – silnˇe ovlivnil vˇetˇsinu oblast´ı sv´eho oboru. 21 Pierre Simon de Laplace (1749–1827) byl francouzsk´ y matematik, fyzik, astronom a politik; ˇclen Francouzsk´e akademie vˇed, kr´alovsk´e spoleˇcnosti v Lond´ ynˇe a Komise pro m´ıry a v´ ahy. Laplace je pr´avem povaˇzov´an za jednoho z nejvˇetˇs´ıch vˇedc˚ u v˚ ubec. Zanechal monument´ aln´ı d´ılo jiˇz sv´ ym rozsahem. Zab´ yval se matematickou anal´ yzou, teori´ı pravdˇepodobnosti, nebeskou mechanikou, teori´ı potenci´alu, zavedl pojem Laplaceovy transformace, uˇzil tzv. Laplace˚ uv oper´ator (v parci´aln´ı diferenci´aln´ı rovnici pro potenci´al silov´eho pole). Je autorem teorie o vzniku sluneˇcn´ı soustavy z rotuj´ıc´ı mlhoviny (KantovaLaplaceova teorie) a mnoha dalˇs´ıch teori´ı a metod s mnoha aplikacemi
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
39
zkoum´an´ı astronomick´ ych mˇeˇren´ı. Byli postaveni pˇred u ´lohu z mnoha mˇeˇren´ı, zat´ıˇzen´ ych chybou, urˇcit hodnotu, kter´a se bude co nejv´ıce bl´ıˇzit skuteˇcnosti. Odtud z´ıskal tento model pˇr´ıvlastek model rozdˇelen´ı chyb mˇeˇren´ı“ a od” pov´ıdaj´ıc´ı kˇrivka hudtoty se nˇekdy t´eˇz naz´ yv´a Gaussova“. Tˇret´ı, kdo tento ” model objevil a z´aroveˇ n prvn´ı, kdo jej nazval norm´aln´ım“, byl Qu´etelet22 ” v roce 1835. Norm´aln´ı kˇrivku dostal v souvislosti s mˇeˇren´ım obvodu prsou 5738 skotsk´ ych voj´ak˚ u a pˇredstavou jak´ehosi norm´aln´ıho“, neboli pr˚ umˇern´e” ho jedince. Od t´e doby si model norm´aln´ıho rozdˇelen´ı zaˇcal budovat svoji pevnou pozici ve vˇsech oblastech vˇedy.
Obr´azek 1.10: Distribuˇcn´ı funkce a hustota norm´aln´ıho rozdˇelen´ı.
(x−µ)2 √1 exp − , 2σ 2 σ 2π Rx = −∞ f (t)dt, x ∈ R
Hustota pravdˇepodobnosti: f (x) =
x∈R
Distribuˇcn´ı funkce F (x) Z´akladn´ı charakteristiky : E(X) = µ V ar(X) = σ 2 Ponˇekud nepˇr´ıjemn´e v tomto modelu je to, ˇze distribuˇcn´ı funkci, kter´a je d´ana v´ yˇse uveden´ ym integr´alem, nelze vyj´adˇrit koneˇcnou analytickou formul´ı; jej´ı hodnoty se poˇc´ıtaj´ı pomoc´ı distribuˇcn´ı funkce takzvan´eho normovan´eho norm´aln´ıho rozdˇelen´ı (viz d´ale). V souˇcasn´e dobˇe to vˇsak nen´ı z´asadn´ı omezen´ı, nebot’ ˇrada program˚ u (vˇcetnˇe tabulkov´eho procesoru MS Excel) umˇej´ı distribuˇcn´ı funkci norm´aln´ıho rozdˇelen´ı spoˇc´ıtat s dostateˇcnou pˇresnost´ı. Parametry norm´aln´ıho rozdˇelen´ı lze interpretovat jako parametr polohy EY = µ a parametr mˇeˇr´ıtka V arY = σ 2 , vzhledem k symetrii rozdˇelen´ı je µ t´eˇz medi´anem i modem. V´ yznam smˇerodatn´e odchylky σ je ilustrov´an obr. 1.11, kde je zn´azornˇena pravdˇepodobnost toho, ˇze Y se liˇs´ı od stˇredn´ı hodnoty µ v absolutn´ı hodnotˇe o m´enˇe neˇz kσ, k = 1, 2, 3. K dalˇs´ımu v´ ykladu potˇrebujeme n´asleduj´ıc´ı tvrzen´ı: 22
Lambert Adolphe Jacques Q´etelet (1796–1874). Belgick´ y vˇedec, jeden ze zakladatel˚ u Kr´ alovsk´e statistick´e spoleˇcnosti v Lond´ ynˇe
40
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Obr´azek 1.11: Vliv parametr˚ u µ a σ norm´aln´ıho rozdˇelen´ı na tvar kˇrivky. Vˇ eta 1.8 M´a-li n´ahodn´a veliˇcina X norm´aln´ı rozdˇelen´ı pravdˇepodobnosti se stˇredn´ı hodnotou µ a rozptylem σ 2 (X ≈ N (µ, σ 2 )), potom pro libovoln´e konstanty a, b ∈ R, a > 0 m´a veliˇcina Y = X−b opˇet norm´aln´ ı se a ı rozdˇelen´ σ 2 σ 2 stˇredn´ı hodnotou µ − b a rozptylem a , neboli pat´ı (Y ≈ N µ − b, a ). D˚ ukaz: D˚ ukaz t´eto vˇety vypl´ yv´a z vˇety 1.9 v n´asleduj´ıc´ım odstavci. N´ahodn´a veliˇcina Z m´a normovan´ e norm´ aln´ı rozdˇ elen´ı, nebo t´eˇz standardn´ı norm´ aln´ı rozdˇ elen´ı, (Z ≈ N (0, 1)), je-li jej´ı hustota rovna z2
φ(z) = √12π e− 2 , z ∈ R. Pˇr´ısluˇsn´a distribuˇcn´ı funkce se oznaˇcuje obvykle symbolem Φ a lze ji vyj´adˇrit jako Z z t2 1 Φ(z) = e− 2 dt. 2π −∞ Hodnoty t´eto funkce se poˇc´ıtaj´ı rozvojem v ˇradu a integrac´ı ˇclen po ˇclenu, nebo jsou uvedeny v takzvan´ ych Statistick´ ych tabulk´ach“. ” n-t´ y obecn´ y moment pro lich´e n = (2k − 1) je vˇzdy nule; tedy je q roven 2 R 2 ∞ 2k − z2 (2k−1) 2k EZ = 0, k ∈ N . Pro n sud´e, n = 2k je EZ = π 0 z e dz. Po 2
substituci z2 = t dostaneme23 r Z ∞ 2k−1 2 2k 1 (2t) 2 e−t dt = p Γ(k+ ) = (2k−1)!! = 1.3.5 . . . (2k−1) EZ 2k = π 0 2 (π) 23
Symbol (2k − 1)!! se pouˇz´ıv´a k vyj´adˇren´ı lich´eho“ faktori´alu, tedy souˇcinu vˇsech ” lich´ ych ˇc´ısel od 1 do (2k − 1).
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
41
Toto rozdˇelen´ı se pouˇz´ıv´a napˇr´ıklad tehdy, je-li tˇreba porovnat vlastnosti v´ıce n´ahodn´ ych veliˇcin s r˚ uzn´ ym norm´aln´ım rozdˇelen´ım. S takzvanou normalizac´ı n´ahodn´e veliˇciny jsme se uˇz setkali pˇri definici normovan´ych moment˚ u v odstavci 1.2. Jestliˇze m´a n´ahodn´a veliˇcina X obecn´e norm´aln´ı rozdˇelen´ı . (X ≈ N (µ, σ)), vytvoˇr´ıme normalizovanou n´ahodnou veliˇcinu Z = X−µ σ Tato veliˇcina m´a normovan´e norm´aln´ı rozdˇelen´ı (Z ≈ N (0, 1)). Vztah mezi hustotou f (x) veliˇciny X a hustotou φ(z) veliˇciny Z je n´asleduj´ıc´ı: (x−µ)2 z2 1 1 1 f (x) = √ e− 2σ2 = √ e− 2 = φ(z). σ σ 2π σ 2π
neboli
x−µ 1 . f (x) = φ σ σ Distribuˇcn´ı funkci F (x) veliˇciny X lze vyj´adˇrit podobnˇe pomoc´ı Φ(z), nebot’ plat´ı x−µ F (x) = Φ( ). σ To lze snadno ovˇeˇrit, dosad´ıme-li do integr´alu pro F (x) substituci x−µ = σ z, dx = σdz. Pˇ r´ıklad 1.3.10 Odhad vzd´alenosti je zat´ıˇzen systematickou chybou a = −50 (zkr´acen´ı v m) a n´ahodn´a chyb Y m´a norm´aln´ı rozdˇelen´ı s nulovou stˇredn´ı hodnotou a se smˇerodatnou odchylkou σ = 100m. Jak´a je pravdˇepodobnost, ˇze a) odhad pˇrev´yˇs´ı skuteˇcnou hodnotu, b) odhad se nebude liˇsit od skuteˇcn´e hodnoty o v´ıce neˇz 50 m? ˇ sen´ı: Um´ıst´ıme-li skuteˇcnou hodnotu do poˇc´atku soustavy souˇradnic, je Reˇ odhadnut´a hodnota X souˇctem systematick´e a n´ahodn´e chyby, tedy X = Y + a. Posunut´ım rozdˇelen´ı Y o a dost´av´ame X ≈ N (−50, 100), oznaˇcme distribuˇcn´ı funkci X jako F (x). v pˇr´ıkladu a) poˇc´ıt´ame 50 ) = 0, 309, P (X > 0) = 1 − P (X ≥ 0) = 1 − F (0) = 1 − Φ( 100 v b) jde o P (|X| < 50) = P ([−50 < X] ∩ [X < 50]) = P ([X < 50] − [X < −50]) = F (50) − F (−50) = Φ(1) − Φ(0) = 0, 341.
1.3.3
Funkce n´ ahodn´ e veliˇ ciny
V ˇradˇe pˇr´ıpad˚ u je tˇreba pracovat s n´ahodnou veliˇcinou, kter´a je vyj´adˇrena jako funkce jin´e n´ahodn´e veliˇciny. Nejjednoduˇsˇs´ım pˇr´ıkladem je normalizovan´a n´ahodn´a veliˇcina nebo n´ahodn´a veliˇcina v pˇr´ıkladu 1.3.10.
42
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Vˇ eta 1.9 Mˇejme n´ahodnou veliˇcinu X s distribuˇcn´ı funkc´ı F (x), x ∈ R. Oznaˇcme Y = aX +b jej´ı line´arn´ı transformaci pro libovoln´e konstanty a, b ∈ R, a 6= 0. Potom pro distribuˇcn´ı funkci G(y) n´ahodn´e veliˇciny Y plat´ı y−b ) pro a > 0, a y−b G(y) = 1 − lim− F ( ) pro a < 0. x→y a G(y) = F (
D˚ ukaz: Pro a > 0 je zˇrejmˇe G(y) = P (Y ≤ y) = P (aX + b ≤ y) = P (X ≤
y−b y−b ) = F( ). a a
Pokud je a < 0, nerovnost se po vyn´asoben´ı v´ yrazu v pravdˇepodobnosti ˇc´ıslem a obrac´ı a dost´av´ame G(y) = P (X ≥
y−b y−b y−b ) = 1 − P (X < ) = 1 − lim− F ( ). x→y a a a
Limita v posledn´ım v´ yrazu je d˚ usledkem toho, ˇze distribuˇcn´ı funkce nemus´ı b´ yt spojit´a zleva (pro diskr´etn´ı rozdˇelen´ı). Je-li F absolutnˇe spojit´a s hustotou f (x) potom i G je absolutnˇe spojit´a s hustotou g(y) = G0 (y) = 1 f ( y−b ) pro libovoln´e a. |a| a D´ale bud’ Y = h(X) transformace obecnou re´alnou funkc´ı h. Pˇri oznaˇcen´ı z vˇety 1.9 je distribuˇcn´ı funkce G(y) = P (Y ≤ y) = P (h(X) ≤ y). D´ale specielnˇe pro F (x) diskr´etn´ı se skoky pn v bodech xn je G(y) =
X
pn
n:h(xn ≤y)
a pro F (x) absolutnˇe spojitou s hudtotou f (x) Z G(y) = f (x)dx x:h(x)≤y
Pˇ r´ıklad 1.3.11 Rozdˇelen´ı n´ahodn´e veliˇciny X je d´ano pravdˇepodobnostmi P (X = 0) = 12 , P (X = 1) = 14 , P (X = 2) = 41 . Najdˇete rozdˇelen´ı n´ahodn´e veliˇciny Y = (X − 1)2 .
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
43
ˇ sen´ı: N´ahodn´a veliˇcina Y m˚ Reˇ uˇze nab´ yvat pouze hodnot 0 nebo 1. Jejich pravdˇepodobnosti jsou P (Y = 0) = P (X = 1) = 14 , P (Y = 1) = P (X = 0) + P (X = 2) = 43 . Pˇ r´ıklad 1.3.12 Najdˇete rozdˇelen´ı spojit´e n´ahodn´e veliˇciny Y = |X|, kde X je n´ahodn´a veliˇcina symetrick´a kolem 0. ˇ sen´ı: Symetrie n´ahodn´e veliˇciny X kolem bodu 0 znamen´a, ˇze jej´ı hustota Reˇ f (x) je sud´a funkce, tj. f (x) = f (−x) pro vˇsechna x ∈ R. Potom je F (x) = −F (−x) + C a z vlastnost´ı distribuˇcn´ı funkceR plyne, ˇze mus´ı b´ yt C = 1. Pro Y = |X| je potom distribuˇcn´ı funkce G(y) = |x|≤y f (x)dx = F (y)−F (−y) = 2F (y) − 1, y ≥ 0. Je-li funkce h ryze monotonn´ı s derivac´ı h0 , existuje inverzn´ı funkce h−1 a potom je G(y) = P (X ≤ h−1 (y)) = F (h−1 (y)) pro h klesaj´ıc´ı. Derivac´ı podle promˇenn´e x dostaneme vzorec pro transformovanou hustotu g(y) n´ ahodn´ e veliˇ ciny Y = h(X) g(y) =
f (h−1 (y)) h0 (h−1 (y))
Pˇ r´ıklad 1.3.13 Najdˇete hustotu g(y) n´ahodn´e veliˇciny Y = asinΨ kde Ψ je n´ahodn´a f´aze s rovnomˇern´ym rozdˇelen´ım U (−π, π). Y je n´ahodn´a v´ychylka harmonick´eho pohybu s konstantn´ı amplitudou a. ˇ sen´ı: Hustota Ψ je f (x) = 1 , −π < x < π, inverzn´ı transformace h−1 (y) = Reˇ 2π arcsin ay , −a < y < a. Ve jmenovateli transformaˇcn´ıho vzorce dost´av´ame p 1 √ 1 h0 (h−1 (y)) = acosarcsin ay = a2 − y 2 . Odsud g(y) = 2π , −a < y < 2 2 a −y
a. Nejpravdˇepodobnˇejˇs´ı“ jsou v´ ychylky v okol´ı amplitud, kde je hustota ” neomezen´a funkce. Pˇ r´ıklad 1.3.14 Necht’ Z ≈ N (0, 1). Spoˇctˇete hustotu pravdˇepodobnosti n´ahodn´e veliˇciny X = Z 2 . p ˇ sen´ı: Zde je h(z) = z 2 a opaˇcnˇe, h−1 (z) = (z) pro z ≥ 0. Pro transforReˇ movanou hustotu dost´av´ame h(x) = √
x 1 e− 2 . 2xπ
44
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Rozdˇelen´ı n´ahodn´e veliˇciny X = Z 2 se naz´ yv´a ch´ı-kvadr´ at rozdˇ elen´ı χ2 (1). Toto rozdˇelen´ı se ˇcasto pouˇz´ıv´a ve statistice jako rozdˇelen´ı souˇctu n druh´ ych mocnin n´ahodn´ ych veliˇcin s rozdˇelen´ım N (0, 1). Necht’ X ≈ N (µ, σ). Uvaˇzujme rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny Y = eX . Transformace v tomto pˇr´ıpadˇe m´a tvar h(x) = ex , coˇz je spojit´a, prost´a a diferencovateln´a funkce, pro y > 0 je nav´ıc h−1 (y) = lny. Dosazen´ım do pˇredchoz´ıho vzorce tedy dostaneme pro y > 0 g(y) =
(lny−µ)2 1 p e− 2σ2 . yσ (2π)
Pˇr´ıpad, kdy by y ≤ 0 je nemoˇzn´ y (exponenciela m´a pouze kladn´e hodnoty) a proto poloˇz´ıme g(y) = 0 pro y < 0. N´ahodn´a veliˇcina Y m´a logaritmicko-norm´ aln´ı rozdˇ elen´ı LN (µ, σ 2 ). σ2
Z´akladn´ı charakteristiky : E(X) = eµ+ 2 2 2 V ar(X) = e2µ+σ (eσ − 1) Obr´acenˇe: m´a-li n´ahodn´a veliˇcina X rozdˇelen´ı LN (µ, σ 2 ), potom n´ahodn´a veliˇcina Y = lnX m´a rozdˇelen´ı N (µ, σ 2 ). Logaritmicko-norm´aln´ı rozdˇelen´ı se pouˇz´ıv´a v teorii spolehlivosti, ve vodohospod´aˇrstv´ı pˇri modelov´an´ı pr˚ utok˚ u vody v ˇrek´ach, pˇri popisu velikosti ˇca´stic sypk´ ych metri´al˚ u a pod. Pro v´ ypoˇcet stˇredn´ı hodnoty funkce n´ahodn´e veliˇciny nen´ı tˇreba transformavat p˚ uvodn´ı rozdˇelen´ı. Jednoduˇsˇs´ı je pouˇz´ıt pˇr´ım´eho vzorce X Eh(X) = h(xj )pj j
pro diskr´etn´ı n´ahodnou veliˇcinu a Z Eh(X) =
h(x)f (x)dx
pro spojit´e rozdˇelen´ı s hustotou f . Pˇ r´ıklad 1.3.15 Opotˇreben´ı Z n´aprav ˇzelezniˇcn´ıch vagon˚ u se zvyˇsuje s druhou mocninou zat´ıˇzen´ı X, tedy Z = X 2 . Pˇredpokl´adejme, ˇze vagon jede po velmi nerovn´e trati, takˇze zat´ıˇzen´ı kol´ıs´a s diskr´etn´ım rozdˇelen´ım s pravdˇepodobnostmi P (X = 8) = 0, 25, P (X = 25) = 0, 7, P (X = 80) = 0, 05. Vypoˇctˇete stˇredn´ı opotˇreben´ı a porovnejte ho s opotˇreben´ım pˇri konstantn´ım zat´ıˇzen´ı 25.
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
45
ˇ sen´ı: Uˇzit´ım prvn´ıho vzorce dost´av´ame EZ = P x2 pj = 773, 5. Pˇri konReˇ j j stantn´ım zat´ıˇzen´ı je opotˇreben´ı 252 = 625, tedy menˇs´ı.
1.3.4
Posunut´ a, podm´ınˇ en´ a a useknut´ a rozdˇ elen´ı
Pˇ r´ıklad 1.3.16 N´ahodn´a veliˇcina Y popisuje dobu potˇrebnou k vykon´an´ı urˇcit´e technologick´e operace. Ta sest´av´a ze dvou ˇc´ast´ı: prvn´ı z nich trv´a vˇzdy stejnou dobu γ, druh´a je n´ahodn´a, s exponenci´aln´ım rozdˇelen´ım Exp 1θ . Popiˇste rozdˇelen´ı pravdˇepodobnosti veliˇciny Y . ˇ sen´ı: Hustota pravdˇepodobnosti veliˇciny Y je na obr´azku 1.12. Tuto funkci Reˇ lze popsat vztahem ( 0 pro y < γ, f (y) = 1 − y−γ e θ pro y ≥ γ. θ Jedn´a se o takzvan´e posunut´ e rozdˇ elen´ı. Jeho stˇredn´ı hodnota je posunut´a
Obr´azek 1.12: Graf hustoty posunut´eho exponenci´aln´ıho rozdˇelen´ı. o γ, tedy EX = θ + γ, zat´ımco rozptyl se posunut´ım nemˇen´ı a je tedy roven V arX = θ2 . Pˇ r´ıklad 1.3.17 Najdˇete hustotu posunut´eho rozdˇelen´ı ve Weibullovˇe modelu a pro logaritmicko-norm´aln´ı pravdˇepodobnostn´ı model. ˇ sen´ı: Pro hustotu posunut´ Reˇ eho Weibullova rozdˇ elen´ı do bodu γ dost´av´ame vztah ( 0 pro y < γ, f (y) = β(y−γ)β−1 − (y−γ) β e ( θ ) pro y ≥ γ, θβ v pˇr´ıpadˇe posunut´ eho logaritmicko-norm´ aln´ıho rozdˇ elen´ı m´a posunut´a hustota tvar 0 pro y < γ, (ln(y−γ)−µ)2 f (x) = 1√ 2σ 2 e− pro y ≥ γ, (y−γ)σ
(2π)
46
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Obr´azek 1.13: Posunut´e Weibullovo (vlevo) a logaritmicko-norm´aln´ı (napravo) rozdˇelen´ı.
Pˇ r´ıklad 1.3.18 Jek´e je rozdˇelen´ı d´elky ˇzivota Y zaˇr´ızen´ı, kdyˇz v´ıme, ˇze se doˇzilo doby y 0 ? ˇ sen´ı: Hledan´e rozdˇelen´ı je takzvan´e podm´ınˇ Reˇ en´ e rozdˇ elen´ı. Oznaˇc´ıme-li hustotu veliˇciny Y jako f (y) a jej´ı distribuˇcn´ı funkci F (y), potom hustota f (y|y 0 ) a distribuˇcn´ı funkce F (y|y 0 ) podm´ınˇen´eho rozdˇelen´ı Y za podm´ınky Y > y 0 jsou d´ any vztahy ( ( 0 0 pro y < y , 0 pro y < y 0 , 0 f (y|y 0 ) = F (y|y ) = 0 f (y) F (y)−F (y ) pro y ≥ y 0 , pro y ≥ y 0 . 1−F (y 0 ) 1−F (y 0 )
Obr´azek 1.14: Hustota (vlevo) a distribuˇcn´ı funkce (napravo) podm´ınˇen´eho rozdˇelen´ı.
Pˇ r´ıklad 1.3.19 Jak´e je rozdˇelen´ı zb´yvaj´ıc´ı doby ˇzivota zaˇr´ızen´ı, kdyˇz se doˇzilo doby y 0 ? ˇ sen´ı: V tomto pˇr´ıpadˇe se poˇca´tek mˇeˇren´ı ˇcasu posouv´a do okamˇziku y 0 , Reˇ od kdy se zb´ yvaj´ıc´ı doba ˇzivota zaˇc´ın´a mˇeˇrit. Rozdˇ elen´ı zb´ yvaj´ıc´ı doby
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
47
ˇ zivota je tedy nˇeco jin´eho, neˇz podm´ınˇen´e rozdˇelen´ı z pˇredchoz´ıho pˇr´ıkladu. Hustotu g(y) a distribuˇcn´ı funkci G(y) zb´ yvaj´ıc´ı doby ˇzivota dostaneme posunut´ım podm´ınˇen´e rozdˇelen´ı do bodu y 0 : ( ( 0 pro y < 0, 0 pro y < 0, G(y) = F (y+y0 )−F (y0 ) g(y) = f (y+y0 ) pro y ≥ 0, pro y ≥ 0. 1−F (y 0 ) 1−F (y 0 ) Pˇ r´ıklad 1.3.20 Automat d´avkuje tekutinu, jej´ıˇz objem m´a b´yt µ0 . v okol´ı µ0 se veliˇcina X, popisuj´ıc´ı objem d´avky, chov´a jako n´ahodn´a veliˇcina s norm´aln´ım rozdˇelen´ım N (µ0 , σ 2 ). Jak´e je rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny X? ˇ sen´ı: Zˇrejmˇe lze pˇredpokl´adat, ˇze objem d´avky X bude vˇzdy pouze nez´aporReˇ n´e ˇc´ıslo, m˚ uˇze b´ yt i nulov´ y. Probl´em je v tom, ˇze norm´aln´ı rozdˇelen´ı pravdˇepodobnosti d´av´a kladnou pravdˇepodobnost i z´aporn´ ym hodnot´am, kter´e jsou v tomto pˇr´ıpadˇe nemoˇzn´e. Je-li µ0 > 3σ, je pravdˇepodobnost jevu {X < 0} prakticky nulov´a a rozdˇelen´ı X zpravidla povaˇzujeme za norm´aln´ı s parametry µ0 a σ 2 . Pokud je ale 0 < µ0 < 3σ, potom by mohla b´ yt chyba v pˇredpokladu norm´aln´ıho rozdˇelen´ı pˇr´ıliˇs velk´a. Mus´ıme tedy pouˇz´ıt takzvan´e useknut´ e norm´ aln´ı rozdˇ elen´ı. To je rozdˇelen´ı, jehoˇz hustota m´a pro x > 0 tvar zvonov´e kˇrivky norm´aln´ıho rozdˇelen´ı, pro x ≤ 0 je nulov´a a pˇresto plocha pod n´ı z˚ ust´av´a rovna 1. Tvar t´eto hustoty a j´ı odpov´ıdaj´ıc´ı distribuˇcn´ı funkci je ( ( 0 pro x < 0, 0 pro x < 0, G(x) = F (x)−F (0) g(x) = f (x) pro x ≥ 0, pro x ≥ 0, 1−F (0) 1−F (0) kde f (x), resp. F (x) je hustota, resp. distribuˇcn´ı funkce rozdˇelen´ı N (µ0 , σ 2 ). Vˇsimnˇete si, ˇze se vlastnˇe jedn´a o podm´ınˇen´e norm´aln´ı rozdˇelen´ı za podm´ınky {X ≥ 0}. Pro stˇredn´ı hodnotu useknut´eho rozdˇelen´ı potom zˇrejmˇe plat´ı R∞ Z ∞ xf (x)dx EX = xg(x)dx = 0 1 − F (0) −∞ a pro rozptyl 1 V arX = (1 − F (0))2
"Z 0
∞
x2 f (x)dx −
Z
2 #
∞
xf (x)dx 0
48
1.3.5
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Rozdˇ elen´ı souˇ ctu nez´ avisl´ ych n´ ahodn´ ych veliˇ cin
Uvaˇzujme dvˇe nez´avisl´e n´ahodn´e veliˇciny, X a Y , prvn´ı s distribuˇcn´ı funkc´ı F (x), druhou s distribuˇcn´ı funkc´ı G(y). Bude n´as zaj´ımat rozdˇelen´ı pravdˇepodobnosti jejich souˇctu, kter´ ym je opˇet n´ahodn´a veliˇcina Z = X +Y . Oznaˇcme distribuˇcn´ı funkci Z jako H(z). V pˇr´ıpadˇe diskr´etn´ı n´ahodn´e veliˇciny vzhledem k nez´avislosti X a Y zˇrejmˇe plat´ı XX H(z) = P (Z ≤ z) = P (X + Y ≤ z) = P (X = x)P (Y = y). x+y≤z
Pro spojit´e n´ahodn´e veliˇciny s hustotami f (x) a g(y) je ZZ
Z
∞
f (x)g(y)dxdy =
H(z) =
Z
−∞
x+y≤z
z−x
f (x) −∞
g(y)dydx = Z ∞ f (x)G(z − x)dx −∞
V´ ysledn´e rozdˇelen´ı pravdˇepodobnosti se naz´ yv´a konvoluc´ı rozdˇelen´ı X a Y . Pˇ r´ıklad 1.3.21 Pˇredpokl´adejme, ˇze doba obsluhy z´akazn´ıka v syst´emu hromadn´e obsluhy m´a exponenci´aln´ı rozdˇelen´ı pravdˇepodobnosti Exp(λ) a obsluhy jednotliv´ych z´akazn´ık˚ u jsou nez´avisl´e. Jak´e je rozdˇelen´ı doby ˇcek´an´ı z´akazn´ıka, kter´y pˇrijde do syst´emu, v nˇemˇz jsou uˇz dva z´akazn´ıci? ˇ sen´ı: Doba ˇcek´an´ı pˇr´ıchoz´ıho z´akazn´ıka je souˇctem dob obsluhy dvou pˇredReˇ choz´ıch. Tedy hled´ame rozdˇelen´ı souˇctu dvou nez´avisl´ ych n´ahodn´ ych veliˇcin s exponenci´aln´ım rozdˇelen´ım s parametrem λ. ZZ
2 −λx −λy
H(z) =
λe
e
Z 0
Z
−λx
Z
λe
dxdy =
x+y≤z
z
z−x
λe−λ(z−x) )dydx =
0
z
λe−λx (1 − e−λ(z−x) )dx = 1 − e−λz − λz e−λz
0
Rozdˇelen´ı s touto distribuˇcn´ı funkc´ı se naz´ yv´a Erlangovo rozdˇ elen´ı s parametry 1 a λ. Obecnˇe je Erlangovo rozdˇelen´ı Erl(n, λ) modelem souˇctu n nez´avisl´ ych n´ahodn´ ych veliˇcin s exponenci´aln´ım rozdˇelen´ım Exp(λ) a jeho charakteristiky jsou ( 0 pro x < 0, Hustota pravdˇepodobnosti: f (x) = n−1 −λx (λx) pro x ≥ 0, λe (n−1)!
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN ( 0 Distribuˇcn´ı funkce F (x) = Pn−1 1 − e−λx k=0 Z´akladn´ı charakteristiky : E(X) = nλ V ar(X) = λn2
49
(λx)k k!
pro x < 0, pro x ≥ 0,
Pˇ r´ıklad 1.3.22 Najdˇete rozdˇelen´ı souˇctu druh´ych mocnin nez´avisl´ych n´ahodn´ych veliˇcin, kter´e maj´ı standardn´ı norm´aln´ı rozdˇelen´ı N (0, 1). ˇ sen´ı: Rozdˇelen´ı n´ahodn´e veliˇciny X = Z 2 jsme spoˇcetli uˇz v pˇr´ıkladu Reˇ x 1 e− 2 pro x ≥ 0. Pro posloup1.3.14 kde jsme dostali hustotu h(x) = √2xπ nost {Z1 , Z2 , . . . , Zn } nez´ avisl´ ych n´ahodn´ ych veliˇcin s rozdˇelen´ım N (0, 1) m´a P n´ahodn´a veliˇcina Xn2 = nk=1 Zk2 rozdˇelen´ı pravdˇepodobnosti ch´ı-kvadr´ at 2 χ (n). Toto rozdˇelen´ı se ˇcasto pouˇz´ıv´a v matematick´e statistice a ve spolehlivosti. Poˇcet sˇc´ıtanc˚ u n je parametr tohoto rozdˇelen´ı (takzvan´e stupnˇe volnosti). V´ ypoˇcet distribuˇcn´ı funkce a hustoty tohoto rozdˇelen´ı je pomˇernˇe sloˇzit´ y a nebudeme se j´ım zde zab´ yvat. Pro pˇredstavu si uvedeme grafy hustoty a distribuˇcn´ı funkce. Z´akladn´ı charakteristiky rozdˇelen´ı χ2 (n) jsou: E(Xn2 ) = n, V arXn2 = 2n.
Obr´azek 1.15: Hustota (vlevo) a distribuˇcn´ı funkce (napravo) rozdˇelen´ı χ2 (k) pro r˚ uzn´a k.
1.3.6
Momentov´ a vytvoˇ ruj´ıc´ı funkce
Momentov´ a vytvoˇ ruj´ıc´ı funkce MX (t) n´ahodn´e veliˇciny X je definov´ana jako stˇredn´ı hodnota MX (t) = EetX , t ∈ R
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
50
Vˇ eta 1.10 Je-li MX (t) koneˇcn´a v intervalu < −b, b > pro nˇejak´e b > 0, je (n)
EX n = MX (0), n = 0, 1, . . . (
kde MX n) znaˇc´ı n-tou derivaci funkce. Je-li MY (t) = MX (t) pro |t| < b, potom n´ahodn´e veliˇciny X a Y maj´ı stejn´e rozdˇelen´ı. P∞ (tX)k Naznaˇc´ıme d˚ ukaz prvn´ıho tvrzen´ı vˇety. Uˇzit´ım rozvoje etX = k=0 k! P tk−n k EX , v bodˇ e 0 je jedin´ y nepoˇc´ıt´ame stˇredn´ı hodnotu EetX = ∞ k=0 (k−n)! n nulov´ y ˇclen t´eto ˇrady pro k = n roven EX . Pˇ r´ıklad 1.3.23 Spoˇctˇete momentovou vytvoˇruj´ıc´ı funkci veliˇciny Y = a + bX, jestliˇze X ≈ N (0, 1). ˇ sen´ı: Je-li MX (t) momentov´a vytvoˇruj´ıc´ı funkce X, potom Reˇ MY (t) = Ee(a+bX)t = eat EebtX = eat MX (tb). Pro X ≈ N (0, 1) dost´av´ame 1 MX (t) = √ 2π
Z
i
x2
t2
nf tyetx e− 2 dx = e 2 .
−∞
Z obou z´ıskan´ ych poznatk˚ u plyne, ˇze pro n´ahodnou veliˇcinu Y ≈ N (µ, σ) je MY (t) = eµt e
σ 2 t2 2
.
Pˇ r´ıklad 1.3.24 Najdˇete obecn´e momenty n´ahodn´e veliˇciny X ≈ U (0, 1). ˇ sen´ı: Momentov´a vytvoˇruj´ıc´ı funkce rovnomˇernˇe rozdˇelen´e n´ahodn´e veliˇciny Reˇ R1 t X ≈ U (0, 1) nesplˇ nuje pˇredpoklady vˇety 1.10: MX (t) = 0 etx dx = e −1 . t Pˇresto lze naj´ıt momenty X srovn´an´ım s ˇradou v d˚ ukazu vˇety 1.10: ∞
∞
et − 1 X tk−1 X tk 1 = = , t k! k! k + 1 k=1 k=0 odsud EX k =
1 k+1
Vˇ eta 1.11 Jsou-li X, Y nez´avisl´e, je momentov´a vytvoˇruj´ıc´ı funkce souˇctu Z = X + Y rovna souˇcinu momentov´ych vytvoˇruj´ıc´ıch funkc´ı sloˇzek, tj. MZ (t) = MX+Y (t) = MX (t)MY (t)
ˇ ´I MODELY 1.3. PRAVDEPODOBNOSTN
51
Tato vˇeta umoˇzn ˇuje stanovit rozdˇelen´ı souˇctu nez´avisl´ ych n´ahodn´ ych veliˇcin mnohdy jednoduˇsˇs´ım zp˚ usobem neˇz pomoc´ı hustot pravdˇepodobnosti. Pˇ r´ıklad 1.3.25 Dokaˇzte, ˇze rozdˇelen´ı souˇctu dvou nez´avisl´ych n´ahodn´ych veliˇcin s norm´aln´ım rozdˇelen´ım je opˇet norm´aln´ı. ˇ sen´ı: Bud’ X ≈ N (µ1 , σ12 ), Y ≈ N (µ2 , σ22 ) nez´avisl´e. Potom Reˇ MX+Y (t) = MX (t)MY (t) = eµ1 t+
2 t2 σ1 2
eµ2 t+
2 t2 σ2 2
= e(µ1 +µ2 )t+
2 +σ 2 )t2 (σ1 2 2
Podle druh´e ˇca´sti vˇety 1.10 (vz´ajemn´a jednoznaˇcnost pˇriˇrazen´ı momentov´e vytvoˇruj´ıc´ı funkce rozdˇelen´ı n´ahodn´e veliˇciny) mus´ı m´ıt n´ahodn´a veliˇcina Z = X + Y norm´aln´ı rozdˇelen´ı N (µ1 + µ2 , σ12 + σ22 ). Pˇ r´ıklad 1.3.26 Necht’ n´ahodn´e veliˇciny Xi , i = 1, . . . , n jsou nez´avisl´e stejnˇe rozdˇelen´e s alternativn´ım rozdˇelen´ım s parametrem p. Vˇetu 1.11 lze rozˇs´ıˇrit Pn n na koneˇcn´y poˇcet sˇc´ıtanc˚ u. Je-li Y = i=1 Xi , je MY (t) = Πi=1 MXi (t). Podle binomick´eho modelu je Y ≈ Bin(n, p) Momentov´a vytvoˇruj´ıc´ı funkce Xi m´a tvar Mxi = EeXi t = pet + (1 − p), tedy momentov´a vytvoˇruj´ıc´ı funkce binomick´eho rozdˇelen´ı je MY (t) = (pet + 1 − p)n Podle vˇety 1.10 lze poˇc´ıtat napˇr. EY = MY0 (0) = n(pe0 +1−p)n−1 p = np. Jsou-li X ≈ Bin(n1 , p), Y ≈ Bin(n2 , p) dvˇe nez´avisl´e n´ahodn´e veliˇciny, je MX+Y (t) = (pet + 1 − p)n1 +n2 , tedy rozdˇelen´ı souˇctu je opˇet binomick´e, X + Y ≈ Bin(n1 + n2 , p). Tento v´ ysledek je zˇrejm´ y z interpretace, pˇrid´ameli k n1 nez´avisl´ ym opakov´an´ım pokusu se dvˇema v´ ysledky (zdar, nezdar) dalˇs´ıch n2 nez´avisl´ ych opakov´an´ı, je poˇcet v´ yskyt˚ u zdar˚ u v serii d´elky n1 +n2 roven souˇctu zdar˚ u v obou seri´ıch d´elky n1 resp. n2 .
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
52
1.4
N´ ahodn´ y vektor
Zobrazen´ı X : Ω → Rn , jehoˇz jednotliv´e sloˇzky Xi , i = 1, 2, . . . , n jsou n´ahodn´e veliˇciny, budeme naz´ yvat n´ ahodn´ ym vektorem. N´ahodn´ y vektor si tedy lze pˇredstavit jako vektor n´ ahodn´ ych veliˇ cin. v n´asleduj´ıc´ım textu se budeme zab´ yvat pouze pˇr´ıpadem n = 2.
1.4.1
Rozdˇ elen´ı n´ ahodn´ eho vektoru
Sdruˇ zen´ a distribuˇ cn´ı funkce n´ahodn´eho vektoru (X, Y ) je definov´ana pˇredpisem F (x, y) = P (X ≤ x, Y ≤) a m´a n´asleduj´ıc´ı vlastnosti: a) 0 ≤ F (x, y) ≤ 1 pro kaˇzd´e (x, y) ∈ R2 , b) limx→∞ F (x, y) = 1, y→∞
c) limx→−∞ F (x, y) = limy→−∞ F (x, y) = 0, d) F je zprava spojit´a v kaˇzd´e promˇenn´e. Uvaˇzujme n´ahodn´ y vektor Z = (X, Y ). Jestliˇze X a Y jsou diskr´etn´ı n´ahodn´e veliˇciny, oznaˇcme {xi } resp. {yj } koneˇcn´e nebo spoˇcetn´e posloupnosti vˇsech hodnot X resp. Y . D´ale oznaˇcme P (X = xi , Y = yj ) = pij . Potom posloupnost {pij } tvoˇr´ı diskr´ etn´ı sdruˇ zen´ e rozdˇ epodobnosti Pelen´ı pravdˇ n´ahodn´eho vektoru Z. Mus´ı samozˇrejmˇe platit i,j pij = 1. Sdruˇzen´a distribuˇcn´ı funkce F (x, y) diskr´etn´ıho n´ahodn´eho vektoru Z se naz´ yv´a diskr´ etn´ı a spoˇcteme ji podle vztahu X F (x, y) = pij i:xi ≤x j:yj ≤y
Pˇ r´ıklad 1.4.1 V´yrobky jsou produkov´any ve tˇrech jakostn´ıch kategori´ıch: tˇr´ıda I s pravdˇepodobnost´ı 0,3, v kategorii II s pravdˇepodobnost´ı 0,5 a v kategorii III s pravdˇepodobnost´ı 0,2. Jak´e je rozdˇelen´ı poˇctu v´yrobk˚ u I. a II. kategorie?
´ ´ VEKTOR 1.4. NAHODN Y
53
ˇ sen´ı: N´ahodn´ Reˇ ym pokusem zde je v´ yroba n v´ yrobk˚ u v r˚ uzn´ ych jakostn´ıch kategori´ıch. Sledujeme veliˇciny X=[poˇcet v´ yrobk˚ u I. kategorie] a Y =[poˇcet v´ yrobk˚ u II. kategorie]. Poˇcet v´ yrobk˚ u II. kategorie je potom doplnˇek do celkov´eho poˇctu n vyroben´ ych. Podle klasick´e definice pravdˇepodobnosti lze odvodit n´asleduj´ıc´ı vztah P (X = k, Y = l) = pkl =
2! (0, 3)k (0, 5)l . k!l!(2 − k − l)!
Obecnˇe, m˚ uˇze-li jeden pokus skonˇcit nˇekter´ ym ze tˇr´ı moˇzn´ ych v´ ysledk˚ u {ω1 , ω2 , ω3 } s pravdˇepodobnostmi p1 , p2 a (1 − p1 − p2 ) a oznaˇc´ıme-li X, Y poˇcty v´ ysledk˚ u {ω1 , ω2 } v n nez´avisl´ ych opakov´an´ıch tohoto pokusu, potom rozdˇelen´ı pravdˇepodobnosti n´ahodn´eho vektoru (X, Y ) se naz´ yv´a multinomick´ e s parametry n, p1 , p2 a plat´ı P (X = k, Y = l) = pkl =
2! pk1 pl2 . k!l!(2 − k − l)!
Tento pˇr´ıklad lze zobecnit pro k moˇzn´ ych v´ ysledk˚ u s pravdˇepodobnostmi pi , i = 1, . . . k. V n nez´avisl´ ych opakov´an´ıch pokusu bud’ Xi poˇcet v´ yskyt˚ u i-t´eho v´ ysledku. Sdruˇzen´e rozdˇelen´ı pravdˇepodobnosti n´ahodn´eho vektoru (X1 , . . . , Xk ) je k-rozmˇ ern´ e multinomick´ e rozdˇ elen´ım definovan´e pˇredpisem n! px1 1 . . . pxkk P (X1 = x1 , . . . Xk = xk ) = x1 !x2 ! . . . xk ! Pk pro xi splˇ nuj´ıc´ı i=1 xi = n. V pˇr´ıpadˇe k = 2 se jedn´a o binomick´e rozdˇelen´ı. Diskr´etn´ı rozdˇelen´ı n´ahodn´eho vektoru se ˇcasto vyjadˇruje tabulkou. V´ yznam jednotliv´ ych bunˇek v tabulce takov´ehoto rozdˇelen´ı je n´asleduj´ıc´ı: Y
X
x1 .. . xP m
P
y1 p11 .. .
... ... .. .
yn p1n .. .
pX 1 .. .
pm1 pY1
... ...
pmn pYn
pX m 1
Y kde pij = P (X = xi , Y = yj ) a pX i = P (X = xi ), resp. pj = P (Y = yj ).
Pˇ r´ıklad 1.4.2 Podle statistick´eho zkoum´an´ı zamˇestnanosti muˇz˚ u a ˇzen v urˇcit´em regionu byly z´ısk´any tyto v´ysledku: mezi muˇzi je 12% nezamˇestnan´ych, mezi ˇzenami je nezamˇestnan´ych 16%. Sestavte tabulku sdruˇzen´eho rozdˇelen´ı vektoru (X, Y ), kde X reprezentuje pohlav´ı a Y zamˇestnanost. Pˇredpokl´adejme, ˇze ve sledovan´em regionu tvoˇr´ı ˇc´ast muˇzsk´e populace 48%.
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
54
ˇ sen´ı: Necht’ jev {X = 0} znamen´a, ˇze n´ahodnˇe vybran´ Reˇ y ˇclovˇek je muˇz, {X = 1} ˇze je ˇzena. Podobnˇe, jev {Y = 0} bude znamenat nezamˇestnanost, jev {Y = 1} zamˇestnanost. Zadan´e pravdˇepodobnosti lze interpretovat jako P (Y = 0|X = 0) = 0, 12, P (Y = 0|X = 1) = 0, 16 a P (X = 0) = 0, 48. Potom je p00 p01 p10 p11
= = = =
P (Y P (Y P (Y P (Y
= 0|X = 1|X = 0|X = 1|X
= 0).P (X = 0).P (X = 1).P (X = 1).P (X
= 0) = 0, 12.0, 48 = 0, 0576; = 0) = 0, 88.0, 48 = 0, 4224; = 1) = 0, 16.0, 52 = 0, 0832; = 1) = 0, 84.0, 52 = 0, 4368;
Hledan´a tabulka m´a tedy tvar Y
X
P 0 1 0 0,0576 0,4224 0,48 1 0,0832 0,4368 0,52 P 0,1408 0,8592 1
Distribuˇcn´ı funkce F (x, y) se naz´ yv´a absolutnˇ e spojit´ a, jestliˇze existuje nez´aporn´a funkce f (x, y) naz´ yv´a sdruˇ zen´ a hustota pravdˇ epodobnosti, struˇcnˇe hustota, takov´a, ˇze Z x Z y F (x, y) = f (u, v)dudv. −∞
−∞
RR
Zˇrejmˇe mus´ı platit f (x, y)dxdy = 1. Vztah mezi spojitou distribuˇcn´ı R2 funkc´ı a jej´ı hustotou lze vyj´adˇrit pomoc´ı parci´aln´ıch derivac´ı f (x, y) =
∂ 2 F (x, y) ∂x∂y
ˇ ık´ame, ˇze n´ahodn´ pokud derivace F existuje. R´ y vektor s absolutnˇe spojitou distribuˇcn´ı funkc´ı m´a spojit´ e rozdˇ elen´ı. Pravdˇepodobnost P (x1 ≤ X ≤ x2 , y1 ≤ Y ≤ y2 ) je pomoc´ı distribuˇcn´ı funkce vyj´adˇrena jako F (x2 , y2 ) − F (x1 , y2 ) − F (x2 , y1 ) + F (x1 , y1 ) pro kaˇzd´e x1 ≤ x2 , y1 ≤ y2 . Ve spojit´em pˇr´ıpadˇe je Z x2 Z y2 P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) = f (x, y)dxdy. x1
y1
Obr.III.1: Graf hustoty dvourozmˇern´eho rozdˇelen´ı, pravdˇepodobnost P (x1 < X < x2 , y1 < Y < y2 ).
´ ´ VEKTOR 1.4. NAHODN Y
55
Pˇ r´ıklad 1.4.3 Na obr. ?? je graf hustoty f (x, y) = dvourozmˇern´eho norm´aln´ıho rozdˇelen´ı.
1 −x e 2π
2 +y 2 2
, (x, y) ∈ R2
Graf spojit´e hustoty (X, Y ) tvoˇr´ı plochu v R3 . Tento model m˚ uˇze slouˇzit napˇr. jako rozdˇelen´ı n´ahodn´e chyby odhadu velikosti dvourozmˇern´eho objektu. V grafu je zn´azornˇena pravdˇepodobnost P (x1 ≤ X ≤ x2 , y1 ≤ Y ≤ y2 ), kterou lze interpretovat jako objem tˇelesa shora ohraniˇcen´eho plochou hustoty nad obd´elnikovou podstavou hx1 , x2 ) × hy1 , y2 ). Necht’ F (x, y) je sdruˇzen´a distribuˇcn´ı funkce n´ahodn´eho vektoru (X, Y ). Potom margin´ aln´ı distribuˇ cn´ı funkc´ı jeho sloˇzky X nazveme distribuˇcn´ı funkci F X (x) = P (X ≤ x) = lim F (x, y) y→∞
a podobnˇe F Y (y) = P (Y ≤ y) = limx→∞ F (x, y) Margin´ aln´ı rozdˇ elen´ı je tedy obyˇcejn´e rozdˇelen´ı n´ahodn´e veliˇciny. V pˇr´ıpadˇe nutnosti rozliˇsen´ı se uˇz´ıv´a pˇr´ıvlastek sdruˇzen´e rozdˇelen´ı (pravdˇepodobnost, hustota) pro n´ahodn´ y vektor a margin´aln´ı rozdˇelen´ı (pravdˇepodobnost, hustota) pro jeho sloˇzky. Jinak je moˇzn´e tento pˇr´ıvlastek vynechat. Je-li F diskr´etn´ı, jsou margin´ aln´ı pravdˇ epodobnosti rovny X X P (X = xi ) = pX pij , P (Y = yj ) = pYj = pij , i = j
i
v tabulce pˇr´ıkadu 1.4.2 jsou um´ıstˇeny na doln´ım resp. prav´em okraji (angl. margin). U n´ahodn´eho vektoru se spojit´ ym rozdˇelen´ım je margin´ aln´ı hustota fX (x) resp. fY (y) sloˇzky X resp. Y rovna Z ∞ Z ∞ X Y f (x, y)dy, f (y) = f (x, y)dx. f (x) = −∞
−∞
Pˇ r´ıklad 1.4.4 Uvaˇzujme n´ahodn´y vektor X, Y s rovnomˇern´ym rozdˇelen´ım pravdˇepodobnosti nad jednotkov´ym kruhem. Spoˇctˇete margin´aln´ı rozdˇelen´ı jeho sloˇzek. ˇ sen´ı: N´ahodn´ Reˇ y vektor (X, Y ) nab´ yv´a hodnot z jednotkov´eho kruhu K = {(x, y) ∈ R2 : x2 + y 2 = 1}, tedy bude se zˇrejmˇe jednat o spojit´ y n´ahodn´ y vektor. Rovnomˇern´e rozdˇelen´ı v tomto RR pˇr´ıpadˇe znamen´aRRkonstantn´ı hustotu f (x, y) = c, takovou, ˇze mus´ı platit K f (x, y)dxdy = K cdxdy = cπ = 1.
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
56
Odtud dost´av´ame f (x, y) = c = π1 pro vˇsechna (x, y) ∈ K a f (x, y) = 0 jinde. Margin´aln´ı hustotu pro X dostaneme integrac´ı Z √1−x2 Z ∞ 2√ 1 f (x, y)dy = √ dy = 1 − x2 , x ∈ h−1, 1i f X (x) = π −∞ − 1−x2 π Podobnˇe je i f Y (y) =
Z
Z √1−y2
∞
f (x, y)dx = −∞
√
−
1−y 2
1 2p dx = 1 − y 2 , y ∈ h−1, 1i. π π
Pˇ r´ıklad 1.4.5 Najdˇete margin´aln´ı rozdˇelen´ı sloˇzek n´ahodn´eho vektoru s dvourozmˇern´ym norm´aln´ım rozdˇelen´ım z pˇr´ıkladu 1.4.3. 2 2 R R ˇ sen´ı: V tomto pˇr´ıpadˇe lze ps´at f X (x) = ∞ f (x, y)dy = 1 e− x2 ∞ e− y2 dy. Reˇ 2π −∞ −∞ √ R∞ y2 Protoˇze je −∞ e− 2 dy = 2π, dost´av´ame pro sdruˇzenou hustotu z 1.4.3 x2
y2
margin´aln´ı hustotu f X (x) = √12π e− 2 , x ∈ R a obdobnˇe f Y (y) = √12π e− 2 , y ∈ R. Margin´aln´ı rozdˇelen´ı obou sloˇzek je tedy opˇet norm´aln´ı N (0, 1).
1.4.2
Nez´ avislost n´ ahodn´ ych veliˇ cin
ˇ ık´ame, ˇze n´ahodn´e veliˇciny X, Y jsou stochasticky nez´ R´ avisl´ e, jestliˇze jsou jevy {X ≤ x}, {Y ≤ y} stochasticky nez´avisl´e pro kaˇzd´e (x, y) ∈ R2 . Stochastick´a nez´avislost sloˇzek n´ahodn´eho vektoru (X, Y ) je ekvivalentn´ı s kaˇzdou z n´asleduj´ıc´ıch vlastnost´ı: a) Pro kaˇzd´e (x, y) ∈ R2 lze sdruˇzenou distribuˇcn´ı funkci F (x, y) vyj´adˇrit jako souˇcin margin´aln´ıch distribuˇcn´ıch funkc´ı F X (x) a F Y (y), tedy plat´ı F (x, y) = F X (x)F Y (y). b) Pro diskr´etn´ı rozdˇelen´ı plat´ı pro kaˇzd´e i, j Y pij = pX i pj .
c) Pro kaˇzd´e (x, y) ∈ R2 lze sdruˇzenou hustotu f (x, y) vyj´adˇrit jako souˇcin margin´aln´ıch hustot f X (x) a f Y (y), tedy plat´ı f (x, y) = f X (x)f Y (y).
´ ´ VEKTOR 1.4. NAHODN Y
57
Pˇ r´ıklad 1.4.6 Existuje stochastick´a z´avislost mezi pohlav´ım a zamˇestnanost´ı v pˇr´ıkladu 1.4.2? ˇ sen´ı: N´ahodn´e veliˇciny v pˇr´ıkladu 1.4.2 nejsou nez´avisl´e, nebot’ napˇr. Reˇ Y pX 0 p0 = 0, 48.0, 1408 = 0, 067584 6= 0, 0576 = p00 . Pˇ r´ıklad 1.4.7 Jsou sloˇzky vektoru (X, Y ) v pˇr´ıkladu 1.4.4 stochasticky z´avisl´e? ˇ sen´ı: Z v´ Reˇ ypoˇctu margin´aln´ıch hustot v pˇr´ıkladu 1.4.4 je na prvn´ı pohled vidˇet, ˇze jejich souˇcin nem˚ uˇze b´ yt roven konstantn´ı funkci, kterou je sdruˇzen´a hustota. Tedy sloˇzky X a Y tohoto vektoru jsou stochasticky z´avisl´e. Nakonec tohot odstavce si uvedeme jeˇstˇe jedno uˇziteˇcn´e tvrzen´ı: Vˇ eta 1.12 Jsou-l´ı n´ahodn´e veliˇciny X, Y stochasticky nez´avisl´e a g, h jsou spojit´e re´aln´e funkce, potom t´eˇz g(X), h(Y ) jsou stochasticky nez´avisl´e n´ahodn´e veliˇciny.
1.4.3
Charakteristiky n´ ahodn´ eho vektoru
Stˇ redn´ı hodnota n´ ahodn´ eho vektoru E(X, Y ) je definov´ana jako vektor stˇ redn´ıch hodnot (EX, EY ) jeho sloˇzek. Tyto stˇredn´ı hodnoty spoˇcteme bud’ pomoc´ı sdruˇzen´eho rozdˇelen´ı v diskr´etn´ım pˇr´ıpadˇe XX X X X EX = xi pij = xi pij = xi p X i , i
EY
=
j
XX i
yj pij =
j
i
j
i
X
X
X
yj
j
i
pij =
yj pYj .
j
V´ yrazy napravo odpov´ıdaj´ı v´ ypoˇctu stˇredn´ı hodnoty jednorozmˇern´e veliˇciny X, resp. Y s rozdˇelen´ım {pX }, resp. {pYj }. i Ve spojit´em pˇr´ıpadˇe maj´ı tyto rovnosti tvar ZZ Z Z Z EX = xf (x, y)dxdy = x f (x, y)dydx = xf X (x)dx, 2 Z ZR ZR Z R ZR EY = yf (x, y)dxdy = y f (x, y)dxdy = yf Y (y)dy. R2
R
R
R
Kovariance cov(X, Y ) n´ahodn´ ych veliˇcin X, Y je definov´ana jako cov(X, Y ) = E(X − EX)(Y − EY ) = EXY − EXEY
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
58
Ve v´ yrazu se objevuje takzvan´ y sm´ıˇsen´y moment EXY , kter´ y je v diskr´etn´ım pˇr´ıpadˇe roven XX EXY = xi yj pij , i
j
ve spojit´em pˇr´ıpadˇe ZZ xyf (x, y)dxdy.
EXY = R2
Vˇsimnˇete si, ˇze pokud jsou veliˇciny X a Y stochasticky nez´avisl´e, potom je EXY =
XX i
Y xi y j p X i pj =
j
X
xi p X i
i
X
yj pYj = EX.EY,
j
ve spojit´em pˇr´ıpadˇe Z Z ZZ X X Y xf (x)dx yf Y (y)dy = EX.EY. xyf (x)f (y)dxdy = EXY = R2
R
R
Potom je cov(X, Y ) = EXY − EXEY = EXEY − EXEY = 0. Tedy plat´ı tvrzen´ı: pokud jsou X a Y stochasticky nez´avisl´e n´ahodn´e veliˇciny, potom je jejich kovariance vˇzdy rovna nule. Toto tvrzen´ı neplat´ı opaˇcnˇe, jak je uk´az´ano v n´asleduj´ıc´ım pˇr´ıkladu. Pˇ r´ıklad 1.4.8 Spoˇctˇete kovarianci sloˇzek X a Y n´ahodn´eho vektoru z pˇr´ıkladu 1.4.4. ˇ sen´ı: Reˇ EX = EY EXY
1 π
Z Z xdxdy = K
1
Z √1−y2 √
xdxdy = 0,
− 1−y 2 √ Z 1−x2 1
−1
Z 1 ydxdy = ydydx = 0, π −1 −√1−x2 K Z Z Z Z √1−x2 1 1 1 = xydxdy = x ydydx = 0, π π −1 −√1−x2 K 1 = π
Z Z
1 π
Z
nebot’ ve vˇsech pˇr´ıpadech jsou v integrandu lich´e funkce a integruje se pˇres symetrickou oblast. Tedy cov(X, Y ) = 0.
´ ´ VEKTOR 1.4. NAHODN Y
59
Pro tent´ yˇz vektor jsme uk´azali v pˇr´ıkladu 1.4.7 ˇze jeho sloˇzky jsou stochasticky z´avisl´e a pˇresto je jejich kovariance nulov´a. Kovarianˇ cn´ı matice n´ahodn´eho vektoru (X, Y ) m´a tvar V ar(X) cov(X, Y ) D= cov(X, Y ) V ar(Y ) Na diagon´ale m´a tedy rozptyly sloˇzek, mimo diagon´alu jejich kovarianci. Korelaˇ cn´ı koeficient ρ(X, Y ) n´ahodn´ ych veliˇcin X a Y je roven cov(X, Y ) ρ(X, Y ) = p V ar(X)V ar(Y ) Je-li ρ(X, Y ) = 0, potom se n´ahodn´e veliˇciny naz´ yvaj´ı nekorelovan´ e. Vˇ eta 1.13 Plat´ı −1 ≤ ρ(X, Y ) ≤ 1. D´ale ρ(X, Y ) = ±1 pr´avˇe tehdy, kdyˇz pro nˇejak´e a, b re´aln´e konstanty, b 6= 0, plat´ı s pravdˇepodobnost´ı 1 rovnost Y = a + bX, pˇritom znam´enko ρ(X, Y ) se shoduje se znam´enkem b. Vˇ eta 1.14 Jsou-li n´ahodn´e veliˇciny X, Y stochasticky nez´avisl´e, potom je ρ(X, Y ) = 0. Naopak, je-li ρ(X, Y ) 6= 0, potom jsou X a Y stochasticky z´avisl´e. Pokud je ρ(X, Y ) = 0, veliˇciny X, Y jsou pouze nekorelovan´e, to znamen´a ˇze mezi nimi nen´ı line´arn´ı z´avislost, ale mohou b´ yt stochasticky z´avisl´e (jak je uk´az´ano v pˇr´ıkladu 1.4.8. Korelaˇcn´ı koeficient se pouˇz´ıv´a v experiment´aln´ım v´ yzkumu k vyj´adˇren´ı m´ıry line´arn´ı z´avislosti mezi dvˇema n´ahodn´ ymi veliˇcinami. Pˇ r´ıklad 1.4.9 Necht’ X ≈ Exp(1), Y = X 2 . Vypoˇctˇete kovarianˇcn´ı matici a korelaˇcn´ı koeficient ρ(X, Y ). ˇ sen´ı: Uˇzit´ım vzorce pro obecn´e momenty exponenci´aln´ıho rozdˇelen´ı pro Reˇ λ = 1 je EX = 1, EX 2 = 2 = EY, EY 2 = EX 4 = 24, tedy V arX = 1, V arY = 20. Pro v´ ypoˇcet EXY si staˇc´ı uvˇedomit, ˇze EXY = EX 3 = 6, tedy kovariance cov(X, Y ) = 4. Kovarianˇcn´ı matice je tedy 1 4 D= 4 20
60
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
a ρ(X, Y ) = √25 . Mezi X a Y je funkcion´aln´ı z´avislost, tj. hodnoty jedn´e sloˇzky n´ahodn´eho vektoru urˇcuj´ı druhou sloˇzku (v praxi ˇr´ıdk´ y pˇr´ıpad). Ko’ relaˇcn´ı koeficient je kladn´ y, nebot s rostouc´ım X roste Y , ale nedosahuje hodnoty 1, protoˇze z´avislost nen´ı line´arn´ı. N´ahodn´ y vektor (X, Y ) m´a dvourozmˇ ern´ e norm´ aln´ı rozdˇ elen´ı s vektorem stˇredn´ıch hodnot (µ1 , µ2 ) a kovarianˇcn´ı matic´ı σ12 σ12 , σ12 σ22
D= jestliˇze jeho hustota f (x, y) m´a tvar
1 − 1 2 p f (x, y) = e 2(1−ρ ) 2 2πσ1 σ2 (1 − ρ )
„
(x−µ1 )2 (x−µ1 )(y−µ2 ) (y−µ2 )2 −2ρ + 2 2 σ1 σ2 σ1 σ2
«
(x, y) ∈ R2 , kde ρ = σσ112σ2 je korelaˇcn´ı koeficient sloˇzek. Pro |ρ| = 1, kdy X a Y jsou line´arnˇe z´avisl´e, nen´ı hustota definov´ana. Hustotu dvourozmˇern´eho norm´aln´ıho rozdˇelen´ı lze rozloˇzit na souˇcin jednorozmˇern´ ych (margin´aln´ıch) hustot pr´avˇe tehdy, kdyˇz ρ = 0, jak je vidˇet z tvaru exponentu. Lze vyslovit n´asleduj´ıc´ı tvrzen´ı: Vˇ eta 1.15 Necht’ rozdˇelen´ı pravdˇepodobnsti n´ahodn´eho vektoru (X, Y ) je dvourozmˇern´e norm´aln´ı. Potom sloˇzky X a Y jsou stochasticky nez´avisl´e pr´avˇe tehdy, je-li jejich korelaˇcn´ı koeficient ρ(X, Y ) roven nule.
Pˇ r´ıklad 1.4.10 Napiˇste hustotu n´ahodn´eho vektoru (X, Y ) s dvourozmˇern´ym norm´aln´ım rozdˇelen´ım, je-li (µ1 , µ2 ) = (26, −12) a D= ˇ sen´ı: Je ρ = Reˇ
σ12 σ1 σ2
196 −91 −91 169
√ = −0, 5, 1 − ρ =
−2 1 √ e 3 f (x, y) = 182π 3
„
√
3 2
tedy
(x−26)2 (x−26)(y+12) (y+12)2 + + 169 196 182
«
´ ´ VEKTOR 1.4. NAHODN Y
1.4.4
61
Funkce n´ ahodn´ eho vektoru
Uvaˇzujme line´arn´ı funkci h(X, Y ) = aX + bY, a, b jsou re´aln´e konstanty, X, Y n´ahodn´e veliˇciny. Pro stˇredn´ı hodnotu Eh(X, Y ) je zˇrejmˇe (z linearity) E(aX + bY ) = aEX + bEY . D´ale pro rozptyl lze odvodit V ar(aX + bY ) = E(aX + bY )2 − (aEX + bEY )2 = a2 E(X − EX)2 + b2 E(Y − EY )2 + 2abE(X − EX)(Y − EY ) = a2 V arX + b2 V arY + 2ab.cov(X, Y ) Specielnˇe, jsou-li X, Y nekorelovan´e, tj. cov(X, Y ) = 0, potom V ar(aX + bY ) = a2 V arX + b2 V arY . Pˇ r´ıklad 1.4.11 Chcete investovat 10000 Kˇc a rozhodujete se mezi akciemi a kr´atkodob´ymi vkladov´ymi certifik´aty. N´avratnosti z obou zdroj˚ u jsou n´ahodn´e veliˇciny s diskr´etn´ım rozdˇelen´ım pravdˇepodobnost´ı v´ynos˚ u. Znaˇc´ı-li X resp. Y procentn´ı v´ynos z akci´ı resp. certifik´at˚ u, je P(X = -5, Y = 8) = 0,1 P(X = 5, Y = 8) = 0,3
P(X = 5, Y = 5) = 0,3 P(X = 15, Y = 5) = 0,3
a) Najdˇete stˇredn´ı v´ynos µ a smˇerodatnou odchylku σ, (riziko) pro rozloˇzen´ı investic mezi akcie a certifik´aty v pomˇeru 100:0, 50:50, 0:100. b) Najdˇete optim´aln´ı portfolio vzhledem k stˇredn´ımu v´ynosu resp. vzhledem k m´ıˇre rizika. ˇ sen´ı: V´ Reˇ ynos Z je d´an vzorcem√Z = aX + bY , kde a + b = 100 (1% z 10000). Hodnoty µ = EZ a σ = V arZ plynou ze v´ yˇse uveden´ ych vzorc˚ u, kam dosad´ıme po v´ ypoˇctech EX = 7, EY = 6, 2, V arX = 36, V arY = 2, 16, cov(X, Y ) = −5, 4. a) Pro pomˇer a : b = 100 : 0 je µ = 700, σ = 600 pro 50 : 50 je µ = 660, σ = 216, 5 pro 0 : 100 koneˇcnˇe µ = 620, σ = 147. b) Protoˇze EX > EY , nab´ yv´a EZ zˇrejmˇe maxima pro a = 100, b = 0. Optimalizace vzhledem k m´ıˇre rizika pˇredstavuje v´ ypoˇcet v´azan´eho extr´emu V arZ jako funkce a, b. Z Lagrangeovy funkce L(a, b, λ) = a2 V arX + b2 V arY + 2ab.cov(X, Y ) + λ(a + b − 100) odeˇcten´ım rovnic ∂L = 2aV arX + 2b.cov(X, Y ) + λ = 0, ∂L = 2bV arY + 2a.cov(X, Y ) + ∂a ∂b λ = 0 dost´av´ame pod´ıl V arY − cov(X, Y ) a = = 0, 1826 b V arX − cov(X, Y )
62
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Z podm´ınky a + b = 100 tomu odpov´ıd´a pomˇer a : b = 15, 44 : 84, 56 (optim´aln´ı vzhledem k riziku), pro nˇejˇz µ = 632, 4, σ = 99, 6. Uk´azalo se, ˇze nelze doc´ılit souˇcasnˇe vysok´eho v´ ynosu (velk´e µ) a n´ızk´eho rizika (mal´e σ), coˇz bylo patrn´e jiˇz z v´ ypoˇct˚ u v a). Uvaˇzme obecnou funkci h(x, y) dvou promˇenn´ ych a n´ahodn´ y vektor (X, Y ). Potom Z = h(X, Y ) je n´ahodn´a veliˇcina, pro jej´ıˇz distribuˇcn´ı funkci FZ plat´ı: FZ (z) = P (h(X, Y ) ≤ z) coˇz je v diskr´etn´ım pˇr´ıpadˇe rovno X
FZ (z) =
pij
h(xi ,yj )≤z
a pro spojit´e rozdˇelen´ı (X, Y ) s hustotou f (x, y) ZZ FZ (z) = f (x, y)dxdy. h(x,y)≤z
Pˇ r´ıklad 1.4.12 N´ahodn´a veliˇcina Z = 50X+50Y z III.4.2 m´a diskr´etn´ı distribuˇcn´ı funkci FZ (z) danou n´asleduj´ıc´ımi pravdˇepodobnostmi: P (Z = 150) = 0, 1, P (Z = 500) = 0, 3, P (Z = 650) = 0, 3, P (Z = 1000) = 0, 3. Pro v´ ypoˇcet stˇredn´ı hodnoty funkce n´ahodn´eho vektoru nen´ı tˇreba poˇc´ıtat transformovan´e sdruˇzen´e rozdˇelen´ı. Stˇredn´ı hodnotu lze poˇc´ıtat pˇr´ımo podle vztah˚ u XX Eh(X, Y ) = h(xi , yj )pij i
j
pro diskr´etn´ı rozdˇelen´ı a Z Z
2
Eh(X, Y ) =
h(x, y)f (x, y)dxdy R
pro spojit´e rozdˇelen´ı. Pˇ r´ıklad 1.4.13 Pˇri mˇeˇren´ı dvou rozmˇer˚ u souˇc´astky m´a chyba (X, Y ) dvourozmˇern´e norm´aln´ı rozdˇelen´ı s nez´avisl´ymi sloˇzkami, nulov´ym vektorem stˇredn´ıch hodnot a stejn´ymi rozptyly σ12 = σ22 = σ 2 , tedy s hustotou f (x, y) =
1 − x2 +y2 2 e 2σ , (x, y) ∈ R2 2πσ 2
Vypoˇctˇete stˇredn´ √ ı hodnotu a rozptyl celkov´e velikosti chyby dan´e n´ahodnou veliˇcinou Z = X 2 + Y 2 .
´ ´ VEKTOR 1.4. NAHODN Y
63
i ˇ sen´ı: Poˇc´ıt´ame i-t´ Reˇ y obecn´ y moment Z: je Z i = (X 2 + Y 2 ) 2 , tedy Z Z 2 x2 +y 2 1 i 2 2 2i 2σ 2 dxdy. EZ = (x + y ) e 2πσ 2 R
Substituc´ı x = rcosβ, y = rsinβ, jej´ıˇz Jakobi´an je r, dost´av´ame Z 2π Z ∞ r2 1 i i+1 − 2σ 2 EZ = dβ r e dr 2πσ 2 0 0 2
r a s pouˇzit´ım dalˇs´ı substituce t = 2σ 2 Z ∞ √ i i i i i EZ = σ (2t) 2 e−t dt = σ 2 Γ( + 1). 2 0 √ Odsud specielnˇe plyne EZ = σ 2Γ( 32 ) = 1, 253σ. Pomoc´ı druh´eho obecn´eho momentu EZ 2 = 2σ 2 Γ(2) je rozptyl V arZ = EZ 2 − (EZ)2 = 0, 429σ 2 .
64
1.5
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Limitn´ı vˇ ety teorie pravdˇ epodobnosti
Limitn´ı vˇety teorie pravdˇepodobnosti se zab´ yvaj´ı chov´an´ım posloupnosti n´ahodn´ ych veliˇcin. N´ahodn´e veliˇciny X1 , . . . Xn jsou nez´avisl´e, jsou-li jevy {X1 ≤ x1 }, . . . , {Xn ≤ xn } nez´avisl´e pro kaˇzd´e (x1 , . . . , xn ) ∈ Rn . V dalˇs´ım textu budeme ˇcasto mluvit o posloupnosti nez´avisl´ ych, stejnˇe rozdˇelen´ ych 24 n´ahodn´ ych veliˇcin N´ahodn´e veliˇciny X1 , X2 , . . . tvoˇr´ı posloupnost nez´ avisl´ ych, stejnˇ e rozdˇ elen´ ych n´ahodn´ ych veliˇcin, jsou-li pro kaˇzd´e n ∈ N veliˇciny X1 , . . . , Xn nez´avisl´e a maj´ı vˇsechny tut´eˇz distribuˇcn´ı funkci F (x).
1.5.1
Z´ akon velk´ ych ˇ c´ısel
Vˇ eta 1.16 (Bernoulliho z´ akon velk´ ych ˇ c´ısel) Necht’ {Xi }∞ i=1 je posloupnost nez´avisl´ych stejnˇe rozdˇelen´ Pyn ch n´ahodn´ych veliˇcin s alternativn´ım rozdˇelen´ım Alt(p). Poloˇzme Sn = i=1 Xi . Potom pro kaˇzd´e > 0 je lim P (|
n→∞
Sn − p| > ) = 0. n
D˚ ukaz: Pro kaˇzd´e n je Sn ≈ Bin(n, p), ESn = np, V arSn = np(1 − p). Odtud ˇ E Snn = p, V ar Snn = p(1−p) . Podle Cebyˇ sevovy nerovnosti (vˇeta 1.6) je n P (|
Sn p(1 − p) − p| > ) ≤ n n2
pˇri n → ∞ konverguje v´ yraz na prav´e stranˇe k nule pro kaˇzd´e pevn´e > 0. V´ yraz Snn v pˇredchoz´ı vˇetˇe je pomˇern´a ˇcetnost jevu A = {Xi = 1} v n opakov´an´ıch pokusu, je to n´ahodn´a veliˇcina, nebot’ v r˚ uzn´ ych seri´ıch opakov´an´ı nab´ yv´a r˚ uzn´ ych hodnot. Setkali jsme se s n´ı jiˇz v u ´vodn´ı kapitole. Sn Z´akon velk´ ych ˇc´ısel potvrzuje, ˇze pro n → ∞ veliˇcina n konverguje ke konstantˇe – k pravdˇepodobnosti jevu A. Pojem konvergence posloupnosti n´ ahodn´ ych veliˇ cin lze definovat r˚ uzn´ ym zp˚ usobem, ve vˇetˇe 1.16 jde o konvergenci v pravdˇ epodobnosti. N´asleduj´ıc´ı vˇeta ˇr´ık´a (bez pˇredpokladu o koneˇcnosti rozptylu), ˇze aritmetick´ y pr˚ umˇer konverguje ke stˇredn´ı hodnotˇe. ’ To je zobecnˇen´ı vˇety 1.16, nebot pomˇern´a ˇcetnost je pr˚ umˇerem alternativn´ıch veliˇcin a pravdˇepodobnost jevu A jejich stˇredn´ı hodnotou. Tak jsou potvrzeny u ´vahy, kter´e jsme pouˇz´ıvali k ˇcetnostn´ı interpretaci pravdˇepodobnosti. 24
V literatuˇre se m˚ uˇzete setkat se zkratkou iid z anglick´eho independent and identically ” distributed“
ˇ ˇ 1.5. LIMITN´I VETY TEORIE PRAVDEPODOBNOSTI
65
Vˇ eta 1.17 Necht’ {Xi } je posloupnost nez´avisl´ych stejnˇe rozdˇelen´ych n´ahodn´ych veliˇcin se stˇredn´ı hodnotou a. Potom pro kaˇzd´e > 0 je ! n 1 X Xi − a > = 0. lim P n→∞ n i=1
Pˇredchoz´ı vˇetu lze aplikovat k v´ ypoˇctu urˇcit´eho integr´alu metodou Monte Carlo , tj. s pouˇ z it´ ım poˇ c ´ ıtaˇ c ov´ y ch simulac´ı pseudon´ahodn´ ych ˇc´ısel. Pro Rb v´ ypoˇcet a g(x)dx, kde g je re´aln´a funkce jedn´e promˇenn´e, necht’ {Xi } je posloupnost nez´avisl´ ych stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin s rovnomˇern´ ym 1 pro a ≤ x ≤ b a f (x) = 0 rozdˇelen´ım U (a, b), tj. s hustotou f (x) = b−a R Rb 1 jinde. Plat´ı Eg(Xi ) = R g(x)f (x)dx = b−a g(x)dx, podle vˇety 1.17 je pro a kaˇzd´e > 0 ! Z b n b − a X lim P g(Xi ) − g(x)dx > = 0 n→∞ n a i=1
Tento v´ yraz ukazuje, ˇze hledan´ y integr´al lze aproximovat uveden´ ym souˇctem a vede k n´asleduj´ıc´ımu algoritmu: 1) proved’me n opakov´an´ı simulace pseudon´ahodn´eho ˇc´ısla Yi ≈ U (0, 1), 2) spoˇcteme Xi = (b − a)Yi + a, Xi ≈ U (a, b), i = 1, . . . , n, Rb Pn 3) potom a g(x)dx ≈ b−a i=1 g(xi ). n Pˇresnost metody Monte Carlo pˇri v´ ypoˇctu jednoduch´eho integr´alu nen´ı vyˇsˇs´ı neˇz u bˇeˇzn´ ych numerick´ ych metod. V´ıce se v praxi uplatˇ nuje pˇri v´ ypoˇctu sloˇzit´ ych v´ıcen´asobn´ ych integr´al˚ u.
1.5.2
Centr´ aln´ı limitn´ı vˇ eta
Centr´aln´ı limitn´ı vˇety v teorii pravdˇepodobnosti podtrhuj´ı v´ ysadn´ı postaven´ı norm´aln´ıho rozdˇelen´ı jako limitn´ıho pro souˇcty ˇci pr˚ umˇery n´ahodn´ ych veliˇcin s obecn´ ym v´ ychoz´ım rozdˇelen´ım. Tˇechto vˇet je cel´a ˇrada a nejjednoduˇsˇs´ı z nich, takzvan´a Moivreova vˇeta pˇrin´aˇs´ı moˇznost aproximovat binomick´e rozdˇelen´ı norm´aln´ım. Vˇ eta 1.18 Za pˇredpoklad˚ u vˇety ?? poloˇzme Sn − np Zn = p . np(1 − p) Potom limn→∞ P (Zn ≤ x) = Φ(x), x ∈ R.
66
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Jin´ ymi slovy, distribuˇcn´ı funkce normovan´ ych souˇct˚ u Zn (normov´an´ım n´ahodn´e veliˇciny rozum´ıme odeˇcten´ı stˇredn´ı hodnoty a vydˇelen´ı smˇerodatnou odchylkou) konverguje k distribuˇcn´ı funkci Φ normovan´eho norm´aln´ıho rozdˇelen´ı N (0, 1). Pˇ r´ıklad 1.5.1 Jak´a je pravdˇepodobnost, ˇze mezi n = 20000 nez´avisl´ymi v´yrobky bude v´ıc neˇz 100 vadn´ych, je-li pravdˇepodobnost v´yroby vadn´eho p = 0, 004? ˇ sen´ı: Poˇcet zmetk˚ Reˇ u Sn ≈ Bin(n, p). M´ısto v´ ypoˇctu pravdˇepodobnosti binomick´eho rozdˇelen´ı vyuˇzijeme norm´aln´ı aproximaci. Pˇri oznaˇcen´ı z vˇety 1.18 je ! 100 − np = P (Zn > 2, 24) P (Sn > 100) = P Zn > p np(1 − p) a tato pravdˇepodobnost je pˇribliˇznˇe rovna 1 − Φ(2, 24) = 0, 0125. Poznamenejme, ˇze pˇresnost tohoto pˇribliˇzn´eho nahrazen´ı je pomˇernˇe velk´a. Pˇ r´ıklad 1.5.2 Leteck´a spoleˇcnost provozuje linku, na kter´e se pr˚ umˇernˇe 5 procent cestuj´ıc´ıch nedostav´ı k letu. I kdyˇz je vˇsech 67 m´ıst rezervov´ano, letadlo ˇcasto l´et´a s pr´azdn´ymi m´ısty. Spoleˇcnost tedy pl´anuje, ˇze bude pˇrij´ımat rezervaci od n = 69 cestuj´ıc´ıch. Jak´a je pravdˇepodobnost, ˇze nebude m´ısto pro vˇsechny cestuj´ıc´ı s rezervac´ı, kteˇr´ı se k letu dostav´ı? ˇ sen´ı: Cestuj´ıc´ı se dostav´ı k letu nez´avisle na sobˇe s pravdˇepodobnost´ı Reˇ p = 0, 95. Celkov´ y poˇcet pˇr´ıchoz´ıch Sn ≈ Bin(n, p). Pˇresn´ y v´ ypoˇcet d´av´a 69 68 P (Sn > 67) = P (Sn = 69) + P (Sn = 68) = 0, 95 + 69.0, 95 0, 05 = 0, 1344. Protoˇze n nen´ı pˇr´ıliˇs vysok´e, je pˇri pouˇzit´ı norm´aln´ı aproximace tˇreba prov´est korekci pro nahrazen´ı diskr´ etn´ıho rozdˇ elen´ı spojit´ ym. Protoˇze Sn je diskr´etn´ı celoˇc´ıseln´a veliˇcina, jsou zˇrejmˇe jevy {Sn > 67} a {Sn ≥ 68} totoˇzn´e, tedy i jejich pravdˇepodobnosti by mˇely b´ yt stejn´e. Jenˇze pˇri pouˇzit´ı aproximace bez korekce by bylo P (Sn > 67) = P (Zn > 0, 801) ≈ 0, 2118 a souˇcasnˇe P (Sn ≥ 68) = P (Zn ≥ 1, 353) ≈ 0, 0885. Proto vol´ıme kompromis, spoˇc´ıvaj´ıc´ı v tom, ˇze nam´ısto dvou jev˚ u {Sn > 67} a {Sn ≥ 68} budeme uvaˇzovat jev {Sn ≥ 67, 5}, pro kter´ y je P (Sn ≥ 67, 5) = P (Zn ≥ 1, 077) ≈ 1 − Φ(1, 077) = 0, 141, coˇz se jiˇz m´alo liˇs´ı od pˇresn´e hodnoty 0, 1344. Nyn´ı uv´ad´ıme obecnˇejˇs´ı verzi centr´aln´ı limitn´ı vˇety. Vˇ eta 1.19 Necht’ {Xi } je posloupnost nez´avisl´ych stejnˇe rozdˇelen´ych n´ahodn´ ych veliˇcin s koneˇcnou stˇredn´ı hodnotou µ a rozptylem σ 2 . Poloˇzme Sn = P n S√ n −ESn = Sn√−nµ . Potom pro x ∈ R je i=1 Xi , Zn = DSn σ
(n)
lim P (Zn ≤ x) = Φ(x).
n→∞
ˇ ˇ 1.5. LIMITN´I VETY TEORIE PRAVDEPODOBNOSTI
67
Tato vˇeta ˇr´ık´a, ˇze distribuˇcn´ı funkce normovan´ ych souˇct˚ u konverguje k distribuˇcn´ı funkci N (0, 1) rozdˇelen´ı dokonce i pro libovoln´e v´ ychoz´ı rozdˇelen´ı s koneˇcnou stˇredn´ı hodnotou a rozptylem. R1√ Pˇ r´ıklad 1.5.3 Pˇri v´ypoˇctu integr´alu J = 0 xdx metodou Monte Carlo s n = 10000 urˇcete pravdˇepodobnost, ˇze chyba v´ysledku bude menˇs´ı neˇz 10−3 . ˇ sen´ı: Pˇri odhadu chyby potˇrebujeme skuteˇcnou hodnotu J = 2 . Necht’ Reˇ 3 √ 2 1 Xi ≈ U (0, 1), i = 1, . . . , n, jsou nez´ a visl´ e . Je E X = J = , EX i i = 2, 3 √ 1 metodou Monte Carlo tvar tedy V ar i = 18 . Podle IV.1.5 m´ √ Pn X√ Pan odhad 1 J ≈ X . Oznaˇ c me S = X , n i potom ESn = nJ, DSn = i=1 Pn n √ i=1 n i ripraveni pouˇz´ıt vˇetu IV.2.4: i=1 D Xi = 18 . Jsme pˇ Sn −3 P − J < 10 =P n
! √ Sn − nJ p < 10−3 18n = P (|Zn | < 0, 424) n 18
≈ 2Φ(0, 424) − 1 = 0, 328 Pravdˇepodobnost, ˇze odhad se bude liˇsit na tˇret´ım desetinn´em m´ıstˇe, je znaˇcn´a. Pˇ r´ıklad 1.5.4 Kolikr´at je tˇreba zmˇeˇrit fyzik´aln´ı veliˇcinu jej´ıˇz pˇresn´a hodnota je m, abychom mohli s pravdˇepodobnost´ı 0, 96 tvrdit, ˇze pr˚ umˇer tˇechto mˇeˇren´ı se liˇs´ı od m o m´enˇe neˇz 2? Je zn´amo, ˇze smˇerodatn´a odchylka mˇeˇric´ı metody je σ = 4. ˇ sen´ı: Pˇresn´a hodnota m pˇredstavuje stˇredn´ı hodnotu mˇeˇren´ı Xi , i = 1, . . . , Reˇ P n, DXi = σ 2 = 16. Pro Sn = ni=1 je ESn = nm, DSn = 16n, pouˇzit´ım vˇety IV.2.4 dost´av´ame √ √ Sn − nm Sn n n √ < ≈ 2Φ − 1. P − m < 2 = P n 2 2 4 n ´ Posledn´ı v´ yraz m´a b´ yt roven alespoˇ n 0, 96. Upravou t´eto nerovnosti je √ √ n n ≥ 1, 96 a tedy ≥ Φ−1 (0, 96) = 2, 055, 2Φ 2 2 tedy poˇcet mˇeˇren´ı mus´ı b´ yt alespoˇ n 17. Pˇr´ıklad pˇredstavuje u ´lohu pl´anov´an´ı experimentu na z´akladˇe poˇzadavk˚ u na pˇresnost.
68
´ ˇ KAPITOLA 1. ZAKLADY TEORIE PRAVDEPODOBNOSTI
Kapitola 2 Z´ aklady matematick´ e statistiky
69
70
2.1
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
Statistick´ a indukce, n´ ahodn´ y v´ ybˇ er
(Upozornˇen´ı: tento text jeˇstˇe nebyl upraven do koneˇcn´e podoby. Proto zde chybˇej´ı nˇekter´e obr´azky a objevuj´ı se zde odkazy na odstavce, kter´e nejsou oznaˇceny odpov´ıdaj´ıc´ım zp˚ usobem. Tyto nedostatky budou postupnˇe odstraˇ nov´any. Do t´e doby pros´ım o trpˇelivost a omlouv´am se za zt´ıˇzen´e ˇcten´ı. GDo)
2.1.1
´ Uloha statistick´ e indukce
ˇ sen´ı vˇetˇsiny praktick´ Reˇ ych probl´em˚ u v kaˇzdodenn´ım ˇzivot je zaloˇzeno na dostupn´ ych informac´ıch o chov´an´ı re´aln´eho svˇeta. Tyto informace z´ısk´av´ame pozorov´an´ım nebo mˇeˇren´ım. Pˇritom n´as zaj´ımaj´ı nejen kvantitativn´ı znaky, jako je napˇr´ıklad hmotnost, napˇet´ı, rychlost, ale i znaky kvalitativn´ı, napˇr´ıklad druh v´ yrobn´ı technologie, kvalitu, zp˚ usob reakce a dalˇs´ı. Pˇri z´ısk´av´an´ı tˇechto informac´ı ovˇsem nar´aˇz´ıme na ˇradu probl´em˚ u. Nejsme napˇr´ıklad schopni zmˇeˇrit spolehlivost cel´e produkce z´aˇrivek, pokud tuto spolehlivost vyjadˇrujeme v hodin´ach ˇzivotnosti. Podobnˇe nelze zmˇeˇrit kvalitu vˇsech dod´avan´ ych komponent, jejichˇz denn´ı spotˇreba je nˇekolik tis´ıc a kontrola kvality je ˇcasovˇe ˇci finanˇcnˇe n´aroˇcn´a. Dokonce ˇradu veliˇcin, kter´e v mnoha pˇr´ıpadech mˇeˇr´ıme zcela bˇeˇznˇe a bez probl´em˚ u, jako napˇr´ıklad hmotnost, nejsme s rostouc´ım n´arokem na pˇresnost schopni pˇresnˇe“ zmˇeˇrit. Pˇri mˇeˇren´ı totiˇz obvykle nelze ” absolutnˇe vylouˇcit dalˇs´ı p˚ usob´ıc´ı vlivy, nepˇresnosti pˇr´ıstroj˚ u, vliv prostˇred´ı. Pokusy o maxim´aln´ı vylouˇcen´ı tˇechto vnˇejˇs´ıch“ vliv˚ u b´ yvaj´ı ˇcasto velmi ” n´akladn´e a ne vˇzdy u ´spˇeˇsn´e. Pˇresto vˇsak mˇeˇren´ı sledovan´ ych veliˇcin a znak˚ u tvoˇr´ı z´akladn´ı u ´lohu, bez n´ıˇz se neobejdeme a na jej´ımˇz v´ ysledku z´avis´ı naˇse dalˇs´ı z´avˇery, rozhodov´an´ı a ˇcinnost. Zde pˇrich´az´ı ke slovu matematick´ a statistika a jej´ı siln´a zbraˇ n - statistick´ a indukce, jejiˇz princip se pokus´ıme v n´asleduj´ıc´ım textu vyloˇzit. Statistick´ a indukce je induktivn´ı zp˚ usob usuzov´an´ı, pˇri kter´em ˇcin´ıme z´avˇery o n´ahodn´em chov´an´ı a vlastnostech celku - z´ akladn´ıho souboru - na z´akladˇe pozorov´an´ı jeho ˇca´sti - v´ ybˇ eru. Chov´an´ı n´ahodn´e veliˇciny, jakou je napˇr´ıklad hmotnost v´ ylisku, lze popsat jej´ım rozdˇelen´ım pravdˇepodobnosti. Abychom je poznali, museli bychom zn´at pravdˇepodobnosti vˇsech hodnot, kter´e m˚ uˇze tato veliˇcina teoreticky nab´ yvat. My vˇsak m˚ uˇzeme v koneˇcn´em ˇcase prostˇrednictv´ım mˇeˇren´ı pozorovat pouze koneˇcn´ y poˇcet hodnot z t´eto nekoneˇcn´e mnoˇziny. Podobnˇe pˇri mˇeˇren´ı ˇzivotnosti z´aˇrivek, kter´e prob´ıh´a tak, ˇze mˇeˇr´ıme dobu, po kterou z´aˇrivka sv´ıt´ı aˇz do jej´ıho zniˇcen´ı. V tomto pˇr´ıpadˇe provedeme v´ ybˇer z celkov´e produkce a na nˇem zmˇeˇr´ıme sledovanou veliˇcinu. Pˇredpokl´ad´ame, ˇze ostatn´ı z´aˇrivky, kter´e byly vyrobeny za pˇribliˇzne stejn´ ych podm´ınek, budou m´ıt i pˇribliˇznˇe stejnou ˇzivotnost.
´ INDUKCE, NAHODN ´ ´ VYB ´ ER ˇ 2.1. STATISTICKA Y
71
Z pˇredchoz´ıch pˇr´ıklad˚ u je zˇrejm´e, ˇze statistickou indukci lze aplikovat pouze na n´ahodn´e jevy (veliˇciny), kter´e maj´ı statistickou povahu. Rozum´ıme t´ım moˇznost neomezen´eho nez´avisl´eho opakov´an´ı jevu za stejn´ ych“ ” podm´ınek. Posloupnost n mˇeˇren´ı, kter´a jsou na sobˇe nez´avisl´a a prob´ıhaj´ı pokud moˇzno za stejn´ ych podm´ınek, m˚ uˇzeme interpretovat jako realizace n nez´avisl´ ych, stejnˇe rozdˇelen´ ych n´ahodn´ ych veliˇcin X1 , X2 , . . . , Xn . Maj´ı-li vˇsechny tyto veliˇciny pravdˇepodobnostn´ı rozdˇelen´ı s distribuˇcn´ı funkc´ı F (x), ˇrekneme, ˇze se jedn´a o n´ ahodn´ y v´ ybˇ er X = {X1 , X2 , . . . , Xn } o rozsahu n z pravdˇepodobnostn´ıho rozdˇelen´ı F (x). Takto proveden´ y v´ ybˇer povaˇzujeme za reprezentativn´ı. Pod pojmem v´ybˇer budeme nad´ale rozumˇet n´ahodn´ y v´ ybˇer. V´ ysledky statistick´e indukce, a tedy vˇsechny statistick´e metody, jsou zaloˇzeny na namˇeˇren´ ych hodnot´ach, na datech. Na jejich kvalitˇe“ pˇr´ımo ” z´avis´ı i kvalita naˇsich z´avˇer˚ u, to znamen´a co nejvˇernˇejˇs´ı popis re´aln´e situace. Data jsou n´aˇs v´ ychoz´ı materi´al“ a je zˇrejm´e, ˇze ze ˇspatn´ ych“ dat nelze ” ” vyrobit“ dobr´e z´avˇery, podobnˇe jako ze ˇspatn´eho materi´alu nelze sebelepˇs´ım ” obr´abˇen´ım vyrobit kvalitn´ı v´ yrobek. Nejˇcastˇejˇs´ı poˇzadavky kladen´e na v´ ybˇer jsou nez´ avislost a reprezentativnost v´ ybˇeru.
2.1.2
N´ ahodn´ y v´ ybˇ er
Kvalita dat je – kromˇe pˇresnosti – urˇcena pˇredevˇs´ım zp˚ usobem v´ ybˇeru. Zp˚ usoby z´ısk´av´an´ı dat ze z´akladn´ıho souboru se zab´ yv´a ˇca´st statistiky, naz´ yˇ van´a v´ ybˇ erov´ aˇ setˇ ren´ı (viz napˇr. [Ce]). Zde se zkoumaj´ı vlastnosti r˚ uzn´ ych zp˚ usob˚ u v´ ybˇeru. Nejˇcastˇeji prov´ad´ıme n´ahodn´ y v´ ybˇer tak, aby kaˇzd´ y prvek z´akladn´ıho souboru mˇel stejnou pravdˇepodobnost, ˇze bude vybr´an, a aby kaˇzd´ y prvek byl vybr´an nez´avisle na ostatn´ıch vybran´ ych prvc´ıch. V praxi se realizuj´ı i jin´e zp˚ usoby v´ ybˇeru. Napˇr´ıklad tzv. z´ amˇ ern´ y v´ ybˇ er, pˇri kter´em vyb´ır´ame z´amˇernˇe prvky, o nichˇz pˇredpokl´ad´ame, ˇze jsou pro dan´ y soubor typick´ ymi. Prov´ad´ıme jej tehdy, m´ame-li o z´akladn´ım souboru dostatek informac´ı. Dalˇs´ım zp˚ usobem je oblastn´ı v´ ybˇ er. Ten spoˇc´ıv´a v tom, ˇze z´akladn´ı soubor nejprve rozdˇel´ıme do skupin (oblast´ı) a v kaˇzd´e z nich potom prov´ad´ıme n´ahodn´ y v´ ybˇer. V tomto pˇr´ıpadˇe je tˇreba m´ıt kriterium pro rozdˇelen´ı do oblast´ı (napˇr. region´aln´ı pˇr´ısluˇsnost, v´ yrobn´ı rezort apod.). Systematick´ y v´ ybˇ er je zp˚ usob, pˇri nˇemˇz vyb´ır´ame prvky z´akladn´ıho souboru podle pˇredem zvolen´eho kriteria, nesouvisej´ıc´ıho s vyˇsetˇrovan´ ymi znaky (napˇr´ıklad vyb´ır´ame kaˇzdou des´atou vyrobenou souˇc´astku). V praxi se vˇenuje velk´a pozornost takzvan´emu pl´ anov´ an´ı experimentu, pˇri kter´em se - kromˇe jin´eho - stanov´ı i zp˚ usob organizace mˇeˇren´ı, poˇrad´ı atd (podrobnˇeji viz [Li]).
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
72
2.1.3
ˇ Cetnosti, empirick´ e rozdˇ elen´ı
Jak v´ıme jiˇz z prvn´ı ˇca´sti tˇechto skript, vlastnosti n´ahodn´ ych veliˇcin lze odvozovat za pˇredpokladu znalosti jejich rozdˇelen´ı pravdˇepodobnosti. Pˇri pozorov´an´ı re´aln´ ych proces˚ u zpravidla teoretick´e rozdˇelen´ı nezn´ame a k dispozici m´ame jen ˇc´ıseln´e hodnoty x1 , x2 , . . . , xn , kter´e dostaneme pozorov´an´ım (mˇeˇren´ım) n´ahodn´eho v´ ybˇeru X = X1 , X2 , . . . , Xn z tohoto rozdˇelen´ı. Namˇeˇren´e hodnoty x1 , x2 , . . . , xn budeme naz´ yvat pozorov´ an´ı nebo vstupn´ı data. Naˇs´ı snahou obvykle b´ yv´a z´ıskat pˇredstavu o rozdˇelen´ı pravdˇepodobnosti sledovan´e n´ahodn´e veliˇciny X. K tomu pouˇz´ıv´ame empirick´ e rozdˇ elen´ı, z´ıskan´e na z´akladˇe pozorov´an´ı n´ahodn´eho v´ ybˇeru X. Pˇredpokl´adejme, ˇze vstupn´ı data x1 , x2 , . . . , xn leˇz´ı vˇsechna v intervalu ha, bi. Rozdˇelme tento interval body a = a0 < a1 < a2 < · · · < ak = b na k disjunktn´ıch podinterval˚ u (ai−1 , ai i, i = 1, 2, . . . , k, kter´ ym budeme ˇr´ıkat tˇ r´ıdn´ı intervaly nebo jen tˇ r´ıdy. Poˇcet pozorov´an´ı xj , splˇ nuj´ıc´ıch nerovnost ai−1 < xj ≤ ai , nazveme absolutn´ı ˇ cetnost´ı nebo jen ˇ cetnost´ı tˇr´ıdy i a budeme ji znaˇcit ni . Poˇcet vˇsech pozorov´an´ı n´ahodn´eho v´ ybˇeru n nazveme rozsahem v´ ybˇ eru. Pomˇ ern´ e, nebo t´eˇz relativn´ı ˇ cetnosti fi = nni potom lze povaˇzovat za odhad empirick´ eho rozdˇ elen´ı pravdˇepodobnosti jevu, ˇze hodnota sledovan´e n´ahodn´e veliˇciny bude v i-t´em intervalu. Tento postup lze pouˇz´ıt jak pro diskr´etn´ı n´ahodn´e veliˇciny, tak i pro spojit´e (metrick´e) n´ahodn´e veliˇciny. V pˇr´ıpadˇe, ˇze n´ahodn´a veliˇcina m˚ uˇze nab´ yvat pouze koneˇcn´eho a mal´eho poˇctu hodnot, nen´ı tˇreba vytv´aˇret tˇr´ıdn´ı intervaly. V takov´em pˇr´ıpadˇe poˇc´ıt´ame pˇr´ımo ˇcetnosti v´ yskytu jednotliv´ ych hodnot n´ahodn´e veliˇciny v naˇsem v´ ybˇeru. Kromˇe ˇcetnost´ı pracujeme i s takzvan´ ymi kumulativn´ımi ˇcetnostmi. Absolutn´ı kumulativn´ı ˇ cetnost N Pi itˇr´ıdy i je rovna poˇctu pozorov´an´ı xj , pro kter´a a ≤ xj ≤ ai , tedy je Ni = r=1 nr . Podobnˇe pomˇ ern´ a kumulativn´ı P uˇze slouˇzit jako hrub´ y odhad ˇ cetnost je d´ana vztahem Fi = ir=1 fr a m˚ empirick´e distribuˇcn´ı funkce. Pˇ r´ıklad 2.1.1 Uvaˇzujme n´ahodn´y v´ybˇer, pˇri kter´em byly namˇeˇreny n´asleduj´ıc´ı hodnoty hmotnosti 40 v´ylisk˚ u (v gramech): 1114 1119 1122 1109
1105 1135 1124 1120
1121 1128 1112 1128
1120 1122 1102 1132
1118 1116 1121 1117
1132 1108 1135 1118
1121 1111 1123 1122
1115 1118 1128 1108
1128 1118 1116 1125
1110 1119 1131 1119
Sestavte ˇcetnostn´ı tabulku. ˇ sen´ı: Vytvoˇr´ıme-li tˇr´ıdy po 6 gramech, dostaneme n´asleduj´ıc´ı tabulku: Reˇ
´ INDUKCE, NAHODN ´ ´ VYB ´ ER ˇ 2.1. STATISTICKA Y
tˇr´ıdn´ı interval lev´a mez stˇred prav´a mez 1101 1103,5 1106 1107 1109,5 1112 1113 1115,5 1118 1119 1121,5 1124 1125 1127,5 1130 1131 1133,5 1136 souˇcet
73
prost´e ˇcetnosti kumulativn´ı ˇcetnosti absolutn´ı pomˇern´a absolutn´ı pomˇern´a 2 0.050 2 0.050 6 0.150 8 0.200 9 0.225 17 0.425 13 0.325 30 0.750 5 0.125 35 0.875 5 0.125 40 1.000 40 1.000 – –
Pro grafick´e zobrazen´ı ˇcetnost´ı pouˇz´ıv´ame nejˇcastˇeji sloupkov´ y graf, takzvan´ y histogram. Kaˇzd´ y sloupek odpov´ıd´a jedn´e tˇr´ıdˇe (tˇr´ıdn´ımu intervalu) a v´ yˇska sloupk˚ u odpov´ıd´a ˇcetnosti. Dalˇs´ım, ˇcasto pouˇz´ıvan´ ym grafem pro pomˇern´e (relativn´ı) ˇcetnosti je kruhov´ y graf (nebo t´eˇz kol´aˇcov´ y graf). ˇ Cetnosti lze samozˇrejmˇe zobrazit i v jin´ ych typech graf˚ u. Na lev´em obr´azku vid´ıte histogram absolutn´ıch ˇcetnost´ı, na prav´em je graf pomˇern´ ych kumulativn´ıch ˇcetnost´ı: V pˇr´ıpadˇe ˇcetnostn´ı anal´ yzy je d˚ uleˇzit´a volba poˇctu tˇr´ıdn´ıch interval˚ u. Pˇr´ıliˇs mal´ y poˇcet tˇr´ıd povede k
2.1.4
V´ ybˇ erov´ e charakteristiky
V odstavci II.2 tˇechto skript se m˚ uˇzete sezn´amit s ˇradou z´akladn´ıch charakteristik rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny X. V naˇsem pˇr´ıpadˇe, kdy m´ame k dispozici pouze pozorov´an´ı n´ahodn´eho v´ ybˇeru {X1 , X2 , . . . , Xn }, nahrazujeme teoretick´e pravdˇepodobnostn´ı charakteristiky jejich v´ ybˇerov´ ymi protˇejˇsky - statistick´ ymi ukazateli, neboli v´ ybˇ erov´ ymi charakteristikami. V´ ybˇerov´e charakteristiky se vyjadˇruj´ı pomoc´ı statistik. Statistiky jsou n´ahodn´e veliˇciny, kter´e jsou vyj´adˇreny jako funkce v´ ybˇeru, to P jest n´ahodn´ ych n veliˇcin X1 , X2 , . . . , Xn . Takovou statistikou je napˇr´ıklad u ´ hrn i=1 Xi . V´ ybˇerov´e charakteristiky lze spoˇc´ıtat pouze na z´akladˇe znalosti vstupn´ıch dat, bez znalosti parametr˚ u skuteˇcn´eho rozdˇelen´ı. P V´ ybˇ erov´ y k-t´ y obecn´ y moment je statistika m0k = n1 ni=1 Xik , k = P 1, 2, . . . . Prvn´ı obecn´ y v´ ybˇerov´ y moment X = n1 ni=1 Xi je m´ırou polohy a naz´ yv´a se v´ ybˇ erov´ y pr˚ umˇ er. P k V´ ybˇ erov´ y k-t´ y centr´ aln´ı momentje roven mk = n1 ni=1 (Xi −X ), k = 1, 2, . . . . Pomoc´ı druh´eho v´ ybˇerov´eho centr´aln´ıho momentu m2 je definov´an
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
74
Pn 1 n 2 m2 = n−1 v´ ybˇ erov´ y rozptyl s2 = n−1 ybˇ erov´ a smˇ eroi=1 (Xi − X) a v´ √ datn´ a odchylka s = s2 . Obˇe tyto statistiky jsou m´ırami rozpt´ ylenosti, podobnˇe jako variaˇ cn´ı koeficient V = s/X. Pomoc´ı druh´eho, tˇret´ıho a ˇctrvt´eho centr´aln´ıho momentu je definov´an 3 a v´ ybˇ erov´ y koeficient ˇ spiˇ cav´ ybˇ erov´ y koeficient ˇ sikmosti γ3 = m3/2 tosti γ4 =
m4 m2
− 3.
m2
Pˇri v´ ypoˇctu nˇekter´ ych statistik pouˇz´ıv´ame takzvan´ y uspoˇ r´ adan´ y v´ ybˇ er X(1) , X(2) , . . . , X(n) , kter´ y vznikne vzestupn´ ym uspoˇra´d´an´ım prvk˚ u v´ ybˇeru {X1 , X2 , . . . , Xn } podle velikosti jeho realizac´ı {x1 , x2 , . . . , xn }. Prvky X(1) , X(2) , . . . , X(n) uspoˇra´dan´eho v´ ybˇeru naz´ yv´ame poˇ r´ adkov´ ymi statistikami. Tak napˇr´ıklad prvn´ı poˇra´dkov´a statistika X(1) je vlastnˇe n´ahodnou veliˇcinou z v´ ybˇeru, u n´ıˇz byla namˇeˇrena nejmenˇs´ı hodnota, neboli v´ ybˇ erov´ e minimum. Podobnˇe, X(n) je v´ ybˇ erov´ ym maximem. Rozd´ıl X(n) −X(1) naz´ yv´ame v´ ybˇ erov´ ym rozpˇ et´ım. Pomoc´ı poˇr´adkov´ ych statistik definujeme empirickou distribuˇ cn´ı funkci pˇredpisem 0, x < X(1) , Fn (x) = ni , X(i−1) ≤ x < X(i) , i = 1, . . . , n, 1, x ≤ X(n) . 100p% v´ ybˇ erov´ y kvantil je definov´an pro 0 ≤ p ≤ 1 n´asleduj´ıc´ım zp˚ usobem: ( X([np]+1) pokud nen´ı np cel´e ˇc´ıslo, x˜100p = 1 (X(np) + X(np+1) ), pro np cel´e. 2 Tak napˇr´ıklad doln´ı v´ ybˇ erov´ y kvartil x˜25 = X([ n4 ]+1) , pokud je n 1 ˜ = (X( n ) + X n +1 ) pro n dˇeliteln´e 4. Podobnˇe v´ ybˇ erov´ y nedˇeliteln´e 4, 25 2 4 4 1 ˜ n n n medi´ an x˜50 = X([ 2 ]+1) pokud je n lich´e, 50 = 2 (X( 2 ) + X 2 +1 ) pro n ˜ = (X[ 3 n)]+1 , pokud je n nedˇeliteln´e sud´e a horn´ı v´ ybˇ erov´ y kvartil 75 4 ˜ = 1 (X( 3 n) + X 3 n+1 ) pro n dˇeliteln´e 4. Jako m´ıra rozpt´ 4, 75 ylenosti dat se 2 4 4 pouˇz´ıv´a tak´e v´ ybˇ erov´ e mezikvartilov´ e rozpˇ et´ı x˜75 − x˜25 .
2.1.5
Rozdˇ elen´ı nˇ ekter´ ych statistik.
Jelikoˇz jsou statistiky funkcemi n´ahodn´ ych veliˇcin, jsou tak´e n´ahodn´ ymi veliˇcinami. Abychom s nimi mohli pracovat a poznat jejich vlastnosti, je
´ INDUKCE, NAHODN ´ ´ VYB ´ ER ˇ 2.1. STATISTICKA Y
75
tˇreba zn´at jejich rozdˇelen´ı pravdˇepodobnosti. Bohuˇzel, explicitn´ı odvozen´ı rozdˇelen´ı statistik b´ yv´a sloˇzit´e a ne vˇzdy moˇzn´e. Toto rozdˇelen´ı z´avis´ı na rozdˇelen´ı v´ ybˇeru. Zn´ame-li rozdˇelen´ı v´ ybˇeru, m˚ uˇzeme pˇri stanoven´ı statistik postupujeme podle postup˚ u popsan´ ych v kapitole II.5. a III.4. Pˇ r´ıklad 2.1.2 Naleznˇete rozdˇelen´ı v´ybˇerov´eho pr˚ umˇeru pˇri v´ybˇeru z Poissonova rozdˇelen´ı s parametrem λ. ˇ sen´ı: Momentov´a vytvoˇruj´ıc´ı funkce MX (t) Poissonova rozdˇelen´ı je Reˇ MX (t) =
∞ X
tx −λ λ
e e
x=0
x
x!
−λ
=e
∞ X
(λet )x
x=0
1 = exp[λ(et − 1)] x!
Pn . Momentov´a vytvoˇruj´ıc´ı funkce souˇctu T = avisl´ ych veliˇcin j=1 Xj nez´ X1 , X2 , . . . , Xn je podle Vˇety III.3.6 rovna souˇcinu jejich vytvoˇruj´ıc´ıch funkc´ı, a tedy n X MT (t) = exp[λ(et − 1)] = exp[nλ(et − 1)] j=1
. Odtud plyne, ˇze statistika T m´a opˇet Poissonova rozdˇelen´ı s parametrem nλ. Pro v´ ybˇerov´ y pr˚ umˇer X = n1 T potom dost´av´ame rozdˇelen´ı P (X = ω) = P (T = nω) = e−nλ
1 2 (nλ)nω , ω = 0, , , . . . (nω)! n n
. Pˇ r´ıklad 2.1.3 Najdˇete stˇredn´ı hodnotu a rozptyl v´ybˇerov´eho pr˚ umˇeru X ˇ sen´ı: Jsou-li X1 , . . . , Xn nez´avisl´e, stejnˇe rozdˇelen´e n´ahodn´e veliˇciny se Reˇ stˇredn´ı hodnotou µ a rozptylem σ 2 , potom jejich v´ ybˇerov´ y pr˚ umˇer X m´a stˇredn´ı hodnotu n
1X 1X E(X) = E( Xi ) = nE(Xi ) = µ n i=1 n i=1 a rozptyl n 1X 1 X V ar(X) = V ar( Xi ) = 2 nV ar(Xi ) = σ 2 n i=1 n i=1
Pˇ r´ıklad 2.1.4 Uvaˇzujme v´ybˇer {X1 , . . . , Xn } z norm´aln´ıho rozdˇelen´ı N (µ, σ 2 ). Jak´e m´a rozdˇelen´ı pravdˇepodobnosti v´ybˇerov´y pr˚ umˇer X?
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
76
ˇ sen´ı: Podle pˇr´ıkladu III.3.7 m´a souˇcet norm´alnˇe rozdˇelen´ Reˇ ych Pn ych nez´avisl´ veliˇcin opˇet norm´aln´ı rozdˇelen´ı. Tedy statistika T = ıt j=1 Xj bude m´ Pn 1 1 2 rozdˇelen´ı N (nµ, nσ ). Rozdˇelen´ı v´ ybˇerov´eho pr˚ umˇeru X = n j=1 Xj = n T 1 2 bude potom N (µ, n σ ). Z centr´aln´ı limitn´ı vˇety (vˇeta IV.2.4) plyne, ˇze pro v´ ybˇery z libovoln´eho rozdˇelen´ı s koneˇcnou stˇredn´ı hodnotou µ, s koneˇcn´ ym rozptylem σ 2 a s velk´ ym rozsahem n, lze rozdˇelen´ı v´ ybˇerov´eho pr˚ umˇeru pˇribliˇznˇe nahra1 2 dit norm´aln´ım rozdˇelen´ım N (µ, n σ ). Pro praktick´e aplikace jsou v´ yznamn´e v´ ybˇery z rozdˇelen´ı N (µ, σ 2 ). S t´ımto rozdˇelen´ım jsou spojena nˇekter´a dalˇs´ı d˚ uleˇzit´a rozdˇelen´ı pravdˇepodobnosti, s nimiˇz se v t´eto ˇca´sti skript budeme setk´avat. M´a-li n´ahodn´a veliˇcina X rozdˇelen´ı N (0, 1), potom veliˇcina X 2 bude m´ıt tzv. rozdˇelen´ı ch´ı-kvadr´ at s jedn´ım stupnˇ em volnosti, kter´e oznaˇcujeme χ2 (1) a jehoˇz hustotu lze snadno odvodit podle II.5.4. Uvaˇzujme v´ ybˇer X1 , X2 , 2 2 . . . , Xn z rozdˇelen´ı N (0, 1). Potom rozdˇelen´ı statistiky χn = X1 + X22 + · · · + yv´ame jej ch´ı-kvadr´ at o n stupn´ıch volnosti. Xn2 oznaˇcujeme χ2 (n) a naz´ Hustota tohoto rozdˇelen´ı je kladn´a pouze pro kladn´e hodnoty argumentu a pro statistiku χ2n plat´ı E(χ2n ) = n, V ar(χ2n ) = 2n. ´ Upravou vztahu pro v´ ybˇerov´ y rozptyl s2 dostaneme n
n
1 X σ 2 X Xi − µ X − µ 2 s = − ) (Xi − X)2 = ( n − 1 i=1 n − 1 i=1 σ σ 2
√ n a Ui = Xiσ−µ , P Oznaˇcme U0 = X−µ i = 1, . . . , n. Tyto n´ahodn´e veliˇciny σ 1 √ maj´ı rozdˇelen´ı N (0, 1) a plat´ı U0 = n ni=1 Ui . Potom n n n σ2 X 2 U0 X σ2 X 2 2 S = [ U − 2√ Ui + U0 ] = [ U − U02 ]. n − 1 i=1 i n − 1 n−1 i n i=1 2
V [An] je uk´az´ano, ˇze tato statistika m´a rozdˇelen´ı χ2 (n − 1). Jsou-li U a χ2n dvˇe nez´avisl´e n´ahodn´e veliˇciny s rozdˇelen´ım N (0, 1) a χ2 (n), potom rozdˇelen´ı pravdˇepodobnosti statistiky T =
√ U np χ2n
se naz´ yv´a rozdˇ elen´ı t (nebo t´eˇz Studentovo) o n stupn´ıch volnosti, kter´e budeme znaˇcit t(n). Hustota gn (t) tohoto rozdˇelen´ı je symetrick´a kolem nuly. Tedy pro distribuˇcn´ı funkci Gn (t) plat´ı (podobnˇe jako pro distribuˇcn´ı funkci
´ INDUKCE, NAHODN ´ ´ VYB ´ ER ˇ 2.1. STATISTICKA Y
77
standardn´ıho norm´aln´ıho rozdˇelen´ı) Gn (t) = 1 − Gn (−t) a pro 100α%-n´ı kvantily tn (α), definovan´e vztahem Gn (tn (α)) = α, 0 ≤ α ≤ 1, n = 1, 2, . . . , plat´ı vztah tn (α) = −tn (1 − α). ybˇeru {X1 , X2 , . . . , Xn } z rozdˇelen´ı N (µ, σ 2 ). Uvaˇzujme statistiky X a s2 v´ Lze uk´azat, ˇze tyto dvˇe statistiky jsou nez´avisl´e n´ahodn´e veliˇciny, veliˇcina √ (n−1)S 2 U = n X−µ m´ a rozdˇ e len´ ı N (0, 1) a veliˇ c ina Z = m´a rozdˇelen´ı σ σ2 √ √ X−µ U 2 χ (n − 1). Potom statistika T = n − 1 √Z = n s m´a rozdˇelen´ı t(n − 1). Oznaˇcme F =
2 Xm /m 2 Xn /n
2 kde Xm a Xn2 jsou dvˇe nez´avisl´e n´ahodn´e veliˇciny s rozdˇelen´ım χ2 (m) a χ2 (n). Potom rozdˇelen´ı pravdˇepodobnosti statistiky F naz´ yv´ame rozdˇ elen´ım F , (respektive Fisher-Snedeckorov´ ym) o m a n stupn´ıch volnosti budeme jej oznaˇcovat F (m, n). Toto rozdˇelen´ı je asymetrick´e, kladn´e pouze pro kladn´e hodnoty argumentu. Pro jeho 100α% kvantily Fm,n (α) plat´ı pro kaˇzdou dvojici m, n = 1, 2, . . . n´asleduj´ıc´ı vztah
Fm,n (α) =
1 ,0 < α < 1 Fn,m (1 − α)
. Pˇredpokl´adejme, ˇze byly provedeny dva nez´avisl´e v´ ybˇery z rozdˇelen´ı 2 2 2 N (µ1 , σ1 ) a N (µ2 , σ2 ) a rozsaz´ıch m a n. Oznaˇcme S1 a S22 jejich v´ ybˇerov´e rozptyly. Potom statistika 2
F = m´a rozdˇelen´ı F (m − 1, n − 1).
1 (m−1)S1 m−1 σ2 2 (n−1)S 1 2 n−1 σ22
=
S12 S22
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
78
2.2
Odhady parametr˚ u rozdˇ elen´ı n´ ahodn´ e veliˇ ciny
(Upozornˇen´ı: tento text jeˇstˇe nebyl upraven do koneˇcn´e podoby. Proto zde chybˇej´ı nˇekter´e obr´azky a objevuj´ı se zde odkazy na odstavce, kter´e nejsou oznaˇceny odpov´ıdaj´ıc´ım zp˚ usobem. Tyto nedostatky budou postupnˇe odstraˇ nov´any. Do t´e doby pros´ım o trpˇelivost a omlouv´am se za zt´ıˇzen´e ˇcten´ı. GDo) Pˇri statistick´em pozorov´an´ı sledujeme urˇcitou n´ahodnou veliˇcinu, aniˇz bychom znali jej´ı pravdˇepodobnostn´ı charakteristiky. Jedin´a informace, kterou o t´eto veliˇcinˇe m´ame, je skryta v datech, v napozorovan´ ych (namˇeˇren´ ych) hodnot´ach. Proto mus´ıme vˇsechny jej´ı charakteristiky z tˇechto dat odhad” nout“. k tomuto u ´ˇcelu je zamˇeˇrena jedna ˇc´ast matematick´e statistiky, takzvan´a teorie odhadu. Typy odhad˚ u jsou v z´asadˇe tˇri: • odhady rozdˇelen´ı, • odhady parametr˚ u za pˇredpokladu nˇejak´eho rozdˇelen´ı (takzvan´e parametrick´e“ odhady), ” • odhady charakteristik bez pˇredpokladu rozdˇelen´ı pravdˇepodobnosti (tyto odhady oznaˇcujeme jako ”neparametrick´e”). Odhady typu rozdˇelen´ı prov´ad´ıme zpravidla graficky, podle histogramu ˇcetnost´ı ˇci z empirick´e distribuˇcn´ı funkce srovn´an´ım se zn´am´ ymi typy rozdˇelen´ı. V nˇekter´ ych pˇr´ıpadech odhadujeme typ rozdˇelen´ı podle logick´eho ˇci fyzik´aln´ıho modelu experimentu. Takto vytvoˇren´e odhady pot´e ovˇeˇrujeme pomoc´ı statistick´ ych test˚ u (takzvan´e testy dobr´e shody“). ” Parametrick´e odhady a odhady pravdˇepodobnostn´ıch charakteristik rozdˇelujeme jeˇstˇe podle jejich charakteru na • bodov´e odhady a • odhady intervalov´e V prvn´ım pˇr´ıpadˇe dost´av´ame sice pˇresn´e, ale zato zcela nespolehliv´e hodnoty odhaduj´ıc´ı hledan´e charakteristiky. Ve druh´em pˇr´ıpadˇe obdrˇz´ıme nepˇresnˇe urˇcenou hodnotu pomoc´ı intervalu, zato ale v´ıme, ˇze skuteˇcn´a hodnota se v tomto intervalu bude vyskytovat s pˇredem danou, zpravidla dosti vysokou pravdˇepodobnost´ı. V jist´em smyslu se na odhady – nebo pˇresnˇeji na odhadov´e statistiky – d´ıv´ame jako na n´ahodn´e veliˇciny. Sloo ”statistika”je zde pouˇzito ve smyslu ”funkce n´ahodn´eho v´ ybˇeru”, tedy funkce n´ahodn´ ych veliˇcin X1 , X2 , . . . , Xn , coˇz je opˇet n´ahodn´a veliˇcina s pravdˇepodobnostn´ım rozdˇelen´ım, stˇredn´ı hodnotou, rozptylem a vˇsemi dalˇs´ımi charakteristikami.
˚ ROZDELEN ˇ ´I NAHODN ´ ´ VELICINY ˇ 2.2. ODHADY PARAMETRU E 79
2.2.1
Bodov´ e odhady a jejich vlastnosti
V pˇredchoz´ı kapitole jsme popsali nˇekter´e charakteristiky v´ ybˇeru, kter´ y si lze pˇredstavit jako nez´avisl´a pozorov´an´ı jist´e n´ahodn´e veliˇciny, z´ıskan´e pouze na z´akladˇe namˇeˇren´ ych hodnot. V nˇekter´ ych pˇr´ıpadech vˇsak m´ame k dispozici v´ıce informac´ı o v´ ybˇeru, napˇr´ıklad informaci o typu pravdˇepodobnostn´ıho rozdˇelen´ı sledovan´e n´ahodn´e veliˇciny. Potom vyvst´av´a ot´azka identifikace tohoto rozdˇelen´ı, tedy urˇcen´ı - odhad - jeho parametr˚ u na z´akladˇe pozorov´an´ı n´ahodn´e veliˇciny, na z´akladˇe v´ ybˇeru. Pˇredpokl´adejme, ˇze m´ame k dispozici v´ ybˇer X = {X1 , . . . , Xn } z rozdˇelen´ı s distribuˇcn´ı funkc´ı F (x, θ), kde θ = (θ1 , . . . , θk ) je vektor re´aln´ ych parametr˚ u, kter´e nezn´ame. V´ıme o nich pouze to, ˇze leˇz´ı v nˇejak´e mnoˇzinˇe Θ ≤ Rk , v tzv. parametrick´ em prostoru. Nahrad´ıme-li nezn´am´e hodnoty parametr˚ u θ1 , . . . , θk hodnotami statistik (re´aln´ ych funkc´ı v´ ybˇeru) T1 (X), . . . , Tk (X), budeme T (X) = (T1 (X), Tk (X)) naz´ yvat odhadovou statistikou pro parametry (θ1 , . . . , θk ). Jestliˇze za X dosad´ıme hodnoty pozorov´an´ı x, dostaneme tzv. bodov´ y odhad T (x) = (T1 (x), . . . , Tk (x)) tˇechto parametr˚ u, z´ıskan´ y na z´akladˇe pozorov´an´ı x = (x1 , . . . , xn ). Definice 2.1 Bodov´y odhad se naz´yv´a nestrann´ y, jestliˇze pro stˇredn´ı hodnotu odhadov´e statistiky plat´ı E(T ) = θ pro vˇsechna θ ∈ Θ. Neplat´ı-li tato rovnost, pak tento odhad naz´yv´ame vych´ ylen´ ym a rozd´ıl B(θ) = E(T ) − θ je vych´ ylen´ı odhadu T .
Pˇ r´ıklad 2.2.1 Je druh´y centr´aln´ı v´ybˇerov´y moment nestrann´ym odhadem rozptylu? P ˇ sen´ı: Druh´ Reˇ y centr´aln´ı v´ ybˇerov´ y moment je roven M2 (x) = n1 2i=1 (xi − x¯)2 . Zz´ısk´ame jej na z´akladˇe nez´avisl´ ych pozorov´an´ı x1 , . . . , xn n´ahodn´e veliˇciny X. Spoˇcteme-li stˇredn´ı hodnotu E(M2 (X)), dostaneme s pouˇzit´ım v´ ysledku pˇr´ıkladu V.4.2 n
n
X 1 X ¯ 2= 1 ¯ 2= E(M2 (X)) = E (Xi − X) E(Xi − µ + µ − X) n i=1 n i=1 n
1X ¯ − µ) + E(X ¯ − µ)2 ] = [E(Xi − µ)2 − 2E(Xi − µ)(X n i=1 n
1X 2 1 2 1 (σ − σ ) = (1 − )σ 2 n i=1 n n
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
80
Tedy tento odhad nen´ı nestrann´ y a jeho vych´ ylen´ı je − n1 σ 2 . Abychom dostali odhad nevych´ ylen´ y, mus´ıme M2 vyn´asobit konstantou n . T´ım dost´av´ame jin´ y odhad rozptylu, takzvan´ y v´ ybˇ erov´ y rozptyl s2 = n−1 P n 1 ¯ 2 z je nevych´ ylen´ ym odhadem. i=1 (Xi − X) . Tento odhad uˇ n−1 Definice 2.2 Stˇ redn´ı kvadratick´ a chyba odhadu T (X) je hodnota v´yrazu E(T (X) − θ)2 = D(T (X)) + B(θ)2
Pˇ r´ıklad 2.2.2 Spoˇctˇete stˇredn´ı kvadratickou chybu statistiky s2 jako odhadu rozptylu σ 2 n´ahodn´e veliˇciny X na z´akladˇe v´ybˇeru X1 , . . . , Xn . ˇ sen´ı: Jest Reˇ E(s2 − σ 2 )2 = E(s4 ) − 2σ 2 E(s2 ) + σ 4 = E(s4 ) − σ 4 = coˇz je m´enˇe, neˇz pro s2 , nebot’ plat´ı nerovnost z tˇechto dvou odhad˚ u je lepˇs´ı“ v jin´em smyslu. ”
2n−1 n2
<
2n − 1 4 σ , n2
2 . n−1
Tedy kaˇzd´ y
Definice 2.3 Nestrann´y odhad nezn´am´eho parametru θ, kter´y m´a nejmenˇs´ı rozptyl mezi vˇsemi nestrann´ymi odhady T (X) parametru θ, se naz´yv´a nejlepˇ s´ım nestrann´ ym odhadem parametru θ.
Definice 2.4 Plat´ı-li pro skuteˇcnou hodnotu θ a libovoln´e > 0 lim P (|T (X) − θ| ≥ ) = 0,
n→∞
ˇrekneme, ˇze odhad T (X) je konzistentn´ım odhadem parametru θ. Tento poˇzadavek odpov´ıd´a pˇredstavˇe, pˇri kter´e se vzr˚ ustaj´ıc´ım poˇctem mˇeˇren´ı se st´ale v´ıce pˇribliˇzujeme skuteˇcn´e hodnotˇe θ.
Vˇ eta 2.1 Plat´ı-li pro odhad T (X) lim B(θ) = 0a lim D(T (X)) = 0,
n→∞
n→∞
potom odhad T (X) je konzistentn´ım odhadem parametru θ.
˚ ROZDELEN ˇ ´I NAHODN ´ ´ VELICINY ˇ 2.2. ODHADY PARAMETRU E 81 ˇ D˚ ukaz: plyne z aplikace Cebyˇ seovy nerovnosti (viz II.2.11) na pravdˇepodobnost v definici VI.1.7. Pˇ r´ıklad 2.2.3 Ukaˇzte, ˇze pro n´ahodn´y v´ybˇer X1 , . . . , Xn z rozdˇelen´ı se stˇredn´ı hodnotou µ a koneˇcn´ym rozptylem σ 2 , je konzistentn´ım odhadem stˇredn´ı hodnoty aritmetick´y pr˚ umˇer. ˇ sen´ı: Toto tvrzen´ı vypl´ ¯ = Reˇ yv´a pˇr´ımo z pˇr´ıkladu V.4.2. Podle nˇeho je E(X) σ2 ¯ µ a D(X) = n . Odtud ¯ − µ) = E(X) ¯ −µ=0 B(µ) = E(X a ¯ = lim f racσ 2 n = 0 lim D(X)
n→∞
n→∞
a tedy plat´ı pˇredpoklady Tvrzen´ı VI.1.8.
2.2.2
Momentov´ a metoda
Nejjednoduˇsˇs´ı metodou pro konstrukci bodov´ ych odhad˚ u parametr˚ u zn´am´eho rozdˇelen´ı n´ahodn´e veliˇciny je takzvan´a momentov´ a metoda. Pˇri t´eto metodˇe srovn´av´ame obecn´e nebo centr´aln´ı momenty n´ahodn´e veliˇciny s pˇredpokl´adan´ ym rozdˇelen´ım, vyj´adˇren´e pomoc´ı nezn´am´ ych parametr˚ u, s v´ ybˇerov´ ymi momenty spoˇcten´ ymi z namˇeˇren´ ych dat. Pokud pozorovan´a data odpov´ıdaj´ı pˇredpokl´adan´emu rozdˇelen´ı, mˇely by se tyto momenty rovnat. T´ım dost´av´ame soustavu rovnic, v n´ıˇz jako nezn´am´e vystupuj´ı hledan´e parametry. Zˇrejmˇe ˇ sen´ım takov´eto soustaˇc´ı tolik rovnic, kolik parametr˚ u chceme odhadovat. Reˇ stavy jsou potom bodov´e odhady tˇechto parametr˚ u, z´ıskan´e momentovou metodou. Pˇ r´ıklad 2.2.4 Najdˇete bodov´e odhady parametr˚ u norm´aln´ıho rozdˇelen´ı. ˇ sen´ı: Pouˇzijeme momentovou metodu. M´ame odhadnout dva parametry, Reˇ tedy potˇrebujeme dvˇe rovnice. k tomu pouˇzijeme prvn´ı dva obecn´e momenty norm´aln´ıho rozdˇelen´ı N (µ, σ 2 ): M1 = E(X) = µ, M2 = E(X 2 ) = V ar(X) + (E(X))2 = σ 2 + µ2 . Tomu odpov´ıdaj´ ıc´ı v´ ybˇerov´e momenty jsou P m1 = x¯ P = n1 ni=1 xi , m2 = n1 ni=1 x2i . Ze soustavy dvou rovnic
82
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
M1 = m1 , M2 = m2 , dost´av´ame bodov´e odhady parametr˚ u µ a σ 2 momentovou metodou µ ˜ = m1 = x¯ 2 P P σ ˜ 2 = m2 − m21 = n1 ni=1 x2i − n1 ni=1 xi .
2.2.3
Maxim´ alnˇ e vˇ erohodn´ e odhady.
Pˇri hled´an´ı bodov´eho odhadu zpravidla poˇzadujeme, aby byl z urˇcit´eho hlediska co nejlepˇs´ı, tedy napˇr´ıklad nejlepˇs´ı nestrann´ y a z´aroveˇ n konzistentn´ı ’ apod. To je ovˇsem v nˇekter´ ych pˇr´ıpadech nemoˇzn´e, nebot takov´ y odhad ani nemus´ı existovat. Pomˇernˇe nejlepˇs´ı v´ ysledky pˇri hled´an´ı bodov´ ych odhad˚ u poskytuje metoda maxim´ aln´ı vˇ erohodnosti. Odhady z´ıskan´e touto metodou se naz´ yvaj´ı maxim´ alnˇ e vˇ erohodn´ e odhady. Uvaˇzujme n´ahodn´ y v´ ybˇer X1 , . . . , Xn ze spojit´eho rozdˇelen´ı s hustotou f (x, θ), z´avisej´ıc´ı na jednom nezn´am´em parametru θ ∈ Θ. Potom sdruˇzen´a hustota n´ahodn´eho vektoru (X1 , . . . , Xn ) je rovna g(x, θ) = f (x1 , θ)f (x2 , θ) . . . f (xn , θ) (Tento v´ yraz je rozˇs´ıˇren´ım multiplikativn´ı vlastnosti z III.3.1 na n n´ahodn´ ych veliˇcin). Funkci g(x, θ) budeme nyn´ı ch´apat jako funkci promˇenn´e θ pˇri pevn´ ych hodnot´ach x1 , . . . , xn a budeme j´ı ˇr´ıkat vˇ erohodnostn´ı funkce. Nam´ısto t´eto funkce je nˇekdy v´ yhodnˇejˇs´ı pracovat s jej´ım logaritmem a potom budeme mluvit o logaritmick´ e vˇ erohodnostn´ı funkci L(x, θ) = ln(g, (x, θ)). Uvaˇzujme nyn´ı prost´ y n´ahodn´ y v´ ybˇer X1 , . . . , Xn z diskr´etn´ıho rozdˇelen´ı s pravdˇepodobnostmi pi = P (Xi = xi ) = p(xi , θ), z´avisej´ıc´ımi na jednom nezn´am´em parametru theta ∈ Θ. Potom za vˇerohodnostn´ı funkci budeme povaˇzovat funkci g(x, θ) = p(x1 , θ)p(x2 , θ) . . . p(xn , θ) jako funkci promˇenn´e θ a logaritmick´a vˇerohodnostn´ı funkce bude opˇet d´ana vztahem L(x, θ) = ln(g, (x, θ)). Za maxim´alnˇe vˇerohodn´ y odhad parametru θ budeme povaˇzovat tu hodnotu θ ∈ Θ, pˇri kter´e je hodnota vˇerohodnostn´ı funkce maxim´aln´ı (pˇri dan´e realizaci x1 , . . . , xn je nejvˇerohodnˇejˇs´ı“). Z´ısk´ame ji ˇreˇsen´ım tzv. vˇ erohod” nostn´ı rovnice ∂g(x, θ) = 0. ∂θ
˚ ROZDELEN ˇ ´I NAHODN ´ ´ VELICINY ˇ 2.2. ODHADY PARAMETRU E 83 Vzhledem k tomu, ˇze funkce logaritmus je rostouc´ı funkce, lze maximum vˇerohodnostn´ı funkce nal´ezt tak´e maximalizac´ı logaritmick´e vˇerohodnostn´ı funkce, coˇz b´ yv´a nˇekdy v´ yhodnˇejˇs´ı, tj. jako ˇreˇsen´ı logaritmick´ e vˇ erohodnostn´ı rovnice ∂L(x, θ) = 0. ∂θ V´ yˇse popsan´ y postup lze zobecnit na pˇr´ıpad, kdy je nezn´am´ ych parametr˚ u v´ıce, tedy na pˇr´ıpad odhadu vektorov´eho parametru θ = θ1 , . . . , θk . Potom budeme hledat extr´em funkce g(x, θ), resp. L(x, θ). To vede k ˇreˇsen´ı soustavy vˇ erohodnostn´ıch rovnic ∂g(x, θ) = 0, i = 1, 2, . . . , k ∂θi Pˇ r´ıklad 2.2.5 Metodou maxim´aln´ı vˇerohodnosti urˇcete odhad nezn´am´eho parametru p binomick´eho rozdˇelen´ı, je-li n zn´am´e. ˇ sen´ı: Pˇredpokl´adejme, ˇze m´ame k dispozici m nez´avisl´ Reˇ ych pozorov´an´ı x = x1 , . . . , xm n´ahodn´e veliˇciny s t´ımto rozdˇelen´ım. Vˇerohodnostn´ı funkce m´a podle II.3.2 a VI.2.2 tvar m X n xi g(x, n, p) = p (1 − p)n−xi . x i i=1 Zˇrejmˇe v tomto pˇr´ıpadˇe bude v´ yhodnˇejˇs´ı pracovat s logaritmickou vˇerohodnostn´ı funkc´ı m X n L(x, n, p) = ln + xi ln(p) + (n − xi )ln(1 − p) . x i i=1 ˇreˇsit logaritmickou vˇerohodnostn´ı rovnic´ı m
∂L(x, n, p) X = ∂p i=1
m xi n − xi 1X 1 X (n − xi ) = − = mxi − p 1−p p i=1 1 − p i=1 " # m m X X 1 (1 − p) xi − pmn − p xi = 0. (2.1) p(1 − p) i=1 i=1
Za pˇredpokladu p 6= 0 a p 6= 1 (pro p = 0 nebo p = 1 nab´ yv´a vˇerohodnostn´ı funkce nulovou hodnotu, coˇz je jej´ı minimum) dostaneme rovnici (1 − p)m¯ x − pmn − pm¯ x = 0,
84
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
kde x¯ je aritmetick´ y pr˚ umˇer ˇc´ısel x1 , . . . , xm . Posledn´ı rovnost po vydˇelen´ı ˇc´ıslem m bude p¯ x = (1 − p)(n − x¯) a jej´ı ˇreˇsen´ı m´a tvar pˆ = parametru p.
2.2.4
1 x¯, n
coˇz je hledan´ y maxim´alnˇe vˇerohodn´ y odhad
Intervaly spolehlivosti
Odhadov´a statistika T (X) je n´ahodn´a veliˇcina. Bodov´ y odhad θˆ parametru θ je z´ısk´an na z´akladˇe konkr´etn´ıch pozorov´an´ı x1 , . . . , xn jako hodnota T (x) odhadov´e statistiky. Proto lze oˇcek´avat, ˇze takto z´ıskan´a hodnota bude pouze bl´ızko“ skuteˇcn´e hodnotˇe parametru θ. Jak bl´ızko“, to z bodov´eho odhadu ” ” nelze zjistit. Proto se ˇcasto pouˇz´ıvaj´ı tzv. intervaly spolehlivosti. ¯ jsou dvˇe statistiky takov´e, ˇze pro interval (θ, θ) ¯ plat´ı Necht’ θ, θ, ¯ ¯ ¯ = 1 − α, P (θ ∈ (θ, θ)) ¯ tj. pravdˇepodobnost, ˇze skuteˇcn´a hodnota parametru leˇz´ı v tomto intervalu je rovna (1 − α), kde α ∈ (0, 1), nazveme intervelem spolehlivosti pro parametr α s koeficientem spolehlivosti (1 − α). Interval spolehlivosti se ˇcasto tak´e naz´ yv´a 100(1 − α)% intervalem spohlehlivosti nebo t´eˇz konfidenˇ cn´ım intervalem. Pˇ r´ıklad 2.2.6 Najdˇete interval spolehlivosti pro stˇredn´ı hodnotu µ, m´ameli k dispozici n´ahodn´y v´ybˇer z norm´aln´ıho rozdˇelen´ı N (µ, σ 2 ) se zn´amou hodnotou σ. √ ¯ ˇ sen´ı: Ke konstrukci pouˇzijeme statistiku X−µ n, kter´a m´a rozdˇelen´ı N (0, 1) Reˇ σ (viz V.4.2 a II.5.1). Plat´ı tedy rovnost ¯ α X − µ√ n ≤ u(1 − ) = 1 − α, P σ 2 kde u(1 − α2 ) je (1 − α2 ) - kvantil rozdˇelen´ı N (0, 1). Odtud dost´av´ame u ´pravou nerovnosti v z´avorce vztah ¯ − √σ u (1 − α )) < µ < X ¯ + √σ u (1 − α ) = 1 − α, P (X 2 2 n n tedy 100(1 − α)% intervalem spolehlivosti je interval ¯ − √σ u (1 − α ) < µ < X ¯ + √σ u (1 − α ) X 2 2 n n
˚ ROZDELEN ˇ ´I NAHODN ´ ´ VELICINY ˇ 2.2. ODHADY PARAMETRU E 85 Pˇ r´ıklad 2.2.7 Najdˇete interval spolehlivosti pro stˇredn´ı hodnotu µ, m´ameli k dispozici n´ahodn´y v´ybˇer z norm´aln´ıho rozdˇelen´ı N (µ, σ 2 ) s nezn´amou hodnotou σ. ˇ sen´ı: Nezn´ame-li hodnotu ˇza´dn´eho z parametr˚ Reˇ u µ a σ v pˇredchoz´ım pˇr´ıkladˇe, m˚ uˇzeme √ postupovat obdobnˇe, pouze s t´ım rozd´ılem, ˇze pouˇzijeme ¯ n. Tato statistika m´a Studentovo t-rozdˇelen´ı o (n − 1) statistiku X−µ s stupn´ıch volnosti (viz V.4.8), a proto ¯ |X − µ| √ α P n > tn−1 (1 − ) = 1 − α, s 2 kde tn−1 (1 − α2 ) je (1 − α2 )-kvantil rozdˇelen´ı t o (n − 1) stupn´ıch volnosti. Tud´ıˇz interval ¯ + √s t( n − 1)(1 − α ) ¯ − √s t( n − 1)(1 − α ) < µ < X X 2 2 n n je 100(1 − α)% intervalem spolehlivosti µ.
86
2.3
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
Testov´ an´ı statistick´ ych hypot´ ez
(Upozornˇen´ı: tento text jeˇstˇe nebyl upraven do koneˇcn´e podoby. Proto zde chybˇej´ı nˇekter´e obr´azky a objevuj´ı se zde odkazy na odstavce, kter´e nejsou oznaˇceny odpov´ıdaj´ıc´ım zp˚ usobem. Tyto nedostatky budou postupnˇe odstraˇ nov´any. Do t´e doby pros´ım o trpˇelivost a omlouv´am se za zt´ıˇzen´e ˇcten´ı. GDo)
2.3.1
Test statistick´ e hypot´ ezy
Pod pojmem statistick´ e hypot´ ezy si budeme pˇredstavovat jak´ekoli tvrzen´ı o jevu statistick´e povahy. Napˇr´ıklad tvrzen´ı o d´elce ˇzivotnosti v´ yrobku, o nez´avislosti v´ ysledku na pouˇzit´e metodˇe, tvrzen´ı o pravdˇepodobnostn´ım rozdˇelen´ı sledovan´e veliˇciny a podobnˇe. Ovˇeˇrov´an´ı, zda hypot´eza plat´ı ˇci nikoli, je pˇredmˇetem statistick´eho testov´an´ı. Toto prov´ad´ıme na z´akladˇe pozorov´an´ı (mˇeˇren´ı) nˇejak´eho v´ ybˇeru (experimentu). Test statistick´ e hypot´ ezy H proti alternativn´ı hypot´ eze A je rozhodovac´ı pravidlo, podle nˇehoˇz na z´akladˇe realizace n´ahodn´eho v´ ybˇeru rozhodujeme mezi dvˇema tvrzen´ımi - sledovanou hypot´ezou a doplˇ nkovou, tzv. alternativn´ı hypot´ ezou A. V´ ysledkem naˇseho rozhodov´an´ı je bud’ zam´ıtnut´ı hypot´ezy H ve prospˇech alternativy A ˇci jej´ı nezam´ıtnut´ı. Skuteˇcnost, ˇze hypot´ezu nezam´ıt´ame, neznamen´a, ˇze namˇeˇren´a data tto hypot´ezu potvrzuj´ı, ale pouze to, ˇze ji nevyvracej´ı. Toto rozhodovac´ı pravidlo je urˇceno testovou statistikou T (X) a mnoˇzinou ν, kter´e ˇr´ık´ame kritick´ y obor. Vlastn´ı rozhodov´an´ı potom prob´ıh´a pomoc´ı indik´atorov´e funkce ( 1 pokud T (X) ∈ ν, Iν (T (X)) = 0 pokud T (X) ∈ / ν. Pokud je hodnota indik´atorov´e funkce rovna 1, tedy T (X) ∈ ν potom hypot´ezu H zam´ıt´ame. V opaˇcn´em pˇr´ıpadˇe ˇr´ık´ame, ˇze hypot´ezu nelze zam´ıtnout. Naˇse u ´sil´ı pˇritom zamˇeˇr´ıme na konstrukci testu, to znamen´a na urˇcen´ı testov´e statistiky T a kritick´eho oboru ν, pomoc´ı nichˇz budeme moci co nejl´epe rozhodnout o zam´ıtnut´ı hypot´ezy. Pˇ r´ıklad 2.3.1 Pˇri dod´avce rezistor˚ u je pro n´as z hlediska pouˇzitelnosti rozhoduj´ıc´ı velikost odporu souˇc´astky. V´yrobce ud´av´a nomin´aln´ı hodnotu, od n´ıˇz se vˇsak vˇetˇsina namˇeˇren´ych hodnot liˇs´ı. Jak rozhodnout, zda je pro n´as dod´avka pˇrijateln´a.
´ ´I STATISTICKYCH ´ ´ 2.3. TESTOVAN HYPOTEZ
87
ˇ sen´ı: Naˇse mˇeˇren´ı vˇsak m˚ Reˇ uˇze podl´ehat n´ahodn´ ym vliv˚ um. Kontrola dod´avky spoˇc´ıv´a ve stanoven´ı rozhodovac´ıho pravidla, kter´ ym chceme otestovat hypot´ezu, ˇze skuteˇcn´ y odpor je roven nomin´aln´ı hodnotˇe. Pˇri v´ yˇse popsan´em rozhodovac´ım pravidle se m˚ uˇzeme dopustit chyby dvˇema zp˚ usoby. Bud’ budeme pˇr´ıliˇs pˇr´ısn´ı a zam´ıtneme hypot´ezu, kter´a plat´ı - to je chyba prvn´ıho druhu - nebo naopak tuto hypot´ezu nezam´ıtneme, i kdyˇz je nespr´avn´a - v tomto pˇr´ıpadˇe se jedn´a o chybu druh´ eho druhu. Obˇe mohou m´ıt nepˇr´ıjemn´e d˚ usledky, a proto budeme zˇrejmˇe za lepˇs´ı“ ” test povaˇzovat ten test, pˇri kter´em bude pravdˇepodobnost obou chyb co nejmenˇs´ı. Pˇritom zpravidla ˇc´ım menˇs´ı bude pravdˇepodobnost chyby 1. druhu, t´ım vˇetˇs´ı bude pravdˇepodobnost chyby 2. druhu a naopak. V takov´em pˇr´ıpadˇe nelze nal´ezt test minimalizuj´ıc´ı obˇe chyby souˇcasnˇe. Proto postupujeme n´asleduj´ıc´ım zp˚ usobem. Pˇri kontrukci testu poˇzadujeme, aby pravdˇepodobnost chyby 1. druhu byl menˇs´ı nebo rovna dan´emu ˇc´ıslu α, kter´emu ˇr´ık´ame hladina v´ yznamnosti testu. Pˇritom obvykle vol´ıme α = 0, 05; 0, 01 apod. Potom hled´ame testovou statistiku T (X) a kritick´ y obor να , tak aby P (T (X)) ∈ να |Hplati) ≤ α P (T (X)) ∈ / να |H neplat´ı) byla minim´aln´ı. Kritick´ y obor je zpravidla interval, ohraniˇcen´ y tzv. kritick´ ymi hodnotami. Test potom prob´ıh´a tak, ˇze spoˇcteme hodnotu testov´e statistiky, porovn´ame ji s kritick´ ymi hodnotami, odpov´ıdaj´ıc´ımi hladinˇe v´ yznamnosti α, a rozhodneme o zam´ıtnut´ı ˇci nezam´ıtnut´ı hypot´ezy. V nˇekter´ ych pˇr´ıpadech - pˇredevˇs´ım pˇri testov´an´ı pomoc´ı poˇc´ıtaˇce - se pouˇz´ıv´a jin´ y postup. Spoˇcte se hodnota testov´e statistiky a k n´ı nejmenˇs´ı kritick´ y obor, pˇri kter´em bychom jeˇstˇe mohli na z´akladˇe t´eto hodnoty zam´ıtnout hypot´ezu proti dan´e alternativˇe. Hladina v´ yznamnosti, odpov´ıdaj´ıc´ı tomuto kritick´emu oboru, se naz´ yv´a p-hodnota. Kdybychom volili hladinu v´ yznamnosti vˇetˇs´ı, neˇz je tato hodnota, mohli bychom jeˇstˇe hypot´ezu zam´ıtnout. Je-li tato p-hodnota pˇr´ıliˇs mal´a, hypot´ezu zam´ıt´ame. Napˇr´ıklad, spoˇcteme-li pro dan´a data p-hodnotu rovnou 0, 005 znamen´a to, ˇze pro jak´ekoliv α vˇetˇs´ı neˇz 0, 005 bychom mˇeli hypot´ezu zam´ıtnout. Konkr´etnˇe pro α = 0, 01 uˇz hypot´ezu zam´ıt´ame. ˇ Sirokou tˇr´ıdu test˚ u tvoˇr´ı testy hypot´ez o parametrech pravdˇepodobnostn´ıho rozdˇelen´ı. V tomto pˇr´ıpadˇe pˇredpokl´ad´ame, ˇze pravdˇepodobnostn´ı rozdˇelen´ı je urˇcit´eho typu a z´avis´ı na nezn´am´ ych parametrech. Pˇredpokl´adejme, ˇze nezn´am´ y parametr θ m˚ uˇze nab´ yvat hodnot z nˇejak´e mnoˇziny Θ. Uvaˇzujme hypot´ezu H : θ = θ0 . Alternativn´ı hypot´eza m˚ uˇze b´ yt bud’ A : θ 6= θ0 ,
88
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
takzvan´a oboustrann´ a alternativa pˇri t´eto alternativˇe mluv´ıme o oboustrann´ em testu), nebo A1 : θ ≤ θ0 ˇci A2 : θ ≥ θ0 tzv. jednostrann´ e alternativy (jimˇz odpov´ıdaj´ı tzv. jednostrann´ e testy). Funkci Pν (θ), kter´a kaˇzd´e hodnotˇe parametru θ ∈ Θ pˇriˇrad´ı pravdˇepodobnost P (T (X) ∈ ν|θ) naz´ yv´ame silofunkc´ı testu. Je to vlastnˇe pravdˇepodobnost zam´ıtnut´ı hypot´ezy H, m´a-li parametr hodnotu θ. Hodnotu silofunkce v bodˇe θ = θ1 naz´ yv´ame silou testu vzhledem k alternativˇ e θ = θ1 a pouˇz´ıv´ame ji k pro hodnocen´ı kvality testu.
2.3.2
Testy o parametrech norm´ aln´ıho rozdˇ elen´ı
V prvn´ı ˇc´asti tohoto odstavce uvedeme nˇekolik parametrick´ ych test˚ u, kter´e 2 se pouˇz´ıvaj´ı pˇri v´ ybˇeru X = X1 , . . . , Xn z rozdˇelen´ı N (µ, σ ). Tyto testy se zab´ yvaj´ı hypot´ezami o parametrech µ a σ. Pˇritom rozliˇsujeme nˇekolik pˇr´ıpad˚ u: Pˇredpokl´adejme, ˇze hodnotu σ zn´ame. Budeme testovat nulovou hypot´ezu H : µ = µ0 proti alternativˇ yznamnosti α. Test √ e A : µ 6= µ0 na hladinˇe v´ ¯ X−µ n, kter´a m´a, za pˇredpokladu platnosti hypot´ezy, zaloˇz´ıme na statistice σ rozdˇelen´ı N (0, 1). Kritick´ y obor je potom urˇcen nerovnost´ı ¯ − µ| √ |X α n > u(1 − ) σ 2 kde u(1 − α2 ) je (1 − α2 )-kvantil Pn rozdˇelen´ı N (0, 1). Pokud bude hodnota 1 v´ ybˇerov´eho pr˚ umˇeru x¯ = n i=1 xi z´ıskan´a z pozorov´an´ı x1 , . . . , xn leˇzet v intervalu σ α σ α µ0 − √ u(1 − ) < x¯ < µ0 + √ u(1 − ) 2 2 n n hypot´ezu nezam´ıtneme na hladinˇe v´ yznamnosti α. V opaˇcn´em pˇr´ıpadˇe hypot´ezu zam´ıt´ame. Pozn´amka: Srovnejte tento v´ ysledek s intervalem spolehlivosti v VI.3.2. Hypot´ezu H nezam´ıtneme tehdy, kdyˇz hypotetick´a hodnota µ0 bude leˇzet v 100(1 − α)% intervalu spolehlivosti, zkonstruovan´em na z´akladˇe pozorov´an´ı x1 , . . . , xn . Pˇri jednostrann´e alternativˇe A1 : µ < µ0 resp. A2 : µ > µ0 bude kritick´ y obor urˇcen nerovnost´ı x¯ − µ0 √ x¯ − µ0 √ n ≤ u(α), resp. n ≥ u(1 − α) σ σ Jednov´ ybˇ erov´ y t-test. Nejˇcastˇejˇs´ım pˇr´ıpadem je test hypot´ezy H : µ = µ0 proti alternativˇe A : µ 6= µ0 na hladinˇe v´ yznamnosti α pˇri nezn´am´e hodnotˇe σ. Nezn´amou hodnotou σ nahrazujeme jej´ım odhadem S a test zaloˇz´ıme
´ ´I STATISTICKYCH ´ ´ 2.3. TESTOVAN HYPOTEZ
89
√ 0 na statistice x¯−µ n. Plat´ı-li hypot´eza H, m´a tato statistika Studentovo tS rozdˇelen´ı o (n − 1) stupn´ıch volnosti (viz V.4.6). Kritick´ y obor je potom urˇcen nerovnost´ı |¯ x − µ0 | √ α n > tn−1 (1 − ) § 2 kde tn−1 (1 − α2 ) je (1 − α2 )-kvantil rozdˇelen´ı t o n − 1 stupn´ıch volnosti. Pro jednostrann´e testy proti alternativ´am µ < µ0 resp. µ > µ0 bude kritick´ y obor urˇcen nerovnostmi x¯ − µ0 √ x¯ − µ0 √ n ≤ −tn−1 (1 − α) n ≥ tn−1 (1 − α) § § Pro v´ ybˇery o velk´em rozsahu n lze t-test pouˇz´ıt (pˇribliˇznˇe) i bez pˇredpokladu normality v´ ybˇeru. Podle centr´aln´ı limitn´ı vˇety IV.2.4 m´a totiˇz v´ ybˇerov´ y ¯ v limitˇe pro n → ∞ norm´aln´ı rozdˇelen´ı N (µ, σ 2 ) a tedy statistika pr˚ umˇ e r X x ¯−µ0 √ n m´a pˇribliˇznˇe Studentovo t-rozdˇelen´ı o (n − 1) stupn´ıch volnosti. § Chceme-li testovat hypot´ezu o rozptylu H : σ 2 = σ02 proti alternativˇe 2 yznamnosti α, m˚ uˇzeme pouˇz´ıt statistiku (n−1)S , A : σ 2 6= σ02 na hladinˇe v´ σ2 kter´a m´a za platnosti hypot´ezy (viz V.4.6) rozdˇelen´ı χ o n − 1 stupn´ıch 1 Σ( i = 1)n (xi − volnosti. Oznaˇcme s2 hodnotu v´ ybˇerov´eho rozptylu s2 = n−1 x¯), z´ıskanou z pozorov´an´ı x1 , . . . , xn . V tomto pˇr´ıpadˇe je kritick´ y obor pro 2 2 oboustrannou alternativu A : σ 6= sigma0 urˇcen nerovnostmi )σ02 χ( n − 1)2 ( α2 )σ02 χ( n − 1)2 ( 1−α 2 a < s2 s < n−1 n−1 2
zat´ımco pro jednostrann´e alternativy A1 : σ 2 < σ02 resp. A2 : σ 2 > σ02 dostaneme kritick´e obory s2 <
χ( n − 1)2 (1 − α)σ02 χ( n − 1)2 (α)σ02 resp. < s2 , n−1 n−1
symbol χ( n − 1)2 (α) zde oznaˇcuje α-kvantil ch´ı-kvadr´at rozdˇelen´ı o (n − 1) stupn´ıch volnosti. P´ arov´ y t-test. Sledujeme-li na jednom objektu dva podobn´e znaky z´aroveˇ n, pouˇz´ıv´ame n´ahodn´ y v´ ybˇer dvojic n´ahodn´ ych veliˇcin {(X1 , Y1 ), . . . , (Xn , Yn )}. O veliˇcin´ach Xi a Yi pˇredpokl´ad´ame, ˇze jsou p´ arovˇ e z´ avisl´ e. Napˇr´ıklad mˇeˇren´ı vlastnosti materi´alu pˇred tepeln´ ym zpracov´an´ım a po nˇem na vybran´ ych n vzorc´ıch. Pˇredpokl´adejme, ˇze {X1 , . . . , Xn } je n´ahodn´ y v´ ybˇer z norm´aln´ıho rozdˇe2 len´ı N (µX , σ ) a Y1 , . . . , Yn je n´ahodn´ y v´ ybˇer z rozdˇelen´ı N (µY , σY2 ). Veliˇciny
90
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
Xi a Yi mohou b´ yt p´arovˇe z´avisl´e. Budeme testovat hypot´ezu o rovnosti stˇredn´ıch hodnot H : µX = µY proti alternativˇe A : µX 6= µY na hladinˇe v´ yznamnosti α. V tomto pˇr´ıpadˇe budeme m´ısto p˚ uvodnˇe sledovan´ ych veliˇcin (X1 , Y1 ), . . . , (Xn , Yn ) pracovat s veliˇcinami Z1 , . . . , Zn , kde Zi = Yi − Xi , i = 1, . . . , n. Protoˇze Xi a Yi maj´ı norm´aln´ı rozdˇelen´ı, bude se i veliˇcina Z ˇr´ıdit norm´aln´ım rozdˇelen´ım se stˇredn´ı hodnotou µZ = µY − µX a rozptylem σZ2 , o jehoˇz vztahu k rozptyl˚ um σX a σY nelze vzhledem k moˇzn´e z´avislosti nic pˇredpokl´adat. Rovnost stˇredn´ıch hodnot X a Y je ekvivalentn´ı nulovosti stˇredn´ı hodnoty rozd´ılu Z. Pro aritmetick´ y pr˚ umˇer plat´ı z¯ = x¯ − y¯ a hodnotu 2 v´ ybˇerov´eho rozptylu sZ spoˇcteme podle vztahu 1 Σn (xi − yi − x¯ + y¯)2 . s2Z = n − 1 n=1 K testu hypot´ezy H : µZ = 0 na hladinˇe v´ yznamnosti α pouˇzijeme jednov´ ybˇerov´ y t-test (viz VII.2.2), tedy pˇri oboustrann´e alternativˇe A : µ 6= 0 hypot´ezu H zam´ıtneme, pokud sZ sZ α α z¯ = − √ tn−1 (1 − ) nebo √ tn−1 (1 − ) < z¯. 2 2 n n Jsou-li veliˇciny X a Y nez´avisl´e, pouˇz´ıv´ame pro srovn´an´ı stˇredn´ıch hodnot dvou v´ ybˇer˚ u dvouv´ ybˇ erov´ y t-test. Necht’ X1 , . . . , Xn je v´ ybˇer z rozdˇelen´ı 2 2 N (µX , σX ) a Y1 , . . . , Ym je v´ ybˇer z rozdˇelen´ı N (µY , σY ) a tyto v´ ybˇery jsou na sobˇe nez´avisl´e. Rozliˇsujeme dva pˇr´ıpady: 2 (1) Oba v´ ybˇery maj´ı stejn´ e rozptyly σX = σY2 . Potom statistika ¯ − Y¯ r mn X , T = S m+n kde n 1 ¯ 2 + Σm (Yj − Y¯ )2 Σi=1 (Xi − X) S2 = j=1 m+n−2 m´a za platnosti nulov´e hypot´ezy H : µX = µY Studentovo t-rozdˇelen´ı o m+n−2 stupn´ıch volnosti. Test uveden´e hypot´ezy proti oboustrann´e alternativˇe A : µX 6= µY na hladinˇe v´ yznamnosti α lze tedy zaloˇzit na nerovnosti r y¯ − x¯ mn 1 ≥ tm+n−2 (1 − α). S m+n 2 Test hypot´ezy H proti jednostrann´ ym alternativ´am A1 : µX ≤ µY , resp. A2 : µX ≥ µY na hladinˇe v´ yznamnosti α je zaloˇzen na nerovnostech r y¯ − x¯ mn ≥ tm+n−2 (1 − α), S m+n r y¯ − x¯ mn ≥ tm+n−2 (α) = −tm+n−2 (α)(1 − α) S m+n
´ ´I STATISTICKYCH ´ ´ 2.3. TESTOVAN HYPOTEZ
91
2 (2) Oba v´ ybˇery maj´ı r˚ uzn´ e rozptyly σX 6= σY2 . Potom pouˇzijeme pˇribliˇzn´ y test, zaloˇzen´ y na statistice
¯ − Y¯ 1 1 X , kde Se2 = s2X + s2Y . Te = n m Se Test hypot´ezy H : µX = µY proti oboustrann´e alternativˇe na hladinˇe v´ yznamnosti α lze zaloˇzit na nerovnosti 1 1 2 α 1 2 α |¯ y − x¯| ≥ sX tn−1 (1 − ) + sY tm−1 (1 − ) 2 m 2 Se Se2 n na nerovnosti 1 1 2 1 2 y¯ − x¯ ≥ sX tn−1 (1 − α) + sY tm−1 (1 − α) m Se Se2 n pˇri jednostrann´e alternativˇe A1 : µX ≤ µY a na 1 2 y¯ − x¯ 1 1 2 sX tn−1 (1 − α) + sY tm−1 (1 − α) ≤− m Se Se2 n pˇri alternativˇe A2 : µX ≥ µY . Pˇ r´ıklad 2.3.2 Pˇri zpracov´an´ı je tˇreba materi´al zahˇr´at na vysokou teplotu. Pˇred zpracov´an´ım bylo vybr´ano n´ahodnˇe 10 vzork˚ u a zmˇeˇrena jejich tvrdost. Po zpracov´an´ı bylo opˇet vybr´ano n´ahodnˇe jin´ych 10 vzork˚ u, na nichˇz byla zmˇeˇrena tvrdost. Namˇeˇren´e hodnoty jsou v n´asleduj´ıc´ı tabulce: pˇred po
3,15 3,21
2,98 2,99
3,00 3,11
2,75 2,91
3,21 3,22
3,33 3,28
2,95 3,09
2,81 3,00
3,26 3,28
2,88 2,99
Testujte hypot´ezu, ˇze se tvrdost materi´alu vlivem zpracov´an´ı nemˇen´ı. ˇ sen´ı: Je m = n = 10. Spoˇcteme x¯ = 3, 032, y¯ = 3, 108, s2 = 0, 03875, s2 = Reˇ x y 0, 018. Za pˇredpokladu, ˇze rozptyl pˇred i po zpracov´an´ı z˚ ust´av´a stejn´ y (namˇeˇren´ y rozd´ıl je nev´ yznamn´ y), pouˇzijeme postup, popsan´ y v VII.2.6.a). Dostaneme hodnotu s2 = 0, 02838 a testov´e statistiky T = 1, 009. Pˇri hladinˇe v´ yznamnosti α = 0, 05 je t1 8(0, 975) = 2, 101 a tedy hypot´ezu nelze zam´ıtnout. Pˇ r´ıklad 2.3.3 Uvaˇzujme stejnou u ´lohu jako v pˇredchoz´ım pˇr´ıkladu, pouze s t´ım rozd´ılem, ˇze sledovan´a veliˇcina je mˇeˇrena pˇred i po zpracov´an´ı na 10 vzorc´ıch, kter´e byly n´ahodnˇe vybr´any pˇred zaˇc´atkem experimentu. Namˇeˇren´a data z˚ ust´avaj´ı stejn´a.
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
92
ˇ sen´ı: V tomto pˇr´ıpadˇe je tˇreba vz´ıt do u Reˇ ´vahy z´avislost, kter´a zde m˚ uˇze b´ yt zp˚ usobena dalˇs´ımi vlastnostmi vzork˚ u. Proto pouˇzijeme p´arov´ y t-test. Dost´av´ame z¯ = x¯ − y¯ = −0, 076, sz = 0, 07777. Testov´a statistika zde bude m´ıt hodnotu T = 3, 09, kterou budeme srovn´avat s ˇc´ıslem t9 = (0, 975) = 2, 262. V tomto pˇr´ıpadˇe hypot´ezu zam´ıtneme. Uveden´e pˇr´ıklady ukazuj´ı, jak´ y vliv na v´ ysledek m˚ uˇze m´ıt tzv. n´avrh experimentu. Druh´ y pˇr´ıpad l´epe vystihuje skuteˇcnost, ˇze namˇeˇren´a data nejsou nez´avisl´a a bere do u ´vahy dalˇs´ı moˇzn´e vlivy, plynouc´ı z individuality vzork˚ u. 2 Uvaˇzujme dva nez´avisl´e v´ ybˇery: X1 , . . . , Xn z rozdˇelen´ı N (µX , σX ) a 2 Y1 , . . . , Yn z rozdˇelen´ı N (µY , σY ) m˚ uˇzeme prov´est tzv. test shody rozptyl˚ u 2 neboli F-test. K testu hypot´ezy H : σX = σY2 lze pouˇz´ıt napˇr´ıklad statistiku F =
2 SX SY2
Rozdˇelen´ı statistiky F je podle V.4.6 a V.4.9 za pˇredpokladu H rozdˇelen´ım F o (n − 1) a (m − 1) stupn´ıch volnosti. Kritick´ y obor pro test hypot´ezy 2 2 yznamnosti α je H proti oboustrann´e alternativˇe A : σX 6= σY na hladinˇe v´ urˇcen nerovnostmi s2X α s2X α 1 ≥ F (1 − )a 2 ≤ Fn−1,m−1 ( ) = n−1,m−1 2 sY 2 sY 2 Fn−1,m−1 (1 − α2 ) kde Fn,m (α) je α-kvantil rozdˇelen´ı F (n, m). Tedy hypot´ezu zam´ıt´ame pro mal´a F bl´ızk´a nule a pro velk´a F (pˇri platnosti hypot´ezy by mˇelo b´ yt F bl´ızk´e 2 1). Kritick´e obory pro test hypot´ezy H proti alternativ´am A1 : σX ≥ σY2 2 yznamnosti α jsou urˇceny nerovnostmi ≤ σY2 na hladinˇe v´ A2 : σX s2X s2X 1 ≥ F (1 − α)resp. ≤ Fn−1,m−1 (α) = (1 − α) n−1,m−1 2 2 sY sY Fn−1,m−1
2.3.3
Testy dobr´ e shody
Zat´ımco pˇri parametrick´ ych testech pˇredpokl´ad´ame, ˇze typ rozdˇelen´ı v´ ybˇeru je zn´am, testy dobr´ e shody provˇeˇruj´ı hypot´ezy pr´avˇe o typu rozdˇelen´ı, z nˇehoˇz byl v´ ybˇer poˇr´ızen. Jedn´a se tedy o hypot´ezy o shodˇe teoretick´eho a empirick´eho rozdˇelen´ı. Test hypot´ezy, ˇze n´ahodn´ y v´ ybˇer poch´az´ı z rozdˇelen´ı se spojitou zn´amou distribuˇcn´ı funkc´ı F0 (x), m˚ uˇzeme prov´est pomoc´ı takzvan´eho KolmogorovSmirnovova testu. Tento test je zaloˇzen na statistice D = supx∈R |Fn (x) − F0 (x)| ,
´ ´I STATISTICKYCH ´ ´ 2.3. TESTOVAN HYPOTEZ
93
kde empirick´a distribuˇcn´ı funkce Fn (x) je definov´ana v paragrafu V.3.6. Pomoc´ı t´eto definice lze statistiku D zapsat tak´e ve tvaru i − 1 i D = max1≤i≤n max F0 (X(i) ) − , F0 (X(i) ) − n n Hypot´eza H : F (x) = F0 (x) bude zam´ıtnuta na hladinˇe v´ yznamnosti α ve prospˇech alternativy A : F (x) 6= F0 (x) alespoˇ n pro jedno x, jestliˇze D ≤ Dn (1 − α), pˇriˇcemˇz hodnoty Dn (1 − α) jsou mal´a n tabelov´any viz [Ja]) a pro velk´a n(n > 100) lze pouˇz´ıt aproximaci (viz [Zv]) Dn (1 − α) ∼ =
r −
1 α ln . 2n 2
Tento test lze spr´avnˇe pouˇz´ıt pouze pro takov´e hypot´ezy, kter´e urˇcuj´ı funkci F0 , jednoznaˇcnˇe, vˇcetnˇe jej´ıch parametr˚ u. 2 χ -test dobr´ e shody vych´az´ı z tˇr´ıdn´ıho rozdˇelen´ı n´ahodn´eho v´ ybˇeru. Nejprve tedy provedeme rozklad namˇeˇren´ ych hodnot do disjunktn´ıch tˇr´ıdn´ıch interval˚ u pomoc´ı zvolen´eho dˇelen´ı a0 < a1 < a2 < · · · < ak a spoˇcteme ˇcetnosti ni (viz V.2.1). D´ale spoˇcteme hypotetick´e pravdˇepodobnosti pi = F0 (ai ) − F0 (ai−1 ). Pˇri volbˇe tˇr´ıdn´ıch interval˚ u se doporuˇcuje dodrˇzet z´asadu aby teoretick´e ˇcetnosti npi pro vˇsechna i byly vˇetˇs´ı nebo alespoˇ n rovny ˇc´ıslu 5. Hypot´ezu, ˇze v´ ybˇer je z rozdˇelen´ı s distribuˇcn´ı funkc´ı F0 (x) potom testujeme pomoc´ı statistiky (ni − npi )2 χ2 = Σki=1 npi Pˇri tomto postupu je tˇreba rozliˇsit dva pˇr´ıpady: a) Hypot´ezu urˇcuje distribuˇcn´ı funkci jednoznaˇcnˇe, vˇcetnˇe parametr˚ u. Potom 2 m´a statistika χ asyptoticky, to znamen´a pˇribliˇznˇe pro velk´a n, rozdˇelen´ı χ2 (k − 1). Bude-li tedy χ2 ≥ χ2k−1 (1 − α) kde χ2k−1 (1 − α) je (1 − α)-kvantil rozdˇelen´ı χ2 (k − 1) zam´ıtneme nulovou hypot´ezu H : X1 , . . . , Xn poch´az´ı z rozdˇelen´ı s distribuˇcn´ı funkc´ı F0 (x) proti alternativˇe A :toto rozdˇelen´ı je jin´e, na hladinˇe v´ yznamnosti α b) Teoretick´e ˇcetnosti pi z´avis´ı na l nezn´am´ ych parametrech. V takov´em pˇr´ıpadˇe pouˇzijeme pˇri v´ ypoˇctu pi odhady tˇechto parametr˚ u. Pˇritom se sn´ıˇz´ı poˇcet stupˇ n˚ u volnosti rozdˇelen´ı statistiky χ2 pr´avˇe o poˇcet odhadnut´ ych parametr˚ u na (k − 1 − l). Kritick´ y obor pˇri hladinˇe v´ yznamnosti α potom bude d´an nerovnost´ı χ2 ≥ χ2k−1−l (1 − α)
94
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
V praxi se ˇcasto pouˇz´ıv´a tzv. pˇredpokladu normality, t.j., ˇze n´ahodn´ y v´ ybˇer poch´az´ı z norm´aln´ıho rozdˇelen´ı s urˇcitou stˇredn´ı hodnotou a nˇejak´ ym, bl´ıˇze neurˇcen´ ym rozptylem. K ovˇeˇren´ı tohoto pˇredpokladu lze pouˇz´ıt testy normality zaloˇzen´e na v´ ybˇerov´ ych koeficientech ˇ sikmosti A3 a ˇ spiˇ catosti A4 . Pro tyto statistiky (viz. V.3.4) plat´ı n´asleduj´ıc´ı vztahy: 6(n−2) E(A3 ) = 0, V ar(A3 ) = (n+1)(n+3) 24n(n−2)(n−3) 6 E(A4 ) = − n+1 , V ar(A4 ) = (n+1) 2 (n+3)(n+5) √ √ pˇriˇcemˇz nA3 a nA4 maj´ı pˇri n → ∞ pˇribliˇznˇe norm´aln´ıho rozdˇelen´ı. Test zaloˇzen´ y na ˇsikmosti zam´ıtnˇe hypot´ezu o normalitˇe, pokud
α |A3 | p ≥ u(1 − ) 2 V ar(A3 ) test zaloˇzen´ y na ˇspiˇcatosti zam´ıtne hypot´ezu o normalitˇe, pokud |A4 − E(A4 )| α p ≥ u(1 − ) 2 V ar(A4 ) kde u(1 − α2 ) je (1 − α2 )-kvantil rozdˇelen´ı N (0, 1). Hladina v´ yznamnosti obou test˚ u je asymptoticky rovna α. Pˇri ovˇeˇrov´an´ı normality je vhodn´e prov´est oba testy. Hypot´ezu nezam´ıtneme teprve tehdy, pokud ji nelze zam´ıtnout obˇema testy z´aroveˇ n. Tyto testy jsou v nˇekter´ ych pˇr´ıpadech citlivˇejˇs´ı na poruˇsen´ı normality neˇz χ2 test, podrobnˇejˇs´ı informace nalezne ˇcten´aˇr v [An]. Pˇ r´ıklad 2.3.4 Pomoc´ı test˚ u ˇsikmosti a ˇspiˇcatosti testujte normalitu dat z pˇr´ıkladu V.2.3. ˇ sen´ı: Pro v´ Reˇ ybˇerov´e koeficienty ˇsikmosti a ˇspiˇcatosti dost´av´ame hodnoty A3 = −0, 005364, E(A3 ) = 0, D(A3 ) = 0, 129325, A4 = −0, 393762, E(A4 ) = −0, 146341, D(A4 ) = 0, 414962. Testov´a statistika pro test zaloˇzen´ y na ˇsikmosti n´am d´av´a hodnotu 0,015 a statistika pro test zaloˇzen´ y na ˇspiˇcatosti je rovna 0, 384. Porovn´an´ım s 0, 975-kvantilem standardn9ho norm´aln´ıho rozdˇelen´ı u(0, 975) = 1, 96 tedy nelze zam´ıtnout hypot´ezu o normalitˇe na hladinˇe v´ yznamnosti α = 0, 05 ani jedn´ım z test˚ u.
2.3.4
Nˇ ekter´ e neparametrick´ e testy
Znam´ enkov´ y test je test o hodnotˇe medi´anu (viz V.3.7). Pˇredpokl´ad´ame, ˇze v´ ybˇer X1 , . . . , Xn je z rozdˇelen´ı se spojitou distribuˇcn´ı funkc´ı F (x). Budeme testovat hypot´ezu H : xf e xf 50 = x0 proti alternativˇ 50 6= x0 na hladinˇe v´ yznamnosti α. Vytvoˇr´ıme posloupnost rozd´ıl˚ u X 1 − x0 , . . . , X n − x0 .
´ ´I STATISTICKYCH ´ ´ 2.3. TESTOVAN HYPOTEZ
95
Oznaˇcme Z poˇcet ˇclen˚ u t´eto posloupnosti s kladn´ ym znam´enkem a m poˇcet nenulov´ ych rozd´ıl˚ u. Z je n´ahodn´a veliˇcina s binomick´ ym rozdˇelen´ım (viz II.3.2) s parametry m a 21 . Pro mal´a m lze tedy stanovit kritick´ y obor pro dan´e α urˇcen´ım cel´eho ˇc´ısla c tak, aby byly splnˇeny nerovnosti c m X m 1 i=1
i
2
c+1 m α X m 1 ≤ < 2 2 i i=1
Hypot´ezu H potom zam´ıtneme, pokud Z < c nebo m − c < Z. Pro vˇetˇs´ı m lze vyuˇz´ıt aproximace binomick´eho rozdˇelen´ı rozdˇelen´ım norm´aln´ım (viz vˇeta v IV.2.1) a kritick´ y obor vyj´adˇrit pomoc´ı (1 − α2 )-kvantilu rozdˇelen´ı N (0, 1) √ nerovnost´ı |2Z−m| ≥ u(1− α2 ). Pro jednostrann´e alternativy vytvoˇr´ıme kritick´ y m obor analogicky jako v VII.2.1. Jednov´ ybˇ erov´ y Wilcoxon˚ uv test. Pˇredpokl´ad´ame, ˇze {X1 , . . . , Xn } je v´ ybˇer z rozdˇelen´ı se spojitou distribuˇcn´ı funkc´ı F (x), kter´a je symetrick´a kolem medi´anu xf f f 50 (neboli F (x 50 − x) = 1 − F (x 50 + x). Budeme opˇet testovat hypot´ezu H : (xf = x ) proti alternativˇ e ( x f 50 0 50 6= x0 ) na hladinˇe v´ yznamnosti α. Podobnˇe jako v VII.4.l i v tomto pˇr´ıpadˇe vytvoˇr´ıme posloupnost rozd´ıl˚ u X1 − x0 , . . . , Xn − x0 a d´ale budeme poˇc´ıtat pouze s nenulov´ ymi rozd´ıly, jejichˇz poˇcet oznaˇc´ıme m. Tuto posloupnost uspoˇr´ad´ame vzestupnˇe podle absolutn´ıch hodnot a oznaˇc´ıme Ri+ poˇrad´ı n´ahodn´e veliˇciny |Xi − x0 |. Seˇcteme-li poˇrad´ı Ri+ pro vˇsechny ˇcleny, pro kter´e je Xi − x0 > 0 a tento souˇcet oznaˇc´ıme S + , dostaneme statistiku, pro kterou za platnosti hypot´ezy plat´ı E(S + ) =
m(m + 1)(2m + 1) m(m + 1) , V ar(S + ) = 4 24
a pro velk´a m je jej´ı rozdˇelen´ı pˇribliˇznˇe norm´aln´ı. Proto budeme pracovat S + −E(S + ) radˇeji s normovanou veliˇcinou V = √ . Hypot´ezu tedy zam´ıtneme, + V ar(S )
pokud |V | ≥ v(1 − α2 ). Pro mal´e hodnoty m jsou kritick´e hodnoty v(1 − α2 ) tabelov´any, pro velk´a m lze pouˇz´ıt kvantily rozdˇelen´ı N (0, 1). Dvouv´ ybˇ erov´ y Wilcoxon˚ uv test slouˇz´ı k testov´an´ı hypot´ezy o shodˇe distribuˇcn´ıch funkc´ı dvou v´ ybˇer˚ u. Necht’ {X1 , . . . , Xn } a {Y1 , . . . , Ym } jsou dva nez´avisl´e v´ ybˇery ze dvou spojit´ ych rozdˇelen´ı. Za platnosti hypot´ezy jsou tato rozdˇelen´ı totoˇzn´a a spojen´ y v´ ybˇer {X1 , . . . , Xn , Y1 , . . . , Ym } lze povaˇzovat za v´ ybˇer z jednoho rozdˇelen´ı. Oznaˇcme RiX poˇrad´ı veliˇ i Pncin X X X ’ ve spojen´em v´ ybˇeru, uspoˇra´dan´em podle velikosti a necht R = i=1 Ri . Potom je E(RX ) =
mn(m + n + 1) m(m + n + 1) , V ar(RX ) = 2 12
96
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
Test lze zaloˇzit pˇr´ımo na statistice RX a kritick´ y obor je potom urˇcen nerovα X nost´ı R ≥ wm,n (1 − 2 ), kde kritick´e hodnoty wm,n (1 − α2 ) jsou tabelov´any (viz napˇr. [An], [Sk], [Zv]). Pro pˇribliˇzn´ y test pouˇzijeme normovanou veliˇcinu RX −E(RX ) W = √ X , kter´a m´a za platnosti hypot´ezy pro velk´e rozsahy m a n D(R )
pˇribliˇznˇe rozdˇelen´ı N (0, 1). Oba uveden´e testy - znam´enkov´ y i Wilcoxon˚ uv - jsou ˇcastou pouˇz´ıv´any jako testy p´ arov´ e nam´ısto p´arov´eho t-testu (viz VII.2.4).
´ 2.4. REGRESN´I ANALYZA
2.4
97
Regresn´ı anal´ yza
(Upozornˇen´ı: tento text jeˇstˇe nebyl upraven do koneˇcn´e podoby. Proto zde chybˇej´ı nˇekter´e obr´azky a objevuj´ı se zde odkazy na odstavce, kter´e nejsou oznaˇceny odpov´ıdaj´ıc´ım zp˚ usobem. Tyto nedostatky budou postupnˇe odstraˇ nov´any. Do t´e doby pros´ım o trpˇelivost a omlouv´am se za zt´ıˇzen´e ˇcten´ı. GDo)
2.4.1
Regresn´ı z´ avislost
V matematice vyjadˇrujeme z´avislost hodnot jedn´e promˇenn´e na hodnot´ach druh´e promˇenn´e funkˇcn´ım vztahem. V praktick´ ych u ´loh´ach je vˇsak situace sloˇzitˇejˇs´ı. Pˇri mˇeˇren´ı hodnot sledovan´e veliˇciny, pˇri jej´ıˇz realizaci p˚ usob´ı ˇrada dalˇs´ıch (n´ahodn´ ych) vliv˚ u, dost´av´ame soubor namˇeˇren´ ych hodnot, kter´e vykazuj´ı ˇcasto jist´e odchylky proti hodnot´am, kter´e bychom oˇcek´avali z teoretick´eho rozboru sledovan´eho jevu nebo z jak´esi oˇcek´avan´e pravidelnosti. Pˇ r´ıklad 2.4.1 Pˇri soustruˇzen´ı vznik´a v m´ıstˇe obr´abˇen´ı na n´astroji teplota, z´avisl´a na rychlosti posuvu n´astroje. Mezi teplotou θ mˇeˇrenou ve stupn´ıch Celsia a rychlost´ı posuvu v v metrech za minutu byl odvozen teoretick´y vztah θ = αv β , kde α a β jsou konstanty, z´avisej´ıc´ı na dalˇs´ıch podm´ınk´ach experimentu. Hodnoty, kter´e byly namˇeˇreny pˇri laboratorn´ım mˇeˇren´ı, vˇsak tomuto vztahu odpov´ıdaj´ı jen velmi pˇribliˇznˇe, jak lze vidˇet z grafu. Pˇredpokl´adejme, ˇze sledovanou n´ahodnou veliˇcinu Y lze vyj´adˇrit jako funkci (zpravidla nen´ahodn´ ych) veliˇcin X1 , . . . , Xr a n´ahodn´e odchylky jako Y = f (X1 , . . . , Xr ; θ1 , . . . , θs ) + . Funkce f se naz´ yv´a regresn´ı funkce a θ1 , . . . , θs naz´ yv´ame parametry regrese. O n´ahodn´e veliˇcinˇe , kter´a se ˇcasto naz´ yv´a nepr´avem chybou“, ” pˇredpokl´ad´ame, ˇze m´a symetrick´e rozdˇelen´ı se stˇredn´ı hodnotou 0 a rozptylem σ 2 . Obvykl´ y je pˇredpoklad norm´aln´ıho rozdˇelen´ı N (0, σ 2 ). Uveden´ y vztah se naz´ yv´a regresn´ı model. Podle druhu z´avislosti regresn´ı funkce na nezn´am´ ych parametrech θ1 , . . . , θs potom hovoˇr´ıme bud’ o line´arn´ım regresn´ım modelu nebo o neline´arn´ım regresn´ım modelu. Nad´ale se budeme zab´ yvat pouze line´arn´ım modelelm. Stˇredn´ı hodnota E(Y ) je potom funkc´ı hodnot veliˇcin X1 , . . . , Xr a nezn´am´ ych parametr˚ u θ1 , . . . , θs . Tuto vlastnost vyj´adˇr´ıme vztahem E(Y ) = f (x1 , . . . , xr ; θ1 , . . . , θs ),
98
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
kde x1 , . . . , xr jsou namˇeˇren´e hodnoty veliˇcin X1 , . . . , Xr a θ1 , . . . , θs jsou parametry. N´ahodn´e veliˇcinˇe Y se ˇr´ık´a vysvˇ etlovan´ a promˇ enn´ a, veliˇcin´am X1 , . . . , Xr budeme ˇr´ıkat vysvˇ etluj´ıc´ı promˇ enn´ e. Podle tvaru regresn´ı funkce budeme mluvit o pˇ r´ımkov´ e, exponenci´ aln´ı, kvadratick´ e, polynomick´ e a jin´ ych regres´ıch. V pˇr´ıpadˇe pˇr´ımkov´e regrese rozliˇsujeme podle poˇctu vysvˇetluj´ıc´ıch promˇenn´ ych tzv. jednoduchou regresi s jednou vysvˇetluj´ıc´ı promˇennou a v´ıcen´ asobnou regresi s v´ıce vysvˇetluj´ıc´ımi promˇenn´ ymi. V z´asadˇe zde m´ame dva probl´emy: urˇcit tvar (typ) regresn´ı funkce a Pˇri vyˇsetˇrov´an´ı regresn´ı z´avislosti je regresn´ı funkce zpravidla zn´ama (vypl´ yv´a z teoretick´ ych vztah˚ u) nebo se jej´ı tvar odhaduje (opticky, napˇr´ıklad podle X-Y grafu rozpt´ ylenosti). Proto se v dalˇs´ım textu omez´ıme na u ´lohu odhadu regresn´ıch parametr˚ u pˇredpokl´adan´e regresn´ı funkce. K tomu nejˇcastˇeji pouˇz´ıv´ame tzv. metodu nejmenˇ s´ıch ˇ ctverc˚ u. Tato metoda spoˇc´ıv´a v proveden´ı n nez´avisl´ ych mˇeˇren´ı hodnot veliˇcin Y, X1 , . . . , Xr a v nalezen´ı hodnot θˆ1 , . . . , θˆs , pˇri nichˇz funkce 2 n X S(θ1 , . . . , θs ) = yi − f (x1i , . . . , xri ; θ1 , . . . , θs ) i=1
nab´ yv´a sv´eho minima. Vektory yi , x1i , . . . , xri oznaˇcuj´ı i-t´e pozorov´an´ı vektoru Y, X1 , . . . , Xr , i = 1, . . . , n. Nejsme-li si jisti a rozhodujeme-li se mezi nˇekolika modely, potom zpravidla vol´ıme ten, v nˇemˇz je hodnota funkce S(θ1 , . . . , θs ) – takzvan´ y rezidu´ aln´ı souˇ cet ˇ ctverc˚ u – nejmenˇs´ı. V pˇr´ıpadˇe line´arn´ı regresn´ Pn ı funkce f (x,2α, β) = α + βx budeme minimalizovat funkci S(α, β) = i=1 (yi − α − βxi ) . Nutnou podm´ınkou pro extr´em funkce dvou promˇenn´ ych je nulovost obou parci´aln´ıch derivac´ı n
X ∂S = −2 (yi − α − βxi ) = 0 ∂α i=1 n
X ∂S = −2 (yi − α − βxi )xi = 0, ∂β i=1 coˇz vede k takzvan´e soustavˇ e norm´ aln´ıch rovnic nα + β α
n X i=1
xi + β
n X i=1 n X i=1
xi = x2i =
n X i=1 n X i=1
yi yi xi
´ 2.4. REGRESN´I ANALYZA
99
jej´ımˇz ˇreˇsen´ım dostaneme bodov´e odhady a a b parametr˚ uαaβ Pn (xi − x)yi b = Pi=1 n 2 i=1 (xi − x) Pn (xi − x)yi a = y − Pi=1 x = y − bx n 2 i=1 (xi − x) P P kde x = n1 ni=1 xi , y = n1 ni=1 yi . Podm´ınku postaˇcuj´ıc´ı nen´ı tˇreba vyˇsetˇrovat, nebot’ funkce S(α, β) je ryze konvexn´ı.
2.4.2
Jednoduch´ a pˇ r´ımkov´ a regrese
Velmi ˇcast´ ym pˇr´ıpadem regresn´ı z´avislosti je pˇ r´ımkov´ a regrese. Pˇredpokl´adejme regresn´ı vztah Y = α + βX + , kde X je n´ahodn´a veliˇcina a je n´ahodn´a veliˇcina s norm´aln´ım rozdˇelen´ım N (0, σ 2 ). Bodov´e odhady a a b parametr˚ u α a β z´ısk´ame metodou nejmenˇs´ıch ˇctverc˚ u ve tvaru uveden´em v pˇr´ıkladˇe VIII.1.6. Namˇeˇren´e hodnoty y1 , . . . , yn lze povaˇzovat za hodnoty realizac´ı nez´avisl´ ych n´ahodn´ ych veliˇcin Y1 , . . . , Yn s norm´aln´ım rozdˇelen´ım N (a + bxi , σ 2 ). Z tohoto hlediska jsou bodov´e odhady a a b odhadov´ ymi statistikami, a tedy n´ahodn´ ymi veliˇcinami. Hodnoty ei = yi − a − bxi , i = 1, . . . , n se naz´ yvaj´ı rezidua a lze je povaˇzovat za ˇ ıslo yˆi = a + bxi je odhadem hodnoty odhady hodnot chybov´eho ˇclenu . C´ n´ahodn´e veliˇciny Yi . Oznaˇcme SR = S(a, b) takzvan´ y rezidu´ aln´ı souˇ cet ˇ ctverc˚ u SR =
n X i=1
e2i
=
n X i=1
2
yi − a − bxi =
n X i=1
yi2
−a
n X
yi − b
i=1
n X
xi yi .
i=1
Bodov´ y odhad s2 rozptylu σ 2 chybov´eho ˇclenu je potom d´an vztahem SR a naz´ yv´a se rezidu´ aln´ı rozptyl. s2 = (n−2) 2 Pomoc´ı s lze vyj´adˇrit odhady rozptylu obou regresn´ıch parametr˚ u P s2 ni=1 x2i s2 2 2 Pn P Sa = Pn 2 , S = n b 2 2 n i=1 xi − ( i=1 xi )2 i=1 xi − nx Statistiky Tα = (a−α) a Tβ = (b−β) maj´ı Studentovo t-rozdˇelen´ı o (n − 2) Sa Sb stupn´ıch volnosti. Intervalov´e odhady pro parametry α a β jsou potom d´any nerovnostmi γ γ a − Sa tn−2 (1 − ) ≤ α ≤ a + Sa tn−2 (1 − ) 2 2
100
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
γ γ b − Sb tn−2 (1 − ) ≤ β ≤ b + Sb tn−2 (1 − ) 2 2 γ γ kde (1−γ) je koeficient spolehlivosti a tn−2 (1− 2 ) je (1− 2 )-kvantil t-rozdˇelen´ı o (n − 2) stupn´ıch volnosti. V nˇekter´ ych pˇr´ıpadech n´as zaj´ım´a, zda hodnota nˇekter´eho z parametr˚ u se liˇs´ı v´ yznamnˇe od nulov´e hodnoty nebo ne a zda jej lze tud´ıˇz v regresn´ı funkci vynechat. Oboustrann´e testy nulovosti regresn´ıch koeficient˚ u lze b a zaloˇzit na odhadov´ ych statistik´ach Ta = Sa resp. Tb = Sb a jim odpov´ıdaj´ıc´ım kritick´ ym obor˚ um tak, ˇze pˇri splnˇen´ı nerovnosti γ γ |Ta | ≥ tn−2 (1 − ), resp. |Tb | ≥ tn−2 (1 − ), 2 2 zam´ıtneme hypot´ezu o nulovosti parametru α, resp. β, na hladinˇe v´ yznamnosti γ. Regresn´ım modelem se snaˇz´ıme vysvˇetlit zmˇeny - variabilitu - vysvˇetlovan´e veliˇciny Y pomoc´ı zmˇen vysvˇetluj´ıc´ı veliˇciny X. Pod´ıl ˇca´sti variability Y vysvˇetlen´e modelem ku celkov´e variabilitˇe Y , zpravidla vyj´adˇren´ y v procentech, se naz´ yv´a koeficient determinace R2 a je d´an vztahy Pn (a + bxi − y)2 SR 2 i=1 = 1 − Pn , R = Pn 2 2 i=1 (yi − y) i=1 (yi − y kde SR je rezidu´aln´ı souˇcet ˇctverc˚ u. K u ´pln´e regresn´ı anal´ yze patˇr´ı i anal´ yza rezidu´ı. Pˇredevˇs´ım by mˇely vyhovovat pˇredpokladu normality, za kter´eho byly vˇsechny pˇredchoz´ı v´ ysledky odvozeny. Pokud tomu tak nen´ı, nelze v´ ysledky povaˇzovat za d˚ uvˇeryhodn´e. K ovˇeˇren´ı shody hodnot rezidu´ı s norm´aln´ım rozdˇelen´ım lze pouˇz´ıt nˇekter´ y z test˚ u, uveden´ ych v odstavci VII.3, nebo pravdˇepodobnostn´ı pap´ır, kter´ y je pops´an v kapitole X. Z anal´ yzy rezidu´ı lze detekovat i takzvan´a odlehl´ a pozorov´ an´ı. To znamen´a ty hodnoty, kter´e byly chybnˇe namˇeˇreny nebo indikuj´ı nesrovnalosti v modelu, a jimˇz je tˇreba vˇenovat zvl´aˇstn´ı pozornost. Ke zjiˇst’ov´an´ı tˇechto hodnot lze pouˇz´ıt napˇr´ıklad krabicov´e gragy, popsan´e v kapitole X. Model line´arn´ı regrese lze pouˇz´ıt i v nˇekter´ ych pˇr´ıpadech, kdy z´avislost mezi veliˇcinami X a Y nen´ı line´arn´ı. Jsou to pˇr´ıpady, kdy lze prov´est takzvanou linearizaci modelu. Vhodnou transformac´ı pˇrevedeme neline´arn´ı z´avislost na line´arn´ı a pouˇzijeme line´arn´ı regresn´ı model. Pˇritom vˇsak mus´ıme b´ yt velmi opatrn´ı, nebot’ vˇse, co bylo odvozeno pro line´arn´ı regresn´ı model za pˇredpokladu normality chybov´eho ˇclenu plat´ı pouze pro ”linearizovan´ y model”, nikoli pro model p˚ uvodn´ı, a to opˇet za pˇredpokladu, ˇze n´ahodn´a veliˇcina, odpov´ıdaj´ıc´ı transformovan´emu chybov´emu ˇclenu v linearizovan´em modelu, m´a norm´aln´ı rozdˇelen´ı.
´ 2.4. REGRESN´I ANALYZA
101
Pˇ r´ıklad 2.4.2 Z´avislost mezi teplotou θ a rychlost´ı posuvu v v pˇr´ıkladu 2.4.1. lze povaˇzovat za regresn´ı z´avislost ve tvaru θ = α.v β ., kde α a β jsou regresn´ı koeficienty a je n´ahodn´a veliˇcina se stˇredn´ı hodnotou 1. Provedemeli transformaci Y = lnθ, X = lnv, a = lnα, e = lnab = β, dostaneme Y = a + bX + e, tedy line´arn´ı vztah. Podobnˇe jako v pˇredchoz´ım pˇr´ıkladu lze linearizovat i jin´e modely, napˇr. 1 a dalˇs´ı. logaritmick´ y, tj. Y = ln(α + β.X), reciprok´ y Y = α+β.X Pˇ r´ıklad 2.4.3 U 155 automobil˚ u byla sledov´ana spotˇreba pohonn´ych hmot v litrech na 100 km a zaznamen´av´an zdvihov´y objem v´alc˚ u v cm3 . Analyzujte z´avislost mezi tˇemito veliˇcinami. ˇ sen´ı: Anal´ Reˇ yza pˇr´ımkov´e regresn´ı z´avislosti mezi uveden´ ymi veliˇcinami byla zpracov´ana statistick´ ym programov´ ym syst´emem STATGRAPHICS. V´ ysledky jsou uvedeny v n´asleduj´ıc´ı tabulce: Absolutn´ı ˇclen = a, smˇernice = b, smˇerodatn´e odchylky parametr˚ u jsou Sa a Sb , statistika T pˇredstavuje hodnoty Ta a Tb a p-hodnota se vztahuje k testu nulovosti regresn´ıch koeficient˚ u a a b. Graf regresn´ı pˇr´ımky, proloˇzen´e namˇeˇren´ ymi hodnotami je zobrazen spolu s tzv. p´asy spolehlivosti“ na ” lev´em obr´azku, na prav´em jsou zakreslena rezidua vzhledem k nez´avisle promˇenn´e objem v´alc˚ u:
2.4.3
P´ asy spolehlivosti a predikce v modelu line´ arn´ı regrese
Kromˇe obecn´ ych u ´vah o z´avislosti Y na X se ˇcasto vyskytuje potˇreba ode hadu hodnoty Y z´avisle promˇenn´e Y pro pˇredem zn´amou hodnotu nez´avisle promˇenn´e X, takzvan´e pˇ redpovˇ edi, neboli predikce. Zpravidla se pouˇz´ıv´a hodnota regresn´ı funkce v dan´em bodˇe. To je ovˇsem pouze bodov´ y odhad a ten jak v´ıme, silnˇe z´avis´ı na p˚ usoben´ı n´ahodn´ ych vliv˚ u v okamˇziku mˇeˇren´ı. Nav´ıc t´ım nedostaneme odpovˇed’ na ot´azku, zda nˇejakou teoreticky uvaˇzovanou hodnotu Y lze - za pˇredpokladu platnosti naˇseho modelu - oˇcek´avat pˇri urˇcit´e hodnotˇe X se zvolenou pravdˇepodobnost´ı 1 − α. Pˇri vyˇsetˇrov´an´ı regresn´ı z´avislosti ˇcasto konstruujeme takzvan´e p´ asy spolehlivosti. V literatuˇre jich byla navrˇzena cel´a ˇrad. Uvaˇzujme napˇr´ıklad sjednocen´ı vˇsech interval˚ u spolehlivosti kolem hodnoty regresn´ı pˇr´ımky v jednotliv´ ych hodnot´ach vysvˇetluj´ıc´ı promˇenn´e, kter´e v naˇsem experimentu pˇrich´azej´ı v u ´vahu. Bodov´ y odhad hodnoty regresn´ı funkce Yˆ (x) = a + bx dostneme pomoc´ı odhadu regresn´ıch koeficient˚ u. Podobnˇe jako v pˇr´ıpadˇe intervalov´ ych odhad˚ u
102
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
pro regresn´ı parametry, i zde lze odvodit statistiku pro nestrann´ y bodov´ y ˆ odhad rozptylu Y (x) (viz [LM]): SY2ˆ = s2 (
1 (x − x)2 + Pn 2 2 ), n i=1 xi − nx
kde s2 je rezidu´aln´ı rozptyl. Pravdˇepodobnostn´ı rozdˇelen´ı statistiky TYˆ = (Yˆ −a−bx) je Studentovo t-rozdˇelen´ı o (n − 2) stupn´ıch volnosti. Odtud dosYˆ staneme hledan´ y interval spolehlivosti kolem hodnoty regresn´ı pˇr´ımky pro koeficient spolehlivosti (1 − α) ve tvaru: 1 1 Yˆ − SYˆ tn−2 (1 − α) ≤ Y ≤ Yˆ + SYˆ tn−2 (1 − α) 2 2 Horn´ı a doln´ı meze tˇechto interval˚ u budou tvoˇrit dvˇe kˇrivky, mezi nimiˇz leˇz´ı tzv. p´ as spolehlivosti kolem regresn´ı pˇ r´ımky. Zakresl´ıme-li nyn´ı do grafu nˇejakou uvaˇzovanou hodnotu X0 , Y0 , m˚ uˇzeme rozhodnout, zda je tato hodnota v souladu s naˇsimi v´ ysledky (je-li tento bod uvnitˇr p´asu), nebo zda se v´ yznamnˇe liˇs´ı (je-li mimo tento p´as). Jin´ y p´as spolehlivosti dostaneme pouˇzit´ım interval˚ u spolehlivosti pro e predikci. Pro predikci Y hodnoty Y pˇri dan´e hodnotˇe x je ve [Zr] odvozen v´ yraz pro intervalov´ y odhad 1 1 Yˆ − SYˆ tn−2 (1 − α) ≤ Y ≤ Yˆ + SYˆ tn−2 (1 − α) 2 2 kde SY2ˆ = s2 (1 +
(x − x)2 1 + Pn 2 2 ), n i=1 xi − nx
V´ ysledkem sjednocen´ı horn´ıch a doln´ıch mez´ı intervalov´ ych odhad˚ u pro r˚ uzn´a Y je p´ as spolehlivosti pro predikci. Tento p´as je ˇsirˇs´ı, neˇz p´as kolem regresn´ı pˇr´ımky. Na obr´azku v pˇr´ıkladu ?? jsou zobrazeny oba uveden´e p´asy dvojic´ı pˇreruˇsovan´ ych ˇcar tak, jak je zobrazuj statistick´ y program STATGRAPHICS. Uˇzˇs´ı p´as (dvojice ˇcar bl´ıˇze k regresn´ı pˇr´ımce) je p´as spolehlivosti kolem regresn´ı pˇr´ımky a ˇsirˇs´ı (vzd´alenˇejˇs´ı dvojice pˇreruˇsovan´ ych ˇcar) je p´as spolehlivosti pro predikci. ˇ Casto n´as zaj´ım´a toleranˇ cn´ı p´ as, kter´ y se t´ yk´a rovnˇeˇz predikce. Pokud budeme sledovan´ y experiment prov´adˇet d´ale za pˇribliˇznˇe stejn´ ych podm´ınek, dostaneme ˇradu takzvan´ ych budouc´ıch“ pozorov´an´ı (mˇeˇren´ı). Toleranˇcn´ı ” p´as pro 100δ% pozorov´an´ı na hladinˇe 1 − α je mnoˇzina, ve kter´e s pravdˇepodobnost´ı 1 − α bude leˇzet alespoˇ n 100δ% budouc´ıch pozorov´an´ı. Kostrukce toleranˇcn´ıho p´asu je pomˇernˇe komplikovan´a a k jeho v´ ypoˇctu je zpravidla tˇreba pouˇz´ıt specializovan´ y software.
´ 2.5. ZAVISLOST A KORELACE
2.5
103
Z´ avislost a korelace
(Upozornˇen´ı: tento text jeˇstˇe nebyl upraven do koneˇcn´e podoby. Proto zde chybˇej´ı nˇekter´e obr´azky a objevuj´ı se zde odkazy na odstavce, kter´e nejsou oznaˇceny odpov´ıdaj´ıc´ım zp˚ usobem. Tyto nedostatky budou postupnˇe odstraˇ nov´any. Do t´e doby pros´ım o trpˇelivost a omlouv´am se za zt´ıˇzen´e ˇcten´ı. GDo) Nejˇcastˇejˇs´ım pˇredpokladem pˇri pravdˇepodobnostn´ıch u ´vah´ach nebo pˇri statistick´em vyˇsetˇrov´an´ı je pˇredpoklad nez´avislosti n´ahodn´ ych veliˇcin. Doposud jsme vˇsak neuvedli ˇza´dn´ y statistick´ y n´astroj, jak tuto z´avislost ˇci ’ nez´avislost zjiˇst ovat nebo ovˇeˇrovat. V t´eto kapitole uvedeme dvˇe statistick´e metody, pomoc´ı nichˇz lze dˇelat jist´e z´avˇery o (line´arn´ı) z´avislosti dvou n´ahodn´ ych veliˇcin na z´akladˇe jejich pozorov´an´ı.
2.5.1
Korelaˇ cn´ı koeficient
Jak jsme uvedli v III.2.3, m´ırou z´avislosti dvou n´ahodn´ ych veliˇcin X, Y je jejich korelaˇcn´ı koeficient ρXY . Je-li tento koeficient r˚ uzn´ y od nuly, ˇr´ık´ame, ˇze veliˇciny X a Y jsou stochasticky z´avisl´e. Nez´avislou mohou b´ yt pouze pˇri nulov´em ρXY , ale tak´e nemus´ı, jak ukazuje pˇr´ıklad III.3.5. Korelaˇcn´ımu koeficientu, kter´ y byl definov´an v III.2.3, odpov´ıd´a ve statistick´em vyˇsetˇrov´an´ı v´ ybˇ erov´ y korelaˇ cn´ı koeficient rXY , kter´ y lze spoˇc´ıtat na z´akladˇe mˇeˇren´ı (x1 , y1 ), dots, (xn , yn ) n´ahodn´ ych veliˇcin X, Y podle vztahu Pn (xi − ¯(x))(yi − ¯(y)) = rXY = pPni=1 P ¯)2 ni=1 (yi − y¯)2 i=1 (xi − x Pn xy¯) i=1 (xi yi − n¯ pP P ( i = 1n x2i − n¯ x2 )( i = 1n yi2 − n¯ y2) M´a-li n´ahodn´ y vektor (X, Y ) sdruˇzen´e norm´aln´ı rozdˇelen´ı, potom lze snadno dok´azat, ˇze nekorelovanost je tot´eˇz co nez´avilost. Za pˇredpokladu normality lze tedy na z´akladˇe nulovosti korelaˇcn´ıho koeficientu usuzovat na nez´avislost. Zpravidla vˇsak m´ame k dispozici pouze statistiku rXY , kter´a je n´ahodnou veliˇcinou a jej´ıˇz hodnota je d´ana moment´alnˇe namˇeˇren´ ymi hodnotami v´ ybˇeru. Je-li nenulov´a, nemus´ı to jeˇstˇe znamenat, ˇze i ρXY = 0 a tedy nekorelovanost veliˇcin X a Y . Nulovost korelaˇcn´ıho koeficientu se ovˇeˇruje pomoc´ı statistick´eho testu. Ten je zaloˇzen na tom, ˇze za pˇredpokladu, ˇze n´ahodn´ y v´ ybˇer (X1 , Y1 ), . . . , (Xn , Yn ) je ze sdruˇzen´eho norm´aln´ıho rozdˇelen´ı s ρXY = 0, potom m´a veliˇcina √ rXY n − 2 T = p 2 1 − rXY
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
104
Studentovo t-rozdˇelen´ı o (n − 2) stupn´ıch volnosti. Test nulovosti korelaˇ cn´ıho koeficientu na hladinˇe v´ yznamnosti α potom zam´ıt´a hypot´ezu H : ρXY = 0 proti alternativˇe A : ρXY 6= 0, pokud |T | ≥ tn−2 (1 − α2 ), kde tn−2 (1 − α2 ) je (1 − α2 )-kvantil t-rozdˇelen´ı o n − 2 stupn´ıch volnosti. Nejsou-li splnˇeny pˇredpoklady pro pouˇzit´ı v´ yˇse uveden´eho testu (norm´aln´ı sdruˇzen´e rozdˇelen´ı (X, Y ), m˚ uˇzeme pro test nez´avislosti X a Y pouˇz´ıt tzv. Spearman˚ uv korelaˇ cn´ı koeficient. V tomto pˇr´ıpadˇe se pouze pˇredpokl´ad´a, ˇze n´ahodn´ y v´ ybˇer (X1 , Y1 ), . . . , (Xn , Yn ) je ze spojit´eho dvojrozmˇern´eho rozdˇelen´ı. Uspoˇra´dejmˇe namˇeˇren´e hodnoty x1 , . . . , xn podle velikosti a jejich poˇrad´ı oznaˇcme R1 , . . . , Rn . Obdobnˇe budeme postupovat s y1 , . . . , yn , jejichˇz poˇrad´ı oznaˇc´ıme Q1 , . . . , Qn . Nyn´ı spoˇcteme v´ ybˇerov´ y korelaˇcn´ı koeficient pro dvoS jice (Ri , Qi ), i = 1, . . . , n a oznaˇc´ıme jej rXY : Pn ¯¯ S i=1 Ri Qi − nRQ rXY = p Pn P n 2 ¯2 ¯ 2 ][ [ i=1 Ri2 − nR i=1 Qi − nQ ] kde ¯= R a P
1 n
n i=1
Pn
i=1
Ri2 =
¯= Ri = Q
Pn
i=1
Q2i =
1 n
Pn
i=1
Qi =
n+1 2
n(n+1)(2n+1) . 6
D´ale je n X i=1
n
Ri Qi = −
n
n
X X 1X (Ri − Qi )2 + Ri2 + Q2i = 2 i=1 i=1 i=1 n
n(n + 1)(2n + 1) 1X (Ri − Qi )2 + . (2.2) − 2 i=1 6 2 Dosazen´ım do vzorce pro rXY dost´av´ame tzv. Spearman˚ uv korelaˇ cn´ı koeficient n X 6 S rXY = 1 − (Ri − Qi )2 . n(n2 − 1) i=1
Test nez´avislosti X a Y na hladinˇe v´ yznamnosti α je potom zaloˇzen na nerovnosti S |rXY | ≥ k(α), kde k(α) je kritick´a hodnota, kterou lze pro mal´e rozsahy v´ ybˇeru (n ≤ 30) nal´ezt v tabulk´ach (viz napˇr. [An]) nebo pˇri vˇetˇs´ıch rozsaz´ıch, tj. pro n > 30, u(1− α ) ji lze aproximovat hodnotou k ∗ (α) ∼ = √n−12 , kde u(1 − α2 ) je (1 − α2 )-kvantil rozdˇelen´ı N (0, 1).
´ 2.5. ZAVISLOST A KORELACE
2.5.2
105
Test nez´ avislosti v kontingenˇ cn´ı tabulce
V odstavci III.3 byla charakterizov´ana nez´avislost veliˇcin X a Y pomoc´ı srovn´an´ı sdruˇzen´eho rozdˇelen´ı s margin´aln´ımi. Pˇri statistick´em ˇsetˇren´ı je tˇreba postupovat sice opatrnˇeji, nicm´enˇe lze tak uˇcinit podobn´ ym zp˚ usobem. Pouze teoretick´a rozloˇzen´ı nahrad´ıme jejich empirick´ ymi odhady, tj. pomˇern´ ymi ˇcetnostmi. Mˇejme k dispozici nez´avisl´a pozorov´an´ı (x1 , y1 ), . . . , (xn , yn ) n´ahodn´eho vektoru (X, Y ). Pˇredpokl´adejme, ˇze veliˇcina X m˚ uˇze nab´ yvat pouze hodnoty z mnoˇziny A1 , . . . , Ak a veliˇcina Y nab´ yv´a hodnoty z mnoˇziny B1 , . . . , Bl ). Spoˇc´ıt´ame ˇcetnosti nrs , reprezentuj´ı poˇcet namˇeˇren´ ych dvojic xi , yj takov´ ych, Pk ˇze xi = Ar , , yj = Bs , r = 1, . . . , k, s = 1, . . . , l. Oznaˇcme n.j = i=1 nij ani. = Pl c´ıtan´e hodnoty uspoˇra´d´ame to tzv. kontingenˇ cn´ı tabulky: j=1 nij . Napoˇ TABULKA n Pomˇern´e ˇcetnosti nij lze povaˇzovat za odhad sdruˇzen´eho rozdˇelen´ı pij n´ahodn´eho vektoru (X, Y ), nni . a nn. j za odhad margin´aln´ıch rozdˇelen´ı qi , rj veliˇcin X a Y . Za pˇredpokladu nez´avislosti by mˇelo b´ yt pij = qi rj (viz n n ni j III.3.1) a tedz budeme oˇcek´avat, ˇze bude pˇribliˇznˇe n = i.n2 .j . To odpov´ıd´a P P n n poˇzadavku,aby souˇcet ki=1 lj=1 ( nij − nni. n.j )2 byl mal´ y. Test nez´avislosti n´ahodn´ ych veliˇcin X a Y je zaloˇzen na statistice kter´a m´a za pˇredpokladu nez´avislosti veliˇcin X a Y pˇri velk´ ych n pˇribliˇznˇe 2 rozdˇelen´ı χ o m = (k − 1)(l − 1) stupn´ıch volnosti. Hypot´ezu nez´avislosti tedy zam´ıtneme, pokud bude χ2 ≤ χ2m (1 − α). Pˇ r´ıklad 2.5.1 U 155 automobil˚ u byla mˇeˇrena spotˇreba pohonn´ych hmot, v´ykon a obsah v´alc˚ u. Podle velikosti spotˇreby na jednotku v´ykonu byly automobily rozdˇeleny do tˇr´ı kategori´ı: n´ızk´a (do 0.15), pr˚ umˇern´a (0.15-0.2) a vysok´a (v´ıce neˇz 2.0). Podle objemu byly rozdˇeleny do sedmi kategori´ı, prvn´ı do 1500 ccm a d´ale po 500 ccm, takˇze sedm´a kategorie byly vozy s objemem vˇetˇs´ım neˇz 4000 ccm. V tabulce jsou uvedenz ˇcetnosti namˇeˇren´ych hodnot: spotˇreba/ jedn.v´ykonu n´ızk´a pr˚ umˇern´a vysok´ P a
1 5 22 3 30
2 15 28 2 45
objem v´alc˚ u 3 4 5 9 8 1 16 3 5 5 1 0 30 12 6
P 6 7 2 10 50 11 8 93 0 1 12 13 19 155
Existuje statisticky v´yznamn´a z´avislost spotˇreby na v´ykonu a obsahu v´alc˚ u? ˇ sen´ı: Uloha ´ Reˇ byla zpracov´ana programem MYSTAT, kter´ y poskytl tyto 2 v´ ysledky: statistika χ nab´ yv´a hodnoty 22,786, poˇcet stupˇ n˚ u volnosti je 12
106
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
a p-hodnota je rovna 0,30. Tedy na hladinˇe v´ yznamnosti α > 0, 03 bychom mohli jeˇstˇe hypot´ezu o nez´avislosti zam´ıtnout. Konkr´etnˇe pro α = 0, 05 je (1 − α)-kvantil rozdˇelen´ı χ2 (12) roven (podle [Jn]χ212 (0, 95) = 21, 0. Na t´eto hladinˇe v´ yznamnosti hypot´ezu o nez´avislosti zam´ıtneme. Pokud vˇsak poloˇz´ıme α = 0, 01, pak odpov´ıdaj´ıc´ı kvantil bude χ212 (0, 99) = 26, 2 a tedy na t´eto hladinˇe hypot´ezu o nez´avislosti nelze zam´ıtnout. Statistika χ2 slouˇz´ı pouze pro test nez´avislosti a nelze ji pouˇz´ıvat jako m´ıru z´avislosti veliˇcin X a Y. Hodnota t´eto statistiky z´avis´ı na rozsahu v´ ybˇeru n´asleduj´ıc´ım zp˚ usobem. Kdyby byla jej´ı hodnota poˇc´ıt´ana dvakr´at na z´akladˇe dvou v´ ybˇer˚ u, obsahuj´ıc´ıch stejn´e hodnoty, pˇriˇcemˇz ve druh´em v´ ybˇeru by se kaˇzd´a dvojice (xi , yj ) opakovala dvakr´at, tj. tento v´ ybˇer by mˇel dvojn´asobn´ y rozsah, pak by druh´a vypoˇc´ıtan´a hodnota byla dvojn´asobn´a. Pˇritom m´ıra z´avislosti mˇeˇren´a napˇr´ıklad korelaˇcn´ım koeficientem z˚ ust´av´a stejn´a.
2.6
Grafick´ e metody anal´ yzy dat
Grafick´e metody jsou ve statistice st´ale v´ıce pouˇz´ıv´any pˇredevˇs´ım pro jejich n´azornost a dostupnost d´ıky rychl´e v´ ypoˇcetn´ı technice. Takzvan´a vizualizace dat je mocn´ ym n´astrojem pˇri anal´ yze dat, regresn´ı anal´ yze, anal´ yze ˇcasov´ ych ˇrad a dalˇs´ıch. Grafick´e metody ˇcasto nahrazuj´ı – pˇredevˇs´ım v prvn´ı f´azi statistick´eho vyˇsetˇrov´an´ı – metody analytick´e.
2.6.1
Frekvenˇ cn´ı (ˇ cetnostn´ı) grafy
Jedn´ım ze z´akladn´ıch typ˚ u grafick´eho zobrazen´ı ve statistick´e anal´ yze jsou frekvenˇ cn´ı grafy. Tyto grafy n´am poskytuj´ı z´akladn´ı pˇredstavu o tvaru pravdˇepodobnostn´ıho rozdˇelen´ı hodnot ve v´ ybˇeru. Frekvenˇcn´ı grafy zobrazuj´ı informace obsaˇzen´e v frekvenˇcn´ı tabulce (viz V.2.3). Sloupkov´ y diagramje konstruov´an n´asleduj´ıc´ım zp˚ usobem: kaˇzd´e tˇr´ıdˇe frekvenˇcn´ı tabulky odpov´ıd´a jeden obd´eln´ık, jehoˇz v´ yˇska je u ´mˇern´a ˇcetnosti a ˇs´ıˇrka tˇr´ıdn´ımu rozpˇet´ı. Nˇekdy se do grafu k jednotliv´ ym obd´eln´ık˚ um zakresluj´ı informace o pr˚ umˇeru a smˇerodatn´e odchylce uvnitˇr kaˇzd´e tˇr´ıdy. ˇ V pˇr´ıpadˇe zobrazen´ı relativn´ıch ˇcetnost´ı mluv´ıme t´eˇz o histogramu. Casto se pro srovn´an´ı dvou a v´ıce v´ ybˇer˚ u zakresluje do jednoho grafu v´ıce histogram˚ u z´aroveˇ n. Polygon ˇ cetnost´ı nebo jen polygon, je graf, v nˇemˇz jsou u ´seˇckami spojeny body, odpov´ıdaj´ıc´ı sv´ ymi souˇradnicemi dvojic´ım (stˇred i-t´e tˇr´ıdy, ˇcetnost i-t´e tˇr´ıdy. Tak´e tento graf umoˇzn ˇuje srovn´an´ı typu rozloˇzen´ı v´ıce v´ ybˇer˚ u v jednom grafu.
´ METODY ANALYZY ´ 2.6. GRAFICKE DAT
107
Kruhov´ e diagramy nebo t´eˇz kol´ aˇ cov´ e grafy. Zat´ımco prvn´ı dva typy se pouˇz´ıvaj´ı k zobrazen´ı vˇsech druh˚ u ˇcetnost´ı, kruhov´e diagramy zobrazuj´ı pouze prost´e ˇcetnosti, nejˇcastˇeji v relativn´ım tvaru, vyj´adˇren´e v procentech. Sloupkov´ y diagram a polygon jsou ˇcasto uˇz´ıv´any pˇri usuzov´an´ı o tvaru hustoty ˇci distribuˇcn´ı funkce pravdˇepodobnostn´ıho rozdˇelen´ı. Do grafu b´ yv´a zakreslena kˇrivka hustoty (v pˇr´ıpadˇe pomˇern´ ych ˇcetnost´ı) nebo distribuˇcn´ı funkce (zobrazujeme-li pomˇern´e kumulativn´ı ˇcetnosti) nˇekter´eho teoretick´eho rozdˇelen´ı a opticky usuzujeme o jej´ı vhodnosti. Tento postup zpravidla pˇredch´az´ı dalˇs´ım odhad˚ um a test˚ um.
2.6.2
Grafick´ e metody pr˚ uzkumov´ e anal´ yzy dat
Stonek s listy (Steam and leaf diagram) je grafick´a podoba frekvenˇcn´ıho histogramu. Na rozd´ıl od nˇeho vˇsak tento graf uchov´av´a alespoˇ n ˇca´steˇcnˇe informaci o pozorovan´ ych hodnot´ach. Z´akladem je rozdˇelen´ı dat do tˇr´ıd (tˇr´ıdn´ıch interval˚ u). Jejich oznaˇcen´ı se zakresluje nalevo od svisl´e ˇca´ry pˇredstavuj´ıc´ı stonek. Napravo v jednotliv´ ych ˇra´dc´ıch pˇredstavuj´ıc´ıch listy jsou vyps´any bud’ jednotliv´e hodnoty, nebo skupiny znak˚ u, kter´e je zastupuj´ı. Nˇekdy se jeˇstˇe zaznamen´avaj´ı horn´ı a doln´ı kvartily, medi´an. Pˇr´ıklad. Na diagramu jsou metodou stonek s listy“ zobrazeny namˇeˇren´e ” hodnoty spotˇreby pohonn´ ych hmot automobil˚ u z pˇr´ıkladu VIII.3.3 jak jej zobrazuuje program MYSTAT: Krabicov´ y graf (Box and whiskers plot, neboli krabice s vousy“. ” Data jsou zde zobrazena ve formˇe obd´eln´ıku (krabice), z nˇehoˇz nahoru a dol˚ u vyb´ıhaj´ı u ´seˇcky (vousy). V´ yˇska obd´eln´ıka je rovna (v dan´em mˇeˇr´ıtku) velikosti mezikvartilov´eho rozpˇet´ı RQ, pˇriˇcemˇz doln´ı, resp. horn´ı, strana odpov´ıd´a doln´ımu resp. horn´ımu kvartilu. Uvnitˇr je obd´eln´ık pˇredˇelen pˇr´ıˇckou v m´ıstˇe medi´anu M e. Vousy“ spojuj´ı hodnoty, splˇ nuj´ıc´ı nerovnost 21 RQ ≤ ” |x−M e| ≤ K.RQ, kde K je konstanta vˇetˇs´ı neˇz 1. Obvykle K = 1, 5nebo1, 75. Hodnoty vnˇe tohoto intervalu se zobrazuj´ı jako izolovan´e body (hvˇezdiˇckou) za pˇredpokladu norm´aln´ıho rozdˇelen´ı je lze povaˇzovat za tzv. odlehl´ a pozorov´ an´ı. Vrubov´ e grafy (Notched box plots) jsou konstruov´any stejnˇe jako krabicov´e grafy, nav´ıc vˇsak obsahuj´ı informaci o intervalu spolehlivosti pro odhad medi´anu. Po obou stran´ach obd´eln´ıku jsou v m´ıstˇe medi´anu z´aˇrezy, tzv. vruby, jejichˇz ˇs´ıˇrka je u ´mˇern´a velikosti intervalu spolehlivosti. Oznaˇc´ıme-li 1 x e odhad medi´anu, Sxe = 0, 926RQ.N − 2 odhad jeho smˇerodatn´e odchylky, pak interval spolehlivosti je d´an vztahem Ixe = x e − C.Sxe, x e + C.Sxe, kde C je konstanta, kter´a z´avis´ı na poˇzadovan´em koeficientu spolehlivosti a typu rozdˇelen´ı. Pro α = 0, 05 ( 95% interval spolehlivosti) je doporuˇcena hodnota pˇribliˇznˇe C = 1, 7.
108
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
Srovn´an´ım nˇekolika vrubov´ ych graf˚ u pro r˚ uzn´e v´ ybˇer v jednom mˇeˇr´ıtku vedle sebe pˇri stejn´em α, m˚ uˇzeme opticky porovnat v´ ybˇery z hlediska rovnosti stˇredn´ı hodnoty jejich medi´an˚ u na hladinˇe v´ yznamnosti α. Pokud se vruba zˇretelnˇe pˇrekr´ yvaj´ı, lze soudit o shodˇe, nepˇrekr´ yvaj´ı-li se v˚ ubec, je to znamen´ı v´ yznamn´eho rozd´ılu. Vˇzdy vˇsak je tˇreba tuto hypot´ezu testovat pomoc´ı statistick´eho testu. Pro srovn´an´ı a hled´an´ı z´avislost´ı ve v´ıcerozmˇern´ ych v´ ybˇerech (kde sledujeme v´ıce znak˚ u najednou) existuje ˇrada grafick´ ych metod, z nichˇz nejjednoduˇsˇs´ı jsou hvˇ ezdicov´ e grafy a paprskov´ e grafy. Pˇr´ıkladem tˇechto graf˚ u m˚ uˇze b´ yt zobrazen´ı souboru AUTA, v nˇemˇz byly u kaˇzd´eho automobilu mˇeˇreno pˇet veliˇcin U, V, X, Y, Z. V obou pˇr´ıpadech je z´akladem grafu hvˇezdice, jej´ıˇz jednotliv´e paprsky odpov´ıdaj´ı mˇeˇren´ ym veliˇcin´am, ale jejich rozmˇery maj´ı v obou pˇr´ıpadech r˚ uznou interpretaci. D´elka paprsk˚ u v hvˇ ezdicov´ em grafu (Star Plot) je promˇenn´a podle velikosti namˇeˇren´ ych hodnot. Jejich konce jsou spojeny a tvoˇr´ı ”hvˇezdici”: V pˇr´ıpadˇe paprskov´ eho grafu (Sun-ray Plot) d´elky paprsk˚ u odpov´ıdaj´ı r/n´asobku smˇerodatn´e odchylky pˇr´ısluˇsn´e veliˇciny, na kaˇzd´em je vyznaˇcena namˇeˇren´a hodnota a tyto jsou spojeny u ´seˇckami. Hodnoty jsou zobrazeny relativnˇe tak, ˇze d´elky paprsk˚ u reprezentuj´ı rozsah hodnot (aritmetick´ y pr˚ umˇer je tedy ve stˇredu paprsku):
2.6.3
Pravdˇ epodobnostn´ı pap´ır
K ovˇeˇren´ı shody namˇeˇren´ ych dat s teoretick´ ym rozdˇelen´ım pravdˇepodobnosti a k odhadu jeho parametr˚ u lze pouˇz´ıt tzv. pravdˇ epodobnostn´ı pap´ır. Je to vlastnˇe graf transformovan´ ych hodnot empirick´e distribuˇcn´ı funkce, v nˇemˇz se hodnoty odpov´ıdaj´ıc´ı teoretick´e distribuˇcn´ı funkce zobrazuj´ı na pˇr´ımku. Pro tento typ grafu se pouˇz´ıv´a bud’ pap´ır s pˇredtiˇstˇenou mˇr´ıˇz´ı, coˇz je obdoba logaritmick´eho pap´ıru“ s logaritmick´ ym mˇeˇr´ıtkem na jedn´e nebo na ” obou os´ach nebo jej generujeme pˇr´ımo na obrazovce poˇc´ıtaˇcov´eho monitoru. Mˇejme v´ ybˇer X1 , . . . , Xn a oznaˇcmˇe Fn (x) jeho empirickou distribuˇcn´ı funkci (viz V.3.6). Necht’ G(x) a G−1 (x) oznaˇcuj´ı teoretickou ryze monot´onn´ı distribuˇcn´ı funkci a funkci k n´ı inverzn´ı. Pro ovˇeˇren´ı shody namˇeˇren´ ych hodnot s rozdˇelen´ım s distribuˇcn´ı funkc´ı y = G(x) pouˇzijeme bodov´ y graf hodnot (xi , yi ), kde yi = G−1 (Fn (xi )), i = 1, . . . , n. Pokud by funkce Fn a G byly totoˇzn´e, potom by muselo b´ yt yi = xi a body (yi , xi ) by leˇzely na pˇr´ımce y = x. Je-li skuteˇcn´e rozdˇelen´ı v´ ybˇeru bl´ızk´e teoretick´emu s distribuˇcn´ı funkc´ı y = G(x), potom budou body (yi , xi ) leˇzet v tˇesn´e bl´ızkosti pˇr´ımky (y = x). Pˇ r´ıklad 2.6.1 V pˇr´ıkladu ?? jsou uvedeny v´ysledky anal´yzy line´arn´ı regrese
´ METODY ANALYZY ´ 2.6. GRAFICKE DAT
109
Obr´azek 2.1: Distribuˇcn´ı funkce diskr´etn´ı n´ahodn´e veliˇciny z pˇr´ıkladu 1.2.1.
110
´ ´ STATISTIKY KAPITOLA 2. ZAKLADY MATEMATICKE
mezi spotˇrebou a objemem automobilu. Ovˇeˇrte, zda rezidua v tomto modelu vyhovuj´ı norm´aln´ımu rozdˇelen´ı. ˇ sen´ı: Tuto shodu lze zobrazit pomoc´ı norm´aln´ıho pravdˇepodobnostn´ıho Reˇ pap´ıru, jak je uk´az´ano na obr´azku vpravo (graf byl poˇr´ızen programem STATGRAPHICS). Z obr´azku je patrn´e, ˇze odklon hodnot od pˇr´ımky je dosti velk´ y. Proto je tˇreba prov´est test normality na zadan´e hladinˇe v´ yznamnosti. Popsanou metodu lze pouˇz´ıt i k rychl´emu a hrub´emu odhadu parametr˚ u v pˇr´ıpadˇe, kdy m´ame pˇredstavu o typu teoretick´eho rozdˇelen´ı. Pˇredpokl´adejme, ˇze m´ame v´ ybˇer X1 , . . . , Xn z norm´aln´ıho rozdˇelen´ı N (µ, σ 2 ) , kde Φ je distribuˇcn´ı funkce rozdˇelen´ı s distribuˇcn´ı funkc´ı F (x) = Φ x−µ σ x−µ −1 N (0, 1). Potom Φ (F (x)) = σ . Zobraz´ıme-li nyn´ı v grafu body o souˇradnic´ıch Xi , Φ−1 (F (Xi )), za v´ yˇse uveden´eho pˇredpokladu budou v bl´ızkosti pˇr´ımky y = αx − β, kde α = σ1 , β = σµ . Proloˇz´ıme jimi tedy pˇr´ımku a z grafu odeˇcteme jej´ı smˇernici α a posunut´ı β, z nich pak spoˇcteme odhady parametr˚ u µ a σ.
2.6.4
Grafy rozpt´ ylenosti
Grafy rozpt´ ylenosti nebo t´eˇz rozptylov´ e ˇci korelaˇ cn´ı grafy jsou vedle frekvenˇcn´ıch graf˚ u nejˇcastˇeji pouˇz´ıvan´ ym zobrazen´ım namˇeˇren´ ych dat. Pouˇz´ıvaj´ı se pˇredevˇs´ım v regresn´ı anal´ yze, k anal´ yze trend˚ u (z´avislosti) v ˇcasov´ ych ˇrad´ach, ve shlukov´e anal´ yze a podobnˇe. Pouˇz´ıvaj´ı se nejˇcastˇeji jako bodov´ e, spojnicov´ e nebo sloupcov´e. Indexov´ y graf. Pˇri zobrazen´ı jednorozmˇern´eho v´ ybˇeru, napˇr´ıklad ˇcasov´e ˇrady, zakreslujeme data do pravo´ uhl´ ych souˇradnic, kde x-ov´e souˇradnici na vodorovn´e ose odpov´ıd´a ˇc´ıslo mˇeˇren´ı (index) i a y-ov´e souˇradnici na svisl´e ose namˇeˇren´a hodnota xi . Pˇri zobrazen´ı ˇcasov´e ˇrady m´a index v´ yznam ˇcasu mˇeˇren´ı. Jednotliv´e hodnoty se zobrazuj´ı bud’ jako body (bodov´ y graf), spojuj´ı se u ´ˇceˇckami (spojnicov´ y graf) nebo jako sloupce (sloupcov´ y graf). Pouˇzijemeli nam´ısto pravo´ uhl´ ych souˇradnic pol´arn´ı, dostaneme tzv. radarov´ y graf. Pˇri sledov´an´ı regresn´ı z´avislosti mezi veliˇcinami X a Y pouˇz´ıv´ame dvourozmˇ ern´ y rozptylov´ y graf, zobrazuj´ıc´ı namˇeˇren´e hodnoty jako body (xi , yi ) v pravo´ uhl´ ych souˇradnic´ıch. Tento typ grafu je ˇcasto jedin´ ym vod´ıtkem pˇri urˇcov´an´ı typu regresn´ı z´avislosti. Pˇr´ıklady rozptylov´ ych graf˚ u jsou uvedeny v pˇr´ıkladu VIII.2.11.