Náhodný jev a definice pravděpodobnosti Obsah kapitoly
Náhodný jev. Vztahy mezi náhodnými jevy. Pravidla pro počítání s pravděpodobnostmi. Formule úplné pravděpodobnosti a Bayesův vzorec.
Studijní cíle
Naučit se pravidla pro počítání s pravděpodobnostmi. Výpočet podmíněné pravděpodobnosti pomocí Bayesova vzorce.
Doba potřebná ke studiu
Základní text 1 hod. Příklady také 1 hod.
Pojmy k zapamatování
Náhodný jev. Jev jistý. Jev nemožný. Průnik náhodných jevů. Sjednocení náhodných jevů. Rozdíl náhodných jevů. Opačný jev. Neslučitelné jevy. Klasická definice pravděpodobnosti. Statistická definice pravděpodobnosti. Pravděpodobnost součtu náhodných jevů. Pravděpodobnost součinu náhodných jevů. Podmíněná pravděpodobnost. Nezávislé jevy. Formule úplné pravděpodobnosti. Bayesův vzorec.
Úvod
Vysvětlíme si, co ve statistice a pravděpodobnosti považujeme za náhodný jev, definujeme si pravděpodobnost pomocí klasické a také pomocí statistické definice pravděpodobnosti. Seznámíme se s pravidly pro počítání s pravděpodobnostmi a naučíme se používat Bayesův vzorec.
Výkladová část
Náhodný jev a definice pravděpodobnosti V mnoha situacích se ve světě, který nás obklopuje setkáváme s pokusy typu „za určitých podmínek vždy nastane určitý následek“. Např. Zahřeje-li se voda při atmosférickém tlaku na 100°C, přeměňuje se v páru, takový jev se nazývá jev jistý. Jestliže naopak „za určitých podmínek určitý následek nenastane nikdy“. Např. Zahřeje-li se voda při atmosférickém tlaku na 100°C, přeměňuje se v led, hovoříme o jevu nemožném. Naproti tomu existují jevy, u nichž i při dodržení všech podmínek
mohou nastat různé výsledky. Např. při sebepečlivějším dodržení výrobních podmínek jsou některé výrobky vadné, tokovéto pokusy nazýváme náhodné. Ve svém životě se ve většině případů setkáváme právě s náhodnými pokusy. Výsledkem náhodného pokusu je náhodný jev. Náhodné jevy budeme označovat velkými písmeny A, B, C, ... Mezi náhodnými jevy platí některé vztahy známe z teorie množin. 1. Jestliže při každé realizaci jevu A nastává i jev B. Jev A má za následek jev B, neboli jev A je částí jevu B. A B 2. Jevy A a B jsou rovnocenné. Jestliže pokaždé, kdy nastal jev A, nastal také jev B a naopak. A=B 3. Jev spočívající v nastoupení jak jevu A, tak i jevu B, nazýváme průnikem (logickým součinem) jevů A a B. A∩B 4. Jev spočívající v nastoupení alespoň jednoho z jevů A a B, nazýváme sjednocením jevů A a B. AUB 5. Rozdílem jevů A a B nazýváme jev, spočívající v nastoupení jevu A a současném nenastoupení jevu B. A–B 6. Jev, který spočívá v nenastoupení jevu A, je jevem opačným k jevu A. Ā 7. Jev, který za realizace daného komplexu podmínek musí nastat nutně, je jev jistý. V Jev, který naopak za daných podmínek nastat nemůže, je jev nemožný. Ø 8. Jevy A a B se nazývají neslučitelné, jestliže výskyt jednoho z nich bude vylučovat možnost výskytu druhého jevu, tj. jejich průnik je nemožný. A∩B=Ø Definice pravděpodobnosti Existuje několik definic pravděpodobnosti. Klasická – předpokládá se, že není důvod, abychom očekávali jeden z výsledků spíše než jiný.
m n m – počet výsledků příznivých jevu A n – počet všech možných výsledků P(A) =
Př. 1: V dodávce 1 000 šroubů je jich 50 vadných. Jaká je pravděpodobnost, že mechanik, který z dodávky náhodně vybral jeden šroub, vybral špatný? 50 P(A) = 0,05 1000 V některých případech není splněn základní požadavek klasické definice pravděpodobnosti, tj. předpoklad stejné možnosti všech jevů. V tomto případě se používá statistická definice pravděpodobnosti. Statistická – relativní četnost výskytu jevu A m P(A) = n m – počet pokusů v nichž nastal jev A n – počet všech pokusů Jde vlastně o jakousi „limitu“ relativních četností pro n blížící se ∞. Př. 2: V osmi dodávkách součástek určitého druhu byl zjišťován počet vadných součástek Dodávka č 1 2 3 4 5 6 7 8 Celkem
Počet součástek 741 843 654 699 766 674 882 810 6 069
Počet vadných 32 36 28 30 33 29 38 35 261
Relativní četnost 0,0432 0,0427 0,0428 0,0429 0,0431 0,0430 0,0431 0,0432 0,0430
Pravděpodobnost převzetí vadné součástky je 0,043, tj. 4,3%. Rozdíl mezi klasickou a statistickou definicí pravděpodobnosti si ukážeme na příkladu pravděpodobnosti narození chlapce. Podle klasické pravděpodobnosti P(A) = 1/2. Jsou dvě možnosti: buď se narodí chlapec nebo děvče. Není důvod, abychom očekávali jeden z výsledků spíše než druhý. Podíváme-li se na stránky Českého statistického úřadu na počty narozených dětí podle pohlaví (tab. 4-10.) http://www.czso.cz/csu/2009edicniplan.nsf/kapitola/0001-09-20090400 můžeme určit statistickou pravděpodobnost.
Rok
Živě narození
Chlapci
2004 2005 2006 2007 2008 Celkem
97.664 102.211 105.831 114.632 119.570 539.908
50.262 52.453 54.612 58.475 61.326 277.128
Relativní m četnost n 0,5146 0,5132 0,5160 0,5101 0,5129 0,5133
Vidíme, že statistická pravděpodobnost se liší od klasické pravděpodobnosti P(A) = 0,5. Statistická pravděpodobnost se pohybuje kolem hodnoty P(A) = 0,51. Neznáme důvod, ale dlouhodobá pozorování ukazují, že pravděpodobnost pohlaví narozeného dítěte je mírně vychýlená ve prospěch chlapců. Pravidla pro počítání s pravděpodobnostmi Sčítání P(A U B) = P(A) + P(B) – P(A ∩ B) součet pravděpodobností mínus pravděpodobnost průniku neslučitelné jevy P(A ∩ B)= 0 P(A U B) = P(A) + P(B) Př. 3: Pražská obchodní banka má zjištěno, že na tisíc šeků je jich 80 na částku do 5 000,-Kč 200 na částku 5 001,-Kč až 8 000,-Kč a 250 na částku 8 001,-Kč až 10 000,-Kč. Jaká je pravděpodobnost, že šek bude znít na částku nižší než 10 000,-Kč? Řešení: Označíme A1 – šek zní na částku do 5 000,-Kč A2 – šek zní na částku 5 001,-Kč až 8 000,-Kč A3 – šek zní na částku 8 001,-Kč až 10 000,-Kč. Jev, že podaný šek bude znít na částku nižší než 10 000,-Kč označíme B. Náhodný jev B lze vyjádřit pomocí neslučitelných náhodných jevů B = A1 U A2 U A3 P(B) = P(A1) + P(A2) + P(A3) = 0,08 + 0,20 + 0,25 = 0,53 Pravděpodobnost, že šek bude znít na částku nižší než 10 000,-Kč, je 53%. Násobení podmíněná pravděpodobnost P(A/ B) – pravděpodobnost nastoupení jevu A za předpokladu, že
nastal jev B. Pravděpodobnost současného nastoupení dvou jevů A a B P(A ∩ B) = P(A/ B).P(B) = P(B/ A).P(A) součin pravděpodobnosti jednoho jevu a podmíněné pravděpodobnosti druhého jevu vzhledem k prvnímu jevu. nezávislé jevy pravděpodobnost nastoupení nebo nenastoupení jednoho z jevů neovlivňuje pravděpodobnost nastoupení nebo nenastoupení druhého jevu. Platí P(A/ B) = P(A), P(B/ A) = P(B) Pak platí P(A ∩ B) = P(A).P(B) Př. 4: Reklamní slogan propaguje „s novým automobilem Mondavia najedete 100 000 km bez vážné poruchy“. Výrobce informoval své prodejce, že může dojít ke čtyřem „klasickým“ vážným poruchám s následujícími pravděpodobnostmi: 5% motor 3% převodovka 1,3% brzdy 1% spojka. Jaká je pravděpodobnost, že by novináři mohli po testu jediného automobilu Mondavia považovat tento slogan za klamavý? Řešení: Označíme jev A1 – porucha motoru jev A2 – porucha převodovky jev A3 – porucha brzd jev A4 – porucha spojky Pravděpodobnost vážné poruchy určíme jako sjednocení jevů A1 až A4. Jevy nejsou neslučitelné (může nastat např. porucha motoru a současně brzd atd.), musíme tedy odečíst pravděpodobnosti průniku dvou jevů, protože jsme tyto jevy započítaly jak v jednom tak i v druhém jevu; stejně tak musíme přičíst pravděpodobnosti nastoupení tří jevů současně, protože jsme tyto jevy třikrát započítaly a také třikrát odečetly (např. jev (A1∩A2∩A3) jsme započítaly jak v jevu A1 tak v jevu A2 i v jevu A3 a odečetli také třikrát a to v jevu A1∩A2 i A1∩A3 i A2∩A3 atd. P(A1UA2UA3UA4) = P(A1) + P(A2) + P(A3) + P(A4) – P(A1∩A2) – P(A1∩A3) – P(A1∩A4) – P(A2∩A3) – P(A2∩A4) – P(A3∩A4) + P(A1∩A2∩A3) + P(A1∩A2∩A4) + P(A1∩A3∩A4) + P(A2∩A3∩A4) – P(A1∩A2∩A3∩A4) = = 0,05 + 0,03 + 0,013 + 0,01 – 0,05 . 0,03 – 0,05 . 0,013 – 0,05 . 0,01 – 0,03 . 0,013 – 0,03 . 0,01 – 0,013 . 0,01 + 0,05 . 0,03 . 0,013 + 0,05 . 0,03 . 0,01 + 0,05 . 0,013 . 0,01 + 0,03 . 0,013 . 0,01 – 0,05 . 0,03 .
0,013 . 0,01 = 0,099574705 Tento výpočet není moc pohodlný. Pro snadnější výpočet budeme zkoumat opačný jev, a to že nedojde k žádné poruše. Pravděpodobnost jevu, že nedojde k žádné poruše určíme jako průnik opačných jevů Ā1 až Ā4. Tyto jevy jsou nezávislé. P(Ā1∩Ā2∩Ā3∩Ā4) = P(Ā1) . P(Ā2) . P(Ā3) . P(Ā4) = 0,95 . 0,97 . 0,987 . 0,99 = 0,900425295. Pravděpodobnost poruchy je potom 1 – 0,900425295 = 0,099574705. Existuje tedy 9,96% pravděpodobnost, že by test mohl ukázat, že reklama je klamavá. Formule úplné pravděpodobnosti a Bayesův vzorec (zjednodušený pro dvě množiny) Chceme určit pravděpodobnost jevu A, který může nastat pouze ve spojení s jedním z jevů B1 a B2, jež tvoří skupinu neslučitelných jevů, tj.platí pro ně P(B1U B2) = P(B1) + (B2) = 1 Tyto jevy budeme nazývat hypotézy. V tomto případě se jev A rozpadá na částečné případy AB1 a AB2 Protože platí P(A ∩ B1) = P(B1) P(A/ B1) a P(A ∩ B2) = P(B2) P(A/ B2) má formule úplné pravděpodobnosti tvar P(A) = P(B1) P(A/ B1) + P(B2) P(A/ B2) V případě, že jsou známy nejen nepodmíněné pravděpodobnosti P(B1), (B2) a podmíněné pravděpodobnosti P(A/ B1), P(A/ B2), ale je také známo, že výsledkem pokusu je nastoupení jevu A, zle podmíněné pravděpodobnosti P(B1/ A), P(B2/ A) pomocí Bayesova vzorce P( B1 ) P A / B1 P(B1/ A) = P B1 P ( A / B1 ) P ( B2 ) P( A / B2 ) Př. 5: Pravděpodobnost, že žena ve věku 40 let onemocní rakovinou prsu, je 1%. V případě, že má rakovinu je pravděpodobnost, pozitivního testu na mamografu 90%. V případě, že nemá rakovinu, je pravděpodobnost pozitivního testu 9%. Určete jaká je pravděpodobnost, že žena, má rakovinu, pokud má pozitivní test? Řešení: Označíme jev A – test je pozitivní jev B1 – žena má rakovinu
P(B1) = 0,01
jev B2 – žena nemá rakovinu P(B2) = 0,99 jev A/ B1 – test je pozitivní za předpokladu, že žena má rakovinu P(A/ B1) = 0,9 jev A/ B2 – test je pozitivní za předpokladu, že žena nemá rakovinu P(A/ B2) = 0,09 Dosadíme do Bayesova vzorce P( B1 ) P A / B1 P(B1/ A) = P B1 P ( A / B1 ) P ( B2 ) P( A / B2 ) 0,01 0,9 = 0,0917 tj. 9,17% 0,01 0,9 0,99 0,09 Pravděpodobnost, že 40-ti letá žena má rakovinu, za předpokladu, že má pozitivní test na mamografu je (možná překvapivě) pouze 9%.
P(B1/ A) =
Rozšiřující text
Shrnutí
Definovali jeme si pravděpodobnost pomocí klasické a také pomocí statistické definice pravděpodobnosti. Seznámili jsme se s pravidly pro počítání s pravděpodobnostmi a naučili jsme se používat Bayesův vzorec.
Kontrolní otázky a úkoly
1) Potřebujeme do rána doručit dokument do Bruselu. Ze zkušenosti víme, že kurýrní služba A doručuje včas zásilky s 90% pravděpodobností, služba B s 88% pravděpodobností a služba C s 92% pravděpodobností. Jaká je pravděpodobnost, že alespoň jedna zásilka dorazí zítra před desátou, pokud využijeme všechny tři kurýrní služby? 2) Je známo, že 90% výrobků odpovídá standardu. Byla vypracována zkouška, která u standardního výrobku dává kladný výsledek s pravděpodobností 0,95, zatímco u nestandardního s pravděp. 0,2. Jaká je pravděpodobnost, že výrobek, u něhož zkouška dopadla kladně, je standardní?
Seznam použitých zkratek
P(A) – pravděpodobnost nastoupení jevu A P(A/ B) – pravděpodobnost nastoupení jevu A za předpokladu, že nastal jev B
Studijní literatura
Bílková, D. – Budinský, P. – Vohánka, V.: Pravděpodobnost a statistika. Aleš Čeněk, Plzeň, 2009. Cyhelský, L. – Souček, E.: Základy statistiky. EUPRESS, Praha 2009. Hindls, R. – Hronová, S. – Seger, J.: Statistika pro ekonomy. Professional Publishing, Praha 2004.
Odkazy
Český statistický úřad - http://www.czso.cz/ http://www.czso.cz/csu/2009edicniplan.nsf/kapitola/0001-09-20090400
Klíč k úkolům
1) 99,9% 2) 97,7%