Úvod - jistota (nuda) x nejistota (riziko) 1 Malá exkurze do 17. století 2 Základní pojmy 2.1 Jev a pokus 2.2 Skládání a rozklad jevů 2.3 Jevy a čísla 2.4 Úloha o rozdělení sázky 2.5 Úlohy Chevaliera de Méré 3 Pravděpodobnost 3.1 Klasická pravděpodobnost 3.1.1 Cardano: součet čísel při hodu dvěma kostkami 3.1.2 Studentské dilema 3.1.3 Problém nešťastné šatnářky 3.2 Geometrická pravděpodobnost 3.2.1 Problém prvního rande 3.2.2 Problém golfistky Alžběty a atomového fyzika Dalibora 3.2.3 Problém nedoručené zprávy 3.2.4 Problém Ludolfova čísla 3.3 Statistická pravděpodobnost 3.3.1 Problém muže s vosami aneb brouk leze po krychli 3.3.2 Problém námořníka Jima v Port Rack poprvé 3.3.3 Problém námořníka Jima v Port Rack podruhé 3.4 Axiomatická definice pravděpodobnosti 3.4.1 Problém dělení jablek 3.4.2 Problém starého výtahu 3.4.3 Problém jednosměrek 3.4.4 Problém výstavby schodiště 3.4.5 Problém krotitele dravé zvěře 3.4.6 Problém sekretářky Evy 4 Podmíněná pravděpodobnost, nezávislé jevy 4.1 Podmíněnost, nezávislost a realita 4.1.1 Problém návštěv krajských nemocnic 4.1.2 Problém jakosti 4.1.3 Problém lidské paměti 4.1.4 Problém zaměstnavatele 4.1.5 Problém roztržitého profesora a cestující Aničky Zvědavé 4.2 Úplná pravděpodobnost 4.2.1 Problém kontrolora Františka 4.2.2 Problém spotřebitele 4.2.3 Problém vězně 4.3 Apriorní a aposteriorní pravděpodobnost, Bayesův vztah 4.3.1 Princip automatické diagnostiky v medicíně 4.3.2 Problém diagnostického testu (na rakovinu) 4.3.3 Problém komisaře Nováka 5 Opakované pokusy 5.1 Bernoulliovo schema 5.1.1 Problém hráčů v kostky 5.1.2 Problém nákazy skotu 5.2 Geometrické schema
6
7
8
9
10
5.2.1 Problém nákupčího 5.2.2 Problém potomků pana Procházky Náhodná veličina, pravděpodobnostní rozdělení 6.1 Hledá se reprezentant 6.1.1 Problém klíčů 6.1.2 Problém střídavých tahů 6.1.3 Problém hazardních her 6.2 Normální rozdělení 6.2.1 Problém normální (Gaussovy) křivky 6.2.2 Problém testů IQ - Mensa 6.3 Když normální rozdělení selhává 6.4 Poissonovo rozdělení 6.4.1 Problém obchodníka s látkami 6.4.2 Problém náhlého úmrtí 6.4.3 Problém hodnocení podřízených 6.4.4 Problémy sedmi trpaslíků Co o sobě lidé (ne)vědí 7.1 Dotazníky a ankety 7.2 Grafické znázornění 7.3 Testování hypotéz 7.4 Kontingenční tabulky 7.4.1 Problém vysokoškoláků 7.4.3 Problém dědičnosti obezity 7.4.4 Problém lidové předpovědi počasí 7.4.5 Problém brusičů z povolání 7.4.6 Problém ze střední školy 7.4.7 Problém sběratelství Jak se optimálně rozhodnout v konfliktní situaci 8.1 Katka a Matouš objevují Lapkův ráj 8.2 Hry se dvěma strategiemi 8.2.1 Problém nudného odpoledne 8.2.2 Problém setkání u divadla 8.2.3 Problém narozenin 8.2.4 Problém péče o nemocného 8.2.5 Problém známý jako Dáma a tygr Dodatek: kombinatorika 9.1 Co je to vlastně kombinatorika? 9.2 Kombinatorika intuitivní 9.2.1 Problém dlouhého stolu 9.2.2 Problém dvou oddělených stolů 9.2.3 Problém čepiček 9.3 Nové symboly pro čísla 9.3.1 Faktoriál 9.3.2 Kombinační čísla 9.3.3 Pascalův trojúhelník 9.4 Kombinatorika a výběry 9.4.1 Typické příklady 9.4.2 Kombinatorika čtená po druhé Použitá literatura
1
Malá exkurze do 17. století
Život člověka je plný nečekaných událostí, které nemůže ovlivnit. Některé jsou jen zpestřením běžného dne, jako třeba jestli najdeme v lese hříbek nebo jak dlouho budeme muset čekat na autobus. Jiné nám tvrdě zasahují do života a mnohdy jej zcela převrátí. S nečekanými událostmi se setkáváme denně. A denně určitou oblast našich životů režíruje nejistota, kterou podle jejích účinků nazýváme Náhoda či Osud. Osud, to jsou ty fatální převraty. Nedá se proti nim obvykle nic dělat, jen se s nimi smířit. V takových chvílích se obracíme k nějaké vyšší autoritě, na kterou se snažíme hodit zodpovědnost, a které v zájmu svého psychického klidu a míru věříme, že to s námi myslí dobře. To Náhodu bereme spíše jako kamarádku, která nám jde mnohokrát na nervy (když udělá něco pro nás nemilého), ale zase je s ní legrace a pomáhá nám plašit nudu. S Osudem si zahrávat nelze, ale s Náhodou ano. Často se ji snažíme využít a na její úkor si přilepšit, třeba v penězích. Voláme obvykle na pomoc Štěstěnu a doufáme, že ona Náhodu přemluví v náš prospěch. O existenci řady věcí mezi nebem a zemí má lidstvo povědomost od nepaměti. Podle starověké mytologie na počátku světa házeli tři bratři Zeus, Poseidon a Hádes kostky; první vyhrál nebesa, druhý moře a Hádes se musel usídlit v pekle. Hrací kostky skutečně archeologové v mnohých částech starověkého světa našli. Kostky nazývané astralagi byly vyřezávané z kloubů zvířat. Od nepaměti také platí snaha lidí si náhodu osedlat. Nejspíše každá dívka si někdy utrhla kopretinu a spoléhala na to, že jí odhalí pravdu o jejím vyvoleném. Jedna studentka vzpomínala, že měla vyzkoušeno, že pokud začne u prvního okvětního lístku slovíčky ,,nemá mě rád“, je odpověď u posledního lístku ,,má mě rád“, mnohem vyšší. Výjevy her s kostkami se objevují i na stěnách egyptských hrobek a na řeckých vázách. Ve starověké matematice však o náhodě nenajdeme žádnou zmínku. Příčinou byl zřejmě fakt, že jednoduše nevěřili, že se v těchto jevech dá najít nějaká zákonitost, výsledky podle nich byly nepředvídatelné. V jistém smyslu měli pravdu: v izolované náhodné události žádnou strukturu nenajdeme, musíme pozorovat a zkoumat událost opakovaně. Aspoň částečný pohled na podstatu pravděpodobnosti (náhoda a náhodný jev) ukázal Girolamo Cardano (1501-1576) a svá pozorování shrnul v knize Liber de ludo aleae (Kniha o náhodných hrách). Ukázal, že při házení kostkou je možné jednotlivým výsledkům přiřadit číselné hodnoty a jakým zákonitostem při tom podléhají, jak s nimi pracovat. Nezávisle na Cardanovi dospěl ke stejným závěrům též Galileo Galilei (1564–1642), který zkoumal chyby vznikající při fyzikálních měřeních a považoval je za výsledky náhodných pokusů. Avšak ani on nezkoumal, jak by se získané poznatky z pravděpodobnosti mohly více využít. Ve středověku se objevila úloha o rozdělení sázky. Některé práce uvádějí její původ v rukopise z roku 1380 a připouští se, že by mohla být arabského původu. Stručné zadání je toto: Dva stejně dobří hráči A (modrý) a B (červený) hrají spolu sérii partií (třeba šachu); nepřipouští se nerozhodně. Hráči hrají o milion, který získá ten, kdo první vyhraje celkem 6 partií. Hra musela být přerušena v okamžiku, kdy hráč A dosáhl 5 vítězství a hráč B 3 vítězství. Ve hře se již nemůže a nebude pokračovat. Určete, v jakém poměru si mají hráči celkovou částku spravedlivě rozdělit. Řešení z roku 1494 uvádí poměr dělení obnosu 2:1 ve prospěch hráče A. Autor vyšel z úvahy: Hráči A stačí jedna výhra a poměr vítězství bude 6:3.
Řešení z roku 1556 uvádí poměr dělení obnosu 3:1 ve prospěch hráče A. K výsledku se došlo nejspíš rozborem možných zakončení, kdyby se pokračovalo v turnaji dále. Jsou tyto možnosti: vyhraje hráč A a turnaj končí; (A) vyhraje hráč B a následující vyhraje A; (BA) 2x vyhraje B a nakonec opět A; (BBA) 3x vyhraje B a jen v tomto případě by získal milion on. (BBB) Obě řešení jsou mylná. Přelomový rok 1654 Za opravdový počátek teorie pravděpodobnosti je považována korespondence, kterou v roce 1654 vedli Blaise Pascal (1623–1662) a Pierre de Fermat (1601–1665) mimo jiné též o problémech, se kterými se na Pascala obrátil Chevalier de Méré (1607-1684). Jedním z problémů byla již zmíněná úloha o rozdělení sázky (správné řešení uvedeme později). Antoine Gombaud, přezdívaný Chevalier de Méré, byl francouzský spisovatel, který vášnivě hrál v kostky a doufal, že tak zbohatne, že tak získá velký majetek. Domníval se, že stačí čtyřikrát opakovat hod kostkou a alespoň jednou šestka padne. Pokud v těchto čtyřech pokusech šestka nepadla, vyhrál soupeř. Ovšem místo výhry utrpěl značné finanční ztráty. V zoufalé snaze odhalit příčiny svého neúspěchu, se obrátil na svého přítele, vynikajícího francouzského matematika a fyzika, Blaise Pascala s touto úlohou: Kolik je třeba hodů jednou (dvěma) kostkami, aby šance, že padne aspoň jedna (dvě) šestka, byla nadpoloviční? I tuto úlohu vyřešíme později. Úspěchy Pascala a Fermata vyvolala otázku, zda je možné přenést vznikající teorii od hracích stolů do našeho neuspořádaného, skutečného světa. O odpověď se pokoušeli i členové Bernoulliho rodiny. Bernoulliovci byli obdobou Bachovců v hudbě. Nejslavnější z nich byli bratři Jakub a Jan a syn Jana Daniel. Slavné Bernoulliho schéma, které popisuje absolutní četnosti náhodné události v sérii nezávislých pokusů, je dílo Jakuba. Byl jedním z prvých analytiků, kteří postavili základy statistické hypotézy – tj. z malého vzorku sebraných dat vyvozovat závěry, které by platili pro celou populaci. Objevil zákon o vztahu pravděpodobnosti a relativní četnosti. Ostatní jmenovaní se zasloužili v jiných oblastech matematiky a fyziky. „Je pozoruhodné, že věda, která začínala úvahami o hazardních hrách, se nakonec mohla stát nejdůležitějším předmětem lidského poznání“. (P. S. Laplace)
A to ještě francouzský matematik, fyzik, astronom a politik Pierre Simon de Laplace (1749 - 1827) nemohl tušit, k jak významným objevům se dojde ve 20. století v teorii pravděpodobnosti a matematické statistiky a jak bude zasahovat do našich životů. Přesto školská výuka o pravděpodobnosti, pokud k ní vůbec dochází, je především založena na poplatnosti hrám a její přednostní aplikace se neuvádějí. Tím se jen šíří účelové nepravdy o její nedůležitosti v běžném životě. Cílem této knížky je ukázat, že teorie pravděpodobnosti je víc než jen hrátky s mincemi nebo kostkou. Přesto si i s nimi na začátku trochu pohrajeme.
3.2.1
Problém prvního rande
Adam a Eva se potkali na diskotéce. Dobře si spolu zařádili, a tak se dohodli, že se druhý den znovu setkají u kašny na Centrálním náměstí. V kraválu tanečního sálu bylo však obtížné se domluvit a tak oba vědí jen to, že rande mají mezi 13 a 14 hodinou, ale nevědí přesně kdy. Vymezme nejprve základní prostor, ve kterém se celá událost odehrává. Označme x čas příchodu Adama a y čas příchodu Evy. Mezi 13 a 14 hodinou je celkem 60 minut. Náhodný příchod Adama a Evy, zde představují souřadnice [x;y] bodu ve čtverci 60 x 60. Body čtverce představují všechny možnosti jejich příchodu. Snadno určíme, že S() = 602 = 3600. A) Nejprve nás bude zajímat, jestli se setkání vůbec uskuteční. Tedy otázka zní: Jaká je pravděpodobnost, že se rande neuskuteční, protože ani jeden není ochoten na druhého čekat déle než 10 minut, a pak odchází? Aby k setkání mohlo dojít, musí se časy příchodu lišit nejvýše o 10 minut. Matematicky to zapíšeme nerovností |x – y| < 10 tj. x – y < 10 a zároveň y – x < 10 Tuto oblast představuje na obrázku tmavý pás. Rande se neuskuteční v případech, kdy bod příchodu [x;y] padne do některého ze dvou světlých trojúhelníků. Tyto trojúhelníky (přiraženy k sobě) tvoří čtverec o straně 50 a jeho obsah je S(A) = 502 = 2500. Pravděpodobnost, že se Adam s Evou nesejdou je P(A) = 502/602 = 0,694, neboli sejdou se (opačný jev) s pravděpodobností P(A’) = 1 – 0,694 = 0,306. B) Řekněme, že Adam má daleko větší zájem na tom, aby k setkání došlo, což se projeví tím, že je ochotný čekat až půl hodiny? Jak se změní pravděpodobnost společně stráveného odpoledne, když Eva zůstane na čekací době deseti minut. Oblast uskutečněného setkání se nyní rozšiřuje v Adamově směru. Obsah tmavého pásu (příznivá oblast jevu B) vypočítáme jako obsah celého čtverce minus velký světlý trojúhelník minus malý světlý trojúhelník: S(B) =602 – 502/2 – 302/2 = 1900. Pravděpodobnost setkání se zvyšuje na P(B) = 1900/3600 = 0,528. C) Do třetice spočítejme pravděpodobnost setkání pro případ, že se Adam i Eva rozhodnou dodržet tradiční čtvrthodinku. Situace je znázorněna obrázkem k jevu ad A) s tím rozdílem, že místo 10 minut je teď 15 minut. Hledaná pravděpodobnost proto je P(C) = 1 – 452/602 = 0,4375.
Jak je vidět, ani akademická čtvrthodinka nezaručuje úspěch. Ani čekat půl hodiny se v podstatě nevyplatí. Nejlepší je se domluvit na přesném čase a ten taky dodržet. 6.3
Když normální rozdělení selhává
I když je normální rozdělení na pohled tak pěkné, a pro použití tak účelné, a může být proto často plným (nebo alespoň značným) právem použito, přes to nemůže zachytit všechny skutečnosti. Je mnoho věcí mezi nebem a zemí, o nichž se normální křivce ani nesní. Velmi jednoduchý a názorný příklad tohoto tvrzení je případ počtu dětí v rodinách. Rodiny bezdětné a s 1 a s 2 dětmi jsou téměř stejně četné; pak však křivka (polygon četnosti) padá na „pravou“ stranu způsobem, který by mohl přibližně odpovídat normálnímu rozdělení: 3 děti jsou méně časté, 4 ještě méně atd., až v úseku 11 a více dětí se dosahuje extrémních hodnot. Co je naproti tomu na „levé“ straně křivky? Nic, žádná žena nemůže mít méně než žádné dítě. Graf švýcarského statistického úřadu to ukazuje velmi názorně.
Výrazně „strmé“ rozdělení ukazuje mimo jiné počet dětí na vdanou ženu (nebo také na rodinu): značné četnosti při 0, 1 a 2 dětech jsou zhruba stejně vysoké a potom se silně snižují.
Normální rozdělení se v tomto případě nehodí, protože naráží na nulové hranici na bariéru, která je – obrazně řečeno - zešikmuje. Šikmost rozdělení je ostatně statistický vědecký termín, kterým se měří horizontální odchylka rozdělení od normálního rozdělení. Doplněk k tomu tvoří exces, jenž křiví zvonovitý tvar normální křivky ve svislém směru, to znamená, že zvon je příliš strmý nebo příliš plochý. Je-li šikmost tak výrazná, že křivka vykazuje při nejnižších hodnotách nejvyšší četnosti (bylo by tomu tak v případě, že bezdětná manželství by byla nejčastější), vzniká takzvaná křivka L. O rozdělení L, které se doprava zplošťuje, koluje melancholické rčení, že prý je charakteristickým rozdělením všech krásných věcí. Téměř každé rozdělení příjmů ukazuje udává-li se výše příjmů na osu x a počet jejich příjemců na osu y - řídkost velkých příjmů a četnost příjmů malých. Chce-li někdo např. považovat vysoký věk za žádoucí příjemnost, udává grafické znázornění úmrtnosti rovněž klesající křivku. Cokoli je zvlášť cenné, vyskytuje se jen u mála osob. Kdyby se měl graficky znázornit počet barokních soch, případně počet knih připadajících na jednu domácnost, zase by vzniklo rozdělení L, rozdělení krásných věcí.
7.4.4
Problém lidové předpovědi počasí
skupina
V rámci biometerologického výzkumu bylo zkoumáno 100 osob na citlivost na počasí. Skupinu A tvořili lidé s loupáním, revmatici, migrénisté, apod., kontrolní skupinu B osoby bez těchto příznaků. Sledovala se úspěšnost předpovědi počasí na lokální úrovni do 24 hodin. Nulová hypotéza: Úspěšnost předpovědi počasí nezávisí na tom, zda-li ji vysloví člověk s bolestmi kloubů a podobně nebo člověk bez těchto příznaků. Tyto vlastnosti, kdyby se prokázaly, by byly pro nás důležité a proto testování provedeme na 1 % úrovni.
A B celkem
vyšla 42 26 68
Protože 2 = 8,12 > citlivější na počasí.
předpověď nevyšla 10 22 32
celkem 52 48 100
100(42.22 - 10.26)2 = 8,12 = 52.48.68.32 2
6,63 = 2(0,01), zamítáme nulovou hypotézu: osoby skupiny A jsou