Binomické rozdělení Někdy se říká, že statistika je užitý počet pravděpodobnosti, a na tomto tvrzení je nepochybně něco pravdy, pokud se nevezme doslovně. Připomeňme si, že statistiku lze rozdělit na statistiku popisnou a induktivní. Popisná (deskriptivní) statistika. která je nejtypičtější pro sčítání lidu a podobná hromadná šetření, se zabývá především tím, jak přehledně uspořádat nepřehledné množství údajů, jak vyjádřit jejich znaky a provést zjednodušení všude tam, kde se tím nezmenší jejich vypovídací schopnost. Až do 20. století se statistika pěstovala převážně v tomto smyslu jako popis veřejného života, politická aritmetika, matematická věda o státě. Stále více však nyní vystupuje do popředí zájmu induktivní statistika, statistická analýza. Ta sice také pracuje s měřením, sčítáním, šetřením, ale nemá k dispozici celkové soubory, často ani větší části těchto celkových souborů. Opírá se o vzorky, které představují malé nebo někdy velmi malé podíly z daného základního souboru, jehož struktura a náplň mají být zjištěny a zobrazeny na základě výsledků získaných z výběrových vzorků. Most mezi těmito dvěma hlavními oblastmi statistické práce tvoří teorie pravděpodobnosti. Poskytuje matematický základ pro posuzování spolehlivosti a přesnosti všech výběrových postupů včetně přesnosti a spolehlivosti metod, jimiž jsou získané vzorky zpracovávány. Skutečnost, že počet pravděpodobnosti je matematickou disciplínou, nás nesmí mýlit v tom, že důraz je na druhém slově - pravděpodobnost. Často lze počítat na mnoho desetinných míst, ale pravděpodobnost končí mnohdy již před desetinnou čárkou! „Zákony pravděpodobnosti“ jsou proto zákony zcela zvláštního druhu - snášenlivé, pružné, nezavrhující pošetilé krajnosti, a přece dlouhodobě spolehlivé, nechybující a důvěryhodné. Téměř každý výklad pojmu matematické pravděpodobnosti vychází z házení mincí, a i my zůstaneme této staré tradici věrni. Hodíme-li si mincí, může se, jak známo, po dopadu ukázat buď hlava (H), nebo orel (O). Pro oba tyto jevy je pravděpodobnost a priori stejná, předpokládáme-li ovšem, že mince není falešná. Tato stejná pravděpodobnost se vyjadřuje tak, že se řekne (napíše): pH = pO, nebo zápisem funkce P(H) = P(O). Pro hod ideální mincí platí: P(H) = 0,5, stejně i P(O) = 0,5, neboť každý jednotlivý jev je z poloviny pravděpodobný, stejně jako absolutní jistota, že jeden z obou jevů nastane. Tato jistota, tento celkový prostor všech myslitelných možností se tedy vyjadřuje jedničkou (1). Součet jednotlivých pravděpodobností nemůže proto za žádných okolností být větší než 1. I v hovorové řeči známe ostatně matematickou pravděpodobnost. Říká se: „naděje na úspěch je jedna ku jedné“ a myslí se právě (což je přesnější zápis): P(H) = 0,5, P(O) = 0,5. To jsou pravděpodobnosti pro jedno hození mincí. Házíme-li mincí vícekrát, lze vypočítat pravděpodobnost jednotlivých výsledných kombinací (HOO, HOH, HHH atd.) násobením výchozích pravděpodobností (pH = 0,5 atd.), protože jde o navzájem zcela nezávislé pokusy. Další hod mincí či kostkou vůbec nic neví o předchozích výsledcích, proces házení nemá paměť. (Pozor, to neplatí o všech náhodných procesech, že by neměly paměť, byly nezávislé. Například po vytažení jednoho čísla ve Sportce je druhý tah závislý na výsledku předchozím – nelze už vytáhnout číslo již dříve vytažené.) Počítejme. Pro jev „dvakrát hlava“ dostaneme pHH = pHpH = pH2 = 0,25; stejně pOO = 0,25. K tomu přistupují ještě dvě možnosti: pro „jednou hlava, jednou orel“, tzn. pOH = 0,25 (nejdříve orel, pak hlava) a pHO = 0,25 (nejdříve hlava, pak orel). Zajímá-li nás celkový výsledek, nikoli však pořadí, dostaneme při dvojím hodu mincí tyto pravděpodobnosti: pHH = pOO = 0,25, pHOlib.pořadí = 0,5. Podobným způsobem lze vypočítat očekávané četnosti při třech, čtyřech a více hodech mincí a získané rozdělení četnosti zobrazené jako histogram se vyvíjí způsobem uvedeným
v obrázku
Pravděpodobnost výsledků při troj, čtyř, šesti a osminásobném hození mincí. Relativní četnosti se doplňují vždy na celek 1 všech možností. V grafu osminásobného hození jsou naproti tomu uvedeny očekávané absolutní četnosti (celek=256, relativní pravděpodobnosti se vypočítávají dělením: pravděpodobnost pro 4krát hlava (K) a 4krát orel (W) činí například 70/256). Z toho, co jsme uvedli, je zřetelně vidět, že se vytváří velmi charakteristický tvar, který se projeví ještě silněji, jestliže přes histogram promítneme frekvenční polygon, a jestliže počet pokusů ještě zvýšíme. Velmi dobrým názorným zobrazením takového rozdělení je také model „římské kašny“, kde voda přetékající z jednotlivých mís odtéká stejnoměrně vlevo i vpravo. Další model, znázorňující posloupnost stejných pravděpodobností náhodných jevů, představuje tzv. Galtonovo prkno. Základní myšlenkou je, že koule kutálející se po nakloněném prkně shora dolů narazí na kolíček, od něhož se odrazí vpravo nebo vlevo dolů. Tam narazí do dvou kolíčků, aby se znovu náhodně odrazila a narazila na trojici kolíčků, atd. Po libovolném počtu řad kolíčků koule zapadne do přihrádky, nejčastěji uprostřed, do vedlejší přihrádky padne méně často a celkem zřídka padá do krajních přihrádek. Galtonovo prkno je dnes známější než kdykoliv jindy, i když nikoli pod tímto názvem, zato v kýčovitém provedení a pseudoelektronickém vyparádění. Tento mechanismus náhodného rozdělení odchýlením kuliček na překážkách vpravo nebo vlevo je totiž základním konstrukčním principem hracích automatů.
Binomické rozdělení zobrazené pomocí modelu římské kašny – nádržky se naplní podle Pascalova trojúhelníku: 1:4:6:4:1
Galtonovo prkno s kolíčky – kuličky se náhodným mechanismem rozdělí do přihrádek podle Pascalova trojúhelníku: 1:6:15:20:15:6:1
Uvedené případy (včetně problému rodin o pěti dětech popsaných v jiném článku) jsou příklady tzv. binomického rozdělení. Pro binomické rozdělení je charakteristické, že má jen dvě rozdílná vyjádření znaků, která však společně vyplňují celý pravděpodobnostní prostor. Při hodu mincí je to samozřejmé, protože jsou jen dva znaky (hlava nebo orel). Avšak již při tažení hrací karty máme čtyři „barvy“. V takových případech, a ty jsou v praxi velmi časté, rozlišuje se prostě „hledaný znak“ a „všechny ostatní“. Jak velká je pravděpodobnost, že z dobře zamíchaného balíčku karet vytáhneme pikovou kartu? Zřejmě jedna čtvrtina, zatímco zbytek – tři čtvrtiny - zůstává pro „nepiky“: „žaludy“, „srdce“ či „kára“. Proto se často vedle pravděpodobnosti p, že očekávaný „jev“ nastane, klade doplňková hodnota (1 - p), která se označuje q. Přitom musí platit p + q = 1. Proto čím menší je p, tím větší je q a obráceně. Jestliže máme znak „muži“ (narození syna), je v každém jen poněkud reprezentativním výběrovém souboru obyvatelstva p jen nepatrně větší než q. Jestliže znakem je „muži přes 40 let, kteří byli v minulém roce v Portugalsku“, pak p je velmi malé, protože q tvoří nejen všechny ženy, ale také všichni muži pod 40 let a všichni, kdo nebyli v Portugalsku. Binomické rozdělení tedy udává, jaká je pravděpodobnost pro určitý výsledek výběrového souboru. Tvoří do jisté míry empirickou základnu pro teorii výběrových souborů. Umožňuje nám z přesně známého základního souboru, např. 52 karet, zjistit pravděpodobnost výsledku pro každé pořadí tahů. V praxi při vytváření výběrových souborů skutečný základní soubor neznáme, avšak víme, jak je pravděpodobné, že výběrové soubory poskytují jeho skutečný nebo zkreslený obraz. Podívejme se např., kolik piků bude „pravděpodobně“ taženo, jestliže se z dobře zamíchaného balíčku karet táhne pětkrát za sebou po jedné kartě. Tažená karta se přitom dá zpět a zamíchá se společně s ostatními; v daném případě máme před sebou model binomického rozdělení. Binomické rozdělení je dáno pravděpodobností p sledovaného jevu a počtem n provedených pokusů (tahů, hodů,…) a budeme ho značit Bi(n;p). Očekávaný počet úspěchů (obdoba aritmetického průměru ve statistickém zpracování) se teoreticky vypočítá jako součin np. Na grafech házení mincí si všimněte, že tato očekávaná hodnota je nejčetnější – 8 hodů: np = 8.0,5 = 4; 6 hodů: np = 3. Při jednom jediném tahu karty z balíčku pro piky platí p = 0,25. Při 5 tazích je tedy početní „očekávaná hodnota“ 5p = 1,25. Není však dosti dobře možné táhnout 1,25 piku; očekávaná hodnota slouží proto v tomto případě jen jako jistý druh orientační pomůcky. Můžeme již teď předpokládat, že „1 pik mezi 5 kartami“ se objeví poměrně často. Nejjednodušší však bude, když vypočítáme nejdříve oba extrémy: 5 piků, případně žádný pik. Protože při tazích jde o navzájem nezávislé náhodné jevy (dali jsme přece taženou kartu vždy zpět a dobře se zamíchalo), platí pravidlo o násobení pravděpodobnosti: P5piků = (0,25)5 ≈ 0,001. Tento výsledek by bylo možné
očekávat jen jednou v 1000 sériích pokusů. Častěji se dá počítat s 5 nepiky: q5nepiků = (0,75)5 ≈ 0,237. A teď jak často se vyskytne 1 pik a 4 nepiky? Můžeme vypočítat, kolik je (0,25).(0,75)4 ≈ 0,079 avšak k tomuto výsledku lze dojít více než jedním způsobem, neboť 1 pik může být tažen jako první, ale také jako druhá, třetí, čtvrtá nebo dokonce pátá karta. Co lze v daném případě poměrně pohodlně vypočítat, nelze tak lehce zjistit ve složitějších případech (třeba 3 piky z 8). V dané obtížné situaci najdeme pomoc ve zvláštním uspořádání čísel, které je známo jako Pascalův trojúhelník, ačkoliv celkem neprávem, protože Pascal není ani jeho znovuobjevitelem, nýbrž poznal jej u svého učitele Hérigona. Podobné uspořádání nacházíme však už o 150 let dříve v knize „Arithmetica integra“ Michaela Stifela (Norimberk 1544); stejně tak se toto číselné uspořádání vyskytuje již v perské a čínské literatuře 13. a počátku 14. století, takže by bylo lépe, kdyby bylo označeno neutrálně, např. jako „aritmetický trojúhelník“. Jak tedy tato číselná sestava vypadá? Vrstva jedniček obklopuje trojúhelník, ve kterém je každé číslo složeno ze součtu obou nad ním šikmo, vpravo i vlevo, stojících čísel. To, co nejprve vypadá jako podivná hračka, nabývá rychle na významu, když znovu připomeneme římskou kašnu a necháme vodu stékat ze stupně na stupeň do dvou, tří, čtyř atd. mís. Předpokládáme-li v nejvyšší míse „jednotku“ vody, pak v následujícím stupni se dělí na 1/2 + 1/2, na třetím stupni na 1/4 + 2/4 + 1/4, v dalším na 1/8 + 3/8 + 3/8 + 1/8, atd., jak je vyznačeno v uvedeném schématu. To přesně odpovídá výsledkům našeho házení mincí. Při jednom hodu je pravděpodobnost 1/2 : 1/2, při dalším je pravděpodobnost 1/4 (HH) : 1/2 (HO, resp. OH) : 1/4 (OO), při třech hodech 1/8 HHH, 3/8 HHO, 3/8 HOD, 1/8 000 atd. Někteří z vás už znají binomickou poučku: (a + b)2 = a2 + 2ab + b2, tzn. rozdělení 2 1 (a ) : 2(ab) : 1 (b2), stejně jako v Pascalově trojúhelníku, resp. v čitateli zlomků naší římské kašny. V případě (a + b)3 = a3 + 3a2b + 3ab2 + b3 se to také potvrzuje, což obecně znamená, že v Pascalově trojúhelníku jsou přesně a pečlivě uspořádány binomické koeficienty. Pro mnohé v matematice téměř neřešitelný problém, např. (a + b)5, lze nyní vyřešit skoro bez námahy, prostě přečíst: na pátém řádku čteme 1 – 5 – 10 – 10 – 5 – 1 , tudíž: (a + b)5 = a5 + 5a4b + 10a3b2 + 10a2b3 + 5ab4 + b5. Teď už není třeba nic jiného než za koeficienty a, b dosadit pravděpodobnosti p a q, a můžeme vypočítat pravděpodobnost všech kombinací pěti tahů z balíčku karet. Hledáme sledovaný případ pq4, tzn. 1 pik a 4 nepiky. Protože pq4 = (0,25). (0,75)4, a (0,75)4= 0,317, dostaneme pravděpodobnost 0,079, kterou však musíme ještě násobit četností 5, protože v řádku je p5 + ... + 5 pq4 + q5. Protože (0,079) .5 = 0,396, je hledaná pravděpodobnost ,,1 pik v pěti tazích" přibližně 0,4. Podobným způsobem vypočítáme: počet piků 0 pravděpodobnost 0,237
1 0,396
2 0,264
3 0,088
4 0,014
5 0,001
Součet všech těchto výrazů dává zase 1. tedy prostor pravděpodobnosti všech výběrových souborů v rozsahu 5 tahů. Největší dílčí souhrn z nich je 5(0,25).(0,75)4 = 0,4, tzn. ten, který jsme vypočítali pro 1 pik, což je úplně správné, neboť ,,1 pik" zobrazuje situaci „očekávaná hodnota 1,25“ nejlépe. Získání binomických koeficientů pomocí Pascalova trojúhelníku pro velká n je značně pracné a nepohodlné. Totéž platí i pro jejich získání přes vzorec (dozvíte se v oktávě nebo na semináři). Naštěstí se však v takové případě může binomické rozdělení, a to nejen v případě p = q = 0,5, na mnohem pohodlnějšího normálního rozdělení, které je i při menších p plně uspokojivé. A pro ještě menší p < 0,1 se použije Poissonova rozdělení. Oběma rozdělením budeme věnovat některý příští článek.
Zákon velkých čísel Hráčská kasina zpravidla neznají úpadek. Je tomu tak z mnoha důvodů, z nichž dva nejdůležitější jsou: každá hra provozovaná v kasinu má včleněnu takovou možnost výhry, že bank musí v dlouhodobém výhledu dosáhnout zisku, a za druhé, že téměř všichni hráči jsou zatíženi pověrčivostí, která je pokřivena představou o „zákonu velkých čísel“. V jejich představách se snoubí elementární počet pravděpodobnosti a naivní optimismus s chybnou matematikou do fantastické legendy, kterou lze vyjádřit takto: „Jestliže desetkrát po sobě padla červená, musí dříve nebo později padnout častěji černá, protože zákon velkých čísel tvrdě vyžaduje, aby červená a černá padaly koneckonců stejně často.“ Stejnou představu by bylo možno uplatňovat, když v ruletě nebo ve Sportce dlouho nevyšlo určité číslo. Mnoho hráčů Sportky sází systematicky čísla, která dlouho nebyla tažena nebo jsou tažena nadprůměrně zřídka, na základě přesvědčení, že tato čísla jsou zralá, ba dokonce přezrálá k tahu. To je však legenda o „dozrávání šancí“. Podle vtipného výroku jednoho francouzského matematika nemá ruleta „ani svědomí, ani paměť“. Moc málo lidí je však ochotno tomu věřit a své naděje upínají místo toho na špatně zažitou moudrost o „zákonu velkých čísel“, který prý slibuje kompenzaci tím, že kategoricky vyžaduje, aby v dlouhodobém výhledu zcela nutně vyšla hodnota očekávaná podle teorie počtu pravděpodobnosti. Hodíme-li mincí stokrát, musí padnout hlava a orel stejně často, a nevyjde-li to ani při stém hodu, musí se tak stát při tisícím nebo desetitisícím nebo také při pozdějších hodech. „Zákon velkých čísel“ je ve svém původním znění znám již více než půl tisíciletí. Objevuje se v „Ars coniectandi“ (Umění dohadu) Jakuba Bernoulliho, uveřejněném v roce 1713, po autorově smrti, a říká asi toto: Jestliže jsou pokusné řady dosti dlouhé a dostatečně často se opakují, lze dosáhnout vypočítané pravděpodobnosti v průměru těchto pokusů s libovolnou přesností. Důraz se přitom klade na průměr četných řad pokusů. Jestliže to, co jsme zde uvedli, ilustrujeme na praktickém příkladu, vypadá to asi takto: pravděpodobnost čísla 4 při házení bezvadnou kostkou je - protože kostka má šest ploch – rovna 1/6. Protože očekávaná hodnota navzájem nezávislých pokusů se rovná pravděpodobnosti správného hodu (p), násobené počtem pokusů (n), vychází při 6 pokusných hodnotách očekávaná hodnota 1 (=6.1/6), při 300 pokusech je očekávaná hodnota 50 (P = 1/6, n = 300), při 9000 je očekávaná hodnota 1500. „Zákon velkých čísel“ vůbec neříká. že při 9000 hodech zcela jistě hodím 1500 čtyřek bez ohledu na to, zda mám smůlu nebo štěstí. Především jde o to, že je možno stanovit uvedené číslo při třístovkových, tisícových nebo jiných sériích, jejichž výsledky vyjádřené jako aritmetický průměr se koneckonců neodchýlí od očekávané hodnoty o více než 1 nebo 3 nebo 7 anebo jinou libovolnou hodnotu. V jediné pokusné řadě nemůže být ani řeči o kompenzaci v průběhu řady. To, co nastane - a to jsme měli možnost pozorovat v náznacích již v Pascalově trojúhelníku – je koncentrace četností v blízkosti očekávané hodnoty se současným stále širším
celkovým rozptylem. Při dvou hodech mincí vyjde očekávaná hodnota 1 hlava (p = 1/2, n = 2) v polovině pokusné řady. Při dvanácti hodech vyjde očekávaná hodnota 6 (p = 1/2, n = 12) jen v 924/4096 = 22,5 % případů, neboli méně než v 1/4 všech případů. Souhrn „blízkých“ výsledků (totiž 4, 5. 6, 7 a 8 hlav) dává však celkově asi 70% pravděpodobnost, zatímco horní a dolní krajní případy (0,1,2,3 a 9,10,11,12 hlav) nedávají celkem víc než 30 %. Co dělá „zákon velkých čísel“ tak důležitým pro statistiku, není jeho užitečnost nebo bezcennost v hráčském kasinu, nýbrž jeho význam při využití výběrových souborů. Protože pokusná řada je prakticky výběrovým souborem, platí i v tomto případě, že očekávanou hodnotu je možno určit (případně skutečnou hodnotu celkového množství) s libovolnou přesností, jestliže jsou vytvořeny dostatečně velké vzorky. V části, kde se budeme zabývat výběry podrobněji, uvidíme, že v praxi se však musí dělat většinou velmi skromné kompromisy.
Jedna zajímavost z historie z roku 1380: Příklad: Dva stejně dobří hráči A a B hrají spolu sérii partií (třeba šachu); nepřipouští se nerozhodně. Hráči hrají o milion, který získá ten, kdo první vyhraje celkem 6 partií. Hra musela být přerušena v okamžiku, kdy hráč A dosáhl 5 vítězství a hráč B 3 vítězství. Ve hře se již nemůže a nebude pokračovat. Určete v jakém poměru si mají hráči celkovou částku spravedlivě rozdělit. řešení uveřejněné v roce 1494 udává dělící poměr A:B = 2:1 řešení uveřejněné v roce 1556 udává dělící poměr A:B = 3:1 řešení uveřejněné v roce 1654 udává dělící poměr A:B = 7:1 Který poměr rozdělení výhry je spravedlivý? To se dozvíte na semináři.