SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO
Statistika I distanční studijní opora
Milan Křápek
Soukromá vysoká škola ekonomická Znojmo Duben 2013
Statistika I Vydala Soukromá vysoká škola ekonomická Znojmo 1. vydání Znojmo, 2013
ISBN 978-80-87314-40-1
© Milan Křápek, 2013
Název ■ Statistika 1 Určení ■ Pro výuku oborů Účetnictví a finanční řízení podniku, Marketing a management v kombinované formě studia na Soukromé vysoké škole ekonomické Znojmo - 3. semestr Garant/autor Mgr. Milan Křápek Recenzoval "[jméno a příjmení recenzenta včetně ak. titulů]"
Cíl Vymezení cíle Seznámit čtenáře se základními pojmy statistiky a pravděpodobnosti. Ukázat jejich možné aplikace v praxi.
Dovednosti a znalosti získané po studiu textu Čtenář po prostudování tohoto textu bude znát hlavní pojmy statistiky. Rozlišovat různé charakteristiky statistických proměnných a bude je správně používat a interpretovat. Také pochopí základní myšlenky teorie pravděpodobnosti a seznámí se s jejím využitím ve statistice. V posledních kapitolách pak získá znalosti jak popisovat pravděpodobnosti spojitých veličin a jakým způsobem s takovými pravděpodobnostmi můžeme pracovat a využívat je při predikci.
Obsah: 1
2
ZÁKLADNÍ POJMY STATISTIKY..................................................................................................................8 1.1
HROMADNÉ JEVY ....................................................................................................................................... 8
1.2
STATISTICKÝ SOUBOR .................................................................................................................................. 8
1.3
ZÁKLADNÍ A VÝBĚROVÝ SOUBOR .................................................................................................................... 9
1.4
STATISTICKÝ ZNAK .................................................................................................................................... 10
1.5
PROMĚNNÉ ............................................................................................................................................. 10
1.6
STATISTICKÉ ŠETŘENÍ ................................................................................................................................. 11
ZÁKLADNÍ ZPRACOVÁNÍ STATISTICKÝCH DAT ........................................................................................14 2.1 2.1.1
Tabulka četností.............................................................................................................................. 14
2.1.2
Grafy a diagramy ............................................................................................................................ 15
2.1.3
Mutabilita ....................................................................................................................................... 16
2.2
3
Prosté rozdělení četností................................................................................................................. 18
2.2.2
Grafické znázornění výsledků prostého rozdělení ........................................................................... 20
2.2.3
Intervalové rozdělení četnosti......................................................................................................... 23
CHARAKTERISTIKY POLOHY ...................................................................................................................28 PRŮMĚRY ............................................................................................................................................... 29
3.1.1
Aritmetický průměr ......................................................................................................................... 29
3.1.2
Geometrický průměr ....................................................................................................................... 34
3.1.3
Harmonický průměr ........................................................................................................................ 35
3.1.4
Kvadratický průměr......................................................................................................................... 36
3.2
KVANTILY ............................................................................................................................................... 36
3.2.1
Výpočet kvantilů prostého rozdělení............................................................................................... 36
3.2.2
Odhad kvantilů intervalového rozdělení ......................................................................................... 38
3.2.3
Přehled názvů často používaných kvantilů...................................................................................... 40
3.2.4
Krabicový diagram .......................................................................................................................... 40
CHARAKTERISTIKY VARIABILITY.............................................................................................................42 4.1
CHARAKTERISTIKY ABSOLUTNÍ VARIABILITY..................................................................................................... 42
4.1.1
Variační rozpětí............................................................................................................................... 42
4.1.2
Kvantilová rozpětí ........................................................................................................................... 43
4.1.3
Rozptyl ............................................................................................................................................ 44
4.1.4
Směrodatná odchylka ..................................................................................................................... 48
4.1.5
Průměrná odchylka ......................................................................................................................... 48
4.1.6 4.2
5
ZPRACOVÁNÍ NUMERICKÝCH PROMĚNNÝCH ................................................................................................... 18
2.2.1
3.1
4
ZPRACOVÁNÍ KATEGORIÁLNÍCH PROMĚNNÝCH ................................................................................................ 14
Kvantilové odchylky ........................................................................................................................ 48 CHARAKTERISTIKY RELATIVNÍ VARIABILITY ...................................................................................................... 49
4.2.1
Variační koeficient .......................................................................................................................... 49
4.2.2
Relativní průměrná odchylka .......................................................................................................... 50
CHARAKTERISTIKY KONCENTRACE.........................................................................................................51 5.1
ŠIKMOST ................................................................................................................................................ 51
5.2
ŠPIČATOST .............................................................................................................................................. 54
5.2.1
Koeficient špičatosti ........................................................................................................................ 54
5.2.2 6
7
8
9
10
11
12
Lorenzova křivka ............................................................................................................................. 56
LINEÁRNÍ ZÁVISLOST A NEZÁVISLOST ....................................................................................................59 6.1
KOVARIANCE ........................................................................................................................................... 59
6.2
KORELAČNÍ KOEFICIENT ............................................................................................................................. 61
INDEXNÍ ANALÝZA .................................................................................................................................63 7.1
ABSOLUTNÍ POROVNÁVÁNÍ......................................................................................................................... 63
7.2
RELATIVNÍ POROVNÁVÁNÍ .......................................................................................................................... 64
7.3
INDEXY ................................................................................................................................................... 65
7.3.1
Jednoduché individuální indexy ...................................................................................................... 65
7.3.2
Složené individuální indexy ............................................................................................................. 66
7.3.3
Souhrnné indexy.............................................................................................................................. 70
ZÁKLADNÍ POJMY TEORIE PRAVDĚPODOBNOSTI...................................................................................74 8.1
NÁHODNÝ JEV ......................................................................................................................................... 74
8.2
OPERACE S NÁHODNÝMI JEVY ..................................................................................................................... 75
DEFINICE PRAVDĚPODOBNOSTI ............................................................................................................79 9.1
AXIOMATICKÁ TEORIE PRAVDĚPODOBNOSTI ................................................................................................... 79
9.2
KLASICKÁ DEFINICE PRAVDĚPODOBNOSTI....................................................................................................... 80
9.3
GEOMETRICKÁ DEFINICE PRAVDĚPODOBNOSTI................................................................................................ 81
9.4
STATISTICKÁ DEFINICE PRAVDĚPODOBNOSTI................................................................................................... 82
VLASTNOSTI PRAVDĚPODOBNOSTI .......................................................................................................84 10.1
PODMÍNĚNÁ PRAVDĚPODOBNOST ............................................................................................................... 84
10.2
NEZÁVISLÉ NÁHODNÉ JEVY ......................................................................................................................... 85
10.3
PRAVIDLO O SČÍTÁNÍ PRAVDĚPODOBNOSTÍ .................................................................................................... 87
10.4
PRAVIDLO O NÁSOBENÍ PRAVDĚPODOBNOSTÍ ................................................................................................. 88
10.5
ÚPLNÁ PRAVDĚPODOBNOST ....................................................................................................................... 88
10.6
BAYESOVA VĚTA ....................................................................................................................................... 90
NÁHODNÁ VELIČINA..............................................................................................................................91 11.1
ROZDĚLENÍ NÁHODNÉ VELIČINY ................................................................................................................... 91
11.2
DISTRIBUČNÍ FUNKCE ................................................................................................................................ 92
11.3
PRAVDĚPODOBNOSTNÍ FUNKCE ................................................................................................................... 94
11.4
HUSTOTA PRAVDĚPODOBNOSTI ................................................................................................................... 96
CHARAKTERISTIKY NÁHODNÉ VELIČINY.................................................................................................99 12.1
OBECNÉ MOMENTY .................................................................................................................................. 99
12.1.1 12.2
CENTRÁLNÍ MOMENTY............................................................................................................................. 102
12.2.1 12.3
13
Střední hodnota ........................................................................................................................ 101 Rozptyl ...................................................................................................................................... 103
NORMOVANÉ MOMENTY ......................................................................................................................... 104
12.3.1
Šikmost ..................................................................................................................................... 105
12.3.2
Špičatost ................................................................................................................................... 105
12.4
CHARAKTERISTIKY POLOHY ....................................................................................................................... 107
12.5
CHARAKTERISTIKY VARIABILITY .................................................................................................................. 108
NÁHODNÝ VEKTOR..............................................................................................................................110 13.1
SDRUŽENÁ DISTRIBUČNÍ FUNKCE................................................................................................................ 110
13.2
SDRUŽENÁ PRAVDĚPODOBNOSTNÍ FUNKCE .................................................................................................. 112
13.3
SDRUŽENÁ HUSTOTA PRAVDĚPODOBNOSTI .................................................................................................. 114
13.4
MARGINÁLNÍ FUNKCE ............................................................................................................................. 115
ÚVOD Statistika je věda, kterou každý z nás zná hlavně z médií, kde jsou nám každodenně předkládány průzkumy obliby, průměrné platy, hodnoty inflace a podobné údaje, které přímo vycházejí ze statistiky a lidé, kteří statistice nerozumí se poté diví, proč jsou tyto údaje tak odlišné od jejich skutečného života. Ovšem v dnešní společnosti se se statistikou setkáváme každý den a to mnohem častěji než si uvědomujeme. Ať už vyjdeme ze základních využití, jako jsou například popisy složení a trvanlivosti výrobků, které denně kupujeme, nebo určování výše platu zaměstnavatelem tak, aby neriskoval ztrátovost podniku, až po ty složitější jako jsou vývoj nových výrobků a ověřování jejich nezávadnosti a trvanlivosti, či správné dávkování léčiv pacientům, všude najdeme určitou část statistiky. Při správném porozumění těmto pojmům nám tyto údaje, mohou poskytnout cenné informace, pro člověka je tedy vhodné rozumět alespoň základním principům této vědy a tím také lépe porozumět fungování společnosti, ve které žije. V ekonomických vědách se statistika využívá také k predikování budoucnosti a tím určování výhodnosti různých investičních možností a manažerských rozhodnutí. K tomu slouží často velmi drahé počítačové aplikace a ještě dražší sady informací, z nichž tyto aplikace mohou naznačovat pravděpodobný další vývoj. Manažer, který tyto principy pochopí nebo je alespoň dokáže efektivně využít, má samozřejmě nad ostatními výhodu.
1
ZÁKLADNÍ POJMY STATISTIKY
CÍL Cílem kapitoly je seznámit čtenáře se základními pojmy používanými v ostatních částech textu. Vysvětlit rozdíly mezi statistickými proměnnými. Popsat způsoby získávání statistických dat a upozornit na možné chyby, jejichž výsledkem mohou být zkreslené výsledky.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 60 minut PROCVIČOVÁNÍ: 5 minut
Pojem statistika v současné době představuje: 1. Číselné a slovní údaje a jejich souhrny o nejrůznějších hromadných jevech. 2. Činnost spočívající v získávání statistických dat, jejich třídění a zpracování. 3. Vědu zabývající se zkoumáním statistických zákonitostí hromadných jevů a vývoji vědeckých metod sběru, zpracování a analyzování dat.
1.1 Hromadné jevy Hromadné jevy jsou jevy vyskytující se mnohokrát a mohou se stále opakovat. Hromadné jevy rozdělujeme na dva typy. Prvním typem jsou hromadné jevy spočívající v opakování určitého pozorování či měření stejného objektu. Důvodem může být úmysl zjistit skutečnou hodnotu pomocí průměru těchto nepřesných měření, nebo také zkoumání přesnosti zvoleného postupu měření či pozorování. Druhým typem hromadných jevů je množina různých podobných objektů, u nichž zkoumáme určitou vlastnost, kterou má každý z těchto objektů v různé míře. Zajímá nás poté rozsah hodnot této vlastnosti, nejčastější hodnota, průměrná hodnota apod.
PŘÍKLAD Příkladem prvního typu, mohou být měření teploty v bytě v pravidelných intervalech, nebo počítání počtu vozidel, které projedou určenou křižovatkou během dne, pokud tento průzkum probíhá více dní. Druhým typem hromadných jevů může být například výstupní kontrola výrobků, určování složení a doby trvanlivosti výrobků za účelem tisku etiket, a podobně.
1.2 Statistický soubor Při zkoumání vlastností je potřeba předem zvolit množinu zkoumaných objektů. Tyto objekty mají celou řadu vlastností, z nichž některé jsou různé, ale některé jsou u zvolených objektů totožné. Právě podle totožných vlastností můžeme určit, zda libovolný objekt patří či nepatří do zkoumané množiny. Statistickým souborem nazýváme zkoumanou množinu, u níž jsou přesně určeny společné vlastnosti, a tím je jednoznačně dáno, které objekty patří do zkoumaného souboru.
PŘÍKLAD Množinu dospělých osob můžeme definovat jako lidi, kteří dosáhli 18 let věku. Pouhá definice pomocí spojení dospělá osoba nemusí být zcela jednoznačná, neboť v různých kulturách se definice dospělé osoby může lišit, proto je třeba pojem upřesnit buď počtem let, nebo určit podle kterých zákonů či zvyků budeme vlastnost posuzovat.
8|Stránka
Prvky statistického souboru nazýváme statistické jednotky. Počet statistických jednotek statistického souboru se nazývá rozsah statistického souboru. Rozsah statistického souboru může být konečný, což ovšem neznamená, že jsme schopni zjistit konkrétní hodnotu, ale také může být nekonečný.
PŘÍKLAD Počet studentů v učebně při první přednášce předmětu Statistika I, je konečný a tento počet můžeme snadno zjistit. Počet osob, které dosáhly 18 let věku v tomto okamžiku, je jistě také konečný, ale nejsme schopni určit tento počet. Naopak při zkoumání určité vlastnosti u vyráběných výrobků po celou dobu probíhající výroby, není možné tuto vlastnost změřit, neboť stále vznikají další objekty ze zvoleného statistického souboru a rozsah tohoto souboru v tuto chvíli považujeme za nekonečný. Podobně je pro nás nekonečný i statistický soubor obsahující množství srážek za den, které získává meteorologická stanice.
1.3 Základní a výběrový soubor Základní soubor, populace - je takový statistický soubor, ve kterém poznání některých vlastností tohoto souboru je cílem statistického zkoumání. Pokud je základní soubor velmi rozsáhlý, není prakticky uskutečnitelné zkoumání každé statistické jednotky.
PŘÍKLAD Zjišťování názorů na úpravu náměstí všech obyvatel města, jistě by takový průzkum byl možný, ovšem jeho časové i finanční náklady by byly obrovské. Proto se obvykle volí snazší způsob jak určit způsob úpravy. Určí se například několik možností od různých architektů a poté řešíme pouze výběr jedné z těchto variant.
Někdy takové zkoumání ani není možné, zvláště v případě kdy zjišťování potřebných údajů vede k fyzickému zničení statistické jednotky, v takových případech jsou ze základního souboru vybrány jen některé statistické jednotky, které jsou dále podrobeny zkoumání. Jedná se hlavně o destruktivní testy, které zkoumanou jednotku znehodnotí, tak že není možné její další prodej, či užívání, nebo je určitým způsobem ztížen.
PŘÍKLAD Měření doby prohoření u stavebního materiálu, či určování kvality vína ochutnáváním jsou příklady statistických zjišťování, které není možné provádět na celém základním souboru. Pokud bychom ochutnali všechny lahve vína, které vyrobíme, nebylo by co prodávat.
Vybranou množinu statistických jednotek ze základního souboru nazýváme výběrový soubor. Výběrový soubor by měl být co nejlepším reprezentantem základního souboru. Výběr vhodného souboru je nejpodstatnější částí průzkumu, chybným postupem je možné získat zcela zkreslené údaje. Chybný výběr může být neúmyslný, kdy zkoumající na základě chybějících údajů či zkušeností chybně určil výběrový soubor. Také může jít o úmyslný chybný výběr, čímž může zkoumající díky správnému odhadu, uměle zkreslit výsledky zkoumání ve svůj prospěch. Je tedy vhodné co nejpřesněji popsat postup vybírání, aby bylo zřejmé, že byl zvolen správný postup. Máme dva způsoby výběru statistických jednotek: 1. Záměrný výběr - odborník na základě znalostí vybere statistické jednotky tak, aby věrně reprezentovaly základní soubor. 2. Náhodný výběr - výběr je přenechán náhodě, losování, tabulka náhodných čísel, systematický výběr a podobně
PŘÍKLAD
9|Stránka
Při předvolebních průzkumech se často objevují různé předpovědi výsledků. Protože tyto průzkumy probíhají pomocí dotazování lidí na ulici je jistě velmi důležité v kterou denní hodinu a ve které části města bude dotazování probíhat. V ulici před nejdražšími obchody a hotely budou výsledky jistě zcela jiné než při dotazování u východu z velké továrny.
1.4 Statistický znak Statistický znak - údaj o určité vlastnosti každé statistické jednotky uvažovaného statistického souboru. Počet hodnot tohoto znaku odpovídá rozsahu statistického souboru. Hodnota statistického znaku, pozorování - je označení stupně uvažované vlastnosti u každé jednotlivé statistické jednotky. Každá statistická jednotka statistického souboru má jednu hodnotu tohoto znaku. Statistický znak může nabývat různého počtu obměn (variant). Podle jejich počtu je rozdělujeme: 1. Shodné - tento znak obsahuje pouze jednu obměnu. Všechny statistické jednotky mají tedy hodnotu tohoto znaku totožnou. Statistický znak nabývající pouze jedné varianty se nazývá identifikační statistický znak. 2. Proměnné - jedná se o statistické znaky nabývající více než jedné obměny. Tyto znaky jsou právě ty, které jsou předmětem statistického zkoumání.
1.5 Proměnné Proměnné rozdělujeme 1. Kategoriální (kvalitativní) - Jedná se o statistické znaky určené slovně. Rozdělují se na nominální a pořadové. 1.1. Nominální proměnné jsou takové, kde slovní určení nedává žádnou další informaci o pořadí těchto znaků. 1.2. Pořadové proměnné jsou takové, u kterých hodnoty neudávají jen základní informaci, ale také udávají pořadí, dle kterého můžeme výsledky srovnávat. 2. Numerické (kvantitativní, měřitelné, metrické) proměnné- Jedná se o statistické znaky určené číselně. U jednotlivých výsledků tedy můžeme určit nejen pořadí, ale taky můžeme srovnávat o kolik je jedna statistická jednotka více než druhá. Numerické proměnné rozdělujeme na diskrétní a spojité. 2.1. Diskrétní (nespojité) proměnné na daném intervalu nabývají pouze izolovaných číselných hodnot. Nejčastěji se jedná o přirozená nebo celá čísla. 2.2. Spojité (kontinuální) proměnné - Na daném intervalu může nabývat libovolných reálných hodnot.
10 | S t r á n k a
Obrázek 1: Rozdělení statistických proměnných podle typu
PŘÍKLAD Proměnná, která udává druh bydlení zkoumané rodiny (dům, vlastní byt, nájemní byt) je nominální. Nemůžeme určit které bydlení je nejlepší a které nejhorší. Kolonka vzdělání udává pořadí, neboť můžeme říci, že vysokoškolské vzdělání je více než středoškolské, už z toho důvodu, že ten kdo dosáhne vysokoškolského vzdělání, musí mít dokončenou střední školu. Počet dětí, výše nájmu jsou hodnoty diskrétní proměnné, protože u každého čísla můžeme určit následující hodnotu. Hustota měřené tekutiny nebo přesný čas zkoumané události jsou spojité veličiny, i když výsledky mohou být někdy považovány za diskrétní, ovšem je třeba si uvědomit, že určení následníka není obecně možné, ale závisí na přesnosti měřícího přístroje.
Některé slovní proměnné můžeme převádět na číselné, abychom mohli lépe využít statistických postupů. U těchto převodů je ovšem nutné postupovat velmi opatrně. Nejdůležitější je vhodně určit rozdíly mezi jednotlivými údaji. Rozdělení na spojité a diskrétní proměnné může být někdy relativní, velmi záleží na přesné definici proměnné.
PŘÍKLAD Statistická proměnná věk může nabývat různých reálných hodnot, neboť nikomu není přesně 20 let, ale spíše 20,523... roku a je tedy spojitá. Zatímco proměnná věk v dokončených letech je diskrétní.
Proměnné také rozdělujeme podle množství variant: 1. Alternativní proměnné nabývají dvou variant, které se vylučují. 2. Množné proměnné nabývají více než dvou variant Slovní alternativní proměnné někdy převádíme na číselné tak, že jednu možnost označíme hodnotou 0 a druhou hodnotou 1. Těmto proměnným poté říkáme nulajedničkové proměnné.
1.6 Statistické šetření Pojmem statistické šetření (zjišťování) rozumíme získávání hodnot zkoumaných statistických jednotek. Součástí statistického šetření jsou také postupy takového šetření, které je třeba u provedeného statistického šetření důkladně zdokumentovat a popsat. 11 | S t r á n k a
Statistická šetření se rozdělují: 1. Vyčerpávající - jedná se o taková statistická šetření, při kterých zjišťujeme hodnoty zkoumaných proměnných u všech statistických jednotek. a. Úplné vyčerpávající šetření - jedná se o takové šetření, kdy se nám podařilo prošetřit všechny statistické jednotky, které měly být prošetřeny. Toto šetření nám dává přesné podklady pro výpočet charakteristik základního souboru. b. Neúplné vyčerpávající statistické šetření - je takové šetření, ve kterém se nám nepodařilo prošetřit všechny statistické jednotky. Neúplnost se dá v některých případech tolerovat, jestliže byl počet neprozkoumaných statistických jednotek vzhledem k rozsahu základního souboru velmi malý. 2. Nevyčerpávající- jedná se o taková šetření, u nichž se předem počítá s tím, že nebudou prošetřeny všechny jednotky, ale jen vybraná část. Tento způsob šetření bývá nutný v případě, kdy zkoumáním dochází k poškození či zničení statistické jednotky. Také je mnohem méně finančně náročný. Nevýhodou ovšem je, že neposkytuje přesné údaje o charakteristikách celého základního souboru. a. Reprezentativní nevyčerpávající statistické šetření - jedná se o šetření, kdy byly zkoumané statistické jednotky vhodně vybrány a výsledné charakteristiky se dají zobecnit tak, že odpovídají hodnotám v celém základním souboru. b. Nereprezentativní nevyčerpávající statistické šetření - je šetření, kdy byl výběrový soubor zvolen nevhodně, a výsledky neodpovídají základnímu souboru. Příkladem postupu, který je obvykle nereprezentativní, je anketa.
PŘÍKLAD Šetření mezi všemi pracovníky podniku, které probíhá formou rozhovoru s každým pracovníkem, je příkladem úplného vyčerpávajícího statistického šetření, za předpokladu, že se žádnému ze zaměstnanců nepodařilo tomuto rozhovoru vyhnout. Sčítání lidu, domů a bytů by bylo také úplné vyčerpávající šetření, neboť původní úmysl je získat odpovědi od všech obyvatel, ovšem z důvodu, kdy někteří nejsou ochotni i za cenu sankcí tento formulář vyplnit, není tohoto cíle dosaženo. Jedná se tedy o neúplné vyčerpávající statistické šetření a neúplnost je možné tolerovat neboť z celkového počtu formulářů je počet těch, které nejsou vyplněny minimální. Zkoumání doby trvanlivosti vyráběných potravin je zcela jistě nevyčerpávající, není možné všechny výrobky nechat zkazit, abychom určili, jakou dobu trvanlivosti měly. Aby se ovšem jednalo o reprezentativní šetření, není možné otestovat jednu sérii výrobků a stejné výsledky udávat i u ostatních sérií. Správný postup by byl testovat vždy několik náhodně vybraných výrobků každé série, pak se jedná o reprezentativní nevyčerpávající statistické šetření. V případě když si majitel webových stránek, zabývajících se výstavbou a prodejem fotovoltaických elektráren, dá na své stránky anketu s otázkou, zda respondent souhlasí se snížením výkupní sazby elektřiny z těchto elektráren, a výsledky ankety bude poté interpretovat, tak, že dané procento lidí v ČR nesouhlasí se snížením ceny, je postup jistě nesprávný. Dané webové stránky obvykle navštíví lidé, kteří tuto výstavbu plánují a tak je samozřejmé, že se snížením ceny nebudou souhlasit, a tím si snižovat vlastní zisk. Naopak lidé, kteří by se snížením souhlasili, takové stránky obvykle nepotřebují vyhledávat a na anketu tedy neodpoví. Jedná se tedy o nereprezentativní nevyčerpávající statistické šetření.
Statistická data rozdělujeme také podle způsobu jejich získání: 1. Primární data - Jedná se o informace, které jsme získali sami pomocí měření, či dotazování konkrétních osob, jichž se statistické zjišťování týká. 2. Sekundární data - Jsou informace, které jsme získali z jiného zdroje, např. statistické ročenky. Jedná se o častější způsob získávání dat. Podle času získání poté používáme rozdělení: 1. Rozhodný okamžik - časový moment, který je určující pro zahrnutí či nezahrnutí statistických jednotek do statistického souboru a pro zachycení okamžikových statistických znaků. Okamžikový statistický znak je znak, jehož hodnota se určuje u všech statistických 12 | S t r á n k a
jednotek k určitému danému okamžiku. Př. Počet obyvatel bytu k 1.1.2011. 2. Rozhodná doba - časové období, během kterého dochází ke zkoumání. Je vymezen dvěma časovými okamžiky. Tento interval je potřebný v případě intervalových statistických znaků. Jedná se o znaky, jejich hodnota se v průběhu doby mění. Počátek výpočtu je první interval a konečný interval určuje konec výpočtu. Př. Počet zákazníků za měsíc březen 2011. Čistý zisk v posledních dvou dnech.
PŘÍKLAD Počet všech obyvatel bytu k půlnoci 1.1.2011 je údaj získaný v rozhodný okamžik. Počet zákazníků za měsíc duben je údaj získaný v rozhodné době mezi půlnocí dne 31. března a půlnocí dne 30. dubna.
ÚLOHA 1 Určete, jaký typ proměnné obsahuje následující hodnoty: a) Váhu nákladních vozidel projíždějících kontrolovaným úsekem. b) Počet prodaných výrobků jednotlivými obchodními zástupci v průběhu dne. c) Odpovědi na otázku „Kolikrát ročně jezdíte s rodinnou na dovolenou?“, pokud měli respondenti na výběr z možností „vůbec“, „jednou“, „několikrát ročně“. d) Údaje vyplněné zájemci o zaměstnání v kolonce poslední zaměstnavatel. e) Počet let praxe v daném oboru. f) Spotřeba vozidel zaregistrovaných v ČR v roce 2010.
13 | S t r á n k a
2
ZÁKLADNÍ ZPRACOVÁNÍ STATISTICKÝCH DAT
CÍL Cílem kapitoly je seznámit čtenáře se základními statistickými výpočty, které využíváme při zpracování získaných údajů. Statistické výpočty budou rozdílné v závislosti na povaze získaných údajů a čtenář bude veden k tomu, aby správně rozlišil, které postupy použít. Budou popsány způsoby zobrazení dat v tabulkách rozdělení, a také různá grafická zobrazení získaných výsledků.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 120 minut PROCVIČOVÁNÍ: 120 minut
Před tím, než můžeme získané údaje zpracovat, musíme určit typ proměnné. Dle popisu v předchozí kapitole rozhodujeme mezi kategoriální proměnnou a numerickou proměnnou. Toto rozdělení je založeno jen na tom, zda získané hodnoty tvoří čísla, či text. Při použití dotazníku je častým výsledkem interval hodnot. Tento interval poté považujeme za numerickou proměnnou a zpracujeme ji pomocí intervalového rozdělení četnosti, ovšem přesnější výsledky vždy dostaneme v případě, že získáme přesnou hodnotu.
2.1 Zpracování kategoriálních proměnných Hodnoty kategoriální proměnné jsou slovní údaje. Tyto údaje nabývají určitého počtu obměn. Počet obměn označme k a počet zkoumaných statistických jednotek označíme n. Jednotlivé obměny označíme ai, kde i =1,2,...,k.
2.1.1 Tabulka četností Absolutní četnost značí počet výskytů jednotlivých obměn a značíme ji ni, pro i=1,2,...,k. Označení n1 tedy určuje, u kolika statistických jednotek se vyskytuje hodnota a1, a podobně u ostatních indexů.
UPOZORNĚNÍ Pro absolutní četnost platí rovnost. n = n1 + n2 + ... + nk Tato rovnost je vhodná pro kontrolu výpočtů. Tedy po výpočtu absolutních četností všech obměn, můžeme pomocí této rovnice snadno ověřit, zda nedošlo k chybě.
Relativní četnost pi určuje, u jaké části základního souboru obsahuje zkoumaná proměnná obměnu ai. Po vynásobení 100 získáme tento údaj v procentech. Relativní četnost vypočítáme z rozsahu statistického souboru a absolutní četnosti pomocí vzorce ni i n
P =
UPOZORNĚNÍ Pro relativní četnost platí, že součet relativních četností všech obměn je roven 1.
p1 + p 2 + ... + p k = 1 Tato rovnost je opět vhodná k ověření správnosti výpočtu. Vzhledem k tomu že hodnoty relativních četností vznikají pomocí dělení a tak je velmi často musí zaokrouhlit. Je tedy možné, že zaokrouhlení způsobí chybu v součtu. Pokud je v takovém případě hodnota součtu velmi blízká 1, považujeme ji za správnou a do tabulky píšeme 1.
Při zpracování dat slovní proměnné je potřeba vytvořit tabulku rozdělení četností. 14 | S t r á n k a
Četnost
Obměna proměnné Absolutní
Relativní
a1
n1
p1 =
n1 n
a2
n2
p2 =
n2 n
...
...
...
ak
nk
pk =
Celkem
n
nk n
1 = p1 + p 2 + ... + p k
Tabulka I: Tabulka četností kategoriální proměnné
V některých případech můžeme u pořadových kategoriálních proměnných postupovat podobně, jako by se jednalo o diskrétní proměnnou a tak vypočítat i kumulativní četnosti, které se obvykle počítají u numerických proměnných. Je potřeba obměny této proměnné seřadit vzestupně (sestupně) podle jejich hodnot.
2.1.2 Grafy a diagramy Grafy a diagramy používáme pro přehlednější zobrazení výsledků. To je vhodné zvláště v případech, kdy máme velké množství obměn a tabulka je tedy velmi rozsáhlá. Nejčastěji používáme sloupkové diagramy. U těchto diagramů jsou jednotlivé obměny vyznačeny sloupci, které jsou stejně široké, a výška těchto sloupců značí počet statistických jednotek, u kterých sledovaná proměnná nabývá daných hodnot. Obměnu, jejíž absolutní i relativní četnost je vzhledem ke svému okolí největší, nazýváme modus nebo také vrchol. Také je možné u těchto grafů prohodit osy a získáme řádkové diagramy, které často mohou být kompaktnější.
Obrázek 2: Sloupcový a řádkový diagram
Dalším užívaným typem grafů jsou plošné grafy. Pomocí těchto grafů se zobrazují relativní četnosti. U těchto grafů platí, že obsah zvoleného geometrického obrazce tvoří 100% a jednotlivě vyznačené části určují relativní četnosti jednotlivých obměn zkoumané proměnné. Z plošných grafů nejčastěji potkáváme výsečové grafy. 15 | S t r á n k a
Obrázek 3: Výsečový a plošný graf
V případech, kdy proměnná nabývá tak velkého množství obměn, nebo kdy každá obměna nabývá pouze velmi malé absolutní četnosti, a diagram by z těchto důvodů byl nepřehledný nebo by nevypovídal o vlastnostech základního souboru, můžeme některé obměny, které jsou si vzájemně podobné spojit v jednu. V této nově vzniklé obměně získáme vyšší absolutní četnost a pomocí několika spojení můžeme snížit počet zobrazovaných údajů na rozumnou mez. Při tomto spojování je ovšem dbát na přesný popis sloučených obměn a také spojovat jen ty obměny, které jsou si velmi blízké, jinak bychom mohli dostat graf, který spíše zamlží informace o základním souboru, než že by je přehledně zobrazil.
2.1.3 Mutabilita Mutabilita značí rozdílnost sledované kategoriální proměnné, určujeme ji pomocí míry mutability. Míra mutability nám pomůže číselně určit, jak rozdílné hodnoty zvolené kategoriální proměnné mají prvky zkoumaného statistického souboru. Míra mutability nabývá hodnot od 0 do 1 a značí podíl počtu dvojic s různou obměnou k počtu všech dvojic. Je možné ji také udávat v procentech. Míra mutability nám vlastně v procentech říká, kolik dvojic prvků má různou hodnotu kategoriální proměnné. Míru mutability M nejlépe vypočítáme pomocí tohoto vzorce:
n2 − M =
k
∑n i =1
2 i
n ⋅ ( n − 1)
UPOZORNĚNÍ Pokud je míra mutability rovna nule, pak mají všechny prvky statistického souboru stejnou hodnotu zkoumané proměnné, tedy tento statistický znak je shodný. Naopak pokud je míra mutability rovna jedné, pak má každý prvek jinou hodnotu tohoto znaku.
16 | S t r á n k a
PŘÍKLAD 2.1 Při anketě jsme se ptali 45 osob na druh jejich bydlení. Mezi možnostmi 5 obměn. Výsledky máme zobrazené v tabulce. Vhodným způsobem zpracujte tuto proměnnou.
Číslo domácnosti
Druh bydlení
Číslo domácnosti
Druh bydlení
Číslo domácnosti
Druh bydlení
1
Dům vlastní
16
Byt vlastní
31
Byt vlastní
2
Dům nájem
17
Jinak
32
Dům vlastní
3
Dům vlastní
18
Dům vlastní
33
Dům vlastní
4
Byt vlastní
19
Dům vlastní
34
Dům vlastní
5
Byt vlastní
20
Byt nájem
35
Byt vlastní
6
Dům vlastní
21
Dům nájem
36
Jinak
7
Byt nájem
22
Byt vlastní
37
Dům nájem
8
Byt nájem
23
Dům vlastní
38
Byt vlastní
9
Jinak
24
Byt vlastní
39
Dům vlastní
10
Byt nájem
25
Dům vlastní
40
Byt vlastní
11
Dům vlastní
26
Byt vlastní
41
Dům nájem
12
Jinak
27
Byt vlastní
42
Dům vlastní
13
Byt nájem
28
Byt vlastní
43
Byt vlastní
14
Dům vlastní
29
Dům vlastní
44
Dům vlastní
15
Dům vlastní
30
Byt vlastní
45
Byt vlastní
Řešení: Proměnná je zřejmě kategoriální (slovní), musíme tedy rozhodnout, zda je nominální, nebo pořadová. Pořadová by byla v případě, kdy se dá vytvořit jednoznačné pořadí těchto obměn. V tomto případě to ovšem není možné, nejsme schopni říci, jestli je lepší bydlet ve vlastním domě nebo v pronajatém bytě, protože každému může vyhovovat jiná z nabízených možností. Jedná se tedy o kategoriální proměnnou a na nás v jakém pořadí obměny zapíšeme do tabulky četností. Nyní musíme spočítat, kolikrát se ve výsledcích objevují různé obměny, a tyto počty zapíšeme do sloupce absolutních četností. V posledním řádku ověříme, zda je součet roven počtu zkoumaných statistických jednotek. Poté vypočítáme relativní četnost a v posledním řádku opět ověříme správnost, tak získáme následující tabulku. Tabulka četností Četnost Obměna proměnné Absolutní Relativní Dům vlastní
17
0,378
Dům podnájem
4
0,089
Byt vlastní
16
0,356
Byt podnájem
5
0,111
Jinak
3
0,067
17 | S t r á n k a
Celkem
45
1
Dále vytvoříme sloupcové diagramy, jeden vychází z absolutních četností a druhý z relativních četností. V praxi ovšem stačí vytvořit jeden z těchto grafů, protože jak vidíme, oba vypadají totožně a liší se pouze podle popisků na ose y.
U této proměnné také prozkoumáme mutabilitu
M=
(
)
45 2 − 17 2 + 4 2 + 16 2 + 5 2 + 3 2 ≈ 0,7222 45 ⋅ 44
Sledovaný statistický soubor má výraznou mutabilitu. Víme tedy, že 72% dvojic sestavených z osob našeho statistického souboru má odlišný typ bydlení. ÚLOHA 2.1 Hodnoty v tabulce udávají odpovědi na otázku „Jezdíte na zahraniční dovolenou?“. Proveďte vyhodnocení této ano ano nepravidelně ne proměnné. Vytvořte tabulku ano ano ano ano četností, vypočítejte mutabilitu a ano ano nepravidelně ano pomocí vhodného grafu zobrazte ano ano ne nepravidelně tyto údaje. ano ano ano ano
ano ano nepravidelně ano ano
2.2 Zpracování numerických proměnných Při zpracování numerických proměnných musíme rozhodnout, zda se jedná o diskrétní či spojitou proměnnou. Pokud je proměnná diskrétní a obsahuje pouze malé množství obměn, můžeme použít prosté rozdělení četností velmi podobně jako v případě kategoriální proměnné. Určení pojmu "malé množství obměn" je často diskutabilní, závisí vždy nejen na počtu obměn, ale také na rozsahu zkoumaného souboru. V případě, že proměnná obsahuje velké množství obměn nebo se jedná o proměnnou spojitou, využíváme k jejímu zpracování intervalové rozdělení četností.
2.2.1 Prosté rozdělení četností Pokud využíváme prosté rozdělení četností, postupujeme podobně jako v případě kategoriálních proměnných. Rozdíl je v tom, že obměny se uspořádají podle velikostí a poté můžeme počítat i kumulativní absolutní a kumulativní relativní četnosti. Počet obměn označme k jednotlivé obměny označíme xi, kde i=1,2,...,k. Rozsah statistického souboru značíme n.
UPOZORNĚNÍ Označení obměn je odlišné od označení obměn kategoriální proměnné, důvodem je, že znak x se obvykle používá pro číselnou proměnnou v matematice.
18 | S t r á n k a
Absolutní četnost značí počet výskytů jednotlivých obměn a značíme ji ni, pro i=1,2,...,k. Označení n1 tedy určuje u kolika statistických jednotek se vyskytuje hodnota x1 a podobně to platí i pro ostatní obměny.
UPOZORNĚNÍ
Opět platí rovnost n = n1 + n2 + ... + nk , kterou můžeme použít k ověření správností výpočtu.
Relativní četnost pi určuje, u jaké části základního souboru obsahuje zkoumaná proměnná obměnu xi. Po vynásobení 100 získáme tento údaj v procentech. Relativní četnost vypočítáme z rozsahu statistického souboru a absolutní četnosti pomocí vzorce
p1 =
n1 n
UPOZORNĚNÍ Pro relativní četnost platí: p1 + p 2 + ... + pk = 1 Tuto vlastnost relativních četností opět použijeme k ověření správnosti výpočtu.
Tyto vypočítávané údaje vkládáme do tabulky rozdělení četností, obdobně jako při zpracování kategoriálních proměnných. Tabulku poté doplníme o další dva sloupce, kumulativní absolutní četnost a kumulativní relativní četnost. Kumulativní absolutní četnost Ni - udává u kolika statistických jednotek byla zkoumaná proměnná menší nebo stejná jako xi. Vzorec pro výpočet absolutní kumulativní četnosti je: N i =
i
∑n j =1
j
U obměny x1 je kumulativní absolutní četnost stejná jako absolutní četnost tedy n1. Obecně platí, že kumulativní četnost nejrychleji spočítáme, když k absolutní četnosti přičteme kumulovanou absolutní četnost o řádek výše.
UPOZORNĚNÍ Hodnota kumulované absolutní četnosti poslední obměny xk musí být rovna n. Tímto způsobem si opět ověříme správnost výpočtů.
Kumulativní relativní četnost Pi - udává jaký poměr statistických jednotek má zkoumanou proměnnou rovnu nebo menší než zvolená hodnota xi. Výpočet je totožný jako v případě kumulativní absolutní četnosti, jen využívá relativní četnost namísto absolutní. i
Pi = ∑ p j j =1
UPOZORNĚNÍ Poslední řádek zde musí obsahovat hodnotu 1. Pokud počítáme kumulativní relativní četnost podle vzorce, může se stát, že součet bude blízko 1. Důvodem může být zaokrouhlování hodnot relativních četností, které k výpočtům používáme. V takovém případě je lepší vypočítat kumulativní relativní četnost pomocí hodnot kumulativních absolutních četností. Kumulativní relativní četnost pak získáme jako poměr mezi kumulativní absolutní četností a rozsahem statistického souboru. Pi =
Ni . n
19 | S t r á n k a
Četnost
Kumulativní četnost
Obměna proměnné Absolutní
Relativní
Absolutní
Relativní
x1
n1
p1 =
n1 n
N1 = n1
P1 =
N1 n
x2
n2
p2 =
n2 n
N 2 = N 1 + n2
P2 =
N2 n
...
...
...
xk
nk
pk =
Celkem
n
... nk n
N k = N k −1 + nk
...
Pk =
Nk n
1
Tabulka II: Tabulka prostého rozdělení četnosti
2.2.2 Grafické znázornění výsledků prostého rozdělení V případech kdy, využíváme prostého rozdělení, můžeme hodnoty graficky zobrazit stejnými způsoby jako v případech kategoriálních proměnných, tedy sloupcový či plošný graf. Mnohem lepších výsledků ale dosáhneme, pokud sestrojíme polygon četností nebo součtovou křivku. Polygon četností získáme vynesením četností jednotlivých obměn do kartézské soustavy souřadnic. Na osu x vyneseme jednotlivé obměny x1,x2,...,xk. Do tohoto grafu poté zobrazíme body určující četnosti jednotlivých obměn. Tyto četnosti mohou být jak absolutní tak relativní. Absolutní nám poté zobrazí přesné počty naměřených obměn, relativní zobrazují poměr.
UPOZORNĚNÍ Výsledná křivka je stejná, a nezávisí na tom, zda použijeme absolutní nebo relativní četnosti, změní se jen popisky osy y. Pokud bychom chtěli do jednoho grafu zobrazit výsledky dvou různých průzkumů o různém počtu statistických jednotek, je vhodnější použít relativní četnosti.
V případě, kdy použijeme absolutní četnosti zakreslíme body (x1,n1),(x2,n2),...,(xk,nk). V případě využití relativních četností zakreslíme body (x1,p1),(x2,p2),...,(xk,pk). Sousední body poté spojíme úsečkou a na osu y můžeme vynést alespoň některé hodnoty četností tak, aby byl graf co nejpřehlednější.
Obrázek 4: Polygon četnosti
Obměnu, jejíž absolutní i relativní hodnota je vzhledem ke svému okolí největší, nazýváme modus nebo také vrchol. Pokud bychom tento graf brali jako funkci pak by vlastně modus byl místem 20 | S t r á n k a
lokálního maxima této funkce. V případě rozdělení na obrázku máme dva modusy, jedním je obměna x4 a druhým x7. Podle počtu vrcholů dělíme rozdělení: 1. Jednovrcholová (unimodální) rozdělení četností, které mají jeden vrchol. V tomto případě se jedná o vrchol v obměně x4.
Obrázek 5: Jednovrcholová rozdělení četnosti Jednovrcholová rozdělení dále rozdělujeme podle umístění vrcholu. Jednou možností je, že vrchol je umístěn uvnitř grafu, tedy vrchol není v obměně x1 ani v obměně xk. Naopak pokud je vrchol v jedné z krajních obměn, pak se jedná o tzv. J-rozdělení. Toto rozdělení má tu vlastnost, že je buď rostoucí, nebo klesající. 2. Vícevrcholová (multimodální) rozdělení četností, které mají více vrcholů. V tomto případě má tři vrcholy x2, x4, x7.
Obrázek 6: Vicevrcholová rozdělení četnosti Pokud má rozdělení dva vrcholy nazýváme jej bimodální rozdělení, jehož speciálním případem je tzv. U-rozdělení, které se vyznačuje tím, že má vrcholy v obou krajních obměnách. U tohoto rozdělení nás často zajímá obměna, která se vyskytuje nejméně (vždy je jen jedna) a nazýváme ji antimodus. V zobrazeném případu je antimodus x3. Dále rozlišujeme různá rozdělení četnosti podle souměrnosti. Mohou být buď symetrická (souměrná) rozdělení četnosti, nebo nesymetrická (nesouměrná) rozdělení četnosti.
UPOZORNĚNÍ Souměrné rozdělení četnosti je takové, ve kterém se (přibližně) rovnají hodnoty pi a pk-i+1. Není ovšem nutné, aby byly zcela totožné.
U nesouměrných jednovrcholových rozdělení dále rozlišujeme rozdělení sešikmené kladně (rozdělení četnosti s kladnou šikmostí) a rozdělení sešikmené záporně (rozdělení četnosti se zápornou šikmostí).
21 | S t r á n k a
Obrázek 7: Symetrické rozdělení četnosti
PŘÍKLAD 2.2 Při průzkumu jsme se dotazovali v 60 domácnostech na počet členů této domácnosti. Výsledky zobrazuje tabulka. Vytvořte tabulku prostého rozdělení četností a graficky zobrazte výsledky.
22 | S t r á n k a
Řešení: Četnost
Kumulativní četnost
obměna
absolutní
relativní
absolutní
relativní
1
15
0.250
15
0.250
2
22
0.367
37
0.617
3
14
0.233
51
0.850
4
7
0.117
58
0.967
5
1
0.017
59
0.984
6
1
0.017
60
1
celkem
60
1
Polygon četností
Modus četnosti počtu členů domácnosti je 2. ÚLOHA 2.2 v tabulce udávají odpovědi na otázku „Kolikrát ročně jezdíte na dovolenou?“. Proveďte vyhodnocení této proměnné. Vytvořte tabulku četností a pomocí vhodného grafu zobrazte tyto údaje. 1 2 1 0 1 1 1 1 2 1
1 2 2 1 2 1 2 1 2 1 3 2 1 4 1 1 1 1 1 1 3 2 0 1 1 1 1 1 1 1 2 1 1 2 1 2 1 1 1 1
2.2.3 Intervalové rozdělení četnosti V případě spojitých číselných proměnných nebo těch diskrétních proměnných, u kterých je počet obměn příliš velký využíváme intervalové rozdělení četnosti. Jeho princip spočívá v tom, že vybereme nejmenší a největší hodnotu, která se v souboru vyskytuje, vhodně je zaokrouhlíme (nejmenší hodnotu dolů a největší nahoru) a takto vzniklý interval rozdělíme na několik částí (intervalů). Rozdíl mezi nejmenší a největší naměřenou hodnotou proměnné nazýváme variační rozpětí. 23 | S t r á n k a
UPOZORNĚNÍ Jednotlivé hodnoty zařazujeme do intervalů a za obměny dále považujeme intervaly a při výpočtech každý interval zastupujeme jeho středem. Pokud máme hodnotu na rozmezí dvou intervalů, pak ji zařazujeme do horního intervalu, protože se tím dopouštíme menší relativní chyby.
Existuje celá řada návrhů jak postupovat při rozdělování hodnot do intervalů, ovšem žádný z postupů není univerzálně použitelný a vždy je třeba podrobné znalosti základního souboru, aby vytvořením intervalů nedošlo k setření důležitých vlastností tohoto souboru. Ve většině případů volíme počet intervalů pomocí Stugesova pravidla, které říká, že počet , kde n je rozsah souboru. intervalů k, by měl být přibližně Tímto výpočtem získáme počet intervalů a zbývá nám určit jejich hranice. Pokud nemá základní soubor nějaké význačné zvláštnosti většinou stačí rozdíl, mezi nejmenší zvolenou hodnotou a největší zvolenu hodnotou, rozdělit na k stejně dlouhých intervalů, a do nich poté přiřadit jednotlivá měření. Někdy je ovšem potřeba postupovat obezřetněji. Například v případě, kdy má soubor dva vrcholy (modusy), pokud bychom oba zařadili do stejného intervalu, pak bychom ve výsledných výpočtech počítali s jediných modusem. Proto by v tomto případě bylo jistě vhodnější v této části rozpětí volit intervaly kratší, nejlépe tak aby každý modus byl středem vlastního intervalu a pokud by to bylo možné, tak aby mezi těmito intervaly byl ještě minimálně jeden interval bez modusu čímž by se vlastnost tohoto rozdělení zvýraznila. Při zpracování intervalového rozdělení četností sestavujeme tabulku intervalového rozdělení četností, která je téměř totožná z tabulkou prostého rozdělení četností. Četnost
Kumulativní četnost
Interval Absolutní (a1,a2)
n1
(a2,a3)
n2
...
...
(ak,ak+1)
nk
Celkem
n
Relativní
Absolutní
...
...
Relativní
...
1
Tabulka III: Tabulka intervalového rozdělení četnosti
UPOZORNĚNÍ Kumulativní četnosti se počítají úplně stejně jako u prostého rozdělení, ale je potřeba trochu jiná interpretace. Kumulativní četnost u intervalu (ai,aj) určuje, kolik prvků zkoumaného souboru bylo menších než hodnota aj. Relativní četnost nám po vynásobení 100 udává stejný údaj v procentech.
Nejlepším způsobem pro zobrazení výsledků intervalového rozdělení četnosti je tzv. Histogram četnosti. Jedná se vlastně o sloupcový diagram, který konstruujeme tak, že do soustavy os vynášíme obdélníky, jejichž šířka odpovídá šířce zobrazovaného intervalu a výška četnosti tohoto intervalu. Na rozdíl od 24 | S t r á n k a
sloupcového diagramu jsou tyto obdélníky umístěny těsně vedle sebe, aby se zdůraznilo jejich propojení.
Obrázek 8: Histogram četnosti
PŘÍKLAD 2.3 Dotazníkem jsme získali údaje o čisté mzdě 60 pracujících osob. Vhodně zpracujte tuto statistickou proměnnou, vytvořte přehlednou tabulku četností a graficky zobrazte výsledky.
13600
26555
21988
10609
9749
14377
23277
16285
17401
9041
10195
17786
14760
19749
9015
23447
18396
24840
10075
14871
10338
21364
11870
15994
19229
10051
17483
14570
11400
13531
8705
20271
26415
11465
9843
10840
14956
14863
11595
14638
16067
13384
15771
8301
14462
26616
24325
10193
13457
15743
8034
10337
12573
9579
8641
16244
25712
10069
24325
15358
Řešení: Proměnná vykazuje znaky spojité veličiny, i když by se dala považovat za diskrétní. Z důvodu velkého množství obměn pro zpracování zvolíme intervalové rozdělení četnosti. Určíme si počet zkoumaných statistických jednotek, nejmenší a největší zjištěnou hodnotu. n=50, xmin=8161 a xmax=26438 Minimální a maximální hodnoty obvykle zaokrouhlíme na blízké hezké číslo, vždy tak abychom případný interval hodnot rozšířili, nikdy jej nemůžeme zúžit, neboť bychom neměli kam zařadit krajní hodnoty. Nejmenší hodnotu si tedy určíme jako 8000 a největší 27000. 25 | S t r á n k a
Variační rozpětí určíme jako rozdíl těchto hodnot, který je roven 19000. Dále musíme určit počet intervalů, který obvykle určíme pomocí Stugesova pravidla.
k ≈ 6.606601014308861 Hodnotu zaokrouhlíme a zjistíme, že bychom měli vytvořit 7 intervalů. Jednoduchým dělením zjistíme, že pokud bychom chtěli pomocí 7 intervalů pokrýt interval šířky 19000, musel by jeden interval mít šířku 2714.285714285714, z důvodu přehlednosti tuto hodnotu opět upravíme tedy například na 2700 s tím, že jeden interval uděláme širší než ostatní a tím pokryjeme hodnoty od 8000 do 27000. Vytvořené intervaly mohou vypadat například takto: Četnosti
Kumulativní četnosti
Interval
Absolutní Relativní Absolutní Relativní (8000,10700)
10
0.167
10
0.167
(10700,13400)
11
0.183
21
0.350
(13400,16100)
9
0.15
30
0.500
(16100,18900)
9
0.15
39
0.650
(18900,21600)
7
0.117
46
0.766
(21600,24300)
9
0.15
55
0.917
(24300,27000)
5
0.083
60
1
celkem
50
1
Četnosti v tabulce se poté vyplní stejně jako v předchozím příkladě, jen je u intervalového rozdělení třeba pamatovat na to, že hodnota na krajích dvou intervalů patří vždy do toho intervalu, jehož dolní mez je tvořena přiřazovanou hodnotou. Výsledky zobrazíme pomocí histogramu četnosti.
ÚLOHA 2.3 Proveďte statistické vyhodnocení proměnné udávající měření spotřeby vozidla na 100 kilometrů.
8,2 9,4 7,9 7,2 8,1
8,5 7,6 7,4 8,4 9,9
7,1 9,3 8,4 9,5 8,6
8,5 8,3 9,4 7,3 9,6
7,7 9,7 8,4 9,1 7,8
9,5 8,6 8,1 9,8 7,3
7,6 8,2 8,8 9,4 7,9
Vypočítejte všechny potřebné hodnoty a vhodně zakreslete.
26 | S t r á n k a
7,1 8,7 9,3 8,6 8,9
8,7 9,9 8,5 7,9 9,7
7,5 8,9 9,2 7,9 9,1
ÚLOHA 2.4 Hodnoty v tabulce udávají odpovědi na otázku „Kolik jste ochotni utratit za dovolenou za jednu osobu?“. (10000;15000) (0;5000) (5000;10000) (0;5000) (5000;10000) Proveďte (10000;15000) (0;5000) (5000;10000) (5000;10000) (0;5000) vyhodnocení této proměnné. (5000;10000) (15000;20000) (0;5000) (5000;10000) (0;5000) Vytvořte tabulku (10000;15000) (5000;10000) (0;5000) (10000;15000) (5000;10000) intervalového rozložení četností (15000;20000) (5000;10000) (5000;10000) (10000;15000) (5000;10000) a pomocí (5000;10000) (10000;15000) (5000;10000) (5000;10000) (0;5000) vhodného grafu (5000;10000) (0;5000) (10000;15000) (15000;20000) (5000;10000) zobrazte tyto (0;5000) (5000;10000) (0;5000) (5000;10000) (0;5000) údaje. (10000;15000) (0;5000) (10000;15000) (10000;15000) (5000;10000) (0;5000) (0;5000) (15000;20000) (5000;10000) (10000;15000)
27 | S t r á n k a
3
CHARAKTERISTIKY POLOHY
CÍL Cílem kapitoly je seznámení s hlavními charakteristikami polohy statistické proměnné. Vysvětleny budou různé druhy průměrů a jejich rozdílné využití. Dále budou prostudovány kvantily a způsoby jejich určení. V této kapitole se také dozvíme jak postupovat v případech, kdy neznáme všechny potřebné údaje a máme průměry a kvantily pouze odhadnout.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 150 minut PROCVIČOVÁNÍ: 120 minut
Při popisu statistických souborů často máme k dispozici velké množství údajů. Pokud bychom pouze sestavili tabulku četností, tak by vzhledem k počtu údajů nebylo možno rozumně se v těchto údajích orientovat. Mnohem vhodnější se proto jeví počítat různé údaje, které nám většinou pomocí jednoho čísla upřesní danou vlastnost. Těmto údajům říkáme statistiky. Většinu statistik lze spočítat pouze pro numerické proměnné, to je také důvodem proč se vždy, když je to možné, snažíme kategoriální proměnné převést na numerické. Nejznámější statistiky jsou právě statistiky polohy. Tyto statistiky nazýváme střední hodnoty. Střední hodnoty jsou číselné údaje, které nám udávají hodnotu, ke které by měly mít všechny hodnoty nejblíže.
UPOZORNĚNÍ Středních hodnot je celá řada a počítají se podle různých vzorců, proto také často vycházejí výrazně různé výsledky. Každá z těchto středních hodnot má své využití v určité skupině problémů a je proto potřeba vědět, kdy a kterou střední hodnotu použít.
Pokud si nejmenší hodnotu zkoumané proměnné x označíme xmin (minimální hodnota) a největší hodnotu xmax (maximální hodnota). Střední hodnotou je potom každá hodnota xstr splňující nerovnost , která se nějakým způsobem získá z hodnot proměnné x. Střední hodnoty se rozdělují na dvě skupiny: První skupina jsou průměry. Průměry se počítají ze všech naměřených hodnot. Tyto proměnné většinou udávají kvalitnější statistiku. Druhou skupinou jsou takové střední hodnoty, které se nepočítají ze všech hodnot, ale pouze se určitým způsobem odhadnou. Jejich hodnota je pak hodnotou několika málo statistických jednotek. Nejznámější střední hodnoty patřící do této skupiny jsou modus, medián, kvantily, ale také sem můžeme zařadit minimální a maximální hodnotu.
UPOZORNĚNÍ Kvantily či modus se vždy získají buď přímo z jedné hodnoty proměnné, nebo aritmetickým průměrem ze dvou sousedních prvků. Proto nejsou ovlivněny velikostí ostatních hodnot sledované proměnné. To je zvláště výhodné ve statistickém souboru, který obsahuje malé množství velmi extrémních hodnot proměnné. Těmto extrémním hodnotám také říkáme odlehlá pozorování. V takových případech jsou modus a medián výhodnější než průměry.
PŘÍKLAD Příkladem může být vypočet průměrného platu. V roce 2010 byla průměrná mzda 23797Kč. Tento údaj pak většinu lidí vede k úvaze, že zhruba polovina lidí má méně a druhá více. Ovšem to by platilo jen v případě, že by mzda měla tzv. normální rozdělení. Pokud se totiž lépe zamyslíme, přijdeme na to, že velká většina lidí průměrné mzdy nedosáhne. Důvodem je omezení mzdy na jedné straně (zákonem určená minimální mzda) a neomezení mzdy druhým
28 | S t r á n k a
směrem. Potom nám stačí několik extrémních hodnot např. člověk, který vydělává několik set tisíc měsíčně a při výpočtu průměru nám tato extrémní hodnota velmi zvedne průměr. Např. jeden člověk s platem 200 000Kč nám zvedne průměrnou mzdu na 23 tisíc i v případě, že 20 jiných lidí vydělává pouze 15 tisíc hrubého měsíčně. Proto by v případě platů bylo jistě vhodnější uvádět medián, nebo jiné kvantily. Jistě bychom dostávali užitečnější údaje než při výpočtu průměrů.
3.1 Průměry Průměrů známe celou řadu, většinou využíváme Aritmetický průměr, ale ve speciálních případech mají využití i Geometrický, Harmonický či Kvadratický průměr. Při používání průměrů je třeba zvolit nejvhodnější z nich a také vzít v úvahu to, že průměr může být velmi vychýlen extrémními hodnotami. Pro průměry kladných hodnot platí tyto nerovnosti x H ≤ xG ≤ x ≤ x K
3.1.1 Aritmetický průměr Aritmetický průměr nejčastěji používaným průměrem, proto pokud se v běžné řeči používá slovo průměr, jedná se právě o aritmetický průměr. Určujeme dva aritmetické průměry, toto rozdělení je ale spíše pojmenováním použitých vzorců, než opravdově rozdělení, neboť výsledek obou je vždy stejný. Prostý aritmetický průměr n hodnot x1,x2,...,xn použijeme v případech, kdy nemáme tyto hodnoty nijak utříděny. Výpočet se provede sečtením všech těchto hodnot a poté vydělením jejich počtem n.
x=
x1 + x2 + ... + xn n
PŘÍKLAD 3.1 Bylo odzkoušeno 10 ocelových tyčí k určení meze průtažnosti s těmito výsledky v MPa: 277, 280, 291, 263, 277, 286, 281, 305, 290, 291. Vypočtěte vhodný průměr.
Řešení: Vhodným průměrem je v tomto případě aritmetický průměr. Naměřené hodnoty dosadíme do vzorce za xi a za n dosadíme počet prvků, tedy 10.
x=
277 + 280 + 291 + 263 + 277 + 286 + 281 + 305 + 290 + 291 2841 = = 284 ,1 10 10
Vážený aritmetický průměr využijeme v případě, kdy máme vytvořenou tabulku četností. Mohli bychom sice využít původního vzorce, ale tímto způsobem dosáhneme výsledku rychleji. Opět platí, že x1,x2,...,xk značí různé obměny proměnné x, zatímco n1,n2,...,nk značí absolutní četnosti těchto proměnných, nazýváme je váhy obměn. Hodnoty pi pak značí relativní četnost proměnné xi. k
x ⋅ n + x2 ⋅ n2 + ... + xk ⋅ nk x= 1 1 = n
∑x ⋅n i =1
i
n
i
k
= ∑ xi ⋅ pi i =1
PŘÍKLAD 3.2 Počet bodů, které získali studenti z písemné práce, je uveden v tabulce. Určete průměr.
29 | S t r á n k a
Řešení: Protože máme tabulku četností, můžeme využít vzorec pro vážený aritmetický průměr, kterým dosáhneme výsledku rychleji. Body jsou obměny a tak je dosazujeme za xi, zatímco počet studentů odpovídá četnosti jednotlivých obměn a dosazujeme je tedy za ni.
x=
20 ⋅ 6 + 18 ⋅ 10 + 14 ⋅ 6 + 10 ⋅ 2 + 8 ⋅ 5 + 5 ⋅ 9 489 = = 12 ,8684 6 + 10 + 6 + 2 + 5 + 9 38
ÚLOHA 3.1 Investovali jsme do různých finančních produktů dle následující tabulky. Určete průměrný zisk nebo ztrátu. Finanční Investice Roční produkt v tisících získ/ztráta A 100 5% B 150 -2% C 20 4% D 40 0% E 350 -1%
UPOZORNĚNÍ Aritmetický průměr, je takovou hodnotou, pro kterou platí: Vynásobením aritmetického průměru počtem prvků dostaneme jejich součet. n
x ⋅ n = ∑ xi i =1
Součet všech odchylek hodnot proměnné od aritmetického průměru je roven nule. n
∑ (x − x ) = 0 i
i =1
Součet čtverců všech odchylek hodnot proměnné od jejich aritmetického průměru je minimální. n
∑ (x − x ) i =1
i
2
= min
Tímto způsobem se také někdy aritmetický průměr definuje. Vlastnost 3 znamená, že pokud bychom zvolili libovolnou hodnotu a do levé strany vzorce ji dosadili místo aritmetického průměru, dostaneme vždy větší číslo, než když dosadíme aritmetický průměr. Aritmetický průměr je touto vlastností jednoznačně určen. Jinými slovy se dá také říct, že aritmetický průměr je takové číslo, u kterého je rozptyl zkoumané proměnné nejmenší možný. Další vlastnosti aritmetického průměru jsou: 1. Aritmetický průměr konstanty je tato konstanta. 2. Přičteme-li (odečteme) ke všem hodnotám stejné číslo, aritmetický průměr se změní právě o tuto hodnotu. 3. Násobíme-li (dělíme) všechny hodnoty stejným číslem, aritmetický průměr se změní právě o tento násobek (dělitel).
30 | S t r á n k a
4. Vynásobíme-li váhy váženého aritmetického průměru libovolnou nenulovou konstantou, aritmetický průměr se nezmění.
UPOZORNĚNÍ Je-li statistický znak rozdělen do několika souborů, u nichž známe průměry a počty prvků v těchto souborech ni. Můžeme celkový aritmetický průměr určit pomocí vzorce pro vážený aritmetický průměr, v němž jednotlivé aritmetické průměry budou hrát roli obměn a k nim příslušné počty prvků budou jejich váhy.
PŘÍKLAD 3.3 Ve škole jsou čtyři 6. třídy. Počty žáků a průměrné známky z matematiky jsou uvedeny v tabulce. Určete průměrnou známku z matematiky ve všech 6. třídách dohromady. Třída
A
B
C
D
Průměrná známka
2.21
1.82
2.23
2.11
Počet studentů
26
27
30
24
Řešení: Známe tedy průměry jednotlivých souborů údajů a také známe četnosti v těchto souborech. Pro určení průměru můžeme vyžít vzorec pro vážený aritmetický průměr. Průměrné známky budeme dosazovat za obměny tedy xi, a počet studentů v každé třídě bude určovat absolutní četnost ni.
x=
2.21 ⋅ 26 + 1.82 ⋅ 27 + 2.23 ⋅ 30 + 2.11 ⋅ 24 224 .14 = = 2.0948 26 + 27 + 30 + 24 107
ÚLOHA 3.2 Podnik vyrábí stejné výrobky ve čtyřech halách, výroba v těchto halách byla zaváděna postupně a tak se v každé hale vyrábí jinou dobu. Každá výrobní hala eviduje denní počet vyrobených výrobků po celou dobu výroby. K datu 30.4.2012 se ve všech halách určil průměrný denní počet výrobků. Přehled těchto výsledků máme v tabulce. Určete průměrný počet vyrobených výrobků za den v jedné hale. průměrný počet Hala Vyrábí od výrobků za den A 1.1.2012 235 B 15.1.2012 258 C 23.1.2012 260 D 18.2.2012 240 Obdobný postup můžeme využít i v případě, kdy neznáme původní hodnoty, máme jen tabulku intervalového rozdělení četností a u každého intervalu známe jeho průměr.
UPOZORNĚNÍ Pokud průměry intervalů neznáme, pak nelze aritmetický průměr spočítat přesně, ale pouze jej odhadneme. Odhad provedeme tak, že předpokládáme průměrnou hodnotu ve středu každého intervalu a poté opět použijeme vážený aritmetický průměr.
31 | S t r á n k a
Problém nám v tomto případě mohou působit krajní intervaly, které nemusí být uzavřené, a proto u nich nelze jednoduše nalézt střed. V takovém případě můžeme postupovat buď tak, že šířku tohoto intervalu určíme stejnou, jako má sousední interval, nebo určíme minimální a maximálního hodnotu v celém statistickém souboru a tyto hodnoty použijeme jako hranice krajních intervalů. Poté již můžeme vypočítat střed těchto intervalů a odhadnout průměr.
UPOZORNĚNÍ Zde vidíme, jak je důležité vhodně volit intervaly, tedy že nejlepší opravdu je volit intervaly tak, aby nejčetnější hodnoty byly ve středech intervalů, poté bude odhad aritmetického průměru na základě tabulky intervalového rozdělení četností přesnější.
PŘÍKLAD 3.4 Při testování měřícího přístroje provádíme tímto přístrojem opakované měření objektu známé délky. Z naměřených hodnot určíme, o kolik se naměřená hodnota liší od skutečnosti. Provedené výsledky jsou zaznamenány v tabulce. Určete průměrnou odchylku. Odchylka měření (-1;-0,5) (-0,5;0) (0;0,5) (0,5;1)
Počet měření 6 10 13 7
Řešení: Protože neznáme průměry měření v jednotlivých intervalech, nemůžeme vypočítat průměr, ale musíme průměr pouze odhadnout. Musíme každý interval nahradit jeho středem. Odchylka měření Počet měření střed intervalu (-1;-0,5) 6 -0.75 (-0,5;0) 10 -0.25 (0;0,5) 13 0.25 (0,5;1) 7 0.75 Nyní použijeme vzorec pro vážený aritmetický průměr, do kterého za xi dosadíme středy intervalů a za ni dosadíme počty měření.
− 0.75 ⋅ 6 − 0.25 ⋅ 10 + 0.25 ⋅ 13 + 0.75 ⋅ 7 1.5 = = 0.0417 6 + 10 + 13 + 7 36 Ze zadaných údajů, můžeme odhadnout, že se průměrná chyba přístroje rovná 0.0417. x=
ÚLOHA 3.3 Tabulka četností udává hodnoty intervalového rozdělení statistické proměnné x, která udává váhu prodané drůbeže v kilogramech. Odhadněte průměrnou váhu prodané drůbeže. Váha 0,8-1 1-1,5 1,5-2 2-2,5 2,5 a více
32 | S t r á n k a
Počet 25 50 120 70 20
33 | S t r á n k a
3.1.2 Geometrický průměr Geometrický průměr se dá využít pouze v případech, kdy má smysl násobení hodnot proměnných, proto se využívá hlavně při průměrování koeficientů. Geometrický průměr je pak roven hodnotě, udávající jaký by měl být přírůstek (úbytek) pokud by byl po celou dobu neměnný, tak aby výsledný počet byl stejný jako u zkoumaného nelineárního případu. Použít se dá jen v případě, kdy jsou všechny hodnoty kladné.
UPOZORNĚNÍ Při použití procent je musíme vydělit 100 a přičíst 1. Pokud je přírůstek 10%, používáme při výpočtu hodnotu 1.1, pokud je úbytek 20%, použijeme 0.8.
PŘÍKLAD Geometrický průměr použijeme při výpočtu průměrného růstu cen, průměrného přírůstku obyvatel. V případě výpočtu průměrného zhodnocení investice je třeba rozlišit dva případy. Pokud jsme investovali do několika různých produktů a určujeme průměrné zhodnocení za jedno období, pak použijeme vážený aritmetický průměr, kde váhy budou tvořeny množstvím investovaných financí. V případě investice do jednoho produktu a získání informací o přírůstku či úbytku v jednotlivých po sobě jdoucích letech, má smysl přírůstky násobit a použijeme tedy geometrický průměr.
Opět máme dva vzorce pro výpočet geometrického průměru. Prostý geometrický průměr n kladných hodnot x1,x2,...,xn vypočteme takto
xG = n x1 ⋅ x2 ⋅ ... ⋅ xn = n
n
∏x
i
i =1
Vážený geometrický průměr k
xG =
( n1 + n 2 + ... + n k )
x ⋅ x ⋅ ... ⋅ x n1 1
n2 2
nk k
=
∑ ni i =1
k
∏x
ni i
i =1
Tento vzorec se využívá v případech, kdy máme hodnoty několika málo opakujících se obměn. Výpočet je poté rychlejší.
PŘÍKLAD 3.5 Investice vynášela v uplynulých letech následující výnosy: 2001 2002 2003 2,5% 5% -1% Vypočítejte vhodný průměr
2004 3%
2005 2%
2006 -2%
2007 5%
2008 1,5%
2009 -2,5%
2010 0%
Řešení: U toho typu příkladu využijeme geometrický průměr, protože má smysl násobit koeficienty růstu, které z hodnot v tabulce získáme. Všechny hodnoty musíme převést tak že je vydělíme 100 a přičteme 1. Tím získáme hodnoty v následující tabulce. 2001 2002 1,025 1,05
2003 0,99
2004 1,03
2005 1,02
2006 0,98
2007 1,05
2008 1,015
2009 0,975
Tyto hodnoty poté dosadíme do vzorce prostého geometrického průměru.
34 | S t r á n k a
2010 1
xG = 10 1,025 ⋅ 1,05 ⋅ 0 ,99 ⋅ 1,03 ⋅ 1,02 ⋅ 0 ,98 ⋅ 1,05 ⋅ 1,015 ⋅ 0 ,975 ⋅ 1 = 10 1,139913 = 1,013181 ÚLOHA 3.4 Zkoumáme inflaci v ČR v letech 2001-2011, z českého statistického úřadu jsme zjistili tyto údaje: 4,7 1,8 0,1 2,8 1,9 2,5 2,8 6,3 1,0 1,5 1,9 Vypočítejte vhodný průměr.
3.1.3 Harmonický průměr Tento průměr využijeme v případě, kdy má smysl součet převrácených hodnot proměnné. Nejčastěji se využívají v příkladech počítajících s časem. Tento typ příkladů se často chybně počítá pomocí aritmetického průměru, protože zadání k tomu přímo svádí. Jedná se o příklady, u kterých známe čas, za který se provede určená práce a úkolem je výpočet průměrného času provedení činnosti. Pro výpočet využijeme buď vzorec pro prostý harmonický průměr
xH =
n = 1 1 1 + +K+ x1 x 2 xk
n k
1
i =1
i
∑x
nebo vážený harmonický průměr k
n + n2 + K + nk = xH = 1 n1 n 2 nk + +K+ x1 x 2 xk
∑n i =1 k
1
ni
∑x i =1
i
PŘÍKLAD 3.6 Máme vozidlo, které 10 kilometrů ujede za 10 minut, poté zpomalí a dalších 10km ujede za 15 minut. Jaký je průměrný čas za který ujede jeden kilometr?
Řešení: Většinou byste tento příklad počítali asi tak, že si řeknete: celkem tedy za 25 minut ujede 20km, proto stačí vydělit 25minut počtem kilometrů a získáme čas, za který ujede jeden kilometr. Dostaneme výsledek 25/20=1,25. To je vlastně aritmetický průměr hodnot 1 a 1,5, které udávají čas v minutách potřebný na ujetí jednoho kilometru v původních rychlostech. Výsledek se tedy tváří naprosto v pořádku, ale podívejme se na něj z jiného pohledu. Představme si, že máme dvě auta, jedno pojede hodinu rychlostí 1km za minutu a pak hodinu rychlostí 1km za 1,5 minuty, zatímco druhé pojede dvě hodiny touto vypočítanou průměrnou rychlostí. 60/1+60/1,5=60+40=100km 120/1,25=96km Vidíte, že výsledek sice vypadá v pořádku a většina lidí by se s ním smířila, ale tato zkouška nám ukázala, že je chybný. Důvodem je, že při výpočtu si často neuvědomíme to, že větší čas má menší "váhu". Správný výpočet samozřejmě získáme pomocí harmonického průměru.
xH =
20 10 10 + 1 1,5
=
20 60 = = 1,2 , 50 50 3
kde n1=10, n2=10, x1=1, x2=1,5. Tyto hodnoty vlastně udávají, že desetkrát autu trvalo ujet kilometr minutu a desetkrát to trvalo minutu a půl. Pokud necháme teď auto jet dvě hodiny touto průměrnou rychlostí, pak ujede 120/1,2=100km a vidíme, že výsledek souhlasí
35 | S t r á n k a
. ÚLOHA 3.5 V továrně máme 5 strojů vyrábějících stejné výrobky. Vypočítejte vhodný průměr. Stroj 1 2 3 4 5
Doba výroby 3 4 3,5 5 3
3.1.4 Kvadratický průměr Kvadratický průměr má tu vlastnost, že přiřazuje vyšší váhu větším číslům. Proto se využívá hlavně ve statistice při výpočtech rozptylů, což je vlastně kvadratický průměr vzdáleností hodnot od aritmetického průměru. Prostý kvadratický průměr k
xK =
x + x +K+ x = n 2 1
2 2
2 k
∑x i =1
2 i
n
Vážený kvadratický průměr k
xK =
x ⋅ n1 + x ⋅ n 2 + K + x ⋅ n k = n1 + n 2 + K + nk 2 1
2 2
2 k
∑x i =1
2 i
⋅ ni
k
∑n i =1
i
3.2 Kvantily Pokud máme statistickou numerickou proměnnou, pak pomocí kvantilů můžeme přehledně popisovat vlastnosti jejího rozložení. Kvantil je hodnota této proměnné, která rozděluje hodnoty na dvě části v předem daném poměru.
UPOZORNĚNÍ
Označujeme jej Qk, kde 0 ≤ k ≤ 1 , někdy se k uvádí v procentech, v tom případě je třeba u následujících vzorců nenásobit toto číslo stem. Kvantil úzce souvisí s relativní kumulativní četností.
3.2.1 Výpočet kvantilů prostého rozdělení. Pokud máme hodnoty proměnné x seřazené vzestupně, pak si je můžeme označit x1, x2, ..., xn a platí xi ≤ xi +1 . Pak kvantil Qk je zvolená hodnota xi tak, aby platilo, že i tvoří k*100 procentní část z n, kde n je rozsah statistického souboru. Můžeme tedy říct, že hodnot menších nebo rovno hodnotě xi je k*100 procent (platí v případě, kdy se hodnoty nerovnají). Hodnot větších než xi je pak (1-k)*100 procent. Prakticky pří výpočtu kvantilu postupujeme následovně. Označme m100k pořadové číslo hodnoty odpovídající kvantilu Qk. Pokud vypočítáme, kolikátý prvek hledáme, pak nám již stačí seřadit hodnoty zkoumané proměnné a prvek nalézt.
36 | S t r á n k a
S pomocí vzorce n ⋅ k ≤ m100 k ≤ n ⋅ k + 1 určíme pořadové číslo m100k, o kterém víme, že se musí jednat o celé číslo.
UPOZORNĚNÍ Pokud hodnoty n ⋅ k a n ⋅ k + 1 vycházejí jako desetinná čísla, pak existuje pouze jedno celé číslo m100k splňující výše napsanou podmínku, čímž získáme potřebný prvek. Pokud jsou tato čísla celá, pak hledaný kvantil vypočítáme jako aritmetický průměr hodnot xnk a xnk+1.
PŘÍKLAD 3.7 Máme tyto údaje 1,6,4,11,8,4,2,5,10,20 a chceme vypočítat Q0.25 a Q0.5.
Řešení: Spočítáme rozsah statistického souboru n=10. Hodnoty statistického souboru seřadíme: 1,2,4,4,5,6,8,10,11,20. Nejdříve spočítáme Q0.25 tedy k=0.25. n ⋅ k = 2 ,5 a n ⋅ k + 1 = 3 ,5 obě hodnoty jsou desetinná čísla tedy m25 je 3. Podíváme se do posloupnosti seřazených hodnot této proměnné a vidíme, že na třetí pozici je hodnota 4. Tedy Q0.25=4. U Q0.5 postupujeme obdobně. Vidíme že k=0,5
n⋅k = 5 a n⋅k +1= 5 obě hodnoty jsou celá čísla proto m5 leží mezi prvky s pořadovým číslem 5 a 6. Podíváme se do posloupnosti seřazených hodnot této proměnné a vidíme, že na páté pozici je hodnota 5 a na šesté 6. Tedy Q0.5=5.5.
ÚLOHA 3.6 Známky z písemné práce v jedné třídě jsou: 1,2,4,5,3,1,2,5,3,2,1,4,1,2,2,3,2,1,5,4. Určete následující kvantily Q0.5, Q0.33 a Q0.842. V případě, kdy máme hodnoty statistické proměnné zapsané v tabulce prostého rozdělení četností, pak k určení kvantilu můžeme využít sloupec hodnot kumulativních relativních četností. Pokud hledáme kvantil Qk, tak budeme postupně prohledávat sloupec kumulativních relativních četností až do chvíle, kdy najdeme první hodnotu větší nebo rovnu k. V případě, že jsme našli relativní kumulativní četnost větší než k, je hledaný kvantil obměna odpovídající nalezenému řádku. Pokud jsme nalezli relativní kumulativní četnost totožnou s k, pak je hledaný kvantil roven aritmetickému průměru obměny v nalezeném řádku a obměny následující.
PŘÍKLAD 3.8 V tabulce máme přehled známek z předmětu Statistika. Určete kvantily Q0.5, Q0.2. Známka A B C D E F
Počet 5 9 13 8 10 7
37 | S t r á n k a
Řešení: Nejdříve doplníme do tabulky sloupec relativních kumulativních četností. Známka Počet Kumulativní relativní četnost 1
5
0,096153846
1,5
8
0,25
2
13
0,5
2,5
9
0,673076923
3
10
0,865384615
4
7
1
Pro kvantil Q0,5 hledáme mezi kumulativními relativními četnostmi hodnotu 0,5 nebo větší. Hodnota 0,5 je v řádku s obměnou 2. Víme tedy, že Q0.5 je rovno aritmetickému průměru obměny 2 a následující obměny (2,5), tedy Q0,5=2,25. U kvantilu Q0,2 jsme našli nejmenší kumulativní relativní četnost větší než 0,2, je to číslo 0,25, které odpovídá obměně 1,5. Platí tedy Q0,2=1,5.
3.2.2 Odhad kvantilů intervalového rozdělení V případě, kdy neznáme přesné hodnoty, můžeme vycházet z tabulky intervalového rozdělení. Vždy jsme schopni pomocí relativní kumulativní četnosti určit interval, ve kterém daný kvantil je. Ovšem pokud neznáme původní data, nedokážeme již určit, jaká je přesně jeho hodnota, proto musíme tuto hodnotu odhadnout lineární interpolací.
UPOZORNĚNÍ Postup odhadu kvantilu je následující. Nejdříve určíme interval, do kterého kvantil náleží pomocí kumulativních relativních četností. Kvantil Qk náleží do intervalu jehož kumulativní relativní četnost je nejmenší hodnota větší než k. Označme si: xd - dolní hranice intervalu xh - horní hranice intervalu id - kumulativní relativní četnost odpovídající xd vynásobená stem, jedná se o kumulativní četnost předcházejícího intervalu v případě, že je uvažovaný interval první pak je tato hodnota 0. ih - kumulativní četnost odpovídající xh vynásobená stem, jedná se o kumulativní četnost uvažovaného intervalu. Z následující rovnice odhadneme hodnotu hledaného kvantilu.
Qk − x d 100 ⋅ k − id = xh − xd ih − id .
Tento postup zohledňuje, jak blízko okraji intervalu by se měl hledaný kvantil nacházet a předpokládá, že jsou hodnoty v intervalu rozloženy lineárně. Výsledky jsou velmi ovlivněny volbou intervalů. Obecně platí, že nejpřesnější odhady získáváme v případech, kdy je hledaný kvantil blízko okrajům intervalu. V případě kdy volíme intervaly tak, aby největší počet prvků byl ve středu intervalu, dostáváme dobré odhady právě pro kvantily odpovídajících průměru sousedních kumulativních četností.
38 | S t r á n k a
PŘÍKLAD 3.9 Tabulka četností udává hodnoty intervalového rozdělení statistické proměnné, která udává váhu prodané drůbeže v kilogramech. Určete kvantil Q0.5. Váha Počet 0,8-1 25 1-1,5 50 1,5-2 120 2-2,5 70 2,5 a více 20
Řešení: Nejdříve určíme kumulativní relativní četnosti jednotlivých intervalů a také doplníme horní mez posledního intervalu. Šířku posledního intervalu určíme totožnou jako předcházejícího, tedy 0.5 a horní mez bude 3. Počet zkoumaných prvků je 285. Po doplnění bude tabulka vypadat následovně. Váha Počet Kumulativní relativní četnost 0,8-1 25 0,087719298 1-1,5 50 0,263157894 1,5-2 120 0,684210526 2-2,5 70 0,929824561 2,5-3 20 1 Kvantil Q0.5 bude ležet v intervalu 1,5-2 protože kumulativní relativní četnost tohoto intervalu je 0,684210526. Pro přesnější odhad použijeme lineární interpolaci.
Qk − x d 100 ⋅ k − id = xh − xd ih − id Do vzorce dosadíme za xd dolní mez intervalu (1,5), za xh horní mez intervalu (2). id je kumulativní relativní četnost odpovídající dolní mezi, udává tedy kolik procent hodnot je menších než 1,5 a tato hodnota odpovídá kumulativní relativní četnosti intervalu 1-1,5 (26,3157894). Poslední potřebnou hodnotou je ih, která je rovna kumulativní relativní četnosti zkoumaného intervalu (68,4210526).
Q0.5 − 1,5 50 − 26 ,3157894 = 2 − 1,5 68 ,4210526 − 26 ,3157894 Po upravení pravé strany a osamostatnění proměnné získáme odhad Q0,5=1,78125.
ÚLOHA 3.7 Odhadněte hodnoty kvantilů Q0.2, Q0.75 a Q0.5, u následující proměnné zpracované v tabulce intervalového rozdělení četností. xi ni (0;1) 5 (1;2) 10 (2;3) 7 (3;4) 2 (4;5) 6 (5;7) 8
39 | S t r á n k a
3.2.3 Přehled názvů často používaných kvantilů Některé kvantily mají přiřazena jména, takže není nutné udávat jejich procenta. Nejznámějším kvantilem je Q0.5 a nazývá se medián nebo také prostřední hodnota. Medián rozděluje hodnoty statistického souboru na dvě poloviny. Kvantily rozdělujeme podle umístění oproti mediánu na Dolní kvantily - jedna se o kvantily Qk nacházející se před mediánem, tedy k<0.5. Horní kvantily - jedna se o kvantily Qk nacházející se za mediánem, tedy k>0.5. Tercily rozdělují hodnoty na tři stejné části. Máme tedy dolní tercil , který odpovídá tercil odpovídající
Q0 ,6
Q0 ,3
a horní
.
Kvartily jsou tři kvantily rozdělující hodnoty na 4 stejné části. Máme tedy dolní kvartil, který odpovídá Q0,25, medián (prostřední kvartil) a horní kvartil odpovídající Q0,75. Kvintily jsou čtyři kvantily, které rozdělují interval na pět stejně četných částí. Jedná se o dolní kvintily Q0,2 a Q0,4 a horní kvintily Q0,6 a Q0,8. Dále se můžeme setkat se sextily, septily, oktávily, nonily, decily, .... Někdy se dá setkat s percentily, které rozdělují hodnoty na 100 stejných částí. Percentily se často využívají při vyhodnocování výsledků přijímacích testů.
UPOZORNĚNÍ Pokud potřebujeme určit indexy určitých kvantilů, stačí nám znát počet stejných částí x, na které chceme rozsah údajů rozdělit. Indexy pak určíme postupným dělením čísel 1,2,..,x-1 číslem x.
PŘÍKLAD Septily tedy učíme jako Q1/7=Q0,1428, Q2/7=Q0,2857, Q3/7=Q0,4286, Q4/7=Q0,5714, Q5/7=Q0,7142, Q6/7=Q0,8571.
ÚLOHA 3.8 Investice vynášela v uplynulých letech následující výnosy: 2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2,5%
5%
-1%
3%
2%
-2%
5%
1,5%
-2,5%
0%
Vypočítejte tercily a největší kvintil.
3.2.4 Krabicový diagram Krabicový diagram je jednoduché schéma, zobrazující informace o nejmenší a největší hodnotě, kvartilech a hlavně přehledně zobrazuje poměry mezi těmito údaji. Základní částí tohoto grafu je krabice znázorňující největší část dat. Krabice začíná v hodnotě dolního kvartilu a končí v hodnotě horního kvartilu. Uvnitř této krabice se tedy nachází 50 procent všech dat, které nazýváme vnitřní hodnoty. Pomocí další svislé čáry uvnitř krabice znázorníme medián. Někdy se zde zobrazují i průměr pomocí tečky či modus pomocí křížku. Hodnoty nacházející se uvnitř krabice nazýváme vnitřní hodnoty. Rozdíl mezi dolním kvartilem a horním kvartilem 40 | S t r á n k a
nazýváme mezikvartilové rozpětí. Z této krabice vycházejí vodorovně dvě čáry, jejichž délka určuje tzv. "hranice". Tyto hranice jsou minimální a maximální uvažované hodnoty a hodnoty ležící mezi těmito hranicemi, ale neležící uvnitř krabice, se nazývají vnější hodnoty. Některé odlehlé (extrémní hodnoty) neuvažujeme, aby nedeformovaly graf, pokud jej srovnáváme s jiným. Hodnoty určíme jako extrémní pokud leží ve vzdálenosti vetší než 1.5 násobku mezikvartilového rozpětí od okraje krabice.
Obrázek 9: Krabicový diagram
UPOZORNĚNÍ Pokud chceme vytvořit krabicový graf, tak musíme nejdříve vypočítat kvartily a mezikvartilové rozpětí. Poté nad číselnou osu vytvoříme krabici, jejíž okraje jsou tvořeny dolním a horním kvartilem. Medián zobrazíme svislou čarou, která bude procházet uvnitř krabice. Poté vypočítáme hranice, které určují extrémní hodnoty. Označíme si je xmin=Q0.25-1.5(Q0.75-Q0.25) a xmax=Q0.75+1.5(Q0.75-Q0.25). Hodnoty, které jsou buď větší než xmax nebo menší než xmin jsou extrémní hodnoty. Poté hranice můžeme posunout do nejvzdálenější vnější hodnoty. Platí tedy, že délka čáry vedoucí z krabice je maximálně 1.5 násobek šířky krabice. Obvykle se nakreslí kratší tak, aby zahrnovala všechny vnější hodnoty, ale nepřesahovala je. Pokud jsou na některé straně extrémní hodnoty, pak tuto hranici posuneme na poslední prvek, který nepovažujeme za extrémní. Hranici zakreslíme pomocí kratší svislé úsečky, která ukončuje vodorovnou čáru.
Na tomto grafu můžeme vidět, zda je graf symetrický či jakou má šikmost, ale také můžeme sledovat rozdíly ve variabilitě hodnot ve srovnání s dalšími grafy zobrazujícími stejné vlastnosti jiného statistického souboru. Někdy, zvláště pokud zobrazujeme a porovnáváme několik krabicových grafů, se tyto grafy zobrazují svisle vedle sebe. V takovém případě pouze graf otočíme o 90 stupňů proti směru hodinových ručiček. Takže minimální hodnota je dole a maximální nahoře. ÚLOHA 3.9 V tabulce
máme
přehled
známek
z předmětu Známka A B C D E F
Statistika.
Nakreslete
krabicový
graf.
Počet 5 9 13 8 10 7
41 | S t r á n k a
4
CHARAKTERISTIKY VARIABILITY
CÍL Cílem kapitoly je seznámit čtenáře se základními charakteristikami, které zkoumají míru rozdílnosti studovaných hodnot.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 60 minut PROCVIČOVÁNÍ: 60 minut Variabilita značí míru rozdílnosti jednotlivých hodnot statistického souboru. Již jsme se setkali s variabilitou Kategoriálních proměnných. Tuto variabilitu jsme nazývali Mutabilita. Nyní se zaměříme na charakteristiky variability numerických proměnných.
UPOZORNĚNÍ U těchto charakteristik vždy platí, že čím větší stupeň nám vyjde, tím vzájemně odlišnější jsou hodnoty statistického souboru. Pokud je variabilita blízká nule, pak jsou hodnoty téměř totožné a charakteristiky polohy (průměr, medián, modus) lépe popisují skutečný stav v tomto souboru.
Tento obrázek zobrazuje dvě statistické proměnné, u nichž by hlavní charakteristiky polohy (průměr, modus, medián) vycházeli naprosto shodně. Pokud bychom tedy neřešili jejich variabilitu, pak bychom se mohli domnívat, že jsou totožné. Ovšem z obrázku vidíme, že u proměnné x je variabilita menší a tudíž průměr je přesnějším vyjádřením vlastností statistického souboru, než u proměnné y. Charakteristik variability je celá řada a rozdělují se do dvou skupin: Charakteristiky absolutní variability - tyto charakteristiky měří variabilitu v absolutních hodnotách. Výsledná hodnota je ve stejných jednotkách jako hodnoty proměnné, případně se jedná o mocninu těchto jednotek. Pokud bychom srovnávali více statistických souborů, lišících se polohou, pak jsou tyto charakteristiky variability nevhodné. Charakteristiky relativní variability - Tyto charakteristiky vyjadřují variabilitu v poměru k poloze sledované proměnné. Výsledkem je bezrozměrné číslo, které po vynásobení 100 udává variabilitu v procentech. Proto jsou vhodné pro srovnávání různých statistických souborů i různých proměnných.
4.1 Charakteristiky absolutní variability 4.1.1 Variační rozpětí
42 | S t r á n k a
Variační rozpětí je velmi lehké na výpočet. Stačí nám určit nejmenší a největší prvek statistického souboru, označíme si je xmin a xmax. Variační rozpětí R je poté kladný rozdíl těchto hodnot.
R = x max − x min
. Variační rozpětí poskytuje velmi hrubý odhad opravdové variability, neboť jeho výpočet vzniká vlastně z extrémních hodnot, o kterých víme, že nám o vlastnostech statistického souboru mnoho neřeknou.
4.1.2 Kvantilová rozpětí Kvantilová rozpětí jsou již lepšími charakteristikami. Jedná se o rozdíly krajních kvantilů, které již většinou nejsou zatíženy extrémními hodnotami. Můžeme tedy určovat: Kvartilové rozpětí je definováno jako rozdíl mezi horním a dolním kvartilem.
Rq = Q0.75 − Q0.25 . Decilové rozpětí je definováno obdobně, jako rozdíl krajních decilů.
Rd = Q0.9 − Q0.1 Percentilové rozpětí je pak rozdílem krajních percentilů.
R p = Q0.99 − Q0.01 PŘÍKLAD 4.1 Máme proměnou s těmito hodnotami:1,2,3,3,6,10,10,11,11,15,18,19,19,20,35. Určete kvartilové rozpětí.
Řešení: Při výpočtu kvartilového rozpětí musíme nejdříve spočítat horní a dolní kvartil. Počet získaných hodnot je 15. Horvní kvartil je hodnota Q0.75. Určíme její pořadové číslo m0,75.
15 ⋅ 0 ,75 ≤ m0 ,75 ≤ 15 ⋅ 0 ,75 + 1 11,25 ≤ m0 ,75 ≤ 12,25 Horní kvartil je tedy 12-té číslo a proto platí Q0,75=19. Obdobně určíme dolní kvartil Q0,25.
3,75 ≤ m0 ,75 ≤ 4 ,75 Máme Q0,25=3. Kvartilové rozpětí pak dostaneme odečtením dolního kvartilu od horního.
Rq = 19 − 3 = 16 Šíře intervalu od dolního kvartilu po horní kvartil je 16, což vlastně znamená, že 50 procent prostředních hodnot leží maximálné 16 jednotek od sebe.
UPOZORNĚNÍ Obdobným způsobem můžeme určovat rozpětí všech kvantilů. Vždy určíme nejmenší kvantil zvoleného druhu a největší kvantil a uděláme jejich rozdíl.
Při používání těchto rozpětí je třeba hlídat, aby nebyly závislé na extrémních hodnotách, to hrozí hlavně u percentilového rozpětí. U něj je možné, aby více než jedno procento hodnot bylo extrémních a pak tato charakteristika nebude moc vypovídající.
43 | S t r á n k a
ÚLOHA 4.1 Při měření veličiny konstantní délky, byly zjištěny následující chyby v měření. Vypočtěte odhad kvartilového a decilového rozpětí. Pro odhad kvantilů použijte lineární interpolaci
Třída
Naměřená chyba
ni
Třída
Naměřená chyba
ni
1.
(-1.25,-1.05)
3
7.
(-0.05,0.15)
27
2.
(-1.05,-0.85)
7
8.
(0.15,0.35)
35
3.
(-0.85,-0.65)
18
9.
(0.35,0.55)
33
4.
(-0.65,-0.45)
28
10.
(0.55,0.75)
18
5.
(-0.45,-0.25)
35
11.
(0.75,0.95)
6
6.
(-0.25,-0.05)
35
12.
(0.95,-1.15)
5
4.1.3 Rozptyl Rozptyl je nejčastěji používaná charakteristika variability numerické proměnné, označujeme nebo také . Udává výsledek v druhé mocnině jednotky. Nabývá hodnot větších nebo rovno jej 0. Čím větší hodnotu udává, tím větší rozdíly mezi jednotlivými obměnami statistického souboru máme. V případě, že je rozptyl 0, má statistický soubor u sledované proměnné pouze jednu obměnu.
UPOZORNĚNÍ Rozptyl je oproti předcházejícím charakteristikám obtížnější na výpočet. Jedná se o aritmetický průměr čtverců odchylek hodnot sledované proměnné od aritmetického průměru této proměnné.
Prostý rozptyl vypočítáme dosazením hodnot do vzorce n
s x2 =
∑ (x i =1
i
− x)2
n
,
kde n je rozsah statistického souboru, xi jsou hodnoty jednotlivých proměnných a x je aritmetický průměr. Pokud máme hodnoty rozdělené v tabulce četností, pak místo prostého rozptylu můžeme použít vážený rozptyl. k
s x2 =
∑ (x i =1
i
− x ) 2 ⋅ ni n
Dosazované hodnoty jsou obdobné jako v předchozím případě, tedy xi jsou jednotlivé obměny, n je rozsah statistického souboru, navíc zde hraje svou roli absolutní četnost jednotlivých obměn, kterou značíme ni. Výpočet pomocí váženého rozptylu bývá rychlejší než pomocí prostého rozptylu.
UPOZORNĚNÍ Tyto dva zmíněné rozptyly se využívají v případě, kdy známe všechny hodnoty statistického souboru, to ale většinou není možné zjistit.
Často musíme provést výběr, čímž vznikne výběrový soubor. Z něj počítáme různé statistiky a předpokládáme, že jsme tento základní soubor vybrali rozumě a že charakteristiky věrně popisují vlastnosti celého statistického souboru. To platí v případech většiny statistik, ale ne u rozptylu. 44 | S t r á n k a
Pomocí rozptylu totiž později budeme odhadovat procentuální přesnost našich odhadů. Čím větší je rozptyl tím menší procentuelní odhad správnosti nám vyjde. Protože je lepší při výzkumu oznámit, že je správný z 80% a mít určitě pravdu, než oznámit, že je správný z 90% a pravdu nemít.
UPOZORNĚNÍ Při odhadu rozptylu z výběrového souboru raději odhadujeme rozptyl větší, než vychází z výběrového souboru. Výběrový soubor totiž často zcela zanedbá extrémní hodnoty, které mohou rozptyl celého statistického souboru ovlivnit a tím by pravdivost výroků mohla být porušena. Proto používáme výběrový rozptyl.
Výběrový rozptyl označujeme s ′x . Výběrový rozptyl je buď prostý, nebo vážený. 2
n
∑ (x
s ′x2 =
i =1
− x)2
n −1 k
s ′x2 =
i
∑ (x i =1
i
− x ) 2 ⋅ ni
n −1
Rozdíly mezi s x a s ′x jsou při velkém počtu prvků výběru (více než 30) minimální. 2
2
Rozptyl můžeme také vyjádřit tímto vzorcem
s x2 = x 2 − x 2 .
PŘÍKLAD 4.2 Bylo odzkoušeno 10 ocelových tyčí k určení meze průtažnosti s těmito výsledky v MPa: 277, 280, 291, 263, 277, 286, 281, 305, 290, 291. Vypočítejte rozptyl těchto hodnot.
Řešení: Protože ze zadání nevyplývá, že by se jednalo o nějaký výběr a nemáme tabulku četností, tak použijeme vzorec na výpočet prostého rozptylu. n
s x2 =
∑ (x i =1
i
− x)2
n
Počet naměřených hodnot je 10, takže do vzorce za n dosadíme číslo 10, za xi postupně dosazujeme naměřené hodnoty. Jedinou hodnotou potřebnou pro výpočet, kterou zatím neznáme je průměr x .Platí
277 + 280 + 291 + 263 + 277 + 286 + 281 + 305 + 290 + 291 = 284 ,1 10 Po dosazení do vzorce rozptylu dostaneme x=
s x2 =
(277 − 284 ,1)2 + (280 − 284 ,1)2 + L + (290 − 284,1)2 + (291 − 284,1)2 10 s x2 =
1142,9 = 114,29 10
Také můžeme vypočítat rozptyl pomocí vzorce
s x2 = x 2 − x 2 , kde pro každou hodnotu
určíme její druhou mocninu a z těchto mocnin odečteme druhou mocninu průměru.
45 | S t r á n k a
277 2 + 280 2 + L + 290 2 + 291 2 x = = 80827,1 10 2
x 2 = 284 ,12 = 80712,81 Rozptyl se tedy rovná hodnotě s x = 80712,81 − 80827,1 = 114,29. 2
Oba dva způsoby rozptylu dávají totožné výsledky je tedy na každém, který způsob využije.
ÚLOHA 4.2 Ze 100 výrobků bylo náhodně vybráno 10 kusů, které byly podrobeny testům trvanlivosti s těmito výsledky: 1000,1200,1150,1100,980,950,1150,1000,1200,1100. Hodnoty jsou v naměřených hodinách provozu, po kterých došlo k poruše. Určete odhad rozptylu vycházející z tohoto výběrového souboru. Jestliže máme statistický soubor rozdělen na k dílčích podsouborů X1, X2,...,Xk, u každého podsouboru
s 22x ,..., s kx2 dílčí aritmetický průměr x1 , x 2 ,..., x k a známe buď počty pozorování n1 , n 2 ,..., n k nebo relativní četnosti p1 , p 2 ,..., p k , můžeme spočítat rozptyl celého 2
známe dílčí rozptyl s1x ,
statistického souboru pomocí vzorce:
s x2 = s 2 + s x2 , kde s 2
je aritmetický průměr dílčích rozptylů nebo také vnitroskupinová
2 x
variabilita, a s je rozptyl dílčích aritmetických průměrů, nebo také meziskupinová variabilita. Pro výpočet těchto dvou údajů využijeme následující vzorce. k
∑s
s =
i =1
2
2 ix
k
∑n i =1
k
s = 2 x
∑ (x i =1
⋅ ni
i
∑n i =1
∑s i =1
2 ix
⋅ pi
i
− x ) 2 ⋅ ni k
=
k
k
= ∑ ( xi − x ) 2 ⋅ p i i =1
i
UPOZORNĚNÍ Výše uvedený vzorec můžeme využít i v případech, kdy neznáme původní hodnoty, například pokud máme výsledky v tabulce četností intervalového rozložení a u každého intervalu známe průměr a rozptyl. Výsledkem pak není odhad rozptylu, ale opravdový rozptyl základního souboru.
46 | S t r á n k a
PŘÍKLAD 4.3 Tabulka uvádí rozptyly průměry a počty žáků při pololetní písemce různých tříd. Určete rozptyl známek.
Rešení: Pro určení rozptylu musíme využít vnitroskupinovou variabilitu a meziskupinovou variabilitu. Vnitroskupinovou variabilitu určíme pomocí vzorce k
s = 2
∑s i =1
2 ix
⋅ ni
k
∑n i =1
=
6 ⋅ 30 + 3 ⋅ 25 + 2 ⋅ 28 + 5 ⋅ 22 = 4,009524. 30 + 25 + 28 + 22
i
Meziskupinovou variabilitu určíme obdobně. Ovšem k jejímu výpočtu musíme nejdříve určit aritmetický průměr. 1,7 ⋅ 30 + 2 ,5 ⋅ 25 + 3 ⋅ 28 + 1,9 ⋅ 22 x= = 2,279048 105 k
s x2 =
∑( x i =1
− x ) 2 ⋅ ni
i
k
∑n i =1
=
=
i
(1,7 − 2 ,279048 )2 ⋅ 30 + (2 ,5 − 2 ,279048 )2 ⋅ 25 + (3 − 2 ,279048 )2 ⋅ 28 + (1,9 − 2 ,279048 )2 ⋅ 22 = 105
= 0,276132426 Když máme určeny meziskupinovou i vnitroskupinovou variabilitu, tak můžeme snadno určit rozptyl, který je součtem těchto dvou hodnot.
s x2 = s 2 + s x2 = 4,009524 + 0,276132426 = 4,285656. ÚLOHA 4.3 Tabulka udává průměrné počty pracovních hodin a rozptyly ve čtyřech odděleních společnosti. Určete průměr a rozptyl počtů pracovních hodin v celém podniku. Oddělení Průměr Rozptyl Výrobní 170 300 Expedice 150 150 Účetní 130 250 Marketingové 145 350
47 | S t r á n k a
4.1.4 Směrodatná odchylka Nevýhodou při interpretaci rozptylu je, že udává výsledky v mocninách jednotek. Protože je pro nás přehlednější popis pomocí základních jednotek, často místo rozptylu uvádíme směrodatnou odchylku. Směrodatná odchylka je kladná odmocnina rozptylu a značí se
σ
nebo s x , platí tedy s x =
s x2 .
UPOZORNĚNÍ U směrodatné odchylky rozlišujeme, stejně jako u rozptylu, zda se jedná o směrodatnou odchylku z celého statistického souboru, nebo výběrovou směrodatnou odchylku, která vznikne výpočtem jen z některých vybraných prvků statistického souboru.
Výběrová směrodatná odchylka se značí rozptylu, tedy
s′x = s′x2
s ′x nebo σ ′ . Určíme ji jako odmocninu z výběrového
.
ÚLOHA 4.4 Bylo odzkoušeno 10 ocelových tyčí k určení meze průtažnosti s těmito výsledky v MPa: 277, 280, 291, 263, 277, 286, 281, 305, 290, 291. Vypočítejte rozptyl těchto hodnot.
4.1.5 Průměrná odchylka Průměrná odchylka se značí d a definuje se jako aritmetický průměr absolutních hodnot odchylek jednotlivých hodnot od aritmetického průměru proměnné. n
d=
∑x i =1
i
−x
n
Jestliže máme hodnoty setříděny do tabulky četností, můžeme využít vzorec pro váženou průměrnou odchylku. k
d=
∑x i =1
i
− x ⋅ ni n
k
= ∑ xi − x ⋅ pi i =1
UPOZORNĚNÍ Průměrná odchylka je uvedena ve stejných jednotkách jako sledovaná proměnná, a má tu výhodu, že na rozdíl od směrodatné odchylky, je celkem názorná a tak je snadné porozumět, co tato statistika udává.
4.1.6 Kvantilové odchylky Kvantilové odchylky jsou definovány jako aritmetický průměr kladných odchylek sousedních kvantilů.
UPOZORNĚNÍ Vnitřní kvantily se při výpočtu průměru přičítají a zároveň odečítají, zůstanou tedy jen krajní kvantily. Kvantilová odchylka se tedy dá definovat i jako kvantilové rozpětí podělené počtem kvantilů snížených o jedna.
48 | S t r á n k a
Můžeme tedy určovat kvartilovu odchylku Q =
Q 0. 9 − Q 0. 1 , 8 Q − Q0.01 percentilovou odchylku P = 0.99 . 98
Q0.75 − Q0.25 , 2
decilovou odchylku D =
Ostatní kvantilové odchylky určíme podobným způsobem. Kvantilová odchylka se uvádí opět v jednotkách totožných s jednotkou zkoumané statistické proměnné.
4.2 Charakteristiky relativní variability Pomocí těchto charakteristik můžeme srovnávat variabilitu různých údajů, jejichž absolutní variabilita je nesrovnatelná. Relativní charakteristiky variability eliminují vliv polohy proměnné, protože udávají variabilitu v poměru charakteristiky absolutní variability s aritmetickým průměrem nebo mediánem.
4.2.1 Variační koeficient Variační koeficient je definován jako podíl směrodatné odchylky sx a aritmetického průměru x , označujeme jej vx.
vx =
sx x
Výsledek, který nám vyjde, nemá jednotku, a po vynásobení stem se interpretuje jako variabilita v procentech. Zhruba platí, že pokud je variační koeficient větší než 50%, značí to velkou nesourodost statistického souboru, a tudíž není vhodné pomocí tohoto souboru činit závěry o základním souboru.
UPOZORNĚNÍ To, že se variační koeficient interpretuje v procentech, neznamená, že může vycházet jen v rozmezí 0-1, ve výjimečných případech se může stát, že variační koeficient bude větší než 1 nebo také záporný.
ÚLOHA 4.5 Bylo odzkoušeno 10 ocelových tyčí k určení meze průtažnosti s těmito výsledky v MPa: 277, 280, 291, 263, 277, 286, 281, 305, 290, 291. Vypočítejte variační koeficient hodnot. Variační koeficient má několik zajímavých vlastností, které je třeba znát, aby nedošlo k chybné interpretaci výsledků. 1) Pokud ke všem hodnotám proměnné přičteme stejné celé číslo, variační koeficient se změní. Při přičtení kladného čísla se zmenší, naopak přičtením záporného čísla se zvětší.
sx s < x = vx x+a x sx sx = > = vx x−a x
v x+a = v x−a
Z tohoto důvodu je nevhodné porovnávat pomocí variačního koeficientu jednotky, které se navzájem převádějí pomocí přičítání konstanty. (stupně celsia a kelviny) 2) Pokud všechny hodnoty proměnné vynásobíme, nebo vydělíme konstantou, pak variační koeficient zůstane zachován. 49 | S t r á n k a
UPOZORNĚNÍ Tato dvě pravidla je třeba brát v úvahu při srovnávání různých jednotek. Pomocí variačního koeficientu tedy nemůžeme porovnávat variabilitu dvou souborů, u kterých je rozdíl jen v přičtení konstantního čísla. Naopak jej můžeme použít tehdy, když se změnou aritmetického průměru dochází i k růstu absolutní variability.
4.2.2 Relativní průměrná odchylka Relativní průměrná odchylka udává, o kolik procent se průměrně odlišují hodnoty sledované proměnné od jejich aritmetického průměru. Vypočítá se jako podíl průměrné odchylky a aritmetického průměru a označujeme ji d r .
dr =
d x
Relativní průměrná odchylka může nabývat stejně jako variační koeficient hodnot větších než 1 či menších než 0. Hodnoty menší než 0 nabývá v případě, že aritmetický průměr je záporný.
50 | S t r á n k a
5
CHARAKTERISTIKY KONCENTRACE
CÍL Cílem je seznámit čtenáře s nejdůležitějšími charakteristikami koncentrace, což jsou koeficient šikmosti a koeficient špičatosti. Kapitola dále popisuje Lorencovu křivku, její interpretaci při porovnávání socioekonomických ukazatelů.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 30 minut PROCVIČOVÁNÍ: 45 minut
Koncentrací rozumíme jev, kdy se více hodnot proměnné vyskytuje v jisté části variačního rozpětí, a naopak v ostatních částech se vyskytuje hodnot méně. Charakteristiky koncentrace rozdělujeme na dva druhy. Prvním druhem je šikmost, druhým druhem je pak špičatost.
5.1 Šikmost Při charakterizování šikmosti, porovnáváme počty výskytů velkých a malých hodnot. Nejčastěji se pro určení druhu šikmosti provádí porovnání aritmetického průměru a mediánu, ale toto porovnání nemusí být vždy zcela spolehlivé. Proto se přesněji šikmost určuje pomocí koeficientu šikmosti. Koeficient šikmosti se také nazývá třetí normovaný moment a je definován vzorcem: n
γ1 =
∑( x i =1
i
− x )3
n ⋅ s x3
,
pokud máme hodnoty proměnné setříděny do tabulky četností, pak můžeme využít vzorec k
γ1 =
∑ (x i =1
i
− x ) 3 ⋅ ni
n⋅s
3 x
k
= ∑ ( xi − x ) 3 ⋅ pi i =1
,
ni je absolutní četnost obměny xi a pi je její relativní četnost. V některé literatuře se koeficient šikmosti značí α .
kde
Určujeme tři rozdílná rozdělení četností podle šikmosti. 1. Souměrné rozdělení četnosti - to se vyznačuje tím, že koeficient šikmosti je roven 0.
UPOZORNĚNÍ Často stačí, aby se velmi blížil nule, protože v reálných situacích většinou nula nevychází, i když je graf téměř symetrický. Meze, kdy se již rozložení považuje za symetrické, se často liší. My budeme uvažovat rozpětí od -0.5 do 0.5.
Většinou platí, že aritmetický průměr je téměř totožný jako medián, opět neplatí tato rovnost přesně, neboť průměr často nevychází celé číslo, zatímco medián většinou celé číslo je. U
51 | S t r á n k a
tohoto rozdělení tedy máme stejný počet nadprůměrných i podprůměrných hodnot. Hodnoty vetší než průměr a hodnoty menší než průměr mají stejný variační rozsah.
Obrázek 10: Souměrné rozdělení četnosti
2. Nesouměrné rozdělení četností zešikmené kladně - vyznačuje se tím, že koeficient šikmosti je kladný. Což znamená, že vpravo od průměru je vyskytují odlehlejší hodnoty než vlevo a většina hodnot se nachází blízko vlevo od průměru. Medián je tedy obvykle menší než průměr.
Obrázek 11: Kladně zešikmené rozdělení četnosti
3. Nesouměrné rozdělení četností zešikmené záporně - vyznačuje se tím, že koeficient šikmosti je záporný. Což znamená, že vlevo od průměru se vyskytují odlehlejší hodnoty než vpravo a většina hodnot se nachází blízko vpravo od průměru. Medián je tedy obvykle větší než průměr.
Obrázek 12: Záporně zešikmené rozdělení četnosti
PŘÍKLAD 5.1 K dispozici máme údaje o městské spotřebě 120 osobních a malých užitkových automobilů dostupných v roce 2004 na trhu v USA. Spotřeba je uvedena v litrech paliva na 100 km. Určete Spotřeba 3.9 6.7 7.4 8.4 9 9.8 12.4 16.8 18.1 koeficient šikmosti a Počet aut 1 2 7 5 21 22 38 13 11 popište, co získaný výsledek značí.
52 | S t r á n k a
Řešení: Koeficient šikmosti určíme pomocí vzorce využívajícího absolutní četnosti. k
γ1 =
∑( x i =1
i
− x )3 ⋅ ni
n ⋅ s x3
K tomu, abychom jej mohli určit, potřebujme znát průměr a směrodatnou odchylku. Průměr určíme vzorcem pro vážený aritmetický průměr a tak dostaneme: n
x=
∑x i =1
i
⋅ ni
n
= 11,70333
Než vypočteme směrodatnou odchylku, musíme určit hodnotu rozptylu. n
s x2 =
∑ (x i =1
− x ) ⋅ ni 2
i
n Směrodatná odchylka tedy je: s x = 1,270385.
= 1,613879
Nyní již máme určené všechny potřebné údaje, a tak můžeme dosadit do výše uvedeného vzorce pro výpočet koeficientu šikmosti.
γ1 =
(3,9 − 11,7..)3 ⋅ 1 + (6 ,7 − 11,7..)3 ⋅ 2 + (7 ,4 − 11,7..)3 ⋅ 7 + (8 ,4 − 11,7..)3 ⋅ 5 +
+ (9 − 11,7..) ⋅ 21 + (9 ,8 − 11,7..) ⋅ 22 + (12 ,4 − 11,7..) ⋅ 38 + (16 ,8 − 11,7..) ⋅ 13 + 120 ⋅ 1,270385 3 3
3
+ (18 ,1 − 11,7..) ⋅ 11
3
3
3
= 10,49755
Koeficient šikmosti je roven 10,49755 a tak můžeme říct, že statistická proměnná X je kladně zešikmená, což značí, že je většina naměřených hodnot ve malé vzdálenosti vpravo od průměrné hodnoty.
ÚLOHA 5.1 Počet bodů, které získali studenti z písemné práce, je uveden v tabulce. Porovnejte jejich šikmost údajů z jednotlivých let
53 | S t r á n k a
5.2 Špičatost Špičatost je statistická charakteristika určující míru nahuštění hodnot kolem střední hodnoty. Pokud je polovina prostředních hodnot soustředěna na mnohem menší části variačního rozpětí než zbylá polovina hodnot pak říkáme, že je rozdělení sledované proměnné špičatější. V opačném případě říkáme, že je plošší.
Obrázek 13: Rozdělení se stejnými základními charakteristikami, průměr, medián, modus, směrodatnou odchylku.
Špičatost se měří pomocí charakteristik vycházejících ze součtů čtvrtých mocnin odchylek hodnot od aritmetického průměru.
5.2.1 Koeficient špičatosti Koeficient špičatosti je nejčastěji používanější charakteristika špičatosti, budeme jej označovat γ 2 a určíme jej podle následujícího vzorce. n
γ2 =
∑( x i =1
i
− x )4
n ⋅ s x4
−3,
Kde n je četnost statistického souboru, xi jsou hodnoty proměnné a
s x je směrodatná odchylka.
V případě, kdy máme hodnoty v tabulce četností, můžeme využít vzorec pro vážený koeficient špičatosti. k
γ2 =
∑( x i =1
i
− x )4 ⋅ ni
n ⋅ s x4
−3
Někdy se koeficient špičatosti označuje také jako β . Oba vzorce dávají totožné výsledky, ty porovnávají špičatost zkoumaného rozdělení se špičatostí normálního rozdělení.
UPOZORNĚNÍ Pokud je výsledná hodnota kladná, pak je zkoumané rozdělení špičatější než normální rozdělení, pokud je naopak záporná, pak je plošší.
54 | S t r á n k a
Obrázek 14: Normální rozdělení četnosti
K měření špičatosti se využívají i další charakteristiky, ale nejsou tak často využívány.
PŘÍKLAD 5.2 K dispozici máme údaje o městské spotřebě 120 osobních a malých užitkových automobilů dostupných v roce 2004 na trhu v USA. Spotřeba je uvedena v litrech paliva na 100km. Určete koeficient špičatosti. Spotřeba Počet aut
3.9 1
6.7 2
7.4 7
8.4 5
9 21
9.8 22
12.4 38
16.8 13
18.1 11
Řešení: Koeficient špičatosti určíme pomocí vzorce využívajícího absolutní četnosti. k
γ2 =
∑( x i =1
i
− x )4 ⋅ ni
n ⋅ s x4
−3
S využitím výsledků průměru a směrodatné odchylky, vypočítané v příkladu 5.1 dostaneme následující výsledek.
γ2 =
(3,9 − 11,7..)4 ⋅ 1 + (6 ,7 − 11,7..)4 ⋅ 2 + (7 ,4 − 11,7..)4 ⋅ 7 + (8 ,4 − 11,7..)4 ⋅ 5 +
+ (9 − 11,7..) ⋅ 21 + (9 ,8 − 11,7..) ⋅ 22 + (12 ,4 − 11,7..) ⋅ 38 + (16 ,8 − 11,7..) ⋅ 13 + 120 ⋅ 1,270385 4 4
4
+ (18 ,1 − 11,7..) ⋅ 11
4
4
4
= 113,9872
Vidíme tedy, že rozdělení této náhodné veličiny je mnohem špičatější, než normální rozdělení.
ÚLOHA 5.1 Počet bodů, které získali Porovnejte jejich šikmost údajů z jednotlivých let.
studenti
z
písemné
práce,
je
uveden
v
tabulce.
55 | S t r á n k a
5.2.2 Lorenzova křivka Lorenzova křivka se používá k zobrazování stupně koncentrace. Jedná se o diagram zobrazovaný do pravoúhlé soustavy souřadnic, na každé ose má rozsah od 0% do 100%. Abychom mohli zakreslit body tvořící Lorenzovu křivku, musíme nejdříve spočítat Kumulativní součty koncentrované proměnné. Koncentrovanou proměnnou rozumíme násobek obměny s její četností. Tato hodnota nám udává, jaké absolutní množství obsahují statistické jednotky mající danou obměnu. Poté z těchto hodnot spočítáme kumulativní součty koncentrované proměnné, postup je totožný jako při počítání kumulativních četností, jen místo četností použijeme koncentrovanou proměnnou. V prvním řádku tedy bude hodnota koncentrované proměnné první obměny a v posledním bude součet všech koncentrovaných proměnných. Dále potřebujeme znát relativní kumulativní součty koncentrované proměnné, ty získáme vydělením kumulativních součtů koncentrované proměnné součtem všech koncentrovaných proměnných. Hodnoty budou ve stejném rozmezí jako u relativních kumulativních četností, na posledním řádku musí vždy být hodnota 1. Obměna
Absolutní četnost
Koncentrovaná proměnná
Kumulativní součet koncentrované proměnné
Relativní kumulativní součet koncentrované proměnné
x1
n1
y1 = x1 ⋅ n1
N 1 = y1
N1 / n
x2
n2
y 2 = x2 ⋅ n2
N 2 = N1 + y2
N2 / n
…
…
…
…
…
xn
nn
y n = x n ⋅ nn
N n = N n −1 + y n
Nn / n
Obrázek 15: Lorenzova křivka
UPOZORNĚNÍ Body Lorenzovy křivky získáme z bodů [x,y], kde x=kumulativní relativní četnost a y=relativní kumulativní součet koncentrované proměnné, obě tyto hodnoty převedeme na procenta. Do grafu následně přidáme úsečku z bodu [0,0] do bodu [100,100]. Tato úsečka ukazuje křivku ideálního rozdělení, což je takové rozdělení, kdy jsou hodnoty stejně rozděleny mezi statistické jednotky.
Zmiňovaný stupeň koncentrace z této křivky můžeme spočítat jako poměr obsahu útvaru mezi křivkou ideálního rozdělení a Lorenzovou křivkou k obsahu trojúhelníku tvořeného křivkou ideálního rozdělení osou x a okrajem grafu. V následujícím obrázku se tedy jedná o hodnotu, která by se dala vypočítat jako
56 | S t r á n k a
A . A+ B
Obrázek 16: Lorenzova křivka - stupeň koncentrace
Rozsah stupně koncentrace tedy je od 0 do 1 a platí, že čím větší číslo tím špičatější je dané rozdělení. Jedničku dostaneme tehdy, když jen jedna z obměn má nenulovou četnost. Nulu dostaneme tehdy, pokud má zkoumaná proměnná ideální rozdělení, což je v případě kdy je pouze jedna obměna.
UPOZORNĚNÍ Většinou se ovšem obejdeme bez výpočtu tohoto poměru a spokojíme se pouze se zobrazením této křivky. Neboť je vhodná k porovnání různých statistických souborů či různých proměnných, lehce poté porovnáme, který obsah útvaru mezi ideálním rozdělením a danou Lorenzovou křivkou je větší.
Lorenzova křivka se často používá k zobrazování poměrů ve společnosti. Může ukazovat, kolik lidí čerpá jakou část z důchodů, dostává jakou část platů, a podobně. Ideální křivka pak ukazuje teoreticky ideální společnost, kde každý čerpá stejné množství prostředků.
PŘÍKLAD 5.3 K dispozici máme údaje o městské spotřebě 120 osobních a malých užitkových automobilů dostupných v roce 2004 na trhu v USA. Spotřeba je uvedena v litrech paliva na 100km. Vytvořte Lorenzovu křivku. Spotřeba Počet aut
3.9 1
6.7 2
7.4 7
8.4 5
9 21
9.8 22
12.4 38
16.8 13
18.1 11
Řešení: Nejdříve musíme vypočítat koncentrovanou proměnnou. Její hodnoty je nelépe doplnit do tabulky a získáme je jako součin četnosti a obměny statistické proměnné. Dále určíme kumulativní součty této proměnné a také její relativní kumulativní součty. Poslední údaj, který musíme vypočítat jsou kumulativní relativní četnosti původní proměnné. Spotřeba xi
3.9
6.7
7.4
8.4
9
9.8
12.4
16.8
18.1
Počet aut ni
1
2
7
5
21
22
38
13
11
Koncentrovaná proměnná xi ·ni
3,9
13,4
51,8
42
189
215,6
471,2
218,4
199,1
3,9
17,3
69,1
111,1
300,1
515,7
986,9
1205,3
1404,4
0,003
0,012
0,049
0,079
0,213
0,367
0,702
0,858
1
0,008333
0,025
0,083333
0,125
0,3
0,483333
0,8
0,908333
1
kumulativní součet koncentrované proměnné relativni kumulativní součet koncentrované proměnné kumulativní relativní četnost
57 | S t r á n k a
Graf pak vytvoříme nanesením bodů [x,y], kde x tvoří kumulativní relativní četnosti a y odpovídající relativní kumulativní součty koncentrované proměnné.
58 | S t r á n k a
6
LINEÁRNÍ ZÁVISLOST A NEZÁVISLOST
CÍL Cílem kapitoly je seznámit čtenáře s pojmem závislosti a nezávislosti dvou statistických proměnných. Podrobně se zaměříme na lineární závislost těchto proměnných, kde si popíšeme způsoby jak určit její existenci, směr a odhadnout sílu této závislosti.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 60 minut PROCVIČOVÁNÍ: 60 minut
Pokud máme dvě statistické proměnné X a Y, pak pojem závislosti těchto proměnných značí, že hodnota jedné proměnné ovlivňuje hodnotu druhé proměnné. Tyto proměnné se tedy navzájem vysvětlují a z hodnoty jedné můžeme alespoň přibližně odhadovat hodnotu druhé proměnné. Tímto se podrobněji zabývá regresní analýza. Lineární závislostí dvou proměnných rozumíme vztah, kdy hodnota jedné proměnné lineárně ovlivňuje hodnotu druhé proměnné. Lineární závislost je obecné pojetí přímé, či nepřímé úměry známých ze základních a středních škol. Rozdílem zde je, že nemůžeme jistě říct, že zvýšení hodnoty jedné povede ke zvýšení hodnoty druhé proměnné, ale zkoumáme, zda při zvýšení jedné proměnné je šance na zvýšení i druhé proměnné. Lineární závislost může být dvou druhů. Přímá lineární závislost, kde růst hodnoty jedné proměnné pravděpodobně povede k růstu hodnoty proměnné druhé. Nepřímá lineární závislost, u které platí, že růst hodnoty jedné proměnné pravděpodobně povede k poklesu druhé proměnné. Lineární závislost určujeme pomocí
6.1 Kovariance Kovariance je statistická charakteristika, která určuje míru lineární závislosti dvou sledovaných proměnných zkoumaného statistického souboru. Kovarianci značíme n
s xy =
∑ (x i =1
i
− x ) ⋅ ( yi − y ) n
n
=
∑x i =1
i
n
⋅ yi
n
−
s xy
a vypočítá se podle vzorce:
n
∑x ∑ y i =1
Kovariance může nabývat všech hodnot v intervalu (− ∞, ∞ ) .
n
i
⋅
i =1
n
i
= x⋅ y − x ⋅ y .
UPOZORNĚNÍ Kladná kovariance značí kladnou lineární závislost proměnných x a y. Kladná lineární závislost se také nazývá přímá lineární závislost a značí, že čím větší hodnotu nabývá jedna proměnná určité statistické jednotky, tím je větší pravděpodobnost, že druhá proměnná stejné statistické jednotky bude také větší.
Tato vlastnost je velmi podobná přímé úměře vyučované na školách, ovšem s tím rozdílem, že zde nemůžeme říct určitě, že bude proměnná větší. Jen podle velikosti kovariance můžeme odhadnout, u jak velké části statistického souboru by tato přímá úměra platila. Ve skutečných situacích je ovšem odhad téměř nemožný. 59 | S t r á n k a
UPOZORNĚNÍ Záporná kovariance naopak určuje míru záporné lineární závislosti proměnných x a y. Záporná lineární závislost se také nazývá nepřímá lineární závislost. Určuje jak často platí, že pokud jedna proměnná nabývá větší hodnoty, pak druhá nabývá menší hodnoty.
PŘÍKLAD 6.1 Určete, zda existuje lineární závislost mezi velikostí bytu a nájmem.
Velikost Nájem 30 10000 40 9000 30 5000 70 12000 Řešení: Pokud si velikost označíme jako proměnnou X, nájem jako proměnnou Y. Využitím vzorce
s xy = x ⋅ y − x ⋅ y dostaneme: s xy = 30 ⋅ 10000 + 40 ⋅ 9000 + 30 ⋅ 5000 + 70 ⋅ 12000 − 42,5 ⋅ 9000 =
= 412500 − 382500 = 30000 Z výsledku vidíme, že proměnné mezi sebou mají přímou lineární závislost, ovšem nedokážeme určit sílu této závislosti. Hodnota kovariance nám říká jen údaje o tom, zda je kladná záporná nebo nulová. Ovšem výsledek naznačuje, že čím větší je byt, tím větší se platí nájem.
UPOZORNĚNÍ V případě, kdy je kovariance rovna nule říkáme, že proměnné x a y nejsou lineárně závislé, což ovšem neznamená, že by nemohly být závislé jinak než lineárně.
Kovariance se k porovnání moc často samostatně nepoužívá, protože u různých statistických souborů a různých proměnných dává rozdílné výsledky a tak se nedají vzájemně srovnávat. Proto se kovariance používá hlavně k výpočtu korelačního koeficientu, který tuto nevýhodu nemá. ÚLOHA 6.1 Určete, zda existuje lineární závislost mezi počtem pracovníků a dobou dokončení úkolu. Určete druh závislosti. Počet Doba práce 1 5 3 4 5 5 2 4 4 1 1 3 2 4 5 2 7 1
60 | S t r á n k a
6.2 Korelační koeficient Korelační koeficient je další charakteristikou používanou k hodnocení případné lineární závislosti. Korelační koeficient značíme
rxy =
s xy sx ⋅ sy
rxy
a vychází z výpočtu kovariance, takže pro jeho výpočet platí
, kde sx a s y jsou směrodatné odchylky proměnných x a y.
UPOZORNĚNÍ
Korelační koeficient nabývá hodnot v intervalu (− 1,1) . Kladné hodnoty značí, že zkoumané proměnné mají přímou lineární závislost a naopak záporné značí nepřímou lineární závislost.
Výhodou proti kovarianci je omezení intervalu, takže můžeme vzájemně srovnávat i takové statistické soubory, které jsme pomocí kovariance srovnávat nemohli. Také nám umožňuje rozdělit závislosti na jednotlivé typy podle jejich síly.
Rozmezí
Označení
0 < rxy ≤ 0.3
nízká závislost
0.3 < rxy ≤ 0.5
mírná závislost
0.5 < rxy ≤ 0 .75
význačná závislost
0 . 75 < r xy ≤ 0 . 9
velká závislost
0 . 9 < rxy ≤ 1
velmi vysoká závislost
Obrázek 17: Ukázky rozdělení a výsledky korelačního koeficientu
61 | S t r á n k a
PŘÍKLAD 6.2 Určete, zda existuje lineární závislost mezi velikostí bytu a nájmem a v případě existence závislosti určete její sílu.
Velikost Nájem 30 10000 40 9000 30 5000 70 12000 Řešení: Abychom určili sílu závislosti, musíme vypočítat korelační koeficient.
rxy =
s xy sx ⋅ sy
V příkladu 6.1 jsme určili s xy = 30000 . Zbývá tedy spočítat směrodatné odchylky sx a sy.
sx =
(30 − 42 ,5 )2 + (40 − 42 ,5 )2 + (30 − 42 ,5 )2 + (70 − 42 ,5 )2 4
= 16 ,3936
Podobně spočítáme směrodatnou odchylku sy.
sy =
26000000 = 2549 ,51 4
Nyní můžeme určit korelační koeficient rxy.
rxy =
30000 = 0 ,71778 16 ,3936 ⋅ 2549 ,51
Z výsledku vidíme, že proměnné mezi sebou mají význačnou přímou lineární závislost, což znamená, že je velmi pravděpodobné, že pří růstu velikosti bytu poroste i cena nájmu a zároveň se na tento vztah můžeme podívat i opačně, tedy pokud někdo platí větší nájem je pravděpodobné, že bydlí ve větším bytě.
ÚLOHA 6.2 Určete, zda existuje lineární závislost mezi počtem pracovníků a dobou dokončení úkolu. Určete druh závislosti. Počet Doba práce 1 5 3 4 5 5 2 4 4 1 1 3 2 4 5 2 7 1
UPOZORNĚNÍ Je potřeba si uvědomit, že korelační koeficient uvádí pouze sílu lineární závislosti, ne sílu závislosti obecně. Proto pokud je korelační koeficient roven 0, pak nemůžeme říci "proměnné jsou nezávislé", ale pouze "proměnné nejsou lineárně závislé".
62 | S t r á n k a
7
INDEXNÍ ANALÝZA
CÍL Cílem kapitoly je seznámit čtenáře se základy indexní analýzy. Vysvětlit způsoby porovnávání získaných ekonomických hodnot a určit míru a směr jednotlivých vlivů.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 120 minut PROCVIČOVÁNÍ: 90 minut
Indexní analýza se používá při analyzování sociálně ekonomických ukazatelů. Pomocí indexů můžeme porovnávat vzájemně odlišné údaje a určovat jejich vzájemné vztahy. Ukazatel je statistická veličina, popisující některý ze sociálně ekonomických jevů. Ukazatele rozdělujeme na: extenzivní - Jsou to ukazatele vyjadřující velikost zkoumaného jevu. Charakterizují množství, rozsah, objem, a podobně. Tyto ukazatele, můžeme při počítání souhrnů sčítat. Pro označení těchto ukazatelů používáme q (případně Q). Také je označujeme jako ukazatele množství. intenzivní - Jedná se o ukazatele vzniklé jako podíl dvou extenzivních ukazatelů. Může se jednat o ukazatele uvádějící cenu za kus, průměrnou mzdu, výnos na hektar, atd.. Pro jejich označení se používá znak p, nebo v případě ceny c. Označují se také jako ukazatele úrovně. Tyto ukazatele se nedají při souhrnech sčítat. Hodnoty ukazatele se v čase mění, a proto je rozlišujeme z časového hlediska. Ukazatele číslujeme dolními indexy, takže 0 značí původní časový údaj nebo období, vzhledem ke kterému se porovnávání děje (báze), nazýváme jej ukazatel bazický. Pozdější údaje postupně označujeme 1,2,... Pak tedy máme jednotlivé ukazatele p0, p1, p2, ...., q0, q1, q2, .... ,c0, c1, c2, .... Používáme dva druhy porovnávání těchto ukazatelů a to pomocí diference a pomocí indexů.
7.1 Absolutní porovnávání Absolutní porovnávání provádíme pomocí diference (rozdílů). Porovnání můžeme provádět vzhledem k bázi, pak tedy získáme absolutní přírůstek
∆ = qn − q0 .
UPOZORNĚNÍ Absolutní přírůstek určuje absolutní množství, které přibylo (v případě záporného čísla ubylo) od původního období.
Nebo můžeme vytvářet tzv. řetězové absolutní srovnávání. Toto srovnávání spočívá ve vypočtení n-1 různých diferencí, kde n je počet časových momentů. Tyto diference pak spočítáme jako ∆i = qi −1 − qi , pro i ∈ {1,..., n} . Každá z těchto diferencí určuje přírůstek (úbytek) ukazatele za jedno období. Z řetězových diferencí můžeme bazickou diferenci získat, pokud sečteme všechny řetězové diference n
∆ = ∑ ∆i . i =1
63 | S t r á n k a
7.2 Relativní porovnávání Mnohem vhodnější než absolutní porovnávání je porovnávání relativní. Relativní porovnávání se provádí pomocí indexů. Indexy jsou hodnoty, které získáme podělením ukazatelů.
UPOZORNĚNÍ Indexy nás informují o poměru ukazatelů a tedy po vynásobení stem o tempu růstu v procentech.
Opět rozlišujeme, zda provádíme porovnání vzhledem k bázi, pak dostáváme bazické indexy.
Ii = 0
qi q0
Bazické indexy značí růst za celé zvolené období. Druhou možností je porovnání vzhledem k sousedním obdobím, čímž získáme řetězové indexy.
I
i i −1
=
qi qi − 1
UPOZORNĚNÍ Řetězové indexy značí tempo růstu (poklesu) za každý interval zvlášť. Používáme pro ně též označení koeficienty růstu (poklesu), proto je také označujeme
ki = I
i i −1
.
Z koeficientů růstu také můžeme odvodit koeficient přírůstku (úbytku) k i − 1 , který po vynásobení stem značí v procentech, jaký byl přírůstek (úbytek) ukazatele za určité období.
Často nás zajímá průměrný koeficient růstu. Ten vypočítáme pomocí geometrického průměru
k = n k 1 ⋅ k 2 ⋅ ... ⋅ k n , ale protože platí ki =
qi q0
, tak se nám vnitřní koeficienty qi zkrátí a
n dostaneme příjemnější vzorec pro výpočet průměrného koeficientu růstu k =
qn q0 .
Z toho vyplývá, že průměrný koeficient růstu závisí pouze na počtu období a pak na první a poslední hodnotě. To je třeba mít na paměti, neboť pokud ukazatel velmi kolísá, pak nemusí mít průměrný koeficient růstu žádný reálný smysl a může se velmi lišit podle toho, které okamžiky vezmeme jako krajní. V této části jsme se zabývali jen nejjednoduššími indexy, ale celkově je indexů celá řada jak uvidíme dále.
64 | S t r á n k a
7.3 Indexy Indexy rozdělujeme na individuální a souhrnné. Pomocí individuálních indexů srovnáváme stejnorodé ukazatele, což jsou takové, jejichž součet má stejný smysl jako stejný ukazatel za jednotlivé části, např. součet zisků za měsíc můžeme sečíst a výsledek má stejný smysl jen za jiné období. Naproti tomu souhrnné indexy jsou indexy nesourodých ukazatelů, tedy takových, jejichž součet nemá pro celek význam, např. součet produkce různých výrobků.
7.3.1 Jednoduché individuální indexy Pomocí těchto indexů srovnáváme dvě hodnoty téhož ukazatele. Postupujeme způsobem popsaným výše. Pokud porovnáváme extenzivní ukazatel, pak počítáme jednoduchý individuální index množství
Iq =
q1 q0
, odpovídající absolutní přírůstek pak bude
∆q = q1 − q0 .
Intenzivní ukazatel porovnáváme pomocí jednoduchého individuálního indexu úrovně odpovídající absolutní přírůstek pak bude
Ip =
p1 p0
,
∆ p = p1 − p0 .
UPOZORNĚNÍ Vidíme, že u jednoduchých individuálních indexů nehraje roli, zda je ukazatel extenzivní, či intenzivní.
PŘÍKLAD 7.1 Firma Pomona prodává v specializované prodejně jižní ovoce. Pro sledování vývoje máme tato data: Druh
prodej kg v období prosinec 2003
leden 2004
pomeranče
1000
1200
banány
800
750
mandarinky
400
500
Z uvedených podkladů posuďte vývoj za jednotlivé druhy ovoce.
Řešení: Při porovnávání různých časových údajů u jednotlivých druhů ovoce využijeme jednoduché individuální indexy. V tom případě nezáleží na tom, zda je proměnná udávající prodej v kilogramech extenzivní nebo intenzivní, ovšem víme, že tato proměnná je extenzivní. Navíc můžeme provést i absolutní porovnávání. Pro pomeranče jsou výsledky porovnání
∆q = 1200 − 1000 = 200
Iq =
1200 = 1,2 1000
Množství se tedy zvýšilo na 120% původního množství z prosince roku 2003, tedy celkové došlo ke zvýšení o 200kg. Také můžeme říct, že došlo ke zvýšení o 20% původního množství. Pro banány máme tyto výsledky
65 | S t r á n k a
∆q = 750 − 800 = −50
750 = 0 ,9375 800
Iq =
Prodané množství se tedy snížilo na 93,75% původní hodnoty, celkově se prodalo o 50kg méně. Došlo ke snížení o 6,25%. Obdobně pro mandarinky
∆q = 500 − 400 = 100
Iq =
500 = 1,25 400
Prodané množství se zvýšilo na 125% původního množství. Prodalo se o100kg více než v předchozím období. Došlo ke zvýšení prodeje mandarinek o 25%.
ÚLOHA 7.1 Tabulka uvádí průměrnou dobu výroby výrobků v letech 2009 a 2010.
Výrobek A B C
Porovnejte dobu výroby u každého výrobku zvlášť.
Množství Doba výroby 2009 2010 2009 2010 100 120 5 4 150 130 3 2 210 150 7 10
7.3.2 Složené individuální indexy Tyto indexy využíváme v případech, kdy máme stejnorodé ukazatele několika částí a chceme je shrnout za celek. Například pokud známe jednotlivé údaje v několika pobočkách a chceme srovnat vývoj za celou společnost.
UPOZORNĚNÍ V případě výpočtů složených individuálních indexů je třeba důkladně hlídat, zda počítáme složené indexy extenzivních nebo intenzivních ukazatelů.
Extenzivní ukazatele Pokud porovnáváme extenzivní ukazatele, pak je shrnujeme pomocí součtu. Pro shrnutí využijeme složený individuální index množství
Iq =
∑q ∑q
1
0
Absolutní přírůstek vypočteme opět jako rozdíl hodnot
∆q = ∑ q1 − ∑ q0 .
PŘÍKLAD 7.2 Firma Pomona prodává v specializované prodejně jižní ovoce. Pro sledování vývoje máme tato data: Druh
prodej kg v období
Cena/kg
prosinec 2003
leden 2004
prosinec 2003
Leden 2004
pomeranče
1000
1200
15
16
banány
800
750
18
17
mandarinky
400
500
18
20
Z uvedených podkladů posuďte vývoj celkového prodaného množství
Řešení:
66 | S t r á n k a
Zajímá nás celkové prodané množství v jednotlivých obdobích. Potřebujeme určit souhrnný index ukazatele „prodej kg“. Tento ukazatel je extenzivní a hodnota souhrnného indexu ukazatele se tedy rovná podílu součtů položek v jednotlivých letech.
Iq =
∑q ∑q
1
0
Iq =
1200 + 750 + 500 2450 = = 1,113636 1000 + 800 + 400 2200
Souhrnný index ukazatele „prodej kg“ se rovná 1,1136, což znamená, že se celkové prodané množství za dané období zvýšilo na 111,36% množství z prosince 2003. Také můžeme říct, že se prodané množství za leden 2004 zvýšilo o 11,36% oproti množství z prosince 2003. Pokud bychom chtěli absolutní porovnání, pak určíme rozdíl součtů z jednotlivých let.
∆ q = 2450 − 2200 = 250 Prodané množství se tedy v lednu zvýšilo o 250kg.
ÚLOHA 7.2 Tabulka uvádí průměrnou dobu výroby výrobků v letech 2009 a 2010.
Výrobek A B C
Množství Doba výroby 2009 2010 2009 2010 100 120 5 4 150 130 3 2 210 150 7 10
Porovnejte celkové množství vyrobených výrobků v jednotlivých letech.
Intenzivní ukazatele Tyto ukazatele nemůžeme shrnout tak lehce jako extenzivní, ale ke shrnování musíme použít vážený aritmetický průměr. Abychom určili váhy jednotlivých hodnot, musíme nejdříve určit hodnoty extenzivního ukazatele qi, který pak využijeme jako váhy. Tento extenzivní ukazatel musí splňovat:
pi =
Qi qi
Index, který takto získáme, se nazývá index proměnlivého složení, a vypočítáme jej pomocí následujícího vzorce.
∑ p1 ⋅ q1 q1 p1 ∑ p = p ⋅q I = p0 ∑ 0 0 ∑ q0
67 | S t r á n k a
Absolutní přírůstek pak má tvar
∑ p ⋅q − ∑ p ⋅q ∑q ∑q
∆p = p1 − p 0 =
1
1
0
1
0
.
0
Index proměnlivého složení tedy zachycuje změny jak intenzivního ukazatele, tak extenzivního ukazatele. Někdy ale potřebujeme znát pouze změnu jedné z těchto složek, při konstantní hodnotě druhé složky. Abychom potlačili vliv extenzivního ukazatele, musíme výpočet vztáhnout k jednomu období. Což je buď základní q0, nebo běžné q1. Poté můžeme vypočítat index stálého složení, který vyjadřuje vliv změny intenzivní složky při konstantním působení složky extenzivní, značíme jej
∑ p ⋅q ∑q = ∑ p ⋅q ∑q 1
I ss
Pro běžné období platí:
1
=
1
0
1
∑p ∑p
1
⋅ q1
0
⋅ q1
I ss .
1
∑ p ⋅q ∑q = ∑ p ⋅q ∑q 1
I ss
Pro základní období platí:
0
0
0
=
0
∑p ∑p
1
⋅ q0
0
⋅ q0
0
UPOZORNĚNÍ Indexy stálého složení nám udávají, jaký by byl růst či úbytek pokud by byl extenzivní ukazatel na stálé hodnotě a to buď té, která byla v běžném období, nebo té na které byla v základním období. Charakterizuje tedy vliv průměrné intenzivní ukazatele pouze v závislosti na částečných intenzivních ukazatelích.
Podobně můžeme určit index struktury, který charakterizuje vliv extenzivního ukazatele při
I str . Také máme dvě možnosti podle
konstantním působení intenzivního ukazatele, značíme jej období.
∑ p ⋅q ∑q = ∑ p ⋅q ∑q ∑ p ⋅q ∑q = ∑ p ⋅q ∑q 1
I str
Pro běžné období platí:
1
1
1
0
0
0
I str
Pro základní období platí:
1
1
0
0
0
PŘÍKLAD 7.3 Firma Pomona prodává ve specializované prodejně jižní ovoce. Pro sledování vývoje máme tato data: Druh
prodej kg v období
Cena/kg
prosinec 2003
leden 2004
prosinec 2003
Leden 2004
pomeranče
1000
1200
15
16
banány
800
750
18
17
mandarinky
400
500
18
20
68 | S t r á n k a
Z uvedených podkladů posuďte vývoj průměrných prodejních cen. Určete, jaký vliv na tuto změnu měla změna struktury prodeje a jaký změna ceníku. Oba vlivy porovnávejte vzhledem k základnímu období.
Řešení: Zajímá nás porovnání cen, protože jsou ceny intenzivním ukazatelem, musíme je porovnávat pomocí indexu proměnlivého složení, který porovnává průměrné prodejní ceny za jednotlivé roky.
∑ p1 ⋅q1 q1 p I p = 1 = ∑p ⋅q = p0 ∑ 0 0 ∑ q0
1200 ⋅ 16 + 750 ⋅ 17 + 500 ⋅ 20 2450 1000 ⋅ 15 + 800 ⋅ 18 + 400 ⋅ 18
= 1,029218
2200
Výsledkem analýzy tedy je, že se průměrná cena zvýšila o 2,9%, také můžeme říct, že se průměrná cena v lednu zvýšila na 102,9% průměrné ceny z prosince 2003. Absolutní růst průměrných cen opět získáme jako jejich rozdíl.
∆p =
1200 ⋅ 16 + 750 ⋅ 17 + 500 ⋅ 20
1000 ⋅ 15 + 800 ⋅ 18 + 400 ⋅ 18
−
= 0,486085 2200 Průměrné cena v lednu vzrostla o 0,486Kč proti průměrné ceně v prosinci. Pro určení míry vlivu, který měla změna ceníku, musíme vypočítat index proměnlivého 2450
složení, a protože porovnáváme vzhledem k základnímu období, volíme tuto verzi vzorce.
∑ p ⋅q ∑q = ∑ p ⋅q ∑q 1
I ss
0
0
0
=
0
∑p ∑p
1
⋅ q0
0
⋅ q0
0
I ss =
16000 + 13600 + 8000 15000 + 14400 + 7200
= 1,027322
Změna ceníku by měla za následek zvýšení průměrné prodejní ceny o 2,7%, za předpokladu, že by prodané množství zůstalo stejné jako v prosinci 2003. Podobně určíme vliv struktury prodaného ovoce, tedy jak ovlivnily průměrnou cenu změny v nákupních zvycích zákazníků pomocí indexu struktury. Opět porovnáváme pro základní období.
∑ p ⋅q ∑q = ∑ p ⋅q ∑q 0
I str
1
1
0
0
0
69 | S t r á n k a
18000 + 13500 + 9000
I str =
16 ,53061 2450 = = 0 ,993643 15000 + 14400 + 7200 16 ,63636364 2200
Změna struktury vedla k mírnému snížení průměrné prodejní ceny o 0,6%, za předpokladu, že by se nezměnil ceník a stále by platily ceny z prosince 2003.
ÚLOHA 7.3 Tabulka uvádí průměrnou dobu výroby výrobků v letech 2009 a 2010.
Výrobek A B C
Množství Doba výroby 2009 2010 2009 2010 100 120 5 4 150 130 3 2 210 150 7 10
Porovnejte průměrnou dobu výroby jednoho výrobku v jednotlivých letech a určete jaký vliv na této změně měla změna výrobního postupu (doba výroby) a jaký vliv mělo různé množsví výráběných výrobků.
7.3.3 Souhrnné indexy Souhrnné indexy jsou indexy nestejnorodých extenzivních ukazatelů. Nestejnorodý ukazatel značí, že hodnoty mohou pro různé části mít různou jednotku. Pokud je tedy chceme srovnávat, není možné hodnoty pouze sečíst. Pro srovnání musíme použít nějaký společný intenzivní ukazatel, vzhledem k němuž můžeme provést souhrn nestejnorodých ukazatelů. Příkladem takového extenzivního ukazatele může být množství prodaných výrobků, v případě, kdy se některé prodávají v kilogramech, jiné v litrech, kusech, či metrech. Společným intenzivním ukazatelem pak mohou být ceny za jednu jednotku. Souhrnný index pak udává změnu vytvořené hodnoty (např. tržba) a nazýváme jej hodnotový index.
∑c ⋅ q ∑c ⋅ q ∆ = ∑ c1 ⋅ q1 − ∑ c0 ⋅ q0 Absolutně pak vývoj tržeb vyjádříme jako cq I cq =
1
1
0
0
UPOZORNĚNÍ Stejně jako v případě indexu proměnlivého složení, udává hodnotový index změnu ovlivněnou dvěma vlivy. V praxi je ovšem vhodné získat údaje o vlivu jednotlivých ukazatelů.
Abychom určili vliv jednoho ukazatele na vývoj vytvořené hodnoty, musíme u druhého ukazatele předpokládat, že je konstantní v čase. V případě cenových indexů předpokládáme, že je konstantní extenzivní ukazatel, naopak v případě objemových indexů předpokládáme, že je konstantní intenzivní ukazatel. Cenové indexy Cenové indexy se také nazývají souhrnné indexy úrovně a udávají vliv změny ceny na hodnotový index, za předpokladu že extenzivní ukazatel se nemění. Těchto indexů je celá řada ale nejčastěji se využívají následující čtyři. 70 | S t r á n k a
Laspeyresův cenový index, využívá jako váhu množství základního období:
∑c ∑c
I cL =
1
⋅ q0
0
⋅ q0
Paascheho cenový index, využívá jako váhu množství běžného období:
∑c ∑c
I cP =
1
⋅ q1
0
⋅q1
Loweho cenový index, využívá jako váhu předem zvolené číslo q, toto číslo může být dané, nebo vypočítané, například jako aritmetický průměr extenzivního ukazatele v základním a běžném období:
I cLowe =
∑c ∑c
1
⋅q
0
⋅q
Fisherův cenový index, je počítán jako geometrický průměr Laspeyresova a Paascheho indexu:
∑c ∑c
I cF =
1
⋅ q0
0
⋅ q0
⋅
∑c ∑c
1
⋅ q1
0
⋅ q1
UPOZORNĚNÍ Ve vzorcích cenových indexů je pro označení intenzivního ukazatele použito označení ci, což ale neznamená, že se nemohou použít i v případech, kdy intenzivní ukazatel udává jinou hodnotu než cenu za jednotku.
Objemové indexy Podobně jako cenové indexy udávají objemové indexy vliv změny množství na hodnotový index, za předpokladu konstantní ceny. Objemové indexy se také nazývají souhrnné indexy množství. Laspeyresův objemový index, využívá jako váhu cenu základního období:
I qL =
∑c ∑c
⋅ q1 0 ⋅ q0 0
Paascheho objemový index, využívá jako váhu cenu běžného období:
I
P q
c ⋅q ∑ = ∑c ⋅ q 1
1
1
0
Loweho objemový index, využívá jako váhu předem zvolené číslo c, toto číslo může být dané, nebo vypočítané, například jako aritmetický průměr intenzivního ukazatele v základním a běžném období:
I
Lowe q
c⋅q ∑ = ∑c ⋅ q
1 0
Fisherův objemový index, je počítán jako geometrický průměr Laspeyresova a Paascheho indexu:
71 | S t r á n k a
I qF =
∑c ∑c
0
⋅ q1
0
⋅ q0
∑c ⋅ q ∑c ⋅ q
⋅
1
1
1
0
PŘÍKLAD 7.4 Firma Pomona prodává v specializované prodejně jižní ovoce. Pro sledování vývoje máme tato data: Druh
prodej kg v období
Cena/kg
prosinec 2003
leden 2004
prosinec 2003
Leden 2004
pomeranče
1000
1200
15
16
banány
800
750
18
17
mandarinky
400
500
18
20
Z uvedených podkladů posuďte vývoj tržeb. Určete, jaký vliv na tuto změnu měla změna struktury prodeje a jaký změna ceníku. Oba vlivy porovnávejte vzhledem k základnímu období.
Řešení: Tržba je hodnota, kterou získáme součinem hodnot prodej kg a cena za kilogram v každém řádku tabulky a následně tyto hodnoty sečteme. Jedná se tedy o souhrnný index.
I cq =
I cq =
∑c ∑c
1
⋅ q1
0
⋅ q0
19200 + 12750 + 10000 15000 + 14400 + 7200
=
41950 36600
= 1,146175
Tržby se zvýšily o 14,6%. Jednotlivé vlivy určíme pomocí cenového indexu (vliv ceny) a objemového indexu (vliv množství) protože budeme porovnávat vzhledem k základnímu období, použijeme L
Laspeyresův cenový index I c a Laspeyresův objemový index
I cL = I cL =
I qL =
∑c ∑c
1
⋅ q0
0
⋅ q0
I qL =
∑c ∑c
16000 + 13600 + 8000 15000 + 14400 + 7200
18000 + 13500 + 9000 15000 + 14400 + 7200
I qL .
0
⋅ q1
0
⋅ q0
= 1,027322
= 1,106557
Změna ceny by měla 2,7% vliv na zvýšení tržeb, pokud by prodané množství zůstalo stejné jako v prosinci roku 2003 a změna prodaného množství by měla za následek zvýšení tržeb o 10,6%, pokud by se v lednu 2004 neměnil ceník a ceny tak zůstaly stejné jako v prosinci 2003.
72 | S t r á n k a
UPOZORNĚNÍ I pro objemové indexy platí, že můžeme ukazatel ceny ci nahradit libovolným intenzivním ukazatelem pi.
ÚLOHA 7.4 Tabulka uvádí průměrnou dobu výroby výrobků v letech 2009 a 2010.
Výrobek A B C
Množství Doba výroby 2009 2010 2009 2010 100 120 5 4 150 130 3 2 210 150 7 10
Porovnejte celkovou dobu výroby v jednotlivých letech a určete jaký vliv na této změně měla změna výrobního postupu (doba výroby) a jaký vliv mělo různé množsví výráběných výrobků.
73 | S t r á n k a
8
ZÁKLADNÍ POJMY TEORIE PRAVDĚPODOBNOSTI
CÍL Cílem kapitoly je seznámit čtenáře se základním pojem teorie pravděpodobnosti, kterým je náhodný jev. Dále budou popsány operace s náhodnými jevy, které hrají významnou roli v dalším výkladu.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 30 minut PROCVIČOVÁNÍ: 0 minut
V počtu pravděpodobnosti je základním pojmem slovo Náhoda. Náhodu definujeme jako výsledek velkého počtu drobných vlivů, které nejsou v dané situaci rozpoznatelné a měřitelné. Pravděpodobnost se pak snaží určit jakou šanci má každý z možných výsledků pokusu. Jsou pokusy, u kterých předem víme, že pokud přesně dodržíme postup, vždy dostaneme tentýž výsledek, ale toto neplatí u všech dějů. Náhodný pokus je činnost probíhající pod vlivem náhody. Není tedy u ní předem zřejmé, jaký bude výsledek této činnosti. Náhodný pokus musí být činnost, která je opakovatelná i když po každém provedení za stejných podmínek můžeme dostat jiný výsledek.
8.1 Náhodný jev Náhodný jev je pak výsledek náhodného pokusu, nebo množina různých výsledků.
UPOZORNĚNÍ Po provedení náhodného pokusu tedy můžeme vždy určit, zda jev při tomto pokusu nastal nebo nenastal. Příkladem jevu může být, že na kostce padne číslo 1, jiným jevem může být, že padne liché číslo. Náhodné jevy budeme označovat velkými písmeny od začátku abecedy.
Jev jistý je jev, u kterého víme jistě, že se stane při každém náhodném pokusu. Jistý jev značíme E, někdy se používá i znak Ω . Nemožný jev je jev který určitě při žádném náhodném pokusu nenastane. Nemožný jev značíme 0/ .
PŘÍKLAD U házení kostkou může tímto jevem být, že padne číslo od 1 do 6. Hod čísla 7 na kostce, kde sedmička není je nemožným jevem.
UPOZORNĚNÍ Jev jistý a jev nemožný nezařazujeme mezi náhodné jevy, neboť předem víme, zda nastanou nebo nenastanou.
Elementární jev je nejjednodušší výsledek, který může při náhodném pokusu nastat. Každý náhodný jev je buď elementární jev, nebo jejich sjednocením elementárních jevů. Elementární jev je jev, který se nedá rozložit na více jevů. Elementární jevy budeme značit E1, E2, E3,....
PŘÍKLAD Elementární jevy při hodu kostkou jsou "padne 1", "padne 2", "padne 3", "padne 4", "padne 5", "padne 6". Elementárním jevem není "padne číslo menší než tři".
74 | S t r á n k a
Prostor elementárních jevů je množina všech elementárních jevů náhodného pokusu. Tento prostor náhodných jevů značíme E. Libovolný náhodný jev je vlastní podmnožinou množiny E. Volba označení je stejná jako u jistého jevu. Důvodem je to, že tyto pojmy jsou často zaměnitelné.
UPOZORNĚNÍ Rozlišujeme tři různé velikosti množiny E. Konečná - Počet prvků je celé číslo. Spočetná nekonečná - Spočetná znamená, že u každé hodnoty známe jeho předchůdce a následníka a všechny prvky se dají seřadit podle velikosti. Příkladem spočetných množin jsou celá čísla, nebo množina vyráběných produktů (dá se určit, v jakém pořadí byly dokončeny). Nespočetná nekonečná - Není možné pro každý prvek přesně určit jeho předchůdce a následníka. Většinou se jedná o prostory jevů, které vycházejí různá reálná čísla (výsledky měření).
8.2 Operace s náhodnými jevy Náhodné jevy se dají ztotožnit s množinami, proto jsou operace s náhodnými jevy stejné jako množinové operace, známé ze střední a základní školy. Pro zobrazení těchto operací se často používají Vennovy diagramy. Doplňkový jev - doplňkovým jevem k jevu A rozumíme jev A , který nastane v případě, když nenastane jev A . Platí tedy E = A + A .
Implikace jevu - jev A implikuje jev B, jestliže platí, že pokud nastane jev A pak automaticky nastává jev B.
Rovnost jevů - jevy A a B jsou si rovny, jestliže A implikuje B a zároveň B implikuje A. Pak píšeme A=B. Sjednocení jevů - sjednocením jevů A a B rozumíme jev, který nastane v případě výskytu alespoň jednoho z jevů A a B. Sjednocení jevů A a B značíme A ∪ B , někdy se také používá A + B . Sjednocení se dá zobecnit na libovolný počet jevů. Pokud máme jevy A1, A2, A3,...., Ak, Pak jejich sjednocením rozumíme A1 ∪ A2 ∪ A3 ∪ ... ∪ Ak nebo také A1 + A2 + A3 + ... + Ak . Sjednocením těchto jevů je pak jev nastávající pokud nastane alespoň jeden z jevů A1, A2, A3,...., Ak.
75 | S t r á n k a
Průnik jevů - průnikem jevů A a B rozumíme jev, který nastane v případě výskytu obou jevů A a B. Průnik jevů A a B značíme A ∩ B někdy se také používá A ⋅ B . Průnik se dá zobecnit na libovolný počet jevů. Pokud máme jevy A1, A2, A3,...., Ak, Pak jejich průnikem rozumíme A1 ∩ A2 ∩ A3 ∩ ... ∩ Ak nebo také A1 ⋅ A2 ⋅ A3 ⋅ ... ⋅ Ak . Průnikem těchto jevů je pak jev nastávající pokud nastanou všechny jevy A1, A2, A3,...., Ak.
Rozdíl jevů - rozdíl jevů A a B rozumíme jev nastávající v případě, kdy nastává jev A a nenastává jev B. Zapisujeme A − B .
Disjunktní (neslučitelné) jevy - o jevech A a B říkáme, že jsou disjunktní, jestliže platí, že jejich průnik je prázdný A ∩ B = 0/ .
Systém disjunktních (neslučitelných) jevů - Je systém jevů A1, A2, A3,…, Ak, které splňují, že žádné dva z nich nejsou disjunktní. Tedy pro libovolné různé i, j platí Ai ∩ A j = 0/ .
76 | S t r á n k a
Úplný systém jevů - úplný systém jevů je množina takových jevů A1, A2, A3,…, Ak jejichž sjednocení je jev jistý A1 ∪ A2 ∪ A3 ∪ ... ∪ Ak = E .
Úplný systém disjunktních (neslučitelných) jevů - je systém disjunktních jevů, jejichž sjednocení je jevem jistým.
UPOZORNĚNÍ Při výpočtu pravděpodobnosti, jsou pro nás nejdůležitější právě úplné systémy disjunktních jevů. Obvykle se pokoušíme rozdělit řešený problém na disjunktní jevy a pro každý z nich určit pravděpodobnost zvlášť a poté využít speciálních vlastností, které má právě systém disjunktních jevů.
Pro výše popsané operace platí následující zákony. Zákon jedinečnosti Pro každé dva jevy A a B existuje jediný průnik a jediné sjednocení. Komutativní zákon Při průniku a sjednocení není důležité pořadí jevů. A∩ B = B∩ A
A∪ B = B∪ A
77 | S t r á n k a
Asociativní zákon U operací sjednocení a průniku nezáleží na pořadí provedených operací.
( A ∩ B) ∩ C = A ∩ ( B ∩ C ) ( A ∪ B) ∪ C = A ∪ ( B ∪ C )
Distributivní zákon Distributivní zákon je velmi podobný jako pravidla pro roznásobení závorek.
( A ∩ B) ∪ C = ( A ∪ C ) ∩ ( B ∪ C ) ( A ∪ B) ∩ C = ( A ∩ C ) ∪ ( B ∩ C )
Zákony identity Zákony identity uvádějí pravidla pro průniky a sjednocení s jeven jistým a jevem nemožným.
A ∪ 0/ = A
A∪ E = E
A ∩ 0/ = 0/
A∩ E = A Zákon doplňku Pro každý jev A existuje jediný jev A takový, že platí A ∩ A = 0/ a A ∪ A = E .
78 | S t r á n k a
9
DEFINICE PRAVDĚPODOBNOSTI
CÍL Cílem kapitoly je představit nejdůležitější způsoby jak je dnes definovaná pravděpodobnost a ukázat využití těchto definic u reálných příkladů.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 45 minut PROCVIČOVÁNÍ: 90 minut
Pravděpodobnost je vlastně pokus přiřadit každému jevu hodnotu určující šanci, že tento jev nastane. Pravděpodobnost jevu A označujeme P(A). Teorie pravděpodobnosti využívá jako základní pojem náhodný jev a množinu elementárních jevů. Teorií, pokoušejících určit pravděpodobnosti různých jevů byla v historii vytvořena celá řada. Postupem času se došlo k tomu, že nejvhodnější jsou teorie založené na axiomatické teorii pravděpodobnosti.
9.1 Axiomatická teorie pravděpodobnosti Základní definice teorie pravděpodobnosti se nazývá axiomatická teorie pravděpodobnosti. Tato teorie definuje pravděpodobnost pomocí několika základních axiomů. Axiomy jsou jednoduchá tvrzení, která se nedokazují a z nichž se odvozují všechny ostatní vlastnosti systému. Axiomy teorie pravděpodobnosti jsou tři a budeme je označovat A1,A2 a A3. A1 - Pravděpodobnost náhodného jevu A je číslo z intervalu A2 - Pravděpodobnost jevu jistého je rovna jedné:
0 ;1 : 0 ≤ P( A) ≤ 1 .
P(E ) = 1 .
A3 - Pravděpodobnost sjednocení konečně nebo spočetně mnoha neslučitelných (disjunktních)
A1 , A2 , A3 ,... je rovna součtu pravděpodobností těchto náhodných jevů: P( A1 ∪ A2 ∪ A3 ∪ ...) = P( A1 ) + P( A2 ) + P( A3 ) + ....
náhodných jevů
UPOZORNĚNÍ Tyto axiomy nám stále neudávají přesnou hodnotu pravděpodobnosti, tyto hodnoty se totiž doplňují různými způsoby. Ovšem udávají nám základní početní úkony, které jsou platné u všech dalších definic pravděpodobnosti.
Z axiomů přímo vyplývají tyto vlastnosti.
Jestliže jev A implikuje jev B, pak platí P( A) ≤ P(B) . Pravděpodobnost nemožného jevu je 0: P(0/ ) = 0
Pravděpodobnost A je rovna rozdílu 1 a pravděpodobnosti jevu A: P(A ) = 1 − P( A) .
Pro pravděpodobnost sjednocení dvou jevů A a B platí: P( A ∪ B ) = P( A) + P(B ) − P( A ∩ B )
Jestliže A implikuje B, pak platí:
P(B − A) = P(B) − P( A)
79 | S t r á n k a
UPOZORNĚNÍ Všechny v praxi používané definice pravděpodobnosti využívají axiomatickou teorii pravděpodobnosti. Každá z uvedených definic pravděpodobnosti se používá pro počítání pravděpodobnosti jiných typů problémů.
9.2 Klasická definice pravděpodobnosti Klasická definice pravděpodobnosti se používá v případě, kdy máme konečný nebo spočetný počet po dvou disjunktních jevů, u nichž každému z těchto jevů přiřadíme stejnou pravděpodobnost. Předpokládáme tedy, že máme n možných výsledků náhodného pokusu. Máme tedy n různých
{
}
elementárních jevů E = E1 , E 2 ,..., E n . U každého z těchto jevů je stejná šance, že nastane. Proto každému z těchto elementárních jevů přiřadíme stejnou pravděpodobnost. Platí P (Ei ) = 1 n.
UPOZORNĚNÍ Pokud máme jev A, který není elementárním jevem, pak víme, že se skládá z několika různých elementárních jevů. Počet elementárních jevů, jejichž sjednocením je jev A označme nA. Platí:
P ( A) =
nA n
Pravděpodobnost jevu A tedy vůbec nezávisí na tom, které elementární jevy jej tvoří, ale závisí jen na počtu těchto jevů.
PŘÍKLAD 9.1 Jaká je pravděpodobnost, že při hodu dvěma vyváženými kostkami, padnou na obou z nich čísla větší než 4.
Řešení: Označme si padnutí dvou čísel větších než 4 jako jev A. Protože jsou kostky vyvážené, můžeme předpokládat, že padnutí každé uspořádané dvojice čísel je stejně pravděpodobné. Pokud bychom vypsali všechny možné dvojice čísel, které mohou padnout, dostaneme 6·6=36, protože se jedná o celkový počet možností, máme n=36. Čísla na každé kostce, která mohou padnout, aby byla splněna podmínka, jsou dvě (5 a 6). Tedy všech možností je celkem 2·2=4, tedy pro hledanou pravděpodobnost platí:
P ( A) =
4 1 = = 0 ,1 . 36 9
Pravděpodobnost padnutí dvou čísel větších než 4 je přibližně 11,1%.
80 | S t r á n k a
Potíž s použitím klasické definice pravděpodobnosti je v tom, že často nevíme, zda elementární jevy mají stejnou šanci a ve většině případů tomu skutečně tak není. Proto se tato definice pravděpodobnosti většinou používá v souvislosti s různými společenskými hrami (kostky, karty, ruleta) ovšem na děje, které nejsou uměle určeny tak, aby vyhovovaly této definici pravděpodobnosti, často musíme používat jiné způsoby přiřazování hodnot pravděpodobnosti. ÚLOHA 9.1 a) Krychle, jejíž všechny stěny jsou obarveny, je rozřezána na 1000 krychliček stejného objemu, které jsou smíchány v jedné nádobě. Jaká je pravděpodobnost, že krychlička náhodně vytažená z nádoby bude mít právě dvě obarvené stěny. b) Opakovaně házíme šestistěnnou kostkou. Určete pravděpodobnost, že hodíme šestku až po osmém hodu. c) V urně je pět bílých a tři černé kuličky. Dvakrát za sebou vytáhneme jednu kuličku. Jaká je pravděpodobnost, že aspoň jedna z vytažených kuliček je bílá, jestliže jde o výběr s vracením? d) V urně je pět bílých a tři černé kuličky. Dvakrát za sebou vytáhneme jednu kuličku. Jaká je pravděpodobnost, že obě dvě kuličky jsou bílé, jestliže jde o výběr bez vracení? e) Jaká musí být pravděpodobnost zásahu při jednom výstřelu , aby pro 4 výstřely platilo P(X=0)=P(X=1)?
9.3 Geometrická definice pravděpodobnosti Geometrická definice pravděpodobnosti je rozšířením klasické definice pravděpodobnosti. Jejím hlavním rozšířením je, že nepožaduje, aby byl počet různých elementárních jevů konečný nebo spočetný. Počet elementárních jevů může být nespočetný. Nespočetné množství elementárních jevů dostáváme právě v případech, kdy pracujeme se spojitou proměnnou. Jedná se tedy o přesné měření, určování polohy a podobně.
UPOZORNĚNÍ Geometrická definice předpokládá, že dokážeme všechny elementární jevy zakreslit do nějakého prostoru. Prostorem může být jednorozměrný prostor (přímka), dvourozměrný prostor (rovina), trojrozměrný prostor,....
Dále předpokládáme, že velikost tohoto prostoru (délka, obsah, objem,...) je konečná, označme ji V. Pokud chceme určit pravděpodobnost určitého jevu A, pak musíme určit velikost, kterou tento jev v prostoru zabírá označme ji VA. Pravděpodobnost jevu a pak vypočteme podobně jako u klasické pravděpodobnosti jako podíl velikosti jevu A ku velikosti celého prostoru.
P ( A) =
VA V
Tato pravděpodobnost má využití hlavně v případech kdy pravděpodobnost závisí na ploše území, vhodná velikosti výrobku zadané intervalem, a podobně.
PŘÍKLAD 9.2 Uprostřed zahrady o rozměrech 10*20m stojí sloup elektrického vedení. Na této zahradě byl zasazen strom. Nebyl zasazen blíže než 1 metr od středu sloupu. Určete pravděpodobnost, že strom není blíže než 3m od středu sloupu.
Řešení:
81 | S t r á n k a
Protože potřebujeme v tomto příkladu porovnávat velikosti obsahů jednotlivých pozemků, tak musíme použít geometrickou definici pravděpodobnosti. Potřebujeme tedy určit objem, který odpovídá všem možnostem, a poté objem, který odpovídá požadovaným možnostem. Nejdříve si nakreslíme náčrtek.
20
1 10 3
Nyní vidíme, že strom může být zasazen kdekoliv na pozemku mimo vnitřního kruhu. Obsah tohoto prostoru určíme jako obsah obdélníku, od kterého odečteme obsah kruhu s poloměrem 1.
V = 20 ⋅ 10 − π ⋅ 12 = 200 − π = 196 ,86 Podobně určíme část, kde strom stát může, aby vyhovoval kriteriu, že není blíž než 3 metry od sloupu. Tato část je opět obdélník bez kruhu, tentokrát má kruh poloměr 3m.
VA = 20 ⋅ 10 − π ⋅ 3 2 = 200 − 9π = 171,74 Nyní již dosadíme do vzorce a dostaneme požadovanou pravděpodobnost.
V 171,74 P ( A) = A = = 0,8723 . V 196 ,86 Pravděpodobnost, že strom bude dál než 3 metry od sloupu je 87,23%.
ÚLOHA 9.2 a) Oblast o rozloze 10 km2 je ostřelována s rovnoměrným rozdělením bodů dopadu střel. Uvnitř oblasti náhodně vybereme území o rozloze 0,5 km2. Určete pravděpodobnost, že na zvolené území dopadne příští výstřel. b) Na úsečce délky l0 se náhodně zvolí dva body. Jaká je pravděpodobnost, že jejich vzdálenost bude menší než 3? Nápověda: nakreslete si všechny možnosti jako obdélník o straně 10 a v něm zakreslete ty, kdy jsou body blíž než 3.
9.4 Statistická definice pravděpodobnosti Oproti klasické a geometrické definici pravděpodobnosti, které vycházejí z předpokladu, že pravděpodobnost každého elementárního jevu je stejná, vychází statistická definice pravděpodobnosti z reálně absolutní četnosti výskytu náhodného jevu. Při použití statistické pravděpodobnosti musíme provést určitý počet pokusů, jako vždy jej označíme n, při těchto pokusech budeme počítat absolutní četnost výskytu sledovaného náhodného jevu A, tuto četnost označíme na. Pravděpodobnost jevu A pak určíme takto:
82 | S t r á n k a
P( A) =
nA n
Pokud bychom výsledky pokusu zaznamenávali a hodnoty označili proměnnou x, pak jev A by byl jednou z obměn této proměnné. Samozřejmě pouze v případě, že by jev A byl elementárním jevem, v opačném případě by jev A byl tvořen několika obměnami proměnné x.
UPOZORNĚNÍ Pravděpodobnost náhodného jevu A se podle statistické definice rovná relativní četnosti obměny A nebo součtu relativních četností obměn tvořících náhodný jev A.
Statistická pravděpodobnost tedy přibližně určuje šanci výskytu jevu A. Ovšem není nijak v rozporu s klasickou nebo geometrickou pravděpodobností. Ve statistické pravděpodobnosti mohou vycházet jiná čísla než ve zbylých dvou pravděpodobnostech, ale pokud náhodný jev splňuje klasickou nebo geometrickou pravděpodobnost, tak při velkém množství pokusů se bude statistická pravděpodobnost stále více blížit ke klasické a geometrické pravděpodobnosti.
UPOZORNĚNÍ Hlavním rozdílem mezi statistickou a klasickou (geometrickou) pravděpodobností tedy je, že u klasické pravděpodobnosti určujeme pravděpodobnost a poté provádíme pokusy, u kterých předpokládáme, že je jistá šance na určitý výsledek, zatímco u statistické pravděpodobnosti nejdříve provádíme pokusy a z nich určujeme pravděpodobnost.
PŘÍKLAD 9.3 Z dotazování vzorku 50ti českých společností, jsme získaly tyto počty zaměstnanců. Odhadněte pravděpodobnost, že náhodně vybraná společnost v ČR bude mít méně než 10 zaměstnanců.
7 5 5 1 16
5 6 2 3 14
10 3 1 8 5
4 5 3 7 2
8 3 4 5 13
3 6 8 1 1
1 1 4 4 8
3 1 2 11 15
1 5 7 2 2
4 11 2 4 12
Řešení: Protože máme naměřené hodnoty, ze kterých máme určit pravděpodobnost, využijeme statistikou definici pravděpodobnosti. Spočítáme tedy, kolik společností splňuje podmínku, tedy kolik jich má méně než 10 zaměstnanců. Těchto společností je 39.
n A 39 ( ) P A = = = 0,78 . Hledaná pravděpodobnost tedy je n 50 ÚLOHA 9.3 Tabulka udává denní tržby za posledních 30 dnů. Máme spočítáno, že pokud je denní tržba menší než 3000, pak jsme ve ztrátě. Určete z dostupných údajů, jaká je pravděpodobnost, že budeme následující den ve ztrátě. 2135 4925 3252 1008 1230 3266 1041 1924 2749 1277 2501 2687 7568 8778 1009 5529 7500 4113 2801 4635 5658 4472 7293 1674 1118 2239 1680 5343 8877 7001
83 | S t r á n k a
10 VLASTNOSTI PRAVDĚPODOBNOSTI CÍL V této kapitole se seznámíme, s podmíněnými pravděpodobnostmi, jejich významem a způsoby jejich výpočtu. Dále budou popsány nezávislé jevy a postupy jak určit pravděpodobnost sjednocení jevů a průniku jevů.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 60 minut PROCVIČOVÁNÍ: 120 minut
10.1 Podmíněná pravděpodobnost Podmíněnou pravděpodobnost řešíme v případě, kdy víme, že nastane některý z jevů, a zajímá nás jaká je pravděpodobnost, že zároveň s ním nastane další jev. Máme tedy dva náhodné jevy A a B, a zajímá nás pravděpodobnost, že nastane jev A za předpokladu výskytu náhodného jevu B. Jinými slovy můžeme říct, že nás zajímá jaká část jevu B odpovídá průniku jevů A a B. Tuto pravděpodobnost značíme
P( A B) a čteme "podmíněná pravděpodobnost
náhodného jevu A za předpokladu, že nastane náhodný jev B". Jev B nemůže být nemožným jevem, jak plyne z definice, neboť nemožný jev není náhodným jevem.
( )
Podmíněnou pravděpodobnost vypočítáme podle vzorce: P A B =
P( A ∩ B ) . P (B )
UPOZORNĚNÍ Výsledná pravděpodobnost opět nabývá hodnot od 0 do 1. Pokud je
P( A B ) = 0 , pak to znamená, P( A ∩ B ) = 0 , naopak pokud platí P ( A B ) = 1
P( A ∩ B ) = B .
je
Podmíněná pravděpodobnost se také využívá k výpočtům hodnoty průniku dvou náhodných jevů, neboť pro nás může být mnohem lehčí vypočítat pravděpodobnost náhodného jevu B, a podmíněnou pravděpodobnost
P ( A B ) , než pravděpodobnost průniku těchto jevů. Pak můžeme využít jeden z
následujících vzorců.
P ( A ∩ B ) = P ( A B )⋅ P (B ) P ( A ∩ B ) = P (B A)⋅ P ( A)
PŘÍKLAD 10.1 V bedně s 8 výrobky je buď jeden, nebo dva vadné výrobky. Pravděpodobnost těchto dvou možností je totožná. Určete podmíněnou pravděpodobnost, udávající jaká je šance, že pokud máme bednu a je v ní jeden vadný výrobek a náhodně vybereme 5 výrobků, tak tyto výrobky budou v pořádku. Podobně určete pravděpodobnost vytažení pěti funkčních výrobků za předpokladu, že máme bednu, ve které jsou dva vadné výrobky.
Řešení: Označme jako B1 jev značící to, že máme bednu, která obsahuje 1 vadný výrobek a B2 bude značit, že máme bednu obsahující dva vadné výrobky. Jev A bude výběr 5-ti výrobků, které jsou v pořádku. 84 | S t r á n k a
Máme určit podmíněnou pravděpodobnost, udávající šanci, že vybereme 5 funkčních výrobků, pokud máme bednu obsahující jeden vadný výrobek.
7 7! 5 = 5!⋅2! = 21 = 0,375 P (A | B1 ) = 8! 56 8 5 5!⋅3! Pravděpodobnost výběru 5-ti funkčních výrobků, za předpokladu, že máme bednu obsahující 8 výrobků, z nichž je jeden vadný je 37,5%. Podobně určíme druhou podmíněnou pravděpodobnost.
6 6! 5 = 5!⋅1! = 6 = 0,107143 P ( A | B2 ) = 8! 56 8 5 5!⋅3! Pravděpodobnost výběru 5-ti funkčních výrobků, za předpokladu, že máme bednu obsahující 8 výrobků, z nichž jsou dva vadné je 10,07%.
ÚLOHA 10.1 Ve skupině 20 studentů, kteří přišli na zkoušku, je 8 připravených výborně, 6 dobře, 4 průměrně a 2 špatně. Ke zkoušce je připraveno 40 otázek. Student připravený výborně může odpovědět na všechny otázky, dobře na 35, průměrně na 25 a špatně pouze na 10. Určete, s jakou pravděpodobností odpoví správně student, který je připraven dobře, na 3 náhodně zvolené otázky.
10.2 Nezávislé náhodné jevy
(
)
( ) ( )
Náhodné jevy A a B nazveme nezávislé jevy, jestliže platí P A ∩ B = P A ⋅ P B . Důvod proč zrovna tato rovnost značí, že jsou tyto jevy nezávislé, je dobře vidět z následujících rovností:
P( A B ) =
P( A ∩ B ) P( A) ⋅ P(B ) = = P( A) P (B ) P (B )
UPOZORNĚNÍ Vidíme, že podmíněná pravděpodobnost jevu A za předpokladu, že nastane jev B, je stejná jako pravděpodobnost nastání jevu A. Takže jev A tvoří stejnou část jevu B jako jistého jevu E. Šance, že tento jev nastane, se tedy nesnižuje ani nezvyšuje, pokud nastane jev B, a proto říkáme, že jev A nezávisí na jevu B.
Podobně platí rovnost pro opačnou podmíněnou pravděpodobnost.
P(B A) =
P ( A ∩ B ) P ( A) ⋅ P ( B ) = = P (B ) . P ( A) P ( A)
Pokud se na to podíváme z pohledu geometrické pravděpodobnosti, tak to vlastně znamená, že poměr, části prostoru tvořeného náhodným jevem A a velikostí celého prostoru tvořeného jistým jevem E, je stejný jako poměr tvořený průnikem náhodných jevů A a B a náhodným jevem B. Tento stav si můžeme zakreslit pomocí Vennových diagramů.
85 | S t r á n k a
Jako O(A) značíme obsah obrazce značícího jev A.
Pokud jsou jevy A a B nezávislé, pak platí
O( A) O( A ∩ B ) = . O(E ) O(B )
PŘÍKLAD 10.2 Ze 200 ložisek je 130 první jakosti a 70 druhé jakosti. Z ložisek první jakosti bylo 80 vyrobeno na prvním stroji a 50 na druhém stroji, z ložisek druhé jakosti bylo 40 vyrobeno na prvním stroji a 30 na druhém stroji. Jev A představuje náhodné vybrání ložiska první jakosti a jev B náhodné vybrání ložiska vyrobeného na prvním stroji. Určete, zda jsou jevy A a B nezávislé.
Řešení: Nejdříve musíme určit pravděpodobnosti jevů A a B. Pravděpodobnost jevu A je pravděpodobnost, že náhodně vybereme ložisko první jakosti. Protože máme 80 ložisek první jakosti vyrobených na prvním stroji, 50 vyrobených na druhém stroji a vybíráme celkem z 200 ložisek, dostáváme
P ( A) =
80 + 50 = 0 ,65. 200
Obdobně dostaneme pravděpodobnost B. Na prvním stroji bylo vyrobeno 80 ložisek první jakosti a 40 ložisek druhé jakosti, proto máme
P (B ) =
80 + 40 = 0 ,6. 200
Poté určíme pravděpodobnost průniku těchto jevů. Počet ložisek, které jsou první jakosti a zároveň jsou vyrobeny na prvním stroji, je 80.
P( A ∩ B ) =
80 = 0 ,4 200
Zbývá nám ověřit platnost rovnosti P( A ∩ B ) = P( A) ⋅ P(B ) .
P( A) ⋅ P(B ) = 0 ,6 ⋅ 0 ,65 = 0 ,39 ≠ 0 ,4 = P( A ∩ B )
Jevy A a B tedy nejsou nezávislé.
UPOZORNĚNÍ Pojem nezávislých náhodných jevů můžeme rozšířit na více než dva jevy. O n náhodných jevech A1 , A2 ,..., An řekneme, že jsou nezávislé, jestliže pro každou podmnožinu těchto jevů platí, že pravděpodobnost jejich průniku je součinem jejich pravděpodobností.
86 | S t r á n k a
Pokud tedy pro každou množinu jevů
A j 1 , A j 2 ,..., A jk
A1 , A2 ,..., An
vybraných z jevů
platí
P ( A j 1 ∩ A j 2 ∩ ... ∩ A jk ) = P (A j 1 )⋅ P (A j 2 )⋅ ... ⋅ P (A jk ) , jsou jevy A1 , A2 ,..., An nezávislé.
UPOZORNĚNÍ Tyto rovnosti je tedy třeba kontrolovat pro všechny dvojice jevů, trojice jevů, čtveřice jevů, atd. Nestačí zkontrolovat jen jednu rovnost.
ÚLOHA 10.2 Čtyři muži A, B, C a D si po příchodu do místnosti odložili své klobouky na věšák. Když odcházeli, každý si vzal (po řadě muž A, muž B, muž C a muž D) náhodně (bez vracení) jeden klobouk. Označme jako jevy A,B,C,D, že má daný muž svůj klobouk. Ověřte zda jsou tyto jevy nezávislé.
10.3 Pravidlo o sčítání pravděpodobností Pravděpodobnost sjednocení dvou náhodných jevů A a B je rovna součtu jejich pravděpodobností, od kterého odečteme pravděpodobnost průniku jevů A a B.
P( A ∪ B) = P( A) + P(B) − P( A ∩ B)
Pro pravděpodobnost sjednocení n náhodných jevů
A1 , A2 ,..., An
P ( A1 ∪ A2 ∪ ... ∪ An ) = ∑ P ( Ai ) − ∑ P (Ai ∩ A j ) + n
n
i −1
i< j
−
∑ P (A ∩ A n
i < j
i
platí následující vztah:
∑ P (A ∩ A n
i < j
i
∩ Al ∩ Ak ) + ... + (− 1)
j
n −1
j
∩ Al ) − ⋅ P ( A1 ∩ A2 ∩ ... ∩ An )
87 | S t r á n k a
UPOZORNĚNÍ Pokud tedy potřebujeme vypočítat pravděpodobnost sjednocení několika náhodných jevů, pak musíme vypočítat pravděpodobnosti všech možných průniků. Po vypočítání pravděpodobností průniků dvou, tří čtyř,... jevů sečteme pravděpodobnosti jednotlivých jevů a pak odečteme pravděpodobnosti průniků dvou jevů. Dále přičteme pravděpodobnosti průniků tří jevů a odečteme pravděpodobnosti průniků čtyř jevů. Tímto způsobem postupujeme dále, dokud nezapočítáme všechny možné průniky. Při počítání nám stačí si uvědomit že průniky sudého počtu náhodných jevů odečítáme a průniky lichého počtu přičítáme.
Toto pravidlo je v případě disjunktního systému jevů mnohem jednodušší, a to z toho důvodu, že průniky všech jevů jsou prázdné a jejich pravděpodobnost je tedy 0. Pravidlo pak vypadá následovně: n
P ( A1 ) ∪ ( A2 ) ∪ ... ∪ P ( An ) = ∑ P ( Ai ) = P ( A1 ) + P ( A2 ) + P ( A3 ) + ... + P ( An ) . i =1
Jedná se vlastně o obměnu kombinatorického pravidla součtu.
10.4 Pravidlo o násobení pravděpodobností Pravidlo o násobení pravděpodobností využijeme v případě, kdy potřebujeme vypočítat průnik náhodných jevů. U dvou náhodných jevů se jedná o vzorec, který je již zmíněn v části o podmíněné pravděpodobnosti.
P( A1 ∩ A2 ) = P( A1 ) ⋅ P( A2 A1 )
Pokud toto pravidlo rozšíříme na více náhodných jevů vzorec:
A 1 , A 2 ,..., A n
dostaneme následující
P ( A1 ∩ A2 ∩ ... ∩ An ) = P ( A1 ) ⋅ P ( A2 A1 ) ⋅ P ( A3 A1 ∩ A2 ) ⋅ P ( A4 A1 ∩ A2 ∩ A3 ) ⋅ ... ... ⋅ P ( An A1 ∩ A2 ∩ A3 ∩ ... ∩ An −1 )
UPOZORNĚNÍ Při výpočtu pravděpodobnosti průniku n jevů tedy postupujeme tak, že nejdříve vypočítáme pravděpodobnost prvního náhodného jevu. Poté vypočítáme pravděpodobnost druhého jevu za předpokladu, že první jev již nastal. Dále spočítáme pravděpodobnost třetího jevu za předpokladu, že nastaly předchozí dva. Tímto způsobem postupně vypočítáme všechny činitele a získáme pravděpodobnost průniku všech těchto jevů. Toto pravidlo je velmi podobné kombinatorickému pravidlu součinu. V kombinatorice jsme museli počítat počet možností dalšího členu, až po tom co byl zvolen předchozí člen, který nám mohl počet možností omezit.
V případě, kdy jsou všechny uvažované jevy vyjádření pravděpodobnosti jejich průniku.
A1 , A2 ,..., An
nezávislé, dostaneme příjemnější
P( A1 ∩ A2 ∩ ... ∩ An ) = P( A1 ) ⋅ P( A2 ) ⋅ P ( A3 ) ⋅ P ( A4 ) ⋅ ... ⋅ P( An ) .
10.5 Úplná pravděpodobnost Pokud máme úplný systém disjunktních náhodných jevů
B1 , B2 , B3 ,..., Bn , nazýváme tyto jevy
hypotézy. Pak libovolný jev A může nastat jen ve spojení s některým z jevů
Bi .
Pravděpodobnost náhodného jevu A pak můžeme určit pomocí vzorce pro úplnou pravděpodobnost. 88 | S t r á n k a
P( A) = P( A ∩ B1 ) + P( A ∩ B2 ) + ... + P( A ∩ Bn )
Bi můžeme vypočítat jako P( A ∩ Bi ) = P(Bi ) ⋅ P( A Bi ) .
Každý z průniků jevů
A
Pravděpodobnost jevu
A tedy můžeme určit podle tohoto vzorce:
a
.
P ( A ) = ∑ P (Bi ) ⋅ P ( A Bi ) n
i =1
PŘÍKLAD 10.3 Při dopravě do školy student volí mezi třemi způsoby dopravy. Může je autem, autobusem, či jít pěšky. Pravděpodobnost, že si zvolí jízdu autem je 40% a autobusem 35%. Pravděpodobnost, že dorazí pozdě, pokud jede autem je 5%, autobusem 10% a pěšky 12%. Jaká je pravděpodobnost, že student přijde pozdě?
Řešení: Různé možnosti způsobu dopravy pokrývají celý prostor elementárních jevů a jsou navzájem disjunktní (nepředpokládáme, že by student použil najednou více způsobů dopravy). Způsoby dopravy tedy tvoří úplný systém disjunktních jevů, které si označíme následovně. B1- student použije auto B2- student použije autobus B3- student půjde pěšky Dále si označme jako jev A to že student přijde pozdě. Pravděpodobnosti těchto jevů pak jsou:
P(B1 ) = 0 ,4
P(B2 ) = 0 ,35
P(B3 ) = 0 ,25
Ze zadání víme, že pokud jede autem, je pravděpodobnost, že přijde pozdě 5%. Jedná se o podmíněnou pravděpodobnost a tak P A B1 = 0 ,05.
( ) Obdobně dostáváme P( A B ) = 0 ,1 a P( A B ) = 0 ,12. 2
3
Pro výpočet pravděpodobnosti že student přijde pozdě, pokud předem nevíme, jaký prostředek použije, využijeme úplné pravděpodobnosti.
P ( A ) = ∑ P (Bi ) ⋅ P (A Bi ) = 0 ,4 ⋅ 0 ,05 + 0 ,35 ⋅ 0 ,1 + 0 ,25 ⋅ 0 ,12 = 0 ,085 n
i =1
Pravděpodobnost, že student přijde pozdě je 8,5%.
89 | S t r á n k a
ÚLOHA 10.3 Ve skupině 20 studentů, kteří přišli na zkoušku, je 8 připravených výborně, 6 dobře, 4 průměrně a 2 špatně. Ke zkoušce je připraveno 40 otázek, z nichž každý student dostane tři náhodně vybrané otázky. Student připravený výborně může odpovědět na všechny otázky, dobře na 35, průměrně na 25 a špatně pouze na 10. Určete pravděpodobnost, že náhodně vybraný student odpoví správně na všechny ze tří zadaných otázek.
10.6 Bayesova věta Bayesovu větu používáme v případě, kdy neznáme podmíněnou pravděpodobnost jevu za předpokladu, že nastane jev Bayesova vzorce:
A . Tuto pravděpodobnost pak můžeme vypočítat pomocí
P ( A ∩ Bi ) P (Bi ) ⋅ P ( A Bi ) = = P( A) P( A)
P (Bi A ) =
Bi
P (B i ) ⋅ P ( A B i )
∑ P (B )⋅ P (A B ) n
j =1
j
j
PŘÍKLAD 10.4 Při dopravě do školy student volí mezi třemi způsoby dopravy. Může je autem, autobusem, či jít pěšky. Pravděpodobnost že si zvolí jízdu autem je 40% a autobusem 35%. Pravděpodobnost, že přijede pozdě, pokud jede autem je 5%, autobusem 10% a pěšky 12%. Jestliže student přišel pozdě, jaká je pravděpodobnost, že jel autobusem?
Řešení: Označíme si jevy stejně jako v příkladu 10.3. B1- student použije auto B2- student použije autobus B3- student půjde pěšky A - student přijde pozdě. Pravděpodobnosti těchto jevů jsou:
P(B1 ) = 0 ,4 P(B2 ) = 0 ,35 P(B3 ) = 0 ,25 a P( A) = 0 ,085
Ze zadání také známe podmíněné pravděpodobnosti
P(A B1 ) = 0 ,05 P( A B2 ) = 0 ,1 P(A B3 ) = 0 ,12
Protože víme, že studen přišel pozdě a zajímá nás jaká je v takovém případě pravděpodobnost, že student jel do školy autobusem, potřebujeme určit podmíněnou pravděpodobnost P B2 A . K tomu využijeme Bayesovu větu.
(
)
P (B2 A ) =
P (B2 ) ⋅ P ( A B 2 ) P( A)
=
0 ,35 ⋅ 0 ,1 = 0 ,411765 0 ,085
Pokud student přišel pozdě je 41,1% pravděpodobnost že jel autobusem.
ÚLOHA 10.4 Ve skupině 20 studentů, kteří přišli na zkoušku, je 8 připravených výborně, 6 dobře, 4 průměrně a 2 špatně. Ke zkoušce je připraveno 40 otázek. Student připravený výborně může odpovědět na všechny otázky, dobře na 35, průměrně na 25 a špatně pouze na 10. Náhodně vybraný student odpověděl správně na všechny ze tří zadaných otázek. Určete pravděpodobnost, že je připraven dobře. 90 | S t r á n k a
11 NÁHODNÁ VELIČINA CÍL Kapitola čtenáře seznámí s pojmem rozdělení náhodné veličiny a způsoby jeho zápisu. Budou vysvětleny distribuční funkce, pravděpodobnostní funkce a hustota pravděpodobnosti, jejich vzájemné vztahy, převody jedné funkce na druhou a také použití jednotlivých funkcí.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 90 minut PROCVIČOVÁNÍ: 120 minut
Při provádění náhodných pokusů dostáváme různé výsledky podle druhu pokusu. Mohou to být slovní výsledky, číselné výsledky, nebo vícerozměrné výsledky. Nyní se budeme zabývat pokusy, jejichž výsledky jsou podmnožinou reálných čísel. Výsledky takového pokusu jsou hodnotou veličiny (proměnné), kterou nazýváme náhodná veličina.
UPOZORNĚNÍ Náhodné veličiny značíme velkými písmeny z konce abecedy (X, Y, Z) nebo jestliže zkoumáme víc náhodných veličin označujeme je X1, X2, X3,.... Hodnoty náhodných veličin pak značíme odpovídajícími malými písmeny.
Množina všech hodnot, kterých nabývá náhodná veličina, se nazývá prostor hodnot, někdy také definiční obor hodnot nebo výběrový prostor a značíme jej Ω . Rozlišujeme různé dva typy náhodných veličin: diskrétní (nespojité) - jsou takové náhodné veličiny, které nabývají pouze konečného nebo spočetného počtu hodnot. spojité (kontinuální) - tyto náhodné veličiny nabývají nespočetně mnoha bodů. Náhodné veličiny jsou velmi podobné statistickým proměnným a velmi podobně s nimi budeme pracovat.
11.1 Rozdělení náhodné veličiny U náhodných veličin nás budou zajímat pravděpodobnosti, které určují šanci nastoupení určitého jevu. U většiny náhodných veličin ovšem neplatí, že pravděpodobnost každé hodnoty nebo stejně širokého intervalu je stejná. Každá náhodná veličina má různě přiřazené pravděpodobnosti. Pravidlo, které náhodné veličině přiřazuje pravděpodobnosti, se nazývá zákon rozdělení náhodné veličiny nebo jen rozdělení náhodné veličiny. Určujeme celou řadu různých rozdělení náhodné veličiny, již dříve jsme se ve spojení se špičatostí zmínili o normálním rozdělení. Tato rozdělení se dají zobrazit pomocí křivky, která určuje jejich chování.
UPOZORNĚNÍ Rozdělení náhodné veličiny je obvykle popsáno pomocí matematické funkce. Pro popis rozdělení využíváme tři druhy funkcí. Prvním druhem je distribuční funkce, která se využívá jak pro diskrétní náhodné veličiny, tak pro spojité náhodné veličiny. Druhým druhem jsou pravděpodobnostní funkce, které můžeme použít pouze u diskrétních náhodných veličin. Posledním druhem je hustota pravděpodobnosti, kterou můžeme využívat pouze pro spojité náhodné veličiny.
91 | S t r á n k a
11.2 Distribuční funkce Distribuční funkce popisuje rozložení jak diskrétní, tak spojité náhodné veličiny. Distribuční funkci náhodné veličiny X značíme F(x).
UPOZORNĚNÍ Pro každé x je distribuční funkce F(x) číslo udávající pravděpodobnost, že náhodná veličina nabude hodnoty nejvýše x.
F (x ) = P( X ≤ x )
Graf distribuční funkce je vždy neklesající. Pokud máme diskrétní náhodnou veličinu, tak je tento graf tvořen úsečkami rovnoběžnými s osou x, někdy se takovému grafu říká schodišťový graf
Obrázek 18: Distribuční funkce diskrétní náhodné veličiny
U spojité náhodné veličiny je graf distribuční funkce také spojitý, tento graf je grafem některé matematické funkce.
Obrázek 19: Distribuční funkce spojité náhodné veličiny
Distribuční funkce náhodné veličiny F(x) nabývá hodnot z intervalu 0;1 . V případě spojité náhodné veličiny nabývá všech hodnot z tohoto intervalu.
UPOZORNĚNÍ
92 | S t r á n k a
(
Pravděpodobnost, že náhodná veličina nabývá hodnoty z intervalu x 1 ; x 2 , můžeme vypočítat jako rozdíl dvou hodnot distribuční funkce.
P(x1 < X ≤ x2 ) = F (x2 ) − F (x1 )
PŘÍKLAD 11.1 Určete hodnoty parametrů a a b tak, aby funkce F(x) byla distribuční funkcí náhodné veličiny X a platilo P(x = 8) = 3,0.
0 0 ,1 a F( x ) = 0 ,6 b 4 a − b + 0 ,2
x ∈ (− ∞ ,5 ) x ∈ 5 ,8 ) x ∈ 8 ,10 )
x ∈ 10 ,15 )
x ∈ 15 ,100 ) x ∈ 100 ,∞ )
Řešení: Z distribuční funkce vidíme, že se jedná o diskrétní veličinu (plyne z toho, že pokud funkci F(x) zakreslíme, dostáváme schodišťový graf.), která nabývá hodnot 5,8,10,15 a 100. Pro parametr a musí platit F (8 ) = P(x ≤ 8 ) = a.
Existují jen dvě hodnoty, které jsou menší nebo rovno 8, a to 5 a 8. Tedy jistě platí F (8 ) = F (5 ) + P( x = 8 ) = 0 ,1 + 0 ,3 = a. Z poslední rovnice dostáváme a = 0,4. Nyní využijeme jednu z důležitých vlastností distribuční funkce a to že hodnota distribuční funkce pro maximální hodnotu náhodné veličiny se rovná 1.
F ( 100 ) = 4 a − b + 0 ,2 = 4 ⋅ 0 ,4 − b + 0 ,2 = 1,8 − b = 1 Z této rovnice již určíme b = 0,8. Hledaná distribuční funkce tedy vypadá takto:
0 0 ,1 0 ,4 F( x ) = 0 ,6 0 ,8 1
x ∈ (− ∞ ,5 ) x ∈ 5 ,8 ) x ∈ 8 ,10 ) x ∈ 10 ,15 ) x ∈ 15 ,100 ) x ∈ 100 ,∞ )
ÚLOHA 11.1 Určete parametry a,b,c tak aby funkce F(x) zadaná tabulkou byla distribuční funkcí náhodné veličiny X. Jestliže víme P(x=2)=0,1 a P(x<4)=0,5. X 1 2 3 5 8 F(x) 0,1 a b 0,7 c
93 | S t r á n k a
PŘÍKLAD 11.2
Mějme náhodnou veličinu X zadanou distribuční funkcí F(x) = sin ( x )+ b , kde x ∈ ( 0 , a ) . Určete parametry a,b.
Řešení: Z distribuční funkce vidíme, že se jedná o spojitou proměnnou. Základní podmínky pro to, aby byla funkce distribuční funkcí náhodné veličiny X jsou totožné jako v případě diskrétní náhodné veličiny. Pokud dosadíme do distribuční funkce nejmenší hodnotu, v našem případě 0, tak musíme dostat 0. F(0) = sin (0 ) + b = 0 + b = b = 0 Parametr b se tedy rovná 0 a distribuční funkce má tvar F(x) = sin (x ) .
Další vlastností, kterou musí distribuční funkce splňovat je, že pokud dosadíme nejvyšší hodnotu tak se distribuční funkce bude rovnat 1. V našem případě to znamená: F(a) = sin (a ) = 1
Hledáme tedy všechny a pro které je sinus a roven jedné, a tak dostáváme
a=
π 2
+ 2kπ
K určení toho, která z těchto hodnot je hledaným maximem, využijeme poslední vlastnost distribuční funkce. Distribuční funkce musí být neklesající, ale o funkci sinus víme, že v intervalu od π/2 do 3π/2 je klesající a tak tento interval nemůže náležet do možných hodnot náhodné veličiny X. Ze všech hodnot, které jsme určili jako možné hodnoty parametru a nám tak zůstává jen ta nejmenší, tedy
a=
π 2
.
ÚLOHA 11.2 Určete hodnoty a a b tak, aby funkce F(x) = ax2 + b pro x∈(2;5) byla distribuční funkcí náhodné veličiny X.
11.3 Pravděpodobnostní funkce Pravděpodobnostní funkce je jiný způsob popisu diskrétní proměnné. Pravděpodobnostní funkce udává pravděpodobnost nastání určité hodnoty náhodné veličiny. Označujeme ji P(x).
Obrázek 20: Pravděpodobnostní funkce
94 | S t r á n k a
Součet všech jejích hodnot je číslo 1.
∑ P(x ) = 1
x∈Ω
P(x ) ≥ 0
Jedná se vždy o nezápornou funkci.
UPOZORNĚNÍ Pravděpodobnost, že náhodná veličina bude mít hodnotu z intervalu
x1 ; x 2
získáme součtem
pravděpodobností všech hodnot ležících v požadovaném intervalu. x2
P( x1 ≤ X ≤ x2 ) = P( x1 ) + P( x1 + 1) + P( x1 + 2 ) + ... + P( x2 ) = ∑ P( x ) x = x1
Pokud známe pravděpodobnostní funkci P(x), pak z ní můžeme určit distribuční funkci.
F (a ) =
∑ΩP(x )
x≤a ,x∈
Naopak z distribuční funkce můžeme určit pravděpodobnostní funkci P(x), tak že od hodnoty distribuční funkce F(x) odečteme hodnotu distribuční funkce předcházející obměny. Pokud si tuto sousední hodnotu označíme xp pak platí vztah
P (x ) = F ( x ) − F (x p ) .
PŘÍKLAD 11.3 Určete pravděpodobnostní funkci P(x) náhodné veličiny X, jestliže známe její distribuční funkci F(x). Dále určete následující pravděpodobnosti P(x=10), P(x<11) a P(5<x≤16).
x ∈ (− ∞,5) 0 0,1 x ∈ 5, 8) 0,4 x ∈ 8,10) F ( x) = 0,6 x ∈ 10,15) 0,7 x ∈ 15,100 ) 1 x ∈ 100, ∞ )
Řešení: Nejdříve musíme určit hodnoty, ve kterých je pravděpodobnostní funkce nenulová. Jedná se o ty hodnoty, ve kterých se distribuční funkce mění. Máme tedy Ω={5,8,10,15,100}. Určíme jednotlivé pravděpodobnosti, tak že vždy odečteme hodnoty distribuční funkce pro sousedící hodnoty veličiny X. P(5) = F (5) − 0 = 0,1
P(8) = F (8) − F (5) = 0,4 − 0,1 = 0,3 P(10) = F (10) − F (8) = 0,6 − 0,4 = 0,2 P(15) = F (15) − F (10) = 0,7 − 0,6 = 0,1 P(100) = F (100) − F (15) = 1 − 0,7 = 0,3 Nyní pro přehlednost sestavíme tabulku pravdivostní funkce. x
5
8
10
15
100
P(x) 0,1 0,3 0,2 0,1 0,3
95 | S t r á n k a
Pravděpodobnosti určíme z této tabulky pomocí součtu, nebo můžeme postupovat přímo z distribuční funkce. P(x=10)=P(10)=0,2 P(x<11)= P(5)+P(8)+P(10)=0,1+0,3+0,2=0,6 nebo P(x<11)= F(11)=0,6 P(6<x≤16) =P(8)+P(10)+P(15)=0,3+0,2+0,1=0,6 nebo P(6<x≤16)=F(16)-F(5)=0,7-0,1=0,6.
ÚLOHA 11.3 Určete pravděpodobnostní funkci P(x) náhodné veličiny X, jestliže její distribuční funkce F(x) je zadaná tabulkou níže. Poté určete pravděpodobnosti P(2≤x≤5) a P(x<4). X 1 2 3 5 8 F(x) 0,1 0,2 0,6 0,7 1
11.4 Hustota pravděpodobnosti Pro spojitou náhodnou veličinu můžeme k popisu pravděpodobnosti použít hustotu pravděpodobnosti. Hustota pravděpodobnosti je funkce označovaná f(x) a definovaná jako limita pravděpodobnosti, že spojitá náhodná veličina X nabude hodnoty z intervalu intervalu
∆x . f ( x ) = lim
∆x →0
(x; x + ∆x ) , kterou vydělíme délkou tohoto
F ( x + ∆x ) − F ( x ) P ( x < X < x + ∆x ) = lim ∆x → 0 ∆x ∆x
Obrázek 21: Hustota pravděpodobnosti
U hustoty pravděpodobnosti nám hodnota f(x) u konkrétní hodnoty x neřekne žádnou rozumnou informaci. Nedá se totiž říct, že pravděpodobnost nastání hodnoty x je určité kladné číslo. Důvodem je, že získání přesné hodnoty je téměř nemožné, spíše získáme nějakou hodnotu blízko námi zvolené hodnoty (při přesném měření). Z tohoto důvodu u spojité náhodné veličiny přiřazujeme pravděpodobnost nastání a rovnu nule.
P( X = a ) = 0
UPOZORNĚNÍ Z hustoty pravděpodobnosti můžeme určit pravděpodobnost, že hodnota náhodné veličiny X
(
)
bude ležet v intervalu x1 ; x2 . Tato pravděpodobnost je rovna velikosti obsahu obrazce hraničeného (plocha pod křivkou): osou x, přímkami
96 | S t r á n k a
x = x1 , x = x2 a hustotou pravděpodobnosti f(x).
Obrázek 22: Pravděpodobnost P(x1<X<x2)
Z matematiky vyučované v minulém roce víte, že tento obsah se dá vypočítat pomocí určitého integrálu následovně:
P( x1 < X < x2 ) =
x2
∫ f (x )dx = F (x ) − F (x ) 2
1
x1
Funkce F(x) ve vzorci značí distribuční funkci náhodné veličiny X.
UPOZORNĚNÍ Protože je pravděpodobnost konkrétního čísla definována jako 0, je jedno, zda okraje do intervalu patří či nepatří. Platí tedy následující rovnosti:
P(x1 < X < x2 ) = P( x1 ≤ X ≤ x2 ) = P( x1 ≤ X < x2 ) = P(x1 < X ≤ x2 ) .
Je tedy zřejmé, že obsah plochy pod křivkou, jejíž meze jsou určeny celým definičním oborem Ω musí mít pravděpodobnost 1. Pokud značíme
Ω = (a; b ) , pak platí b
P(a < X < b ) = ∫ f ( x )dx = F (b ) = 1 . a
Pravděpodobnost toho, že náhodná veličina bude náležet do jejího definičního oboru je tedy 1 a jedná se o jev jistý.
Obrázek 23: Pravděpodobnost P(X∈ ∈Ω )
97 | S t r á n k a
Hustota pravděpodobnosti je nečastější způsob určení pravděpodobnosti. Většinou se ovšem nepočítá pomocí integrálů, ale určí se která ze standardních křivek je našemu případu nejblíže a poté hodnoty hledáme v tabulkách rozložení pravděpodobnosti.
PŘÍKLAD 11.4 Určete hodnotu parametru a tak, aby funkce f(x) pro x∈(1;10) byla hustotou pravděpodobnosti. Určete distribuční funkci a následující pravděpodobnosti P(x≤5), P(3<x≤8), P(x>7).
f ( x ) = ax
Řešení: Protože je zadána hustota pravděpodobnosti je náhodná veličina X spojitá. Hustota pravděpodobnost má tu vlastnost, že určitý integrál od dolní meze prostoru hodnot po horní mez prostoru hodnot je roven jedné. V našem případě dostáváme tento výraz: 10
∫ 1
10
ax 2 f ( x)dx = ∫ axdx = = 50a − 0,5a = 49,5a = 1 2 1 1 1 a= 49,5 10
Hustota pravděpodobnosti je tedy funkce f ( x) =
x . 49,5
Distribuční funkci získáme integrováním hustoty pravděpodobnosti.
F ( x) = ∫ f ( x)dx = ∫
x x2 dx = +c 49,5 99
Nyní musíme určit hodnotu parametru c, což uděláme tak, že ověříme pro jaké c, se distribuční funkce dolní meze prostoru hodnot rovná nule.
F (1) =
1 +c =0 99
Hledaná distribuční funkce tedy je F ( x ) =
c=−
1 99
x2 1 − . 99 99
Pravděpodobnosti můžeme určit pomocí integrálu, nebo z distribuční funkce. 5
x2 x 25 1 P( x ≤ 5) = ∫ dx = = − = 0, 24 49,5 99 1 99 99 1 5
P ( x ≤ 5) = F (5) = 0, 24
8
x2 x 64 9 P( 3 < x ≤ 8 ) = ∫ dx = = − = 0 ,5 49 , 5 99 99 99 3 3 8
P( 3 < x ≤ 8 ) = F ( 8 ) − F ( 3 ) = 0 ,5 10
x2 x 100 49 P( x > 7 ) = ∫ dx = = − = 0 , 51 49 ,5 99 99 99 7 7 10
P( x > 7 ) = 1 − P( x ≤ 7 ) = 1 − F ( 7 ) = 0 , 51 ÚLOHA 11.4
98 | S t r á n k a
Určete hodnotu parametru a, tak aby funkce
ax 2 x pro x∈(0;5) byla hustotou − f ( x) = 100 50
pravděpodobnosti náhodné veličiny X. Určete distribuční funkci náhodné veličiny X. Určete pravděpodobnosti P(X>3), P(x≤4,5), P(1<x≤6).
12 CHARAKTERISTIKY NÁHODNÉ VELIČINY CÍL Cílem kapitoly je popsat různé charakteristiky, které jsme schopni vypočítat z distribuční funkce, hustoty pravděpodobnosti či pravděpodobnostní funkce. Většinou se jedná a tzv. momenty, které obecně vyjadřují vzorce pro výpočet různých charakteristik. V posledních dvou částech špitly jsou popsány také ostatní charakteristiky, které jsou buď z momentů odvozeny nebo jsou zcela speciální a počítají se úplně jiným způsobem.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 120 minut PROCVIČOVÁNÍ: 180 minut
Rozdělení náhodné veličiny podle některé funkce (Distribuční, Pravděpodobnostní, Hustota pravděpodobnosti), neudává kompletní obraz o chování náhodné veličiny. Z tabulky nebo funkce často nedokážeme určit, jak se náhodná veličina chová. Proto u náhodných veličin počítáme charakteristiky podobně jako u statistických proměnných. Tyto charakteristiky můžeme rozdělit do několika skupin: • Charakteristiky polohy - uvádějí střední hodnotu, kolem níž jsou rozděleny ostatní hodnoty náhodné veličiny.
•
Charakteristiky variability - tato hodnota nám určuje, jak velké rozdíly jsou mezi hodnotami náhodné veličiny a střední hodnotou. Charakteristiky šikmosti - určuje směr zešikmení náhodné veličiny.
• • Charakteristiky špičatosti - určuje míru nahuštění hodnot kolem střední hodnoty. • Charakteristiky náhodných veličin počítáme pomocí momentů. Vidíme, že se jedná o totožné charakteristiky, jako v případě náhodných proměnných, dále také uvidíme, že i výpočty těchto charakteristik jsou totožné. Rozlišujeme momenty tří druhů: • Obecné momenty • Centrální momenty • Normované momenty
12.1 Obecné momenty Obecné momenty jsou hodnoty počítané z pravděpodobnostní funkce nebo z hustoty pravděpodobnosti. Obecných momentů máme celou řadu, ale využívají se jen některé z nich. Označení pro r-tý obecný moment náhodné veličiny X je µ r′ ( X ) .
Pokud máme diskrétní náhodnou veličinu s pravděpodobnostní funkcí P ( X ) počítáme r-tý obecný moment podle vzorce:
µ r′ ( X ) = ∑ x r ⋅ P (x ) x
99 | S t r á n k a
U spojité proměnné je r-tý náhodný moment definován z její hustoty pravděpodobnosti f ( x ) a platí
µ r′ ( X ) =
∞
∫x
⋅ f ( x )dx
r
−∞
UPOZORNĚNÍ Jediným používaným obecným momentem je první obecný moment. Obecné momenty vyšších řádů se nepoužívají a místo nich se používají centrální nebo normované momenty. Obecný moment prvního řádu nazýváme střední hodnota náhodné veličiny.
V případě, kdy neznáme pravděpodobnostní funkci, hustotu pravděpodobnosti, ani distribuční funkci, můžeme místo obecných momentů počítat výběrové obecné momenty, ty počítáme z náhodné vybraných prvků náhodné veličiny. Samozřejmě se nejedná o přesnou statistiku náhodné veličiny, ale jde jen o odhad. Výběrový obecný moment značíme m′r ( X ) vypočítáme jej podle následujícího vzorce: n
mr′ ( X ) =
∑x i =1
r i
n
PŘÍKLAD 12.1 Funkce F(x)=ln(x) pro x∈(1,e) je distribuční funkcí náhodné veličiny X. Určete první a třetí obecný moment této veličiny.
Řešení: Abychom mohli určit jakékoliv momenty, musíme znát buď hustotu pravděpodobnosti, nebo pravděpodobnostní funkci. Protože je tato veličina spojitá, musíme získat hustotu pravděpodobnosti, která je derivací distribuční funkce.
f ( x ) = F ′( x ) = (ln( x ))′ =
1 x
Nyní můžeme vypočítat první obecný moment: e e 1 µ1′ = ∫ x ⋅ dx = ∫ 1dx = [x]1e = e − 1 x 1 1
První obecný moment se tedy rovná e − 1 =& 1,7. Třetí obecný moment určíme obdobně: e
e x3 1 e3 − 1 µ 3′ = ∫ x ⋅ dx = ∫ x 2 dx = = =& 18,683 x 3 3 1 1 1 e
3
PŘÍKLAD 12.2 Náhodná veličina X má rozdělení pravděpodobnosti dané tabulkou. x 0 1 2 3 P(x) 0,1 0,2 0,3 0,4 Určete první a čtvrtý obecný moment
Řešení: První obecný moment určíme podle vzorce
100 | S t r á n k a
µ 1′ ( X ) = ∑ x 1 ⋅ P ( x ) = 0 ⋅ 0 ,1 + 1 ⋅ 0 ,2 + 2 ⋅ 0 ,3 + 3 ⋅ 0 ,4 = 2 x
Čtvrtý obecný moment je obdobný
µ 4′ ( X ) = ∑ x 4 ⋅ P (x ) = 0 4 ⋅ 0 ,1 + 14 ⋅ 0 ,2 + 2 4 ⋅ 0 ,3 + 3 4 ⋅ 0 ,4 = 37 ,4 x
ÚLOHA 12.1 Určete první a třetí obecný moment náhodné veličiny X zadané a) F(x) = b)
x − 1 pro x∈(1;2) 2
x 1 2 3 4 5 F(x) 0,1 0,3 0,45 0,7 1
12.1.1 Střední hodnota Střední hodnota je hlavní charakteristika polohy náhodné veličiny. Místo pojmu střední hodnota se často používá očekávaná hodnota. Na rozdíl od charakteristik statistických proměnných mají náhodné veličiny jen jednu střední hodnotu.
UPOZORNĚNÍ
Střední hodnota náhodné veličiny se označuje E ( X ) nebo µ . Protože se jedná o obecný moment prvního řádu, tak platí:
E ( X ) = ∑ x ⋅ P( x )
pokud známe pravděpodobnostní funkci P( x ) diskrétní proměnné.
x
E(X ) =
∞
∫ x ⋅ f (x )dx pokud
−∞
f ( x ) je hustota pravděpodobnosti spojité proměnné.
Střední hodnota se uvádí v jednotkách náhodné proměnné. Střední hodnota má několik zajímavých vlastností: Střední hodnota konstanty je rovna této konstantě.
E (c ) = c
Střední hodnota součtu konstanty c a náhodné veličiny X je rovna součtu konstanty c a střední hodnoty náhodné veličiny X.
E (c + X ) = c + E ( X )
Střední hodnota součinu konstanty c a náhodné veličiny X je rovna součinu konstanty c a střední hodnoty náhodné veličiny X.
E (c ⋅ X ) = c ⋅ E ( X )
Střední hodnota součtu náhodných veličin X 1 , X 2 , X 3 ,..., X n je rovna součtu středních hodnot těchto veličin.
E ( X 1 + X 2 + ... + X n ) = E ( X 1 ) + E ( X 2 ) + ... + E ( X n )
101 | S t r á n k a
Střední hodnota součinu náhodných veličin X 1 , X 2 , X 3 ,..., X n je rovna součinu středních hodnot těchto veličin.
E ( X 1 ⋅ X 2 ⋅ ...⋅ X n ) = E ( X 1 ) ⋅ E ( X 2 ) ⋅ ...⋅ E ( X n )
UPOZORNĚNÍ V případě výběru prvků náhodné veličiny nemůžeme počítat střední hodnotu, ale počítáme výběrový průměr x . Výběrový průměr je první výběrový obecný moment proto platí: n
x=
∑x i =1
i
n
Vidíme tedy, že střední hodnota a výběrový průměr náhodných veličin jsou téměř totožné charakteristiky, jako byl aritmetický průměr statistického souboru.
12.2 Centrální momenty Centrální momenty náhodné veličiny X jsou obecné momenty náhodné veličiny X − E ( X ) . Jedná se tedy o hodnoty vztažené ke střední hodnotě. Označujeme µ r ( X ) jako r-tý centrální moment.
Pro diskrétní náhodné veličiny X je r-tý centrální moment µ r ( X ) určen vzorcem
µ r ( X ) = ∑ [x − E ( X )]r ⋅ P(x ) . x
U spojitých náhodných veličin je k jeho výpočtu opět potřeba integrál, platí tedy
µr (X ) =
∞
∫ [x − E ( X )]
r
⋅ f ( x )dx .
−∞
Pokud neznáme rozložení náhodných veličin, musíme opět přistoupit k výpočtu centrálních momentů z výběrové náhodné veličiny. Výběrový centrální moment, který takto získáme, značíme mk a platí n
mk =
∑ (x i =1
− x)
k
i
n
.
UPOZORNĚNÍ Vždy když ze zadání nebo jiného zdroje známe střední hodnotu, pak ji v předešlém vzorci můžeme použít místo výběrového průměru, protože výběrový průměr neposkytuje přesnou charakteristiku ale jen odhad, zatím co střední hodnota je přesnou charakteristikou náhodné veličiny.
PŘÍKLAD 12.3 1 Funkce f(x) = pro x∈(1,e) je hustotou pravděpodobnosti náhodné veličiny X. Určete první a x druhý centrální moment této veličiny.
Řešení: 102 | S t r á n k a
Z příkladu 12.1. víme, že E(X)=2,7, v případě že bychom tento údaj neznali, bylo by nutné nejdříve spočítat střední hodnotu. Nyní můžeme vypočítat první centrální moment: e
e
1 2 ,7 e µ1 = ∫ (x − 2 ,7 ) ⋅ dx = ∫ 1 − dx = [x − 2 ,7 ln( x )]1 = e − 2 ,7 − 1 = e − 3 ,7 x x 1 1 Druhý obecný moment určíme obdobně: e
e 2 x2 1 x − 5 ,4 x + 7 ,29 µ 2 = ∫ ( x − 2 ,7 ) ⋅ dx = ∫ dx = − 5 ,4 x + 7 ,29 ln( x ) = x x 2 1 1 1 e
2
=
e2 1 − 5 ,4 e + 7 ,29 − + 5 ,4 = 1,255. 2 2
PŘÍKLAD 12.4 Náhodná veličina X má rozdělení pravděpodobnosti dané tabulkou. x 0 1 2 3 P(x) 0,1 0,2 0,3 0,4 Určete první a druhý centrální moment
Řešení: Z příkladu 12.2. víme že E(X)=2, proto můžeme rovnou dosadit do vzorce
µ1 ( X ) = ∑ ( x − 2 ) ⋅ P (x ) = −2 ⋅ 0 ,1 − 1 ⋅ 0 ,2 + 0 ⋅ 0 ,3 + 1 ⋅ 0 ,4 = 0 x
Obdobně určíme druhý centrální moment
µ 2 ( X ) = ∑ ( x − 2 )2 ⋅ P ( x ) = 4 ⋅ 0 ,1 + 1 ⋅ 0 ,2 + 0 ⋅ 0 ,3 + 1 ⋅ 0 ,4 = 1 x
ÚLOHA 12.2 Určete druhý a třetí centrální moment náhodné veličiny X zadané a) f(x) = 2x pro x∈(0;1) b)
x 1 2 3 4 5 P(x) 0,1 0,2 0,15 0,25 0,3
12.2.1 Rozptyl Rozptyl je nejčastěji používaný centrální moment, často pro něj používáme i pojmy variace či disperze. Rozptyl náhodné veličiny X značíme D( X ) nebo σ 2 a jedná se o druhý centrální moment náhodné veličiny X. Rozptyl udáváme v mocninách jednotky náhodné veličiny. Pro diskrétní náhodnou veličinu je tedy rozptyl roven D ( X ) =
∑ [x − E ( X )]
2
⋅ P (x ) .
x
U spojité náhodné veličiny je roven D ( X ) =
∞
∫ [x − E ( X )]
2
⋅ f ( x )dx .
−∞
UPOZORNĚNÍ V případě, že vycházíme z výběru prvků náhodné veličiny, tak počítáme výběrový rozptyl s′x , který vypočítáme stejně jako u statistické proměnné, tedy 2
103 | S t r á n k a
n
s′x = 2
∑ (x − x ) i =1
n −1
. Když známe střední hodnotu, můžeme ji použít místo výběrového průměru.
Rozptyl má několik vlastností, jejichž znalost nám může urychlit jeho výpočet. Rozptyl náhodné veličiny je vždy nezáporný.
D( X ) ≥ 0
Rozptyl konstanty se rovná nule.
D(c ) = 0
Rozptyl součtu konstanty c a náhodné veličiny X je roven součtu konstanty c a rozptylu náhodné veličiny X.
D(c + X ) = c + D( X )
Rozptyl součinu konstanty c a náhodné veličiny X je roven součinu druhé mocniny konstanty c a rozptylu náhodné veličiny X.
D(c ⋅ X ) = c 2 ⋅ D( X ) Rozptyl součtu náhodných veličin X 1 , X 2 , X 3 ,..., X n je roven součtu rozptylů těchto veličin.
D( X 1 + X 2 + ... + X n ) = D( X 1 ) + D( X 2 ) + ... + D( X n ) UPOZORNĚNÍ Rozptyl náhodné veličiny X můžeme vyjádřit jako střední hodnotu čtverce náhodné veličiny X od které odečteme čtverec střední hodnoty.
( )
D( X ) = E X 2 − [E ( X )]
2
Rozptyl je tedy druhý obecný moment od kterého odečteme mocninu prvního obecného momentu.
12.3 Normované momenty Ve statistice je často potřebná normovaná náhodná veličina. Jedná se o statistickou veličinu, která má střední hodnotu 0 a rozptyl 1. Získáme ji normováním libovolné náhodné veličiny X. Normovanou náhodnou veličinu označujeme U a platí:
U=
X − E(X ) D( X )
.
Normovaná náhodná veličina má také stejné obecné a centrální momenty stejného řádu µ r′ ( X ) = µ r ( X ) .
UPOZORNĚNÍ Normované momenty jsou právě momenty počítané z normované proměnné. Takže r-tý normovaný moment je roven:
µ r′ (U ) = µ r (U ) =
[
µr (X ) D( X )
]
r
Z normovaných momentů jsou důležité hlavně třetí a čtvrtý normovaný moment.
104 | S t r á n k a
12.3.1 Šikmost Šikmost udává umístění hodnot vzhledem k průměru. Koeficient šikmosti se počítá jako třetí normovaný moment a značí se γ 1 ( X ) .
γ 1 ( X ) = µ 3 (U ) =
[
µ3 ( X ) D( X )
]
3
UPOZORNĚNÍ Koeficient šikmosti náhodné veličiny odpovídá koeficientu šikmosti statistické proměnné. Jeho interpretace je také totožná. Pokud je koeficient šikmosti roven nule (blízko nuly), pak se jedná o symetrické rozdělení náhodné veličiny. Pokud je koeficient šikmosti kladný, pak se jedná o kladně zešikmené rozdělení náhodné veličiny. Pokud je koeficient šikmosti záporné číslo, říkáme, že máme záporně zešikmené rozdělení náhodné veličiny.
12.3.2 Špičatost Špičatost je udávána koeficientem špičatosti, který se počítá jako čtvrtý normovaný moment zmenšený o tři. Značíme jej γ 2 ( X ) a platí
γ 2 ( X ) = µ 4 (U ) − 3 =
[
µ4 (X ) D( X )
]
4
−3.
UPOZORNĚNÍ Normální rozdělení má koeficient špičatosti roven nule. Kladný koeficient špičatosti nám pak udává, že rozdělení náhodné veličiny X je špičatější než normální rozdělení. Naopak záporný koeficient špičatosti udává, že rozdělení náhodné veličiny je plošší než normální rozdělení.
PŘÍKLAD 12.5 1 Funkce f(x) = pro x∈(1,e) je hustotou pravděpodobnosti náhodné veličiny X. Určete koeficient x šikmosti a špičatosti této veličiny.
Řešení: Z příkladů 12.1. a 12.3. víme, že E(X)=2,7 a D(X)=1,255, v případě že bychom tyto údaje neznali, bylo by nutné nejdříve spočítat střední hodnotu. Koeficient šikmosti je třetí normovaný moment, takže použijeme vzorec:
γ 1 ( X ) = µ 3 (U ) =
[
µ3 ( X ) D( X )
]
3
Nejdříve určíme třetí centrální moment:
105 | S t r á n k a
1 x 3 − 8 ,1x 2 + 21,87 x − 19 ,683 µ 3 = ∫ ( x − 2 ,7 ) ⋅ dx = ∫ dx = x x 1 1 e
e
3
e
x3 x2 e3 e2 1 8 ,1 − 8 , 1 + 21 , 87 x − 19 , 683 ln( x ) = − 8 , 1 + 21,87 e − 19 ,683 − + − 21,87 = 3 2 2 3 2 1 3 = -1,9175. Ten poté dosadíme do vzorce a dostaneme koeficient špičatosti.
γ 1 (X ) =
- 1,9175 1,255
3
=
- 1,9175 = -1,36386 1,405936
Rozdělení této veličiny je tedy záporně zešikmené. Koeficient špičatosti určíme obdobně, nejdříve spočítáme čtvrtý centrální moment, které k výpočtu potřebujeme. e
x 4 − 10 ,8 x 3 + 43,74 x 2 − 78,732 x + 53,1441 dx = x
e
µ 4 = ∫ ( x − 2 ,7 )4 ⋅ dx = ∫ 1 x
1
1
e
x x x − 10 ,8 + 43,74 − 78,732 x + 53,1441ln( x ) = 2,28059. 3 2 4 1 4
3
γ 2 (X ) =
2
[
µ4 ( X ) D( X )
]
4
−3 =
2,28059 1,255
4
− 3 = 1,448 − 3 = −1,552
Náhodná veličina má plošší rozdělení než normované normální rozdělení.
PŘÍKLAD 12.6 Náhodná veličina X má rozdělení pravděpodobnosti dané tabulkou. x 0 1 2 3 P(x) 0,1 0,2 0,3 0,4 Určete šikmost a špičatost této veličiny
Řešení: Z příkladů 12.2. a 12.4. víme že E(X)=2 a D(X)=1, proto můžeme rovnou dosadit do vzorce
µ 3 ( X ) = ∑ ( x − 2 )3 ⋅ P (x ) = −8 ⋅ 0 ,1 − 1 ⋅ 0 ,2 + 0 ⋅ 0 ,3 + 1 ⋅ 0 ,4 = −0 ,6 x
Koeficient šikmosti se tedy rovná
γ 1 (X ) =
- 0,6 1
3
= −0 ,6 a náhodná veličina tedy je
mírně záporně zešikmená. Obdobně určíme koeficient špičatosti
µ 4 ( X ) = ∑ ( x − 2 )4 ⋅ P (x ) = 16 ⋅ 0 ,1 + 1 ⋅ 0 ,2 + 0 ⋅ 0 ,3 + 1 ⋅ 0 ,4 = 2 ,2 x
γ 2 (X ) =
2,2 1
3
− 3 = −0 ,8
Náhodná veličina X je tedy plošší než veličina, která má normované normální rozdělení
ÚLOHA 12.3 106 | S t r á n k a
Určete šikmost a špičatost náhodné veličiny X zadané a) f(x) = 2x pro x∈(0;1)
b)
x 1 2 3 4 5 P(x) 0,1 0,2 0,15 0,25 0,3
12.4 Charakteristiky polohy Kromě již vysvětlené střední hodnoty, počítáme u náhodné veličiny i další charakteristiky polohy. Nejčastěji se počítají kvantily. Kvantil je hodnota náhodné veličiny, která rozděluje ostatní hodnoty v daném poměru. Kvantily nejlépe vypočítáme z distribuční funkce. Je rozdíl mezi výpočtem kvantilu u diskrétní proměnné a spojité proměnné. 100 ⋅ p% kvantilem náhodné veličiny X rozumíme hodnotu xp, která splňuje následující nerovnosti.
UPOZORNĚNÍ Pokud je náhodná veličina X diskrétní, pak kvantil určíme z těchto nerovnosti:
F (x p ) ≥ p
1 − F (x p ) ≤ 1 − p
Důvodem proč jsou zde nerovnosti, je skutečnost, že u diskrétní proměnné můžeme mít několik stejných hodnot.
UPOZORNĚNÍ U spojité proměnné tyto nerovnosti nemáme a kvantil splňuje jen dvě rovnosti, které se vzájemně doplňují.
F (x p ) = p
1 − F (x p ) = 1 − p
Nejznámějším kvantilem je medián, který označujeme ~ x , a rozděluje hodnoty na dva stejné intervaly.
~ x = x0.5 PŘÍKLAD 12.7 1 Funkce f(x) = pro x∈(1,e) je hustotou pravděpodobnosti náhodné veličiny X. Určete medián a x kvantil Q0,15.
Řešení: K výpočtu kvantilů nejlépe využijeme distribuční funkci a proto integrujeme hustotu pravděpodobnosti a poté určíme parametr c tak aby vzniklá funkce byla distribuční funkcí na daném intervalu.
1 dx = ln(x) + c x F ( 1 ) = ln( 1 ) + c = 0 + c = c = 0
F(x) = ∫ f(x)dx = ∫
Hledaná distribuční funkce tedy je F ( x ) = ln( x ) . Pokud hledáme medián, tak hledáme hodnotu Q0,5, pro kterou platí, že P(x< Q0,5)=0,5. Tato pravděpodobnost se ovšem rovná distribuční funkci a proto medián určíme z rovnice F(Q0,5)=0,5
107 | S t r á n k a
ln(Q0,5)=0,5 Q0,5=e0,5 Q0,5=1,6487 Obdobně najdeme libovolný kvantil. F(Q0,15)=ln(Q0,15)=0,15 Q0,15=e0,15=1,1618
PŘÍKLAD 12.8 Náhodná veličina X má rozdělení pravděpodobnosti dané tabulkou. x 0 1 2 3 P(x) 0,1 0,2 0,3 0,4 Určete šikmost a špičatost této veličiny
Řešení: Podobně jako u spojité proměnné je nejlepší určit distribuční funkci a z této funkce najít hledaný kvantil. x 0 1 2 3 P(x) 0,1 0,2 0,3 0,4 F(x) 0,1 0,3 0,6 1 Nyní hledáme medián tak, že postupně prohledáváme hodnoty distribuční funkce, dokud nenalezneme číslo větší nebo rovno 0,5. V našem případě je to třetí hodnota (0,6). x = Q0 ,5 = 2. Medián je poté hodnota proměnné x v tomto sloupci, tedy ~ Podobně Q0,15=1.
ÚLOHA 12.3 Určete všechny tercily, kvantily a kvintily náhodné veličiny X zadané a) f(x) = 2x pro x∈(0;1) b)
x 1 2 3 4 5 P(x) 0,1 0,2 0,15 0,25 0,3
Další charakteristikou polohy je modus, který značíme
xˆ .
UPOZORNĚNÍ Modus diskrétní náhodné veličiny definujeme jako hodnotu náhodné veličiny, která má největší pravděpodobnost.
P(xˆ ) ≥ P(x ),−∞ < x < ∞
Modus spojité náhodné veličiny je taková hodnota náhodné veličiny, ve které je hustota pravděpodobnosti největší.
f (xˆ ) ≥ f ( x ),−∞ < x < ∞
12.5 Charakteristiky variability Kromě rozptylu využíváme i další charakteristiky variability náhodné veličiny. Charakteristiky variability rozdělujeme na absolutní a relativní. Jedinou relativní charakteristikou variability náhodné
108 | S t r á n k a
proměnné, kterou budeme probírat, je variační koeficient, všechny ostatní jsou absolutními charakteristikami. Směrodatná odchylka je stejně jako v případě statistických proměnných odmocninou z rozptylu, označujeme ji σ ( X ) . Směrodatná odchylka udává variabilitu v jednotkách proměnn
σ ( X ) = D( X ) Variační koeficient
V ( X ) je bezrozměrná veličina udávající variabilitu v závislosti na střední
hodnotě. Variační koeficient má smysl pouze v případě, kdy je střední hodnota nenulová.
V (X ) =
σ (X )
E(X )
Dalšími charakteristikami jsou kvantilová rozpětí či kvantilové odchylky, které jsou téměř totožné jako v již zkoumaných případech statistických proměnných. Kvartilové rozpětí
Decilové rozpětí
x0.75 − x0.25
x0.9 − x0.1
Percentilové rozpětí
x0.99 − x0.01
x0.75 − x0.25 2 x0.9 − x0.1 Decilová odchylka Q( X ) = 8 x0.99 − x0.01 Percentilová odchylka Q( X ) = 98 Kvartilová odchylka
Q( X ) =
Také se někdy používá střední odchylka, která se uvádí ve dvou variantách. Jedna počítá průměrnou x) odchylku od střední hodnoty a druhá od mediánu. E X − E ( X ) E X − (~
(
) (
)
Hodnota je v jednotkách náhodné veličiny X.
UPOZORNĚNÍ Pro všechny charakteristiky variability platí, že pokud k proměnné X přičteme libovolnou konstantu, tak se jejich hodnota nezmění. Pokud ji vynásobíme konstantou, tak se její charakteristiky variability změní také tímto násobkem, nebo v případě rozptylu se změní násobkem druhé mocniny konstanty.
109 | S t r á n k a
13 NÁHODNÝ VEKTOR CÍL Cílem této kapitoly je čtenáře seznámit s rozšířením myšlenky náhodné veličiny, která popisovala jednu proměnnou na náhodný vektor popisující pole tvořené více proměnnými, které náleží ke stejnému statistickému prvku a společně uchovávají více informací o výsledku náhodného pokusu.
ČASOVÁ ZÁTĚŽ STUDIUM KAPITOLY: 90 minut PROCVIČOVÁNÍ: 90 minut
Často získáme údaje o více než jedné proměnné statistického souboru. Od každého respondenta můžeme získat více údajů a chceme zachovat i informace o vztazích těchto údajů. Máte tedy n náhodných veličin, kde n ≥ 2 , tyto veličiny označíme X 1 , X 2 ,..., X n . Náhodný vektor X tedy definujeme jako X = ( X 1 , X 2 ,..., X n ) .
UPOZORNĚNÍ U náhodného vektoru určujeme počet rozměrů, čímž rozumíme právě počet náhodných veličin, které tento náhodný vektor tvoří, mluvíme pak o n-rozměrném náhodném vektoru.
Rozdělení příslušné k náhodnému vektoru X nazýváme sdružené (simultánní) rozdělení.
13.1 Sdružená distribuční funkce Sdružená distribuční funkce náhodných veličin X 1 , X 2 ,..., X n je funkce určující rozdělení
náhodného vektoru. Označujeme ji stejně jako v případě náhodné veličiny, tedy F ( x ) . Je to tedy funkce o n proměnných.
UPOZORNĚNÍ
Distribuční funkce náhodného vektoru je tedy F (x ) = F ( x1 , x 2 ,..., xn ) a udává pravděpodobnost že, náhodná veličina X 1 nabývá hodnoty nejvýše x1 , náhodná veličina X 2 nabývá hodnoty nejvýše x 2 , a tak dále. Všechny tyto podmínky musí být platné najednou.
Sdružená distribuční funkce náhodných veličin může nabývat hodnot v intervalu 0 ,1 a je stejně jako distribuční funkce náhodné veličiny neklesající. Hodnota sdružené distribuční funkce je rovna 1 právě tehdy, když všechny proměnné nabývají největší možné hodnoty F (∞ 1 ,∞ 2 ,...,∞ n ) = 1 . Hodnota sdružené distribuční funkce je rovna 0 právě tehdy, když alespoň jedna proměnná nabývá hodnoty menší než je minimální hodnota, pokud jsou náhodné veličiny diskrétní. V případě spojitých náhodných veličin stačí, aby alespoň jedna veličina nabývala nejmenší možné hodnoty.
F (− ∞ 1 , x 2 ,..., x n ) = 0
F ( x1 , −∞ 2 ,..., x n ) = 0
110 | S t r á n k a
F ( x1 , x 2 ,..., −∞ n ) = 0 F (− ∞ 1 ,−∞ 2 ,..., −∞ n ) = 0 Zaměřme se nyní na případ náhodného vektoru tvořeného dvěma náhodnými veličinami. Tedy máme X = (X 1 , X 2 ) .
Pravděpodobnost nastání jevu P(a1 < X 1 ≤ b1 , a 2 < X 2 ≤ b2 ) kde a1 < b1 a a 2 < b2 vypočítáme pomocí několika distribučních funkcí. Jedná se o použití pravidla o sčítání pravděpodobností. Platí tedy:
P(a1 < X 1 ≤ b1 , a2 < X 2 ≤ b2 ) = P( X 1 ≤ b1 , X 2 ≤ b2 ) − P( X 1 ≤ b1 , X 2 ≤ a2 ) −
− P( X 1 ≤ a1 , X 2 ≤ b2 ) + P( X 1 ≤ a1 , X 2 ≤ a2 ) =
= F (b1 ,b2 ) − F (b1 , a2 ) − F (a1 ,b2 ) + F (a1 , a2 )
Obrázek 24: Pravděpodobnost ve dvojrozměrném náhodném vektoru
PŘÍKLAD 13.1 Náhodný vektor Z=(X,Y) má distribuční funkci zadanou tabulkou. y x 0 1 2 3 1 0,1 0,2 0,3 0,4 2 0,15 0,25 0,4 0,6 3 0,3 0,45 0,6 1 Určete následující pravděpodobnosti P(x < 2 ∧ 1 ≤ y < 3) , P(x > 2 ∧ y < 3)
Řešení: První pravděpodobnost můžeme upravit takto
P(x < 2 ∧ 1 ≤ y < 3) = P(x ≤ 1 ∧ y ≤ 2 ) = F(1,2) = 0,25 Druhou pravděpodobnost určíme podobně
P(x > 2 ∧ y < 3) = P( y ≤ 2 ) - P(x ≤ 2 ∧ y ≤ 2) = F ( 3,2 ) − F(2,2) = 0 ,2 PŘÍKLAD 13.2 Náhodný vektor Z=(X,Y) má distribuční funkci F(x,y)=xy pro x∈(0,1), y∈(0,1). Určete následující pravděpodobnosti P(x < 0 ,2 ∧ 0 ,1 ≤ y < 0 ,3) , P(x > 0 ,2 ∧ y < 0 ,3)
Řešení:
P(x < 0 ,2 ∧ 0 ,1 ≤ y < 0 ,3) = F(0,2;0,3)- F(0,2;0,1) = 0 ,06 − 0 ,02 = 0 ,04 P(x > 0 ,2 ∧ y < 0 ,3) = F(1;0,3)- F(0,2;0,3) = 0,3 - 0,06 = 0,24 111 | S t r á n k a
ÚLOHA 13.1 Určete pravděpodobnosti P(0,5 ≤ x < 1,5 ∧ 0 ,3 ≤ y < 2 ,2 ) , P(x < 1 ∧ 0 ,5 ≤ y < 2 ) veličiny X zadané
a) F(x) = b)
y x 0,5 1 1,5 2 2,5 3
náhodné
x 2 y xy 2 + pro x∈(0;2), y∈(0;3) 24 36 0,5 0,1 0,15 0,19 0,21 0,23 0,27
1 0,17 0,26 0,4 0,45 0,48 0,55
1,5 0,2 0,31 0,53 0,63 0,68 0,76
1,8 0,24 0,36 0,59 0,7 0,76 0,88
2 0,25 0,41 0,66 0,78 0,86 1
13.2 Sdružená pravděpodobnostní funkce Sdruženou pravděpodobnostní funkci používáme v případě, kdy máme diskrétní náhodné veličiny X 1 , X 2 ,..., X n .
UPOZORNĚNÍ
Sdruženou pravděpodobnostní funkci značíme P( x ) = P( x1 , x 2 ,..., x n ) a je definována jako pravděpodobnost, že náhodná veličina X1 nabude hodnoty x1, X2 nabude hodnoty x2 atd.
Pravděpodobnost P(a1 ≤ X 1 ≤ b1 , a 2 ≤ X 2 ≤ b2 ,..., a n ≤ X n ≤ bn ) vypočítáme jako součet vhodných hodnot pravděpodobnostní funkce:
P(a1 ≤ X 1 ≤ b1 , a2 ≤ X 2 ≤ b2 ,..., an ≤ X n ≤ bn ) =
b1
b2
bn
∑ ∑ ⋅ ⋅ ⋅ ∑ P(x , x ,..., x )
x1 = a1 x2 = a2
xn = an
1
2
Z této rovnosti také vyplývá, že pokud sečteme všechny hodnoty sdružené pravděpodobnostní funkce, dostaneme číslo 1.
UPOZORNĚNÍ
Ze sdružené pravděpodobnostní funkce P( x ) = P( x1 , x 2 ,..., x n ) můžeme získat distribuční funkci sečtením hodnot P(t ) = P(t1 ≤ x1 , t 2 ≤ x2 ,..., t n ≤ x n ) .
F (x1 , x2 ,..., xn ) =
∑ ∑ ⋅ ⋅ ⋅ ∑ P(t , t
t1 ≤ x1 t 2 ≤ x2
t n ≤ xn
1
2
,..., t n )
Hodnoty sdružené pravděpodobnostní funkce náhodného vektoru tvořeného dvěma náhodnými veličinami můžeme úspěšně zapisovat do tabulky a její graf je trojrozměrný takže se dá pomocí výpočetní techniky vykreslit.
112 | S t r á n k a
n
PŘÍKLAD 13.3 Máme zadanou pravděpodobnostní funkci P(x,y) náhodného vektoru (x,y). Určete distribuční funkci F(x,y) a vytvořte grafy těchto funkcí. xy
1
2
3
1
0,020617
0,138904
0,029308
2
0,03452
0,085583
0,124536
3
0,101236
0,119627
0,171502
4
0,047334
0,113332
0,0135
Řešení: Distribuční funkci F(x,y) určíme tak, že postupně počítáme součty předcházejících obměn, podle vzorce
F (x1 , x2 ,..., xn ) =
∑ ∑⋅ ⋅ ⋅ ∑ P(t , t ,..., t )
t1 ≤ x1 t 2 ≤ x2
t n ≤ xn
1
2
n
V tomto konkrétním případě vytvoříme následující tabulku x
y
1
2
3
1
P(1,1)
P(1,1) + P(1,2)
P(1,1) + P(1,2) + P(1,3)
2
P(1,1) + P(2,1)
P(1,1) + P(1,2) + P(2,1) + P(2,2)
P(1,1) + P(1,2) + P(1,3) + P(2,1) + P(2,2) + P(2,3)
3
P(1,1) + P(2,1) + P(3,1)
P(1,1) + P(1,2) + P(2,1) + P(2,2) + P(3,1) + (3,2)
P(1,1) + P(1,2) + P(1,3) + P(2,1) + P(2,2) + P(2,3) + P(3,1) + P(3,2) + P(3,3)
4
P(1,1) + P(2,1) + P(3,1) + P(4,1)
P(1,1) + P(1,2) + P(2,1) + P(2,2) + P(3,1) + (3,2) + P(4,1) + P(4,2)
∑( P) ( i , j ) 1
i , j∈ x ,y
Po dosazení dostaneme tabulku distribuční funkce F(x,y) x
y
1
2
3
1
0,020617
0,159521
0,188829
2
0,055137
0,279625
0,433469
3
0,156373
0,500487
0,825834
113 | S t r á n k a
4
0,203708
0,661154
1
Snadno pak z údajů v tabulkách vytvoříme požadované grafy.
ÚLOHA 13.2 Určete distribuční funkci náhodné veličiny X, u které máme tabulkou P(x,y) 1 2 y x 0,11 0,037 1,5 0,1 0,045 2 0,115 0,086 2,5 0,088 0,09 3
zadanou pravděpodobnostní funkci
3 0,083 0,099 0,106 0,041
13.3 Sdružená hustota pravděpodobnosti Sdružená hustota pravděpodobnosti se udává u spojitého náhodného vektoru X. Je to funkce
f ( x ) = f ( x1 , x 2 ,..., x n ) definovaná jako nezáporná funkce splňující následující rovnost.
F ( x1 , x2 ,..., xn ) =
x1 x2
xn
∫ ∫ ⋅ ⋅ ⋅ ∫ f (t ,t 1
−∞−∞
2
,...,t n )dt1dt2 ...dtn
−∞
UPOZORNĚNÍ
Pravděpodobnost P(a1 ≤ X 1 ≤ b1 , a 2 ≤ X 2 ≤ b2 ,..., a n ≤ X n ≤ bn ) vypočítáme pomocí určitých integrálů:
P(a1 ≤ X 1 ≤ b1 , a2 ≤ X 2 ≤ b2 ,..., an ≤ X n ≤ bn ) = b1 b2
bn
a1 a2
an
= ∫ ∫ ⋅ ⋅ ⋅ ∫ f ( x1 , x2 ,..., xn )dx1dx2 ...dxn
114 | S t r á n k a
Tuto funkci můžeme v případě dvou náhodných veličin zakreslit, jako trojrozměrnou plochu kde prostor pod ní má objem 1.
PŘÍKLAD 13.3 Máme zadanou hustotu pravděpodobnosti f(x,y) pro x∈(0,2), y∈(0,3) náhodného vektoru (X,Y).
f ( x, y ) =
x y + 12 18
Určete distribuční funkci tohoto vektoru a pravděpodobnost P(1<x<1.5 ∧ 1
Řešení: Distribuční funkci F(x,y) určíme integrací hustoty pravděpodobnosti f(x,y) podle obou proměnných.
F( x, y ) = ∫ ∫
x y x 2 yx x 2 y xy 2 + dxdy = ∫ + dy = + +c 12 18 24 18 24 36
Nyní dosadíme nejmenší hodnoty a z definice distribuční funkce víme, že se musí rovnat nule tak dopočítáme parametr c.
F ( 0 ,0 ) =
02 ⋅0 0 ⋅02 + +c =0 24 36
Proto dostáváme, že c=0 a hledaná distribuční funkce je
F( x, y ) =
x 2 y xy 2 + . 24 36
Hledanou pravděpodobnost najdeme buď způsobem popsaným v kapitole 13.1, tedy pomocí distribuční funkce, nebo pomocí určitých integrálů z hustoty pravděpodobnosti. 1.5
2 x 2 xy x y P( 1 < x < 1.5 ∧ 1 < y < 2 ) = ∫ ∫ + dxdy = ∫ + dy = 12 18 24 18 1 1 1 1 2 1.5
2
2 1.25 y 0.5 y 2 2.25 1.5 y 1 y 1.25 0.5 y dy dy + − − = + = + = ∫1 24 18 24 18 ∫1 24 18 24 36 1 2
2.5 2 1.25 0.5 + − − = 0 ,09375 24 36 24 36 ÚLOHA 13.3 Máme zadanou hustotu pravděpodobnosti f(x,y)=1 pro x∈(0,1), y∈(0,1) náhodného vektoru (X,Y). Určete distribuční funkci tohoto vektoru a pravděpodobnost P(0.1<x<0.5 ∧ 0.3
13.4 Marginální funkce Marginálními funkcemi rozumíme funkce (distribuční funkci, pravděpodobnostní funkci, hustotu pravděpodobnosti), kterou získáme z původních funkcí F(X), P(X), f(X) náhodného vektoru X = ( X 1 , X 2 ,..., X n ) .
UPOZORNĚNÍ Marginální distribuční funkce určuje pravděpodobnost, že určitá proměnná nabývá nejvýše dané hodnoty.
115 | S t r á n k a
Např.: F1 ( X 1 ) je marginální distribuční funkce udávající pravděpodobnosti, že náhodná veličina X 1 nabývá nejvýše hodnoty x1 .
Tuto funkci určíme jako F1 ( x1 ) = P( X 1 ≤ x1 ) = F ( x1 , ∞ ,..., ∞ ) , podobně můžeme určit marginální funkce ostatních veličin. F 2 ( x 2 ) = P ( X 2 ≤ x 2 ) = F (∞ , x 2 , ∞ ,..., ∞ ) , atd. Marginální distribuční funkce mohou obsahovat i více veličin. Např.: F12 ( x1 , x 2 ) = P ( X 1 ≤ x1 , X 2 ≤ x 2 ) = F ( x1 , x 2 , ∞ ,..., ∞ )
UPOZORNĚNÍ Marginální pravděpodobnostní funkce a marginální hustota pravděpodobnosti určují pravděpodobnosti, že veličina nabývá určité hodnoty.
Tedy marginální funkce pro X 1 by vypadaly následovně:
P1 (x1 ) = P( X 1 = x1 ) = ∑∑ ⋅ ⋅ ⋅ ∑ P( X 1 = x1 , X 2 = x2 , X 3 = x3 ,..., X n = xn ) x2
f1 ( x1 ) =
x3
∞ ∞
xn
∞
∫ ∫ ⋅ ⋅ ⋅ ∫ f (x , x ,..., x )dx dx ...dx 1
− ∞− ∞
2
n
2
3
n
−∞
Pro ostatní veličiny jsou marginální funkce analogické:
P2 ( x2 ) = P( X 2 = x2 ) = ∑∑ ⋅ ⋅ ⋅ ∑ P( X 1 = x1 , X 2 = x2 , X 3 = x3 ,..., X n = xn ) x1
f 2 ( x2 ) =
x3
xn
∞ ∞
∞
− ∞− ∞
−∞
∫ ∫ ⋅ ⋅ ⋅ ∫ f (x , x ,..., x )dx dx ...dx 1
2
n
1
3
n
Marginální pravděpodobnostní funkci i marginální hustotu pravděpodobnosti můžeme určit pro více než jednu proměnnou.
P12 ( x1 , x2 ) = P( X 1 = x1 , X 2 = x2 ) =
= ∑∑ ⋅ ⋅ ⋅ ∑ P( X 1 = x1 , X 2 = x2 , X 3 = x3 ,..., X n = xn ) x3
x4
xn
f12 ( x1 , x2 ) =
∞ ∞
∫ ∫ ⋅ ⋅ ⋅ ∫ f (x , x ,..., x )dx dx ...dx 1
−∞ −∞
116 | S t r á n k a
∞
−∞
2
n
3
4
n