Statistika
verze 1.0
Obsah Obsah.......................................................................................................................................... 1 1. Význam pojmu STATISTIKA ............................................................................................... 2 2. Kombinatorika........................................................................................................................ 4 3. Statistická jednotka, soubor, znak, data a ukazatele............................................................... 5 4. Úvod do pravděpodobnosti .................................................................................................... 7 5. Objektivní, subjektivní, podmíněná pravděpodobnost a nezávislé jevy ................................ 9 6. Úplná pravděpodobnost........................................................................................................ 11 7. Třídění číselných znaků ....................................................................................................... 13 8. Klasifikace charakteristik podle jejich významu, kontingenční tabulka.............................. 15 9. Náhodné veličiny.................................................................................................................. 17 10. Metody statistické indukce................................................................................................. 20 11. Statistické srovnávání ekonomických jevů ........................................................................ 22 12. Indexy................................................................................................................................. 26
Tyto podklady slouží pouze pro přípravu ke zkoušce z předmětu STATISTIKA. Kapitoly se shodují s jednotlivými okruhy otázek. Některé otázky chybějí nebo se s jinými překrývají. Veškerý zde uvedený text je převzat z přednášek a cvičení a není určen pro komerční účely.
-1Jiří Sitta © 2004
Statistika
verze 1.0
1. Význam pojmu STATISTIKA Význam pojmu statistika •
•
praktická činnost - statistika administrativy o statistika evidence (sběr údajů, evidence, sumarizace) o instituce, která tuto evidenci provádí (ČSÚ, ministerstva) o souhrn údajů o nějaké skutečnosti (statistika nezaměstnanosti aj.) vědní disciplína – teorie statistiky
-
Popisná statistika Matematická statistika (cílem je výsledky zobecnit, používá počtu pravděpodobností) Teorie výběrových zjišťování Aplikované vědy Vědy se silným statistickým základem (sociologie, psychologie aj.).
Statistika 1. je nástrojem poznání. Informace, které poskytuje nám umožní vytvořit si obraz o skutečnosti. Poznání podněcuje poznání příčin, které vedou k určité úrovně sledovaného jevu. 2. je nástrojem rozhodování. Poznání je předpokladem k vytváření závěrů a přijímání rozhodnutí. Statistika znamená 1. údaje, data 2. činnosti spočívající v získávání statistických dat 3. věda zkoumající statistické zákonitosti jevů Název je odvozen z latinského STATUS = STÁT. Původně se označovala věda zabývající se počtem obyvatel, kolik se prodalo => popis státu (hospodářství, politika a zeměpisný stav státu). - Starověk: císař Augus, Vilém dobyvatel - Thomas Cromwel – zaznamenávání o narození a úmrtí v církevních matrikách - Sir William Petty – spojil hospodářské vědy a matematiku. Zakladatel vědecké statistiky v 16. století. Matematici Pascard, Laplas, Plason, Gaus (gausovy křivky), Adolf Phejackues Quetelet – belgičan, výzkumy na lidech, spojení statistických souhrnů, třídění, porovnávání o určitých hromadných jevech.
Co je typické pro statistiku -
zkoumá hromadné jevy (jev, který se vyskytuje mnohokrát) zabývá se proměnlivými (variabilními) vlastnostmi pracuje s čísly a vyjadřuje se pomocí čísel (zajímá se o kvantitativní stránku reality) používá výpočetní techniku k vytváření a správě databází k provádění hromadného zpracování a analýzy.
-2Jiří Sitta © 2004
Statistika
verze 1.0
Co „umí“ a „neumí“ statistika •
•
UMÍ o Řeší různé úlohy různého stupně složitosti, počínaje zjišťováním (počet domácností v ČR) přes popis struktury (věk aj.), shrnování dílčích ukazatelů v čase a prostoru (výpočet průměrných ukazatelů cenové hladiny aj.) srovnávání takto agregovaných ukazatelů v čase a prostoru, předvídání dalšího vývoje, a měření závislosti. NEUMÍ o Selhává pokud nemá adekvátní číselné údaje. Chybí-li představa o velikosti chyb měření a vlivu určitých doprovodných činitelů. Nemá-li k dispozici dostatečně veliký soubor příkladů a dostatečnou variabilitu.
Etapy statistické činnosti 1. Zjišťování – shromažďuje a zaznamenává a kontroluje údaje 2. Zpracování – uspořádání, shrnování, sumarizace a seskupení 3. Analýza – výpočet charakteristik (rozpětí), měření závislosti, srovnávání a měření dynamiky. 4. Prezentace výsledků – tabulkové, grafické a slovní vyjádření výsledků předcházejících etap.
Rámcové informace o statistickém zjišťování Klasifikace: 1. podle zdroje a. primární (základní) b. sekundární (upravené) 2. podle reálnosti a. skutečné b. simulované 3. podle peridiocity zjišťování a. průběžné b. periodické c. jednorázové 4. podle časového hlediska a. okamžikové b. intervalové (větší rozsah)
Základy metody zjišťování 1) Podle úplnosti zjišťování dělíme na úplné a neúplné. Výběrové jsou reprezentativní a ostatní jsou nereprezentativní. Spolehlivou metodou je pravděpodobnostní výběr (náhodný výběr). 2) Podle stupně kontroly podmínek při zjišťování dělíme na prosté pozorování a na řízený experiment. V oblasti sociálně ekonomických jevů je metoda pozorování prosté pozorování.
-3Jiří Sitta © 2004
Statistika
verze 1.0
2. Kombinatorika Kombinace bez opakování -
Nezáleží na pořadí prvků. Kombinace k-té třídy z n prvků je k prvková podmnožina n prvkové množiny. Platí zde neuspořádaný výběr. ⎛n⎞ n! Označujeme ji: Ck (n) = ⎜⎜ ⎟⎟ = ⎝ k ⎠ k!(n − k )!
Variace bez opakování -
Záleží na pořadí prvků, uspořádaný výběr Variace k-té třídy z n prvků je uspořádaná k-tá podmnožina n prvkové množiny n! Označujeme ji: Vk (n) = (n − k )!
Permutace bez opakování -
Permutace n prvků bez opakování je každé uspořádání n-prvkové množiny Počet permutací: P(n) = n!
Kombinace s opakováním -
Kombinace k-té třídy z n prvků s opakováním je k-prvková skupina prvků vybraných z n-prvkové základní množiny tak, že se kterýkoliv prvek může ve skupině libovolněkrát opakovat. Jde o neuspořádaný výběr ⎛ n + k − 1⎞ n! ⎟⎟ = Počet kombinací s opakováním značíme: C´k (n) = ⎜⎜ ⎝ k ⎠ k!(n − k )!
Variace s opakováním -
Variace k-té třídy z n prvků s opakováním je uspořádaná skupina k prvků vybraných ze základní množiny tak, že kterýkoliv prvek se může ve skupině libovolněkrát opakovat. Záleží na pořadí prvků Značíme: V ´k (n) = n k
Permutace s opakováním -
k = k1; k2; k3 … kn prvků s opakováním je každé uspořádání skupiny k prvků v níž je všech n prvků základní množiny k! Značíme: P´k1,k 2...kn (k ) = k1!k 2!...kn! -4Jiří Sitta © 2004
Statistika
verze 1.0
3. Statistická jednotka, soubor, znak, data a ukazatele Statistická jednotka -
-
nositel statistické informace, elementární prvek hromadného jevu reálně existují objekty hmotné povahy: o lidé, jako jedinci v různých rolích (zákazníci, voliči aj.) o organismy a jejich skupiny (zvířata, rostliny aj.) o neživé přírodní předměty o hmotné výsledky lidské činnosti právně, politicky či jinak smluvně vymezené části společenského prostoru (ekonomické subjekty, hospodářské odvětví, státy, kraje) nehmotné výsledky lidské činnosti (sportovní či umělecké výkony) živelné a jiné události (požáry, narození, smrt, tornáda, úrazy apod.) neopakovatelné vzorky ze spojitého prostředí (vzorky atmosféry, vody aj.)
Příbuzné jevy • zpravodajské jednotky – statistické jednotky, které mají ze zákona zpravodajskou povinnost vůči orgánům státní statistické služby • výběrové jednotky – při výběrovém způsobu zjišťování mohou být vybírány buď statistické jednotky nebo jejich přesně definované skupiny -> výběrové jednotky.
Statistický soubor -
množina statistických jednotek, které společně tvoří určitý jev (domácnosti ČR, obce jednoho kraje aj.) dva atributy statistického souboru: o kvalita: (obsah, identifikace, vymezení) -> CO? KDE? KDY?. Explicitní vymezení (seznam jednotek) a implicitní vymezení (vlastnosti jednotek). o kvantita: (počet, množství, rozsah) -> KOLIK?
Rozsah statistického souboru - v popisné statistice značíme „n“ bez další specifikace - v induktivní statistice rozdělujeme základní („N“) a výběrový („n“) soubor
Statistický znak Znaky = zkoumané vlastnosti statistických jednotek Klasifikace statistického znaku (základní klasifikace): • znaky identifikační o z věcného, časového a prostorového hlediska. Identifikují statistickou jednotku, rozhodují o zařazení či nezařazení do souboru. Nejsou předmětem analýzy (jednotky se v nich shodují). • znaky variabilní o rozhodují o způsobu a výsledku zpracování a analýzy. Klasifikace variabilních znaků:
-5Jiří Sitta © 2004
Statistika
verze 1.0
znaky číselné: • znaky měřitelné (kardinální) – hmotnost, počet obyvatel; intervalové, poměrové • znaky pořadové (ordinální) – školská klasifikace, datum znaky slovní (nominální – kvalitativní) • znaky alternativní (dvojné, binární, dichotomické – např. kuřák, nekuřák, slovní rozhodnutí) • znaky možné (více kategoriální např. rodinný stav)
Měřitelné znaky dále klasifikujeme na: • spojité (reálná čísla) např. časové údaje, rozměry, příjmy, výdaje aj. • diskrétní (nespojité, izolované hodnoty) často celočíselné, nezáporné (počet dětí, pracovníků ve firmě apod.) Symbolika a terminologie • číselný znak – velká písmena z konce abecedy (X, Y, Z) hodnoty znaku písmena malá (x, y. z). • slovní znak – velká písmena ze začátku abecedy (A, B, C) obměny znaku písmena malá (a, b, c)
Statistické údaje – data -
hodnoty číselného znaku X, které tvoří statistický soubor o rozsahu „n“ označíme jako x1, x2 … xi … xn. Stručně x,i = 1,2 … n. obměny slovního znaku A, které tvoří statistický soubor o rozsahu „n“ označíme jako a1, a2…ai….an, stručně a,i = 1,2 … n.
Statistické ukazatele - charakteristiky -
-
statistický údaj charakterizuje každou statistickou jednotku zvlášť statistická charakteristika charakterizuje určitou vlastnost statistického souboru jako celku např. tyto údaje 3,7,7,7,10,11,14,20,20 o číslo 10 je v tomto souboru uprostřed -> MEDIÁN o číslo 7 je nejčastěji opakující se hodnota -> MODÁLNÍ o číslo 11 je aritmetickým průměrem a všechny tyto charakteristiky, každá svým způsobem vypovídají o úrovni statistického souboru pro stejné údaje platí: o číslo 17 je rozpětím hodnot znaku o číslo 31,56 je rozptylem o číslo 5,62 je směrodatnou odchylkou o číslo 51,1 % je variačním koeficientem o a všechny tyto charakteristiky (každá svým způsobem) vypovídají o proměnné variabilitě tohoto datového souboru.
-6Jiří Sitta © 2004
Statistika
verze 1.0
4. Úvod do pravděpodobnosti Nechť je definován komplex podmínek, za kterých je sledovaná možnost nastoupení nějakého jevu (přeměna vody v páru při dané teplotě a tlaku). a) jev, který za těchto podmínek nemůže nikdy nastat nazveme jevem NEMOŽNÝM (značíme jej „/“) b) jev, který za těchto podmínek nutně musí nastat se nazývá jev JISTÝ (značíme „V“) c) jev, který i při striktním dodržení podmínek může, ale nemusí nastat případně nastává s růstnou intenzitou, nazveme jako jev NÁHODNÝ (označujeme velkými písmeny abecedy – A, B, C) -
Náhodný jev nemusí být určen komplexem podmínek, ale o tom jestli jev nastane nebo ne, rozhoduje náhoda. Každý takový děj nazýváme náhodný experiment (např. házení kostkou). Skončí-li náhodný experiment nastoupením nějakého náhodného jevu A, říkáme, že nastal příznivý případ pro jev A. V opačném případě nastal nepříznivý případ pro jev A. Můžeme mít jev: o ELEMENTÁRNÍ o SLOŽENÝ Jev A budeme nazývat elementárním, jestliže pro něj neexistují jevy B, C různé od A, takové, že A = B U C (B sjednocení C) Elementární jev je nejjednodušší výsledek náhodného pokusu, který nelze rozložit. Elementárním jevem při házením kostkou je jev padne-li číslo 3. Složený jev může být, pokud padne sudé číslo při hodu kostkou. Složený jev je množina všech elementárních jevů, které mohou nastat jako výsledek daného náhodného pokusu. Libovolný náhodný jev je potom podmnožinou prostoru libovolných elementárních jevů a značíme ho „U“.
Vztahy mezi jevy PRŮNIK JEVŮ A,B: - dva jevy A, B se částečně překrývají - např. A: 2,3,4 B: padne sudé číslo => A∩B = 2,4 SJEDNOCENÍ JEVŮ A,B: - jestliže nastane jev A neb jev B - např. A: 2,3,4 B: sudé číslo => AUB = 2,3,4,6 - disjunktní jevy jsou takové, které nemají spolu žádný společný výsledek …. A∩B = Ø ROVNOST JEVŮ A,B: PODMNOŽINA: - jeden jev je obsažen v jevu druhém. Jev A je podjevem jevu B - značíme: A ⊂ B - např. A: 2 B: sudá čísla => A ⊂ B = 2
-7Jiří Sitta © 2004
Statistika
verze 1.0
OPAČNÝ JEV - je tzv. doplňkovým jevem a je to jev, který nastane, když nenastane jev A - značíme A ROZDÍL JEVŮ - rozdílem jevů A a B je jev, který nastane právě tehdy, nastane-li jev A a nenastane jev B - značíme A – B
Pravděpodobnosti Jestliže je pokus opakovatelný neomezeně mnohokrát, hovoříme o Objektivní pravděpodobnosti, pokud se podmínky mnění při každém pokusu, hovoříme o subjektivní pravděpodobnosti. Objektivní pravděpodobnost je založena na četnosti výskytu sledovaného jevu. Zdá se rozumné považovat toto číslo za objektivní míru opakování a nazvat jej pravděpodobností. Pravděpodobnost jevu A je číslo P(A) přiřazené jevu A, které má tu vlastnost, že relativní četnost jevu A se s rostoucím počtem realizací pokusů blíží k číslu P(A). Hodnota pravděpodobnosti je v intervalu <0;1>.
P ( A) =
m n( A) = n n
m…počet pokusů příznivých pro jev A n…počet všech možností, které se mohou vyskytnout
P( A ∪ B ) = P( A) + P( B ) − P( A ∩ B) P ( A1 ∩ A2 ... ∩ An ) = P( A1 ) • P( A2 ) • ... • P ( An ) ………. předpokládáme že jevy jsou nezávislé
-8Jiří Sitta © 2004
Statistika
verze 1.0
5. Objektivní, subjektivní, podmíněná pravděpodobnost a nezávislé jevy Objektivní pravděpodobnost Je založena na četnosti výskytu sledovaného jevu. Pravděpodobnost jevu A je tedy v tomto případě P(A) přiřazené jevu A, která má tu vlastnost, že relativní četnost jevu A se s rostoucím počtem realizací pokusí blíží číslu P(A).
Subjektivní pravděpodobnost Je pravděpodobnost, kterou přiřazujeme výsledku pokusu, jež není za stejných podmínek opakovatelný (HDP v ČR v letošním roce je pokus sledovatelný jen jednou) Pro oba typy pravděpodobností platí stejné zákona a pravidla jimiž se nyní budeme zabývat. Platí 3 axiomy: AXIOM 1.: - Pravděpodobnost náhodného jevu je nezáporné číslo nejvýše rovné jedné. - 0 ≤ P(A) ≤ 1 AXIOM 2.: - je-li A1, A2, A3 … konečný nebo spočetný disjunktní systém náhodných jevů, pak pravděpodobnost je sjednocení An. A je rovna součtu pravděpodobností. - A1 ∩ A2 = Ø pro všechna i ≠ j => P(Ui Ai) = ∑ P ( Ai ) i
AXIOM 3.: - pravděpodobnost jevu jistého S je rovná jedné - P(S) = 1
Bezprostředně z těchto tří axiomů vyplývají další VLASTNOSTI pravděpodobnosti: • z axiomu 3 dostáváme pro jev A a jeho doplněk P( A ∪ A) = P( A) + P( A) = P( S ) = 1
Podmíněná pravděpodobnost Často se setkáme s podmínkou pravděpodobností => jedná se o pravděpodobnost jevu, že nastal určitý jev jiný (n-krát realizujeme nějaký náhodný pokus a uvažujeme dvě množiny A a B v příslušném prostoru elementárních jevů, tj. dva jevy souvisejí s tímto pokusem. Vybereme z posloupností realizací pokusy jen ty realizace, při kterých nastal jev B. pak nás zajímá kolikrát za takové podmínky nastal i jev A.). Vztahy pro výpočet podmíněné pravděpodobnosti P( A ∩ B) kde P(A) ≠ 0 P( B / A) = P( A) P( B ∩ A) kde P(B) ≠ 0 P( A / B) = P( B)
-9Jiří Sitta © 2004
Statistika
verze 1.0
Bayesova věta P( A / B) =
P( B / A) • P( A) P( B)
Nezávislé jevy • • • •
Jevy A a B nazýváme nezávislé navzájem, jestliže platí: P ( B ∩ A) = P( A) • P( B) Jevy A a B jsou tedy nezávislé, jestliže pravděpodobnost průniku těchto dvou jevů je rovna součinu pravděpodobností jednotlivých jevů Příkladem nezávislých jevů je házení kostkou. Jestliže v prvním hodu hodíme jedničku, nijak to neovlivní pravděpodobnost, že jednička padne také ve druhém hodu. P( A • B) P ( B / A) = P( B)
Značení pravděpodobnosti • • •
bodový graf sloupcový graf čárový graf
Bernuliho vzorec Uvažujeme pokus, jehož výsledkem může být jev A s pravděpodobností B a opakujeme-li tento pokus n-krát, přičemž výsledky jsou na sobě nezávislé a jev A nastal kkrát, pak pravděpodobnost vypočítáme pomocí bernuliho vzorce. ⎛n⎞ P ( A) = ⎜⎜ ⎟⎟ • p k • (1 − p ) n−k ⎝k ⎠
p … pravděpodobnost, že nastane jev A pk … pravděpodobnost, že jev A nastal k-krát ⎛n⎞ ⎜⎜ ⎟⎟ … vyčísluje všechny možnosti jak se v n pokusech může jev A objěvit právě k-krát ⎝k ⎠
- 10 Jiří Sitta © 2004
Statistika
verze 1.0
6. Úplná pravděpodobnost Úplná pravděpodobnost jevu A. Pravděpodobnost jevu A bez ohledu na jev B, tj. výsledek jevu B neznáme nebo neuvažujeme jej. P ( A) = P( A / B) • P( B) + P( A / B) • P( B)
P( A ∩ B)
P( A ∩ B)
Příklad: U konkursu na místo obchodního zástupce firmy má vysokoškolák 60% šanci na přijetí, středoškolák 20%. Mezi zájemci o místo je 40 % vysokoškoláků a 60 % středoškoláků. Jakou šanci má náhodně vybraný zájemce, pokud neznáme jeho vzdělání?
Jev B … vysokoškolák (VŠ) … 0,4 Jev A … byl přijat Jev B … středoškolák (SŠ) … 0,2 P(A) = P(A/VŠ) * P(VŠ) + P(A/SŠ) * P(SŠ) P(A) = 0,6 * 0,4 + 0,2 * 0,6 = 0,36 Náhodně vybraný zájemce má 36% šanci na přijetí. Pokračování: Uchazeč byl přijat. S jakou pravděpodobností měl vysokoškolské vzdělání? P(VŠ ∩ A) P( A / VŠ ) • P(VŠ ) 0,6 • 0,4 P (VŠ / A) = = = = 0,66 P( A) P( A) 0,36 Uchazeč o místo byl odmítnut. S jakou pravděpodobností to byl středoškolák? P( SŠ ∩ A) P( A / SŠ ) • P( SŠ ) 0,8 • 0,6 P ( SŠ / A) = = = = 0,75 0,64 P( A) P( A)
Rozhodovací strom
- 11 Jiří Sitta © 2004
Statistika
verze 1.0
Rozhodovací strom – obrácený
Opakované pokusy Nezávislé opakované pokusy: Nechť posloupnost nastoupení jevu A v jediném pokuse je rovna P(A) = p a sledujeme pravděpodobnost jeho nastoupení postupně ve dvou, třech atd. nezávislých opakovaných pokusech.
Jsou-li výskyty jevu A skutečně nezávislé,můžeme např. pro dva pokusy, které mohou končit možnými čtyřmi výsledky AA , A A , AA , A A , určit pravděpodobnosti jednotlivých výsledků jako p2, p(1-p), (1-p)*p, (1-p)2. Nebudeme-li rozlišovat pořadí, v jakém jevy nastaly, můžeme místo prostředních dvou výrazů napsat 2p(1-p). Podobně pro tři a více pokusů. Uskutečníme-li n pokusů a ptáme se jaká je pravděpodobnost, že jev A nastal právě x-krát bez ohledu na pořadí, můžeme tuto pravděpodobnost vyjádřit jako: Bernoulliův binomický vzorec ⎛n⎞ x n− x n , x P ( A) = ⎜ ⎜ x ⎟⎟ • p • (1 − p) ⎝ ⎠
- 12 Jiří Sitta © 2004
Statistika
verze 1.0
7. Třídění číselných znaků Číselný znak obecně vykazuje několik málo (obecně k) hodnot. Třídíme podle každé hodnoty znaku. Hodnoty znaku v tabulce uvedeme ve vzestupném pořadí. Ke každé hodnotě určíme počet výskytů v souboru => četnost. Příklad: P.č. 1 2 3 Součet
xi 1 2 3 x
ni 4 3 5 12
Třídění číselných znaků – Skupinové třídění Spojitý číselný znak vykazuje velké množství vzájemně od sebe různých hodnot. Třídíme v rámci uměle vytvořených skupin (tříd, intervalů). Zásady: - třídy s konstantní šířkou - počet tříd koresponduje s rozsahem souboru a je v rozsahu rozmezí od 6 do 15 - šířku, hranice a středy tříd volíme s ohledem na maximální přehlednost - nesporné vymezení hranic tříd - první a poslední třída mohou být otevřené, jejich šířka se považuje za h. Co se rozumí pod pojmem „nesporné vymezení“ - celočíselný znak do 99 do 100 do 100 nevhodné 100 - 199 101 - 200 100 - 200 h = 101 nelze 200 - … 201 - … 200 - … jednoznačně určit střed intervalu
Druhy četnosti •
k
absolutní četnost – počet hodnot ve třídě – ni platí:
∑n i =1
• •
i
=n
relativní četnost – podíl hodnot ve třídě na rozsahu souboru pi = i
i
j =1
j =1
pi . Platí n
k
∑p i =1
i
=1
součtová četnost - k ni = ∑ ni ; k pi = ∑ pi . Alternativně opět v % (absolutní nebo
relativní). Počet / podíl hodnot od počátku po danou třídu včetně. Příklad: Pořadové číslo 1 2 3 4 5 6 Celkem
Vymezení intervalu do 20) <20 až 25) <25 až 30) <30 až 35) <35 až 40) <40 a více X
Střed tříd xi 17,5 22,5 27,5 32,5 37,5 42,5 X
Absolutní četnost ni 12 32 20 8 6 2 80
Relativní četnost pi 0,15 0,40 0,25 0,10 0,08 0,02 1
Součtová absolutní kni relativní 100kni 12 15,0 44 55,0 64 80,0 72 90,0 78 98,0 80 100,0 X X
- 13 Jiří Sitta © 2004
Statistika
verze 1.0
Grafy skupinového rozdělení četností • histogram absolutní četností • spojnicový graf součtové relativní četnosti v % Různé typy rozdělení četnosti (typické tvary) - symetrické modální - levostranné nesouměrné - extrémně pravostranné - rovnoměrné - tvar „U“ - dvouvrcholové
Kvantily Kvantil xp (= p – procentní kvantil) je taková hodnota znaku, pro kterou platí, že nejméně pprocent prvků má hodnotu menší nebo rovnou xp a 100-p prvků je větších nebo rovno xp. k = (počet pozorování ~ n) * (úroveň kvantilu ~ p) / 100 Kvartily jsou p-kvantily pro p = 25, 50, 75 (x25, x50, x75). Dolní kvartil = x25 Medián = x50 označujeme Při lichém rozsahu souboru je medián jednoduše vždy hodnota konkrétní prostřední číslo statistické jednotky souboru (musí to být uspořádaný soubor podle velikosti). Při sudém rozsahu souboru však medián leží mezi dvěma prostředními statistickými jednotkami, proto z těchto dvou jednotek stanovíme průměr a ten označíme jako medián.
Výpočet kvantilů z hodnot neuspořádaných do tabulky rozdělení četností je velmi jednoduchý. Poněkud složitější je pouze výpočet kvantilů z intervalového rozdělení, kde k odhadu použijeme následující vzorec. p z −n x p = p 1 • hp + a p , kde z p = n • + 0,5 n2 100 zp … pořadové číslo jednotky, jejíž hodnota je hledaný kvantil n … počet pozorování (součet všech hodnot) p … relativní četnost nižších hodnot n1 … kumulativní četnost prvků ležících před kvantilovým intervalem n2 … četnost intervalu, v němž leží hledaný kvantil hp … délka kvantilového intervalu ap … hodnota, která tvoří dolní hranice kvantilového intervalu
Modus Modus znaku x značíme x se stříškou. Je to hodnota znaku x s největší absolutní četností. Jsou-li takové hodnoty se stejnou největší četností dvě (tři,…) hovoříme o rozložení dat na bi- (tri-,…) modálním.
- 14 Jiří Sitta © 2004
Statistika
verze 1.0
8. Klasifikace charakteristik podle jejich významu, kontingenční tabulka Charakteristika: - polohy - variability - šikmosti - špičatosti
Míra úrovně (polohy) -
Patří se průměry (aritmetický, geometrický, harmonický atd.) n
-
x1 x1 + x2 + ... + xn ∑ i =1 Aritmetický průměr: x = = n n Jsou-li zjištěné hodnoty uspořádané do tabulky rozdělení četnosti, používáme pro výpočet vážený aritmetický průměr. k
-
x n + x n + ... + xk nk Vážený aritmetický průměr: x = 1 1 2 2 = n1 + n2 + ... + nk
∑xn i =1 k
∑n i =1
-
i i
i
Do míry polohy patří také kvantily a modus.
Míra variability -
-
míru absolutní R = Xmax - Xmin
variability
(proměnlivosti)
počítáme
zde
variační
míra relativní variability (proměnlivosti): počítáme variační koeficient Vx =
rozpětí
σ x
(sigma
=> směrodatná odchylka) n
∑ ( x − x) i
2
nebo také σ 2 = x 2 − x
-
rozptyl: σ 2 =
-
směrodatná odchylka: σ = σ 2
i =1
n
2
Směrodatná odchylka -
je druhou odmocninou rozptylu a vychází z původních měrných jednotkách znaků
-
σ = σ2
-
velikost je ovlivněna nejen variabilitou, kterou měří, ale i úrovní zkoumaného kvantitativního znaku je absolutní mírou variace
- 15 Jiří Sitta © 2004
Statistika
verze 1.0
Variační koeficient -
je relativní mírou variace počítá se jako podíl směrodatné odchylky a průměru. Tím se získá bezrozměrné číslo. Pro praktické účely se počítá 100 násobek tohoto čísla a výsledek je udáván v procentech
-
Vx =
-
σ
• 100 x variačním koeficientem lze porovnávat nejen variabilitu stejných znaků se stejnými měrnými jednotkami různých souborů lišících se svou absolutní úrovní, ale i různých znaků s odlišnými měrnými jednotkami.
Šikmost n
-
charakteristika šikmosti je definována jako α =
∑ ( x − x)
3
1
i =1
n •σ 3 z kladné (záporné) nodnoty těchto měr se pak usuzuje většinou na kladně (záporně) zešikmené rozdělení a zároveň na větší koncentraci malých (velkých) hodnot ve srovnání s koncentrací velkých (malých) hodnot.
Špičatost n
-
charakteristika špičatosti je definována jako β =
∑ (x i =1
1
− x) 4
n •σ 4
−3
Dvoustupňové třídění -
zkoumáme výskyt a hodnost dvou statistických znaků pocházejících ze stejného základního X souboru (výška – váha, cena – prodané množství aj.) pro dvoustupňové třídění se zavádí kontingenční tabulka znaků x a y. Kontingenční tabulka pro x a y x y y1 y2 … Celkem x1 n11 n12 … n10 x2 n21 n22 … n20 … … … … … Celkem n01 n02 … n
n12 n20 n n02 n01; n02; n03
počet prvků s vlastnostmi x1 a y2 počet prvků s vlastnostmi x2 počet prvků v souboru počet prvků s vlastnostmi y2 marginální četnosti rozdělení znaku y
- 16 Jiří Sitta © 2004
Statistika
verze 1.0
9. Náhodné veličiny Náhodná proměnná je zobrazení, které každému elementárnímu jevu ze základního prostoru elementárních jevů přiřadí číslo reálné. Obor hodnot náhodné proměnné je množina všech R čísel, kterých může náhodná proměnná nabývat.
Příklad: Náhodná proměnná X bude počet teček na horní straně hrací kostky. Obor hodnot je D = (1,2,3,4,5,6).
Podle oboru hodnot rozlišujeme dva typy náhodných proměnných: 1) diskrétní náhodné proměnné – definiční obor je spočetná množina (konečná nebo nekonečná posloupnost, nebo množina izolovaných bodů) značíme ji DNP 2) spojitá náhodná proměnná – značíme SNP, definiční obor je nespočetná množina (ohraničený nebo neohraničený interval) Příklad: a) počet automobilů vyrobených za jednu pracovní směnu => DNP b) životnost PC v konkrétní učebně => SNP
Zákon rozdělení (rozložení) pravděpodobnosti náhodné veličiny Je to pravidlo, které každé číselné hodnotě DNP nebo každému intervalu hodnot SNP přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty nebo hodnoty z tohoto intervalu. K popisu rozložení se používá distribuční a frekvenční funkce. Distribuční funkce F(x) náhodné veličiny X je reálná funkce, která každému reálnému číslu X od (−∞; ∞) přiřazuje pravděpodobnost toho, že náhodná proměnná X nabývá hodnot menších než x (malé x; hodnota) F(x) = P(X < x); x ∈ R .
Vlastnosti distribuční funkce (platí pro všechny distribuční funkce)
1) Funkce je neklesající na množině R 2) F(x) je zleva spojitá v každém bodě 3) Limita lim f ( x ) = 0 x& →−∞
4) Limita lim f ( x ) = 1 5) 0 ≤ f ( x )
x& →+∞
6) F (b) − F (a) = P(a ≤ x < b)
Frekvenční funkce Definuje se různě pro různé typy proměnné. Pravděpodobnostní funkce p(x). U spojité ji označujeme funkce hustoty a značíme f(x). Pravděpodobnostní funkce p(x) je reálná funkce, která každému reálnému číslu X určí pravděpodobnost toho, že DNP X nabývá této hodnoty. Zapisujeme ji p(x) = P(X=x).
- 17 Jiří Sitta © 2004
Statistika
verze 1.0
Vlastnosti:
1) p(x) ≥ 0 +∞
2)
∑p
x→−∞
x
=1
x=xi P(xi)
x1 x2 p(x1) p(x2)
… …
xn p(xn)
Znázorňujeme graficky, existují 4 možnosti: 1) bodový diagram 2) úsečkový diagram 3) polygon 4) histogram
-
V popisu rozložení DNP můžeme použít i distribuční funkci F(x) hodnotu F(x) určíme jako souček pravděpodobnostní funkce pxi pro xi < X …
∑ p( x )
xi< X
-
i
Graf F(x) je stupňovitý, schodovitý
Spojitá náhodná proměnná SNP má nespočetně mnoho hodnot tvořící interval. Nemá význam popisovat rozdělení pomocí pravděpodobností. Opět použijeme distribuční funkci. Na rozdíl od DNP je tato funkce spojitá v obou krajních bodech. Funkce hustoty SNP f(x) je dána jako f ( x) : lim
h→0+
P ( x ≤ X < x + h) ; x∈ R h
Vlastnosti funkce: 1) f ( x) ≥ 0 +∞
2)
∫ f ( x)dx = 1
−∞
Vztahy: - f(x) = F´(x) x
-
F´(x) =
∫ f (t )dt
−∞
Typy rozložení náhodných proměnných 1) Rovnoměrné rozložení NP: toto rozložení má DNP x jejíž všechny možné hodnoty xi se vyskytuje se stejnou pravděpodobností. Závisí na parametru n (počet realizací). 1 Označuje se R(n). Pravděpodobnostní funkce f p( xi ) = ; D = {x1 ,..., xn } např. n házení hrací kostkou aj.) 2) Binomické rozložení: toto rozložení má DNP x, která vyjadřuje počet výskytů jevu „a“ v Bernouliho posloupnosti „n“ nezávislých pokusů. Závisí na dvou parametrech:
- 18 Jiří Sitta © 2004
Statistika
verze 1.0
n – počet pokusů; p – je pravděpodobnost sledovaného jevu „a“ v jednom pokusu. Značíme Bi (n;p). Pravděpodobnostní funkce f
⎛n⎞ p ( xi ) = ⎜⎜ ⎟⎟ • p xi • (1 − p) n − xi ; xi = 0;1;...; n ⎝ x⎠
Poissonovo rozložení Toto rozložení má DNP x, která vyjadřuje počet výskytů sledovaných jevů v určitém časovém intervalu nebo určité oblasti (příklad: počet zákazníků za den, počet chyb v jednom daňovém přiznání). Závisí na jednom parametru λ (lambda) (průměrný počet výskytů sledovaného jevu v daném intervalu). Značíme: Po( λ )
p ( xi) = e −λ •
λxi xi !
; λ >0; xi = 0,1,…, n
Nechť v Bernouliho posloupnosti kde n → ∞ + a pravděpodobnost výskytu v jednom pokusu se blíží nule, pak binomické rozložení lze aproximovat (přiblížit) poisonově rozdělení: Bi (n; p) ~ Po(λ ) kde λ = p • n
Typy rozložení pravděpodobností SNP 1) Rovnoměrné rozložení: toto rozložení má SNP x jejíž realizace vyplňují interval konečné délky a mají stejnou možnost výskytu (doba čekání na uskutečnění opakujícího se jevu v časových intervalech). Závisí na dvou parametrech „a“ (dolní mez intervalu možných hodnot) a „b“ (horní mez intervalu možných hodnot). Značíme ji: R(a;b). Funkce hustoty potom následovně: 1 x ∉ a; b ba f (x ) 0
x ∈ a; b
2) Normované normální rozdělení: toto rozložení je speciálním příkladem obecného normálního rozložení, pro µ = 0 a δ 2 = 1 . Označujeme Z. funkce hustoty značíme ϕ a distribuční funkci značíme Φ . Značíme N(0;1). Funkce hustoty
ϕ( z ) =
−1
•z 2 1 • e 2 ; z ∈ (−∞, ∞) Graf ϕ (z) se nazývá Gausova křivka. 2π
Distribuční funkce: Φ ( z ) = ∫
∞
−∞
−1
•t 2 1 • e 2 dt ; z ∈ (−∞, ∞) 2π
- 19 Jiří Sitta © 2004
Statistika
verze 1.0
10. Metody statistické indukce -
-
Umožňuje vyslovovat závěry o rozložení a vlastnostech souborů o němž nemáme úplnou informaci. Místo toho, abychom pracovali s celým souborem, vybereme z něj poměrně malou část (výběr). Základní soubor označujeme ZS a je to soubor, o němž nemáme úplnou informaci, protože je: o Neukončený (soubor nekonečné řady pokusů) o Konečný, ale velkého rozsahu o Konečný, ale je nemožné nebo nesmyslné jej celý prozkoumat (zjišťování kvality skladovaných konzerv) Sledujeme rozsah a značíme ho N. Základní soubor považujeme za popsaný, známe-li jeho frekvenční funkci náhodné proměnné X. Máme-li X, která má normální rozložení, považujeme ZS za normálně rozložený. Charakteristiky se nazývají parametry ZS a jsou to konstanty a označujeme je konkrétně jako µ , δ 2 atd. Náhodný výběr je podmnožinou ZS a rozsah výběru značíme „n“. Můžeme rozlišovat: o Výběr s vracením – prvek se může opakovat o Výběr bez vracení – prvek maximálně jednou Náhodný výběr rozsahu n je takový výběr, který poskytuje každému prvku ZS stejnou a nezávislou šanci být vybrán. Konkrétní výběr se provádí: o Losováním o Použitím generátoru náhodných čísel o Systematickým výběrem (u setřízeného ZS se vybere prvek „k“) o Stratifikovaným výběrem, který se používá tam, kde je základní soubor vnitřně rozdělen do skupin v nichž je rozptyl sledovaného znaku menší než v celém ZS (předvolební průzkum)
Výběrová statistika -
-
Protože ze ZS můžeme provést více výběrů, tak pro každý výběr můžeme vypočítat základní charakteristiky (střední hodnota, rozptyl). Pro různé konkrétní výběry můžeme dostat odlišné výsledky. Obecně lze říct, že charakteristiky náhodného výběru jsou náhodnou proměnnou, které nabývají svých hodnot v závislosti na konkrétním náhodném výběru ze ZS. Hodnoty značíme x1….xn ze ZS. Náhodné proměnné X1….Xn. Protože je výběrová statistika náhodnou proměnnou, musí mít své rozložení pravděpodobností (výběrové rozložení)
Výběrová střední hodnota:
Je náhodná proměnná X = S2 =
1 n ∑ Xi n x=1
1 n ( X i − X )2 ∑ n x=1
- 20 Jiří Sitta © 2004
Statistika
verze 1.0
Věty o náhodných výběrech a statistikách 1) Centrální limitní věta: Jsou-li n členné náhodné výběry X1….Xn vybrány z velkého nebo nekonečného ZS s rozložením jehož střední hodnota je µ a konečný rozptyl je
δ 2 pak výběrové rozložení výběrové střední hodnoty X konverguje k normálnímu δ rozložení se střední hodnotou µ a směrodatnou odchylkou .
n 2) Věta o jednom výběru: jsou-li X1….Xn , které tvoří n členný náhodný výběr ze 1 n základního souboru se normální rozložením N( µ ; δ 2 ) a je-li X = ∑ X i a n x=1 1 n S 2 = ∑ ( X i − X ) 2 pak náhodná proměnná může být: n x=1 X −µ • n − 1 má Studentovo rozložení T s (n-1) stupni volnosti. S X −µ • n má základní rozložení N(0,1) II. U = I. T =
δ
III. χ 2 =
n•S2
µ
má Pearsonovo rozložení χ 2 s (n − 1) stupeň volnosti
Nechť X1 až Xn jsou nezávislé náhodné proměnné z nich každá se řídí rozložením n
N(0;1), potom náhodná proměnná χ 2 = X 12 + ... + X n2 = ∑ X i2 má Pearsonovo rozložení s µ i =1
stupni volnosti. Značíme ho χ (n) a čteme „chý kvadrát volnosti“. 2
Funkce hustoty:
x fn ( X ) =
n +1 2
2
•e
−x 2
n ⎛n⎞ •⎜ ⎟ 2 ⎜⎝ 2 ⎟⎠
0
x>0 x≤0
Studentovo rozložení se vztahuje na 2 proměnné. Nechť X1 a X2 jsou nezávislé proměnné a nechť X1 se řídí rozložením N(0,1) a X2 rozložení χ 2 (n) potom náhodná proměnná X1 T= • n má studentovo rozložení s n stupni volnosti. Značíme t(n) a funkce hustoty je X2
dána f n ( x) =
⎛ n − 1⎞ ⎟ ⎜⎜ 2 ⎟⎠ ⎛ x 2 ⎞ n + 2 1 ⎝ • ⎜1 + ⎟⎟ − • 2 n⎠ ⎛ n ⎞ ⎜⎝ n •π ⎜ ⎟ ⎝2⎠
- 21 Jiří Sitta © 2004
Statistika
verze 1.0
11. Statistické srovnávání ekonomických jevů Ukazatel je specifickou statistickou veličinou popisující určitou ekonomickou skutečnost. Každý ukazatel má tedy svůj věcný obsah a zároveň svoji formálně logickou konstrukci, která ho řadí mezi statistické veličiny.
Statistický ukazatel je statistickou veličinou a předpokládá se, že daný statistický soubor je obecně, prostorově a časově vymezen (např. ukazatel odpracovaná doba -> tento ukazatel je vymezen jako úhrn doby odpracované pracovníky podniku v měsíci). Jestliže přesně definujeme prostor a čas (březen 2004 podnik A) dostaneme konkrétní hodnotu ukazatele -> údaj. Ukazatel je tedy proměnná veličina a hodnota ukazatele je hodnotou této proměnné veličiny, která vzniká konkrétním vymezením v čase a prostoru.
Dělení ukazatele: 1) Primární a sekundární (druhotné): Primární ukazatelé jsou přímo zjišťované – neodvozené. Např. odpracovaná doba, počet pracovníků k určitému datu atd. Jedná se o ukazatele, kde lze přímo určit typ charakteristiky statistické jednotky i statistického znaku. Sekundární ukazatelé mohou vznikat třemi způsoby: a. Jako funkce (rozdíl nebo podíl) různých primárních ukazatelů (např. zisk, doba obratu zásob) b. Jako funkce různých hodnot téhož primárního ukazatele (časový průměr, ukazatel struktury, hrubý obrat) c. Jako funkce dvou primárních ukazatelů, kde aspoň u jednoho pracujeme s více hodnotami (spojení předcházejících dvou kroků) (produktivita práce na pracovníka, ziskovost produkce) • • •
•
•
Indexy, absolutní rozdíly a další míry rozdílnosti jsou nástroji srovnávání a nástroji analýzy výsledků srovnání. Ukazatelé samy o sobě vypovídají o nějaké skutečnosti, ale nehodnotí ji, zatímco indexy a absolutní přírůstky měří rozdílnost dvou hodnot téhož ukazatele. Další členění je na absolutní a relativní. o Absolutní ukazatelé vyjadřují velikost absolutního jevu bez vztahu k dalšímu jevu. Patří sem všechny primární ukazatelé – vznikající úhrnem, ale i některé ukazatele sekundární (časové průměry a rozdílové ukazatelé – např. zisk). o Relativní ukazatelé vyjadřují velikost jednoho jevu vzhledem k jinému jevu. Relativní ukazatelé jsou vždy sekundární, neboť vznikají jako podíl absolutních (primárních i sekundárních) ukazatelů. Toto členění je vyčerpávající. Další dvojce dělení je na Extenzivní a Intenzitní ukazatele. Nejsou už vyčerpávající. o Extenzivní ukazatelé jsou ukazatelé množství a patří do skupiny absolutních ukazatelů. o Intenzitní ukazatelé jsou ukazatelé úrovně, nepokrývají však celou skupinu relativních ukazatelů, ale pouze jen ty, které vyjadřují intenzitu určitého jevu. Toto členění je důležité především při práci s indexy. Okamžikové a intervalové ukazatele. Toto členění definuje vlastnost ukazatele a předurčuje způsob jeho shrnování v čase. Jedná se pouze u absolutních ukazatelů.
- 22 Jiří Sitta © 2004
Statistika
verze 1.0
Typické vlastnosti ukazatelů Patří sem stejnorodost, porovnatelnost a shrnovatelnost. • Stejnorodost statistických ukazatelů je dána povahou statistických jednotek. Kritérium je pak statistický znak, který na daných jednotkách sledujeme. Stejnorodost statistických ukazatelů je relativní. Absolutní ukazatel je stejnorodý tehdy, jestliže má věcný smysl shrnovat jeho dílčí hodnoty součtem. Relativní je stejnorodý jen tehdy, když jsou stejnorodé oba absolutní ukazatelé z nichž se skládá. Pokud toto neplatí je ukazatel nestejnorodý. • Srovnatelnost statistických ukazatelů je vlastnost, která má vazbu na tvorbu relativních ukazatelů. Za srovnatelné považujeme takové ukazatele, jejíchž srovnáním respektive srovnáním hodnot, získáme smysluplnou veličinu (produktivita práce). Za nesrovnatelné považujeme takové, jejichž srovnání nemá smysl z hlediska srovnání rozdílného druhového, časového nebo prostorového rozdělení. • Shrnovatelnost vyjadřuje schopnost ukazatele určit jeho celkovou hodnotu na základě jeho dílčích hodnot. Z tohoto hlediska je dělíme na přímo shrnovatelné, nepřímo shrnovatelné a neshrnovatelné ukazatele. Přímo shrnovatelné jsou takové, které můžeme dílčí hodnoty přímo shrnout. Nepřímo shrnovatelné jsou takové, u kterých musíme znát dílčí hodnoty tohoto ukazatele, ale i dílčí hodnoty jiného ukazatele (typické pro všechny relativní ukazatele). Neshrnovatelné nelze určit ani při dílčích znalostech jiných ukazatelů.
Indexy a absolutní rozdíly V praxi nepracujeme s určitými izolovanými hodnotami ukazatele, ale snažíme se zajistit určitou změnu oproti téže skutečnosti v minulém období či v jiném územní či organizační jednotce. Zajímá nás o kolik je hodnota daného ukazatele v dané situaci vyšší nebo nižší než hodnota ukazatele v jiné situaci. Chceme-li vědět kolikrát nebo o kolik % je jedna hodnota vyšší nebo nižší než hodnota jiná, budeme obě hodnoty srovnávat podílem. Pokud o kolik jednotek je jedna vyšší nebo nižší než druhá, srovnáváme rozdílem. Podílem dvou hodnot téhož ukazatele získáme INDEX, obě tyto míry rozdílnosti jsou rovnocenné a vzájemně se doplňují. Index: je bezrozmezné číslo (podíl dvou hodnot) udávající kolikrát je hodnota čitatele vyšší nebo nižší než jmenovatel. Absolutní přírůstek udává o kolik měrných jednotek je hodnota menšence vyšší nebo nižší než hodnota menšitele. Časový index je, budeme-li srovnávat zisk podniku ve dvou letech.
Budeme-li srovnávat zisk podniku α se ziskem podniku β v určitém roce, sestrojíme prostorový index. Budeme-li porovnávat zisk při výrobě výrobku x a y v podniku α v roce 2002, získáme druhový index.
- 23 Jiří Sitta © 2004
Statistika
verze 1.0
Dělení indexů •
•
množství o souhrnné o individuální jednoduché složené úrovně o souhrnné o individuální jednoduché složené
První členění na indexy množství a úrovně je členěním na indexy extenzivních a intenzitních ukazatelů a vychází z typu ukazatele. Ve druhém stupni dělíme indexy na individuální a souhrnné. Kritériem je stejnorodost či nestejnorodost ukazatele. Individuální indexy jsou indexy stejnorodých (extenzivních i intenzitních). Indexy stejnorodých ukazatelů dále členíme na jednoduché a složené indexy. Jednoduché indexy jsou takové, ve kterých neprovádíme shrnování. Složené indexy jsou indexy stejnorodého intenzitního nebo extenzivního ukazatele, kde shrnujeme dílčí hodnoty sledovaného ukazatele. Obecně jsou definovány tři ukazatelé. Dva extenzivní označeny q a Q a jeden Q intenzitní označený p, pro který platí p = . Toto označení vychází ze vztahu mezi cenou, q hodnotou a množstvím.
Jednoduché individuální indexy Jednoduché indexy jsou veličinami, které srovnávají dvě hodnoty téhož ukazatele. Budeme-li srovnávat hodnotu intenzitního ukazatele p v situaci 1 (v časovém období -> i) a p v situaci 0 (v časovém nazývání jako základní období) dostaneme I p = 1 . Analogicky p0 Q q potom I Q = 1 a I q = 1 . Z těchto vztahů vyplývá I Q = I q • I p . Odpovídající přírůstky Q0 q0 ∆p = p1 – p0; ∆Q = Q1 – Q0 a ∆q = q1 – q0. Individuální jednoduché indexy se často vyskytují sdružené do delších časových řad (období 5 až 10 let). V takovém případě mohou být indexy počítány ke stejnému indexu (nejstarší hodnota) nebo k proměnlivému základu a to tak bezprostředně předcházejícímu časovému údaji. Pokud budeme srovnávat ke stejnému základu => bazické indexy, pokud srovnáváme za sebou jdoucí hodnoty => řetězové indexy.
Gausovo rozložení Toto rozložení je nejdůležitějším rozložením SNP. Řídí jím náhodná proměnná, která je výsledkem působení mnoha vzájemně nezávislých jevů. Používá se k aproximaci jiných, často složitějších náhodných proměnných a má ¨klíčovou roli při aplikaci mnoha statistických metod.
- 24 Jiří Sitta © 2004
Statistika
verze 1.0
Obecné rozložení závisí na dvou parametrech. Na µ a δ 2 . Střední hodnota a rozptyl popisují střed a náhodný rozptyl bodu kolem něho. N( µ ; δ 2 ) −1⎛ x − µ ⎞ ⎟ δ ⎠
⎜ 1 Funkce hodnoty: f ( x) = •e 2⎝ δ 2π
2
; x ∈ (− ∞; ∞ )
Graf f(x) je Gausova křivka - křivka má zvonovitý tvar a je souměrná podle křivky x = µ - střední hodnota rozhoduje o vrcholu křivky a δ o rozptýlení křivky 1 ⎤ ⎡ - souřadnice vrcholu ⎢ µ ; ⎥ ⎣ δ • 2π ⎦
-
x
1
−∞
δ • 2π
distribuční funkce F ( x) = ∫
•e
−1 ⎛ x − µ ⎞ •⎜ ⎟ 2 ⎝ δ ⎠
dx
- 25 Jiří Sitta © 2004
Statistika
verze 1.0
12. Indexy Vztahy mezi řetězovými a bazickými indexy •
Postupným násobením řetězových indexů získáme řadu bazických indexů. Součin řady řetězových indexů = bazický index
q q q1 q2 q3 • • ...... n = n q0 q1 q2 qn −1 q0 •
Postupným dělením bazických indexů získáme řadu řetězových indexů. Podíl dvou za sebou následujících bazických indexů = řetězový index.
qk qk −1 q : = k q0 q0 qk −1
Kruhová zkouška • •
řetězové indexy lze jakoby „uzavřít“ součin řetězových indexů vydělený posledním bazickým musí dát 1, pokud nevyjde 1, pak jsme někde udělali chybu ⎛ q1 q2 q3 q ⎞ q ⎜⎜ • • ...... n ⎟⎟ / n = 1 qn−1 ⎠ q0 ⎝ q0 q1 q2
Růměné tempo růstu • •
roční tempa růstu měříme pomocí řetězových indexů průměrné tempo růstu určíme geometrickým průměrem n ročních temp růstu n
q1 q2 q3 q • • ...... n q0 q1 q2 qn−1
Složené individuální indexy •
jsou to indexy stejnorodého, extenzivního nebo intenzitního ukazatele, které používáme za situace, kdy hodnoty daného ukazatele jsou členěny na dílčí hodnoty a v rámci výpočtu indexů provádíme shrnování n
I (∑ Q) =
∑ Q1i i =1 n
∑Q i =1
n
Q1i = p1q1
0i
I (∑ q) =
∑q i =1 n
1i
∑q i =1
0i
- 26 Jiří Sitta © 2004
Statistika
verze 1.0
Index proměnlivého složení •
intenzitní ukazatel, který shrnuje průměr n
∑Q
1i
i =1 n
Ip Ip = 1 I p0
∑q i =1 n
1i
Q1i = p1i q1i Q q1i = 1i p1i
∑Q i =1 n
0i
∑q i =1
0i
Index stálého složení •
index s váhou 1 ISS (q1) n
∑ p1i q1i i =1 n
∑q
:
∑ p0i q1i i =1
n
∑q
1i
i =1
•
n
n
=
1i
i =1
∑p i =1 n
q
1i 1i
∑p i =1
q
0i i
index s váhou 0 ISS (q0) n
n
∑p q ∑p i =1 n
1i 0 i
∑q i =1
:
i =1
0i
n
q
0i 0i
n
∑q i =1
=
0
∑p q i =1 n
1i 0 i
∑p i =1
q
0i 0i
Index agregátní (souhrnný) • •
různorodé veličiny na jednom místě nestejnorodé veličiny (různorodé) nelze průměrkovat, lze je agregovat (shrnovat) typ agregace vyjádříme Qi = ∑ Qi = ∑ qi pi
•
z toho vytvoříme index – index hodnotový
∑pq
1 1
IH =
∆H = Qi = ∑ qi pi − ∑ q0 p0
∑p q
0 0
i
•
postupným rozkladem hodnotového indexu můžeme získat dvě varianty indexů
∑q p ∑q p
1 1
0
•
0
=
∑q p • ∑q p ∑q p ∑q p 1 1
0
1
0
0
0
1
nebo
∑q p ∑q p
1 1 0
1
=
∑q p • ∑q p ∑q p ∑q p 1
0
1 1
0
0
1
0
index hodnotový jsme rozložili na index objemový a index cenový.
- 27 Jiří Sitta © 2004
Statistika
verze 1.0
Cenové indexy •
Cenové indexy mají své názvy: o Paascheho I cpaa =
∑q p ∑q p
1 1
1
=
∑q p = ∑q p p qp ∑p qp ∑ p 0
0
1 1
1 1
1 1
1 1
1
1
p0
o Laspeyresův
I cla =
∑q p ∑q p 0
1
0
0
=
∑q p ∑q p 0
1
0
0
p1
∑p q p = ∑p q 0
0
0
0 0
Fisherův index •
F
Hodnoty Laspeyresova a Paascheho SCI dávají při srovnání stejných souborů více či méně odlišné výsledky. I. Fisher navrhl kompromisní řešení ve formě geometrického průměru těchto dvou indexů
I ( p) =
la
I ( p )• paa I ( p ) =
∑pq ∑p q
1 0 0 0
•
∑pq ∑p q
1 1 0 1
- 28 Jiří Sitta © 2004