HOSPODÁŘSKÁ A SOCIÁLNÍ STATISTIKA 1. REGRESNÍ A KORELAČNÍ ANALÝZA Popisuje průběh a těsnost závislosti kvantitativních znaků, zjišťuje příčinnou souvislost mezi nimi Řadí se mezi vícerozměrné statistické metody Závislost:Jednostranné-y = závisle proměnná (vždy jen jedna) x = nezávisle proměnná (1 a více) Oboustranné - původní závisle proměnná se promění v nezávislou a naopak Závislost příčinná (kauzální) – jeden jev (příčina) vyvolává existenci (vznik, změnu, zánik apod.) jevu druhého (důsledek). Závislost pevná – výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a naopak). Průběh závislosti (v určitém intervalu) lze přesně charakterizovat určitou matematickou funkcí. Volná závislost – jeden jev podmiňuje jev jiný jen s určitou pravděpodobností a v různé intenzitě. U této závislosti lze charakterizovat teoretický průběh závislosti a její těsnost. Závislost statistická – volná závislost týkající se kvantitativních statistických znaků. K matematickému popisu statistických závislostí, jakož i k ověření deduktivně odvozených teorií, slouží metody regresní a korelační analýzy. Druhy statistických závislostí ■ podle počtu kvantitativních znaků: * závislost jednoduchá – dva znaky, * závislost vícenásobná – více než dva znaky, ■ podle typu regresní funkce: * lineární závislost, * nelineární závislost, ■ podle směru změn kvantitativních znaků: * závislost pozitivní (kladná, přímá), * závislost negativní (záporná, nepřímá). 1) Vystihnout průběh závislosti – tzv. tendenci změn, abychom mohli provádět odhady závisle proměnné = vlastní regresní analýza 2)Změřit sílu neboli intenzitu závislosti-abychom mohli říci, jak je závislost silná a zároveň abychom mohli posoudit přesnost regresních odhadů z předcházejícího bodu = korelační analýza REGRESE - vyjadřuje průběh závislosti mezi kvantitativními znaky pomocí matematického modelu. (regresní fce) REGRESNÍ KOEFICIENT (b)-udává, jak se změní závislá proměnná, pokud se nezávislá proměnná změní o jednotku KORELACE - vyjadřuje sílu závislosti. Měří těsnost (sílu, intenzitu, míru) statistické závislosti mezi kvantitativními znaky. Měří se korelačním koeficientem KORELAČNÍ KOEFICIENT (r) – udává sílu závislosti, čím víc se blíží extrémům, tím je silnější závislost rϵ〈1;1〉 Přímá r ϵ (0;1⟩ Nepřímá r ϵ ⟨-1;0) Hodnoty korelačního koeficientu: - pod 0,3 = velmi slabá závislost - nad 0,8 = velmi silná závislost PARCIÁLNÍ KOEFICIENT REGRESE Udává změnu závisle proměnné (Y) při jednotkové změně j-té proměnné (Xj), za předpokladu že ostatní nezávisle proměnné jsou konstantní. Vyjadřuje pouze část vlivu působících na proměnnou Y, proto se k jejich názvu připojuje Parciální.
KOEFICIENT ÚPLNÉ KORELACE Těsnost závislosti závisle proměnné na všech nezávislých proměnných najednou. FISCHEROVA Z- TRANSFORMACE Metoda, kdy převádíme hodnoty r na hodnoty z, hodnoty z se blíží normálnímu rozdělení. Pro Interval spolehlivosti dílčího korelačního koeficientu.
JEDNODUCHÁ NELINEÁRNÍ REGRESE A KORELACE Regresní fce dle nezávisle proměnných • Jednoduchá = vztah 1 nezávisle proměnné, která působí na 1 závisle proměnnou (x→y) • vícenásobná = vztah více než 1 nezávisle proměnné, která působí na 1 závisle proměnnou (x1,x2,x3,…xk→y) o lineární (regresní přímka) o nelineární (aditivní a multiplikativní fce) KOLIK PROMĚNNÝCH? – 2 KOLIK NEZÁVISLE PROMĚNNÝCH? 1 – x, neboli faktor, vysvětlující proměnná KOLIK ZÁVISLE PROMĚNNÝCH? - 1 - y, vždy jen jedna, nemůže vstoupit víc
Základní úkoly regresní analýzy: ■ získání statistických odhadů neznámých parametrů regresní funkce na základě výběru, ■ testování hypotéz o těchto parametrech, ■ ověřování předpokladů regresního modelu. Určování parametrů regresní funkce (str. 108) Regrese = průběh závislosti mezi oběma proměnnými, je popsán jednoduchými nelineárními regresními fcemi: - pouze 2 proměnné - nezávislá x, závislá y Při vyjádření nelineární regrese se nejčastěji používají následující typy funkcí (křivek): Aditivní typ funkcí (ad=přidat, přičíst, tam kde je + - ) ■ Kvadratická (parabola 2. stupně) ■ Hyperbolická = hyperbola ■ Logaritmická, odmocninná, atd. Multiplikativní typ funkcí (zde je násobení) ■ Exponenciální ■ Mocninná … CÍLEM je dle hodnot určit příslušné parametry METODOU NEJMENŠÍCH ČTVERCŮ získáme SOUSTAVU NORMÁLNÍCH ROVNIC, TO LZE POUZE U ADITIVNÍCH MODELŮ. PROTO SE MULTIPLIKATIVNÍ MUSÍ PŘEVÉST POMOCÍ LOGARITMNICKÉ TRANSFORMACE Př. y´ = a.
(zlogaritmováno) log yi = loga + xi . logb (substituce) Y = A + Bx (podoba rovnice, přímky)
Metoda nejmenších čtverců (str. 109) Požadujeme, aby součet odchylek jednotlivých napozorovaných hodnot závisle proměnné od regresní funkce (teoretických hodnot) byl minimální: = − ´ =min Po úpravách lze následně získat tzv. soustavu normálních rovnic, jejímž vyřešením se určí parametry výběrové regresní funkce. 2
Korelační analýza (str. 116) – měří míru závislosti Korelace je míra, která označuje stupeň závislosti mezi proměnnými. Uvádí se, že dvě proměnné jsou korelované, jestliže určité hodnoty jedné proměnné mají tendenci se vyskytovat společně s určitými hodnotami druhé proměnné. Míra této tendence může sahat od neexistence korelace až po absolutní korelaci. V případě lineární závislosti používáme k vyjádření síly závislosti koeficient korelace, který se značí r (str. 116). Koeficient korelace se pohybuje v intervalu <–1;+1>. Jestliže je koeficient korelace roven ±1, existuje mezi proměnnými lineární funkční závislost. Je-li r = 0, jedná se o lineární nezávislost proměnných. Těsnost závislosti lze hodnotit zhruba takto: + r přímá závislost. - r nepřímá závislost r 2 – koef.determinace Jednoduchá nelineární závislost - síla mezi 2 znaky, měří se pomocí Indexu korelace a indexu determinace , je v intervalu (0;1), nemůže být INDEX KORELACE – nutné poznat, co je na čem závislé ≠ záporný 0 < | r | ≤ 0,3 závislost slabá 0,3 < | r | ≤ 0,8 závislost mírná (střední) 0,8 < | r | ≤ 1 závislost silná = √1 −
´ ȳ
=
´
!
INDEX DETERMINACE = z kolika % jsou změny závisle proměnné vysvětlitelné změnami nezávisle proměnné, " (0;1) To co chybí do 100% jsem závisle nepostihli = nepostihnutelné údaje ( vlivy dalších jiných faktorů, které působí na y – nemoc, počasí, ...)
Popište grafem nějakou fci:
3
2. ANALÝZA KVALITATIVNÍCH ZNAKŮ NOMINÁLNÍ-nelze varianty seřadit ORDINÁLNÍ -Řadí se mezi kvalitativní znaky, ale ve skutečnosti to jsou kvantitativní znaky. Můžeme seřadit od nejnižších po nejvyšší. VÍCENÁSOBNÁ REGRESE A KORELACE Analýza závislosti kvalitativních znaků – znaky jsou vyjádřeny slovně a) Alternativní = vztah dvou obměn (muž/žena) = ASOCIACE b) Množné = vztah více obměn (ano/nevím/ne) = KONTINGENCE Při zpracování tabulek řešíme 2 úkoly: 1) Zda mezi znaky existuje závislost (testy) 2) Pokud ano, jaká je její síla (koeficienty) Schéma asociační tabulky
TESTOVÁNÍ - Postup, při kterém ověřujeme, zda předem vyslovená hypotéza je platná či ne (pod vlivem pozorování to znamená na výběrovém souboru) - Nástrojem je statistický test (několik testů, každý má svůj pevný postup a přijímá nějaký závěr) - Testování jako procedura patří do oblasti statistické indukce (na základě výběrového vyvozuju základní – dedukce opak) - 2 oblasti – teorie odhadu, testování stat. Hypotéz - Pokud chci jistotu, musím pracovat se základním souborem př. sčítání lidí 1x10let - Pravidla volby testů: o n>40 => χ2 Test o n<20 => F-test o 20
40 => nutno zjistit očekávané četnosti * Pokud jsou všechny očekávané četnosti větší než 5 => χ2 Test * Pokud alespoň jedna očekávaná četnost je menší jak 5 => F-Test
χ2 Test nezávislosti - Ho: mezi sledovanými znaky neexistuje závislost - Po vypočtení to musím porovnat s tabulkovým χ2∝ (1) str 182 - Je-li χ2 >χ2∝ (1) Ho zamítáme
4
Fisherův faktoriálový test - Ho: mezi sledovanými znaky neexistuje závislost - Postup: 1) Vyhledáme nejmenší skutečnou četnost 2) Tuto četnost postupně v pomocných 2 – 3 tabulkách zmenšujeme po jedné, až dostanu nulu, při zachování okrajových četností. 3) Pro každou tabulku spočítám pravděpodobnost Pi pomocí faktoriálu 4) Součet všech Pi je hodnotou testovacího kritéria a porovnává se s hladinou významnosti ∝ Pokud ΣPi < ∝ pak Ho zamítáme ΣPi testové kritérium k ∈ P ≤∝ ) Kritický obor (obor zamítnutí Ho) Mc Nemarův test (str.22) - Na základě náhodného výběru provádíme dvojí zjišťování před a po - Ho: v základním souboru se podíl jednotek se zjištěným sledovaným znakem nezměnil Mediánový test - Pro 2 nezávislé výběry - Oba sloučíme do 1 souboru, určíme jeho medián a setřídíme dle velikosti Určení síly závislosti: Koeficient asociace - Z měr založených na veličině χ2 V= Yuleův koeficient asociace Q= Koeficient koligace Y= Znaménkové schéma odchylek – podrobnější hodnocení znaků umožní určit, kde se sdružené četnosti významně odlišují od hypotetických četností Míry rizika či ohrožení - Relativní riziko RR = kolikrát se zvýší pravděpodobnost ohrožení RR= a (c+d)/c(a+b) - Křížový poměr OR = kolikrát je vyšší šance na ohrožení OR= ad/bc - Atributivní riziko AR = o kolik se změní pravděpodobnost ohrožení - Relativní atributivní riziko AF – o kolik %se změní pravděpodobnost ohrožení Schéma kontingenční tabulky
5
Testování závislosti - Test nezávislosti se provádí pomocí χ2 testu dobré shody - Teoretické četnosti – součin okrajových četností dělený celkovým rozsahem souboru
-
Testové kritérium Vypočtenou hodnotu porovnáváme s ,,tabulkovu´´ kritickou χ2 ∝ (k-1)(m-1), kde k =počet obměn 1.znaku, m=počet obměn druhého znaku je-li χ2 >χ2∝ (k-1)(m-1), Ho se zamítá
-
Podmínky použití χ2 testu o Podíl teoretických četností menších než 5 nesmí překročit 20% o Žádná z teoretických četností nesmí být menší než 1 Porušení podmínek o Jestliže nejsou tyto podmínky splněny, pak je nutné spojit slabé skupiny o Slučujeme řádky nebo sloupce – musí být logické, věcně správné a dobře interpretovatelné o Poté opět vyjádříme teoretických četnosti a kontrolujeme podminku
-
U síly závislosti existují určité nedostatky př. citlivost na rozměry tabulky, problematika interpretace,.. To vedlo ke konstrukci Míry predikční charakteristiky typu PRE (Proportional Reduction od Error) str.15 - Nejsou závislé na testovacím kritériu χ2 - Zvlášť se konstruují pro znaky nominální a ordinální Určení síly závislosti Pearsonův koeficient kontingence – ptž nenabývá hodnot 1. Musíme ho normalizovat C= normalizovaný Cn = -
Nepoužívá se pro jednu, ale při porovnání několik kontingenčních tabulek z hlediska míry závislosti
Cramerův koeficient (kramerovo V) V= Čuprorův koeficient kontingence K=
3. PŘÍPRAVA A HODNOCENÍ ANKETNÍHO ŠETŘENÍ Vytvoření projektu výzkumu, definování jednotek a stanovení nutného rozsahu výběru a způsobu výběru, vlastní rozpracování dotazníku, ověření dotazníku a provedení pilotního průzkumu, vlastní shromažďování materiálu, analýza získaného materiálu a jeho zobecnění. DRUHY OTÁZEK UZAVŘENÉ- předem dané možnosti odpovědi OTEVŘENÉ- volná formulace odpovědi POLOOTEVŘENÉ-uzavřené otázky + možnost jedné volné odpovědi IDENTIFIKAČNÍ-na jejich základě je možné třídění daného souboru dotazovaných kontaktní a tréninkové- navázat lepší kontakt s dotazovaným FILTRAČNÍ- umožňují vyloučit ze souboru ty jednotky, u nichž další dotazování ztrácí význam a nemělo by smysl jejich odpovědi hodnotit DOTAZNÍKOVÉ PRŮZKUMY PROGRAMOVÁ OTÁZKA Bývá abstraktní, špatně zodpověditelná, tudíž ji převádíme na otázky zjišťovací. Slouží ke zjištění hlavní věci, ke které chceme pomocí dotazování dojít. ZJIŠŤOVACÍ OTÁZKA Jsou formulovány konkrétněji, odpovědi na ně představují výchozí bázi pro vlastní analýzu hlavního problému.
6
4. ČASOVÁ ŘADY 1. ČASOVÁ ŘADA je posloupnost v čase uspořádaných údajů, zpravidla ve směru minulost přítomnost, z nichž každý se vztahuje buď k určitému časovému úseku (intervalu) nebo k časovému bodu (okamžiku). Cílem analýzy ČŘ 1) charakterizovat (číselně popsat) dynamiku vývoje ukazatele v čase v referenčním období (to období, které jsme si vybrali) pomocí elementárních charakteristik ČŘ 2) na základě dosavadních vývojových tendencí předpovídat = predikovat úroveň ukazatele budoucnosti Základní druhy časových řad a) podle rozhodného časového hlediska * Intervalové časové řady – týden, rok (stav zásob, výroby, zaměstnanců,…) Obsahují údaje, které se vztahují k určitému časovému intervalu Součet časové řady má smysl Př.: vývoj HDP v letech 2000-2011 (intervalem je celý rok) Průměrem je prostý aritmetický průměr ȳ = * * Okamžikové časové řady – rozhodující okamžik (sčítání lidu) Sestaveny z údajů k rozhodujícímu okamžiku Součet časové řady nemá smysl Př.: sčítání lidí, počty zaměstnanců k 1.1. Shrnují se pomocí chronologických průměrů + ,+- +-,+/ + ,+ . .⋯. 1 -
prostý ȳ=
* 2
+ ,+-
vážený ȳ=
=-
. - . / .⋯. * 2
+ ,+ + ,+ 3- 3 . - / 3/ 3- .⋯. 1 -
3
3
-
3
1
.
-
3 1
b) podle periodicity sledování (jak často) * Krátkodobé časové řady (méně jak 1 rok) * Střednědobé časové řady (za 1 rok) * Dlouhodobé časové řady (delší jak 1 rok)
c) podle druhu sledovaných ukazatelů *primárních – spotřeba masa na 1 obyvatele v letech 2005-2010 (vývoj HDP v letech, vývoj sklizně v letech, …) *sekundárních – odvozených ukazatelů (podíl celk. spotřeba : počet obyvatel = sekundární) (vypočteny na základě primárních ukazatelů – HDP na obyvatele v letech …)
d) podle způsobu vyjádření údajů * naturálních (změřit, zvážit) * peněžních
7
Srovnatelnost údajů v časové řadě - Každá časová řada musí splňovat 4 hlediska srovnatelnosti: o hledisko věcné srovnatelnosti – každý musí být stejně metodicky vymezen, musí být stejná (míra nezaměstnanosti) o hledisko prostorové srovnatelnosti – porovnání regionu formace prostoru stále stejný (kraje) o hledisko časové srovnatelnosti – pouze u intervalových ČŘ zachovaná (1 měsíc, 1 rok) o hledisko cenové srovnatelnosti – podceňováno, peníze ve stálých cenách, buď sami stanovit, nebo ve spolupráci s ČSÚ 2. ELEMENTÁRNÍ (= ZÁKLADNÍ) CHARAKTERISTIKY ČASOVÝCH ŘAD Slouží k popisu časových řad, slouží k rychlé informaci o charakteru a chování ukazatele v časové řadě = DYNAMIKY VÝVOJE a člení se: a) diference různého řádu absolutní (stejné jednotky), nebo relativní (%) b) tempa růstu a průměrného tempa růstu c) průměry (obecně) d) bazický index (báze=základna) a) Absolutní charakteristiky První absolutní diference 425 =63 − 63
Druhá absolutní diference
4
5
kde t=2, 3, … , n
2
= 432 − 4251
kde t=3, 4, … , n
b) Relativní charakteristiky Bazický index 78 = Koeficient růstu
5
9
73 =
5
t=2, 3, … , n
51
7=
Průměrný koeficient růstu Tempo přírůstku
=3 =
Koeficienty zrychlení
>5
51
=
5
1
:72 ∗ 7 ∗ 7*
2
=
1
<
51
51
>-5
?3 = >
51
c) Průměr u intervalové ČŘ vypočtený jako prostý aritmetický průměr u okamžikové ČŘ se používá chronologický průměr Charakteristické rysy průběhu ČŘ – 3 složky: 1. Trendová – dlouhodobá vývojová tendence 2. Periodická kolísání – výsledek periodicky působících faktorů 3. Náhodná kolísání – neočekávané náhodné neřízené faktory – působení vedlejších faktorů náhodného charakteru, drobné nepravidelné výkyvy, které nemůžeme předvídat.
Každá ČŘ může obsahovat 3 složky, nemůže být nic jiného (1, 2 nebo všechny 3) Dle těchto se dále člení podle přítomnosti složek: a) ČŘ neperiodická s trendovou složkou Ceny pohonných hmot b) ČŘ periodická s trendovou složkou Trend + kolísání periodicity – cestovní ruch, prodej zájezdu, počet nezaměstnaných 8
c) ČŘ neperiodická stacionární Nijaká, nevykazuje trend – v zemědělství vývoj hektarových plodin, klimatické faktory, něco co můžu předvídat d) ČŘ periodická stacionární Elektrika v domácnosti, plyn, chceme, aby byla stabilní, ale když je zima topíme-zvednou se ceny a v létě naopak Periodická = pravidelně něčím ovlivňována 3. Modelování časových řad Princip založen na předpokladu, že jediný faktor dynamiky ukazatele shromážděného v ČŘ představuje čas. Modely založené na tomto principu se nazývají jednorozměrnými modely ve tvaru: 63 = f ( t, @t), kdy 63 je hodnota modelového ukazatele v čase t, t=1,2,3,… (časová proměnná), @t je hodnota náhodné složky (poruchy, chyby,…) v čase t 3 způsoby jednorozměrných modelů: 1) Pomocí klasického (formálního) modelu - Model vychází z dekompozice (=rozklad) řady na 4 složky (formy) časového pohybu, které tvoří systematickou část průběhu ČŘ - Lze ji dekomponovat na složku o trendová složka (Tt) Trend – hlavní tendence dlouhodobého vývoje (rostoucí, klesající,konstantní) o periodická složka (Pt): sezónní (St) nebo cyklická (Ct) Sezónní složka – pravidelně se opakující odchylka od trendu, vyskytující se u ČŘ údajů s periodicitou kratší než jeden rok nebo rovnou právě jednomuroku Cyklická složka – kolísání okolo trendu v důsledku dlouhodobého cyklického vývoje s délkou vlny delší než jeden rok o náhodné kolísání (εt) /epsilon/ Náhodná složka – nelze ji popsat žádnou funkcí času, jejím zdrojem jsou drobné, vzájemně nezávislé a v jednotlivostech nepostižitelné příčiny 2) Pomocí Boxovy-Jenkinsovy metodologie - Považuje za základní prvek náhodnou službu, jež může být vytvořená 3) Pomocí spektrální analýzy
Aditivní model
Multiplikativní model
63A = B3 + D3 + @3 63A = B3 ∗ D3 ∗ @3
9
4. Analýza neperiodických ČŘ - hlavním úkolem je vystižení základní tendence jejich vývoje – trendu. Popis trendu (trendové složky) v časových řadách: a) Graficky – dvourozměrný graf
b) Mechanicky – pomocí klouzavých průměrů str.112-113 častá empirická metoda, klouzavé (sklouznu o období níže) vyrovnání pomocí klouzavých průměrů spočívá v nahrazení skutečných hodnot ČŘ průměrem určitého období při postupném výpočtu průměrů postupujeme ,,kloužeme´´ vždy o 1 pozorování dopředu, přičemž zároveň nejstarší (tj. první) pozorování z té skupiny, z nich je průměr počítán, vypouštíme klouzavé průměry o za lichý počet období o za sudý počet období, kdy střední hodnotu vyhledáme centrováním tzv. centrované klouzavé průměry c)
Analyticky – pomocí trendové fce
4.1. Mechanické vyrovnání Mechanické vyrovnání používá k popisu trendu čáru klouzavých průměrů. Při postupném výpočtu klouzavých průměrů postupujeme („kloužeme“) vždy o jedno pozorování dopředu, přičemž zároveň nejstarší (tj. první) pozorování z té skupiny, z níž je průměr počítán, vypouštíme. . - .⋯. E - . / .⋯. E, , F F
,
/ . H . E,-
F
,…
kde k je délka klouzavého průměru (klouzavý průměr řádu k) 4.2. Analytické vyrovnání ČŘ pomocí trendových funkcí - trendová fce je obdoba jednoduché regresní fce, jde o vyjádření průběhu ČŘ matematickou fcí, kde zkoumaný ukazatel v ČŘ I vystupuje jako závisle proměnná a čas (časová proměnná) jako nezávisle proměnná (t), tedy J3 =f(t) + @3 , kde J3 je vyrovnaná hodnota zkoumaného ukazatele ČŘ, t – časová proměnná, tj. pořadové číslo posloupnosti údajů v ČŘ (t=1,2,3,…n), @3 je náhodná složka - pro analýzu vyrovnání se používají trendové fce, od nich se vyžaduje, aby byli matematicky jednoduché: * minimální počet členů v rovnici * minimální možná mocnina argumentu * linearita v parametru *spojitost * minimální počet extrémů a inflexních bodů
Těmto vlastnostem odpovídají fce: Lineární B3 = a + b·t Kvadratická B3 = a + b·t + c·K Logaritmická B3 = a + b·log t Exponenciální B3 = a · 3 Mocninná B3 = a · K L
Odmocninná Kombinovaná Logistická
B3M N + . √K B3 = a + b . t+ c . √K F
B3 =2.P Q,R5
Pozn.: roky 1993, 1994, … jsou pouze časové informace, které se musí převézt na časovou proměnou K a to 1, 2, … 10
Parametry trendové fce – (musíme určit a, b, c) obvykle se odhadnou pomocí MNČ, která je použitelná v případě, že zvolená trendová fce je lineární v parametrech Σ 63 − J3 2 → UVW 63 = skutečné y´=J3 =J Lineární trend 6 ´ = N + . K , grafem je přímka Parametry lze určit metodou nejmenších čtverců ze soustavy Xormálních rovnic: W . N + ΣK M Σ 6 a Σ K + b ΣK = ΣK 6 Soustavy normálních rovnic pro časté trendové funkce: kvadratický trend (parabola): n . a + b Σ K + c Σ K = Σ 6 a Σ K + b Σ K + c Σ K Y = Σ 6 K a Σ K + b Σ K Y + c Σ K Z = Σ 6 K hyperbolický (lomený) trend: 2
n – a+b Σ = Σ 6 2
3
aΣ +bΣ 3
2
3-
= Σ
3
Řešením této soustavy se pak získají odhady parametrů lineárního trendu a= b=
− .
* * . 3 . * .3 -
3
* 3 .
3
= ȳ − . K
5. Posouzení vhodnosti modelů 1) Základem pro rozhodování o vhodném typu trendové fce by měla být věcně eko kritéria 2) Druhou jednoduchou možností volby je analýza grafů ČŘ (nebezpečí – vizuální výběr fce může být subjektivní a závisí na měřítku!!! Z komára velblouda a naopak, stačí pouze zvětšit měřítko (špatný nákres regrese) 3) Kvalita modelu je porovnána např. pomocí reziduální (zbytek) směrodatné odchylky 4) Často používaným ukazatelem, který slouží k popisu stupně shody, je index determinace [ Σ 63 − 6´3 = 1 − Σ 63 − ȳ Čím je jeho hodnota bližší 1, tím model lépe popisuje zkoumaný jev (=existuje větší soulad s modelem) 5) Kritéria používaná stat.programy (chyby odhadu str 48) M.E. (mean error) – střední chyba odhadu M.S.E. (mean squared error) – střední kvadratická/čtvercová chyba odhadu M.A.E. (mean absolute error) – střední absolutní chyba odhadu M.P.E. (mean percent error) – střední procentní chyba odhadu M.A.P.E. (mean absolute percent error) – střední absolutní procentní chyba odhadu M.A.P.E. =
288 *
. Σ
/ 51 ]5 / 5
Hodnocení při kvalitě modelu M.A.P.E. Menší jak 5% velmi vhodný model 5 – 10 % vhodný model Větší jak 10% méně vhodný model, uvažovat o změně modelu nebo zda neobsahuje složku stacionární, méně přesné prognózy, uvažovat zda tam je trendová složka
11
Adaptivní přístupy k modelování ČŘ (kapitola3.8. SMII.) - dávají novým údajům větší váhu než těm starým - Adaptivní modely vychází z předpokladu, že pro konstrukci prognózy budoucnosti vývoje mají největší význam (váhu) nejnovější pozorování ČŘ , nejnovější=nejsilnější váha/nejstarší=nejslabší
- berou v úvahu ,,stárnutí´´ informací - patří sem: metody exponenciálního vyrovnávání, ARIMA modely,apod - naprosto jiný přístup, nedá se počítat
6. Analýza periodických ČŘ (musí obsahovat periodické kolísání) Menší nebo rovno 1 rok - Sezónnost v časových řadách St (krátkodobé kolísání – zemědělství, stavebnictví, eko, CR, musí mít periodické kolísání)
Delší jak 1 rok – cyklická složka Ct (dlouhodobé kolísání) – může a nemusí být periodické kolísání, nesetkáme se, demografická info, hospodářská krize
Objektivní faktory – klima, roční období Subjektivní faktory – působí omezeně na území – tradice, prázdniny, náboženství, svátky,… Intenzita sezónního kolísání - Měří se pomocí absolutních sezónních odchylek nebo častěji pomocí sezónních indexů ^I 1) Sezónní odchylky _ = − ȳ u ČŘ bez trendu _ = − ` u ČŘ s trendem 2) Sezónní indexy bF]3Pč*á efg*f3h řhg 5 a3 = j kfj*h*á efg*f3h řhg 5´
a =
= lUmV=Vn7á ℎp4WpKN a7JKlčWá q6=pqWNWá Klp=lKVn7á ℎp4WpKN
Vyrovnaná hodnota - průměr řady, celkový průměr ȳ… u ČŘ bez trendu - průměr za rok - klouzavé průměry - u ČŘ s trendem - hodnota vyjádřená z trendové funkce ui- u ČŘ s trendem Postup pro vyjádření z trendové funkce - výpočet trendové funkce - výpočet vyrovnaných hodnot z funkce 63´ - výpočet sezónních indexů - výpočet průměrných sezónních indexů pro jednotlivá období
Náhodné kolísání - Náhodou složkou @K lze vyjádřit ve tvaru @K = 63 − J3 lze chápat jako výsledek působení blíže nespecifického souboru - Popis: pomocí absolutní a relativní průměrné odchylky 7. Korelace časových řad - nutno odstranit trendovou složku z časové řady - korelační analýzu aplikujeme na rezidua obou ukazatelů VHODNOST TRENDOVÉ FUNKCE V ČŘ Posoudím podle Indexu korelace a determinace ( I, vhodně, slabá závislost
). Pokud se I blíží k jedné funkce, je zvolena vhodně. Pokud k nule není zvolena
12
INTERPOLACE V ČŘ - Doplnění chybějících údajů uvnitř ČŘ (válka, povodně, oheň,… posloupnost, nesmí nic chybět) a) Pomocí dvou sousedních hodnot (starší – díra – mladší, něco chybí) – jejich aritmetický průměr X průměrný koeficient růstu (k) b) Pomocí všech údajů v ČŘ – z trendové fce EXTRAPOLACE V ČŘ = odhad údajů ukazatele za horizont známých hodnot → Je to tzv. statistické prognózování. Odhady budoucích hodnot pomocí trendové funkce. Do t dosadíme očekávané období.
-
Předpověď: o Bodová – výsledkem bod, číslo o Intervalová – s určitou pravděpodobností
Index determinace
Posouzení prognózy * pomocí pseudoprognózy – ČŘ zkrátíme o 1 období a vypočítáme modelově hodnotu pro poslední údaj a porovnáme * relativní chyba prognózy - us =
tkfu*ówh bF]3Pč*fb3 bF]3Pč*fb3
* 100
r=
x y . 100 y
%
Je-li us větší jak 5% - velmi dobrá prognóza; mezi 5-10% uspokojivá; větší jak 10% nevhodný model * Theilův koeficient nesouladu: B =
x y y -
* relativní chyba extrapolace T = √B . 100 (%)
* M.A.P.E. – čím menší chyba je, tím je model vhodnější * Index korelace – čím větší tím lepší
5. INDEXNÍ ANALÝZA - pomocí ní provádíme porovnání ukazatelů, které se liší z hlediska věcného, prostorového a časového - Podílem hodnot téhož ukazatele získáme index, rozdílem pak absolutní rozdíl (absolutní přírůstek) ukazatele - Index = bezrozměrná veličina, vyjadřuje podíl a lze ho vyjádřit v % Vymezení a typy ukazatelů Ukazatel – veličina, kt. popisuje určitou sociálněekonomickou skutečnost (údaj je pak konkrétní hodnota) 1) Způsob zjišťování o Primární (prvotní) ukazatele – přímo zjišťované př. počet pracovníků, sklizeň, stav zásob, zboží,…
o
Sekundární – odvozené od primárních, zpravidla podíl či rozdíl př. zisk, produktivita práce, hektarový výnos,…
13
2) Hledisko vyjádření o Absolutní – vyjadřuje velikost určitého jevu bez vztahu k jinému jevu (primární i sekundární) o Relativní – podíl absolutních (jen sekundární) 3) Hledisko doby zjišťování o Okamžikové – k určitému okamžiku (datu) – (počet pr-ků k 1.1.) o Intervalové – za určité období (zisk za měsíc, náklady za rok,…) 4) Hledisko povahy ukazatelů o Extenzitní – absolutní, kt. charakterizují množství, rozsah, objem o Intenzitní – měří intenzitu, úroveň 5) Hledisko shrnování ukazatelů o Stejnorodé – prostý součet má pro daný celek smysl o Nestejnorodé – prostý součet nedává smysl (př objem produkce výrobků, sklizeň různých plodin,…) 6) Hledisko shrnovatelnosti – schopnost ukazatele určit jeho celkovou hodnotu na základě jeho dílčích hodnot o Ukazatele shrnovatelné přímo o Ukazatele shrnovatelné nepřímo o Ukazatele neshrnovatelné Elementární prostředky srovnávání ukazatelů a) Porovnáváme hodnoty ukazatele vzhledem ke stejnému období (bázi) → indexy bazické b) Porovnáváme hodnoty ukazatele vzhledem k období předchozímu → indexy řetězové
PŘEVOD Pomocí dělení převádíme Bazické => Řetězové Pomocí násobení převádíme Řetězové => Bazické Řetězové indexy charakterizují tempo růstu (poklesu) - Koeficient růstu -
Koeficient přírůstku (úbytku)
-
Průměrný koeficient růstu
Hodnota průměrného koeficientu růstu je závislá na první a poslední hodnotě v řadě (ptž dělím poslední prvním) Pokud vykazuje velké výkyvy, tak ztrácí smysl Druhy indexů 1) Individuální - Množství a úrovně; dále je lze dělit na jednoduché a složené - Symbolika: Intenzitní ukazatele p Extenzitní ukazatele q Ceny c 1 značí období běžné 0 značí období základní - Individuální indexy – srovnáváme dvě hodnoty téhož ukazatele o Jednoduché – porovnává množství pro jednu jednotku (není zde třeba shrnování) jednoduchý individuální index množství jednoduchý individuální index úrovně 14
o
Složené – indexy stejnorodého extenzitního a intenzitního ukazatele, kdy dílčí hodnoty shrnujeme za celek. Hodnoty extenzitního shrnujeme pomocí součtu a hodnoty intenzitního pomocí průměru složený individuální index množství Intenzitního ukazatele můžeme shrnovat pouze pomocí váženého harmonického průměru, kde jako váhy užijeme strukturu extenzitního ukazatele q. Tento index se nazývá INDEX PROMĚNLIVÉHO SLOŽENÍ (IPS)
IPS - Tvořen z hodnot extenzitních a intenzitních ukazatelů. Zachycuje změny obou ukazatelů. Je potřeba Lze ho vyjádřit jako součin dvou indexů, z nichž: a) Vyjadřuje vliv změny intenzitní složky při konstantním působení (váze) složky extenzitní=> INDEX STÁLEHO SLOŽENÍ (ISS) b) Vyjadřuje vliv změny extenzitní složky při konstantním působení (váze) složky intenzitní=> INDEX STRUKTURY (ISTR) Váhy mohou být z období základního i běžného, proto 2 způsoby rozkladu
znát i hodnoty ukazatelů, ty zachytí pouze změnu jedné složky, při konstantní hodnotě druhé složky.
2) Souhrnné – představují indexy nestejnorodých extenzivních ukazatelů - Jsou nesouměřitelné, jejich součet nemá pro celkem význam, proto je nutné, abychom je učinili alespoň podmíněně souměřitelnými a to pomocí společných intenzitních ukazatelů (souměřitelů). Nejčastěji souměřitelné jsou ceny - Index hodnotový – souhrnný index charakterizující změnu vytvořené hodnoty
- Hodnotový index- lze rozložit na součin dvou indexů. a) Jeden představuje změnu intenzitní složky =>CENOVÝ INDEX (index úrovně) b) Druhý představuje vliv změny množství (extenzitní ukazatel) =>INDEX FYZICKÉHO OBJEMU (množství)
LASPEYRESŮV
Souhrnné indexy úrovně - Cenové indexy Vliv změny cen při nezměnění váhy (extenzitní složky), a to množství PAASCHEHO LOWEHO FISHERŮV
15
LASPEYRESŮV
Souhrnné indexy množství - Objemové indexy = jsou indexy nestejnorodého extenzitního ukazatele q Podávají info o změnách objemu vytvořené či prodané produkce PAASCHEHO LOWEHO FISHERŮV
LASPEYRESŮV – jako váhy uvažuje množství základního období PAASCHEHO - jako váhy uvažuje množství běžného období LOWEHO – jako váhy bere stálé množství ceny FISHERŮV – představuje geometrický průměr Laspeyresova a Paascheho indexu. Slouží k vyjádření průměru, když chceme vypočítat, jak ovlivnila změna ceny, celkovou změnu. BORTKIEWICZŮV ROZKLAD – lze odpovědět na otázku co je příčinou rozdílu mezi hodnotou Laspeyresova a Paascheho indexu - Rozdíl může být způsoben: o V důsledku variability hodnot znaku (cen – c) o V důsledku variability podílu vah (množství - q) o V důsledku intenzity závislosti průměrových hodnot znaku a podílu vah – korelace mezi objemovými a cenovými indexy SOUMĚŘITEL V INDEXNÍ ANALÝZE Je to hodnota, která srovnává nesrovnatelné, např. cena 6.DEMOGRAFIE 1. ÚDAJE O STAVU OBYVATELSTVA 2. ÚDAJE O POHYBU OBYVATELSTVA POČET OBYVATELSTVA-Okamžikový údaj STŘEDNÍ STAV OBYVATELSTVA-Vychází z průměru počátečního a konečného stavu za dané období SLOŽENÍ OBYVATELSTVA PODLE VĚKU: Biologické generace(I-0-14,II-15-49,II-50+) Index stáří =(obyvatelé nad 65)/(obyvatelé do 14) Ekonomické generace(I-0-19-předproduktivní,II-20-64-produktivní, III-65+-postproduktivní) Index hospodářského zatížení-počet osob, které musí živit svou prací jeden produktivní Vážený index hospodářského zatížení-kolik spotřebních jed. musí svou prací živit jeden produktivní Index závislosti mladých-zelené zatížení Index závislosti starých-šedé zatížení STROM ŽIVOTA VĚKOVÁ PYRAMIDA-představuje věkovou strukturu populace v daném období Progresivní převažuje I. biologická generace na III. biologickou generaci – typická pro rozvojové země Stacionární podíl I. a III. biologické generace je přibližně stejný Regresivní podíl III. biologické generace převažuje nad I. biologickou generací typické pro většinu evropských států DÉLKA ŽIVOTA STŘEDNÍ-naděje dožití, prům.počet let, kt. by se dožil novorozenec při zachování současné úmrtnosti. NORMÁLNÍ-modus délky života, věk, ve kterém lidé nejčastěji umírají PRAVDĚPODOBNÁ-věk, kterého by se při dané úmrtnosti dožila polovina obyvatel (medián) PRŮMĚRNÝ VĚK-průměr současného věku všech obyvatel žijících na daném území
16
KLASIFIKACE NAROZENÝCH Pohlaví, Vitalita (živé x mrtvé), Legitimita (narozen v manželství či mimo), Zralost (připravenost žít),Pořadí(kolikáté dítě se narodilo),Socioekonomická skupina (nejvyšší dosažené vzdělání matky) UKAZATELE POHYBU OBYVATELSTVA PŘIROZENÁ MĚNA ŽIVOTA Úmrtnost (mortalita)-schopnost zemřít (v jakém věku, na co častěji) Plodnost (fertilita)-schopnost rozmnožovat se (v jakém věku, jaké sociální skupiny) Sňatečnost-schopnost vytvářet jednotky, které reprodukci umožňují Rozvodovost-schopnost tyto jednotky rušit EVIDENCE MIGRACE Migrace- schopnost se stěhovat OBRAT MIGRACE O= I (počet přistěhovalých)+ E (počet vystěhovalých) SALDO MIGRACE S=I-EINTENZITA MIGRACE i=I/P x 100
7.EKONOMICKÁ AKTIVITA OBYVATELSTVA AKTIVNÍ Disponibilní pracovní síly-ob.starší 15 let – zaměstnané i nezaměstnané osoby NEAKTIVNÍ Objektivní(předškolní děti, žáci, studenti, starobní důchodci, dlouhodobě nemocní, invalidé) subjektivní(osoby v domácnosti, rentiéři, ostatní fin. zajištění, neochota pracovat) Hospodářské zatížení pracujících osob Podíl počtu neaktivních a počtu zaměstnaných osob Míra ekonom.aktivity obyvatelstva Podíl počtu ekonomicky aktivních osob z celkového počtu obyvatel ZAMĚSTNANOST Placená zaměstnanost Sebezaměstnanost Podzaměstnanost SLEDOVÁNÍ POMOCÍ SČÍTÁNÍ LIDU, DOMŮ A BYTŮ STATISTICKÉ VÝKAZNICTVÍ-sleduje pouze zaměstnané osoby a to pomocí podnikové statistiky EVIDENČNÍ POČET ZAMĚSTNANCŮ-denní stav PRŮMĚRNÝ EVIDENČNÍ POČET ZAMĚSTNANCŮ-Průměr z počátečního a konečného stavu. VÝBĚROVÁ ŠETŘENÍ PRAC.SIL PROVÁDĚNÝCH ČSÚ EVIDENCE ÚŘADŮ PRÁCE A MPSV-měsíční údaje NEZAMĚSTNANOST Registrované osoby hledající práci SLEDOVÁNÍ POMOCÍ ÚDAJE MPSV VÝBĚROVÉ ŠETŘENÍ ČSÚ
8.ŽIVOTNÍ ÚROVEŇ OBYVATELSTVA ŽIVOTNÍ ÚROVEŇ-souhrn všech užitných hodnot, kt. má obyvatelstvo v daném čase a prostoru k uspokojování živ. potřeb k dispozici. ZÁKLADNÍ PRVKY- Příjmy, Spotřeba, Standard bydlení, Volný čas a jeho využití, Stav SZ a soc. péče Při sledování a hodnocení ŽÚ důležité provedení diferenciace do (soc.,ekon.,biolog.) skupin obyvatelstva. Údaje vyjádřeny relativně- na spotřebitelskou jednotku (jednotlivec,domácnost). SPOTŘEBNÍ JEDNOTKA-relativní úroveň spotřeby(příjmu), stupnice spotřebních jednotek rozlišujeme: a)Pro jednotlivce (nutriční hodnoty, na osobu…)
17
b)Pro rodiny (ekonom.spotř.jednotky) METODY ZJIŠŤOVÁNÍ a)Výkaznictví mezd a soc. příjmech b)Výběrové šetření o příjmech domácností-MIKROCENSY c)Daňová statistika d)Statistika rodinných účtů MIKROCENSY Výběrové šetření, zjišťujeme ukazatele o soc. a příjmové diferenciaci domácností. Ve 2-5letých intervalech. Vždy náhodný výběr. Jednotka zjišťování domácnost. Dotazník spracovává instruovaný tazatel. STATISTIKA RODINNÝCH ÚČTŮ Veškeré peněžní a naturální příjmy a výdaje vybraných domácností.Vedou deníky, záměrný výběr, počítá se metodou kvót(asi 3000domácností) PŘÍJMY OBYVATELSTVA Rozduje disponibilní příjem Čisté mzdy a platy zaměstnanců, Čistý příjem z vlastního podniku, Příjmy od družstev, prodej zem.výrobků, provize, důchody, stipendia, soc. podpory, … PRO HODNOCENÍ ŽÚ Průměrný příjem na hlavu, na spotřební jednotku, příjem domácností, domácností na hlavu. Reálné Příjmy =Nominální Příjmy : Index spotřebitelských cen Úhrnný životní příjem-od počátku aktivního věku do doby pozorování Úhrnný celoživotní pracovní příjem- celé prac. období Životní minimum-částka k uspokojení životních potřeb, řeší pouze nejnutnější ex.záležitosti Existenční minimum-dolní hranice životního minima Sociální minimum-horní hranice životního minima SPOTŘEBA OBYVATELSTVA Veškeré spotřební produkty a služby. BYDLENÍ A JEHO PROSTŘEDÍ SOCIÁLNÍ ZABEZPEČENÍ A PÉČE Důchodové zabezpečení Nemocenské pojištění Dávky soc. a státní podpory Soc. péče a podpora v nezaměstnanosti Podpora v nezaměstnanosti ČASOVÝ FOND A VYUŽITÍ VOLNÉHO ČASU Pomocí speciálních dotazníků-ČASOVÉ DENÍKY LORENZOVA KŘIVKA Grafické znázornění kumulativní distribuční funkce rozdělení určité proměnné Např. přiřazuje poměrně rozloženým domácnostem poměrně rozložené důchody Absolutní rovnost přiřazena teoretickou Lorenzovou křivkou (y = x) se sklonem 45o GINIHO KOEFICIENT Rozdíl mezi plochou pod ideální Lorenzovou křivkou a plochou pod skutečnou L. K. s plochou pod ideální křivkou. Giniho koeficient nabývá hodnot od 0 do 1. Čím více se hodnota blíží k 0, tím je rozdělení rovnější a naopak Giniho koeficient sděluje, kolik procent mezd je třeba vyplatit navíc, aby bylo dosaženo dané diferenciace. Y= A/A+B
18