Mendelova univerzita v Brně Provozně ekonomická fakulta
Ekonomické důsledky statistických chyb a omylů Bakalářská práce
Vedoucí práce:
Vypracoval:
doc. Ing. Jiří Blažek, CSc.
Tomáš Náhlík
Brno 2013
Rád bych zde poděkoval vedoucímu bakalářské práce doc. Ing. Jiřímu Blažkovi, CSc. za poskytnutí odborných rad, věcné připomínky, ochotu a vstřícný přístup během zpracování této práce.
Prohlašuji, že jsem bakalářskou práci na téma Ekonomické důsledky statistických chyb a omylů vypracoval samostatně s použitím odborné literatury a pramenů, uvedených v seznamu, který tvoří přílohu této práce. V Brně dne 20. května 2013
__________________
Abstract This bachelor thesis deals with issue of mistakes of statistical reporting. First part describes stages of statistical research and specific points. These points take the most common step on the way to a misconduct or intentional distortion of results. Second part describes statistical reporting since its beginning until present. Furthermore it makes known about specific case of mistakes in statistical reporting and it describes economic consequence. Keywords Statistical reporting, national accounting, mistakes, foreign trade, Czech statistical office, ESA, SNA.
Abstrakt Bakalářská práce se zabývá problematikou chyb a omylů ve statistickém výkaznictví. V první části práce jsou popsány etapy statistického výzkumu a konkrétní body, ve kterých dochází nejčastěji k pochybení, případně k úmyslnému zkreslení výsledků. Ve druhé části je popsáno statistické výkaznictví od jeho vzniku až po současnou podobu. Dále jsou zde uvedeny konkrétní případy, kdy došlo k chybám ve statistickém výkaznictví a jsou popsány jejich ekonomické důsledky. Klíčová slova Statistické výkaznictví, národní účetnictví, chyby, zahraniční obch0d, Český statistický úřad, ESA, SNA.
Obsah
7
Obsah 1
Úvod a cíl práce
11
1.1 Úvod
11
1.2 Cíl práce
11
2
12
Hlavní zdroje chyb a omylů
2.1 Sběr dat
12
2.1.1 Výběr reprezentativního vzorku .............................................................. 12 2.2 Analýza dat
14
2.2.1 Nevhodné použití aritmetického průměru .............................................. 14 2.2.2 Posunutí základu pro výpočet procentuálního podílu ............................ 15 2.2.3 Sčítání procent ......................................................................................... 16 2.2.4 Predikce vývoje časových řad .................................................................. 16 2.2.4.1 Použití jednoduché trendové přímky k predikci časové řady ......... 16 2.2.4.2 Nevhodně zvolená délka časové řady .............................................. 17 2.2.5 Selhání lidského faktoru .......................................................................... 17 2.3 Interpretace výsledků
18
2.3.1 Dogmatické lpění na teoretickém modelu ..............................................18 2.3.2 Reálně nesouvisející korelace .................................................................. 19 2.3.2.1 Korelace způsobené dalším faktorem .............................................. 19 2.3.2.2 Zdánlivé korelace ............................................................................ 20 2.3.2.3 Závěry o korelaci nad rámec zkoumaných dat ............................... 20 2.3.3 Chybná prezentace správných výsledků .................................................. 21 2.3.4 Chybějící vysvětlivky ............................................................................... 22 2.3.5 Ignorování statistické chyby odhadu...................................................... 22 2.4 Grafické zobrazení
23
2.4.1 Hodnoty na ose nezačínají v nule ........................................................... 23 2.4.2 Volba měřítka os ..................................................................................... 25
Obsah
8
2.4.3 Nahrazení absolutních hodnot růstovými koeficienty ........................... 27 2.4.4 Vícerozměrné obrazce............................................................................. 28 2.4.5 Matoucí mapy ......................................................................................... 30 3
Statistické výkaznictví
32
3.1 Statistické výkaznictví v České republice
33
3.2 Architektura národního účetnictví
34
4
Analýza konkrétních případů chyb ve statistickém výkaznictví 37
4.1 Bilance zahraničního obchodu - červenec až listopad 2002
37
4.2 Bilance zahraničního obchodu – leden 2000
39
4.3 Bilance zahraničního obchodu – leden 2005
39
5
Závěr
40
6
Literatura
42
6.1 Knižní zdroje
42
6.2 Zákony a závazné dokumenty
43
6.3 Internetové zdroje
43
6.4 Nepublikované dokumenty
45
7
46
Přílohy
Seznam obrázků
9
Seznam obrázků Obr. 1 Graf znázorňující hustotu normálního rozdělení se střední hodnotou rovnou μ a směrodatnou odchylkou rovnou σ. (WikiSkripta, 2013) 18 Obr. 2 Graf vývoje průměrné mzdy od roku 2008 do roku 2012 s posunutým počátkem osy y, vlastní zpracování dat Českého statistického úřadu (2013) 24 Obr. 3 Graf vývoje průměrné mzdy od roku 2008 do roku 2012 s počátkem osy y v bodě nula, vlastní zpracování dat Českého statistického úřadu (2013) 24 Obr. 4 Graf návštěvnosti hromadných ubytovacích zařízení s malým měřítkem osy y a jejím posunutým počátkem, vlastní zpracování dat Českého statistického úřadu (2013)
26
Obr. 5 Graf návštěvnosti hromadných ubytovacích zařízení s velkým měřítkem osy y a počátkem osy y v bodě nula, vlastní zpracování dat Českého statistického úřadu (2013)
26
Obr. 6
Graf vycházející z absolutních hodnot přírůstků
28
Obr. 7
Graf vycházející z koeficientů růstu
28
Obr. 8
Porovnání jednotlivých druhů zobrazení
29
Obr. 9
Obrázkový graf tvořený lidskými postavami
30
Obr. 10 Mapka USA se zvýrazněnými státy s řídkým osídlením, jejichž GSP je rovno vládním výdajům, vlastní zpracování původní mapy (superia.cz, 2010) 31 Obr. 11 Mapka USA se zvýrazněnými státy s hustým osídlením, jejichž GSP je rovno vládním výdajům, vlastní zpracování původní mapy (superia.cz, 2010) 31
Seznam tabulek
10
Seznam tabulek Sektory a subsektory národního účetnictví, zdroj: Evropský systém účtů ESA 1995 (Český statistický úřad, 2000) 35 Tab. 1 Zjednodušená spojená tabulka dodávek a užití, zdroj: Evropský systém účtů ESA 1995 (Český statistický úřad, 2000) 36 Tab. 2 Zjednodušená symetrická input-output tabulka, produkt na produkt, zdroj: Evropský systém účtů ESA 1995 (Český statistický úřad, 2000) 37
Úvod a cíl práce
11
1 Úvod a cíl práce 1.1 Úvod Bakalářská práce se zabývá chybami a omyly ve statistickém výkaznictví, které je velmi důležitým zdrojem informací o aktuálním stavu a vývoji národního hospodářství. Úlohou statistického výkaznictví není pouze popis minulosti, ale slouží především jako základ pro rozhodování v oblasti fiskální a monetární politiky. Z toho plyne, že je velmi důležité, aby výsledky statistického výkaznictví byly přesné a aby co nejlépe vystihovaly realitu, protože v opačném případě by mohly negativně ovlivnit budoucí vývoj národní ekonomiky.
1.2 Cíl práce Cílem bakalářské práce je identifikace hlavních zdrojů chyb a omylů v průběhu statistického výzkumu. Dále zobecnění společných rysů vybraných případů, ve kterých došlo k chybám ve statistickém výkaznictví a popis ekonomických důsledků těchto chyb.
Hlavní zdroje chyb a omylů
12
2 Hlavní zdroje chyb a omylů Pod pojmem statistika si většinou lidé představí pouhé sbírání čísel. Dříve tomu tak skutečně bylo. Název statistika vznikl z latinského ‚‚status‘‘, což v překladu znamená stát. Původně byla tímto názvem označována disciplína, která se zabývala sběrem informací o státu, například o počtu obyvatel. V dnešní době ovšem statistika neznamená pouhé shromažďování čísel. Stala se z ní plnohodnotná vědecká disciplína, která ve světě nachází velmi široké uplatnění. (Wonnacot, 1995) Pokud se chceme zabývat chybami ve statistických výzkumech, ani ty tedy nemusí být pouze početní, ale mohou vzniknout z mnoha jiných příčin. Každý statistický výzkum lze rozdělit na tři základní fáze, kterými jsou: sběr dat, analýza nashromážděných údajů a vyvození závěrů a jejich následná prezentace. V každé z těchto fází může dojít ke specifickým chybám, a proto bude každá fáze dále rozebrána samostatně. Ovšem ještě dříve, než začneme se samotným projektem, tedy sběrem dat, musíme se důkladně zamyslet nad tím, co vlastně chceme zkoumat. Správně položená otázka je prvním krokem k úspěšnému a kvalitnímu výzkumu. V tomto okamžiku se poprvé dostáváme do situace, kdy můžeme udělat chybu, která následně ovlivní výsledek celého našeho bádání. Pokud nevytvoříme jednoznačnou a konkrétní výzkumnou otázku, můžeme si tím zkomplikovat průběh naší další práce. Vždy musíme znát konkrétní cíl, ke kterému se chceme dopracovat. Pokud by tato otázka byla příliš obecná, nebo bychom ji nevhodně formulovali, mohlo by to vést například k špatné volbě formy sběru dat, nebo následně metody jejich analýzy. (Walker, 2013)
2.1 Sběr dat Výběr správné metody sběru dat je velmi důležitou součástí každého statistického výzkumu. Pokud zvolíme nesprávnou metodu, nebo nevhodný vzorek pro statistiku prováděnou výběrovým šetřením můžeme dojít k zcela chybným výsledkům a nepomohou nám ani sebelepší metody statistické analýzy.
2.1.1
Výběr reprezentativního vzorku
Zdrojem nejčastějších chyb je způsob výběru reprezentativního vzorku. Představme si, že máme hrnec fazolí a některé fazole jsou bílé a některé tmavé. Jediný způsob, jak můžeme zjistit přesný poměr bílých a tmavých fazolí v hrnci je ten, že spočítáme fazole jednotlivých druhů a poměříme jejich množství v hrnci. Pokud si ovšem chceme usnadnit práci a chceme zjistit pouze přibližný poměr těchto dvou druhů fazolí, nabereme hrst fazolí z hrnce, což pro nás bude představovat reprezentativní vzorek, a spočítáme bílé a tmavé fazole, které máme v hrsti. Pro tento postup je ovšem velmi dů-
Hlavní zdroje chyb a omylů
13
ležitý předpoklad, že poměr fazolí je stejný v celém hrnci. Pokud bude náš vzorek dostatečně velký a bude správně vybrán, bude dobře reprezentovat poměr fazolí v celém hrnci. (Huff, 1993) Jako příklad bychom mohli uvést různé průzkumy, které se zabývají uplatněním absolventů vysokých škol na trhu práce. Masarykova univerzita provádí tento průzkum od roku 1994, s výjimkou let 2001, 2003 a 2005. Výsledky z roku 2011 říkají, že 43,7 % absolventů již pracuje, nebo ví, kde bude pracovat. Dále jsou zde uvedeny průměrné nástupní platy absolventů, rozdělené podle jednotlivých fakult univerzity. Při provádění výzkumu bylo osloveno celkem 2231 respondentů a podařilo se získat 1150 vyplněných dotazníků, tedy 54,5 %. (Nekuda, 2011) Počet vyplněných dotazníků je opravdu vysoký, neboť běžná návratnost při dotazníkovém šetření bývá mnohonásobně nižší. Přestože se podařilo získat velké množství odpovědí, musíme se zamyslet, zda skupina respondentů, kteří na dotazník odpověděli, skutečně vystihuje charakteristiky zkoumaného celku. Například je možné, že se respondenti přirozeně rozdělili na dvě skupiny. Na ty úspěšné, kteří mají zajištěnou práci, nebo alespoň pozitivní vyhlídky do budoucnosti, popřípadě vysoký nástupní plat, přičemž se s tím rádi pochlubí a hrdě vyplní dotazník, a na ty, kteří už tak úspěšní nejsou, práci nemají, nebo pracují například jako pokladní v supermarketu za velmi nízký plat, za což se stydí a tudíž dotazník nevyplní, přestože je třeba anonymní. Tomuto faktu by mohla nasvědčovat i návratnost dotazníků, rozdělená podle fakult, kde návratnost například z Ekonomicko-správní fakulty dosahuje 77,6 %, nebo Přírodovědecké fakulty 70,8 %, přičemž absolventi těchto fakult jsou v první polovině statistiky průměrných nástupních platů, zatímco návratnost dotazníků z Filozofické fakulty, která je ve druhé polovině této statistiky, je pouze 37,3 %. Samozřejmě, že rozdílná návratnost dotazníků od studentů jednotlivých fakult může být způsobena zcela jinými vlivy, přesto bychom se vždy při čtení nějaké statistiky měli zajímat, jak vznikl výběrový soubor a zda nemůže být nějakým způsobem deformován. Aby mělo výběrové šetření skutečnou hodnotu, musí být vybrán takový reprezentativní vzorek, který není v žádném případě vychýlený a svým složením odpovídá struktuře celku. Při provádění výběrového šetření bychom vždy měli klást důraz na to, aby měl každý člověk nebo každá zkoumaná věc ze základního souboru stejnou šanci dostat se do výběrového souboru, který budeme dále zkoumat. Při provádění mnoha průzkumů se nevyhneme dotazování lidí, je však velmi složité zvolit takovou metodu, kterou bychom postihli rovnoměrně celý základní soubor. (Huff, 1993) Pokud například vezmeme telefonní seznam a budeme provádět sběr dat po telefonu, automaticky tím vyřadíme z výzkumu lidi, kteří nemají pevnou linku. V dnešní době mají pevnou linku převážně starší lidé a firmy. To znamená, že bychom tímto způsobem sběru dat mohli výrazně zkreslit výslednou statistiku. Obdobně, pokud budeme oslovovat lidi na ulici, nemusí zde být rovnoměrně zastoupeny všechny skupiny.
Hlavní zdroje chyb a omylů
14
Řešením tohoto problému by mohl být stratifikovaný výběr, kdy si zkoumaný celek rozdělíme na několik skupin, většinou podle geografických nebo demografických kritérií. Rozdělením základního souboru na několik skupin zajistíme stejný poměr zastoupení jednotlivých skupin v námi zkoumaném výběrovém souboru jako v souboru základním. (Kozel, 2011) Základní předpoklad použití této metody je ovšem to, že známe poměr zastoupení jednotlivých skupin ve zkoumaném celku. Ovšem zde nastává další problém. Abychom znali tento poměr, musel být v minulosti proveden statistický výzkum, který tento poměr zkoumal. A pokud chceme zajistit kvalitu našeho výzkumu, musíme si být jistí, že i statistiky, ze kterých vycházíme, jsou zcela správné. Při sběru dat pro některé průzkumy do hry vstupuje další faktor a tím je osobní kontakt respondenta a tazatele. Problém může být v tom, že respondenti často odpovídají tak, aby se zalíbili tazateli, a říkají to, co si myslí, že chce tazatel slyšet. Za druhé světové války provedlo americké Národní centrum pro výzkum pokus, při kterém sestavili dva týmy tazatelů, jeden byl tvořen bělochy a druhý černochy. Tyto dva týmy tazatelů se ptaly barevných respondentů na otázku, zda by se podle jejich mínění zacházelo ve Spojených státech s barevnými lépe, pokud by Japonsko dobylo USA. Černým tazatelům odpovědělo 9 % dotázaných, že lépe, zatímco bílým tazatelů stejně odpověděla pouze 2 % dotázaných. Dalším problémem, který je ovšem spojen přímo s tazateli a zároveň s již dříve zmíněnou stratifikací je to, že pokud bude mít tazatel za úkol například tázat se lidí nad třicet let, nejspíš bude oslovovat lidi, kteří tuto věkovou hranici evidentně přesáhli. Do průzkumu tak nebudou zahrnuti lidé těsně nad touto hranicí. (Huff, 1993)
2.2 Analýza dat 2.2.1
Nevhodné použití aritmetického průměru
Na tuto velmi často se objevující chybu upozornil například Helmut Swoboda (1977) ve své publikaci Moderní statistika, kde píše, že v různých statistikách je používán aritmetický průměr na místech, kde nemá prakticky žádnou vypovídací schopnost. Z pohledu laika se jedná někdy až o magickou hodnotu, která umožní pomocí jednoho čísla jednoduše vyjádřit něco, co je jinak skryto v nepřeberném množství hodnot. Bohužel k nevhodnému užití aritmetického průměru nedochází jen z nevědomosti, ale velmi často za účelem zkrášlení výsledků a k manipulaci s konečným čtenářem výzkumu. Jako příklad bychom mohli uvést aritmetický průměr majetku občanů města Redmond v americkém Washingtonu, který je velmi vysoký. Tento fakt ovšem není způsobený tím, že typický obyvatel tohoto města je výrazně bohatší než obyvatel jiného Washingtonského města, nýbrž tím, že zde žije miliardář Bill Gates.
Hlavní zdroje chyb a omylů
15
Na uvedeném příkladu je jasně patrné, že aritmetický průměr může být výrazně ovlivněn extrémními hodnotami a tím pádem v některých případech absolutně ztrácí svoji vypovídací hodnotu. V takových případech je většinou na místě použití jiného ukazatele než aritmetického průměru, který bude pro daný případ vhodnější. Vhodnými ukazateli pro takové případy mohou být například modus, tedy nejčastější hodnota, nebo medián, což je hodnota, která dělí řadu hodnot podle velikosti seřazených výsledků na dvě stejně početné poloviny.
2.2.2
Posunutí základu pro výpočet procentuálního podílu
Vždy, když někde uvidíme nějaký údaj uvedený v procentech, bychom se měli zajímat, z jakého základu byla tato procenta vypočtena. Pozor bychom si měli dát především na několikanásobné snižování nebo zvyšování hodnot. Při každém zvýšení, nebo snížení se totiž mění základ pro výpočet procent. Pokud bychom se například někde dočetli, že se stavebním dělníkům v letošním roce zvýšily platy o 10 %, čímž byla smazána polovina 20% snížení, ke kterému došlo v minulém roce, pravděpodobně tohle tvrzení nebude pravdivé. Procentuální snížení platů v minulém roce bylo totiž vypočteno z jiného základu, než následné navýšení platu. Po snížení platů dosahovali dělníci 80 % původního platu a těchto 80 % procent je nyní nový základ pro výpočet navýšení platů. Ve výsledku tvoří navýšení 8 % původního platu. Lze tedy říct, že bylo smazáno 40 % z původního snížení platů, ale v žádném případě jeho polovina. Pokud by byl výchozí průměrný plat dělníků před jeho snížením například 18 000 Kč, znamenalo by 20% snížení tohoto platu pokles na hodnotu 14 400 Kč. Následné navýšení o 10%, nyní ovšem už vypočtené z nového základu 14 400 Kč, by činilo 1 440 Kč, nikoliv 1 800 Kč, což je polovina předcházejícího poklesu. Konečný plat by tedy byl 15 840 Kč. To stejné platí pro několikanásobné slevy. Pokud je zboží nejprve zlevněno o 50 % a poté o dalších 20 %, neznamená to, že je konečná cena zboží o 70 % nižší než cena původní. Je to stejně jako u snížení platů dělníků způsobeno posunutím základu pro výpočet procentuálního podílu po první slevě. 20% z nové ceny je v tomto případě stejná částka jako 10% z ceny původní. Celková sleva zde tedy činí 60 % z původní ceny. Pokud bychom si tuto skutečnost neuvědomili, mohli bychom dospět k přesvědčení, že jsou reálné i slevy větší než 100 %, což samozřejmě není možné, protože stěží najdeme obchodníka, který nám zaplatí za to, že si od něj něco koupíme. Například pokud by první sleva činila 50 % a druhá 60 %, v případě, že bychom neposunuli základ pro výpočet, získali bychom výsledek 110 %.
Hlavní zdroje chyb a omylů
2.2.3
16
Sčítání procent
Pokud vypočteme procentní podíly zastoupení určitého jevu z několika výběrových souborů, získáme odlišné výsledky a chceme následně zjistit celkové zastoupení tohoto jevu, v žádném případě nesmíme sčítat dílčí zastoupení v jednotlivých výběrových souborech. K správnému výsledku dospějeme vypočtením váženého průměru dílčích výsledků. Mohlo by se zdát, že k takové chybě snad ani nemůže dojít, ovšem opak je pravdou. Příkladem by mohla být chyba Ministerstva vnitra České republiky, která na konci roku 2012 způsobila velký rozruch. Došlo k ní při kontrole správnosti údajů uvedených v petičních listinách prezidentských kandidátů. Podle zákona č. 275/2012 Sb. o volbě prezidenta republiky a o změně některých zákonů (Česká republika, 2012) museli potenciální kandidáti získat 50 000 podpisů, aby byli zapsáni na kandidátní listinu. Dále, dle stejného zákona, proběhlo ověření správnosti údajů na peticích na náhodně vybraném vzorku údajů u 8 500 občanů podepsaných na každé petici. Zjistí-li Ministerstvo vnitra nesprávné údaje u 3 % nebo více než 3 % podepsaných občanů, provede kontrolu na dalším vzorku stejného rozsahu. U všech kontrolovaných petičních listin byla zjištěna chybovost uvedených údajů větší než 3 %, proto byla provedena kontrola na druhém vzorku. Ministerstvo vnitra zde udělalo chybu v tom, že sečetlo výsledky chybovosti z obou zkoumaných vzorků místo toho, aby je zprůměrovalo. Na tuto chybu upozornil jako první Marek Antoš z Právnické fakulty Univerzity Karlovy. Na základě provedené kontroly nebyly registrovány kandidátní listiny Vladimíra Dlouhého, Tomia Okamury a Jany Bobošíkové. První dva jmenovaní by byli vyřazeni z kandidátní listiny i v případě, že by se chybovost obou vzorků zprůměrovala, ovšem Jana Bobošíková by v tomto případě překročila požadovanou hranici 50 000 podpisů. (Kopecký, 2012) Proto se odvolala u Nejvyššího správního soudu, který dne 13. prosince 2012 vynesl rozsudek Č.j. MV-123093-23/VS-2012, který hovoří v její prospěch a kandidátní listina Jany Bobošíkové byla zaregistrována.
2.2.4
Predikce vývoje časových řad
Hlavním cílem analýzy časových řad je snaha o nalezení principu generování jejich hodnot s vyhlídkou toho, že na základě zjištěného principu bude možné extrapolovat i budoucí hodnoty časové řady a tím tedy predikovat její budoucí chování. Z těchto předpovědí je tedy poté částečně možné odhadovat chování reálného systému, ke kterému se daná časová řada vztahuje. (Štědroň, 2012) 2.2.4.1 Použití jednoduché trendové přímky k predikci časové řady Analýzy časových řad mají určitá specifika, kterými se liší od analýz průřezových dat. Jedním z nich je právě to, že jednoduchou trendovou přímku není možné používat k predikci budoucího vývoje časové řady. (Wonnacot, 1995)
Hlavní zdroje chyb a omylů
17
V minulosti byl tento postup zcela běžný. Na příkladech odhadů vývoje populace z poloviny minulého století si můžeme ukázat, jak jsou tyto odhady nespolehlivé. Denis Gabor odhadoval, že pokud by se populační vývoj extrapoloval z dat od roku 1920 do roku 1940, měla lidská populace dosáhnout v roce 2000 3,5 miliardy. V té době bylo toto číslo pokládáno za nejspolehlivější odhad. V roce 1945 byl odhad Franka W. Nosteina pro rok 2000 dokonce ještě nižší a činil pouze 3,35 miliard. (Swoboda, 1977) Dnes víme, že populace v roce 2000 dosáhla 6,1 miliardy (Worldometers, 2013), tedy téměř dvojnásobku tehdejších odhadů. Dalším příkladem by moha být klesající křivka, která znázorňuje snižující se dětskou úmrtnost ve vyspělých zemích. V tomto případě je na první pohled zřejmé, že tato přímka nemůže být libovolně prodloužena a to z toho důvodu, že by se na grafu časem dostala pod osu x a úmrtnost jednoduše nemůže být záporná. Je tedy zřejmé, že tato křivka se v určitém okamžiku zlomí, nebo se její klesající tendence začne postupně zpomalovat a časem se nejspíš ustálí na přibližně konstantní hodnotě. Ve Velké Británii nastal onen okamžik zlomu křivky shodou okolností v době, kdy se zavedlo hromadné očkování dětí. Toho využili odpůrci očkování a tento fakt použili jako ‘‘statistický důkaz‘‘ škodlivosti očkování. (Mareš, 1994) 2.2.4.2 Nevhodně zvolená délka časové řady Aby byla predikce budoucího vývoje časové řady co možná nejpřesnější, je nutné zvolit vhodnou délku časové řady, ze které se bude při výpočtu vycházet. Příliš krátké, nebo naopak příliš dlouhé časové řady do výpočtu vnáší své specifické problémy. Volba správné délky časové řady je proto velmi důležitá. Pokud bude pro výpočet zvolena příliš krátká časová řada, hrozí, že v ní nebude obsažen reálný trend časové řady. Pokud zvolíme pro výpočet naopak příliš dlouhou časovou řadu, mohou se v ní objevit vlivy, které již nejsou aktuální, a proto jsou pro predikci vývoje nežádoucí. Při volbě správné délky časové řady pro predikci jejího budoucího chování je tedy nutné zohlednit vlastnosti a specifika konkrétní zkoumané časové řady. (Štědroň, 2012)
2.2.5
Selhání lidského faktoru
I v případě, že jsou metody, kterými byl proveden statistický výzkum, zcela korektní, sběr dat je proveden vhodným způsobem s přihlédnutím k povaze výzkumu a i analýza dat je provedena zcela správně, zbývá stále jeden důvod ke vzniku chyby, a tím je lidský faktor. Při výzkumu může dojít například k početní chybě, nebo k překliku při zadávání hodnot do počítače. Nejznámějším případem, kdy došlo k takové chybě, je německá studie z roku 1870, která se zabývala obsahem železa v zelenině. Vědec, který zapisoval výsledky výzkumu, posunul desetinnou čárku u hodnoty obsahu železa ve špenátu. Lidé se tak po mnoho let domnívali, že špenát obsahuje desetkrát více železa, než tomu ve skutečnosti je. Tento mýtus se tak rozšířil,
Hlavní zdroje chyb a omylů
18
že se s názorem o vysokém obsahu železa ve špenátu můžeme setkat dodnes. Tato chyba pravděpodobně dala vniknout i kreslené postavičce Pepka námořníka, který po konzumaci špenátu získal nadlidskou sílu. (Tesařová, 2013)
2.3 Interpretace výsledků 2.3.1
Dogmatické lpění na teoretickém modelu
Mnoho náhodných veličin nabývá hodnot, jejichž četnosti jsou rozděleny podle Gaussovy křivky. Křivka má zvonovitý tvar, je souměrná podle nejvyšší četnosti, a přestože oběma konci klesá k ose x, nikdy nedosahuje nulové hodnoty. Tento typ rozdělení pravděpodobnosti je rovněž označován jako normální rozdělení. Gaussovo rozložení uspokojivě popisuje například chyby při fyzikálních měřeních nebo ekonomických pozorováních. (Wonnacot, 1995)
Obr. 1 Graf znázorňující
hustotu normálního rozdělení se střední hodnotou rovnou μ a směrodatnou odchylkou rovnou σ. (WikiSkripta, 2013)
V Anglii byl k placení alimentů odsouzen muž, který mohl být otcem dítěte pouze v případě patnáctiměsíčního těhotenství. Znalci, kteří byli přizváni žalobkyní, potvrdili, že doba těhotenství je statistickým znakem respektujícím Gaussovo rozdělení s průměrem 270 dnů. Podle tohohle modelu existuje pro patnáctiměsíční těhotenství pouze malá, ale stále kladná pravděpodobnost. Obhajobu bohužel nenapadlo uvést, že podle stejné logiky by se mohlo dítě narodit s kladnou pravděpodobností dokonce i dříve, než bylo počato. (Mareš, 1994) Prakticky žádný teoretický model není absolutní. Každý model má své hranice použitelnosti. A pokud tyto hranice překročíme, pravděpodobně tím dojdeme k zcela chybným závěrům.
Hlavní zdroje chyb a omylů
2.3.2
19
Reálně nesouvisející korelace
Korelační počet je matematický postup, který činí číselná zjištění o souvislostech dvou měřených hodnot. Druh těchto měřených hodnot je pro korelační počet zcela bezvýznamný. Pokud existuje nějaká souvislost, bude to jasně vidět z výsledku výpočtu. Více nebo méně zřetelná korelace však ještě neříká, že existuje vnitřní přímá souvislost mezi zjištěnými hodnotami a už vůbec ne, že existuje příčinná souvislost. Matematicky prokázaná korelace může být zapříčiněna dalším faktorem, nebo se může jednat o zdánlivou korelaci. (Swoboda, 1977) 2.3.2.1 Korelace způsobené dalším faktorem Uvést zde můžeme například vztah platů pastorů a cenou alkoholu. Po dlouhou řadu let lze dokázat, že je mezi nimi zřejmá souvislost. Zamysleme se zde ovšem nad tím, co je v tomto případě příčinou a co následkem. Je snad možné, aby pastoři zkonzumovali takové množství alkoholu, že by tím znatelně ovlivnili poptávku a tím zvýšili jeho cenu? Pravděpodobně ne. Ani plat pastorů ovšem neplyne z prodeje alkoholu, tudíž zvýšení jeho ceny by nemělo mít vliv na jejich platy. Do hry zde vstupuje další faktor, kterým je v tomto případě inflace. Postupem času prostě rostou jak ceny zboží, tak platy ve všech profesích. (Swoboda, 1977) Tento příklad byl docela zřejmý a lze si snadno logicky domyslet, že mezi uvedenými jevy není přímá věcná souvislost. Často se ovšem můžeme setkat s korelacemi, které lze snadno a zcela nepochybně matematicky potvrdit a současně se může zdát, že u nich existuje zřetelná příčina a následek. Tak tomu může být u často prezentované souvislosti mezi dosaženým vzděláním a finančními příjmy. Z mnoha průzkumů vyplývá, že čím vyššího vzdělání člověk dosáhne, tím bude mít v průměru vyšší plat. Problém zde nastává v tom, že se výsledky souvislosti mezi dosaženým vzděláním a peněžními příjmy často prezentují tak, že pokud půjdete studovat, budete pravděpodobně vydělávat více peněz, než kdybyste se pro studium nerozhodli. Tento závěr je ovšem nepodložený, protože vychází z předpokladu, že lidé, kteří dosáhli vyššího vzdělání, vydělávají více peněz právě díky tomuto dosaženému vzdělání. Tento fakt ovšem nemůžeme potvrdit. Jediné, co potvrdit můžeme, je fakt, že lidé s vyšším vzděláním vydělávají v průměru více. Je možné, že tito lidé by vydělávali tolik peněz i bez dosaženého vzdělání. Tomu by nasvědčovalo to, že studovat chodí především děti chytré anebo děti z bohatých rodin. Chytré děti by mohly využít své schopnosti a dosáhnout vyšších příjmů i bez vyššího vzdělání. A co se týká dětí z bohatých rodin, jen málo z nich se nějakým způsobem dostane do nízkopříjmových pásem, ať už studují, nebo nikoliv. (Huff, 1993)
Hlavní zdroje chyb a omylů
20
2.3.2.2 Zdánlivé korelace Korelaci je možné hledat mezi vším, a v jisté míře také mezi vším existuje. Pokud k matematicky prokázané statistice připojíme vlastní výklad: „statistika dokazuje, že…“, často se tím dopustíme hrubé chyby. Statistika totiž pouze zjistila korelaci, ale neřekla nic o příčině a následku. (Swoboda, 1977) Zajímavým příkladem je několika nizozemskými statistikami prokázaná pozitivní korelace mezi počtem hnízdících čápů a počtem narozených lidských dětí. Samozřejmě, že zde žádná příčinná souvislost neexistuje. Počet hnízdících čápů je ovlivněn především aktuálním počasím a počet narozených dětí mohly ovlivnit různé faktory, které však byly aktuální devět měsíců před narozením dětí. S největší pravděpodobností právě díky těmto statistikám vznikly báchorky pro děti o čápech, kteří je přinesli. (Sapsford, 2006) Zdánlivou korelací je také notoricky známá závislost mezi délkou dámských sukní, které jsou právě v módě, a vývojem cen akcií. Říká se, že pokud budou ženy nosit krátké sukně, ceny akcií porostou. Tato závislost však nebyla nikdy prokázána, a když se nad ní racionálně zamyslíme, žádná souvislost zde snad ani existovat nemůže. 2.3.2.3 Závěry o korelaci nad rámec zkoumaných dat Korelační analýza má největší uplatnění v oblasti vědeckých experimentů. Pokud se při pokusu podaří udržet všechny faktory, které ho mohou ovlivnit v rovnováze a vždy změnit pouze zkoumaný faktor, můžeme někdy získat tak jednoznačné výsledky, že můžeme mluvit o statistickém důkazu. (Swoboda, 1977) Představme si pole, na jehož celé ploše se nachází stejný druh půdy. Tohle pole osejeme stejným osivem a rozdělíme ho na menší části. Každou část poté budeme jinak vydatně zalévat. Když po sklizni provedeme analýzu výnosů z jednotlivých políček, zřejmě zjistíme, že existuje kladná korelace mezi množstvím vláhy, kterou jsme jednotlivým částem pole dodali, a výnosem z nich. Z výsledků by se tedy mohlo zdát, že čím více budeme zalévat, tím větší bude úroda. Tohle tvrzení může být pravdivé, ovšem pouze v rozsahu provedeného pokusu, jelikož korelace nelze extrapolovat donekonečna. Pokud bychom překročili hranice, ve kterých byl pokus proveden, nemůžeme si být zjištěnými korelacemi jistí. Pokud bychom naše pole zalévali tolik, že by na něm zůstávala voda stát a pokud bychom na něm nechtěli pěstovat rýži, nejspíš bychom zvýšení výnosu nedosáhli. Naopak by se výnosy začaly postupně snižovat. Z provedeného pokusu byla zjištěná kladná korelace, ovšem kdyby se tento pokus rozšířil, v určitém bodě by došlo ke zlomu a korelace by se změnila v zápornou. (Huff, 1993)
Hlavní zdroje chyb a omylů
2.3.3
21
Chybná prezentace správných výsledků
Již dříve jsme se zabývali problémy, které mohou vzniknout, pokud pro výpočet zvolíme aritmetický průměr namísto jiné vhodnější charakteristiky. Nyní ve fázi interpretace výsledků se ale dostáváme do situace, kdy je nějaká statistika vypočtena správně, ovšem její výsledky jsou použity k něčemu jinému, než o čem ve skutečnosti vypovídají. Typický příkladem může být průměrná hrubá mzda, která podle Českého statistického úřadu (2013) ve 4. čtvrtletí roku 2012 dosáhla 27 170 Kč. Samozřejmě, že zde nechci kritizovat metody Českého statistického úřadu a ani nechci tvrdit, že ukazatel průměrné hrubé mzdy nemá žádný význam a o ničem nevypovídá. Naopak je to jistě důležitý údaj, který má své opodstatnění. Často je však nesprávně interpretován a to především v rámci politiky. Z úst politiků můžeme často slyšet, že průměrná mzda je nějaké konkrétní číslo, což znamená, že si tolik vydělá běžný občan. To ovšem není pravda, zhruba 60 % pracujících lidí průměrné hrubé mzdy nedosahuje. (Podnikatel.cz, 2012) Jak už bylo uvedeno v předcházející kapitole, aritmetický průměr bývá výrazně ovlivněn extrémy, k čemuž dochází i při výpočtu průměrné hrubé mzdy, kdy je výsledek ovlivněn malým počtem lidí s velmi vysokými platy. Medián hrubé mzdy za 4. čtvrtletí roku 2012 je pouze 22 446 Kč, což znamená, že 50 % lidí si vydělalo méně, než je tato hodnota. Uvedená průměrná hrubá mzda je zde zhruba o 21 % vyšší než její medián. Ani v případě, že od politiků uslyšíme, že se hrubá mzda za jejich období vlády zvýšila, nemůžeme věřit tomu, že se tím zákonitě zvýšila životní úroveň všech nebo většiny ekonomických vrstev obyvatelstva, jak by tomu bylo patrné z projevu daného politika. Zvýšení průměrného platu může být zapříčiněno například nárůstem platů malé části nejlépe placených lidí anebo naopak třeba zvýšením minimální mzdy, což jistě přímo nezvýší životní úroveň většiny populace. S podobným problémem se potýká velká část statistik, ve kterých se objevují výrazy, ze kterých je patrné, že se jedná o nějakou střední hodnotu, není zde už ale uvedeno, zda je daná hodnota medián, modus, nebo průměr, popřípadě o jaký konkrétní průměr se jedná. Pokud se vychází z hodnot, jejichž rozdělení se blíží Gaussovu rozdělení, nebude mezi těmito hodnotami velký rozdíl. Jak už bylo uvedeno, Gaussova křivka má zvonovitý tvar a v ideálním případě, kdy jsou data základního souboru rozdělena přesně podle tohoto teoretického modelu, se bude nacházet průměr, medián i modus v jednom bodě, a to na vrcholu křivky. (Huff, 1993) Pokud ovšem budeme chtít popsat například již zmíněné peněžní příjmy obyvatelstva, křivka popisující rozdělení hodnot již nebude mít pravidelný zvonovitý tvar, ale pravděpodobně bude zpočátku strmě stoupat a po dosažení vrcholu bude pozvolna klesat. Průměr v tomto případě jistě nebude ve stejném bodě jako medián, ale bude od mediánu posunut doprava na ose x, hodnota průměru bude tedy vyšší než hodnota mediánu.
Hlavní zdroje chyb a omylů
2.3.4
22
Chybějící vysvětlivky
Pokud u nějaké statistiky chybějí podstatné vysvětlivky, tato statistika ztrácí svou vypovídací hodnotu a především věrohodnost. Je to tím, že vysvětlivky většinou nechybí náhodou nebo nějakým nedopatřením, nýbrž úmyslně. Typicky se s tímto jevem můžeme setkat v různých reklamních kampaních například na přípravky na hubnutí, kosmetiku, zubní pasty nebo šampóny proti lupům. V reklamě se můžeme dozvědět například, že je statisticky dokázáno, že po použití zázračné pilulky na hubnutí během nějakého období viditelně zhublo 71,4 % zkoumaných uživatelů pilulky. Nikde se už ovšem nedočteme, jak tohle číslo vzniklo, ani s jakou statistickou významností se při výzkumu pracovalo. Pokud by byla v popisku uvedena statistická významnost, se kterou se pracovalo, bylo by na první pohled zřejmé, s jakou pravděpodobností je výsledný údaj skutečným důsledkem užití přípravku a naopak jakou roli zde může hrát náhoda. Pokud ovšem tento údaj uveden není a není uvedena ani velikost souboru, ze kterého výsledek vzešel, tato statistika absolutně ztrácí význam. Uvedená hodnota 71,4 % na první pohled vzbuzuje dojem, že byla vypočtena z velkého souboru dat a svou přesností na desetinu procenta může působit velmi přesně a seriózně. Ve skutečnosti tento výsledek mohl vzniknout i v případě, že po užití zázračné pilulky zhublo pět ze sedmi uživatelů, což už moc věrohodně nevypadá. Pokud je výběrový soubor takto malý, můžeme dojít prakticky k jakémukoliv výsledku. A to tak, že provedeme pokus a pokud s jeho výsledky nebudeme spokojeni, tak provedeme pokus nový. Díky tomu, že je výběrový soubor, se kterým pracujeme, takto malý, hraje zde obrovskou roli náhoda a dříve nebo později se nám podaří uskutečnit pokus, kdy v určitém období zhubne pět ze sedmi lidí, i kdybychom je krmili třeba banány. (Huff, 1993) Dalším velmi často používaným reklamním trikem je použití statistiky, podle které je například devět z deseti uživatelů výrobku s jeho funkcí spokojeno. Typicky se můžeme dozvědět, že devět z deseti šéfkuchařů doporučuje jistý bujón, nebo že devět z deseti opravářů praček doporučuje nějaký přípravek proti vodnímu kameni. Chybí zde ovšem jedna velmi důležitá informace. Nikde se totiž nedozvíme, jak bylo oněch deset šéfkuchařů nebo opravářů vybráno. Pokud by zde bylo uvedeno například devět z deseti náhodně vybraných šéfkuchařů, bylo by všechno v pořádku. Pokud tomu tak ale není, realizátor této statistiky mohl klidně nejprve najít devět šéfkuchařů, kteří bujón doporučí, k nim přidat jednoho, který by ho nedoporučil a najednou máme ‘‘důkaz‘‘ o tom, jak je daný výrobek úžasný.
2.3.5
Ignorování statistické chyby odhadu
Statistickou chybu nesmíme chápat jako chybu způsobenou špatným postupem, ani jako nedostatek modelu. Je to vlastnost statistického modelu, která je měřitelná a její velikost lze ovlivnit. S rostoucí velikostí souboru dat, se kterým pracujeme, se tato chyba zmenšuje. Údaj o velikosti statistic-
Hlavní zdroje chyb a omylů
23
ké chyby, se kterou se pracuje, by měl být uveden u každého výběrového šetření. Se statistickou chybou pracují i testy inteligence. Konkrétně u StafordBinetova IQ testu byla zjištěna chyba odhadu na úrovni 3 %. Výsledky IQ testů ovšem zpravidla nebývají prezentovány jako intervaly, nýbrž jako celá čísla. Představme si dva lidi, dejme tomu, že se budou jmenovat Petr a Jana, kteří podstoupili IQ test. Z výsledků testů vyplývá, že Petrovo IQ je 98 a Janino 101. Jak víme, běžné neboli průměrné IQ je 100. Z výsledků by se tedy dalo odvodit, že Petr má menší IQ než Jana a také že je jeho IQ podprůměrné, naopak Janino IQ je podle výsledků nadprůměrné. Nic takového ale nemůžeme říct s naprostou jistotou. Jak už bylo zmíněno, StafordBinetův IQ test který Petr a Jana podstoupili, pracuje s 3% statistickou chybou. Výsledky testu měly být tedy spíše uvedeny v intervalu, pro Petra od 95 do 101 a pro Janu od 98 do 104. Rovněž údaj o průměrném IQ by bylo vhodné uvádět v intervalu, tedy 100 ±3. Když se nyní podíváme na výsledné intervaly, zjistíme, že je možné, že Petrovo IQ je vyšší než Janino. Rovněž je možné, že Petrovo IQ přesahuje hranici uváděnou jako průměrné IQ a také, že Janino IQ této hranice nedosahuje. (Huff, 1993)
2.4 Grafické zobrazení Grafické zobrazení se pro prezentování výsledků různých výzkumů a statistik používá a bohužel i zneužívá velmi často. Největší jeho výhodou je jednoduchost, se kterou dokáže vyjádřit velké množství informací. Když se čtenář podívá na graf, hned je mu jasné jak daný výzkum dopadl a udělá si představu o jeho výsledcích, aniž by se musel prodírat sáhodlouhými texty nebo tabulkami. Grafické zobrazení sebou ovšem nese velká rizika. Grafy se dají různě upravit, aby byl dosažen kýžený efekt, a to aniž by byla porušena formální pravidla. Výsledky samozřejmě pomocí grafu změnit nelze, je ovšem možné je prezentovat tak, aby vypadaly podle autorových představ.
2.4.1
Hodnoty na ose nezačínají v nule
Jedním ze způsobů, jak vylepšit výsledky, které nejsou takové, jaké bychom si představovali, je vynechání části hodnot na ose y. Ta nebude mít počátek v nule, ale v nějaké jiné hodnotě. Tento postup bývá často zdůvodňován potřebou ušetřit místo, protože se tím zmenší plocha, kterou výsledný graf zabere. (Jones, 2007) V následujících dvou grafech je znázorněn vývoj průměrné mzdy od roku 2008 do roku 2012. Grafy působí značně rozdílným dojmem a na první pohled by se mohlo zdát, že prezentují rozdílná data. Opak je však pravdou, rozdílný sklon křivky znázorňující vývoj průměrné hrubé mzdy je způsoben právě vynecháním části hodnot osy y. Takto upravené grafy se často používají v případech, kdy chce autor zdůraznit rostoucí nebo klesající tendenci křivky. Upravený graf by mohl být navíc podpořen komentářem, kte-
Hlavní zdroje chyb a omylů
24
rý by sděloval, že za posledních pět let došlo k výraznému růstu průměrné hrubé mzdy.
Obr. 2 Graf vývoje průměrné mzdy od roku 2008 do roku 2012 s posunutým počátkem osy y, vlastní zpracování dat Českého statistického úřadu (2013)
Obr. 3 Graf vývoje průměrné mzdy od roku 2008 do roku 2012 s počátkem osy y v bodě nula, vlastní zpracování dat Českého statistického úřadu (2013)
Hlavní zdroje chyb a omylů
25
Naopak neupravený graf by se dal využít opačným způsobem s komentářem, že průměrná hrubá mzda roste jen pozvolna. Vrcholem zneužití takto upraveného grafu je zřejmě jeho umístění vedle grafu neupraveného, který zobrazuje stejný jev za jiné období. Výsledky zobrazené upraveným grafem v kontrastu s grafem neupraveným by působily výrazně lepším dojmem, i když by ve skutečnosti lepší být nemusely.
2.4.2
Volba měřítka os
Dalším způsobem, jak lze opticky výsledky vylepšit, nebo něco zatajit, je vhodná volba měřítka osy y. Pokud bude zvolené měřítko velké, křivka grafu se opticky vyhladí a nebudou zřetelné její výkyvy. Když bude naopak měřítko malé, výkyvy křivky budou velmi dobře viditelné. Opět se tedy tímto způsobem dají prezentovat stejné výsledky různými způsoby. (Jones, 2007) Uvedené dva grafy opět zobrazují stejná data, tentokrát návštěvnost v hromadných ubytovacích zařízeních v České republice v období od roku 2004 do roku 2012. U prvního grafu bylo zvoleno pro osu y poměrně malé měřítko, jak můžeme vidět, hodnoty na ose narůstají po půl milionu a současně nemá osa počátek v bodu nula, což už bylo popsáno dříve. K tomuto grafu by se jistě hodil optimistický komentář, který by tvrdil, že po velkém propadu v návštěvnosti způsobeném ekonomickou krizí, nastal prudký nárůst a majitelé ubytovacích zařízení se tak mohou těšit na vysoké zisky. Když se ale podíváme na hodnotu roku 2007, tedy vrcholu křivky před jejím následným poklesem a hodnotu roku 2009, cože je minimální hodnota, ke které křivka klesla, zjistíme, že zde poklesla návštěvnost pouze o 7,5 %. A to jistě nezní tak dramaticky, jak by se při pohledu na graf mohlo zdát. Osa y druhého grafu má počátek v bodě nula a bylo u ní zvoleno větší měřítko. Hodnoty na ose narůstají po pěti milionech, měřítko je tedy desetinásobné. Tento graf by se naopak dal použít k dementování dopadu ekonomické krize na návštěvnost ubytovacích zařízení. Graf by bylo možno okomentovat tak, že ekonomická krize měla na návštěvnost jen minimální dopad a že je za posledních devět let prakticky konstantní.
Hlavní zdroje chyb a omylů
Obr. 4 Graf návštěvnosti hromadných ubytovacích zařízení s malým měřítkem osy y a jejím posunutým počátkem, vlastní zpracování dat Českého statistického úřadu (2013)
Obr. 5 Graf návštěvnosti hromadných ubytovacích zařízení s velkým měřítkem osy y a počátkem osy y v bodě nula, vlastní zpracování dat Českého statistického úřadu (2013)
26
Hlavní zdroje chyb a omylů
2.4.3
27
Nahrazení absolutních hodnot růstovými koeficienty
V případech, kdy jsou použity růstové koeficienty namísto absolutních hodnot, si musíme uvědomit jejich skutečný význam. Představme si začínající firmu, zabývající se výrobou žárovek, která v prvním roce své existence vyrobí a prodá 100 000 žárovek, ve druhém roce prodá o 50 000 kusů víc, což znamená 50% nárůst prodeje. Když se jí ale v dalším roce podaří prodat opět o 50 000 žárovek více, nárůst prodeje oproti předchozímu roku bude pouze 33,3 %. Pokud bychom uvažovali, že bude tato firma každoročně prodávat o 50 000 žárovek více než v roce předchozím, v desátém roce by koeficient růstu dosáhl pouze 8,3 % Pokud bychom tedy sledovali absolutní hodnoty, mohli bychom říci, že prodeje firmy stabilně rostou a za deset let je tempo tohoto růstu pořád stejné. Když se ale podíváme na koeficienty růstu za jednotlivé roky, mohlo by se zdát, že tempo růstu prodeje se neustále snižuje. Pokud by ovšem byly za jednotlivé roky stejné koeficienty růstu, ve skutečnosti by to znamenalo, že prodej firmy roste exponenciálně. To je způsobeno tím, že základ pro výpočet koeficientu růstu je hodnota minulého období. Stejné hodnoty koeficientů růstu ze dvou odlišných období proto nepopisují nárůst o stejnou hodnotu s výjimkou případu, kdy jsou i hodnoty minulých období použité pro výpočet koeficientu shodné. Nahrazení absolutních hodnot koeficienty růstu samozřejmě není pouze záležitost grafického zobrazení. Stačí například v článku zabývajícím se nějakým růstem či poklesem napsat koeficienty růstu ze tří po sobě jdoucích let, dejme tomu 20 %, 18,3 % a 16,9 %, k těmto koeficientům připojit komentář říkající, že zkoumaná hodnota sice roste, ale přírůstky jsou čím dál menší, a chyba je na světě. Kdyby byla pro výpočet prvního koeficientu použita výchozí hodnota 100, znamenalo by to nárůstu v prvním roce o 20 jednotek, ve druhém o 22 jednotek a ve třetím o 24 jednotek, vždy vzhledem k roku předcházejícímu. Když se nyní podíváme na absolutní hodnoty, zjistíme, že se přírůstky nezmenšují, ale naopak se každý rok zvyšují o dvě jednotky. Když jsou pak koeficienty růstu použity v grafu, namísto absolutních hodnot, výsledek je ještě efektnější, jak můžeme vidět v obrázcích 6 a 7.
Hlavní zdroje chyb a omylů
Obr. 6
Graf vycházející z absolutních hodnot přírůstků
Obr. 7
Graf vycházející z koeficientů růstu
2.4.4
28
Vícerozměrné obrazce
Jednorozměrné zobrazení je nejjednodušším a současně zřejmě nejlépe srozumitelným typem grafického zobrazení. Při popisu reality využívá porovnávání vzdáleností, na první pohled je tedy zřetelný, když je jedna úsečka dvakrát delší než jiná. Problémy mohou nastat, když se v grafickém zobrazení použije další rozměr. Pokud budeme porovnávat dva dvourozměrné objekty, budeme porovnávat jejich obsah, když do zobrazení přidáme navíc
Hlavní zdroje chyb a omylů
29
i třetí rozměr, budeme porovnávat objem zobrazených těles. (Swoboda, 1977)
Obr. 8
Porovnání jednotlivých druhů zobrazení
V obrázku 8 je znázorněno porovnání zmíněných způsobů zobrazení, kdy objekt vpravo je vždy dvakrát větší než druhý objekt stejného typu zobrazení. Když se podíváme na jednorozměrné zobrazení, tedy úsečky, na první pohled je možné odhadnout, že úsečka vpravo je přibližně dvojnásobně dlouhá. To už se ovšem zřejmě nedá říct u dvourozměrného zobrazení, zde pomocí čtverců a kruhů. Asi málokdo by byl schopný při pohledu na tyto dva čtverce nebo kruhy odhadnout, že obrazce vpravo jsou dvakrát tak velký jako ty vlevo. Podobná, nejspíš ještě horší situace vzniká u trojrozměrného zobrazení, zde krychle a koule, kde by se opravdu jen stěží dalo při pouhém pohledu na ně usoudit, že jsou tělesa vpravo dvakrát větší než ty vlevo. Mnoho autorů usiluje o originalitu a hledá při tom působivá zobrazení. Často se přitom ale vytrácí statistická výpověď a zůstává jen nějaká zvláštnost, s jejímž pochopením může mít čtenář více práce, než kdyby mu bylo předloženo obyčejné, ničím výjimečné, ale jednoduše pochopitelné zobrazení. (Swoboda, 1977) Zřejmě nejhůře pochopitelným grafickým zobrazením je takové, které využívá obrázků s nepravidelnými tvary, jako například postav lidí nebo měšců s penězi. Graf, kde jedna postavička člověka zobrazuje milion lidí, nebo měšec tisíce nebo miliony korun, se nazývá obrázkový graf. Tento typ zobrazení se vyvinul z obyčejných sloupcových grafů, kde byly sloupce nahrazeny například lidskými postavami u statistiky zachycující růst populace. Stejně jako u sloupcových grafů udává poměr velikosti zobrazených hodnot výška obrázku (původně sloupce u sloupcového grafu). Problém je
Hlavní zdroje chyb a omylů
30
v tom, že pokud obrázek zvětšíme tak, aby byl dvojnásobně vysoký, zdvojnásobí se i jeho šířka, čímž ve výsledku obrázek působí několikanásobně větší. Pokud čtenář takové statistiky zapojí svoji fantazii, bude tento efekt ještě o něco větší, protože zobrazené objekty jsou ve skutečnosti trojrozměrné. (Huff, 1993)
Obr. 9
Obrázkový graf tvořený lidskými postavami
Na obrázku 9 vidíme tři postavy, druhá postava je dvakrát vyšší než první a třetí je v porovnání s první postavou vyšší čtyřikrát. Jak už bylo uvedeno dříve, tyto výšky zobrazují nějaké skutečné hodnoty. Podobný graf by mohl být využit například ve statistice zkoumající růst populace v určitých státech, přičemž výška postav by zachycovala koeficient růstu obyvatelstva za zvolené období. Malá postavička by nejspíš zachycovala nějaký vyspělý stát s nízkým přírůstkem obyvatelstva, velká pak zřejmě nějakou rozvojovou zemi s vysokým nárostem počtu obyvatel. Použitím takového grafu by autor mohl docílit zdůraznění populační expanze rozvojových zemí a prezentovat ji větší než ve skutečnosti je.
2.4.5
Matoucí mapy
V USA byly jednu dobu velice populární mapky, které znázorňovaly, jakou část národního důchodu spotřebovává federální vláda. Znázorněno to bylo tak, že byly zvýrazněny státy, které dohromady vytvořily stejnou část národního důchodu, kterou spotřebovává federální vláda. Háček spočíval v tom, že byly vyšrafovány státy s velkou rozlohou, ale řídkým osídlením a tudíž nízkým podílem na tvorbě národního důchodu. Z mapy se pak zdálo, že federální vláda spotřebovává výrazně větší část národního důchodu, než
Hlavní zdroje chyb a omylů
31
jaká odpovídala realitě. Zcela opačného efektu, tedy dojmu, že vláda spotřebovává relativně malou část národního důchodu, by se dalo dosáhnout vyšrafováním hustě osídlených států s vysokým podílem na tvorbě národního důchodu. (Huff, 1993)
Obr. 10 Mapka USA se zvýrazněnými státy s řídkým osídlením, jejichž GSP je rovno vládním výdajům, vlastní zpracování původní mapy (superia.cz, 2010)
Obr. 11 Mapka USA se zvýrazněnými státy s hustým osídlením, jejichž GSP je rovno vládním výdajům, vlastní zpracování původní mapy (superia.cz, 2010)
Statistické výkaznictví
32
Součet GSP – gross state product červeně zvýrazněných států na obrázku 10 za rok 2012 je podle serveru usgovernmentspending.com (2013) roven vládním výdajům za tentýž rok, které činily 5,97 x 1012 dolarů. Stejně tomu tak je na obrázku 11, ovšem na rozdíl od obrázku 10, kde byly vybrány státy s řídkým osídlením, jsou zde zvýrazněny státy s vysokou mírou zalidnění a s vysokými hodnotami GSP. Jak můžeme na obrázcích vidět, vhodnou volbou států můžeme dosáhnout efektu, který se pro naše účely hodí.
3 Statistické výkaznictví Národní hospodářství je velmi složitý organismus, který odráží komplexní ekonomické jevy a procesy, vlivy legislativních norem, aktuální mezinárodněpolitické okolnosti i zájmy nejrůznějších politických skupin. Úspěšné řízení takto složitého systému si vyžaduje kvalitní informace o jeho fungování. Tyto informace by měly pomocí modelových schémat umožnit konstrukci účinných nástrojů, které budou sloužit k popisu národního hospodářství a k analýze jeho struktury a vnitřních vazeb. (Hronová, 2000) Snaha o zachycení souhrnných výsledků národního hospodářství se poprvé objevila v polovině 17. století. William Petty a Gregory King se tehdy snažili odhadnout velikost národního bohatství a určit veličinu národního důchodu. Opravdovým předchůdcem myšlenek národního účetnictví ve smyslu modelu národního hospodářství byl však Francois Quesnay, který se pomocí své ekonomické tabulky pokusil mimo odhadu celkového bohatství společnosti popsat i vzájemné vazby ekonomické činnosti. Dalšími velmi významnými teoretiky byli Adam Smith a Karl Marx, kteří rozvinuli tzv. pracovní teorii hodnoty, která se po druhé světové válce stala základem pro makroekonomický model užívaný v zemích s centrálně plánovanou ekonomikou. Zlomovým obdobím pro rozvoj národního účetnictví byla léta světové hospodářské krize, jejíž rozsah a obtížnost jejího řešení poukázaly na nutnost existence modelu, který by zachytil výsledek hospodářské činnosti a poukázal na slabá místa, například problémy ekonomické rovnováhy a stability. První národní účty byly sestaveny ve Velké Británii počátkem čtyřicátých let a jejich cílem bylo především odhadnout mobilizovatelné zdroje pro válečné účely. Ve Francii byly první národní účty sestaveny v roce 1945. K pravidelnému sestavování národních účtů však dochází ve vyspělých státech až od konce čtyřicátých let. Po druhé světové válce začaly tedy vznikat ve státech s tržní ekonomikou různé varianty modelu národního účetnictví a současně s tím ve státech s centrálně řízenou ekonomikou systémy bilancí národního hospodářství. (Hronová, 2000) Rozdílnost jednotlivých modelů a tedy nemožné porovnání jejich výsledků vedlo ke snaze vytvořit standardy národního účetnictví. Prvním byl System of National Accounts - SNA, který byl vytvořen v roce 1952 z iniciativy OSN. Tento standart měl povahu doporučení pro jednotlivé
Statistické výkaznictví
33
členské státy při vykazování národní hospodářské bilance. Oceňování bylo v tomto modelu prováděno pouze v běžných cenách. V roce 1968 byla provedena revize tohoto modelu. Rozšíření modelu přineslo zachycení finančních toků, bilance mezioborových vztahů a také vyjádření ve srovnatelných cenách. Postupem času ovšem tento model přestával vyhovovat rozdílným potřebám vyspělých a rozvojových zemí. Proto byl po dlouhých diskusích vytvořen nový standard, který platí od roku 1993. Nový standard přinesl větší volnost při tvorbě struktury národního účetnictví. Byl definován základní rámec sestavovaných účtů a vedle něj další navazující a doplňující subsystémy. (European Commission, 2009) Vedle standardu OSN vzniká v roce 1970 i Evropský systém integrovaných účtů - ESA vytvořený Evropským společenstvím. Tento systém navazuje na standard OSN a jeho revize z roku 1978 byla doporučeným systémem v zemích Evropské unie až do roku 1998. Další revize tohoto standardu - ESA 1995, navazující na SNA 1993 a měla původně vejít v platnost 1. 1. 1997 současně se vznikem měnové unie. Ale odkladem vzniku měnové unie došlo i k posunutí počátku platnosti nového standardu. Důvodem pro tento posun byla snaha o jednotné vykazování kritérií pro vstup do měnové unie, která vycházejí z národních účtů. Evropský standard ESA 1995 je obsahově prakticky totožný se standardem SNA 1993. Rozdíl je ovšem v tom, že zatímco SNA má pouze doporučující charakter, ESA je závazným dokumentem pro členy Evropské unie. Nejnovější revize standardu OSN bude mít název SNA 2008 a předpokládá se, že většina členských zemí ho přijme do roku 2014. Na něj poté opět naváže evropský standart s označením ESA 2011, jehož platnost se předpokládá od roku 2013 až 2014. (Hronová, 2009)
3.1 Statistické výkaznictví v České republice Do počátku devadesátých let, stejně jak tomu bylo v i v jiných zemích s centrálně řízenou ekonomikou, byl i v Československu používán systém bilancí národního hospodářství, který byl založen na teorii pracovní hodnoty. V roce 1990 rozhodla federální vláda na základě návrhu statistického úřadu zavést systém národního účetnictví, který by tak nahradil doposud užívaný systém bilancí národního hospodářství. Základem pro budování nového systému se stal standard Evropského společenství ESA 1978. Vzhledem k náročnosti přechodu na nový systém byl celý proces rozložen do několikaletého období, během kterého současně existovaly oba systémy. První výpočet hrubého domácího produktu, základního agregátu systému národního účetnictví, byl vypočten pro rok 1992. Byl ovšem zveřejněn až v roce 1995 a vzhledem k rozdělení ČSFR pouze pro Českou republiku. Národní účty za ČSFR nebyly nikdy oficiálně sestaveny a existují pouze jako tzv. experimentální soustavy sektorových účtů za 80. léta a roky 1990 a 1991. Nový systém byl u nás zaváděn poměrně v nevhodnou dobu, protože byl zkomplikován rozpadem ČSFR a také revizí standardu národního účetnictví. Národní účty za rok 1993 publikované v roce 1996 byly již sestaveny podle nového stan-
Statistické výkaznictví
34
dardu ESA 1995. Přechod na nový standard způsobil nesrovnatelnost dat za roky 1992 a 1993. Kvalita údajů byla navíc negativně ovlivněna probíhajícím procesem privatizace, o jehož průběhu neměl Český statistický úřad dostatečné informace. Nedostatek informací o kuponové privatizaci například značně zdeformoval účet domácností. Postupně se zlepšovala kvalita sestavovaných účtů a od roku 2000 se začaly postupně intervaly zveřejňování národních účtů zkracovat až na 9 měsíců pro předběžnou sestavu, která je zpřesňována 18 měsíců po konci období semidefinitivní sestavou. Definitivní sestava je vydávána 30 měsíců po konci období a je už neměnná s výjimkou opravdu výjimečných případů. Dnes je možné říct, že národní účty České republiky plně odpovídají standardům vyspělých evropských zemí. (Hronová, 2009) Vedle kompletních sestav národních účtů vydává Český statistický úřad i aktuální údaje o národním hospodářství vztahující se vždy k předcházejícímu čtvrtletí. Tyto údaje jsou zveřejňovány 70 dní po konci předcházejícího čtvrtletí a jsou součástí čtvrtletních národních účtů publikovaných 90 dní po skončení čtvrtletí. Dále Český statistický úřad vydává tzv. flash estimates, tedy předběžné odhady vývoje hrubého domácího produktu, které jsou zveřejňovány 45 dní po konci čtvrtletí. (Czech statistical office, 2008)
3.2 Architektura národního účetnictví Hlavním výstupem modelu národního účetnictví je hrubý domácí produkt, který je ve státech s tržní ekonomikou považován za hlavní ekonomický ukazatel vyspělosti národní ekonomiky. Na základě tohoto údaje je možné porovnávat výsledky hospodaření různých států, ale také sledovat vývoj národní ekonomiky konkrétního státu. Hrubý domácí produkt a jeho vývoj v čase je nesmírně důležitou informací pro tvorbu monetární i fiskální politiky. Standard ESA 1995 obsahuje dva hlavní soubory tabulek, prvním souborem jsou sektorové účty zobrazující výsledky národního hospodaření na tokových a majetkových účtech a druhým jsou tabulky input-output a účty podle odvětví popisující původ a užití zboží a služeb. Sektorové účty poskytují systematický popis různých etap ekonomického procesu, jako je výroba, tvorba důchodů, přerozdělování důchodů, užití důchodů a finanční a nefinanční akumulace a jsou členěny podle institucionálních sektorů a subsektorů, viz tabulka 1. Systém seskupuje institucionální jednotky do sektorů podle jejich hlavních funkcí a chování. (European Commission, 2013) Institucionální jednotky jsou ekonomické celky, které jsou schopné vlastnit výrobky a aktiva, vstupovat do závazků a zapojují se samostatně do hospodářských činností a transakcí s ostatními jednotkami na svůj účet. Sektorové účty rovněž zahrnují rozvahy, které popisují stavy aktiv, závazků a čistého jmění k začátku a ke konci účetního období. (Český statistický úřad, 2000)
Statistické výkaznictví
35
Sektory a subsektory národního účetnictví, zdroj: Evropský systém účtů ESA 1995 (Český statistický úřad, 2000)
Pod zaNárodní Veřejný hraniční soukromý kontrolou
Sektory a subsektory Nefinanční podniky Finanční instituce Ústřední banka Ostatní měnové finanční instituce Ostatní finanční zprostředkovatelé, s výjimkou pojišťovacích společností a penzijních fondů Pomocné finanční instituce Pojišťovací společnosti a penzijní fondy Vládní instituce Ústřední vládní instituce Národní vládní instituce Místní vládní instituce Fondy sociálního zabezpečení Domácnosti Zaměstnavatelé (včetně osob samostatně výdělečně činných) Zaměstnanci Příjemci důchodů z vlastnictví Příjemci dávek důchodového zabezpečení Příjemci jiných transferových důchodů Ostatní domácnosti Neziskové instituce sloužící domácnostem Nerezidenti Evropská unie Členské státy Evropské unie Instituce Evropské unie Ostatní země a mezinárodní organizace
S.11 S.12 S.121 S.122
S.11001 S.11002
S.11003
S.12201 S.12202
S.12203
S.12301 S.12302 S.124 S.12401 S.12402 S.125 S.12501 S.12502 S.13 S.1311 S.1312 S.1313 S.1314 S.14 S.141+S.142 S.143 S.1441 S.1442 S.1443 S.145 S.15 S.2 S.21 S.211 S.212 S.22
S.12303 S.12403 S.12503
S.123
Input-output tabulky a odvětvové účty popisují podrobněji výrobní proces (strukturu nákladů, vytvořený důchod a zaměstnanost) a toky výrobků a služeb (produkci, dovoz, vývoz, konečnou spotřebu, mezispotřebu a tvorbu kapitálu podle skupin produktů). Pro tyto potřeby systém seskupuje místní činnostní jednotky do odvětví podle jejich typů činnosti. Činnost je charakterizována vstupem produktů, procesem výroby a produkcí komodit. (Český statistický úřad, 2000)
Statistické výkaznictví
36
Tabulky input-output se dělí na tabulky dodávek a užití a symetrické inputoutput tabulky. Tabulky dodávek a užití se člení podle odvětví a produktů, které popisují procesy domácí výroby a transakce s produkty v rámci národního hospodářství. Tyto tabulky vypovídají o struktuře nákladů na výrobu a důchod vytvořený ve výrobním procesu, toky výrobků a služeb vyráběných v národním hospodářství a toky výrobků a služeb ve vztahu k nerezidentům. (Český statistický úřad, 2000) Tabulka 2 je příkladem spojené tabulky dodávek a užití. Tab. 1 Zjednodušená spojená tabulka dodávek a užití, zdroj: Evropský systém účtů ESA 1995 (Český statistický úřad, 2000)
Produkty
Produkty (komodity)
-
Odvětví
Mezispotřeba
Odvětví
Produkce
-
Složky přidané hodnoty
-
Přidaná hodnota
Nerezidenti
Dovoz
-
Celkem
Dodávky celkem podle produktů
Vstupy celkem podle odvětví
Tvorba Konečná Nerezidenti hrubého spotřeba kapitálu
Celkem
Výdaje na Tvorba konečnou hrubého spotřebu kapitálu
Užití celkem podle odvětví
Vývoz
-
-
-
Produkce celkem podle odvětví
Symetrická input-output tabulka přeskupuje údaje o dodávkách a užití do jedné tabulky. Na rozdíl od kombinované tabulky dodávek a užití, kde se k sobě vztahují produkty a odvětví, se k sobě v tabulce input-output vztahují odvětví k odvětví nebo produkty k produktům, viz tabulka 3. Tato tabulka podrobně popisuje procesy domácí výroby a transakce s produkty v národním hospodářství. (Český statistický úřad, 2000)
Analýza konkrétních případů chyb ve statistickém výkaznictví
37
Tab. 2 Zjednodušená symetrická input-output tabulka, produkt na produkt, zdroj: Evropský systém účtů ESA 1995 (Český statistický úřad, 2000)
Výdaje na konečnou spotřebu
Tvorba hrubého kapitálu Tvorba hrubého kapitálu
Užití celkem podle produktů
-
-
-
-
Dovoz
-
-
-
-
Dodávky celkem podle odvětví
-
-
-
Dodávky celkem = užití celkem
Produkty
Nerezidenti
Konečná spotřeba
Produkty (komodity)
Mezispotřeba
Vývoz
Složky přidané hodnoty
Přidaná hodnota
Nerezidenti
Celkem
Celkem
4 Analýza konkrétních případů chyb ve statistickém výkaznictví 4.1 Bilance zahraničního obchodu - červenec až listopad 2002 Pravděpodobně k nejzávažnější chybě ve statistickém výkaznictví v dějinách samostatné České republiky došlo v roce 2002, kdy 1. července vstoupila v platnost novela celního zákona č. 1/2002 Sb. a nová společná vyhláška Ministerstva Financí ČR a Českého statistického úřadu č. 253/2002 Sb. Tato novela přinesla významné změny, zejména v oblasti celních režimů. Cílem této novely byla harmonizace s právními předpisy EU. Český statistický úřad vypracoval tabulku, rozhodující o volbě a zpracování každého celního režimu pro statistické účely, a zaslal ji celní správě s oficiální žádostí o její provedení. Celní správa ovšem nesplnila požadavky zadávací tabulky, konkrétně ustanovení o vývozu po aktivním zušlechtění. Do vývozu byla započtena pouze hodnota dovezeného zboží před zušlechtěním a ne jeho celková hodnota po provedeném zušlechtění. Po významném zhoršení obchodní bilance zjištěné z říjnových údajů vznikly pochybnosti o přesnosti údajů poskytovaných celní správou. Český statistický úřad podle svého vyjádření několikrát na možné nesrovnalosti celní úřad neformálně upozornil. Poté, co 30. prosince celní správa zveřejnila údaje o zahraničním obchodu, požádal Český statistický úřad o svolání naléhavé schůzky, jejímž tématem byla prá-
Analýza konkrétních případů chyb ve statistickém výkaznictví
38
vě podezřelá data. Celní správa předala 13. ledna 2003 Českému statistickému úřadu opravená data o zahraničním obchodu za červenec až listopad, ze kterých vyplýval značný nárůst vývozu. (Český statistický úřad, 2003) Zatímco podle původních chybných dat byl deficit zahraničního obchodu za období od července do listopadu 73,9 miliardy korun, po odhalení chyby a přepočtu tento deficit klesl na 35,2 miliardy. (Ventura, 2003) Po dalším zpřesnění dat klesl deficit zahraničního obchodu dokonce na 31,2 miliardy. (Český statistický úřad, 2013) Se zveřejněním správných dat ovšem nedošlo pouze k revizi bilance zahraničního obchodu, ale i s ní souvisejícím HDP. Podle původních dat vzrostl hrubý domácí produkt za třetí čtvrtletí o 1,5 %, což bylo v té době nejméně za poslední tři roky a zdálo se tedy, že růst české ekonomiky zpomaluje. Po započtení správných dat se ovšem ukázalo, že ekonomika ve skutečnosti vzrostla o 2,7 % a obavy ze zpomalování jejího růstu byly tedy neoprávněné. (iDNES.cz, 2003) Zveřejnění revize zahraničního obchodu 16. ledna 2003 ovlivnilo také kurz koruny. Podle statistik České národní banky (2013) posílila koruna vůči euru na devizovém trhu v den zveřejnění revize o 52 haléřů z původních 31,95 na 31,43 CZK/EUR. Během dalších tří pracovních dní posílil kurz koruny vůči euru až na 31,18 CZK/EUR, ovšem poté se opět vrátil přibližně na hodnotu, které dosahoval v den zveřejnění revize a tu si také udržel do konce měsíce. Český statistický úřad zdůvodnil vznik chyby tím, že se opírá o deklarace Generálního ředitelství cel a že pracuje jen se souhrnnými údaji, které mu Generální ředitelství cel posílá, a tudíž nad těmito daty nemá přímou kontrolu. (Ventura, 2003) Celní správa se hájila tím, že navzdory formálnímu závazku Českého statistického úřadu z února 2002 poskytnout celní správě do léta podrobné pokyny jak uplatňovat nové statistické předpisy v systému zpracování dat, nebyly nikdy tyto pokyny předány a první verze zadávací tabulky jí byla dána k dispozici až v srpnu. Ovšem podle auditu provedeného Eurostatem byly pokyny v dopise Českého statistického úřadu jasné. Zároveň však došel Eurostat k závěru, že nový systém zpracování hodnot vývozu je velmi složitý a k správné definici a použití zadávací tabulky byla nutná úzká spolupráce obou organizací. K této spolupráci ovšem nedošlo. (Český statistický úřad, 2003) Nejvíce zarážející je na tomto případu ovšem to, že k prakticky stejné chybě už jednou došlo. V roce 1995 stejně jako v roce 2002 došlo ke změně metodiky účtování aktivního zušlechťovacího styku. Edvard Outrata, tehdejší předseda Českého statistického úřadu, uvedl, že tehdy celní správa poskytovala Českému statistickému úřadu po revizi metodiky účtování aktivního zušlechťovacího styku chybné údaje o zahraničním obchodu a statistický úřad neměl žádné nástroje, kterými by mohl kontrolovat údaje poskytované celní správou. (Vališ, 2003)
Analýza konkrétních případů chyb ve statistickém výkaznictví
39
4.2 Bilance zahraničního obchodu – leden 2000 Podle původních dat zveřejněných Českým statistickým úřadem dosáhl deficit zahraničního obchodu za leden roku 2000 9,1 miliardy korun, což byl do té doby druhý nejvyšší deficit v historii České republiky. Statistický úřad ovšem z dat, která mu poskytlo Generální ředitelství cel, neodhalil, že se v dovozu skrývají dvě letadla v hodnotě 3,5 miliardy korun, která byla do české republiky dovezena za účelem dokončení výroby, a tudíž se správně do statistik dovozu neměla započítat. Informaci o dvou letadlech, která výrazně ovlivnila výsledek bilance zahraničního obchodu, přinesla Česká národní banka. Vedoucí referátu statistiky Českého statistického úřadu Věra Petrásková uvedla, že statistický úřad dostává od celníků zpracované údaje a o dovozu letadel od nich nedostal avízo. (iDNES.cz, 2000) Tento případ opět ukazuje na nedostatečnou komunikaci mezi Českým statistickým úřadem a Generálním ředitelstvím cel.
4.3 Bilance zahraničního obchodu – leden 2005 Další případ se opět týká zahraničního obchodu a hlavní roli v něm opět hrají letadla. V lednu roku 2005 byla do České republiky dovezena k opravě letadla v hodnotě 9,5 miliardy korun. Od začátku tohoto roku se opravy nevykazují jako odeslání a přijetí zboží v rámci zušlechťovacího styku, ale hodnota oprav se uvádí ve statistice dovozu a vývozu služeb. V případě letadel v hodnotě zhruba 9,5 miliardy korun šlo pouze o opravy a jejich odeslání a přijetí bylo vykázáno chybně. (Krynek, 2005) Český statistický úřad promítnul opravu chyby v pravidelném zpřesňování dat za první pololetí 2. září 2005. Podle tiskové zprávy Českého statistického úřadu chybu způsobil jeden z respondentů, který porušil povinnost zadávat data do statistického systému Intrastat. Zpřesnění zvýšilo výsledek obchodní bilance o 6 miliard korun. (Český statistický úřad, 2005) Podle vyjádření Českého statistického úřadu došlo k odhalení této chyby na základě jejich spolupráce s celní správou, což by mohlo svědčit o zlepšení komunikace mezi těmito dvěma úřady. Ovšem fakt, že byla informace o odhalení chyby zveřejněna 19. 8. 2005, tedy téměř sedm měsíců od doby, kdy tato chyba vznikla, příliš uspokojivý není.
Závěr
40
5 Závěr V první části práce byl popsán průběh statistického výzkumu a v každé jeho části byly identifikovány a popsány typické chyby, ke kterým dochází v průběhu výzkumu z nevědomosti, nedopatřením, ale i úmyslně. Při čtení prakticky jakékoliv statistiky bychom měli být na pozoru. Měli bychom se vždy zamyslet nad způsobem, jak ona statistika vznikla, zda by nebylo vhodné použití jiných metod a zda nemůže být výsledek statistiky nějakým způsobem deformován. Další velmi důležitou informací, o kterou bychom se měli zajímat, je to, kdo a za jakým účelem statistiku vytvořil. Teprve když jsme si těmito věcmi jisti, můžeme statistiku přijmout a považovat její výsledky za správné. Když budeme nyní vycházet z výsledků první části práce a budeme je vztahovat k uvedeným případům selhání systému statistického výkaznictví zachycujícího výsledky národního hospodářství, zjistíme, že Český statistický úřad nemá problémy s analýzou dat, ani s prezentací výsledků. Za to si jistě zaslouží pochvalu, i když je to možná do jisté míry dáno tím, že postupuje podle předepsaných standardů a metodik a tudíž nemá moc velký prostor pro vlastní kreativitu. Problém ovšem nastává ve fázi sběru dat, což je stěžejní část každé statistiky. Jak už bylo psáno dříve, sebelepší metody analýzy nám nepomohou k dosažení správného výsledku, pokud vycházíme z chybných dat. Z uvedených případů vyplývá, že má Český statistický úřad největší mezery v komunikaci s Generálním ředitelstvím cel, od kterého dostává souhrnné informace o zahraničním obchodu. Pokud se zaměříme na případy z let 1995 a 2002, kde došlo k chybě vlivem změny metodiky, je zcela evidentní, že by si takové situace zasloužily hlubší spolupráci Českého statistického úřadu a Generálního ředitelství cel. Bylo by vhodné, aby Český statistický úřad při zavádění nových metodik spolupracoval s jinými institucemi, kterých se tyto změny týkají. A to tak, že by se podílel na sestavování údajů, které za normálních okolností od těchto institucí dostává. Případně, pokud by se na jejich sestavování nepodílel, měl by mít alespoň možnost kontroly těchto údajů. Další dva případy se týkají dovozu zboží za účelem oprav a dokončení výroby, kdy tento fakt Český statistický úřad nebyl schopen z dat poskytnutých Generálním ředitelstvím cel odhalit. Problém zde opět spočívá v tom, že Generální ředitelství cel poskytuje Českému statistickému úřadu pouze souhrnná data, ze kterých nelze odhalit strukturu dovozu a vývozu. Tento problém by mohl být vyřešen tím, že by Generální ředitelství cel začalo poskytovat Českému statistickému úřadu podrobnější data, ze kterých by byl schopen takové případy odhalit. Český statistický úřad samozřejmě nemůže kontrolovat každou položku, ale měl by takto alespoň možnost kontroly dat v případě, že by pojal podezření o tom, že nejsou správná.
Závěr
41
Dalším možným řešením by mohla být povinnost Generálního ředitelství cel upozornit Český statistický úřad na položky dovozu a vývozu, jejichž hodnota přesahuje určitou hranici. Tím by se zabránilo uvedeným dvěma případům zaúčtování dovozu letadel, protože ta by hranici, nad kterou by muselo Generální ředitelství cel na položky upozornit, jistě překročila, a tudíž by je byl Český statistický úřad schopen odhalit. Protože neznám strukturu dovozu a vývozu, nejsem schopen doporučit konkrétní hranici pro tuto povinnost. Tato hranice by ovšem měla být taková, aby zabránila chybnému zaúčtování položek, které by výrazně ovlivnily výsledek národního hospodářství, ale neměla by být příliš nízká, aby nebyl Český statistický úřad přehlcen zbytečnými informacemi. Povinnost Generálního ředitelství cel upozornit na takové položky by sice neřešila systematické chyby, které jsou tvořeny položkami malých hodnot, ale předešlo by se tím chybnému započtení položek vysoké hodnoty, které by mohly výrazně ovlivnit výsledek národního hospodářství. Samozřejmě jsem si vědom, že názor jednoho bakalanta pravděpodobně neovlivní metodiku sběru dat pro statistické výkaznictví. A rovněž na jeho základě zřejmě nebudou přijata žádná preventivní opatření, přesto pociťuji potřebu zavedení takovýchto preventivních opatření, aby se v budoucnosti podobné chyby již neopakovaly.
Literatura
42
6 Literatura 6.1 Knižní zdroje ČESKÝ STATISTICKÝ ÚŘAD. Evropský systém účtů ESA 1995. Praha, 2000. ISBN 978-807-2232-666. EUROPEAN COMMISSION, System of national accounts 2008. New York: United Nations, 2009, lvi, 662 p. ISBN 92-116-1522-4. EUROPEAN COMMISSION. Manual on Government Deficit and Debt — Implementation of ESA95. Luxembourg: Publications Office of the European Union, 2013, 378 s. ISBN 978-92-79-28176-1 HRONOVÁ, STANISLAVA. Národní účetnictví: koncept a analýzy. Vyd. 1. Praha: C. H. Beck, 2000, x, 258 s. ISBN 80-717-9235-7. HRONOVÁ, STANISLAVA. Národní účetnictví: nástroj popisu globální ekonomiky. Vyd. 1. V Praze: C.H. Beck, 2009, xix, 326 s. Beckova edice ekonomie. ISBN 978-80-7400-153-6. HUFF, DARRELL. How to lie with statistics. Ilustrace Irving Geis. New York: Norton, 1993, 142 p. ISBN 03-933-1072-8. JONES, GERALD E. How to lie with charts. 2nd ed. Santa Monica, Calif.: LaPuerta, c2007, xxi, 279 p. ISBN 978-141-9651-434. KOZEL, ROMAN, LENKA MYNÁŘOVÁ A HANA SVOBODOVÁ. Moderní metody a techniky marketingového výzkumu. 1. vyd. Praha: Grada, 2011, 304 s. Expert (Grada). ISBN 978-80-247-3527-6. MAREŠ, MILAN. Statistiky chtějí opatrnost. Vesmír: přírodovědecký časopis Akademie věd České republiky. 1994, č. 3. ISSN 0042-4544. NEKUDA, JAROSLAV. Ukončení studia na Masarykově univerzitě: ohlédnutí a perspektiva 2011. Brno: Masarykova univerzita, 2011. 79 s. SAPSFORD, ROGER. Data collection and analysis. 2nd ed. Thousand Oaks, CA: Sage Publications, 2006, p. cm. ISBN 07-619-4363-3. SWOBODA, HELMUT. Moderní statistika. 1. vyd. Praha: Svoboda, 1977, 351 s. Beckova edice ekonomie. ISBN 978-80-7179-174-4. ŠTĚDROŇ, BOHUMÍR. Prognostické metody a jejich aplikace. Vyd. 1. Praha: C.H. Beck, 2012, xxii, 197 s. Beckova edice ekonomie. ISBN 978-80-7179174-4. WALKER, IAN. Výzkumné metody a statistika. Vyd. 1. Editor Nigel Holt, Robert Lewis. Praha: Grada, 2013, 218 s. Z pohledu psychologie. ISBN 978-8024739-205. WONNACOT, THOMAS H. Statistika pro obchod a hospodářství. Praha: Victoria Publishing, 1995, 891 s. ISBN 80-856-0509-0.
Literatura
43
6.2 Zákony a závazné dokumenty ČESKÁ REPUBLIKA. Zákon o volbě prezidenta republiky a o změně některých zákonů. In: č. 275/2012 Sb. 2012. NEJVYŠŠÍ SPRÁVNÍ SOUD, rozhodnutí Č.j. MV-123093-23/VS-2012. 2012 [cit. 2013-04-29]. Dostupné z: http://www.mvcr.cz/soubor/jana-bobosikovaregistrace-pdf.aspx
6.3 Internetové zdroje CZECH STATISTICAL OFFICE. Quarterly national accounts inventories. [online]. 2008 [cit. 2013-05-08]. Dostupné z: http://www.czso.cz/csu/redakce.nsf/i/metodika_ctvrtletni_ucty/$File/09 087474.pdf ČESKÁ NÁRODNÍ BANKA. Kurzy devizového trhu [online]. 2003 [cit. 2013-05-12]. Dostupné z: http://www.cnb.cz/cs/financni_trhy/devizovy_trh/kurzy_devizoveho_trh u/denni_kurz.jsp?date=04.02.2003 ČESKÝ STATISTICKÝ ÚŘAD. Cestovní ruch - časové řady. [online]. 2013 [cit. 201305-06]. Dostupné z: http://www.czso.cz/csu/redakce.nsf/i/cru_cr ČESKÝ STATISTICKÝ ÚŘAD. Databáze zahraničního obchodu [online]. 2013 [cit. 2013-05-12]. Dostupné z: http://apl.czso.cz/pll/stazo/STAZO.STAZO ČESKÝ STATISTICKÝ ÚŘAD. Mzdy, náklady práce - časové řady. [online]. 2013 [cit. 2013-05-06]. Dostupné z: http://www.czso.cz/csu/redakce.nsf/i/pmz_cr ČESKÝ STATISTICKÝ ÚŘAD. Oprava chyby respondenta zvýší aktivum lednové bilance [online]. 2005 [cit. 2013-05-12]. Dostupné z: http://www.czso.cz/csu/tz.nsf/i/oprava_chyby_respondenta_zvysi_aktivu m_lednove_bilance_19_08_2005 ČESKÝ STATISTICKÝ ÚŘAD. Průměrné mzdy - 4. čtvrtletí 2012. [online]. 2013 [cit. 2013-04-15]. Dostupné z: http://www.czso.cz/csu/csu.nsf/informace/cpmz031113.doc IDNES.CZ. Lednový zahraniční obchod skončil deficitem 9,1 miliardy korun. [online]. 2000 [cit. 2013-05-12]. Dostupné z: http://ekonomika.idnes.cz/lednovy-zahranicni-obchod-skoncil-deficitem9-1-miliardy-korun-pus/ekonomika.aspx?c=A000221184828ekonomika_jjx IDNES.CZ. Oprava vrátila české ekonomice sílu. [online]. 2003 [cit. 2013-0512]. Dostupné z: http://ekonomika.idnes.cz/oprava-vratila-ceskeekonomice-silu-dbt/ekonomika.aspx?c=A030117_120927_komentanalyt_ven KOPECKÝ, JOSEF, DAVID BŘEZINA A ZDEŇKA TRACHTOVÁ. Sčítat, nebo zprůměrovat? Odečet hlasů neúspěšným kandidátům budí dohady. IDNES.cz [online]. 2012 [cit. 2013-04-28]. Dostupné z:
Literatura
44
http://zpravy.idnes.cz/reakce-vyrazenych-kandidatu-na-funkci-prezidentaf7k-/domaci.aspx?c=A121123_150530_domaci_kop KRYNEK, ONDŘEJ. Chyba zkreslila data o přebytku zahraničního obchodu. Novinky.cz [online]. 2005 [cit. 2013-05-12]. Dostupné z: http://www.novinky.cz/ekonomika/63256-chyba-zkreslila-data-oprebytku-zahranicniho-obchodu.html PODNIKATEL.CZ. Více než 60 % Čechů nedosáhne na průměrný plat. [online]. 2012 [cit. 2013-04-15]. Dostupné z: http://www.podnikatel.cz/clanky/vicenez-60-cechu-nedosahne-na-prumerny-plat/ SUPERIA.CZ. Mapa USA. [online]. 2013 [cit. 2013-05-06]. Dostupné z: http://obrazky.superia.cz/mapy/mapa_usa-1280.php TESAŘOVÁ, KRISTÝNA. Nejrozšířenější mýty o zelenině. Top lékař [online]. 2013 [cit. 2013-04-29]. Dostupné z: http://www.toplekar.cz/archivclanku/nejrozsirenejsi-myty-o-zelenine.html USGOVERNMENTSPENDING.COM. Compare Spending By State. [online]. 2013 [cit. 2013-05-06]. Dostupné z: http://www.usgovernmentspending.com/compare_state_spending_2012b Z0a USGOVERNMENTSPENDING.COM. Total 2012 Government Spending. [online]. 2013 [cit. 2013-05-06]. Dostupné z: http://www.usgovernmentspending.com/total_spending_2012USrn VALIŠ, ZDENĚK. Ekonomika. Český rozhlas - Rádio Praha [online]. 2003 [cit. 2013-05-12]. Dostupné z: http://www.radio.cz/cz/rubrika/ekonomika/ekonomika-2003-01-23 VENTURA, TOMÁŠ A LUBOŠ KRATOCHVÍL. Matoucí statistiky odnesli dva šéfové. IDNES.cz [online]. 2003 [cit. 2013-05-12]. Dostupné z: http://ekonomika.idnes.cz/matouci-statistiky-odnesli-dva-sefove-dh6/ekonomika.aspx?c=A030120_145712_ekonomika_klu VENTURA, TOMÁŠ. Obchod s cizinou kazila chyba statistiků. IDNES.cz [online]. 2003 [cit. 2013-05-12]. Dostupné z: http://ekonomika.idnes.cz/obchod-scizinou-kazila-chyba-statistiku-fp2/ekonomika.aspx?c=A030116_100956_komentanalyt_ven WIKISKRIPTA. Gaussovo rozdělení. [online]. 2013 [cit. 2013-04-29]. Dostupné z: http://www.wikiskripta.eu/images/thumb/0/07/Normalni_rozdeleni.png/ 700px-Normalni_rozdeleni.png Worldometers: real time world statistics [online]. 2013 [cit. 2013-05-11]. Dostupné z: http://www.worldometers.info/
Literatura
45
6.4 Nepublikované dokumenty ČESKÝ STATISTICKÝ ÚŘAD. Audit revizí údajů o zahraničním obchodu ČR provedený Eurostatem. Praha, 2003. ČESKÝ STATISTICKÝ ÚŘAD. Tisková informace 17. 1. 2003 - Oprava údajů o vývozu za červenec až listopad 2002. Praha, 2003.
Přílohy
46
7 Přílohy Příloha 1: Zpráva o auditu revizí údajů o zahraničním obchodu provedeném Eurostatem, poskytnutá e-mailem Českým statistickým úřadem
Audit revizí údajů o zahraničním obchodu provedený Eurostatem Praha, 29. – 31. ledna 2003 FAKTA Dnem 1. července 2002 vstoupila v platnost novela celního zákona č. 1/2002 Sb. a nová společná vyhláška Ministerstva Financí ČR a ČSÚ č. 253/2002 Sb. Pro statistiku to znamenalo významné změny, zejména pokud jde o celní režimy, jejichž cílem byla harmonizace s právními předpisy EU. Tyto nové předpisy vedly k nutnosti upravit stávající tabulku rozhodující o volbě a zpracování každého celního režimu pro statistické účely. ČSÚ vypracoval první verzi této tabulky a zaslal ji celní správě 6. srpna. Tabulka byla upravena 24. září a zaslána celní správě s oficiální žádostí o její provedení. Po významném zhoršení obchodní bilance zjištěném z říjnových údajů vznikly v ČSÚ pochybnosti o spolehlivosti údajů poskytovaných celní správou od července dále a ČSÚ požádal o poskytnutí podrobné tabulky s údaji za leden až říjen 2002 v členění podle statistických postupů. 13. ledna celní správa předala ČSÚ čísla o zahraničním obchodu za červenec až listopad, z kterých vyplýval značný nárůst vývozu (36,7 mld Kč). Změna se týkala vývozu po aktivním zušlechtění. Změna nebyla promítnuta do žádných údajů zveřejněných před uvedeným datem – ani do čísel publikovaných ČSÚ měsíčně nebo čísel zveřejněných celní správou 30. prosince 2002. Nebyla také promítnuta do prvního odhadu HDP za třetí čtvrtletí provedeného odborem národních účtů ČSÚ a zveřejněného 11. prosince 2002 a do platební bilance centrální banky ze dne 4. prosince 2002. Po zmíněné revizi ČSÚ vydal 16. ledna nová čísla o zahraničním obchodu a 17. ledna nový odhad HDP.
Přílohy
47
VZNIK CHYBY Celní správa splnila požadavky zadávací tabulky, která jim byla zaslána 24. září, zejména konkrétního ustanovení o vývozu po aktivním zušlechtění, až v lednu. Toto ustanovení se týkalo vykázání celkové hodnoty vyvezeného zboží po zušlechtění a ne pouze, jak vyrozuměl Eurostat, hodnoty zboží dovezené před zušlechtěním. Argumenty celní správy vysvětlující, proč nebyla aplikována zmíněná tabulka:
Před 24. zářím poskytnul ČSÚ celní správě dvě verze tabulky. Z jednání mezi celní správou a ČSÚ konaném 25. září celní správa vyrozuměla, že tabulka zaslaná 24. září má být ještě případně upravena. To je důvod, proč celní správa odložila její aplikaci až do formální dohody mezi oběmi organizacemi. Korekce zavedená v lednu vyplývá z aplikace konkrétního ustanovení o vývozu po aktivním zušlechtění podle požadavku ČSÚ ze dne 24. září.
Celní správa se hájila tím, že navzdory formálnímu závazku ČSÚ z února 2002 poskytnout celní správě do léta podrobné pokyny jak uplatňovat nové statistické předpisy v systému zpracování dat celní správy nebyly nikdy tyto pokyny předány a první verze zadávací tabulky byla dána k dispozici až v srpnu.
POSTUP ČSÚ TÝKAJÍCÍ SE CHYBY ČSÚ poskytnul toto vysvětlení:
S ohledem na záplavy bylo obtížné analyzovat čísla za červenec až září.
Pochybnosti vznikly při analýze říjnových čísel ukazujících zhoršení obchodní bilance. V členění podle statistických postupů čísla ukázala na abnormální pokles vývozu po aktivním zušlechtění.
ČSÚ několikrát neformálně upozornil (telefonicky) celní správu na zmíněné údaje.
Protože celní správa oficiálně nereagovala a ČSÚ neznal velikost anomálie, předpokládal, že se korekce provedou a výsledek zveřejní spolu s údaji za rok 2002 v rámci standardní revize v lednu.
Během tiskové konference uspořádané 11. prosince ke zveřejnění čísel národních účtů za třetí čtvrtletí však bylo ústně upozorněno na některé potíže s údaji obchodní bilance v souvislosti s jinými dostupnými agregovanými údaji.
Poté, co celní správa zveřejnila 30. prosince podezřelé údaje o obchodu, ČSÚ naléhavě požádal a svolání schůzky. Ta se konala 6. ledna.
Přílohy
48
Jakmile celní správa chybu opravila a zjistila se velikost chyby, ČSÚ čísla rychle revidoval a zveřejnil.
ZÁVĚRY EUROSTATU
Podle názoru Eurostatu byly pokyny v dopisu ze dne 24. září jasné.
Podle nových celních a statistických předpisů však zadávací tabulka zavedla pro statistické účely složitý systém zpracování hodnoty vývozu, který vyústil v nedorozumění a obtížnému splnění zadání. Správná definice a použití zadávací tabulky vyžadovaly vysokou úroveň odborných znalostí na obou stranách a úzkou spolupráci mezi oběma organizacemi. Tato spolupráce nebyla v tomto nestandardním období (povodně, významně změněná legislativa) optimální.
Komunikace ze strany ČSÚ, pokud se týká podezření na možnou chybu v číslech publikovaných pro odhad HDP za třetí čtvrtletí, mohla být formálnější a důraznější.
Měsíční bilance zahraničního obchodu ČR měly vysokou úroveň nestability – zejména od ledna 2002. Počáteční bilance zveřejněné za měsíce po červnu 2002 nevykazovaly zjevnou anomálii.
Úroveň vývozu a dovozu zaznamenaná za stejné období nebyla také vyjímečná. Jenom úroveň srpnových vývozů je hodně nízká (80,5 mld Kč – nejnižší číslo od ledna 2000). ČSÚ navíc upozornil na nízký evidovaný počet celních deklarací za tento měsíc, což vysvětloval dopadem povodní na vývoz spolu s obvyklým sezónním vlivem. To mohla být při nedostatku jiných informací přijatelná interpretace.
Vliv povodní zcela jistě ovlivnil organizaci práce ČSÚ.
Identifikace možného problému předpokládala konfrontaci s jinými zdroji dat. V době zveřejnění čísel za červenec až září takové zdroje nebyly k dispozici.
Zhoršení říjnové bilance (v polovině listopadu) způsobilo pochyby u odborníků z ČSÚ. Ti však měli v dané době jiné informace o úrovni ekonomické aktivity. Později se problém začal zkoumat, ale vyšetřování nevedlo před koncem roku k žádným závěrům.
Přílohy
49
Další poznámky Eurostatu k aspektům kvality statistiky obchodu
Bilance, jako je bilance zahraničního obchodu, je statistickou proměnnou velice citlivou na chyby měření. Chyba relativně omezená na jeden z toků (o velikosti několika procent) má násobný dopad na měření bilance.
Eurostat již v minulosti zaznamenal velké revize statistiky zahraničního obchodu předané členskými státy EU.
Například v šesti zemích Unie došlo v roce 2002 k revizi alespoň jednoho z dovozních nebo vývozních toků mimo Společenství větší než 10%.
Na základě žádosti Eurostatu o prošetření národní orgány identifikovaly příčiny těchto anomálií. Šlo například o: nepředání všech nezbytných dat, pozdní deklarace od podniků, chyby deklarujících podniků včas neopravené, zjednodušené postupy celního odbavení, které nepřihlížejí ke statistickým omezením.
V minulosti byly zjištěny i jiné anomálie. Pokaždé členské státy provedly na žádost Komise nápravná opatření.
Mimo Unii, například v USA, také vznikly problémy se zajištěním vyčerpávajícího sledování obchodních toků. Zpráva „Kvalita statistiky vývozu zahraničního obchodu v USA (16. září 1998)“ říká: „Výzkum prováděný formou cenzu v roce 1997 ukázal, že 50% z asi 500 000 měsíčních deklarací o vývozu předkládaných zasilateli obsahuje alespoň jednu chybu. Odhaduje se, že statistické údaje o vývozu jsou podhodnoceny o 3-7% (…) a dokonce až o 10% (na základě cenzu a přístavních auditů celní správy). Z analýzy dat roční zprávy o vývozu ve výši 689 mld USD vyplynulo, že statistické údaje byly podhodnoceny o přibližně 21-69 mld USD (jedna třetina objemu obchodu v roce 1997)“.
Od zavedení Intrastatu v lednu 1993 existují asymetrie v obchodních tocích mezi členskými státy uvnitř EU. Představují zhruba 6% toků, což je přibližně 1% HDP Unie. I přes metodické vklady členských států se je nepodařilo redukovat. Mají však omezený vliv na vývoj HDP, zvážíme-li jejich strukturní povahu.
Přílohy
50
DOPORUČENÍ EUROSTATU
Je nezbytné přehodnotit stávající předpisy pro zpracování hodnoty vývozu pro statistické účely, aby nedocházelo k nesprávnému výkladu a usnadnilo se zpracování dat.
Je nezbytné pečlivě přezkoumat současnou metodiku pro sestavování statistiky obchodu zapracovanou do národní legislativy z hlediska předpisů EU a v kontextu s rozšířením EU.
ČSÚ by měl specifikovat směrnice pro implementaci statistických předpisů ve zpracovatelském systému.
Je třeba posílit a lépe strukturovat spolupráci mezi ČSÚ a celní správou, včetně jasného určení kontaktních osob na obou stranách a na každé úrovni řízení.
V případě výskytu podezřelých údajů by sdělení uživatelům o možných rizicích z takových dat vyplývajících mělo být více transparentní a explicitní.
Je nezbytné rozvíjet kulturu analýz a ekonomické validace statistických dat.
V souvislosti s novou odpovědností a úkoly ČSÚ v budoucnosti (převod zpracování statistických dat a realizace Intrastatu) je třeba zajistit odpovídající finanční prostředky.
Přílohy
51
Příloha 2: Tisková zpráva ze dne 17. 1. 2003 – Oprava údajů o vývozu za červenec až listopad 2002, poskytnutá e-mailem Českým statistickým úřadem
Tisková informace 17. 1. 2003 - Oprava údajů o vývozu za červenec až listopad 2002 Od 1. července 2002 vstoupila v platnost novela celního zákona č. 1/2002 Sb. a na ni navazující nové prováděcí vyhlášky, které změnily pravidla ve vybírání cel, právní výklad a postavení některých celních režimů i jejich zahrnování do statistiky zahraničního obchodu. Dosud publikované údaje o vývozu, které vycházejí z celní statistiky, byly v druhém pololetí v porovnání s prvním pololetím výrazně nižší. Analýzou bylo zjištěno, že chybné údaje se týkají pouze celního režimu vývoz po aktivním zušlechtění. Pokles hodnoty byl vyvolán chybným zařazováním vývozu v tomto celním režimu, což si vyžádalo náročnou revizi údajů pro statistiku vývozu. Byly tak získány odpovídající údaje o vývozu po aktivním zušlechtění a provedena oprava údajů za červenec až listopad 2002. Přepočtené údaje o vývozu po aktivním zušlechtění zvyšují výrazně vývoz a tím podstatně snižují dosud vykázaný schodek zahraničního obchodu za uvedené období. Opravené údaje o vývozu a standardně zpřesněné údaje o vývozu i dovozu vypovídají o konzistentním vývoji zahraničního obchodu v průběhu celého roku 2002 a jsou v souladu s ostatními údaji ČSÚ, zejména s údaji o vývoji produkce.