1. Úvod do studia statistiky Andrew Lang o politikovi:
“Používá statistiku jako opilý člověk pouliční lampu – spíš na podporu než na osvětlení.” Benjamin Disraeli o lži:
“Jsou tri stupně lži - lež, nehanebná lež a statistika.” 1.1. Významy pojmu statistika Slovu „statistika“ může být přisuzován nejrůznější obsah, a proto také existuje mnoho definic. Vzniklo z latinského slova „status“ = „stav“, resp. „štát“. Nejstarší statistikou je „popis státu“, spočívající v zobrazení daného zeměpisného, hospodářského a politického stavu. V současné době pohlížíme na statistiku ze dvou přístupů. Jednak jde o praktickou činnost, tj. evidenční a statistickou praxi, jednak o vědu, která se zabývá zkoumáním hromadných jevů. Statistika jako praktická činnost — statistická administrativa statistická evidence ( např. sběr údajů, tříděni, sumarizace apod.), instituce, která tuto evidenci vykonává (např.. ČSÚ, ministerstva aj.), úhrn údajů o nějaké skutečnosti (statistika nezaměstnanosti atd.) Realizuje prostřednictvím statistického výkaznictví. Těžiště je v soustavě orgánů státní statistiky, která je vytvořena na územním principu a je řízena Českým statistickým úřadem (ČSÚ) se sídlem v Praze. Státní statistické orgány poskytují informace potřebné pro posuzování úrovně sociálního a ekonomického vývoje na příslušné úrovni územní hierarchie a realizují různá další statistická šetření. Statistika jako vědecká disciplína — teorie statistiky Statistická věda je disciplínou zabývající se zkoumáním hromadných společenských jevů a procesů, může jít však i o jevy biologické a technické. I když statistika zkoumá kvantitativní stránku těchto jevů, nesmí být opomíjena stránka kvalitativní. Základním vyjadřovacím prostředkem je číslo. Statistika, chápaná jako vědecká disciplína, má dvě specifické části, a to ekonomickou statistiku a obecnou teorii statistiky (statistické metody): ekonomická statistika - zkoumá kvantitativní stránku národního hospodářství a podle dílčí působnosti se člení na dílčí složky (např. statistika průmyslu, zemědělství, obchodu, obyvatelstva ap.) obecná teorie statistiky - definuje statistické pojmy a prezentuje obecně platné metody pro kvantitativní zkoumání hromadných jevů. Jde o metody Získávání dat statistických údajů, metody jejich zpracování, metody statisticko ekonomické (biologické, technické) analýzy a formy sdělování výsledků. Ekonomická teorie statistiky v podstatě poskytuje metodiku pro ten který účel
1
zkoumání v rámci řešeného problému ekonomické statistiky. Mohou to být například: popisná statistika - výsledky není možné zevšeobecnit, matematická (induktivní) statistika — cílem je zevšeobecnit výsledky (odhad a testování hypotéz) — použiti počtu pravděpodobnosti, teorie výběrových zjišťovaní, aplikované vědy („–metrie“ a „-grafie“): biometrie, dendrometrie, ekonometrie, chemometrie atd. vědy se silným statistickým základem: sociologie, psychologie, demografie.
1.2. Co je typické pro statistiku Zkoumá hromadné jevy. Zabývá se proměnlivými — variabilními — vlastnostmi. Pracuje s čísly a vyjadřuje se pomocí čísel — zajímá se především o kvantitativní stránku reality. Používá výpočtovou techniku na vytváření a správu statistických databází, na hromadné zpracování a analýzu dát a na komunikaci.
1.3. Co „umí“ a „neumí“ statistika Statistika řeší úlohy různého stupně složitosti, počínajíc Získávání datm (počet domácností, počet pracovníků v odvětví XY, objem vývozu ), přes popis struktury (věková struktura obyvatelů, struktura firem z hlediska právní formy podnikání, vyčíslování dílčích ukazatelů v čase a prostoru (výpočet průměrné mzdy v NH, výpočet cenové hladiny spotřebitelských cen), porovnávaní takto agregovaných ukazovatelů v čase anebo prostoru (trend vývoje mezd, změna hladiny spotřebitelských cen), předpovídání jejich budoucí úrovně (tržby v maloobchode v budoucím čtvrtroku, vývoz produktu AB v budoucím roku), měření závislosti (závislost mezd na HDP, závislost vývozu na kurzu koruny). To vše buď na popisné nebo induktivní úrovni. Statistika selhává, pokud nemá k dispozici adekvátní číselné údaje, když chybí představa o velkosti chyb měřeni a vplyvu různých průvodních činitelů, když není je k dispozici dostatečně rozsáhlý soubor případů anebo v datech chybí proměnlivost (variabilita).
2
1.4. Statistický projekt Obecné schéma vedeckého projektu Každý výzkumný a statistický projekt nevyjímaje lze popsat pomocí jednotlivých, na sebe navazujících činností, uvedených na vedlejším obrázku. Statistika může přispět k řešení výzkumného projektu prakticky v každém kroku. Hlavními úkoly při plánování a návrhu výzkumného projektu jsou přesná formulace cíle a účelu výzkumu a vymezení pojmů a metod pro studované statistické jenotky, sledované znaky, sběr dat, statistickou analýzu a technické zpracování dat.
Příklad: Lékař zformuluje problém, který podle jeho názoru vyžaduje další výzkum. Je samozřejmé, že se má dobře seznámit s výsledky dřívějšího výzkumu v této oblasti a že má v hrubých rysech formulovat cíl a účel výzkumu. Cíl : Vytipovat osoby, které se snadno mohou nakazit chřipkou. Účel : Provést preventivní opatření. Cíl : Získat poznatky o účincích dvou léků užívaných při léčbě choroby. Účel : Použít lepší z obou léků. Cíl : Zjistit příčiny vysoké dětské úmrtnosti v dané oblasti. Účel : Provést potřebná zdravotnická opatření. Při vytváření přesné formulace cílů výzkumu, kdy se předpokládá užití statistických metod, je vhodné zahájit spolupráci příslušného odborníka a erudovaného statistika už na samém počátku plánování a návrhu výzkumného projektu. Statistik má být obeznámen s nejdůležitějšími aspekty problému z lékařské stránky a lékař musí získat základní statistické znalosti. Společně pak formulují cíle ve tvaru hypotéz, které mají být kriticky prověřeny pomocí dat.
3
Zásadní chybou je vytvářet hypotézy až podle druhu nashromážděných dat a na stejných datech je prověřovat.
Většinou již při formulaci cíle a účelu výzkumu přesně vymezujeme statistické jednotky (místně, časově, věcně), kterých se výzkum týká. V mnoha výzkumných projektech musíme počítat s tím, že nemůžeme studovat celou populaci1, která nás zajímá. V této fázi rovněž rozhodujeme, zda prováděné statistické šetření bude úplné, nebo výběrové. V případě výběrového šetření stanovíme metodu výběru a odhadneme potřebný rozsah výběru. Zvolená metoda výběru předurčuje kvalitu prováděných závěrů. Nežádoucí jsou takové metody, které vedou k vytváření selektivních výběrů, např. výběr respondentů podle jejich momentální dostupnosti. Každý sledovaný znak statistické jednotky musí být přesně a jednoznačně určen. Například pro znak "měsíční příjem" musíme udat, zda sledovaná osoba má uvést hrubý, nebo čistý měsíční příjem, a to z vlastního výdělku, nebo jako průměrný výdělek připadající na jednoho člena rodiny. Dále je třeba určit typ sledovaných znaků. Zda jsou kvalitativní (slovní) nebo kvantitativní (číselné) a zvolit stupnici měření. Volba měrných stupnic ovlivňuje množství informace obsažené v údajích a má rozhodující význam i pro použité metody statistického zpracování.
1
Populací se ve statistice nazývají jakékoliv úplné soubory zkoumaných statistických jednotek
4
Schéma statistického projektu
Statistický problém Statistická jednotka
Statistické otázky Statistické znaky
Získávání dat (měření, pozorování, dotazování)
Rešení statistických otázek
Interpretace výsledků Odpověď na štat. otázky
Prezentace výsledků
5
1.5.
Statistický problém, jednotka a statistické otázky
Formulace statistického problému většinou navazuje na problémy společenské praxe (ekonomické, sociální, ad.) řešené v rámci různých vědeckých studií a zadání. Bývá proto formulovaný ze širšího hlediska a všeobecněji. Statistické otázky a odpovědi na ně slouží na vysvětlení nebo vyřešení statistického problému. Příklad: Statistický problém: Statistické otázky:
Úspěšnost (neúspěšnost) studentů na vysoké škole. Statistická jednotka: Student Vývoj prospěchu studentů podle studijních programů a ročníků studia ? Statistický znak: prospěch, studijní program, ročník studia Počty a podíl studentů odcházejících ze studia v jednotlivých ročnících studia ? Statistický znak: Rozdělení studentů odcházejících ze studia podle důvodů odchodu ? Statistický znak: Počty studentů odcházejících ze studia v závislosti na absolvované střední škole ? Statistický znak:
6
1.1.
Příklady statistik
Tabulky Tab. 1.6.
Třída
Klasifikace
1. 2. 3. 4. 5. 6. Součet
A B C D E F
Rozdělení studentů podle klasifikace (Tabulka rozdělení četností) Počet Podíl studentů Součtový počet Součtový podíl studentů podle studentů podle studentů podle podle klasifikace [%] klasifikace klasifikace [%] klasifikace 18 10,1 18 10,1 21 11,7 39 21,8 29 16,2 68 38,0 37 20,7 105 58,7 50 27,9 155 86,6 24 13,4 179 100,0 179 100,0
Grafika 60 P o č 50 e t 40 s t u d e n t ů
30 20 10 0
A
B
C
D
E
F
Klasifikace studentů
Obr. 1.6 Rozdělení studentů podle klasifikace Sloupcový diagram (pseudo 3D) Experiment výnos plodiny
výnos plodiny
čára vystihuje závislost výnosu na hnojení
zasáhly rušivé činitele: bonita půdy klimatické podmínky
všichni hnojili přibližně stejně
dávka hnojiva řízená experimentátorem
dávka hnojiva udaná pěstitelem
7