Přednáška 1/ 1
Úvod do studia statistiky 1. Významy pojmu statistika Co o ní asi všichni víme … • Statistika je přesný součet nepřesných čísel … • Statistika nuda je, má však cenné údaje … • Věřím jen těm statistikám, které jsem si zfalšoval sám … … a jaká je realita: Statistika jako praktická činnost — statistická administrativa • statistická evidence ( např. sběr údajů, třídění, shrnování, apod.), • instituce, která tuto evidenci provádí (např. ČSÚ, ministerstva, aj.), • souhrn faktografických údajů o nějaké skutečnosti (statistika nezaměstnanosti, zahraničního obchodu, pohybu obyvatelstva atd.), je upravena zákonem č. 89/1995 „O státní statistické službě“ a mnoha dalšími předpisy, opírá se o klasifikace, číselníky a registry, slouží státu, resortu, instituci, firmě … Provádí šetření formou výkaznictví, soupisů, dotazníkových šetření apod. Těžiště je ve zjišťování faktografických údajů, jednoduchém zpracování a prezentaci výsledků. V omezené míře jsou používány jednoduché analytické nástroje (např. stanovení struktury jevu pomocí třídění, shrnování (součtem, průměrem, agregací), prostorové a časové srovnávání, apod.). V případě použití výběrových zjišťování jsou využívány poznatky teorie výběrových zjišťování (viz dále). Navzájem se ovlivňují a doplňují Statistika jako vědní disciplína — teorie statistiky • popisná statistika — výsledky statistické analýzy se týkají jen prošetřených případů a nelze je zobecnit, • matematická (induktivní) statistika — cílem je zobecnit výsledky (používané úlohy jsou odhady a testování hypotéz) — použití počtu pravděpodobnosti, • teorie výběrových zjišťování — vytváření reprezentativních „vzorků“ — výběrů — z „populací“ zákazníků, voličů, obcí, firem, atd. • aplikované vědy („–metrie“ a „-grafie“): biometrie, dendrometrie, ekonometrie, sociometrie, psychometrie, demografie …
• • • •
2. Co je typické pro statistiku Zkoumá hromadné jevy. Zabývá se proměnlivými — variabilními — vlastnostmi. Pracuje s čísly a vyjadřuje se pomocí čísel — zajímá se především o kvantitativní stránku reality. Používá výpočetní techniku k vytváření a správě statistických databází, k provádění hromadného zpracování a analýzy dat a ke komunikaci.
Přednáška 1/ 2
3. Co „umí“ a „neumí“ statistika Některé typické statistické úlohy různého stupně složitosti: • popis struktury hromadného jevu (věková struktura obyvatel ČR, struktura domácností z hlediska sociálních skupin, struktura firem zvoleného odvětví z hlediska právní formy podnikání), • shrnování dílčích ukazatelů v čase a prostoru (výpočet úhrnného maloobchodního obratu, výpočet průměrné mzdy v NH ČR, výpočet cenové hladiny spotřebitelských cen v ČR), • srovnávání takto agregovaných ukazatelů v čase nebo prostoru (dynamika mezd, dynamika hladiny spotřebitelských cen, srovnání míry nezaměstnanosti v několika regionech), • předvídání jejich budoucí úrovně (tržby v maloobchodě v příštím čtvrtletí, vývoz produktu AB v příštím roce), • měření závislostí (závislost mezd na HDP, závislost vývozu na kurzu koruny, závislost preferencí na vzdělání voličů). To vše buď na popisné nebo induktivní úrovni. Každá úloha má svoji stránku praktickou, teoretickou a výpočetní.
Kdy statistika „mlčí“: • chybí-li představa o velikosti chyb zjištěných údajů a míře vlivu „rušivých“ faktorů, • nemá-li k dispozici dostatečně rozsáhlý a reprezentativní soubor případů, • není-li v datech přítomna proměnlivost (variabilita).
4. Etapy statistické činnosti • • • •
zjišťování — shromáždění a zaznamenání údajů, jejich verifikace a kontrola, zpracování — uspořádání v databázi, seskupování: třídění, shrnování: sumarizace, průměrování, agregace, analýza — výpočet charakteristik, měření závislostí, časové či prostorové srovnávání, měření dynamiky, prezentace výsledků — tabulkové či grafické vyjádření a slovní zhodnocení výsledků předcházejících etap.
Přednáška 1/ 3
5. Základní principy statistických zjišťování Podle úplnosti zjišťování
Úplná zjišťování
Neúplná zjišťování
Zahrnují všechny existující případy v populaci Vedou k přesným výsledkům Prakticky těžko proveditelná
Pracují se vzorkem případů Vedou nejvýše k odhadům výsledků Prakticky snadno proveditelná
Reprezentativní (výběrová) Exaktní metoda tvorby vzorku - výběru Poskytuje zobecnitelné poznatky
Úsudkový (záměrný výběr) Omezeně zobecnitelné poznatky
Pravděpodobnostní (náhodný) výběr Zcela zobecnitelné poznatky
Nereprezentativní (ostatní) Neexaktní metody tvorby vzorku Neposkytuje zobecnitelné poznatky V běžné praxi dosti používaná
Anketa Metoda základního masívu Samovolný (spontánní) výběr Namátkový výběr aj.
Nepřekonatelnou metodou výběrového zjišťování je pravděpodobnostní (náhodný) výběr.
Přednáška 1/ 4
Podle podmínek zjišťování
Prosté pozorování
Řízený experiment
Monitorování skutečnosti Obtížná eliminace vlivu rušivých faktorů Žádná kontrola ovlivňujících faktorů
Vytvoření umělé "reality" Eliminace vlivu rušivých faktorů Řízení úrovně ovlivňujících faktorů
V oblasti sociálně ekonomických jevů je typickou metodou zjišťování prosté pozorování. Proč jsou údaje z řízeného experimentu kvalitnější? výnos plodiny
výnos plodiny
čára vystihuje závislost výnosu na hnojení
dávka hnojiva řízená experimentátorem
zasáhly rušivé činitele
všichni hnojili přibližně stejně
dávka hnojiva udaná pěstitelem
Přednáška 1/ 5 MS EXCEL jako nástroj pro statistickou analýzu dat
Možnosti statistické analýzy v MS Excelu: • • • • •
vlastní pracovní tabulka + vlastní vzorce, event. makra (prakticky neomezené možnosti), použití statistických funkcí (80 funkcí s výsledkem ve tvaru skaláru, vektoru nebo matice), použití doplňku Analýza dat (19 procedur s výsledky uspořádanými v přehledných tabulkách — viz příklad), vlastní nebo získané doplňky v jazyce Visual Basic (neomezené možnosti), grafy (14 základních typů grafů v celé řadě modifikací).
Přednáška 1/ 6 UNISTAT pro Windows — statistické výpočetní prostředí
Možnosti statistické analýzy v prostředí UNISTAT pro Windows: • • • • • • •
více než 100 statistických procedur, několik desítek grafů ve formátu *.bmp, *wmf, *jpg, výměna dat v celé řadě formátů (*.xls, *.doc, *.dbf, *.mdb, *.wk?, *.txt aj.), přímý výstup výsledků do Wordu, Excelu, PowerPointu, Exporeru apod., možnost provozovat jako doplněk MS Excelu, aktuální jazykové prostředí (čeština, slovenština, angličtina) volí uživatel, snadná obsluha a nízká cena.
Další statistický software pro profesionální použití: SPSS — pro sociology, psychology, marketing aj., kromě „běžné“ statistiky řada velmi specializovaných modulů, vlastní jazyk, vlastní textový procesor, STATGRAPHICS — byl pro většinu Čechů prvním statistickým programem pro PC, SAS — pro biology, lékaře, zemědělce — extrémně rozsáhlý a náročný na obsluhu, SPlus — určený původně pro rozvoj statistických metod, má vlastní programovací jazyk, teprve poslední verze umožňují nabídkový režim, STATISTICA — relativně nejpřístupnější, umožňuje řešit např. problematiku řízení kvality a několik desítek jiných … Jsou většinou podstatně rozsáhlejší, dražší, některé vyžadují speciálně zaškolenou obsluhu, ale hlavně — dokonalou znalost statistických metod a jejich záludností.