MATEMATICKÁ STATISTIKA -
na základě výběrových dat usuzujeme na obecnější skutečnosti, týkající se základního souboru; provádíme zevšeobecňující (induktivní) úsudek induktivní usuzování pomocí matematicko-statistických metod je tzv. statistická indukce induktivní uvažování s sebou vždy nese riziko nesprávného úsudku (= riziko omylu) výběrová data musí být pořízena náhodným výběrem.
Statistické indukce zahrnuje: 1. teorii odhadu 2. testování statistických hypotéz.
Teorie odhadu -
metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.
1. Bodový odhad -
-
spočívá v nahrazení neznámé hodnoty parametru základního souboru (dále ZS) hodnotou vhodné výběrové charakteristiky, která bude sloužit jako dobrá náhrada neznámého parametru vhodnost jednotlivých odhadů posuzujeme podle několika vlastností.
Vlastnosti bodového odhadu: 1. nevychýlenou (nestrannost): odhad má vzhledem ke střední hodnotě nulové vychýlení 2. konzistence 3. vydatnost. Symbolika:
parametry v ZS značíme obecně (konkrétně např. , , ) výběrové charakteristiky značíme obecně t (např. x , s x , ) t je výběrová chyba symbolický zápis bodového odhadu: est t nebo t ~ .
2. Intervalový odhad -
spočívá v konstrukci náhodného intervalu, od něhož se zvolenou pravděpodobností P 1 očekáváme, že bude obsahovat skutečnou hodnotu neznámého parametru dovoluje, abychom uvažovali pravděpodobnost, s níž lze očekávat, že odhad je správný.
Spolehlivost odhadu 1 -
je to pravděpodobnost; 0 1 volíme vždy číslo blízké 1, nejčastěji 0,95 (event. 0,99 nebo 0,9) čím vyšší spolehlivost žádáme, tím je za jinak stejných podmínek IS širší.
1
Riziko odhadu -
udává, v kolika případech ze 100 (v jakém % případů) nebude IS pokrývat odhadovaný parametr .
Intervaly spolehlivosti mohou být konstruovány jako: 1. oboustranné: d h , kde h je horní mez, d je dolní mez 2. jednostranné: pravostranné h levostranné > d
Odhad parametru µ (střední hodnoty) normálního rozdělení 1. Bodový odhad Bodovým odhadem střední hodnoty
1 N
N
xi je výběrový průměr x i 1
1 n xi . Je to n i 1
nevychýlený odhad střední hodnoty. Směrodatná odchylka výběrového průměru = standardní chyba odhadu: -
Dx
n
je odrazem přesnosti výběrového průměru, jako odhadu střední hodnoty souvisí nejen s variabilitou zkoumaného procesu, ale rovněž s velikostí výběrového souboru.
2. Intervalový odhad Při konstrukci IS pro parametr μ rozlišujeme 3 případy: 1. Velký výběr z normálního rozdělení se známým rozptylem σ2: Oboustranný IS: 1 P x u x u 1 1 n n 2 2 Pravostranný IS: P x u1 1 n Levostranný IS: P x u1 1 n je přípustná chyba odhadu. u 1 n 2
2
2. Velký výběr z normálního rozdělení s neznámým rozptylem σ2: Při řešení praktických úloh obvykle neznáme rozptyl ZS σ2. Odhadujeme jej pomocí výběrového rozptylu s x2 : n
s x2
x
i
x
i 1
n 1
2
.
Oboustranný IS: s s P x u x x u x 1 1 1 n n 2 2 Pravostranný IS: s P x u1 x 1 n Levostranný IS: s P x u1 x 1 n 3. Malý výběr z normálního rozdělení s neznámým rozptylem σ2: Kvantily rozdělení N[μ; σ2] nahradíme kvantily Studentova rozdělení t s n 1 stupni volnosti. Oboustranný IS: s s P x t n 1 x x t n 1 x 1 1 1 n n 2 2 Pravostranný IS: s P x t1 n 1 x 1 n Levostranný IS: s P x t1 n 1 x 1 n
Odhad parametru π (relativní četnosti )alternativního rozdělení Je třeba mít k dispozici výběr dostatečně velkého rozsahu; to je zajištěno splněním podmínky n 1 > 9 .
3
1. Bodový odhad Bodovým odhadem relativní četnosti p
M je výběrová relativní četnost (výběrový podíl) N
m , n
M počet jednotek se sledovanou vlastností v ZS N celkový počet jednotek ZS m počet jednotek se sledovanou vlastností ve výběrovém souboru n rozsah výběru.
2. Intervalový odhad Oboustranný IS: p1 p P p u pu 1 1 n 2 2 u
1
2
p 1 p 1 n
p 1 p je přípustná chyba odhadu. n
Pravostranný IS: p 1 p P p u1 1 n Levostranný IS: p 1 p P p u1 1 n
Odhad parametru σ2 (rozptylu) normálního rozdělení 1. Bodový odhad n
N
Bodovým odhadem rozptylu 2
xi 2
je výběrový rozptyl s x2
i 1
N
x
i
x
i 1
n 1
2
.
Je to nezkreslený a konzistentní odhad.
2. Intervalový odhad Při konstrukci IS pro parametr σ2 rozlišujeme 2 případy: buď známe parametr μ nebo ho neznáme. V praxi je častější případ, kdy parametr μ neznáme, proto se na něj zaměříme.
4
Oboustranný IS: 2 n 1 s x2 n 1 s x 2 P 2 2 1 n 1 n 1 1 2 2 Pravostranný IS: n 1 s x2 P 2 2 1 n 1 Levostranný IS: n 1 s x2 P 2 2 1 1 n 1
Stanovení minimálního rozsahu výběru Pro stanovení minimálního rozsahu výběru vycházíme ze vzorce přípustné chyby odhadu parametru , jehož jednoduchou úpravou dostaneme: u2 2 n
1
2
.
2
Pokud neznáme 2 , použijeme jeho bodový odhad s x2 . Budeme-li vycházet ze vzorce přípustné chyby odhadu parametru , dostaneme: u 2 1 1
n
2
2
.
Pokud neznáme , použijeme jeho bodový odhad p .
5
Testování statistických hypotéz -
testování hypotéz je postup, sloužící k ověření předpokladů o ZS (tzv. hypotéz) na základě výběrových dat (tj. hodnot z výběrového souboru) hypotéza = určitý předpoklad (tvrzení) o základním souboru testování umožňuje rozhodnout, zda určitou hypotézu zamítneme či nikoli, a to s malým, předem zvoleným rizikem (α) pokud se hypotéza týká neznámého parametru pravděpodobnostního rozdělení základního souboru, jde o testy parametrické jestliže se hypotéza týká vlastností základního souboru, jde o testy neparamtrické.
Základní pojmy a symbolika: Hypotézy: H0: nulová (testovaná) hypotéza H1: alternativní hypotéza Testové kriterium (t): -
je to náhodná veličina, která má při platnosti H0 známé pravděpodobnostní rozdělení prostor hodnot testového kritéria rozdělíme na dva disjunktní obory (W a V).
Kritický obor (W): -
kritický obor je tvořen hodnotami TK, které jsou při platnosti H0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá.
Obor přijetí (V): -
obor přijetí je tvořen všemi hodnotami TK, které leží mimo kritický obor.
Hladina významnosti (α) = pravděpodobnost chyby I. druhu: -
pravděpodobnost že zamítneme H0, ačkoli platí.
Pravděpodobnost chyby II. druhu (β): -
pravděpodobnost, že nezamítneme H0, ačkoli neplatí.
Síla testu (1- β): -
pravděpodobnost správného zamítnutí H0 (schopnost testu zamítnout neplatnou H0).
Standardní testovací postup: -
obecný, bez ohledu na konkrétní typ testu.
1. Formulace hypotéz H0 a H1. 2. Volba testového kritéria: zvolíme vhodnou charakteristiku, jejíž pravděpodobnostní rozdělení při platnosti H0 je známé.
6
3. Vymezení kritického oboru: je omezen kvantily rozdělení TK při platnosti H0 (tzv. kritické hodnoty). 4. Výpočet hodnoty TK z výběrových dat. 5. Formulace závěru o výsledku testu: velmi důležité, existují pouze dvě možnosti. I. TK leží v kritickém oboru (TK ∈ W): zamítáme H0, tedy prokázali jsme H1. II. TK neleží v kritickém oboru (TK ∉ W): nezamítáme H0, tedy neprokázali jsme H1.
Možné výsledky rozhodovacího procesu při testování statistických hypotéz a jejich pravděpodobnosti Rozhodnutí
Skutečnost H0 platí
H0 nezamítáme
správné rozhodnutí nezamítáme platnou H0 P 1
H0 zamítáme
nesprávné rozhodnutí zamítáme platnou H0 chyba I. druhu P
7
H0 neplatí nesprávné rozhodnutí nezamítáme neplatnou H0 chyba II. druhu P správné rozhodnutí zamítáme neplatnou H0 P 1
Parametrické testy -
hypotézy těchto testů se týkají neznámých parametrů pravděpodobnostního rozdělení základního souboru vyžadují minimálně znalost pravděpodobnostního rozdělení základního souboru, což představuje velmi silný předpoklad nejčastější je předpoklad normality dat, který v praxi často není splněn nebo ho nelze ověřit z důvodu malého rozsahu výběru jsou obecně náročnější než testy neparametrické, avšak jejich síla je vyšší v případě nesplnění předpokladů pro parametrické testy nebo nemožnosti jejich ověření je vždy třeba využít testů neparametrických (viz další výklad).
Test parametru μ normálního rozdělení 1. Formulace hypotéz H 0 : 0 a ) H1 : 0 b) H1 : 0 c ) H1 : 0
oboustranná alternativní hypotéza pravostranná alternativní hypotéza levostranná alternativní hypotéza
2. Volba testového kritéria Rozlišujeme tři případy: a) známe rozptyl ZS σ2
U
x 0 n
N 0;1
b) neznáme rozptyl ZS σ2; výběr má malý rozsah
t
x 0 s
t n 1
n c) neznáme rozptyl ZS σ2; výběr má velký rozsah U
x 0 s n
N 0;1
8
3. Stanovení kritického oboru Pro případy a) a c) a různé typy alternativních hypotéz: a ) W u; u u a u u 1 2 2 b) W u; u u1
c) W u; u u Pro případ b) a různé typy alternativních hypotéz: a ) W t ; t t n 1 a t t n 1 1 2 2 b) W t ; t t1 n 1
c) W t ; t t n 1
Test parametru σ2 normálního rozdělení H 0 : 2 02
1.
a ) H 1 : 2 02 b) H 1 : 2 02 c) H 1 : 2 02
2. Rozlišujeme dva případy: buď druhý parametr μ známe nebo ne. V praxi je častější případ, kdy parametr μ neznáme, proto se na něj omezíme.
2
n 1s 2
2 0
2 n 1
3. a ) W 2 ; 2 2 n 1 a 2 2 n 1 1 2 2 2 2 2 b) W ; 1 n 1
c) W 2 ; 2 2 n 1
Test parametru π alternativního rozdělení Je třeba mít k dispozici dostatečně velký výběr, který splňuje podmínku n 1 > 9 . 1.
H0 : 0 a) H 1 : 0 b) H 1 : 0 c) H 1 : 0 9
2. U
p 0
0 1 0 n
N 0;1
3. a ) W u; u u a u u 1 2 2 b) W u; u u1 c) W u; u u
Testování shody parametrů ve dvou souborech Nejdříve je třeba rozlišit, zda se jedná o závislé nebo nezávislé výběry, následně zvolíme vhodný typ testu. Nezávislé výběry: -
vybírání jednotek z jednoho základního souboru nezávisí na vybírání jednotek ze souboru druhého.
Závislé výběry: -
hodnoty z prvního výběru tvoří logický pár s hodnotami z druhého výběru, jedná se o tzv. párové testy například: výsledky vyšetření u 10 pacientů před a po aplikaci určitého léku.
Test shody středních hodnot dvou normálních rozdělení (nezávislé výběry) 1.
H 0 : 0 a) H 1 : 0 b) H 1 : 0 c) H 1 : 0
Další postup, tj. body 2. a 3. viz tabulka A.
Test shody rozptylů dvou normálních rozdělení (nezávislé výběry) 1.
H 0 : 12 22
a) H 1 : 12 22 b) H 1 : 12 22 c) H 1 : 12 22
10
2. F
s12 s 22
F (n1 1; n2 1)
3. a ) W F ; F F (n1 1; n 2 1) a F F (n1 1; n 2 1) 1 2 2 b) W F ; F F1 (n1 1; n 2 1) c) W F ; F F (n1 1; n 2 1)
Test shody relativních četností dvou alternativních rozdělení (nezávislé výběry) Předpoklad: Máme náhodný výběr velkého rozsahu n1 z rozdělení A 1 a náhodný výběr velkého rozsahu n 2 z rozdělení A 2 , přičemž výběry jsou nezávislé. 1.
H 0 : 1 2
a) H 1 : 1 2 b) H 1 : 1 2 c) H 1 : 1 2 2. U
p
p1 p 2 p 1 p
n1 n2 n1 n2
N 0;1
p1 n1 p 2 n2 n1 n2
3. a ) W U ;U u a U u 1 2 2 b) W U ;U u1
c) W U ;U u
Test shody středních hodnot dvou normálních rozdělení (závislé výběry) Z každého i-tého párově uskutečněného pokusu zjistíme rozdíly d i x1i x 2i a stanovíme jejich průměr d a rozptyl s d2 . 1.
H 0 : 0 a) H 1 : 0 b) H 1 : 0 c) H 1 : 0
11
2. t
d 2 d
t (n 1)
s n 1 3. a ) W t ; t t n 1 a t t n 1 1 2 2 b) W t ; t t1 n 1 c) W t ; t t n 1
12
Tabulka A: Test shody středních hodnot dvou normálních rozdělení (nezávislé výběry)
Východisko
Rozdělení T při platnosti H0
Testové kritérium
U
Známe 12 a 22
Alternativní hypotéza
Parametry rozdělení
Kritický obor
H1 : 1 2 U u a U u1
x1 x 2
2
12 22 n1 n 2
0
N
2
H 1 : 1 > 2 U u1
2 1
H 1 : 1 < 2 U u t t n1 n 2 2
2 1
Neznáme a Předpokládáme: 12 22
2 2
t
x1 x 2
n1 1s1 2 n2 1s 22 n1 n2 2
H1 : 1 2 1 1 n1 n2
2
a tt 1
n1 n2 2
t
2
n1 n2 2
H 1 : 1 > 2 t t1 n1 n 2 2 H 1 : 1 < 2 t t n1 n 2 2
2 1
2 2
Neznáme a Předpokládáme: 12 22 Tzv. AspinovéWelchova korekce
t
x1 x 2 s1 2 s 22 n1 n2
t
13
s1 2 s 22 n n 1 2 1 s1 2 n1 1 n1
2
2
1 s 22 n2 1 n2
H1 : 1 2
2
t t a t t 2
H 1 : 1 > 2 t t1 H 1 : 1 < 2 t t
1
2
Neparametrické testy -
hypotézy těchto testů se týkají různých vlastností základního souboru jsou nezávislé či téměř nezávislé na konkrétním pravděpodobnostním rozdělení vyžadují tedy slabší předpoklady, než testy parametrické (např. místo normality rozdělení vyžadují pouze jeho symetrii atd.) oproti testům parametrickým je síla těchto testů menší.
Wilcoxonův test pro jeden výběr -
neparametrická alternativa testu o střední hodnotě normálního rozdělení nevyžaduje splnění předpokladu normality dat namísto střední hodnoty testujeme populační medián.
Předpoklady testu: -
jediným předpokladem tohoto testu je symetrie rozdělení NV v základním souboru.
Postup testu:
stanovíme rozdíly d i xi ~ x0 pokud je některý rozdíl roven nule, je vypuštěn a rozsah výběru se sníží absolutní hodnoty rozdílů d i uspořádáme podle velikosti a přiřadíme jim pořadová čísla pořadová čísla rozdělíme do dvou skupin: S součet pořadových čísel kladných odchylek S součet pořadových čísel záporných odchylek.
1. Formulace hypotéz
~ ~ H0 : X X 0 ~ ~ a) H 1 : X X 0 oboustranná alternativní hypotéza ~ ~ b) H 1 : X X 0 pravostranná alternativní hypotéza ~ ~ c) H 1 : X X 0 levostranná alternativní hypotéza 2. Testové kritérium
WTK min S , S
3. Stanovení kritického oboru W WTK ; WTK w n
Kritické hodnoty tohoto testu jsou tabelovány pro různá n a ∝.
14
Mannův-Whitneyův (Wilcoxonův) test pro dva nezávislé výběry -
neparametrická alternativa k testu shody dvou středních hodnot normálního rozdělení v případě, že výběry jsou nezávislé používá se v případě porušení předpokladu normality zkoumané NV slouží ověření shody středních hodnot (mediánů) ve dvou základních souborech je to jeden z nejsilnějších neparametrických testů.
Předpoklady testu: -
pracujeme s nezávislými náhodnými výběry o rozsahu n1 a n 2 náhodné výběry pocházejí ze spojitého rozdělení pokud se rozdělení sledované veličiny v obou populacích liší, pak jedině úrovní škála měření NV X je alespoň ordinální.
Postup testu: oba soubory spojíme dohromady, hodnoty uspořádáme vzestupně a podle velikosti je očíslujeme pořadovými čísly shodným hodnotám přiřadíme průměr jejich pořadových čísel je součet pořadových čísel v prvním výběru je součet pořadových čísel v druhém výběru vypočteme T1 a T2 :
n1 n1 1 R1 2 n n 1 T2 n1 n2 2 2 R2 2
T1 n1n2
1. Formulace hypotéz
~ ~ H 0 : X1 X 2 ~ ~ a) H 1 : X X 0 oboustranná alternativní hypotéza ~ ~ b) H 1 : X X 0 pravostranná alternativní hypotéza ~ ~ c) H 1 : X X 0 levostranná alternativní hypotéza
2. Testové kritérium
U minT1 , T2 3. Stanovení kritického oboru W U ; U u M , n1 , n 2
Kritické hodnoty tohoto testu jsou tabelovány pro různá n1 a n 2 a ∝.
15
χ2- test dobré shody -
slouží k ověření shody mezi teoretickým a empirickým rozdělením předpokladem testu je možnost roztřídit výsledky náhodného výběru do určitého počtu (k) disjunktních tříd podle nějakého znaku je použitelný jen v případě velkých výběrů nemáme-li k dispozici dostatečně velký výběr, lze místo tohoto testu aplikovat test Kolmogorovův-Smirnovův.
Předpoklady testu: -
je nutné, aby rozsah výběru zajistil dostatečné teoretické obsazení ve všech skupinách, do nichž je soubor roztříděn, tj. n 0,i 5
-
tuto podmínku lze formulovat i mírněji: ve všech třídách musí platit n 0,i 1 a alespoň v 80 % tříd musí platit n 0,i 5 .
Nejsou-li výše uvedené podmínky splněny, je třeba sloučit některé třídy (např. sousední či věcně příbuzné). Pokud se situace nezlepší, je nutno použít jiný test.
Tento test se používá ve dvou situacích: 1. H0 udává proporce četností v jednotlivých skupinách (může být formulováno například intuitivně). 2. H0 předpokládá, že ZS má rozdělení určitého typu: pokud H0 udává typ rozdělení i jeho parametry, jedná se o úplně specifikovaný model pokud H0 udává pouze typ rozdělení bez specifikace parametrů, jde o neúplně specifikovaný model. Situace 1 1. H 0 : i 0 ,i
pro i = 1, 2, ... , k
H 1 : non H 0 k
2. G i 1
n
n 0,i
2
i
n 0,i
2 k 1
kde ni ....... empirická (pozorovaná, výběrová) četnost n 0 ,i ... teoretické (hypotetická) četnost, tj. teoretické obsazení i-té třídy. 3. W G; G 12 k 1
16
Situace 2 Úplně specifikovaný model (příklad) 1. H 0 : Po2 H 1 : non H 0 Další postup (tj. body 2. a 3.) viz situace 1. Neúplně specifikovaný model (příklad) 1. H 0 : Po H 1 : non H 0 k
2. G
n
i 1
n 0,i
2
i
n 0,i
2 k p 1
kde p je počet parametrů rozdělení, které odhadujeme. 3. W G; G 12 k p 1 Závěr testu: Pokud TK Є W, zamítáme H0 (tzn., že přijímáme H1). V tom případě není rozdělení, specifikované nulovou hypotézou, vhodným modelem pro empirická data. Shoda obou rozdělení (teoretického a empirického) se na hladině významnosti α nepotvrdila.
Kolmogorovův-Smirnovův test pro jeden výběr -
test o tvaru rozdělení, slouží k ověření shody mezi teoretickým a empirickým rozdělením lze ho použít i pro výběr malého či velmi malého rozsahu údaje nemusí být roztříděny do skupin, test vychází z původních napozorovaných hodnot nedochází tak ke ztrátě informace, která je ve výběru obsažena.
Předpoklady testu: -
náhodný výběr pochází z některého spojitého rozdělení, které musí být hypotézou H0 úplně specifikované.
Symbolika: Fn x empirická (skutečná) distribuční funkce náhodné veličiny X F0 x teoretická (hypotetická) distribuční funkce náhodné veličiny X Empirická distribuční funkce Fn x : Tuto funkci určíme z hodnot uspořádaných podle velikosti x1 x 2 x n .
17
Fn x je definována tvarem: Fn x 0 , =
i , n
= 1,
< ≤
≤
, i 1, 2, , n 1
x xn .
Testovací postup: 1. H 0 : Fn x F0 x H 1 : non H 0 2. d n sup Fn x F x x
3. W d n ; d n d n;1 Kritické hodnoty tohoto testu jsou tabelovány pro různá n a ∝. Závěr testu: Pokud TK Є W, zamítáme H0 a přijímáme H1. V tom případě není rozdělení, specifikované nulovou hypotézou, vhodným modelem pro empirická data. Shoda obou rozdělení (teoretického a empirického) se na hladině významnosti α nepotvrdila.
18