Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
6 TESTY HYPOTÉZ – NEPARAMETRICKÉ TESTY RYCHLÝ NÁHLED DO KAPITOLY Kapitola obsahuje přehled neparametrických testů, které nalezneme v nabídce Analyze – Nonparametric Tests programu SPSS. Obrázek 6.1
Zdroj: Vlastní zpracování. Dostupné jsou následující testy: Chi-Square Test zařazuje proměnnou do kategorií a počítá statistiku chí-kvadrát, která je založená na rozdílech mezi pozorovanými a očekávanými četnostmi. Binomial Test porovnává četnosti pozorování v každé kategorii u dichotomické proměnné s očekávanou četností binomického rozdělení. Runs Test testuje, zda pořadí výskytu dvou hodnot veličiny je náhodné. One-Sample Kolmogorov-Smirnov Test porovnává empirickou distribuční funkci náhodné veličiny s uvedeným teoretickým rozdělením, které může být normální, rovnoměrné, exponenciální, nebo Poissonovo. Two-Independent-Samples Tests oveřují shodnou úroveň veličiny ve dvou populacích na základě dvou nezávislých výběrů. K dispozici jsou Mann-Whitney U test, Kolmogorov-Smirnov test, Moses test of extreme reactions, Wald-Wolfowitz runs test. Tests for Several Independent Samples ověřují shodnou úroveň veličiny v 𝑘 populacích na základě 𝑘 nezávislých výběrů. K dispozici jsou Kruskal-Wallis test, Median test, Jonc-kheere-Terpstra test. Two-Related-Samples Tests porovnávají rozdělení dvou proměnných. K dispozici jsou Wilcoxon signed-rank test, Sign test, McNemar test, Marginal homogeneity test. Tests for Several Related Samples porovnávají rozdělení dvou nebo více proměnných. K dispozici jsou Friedman’s test, Kendall’s W, Cochran’s Q.
- 73 -
6 Testy Hypotéz – neparametrické testy
6.1 TESTY ZALOŽENÉ NA BINOMICKÉM ROZDĚLENÍ Znaménkový test pro dva závislé výběry Znaménkový test patří mezi nejstarší z testů a je neparametrickou obdobou párového 𝑡−testu. Zkoumá se, zda dvě populace, z nichž jsou vybrány dva závislé výběry mají stejnou charakteristiku polohy - medián. Závislým výběrem rozumíme případy, kdy sledujeme určitý znak např. ve dvou po sobě jdoucích obdobích, nebo určitou vlastnost stejných jednotek za odlišných podmínek. Tento test je velmi jednoduchý, avšak jeho síla je malá, proto je zapotřebí mít k dispozici větší počet pozorování. Dvěma závislými výběry získáme párová pozorování náhodných veličin X 1 , Y1 ; X 2 , Y2 ; ...; X n , Yn . Rozdíly d i xi yi se rozdělí do dvou skupin podle znamének. Páry s nulovými rozdíly se z testu vyloučí. Počet párů bez nulových rozdílů se označí 𝑛, přitom platí 𝑛 ≤ 𝑛′. Testujeme nulovou hypotézu H 0 : X Y , která vyjadřuje předpoklad, že výběry pocházejí ze souborů se shodným mediánem, oproti dvoustranné alternativní hypotéze H1 : X Y , která toto tvrzení popírá. Testovým kritériem je výběrový úhrn 𝑀, jehož hodnota 𝑚 udává počet párů s kladným znaménkem. Náhodná veličina 𝑀 má binomické rozdělení s parametry 𝜋 = 0,5 a 𝑛. Kritický obor je interval n m ; m . 2 2 Pro dostatečně velké výběry (zpravidla n > 36) má náhodná veličina M přibližně normované normální rozdělení. Testové kritérium je Z
M
n 2
n 4
.
Kritická hodnota je kvantil normovaného normálního rozdělení z Pokud
platí
Z z
1
,
pak
zamítáme
1
.
2
nulovou
hypotézu.
2
___________________________________________________________________________
6.2 TESTY PRO DVOUROZMĚRNOU KONTINGENČNÍ TABULKU Mediánový test Tento test je navržen tak, aby se mohla zkoumat shoda populačního mediánu neboli stejné rozdělení veličiny X v r populacích. Škála měření je alespoň ordinální. Máme 𝑟 nezávislých náhodných výběrů o rozsahu 𝑛, které jsou roztříděny do dvou skupin. Skupina 1 představuje hodnoty, které jsou vetší než společný medián a skupina 2 představuje hodnoty, které jsou menší nebo se rovnají společnému mediánu. Máme tedy kontingenční tabulku r×2. Sloupcový součet 𝑛+1 představuje počet případů, kde hodnoty náhodné veličiny 𝑋 byly větší než společný medián a sloupcový součet 𝑛+2 představuje počet případů, kde hodnoty náhodné veličiny 𝑋 byly menší nebo se rovnaly společnému mediánu. Testujeme nulovou hypotézu H0, která předpokládá, že všechny populace mají stejný medián, oproti alternativní hypotéze H1, která tvrdí, že alespoň jedna populace má jiný medián. - 74 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Testové kritérium
r
2
G
nij nˆij 2 , nˆ ij
i 1 j 1
má asymptoticky rozdělení 2 se stupni volnosti r 1 , kde nˆ ij
ni n j
jsou n očekávané četnosti. Vyžaduje se, aby všechny očekávané četnosti byly větší než 1 a aspoň 80% těchto četností bylo větší než 5. Kritická hodnota je 12 r 1 . Pokud G 12 r 1 , pak nulovou hypotézu zamítáme. ___________________________________________________________________________
6.3 TESTY ZALOŽENÉ NA POŘADÍ 6.3.1 MANNŮV-WHITNEYŮV-WILCOXONŮV TEST PRO DVA NEZÁVISLÉ VÝBĚRY Tento test patří k nejsilnějším neparametrickým testům a využívá se v případech, kdy nelze použít parametrický dvouvýběrový 𝑡−test. Je testem o shodné úrovni spojité náhodné veličiny X ve dvou souborech. Test lze rozdělit na Mannův-Whinteyův U test a Wilcoxonův pořadový test. Oba tyto testy jsou rovnocenné. Škála měření náhodné veličiny 𝑋 je alespoň ordinální. Uvažuje se náhodný výběr x1 x11 , x 21 ,..., xn11 T s distribuční funkcí F1 x a náhodný
výběr x2 x12 , x 22 ,..., xn2 2 T s distribuční funkcí F2 x . Hodnoty z obou výběrů se spojí
n n1 n2 a uspořádají se vzestupně podle velikosti. Jednotlivým hodnotám se přiřadí pořadí, shodným hodnotám se přiřadí průměrná pořadí čísel, která by jim připadla. Pořadí hodnoty v prvním výběru označíme Rxi1 , i 1,2,..., n1 ; pořadí ve druhém výběru n1
Rxi 2 , i 1,2,..., n2 . Dále definujeme součet pořadí z prvního výběru R1 Rxi1 ; i 1
n2
a součet pořadí z druhého výběru R2 Rxi 2 . i 1
~ ~ Testujeme pak nulovou hypotézu H 0 : E1 x E2 x nebo H 0 : X 1 X 2 o shodné úrovni veličiny X v obou souborech proti alternativní hypotéze H1 : non H 0 . Testové kritérium pro Wilcoxonův test je menší hodnota z obou součtů pořadí: S minR1 , R2 . Kritické hodnoty jsou uvedeny ve speciálních tabulkách pro Wilcoxonův test, ale protože má náhodná veličina S asymptoticky normované normální rozdělení, lze použít jako testové kritérium: Z
n 1 2 . n1 n 2 n 1 12
S n1
Asymptotické rozdělení můžeme použít v případě, že n1 8, n2 14. Kritická hodnota je kvantil normovaného normálního rozdělení z
- 75 -
1
2
.
6 Testy Hypotéz – neparametrické testy
Pokud platí Z z
1
, pak zamítáme nulovou hypotézu.
2
6.3.2 WALDŮV-WOLFOWITZŮV TEST Waldův-Wolfowitzův test je také neparametrickou analogií 𝑡−testu pro dva nezávislé výběry. Testuje, zda spojitá náhodná veličina X má shodnou úroveň v obou souborech. Využívá se v případě, kdy nás zajímá, jestli posloupnost alternativních dat je náhodně uspořádaná. Tento test oproti předchozímu testu nemá takovou sílu. Pro použití WaldovaWolfowitzova testu jsou potřeba dva nezávislé náhodné výběry a spojitou veličinu 𝑋. Škála měření je alespoň ordinální. Uvažují se dva náhodné výběry x1 x11 , x 21 ,..., xn11 T ; x2 x12 , x 22 ,..., xn2 2 T .
Hodnoty z obou výběrů se spojí n n1 n2 a uspořádají se vzestupně podle velikosti a určí se počet iterací R. Iterace je posloupnost za sebou následujících hodnot, které patří stejnému výběru. ~ ~ Testujeme pak nulovou hypotézu H 0 : E1 x E2 x nebo H 0 : X 1 X 2 o shodné úrovni veličiny X v obou souborech proti alternativní hypotéze H1 : non H 0 . Testové kritérium je počet iterací R. Kritické hodnoty r n1 , n2 jsou uvedeny ve speciálních tabulkách pro test iterací. Pro velké rozsahy max n1 , n2 20 má veličina R asymptoticky normální rozdělení se 2n1n2 2n n 2n n n1 n2 střední hodnotou E R a rozptylem DR 1 2 12 2 . n1 n2 n1 n2 n1 n2 1 Testové kritérium má tvar: Z
R E R
D R Kritická hodnota je kvantil normovaného normálního rozdělení z Pokud platí Z z
1
1
.
2
, pak zamítáme nulovou hypotézu.
2
6.3.3 KRUSKALŮV-WALLISŮV TEST PRO „K“ NEZÁVISLÝCH VÝBĚRŮ Tento test je vhodné použít místo jednofaktorové analýzy rozptylu, jestliže není splněna podmínka o normálním rozdělení X a stejných rozptylech ve sledovaných populacích. Testuje se jím rozdělení více náhodných veličin, přesněji shodu úrovně X ve všech 𝑘 populacích. Rozšiřuje Mannův-Whineyův test na 𝑘 nezávislých výběrů. Předpokladem Kruskallova-Wallisova testu je spojitost náhodné veličiny X, ordinální škála měření a stejný tvar rozdělení v populacích, ze kterých se provádí nezávislé náhodné výběry.
Uvažuje se k 2 nezávislých výběrů x j x1 j , x 2 j ,..., x n j j , T
j 1,2,..., k. Hodnoty
ze všech k výběrů se spojí n n1 n2 ... nk a uspořádají se vzestupně podle velikosti. Jednotlivým hodnotám se přiřadí pořadí, shodným hodnotám průměr z pořadových čísel, která jim přísluší. Pořadí hodnoty xij označíme Rxij , i 1,2,..., n j ; j 1,2,..., k . nj
Dále definujeme součet pořadí v j-tém výběru R j R xij ,
j 1,2,..., k.
i 1
Testujeme pak nulovou hypotézu H 0 : úroveň veličiny X je v k populacích stejná. Alternativní hypotéza H 1 pak předpokládá, že úroveň veličiny X je aspoň pro jednu populaci jiná.
- 76 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
2
k R 12 j Testové kritérium je H 3n 1 . nn 1 j 1 n j
Jestliže je v každém výběru aspoň 5 pozorování, je vhodné použít jako kritickou hodnotu kvantil 12 se stupni volnosti k 1. 6.3.4 WILCOXONŮV TEST PRO DVA ZÁVISLÉ VÝBĚRY Test se využívá pro testování parametru polohy. Cílem je ověřit, zda dva závislé výběry pocházejí ze souborů se shodným mediánem. Škála měření je alespoň intervalová. Uvažujme dva závislé výběry, kde data obsahují dvojice hodnot x1 , y1 , x2 , y 2 ,..., xn , yn . Vypočteme diference d i xi yi , i 1,2,..., n ; páry s nulovou diferencí se vynechají. Označme n počet párů, které zůstaly. Absolutní hodnoty diferencí se seřadí podle velikosti do neklesající posloupnosti a přiřadí se jim pořadí Ri , i 1,2,..., n ; shodným hodnotám se přiřadí průměr z pořadových čísel, která jim přísluší. Dále se pořadí rozdělí do dvou skupin podle znamének a označí se s+ jako součet pořadí skupiny s kladným znaménkem, s- jakou součet pořadí se záporným znaménkem. Nulová hypotéza H 0 : d 0,50 0 předpokládá, že medián diferencí je nulový, neboli že výběry pocházejí ze souborů se stejným mediánem. Alternativní hypotéza H1 : d 0,50 0 tento předpoklad popírá. Testové kritérium je S min s , s , kritická hodnota je s p kvantil Wilcoxonovy statistiky.
Pro velká n n 8 má náhodná veličina S přibližně normované normální rozdělení a nn 1 S 4 testové kritérium je pak Z . Kritický obor je interval z , z . 1 nn 12n 1 2 2 24 6.3.5 FRIEDMANŮV TEST Test ověřuje, zda úroveň sledovaného znaku závisí nebo nezávisí na změně podmínek. Rozšiřuje Wilcoxonův test pro dva závislé výběry. Je testem náhodnosti na základě k 2 závislých výběrů. Využívá se v případě, kdy není splněna podmínka normality a shody rozptylů ve skupinách, jak se předpokládá při analýze rozptylu. Předpokladem použití tohoto testu je spojitost rozdělení. Je možné ho aplikovat i pro nominální nebo ordinální škálu měření. Jestliže jsou pozorovány stejné jednotky za k různých podmínek, je třeba tyto jednotky uspořádat do n bloků, které jsou náhodně vybrány. Dostáváme k, k 2 závislých výběr
x j x1 j , x 2 j ,..., x n j j , T
j 1,2,..., k. Pozorovaná hodnota xij je v i-tém bloku spojena s j-tou
podmínkou. V rámci bloku jsou jednotlivým pozorováním přiřazena pořadí od 1 do k podle nějakého kritéria. Shodným hodnotám je přiřazen průměr z pořadových čísel, která jim přísluší. Pořadí hodnoty xij označíme Rxij , i 1,2,..., n j ; j 1,2,..., k . nj
Dále definujeme součet pořadí v j-tém výběru R j R xij ,
j 1,2,..., k.
i 1
Testujeme pak nulovou hypotézu H 0 : hodnoty náhodné veličiny mají stejnou úroveň (odlišné podmínky mají stejný efekt). Alternativní hypotéza H 1 pak předpokládá, že alespoň jedna hodnota náhodné veličiny má odlišnou úroveň.
- 77 -
6 Testy Hypotéz – neparametrické testy k 12S nk 1 Testové kritérium je V . , kde S R j nk k 1 2 j 1 2
Jestliže je v každém výběru aspoň 5 pozorování, je vhodné použít jako kritickou hodnotu kvantil 12 se stupni volnosti k 1. 6.3.6 KENDALLŮV TEST KONKORDANCE Tímto testem se posuzuje pořadí k závislých výběrů. Kendallův koeficient konkordance W je modifikací Friedmanovy testové statistiky a je mírou shody v pořadí mezi všemi bloky. Nabývá hodnot od 0 do 1. Jestliže je Kendallův koeficient roven 1, pak se jedná o shodu v pořadí ve všech blocích. Jestliže je roven 0, pak jde o nezávislost pořadí ve všech blocích. V W , nk 1 kde V je Friedmanovo testové kritérium, n je počet bloků a k je počet podmínek. Pro testování nulové hypotézy H 0 o nezávislosti pořadí ve všech blocích proti alternativní hypotéze H 1 o závislosti, zvolíme stejné testové kritérium a kritický obor jako u Friedmanova testu. ___________________________________________________________________________
6.4 TESTY ZALOŽENÉ NA STATISTIKÁCH KOLMOGOROVOVA-SMIRNOVOVA TYPU Kolmogorov a Smirnov vyvinuli statistické postupy, které využívají maximální vertikální vzdálenost mezi teoretickou a empirickou funkcí jako měřítko toho, jak dobře se funkce navzájem podobají. Empirická distribuční funkce S x je dána vztahy: 1 S x 0, x x1 ; S x , xi x xi 1 ; S x 1, x xn . n 6.4.1 KOLMOGORŮV TEST DOBRÉ SHODY PRO JEDEN VÝBĚR Test ověřuje předpoklad, že náhodný výběr pochází z určitého specifikovaného spojitého rozdělení. Využívá se i v případech, kdy je malý rozsah výběru. Tento test umožňuje ověřit tvrzení, že náhodný výběr pochází z rovnoměrného, normálního, Poissonova nebo exponenciálního rozdělení. Uvažujme uspořádaný náhodný výběr x x1 , x 2 ,..., xn T
o velikosti n, který pochází z neznámého rozdělení s distribuční funkcí F x . K testování se použije empirická distribuční funkce S x jako odhad teoretické distribuční funkce F * x .
Testuje se nulová hypotéza: H 0 : F x F * x , že náhodný výběr pochází ze spojitého
rozdělení s distribuční funkcí F * x oproti alternativní hypotéze H1 : F x F * x . Testovým kritériem je maximální absolutní rozdíl mezi hodnotami teoretické distribuční funkce F * x a empirické distribuční funkce S x , tedy:
T sup F * x S x . x
Kritická hodnota je d1 n , kde d p je kvantil pro Kolmogorovův-Smirnovův test.
- 78 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
6.4.2 KOLMOGORŮV-SMIRNOVŮV TEST PRO DVA NEZÁVISLÉ VÝBĚRY V tomto případě se testuje, zda dva nezávislé výběry ze dvou různých populací pocházejí ze stejného rozdělení. Škála měření je alespoň ordinální. Uvažujme uspořádaný náhodný výběr x1 x11 , x 2 1 ,..., xn1 1 T o velikosti n1, který
pochází z neznámého spojitého rozdělení s distribuční funkcí F1 x , a uspořádaný náhodný
výběr x2 x12 , x 2 2 ,..., xn2 2 T o velikosti n2, který pochází z neznámého spojitého rozdělení s distribuční funkcí F2 x . Oba náhodné výběry jsou nezávislé. Odhadem distribuční funkce Fi x je empirická distribuční funkce S i x , i 1,2. Testuje se nulová hypotéza: H 0 : F1 x F2 x , že oba výběry pocházejí ze stejného rozdělení oproti alternativní hypotéze H1 : F1 x F2 x . Testovým kritériem je maximální absolutní rozdíl mezi hodnotami dvou empirických distribučních funkcí: T sup S1 x S 2 x . x
Kritická hodnota je d1 n1 , n2 , kde d p je kvantil pro Kolmogorovův-Smirnovův test pro dva výběry.
6.5 ŘEŠENÉ PŘÍKLADY V této části je uvedeno pět příkladů, na kterých jsou provedeny jednotlivé testy.
6.5.1 KOLMOGOROVŮV TEST PRO JEDEN VÝBĚR V hlavním menu zvolíme Analyze – Nonparametric Tests – 1-Sample K-S… Aktivuje se dialogové okno (Obr.6.2), proměnnou přesuneme do pole Test Variable List: a vybereme jedno nebo více pravděpodobnostních rozdělení. SPSS nabízí Normal, Uniform, Poisson, Exponential. Kliknutím na OK se spustí analýza. Obrázek 6.2
Zdroj: Vlastní zpracování.
- 79 -
6 Testy Hypotéz – neparametrické testy
ŘEŠENÝ PŘÍKLAD 6.1 Dopravní policie modeluje počet nehod na jednoho řidiče v průběhu šesti let. K dispozici jsou náhodně vybrané údaje o řidičích v určitém regionu. Tabulka uvádí počty automobilových nehod pro jednotlivé řidiče.
Tabulka 6.1 Řidič
Pohlaví
Věk
Počet nehod
Řidič
Pohlaví
Věk
Počet nehod
1
žena
22
5
11
muž
28
6
2
žena
23
4
12
muž
31
2
3
žena
29
3
13
muž
34
5
4
žena
32
5
14
muž
43
0
5
žena
34
4
15
muž
43
2
6
žena
34
0
16
muž
45
4
7
žena
37
7
17
muž
47
2
8
žena
38
0
18
muž
48
2
9
žena
42
3
19
muž
54
4
10
žena
45
1
20
muž
63
3
Zjistěte, jakým rozdělením (normálním, rovnoměrným, exponenciálním) lze nejlépe modelovat počet automobilových nehod.
Poissonovým
nebo
Řešení: První nulová hypotéza předpokládá normální rozdělení, druhá nulová hypotéza – rovnoměrné rozdělení, třetí nulová hypotéza – Poissonovo rozdělení a čtvrtá nulová hypotéza – exponenciální rozdělení počtu nehod na jednoho řidiče v průběhu šesti let. Alternativní hypotéza tvrdí, že neplatí nulová hypotéze. Test provedeme na hladině významnosti 5%. Tabulka 6.2 One-Sample Kolmogorov-Smirnov Test počet_nehod N Normal Parameters
20 a,,b
Mean Std. Deviation
Most Extreme Differences
3,10 1,997
Absolute
,124
Positive
,109
Negative
-,124
Kolmogorov-Smirnov Z
,554
Asymp. Sig. (2-tailed)
,919
a. Test distribution is Normal. b. Calculated from data.
- 80 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Tabulka 6.3 One-Sample Kolmogorov-Smirnov Test 2 počet_nehod N
20
Uniform Parameters
a,,b
Most Extreme Differences
Minimum
0
Maximum
7
Absolute
,186
Positive
,186
Negative
-,086
Kolmogorov-Smirnov Z
,831
Asymp. Sig. (2-tailed)
,495
a. Test distribution is Uniform. b. Calculated from data.
Tabulka 6.4 One-Sample Kolmogorov-Smirnov Test 3 počet_nehod N
20
Poisson Parameter
a,,b
Most Extreme Differences
Mean
3,10
Absolute
,105
Positive
,105
Negative
-,075
Kolmogorov-Smirnov Z
,469
Asymp. Sig. (2-tailed)
,980
a. Test distribution is Poisson. b. Calculated from data.
Tabulka 6.5 One-Sample Kolmogorov-Smirnov Test 4 počet_nehod N Exponential parameter.
20 b,,c
Most Extreme Differences
a
Mean
3,65
Absolute
,323
Positive
,323
Negative Kolmogorov-Smirnov Z
-,187 1,332
Asymp. Sig. (2-tailed)
,057
a. There are 3 values outside the specified distribution range. These values are skipped. b. Test Distribution is Exponential. c. Calculated from data.
Z výsledků vyplývá, že všechny čtyři p - hodnoty (Asymp.Sig.(2-tailed)) jsou větší než 0,05. (testujeme na hladině významnosti 5%), a proto nezamítáme žádnou nulovou hypotézu. Nejvyšší hodnotu má první testovaná hypotéza. Pro dopravní policii se jeví jako nejlepší modelovat počet automobilových nehod na řidiče normálním rozdělením.
- 81 -
6 Testy Hypotéz – neparametrické testy
6.5.2 SROVNÁNÍ DVOU NEZÁVISLÝCH VÝBĚRŮ V hlavním menu zvolíme Analyze – Nonparametric Tests – 2 Independent Samples… Aktivuje se dialogové okno (Obr.6.3), závislé proměnné přesuneme do pole Test Variable List: a nezávislou proměnnou do pole Grouping Variale:. Aktivuje je tlačítko Define Groups…, potvrdíme. Dále zapíšeme numerické kódy, které byly vytvořeny pro každý výběr, a potvrdíme. V hlavním dialogovém okně vybereme jeden nebo více ze čtyř testů, kterými se bude ověřovat platnost testované hypotézy, klikneme na OK. Obrázek 6.3
Zdroj: Vlastní zpracování. ŘEŠENÝ PŘÍKLAD 6.2 Vědci krmili laboratorní potkany dvěma různými stravami po delší dobu. Bylo vybráno náhodně 10 potkanů, kteří byli krmeni stravou A, a deset potkanů, kteří byli krmeni stravou B. Poté byl změřen obsah železa v játrech těchto potkanů. Testujte nulovou hypotézu, že rozdělení množství železa v játrech obou potkanů je stejné, oproti alternativní hypotéze, že rozdělení není stejné. Dále testujte hypotézu, že medián množství železa v játrech potkanů u obou strav je shodný. Výsledky ověřte na 5% hladině významnosti. Tabulka 6.6 Potkan 1 2 3 4 5 6 7 8 9 10
Strava A 2,22 3,98 1,99 4,11 1,49 2,17 3,67 1,21 0,92 3,33
Potkan 11 12 13 14 15 16 17 18 19 20
- 82 -
Strava B 1,33 0,48 1,29 1,65 1,12 0,96 1,07 2,04 1,51 1,08
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Řešení: Manův-Whitneyův-Wilcoxonův test Tabulka 6.7 Ranks strava množství_železa
N
Mean Rank
Sum of Ranks
1
10
13,70
137,00
2
10
7,30
73,00
Total
20
Tabulka 6.8
b
Test Statistics
množství_železa Mann-Whitney U
18,000
Wilcoxon W
73,000
Z
-2,419
Asymp. Sig. (2-tailed)
,016
Exact Sig. [2*(1-tailed Sig.)]
,015
a
a. Not corrected for ties. b. Grouping Variable: strava
Kolmogorovův-Smirnovův test pro dva nezávislé výběry Tabulka 6.9 a
Test Statistics
množství_železa Most Extreme Differences
Absolute
,600
Positive
,000
Negative
-,600
Kolmogorov-Smirnov Z
1,342
Asymp. Sig. (2-tailed)
,055
a. Grouping Variable: strava
Waldův-Wolfowitzův test Tabulka 6.10 b,c
Test Statistics
Number of Runs množství_železa
Exact Number of Runs
10
a
Z
Exact Sig. (1-tailed) -,230
,414
a. No inter-group ties encountered. b. Wald-Wolfowitz Test c. Grouping Variable: strava
Podle Mannova-Whitneyova testu u obou strav není shodný medián množství železa. Strava A má větší medián množství železa než strava B. Podle Kolmogorovova testu množství železa v játrech, které pochází od stravy A, má stejné rozdělení jako množství železa v játrech, které pochází od stravy B.
- 83 -
6 Testy Hypotéz – neparametrické testy
Podle Waldova-Wolfowitzova testu obě stravy mají shodný medián množství železa. Nezamítáme nulovou o stejném rozdělení množství železa v obou potravách. Ani nulovou hypotézu o shodných mediánech nelze zamítnout. 6.5.3 SROVNÁNÍ „K“
NEZÁVISLÝCH VÝBĚRŮ
V hlavním menu zvolíme Analyze – Nonparametric Tests – K Independent Samples… Aktivuje se dialogové okno (Obr.6.4), závislou proměnnou přesuneme do pole Test Variable List: a nezávislou proměnnou do pole Grouping Variale:. Aktivuje je tlačítko Define Range…, kterým definujeme výběry. Zapíšeme minimální a maximální hodnoty číselných kódů, které jsme přidělili jednotlivým nezávislým výběrům a potvrdíme. Vybereme jeden nebo více ze tří testů, kterými se bude ověřovat platnost testované hypotézy, klikneme na OK. Obrázek 6.4
Zdroj: Vlastní zpracování. ŘEŠENÝ PŘÍKLAD 6.3 Manažer prodeje hodnotí dva nové vzdělávací kurzy. Třicet zaměstnanců, kteří dostávají standardní školení, rozdělí do tří skupin. Skupina 2 obdrží navíc technický výcvik a skupina 3 obdrží navíc aktivní tutoriál. Každý zaměstnanec byl testován na konci výcvikového kurzu. Výsledky jsou zaznamenány v následující tabulce. Testujte nulovou hypotézu, že výsledky všech tří školících metod jsou stejné, proti alternativní hypotéze, která tvrdí, že nulová hypotéza neplatí. Test proveďte na hladině významnosti 5%. Tabulka 6.11 Skupina 1 29,51 21,54 39,46 29,46 24,31 29,46 31,62 27,85 28,12 29,74
Skupina 2 30,54 31,52 33,45 36,95 33,79 34,37 31,32 30,24 37,49 30,45
- 84 -
Skupina 3 33,95 38,98 34,12 35,16 37,59 36,74 33,47 35,12 33,97 34,12
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Řešení: Kruskalův-Wallisův test Tabulka 6.12 Ranks Skupina Body
N
Mean Rank
Skupina 1
10
8,00
Skupina 2
10
16,20
Skupina 3
10
22,30
Total
30
Tabulka 6.13 a,b
Test Statistics
Body Chi-Square
13,294
df
2
Asymp. Sig.
,001
a. Kruskal Wallis Test b. Grouping Variable: Skupina
P-hodnota (signifikance) 0,001 < 0,05 , proto nulovou hypotézu zamítáme: na základě tohoto testu výsledky všech tří školících metod nejsou stejné. Mediánový test Tabulka 6.14 Frequencies Skupina Skupina 1 Body
Skupina 2
Skupina 3
> Median
1
4
10
<= Median
9
6
0
Tabulka 6.15 b
Test Statistics
Body N
30
Median
33,4600
Chi-Square
16,800
df
a
2
Asymp. Sig.
,000
a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 5,0. b. Grouping Variable: Skupina
P-hodnota (signifikance) 0,000x < 0,05 , proto nulovou hypotézu zamítáme: na základě tohoto testu výsledky všech tří školících metod nejsou stejné.
- 85 -
6 Testy Hypotéz – neparametrické testy
Oba provedené testy zamítají nulovou hypotézu. Tedy můžeme z 95% tvrdit, že bodové výsledky závisí na zvolené školící metodě. 6.5.4 SROVNÁNÍ DVOU ZÁVISLÝCH VÝBĚRŮ V hlavním menu zvolíme Analyze – Nonparametric Tests – 2 Related Samples… Aktivuje se dialogové okno (Obr.6.5), vybereme dvě závislé proměnné a přesuneme do pole označené jako Test Pair(s) List: Vybereme jeden nebo více ze čtyř testů, kterými chceme srovnávat dva závislé soubory, klikneme na OK. Obrázek 6.5
Zdroj: Vlastní zpracování. ŘEŠENÝ PŘÍKLAD 6.4 V tabulce jsou zaznamenány výsledky „reakční doby“ jednotlivých řidičů před podáním alkoholu a po konzumaci alkoholu. Testujte nulovou hypotézu, že použití alkoholu před jízdou nemá žádný vliv na reakční dobu řidiče, proti alternativní hypotéze, která tvrdí, že nulová hypotéza neplatí. Test proveďte na hladině významnosti 5%. Tabulka 6.16 Řidič 1 2 3 4 5 6 7 8 9 10
Před 0,69 0,56 0,87 0,74 0,65 0,68 0,63 0,52 0,71 0,59
Řidič 11 12 13 14 15 16 17 18 19 20
Po 0,84 0,75 0,61 0,81 0,72 0,57 0,54 0,63 0,83 0,79
- 86 -
Před 0,68 0,55 0,51 0,67 0,69 0,54 0,66 0,69 0,59 0,73
Po 0,74 0,81 0,67 0,69 0,70 0,56 0,58 0,84 0,72 0,65
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Řešení: Wilcoxonův test pro dva závislé výběry Tabulka 6.17 Ranks N Po - Před
Negative Ranks
Mean Rank 5
Positive Ranks
Sum of Ranks
a
10,80
54,00
b
10,40
156,00
15
c
Ties
0
Total
20
a. Po < Před b. Po > Před c. Po = Před
Tabulka 6.18 b
Test Statistics
Po - Před a
Z
-1,905
Asymp. Sig. (2-tailed)
,057
a. Based on negative ranks. b. Wilcoxon Signed Ranks Test
Znaménkový test pro dva závislé výběry Tabulka 6.19 Frequencies N Po - Před
Negative Differences Positive Differences
a
5
b
15
c
0
Total
20
Ties a. Po < Před b. Po > Před c. Po = Před
Tabulka 6.20 b
Test Statistics
Po - Před Exact Sig. (2-tailed)
,041
a
a. Binomial distribution used. b. Sign Test
U Wilcoxonova testu nelze zamítnout nulovou hypotézu (neboť p-hodnota 0,057>0,05), avšak na základě znaménkového testu jsme zamítli platnost nulové hypotézy (neboť
- 87 -
6 Testy Hypotéz – neparametrické testy
p-hodnota 0,041<0,05); tedy reakční doba před podáním a po podání alkoholu není stejná. Rozdílné výsledky dosažené pomocí různých testů signalizují, že testování není průkazné: nejlepší by bylo získat další data (rozšířit datový soubor) a testování pak zopakovat. 6.5.5 SROVNÁNÍ „K“
ZÁVISLÝCH VÝBĚRŮ
V hlavním menu zvolíme Analyze – Nonparametric Tests – K Related Samples… Aktivuje se dialogové okno (Obr.6.6), vybereme k závislých proměnných a přesuneme do pole Test Variable: Vybereme jeden nebo více ze tří testů, klikneme na OK. Obrázek 6.6
Zdroj: Vlastní zpracování. ŘEŠENÝ PŘÍKLAD 6.5 Dvanáct náhodně vybraných žáků psalo po sobě tři různé diktáty. Poté se zjistil počet chyb u každého žáka v jednotlivých diktátech, jak ukazuje následující tabulka. Testujte nulovou hypotézu, že všechny diktáty jsou stejně těžké, proti alternativní hypotéze, která tvrdí, že nulová hypotéza neplatí. Test proveďte na hladině významnosti 5%. Tabulka 6.21 Žák 1 2 3 4 5 6 7 8 9 10 11 12
Diktát 1 1 0 2 3 1 0 4 5 1 0 2 3
Diktát 2 0 4 5 4 3 1 5 0 4 5 2 1
- 88 -
Diktát 3 1 0 1 2 3 2 1 1 0 0 1 1
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Řešení: Friedmanův test Tabulka 6.22 a
Test Statistics N
12
Chi-Square
3,857
df
2
Asymp. Sig.
,145
a. Friedman Test
Kendallův test konkordance Tabulka 6.23 Test Statistics N Kendall's W
12 a
,161
Chi-Square
3,857
df
2
Asymp. Sig.
,145
a. Kendall's Coefficient of Concordance
Oba testy dávají stejné výsledky. Protože p-hodnota je v obou případech značně větší než hladina významnosti 0,05, nulovou hypotézu o stejné obtížnosti všech diktátů nelze zamítnout.
6.6 PŘÍKLADY K PROCVIČENÍ PŘÍKLAD 6.1 Jsou uvedená tvrzení pravdivá? Pro znaménkový test pro dva závislé výběry testujeme nulovou hypotézu, že výběry pocházejí ze souborů se shodným mediánem. b) Friedmanovým testem se ověřuje, zda úroveň sledovaného znaku závisí na změně podmínek. c) 2 - test patří mezi parametrické testy. d) Neparametrické testy najdeme v programu SPSS v nabídce Analyze. e) Kolmogorovův – Smirnovův test porovnává empirickou distribuční funkci náhodné veličiny s uvedeným teoretickým rozdělením, které může být normální, rovnoměrné, exponenciální nebo Poissonovo. a)
- 89 -
6 Testy Hypotéz – neparametrické testy
PŘÍKLAD 6.2 Doplňte následující věty: a) Statistika u 2 - testu je založena na rozdílech mezi …………..a…………četnostmi. b) Test, který porovnává četnosti pozorování v každé kategorii u dichotomické proměnné s očekávanou četností binomického rozdělení, se nazývá ………………. c) Test, který ověřuje shodnou úroveň veličiny ve dvou populacích na základě dvou nezávislých výběrů se nazývá …………………… d) Jestliže je Kendallův koeficient roven……., pak se jedná o shodu v pořadí ve všech blocích. e) Odpověď na otázku, kterým rozdělením (normálním, rovnoměrným, Poissonovým nebo exponenciálním) lze nejlépe modelovat počet pojistných událostí, nám dává…………………..
PŘÍKLAD 6.3 Pojišťovna modeluje počet pojistných událostí v průběhu deseti let. K dispozici jsou náhodně vybrané údaje o klientech v určitém regionu. V následující tabulce jsou uvedeny počty pojistných událostí pro jednotlivé klienty.
Tabulka 6.24 Řidič
Pohlaví
Věk
1 2 3 4 5 6 7 8 9 10
žena žena žena žena žena žena žena žena žena žena
22 23 29 32 34 34 37 38 42 45
Počet pojistných událostí 1 2 3 2 2 4 4 4 3 1
Řidič
Pohlaví
Věk
11 12 13 14 15 16 17 18 19 20
muž muž muž muž muž muž muž muž muž muž
28 31 34 43 43 45 47 48 54 63
Počet pojistných událostí 3 2 4 2 2 1 1 2 2 1
Zjistěte, jakým rozdělením (normálním, rovnoměrným, Poissonovým nebo exponenciálním) lze nejlépe modelovat počet pojistných událostí. Testujte na hladině významnosti 5%.
PŘÍKLAD 6.4 Laboratorní myši byly krmeny dvěma různými typy stravy A a B. Bylo vybráno náhodně 10 myší, které byly krmeny stravou A, a deset myší, které byly krmeny stravou B. Poté byl změřen obsah železa v játrech těchto myší. Testujte nulovou hypotézu, že rozdělení množství železa v játrech je stejné, oproti alternativní hypotéze, že rozdělení není stejné. Dále testujte na 5% hladině významnosti hypotézu, že medián množství železa v játrech u obou typů stravy je shodný. - 90 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Tabulka 6.25 Potkan
Strava A
Potkan
Strava B
1 2,21 11 1,11 2 3,98 12 0,48 3 2,99 13 1,29 4 4,11 14 0,98 5 3,21 15 1,12 6 2,17 16 0,96 7 3,67 17 1,07 8 3,23 18 1,23 9 2,32 19 1,51 10 3,33 20 1,08 __________________________________________________________________________
6.7 ŘEŠENÍ PŘÍKLADŮ ŘEŠENÍ a) c)
PŘÍKLADU
ano ne
b) ano d) ano
ŘEŠENÍ
PŘÍKLADU
6.1 e) ano
6.2
a) pozorovanými, očekávanými b) binomický test c) Two-Independent-Samples Tests d) 1 e) Kolmogorovův test pro jeden výběr __________________________________________________________________________ ŘEŠENÍ
PŘÍKLADU
6.3
Tabulka 6.25 One-Sample Kolmogorov-Smirnov Test počet_událostí N Normal Parameters
20 a,,b
Mean
2,30
Std. Deviation Most Extreme Differences
1,081
Absolute
,259
Positive
,259
Negative
-,142
Kolmogorov-Smirnov Z
1,160
Asymp. Sig. (2-tailed)
,136
a. Test distribution is Normal. b. Calculated from data.
- 91 -
6 Testy Hypotéz – neparametrické testy
Tabulka 6.26 One-Sample Kolmogorov-Smirnov Test 2 počet_událostí N
20
Uniform Parameters
a,,b
Most Extreme Differences
Minimum
1
Maximum
4
Absolute
,317
Positive
,317
Negative
-,200
Kolmogorov-Smirnov Z
1,416
Asymp. Sig. (2-tailed)
,036
a. Test distribution is Uniform. b. Calculated from data.
Tabulka 6.27 One-Sample Kolmogorov-Smirnov Test 3 počet_událostí N
20
Poisson Parameter
a,,b
Most Extreme Differences
Mean
2,30
Absolute
,100
Positive
,084
Negative
-,100
Kolmogorov-Smirnov Z
,448
Asymp. Sig. (2-tailed)
,988
a. Test distribution is Poisson. b. Calculated from data.
Tabulka 6.28 One-Sample Kolmogorov-Smirnov Test 4 počet_událostí N Exponential parameter.
20 a,,b
Most Extreme Differences
Mean
2,30
Absolute
,353
Positive
,176
Negative
-,353
Kolmogorov-Smirnov Z
1,577
Asymp. Sig. (2-tailed)
,014
a. Test Distribution is Exponential. b. Calculated from data.
- 92 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Počet pojistných událostí se neřídí binomickým ani exponenciálním rozdělením (nulovou hypotézu zamítáme). Nejlépe lze popsat počet pojistných událostí Poissonovým rozdělením. __________________________________________________________________________ ŘEŠENÍ
PŘÍKLADU
6.4
Manův-Whitneyův-Wilcoxonův test Tabulka 6.29 b
Test Statistics
množství_železa Mann-Whitney U
,000
Wilcoxon W
55,000
Z
-3,780
Asymp. Sig. (2-tailed)
,000
Exact Sig. [2*(1-tailed Sig.)]
,000
a
a. Not corrected for ties. b. Grouping Variable: strava
Kolmogorovův-Smirnovův test pro dva nezávislé výběry Tabulka 6.30 a
Test Statistics
množství_železa Most Extreme Differences
Absolute
1,000
Positive
,000
Negative
-1,000
Kolmogorov-Smirnov Z
2,236
Asymp. Sig. (2-tailed)
,000
a. Grouping Variable: strava
Waldův-Wolfowitzův test Tabulka 6.31 b,c
Test Statistics
Number of Runs množství_železa
Exact Number of Runs
2
a
Z -3,905
Exact Sig. (1tailed) ,000
a. No inter-group ties encountered. b. Wald-Wolfowitz Test c. Grouping Variable: strava
Podle Mannova-Whitneyova testu u obou typů stravy není shodný medián množství železa.
- 93 -
6 Testy Hypotéz – neparametrické testy
Podle Kolmogorovova testu množství železa v játrech, které pochází od stravy A, nemá stejné rozdělení jako množství železa v játrech, které pochází od stravy B. Podle Waldova-Wolfowitzova testu stravy nemají shodný medián množství železa. Zamítáme nulovou o stejném rozdělení množství železa v obou typech stravy, také nulovou hypotézu o shodných mediánech lze zamítnout. Množství železa v játrech závisí na typu potravy. __________________________________________________________________________
6.8 PŘÍPADOVÉ STUDIE PŘÍPADOVÁ STUDIE 6.1 Vedoucí oddělení hodnotí dva nové jazykové kurzy angličtiny. Třicet zaměstnanců, kteří dostávají standardní školení, rozdělí do tří skupin, viz Tab. 6.32. Skupina 2 obdrží navíc hodiny konverzace a skupina 3 obdrží navíc poslech v angličtině. Každý zaměstnanec byl testován na konci jazykového kurzu. Výsledky jsou zaznamenány v následující tabulce. Testujte nulovou hypotézu, že výsledky všech tří školících metod jsou stejné, proti alternativní hypotéze, která tvrdí, že nulová hypotéza neplatí. Test proveďte na hladině významnosti 5%. K testování použijte Kruskalův-Wallisův test a Mediánový test. Tabulka 6.32 Skupina 1 30 21 39 29 24 29 31 27 28 30
Skupina 2 32 31 34 36 33 34 31 30 37 30
Skupina 3 34 39 34 35 38 37 33 35 33 36
PŘÍPADOVÁ STUDIE 6.2 Deset náhodně vybraných studentů psalo po sobě tři různé testy z matematiky. Poté se zjistil počet bodů u každého studenta v jednotlivých testech, jak ukazuje následující tabulka. Testujte nulovou hypotézu, že všechny testy jsou stejně těžké, proti alternativní hypotéze, která tvrdí, že nulová hypotéza neplatí. Test proveďte na hladině významnosti 5%. K testování použijte Friedmanův test a Kendallův test konkordance. Tabulka 6.33 Student 1 2 3 4 5 6 7 8 9 10
Test 1 77 67 56 73 61 60 74 85 81 70
Test 2 60 54 65 54 53 51 65 70 74 65
- 94 -
Test 3 51 60 61 52 53 52 61 71 60 60