NEPARAMETRICKÉ TESTY Výhodou neparametrických testů je jejich použitelnost bez ohledu na typ rozdělení, z něhož výběr pochází. K testování se nepoužívají parametry výběru (např.: aritmetický průměr či výběrový odhad směrodatné odchylky). Jejich nevýhodou je však menší citlivost, tj. menší schopnost odkrýt na dané hladině významnosti nesprávnost testované hypotézy. Z rozsáhlé skupiny neparametrických testu jsou zde uvedeny pouze testy pořadové – provádíme setřídění hodnot podle velikosti do jedné řady. Použití neparametrických testů je obvykle přínosné ve vědách sociologických, psychologických či ekonomických. V chemii a dalších přírodních oborech bychom se jejich použití měli spíše vyvarovat nebo je používat po důkladném zvážení všech dalších možností.
JEDNOVÝBĚROVÝ WILCOXONŮV TEST
Jde o neparametrickou obdobu testu správnosti - H0: µ = ~x0,5 , H1: µ ≠ ~x0,5 . Od prvků výběru se odečte správná hodnota a absolutní hodnoty rozdílů seřadíme do neklesající posloupnosti. Každé hodnotě přiřadíme pořadové číslo (pořadí). Vytvoříme sumu pořadí nezáporných prvků S+ a sumu pořadí záporných prvků S-. Při shodě pořadí se použije průměrné pořadí. Je-li menší číslo z dvojice S+ a S- menší nebo rovno tabelované hodnotě w(n, 0,05) nulová hypotéza o správnosti se zamítá. (Opačný postup zamítání nulové hypotézy než u parametrických testů!)
WILCOXONŮV PÁROVÝ TEST
Podobný postup se používá i pro párová data, která se vlastně převedou na soubor dat shodný s typem pro jednovýběrový test. Ze dvou výběrů párových dat se pro výpočet používají jejich diference, které již jsou jedním výběrem. Diference párových hodnot di se v absolutní hodnotě seřadí do neklesající posloupnosti a přiřadí se jim pořadí, přičemž případy kdy di = 0 se vynechávají. Další postup je totožný jako u jednovýběrového testu. Tyto dva testy jsou použitelné, pokud je počet prvků n větší nebo roven šesti.
DVOUVÝBĚROVÝ WILCOXONŮV TEST
Jedná se o neparametrickou obdobu testu shodnosti středních hodnot dvou souborů H0: µ1 = µ2, H1: µ1 ≠ µ2. Označme jeden výběr X1 a druhý X2, jejich rozsahy N1 a N2. Všechny prvky z obou výběrů (sdružený výběr) uspořádáme do neklesající posloupnosti a zjistíme součet pořadí výběru X1, který označíme T1, obdobně pak určíme T2. Dále vypočteme statistiky U1 a U2: 𝑈1 = 𝑇1 − ACH/CHEX1
𝑁1 (𝑁1 + 1) 2
𝑈2 = 𝑇2 −
© David MILDE
𝑁2 (𝑁2 + 1) 2
1
Je-li menší číslo z dvojice U1 a U2 menší nebo rovno tabelované hodnotě w(N1, N2; 0,05) nulová hypotéza o správnosti se zamítá. PŘÍKLADY:
1. Objemy spotřeby titračního činidla při titraci 10 ml přibližně 0,01 mol/l HCl na titrátoru RTS 622 jsou v ml: 1,10; 1,08; 1,09; 1,08; 1;10; 1,08; 1,10; 1,09; 1,11; 1,08. Správná hodnota byla určena na 1,09 ml. Zjistěte, zda titrátor pracuje správně. 2. Bylo vybráno 10 polí stejné kvality. Na 4 polích byl aplikován nový růstový stimulátor, ostatní byla ponechána bez aplikace. Poté byla oseta pšenicí a sledoval se hektarová výnos. Na polích s aplikací stimulátoru byly získány hektarové výnosy 51, 67, 56, 63 a na polích bez aplikace 45, 54, 48, 44, 53, 50 q/ha. Zjistěte, zda aplikace stimulátoru zvýší výnosy. 3. Paralelními analýzami vzorku Cu v osmi slitinách byla získána data nové metody a standardní metody podle normy. Testujte, zda obě metody určují vždy stejný obsah. Použijte parametrický i neparametrický test. Data: 11,68 11,23; 23,91 23,77; 32,27 33,04; 38,29 38,43; 47,04 46,79; 51,34 50,96; 68,23 67,85; 79,24 78,55. 4. Ve 3 vzorcích ropy byl metodou AAS stanovován obsah Ni s následujícími výsledky. Pomocí Kruskal-Wallisova testu rozhodněte, zda se obsah Ni ve vzorcích významně liší. Vzorek Ni (ppm) 1 14,2 16,8 19,1 15,5 16,0 15,9 2 14,5 20,0 18,0 15,4 16,1 17,7 3 18,3 20,1 17,7 17,9 19,3 16,9
TABULKY Kritické hodnoty w(n, 0,05) pro jednovýběrový a párový Wilcoxonův test n 6 7 8 9 10 11 12 13 14 15 16 17 w(n) 0 2 3 5 8 10 13 17 21 25 29 34 Kritické hodnoty w(N1, N2; 0,05) pro dvouvýběrový Wilcoxonův test N1 N2 w N1 N2 3 3 5 6 3 4 5 7 3 5 0 5 8 3 6 1 5 9 3 7 1 6 6 3 8 2 6 7 3 9 2 6 8 4 4 0 6 9 4 5 1 7 7 4 6 2 7 8 4 7 3 7 9 4 8 4 8 8 4 9 4 8 9 5 5 2 9 9
ACH/CHEX1
© David MILDE
18 40
19 46
20 52
w 3 5 6 7 5 6 8 10 8 10 12 13 15 17
2
TEST CHÍ - KVADRÁT (TEST DOBRÉ SHODY) • Neparametrický test pro testování (po)četnosti výskytu. Testujeme hodnoty četnosti a ne spojité proměnné, nemůžeme tedy použít t-testy! • Jedná se o testy tvaru rozdělení, např. že základní soubor má rovnoměrné rozdělení (př.: vznik zmetků ve výrobě je rovnoměrně rozložen po celé směně). • PRINCIP: - specifikujeme H0 a H1: H0: veličina má dané rozdělení (obvykle rovnoměrné) H1: veličina nemá dané rozdělení - vypočteme teoretickou početnost podle H0, - zjistíme skutečné početnosti v jednotlivých skupinách, - porovnáme skutečné a teoretické početnosti a rozdíly mezi nimi použijeme pro výpočet hodnoty χ2exp testovací statistiky, - porovnáme χ2exp s tabulkovým kvantilem χ2 rozdělení χ2krit(n-1; 0,95), kde n je počet skupin; je-li χ2exp < χ2krit přijímáme H0.
χ
2 exp
n
(Oi − E ) 2
i =1
E
=∑
Oi – skutečná početnost v příslušné skupině E = N/n – teoretická početnost, kde N je celková početnost.
kde
Příklad 1: 4 pracovníci v laboratoři rozbili následující počet laboratorního skla za určité období 24, 17, 11, 9 kusů. 1. Lze rozdíl v počtu rozbitého skla mezi pracovníky považovat za významný? 2. Liší se v počtu rozbitého skla první pracovník od ostatních?
1. n = 4, N = 61
χ
2 exp
E = 61/4 = 15,25 O1 - E = 8,75 O3 - E = -4,25
8,75 2 + 1,75 2 + (−4,25) 2 + (−6,25) 2 136,25 = = = 8,934 15,25 15,25 χ2krit(3; 0,95) = 7,81
2. n=2
E1 = 15,25 E2 = 3x15,25 = 45,75
ACH/CHEX1
O2 - E = 1,75 O4 - E = -6,25
χ2exp > χ2krit přijímáme H1
pro 1. pracovníka pro zbývající
© David MILDE
3
O1 = 24
O2 = 17 + 11 + 9 = 37
!!! V případě pouze 2 skupin se zavádí Yatesova korekce. !!!
Oi − Ei − 0,5 /O1 - E1/ - 0,5 = 8,25 /O2 - E2/ - 0,5 = 8,25
8,252 / 15,25 = 4,46 8,252 / 45,75 = 1,49
χ2exp = 4,46 + 1,49 = 5,95 χ2krit(1; 0,95) = 3,84 χ2exp > χ2krit přijímáme H1 Příklad 2: Na hladině významnosti α = 5 % testujte hypotézu, že okamžiky vzniku zmetků při výrově jsou rovnoměrně rozděleny v průběhu osmihodinové směny. Hodina Četnost zmetků
ACH/CHEX1
1 10
2 15
3 20
© David MILDE
4 10
5 8
6 7
7 5
8 5
4
DIFERENCE PARALELNÍCH STANOVENÍ Eckschlager K. a kol.: Vyhodnocování analytických výsledků a metod. SNTL, Praha 1980.
• V praxi se zpravidla provádí 2 paralelní stanovení ⇒ není možné jednu z hodnot vyloučit jako odlehlou, protože nevíme, která to je. • Určení „dovolené diference paralelních stanovení“ umožní rozhodnout, jestli je některá hodnota odlehlá. • Můžeme určit, je-li v datech jen náhodná chyba nebo hrubá chyba. POSTUP: 1. Určíme průměrné rozpětí nebo průměrnou směrodatnou odchylku z alespoň 10 měření téhož materiálu (doporučují se různé vzorky). 2. Vypočteme maximální dovolené rozpětí RMAX:
RMAX = a s ⋅ s
RMAX = bR ⋅ R
n as (pro α=0,05) bR (pro α=0,05) 2 2,77 2,46 3 3,31 1,96 4 3,63 1,76 5 3,86 1,66 3. Je-li skutečné R ≤ RMAX, tj. je-li menší než dovolená diference, předpokládáme, že žádný z výsledků není odlehlý. Je-li R > RMAX, musíme provést 3. stanovení. 4. Je-li 3. stanovení takové, že se shoduje s jedním ze 2 výsledků (menší než RMAX), vyloučíme odlehlý výsledek a ze 2 zbývajících vypočteme průměr. 5. Je-li 3. stanovení takové, že se shoduje s oběma původními v mezi dovolené diference, počítáme průměr ze všech 3 výsledků. Př.: Stanovení N pro obsah asi 3 %, průměrné rozpětí bylo určeno na 0,057. a) 2 paralelní analýzy vzorku A s výsledky 2,96 a 3,19 %. b) 2 paralelní analýzy vzorku B s výsledky 3,18 a 3,34 %. Předpoklady použití: • Validovaná metoda, analýzy prováděny stále podle SOP v rozsahu validace (např. stejná matrice). • Průměrné rozpětí nebo průměrná směrodatná odchylka musí být určena z dostatečného počtu vzorků.
ACH/CHEX1
© David MILDE
5
ANALÝZA DUPLIKÁTŮ (duplikátní vzorky – 2 vzorky odebrané z analyzovaného objektu) – slouží k posouzení preciznosti (dříve přesnosti) metody:
dr =
ACH/CHEX1
x1 − x2 ×100 ( x1 + x2 ) / 2
© David MILDE
6