Testov´an´ı hypot´ez Petr Poˇs´ık ˇ asti dokumentu jsou pˇrevzaty (i doslovnˇe) C´ z Mirko Navara: Pravdˇepodobnost a matematick´a statistika, https://cw.felk.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf s laskavym ´ svolen´ım autora.
Testov´an´ı hypot´ez a jeho metodika 2 Jasnovidec? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Postup. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Chyby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 ROC kˇrivka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Volba κ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Formulace hypot´ez. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 p-hodnota. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Vyznamnost?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 ´ Kuchaˇrka pro testov´an´ı hypot´ez Typicky´ tvar testu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Test µ, σ zn´ame . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Test µ, σ nezn´ame . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pˇr: Oboustr. test µ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Test σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14 15 16 17 18 19
Neparametrick´e testy Neparametrick´e?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Znam´enkovy´ test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˚ test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Jednovybˇ ´ erovy´ Wilcoxonuv
20 21 22 23
1
2 / 23
Testov´an´ı hypot´ez a jeho metodika Testov´an´ı hypot´ez
Mnoho statistiku˚ trp´ı nejruznˇ ˚ ejˇs´ımi psychick´ymi poruchami, protoˇze v ml´ad´ı bylo mnoho jejich hypot´ez zam´ıtnuto. :-) c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 3 / 23
Motivaˇcn´ı pˇrı´klad: Jasnovidec? Experiment, kterym ´ chceme ovˇerˇ it, zda osoba m´a (vˇetˇs´ı cˇ i menˇs´ı) jasnovideck´e schopnosti: ■ M´ame bal´ıcˇ ek karet o 4 barv´ach (k´ary, piky, ...) se stejnym ´ poˇctem karet kaˇzd´e barvy.
˚ tip, my jej zkontrolujeme, kartu vr´at´ıme do ■ Vyt´ahneme z bal´ıcˇ ku 1 kartu, poloˇz´ıme rubem nahoru, testovan´a osoba rˇ ekne svuj bal´ıcˇ ku, bal´ıcˇ ek zam´ıch´ame. ■ Opakujeme n-kr´at, napˇr. 25kr´at. ■ Vysledek experimentu: testovan´a osoba se “trefila” v X pˇr´ıpadech z n. ´
Jak´e rozhodovac´ı pravidlo byste pouˇzili? ˇ byste, zˇ e osoba je jasnovidec, kdyˇz se trefila v 25 pˇr´ıpadech z 25? ■ Rekli ˇ byste, zˇ e osoba je jasnovidec, kdyˇz se trefila v 6 nebo 7 pˇr´ıpadech z 25? ■ Rekli ■ Co kdyˇz se trefila v 10, 15, 20 pˇr´ıpadech? ■ Jak postupovat systematicky?
˚ ze byt ˚ Osoba muˇ ´ v jednom ze dvou skuteˇcnych ´ “stavu”: 1. obyˇcejny´ cˇ lovˇek, pak pravdˇepodobnost, zˇ e kartu urˇc´ı spr´avnˇe, je p = p0 = 41 , nebo 2. jasnovidec, pak p > 41 . Vysledkem vaˇseho testu mohou byt ´ ´ 2 rozhodnut´ı: 1. prohl´as´ıte osobu za “obyˇcejn´eho” cˇ lovˇeka, nebo 2. prohl´as´ıte osobu za jasnovidce (zam´ıtnete “obyˇcejnost”). c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 4 / 23
2
Motivaˇcn´ı pˇrı´klad: Jasnovidec? (Pokr.) Pouˇzijme test: Osobu oznaˇc´ıme za jasnovidce (zam´ıtneme “obyˇcejnost”), tref´ı-li se v 25 pˇr´ıpadech z 25. ˚ zeme s t´ımto pravidlem oznaˇcit obyˇcejn´eho cˇ lovˇeka za jasnovidce? Ano. ■ Muˇ ■ Jak´a je pravdˇepodobnost, zˇ e se to stane?
P[zam´ıt´ame “obyˇcejnost”|ve skuteˇcnosti “obyˇcejny” ´ ] = P[ X = 25| p = p0 ] =
25 1 . = 10−15 4
Pro obecny´ test: Osobu oznaˇc´ıme za jasnovidce (zam´ıtneme “obyˇcejnost”), tref´ı-li se alesponˇ v c pˇr´ıpadech z n. ■ Jak´e rozdˇelen´ı m´a X pro “obyˇcejn´eho” cˇ lovˇeka? X ∼ Bi(n, p0 )
0.2 PDF of X
■ Pravdˇepodobnost, zˇ e obyˇcejn´eho cˇ lovˇeka oznaˇc´ıme za
jasnovidce P[zam. “obyˇc”|skut. “obyˇc”] = P[ X ≥ c| p = p0 ] =
0.15 0.1 0.05 0 0
n
=
5
10
15
20
25
15
20
25
X
∑ pBi(n,p0 ) (i) = 1 − FBi(n,p0 ) (c − 1)
1 CDF of X
i =c
0.5
0 0
5
10 X
c P [ X ≥ c | p = p0 ]
8 0.27
9 0.15
10 0.07
11 0.03
12 0.01
13 0.003
14 0.0009
15 0.0002
20 10−8
25 10−15
■ Pravdˇepodobnost, zˇ e by “obyˇcejny” ´ cˇ lovˇek (n´ahodou) uhodl 14 nebo v´ıce karet z 25 je cca 1/1000.
˚ ■ Staˇc´ı v´am to jako dukaz toho, zˇ e onen cˇ lovˇek nen´ı “obyˇcejny” ´ (ˇze je jasnovidec)? c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 5 / 23
Pojmy Hypot´eza H je tvrzen´ı o vlastnostech rozdˇelen´ı pravdˇepodobnosti pozorovan´e n´ahodn´e veliˇciny X s distribuˇcn´ı funkc´ı FX ( x, θ) nebo n´ahodn´eho vektoru ( X, Y ) se sdruˇzenou distribuˇcn´ı funkc´ı FXY ( x, y|θ), napˇr: ■ Stˇredn´ı hodnota polomˇeru vyr´abˇenych ´ hˇr´ıdel´ı se shoduje s nomin´aln´ı hodnotou.
´ ˚ ych pˇri stejn´em druhu operace na 3 ruzn ■ Umrtnost ´ pracoviˇst´ıch je stejn´a. ■ Pacienti s AIDS maj´ı cˇ erven´e krvinky menˇs´ı neˇz zdrav´ı lid´e.
ˇ je norm´aln´ı. ■ Rozdˇelen´ı vyˇ ´ sky dospˇelych ´ muˇzu˚ v CR ´ cinku˚ alesponˇ o 5 %. ■ Pouˇz´ıv´an´ı l´eku XY zvyˇsuje riziko neˇza´ douc´ıch uˇ Test statistick´e hypot´ezy je matematicky´ postup, j´ımˇz ovˇerˇ ujeme hypot´ezu. ■ Nulov´a hypot´eza H0 je ta, jej´ızˇ platnost ovˇerˇ ujeme. ■ Alternativn´ı hypot´ezu H A stav´ıme proti H0 .
POZOR: Nelze prok´azat platnost statistick´e hypot´ezy! Na z´akladˇe realizace n´ahodn´eho vybˇ ´ eru bud’ ■ lze rozhodnout, zˇ e hypot´eza H0 nen´ı vˇerohodn´a (pak zam´ıt´ame H0 a vˇedomˇe podstupujeme mal´e riziko chybn´eho rozhodnut´ı), nebo ■ nelze zam´ıtnout H0 , ale v tom pˇr´ıpadˇe nev´ıme, zda je to proto, zˇ e ■ H0 skuteˇcnˇe plat´ı, nebo ■ jen nem´ame dostatek dat (dostateˇcny ´ rozsah vybˇ ´ eru) na jej´ı zam´ıtnut´ı.
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 6 / 23
3
Prubˇ ˚ eh testu Typicky´ postup pˇri testu hypot´ezy: 1. Formulujeme H0 a H A . 2. Zvol´ıme vhodnou testovou statistiku T (krit´erium) takovou, zˇ e ■ jej´ı hodnoty co nejtˇesnˇeji souvisej´ı s platnost´ı hypot´ezy H0 , ■ jej´ı realizaci jsme schopni spoˇc´ıtat z realizace n´ahodn´eho vybˇ ´ eru a ■ jej´ı rozdˇelen´ı za pˇredpokladu platnosti H0 zn´ame nebo jsme schopni odvodit.
3. Zvol´ıme pr´ah κ ∈ R (kritickou hodnotu), pomoc´ı nˇehoˇz dok´azˇ eme rozhodnout o H0 : pro T > κ zam´ıt´ame H0 , pro T ≤ κ nezam´ıt´ame H0 . 4. Z´ısk´ame realizaci n´ahodn´eho vybˇ ´ eru x a provedeme test. ´ Test hypot´ezy lze povaˇzovat za bin´arn´ı klasifik´ator: jeho ukolem je bud’ ■ zaˇradit realizaci x do norm´aln´ı“ populace (nezam´ıtne H0 ), nebo
” ”
■ zaˇradit realizaci x do anom´aln´ı“ populace (zam´ıtne H0 ve prospˇech H A ).
Testov´a statistika T je n´ahodnou veliˇcinou (je to funkce n´ahodn´eho vybˇ ´ eru). Rozhodov´an´ı se proto neobejde bez chyb. c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 7 / 23
Chyby I. a II. druhu Stav svˇeta
Rozhodnut´ı (vysledek testu) ´ H0 nezam´ıtnuta H0 zam´ıtnuta
H0 plat´ı
OK True negative (TN)
Chyba I. druhu False positive (FP)
H0 neplat´ı
Chyba II. druhu False negative (FN)
OK True positive (TP)
ˇ ık´ame, zˇ e vysledek ˚ zeme zam´ıtnout H0 , a negativn´ı, kdyˇz nemuˇ ˚ zeme. R´ testu je pozitivn´ı, kdyˇz muˇ ´ Chyba I. druhu: zam´ıtneme H0 , kter´a ve skuteˇcnosti plat´ı. Jej´ı pravdˇepodobnost α(κ ) je nerostouc´ı funkce prahu κ a nazyv´ ´ ame ji hladinou vyznamnosti testu. ´ ˇ ıslo 1 − β pak nazyv´ Chyba II. druhu: nezam´ıtneme H0 , kter´a neplat´ı. Jej´ı pravdˇepodobnost β(κ ) je neklesaj´ıc´ı funkc´ı prahu κ. C´ ´ ame s´ılou testu. Hodnotu β lze stanovit jen tehdy, zn´ame-li rozdˇelen´ı T za pˇredpokladu platnosti H A ! V l´ekaˇrsk´e literatuˇre se cˇ asto mluv´ı o n´asleduj´ıc´ıch veliˇcin´ach: ■ Specificita (jinak tak´e true negative rate, TNR):
spec = TNR =
p TN = P[ H0 nen´ı zam´ıtnuta| H0 plat´ı] = 1 − α. p TN + p FP
■ Senzitivita (jinak tak´e true positive rate, TPR, nebo recall):
senz = TPR =
p TP = P[ H0 je zam´ıtnuta| H0 neplat´ı] = 1 − β. p TP + p FN
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 8 / 23
4
ROC kˇrivka Reciever operating characteristic (ROC): z´avislost vyznamnosti testu α (vodorovn´a osa) a s´ıly testu 1 − β (svisl´a osa). Parametrem ´ kˇrivky je kritick´a hodnota κ. 1.5
1.5
1.5
β = 0.226 α = 0.100
β = 0.105 α = 0.300
β = 0.026 α = 0.700
1
1
1
0.5
0.5
0.5
0 31 1.5
32
33
34
35
36
37
0 31
32
33
34
35
36
37
0 31
32
33
34
35
36
37
1 β = 0.304 α = 0.050
0.9
1
0.8 0.7
0 31 1.5
32
33
34
35
36
37
β = 0.476 α = 0.010
S´ıla testu 1 − β
0.5
0.6 0.5 0.4 0.3
1
0.2 0.5
0 31
0.1
32
33
34
35
36
37
0 0
0.2
0.4 0.6 Hladina v´ yznamnosti α
c 2015 P. Poˇs´ık
0.8
1
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 9 / 23
Volba kritick´e hodnoty Volbou kritick´e hodnoty κ sniˇzujeme riziko jedn´e chyby, ale z´arovenˇ zvyˇsujeme riziko druh´e. ■ Hodnotu κ obecnˇe vol´ıme tak, abychom se pˇribl´ızˇ ili bezchybn´e klasifikaci (α = 0, β = 0), tj. bodu (0,1) v grafu ROC.
ˇ je z´ıskat v´ıce dat! ■ Jedinou moˇznost´ı, jak sn´ızˇ it riziko obou chyb z´aroven, Moˇzn´a krit´eria pro volbu prahu κ: ■ α (κ ) = β (κ ) ■ minκ (α(κ ) + β(κ )) ■ minκ e(α(κ ), β(κ )), napˇr. minκ ( aα(κ ) + bβ(κ )), tj. minimalizace vyplatn´ ı funkce, ´ ■ α(κ ) = pˇredem zvolen´a mal´a hodnota.
Vˇetˇsinou se pouˇz´ıv´a posledn´ı moˇznost: ■ nalezen´ı κ je nejsnazˇs´ı, ■ nepotˇrebujeme zn´at rozdˇelen´ı anom´aln´ı skupiny (tj. rozdˇelen´ı, pokud H0 neplat´ı).
Kritick´a hodnota testu κ se vol´ı tak, aby chyba I. druhu nast´avala s pravdˇepodobnost´ı α nebo menˇs´ı (nelze-li dos´ahnout rovnosti). Tradiˇcnˇe se vol´ı α = 0.05 nebo α = 0.01. ˚ m´alo pravdˇepodobnym ■ Hodnoty T > κ (odpov´ıdaj´ı vysledk um ´ ´ za pˇredpokladu platnosti H0 ) povaˇzujeme za statisticky vyznamn´ e (a zam´ıt´ame H0 ). ´ ˚ ■ Hodnoty T ≤ κ (odpov´ıdaj´ı vysledk um, jejichˇz pravdˇepodobnost nen´ı dostateˇcnˇe mal´a pˇri platnosti H0 ) nejsou statisticky ´ vyznamn´ e (a H0 proto nezam´ıt´ame, ani nepotvrzujeme). ´
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 10 / 23
5
Formulace hypot´ez Obvyklym ´ c´ılem testov´an´ı hypot´ez je stanovit, zda nˇejak´a spekulativn´ı hypot´eza o pozorovan´em jevu m´a podporu v datech. O H0 se ˚ ˚ pro jej´ı zam´ıtnut´ı ve prospˇech H A . Proto obvykle: pˇredpokl´ad´a, zˇ e plat´ı, dokud data neposkytnou dostatek dukaz u“ ” ■ H0 vyjadˇruje shodu s pˇredpoklady, neexistenci rozd´ılu mezi skupinami, neexistenci vlivu, nez´avislost, apod. (protoˇze v tˇechto pˇr´ıpadech jsme obvykle schopni odvodit rozdˇelen´ı testov´e statistiky), zat´ımco ˚ vyznamn ■ H A vyjadˇruje naˇsi spekulativn´ı hypot´ezu, pro n´ızˇ hled´ame podporu v datech; vyjadˇruje odchylku od pˇredpokladu, y´ ´ rozd´ıl, existenci vlivu, z´avislosti, apod. H0 i H A mohou byt ´ ■ jednoduch´a hypot´eza, j´ızˇ odpov´ıd´a jedin´a hodnota parametru, nebo ■ sloˇzen´a hypot´eza, j´ızˇ odpov´ıd´a v´ıce hodnot parametru.
U sloˇzen´e hypot´ezy H poˇzadujeme, aby pravdˇepodobnost chyby I. druhu byla nejvyˇ ´ se α pˇres vˇsechny hodnoty parametru vyhovuj´ıc´ı H. H0 a H A se cˇ asto formuluj´ı tak, zˇ e nejsou navz´ajem svymi negacemi a nepokryvaj´ ´ ´ ı cely´ prostor moˇznych ´ hodnot parametru =⇒ chaos. Snadno se mu vyhneme, kdyˇz budeme formulovat nulovou hypot´ezu jako negaci alternativn´ı. ■ Je-li H A : θ > c, nevol´ıme H0 : θ = c, ale radˇeji H0 : θ ≤ c.
■ Nejvˇetˇs´ı riziko chyby I. druhu obvykle odpov´ıd´a pˇr´ıpadu θ = c, takˇze postup testu je stejny. ´
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 11 / 23
Klasicky´ a alternativn´ı postup testu Pˇredpoklad: M´ame testovou statistiku T, kter´a roste s parametrem θ (jehoˇz hodnota je pˇredmˇetem testu) a m´a zn´am´e rozdˇelen´ı pˇri platn´e H0 . Klasicky´ test hypot´ezy: Typicky´ postup: 1. Zvol´ıme poˇzadovanou hladinu vyznamnosti α. ´ 2. Ze znalosti rozdˇelen´ı T pro pˇr´ıpad, zˇ e plat´ı H0 , urˇc´ıme kritickou hodnotu κ tak, aby P[ T > κ ] ≤ α, tj. κ je pˇr´ısluˇsny´ kvantil rozdˇelen´ı T: κ = q T (1 − α). 3. Porovn´ame realizaci t a kritickou hodnotu κ a zam´ıtneme H0 , pokud t > κ. Ekvivalentn´ı postup: H0 zam´ıt´ame, pokud hodnota parametru θ platn´a pro H0 nepadne do (1 − α) intervalu spolehlivosti. Alternativn´ı postup: zjiˇstˇen´ı mezn´ı hladiny vyznamnosti, pˇri n´ızˇ by pozorovan´a hodnota t byla kritick´a, tj. ´ 1. Ze znalosti rozdˇelen´ı T zjist´ıme pravdˇepodobnost, s jakou statistika T nabyv´ ´ a hodnot jeˇstˇe extr´emnˇejˇs´ıch neˇz t za pˇredpokladu, a obvykle se znaˇc´ı P (nebo p-value, p-hodnota). zˇ e plat´ı H0 . T´eto pravdˇepodobnosti rˇ´ık´ame dosaˇzen´a hladina vyznamnosti ´ 2. Dosaˇzenou hladinu vyznamnosti P ´ ■ prostˇe zveˇrejn´ıme (aby si kaˇzdy ´ udˇelal z´avˇer s´am), nebo ■ porovn´ame se stanovenou poˇzadovanou hladinou vyznamnosti a zam´ıtneme H0 , pokud P < α. ´
ˇ ım niˇzsˇ´ı, t´ım je vysledek Dosaˇzenou hladinu v´yznamnosti P lze interpretovat jako m´ıru naˇs´ı duvˇ ˚ ery v platnost H0 . (C´ vyznamnˇ ejˇs´ı a t´ım ´ ´ vˇetˇs´ı m´ame “pr´avo” H0 zam´ıtnout.) c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 12 / 23
6
Statistick´a vyznamnost vs. faktick´a vyznamnost ´ ´ ˚ se s dostateˇcnym ■ I sebemenˇs´ı odchylka od pˇredpokladu a. ´ rozsahem vybˇ ´ eru uk´azˇ e jako statisticky vyznamn´ ´ ■ Oznaˇcme ∆ jistou minim´aln´ı odchylku, kter´a pro n´as bude uˇz fakticky vyznamn´ a. ´
Interval spolehlivosti 0
∆
0
∆
0
∆
0
∆
0
∆
0
∆
Vyznamnost ´ statistick´a skuteˇcn´a Ne
Moˇzn´a
Ne
Moˇzn´a
Ano
Moˇzn´a
Ano
Ano
Ne
Ne
Ano
Ne
■ Zdaleka ne kaˇzdy y, y´ i re´alnˇe. ´ efekt, ktery´ je statisticky vyznamn ´ ´ je vyznamn ´ ■ Pojem statistick´a v´yznamnost je tak l´epe ch´apat jako statistickou rozeznatelnost.
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 13 / 23
14 / 23
Kuchaˇrka pro testov´an´ı hypot´ez Typicky´ tvar testu Realizaci t testovac´ı statistiky T, kter´a roste s parametrem θ a pro H0 m´a zn´am´e rozdˇelen´ı, porovn´ame s kvantily pˇr´ısluˇsn´eho rozdˇelen´ı a H0 zam´ıtneme pˇri extr´emn´ıch hodnot´ach (nepravdˇepodobnych ´ pˇri platnosti H0 ). H0
HA
H0 zam´ıt´ame, kdyˇz
dosaˇzen´a vyznamnost P ´
θ≤c θ≥c θ=c
θ>c θ
t > q T (1 − α ) t < qT (α) t > q T (1 − α2 ) nebo t < q T ( α2 )
1 − FT (t) FT (t) 2 min( FT (t), 1 − FT (t))
V literatuˇre se cˇ asto setk´ame i s n´asleduj´ıc´ımi formulacemi hypot´ez, kter´e se ale rˇ eˇs´ı stejnˇe jako prvn´ı dva vyˇ ´ se uveden´e pˇr´ıpady: H0
HA
θ=c θ=c
θ>c θ
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 15 / 23
7
Recept: Test stˇredn´ı hodnoty N (µ, σ2 ) pˇri zn´am´em σ2 Realizaci testov´e statistiky t=
x−c√ n σ
porovn´ame s kvantily normovan´eho norm´aln´ıho rozdˇelen´ı: H0 µ≤c µ≥c µ=c
HA µ>c µ
H0 zam´ıt´ame, kdyˇz
dosaˇzen´a vyznamnost P ´
Φ −1 ( 1 − α )
1 − Φ(t) Φ(t) 2(1 − Φ(|t|))
t> t < Φ −1 ( α ) t > Φ−1 (1 − α2 ) nebo t < Φ−1 ( α2 )
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 16 / 23
Recept: Test stˇredn´ı hodnoty N (µ, σ2 ) pˇri nezn´am´em σ2 Realizaci testov´e statistiky t=
x−c√ n sx
porovn´ame s kvantily Studentova rozdˇelen´ı s n − 1 stupni volnosti: H0
HA
H0 zam´ıt´ame, kdyˇz
dosaˇzen´a vyznamnost P ´
µ≤c µ≥c µ=c
µ>c µ
t > q t ( n −1) ( 1 − α ) t < q t ( n −1) ( α ) t > qt(n−1) (1 − α2 ) nebo t < qt(n−1) ( α2 )
1 − Ft(n−1) (t) Ft(n−1) (t) 2(1 − Ft(n−1) (|t|))
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 17 / 23
8
Pˇrı´klad: Oboustranny´ test stˇredn´ı hodnoty ˚ jsme zmˇerˇ ili koncentraci b´ılkovin v krevn´ım s´eru: x = 34.46 g/l, s x = 5.835 g/l. Ovˇerˇ te hypot´ezu, zˇ e stˇredn´ı Zad´an´ı: 216 pacientum hodnota koncentrace b´ılkovin u pacientu˚ tohoto typu je µ0 = 33.5 g/l, proti moˇznosti, zˇ e se od t´eto hodnoty liˇs´ı. Pozn´amka: Protoˇze nezn´ame skuteˇcny´ rozptyl σ2 , mˇeli bychom pouˇz´ıt Studentovo rozdˇelen´ı. Protoˇze ale m´ame dostateˇcnˇe velky´ ˚ zeme jej aproximovat norm´aln´ım rozdˇelen´ım. vzorek, muˇ ˇ sen´ı 1: Interval spolehlivosti. Nepokryje-li 95% interval Reˇ spolehlivosti I hodnotu µ0 , zam´ıtneme H0 :
¯ N (34.46, 0.158) Rozdˇelen´ı v´ yb. pr˚ umˇer˚ u X: 1
α sx I = x ± √ Φ −1 ( 1 − ) = 2 n 5.835 1.96 g/l = 34.46 ± √ 216 = 34.46 ± 0.78 g/l
0.8
0.6
I = (33.68, 35.24) g/l
α 2
Pˇredpokl´adan´a hodnota µ0 = 33.5 g/l nepatˇr´ı do tohoto intervalu, coˇz je vysledek, ktery´ bychom pozorovali v m´enˇe ´ ˚ kdyby skuteˇcnˇe platilo µ = 33.5 g/l. Proto neˇz 5 % pˇr´ıpadu, zam´ıt´ame H0 na hladinˇe vyznamnosti 5 %. ´
0.2p 0
ˇ sen´ı 2: Oboustranny´ test hypot´ezy. Formulujeme Reˇ hypot´ezy: a
= 0.025
α 2
1 − α = 0.95
0.4
p 2
= 0.0078
2
H0 : µ = 33.5 g/l
= 0.025
33
= 0.0078
33.5 34 34.5 35 35.5 Rozdˇelen´ı testov´e statistiky T : N (0, 1)
36
0.4
H A : µ 6= 33.5 g/l
0.35
Realizace testov´e statistiky
0.3
x−µ√ t= n= sx 34.46 − 33.5 √ 216 = 2.418 = 5.835
0.25 0.2
α 2
= 0.025
α 2
1 − α = 0.95
= 0.025
0.15
T m´a pˇribliˇznˇe rozdˇelen´ı Φ = N (0, 1). Dosaˇzen´a hladina vyznamnosti: ´
0.1 p = 2(1 − Φ(|t|)) = 0.0156
p
0.052 0 −4
p 2
= 0.0078
−2
0
2
= 0.0078
4
Pravdˇepodobnost, zˇ e bychom pozorovali hodnotu t = 2.418 nebo vˇetˇs´ı, kdyby platila H0 , je pouze 1.56%. Na hladinˇe vyznamnosti ´ 5 % bychom H0 zam´ıtli. Na hladinˇe vyznamnosti 1 % bychom H0 zam´ıtnout nemohli. ´ c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 18 / 23
Recept: Test rozptylu N (µ, σ2 ) Realizaci testov´e statistiky t=
(n − 1)s2x c
porovn´ame s kvantily χ2 rozdˇelen´ı s n − 1 stupni volnosti: H0
HA
H0 zam´ıt´ame, kdyˇz
dosaˇzen´a vyznamnost P ´
σ2 ≤ c σ2 ≥ c σ2 = c
σ2 > c σ2 < c σ2 6 = c
t > q χ2 ( n −1) ( 1 − α ) t < q χ2 ( n −1) ( α ) t > qχ2 (n−1) (1 − α2 ) nebo t < qχ2 (n−1) ( α2 )
1 − Fχ2 (n−1) (t) Fχ2 (n−1) (t) 2 min( Fχ2 (n−1) (t), 1 − Fχ2 (n−1) (t))
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 19 / 23
9
20 / 23
Neparametrick´e testy Neparametrick´e? Neparametrick´e testy nejsou zaloˇzeny na nˇejak´e parametrizovan´e rodinˇe rozdˇelen´ı, tj. ■ jsou pouˇziteln´e bez ohledu na typ rozdˇelen´ı, ale
˚ jsou-li aplikovateln´e oba druhy). ■ jsou slabˇs´ı (ke stejn´emu z´avˇeru potˇrebujeme v´ıce dat neˇz u parametrickych ´ testu, ■ Narozd´ıl od parametrickych ´ testu˚ jsou cˇ asto pouˇziteln´e i na kvalitativn´ı data, tj. pro ordin´aln´ı cˇ i nomin´aln´ı sˇ k´alu.
c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 21 / 23
Znam´enkovy´ test ˚ zeme pouˇz´ıt test stˇredn´ı hodnoty (ktery´ vyˇzaduje rozdˇelen´ı, u nˇehoˇz stˇredn´ı Jak otestovat hypot´ezu o poloze rozdˇelen´ı, kdyˇz nemuˇ hodnota existuje)? ■ Otestujme medi´an: H0 : q X (0.5) = c ■ Plat´ı-li H0 , pak jsou kladn´e i z´aporn´e odchylky od c stejnˇe pravdˇepodobn´e.
Testovac´ı statistikou T je poˇcet kladnych ´ odchylek, kter´e testujeme na rozdˇelen´ı Bi(n, 0.5). (Z vybˇ ´ eru jsme pˇredem vylouˇcili nulov´e odchylky.) H0
HA
H0 zam´ıt´ame, kdyˇz
dosaˇzen´a vyznamnost P ´
q X (0.5) ≤ c
q X (0.5) > c
t > qBi(n, 1 ) (1 − α)
1 − FBi(n, 1 ) (t)
q X (0.5) ≥ c
q X (0.5) = c
q X (0.5) < c q X (0.5) 6= c
2
t < qBi(n, 1 ) (α) 2
t > qBi(n, 1 ) (1 − α2 ) 2
nebo t < qBi(n, 1 ) ( α2 )
2
FBi(n, 1 ) (t) 2
2 min( FBi(n, 1 ) (t), 1 − FBi(n, 1 ) (t)) 2
2
2
Pro velk´a n pouˇz´ıv´ame CLV a testujeme T0 =
2T − n √ n
na rozdˇelen´ı N(0, 1). c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 22 / 23
10
Jednovybˇ ˚ test ´ erovy´ Wilcoxonuv Testuje H0 : X m´a rozdˇelen´ı symetrick´e kolem hodnoty c. ■ M´a-li X rozdˇelen´ı symetrick´e kolem c, pak je c medi´anem i stˇredn´ı hodnotou.
ˇ ■ Casto se pouˇz´ıv´a se jako neparametrick´a alternativa testu stˇredn´ı hodnoty, je silnˇejˇs´ı neˇz znam´enkovy´ test. ■ Z realizace x = ( x1 , . . . , xn ) vypoˇcteme posloupnost (z1 , . . . , zn ), kde z j = x j − c.
˚ pˇriˇrad´ıme jim stejn´e poˇrad´ı ■ Seˇrad´ıme ji vzestupnˇe podle |z j |, cˇ ´ımˇz j-t´emu prvku pˇriˇrad´ıme poˇrad´ı r j . Je-li v´ıce stejnych ´ rozd´ılu, ˚ eru. rovn´e aritmetick´emu prumˇ
■ Testovou statistikou je
T1 =
∑
rj
j:z j >0
nebo
T2 = min
∑ j:z j >0
rj ,
∑ j:z j <0
rj .
■ Porovn´av´ame s tabulkou kritickych ´ hodnot pro tento test.
˚ V dalˇs´ıch pˇredn´asˇ k´ach uvid´ıte pˇr´ıklady dalˇs´ıch neparametrickych ´ testu. c 2015 P. Poˇs´ık
A6M33SSL: Statistika a spolehlivost v l´ekaˇrstv´ı – 23 / 23
11