5 5.1
Parametrick´ e testy hypot´ ez Pojem parametrick´ eho testu
(Skripta str. 95-96)
Na z´akladˇe v´ ybˇeru srovn´av´ame dvˇe tvrzen´ı o hodnotˇe urˇcit´eho parametru θ rozdˇelen´ı f (x, θ). Prvn´ı tvrzen´ı (kter´e vˇetˇsinou obhajuje st´avaj´ıc´ı stav vˇec´ı) se naz´ yv´a nulov´a hypot´eza a znaˇc´ı se H0 , druh´e tvrzen´ı (kter´e vˇetˇsinou prosazuje, ˇze vˇeci se zmˇenily) je alternativn´ı hypot´eza oznaˇcen´a HA . Nulov´a hypot´eza nˇeco tvrd´ı: napˇr., ˇze stˇredn´ı hodnota µ je rovna µ0 a alternativn´ı hypot´eza ji odporuje. To m˚ uˇze m´ıt tˇri r˚ uzn´e podoby: hypot´ eza I. parametr m´a podle HA vˇ etˇ s´ı hodnotu neˇz podle H0 II. parametr m´a podle HA menˇ s´ı hodnotu neˇz podle H0 III. parametr se podle HA nerovn´ a hodnotˇe parametru podle H0
pˇ r´ıklad (25) µ > µ0 µ < µ0 µ 6= µ0
Tvrzen´ı testujeme na z´akladˇe testov´e statistiky, kterou je statistika pro bodov´ y odhad parametru podle H0 . Pro parametrick´e testy lze podstatu testov´an´ı vyloˇzit v souvislosti s IS n´asleduj´ıc´ım zp˚ usobem (pro jednoduchost budeme uvaˇzovat test pro stˇredn´ı hodnotu a se zn´am´ ym rozptylem souboru). Nulov´a hypot´eza ˇr´ık´a, ˇze µ = µ0 . Jestliˇze je tato hypot´eza pravdiv´a a kolem bodu µ0 sestroj´ıme α IS a tam by s tak´e s pravdˇepodobnost´ı 1−α mˇel padnout bodov´ y odhad, poˇr´ızen´ y z v´ ybˇeru. Pokud tam padne, hypot´ezu H0 nezam´ıt´ame – ˇrekneme, ˇze data neprok´azala jej´ı neplatnost. Pokud bodov´ y odhad padne mimo IS, hypot´ezu H0 zam´ıtneme. Jedin´ y (form´aln´ı) rozd´ıl test˚ u a interval˚ u je v tom, ˇze pˇri intervalu pouˇz´ıv´ame nenormovan´ y tvar statistiky, napˇr. pro stˇredn´ı hodnotu se zn´am´ ym rozptylem je to v´ ybˇerov´ y pr˚ umˇer X , zat´ımco pro test √ 0 pouˇzijeme normovan´ y v´ ybˇerov´ y pr˚ umˇer z = X −µ n. Jeho realizaci oznaˇc´ıme zr . σ ´ m k a: Vˇsimnˇete si, ˇze pro normov´an´ı pouˇzijeme µ0 , coˇz je stˇredn´ı hodnota podle nulov´e Pozna hypot´ezy. Cel´y test prob´ıh´ a za platnosti H0 , kter´ a bud’ d´ ale trv´ a, nebo je testem vyvr´ acena.
f (z|H0 )
α/2
α/2
1−α 6
IS
5.2
Z´ akladn´ı pojmy
zr
(Skripta str. 97)
V pˇredchoz´ım odstavci jsme dosti netradiˇcnˇe nast´ınili podstatu testov´an´ı parametrick´ ych hypot´ez. Nyn´ı uvedeme z´akladn´ı pojmy a postupy pro testov´an´ı tak, jak je lze bˇeˇznˇe nal´ezt v uˇcebnic´ıch klasick´e statistiky. Pojmy budeme ihned demonstrovat na n´asleduj´ıc´ım pˇr´ıkladˇe. 17
ˇ ´ı k l a d: Pr
Z´avod vyr´ab´ı televizn´ı obrazovky u kter´ych ud´av´a stˇredn´ı ˇzivotnost 1200 h a rozptyl ˇzivotnosti 900 V´yvojov´e oddˇelen´ı provedlo nˇekter´e technologick´e zmˇeny pˇri v´yrobˇe a tvrd´ı, ˇze ˇzivotnost novˇe vyroben´ych obrazovek je vˇetˇs´ı. Sv´e tvrzen´ı dokl´ad´a v´ybˇerem 10 obrazovek z nov´e s´erie pro nˇeˇz byla zjiˇstˇena pr˚ umˇern´a ˇzivotnost 1216 h. Testujte H0 : ”stˇredn´ı ˇzivotnost obrazovek je 1200 hodin” na hladinˇe v´yznamnosti 0.05. h2 .
Nulov´ a hypot´ eza H0 je z´akladn´ı hypot´eza, kter´a vˇetˇsinou potvrzuje st´avaj´ıc´ı stav. [H0 : stˇredn´ı ˇzivotnost obrazovek je 1200 h.] Alternativn´ı hypot´ eza HA je nov´a hypot´eza, kter´a jedn´ım ze zp˚ usob˚ u (25) pop´ır´a H0 . [HA : stˇredn´ı ˇzivotnost obrazovek je vˇetˇs´ı.] Testov´ a statistika je normovan´a statistika pro bodov´ y odhad testovan´eho parametru. [Zde se jedn´a o stˇredn´ı hodnotu, jej´ıˇz odhadov´a statistika je v´ ybˇerov´ y pr˚ umˇer.] D´ale se jako parametr bude objevovat rozptyl se statistikou v´ ybˇerov´ y rozptyl a pod´ıl se statistikou v´ ybˇerov´ y pod´ıl. Hladina v´ yznamnosti α je pravdˇepodobnost α z IS. Je to tzv. pravdˇepodobnost I. druhu, tj., ˇze H0 bude zam´ıtnuta, zat´ımco je ve skuteˇcnosti pravdiv´a. [V pˇr´ıkladu je α = 0.05, coˇz b´ yv´a nejˇcastˇeji pouˇz´ıvan´a hodnota.] Obor pˇ rijet´ı je mnoˇzina hodnot normovan´e statistiky, kter´a odpov´ıd´a IS. Pokud normovan´a statistika padne do oboru pˇrijet´ı, nen´ı H0 zam´ıtnuta. Kritick´ y obor W je mnoˇzina hodnot normovan´e statistiky, kter´a odpov´ıd´a doplˇ nku IS. Pokud normovan´a statistika padne do kritick´eho oboru, je H0 zam´ıtnuta. ´ m k a: Podle alternativn´ı hypot´ezy HA pozn´ame smˇerov´an´ı testu. Pozna pro W = (•; ∞) podle I. hovoˇr´ıme o pravostrann´em testu; pro W = (−∞; •) podle II. hovoˇr´ıme o levostrann´em testu; pro W = (−∞; •) ∪ (•; ∞) podle III. hovoˇr´ıme o oboustrann´em testu.
ˇ ´ı k l a d: (pokraˇcov´ Pr an´ı) Vypoˇcteme pˇr´ıklad o televizn´ıch obrazovk´ach. Statistika pro odhad: x = 1216 (zad´ano). Hladina v´yznamnosti: α = 0.05 (zad´ano). √ √ √ Normovan´a statistika: z = x−µ0 n = 1216−1200 10 = 1.687. r
σ
900
Obor pˇrijet´ı: dostaneme normov´an´ım pravostrann´eho IS, tj. (−∞; zα ) = (−∞; 1.645). Kritick´y obor: je doplˇ nkem oboru pˇrijet´ı, tj. W = (1.645; ∞). Z´avˇer: z ∈ W ⇒ H0 zam´ıt´ame. Tedy, nen´ı pravda, ˇze stˇredn´ı ˇzivotnost obrazovek je 1200 hodin.
18
5.3
P-hodnota
(Skripta str. 101-103)
Z pˇredchoz´ıho pˇr´ıkladu je patrn´e, ˇze z klasick´eho testu nepozn´ame, ”jak moc” H0 zam´ıt´ame nebo ”jak daleko” od zam´ıtnut´ı se H0 nach´az´ı. Abychom tento nedostatek odstranili, a tak´e abychom v´ ysledek testu vyj´adˇrili jedin´ ym ˇc´ıslem, zav´ad´ıme p-hodnotu pv . Pro pravostrann´ y test stˇredn´ı hodnoty je p-hodnota definov´ana vztahem pv = P (Z > zr |H0 ),
(26)
coˇz je plocha pod hustotou pravdˇepodobnosti normovan´e statistiky, vpravo od realizovan´e statistiky.
f (z|H0 )
α/2
1−α
α/2
pv 6
W
zr
Z obr´azku je patrn´e, ˇze: − bude-li pv = α, budeme na hranici zam´ıtnut´ı, − pro pv < α leˇz´ı realizovan´a statistika v kritick´em oboru W , a tedy H0 zam´ıt´ame, − pro pv > α leˇz´ı realizovan´a statistika mimo kritick´ y obor W , a tedy H0 nezam´ıt´ame. ˇ ´ı k l a d: (pokraˇcov´ Pr an´ı) K pˇredchoz´ımu pˇr´ıkladu jeˇstˇe dopoˇcteme p-hodnotu: pv = P (Z > 1.687) = 0.046. Protoˇze pv < α, hypot´ezu H0 zam´ıt´ame.
5.4
Obecn´ e sch´ ema testu hypot´ ezy
(Skripta str. 101)
Pro jednotliv´e pˇr´ıpady z kapitoly 2 lze pouˇz´ıt obecn´e schema: Zn´ ame: zadan´e a spoˇcten´e charakteristiky a konstanty. y Testov´ a statistika T : pouˇzit´a normovan´a statistika a jej´ı rozdˇelen´ı (vzorec - normovan´ podle H0 ). Hodnota statistiky Tr : statistika s dosazen´ ym v´ ybˇerem (vypoˇcten´e ˇc´ıslo). 19
P-hodnota: spoˇcteme pravdˇepodobnost Pr = P (T < Tr ) (kvantil pro hodnotu statistiky - funkce xxx.cdf) pv = 1 − Pr pro pravostrann´ y test, tj. θ0 > θ pv = Pr pro levostrann´ y test, tj. θ0 < θ pv = 2 min{Pr , 1 − Pr } pro oboustrann´ y test, tj. θ0 6= θ Z´ avˇ er: slovn´ı interpretace v´ ysledku. ˇ ´ı k l a d: (test pro dva pod´ıly) Na dvou pracoviˇst´ıch A a B byly sledov´any pracovn´ı prostoje. Pr
Pracoviˇstˇe A bylo sledov´ano v nA = 800 ˇcasov´ych okamˇzic´ıch a bylo zaznamen´ano n+ A = 116 pros+ toj˚ u, zat´ımco pracoviˇstˇe B bylo sledov´ano nB = 1200 kr´at a zjiˇstˇeno nB = 138 prostoj˚ u. Na hladinˇe v´yznamnosti α = 0.05 testujte hypot´ezu o rovnosti stˇredn´ıch pod´ıl˚ u prostoj˚ u na obou pracoviˇst´ıch. ˇ sen´ı provedeme podle uveden´eho sch´ematu: Reˇ Zn´ ame: Hypot´ezy: H0 : pA = pB , HA : pA 6= pB Smˇerov´an´ı: oboustrann´y test. Pod´ıly: pA =
116 = 0.145, 800
pB =
138 = 0.115, 1200
pP =
p1 (1 − p1 ) p2 (1 − p2 ) + = 2.4 10−4 n1 − 1 n2 − 1
Hladina v´yznamnosti: α = 0.05 Testov´ a statistika:
Hodnota statistiky: Kritick´ y obor P-hodnota:
p1 − p2 z= √ pP
∼ N (0; 1)
zr = 1.94
W = (−1.96; 1.96)
pv = 2 × 0.0265 = 0.053.
Z´ avˇ er: Na hladinˇe 0.05 hypot´ezu H0 nezam´ıt´ame, pod´ıly prostoj˚ u na pracoviˇst´ıch A a B nejsou stejn´e. P-hodnota nav´ıc ukazuje, ˇze zam´ıtnut´ı je pomˇernˇe tˇesn´e.
´ m k a: Pozna 1. V´ybˇer charakteristiky (vzorce) pro test urˇcuje H0 - o ˇcem vypov´ıd´ a tvrzen´ı nulov´e hypot´ezy, to se testuje. 2. O smˇerov´ an´ı testu rozhoduje HA - podle toho jak odporuje nulov´e hypot´eze (<, urˇc´ıme smˇerov´ an´ı.
20
>,
6=)
5.5
Vybran´ e parametrick´ e testy
(Skripta str. 103-115)
Budeme sledovat parametrick´e testy pro stˇredn´ı hodnotu, rozptyl a pod´ıl, jako pro IS. Stˇ redn´ı hodnota (zn´ am´ e σ 2 )13 •|• ^
V programu O c t a v e lze pro tyto testy pouˇz´ıt funkci [pval, z] = z− test (x, m, v, alt), [pval, z] = z− test− 2(x, y, v− x, v− y, alt),
kde pval je p-hodnota, z je hodnota statistiky, rozptyl souboru, alt typ testu (<, >, <>).
x,y
je v´ ybˇer,
v,v− x,v− y je
Stˇ redn´ı hodnota (nezn´ am´ e σ 2 )14 •|• ^
V programu O c t a v e lze pro tyto testy pouˇz´ıt funkci [pval, [pval, [pval, [pval,
t, t, t, t,
df] df] df] df]
= = = =
t− test (x, m, t− test− 2s (x, t− test− 2n (x, t− test− 2p (x,
kde pval je p-hodnota, t je hodnota statistiky, v´ ybˇer, alt typ testu (<, >, <>).
alt), y, alt), y, alt), y, alt),
df jsou stupnˇe volnosti,
x,y je
Rozptyl15 •|• ^
V programu O c t a v e lze pro tyto testy pouˇz´ıt funkci [pval, ch2, df] = var− test (x, v0, alt), [pval, f, df− num, df− den] = var− test− 2 (x, y, alt),
kde pval je p-hodnota, ch2,t je hodnota statistiky, df,df− num,df− den jsou stupnˇe volnosti, x,y je v´ ybˇer, v0 je rozptyl podle nulov´e hypot´ezy, alt typ testu (<, >, <>). Pod´ıl16 U tohoto testu se v literatuˇre obvykle uv´ad´ı trochu jin´a statistika. V z´ajmu jednotnosti jsme ponechali stejnou statistiku, jako pro odhad (coˇz je zvykem). Rozd´ıly jsou zanedbateln´e. •|• ^ 13
V programu O c t a v e lze pro tento test pouˇz´ıt funkci
Skripta Skripta 15 Skripta 16 Skripta 14
str. str. str. str.
103 105,108-113 106 107,113-114
21
[pval, z] = prop− test− 2 (x1, n1, x2, n2, alt), kde pval je p-hodnota, z je hodnota statistiky, x1,x2 jsou v´ ybˇerov´e pod´ıly (poˇcty), n1,n2 jsou poˇcty pokus˚ u, alt typ testu (<, >, <>).
22