Pˇ r´ıklady na testy hypot´ ez o parametrech norm´ aln´ıho rozdˇ elen´ı 1. O ˇzivotnosti 75W ˇza´rovky (v hodin´ach) je zn´amo, ˇze m´a norm´aln´ı rozdˇelen´ı s σ = 25h. Pro n´ahodn´ y v´ ybˇer 20 ˇza´rovek byla stanovena pr˚ umˇern´a ˇzivotnost x = 1014h. (a) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze ˇzivotnost (µ) je 1000 hodin, proti alternativˇe, ˇze µ 6= 1000. √ 0 Vyuˇzijeme testovou statistiku U = n X−µ ı realizace je v tomto pˇr´ıpadˇe σ . Jej´ 35,06. Pˇri oboustrann´e alternativˇe je doplnˇek kritick´eho oboru W α = h−u1−α/2 , u1−α/2 i (Nakreslete si pro pˇredstavu hustotu N (0, 1) rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.05 = h−u0.975 , u0.975 i = h−1.96, 1.96i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0,05 zam´ıt´ ame. (b) Otestujte hypot´ezu H0 , ˇze ˇzivotnost (µ) je 1000 hodin, proti alternativˇe, ˇze µ > 1000. √ 0 ı realizace je v tomto pˇr´ıpadˇe Vyuˇzijeme testovou statistiku U = n X−µ σ . Jej´ 35,06. Pˇri jednostrann´e alternativˇe je doplnˇek kritick´eho oboru W α = (−∞, u1−α i. V tomto pˇr´ıpadˇe je tedy W 0.05 = (−∞, 1.645i. Hypot´ezu H0 opˇet na hladinˇe v´yznamnosti 0,05 zam´ıt´ame. (c) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze ˇzivotnost (µ) je 1000 hodin, proti alternativˇe, ˇze µ 6= 1000 pomoc´ı intervalu spolehlivosti. √ 0 Vyuˇzijeme testovou statistiku U = n X−µ ıho tvaru odvod´ıme interσ . Z jej´ σ σ val spolehlivosti hX − u1− α2 √n , X + u1− α2 √n i. V naˇsem pˇr´ıpadˇe P (µ ∈ h1011.8, 1016.2i) = 0.95. Testovan´a hodnota 1000 neleˇz´ı ve vypoˇcten´em intervalu spolehlivosti a proto hypot´ezu H0 zam´ıt´ame na hladinˇe v´yznamnosti 0,05. 2. Poˇzadovan´a stˇredn´ı hodnota vlhkosti ˇcaje je 4.1% a smˇerodatn´a odchylka 0,4%. V 15 vzorc´ıch byly anal´ yzou zjiˇstˇeny tyto skuteˇcn´e hodnoty vlhkosti v %: 4.24 3.75 4.20 3.93 4.24 3.21 3.86 4.26 4.20 4.25 4.23 3.73 4.09 3.98 3.94 Pˇredpokl´ad´ame, ˇze jde o realizace n´ahodn´eho v´ ybˇeru z norm´aln´ıho rozdˇelen´ı. (a) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze stˇredn´ı hodnota vlhkosti ˇcaje je 4.1%. √ 0 Vyuˇzijeme testovou statistiku T = n X−µ ı realizace je v tomto pˇr´ıpadˇe Sn . Jej´ √ 4.0073−4.1 t = 15 0.2895 = −1.2397. Pˇri oboustrann´e alternativˇe je doplnˇek kritick´eho oboru W α = h−t1−α/2 (14), t1−α/2 (14)i (Nakreslete si pro pˇredstavu Pravdˇepodobnost a statistika I (S1P)
´ FSI VUT v Brnˇe, 2015 Z. H¨ ubnerov´a, UM
hustotu t rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.05 = h−2.144, 2.144i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0,05 nezam´ıt´ ame. (b) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze smˇerodatn´a odchylka vlhkosti ˇcaje je 0.4%. Hypot´eza je shodn´ a s hypot´ezou, ˇze rozptyl vlhkosti ˇcaje je roven 0.16. 2 Vyuˇzijeme testovou statistiku K = n−1 ı realizace je v tomto pˇr´ıpadˇe σ 2 Sn . Jej´ 14 k = 0.16 0.0838 = 7.3325. Pˇri oboustrann´e alternativˇe je doplnˇek kritick´eho oboru W α = hχ2α/2 (14), χ21−α/2 (14)i (Nakreslete si pro pˇredstavu hustotu χ2 rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.05 = h5.6287, 26.1189i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0,05 nezam´ıt´ ame. 3. U 15 dospˇel´ ych muˇz˚ u ve vˇeku mezi 35 a 50 let byl zkoum´an vliv diety a cviˇcen´ı na hladinu cholesterolu. Celkov´a hladina cholesterolu byla mˇeˇrena u kaˇzd´eho jedince na poˇca´tku a po tˇrech mˇes´ıc´ıch u ´ˇcasti na programu aerobn´ıho cviˇcen´ı a zkouman´e diety. V´ ysledky jsou uvedeny v n´asleduj´ıc´ı tabulce. Pˇredpokl´ad´ame, ˇze jde o realizace n´ahodn´eho v´ ybˇeru z norm´aln´ıho rozdˇelen´ı. osoba 1 2 3 4 5 6 7 8 9 10 pˇred 265 240 258 295 251 245 287 314 260 279 pot´e 229 231 227 240 238 241 234 256 247 239 osoba 11 12 13 14 15 pˇred 283 240 238 225 247 pot´e 246 218 219 226 233 (a) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze program nem´a vliv na hladinu cholesterolu. Hladiny cholesterolu pˇred a po programu jsou jednoznaˇcnˇe z´avisl´e. Proto nem˚ uˇzeme vyuˇz´ıt dvouv´ybˇerov´y t-test pˇri shodn´ych nebo r˚ uzn´ych rozptylech. Vypoˇcteme rozd´ıl hladin cholesterol˚ u pˇred a po programu pro kaˇzd´eho jednotlivce. Pot´e otestujeme hypot´ezu, ˇze stˇredn´ı hodnota rozd´ılu je nulov´a. √ 0 Vyuˇzijeme testovou statistiku T = n D−µ . Jej´ı realizace je v tomto pˇr´ıpadˇe S n √ 26.8667−0 t = 15 19.0371 = 5.4659. Pˇri oboustrann´e alternativˇe je doplnˇek kritick´eho oboru W α = h−t1−α/2 (14), t1−α/2 (14)i (Nakreslete si pro pˇredstavu hustotu t rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.05 = h−2.144, 2.144i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0,05 zam´ıt´ ame. Pravdˇepodobnost a statistika I (S1P)
´ FSI VUT v Brnˇe, 2015 Z. H¨ ubnerov´a, UM
4. Koncentrace arzenu v kohoutkov´e vodˇe m˚ uˇze znamenat potencion´aln´ı zdravotn´ı riziko. Byla mˇeˇrena koncentrace arzenu [v miliardtin´ach] v 10 oblastech v hlavn´ıho mˇesta Arizony Phoenixu a 10 oblastech venkovsk´e Arizony. Bylo zjiˇstˇeno x1 = 12.5 a s1 = 7.63 ve Phoenixu a x2 = 27.5 a s1 = 15.3 na venkovˇe. Pˇredpokl´ad´ame, ˇze jde o realizace n´ahodn´eho v´ ybˇeru z norm´aln´ıho rozdˇelen´ı. (a) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze rozptyl koncentrac´ı arzenu ve Phoenixu a na venkovˇe je stejn´ y. Testujeme hypot´ezu H0 : σ12 = σ22 . Pˇredpokl´ad´ame nez´avislost n´ahodn´ych 2 v´ybˇer˚ u, protoˇze ˇslo o vzd´ alen´e lokality. Vyuˇzijeme F statistiku F = SS12 . Jej´ı 7.632 15.32
2
= 0.2487. Pˇri oboustrann´e alternativˇe realizace je v tomto pˇr´ıpadˇe f = je doplnˇek kritick´eho oboru W α = hFα/2 (9, 9), F1−α/2 (9, 9)i (Nakreslete si pro pˇredstavu hustotu F rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.05 = h0.2484, 4.0260i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0,05 nezam´ıt´ ame. (b) Na hladinˇe v´ yznamnosti 0,05 otestujte hypot´ezu H0 , ˇze stˇredn´ı hodnoty koncentrac´ı arzenu ve Phoenixu a na venkovˇe jsou stejn´e. Testujeme hypot´ezu H0 : µ1 −µ2 = 0. Pˇredpokl´ad´ame nez´avislost n´ahodn´ych v´ybˇer˚ u, protoˇze ˇslo o vzd´ alen´e lokality. Kv˚ uli v´ysledku pˇrechoz´ıho testu vyuˇzijeme dvouv´ybˇerov´y q t test se shodn´ymi rozptyly, kter´y je zaloˇzen na statistice p X 1 −X 2 −∆ n1 n2 ((n1 − 1)S12 + (n2 − 1)S22 )/(n1 + n2 − 2). T = S n1 +n2 , kde S = p Vypoˇcteme S = (9 · 7.632 q + 9 · 15.32 )/18 = 12.0894. Proto je realizace 100 ri oboustrann´e alternativˇe testov´e statistiky t = 12.5−27.5 12.0894 20 = −2.7744. Pˇ je doplnˇek kritick´eho oboru W α = h−t1−α/2 (18), t1−α/2 (18)i (Nakreslete si pro pˇredstavu hustotu t rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.05 = h−2.1009, 2.1009i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0,05 zam´ıt´ ame. 5. Byla sledov´ana hmotnost v´apn´ıku ve standardn´ım cementu a v cementu s pˇr´ımˇes´ı olova. Niˇzˇs´ı hladina v´apn´ıku by znamenala, ˇze mechanismus hydratace cementu je blokov´an a umoˇznila by vodˇe koncentrovat se av r˚ uzn´ ych m´ıstech struktury cementu. Deset vzork˚ u standardn´ıho cementu mˇelo pr˚ umˇernou hmotnostn´ı procento v´apn´ıku x1 = 90.0 s v´ ybˇerovou smˇerodatnou odchylkou s1 = 7.0 a 15 vzork˚ u olovem obohacen´eho cementu mˇelo pr˚ umˇernou procentul´an´ı v´ahu
Pravdˇepodobnost a statistika I (S1P)
´ FSI VUT v Brnˇe, 2015 Z. H¨ ubnerov´a, UM
kalcia x2 = 87.0 s s2 = 4.0. Pˇredpokl´ad´ame, ˇze hmotnostn´ı procento kalcia m´a norm´aln´ı rozdˇelen´ı. (a) Na hladinˇe v´ yznamnosti 0.1 otestujte hypot´ezu H0 , ˇze rozptyl hmotnostn´ıho procenta kalcia v obou typech cementu je stejn´ y. Testujeme hypot´ezu H0 : σ12 = σ22 . Pˇredpokl´ad´ame nez´avislost n´ahodn´ych 2 v´ybˇer˚ u, protoˇze jde o nez´ avisl´e vzorky. Vyuˇzijeme F statistiku F = SS12 . Jej´ı 2
2
7.0 ri oboustrann´e alternativˇe realizace je v tomto pˇr´ıpadˇe f = 4.0 2 = 3.0625. Pˇ je doplnˇek kritick´eho oboru W α = hFα/2 (14, 9), F1−α/2 (14, 9)i (Nakreslete si pro pˇredstavu hustotu F rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). V tomto pˇr´ıpadˇe je tedy W 0.1 = h0.3780, 3.0255i. Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0.1 zam´ıt´ ame.
(b) Na hladinˇe v´ yznamnosti 0.1 otestujte hypot´ezu H0 , ˇze stˇredn´ı hodnoty hmotnostn´ıho procenta kalcia v obou typech cementu jsou stejn´e. Testujeme hypot´ezu H0 : µ1 −µ2 = 0. Pˇredpokl´ad´ame nez´avislost n´ahodn´ych v´ybˇer˚ u, protoˇze jde o nez´ avisl´e vzorky. Kv˚ uli v´ysledku pˇrechoz´ıho testu vyuˇzijeme dvouv´ybˇerov´y t test s rozd´ıln´ymi rozptyly, kter´y je zaloˇzen na statistice X−Y −∆ T = r . Realizace testov´e statistiky je t = √90−87 = 1.3599. Pˇri 49 16 2 2 S2 S1 n1 + n2
15 + 10
tomto testu nen´ı zn´ am´e pˇresn´e rozdˇelen´ı testovac´ı statistiky a je tˇreba jej aproximovat. Jedna z moˇ z´ıt studentovo t rozdˇelen´ı s df stupni znost´ı je vyuˇ 2 1 R 2 1 1 volnosti, kde df = 1+R n1 −1 + (1+R)2 n21−1 , a R = SS12 nn21 . V naˇsem pˇr´ıpadˇe 2 49 10 1 2.0417 2 1 1 to je R = 16 15 = 2.0417 a df = 3.0417 14 + (1+2.0417)2 19 = 0.0442. Odtud df = 22.6284. Pˇresnou hodnotu kvantilu t0.95 (22.6284) lze z´ıskat ze softwaru jako 1.7151. Pˇr´ıpadnˇe vyuˇzijeme vhodnou interpolaci bl´ızk´ych hodnot z tabulek. Pˇri oboustrann´e alternativˇe je doplnˇek kritick´eho oboru W α = h−1.7151, 1.7151i (Nakreslete si pro pˇredstavu hustotu t rozdˇelen´ı a vyznaˇcte odpov´ıdaj´ıc´ı kvantily). Hypot´ezu H0 tedy na hladinˇe v´yznamnosti 0.1 nezam´ıt´ ame.
Pravdˇepodobnost a statistika I (S1P)
´ FSI VUT v Brnˇe, 2015 Z. H¨ ubnerov´a, UM
N(µ2 , σ22 )
N(µ2 , σ22 )
N(µ2 , σ22 )
A(π2 )
N(µ1 , σ12 )
N(µ1 , σ12 )
N(µ1 , σ12 )
A(π1 )
nezn´ame
ne
ne π1 = π2
σ12 = σ22
Yn1 +Zn2 n1 +n2
2 1 R 1 1 = 1+R + (1+R) 2 n −1 , kde R = n1 −1 2 pravdˇepodobnost, 2007)
1 f
3. v =
2.
N ( 12 ln
1+ρ 1−ρ
U ∼ N (0, 1)
as
Z∼
as
2 SX n2 SY2 n1
T =
U ∼ N (0, 1)
as
√
−
Z n2 n2
2 SX SY2
S2
n > 30
n1 n2 n1 +n2
2
+ nY
q
S2 X n1
X−Y −∆ r
v(1−v)
Yn1 n1
F ∼ F (n1 − 1, n2 − 1) F =
T ∼ t(f )
as
T ∼ t(n1 + n2 − 2)
n
n1 > 50 a n2 > 50
dvouv´ ybˇerov´ y t-test pˇri stejn´ ych rozptylech dvouv´ ybˇerov´ y t-test pˇri r˚ uzn´ ych rozptylech (Behrens-Fisher probl´em) F-test
pozn´amka p´arov´ y t-test
n ≥ 10, |r| = 6 1, |ρ| = 6 1
testov´a statistika √ TD = n D−∆ , Di = SD Xi − Yi q n2 T = X−YS −∆ nn11+n , 2 S viz pozn.
π0 (1−π0 )
1−rXY XY ln 1+r 1−rXY Yn −π0 √ n
U=√
Z=
1 2
rozdˇelen´ı testov´e stat. TD ∼ t(n − 1)
+
ρ , 1 ) 2(n−1) n−3
testov´a statistika pozn´amka √ X−µ0 U= n σ √ t-test pro jeden v´ ybˇer T = n X−µ Sn n−1 2 K = σ 2 Sn √ Pearson˚ uv test rXY √ T = n − 2 pouze pro test line´arn´ı nez´avislosti 2
Welch˚ uv pˇribliˇzn´ y t-test (jin´ y viz. Karp´ıˇsek: Matematika IV, Statistika a
µ1 , µ2 nezn´ame
z´avisl´e hypot´eza pˇredpoklad ano µ1 − µ2 = ∆ σ12 , σ22 , ρ nezn´ame ne µ1 − µ2 = ∆ σ12 , σ22 nezn´ame, σ12 = σ22 ne µ1 − µ2 = ∆ σ12 , σ22 nezn´ame, σ12 6= σ22
n zn´ame
µ1 , µ2 , σ12 , σ22
a binomick´eho rozdˇelen´ı pˇredpoklad rozdˇelen´ı testov´e stat. 2 σ zn´ame U ∼ N (0, 1) 2 σ nezn´ame T ∼ t(n − 1) µ nezn´ame K ∼ χ2 (n − 1) µ1 , µ2 , σ12 , σ22 nezn´ame T ∼t(n − 2)
Pozn´amky: p 2 + (n2 − 1)SY2 )/(n1 + n2 − 2) 1. S = ((n1 − 1)SX
n1 , n2
n1 , n2
n1 , n2
n1 , n2
2. v´ ybˇer z rozsahy N(µ2 , σ22 ) n1 = n2
π = π0
Bi(n, π)
1. v´ ybˇer z N(µ1 , σ12 )
ρ = ρ0
norm´aln´ıho hypot´eza µ = µ0 µ = µ0 σ 2 = σ02 ρ=0
N2 (µ1 , µ2 , σ12 , σ22 , ρ)
Testy o parametrech rozdˇelen´ı N(µ, σ 2 ) N(µ, σ 2 ) N(µ, σ 2 ) N2 (µ1 , µ2 , σ12 , σ22 , ρ)