Testov´ an´ı hypot´ ez: dvouv´ ybˇ erov´ y t-test, Student˚ uv p´ arov´ y test Ing. Michael Rost, Ph.D.
´ Uvod do probl´ emu . . . Jiˇ z zn´ ame jednov´ ybˇ erov´ y t-test, pˇ ri kter´ em jsme mˇ eli k dispozici pouze jeden v´ ybˇ er. M˚ uˇ zeme se setkat tak´ e se situac´ı, ve kter´ e potˇ rebujeme porovnat dva ˇ ci v´ıce soubor˚ u navz´ ajem. V pˇ r´ıpadˇ e dvou v´ ybˇ er˚ u, m˚ uˇ zeme pouˇ z´ıt, pˇ ri splnˇ en´ı urˇ cit´ ych pˇ redpoklad˚ u, dvouv´ ybˇ erov´ e t-testy. Postup je stejn´ y:
c Rost 2006 °
Magdalena Rettigov´ a doporuˇ cuje:
1. Zformulovat hypot´ ezy: H0 vs. HA. 2. Stanovit hodnotu α, nejˇ castˇ eji vol´ıme α = 0, 05 nebo α = 0, 01. 3. Zvolit adekv´ atn´ı testov´ e krit´ erium a stanovit hodnotu testov´ eho krit´ eria 4. Zjistit zda T ∈ K nebo zda p-value ≤ α 5. Z´ avˇ er c Rost 2006 °
Pˇ r´ıklad - motivace U ˇ sestn´ acti pracovn´ık˚ u bez v´ ycviku (n1 = 16) a u deseti (n2 = 10) pracovn´ık˚ u, kteˇ r´ı absolvovali v´ ycvik, byla sledov´ ana doba reakce na urˇ cit´ y podmˇ et v sekund´ ach. P˚ uvodn´ı datov´ e soubory jiˇ z nejsou k dispozici, nicm´ enˇ e jeden z psycholog˚ u si poznamenal tyto charakteristiky obou soubor˚ u: x ¯1 = 11, 8; x ¯2 = 10, 00;
s2 1 = 2, 3 . s2 2 = 2, 5 .
S 95 % spolehlivost´ı ovˇ eˇ rte, zda v´ ycvik vede ke zrychlen´ı sledovan´ e reakce. Dobu reakce pracovn´ıka, budeme pokl´ adat za n´ ahodnou veliˇ cinu s norm´ aln´ım rozdˇ elen´ım. c Rost 2006 °
Testy hypot´ ez o shodˇ e stˇ redn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı Testujeme-li hypot´ ezu o shodˇ e stˇ redn´ıch hodnot dvou nez´ avisl´ ych norm´ aln´ıch rozdˇ elen´ı, jejichˇ z rozptyly nezn´ ame, je zp˚ usob testu z´ avisl´ y na tom, zda m˚ uˇ zeme pˇ redpokl´ adat n´ asleduj´ıc´ı:
• rozptyly jsou shodn´ e.
• rozptyly obou v´ ybˇ er˚ u lze povaˇ zovat za r˚ uzn´ e.
Z tohoto d˚ uvodu je nutn´ e nejprve prov´ est test shody rozptyl˚ u.
c Rost 2006 °
Test shody rozptyl˚ u
F -test
Prov´ ad´ıme test hypot´ ezy H0 : σ12 = σ22 . proti alternativn´ı hypot´ eze (ta m˚ uˇ ze b´ yt levostrann´ a, pravostrann´ a, nebo oboustrann´ a). Testovac´ım krit´ eriem je statistika F : s2 F = 1 , 2 s2 kter´ a m´ a za platnosti nulov´ e hypot´ ezy rozdˇ elen´ı F (m − 1, n − 1). Symbolicky tedy F ∼ F (m − 1, n − 1) .
c Rost 2006 °
Test shody rozptyl˚ u
F -test
Jednotliv´ e kritick´ e obory jsou pak vymezeny n´ asledovnˇ e:
H0
HA
K
σ12 ≤ σ22
σ12 > σ22
{F : F ≥ F1−α(m − 1, n − 1)}
σ12 ≥ σ22
σ12 < σ22
{F : F ≤ Fα(m − 1, n − 1)}
σ12 = σ22
σ12 6= σ22
{F : F ≤ F α (m − 1, n − 1) ∪ 2 F ≥ F1− α (m − 1, n − 1)} 2
c Rost 2006 °
Varianta a) shodn´ e rozptyly homoskedasticita Pokud tedy pˇ redpokl´ ad´ ame, na z´ akladˇ e pˇ redchoz´ıho testu, ˇ ze jsou oba rozptyly shodn´ e, lze k testov´ an´ı nulov´ e hypot´ ezy o shodˇ e stˇ redn´ıch hodnot H0 : µ1 = µ2 vyuˇ z´ıt testovac´ı statistiky: x ¯ −x ¯ t= 1 ∗ 2 s kde
s
mn , m+n
v u u (m − 1)s2 + (n − 1)s2 ∗ 2 . 1 s =t
m+n−2
c Rost 2006 °
Varianta a) shodn´ e rozptyly homoskedasticita Dle formulace alternativn´ı hypot´ ezy, pak pouˇ z´ıv´ ame kritick´ e obory uveden´ e v tabulce: H0
HA
K
µ1 ≤ µ2
µ1 > µ2
{t : t ≥ t1−α(m + n − 2)}
µ1 ≥ µ2
µ1 < µ2
{t : t ≤ −t1−α(m + n − 2)}
µ1 = µ2
µ1 6= µ2
{t : |t| ≥ t1− α (m + n − 2)} 2
c Rost 2006 °
Varianta b) neshodn´ e rozptyly heteroskedasticita V praxi se setk´ av´ ame i s pˇ r´ıpadem, kdy nem˚ uˇ zeme pˇ redpokl´ adat, ˇ ze jsou rozptyly shodn´ e. V´ ysledek pˇ redch´ azej´ıc´ıho testu na shodu rozptyl˚ u vedl zam´ıtnut´ı nulov´ e hypot´ ezy H0 : σ12 = σ22. V takov´ em pˇ r´ıpadˇ e jsme nuceni pouˇ z´ıt ponˇ ekud jin´ e testov´ e statistiky: x ¯ −x ¯2 t = r1 2 s2 1 + s2 m n
c Rost 2006 °
Varianta b) neshodn´ e rozptyly heteroskedasticita Tato statistika sleduje, za pˇ redpokladu platnosti nulov´ e hypot´ ezy, rozdˇ elen´ı t(f ), kde Ã
f =
Ã
s2 1
s2 1 1 m−1 m
s2 2
m + n !2
+
!2 Ã
s2 1 2 n−1 n
!2 .
ˇ´ıslo f je zde nemus´ı b´ C yt pˇ rirozen´ ym ˇ c´ıslem!
c Rost 2006 °
Varianta b) neshodn´ e rozptyly heteroskedasticita Dle alternativn´ı hypot´ ezy pak rozezn´ av´ ame n´ asleduj´ıc´ı kritick´ e obory viz tabulka:
H0
HA
K
µ1 ≤ µ2
µ1 > µ2
{t : t ≥ t1−α(f )}
µ1 ≥ µ2
µ1 < µ2
{t : t ≤ −t1−α(f )}
µ1 = µ2
µ1 6= µ2
{t : |t| ≥ t1− α (f )} 2
c Rost 2006 °
Pˇ r´ıklad pokraˇ cov´ an´ı Formulujeme hypot´ ezy: H0 : µ1 ≤ µ2
vs.
HA : µ1 > µ2 .
Nejprve mus´ıme ovˇ eˇ rit hypot´ ezu o shodˇ e rozptyl˚ u - homoskedasticitu. Formulujeme tedy pomocn´ e hypot´ ezy: H0 : σ12 = σ22
vs.
HA : σ12 6= σ22 .
Pouˇ zijeme testov´ e krit´ erium F : s2 2, 5 = 1, 0869565 . F = 2 = 2 2, 3 s1
c Rost 2006 °
Z´ıskanou hodnotu porovn´ ame s kritick´ ym oborem: Wα = {F : F ≤ F α (n2 − 1; n1 − 1) 2
∪ F ≥ F1− α (n2 − 1; n1 − 1)} = 2
K = {F : F ≤ F 0,05 (10−1; 16−1) ∪F ≥ F 2
K = {F : F ≤ F0,025(9; 15)
1− 0,05 2
(10−1; 16−1)} =
∪ F ≥ F0,975(9; 15)} =
K = {F : F ≤ 0, 2652972; F ≥ 3, 122712} . Vid´ıme, ˇ ze testovac´ı statistika F neleˇ z´ı v kritick´ em oboru. Lze tedy ˇ r´ıci, ˇ ze se n´ am nepodaˇ rilo, na z´ akladˇ e pozorovan´ ych c Rost 2006 °
dat s 95% spolehlivost´ı zam´ıtnout nulovou hypot´ ezu. Lze tedy pˇ redpokl´ adat, ˇ ze rozptyly jsou shodn´ e. D´ ale vyuˇ zijeme t-test za pˇ redpokladu: X1 ∼ N(µ1, σ 2)
X2 ∼ N(µ2, σ 2)
Pro test hypot´ ezy H0 : µ1 ≤ µ2
vs.
HA : µ1 > µ2 ,
pouˇ zijeme tedy testov´ e krit´ erium x ¯ −x ¯ t= 1 ∗ 2 s
s
kde s∗ =
v u u (n − 1)s2 + (n − 1)s2 2 t 1 1 2
n1 + n2 − 2
=
n1n2 , n1 + n2 v u u 15 · 2, 32 + 9 · 2, 52 t
16 + 10 − 2
= 2, 37
c Rost 2006 °
a
s
t=
11, 8 − 10, 16 · 10 = 1, 88 . 2, 37 16 + 10
Hodnotu testov´ eho krit´ eria porovn´ ame s kritick´ ym oborem K: K = {t : t ≥ t1−α(n2 + n1 − 2)} , a tedy K = {t : t ≥ t0,95(24)} = 1, 710882 . Vid´ıme, ˇ ze naˇ se testov´ e krit´ erium leˇ z´ı v kritick´ em oboru a lze tedy ˇ r´ıci, ˇ ze s 95 % spolehlivost´ı se n´ am na z´ akladˇ e pozorovan´ ych dat podaˇ rilo zam´ıtnout nulovou hypot´ ezu o shodˇ e dvou stˇ redn´ıch hodnot. M˚ uˇ zeme tedy usuzovat na to, ˇ ze v´ ycvik vede ke zkr´ acen´ı doby reakce. c Rost 2006 °
Testy hypot´ ez o shodˇ e stˇ redn´ıch hodnot pˇ ri z´ avisl´ ych v´ ybˇ erech Jde o takzvan´ y Student˚ uv p´ arov´ y t-test. V tomto pˇ r´ıpadˇ e lze pˇ rev´ est nulovou hypot´ ezu tvrd´ıc´ı, ˇ ze n´ ahodn´ e v´ ybˇ ery x1 a x2 poch´ azej´ı z rozdˇ elen´ı se stejn´ ymi stˇ redn´ımi hodnotami na hypot´ ezu H0, kter´ a tvrd´ı, ˇ ze n´ ahodn´ y v´ ybˇ er d = [d1, d2, · · · , dn], poch´ az´ı z rozdˇ elen´ı jehoˇ z stˇ redn´ı hodnota se rovn´ a nule. Pro jednotliv´ e hodnoty di, i = 1, 2, . . . , n plat´ı:
di = d1i − d2i .
c Rost 2006 °
Student˚ uv p´ arov´ y t-test Testujeme tak hypot´ ezu H0 : µd = µ1 − µ2 = 0 . Testov´ ym krit´ eriem je statistika: d¯ √ t= n . sd Kritick´ e obory pro jednotliv´ e alternativn´ı hypot´ ezy ud´ av´ a tabulka:
H0
HA
K
µd = µ1 − µ2 ≤ 0
µd = µ1 − µ2 > 0
{t : t ≥ t1−α(n − 1)}
µd = µ1 − µ2 ≥ 0
µd = µ1 − µ2 < 0
{t : t ≤ −t1−α(n − 1)}
µd = µ1 − µ2 = 0
µd = µ1 − µ2 6= 0
{t : |t| ≥ t1− α (n − 1)} 2
c Rost 2006 °