t-test, Studentův párový test Ing. Michael Rost, Ph.D

Testov´ an´ı hypot´ ez: dvouv´ ybˇ erov´ y t-test, Student˚ uv p´ arov´ y test Ing. Michael Rost, Ph.D.

´ Uvod do probl´ emu . . . Jiˇ z zn´ ame jednov´ ybˇ erov´ y t-test, pˇ ri kter´ em jsme mˇ eli k dispozici pouze jeden v´ ybˇ er. M˚ uˇ zeme se setkat tak´ e se situac´ı, ve kter´ e potˇ rebujeme porovnat dva ˇ ci v´ıce soubor˚ u navz´ ajem. V pˇ r´ıpadˇ e dvou v´ ybˇ er˚ u, m˚ uˇ zeme pouˇ z´ıt, pˇ ri splnˇ en´ı urˇ cit´ ych pˇ redpoklad˚ u, dvouv´ ybˇ erov´ e t-testy. Postup je stejn´ y:

c Rost 2006 °

Magdalena Rettigov´ a doporuˇ cuje:

1. Zformulovat hypot´ ezy: H0 vs. HA. 2. Stanovit hodnotu α, nejˇ castˇ eji vol´ıme α = 0, 05 nebo α = 0, 01. 3. Zvolit adekv´ atn´ı testov´ e krit´ erium a stanovit hodnotu testov´ eho krit´ eria 4. Zjistit zda T ∈ K nebo zda p-value ≤ α 5. Z´ avˇ er c Rost 2006 °

Pˇ r´ıklad - motivace U ˇ sestn´ acti pracovn´ık˚ u bez v´ ycviku (n1 = 16) a u deseti (n2 = 10) pracovn´ık˚ u, kteˇ r´ı absolvovali v´ ycvik, byla sledov´ ana doba reakce na urˇ cit´ y podmˇ et v sekund´ ach. P˚ uvodn´ı datov´ e soubory jiˇ z nejsou k dispozici, nicm´ enˇ e jeden z psycholog˚ u si poznamenal tyto charakteristiky obou soubor˚ u: x ¯1 = 11, 8; x ¯2 = 10, 00;

s2 1 = 2, 3 . s2 2 = 2, 5 .

S 95 % spolehlivost´ı ovˇ eˇ rte, zda v´ ycvik vede ke zrychlen´ı sledovan´ e reakce. Dobu reakce pracovn´ıka, budeme pokl´ adat za n´ ahodnou veliˇ cinu s norm´ aln´ım rozdˇ elen´ım. c Rost 2006 °

Testy hypot´ ez o shodˇ e stˇ redn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı Testujeme-li hypot´ ezu o shodˇ e stˇ redn´ıch hodnot dvou nez´ avisl´ ych norm´ aln´ıch rozdˇ elen´ı, jejichˇ z rozptyly nezn´ ame, je zp˚ usob testu z´ avisl´ y na tom, zda m˚ uˇ zeme pˇ redpokl´ adat n´ asleduj´ıc´ı:

• rozptyly jsou shodn´ e.

• rozptyly obou v´ ybˇ er˚ u lze povaˇ zovat za r˚ uzn´ e.

Z tohoto d˚ uvodu je nutn´ e nejprve prov´ est test shody rozptyl˚ u.

c Rost 2006 °

Test shody rozptyl˚ u

F -test

Prov´ ad´ıme test hypot´ ezy H0 : σ12 = σ22 . proti alternativn´ı hypot´ eze (ta m˚ uˇ ze b´ yt levostrann´ a, pravostrann´ a, nebo oboustrann´ a). Testovac´ım krit´ eriem je statistika F : s2 F = 1 , 2 s2 kter´ a m´ a za platnosti nulov´ e hypot´ ezy rozdˇ elen´ı F (m − 1, n − 1). Symbolicky tedy F ∼ F (m − 1, n − 1) .

c Rost 2006 °

Test shody rozptyl˚ u

F -test

Jednotliv´ e kritick´ e obory jsou pak vymezeny n´ asledovnˇ e:

H0

HA

K

σ12 ≤ σ22

σ12 > σ22

{F : F ≥ F1−α(m − 1, n − 1)}

σ12 ≥ σ22

σ12 < σ22

{F : F ≤ Fα(m − 1, n − 1)}

σ12 = σ22

σ12 6= σ22

{F : F ≤ F α (m − 1, n − 1) ∪ 2 F ≥ F1− α (m − 1, n − 1)} 2

c Rost 2006 °

Varianta a) shodn´ e rozptyly homoskedasticita Pokud tedy pˇ redpokl´ ad´ ame, na z´ akladˇ e pˇ redchoz´ıho testu, ˇ ze jsou oba rozptyly shodn´ e, lze k testov´ an´ı nulov´ e hypot´ ezy o shodˇ e stˇ redn´ıch hodnot H0 : µ1 = µ2 vyuˇ z´ıt testovac´ı statistiky: x ¯ −x ¯ t= 1 ∗ 2 s kde

s

mn , m+n

v u u (m − 1)s2 + (n − 1)s2 ∗ 2 . 1 s =t

m+n−2

c Rost 2006 °

Varianta a) shodn´ e rozptyly homoskedasticita Dle formulace alternativn´ı hypot´ ezy, pak pouˇ z´ıv´ ame kritick´ e obory uveden´ e v tabulce: H0

HA

K

µ1 ≤ µ2

µ1 > µ2

{t : t ≥ t1−α(m + n − 2)}

µ1 ≥ µ2

µ1 < µ2

{t : t ≤ −t1−α(m + n − 2)}

µ1 = µ2

µ1 6= µ2

{t : |t| ≥ t1− α (m + n − 2)} 2

c Rost 2006 °

Varianta b) neshodn´ e rozptyly heteroskedasticita V praxi se setk´ av´ ame i s pˇ r´ıpadem, kdy nem˚ uˇ zeme pˇ redpokl´ adat, ˇ ze jsou rozptyly shodn´ e. V´ ysledek pˇ redch´ azej´ıc´ıho testu na shodu rozptyl˚ u vedl zam´ıtnut´ı nulov´ e hypot´ ezy H0 : σ12 = σ22. V takov´ em pˇ r´ıpadˇ e jsme nuceni pouˇ z´ıt ponˇ ekud jin´ e testov´ e statistiky: x ¯ −x ¯2 t = r1 2 s2 1 + s2 m n

c Rost 2006 °

Varianta b) neshodn´ e rozptyly heteroskedasticita Tato statistika sleduje, za pˇ redpokladu platnosti nulov´ e hypot´ ezy, rozdˇ elen´ı t(f ), kde Ã

f =

Ã

s2 1

s2 1 1 m−1 m

s2 2

m + n !2

+

!2 Ã

s2 1 2 n−1 n

!2 .

ˇ´ıslo f je zde nemus´ı b´ C yt pˇ rirozen´ ym ˇ c´ıslem!

c Rost 2006 °

Varianta b) neshodn´ e rozptyly heteroskedasticita Dle alternativn´ı hypot´ ezy pak rozezn´ av´ ame n´ asleduj´ıc´ı kritick´ e obory viz tabulka:

H0

HA

K

µ1 ≤ µ2

µ1 > µ2

{t : t ≥ t1−α(f )}

µ1 ≥ µ2

µ1 < µ2

{t : t ≤ −t1−α(f )}

µ1 = µ2

µ1 6= µ2

{t : |t| ≥ t1− α (f )} 2

c Rost 2006 °

Pˇ r´ıklad pokraˇ cov´ an´ı Formulujeme hypot´ ezy: H0 : µ1 ≤ µ2

vs.

HA : µ1 > µ2 .

Nejprve mus´ıme ovˇ eˇ rit hypot´ ezu o shodˇ e rozptyl˚ u - homoskedasticitu. Formulujeme tedy pomocn´ e hypot´ ezy: H0 : σ12 = σ22

vs.

HA : σ12 6= σ22 .

Pouˇ zijeme testov´ e krit´ erium F : s2 2, 5 = 1, 0869565 . F = 2 = 2 2, 3 s1

c Rost 2006 °

Z´ıskanou hodnotu porovn´ ame s kritick´ ym oborem: Wα = {F : F ≤ F α (n2 − 1; n1 − 1) 2

∪ F ≥ F1− α (n2 − 1; n1 − 1)} = 2

K = {F : F ≤ F 0,05 (10−1; 16−1) ∪F ≥ F 2

K = {F : F ≤ F0,025(9; 15)

1− 0,05 2

(10−1; 16−1)} =

∪ F ≥ F0,975(9; 15)} =

K = {F : F ≤ 0, 2652972; F ≥ 3, 122712} . Vid´ıme, ˇ ze testovac´ı statistika F neleˇ z´ı v kritick´ em oboru. Lze tedy ˇ r´ıci, ˇ ze se n´ am nepodaˇ rilo, na z´ akladˇ e pozorovan´ ych c Rost 2006 °

dat s 95% spolehlivost´ı zam´ıtnout nulovou hypot´ ezu. Lze tedy pˇ redpokl´ adat, ˇ ze rozptyly jsou shodn´ e. D´ ale vyuˇ zijeme t-test za pˇ redpokladu: X1 ∼ N(µ1, σ 2)

X2 ∼ N(µ2, σ 2)

Pro test hypot´ ezy H0 : µ1 ≤ µ2

vs.

HA : µ1 > µ2 ,

pouˇ zijeme tedy testov´ e krit´ erium x ¯ −x ¯ t= 1 ∗ 2 s

s

kde s∗ =

v u u (n − 1)s2 + (n − 1)s2 2 t 1 1 2

n1 + n2 − 2

=

n1n2 , n1 + n2 v u u 15 · 2, 32 + 9 · 2, 52 t

16 + 10 − 2

= 2, 37

c Rost 2006 °

a

s

t=

11, 8 − 10, 16 · 10 = 1, 88 . 2, 37 16 + 10

Hodnotu testov´ eho krit´ eria porovn´ ame s kritick´ ym oborem K: K = {t : t ≥ t1−α(n2 + n1 − 2)} , a tedy K = {t : t ≥ t0,95(24)} = 1, 710882 . Vid´ıme, ˇ ze naˇ se testov´ e krit´ erium leˇ z´ı v kritick´ em oboru a lze tedy ˇ r´ıci, ˇ ze s 95 % spolehlivost´ı se n´ am na z´ akladˇ e pozorovan´ ych dat podaˇ rilo zam´ıtnout nulovou hypot´ ezu o shodˇ e dvou stˇ redn´ıch hodnot. M˚ uˇ zeme tedy usuzovat na to, ˇ ze v´ ycvik vede ke zkr´ acen´ı doby reakce. c Rost 2006 °

Testy hypot´ ez o shodˇ e stˇ redn´ıch hodnot pˇ ri z´ avisl´ ych v´ ybˇ erech Jde o takzvan´ y Student˚ uv p´ arov´ y t-test. V tomto pˇ r´ıpadˇ e lze pˇ rev´ est nulovou hypot´ ezu tvrd´ıc´ı, ˇ ze n´ ahodn´ e v´ ybˇ ery x1 a x2 poch´ azej´ı z rozdˇ elen´ı se stejn´ ymi stˇ redn´ımi hodnotami na hypot´ ezu H0, kter´ a tvrd´ı, ˇ ze n´ ahodn´ y v´ ybˇ er d = [d1, d2, · · · , dn], poch´ az´ı z rozdˇ elen´ı jehoˇ z stˇ redn´ı hodnota se rovn´ a nule. Pro jednotliv´ e hodnoty di, i = 1, 2, . . . , n plat´ı:

di = d1i − d2i .

c Rost 2006 °

Student˚ uv p´ arov´ y t-test Testujeme tak hypot´ ezu H0 : µd = µ1 − µ2 = 0 . Testov´ ym krit´ eriem je statistika: d¯ √ t= n . sd Kritick´ e obory pro jednotliv´ e alternativn´ı hypot´ ezy ud´ av´ a tabulka:

H0

HA

K

µd = µ1 − µ2 ≤ 0

µd = µ1 − µ2 > 0

{t : t ≥ t1−α(n − 1)}

µd = µ1 − µ2 ≥ 0

µd = µ1 − µ2 < 0

{t : t ≤ −t1−α(n − 1)}

µd = µ1 − µ2 = 0

µd = µ1 − µ2 6= 0

{t : |t| ≥ t1− α (n − 1)} 2

c Rost 2006 °

t-test, Studentův párový test Ing. Michael Rost, Ph.D

Recommend Documents