´ Uvod do testov´ an´ı hypot´ ez, jednov´ ybˇ erov´ y t-test Ing. Michael Rost, Ph.D.
Testovan´ a hypot´ eza Pokud n´ as zaj´ım´ a zda plat´ı, ˇ ci neplat´ı tvrzen´ı o urˇ cit´ em parametru, napˇ r. o parametru Θ, pak takov´ eto tvrzen´ı lze nazvat hypot´ ezou, resp. statistickou hypot´ ezou. Statistickou hypot´ ezu m˚ uˇ zeme zapsat form´ alnˇ eji (a zpravidla to tak dˇ el´ ame) napˇ r´ıklad ve tvaru H0 : θ = θ0 Takto formulovanou hypot´ ezu nazveme testovanou hypot´ ezou (nulovou hypot´ ezou). Pˇ r´ıklad: H0 : Pr˚ umˇ ern´ a hmotnost muˇ z˚ u je 88,0 Kg. H0 : µ = 88, 0
c Rost 2006 °
Alternativn´ı hypot´ eza Proti testovan´ e hypot´ eze formulujeme hypot´ ezu alternativn´ı. Znaˇ c´ı se symbolem HA nebo H1. Existuj´ı r˚ uzn´ e alternativn´ı hypot´ ezy. V podstatˇ e vˇ sak pˇ ri testov´ an´ı hypot´ ez rozezn´ av´ ame pouze tˇ ri typy alternativn´ıch hypot´ ez. Ty lze koncipovat n´ asleduj´ıc´ım zp˚ usobem:
Pravostrann´ a hypot´ eza
HA :
Θ > Θ0
Levostrann´ a hypot´ eza
HA :
Θ < Θ0
Oboustrann´ a hypot´ eza
HA :
Θ 6= Θ0.
c Rost 2006 °
Dvojice hypot´ ez Je velmi d˚ uleˇ zit´ e, jak budeme sv´ e hypot´ ezy specifikovat. Dle formulace probl´ emu se mus´ıme spr´ avnˇ e rozhodnout mezi tˇ remi variantami: H0 : Θ = Θ0 vs. HA : Θ 6= Θ0, nebo H0 : Θ = Θ0 vs. HA : Θ > Θ0 nebo H0 : Θ = Θ0 vs. HA : Θ < Θ0 .
c Rost 2006 °
Testov´ e krit´ erium Pro rozhodnut´ı o tom, kter´ a z v´ yˇ se formulovan´ ych hypot´ ez je pravdiv´ a, tj. zda bude platit H0 nebo naopak HA, rozhodujeme za pomoci tzv. testov´ e statistiky T . Testov´ a statistika je funkc´ı naˇ sich pozorov´ an´ı, tj.: T = g(x1, x2, x3, . . . , xn) a je tedy n´ ahodnou veliˇ cinou nab´ yvaj´ıc´ı urˇ cit´ eho oboru hodnot, resp. hodnot z urˇ cit´ e podmnoˇ ziny mnoˇ ziny re´ aln´ ych ˇ c´ısel. Na definovan´ em oboru hodnot testov´ e statistiky T lze vymezit jist´ ym zp˚ usobem dvˇ e podmnoˇ ziny.
c Rost 2006 °
Obor pˇ rijet´ı × kritick´ y obor Prvn´ı mnoˇ zinu nazveme oborem pˇ rijet´ı testovan´ e hypot´ ezy. Druhou mnoˇ zinu nazveme kritick´ ym oborem a oznaˇ c´ıme ji symbolem K. Ot´ azka spoˇ c´ıv´ a v tom jak stanovit hranici mezi tˇ emito mnoˇ zinami? S touto ot´ azkou souvis´ı problematika chyb kter´ ych se m˚ uˇ zeme pˇ ri testov´ an´ı hypot´ ez dopustit.
c Rost 2006 °
Chyby spojen´ e s testov´ an´ım hypot´ ez V souvislosti s testov´ an´ım hypot´ ez lze doj´ıt ke ˇ ctyˇ rem z´ avˇ er˚ um:
• Zam´ıtneme nulovou hypot´ ezu, pˇ riˇ cemˇ z ve skuteˇ cnosti plat´ı alternativn´ı hypot´ eza. Naˇ se rozhodnut´ı je tedy spr´ avn´ e.
• Nezam´ıtneme nulovou hypot´ ezu, pˇ riˇ cemˇ z ve skuteˇ cnosti nulov´ a hypot´ eza plat´ı. Naˇ se rozhodnut´ı je tedy spr´ avn´ e.
• Zam´ıtneme nulovou hypot´ ezu pˇ restoˇ ze je spr´ avn´ a. Dopouˇ st´ıme se tak chyby. Tento typ chyby naz´ yv´ ame chybou I. druhu. c Rost 2006 °
Chyby spojen´ e s testov´ an´ım hypot´ ez • Nezam´ıtneme nulovou hypot´ ezu pˇ restoˇ ze plat´ı alternativn´ı hypot´ eza. Dopouˇ st´ıme se tak chyby. Tento typ chyby naz´ yv´ ame chybou II. druhu.
c Rost 2006 °
Chyba I. druhu Pokud bychom tedy chtˇ eli urˇ cit pravdˇ epodobnost vzniku chyby I. druhu, platilo by n´ asleduj´ıc´ı: P (chyby I.) = P (pˇ rijmu HA|H0) = P (T ∈ K|plat´ı H0). Ve vˇ etˇ sinˇ e pˇ r´ıpad˚ u poˇ zadujeme, aby tato pravdˇ epodobnost nepˇ rekroˇ cila urˇ citou, pˇ redem danou hodnotu α. Hodnotu α naz´ yv´ ame hladinou v´ yznamnosti. Nejˇ castˇ ejˇ s´ı volbou hodnoty α pro testov´ an´ı hypot´ ez je α = 0, 05 ˇ ci α = 0, 01. V takov´ em pˇ r´ıpadˇ e pˇ ripouˇ st´ıme existenci vzniku chyby I. druhu s pravdˇ epodobnost´ı 0,05 resp. 0,01. Kritick´ y obor je konstruov´ an tak, ˇ ze plat´ı: P (chyby I.) = P (T ∈ K|plat´ı H0) = α . c Rost 2006 °
Rozhodnut´ı o platnosti testovan´ e hypot´ ezy Pokud jde o samotn´ e testov´ an´ı hypot´ ezy, pak to spoˇ c´ıv´ a v aplikaci jednoduch´ eho rozhodovac´ıho pravidla: Leˇ z´ı-li hodnota testov´ eho krit´ eria T v kritick´ em oboru tj. plat´ı-li: T ∈ K, zam´ıt´ ame nulovou hypot´ ezu H0 ve prospˇ ech hypot´ ezy alternativn´ı HA. Naopak, neleˇ z´ı-li hodnota testov´ eho krit´ eria v kritick´ em oboru, pak testovanou hypot´ ezu nezam´ıt´ ame a tvrd´ıme, ˇ ze se nepodaˇ rilo zam´ıtnout nulovou hypot´ ezu na pˇ redem zvolen´ e hladinˇ e v´ yznamnosti α na z´ akladˇ e pozorovan´ ych dat.
c Rost 2006 °
Chyba II. druhu Chyby druh´ eho druhu se dopust´ıme tehdy, nezam´ıtnemeli hypot´ ezu H0, pˇ restoˇ ze tato hypot´ eza ve skuteˇ cnosti neplat´ı. Pravdˇ epodobnost toho, ˇ ze se dopust´ıme chyby II. druhu lze vyj´ adˇ rit n´ asleduj´ıc´ım zp˚ usobem: P (chyby II.) = P (nezam´ıtnu H0|HA) = P (T 6∈ K|HA) = β. Vˇ etˇ sinou se vˇ sak zaj´ım´ ame sp´ıˇ se o doplnˇ ek k t´ eto pravdˇ epodobnosti. Tj. o pravdˇ epodobnost toho, ˇ ze se t´ eto chyby nedopust´ıme. Symbolicky lze hledanou pravdˇ epodobnost definovat n´ asledovnˇ e: P (pˇ rijmu HA|HA) = P (T ∈ K|HA) = 1 − β.
(1)
Tento doplnˇ ek k pravdˇ epodobnosti chyby II. typu, tj. hodnotu 1 − β, zpravidla naz´ yv´ ame silou testu. c Rost 2006 °
Druhy test˚ u Z hlediska toho, jak´ e pˇ redpoklady ˇ cin´ıme o rozdˇ elen´ı sledovan´ eho statistick´ eho znaku, lze rozliˇ sit dvˇ e tˇ r´ıdy test˚ u: Parametrick´ e testy: Jsou testy zaloˇ zen´ e na znalosti charakteru rozdˇ elen´ı sledovan´ eho statistick´ eho znaku. Parametrick´ ymi testy se pak testujeme pˇ redpoklady o nezn´ am´ ych hodnot´ ach parametr˚ u (m˚ uˇ ze j´ıt napˇ r´ıklad o stˇ redn´ı hodnotu ˇ ci rozptyl). V pˇ rev´ aˇ zn´ e vˇ etˇ sinˇ e jde o poˇ cetnˇ e n´ aroˇ cnˇ ejˇ s´ı, ale siln´ e testy. Neparametrick´ e testy: Jsou takov´ e testy, kter´ e nevyˇ zaduj´ı znalost pˇ redpoklad˚ u o charakteru rozdˇ elen´ı n´ ahodn´ ych veliˇ cin. Neparametrick´ e, se naz´ yvaj´ı proto, ˇ ze se net´ ykaj´ı parametr˚ u rozdˇ elen´ı. Tyto testy maj´ı obecnˇ e menˇ s´ı s´ılu ve srovn´ an´ı s parametrick´ ymi testy. c Rost 2006 °
Testy hypot´ ez o parametru µ pˇ ri nezn´ am´ em σ 2 Pˇ redpokl´ adejme, ˇ ze m´ ame k dispozici v´ ybˇ er x = [x1, x2, · · · , xn] , poch´ azej´ıc´ı z norm´ aln´ıho rozdˇ elen´ı, jehoˇ z parametry µ a σ 2 nezn´ ame. Tato situace b´ yv´ a v praxi nejˇ castˇ ejˇ s´ı. D´ ale pˇ redpokl´ adejme, ˇ ze se budeme snaˇ zit uˇ cinit z´ avˇ er o velikosti stˇ redn´ı hodnoty µ v z´ akladn´ım v´ ybˇ eru. Testovan´ a hypot´ eza m˚ uˇ ze m´ıt nˇ ekter´ y z n´ asleduj´ıc´ıch tvar˚ u: H0 : µ = µ0 H0 : µ ≥ µ0 H0 : µ ≤ µ0 c Rost 2006 °
Testy hypot´ ez o parametru µ pˇ ri nezn´ am´ em σ 2
• Kritick´ y obor je v pˇ r´ıpadˇ e testu hypot´ ez o parametru µ pˇ ri nezn´ am´ em σ 2 zaloˇ zen na testov´ em krit´ eriu x ¯ − µ0 √ t= n . s • Uvˇ edomte si, ˇ ze testov´ e krit´ erium t je n´ ahodnou veliˇ cinou !!! • N´ ahodn´ a veliˇ cina t sleduje za platnosti nulov´ e hypot´ ezy Studentovo rozdˇ elen´ı s n − 1 stupni volnosti. • Symbolicky lze tedy ps´ at, ˇ ze: t ∼ t(n − 1) . c Rost 2006 °
Hypot´ ezy, t, K a pˇ r´ıklad H0
HA
µ = µ0
µ 6= µ0
µ ≤ µ0
µ > µ0
µ ≥ µ0
µ < µ0
t
K K = {t; |t| > t1− α (n − 1)} 2
√ 0 n t = x¯−µ s
K = {t; t ≥ t1−α(n − 1)} K = {t; t ≤ tα(n − 1)}
Pˇ r´ıklad: V popul´ arn´ım ˇ casopise bylo uvedeno, ˇ ze ˇ cesk´ a populace ˇ zen vlivem zmˇ en ˇ zivotn´ıho stylu a ˇ spatn´ ych stravovac´ıch n´ avyk˚ u tloustne. Zat´ımco pˇ red pˇ eti lety byla pr˚ umˇ ern´ a hmotnost ˇ cesk´ ych ˇ zen 72,5 Kg dnes jsou ˇ zeny podstatnˇ e ob´ eznˇ ejˇ s´ı. M´ a autor tohoto ˇ cl´ anku pravdu nebo ˇ zen´ am kˇ rivd´ı?
c Rost 2006 °
Pozorovan´ a data Pˇ ristupme k tomuto probl´ emu statisticky. Pˇ redpokl´ adejme, ˇ ze jsme poˇ r´ıdili n´ ahodn´ y v´ ybˇ er z populace ˇ cesk´ ych ˇ zen o rozsahu n = 24: 67,16; 86,97; 84,00; 85,29; 74,55; 68,93; 74,22; 72,34; 87,09; 77,51; 63,25 71,02; 99,82; 54,56; 73,12; 74,03; 71,00; 69,46; 79,86; 69,31; 68,25; 72,87 80,24; 83,20
c Rost 2006 °
ˇ sen´ı v ruce Reˇ Napiˇ sme tedy testovanou a alternativn´ı hypot´ ezu: H0 : µ ≤ 72, 5
HA : µ > 72, 5
Pr˚ umˇ ern´ a hodnota hmotnosti ˇ zen ve v´ ybˇ erov´ em souboru je n 1 X xi = 75, 33542 . x ¯= n i=1
Smˇ erodatn´ a odchylka pak v u u s=t
n p 1 X 2 (xi − x ¯) = 88, 07907 = 9, 385045 . n − 1 i=1
c Rost 2006 °
ˇ sen´ı v ruce Reˇ Vyj´ adˇ reme hodnotu testov´ e statistiky t.
x ¯ − µ0 √ 75, 33542 − 72, 5 q t= · n= · (24) = 1, 480083 s 9, 385045 D´ ale pˇ redpokl´ adejme, ˇ ze budeme cht´ıt interpretovat naˇ se v´ ysledky s 95% spolehlivost´ı. Hladinu α specifikujeme tedy hodnotu 0, 05. Zb´ yv´ a urˇ cit kritick´ y obor K, ten je definov´ an jako mnoˇ zina hodnot t pro kter´ e plat´ı: t ≥ t1−α(n − 1) = t0,95(23) = 1, 713872 . Je tedy zˇ rejm´ e, ˇ ze testov´ a statistika t neleˇ z´ı v kritick´ em oboru K. c Rost 2006 °
ˇ sen´ı v ruce Reˇ Z tohoto d˚ uvodu nelze zam´ıtnout testovanou hypot´ ezu H0, kter´ a tvrd´ı, ˇ ze µ ≤ 72, 5. Z´ avˇ er: Z´ avˇ erem lze ˇ r´ıci, ˇ ze se n´ am s 95% spolehlivost´ı na z´ akladˇ e pozorovan´ ych dat nepodaˇ rilo prok´ azat, ˇ ze hmotnost ˇ zen vzrostla v porovn´ an´ı s pr˚ umˇ ernou hmotnost´ı ˇ zen pˇ red pˇ eti lety. Autor ˇ cl´ anku ˇ zen´ am zˇ rejmˇ e kˇ rivd´ı.
c Rost 2006 °