Testov´ an´ı hypot´ ez na z´ akladˇ e jednoho 1 a dvou v´ ybˇ er˚ u
1
ˇ ˇc´ıslo 1145/2004. Tyto materi´ aly byly vytvoˇreny za pomoci grantu FRVS
Testov´ an´ı hypot´ ez Pokud n´as zaj´ım´a zda plat´ı, ˇci neplat´ı tvrzen´ı o urˇcit´em parametru, napˇr. o parametru Θ, pak takov´eto tvrzen´ı lze nazvat hypot´ezou, resp. statistickou hypot´ezou. Napˇr´ıklad, chceme testovat hypot´ezu, ˇze stˇredn´ı hodnota je nˇejak´e konkr´etn´ı ˇc´ıslo, nebo patˇr´ı do urˇcit´eho intervalu. Pak θ je pr´avˇe stˇredn´ı hodnota a θ0 pr´avˇe naˇse konkr´etn´ı hodnota. Statistickou hypot´ezu lze pak zapsat napˇr´ıklad ve tvaru H0 : θ = θ 0 (1) Takto formulovanou hypot´ezu nazveme testovanou hypot´ezou. Nˇekdy se lze setkat s pojmenov´an´ım nulov´a hypot´eza. Proti testovan´e hypot´eze formulujeme hypot´ezu alternativn´ı. Znaˇc´ı se symbolem HA nebo H1 . Existuj´ı r˚ uzn´e alternativn´ı hypot´ezy. V podstatˇe vˇsak pˇri testov´an´ı hypot´ez rozezn´av´ame pouze tˇri typy alternativn´ıch hypot´ez. Ty lze koncipovat n´asleduj´ıc´ım zp˚ usobem: Pravostrann´a hypot´eza Levostrann´a hypot´eza Oboustrann´a hypot´eza
HA : HA : HA :
Θ > Θ0 Θ < Θ0 Θ 6= Θ0 .
Na tomto m´ıstˇe je nutn´e upozornit ˇcten´aˇre na to, ˇze je velmi d˚ uleˇzit´e, jak budeme tyto hypot´ezy specifikovat. Je nutn´e se spr´avnˇe rozhodnout mezi tˇemito variantami:
H0 : Θ = Θ0 vs. HA : Θ 6= Θ0 , nebo H0 : Θ ≤ Θ0 vs. HA : Θ > Θ0 nebo H0 : Θ ≥ Θ0 vs. HA : Θ < Θ0 .
Testov´ e krit´ erium Pro rozhodnut´ı o tom, kter´a z v´ yˇse formulovan´ ych hypot´ez je pravdiv´a, tj. zda bude platit H0 nebo naopak HA , rozhodujeme za pomoci tzv. testov´e statistiky T . To je jist´a n´ami zvolen´a funkce, kter´a z´avis´ı na naˇsem v´ ybˇeru. Pˇr´ıkladem m˚ uˇze b´ yt testov´a statistika pro odhad stˇredn´ı hodnoty - aritmetick´ y pr˚ umˇer. Tedy funkce z´avisej´ıc´ı na naˇsem pozorov´an´ı. Testovac´ı statistiku pak zpravidla naz´ yv´ame testov´ ym krit´eriem. Statistika T je n´ahodnou veliˇcinou nab´ yvaj´ıc´ı urˇcit´eho oboru hodnot, resp. hodnot z urˇcit´e podmnoˇziny mnoˇziny re´aln´ ych ˇc´ısel.
1
Na definovan´em oboru hodnot testov´e statistiky T lze vymezit jist´ ym zp˚ usobem dvˇe podmnoˇziny. Prvn´ı z nich, oznaˇc´ıme ji symbolem K, nazveme kritick´ ym oborem. Druhou podmnoˇzinu, oznaˇc´ıme ji H, nazveme oborem pˇrijet´ı. Heuristick´ ym vysvˇetlen´ım tˇechto dvou mnoˇzin m˚ uˇze b´ yt n´asleduj´ıc´ı pˇredstava. Chceme rozhodnout, zda se naˇse rozdˇelen´ı chov´a podle naˇs´ı hypot´ezy H0 , nebo uˇz sp´ıˇse dle alternativy HA . Napˇr´ıklad m´ame ˇsestistˇenou kostku a hodl´ame rozhodnout, zda je poctiv´a, tj. vˇsechna ˇc´ısla padaj´ı se stejnou pravdˇepodobnost´ı, nebo zda je faleˇsn´a a nˇekter´a ˇc´ısla padaj´ı ˇcastˇeji. Test provedeme tak, ˇze si ˇrekneme, ˇze hod´ıme stokr´at kostkou a spoˇcteme si, kolikr´at kter´e ˇc´ıslo padlo. V´ıme, ˇze se m˚ uˇze st´at, ˇze i kdyˇz je kostka poctiv´a, mohou n´am padnout napˇr´ıklad jen sam´e pˇetky a ˇsestky. Ale pravdˇepodobnost, ˇze se tak stane, je u poctiv´e kostky miziv´a. V takov´em pˇr´ıpadˇe je daleko pravdˇepodobnˇejˇs´ı, ˇze je kostka faleˇsn´a. Naˇs´ım c´ılem je pr´avˇe dopˇredu urˇcit mnoˇzinu vˇsech v´ ysledk˚ u, kter´e uˇz jsou ”daleko” od naˇs´ı testovan´e hypot´ezy. Pravdˇepodobnost t´eto mnoˇziny m´a b´ yt pr´avˇe naˇse α. Pravdˇepodobnost (za platnosti H0 ), ˇze nastanou tyto nebo vˇsechny ”horˇs´ı” v´ ysledky je velmi mal´a. Jak mal´a, to je pr´avˇe naˇse hladina v´ yznamnosti testu. A pak uˇz jen h´az´ıme a pokud nastal v´ ysledek, kter´ y je v t´eto naˇs´ı mnoˇzinˇe, pak zam´ıtneme hypot´ezu. Pokud jde o samotn´e testov´an´ı hypot´ezy, pak to spoˇc´ıv´a v aplikaci jednoduch´eho rozhodovac´ıho pravidla: Leˇz´ı-li hodnota testov´eho krit´eria T v kritick´em oboru tj., T ∈ K, zam´ıt´ ame nulovou hypot´ezu ve prospˇech hypot´ezy alternativn´ı. Naopak, neleˇz´ı-li hodnota testov´eho krit´eria v kritick´em oboru, pak testovanou hypot´ezu nezam´ıt´ame a tvrd´ıme, ˇze se nepodaˇrilo zam´ıtnout nulovou hypot´ezu na pˇredem zvolen´e hladinˇe v´ yznamnosti α.
Chyby spojen´ e s testov´ an´ım hypot´ ez Pˇri testov´an´ı hypot´ez se m˚ uˇzeme dopustit v podstatˇe chyb dvoj´ıho typu. Ve statistick´e teorii je naz´ yv´ame chybami prvn´ıho a druh´eho druhu. Pojednejme o nich bl´ıˇze. Chyby prvn´ıho druhu se dopust´ıme tehdy, zam´ıtneme-li testovanou hypot´ezu, pˇrestoˇze plat´ı. Pokud bychom tedy chtˇeli urˇcit pravdˇepodobnost vzniku chyby I. druhu, platilo by n´asleduj´ıc´ı: P (chyby I.) = P (pˇrijmu HA |H0 ) = P (T ∈ K|plat´ı H0 ).
2
(2)
Pravdˇepodobnost vzniku chyby I. typu chceme zpravidla jist´ ym zp˚ usobem omezit. Ve vˇetˇsinˇe pˇr´ıpad˚ u poˇzadujeme, aby tato pravdˇepodobnost nepˇrekroˇcila urˇcitou, pˇredem danou hodnotu α. Hodnotu α naz´ yv´ame hladinou v´ yznamnosti. Nejˇcastˇejˇs´ı volbou hodnoty α pro testov´an´ı hypot´ez je α = 0, 05 ˇci α = 0, 01. V takov´em pˇr´ıpadˇe pˇripouˇst´ıme existenci vzniku chyby I. druhu s pravdˇepodobnost´ı 0,05 resp. 0,01. Kritick´ y obor je pak konstruov´an tak, ˇze plat´ı: P (chyby I.) = P (T ∈ K|plat´ı H0 ) = α . Chyby druh´eho druhu se dopust´ıme tehdy, nezam´ıtneme-li hypot´ezu H0 , pˇrestoˇze tato hypot´eza ve skuteˇcnosti neplat´ı a my bychom se mˇeli pˇriklonit k alternativn´ı hypot´eze. Pravdˇepodobnost toho, ˇze se dopust´ıme chyby II. druhu lze vyj´adˇrit n´asleduj´ıc´ım zp˚ usobem: P (chyby II.) = P (nezam´ıtnu H0 |HA ) = P (T 6∈ K|HA ) = β.
(3)
Vˇetˇsinou se vˇsak zaj´ım´ame sp´ıˇse o doplnˇek k t´eto pravdˇepodobnosti. Jin´ ymi slovy, zaj´ım´ame se o pravdˇepodobnost toho, ˇze skuteˇcnˇe zam´ıtneme nulovou hypot´ezu, pokud skuteˇcnˇe neplat´ı. Urˇcujeme tedy pravdˇepodobnost toho, ˇze se t´eto chyby nedopust´ıme. Symbolicky lze hledanou pravdˇepodobnost definovat n´asledovnˇe: P (pˇrijmu HA |HA ) = P (T ∈ K|HA ) = 1 − β. (4) Tento doplnˇek k pravdˇepodobnosti chyby II. typu, tj. hodnotu 1 − β, zpravidla naz´ yv´ame silou testu. Ve statistick´e teorii se lze setkat s celou ˇradou r˚ uzn´ ych test˚ u, kter´e slouˇz´ı k vysloven´ı z´avˇer˚ u o hodnot´ach odhadovan´ ych parametr˚ u ˇci o tvarech studovan´ ych rozdˇelen´ı. Tato problematika vˇsak pˇresahuje r´amec naˇseho kurzu, proto se omez´ıme pouze na nˇekter´e z nich. Dalˇs´ı testy lze nal´ezt v odborn´e statistick´e literatuˇre. Jejich prostudov´an´ı pˇrenech´av´ame laskav´emu ˇcten´aˇri.
Druhy test˚ u Z hlediska toho, jak´e pˇredpoklady ˇcin´ıme o rozdˇelen´ı sledovan´eho statistick´eho znaku, lze rozliˇsit dvˇe tˇr´ıdy test˚ u: Parametrick´ e testy: Jsou testy zaloˇzen´e na znalosti charakteru rozdˇelen´ı sledovan´eho statistick´eho znaku, tj. pˇredpokl´ad´ame napˇr. ˇze v´ıme, ˇze naˇse pozorov´an´ı poch´az´ı napˇr´ıklad z norm´aln´ıho, binomick´eho, apod. rozdˇelen´ı, ale nezn´ame hodnoty jednoho ˇci v´ıce parametr˚ u. Parametrick´ ymi testy se pak testujeme pˇredpoklady o tˇechto nezn´am´ ych parametrech (m˚ uˇze j´ıt napˇr´ıklad o stˇredn´ı hodnotu ˇci rozptyl). V pˇrev´aˇzn´e vˇetˇsinˇe jde o poˇcetnˇe n´aroˇcnˇejˇs´ı, ale siln´e testy. Neparametrick´ e testy: Jsou takov´e testy, kter´e nevyˇzaduj´ı znalost pˇredpoklad˚ u o charakteru rozdˇelen´ı n´ahodn´ ych veliˇcin. Neparametrick´e, se naz´ yvaj´ı proto, ˇze se net´ ykaj´ı parametr˚ u rozdˇelen´ı. Tyto testy maj´ı obecnˇe menˇs´ı s´ılu ve srovn´an´ı s parametrick´ ymi testy. Jejich v´ yhodu je vˇsak jejich univerz´alnost, nebot’ lze tyto testy pouˇz´ıt jak pro kvantitativn´ı, tak i kvalitativn´ı znaky. Po v´ ypoˇcetn´ı str´ance jsou jednoduch´e. 3
Testy hypot´ ez o parametru µ pˇ ri nezn´ am´ em σ 2 0
Pˇredpokl´adejme, ˇze m´ame k dispozici v´ ybˇer x = [x1 , x2 , · · · , xn ] , poch´azej´ıc´ı z norm´aln´ıho rozdˇelen´ı, jehoˇz parametry µ a σ 2 nezn´ame. Tato situace b´ yv´a v biologick´e a zejm´ena v ekonomick´e praxi nejˇcastˇejˇs´ı. D´ale pˇredpokl´adejme, ˇze se budeme snaˇzit uˇcinit z´avˇer o velikosti stˇredn´ı hodnoty µ v z´akladn´ım v´ ybˇeru. Kritick´ y obor je v pˇr´ıpadˇe testu hypot´ez o parametru µ pˇri nezn´am´em σ 2 zaloˇzen na testov´em krit´eriu x ¯ − µ0 √ n. (5) t= s Uvˇedomte si, ˇze t je n´ahodnou veliˇcinou. Tato n´ahodn´a veliˇcina sleduje za platnosti nulov´e hypot´ezy Studentovo rozdˇelen´ı s n − 1 stupni volnosti. Symbolicky lze tedy ps´at, ˇze t ∼ t(n − 1). Testujeme-li hypot´ezu H0 : µ ≤ µ0 proti HA : µ > µ0 , je kritick´ ym oborem K n´asleduj´ıc´ı mnoˇzina: {t; t ≥ t1−α (n − 1)} .
(6)
Protoˇze, pokud by platila alternativa, pak by sloˇzky vektoru pozorov´an´ı xi nab´ yvaly sp´ıˇse vyˇsˇs´ıch hodnot, a tedy i x ¯ urˇcen´ y na z´akladˇe tˇechto hodnot by byl vyˇsˇs´ı. My tedy hled´ame tak vysokou hodnotu, aby, pokud plat´ı nulov´a hypot´eza, x ¯ nab´ yval t´eto nebo vyˇsˇs´ı hodnoty jen s pravdˇepodobnost´ı menˇs´ı neˇz α. Pokud se tedy stane, ˇze x ¯ dos´ahne t´eto nebo vyˇsˇs´ı hodnoty, pak hypot´ezu zam´ıtneme na hladinˇe α. Rozmyslete si, ˇze pr´avˇe toto n´am ˇr´ık´a nerovnost t ≥ t1−α (n − 1) !
(7)
Naopak testujeme-li hypot´ezu H0 : µ ≥ µ0 proti HA : µ < µ0 , je kritick´ ym oborem K mnoˇzina {t; t ≤ −t1−α (n − 1)} .
(8)
S ohledem na symetriˇcnost rozdˇelen´ı je tento kritick´ y obor totoˇzn´ y s mnoˇzinou {t; t ≤ tα (n − 1)}. V pˇr´ıpadˇe, ˇze n´as zaj´ım´a pouze oboustrann´a alternativa, tj. pˇredpokl´ad´ame n´asleduj´ıc´ı hypot´ezy: H0 : µ = µ0 proti HA : µ 6= µ0 , pak je kritick´ ym oborem mnoˇzina {t; |t| ≥ t1− α2 (n − 1)} .
(9)
Cel´ y postup demonstrujme na n´asleduj´ıc´ım pˇr´ıkladˇe. V popul´arn´ım ˇcasopise 4
bylo uvedeno, ˇze ˇcesk´a populace ˇzen vlivem zmˇen ˇzivotn´ıho stylu a ˇspatn´ ych stravovac´ıch n´avyk˚ u tloustne. Zat´ımco pˇred pˇeti lety byla pr˚ umˇern´a hmotnost ˇcesk´ ych ˇzen 72,5 Kg dnes jsou ˇzeny podstatnˇe ob´eznˇejˇs´ı. M´a autor tohoto ˇcl´anku pravdu nebo ˇzen´ am kˇrivd´ı? Pˇristupme k tomuto probl´emu statisticky. Pˇredpokl´adejme, ˇze jsme poˇr´ıdili n´ahodn´ y v´ ybˇer z populace ˇcesk´ ych ˇzen o rozsahu n = 24. [1] 67.16 86.97 84.00 85.29 74.55 68.93 74.22 72.34 87.09 77.51 [11] 63.25 71.02 99.82 54.56 73.12 74.03 71.00 69.46 79.86 69.31 [21] 68.25 72.87 80.24 83.20 Pro posouzen´ı normality dat vyuˇzijeme histogram a tzv. Q-Q plot1 viz obr´azek 1. Z tˇechto graf˚ u lze vyvodit pˇredbˇeˇzn´ y z´avˇer, ˇze testovan´ y soubor m˚ uˇze poch´azet z norm´aln´ıho rozdˇelen´ı. Z´avˇer uˇcinˇen´ y na z´akladˇe tˇechto graf˚ u je nutn´e br´at pouze jako informativn´ı z´avˇer. Obr´azek 1: Q-Q graf pro vizu´aln´ı posouzen´ı normality dat Normal Q−Q Plot
80
0
60
2
70
4
Frequency
6
Sample Quantiles
90
8
10
100
Histogram of X
50
60
70
80
90
100
−2
X
−1
0
1
2
Theoretical Quantiles
Pˇredepiˇsme tedy testovanou a alternativn´ı hypot´ezu: H0 : µ ≤ 72, 5
HA : µ > 72, 5
Pr˚ umˇern´a hodnota hmotnosti ˇzen ve v´ ybˇerov´em souboru je n
1X x ¯= xi = 75, 33542 . n i=1 1 Velmi hrubˇ e ˇreˇ ceno, jsou-li body v tomto grafu pˇribliˇ znˇ e na pˇr´ımce lze se domn´ıvat, ˇ ze pozorovan´ a data poch´ azej´ı z norm´ aln´ıho rozdˇ elen´ı.
5
Smˇerodatn´a odchylka pak v u n u 1 X p s=t (xi − x ¯) = 88, 07907 = 9, 385045 . n − 1 i=1 Vyj´adˇreme hodnotu testov´e statistiky t. t=
x ¯ − µ0 √ 75, 33542 − 72, 5 p · n= · (24) = 1, 480083 s 9, 385045
D´ale pˇredpokl´adejme, ˇze budeme cht´ıt interpretovat naˇse v´ ysledky s 95% spolehlivost´ı. Hladinu α specifikujeme tedy hodnotu 0, 05. Zb´ yv´a urˇcit kritick´ y obor K, ten je definov´an jako mnoˇzina hodnot t pro kter´e plat´ı: t ≥ t1−α (n − 1) = t0,95 (23) = 1, 713872 . Je tedy zˇrejm´e, ˇze testov´a statistika t neleˇz´ı v kritick´em oboru K. Z tohoto d˚ uvodu nelze zam´ıtnout testovanou hypot´ezu H0 : µ ≤ 72, 5. Z´avˇerem lze tedy ˇr´ıci, ˇze se n´am s 95% spolehlivost´ı na z´akladˇe pozorovan´ ych dat nepodaˇrilo prok´azat, ˇze hmotnost ˇzen vzrostla v porovn´an´ı s pr˚ umˇernou hmotnost´ı ˇzen pˇred pˇeti lety. Autor ˇcl´anku ˇzen´am zˇrejmˇe kˇrivd´ı.
P -value, aneb dosaˇ zen´ a hladina v´ yznamnosti Pokud budeme pracovat se statistick´ ym software, tak se t´emˇeˇr s jistotou setk´ame s hodnotou naz´ yvanou p-value. Ta ud´av´a pravdˇepodobnost s jakou by n´ahodn´a veliˇcina T , za platnosti nulov´e hypot´ezy, nabyla alespoˇ n takov´e hodnoty, jakou m´a testov´a statistika t, vypoˇcten´a na z´akladˇe pozorovan´ ych dat. Symbolicky pak pro spojit´e n´ahodn´e veliˇciny: P (T ≥ t) = p-value
(10)
Pˇri testov´an´ı hypot´ez lze uplatnit n´asleduj´ıc´ı pravidlo: Pokud je p-value menˇs´ı neˇz α, zam´ıt´ ame nulovou hypot´ezu ve prospˇech hypot´ezy alternativn´ı. Pro pˇredeˇsl´ y pˇr´ıklad ˇcin´ı hodnota p-value 0, 07620986. Je tedy vˇetˇs´ı neˇz n´ami specifikovan´a hladina α = 0.05, a proto nelze zam´ıtnout testovanou hypot´ezu H0 : µ ≤ 72, 5. Pokud bychom chtˇeli urˇcit dosaˇzenou hladinu v´ yznamnosti pro levostrannou alternativu, tj. pro HA : µ < 72, 5, museli bychom postupovat n´asleduj´ıc´ım zp˚ usobem: 1 − P (T ≥ t) = 1 − p-value = 1 − 0, 07620986 = 0, 9237901 V pˇr´ıpadˇe, ˇze bychom se zaj´ımali o dosaˇzenou hladinu v´ yznamnosti pro oboustrann´ y test, tj. HA : µ 6= 72, 5, staˇc´ı vyn´asobit hodnotu p-value z´ıskanou pro 6
pravostrannou alternativu dvˇema. Pokud postupujeme pˇres p-value z´ıskan´e pomoc´ı levostrann´e alternativy je nutno pˇred vyn´asoben´ım odeˇc´ıst od p-value jedniˇcku. Pozn.: U nˇekter´ ych statistick´ ych bal´ık˚ u si m˚ uˇzeme zvolit pro jak´ y typ testu (jakou alternativu) chceme p-value spoˇc´ıtat. Komerˇcn´ı statistick´ y bal´ık STATISTICA vˇsak tuto vlastnost nem´a. Hodnota p-value je poˇc´ıt´ana vˇzdy pro oboustrann´ y test. V pˇr´ıpadˇe jednostrann´ ych test˚ u mus´ıme skuteˇcn´e p-value dopoˇc´ıtat.
Testy hypot´ ez o parametru σ 2 norm´ aln´ıho rozdˇ elen´ı Testy hypot´ezy o rozptylu norm´aln´ıho rozdˇelen´ı lze prov´adˇet za podm´ınky, ˇze stˇredn´ı hodnotu µ zn´ame, coˇz je dosti ˇr´ıdk´ y pˇr´ıpad, nebo za podm´ınky ˇze µ nezn´ame. Vˇsimnˇeme si ˇcastˇejˇs´ıho pˇr´ıpadu. V takov´em pˇr´ıpadˇe jsou kritick´e obory pro jednotliv´e hypot´ezy zaloˇzeny na testov´em krit´eriu Pn (xi − x ¯)2 (n − 1)s2 2 χ = i=1 2 = , (11) σ0 σ02 kter´e m´a, za pˇredpokladu platnosti nulov´e hypot´ezy χ2 rozdˇelen´ı s n − 1 stupni volnosti. Pˇri testu hypot´ezy H0 : σ 2 ≤ σ02 proti pravostrann´e alternativˇe HA : σ 2 > σ 2 vyuˇz´ıv´ame kritick´ y obor K, kter´ y lze vymezit jako {χ2 ; χ2 ≥ χ21−α (n − 1)} .
(12)
Naopak pˇri testu hypot´ezy H0 : σ 2 ≥ σ02 proti levostrann´e alternativˇe HA : σ 2 < σ 2 vyuˇz´ıv´ame kritick´ y obor K, kter´ y je specifikov´an jako {χ2 ; χ2 ≤ χ2α (n − 1)} .
(13)
Koneˇcnˇe, pˇri testu hypot´ezy H0 : σ 2 = σ02 proti oboustrann´e alternativˇe HA : σ 2 6= σ 2 , vyuˇz´ıv´ame kritick´ y obor K, kter´ y je specifikov´an jako sjednocen´ı dvou podmnoˇzin, tedy: {χ2 ; χ2 ≤ χ2α2 (n − 1) ∪ χ2 ≥ χ21− α2 (n − 1)} .
(14)
Testy hypot´ ez o shodˇ e stˇ redn´ıch hodnot dvou norm´ aln´ıch rozdˇ elen´ı pˇ ri nez´ avisl´ ych v´ ybˇ erech a nezn´ am´ ych rozptylech Testujeme-li hypot´ezu o shodˇe stˇredn´ıch hodnot dvou norm´aln´ıch rozdˇelen´ı, jejichˇz rozptyly nezn´ame, je zp˚ usob testu z´avisl´ y na tom, zda m˚ uˇzeme pˇredpokl´adat, ˇze rozptyly jsou stejn´e, tj. je nutno nejprve prov´est test hypot´ezy H0 : σ12 = σ22 . Testovac´ım krit´eriem je statistika F =
s21 , s22
(15)
kter´a m´a za platnosti nulov´e hypot´ezy rozdˇelen´ı F (m − 1, n − 1). Jednotliv´e kritick´e obory jsou pak vymezeny n´asledovnˇe:
7
Tabulka 1: Testy hypot´ezy o shodˇe dvou rozptyl˚ u K
HA σ12 > σ22
{F : F ≥ F1−α (m − 1, n − 1)}
σ12 < σ22
{F : F ≤ Fα (m − 1, n − 1)}
σ12 6= σ22
{F : F ≤ F α2 (m − 1, n − 1) ∪ F ≥ F1− α2 (m − 1, n − 1)}
Varianta a) shodn´ e rozptyly - homoskedasticita Pokud tedy pˇredpokl´ad´ame, na z´akladˇe pˇredchoz´ıho testu, ˇze jsou oba rozptyly shodn´e, lze k testov´an´ı nulov´e hypot´ezy o shodˇe stˇredn´ıch hodnot vyuˇz´ıt testovac´ı statistiky r x ¯1 − x ¯2 mn t= , (16) s∗ m+n kde
s ∗
s =
(m − 1)s21 + (n − 1)s22 . m+n−2
(17)
Dle formulace alternativn´ı hypot´ezy pak pouˇz´ıv´ame kritick´e obory uveden´e v tabulce 2: Tabulka 2: Testy hypot´ezy o shodˇe stˇredn´ıch hodnot HA
K
µ1 > µ2
{t : t ≥ t1−α (m + n − 2)}
µ1 < µ2
{t : t ≤ −t1−α (m + n − 2)}
µ1 6= µ2
{t : |t| ≥ t1− α2 (m + n − 2)}
Varianta b) neshodn´ e rozptyly - heteroskedasticita V praxi se setk´av´ame i s pˇr´ıpadem, kdy rozptyly nezn´ame a nav´ıc nem˚ uˇzeme pˇredpokl´adat, ˇze jsou shodn´e. Neboli testem na shodu rozptyl˚ u jsme zam´ıtli nulovou hypot´ezu σ12 = σ22 . V takov´em pˇr´ıpadˇe jsme nuceni pouˇz´ıt ponˇekud jin´e testov´e statistiky: x ¯1 − x ¯2 (18) t= q 2 s1 s22 + m n
8
Tato statistika sleduje, za pˇredpokladu platnosti nulov´e hypot´ezy, rozdˇelen´ı t(f ), kde µ ¶ s21 m
f=
µ 1 m−1
s21 m
+
s22 n
2
¶2
µ +
1 n−1
s22 n
¶2 .
(19)
Dle alternativn´ı hypot´ezy pak rozezn´av´ame n´asleduj´ıc´ı kritick´e obory viz tabulka 3.
Tabulka 3: Testy hypot´ez o shodˇe stˇredn´ıch hodnot HA K µ1 > µ2
{t : t ≥ t1−α (f )}
µ1 < µ2
{t : t ≤ −t1−α (f )}
µ1 6= µ2
{t : |t| ≥ t1− α2 (f )}
Testy hypot´ ez o shodˇ e stˇ redn´ıch hodnot pˇ ri z´ avisl´ ych v´ ybˇ erech Jde o takzvan´ y Student˚ uv p´arov´ y t-test. V tomto pˇr´ıpadˇe lze nulovou hypot´ezu tvrd´ıc´ı, ˇze n´ahodn´e v´ ybˇery x1 a x2 poch´azej´ı z rozdˇelen´ı se stejn´ ymi stˇredn´ımi hodnotami, lze pˇrev´est na hypot´ezu H0 , tvrd´ıc´ı, ˇze n´ahodn´ y v´ ybˇer d = [d1 , d2 , · · · , dn ], kde pro di plat´ı di = d1i − d2i , poch´az´ı z rozdˇelen´ı jehoˇz stˇredn´ı hodnota se rovn´a nule. Testujeme hypot´ezu HA : µ = µ1 − µ2 = 0 . Testov´ ym krit´eriem je statistika t=
d¯ √ n. sd
(20)
Kritick´e obory pro jednotliv´e alternativn´ı hypot´ezy ud´av´a tabulka 4.
Tabulka 4: Test hypot´ezy o shodˇe stˇredn´ıch hodnot – z´avisl´e soubory HA
K
µ = µ1 − µ2 > 0
{t : t ≥ t1−α (n − 1)}
µ = µ1 − µ2 < 0
{t : t ≤ −t1−α (n − 1)}
µ = µ1 − µ2 6= 0
{t : |t| ≥ t1− α2 (n − 1)}
9