Pozn´ amky k pˇ redmˇ etu Aplikovan´ a statistika, 9.t´ ema
Princip testov´ an´ı hypot´ ez, jednov´ ybˇ erov´ e testy V minul´e hodinˇe jsme si uk´azali, jak sestavit intervalov´e odhady pro nˇekter´e ˇc´ıseln´e charakteristiky norm´aln´ıho rozdˇelen´ı. V praxi n´as ale mohou zaj´ımat i dalˇs´ı vˇeci. Dnes si uk´aˇzeme, na jak´em principu je postaveno testov´an´ı hypot´ez. Uvaˇzujme n´ahodn´ y v´ ybˇer X1 , . . . , Xn . Pˇredpokl´adejme, ˇze v r´amci experimentu jsme si udˇelali jakousi pˇredstavu o nˇekter´ ych aspektech. Oznaˇcme tuto naˇsi hypot´ezu H0 . Tuto nulovou hypot´ ezu budeme cht´ıt nyn´ı otestovat. Nulov´a hypot´eza m˚ uˇze b´ yt velice r˚ uznorod´a. Napˇr´ıklad m˚ uˇzeme zkoumat, zda stˇredn´ı hodnota n´ahodn´eho v´ ybˇeru odpov´ıd´a nˇejak´e hypotetick´e hodnotˇe µ0 , nebo ˇze n´ahodn´ y v´ ybˇer poch´az´ı z nˇejak´eho konkr´etn´ıho rozdˇelen´ı. Z podstaty testov´an´ı hypot´ez, kterou si vysvˇetl´ıme n´ıˇze na konkr´etn´ım pˇr´ıpadˇe, vypl´ yv´a nutnost testovat hypot´ezu H0 oproti nˇejak´e alternativˇe. Nelze prov´adˇet test, nen´ı-li tato alternativn´ı hypot´ eza H1 stanovena. Rozhodovac´ı krit´erium, tj. jestli bude nulov´a hypot´eza zam´ıtnuta ˇci nikoliv, z´avis´ı pr´avˇe na alternativn´ı hypot´eze. Zam´ıtneme-li nulovou hypot´ezu, je to vˇzdy ve prospˇech pr´avˇe alternativy. Na druhou stranu, princip testov´an´ı n´am nedovoluje nulovou hypot´ezu pˇrijmout. M˚ uˇzeme ji pouze nezam´ıtnout. To v podstatˇe znamen´a, ˇze data nejsou dostateˇcnˇe pr˚ ukazn´a proti hypot´eze H0 (lidovˇe ˇreˇceno, neˇr´ık´ame tak ani tak). Pˇri testov´an´ı n´am m˚ uˇzou nastat tyto ˇctyˇri moˇznosti 1. Hypot´eza H0 ve skuteˇcnosti neplat´ı a test ji zam´ıt´a. 2. Hypot´eza H0 ve skuteˇcnosti plat´ı a test ji nezam´ıt´a. 3. Hypot´eza H0 ve skuteˇcnosti plat´ı a test ji zam´ıt´a. 4. Hypot´eza H0 ve skuteˇcnosti neplat´ı a test ji nezam´ıt´a. Prvn´ı dvˇe situace jsou naprosto v poˇra´dku. Druh´e dvˇe moˇznosti jiˇz ovˇsem ne. Situaci 3. ˇr´ık´ame chyba prvn´ıho druhu a situaci 4. chyba druh´ eho druhu. Pravdˇepodobnosti tˇechto chyb se znaˇc´ı α = P (H0 zam´ıt´ame|H0 plat´ı), β = P (H0 nezam´ıt´ame|H0 neplat´ı). Samozˇrejmˇe bychom si pˇr´ali, aby pravdˇepodobnosti chyb prvn´ıho a druh´eho druhu byly co nejmenˇs´ı, ale toho v praxi nelze obecnˇe dos´ahnout. Proto se pravdˇepodobnost chyby prvn´ıho druhu α, tzv. hladina testu, pevnˇe vol´ı (zpravidla α = 1% nebo α = 5%). Hodnota 1 − β se naz´ yv´a s´ıla testu. Snaha sn´ıˇzit hladinu testu α s sebou pˇrin´aˇs´ı zvˇetˇsen´ı chyby β. To se d´a eliminovat zv´ yˇsen´ım rozsahu v´ ybˇeru n. Rozhodovac´ı krit´erium, resp. princip testov´an´ı si uk´aˇzeme na testu hypot´ezy o stˇredn´ı hodnotˇe. Odvozen´ı rozhodovac´ıho pravidla pro testov´ an´ı stˇ redn´ı hodnoty Uvaˇzujme n´ahodn´ y v´ ybˇer X1 , . . . , Xn z rozdˇelen´ı N (µ, σ 2 ), kde σ 2 > 0 je zn´am´e. Chceme otestovat, zda stˇredn´ı hodnota je rovna dan´e hypotetick´e hodnotˇe µ0 oproti alternativˇe, ˇze tomu tak
1
nen´ı. Tedy H0 : H1 :
µ = µ0 µ 6= µ0
V minul´e hodinˇe jsme se dozvˇedˇeli, ˇze v´ ybˇerov´ y pr˚ umˇer je nejlepˇs´ım nestrann´ ym bodov´ ym odhaσ2 ¯ dem stˇredn´ı hodnoty µ a tak´e v´ıme, ˇze X ∼ N (µ, n ), respektive ˇze ¯ − µ√ X n ∼ N (0, 1). σ ¯ bude hodnˇe daleko od hypotetick´e hodnoty µ0 , tj. Intuitivnˇe H0 zam´ıtneme, jestliˇze hodnota X ¯ − µ0 | > k. Hodnotu k pak pˇri pevnˇe zvolen´e hladinˇe testu urˇc´ıme n´asledovnˇe: kdyˇz |X ¯ √ √ | X − µ | k n 0 ¯ 0 | > k|H0 plat´ı) = P H0 plat´ı . α = P (|X/µ n> σ σ Potom pˇri platnosti H0 dost´av´ame rovnost ¯ |X − µ0 | √ n > u1− α2 = α, P σ a odtud
√ k n = u1− α2 . σ
Tedy hypot´ezu H0 zam´ıtneme, bude-li ¯ − µ0 √ X n > u1− α2 . σ √ ¯ 0 Funkce R(X1 , . . . , Xn ) = R = X−µ n se naz´ yv´a testov´ a statistika. Obor hodnot testov´e staσ tistiky, pˇri kter´ ych zam´ıt´ame H0 , se naz´ yv´a kritick´ y obor Wα := {R : |R(X1 , . . . , Xn )| > u1− α2 }. Pozn´ amka 1. Povˇsimnˇeme si, jak velice podobn´a je pˇredchoz´ı u ´vaha odvozen´ı oboustrann´eho (1 − α)% intervalov´eho odhadu pro stˇredn´ı hodotu. Ve skuteˇcnosti jsou tyto dvˇe metody naprosto ekvivalentn´ı. To znamen´a, ˇze naˇsi hypot´ezu zam´ıtneme pr´avˇe tehdy, kdyˇz hodnota µ0 spadne mimo (1 − α)% oboustrann´y interval spolehlivosti pro stˇredn´ı hodnotu. Analogicky lze odvodit i tzv. jednostrann´e hypot´ezy, tj. hypot´ezy, kde alternativa H1 je tvaru H1 : µ > µ0 nebo H1 : µ < µ0 . Tvar testov´e statistiky a kritick´e obory naleznete v tabulk´ach. Pro n´as je nyn´ı podstatn´a n´asleduj´ıc´ı u ´vaha. V pˇredchoz´ıch odstavc´ıch jsme se dozvˇedˇeli, ˇze nulovou hypot´ezu nem˚ uˇzeme pˇrijmout, ale m˚ uˇzeme ji zam´ıtnout a to vˇ zdy ve prospˇech alternativn´ı hypot´ezy. Uvaˇzujme nyn´ı, ˇze chceme ˇ e republice. Na z´akladˇe n´ahodn´eho v´ napˇr´ıklad zkoumat pr˚ umˇernou v´ yˇsku muˇz˚ u v Cesk´ ybˇeru m´ame 2
podezˇren´ı, ˇze tato hodnota je alespoˇ n 175 cm. Bohuˇzel nulovou hypot´ezu H0 : µ ≥ 175 by se n´am nikdy potvrdit nepodaˇrilo. Na druhou stranu, pokud hypot´ezy stanov´ıme n´asledovnˇe: H0 : µ = 175 H1 : µ > 175, potom podaˇr´ı-li se n´am zam´ıtnout H0 , je to uˇz ve prospˇech naˇs´ı p˚uvodn´ı hypot´ezy. Tedy se n´am podaˇr´ı statisticky v´ yznamnˇ e na hladinˇ e α prok´azat hypot´ezu o tom, ˇze oˇcek´avan´a v´ yˇska muˇz˚ u v naˇs´ı republice je vˇetˇs´ı neˇz 175 cm. Obdobn´ y postup se tedy v takov´ ych pˇr´ıpadech pouˇz´ıv´a. Shrˇ nme si nyn´ı obecn´ y postup pˇri testov´an´ı hypot´ez: • stanoven´ı c´ıle testov´an´ı ⇒ stanoven´ı H0 a H1 • spoˇcten´ı testov´e statistiky (jej´ı tvar z´avis´ı na tom, co testujeme) • stanoven´ı kritick´eho oboru a porovn´an´ı statistiky R s kritick´ ym oborem • z´avˇer: rozhodnut´ı H0 zam´ıt´ame ve prospˇech H1 nebo H0 nezam´ıt´ame Test, na kter´em jsme si odvodili princip testov´an´ı hypot´ez byl jednov´ ybˇ erov´ y test o stˇ redn´ı 2 hodnotˇ e pˇ ri zn´ am´ em σ . V praxi se n´am ale moc ˇcasto nestane, ˇze bychom znali rozptyl n´ahodn´eho v´ ybˇeru. V takov´em pˇr´ıpadˇe se pouˇz´ıv´a tzv. jednov´ ybˇ erov´ y t-test o stˇ redn´ı hod2 2 notˇ e. V nˇem je hodnota σ v testov´e statistice nahrazena S a statistika R m´a pak za platnosti H0 Studentovo t−rozdˇelen´ı o n − 1 stupn´ıch volnosti. Pˇresn´ y tvar testov´e statistiky R a kritick´ y obor naleznete opˇet v tabulk´ach. Pozn´ amka 2. V praxi se pˇri testov´an´ı vyuˇz´ıv´a tzv. p-hodnota testu (p-value). Tato hodnota p je dosaˇzenou hladinou testu. Je to nejmenˇs´ı hladina v´yznamnosti α, na kter´e jeˇstˇe lze hypot´ezu H0 zam´ıtnout. V dneˇsn´ı dobˇe n´am tuto hodnotu poskytne kaˇzd´y statisticky zamˇeˇren´y software. ˇ ´I K TOMUTO TEMATU ´ CVICEN (i) Rozptyl koncentrace kyseliny pˇri v´ yrobˇe byl dlouhodobˇe σ 2 = 10. Otestujte na hladinˇe v´ yznamnosti 5%, zda po gener´aln´ı opravˇe v´ yrobn´ıho zaˇr´ızen´ı je opˇet roven deseti, m´ameli vzorky mˇeˇren´ı xi
86
88 90 87 85 86 84
88 89 .
Pˇredpokl´adejme, ˇze koncentrace je norm´alnˇe rozdˇelen´a n´ahodn´a veliˇcina. (ii) Spotˇreba paliva u dan´eho typu auta je 10 l/100 km. Byla navrˇzena u ´prava na sn´ıˇzen´ı spotˇreby a bylo vyrobeno 25 prototyp˚ u aut s touto u ´pravou. Automobilka chce u ´pravu zav´est s´eriovˇe pouze tehdy, kdyˇz se spolehlivˇe (na hladinˇe v´ yznamnosti 5%) prok´aˇze sn´ıˇzen´ı spotˇreby paliva u upraven´ ych aut. Pˇredpokl´ad´a se norm´aln´ı rozdˇelen´ı spotˇreby paliva. Rozhodnˇete, zda m´a automobilka zav´est u ´pravu s´eriovˇe, pokud v´ıte, ˇze z namˇeˇren´ ych hodnot spotˇreby se spoˇcetlo x¯ = 9, 3 l/100 km, s2 = 4. (iii) Napiˇste 95% doln´ı interval spolehlivosti pro stˇredn´ı hodnotu n´ahodn´e veliˇciny X ∼ N (µ, σ 2 ), byly-li namˇeˇreny n´asleduj´ıc´ı hodnoty X xi
11
15 13 19 7 .
Lze pouze na z´akladˇe tohoto intervalu spolehlivosti tvrdit, ˇze 3
(a) s 95% spolehlivost´ı plat´ı • • • •
µ < 9, µ < 5, µ > 8, µ > 10,
(b) s 90% spolehlivost´ı plat´ı µ > 8, (c) s 99% spolehlivost´ı plat´ı µ > 10, (d) lze zam´ıtnout na hladinˇe v´ yznamnosti 5% hypot´ezy • • • •
H0 H0 H0 H0
: : : :
µ ≥ 7, µ ≥ 10, µ ≤ 7, µ ≤ 9?
(iv) Norma poˇzaduje, aby urˇcit´ y reaguj´ıc´ı roztok mˇel hodnotu pH = 8, 30. Modelujme hodnotu pH n´ahodnou veliˇcinou s rozdˇelen´ım N (µ, σ 2 ), kde σ = 0, 02. Na z´akladˇe z´ıskan´ ych mˇeˇren´ı pH
8, 34 8, 31 8, 30 8, 33 8, 32
rozhodnˇete na hladinˇe v´ yznamnosti 5%, zda je hodnota pH vˇetˇs´ı, neˇz poˇzaduje norma. (dcv) Bylo mˇeˇreno mnoˇzstv´ı odpadu (v %) pˇri v´ yrobˇe jist´e souˇca´stky xi v %
4, 1
4, 0 3, 8 3, 9 3, 8 3, 8 3, 5 3, 7
4, 0 4, 0 .
Na hladinˇe v´ yznamnosti 5% testujte n´asleduj´ıc´ı nulov´e hypot´ezy o pr˚ umˇern´em odpadu pˇri v´ yrobˇe souˇc´astky (a) H0 : µ ≤ 3, 9, (b) H0 : µ = 3, 8, (c) H0 : µ ≥ 4.
Dvouv´ ybˇ erov´ e testy, p´ arov´ y test Ted’ uˇz tedy v´ıme, na jak´em principu funguje testov´an´ı hypot´ez a uvedli jsme si z´akladn´ı testy pro ˇc´ıseln´e charakteristiky norm´aln´ıho rozdˇelen´ı. Vrat’me se k pˇr´ıkladu z minul´eho odstavce. Uvaˇzujme ˇ e republice a pod´ıvejme se bl´ıˇze na rozdˇelen´ı v´ nyn´ı muˇze a ˇzeny v Cesk´ yˇsky pro obˇe pohlav´ı. Asi nikdo z n´as nepˇredpokl´ad´a, ˇze by oˇcek´avan´a v´ yˇska byla pro obˇe pohlav´ı stejn´a. Kdybychom si ale chtˇeli podobnou hypot´ezu statisticky ovˇeˇrit, potˇrebovali bychom porovnat obˇe stˇredn´ı hodnoty µ1 (muˇzi) a µ2 (ˇzeny). Nejjednoduˇsˇs´ım testem shody stˇredn´ıch hodnot je tzv. dvouv´ ybˇ erov´ y t-test. Pˇredpokl´adejme, ˇze X1 , . . . , Xn je n´ahodn´ y v´ ybˇer z N (µ1 , σ12 ) a Y1 , . . . , Ym n´ahodn´ y v´ ybˇer z N (µ2 , σ22 ) a ˇze tyto v´ ybˇery jsou na sobˇe nez´avisl´e. Hypot´ezu H0 : µ1 = µ2 m˚ uˇzeme ekvivalentnˇe formulovat ve tvaru H0 : µ1 − µ2 = 0. Dvouv´ ybˇ erov´ y t-test shody stˇ redn´ıch hodnot pˇ ri zn´ am´ ych σ12 a σ22
4
¯ a Y¯ maj´ı tak´e norm´aln´ı rozdˇelen´ı a tud´ıˇz i veliˇcina Z vlastnost´ı norm´aln´ıho rozdˇelen´ı plyne, ˇze X ¯ − Y¯ bude m´ıt norm´aln´ı rozdˇelen´ı. Potom (po znormov´an´ı a za platnosti H0 ) m´a testov´a statistika X ¯ − Y¯ X R= q 2 σ1 σ2 + m2 n normovan´e norm´aln´ı rozdˇelen´ı. T´ımto rozdˇelen´ım se ˇr´ıd´ı kritick´ y obor (viz tabulky). Dvouv´ ybˇ erov´ y t-test shody stˇ redn´ıch hodnot pˇ ri nezn´ am´ ych rozptylech Nezn´ame-li rozptyly jednotliv´ ych rozdˇelen´ı (coˇz praxi nezn´ame v podstatˇe nikdy), je tˇreba nahradit tyto rozptyly jejich bodov´ ymi odhady S12 a S22 . Potom m´a (opˇet po znormov´an´ı a za platnosti H0 ) testov´a statistika ¯ − Y¯ X R= q 2 S22 S1 + n m Studentovo rozdˇelen´ı t(l), kde poˇcet stupˇ n˚ u volnosti l se z´ısk´a ze vztahu l=
S12 n 4
1 S1 n−1 n2
2
+
S22 m
+
4 1 S2 m−1 m2
.
Toto ˇc´ıslo nen´ı (skoro nikdy) cel´e, proto se bud’ zaokrouhl´ı na nejbliˇzˇs´ı cel´e ˇc´ıslo, nebo m˚ uˇzeme za kvantil volit pr˚ umˇer mezi kvantilem se stupni volnosti rovn´ ymi nejbliˇzˇs´ımu menˇs´ımu cel´emu ˇc´ıslu a kvantilem se stupni volnosti rovn´ ymi nejbliˇzˇs´ımu vˇetˇs´ımu cel´emu ˇc´ıslu. Bliˇzˇs´ı detaily o kritick´em oboru opˇet naleznete v tabulce. Test shody rozptyl˚ u Chceme-li u dvou v´ ybˇer˚ u testovat shodu rozptyl˚ u (napˇr´ıklad k urˇcen´ı, zda jsou dva pˇr´ıstroje stejnˇe σ2 2 2 citliv´e), lze nulovou hypot´ezu H0 : σ1 = σ2 formulovat jako H0 : σ12 = 1. Bodov´e odhady S12 a S22 2 maj´ı χ2 -rozdˇelen´ı, a proto (za platnosti H0 ) bude statistika S12 R= 2 S2 m´ıt Fisherovo–Snedecorovo rozdˇelen´ı o n − 1, m − 1 stupn´ıch volnosti. Pozn´ amka 3. V literatuˇre (vˇcetnˇe skrip Pavl´ık a kol.) lze nal´ezt i test shody stˇredn´ıch hodnot pro pˇr´ıpad shodn´ych, ale nezn´am´ych rozptyl˚ u σ12 = σ22 . Testov´a statistika je pak tvaru ¯ − Y¯ r n m X R= , S12 n+m kde
s S12 =
(n − 1)S12 + (m − 1)S22 , n+m−2
a m´a za platnosti H0 Studentovo rozdˇelen´ı s n + m − 2 stupni volnosti. V praxi je ovˇsem jen velmi zˇr´ıdka pˇredpoklad o shodˇe rozptyl˚ u dostateˇcnˇe opodstatnˇen´y. Dˇr´ıve se ˇcasto dˇelal pˇredbˇeˇzn´y test 5
shody rozptyl˚ u, a v pˇr´ıpadˇe nezam´ıtnut´ı hypot´ezy o shodˇe se pouˇz´ıval pr´avˇe test z t´eto pozn´ amky. Tento postup ovˇsem nedoporuˇcujeme, nebot’ nezam´ıtnut´ı hypot´ezy nen´ı (jak jiˇz v´ıme ze zaˇc´ atku t´eto kapitoly) ekvivalentn´ı jej´ımu pˇrijet´ı a podobn´ym postupem uˇz bychom nemohli zajistit dosaˇzen´ı pˇredepsan´e hladiny α a nav´ıc bychom mohli v´yraznˇe ovlivnit s´ılu testu 1−β. Je tedy l´epe v takov´ych pˇr´ıpadech uˇz´ıt testu pro obecnˇe nezn´am´e rozptyly i za cenu toho, ˇze ˇcastˇeji nezam´ıtneme. Pˇredt´ım, neˇz se pod´ıv´ame na posledn´ı test t´eto kapitoly, mus´ıme jeˇstˇe zav´est pojem dvourozmˇern´eho norm´aln´ıho rozdˇelen´ı. Definice 1. N´ahodn´ y vektor X = (X1 , X2 ) se stˇredn´ı hodnotou µ = (µ1 , µ2 ) a kovarianˇcn´ı matic´ı σ12 , cov(X1 , X2 ) var(X1 , X2 ) = cov(X1 , X2 ) , σ22 m´a dvourozmˇ ern´ e norm´ aln´ı rozdˇ elen´ı, jestliˇze pro vˇsechna a, b ∈ R m´a n´ahodn´a veliˇcina Y = aX1 + bX2 norm´aln´ı rozdˇelen´ı N (aµ1 + bµ2 , σ 2 ), kde σ 2 = a2 σ12 + b2 σ22 + 2ab cov(X1 , X2 ). P´ arov´ y t-test Pˇ r´ıklad 1. U pˇeti n´ahodnˇe vybran´ych pacient˚ u byl namˇeˇren krevn´ı tlak pˇred (xi ) a po (yi ) pod´ an´ı ´ nov´eho l´eku. Udaje jsou uvedeny v n´asleduj´ıc´ı tabulce R´adi bychom ovˇeˇrili, ˇze pod´an´ı tohoto l´eku i xi yi
1 2 3 4 5 105 99 109 97 115 115 103 101 108 121
m´a vliv na krevn´ı tlak pacient˚ u, jin´ymi slovy ˇreˇceno, zda se stˇredn´ı hodnota tlaku pˇred i po pod´ an´ı l´eku mˇen´ı Jak je vidno, m´ame tu opˇet dva v´ ybˇery dat, ale je zˇrejm´e, ˇze v tomto pˇr´ıpadˇe nem˚ uˇzeme uvaˇzovat jednotliv´e v´ ybˇery za nez´avisl´e. Ba naopak, z´avislost dvojic hodnot v i−t´em sloupci je zcela zˇrejm´a. Dvouv´ ybˇerov´ y t-test je tedy absolutnˇe nevhodn´ y. Pˇredpokl´adejme, ˇze dvourozmˇern´ y n´ahodn´ y v´ ybˇer (X1 , Y1 ), . . . , (Xn , Yn ) (tj. mnoˇzina nez´avisl´ ych stejnˇe rozdˇelen´ ych vektr˚ u) poch´az´ı z dvourozmˇern´eho norm´aln´ıho rozdˇelen´ı a X1 , . . . , Xn maj´ı stˇredn´ı hodnotu µ1 a rozptyl σ12 a veliˇciny Y1 , . . . , Yn maj´ı stˇredn´ı hodnotu µ2 a rozptyl σ22 . Definujme nyn´ı veliˇciny Zi = Xi − Yi , potom Zi maj´ı norm´aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µZ = µ1 − µ2 a v´ ybˇerov´ y rozptylem SZ2 = P n 1 ¯ 2 an´ı hypot´ezy H0 : µ1 = µ2 je ekvivalentn´ı testov´an´ı hypot´ezy H0 : µZ = i=1 (Zi − Z) . Testov´ n−1 0 a pro tuto hypot´ezu lze jiˇz pouˇz´ıt jednov´ ybˇerov´eho t-testu o stˇredn´ı hodnotˇe. Testov´a statistika m´a pak tvar (dosad’ µ0 = 0) Z¯ √ n. R= SZ Kritick´ y obor naleznete v tabulk´ach. Pozn´ amka 4. Pro vˇsechny uveden´e testy byl vyuˇzit pˇredpoklad, ˇze n´ahodn´y v´ybˇer poch´az´ı z norm´ aln´ıho rozdˇelen´ı. Co ale v pˇr´ıpadˇe, ˇze se nejedn´a o v´ybˇer z norm´aln´ıho rozdˇelen´ı (coˇz v praxi ne vˇzdycky m˚ uˇzeme pˇredpokl´adat)? Vzhledem k tomu, ˇze vˇsechny uveden´e testov´e statistiky byly 6
¯ nebo S 2 a tyto veliˇciny lze interpretovat jako souˇcet nez´ zaloˇzeny na n´ahodn´ych veliˇcin´ach X avisl´ych veliˇcin, m˚ uˇzeme d´ıky centr´ aln´ı limitn´ı vˇ etˇ e pˇredpokl´adat asymptotickou normalitu veliˇcin ¯ a S 2 a pro dostateˇcnˇe ˇsirok´y rozsah v´ybˇeru (CLV funguje dobˇre uˇz od relatvnˇe mal´eho n) pouˇz´ıt X zmiˇ novan´e testy jako asymptotick´ e. ˇ ´I K TOMUTO TEMATU ´ CVICEN (i) N´ahodnˇe se vybrala prasata a rozdˇelila do dvou skupin. Kaˇzd´a skupina byla krmena p˚ ul roku jinou dietou. Na z´avˇer se zjistily v´ahov´e pˇr´ır˚ ustky prasat (v kilogramech) 1. dieta 2. dieta
62 54 55 60 53 58 . 52 56 49 50 51
Pˇredpokl´adejme normalitu v´ahy prasat. Prvn´ı dieta je n´akladnˇejˇs´ı neˇz druh´a, a proto se v´ ykrmna pt´a, zdali je prvn´ı dieta statisticky v´ yznamnˇe u ´ˇcinnˇejˇs´ı neˇz druh´a (testujte na hladinˇe 5%). (ii) Firma provozuj´ıc´ı billboardy se rozhodla otestovat, zdali m´a nakoupit draˇzˇs´ı ˇci levnˇejˇs´ı barvu podle toho, jak z˚ ustane zachov´ana. N´ahodnˇe se vybralo 10 billboard˚ u, 5 z nich se natˇrelo draˇzˇs´ı barvou a zbytek levnˇejˇs´ı. Po ˇctvrt roce se zjistilo procento zachoval´e barvy na kaˇzd´em billboardu draˇzˇs´ı barva 89 89 90 84 88 . levnˇejˇs´ı barva 85 87 92 80 84 Pˇredpokl´ad´ame norm´aln´ı rozdˇelen´ı zachov´an´ı barvy se stejn´ ym nezn´am´ ym rozptylem. Draˇzˇs´ı barva se nakoup´ı, pokud bude spolehlivˇe (na hladinˇe 10%) prok´az´ano, ˇze je st´alejˇs´ı. V opaˇcn´em pˇr´ıpadˇe se poˇr´ıd´ı levnˇejˇs´ı. Rozhodnˇete, kterou barvu m´a firma koupit. (iib) Uvaˇzte stejn´e zad´an´ı jako v pˇr´ıkladu (ii), jen s t´ım rozd´ılem, ˇze se vybralo pouze 5 bilboard˚ u a kaˇzd´ y z nich se natˇrel z poloviny draˇzˇs´ı barvou a z poloviny levnˇejˇs´ı. (iii) Laboratoˇr chce koupit jist´ y mˇeˇr´ıc´ı pˇr´ıstroj. M´a na v´ ybˇer ze dvou moˇznost´ı. Prvn´ı pˇr´ıstroj lze obstarat hned, druh´ y aˇz za rok. Rozhodovac´ı strategie je n´asleduj´ıc´ı. Druh´ y pˇr´ıstroj se koup´ı pouze tehdy, uk´aˇze-li se spolehlivˇe (α = 10%), ˇze je pˇresnˇejˇs´ı neˇz prvn´ı. Laboratoˇr m´a k dispozici 4 mˇeˇren´ı jist´eho vzorku prvn´ım pˇr´ıstrojem a 5 mˇeˇren´ı t´ehoˇz vzorku druh´ ym pˇr´ıstrojem 1. pˇr´ıstroj 2. pˇr´ıstroj
610 580 635 625
620 630 . 640 620 630
Porad’te laboratoˇri (na z´akladˇe v´ ysledk˚ u mˇeˇren´ı), m´a-li s koup´ı pˇr´ıstroje poˇckat, ˇci nikoli. (iv) Zkoum´a se, zdali se u dan´eho typu auta sj´ıˇzd´ı prav´a a lev´a zadn´ı pneumatika stejnˇe, na hladinˇe v´ yznamnosti 10%. N´ahodnˇe se vybralo 6 aut, se kter´ ymi se jezdilo p˚ ul roku na stejn´ ych pneumatik´ach. Zmˇeˇrilo se ojet´ı zadn´ıch pneumatik (v mm) auto lev´a prav´a
1 2 3 4 5 6 1, 8 1, 0 2, 2 0, 9 1, 5 1, 6 . 1, 5 0, 9 2, 0 1, 1 1, 0 1, 4
D´ale zjistˇete (se spolehlivost´ı 90%), zdali podhuˇstˇen´ı lev´e zadn´ı pneumatiky zp˚ usobuje vˇetˇs´ı ojet´ı, tj. pt´ame se, zdali se lev´a zadn´ı pneumatika sj´ıˇzd´ı v´ıce, neˇz prav´a?
7
(v) Ve dvou cement´arn´ach se provedla kontrola d´avkovaˇc˚ u. Zv´aˇzily se n´ahodnˇe vybran´e pytle cementu z obou cement´aren (jejich hmotnost uvedena v kg) 1. cement´arna 2. cement´arna
50 51 48 50 51 . 49 46 52
Pˇredpokl´adejme normalitu v´ahy pytl˚ u cementu. Otestujte (volte hladinu 20%), zdali d´avkovaˇce v obou cement´arn´ach d´avkuj´ı stejnˇe. (vi) Laboratoˇr m´a dvˇe elektronick´e v´ahy. Chce otestovat (na hladinˇe 10%), zda nen´ı systematick´a odchylka mezi mˇeˇren´ımi hmotnosti prvn´ı a druhou v´ahou. Jedno z´avaˇz´ı se zv´aˇzilo ˇsestkr´at jednou v´ahou, a pak ˇsestkr´at druhou v´ahou 1. v´aha 2. v´aha
0, 99 1, 05
0, 98 1, 03 0, 95 1, 00 0, 99 . 0, 97 1, 00 1, 02 1, 00 0, 96
(dcv) Na hladinˇe v´ yznamnosti 5% rozhodnˇete, zdali jsou dvˇe analytick´e metody srovnateln´e z hlediska (a) pˇresnosti, (b) spr´avnosti v´ ysledk˚ u mˇeˇren´ı, m´ate-li k dispozici data metoda A metoda B
3, 28 3, 28 3, 29 3, 29 . 3, 25 3, 27 3, 26 3, 25
V pˇr´ıpadˇe (b) nadto urˇcete pˇribliˇznˇe dosaˇzenou hladinu testu.
8