´ ´I STATISTICKYCH ´ ´ 7. TESTOVAN HYPOTEZ 7.1. Podstata testu statistick´ e hypot´ ezy Statistick´ a hypot´ eza – urˇcit´y pˇredpoklad o parametrech nebo tvaru rozdˇelen´ı zkouman´eho st. znaku. Testov´ an´ı hypot´ ez – proces ovˇeˇrov´an´ı spr´avnosti nebo nespr´avnosti hypot´ezy pomoc´ı v´ysledk– z´ıskan´ych realizac´ı n´ahodn´eho v´ybˇeru. Test hypot´ezy zahrnuje dvˇe hypot´ezy. Nulov´ a hypot´ eza (H, H0) (null hypothesis) – hypot´eza, kter´a je testovan´a. Alternativn´ı hypot´ eza (A, HA) (alternative hyp.) – hypot´eza, kter´a je uvaˇzovan´a jako alternativa k nulov´e h., nˇejak´ym zp˚ usobem pop´ır´a vlastnost vysloven´e nulov´e h. V´ ysledek rozhodov´ an´ı: zam´ıtnut´ı H0 ve prospˇech A ∨ nezam´ıtnut´ı H0. Formulace hypot´ez H:
θ = θ0, θ ∈ Θ
A1 : θ 6= θ0 dvoustrann´ a alternativa (two-tailed) A2 : θ < θ0 levostrann´ a alternativa (left-tailed) A3 : θ > θ0 pravostrann´ a alternat. (right-tailed)
7.2. Z´ akladn´ı pojmy a terminologie Testov´ a statistika (test statistics): Statistika pouˇzit´a jako z´aklad pro rozhodnut´ı, zda nulov´a hypot´eza by mˇela b´yt zam´ıtnuta. Obor zam´ıtnut´ı - kritick´ y obor (rejection region): Mnoˇzina hodnot testov´e statistiky, kter´a vede k zam´ıtnut´ı hypot´ezy. Obor pˇ rijet´ı (nonrejection region or acceptance region): Mnoˇzina hodnot testov´e statistiky, kter´a vede k pˇrijet´ı hypot´ezy. Kritick´ e hodnoty (critical values): Hodnoty testov´e statistiky, kter´e oddˇeluj´ı obor pˇrijet´ı od oboru zam´ıtnut´ı. Chyby I. a II. druhu Chyba I. druhu (type I error): Zam´ıtnut´ı H, kdyˇz je ve skuteˇcnosti pravdiv´a. Chyba II. druhu (type II error): Nezam´ıtnut´ı H, kdyˇz je ve skuteˇcnosti nepravdiv´a. Pravdˇ epodobnosti chyb I. a II. druhu Pst, ˇze se dopust´ıme chyby I. druhu je pst zam´ıtnut´ı spr´avn´e nulov´e hypot´ezy. Je to pst, ˇze testov´a statistika bude v oboru zam´ıtnut´ı, jestliˇze ve skuteˇcnosti nulov´a hypot´eza je spr´avn´a. Hladina v´ yznamnosti α (significance level): – pst, ˇze se dopust´ıme chyby I.druhu. Pst β, ˇze se dopust´ıme chyby II. druhu je pst nezam´ıtnut´ı
nespr´avn´e nulov´e hypot´ezy. Je to pst, ˇze testov´a statistika bude v oboru pˇrijet´ı, jestliˇze ve skuteˇcnosti nulov´a hypot´eza je nespr´avn´a. Vztah mezi pravdˇ epodobnostmi chyb I. a II. druhu Pro dan´y rozsah v´ybˇeru plat´ı, ˇze ˇc´ım menˇs´ı je pst chyby I. druhu t´ım vˇetˇs´ı je pst chyby II. druhu a naopak. Ide´ aln´ı stav: α i β mal´e. Moˇ zn´ e z´ avˇ ery pˇ ri testov´ an´ı hypot´ ez • If nulov´a hypot´eza je zam´ıtnuta, dˇel´ame z´avˇer, ˇze alternativn´ı hypot´eza je spr´avn´a. • If nulov´a hypot´eza nen´ı zam´ıtnuta, dˇel´ame z´avˇer, ˇze data n´am neposkytla dostatek podklad˚ u k podpoˇre alternativn´ı h. ”V´ysledek testu je statisticky v´ yznamn´ y na hladinˇe α” – nulov´a hypot´eza je zam´ıtnuta na hladinˇe v´yznamnosti α Vztah mezi testov´ an´ım h. a intervaly spolehlivosti Nulov´a hypot´eza o urˇcit´em parametru bude zam´ıtnuta iff hodnota parametru dan´a nulovou hypot´ezou leˇz´ı vnˇe 100(1− α)% intervalu spolehlivosti pro testovan´y parametr. Silofunkce testu: funkce PW (θ), kter´a kaˇzd´emu θ ∈ Θ pˇriˇrad´ı pst P (T (X) ∈ W |θ), tedy pst zam´ıtnut´ı hypot´ezy H, m´a-li parametr hodnotu θ. Hodnotu silofunkce v bodˇe θ = θ1 naz´yv´ame silou testu vzhledem k alternativˇ e θ = θ1.
V´ ysledky testu hypot´ ez Rozhodnut´ı: H je: H se nezam´ıt´a H se zam´ıt´a pravdiv´a spr´avn´e rozhodnut´ı chyba I.druhu Pst = 1 − α Pst = α hladina v´yznamnosti nepravdiv´a chyba II.druhu spr´avn´e rozhodnut´ı Pst = β Pst = 1 − β s´ıla testu
7.3. Klasick´ y pˇ r´ıstup k testov´ an´ı hypot´ ez Postup pˇ ri testov´ an´ı uˇ zit´ım klasick´ eho pˇ r´ıstupu • Step 1 Formuluj nulovou a alternativn´ı hypot´ezu. • Step 2 Zvolte hladinu v´yznamnosti α. • Step 3 Urˇcete kritickou hodnotu (kritick´e hodnoty). • Step 4 V´ypoˇctˇete hodnotu testov´e statistiky. • Step 5 If hodnota testov´e statistiky padne do oboru zam´ıtnut´ı, zam´ıtni H; jinak nezam´ıtej H. • Step 6 Formulujte slovnˇe z´avˇer.
7.4. Pˇ r´ıstup k testov´ an´ı zaloˇ zen´ y na P -hodnotˇ e P - hodnota jako pozorovan´a hladina v´yznamnosti P - hodnota testu hypot´ezy je rovna nejmenˇs´ı hladinˇe v´yznamnosti, na kter´e H m˚ uˇze b´yt zam´ıtnuta. Velk´a P - hodnota neposkytuje dostateˇcn´y d˚ uvod zam´ıtnout H. Mal´a P - hodnota poskytuje d˚ uvod zam´ıtnoutH. X–testov´a statistika; x0–zjiˇstˇen´a hodnota test. stat. Pak P -hodnota • 2 min{P (X ≤ x0), P (X ≥ x0)} pro dvoustrann´y test • P = P (X ≤ x0) pro levostrann´y test • P = P (X ≥ x0) pro pravostrann´y test Postup pˇ ri testov´ an´ı uˇ zit´ım P - hodnoty • Step 1 Formulujte nulovou a alternativn´ı hyp. • Step 2 Zvolte hladinu v´yznamnosti α. • Step 3 V´ypoˇctˇete hodnotu testov´e statistiky. • Step 4 Urˇcete P - hodnotu. • Step 5 If P ≤ α zam´ıtni H; jinak nezam´ıtej H. • Step 6 Formulujte slovnˇe z´avˇer.
• Pˇ r´ıklad 7/1: ˇ je obˇzalovan´y povaˇzov´an za V pr´avn´ım syst´emu CR nevin´eho, dokud mu nen´ı prok´az´ana vina. Pˇri procesech s obˇzalovan´ymi se porota mus´ı rozhodnout mezi nulovou hypot´ezou H0 a alternativn´ı hypot´ezou HA: H0 : Obˇzalovan´y je nevinen. HA : Obˇzalovan´y je vinen. a) Pokud by jste byl obˇzalovan´y, jakou hodnotu psti chyby I.druhu α byste zvolil? Proˇc? b) Pokud by jste byl obh´ajce obˇzalovan´eho, jak´a hodnota pravdˇepodobnosti chyby II.druhu β by v´am nejv´ıce vyhovovala? Proˇc? c) Co by znamenalo pro soudn´ı syst´em, kdybychom zvolili α = 0? β = 0?
• Pˇ r´ıklad 7/4: Nakolik jsou bezpeˇ cnostn´ı p´ asy u ´ˇ cinn´ e? Pro zodpovˇezen´ı t´eto ot´azky byl proveden pr˚ uzkum automobil˚ u, kter´e byly vybaveny bezpeˇcnostn´ımi p´asy a kter´e se z´uˇcastnily dopravn´ıch nehod. N´ahodn´y v´ybˇer 10 000 pasaˇz´er˚ u tˇechto vozidel mˇel n´asleduj´ıc´ı m´ıru poranˇen´ı (Na z´akladˇe U.S. Department of Transportation, 1981): Bezpeˇcnostn´ı p´asy Tˇeˇzk´e nebo smrteln´e zranˇen´ı ANO NE celkem ANO 3 119 122 NE 829 9 049 9 878 Celkem 832 9 168 10 000 a) Formulujte nulovou a alternativn´ı hypot´ezu slovnˇe a symbolicky. b) Do jak´e m´ıry podporuj´ı tyto u ´daje tvrzen´ı, ˇze bezpeˇcnostn´ı p´asy jsou dobrou prevenc´ı proti u ´razu pˇri dopravn´ı nehodˇe?