Přednáška č. 7 – Analýza experimentálních údajů, testování statistických hypotéz, testy střední hodnoty K popisu vlastností základního souboru ve statistice souboru výběrového, který představuje určitý konečný počet údajů získaných z provedených experimentů, jiných zjištění. Uvedené hodnoty jsou vždy ovlivněny různými náhodnými vlivy (faktory). Při vyhodnocování je proto potřebné: - vyhodnotit objektivní chyby vzniklé při získávání výběrového souboru, - číselně vyjádřit velikost chyb, - vyhodnotit závislosti mezi jednotlivými sledovanými veličinami. K těmto činnostem se užívají metody statistické analýzy. Mezi základní postupy patří: - testy významnosti, postupy ověřující statistická tvrzení o jednotlivých parametrech náhodných veličin, - testy dobré shody pro porovnání empirické náhodné veličiny se zvolenou (předpokládanou) teoretickou náhodnou veličinou, - regresní analýza a korelace k posouzení statistických vztahů a závislostí dvou a více náhodných veličin, - analýza rozptylu k odvození spolehlivostních závěrů o sledovaných veličinách a určení velikostí ovlivňujících efektů jednotlivých faktorů. Obecný postup statistického testu Některé vlastnosti náhodné veličiny jsou zřejmé z pozorování, měření či jiných úvah a rozborů. Další vlastnosti jsou neznámé. Statistickou hypotézou nazýváme předpoklad o neznámé vlastnosti náhodné veličiny. Postupy, které slouží k ověřování zvolené hypotézy se nazývají statistické testy nebo testy významnosti. Test statistické hypotézy Ho provádíme obecně v následujících bodech: 1) formulujeme základní (nulovou) hypotézu Ho a hypotézu alternativní H1 pro případ, že základní hypotézu nebude možné přijmout. Dále zvolíme hladinu významnosti testu . 2) Ověřování základní hypotézy provedeme za základě vlastností výběrového souboru. Výběrový soubor n náhodných proměnných x1, x2, …..,xn lze popsat funkcí hustoty pravděpodobnosti, která závisí na známých náhodných proměnných a neznámém počtu parametrů tedy zápisem f(x1, …, xn, p1, ……., pn). Výběrový soubor popíšeme vhodnými odhady charakteristik náhodné veličiny. 3) Zvolíme testovací kritérium (charakteristiku), které vyhodnocuje vztah výběrového souboru a zvolené nulové (základní) hypotézy.
T T ( x1 ,...xn , H o ) Testovací kritérium je náhodná veličina (závisí na vlastnostech výběrového souboru) a k popisu zvolíme vhodný typ teoretické náhodné veličiny. 4) Obor platnosti náhodné veličiny pro popis testovacího kritéria rozdělíme podle zvolené hladiny významnosti testu na část R a doplněk R+. Obor R volíme tak, aby pravděpodobnosti, že náhodná veličina T nabude hodnoty z oboru R při platnosti hypotézy Ho odpovídala hladině významnosti . Tento obor nazýváme kritickým oborem a příslušná hodnota kvantitu T je kritickým kvantilem, platí tedy vztah P(T R / H o )
Uvedený postup je při jednostranném testu, v případě oboustranného testu určíme dvě hodnoty kritického kvantilu. V tomto případě dělíme hladinu významnosti testu na dvě stejné části o velikosti /2. 5) Rozhodnutí o platnosti Ho provedeme na základě posouzení velikosti testovacího kritéria a kritického kvantilu. Při testování se můžeme dopustit chyb dvojího druhu. Obě chyby vznikají v důsledku skutečnosti, že experimentální hodnoty jsou náhodnými veličinami a proto i výběrová charakteristika, kterou je testovací kritérium, má náhodný charakter. a) chyba 1. druhu Hypotéza Ho platí, ale ná základě experimentálně zjištěných hodnot ji zamítáme. Označíme-li P1 pravděpodobnost, s kterou při platnosti hypotézy Ho testovací kritérium T(x) bude hodnoty z kritického oboru P1 P(T R / H o ) je zřejmé, že tato pravděpodobnost odpovídá hladině významnosti testu . Hodnota udává, že mylně zamítaná testovaná hypotéza Ho ve skutečnosti platí. Velikost hladiny významnosti se volí v mezích 0,01 až 0,05. b) chyba 2. druhu Pravděpodobnost chyby P2 odpovídá pravděpodobnosti, že při platnosti alternativní hypotézy H1 testovací kritérium T(x) získá hodnotu z oboru R+ tj. v oboru ve kterém hypotéza H1 neplatí P2 P(T R / H1 )
1 P2 nebo po úpravě
1 P(T R / H1 ) P(T R / H1 ) Pravděpodobnost nazýváme síla (mohutnost) testu hypotézy Ho. Síla testu vyjadřuje pravděpodobnost, že zamítneme hypotézu Ho, platí-li H1. Hladina významnosti testu se volí v mezích 0,01 až 0,05, při ostatních velikostech jsou odchylky zjištěné ve výběrovém souboru jistě statisticky významné. Testy významnosti Testy slouží k rozlišení odchylek ve výběrových charakteristikách, které jsou náhodné a proto z hlediska statistického posuzování nevýznamné a odchylek, které významné jsou. Při testování významnosti se vychází z předpokladů: - výběry byly získány ze stejného základního souboru, za relativně stejných podmínek, - základní soubor je popsán normální náhodnou veličinou. Mezi nejčastější testy patří t-test (testování střední hodnoty), testování relativní četnosti znaku a test rozptylu. Testy dělíme na testy: - jednostranné, hladina významnosti testu se nedělí, pouze jedna kritická hodnota testovacího kritéria, obor R+ tvoří pouze jednu část
-
oboustranné, hladina významnosti se dělí na dvě stejné části, kritické hodnoty jsou dvě a proto obor R+ se skládá také ze dvou částí, testem není přesněji popsán výskyt při platnosti alternativní hypotézy H1.
Použití jednotlivých druhů testů závisí na formulaci alternativní hypotézy a možné případy jsou: (v hypotéze nulové ověřujeme tvrzení A=B) a) H1: A≠B oboustranný test Postačující je zjištění pouhé nerovnosti tvrzení bez dalšího rozlišení. V tomto případě se jedná o oboustranný test, zvolenou hladinu významnosti rozdělíme na /2 a podle druhu testu určíme dvě kritické hodnoty testovacího kritéria. Pokud se hodnota testovacího kritéria nachází mezi hodnotami přijímáme nulovou hypotézu tj. Tkr1 T Tkr 2 b) H1: A>B jednostranný test Testem se při odmítnutí nulové hypotézy přijímá tvrzení, že posuzovaná hodnota parametru je větší než požadovaná. Hladina významnosti popisuje pouze tyto případy, kritická hodnota testovacího kritéria je pouze jedna a přijetí nulové hypotézy je možné za platnosti T Tkr c) H1: A
alternativní H1: ≠
pro hladinu významnosti Test bude oboustranný.
2) Výpočet charakteristik výběrového souboru. Z výběrového souboru určíme bodový odhad střední hodnoty základního souboru 1 n xi n 1 pokud není známa střední směrodatná odchylka provedeme její bodový odhad x
1 n . ( xi x ) 2 n 1 1 a další charakteristikou je počet hodnot ve výběrovém souboru n (s touto hodnotou souvisí věrohodnost odhadu použitých charakteristik náhodné veličiny).
3) Výpočet testovacího kritéria T Testovací kritérium vyhodnocuje vztah výběrového souboru a základního souboru, ve kterém předpokládáme určitou velikost střední hodnoty o. T
x o . n
uvedená veličina má charakter náhodné veličiny. Tuto veličinu obecně popisuje Studentova náhodná veličina o počtu stupňů volnosti k = n-1. V případě, že počet hodnot ve výběrovém souboru je velký (>30) lze veličinu nahradit normální normovanou náhodnou veličinou. 4) Určení kritické hodnoty testovacího kritéria Pro případ pouhé nerovnosti v alternativní hypotézy určíme kritické hodnoty testovacího kritéria Tkr1 t 2
, k n 1
a
Tkr 2 t
1 , k n 1 2
5) Platnost Ho Pro přijetí nulové hypotézy se musí skutečná hodnota testovacího kritéria vyskytovat mezi kritickými hodnotami t 2
Postup při variantních hypotézách H1: a) H1: > o test jednostranný Body testu 2), 3) budou stejné
, k n 1
T t
1 , k n 1 2
4) Určení kritické hodnoty testovacího kritéria Kritická hodnota bude 5) Platnost Ho Pro přijetí nulové hypotézy se musí skutečná hodnota testovacího kritéria splňovat tvrzení T t1 , k n 1
b) H1: <test jednostranný Body testu 2), 3) budou stejné. 4) Určení kritické hodnoty testovacího kritéria Kritická hodnota bude Tkr t , k n 1
5) Platnost Ho Pro přijetí nulové hypotézy se musí skutečná hodnota testovacího kritéria splňovat tvrzení T t , k n 1
II) Testování tvrzení o vztahu dvou středních hodnot A) Posuzujeme dva náhodné výběry ze základních souborů s normální náhodnou veličinou: Výběr 1: Výběr 2:
x1, x2, …….,xm y1, y2, ……, yn
základní soubor N() základní soubor N(
četnost m četnost n
Předpokládáme rovnost rozptylů v obou základních souborech tj. Postup testu: 1) Formulace hypotéz Ho: alternativní H1: ≠
pro hladinu významnosti test bude oboustranný.
2) Výpočet charakteristik výběrových souborů Z výběrových souborů určíme bodové odhady střední hodnoty základních souborů x1
1 m xi n 1
a
x2
1 n xi 2 n 1
Pokud není známa střední směrodatná odchylka provedeme její bodový odhad. Vzhledem k předpokladu o rozptylu je možné při odhadu rozptylu sloučit oba soubory a určit společnou střední směrodatnou odchylku dle vztahu n 1 n . ( xii1 x1 ) 2 ( xii 2 x2 ) 2 mn2 1 1 a další charakteristikou jsou četnosti ve výběrových souborů m, n.
s
3) Testovací kritérium Vztah mezi vlastnostmi výběrových souborů a základnímu soubory vyhodnotíme vztahem: T
x1 1 x2 2 s.
1 1 m n
x1 x2 1 1 s. m n
Testovací kritérium je popsáno náhodnou veličinou Studentovou a počtu stupňů volnosti k = m+n-2. Poznámka: pro soubory o malých četnostech jsou věrohodnější hodnoty testovacího kritéria, která používají četnosti souborů m-1 a n-1. 4) Určení kritické hodnoty testovacího kritéria Pro případ pouhé nerovnosti v alternativní hypotézy jsou kritické hodnoty testovacího kritéria
Tkr1 t 2
Tkr 2 t
a
,k m n 2
1 , k m n 2 2
5) Platnost Ho Pro přijetí nulové hypotézy se musí skutečná hodnota testovacího kritéria splňovat tvrzení t 2
,k m n 2
T t
1 , k m n 2 2
B) Posuzujeme dva náhodné výběry ze základních souborů s normální náhodnou veličinou: Výběr 1: Výběr 2:
x1, x2, …….,xm y1, y2, ……, yn
četnost m četnost n
základní soubor N() základní soubor N(
Rozptyly v základních souborech jsou různé tj. ≠
Postup testu: 1) Formulace hypotéz Ho: alternativní H1: ≠
pro hladinu významnosti test bude oboustranný.
2) Výpočet charakteristik výběrových souborů Z výběrových souborů určíme bodové odhady střední hodnoty základních souborů 1 m 1 n a x x i xi 2 2 n 1 n 1 Z výběrových souborů určíme bodové odhady středních směrodatných odchylek x1
1
1 m x1i x1 2 m 1 1
1 n x2i x2 n 1 1
2
2
a váhové podíly směrodatných odchylek
1 2 v2 m 1 n 1 společná střední směrodatná odchylka charakterizující variabilitu pomocí dílčích směrodatných odchylek a jejich váhových podílů v1
o
v
2
1
v22
3) Testovací kritérium Vztah mezi vlastnostmi výběrových souborů a základnímu soubory vyhodnotíme vztahem:
x1 x 2 o 4) Kritické hodnoty testovacího kritéria Kritická hodnota bude složena ze dvou kvantilů náhodných veličin typu Studentovy veličiny, které popisují vlastnosti výběrových souborů. Podíl těchto veličin je určen významností charakterizující variabilitu ve výběrech tj. váhovým podílem střední směrodatné odchylky. Pro oboustranný test jsou to kvantily: T
v1 .t Tkr1
2
, k1 m 1
v 2 .t
v 21 v 2 2
2
, k 2 n 1
v1 .t Tkr 2
1 , k1 m 1 2
v 2 .t
1 , k 2 n 1 2
v 21 v 2 2
5) Platnost Ho Pro přijetí nulové hypotézy se musí skutečná hodnota testovacího kritéria splňovat tvrzení Tkr1 T Tkr 2