Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H0: veličiny X, Y jsou nezávislé zamítneme, když se pozorované četnosti nij budou významně lišit od očekávaných četností eij . r
Testovým kritériem je statistika
s
χ2 = ∑∑ i =1 j =1
( nij − eij ) 2 eij
,
která má asymptoticky tj. pro dostatečně velké četnosti, rozdělení χ2 s (r - 1)(s - 1) stupni volnosti. Dostatečně velké četnosti jsou takové, kdy všechny očekávané četnosti jsou > 1 a naprostá většina očekávaných četností (alespoň 80%) je > 5.
Test můžeme použít pro nominální data (barva očí x barva vlasů) nebo pro data spojitá, která roztřídíme do vhodných intervalů (výška x váha) nebo pro jejich kombinaci.
Příklad 1: Skupina 90 žáků odpovídala na otázku, který z předmětů matematika, fyzika a chemie je jeho nejoblíbenější. Rozhodněte, zda je v oblibě těchto předmětů statisticky významný rozdíl. Vyučovací Pozorovaná Očekávaná P - O (P-O)2 četnost P četnost O předmět fyzika 35 30 5 25 chemie 28 30 -2 4 matematika 27 30 -3 9 Suma 90 90
(P-O)2 /O 0,833 0,133 0,300 1,267
Vypočtenou statistiku 1,267 porovnáme s kritickou hodnotou chíkvadrát pro počet stupňů volnosti = 2
Na hladině spolehlivosti 95% (hladině významnosti 5%) je to 5,99. H0 nemůžeme zamítnout, protože vypočtená statistika < Chí-kvadrát kritická (1,267 < 5,99) Ověříme ještě funkcí v programu Excel: CHITEST = 0,53
Příklad 2: Skupině 190 učitelů byla položena otázka, zda by souhlasili s jistým organizačním opatřením. Odpovědi učitelů byly rozděleny podle odpovědi a věku do následující tabulky a máme rozhodnout, zda výsledná odpověď závisí na věku učitele. pozorované četnosti plně souhlasím souhlasím nesouhlasím naprosto nesouhlasím Celkem
do 25
25 - 40 nad 40
Celkem
29 23 12
16 14 13
8 11 23
53 48 48
10
13
18
41
74
56
60
190
Vypočteme očekávané četnosti jako součin marginálních četností dělených počtem všech odpovědí. Marginální četnosti jsou stejné u pozorovaných i očekávaných četností. Způsob 1: (Pozorované očekávané četnosti)2 / do 25 očekávané plně souhlasím 3,4 souhlasím 1,0 nesouhlasím 2,4 naprosto nesouhlasím 2,2 Suma 9,0
25 - 40
nad 40
Celkem
0,0 0,0 0,1 0,1 0,2
4,6 1,1 4,1 2,0 11,7
8,0 2,1 6,5 4,3 20,9
2
V této tabulce jsme vypočetli testovací statistiku χ pomocí čtverců rozdílů pozorovaných a očekávaných četností dělených očekávanými četnostmi.
Uvnitř tabulky jsou příspěvky jednotlivých políček, v dolním pravém políčku (zeleně) je námi vypočtená testová statistika. Počet stupňů volnosti je součin (r-1)*(s-1), kde r je počet řádků a s počet sloupců tabulky. V tabulce rozdělení chí-kvadrát nebo funkcí v programu Excel najdeme kritickou hodnotu pro 6 stupňů volnosti a hladinu významnosti 5% (resp. hladinu spolehlivosti 95%): 12,59 Vypočtená statistika je větší než kritická hodnota -> nulovou hypotézu na hladině významnosti 95% zamítáme. Tímto způsobem jsme vypočítali testovací statistiku sami a porovnávali s tabelovanými 2
hodnotami ve statistických tabulkách funkce χ .
Způsob 2: Jednodušší je vypočítat pouze očekávané četnosti a dosadit skutečné a očekávané četnosti do funkce CHITEST v Excelu. Pomocí této funkce vypočteme pravděpodobnost (p-hodnotu), s jakou uděláme chybu I. druhu, když zamítneme nulovou hypotézu. V našem případě vyšlo p = 0,0019 tj. pravděpodobnost je velmi malá, test je statisticky významný, H0 zamítáme.
Příklad 3: Bylo sledováno 8 940 těhotných žen a průběh porodu byl hodnocen stupněm: fyziologický, ohrožený a patologický (nominální veličina). V souvislosti s pořadím těhotenství byla testována hypotéza, zda průběh porodu závisí na pořadí těhotenství. Výsledky jsou v souboru: 6h_chi-kvadrat_prubeh_porodu.xls.
Příklad 4: V porodnici sledovali během 1 roku váhu narozených dětí a lékaře zajímalo, zda váha novorozence závisí na pohlaví dítěte. Z dat vytvořili tuto tabulku a půlka lékařů tvrdila, že váha nezávisí na pohlaví, čtvrtina, že porodní váha chlapců je významně vyšší než u holčiček a čtvrtina, že porodní váha holčiček je významně vyšší než u chlapců. Rozhodněte, která skupina lékařů obhajovala tzv. nulovou hypotézu a která skupina lékařů měla pravdu. V následujících tabulkách jsou výsledky statistického sledování rozdělené do různých kategorií. Výsledky viz: 6i_chi-kvadrat_deti.xls
do 2 kg 2 - 2,5 kg 2,5 - 3 kg 3 - 3,5 kg 3,5 - 4 kg nad 4 kg Chlapečci 21 68 185 190 111 17 Holčičky 16 80 125 230 115 22 Celkem 37 148 310 420 226 39 Váha
Váha Chlapečci Holčičky Celkem
do 2 kg 21 16 37
2 - 3 kg 253 205 458
3 - 4 kg 301 345 646
Váha do 3 kg Chlapečci 274 Holčičky 221 Celkem 495
nad 3 kg 318 367 685
Celkem 592 588 1180
nad 4 kg 17 22 39
Celkem 592 588 1180
Celkem 592 588 1180