Rann´ı uvahy o statistice ´ ´ Neupln´ ke cˇ ten´ı statistick´ych v´ysledku˚ ´ y navod
Duˇsan Merta
ˇ kveten 2016
´ cˇ eka´ Co nas
1
´ Zakladn´ ı pojmy
2
´ ı hypotez ´ Testovan´
3
Confidence interval
4
Odds ratio
2 / 26
´ Zakladn´ ı pojmy
´ Zakladn´ ı pojmy
3 / 26
´ Zakladn´ ı pojmy ´ modus, smerodatn ˇ median, ˇ m´ıry polohy – prum ˚ er, a´ odchylka, rozptyl, IQR, . . .
´ Zakladn´ ı pojmy
4 / 26
´ Zakladn´ ı pojmy ´ modus, smerodatn ˇ median, ˇ m´ıry polohy – prum ˚ er, a´ odchylka, rozptyl, IQR, . . . v u N u 1 X t (xi − x)2 s= N −1 i=1
´ Zakladn´ ı pojmy
4 / 26
´ Zakladn´ ı pojmy ´ modus, smerodatn ˇ median, ˇ m´ıry polohy – prum ˚ er, a´ odchylka, rozptyl, IQR, . . . rozloˇzen´ı
´ Zakladn´ ı pojmy
4 / 26
´ Zakladn´ ı pojmy ´ modus, smerodatn ˇ median, ˇ m´ıry polohy – prum ˚ er, a´ odchylka, rozptyl, IQR, . . . rozloˇzen´ı
´ Zakladn´ ı pojmy
4 / 26
´ Zakladn´ ı pojmy ´ modus, smerodatn ˇ median, ˇ m´ıry polohy – prum ˚ er, a´ odchylka, rozptyl, IQR, . . . rozloˇzen´ı
´ Zakladn´ ı pojmy
4 / 26
´ Zakladn´ ı pojmy ´ modus, smerodatn ˇ median, ˇ m´ıry polohy – prum ˚ er, a´ odchylka, rozptyl, IQR, . . . rozloˇzen´ı
´ Zakladn´ ı pojmy
4 / 26
´ ı hypotez ´ Testovan´ ´ Nulova´ a alternativn´ı hypoteza Hladina v´yznamnosti Chyba I. a II. druhu
´ ı hypotez ´ Testovan´
5 / 26
´ Nulova´ a alternativn´ı hypoteza ˇ sinou porovnav ´ ame ´ vetˇ dveˇ skupiny ´ rene´ srovnan´ ´ ı – efekt cˇ ´ıselneˇ vyjadˇ ˇ e´ telesn ˇ rozd´ıl prum e´ v´ysˇ ky muˇzu˚ a zˇ en ˚ ern
neexistence rozd´ılu mezi skupinami (nulov´y efekt) – ´ nulova´ hypoteza ˇ sinou nam ´ jde o prokaz ´ an´ ´ ı opaku vetˇ ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en je stejn´y.“ ˚ er ”
existence rozd´ılu (nenulov´y efekt) – alternativn´ı ´ hypoteza ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en se liˇs´ı.“ ˚ er ”
´ zeme jak nepravdepodobn ˇ ´ a ukaˇ a´ je nulova´ hypoteza ´ zeme alternativn´ı t´ım prokaˇ
´ ı hypotez ´ Testovan´
´ Nulova´ a alternativn´ı hypoteza
6 / 26
´ Nulova´ a alternativn´ı hypoteza ˇ sinou porovnav ´ ame ´ vetˇ dveˇ skupiny ´ rene´ srovnan´ ´ ı – efekt cˇ ´ıselneˇ vyjadˇ ˇ e´ telesn ˇ rozd´ıl prum e´ v´ysˇ ky muˇzu˚ a zˇ en ˚ ern
neexistence rozd´ılu mezi skupinami (nulov´y efekt) – ´ nulova´ hypoteza ˇ sinou nam ´ jde o prokaz ´ an´ ´ ı opaku vetˇ ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en je stejn´y.“ ˚ er ”
existence rozd´ılu (nenulov´y efekt) – alternativn´ı ´ hypoteza ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en se liˇs´ı.“ ˚ er ”
´ zeme jak nepravdepodobn ˇ ´ a ukaˇ a´ je nulova´ hypoteza ´ zeme alternativn´ı t´ım prokaˇ
´ ı hypotez ´ Testovan´
´ Nulova´ a alternativn´ı hypoteza
6 / 26
´ Nulova´ a alternativn´ı hypoteza ˇ sinou porovnav ´ ame ´ vetˇ dveˇ skupiny ´ rene´ srovnan´ ´ ı – efekt cˇ ´ıselneˇ vyjadˇ ˇ e´ telesn ˇ rozd´ıl prum e´ v´ysˇ ky muˇzu˚ a zˇ en ˚ ern
neexistence rozd´ılu mezi skupinami (nulov´y efekt) – ´ nulova´ hypoteza ˇ sinou nam ´ jde o prokaz ´ an´ ´ ı opaku vetˇ ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en je stejn´y.“ ˚ er ”
existence rozd´ılu (nenulov´y efekt) – alternativn´ı ´ hypoteza ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en se liˇs´ı.“ ˚ er ”
´ zeme jak nepravdepodobn ˇ ´ a ukaˇ a´ je nulova´ hypoteza ´ zeme alternativn´ı t´ım prokaˇ
´ ı hypotez ´ Testovan´
´ Nulova´ a alternativn´ı hypoteza
6 / 26
´ Nulova´ a alternativn´ı hypoteza ˇ sinou porovnav ´ ame ´ vetˇ dveˇ skupiny ´ rene´ srovnan´ ´ ı – efekt cˇ ´ıselneˇ vyjadˇ ˇ e´ telesn ˇ rozd´ıl prum e´ v´ysˇ ky muˇzu˚ a zˇ en ˚ ern
neexistence rozd´ılu mezi skupinami (nulov´y efekt) – ´ nulova´ hypoteza ˇ sinou nam ´ jde o prokaz ´ an´ ´ ı opaku vetˇ ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en je stejn´y.“ ˚ er ”
existence rozd´ılu (nenulov´y efekt) – alternativn´ı ´ hypoteza ˇ telesn ˇ Prum e´ v´ysˇ ky muˇzu˚ a zˇ en se liˇs´ı.“ ˚ er ”
´ zeme jak nepravdepodobn ˇ ´ a ukaˇ a´ je nulova´ hypoteza ´ zeme alternativn´ı t´ım prokaˇ
´ ı hypotez ´ Testovan´
´ Nulova´ a alternativn´ı hypoteza
6 / 26
Hladina v´yznamnosti (p-value, p-level) ˇ ame ´ ´ ´ ery ˇ o cele´ populaci del zav na zaklad eˇ ˇ ıho vyb ˇ populacn´ ´ eru Hladina v´yznamnosti (p-value, p-level) ˇ pravdepodobnost s jakou dostaneme pozorovan´y (nebo ˇ s´ı) rozd´ıl (efekt) pˇri platnosti nulove´ hypotezy ´ vetˇ ´ (tj. nahodou“) ” obvykle vyjadˇrujeme v procentech (p = 5%) nebo ´ lepe desetinn´ym cˇ ´ıslem (p = 0, 05) ˇ ı dohody – obvykle co je statisticky v´yznamne´ je vec´ p < 0, 05 nebo p < 0, 01 ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat ´ ı hypotez ´ Testovan´
Hladina v´yznamnosti
7 / 26
Hladina v´yznamnosti (p-value, p-level) ˇ ame ´ ´ ´ ery ˇ o cele´ populaci del zav na zaklad eˇ ˇ ıho vyb ˇ populacn´ ´ eru Hladina v´yznamnosti (p-value, p-level) ˇ pravdepodobnost s jakou dostaneme pozorovan´y (nebo ˇ s´ı) rozd´ıl (efekt) pˇri platnosti nulove´ hypotezy ´ vetˇ ´ (tj. nahodou“) ” obvykle vyjadˇrujeme v procentech (p = 5%) nebo ´ lepe desetinn´ym cˇ ´ıslem (p = 0, 05) ˇ ı dohody – obvykle co je statisticky v´yznamne´ je vec´ p < 0, 05 nebo p < 0, 01 ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat ´ ı hypotez ´ Testovan´
Hladina v´yznamnosti
7 / 26
Hladina v´yznamnosti (p-value, p-level) ˇ ame ´ ´ ´ ery ˇ o cele´ populaci del zav na zaklad eˇ ˇ ıho vyb ˇ populacn´ ´ eru Hladina v´yznamnosti (p-value, p-level) ˇ pravdepodobnost s jakou dostaneme pozorovan´y (nebo ˇ s´ı) rozd´ıl (efekt) pˇri platnosti nulove´ hypotezy ´ vetˇ ´ (tj. nahodou“) ” obvykle vyjadˇrujeme v procentech (p = 5%) nebo ´ lepe desetinn´ym cˇ ´ıslem (p = 0, 05) ˇ ı dohody – obvykle co je statisticky v´yznamne´ je vec´ p < 0, 05 nebo p < 0, 01 ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat ´ ı hypotez ´ Testovan´
Hladina v´yznamnosti
7 / 26
Hladina v´yznamnosti (p-value, p-level) ˇ ame ´ ´ ´ ery ˇ o cele´ populaci del zav na zaklad eˇ ˇ ıho vyb ˇ populacn´ ´ eru Hladina v´yznamnosti (p-value, p-level) ˇ pravdepodobnost s jakou dostaneme pozorovan´y (nebo ˇ s´ı) rozd´ıl (efekt) pˇri platnosti nulove´ hypotezy ´ vetˇ ´ (tj. nahodou“) ” obvykle vyjadˇrujeme v procentech (p = 5%) nebo ´ lepe desetinn´ym cˇ ´ıslem (p = 0, 05) ˇ ı dohody – obvykle co je statisticky v´yznamne´ je vec´ p < 0, 05 nebo p < 0, 01 ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat ´ ı hypotez ´ Testovan´
Hladina v´yznamnosti
7 / 26
Hladina v´yznamnosti (p-value, p-level) ˇ ame ´ ´ ´ ery ˇ o cele´ populaci del zav na zaklad eˇ ˇ ıho vyb ˇ populacn´ ´ eru Hladina v´yznamnosti (p-value, p-level) ˇ pravdepodobnost s jakou dostaneme pozorovan´y (nebo ˇ s´ı) rozd´ıl (efekt) pˇri platnosti nulove´ hypotezy ´ vetˇ ´ (tj. nahodou“) ” obvykle vyjadˇrujeme v procentech (p = 5%) nebo ´ lepe desetinn´ym cˇ ´ıslem (p = 0, 05) ˇ ı dohody – obvykle co je statisticky v´yznamne´ je vec´ p < 0, 05 nebo p < 0, 01 ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat ´ ı hypotez ´ Testovan´
Hladina v´yznamnosti
7 / 26
Hladina v´yznamnosti ´ Historicke´ souvislosti – pozdn´ı 20. leta
R ONALD F ISHER ˇ y a hroziv´y Neymanuv ˚ pˇr´ıstup detsk´ ” ´ ı svobodu zapadu.“ ´ pro intelektualn´ ´ ı hypotez ´ Testovan´
E GON P EARSON , J ERZY N EYMAN ´ horˇs´ı neˇz Fisherova prace ” ´ neuˇziteˇcna.“ Historicke´ souvislosti
8 / 26
Hladina v´yznamnosti (p-value, p-level) ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat
´ ı hypotez ´ Testovan´
Pˇr´ıklady
9 / 26
Hladina v´yznamnosti (p-value, p-level) ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat N = 2000, ♂ 180cm, ♀ 167cm
´ ı hypotez ´ Testovan´
Pˇr´ıklady
9 / 26
Hladina v´yznamnosti (p-value, p-level) ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat N = 2000, ♂ 180cm, ♀ 167cm n = 12, ♂ 185cm, ♀ 170cm p = 0, 01
´ ı hypotez ´ Testovan´
Pˇr´ıklady
9 / 26
Hladina v´yznamnosti (p-value, p-level) ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat N = 2000, ♂ 180cm, ♀ 167cm n = 12, ♂ 185cm, ♀ 170cm p = 0, 01
n = 18, ♂ 182cm, ♀ 165cm p = 0, 001
´ ı hypotez ´ Testovan´
Pˇr´ıklady
9 / 26
Hladina v´yznamnosti (p-value, p-level) ´ ı na typu dat, velikosti vyb ˇ zavis´ ´ eru, velikosti efektu, rozloˇzen´ı dat N = 2000, ♂ 180cm, ♀ 167cm n = 207, ♂ 181cm, ♀ 167cm p ∼ 10−16
n = 192, ♂ 180cm, ♀ 167cm p ∼ 10−16
´ ı hypotez ´ Testovan´
Pˇr´ıklady
9 / 26
Hladina v´yznamnosti p = 0, 05
´ Co to neznamena?
´ Co to znamena? ˇ Pravdepodobnost 5%, zˇ e pˇri platnosti ´ nameˇ ˇ r´ıme rozd´ıl (efekt) nulove´ hypotezy ˇ s´ı) jako jsme z´ıskali (nebo dokonce vetˇ ´ pouhou nahodou.
´ e“. ˇ 95% jistotu, zˇ e v´ysledek je spravn ” ˇ statisticky v´yznamn´y efekt ma´ realn´ ´ y Ze (klinick´y) v´yznam. ˇ pokud mame ´ Ze 20 v´ysledku˚ s p = 0, 05, ´ je jeden z nich nahodn´ y. ˇ (Pravdepodobnost toho je 64%.)
´ ı hypotez ´ Testovan´
´ Co to znamena´ a neznamena?
10 / 26
Hladina v´yznamnosti p = 0, 05
´ Co to neznamena?
´ Co to znamena? ˇ Pravdepodobnost 5%, zˇ e pˇri platnosti ´ nameˇ ˇ r´ıme rozd´ıl (efekt) nulove´ hypotezy ˇ s´ı) jako jsme z´ıskali (nebo dokonce vetˇ ´ pouhou nahodou.
´ e“. ˇ 95% jistotu, zˇ e v´ysledek je spravn ” ˇ statisticky v´yznamn´y efekt ma´ realn´ ´ y Ze (klinick´y) v´yznam. ˇ pokud mame ´ Ze 20 v´ysledku˚ s p = 0, 05, ´ je jeden z nich nahodn´ y. ˇ (Pravdepodobnost toho je 64%.)
´ ı hypotez ´ Testovan´
´ Co to znamena´ a neznamena?
10 / 26
Hladina v´yznamnosti p = 0, 05
´ Co to neznamena?
´ Co to znamena? ˇ Pravdepodobnost 5%, zˇ e pˇri platnosti ´ nameˇ ˇ r´ıme rozd´ıl (efekt) nulove´ hypotezy ˇ s´ı) jako jsme z´ıskali (nebo dokonce vetˇ ´ pouhou nahodou.
´ e“. ˇ 95% jistotu, zˇ e v´ysledek je spravn ” ˇ statisticky v´yznamn´y efekt ma´ realn´ ´ y Ze (klinick´y) v´yznam. ˇ pokud mame ´ Ze 20 v´ysledku˚ s p = 0, 05, ´ je jeden z nich nahodn´ y. ˇ (Pravdepodobnost toho je 64%.)
´ ı hypotez ´ Testovan´
´ Co to znamena´ a neznamena?
10 / 26
Hladina v´yznamnosti p = 0, 05
´ Co to neznamena?
´ Co to znamena? ˇ Pravdepodobnost 5%, zˇ e pˇri platnosti ´ nameˇ ˇ r´ıme rozd´ıl (efekt) nulove´ hypotezy ˇ s´ı) jako jsme z´ıskali (nebo dokonce vetˇ ´ pouhou nahodou.
´ e“. ˇ 95% jistotu, zˇ e v´ysledek je spravn ” ˇ statisticky v´yznamn´y efekt ma´ realn´ ´ y Ze (klinick´y) v´yznam. ˇ pokud mame ´ Ze 20 v´ysledku˚ s p = 0, 05, ´ je jeden z nich nahodn´ y. ˇ (Pravdepodobnost toho je 64%.)
´ ı hypotez ´ Testovan´
´ Co to znamena´ a neznamena?
10 / 26
Hladina v´yznamnosti p = 0, 05
´ Co to neznamena?
´ Co to znamena? ˇ Pravdepodobnost 5%, zˇ e pˇri platnosti ´ nameˇ ˇ r´ıme rozd´ıl (efekt) nulove´ hypotezy ˇ s´ı) jako jsme z´ıskali (nebo dokonce vetˇ ´ pouhou nahodou.
´ e“. ˇ 95% jistotu, zˇ e v´ysledek je spravn ” ˇ statisticky v´yznamn´y efekt ma´ realn´ ´ y Ze (klinick´y) v´yznam. ˇ pokud mame ´ Ze 20 v´ysledku˚ s p = 0, 05, ´ je jeden z nich nahodn´ y. ˇ (Pravdepodobnost toho je 64%.)
´ ı hypotez ´ Testovan´
´ Co to znamena´ a neznamena?
10 / 26
Hladina v´yznamnosti p = 0, 05
´ Co to neznamena?
´ Co to znamena? ˇ Pravdepodobnost 5%, zˇ e pˇri platnosti ´ nameˇ ˇ r´ıme rozd´ıl (efekt) nulove´ hypotezy ˇ s´ı) jako jsme z´ıskali (nebo dokonce vetˇ ´ pouhou nahodou.
´ e“. ˇ 95% jistotu, zˇ e v´ysledek je spravn ” ˇ statisticky v´yznamn´y efekt ma´ realn´ ´ y Ze (klinick´y) v´yznam. ˇ pokud mame ´ Ze 20 v´ysledku˚ s p = 0, 05, ´ je jeden z nich nahodn´ y. ˇ (Pravdepodobnost toho je 64%.) P20 = 1 − 0, 9520 = 0, 64
´ ı hypotez ´ Testovan´
´ Co to znamena´ a neznamena?
10 / 26
1
Nature, Vol 506, 13. unora 2014 ´
Chyba I. a II. druhu Chyba I. druhu
Chyba II. druhu
´ z´ıskame v´yznamn´y v´ysledek a ´ zam´ıtneme nulovou hypotezu, ktera´ ve skuteˇcnosti plat´ı ˇ jej´ı pravdepodobnost: α
´ z´ıskame nev´yznamn´y v´ysledek, ´ ve pˇrestoˇze nulova´ hypoteza skuteˇcnosti neplat´ı ˇ jej´ı pravdepodobnost: β
p∼α
s´ıla testu: 1 − β
Zachyt´ıme efekt, kter´y ve skuteˇcnosti neexistuje.
Nezachyt´ıme efekt, kter´y ve skuteˇcnosti existuje.
´ ı hypotez ´ Testovan´
Chyba I. a II. druhu
12 / 26
Chyba I. a II. druhu Chyba I. druhu
Chyba II. druhu
´ z´ıskame v´yznamn´y v´ysledek a ´ zam´ıtneme nulovou hypotezu, ktera´ ve skuteˇcnosti plat´ı ˇ jej´ı pravdepodobnost: α
´ z´ıskame nev´yznamn´y v´ysledek, ´ ve pˇrestoˇze nulova´ hypoteza skuteˇcnosti neplat´ı ˇ jej´ı pravdepodobnost: β
p∼α
s´ıla testu: 1 − β
Zachyt´ıme efekt, kter´y ve skuteˇcnosti neexistuje.
Nezachyt´ıme efekt, kter´y ve skuteˇcnosti existuje.
´ ı hypotez ´ Testovan´
Chyba I. a II. druhu
12 / 26
Chyba I. a II. druhu Chyba I. druhu
Chyba II. druhu
´ z´ıskame v´yznamn´y v´ysledek a ´ zam´ıtneme nulovou hypotezu, ktera´ ve skuteˇcnosti plat´ı ˇ jej´ı pravdepodobnost: α
´ z´ıskame nev´yznamn´y v´ysledek, ´ ve pˇrestoˇze nulova´ hypoteza skuteˇcnosti neplat´ı ˇ jej´ı pravdepodobnost: β
p∼α
s´ıla testu: 1 − β
Zachyt´ıme efekt, kter´y ve skuteˇcnosti neexistuje.
Nezachyt´ıme efekt, kter´y ve skuteˇcnosti existuje.
´ ı hypotez ´ Testovan´
Chyba I. a II. druhu
12 / 26
Chyba I. a II. druhu Chyba I. druhu
Chyba II. druhu
´ z´ıskame v´yznamn´y v´ysledek a ´ zam´ıtneme nulovou hypotezu, ktera´ ve skuteˇcnosti plat´ı ˇ jej´ı pravdepodobnost: α
´ z´ıskame nev´yznamn´y v´ysledek, ´ ve pˇrestoˇze nulova´ hypoteza skuteˇcnosti neplat´ı ˇ jej´ı pravdepodobnost: β
p∼α
s´ıla testu: 1 − β
Zachyt´ıme efekt, kter´y ve skuteˇcnosti neexistuje.
Nezachyt´ıme efekt, kter´y ve skuteˇcnosti existuje.
´ ı hypotez ´ Testovan´
Chyba I. a II. druhu
12 / 26
Chyba I. a II. druhu
ˇ skutecnost rozhodnut´ı
H0 plat´ı nezam´ıtneme H0 (nev´yznamn´y v´ysledek) zam´ıtneme H0 (v´yznamn´y v´ysledek)
´ eˇ spravn
chyba I. druhu ˇ pravdepodobnost α
´ ı hypotez ´ Testovan´
Chyba I. a II. druhu
H0 neplat´ı chyba II. druhu β
ˇ pravdepodobnost ´ eˇ spravn
13 / 26
Chyba II. druhu (β)
Chyba I. druhu (α)
´ ı hypotez ´ Testovan´
Chyba I. a II. druhu
14 / 26
Confidence interval ˇ pˇri normaln´ ´ ım rozdelen´ ˇ ı CI prum ˚ eru ˇ u˚ dvou skupin CI rozd´ılu prum ˚ er
Confidence interval
15 / 26
Interval spolehlivosti (confidence interval) ˇ median, ´ . . . (obecneˇ m´ıry polohy) pro celou populaci odhadujeme na prum ˚ er, ´ ˇ ´ ˇ z populace zaklad eˇ prum medianu, . . . v´yberu ˚ eru, ˇ dostaneme jin´y v´ysledek pokud zvol´ıme jin´y v´yber, ´ interval spolehlivosti urˇcuje rozsah, do ktereho se se zvolenou jistotou ˇ median, ´ . . . spoˇcten´y z naˇseho v´yberu ˇ (obvykle 95%) tref´ı prum ˚ er, ´ ı na rozloˇzen´ı dat, velikosti vyb ˇ ˇ zavis´ ´ eru, zvolene´ pravdepodobnosti ´ ren´ı statisticke´ v´yznamnosti naˇseho da´ se pouˇz´ıt jako jin´y zpusob vyjadˇ ˚ v´ysledku 95%CI ↔ p = 0, 05 ˇ u˚ (v pravdepodobnostn´ ˇ ˇ ve 19 z 20 v´yber ım smyslu) bude m´ıt prum ˚ er ´ intervalu vypoˇctenem
Confidence interval
Definice
16 / 26
Interval spolehlivosti (confidence interval) ˇ median, ´ . . . (obecneˇ m´ıry polohy) pro celou populaci odhadujeme na prum ˚ er, ´ ˇ ´ ˇ z populace zaklad eˇ prum medianu, . . . v´yberu ˚ eru, ˇ dostaneme jin´y v´ysledek pokud zvol´ıme jin´y v´yber, ´ interval spolehlivosti urˇcuje rozsah, do ktereho se se zvolenou jistotou ˇ median, ´ . . . spoˇcten´y z naˇseho v´yberu ˇ (obvykle 95%) tref´ı prum ˚ er, ´ ı na rozloˇzen´ı dat, velikosti vyb ˇ ˇ zavis´ ´ eru, zvolene´ pravdepodobnosti ´ ren´ı statisticke´ v´yznamnosti naˇseho da´ se pouˇz´ıt jako jin´y zpusob vyjadˇ ˚ v´ysledku 95%CI ↔ p = 0, 05 ˇ u˚ (v pravdepodobnostn´ ˇ ˇ ve 19 z 20 v´yber ım smyslu) bude m´ıt prum ˚ er ´ intervalu vypoˇctenem
Confidence interval
Definice
16 / 26
Interval spolehlivosti (confidence interval) ˇ median, ´ . . . (obecneˇ m´ıry polohy) pro celou populaci odhadujeme na prum ˚ er, ´ ˇ ´ ˇ z populace zaklad eˇ prum medianu, . . . v´yberu ˚ eru, ˇ dostaneme jin´y v´ysledek pokud zvol´ıme jin´y v´yber, ´ interval spolehlivosti urˇcuje rozsah, do ktereho se se zvolenou jistotou ˇ median, ´ . . . spoˇcten´y z naˇseho v´yberu ˇ (obvykle 95%) tref´ı prum ˚ er, ´ ı na rozloˇzen´ı dat, velikosti vyb ˇ ˇ zavis´ ´ eru, zvolene´ pravdepodobnosti ´ ren´ı statisticke´ v´yznamnosti naˇseho da´ se pouˇz´ıt jako jin´y zpusob vyjadˇ ˚ v´ysledku 95%CI ↔ p = 0, 05 ˇ u˚ (v pravdepodobnostn´ ˇ ˇ ve 19 z 20 v´yber ım smyslu) bude m´ıt prum ˚ er ´ intervalu vypoˇctenem
Confidence interval
Definice
16 / 26
Interval spolehlivosti (confidence interval) ˇ median, ´ . . . (obecneˇ m´ıry polohy) pro celou populaci odhadujeme na prum ˚ er, ´ ˇ ´ ˇ z populace zaklad eˇ prum medianu, . . . v´yberu ˚ eru, ˇ dostaneme jin´y v´ysledek pokud zvol´ıme jin´y v´yber, ´ interval spolehlivosti urˇcuje rozsah, do ktereho se se zvolenou jistotou ˇ median, ´ . . . spoˇcten´y z naˇseho v´yberu ˇ (obvykle 95%) tref´ı prum ˚ er, ´ ı na rozloˇzen´ı dat, velikosti vyb ˇ ˇ zavis´ ´ eru, zvolene´ pravdepodobnosti ´ ren´ı statisticke´ v´yznamnosti naˇseho da´ se pouˇz´ıt jako jin´y zpusob vyjadˇ ˚ v´ysledku 95%CI ↔ p = 0, 05 ˇ u˚ (v pravdepodobnostn´ ˇ ˇ ve 19 z 20 v´yber ım smyslu) bude m´ıt prum ˚ er ´ intervalu vypoˇctenem
Confidence interval
Definice
16 / 26
Interval spolehlivosti (confidence interval) ˇ median, ´ . . . (obecneˇ m´ıry polohy) pro celou populaci odhadujeme na prum ˚ er, ´ ˇ ´ ˇ z populace zaklad eˇ prum medianu, . . . v´yberu ˚ eru, ˇ dostaneme jin´y v´ysledek pokud zvol´ıme jin´y v´yber, ´ interval spolehlivosti urˇcuje rozsah, do ktereho se se zvolenou jistotou ˇ median, ´ . . . spoˇcten´y z naˇseho v´yberu ˇ (obvykle 95%) tref´ı prum ˚ er, ´ ı na rozloˇzen´ı dat, velikosti vyb ˇ ˇ zavis´ ´ eru, zvolene´ pravdepodobnosti ´ ren´ı statisticke´ v´yznamnosti naˇseho da´ se pouˇz´ıt jako jin´y zpusob vyjadˇ ˚ v´ysledku 95%CI ↔ p = 0, 05 ˇ u˚ (v pravdepodobnostn´ ˇ ˇ ve 19 z 20 v´yber ım smyslu) bude m´ıt prum ˚ er ´ intervalu vypoˇctenem
Confidence interval
Definice
16 / 26
Interval spolehlivosti (confidence interval) ´ ı rozdelen´ ˇ ı a CI prum ˇ Normaln´ ˚ eru
Confidence interval
ˇ pˇri normaln´ ´ ım rozdelen´ ˇ ı CI prum ˚ eru
17 / 26
Interval spolehlivosti (confidence interval) ˇ u˚ Rozd´ıl prum ˚ er
V´yznamn´y rozd´ıl
Nev´yznamn´y rozd´ıl
♂ 181 cm, ♀ 167 cm, p = 2, 2 · 10−16 ∆ = 14 cm (95% CI: 11, 6 - 16, 0) neobsahuje nulu
P-ha 180 cm, OV 181 cm, p = 0, 48 ∆ = 1 cm (95% CI: −2, 1 - 1, 0) obsahuje nulu
Confidence interval
ˇ u˚ dvou skupin CI rozd´ılu prum ˚ er
18 / 26
Interval spolehlivosti (confidence interval) ˇ u˚ Rozd´ıl prum ˚ er
Nev´yznamn´y rozd´ıl
V´yznamn´y rozd´ıl
♂ 181 cm, ♀ 167 cm, p = 2, 2 · 10−16 ∆ = 14 cm (95% CI: 11, 6 - 16, 0) neobsahuje nulu
P-ha 180 cm, OV 181 cm, p = 0, 48 ∆ = 1 cm (95% CI: −2, 1 - 1, 0) obsahuje nulu
Confidence interval
ˇ u˚ dvou skupin CI rozd´ılu prum ˚ er
18 / 26
Interval spolehlivosti (confidence interval) ˇ u˚ Rozd´ıl prum ˚ er
Nev´yznamn´y rozd´ıl
V´yznamn´y rozd´ıl
♂ 181 cm, ♀ 167 cm, p = 2, 2 · 10−16 ∆ = 14 cm (95% CI: 11, 6 - 16, 0) neobsahuje nulu
P-ha 180 cm, OV 181 cm, p = 0, 48 ∆ = 1 cm (95% CI: −2, 1 - 1, 0) obsahuje nulu
Confidence interval
ˇ u˚ dvou skupin CI rozd´ılu prum ˚ er
18 / 26
Odds ratio ˇ ˇ Sance a pravdepodobnost ˇ rpoln´ı tabulka Ctyˇ
Odds ratio
19 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ ˇ Sance a pravdepodobnost
´ sˇ ance daneho jevu vyjadˇrujeme napˇr. jako 1 : 3 1 ˇ = 14 pravdepodobnost jevu je potom 1+3 O(A) = P(A) =
P(A) P(A) = P(¬A) 1 − P(A) O(A) 1 + O(A)
´ ˇ v medic´ıneˇ pouˇz´ıvame obvykle pod´ıl sanc´ ı – odds ratio (OR) ´ ´ (jev B) k sˇ anci na nador ´ napˇr. sˇ ance na nador plic (jev A) u kuˇraka plic u ´ (jev ¬B) nekuˇraka
OR = Odds ratio
O(A|B) O(A|¬B) ˇ ˇ Sance a pravdepodobnost
20 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ ˇ Sance a pravdepodobnost
´ sˇ ance daneho jevu vyjadˇrujeme napˇr. jako 1 : 3 1 ˇ = 14 pravdepodobnost jevu je potom 1+3 O(A) = P(A) =
P(A) P(A) = P(¬A) 1 − P(A) O(A) 1 + O(A)
´ ˇ v medic´ıneˇ pouˇz´ıvame obvykle pod´ıl sanc´ ı – odds ratio (OR) ´ ´ (jev B) k sˇ anci na nador ´ napˇr. sˇ ance na nador plic (jev A) u kuˇraka plic u ´ (jev ¬B) nekuˇraka
OR = Odds ratio
O(A|B) O(A|¬B) ˇ ˇ Sance a pravdepodobnost
20 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ ˇ Sance a pravdepodobnost
´ sˇ ance daneho jevu vyjadˇrujeme napˇr. jako 1 : 3 1 ˇ = 14 pravdepodobnost jevu je potom 1+3 O(A) = P(A) =
P(A) P(A) = P(¬A) 1 − P(A) O(A) 1 + O(A)
´ ˇ v medic´ıneˇ pouˇz´ıvame obvykle pod´ıl sanc´ ı – odds ratio (OR) ´ ´ (jev B) k sˇ anci na nador ´ napˇr. sˇ ance na nador plic (jev A) u kuˇraka plic u ´ (jev ¬B) nekuˇraka
OR = Odds ratio
O(A|B) O(A|¬B) ˇ ˇ Sance a pravdepodobnost
20 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ ˇ Sance a pravdepodobnost
´ sˇ ance daneho jevu vyjadˇrujeme napˇr. jako 1 : 3 1 ˇ = 14 pravdepodobnost jevu je potom 1+3 O(A) = P(A) =
P(A) P(A) = P(¬A) 1 − P(A) O(A) 1 + O(A)
´ ˇ v medic´ıneˇ pouˇz´ıvame obvykle pod´ıl sanc´ ı – odds ratio (OR) ´ ´ (jev B) k sˇ anci na nador ´ napˇr. sˇ ance na nador plic (jev A) u kuˇraka plic u ´ (jev ¬B) nekuˇraka
OR = Odds ratio
O(A|B) O(A|¬B) ˇ ˇ Sance a pravdepodobnost
20 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ ˇ Sance a pravdepodobnost
´ sˇ ance daneho jevu vyjadˇrujeme napˇr. jako 1 : 3 1 ˇ = 14 pravdepodobnost jevu je potom 1+3 O(A) = P(A) =
P(A) P(A) = P(¬A) 1 − P(A) O(A) 1 + O(A)
´ ˇ v medic´ıneˇ pouˇz´ıvame obvykle pod´ıl sanc´ ı – odds ratio (OR) ´ ´ (jev B) k sˇ anci na nador ´ napˇr. sˇ ance na nador plic (jev A) u kuˇraka plic u ´ (jev ¬B) nekuˇraka
OR = Odds ratio
O(A|B) O(A|¬B) ˇ ˇ Sance a pravdepodobnost
20 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ ˇ Sance a pravdepodobnost
´ sˇ ance daneho jevu vyjadˇrujeme napˇr. jako 1 : 3 1 ˇ = 14 pravdepodobnost jevu je potom 1+3 O(A) = P(A) =
P(A) P(A) = P(¬A) 1 − P(A) O(A) 1 + O(A)
´ ˇ v medic´ıneˇ pouˇz´ıvame obvykle pod´ıl sanc´ ı – odds ratio (OR) ´ ´ (jev B) k sˇ anci na nador ´ napˇr. sˇ ance na nador plic (jev A) u kuˇraka plic u ´ (jev ¬B) nekuˇraka
OR = Odds ratio
O(A|B) O(A|¬B) ˇ ˇ Sance a pravdepodobnost
20 / 26
Pod´ıl sˇ anc´ı (odds ratio) ˇ rpoln´ı tabulka“ Ctyˇ ”
ˇ ı onemocnen´
expozice
Ano
OR =
Ne
Ano
A
C
Ne
B
D
A C B D
=
A·D C·B
OR ma´ svoji p i CI! ´ cen´ı stejn´y princip u sˇ ance na v´yleˇ ´ cbeˇ / bez leˇ ´ cby a pod. pˇri leˇ
Odds ratio
ˇ rpoln´ı tabulka Ctyˇ
21 / 26
Pod´ıl sˇ anc´ı (odds ratio) Pˇr´ıklady
ˇ ı onemocnen´ Ne
Ano
5
3
Ne
2
6
Ano expozice
expozice
Ano
ˇ ı onemocnen´
p = 0, 14 OR = 5 (95% CI: 0, 6 – 42, 8)
Ne
Ano
20
12
Ne
8
24
p = 0, 003 OR = 5 (95% CI: 1, 7 – 14, 6) neobsahuje 1
obsahuje 1
Odds ratio
Pˇr´ıklady
22 / 26
Pod´ıl sˇ anc´ı (odds ratio) Pˇr´ıklady
ˇ ı onemocnen´ Ne
Ano
5
3
Ne
2
6
Ano expozice
expozice
Ano
ˇ ı onemocnen´
p = 0, 14 OR = 5 (95% CI: 0, 6 – 42, 8)
Ne
Ano
20
12
Ne
8
24
p = 0, 003 OR = 5 (95% CI: 1, 7 – 14, 6) neobsahuje 1
obsahuje 1
Odds ratio
Pˇr´ıklady
22 / 26
Pod´ıl sˇ anc´ı (odds ratio) Interpretace
A sniˇzuje riziko B, D zvyˇsuj´ı riziko C statisticky nev´yznamn´y
Odds ratio
Interpretace
23 / 26
Literatura ´ ´ : Biomedic´ınska´ statistika I. J ANA Z V AROV A Karolinum (2011)
S ARAH B OSLAUGH & PAUL A NDREW WATTERS : Statistics in a Nutshell O’Reilly (2008)
R EGINA N UZZO : Statistical Errors Nature, Vol. 506 (Feb 13, 2014) 150-152
R C ORE T EAM : R: A language and environment for statistical computing R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/
XKCD:http://www.xkcd.com/
LATEX 2ε
Literatura
24 / 26
Pˇr´ısˇ teˇ uvid´ıte
Pˇr´ısˇ teˇ uvid´ıte
25 / 26
Ke staˇzen´ı
http://dusanmerta.eu/prezentace