Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet
Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai minta) alapján az egész jelenség (populáció) tulajdonságaira következtetünk. Azt vizsgáljuk, hogy a tapasztalt eredmény (különbség) nagyobb-e, mint amit a véletlen önmagában okoz.
Krisztina Boda
2
Mintavétel, szimuláció
Krisztina Boda
Legyen a populáció 120 átlagú, 10 szórású normális eloszlás, ebből veszünk 50 elemű mintákat
3
Histogram: s2 K-S d=.08901, p> .20; Lilliefors p> .20 Expected Normal 25
20
15
No. of obs.
10
5
0 80
90
100
110
120
130
140
150
160
X <= Category Boundary
Krisztina Boda
4
Histogram: s3 K-S d=.06554, p> .20; Lilliefors p> .20 Expected Normal 20 18 16 14 12 10
No. of obs.
8 6 4 2 0 80
90
100
110
120
130
140
150
160
X <= Category Boundary
Krisztina Boda
5
Histogram: s4 K-S d=.05667, p> .20; Lilliefors p> .20 Expected Normal 25
20
15
No. of obs.
10
5
0 80
90
100
110
120
130
140
150
160
X <= Category Boundary
Krisztina Boda
6
Histogram: s5 K-S d=.06256, p> .20; Lilliefors p> .20 Expected Normal 20 18 16 14 12 10
No. of obs.
8 6 4 2 0 80
90
100
110
120
130
140
150
160
X <= Category Boundary
Krisztina Boda
7
Histogram: s6 K-S d=.11902, p> .20; Lilliefors p<.10 Expected Normal 22 20 18 16 14 12 10
No. of obs.
8 6 4 2 0 80
90
100
110
120
130
140
150
160
X <= Category Boundary
Krisztina Boda
8
Histogram: s7 K-S d=.07360, p> .20; Lilliefors p> .20 Expected Normal 25
20
15
No. of obs.
10
5
0 80
90
100
110
120
130
140
150
160
X <= Category Boundary
Krisztina Boda
9
120 átlagú, 10 szórású populációból származó 50 elemű minták átlagai és szórásai 140
120
átlag + SD
100
80
60
40
20
0 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
ism étlés
Krisztina Boda
10
Mekkora lehet a véletlen ingadozás? A minták átlagai 120 körül ingadoznak, ha „nem történik semmi”, csak sima ismétlés Két mérés különbségének átlaga a 0 körül ingadozik Mekkora az a különbség, amit már nem a véletlen okoz?
Krisztina Boda
11
Hipotézisek
Nullhipotézis: véletlen ingadozást mértem, „semmi nem történt”. A különbség 0 körül ingadozik y=student(x;49)
Alternatív hipotézis: a véletlen ingadozásnál nagyobbat mértem, „valami történt” A különbség 0-tól eltérő szám körül ingadozik
p=2*(1-istudent(abs(x);49))
0.5
1.0
0.4
0.8
0.3
0.6
0.2
0.4
0.1
0.2
0.0
???
0.0 -3
-2
-1
0
1
2
3
-3
-2
-1
0
1
2
3
0 Krisztina Boda
12
Hipotézisek tesztelése
Mekkora esélyt adjunk a véletlennek? (Megbízhatósági szint). Akármennyi lehet, (tőlünk függ), általában 95%
Mekkora esélyt adjunk annak, hogy esetleg hibásan döntünk (szignifikancia szint) Általában 5% (=0.05)
Krisztina Boda
13
A hipotézisvizsgálat menete
Hipotézisek felállítása Nullhipotézis: semmi nem történt Alternatív hipotézis: valami változás van
A döntés megbízhatósága (vagy a hiba) rögzítése: =0.05 Döntési szabály felállítása (függ: a kísérleti elrendezéstől, -tól, az elemszámtól) Minta-elemszám meghatározása A minta előállítása (mérés, adatgyűjtés,stb) A döntési szabály kiszámítása Döntés
A nullhipotézist elfogadjuk (nincs szignifikáns különbség szinten, nincs elegendő információ a különbség (hatás) kimutatására) A nullhipotézist elvetjük, a különbség szignifikáns %-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.
Krisztina Boda
14
Student féle t-próbák
Általános cél. A Student t-próbák normális eloszlású populációk átlagait vizsgálják. A hipotézisek teszteléséhez egy t próbastatisztikát használnak, amely a nullhipotézis fennállása esetén adott szabadságfokú t-eloszlást követ. Egymintás t-próba. Adott egyetlen minta, amelyről feltesszük, hogy normális eloszlásból származik. A próbával azt teszteljük, hogy a populációátlag lehet-e egy adott konstans H0: =c
Páros t-próba (= egymintás t-próba a különbségekre). Két összetartozó mintát vizsgál. Feltételezzük, hogy a különbség-minta normális eloszlásból származik. A próbával azt teszteljük, hogy a különbség-átlag a populációban lehet-e nulla H0: különbség=0
Kétmintás t-próba ( independent samples t-test). Két független mintánk van, mindegyikről feltétezzük, hogy normális eloszlású populációból származik. A próbával azt teszteljük, hogy a két populáció-átlag azonos-e H0: 1= 2
Krisztina Boda
15
Normális eloszlást feltételezve, az átlagok összehasonlítására használható próbák
Egy minta esete: egymintás t-próba Két minta esete: Összetartozó minták: (előtt-után, baloldal-jobboldal): páros t-próba= egymintás t-próba a különbségekre Független minták (placebo-kezelés, férfi-nő, betegegészséges): kétmintás t-próba
Azonos szórások esetén „klasszikus” Különböző szórások esetén „módosított” (Welch, D) Szórások egyezésének tesztelése: F-próba, Levene-próba
Több (>2) minta esete: varianciaanalízis
3. Egyváltozós Krisztina Boda
statisztikák
16
t-próbák végrehajtásának általános menete
Null- és alternatív hipotézis felállítása Rögzítjük -t Ellenőrizzük a feltételeket legalább grafikusan Normalitásvizsgálat, kétmintás t-próba esetén a varianciák azonossága – a hisztogramok illetve boksz diagramok alapján
A próbastatisztika kiszámítása – általában egy formula Döntés táblabeli t-érték (ttáblázat ) alapján döntés( kézi számolás) |t|>ttáblázat - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a különbség szignifikáns szinten |t|
Döntés p-érték alapján (számítógép) p< - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a különbség szignifikáns szinten p> - nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a különbség nem szignifikáns szinten
Krisztina Boda
17
Statisztikai próbákról általában
Egy- és kétoldalas próbák
Kétoldalas próba
H0: nincs változás 1=2 Ha: van változás (bármilyen irányú) 12
Egyoldalas próba H0: az átlag nem csökkent, 1≤2 Ha: az átlag csökkent, 1>2
9 szabadságfokú t-eloszlás
0.025
0.05
Más lesz a táblabeli kritikus érték. pegyoldalas=pkétoldalas/2 Krisztina Boda
19
df 1 2 3 4 5 6 7 8 9
Krisztina Boda
0.2 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383
0.1 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833
valószínűség 0.05 0.02 12.706 31.821 4.303 6.965 3.182 4.541 2.776 3.747 2.571 3.365 2.447 3.143 2.365 2.998 2.306 2.896 2.262 2.821
0.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250
0.001 636.619 31.599 12.924 8.610 6.869 5.959 5.408 5.041 4.781
df 1 2 3 4 5 6 7
0.1
0.05
0.2 3.078 1.886 1.638 1.533 1.476 1.440 1.415
0.1 6.314 2.920 2.353 2.132 2.015 1.943 1.895
valószínűség egyoldalas 0.025 0.01 kétoldalas 0.05 0.02 12.706 31.821 4.303 6.965 3.182 4.541 2.776 3.747 2.571 3.365 2.447 3.143 2.365 2.998
0.005
0.0005
0.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499
0.001 636.619 31.599 12.924 8.610 6.869 5.959 5.408
20
Szignifikancia
Szignifikáns a különbség – ha azt mondjuk, hogy van hatás, az esetleges hiba nagysága kicsi (maximum - ez az ún. első fajta hiba). Nem szignifikáns különbség – ilyenkor csak annyit tudunk mondani, hogy nincs elegendő információ a különbség kimutatására. Lehet, hogy
Krisztina Boda
Valóban nincs is különbség Van különbség, csak kevés volt az elemszám Nagy volt a szórás Rossz volt a vizsgálati módszer …
A statisztikai szignifikanciát mindig át kell gondolni, vajon biológiai szempontból jelentős-e 21
Statisztikai hibák
Hipotézisvizsgálat során a minták alapján az összehasonlítandó populációkról döntést hozunk: vagy azt állítjuk róluk, hogy különbözők, vagy azt, hogy azonosak. Bárhogyan döntünk is, nem tudhatjuk, hogy helyesen döntöttünk-e, mivel a valóságot nem ismerjük (a hipotézisvizsgálatot éppen ezért végezzük). Helyesen döntöttünk, ha különbséget állapítottunk meg és a populációk valóban eltérők, vagy ha nem állapítottunk meg különbséget, és a populációk valóban azonosak.
Döntés
Igazság HA igaz
H0 igaz
Elvetjük H0-t (szign.)
helyes döntés
első fajta hiba, Type I. error (álpozitív eredmény) valószínűsége:
Nem vetjük el H0-t (nem szign.)
második fajta hiba, helyes döntés Type II.error (álnegatív eredmény)
valószínűsége: Krisztina Boda
22
Kereszt-osztályozás ̶ emlékeztető A referencia teszt Az általunk vizsgált (új) teszt eredménye
Pozitív (beteg)
Negatív (nem beteg)
Pozitív
VP – Valódi pozitív ( a)
ÁP – Álpozitív (b)
Össz pozitív (a
+ b)
Negatív
ÁN – Álnegatív ( c)
VN – Valódi negatív (d)
Össz negatív (c
+ d)
Összes beteg ( a + c)
Összes nem beteg ( b + d)
Szenzitivitás= a/(a+c) ∙100% P(T+|B) = P(T+ B)/P(B) Specificikusság= d/(b+d) ∙100% P(T-|E ) = P(T- E )/P(E ) Pozitív prediktív érték= a/(a+b) ∙100% Negatív prediktív érték = d/(c+d) ∙100% Validitás = (a+d)/(a+b+c+d) ∙100% Álnegativitási arány= c/(a+c) ∙100% ; Álpozitivitási arány= b(b+d) ∙100% ;
Krisztina Boda
Összes eset
(n=a+b+c+d)
Első fajta hiba, Type I. error
Krisztina Boda
Előfordulhat, hogy szignifikáns különbséget állapítunk meg, pedig valójában nincs különbség. Ebben az esetben a döntés hibás, az elkövetett hibát első fajta hibának nevezik, nagyságát elkövetésének valószínűségével szokás megadni. Az első fajta hiba valószínűsége annak esélye, hogy a tapasztalt különbséget a véletlen okozta, ez éppen a szignifikanciaszinttel egyenlő (). Ha több összehasonlítást végzünk, pl. több csoportot páronként hasonlítunk össze, ez a hiba halmozódhat.
24
Második fajta hiba, Type II.error
Hipotézisvizsgálat során nem állapítunk meg szignifikáns különbséget, pedig valójában – azaz a populációk között – mégis van különbség. Ebben az esetben a döntés hibás, az így elkövetett hibát második fajta hibának nevezik. A második fajta hiba valószínűségét () általában nem ismerjük, mivel függ
Krisztina Boda
a szignifikanciaszinttől (), az elemszámtól, a populáció(k) szórásától tényleges különbség (hatás) nagyságától egyéb tényezők (milyen próba, a feltételek teljesülése, a kísérleti elrendezés, ..)
A második fajta hiba valószínűségének kiszámítását az nehezíti, hogy nem ismerjük a populációk közötti tényleges különbséget, így gyakran ehelyett a megfelelőnek tekintett különbséget (pl. a legkisebb klinikailag jelentős különbség), vagy a minták átlagai alapján becsült különbséget alkalmazzák. A populáció szórását pedig a minta(ák)ból számolt szórással közelítik. 25
A próba ereje
Krisztina Boda
A második fajta hiba valószínűsége helyett inkább (1–)-t, a próba erejét szokták megadni A próba ereje azt méri, hogy a próba milyen jó abban az esetben, ha elvetjük a hamis nullhipotézist. Minél erősebb a próba, (minél közelebb van értéke 1-hez), annál nagyobb valószínűséggel veti el a hamis nullhipotézist. Másképpen: a próba ereje annak valószínűsége, hogy egy különbséget — adott mintanagyság és szignifikancia-szint mellett — egy statisztikai próba kimutat. A vizsgálatok tervezésének gyakorlatában az erő nagyságának előre megszabott értékéből kiindulva határozzák meg a szükséges mintaelemszámot. A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé teszi adott esetén.
26
Második fajta hiba, Type II.error
„Ha a ködben semmit sem látsz, ez távolról sem jelenti azt, hogy nincs ott semmi”. (Piepenbrink kapitány – Hans-Peter Beck-Bernholdt, Hans-Hermann Dubben: A tojást rakó kutya. Magyar könyvklub, 1999.)
Krisztina Boda
27
Második fajta hiba, Type II.error
Krisztina Boda
28
A próba ereje adott elemszám és esetén, különböző alternatív hipotézisek mellett
Krisztina Boda
29
A próba ereje adott elemszám és esetén, különböző alternatív hipotézisek mellett
Krisztina Boda
30
Két átlag (változás) összehasonlításához szükséges elemszám ismert esetén
z
x 0
n
Legyen a H0-ban és a H1-ben megfogalmazott átlag µ0 ill. µ1 . Adott α,β, µ0 ill. µ1 esetén, konstans és ismert szórást tekintve a kritikus értékek a következők:
z
x 0
n zα
µ0
zβ
µ1
n
Kétoldalas α=0.05 esetén zα =1.96, Egyoldalas β=0.1 esetén zβ =1.28. Az egyenletekből az átlagot kifejezve és a két oldalt egyenlővé téve az n:
( z z ) n 1 0 Krisztina Boda
z
x 1
2
31
Kérdések
Krisztina Boda
Ha két mintaátlagát vizsgálom, milyen esetben (milyen kísérlet esetén) lehet páros t-próbát és milyen esetben lehet kétmintás tpróbát alkalmazni? A kétmintás t-próba feltételei A kétmintás t-próba nullhipotézise A kétmintás t-próba végrehajtása azonos és különböző varianciák esetén A varianciák összehasonlítása: F-próba A statisztikai szignifikancia jelentése és értelmezése Statisztikai hibák Az első fajta hiba jelentése és valószínűsége A második fajta hiba jelentése és valószínűsége. Mitől függ? A próba ereje Elemszámbecslés két átlag összehasonlításához (mitől függ?)
Feladat
A kalcium hatását vizsgálták a vérnyomásra két csoportban. A kezelés előtt és a kezelés után mért különbségeket hasonlították össze kétmintás t-próbával. Értelmezze az alábbi eredményeket! Kimutatható-e 5%-os hibát feltételezve, hogy a kalcium kezelés csökkenti a vérnyomást? Vérnyomás-esés alapstatisztikák Group Statisti cs
decr
treat Calcium Placebo
N 10 11
Mean 5.0000 -.2727
St d. Dev iation 8.74325 5.90069
St d. Error Mean 2.76486 1.77913
t-próba eredménye: különböző varianciákat feltételezve, t=1.604, szabadságfok=15.591, p=0.129-et kaptunk. (Útmutatás: elegendő a p-érték alapján dönteni, p>0.05, a különbség nem szignifikáns 5%-os szinten) Independent Samples Test Lev ene's Test f or Equality of Variances
decr
Krisztina Boda
Equal v ariances assumed Equal v ariances not assumed
F 4.351
Sig. .051
t-test f or Equality of Means
t 1.634 1.604
19
Sig. (2-tailed) .119
Mean Dif f erence 5.27273
Std. Error Dif f erence 3.22667
15.591
.129
5.27273
3.28782
df
95% Conf idence Interv al of the Dif f erence Lower Upper -1.48077 12.02622 -1.71204
12.25749
Feladatok 1.
2.
Krisztina Boda
Vajon azonos-e a diabeteses és nem diabeteses populáció átlag- cholesterin szintje? Egy vizsgálatban az 1941-50 között születettek korcsoportjában a következő eredményeket kapták: Kontroll csoport n=63, átlag=5.27, SD=1.16 Diabetes csoport n=52, átlag=4.63, SD=1.31. A kérdés eldöntésére milyen statisztikai próbát használ? Mik a próba feltételei? A próbastatisztika értéke t=2.327. Szignifikáns-e a különbség? Döntsön 5%-os szinten (α =0.05) A p-érték 0.022. Szignifikáns-e a különbség 5%-os szinten? Vajon azonos-e a hallgatók populációjában a fiúk és lányok átlagéletkora? Az idegen nyelvű képzésben szereplő hallgatók adatait elemezve, az átlagok összehasonlítására a következő eredményeket kapták: Fiú: n=4, átlag=21.18, SD=3.025 Lány: n=53, átlag=20.38, SD=3.108 A kérdés eldöntésére milyen statisztikai próbát használ? Mik a próba feltételei? A próbastatisztika értéke t=1.505. Szignifikáns-e a különbség? Döntsön 5%-os szinten (α =0.05) A p-érték 0.807. Szignifikáns-e a különbség 5%-os szinten? 34
Problémák több próba végrehajtásakor
Krisztina Boda
Ugyanazon populációból származó minták páronkénti összehasonlítása t-próbával
átlag + SD
T-test for Dependent Samples: p-levels (veletlen) Marked differences are significant at p < .05000 Variable s10 s11 s12 s13 s14 s15 s16 s17 s18 s19 s20 s1 0.304079 0.074848 0.781733 0.158725 0.222719 0.151234 0.211068 0.028262 0.656754 0.048789 0.223011 s2 0.943854 0.326930 0.445107 0.450032 0.799243 0.468494 0.732896 0.351088 0.589838 0.312418 0.842927 s3 0.364699 0.100137 0.834580 0.151618 0.300773 0.152977 0.201040 0.136636 0.712107 0.092788 0.348997 s4 0.335090 0.912599 0.069544 0.811846 0.490904 0.646731 0.521377 0.994535 0.172866 0.977253 0.338436 s5 0.492617 0.139655 0.998307 0.236234 0.4206371400.186481 0.362948 0.143886 0.865791 0.147245 0.399857 s6 0.904803 0.285200 0.592160 0.429882 0.774524 0.494163 0.674732 0.392792 0.707867 0.330132 0.796021 120 s7 0.157564 0.877797 0.053752 0.631788 0.361012 0.525993 0.352391 0.796860 0.092615 0.818709 0.263511 s8 0.462223 0.858911 0.156711 0.878890 0.6241231000.789486 0.569877 0.932053 0.136004 0.923581 0.564532 s9 0.419912 0.040189 0.875361 0.167441 0.357668 0.173977 0.258794 0.099488 0.757767 0.068799 0.371769 80
60
40
20
0 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
ism étlés
Krisztina Boda
36
Miért nem t-próbákat végzünk páronként? Mert a véletlen is okozhat „szignifikáns eredményt átlagosan minden 20-adik esetben. CSOP R1 R2 R3 R4 R5 R6 R7 R8 1. 00 - . 84 1. 73 2. 36 - . 30 - . 31 - . 31 - . 56 1. 58 1. 00 . 59 . 44 . 60 - . 75 - . 28 - 1. 51 - . 81 - . 12 1. 00 . 19 - . 73 - 1. 04 1. 27 . 69 - . 21 - . 52 - 1. 34 1. 00 - 1. 05 . 88 1. 27 1. 05 - . 87 . 68 - . 17 - . 15 1. 00 . 12 - . 75 - . 05 - 1. 13 2. 21 . 74 - . 90 - . 45 1. 00 1. 10 - . 20 - . 78 1. 02 . 67 . 18 - . 52 - . 34 1. 00 - . 19 - . 57 - . 41 2. 25 - 1. 26 - . 27 . 44 - 2. 52 1. 00 . 45 1. 20 2. 77 - . 17 - . 68 . 60 . 54 - . 37 1. 00 - . 58 - . 01 . 60 1. 66 2. 14 2. 31 - . 90 - 1. 75 1. 00 - . 39 . 93 - . 51 . 31 - . 60 - . 21 . 55 . 57 1. 00 - . 23 - 1. 21 - 1. 08 . 02 . 31 - 1. 28 1. 20 1. 62 1. 00 . 87 . 97 - 1. 04 . 60 - . 29 . 86 1. 09 - . 68 2. 00 . 42 - 1. 18 - . 64 - . 08 1. 10 . 39 - . 66 2. 12 2. 00 1. 26 - 2. 13 - 1. 78 - . 60 - 1. 25 - 1. 10 . 19 - 1. 54 2. 00 - . 60 - . 83 - . 94 1. 61 . 95 1. 37 . 10 - . 97 2. 00 - 1. 75 . 63 . 16 . 24 - . 25 1. 49 . 42 - 2. 01 2. 00 . 07 - . 33 - . 56 . 36 . 12 - . 48 . 78 - 1. 29 2. 00 . 15 . 85 . 10 - 2. 07 . 18 2. 14 1. 71 . 62 2. 00 . 98 - 1. 20 - . 46 - . 92 . 08 - 1. 37 . 80 - . 67 2. 00 - . 42 1. 05 - . 29 . 73 . 10 1. 42 . 79 1. 67 2. 00 2. 00 . 06 2. 24 - . 31 - . 13 - . 01 . 04 - . 45 2. 00 - 1. 85 - 1. 83 3. 35 1. 83 - . 12 - . 30 - 1. 68 . 57 2. 00 1. 06 - . 55 - . 36 - . 80 - 1. 41 - 1. 49 . 89 . 82 2. 00 - . 57 - 2. 15 2. 15 - . 99 - 1. 63 . 00 - . 41 1. 42 t - pr . 0. 882846 0. 053926 0. 96894 0. 205339 0. 418212 0. 928912 0. 391001 0. 508963 s z i gn. 4 el s ő f aj t a hi ba v s z - e
Krisztina Boda
37
Az első fajta hiba növekedése, összehasonlításonkénti és kísérletenkénti szignifikancia
Krisztina Boda
Ha egy adott adathalmaz esetén adott változóra vagy változókra vonatkozóan több statisztikai próbát is elvégzünk, mindegyiket adott mellett, az egész kísérletre vonatkozó az első fajta hibavalószínűség -nál sokkal nagyobb is lehet. Ez a meglepőnek látszó tényt a kétmintás tpróbával mutatjuk be: Az =0.05 szint azt jelenti, hogy amennyiben a nullhipotézis igaz, (pl. az összehasonlítandó populációk között nincs különbség), az első fajta hiba elkövetésének valószínűsége 0.05, azaz minden száz ilyen esetből 5 alkalommal, nagyjából minden húszadik esetben követhetjük el ezt a hibát. Ennyiszer okoz ugyanis a véletlen a különben egyforma, azonos populációkból vett minták közt túlságosan nagy, általunk szignifikánsnak minősített különbséget. Ha több, azonos populációból vett mintát páronként hasonlítunk össze, 20 közül átlagosan 1 összehasonlítás szignifikáns eredményre vezet! Általában, n számú független összehasonlítás esetén annak valószínűsége, hogy legalább egy összehasonlítás hibás (legalább egyszer elkövetjük az első fajta hibát), maximum:1-(1-)n
38
A kísérletenkénti első fajta hiba valószínűségének növekedése
Krisztina Boda
Emiatt hibás több csoport esetén az átlagok összehasonlítására páronkénti kétmintás t-próbákat végezni, vagy két csoport esetén több összefüggő változót szintén kétmintás t-próbákkal összehasonlítani. Nem tudhatjuk ugyanis, hogy a szignifikáns eredmények közül melyek tulajdoníthatók a véletlennek, és melyek tükröznek valódi különbséget. 39
Sok kis darabból összecsomózott hegymászókötél: az egyes csomók 95%-os valószínűséggel jól tartanak
Két csomó hibátlan voltának valószínűsége=0.95*0.95 =0.9025~90% 20 csomó hibátlan voltának valószínűsége=0.9520= =0.358~36% Lezuhanás valószínűsége 20 csomó esetén ~64%
Krisztina Boda
40
Megoldás: sok t-próba helyett egyetlen varianciaanalízis Az egyedi p-értékek korrekciója
Krisztina Boda
Bonferroni Holm FDR (False Discovery Rate) …
41
ANOVA Analysis of Variance
Több (>2), normális eloszlású populáció átlagának összehasonlítására szolgáló módszer Fajtái: Egyszempontos (one-way):
kontroll, kezelés I, kezelés II.
Többszempontos (Kezelés, nem: a kettő együtt hogy hat)
Bármelyik szempont lehet „független” („between-subjects”) pl. nem, kezelési csoportok „ismételt méréses” („within-subjects”) pl. időben mért ismétlések
Krisztina Boda
42
Példa
Egy kísérletben (Farkas és mtsai, 2003.) lokális iszkémiának alávetett, izolált patkányszívben a szívfrekvencia és a QT szakasz hosszának változását vizsgálták három antiaritmiás gyógyszer hatására. 5 Mm K+ kálium ion koncentráció esetén, 25 perccel a lokális iszkémia után a QT szakasz hosszára a 4.8. táblázatban látható értékeket kapták. Vizsgáljuk meg, hogy a 4 csoportban van-e különbség a QT szakasz átlagos hosszában!
Kontroll 61 53 68 66 54 átlag SD
60.4 6.80
Quinidine 76 84 89 78 81 89 82.8 5.49
Lidocaine 65 56 76 72 66 69 67.3 6.86
Flecainide 69 65 73 71 61 69 68.0 4.34
100
90
80
70
60
50
40 Kontroll
Krisztina Boda
Quinidine
Lidocaine
Flecainide
43
Egyszempontos ANOVA Feltételek, nullhipotézis
Feltételek: Az egyedek véletlenszerűen kerülnek egyik vagy másik csoportba, a minták független minták (egy egyed csak egy csoportba kerülhet). Az összehasonlítandó értékeket tartalmazó változó folytonos. A minták normális eloszlású populációból származnak. Azok a populációk, amelyekből a minták származnak, azonos varianciájúak.
Nullhipotézis: A független minták azonos eloszlású populációból származnak, azaz
a populáció-átlagok megegyeznek
H0: 1= 2=…= t t a csoportok száma (t kezelés - treatment) HA: i≠ j i ≠j, i,j=1,2,…t (van a csoport-átlagok között különböző)
Krisztina Boda
44
Módszer
Az ANOVA a teljes adathalmaz összvarianciáját kétféle forrásból származtatja: Csoportok közötti Csoportokon belüli
Ha igaz az a nullhipotézis, hogy a populáció-átlagok megegyeznek, (H0: 1= 2=…= t), akkor a populációban a csoportok közötti és a csoportokon belüli variancia is megegyezik. A kettő hasonlításával lehet következtetni az átlagok azonosságára. ‘új’ nullhipotézis: A populációban a csoportok közötti és a csoportokon belüli variancia megegyezik. 2között=2belül Tesztelése: F-próba (egyoldalas). Egy p-értéket ad: ha p>0.05, akkor elfogadjuk az átlagok azonosságát (H0) ha p<0.05, akkor van az átlagok között különböző
Krisztina Boda
45
7
7
6
6
5
5
4
4
3
3
2
2
1
1
0
.
0 0
1
2
3
4
0
1
2
3
4
a) b Azonos (a) és különböző (b) átlagú, egységnyi szórású normális eloszlású populációkból vett 6 elemű véletlen minták.
Krisztina Boda
46
A varianciaanalízis táblázata A variancia analízis számításait általában táblázatba szokták foglalni A szóródás oka Csoportok között Csoportokon belül
Négyzetösszeg Qk Qb Q
Teljes
Krisztina Boda
t
i 1
ni ( x i x )
t
ni
i 1
j 1
t
ni
i 1
j 1
Szabadságfok 2
( xij xi ) 2 ( xij x) 2
t-1 N-t
Variancia Q sk2 k t 1 Qb sb2 N t
F sk2 F 2 sb
N-1
47
A varianciaanalízis táblázata példafeladat adataira 100
90
80
70
60
50
40 Kontroll
A szóródás oka Csoportok között Csoportokon belül Teljes
Négyzetösszeg 1515.590 665.367 2180.957
Quinidine
Lidocaine
Szabadságfok 3 19 22
Flecainide
Variancia 505.197 35.019
F 14.426
p 0.000
F(3,19)=14.426, p<0.001, a különbség szignifikáns, csoport-átlagok között van legalább egy, a többitől eltérő
Krisztina Boda
48
További teendők, ha a varianciaanalízis eredménye szignifikáns Ha megállapítottuk, hogy az átlagok nem mind azonosak, felmerül a kérdés, hol van a különbség? Ismételt t-próbákkal nem dolgozhatunk (1. fajta hibanövekedés)
Speciális páronkénti összehasonlítások (posthoc tesztek) Előre tervezett összehasonlítások
Krisztina Boda
Páronkénti hasonlítások Módosított t-próbák (LSD) Bonferroni Scheffé Tukey Dunnett- egy kontrollhoz hasonlítja a többi csoportot … Kontroll – Quinidine Kontroll – Lidocaine Kontroll – Flecainide
Krisztina Boda
Az átlagok különbsége 22.4333 6.9333 7.6000
Dunnett - p .000 .158 .113
Páronkénti hasonlítások Multi ple Comparisons
Multi ple Comparisons
Dependent Variable: QT LSD
(I) CSoport Kontroll
Quinidine
Lidocaine
Flecainide
(J) CSoport Quinidine Lidocaine Flecainide Kontroll Lidocaine Flecainide Kontroll Quinidine Flecainide Kontroll Quinidine Lidocaine
Dependent Variable: QT Bonf erroni Mean Dif f erence (I-J) St d. Error -22.43333* 3.58335 -6.93333 3.58335 -7.60000* 3.58335 22.43333* 3.58335 15.50000* 3.41659 14.83333* 3.41659 6.93333 3.58335 -15.50000* 3.41659 -.66667 3.41659 7.60000* 3.58335 -14.83333* 3.41659 .66667 3.41659
*. The mean dif f erence is signif icant at the . 05 lev el.
Sig. .000 .068 .047 .000 .000 .000 .068 .000 .847 .047 .000 .847
95% Conf idence Interv al Lower Bound Upper Bound -29.9334 -14.9333 -14.4334 .5667 -15.1000 -.1000 14.9333 29.9334 8.3490 22.6510 7.6823 21.9843 -.5667 14.4334 -22.6510 -8.3490 -7.8177 6.4843 .1000 15.1000 -21.9843 -7.6823 -6.4843 7.8177
(I) CSoport Kontroll
Quinidine
Lidocaine
Flecainide
(J) CSoport Quinidine Lidocaine Flecainide Kontroll Lidocaine Flecainide Kontroll Quinidine Flecainide Kontroll Quinidine Lidocaine
Mean Dif f erence (I-J) St d. Error -22.43333* 3.58335 -6.93333 3.58335 -7.60000 3.58335 22.43333* 3.58335 15.50000* 3.41659 14.83333* 3.41659 6.93333 3.58335 -15.50000* 3.41659 -.66667 3.41659 7.60000 3.58335 -14.83333* 3.41659 .66667 3.41659
Sig. .000 .408 .284 .000 .001 .002 .408 .001 1.000 .284 .002 1.000
95% Conf idence Interv al Lower Bound Upper Bound -32.9823 -11.8843 -17.4823 3.6157 -18.1490 2.9490 11.8843 32.9823 5.4419 25.5581 4.7752 24.8914 -3.6157 17.4823 -25.5581 -5.4419 -10.7248 9.3914 -2.9490 18.1490 -24.8914 -4.7752 -9.3914 10.7248
*. The mean dif f erence is signif icant at the . 05 lev el.
pBonferroni=pLSD*összehasonlítások száma=pLSD*6
Krisztina Boda
51
> csoport<-factor(c(1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4)) > mit
mean(mit[csoport==1]);sd(mit[csoport==1]) [1] 60.4 [1] 6.80441 > mean(mit[csoport==2]);sd(mit[csoport==2]) [1] 82.83333 [1] 5.492419 > mean(mit[csoport==3]);sd(mit[csoport==3]) [1] 67.33333 [1] 6.860515 > mean(mit[csoport==4]);sd(mit[csoport==4]) [1] 68 [1] 4.335897 > boxplot(mit~csoport) > fit<-aov(mit~csoport) #1-es tipusu, unbalanced eseten > fit Call: aov(formula = mit ~ csoport) Terms: csoport Residuals Sum of Squares 1515.5899 665.3667 Deg. of Freedom 3 19 Residual standard error: 5.917711 Estimated effects may be unbalanced > summary(fit) #szokasos ANOVA tablat adja Df Sum Sq Mean Sq F value Pr(>F) csoport 3 1515.6 505.2 14.43 3.89e-05 *** Residuals 19 665.4 35.0 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > pairwise.t.test(mit,csoport,p.adj="none") #LSD Pairwise comparisons using t tests with pooled SD data:
mit and csoport
1 2 3 2 5.2e-06 3 0.06804 0.00023 4 0.04731 0.00035 0.84737 P value adjustment method: none > pairwise.t.test(mit,csoport,p.adj="bon")
#Bonferroni
Pairwise comparisons using t tests with pooled SD data:
mit and csoport
1 2 3 2 3.1e-05 3 0.4082 0.0014 4 0.2839 0.0021 1.0000 P value adjustment method: bonferroni
Krisztina Boda
R futtatás
Kérdések és feladatok Miért nem helyes több csoport átlagának összehasonlítására páronként t-próbákat alkalmazni? A Bonferroni korrekció Az egyszempontos varianciaanalízis céja, null- és alternatív hipotézise A varianciaanalízis elve (milyen varianciákat hasonlít?), táblázata Páronkénti hasonlítások
Krisztina Boda
Hasznos WEB oldalak Klinikai Biostatisztikai Társaság http://www.biostat.hu Rice Virtual Lab in Statistics http://davidmlane.com/hyperstat/intro_ANOVA. html Statistics on the Web http://www.claviusweb.net/statistics.shtml
Krisztina Boda
54