A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet
Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai minta) alapján az egész jelenség (populáció) tulajdonságaira következtetünk. Azt vizsgáljuk, hogy a tapasztalt eredmény (különbség) nagyobb-e, mint amit a véletlen önmagában okoz.
Krisztina Boda
2
Hipotézis
Állítás a populációról (vagy annak paraméteréről) Példák H1: p=0.5 (a pénzérme szabályos – a dobások fele fej, másik fele írás; p=pl. a fejdobás valószínűsége) H2: p≠0.5 ( a pénzérme nem szabályos) H3: =20 (a populáció átlag 20) H4: ≠20 (a populációü átlag nem 20)
Krisztina Boda
Kétféle hipotézis: nullhipotézis általában a szabályosság, egyenlőség feltételezése Ellentéte, az alternatív hipotézis, különbség, eltérés feltételezése. Gyakran ez az, amit bizonyítani szeretnénk.
3
Hipotézisek tesztelése
Mekkora esélyt adjunk a véletlennek, azaz, mekkora legyen a megbízhatósági szint:
akármennyi lehet, (tőlünk függ), általában 95%
vagy ami ugyanaz, mekkora legyen a szignifikancia szint:
Krisztina Boda
általában 5% (=0.05)
4
A hipotézisvizsgálat menete
Hipotézisek felállítása Nullhipotézis: semmi nem történt Alternatív hipotézis: valami változás van
A döntés megbízhatósága (vagy a hiba) rögzítése: =0.05 Döntési szabály felállítása (függ: a kísérleti elrendezéstől, -tól, az elemszámtól) Mintaelemszám (n) meghatározása A minta előállítása (mérés, adatgyűjtés,stb) A döntési szabály kiszámítása Döntés
A nullhipotézist elfogadjuk (nincs szignifikáns különbség szinten, nincs elegendő információ a különbség (hatás) kimutatására) A nullhipotézist elvetjük, a különbség szignifikáns -os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.
Krisztina Boda
5
Egymintás t-próba Hipotézis teszt a normális eloszlású populáció μ átlagára Egy kezelés során szükségessé vált annak ellenőrzése, hogy az milyen hatással van a vérnyomásra. A vizsgált paciensek korcsoportjában a systolés vérnyomás normálértéke 120. Mondhatjuk-e 95% biztonsággal, hogy a minta-adatok 120 átlagú populációból származnak? HO: A populáció átlag 120, =120 Ha: A populáció átlag nem 120 , 120 (kétoldalas) Általában: HO: =c Ha: c =0 Mintavétel, adatok: n=9 személyt megmérve a következő értékeket kapták: 182.00 152.00 178.00 157.00 194.00 163.00 144.00 114.00 174.00 Az átlag=162 Hgmm volt, a standard deviáció SD=23.92 .
Krisztina Boda
6
Döntési szabály a konfidencia intervallum alapján Általában Ha c benne van az intervallumban: megtartjuk a nullhipotézist, a különbség nem szignifikáns adott szinten Ha c nincs benne az intervallumban : elvetjük a nullhipotézist, a különbség szignifikáns adott szinten Esetünkben Adjuk meg a populáció-átlagra vonatkozó 95%-os konfidencia intervallumot! t8,0.05=2.306 A standard error, SE=SD/ n=7.97. A konfidencia intervallum: (átlag - t*SE, átlag + t * SE )= (162-2.306*23.92/9, 162+2.306*7.97) =(143.61,180.386) Döntés: Mondhatjuk-e a konfidencia intervallum alapján 95% biztonsággal, hogy a minta-adatok 120 átlagú populációból származnak? Nem, mivel a konfidencia intervallum nem tartalmazza 120-at. Esetünkben 120 nincs benne a konfidencia intervallumban, tehát a különbség szignifikáns 5%-os szinten Krisztina Boda
7
Döntési szabály a t-érték alapján
Számítsuk ki a következő ún. próbastatisztikát: t= (átlag - c)/SE Ha igaz a nullhipotézis, a t próbastatisztika n-1 szabadságfokú t-eloszlást követ. Ekkor megadható az a tartomány, ahova a t nagy 95% valószínűséggel beleesik (ennek határait a t-eloszlás táblázatából keressük ki a megfelelő szabadságfok és alapján). Az elfogadási tartomány a változó azon értékeinek halmaza, amelyekre elfogadjuk a nullhipotézist (- ttábla ,ttábla) A kritikus tartomány ennek ellentettje. A kritikus tartomány értékeire a nullhipotézist nem fogadjuk el. Döntési szabály: ha |t|>ttábla, a különbség szignifikáns adott szinten ha |t|
Esetünkben: t=(162-120)/7.97=5.26. Szabadságfok: n-1=9-1=7 t8,0.05=2.306 (táblázatbeli érték): Döntés: 5.26>2.306, a különbség szignifikáns 5%-os szinten
Krisztina Boda
Elfogadási tartomány t=5.26 8
Döntési szabály a p-érték alapján
p-érték: a mi általunk számított t-érték által az eloszlásból levágott terület nagysága Annak valószínűsége, hogy ha igaz a nullhipotézis (=nincs hatás), a tapasztalt eltérést vagy annál még nagyobb eltérést kapjunk Ha a p<, akkor a különbség szignifikáns adott szinten Esetünkben p=0.001<0.05 One-Sampl e Statistics
N VAR00001
Mean 162.0000
9
Std. Dev iation 23. 92175
Std. Error Mean 7. 97392
One-Sampl e Test
Elfogadási tartomány
Tes t Value = 120
VAR00001
Krisztina Boda
t 5. 267
df 8
Sig. (2-t ailed) .001
Mean Dif f erenc e 42. 0000
95% Conf idence Interv al of the Dif f erenc e Lower Upper 23. 6121 60. 3879
t=5.26 9
Másik mintafeladat
Krisztina Boda
Két oktató beszélget: vajon mennyi lehet az elsőéves idegen nyelven tanuló hallgatók átlagéletkora? Az egyik oktató szerint ez 20 év, a másik oktató ezzel nem ért egyet. Oktató#1: A populáció-átlag 20. H0: μ=20 Oktató#2: A populáció-átlag nem 20. Ha: μ20
10
Egymintás t-próba Döntési szabály: konfidencia intervallum
H0: =20 , Ha: 20
α =0.05
Adatgyűjtés. n=137 Minta átlag=20.87 Minta SD=3.071 95%-os konfidenica intervallum számítás a populáció átlagra:
Szabadságfok=136, t136,0.05=1.977 t
SD 3.071 1.977 1.977 0.262 0.518 n 137
Alsó határ: 20.87-0.518=20.352 Felső határ: 20.87+0.518=21.388 Az intervallum: (20.35-21.39). Az igazi átlag (a populációátlag) ebben az intervallumban van, 95%-os valószínűséggel.
Döntési szabály: ellenőrizzük, hogy a hipotézisben szereplő feltételezett átlag (20) benne van-e az intervallumban
Döntés 20 nincs benne a 95%-os konfidencia-intervallumban, ezért a nullhipotézist elvetjük és azt mondjuk, hogy a különbség szignifikáns 5%-os szinten.
Krisztina Boda
11
Egymintás t-próba Döntési szabály: kritikus érték
H0: =20 , Ha: 20
α =0.05
Adatgyűjtés. n=137 Minta átlag=20.87 x c 20.87 20 Minta SD=3.071 t 3.321 SE 0 . 262 Próbastatisztika (t-érték) számítása: Ha H0 igaz, akkor a próbastatisztika n-1=136 szabadságfokú t-eloszlást követ. A t-eloszlás táblázatából meghatározható a kritikus érték, ennek segítségével az elfogadási tartomány: (- 1.977, 1.977) És ennek ellentéte, az elutasítási tartomány Döntési szabály: ellenőrizzük, hogy az általunk számolt próbastatisztika értéke benne van-e az elfogadási intervallumban Döntés t=3.321 nincs az elfogadási intervallumban, 3.321>1.977, |t|>ttable, ezért a nullhipotézist elvetjük és azt mondjuk, hogy a különbség szignifikáns 5%-os szinten.
Krisztina Boda
y=student(x;136) 0.5
1.0
0.4
0.8
0.3
0.6
0.2
0.4
0.1
0.2
0.0
0.0 -3
-2
-1
0
1
2
3
Elfogadási intervallum t=3.321
12
-3
Egymintás t-próba Döntési szabály: p-érték
H0: =20 , Ha: 20
α =0.05
Adatgyűjtés. n=137 Minta átlag=20.87 x c 20.87 20 Minta SD=3.071 t 3.321 SE 0 . 262 Próbastatisztika (t-érték) számítása: A p-érték a t-eloszlásból a próbastatisztika által levágott szélső területek nagysága Annak valószínűsége, hogy ha igaz a nullhipotézis, a kapott, vagy annál nagyobb eltérést kapunk Döntés: p=0.001152<0.05, ezért a nullhipotézist elvetjük és azt mondjuk, hogy a különbség sziginifkáns 5%-os szinten.
Elfogadási intervallum
t=3.321
p=.001152
Krisztina Boda
13
Az egymintás t-próba tesztelésére alkalmazható egyenértékű döntési szabályok. Feltétel: normalitás 1. H0: =c, (c adott konstans). 2. Ha: c. 3. rögzítsük a hibavalószínűséget. 4. Állapítsuk meg a mintaelemszámot n 5. Mérjük le (gyűjtsük be) az adatkokat, ( x1 , x2 ,..., xn .), számítsuk ki a minta átlagot ás szórást 6. A döntési szabály: Konfidencia intervallum Döntési szabályok
( x t
s s ,x t ) n n
Kritius pontok (t-érték) x c x c t SD SE n
p-érték A p-értéket számítógépes programmal lehet kiszámolni
t= a kétoldalas t-táblázatból nyert kritikus érték 7. Döntés
a) Ha : elvetjük H0-t, a különbség szignifikáns 100%-os szinten.
Döntés Konfidencia intervallum c nincs benne a konfidenicaintervallumban
a) H0 : nem vetjük el H0-t, a különbség nem szignifikáns 100%-os szinten.
c benne van a konfidenicaintervallumban
Krisztina Boda
Kritius pontok (t-érték)
p-érték
t t
p<
t t
p>
14
Eredmények az SPSS programmal One-Sample Statistics N Age Age in y ears
137
Mean 20.87
Std. Dev iation 3.071
Std. Error Mean .262
One-Sample Test Test Value = 20
Age Age in y ears
t 3.324
A t-érték és szabadságfok alapján történő döntéshez szükségünk van a t-táblázatra
Krisztina Boda
df 136
Sig. (2-tailed) .001
Mean Dif f erence .872
95% Conf idence Interv al of the Dif f erence Lower Upper .35 1.39
p-érték, Ha p<, a különbség szignifikáns, Ha p>, a különbség nem szignifikáns
15
Statisztika a magyar nyelven tanuló elsőéves orvostanhallgatók életkorára Case Processing Summary
Valid N Kor
244
Percent 100.0%
Cases Missing N Percent 0 .0%
Total N 244
Percent 100.0%
Descriptives Kor
Mean 95% Conf idence Interv al f or Mean 5% Trimmed Mean Median Variance Std. Dev iat ion Minimum Maximum Range Interquartile Range Skewness Kurt osis
Lower Bound Upper Bound
Stat istic 19.25 19.03
Std. Error .110
19.46 19.03 19.00 2.960 1.720 17 36 19 2 5.035 40.757
.156 .310
Mondhatjuk-e, hogy a magyar nyelven tanuló hallgatók átlagéletkora =20 év? Krisztina Boda
16
Egymintás t-próba a magyar populációra One-Sample Statistics N Kor
244
Mean 19.25
Std. Dev iat ion 1.720
Std. Error Mean .110
One-Sample Test Test Value = 20
Kor
t -6.847
df 243
Sig. (2-tailed) .000
Mean Dif f erence -.754
95% Conf idence Interv al of the Dif f erence Lower Upper -.97 -.54
Mondhatjuk-e, hogy a magyar nyelven tanuló hallgatók átlagéletkora =20 év?
Krisztina Boda
17
Páros t-próba
Adott két összetartozó minta, azaz ugyanazokon az egyedeken ugyanazt a változót kétszer megmérték
önkontrollos kísérlet (kezelés előtti és utána adatok), vagy más módon összetartozó adatok pl. jobb oldal-bal oldal Vagy Illesztett párok- matched pairs (különböző személyek, de a kísérlet szempontjából párba állíthatók)
Nullhipotézis: a két minta-átlag ugyanannak a populáció-átlagnak a közelítése, (nincs kezelés-hatás, a tapasztalt különbség véletlen) Alternatív hipotézis: van hatás Döntési szabály: Konfidenica intervallum a különbségre t-érték számítás és összehasonítás a táblázattal p-érték (szoftver)
Krisztina Boda
18
Páros t-próba, példa
Krisztina Boda
Egy vizsgálat során egy speciális diéta hatását tesztelték. Szeretnénk ellenőrizni, vajon a diéta hatásos volt-e. A különbség-átlag=4 kg. Ez nagy vagy kis különbség? Véletlenül kaptunk-e ekkora eltérést (azaz, akár nulla is lehetne), vagy ekkora eltérést már nem minősíthetünk véletlen hatásnak?
Mean SD
Before 85 95 75 110 81 92 83 94 88 105 90.8 10.79
After 86 90 72 100 75 88 83 93 82 99 86.8 9.25
Difference -1 5 3 10 6 4 0 1 6 6 4. 3.333
19
Páros t-próba, példa (folytatás)
Krisztina Boda
Gondolatmenet: ha a kezelés nem hatásos, az átlagos különbség kicsi (közel 0). Ha a diéta hatásos, az átlagos különbség nagy. A populációra nézve ez a következő hipotéziseket jelenti: HO: előtt= után or különbség= 0 (c=0)!! HA: előtt ≠ után or különbség ≠ 0 Legyen =0.05. A szabadságfok=10-1=9, ttáblázat=t0.05,9=2.262 átlag=4, SD=3.333 SE=3.333/10=1.054
20
Páros t-próba, példa (folytatás)
Döntés a konfidenciaintervallum alapján: 95%CI: (4-2.262*1.054, 4+2.262*1.054)=(1.615, 6.384) Ha H0 igaz, akkor a 0 benne van a konfidenciaintervallumban Most 0 nincs benne a 95%-os konfidenciaintervallumabn, ezért döntésünk az, hogy a különbség szignifikáns 5%os szinten, a kezelés hatásos volt Az átlagos súlyveszteség 4 kg, ami akár 6.36 is lehetne, de minimum 1.615, 95% valószínűséggel.
Krisztina Boda
21
Páros t-próba, példa (folytatás)
Döntés a próbastatisztika alapján (t-érték: t
xc x0 4 SE SE 1.054 3.795
Azt hasonlítjuk a táblabeli kritikus értékhez. |t|=3.795>2.262(=t0.05,9), a különbség szignifikáns 5%os szinten
Döntés p-érték alapján: p=0.004, p<0.05, a különbség szignifikáns 5%os szinten
Elfogadási tartomány tszámított, próbastatisztika ttábla, kritikus érték
Krisztina Boda
22
Példa. Tegyük fel, hogy 8 önként vállalkozó beteg kezelése során a következő systolés vérnyomásértékeket kaptuk (fiktív adatok) =0.05, és 7 -es szabadságfokhoz tartozó kritikus érték a t-eloszlás táblázatából t0.025,7=2.365 . Kezelés előtt 170 160 150 150 180 170 160 160
Kezelés után 150 120 150 160 150 150 120 130
Különbség 20 40 0 -10 30 20 40 30 d =21.25 sd=18.077 t =3.324
Döntés: |t|=3.324>2.365, tehát elvetjük H0-t és azt mondjuk, hogy a populáció átlagok közötti különbség szignifikáns 5 %-os szinten. A döntés hibája első fajta hiba, valószínűsége 0.05. 95%-os konfidencia-intervallum a különbségre: (6.137, 36.36) p-érték: p=0.013 Krisztina Boda
23
Példa az orvosi irodalomból
Krisztina Boda
24
Krisztina Boda
25
Példa az orvosi irodalomból
Krisztina Boda
26
Ellenőrző kérdések és feladatok
Krisztina Boda
A hipotézis fogalma Null- és alternatív hipotézis A hipotézisvizsgálat lépései Az egymintás t-próba null- és alternatív hipotézise Az egymintás t-próba döntési szabályai Az egymintás t-próba nullhipotézisének tesztelése konfidenciaintervallum alapján Az egymintás t-próba nullhipotézisének tesztelése t-érték alapján Az egymintás t-próba nullhipotézisének tesztelése p-érték alapján A p-érték jelentése Egy vizsgálatban, 10 egészséges nő systolsé vérnyomását vizsgálva, az átlag 119, a standard error 0.664. Feltéve, hogy a minta normális eloszlású populációból szármatik, ellenőrizzük, hogy a populáció-átlag 125-e? (=0.05, ttábla=2.26). Egy új gyógyszer kipróbálásakor 5 betegen megmérték a systolés vérnyomást a gyógyszer beadása előtt és utána. Az átlagos különbség = 6 , a különbségek standard errorja SE=4.65. Végezze el a megfelelő statisztikai próbát annak ellenőrzésére, hogy a két átlag között kimutatható-e szignifikáns különbség. ( =0.05, ttábla=2.57)
27
Hasznos WEB oldalak Klinikai Biostatisztikai Társaság http://www.biostat.hu Rice Virtual Lab in Statistics http://onlinestatbook.com/rvls.html Statistics on the Web http://www.claviusweb.net/statistics.shtml Hisztogram alakjának változása – Old Faithful http://www.stat.sc.edu/~west/javahtml/Histogra m.html
Krisztina Boda
28