Statisztikai módszerek alkalmazása az orvostudományban
Szentesi Péter
Az orvosi munkahipotézis ellenőrzése statisztikai módszerekkel munkahipotézis mérlegelés
differenciáldiagnosztika
mi lehet ez a más
egy adott gyógyszer hypotensiv hatású a kapott tenziócsökkenés orvosilag elegendően nagy ahhoz, hogy megfelelőnek tekintsük valóban a szer okozta a tenziócsökkenést vagy valami más szisztémás hatás vagy véletlen
A véletlen szerepének megítélése, a szignifikancia Nem lehet minden körülményt tekintetbe venni, sőt általában nem is érdemes. Mérlegelni kell, hogy mely tényezőket vesszük figyelembe, illetve melyeket nem. Mindannak a hatását, amit nem vettünk tekintetbe, összességében a véletlen hatásának fogjuk fel. A véletlen által is befolyásolt eseményekre kidolgozott valószínűségi és matematikai statisztikai törvények objektívek, de a határ szubjektív. A kutató tudása -és nem ritkán a szerencséje is- dönti el, hogy jó helyen húzza meg a határt.
A véletlen A szignifikancia vizsgálatok során tehát a logika: Ha más hatás nincs, csak a véletlen, akkor elég gyakran okoz-e egymaga a véletlen akkora eltérést (vagy még nagyobbat), amekkorát a vizsgálat során észleltünk. Ha elég gyakran okoz, azt mondjuk, hogy az észlelt eltérés a véletlen okozhatta, tehát nincs kellő erővel bizonyítva, hogy a munkahipotézisünkben feltételezett beavatkozás okozná.
Szignifikancia próbákkal kapcsolatos félreértések I. Mi azt akarjuk igazolni, hogy a vizsgált beavatkozás hatásos. A szignifikancia próbák viszont arra felelnek, hogy mit várhatunk akkor, ha nincs hatásos beavatkozás. Következmény 1. Fordítva minősíti a szignifikancia próbák eredményeit a matematikus és az orvos, kutató. A mi hipotézisünk, hogy van hatás, a matematikusé, hogy nincs (nullhipotézis).
Szignifikancia próbákkal kapcsolatos félreértések II. Következmény 2. Ha a hatás “szignifikánsnak” bizonyul, akkor mi megtartjuk a munkahipotézisünket, a matematikus pedig elveti a null hipotézist. Következmény 3. A szignifikanciapróba tehát nem az orvosi munkahipotézisre felel, hanem a matematikai null hipotézisre, éppen ezért mindig erős fenntartással kell az eredményt értékelnünk.
A legfontosabb egyszerű szignifikanciapróbák I. Alaphelyzet A vizsgált rendszer minden más szempontból változatlan, az egyetlen különbség az, aminek a hatását vizsgálni akarjuk és emellett legfeljebb csak a véletlen jut szerephez. Típus önkontrollos vagy csoportkontrollos Az önkontrollos általában jobb, de nem mindíg alkalmazható (pl. a szernek maradandó hatása van).
A legfontosabb egyszerű szignifikanciapróbák II. Kérdés Elég gyakran okoz a véletlen az észlelttel egyenlő (vagy nagyobb) hatást? Ha csak ritkán, akkor szignifikánsnak tekintjük az eltérést. Általában, ha a véletlen csak legfeljebb minden huszadik esetben vagy ritkábban okoz változást, akkor a vizsgált eltéres szignifikáns (p=0,05). Alkalmazhatóság Próbák 1. χ2 próba 2. Student-féle t-próba
A χ2 próba I. a legrégibb, a legegyszerűbb, a legkevesebb feltételhez kötött és a legkevésbé érzékenyebb próba Alkalmazás eloszlások összehasonlítása 1. a két vagy több minta nem különbözik-e homogenitás vizsgálat 2. a minta megfelel-e egy már előre ismert eloszlásnak illeszkedés vizsgálat Feltétel csak teljes eseményrendszer esetén és csak abszolút frekvenciákkal szabad végezni a számítást kellő számú eset jusson az egyes kategóriákba
A χ2 próba II. Kontingencia tábla sorok: összehasonlítható csoportok oszlopok: összehasonlításkor tekintetbe vett szempontok az egyes cellákban lévő számok azt jelentik, hogy az adott kritériumnak hányan feleltek meg
Homogenitás vizsgálat I. Példa: Egy lényegesen megváltoztatott védőoltás hogyan befolyásolja az állatpopuláció túlélését egy betegséggel szemben? Elpusztult
Él
Összesen
Új eljárás
12
48
60
Standard eljárás
33
57
90
Összesen
45
105
150
Homogenitás vizsgálat II. Szignifikáns-e ez a különbség? Feltesszük, hogy a két védőanyag egyforma hatású, és a különbséget a véletlen magyarázza. Ehhez feltételezni kell az egyformaságot, a homogenitást, tehát hogy a két minta ugyanabból a populációból származik. Talált Elpusztult
Él
Összesen
Számított Elpusztult Él
Új eljárás
12
48
60
18
42
Standard eljárás
33
57
90
27
63
Összesen
45
105
150
45
105
Homogenitás vizsgálat III. Szabadságfok 1. Az egyes cellákban kapott eltéréseket előbb külön-külön értékeljük, majd a talált különbséget négyzetre emeljük és osztjuk a számított értékkel. Első cella (18-12)2/18=2 Második cella (48-42)2/42=6/7 Harmadik cella (33-27)2/27=4/3 Negyedik cella (63-57)2/63=4/7 A sorozat összege (4,762) mutatja, hogy egyes osztályok mekkora elérést jelentenek (χ2 érték).
A χ2 próba táblázata df
P = 0,05
P = 0,01
P = 0,001
1
3,84
6,64
10,83
2
5,99
9,21
13,82
3
7,82
11,35
16,27
4
9,49
13,28
18,47
5
11,07
15,09
20,52
6
12,59
16,81
22,46
7
14,07
18,48
24,32
8
15,51
20,09
26,13
9
16,92
21,67
27,88
10 18,31
23,21
29,59
3,84<4,762 de 4,762<6,64
df=szabadsági fok =(r-1)*(c-1), ahol az r a sorok, míg a c az oszlopok száma.
Homogenitás vizsgálat IV. Mit jelent a χ2=4,762 ? A χ2 táblázatból a 0,05-ös oszlopban 3,841, míg a 0,01-es oszlopban 5,412 van, tehát az általunk kapott eltérés 5%-os szinten szignifikáns, míg 1%-os szinten nem. Megmutatta, hogy az új eljárás jobb, de azt nem hogy mennyivel! Kiegészítés: a szabadságfok=(r-1)*(c-1), ahol az r az sorok, míg a c az oszlopok száma.
Illeszkedésvizsgálat I. Sok esetben a munkahipotézisünk szerint a vizsgált betegségre való hajlam valamely, az egészséget egymagában nem befolyásoló tulajdonsággal mutat kapcsolatot. Pl. cholecysta betegségek gyakoribbak nőkben életkor és Down szindróma kapcsolata, HLA és diabetes… Ezekben az esetekben először azt nézzük, hogy a betegek megoszlása az egyes kategóriákban olyan-e, mint az összpopulációban.
Illeszkedésvizsgálat II. Példa 1. A syndactilia (ujjak összenövése) szignifikánsan gyakoribb-e a fiú újszülöttekben, mint a lányokban?
talált számított
lány 22 30
fiú 38 30
összesen 60 60
A χ2 számítása azonos a homogenitás vizsgálatnál ismertettel. Ez esetben a χ2 értéke 4,27, ami 0,05%-os szinten szignifikáns.
Illeszkedésvizsgálat III. Példa 2. A Bürker kamrában lévő vér fehérvérsejt (fvs) száma követi-e a Poisson eloszlást? A fvs-ek száma 0 1 2 3 4 5 6 7 8 9
A cellák száma észlelt számított (λ=4,04) 2 0,88 6 3,55 8 7,17 8 9,66 4 9,76 6 7,89 7 5,31 6 3,06 1 1,55 2 1,17
1,12 2,45 0,83 -1,66 -5,76 -1,89 1,69 2,94 -0,55 0,83
∑
50
0
50
észlelt-számított
szabadságfok 8 χ2 = 10,52
ns
Student-féle t-próba I. A χ2 próbánal jobb, de korántsem a legjobb. Ha az alkalmazásának feltételei teljesülnek, akkor maximális jó eredményt ad. Kritériumok legyen az eloszlás normális, vagy azzá transzformálható a minta(k) elemei egymástól függetlenek legyenek (a legfontosabb kritérium) ha két minta középértékét hasonlítjuk össze, akkor ezek homoszcedasztikusak legyenek
Student-féle t-próba II. Az értékek megbízhatóságát a saját hibájához viszonyítva mérjük. Így a t-próba esetén a középértéket vagy különbségüket a saját hibájához viszonyítjuk. Ha sokkal nagyobb, mint a hibája, akkor feltételezzük, hogy szignifikáns. t-próba lehet egymintás (megbízhatóbb) önkontrollos kísérlet 0 teoretikus értékhez hasonlítunk sokezer értékből meghatározott átlag vagy többmintás csoportkontrollos kísérlet
Egymintás t-próba (paired t-test) Képlet t[n-1]= x / sx
vagy
t[n-1]= ( x / s)*√n,
x -átlag (= ∑x/n) sx -szórás (= √ s2/n ) s -variancia (= √(∑x2- ((∑x)2/n))/(n-1)) n - darabszám A t értéke annál nagyobb, minél nagyobb az x, minél nagyobb az n és minél kisebb az s. Egymintás t-próba esetén a szabadságfok eggyel kevesebb, mint a megfigyeléspárok száma.
ahol:
Egymintás t-próba II. Példa Új altatószer által létrehozott alvásidő meghosszabbodás szignifikánsnak tekinthető-e vagy sem? No. 1 2 3 4
A +0,7 -1,6 -0,2 -1,2
B +1,9 +0,8 +1,1 +0,1
B-A +1,2 +2,4 +1,3 +1,3
(B-A)2 1,44 5,76 1,69 1,69
5
-0,1
-0,1
0
0
6
+3,4
+4,4
+1
1
7 6 9 10
+3,7 +0,8 0 +2
+5,5 +1,6 +4,6 +3,4
+1,8 +0,8 +4,6 +1,4
3,24 0,64 21,16 1,96
∑ x
7,5 0,75
23,3 2,33
15,8 1,58
38,58
átlag 1,58 szórás 0,389 variancia 1,513 t érték 4,06 t[9] 0,05% 2,262
Valószínűség táblázat A t értékének kiszámítása után összehasonlítandó az adott szabadsági foknál a kívánt valószínűségi szinthez tartotó érték a táblázatban. Az előző példában p=0,05 és a szabadsági fok=9.
Egymintás t-próba III. Vizsgáljuk meg az altatószereket külön-külön is. Az előző esetben az analízis során a B-A különbségről tettük fel, hogy egyforma hatás esetén nulla. Most azt tesszük fel, hogy hatástalanságok esetén az alvási plusz lesz nulla. Az A esetén az xA értékét fogjuk a saját hibájával osztani. Ebben az esetben az SxA 0,566, míg a t értéke 1,33, ami nem jelent szignifikáns változást. A B esetén az xB értékét is a saját hibájával osztjuk. Ebben az esetben az SxB 0,633, míg a t értéke 3,681, ami szignifikáns változást jelent.
Kétmintás t-próba I. Két empiriás minta középértékének összehasonlítására szolgál. A differenciát a saját hibájához hasonlítjuk. A középértékek különbségének varianciája s2*(n1+n2)/(n1*n2) A két középérték differenciájának szórása s √(n1+n2)/(n1*n2) A kétmintás t-próba értéke t[n-2]=(x1-x2)/s* √(n1*n2)/(n1+n2) A kétmintás t-próba szabadságfoka 2-vel kisebb, mint az összes megfigyelés száma.
Kétmintás t-próba II. Példa egy emlősökben nem lévő steroid hormon adása patkányoknál módosítja-e a mellékvese tömegét? Mért értékek kezelt 19,20,24,24,24,24,24,27,24,15,27,27,18,20,23,11,29,21,22,27,20,22,22,19 kontroll 16,20,19,20,20,16,12,11,15,13,20,24,21,19,22 Számított értékek kezelt kontroll n 24 15 s=4,01 x 533 268 t[37]=3,26 x 22,2 17,9 t(0,05)[37]=2,03 ∑x2 12227 49994 Qx 389,96 205,73
Kétmintás t-próba III. Az egymintás t-próba sokkal hatékonyabb! Nézzük meg hogyan befolyásolja az egymintás t-próbánál említett példát, ha a két különböző altatószer hatását két különböző csoporton vizsgáljuk. Ebben az esetben a t[18] értéke 1,86, ami nem szignifikáns eltéres. Ez a különbség abból adódik, hogy az önkontrollos vizsgálatnál csökkenteni tudjuk az egyes emberek különbsége okozta nagy variabilitás zavaró hatását. Fontos!!!! Önkontrollos vizsgálatnál tilos kétmintás tpróbát használni, hiszen az adatok nem függetlenek egymástól. Ugyanazon embernél az A-ra kapott reakció nagysága és a B-re kapotté összefüggést mutat.
Egy- és kétvégű t-tesztek Az egy- és kétvégű t-tesztek azáltal vannak definiálva, hogy az α valószínűség teljesen egy oldalra vagy egyenlően elosztva két oldalra esik. Egyvégű t-tesztet használnak ha az eredmények változása csak egy irányban vizsgálandó. Kétvégű t-tesztet használnak ha az eredmények változása mindkét irányban vizsgálandó. A döntés, hogy egy vagy kétvégű t-tesztet használnak több pontban is befolyásolja a teszteljárást.
Kétvégű t-tesztek A kétvégű t-teszt kettéosztja az α valószínűséget és a két szélre helyezi. A nullhipotézis ebben az esetben egy adott érték és van két alternatív hipotézis, egy pozitív és egy negatív. A t kritikus értéke (tcrit) ekkor plusz és minusz jellel (± ) irandó. Például a t kritikus értéke 10-es szabadsági fok és α=0,05 esetén tcrit= ± 2,228. A kétvégű t-teszt eloszlása látható itt:
Egyvégű t-tesztek I. Ténylegesen két különböző egyvégű t-teszt van, egy-egy mindkét szél számára. Az egyvégű t-tesztben az α-hoz tartozó egész terület egy szélre kerül. A szél megválasztása attól függ, hogy ha a mérés eredménye a várakozások szerint alakul. A szél megválasztásának meg kell előznie a méréseket és a kiértékelést. A pozitív irányban egyvégű t-teszt eloszlása látható itt:
A tcrit most pozitív. Például ha α=0,05 és a szabadsági fok 10 (df=10), tcrit = +1,812.
Egyvégű t-tesztek II. A negatív irányban egyvégű t-teszt eloszlása látható itt:
A tcrit most negatív. Például ha α=0,05 és a szabadsági fok 10 (df=10), tcrit = -1,812.
A varianciaanalízis alapjai I. ANOVA- Analysis Of VAriance A t-próba csak 2 mintát tud összehasonlítani, de azok csak egy szempontban különbözhetnek egymástól. ANOVA több mintát is össze tud hasonlítani és azok több szempontból is különbözhetnek. Egyszempontos varianciaanalízis, többszempontos varianciaanalízis. Bonyolultabb típusok- kovarianciaanalízis, MANOVA, faktoriális kisérletek
A varianciaanalízis alapjai II. Alapkérdés- Kellően nagy-e a csoportok átlagai közt fennálló variabilitás a csoportokon belüli variabilitáshoz viszonyítva? Az összvariabilitás két okra vezethető vissza, egyrészt az azonosan kezelt egyedek sem reagáltak mind egyformán, másrészt a különböző kezeléseknek különböző az átlagos hatása. A számítás menete kiszámítjuk, hogy az észlelt összvariabilitásból mennyit okoz a csoporton belüli és mennyit a csoportok közötti variabilitás, és összevetjük a két komponenst.
ANOVA típusok Anova: Egy faktor. Egyszeres variancia analízis, amely az teszteli, hogy két vagy több minta átlaga egyenlő-e . Ez a technika a két átlagon végzett vizsgálatok (mint a t-teszt) kiterjesztése. Anova: Két faktor ismétlődéssel. Ez a módszer az egyszeres variancia analízis bővítése úgy, hogy minden adatsorból több adatot használ fel. Anova: Két faktor ismétlődés nélkül. Ez a módszer a két faktorú variancia analízis módosítása úgy, hogy minden adatsorból csak egy adatot használ fel. Azt feltételezi, hogy két vagy több minta átlaga egyenlő. Ez a technika a két átlagon végzett vizsgálatok (mint a t-teszt) kiterjesztése.
Lineáris regresszió A Regresszió analízis lineáris regresszió számolást végez a "legkisebb négyzetek" ("least squares") módszerével. Ez azt jelenti, hogy egy egyenest illeszt a mérési eredményekre. Ekkor azt tudjuk elemezni, hogy befolyásol egy függő változót egy vagy több független változó. Például, hogy befolyásolja egy versenyző teljesítményét a kora, magassága és súlya. Így meghatározható ezek részesedése a teljesítményben ha van erre vonatkozó mérés és a kapott összefüggéssel megjósolható egy nem mért versenyző teljesítménye az adatai alapján.
Nemlineáris regresszió A legtöbb nemlineáris regresszió számolás is a "legkisebb négyzetek" ("least squares") módszerével dolgozik. Elyenkor egy ismert függvényt illesztenek a mérési eredményekre. Például, hogy a sejtmembránon belüli töltéselmozdulás vagy az ioncsatornák nyitvatartási valószínűsége Boltzmann eloszlást követ.