Biometria az orvosi gyakorlatban Regresszió Túlélésanalízis ´ Werner Agnes ´ oki ¨ es ´ Informaci ´ os ´ Rendszerek Tanszek ´ Villamosmern
e-mail:
[email protected]
SZDT-09 – p. 1/36
Logisztikus regresszió
SZDT-09 – p. 2/36
´ binaris ´ regresszio´ Logisztikus regresszio, Bináris - a megfigyelt eseménynek csak két állapota van A vizsgált y = 1 esemény lehet pl. • szívinfarktus (bekövetkezett vagy nem következett be
(y = 0)) • transzplantáció eredménye (a beültetett szerv kilöködott ˝
vagy nem) • mutét ˝ (a beteg túléli-e az 5 évet a mutét ˝ után vagy nem)
Ilyen esetekben - az xi független változók egyaránt tartalmazhatnak folytonos és normális adatokat -, az y esemény bekövetkezési valószínuségét ˝ logisztikus regresszióval becsüljük. PN
Az eljárás hasonlít a lineáris regresszióhoz y = a + i=1 bi xi azzal a különbséggel, hogy az egyenlet jobb oldalán álló xi változóktól nem követeljük meg a normális eloszlást. SZDT-09 – p. 3/36
´ regresszio´ Binaris Az xi változók azok a rizikófaktorok, amelyek segítségével becsülni akarjuk az y esemény valószínuségét ˝ (P (y = 1). Ha vesszük az ln[p/(1 − p)] kifejezést, ahol p a vizsgált esemény valószínusége, ˝ akkor ehhez az értékhez a (−∞, +∞) intervallum tartozik. Ez megegyezik az y = a + kifejezés intervallumával.
PN
i=1 bi xi
lineáris regressziós
SZDT-09 – p. 4/36
´ regresszio´ Binaris Legyen u = [x1 , x2 , . . . , xN ] az a vektor, amely a prediktor xi változókat (rizikófaktorokat) tartalmazza. Vizsgáljuk az y = 1 esemény bekövetkezését logisztikus regresszióval. A regressziós modell alakja: PN P (y=1|u) P (y=1|u) ln[ 1−P (y=1|u) ] = ln[ P (y=0|u) ] = a + i=1 bi xi Az ezzel ekvivalens modell: P exp(a+ N bi xi ) P (y = 1|u) = 1+exp(a+Pi=1 N bx) i=1
i
i
Tehát a modell a lineáris regressziót használja az y esemény valószínuségének ˝ a becsléséhez.
SZDT-09 – p. 5/36
Feladat1 ˝ Azt vizsgáljuk, hogy a mutét ˝ utáni 5 éves idoszak túlélésének ˝ ol. ˝ valószínusége ˝ hogyan függ a daganat átmérojét
SZDT-09 – p. 6/36
Feladat1 Ábrázoljuk grafikusan az adatokat:
SZDT-09 – p. 7/36
Feladat1
SZDT-09 – p. 8/36
Feladat1 Végezzük el a logisztikus regressziót a Statistics > Advanced Models > Generalized Linear/Nonlinear modullal!
SZDT-09 – p. 9/36
Feladat1
SZDT-09 – p. 10/36
Feladat1
SZDT-09 – p. 11/36
Feladat1
SZDT-09 – p. 12/36
Feladat1
SZDT-09 – p. 13/36
Túlélésanalízis
SZDT-09 – p. 14/36
Alapok A klinikai vizsgálatok során gyakran szükséges azt vizsgálni, hogy egy esemény mennyi ido˝ múlva következik be. Ez az esemény sok minden lehet pl. • tüdorák ˝ kialakulása • mutét ˝ után a felépülés • kórházból való eltávozás • betegség következtében bekövetkezett halálesemény
˝ nevezzük túlélési idonek. ˝ A megfigyelt idot
SZDT-09 – p. 15/36
Alapok Probléma: • a túlélési ido˝ vizsgálata speciális vizsgálati módszereket
igényel (nem mindenkinél következik be a vizsgált esemény) • a túlélési ido˝ nem normális eloszlású
Történeti háttér: • legeloször ˝ biztosítási statisztikusok használták
életbiztosítással kapcsolatos problémák megoldásánál (Berkson és Gage, 1950) • késobb ˝ továbbfejlesztették a módszert (Cutler és Ederer)
SZDT-09 – p. 16/36
Alapok Definíciók: • Esemény (endpoint, failure): bármilyen megfigyelés
eredménye • Megfigyelési ido ˝ (observation time): az esetek
˝ definiált idointervallum ˝ többségében egy elore • Követés (follow-up): a betegek sorsának figyelése • Kiesett egyének (drop-out): a vizsgálatból kiesett egyének • Visszavonás (withdrawing): pl. együttmuködés ˝ hiánya
miatt egyéneket kizárunk a vizsgálatból • Túlélési ido ˝ (survival time): a megfigyelés kezdetétol ˝ a
vizsgált eseményig eltelt ido˝ • Nem teljes adat (censored data): olyan egyének, akik
’elvesznek’ a megfigyelés során (pl. elköltöznek), de addigi adataikat felhasználjuk SZDT-09 – p. 17/36
Feladat1 A táblázat szívátültetés utáni túlélés vizsgálatára vonatkozik:
SZDT-09 – p. 18/36
Feladat1 Használjuk a Statistics > Advanced Models > Survival menüpontot:
SZDT-09 – p. 19/36
Feladat1 Használjuk a Kaplan & Meier módszert, beállítjuk a vizsgált ˝ idointervallumot és a Censoring indikátort:
SZDT-09 – p. 20/36
Feladat1 Szükséges beállítani a Code for complete responses és Code ˝ for censored responses mezoket:
SZDT-09 – p. 21/36
Feladat1 Használjuk a Survival times vs. cum. proportion surviving gombot az adatok ábrázolásához:
SZDT-09 – p. 22/36
Feladat1 Az eredményül kapott függvény görbe:
SZDT-09 – p. 23/36
Feladat1 Használjuk a Summary: Product-limit survival analysis gombot:
SZDT-09 – p. 24/36
Feladat1 Az Advanced fülön megtekinthetjük a túlélési függvény kvartiliseit:
SZDT-09 – p. 25/36
Feladat2 ˝ a3 Megvizsgáljuk, hogy a túlélési görbe különbözo-e kórházban, ahonnan az adatok származnak. Az eseteik kórházakhoz rendelése a HOSPITAL oszlopban található.
SZDT-09 – p. 26/36
Feladat2 Megadjuk a változókat:
SZDT-09 – p. 27/36
Feladat2 Az összefoglalóban megjelenik egy statisztikai próba eredménye:
SZDT-09 – p. 28/36
Feladat2 Használjuk a Quick fülön a Cumulative proportion surviving (Kaplan-Meier) by group gombot:
SZDT-09 – p. 29/36
Feladat2 A kapott grafikon:
SZDT-09 – p. 30/36
Feladat2 Csak két kórház adatait szeretnénk összehasonlítani:
SZDT-09 – p. 31/36
Feladat2 A két kórház adatainak összehasonlítási eredménye:
SZDT-09 – p. 32/36
Feladat2 Végrehajtunk egy tesztet .
SZDT-09 – p. 33/36
Feladat2 A teszt eredménye, hogy elutasítjuk azt a hipotézist, hogy a két kórház között nincs különbség.
SZDT-09 – p. 34/36
Feladat3 Vizsgáljuk meg, hogy a túlélési ido˝ hogyan függ a betegek életkorától! Statistics > Advanced Models > Survival > Regression models
SZDT-09 – p. 35/36
Feladat3 A kapott eredmények: látható, hogy a regresszió szignifikáns
SZDT-09 – p. 36/36