MODELOVÁNÍ RIZIKA MORBIDITY LAPAROSKOPICKÝCH OPERACÍ POMOCÍ LOGISTICKÉ REGRESE
Radim Briš Katedra aplikované matematiky, Fakulta elektrotechniky a informatiky, Vysoká škola báňská – Technická univerzita Ostrava 17 listopadu 15, 708 33 Ostrava-Poruba
[email protected]
Abstrakt: Příspěvek se zabývá modelováním speciálních lékařských dat pomocí logistické regresní analýzy. Je provedena analýza logistického modelu POSSUM, převzatého z britského referenčního odkazu, a jeho aplikace na lékařská data získaná z Fakultní nemocnice Ostrava-Poruba. Analýza dat a modelu je provedena pomocí exponenciální verifikační metody. Exponenciální analýza ukázala, že převzatý model není vhodný pro daná data, a proto bylo nezbytné sestavení nového regresního modelu pro vyhodnocení morbidity pro aktuální lékařská data, získaná z otevřených a laparoskopických operací střev a ohodnocená pomocí skórovacího systému. Nový regresní model je nalezen použitím vícerozměrné logistické regrese a posléze verifikován pomocí exponenciální analýzy.
1. Úvod Morbidita po laparoskopických operacích kolorekta je velmi často publikovaným výsledkem různých lékařských studií [3]. Hrubá morbidita ve velkých souborech pro laparoskopickou kolorektální chirurgii je udávána v širokém rozmezí 4 – 26 % ([2]). V konsensu Evropské asociace endoskopické chirurgie pro karcinom kolon se uvádí, že na základě získaných dat se morbidita laparoskopických operací kolon neliší od morbidity operací otevřených. V různých vědeckých lékařských studiích [3] je uvedena řada pozitivních i negativních faktorů pro laparoskopické operace kolon a rekta, které se mohou ve větší či menší míře podílet na morbiditě. Jednou z možností objektivizace dosažených výsledků morbidity a jejich porovnávání je stratifikace pacientů podle rizik a následně srovnání dosažených výsledků a výsledků očekávaných. Předpokladem této stratifikace pacientů je vhodný objektivní skórovací systém. Ideální skórovací systém by měl vycházet z všeobecně dostupných, jednoduchých, snadno zpracovatelných dat a měl by být schopný sofistikované predikce morbidity u širokého spektra chirurgických pacientů. Měl by současně umožnit i analýzu dosažených výsledků. Skórovací systémy v chirurgii usilují obecně o kvantifikaci a tedy objektivizaci rizik chirurgických pacientů. Jedná se zejména o stanovení pravděpodobnosti výskytu komplikací, morbidity. Cílem je tedy numerické vyjádření rizika komplikací u konkrétního pacienta, skupiny pacientů nebo celého souboru. Tyto systémy vychází z charakteristik odrážejících závažnost nemocnění, z popisu předem existujících chorob pacienta nebo z kombinací těchto údajů. Potřebné parametry jsou zpravidla shromážděny a vyhodnocovány na počátku hospitalizace, ale mohou být sledovány i průběžně a závěry se vztahují spíše k průběžným změnám skóre než k jeho absolutní výši. Existuje několik typů skórovacích systémů. První skupinou jsou systémy obecně kvantifikující morbiditu a mortalitu pacientů v celé šíři. Druhou skupinou jsou systémy, které se snaží o stanovení pravděpodobnosti určitého typu komplikací, například kardiálních nebo respiračních. Třetím typem jsou skórovací systémy, vztahující se k určitým situacím nebo specifickým onemocněním. Obecně mohou být chirurgické skórovací systémy také klasifikovány jako předoperační, které se snaží o kvantifikaci rizik pacientů podstupujících
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
operační výkon, a fysiologické hodnotící závažnost stavu nebo onemocnění, vycházející z odpovědi organismu na nemoc nebo poranění (včetně operace), snažící se o prognózu průběhu a výsledku. Tyto systémy se často významně překrývají. Skóre vztahující se na individuálního pacienta určuje jeho individuální prognózu. Získaný výsledek tak může ovlivnit rozhodování o rozsahu vyšetřování, o způsobu a agresivitě léčby, o rozsahu výkonu a předoperační přípravě. Může se takto podílet i na racionalizaci nákladů. Skórovací systémy aplikované na skupiny pacientů dovolí smysluplnou analýzu dosažených výsledků morbidity. Umožní stratifikaci pacientů podle závažnosti stavu, podle jejich rizik a pravděpodobnosti komplikací. Pouze takto lze objektivně srovnávat dosažené výsledky. Skórovací systémy se tak mohou stát objektivním nástrojem zhodnocení kvality chirurgické péče. Předoperační skóre je kvantitativní charakteristika pacienta, která se snaží předoperačně stanovit rizika jednotlivého pacienta, který podstupuje operaci. Vzhledem k tomu, že nejčastější pooperační komplikace jsou kardiorespirační a zároveň jsou tyto komplikace i častou příčinou smrti, zaměřují se některé systémy právě na predikci těchto rizik. Fysiologické skóre závažnosti stavu je kvantitativní charakteristika pacienta, vycházející z fysiologické odpovědi organismu na nemoc nebo poranění. Většinou bylo toto skóre zaměřováno na skupiny kriticky nemocných s tendencí prognózovat spíše pro skupinu pacientů než pro jednotlivce. Jedním z nejpraktičtějších skórovacích systému pro každodenní chirurgickou praxi se stal Physiological and Operative Severity Score for enUmeration of Mortality and morbidity (POSSUM), popřípadě jeho varianta Portsmouth modification of Physiological and Operative Severity Score for enUmeration of Mortality and morbidity (P-POSSUM), aplikované na kolorektální, cévní chirurgii a chirurgii jícnu a žaludku ([2]). 1.1 Skórovací systém POSSUM Hrubá čísla uvádějící morbiditu jsou často zavádějící a zkreslená neboť nezohledňují variabilitu zdravotního stavu hodnoceného souboru pacientů, stav v okamžiku operace, obecný zdravotní stav populace a například ani zavedenou chirurgickou praxi. Neumožňují tak objektivní srovnání dosažených výsledků a problematické je i hodnocení nově zaváděných postupů. Skorovací systém POSSUM byl vyvinut Copelandem a kol. [4] počátkem 90. let. Původně měl sloužit jako nástroj pro srovnávání výsledků mezi jednotlivými institucemi zvláště v případech s výraznými rozdíly v morbiditě a mortalitě. Hodnocení se mohlo dotýkat nejen rozdílů mezi institucemi, ale i mezi individuálními chirurgy či například všeobecnými chirurgy a specialisty. Portsmouth Physiological and Operative Severity Score for the enUmeration of Mortality (P-POSSUM systém) byl zaveden jako modifikace původního Copelandova systému Prytherchem a kol. [5] ve snaze o upřesnění predikce operační mortality u pacientů s nízkým rizikem, kteří představují významnou část chirurgické péče a u nichž se zdála očekávaná předpovězená mortalita výrazně nadhodnocena. POSSUM vznikl z potřeby jednoduchého skórovacího systému, který by byl použitelný napříč celým spektrem chirurgických výkonů. Retrospektivní lineární multivariantní diskriminační analýzou bylo na počátku vyhodnoceno 62 individuálních rizikových faktorů (48 předoperačních, 14 peroperačních a pooperačních). Z těchto 62 faktorů bylo následně stejnou metodikou prospektivně sledováno 35 faktorů a do výsledného skóre byly zahrnuty pouze signifikantně nezávislé rizikové faktory. Koeficient multivariantní diskriminační funkce pro tyto faktory byl modifikován na exponenciální stupnici na hodnoty 1, 2, 4 a 8. Takto bylo získáno fysiologické skóre zahrnující 12 nejdůležitějších parametrů (např. věk, kardiální zátěž, krevní tlak, atd.) a každý parametr měl navíc čtyři možné stupně, jejichž hodnoty narůstaly exponenciálně (1,2,4 a 8).Toto skóre bylo doplněno 6 nezávislými rizikovými parametry chirurgického výkonu (např. závažnost operace, opakované výkony,
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
atd.), které vyjadřovaly závažnost chirurgické intervence a každému z těchto parametrům byly analogicky přiřazeny rovněž čtyři stupně s exponenciálními koeficienty 1, 2, 4 a 8. Souhrnně řečeno, technikou lineární miltivariantní diskriminanční analýzy bylo stanoveno 12 nezávislých faktorů závažnosti fysiologického stavu a 6 nezávislých faktorů závažnosti operačního výkonu (každý faktor s možností čtyř exponenciálních koeficientů 1,2,4 a 8), které se signifikantně podílí na pooperační mortalitě a morbiditě. Logistická regresní analýza pak na hladině významnosti p = 0,001 vyjádřila riziko morbidity následovně : Riziko morbidity (R): ln [R/1 – R] = – 5,91 + (0,16 . PS) + (0,19 . OS) (1) kde PS znamená fysiologické skóre a OS znamená operační skóre. Parametry fysiologického skóre se vztahují k přijetí pacienta nebo k okamžiku bezprostředně předcházejícímu operaci a operační skóre lze doplnit po operačním výkonu. Potřebná data jsou lehce dostupná a lze je získat i retrospektivně u většiny chirurgických pacientů. Vypočtené hodnoty – předpokládaná morbidita pak mohou být srovnávány s aktuální dosaženou morbiditou. POSSUM nezahrnuje takové faktory, jako rozdíly mezi chirurgy, anesteziology nebo operační časy, které mohou rovněž ovlivňovat očekávané výsledky. Je jedním z cílů tohoto systému právě na tyto rozdíly v chirurgické péči poukázat. POSSUM byl ověřován na řadě chirurgických pacientů a byl srovnáván s jinými skórovacími systémy. Byl použit ke srovnání výsledků kolorektální chirurgie jak mezi různými pracovišti, tak mezi jednotlivými chirurgy ([3]). 2. Verifikace modelu aktuálními daty pomocí exponenciální analýzy Byla provedena analýza dat získaných z laparoskopických operací střev, provedených na chirurgickém oddělení Fakultní nemocnice Ostrava-Poruba pomocí exponenciální analýzy, kterou podrobně popíšeme v tomto odstavci. Exponenciální analýza byla poprvé provedena v [6] pro účely porovnání očekávané a skutečně se vyskytující morbidity a mortality. Exponenciální analýzu budeme aplikovat na model POSSUM daný rovnicí (1) pro predikci morbidity. Jednotlivé pacienty rozdělíme do skupin dle R spočtených na základě aktuálních PS a OS, kterou si vyjádříme v procentech. Celou analýzu budeme provádět od skupiny 90-100 a postupně budeme zvětšovat interval po deseti procentech až do doby, kdy bude vyhovovat podmínce, aby předpovídaný počet pacientů s pooperačními komplikacemi měl vzrůstající tendenci (nebo byl stejný) vzhledem k předchozí skupině. Analýzu provádíme zdola nahoru. Jestliže dojde k porušení podmínky, analýza zdola nahoru se zastaví a skupina, u které došlo k porušení podmínky se do analýzy nepočítá. Pokračuje se dále analýzou shora dolů. Pro tuto analýzu je důležitá poslední skupina analýzy zdola nahoru, u které nedošlo k porušení podmínky. Její dolní hranice bude určovat horní hranici skupin u analýzy shora dolů. • • • •
Sloupec skupina v tabulce 1 udává intervaly pro morbiditu pacientů v procentech. Sloupec počet pacientů udává počet pacientů vztahující se k dané skupině. Sloupec skutečný počet udává, kolik pacientů dané skupiny mělo skutečné pooperační komplikace. Sloupec predikce udává předpovídaný (modelový) počet pacientů s pooperačními komplikacemi, spočtený z následujícího vztahu: předpovídaný počet = počet pacientů * dolní hranice skupiny / 100
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
•
Poslední sloupec poměr udává poměr mezi skutečným a předpovídaným počtem pacientů, kteří měli pooperační komplikace. Tato hodnota je velice důležitá pro celý výsledek exponenciální analýzy. Je-li tento poměr roven jedné nebo je statisticky blízký hodnotě jedna, je daný model vhodný pro ocenění morbidity.
Skupina (%) Počet pacientů Skutečný počet Predikce Poměr 0 - 30.00 96 31 9 3.4444 10.00 - 30.00 93 30 9 3.3333 20.00 - 30.00 30 11 6 1.8333 30.00 - 100.00 180 87 54 1.6111 40.00 - 100.00 133 69 53 1.3019 50.00 - 100.00 101 57 51 1.1176 60.00 - 100.00 70 42 42 1.0000 70.00 - 100.00 43 27 30 0.9000 80.00 - 100.00 20 13 16 0.8125 90.00 - 100.00 3 3 3 1.0000 0.00 - 100.00 276 118 63 1.8730 Tabulka 1: Tabulka verifikace exponenciální analýzy
Výsledná tabulka 1 ukazuje, že model daný rovnicí (1) není vhodný na použitá data. Hodnoty 3,4444, 3,3333, 1,8333 nejsou blízké jedné a tudíž dochází k nesrovnalostem mezi předpovídaným a skutečným počtem pacientů s komplikacemi. Skutečný počet komplikací je tedy mnohem větší nežli předpokládaný, což dokumentuje obrázek 1. Tato skutečnost byla motivem k revizi modelu a k následné generaci nového modelu.
Obrázek 1: Poměr skutečných a predikovaných pacientů s komplikacemi (úmrtí)
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
3. Logistická regrese, metoda maximální věrohodnosti pro logistickou regresi
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
π(x) je tzv. logitová transformace, která je dominantní při logistické regresi. Důležitost této transformace spočívá v tom, že g(x) má mnohé žádané vlastnosti lineárního regresního modelu. Logit g(x) je lineární v parametrech, může být spojitý a může se pohybovat v intervalu od -∞ do +∞, v závislosti na x. 4. Generace nového modelu Na základě výše uvedené metody bylo nezbytné vygenerovat nový model pro operační data dodaná z chirurgické kliniky FN Ostrava-Poruba. Data pocházející z otevřených operací střev jsou schematicky znázorněna na obrázku 2.
Obrázek 2: Schematické prostorové znázornění datového souboru
Výsledkem logistické regrese je následující model (2): ln [R/1 – R] = – 2,75257+ (0,08564 . PS) + (0,0654 . OS)
(2)
kde R(PS,OS) = π(PS,OS) v souladu se značením předchozího odstavce.
4. 1 Verifikace nového modelu Verifikace nově generovaného modelu byla provedena standardními testy χ2: byla testována jak vhodnost modelu, tak významnost regresních koeficientů:
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
•
χ2-test dobré shody pro vhodnost použitého modelu
Třída Logitový interval 1 < -0,748892 2 -0,748892 až -0,487402 3 -0,487402 až -0,185379 4 -0,185379 až 0,16175 5 > 0,16175 Celkem
χ2 = 3,11935 …
n 55 55 57 53 54 274
Morbidita 1 Pozorováno Predikce 12 15,7492 24 19,2725 24 23,8842 25 26,0443 33 33,0499 118
počet stupňů volnosti 3 …
Morbidita 0 Pozorováno Predikce 43 39,2508 31 35,7275 33 33,1158 28 26,9557 21 20,9501 156
p-value = 0,373584
Tento test ověřuje hypotézu o tom, zda nová logistická regresní funkce je adekvátní s pozorovanými daty. Jelikož hodnota p-value je větší než 0.10, není důvod zamítat vhodnost použitého modelu na 90% hladině významnosti. • Testy významnosti parametrů logistické regrese [1]: Testy věrohodnostního poměru (Likelihood Ratio Tests) --------------------------------------------------------------------------------------------------Parametr u vysvětlující proměnné: χ2 počet stupňů volnosti p-value ---------------------------------------------------------------------------------------------------PS 11,2341 1 0,0008 OS 5,36464 1 0,0205
Jelikož pro oba koeficienty logistické regrese je hodnota p-value menší než 0.05, oba jsou statisticky významné. 5. Aplikace nového modelu na chirurgická data z laparoskopických operací střev Nový model logistické regrese byl aplikován na data pocházející z chirurgických zákroků, provedených laparoskopickou technikou. Verifikace modelu byla provedena pomocí exponenciální analýzy, jejíž algoritmus je popsán v odstavci 2. Výsledek exponenciální analýzy přináší tabulka 2. Největší shoda mezi skutečností a predikcí připadá na procentuální interval 30-100. U skupin 20 - 30, 40 - 100, 50 - 100, 60 - 100, je hodnota poměru menší než 1, což znamená větší počet předpovídaných komplikací, nežli ve skutečnosti byl, a tedy predikce je svým způsobem mírně pesimistická. Tato vlastnost modelu je však optimistická vzhledem ke vztahu k pacientům. Pokud jsou předpovězeny jisté pooperační komplikace ještě to neznamená, že k nim zaručeně dojde.
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
Tabulka 2: Verifikace exponenciální analýzou pro data z laparoskopických operací
Z grafické demonstrace exponenciální analýzy na obrázku 3 lze vizuálně usoudit, že skutečný počet pacientů s komplikacemi se příliš neliší od predikovaného počtu pacientů s komplikacemi v jednotlivých morbidních skupinách.
Obrázek 3: Poměr skutečných a predikovaných pacientů s komplikacemi (úmrtí) po laparoskop. operacích.
6. Závěr Byla aplikována vícerozměrná logistická regresní analýza na aktuální lékařská data, nahromaděná z otevřených i laparoskopických operací střev. Z databáze přidružené k otevřeným operacím byly stanoveny u jednotlivých pacientů hodnoty skórovacích proměnných PS a OS, které byly použity ke generaci nového modelu logistické regrese poté, co exponenciální verifikační metoda prokázala špatnou shodu mezi skutečným a predikovaným počtem komplikací dle modelu původního (převzatého z referencí). Byl popsán algoritmus exponenciální verifikační metody, která byla převzata na základě širokých zahraničních zkušeností z lékařské praxe z reference [6]. Její aplikace na data z laparoskopických operací z Fakultní nemocnice Ostrava-Poruba prokázala dobrou shodu mezi skutečným a predikovaným počtem pooperačních komplikací, spočteným z nově generovaného modelu.
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006
Další verifikace nového modelu může následovat pomocí standardních χ2 testů vhodnosti použitého modelu, případně pomocí specializovaného Hosmer-Lemeshowova testu [1].
Literatura: [1] Hosmer, D.W., Lemeshow, S.: Applied Logistic Regression, Wiley 2000, ISBN 0-471-35632-8. [2] Senagore, A.J., Delaney, C.P., Duepree, H.J., Brady, K.M., Fazio, V.W.: Evaluation of POSSUM and P-POSSUM scoring systems in assissing outcome after laparoscopic colectomy. Br. J. Surg., 2003, 90, s.1280-1284. [3] Martínek, L.: Aplikace specializovaných skórovacích systémů pro objektivizaci rizik laparoskopických operací kolorekta.Doktorská disertační práce 2006. [4] Copeland, G.P., Jones, D., Walters, M.: POSSUM: a scoring system for surgical audit. Br. J. Surg., 1991, 78, s.356-360. [5] Prytherch, D.R., Whiteley, M.S., Higgins, B., Weaver, P.C., Prout, W.G., Powell, S.J.:
POSSUM and Portsmouth POSSUM for predicting mortality. Physiological and operative severity score for the enumeration of mortality and morbidity. Br. J. Surg., 1998, 85, s.1217-1220. [6] Wijesinghe, L.D., Mahmood, T., Scott, D.J.A., Berridge, D.C., Kent, P.J., Kester, R.C.: Comparison of POSSUM and the Portsmouth predictor equation for predicting death following vascular surgery. Br. J. Surg., 1998, 85, s.209-212. Poděkování: Autor tohoto příspěvku děkuje za finanční podporu ze strany projektu výzkumu a vývoje č. 1M06047 (CQR), který je financován z prostředků MŠMT ČR.
8.
NÁRODNÍ KONFERENCE
STATISTICKÉ DNY
V
BRNĚ, BRNO 27. - 28.
ČERVNA,
2006