MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA CENTRUM PRO VÝZKUM TOXICKÝCH LÁTEK V ŽIVOTNÍM PROSTŘEDÍ INSTITUT BIOSTATISTIKY A ANALÝZ
MODELY PREDIKUJÍCÍ INCIDENCI ZHOUBNÝCH NÁDORŮ NA PŘÍKLADU ZHOUBNÉHO MELANOMU V ČR
Mariya Antonova Bakalářská práce
Vedoucí práce: doc. RNDr. Ladislav Dušek, Dr
Brno
2011
Prohlašuji, že jsem bakalářskou práci na téma: Modely predikující incidenci zhoubných nádorů na příkladu zhoubného melanomu v ČR vypracovala sama na základě pokynů a rad vedoucího, s využitím zázemí pracoviště, a že veškeré použité zdroje informací jsou v práci řádně citovány.
V Brně dne .........................................
Podpis: ........................................
Poděkování Ráda bych poděkovala doc. RNDr. Ladislavu Duškovi, Dr. za vedení a pomoc při tvorbě bakalářské práce. Dále RNDr. Janu Mužíkovi za čas strávený při konzultacích a za poskytnutí cenných rad a připomínek. Také RNDr. Ondřeji Májkovi za odbornou pomoc.
Obsah ANOTACE
6
ABSTRACT
7
ÚVOD A CÍLE PRÁCE
8
1. ÚVOD DO PROBLEMATIKY ZHOUBNÉHO MELANOMU
9
1.1. CO JE ZHOUBNÝ MELANOM?
9
1.2. RIZIKOVÉ FAKTORY
10
1.3. EPIDEMIOLOGIE
12
1.4. ABCDE PRAVIDLO ROZPOZNÁNÍ MELANOMU
14
1.5. ROZDĚLENÍ ZHOUBNÉHO MELANOMU DO STADIÍ PODLE CLARKA, BRESLOWA A TNM
14
1.6. LÉČBA
15
1.7. SOUČASNÝ VÝZKUM
16
2. EPIDEMIOLOGICKÁ ANALÝZA DAT O MELANOMU KŮŽE (C43, D03) V ČESKÉ REPUBLICE
17
2.1. ZÁKLADNÍ POJMY
17
2.2. NOR A KVALITA DAT O ZHOUBNÉM MELANOMU
18
2.3. VYHODNOCENÍ EPIDEMIOLOGICKÝCH CHARAKTERISTIK
25
3. METODIKA PREDIKTIVNÍCH ANALÝZ 3.1. REŠERŠE METOD
27 27
3.1.1. Metodika analýzy časových řad
28
3.1.2. Regresní modely
31
3.1.3. Srovnání predikčních modelů
40
3.2. METODIKA HODNOCENÍ POPULAČNÍHO PŘEŽITÍ
43
4. APLIKACE REGRESNÍCH MODELŮ A MODELŮ ČASOVÝCH ŘAD NA DATA NOR O ZHOUBNÉM MELANOMU 45 4.1. DATA A VÝBĚR MODELŮ
45
4.2. PREDIKCE INCIDENCE, MORTALITY A PREVALENCE
46
ZÁVĚR
48
POUŽÍVANÉ ZKRATKY
49
SEZNAM TABULEK
50
SEZNAM OBRÁZKŮ
51
SEZNAM LITERATURY
53
PŘÍLOHA A: EPIDEMIOLOGIE MELANOMU KŮŽE (C43, D03) V ČESKÉ REPUBLICE PŘÍLOHA B: GRAFICKÉ VIZUALIZACE A TABELÁRNÍ SOUHRN PROVEDENÝCH PREDIKCÍ INCIDENCE, MORTALITY A PREVALENCE ZHOUBNÉHO MELANOMU (C43) V ČESKÉ REPUBLICE ZA OBDOBÍ 2008 – 2011.
Anotace Predikce incidence zhoubných nádorů je nutná z mnoha administrativních a vědeckých důvodů. Tato bakalářská práce má za cíl popsat a hodnotit metodiku predikce incidence a na základě epidemiologických analýz vybrat model pro predikci incidence, mortality a prevalence zhoubného melanomu v České republice pomocí vhodného statistického software. První kapitola obsahuje úvod do problematiky zhoubného melanomu – obecný popis onemocnění a jeho typy, rizikové faktory, epidemiologický přehled, diagnostická kritéria, léčbu a současný výzkum v dané oblasti. Dále jsou zmíněny základní epidemiologické pojmy, které následuje rozbor kvality dat Národního onkologického registru a popis vlivu TNM klasifikace na úplnost záznamů z hlediska jejich využití pro populační analýzy. Další část práce je praktická a zabývá se vyhodnocením epidemiologických charakteristik zhoubného melanomu v České republice za období 1977 – 2007. Modelovat incidenci a mortalitu lze pomocí modelů časových řad nebo regresních modelů. V nejrozsáhlejší části práce jsou jednotlivé metody popsány a následně ve srovnání predikčních modelů jsou zmíněny jejich výhody a nevýhody. Třetí kapitola je také doplněna o krátký souhrn metodiky hodnocení populačního přežití. Závěr práce je věnován aplikaci modelu ARIMA (1,1,0) a poissonovské regrese na data NOR o zhoubném melanomu za období 1995 – 2007. Predikce incidence, mortality a prevalence je vytvořena pro období 2008 – 2011, realizace výpočtů je provedena v prostředí SPSS a R 2.12.0. Vizualizace a tabelární souhrn epidemiologických analýz i provedených predikcí jsou umístěny v přílohách na konci práce.
Klíčová slova: zhoubný melanom, rizikové faktory, epidemiologie, incidence, mortalita, prevalence, věková standardizace, NOR, TNM klasifikace, dlouhodobý trend, predikce, klinické stadium onemocnění, modely časových řad, regresní modely, poissonovská regrese, ARIMA.
6
Abstract Prediction of cancer incidence is needed for many administrative and scientific reasons. This bachelor thesis aims to introduce the methodological background for the prediction of incidence rates of malignant tumors and on the basis of the epidemiological analyses to choose a proper model for prediction of incidence, mortality and prevalence rates of malignant melanoma in the Czech Republic using the appropriate statistical software. The first chapter contains introduction to some malignant melanoma issues such as general cancer description and melanoma types, risk factors, epidemiological survey, diagnostic criteria, treatment and current research. Furthermore basic epidemiological terms are mentioned. This part of bachelor thesis is followed by quality analysis of the Czech National Cancer Registry data and by description of the TNM classification and its influence on the completness of records entirety with regard to their usage for population analysis. Next chapter is practical and deals with the evaluation of malignant melanoma epidemiological characteristics in the Czech Republic for the period 1977 – 2007. Incidence and mortality rates can be predicted using time series or regression models. Various methods are described in the theoretical part of the thesis, consequently their advantages and disadvantages are critically discussed in the comparison with other predictive models. The third chapter is also supplemented by a brief summary of the methodology of population survival estimates. The final part is devoted to the application of the ARIMA (1,1,0) model and poisson regression on the CNCR malignant melanoma data for the period 1995 – 2007. Predictions of incidence, mortality and prevalence rates are made for the period 2008 – 2011, calculations are performed in SPSS and R software. Visualization and tabular summary of the epidemiological analysis and the estimated predictions are attached at the end of this bachelor thesis.
Key words: malignant melanoma, risk factors, epidemiology, incidence rate, mortality rate, prevalence rate, age standardization, CNCR, TNM classification, long-term trend, prediction, clinical stage of disease, time series models, regression models, Poisson regression, ARIMA.
7
Úvod a cíle práce Nedílnou součástí boje proti rakovině je plánování budoucí populační onkologické zátěže. Její predikce, ať už z hlediska počtů nových nádorových onemocnění nebo úmrtí na ně, je dost riskantní, neboť často není jistota v tom, že pozorované v minulosti trendy zůstanou zachovány v budoucnu. Nicméně, jsou-li predikce spolehlivé, pak mohou být velice přínosné pro optimalizaci nákladů ve zdravotnictví. Predikce incidence je nutná z mnoha administrativních a vědeckých důvodů. I přesto, že se uvažuje o tom, že se rakovina vyvíjí náhodně a proto je těžce předvídatelná v jakémkoliv stadiu na jakékoliv úrovni přesnosti, hodně moderních výzkumů je věnováno dané problematice. Incidence zhoubného melanomu celosvětově roste a následně se zvětšuje potřeba hlubšího zkoumání prevence, příčin, průběhu a léčby tohoto nádorového onemocnění. Česká republika není v daném ohledu výjimkou a rakovinu kůže má čím dál více lidí. Incidence zhoubného melanomu vykazuje v české populaci významně rostoucí trend, v jehož důsledku se počet ročně nově diagnostikovaných pacientů za posledních 25 let více než zčtyřnásobil. Proto rozbor rizikových faktorů, provedení epidemiologických analýz a predikce počtu nově diagnostikovaných onemocnění na melanom kůže je aktuální téma současné doby. Predikce se z matematického hlediska liší od většiny statistických analýz hlavně tím, že objektivní informace, která se nachází ve vzorku, je rozšířena mimo jeho meze. Z uvedeného důvodu je důležité na základě jistých epidemiologických znalostí a spolehlivých údajů správně zvolit predikční model, který poskytuje dobrý odhad budoucích hodnot. Důležitý je také výběr škály predikce. Kvalita modelu je hodně ovlivněna kvalitou dat, která mohou být poškozená, například, změnou v klasifikaci nebo změnou způsobu registrace pacientů. V následujícím textu se budeme zabývat zpracováním metodiky predikce incidence, konkrétně analýzou časových řad a regresními modely. Tato bakalářská práce si nejprve klade za cíl provést audit dostupných populačních dat o zhoubném melanomu, popsat a vyhodnotit epidemiologické charakteristiky a dlouhodobé trendy za období 1977 – 2007. Následně se bude zabývat metodikou postupu prediktivních analýz zhoubných nádorů shrnující zejména regresní modely pro predikce incidence. Práce je doplněna o tabelární a grafický souhrn provedených predikcí incidence, mortality a prevalence zhoubného melanomu pro období 2008 – 2011 pomocí modelů časových řad a regresních modelů.
8
1. Úvod do problematiky zhoubného melanomu Rakovina. Tajemství spojené s touto chorobou je natolik velké, že se její výskyt v některých společnostech a kulturách zamlčuje, daný termín je málo používaný a o rakovině se nemluví. V tom je jistá míra tragické ironie. Nádorová onemocnění v současné době jsou velmi rozšířená a jsou po kardiovaskulárních chorobách druhou nejčastější příčinou úmrtí a invalidity ve světě. Každý rok rakovina zabíjí více lidí než AIDS, tuberkulóza a malárie dohromady. Roční mortalita je šestkrát větší než roční počet obětí dopravních nehod. Rakovina je globální výzvou (Beaulieu a kol., 2009). Více nově registrovaných nádorových onemocnění a úmrtí na rakovinu je dnes pozorováno v zemích s nižšími a středními příjmy. V místech, kde incidence nádorů roste nejrychleji, ticho, které doprovází chorobu, je často výsledkem kompletního nedostatku smysluplné informace, rakovina může nebýt správně nebo vůbec diagnostikována a léčena, což mívá letální následky. Dokonce i poté příčina úmrtí často zůstává neznámou. Absence aktivního přístupu a zamlčování problémů v daných regionech přidává další pohled na věc a je projevem skryté, ale rostoucí epidemie. I když se svět pomalu probouzí a reaguje na stále zvětšující se nádorovou zátěž, kterou se dá srovnat s narůstající vlnou, jednání, zaměřená na boj s krizí, jsou nedostatečná. Zhoubný melanom je nádorové onemocnění, které v absolutních číslech patří stále mezi vzácnější, snad proto je většina lékařů seznámena s jeho problematikou jen velmi povrchně (Krajsová, 2006). Jeho prognóza přitom zcela závisí na tom, v jakém stadiu je stanovena diagnóza, resp. na tom, kdy lékař vysloví na tuto diagnózu podezření. Melanom přitahuje čím dál tím víc pozornosti odborníků i laiků, poněvadž jeho průběh je nepředvídatelný a velmi často letální (Krajsová, 2008). 1.1. Co je zhoubný melanom? Melanom (podle 10. vydání Mezinárodní klasifikace nemocí (MKN-10) se nazývá zhoubný melanom; též se používá termín maligní melanom) je zhoubný nádor pigmentových buněk obsahujících melanin. Maligní melanom kůže vzniká neoplastickou proliferací kožních melanocytů – buněk tvořících pigment (Fikrle a Pizinger, 2010). Vyskytuje se hlavně na kůži, ale může být i na sliznicích či v oku. Může se objevit na původně úplně čisté kůži, avšak častěji vzniká v místě vrozených (kongenitálních), získaných či dysplastických mateřských znamének. Různé vědecké zdroje uvádí původ melanomu v 30 – 70% případů na podkladě pigmentového névu, zbytek de novo. Dané prohlášení je dost sporné, protože jen malé procento pacientů je schopno si s jistotou vzpomenout na preexistenci útvaru. Onemocnění se zpravidla projevuje jako tmavá pigmentová skvrna, existují ovšem i amelanotické formy, které mají nestejnorodou barvu, nepravidelné okraje a mohou svědit či krvácet. Melanom roste ve dvou fázích: horizontálně-radiální, kdy se atypické melanocyty šíří epidermis, a vertikální, kdy melanomové buňky pronikají do koria a zde se množí. Do vertikální fáze přejde v průběhu doby většina nádorů (URL 1). Klinicky a histologicky se rozlišuje 4 typy maligního melanomu:
Povrchově nebo superficiálně se šířící melanom (SSM). SSM tvoří 70% všech maligních melanomů. Vyznačuje se horizontálním růstem, jeho okraje jsou zpočátku relativně pravidelné, ale později získávají typické nepravidelné melanomové kontury. U žen se obvykle vyskytuje na bércích nebo stehnech a u mužů v horních partiích trupu.
Nodulární melanom (NM). NM reprezentuje 20% všech melanomů a zaujímá tak druhé místo v četnosti tohoto nádoru. Vyznačuje se rychlým vertikálním růstem na podkladě pigmentového znaménka nebo vzniká na klinicky zdravé kůži. Pro něj je charakteristický již od počátku patrný hrbol vyvýšený nad okolní kůži, který však také znamená, že nádor 9
prorůstá do větší hloubky. Je vysoce agresivní. Zvláštní klinickou formou je amelanotický melanom s chyběním pigmentu, napodobující granulační tkáň.
Lentigo maligna melanom (LMM). LMM vzniká na podkladě lentigo maligna, převážně na obličeji u starších osob. Jedná se o plošná ložiska, na nichž se střídají světlejší a tmavší odstíny hnědé barvy. Projev může dosahovat v průměru až 10 cm a k vertikálnímu růstu dochází až po mnoha letech. Prognóza bývá poměrně příznivá.
Akrolentiginózní melanom (ALM). Klinicky se jedná o nodulární melanom nebo povrchově se šířící melanom v charakteristické lokalizaci bez přítomnosti vlasových folikulů, tedy na dlaních, ploškách nebo pod nehty. Daná forma je záludná v tom, že může zpočátku vypadat jako bradavice, modřina či mozol. Prognosticky je tento typ nejrizikovější.
Zhoubný melanom je více nebezpečný než ostatní typy rakoviny kůže. Na rozdíl od epiteliálních kožních nádorů, jako je basaliom nebo spinaliom, se melanom nevyznačuje lokálním destruktivním růstem, ale nebezpečím časného hematogenního či lymfogenního metastazování (URL 1). 1.2. Rizikové faktory Příčina vzniku zhoubného melanomu zatím není přesně známa. Nedá se jednoznačně říct, co způsobuje dané nádorové onemocnění, nicméně různé vědecké zdroje uvádí řadu rizikových faktorů, které se podílejí na jeho rostoucím výskytu. Avšak zase není shoda v jejich seřazení podle stupně rizika. Příklad vyjmenování a ocenění rizikových faktorů je znázorněn v tabulce 1. Lze vidět, že lidé s dysplastickými névy s rodinnou anamnézou a s osobní anamnézou melanomu mají 500 krát větší riziko vzniku rakoviny kůže. Vysoké riziko onemocnění je i u lidí s dysplastickými névy s rodinnou anamnézou ale bez osobní anamnézy melanomu a u lidí s névy, které mění tvar, barvu, velikost atd.
10
Tab. 1: Nejvýznamější rizikové faktory vzniku zhoubného melanomu (Rhodes, 1999). Rizikový faktor
Stupeň rizika
Již existující nebo nově vzniklé névy, které se vzhledově Vysoké (10-400 krát větší) změnily Dysplastické névy s rodinnou anamnézou a osobní Velmi vysoké (500 krát větší) anamnéza melanomu Dysplastické névy s rodinnou anamnézou a není osobní Vysoké (148 krát větší) anamnéza melanomu Dysplastické névy bez rodinné anamnézy a není osobní anamnéza melanomu
Středně vysoké (7-27 krát větší)
Kongenitální névy
Středně vysoké (2-21 krát větší)
Příslušnost k bělošské rase
Středně vysoké (20 krát větší)
Lentigo maligna
Středně vysoké (10 krát větší)
20 znamének s diametrem nejméně 2 mm (50 znamének Středně vysoké (7-54 krát větší) a více) 5 znamének s diametrem nejméně 5 mm (12 znamének a Středně vysoké (10-41 krát větší) více) 5-8 znamének s diametrem nejméně 7 mm (50 znamének Středně vysoké (6-17 krát větší) a více) Osobní anamnéza melanomu
Středně vysoké (9 krát větší)
Melanom u blízkého příbuzného
Středně vysoké (10 krát větší)
Imunosuprese
Střední (4 krát větší)
Pihy ze slunce
Střední (3 krát větší)
Zvýšená citlivost na slunce
Střední (3 krát větší)
Zrzavé nebo blond vlasy, zelené nebo modré oči
2 krát větší
Expozice UV záření
Záleží na typu kůže a jiných rizikových faktorech
Následující souhrn reprezentativně představuje rizikové faktory vzniku maligního melanomu (Dvořáková a Třísková, 2009; Fikrle a Pizinger, 2010; URL 2): •
Přítomnost pigmentových névů. Více než 50 mateřských znamének na těle znamenají zvýšené riziko vzniku melanomu. Přítomnost a obzvlášť velký počet dysplastických névů.
•
Světlá kůže (fototyp I a fototyp II). Menší množství melaninu v kůži znamená, že UV záření může snadněji ji poškodit. Blond nebo zrzavé vlasy, světlá barva očí a náchylnost ke spálení od slunce zvyšují pravděpodobnost vzniku melanomu.
•
Expozice UV záření, zejména opakovaná nadměrná expozice v dětském věku. Rizikové jsou i časté pobyty u moře, aktivity na slunci, pravidelné návštěvy solárií. Jeden nebo více závažných spálenin od slunce v mladším věku mohou zvýšit riziko vzniku rakoviny kůže v dospělosti.
•
Genetická dispozice. Rodinná a osobní anamnéza melanomu. Jiné nádory kůže. Lidé, kteří měli jiné typy rakoviny kůže, mají vyšší riziko vzniku choroby. 11
•
Oslabený imunitní systém. To zahrnuje lidi, kteří mají HIV / AIDS nebo měli transplantaci orgánů.
•
Bydlení poblíž rovníku nebo ve vyšší nadmořské výšce.
•
Věk, pohlaví, zaměstnání.
1.3. Epidemiologie Během několika posledních desetiletí incidence maligního melanomu vzrostla u obou pohlaví téměř ve všech rozvinutých státech, obzvlášť se tento problém týká zemí s převažující populací bělochů. Roční nárůst incidence obecně dosáhl 3 – 7%, avšak samozřejmě se liší v závislosti na zeměpisné šířce (Diepgen a Mahler, 2002). Tak, například, program SEER (The Surveillance, Epidemiology and End Results) uvádí, že v roce 2005 v USA počet nově registrovaných nádorových onemocnění byl o 600% větší ve srovnání s rokem 1950. V letech 1970 – 1980 se incidence celosvětově zdvojnásobila, nyní již nárůst není tak prudký a představuje v Evropě průměrně 12 pacientů na 100 000 obyvatel, v jihozápadních státech USA a v Austrálii přes 40 zhoubných melanomů na 100 000 obyvatel (největší výskyt v Queenslandu, na Novém Zélandu a v Austrálii, a to u bělochů až 60 nádorových onemocnění na 100 000 obyvatel) (Lens a Dawes, 2004). Větší riziko vzniku melanomu je u bílé rasy, u černochů a asiatů se odhaduje incidence asi na 0,1 nově registrovaných zhoubných nádorů na 100 000 obyvatel (Fikrle a Pizinger, 2010). V současné době připadá v České republice na 100 000 obyvatel 20 – 24 nově hlášených melanomů. V této částí své bakalářské práce představuji pouze obecný přehled epidemiologie maligního melanomu, v kapitole číslo dva bude proveden podrobnější rozbor epidemiologických charakteristik. Z hlediska epidemiologických analýz na celosvětové úrovni je velice užitečný projekt GLOBOCAN, který zpřístupňuje odhady incidence, prevalence a mortality 27 nádorových onemocnění pro všechny země světa. Momentálně na web-stránkách GLOBOCANu jsou dostupné odhady pro rok 2008 (URL 3). Obr. 1: Odhady hrubé incidence zhoubného melanomu celosvětově. Počet nově registrovaných zhoubných melanomů na 100 000 osob (všechny věkové skupiny, obě pohlaví). GLOBOCAN 2008 (URL 3 ).
12
Z obrázku 1 lze vidět, že v roce 2008 nejvíce zhoubných melanomů bylo zaregistrováno v Austrálii a na Novém Zélandu, 54,3 a 52,6 nově hlášených nádorových onemocnění na 100 000 obyvatel. Za nimi jsou Švýcarsko, Dánsko a Norsko, 29,2, 26,6 a 26,5 maligních melanomů na 100 000 obyvatel. Česká republika je na 11. místě s incidencí 19,7 nově registrovaných zhoubných nádorů na 100 000 obyvatel. Na opačné straně jsou Bahamy, Bahrajn a Barbados s nulovou incidencí, Spojené Arabské Emiráty a Indie s incidencí 0,1 nádorových onemocnění na 100 000 obyvatel. Zvyšuje se také počet úmrtí na zhoubný melanom. Podle zprávy WHO (World Health Organization) v celém světě ročně zemře v souvislosti s melanomem okolo 48 000 lidí. Obrázek 2 znázorňuje odhady hrubé mortality v roce 2008. Nejvyšší úroveň mortality je na Novém Zélandu a v Austrálii, 6,8 a 5,8 registrovaných úmrtí na zhoubný melanom na 100 000 obyvatel. Dále následují Norsko, Švédsko a Slovinsko, 5,7, 5,4 a 4,7 úmrtí na 100 000 obyvatel. Česká republika zaujímá 18. místo s mortalitou 3,4 registrovaných úmrtí na zhoubný melanom na 100 000 obyvatel. Nulovou mortalitu mají, například, Spojené Arabské Emiráty, Bahamy, Bahrajn, Samoa. Obr. 2: Odhady hrubé mortality zhoubného melanomu celosvětově. Počet registrovaných úmrtí na zhoubný melanom na 100 000 osob (všechny věkové skupiny, obě pohlaví). GLOBOCAN 2008 (URL 3).
Ženy bývají postiženy častěji než muži, a to v poměru 1,5 − 2 : 1. V poslední době je popisován posun začátku vzniku maligního melanomu do mladších věkových skupin (Čap a kol., 2005), ovšem daný závěr mohl být udělán bez ohledu na změny věkové struktury populace a proto nemusí odrážet realitu. Zatímco dříve melanom byl diagnostikován mezi 60. a 70. rokem, nyní jsou pozorována dvě maxima, a to mezi 30 – 40 lety a v 60 letech věku. Do puberty je vznik dané choroby velmi vzácný. U žen ve věku mezi 20 – 30 lety je melanom jedním z nejčastějších maligních nádorů (URL 4; Heistein a Ruberg, 2000).
13
1.4. ABCDE pravidlo rozpoznání melanomu Každý melanom vzniká jako plošné ložisko bez schopnosti metastazovat. Pokud je diagnostikován v této fázi, stačí jeho odstranění. Pro vyslovení podezření na nádorové onemocnění jsou důležité změny vzhledu, k popisu kterých je z angličtiny užíván akronym ABCDE. Toto pravidlo shrnuje příznaky signalizující přeměnu klidného pigmentového znaménka na maligní melanom. A (asymmetry): asymetrie Pigmentové névy vytvářejí víceméně pravidelná ložiska, maligní melanom má obvykle asymetrický tvar, který se s postupujícím procesem zvýrazňuje. B (border): ohraničení, okraje Hranice skvrny by měla být ostrá a pravidelná. Neostré ohraničení nebo nepravidelné výběžky a zářezy do okolí jsou příznaky rakoviny. C (colour): barva Melanom má již od počátku výraznou, někdy skvrnitou pigmentaci, s odstíny hnědé, černé či šedé barvy. D (diameter): průměr Velikost melanomu je větší než většiny pigmentových névů, minimálně 6 mm alespoň v jednom rozměru. E (elevation): vyvýšení, elevace Na rozdíl od pigmentového névu se melanom trvale zvětšuje. Změna v elevaci je již známkou pokročilého stavu. (Čap a kol., 2005). Pokud se objeví na kůži ložisko, které splňuje 2 nebo více z parametrů ABCDE, měl by pacient vyhledat odborného lékaře. Často změny vzhledu, představené ABCDE pravidlem, doprovází pocit šimrání či svědění. Krvácení z tumoru je již příznakem pozdě rozpoznaného onemocnění a signalizuje nepříznivou prognózu. Pozdními příznaky jsou i zánětlivý lem, ulcerace či satelitní metastázy. Mezi další metody vyšetření patří ruční dermatoskop, který dokáže prostřednictvím osvětlené lupy zvětšit ložisko zhruba desetkrát. V současné době se stále více uplatňuje použití digitálního dermatoskopu (vyšetřované znaménko zvětšuje padesátkrát), který znaménko počítačově zpracovává a údaje navíc ukládá s možností kontroly s odstupem času. Nejdůležitější vyšetření, které pak absolutně potvrdí či vyloučí klinicky stanovenou diagnózu, je histologické (mikroskopické) vyšetření chirurgicky odstraněného ložiska. 1.5. Rozdělení zhoubného melanomu do stadií podle Clarka, Breslowa a TNM. Rozdělení maligního melanomu do klinických stadií je založeno na histologickém zhodnocení podle Breslowa a Clarka. V roce 1970 Alexandr Breslow prohlásil hloubku invaze za prognostický faktor. Po něm je pojmenována klasifikace tumoru podle tloušťky, která v současné době je přiznána dobrým prediktorem chování nádoru a je zahrnuta v pracovní pokyny pro AJCC (American Joint Committe on Cancer). Tak, například, hloubka invaze do 0,75 mm znamená téměř stoprocentní pětileté přežití, když melanom proniká více než na 3 mm, přežití klesá na 45% (Heistein a Ruberg, 2000). Clarkova klasifikace vyjadřuje stupně hloubky invaze tumoru z hlediska pronikání do jednotlivých histologických vrstev kůže či podkoží. 1. stupeň je melanoma in situ, protože nádor neprorůstá bazální membránou. 2. stupeň znamená průnik nádoru přes bazální membránu do 14
stratum papilare. 3., 4. a 5. stupně charakterizují infiltrace stratum papilare, stratum retikulare a podkoží. V letech 1943 až 1952 P. Denoix vypracoval TNM (The TNM Classification of Malignant Tumors) systém, který se s vývojem vědy a s novými poznatky rozvíjel a upravoval. Současné 6. vydání TNM klasifikace obsahuje pravidla klasifikace a rozdělení do stadií, která se přesně shodují s pravidly v 6. vydání AJCC Cancer Staging Manual (2002), a která byla schválena všemi národními komisemi pro TNM. TNM systém je založen na určení tří složek: T – rozsah primárního nádoru, N – nepřítomnost či přítomnost a rozsah metastáz v regionálních mízních uzlinách, M – nepřítomnost či přítomnost vzdálených metastáz. Pro každou lokalizaci existují dvě klasifikace: klinická (předléčebná, označována jako TNM) a patologická (pooperační histopatologická, označována jako pTNM). Po stanovení kategorií T, N, M (případně pT, pN, pM) lze určit stadium onemocnění (Sobin a Wittekind, 2002). Pro ukázku v tabulce 2 je znázorněno rozdělení zhoubného melanomu do stadií dle 5. vydání TNM klasifikace. Tab. 2: Rozdělení zhoubného melanomu do stadií dle 5. vydání TNM (Sobin a Wittekind, 1997). Stadium 0
pTis
N0
M0
Stadium I
pT1
N0
M0
pT2
N0
M0
Stadium II
pT3
N0
M0
Stadium III
pT4
N0
M0
jakékoliv pT
N1, N2
M0
jakékoliv pT
jakékoliv N
M1
Stadium IV 1.6. Léčba
Po stanovení klinické diagnózy melanomu se vždy provádí chirurgická excize. V závislosti na typu nádoru a jeho tloušťce se určuje šířka odstranění tzv. ochranného lemu. Pro SMM je předepsána excize s centimetrovým lemem zdravé kůže, lehce vyklenutý melanom je vyoperován s dvoucentimetrovým lemem, pro nodulární pokročilý tumor je doporučována šířka 3 cm. Z původního ložiska se nádorové buňky mohou šířit různými cestami, nejčastější u maligního melanomu je šíření mízními cévami. Pacienti, kteří mají očekávanou nebo již histopatologicky stanovenou tloušťku tumoru větší než 1 mm jsou indikováni k vyšetření první spádové (sentinelové) uzliny, kde se vychytávají a nějakou dobu akumulují nádorové buňky. V případě, že se prokáže jejich přítomnost, provede se následné odstranění všech uzlin ve spádové oblasti. Pomocí základních vyšetřovacích metod, jako sonografie (ultrazvukové vyšetření) břicha, mízních uzlin a RTG (rentgenové vyšetření) plic, se u pokročilejších melanomů ověřuje, jestli se nádorové buňky nedostaly do jiných vnitřních orgánů krevní cestou. Dále následuje zařazení pacienta do příslušného stadia. Obecně se dá říct, že se do stadia I nebo II zařadí pacienti s prokázaným postižením melanomem pouze kůže. III. stadium je charakterizován již průnikem melanomových buněk do spádových mízních uzlin a také kožními nebo podkožními metastázami, které se nacházejí buď v bezprostředním okolí nádoru, nebo v prostoru mezi nádorem a spádovou mízní uzlinou. Pacienti diagnostikováni IV. stadiem mají vzdálené metastázy na kůži, v mízních uzlinách nebo ve vnitřních orgánech. Pro pacienty v I. a IIa, stadiu je předepsáno pouze chirurgické odstranění tumoru. Ve stadiu IIa. a III. se podává interferon alfa, případně se provádí chirurgické odstranění kožních a podkožních metastáz, aktinoterapie, intralezionální imunoterapie, kryoterapie, laserová terapie, lokální terapie imiquimodem. Pacienti se vzdálenými metastázami jsou léčeni chemoterapií. Lékem volby je cytostatikum dakarbazin.
15
Chirurgickou léčbu musí následovat pravidelné kontroly (dispenzarizace), protože se riziko vzniku metastáz se stoupajícím stadiem zvyšuje. Pacienti s jedním melanomem jsou ohroženi vznikem druhého, tzv. duplicitního, melanomu mnohem častěji než ostatní. Navíc, 50% metastáz u maligního melanomu vzniká během pěti let od chirurgické léčby primárního tumoru. Pozdní metastázy (po deseti letech po odstranění melanomu) jsou sice vzácné, ale možné, proto by měla být následná péče v jisté míře doživotní. 1.7. Současný výzkum Zatím se moc nedaří zastavit stoupající incidenci maligního melanomu, i když se provádí rozsáhlé preventivní programy. Rovněž není objeven lék, který by významně prodlužoval celkové přežití pacientů v metastatickém stadiu IV. Avšak výsledky nedávných vědeckých studií naznačují možné náhlé změny díky novému pohledu na pochopení mechanismů, které vedou k neregulovanému růstu nádorových buněk. Je známo, že z molekulárně biologického hlediska melanom je heterogenním útvarem a proto léčba by měla být specifická, ovlivňující příslušné antigenní struktury (Arenbergerová, 2010). Rok 2010 můžeme považovat za zlom v pohledu na metastazující formu melanomu. V poslední době se výzkum zaměřil na zkoumání genetické podstaty rakoviny, obzvlášť onkogenů. Publikace z časopisu The New England Journal of Medicine pojednává o vynálezu nové účinné látky, zaměřené na potlačení následků mutace BRAF V600E. Gen BRAF (serin/threoninproteinkináza B-Raf) kóduje důležitý v regulaci signální kaskády MAPK/ERK (mitogenem aktivovaná proteinkináza/extracelulární signálem regulována kináza) protein, který ovlivňuje buněčné dělení, diferenciaci a sekreci. Mutace má název V600E, protože se v 90% jedná o záměnu glutamátu za valin na pozici 600, která vede k aktivaci BRAF a následné signální transdukci v MAP kinázové kaskádě. Mutace často vzniká kvůli dlouhodobému působení slunečního záření. U melanomu se mutace BRAF V600E vyskytuje průměrně u 50% pacientů. První část studie porovnávala účinky terapie novými léky PLX4032 nádorů ve stadiu III s mutací BRAF V600E a bez ní, následně se určovala optimální velikost dávky. Pacienti bez mutace na léčbu nezareagovali. Do druhé části bylo zařazeno 32 pacientů již výhradně s pozitivní mutací BRAF, kteří dostávali 960 mg PLX4032 dvakrát denně. Na konci výzkumu 24 pacienti dosáhlo částečné a 2 kompletní léčebné odpovědi. Studie prokázala účinnost léčby zhoubného melanomu, který ve svých metastazujících buňkách má mutaci BRAF V600E, pomocí látky PLX4032 a byla dosažená částečná nebo úplná regrese choroby u většiny pacientů (Flaherty a kol., 2010). Avšak PLX4032 není všelék, vhodný pro všechny pacienty s metastazujícím maligním melanomem, protože působí jen na nádory obsahující cílová místa pro látku. V jiné publikaci z The New England Journal of Medicine se jedná o vynález nového léku ipilimumab, který zvyšuje vlastní obranyschopnost organismu proti nádorovým buňkám. Do studie byli zařazeni pacienti se zhoubným melanomem ve stadiu III, a výsledky terapie ipilimumabem ukazují příznivý vliv účinku nové látky na celkovou dobu přežívání pacientů s metastazujícím melanomem (pozorované prodloužení doby celkového přežití o 30 %) (Hodi a kol., 2010) Vědci z Mount Sinai School of Medicine objevili, že jisté proteiny potlačují růst melanomu pomocí regulace onkogenů. Studie byla zveřejněna 23. prosince 2010 v časopisu Nature. Zjistilo se, že u všech zkoumaných případů se stoupající agresivitou nádoru, klesá počet macroH2A histonů, bílkoviny, která se podílí na sbalování DNA. Následné manipulace s macroH2A prokázaly příznivý vliv na průběh onemocnění přítomnosti histonů v melanomových buňkách. Další výzkum funkcí proteinu ukázal, že macroH2A reguluje CDK8 (cyklin-dependentní kináza 8), známý onkogen u kolorektálního karcinomu. Odstranění macroH2A vede ke zvýšení exprese CDK8, odstranění CDK8 z metastazujících nádorových buněk způsobuje jejich poliferaci. Daná studie naznačuje potřebu zjištění způsobu inhibice funkcí CDK8 a zkoumání epigenetického kódu obecně (Kapoor a kol., 2010). 16
2. Epidemiologická analýza dat o melanomu kůže (C43, D03) v České republice Epidemiologie je srovnávací věda, která se zabývá studiem rozdělení a příčin nemocí a událostí spjatých se zdravotním stavem lidské populace (Neuvirtová, 2006), slouží také jako podklad k opodstatnění lékařských zásahů, provedených v zájmu veřejného zdravotnictví a preventivního lékařství. Epidemiologie je považována za základ metodologie výzkumu ve zdravotnictví a je vysoce ceněna v medicíně založené na důkazech, protože pomáhá rozpoznat rizikové faktory pro přenos nemocí a určuje optimální postup jejich léčby v klinické praxi. V důsledku vysokého počtu nádorových onemocnění význam epidemiologie zhoubných nádorů neustále roste nejenom v celosvětovém kontextu, ale i v rámci České republiky. Epidemiologie zhoubných nádorů hraje klíčovou roli v retrospektivních i prospektivních analýzách. Již nejjednodušší přehledy o incidenci a mortalitě odhalují závažné trendy v úspěšnosti diagnostiky a léčby zhoubných nádorů a přispívají tak i k hodnocení kvality péče na kterékoli úrovni řízení zdravotnictví. Epidemiologická data jsou rovněž nezbytná pro optimalizaci léčebné péče pro různé rizikové skupiny obyvatel a jsou i nezbytnou informační oporou programů protinádorové prevence (Dušek a kol., 2007). 2.1. Základní pojmy Incidence je definována jako počet nových případů zjištěných ve sledovaném období v hodnocené populaci. Když mluvíme o incidenci v kontextu epidemiologie nádorových onemocnění, nejčastěji ji vztahujeme na 100 000 obyvatel dané populace a můžeme vypočítat podle následujícího vzorce: It
ct 100000 , nt
kde ct je počet nově diagnostikovaných onemocnění ve sledovaném období t a nt je velikost hodnocené populace. Pokud t je dlouhé pouze jeden rok, pak ve jmenovateli zlomku dostáváme počet osob ve sledované populací. Pokud t je delší, pak nt tvoří počet člověkoroků v riziku. Pokud populace značí jen osoby v definovaném věkovém intervalu, pak mluvíme o věkově specifické incidenci. Jestliže do studie jsou zahrnuty osoby z celé populace, mluvíme o hrubé incidenci, pokud uvažujeme jenom určitou skupinu osob, kteří, například, mají společný rok narození nebo jsou zaměstnanci stejného podniku, mluvíme o kohortové incidenci. Incidence může být vyjádřena jako absolutní počet nových onemocnění, nebo jako relativní veličina, čili jako podíl nových onemocnění v populaci, ve které se mohl daný nádor pravděpodobně objevit. Relativní incidence nabývá hodnoty od 0 do 1. Rozlišuje se také kumulativní incidence, která vyjadřuje součet specifických incidenci, zpravidla podle věku. Kumulativní incidenci můžeme zahrnout do alternativních metod standardizace, protože daná veličina udává, kolik se dá očekávat nových nádorových onemocnění v populaci za podmínky, že počet osob v jednotlivých specifických kategoriích této populace je stejný. Souhrnnou statistikou, která bere v úvahu rozdíly ve věkovém rozložení populace, je věkově standardizovaná incidence (age-adjusted incidence rate, ASR). Přímá metoda standardizace upravuje věkově specifické relativní incidence zkoumané populace vzhledem k danému věkovému rozložení standardní populace (tzv. referenční populace, nejčastěji je to evropský nebo světový standard). Nepřímé metody standardizace využívají věkově specifických ukazatelů referenční populace (např. věkově specifické incidence standardní populace). Věkově standardizovanou incidenci můžeme vypočítat pomocí přímé metody podle vzorce: 17
I t ( wi / nit ) cit , i
kde cit a nit jsou věkově specifické počty nových nádorových onemocnění a počty člověkoroků ve sledovaném období t , wi je vážená suma věkových skupin i v referenční populaci, sloužící pro standardizaci,
w
i
1.
i
Mortalita se definuje jako počet úmrtí na dané onemocnění ve sledovaném období v hodnocené populaci. Stejně jako incidenci, mortalitu nejčastěji vztahujeme na 100 000 obyvatel dané populace a můžeme vypočítat podle vzorce:
It
dt 100000 , nt
kde d t je počet úmrtí ve sledovaném období t a nt je velikost hodnocené populace. Identicky, jako u incidence, rozlišujeme věkově specifickou mortalitu, hrubou a kohortovou mortalitu, absolutní a relativní mortalitu. Pro výpočet věkově standardizované mortality (age-adjusted mortality rate, ASR) se také používají přímé a nepřímé metody standardizace. Věkově standardizovanou mortalitu můžeme vypočítat pomocí přímé metody podle vzorce: M t wi i
d it , nit
kde d it a nit jsou věkově specifické počty úmrtí na nádorová onemocnění a počty člověkoroků ve sledovaném období t , wi je vážená suma věkových skupin i v referenční populaci, sloužící pro standardizaci,
w
i
1.
i
Jedna z metod nepřímé standardizace věkově specifické mortality je standardizovaný poměr mortalit (standardized mortality ratio, SMR), která je založena na výpočtu poměru mezi skutečnou a očekávanou hrubou mortalitou (Lai a kol., 1996). Absolutní incidenci a mortalitu (věkově specifickou, hrubou, kohortovou) lze modelovat stejnými nástroji, neboť se z matematického hlediska jedná o veličiny stejného charakteru (Gelnarová a kol., 2007). Prevalence je definována jako počet osob trpících daným onemocněním v určitém čase na 100 000 obyvatel. Prevalence kvantifikuje výskyt všech existujících onemocnění s danou diagnózou v dané populaci. Rozlišujeme intervalovou, okamžikovou, kompletní prevalenci a prevalenci s omezenou délkou sledování. 2.2. NOR a kvalita dat o zhoubném melanomu
Data o melanomu kůže (C43, D03), nad kterými se provádí epidemiologická analýza a následná predikce incidence, mortality a prevalence jsou data z Národního onkologického registru (NOR) České republiky. Jedná se o data z let 1977 – 2007. Hlavním zdrojem dat o epidemiologii zhoubných nádorů je Národní onkologický registr ČR. Účelem NOR je registrace onkologických onemocnění a periodické sledování jejich dalšího vývoje, tj. shromažďování dat, jejich verifikace, ukládání, ochrana a zpracování. Instituce Národního onkologického registru shromažďuje údaje o výskytu nádorových onemocnění v České republice od roku 1976. (Gelnarová a kol., 2007). Od roku 1979 se začaly registrovat karcinomy in situ, později se začaly uvádět povinně i provedení cytologie a histologie. Od roku 1989 je registr 18
doplňován každoročně o případy onemocnění, které jsou hlášená pouze na základě Listu o prohlídce mrtvého (DCO). NOR je nedílnou součástí komplexní onkologické péče a při reprezentativním pokrytí 100% české populace obsahuje za období 1977 – 2007 více než 1,6 miliónu záznamů (Dušek a kol., 2010). Díky své kvalitě, registr byl přijat za člena Mezinárodní asociace registrů rakoviny (IARC). Registrace novotvarů je legislativně zakotvena a je povinná. Formulář o novotvaru vyplňuje lékař, který jej diagnostikoval. Pak se formulář posílá na okresní pracoviště NOR, kde jsou do něho doplněné další údaje ze zdravotnické dokumentace. Každé hlášení je podrobeno mnoha kontrolám a údaje jsou jedenkrát ročně aktualizovány prostřednictvím regionálních registrů. Na centrálním pracovišti probíhá porovnávání dat s daty zemřelých na zhoubný novotvar. Jako součást monitoringu české populace zpracovává Český statistický úřad (ČSÚ) data o demografické struktuře obyvatelstva. Tato data postihují hlavní demografické charakteristiky, zejména celkový počet obyvatel, věkovou strukturu a očekávanou délku života. Zdrojem údajů o populační mortalitě zhoubných novotvarů je v ČR primárně databáze příčin úmrtí, kterou taktéž zpracovává ČSÚ podle mezinárodních metodik a na základě údajů z listu o prohlídce mrtvého (Dušek a kol., 2010). Od roku 2000 jako univerzální nástroj pro zviditelnění a analýzu dat populačních onkologických registrů, především NOR, je vyvíjen analytický systém SVOD (software pro vizualizaci onkologických dat). Výstupy nabízejí analytický a grafický servis. SVOD pracuje v první řadě s databází Národního onkologického registru, ale pro výpočet a interpretaci epidemiologických parametrů systém využívá podporu dalších populačních databází obsahujících demografická data ČR a věkově specifické agregace z databáze zemřelých ČR (Dušek a kol., 2007). Webový portál SVOD je volně dostupný na internetu (Dušek a kol., 2007). Zde je možno získat přehled o všech epidemiologických charakteristikách všech maligních diagnóz v ČR za období 1977 – 2008. Portál také umožňuje on-line analýzu dle volby uživatele. NOR je jediný plošný zdroj informací o klinickém stadiu nádorového onemocnění v době diagnózy (Dušek a kol., 2010). Tyto záznamy jsou v databázi reprezentativně obsaženy a jsou kvalitní i přes časté změny v systému klasifikace zhoubných nádorů. S rozvojem diagnostických metod a znalostí o nádorových onemocněních byla TNM klasifikace pro jednotlivé diagnózy zaváděna postupně a pravidla klasifikace se často měnila; v současné době je používáno již 6. vydání. V NOR byly postupně zaváděny tyto TNM klasifikace: TNM II. vydání od roku 1976, TNM III. vydání od roku 1982, TNM IV. vydání od roku 1995, TNM V. vydání od roku 2001 a TNM VI. vydání od roku 2005. Komplikovaný systém stanovení klíčových prognostických parametrů samozřejmě přináší problémy v úplnosti dat a ve správnosti záznamů. Vliv změn a vůbec existence TNM klasifikace na kvalitu záznamů NOR můžeme sledovat také pomocí rozboru dat o zhoubném melanomu. Tabulka 3 obsahuje přehled TNM klasifikace. Z tabulek 3.1 – 3.3 lze vidět rozdíly ve stanovení kategorií T, N a M mezi III. a IV. i mezi V. a IV. vydáním TNM klasifikace. Klasifikační kritéria v IV. a V. vydání TNM klasifikace se mezi sebou neliší. Tabulka 3.4 znázorňuje způsoby rozdělení zhoubného melanomu do klinických stadií podle všech existujících vydání TNM klasifikace. Jak je vidět, ve II. edici TNM klasifikační kritéria pro maligní melanom ještě nebyla zavedena, proto v tabulce za období 1976 – 1981 nejsou žádné informace. Podstatné změny oproti III. vydání pozorujeme ve IV. vydání. Další modifikace byly provedeny také v poslední VI. edici.
19
Tab. 3: Přehled TNM klasifikace zhoubného melanomu (C43). Tab. 3.1: T – primární nádor. 1982 – 1994
1995 – 2000
2001 – 2004
2005 – 2007
TNM III. vydání
TNM IV. vydání
TNM V. vydání
TNM VI. vydání
pT0
bez známek nádoru
bez známek nádoru
bez známek nádoru
bez známek nádoru
pTis
Melanom in situ (Clark I)
Melanom in situ (Clark I)
Melanom in situ (Clark I)
Melanom in situ (Clark I)
pT1
0,75 mm, postihuje 0,75 mm, postihuje 0,75 mm, postihuje 1 mm stratum papillare ds stratum papillare stratum papillare (Clark II) ds (Clark II) (Clark II)
pT1a -
-
-
Clark II nebo III, bez ulcerace
pT1b -
-
-
Clark IV nebo V, nebo s ulcerací
> 0,75 mm a 1,5 mm a/nebo Clark III
> 0,75 mm a 1,5 mm a/nebo Clark III
> 1mm a 2 mm
pT2a -
-
-
bez ulcerace
pT2b -
-
-
s ulcerací
> 1,5 mm a 4 mm a/nebo Clark IV
> 1,5 mm a 4 mm a/nebo Clark IV
> 2 mm a 4 mm
pT3a -
> 1,5 mm a 3 mm
> 1,5 mm a 3 mm
bez ulcerace
pT3b -
> 3 mm a 4 mm
> 3 mm a 4 mm
s ulcerací
> 4 mm a/nebo Clark V a/nebo satelity do 2 cm
> 4 mm a/nebo Clark V a/nebo satelity do 2 cm
> 4 mm
pT4a -
> 4 mm a/nebo Clark V
> 4 mm a/nebo Clark V
bez ulcerace
pT4b -
satelity do 2 cm
satelity do 2 cm
s ulcerací
pT2
pT3
pT4
> 0,75 mm a 1,5 mm a/nebo Clark III
> 1,5 mm a 3 mm a/nebo Clark IV
> 3 mm a/nebo Clark V
20
Tab. 3.2: N – regionální mízní uzliny. 1982 – 1994
1995 – 2000
2001 – 2004
2005 – 2007
TNM III. vydání
TNM IV. vydání
TNM V. vydání
TNM VI. vydání
N0
bez metastáz
bez metastáz
bez metastáz
bez metastáz
N1
Postižení kterékoliv uzliny je prokázané
metastáza 3 cm v největším rozměru ve kterékoliv uzlině (uzlinách)
metastáza 3 cm v největším rozměru ve kterékoliv uzlině (uzlinách)
jedna uzlina
N1a -
-
-
mikroskopická metastáza
N1b -
-
-
makroskopická metastáza
-
metastáza > 3 cm v největším rozměru ve kterékoliv uzlině (uzlinách) a/nebo tranzitorní metastáza(y)
metastáza > 3 cm v největším rozměru ve kterékoliv uzlině (uzlinách) a/nebo tranzitorní metastáza(y)
2 nebo 3 uzliny, nebo intralymfatické regionální metastázy
N2a -
metastáza > 3 cm v největším rozměru ve kterékoliv uzlině (uzlinách)
metastáza > 3 cm v největším rozměru ve kterékoliv uzlině (uzlinách)
mikroskopické metastázy
N2b -
tranzitorní metastáza(y)
tranzitorní metastáza(y)
makroskopické metastázy
N2c -
obojí
obojí
satelitní nebo tranzitorní metastázy
N2
N3
-
-
-
4 uzliny nebo prorůstající infiltrované uzliny
N4
juxta-regionální uzliny
-
-
-
21
Tab. 3.3: M – vzdálené metastázy. 1982 – 1994
1995 – 2000
2001 – 2004
2005 – 2007
TNM III. vydání
TNM IV. vydání
TNM V. vydání
TNM VI. vydání
M0
bez vzdálených metastáz
bez vzdálených metastáz
M1
vzdálené metastázy vzdálené metastázy
bez vzdálených metastáz
bez vzdálených metastáz
vzdálené metastázy
vzdálené metastázy
M1a -
metastázy v kůži nebo podkožní tkáni nebo mízní uzlině (uzlinách) vně regionálních mízních uzlin
metastázy v kůži nebo podkožní tkáni nebo mízní uzlině (uzlinách) vně regionálních mízních uzlin
metastázy v kůži nebo podkožní tkáni nebo mízní uzlině (uzlinách) vně regionálních mízních uzlin
M1b -
viscerální metastázy
viscerální metastázy
metastázy v plicích
M1c -
-
-
jiné lokalizace nebo jakékoliv lokalizace se zvýšenou sérovou laktátdehydrogenázou (LDH)
22
Tab. 3.4: Rozdělení do stadií. TNM klasifikace Stadium onemocnění Stadium 0
Stadium I
Stadium II
-
-
-
Stadium III -
Stadium IV
-
1976 – 1981
1982 – 1994
1995 – 2000
2001 – 2004
2005 – 2007
TNM II. vydání
TNM III. vydání
TNM IV. vydání
TNM V. vydání
TNM VI. vydání
pTis
pTis
pTis
pTis
pN0
pN0
N0
N0
pM0
pM0
M0
M0
pT1, pT2, pT3, pT4
pT1, pT2
pT1, pT2
pT1, pT2
pN0
pN0
N0
N0
pM0
pM0
M0
M0
jakékoliv pT
pT3
pT3
pT3, pT4
pN0, pN1
pN0
N0
N0
pM0
pM0
M0
M0
jakékoliv pT f
pT4, jakékoliv pT
pT4, jakékoliv pT
jakékoliv pT fd
pN4 f
pN0, pN1, pN2
N0, N1, N2
N1, N2, N3 fd
pM0
pM0
M0
M0
jakékoliv pT
jakékoliv pT
jakékoliv pT
jakékoliv pT
jakékoliv pN
jakékoliv pN
jakékoliv N
jakékoliv N
pM1
pM1
M1
M1
Pomocí obrázků 3 a 4 můžeme srovnávat kvalitu záznamů o zhoubném melanomu (C43) v Národním onkologickém registru za období 1977 – 2007 a novější záznamy od roku 1995 do roku 2007. V důsledku toho, že do roku 1982 nebyla TNM klasifikace pro zhoubný melanom, podíl záznamů s chybně nevyplněným stadiem a TNM na obrázku 3 je 9,9%. Období 1995 – 2007 zahrnuje IV., V a VI vydání TNM klasifikace, které už obsahují klasifikaci pro melanom, proto podíl záznamů s nevyplněným stadiem a TNM na obrázku 4 klesl na 3,88%. Nízký podíl záznamů s diagnózou na základě pitvy nebo DCO indikuje spolehlivost dat (Dušek a kol., 2007). Další problematická část dat jsou záznamy bez zahájení léčby a časná úmrtí (byla použita hranice časného úmrtí do 1 měsíce od diagnózy). Obrázky 3 a 4 dokládají relativně malý podíl těchto záznamů. Validní záznamy s úplnou diagnostikou obsahují nově hlášené zhoubné nádory včetně hlášení opakovaných malignit, následná separace léčených a neléčených pacientů stále poskytuje dostatečně velký vzorek pro populační analýzy, avšak pro hodnocení přežití by měli být vyloučeni pacienti, kteří mají prokázaný více než jeden zhoubný nádor v době posledního kontrolního vyšetření (Dušek a kol., 2007). U léčených pacientů logicky převažují méně pokročilá klinická stadia, u pacientů, kteří nebyli léčeni je situace opačná.
23
Obr. 3: Přehled záznamů (C43) v Národním onkologickém registru za období 1977 – 2007. Vzor obrázku byl převzat z publikace Dušek a kol. (2007), originální data Antonova.
Všechny záznamy
n = 33 179 (100%)
n = 415 (1,25%)
Diagnóza na základě pitvy/DCO
n = 1756 (5,29%)
Časná úmrtí, léčba nebyla zahájená
n = 3285 (9,9%)
Nevyplněné stadium a TNM
Validní záznamy s úplnou diagnostikou ZÁZNAMY O PACIENTECH S PROTINÁDOROVOU LÉČBOU n = 26 940 (81,21%) 5%
6%
n = 27 723 (83,56%)
ZÁZNAMY O PACIENTECH BEZ PROTINÁDOROVÉ LÉČBY n = 783 (2,35%) 22%
Stadium I Stadium II Stadium III
17%
72%
10%
Stadium IV
61% 7%
Obr. 4: Přehled záznamů (C43) v Národním onkologickém registru za období 1995 – 2007. Vzor obrázku byl převzat z publikace Dušek a kol. (2007), originální data Antonova.
Všechny záznamy
n = 19 875 (100%)
n = 228 (1,15%)
Diagnóza na základě pitvy/DCO
n = 772 (3,88%)
Časná úmrtí, léčba nebyla zahájená
n = 761 (3,83%)
Nevyplněné stadium a TNM
Validní záznamy s úplnou diagnostikou ZÁZNAMY O PACIENTECH S PROTINÁDOROVOU LÉČBOU n = 17 843 (98,5%) 7%
21%
5%
n = 18 114 (91,14%)
ZÁZNAMY O PACIENTECH BEZ PROTINÁDOROVÉ LÉČBY n = 271 (1,5%) 17%
Stadium II 7%
67%
8% 68%
24
Stadium I
Stadium III Stadium IV
2.3. Vyhodnocení epidemiologických charakteristik
V České republice trpí malignitami kůže stále rostoucí počet lidí. Na obrázku A-1 je zobrazen vývoj incidence a mortality melanomu kůže u mužů a žen za období 1977 – 2007. Incidence vykazuje v české populaci významně rostoucí trend, v jehož důsledku se počet ročně nově diagnostikovaných pacientů za posledních 25 let více než zčtyřnásobil. Hrubá incidence překročila po roce 2004 hodnotu 20 nemocných na 100 tisíc osob, jak u mužů, tak i u žen, a vykazuje další nárůst. Mortalitu má smysl uvažovat od roku 1981 a její vývoj vykazuje relativní stabilitu. Hodnoty mortality u žen jsou o něco menší než u mužů. V důsledku rostoucí incidence a stabilní mortality pozorujeme strmý nárůst prevalence (viz Obrázek A-3). Tabulka A-1 obsahuje přehled epidemiologické situace v roce 2007. Lze vidět, že muži a ženy v České republice bývají postiženi melanomem kůže zhruba ve stejné míře. V datech z Národního onkologického registru České republiky 92% tvoří záznamy o zhoubném melanomu (C43), zbývajících 8% jsou záznamy o melanomu in situ (D03), tabulka A-2. Incidence melanomu in situ také vykazuje rostoucí trend (viz Obrázek A-2). Na obrázku A-4 je znázorněna věkově specifická incidence za recentní období 2003 – 2007. Lze vidět, že počet nově diagnostikovaných nádorů roste s věkem. Je to obzvlášť patrné u mužů, kde incidence ve věkové skupině 80 – 84 let dosahuje hodnoty 122 nových nádorových onemocnění na 100 tisíc osob. Průběh křivky, popisující věkově specifickou incidenci u žen, je souvislejší, incidence ve věkových skupinách 25 – 49 let je vyšší než u mužů. Průměrný věk při diagnóze u mužů je 62 let, u žen je to hodnota 59 let, tabulka A-3. Mortalita ve starších věkových skupinách vykazuje rychlý nárůst, obrázek A-5, a nabývá větších hodnot u mužů, což ale také může být způsobeno větším podílem starších věkových kategorií při diagnóze ve srovnání s ženami (viz Obrázek A-6). Tabulka A-4 obsahuje průměr, medián a kvartily věku úmrtí na melanom kůže za období 2003 – 2007. Když na obrázku A-7 porovnáme křivky věkově specifické incidence pro různé periody, vidíme, že výskyt melanomu kůže roste s časem u osob starší 45 let, největší hodnoty jsou v letech 2003 – 2007. U mladší části populace zůstává incidence v průběhu let stejná. Průměrný věk při diagnóze se posouvá do starších věkových kategorií, tabulka A-5. Obrázky A-8 a A-9 představují srovnání vývoje hrubé a věkově standardizované incidence a mortality. Standardizace incidence a mortality byla provedena na světový věkový standard (ASR(W)) a na evropský věkový standard (ASR (E)). Věkově standardizované hodnoty incidence a mortality jsou pak vhodné pro mezinárodní srovnání. Na obrázku A-10 je znázorněna věkově standardizovaná incidence (ASR(W)) melanomu kůže (C43, D03) v krajích České republiky za období 2003 – 2007. Hodnoty se pohybují v rozmezí od 9,1 do 16,6 nově diagnostikovaných nádorů, nejvyšší incidence je v Pardubickém kraji, nejmenší počet nádorových onemocnění je v Ústeckém kraji. Věkově standardizovaná mortalita (ASR(W)) nabývá hodnot v intervalu od 1,7 do 3 úmrtí na melanom kůže, nejvyšší mortalitu má Plzeňský kraj, nejnižší – Moravskoslezský (viz Obrázek A-11). Odhad věkově standardizované incidence na světový věkový standard (ASR(W)) je u melanomu kůže za rok 2008 v České republice 12,4 nově diagnostikovaných onemocnění, což představuje celkově 12. nejvyšší incidenci ze všech zemí světa a 9. nejvyšší incidenci v Evropě. Ve srovnání s okolními zeměmi se pak odhad incidence blíží spíš hodnotám v zemích západních (Německo 12,15) než v zemích východních (Slovenská republika 8,8, Polsko 4,12); v evropském měřítku dosahuje nadprůměrných hodnot. Odhad incidence melanomu kůže se u mužů v roce 2008 v České republice rovnal 13,35 (10. nejvyšší incidence ze všech zemí světa a 7. nejvyšší incidence v Evropě), u žen je to 12,02 nových nádorových onemocnění (15. nejvyšší incidence ze všech zemí světa a 12. nejvyšší incidence v Evropě) (URL 3). Odhad věkově standardizované mortality (ASR(W)) je u melanomu kůže za rok 2008 v České republice 1,83 úmrtí na 100 tisíc osob, což představuje celkově 25. nejvyšší mortalitu ze 25
všech zemí světa a 18. nejvyšší mortalitu v Evropě. Obrázek A-12 znázorňuje odhady věkově standardizované incidence a mortality (ASR(W)) melanomu kůže na 100 tisíc osob v mezinárodním srovnání v roce 2008 ve 20 světových státech s nejvyššími hodnotami daných ukazatelů (URL 3). Obrázky A-13 a A-14 srovnávají zastoupení lokalizací melanomu kůže zaznamenané v datech NOR České republiky za období 1977 – 2007. Nejčastěji se tento nádor vyskytuje na trupu, dále následují lokalizace na horních a dolních končetinách. U mužů se melanom vyskytuje hlavně na trupu (53% všech záznamů), u žen podíl lokalizací na trupu a dolních končetinách je zhruba stejný (28% a 30% všech záznamů). Rozdíly mezi lokalizacemi u dvou pohlaví mohou být způsobeny odlišným životním stylem, zaměstnáním a oblečením mužů a žen. Vývoj incidence a zastoupení stadií při stanovení diagnózy zhoubného melanomu (C43) za období 1977 – 2007 je hodně ovlivněn změnami v TNM klasifikaci (viz Obrázky A-15, A-16). Tak, například, v roce 1995 dochází k rychlému nárůstu nádorů v I., II. a III. klinickém stadiu v důsledku modifikace klasifikačních kritérií. Incidence zhoubného melanomu ve IV. stadiu je v průběhu let víceméně stabilní. Analýza incidence C43 dle klinických stadií nabízí v ČR optimistický výstup, neboť mezi nově diagnostikovanými pacienty výrazně převažuje časné stadium I a jeho incidence v čase významně narůstá. Zmenšení podílu záznamů s chybějícím stadiem svědčí o zlepšení diagnostiky zhoubného melanomu a o zvětšující se kvalitě dat. Obrázek A-17 znázorňuje zastoupení stadií dle věku při stanovení diagnózy zhoubného melanomu (C43) za období 2005 – 2007 (období bylo vybráno podle platnosti posledního 6. vydání TNM klasifikace). Z grafu lze vidět větší zastoupení pokročilejších stadií ve starších věkových skupinách, u mladší části populace převažuje I. stadium onemocnění.
26
3. Metodika prediktivních analýz
Prediktivní analýza zahrnuje určení rozsahu problému ve smyslu počtů událostí a míry, do které recentní změny trendů ovlivní budoucí vývoj. Extrapolace trendů poskytuje jednoduchý prostředek kvantifikace onkologické zátěže. Predikované scénáře mohou nás informovat o rozsahu pravděpodobných vlivů různých determinantů onemocnění a plánovaných nebo neplánovaných intervencí na výskyt rakoviny v následujících letech (Hakulinen, 1996). Kvalitní zdravotní péče za dostupnou cenu je velkou výzvou, zvláštť v onkologii. Poskytovatelé zdravotní péče potřebují spolehlivý odhad počtu pacientů pro umožnění nejlepší distribuce omezených prostředků pro diagnostiku, léčbu, screeningy, rehabilitaci a paliativní péči (Moller a kol., 2003). Většinou jsou to drahé záležitosti. Takovým způsobem spolehlivost predikce ve smyslu návodu na praktická opatření je stěžejní pro rozhodovací proces. Predikcí incidence a prevalence můžeme stanovit dost spolehlivý odhad počtu pacientů, které se budou nacházet v daném stadiu onemocnění a budou potřebovat protinádorovou léčbu. Tyto odhady pak slouží pro vyhodnocení onkologického rizika, pro sledování kvality zdravotní péče a pro optimalizaci nákladů spojených s protinádorovou léčbou. Z vědeckého hlediska predikce umožňují vyhodnocení vlivů plánovaných intervencí, včetně preventivních programů, screeningů a terapie. Také predikce naznačují rozsah dalšího vývoje nádorů. Zároveň predikce jistým způsobem varují před uskutečněním pravděpodobných nepříznivých scénářů (Bray a Moller, 2006). 3.1. Rešerše metod
Predikce se liší od většiny statistických analýz hlavně tím, že objektivní informace, která se nachází ve vzorku, je rozšířena mimo jeho meze. Proto při provedení predikce je potřeba mít jistotu o správnosti a spolehlivosti zvoleného modelu, o stabilitě modelovaného procesu a odůvodněnosti prováděného rozšíření informace mimo vzorec. Ovšem v praxi tyto předpoklady často platí ne vždy stoprocentně. Princip parsimonie, neboli preferování jednoduššího řešení před složitějším, celkově zvyšuje šance úspěchu procesu predikce (Dyba, 2000). Příčiny změn výskytu rakoviny můžeme rozdělit do dvou skupin. První obsahuje změny v riziku, druhá změny velikosti a věkové struktury populace. Dalším faktorem, ovlivňujícím incidenci, je zvýšená detekce nádorových onemocnění (Bray a Moller, 2003). Stadium onemocnění hraje v léčbě pacienta s rakovinou úlohu zdaleka nejdůležitější, proto při korektním modelování incidence je vhodné do modelu zahrnout stratifikaci dle stadií. Zároveň s tím dobrý predikční model by měl být sestaven na základě jistých epidemiologických znalosti a spolehlivých údajů. Ovšem ve většině případů etiologie nádoru není dokonce známá a tak je těžké ji zahrnout do modelování jako statistickou, vysvětlující proměnnou. Navíc se rizikové faktory a diagnostická kritéria mění v čase a skrývají reálné trendy v datech. Na druhé straně, když rizikové faktory jsou definovány, znalosti jejich statistických charakteristik a populačních trendů nejsou vhodné pro použití v predikčním modelu. V podstatě jediné vždy dostupné a známé rizikové faktory jsou věk, observační perioda a datum narození příslušného pacienta (kohorta). V praxi tyto tři proměnné slouží pro sestavení modelu a vystupují v roli náhradních proměnných (Dyba a kol., 1997). Řada alternativních modelů, které se liší svým funkcionálním tvarem a zahrnutými proměnnými, mohou fitovat data v rámci vzorku. Avšak jenom některé z nich poskytují dobrý odhad mimo jeho rozsah. Důležitý je také výběr škály predikce. Lineární škála musí zabránit extrémnímu růstu incidence. Logaritmická škála zajistí plynulý pokles a nezáporné hodnoty u nádorů s klesajícím trendem. 27
Kvalita modelu je kromě výběru vhodného modelu a metod odhadu parametrů závislá také na kvalitě dat. Data mohou být poškozená změnou v klasifikaci nebo změnou v registraci pacientů. Data jsou také ovlivňována změnami v diagnostice a novými léčebnými metodami nebo změnami životního stylu (Gelnarová a kol., 2007). 3.1.1. Metodika analýzy časových řad
Časové řady jsou důležitými statistickými daty, pomocí nichž můžeme zkoumat dynamiku jevů v čase. Časová řada jsou věcně a prostorově srovnatelná pozorování, která jsou jednoznačně uspořádána z hlediska času ve směru minulost – přítomnost. Cílem jejich analýzy je většinou konstrukce vhodného modelu, který umožní pochopení mechanismu, na jehož základě vznikají hodnoty časové řady, a porozumění podmínkám, které vznik těchto hodnot ovlivňují. Dalším velmi častým cílem je konstrukce předpovědí. Základní metody a postupy pro analýzu časových řad jsou následující (Cipra, 1986):
dekompozice časové řady
Boxova-Jenkinsonova metodologie
lineární dynamické modely
spektrální analýza.
Dekompoziční metoda rozkládá časovou řadu ( yt ) na systematické složky. Vycházíme z předpokladu, že každá časová řada může obsahovat čtyři složky: trendovou ( Trt ), sezónní ( Szt ), cyklickou ( Ct ) a náhodnou ( t ). Trendem se rozumí hlavní tendence dlouhodobého vývoje hodnot analyzovaného ukazatele v čase (rostoucí, klesající, konstantní). Trendová složka se většinou modeluje pomocí matematických křivek. Sezónní složka je odchylkou od trendové složky, která se pravidelně opakuje, avšak může měnit svůj charakter. Její perioda je menší než celková velikost sledovaného období. V důsledku dlouhodobého cyklického vývoje dochází ke kolísání okolo trendu, které vytváří cyklickou složku časové řady. Náhodná složka je vyvolána nepostižitelnými příčinami a nedá se popsat žádnou funkcí času, vyjadřuje nahodilé a jiné nesystematické výkyvy. Pokud střední hodnota a kovariance náhodné složky jsou nulové a rozptyl je konstantní, mluvíme o ní jako o bílém šumu.
Vlastní dekompozice časové řady může probíhat aditivní nebo multiplikativní formou. Jestliže se předpokládá, že se jednotlivé složky vývoje sčítají, platí aditivní model yt Trt Ct Szt t . Všechny složky jsou měřeny v jednotkách řady yt a uvažovány ve svých skutečných absolutních hodnotách. Aditivní dekompozice se používá v případě, že variabilita hodnot časové řady je víceméně konstantní v čase. Analýza složky každého typu se provádí v podstatě klasickou regresí. Jestliže variabilita hodnot roste nebo se mění v čase, používá se multiplikativní dekompozice. V případě multiplikativního modelu platí yt Trt Ct Szt t . Trendová složka je ve stejných měrných jednotkách jako původní časová řada, ostatní složky jsou v relativním vyjádření. V případě, že jednotlivá pozorování jsou navzájem nekorelována, v dekompozičních metodách se používá regresní analýza.
28
Analýza trendové složky je zřejmě nejdůležitější částí analýzy časových řad. Odpovídá-li trend určité funkci, je možné ho popsat pomocí trendové funkce. Pak časovou řadu lze vyjádřit ve tvaru yt f (t ) . Funkce f(t) je trendová funkce v čase t. Zahrnuje-li časová řada sezónní nebo cyklickou složku, potom je yt kompozicí modelů těchto složek. Za předpokladu, že se charakter trendové funkce nemění, lze konstruovat bodovou nebo intervalovou předpověď. Mezi základní trendové funkce patří konstantní trend, lineární trendová funkce, kvadratická trendová funkce, exponenciální trendová funkce, S-křivka, modifikovaný exponenciální trend, logistický trend a Gompertzův trend (Hančlová a Tvrdý, 2003). Máme-li časovou řadu se známými hodnotami v čase t = 1,2,…, n, pomocí extrapolace můžeme předpovědět kvantitativní odhady budoucích hodnot, které vzniknou prodloužením vývoje z minulosti a přítomnosti do budoucna s horizontem t = n+1,n+2,...,T za předpokladu, že se tento vývoj nezmění. Rozlišujeme bodové a intervalové extrapolační predikce. Podmínka konstantních v průběhu času parametrů modelu je v mnoha situacích nereálná, proto se její chyba s prodloužením horizontu predikce zvětšuje. Jestliže je vývoj časové řady nerovnoměrný nebo má extrémní hodnoty, používá se modelování pomocí klouzavých průměrů. Metoda je založena na předpokladu, že časovou řadu můžeme vyrovnat v krátkých úsecích jednou matematickou křivkou ovšem s různými parametry. Základní myšlenkou je vytváření lineární kombinace hodnot původní časové řady a v podstatě se jedná o vyrovnání řady polynomem určitého řádu. Rozeznáváme jednoduché a vážené klouzavé průměry. Metoda klouzavých průměrů je výpočetně jednoduchá a pružně reaguje na časové změny v charakteru řady, zároveň průměry jsou náchylné k extrémním hodnotám, proto se metoda nehodí k odhadům budoucího vývoje. Pro krátkodobou predikci trendů je vhodná technika exponenciálního vyhlazování. Používají se všechny předchozí pozorování, přičemž jejich váha (w) směrem do minulosti klesá podle exponenciální funkce
wt (1 ) n t , kde n je počet pozorování a je vyrovnávací konstanta v intervalu (0; 1) (Hančlová a Tvrdý, 2003). Na rozdíl od dekompozičních metod Boxova-Jenkinsonova metodologie za základní prvek konstrukce modelu časové řady považuje reziduální složku, která může být tvořena korelovanými náhodnými veličinami. Takovým způsobem daná metoda může zpracovávat časové řady s navzájem závislými pozorováními a dokonce těžištěm její postupu je korelační analýza. Model klouzavých průměrů reziduální složky MA (q) je dost jednoduchý a vhodný pro časovou řadu, která má všechny pozorování navzájem nekorelovaná až na bezprostřední sousední dvojice. MA model se dá zapsat ve tvaru
yt t c1 t 1 c2 t 2 ... cq t q , kde yt je modelovaná řada, t tvoří bílý šum, ci jsou parametry MA modelu a q jeho řád. Další typ modelů jsou autoregresní modely AR (p). Proces AR má tvar yt t a1 yt 1 a2 yt 2 ... a p yt p , kde y t je časová řada, t tvoří bílý šum, ai jsou parametry AR modelu a p jeho řád.
29
Smíšený model časové řady se nazývá ARMA (p,q) model, přičemž výraz p je autoregresního typu a q reprezentuje zpožděné klouzavé průměry. Proces ARMA (p, q) má tvar yt a1 yt 1 a2 yt 2 ... a p yt p t c1 t 1 c2 t 2 ... cq t q . Autoregresní integrované modely klouzavých průměrů ARIMA (p,d,q), kde d je parametr řádu, se používají při modelování nestacionárních procesů a pracují nejen s trendovou složkou ale i s náhodnými fluktuacemi. Lineární dynamické modely jsou zpravidla kauzální, v nich, kromě popisované časové řady a bílého šumu, vystupují jako příčinné faktory další časové řady. Cílem je odhalit příčinné vazby mezi jednotlivými veličinami za předpokladu lineární nebo linearizované závislosti mezi proměnnými. Spektrální analýza časové řady používá úplně odlišný přístup, který spočívá v tom, že se zkoumaná časová řada považuje za směs sinusových a kosinusových křivek s různými amplitudami a frekvencemi. Pomocí speciálních statistických nástrojů se zjišťuje spektrum řady. V této koncepci tedy není stěžejním faktorem časová proměnná, ale právě faktor frekvenční.
Američtí vědci z National Cancer Institute a American Cancer Society (ACS) za účelem zlepšení přesnosti predikce mortality vyvinuli a otestovali novou metodu, která poprvé byla publikována v Cancer Statistics (2004) a Cancer Facts & Figures (2004). Nová metodika se nazývá state-space method (SSM). Od roku 1995 se pro predikci mortality používal model kvadratické časové řady, výsledky kterého byly pak subjektivně posouzeny a případně upraveny podle recentních změn vývoje trendů. V roce 2004 se ACS a National Cancer Institute po provedeném srovnání metod rozhodli predikovat věkově standardizované počty úmrtí na nádorová onemocnění pomocí SSM, který obecně poskytuje lepší odhady než model kvadratické časové řady (Tiwari a kol., 2004). Modelování pomocí kvadratické časové řady je vícekrokový proces. Kvadratický trend se vztahuje na data o mortalitě v dostatečně dlouhém časovém intervalu a popisuje kolísání trendů jako funkci čtverce času. Věkově standardizovaná mortalita M t v čase t je definována následovně: M t wi i
d it , nit
kde wi jsou normalizované váhy dávající v součtu 1, d it a nit jsou počty úmrtí na nádorová onemocnění a počty lidí v riziku v čase t ve věkové skupině i. Model kvadratické řady předpokládá, že věkově standardizovaná mortalita má kvadratický trend s autoregresní chybou, který se rovná M t b0 b1t b2t 2 ut , kde ut a1ut 1 ... a p ut p t je autoregresní chyba. Složka t má všechny statistické vlastnosti bílého šumu. Sestavení modelu probíhá ve dvou postupných krocích. V prvním kroku se pomocí metody nejmenších čtverců odhadnou parametry trendu bˆ0 , bˆ1 , bˆ2 . Ve druhém kroku se vypočtou rezidua uˆ Mˆ bˆ bˆ t bˆ t 2 , což jsou rozdíly mezi odhadnutou a pozorovanou veličinou. t
t
0
1
2
Tento proces modeluje rezidua v libovolném časovém okamžiku jako funkci reziduí v předchozích časových okamžicích a tak vysvětluje krátkodobé chování trendu (Hayat a kol., 2010). Následně se kombinovaný model používá pro provedení predikce na tři roky dopředu a sestavení odpovídajícího 95% intervalu spolehlivosti. Konstrukce modelu a jeho implementace jsou součástí software SAS, balíku PROC FORECASTING, který potřebuje pro výpočty data z posledních sedmi let. 30
Jako alternativa modelu kvadratické řady pro predikci věkově standardizované mortality byla použita state-space metoda. Motivací byly snaha vylepšit citlivost na krátkodobé fluktuace a eliminace subjektivity. SSM model se skládá ze dvou důležitých částí: rovnice míry a rovnice přechodu. Z rovnice míry vyplývá, že se počty úmrtí řídí lineárním modelem s časově proměnlivými regresními koeficienty, které tvoří stavový vektor parametrů, neboť všechny informace o aktuálním stavu procesu jsou v něm přítomné. Časově proměnlivé regresní koeficienty se také řídí lineárním modelem. Obě rovnice dohromady dávají kvadratický trend v krátkých časových úsecích na rozdíl od modelu kvadratické řady, kde předpokládáme kvadratický trend přes celá data. Rovnice přechodu slouží k modelování závislosti přítomného stavu na bezprostředně minulém pomocí dalšího lineárního modelu. Předpokládá se, že rovnice míry a rovnice přechodu zahrnují náhodné chyby. V případě nulového rozptylu chyby přechodu, SSM reprezentuje zobecnění kvadratické časové řady. Pro přesnost predikce se SSM modifikuje pomocí dvou ladících parametrů. V upravené variantě jsou rozptyly chyb přepočítány pomocí dvou konstant, jedna z nich je pro chybu míry a druhá pro chybu přechodu. Parametry jsou určeny minimalizací sumy čtverců rozdílů mezi pozorovaným počtem úmrtí a tříletou predikcí. Výrazy pro odhad stavového vektoru a ladících parametrů jsou získány pomocí iteračního numerického postupu (Hayat a kol., 2010). 3.1.2. Regresní modely
Regresní analýza je hojně využívanou statistickou metodou, protože je schopná odhalit a kvantifikovat funkční vztahy mezi proměnnými, umožňuje hledat v datech trendy a různé periodicity, zkoumat vlastnosti procesů, které tato data vygenerovaly, a také předvídat jejich chování. Předpokládá se, že naměřená data lze rozdělit na deterministickou část a aditivní nekorelovanou chybu s nulovou střední hodnotou. Právě deterministickou složku jsme schopni odhadovat a modelovat metodami regresní analýzy. Nechť X ( X 1 ,..., X r ) je vysvětlující proměnná, Y je vysvětlovanou proměnnou, pak regresní model má tvar Y f ( X 1 ,... X r ; 1 ,..., p ) , kde f je regresní funkce a 1 ,... p jsou parametry regrese. Předpokládá se, že je náhodná veličina s nulovou stření hodnotou a rozptylem 2 , která navíc často mívá normální rozložení. K nalezení odhadu parametrů se převážně používá metoda nejmenších čtverců. Nejčastějším případem regresní funkce je lineární regresní funkce, což vede na regresní rovnici y i 1 xi1 2 xi 2 ... k xik i , kde y i je i-té pozorování náhodné veličiny Y, i=1,…,n, xij je i-tá hodnota vysvětlující proměnné i=1,…,n, j=1,…,k,
j jsou parametry modelu j=1,…,k, i ~ N (0, 2 ) jsou neznámé náhodné chyby, n je počet pozorování (Veselý, 2007). Zobecněné lineární modely (GLM) jsou rozšířením lineárních modelů s větší tolerancí pro různé distribuční vlastnosti vysvětlovaných proměnných. V zobecněném modelu se předpokládá, že
31
distribuce Y je ze třídy exponenciálních rozdělení, kam patří např. Poissonovo, binomické, exponenciální nebo gamma rozdělení. V GLM se kombinace vysvětlujících proměnných nazývá lineární prediktor ( ) a můžeme ho zapsat následujícím způsobem: p
0 j x j . j 1
Hodnotu vysvětlované proměnné se dá vyjádřit pomocí dvou složek: střední hodnoty ( yˆ i ) a náhodné složky ( i ), představující regresní residuál yi yˆ i i , kde g ( yˆ i ) i . Funkce g je linkovací funkce, která převádí hodnoty vysvětlované proměnné na škálu slučitelnou s hodnotami, které definuje pravá strana regresní rovnice, obsahující vysvětlující proměnné. Residuály i mohou pocházet z různých distribucí. Volba linkovací funkce závisí na předpokládaném typu rozložení. Linkovací funkce, která přísluší danému typu rozložení, se nazývá kanonická. Při zvolení vhodného regresního modelu by měl být brán ohled na to, že prediktory musí být navzájem nezávislé, jinak nastává problém multikolinearity, model má obsahovat pouze statisticky významné nezávislé proměnné a být co nejjednodušší. Pro odhad neznámých parametrů se u klasického lineárního modelu používá metoda nejmenších čtverců. Pro odhad regresních koeficientů GLM se aplikuje metoda maximální věrohodnosti (MMV). Pomocí MMV dostaneme takové hodnoty parametrů, které maximalizují pravděpodobnost získání vstupné množiny dat. MMV zahrnuje sestavení věrohodnostní funkce pravděpodobnosti výskytu dat, její zlogaritmování a následné nalezení maximálně věrohodných odhadů regresních parametrů. K otestování významnosti regresních koeficientů se používá test poměrem věrohodnosti nebo Waldův test (Šmilauer, 2007). Měřítkem vhodnosti modelů je deviance. Submodelem je model, ve kterém jsou vypuštěny některé nezávislé proměnné. Rozdíl deviance pro model, odečtený od deviance pro submodel, se nazývá škálová deviance. Pomocí škálové deviance můžeme testovat vhodnost submodelu jako zjednodušení obecného modelu. V epidemiologii se obecně předpokládá, že počty nově zaregistrovaných nádorových onemocnění v různých věkových skupinách v určitém časovém období jsou nezávislé a mají Poissonovo rozdělení. Daný závěr byl potvrzen pomocí srovnání s jinými přístupy, které považují věkově specifickou incidenci za veličinu s normální distribucí (Dyba a Hakulinen, 2000). Nejčastějším rizikovým faktorem u chronických onemocnění je věk a informace o něm je téměř vždy k dispozici. Nejjednodušší predikční metoda upravuje incidenci podle věku a pak provádí predikci založenou na regresní analýze. Specifickou podle periody věkově standardizovanou úroveň incidence representuje sumační index pro všechny věkové skupiny dohromady. Tato míra je široce používána v analýze a srovnání trendů nádorových onemocnění. Standardizovaná věkově specifická incidence ( I t ) se počítá podle vzorce I t ( wi / nit ) cit , i
kde cit a nit jsou specifické podle věku a periody počty nádorových onemocnění a počty člověkoroku, t je perioda, wi je vážená suma věkových skupin i v referenční populaci, sloužící pro standardizaci,
w
i
1.
i
Pro modelování věkově standardizované incidence se používají modely: E ( I t ) t
(1) 32
narůstá-li počet onemocnění a log( E ( I t )) t
(2)
pro případy s klesajícím trendem, kde E ( I t ) je očekávaná (střední) hodnota, je baseline parametr, je slope parametr. Lineární tvar modelu (1) zabraňuje extrémnímu růstu predikovaných hodnot. Logaritmická škála, použitá pro klesající trend, vylučuje možnost výskytu záporných veličin. Tato metoda nemůže poskytovat věkově specifické predikce a standardizace teoreticky vede k maskování rozdílů mezi věkově specifickými trendy, což zkresluje celkový výsledek. V různých věkových skupinách se liší změna věkově specifické incidence v čase, proto použití stejného parametru pro všechny věkové skupiny je dost sporné (Dyba a Hakulinen, 2000). V případě extrapolace lineárního trendu incidence nádoru, každá věková skupina může být modelována zvlášť, což se dělá aplikací následujícího modelu: E ( I it ) i i t ,
(3)
kde I it ( I it cit / nit ) je věkově specifická incidence ve věkové skupině i 1,...N (N je počet věkových skupin) v periodě t, E ( I it ) je střední hodnota, i je věkově specifický baseline parametr, i je věkově specifický slope parametr. Použití modelu (3) vede k fitování mnoha submodelů, máme jich tolik, kolik je věkových skupin. Informace, která se nachází v celém datovém souboru, je během modelování rozdělená na samostatné části, což může vést ke snížení přesnosti odhadu parametrů modelu a následné predikce obecně. Na druhé straně model má výhodnou nonidentifiability vlastnost, která ho umožňuje používat jako age-cohort model. Záměna lineárního času lineární kohortou nemění fitované hodnoty a výsledek predikce je identický. Speciálním případem modelu (3) pro predikci nádorů, u kterých průměrná incidence roste s věkem, je modifikace, mající tvar E ( I it ) i (1 t ) .
(4)
Daný model je nelineární v parametrech ale lineární v čase, proto se predikce provádí pomocí lineární extrapolace. Jestliže model (4) vhodně popisuje data, pak provedená predikce je přesnější ve srovnání s modelem (3) a využívá informaci z celého datového souboru (Dyba a kol., 1997). Avšak na rozdíl od modelu (3) model (4) postrádá non-identifiability vlastnost (Dyba, 2000). Znakem nedostatečné homogenity v datech je problém nadměrného rozptylu (overdispersion), který obvykle vzniká při analýze velkých populací. Problém se dá vyřešit rozdělením souboru do více homogenních podmnožin. Bydliště pacienta může být dobrým kritériem pro takové rozdělení, protože různé lokality mohou např. mít odlišnou distribuci rizikových faktorů nebo lišit se v kvalitě registrace nádorů a léčebné péče. Pro zahrnutí informace o bydlišti se provádí rozšíření modelu (3): E ( I irt ) ir ir t ,
(5)
kde E ( I irt ) je střední hodnota věkově specifické incidence ve věkové skupině i v regionu r v čase t. Rozšíření modelu (4) vede k dalším modifikacím, které také počítají s regionální variabilitou: E ( I irt ) ir (1 r t ) ,
(6)
E ( I irt ) ir (1 t ) ,
(7)
E ( I irt ) i (1 r r t ) ,
(8) 33
E ( I irt ) i (1 r t ) ,
(9)
kde
i je věkově specifický intercept parametr, ir je věkově regionálně specifický intercept parametr,
je násobitel i nebo ir pro výpočet slope parametru, r je kategoriální regionálně specifický násobitel i nebo ir pro výpočet slope parametrů, r je kategoriální regionálně specifický násobitel pro výpočet intercept parametru. Všechny čtyři modely jsou lineární v čase a pro fixovanou hodnotu r zachovávají užitečnou vlastnost proporcionality věkově specifického baseline a slope parametrů. Rozdíl spočívá v tom, že se předpoklady o vztahu regionálně specifických incidencí u různých modelů liší. Model (6) aplikuje model (4) na regionálně specifická data a nepočítá s tím, že může existovat nějaká souvislost mezi regionálně specifickými parametry. Model (7) zachovává proporcionalitu také s ohledem na odlišné regiony pro tu samou věkovou skupinu. Model (8) umožňuje používat různé věkově specifické slope parametry v odlišných regionech. Výše uvedené modely se aplikují na nádory se stoupající incidenci. V modelech s klesajícím trendem změny úrovně incidence jsou spíš multiplikativní, proto se používá tvar log( E ( I it )) i t ,
(10)
log( E ( I irt )) i r t ,
(11)
log( E ( I irt )) ir t ,
(12)
log( E ( I irt )) i r t ,
(13)
log( E ( I irt )) ir r t .
(14)
Nejjednodušší z nich, model (10), předpokládá stejnou relativní změnu incidence v čase pro každou věkovou skupinu a fixuje ji na hodnotě exp( ) . Také platí předpoklad proporcionality věkově specifické incidence pro dvě libovolné věkové skupiny i a j v čase t, koeficient proporcionality se rovná exp( j i ) . Pro modifikace modelů s ohledem na regionální variabilitu dvě předchozí tvrzení jsou splněny, ovšem přibývají nové možné vztahy mezi parametry. V modelu (11) určité věkové skupině přísluší jistá relativní změna incidence v regionu a zachovává se proporcionální vztah mezi regionálně specifickou incidenci. Model (12) splňuje pouze první předpoklad modelu (11). Model (14) aplikuje model (10) nezávisle pro každý region. Model (13) oceňuje hodnotu relativní změny v čase, exp( r ) , nezávisle na regionu a pro libovolnou věkovou skupinu a zadané lokality r1 a r2 zachovává vztah mezi regionálně specifickou incidenci exp(( r 2 r1 )t ) (Dyba, 2000). Vzdání se předpokladů o stejné relativní změně incidence v čase v každé věkové skupině vede na modely, mající následující tvar: log( E ( I it )) i i t ,
(15)
log( E ( I irt )) i r i t ,
(16)
log( E ( I irt )) ir i t ,
(17)
log( E ( I irt )) ir ir t .
(18) 34
Aditivní modely (4), (6) - (9) a multiplikativní modely (10) - (14) mají užitečnou vlastnost pro daný region r0 , pro každou periodu a pro libovolné věkové skupiny i a j E ( I ir0t ) / E ( I jr0t ) ir0t / jr0t , což znamená, že růst věkově specifické očekávané incidence způsobuje zvětšení věkově specifického baseline parametru. Multiplikativní modely se dají vyjádřit v aditivním tvaru. Například model (10) můžeme upravit takto: E ( I it ) exp( i t ) exp( i ) (1 t ) i (1 t ) , což vede na model (4). Základním předpokladem predikce je stabilita modelovaného jevu v čase. V praxi ho můžeme aplikovat jenom na omezený časový interval, proto výběr báze predikce musí být prováděn opatrně. Kratší délka báze predikce zvyšuje pravděpodobnost stability procesu. Na druhé straně delší báze predikce znamená přítomnost většího množství informace pro sestavení modelu, takovým způsobem se zvětšuje přesnost odhadů parametrů a samotné predikce. Všechny lineární v parametrech modely ((3) - (9)) spadají do rámce zobecněných lineárních modelů, které používají metodu maximální věrohodnosti, proto mohou být fitovány pomocí GLIM software. Modely (10) - (18) jsou nelineární v parametrech a výpočetní proces potřebuje modifikaci (GLIM software (macro V) nebo EPICURE software) (Dyba, 2000). Z praktického hlediska velmi důležitou je míra spolehlivosti predikce, statistické chování odhadů a predikční interval neboli budoucí rozsah hodnot za předpokladu správného zvolení modelu. Má smysl předpokládat, že věkově specifický počet nádorových onemocnění pro budoucí období T, ciT , se řídí Poissonovým rozdělením s parametrem iT . Střední hodnotu E (cT ) můžeme spočítat podle vztahu E (cT ) E (ciT ) iT i
i
a odhady iT , ˆiT záleží na zvoleném modelu. Další rovnosti mají obecný charakter a v podstatě nejsou ovlivněny funkcionálním tvarem modelu var(cT ) var(ˆT ) E (ˆT ) , kde var(ˆT ) var(ˆiT ) cov(ˆiT , ˆ jT ) (Dyba 97). i
i j
Pro výpočet přibližné hodnoty var(ˆiT ) a cov(ˆiT , ˆ jT ) se používá delta metoda založená na Taylorových řadách. Za předpokladu Poissonova rozdělení se věkově standardizovaná incidence, I t , dá přepsat do tvaru E ( I T ) T ( wi / niT ) iT . i
Výpočet rozptylu predikované hodnoty by pak měl vypadat následujícím způsobem: var(I T ) ( wi / niT ) 2 var(ˆiT ) 2i j ( wi / niT ) ( w j / n jT ) cov(ˆiT , ˆ jT ) . i
35
Za předpokladu normality odhadu ˆT asymptotické intervaly spolehlivosti jsou vypočteny na základě standardní chyby. Variabilita predikce se skládá ze dvou částí: nejistota ohledně predikované střední hodnoty Poissonova rozdělení, získané prostřednictvím statistického modelu, var(ˆT ) , a náhodná chyba Poissonova rozdělení ohledně predikované do budoucna střední hodnoty, E (ˆ ) . Takovým způsobem se zajímáme o predikci intervalu spolehlivosti pro střední hodnotu T
pozorování a o predikční interval, který bere v úvahu variabilitu budoucí empirické distribuce (Dyba, 2000). Modelování incidence, jako veličiny, která má Poissonovo rozdělení, se může provádět také pomocí poissonovské regrese ze třídy zobecněných lineárních modelů g ( E ( I t )) g ( t ) 0 1t , kde 0 a 1 jsou parametry a g ( t ) je nelineární linkovací funkce, která specifikuje, jak E ( I t ) t závisí na lineární kombinaci prediktorů. Jako linkovací funkce se obvykle volí logaritmus nebo identická linkovací funkce. Bodový odhad incidence v roce T je roven I T g 1 ( ˆ0 ˆ1T ) ,
kde maximálně věrohodné odhady parametrů jsou označeny stříškou a g 1 je inverzní funkce k linkovací funkci. Odhad predikčního intervalu se dá provést pomocí odhadu standardních chyb pomocí delta-metody. V případě logaritmické linkovací funkce rozptyl odhadu počtu nových onemocnění je roven var(I T ) exp 2 ( ˆ0 ˆ1T ) (var(ˆ0 ) 2T cov(ˆ0 , ˆ1 ) T 2 var(ˆ0 )) .
Za předpokladu normality 90% predikční interval pro celkovou incidenci je roven ( I T 1,65 se( I T ), I T 1,65 se( I T )) ,
kde 1,65 je kvantil normovaného normálního rozdělení a se( I T ) je standardní chyba odhadu celkové predikce (Gelnarová, 2007). Již zmíněný problém nadměrného rozptylu, tzv. overdisperze, nastává při práci s poissonovskou regresí, kdy predikovaný modelem rozptyl je menší než skutečný rozptyl pozorovaných dat. Takovým způsobem na základě modelu dostáváme podhodnocené odhady rozptylů a úzké predikční intervaly pro odhad incidence. V případě overdisperze u Poissonova rozdělení dochází k porušení shodnosti střední hodnoty a rozptylu.
I ~ Po( ) var(I ) E ( I ) Jedním z řešení problému overdisperze je vynásobení odhadu rozptylu disperzním parametrem , který je roven podílu Pearsonovy statistiky X 2 a reziduálních stupňů volnosti (rdf) (McCullagh a Nelder, 1989). X 2 / rdf . Také pro řešení problému overdisperze jsou vhodné logaritmicko-lineární modely, kde závislá proměnná má negativně-binomické rozdělení, nebo modely se smíšenými efekty (Neuvirtová, 2006). Demografická struktura populace způsobuje změny v incidenci. Je známo, že počet nádorových onemocnění stoupá, zvětšuje-li se podíl starších lidí v populaci. Vzhledem 36
k celkovému stárnutí populace a změnám v demografii společnosti je vhodné zahrnout do modelu i tento faktor. Nechť N t je nenáhodná známá veličina, která označuje počet osob ve sledované populaci, pak E(It ) 0 1t . g Nt
Zvolíme-li logaritmickou linkovací funkci, výše uvedený regresní model lze přepsat následujícím způsobem: log( E ( I t )) 0 1t log( N t ) . Proměnná log( N t ) vstupuje do modelu s pevně zadanou hodnotou příslušného parametru rovnou 1, označuje se termínem offset. Bodový odhad incidence v roce T je roven I T exp( ˆ0 ˆ1T ) N T .
Výsledná predikce celkové incidence (I) pro jednotlivá stádia a diagnózy je součtem predikci věkově specifických incidenci. Stejným způsobem lze odhadnout její rozptyl (Gelnarová, 2007). Často se pro predikci incidence a mortality používají Age-period-cohort (APC) modely, které jsou speciálním typem zobecněných lineárních modelů a jsou založeny na poissonovské regresi. Základní předpoklad APC modelů spočívá v tom, že se proporcionální vztah mezi věkově specifickými incidencemi v čase nemění. Data nejsou modelována odděleně pro různé věkové skupiny, ale jsou vyhodnocována jako jeden celek (Gelnarová a kol., 2007). V APC modelech uvažujeme čas jako univerzální faktor ovlivňující vývoj incidence a mortality. Modelování probíhá v závislosti na třech časových faktorech: age (věk při diagnóze či úmrtí), period (rok diagnózy, úmrtí) a cohort (rok narození). Zřejmý vztah mezi věkem, periodou a rokem narození vypadá následujícím způsobem: cohort period age . Kvantitativně se na riziku vzniku rakoviny nejvíce podílí věk pacienta. Výskyt nádorů stoupá ve starších věkových skupinách, které jsou více ohroženy nádorovými onemocněními. Efekty periody jsou charakteristické okamžitými nebo zpožděnými, ale předurčenými, změnami v každé věkové skupině a proto patří k událostem, které rychle mění incidenci nebo mortalitu v řádově stejném rozsahu bez ohledu na věkové skupiny. Ony často vznikají ze změn klasifikačních kritérií, dostupnosti nových diagnostických testů nebo organizace screeningu. Efekty kohorty jsou spojeny s dlouhodobými zvyky a návyky a souvisí s datem narození, protože zahrnují faktory, které sdílí určitá generace, společně stárnoucí v průběhu času. Sem patří například obvyklý počet děti, životospráva nebo sexuální chování (Bray a Moller, 2006). Nejčastěji se data zkoumají v agregované podobě, například za pětileté období. Pak vzájemný vztah mezi věkem při diagnóze (nebo úmrtí), rokem diagnózy (úmrtí) a rokem narození již nelze vyjádřit pomocí jednoduchého vzorce, ale pomocí tzv. Lexisova diagramu. Řádky Lexisova diagramu jsou tvořený jednotlivými věkovými kategoriemi, sloupce jsou tvořeny kategoriemi dle data diagnózy. Každé věkové kohortě odpovídá jedna diagonála tabulky (Gelnarová a kol., 2007). Pokud jsou věk a perioda kategorizovány do pětiletých intervalů, pak jednotlivé kohorty tvoří skupiny lidí, jejichž datum narození se nachází v desetiletém intervalu. Některé kohorty se vzájemně překrývají. Lexisův diagram existuje ve dvou variantách: Lexisův diagram se čtvercovými kohortami a Lexisův diagram s trojúhelníkovými kohortami (Neuvirtová, 2006). 37
Nechť máme A věkových kategorií, P period, a C kohort. Efekt věku označme jako i pro i 1,... A , efekt periody jako j pro j 1,...P , efekt kohorty jako k pro k 1,...C . Incidenci v i-té věkové skupině a j-té periodě I ij lze odhadnout pomocí APC modelu následujícím způsobem: I ij exp( i j k ) .
(19)
Nejdřív se zvolí referenční perioda nebo kohorta, pro kterou se odhadnou efekty věku pro každou věkovou kategorii. Exponováním i získáme incidenci pro jednotlivé věkové kategorie v referenční periodě nebo kohortě. Incidence pro ostatní periody jsou odvozeny z incidencí v referenční periodě (Gelnarová a kol., 2007). Když vliv kohorty není považován za významný, lze data modelovat pomocí age-period modelů. Incidence v i-té věkové skupině a j-periodě je rovna součinu exp( i ) exp( j ) . Analogicky je možné definovat age-cohort model, ve kterém není obsažen efekt periody. V APC modelech se parametry odhadují pomocí metody maximální věrohodnosti. Považujeme-li jeden z parametrů za známý, ostatní se určují pomocí nejvhodnějšího odhadu relativního rizika, převzatého z výpočtů Standardized Mortality Ratios. Když neznáme žádný z parametrů, používá se metoda IPF (iterrative proportional fitting), která je speciálním případem obecného algoritmu výpočtu maximálně věrohodného odhadu parametrů loglineárních modelů (Clayton a Schifflers, 1987). Přepsání APC modelu do maticového tvaru a algoritmus odhadování parametrů znázornil ve své publikaci Naser B. Elkun (2005), tamtéž je popsán výpočet rozptylu a intervalů spolehlivosti pro bodové odhady incidence s využitím delta metody. Odhad parametrů APC modelu může být také proveden pomocí sekvenční (Carstensen a Keiding, 2005) nebo Holfordové metody (Holford, 1983). Fitování APC modelů je implementováno v software R, knihovna Epi (Carstensen, 2007). Hlavním problémem age-period-cohort modelů je lineární závislost mezi efektem periody, kohorty a věku, takzvaný identifiability problem (Carstensen, 2007). Řada existujících přístupů řešících identifiability problem je uvedena v publikaci Robertsona a kol. (1999). Age-period-cohort model také může být zapsán ve tvaru I ij exp( i j j k ) ,
(20)
kde je průměrný trend společný pro periodu a kohortu, označovány jako drift, efekty periody a kohorty jsou nelineární (Bray a Moller, 2003). Pro výše uvedenou metodu a následující její modifikace platí předpoklad, že aktuální trendy nebo jejich části budou zachovány v budoucnu. V modelu (20) se nelineární vliv periody a kohorty rovná poslednímu odhadovanému efektu. Uvažujeme kategorizaci do pětiletých intervalů. Predikce se dělají projekcí driftu, ale místo přidávání ke každé ze čtyř nových period, přidává se , , 1 / 2 , 1 / 2 , což umožňuje tlumení exponenciálního růstu v multiplikativním modelu. Další možnost řešení tohoto problému u nádorů s rostoucím trendem ( ˆ 0 ) je použití následující modifikace (Moller a kol., 2003): I ij exp( i j k ) (1 j ) .
(21)
I ij ( i j j k ) 5
(22)
Model
je založen na aplikaci mocninné funkce místo logaritmické, pátá mocnina je zvolena empiricky. Pro predikci budoucích hodnot se drift promítá stejným způsobem jako v metodě (20). Moller a kol. (2003) zmiňují několik způsobů modifikace modelu (22). Jednou z možností je přidávání celého driftu ke všem budoucím pětiletým obdobím (metoda 23), což ovlivní jenom dlouhodobou predikci.
38
Pro vyhodnocení vlivu nelineárních složek periody a kohorty se do modelu (24) začleňuje pouze věk a drift I ij ( i j ) 5 .
(24)
Výběr nižší mocniny tlumí exponenciální růst ještě víc, ale když hodnoty jsou příliš malé, mohou nastat numerické problémy I ij ( i j j k ) 2 .
(25)
Implementace předpokladu o tom, že recentní periody jsou relevantnější než předchozí období, je provedena v metodě (26) vážením případů. Poslední perioda dostává w-krát větší váhu než dřívější, předposlední perioda dostává (w – 1)-krát větší váhu atd., kde w je počet period v bázi predikce. Další modifikace namísto celé observační periody používá jenom rozdíl mezi dvěma posledními obdobími. Máme-li P period, pak se poslední rozdíl rovná P 1 last , kde P 1 je poslední odchylka od celkového driftu. Ovšem daná záměna má smysl pouze, jestli chování trendu není náhodně vychýlené. Model I ij ( i j j 2 k ) 5
(26)
slouží k určení, zda aplikovat nebo last . Pokud je ˆ významné, používá se last . Nahradíme v modelech ((3), (4), (10), (15)) baseline parametr i efektem věku, slope parametr driftem (případně i driftem i , příslušným jisté věkové skupině i). Změníme také označení periody p na j. Báze predikce je interval s délkou 11 let. Model (4) není implementován ve většině statistických software, proto modifikace (27) nabízí odhadnutí parametrů modelů (4) a (3) pomocí modelů (10) a (15). Vypočítané odhady mohou být dosazeny do vzorků (4) a (3), protože (1 x) exp( x) pro malé hodnoty x, a tento trik jenom nepatrně ovlivní predikci. Následující modifikace (27) přidává k modelu takový počet polynomů, který je postačující k popisu chování dat v odlišných věkových skupinách. Pro onemocnění s klesajícím trendem se používá tvar I ij exp( i ik j ) ,
(27.1)
kde ik 0 1 i nebo ik 0 1 k , výběr vhodného vzorku se provádí pomocí srovnání odchylek, přičemž menší odchylka znamená lepší odhad. Výběr počtu polynomů, které budou zahrnuty do modelu, se dělá následujícím způsobem. Za prvé se srovnávají modely s ik 0 a ik 0 1 i , resp. ik 0 1 k . Jestliže ˆ1 je významně odlišné od nuly, pokračujeme přidávat polynomy 2 i 2 , resp. 2 k 2 , dokud m a ˆm1 jsou zároveň nevýznamné. Pro onemocnění s klesajícím trendem je vhodný model I ij exp( i ) (1 ik j ) .
(27.2)
Modifikace (28) umožňuje vyhlazování efektu kohorty a periody pomocí začlenění do modelu polynomů druhého a třetího řádu a má tvar I ij exp( i j 2 j 2 3 j 3 2 k 2 3 k 3 ) ,
(28)
kde 2 a 3 , 2 a 3 jsou parametry polynomů druhého a třetího řádu, které jsou vztaženy k centrovaným hodnotám periody j a kohorty k . Ovšem nevýhodou této metody mohou být velké odchylky polynomů, které vyhlazují vliv periody. Další úprava (29) používá bázi délky 16 jednoročních období v tom případě, kdy odhad ˆ2 je statisticky nevýznamný 39
I ij exp( i j 2 j 2 2 k 2 3 k 3 ) ,
(29)
jinak se výpočet provádí na základě 11 leté báze (Moler a kol., 2003). Berzuini a Clayton vypracovali Bayesovskou modifikaci APC modelu, která upravuje efekty věku, periody a kohorty tak, aby se odhady pro sousední skupiny příliš od sebe nelišily (Bray a Moller, 2006). Na rozdíl od klasického APC modelu, platí předpoklad, že se počty onemocnění řídí binomickým rozdělením I ij ~ Bi(nij , pij ) , kde nij je známý počet lidí ve věkové skupině i v období j, a pij je neznámá pravděpodobnost výskytu onemocnění. Bayesovský přístup zahrnuje hierarchický model, který v první řadě počítá s incidencí, jako s binomickým procesem, a pro vyhlazování parametrů věku, periody a kohorty k dispozici jsou náhodné procházky prvního a druhého řádu s a bez dodatečných nestrukturovaných komponentů. Software BAMP (Bayesian Age-Period-Cohort Modeling and Prediction) nabízí analýzu incidence nebo mortality pomocí Bayesovské modifikace APC modelu (Schmid a Held, 2007). 3.1.3.
Srovnání predikčních modelů
Vývoj incidence lze modelovat různými způsoby. Každý z nich má svoje výhody a nevýhody. Jednoduchá extrapolace trendů z minulosti do budoucna je podle principu parsimonie dobrou volbou, ale má silný předpoklad konstantnosti parametrů, což často zkresluje výsledek. Box-Jenkinsonové modely jsou flexibilní a rychlé se adaptují na změnu charakteru modelovaného procesu, zároveň často poskytují kvalitní předpověď. Avšak jejich realizace a interpretace výsledků není snadná, navíc modelování musí být provedeno na bázi, obsahující nejméně 50 pozorování. Což znamená, že se Box-Jenkinsonová metodologie nehodí pro data, která jsou seskupená do pětiletých intervalů, jelikož není k dispozici dostatečné množství informace. SSM model je flexibilnější než standardní regresní model, protože se časově proměnlivé koeficienty umožňují přizpůsobit náhlým změnám v pozorovaných datech. Klasický regresní model se snaží proložit jednu křivku přes celý datový soubor, což nemusí poskytnout dobrý odhad v případě výskytu četných prudkých výkyvů. Citlivost SSM na náhlé změny v datech není výhodou, pokud předurčené nebo náhodné změny v pozorovaných časových řadách způsobují klikatý tvar křivky (Hayat a kol., 2010). Modely (1) – (18) dost dobře representují hlavní rysy historického vývoje incidence, což zvyšuje šanci dostat spolehlivou predikci. Malý počet parametrů a dispozice dost velkého počtu stupňů volnosti zvětšují přesnost fitování modelu. Ovšem jsou známy příklady zkreslení při použití dané metodiky. Dyba ve své práci (2000) analyzoval onkologická data z regionu StockholmGotland ve Švédsku. Byly srovnávány průměrné věkově specifické incidence maligního melanomu žen v letech 1960 – 1984 a incidence predikované pro období 2000 – 2004. Z obrázku 5 je vidět, že predikce incidence pro 5. věkovou skupinu jsou podhodnocené (Gelnarová a kol., 2007).
40
Obr. 5: Ilustrační obrázek, upraveno podle Dyba, 1997. T. Dyba: Melanom, ženy, onkologický region Stockholm-Gotland. Přerušovaná čára – průměrné, věkově specifické incidence v letech 1960 – 1984. Plná čára – predikce incidence pro periodu 2000 – 2004 (Neuvirtová, 2006).
APC modely se často používají pro modelování incidence a mortality. Nicméně předpoklad stejného věkového profilu nebývá vždy splněn a hlavním problémem age-period-cohort modelů je lineární závislost mezi efektem periody, kohorty a věku. Bayesovská modifikace APC modelu nabízí dobré výsledky predikce, ovšem pro některé nádory může poskytovat extrémní hodnoty. (Bray a Moller, 2006). Bray a Moller ve své publikaci (2006) nabízejí predikovat incidenci nádorových onemocnění pomocí modelu (22) - (26) v případě, že máme k dispozici data za několik předchozích desetiletí. Máme-li data za kratší časový úsek, dají se použít jednoduché regresní modely (1) - (18). Na data ovlivněná artefakty by se měla aplikovat extrapolace, která předpokládá konstantní budoucí incidenci a zahrnuje jenom demografické změny v populaci. V praxi se ukázal význam pro predikci incidence zhoubných nádorů jednoduchých lineárních v čase modelů (Pindyck a Rubifeld, 1976; Cox a Wermuth, 1996). Použití jednodušších modelů, které jsou jenom součástí složitých modelů, zlepšuje přesnost predikce. Komplexní modely, obsahující hodně parametrů nebo mající složitý funkcionální tvar, snižují přesnost odhadu tím, že skoro vždy rozšiřují predikční interval až k jeho nepoužitelnosti. Pro predikci incidence zhoubných nádorů, včetně zhoubného melanomu, do roku 2022 v Norsku, Irsku, Dánsku, Švédsku a Finsku. Moller a kol. (2002) použili metodu (26), power recent slope model. Báze predikce se skládala ze záznamů výskytů nádorových onemocnění během období 1958 – 1977, které byly rozděleny do pětiletých intervalů, pětiletých věkových skupin a podle pohlaví. Ke každé z pěti nových period přidávali , 3/4 , 1 / 2 , 1 / 4 , 1 / 4 .
41
Dlouhodobá predikce incidence zhoubného melanomu ve Spojeném království Velké Británie a Severního Irska byla provedena pomocí age cohort modelu (Diffey, 2004). V Holandsku pro predikci incidence melanomu do roku 2015 byly použity modely (3), (4), (10) a (15) (E. de Vries a kol., 2005). Moller a kol. (2003) ve své práci srovnávají mezi sebou modely (3), (4), (10), (15), (20), (22), (28) a jejich modifikace. Na data z onkologických registrů Norska, Dánska, Švédska a Finska za období 1958 – 1997 byly aplikovány 15 metod. Následně se srovnával medián absolutních hodnot rozdílů mezi pozorovanou a očekávanou incidencí. Obrázek 6 demonstruje použití různých predikčních metod na věkově standardizovaná data o zhoubném melanomu u mužů v Norsku. Báze predikce obsahuje data o incidenci nádorů za období 1958 – 1977. Dá se říct, že nejlepší odhad poskytuje short-base model. Také z obrázku je vidět efekt přidávání necelého driftu do poloviny predikčních period. Hodnoty, predikované pomocí APC modelu, prvních 10 let exponenciálně rostou, ale pak nastává zalomení čáry v důsledku zkrácení driftu.
Standardizovaná úroveň incidence
Obr. 6: Ilustrační obrázek, upraveno podle Moller a kol., 2003. B. Moller a kol.: Pozorovaná versus očekávaná věkově standardizovaná incidence zhoubného melanomu, muži, Norsko. Predikce je založena na pozorováních do roku 1977 a provedena pomocí čtyř hlavních metod.
Pozorovaná incidence APC model (20) Power model (22) Short-base model (3) Short APC model (28)
Perioda
42
3.2. Metodika hodnocení populačního přežití.
Přežití pacientů je v onkologii klíčovým parametrem a je standardně používáno pro hodnocení klinických experimentů nebo pro analýzy populační zátěže. Analýza přežití na populační úrovni není metodicky jednoduchá a je dosud předmětem probíhajícího výzkumu. (Pavlík a kol., 2010). Přežití je parametr, který zahrnuje vliv mnoha faktorů, je ukazatelem komplexních populačních vztahů a trendů. Základním cílem analýzy přežití je odhad funkce přežití, S (t ) , kterou definujeme jako pravděpodobnost dožití pacienta nejméně do času t od začátku sledování: S (t ) Pr(T t ) , Kde T náhodná veličina, reprezentující čas, kterého se pacient dožil od začátku sledování a t 0 . S (t ) je nerostoucí funkce s hodnotou 1 v čase 0. Nejčastější hodnocenou charakteristikou onkologických dat je celkové přežití pozorované u daného souboru pacientů. Celkové přežití odráží celkovou mortalitu bez ohledu na příčinu úmrtí a standardně se používá v klinických studiích. Z důvodu silné závislosti na věkové struktuře dané populace a následné integrace všech příčin úmrtí, tedy i příčin, které nesouvisí se sledovanou diagnózou, celkové přežití není úplně vhodné pro populační hodnocení. Pro srovnávací analýzu přežití založenou na populačních datech se používá relativní přežití, které je definováno jako podíl celkového přežití daného souboru pacientů a očekávaného přežití srovnatelné skupiny osob z obecné populace, která podle předpokladu není zatížena sledovaným onkologickým onemocněním (Gelnarová, 2007). Největší výhodou relativního přežití je fakt, že pro jeho výpočet není potřeba detailní záznam příčin úmrtí u jednotlivých pacientů, čímž se vyhýbáme problémům s jejich spolehlivostí (Dickman a kol., 2004). Hodnocení přežití je vždy prováděno retrospektivně po dosažení požadované doby sledování. Předpokládáme, že neznáme rozložení pravděpodobnosti, proto pro hodnocení dat přežití jsou vhodné neparametrické metody. Dvě nejznámější z nich jsou metoda dle Kaplan-Meiera a metoda Life-table. Výsledek hodnocení přežití analýzou dle Kaplan-Meiera je hodně ovlivněn dobou sledování a velikostí skupiny pacientů. Za standardní metodu hodnocení populačních dat je považována metoda Life-table (Verdecchia a kol., 2007), která odhaduje funkci přežití podle časových intervalů a často pracuje s časovými úseky o délce 1 rok a její přesnost tedy není tolik ovlivněna detailní kvalitou záznamů v registru. V případě, že se populace liší svou věkovou strukturou, můžeme vypočítat věkově specifické relativní přežití, které znamená výpočet relativního přežití v několika věkových kategoriích a následné vážení těchto dílčích odhadů váhami příslušných věkových kategorií (Brenner a Hakulinen, 2003). Odhady x-letého přežití částečně řeší problém heterogenity vzorku, neboť výpočet agreguje více ročních záznamů sledování. Běžnou metodou kalkulace x-letého absolutního nebo relativního přežití je kohortní metoda. Analyzovaná kohorta pacientů je definována retrospektivně dle data diagnózy a vzorců výstupní analýzy zpět, což je patrné u 10- a víceletého přežití (Dušek a kol., 2007). U dat, kde se přežití významně mění v důsledku vývoje diagnosticko-léčebných postupů je vhodná pro použití analýza časových period, která započítává data pouze ze sledování v recentním období na rozdíl od kohortní metody. Analýza period odráží aktuální výsledky péče i když může poskytovat optimistické nadhodnocení přežití (Brenner a kol., 2004). Další alternativní metodou je kompletní analýza, která zahrnuje jak data z recentního období, tak i data z průběžného sledování dříve diagnostikovaných pacientů. Daný přístup hodnocení populačního přežití se v literatuře považuje za objektivnější a přesnější než jiné postupy (Brenner a kol., 2004). Tabulka 4 pro ukázku obsahuje hodnoty 5letého absolutního a relativního přežití pro zhoubný melanom (C43) vypočítané pomocí kompletní analýzy na referenčním souboru NOR ČR za období 1995 – 2003 (Dušek a kol., 2007).
43
Tab. 4: Hodnoty 5letého absolutního a relativního přežití pro zhoubný melanom (C43) vypočítané pomocí kompletní analýzy na referenčním souboru NOR ČR za období 1995 – 2003. Analýza zahrnuje pacienty s protinádorovou léčbou ze všech typů zdravotnických zařízení (Dušek a kol., 2007). Stadia Všechna stadia Stadium I+II Stadium III Stadium IV
N
5leté přežití
9920 7956 1254 391
71,8 79,8 43,6 17,4
44
5leté relativní přežití 84,1 92,6 55,2 21,2
4. Aplikace regresních modelů a modelů časových řad na data NOR o
zhoubném melanomu. 4.1. Data a výběr modelů
Data, nad kterými jsou vytvořeny modely časových řad a regresní modely v této práci jsou data NOR, týkající se incidence, mortality a prevalence zhoubného melanomu (C43). Jedná se o data z let 1977 – 2007. Údaje NOR jsou zpětně validovány a srovnávány s registrem zemřelých, proto nejaktuálnější dostupné údaje v roce 2010 byly údaje za rok 2007. Vzhledem k administrativním změnám, které proběhly v roce 1995 byly modely pro predikci incidence, mortality a prevalence vytvořeny pouze na základě dat z let 1995 – 2007. Kvalita analyzovaných záznamů je znázorněna na obrázku 4. Dále bylo přihlédnuto také k pohlaví pacientů a stadiu onemocnění – I., II., III., IV. a neuvedené stadium – skupina bez známého klinického stadia neuvedeného z objektivních důvodů. Pokud v historických záznamech nebylo uvedeno stadium onemocnění, stadium bylo dopočteno na základě kompletní TNM klasifikace uvedené v NOR. Odděleně byla analyzována skupina pacientů bez známého klinického stadia neuvedeného z objektivních důvodů. Predikce byla provedena pouze na základě dat o zhoubném melanomu, tedy nevztahuje se na melanomu in situ. Do části výpočtů byla zahrnuta také demografická data. Na oficiálních internetových stránkách Českého statistického úřadu (URL 5) je zveřejněna predikce vývoje demografie v České republice. Ze tří variant projekce (nízká, střední, vysoká), byla pro účely predikce použita varianta střední. Pro výběr nejvhodnějšího modelu ze třídy časových řad pomocí statistického software SPSS na základě dat NOR o zhoubném melanomu za období 1991 – 2003 byla provedena predikce incidence pro rok 2004 – 2007. Pro srovnání modelů byl použit medián absolutní hodnoty rozdílu mezi pozorovaným a očekávaným počtem nově diagnostikovaných nádorových onemocnění (Moller a kol., 2003) (viz Tabulka 5). Model ARIMA (1,1,0) má nejmenší medián absolutní hodnoty rozdílu a poskytuje dobrý predikční interval, proto byl vybrán pro predikce incidence, mortality a prevalence. Výpočet byl proveden pomocí software SPSS (Statistical Package for the Social Sciences), kde je model ARIMA (1,1,0) implementován. Ze třídy regresních modelů jsem vybrala poissonovskou regresi se zahrnutím demografie, data byla analyzována pomocí statistického software R 2.12.0. Při výpočtu byl využit balík Epitools a procedura predict.glm.
45
Tab. 5: Srovnání predikčních modelů podle mediánu absolutní hodnoty rozdílu mezi pozorovaným a očekávaným počtem nově diagnostikovaných zhoubných melanomů pro období 2004 – 2007. Predikční metoda
Medián absolutní hodnoty rozdílu mezi pozorovaným a očekávaným počtem nově diagnostikovaných nádorů
Exponenciální vyhlazování, simple
95,00
Exponenciální vyhlazování, Holt’s linear trend
76,56
Exponenciální vyhlazování, Brown’s linear trend
91,91
Exponenciální vyhlazování, damped trend
76,37
ARIMA (1,0,0)
76,53
ARIMA (0,1,0)
82,84
ARIMA (0,0,1)
76,56
ARIMA (1,1,1)
58,19
ARIMA (1,1,0)
57,13
ARIMA (0,1,1)
67,76
ARIMA (1,0,1)
79,41
ARIMA (2,1,0)
57,33
Poissonovská regrese
65,59
4.2. Predikce incidence, mortality a prevalence.
Predikce incidence, mortality a prevalence zhoubného melanomu pro rok 2008 – 2011 jsou shrnuty v příloze B. Pomocí modelu ARIMA (1,1,0) byla predikována celková incidence, prevalence a mortalita (viz Tabulky B-1 – B-3, Obrázky B-1 – B-3). Všechny bodové odhady jsou doplněny 90% IS (intervalem spolehlivosti). Predikce incidence, mortality a prevalence mužů a žen byly provedeny pomocí samostatných ARIMA (1,1,0) modelů, proto se hodnoty celkové incidence, mortality a prevalence nerovnají součtu predikovaných hodnot pro muže a pro ženy. I přesto, že se modely ARIMA běžně nepoužívají pro predikci epidemiologických charakteristik, poskytují dost dobrý bodový odhad a predikční interval prevalence zhoubného melanomu, obrázek B-3. Široce používanou metodou predikce incidence a mortality je poissonovská regrese (viz Tabulky B-4 – B-5, Obrázky B-4 – B-5). Predikce prevalence se většinou provádí pomocí metod odlišných od těch, které jsou popsány v kapitole číslo 3 (Gelnarová, 2007). Ale v rámci mé bakalářské práce se nedíváme na prevalenci z hlediska přežívání pacientů a modelujeme ji stejným způsobem jako incidenci a mortalitu (viz Tabulka B-6, Obrázek B-6). Všechny bodové odhady jsou doplněny 90% IS. Predikce incidence, mortality a prevalence mužů a žen byly provedeny pomocí samostatných regresních modelů, proto se hodnoty celkové incidence, mortality a prevalence nerovnají součtu predikovaných hodnot pro muže a pro ženy. Další důležitou součástí predikčních výpočtů je predikce incidence zhoubného melanomu po stadiích. Bodové odhady počtu pacientů v určitém stadiu onemocnění pro rok 2008 – 2011 byly 46
vypočítány aplikací procentuálního zastoupení jednotlivých stadií v minulosti na predikční odhad celkové incidence v budoucnu. Použila jsem odhady obdrženy pomocí poissonovské regrese (viz Tabulka B-7, Obrázek B-7). Není možné vytvořit samostatné regresní modely pro jednotlivá stadia a následně vypočítat predikční interval z důvodu podstatných změn diagnostických kritérií v VI. vydání TNM klasifikace (viz Tabulka 3), proto v tabulce B-7 a na obrázku B-7 chybí 90% IS. Z obrázku 7 lze vidět očekávaný nárůst počtů onemocnění v I. stadiu. Z provedených predikcí lze usuzovat o tom, že incidence zhoubného melanomu v budoucnu roste, vývoj mortality je víceméně stabilní, což způsobuje rychlý nárůst prevalence, který potvrzují predikované hodnoty.
47
Závěr V důsledku stárnutí světové populace roste incidence zhoubných nádorů, proto epidemiologická analýza a predikce počtu nově diagnostikovaných nádorových onemocnění nebo úmrtí na ně nabývají na významnosti. Tato práce měla za cíl uvést problematiku zhoubného melanomu, rozebrat kvalitu dat o daném nádorovém onemocnění a poskytnout přehled epidemiologických charakteristik, seznámit s metodami pro predikce incidence a aplikovat je na reálných datech. První kapitola obsahuje úvod do problematiky zhoubného melanomu, poskytuje klinický obraz tohoto nádorového onemocnění a přehled rizikových faktorů, které se podílejí na jeho vzniku, také zahrnuje krátký popis epidemiologie, diagnostiky a léčby. Na konci kapitoly je zmíněn současný výzkum, který naznačuje možné náhlé změny díky novému pohledu na pochopení mechanismů, které vedou k neregulovanému růstu nádorových buněk. V druhé kapitole byly vysvětleny základní epidemiologické pojmy. Následuje část obsahující popis Národního onkologického registru a rozbor kvality dat o zhoubném melanomu, nad kterými se provádí epidemiologická analýza a predikce incidence, mortality a prevalence. Druhá kapitola také obsahuje popis a vyhodnocení epidemiologických charakteristik a dlouhodobých trendů za období 1977 – 2007. Ve třetí kapitole byly uvedeny metody pro predikce incidence, jejich srovnání a stručný přehled metodiky hodnocení populačního přežití. V závěru práce se provádí výběr metod, které jsou následovně aplikovány na reálná data o zhoubném melanomu za pomocí statistického programu R a SPSS. Predikce pro rok 2008 – 2011 byla provedena na základě dat NOR ČR za období 1995 – 2007 pomocí poissonovské regrese a modelu ARIMA (1,1,0). Použité predikční modely lze ještě dále modifikovat. Detailnější srovnání jednotlivých metod a jejich modifikací, rozbor kritérií vhodnosti a spolehlivosti predikčních modelů nebo dokonce programování predikčních algoritmů může být cílem postupu pro další práci.
48
Seznam zkratek ACS
American Cancer Society
AJCC
American Joint Committe on Cancer
APC
age-period-cohort model
AR
autoregresní model
ARIMA
autoregresní integrované modely klouzavých průměrů
ARMA
smíšený model časových řad
ASR(W/E)
věkově standardizovaná incidence (mortalita) na světový/evropský věkový standard
ALM
akrolentiginózní melanom
BAMP
Bayesian Age-Period-Cohort Modeling and Prediction
BRAF
serin/threonin-proteinkináza B-Raf
CDK8
cyklin-dependentní kináza 8
ČSÚ
Český statistický úřad
DCO
list o prohlídce mrtvého
ERK
extracelulární signálem regulována kináza
GLM
zobecněné lineární modely
IARC
International Agency for Research on Cancer
IPF
iterrative proportional fitting
IS
interval spolehlivosti
LDH
laktátdehydrogenáza
LMM
lentigo maligna melanom
MA
model klouzavých průměrů reziduální složky
MAPK
mitogenem aktivovaná proteinkináza
MKN-10
Mezinárodní klasifikace nemocí 10. vydání
MMV
metoda maximální věrohodnosti
NM
nodulární melanom
NOR
Národní onkologický registr
RTG
rentgenové vyšetření
SEER
The Surveillance, Epidemiology and End Results
SMR
standardized mortality ratio
SPSS
Statistical Package for the Social Sciences
SSM
superficiálně se šířící melanom
SSM
state-space metoda
SVOD
software pro vizualizaci onkologických dat
TNM
The TNM Classification of Malignant Tumors
WHO
World Health Organization 49
Seznam tabulek Tabulka 1
Nejvýznamější rizikové faktory vzniku zhoubného melanomu (Rhodes, 1999).
Tabulka 2
Rozdělení zhoubného melanomu do stadií dle 5. vydání TNM (Sobin a Wittekind, 1997). 15
Tabulka 3
Přehled TNM klasifikace zhoubného melanomu (C43).
20
Tabulka 3.1
T – primární nádor.
20
Tabulka 3.2
N – regionální mízní uzliny.
21
Tabulka 3.3
M – vzdálené metastázy.
22
Tabulka 3.4
Rozdělení do stadií.
23
Tabulka 4
Hodnoty 5letého absolutního a relativního přežití pro zhoubný melanom (C43) vypočítané pomocí kompletní analýzy na referenčním souboru NOR ČR za období 1995 – 2003. Analýza zahrnuje pacienty s protinádorovou léčbou ze všech typů 44 zdravotnických zařízení (Dušek a kol., 2007).
Tabulka 5
Srovnání predikčních modelů podle mediánu absolutní hodnoty rozdílu mezi pozorovaným a očekávaným počtem nově diagnostikovaných zhoubných melanomů 46 pro období 2004 – 2007.
Tabulka A-1 Epidemiologická situace v roce 2007. Tabulka A-2 Zastoupení diagnóz C43 a DO3 v datech NOR ČR za období 1977 – 2007. Tabulka A-3 Věk při diagnóze. Tabulka A-4 Věk úmrtí na zhoubný melanom. Tabulka A-5 Věk při diagnóze v různých obdobích. Tabulka B-1 Prediktivní odhady incidence zhoubného melanomu, model ARIMA (1,1,0). Tabulka B-2 Prediktivní odhady mortality zhoubného melanomu, model ARIMA (1,1,0). Tabulka B-3 Prediktivní odhady prevalence zhoubného melanomu, model ARIMA (1,1,0). Tabulka B-4 Prediktivní odhady incidence zhoubného melanomu, poissonovská regrese. Tabulka B-5 Prediktivní odhady mortality zhoubného melanomu, poissonovská regrese. Tabulka B-6 Prediktivní odhady prevalence zhoubného melanomu, poissonovská regrese. Tabulka B-7 Prediktivní odhady incidence zhoubného melanomu po stadiích.
50
11
Seznam obrázků Obrázek 1
Odhady hrubé incidence zhoubného melanomu celosvětově. Počet nově registrovaných zhoubných melanomů na 100 000 osob (všechny věkové skupiny, 12 obě pohlaví). GLOBOCAN 2008 (URL 3).
Obrázek 2
Odhady hrubé mortality zhoubného melanomu celosvětově. Počet registrovaných úmrtí na zhoubný melanom na 100 000 osob (všechny věkové skupiny, obě pohlaví). 13 GLOBOCAN 2008 (URL 3).
Obrázek 3
Přehled záznamů (C43) v Národním onkologickém registru za období 1977 – 2007. Vzor obrázku byl převzat z publikace Dušek a kol. (2007), originální data 24 Antonova.
Obrázek 4
Přehled záznamů (C43) v Národním onkologickém registru za období 1995 – 2007. Vzor obrázku byl převzat z publikace Dušek a kol. (2007), originální data 24 Antonova.
Obrázek 5
Ilustrační obrázek, upraveno podle Dyba, 1997. T. Dyba: Melanom, ženy, onkologický region Stockholm-Gotland. Přerušovaná čára – průměrné, věkově specifické incidence v letech 1960 – 1984. Plná čára – predikce incidence pro 41 periodu 2000 – 2004 (Neuvirtová, 2006).
Obrázek 6
Ilustrační obrázek, upraveno podle Moller a kol., 2003. B. Moller a kol.: Pozorovaná versus očekávaná věkově standardizovaná incidence zhoubného melanomu, muži, Norsko. Predikce je založena na pozorováních do roku 1977 a provedena pomocí 42 čtyř hlavních metod.
Obrázek A-1 Vývoj incidence a mortality melanomu kůže (C43, D03) za období 1977 – 2007. Obrázek A-2 Vývoj incidence zhoubného melanomu (C43) a melanomu in situ (D03) za období 1977 – 2007. Obrázek A-3 Vývoj kompletní prevalence melanomu kůže (C43, D03) za období 1990 – 2007. Obrázek A-4 Věkově specifická incidence melanomu kůže (C43, D03) za období 2003 – 2007. Obrázek A-5 Věkově specifická mortalita melanomu kůže (C43, D03) za období 2003 – 2007. Obrázek A-6 Věková struktura pacientů s melanomem kůže (C43, D03) za období 2003 – 2007. Obrázek A-7 Věkově specifická incidence melanomu kůže (C43, D03) v různých obdobích. Obrázek A-8 Srovnání vývoje hrubé a věkově standardizované incidence (ASR World, ASR Europe) melanomu kůže (C43, D03) za období 1977 – 2007. Obrázek A-9 Srovnání vývoje hrubé a věkově standardizované mortality (ASR World, ASR Europe) melanomu kůže (C43, D03) za období 1977 – 2007. Obrázek A-10 Věkově standardizovaná incidence melanomu kůže (C43, D03) v krajích České republiky v období 2003 – 2007. Obrázek A-11 Věkově standardizovaná mortalita melanomu kůže (C43, D03) v krajích České republiky v období 2003 – 2007. Obrázek A-12 Odhady věkově standardizované incidence a mortality na 100 000 osob (ASR World) melanomu kůže (C43, D03) v mezinárodním srovnání v roce 2008. Upraveno podle GLOBOCAN 2008 (URL 3). Obrázek A-13 Lokalizace melanomu kůže (C43, D03) zaznamenané v datech NOR ČR za období 1977 – 2007.
51
Obrázek A-14 Srovnání lokalizací melanomu kůže (C43, D03) v agregované podobě u mužů a žen zaznamenané v datech NOR ČR za období 1977 – 2007. Obrázek A-15 Vývoj incidence stadií při stanovení diagnózy zhoubného melanomu (C43) za období 1977 – 2007. Obrázek A-16 Vývoj zastoupení stadií při stanovení diagnózy zhoubného melanomu (C43) za období 1977 – 2007. Obrázek A-17 Zastoupení stadií dle věku při stanovení diagnózy zhoubného melanomu (C43) za období 2005 – 2007. Obrázek B-1 Celková incidence zhoubného melanomu (C43) v letech 1977 – 2007 a predikce pro rok 2008 – 2011 pomocí modelu ARIMA (1,1,0). Obrázek B-2 Mortalita zhoubného melanomu (C43) v letech 1981 – 2007 a predikce pro rok 2008 – 2011 pomocí modelu ARIMA (1,1,0). Obrázek B-3 Prevalence zhoubného melanomu (C43) v letech 1990 – 2007 a predikce pro rok 2008 – 2011 pomocí modelu ARIMA (1,1,0). Obrázek B-4 Celková incidence zhoubného melanomu (C43) v letech 1977 – 2007 a predikce pro rok 2008 – 2011 pomocí poissonovské regrese. Obrázek B-5 Mortalita zhoubného melanomu (C43) v letech 1981 – 2007 a predikce pro rok 2008 – 2011 pomocí poissonovské regrese. Obrázek B-6 Prevalence zhoubného melanomu (C43) v letech 1990 – 2007 a predikce pro rok 2008 – 2011 pomocí poissonovské regrese. Obrázek B-7 Incidence zhoubného melanomu (C43) po stadiích v letech 1977 – 2007 a predikce pro rok 2008 – 2011.
52
Seznam literatury ARENBERGEROVÁ M., 2010: Co nového v léčbě melanomu přinesl rok 2010? Lékařské listy. 19, 5 – 8. BEAULIEU N., BLOOM D. E., BLOOM L. R., STEIN R.M., 2009 : Breakaway: The global burden of cancer – challenges and opportunities. A report from the Economist Intelligence Unit. Economist Intelligence Unit, 73pp. BRAY F., MOLLER B., 2006: Predicting the future burden of cancer. Nature reviews Cancer. 6, 63 – 74. BRENNER H., HAKULINEN T., 2003: On crude and age-adjusted relative survival rates. Journal of Clinical Epidemiology. 56 (12), 1185 – 1191. BRENNER H., GEFELLER O., HAKULINEN T., 2004: Period analysis for up-to-date cancer survival data: Theory, empirical evaluation, computational realization and applications. European Journal of Cancer. 40, 326 – 335. CARSTENSEN B., KEIDING N., 2005: Age-Period-Cohort models: Statistical inference in the Lexis diagram. Dostupný z WWW: www.biostat.ku.dk/~bxc/APC. CARSTENSEN B., 2007: Age-period-cohort models for the Lexis diagram. Statistics in medicine. 26, 3018 – 3045. CIPRA T., 1986: Analýza časových řad s aplikacemi v ekonomii. SNTL, Praha, 248pp. CLAYTON D., SCHIFFLERS E., 1987: Models for temporal variation in cancer rates. I. Ageperiod and age-cohort models. Statistics in medicine. 6, 446 – 467. COX D. R., WERMUTH N., 1996: Multivariate dependencies – models, analysis and interpretation. Chapman and Hall, London, 272pp. ČAP R., DOBEŠ D., HOŠEK F., HYŽA P., 2005: Maligní melanom. Vojenské zdravotnické listy. 74(1), 4 – 8. DICKMAN P. W., SLOGGETT A., HILLS M., HAKULINEN T., 2004: Regression models for relative survival. Statistics in Medicine. 23(1), 51 – 64. DIEPGEN T.L., MAHLER V., 2002: The epidemiology of skin cancer. British Journal of Dermatology. 146 (61), 1 – 6. DIFFEY B. L., 2004: The future incidence of cutaneous melanoma within the U. K. British Journal of Dermatology. 151, 868 – 872. DUŠEK L., MUŽÍK J., KUBÁSEK M., KOPTÍKOVÁ J., ŽALOUDÍK J., VYZULA R., 2007: Český národní webový portál epidemiologie nádorů. Dostupný z WWW: http://www.svod.cz. Verze 7.0. DUŠEK L., MUŽÍK J., KOPTÍKOVÁ J., ŽALOUDÍK J., KLIMEŠ D., BOUREK A., INDRÁK K., MIHÁL V., HAJDÚCH M., ŠTĚRBA J., VYZULA R., ABRAHÁMOVÁ J., 2007: Registrace dat tvoří nezbytnou informační základnu současné onkologie. Klinická onkologie. 20, 53 – 62.
53
DUŠEK L., PAVLÍK T., KOPTÍKOVÁ J., MUŽÍK J., GELNAROVÁ E., ŽALOUDÍK J., VYZULA R., HAJDÚCH M., ABRAHÁMOVÁ J., 2007: Národní onkologický registr ČR jako zdroj referenčních standardů pro hodnocení výsledků léčebné péče. Klinická onkologie. 20, 77 – 95. DUŠEK L., ŽALOUDÍK J., KOPTÍKOVÁ J., MUŽÍK J., BRABEC P., PAVLIŠ P., ABRAHÁMOVÁ J., VYZULA R., 2007: Informační systém pro analytické zpracování dat Národního onkologického registru – projekt SVOD v roce 2006. Klinická onkologie. 20, 96 – 108. DUŠEK L., MUŽÍK J., ABRAHÁMOVÁ J., PAVLÍK T., MÁJEK O., KOPTÍKOVÁ J., VYZULA R., FÍNEK J., VORLÍČEK J., 2010: Epidemiologie solidních nádorů v ČR podle dat Národního onkologického registru za období 1997 – 2007. Postgraduální medicína. 3, 268 – 278. DVOŘÁKOVÁ K., TŘÍSKOVÁ K., 2009: Maligní melanom: strašák? Varování?. Anews – Týdeník estetické medicíny, 11.05. – 17.05. DYBA T., HAKULINEN T., PAIVARINTA L., 1997: A simple non-linear model in incidence prediction. Statistics in medicine. 16, 2297 – 2309. DYBA T., 2000: Precision of cancer incidence predictions based on the poisson distributed observations. University of Helsinki, academic dissertation. DYBA T., HAKULINEN T., 2000: Comparison of different approaches to incidence prediction based on simple interpolation techniques. Statistics in Medicine. 19, 1741 – 1752. FIKRLE T., PIZINGER K., 2010: Maligní melanom. Onkologie. 4(4), 225 – 228. FLAHERTY K.T., PUZANOV I., KIM K.B., RIBAS A., McARTHUR G.A., SOSMAN J.A., O’DWYER P.J., LEE R.J., GRIPPO J.F., NOLOP K., CHAPMAN P.B., 2010: Inhibition of Mutated, Activated BRAF in Metastatic Melanoma. The New England Journal of Medicine. 363(9), 809 – 819. GARBE C., McLEOD G.R., BUETTNER P.G., 2000: Time trends of cutaneous melanoma in Queensland, Australia and Central Europe. Cancer. 89(6), 69 – 78. GELNAROVÁ E., 2007: Prediktivní odhady incidence a prevalence nádorových onemocnění na populační úrovni. Masarykova univerzita, rigorózní práce. GELNAROVÁ E., NEUVIRTOVÁ L., SVOBODNÍK A., KOMOLÍKOVÁ L., DANEŠ J., SKOVAJSOVÁ M., BARTOŇKOVÁ H., MIŽÍK J., KOPTÍKOVÁ J., DUŠEK L., 2007: Využití národního onkologického registru pro modelování vlivu screeningových programů v cílové populaci: age-period-cohort modely. Klinická onkologie. 20, 167 – 175. HAKULINEN T., 1996: The future cancer burden as a study subject. Acta Oncologica. 35, 665 – 670. HANČLOVÁ J., TVRDÝ L., 2003: Úvod do analýzy časových řad. Ostrava, 34pp. HAYAT M. J., TIWARI R.C., GHOSH K., HACHEY M., HANKEY B., FEUER R., 2010: Ageadjusted US cancer death rate predictions. Journal of Data Science. 8, 339 – 348. HIESTEIN J.B., RUBERG R.L., 2000: Malignant Melanoma. Emedicine.com. Dostupný z WWW: http://emedicine.medscape.com/article/1100753-overview#showall.
54
HODI F.S., O’DAY S.J., McDERMOTT D.F., WEBER R.W., SOSMAN J.I., HAANEN J.B., GONZALEZ R., ROBERT C., SCHADENDORF D., HASSEL J.C., AKERLEY W., ALFONS J.M., LUTZKY J., LORIGAN P., VAUBEL J.M., LENETTE G.P., HOGG D., OTTENSMEIER C.H., LEBBE C., PESCHEL C., QUIRT I., CLARK J.I., WOLCHOK J.D., WEBER J.S., TIAN J., YELLIN M.J., NICHOL G.M., HOOS A., URBA W.J., 2010: Improved Survival with Ipilimumab in Patients with Metastatic Melanoma. The New England Journal of Medicine. 363(8), 711 – 723. HOLFORD T. R., 1983: The estimation of the age, period, cohort effects for vital rates. Biometrics. 39, 311 – 324. KAPOOR A., GOLDBERG M.S., CUMBERLAND M.K., RATNAKUMAR K., SEGURA M.F., EMANUEL P.O., MENDEZ S., VARDABASSO CH., LeROY G., VIDAL C.I. et al., 2010: The Histone Variant MacroH2A Suppresses Melanoma Progression Through Regulation of CDK8. Nature. 468, 1105 – 1109. KRAJSOVÁ I., 2006: Melanom: Klasifikace – diagnostika – terapie – prevence. MAXDORF, Praha, 332 pp. KRAJSOVÁ I., 2008: Atlas kožního melanomu. MAXODORF, Praha, 244 pp. LAI D., HARDY R. J., TSAI S. P., 1996: Statistical analysis of the standardized mortality ratio and life expectancy. American Journal of Epidemiology. 143 (8), 832 – 840. LENS M.B., DAWES M., 2004: Global Perspectives of Contemporary Epidemiological Trends of Cutaneous Malignant Melanoma. British Journal of Dermatology. 150, 179 – 185. McCULLAGH P., NELDER J. A., 1989: Generalized linear models. Chapman and Hall, London, 511pp. MOLLER B., FEKJAER H., HAKULINEN T., TRYGGVADOTTIR L., STORM H. H., TALBACK M., HALDORSEN T., 2002: Prediction of cancer incidence in the Nordic Countries up to the year 2020. The Official Journal of the European Cancer Prevention Organisation. 11 (1), 1 – 96. MOLLER B., FEKJAER H., HAKULINEN T., SIGVALDASON H., STORM H. H., TALBACK M., HALDORSEN T., 2003: Prediction of cancer incidence in the Nordic countries: empirical comparison of different approaches. Statistics in medicine. 22, 2751 – 2766. NASER B. ELKUN, 2005: Predicting confidence intervals for the Age-period-cohort model. Journal of Data Science. 3, 403 – 414. NEUVIRTOVÁ L., 2006: Epedemilogické analýzy dat onkologických pacientů se zaměřením na modelování časových trendů (aplikace na diagnózu rakoviny prsu). Masarykova univerzita, diplomová práce. PAVLÍK T., DUŠEK L., MÁJEK O., BABJUK M., 2010: Monitoring výsledků a kvality péče o pacienty s nádory urogenitálního systému v ČR. Dostupný z WWW: http://www.uroweb.cz/index.php?pg=dg--nadory-ledvin--monitoring. PINDYCK R., RUBINFELD D., 1976: Econometric models and economic forecasts. McGraw-Hill, New York, 634pp. RHODES A.R., 1999: Fitzpatrick’s dermatology in general medicine. 5th edn., McGrow-Hill Professional Publishing, New York, 3129 pp. 55
ROBERTSON CH., GANDINI S., BOYLE P., 1999: Age-period-cohort model: a comparative study of available methodologies. Journal of Clinical Epidemiology. 52 (6), 569 – 583. SCHMID V. J., HELD L., 2007: Bayesian age-period-cohort modeling and prediction – BAMP. Journal of Statistical Software. 21 (8), 1 – 15. SOBIN L.H., WITTEKIND CH., 1997: TNM Classification of Malignant Tumours. 5th edn. John Willey and Sons, Inc., New York, 189 pp. SOBIN L.H., WITTEKIND CH., 2002: TNM Classification of Malignant Tumours. 6th edn. John Willey and Sons, Inc., New York, 196 pp. ŠMILAUER P., 2007: Moderní regresní metody. České Budějovice, 168pp. TIWARI R. C., GHOSH K., JEMAL A., HACHEY M., WARD E., THUN M. J., FEUER E. J., 2004: A new method of predicting US and state-level cancer mortality counts for the current calendar year. CA: A Cancer Journal for Clinicians. 54, 30 – 40. VESELÝ M., 2007: Aplikace GLM modelu v provozní praxi. Masarykova univerzita, diplomová práce. VERDECCHIA A., FRANCISCI S., BRENNER H. et al., 2007: Recent cancer survival in Europe: a 2000 – 02 period analysis of EUROCARE-4 data. Lancet Oncology, published online in August 21, 2007: http://oncology.thelancet.com. de VRIES L., van de POLL-FRANCE L. V., LOUWMAN W. J., de GRUIJL F. R., COEBERGH J. W. W., 2005: Prediction of skin cancer incidence in the Netherlands up to 2015. British Journal of Dermatology. 152, 481 – 488.
Internetové zdroje URL 1: http://www.melanomy.cz/?touch=malignimelanom, Arenbergerová M. a Arebenrg P., Melanomy.cz, rok aktualizace 2011. URL 2: http://www.melanoma.org/learn-more/melanoma-101/melanoma-risk-factors, Melanoma Research Foundation, rok aktualizace 2011. URL 3: http://globocan.iarc.fr/, GLOBOCAN 2008, Cancer Incidence and Mortality Worldwide in 2008, rok aktuaizace 2010. URL 4: http://www.melanoma.cz/co-je-melanom, Hercogová J., Melanoma.cz, rok aktualizace 2011. URL 5: http://vdb.czso.cz/vdbvo/uvod.jsp, ČSÚ, Veřejná databáze ČSÚ, rok aktualizace 2011.
56
Příloha A: Epidemiologie melanomu kůže (C43, DO3) v České republice Obr. A-1: Vývoj incidence a mortality melanomu kůže (C43, D03) za období 1977 – 2007.
Počet případů na 100 000 osob
24 20 16 Incidence muži
12
Incidence ženy
8
Mortalita muži
4
Mortalita ženy
07
05
20
03
20
20
01
99
20
97
19
95
19
19
93
91
19
89
19
19
87
85
19
83
19
19
81
19
79
19
19
77
0
Rok
Tab. A-1: Epidemiologická situace v roce 2007. Počet na 100 000 osob Absolutní počet nových onemocnění Výskyt muži : ženy Mortalita na 100 000 osob Absolutní počet zemřelých Prevalence
Muži 22,6 1 149
Ženy 22,8 1 209
Celkem 22,7 2 358
0,99 : 1 5,2 266
3,4 180 20 021 osob
4,3 446
Obr. A-2: Vývoj incidence zhoubného melanomu (C43) a melanomu in situ (D03) za období 1977 – 2007.
18 C43
16 14
D03
12 10 8 6 4 2
07 20
05 20
03
01
20
20
99 19
97 19
19
95
93 19
91 19
19
89
87 19
85 19
19
81 19
79 19
19
83
0 77
Počet nově diagnostikovaných nádorů na 100 000 osob
20
Rok diagnózy
Tab. A-2: Zastoupení diagnóz C43 a DO3 v datech NOR ČR za období 1977 – 2007. Diagnóza C43 D03 Celkem
N 33 179 2796 35 975
% 92,23% 7,77% 100 %
Obr. A-3: Vývoj kompletní prevalence melanomu kůže (C43, D03) za období 1990 – 2007. 200
150 125 Prevalence celková
100
Prevalence C43
75
Prevalence D03
50 25
Rok
07
20
06
20
05
04
20
03
20
20
02
20
01
00
20
99
20
19
98
19
97
19
96
95
19
19
94
19
93
19
92
91
19
19
90
0 19
Počet nádorů na 100 000 osob
175
Obr. A-4: Věkově specifická incidence melanomu kůže (C43, D03) za období 2003 – 2007.
100 80 60 40
Muži Ženy
20 0 04 59 10 -1 4 15 -1 9 20 -2 4 25 -2 9 30 -3 4 35 -3 9 40 -4 4 45 -4 9 50 -5 4 55 -5 9 60 -6 4 65 -6 9 70 -7 4 75 -7 9 80 -8 4 85 +
Počet nově diagnostikovaných nádorů na 100 000 osob ve věkové skupině
120
Věk při diagnóze
Tab. A-3: Věk při diagnóze. Průměr Medián (25 – 75% kvartil)
Muži 62 let 63 (53 – 73) let
Ženy 59 let 60 (48 – 72) let
Obr. A-5: Věkově specifická mortalita melanomu kůže (C43, D03) za období 2003 – 2007.
40
30
20
Muži Ženy
10
10 -1 4 15 -1 9 20 -2 4 25 -2 9 30 -3 4 35 -3 9 40 -4 4 45 -4 9 50 -5 4 55 -5 9 60 -6 4 65 -6 9 70 -7 4 75 -7 9 80 -8 4 85 +
0 04 59
Počet úmrtí na 100 000 osob ve věkové skupině
50
Věk při diagnóze
Tab. A-4: Věk úmrtí na zhoubný melanom. Průměr Medián (25 – 75% kvartil)
Muži 71 let 74 (63 – 81) let
Ženy 74 let 77 (66 – 84) let
Obr. A-6: Věková struktura pacientů s melanomem kůže (C43, D03) za období 2003 – 2007.
12% 10% 8% 6% Muži
4%
Ženy
2% 0% 04 59 10 -1 4 15 -1 9 20 -2 4 25 -2 9 30 -3 4 35 -3 9 40 -4 4 45 -4 9 50 -5 4 55 -5 9 60 -6 4 65 -6 9 70 -7 4 75 -7 9 80 -8 4 85 +
Podíl nově diagnostikovaných nádorů dle věkových kategorií [%]
14%
Věk při diagnóze
Obr. A-7: Věkově specifická incidence melanomu kůže (C43, D03) v různých obdobích.
60
2003-2007
50
1998-2002 40
1993-1997 1988-1992
30
1983-1987 20 10 0 04 59 10 -1 4 15 -1 9 20 -2 4 25 -2 9 30 -3 4 35 -3 9 40 -4 4 45 -4 9 50 -5 4 55 -5 9 60 -6 4 65 -6 9 70 -7 4 75 -7 9 80 -8 4 85 +
Počet nově diagnostikovaných nádorů na 100 000 osob ve věkové skupině
70
Věk při diagnóze
Tab. A-5: Věk při diagnóze v různých obdobích. Období 1983 – 1987 1988 – 1992 1993 – 1997 1998 – 2002 2003 – 2007
N 3546 4597 6309 7896 10304
Průměr 56 let 57 let 58 let 59 let 60 let
Medián 58 let 59 let 60 let 61 let 61 let
Obr. A-8: Srovnání vývoje hrubé a věkově standardizované incidence (ASR World, ASR Europe) melanomu kůže (C43, D03) za období 1977 – 2007. Počet nově diagnostikovaných nádorů na 100 000 osob
24 20
Hrubá incidence ASR World
16
ASR Europe
12 8 4
07
05
20
03
20
01
20
99
20
19
97
19
95
93
19
91
19
89
19
87
19
19
85
19
83
19
81
79
19
19
19
77
0
Rok diagnózy
Obr. A-9: Srovnání vývoje hrubé a věkově standardizované mortality (ASR World, ASR Europe) melanomu kůže (C43, D03) za období 1977 – 2007.
4
Hrubá mortalita ASR World
3
ASR Europe
2 1
Rok diagnózy
07 20
05 20
03 20
01 20
99 19
97 19
95 19
93 19
91 19
89 19
87 19
85 19
83 19
81
0 19
Počet úmrtí na 100 000 osob
5
Obr. A-10: Věkově standardizovaná incidence melanomu kůže (C43, D03) v krajích České republiky v období 2003 – 2007.
Obr. A-11: Věkově standardizovaná mortalita melanomu kůže (C43, D03) v krajích České republiky v období 2003 – 2007.
Obr. A-12: Odhady věkově standardizované incidence a mortality na 100 000 osob (ASR World) melanomu kůže (C43, D03) v mezinárodním srovnání v roce 2008. Upraveno podle GLOBOCAN 2008 (URL 3). Muži
Ženy
Austálie Nový Zéland Švýcarsko Dánsko Norsko Nizozemsko Švédsko Slovinsko Spojené státy americké Irsko Česká republika Velká Británie Německo Island Kanada Finsko Beligie Incidence
Izrael Lucembursko
Mortalita
Itálie 60
40
20
0
20
40
60
Obr. A-13: Lokalizace melanomu kůže (C43, D03) zaznamenané v datech NOR ČR za období 1977 – 2007.
Ret
1%
4% 1% 1% 1%
Oční víčko,včetně koutku 10%
21%
Ucho a zevní zvukovod 3%
Jiné části obličeje Vlasová část hlavy a krku Trup
Horní končetiny, včetně ramene Dolní končetiny, včetně boku
17%
Jiné lokalizace
41% N = 35 975
NS
Obr. A-14: Srovnání lokalizací melanomu kůže (C43, D03) v agregované podobě u mužů a žen zaznamenané v datech NOR ČR za období 1977 – 2007. 100% 90% 80%
Jiné lokalizace
70%
Dolní končetiny, včetně boku
60% 50%
Horní končetiny, včetně ramene
40%
Trup
30%
Hlava, krk
20% 10% 0% Muži N = 17 285
Ženy N = 18 680
Obr. A-15: Vývoj incidence stadií při stanovení diagnózy zhoubného melanomu (C43) za období 1977 – 2007. není TNM klasifikace (stadia doplněna podle zaznamenaného TNM)
TNM III. vydání
Počet nově diagnostikovaných nádorů na 100 000 osob
14
TNM IV. vydání
TNM V. vydání
TNM VI. vydání
Stadium I
12
Stadium II
10
Stadium III
8
Stadium IV
6
Stadium neuvedeno z objektivních důvodů
4
Stadium chybně neuvedeno
2
07 20
05 20
03 20
01 20
99 19
97 19
95
93
19
91
19
89
19
19
87 19
85 19
83 19
81 19
19
19
77
79
0
Rok diagnózy
Obr. A-16: Vývoj zastoupení stadií při stanovení diagnózy zhoubného melanomu (C43) za období 1977 – 2007.
TNM III. vydání
TNM IV. vydání
TNM V. vydání
TNM VI. vydání
100% 90%
Stadium chybně neuvedeno
80%
Stadium neuvedeno z objektivních důvodů
70% 60% 50%
Stadium IV
40% 30%
Stadium III
20%
Stadium II
10%
Stadium I
Rok diagnózy
20 07
20 05
20 03
20 01
19 99
19 97
19 95
19 93
19 91
19 89
19 87
19 85
19 83
19 81
19 79
0% 19 77
Podíl nově diagnostikovaných nádorů dle stadií [%]
není TNM klasifikace (stadia doplněna podle zaznamenaného TNM)
100% 90% 80% 70%
Stadium neuvedeno
60%
Stadium IV
50%
Stadium III
40%
Stadium II
30% Stadium I
20% 10%
Věk při diagnóze
+ 85
-84 80
-74
-69
-79 75
70
65
-64 60
-59 55
-54 50
-44
-39
-49 45
40
35
-34 30
-29 25
4
0% 5-2
Podíl nově diagnostikovaných nádorů dle stadií [%]
Obr. A-17: Zastoupení stadií dle věku při stanovení diagnózy zhoubného melanomu (C43) za období 2005 – 2007.
Příloha B: Grafické vizualizace a tabelární souhrn provedených predikcí incidence, mortality a prevalence zhoubného melanomu (C43) pro období 2008 – 2011. Tab. B-1: Prediktivní odhady incidence zhoubného melanomu, model ARIMA (1,1,0). Muži 2008 2009 2010 2011
Incidence 90 % IS Incidence 90 % IS Incidence 90 % IS Incidence 90 % IS
Ženy
920 (828; 1013) 1100 (1007; 1193) 1027 (902; 1153) 1190 (1063; 1317)
Celková incidence 1948 (1833; 2062) 2185 (2070; 2301) 2161 (2006; 2317) 2379 (2222; 2536)
1031 (981; 1081) 1087 (1032; 1142) 1136 (1070; 1204) 1193 (1120; 1266)
Počet nově diagnostikovaných nádorů
Obr. B-1: Celková incidence zhoubného melanomu (C43) v letech 1977 – 2007 a predikce pro rok 2008 – 2011 pomocí modelu ARIMA (1,1,0). 2800 Incidence
2400
Bodový odhad
2000
90% predikční interval
1600 1200 800 400
11
09
20
07
20
05
20
03
20
01
20
99
20
97
19
95
19
93
19
91
19
89
19
87
19
85
19
83
19
81
19
79
19
19
19
77
0
Rok diagnózy
Tab. B-2: Prediktivní odhady mortality zhoubného melanomu, model ARIMA (1,1,0). Muži 2008 2009 2010 2011
Mortalita 90 % IS Mortalita 90 % IS Mortalita 90 % IS Mortalita 90 % IS
276 (247; 306) 292 (256; 328) 309 (266; 351) 327 (279; 375)
Ženy 161 (138; 185) 164 (141; 188) 141 (118; 181) 148 (116; 180)
Celková mortalita 442 (403; 482) 459 (415; 502) 468 (415; 520) 482 (425; 540)
Obr. B-2: Mortalita zhoubného melanomu (C43) v letech 1981 – 2007 a predikce pro rok 2008 – 2011 pomocí modelu ARIMA (1,1,0). Počet úmrtí na zhoubný melanom
600 Celková mortalita
500
Mortalita muži Mortalita ženy
400
Bodový odhad 90% predikční interval
300 200 100
11
09
20
07
20
05
20
03
20
01
20
99
20
97
19
95
19
93
19
91
19
89
19
87
19
85
19
83
19
19
19
81
0
Rok diagnózy
Tab. B-3: Prediktivní odhady prevalence zhoubného melanomu, model ARIMA (1,1,0). 2008 2009 2010 2011
Prevalence 90 % IS Prevalence 90 % IS Prevalence 90 % IS Prevalence 90 % IS
Muži 8203 (8124; 8282) 8758 (8670; 8846) 9333 (9227; 9439) 9933 (9816; 10 049)
Ženy 10 509 (10 460; 10 559) 11 159 (11 109; 11 209) 11 676 (11 609; 11 743) 12 344 (12 276; 12 411)
Celková prevalence 18 730 (18 680; 18 781) 19 923 (19 871; 19 974) 21 046 (20 979; 21 113) 22 296 (22 227; 22 365)
Obr. B-3: Prevalence zhoubného melanomu (C43) v letech 1990 – 2007 a predikce pro rok 2008 – 2011 pomocí modelu ARIMA (1,1,0). 24000 Celková prevalence Prevalence muži Prevalence ženy
16000
Bodový odhad 90% predikční interval
12000 8000 4000
Rok diagnózy
10 20
08 20
06 20
04 20
02 20
00 20
98 19
96 19
94 19
92 19
90
0 19
Počet nádorů
20000
Tab. B-4: Prediktivní odhady incidence zhoubného melanomu, poissonovská regrese. 2008 2009 2010 2011
Muži 996 (885; 1106) 1036 (918; 1153) 1077 (951; 1202) 1114 (981; 1248)
Incidence 90 % IS Incidence 90 % IS Incidence 90 % IS Incidence 90 % IS
Ženy 1066 (1014; 1118) 1122 (1067; 1178) 1180 (1120; 1240) 1241 (1176; 1306)
Celková incidence 2060 (1922; 2198) 2156 (2008; 2304) 2253 (2095; 2412) 2351 (2181; 2521)
Počet nově diagnostikovaných nádorů
Obr. B-4: Celková incidence zhoubného melanomu (C43) v letech 1977 – 2007 a predikce pro rok 2008 – 2011 pomocí poissonovské regrese. 2800 Incidence
2400
Bodový odhad
2000
90% predikční interval
1600 1200 800 400
11
09
20
07
20
05
20
03
20
01
20
99
20
97
19
95
19
93
19
91
19
89
19
87
19
85
19
83
19
81
19
79
19
19
19
77
0
Rok diagnózy
Tab. B-5: Prediktivní odhady mortality zhoubného melanomu, poissonovská regrese. Muži 2008 2009 2010 2011
Mortalita 90 % IS Mortalita 90 % IS Mortalita 90 % IS Mortalita 90 % IS
247 (220; 274) 250 (222; 278) 253 (224; 282 ) 256 (226; 286)
Ženy 189 (159; 219) 191 (160; 223) 193 (161; 226) 195 (161; 229)
Celková mortalita 436 (403; 469) 441 (407; 475) 446 (410; 482) 450 (413; 487)
Obr. B-5: Mortalita zhoubného melanomu (C43) v letech 1981 – 2007 a predikce pro rok 2008 – 2011 pomocí poissonovské regrese. Počet úmrtí na zhoubný melanom
600 Celková mortalita
500
Mortalita muži Mortalita ženy
400
Bodový odhad 90% predikční interval
300 200 100
11
09
20
07
20
05
20
03
20
01
20
99
20
97
19
95
19
93
19
91
19
89
19
87
19
85
19
83
19
19
19
81
0
Rok diagnózy
Tab. B-6: Prediktivní odhady prevalence zhoubného melanomu, poissonovská regrese. 2008 2009 2010 2011
Prevalence 90 % IS Prevalence 90 % IS Prevalence 90 % IS Prevalence 90 % IS
Muži 8593 (8381; 8806) 9305 (9072; 9539) 10 058 (9800; 10 317) 10 876 (10 588; 11 164)
Ženy 10 962 (10 706; 11 218) 11 724 (11 446; 12 003) 12 530 (12 225; 12 834) 13 335 (13 001; 13 669)
Celková prevalence 19 533 (19 102; 19 964) 20 997 (20 525; 21 468) 22 541 (22 023; 23 059) 24 152 (23 580; 24 724)
Obr. B-6: Prevalence zhoubného melanomu (C43) v letech 1990 – 2007 a predikce pro rok 2008 – 2011 pomocí poissonovské regrese. 25000 Celková prevalence
20000
Prevalence muži
17500
Prevalence ženy
15000
Bodový odhad
12500
90% predikční interval
10000 7500 5000 2500
Rok diagnózy
10 20
08 20
06 20
04 20
02 20
00 20
98 19
96 19
94 19
92 19
90
0 19
Počet nádorů
22500
Tab.B-7: Prediktivní odhady incidence zhoubného melanomu po stadiích. Stadium I Stadium II Stadium III Stadium IV Skupina bez známého klinického stadia z objektivních důvodů CELKEM
2008 1380 355 136 92 97
2009 1445 372 142 96 101
2010 1510 388 148 101 106
2011 1575 406 155 105 110
2060
2156
2253
2351
1800 Stadium I
1500
Stadium II Stadium III
1200
Stadium IV
900
Bodový odhad
600 300
11
09
20
07
20
05
20
03
20
01
20
99
20
97
Rok diagnózy
19
95
19
93
19
91
19
89
19
87
19
85
19
83
19
81
19
79
19
19
77
0 19
Počet nově diagnostikovaných nádorů
Obr. B-7: Incidence zhoubného melanomu (C43) po stadiích v letech 1977 – 2007 a predikce pro rok 2008 – 2011.