FACULTEIT GENEESKUNDE EN GEZONDHEIDSWETENSCHAPPEN
Academiejaar 2012 - 2013
De waarde van automatische segmentatie in de vroegdiagnose van multiple sclerose
Elke BRUNEEL Koen MAES
Promotor: Prof. Dr. Debruyne Jan Co-promotor: Prof. Dr. Achten Eric
Scriptie voorgedragen in de 2de Master in het kader van de opleiding
MASTER OF MEDICINE IN DE GENEESKUNDE
“De auteur en de promotor geven de toelating dit afstudeerwerk voor consultatie beschikbaar te stellen en delen ervan te kopiëren voor persoonlijk gebruik. Elk ander gebruik valt onder de beperkingen van het auteursrecht, in het bijzonder met betrekking tot de verplichting uitdrukkelijk de bron te vermelden bij het aanhalen van resultaten uit dit afstudeerwerk.”
Datum: 18/04/2013
Elke Bruneel
Prof. Dr. J. Debruyne
Koen Maes
Prof. Dr. E. Achten
Voorwoord In de voorbije twee jaar verliep het thesis-proces niet altijd zoals we hadden gehoopt. We kenden enkele tegenslagen, maar ook wat meevallers. Deze scriptie zou niet geworden zijn wat het is, zonder de hulp van een aantal mensen. Daarom willen we een woord van dank richten aan diegenen die ons van bij het begin gesteund hebben en een bijdrage leverden tot de realisatie van dit onderzoek. Ten eerste zouden we graag onze promotors Prof. Dr. Debruyne en Prof. Dr. Achten willen bedanken voor hun continue ondersteuning en aanmoediging, voor de kritische reflectie en het nalezen van deze thesis. Zonder hun hulp had deze thesis niet kunnen slagen. Speciale dank gaat uit naar Pieter Vandemaele, voor de technische ondersteuning. Annelies de Waegeneer zijn we dankbaar voor de occasionele babbel en steun toen het even moeilijk ging. Verder willen we ook onze medestudenten, vrienden en kennissen bedanken, die ons moed inspraken toen de druk zwaar doorwoog.
Hartelijk bedankt,
Elke en Koen
Inhoudstafel Abstract ..................................................................................................................................... 1 Inleiding ..................................................................................................................................... 2 1. Situering van de thesis ...................................................................................................... 2 2. Over Multiple Sclerose ..................................................................................................... 3 2.1. Klinische manifestaties van MS ................................................................................ 3 2.2. Epidemiologie en etiologie ........................................................................................ 7 2.3. Diagnose .................................................................................................................... 8 2.3.1. Evolutie van de diagnostische criteria voor MS ............................................. 8 2.3.2. Differentiaal diagnose ................................................................................... 13 2.4. Immunologische behandeling .................................................................................. 13 2.4.1. Behandeling van acute exacerbaties ............................................................. 13 2.4.2. Ziektemodifiërende behandeling van MS ..................................................... 14 3. Besproken MRI-acquisities............................................................................................. 17 Materialen en methodes ......................................................................................................... 19 1. Patiëntenselectie.............................................................................................................. 19 2. Verloop van het experiment en evolutie van de doelstellingen ...................................... 21 3. Beoordeling van de performantie en berekening van similariteitsmaatstaven ............... 26 Resultaten ................................................................................................................................ 29 1. Visuele beoordeling ........................................................................................................ 29 2. Kwantitatieve analyse ..................................................................................................... 30 2.1. Reproductie van de optimale kappa ......................................................................... 30 2.2. Kwantitatieve analyse van de performantie ............................................................. 33 2.3. Toepassing van de segmentatiemaps op de diagnostische criteria .......................... 36 2.3.1. Toepassing van de 2005 radiologische criteria ............................................. 37 2.3.2. Toepassing van de 2010 radiologische criteria: ............................................ 39
Discussie .................................................................................................................................. 41 Conclusie ................................................................................................................................. 47 Referentielijst .......................................................................................................................... 49 Bijlages .................................................................................................................................... 52 1. Appendix A: Gebruikte afkortingen ............................................................................... 52 2. Appendix B: EDSS en FSS ............................................................................................. 54 3. Appendix C: 100 aandoeningen in de differentiaal diagnose van MS ........................... 58 4. Appendix D: Tabel besluiten letselscoring ..................................................................... 62 5. Appendix E: Historisch overzicht van MS ..................................................................... 64 6. Appendix F: Histopathologie van MS ............................................................................ 66
Abstract Sinds de opkomst van de immunomodulerende therapie voor MS is het belang van een vroege en accurate diagnose zeer groot geworden. Het stellen van de klinische diagnose van MS vergt soms enige tijd, gezien een evolutie in de tijd (DIT) en betrokkenheid van verschillende delen van het centraal zenuwstelsel (DIS) cruciaal zijn.1,2 Bij mensen die een eerste episode
suggestief voor demyelinisatie doormaakten (CIS) is het een uitdaging om zo snel mogelijk tot de diagnose te komen. Immers verschillende studies toonden aan dat vroege aanvang van de onderhoudstherapie bij vastgestelde MS de progressie van de ziekte gunstig kan beïnvloeden. Ook reeds bij CIS zou een behandeling een gunstig effect hebben, echter dit betekent dat men veel mensen zal behandelen die nooit een MS zullen ontwikkelen.3,4,5,6 Een vroege differentiatie bij CIS zou meer zekerheid bieden rond de therapeutische strategie. Van
de verschillende paraklinische tests die men in het verleden heeft gehanteerd blijkt MRI beeldvorming de meeste bijdrage te kunnen leveren. In de recente McDonaldcriteria van 2010 is MRI zelfs als enige paraklinische test opgenomen.7 Wil men de gevoeligheid van diagnose
opdrijven, dan doet men dit het best door de gevoeligheid van de radiologische diagnose te verhogen. In deze thesis is de rol van automatische segmentatie onderzocht, meer bepaald van het programma LST (Lesion Segmentation Tool). Bij algemene beschouwing en kwantitatieve analyse is gebleken dat de globale letseldetectie weinig efficiënt is (sensitiviteit = 0,49). Bovendien is het verschil in detectiegevoeligheid over de verschillende delen van het CZS bijzonder groot, waarbij de sensitiviteit ligt tussen de 0 en
de 0,68. Voor 148 gedetecteerde letsels waren er slechts 2 vals positieven, dus vermoedelijk is de specificiteit zeer hoog. Ondanks lichte kwaliteitsverschillen in beeldvorming konden geen significante verschillen in performantie worden gevonden binnen de dataset. Vermoedelijk is de detectie afhankelijk van de morfologie, grootte en intensiteit van de letsels. Bij toepassing op de McDonaldcriteria van 2010 vervult LST de DIS-criteria met een sensitiviteit van 0,76. Dit is hoger dan voor de 2005 McDonaldcriteria (0,56). Ter besluit heeft LST een hoge positief predictieve waarde voor aantonen van letsels, maar is de gevoeligheid te laag en te variabel om in de dagelijkse praktijk te worden aangewend. We weerhouden ook een aantal methodologische besluiten om in de toekomst op meer reproduceerbare wijze de performantie van een automatisch segmentatie-algoritme te onderzoeken.
1
Inleiding 1. Situering van de thesis Multiple Sclerose (MS) is de meest voorkomende chronische, niet traumatische ziekte van het centraal zenuwstelsel bij jonge mensen. Voor de individuele patiënt is de impact van de ziekte zeer groot. Gezien de jonge leeftijd van de patiënten is de ziekte ook maatschappelijk van belang.8 De klinische presentatie is reeds meer dan 150 jaar gekend en bij het stellen van de diagnose is de kliniek altijd van groot belang geweest.9 Pas vanaf de jaren negentig zijn de
eerste efficiënte therapieën op de markt gekomen. Vanaf dat moment was een snelle en accurate diagnose belangrijk om de lange termijn outcome te beïnvloeden. Verschillende paraklinische tests zijn bestudeerd om het diagnostisch proces te versnellen, waarvan MRI in de huidige praktijk de grootste invloed heeft. De beeldvorming zal nooit de rol van de clinicus kunnen verdringen, maar de complementariteit van beeldvorming en klinische bevindingen is essentieel bij het stellen van de MS-diagnose. Na meer dan 20 jaar ervaring in MRI-beeldvorming is er nog steeds een revolutie aan nieuwe ontwikkelingen. De zoektocht naar acquisities die de witte- en grijze stofletsels met groter contrast in beeld brengen gaat voort. In de loop van deze thesis diende de scoop bijgesteld te worden, maar de opdracht bleef het zoeken naar meer sensitieve methoden om binnen de huidige criteria de diagnosestelling te kunnen bevorderen. Een andere aanpak die potentieel de gevoeligheid en snelheid van de diagnose kan verhogen is een automatische segmentatie van de wittestofletsels op MRI. Er zijn reeds verschillende dergelijke algoritmen beschikbaar. Wij kozen ervoor de toepasbaarheid van LST (Lesion Segmentation Tool) in de huidige praktijk te bestuderen. Er werd beslist een retrospectieve studie uit te voeren en naar analogie met de dagelijkse praktijk te vertrekken bij patiënten met een Clinically Isolated Syndrome (CIS). Dit is een klinische term die wordt gebruikt wanneer een patiënt zich eenmalig heeft gepresenteerd met symptomen suggestief voor demyelinisatie, maar niet voldoet aan de diagnostische criteria van MS.10 Bij deze groep situeert zich een grote uitdaging voor de klinische neurologie. Er is
nog geen consensus of men reeds onderhoudstherapie voor MS moet starten bij de CISpatiënt, maar er is duidelijk gebleken dat een vroege diagnose en behandeling van MS het klinisch verloop kan afremmen.3,4,5,6
2
2. Over Multiple Sclerose 2.1. Klinische manifestaties van MS Zoals bij de eerste beschrijvingen reeds bleek, vertoont MS een potentieel wijdverspreide aantasting van het centraal zenuwstelsel en als dusdanig een aantasting van hersenen, kleine hersenen, hersenstam en ruggenmerg wiens distributie uniek is voor elk individueel geval.11 Deze eerste basiseigenschap wordt beschreven als Dissemination In Space (DIS).12
Multiple Sclerose is per definitie een intermittente doch progressieve ziekte met een chronisch verloop die voor belangrijke invaliditeit kan zorgen op lange termijn. In het ziekteverloop worden vaak symptoomvrije perioden onderscheiden, afgewisseld met opstoten die kunnen verschillen naargelang de aangetaste locus van het centraal zenuwstelsel. Deze tweede basiseigenschap wordt beschreven als Dissemination In Time (DIT).12 Deze twee basiseigenschappen hebben belangrijke gevolgen met betrekking tot het stellen van de klinische diagnose. Ten eerste zal men bij een eerste consultatie met neurologische klachten niet in staat zijn om de diagnose van MS te stellen bij gebrek aan gekende chronologie (zelfs al is er een multifocale presentatie). Ten tweede zal men bij een tweede episode van een identieke klacht niet in staat zijn de diagnose te stellen bij gebrek aan betrokkenheid van een ander gedeelte van het zenuwstelsel. Om dit probleem het hoofd te bieden heeft men een term ingevoerd om toe te kennen aan een persoon die een eenmalige presentatie vertoont van symptomen suggestief voor inflammatoire demyelinisatie. De term wordt aangeduid als Clinically Isolated Syndrome (CIS).𝟐,𝟏𝟑,𝟏𝟒 Gezien MS overwegend jonge mensen aantast,8 is het niet verwonderlijk dat CIS, als
potentiële voorbode, voorkomt aan een mediane leeftijd van 27 jaar. De klachten ontstaan acuut of subacuut en kennen een snelle piek, binnen 2 à 3 weken. Om van een relaps als eerste verschijnsel van CIS te spreken dient de episode meer dan 24h te duren en er mag geen koorts, infectie of aanwijzing van een encephalopathie bestaan.10 CIS kan heel veel verschillende symptomen omvatten, maar de meest bekende zijn de aantasting van de optische zenuwen, het ruggenmerg en de hersenstam. De cerebrale hemisferen zijn evenzeer aangetast, maar geven zelden de eerste klinische symptomen. Dat in retrospect- ook cognitieve afwijkingen, epileptische insulten, vermoeidheid en paroxysmale symptomen een eerste presentatie van MS kunnen zijn, zorgt ervoor dat men er vaak niet toe
3
komt om een eerste episode daadwerkelijk als CIS te documenteren. Deze doen namelijk niet in de eerste plaats denken aan een demyeliniserende pathologie.10,14 Tabel 1: Meest voorkomende klinisch geïsoleerde syndromen.14 Optische zenuw
Neuritis optica (typisch of atypisch)
Hersenstam en cerebellum
(Internucleaire) ophtalmoplegie Ataxie Nystagmus Diplopie Vertigo Gelaatshypo-esthesie Nucleaire of radiculaire aantasting van craniale zenuwen
Ruggenmerg
Incomplete myelitis transversa Sfincter symptomen Asymmetrische lidmaatzwakte
Cerebrale hemisferen
Hemiparesen Hemiparesthesieën Corticale spraakstoornissen
In bovenstaande tabel (aangepast uit Miller et al.) ziet men de meest voorkomende loci van aantasting bij een CIS. Het dient te worden benadrukt dat vaak niet alle symptomen aanwezig zijn.
Een CIS kan ook multifocaal zijn, hoewel deze presentaties zeldzamer zijn dan de monofocale. Zo kan men een combinatie vinden van een ruggenmerg- en hersenstamaantasting. Een multifocale CIS is niet geïsoleerd in ruimte, maar wel in tijd. Het blijft wachten op een tweede episode om de diagnose van MS te stellen.15 De CIS-episode zal in de meerderheid van de gevallen spontaan regresseren, maar deze personen maken een grotere kans op MS. De progressie van CIS naar MS is vaak moeilijk te voorspellen. In grote reeksen vindt men na 15-20 jaar een evolutie van 30% naar een MS met milder verloop en 50% naar een secundair progressieve MS.14 De meeste conversies worden gezien in de eerste vijf jaar en meer in het bijzonder in de eerste twee jaar na de CIS.13 Tussen
de verschillende CIS worden geen grote verschillen gezien qua conversiekansen.14
De voornaamste factoren die het risico op conversie verhogen zijn (1) MRI-detectie van meerdere letsels die klinisch asymptomatisch blijven en (2) het vinden van oligoclonale banden in het cerebrospinaal vocht. Factoren die uit de epidemiologie naar voor zijn geschoven in het verklaren van MS, zoals EBV-seropositiviteit en vit D deficiëntie, zijn grotendeels analoog bij de patiënten met CIS en CDMS, waardoor deze niet als indicatoren voor progressie kunnen gebruikt worden.14,15 4
In de uitwerking van een CIS-patiënt zal men dus een grondig neurologisch onderzoek verrichten naar overige afwijkingen en MRI-beeldvorming aanvragen. Indien geen andere ziekten kunnen weerhouden worden, zal men CIS goed documenteren en de patiënt met regelmatige tussenposen zowel klinisch als beeldvormend opvolgen. In sommige gevallen kan men een ernstige CIS behandelen, maar in veel gevallen dient men af te wachten om zo mogelijk snel de diagnose van MS volgends de recente criteria te bevestigen en dan een onderhoudsbehandeling te starten. Steeds meer studies tonen de meerwaarde aan van een vroegbehandeling vanaf het CIS stadium.3,4,5,6 De radiologisch bevestigde diagnoses buiten beschouwing gelaten spreekt men van een clinically definite MS (CDMS) wanneer men twee demyeliniserende episodes heeft doorgemaakt die van elkaar onderscheiden zijn in tijd (DIT) en waarbij verschillende delen van het centraal zenuwstelsel werden betrokken (DIS).1,12 Naast grote individuele verschillen in verloop zijn er voor MS een aantal grote klinische subgroepen te identificeren: RRMS of relapsing-remitting MS is veruit het meest voorkomende verloop van multiple sclerose. Ongeveer 85 % van de patiënten zullen bij aanvang dergelijk verloop vertonen. RRMS wordt gekenmerkt door acute exacerbaties van klachten en symptomen gevolgd door een compleet dan wel partieel herstel.13,16 De exacerbaties zijn uitingen van focale
inflammatoire letsels en bij het nemen van een MRI wordt vaak een nieuw gadoliniumkleurend letsel aangetroffen. In de opvolging van een patiënt met RRMS heeft men een aantal ‘typicalities’ gedefinieerd die in de diagnostische criteria werden opgenomen. Deze definities moeten clinici toelaten om het typisch karakter van een klinische uitval met ‘inflammatoir karakter’ te herkennen en uniform een ‘demyeliniserend’ ziekteverloop te rapporteren bijvoorbeeld in het kader van klinische trials. Volgens Schumacher zijn er 4 toestanden te onderscheiden.1 Een “relaps” is het nieuw optreden of verergeren van een symptoom of een cluster van symptomen. Deze periode dient minstens 24h te duren en zal stoppen wanneer de symptoomernst een maximum heeft bereikt. Een “plateau” is een status van maximale dysfunctie met constante ernst.
5
Een “remissie” is een status waarin een verbetering van de toestand wordt waargenomen. Dit houdt aan tot er geen verbetering meer optreedt. Een “stationaire” fase is de periode tussen een remissie en de volgende relaps. Vaak wordt geopperd dat een stationaire fase minstens een maand moet duren, anders wordt de verbetering van de functie als onderdeel van een langer durende episode aanzien. Met andere woorden twee opstoten moeten minstens een maand uiteen liggen. SPMS of secondary progressive MS wordt gezien als een evolutieve toestand die volgt uit een jarenlang bestaande RRMS. Hierbij is er geen sprake meer van echte opstoten en ook het herstel is zeer beperkt tot onbestaande. De patiënten vertonen vaak een hoge graad van invaliditeit. In de periode voor de behandeling zag men een evolutie van RRMS naar SPMS in 50 tot 60% met een progressiesnelheid van ongeveer 2-3% per jaar. Deze progressie is het gevolg van een accumulatie van axonale en demyeliniserende schade. Een adequate behandeling zou de onset van SPMS kunnen uitstellen.16 PPMS of primary progressive MS is een verloop waarbij men van in het begin geen echte opstoten en remissies kan onderscheiden. Ongeveer 10% van de patiënten vertoont deze evolutie. PPMS en SPMS vertonen veel gelijkenissen op gebied van pathologie en beeldvorming. Op MRI worden meestal geen Gd-aankleurende letsels gezien, maar eerder een diffuse wittestofaantasting, atrofie en demyelinisatie. Een PPMS begint meestal op hogere leeftijd (gemiddeld 10 jaar later dan RRMS) maar komt eigenaardig genoeg wel overeen met de gemiddelde leeftijd voor conversie van RRMS naar SPMS.16 Het klinisch beeld is belangrijk voor het stellen van de diagnose en voor de opvolging van therapeutische effecten, maar ook voor het voorspellen van de prognose is een goede opvolging noodzakelijk. De individuele prognose is moeilijk te stellen gezien het sterk wisselend verloop van de ziekte qua frequentie, aard van de relapsen, graad van remissies en respons op de therapie. Deze parameters zijn verschillend voor elke individuele patiënt. Bovendien is er nog steeds geen biomerker die de outcome kan voorspellen.17 De EDSS schaal of Expanded Disability Status Scale is een klinische score voor het meten van de cognitieve en fysische invaliditeit bij MS. Deze schaal wordt samengesteld uit de verschillende systemen, de zogenaamde functionele systemen (FS). Ze omvat het volledig neurologisch functioneren. De auteur JF Kurtzke, gebruikte deze schaal voor het eerst bij oorlogsveteranen met MS. Later en sindsdien wordt zij toegepast in alle klinische MS trials. 6
De heterogeniteit van de symptomen en de veranderingen in presentatie over de tijd maakten het moeilijk om de klinische toestand van patiënten onderling te vergelijken. De EDSS schaal wordt, niettegenstaande gekende onvolmaaktheden, als standaard toegepast. De EDSS scoort de invaliditeit van 0 tot 10, waarbij 0 een normale toestand en 10 dood door MS betekent.18 Kurtze’s functionele systemen omstrijken het neurologisch onderzoek in al zijn facetten en worden verdeeld in exclusieve klinische categorieën. Ze omvatten alle aangetaste zones bij MS, namelijk P (pyramidaal), S (sensorisch), H (hersenstam), DB (darm en blaas), Cll (cerebellair), Cb (cerebraal), V (visueel) en O (andere). Men scoort de systemen apart waarbij P, S, V en DB een range hebben van 0 tot 6; Cll, Cb en H hebben een range van 0 tot 5. De score loopt op volgens de graad van aantasting. Wanneer daarbuiten nog andere niet specifiek MS gelieerde, neurologische bevindingen aanwezig zijn (categorie O), zoals epilepsie, wordt dit gescoord met 1. Scores van de functionele systemen worden niet opgeteld omdat dit een verkeerd beeld kan geven. De verschillende schalen hebben immers een verschillende ernstmaat, een patiënt kan verbeteren in het ene en verslechteren in het andere gebied. Een algemene kritiek op de EDSS is dat de mobiliteit te veel op de voorgrond staat en te weinig aandacht wordt geschonken aan de cognitieve score. Dit heeft geleid tot de misvatting dat EDSS een schaal van mobiliteit is, het is uiteraard veel meer dan dat. Voor een overzicht van de EDSS en de FSS scoresystemen: zie appendix B. Een patiënt evolueert niet lineair over de EDSS schaal, maar kan soms heel lang op een niveau blijven om vervolgens een plotse evolutie door te maken. In de lagere range is de EDSS-score vaak gecorreleerd aan een verloop in opstoten; in de hogere range zien we doorgaans minder herstel en wordt meer progressieve verhoging gezien. 2.2. Epidemiologie en etiologie Uit de wereldwijde epidemiologie blijkt dat de prevalentie van MS sterk samenhangt met de breedtegraad, waarbij de prevalentie daalt naar de evenaar toe. Dit geldt zowel voor noordelijk als zuidelijk halfrond. In België kennen we een prevalentie van 1/1000, wat neerkomt op zo’n 10 000 Belgen.19 Men vermoedt dat veel meer personen MS-symptomen vertonen, maar in dergelijk milde vorm dat zij geen arts raadplegen en de diagnose dus
uitblijft. De incidentie van de ziekte bereikt een piek tussen 25 en 35 jaar, desalniettemin kan de ziekte op elke leeftijd beginnen. Er is een ongelijke geslachtsverdeling, met een vrouw/man ratio van 3/1.
7
Multiple sclerose ontstaat uit een complexe interactie van genetische en omgevingsfactoren. Er zijn verschillende allelen en genen die van belang zouden kunnen zijn. Studies suggereren betrokkenheid van de HLA-locus op chromosoom 6. Voor HLA-DR1 werd tot nu toe het meest evidentie gevonden.20,21 Als mogelijke contribuerende omgevingsfactoren schuiven
epidemiologische studies vooral klimaat en zonlicht naar voor, waarbij een hoog vitamine-D gehalte een beschermende rol zou hebben in het ontstaan van MS.22 Ook blootstelling aan
verschillende pathogenen op jonge leeftijd zou een bescherming vormen tegen MS. Van deze
pathogenen is het verband met Ebstein-Bar virus (EBV) het best beschreven. Seronegatieve personen hebben een kleinere kans op MS. Ook verschillende andere virussen werden bestudeerd, maar er zijn tot nu toe geen studies die een verband kunnen bevestigen.23
Zwangerschap verlaagt de ziekteactiviteit, voornamelijk in het derde trimester. Het risico in het puerperium is dan weer verhoogd.24 Ten slotte is het van belang dat rokers een grotere
kans hebben op MS dan niet-rokers en dat roken de symptomen van MS verergert.22 Ook
obesitas zou een ongunstige rol spelen in de evolutie van MS. 2.3. Diagnose
2.3.1. Evolutie van de diagnostische criteria voor MS MS is per definitie een aandoening die verschillende delen van het zenuwstelsel kan aantasten en als ziekte aanleiding kan geven tot een veelheid aan symptomen. Net als de symptomen kan het verloop tussen twee patiënten zeer sterk uiteenlopen. De meeste patiënten presenteren op jonge leeftijd, maar op geen enkele leeftijd is de diagnose van MS onmogelijk. Deze feiten zorgen ervoor dat men de diagnose met voorzorg moet stellen. Geen enkel neurologisch verschijnsel is pathognomonisch voor MS. De enige methode om op klinische wijze de diagnose te stellen is het beeld te toetsen aan eigenschappen die inherent zijn aan de aandoening.12 - De ziekte is per definitie van lange duur en het beeld spreidt zich over een langere tijd met mogelijke episodes van verergering. Dit werd gedefinieerd als disseminatie in tijd (DIT). - De ziekte is verspreid over het zenuwstelsel en dient zich te vertalen in symptomen die topografische spreiding aantonen. Dit werd gedefinieerd als disseminatie in ruimte (DIS). De eerste publicaties van MS zijn louter beschrijvend.11,25 In de eerste helft van de 20e eeuw begint men in deze omschrijvingen duidelijke lijnen te zien. Het is in 1954 dat de eerste diagnostische criteria verschijnen, gepubliceerd door Allison en Millar. Op basis van categorische variabelen worden de patiënten ingedeeld in “early”, “possible” en “probable 8
disseminated sclerosis” (de oude britse term voor MS). De “early” categorie had een zelfgerapporteerde geschiedenis van klachten die vaker bij MS patiënten werden gezien. In veel van de latere diagnostische criteria zou men zelfrapportage niet meer als waardevol aanvaarden. De “probable” categorie moest reeds een graad van invaliditeit vertonen en klinische tekenen suggestief voor MS. De “possible” categorie was zeer vaag omschreven als een vaststaande disseminatie in tijd, maar met slechts een vermoeden van topografische spreiding.12 In 1965 publiceerde Broman et al. een aantal kenmerken van MS die in de latere schemata zouden gebruikt worden. Onder andere werd het tweelingprincipe DIS en DIT gedefinieerd en werd er een duidelijke lijst opgesteld van mogelijke differentiaaldiagnoses. Het was ook de eerste publicatie die oligoclonale banden in CSF aanhaalde als mogelijke paraklinische test.12 . Ook in de jaren zestig werden de Schumachercriteria geformuleerd. Deze maken nog uitsluitend gebruik van klinische kenmerken. In plaats van te spreken van “clinically definite” MS spreken zij van “highly probable” MS. Zij benadrukken daarbij dat er helemaal geen specifieke tests bestaan en dat men zelfs in de highly probable groep zeer waakzaam moet blijven voor verschijnselen die wijzen op een andere diagnose. Zelfrapportage, hoe zorgvuldig ook geregistreerd, wordt niet aanvaard als klinisch argument. In dit artikel hanteert men een eerste definitie van een relaps en remissie teneinde een objectieve beschrijving van de evolutie te kunnen geven. Het is lange tijd de referentie geweest voor de diagnose.1,12 McAlpine et al. maakten bij hun categorisering gebruik van “probable”, “latent probable” en “possible” MS waarbij ze doelbewust niet de term “definite” MS hanteren. In deze criteria aanvaarde men wel zogenaamde “tekenen van MS in de voorgeschiedenis”; een moeilijk hanteerbaar criterium. Tevens werden oligoclonale banden vernoemd als test voor MS. De McAlpine-criteria werden als alternatief beschouwd van de Schumachercriteria.12 In de jaren zeventig geven McDonald en Halliday aan dat de enige manier om ontegensprekelijk MS vast te stellen een autopsie of een biopsie is. Hoewel routinematig geen gebruik gemaakt wordt van een biopsie staat deze bewering tot op vandaag nog steeds.12 De zoektocht naar andere indicatieve tests, die de diagnosestelling kunnen versnellen en betrouwbaarder maken, blijft. Drie procedures die kandidaat zijn voor de aanvulling zijn laboratoire testen, beeldvorming en neurofysiologische investigaties. Het is in de Posercriteria van 1983 dat men voor het eerst een laboratoire test incorporeert in de diagnostische 9
criteria. Concreet wordt een elektroforese uitgevoerd van de eiwitfractie van CSF, waarbij een oligoclonale banding van het IgG-gebied suggestief is voor MS op voorwaarde dat deze banding niet kan worden gereproduceerd bij serumelektroforese. Ook een globale verhoging van het intrathecaal IgG-gehalte kan, alhoewel minder specifiek, indicatief zijn voor MS.12. Andere paraklinische tests zoals de geëvokeerde potentialen en beeldvorming werden steeds meer beschikbaar om argumenten toe te voegen aan de klinische bevindingen. De evoked responses tonen vertraging van de geleiding over de verschillende zenuwbanen. De meest gebruikte is de visual evoked respons (VEP), echter met beperkte bijdrage tot de diagnose.7,26 Hoewel voor de beeldvorming aanvankelijk CT werd gebruikt zou vanaf 1981 magnetische resonantie beeldvorming zeer snel in belang groeien.27,28 Dit terwijl verschillende auteurs
vreesden dat de toegenomen sensitiviteit afbreuk zou doen aan de specificiteit, en dat MRI bij
de differentiaaldiagnose weinig bruikbaar zou zijn wegens aspecificiteit door pathogene heterogeniteit van de letsels. Poser voorspelde dat dit tot veel vals positieve diagnostiek zou leiden. Het is de veelbeschreven radioklinische paradox.29,30 De term “paraklinische evidentie” wordt geïntroduceerd, waarbij men doelt op argumenten die geleverd worden door lumbaalpunctie, beeldvorming of geëvokeerde potentialen. Zo wenst men in de terminologie aan te geven of de diagnose klinisch dan wel paraklinisch werd ondersteund. Op het gebied van definiëring is er evenwel veel veranderd. Gesterkt door bijkomende testen neemt men de term “definite” MS terug op en een tweede mogelijkheid is “probable” wanneer niet aan alle criteria (DIT en DIS) wordt voldaan. De term “possible” laat men hier vallen. Een diagnose die wordt ondersteund door positieve CSF banden wordt als “laboratory supported” probable of definite MS aangegeven.12 Voordat MRI officieel in overkoepelende diagnostische richtlijnen werden opgenomen, hadden reeds veel radiologische studies hun eigen criteria geformuleerd. Zo is er Fazekas die in ‘88 minstens drie letsels vraagt. Volgens hem moeten de letsels meer dan 6 mm in doormeter zijn en periventriculair of infratentorieel gelegen.31 Later is er Paty die vier letsels
of meer vooropstelt ofwel drie waarvan minstens 1 periventriculair. Deze criteria zijn op retrospectieve wijze ontwikkeld, met patiënten die na opname in de studie reeds klinisch bevestigde MS hebben.32 In 2001 was er een panel onder leiding van McDonald die de klinische diagnose herzag en voor het eerst MRI criteria integreerde in het schema. Men benadrukt de complementariteit 10
van de kliniek en beeldvorming. Geen enkele test kan de diagnose stellen in afwezigheid van klinische bevindingen. Men bevestigt de principes van disseminatie in ruimte en tijd, waarop de klinische diagnose, maar ook de beeldvormende criteria nog steeds zijn gebaseerd.2 McDonald maakt het onderscheid tussen “MS”, “no MS” bij alternatieve diagnose of “possible MS” als tussenstadium bij onvoldoende argumenten. De waarde van MRI, VEP en CSF-testen zijn sterk afhankelijk van de situatie. MRI krijgt in de criteria een grote waarde toebedeeld. De gehanteerde MRI-criteria werden opgesteld door Barkhof en Tintoré.32,33 Men
vereist voor het aantonen van DIS ten minste drie van de vier volgende: (1) 1 Gd-enhancing letsel of 9 T2-hyperintense letsels, (2) een infratentorieel letsel, (3) een juxtacorticaal letsel en 4) drie periventriculaire letsels. De letsels moeten groter zijn dan 3 mm. Indien men een positieve CSF bevinding heeft, hanteert men mildere criteria voor het vaststellen van DIS (slechts 2 MRI-letsels nodig). DIT kan worden aangetoond indien men op een follow-up scan minstens 1 bijgekomen Gd-enhancing letsel opmerkt. Voor de follow-up scan raadt men aan minstens 3 maand te wachten. Zo men geen contrastcapterende letsels aantreft dient men een nieuwe MR-scan uit te voeren. Op deze scan volstaat een contrastcapterend of een T2 letsel dat niet eerder werd geobserveerd om spreiding in de tijd aan te tonen. De timing van deze follow-up scan is minder belangrijk, maar er wordt weer aangeraden om 3 maand te wachten. In de jaren volgend op de McDonald ‘01 wordt steeds duidelijker dat er ruggenmergletsels ontstaan op onafhankelijke wijze en dat deze ook kunnen bijdragen tot de diagnose. In de McDonald criteria stelt men dat één hersenletsel van in de criteria van Barkhof mag worden vervangen door een ruggenmergletsel. Het panel van 2005 zou dit in retrospect verwarrend en weinig onderbouwd noemen. Een ander punt voor discussie in de McDonald criteria is het principe “no better explanation”. Dit betekent dat de diagnose pas mag worden besloten zo men in de kliniek geen ziekte kan vinden die beter bij de symptomen past. Auteurs als Charil beamen het belang van de differentiaal diagnose, maar waarschuwen evenwel voor een gebrek aan systematisering in deze differentiaaldiagnose. Zij hebben een aantal radiologische “red flags” geformuleerd die indicatief zijn voor een andere diagnose. De red flags worden tot nog toe niet systematisch in de diagnostische criteria opgenomen.34 Uiteindelijk was het McDonald die voor het eerst gebruik maakte van de MRI in de nieuw ontwikkelde diagnostische criteria voor MS. De McDonaldcriteria worden snel wereldwijd opgenomen en toegepast. Retrospectieve studies tonen een sensitiviteit en specificiteit die de vroegere criteria overtreft. In 2005 zou een panel in Amsterdam onder leiding van Polman 11
revisies aanbrengen aan de DIS en DIT criteria. Men richt zich op het herzien van de MRIcriteria en de criteria voor PPMS. Tevens zou men aanhalen dat er verdere studie nodig is naar de performantie van de criteria in een populatie die verschilt van de typische Westerse populatie.35 De DIT criteria worden aangepast vanuit het besef dat het interval van 3 maanden voor een follow-up scan de meest snelheidsbeperkende factor is voor het stellen van de diagnose. Naar analogie met de kliniek waarin men twee opstoten als gescheiden ziet na een tussenperiode van 1 maand, raadt men ook hier aan om reeds een follow-up scan te doen na 1 maand en vanaf dit punt een nieuw letsel (T2W of T1Gd) beschouwen als nieuwe activiteit en equivalent aan een nieuwe, zij het subklinische opstoot.35,36 Voor wat betreft de DIS-criteria zal het 2005 panel een duidelijker standpunt innemen rond de ruggenmergletsels. Voortaan wordt een T2 ruggenmergletsel equivalent gezien aan een infratentorieel
letsel,
en
een
contrastcapterend
medullair
letsel
equivalent
aan
contrastcapterende hersenletsels.7 Wat betreft de radiologische definitie van DIS, zijn de Barkhof-criteria behoorlijk strikt. De Europese Research Groep MAGNIMS 2008 pleit voor een vereenvoudiging van de criteria. Volgens hen zou dit weinig afbreuk doen aan de specificiteit van de diagnostiek.37 In 2010 komt het panel voor een 3e maal samen in Dublin en worden de huidige criteria opgesteld. Daarin wordt het belang benadrukt van het klinisch luik van de diagnose. Namelijk minstens 2 klinische aanvallen verspreid in tijd en ruimte. Men uit de waarschuwing dat de criteria het meest betrouwbaar zijn bij mensen met een typische CIS presentatie (zoals aangegeven in de 2001 criteria 2) en bij de caucasische populatie. Het ingenomen standpunt
rond zelfrapportage van klachten suggestief voor demyelinisatie is enigszins veranderd. Men ziet een zeer typisch patiëntenverhaal nu wel als een valabel argument.7 De nieuwe radiologische criteria moeten de sensitiviteit van de diagnose verhogen zonder afbreuk te doen aan de specificiteit. Zowel op het vlak van DIS als DIT zijn er grote veranderingen. DIS wordt vastgesteld wanneer men minstens 1 letsel aantreft in 2 van de 4
specifieke regio’s van MS: juxtacorticaal (JC), periventriculair (PV), infratentorieel (IT) en spinaal (S). In de DIT-criteria wordt het 30 dagen interval voor de follow-upscan verlaten. Een nieuw aangetoond letsel op eender welk tijdtip na de initiële MRI volstaat om de diagnose te 12
bevestigen. Een belangrijke bijdrage van de 2010 McDonald criteria, is dat een simultane aanwezigheid van een T1Gd en een T2 letsel op 1 MRI voldoende is om een definitieve diagnose te stellen. Bij veel patiënten valt daardoor het tussenstadium van CIS-patiënt weg.37 Omdat men de MRI-criteria in deze mate heeft vereenvoudigd is het onduidelijk welke bijdrage de CSF-bevindingen nog kunnen bieden. In de vorige richtlijnen betekende een positieve CSF-test een versoepeling van de MRI-criteria. Het panel van 2010 drukt uit dat de nieuwe criteria danig vereenvoudigd zijn dat verdere versoepeling de sensitiviteit zou aantasten.7 2.3.2. Differentiaal diagnose De differentiaal diagnose van MS is zeer breed en omvat onder andere infectieuze, inflammatoire, vasculair-reumatische, metabole, structurele, genetische en psychiatrische aandoeningen. De meeste zijn relatief eenvoudig te differentiëren, andere zijn zeer zeldzaam, maar het onderscheid met andere demyeliniserende aandoeningen zoals neuromyelitis optica en acute gedissemineerde encefalomyelitis kan moeilijk zijn.38 In appendix C kunt u een lijst vinden van 100 aandoeningen die ooit in de differentiaaldiagnose van MS zijn uitgewerkt, de zogenaamde MS-mimics. 2.4. Immunologische behandeling 2.4.1. Behandeling van acute exacerbaties De behandeling van een acute opstoot is enkel noodzakelijk wanneer de symptomen een belangrijke invaliditeit veroorzaken. Corticosteroïden in pulse worden gebruikt bij een MSrelapse of CIS-aanval, ze hebben geen plaats bij de behandeling van SPMS, noch bij PPMS. Er bestaat geen universeel consensusprotocol over de dosis en wijze van toediening van steroïden.39 Algemeen wordt intraveneus methylprednisolone 1g/d gedurende 3 of 5 dagen
beschouwd als voorkeursbehandeling. Er is evenwel geen consensus in de literatuur wat de
dosering betreft. Al dan niet kleinere dosissen hangen af van de ernst van het klinisch beeld.40
Een studie van Barnes et al. toonde aan dat er geen verschil in doeltreffendheid bestaat tussen oraal of intraveneus toegediende steroïden. Orale behandeling is bijgevolg mogelijk in poliklinische context.41 Steroïden bespoedigen het herstel bij een opstoot, maar lijken geen invloed te hebben op het ziektebeloop op lange termijn. Ook het al dan niet bevorderen van klinisch herstel, en de invloed op frequentie van verdere opstoten of progressie naar permanente invaliditeit is 13
onvoldoende aangetoond.38,42 Mogelijke bijwerkingen zijn toename van de eetlust, hyperglycemie,
myopathieën,
erytheem,
hartkloppingen,
ongedurigheid,
psychoses,
stemmingsschommelingen en aseptische heupkopnecrose.43 2.4.2. Ziektemodifiërende behandeling van MS Er is nog geen causale therapie voor MS, maar sinds midden de jaren 90 zijn er wel middelen beschikbaar die het ziekteproces afremmen. Deze worden disease-modifying drugs (DMD) genoemd. Het doel van deze medicatie is dat de patiënt vrij wordt van ziekteactiviteit. Dit houdt in dat men klinisch een onderdrukking van het aantal relapses en vertraging van ziekteprogressie beoogt en radiologisch een toename van aantal en volume van MRI-letsels vermijdt.39 Men spreekt van een suboptimale respons bij voortschrijdende MRI-activiteit of
wanneer de relapse rate onveranderd blijft na 6 maand tot 1 jaar behandeling. Mogelijke
secundaire oorzaken van non response zijn noncompliance of de ontwikkeling van neutraliserende AL bij IFN-β.42 Alle beschikbare middelen hebben bewezen effect bij RRMS
en CIS, maar een hoogstens marginaal tot geen effect bij SPMS en PPMS.
Er dient te worden opgemerkt dat niet iedere CIS-patiënt uiteindelijk MS zal ontwikkelen, ook de kost en bijwerkingen van de behandeling zijn een punt voor discussie. Verschillende klinische trials hebben aangetoond dat vroegbehandeling bij patiënten in het CIS-stadium van MS de ziekteactiviteit doet verminderen, en daardoor de conversie naar definitieve MS vertraagt.3,4,5,6,44 In acht nemend dat een MS-verloop niet voorspelbaar is, dient men de vooren nadelen van behandeling ten aanzien van afwachtende houding af te wegen.
Momenteel zijn er vier immunomodulerende medicaties erkend als eerstelijnsbehandeling bij MS: interferon-beta-1a (IFN-β-1a, Avonex® en Rebif®), interferon-beta-1b (IFNβ-1b, Betaferon®) en Glatirameeracetaat (GA, Copaxone ®). Meerdere studies hebben het effect van IFN-β aangetoond met als resultaat een vermindering van het aantal opstoten met ongeveer 30% en een daling van het aantal actieve MRI-laesies. Deze studies hebben bewezen dat IFN-β de progressie van RRMS naar SPMS vertragen.3,4
Initieel werd aangenomen dat GA ondergeschikt was aan IFN-β op vlak van verandering van relaps frequentie en lange termijn resultaten. Recente head-to-head trials hebben geen significante verschillen kunnen aantonen tussen GA en IFN-β op vlak van aantal opstoten en ziekteprogressie.45,46. IFN-β kan subcutaan of intramusculair toegediend worden en heeft als
belangrijkste bijwerkingen een grippaal syndroom, huidirritatie, abcesvorming en stijging van
de levertransaminasen. Indien patiënten langere tijd behandeld worden met IFN-β kunnen 14
mogelijks neutraliserende antilichamen gevormd worden.43 Het is onzeker in hoeverre deze
de werking van IFN-β onderdrukken. GA wordt subcutaan toegediend, waarbij huidirritatie op de plaats van injectie de voornaamste bijwerking is, in zeldzame gevallen vertonen patiënten allergische reacties.43 In de praktijk wordt GA hoofdzakelijk gebruikt bij patiënten
die lijden onder de bijwerkingen van IFN-β of die neutraliserende AL gevormd hebben.
Patiënten moeten aan bepaalde voorwaarden voldoen om tweedelijnsmedicatie te mogen opstarten. Te allen tijde moet MS vastgesteld zijn volgens de 2010 McDonaldcriteria. Verder zijn er 2 bijkomende categoriën. Een eerste groep zijn de non-responders op IFN-β. Dit wil zeggen dat ze nieuwe opstoten vertonen in het verloop van minstens 1 jaar IFN-β therapie. Patiënten die onder behandeling met GA exacerbaties doormaken, komen niet in aanmerking voor tweedelijnsbehandeling. Deze bepaling is niet wetenschappelijk onderbouwd en wordt door MS-experten sterk bekritiseerd. Een tweede groep zijn de patiënten die, al dan niet onder behandeling, minstens 2 invaliderende opstoten doormaakten tijdens het voorbije jaar. Deze patiënten moeten daarenboven 9 T2W letsels en 1Gd letsel op MRI vertonen, ofwel een significante toename van de T2-laesies vergeleken met de MRI van het jaar ervoor. We kunnen dus samenvatten dat tweedelijnsbehandeling geïndiceerd is bij RRMS patiënten met onvoldoende respons op IFN-β of bij de hoog actieve MS-patiënt.47 Welke de meest actieve
behandeling is in tweede lijn, is onduidelijk gezien geen head-to-head studies werden uitgevoerd. Momenteel zijn er 2 tweedelijnsbehandelingen op de markt. Natalizumab (Tysabri ®) is een gehumaniseerd monoklonaal antilichaam dat de migratie van leukocyten in het CZS verhindert via α4-integrine antagonisme. Het wordt intraveneus toegediend om de 4 weken. In de AFFIRM-studie, een dubbelblinde, placebogecontroleerde studie, bleven 37% van de patiënten behandeld met natalizumab compleet vrij van ziekteactiviteit. In deze studie daalde het aantal opstoten en aantal nieuwe laesies respectievelijk met 68 en 83% in vergelijking met de placebogroep. De relapse rate was na 2 jaar 0.23 in de natalizumabgroep, vergeleken met 0.73 in de placebogroep.48 In een tweede studie bleef 82% van de patiënten vrij van opstoten
in een periode v 44 weken. Een iets kleinere groep, namelijk 71%, bleef radiologisch
ziektevrij. In deze studie bleef 62% compleet vrij van ziekteactiviteit. De gemiddelde relapse rate daalde van 1.87±0.73 bij aanvang naar 0.29±0.69 aan het eind van de studie. Zo’n 29% haalde lagere EDSS-score na 44 weken, hoewel men hierbij moet vermelden dat deze patiënten gemiddeld een hogere relapse rate hadden in vergelijking met de patiënten die geen
15
betere score haalden en 92% van deze patiënten in het voorbije jaar een opstoot meemaakten die hun EDSS-score had verhoogd.49
Het gebruik van natalizumab wordt voornamelijk geremd door het risico op progressieve multifocale leuko-encefalopathie (PML), een herseninfectie veroorzaakt door het JC-virus. Er bestaat een uiterst sensitieve 2 stappen ELISA techniek om het virus op te sporen. Patiënten die positief testen op AL hebben een grotere kans om PML te ontwikkelen in vergelijking met patiënten die negatief testen. Vóór men start met natalizumab, is het dus belangrijk om deze titers te bepalen. Fingolimod (Gilenya®) is de eerste per orale behandeling voor RRMS.50 Het is een
antagonist van de sfingosine-1-fosfaat–receptor, waardoor lymfocyten de secundaire lymfoïde
weefsels niet kunnen verlaten. Gezien het lipofiele karakter van de molecule kan het de Blood-Brain Barrier (BBB) passeren. Dit vermindert het aantal auto-agressieve lymfocyten die het CZS binnendringen. Gezien het werkingsmechanisme kan men een reversiebele lymfopenie verwachten tijdens behandeling. Mogelijks heeft fingolimod ook neuroprotectieve of reparatieve effecten.51,52
Een twee jaar durende, dubbelblinde, placebogecontroleerde studie onderzocht het effect van fingolimod op relapse rate, ziekteprogressie en MRI-activiteit bij patiënten met RRMS. In de fingolimod groep bleef ongeveer 70-75% opstoot vrij gedurende 2 jaar, in vergelijking met 46% in de placebo groep. Dit komt neer op een relapse rate van respectievelijk 0.16-0.18 en 0.40. Men stelde ook een significante daling in ziekteprogressie vast onder fingolimodbehandeling vergeleken met placebo. Deze klinische bevindingen worden bevestigd door de MRI-resultaten.50 Een andere studie heeft de effectiviteit van fingolimod vergeleken met IFN-β-1a. Fingolimod bleek superieur te zijn aan IFN-β op vlak van relapse rate en MRI-
bevindingen, met relapse rates van 0.16-0.20 en 0.33 respectievelijk. Er werden evenwel geen significante verschillen gezien tussen de groepen wat betreft ziekteprogressie.53
Mogelijke bijwerkingen zijn macula-oedeem, leverfunctiestoornissen, varicella-zoster infecties, een lichte stijging van de bloeddruk, transiënte bradycardie en atrio-ventriculair blok.43 Gezien deze bijwerkingen is het aangewezen patiënten cardiologisch te evalueren
alvorens behandeling fingolimod op te starten.
Er zijn heel wat behandelingen in ontwikkeling die zich momenteel in fase 2 of 3 trials bevinden. De belangrijkste zijn de monoclonale AL ocrelizumab 54 , alemtuzumab 55,56, 16
rituximab, en de per orale middelen: siponimod, teriflunomide 57 en laquinimod. Ondertussen
zijn Teriflunomide (Aubagio®) en BG12 dimethyl fumaraat (Tecfidera®) door het FDA als
eerstelijnsbehandeling aanvaard, wat het behandelingslandschap in de nabije toekomst sterk zal wijzigen. 3. Besproken MRI-acquisities Voor de detectie van MS-letsels wordt in de praktijk vaak een combinatie van T1 en T2 acquisities gebruikt. De T1 is vaak gecombineerd met Gadolinium contrast voor detectie van de letsels met actieve inflammatie en doorbraak van de bloedhersenbarrière. De niet contrastcapterende letsels zijn op T1 eerder hypo-intens. Voor deze niet capterende letsels zijn T2 acquisities veel gevoeliger gezien een oedemateus weefsel een hogere signaalintensiteit geeft. Binnen de T1 en T2-categorieën zijn er tal van varianten mogelijk. In dit stuk beschrijven we de gebruikte acquisities. Er wordt kort ingegaan op de eigenschappen van de DIR-sequentie, daar dit oorspronkelijk de focus van de studie was. FLAIR is een T2-gewogen acquisitie en staat voor Fluid-Attenuated Inversion Recovery. “Inversion recovery (IR)” is een vorm van magnetisatie preparatie waarbij men een inversie (180°) puls laat voorafgaan aan de standaard sequentie van de beeldvorming. Men stuurt eerst een 180° radiofrequente (RF) puls om de longitudinale magnetisatie te inverteren. Deze keert terug naar de oorspronkelijke positie, waarbij het nulpunt wordt gepasseerd. De snelheid waarmee dit gebeurt is afhankelijk van de T1 relaxatietijd van het weefsel. Een tweede 90° RF puls wordt gestuurd om een transverse magnetisatie te bekomen en het MRI signaal zichtbaar te maken. Een bepalende factor van de IR is de tijd die men wacht tussen de 90° en de 180° puls (Inversion Time:TI). Wanneer deze zorgvuldig gekozen wordt in relatie tot de T1 relaxatieconstante van een weefsel als CSF (water) of witte stof (vet), kan men het signaal van deze weefsels onderdrukken. De IR kan toegepast worden op T1 of T2 acquisities. In de FLAIR acquisitie wordt het signaal van CSF onderdrukt (dat een lange TI heeft), wat het contrast met nabijgelegen oedemateuze letsels hoger maakt. FLAIR is bijgevolg gevoeliger dan andere T2 opnames voor het detecteren van voornamelijk periventriculair gelegen letsels.58 Bepaalde letsels met slechts een matig hoog signaal op T2 zouden echter een slechte detecteerbaarheid geven op FLAIR. Dit werd door Turetschek et al.58 toegeschreven aan het feit dat bij deze letsels zowel de T1 tijd als de T2 tijd verlengd is en dat een T1 verlenging
voor een antagonistisch effect kan zorgen wanneer de T2 verlenging op zich weinig 17
uitgesproken is. De hoge T1 (signaal daling op FLAIR) zorgt dus voor een maskering van een matig intens T2 letsel (signaal stijging op FLAIR). Door nu een tweede inversion recovery sequentie aan de FLAIR toe te voegen zou men een tweede soort weefsel onderdrukken met een kortere T1 dan het eerder onderdrukte water. Het signaal van een letsel met een verhoogde T1 en T2 is dus hoog, gezien een synergisme wordt gecreëerd tussen lange T1 en T2 constantes. Op deze “Double Inversion Recovery (DIR)” beelden is het signaal van zowel het CSF als witte stof onderdrukt. Het DIR beeld is bijgevolg anatomisch moeilijker te interpreteren met slechte begrenzing tussen subcorticale en corticale massa. Doch de detectiegevoeligheid van de DIR opname is hoog, met in verschillende studies een hoger globaal aantal letsels. De hoogste gevoeligheid is voor infratentoriële en periventriculaire letsels, op juxtacorticaal niveau wordt iets aan gevoeligheid ingeboet.58,59 De laatste studies rond de DIR-acquisitie tonen een hoge efficiëntie voor het aantonen van corticale letsels.60,61,62 Voor de multichannel approach van de segmentatiealgoritmen wordt gebruik gemaakt van een MPRAGE (magnetization preparation rapid acquisition gradient echo) acquisitie. Deze steunt ook op IR, maar hier wordt de TI zo gekozen dat er een groot contrast tussen witte en grijze stof ontstaat. Het is een 3D T1-opname met een hogere performantie voor het aantonen van letsels dan de klassieke T1 Spin-Echo opnames.63
18
Materialen en methodes 1. Patiëntenselectie Voor de selectie van de proefpersonen hebben we gekozen voor een subset van de patiëntenpopulatie van prof. dr. Debruyne van de MS-kliniek van het UZ Gent. Bij aanvang was het de bedoeling om verschillende MRI-acquisities, namelijk FLAIR en DIR, te vergelijken met als doel de meest gevoelige te vinden voor de vroegdiagnose van MS. Gezien de focus lag bij de diagnosestelling en niet opvolging, includeerden we patiënten die voldoen de volgende 3 voorwaarden: 1. De patiënt dient zich met CIS te hebben gepresenteerd in de dienst neurologie van het UZ in de 2 jaar voor patiëntselectie. De aanvullende onderzoeken voor differentiaaldiagnose en de beeldvorming moeten in het UZ Gent hebben plaatsgehad. 2. Om een zekere tijdslijn te kunnen creëren binnen de beeldvorming moeten minstens twee consecutieve MRI-onderzoeken gebeurd zijn bij de patiënt. 3. Op het moment van inclusie van patiënten in de studie werden alle alternatieve diagnosen uitgesloten en is er sprake van RRMS. PPMS werden niet geïncludeerd omwille van het verschil in diagnostische criteria. Bij alle geïncludeerde patiënten is aldus in de laatste twee jaar een definitieve diagnose van MS gesteld volgens de herziene McDonaldcriteria van 2010. In de voorgeschiedenis situeert zich bij alle patiënten een episode suggestief voor demyelinisatie zonder voldoende argumenten voor de onmiddellijke diagnose, het betreffen CIS-patiënten. Personen die verwezen werden voor een tweede opinie werden niet in de studie opgenomen, gezien er te weinig informatie gekend is, de beeldvorming vaak onbereikbaar en verschillend in acquisities, beeldkwaliteit, ed. in vergelijking met de UZ opnames. Dit betekent dat we doorverwezen patiënten, waarbij de differentiaaldiagnose in de periferie is gesteld, excluderen van de studie. Een aantal opmerkingen dringen zich op bij deze selectie. De afspraak rond deze criteria is gemaakt in de loop van september 2011. Toen lag de focus van de studie nog op een vergelijking tussen DIR en FLAIR-acquisitie. De voorgaande McDonald criteria van 2001 en 2005 stelden dat MS als diagnose niet op 1 tijdstip kon worden gesteld en dat meerdere klinisch neurologische onderzoeken en/of beeldvormende onderzoeken nodig waren. Bij overgang naar de 2010 criteria blijft de klinische criteria ongewijzigd, maar de beeldvormende criteria laten nu toe de diagnose te stellen op één tijdstip. Het oorspronkelijk 19
idee om retrospectief te kijken naar de evolutie van patiënten met CIS naar een CDMS verviel daardoor als opzet, gezien het interval tussen beide zeer kort is geworden. DIT vervullen op 1 tijdstip deed dus de noodzaak aan consecutieve beelden vervallen. Na selectie werd via het Elektronisch Patiëntendossier (EPD) een adrema-nummer opgezocht. In de verdere communicatie en analyse werd uitsluitend met deze nummers gewerkt teneinde de privacy niet te schenden. De dataverzameling gebeurde volgens twee luiken. Klinischneurologische informatie werd gehaald uit het EPD, via een computer op de dienst neurologie. Voor elke patiënt werd leeftijd en geslacht verzameld om een idee te krijgen van de verdeling van onze patiëntenpopulatie. Tevens benaderden we op basis van de consultverslagen en briefwisseling de datum van diagnosestelling. Om een inschatting te krijgen van de impact van de ziekte documenteerden we ook de EDSS-score volgens Kurtzke.18 Een soft-copy van de MRI beelden werd gepreleveerd uit het PACS (Picture Archiving and Communication System) via de server op de dienst radiologie. De selectie van patiënten en verzameling van beeldmateriaal verliep over een periode van september 2011 tot eind 2012. Er werd ook teruggegaan in het patiëntendossier van professor Debruyne, bij sommige patiënten was de diagnose reeds in 2009 gesteld. De aanvraag voor het ethisch comité werd ingediend in juli 2011. We beschreven een retrospectieve vergelijkende studie tussen verschillende beeldvormingsmodaliteiten om te bepalen welke methode het gevoeligst is voor de vroegdiagnose van MS. Oorspronkelijk ging het over een parallelle beoordeling van twee verschillende acquisities (zie verder). Uiteindelijk is het een vergelijking geworden tussen een automatisch detectiealgoritme en de protocollering door de neuroradioloog. Ethisch gezien is er geen fundamenteel verschil gezien er voor de patiënt niets verandert. De gebruikte beelden worden standaard genomen bij een CIS-patiënt, daar ze behoren tot een radiologisch protocol. In de werkwijze van het onderzoek werden geen veranderingen aangebracht. De verwerking gebeurt immers volledig buiten de dienst neurologie, dus het heeft de clinicus geenszins beïnvloed en er zijn geen therapeutische implicaties voor de patiënt. De patiëntendossiers werden ingekeken, maar behalve de variabelen leeftijd, geslacht, EDSS-score en datum van diagnose werd niets gedocumenteerd of gecommuniceerd. Er werd geen informed consent voorgelegd aan de patiënten gezien deelname aan de studie geen voordeel of repercussie met zich mee bracht.
20
Zoals de epidemiologie reeds doet vermoeden gaat het over een jonge groep patiënten met een grotere proportie vrouwen dan mannen. Onderstaand wordt de verdeling naar geslacht en leeftijd weergegeven door middel van een staafdiagram (histogram 1).
Leeftijdsverdeling van de studiepatiënten 10 9 8 7 6 5 4 3 2 1 0
Man Vrouw
≤19
20-29
30-39
40-49
50+
Histogram 1: leeftijdsverdeling van de studiepatiënten, met stratificatie naar geslacht
2. Verloop van het experiment en evolutie van de doelstellingen Het oorspronkelijke idee was een studie te verrichten naar de meerwaarde van 3D DIR T2acquisities bij een CIS-patiënt. DIR staat voor Dual Inversion Recovery. Het 3 Tesla MRItoestel in het UZ Gent is reeds enkele jaren uitgerust om deze opnames te nemen, maar tot nog toe is er weinig studie gebeurd naar de toepasbaarheid van de opname. Om de performantie van de beeldvorming te bepalen zouden we de vergelijking maken met de 3D FLAIR T2 opname. Waar men vanuit de kliniek vooral in geïnteresseerd was, is het aantal letsels dat respectievelijke beeldvorming oplevert. Het onderzoek zou kaderen binnen een algemene zoektocht naar meer gevoelige beeldvorming. Immers de diagnostische richtlijnen van 2005 hechten veel belang aan het aantal T2-letsels.35 In het belang van deze vroege diagnosestelling heeft het panel van 2010 de richtlijnen echter al sterk versoepeld met een minder vereist aantal letsels (minimum 2).7 Dit heeft de
sensitiviteit van de MRI-criteria al gevoelig verhoogd. Toch blijft het belangrijk te zoeken naar meer gevoelige acquisities. Ook zouden bepaalde nieuwe technieken gevoeliger zijn voor het opsporen van grijzestofletsels, een vorm van aantasting die steeds meer de aandacht krijgt omdat ze beter is gecorreleerd met de klinische toestand.64
Met deze studieopzet zijn we vertrokken om een patiëntenselectie op te stellen. Van alle patiënten zouden FLAIR- en DIR naast elkaar worden gelegd. De letsels zouden eerst door de studenten worden gescoord, waarna de radioloog de bevindingen zou onderbouwen of 21
verbeteren. Echter bij een exploratie van PACS op zoek naar het benodigd beeldmateriaal blijkt dat de databank aan DIR-opnames niet zo groot is als initieel ingeschat. Ze waren uit het protocol verdwenen als gevolg van de beperkte vraag vanuit de kliniek en weinig studies rond de performantie. De DIR werd bij het begin van de studie dus niet systematisch genomen. Hier werd verandering in gebracht door DIR alsnog in het protocol op te nemen. Het zou nog een hele tijd duren voor het gewenste aantal beelden was verzameld, dus werd beslist om voorlopig te focussen op een ander topic. Een andere toepassing met potentieel om de gevoeligheid van de beeldvorming te verhogen is de automatische segmentatie. Het betreffen algoritmes die op bestaand beeldmateriaal worden toegepast met de bedoeling om “gezond hersenweefsel” van wittestofletsels te onderscheiden. Wanneer geoptimaliseerd, zou de mogelijkheid bestaan om wittestofletsels automatisch naar aantal en volume in te schatten. De nieuwe opdracht luidt om voor een dergelijk algoritme de performantie te bestuderen en te bepalen of het een plaats kan krijgen in de diagnosestelling van MS. Het plaatsen van deze nieuwe opzet in een bredere klinische context was iets moeilijker. Een dergelijk algoritme was minder onmiddellijk toepasbaar voor de clinicus dan een nieuwe acquisitie. Tevens kan de opmerking worden gemaakt dat een volumetrische inschatting met bepaling van een lesion load een idee kan geven van de uitgebreidheid van aantasting, maar dit is minder van belang bij diagnose dan bij opvolging van de ziekte. Om die reden werd voorgenomen vooral aandacht te besteden aan het aantal letsels en de DIR-FLAIR vergelijkende studie voorlopig niet op te geven. Een terugkoppeling van de segmentatie-algoritmes naar de DIR-FLAIR vergelijking was evenwel onmogelijk gezien geen algoritme bestaat dat gebruik maakt van DIR-acquisitie. In het zoeken naar een algoritme voor gebruik in de studie werden we bijgestaan door meneer Vandemaele, ingenieur bij GIFMI (Ghent Institute for Functional and Metabolic Imaging). We werden eerst aangeraden om gebruik te maken van een lesion-TOADS plug-in voor MIPAV (Medical Image Processing, Analysis and Visualisation). MIPAV is ontwikkeld door de NIH (National Institutes of Health, USA) en is gratis beschikbaar. Het ondersteunt veel verschillende visualisatie- en post-opname analyse-toepassingen en dit bij MRI, CT, PET en andere medische beeldvorming. De lesion-TOADS plug-in geeft als algoritme een gelijktijdige segmentatie van de normale hersenanatomie en zal daar bovenop een segmentatie van wittestofletsels uitvoeren. De segmentatie van de normale hersenen gebeurt via het TOADS principe (Topology-preserving 22
Anatomy-Driven Segmentation), dat een combinatie van topologische en statistische atlassen gebruikt om te de hersenanatomie te ontleden. Het segmenteert het CSF, cerebrale grijze en witte stof, cerebellaire grijze en witte stof, basale ganglia en hersenstam. Daarna zal het van de probabiliteit van aantasting en intensiteitsweging gebruik maken om wittestofletsels te herkennen. We merken op dat in de beschrijving van Schiee et al. niet wordt gesproken van hersenstamletsels. Het programma gebruikt een multichannel weging, wat betekent dat men meerdere acquisities nodig heeft als input. Hoog contrast tussen normaal en pathologisch weefsel wordt voorzien via de T2 en hoog contrast binnen de normale anatomische structuren wordt voorzien via de T1 opname. Men mag verschillende T1 en T2 beelden gebruiken, maar men raadt aan met FLAIR en Spin Echo T1 te werken.65 Praktisch vereist de toepassing behoorlijk veel geheugen, de handleiding beschrijft een minimum van 2,5Gb. Er zijn een paar pogingen ondernomen om het programma toe te passen op de eigen PC’s, maar op deze wijze werd geen output bekomen. Hierop werd contact opgenomen met de ontwerpers van de TOADS plug-in, geaffilieerd met IACL (Image Analysis and Communications Lab) van John Hopkins University. De heer Navid Shiee adviseerde om ondanks de aangegeven 2,5Gb minstens 4 à 6Gb werkgeheugen te voorzien. Terwijl een oplossing gezocht werd voor het tekort aan rekenkracht, werd een nieuw algoritme gelanceerd dat gelijkaardige eigenschappen en doelstellingen heeft als de lesion TOADS. Het betreft LST of Lesion Segmentation Tool, een plug-in voor SPM8. SPM staat voor Statistical Parametric Mapping, een softwarepakket dat toelaat om statistische analyse toe te passen op verschillende beeldvormingsmodaliteiten. Gezien men in het UZ veel meer ervaring heeft met het gebruik van SPM dan met MIPAV besluiten we over te stappen op de nieuwe toepassing. LST werkt ook met een multichannel approach. De keuze van beeldvorming is veel strikter dan voor de vorige toepassing. Het algoritme is ontworpen voor een 3DT2 FLAIR en een 3D gradiënt echo T1 (MPRAGE), preferentieel op een 3T toestel. Niet alle patiënten hebben een MPRAGE, dus er wordt besloten dit in het CIS-protocol op te nemen. Op dit punt wordt de opname van DIR verlaten, daar het de studie onoverzichtelijk zou maken op twee totaal verschillende pistes te werken.66 Voor de toepassing van het algoritme is er een preprocessing nodig via het VBM8 (voxelbased morphometry) pakket in SPM8. LST maakt vervolgens een probabiliteitsberekening van de voxels en deelt ze in volgens witte stof, grijze stof en CSF. De detectie van letsels 23
baseert zich (1) op het detecteren van hyperintense outliers op FLAIR en (2) weging naar probabiliteit dat de voxels tot witte stof behoren. De werkwijze wordt schematisch getoond in figuur 1, overgenomen uit Schmidt et al.66 Het algoritme werkt niet volautomatisch. Een aantal manueel in te stellen variabelen zullen mee de output bepalen. Onderstaande tabel 2 geeft een overzicht met de beschrijving van de variabelen en hun range. De initiële threshold 𝜅 dient manueel ingesteld te worden omdat de optimale waarde kan
verschillen naargelang de gebruikte beeldset. Kappa kan variëren binnen een range van 0,05
tot 1 met een increment van 0,05. In het lanceringartikel vond men een optimum van 0,3. Voor nieuwe gebruikers raad men aan het optimum te zoeken tussen 0,2 en 0,4.66 Tabel 2: LST-variabelen Benoeming
Beschrijving
Range
Initial Threshold Kappa (𝜅)
Representeert de drempelwaarde om een voxel van de lesion
0 tot 1
MRF parameter
belief map (B) in de initial lesion map (𝐿𝑖𝑛𝑖𝑡 ) op te nemen.
n.v.t.
MRF slaat op Markov Random Field, een probabilistisch model.
Maximaal aantal Iteraties
Aantal keer dat het lesion growing algoritme kan wordt
10 tot 50
toegepast en de letsels centrifugaal worden vervolledigd in de lesion probability map. Binary Threshold parameter
Een extra drempelwaarde om uit de lesion probability maps
0 tot 1
een binaire lesion map te genereren.
Ook LST heeft veel rekenkracht nodig en er wordt besloten om vanaf de server te werken. Op die manier draait alleen de interface op onze PC en wordt het gros van de berekeningen door de server uitgevoerd. Toepassing van LST via de internetverbinding kende echter ook zijn beperkingen. De voornaamste snelheidsbepalende factor bleek de instelling van het aantal iteraties. Wanneer deze op meer dan 10 werden ingesteld, resulteerde dit in een time-out voor de volledige output werd bekomen. De visuele beoordeling van de binaire lesion map toonde aan dat de letsels vaak niet werden opgespoord en meestal onvoldoende gegroeid waren. Deze uitkomsten lagen ver van de performantie in het lanceringsartikel. Daarnaast hadden we een beperkt begrip van de impact van invulling van de variabelen MRF, 𝜅, maximaal aantal
iteraties en binary threshold. Een optimum inschatten was zeer moeilijk en het aantal verschillende combinaties van variabelen is te groot voor een “trial and error” benadering. De ontwerpers werden gecontacteerd.
24
Fig 1: LST werkingsmechanisme, overgenomen uit Schmidt et al.66 Eerst wordt er een preprocessing uitgevoerd door het
VBM8-pakket. De natieve T1 beelden worden gebruikt om een PVE (Partial Volume Estimate) te genereren. Voor
volumetrische berekeningen is het immers noodzakelijk om rekening te houden met voxels die een gedeeld weefseltype representeren. Een zekere graad van normalisatie is nodig, doch het programma werkt met de beelden in native space. De FLAIR beelden worden gecorrigeerd en gecoregistreerd met de T1 voor goede superpositie. Een FLAIR intensiteitsdistributie wordt berekend voor elke van de drie weefselklasses (CSF, WM en GM). Van deze distributies worden hyperintensiteitsoutliers weergegeven via respectievelijke BELIEF maps (𝐵𝐺𝑀 , 𝐵𝑊𝑀 en 𝐵𝐶𝑆𝐹 ). De drie belief maps worden
opgesomd om een globale belief map te genereren (B). Een binaire versie van de belief maps wordt berekend met een bepaalde drempelwaarde (hier 𝜅 = 0,3) en wordt aangeduid als een initial lesion map (𝐿𝑖𝑛𝑖𝑡 ). Het is een conservatieve,
strenge inschatting van de letsels. Het lesion growing algoritme zal voor de omliggende voxels een analyse maken en afhankelijk van een aantal eigenschappen besluiten om deze tot de segmentatie te rekenen. De mate waarin letsels groeien is afhankelijk van het aantal keer dat dit groeialgoritme wordt toegepast (iteraties). Gaandeweg gaat men van een rigide initial lesion map naar een meer liberale Lesion Probability Map.
25
Dr. Gaser, dr. Schmidt en dr.Mühlau van de Technische Universiteit München en de universiteit van Jena werden gecontacteerd met de vraag of er verbeteringen kunnen worden aangebracht. Een set beelden werd meegestuurd (figuur 2). Zij geven aan dat we zoals verwacht een suboptimale invulling van variabelen gebruiken. We kregen de volgende aanbevelingen: de optimale kappa coëfficiënt kan enigszins afwijken door verschil in gebruikt beeldmateriaal, maar naar alle verwachting niet veel. We mogen dus verwachten dat ons optimum ook rond de 0,3 zal liggen. Men raadt aan het maximaal aantal iteraties op te drijven tot 50 om een completere invulling te krijgen. De MRF parameter wordt het best op de default waarde van 1 gehouden. De beschrijving van de binaire threshold waarde noemen ze misleidend, dit kan het best op 0 worden gehouden.
Fig 2: Deze afbeeldingen behoren tot de beelden die we hebben overgemaakt aan dr. Gaser, dr. Schmidt en dr. Mühlau. U ziet drie aanzichten van een letsel boven het linker laterale ventrikel. In overlay is de binaire lesion map geplaatst (rood gekleurd). Het letsel is gedetecteerd maar de overlay beschrijft het letsel onvolledig qua grootte en lijkt ook een stukje van het ventrikel zelf mee te nemen.
Opdrijven van de iteraties maakte dat de server onvoldoende krachtig was om de beelden te segmenteren. Dit werd dientengevolge uitbesteed aan meneer Vandemaele, die over een krachtiger systeem beschikt. Na optimalisering van de batch beschikt het programma over zijn maximale capaciteit voor detectie. Dr. Gaser gaf in zijn correspondentie aan welke beperkingen het programma volgens zijn ervaring had. Het zou weinig sensitief zijn voor kleine, weinig intense letsels in de periferie van de hemisferen. 3. Beoordeling van de performantie en berekening van similariteitsmaatstaven De uiteindelijke doelstelling is om de performantie te bepalen van automatische segmentatie door middel van LST bij de CIS-patiënt. De onderzoeksvragen die we hanteren zijn de volgende: Kan LST de diagnostische gevoeligheid van de neuroradioloog evenaren? Kan men 26
door segmentatie alleen de diagnose even snel bevestigen conform de anno 2010 gehanteerde MRI-criteria? Is er een verschil wanneer het gebruikt wordt met de 2005 criteria? Als gouden standaard wordt een beoordeling door een neuroradioloog gehanteerd. Prof. dr. Achten van de afdeling neuroradiologie heeft de oorspronkelijke beelden geprotocolleerd en samen met ons een telling en precieze lokalisatie van de letsels geformuleerd. De keuze van viewing software viel op MRIcron. Handige functies van het programma laten toe de T1 en T2 sets gelijktijdig op te roepen en via de “Yoke” functie parallel te doorlopen. Na de klassieke protocollering werd de segmentatie gevalideerd op visuele wijze door de binaire lesion map op de oorspronkelijke beelden te projecteren via de functie “overlay”. Door de transparantie van de overlay te wijzigen kunnen oorspronkelijk letsel en segmentatie afzonderlijk worden begrensd om de volledigheid van de lesion growing na te gaan. Na het beoordelen van de oorspronkelijke beelden en binaire lesion probability map werd per patiënt een zekere besluitvorming geformuleerd. Terugkerende à vue opmerkingen geven een waardevolle kwalitatieve voorspelling van de resultaten. Voor de kwantitatieve analyse van het beeldmateriaal beroepen we ons op de telling van de letsels op de natieve beelden als referentie. Dit gebeurt op visuele wijze. De telling van de gedetecteerde letsels op de binaire probability overlay wordt tweevoudig uitgevoerd. Voor de inschatting van de optimale kappa gebeurde dat door een telalgoritme, geschreven door meneer Vandemaele. Voor de berekening van de gevoeligheid van LST (ook regionaal) werd dan weer visueel geteld. We tellen immers de letsels op de natieve FLAIR ook op visuele wijze en een side-by-side vergelijking is dan correcter. Temeer wanneer de segmentatie beoordeeld wordt per regio. In de beeldensets van patiënten 17 en 18 bleken de letsels zo talrijk en vertoonden ze zo’n confluerende contouren dat geen accurate telling mogelijk was. Het automatisch telalgoritme vond wel respectievelijk 25 en 92 letsels. De beeldensets worden opgenomen in de visuele beoordeling, maar worden van elke kwantitatieve analyse uitgesloten. De letsels van patiënten 3 en 21 waren ook omwille van aantal en confluentie moeilijk naar aantal te schatten, zij het niet in alle regio’s. Deze worden dus uitgesloten van analyse van de totale lesion count, doch voor analyse van de regionale count kunnen ze wel worden gebruikt. Bij de visuele vergelijking van de letsels op de binaire map met de letsels op de natieve beelden onderscheiden we 3 categorieën. True Positive (TP) wordt genoteerd wanneer in de 27
overlay een zichtbare (soms onvolledige) opvulling van het letsel wordt gezien. False Negative (FN) is wanneer een letsel niet is gedetecteerd. False Positive (FP) is wanneer binnen normaal weefsel verkeerdelijk een letsel wordt aangegeven. Echter er zijn zware beperkingen aan de werkwijze. In eerste instantie geven we een letsel als True Positive aan wanneer het gedetecteerd is, maar dit zegt niets over de volledigheid waarmee het letsel is gegroeid. In plaats van beoordeling van de segmentatie naar volledigheid, dichotomiseren we de output naar gedetecteerd of niet gedetecteerd. Deze beperking is te verdedigen gezien vooral het aantal letsels en niet het volume ons interesseert. Een tweede beperking is dat we zonder verdere hulpmiddelen geenszins een kwantificering van de True Negatives (TN) kunnen uitvoeren. Immers elke voxel die normaal weefsel representeert en in de binaire lesion map als negatief wordt aangegeven is een True Negative. Wij werken van letsel tot letsel en niet van voxel tot voxel. Rekening houdend met het bovenstaande berekenen we de sensitiviteit, positief predictieve waarde (PPV) en de false discovery rate (FDR). 𝑠𝑒𝑛𝑠 = 𝑃𝑃𝑉 =
𝐹𝐷𝑅 =
𝑇𝑃
𝑇𝑃+𝐹𝑁 𝑇𝑃
𝑇𝑃+𝐹𝑃 𝐹𝑃
= De kans dat een letsel als dusdanig wordt gesegmenteerd.
= De waarschijnlijkheid dat een positieve vondst een letsel is.
𝑇𝑃+𝐹𝑃
= De waarschijnlijkheid dat een positieve vondst vals positief is. Dit is de
complementaire kans van de positief predictieve waarde. Het is onmogelijk om een berekening uit te voeren van de specificiteit gezien we geen True Negative maat kunnen bepalen. De specificiteit is dus enkel visueel te bepalen. 𝑆𝑝𝑒𝑐 =
𝑇𝑁 𝑇𝑁 + 𝐹𝑃
Accuraatheid is ook niet te bepalen wegens gebrek aan True Negative maat. 𝐴𝑐𝑐 =
𝑇𝑃 + 𝑇𝑁 𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
Een DICE coëfficiënt geeft een hoge weging aan True Positives, een gelijke weging aan False Positives en False Negatives, maar houdt geen rekening met True Negative. Het is hier dus wel te bepalen en geeft de best mogelijke benadering van accuraatheid. Opgelet: door geen TN te includeren zegt deze coëfficiënt meer over de sensitiviteit dan over de specificiteit. 28
Deze coëfficiënt kan variëren in waarde tussen 0 en 1, waarbij 1 de hoogste performantie aangeeft. De DICE-coëfficiënt wordt ook gebruikt in het lanceringsartikel. DICE coëfficiënt =
2𝑇𝑃
2𝑇𝑃+𝐹𝑁+𝐹𝑃
Deze berekeningen worden per regio (juxtacorticaal, diepe witte stof, periventriculair en infratentorieel) uitgewerkt om eventueel een verschil in performantie aan te tonen. Terugkoppelend naar de diagnostische criteria en de kliniek passen we de resultaten van de segmentatie toe op de MRI-criteria en bepalen of deze op zich volstaan om de diagnose te stellen. Dit wordt gedaan voor zowel de 2005 als de 2010 criteria.
Resultaten 1. Visuele beoordeling De eerste informatie werd reeds verzameld tijdens het scoren van de letsels en het beoordelen van de (volledigheid van) lesiesegmentatie. Bepaalde patronen tekenen zich hierbij duidelijk af. Tevens werden bijzonderheden omtrent de beeldvorming, die mogelijks een invloed hebben op de performantie van LST, opgetekend. De beelden werden zowel gewonnen op het 1,5 als 3T toestel van het UZ Gent. In Appendix D is een samenvatting opgenomen van de voornaamste besluiten en andere opmerkingen. De visuele evaluatie geeft een aanvulling op de kwantitatieve analyse, gezien we bijvoorbeeld niet in staat waren om de volumetrische segmentatie kwantitatief naar volledigheid in te schatten. De beeldkwaliteit was over het algemeen goed. Echter een aantal FLAIR-acquisities schenen een moeilijke begrenzing weer te geven tussen de grijze en witte stof, waardoor het beoordelen van juxtacorticale letsels moeilijker werd. Dit was het geval bij patiënten 14, 22 en 28. De mogelijke oorzaken zijn een bewegingsartefact of problemen met de gebruikte sequentie. In sommige beeldensets (patiënten 9 en 15) is een vervorming van de weergave van de MPRAGE opgemerkt. De normalisatie van de MPRAGE in MNI-space voor het creëren van een Partial Volume Estimate (PVE) en de coregistratie met het FLAIR beeld kan naar alle waarschijnlijkheid de impact van deze vervorming beperken. Niettemin weerhouden we dit als mogelijke beperkende factor in het beoordelen van de performantie. In 9 van onze beeldensets merken we op dat het programma zeer gebrekkig de volumes van de letsels inschat. Na superpositie van de overlay werd een niet gesegmenteerde “rest” gezien (figuur 3). Dit werd ook gezien bij de eerste segmentatiepoging (figuur 2), maar het probleem houdt aan na verhoging van het aantal iteraties van 10 tot 50. 29
Fig 3: Op de FLAIR-opname van patiënt 22 zijn een aantal al dan niet gedetecteerde letsels te zien. Een voorbeeld van een volumetrisch onvolledige segmentatie is te zien boven en anterieur van de achterhoorn van het linker laterale ventrikel.
Een tweede terugkerend besluit bij meerdere casussen is dat een op het zicht onscherp begrensd letsel vaker wordt gemist dan een scherp begrensd letsel. Ook schijnt er een verband te bestaan tussen de grootte van het letsel en de efficiëntie van de detectie. In een vijftal patiënten besloten we dat er een efficiëntere detectie is van hyperintense letsels, doch zeer intense letsels werden soms ook gemist. De sterkste trend scheen een relatie tussen de lokalisatie en de efficiëntie van detectie. In de infratentoriële regio werd geen enkel letsel gedetecteerd. De meest efficiënte detectie en meest volledige invulling werd gezien in de periventriculaire en diepe witte stof regio’s. In de juxtacorticale regio werden veel kleine letsels gemist en werden slechts de beter omschreven en grotere letsels gesegmenteerd. 2. Kwantitatieve analyse 2.1. Reproductie van de optimale kappa We maken gebruik van de aanbevelingen van het lanceringsartikel voor het kiezen van de te bestuderen lesion maps (𝜅 = 0,3).66 Echter in het artikel wordt ook aangegeven dat de
optimale kappa kan afhangen van de gebruikte beeldenset. Bij ruimere marge bevelen ze een kappa aan tussen de 0,2 en 0,4. We kunnen voor onze beeldenset een ruwe inschatting maken van de optimale kappa door enerzijds de letsels te tellen op de natieve beelden (op visuele wijze) en anderzijds voor de afzonderlijke binaire lesion maps (range 𝜅[0,2; 0,4]) het aantal
letsels te laten bepalen door een telalgoritme. Het teken “>” geeft aan dat er zeer veel letsels zijn en dat visuele kwantificatie moeilijk was. Opeenvolgende tellingen leverden verschillende aantallen op. Het cijfer na dit teken is dus een “best estimate”.
30
Tabel 3:Toetsing van verschillende 𝜅-waarden aan de visuele count Patiëntnr
visuele count
3
> 50
5
12
6
6
8
21
9
19
10
7
13
6
14
5
15
15
16
4
17
/
18
/
19
6
20
9
21
>50
22
14
23
26
24
0
25
2
26
18
27
9
28
15
𝜅 = 0,2
𝜅 = 0,25
𝜅 = 0,3
𝜅 = 0,35
𝜅 = 0,4
16
14
14
14
12
15
13
8
6
5
15
10
6
4
4
31
28
21
22
21
27
18
14
12
8
0
0
0
0
0
4
4
5
3
3
9
3
1
1
1
10
8
8
10
7
2
1
1
0
0
29
26
25
22
20
94
95
92
89
89
8
5
5
2
2
2
1
1
1
1
32
31
26
22
18
18
16
14
11
10
32
25
23
22
19
9
7
4
2
4
2
0
0
0
0
18
14
12
10
7
6
3
3
3
3
9
7
7
7
4
Tabel 3: Rode velden tonen hogere segmentatiecount dan visuele count. De 𝜅-waarden met veel in het rood gekleurde velden komen overeen met een lage detectiedrempel wat een risico geeft op vals positieven
In bovenstaande tabel 3 werd het aantal getelde letsels op de natieve beelden vergeleken met het aantal op de lesion maps. De in het rood aangeduide velden staan voor een hoger aantal gesegmenteerde letsels dan op de natieve beelden kunnen worden aangetoond. Dit komt meer voor bij de lagere 𝜅-waarden. Immers een lagere kappa staat voor een lagere initial threshold
en dus een lagere intensiteitsdrempel om een voxel als letsel op te nemen. Een lagere kappa zal dus overeenkomen met een hoger aantal letsels op de binaire lesion map. Met een kappa van 0,2 zien we dat er bij veel patiënten meer letsels gesegmenteerd worden dan door visuele beoordeling kunnen worden bevestigd. Vermoedelijk zijn hier veel vals positieven bij. Vanaf een kappa hoger dan 0,3 zijn nagenoeg geen velden meer in het rood aangeduid en is het aantal vals positieven naar schatting dus laag. Een uitzondering hierop is het beeldmateriaal van patiënt 24 (figuur 4). Gesteld dat de optimale kappa ons een minimum aan vals positieven met een hoge detectiegraad van de letsels oplevert, is het inderdaad aan te nemen dat 0,3 ook voor onze beeldensets de beste keuze is. 31
Grafiek 2 toont voor elke kappa [0,05; 1] aan wat het gemiddeld aantal gesegmenteerde letsels is. Men ziet
duidelijk dat met toenemende kappa de selectie strenger is en minder letsels worden gesegmenteerd.
Fig 4: Bovenstaande afbeelding is een weergave van de beelden van patiënt 24 voor (boven) en na (onder) overlay van de binaire lesion map (𝜅 = 0,3). Deze intense concentraties aan de voorhoorn van linker en rechter laterale ventrikel werden door de radioloog als vals positieven aangegeven. Het zijn bij gebruik van 𝜅 = 0,3 de enige gedocumenteerde vals positieven in de volledige dataset. Ook bij de hogere 𝜅-waarden worden deze letsels opgenomen. Patiënt 24 heeft voor het overige geen observeerbare letsels.
32
2.2. Kwantitatieve analyse van de performantie Na het scoren van de letsels en het beoordelen van de gesegmenteerde stukken als accuraat of niet, krijgen we onderstaand resultaat. In tabel 4 staat een indeling van het aantal letsels per beeldenset en per regio. Tevens staat aangegeven per regio en in totaal hoeveel letsels zijn gedetecteerd. We merken nogmaals op dat er geen rekening werd gehouden met de volledigheid van segmentatie. Alle onderstaande tellingen zijn visueel bekomen, wat betekent dat de totalen kunnen afwijken van bovenstaande tabel 3. Tabel 4: overzicht van gescoorde letsels op natieve beelden en lesion maps, per regio Ptnr.
JC
PV
DWM
IT
Tot.
FLAIR
segm.
FLAIR
segm.
FLAIR
segm.
FLAIR
segm.
FLAIR
segm.
9
0
0
> 25
5
0
0
> 50
14
5
>25 1
0
5
5
6
3
0
0
12
8
6
2
2
3
3
1
1
0
0
6
6
8
4
3
3
2
13
13
1
0
21
18
9
5
1
7
5
4
4
3
0
19
10
10
1
0
2
0
3
0
2
0
8
0
13
0
0
4
1
2
1
0
0
6
2
14
0
0
4
1
1
0
0
0
5
1
15
6
2
6
5
1
1
2
0
15
8
16
0
0
4
1
0
0
0
0
4
1
19
1
1
3
2
1
1
1
0
6
4
20
4
1
2
0
1
0
2
0
9
1
21
5
1
15
15
> 20
8
> 10
0
>50
24
22
3
2
8
6
3
1
0
0
14
9
23
7
4
8
8
11
10
0
0
26
22
24
0
0
0
2
0
0
0
0
0
2
25
0
0
2
0
0
0
0
0
2
0
26
2
1
8
6
6
3
2
0
18
10
27
4
0
3
2
2
1
0
0
9
3
28
6
3
5
1
3
1
1
0
15
5
Tot.
76
30
92
63
103
53
24
0
295
146
3
Tabel 4: JC: juxtacorticaal, PV: periventriculair, DWM: diepe witte stof, IT: infratentorieel, Tot.: totaal. In de kolom FLAIR wordt weergegeven hoeveel letsels op T2-FLAIR met het oog zichtbaar waren. In de kolom segm. wordt weergegeven hoeveel letsels werden gesegmenteerd in de binaire lesion maps. Bij patiënten 3 en 21 waren bepaalde regio’s niet te kwantificeren, andere wel. Het rood gekleurde veld bij patiënt 24 duidt op de periventriculaire vals positieven, die niet bij het kolomtotaal werden geteld. Het kolom totaal geeft voor elke patiënt de balans tussen gescoorde en gesegmenteerde letsels. Het rijtotaal geeft voor elke regio de balans tussen gescoorde en gesegmenteerde letsels. De aantallen met een “>” aangegeven zijn “best estimates” en dus minder correct dan de overige.
33
Berekening van de sensitiviteit en positief predictieve waarde gebeurt door de waarden in bovenstaande tabel in de formules toe te passen. De visuele beoordeling suggereerde een zeer hoge specificiteit in die zin dat elke gesegmenteerde ruimte ook daadwerkelijk tot een letsel behoorde, met uitzondering van de letsels bij patiënt 24. Na aftrek van deze vals positieven kunnen de gesegmenteerde letsels worden gezien als een subset van de gescoorde letsels. Van de totale 295 letsels over alle patiënten zijn er 146 letsels gevonden. De totale balans van 𝑇𝑃
146
de hele dataset is dus als volgt: 𝑠𝑒𝑛𝑠 = 𝑇𝑃+𝐹𝑁 = 146+(295−146) = 0,4949 Over alle beeldensets en het volledige centraal zenuwstelsel vinden we een sensitiviteit van ongeveer 50 %. Overeenkomstig berekenen we de positief predictieve waarde (PPV): 𝑃𝑃𝑉 =
𝑇𝑃 146 = = 0,9865 𝑇𝑃 + 𝐹𝑃 146 + 2
Een letsel op de binaire lesion map (met 𝜅 = 0,3) correspondeerde in onze dataset in bijna
99% van de gevallen met een letsel dat door de radioloog werd gescoord. Complementair 𝐹𝑃
berekenen we de “False Detection Rate” (FDR): 𝐹𝐷𝑅 = 𝑇𝑃+𝐹𝑃 = 1 − 𝑃𝑃𝑉 = 0,0135
Slechts in ongeveer 1% van de letsels zagen we een vals positieve segmentatie. We berekenen een DICE-coëfficiënt met dezelfde waarden.. 𝐷𝐼𝐶𝐸 =
2𝑇𝑃 2 × 146 = = 0,6591 2𝑇𝑃 + 𝐹𝑃 + 𝐹𝑁 2 × 146 + 2 + (295 − 146)
De DICE coëfficiënt hier een beter resultaat dan de sensitiviteit omwille van de geringe maat van False Positives en een dubbele weging van de True Positives. In de visuele beoordeling is zeer duidelijk gebleken dat er verschillen bestonden in detectiegraad tussen de verschillende regio’s van de hersenen.35 Om deze reden werden
dezelfde berekeningen ook uitgevoerd voor de regio’s van de hersenen afzonderlijk en opgevat in onderstaand overzicht (Tabel 5).
Tabel 5:Sensitiviteit, positief predictieve waarde en DICE-coëfficiënt voor de verschillende hersenregio’s
JC PV DWM IT Totaal
TP
FN
FP
Sens
PPV
DICE
30
46
0
0,3947
1,0000
0,5660
63
29
2
0,6847
09692
0,8025
53
50
0
0,5146
1,0000
0,6795
0
24
0
0,0000
/
0,0000
146
149
2
0,4949
0,9865
0,6591
34
Tabel
5:
JC
juxtacorticaal,
=
sensitiviteit
(sens), PV
=
positief
predictieve
periventriculair,
DWM
waarde =
(PPV),
diepe
witte
DICE-coëfficiënt stof,
IT
=
(DICE).
infratentorieel.
In de onderste rij is nogmaals de totaalberekening opgevat. De PPV van de infratentoriële regio kan niet worden bepaald omwille van een 0 in de noemer.
Uit deze berekeningen blijkt dat het programma de hoogste sensitiviteit vertoont in de periventriculaire regio (0,68). In de infratentoriële regio, waar in onze beeldensets geen enkel letsel werd gedetecteerd, is de sensitiviteit nihil. In de diepe witte stof bedraagt de sensitiviteit 0,51 en in de juxtacorticale regio was de sensitiviteit iets lager (0,39). De positief predictieve waarde is over de hele lijn zeer hoog, vooral in de diepe witte stof en juxtacorticaal, waar geen vals positieven werden aangetroffen. In de infratentoriële regio is dit niet aan te tonen. De performantie, weergegeven door de DICE-coëfficiënt, is het hoogst in de periventriculaire regio (0,80), gevolgd door diepe witte stof (0,68) en juxtacorticaal (0,57). De infratentoriële performantie is nihil. Grafische weergave van de sensibiliteit voor de verschillende CNS-regio’s 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
False Negative True Positive
PV
DWM
JC
IT
Histogram 3: Door de som van de TP en FN op honderd procent te plaatsen weerspiegelt de scheidingslijn op grafische wijze de sensitiviteit. PV: periventriculair, DWM: diepe witte stof, JC: juxtacorticaal en IT: infratentorieel.
Vervolgens kunnen we bestuderen of de beeldkwaliteit van de beeldensets de performantie van het programma beïnvloedt. Van de beeldensets van patiënten 14, 22 en 28 is opgemerkt dat de beeldkwaliteit van de FLAIR minder goed is dan bij de overige patiënten, omwille van beperkt contrast tussen witte en grijze stof. Bij patiënten 9 en 15 was de weergave van de MPRAGE vervormd, met mogelijke coregistratieproblemen. We analyseerden deze twee groepen apart. Ter referentie wordt onder deze analyses een berekening gemaakt voor de totale populatie met exclusie van deze vijf patiënten (Tabel 6). 35
Tabel 6 TP
FN
FP
Sens
PPV
Dice
Patiënt 14, 22 en 28
15
19
0
0,4412
1
0,6122
Patiënt 9 en 15
18
16
0
0,5294
1
0,6923
Overige patiënten
113
114
2
0,4978
0,9741
0,6608
Hoewel de visuele beoordeling suggereerde dat de segmentatie minder volledig verliep bij een mindere kwaliteit van de FLAIR-acquisitie, kan dit niet ondersteund worden met kwantitatieve gegevens. Er zijn geen vals positieven aangetoond en in de gevoeligheid is het verschil heel klein en niet significant (P = 0.64). Ook voor de vervormde weergave van de MPRAGE geeft de analyse zelfs een hogere gevoeligheid (doch niet significant, P = 0.79) en er zijn geen vals positieven aangetroffen. 2.3. Toepassing van de segmentatiemaps op de diagnostische criteria Gezien we geen opeenvolgende beeldensets hebben is het moeilijk om de DIT criteria toe te passen. Bij patiënten 6, 8, 18, 21 en 23 werd een gadoliniumcontrasterend letsel aangetroffen; simultaan met T2 letsels volstaat dit voor de DIT-criteria van 2010. De contrastcapterende letsels werden overigens zeer goed gesegmenteerd. Voor de overige patiënten werd geen Gdcontrastcaptatie gevonden en zijn helemaal geen uitspraken rond de spreiding in tijd mogelijk. Toepassing van LST op de invulling van bepaalde DIS-criteria is wel mogelijk. Tabel 7: overzicht DIS-criteria volgens 2005 en 2010 richtlijnen Radiologische DIS, McDonaldcriteria 2010.7,67
Radiologische DIS, McDonaldcriteria 2005.32,33,35
≥ 1 letsel kan werd aangetroffen in 2 van de 4
Men voldoet aan 3 van de 4 voorwaarden: 1) 1
Gd-aankleurend
letsel of 9
T2
hyperintense letsels
volgende regio’s: -
Periventriculair
2) 1 infratentorieel letsel
-
Juxtacorticaal
3) 1 juxtacorticaal letsel
-
Infratentorieel
4) 3 periventriculaire letsels
-
Spinal cord
De letsels zijn > 3 mm in diameter Een
ruggenmergletsel
infratentorieel
letsel.
is De
equivalent medullaletsels
aan
een
kunnen
bijdragen tot het bereiken van de vereiste 9 T2 letsels of Gd-letsel (wanneer contrastcapterend). Tabel 7: De criteria waarmee we moeilijk rekening kunnen houden omwille van beperkte informatie staan in het rood aangeduid.
36
Toepassing van deze criteria op ons beeldmateriaal en gesegmenteerde maps kent een paar beperkingen. Ten eerste hebben we van geen enkele patiënt een ruggenmergopname, dus de 2005 herzieningen aan de radiologische criteria kunnen niet toegepast worden. Ook de vierde categorie van de 2010 criteria (ruggenmerg) kan niet worden gescoord. Ten tweede staat in de 2005 criteria vermeld dat de letsels meer dan 3 mm groot moeten zijn. Hier kunnen wij geen rekening mee houden, daar we nergens volumes hebben bepaald. Voor het beschrijven van de letsels in het centrum semiovale en letsels die zich arbitrair bevinden tussen periventriculaire regio en juxtacorticale regio maakte de radioloog gebruik van de categorie diepe witte stof (DWM). Liberaal genomen kunnen we deze letsels ook toewijzen tot de periventriculaire regio. Ondanks het feit dat bij alle patiënten ondertussen de diagnose MS is gesteld, zullen niet alle patiënten aan de DIS criteria voldoen. Dit is deels omdat we een belangrijk stuk van het zenuwstelsel (de medulla spinalis) niet in beschouwing nemen en anderzijds omdat DIS ook op klinische wijze kan worden weerhouden. Wanneer in de volgende tabellen DIS staat aangeduid, betekent dit dat men DIS kan besluiten op basis van de natieve beelden, respectievelijk segmentatiemaps. 2.3.1. Toepassing van de 2005 radiologische criteria Tabel 8: Toetsing van de segmentatie aan de 2005 radiologische DIS criteria Patiënt
Voldane criteria* op originele beelden
3
1, 3, 4
DIS
Voldane criteria* op segmentatiemaps (𝜅 = 0,30)
5
1, 3, 4
DIS
4
6
3, 4
3, 4
8
1, 2, 3, 4 DIS
1, 3, 4
DIS
9
1, 2, 3, 4 DIS
1, 3, 4
DIS
10
2, 3, 4
/
13
4
/
14
4
/
15
1, 2, 3, 4 DIS
3, 4
16
4
Geen
17
1, 2, 3, 4 DIS
1, 3, 4
DIS
18
1, 2, 3, 4 DIS
1, 3, 4
DIS
19
2, 3, 4
3, 4
20
1, 2, 3, 4 DIS
3
21
1, 2, 3, 4 DIS
1, 3, 4
DIS
22
1, 3, 4
DIS
1, 3, 4
DIS
23
1, 3, 4
DIS
1, 3, 4
DIS
24
/
DIS
DIS
1, 3, 4
DIS
/°
37
25
/
/
26
1, 2, 3, 4 DIS
1, 3, 4
27
1, 3, 4
DIS
4
28
1, 2, 3, 4 DIS
3
DIS
Tabel 8: toont welke criteria van Barkhof et al.32 voldaan zijn op de natieve beelden en de segmentatiemaps. 1: ≥ 9 T2 hyperintense letsels of ≥ 1 Gd aankleurend letsel; 2: minstens 1 infratentorieel letsel; 3: minstens 1
juxtacorticaal letsel; 4: minstens 3 periventriculaire letsels; /: geen criteria voldaan;° Bij patiënt 24 wordt het vals positief resultaat niet als letsel meegeteld.
Bij 14 patiënten werden op het zicht meer dan 9 T2 hyperintense letsels gescoord (criterium 1). Dit kon slechts in 9 patiënten bevestigd worden na segmentatie. Het feit dat het programma voor onze dataset een algehele sensitiviteit had van slechts 0,49 heeft ervoor gezorgd dat in 5 patiënten de lesion count onder de diagnostische grens van 9 is gevallen. Van de 10 patiënten met gedocumenteerde infratentoriële letsels (criterium 2) zijn bij geen enkele de letsels gesegmenteerd. Bij 10 patiënten is aldus een positief criterium 2 niet bevestigd na segmentatie. Bij 17 patiënten werden 1 of meer juxtacorticale letsels (criterium 3) aangetroffen bij scoring. Na segmentatie was bij 14 patiënten minstens 1 van deze letsels gesegmenteerd, bij 3 patiënten was de juxtacorticale segmentatie onsuccesvol. Twintig patiënten vertoonden bij scoring 3 of meer periventriculaire letsels (criterium 4). Binnen deze groep werden bij 6 patiënten minder dan 3 letsels gesegmenteerd, waardoor aan criterium 4 na segmentatie niet langer werd voldaan. Verschil visuele scoring en segmentatiemap 25 20 visuele scoring
15
segmentatiemap (κ = 0,30)
10 5 0 criterium 1 criterium 2 criterium 3 criterium 4
Histogram 4: de verschillen tussen de visuele scoring en de segmentatie van de beelden voor wat betreft het vervullen van de criteria van Barkhof et al.32 Op de y-as vindt men het aantal patiënten. criterium 1: minstens 9 T2 hyperintense letsels of 1 Gd-contrasterend letsel; criterium 2: minstens 1 infratentorieel letsel; criterium 3:
minstens 1 juxtacorticaal letsel; criterium 4: minstens 3 periventriculaire letsels.
38
Histogram 4 toont duidelijk aan dat verschillende van de Barkhofcriteria niet worden vervuld wanneer men alleen op de segmentatie afgaat. De gevoeligheid is het hoogst voor de juxtacorticale letsels en de periventriculaire letsels (resp. criterium 3 en 4). De infratentoriële voorwaarde wordt nooit voldaan. De lesion count na segmentatie is gereduceerd, waardoor men een lage gevoeligheid vindt voor criterium 1. Dit is grotendeels overeenkomstig met wat men bij de kwantitatieve analyse vond. Alleen werd toen een grotere gevoeligheid gevonden voor periventriculaire dan voor juxtacorticale letsels. Dat het hier omgekeerd lijkt is omdat het vereist aantal letsels volgens Barkhof groter is voor de periventriculaire (3) dan voor de juxtacorticale (1) regio.32,33 In 16 van de 22 patiënten konden we op basis van de visueel gescoorde letsels de DIS-criteria als vervuld beschouwen. Nochtans hebben de andere patiënten ook reeds een diagnose van MS. Dit heeft veel te maken met het feit dat bij een groot deel van het patiëntenbestand de diagnose werd gesteld op basis van de 2010 criteria van Polman. Daarnaast is bij een aantal patiënten de diagnose op klinische basis gesteld en (nog) niet radiologisch bevestigd. Na segmentatie waren de DIS-criteria nog voldaan bij 9 van de 22 patiënten. Bij 7 patiënten is op visuele wijze DIS te bevestigen, maar is de segmentatie ontoereikend. Indien we de sensitiviteit voor het vervullen van de 2005 criteria met het segmentatiealgoritme berekenen, ten opzichte van de radiologische protocollering, vinden we een waarde van 0,5625. 2.3.2. Toepassing van de 2010 radiologische criteria: Tabel 9: Toetsing van de segmentatie aan de 2010 radiologische DIS criteria patiënt
Ingenomen regio’s op originele beelden
Ingenomen
3
JC, PV
DIS
(𝜅 = 0,30)
5
JC, PV
DIS
PV
6
JC, PV
DIS
JC, PV
DIS
8
JC, PV, IT DIS
JC, PV
DIS
9
JC, PV, IT DIS
JC, PV
DIS
10
JC, PV, IT DIS
/
13
PV
PV
14
PV
PV
15
JC, PV, IT DIS
JC, PV DIS
16
PV
PV
17
PV, JC, IT DIS
PV, JC DIS
18
PV, JC, IT DIS
PV, JC DIS
JC, PV
regio’s
op
segmentatiemaps
DIS
39
19
JC, PV, IT DIS
JC, PV DIS
20
JC, PV, IT DIS
JC
21
JC, PV, IT DIS
JC, PV DIS
22
JC, PV
DIS
JC, PV DIS
23
JC, PV
DIS
JC, PV DIS
24
/
/°
25
PV
/
26
JC, PV, IT DIS
JC, PV DIS
27
JC, PV
PV
28
JC, PV, IT DIS
DIS
Tabel 9: toont welke regio’s volgens Swanton et al.
JC, PV DIS 67
zijn ingenomen op de natieve beelden en de
segmentatiemaps. JC: juxtacorticaal regio; PV: periventriculaire regio; IT: infratentoriële regio; / geen criteria voldaan. De spinale regio wordt hier niet opgenomen daar de studie zich tot de hersenen beperkt. ° Bij patiënt 24 wordt het vals positief resultaat niet als letsel meegeteld. De vermelding DIS betekent dat de DIS-criteria zijn vervuld, daar 2 of meer regio’s zijn ingenomen conform de Swantoncriteria.
Dat de 2010 criteria een hogere gevoeligheid hebben dan de 2005 criteria 7 komt in deze
bevindingen in geringe mate naar voor. De visuele scoring van de natieve beelden volstond in 17 van de 22 patiënten om disseminatie in ruimte te weerhouden, bij de 2005 criteria waren dit 16 van de 22 patiënten. Toepassing van diezelfde criteria op de segmentatiemaps leverde in 13 patiënten nog een besluit van disseminatie in ruimte. Bij 4 patiënten is op visuele wijze DIS te bevestigen maar is de segmentatie ontoereikend. Indien we de sensitiviteit voor het vervullen van de 2010 criteria met het segmentatiealgoritme berekenen, ten opzichte van de radiologische protocollering, vinden we een waarde van 0,7647.
Deze sensitiviteit is hoger dan de waarde berekend voor de 2005 criteria, die 0,5625 bedroeg. Bij het berekenen van een betrouwbaarheidsinterval rond de 0,5625 vinden we: 0,5625 × (1 − 0,5625) 0,5625 × (1 − 0,5625) 𝐶𝐼 = �0,5625 − 1,96 × � ; 0,5625 + 1,96 × � � = [0,3194; 0,8056] 16 16
De berekende 0,7647 voor de 2010 criteria ligt hierbinnen. We kunnen dus besluiten dat we een hogere sensitiviteit vonden van het segmentatie-algoritme voor het weerhouden van disseminatie in ruimte volgens de 2010 criteria dan volgens de 2005 criteria. Echter dit verschil is niet significant (P = 0.10). In de juxtacorticale regio werden visueel in 17 van de 22 patiënten letsels aangetroffen. Na de segmentatie kon dit slechts bij 14 patiënten worden bevestigd. Eenentwintig patiënten 40
vertoonden zichtbare periventriculaire letsels, waarvan slechts in 18 te bevestigen na segmentatie. Van de 11 patiënten met infratentoriële letsels kon na segmentatie geen enkele worden weerhouden. Het besluit is dus grotendeels overlappend met de toepassing op de 2005 criteria. Doordat het vereist aantal letsels niet meer verschilt tussen de periventriculaire en de juxtacorticale regio zien we hier een betere overeenkomst met de kwantitatieve analyse, de periventriculaire gevoeligheid is hoger dan de juxtacorticale. 25 20 15
visuele scoring
10
segmentatiemap (κ = 0,30)
5 0 PV
JC
IT
Histogram 5: de verschillen tussen de visuele scoring en de segmentatie van de beelden voor wat betreft het vervullen van de criteria van Swanton et al.67 Op de y-as vindt men het aantal patiënten. PV: minstens 1 letsel periventriculair; JC: minstens 1 juxtacorticaal letsel; IT: minstens 1 infratentorieel letsel.
Discussie Gezien de evolutie in kennis rond pathogenetische en etiopathogenetische processen die bij MS zijn betrokken en de opkomst van nieuwe therapeutische mogelijkheden is in de laatste jaren het belang van een accurate en vooral snelle diagnose toegenomen. Voor het jaar 1983 heeft men zich vooral gebaseerd op de klinische diagnosestelling, door een spreiding van neurologische aantasting in ruimte (DIS) en in tijd (DIT), waarbij daarnaast veel aandacht werd geschonken aan de differentiaaldiagnose.1,12 Deze principes blijven geldig en worden
ook toegepast bij interpretatie van de paraklinische tests en integratie met de klinische bevindingen. Immers de klinische progressie van een patiënt met CIS, naar een definitieve diagnose van MS kan vele jaren duren als men zich enkel baseert op klinische criteria, in veel gevallen blijft het een eenmalige gebeurtenis.17 Er is intensief gezocht naar technische
onderzoeken en biomerkers om de diagnose te ondersteunen en die periode van onzekerheid te verkorten. Dit om verschillende redenen. Ondanks het feit dat bij aanvang de kliniek in opstoten en remissies verloopt, zal in veel gevallen na een langdurige ziekte het herstel steeds minder efficiënt worden. Er ontstaat 41
progressie van de invaliditeit, met een minder intermittent verloop maar in plaats daarvan accumulatie van symptomen en progressie op de EDSS schaal; het is de zogenaamde secundair progressieve MS. Of men ooit in het stadium van SPMS zal komen of een eerder ‘benigne’ verloop zal vertonen is op voorhand niet te bepalen. Ook het tijdsbestek waarmee dit gebeurt is moeilijk te voorspellen. Van de immunologische behandeling wordt beweerd dat het de progressie naar een SPMS kan uitstellen, maar eens dit stadium bereikt, is nog geen enkele therapie efficiënt gebleken.13 Hoe vroeger de behandeling wordt aangevat, des te meer
het progressieve stadium kan worden uitgesteld
Uitgebreid in vitro en beeldvormend onderzoek toonde aan dat de progressieve invaliditeit toe te schrijven is aan axonale schade eerder dan aan inflammatie en demyelinisatie.68 Axonale
schade zou reeds zeer vroeg in de ziekte een rol spelen. Dat de patiënt op dit punt nog herstel ondervindt is grotendeels door de grote plasticiteit van het zenuwstelsel.64 De nieuwe
therapeutische inzet is dus axonsparende therapie naast de huidige immunomodulerende therapie. Door de axonale aantasting, die in het 2de stadium massaal aanwezig is gedraagt MS zich als een neurodegeneratieve ziekte zoals vb de ziekte van Parkinson of ALS, een argument om de ziekte vroegtijdig te behandelen.13 Bij de huidige immunomodulerende therapie vindt men steeds meer evidentie van een gunstiger verloop bij vroege toediening, zoals boven aangehaald.14 Placebo gecontroleerde trials bij CIS-patiënten hebben overvloedig aangetoond dat vroegbehandeling de conversie
naar definitieve MS vertragen.3,4,5,6 De hoge kostprijs en de potentiële bijwerkingen hebben
veel practici er van weerhouden deze middelen te gebruiken in een groep waarvan wordt
uitgegaan dat zij een goedaardig MS verloop zullen hebben of geen 2e opstoot zullen vertonen (30% maakt na 15-20 jaar geen tweede episode door).14 Men zou er dus voordeel bij hebben
bij CIS patiënten snel de diagnose van MS te kunnen stellen en daarbij te kunnen bepalen bij wie onmiddellijke therapie noodzakelijk is en wie een grotere kans heeft op benigne verloop en dus eerder afwachtend moet worden opgevolgd. Verschillende paraklinische tests zijn voorgesteld om de gevoeligheid van de diagnose te verhogen. Geëvokeerde potentialen, elektroforese op het CSF en CT zijn reeds in de Posercriteria van 1983 opgenomen, maar hun bijdrage blijkt, behoudens de liquoranalyse, in
het huidig beleid zeer klein.12 De meeste aandacht gaat al een tijd uit naar MRI van hersenen en ruggenmerg. Ondanks de hoge gevoeligheid van MRI is er, wegens de geringe specificiteit van de letsels, een uitgebreide differentiaaldiagnose met andere wittestofaandoeningen. In 42
respons op deze kritiek heeft men radiologische criteria opgesteld die de specificiteit moesten verhogen, naast een aantal ‘red flags’ die de aandacht op andere diagnosen doet vestigen.34
Dezelfde DIS en DIT-principes als in de neurologische praktijk zijn ook in deze radiologische criteria opgenomen. De criteria werden omwille van hogere eisen qua sensitiviteit in 2010 sterk vereenvoudigd.
Men besloot toen geen andere diagnostische tests op te nemen in het overkoepelend schema uit vrees voor een verlies in specificiteit.7 Om in deze context de snelheid van de diagnose
verder te optimaliseren moet men zich dus richten op de kwaliteit van de beeldvorming, nieuwe acquisities of methodes die de letsels op MRI met een grote gevoeligheid opsporen. Dit werk bestudeert het potentieel van de derde categorie, namelijk de automatische segmentatie van letsels op de MRI-acquisities. LST (Lesion Segmentation Tool) maakt gebruik van zowel T1 (hier MPRAGE) als T2 (hier FLAIR) karakteristieken en een groeialgoritme om wittestofletsels in de hersenen te detecteren en naar volume in te schatten. Het eindproduct is een driedimensionele binaire map die de voxels indeelt in “letsel” en “gezonde witte stof”. De meeste variabelen die het programma hanteert liggen bij uitstek vast, uitgenomen de ‘initial threshold Kappa’. De optimale kappa kan enigszins afhangen van het gebruikte beeldmateriaal, maar men raadt aan een κ te kiezen tussen 0,2 en 0,4.66 Zelf kiezen
Schmidt et al. een κ = 0,3. Op basis van een automatische telling van de letsels op de resulterende binaire lesion maps voor verschillende κ en vergelijking met onze letselscoring
vonden we dat bij een κ hoger dan 0,3 veel letsels gemist werden. Lager dan 0,3 worden dan weer onrealistisch veel letsels gevonden met vermoedelijk veel vals positieven. We zien in dat de vergelijking van een visuele scoring met een automatische telling slechts een zeer ruwe inschatting oplevert. Met de gegevens waarover we beschikken trekken we toch het besluit dat een κ = 0,3 ook voor onze dataset optimaal is. In retrospect was het beter en meer betrouwbaar geweest zo we een ROC-curve (reciever operating characteristic) hadden opgesteld met bepalen van de κ met de grootste AUC (area under the curve). Deze methode is de standaard voor het bepalen van een afkapwaarde. Een beperking voor ons is dat de ROC een uiteenzetting is van de sensitiviteit in functie van de aspecificiteit (1- specificiteit). Bij gebrek aan een maat voor True Negatives verkeerden we niet in de mogelijkheid om een specificiteit te berekenen. Om de performantie van het programma te beoordelen wordt gebruik gemaakt van de huidige gouden standaard, namelijk de neuroradiologische protocollering. Het ander lid van de 43
vergelijking is de binaire lesion map van LST. Voor het bepalen van de optimale kappa hebben we een automatische telalgoritme gebruikt op de binaire lesion map en vergeleken met visueel getelde letsels op de oorspronkelijke beelden. Bij kwantitatieve analyse echter moest elk letsel afzonderlijk worden onderverdeeld als niet gedetecteerd (FN), correct gedetecteerd (TP) of onterecht gedetecteerd (FP). Ook kozen we ervoor om de letsels in te delen naar regio. Om deze redenen is voor de kwantitatieve bepaling van de performantie zowel de scoring op natieve beelden als de telling van de letsels op de binaire lesion map op visuele wijze gebeurd. Nog vóór de kwantitatieve vergelijking werden bij visuele scoring een aantal besluiten op het zicht geformuleerd. Hoewel methodologisch weinig accuraat en moeilijk te onderbouwen geven deze besluiten een aantal nuances weer die niet uit de cijfers te halen zijn. Zo lijken veel letsels onvolledig te worden gesegmenteerd. Onscherp begrensde letsels schijnen slechter te worden gedetecteerd en ook de kleinere letsels worden vaker gemist. We hebben nergens een indeling gemaakt van letsels naar grootte of andere karakteristieken dus dit is verder niet te staven. Het verschil in detectie naargelang de regio in de hersenen is visueel goed te beoordelen. We vonden op het zicht al dat de infratentoriële detectie zeer slecht tot afwezig was en dat de meer efficiënte detectie plaatsvond in de periventriculaire regio en diepe witte stof. In een gering aantal letsels blijkt het programma een gebied te segmenteren dat de neuroradioloog niet als letsel beschouwt. Dit gebeurt in de hele dataset slechts bij 1 patiënt (waarbij twee letsels). De ingeschatte specificiteit is op het eerste zicht zeer hoog. Gezien geen True Negative maat kon bepaald worden, hebben we ons bij kwantitatieve analyse beperkt tot het bepalen van een sensitiviteit, positief predictieve waarde en false detection rate. Accuraatheid en specificiteit konden niet bepaald worden. Wel hebben we gewerkt met de DICE-coëfficiënt.66 De DICE-coëfficiënt houdt rekening met zowel False
Positives als False Negatives, maar door dubbele weging van de True Positives leunt het meer aan tegen de sensitiviteit dan de specificiteit. De globale sensitiviteit van detectie van letsels over de volledige hersenen ligt op 0,49 wanneer vergeleken met het radiologisch protocol. Echter we kunnen veronderstellen dat ook door de radioloog letsels kunnen gemist worden, dus vermoedelijk ligt de werkelijke sensitiviteit nog lager. Berekening van de positief predictieve waarde leverde cijfers die zeer sterk bij 1 lagen (0,99). Deze hoge waarde is niet verwonderlijk gezien van de 148 gesegmenteerde letsels slechts 2 als vals positief werden beoordeeld. De positief predictieve waarde is rechtevenredig met enerzijds de prevalentie van het positief testresultaat en 44
anderzijds de specificiteit van de test, dus is het realistisch om de specificiteit op basis van deze cijfers als zeer hoog in te schatten. Complementair met de positief predictieve waarde is de false detection rate zeer laag (0,01). De DICE-coëfficiënt geeft door dubbele weging van de True Positives en zeer geringe False Positives een hogere waarde (0,66) dan de sensitiviteit. De berekeningen werden herhaald voor de afzonderlijke regio’s van de hersenen. De sensitiviteit was het hoogst in de periventriculaire regio (0,68) gevolgd door de diepe witte stof (0,51), juxtacorticaal (0,39) en infratentorieel (0,00). De DICE vertoonde gelijkaardige rangschikking met een maximum van 0,80 voor periventriculair en nihil voor de infratentoriële regio. Alle regio’s, uitgenomen de infratentoriële, toonden een zeer hoge positief predictieve waarde. Bij visuele beoordeling werd opgemerkt dat de beeldensets verschillend waren in kwaliteit (onafgezien van verschillen in magneetsterkte). Van 3 patiënten is het FLAIR beeldcontrast beperkt en 2 patiënten hebben een vervormde weergave van MPRAGE. Wat aan de basis ligt van deze verschillende kwaliteit is ons niet duidelijk. Bij visuele beoordeling leek het erop dat de segmentatie minder efficiënt is op deze beelden, met vooral een minder goede inschatting naar volume. Puur op de lesion count vinden we minder effect van de beeldkwaliteit. De kwantitatieve analyse levert voor de groep met de ‘slechte’ FLAIR een sensitiviteit op van 0,44. De sensitiviteit voor de groep na exclusie van de vijf patiënten bedroeg 0,50. Dit verschil is niet significant (P = 0,64). Bij patiënten met vervormde MPRAGE weergave vinden we een sensitiviteit van 0,53, wat hoger is dan bij de rest van de patiënten. Echter ook dit resultaat is niet significant (P = 0,79). Globaal besluiten we dat als de beeldkwaliteit de segmentatie van de beelden beïnvloedt, onze dataset te klein is om dit aan te tonen. Zoals eerder aangehaald is de kwantitatieve beoordeling volledig gestoeld op data die op het zicht werd bekomen, zij het in consensus tussen een ervaren neuroradioloog en de twee thesisstudenten. Gezien in de diagnostische criteria nergens nog een duiding bestaat van het volume van de letsels en er tot op heden geen rekening wordt gehouden met de ‘lesion load’ (totaal letselvolume) besloten we af te zien van het idee om de letsels snede per snede af te lijnen. Achteraf gezien hadden we dat beter wel gedaan. Een 3D-rendering van deze aflijningen zou ons immers een VOI-map (volume of interest) hebben opgeleverd, waarna wel een automatische telling mogelijk was geweest. Een vergelijking met de automatisch bekomen telling van de lesion map zou een meer betrouwbaar beeld hebben gegeven met een 45
kleinere foutmarge. Bovendien zou de VOI-map een bepaling van de True Negative maat mogelijk hebben gemaakt (totale voxels – VOI), wat op zijn beurt toelaat om specificiteit en accuraatheid te berekenen. Ook het opstellen van een ROC-curve en meer accurate bepaling van de kappa was dan mogelijk geweest. Uiteindelijk is het de bedoeling om de toepasbaarheid van het algoritme in de dagelijkse praktijk te bestuderen. Om een idee te krijgen over de invulling van zowel DIT als DIS criteria was het de bedoeling om zoveel mogelijk consecutieve beeldensets te bekomen. Helaas hebben de vereisten qua acquisities en de overige selectiecriteria dit belet. Om deze redenen is het quasi onmogelijk om uitspraken te doen over DIT volgens de 2005 criteria. De simultane presentatie van een T2 en een T1Gd letsel bij sommige patiënten laat toe om volgens de 2010 criteria de DIT te weerhouden, maar voor de overige patiënten zijn geen uitspraken mogelijk. De contrastcapterende letsels zijn wel goed gedetecteerd. De doeltreffendheid van het programma voor wat betreft invulling van de DIS criteria hebben we wel kunnen bestuderen. Echter ook hierin zijn beperkingen te vinden. Ten eerste is het programma niet ontworpen voor segmentatie van het ruggenmerg, dat in 2005 als volwaardige regio werd opgenomen in de criteria. Wij zien ons genoodzaakt deze hele regio te negeren. De 2010 criteria zullen ongetwijfeld aan gevoeligheid verliezen wanneer 1 van de 4 regio’s niet in beschouwing wordt genomen, wat deels verklaart waarom niet al onze studiepatiënten aan DIS voldoen in onze beperkte beschouwing. Niettemin is deze beperkte invulling van DIS toch waardevol. Het geeft immers een idee van het effect van de implementatie van LST in de dagelijkse praktijk en toont direct zijn grootste beperkingen. Toepassing van LST met de 2005 criteria impliceert dat criterium 2 (minstens één infratentorieel letsel) helemaal niet meer kan worden vervuld wegens een sensitiviteit = 0. De globale gevoeligheid van letseldetectie van 0,49 zorgt ervoor dat criterium 1 (meer dan 9 T2 hyperintense letsels of 1 Gd-kleurend letsel) in een groot aantal patiënten niet meer kan worden vervuld. Criterium 3 (minstens 1 juxtacorticaal letsel) wordt van alle criteria het meest efficiënt bevestigd, gevolgd door criterium 4 (minstens 3 periventriculaire letsels). Dat criterium 3 met hogere gevoeligheid wordt voldaan dan criterium 4 is schijnbaar in tegenstelling met de kwantitatieve gegevens. Dit is echter te verklaren op basis van een strengere afkapwaarde voor de periventriculaire letsels; men vereiste 3 periventriculaire en slechts 1 juxtacorticaal letsel.
46
Met de radiologische protocollering als standaard vertoont LST een gevoeligheid van 0,56 om de 2005 Barkhofcriteria te vervullen. Grofweg kan een positieve DIS op het radiologisch verslag dus in iets meer dan de helft van de gevallen worden gereproduceerd door LST toepassing alleen. Toepassing van LST met de 2010 criteria geeft grosso modo dezelfde bevindingen als de kwantitatieve analyse gezien de indeling niet echt in criteria maar eerder volgens ingenomen regio’s is. De letsels in de periventriculaire regio worden het meest efficiënt ontdekt, gevolgd door juxtacorticale letsels. Infratentorieel worden geen letsels aangetroffen dus inname van de hersenstam en het cerebellum is niet te ontdekken. Detectie van spinale letsels is helemaal onmogelijk. In de literatuur is te vinden dat de 2010 radiologische criteria gevoeliger zijn dan die van 2005.7,67 Temeer, zelfs bij radiologische protocollering met negeren van het ruggenmerg als vierde regio wordt nog steeds een hogere gevoeligheid gevonden. Bij segmentatie met LST
wordt zowel de spinale regio als de infratentoriële regio niet meer in rekening gehouden. Dit betekent dat zowel in de juxtacorticale als periventriculaire regio letsels moeten gevonden worden om nog aan 2 van de 4 criteria te voldoen. Desondanks, met de radiologische protocollering als standaard, vertoont LST een gevoeligheid van 0,76 om de 2010 Swantoncriteria te vervullen. Grofweg kan een positieve DIS op het radiologisch verslag dus in iets meer dan drie op vier gevallen worden gereproduceerd door LST toepassing alleen. De efficiëntie voor het aantonen van DIS lijkt dus toch hoger te zijn wanneer men LST toepast op de 2010 criteria, dan op de 2005 criteria. Dit resultaat is echter niet significant (P = 0,10).
Conclusie In antwoord op de gestelde onderzoeksvragen kan men ten eerste aanhalen dat LST de diagnostische gevoeligheid van de radioloog niet kan evenaren, zowel op gebied van tellen van de letsels, als van correct aflijnen van hun volume. De lesion count wordt slechts voor de helft benaderd. Bij toepassing van de diagnostische criteria wordt een iets optimistischer beeld geschetst en dit vooral wanneer de eenvoudige en gevoelige 2010 criteria worden gebruikt.7
We hebben geen verschil kunnen vinden in doeltreffendheid op basis van de beeldkwaliteit.
In deze thesis hebben we dus niet direct kunnen aantonen dat LST als segmentatie-algoritme een plaats toebehoort in de dagelijkse praktijk. Hiervoor is het programma niet gevoelig genoeg en kan het niet voldoende radiologische criteria invullen bij patiënten met gekende MS. Deze besluiten formuleren we met grote zekerheid ondanks vele beperkingen in de 47
gehanteerde methodologie van de studie. De voornaamste bijdrage van de thesis is een denkoefening rond hoe men een segmentatie-algoritme als LST moet bestuderen en naar waarde inschatten. Op deze wijze kunnen dit soort experimenten in de toekomst vlotter en betrouwbaarder verlopen. Ondanks het feit dat in de kliniek niet met lesion load wordt gewerkt raden we toch aan om in de toekomst manueel ‘regions of interest’ af te lijnen, waaruit men een 3D voxel map genereert, gelijkaardig aan de output van het programma. Vertrekkend van deze twee 3D maps (manuele en segmentatie lesion map) kan men op meer gestandaardiseerde wijze de data inwinnen. Men kan automatische tellingen laten uitvoeren en graad van overlap bepalen. Zo is er minder ‘human error’ betrokken bij het proces. De vier categorieën kunnen bepaald worden (TN, TP, FN en FP), wat alle mogelijkheden van het Theorema van Bayes openlaat. Het optimum van de afkapwaarde van het programma kan bepaald worden door een ROC-curve uit te zetten. De DICE-coëfficiënt die wij hanteren is een vrij goede benadering van accuraatheid maar is iets meer gebiast, daar het meer een idee geeft van gevoeligheid dan van specificiteit. Zo men over een True Negative beschikt is een accuraatheid dus te verkiezen boven een DICE-coëfficiënt. In retrospect zouden wij dus veel wijzigingen aanbrengen in de methodologie van het onderzoek, maar zoals eerder aangehaald is het besluit toch weinig betwistbaar omwille van duidelijke tekortkomingen van het programma ter sprake. Gezien MS een aandoening is die per definitie het potentieel heeft tot zeer wijdverspreide aantasting van het centraal zenuwstelsel en een CIS patiënt een geïsoleerd letsel kan hebben in elk van de afzonderlijke delen van het CZS, lijkt het ons ongeoorloofd om een methode te hanteren die zo sterk verschilt in gevoeligheid tussen de regio’s van de hersenen en anderzijds het ruggenmerg helemaal niet beschouwt. Aanpassingen aan het algoritme dienen zowel de globale detectiegevoeligheid te verhogen als de grote verschillen in detectiegraad tussen de hersenregio’s op te heffen. Alleen dan kan LST of een ander segmentatie-algoritme zijn ingang vinden in de praktijk.
48
Referentielijst (1) Schumacher GA, Beebe G, et al. Problems of experimental trials of therapy in multiple sclerosis. Ann NY Acad Sci 1965; 122: 552-568. (2) McDonald WI, Compston A, et al. Recommended diagnostic criteria for Multiple Sclerosis: Guidelines from the international panel on the diagnosis of Multiple Sclerosis. Ann Neurol 2001; 50(1): 121-127. (3) Jacobs LD, Beck RW, et al. . CHAMPS Study Group. Intramuscular interferon β-1a therapy initiated during a first demyelinating event in multiple sclerosis. N Engl J Med 2000;343:898–904. (4) Comi G, Filippi M, et al. ETOMS Study Group. Effect of early interferon treatment on conversion to definite multiple sclerosis: a randomised study. Lancet 2001;357:1576–1582. (5) Diener HC, Nitschmann. PRECISE Study Group. S. Glatiramerazetat bei Patienten mit klinisch isoliertem MS-typischem Syndrom. Internist 2010; 51: 793–794 (6) Kappos L, Polman CH, et al. BENEFIT Study Group. Treatment with interferon β-1b delays conversion to clinically definite and McDonald MS in patients with clinically isolated syndromes. Neurology 2006;67:1242–1249. (7) Polman CH, Reingold SC, et al. Diagnostic criteria for Multiple Sclerosis: 2010 revisions to the McDonald criteria. Ann Neurol 2012; 69(2): 292-302. (8) Ebers GC. Environmental factors and Multiple Sclerosis. Lancet Neurology 2008; 7(3): 268-277. (9) Compston A. The 150th anniversary of the first depiction of the lesions of multiple sclerosis. Journal of neurology, neurosurgery and psychiatry 1988; 51(10): 1249-1252. (10) Miller D, Barkhof F, et al. Clinically Isolated Syndromes suggestive of Multiple Sclerosis, part I: natural history, pathogenesis, diagnosis and prognosis. Lancet Neurol 2005; 4(5): 281-288. (11) Charcot JM. Histologie de la Sclérose en plaques, leçon faite à l’hospice de la Salpetrière par M Charcot et recueillie par M Bourneville. 1869. (12) Poser CM, Brinar VV. Diagnostic criteria for Multiple Sclerosis: an historical review. Clinical Neurology and Neurosurgery 2004; 106(3): 147-158. (13) Murray TJ. Diagnosis and treatment of Multiple Sclerosis. BMJ 2006; 332(7540): 525-527. (14) Miller DH, Chard DT, et al. Clinically Isolated Syndromes. Lancet Neurology 2012; 11(2): 157-169. (15) Miller D, Barkhof F, et al. Clinically Isolated Syndromes suggestive of Multiple Sclerosis, part 2: nonconventional MRI, recovery process and management. Lancet Neurol 2005; 4(6): 341-348. (16) Antel J, Antel S. Primary Progressive Multiple Sclerosis: part of the MS disease spectrum or separate disease entity? Acta Neuropathol 2012; 123(5): 627-638. (17) Debruyne J, Philippé J, et al. Relapse markers in Multiple Sclerosis: are in vitro cytokine production changes reflected by circulatory T-cell phenotype alterations? Multiple Sclerosis 1998; 4(3): 193-197. (18) Kurtzke JF. Disability rating scales in Multiple Sclerosis. Ann NY Acad Sci 1984; 436: 347-360. (19) Pugliatti M, Rosati G, et al. . The epidemiology of multiple sclerosis in Europe. European Journal of Neurology 2006, 13: 700–722 (20) McElroy JP, Oksenberg JR. Multiple Sclerosis. Genetics 2010. Neurol Clin 29 (2011) 219–231 (21) Kakalacheva K, Münz C, et al. Viral triggers of Multiple Sclerosis. Biochimica et Biophysica Acta 2011; 1812(2): 132-140. (22) Ascherio A, Munger KL. Environmental Risk Factors for Multiple Sclerosis. Part II: Noninfectious Factors. Ann Neurol 2007;61:504–513 (23) Ascherio A, Munger KL. Environmental Risk Factors for Multiple Sclerosis. Part I: The Role of Infection. Ann Neurol 2007;61:288–299 (24) Vukusic S, Hutchinson M, et al. Pregnancy and multiple sclerosis (the PRIMS study): clinical predictors of post-partum relapse. Brain 2004;127(Pt 6):1353–60 (25) Putnam TJ. Multiple sclerosis en ‘encephalomyelitis’. Bull NY Acad Med 1943; 19(5): 301-316 (26) Whiting P, Harhord R, et al. Accuracy of Magnetic resonance imaging for the diagnosis of multiple sclerosis: systematic review. BMJ 2006; 332(7546): 875-884. (27) Young IR, Hall AS, et al. Nuclear Magnetic Resonance imaging of the brain in Multiple Sclerosis. The Lancet 1981; 2(8255): 1063-1066.
49
(28) Achten E, Deblaere K, et al. Health Techology Assessment on the use of Magnetic Resonance Imaging and Computed Tomography in the diagnosis of Multiple Sclerosis (MS) and Clinically Isolated Syndromes (CIS). Eur J Radiology 2008; 65(2): 211-213. (29) Miller D, Weinshenker BG, et al. Differential diagnosis of suspected multiple sclerosis: a consensus approach. Multiple Sclerosis 2008; 14: 1157-1174 (30) Schäffler N, Köpke S, et al. Accuracy of diagnostic tests in multiple sclerosis – a systematic review. Acta Neurologica Scandinavia 2011; 124(3): 151-154. (31) Fazekas F, Offenbacher H, et al. Criteria for an increased specificity of MRI interpretations in elderly subjects with suspected Multiple Sclerosis. Neurology 1988; 38(12): 1822-825. (32) Barkhof F, Filippi M, et al. Comparison of MRI criteria at first presentation to predict conversion to clinically definite Multiple Sclerosis. Brain 1997; 120(11): 2059-2069. (33) Tintoré M, Rovira A, et al. Isolated demyelinating syndromes: comparison of different MR imaging criteria to predict conversion to clinically definite Multiple Sclerosis. Am J Neuroradiol 2000; 21(4): 702-706. (34) Charil A, Yousnef TA, et al. MRI and the diagnosis of multiple sclerosis: expanding the concept of “no better explanation”. Lancet Neurol 2006; 5(10): 841-852. (35) Polman CH, Reingold SC, et al. Diagnostic criteria for Multiple Sclerosis: 2005 revision to the McDonald criteria. Ann Neurology 2005; 58(6): 840-846. (36) Dalton CM, Brex PA, et al. New T2 lesions enable an earlier diagnosis of Multiple Sclerosis in clinically Isolated Syndromes. Ann Neurol 2003; 53(5): 673-676. (37) Rovira A, Swanton J, et al. A single, early Magnetic Resonance Imaging Study in the diagnosis of Multiple Sclerosis. Arch Neurol 2009; 66(5): 587-592. (38) Van Oosten BW. Multiple sclerose en aanverwante aandoeningen. In KLINISCHE NEUROLOGIE, Eds. Kuks JB, Snoek JW. Bohn Stafleu van Loghum, Houten, 2012; 359-368 (39) Debruyne J. Inflammatoire parameters van ziekteactiviteit bij multiple sclerose: immunologische en positron emissie tomografische studie. PROEFSCHRIFT ter verkrijging van de graad van Doctor in de Medische Wetenschappen, Universiteit Gent, 2004; 9-27 (40) Tremlett HL, Luscombe DK, et al. Use of corticosteroids in multiple sclerosis by consultant neurologists in the United Kingdom. J Neurol Neurosurg Psychiatry 1998; 65: 362-365 (41) Barnes D, Hughes RA, et al. Randomised trial of oral and intravenous methylprednisolone in acute relapses of multiple sclerosis. Lancet 1997; 349: 902-906 (42) Tsang B, Macdonell R. Multiple sclerosis - diagnosis, management and prognosis. Australian Family Physician Vol. 40, No. 12, December 2011 (43) Belgisch centrum voor farmacotherapeutische informatie. Gecommentarieerd geneesmiddelenrepertorium 2012. JM Maloteaux, Brussel, 2012. (44) Tintoré M. Rationale for early intervention with immunomodulatory treatments. J Neurol 2008; 255 [Suppl 1]:37–43 (45) O'Connor P, Filippi M et al. BEYOND trial. 250 microg or 500 microg interferon beta-1b versus 20 mg glatiramer acetate in relapsing-remitting multiple sclerosis: a prospective, randomised, multicentre study. Lancet Neurol. 2009 Oct;8(10):889-97. (46) Mikol DD, Barkhof F, et al. Comparison of subcutaneous interferon beta-1A with Glatiramer Acetate in patients with relapsing multiple sclerosis (the REBIF vs Glatiramer Acetate in Relapsing MS Disease [REGARD] study): a multicentre, randomized, parallel, open-label trial. Lancet Neurol 2008; 7(10): 903-914. (47) EMEA: Tysabri: EPAR - Product Information. Online 2009. opgehaald op 18 juli 2012, van http://www.ema.europa.eu/docs/en_GB/document_library/EPAR__Product_Information/human/000603/WC500044686.pdf (48) Polman CH, O’Connor PW, et al; AFFIRM study group A randomized Placebo-controlled trial of Natalizumab for Relapsing-Remitting Multiple Sclerosis. NEJM 2006; 354(9): 899-910. (49) Belachew S, Phan-Ba R, et al; MYDREAM study group. Natalizumab induces a rapid improvement of disability status and ambulation after failure of previous therapy in relapsing-remitting multiple sclerosis. European Journal of Neurology 2011; 18: 240–245
50
(50) Kappos L, Radue EW, et al; FREEDOMS Study Group. A placebo-controlled trial of oral fingolimod in relapsing multiple sclerosis. NEJM 2010;362:387–401. (51) Foster CA, Howard LM, et al. Brain penetration of the oral immunomodulatory drug FTY720 and its phosphorylation in the central nervous system during experimental autoimmune encephalomyelitis: for mode of action in multiple sclerosis. J Pharmacol Exp Ther 2007; 323: 469-75. (52) Coelho RP, Payne SG, et al. The immunomodulator FTY720 has a direct cytoprotective effect in oligodendrocyte progenitors. J Pharmacol Exp Ther 2007; 323: 626-35. (53) Cohen JA, Barkhof F, et al; TRANSFORMS Study Group. Oral fingolimod or intramuscular interferon for relapsing multiple sclerosis. NEJM 2010;362:402–415. (54) Kappos L, Li D, et al. Ocrelizumab in relapsing-remitting multiple sclerosis: a phase 2, randomised, placebo-controlled, multicentre trial. Lancet 2011; 378: 1779–87 (55) Cohen JA, Coles AJ, et al; CARE-MS I study group. Alemtuzumab versus interferon beta 1a as firstline treatment for patients with relapsing-remitting multiple sclerosis: a randomised controlled phase 3 trial. Lancet. 2012 Nov 24;380(9856):1819-28. (56) Coles AJ, Twyman CL, et al; CARE-MS II study group. Alemtuzumab for patients with relapsing multiple sclerosis after disease-modifying therapy: a randomised controlled phase 3 trial. Lancet. 2012 Nov 24;380(9856):1829-39. (57) O’Connor P, Wolinsky JS, et al; TEMSO Trial Group. Randomized trial of oral teriflunomide for relapsing multiple sclerosis.. N Engl J Med. 2011 Oct 6;365(14):1293-303 (58) Turetschek K, Wunderbaldinger P, et al. Double Inversion Recovery image of the brain: initial experience and comparison with Fluid Attenuated Inversion Recovery imaging. Magnetic Resonance Imaging 1998; 16(2): 127-135. (59) Wattjes MP, Lutterbey GG, et al. Double Inversion Recovery brain imaging at 3T: diagnostic value in the detection of Multiple Sclerosis lesions. AJNR 2007; 28(1):54-59. (60) Geurts JJ, Rosendaal SD, et al. Consensus recommendations for MS cortical lesion scoring using Double Inversion Recovery. Neurology 2011; 76(5): 418-424. (61) Simon B, Schmidt S, et al. Improved in vivo detection of cortical lesions in multiple sclerosis using Double Inversion Recovery MR imaging at 3 Tesla. Eur Radiol 2010; 20: 1675-1683. (62) De Graaf WL, Zwanenbrug JJ, et al. Lesion detection at seven Tesla in multiple sclerosis using magnetization prepared 3D-FLAIR and 3D-DIR. Eur Radiol 2011; 22(1): 221-231. (63) Filippi M, Rocca MA, et al. Increased spatial resolution using a three-dimensional T1-weighted Gradient-Echo MR sequence results in greater hypointense lesion volumes in Multiple Sclerosis. AJNR 1998; 19: 235-238. (64) Grigoriadis N, Ben-Hur T, et al. Axonal damage in multiple sclerosis: a complex issue in a complex disease. Clinical Neurology and Neurosurgery 2004; 106(3):211-217. (65) Shiee N, Bazin PL, et al. A Topology-preserving approach to the segmentation of brain images with Multiple Sclerosis lesions. Neuroimage 2010; 49(2): 1524-1532. (66) Schmidt P, Gaser C, et al. An automated tool for detection of FLAIR-hyperintense white-matter lesions in multiple sclerosis. Neuroimage 2012; 59: 3774-3783. (67) Swanton J, Fernando K, et al. Modification of MRI criteria for Multiple Sclerosis in patients with clinically isolated syndromes. J Neurol Neurosurg Psychiatry 2006; 77(7): 830-833. (68) Wu GF, Alvarez E, et al. The Immunopathophysiology of multiple sclerosis. Neurol Clin 2011; 29(2): 257-278.
51
Bijlages 1. Appendix A: Gebruikte afkortingen Acc AL ALS AUC BBB Cb CDMS CIS Cll CSF CSZS CT DB DICE DIR DIS DIT DMD DWM EBV EDSS ELISA EPD FDR FLAIR FN FP FS GA Gd GIFMI GM H IACL IFN IgG IR IT JC-virus JC LST
Accuraatheid Antilichamen Amytrofe Lateraal Sclerose Area Under the Curve Blood-Brain Barrier Cerebraal Clinically Definite MS Clinically Isolated Syndrome Cerebellair Cerebrospinal Fluid Computer Tomografie Centraal Zenuwstelsel Darm en Blaas Dice-coëfficiënt Double Inversion Recovery Dissemination in Space Dissemination in Time Disease Modifying Drugs Diepe Witte Stof Ebstein-Barr Virus Expanded Disability Status Score Enzyme-Linked Immuno Sorbent Assay Elektronisch Patiëntendossier False Discovery Rate Fluid-Attenuated Inversion Recovery False Negative False Positive Functionele Systemen Glatirameer Acetaat Gadolinium Ghent Institute for Functional and Metabolic Imaging Grey Matter Hersenstam Image Analysis and Communications Lab Interferon Immunoglobuline G Inversion recovery Infratentorieel John Cunningham virus Juxtacorticaal Lesion Segmentation Tool 52
MAGNIMS MIPAV MNI MPRAGE MR/MRI MRF MS NIH O P PC PET PML PPMS PPV PV PVE RF ROC RRMS S S sens spec SPM SPMS T1Gd T2W TI TN TOADS TP V VBM VEP VOI WM
Magnetic Resonance Imaging in MS Medical Image Processing, Analysis and Visualisation Montreal Neurological Institute Magnetization Preparation Rapid Acquisition Gradient Echo Magnetic Resonance Imaging Markov Random Field Multiple Sclerose National Institutes of Health Andere Pyramidaal Personal Computer Positronemissietomografie Progressieve Multifocale Leuko-encefalopathie Primair Progressieve MS Positief Predictieve Waarde Periventriculair Partial Volume Estimate radiofrequente reciever operating characteristic Relapsing Remitting MS Sensorisch Spinaal Sensitiviteit Specificiteit Statistical Parametric Mapping Secundair Progressieve MS T1 met Gadolinium T2-gewogen Inversion Time True Negative Topology-preserving Anatomy-Driven Segmentation True Positive Visueel Voxel-Based Morphometry Visual Evoked Potential Volume Of Interest White Matter
53
2. Appendix B: EDSS en FSS Kurtzke Expanded Disability Status Scale (EDSS) 𝟏,𝟐 ❏ 0.0 - Normal neurological exam (all grade 0 in all Functional System (FS) scores*). ❏ 1.0 - No disability, minimal signs in one FS* (i.e., grade 1). ❏ 1.5 - No disability, minimal signs in more than one FS* (more than 1 FS grade 1). ❏ 2.0 - Minimal disability in one FS (one FS grade 2, others 0 or 1). ❏ 2.5 - Minimal disability in two FS (two FS grade 2, others 0 or 1). ❏ 3.0 - Moderate disability in one FS (one FS grade 3, others 0 or 1) or mild disability in three or four FS (three or four FS grade 2, others 0 or 1) though fully ambulatory. ❏ 3.5 - Fully ambulatory but with moderate disability in one FS (one grade 3) and one or two FS grade 2; or two FS grade 3 (others 0 or 1) or five grade 2 (others 0 or 1). ❏ 4.0 - Fully ambulatory without aid, self-sufficient, up and about some 12 hours a day despite relatively severe disability consisting of one FS grade 4 (others 0 or 1), or combination of lesser grades exceeding limits of previous steps; able to walk without aid or rest some 500 meters. ❏ 4.5 - Fully ambulatory without aid, up and about much of the day, able to work a full day, may otherwise have some limitation of full activity or require minimal assistance; characterized by relatively severe disability usually consisting of one FS grade 4 (others or 1) or combinations of lesser grades exceeding limits of previous steps; able to walk without aid or rest some 300 meters. ❏ 5.0 - Ambulatory without aid or rest for about 200 meters; disability severe enough to impair full daily activities (e.g., to work a full day without special provisions); (Usual FS equivalents are one grade 5 alone, others 0 or 1; or combinations of lesser grades usually exceeding specifications for step 4.0). ❏ 5.5 - Ambulatory without aid for about 100 meters; disability severe enough to preclude full daily activities; (Usual FS equivalents are one grade 5 alone, others 0 or 1; or combination of lesser grades usually exceeding those for step 4.0). ❏ 6.0 - Intermittent or unilateral constant assistance (cane, crutch, brace) required to walk about 100 meters with or without resting; (Usual FS equivalents are combinations with more than two FS grade 3+). ❏ 6.5 - Constant bilateral assistance (canes, crutches, braces) required to walk about 20 meters without resting; (Usual FS equivalents are combinations with more than two FS grade 3+). ❏ 7.0 - Unable to walk beyond approximately 5 meters even with aid, essentially restricted to wheelchair; wheels self in standard wheelchair and transfers alone; up and about in wheelchair some 12 hours a day; (Usual FS equivalents are combinations with more than one FS grade 4+; very rarely pyramidal grade 5 alone).
54
❏ 7.5 - Unable to take more than a few steps; restricted to wheelchair; may need aid in transfer; wheels self but cannot carry on in standard wheelchair a full day; May require motorized wheelchair; (Usual FS equivalents are combinations with more than one FS grade 4+). ❏ 8.0 - Essentially restricted to bed or chair or perambulated in wheelchair, but may be out of bed itself much of the day; retains many self-care functions; generally has effective use of arms; (Usual FS equivalents are combinations, generally grade 4+ in several systems). ❏ 8.5 - Essentially restricted to bed much of day; has some effective use of arm(s); retains some self-care functions; (Usual FS equivalents are combinations, generally 4+ in several systems). ❏ 9.0 - Helpless bed patient; can communicate and eat; (Usual FS equivalents are combinations, mostly grade 4+). ❏ 9.5 - Totally helpless bed patient; unable to communicate effectively or eat/swallow; (Usual FS equivalents are combinations, almost all grade 4+). ❏ 10.0 - Death due to MS.
Kurtzke Functional Systems Scores (FSS) 𝟏,𝟐 ❏ Pyramidal Functions 0 - Normal 1 - Abnormal signs without disability 2 - Minimal disability 3 - Mild to moderate paraparesis or hemiparesis (detectable weakness but most function sustained for short periods, fatigue a problem); severe monoparesis (almost no function) 4 - Marked paraparesis or hemiparesis (function is difficult), moderate quadriparesis (function is decreased but can be sustained for short periods); or monoplegia 5 - Paraplegia, hemiplegia, or marked quadriparesis 6 - Quadriplegia 9 - (Unknown) ❏ Cerebellar Functions 0 - Normal 1 - Abnormal signs without disability 2 - Mild ataxia (tremor or clumsy movements easily seen, minor interference with function) 3 - Moderate truncal or limb ataxia (tremor or clumsy movements interfere with function in all shpheres) 4 - Severe ataxia in all limbs (most function is very difficult) 5 - Unable to perform coordinated movements due to ataxia 9 - (Unknown) ❏
Record #1 in small box when weakness (grade 3 or worse on pyramidal) interferes with testing.
❏ Brainstem Functions 0 - Normal 1 - Signs only 55
23459-
Moderate nystagmus or other mild disability Severe nystagmus, marked extraocular weakness, or moderate disability of other cranial nerves Marked dysarthria or other marked disability Inability to swallow or speak (Unknown)
❏ Sensory Function 0 - Normal 1 - Vibration or figure-writing decrease only in one or two limbs 2 - Mild decrease in touch or pain or position sense, and/or moderate decrease in vibration in one or two limbs; or vibratory (c/s figure writing) decrease alone in three or four limbs 3 - Moderate decrease in touch or pain or position sense, and/or essentially lost vibration in one or two limbs; or mild decrease in touch or pain and/or moderate decrease in all proprioceptive tests in three or four limbs 4 - Marked decrease in touch or pain or loss of proprioception, alone or combined, in one or two limbs; or moderate decrease in touch or pain and/or severe proprioceptive decrease in more than two limbs 5 - Loss (essentially) of sensation in one or two limbs; or moderate decrease in touch or pain and/or loss of proprioception for most of the body below the head 6 - Sensation essentially lost below the head 9 - (Unknown) ❏ Bowel and Bladder Function (Rate on the basis of the worse function, either bowel or bladder) 0 - Normal 1 - Mild urinary hesitance, urgency, or retention 2 - Moderate hesitance, urgency, retention of bowel or bladder, or rare urinary incontinence (intermittent self-catheterization, manual compression to evacuate bladder, or finger evacuation of stool) 3 - Frequent urinary incontinence 4 - In need of almost constant catheterization (and constant use of measures to evacuate stool) 5 - Loss of bladder function 6 - Loss of bowel and bladder function 9 - (Unknown) ❏ Visual Function 0 - Normal 1 - Scotoma with visual acuity (corrected) better than 20/30 2 - Worse eye with scotoma with maximal visual acuity (corrected) of 20/30–20/59 3 - Worse eye with large scotoma, or moderate decrease in fields, but with maximal visual acuity (corrected) of 20/60–20/99 4 - Worse eye with marked decrease of fields and maximal visual acuity (corrected) of 20/100 20/200; grade 3 plus maximal acuity of better eye of 20/60 or less 5 - Worse eye with maximal visual acuity (corrected) less than 20/200; grade 4 plus maximal acuity of better eye of 20/60 or less 6 - Grade 5 plus maximal visual acuity of better eye of 20/60 or less 9 - (Unknown) 56
❏
Record #1 in small box for presence of temporal pallor
❏ Cerebral (or Mental) Functions 0 - Normal 1 - Mood alteration only (does not affect EDSS score) 2 - Mild decrease in mentation 3 - Moderate decrease in mentation 4 - Marked decrease in mentation (chronic brain syndrome – moderate) 5 - Dementia or chronic brain syndrome – severe or incompetent 9 - (Unknown)
Referenties: (1) Kurtzke JF. Rating neurologic impairment in multiple sclerosis: an expanded disability status scale (EDSS). Neurology. 1983 Nov;33(11):1444-52. (2) Haber A, LaRocca NG. eds. Minimal Record of Disability for multiple sclerosis. New York: National Multiple Sclerosis Society; 1985.
57
3. Appendix C: 100 aandoeningen in de differentiaal diagnose van MS 𝟏 MS Variants – Other White Matter Disease 1. Monosymptomatic demyelination = Isolated TM, ON, etc. 2. Balo’s concentric sclerosis 3. Schilder’s disease = Myelinoclastic diffuse sclerosis 4. Tumefactive MS 5. Marburg disease 6. Devic’s disease = Neuromyelitis optica 7. ADEM 8. CIDP or Guillain-Barre 9. Bickerstaff’s brainstem encephalitis 10. Subacute myelo-optic neuritis (SMON) Inflammatory/Rheumatologic 11. Eale’s syndrome 12. Bechet’s disease 13. Sarcoid 14. Sjogren’s disease 15. Lupus 16. Eosinophilia-myalgia syndrome 17. Systemic sclerosis (Scleroderma) Vascular 18. Uveitis 19. Anterior ischemic optic neuropathy 20. Cogan’s disease 21. Susac’s disease 22. Sneddon’s disease 23. Degos disease 24. CNS vasculitis 25. Antiphospholipid antibody syndrome 26. Central serous chorioretinopathy 27. Stroke in the young – venousocclusion, emboli, etc. 28. Migraine 29. Binswanger’s or leukoariosis 58
30. Neuroretinitis 31. Familial cavernous hemangiomata 32. Thrombotic thrombocytopenic purpura Infections 33. PML 34. Whipple’s disease 35. HTLV-1 myelopathy 36. Lyme disease 37. Syphilis 38. HIV 39. New variant Creutzfeldt-Jacob 40. Brucellosis 41. SSPE 42. HHV-6 herpes virus 43. Hepatitis C 44. Mycoplasma Degenerative/Metabolic 45. Central pontine myelinolysis 46. Hashimoto’s encephalopathy 47. Vitamin B12 deficiency 48. Folate deficiency 49. Celiac disease = gluten sensitivity or sprue 50. ALS 51. Primary lateral sclerosis Genetic 52. Adrenoleukodystrophy 53. Metachromatic leukodystrophy 54. Krabbe’s = Globoid cell leukodystrophy 55. Fabry’s disease 56. Adult onset autosomal dominant leukodystrophy 57. Organic acidemias 58. Spinocerebellar ataxias 59. Friedreich’s ataxia 60. OPCA 59
61. Mitochondrial cytopathies =MELAS, MERFF 62. NARP = Neuropathy, Ataxia, Retinitis Pigmentosa 63. MNGIE = Mitochondrial Neuro-Gastrointestinal Encephalopathy 64. Leber’s hereditary optic neuropathy 65. Leigh’s syndrome 66. Usher’s syndrome 67. CADASIL 68. CRV = CerebroRetinal Vasculopathy 69. HERNS = Hereditary Endotheliopathy, Retinopathy, Nephropathy, & Stroke 70. Wilson’s disease 71. Adult polyglusan body disease 72. Hereditary spastic paraparesis 73. Porphyria 74. Vitamin E deficiency 75. Abetalipoproteinemia Oncological 76. CNS lymphoma 77. Intravascular lymphoma = Malignant angioendotheliomatosis 78. Paraneoplastic syndromes 79. Leukoencephalopathy after chemotherapy or radiation 80. Glioblastoma 81. Spinal tumor Psychiatric Disease 82. Somatization disorder 83. Conversion disorder 84. Hypochondriasis 85. Other – psychiatric syndromes Structural Disease 86. Spondylosis 87. Chiari malformation 88. Syringomyelia 89. Spinal AVM 90. Arachnoiditis 91. Foramen magnum and clivus lesions 60
92. Isolated cranial nerve palsies = Bell’s palsy, abducens palsy, etc. Toxins/Miscellaneous 93. Drugs = prescription or abuse 94. Environmental toxins = heavy metals, benzene, etc. 95. Periventricular leukomalacia 96. Migratory sensory neuritis 97. Chronic fatigue syndrome and fibromyalgia 98. Myasthenia gravis 99. Progressive necrotic myelopathy 100. Normal
Referenties: (1) Fleming JO, Diagnosis and Management of Multiple Sclerosis. New York: Professional Communications Incorporated. 2002.
61
4. Appendix D: Tabel besluiten letselscoring Tabel: Besluiten bij letselscoring wat betreft beeldkwaliteit en globale prestatie van het algoritme. Patiëntnr. Besluitvorming casus Opmerkingen Magneetsterkte beeldvorming Patiënt 3 Grote hyperintense letsels zijn 1,5T gedetecteerd, meerdere kleine letsels zijn gemist. Patiënt 5 Diffuse aantasting, weinig gedefinieerde 3T letsels niet gevonden. Scherp afgelijnde diepe witte stofletsels goed gevonden. Patiënt 6 Hyperintense en scherp begrensde letsels. 3T Goed gesegmenteerd naar volume. Patiënt 8 Hoge lesion count. Goede detectie van 3T periventriculaire letsels. Vagere letsels blijven ongedetecteerd. Patiënt 9 Volumetrisch onvolledige detectie. Groot Vervorming van de 1,5T corticaal letsel gemist. Pons, cerebellair en coronale en axiale trigeminaal letsel gemist. MPRAGE Patiënt 10 Verscheidene kleine letsels in de vier 1,5T regio’s, GEEN detectie. Patiënt 13 Periventriculaire letsels zeer gebrekkig 3T gesegmenteerd. Letselcomplex in de diepe witte stof zeer volledig gesegmenteerd. Patiënt 14 Verschillende witte stofletsels volledig Slechte FLAIR 3T ongedetecteerd. Eén wittestofletsel thv de beeldkwaliteit met matig ventriculaire voorhoorn is gesegmenteerd , onderscheid witte-grijze echter met een verschuiving tot in het stof ventrikel! Patiënt 15 Temporaal letselcomplex zeer matig Vervorming van de 1,5T afgegrensd. Andere letsels onvolledig coronale en axiale ingevuld. Verschillende letsels gemist. MPRAGE Infratentoriële letsels gemist. Patiënt 16 Periventriculaire cluster van letsels, 1,5T waarvan 1 gedetecteerd. Patiënt 17 Meer dan 50 letsels. Veel kleine diepe witte 3T stofletsels ongedetecteerd. Periventriculair betere detectie. Infratentorieel geen enkel letsel gedetecteerd. Patiënt 18 Zeer volledige segmentatie periventriculair Goede kwaliteit FLAIR 1,5T en diepe witte stof. Infratentorieel worden alle letsels gemist. Patiënt 19 Onvolledige detectie. Slechte detectie van 3T hyperintense doch onscherp begrensde letsels. Patiënt 20 1 juxtacorticaal letsel volledig gedetecteerd, 1,5T verscheidene andere kleine letsels gemist. Patiënt 21 Groot deel van de lesion count goed 1,5T gesegmenteerd. Juxtacorticaal en cerebellair weinig detectie. Patiënt 22 Grootste letsels zijn gedetecteerd doch veel Slechte beeldkwaliteit 3T te klein. FLAIR, mogelijk door bewegen
62
Patiënt 23
Patiënt 24
Patiënt 25
Patiënt 26 Patiënt 27
Patiënt 28
Zeer hoge lesion load. Verscheidene letsels goed gevonden, zelfs de kleine. Slechts enkele gemist. Er zijn op het zicht geen letsels te vinden. 2 periventriculaire regio’s werden op de binaire map aangekleurd, maar vermoedelijk zijn het vals positieven. Vage en kleine periventriculaire letsels alleen op 3D FLAIR te zien, hiervan geen enkele gedetecteerd. Onvolledige segmentatie naar volume. Infratentoriële letsels compleet gemist. Gevonden letsels zeer volledig gesegmenteerd, toch ook juxtacorticale letsels en periventriculaire letsels gemist. Weinig letsels gevonden en zeer onvolledig ingevuld.
1,5 T
1,5T
3T
1,5T Goede kwaliteit FLAIR
1,5 T
Mindere kwaliteit FLAIR, slechte begrenzing witte en grijze stof
1,5 T
63
5. Appendix E: Historisch overzicht van MS Multiple Sclerose wekte voor het eerst de aandacht van artsen in de loop van de negentiende eeuw en de kennis rond deze ziekte met ‘mysterieuze’ presentatie is sindsdien enorm toegenomen, doch grote vragen resteren. In de ‘atlas of pathology’ van Sir Robert Carswell (pathologieprofessor aan de universiteit van Londen anno 1836) wordt een foto en beschrijving weergegeven van een uitzonderlijk neurologisch specimen.1 In deze beschrijving
wordt gesproken van een pons en medulla spinalis die grijsachtige onregelmatige gebieden van atrofie vertonen; in het lumbaal ruggenmerg vond men verwekingen. Later zou de Franse patholoog Cruveilhier gelijkaardige specimens beschrijven en in de jaren erop verschenen verschillende pathologische studies van een gelijkaardige degeneratie van het centraal zenuwstelsel.1 Echter behalve een anatomo-pathologisch curiosum werd men van deze
casussen weinig wijzer en rond de praktische aspecten van de ziekte bleef alle informatie uit.
De beschrijving van het eerste duidelijk omkaderde geval van dit soort degeneratie gebeurde rond 1868 door de gekende patholoog Jean-Martin Charcot. Hem wordt de ‘ontdekking’ van MS toegeschreven omdat het de eerste was om pathologische veranderingen te beschrijven in relatie tot een ziektegeschiedenis.1,2 De naam die hij gebruikte om de entiteit te beschrijven was “Sclérose en plaques disseminée”, een naam die ons inziens tot op heden toepasselijk blijft. Hij beschreef de distributie van de letsels, hun scherpe begrenzing, afbraak van de myelineschede, gliosis en andere eigenschappen die relevant blijven. Zijn klinische beschrijving was minder detaillistisch en de casus in kwestie kende een snellere progressie dan de ‘benigne’ gevallen die hij later zou beschrijven en waarvan we nu weten dat ze een grote proportie van de populatie MS-patiënten uitmaken.2 Naar het voorbeeld van Charcot werd Multiple Sclerose nog lang beschreven als een ziekte van de witte stof, met demyeliniserende en inflammatoire kenmerken als voornaamste determinanten van hersen- en ruggenmergaantasting. Macroscopisch en op MRI zien we de zogenaamde verspreide plaques als focale zones van inflammatie. Qua etiologie werd een auto-immuunziekte weerhouden omwille van de sterke histologische immuuninvasie en omwille van een chronisch progressief verloop met opstoten.3
Vanaf de tweede helft van de 20e eeuw zijn verschillende diagnostische schemata vooropgesteld om de diagnose van MS te stellen. Een gemeenschappelijke factor in elk van 64
deze schemata is het tweelingprincipe DIS (Dissemination In Space) en DIT (Dissemination in Time). Deze zelfde principes blijven ook geldig na incorporatie van paraklinische tests als VEP (Visual Evoked Potentials) en lumbaalpunctie in de richtlijnen van Poser(1983).3
Ook in de jaren tachtig wordt veel onderzoek verricht naar beeldvormende technieken, in het bijzonder de magnetische resonantie beeldvorming (MRI) die vanaf 1981 voor het eerst werd toegepast en in 2001 in de nieuwe criteria werd opgenomen.5,6 De diagnose van MS blijft in essentie een klinische diagnose, maar MRI bevindingen werden aan de klinische bevindingen
toegevoegd om zo een snellere diagnose toe te laten. Bij gebrek aan een biologische parameter zoals bij neuromyelitis optica blijft het aspect van de differentiaaldiagnose belangrijk.7 Parallel aan de klinische richtlijnen blijft men de beeldvormende richtlijnen verfijnen tot een optimale combinatie van specificiteit en sensitiviteit wordt bekomen. De
beeldvorming zal nooit de rol van de clinicus kunnen verdringen, maar de complementariteit van beeldvorming en kliniek is essentieel bij het stellen van de MS-diagnose.
In de diagnosestelling is de laatste decaden veel veranderd, echter pas vanaf de jaren negentig is het belang hiervan sterk toegenomen met de ontwikkeling van immumodulerende therapieën.
Recentere
histochemische,
anatoompathologische
en
immunologische
bevindingen hebben gezorgd voor een snelle uitbreiding van het therapeutisch arsenaal, waarin de aandacht steeds meer ligt op vroege beperking van de ziekteprogressie.
Referenties: (1) Compston A. The 150th anniversary of the first depiction of the lesions of multiple sclerosis. Journal of neurology, neurosurgery and psychiatry 1988; 51(10): 1249-1252. (2) Charcot JM. Histologie de la Sclérose en plaques, leçon faite à l’hospice de la Salpetrière par M Charcot et recueillie par M Bourneville. 1869. (3) Phillippé J, Debruyne J. De immunologie van multiple sclerose. Tijdschr voor Geneeskunde 1999; 55: 1670-1675. (4) Poser CM, Brinar VV. Diagnostic criteria for Multiple Sclerosis: an historical review. Clinical Neurology and Neurosurgery 2004; 106(3): 147-158. (5) Achten E, Deblaere K, et al. Health Techology Assessment on the use of Magnetic Resonance Imaging and Computed Tomography in the diagnosis of Multiple Sclerosis (MS) and Clinically Isolated Syndromes (CIS). Eur J Radiology 2008; 65(2): 211-213. (6) Young IR, Hall AS, et al. Nuclear Magnetic Resonance imaging of the brain in Multiple Sclerosis. The Lancet 1981; 2(8255): 1063-1066. (7) Debruyne J, Philippé J, et al. Relapse markers in Multiple Sclerosis: are in vitro cytokine production changes reflected by circulatory T-cell phenotype alterations? Multiple Sclerosis 1998; 4(3): 193-197.
65
6. Appendix F: Histopathologie van MS De microscopische omschrijving van de MS plaques ging de klinische definitie ver vooraf.1,2 Naast
histologie zijn bijdrages geleverd door cytologie en immunohistochemie om meer precies de aard van de aantasting na te gaan. De meeste technieken worden toegepast op post-mortem hersenweefsel van MS-patiënten en biopsiemateriaal bij de uitwerking van de differentiaal diagnose, echter voor sommige immunopathologische en etiologische studies heeft men zijn toevlucht gezocht tot een diermodel (de Experimentele Autoimmune Encephalomyelitis : EAE).
Talloze observaties gaven nog geen sluitend antwoord rond de pathogenese van de ziekte. Vooral het chronisch verloop met opstoten en de initieel op de voorgrond staande invasie van immuuncomponenten duiden op auto-immuniteit. Maar er is nog geen definitieve consensus.3
De klassieke pathologische beschrijving door Charcot omstreeks midden 19e eeuw is gefocust op plaques van inflammatoire demyelinisatie. Nu weten we echter dat er naast de duidelijke zones van inflammatie ook veranderingen optreden in de overige witte stof, onder meer de NAWM en dat de ziekte ook de grijze stof aantast.3,4,5 Typische eigenschappen van de acute plaque zijn slecht begrensde zones van myelineverlies, immuuncelinfiltratie en parenchymaal oedeem. Rond de bloedvaten vindt men monocyten-,
macrofagen- en lymfocyten-infiltraties (vooral T) die men aanduidt als perivasculaire cuffing. MHC-II (majeur histocompatibiliteitscomplex II) presenterende macrofagen worden talrijk in het letsel aangetroffen. Deze zijn gevuld met een vettige substantie en zouden een actieve rol spelen in het strippen van de myeline van rond de axonen. De mate van axonale schade werd oorspronkelijk onderschat, maar zou toch reeds in het acuut letsel aanwezig kunnen zijn.3,4 Er wordt een gliale
hyperreactiviteit gezien (vooral van astrocyten) die zorgt voor beginnende gliose, hoewel een echte dense gliose bij het acuut letsel nog niet wordt aangetroffen.
Chronische letsels worden bij het post-mortem onderzoek vaker aangetroffen en zijn macroscopisch goed te onderscheiden door scherpe begrenzing en consistent aanvoelen. Microscopisch ziet men een goed begrensde zone van hypocellulariteit, myelineverlies en gliosis. De inflammatie is centraal uitgedoofd, maar men ziet nog verdikte vaten en een uitgebreide perivasculaire ruimte. Er is over het volledige letsel een variabel axonverlies. Op basis van de randactiviteit zal men de chronische letsels verder onderscheiden in chronisch actieve letstels met actieve rand en chronisch stille letsels met volledig uitgedoofde inflammatie. Typisch voor het chronisch letsels is ook de remyelinisatie. De grote variatie tussen de wittestofletsels op gebied van inflammatiegraad, demyelinisatie, remyelinisatie en axonaal verlies is voor sommige auteurs een indicatie dat er een uitgebreidere
66
anatoompathologische indeling dient te worden opgesteld dan louter “actieve” en “chronische letsels”.3,6 De aantasting van de hersenen bij MS gaat verder dan de wittestofplaques. In de normaal uitziende witte stof of NAWM (Normal Appearing White Matter) zijn er ook diffuse veranderingen aan te treffen. Ze zijn verantwoordelijk voor het progressieve luik van MS, niet in het minst voor de achteruitgang van de cognitie. Uitgebreide neuro-imaging heeft aangetoond dat er in de witte stof buiten de focale letsels, niet alleen een verlies van myeline-integriteit, maar ook een verminderde axonale densiteit bestaat. Dit wordt ondersteund door de histopathologische bevindingen. Zo zouden in de NAWM op sommige plaatsen microgliale activatie, T-lymfocytinvasie en perivasculaire cuffing observeerbaar zijn. Het dient ons dan ook niet te verwonderen dat bij de progressieve vormen van MS deze diffuse aantasting meer uitgesproken is.3 T2W studies hebben een verhoogd intermittent signaal aangetoond tussen wat we als normale witte stof en T2 wittestofletsels beschouwen. Dit wordt aangeduid als vuil uitziende witte stof of DAWM (Dirty Appearing White Matter). Verdere studie van deze gebieden toont diffuus myelineverlies en gekende inflammatoire kenmerken. Wat de betekenis van deze bevindingen is en hun implicaties in de kliniek zijn is nog onvoldoende gekend.3 Het is reeds lange tijd gekend dat er een niet miskenbare aantasting is van grijze stof bij MS. De grijze stof letsels worden partieel aangetoond bij het MRI-onderzoek en worden zelfs in de diagnostische criteria opgenomen onder de gezamenlijke categorie cortico-subcorticaal (zie verder). Men ziet dat alle loci van grijze stof kunnen worden aangetast, maar dat er een voorkeur bestaat voor de prefrontale cortex, motorische cortex, ruggenmerg en cerebellum. Grijzestofletsels correleren met neuronale schade en transsectie van axonen. De histopathologische kenmerken zijn anders dan de wittestofletsels. Er is doorgaans een lagere graad van inflammatie en minder T-cel- en macrofaaginvasie. De grijzestofletsels worden in grotere mate aangetroffen bij de patiënten met een progressieve vorm, maar zijn reeds vroeg in de ziekte aanwezig. Ze correleren met een invaliditeit die niet door wittestofletsels kan worden verklaard.3 Sommige bronnen beweren dat de grijzestofletsels en axonale schade beter correleren met bepaalde vormen van invaliditeit dan de wittestofletsels. Dit geldt vooral voor de cognitieve aantasting.5 Immunopathogenetische mechanismen: T-lymfocytgemedieerde mechanismen en triggering van auto-immuniteit: De observatie van talrijke T-lymfocyten in de actieve letsels suggereert een adaptieve immuunrespons tegen myeline of andere componenten van het centraal zenuwstelsel. Het experimentele diermodel EAE is trouwens gebaseerd op destructie door autoreactieve CD4 T-lymfocyten.3,7 Men heeft ook bij 67
MS patiënten bepaalde autoreactieve CD4 cellen kunnen opsporen, alsook bepaalde autoreactieve cytotoxische CD8 cellen. Echter bij gezonde individuen worden autoreactieve cellen in dezelfde mate teruggevonden. Het verschil tussen beide groepen zou de affiniteit van de TCR (T-cell receptor) en de mate van activiteit van de cellen zijn.
Hoe precies de auto-immuniteit ontstaat, is tot op heden onduidelijk hoewel de molecular mimicry theorie de meest gangbare hypothese lijkt. Hierbij zouden bepaalde epitopen van een infectieus pathogen structurele gelijkenissen vertonen met componenten van het CZS wat aanleiding geeft tot een aanval van het adaptieve immuunsysteem tegen de eigen componenten lang nadat de infectie is bestreden. Bij de daaropvolgende celschade kunnen andere auto-antigenen ontstaan met uitbreiding van de infectieloci; dit heet epitope spreading. Andere vormen van virale triggering zijn “bystander activatie”, waarbij pathogeengeactiveerde antigenpresenterende cellen (APC) ook zelfantigenen presenteren aan autoreactieve T-cellen, het “adjuvant effect” waarbij herkenning van pathogenassociated molecular patterns (PAMP) voor cytokinevrijstelling zorgt en activatie van auto-reactievecellen en de “superantigen activatie”. Daarbij zorgen bepaalde microbiële moleculen voor een crosslinking tussen MHC II en TCR zodat aspecifieke activatie van autoreactieve T-cellen kan ontstaan.8 Het adaptieve systeem is echter niet als enige betrokken, gezien men een bepaalde HLA-configuratie dient te hebben om T-cellen in contact te brengen met deze epitopen en vervolgens te activeren tot auto-immuniteit. Hieruit volgt dat de configuratie van het aangeboren immuunsysteem een genetische voorbeschiktheid tot auto-immuunziekten kan veroorzaken, waarna een infectie eerder een luxerende factor is. Macrofagen en allerhande gliale cellen zijn in het proces betrokken. Dit verklaart waarom bepaalde HLA-DQ en HLA-DR genen voor een verhoogd risico op MS zorgen.8 Ook het verband met een EBV-infectie kan hiermee verklaard worden.8
68
Overgenomen uit Croxford et al.7 : molecular mimicry is de meest aangehaalde oorzaak van virale triggering van een auto-
immuunaandoening. Het begint bij een infectie met een pathogeen dat een self-peptide mimic draagt. Dit mimic wordt door
een antigenpresenterende cel (APC) gepresenteerd aan viral-specific CD4+ Th1 (vTh1) cellen(1). Er volgt een secretie van cytokines en chemotactische stoffen(2), waarop macrofagen (M𝜙) invaderen uit de bloedbaan door diapedese en voor autodestructie zorgen(3). Voortzetting van de auto-immuunreactie volgt uit verdere vrijlating van auto-antigenen, wat voor activatie van self-specific CD4+ Th1 (sTh1) cellen zorgt(4). Epitope spreading volgt uit molecular mimicry waarbij autoimmuundestructie en apoptose leidt tot vrijlating van andere (nu vaak intracellulaire) auto-antigenen (5), die gepresenteerd worden aan andere autoreactieve T-cellen (6).
B-lymfocyt- en humoraal gemedieerde mechanismen: Hoewel men vroeger ervan uit ging dat T-lymfocytenactiviteit volstaat om het volledige beeld van MS te verklaren, wordt steeds duidelijker dat ook B-lymfocyten zouden een rol spelen in de pathogenese.3,9 De B-cellen hebben op hun celmembraan een BCR (B-cel receptor) met variabel deel
op basis van herschikking van chromosoom 6. Indien ze geactiveerd worden door antigen en door CD4+ T-helpercellen kunnen ze een secretoire vorm van deze molecule aanmaken die we immunoglobulines noemen; de B-cel is nu een plasmacel geworden. Er is een adaptieve herschikking gedurende een immuunreactie tegen een pathogeen waardoor de affiniteit van de immuunglobulines toeneemt en daarmee de efficiëntie van humorale afweer. In de etiologie van de auto-immuunrespons lijkt de B-cel niet zo belangrijk als de T-cel, daar de B-cel afhankelijk is van deze laatste voor zijn activatie. Toch zal de secretie van affiene immunoglobulines zorgen voor een efficiëntere autodestructie door macrofagen en ook de complementdepositie is afhankelijk van de Ig werking. Een aanwijzing voor een B-cel betrokkenheid bij MS is de aanwezigheid van IgG, plasmacellen en complement in het geïnflammeerd weefsel van de acute letsels.9 Daarnaast zal men in 90 % van de RRMS-patiënten een oligoclonale productie zien van IgG bij elektroforese van het cerebrospinaal vocht.10 Deze test kan negatief zijn bij MS patiënten en is dan gecorreleerd met een milder 69
ziekteverloop.10 In contrast met deze aanwijzingen blijkt dat de Ig verdeling binnen de hersenen gelijk verdeeld is tussen plaques en NAWM, waardoor de Ig productie ook secundair aan wittestofschade zou kunnen zijn, eerder dan primair te contribueren tot de schade. Naast de meest voorkomende IgG kan men ook pentameer type IgM opsporen tegen bepaalde componenten van de myelineschede. Dit zou op zich een indicator kunnen zijn van een agressiever ziekteverloop.10
De rol van B-lymfocyten zou uitgebreider zijn dan alleen de productie van antilichamen. Zo zien we dat een anti-CD20 therapie (monoclonale antilichamen als Rituximab) een zekere efficaciteit hebben in de behandeling van RRMS zonder dat de plasmacellen verdwijnen of de Ig spiegel in het CSF daalt. Dit zou kunnen verklaard worden doordat B-cellen een directe en indirecte invloed hebben op T-cel inflammatie.3,9 Ten slotte zou de B-lymfocyt ook voor de degeneratie van ectopische follikels kunnen zorgen, die bij SPMS-patiënten geobserveerd werden ter hoogte van de meningen.3 De aanwezigheid van meningeale follikels werd in bepaalde gevallen geassocieerd met corticale letsels in gebieden die direct met deze
meningeale zones in contact liggen.11 Het werd tot nog toe enkel geobserveerd bij SPMS patiënten,
maar men denkt dat de follikelvorming reeds in de RRMS vorm kan beginnen en evolueren tot detectie mogelijk is. Het aantal studies dat deze follikelvorming ondersteunt is gering en er zijn veel betwistingen.3 Ook de pathogenetische B-celmechanismen kunnen gelinkt worden aan een latente EBV-infectie. Immers EBV zal in de eerste plaats B-cellen infecteren en zou door expansie, immortalisatie en maturatie van B-cellen voor de ectopische follikelvorming kunnen zorgen en de intrathecale Ig productie aanmoedigen.3 Deze vorm van infectieus uitgelokte auto-immuniteit wordt aangeduid als “viral support of autoreactive cell survival” .8
Leukocytinvasie door de bloedhersenbarrière: Van sinds de ontdekking van de bloedhersenbarriëre door Paul Ehrich in het begin van de twintigste eeuw is het centraal zenuwstelsel beschouwd als een immuungepriviligeerde site met beperkte toegang voor macromoleculen.12 Na het ophelderen van de moleculaire basis voor transport van deze
macromoleculen
en
diapedese
van
cellen
is
deze
visie
aangepast
tot
dat
van
een
immuungespecialiseerde site. Een belangrijk element in het ontstaan van MS of gelijk welke inflammatie in het centraal zenuwstelsel blijft wel de migratie van immuuncellen voorbij de bloedhersenbarrière. Het microscopisch substraat van de doorbraak van de bloedhersenbarrière bij MS is de perivasculaire cuff.3
70
De integriteit van de bloedhersenbarrière is afhankelijk van tight junctions tussen de endotheelcellen, een onderliggend basaal membraan, moleculaire transportermoleculen en immuuncellen in de directe omgeving van de bloedvaten. Opdat cellen door de BBB (blood-brain-barrier) zouden geraken is een welbepaalde sequentie van gebeurtenissen nodig. Eerst ondergaan ze een zwakke, transiënte binding met receptoren aan de endotheelwand, waarbij ze marginaliseren en adhereren. Voorbeelden van deze adhesiemoleculen zijn ICAM-1 en VCAM-1 (immune cell, respectievelijk vascular cell adhesion molecule). Deze moleculen worden opgereguleerd bij inflammatoire reacties door TNF (Tumor Necrosis Factor) en LPS (lipopolysacchariden). Volgend op de adhesie zal er extravasatie tussen de endotheelcellen plaatsvinden, die gefaciliteerd wordt door een complexe set van moleculen (in hoofdzaak integrines). Uit een grote groep adhesiemoleculen is VLA-4 (Very Late Antigen; een integrine) als belangrijkste encephalitogene molecule geïdentificeerd. Dit integrine zit op de celmembraan van de leukocyt en heeft VCAM-1 als bindingspartner op de endotheelcel.3
Naast de adhesiemoleculen is er ook een nood aan chemokines, die de leukocyten aantrekken naar een bepaalde inflammatoire site en ze op de juiste plaats doen extravaseren. Verschillende chemotactische factoren zijn aangeduid bij MS. Zo zou CXCL12 (chemokine ligand 12) op de luminale zijde van het endotheel en CCR6 met ligand ter hoogte van de plexus chorioideus een rol spelen.12
De studie van de extravasatiemechanismen heeft nieuwe therapeutische targets aangewezen. Zo heeft men een monoclonaal antilichaam ontwikkeld tegen de 𝛼4-subunit van het VLA-4 dat Natalizumab
(Tysabri®) heet. Er worden minder T-cellen, dendrocyten en andere immuuncellen gezien in het CZS.
Het middel is een eerste demonstratie van hoe een blokkering van de diapedese de ziekte kan afremmen (minder opstoten, tragere progressie, minder MRI-letsels). Natalizumab is momenteel een van de meest succesvolle behandelingen van MS. Nieuwe targets zijn het ALCAM-1, osteopontine en andere.3,13 Axonale en neuronale schade bij MS: Reeds in de histopathologie werd onderstreept dat MS zich niet beperkt tot de witte stof. Bij het ontstaan van de invaliditeit bij MS-patiënten is het belangrijk dat naast demyeliniserende processen ook axonale schade ontstaat.
Axonale schade was reeds langere tijd beschreven en werd later aangetoond door Trapp et al. op microscopische wijze.14 De transsectie van axonen werd geobserveerd in actieve letsels en aan de rand van letsels, maar ook (in mindere mate) in de NAWM. Vergelijkende studies tussen RRMS, SPMS en PPMS specimen toonde aan dat axonale schade het grootst is in het eerste jaar na aanvang van de ziekte en vooral bij actieve letsels optreedt.3 Een immunopathologische wijze om axonale schade in
vitro aan te tonen is via APP (amyloid precursor proteine) antilichamen.5 . In vivo kan axonale schade worden aangetoond door MR-spectroscopie met veranderingen in de densiteit van NAA (Nacetylaspartaat). De daling van de NAA-intensiteit wordt aanzien als een merker voor axonale schade.
71
Sommige NAA verlagingen zijn tijdelijk, wat naar analogie met een trauma aantoont dat axonale schade herstelbaar is (via Walleriaanse degeneratie). Ook bij MS zien we dus soms een normalisatie van NAA in wittestofletsels, een aantal maanden na de acute fase.5 Toch is axonale schade steeds belangrijker bij het begrip van de progressie van de ziekte. Men gaat ervan uit dat axonale schade meer gecorreleerd is met de EDSS evolutie van de patiënt dan demyelinisatie.4,5 De enorme functionele flexibiliteit van de hersenen zou de gehele of gedeeltelijke
remissie bij RRMS-patiënten verklaren en het overschrijden van een bepaalde grens van axonale schade zou de progressie naar een SPMS met irreversibele invaliditeit betekenen. Inflammatie van het centraal zenuwstelsel wordt gezien als de eerste stap naar axonale aantasting. CD8 cytotoxische T-cellen worden als belangrijke factoren aangeduid, maar ook macrofagen en microglia worden dichtbij beschadigde axonen gezien. Al deze cellen hebben gemeen dat ze NO produceren (via NNOS : neuronaal stikstofmonoxide synthetase). NO zou de mitochondriale ademhaling verhinderen, waarna door ATP-tekort de Na-K pomp niet goed functioneert. De intraaxonale toename van Na zorgt voor een omgekeerde werking van de Na/Ca exchanger waardoor op zijn beurt een overvloed aan intra-axonaal calcium ontstaat. Calcium is vanaf bepaalde concentraties cytotoxisch; het zal via calcium-dependente protease-activatie axonale schade in de hand werken.5,15 Inflammatie kan niet altijd een rol spelen bij axonale schade gezien het ook gezien wordt in corticale letsels, waarvan is aangetoond dat ze nauwelijks inflammatie ondergaan. Myeline zou een trofische ondersteuning leveren voor het axon. Een verlies van myeline zorgt voor een axonale conductieblokkage en als gevolg metabole dysfunctie. Daarenboven is een gedemyeliniseerd axon gevoeliger voor schade. Remyelinisatie zou bij chronische MS letsels beperkt zijn door tekort aan oligodendrocyten.15 Myeline- en axonale schade zouden ook een gevolg kunnen zijn van immunoglobulineproductie. Een andere factor met mogelijke bijdrage tot axonale schade is glutamaatexcitotoxiciteit zou neurotoxisch kunnen zijn. De theorieën worden allen betwist als uniek pathogenetisch mechanisme, dus is het realistisch aan te nemen dat er meerdere mechanismen bijdragen tot de schade van het axon. Door chronische axonale schade kan men MS zowel als een inflammatoire als een neurodegeneratieve ziekte beschouwen. De activiteit van de huidige immunomodulatoren (die zich vooral toespitsen op inflammatie) neemt af in de progressieve stadia van de ziekte. Waarschijnlijk is dit te verklaren door een overheersende neurodegeneratieve component. Men is dus steeds meer op zoek naar neuroprotectieve factoren om met de immunomodulerende behandeling te associëren. Het effect van neuroprotectie wordt onderzocht bij producten die remyelinisatie stimuleren, Na-kanaalblokkers en Na/Ca-exchangerblokkers, BDNF (brain derived neurotrophic factor) en nog vele andere.15 72
Referenties: (1)
Compston A. The 150th anniversary of the first depiction of the lesions of multiple sclerosis. Journal of neurology, neurosurgery and psychiatry 1988; 51(10): 1249-1252.
(2)
Charcot JM. Histologie de la Sclérose en plaques, leçon faite à l’hospice de la Salpetrière par M Charcot et recueillie par M Bourneville. 1869.
(3)
Wu GF, Alvarez E, et al. The Immunopathophysiology of multiple sclerosis. Neurol Clin 2011; 29(2): 257-278.
(4)
Murray TJ. Diagnosis and treatment of Multiple Sclerosis. BMJ 2006; 332(7540): 525-527.
(5)
Grigoriadis N, Ben-Hur T, et al. Axonal damage in multiple sclerosis: a complex issue in a complex disease. Clinical Neurology and Neurosurgery 2004; 106(3):211-217.
(6)
Lucchinetti CF, Wolfgang B, et al. Evidence for pathogenic heterogeneity in Multiple Sclerosis. Ann Neurol 2006; 56(2): 308.
(7)
Croxford JL, Obson JK, et al. Epitope Spreading and Molecular Mimicry as triggers of Autoimmunity in the Theiler virus-induced demyelinating disease model of Multiple Sclerosis. Autoimmunity Reviews 2002; 1(5): 251-260.
(8)
Kakalacheva K, Münz C, et al. Viral triggers of Multiple Sclerosis. Biochimica et Biophysica Acta 2011; 1812(2): 132-140.
(9)
Hauser SL, Waubant E, et al. B-cell depletion with Rituximab in Relapsing-Remitting MS. NEJM 2008; 358(7): 676-688.
(10) Bosca I, Magramer MJ, et al. The risk of relapse after a Clinically Isolated Incident is related to the pattern of oligoclonal bands. Journal of Neuroimmunology 2010; 226(1-2): 143-146. (11) Howell OW, Reeves CA, et al. Meningeal inflammation is widespread and linked to cortical pathology in Multiple Sclerosis. Brain 2011; 134(9): 2755-2771. (12) Ferenc Joo. The Blood-Brain Barrier in vitro: the second decade. Neurochem Int 1993; 23(6): 499521. (13) Polman CH, O’Connor PW, et al. A randomized Placebo-controlled trial of Natalizumab for Relapsing-Remitting Multiple Sclerosis. NEJM 2006; 354(9): 899-910. (14) Trapp BD, Peterson J, et al. Axonal Transsection in the lesions of Multiple Sclerosis. NEJM 1998; 338(5): 278-285. (15) Smith KJ, Lassman H. The role of Nitric Oxide in multiple sclerosis. The Lancet Neurology 2002; 1(4): 232-241.
73