Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
ARTIKELEN
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek* Edwin de Beurs & Marko Barendregt Inleiding In de forensische psychiatrie wordt nog nauwelijks gewerkt volgens de evidencebased medicine (EBM). Weliswaar worden binnen de tbs-sector momenteel zorgprogramma’s ontwikkeld, maar wetenschappelijke kennis over welke behandelmethoden werken bij welke patiënten ontbreekt nog grotendeels. Op basis van deze constatering deed de tijdelijke parlementaire commissie-Visser, die in 2006 het tbs-stelsel onderzocht, de volgende aanbeveling: ‘Wetenschappelijk onderzoek naar effectiviteit van behandelmethoden in de forensische psychiatrie moet worden uitgebreid. De dieperliggende factoren die delictrisico verklaren, moeten daarbij worden betrokken.’1 Dit artikel gaat over de vraag hoe dit onderzoek het beste kan worden vormgegeven. Bij onderzoek binnen de context van de tbs treden problemen op die inherent zijn aan het tbs-stelsel. Praktische problemen zijn de beperkte omvang van de onderzoekspopulatie (volgens een raming van het WODC kent het tbs-stelsel in 2009 ‘slechts’ 2000 patiënten, waarvan een groot deel niet in onderzoek geïncludeerd kan worden), de grote verscheidenheid aan pathologie en de grote verschillen tussen de klinieken. Vanuit ethisch oogpunt zijn er voor experimentele studies belemmeringen die voortvloeien uit het gedwongen en juridische kader. De legitimering van de tbs-maatregel vereist bijvoorbeeld dat patiënten te allen tijde een behandeling krijgen aangeboden, wat het construeren van een placebocontrolegroep, die geen behandeling krijgt, ingewikkeld maakt. Klassieke onderzoeksmethoden, waarbij grote groepen patiënten aselect aan verschillende behandelcondities worden toegewezen om het behandeleffect te bepalen, lijken dus moeilijk toepasbaar binnen de tbs. Wetenschappelijk onderzoek binnen de tbs vereist een op de situatie aangepaste methodologie. In dit artikel beschrijven we enkele verschillende onderzoeksmethoden die in aanmerking komen voor toepassing in de tbs. *
1
Edwin de Beurs is hoofd van het Bureau Onderzoek en Ontwikkeling, Nederlands Instituut voor Forensische Psychiatrie en Psychologie (NIFP), en inhoudelijk directeur van het Kenniscentrum Zorg Nederland (KZN). Marko Barendregt is senior onderzoeker bij het Kenniscentrum Zorg Nederland (KZN). Dit artikel is gebaseerd op een rapport dat door beide auteurs in 2008 is geschreven in opdracht van het Wetenschappelijk Onderzoek- en Documentatiecentrum van het Ministerie van Justitie. Kamerstukken II 2005/06, 30 250, nr. 5 (Commissie Visser, Parlementair onderzoek TBS, Eindrapport 2006), p. 113.
PROCES 2010 (89) 5
331
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
Edwin de Beurs & Marko Barendregt
Wat is evidence-based behandelen? Evidence-based medicine (EBM) is ‘het nauwgezet, expliciet en oordeelkundig gebruik van het huidige beste bewijsmateriaal bij het nemen van besluiten over de zorg van individuele patiënten’.2 De totstandkoming van een evidence-based werkwijze vereist een drietal stappen. Ten eerste dient er een evidence base te worden opgebouwd. Dit is een kennisbestand gebaseerd op grondig wetenschappelijk onderzoek over welke behandelmethoden werken bij welke stoornissen en welke typen patiënten. Op basis van dit kennisbestand worden vervolgens richtlijnen en zorgprogramma’s opgesteld, die fungeren als algemene voorschriften voor behandelaars. Ten slotte kunnen de richtlijnen worden geïmplementeerd, zodat behandelaars bij patiënten evidence-based beslissingen nemen bij het opstellen van een individueel behandelplan. Voor het opbouwen van de evidence base is het essentieel dat onderzoeksresultaten structureel en systematisch worden gedocumenteerd. De door wetenschappelijk onderzoek verkregen kennis omtrent specifieke behandelingen wordt daarom volgens een vaste methodiek verzameld door internationale organisaties, zoals de Cochrane Collaboration voor medisch onderzoek en de Campbell Collaboration Crime and Justice Group.3 Onderdeel van dergelijke organisaties zijn zogenaamde Collaborative Review Groups, die op basis van een inventarisatie en meta-analyse van alle beschikbare studies een uitspraak doen over de werkzaamheid van een specifieke behandeling. Deze uitspraak wordt vastgelegd in de evidence-based richtlijnen. De ontwikkeling van EBM en de groeiende toepassing in de somatische zorg worden op enige afstand gevolgd door een vergelijkbare ontwikkeling in de GGZ.4 Zo zijn er de laatste jaren richtlijnen gekomen voor de behandeling van stemmingsstoornissen, angststoornissen schizofrenie en persoonlijkheidsstoornissen.5 Implementatie van de richtlijnen vindt in de GGZ onder andere plaats in de vorm van ontwikkeling van zorgprogramma’s. Deze zorgprogramma’s zijn idealiter verzamelingen van evidence-based behandelingen. In werkelijkheid heeft men bij het opstellen van zorgprogramma’s in de GGZ in een aantal gevallen echter slechts
2 3 4
5
332
D.L. Sackett, W.M. Rosenberg, J.A. Gray, R.B. Haynes & W.S. Richardson, ‘Evidence-based medicine: what it is and what it isn’t’, British Medical Journal 1996, 312(7023), p. 71-72. D.P. Farrington & A. Petrosino, ‘The Campbell Collaboration Crime and Justice Group’, The ANNALS of the American Academy of Political and Social Science 2001, 578(1), p. 35-49. R.E. Drake, H.H. Goldman, H.S. Leff, A.F. Lehman, L. Dixon, K.T. Mueser & W.C. Torrey, ‘Implementing evidence-based practices in routine mental health service settings’, Psychiatric Services 2001, 52, p. 179-182; I. Nijs, K. Hannes, B. Aertgeerts & G. Peeters, ‘“Evidence-based medicine” in de Nederlandstalige psychiatrische, psychologische en psychotherapeutische vakliteratuur: opvallend aanwezig?’, Tijdschrift voor de Psychiatrie 2006, 48, 1, p. 53-57. Zie www.ggzrichtlijnen.nl.
PROCES 2010 (89) 5
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek
het behandelaanbod in de huidige praktijk beschreven en samengevat in plaats van de gewenste praktijk op basis van evidence-based richtlijnen weer te geven.6 Evidence-based behandelen in de tbs Het invoeren van behandelingen volgens zorgprogramma’s voor de tbs-sector naar model van de somatische zorg en de GGZ vereist dus allereerst de beschikbaarheid van een kennisbestand over wat werkt bij wie onder welke omstandigheden in de tbs. Deze evidence base is op dit moment niet beschikbaar en zal dus opgebouwd moeten worden. Deels kan daarvoor gebruik worden gemaakt van de reeds aanwezige kennis uit de Cochrane en Campbell Libraries. Formeel is dan weliswaar niet aangetoond dat in de GGZ gebruikelijke behandelingen effectief zijn in de tbs-setting, maar we kunnen toch wel aannemen dat de behandeling van geïsoleerde syndromen zoals angst- of stemmingsstoornissen in de tbs weinig anders zal zijn dan in de reguliere GGZ. Deze wijze van opbouwen van de evidence base voor de tbs door ‘leentjebuur’ te spelen in de GGZ is echter niet voldoende; in de praktijk zal onderzoek uit de GGZ gerepliceerd moeten worden binnen de tbs-context en wel om twee redenen. In de eerste plaats is zowel de setting als de populatie van de tbs dusdanig uniek, dat niet zonder meer aangenomen kan worden dat wat effectief is in de GGZ ook effectief is in de tbs. De dwang/drang van de tbs-setting kan bijvoorbeeld invloed hebben op de werkzaamheid van interventies die in de reguliere GGZ worden toegepast. Verder is een groot deel van de psychopathologie in de reguliere GGZ enkelvoudig, terwijl een groot deel van de tbs meervoudige problematiek heeft, vaak in combinatie met middelenmisbruik. In de tweede plaats is de doelstelling van behandeling in de GGZ en in de tbs verschillend: in de GGZ gaat het om het terugdringen van de ziektelast en genezing, in de tbs is de doelstelling reductie van het risico op ongewenst gedrag en recidive. Hierdoor zijn voor effectstudies in de tbs andere uitkomstmaten aangewezen dan de doorgaans in de GGZ gebruikte maten voor symptoom- of klachtenreductie. Het kiezen van de juiste uitkomstmaat in de tbs-settings is geen sinecure. De gekozen uitkomstmaat is afhankelijk van de onderzoeksdoelstelling. Wil men de uitkomst van het gehele verblijf in de tbs evalueren, dan zal de uitkomstmaat betrekking hebben op recidiverisico; wil men het effect van specifieke interventies als onderdeel van een tbsbehandeling evalueren, dan zijn specifiekere uitkomstmaten aan de orde. Een interventie die erop gericht is psychopathologie af te doen nemen, moet geëvalueerd worden met een instrument voor de aard of de ernst van de psychische klachten. Het succes van een interventie gericht op het aanleren van sociale vaar6
E. van Fenema, N. van der Wee, E. de Beurs, E. Onstein & F.G. Zitman, ‘Implementatie van zorgprogramma’s in de behandelpraktijk: meten is weten’, Maandblad Geestelijke Volksgezondheid 2006, 61, p. 817-826. Het feitelijke behandelaanbod in de klinische praktijk zal overigens altijd ruimer zijn en meer omvatten dan alleen behandelingen met het predicaat ‘evidence-based’, ook bij volledige implementatie van werken volgens zorgprogramma’s. Dat is ook een goede zaak, omdat er mogelijkheden moeten blijven om ervaring op te doen met nieuwe experimentele potentieel werkzame behandelingen.
PROCES 2010 (89) 5
333
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
Edwin de Beurs & Marko Barendregt
digheden wordt afgemeten aan een toename van die vaardigheden en zichtbaar gemaakt met een instrument dat dit meet. Onderzoeksdesigns Randomised Clinical Trials (RCT’s) De Randomised Controlled Clinical Trial (RCT) is nog altijd dé voorgeschreven methode om aan te tonen dat een behandeling effect heeft. RCT’s komen voort uit een onderzoekstraditie in de medische wetenschappen, waar patiënten willekeurig worden toebedeeld aan een experimentele conditie die een naar verwachting werkzame behandeling bevat, of een controleconditie met een niet werkzame behandeling (placebo). Het design met de meest rigoureuze methodologische controle is het zogenoemde dubbelblind placebo gecontroleerde design. In een dubbelblinde studie weet de onderzoeker noch de patiënt aan wie actieve medicatie of placebo gegeven wordt. Dubbele blindering is wenselijk, omdat gebleken is dat verwachtingseffecten (zowel bij de onderzoeker als bij de patiënt) over de behandeling het resultaat beïnvloeden. In de klinische praktijk vaart men wel bij dit verwachtingseffect, dat naar schatting van sommigen7 wel tot 15% van het therapieeffect bijdraagt, maar een methodologische zuivere RCT is erop gericht invloed van dit effect uit te sluiten. Het onderzoeksdesign kan ook enkel-blind of open zijn. In een enkel-blind design weet de patiënt niet, maar de behandelaar wel, wie er in de experimentele of controleconditie zit. In een open studie weet zowel behandelaar als patiënt wie actieve en wie placebobehandeling krijgt. Bij psychosociale behandelingen is een dubbelblinde opzet praktisch niet uitvoerbaar, omdat de behandelaar altijd zal weten welke behandeling geboden wordt. Een bijkomend probleem is dat het moeilijk is om een placebotherapie te ontwerpen die gelijkwaardig is aan de actieve behandeling wat betreft relevante non-specifieke factoren, zoals de duur van de behandeling, de intensiteit (therapeut-patientcontact) en de geloofwaardigheid. Specifiek voor de tbs-setting geldt dat het vanuit een oogpunt van rechtsongelijkheid niet mogelijk is om een tbs-gestelde een placebobehandeling aan te bieden. Om deze problemen te omzeilen zal bij onderzoek met een experimentele psychosociale behandeling de controlegroep meestal bestaan uit treatment as usual (TAU) of zullen twee experimentele behandelingen met elkaar worden vergeleken. Je weet dan echter niet wat het effect van de behandeling is in vergelijking met niets doen. Een ander probleem bij het onderzoeksdesign met een TAU-conditie is dat positieve verwachtingen van de patiënt over de baten van de nieuwe behandeling een ongewenste positieve invloed kunnen hebben op de resultaten van de trial. Verwachtingseffecten van de patiënt kunnen in ieder geval zo veel mogelijk worden tegengegaan door in de voorlichting over de trial te benadrukken dat het nog niet bekend is of de onderzochte behandeling een positief effect zal hebben.
7
334
B.L. Duncan & S.D. Miller, ‘The client’s theory of change: Consulting the client in the integrative process’, Journal of Psychotherapy Integration 2000, 10, p. 169-187.
PROCES 2010 (89) 5
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek
Voor een RCT is randomisatie, waardoor patiënten aselect worden toegewezen aan de behandelcondities, het belangrijkste kenmerk.8 Quasi-experimentele designs (bijvoorbeeld matched controls of ongecontroleerde cohortstudies) zijn methodologisch inferieur, maar second best.9 Een alternatief voor randomisatie op patiëntniveau is randomisatie op instellingsniveau. Patiënten van instelling A, D en F ontvangen de experimentele behandeling en patiënten van instelling B, C en E ontvangen de controlebehandeling, waarbij toewijzing aan A, D en F willekeurig heeft plaatsgevonden. Voorwaarde is dan wel dat deelnemende instellingen onderling niet sterk verschillen in behandelaanbod en effectiviteit (bijvoorbeeld deskundigheidsniveau van het personeel). Tevens moeten er voldoende instellingen deelnemen aan het onderzoek om succesvol en effectief te kunnen randomiseren. Ten slotte zullen de resulterende uitkomstgegevens met gepaste statistische technieken moeten worden geanalyseerd om recht te doen aan de onderlinge afhankelijkheid van gegevens van patiënten die uit dezelfde instelling afkomstig zijn. Multi-level analyse is de aangewezen methode wanneer er systematische onderlinge afhankelijkheid in de data zit. Een belangrijk onderwerp bij RCT’s is het minimaal vereiste aantal deelnemers aan de studie. In het meeste klinisch effectonderzoek, waar we te maken hebben met middelgrote effecten, zijn minstens 50 personen per experimentele conditie noodzakelijk om een verschil aan te tonen.10 Maatregelen om de statistische power te vergroten zijn gebruik van betrouwbare en gevoelige meetinstrumenten en homogene patiëntengroepen. In de klinische werkelijkheid van de tbs-setting is het evalueren van interventies met een aanzienlijk effect, gebruik van gevoelige meetinstrumenten en homogene onderzoeksgroepen vooralsnog meer wens dan werkelijkheid. Het effect van interventies zal dan ook niet groter zijn dan bijvoorbeeld in de GGZ, eerder kleiner. Bij een verwacht verschil in recidive tussen de experimentele en de controlegroep van 10% zijn er bijvoorbeeld al 252 deelnemers nodig die de interventie afmaken om voldoende kans te hebben dit verschil aan te tonen.11 Een dergelijk aantal betekent dat dit type onderzoek een zeer groot beroep doet op de tbs-populatie van slechts 2000 patiënten, van wie een groot deel vanwege exclusiecriteria niet eens in aanmerking komt. In de praktijk betekent dit dat er gelijktijdig slechts enkele RCT’s kunnen worden opgezet. Ten slotte dient opgemerkt te worden dat het verblijf in de tbs-kliniek niet vrijwillig is. Deelname aan een onderzoekstrial in principe wel, maar in de context van de tbs-maatregel kan men zich afvragen in hoeverre er toch niet sprake is van 8
9
10
11
A. Fink, Evaluation Fundamentals: Insights into Outcomes, effectiveness and Quality of Health Programs, Londen: Sage 2005; W. Shadish, T. Cook & D. Campbell, Experimental and Quasi-Experimental Designs, Boston: Houghton Mifflin Company 2002. D.T. Campbell & J.C. Stanley, Experimental and Quasi-Experimental Designs for Research, Boston: Sage 1966; W.R. Shadish, ‘The empirical program of Quasi-Experimentation’, in: L. Bickman (red.), Validity and Social Experimentation, Londen: Sage 2000. A.E. Kazdin & D. Bass, ‘Power to detect differences between alternative treatments in comparative psychotherapy outcome research’, Journal of Consulting and Clinical Psychology 1989, 57, p. 138-147. B.S.J. Wartna, Evaluatie van daderprogramma’s: een wegwijzer voor onderzoek naar de effecten van strafrechtelijke interventies speciaal gericht op het terugdringen van recidive, Den Haag: Boom/ WODC 2005.
PROCES 2010 (89) 5
335
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
Edwin de Beurs & Marko Barendregt
dwangbehandeling. Dit heeft potentieel een negatieve invloed op de uitkomst van behandeling en leidt dus tot kleinere behandeleffecten dan in de reguliere geestelijke gezondheidszorg (en daarmee tot een geringere statistische power van het onderzoek). Voor een RCT is het van eminent belang dat de geëvalueerde behandeling zuiver is toegepast en dat de zogenoemde behandelintegriteit op de een of andere manier is vastgesteld. De specifieke kenmerken/interventies van een behandeling worden hiertoe in een protocol of draaiboek vastgelegd. Zo’n protocol vergemakkelijkt een gestandaardiseerde toepassing van de behandeling tijdens de trial en maakt, bij gebleken werkzaamheid van de interventie, toekomstige verspreiding van de behandeling mogelijk. De behandelingen die geëvalueerd worden, dienen dus vastgelegd te zijn in protocollen. Ook aandacht verdienen de ondersteunende materialen bij een therapie-uitkomststudie, zoals informatiemateriaal voor de experimentele en controlebehandeling en informatie over de trial. Behandelintegriteit kan een heikel punt zijn, omdat een experimentele behandeling niet los kan worden onderzocht van het ‘groepstherapeutisch’ klimaat dat in een tbssetting bestaat. Isolatie van de interventie van het therapeutisch klimaat kan lastig zijn, zeker wanneer er weinig verschil is tussen de interventie en het dagelijkse therapeutisch handelen. Single case designs Om tegemoet te komen aan het praktische probleem van het grote aantal benodigde patiënten bij RCT’s is een aantal alternatieve experimentele onderzoeksdesigns ontwikkeld, die single case designs of N=1-studies worden genoemd.12 Hierbij worden er geen groepen met elkaar vergeleken, maar wordt het gedrag binnen één individu longitudinaal gevolgd en vergeleken op verschillende momenten (non-interventieperioden en interventieperioden). Het is een misverstand single case-methodologieën gelijk te stellen aan casusbeschrijvingen waarin anekdotisch veranderingen bij een patiënt worden geschetst. Bij een casusbeschrijving is geen sprake van een systematische observatie, waardoor een mogelijke conclusie dat gedragsverandering het gevolg is van een behandeling niet gestaafd kan worden. Het single case design daarentegen, gaat uit van een experimentele onderzoeksopzet met een systematische manipulatie van variabelen. Hiermee wordt getracht de interne validiteit te waarborgen, zodat oorzakelijke verbanden wel aangetoond kunnen worden. Een ander misverstand is dat er bij single case-studies slechts één persoon wordt gebruikt. Vaak worden er meerdere patiënten gebruikt, al ligt de nadruk altijd op de gedragsveranderingen bij het individu. Er is in de loop der jaren een rijke schakering aan single case-onderzoeksdesigns ontwikkeld, variërend van eenvoudig tot zeer verfijnd. Het meest eenvoudige is het AB-design, waarbij bij een individu de periode voorafgaand aan de behandelinterventie wordt vergeleken met de periode tijdens of na de interventie. Bij dit 12
336
R.C. Tervo, T.L. Estrem, W. Bryson-Brockmann & F.J. Symons, ‘Single-case experimental designs: applications in developmental-behavioral pediatrics’, Journal of Developmental Behavioral Pediatrics 2003, 24, p. 438-448.
PROCES 2010 (89) 5
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek
design kunnen gemeten gedragsveranderingen causaal worden toegeschreven aan de interventie indien er aan een aantal condities wordt voldaan, zoals voldoende stabiliteit van het gedrag, continue en herhaalde metingen, een duidelijke verandering in de trend op het moment van de interventie en repliceerbaarheid bij verschillende individuen. Helaas wordt slechts zelden aan alle condities voldaan, waardoor een oorzakelijk verband alsnog lastig aan te tonen is. Het AB-design functioneert daardoor vooral als hypothese-genererend. Een multiple baseline design is een specifieke vorm van het AB-design. In tegenstelling tot het AB-design wordt er bij een multiple baseline design niet slechts één preinterventieperiode geïntroduceerd, maar meerdere, bijvoorbeeld bij meerdere individuen. Vervolgens vangt de behandeling voor individu 1 aan, maar blijven de andere individuen nog in de baseline-periode. Pas wanneer er een gedragsverandering gemeten wordt voor individu 1, start de behandeling bij individu 2. Het idee achter het multiple baseline design is dat een gedragsverandering bij individu 1 pas dan aan de behandeling kan worden toegeschreven wanneer deze verandering niet ook tegelijkertijd bij individu 2 optreedt, die nog in de baseline-conditie verkeert. Bij een crossover design worden twee behandelingen (A en B) vergeleken door bij een individu de behandelinterventies af te wisselen. Daarvoor kan een ABAB-variant worden gekozen, hoewel het de voorkeur heeft de sequentie te randomiseren (bijvoorbeeld ABBABAAB) of twee deelnemers de behandelingen in omgekeerde volgorde aan te bieden (deelnemer 1 ABAB en deelnemer 2 BABA). Voor dit design geldt dat de effecten van de behandeling reversibel moeten zijn en het is daardoor vooral geschikt om medicamenteuze behandelingen te evalueren en niet voor behandelingen met een blijvend effect zoals vaardigheidstrainingen. Het alternating treatments design houdt in dat twee soorten interventies zeer snel achter elkaar worden afgewisseld. Wanneer behandeling A effectiever is dan behandeling B, verwacht men dat de gemeten uitkomstmaten tijdens perioden A een ander patroon of andere trend laten zien dan tijdens perioden B. Een vereiste voor dit design is wel dat de interventie een snel effect dient te hebben. Het voordeel van dit design boven een crossoverdesign (dat een minder snelle afwisseling kent) is dat het alternating treatments design minder gevoelig is voor veranderingen in de omgeving, aangezien aangenomen wordt dat de context minder snel varieert dan de experimentele conditie. Hiermee wordt weliswaar de interne validiteit verbeterd, maar de externe validiteit is problematisch. In een normale klinische setting vindt een dergelijke snelle afwisseling namelijk niet plaats en bovendien is niet denkbeeldig dat de twee behandelingen elkaar beïnvloeden. Goed opgezette single case-studies zijn wetenschappelijk gerespecteerde onderzoeksdesigns. Bewijs verkregen uit single case experimentele designs wordt onder
PROCES 2010 (89) 5
337
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
Edwin de Beurs & Marko Barendregt
meer als empirische evidentie geaccepteerd door de American Psychological Association13 en de eerdergenoemde Cochrane organisatie.14 Met single case designs is het relatief goed mogelijk om oorzakelijke verbanden aan te tonen (interne validiteit), maar de externe validiteit kan problematisch zijn. Om de effectiviteit van een behandeling gemeten bij slechts enkele patiënten te kunnen generaliseren over een grotere groep wordt onder andere aangeraden de context en setting van de onderzochte behandeling zo gedetailleerd mogelijk te beschrijven, en de resultaten zo veel mogelijk te interpreteren in een bestaande theorie. Het grote voordeel van de single case designs is natuurlijk dat er geen tot nauwelijks eisen worden gesteld aan de groepsgrootte. Het is praktisch goed uitvoerbaar meerdere studies binnen één instelling op te zetten en uit te voeren (hoewel een multi-center-aanpak tot een betere externe validiteit leidt). Single case designs kunnen derhalve een plaats hebben naast andere designs bij het komen tot een evidence base in de tbs, mits talrijk en goed opgezet. Gegeven alle genoemde beperkingen zullen single case designs daar echter niet voor in de plaats kunnen komen. Outcomes-onderzoek of Routine Outcome Monitoring (ROM) De term outcomes research komt uit Engeland en wordt gebruikt om onderzoek naar de effectiviteit van klinisch handelen in de praktijk van alledag aan te duiden. Men meet bij alle patiënten die bij een instelling onder behandeling zijn periodiek de klachten of het functioneren en er wordt vastgelegd wat de behandeling was in de periode die voorafging aan de meting. Feitelijk gebruikt men het instrumentarium en de methodiek die zijn ontwikkeld voor RCT’s, maar nu zonder controlegroep en zonder stringente inclusie- en exclusiecriteria. Er kan zo een cohort van behandelde patiënten worden samengesteld, die over langere tijd gevolgd kunnen worden. Op deze wijze gegevens verzamelen in de klinische praktijk staat in Nederland bekend onder de naam Routine Outcome Monitoring (ROM) en er is in de ambulante geestelijke gezondheidszorg al ruime ervaring mee opgedaan.15 ROM heeft als voornaamste doel de kwaliteit en efficiëntie van de behandeling in de GGZ te vergroten. Dat kan op verschillende manieren worden gerealiseerd. Ten eerste biedt ROM feedback aan de individuele behandelaar en diens patiënt over het verloop van de klachten ter ondersteuning van het klinisch handelen. Er wordt gezocht naar een optimale afstemming van meetmomenten met het klinisch handelen, zodat gegevens beschikbaar zijn op het moment dat er een beslissing genomen moet worden over voortzetting, verandering van koers of afsluiting van de behandeling, bijvoorbeeld op het moment dat een protocol van zestien zittingen gedragstherapie voor een angststoornis compleet is uitgevoerd. ROM biedt 13 14
15
338
D.L. Chambless, M.J. Baker, D.H. Boucom, L.E. Beutler, K.S. Calhoun, P. Crits-Christoph e.a., ‘Update on empirically validated therapies, II’, The Clinical Psychologist 1998, 51, p. 3-16. J. Davies, K. Howells & L. Jones, ‘Evaluating innovative treatments in forensic mental health: A role for single case methodology’, Journal of Forensic Psychiatry and Psychology 2007, 18, p. 353-367; zie ook www.cochrane.org. E. de Beurs & F.G. Zitman, ‘Routine Outcome Monitoring: Het meten van therapie-effect in de klinische praktijk met webbased software’, Maandblad Geestelijke Volksgezondheid 2007, 62, p. 13-28.
PROCES 2010 (89) 5
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek
het management van een instelling meer zicht op de effectiviteit van handelen in (sub)divisies van de instelling of van individuele therapeuten (benchmarking). Zo wordt duidelijk welke afdelingen heel goed presteren, en factoren die daar mee samenhangen (behandelaanpak, aard van de patiënten) kunnen aan het licht komen. ROM brengt een ‘meetvriendelijke’ cultuur in de instelling tot stand, waarin uitspraken over het klinische functioneren van patiënten ondersteund worden met de uitkomsten van gestandaardiseerde en gevalideerde meetinstrumenten. Ten slotte wordt met ROM een infrastructuur gerealiseerd waarin (gecontroleerd) wetenschappelijk onderzoek naar de klinische effectiviteit van specifieke interventies bij bepaalde gespecificeerde subgroepen patiënten uitgevoerd kan worden. ROM is vooral gericht op het optimaliseren van de externe validiteit of generaliseerbaarheid van de bevindingen. Specifiek aan ROM is dan ook het belang dat zo veel mogelijk patiënten worden geïncludeerd en gemeten. Dit is vooral om vertekening van de resultaten vanwege selectieve weigering van bijvoorbeeld ‘moeilijke mensen’ tegen te gaan. Alleen dan zijn de resultaten representatief voor de instellingspopulatie waaruit zij afkomstig zijn. Verder is het van belang frequent en op klinisch relevante momenten te meten. Meetinstrumenten moeten zijn toegesneden op patiëntengroepen en op de inhoud van interventies en kunnen variëren per meetmoment. De set voor de aanvangsmeting, hermetingen ten tijde van het verblijf, nametingen en follow-up kunnen uiteenlopend zijn. Dataverzameling, databeheer en softwarematige ondersteuning zijn belangrijke punten van aandacht. Voor het doen van routinematig effectonderzoek dient men te beschikken over een infrastructuur om periodiek gegevens over het functioneren (klacht-/ symptoomniveau, gedrag, incidenten) van de patiënt te meten en deze gegevens te beheren. Voor software ondersteuning is een Elektronisch Patiënten Dossier nodig dat flexibel ingericht kan worden met meetinstrumenten. Alle hiervoor genoemde kenmerken van ROM in de GGZ gelden onverkort voor de tbs-sector. De totstandbrenging of versterking van een reeds aanwezige meetcultuur wordt de laatste jaren in de tbs-sector al nagestreefd en heeft bijvoorbeeld geleid tot tbs-brede implementatie van routinematige risicotaxatie. Behandelevaluatie met instrumenten die qua meetpretentie dichter bij de interventie staan, wordt wel op sommige instellingen maar nog niet sectorbreed toegepast. ROM is goed toepasbaar in de tbs-sector. Een voordeel van de tbs-sector in vergelijking met de wereld buiten de kliniek is de grote controle die er is over de patiënten. Dit zal het verwerven van gegevens over hun gedrag en/of klachten vergemakkelijken. Kenmerken van de tbs-sector brengen aldus niet alleen beperkingen met zich mee voor therapie-effectonderzoek. Dataverlies omdat patiënten niet langer willen meewerken aan het meten van hun klachten of functioneren zal veel minder voorkomen dan in de GGZ, waar 30-40% verlies per meetronde gebruikelijk is. Een succesvolle implementatie van ROM zal leiden tot een ‘meetcultuur’ in de instelling. Om zo’n meetcultuur tot stand te brengen dienen met name behandelaars hun voordeel te kunnen doen met de gegevens die gegenereerd worden. Zij zullen vooral baat hebben bij uitkomstgegevens van individuele patiënten, die direct betrekking hebben op hun interventie en die sturend kunnen zijn bij de verdere planning van behandeling. Wanneer eenmaal een meetcultuur tot stand
PROCES 2010 (89) 5
339
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
Edwin de Beurs & Marko Barendregt
is gebracht, kunnen daarmee naast ROM ook andere vormen van onderzoek worden ondersteund. Een RCT of single case-studies laten zich eenvoudiger implementeren als men er al aan gewend is dat er routinematig gemeten wordt in de instelling. Samenwerking tussen meerdere tbs-instellingen en onderlinge afstemming zijn wenselijk om te komen tot een kernset van meetinstrumenten die door iedereen gedeeld wordt, zo mogelijk landelijk. Een voordeel van onderlinge afstemming is dat niet elke instelling het wiel opnieuw hoeft uit te vinden. Ook maakt afstemming de onderlinge vergelijking van effectiviteit mogelijk (benchmarking). Ten slotte voorkomt afstemming informatieverlies bij overplaatsing van een tbsgestelde. Het zal naar verwachting de nodige moeite kosten om overeenstemming te bereiken in het veld over welke meetinstrumenten deel zouden moeten uitmaken van een regelmatig terugkerende batterij. Het lijkt raadzaam consensus te zoeken over een beperkte kernset, zodat er genoeg ruimte overblijft voor andere meetinstrumenten waarmee in de verschillende instellingen al een lange traditie is opgebouwd. Deze kernset zou kunnen bestaan uit algemene en stoornisspecifieke uitkomstmaten die met een vastgestelde regelmaat worden afgenomen bij de tbs-gestelden. Te denken valt aan risicotaxatie-instrumenten (bijvoorbeeld de HKT-30,16 de FP40,17 FOTRES18), delictspecifieke of stoornisspecifieke uitkomstmaten en event monitoring van agressieve incidenten (bijvoorbeeld SOAS-r19). Het is in ieder geval van belang ook meetinstrumenten in te zetten die inhoudelijk goed aansluiten bij de doelstelling van de te evalueren interventie. Uitspraken doen over de werkzaamheid van een therapie(vorm) op grond van de observationele gegevens is niet het primaire doel van ROM, maar is niet onmogelijk. Het grootste probleem dat optreedt wanneer er geen willekeurige toewijzing aan therapiecondities heeft plaatsgehad, is vertekening van de uitkomsten door zogenoemde confounders. Dit zijn varabelen die een effect hebben op de therapieuitkomst en die niet evenredig zijn verdeeld over de verschillende behandelingen (bijvoorbeeld: de assertieve patiënten hebben vooral behandeling X gekregen, de non-assertieve vooral behandeling Y). Er zijn voorstellen gedaan in de methodologische onderzoeksliteratuur om met potentiële confounders om te gaan bij uitkomstgegevens uit een observationele studie. De propensity score modeling-strategie is een elegante statistische methode voor het analyseren van data verkregen
16 17 18 19
340
Ministerie van Justitie, Handleiding HKT-30 versie 2002, risicotaxatie in de forensische psychiatrie, Den Haag: Ministerie van Justitie, Dienst Justitiële Inrichtingen 2003. E.F.J.M. Brand & G.J.M. Diks, Handboek Forensisch Psychiatrische Profielen. Handleiding FP40, Den Haag: Ministerie van Justitie, Directie Justitiële Inrichtingen, CUB/ID 2001. F. Urbaniok, FOTRES, Forensisches Operationalisiertes Therapie-Risiko-Evaluations-System, Oberhofen am Thunersee: Zytglogge Verlag 2007. H.L.I. Nijman, W.F.F. Allertz & J.L.M.G. à Campo, ‘Agressie van patiënten: een onderzoek naar agressief gedrag op een gesloten opnameafdeling’, Tijdschrift voor Psychiatrie 1995, 37(4), p. 329-342.
PROCES 2010 (89) 5
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek
met observationeel onderzoek waarbij aselecte toewijzing ontbrak.20 Ten slotte noemen we nog het onderzoek van Ferriter en Huband.21 Zij vergeleken de uitkomsten van RCT’s en gecontroleerde, maar niet gerandomiseerde, studies in het forensische veld en concludeerden dat de effectgroottes die in beide typen onderzoek gerapporteerd worden aan elkaar gelijk waren. Hun conclusie is dat goed uitgevoerde gecontroleerde studies waarbij randomisatie ontbreekt toch een belangrijke bijdrage kunnen leveren aan de evidence base van het forensisch veld. Responsiviteitsonderzoek (prognostische variabelen) Wanneer aangetoond is dat een behandeling werkt en effectief is op groepsniveau, is het vervolgens relevant te weten voor wie en onder welke omstandigheden die behandeling werkt. Bij toepassing van een bewezen effectieve behandeling is er doorgaans een aanzienlijke groep patiënten die geen baat heeft bij de behandeling. Zo laten internationale studies onder seksueel delinquenten zien dat behandeling recidive reduceert.22 Desondanks recidiveert 1 op de 10 delinquenten na behandeling.23 Het is om die reden belangrijk inzicht te krijgen in de factoren die bepalen bij wie een behandeling al dan niet aanslaat en of de behandeling wordt volgehouden. Op basis daarvan kunnen er programma’s worden ontwikkeld om drop-outs zo veel mogelijk te voorkomen. Dergelijke factoren worden binnen de medische wetenschap prognostische variabelen genoemd. Binnen de forensische psychiatrie staan deze ook bekend onder de naam ‘responsiviteitsfactoren’. Deze factoren kunnen worden onderverdeeld in enerzijds interne factoren en anderzijds externe factoren.24 Interne factoren zijn kenmerken van de patiënt zelf, die van invloed kunnen zijn op diens vermogen om van een behandeling te profiteren. Denk daarbij aan leeftijd, culturele factoren, geslacht, behandelmotivatie en behandelbereidheid, ontkenning van het delict, intellectuele capaciteiten, psychische stoornis, attitudes als vijandigheid of weerstand. Externe responsiviteitsfactoren zijn kenmerken van het behandelteam en de behandelsetting, zoals vorm van de behandeling (groepstherapie versus individueel), open versus gesloten groepsformat, therapeutische communities, eigenschappen van 20
21 22 23
24
Er wordt bij de propensity score-methode rekening gehouden met potentiële confounders of matchingsvariabelen door voor iedere deelnemer te berekenen wat de kans is om tot de behandelde of de controlegroep te behoren op basis van de confounding-variabelen. Dit resulteert in een propensity score. Bij de uiteindelijke vergelijking van de resultaten wordt rekening gehouden met deze score, bijvoorbeeld door hem als een covariaat mee te nemen in de analyse. Een gedetailleerde uitwerking van de methode valt buiten het bestek van dit artikel en we verwijzen de geïnteresseerde lezer naar K.H. Hullsiek & T. Louis, ‘Propensity score modeling strategies for the caual analysis of observational data’, Biostatistics 2002, 2, p. 179-193. M. Ferriter & N. Huband, ‘Does the non-randomized controlled study have a place in the systematic review? A pilot study’, Criminal Behaviour and Mental Health 2005, 15, p. 111-120. V.C. Veen & C. De Ruiter, ‘De effectiviteit van behandelingen bij seksuele delinquenten; Een overzicht van de internationale literatuur’, Justitiële Verkenningen 2005, 31, p. 75-94. R.K. Hanson & K.E. Morton-Bourgon, ‘The characteristics of persistent sexual offenders: a metaanalysis of recidivism studies’, Journal of Consulting and Clinical Psychology 2005, 73, p. 1154-1163. J. Looman, I. Dickie & J. Abracen, ‘Responsivity issues in the treatment of sexual offenders’, Trauma Violence Abuse 2005, 6, p. 330-353.
PROCES 2010 (89) 5
341
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
Edwin de Beurs & Marko Barendregt
de therapeut (onder andere empathie, warmte, belonend, directief/niet-confrontatief, interpersoonlijke vaardigheden). Een belangrijkste interne responsiviteitsfactor bij effectiviteitsstudies in de tbs is behandelmotivatie.25 Gezien het gedwongen karakter van de tbs is motivatie bij de tbs-gestelde om te veranderen, anders dan bij patiënten in de reguliere GGZ die zelf hulp zoeken, niet vanzelfsprekend. Deze verschillen maken dat aangetoonde effectiviteit van een behandeling binnen een vrijwillige setting als de GGZ niet automatisch gegeneraliseerd kan worden naar de tbs. Ook neurobiologische en neuropsychologische variabelen zijn potentieel waardevolle interne responsiviteitsfactoren. De laatste jaren is er aanzienlijke voortgang geboekt met onderzoek naar de relatie tussen het functioneren van het brein en impulsief, agressief en antisociaal gedrag. De uitkomsten van dergelijk onderzoek kunnen relevant zijn voor effectonderzoek in de tbs. Een verstoorde HPA-as, een verhoogde impulsiviteit ten gevolge van deficiënties in prefrontale executieve functies, minder empathie ten gevolge van een verminderde gevoeligheid voor oxytocine of vasopressine, en een verhoogde genetische kwetsbaarheid voor verslaving, kunnen allemaal factoren zijn die een goede behandeluitkomst in de weg staan. Conclusie en aanbevelingen Uit het voorgaande vloeien drie aanbevelingen voor het veld voort: (1) opzetten van infrastructuur ten behoeve van ROM; (2) opzetten van kleinschalig waarlijk experimenteel onderzoek; en (3) onderzoek naar responsiviteitsfactoren. De infrastructuur voor ROM maakt niet alleen outcomes-onderzoek mogelijk: wanneer eenmaal een infrastructuur is opgezet en in uitvoering is gebracht, is ook het andersoortige therapie-effectonderzoek (single case designs en gecontroleerde clinical trials, al dan niet gerandomiseerd) makkelijker te implementeren. Uiteindelijk blijven experimentele designs, en dan met name RCT’s, de sine qua non om de werkzaamheid van specifieke interventies aan te tonen. Deze infrastructuur dient te zorgen voor gestandaardiseerde diagnostiek en indicatiestelling, monitoring van behandeling en monitoring van het effect. Alvorens deze infrastructuur te realiseren dienen keuzes te worden gemaakt omtrent instrumentarium en de praktische implementatie van monitoring (bijvoorbeeld wanneer te meten) en scholing van medewerkers in de toepassing van de instrumenten en de interpretatie van de resultaten. Het gezamenlijk realiseren van een goede infrastructuur voor therapie-effectonderzoek biedt grote (schaal)voordelen. Dat hoeft er niet aan in de weg te staan dat instellingen eigen wensen en bestaande onderzoekslijnen onderbrengen in een ROM-structuur. De omvang van de patiëntenpopulaties met overeenkomstige pathologie is in individuele tbs-instellingen te klein om goed onderzoek naar therapie-effect te doen en noopt tot multi-center trials, wat samenwerking van instellingen impliceert. Bovendien levert een landelijke implementatie het voordeel dat 25
342
K.H. Drieschner, S.M. Lammers & C.P. van der Staak, ‘Treatment motivation: An attempt for clarification of an ambiguous concept’, Clinical Psychology Review 2004, 23, p. 1115-1137.
PROCES 2010 (89) 5
Dit artikel uit PROCES is gepubliceerd door Boom Juridische uitgevers en is bestemd voor Universiteit Leiden
De evidence base van zorgprogramma’s in de tbs: een visie op therapie-effectonderzoek
er geen informatieverlies optreedt bij overplaatsing van patiënten naar andere instellingen. Essentieel voor het opzetten van een landelijke monitoring van therapie-uitkomsten is dat in alle klinieken op vergelijkbare wijze gemeten wordt. Daarvoor is consensus nodig over een beperkte batterij van te gebruiken onderzoeksmaterialen (primaire uitkomstmaten, secundaire uitkomstmaten, treatment integrity checklists). Er dient hierbij ook aandacht te zijn voor speciale doelgroepen, zoals zwakbegaafden en jeugd. In de tbs-sector is de laatste jaren veel gedaan aan instrumentontwikkeling en er is ruime expertise opgebouwd, met name met risicotaxatie-instrumenten, beoordelingsschalen en de monitoring van (agressieve) incidenten. Het verdient aanbeveling te komen tot een inventarisatie van wat in gebruik is aan meetinstrumenten in de verschillende instellingen. Het is hierbij belangrijk om onderscheid te maken tussen (1) verschillende methoden (beoordeling, zelfrapportage, event monitoring); (2) verschillen in niveau van meten (dicht bij de te evalueren interventie of juist meer generiek, zoals bijvoorbeeld risicotaxatie); en (3) verschillende subpopulaties in de tbs. Na een inventarisatie kan er worden nagegaan of er iets gemeenschappelijks uit te distilleren valt. Ook zou landelijk gebruik van dezelfde generieke meetinstrumenten benchmarking van instellingen in de tbs mogelijk maken, bijvoorbeeld op het aantal (voltooide) behandelingen of succesvol gemeten patiënten en, op termijn, op de uitkomst van de behandeling in termen van recidive. Ontwikkeling van een benchmark is ook wenselijk vanwege de nieuwe aanbieders van tbs-behandeling die zich op de markt aandienen. Het creëren van een infrastructuur voor ROM maakt niet alleen outcomes-onderzoek mogelijk: wanneer eenmaal een infrastructuur is opgezet en in uitvoering is gebracht, is ook het andersoortige therapie-effectonderzoek waarvoor we pleiten (single case designs en gecontroleerde clinical trials, al dan niet gerandomiseerd) makkelijker te implementeren. Uiteindelijk blijven experimentele designs, en dan met name RCT’s, de gouden standaard om de werkzaamheid van interventies aan te tonen. De tweede aanbeveling is dan ook om, gebruikmakend van de ROMinfrastructuur, single case designs en RCT’s te ontwikkelen. Met behulp van deze laatste twee designs is de werkzaamheid van specifieke interventies het best te onderzoeken. Ten slotte zal responsiviteitsonderzoek naar interne en externe factoren kunnen helpen bij het indiceren van de meest passende behandeling en zo een optimale match mogelijk maken van kenmerken van de tbs-gestelde en de behandeling.
PROCES 2010 (89) 5
343