HET N=1 DESIGN IN CAM-ONDERZOEK
Methodiek en theorie met betrekking tot het effectiviteitonderzoek in de complementaire en alternatieve geneeswijzen
Stichting CAM-research Amsterdam, februari 2010
INHOUDSOPGAVE
Pagina
Samenvatting, conclusies en aanbevelingen
2
Hoofdstuk 1. Algemeen inleidende opmerkingen
6
Hoofdstuk 2. Kader en definitie van N=1 onderzoek
8
Hoofdstuk 3. Criteria voor de opzet van een N=1 onderzoek
11
Hoofdstuk 4. Uitwerking specifieke sub-designs
14
Hoofdstuk 5. Theoretische context
19
Bijlagen I
Methodologische aspecten
22
II
Korte vergelijking van RCT en N=1 designs
34
III Criteria voor evidence based medicine
36
IV Geraadpleegde literatuur
37
-1-
Samenvatting, conclusies en aanbevelingen
Algemeen Doel van het rapport is om de theorie en methodiek van het N=1 onderzoek te verhelderen en om aldus een basis te bieden voor de dialoog met voorstanders van een meer experimentele benadering van het effectiviteitsprobleem in de gezondheidszorg. De methodiek van het N=1 onderzoek is van belang te achten voor het terrein van de complementaire geneeswijzen, omdat artsen en therapeuten die op dit terrein werkzaam zijn, overwegend uitgaan van (gehele) mens-gerichte methoden in de diagnostiek en therapie. Bezwaren die kunnen worde aangevoerd tegen experimentele designs als het RCT betreffen het feit dat deze slechts bevindingen op categorie-niveau opleveren, dat de aandacht eenzijdig gericht is op de genezende kracht van middel of methode als zodanig, dat deze onderzoeksdesigns doorgaans ver afstaan van de dagelijkse praktijksituatie, en dat dus de resultaten ervan slechts beperkt generaliseerbaar zijn. Daarmee wordt het “gouden standaard”-karakter van bijvoorbeeld het RCT ter discussie gesteld en dient zich vervolgens de noodzaak aan “sophisticated” observationele designs nader te verkennen en zo nodig verder te (doen) ontwikkelen. Het onderhavige rapport wil aan deze ontwikkeling concreet bijdragen. (De bovenstaande opmerkingen zijn nader uitgewerkt in hoofdstuk 1)
Globale positie bepaling van het N=1 onderzoek De essentie van het N=1 design is hierin gelegen dat de resultaat-beoordeling gebaseerd is op de voortgang van genezingsprocessen in individuele patiënten. Meerdere van dergelijke beoordelingen bij vergelijkbare patiënten kunnen, zo luidt de stelling, onder nader te bepalen voorwaarden tot valide gevolgrekkingen leiden inzake de effectiviteit van een behandeling. Enkele praktische voordelen van het N=1 design zijn: tevens inzicht in de hoe- en waarom-vraag waardoor betere bijsturing van het therapeutische proces, er kan met een geringer aantal patiënten worden volstaan, tussentijdse resultaat-aanwijzingen komen beschikbaar, de patiënt is nauwer betrokken en gemotiveerd, einduitkomsten zijn sneller bekend, en de kosten van het onderzoek zullen doorgaans lager uitvallen. Het N=1 design betreft in feite een familie van designs; het zou daarom wellicht beter zijn om te spreken van een N=1 kader. Onder een N=1 design of kader wordt in dit rapport verstaan: al het onderzoek dat, (1) op basis van een integrale/holistische benadering, een evaluatie betreft van (2) gerealiseerde gezondheidsverandering bij individuele patiënten, zoals (3) vastgesteld op basis van meerdere meetpunten, en met (4) een zo gering mogelijke verstoring van de normale behandelsituatie. Voorbeelden zijn: de klassieke casestudy, het ABAB-design (afwisselend wel en niet behandelen) en multivariate database-analyses. Bijzonder aan alle hier bedoelde sub-designs is dat uitgegaan wordt van een breder behandeldoel, van sturingsprocessen en van patroonanalyse. (De bovenstaande opmerkingen zijn nader uitgewerkt in hoofdstuk 2)
-2-
Criteria voor de opzet van een N=1 onderzoek In het rapport is een checklist van criteria opgesteld die onderzoekers, die met een N=1 design willen gaan werken, kunnen volgen bij de voorbereiding daarvan, of die door derden kan worden gebruikt bij bijvoorbeeld (de beoordeling van) een subsidieaanvraag. Hiervoor zijn de criteria voor een RCT als uitgangspunt genomen, en waar nodig toegespitst op de situatie van een onderzoek volgens het N=1 kader. Het gaat dan om een goede operationalisering van de onderzoeksvraag, een duidelijke populatie- c.q. steekproefomschrijving, specificatie van te hanteren onderzoeksinstrumenten, de precieze opzet van het onderzoek als zodanig, eventuele blindering en randomisatie, de resultaat-beoordeling, ethische aspecten, implementatie van de resultaten etc. (Een en ander is nader uitgewerkt in hoofdstuk 3; enkele methodologische problemen worden kort aangestipt in bijlage 1). Uitwerking van enkele subdesigns Bij wijze van voorbeeld zijn de volgende sub-designs nader uitgewerkt: klassieke casestudy, het ABABdesign, de Multivariate Database Analyse (in zowel een fundamentele als een praktijkgerichte variant), het “time series”-design en een RCT/N=1 combinatie. De klassieke case-study behelst een (niet-kwantitatieve) benadering van een individuele patiënt, met een gedetailleerde beschrijving van klachtenpatroon of ziekte, voorgeschiedenis, behandelverloop, reacties van de patiënt en/of resultaat beoordeling Het ABAB-design wordt ook wel aangeduid als single subject experimental design. Hierbij wordt eerst een baseline-periode onderscheiden waarin nog niet wordt behandeld (A), vervolgens een test-periode met behandeling (B), daarna opnieuw een therapie-vrije periode (withdrawal, A), eventueel gevolgd door weer een behandelperiode (B) etc. In iedere periode worden belangrijke parameters vastgelegd voor de resultaatmeting De Multivariate Database Analyse (MDA) richt zich in beginsel op de (statistische) analyse van databases inzake in de tijd verlopende waarden van individuele personen op voor het onderzoek relevante kenmerken. Hier worden twee varianten onderscheiden: 1) een fundamentele die zich richt op bijvoorbeeld de identificatie van patronen in de bio-markers van (chronische) patiënten op opeenvolgende tijdstippen in de ontwikkeling van hun ziekte of aandoening, en 2) een praktijk-gerichte variant die uitgaat van via een (elektronisch) registratiesysteem in de complementaire praktijk verkregen gegevens van de patiënt en zijn/haar behandeling. Doel van beide analyses is om patronen in het materiaal te identificeren evenals opeenvolgende stadia in het ziekte- of herstelproces. Het time-series design lijkt slechts beperkt toepasbaar in de medische praktijk gezien de grote hoeveelheid meetmomenten die hiervoor zijn vereist. De analyse over vele meetpunten is gericht op het identificeren van (genezings)trends door het uitsluiten van seizoens- en toevalsfluctuaties. Combinaties van RCT- en N=1 designs lijken mogelijk, zij het complex van opzet en interpretatie. Enkele overige designs verdienen het volgens de opstellers van het rapport om nader bestudeerd te worden. Genoemd worden: patiënt tevredenheidonderzoek, de Routine Outcome Assessment, de cohortanalyse, het Bayesiaanse theorema, en de “Grounded theory”. (De gemaakte opmerkingen worden nader uitgewerkt in hoofdstuk 4)
-3-
Theoretische context In het complementair geneeskundig onderzoek is men zich in groeiende mate bewust van de vaak nauwe relatie tussen theorie, met name wat betreft de daaraan ten grondslag liggende aannames en uitgangspunten, en onderzoeksmethode. Daarnaast is men geneigd meer over de grenzen te kijken van de eigen discipline (biologie, voedingswetenschappen, sociale wetenschappen etc). Daardoor groeide het inzicht in de multifactoriële bepaaldheid (ook in de tijd gezien) van veel verschijnselen. Het complex van interacties in en rond het ontstaan van een ziekte als ook bij het herstel daarvan, kwam daardoor steeds meer centraal te staan. Dit vraagt om andere analysemethoden en om multidisciplinaire samenwerking, ook -en soms zelfs jùist- buiten de eigen medische discipline. Heterogeniteit, individualiteit, interactiviteit en coherentie zijn hier de sleutelbegrippen. Enige specifieke toepassingen van deze systeem-gebaseerde benadering worden in het rapport kort besproken. (Deze opmerkingen worden nader uitgewerkt en onderbouwd in hoofdstuk 5)
Methodologische aspecten Als bijzondere methodologische problemen in geval van een N=1 onderzoekskader zijn de volgende te noemen. 1. Bij de toepassing van een N=1 design gaat het bijna steeds om de bijdrage die het onderzoek kan leveren aan de oplossing van een concreet probleem, in casu de ziektetoestand van de patiënt; vanuit deze individuele oplossingen zal de algemeen verklarende theorie moeten ontstaan of een aanscherping daarvan (bijvoorbeeld door een nadere specificatie van de condities waaronder een uitspraak waar is). 2. Binnen CAM wordt gesteld dat iedere patiënt uniek is; heterogeniteit c.q. inter-individuele variatie, is het uitgangspunt. De analyse dient zich er dan op te richten de individuele variatie in behandeluitkomsten te verklaren vanuit de variatie in zijn antecedente factoren. 3. Een belangrijk kenmerk van CAM-behandelingen is dat doorgaans met een individueel afgestemde combinatie van methoden (en adviezen) wordt gewerkt. Onderdelen uit deze combinatie worden i.h.a. op uiteenlopende momenten in het behandelproces ingezet; tussentijdse aanpassingen in de onderzochte behandeling zijn daarbij eerder regel dan uitzondering. De voortgang van dit proces is nonlineair. 4. Uiteindelijk doel moet zijn de rationaliteit te doen toenemen van de te maken keuzes van de arts/therapeut ten aanzien van de interventie in ziekteprocessen. Het gaat daarbij zowel om de rationaliteit van de behandeling als geheel als van die van de afzonderlijke therapieonderdelen en de volgorde waarin deze zijn of worden ingezet. 5. Een N=1 studie vereist steeds een nauwgezette registratie van zowel het ziektebeloop c.q. herstelproces als van de gepleegde interventies (en van eventuele bevorderende dan wel belemmerende factoren daarbij). Dit vraagt om daarop toegesneden computerprogramma‟s. Deze zijn in ontwikkeling. 6. In het algemeen zal N=1 onderzoek plaats vinden in de eigen praktijk van een arts of therapeut. De omstandigheden aldaar gelijken het meest op “real life”. Anderzijds zijn hieraan risico‟s verbonden voor de kwaliteit van het onderzoek, de belastbaarheid van de patiënt en de generaliseerbaarheid van de resultaten. Een vorm van externe ondersteuning dient daartoe te worden ontwikkeld.
-4-
7. Voor de CAM-praktijk lijkt sprake van een bijzonder probleem wat betreft de uitval van patiënten. In de beginfase van de behandeling kunnen patiënten afhaken om niet-medische redenen, in latere fasen achten zij zich soms zodanig hersteld dat zij voortzetting van de behandeling niet noodzakelijk vinden. Beide factoren dienen in aanmerking te worden genomen bij het beoordelen van de effectiviteit. 8. In de CAM-praktijk moet een duidelijk onderscheid worden gemaakt tussen de “behandeling zoals bedoeld” en de “behandeling zoals gerealiseerd”. Discrepanties moeten worden beschreven en hun invloed op de beantwoording van de primaire onderzoeksvraag moeten worden verklaard. 9. Aangezien iedere patiënt en dus behandeling uniek is, bestaat behoefte aan een nieuwe samengestelde variabele die hier als “therapeutische adequaatheid” wordt omschreven. Naarmate de therapie die daadwerkelijk door de patiënt is genoten beter gelijkt op de therapie zoals die idealiter zou dienen te hebben plaatsgevonden, zou de aangetoonde effectiviteit (geboekte gezondheidswinst) groter moeten zijn. Een en ander zal nog nader dienen te worden uitgewerkt. 10. Bij het N=1 design gaat het om genezingsprocessen bij individuele patiënten. Dit vraagt niet alleen om een evaluatie van het eindresultaat in termen van de start-situatie, maar vooral om een analyse van het tussenliggende proces. Juist daaruit zal zichtbaar moeten worden dat het eindresultaat geleidelijk wordt “geproduceerd”. Een nieuwe statistiek in de vorm van non-lineaire varianten van de multivariate analyse lijkt hierbij noodzakelijk. 11. In de CAM-praktijk wordt ervan uitgegaan dat het eindresultaat van een interventie niet alleen afhankelijk is van het gekozen middel c.q. combinatie van middelen, maar dat een veelheid van (secundaire) factoren in aanmerking moet worden genomen voor het bereiken en dus ook voor het verklaren daarvan. Als belangrijke secundaire factoren zijn daarbij te noemen: vertrouwensrelatie tussen arts en patiënt, therapie-trouw, stress reductie, steun van het primaire milieu etc. (De voorgaande opmerkingen worden nader uitgewerkt in bijlage 1) Enkele belangrijke conclusies en aanbevelingen 1. Het is noodzakelijk en mogelijk het effectiviteitsonderzoek op CAM-gebied te verrichten met behulp van het zogenoemde N=1 design; de relatie met onderliggende theoretische uitgangspunten dient daarbij verhelderd te worden. 2. Er dient een dialoog tot stand te komen tussen aanhangers van N=1 designs en die van meer experimentele designs over de bewijskracht van beide typen designs met betrekking tot het vaststellen van de effectiviteit van geneeskundige interventies. 3. Van overheidswege dienen geldmiddelen en overige faciliteiten beschikbaar te worden gesteld voor de (verdere) ontwikkeling van N=1 designs, met specifieke aandacht voor CAM. 4. De Stichting CAM-research dient op korte termijn te starten met de opzet van onderzoek in praktijken van complementair werkende artsen en therapeuten ten behoeve van de vaststelling van de effectiviteit van dit type interventies. 5. Op korte termijn dienen computer programma‟s beschikbaar te komen voor de systematische registratie van interventies in geselecteerde CAM praktijken.. 6. De Stichting CAM-research dient het initiatief te nemen tot een rondetafel overleg tussen alle partijen in het CAM-veld die zich willen inzetten voor de erkenning en verdere ontwikkeling van het wetenschappelijk onderzoek terzake van CAM.
-5-
Hoofdstuk 1. Algemeen inleidende opmerkingen
Doelen van dit rapport De belangrijkste doelen van dit rapport zijn de volgende: 1. Het zodanig presenteren van opvattingen betreffende de meest geschikte methodiek(en) voor effectiviteitsonderzoek van complementaire en/of alternatieve behandelwijzen dat daarmee een platform wordt geschapen voor een grondige methodologiediscussie tussen “regulier”en “complementair”. 2. Het bieden van steun aan onderzoekers die zich willen oriënteren op geschikte methoden voor een effectiviteitsonderzoek naar een complementaire of alternatieve geneesmethode. 3. Daarnaast biedt dit rapport een “state of the art” voor de leden van het Platform CAM-research op grond waarvan de voortgezette interne methodologieontwikkeling kan plaatsvinden.
De vijf basiskenmerken van CAM 1
In het algemeen kenmerkt CAM zich door de volgende vijf beginselen c.q. werkwijzen: 1. De aandacht is gericht op de gehele mens, dus de persoon als een geïntegreerde eenheid van lichaam, geest/ziel en sociaal wezen. Dit “holistische” denken weerspiegelt zich zowel in de diagnostiek (zoeken naar totaalbeeld van de zieke) als in de behandeling (totaalbehandeling). 2. Gerichtheid op duurzaam herstel van gezondheid, zelfredzaamheid en welbevinden van de zieke in plaats van op louter de bestrijding van symptomen of de ziekte als zodanig. 3. Gerichtheid op herstel en de stimulering van het zelfregulerende vermogen van de mens. 4. Een expliciete voorkeur voor middelen die niet schaden, met name zogenoemd “natuurlijke” middelen en methoden. 5. Benadering van de patiënt als partner, met wie interactief wordt samengewerkt aan de optimalisering van diens gezondheidstoestand. Hoewel zich baserend op een ander paradigma dan dat van de reguliere of schoolgeneeskunde, is de behoefte aan en noodzaak van wetenschappelijke onderbouwing hier van dezelfde orde. Het Randomized Controlled Trial (RCT) is hierbij zeker een optie te achten, maar aangezien daaraan enkele voorwetenschappelijke beginselen ten grondslag liggen die niet direct aansluiten bij het CAM-paradigma, moet daarnaast worden gezocht naar onderzoeksmethoden die meer recht doen aan de uitgangspunten van CAM.
¹ Complementary and Alternative Medicine -6-
Enkele vraagtekens bij RCT Bij het design van het RCT en de status daarvan als “gouden standaard” kunnen met name de volgende vraagtekens worden geplaatst. 1) de aanname dat het bewijs voor de invloed van een bepaalde interventie op individuele patiënten kan worden verworven in een experimentele proefopstelling bij categorieën van patiënten (met zijn loskoppeling van de actuele behandelsituatie en standaardisering van behandelcondities). 2) de aanname dat het proces waarin genezing tot stand komt, niet relevant is voor het verwerven van inzicht in het nut van een specifieke behandeling. 3) de aanname dat alleen het middel of de behandelmethode als zodanig voldoende is voor het teweegbrengen van genezing (met uitsluiting van factoren als motivatie van de patiënt, zijn leefwijze en leefsituatie, sociale steun, het vertrouwen in de arts, een suggestieve houding van de behandelaar, de behandelomgeving etc. Kortom: verwaarlozing van de contextfactoren). 4) de aanname dat zulk onderzoek moet plaatsvinden bij patiënten met identieke (westers reguliere) diagnoses (wat geen ruimte laat voor een meer holistische diagnostiek c.q. bredere typering van de problematiek van de patiënt). Voor een wat uitgebreidere argumentatie wordt verwezen naar bijlage II
Het N=1 design als een mogelijk alternatief Recentelijk dienen zich steeds meer voorbeelden en methoden aan van andere bruikbare designs bij het onderzoek naar de effectiviteit van interventies in de medische situatie. Een daarvan is het zogenoemde N=1 design. Omdat dit -in de medisch-wetenschappelijke sector- een betrekkelijk weinig toegepaste methodiek betreft, waaromtrent nog de nodige onduidelijkheid bestaat, heeft het CAM-netwerk van onderzoekers in het najaar van 2007 daarover in eigen kring een studiedag gehouden. Bij de evaluatie daarvan door de toenmalige stuurgroep van dit Netwerk werd besloten de methodiek van het N=1 onderzoek verder uit te (doen) werken en te bespreken met experts op dit gebied. Dit rapport vormt hiervan de voorlopige neerslag. Daarbij bestaat het besef bij de stuurgroep dat wat betreft rigiditeit van onderzoeksmethodiek het complementaire veld zeker nog het een en ander kan leren van de regulier medische onderzoekservaringen. Anderzijds bestaat de overtuiging dat het N=1 design ook goed valt toe te passen binnen de reguliere setting, bijvoorbeeld bij zeldzame ziektebeelden of complexe patiënten/of behandel situaties. Ieder design heeft uiteraard zijn sterke en zwakke punten. Het nut voor en de medewerking van de patiënt kan dan doorslaggevend zijn bij de keuze voor een specifiek design. Een helder overzicht van bedoelde voor- en nadelen lijkt noodzakelijk, maar valt buiten het kader van het huidige overzicht.
-7-
Hoofdstuk 2. Kader en definitie van N=1 onderzoek
2.1 Algemene opmerkingen over het N=1 design
De essentie van het N=1 design is, dat de evaluatie van effectiviteit wordt gebaseerd op de voortgang van processen in individuele patiënten. Dat kunnen ook meerdere patiënten zijn. De patiënt wordt hier in beginsel vergeleken met zich zelf: welke verandering in ziekteverschijnselen toont deze aan het einde van (en dankzij) de behandeling ten opzichte van de start-situatie en/of ten opzichte van een placebo of behandelvrije periode. Het is in het algemeen niet de bedoeling dat bij het n=-1 design de onderzoeker de bewijsvoering zou baseren op slechts één enkele patiënt. In beginsel gaat het hier om een vorm van proces-analyse.
Het is een belangrijk voordeel van het N=1 onderzoek dat het goed bruikbaar is voor onderzoek in de dagelijkse praktijk van de zorgverlening, omdat behandeling en onderzoek hierbij gemakkelijk aan elkaar gekoppeld kunnen worden. Bovendien kan de behandelaar doorgaans direct, op grond van de reacties van de patiënt, de behandeling bijstellen. Anders dan bij het RCT--design, waaruit alleen harde conclusies getrokken kunnen worden over de effectiviteit van een interventie, is de onderzoeker bij het N=1 design vaak tevens in staat om te achterhalen bij welke behandeling, duur of dosering het beste effect optreedt. Een ander groot voordeel van het n=1 design is dat men niet zo veel patiënten nodig heeft als in een experimenteel onderzoek. Daarbij kan de onderzoeker in een N=1 design zoveel observatie- en meetmomenten invoeren als hij wenst en de situatie toelaat. Drie meetmomenten zijn hier echter wel het absolute minimum. Een aansluitende vraag is hoe de meetmomenten in de tijd gespreid dienen te worden. Daartoe onderscheidt de onderzoeker doorgaans enkele duidelijke fasen in het verloop van de ziekte en behandeling, en bepaalt hij de meetmomenten dienovereenkomstig. Daarbij is wel aan de orde hoe vaak het experiment herhaald moet worden om conclusies te kunnen trekken voor de toepassing bij andere patiënten of in andere behandelsituaties. N=1 onderzoek leidt tot minder „harde‟ resultaten dan een RCT m.b.t. het effect van een interventie maar zegt wel meer over het daadwerkelijke beloop van de ziekte. Het gaat dan vooral om een afweging van „interne‟ versus „externe‟ validiteit. Voorts is het een voordeel te achten dat de patiënt bij een n=1 experiment nauw betrokken en gemotiveerd wordt. Tenslotte is het een groot voordeel dat n=1 onderzoeken low budget kunnen worden uitgevoerd, althans aanzienlijk “lower” dan bij een experimenteel onderzoek gebruikelijk is. Er moet overigens op worden gewezen dat het N=1 onderzoek toegepast wordt bij regulier onderzoek, bijvoorbeeld in de hypothese-vormende fase en bij het aantonen van bijwerkingen.
-8-
2.2 Definitie, basale vereisten en sub-designs Het N=1 onderzoek is niet beperkt tot één design, maar is te beschouwen als een familie van designs die qua uitwerkingen van elkaar verschillen. Het zou dan ook voor de begripsvorming beter zijn om in het vervolg te spreken van een N=1 kader, omdat binnen dat kader uiteenlopende (sub)designs mogelijk zijn. Het accent ligt daarbij op de toepassing binnen het gebied van CAM.
Onder het N=1 kader wordt dan verstaan: 1: behandelaar en onderzoeker gaan uit van een integrale, soms holistisch genoemde, denk- en werkwijze.; de diagnostiek betreft het totale functioneren van de patiënt als een persoon, en de behandeling is gericht op balansherstel bij deze totale persoon-in-zijn-context. Dit heeft directe consequenties voor aard en aantal van te meten variabelen en hun analyse. 2: de individuele patiënt vormt het object van effect-evaluatie, niet de groep. Het gaat hierbij om een vorm van proces-analyse over de behandelgegevens van individuele patiënten. 3: behandeling en onderzoek vinden plaats in een zo natuurlijk mogelijke omgeving c.q. praktijksituatie. 4: er wordt gebruik gemaakt van een reeks van opeenvolgende meetpunten, waarbij een aantal van drie wel het absolute minimum is; deze meetpunten vallen doorgaans samen met de consulten. In dit rapport zullen de volgende sub-designs van het N=1 kader worden besproken 1. Klassieke case study (niet experimenteel, maar observationeel) 2. Het ABAB design (afwisselend wel en niet behandelen; het n=1 experiment) 3. Multivariate Database Analyse - fundamentele variant (system biology) 4. Multivariate Database Analyse - praktijk variant 5. Timeseries (trend-analyses) 6. Gecombineerde RCT/N=1 designs 2.3 Visie op ziekte en behandelen Het N=1 kader lijkt aangewezen voor situaties waarin behandelaars werken vanuit een integrale en complementaire visie op zorg. Zoals reeds betoogd in hoofdstuk 1, wijkt deze benadering op een aantal punten af van de benadering in de gangbare westerse geneeskunde. Enkele concrete argumenten voor een N=1 design zijn gelegen in haar bredere behandeldoel, haar stuur-aspect en haar patroon-denken.. Deze drie aspecten worden hieronder kort toegelicht: 1. Het behandeldoel: als regel zal de beoefenaar van een integrale benaderingswijze zijn doelen ruimer steller dan in de reguliere geneeskunde gebruikelijk is. Men zal deze eerder definiëren in termen van balansherstel, herstel van het zelfregulerende vermogen, bevordering van welbevinden etc. Dit zijn complexe doelstellingen die de inzet van een combinatie van -individueel afgestemde- therapievormen vereisen. Een effect-evaluatie op basis van een experiment op populatieniveau ligt dan minder voor de hand.
-9-
2. Sturing: bij een RCT is het niet toegestaan af te wijken van het onderzoeksprotocol, bijvoorbeeld door tussentijds iets te veranderen aan de therapie of aan de onderzoeksomstandigheden. Bij een integrale, procesmatige benadering is dit laatste niet alleen mogelijk, maar vaak zelfs wenselijk, gezien vanuit het belang van de patiënt. De aangebrachte verandering moet uiteraard bij de interpretatie van het uiteindelijke resultaat worden verantwoord. Op deze manier sturen behandelaar en patiënt de aanvankelijke ziektetoestand op interactieve wijze samen naar een optimaal resultaat. 3. Patroon-analyse: de beoefenaar van integrale benaderingen zal in het algemeen meer denken in termen van patronen en onderlinge samenhangen dan in termen van enkelvoudige verbanden tussen parameters. Ook vanwege dit aspect zijn onderzoeksdesigns, die uitgaan van een evaluatie van effectiviteit op individueel niveau, eerder aangewezen.
-10-
Hoofdstuk 3. Criteria voor de opzet van een N=1 onderzoek
In dit hoofdstuk worden de belangrijkste criteria geformuleerd waaraan een onderzoeksopzet volgens het N=1 design zou moeten voldoen. Hierbij zijn de reguliere criteria voor een RCT als uitgangspunt genomen (zie Bijlage 3). De criteria voor het N=1 design zijn grotendeels identiek aan die voor het RCTdesign, maar zij verschillen qua uitwerking. De criteria voor een onderzoek volgens het N=1 kader worden hieronder als checklist gepresenteerd, met eventueel een korte toelichting. Voor theoretische achtergronden wordt verwezen naar hoofdstuk 5, voor enkele methodologische achtergronden naar bijlage I.
1. Protocol Het protocol beschrijft alle hierna volgende aspecten van het voorgenomen onderzoek zo nauwkeurig mogelijk, en in de aangegeven volgorde. 2. Vraagstelling Het dient duidelijk te zijn welke de vraagstelling is van het onderzoek, zowel in theoretische als in operationele zin. 3. Populatie Een duidelijke omschrijving van de te onderzoeken persoon(en) of populatie is noodzakelijk en wel in drie opzichten: * de feitelijke “steekproef”-kenmerken c.q. de belangrijkste kenmerken van de te onderzoeken persoon(en), inclusief diagnostiek, eventueel de wijze van steekproef trekking, voorlichting aan de patiënt en verwerving van informed consent, eventuele in- en uitsluitingscriteria, mogelijke instroomvertragingen etc. * de populatie waaruit de “steekproef” eventueel wordt getrokken, en * de totale populatie waarnaar wordt gegeneraliseerd. 4. Behandeling Een duidelijke omschrijving van de voorgenomen behandeling. Daarbij moet worden gedacht aan het type behandeling (acupunctuur, fytotherapie etc) en een nadere specificatie daarvan, wie de behandelaar zal zijn, binnen welke setting de behandeling zal plaatsvinden, of het zal gaan om een geneesmiddelinterventie, etc. Ook dient te worden aangegeven of en hoe de behandeling, naar gelang het verloop van het herstelproces, tussentijds kan worden bijgesteld en binnen welke marges. 5. Methoden Hier gaat het vooral om de meetmethoden en specifieke meetinstrumenten die zullen worden toegepast; welke variabelen zullen worden gemeten, hoe en op welke momenten zullen bepalingen worden verricht, (baseline, follow up etc), hoe worden “successes” en “failures” gedefinieerd etc.
-11-
6. Design Welke zal de precieze onderzoeksopzet zijn, wanneer gaat het onderzoek starten, hoe lang gaat het duren, hoeveel patiënten zullen in het onderzoek (moeten) worden betrokken en waarom? Wordt wel of niet met een vergelijkingsbasis gewerkt en zo ja welke, zullen er replicaties plaatsvinden etc. 7. Randomisatie Bij sommige designs (ABAB, N=100?) kunnen vormen van randomisatie plaatsvinden (bijv. ten aanzien van patiënten of ten aanzien van interventies). De betreffende procedures moeten exact worden beschreven. 8. Blindering Indien van toepassing: welke zal de wijze van blindering zijn, double of triple blind, op welk tijdstip wordt de codering verbroken? Door wie wordt de blindering van behandelaars en patiënten begeleid? 9. Veiligheid In beginsel zou er een veiligheidsprotocol dienen te zijn, bijvoorbeeld waar het gaat om het rapporteren en afhandelen van ongewenste bijwerkingen die kunnen optreden (adverse effects). Voor het monitoren daarvan kan eventueel een Qualified Person worden aangewezen. 10. Intention to treat Er moet duidelijk sprake zijn van een “intention to treat” wat betreft de in het onderzoek te betrekken patiënten. 11. Uitval Het aantal uitvallers tijdens het onderzoek dient nauwkeurig te worden vastgelegd, evenals de redenen van hun uitval en het tijdstip waarop. Aangegeven dient te worden hoe de invloed van uitval op de resultaten wordt berekend. Wordt de patiënt wel of niet vervangen en tot welk tijdstip in de voortgang van het onderzoek? 12. Vergelijkbaarheid behandeling(en) Indien de feitelijke behandeling afwijkt van de onder punt 4 beschreven behandeling, dient dit nauwgezet te worden vastgelegd evenals de redenen daarvoor en de mogelijke invloed ervan op het resultaat, al dan niet leidend tot verwijdering van de betreffende patiënt(en) uit het onderzoek.13. Resultaat-beoordeling De wijze waarop het resultaat zal worden beoordeeld dient nauwkeurig te worden beschreven, alsmede het tijdstip waarop deze beoordeling zal plaatsvinden. De beoordeling zal in beginsel plaatsvinden op basis van het verloop van de therapie bij de individuele patiënt. Bij deze evaluatie worden de gegevens van de criteria 11 en 12 betrokken. NB Aan de resultaat-beoordeling ligt een vertrouwelijke “Dossier-bijlage” ten grondslag waarin de behandeling en het herstelverloop van de individuele patiënt(en) zo nauwkeurig mogelijk (op datum) maar geanonimiseerd worden beschreven.
-12-
14. Ethische aspecten Er dient te worden aangegeven waar het protocol zal afwijken van de gangbaar te achten ethische maatstaven voor dit type onderzoek, en waarom (zie Protocol van Helsinki; nog nader uit te werken). 15. Toepasbaarheid Aangegeven dient te worden op welke wijze de resultaten eventueel toegepast kunnen worden binnen de Nederlandse gezondheidszorg. 16. Implementatie Eveneens dient te worden aangegeven hoe de bevindingen van dit onderzoek daadwerkelijk kunnen worden geïmplementeerd binnen de Nederlandse gezondheidszorg. 17. Organisatie Duidelijk moet worden beschreven hoe de continuïteit van het geplande onderzoek zal worden gegarandeerd, in termen van administratie en registratie, personeel (instructie/training), ruimtelijke voorzieningen, instrumentarium, financiering etc. 18. Rapportage Van het verrichte onderzoek zal een systematisch, nauwkeurig en volledig verslag dienen te worden opgesteld dat in beginsel toegankelijk is voor derden. Dit verslag of een bewerking daarvan zal ter publicatie worden aangeboden. Korte toelichting Het protocol omschrijft in beginsel een ideale gang van zaken. Indien de feitelijke onderzoekspraktijk daarvan afwijkt, moet dit nauwkeurig worden vermeld en moet de invloed daarvan op het resultaat expliciet worden beargumenteerd.
-13-
Hoofdstuk 4. Uitwerking specifieke subdesigns
In dit hoofdstuk worden enkele sub-designs die binnen het N=1 kader te onderscheiden zijn, nader uitgewerkt. In paragraaf 2.2 werd al aangekondigd dat dit de volgende sub-designs zullen zijn: * De klassieke case study * Het ABAB design (afwisselend wel en niet behandelen; het n=1 experiment) * De Multivariate Database Analyse - fundamentele variant * De Multivariate Database Analyse - praktijk-variant * De Timeserie (trend-analyses) * Het gecombineerde RCT/N=1 designs * Enkele overige sub-designs
4.1 Klassieke casestudy Dit design behelst een (niet-kwantitatieve) benadering van een individuele patiënt, met een gedetailleerde beschrijving van klachtenpatroon of ziekte, voorgeschiedenis, behandelverloop, reacties van de patiënt en/of resultaat beoordeling. Het is niet per definitie een experiment, maar kan ook achteraf worden beschreven. De klassieke case-study valt binnen het N=1 kader vanwege a. zijn holistisch/integrale benadering, b. de focus op de individuele patiënt, c. een directe koppeling van het onderzoek aan de behandeling (eventueel retrospectief) en d. een opeenvolgende “reeks”van observatiemomenten. Baars (2008) stelt dat de voornaamste reden om een casestudy te verrichten erin is gelegen dat het te bestuderen (sociale) verschijnsel zich niet laat isoleren van de natuurlijke omgeving of levensechte context. Deze auteur noemt de volgende mogelijke nuances binnen het casestudy-design: kwantitatieve of kwalitatieve aanpak, een theorie-toetsend, theorie-vormend dan wel theorie-toepassend karakter, gerichtheid op verklaren of begrijpen, en: klinische casestudy versus actieonderzoek (in dit laatste type staat het veranderdoel centraal). Het door Baars genoemde Therapeutic Causality Report (TCR) van Kiene, kan eveneens tot dit sub-design worden gerekend. Hierbij ligt het accent op de evidente opeenvolging van gebeurtenissen of zijns-toestanden. Als voorbeelden worden genoemd: de direct zichtbare effecten van een computer muis en de luchtpijp snede. Het N=1 design wordt, zoals eerder al opgemerkt (Par. 2.1) ook in de reguliere medische wetenschap veelvuldig toegepast, bijvoorbeeld als voorfase van een RCT, voor het vaststellen en verklaren van bijwerkingen van geneesmiddelen, of voor het verklaren van onverwachte bevindingen. (Bijvoorbeeld Baars 2007)
-14-
4.2 Het ABAB-design Het betreft hier een experimenteel design, om die reden ook wel aangeduid als “single subject experimental design” (Barlow en Hersen 1987). Bij dit design wordt eerst een baseline-periode onderscheiden waarin nog niet wordt behandeld (A), vervolgens een test-periode met behandeling (B), daarna opnieuw een therapie-vrije periode (withdrawal, A), eventueel gevolgd door weer een behandelperiode (B) etc., In iedere periode worden belangrijke parameters vastgelegd ten behoeve van de resultaatmeting. Binnen dit design kunnen vele variaties worden onderscheiden. Dit design valt binnen het N=1 kader omdat a. er sprake is van een integrale, op de persoon als geheel gerichte benadering, b. het gaat om een beoordeling van individuele patiënten, c. het onderzoek plaats vindt in de behandelpraktijk, en d. er sprake is van een opeenvolgende reeks van beoordelingsmomenten. Wanneer bij de behandelde patiënt in een ABAB-design onvermoed herstel optreedt (immers het object van studie wordt in principe gevormd door recidiverende ziektebeelden of gedragsstoornissen), is eerder sprake van een case study. Het ABAB-design leent zich goed voor palliatieve behandelingen bij ongeneeslijke ziekten die met pijn gepaard gaan, zoals artrose, lage rugpijn, rheuma, maar ook bij hartfalen, astma, oorsuizen en meer van dit type ziekten . Op het basisontwerp (ABAB) zijn tal van varianten denkbaar en ook in de praktijk reeds toegepast, vooral in de geestelijke gezondheidszorg. Een van die varianten is het „multiple baseline design‟. In dat geval wordt eerst één casus onderzocht en pas na verkregen resultaten de volgende casus ( de invloed van tijdstippen is dan weggelaten). Punten van aandacht bij dit design zijn de keuze van het aantal meetpunten, de duur van de intervallen tussen twee stadia, de duur van de wash-out periode, de duur van de periode nodig om het effect van de interventie zichtbaar te maken, replicate-studies, het at random vaststellen van de interventieperiodes etc. In beginsel lijkt dit echter een sterk design: de stoornis verdwijnt bij interventie en keert terug bij het stoppen daarvan. Hierin is anderzijds een duidelijke beperking gelegen van dit design. 4.3 Multivariate Database Analyse - fundamentele variant De Multivariate Database Analyse (MDA)richt zich in beginsel op de (statistische) analyse van databases inzake in de tijd verlopende waarden van individuele personen op voor het onderzoek relevante kenmerken. Hiervan worden twee varianten met name van belang geacht voor het onderzoek van CAM, een fundamentele en een praktijk-gerichte. De eerste variant richt zich bijvoorbeeld op de identificatie van patronen in de bio-markers van (chronische) patiënten op opeenvolgende tijdstippen in de ontwikkeling van hun ziekte of aandoening. Algemeen doel daarvan is om in een zo vroeg mogelijke fase van de ziekte-ontwikkeling bij een individuele patiënt een causale therapie c.q. begeleiding te kunnen instellen. Een goed voorbeeld daarvan biedt het onderzoek van Van der Greef c.s. (2007) in Leiden. Dit onderzoek richt zich op de meting van biomarkers op verschillend niveau, zoals DNA, RNA, eiwitten, metabolieten en andere fysiologische parameters. Dit leidde onder andere tot nieuwe inzichten in de ontwikkeling van diabetes II en de werkzaamheid van traditionele Chinese kruiden.
-15-
Het hier bedoelde design kan worden gerekend tot het N=1 kader vanwege a. zijn gerichtheid op de gehele persoon als een samenhangend geheel, b. de concentratie op ontwikkelingen bij de individuele persoon, c. de directe koppeling van de behandelsituatie, en d. Het gebruik van opeenvolgende tijdsmomenten in de registratie.
4.4 Multivariate Database Analyse - praktijk gerichte variant Ook dit sub-design van het N=1 type baseert zich op de statistische analyse van de gegevens van grotere aantallen patiënten, ook wel als “N=100" aangeduid, waarbij 100 de betekenis heeft van “100 of meer patiënten”. De hier besproken variant gaat uit van via een (elektronisch) registratiesysteem verkregen gegevens van de patiënt en zijn/haar behandeling. Doel van de analyse is om vast te stellen in welke mate de gezondheidstoestand van welke patiënten en op welke wijze zich dankzij de interventie ontwikkelt tot (duurzaam) herstel van gezondheid en welbevinden. Hierbij worden op gestandaardiseerde wijze de basisgegevens van de patiënt en zijn/haar behandeling vastgelegd, en wel op ieder consult opdat een en ander procesmatig kan worden benaderd. Dit type onderzoek werd hier te lande ontwikkeld en toegepast door medisch-socioloog Aakster (2006, 2009) in de jaren 1985 tot 2000. De methode is inmiddels nu zover ontwikkeld dat deze zich leent voor een grootschaliger toepassing en voor een meer sophisticated wiskundig-statistische analyse. Ziekte gegevens worden hier zowel vastgelegd in termen van reguliere ziekte-ernst, van “alternatieve” diagnostiek als ook van algemene gezondheidsindicatoren (gezondheidswinst, functiewinst etc). De mate van herstel wordt uitgedrukt als proportie vooruitgang (in termen van bedoelde diagnostische gegevens) op het eindconsult ten opzichte van het startconsult c.q. voorafgaande consulten. Deze relatieve scores worden vervolgens gecorreleerd met behandel- en overige variabelen en uitgedrukt in een multipele regressievergelijking. De basisgedachte is dat in beginsel alle variatie in het behaalde resultaat verklaarbaar is uit de variatie in de antecedente variabelen, waaronder in elk geval die van de behandeling als zodanig. Maar ook de rol van secundaire factoren in het verklaren van een genezingsresultaat is hier zeker aan de orde. De hier beschreven variant van de Multivariate Database Analyse is als een N=1 design op te vatten op grond van: 1. de gerichtheid op de gehele persoon van de patiënt, 2. de analyse over individuele personen, 3. de handhaving van de natuurlijke behandelsituatie en 4. de opeenvolgende reeks van meetmomenten.
4.5 Timeseries design In feite gaat het hierbij om een vorm van trend-analyse. Daartoe zijn grotere aantallen meetgegevens in de tijd noodzakelijk (minimaal 30) en moeten toevalsfluctuaties en seizoeninvloeden kunnen worden uitgesloten. Voor de toepassing als effectiviteitsonderzoek (bij CAM) dienen punt-gegevens beschikbaar te zijn, bijv inzake de gezondheidstoestand van individuele patiënten op opeenvolgende momenten. De onderzoeker tracht dan vast te stellen in welke mate de gezondheidstoestand over de betreffende periode tendeert naar een grotere (of juist geringere) gezondheid.
-16-
In het laatste opzicht valt deze methode met enige welwillendheid te rekenen tot de N=1 familie op grond van 1. de follow up van individuele personen, 2. Een mogelijk directe koppeling naar de behandelsituatie, en 3. Een opeenvolgende reeks van meetmomenten. Dit sub-design moet worden onderscheiden van het eerder besproken ABAB-design omdat het geen wisselende behandelsituaties kent (wel of niet behandelen) en van multivariatie database analyse omdat het alleen eindpunten meet en slechts gericht is op de vaststelling van trends (bij een groot aantal meetpunten). Dit design, c.q. familie van deel-designs wordt uitvoerig beschreven in Kendall en Keith Ord (1990) alsook in Ottenbacher. In Hoofdstuk 13 van dit boek worden non-lineaire toepassingen besproken.
4.6 RCT/N=1 combinaties Het bijzondere aan dit design is dat het beoogt een rct-achtige opzet te combineren met een N=1design. Hierbij is sprake van een groepsvergelijking met een RCT karakter (geen blindering, wel randomisatie en controle), waarbij bovendien de individuele leden (N=1 aspect) van beide groepen in de tijd worden gevolgd en geëvalueerd. In bepaalde toepassingen (vanuit integraal denkkader en handhaving natuurlijke context) lijkt dit combinatiedesign voordelen te kunnen hebben voor het onderzoek inzake CAM. Door het EMGO werden twee onderzoeken uitgevoerd onder dit design, en wel bij een toets op effectiviteitsverschillen voor de toepassing van Paracetamol versus NSAID; alsook voor Temazepan versus placebo. De vraag of dit meer een RCT-achtig design is of meer een N=1 design lijkt zich te toe te spitsen op de wijze van omgaan met de gegevens en de interpretatie daarvan. Borgsteede(2008) concludeert op grond van in de huisartspraktijk verrichte proeven dat dit model zeker bruikbaar is in deze sector, maar dat daarbij veel praktische en methodologische ondersteuning nodig is. Een wens die overigens ook geldt ten aanzien van de andere hier genoemde designs.
4.7 Overige designs Volledigheidshalve worden hier nog enkele onderzoeksmethoden genoemd die de potentie hebben het effectiviteitsonderzoek volgens een N=1 kader te verrijken. * Patiënt tevredenheidsonderzoek. Satisfactie betreft in feite slechts een van de te meten parameters in een N=1 studie, maar er zou sprake kunnen zijn van apart N=1 design indien de satisfactie-bepalingen zich zouden toespitsen op de directe individuele ervaring van patiënten bij een gegeven behandeling, welke ten minste drie meetmomenten kent (start, tussentijds en eind). Hieraan kleeft het bezwaar dat “tevredenheid” uit twee componenten bestaat, een persoonsgebonden component (er zijn mensen die habitueel tevreden of ontevreden zijn) en een situatie-gebonden component. * ROA-design. Dit design werd gemeld door Hoenders en Appelo (2008) en staat voor Routine Outcome Assessment, waarbij om de zoveel tijd een patiënt wordt bekeken. Bij de ROA aanpak zijn vier tot zes K‟s van toepassing, zoals klachten, kwaliteit van leven, kosten, klant tevredenheid. De evaluatie vindt bij de individuele patiënt via de email plaats aan de hand van een formulier met 40 vragen op 4 opeenvolgende momenten. Het hangt af van de operationalisering en de interpretatie van de uitkomsten, of hiermee inzicht kan worden verkregen in de effectiviteit van (een combinatie van) bepaalde behandelvormen.
-17-
* Cohort-analyse; hierbij moet gedacht worden aan een onderzoeksopzet waarbij een bepaalde groep patiënten over langere termijn wordt gevolgd, waarbij herhaalde metingen plaatsvinden en de patiënten individueel worden geanalyseerd. Behalve satisfactie zouden hier ook werkelijke gezondheidsparameters kunnen worden gemeten. De controle op interfererende omstandigheden is hier echter gering * Bayes theorema (geen design): het betreft hier een vorm van statistiek waarbij getracht wordt de uitkomst van bijvoorbeeld het behandelproces (steeds beter) te voorspellen op basis van vooraf bekende parameters. Deze “predictietechniek”laat zich waarschijnlijk goed inbouwen in de eerder besproken multivariate database analyse. * Grounded Theory” van Glaser en Strausz (1976) (geen design): De methode komt erop neer dat de onderzoeker start met een nauwgezette analyse van (bijvoorbeeld) het verloop van het behandel- en herstelproces bij een individuele patiënt met een bepaalde aandoening en een gegeven behandeltype. Op grond daarvan stelt de onderzoeker een voorlopig “theorie” op inzake de factoren die het behandelresultaat (c.q. het uitblijven daarvan) hebben bepaald. Met deze theorie gewapend onderzoekt hij een tweede patiënt. Úiteraard zal dit ertoe leiden de “theorie” bij te stellen, aan te vullen of aan te scherpen. Daarmee gewapend onderzoekt men een derde patiënt en stelt opnieuw de theorie bij. Dit gaat zo door tot de theorie “verzadigd” is. Dat wil zeggen: totdat nieuwe patiënten geen aanleiding geven de theorie nog op essentiële punten bij te stellen; doorgaans kan zo‟n verzadigingspunt al na omstreeks 8 “trials” worden bereikt. Het lijkt echter noodzakelijk de bereikte eind-theorie naast die van andere onderzoekers te leggen opdat de mate van generaliseerbaarheid inzichtelijk wordt. De kwantitatieve uitwerking van dit design dient nog plaats te vinden.
-18-
Hoofdstuk 5. Theoretische context
Het nieuwe denken De geneeskunde heeft behoefte aan een ruimere benadering dan tot nu toe gangbaar, gegeven de ontwikkelingen in „basic sciences‟ als de biologie, voedingswetenschappen, sociale wetenschappen etc. Om de toenemende kennis over biologische processen te beschrijven en te onderzoeken kwam ook in de biologie het systeemdenken tot ontwikkeling (Van Wijk c.s.1989). Steeds beter leerde men aldus multifactoriële processen te beschrijven. Op een breed vlak tekenen zich nu vernieuwende denkwijzen af: een geneigdheid om meer met open (interdisciplinaire) constructies constructies te werken, een groeiende aandacht voor de context van verschijnselen en hun interactiepatronen, alsook voor het complexiteitsprobleem. Theorieën over krachtenvelden lijken de plaats te gaan innemen van mono-causaliteit. In dat kader lijkt ook sprake vaneen accent-verschuiving van categoriale naar meer individualiserende benaderingen. Daarbij komt inmiddels het tijdsaspect duidelijk om de hoek kijken, alles is proces, alles verandert continu. Het menselijk organisme wordt dan ook in toenemende mate benaderd als een complex systeem,gekenmerkt door dynamische interacties tussen vele factoren die leiden tot niet-lineaire, op kans gebaseerde oorzaak-effect relaties. Gebleken is (Van der Greef 2007) dat patronen van georganiseerde complexiteit emergente eigenschappen bezitten op bepaalde niveaus van organisatie. Ook is gesteld dat de aard van “leven” is te kenschetsen als: interconnectedness, interdependance en multi-leveled. Levende systemen zijn dynamisch georganiseerd en hun interne relaties zijn in hoge mate nonlineair; levende systemen zijn energetisch open maar organisatorisch gesloten; patronen van zelforganisatie zijn hier basaal. Onder andere hieruit lijkt een nieuwe wetenschap van het leven te ontstaan als vorm van zelf-organisatie en transformatie, die in zijn kern holistisch van aard is, met continue interactieprocessen zowel intern als extern. Het gaat hierbij in de eerste plaats om het zichtbaar maken van impliciete noties die ten grondslag liggen aan hedendaagse theorieën op het gebied van het menselijk functioneren en van de geneeskunde. Een grotere bewustwording daaromtrent lijkt een eerste vereiste. Een voorbeeld van dit laatste is de zogenoemde “system biology” zoals Van der Greef (2007) die hier te lande vertegenwoordigt. Hij lijkt met zijn benadering een theoretische en praktische brug te kunnen slaan tussen “regulier” en “complementair” of zelfs “alternatief”. Het levende systeem (organisme) staat bij Van der Greef voorop, met zowel een ruimtelijke dimensie (relatie met omgeving) als een tijdsdimensie (ontwikkeling van jong naar oud, van gezond naar ziek etc). In dit kader wordt vooral naar patronen gezocht met een voorspellende waarde. Diagnostiek en interventie Een van de consequenties van het aanvaarden van het systeem-denken in de geneeskunde is dat de multifactoriёle aard van ziekteprocessen wordt erkend en precies wordt gedocumenteerd. Een andere consequentie is dat het diagnostische proces (aard van de stoornis) centraal komt te staan, met een nauwgezette monitoring van de ontwikkelingen daarin. De complexiteit van elk mens uit zich in verschillen tussen de individuen, leidend tot het besef van heterogeniteit . Dit veronderstelt een meer
-19-
individualiserende benadering bij interventies in ziekteprocessen. Van der Greef (2007) pleit hier voor een nieuwe manier van diagnostiek bedrijven (patroon identificatie) en geïntegreerde therapeutische strategieën die expliciet gericht zijn op “personalized health”. In feite gaat het daarbij om een denken in gehelen, om een geïntegreerde benadering van kennissystemen en interventiestrategieën. De interventie beïnvloedt het complexe interactiesysteem van het menselijk organisme zodanig dat dit niet terugkeert tot de begin-situatie maar zich juist kenmerkt door een complex van nieuwe relaties.
Specifieke toepassingen Het werk van Van der Greef Hierboven kwam het werk van Van der Greef (2007)al aan de orde. Inmiddels heeft deze benaderingswijze zijn waarde al kunnen bewijzen bij het signaleren van bijvoorbeeld ontwikkelingsstadia van Diabetes II (met kenmerkende verschillen tussen mannelijke en vrouwelijke patronen), leverintoxicaties bij dieren, de identificatie van werkzaamheid van medicijnen en interessante links naar de Traditionele Chinese Geneeskunde. Als “bij-effect” ontstond zo ook meer inzicht in onwerkzame aspecten van medicijnen en van hun mogelijke bijwerkingen. Bedoelde analyses konden zo aannemelijk maken dat de traditionele wijze van geneesmiddelontwikkeling zijn grenzen heeft bereikt en dat hier een andere koers noodzakelijk is. In de benadering van Van der Greef is sprake van frequente bloedafnames; per individu worden op die basis samenhangen vastgesteld tussen biochemische en biologische parameters, en de follow up daarvan op meerdere meet-momenten. Het gaat dan om een groot aantal metingen, een nog groter aantal relaties, en uiteindelijk om een dynamisch geheel van “personalized fingerprints” dat nonlineair is, multi-leveled, interconnected en interdependant. De grondslag daarvan wordt gevormd door de analyse van metabolieten, eiwitten, transcriptie en aanvullende fenotypische data. Een 2 e stap: is “processing”, normalisatie en integratie van datasets. 3e stap: de vaststelling van een master dataset, 4e stap: cluster analyse, statistische modellering en correlationele analyses. 5 e stap: biochemische groepering, biomarkers inzake systeemtoestanden, associaties tussen moleculen en ultieme kennis en begrip van biologische systemen, c.q. het leven als zodanig. Het werk van Lentis Het betreft hier een tweede voorbeeld van een integrale benaderingswijze binnen de geneeskunde, bekend onder de naam “integrale psychiatrie”. Kernthema‟s zijn daarbij volgens Hoenders: 1) herwaardering en optimalisering van de therapeutische relatie, 2) een kritische houding t.o.v alle therapieën (regulier en CAM) op basis van de principes van EBM, 3) focus op oplossingen, welzijn en gezondheid, 4) in een “healing environment” met zoveel mogelijk dimensies van het bestaan betrokken (biologisch, psychologisch, sociaal, ecologisch, spiritueel). Daarbij worden vier K‟s gehanteerd: klachten, kwaliteit van leven, kosten en klant, in feite nog uit te breiden met krachten en kinetiek. In het onderzoek gaat het om technieken die de -al dan niet geïnduceerde- continue interacties en patroonvorming kunnen registreren die zowel binnen als tussen (deel)systemen plaatsvinden. Met als doel het tot stand brengen van integrale kennis en modelvorming die predictie en systematische interventie mogelijk maakt. (In feite gaat het hier om regelsystemen en stuurprocessen).
-20-
Methodologische vernieuwing Steeds meer onderzoekers op dit terrein lijken zich te realiseren dat de mens van een hogere ordeningsgraad is dan een dier en dat dus de bevindingen bij dier-onderzoek niet zonder meer c.q. niet langer kunnen helpen ter verklaring van de effecten van bepaalde geneesmiddelen op de mens. Dit betekent ook dat meer individuele variatie en dus heterogeniteit wordt geïntroduceerd in het onderzoeksontwerp. Ook komen non-lineariteit en multivariate analyse om de hoek kijken. De algemene systeem theorie levert hiertoe de theoretische handvatten. Het N=1 design belooft daarop aan te sluiten: de benadering van het subject als een integraal geheel, de individuele persoon als primaire analyse-eenheid, een directere aansluiting op de praktijksituatie, en de interesse in de opeenvolging van toestandsbeelden (dus meerdere meet- en observatiemogelijkheden tijdens de interventie). Een pragmatische benadering als die van Hoenders c.s. lijkt hier echter niet verkeerd: eerst vaststellen bij welk soort problematiek welke (complementaire) behandelmethode naar verwachting het meest effectief (zal) zijn en om de onderzoeksvraag daarop dan in eerste aanleg te richten. Voorts is hier wellicht de Bayesiaanse statistiek het beste toepasbaar, en moet nog worden nagedacht over de wijze waarop controle met de nul-situatie mogelijk is.
-21-
Bijlage 1 - Methodologische aspecten - kanttekeningen bij de criteria van hoofdstuk 3.
Tot slot van deze beschouwingen over het N=1 design, met name wat betreft haar toepasbaarheid op het gebied van CAM, volgen nog enkele methodologische kanttekeningen bij de in hoofdstuk 3 gepresenteerde criteria voor de opzet en uitvoering van dit type onderzoek. Eventueel worden deze opmerkingen toegespitst op bepaalde subdesigns. De volgorde van de te bespreken criteria is hier dezelfde als in hoofdstuk 3. 1. Protocol Geen onderzoek zonder duidelijk protocol. Daarin worden zo nauwkeurig mogelijk de “routing en timing” van het onderzoek aangegeven. Naast de werktitel dient de volledige titel (indien aanwezig) te worden vermeld, alsmede de naam of namen van de onderzoeker(s) en zijn/haar/hun kwalificaties. Voorts wordt de naam van de eventuele sponsor of (andere) subsidie-verstrekker vermeld. 2. Vraagstelling Hierbij dient te worden onderscheiden tussen de doelstelling die uiteindelijk met het onderzoek wordt beoogd, de daarvan afgeleide theoretische of praktische probleemstelling en de vertaling van de laatste in operationele termen. Als mogelijke doelstellingen van een onderzoek noemt Baars (2007): het genereren van nieuwe kennis of het oplossen van problemen. In dat kader kan het gaan om een beschrijving van iets, een vergelijking, een definiëring, evaluatie. verklaring, voorspelling of prescriptie. Baars maakt daarbij onderscheid tussen uitkomst- en proces- onderzoek. Uiteraard moet daarbij rekening worden gehouden met feitelijke omstandigheden, zoals de aard van de patiënt of diens aandoening. Vanuit CAM-gezichtshoek kunnen hieraan twee specifieke vereisten worden toegevoegd, de oplossingsgerichtheid en het herstel van welbevinden. Onderzoek zal steeds meer oplossingsgericht dienen plaats te vinden; het gaat ook bij N=1 toepassingen in de CAM-sector, om de bijdrage die onderzoek kan leveren aan de oplossing van een concreet probleem. Vanuit deze individuele oplossingen kan dan een verklarende theorie ontstaan of aanscherping van de bestaande. In de CAM-sector is het algemeen aanvaard dat het bij therapie uiteindelijk moet gaan om het herstel en behoud van welbevinden van individuele patiënten. Uiteraard is het wegnemen van de ziekte(symptomen) zeer belangrijk, maar het doel moet verder reiken. Lineaire statistiek zal hier doorgaans niet toereikend zijn; rekening moet worden gehouden met een procesmatig verloop, en met individuele variaties in dynamiek en ritmiek. De vraagstelling moet uiteraard worden geplaatst binnen de context van een bestaande theorie, beschikbare literatuur en/of praktisch kader. Soms kan het gewenst zijn om ook de persoonlijke “committment” (ervaringen/publicaties) van de onderzoeker kort hierbij te vermelden, met name wanneer het gevaar zou bestaan dat hij/zij emotioneel of financieel aan het onderwerp is gebonden.
-22-
3. Onderzoekspopulatie Hierbij zijn drie categorieën van personen of patiënten te onderscheiden : 1) de “steekproef”, zijnde de personen bij wie de gegevens worden verzameld, 2) de onderzoekspopulatie, zijnde de categorie personen waaruit de steekproef wordt getrokken, en 3) de populatie waarnaar gegeneraliseerd wordt, zijnde alle patiënten waarop de onderzoeksresultaten geacht worden betrekking te hebben. Gaat het om een steekproef, dan dient de wijze van steekproef trekking nauwkeurig te worden aangegeven. Tevens dient de omvang van de steekproef of onderzoeksgroep te worden verantwoord, alsmede de wijze waarop de patiënten in de steekproef zijn betrokken (voorlichting, “informed consent” etc). Hierbij dienen ook eventuele specifieke in- en uitsluitingscriteria te worden vermeld, waarbij erop moet worden gelet dat de uiteindelijke “eligible” patiënten nog wel een juiste afspiegeling vormen van de groep waarnaar gegeneraliseerd zal worden. De mate van heterogeniteit die de onderzoeker binnen zijn onderzoeksgroep(en) wil toestaan, is hierbij een punt van aandacht. Binnen CAM zal doorgaans gesteld worden dat iedere patiënt uniek is; heterogeniteit (inter-individuele variatie) is dan in mindere mate een probleem, dat wil zeggen: uitgangspunt voor de analyse. Daarbij kan worden bedacht dat de CAM-beoefenaar er doorgaans naar zal streven om, indien een regulier diagnose bekend is, deze wel tot uitgangspunt te nemen voor zijn/haar behandel beleid, maar deze vervolgens te verbreden tot een totaalbeeld van de gezondheidstoestand van de patiënt. De onderzoeker zal er dan ook verstandig aan doen om het gezondheidsprobleem van de patiënt op tenminste drie niveaus te omschrijven: het regulier medisch niveau (“de reguliere diagnose”), het eigen complementaire niveau (de “complementaire diagnose”) alsook op onderzoeksniveau, bijvoorbeeld in termen van “gewogen klacht ernst”, “functieniveau” of bepaalde biologische parameters. Een dergelijke drie-dimensionele diagnostiek biedt een goede mogelijkheid om veranderingen in de gezondheidstoestand van de patiënt nauwgezet te monitoren gedurende de behandeling en om de geboekte “gezondheidswinst” uit te drukken als percentage verbetering ten opzichte van de startwaarden. Het werken met gezondheidsprofielen (waarin alle drie genoemde niveaus worden betrokken) kan hier van voordeel zijn. 4. Behandeling De toe te passen behandeling zal vooraf duidelijk moeten worden omschreven plus de variatiebreedte die men daarbij in de praktijk van het onderzoek zal willen toestaan. Een belangrijk kenmerk van CAM-behandelingen is dat doorgaans met een individueel afgestemde combinatie van methoden (en adviezen) wordt gewerkt. Onderdelen uit deze combinatie worden doorgaans op uiteenlopende momenten in het behandelproces ingezet; tussentijdse aanpassingen in de onderzochte behandeling zijn dus eerder regel dan uitzondering. Een en ander geschiedt op basis van de reacties in de patiënt; deze maken duidelijk wanneer een volgende behandelfase kan worden ingetreden. Globaal zijn hierbij de volgende fasen te onderscheiden: intake, reiniging, opbouw, “full speed”-behandeling, afbouw en nazorg.
-23-
Uiteraard moet uiteindelijk de rationaliteit helder gemaakt kunnen worden die aan genoemde keuzes ten grondslag ligt. Het gaat daarbij zowel om de validiteit van de behandeling als geheel als van de noodzakelijkheid van de afzonderlijke therapie-onderdelen en de volgorde waarin deze zijn ingezet. Hier lijkt de opmerking van Van der Greef (2007) van belang dat een biomarker-geleide geneeskunde sneller zal komen tot een per subgroep of individuele patiënt aangepaste therapie, op basis van de “Correlation Network Analyse”. Op deze wijze kan ook een eventuele “therapeutische overdaad” in de behandeling worden voorkomen. 5. Methoden Het begrip “methoden” verwijst hier naar de te bezigen onderzoeks-instrumenten, niet naar het design van het onderzoek, dit laatste is het onderwerp van de volgende paragraaf. In beginsel kunnen bepaalde instrumenten worden toegepast in meerdere designs (bijvoorbeeld een pijnschaal of een bloeddrukmeter). Met “instrument” wordt ieder middel bedoeld met behulp waarvan valide gegevens van (in dit geval) de patiënt kunnen worden verkregen. Ook de anamnese wordt in dit verband een onderzoeksinstrument genoemd. Voorafgaand aan de vraag naar een bepaald instrument moet de onderzoeker vaststellen welke parameters hij/zij wil meenemen in het onderzoek. Een onderzoeker die zich bedient van een rct-design zal behoefte hebben aan andere (en doorgaans een geringer aantal) parameters dan de onderzoeker die met een N=1 design werkt. In beide gevallen zal primair behoefte bestaan aan een valide vaststelling van de aard van de ziekte (diagnose) en van de progressie die in dit opzicht is gemaakt tijdens en/of door de behandeling (zie punt 6.4). Vooraf zal moeten worden gedefinieerd wat als een “succes”en wat als een “failure” zal worden geteld bij de uitkomsten van de behandeling. Doorgaans zal de N=1 onderzoeker de invloed willen kunnen nagaan van omstandigheden die een optimaal resultaat hebben bevorderd dan wel belemmerd. Het gekozen sub-design binnen het N=1 kader zal min of meer bepalend zijn voor de keuze van parameters. Hoenders c.s. (2008) adviseren om ook de “mate van ontreddering” mee te nemen waarmee patiënten zich soms melden bij de psychiater of arts voor complementaire geneeswijzen. Anderen bepleiten het bijhouden van een (gestructureerd) dagboek door de patiënt gedurende het verloop van de behandeling. Baars (2008) noemt de gevalideerde “Behavioral Health Status”. In dit kader wordt ook opgemerkt dat het van belang kan zijn om met VAS-schalen te werken (Visual Analoge Scales) en/of met tenminste 5-puntsschalen. Daarbij is de problematiek van het meetniveau (nominaal, ordinaal of intervalschaal) aan de orde. Het werken met profielen van resultaat-indicatoren kan hier worden aanbevolen. Een N=1 studie vereist een nauwgezette registratie van zowel het ziektebeloop c.q. herstelproces als van de gepleegde interventies (en van eventuele bevorderende dan wel belemmerende factoren daarbij). Een palmtop of microfoontje gekoppeld aan een spraakherkenningsprogramma, kan het gemakkelijker maken om tijdens het onderzoek gegevens vast te leggen. Het werken met een EPD (Elektronisch Patiënten dossier) lijkt hier zeer aan te bevelen.
-24-
6. Design Aangenomen wordt dat de keuze tussen een rct- of N=1 design al ten gunste van de laatste is gedaan. Het gaat vervolgens nog om de vraag welk specifiek (sub)design binnen de N=1 familie zal worden toegepast. In hoofdstuk 4 werden deze sub-designs kort besproken. In het algemeen zal N=1 onderzoek plaats vinden in de eigen praktijk van een arts of therapeut. De omstandigheden aldaar gelijken het meest op “real life”. Het onderzoek is hier (tamelijk) gemakkelijk uit te voeren, alle benodigdheden liggen voor het grijpen. Anderzijds zijn hieraan risico‟s verbonden voor de kwaliteit van het onderzoek, de belastbaarheid van de patiënt en de generaliseerbaarheid van de resultaten. Om die reden wordt aanbevolen: 1) niet al te gecompliceerde patiënten of problemen te selecteren, 2) externe onderzoekers of beoordelaars in te schakelen, 3) zo veel mogelijk met gestandaardiseerde meetinstrumenten te werken, 4) de patiënten vooraf goed te informeren 5) kenmerken van patiënten vast te leggen die hun heterogeniteit indiceren, 6) de specifieke onderzoeksvereisten in te bouwen in het dagelijks handelen, of die juist daarop te baseren. (bijv. qua manier van registratie). De keuze voor een bepaald (sub)design is altijd een strategische keuze waarin men de verschillende (veronderstelde) voor- en nadelen tegen elkaar moet afwegen. Elementen die in dit strategisch keuzeproces een rol kunnen spelen, zijn: 1) de bewijskracht van een specifiek design. Deze is gerelateerd aan het nagestreefde niveau van “evidence”. (zie bijlage III voor regulier onderscheiden evidentie-niveaus) 2) de bekendheid en/of ervaring van de onderzoeker met het geprefereerde design. 3) de praktische mogelijkheden tot uitvoering (tijdsbeslag, beschikbare geldmiddelen, “eligible patiënts”, inpasbaarheid in de dagelijkse praktijkroutine etc.) 4) passendheid van het design in het licht van de specifieke vraagstelling Enkele bijzondere aspecten die bij de bepaling van het onderzoeksdesign bovendien aan de orde kunnen komen, zijn:
-25-
Positie van de patiënt Vaak voltrekt het onderzoek zich bij eigen patiënten; een duidelijke betrokkenheid van de patiënt bij de opzet en uitvoering van het onderzoek lijkt dan ook vanzelfsprekend. Dit vereist een goede voorlichting aan de patiënt en vrijwilligheid van deelname. Willekeurige toewijzing aan proef- of controlegroep en onwetendheid ten aanzien van de aard van de behandeling, lijken vanuit de N=1 gezichtshoek niet passend. Kwaliteitsmaatregelen De volgende aanbevelingen kunnen hier worden gedaan: * voldoende aantal observatie- en meetmomenten, met een goede spreiding over de ziekte-episode * intervallen tussen de meettijdstippen die zijn afgestemd op het acute of chronische karakter van de bestudeerde problematiek van de patiënt, alsook op het gefaseerde verloop van diens herstelproces * het uitsluiten van carry-over effecten, zij het dat binnen eenzelfde behandeling auto-correlatie normaal te achten is. * een of meer replicaties zijn noodzakelijk om een minimale generalisatie te rechtvaardigen naar andere patiënten, andere behandelaars en andere behandel settings. * de baseline (periode van niet-behandeling) dient steeds zo nauwkeurig mogelijk te worden vastgelegd * er dient een nauwgezette registratie plaats te vinden van alle relevante onderzoeksaspecten Te verwachten opbrengsten Een eerste type opbrengsten bestaat uit het antwoord op de onderzoeksvraag als zodanig plus het helder worden van de nieuwe vragen die zo‟n onderzoek doorgaans oplevert . Een tweede resultaat kan zijn dat meer inzicht is ontstaan in het interactieve, fasegewijze verloop van het behandel- en herstelproces van de individuele patiënt. Een derde mogelijke opbrengst kan zijn een toegenomen inzicht in de toepasbaarheid van het gekozen N=1 subdesign in de complementair geneeskundige behandelpraktijk. En een vierde opbrengst kan zijn dat de onderzoeksresultaten worden vertaald in een betere kwaliteit van de zorg zoals deze door de onderzoeker c.q. zijn vakgenoten wordt verleend. 7. Randomisatie Situaties zijn denkbaar waarin een willekeurige toewijzing van patiënten aan (sub)groepen of aan specifieke behandelvormen wordt overwogen of toegepast. In het algemeen zal dit in nauw overleg met en met volledig consent van de patiënt dienen te geschieden. Ook mag de patiënt er geen nadeel van ondervinden, althans geen ander of groter nadeel dan vooraf als aanvaardbaar risico is overeengekomen. Voorbeelden van een dergelijke randomisatie kunnen zijn: bij het ABAB-desing: het willekeurig toewijzen van A- en B-perioden aan de patiënt. En bij het N=100 design (MDA-praktijk variant): het willekeurig betrekken van patiënten (uit een welomschreven populatie) in de steekproef van te onderzoeken patiënten.
-26-
8. Blindering Blindering is ten aanzien van het N=1 kader in het algemeen niet aan de orde. De hier besproken designs zijn doorgaans van een opzet waarbij zowel behandelaar als patiënt (of althans een van beide) weet heeft van de aard van de behandeling. Dit heeft er met name mee te maken dat voor het bereiken van een optimaal effect, de gemotiveerde medewerking van de patiënt een belangrijke voorwaarde wordt geacht. Het gaat immers om het activeren van diens eigen zelf genezende en zelfregulerende krachten. Een ABAB design kan echter ook geblindeerd worden toegepast. 9. Veiligheid Een nog te vaak verwaarloosd aspect bij het uitvoeren van wetenschappelijk onderzoek betreft het aspect veiligheid. In het algemeen zullen rond het N=1 design vergelijkbare veiligheidsbepalingen van toepassing zijn als rond een rct. De voorschriften hebben betrekking op de ruimte waarin de behandeling plaatsvindt, de behandeling als zodanig en de positie van de patiënt. Het gaat daarbij zowel om veilige voorzieningen als om een goede instructie aan de gebruikers van de ruimte. Het is hier niet de plaats om deze veiligheidsaspecten nader uit te werken. In het onderzoeksprotocol zal daarover echter wel het nodige moeten worden gezegd. 10. Intention to treat Evenals ten aanzien van het rct-design moet duidelijk zijn dat ten aanzien van de in een N=1-onderzoek te bertrekken patiënten, sprake is van een “intention tot treat”. Het is niet ongewoon dat zich in een CAMpraktijk patiënten melden die uitsluitend komen voor een algemeen gezondheidsadvies, of die de zaak eerst eens komen verkennen. Deze “patiënten ” zullen in het algemeen worden buitengesloten van deelname aan een effectiviteitsonderzoek. Anderzijds zullen bepaalde patiënten worden doorverwezen naar collega‟s of worden terugverwezen naar de huisarts of behandelend specialist. Ook deze patiënten lijken minder geschikt om aan een effectiviteitsonderzoek deel te nemen. 11. Uitval Voor de CAM-praktijk lijkt sprake van een bijzonder probleem wat betreft de uitval van patiënten. Daarbij kunnen financiële aspecten een rol spelen alsook onbekendheid met de behandelfilosofie of te hoge “eisen” van de behandelaar ten aanzien van leefwijze-aanpassing. Soms kan daardoor een derde deel van de zich in eerste aanleg meldende patiënten, zich korte tijd later weer afmelden (bijvoorbeeld door niet meer terug te komen voor een volgend consult). Anderzijds kan er een probleem zijn dat patiënten in de verdere loop van het behandelproces afhaken. Zij achten zich bijvoorbeeld voldoende (of juist niet voldoende) hersteld of kunnen de financiële lasten niet meer opbrengen. Het moet daarom vooraf duidelijk zijn hoe de onderzoeker met deze verschillende vormen van uitval zal omgaan. De volgende vuistregels kunnen hierbij wellicht helpen: 1. Patiënten die na 1 of 2 consulten niet terugkomen, worden vervangen Hoewel er ook patiënten zijn die na 1 behandeling al genezen zijn (bijv. “Sekunden Phänomen” uit de neuraaltherapie), c.q. voldoende inzicht hebben gekregen in hun probleem om er zelf mee aan de gang te kunnen gaan, zijn hier de meest genoemde redenen: geen geld of geen tijd, geen motivatie,
-27-
afkeurende reacties vanuit omgeving etc. Hiernaar kan eventueel een daarop gericht apart onderzoek worden opgezet. Door deze patiënten te vervangen, heeft deze uitval geen invloed op de berekening van de uiteindelijke succes-score. 2. Patiënten die na het 3e of een later consult uitvallen maar voordat hun behandeling volgens plan is afgerond, worden niet vervangen, maar de datum van uitval wordt genoteerd alsmede de (vermoedelijke) reden van uitval (ten behoeve van een latere uitval-analyse). Het kan zijn dat deze patiënten wel “evaluabel” zijn, in die zin dat de gegevens van hun laatste consult (minimaal dus op het 3e consult) bekend zijn en kunnen dienen als een beoordeling van de mate van succes. Deze “laatste consult-scores” zullen doorgaans een onderschatting geven van het te behalen eindresultaat bij voltooide behandeling, maar het kan toch zinvol zijn om deze patiënten mee te nemen in de resultaatvaststelling. Met deze twee vuistregels kan men het probleem van de uitval adequaat oplossen en blijft het aantal beoordeelde patiënten in het kader van het onderzoek gelijk aan het aantal in behandeling genomen patiënten. Hiermee wordt het probleem opgelost dat men tot te rooskleurige uitkomsten van het onderzoek zou besluiten op grond van weglating van de “mislukte” behandelingen. Er is zodoende dus duidelijkheid over de noemer van de te berekenen succes-scores van de behandeling. Een follow up onderzoek na drie maanden kan het beeld eventueel bevestigen. 12. Vergelijkbaarheid behandelingen Er moet een duidelijk onderscheid worden gemaakt tussen de “behandeling zoals bedoeld” en de “behandeling zoals gerealiseerd”. De laatste, de feitelijk ondergane behandeling, moet worden vergeleken met de eerste, dus de behandeling zoals die in het protocol wordt omschreven onder punt 6.4. De mate van overeenstemming tussen beide moet worden gescoord op bijv een 5-puntsschaal, waarna deze variabele, bijvoorbeeld onder de naam “therapeutische adequaatheid”, in de analyse kan worden betrokken. Het gaat hier om een samengestelde variabele, waarvan de validiteit nog nader zal moeten worden uitgewerkt, maar die in beginsel kan worden berekend op basis van: 1) de mate waarin de in te stellenbehandeling volgens par. 6.4 overeenstemt met de indicatie van de fabrikant (bij preparaten) en/of met de indicatiestelling volgens gangbare leerboeken. 2) de mate waarin de behandeling volgens plan is voltooid (of voortijdig beëindigd) 3) de mate waarin de behandeling tussentijds is bijgesteld (en dus -in beginsel- verbeterd) 4) de mate waarin de behandeling zich daadwerkelijk volgens plan heeft ontwikkeld (dus op tijdige moment (consulten) is gegeven en op de juiste wijze in de juiste hoeveelheid), voorzover binnen het vermogen van de behandelaar gelegen. 5) de mate waarin de patiënt zich heeft gehouden aan de voorschriften en adviezen (Compliance oftewel therapietrouw)
-28-
6. De mate waarin zich externe verstorende omstandigheden hebben voorgedaan (verhuizing, ontslag of faillissement, echtscheiding, kind of ouder verloren etc) Al deze aspecten dienen (bij voorkeur) op een 5-puntsschaal te worden vastgelegden en tot een totaal-score ter worden samengevoegd. Te zijner tijd kunnen hiertoe nadere wegingsfactoren worden ingevoerd of berekend. Voor het doel van de hier bedoelde vergelijking dient van iedere patiënt die aan het onderzoek deelneemt, een volledig dossier te worden bijgehouden, dat desgevraagd aan een controleur ter inzage kan worden getoond. Het spreekt verder vanzelf dat het onderzoeksresultaat alleen goed kan worden beoordeeld indien dit wordt vastgesteld voor de patiënten voor wie de behandeling optimaal is verlopen, dus voor patiënten met de hoogste scores op “therapeutische adequaatheid”. De vraag welke patiënten men daarbij uitsluit (met lage scores voor “therapeutische adequaatheid”) zal nog nader moeten worden verkend. Alle “Off-protocol”-ervaringen dienen dan ook nauwgezet te worden vastgelegd. 13. Resultaat-beoordeling Aangezien de vraag naar de effectiviteit van een complementaire geneeskundige interventie de essentie vormt van de in het onderhavige rapport besproken problematiek, zal iets uitvoeriger worden stilgestaan bij dit aspect van het N=1 design. Daartoe worden eerst enkele algemene opmerkingen gemaakt, en vervolgens wordt ingegaan op de aard en kwaliteit van het verkregen onderzoeksmateriaal, de noodzaak van enkele voor- en tussen-bewerkingen, het onderscheid tussen beschrijvende en analytische bewerkingsfase, analyse- en toetsingsmethoden, en enkele afrondende opmerkingen tot slot. Voor het overige wordt uiteraard verwezen naar de methodologische leerboeken. Algemeen Uitgangspunt is dat hier beoordelingsmethoden aan de orde zijn inzake genezingsprocessen bij individuele patiënten. Het gaat daarbij om vormen van proces-analyse. Per sub-design zullen de analysemethoden kunnen verschillen. Een duidelijk probleem wordt hier gevormd door de doorgaans grote hoe veelheid informatie die bij het N=1 design beschikbaar komt. Manieren om tot data-reductie te komen en ordening aan te brengen, zijn dan essentieel voor onze appreciatie van de opbrengsten van een N=1 design. Kwaliteit van het materiaal Wat de kwaliteit van het verkregen onderzoeksmateriaal betreft, is in de eerste plaats het meetniveau van belang (nominaal, ordinaal, interval dan wel ratio niveau). Hoe hoger het meetniveau, hoe geavanceerder in het algemeen de analysetechnieken kunnen zijn. De kwaliteit wordt verder bepaald door betrouwbaarheid en geldigheid. De onderzoeker beperkt zich hier, bij het ontbreken van objectieve vergelijkingsmogelijkheden, vaak tot “construct-validiteit”, in feite gelijk te stellen aan uni-dimensionaliteit van een meetinstrument. Men onderscheidt voorts tussen interne en externe validiteit. De interne validiteit verwijst naar de maten waarin alle metingen en
-29-
meetomstandigheden aan de hoogste vereisten voldoen. Naar de mate deze vereisten hoger zijn, is de vergelijkbaarheid naar andere groepen of populaties doorgaans geringer (externe validiteit). In het CAM-0nderzoek lijkt zwaarder te worden getild aan de externe dan aan de interne validiteit. Dit heeft ongetwijfeld te maken met het meer praktijk gerichte karakter van het onderzoek aldaar.
Voor- en tussenbewerkingen De onderzoekgegevens die beschikbaar komen lenen zich niet steeds voor directe opname in de database waarmee gerekend gaat worden. Vaak zal men variabelen als leeftijd, aard van de hoofdklacht, duur van het interval tussen 1e en 2e consult etc willen (re)coderen. In andere gevallen wil men combinatie-scores berekenen bijvoorbeeld voor ziektelast of functieniveau. Ook zal een oplossing moeten worden gevonden voor “missing data”. Voorts zal de onderzoeker waarschijnlijk een eerste selectie willen plegen ten aanzien van de variabelen die het meest direct lijken samen te hangen met het resultaat van de behandeling. Beschrijvende uitkomsten Het lijkt aan te bevelen alvorens met de analyse als zodanig te starten, eerst een overzicht te vervaardigen van alle afzonderlijke variabelen (zowel in tabel als in grafische vorm) , opdat men een goed inzicht krijgt in de aard en kwaliteit van het materiaal. Wanneer bijvoorbeeld het functieniveau per consult in een tabel of grafiek wordt uitgezet, kan met één al belangrijk inzicht worden verworven in de voortgang van het herstelproces. De toets-situatie Anders dan bij het rct waarbij het antwoord op de effectiviteitsvraag min of meer in het design ligt besloten (score in proefgroep beter dan in controlegroep), dient bij het N=1 design de effectiviteitsvraag in twee stappen te worden beantwoord: * is de gezondheidstoestand aan het einde van de behandeling significant beter dan die bij de start, en: * kan deze verbetering worden toegeschreven aan de behandeling als zodanig (en in welke mate) De eerste vraag is nog het simpelst te beantwoorden; men behoeft daartoe in beginsel slechts te kijken naar de start- en eindwaarden op de belangrijkste parameters voor de gezondheidstoestand c.q. het welbevinden . De tweede vraag is moeilijker te beantwoorden omdat in het algemeen de behandeling geïndividualiseerd zal zijn, met een unieke combinatie van methoden die wisselend worden ingezet. Hier bestaat behoefte aan de invoering van een nieuw begrip, namelijk dat van “therapeutische adequaatheid” (zie punt 6.12). Naarmate de therapeutische adequaatheid hoger scoort, moet men dienovereenkomstig een grotere gezondheidswinst kunnen vaststellen. Het behandelresultaat zal doorgaans afhankelijk zijn van ook andere, de zogenoemd secundaire, factoren dan de strikt therapeutische. Bijvoorbeeld de aard van de aandoening, de begin-ernst, leeftijd- en geslachtscombinaties, motivatie van de patiënt, het specifieke consultpatroon (hun onderlinge spatiering), vertrouwensrelatie arts-patiënt etc.
-30-
Analyse-methoden Men kan hier volstaan met simpele vergelijkingen tussen behaalde resultaten door de patiënten op het eindpunt van de behandeling ten opzichte van de begin-situatie. Het gebruik van grafische presentaties kan hier veel tot het goede begrip bijdragen, zeker indien men daarbij ook baseline-waarden betrekt. Mooier is het echter als men ook de waarden op tussenliggende tijdstippen (bijvoorbeeld ieder consult) kan laten zien omdat op deze manier meer inzicht kan worden verkregen in het totale verloop van het proces. Tot slot kan men (bijvoorbeeld) regressievergelijkingen opstellen voor de per consult geboekte (tussen)resultaten en de invloed daarop van de “secundaire” factoren (=naast uiteraard die van de therapie als zodanig). Voor de precieze methoden moet hier worden verwezen naar de leerboeken, c.q. epidemiologisch geschoolde adviseurs. Een verstorende rol kan hier worden gespeeld door het zogenoemde “carry-over ” fenomeen: de therapeutische effecten van een eerdere behandel-episode kunnen in een volgende behandelfase doorwerken. Het is dan van belang de “wash-out” periode goed te kunnen vaststellen. Verder is het kunnen identificeren van patronen van belang, bijvoorbeeld tussen patiënten met overeenkomstige problematiek, tussen diagnose-behandelcombinaties etc. Slotopmerkingen t.a.v. de resultaat-beoordeling Min of meer concluderend kan worden opgemerkt dat de toepasbaarheid van een specifieke analysetechniek in de eerste plaats wordt bepaald door te vervullen voorwaarden van de betrokken methode; voldoet het onderzoeksmateriaal niet aan die voorwaarden (bijvoorbeeld qua meetniveau of qua aantal observaties), dan moet men er doorgaans niet aan beginnen. Verder moge het ook duidelijk zijn dat ieder design min of meer zijn eigen eisen stelt ten aanzien van de aard van de meest passende analysetechniek en voorts dat er een dringende noodzaak bestaat de N=1 designs te voorzien van een adequate methodologisch-statistische onderbouwing. Aan een goede presentatie van de resultaten van N=1 studies dient eveneens nog duidelijk aandacht te worden gegeven. Onderzoekers op het gebied van CAM kunnen daartoe met vrucht te rade gaan bij hun collega‟s op het gebied van didactiek en psychotherapie die al vele jaren werken met N=1 designs. Voorts moet worden benadrukt dat een N=1 design niet voor ieder probleem een oplossing kan bieden. Voor het uittesten van specifieke onderdelen van een behandeling kan het gewenst zijn terug te vallen op een rct-design. 14. Ethische problemen Hoewel het N=1 design een aantal ethische problemen vermijdt dat aan een rct is verbonden (deels niet of niet adequaat behandelde patiënten, onzekere therapeutische uitkomst voor de wel behandelde patiënten, ontbreken van vrije keuze voor patiënt etc), kan er niet zonder meer vanuit worden gegaan dat N=1 designs ethisch neutraal zouden zijn. Vooralsnog werden in de betreffende CAM-conferentie de volgende ethische aspecten genoteerd. 1. De vrijheid van de patiënt om nee te zeggen tegen een verzoek van de eigen behandelaar om mee te werken aan een onderzoek kan (te) gering zijn.
-31-
2. Soms (zoals bij het ABAB-design) wordt ook hier de potentieel werkzame behandeling gedurende enige tijd aan de patiënt onthouden. 3. Het gevaar van schending van de privacy van de patiënt is zeker niet uitgesloten bij geringe aantallen patiënten: patiënten zullen sneller herkenbaar zijn in een wetenschappelijke publicatie als deze slechts over één of een gering aantal patiënten gaat. 15. Toepasbaarheid van het subdesign Het is raadzaam om zich als onderzoeker tevoren te bezinnen op de toepasbaarheid van het geprefereerde design. Hierbij kan gedacht worden aan de specifieke “afdelingscultuur” of aan de specifieke omstandigheden rond de praktijk c.q. de bereidheid van patiënten etc. Wat dit laatste betreft, werd in de door Aakster (2006) uitgevoerde studies in praktijken van artsen en therapeuten echter gevonden dat patiënten eerder graag dan niet meewerkten aan een wetenschappelijk onderzoek naar de resultaten van complementair geneeskundige behandelingen. 16. Implementatie In het algemeen zal een onderzoek naar effectiviteit dat is uitgevoerd met een andere dan het rct-design met scepsis worden bekeken door reguliere collegae. De methodiek van het N=1 design wijkt immers af van de gangbare praktijk waarin het usance is te denken in termen van een controlegroep-design met grotere aantallen patiënten met eenzelfde diagnose. Ook heeft de case-benadering over het algemeen een slechte naam vanwege zijn (vermeende) subjectieve karakter. Mede daardoor is sprake van een grote onbekendheid onder de meerderheid van reguliere artsen en onderzoekers met het N=1 design. Willen onderzoekers op het CAM-terrein dan toch met een N=1 design aan de gang, dan valt op voorhand te verwachten dat de resultaten ervan zullen stuiten op duidelijke reserves bij een meer rctgeoriënteerde groep van onderzoekers. Deze reserve begint op het moment dat men met collega‟s de mogelijkheid bespreekt van een N=1 design en wordt opnieuw ervaren op het moment van het verwerven van subsidie, of van het publiceren van het verslag in een regulier-medisch tijdschrift. Er ligt hier dus een duidelijk acceptatie-probleem voor onderzoekers die met een N=1 design willen werken. Wel kan worden verondersteld dat bijvoorbeeld verzekeraars eerder geneigd kunnen zijn ook andere methoden dan het rct (bijvoorbeeld het Routine Outcome Assessment) te accepteren bij hun beslissing om bepaalde verstrekkingen in hun pakket op te nemen. Het is dan ook wenselijk zo niet noodzakelijk dat onderzoekers die zich van een N=1 design bedienen, actief werken aan de acceptatie van hun onderzoeksresultaten, aan publicatie daarvan in een erkend tijdschrift en aan toepassing van de bevindingen in de praktijk. Anders gezegd: onderzoekers dienen niet tevreden te zijn met het gereed maken van een eindrapport, maar dienen zich actief in te zetten voor toepassing op de werkvloer (implementatie).
-32-
Het kan in dit verband noodzakelijk zijn, analoog aan het reguliere streven naar “evidence-based” kwalificaties
11
te werken met een duidelijke rangorde wat betreft de generaliseerbaarheid van de
bereikte resultaten bij (typen van) N=1 onderzoek. Veel zal ook samenhangen met de feitelijke uitkomsten (praktisch nut!) die met dit type onderzoek zijn verkregen, alsook met de kosten-baten verhouding daarvan. Een ander belangrijk aspect betreft het gezag van het tijdschrift waarin een verslag van het onderzoek werd opgenomen. 17. Organisatie In een onderzoeksprotocol dient de onderzoeker tevens concreet aan te geven in welke mate de condities zijn vervuld voor de feitelijke realisatie van het beoogde onderzoek. Daarbij moet aan de volgende aspecten worden gedacht: * op welke methodologische ondersteuning kan worden gerekend? * is de benodigde tijd voor onderzoek beschikbaar? * is de financiering gegarandeerd? * zullen voldoende patiënten binnen de gestelde termijn kunnen worden gerekruteerd, en hoe staat het met hun bereidheid tot medewerking? * is het gewenste onderzoek instrumentarium aanwezig? 18. Rapportage In het algemeen wordt onderscheid gemaakt tussen het onderzoeksverslag of -rapport als zodanig en daarop gebaseerde artikelen. Het verslag als zodanig is in het algemeen volledig, inclusief bijlagen en wordt op verzoek ter beschikking van derden gesteld. De opbouw ervan volgt min of meer die van het protocol, met extra aandacht voor de wijze waarop een en ander daadwerkelijk heeft plaatsgevonden. Duidelijk dient te worden aangegeven op welke punten eventueel van het protocol is afgeweken en welke de (vermoedelijke) invloed daarvan is op de verkregen resultaten. Dit laatste verwijst naar het controleaspect van onderzoek, nodig om kritische beoordelaars de gelegenheid te geven de generaliseerbaarheid van de bevindingen te beoordelen.
11 Levels of evidence; http://www.cbo.nl/product/richtlijnen/handleiding_ebro/article20060207153532/view
-33-
Bijlage II - Korte vergelijking van RCT- en N=1 designs
Een eerste verschil is dat de in de klinische trials betrokken patiënten vaak sterk afwijken van die in de dagelijkse praktijk van de arts of therapeut. Deze selectie beantwoordt in het RCT-design aan strenge inclusie- en exclusiecriteria waarin de patiënt zelf geen stem heeft, terwijl het vanuit het N=1 design, juist van het grootste belang is goed samen te werken met de patiënt en diens optimale betrokkenheid en dus motivatie te verwerven. Er is hier sprake van zowel een representativiteits-verschil als van een motivatie-verschil. Een tweede verschil betreft de context waarbinnen trials dan wel N=1 studies worden uitgevoerd, zijnde enerzijds een institutionele behandelsetting als het ziekenhuis, en anderzijds de ambulante praktijk aan huis, zij het dat ook N=1 experimenten bekend zijn die binnen een ziekenhuis of verpleeginrichting worden uitgevoerd. Het verschil in “controleerbaarheid” van de onderzoekssituatie kan hier groot zijn, ten nadele van de N=1 opzet (vide echter ook “multi-centre trials”). Anderzijds zijn praktijkonderzoeken gemakkelijker te realiseren en zijn de uitkomsten ervan sneller te implementeren. Voor het verschil in controleerbaarheid kan men deels compenseren door het gebruik van gevalideerde meetinstrumenten, een goede sturing van het totale behandel- en onderzoeksproces etc. Een derde verschil betreft de hoe en waarom-vraag. In een RCT gaat het doorgaans expliciet om een vraag in termen van: werkt deze therapie wel of niet significant beter dan geen of een placebo-behandeling? Gesteld echter dat daarbij een te lage dosering werd gebezigd of dat de observatieduur te kort was, en de uitkomst is niet-significant. Moet men het hele onderzoek dan nog eens overdoen voor een andere behandelduur en/of dosering? In dat geval lijkt het eenvoudiger om in een N=1 opzet zowel dosering als duur van de behandeling systematisch te variëren opdat de behandelaar aan het einde meer inzicht heeft verkregen in de optimale werkzaamheid van een bepaalde interventie. Kortom, het N=1 design leidt tot inzicht in het gehele behandelproces, niet slechts tot een kans-uitspraak op categorie-niveau. Daardoor kan het feitelijke nut voor de patiënt van een N=1 opzet groter zijn. Een vierde verschil is dat het RCT zijn kracht (“power”) vooral ontleent aan zijn interne validiteit (rigide meetprocedures en onderzoekomstandigheden), terwijl de kracht van een N=1 design vooral ligt in zijn externe validiteit oftewel generaliseerbaarheid naar de praktijksituatie. Een vijfde verschil is dat een RCT werkt op categorie-niveau (specifieke diagnostische groep), terwijl bij het N=1 design de aandacht primair uitgaat naar een individuele benadering van de patiënt; het gaat daarbij met name om de ontwikkeling van behandelings- en herstelprocessen van de patiënt. Hierbij wordt het probleem vermeden dat de medicus practicus bevindingen op groepsniveau (een totale diagnostische categorie betreffende) naar eigen inzicht moet vertalen naar zijn toepasbaarheid op individuele patiënten. Een zesde verschil is dat in de integrale of complementaire praktijk vaak meerdere behandelingen gelijktijdig of in volgorde worden toegepast ten behoeve van een optimaal effect bij de patiënt. Zelfs al zou daarbij louter gebruik worden gemaakt van rct-getoetste methoden/technieken, dan nog zou de combinatie daarvan een nieuwe toetsnoodzaak opleveren. Het lijkt echter uitgesloten om alle daarbij denkbare en toegepaste combinaties aan een rct-toets te onderwerpen. Nuttiger is dan om de totale behandeling tot
-34-
onderwerp van evaluatie te maken en om naderhand de vraag te beantwoorden welke onderdelen van die totale behandeling eventueel achterwege hadden kunnen blijven. Deze vragen kunnen in eerste aanleg het beste vanuit een N=1 design worden beantwoord, waarna bij ernstige twijfel wellicht een RCT-toets uitkomst zou kunnen brengen. Echter, een N=1 design heeft natuurlijk niet alleen maar positieve kanten. Het gaat er in de kern om dat beoefenaren van complementaire geneeswijzen het RCT-model als “gouden standaard” in zijn algemeenheid onbruikbaar achten voor een correcte bewijsvoering inzake effectiviteit op hun vakgebied en dat dus moet worden gezocht naar observationele methoden die zodanig methodologisch aangescherpt zijn dat zij kunnen dienen als een min of meer gelijkwaardig alternatief voor een RCT.
-35-
Bijlage III - Criteria voor evidence based medicine
Regulier onderscheidt men de volgende niveaus (te downlaoden van: www.cbo.nl/product/richtlijnen/handleiding_ebro/article20060207153532/view): A1: Systematische review van tenminste twee onafhankelijk van elkaar uitgevoerde onderzoeken van A2niveau; A2: Gerandomiseerd dubbelblind vergelijkend klinisch onderzoek van goede kwaliteit en van voldoende omvang. B: Vergelijkend onderzoek, maar niet met alle kenmerken als genoemd onder A2 (hieronder valt ook patiëntcontrole-onderzoek, cohort-onderzoek). C: Niet-vergelijkend onderzoek, D: Mening van deskundigen. E: Case studies Het N=1 design c.q. de verschillende sub-designs daarvan zullen op overeenkomstige wijze dienen te worden ingeschaald; niveau C is daarbij zeker haalbaar en bij streng opgezette N=1 studies ook niveau B.
-36-
Bijlage IV - Literatuurverwijzing Aakster CW: Jaarboek TIG 2009, hoofdstuk 20 Harderwijk 2009, (ISBN/EAN: 978-9--810186-5-4) Aakster CW: Gestuurde verandering, hoofdstuk 9. (Van Gorcum, Assen 2006, ISBN 90 232 4266 1). Baars E: Begrippen en context van N=1 onderzoek, Presentatie Conferentie Platform CAM-research, voorjaar 2007. Barlow DH en Hersen M: Single case experimental designs, Pergamon General Psychology Series, Oxford 1987 Borgsteede S: “N=1 onderzoek in de eerste lijn” referaat 22-11-2007 tijdens studiedag n=1 van Stichting CAMresearch te Baarn Brands M: N=1 onderzoek en tijdserie-analyse in complementaire geneeskunde, Jaarboek TIG 2009 hoofdstuk 19, ISBN 978-90-810186-5-4. Glaser BG en Strausz AL: De ontwikkeling van gefundeerde theorie. Samson, Alphen a/d Rijn 1976 Greef J van der: Personalized Medicine taking off? Towards N=1 clinical trials? Presentatie Conferentie Platform CAM-research voorjaar 2007. Hoenders R en Appelo M: “de integrale psychiatrie van Lentis” referaat 22-11-2010 tijdens studiedag n=1 van stichting CAMresearch te Baarn Kendall M en Keith J Ord: Time series, Edward Arnold, Suffolk 1990 ISBN 0-85264-295-4. Ottenbacher K J. Evaluating clinical change: strategies of occupational and physical therapists. 1986. Baltimore: Williams and Wilkins Wijk R van, Aakster CW en van Dijk P: Integrale Geneeskunde - een inleiding, Wolters Noordhoff, Groningen 1989.
-37-