Onderzoeksontwerpen en de ladder van evidence

Thema: Evidence-based tandheelkunde

I.H.A. Aartman, C. van Loveren

Onderzoeksontwerpen en de ladder van evidence In het proces van ‘evidence-based’ tandheelkunde moet van elk gevonden artikel dat is geselecteerd op basis van een zoekactie worden bepaald hoeveel zeggingskracht het heeft. Dit wordt gedaan op grond van het gebruikte onderzoeksontwerp. De interne validiteit hiervan geeft de mate aan waarin alternatieve verklaringen voor de gevonden resultaten verantwoordelijk kunnen zijn. Op basis van de interne validiteit kunnen onderzoeksontwerpen geplaatst worden op de zogenaamde ladder van ‘evidence’. Hoog op deze ladder staat onderzoek met veel zeggingskracht, laag op de ladder onderzoek dat veel alternatieve verklaringen toelaat. Klinisch experimenteel onderzoek (gerandomiseerd gecontroleerd onderzoek, cross-over design en split-mouth onderzoek), waarin de onderzoeker een verandering aanbrengt of een interventie pleegt en de overige factoren constant houdt, heeft een hoge interne validiteit. In observationeel onderzoek (cohortonderzoek, patiënt-controleonderzoek, cross-sectioneel onderzoek, patiëntenserie en casusonderzoek), waarin groepen vanuit de bestaande situatie worden bestudeerd en vergeleken, kan vertekening optreden, resulterend in een lagere interne validiteit, waardoor dit onderzoek lager op de ladder van evidence staat. Voor het op waarde schatten van een onderzoek is enig begrip van wat deze onderzoeksontwerpen inhouden onontbeerlijk.

Aartman IHA, Loveren C van. Onderzoeksontwerpen en de ladder van evidence Ned Tijdschr Tandheelkd 2007; 114: 161-165

Inleiding Nadat de PICO-vraag is opgesteld, kan het zoeken naar de juiste wetenschappelijke artikelen beginnen. In de bijdrage van Van Loveren en Aartman (2007) staat beschreven hoe dit moet worden aangepakt. Van elk artikel dat is geselecteerd op basis van een zoekactie en dat zal worden gebruikt om de PICO-vraag te beantwoorden, moet worden bepaald hoeveel zeggingskracht het heeft. Dit wordt gedaan op grond van het gebruikte onderzoeksontwerp. Enig begrip van wat voor klinisch onderzoek gebruikte onderzoeksontwerpen inhouden is dan ook onontbeerlijk. In dit artikel zullen de meest gangbare onderzoeksontwerpen worden beschreven, waarbij wordt aangegeven hoeveel zeggingskracht een onderzoek met een bepaald ontwerp heeft. In meer methodologische termen wordt dan gesproken over de interne validiteit van onderzoek. Dit begrip wordt later, nadat de verschillende onderzoeksontwerpen zijn besproken, samen met de zogenaamde ladder van ‘evidence’ uitgebreider uitgelegd.

Experimenteel onderzoek In een experimenteel opgezet onderzoek voert de onderzoeker een handeling, een interventie, uit waarvan het gevolg wordt gemeten. Dit in tegenstelling tot in een observationeel onderzoek, waarin de onderzoeker niet ingrijpt en alleen metingen verricht in bestaande situaties. Tandheelkundig experimenteel onderzoek kan in verschillende vormen

Ned Tijdschr Tandheelkd 114 april 2007

plaatsvinden: in het laboratorium (in vitro), in de mond maar met aangebrachte objecten (in situ), bij dieren of bij patiënten (in vivo, klinisch). In het kader van ‘evidencebased’ tandheelkunde is in principe alleen klinisch experimenteel onderzoek bij patiënten van belang, omdat de toepasbaarheid van het onderzoek op een PICO-vraag anders in de regel te gering is (zie Van Loveren en Aartman, 2007). De onderzoeksontwerpen die hierna zullen worden besproken, zijn dan ook alle klinisch van aard. Gerandomiseerd gecontroleerd onderzoek In een gerandomiseerd gecontroleerd onderzoek (‘randomised controlled trial’, RCT) wordt een groep patiënten at random over de onderzoeksgroepen verdeeld. At random wil zeggen dat iedere patiënt uit de oorspronkelijke steekproef evenveel kans heeft om in iedere onderzoeksgroep te worden opgenomen. Daartoe kunnen verschillende zogenaamde randomisatieprocedures worden gebruikt, die ertoe moeten leiden dat er op geen enkele wijze bias (vertekening) optreedt in de toewijzing. Van groepen die door middel van at random toewijzing tot stand zijn gekomen kan worden verondersteld dat ze gelijk zijn. Daar waar bij het gebruik van bestaande groepen verschillen tussen groepen aanwezig kunnen zijn, zoals een verschil in mondhygiëne, poetsgewoonten of sociale achtergrond, zijn zulke variabelen na at random toewijzing gelijk verdeeld over de groepen. Er zijn daardoor geen andere vari-

161


abelen die het verschil kunnen verklaren, dat wil zeggen dat ‘confounders’, andere verklarende variabelen, zijn uitgesloten, waardoor causale uitspraken kunnen worden gedaan. Wanneer dan na een interventie op een nameting verschillen aanwezig zijn tussen de groepen, kan dat alleen maar worden toegeschreven aan het verschil in behandeling, de interventie. Indien de scores op de uitkomstmaat na behandeling B beter zijn dan na behandeling A, kan terecht worden geconcludeerd dat behandeling B beter is dan behandeling A met betrekking tot de betreffende uitkomstmaat. Cross-over design In een ‘cross-over design’ vinden beide te vergelijken behandelingen plaats binnen 1 persoon. In plaats van dat een groep in 2 delen wordt gesplitst, waarna de éne groep bijvoorbeeld met de hand poetst en de andere groep met een elektrische tandenborstel, gebruikt elke patiënt in een cross-over design elk type tandenborstel na elkaar. Na beide perioden wordt de mate van plaque bepaald en worden de uitkomsten vergeleken. Tussen de 2 behandelingen in is er een rustperiode, die lang genoeg is om een effect van de eerste behandeling te laten uitdoven, waardoor geen ‘carryover effect’ ontstaat. Om een volgorde-effect te voorkomen, wordt de steekproef at random in 2 groepen gesplitst, waarbij vervolgens de volgorde van de behandelingen wordt gevarieerd. Het behoeft nauwelijks toelichting dat een cross-over design voor lang niet alle vraagstellingen een optie is. Daar waar de effecten van een interventie blijvend zijn (vullen van een gebitselement, onderzoek met cariës als uitkomstmaat, 2 typen behandelingen voor parodontitis), kan dit onderzoeksontwerp niet worden gebruikt. Het voordeel van het toepassen van een cross-over design ten opzichte van een gerandomiseerd gecontroleerd onderzoek is dat er minder patiënten nodig zijn doordat iedere patiënt zijn of haar eigen controle vormt. Verder speelt individuele variatie ook een kleinere rol bij de vergelijking van de condities. Al met al kan het, daar waar mogelijk, een krachtig alternatief zijn voor een gerandomiseerd gecontroleerd onderzoek. Split-mouth design Een ‘split-mouth design’ is een variant op het cross-over design dat veel in tandheelkundig onderzoek wordt gebruikt. In een dergelijk ontwerp wordt de mond van de patiënt in 2 delen gesplitst en wordt interventie A toegepast op het éne en interventie B op het andere deel van de mond. Hierbij dient de plaats in het gebit te worden gerandomiseerd, om te voorkomen dat er verschillen tussen de interventies worden gevonden die zijn terug te voeren op verschillen tussen links en rechts of tussen de onder- en bovenkaak. De voordelen van een split-mouth design zijn vergelijkbaar met die van een cross-over design. Dit ontwerp is niet geschikt indien de behandeling aan de éne kant van het gebit invloed heeft op of gerelateerd is aan de behandeling in de andere kant van het gebit.

162

Observationeel onderzoek Zoals eerder beschreven vindt in observationeel onderzoek geen ingrijpen van een onderzoeker plaats. Groepen worden bestudeerd en vergeleken, maar vanuit de bestaande situatie. Hierna worden achtereenvolgens het cohortonderzoek, het patiënt-controleonderzoek, cross-sectioneel onderzoek, de patiëntenserie en het casusonderzoek besproken. Cohortonderzoek In een cohortonderzoek worden groepen (cohorten) geformeerd naar de aanwezigheid van een determinant, bijvoorbeeld een risicofactor of een behandeling, waarna ze met elkaar worden vergeleken. Bij de éne groep is de determinant wel aanwezig, en bij de zogenaamde controlegroep niet (bijvoorbeeld rokers versus niet-rokers), terwijl de groepen verder zoveel mogelijk vergelijkbaar moeten zijn ten aanzien van de mogelijke confounders. In een longitudinaal onderzoek wordt dan op meerdere meetmomenten vastgesteld wat de uitkomst of het effect is (bijvoorbeeld wel of geen parodontitis). Dit gebeurt doorgaans prospectief, dat wil zeggen dat de gegevens vooruit in de tijd worden verzameld vanaf het beginpunt van het onderzoek. Een cohortonderzoek kan ook retrospectief worden uitgevoerd, indien zowel de determinant als de uitkomstmaat al hebben plaatsgevonden, maar waarbij de cohorten ingedeeld zijn naar de determinant, en niet naar de uitkomstmaat zoals in een patiënt-controleonderzoek (zie volgende paragraaf). Cohortonderzoeken zijn vaak kostbaar, onder andere doordat ze lang duren. Voor ziekten en aandoeningen die niet vaak voorkomen, is een cohortonderzoek niet zo geschikt, omdat er dan een heel grote steekproef nodig is om op een redelijk aantal personen met de aandoening uit te komen. Patiënt-controleonderzoek In een patiënt-controleonderzoek is het uitgangspunt van het onderzoek de uitkomstmaat, de ziekte of de aandoening. Op basis van deze uitkomstmaat worden 2 groepen gecreeerd: de patiënten die positief scoren op de uitkomstmaat, die dus ‘ziek’ zijn, en een daaraan (ten aanzien van confounders) zoveel mogelijk gelijke controlegroep die de aandoening niet heeft (controles). Bij deze 2 groepen wordt door middel van retrospectief onderzoek vastgesteld of 1 of meerdere risicofactoren voorafgaande aan het optreden van de ziekte aanwezig waren. Er vindt dan een vergelijking plaats waarbij wordt vastgesteld of er bijvoorbeeld in een groep patiënten met parodontitis relatief meer personen vertegenwoordigd zijn die rookten voordat zij parodontale klachten kregen dan in een groep mensen zonder parodontitis. Een patiënt-controleonderzoek is bij uitstek geschikt voor aandoeningen die zeldzaam zijn. Doordat de groep patiënten als eerste wordt gevormd, heeft de onderzoeker zelf invloed op de uiteindelijke grootte van die groep. Het retrospectieve karakter van dit onderzoeksontwerp brengt


Aartman en Van Loveren: Onderzoeksontwerpen en de ladder van evidence

echter nadelen met zich mee. Doordat de gegevens die verzameld worden of van patiëntenkaarten moeten worden gehaald of worden achterhaald door vragen aan patiënten of anderen over zaken uit het verleden, kan er een vorm van vertekening optreden die ‘recall (= herinnerings) bias’ wordt genoemd. Dat wil zeggen dat patiënten zich van belang zijnde variabelen beter of anders kunnen herinneren dan controlesubjecten. Daardoor ontstaat er een ongewenst verschil in de zekerheid waarmee factoren voorkomen bij de groepen. Ook kan het zijn dat de gegevens van wat patiënten blijken te zijn, anders waren genoteerd en dus anders werden gemeten dan van controlesubjecten. In vergelijking met een cohortonderzoek is een patiënt-controleonderzoek doorgaans makkelijker uitvoerbaar en goedkoper. Cross-sectioneel onderzoek In een cross-sectioneel onderzoek worden alle gegevens tegelijkertijd verzameld. Zowel de bepaling van de uitkomstmaat als de aanwezigheid van eventuele risicofactoren worden op 1 moment in de tijd gemeten. Dit type onderzoek is vooral geschikt voor onderzoek naar diagnostiek, waarbij zowel de gouden standaard als de nieuwe test de situatie op hetzelfde moment bij de patiënt bepalen (zie Mileman en Van den Hout, 2007). Het komt echter ook voor dat dit type onderzoek wordt gebruikt om een vraag te beantwoorden als ware het een cohortonderzoek of een patiënt-controleonderzoek, doordat de onderzoeksvraag in die vorm wordt gesteld en beantwoord. Het is wellicht overbodig te melden dat de waarde van een onderzoek met een cross-sectioneel ontwerp om een dergelijke onderzoeksvraag te beantwoorden minder is dan van een ‘echt’ cohortonderzoek of patiënt-controleonderzoek, omdat de tijdslijn waarin de gebeurtenissen plaatsvonden onbekend is. Patiëntenserie In een patiëntenserie wordt een aantal variabelen van een groep patiënten met een bepaalde aandoening of ziekte gemeten en beschreven. Er is echter geen sprake van een controlegroep, evenmin is er sprake van een longitudinaal aspect. Deze laatste 2 kenmerken maken dat dit onderzoeksontwerp van relatief geringe waarde is om uitspraken te doen over onderzoeksvragen. Het belang van dit soort onderzoeken is gelegen in het signaleren, het in kaart brengen van een probleem of van aandoeningen waar nog niet zoveel over bekend is. Zodra men echter uitspraken wil doen over de ernst van symptomen en dergelijke, is het veel waardevoller te vergelijken met een controlegroep zonder de betreffende aandoening. Casusonderzoek In een casusonderzoek wordt een beschrijving gegeven over het verloop van een ziekte/aandoening of van een behandeling van 1 patiënt. De toestand voor en na een ingreep of voor en na een natuurlijk optredend herstel worden beschreven in relevante uitkomstmaten.


Interne validiteit De zojuist besproken onderzoeksontwerpen verschillen evident van elkaar in opzet. Bij het gerandomiseerd gecontroleerd onderzoek worden zoveel mogelijk variabelen, op 1 na, constant gehouden en gecontroleerd. In een onderzoek dat gerandomiseerd gecontroleerd is opgezet, is het daardoor mogelijk om causale uitspraken te doen. Niet alleen zijn 2 variabelen aan elkaar gerelateerd, maar variabele A is er ook de oorzaak van dat variabele B van waarde verandert. Veel vraagstellingen die men binnen de tandheelkunde beantwoord zou willen zien, dragen het karakter van het willen vaststellen van een dergelijk causaal verband. Er is echter niet altijd voldoende onderzoek op de juiste manier opgezet om dit soort uitspraken ook daadwerkelijk te kunnen doen. Naarmate er meer verschillen zijn tussen de onderzoeksen controlegroep, zoals bij een cohortonderzoek of een patiënt-controleonderzoek, zijn er meer alternatieve verklaringen voor de relatie tussen variabele A en B. Een derde variabele, ook wel confounder genoemd, kan dan verklaren waarom er een verschil wordt gevonden tussen de groepen. Dit belangrijke methodologische aspect van onderzoek bepaalt de interne validiteit van een onderzoek. De interne validiteit betreft dus de mate waarin het mogelijk is om binnen het onderzoek uit te sluiten dat 1 of meer andere variabelen dan de onderzochte een verklaring kunnen zijn voor het vinden van een verband tussen deze. Hoe minder confounders, hoe hoger de interne validiteit, en omgekeerd. Omdat een gerandomiseerd gecontroleerd onderzoek in het ideale geval is opgezet om alle confounders uit te sluiten, heeft zo’n onderzoek − mits goed uitgevoerd − een hoge, maximale interne validiteit. Zodra er geen sprake meer is van at random toewijzing van de patiënten aan de groepen, kunnen confounders een rol gaan spelen, en neemt de interne validiteit af. In een cohortonderzoek worden 2 bestaande groepen met elkaar vergeleken, wat met zich meebrengt dat er mogelijk meer verschillen zijn tussen de groepen dan alleen de variabele waarin men is geïnteresseerd. In een patiënt-controleonderzoek kan echter nog meer vertekening optreden, voornamelijk doordat de gegevens retrospectief worden verzameld (recall bias), waardoor de interne validiteit van een patiënt-controleonderzoek lager is dan van een cohortonderzoek. De interne validiteit van een cross-sectioneel onderzoek is nog minder. De gegevens worden allemaal tegelijkertijd verzameld, waardoor niet duidelijk is of de veronderstelde oorzakelijke factor voorafging aan het gevolg of andersom. Dit laatste is overigens niet relevant indien cross-sectioneel onderzoek gebruikt wordt om diagnostische methoden te testen. Onderzoek waarin helemaal niet met een controlegroep wordt gewerkt, zoals in een patiëntenserie, ontbeert elke mate van interne validiteit. Indien er geen vergelijking mogelijk is met hoe de situatie zou zijn als het kenmerk afwezig is, kan men nauwelijks iets uit zo’n onderzoek concluderen. Ten slotte, wellicht overbodig, kan uit een casusonderzoek, waarin 1 patiënt wordt beschreven die bijvoor-

163


beeld na een bepaalde behandeling geneest, zeker ook geen causale uitspraken genereren. Hoe opzienbarend het soms ook is, om een direct verband tussen 2 variabelen aan te tonen dient een relatie op groepsniveau aanwezig te zijn en kan een effect bij 1 patiënt daarvoor geen bewijs zijn.

Ladder van evidence Nu duidelijk is dat de verschillende onderzoeksontwerpen te ordenen zijn naar de mate van interne validiteit, kunnen de onderzoeksontwerpen op de ladder van evidence worden geplaatst (Sutherland, 2001). Er wordt ook wel gesproken van hiërarchie van evidence, piramide van evidence of niveau van evidence. In het proces van evidence-based tandheelkunde neemt deze ladder een prominente plaats in, omdat deze ladder mogelijke typen van informatie ordent naar de mate van evidence. Nadat men een klinische vraag heeft omgevormd tot een vraag in de PICO-vorm en helder is in welk domein de vraag is gesteld (zie Van Loveren en Aartman, 2007), is de ladder van evidence de leidraad bij het zoeken van de juiste informatie. Het moge duidelijk zijn dat dit de informatie betreft die het hoogste in de hiërarchie staat. Informatie met het hoogste niveau van evidence is onderzoek met een hoge interne validiteit, vandaar dat het gerandomiseerd gecontroleerd onderzoek hoog op de ladder of piramide staat (afb. 1). De enige informatiebron die erboven staat, is een systematisch literatuuronderzoek van gerandomiseerde gecontroleerde onderzoeken, met of zonder metaanalyse. In een systematisch literatuuronderzoek worden naar aanleiding van een specifieke vraagstelling gerandomiseerde gecontroleerde onderzoeken samengevat en systematisch, objectief en controleerbaar beoordeeld aan de hand van methodologische beoordelingscriteria (zie Aartman en Van Loveren, 2007; Van der Sanden et al, 2007). Omdat een Afb. 1. Ladder van evidence.

SR RCT Cohortonderzoek Patiënt-controleonderzoek

dergelijk systematisch literatuuronderzoek is gebaseerd op meerdere gerandomiseerde gecontroleerde onderzoeken, kan men hier, mits goed uitgevoerd (en toepasbaar op de PICO-vraag), meer waarde aan hechten dan aan een enkel gerandomiseerd gecontroleerd onderzoek. In feite is het zo dat wanneer een systematisch literatuuronderzoek betreffende de PICO-vraag niet te vinden is in de literatuur, en men zelf op zoek gaat naar gerandomiseerd gecontroleerd onderzoek en op grond daarvan de vraag probeert te beantwoorden, dezelfde stappen doorlopen zouden moeten worden als bij het uitvoeren van een systematisch literatuuronderzoek. Na het systematisch literatuuronderzoek en het gerandomiseerd gecontroleerd onderzoek dient de tandartsalgemeen practicus op zoek te gaan naar andere informatiebronnen, in volgorde van afnemende interne validiteit. Op de derde plaats op de ladder staat het cohortonderzoek, gevolgd door patiënt-controleonderzoek, cross-sectioneel onderzoek, patiëntenserie en casusonderzoek. Daarna volgt pas de zogenaamde opinie van de expert. Het klinkt wellicht tegenstrijdig, omdat ook de expert zijn of haar mening kan baseren op onderzoek met een hoge interne validiteit, maar het gaat er in het proces van evidence-based tandheelkunde om dat de informatie objectief en controleerbaar is. Dat wil zeggen dat moet kunnen worden nagegaan of er rechtvaardiging voor is. En dat kan alleen als de lezer dat zelf kan beoordelen op grond van de informatie die wordt gegeven in een wetenschappelijk artikel. De beoordeling van de mate van evidence en de sterkte of zwakte van een onderzoek bepaalt hoe sterk het antwoord op de PICO-vraag kan zijn en of er überhaupt een antwoord kan worden gegeven. Tandartsen kunnen de artikelen in dit themanummer gebruiken om het proces van evidence-based tandheelkunde te doorlopen, inclusief de beoordeling van de literatuur (zie Aartman en Van Loveren, 2007). Over het algemeen is de practicus geneigd van een artikel alleen de samenvatting, de inleiding en de conclusie te lezen. De vraag is echter of de conclusie zoals een auteur die formuleert gerechtvaardigd is. Zoals uit deze bijdrage blijkt is, naast de vraagstelling, de sectie over het materiaal en de methode van het onderzoek het meest informatief. Alleen na het lezen van dit onderdeel kan immers worden vastgesteld of het onderzoek goed is opgezet en welke waarde men aan de resultaten kan hechten. Conclusies die in een artikel worden getrokken moeten worden geverifieerd. Dat kan alleen als de opzet helemaal duidelijk is zodat de lezer zelf kan beoordelen welke conclusies gerechtvaardigd zijn.

Cross-sectioneel onderzoek

De link tussen domein en design Zoals wordt besproken in de bijdrage van Van Loveren en Aartman (2007) kunnen relevante klinische onderzoeksvragen worden ingedeeld in 4 domeinen (therapie/preventie, prognose, etiologie/risico en diagnose). Veel van de tandheelkundige klinische vraagstukken zullen afkomstig zijn uit het domein therapie/preventie. Bij vragen uit dit domein dient de tandarts-algemeen practicus in eerste instantie op

Patiëntenserie Mening expert SR = ‘systematic revieuw’, ofwel systematisch literatuuronderzoek/-overzicht RCT = ‘randomised controlled trial’, ofwel gerandomiseerd gecontroleerd onderzoek

164


Aartman en Van Loveren: Onderzoeksontwerpen en de ladder van evidence

zoek te gaan naar evidence dat het hoogste op de ladder staat: een systematisch literatuuroverzicht van gerandomiseerde gecontroleerde onderzoeken. Zijn deze er niet met betrekking tot de gestelde vraag, dan komt de tandarts uit bij het hoogste niveau van origineel onderzoek: het gerandomiseerd gecontroleerd onderzoek. Als een onderzoek antwoord moet geven op de vraag of behandeling A of B beter is voor een bepaald type patiënt, is het wenselijk dat dit onderzoek daar ondubbelzinnig op kan antwoorden. Met een gerandomiseerd gecontroleerd onderzoek kan dat, omdat met zo’n ontwerp causale uitspraken kunnen worden gedaan. Als er geen gerandomiseerd gecontroleerd onderzoek beschikbaar is, kan de ladder verder worden afgezakt volgens afbeelding 1. De consequentie daarvan is echter wel dat er geen causale relatie kan worden aangetoond, waardoor het antwoord op de PICO-vraag eigenlijk niet kan worden gegeven. Als de onderzoeksvraag een prognostisch karakter heeft, kan op de ladder worden ingestapt op het niveau van het cohortonderzoek. Het ligt niet voor de hand dat er voor een dergelijke onderzoeksvraag passend gerandomiseerd gecontroleerd onderzoek beschikbaar is, omdat de meeste prognostische factoren niet at random zijn in te delen. Indien de vraag is of een bepaalde factor een indicator is voor het krijgen van een bepaalde aandoening (domein etiologie/risico), zal het antwoord vooral te vinden zijn in patiënt-controleonderzoek. Immers, in zo’n onderzoek worden patiënten met een bepaalde aandoening vergeleken met een controlegroep zonder die aandoening, op de relevante risicofactor. Het ligt niet voor de hand dat er voor vragen binnen dit domein cohortonderzoeken of zelfs gerandomiseerde gecontroleerde onderzoeken beschikbaar zijn, omdat het vaak gaat om variabelen die niet te manipuleren zijn (genetische factoren, ervaringen in de jeugd, lichamelijke kenmerken, psychologische aspecten), alhoewel het niet valt uit te sluiten. Er dient te worden opgemerkt dat als een systematisch literatuuronderzoek beschikbaar is van cohortonderzoeken bij een prognostische vraag of van patiënt-controleonderzoeken bij een vraag uit het domein etiologie/risico, dit onderzoek het allerhoogste niveau van evidence heeft. In het geval van een diagnostische onderzoeksvraag is cross-sectioneel onderzoek de eerst aangewezen bron van evidence. Om iets te kunnen zeggen over de bruikbaarheid van een diagnostisch instrument, is onderzoek waarin de aandoening op 2 manieren (nieuwe methode en gouden standaard) − uiteraard op nagenoeg hetzelfde moment − wordt gemeten het meest voor de hand liggend.

Tot slot In dit artikel zijn de belangrijkste onderzoeksontwerpen en hun mate van interne validiteit besproken. Om een onderzoek op waarde te kunnen schatten moet voor de lezer duidelijk zijn welk type onderzoeksontwerp is gebruikt. Een gerandomiseerd gecontroleerd onderzoek staat van de oorspronkelijke vormen van onderzoek het hoogst op de ladder


van evidence, maar de resultaten kunnen meer of minder valide zijn, afhankelijk van de daadwerkelijke uitvoering. De uitvoering van een gerandomiseerd gecontroleerd onderzoek en andere onderzoeksontwerpen kan worden beoordeeld aan de hand van criteria die in de volgende bijdrage aan dit themanummer worden besproken (zie Aartman en Van Loveren, 2007). Literatuur

> Aartman IHA, Loveren C van. Evidence-based tandheelkunde en het beoordelen van de waarde en toepasbaarheid van onderzoek. Ned Tijdschr Tandheelkd 2007; 114: 166-171.

> Loveren C van, Aartman IHA. De PICO-vraag. Ned Tijdschr Tandheelkd 2007; 114: 172-178.

> Mileman PA, Hout WB van den. Evidence-based diagnostiek en klinische besluitvorming. Ned Tijdschr Tandheelkd 2007; 114: 187-194.

> Sanden WJM van der, Nienhuijs MEL, Mettes TG. De rol van richtlijnen en systematische literatuuroverzichten in de tandheelkundige zorgverlening. Ned Tijdschr Tandheelkd 2007; 114: 179-186.

> Sutherland SE. Evidence-based dentistry: Part IV. Research designs and levels of evidence. J Can Dent Assoc 2001; 67: 375-378.

Summary

Research designs and levels of evidence In the process of evidence-based dentistry the value of each article located by means of a search action has to be determined. This is done based on the research design used. The internal validity of these designs indicates the degree to which alternative explanations might be responsible for the found results. On the basis of internal validity, research designs can be placed on the so-called ladder of ‘evidence’. Clinical experimental studies (randomised controlled trials, cross-over design and split-mouth design), studies in which the researcher introduces changes or intervenes and keeps the other factors constant, have the highest level of internal validity. Observational studies (cohort study, case-control study, cross-sectional study, patient series and case study), in which groups are described and compared in their natural habit, can introduce bias, leading to a lower level of evidence. In order to assess the value of research, it is necessary to have some understanding of what these research designs are concerned with. Bron I.H.A. Aartman1, C. van Loveren2, 3 Uit 1de afdeling Sociale Tandheelkunde en Voorlichtingskunde en 2de afdeling Cariologie Endodontologie Pedodontologie van het Academisch Centrum Tandheelkunde Amsterdam (ACTA) en 3het Ivoren Kruis. Datum van acceptatie: 9 februari 2007 Adres: mw. dr. I.H.A. Aartman, ACTA, Louwesweg 1, 1066 EA Amsterdam [email protected]

165

Onderzoeksontwerpen en de ladder van evidence

Recommend Documents