FACULTEIT GENEESKUNDE
AMBTELIJKE REGISTRATIES VOOR EEN EVALUATIEF GEZONDHEIDSBELEID. ASPECTEN VAN BELEIDSONDERBOUWING OP LANDELIJK, INTERMEDIAIR EN LOKAAL NIVEAU
Proefschrift voorgelegd tot het behalen van de graad van doctor in de medische wetenschappen aan de Universiteit Antwerpen te verdedigen door WILLEM AELVOET Promotor: Prof.dr.Marc van Sprundel (Universiteit Antwerpen) Co-promotor: Prof.dr.Geert Molenberghs (Universiteit Hasselt) Antwerpen, 2008
2
Samenstelling van de PhD jury Promotoren: prof. dr. M. van Sprundel
Universiteit Antwerpen
prof. dr. G. Molenberghs
Universiteit Hasselt
Doctoraatscommissie: prof. dr. L. Bossaert
Voorzitter
Universiteit Antwerpen
prof. dr. M. Elseviers
Universiteit Antwerpen
prof. dr. H. Meulemans
Universiteit Antwerpen
Externe leden: prof. dr. G. De Backer
Universiteit Gent
prof. dr. J. Kips
Katholieke Universiteit Leuven
Ambtelijke registraties voor een evaluatief gezondheidsbeleid. Aspecten van Beleidsonderbouwing op landelijk, intermediair en lokaal niveau Willem Aelvoet ISBN 978-90-5728-087-0 Vakgroep Epidemiologie en Sociale Geneeskunde Faculteit Geneeskunde Universiteit Antwerpen Universiteitsplein 1 B-2610 Antwerp Belgium E-mail
[email protected]
3 INHOUDSOPGAVE Samenstelling van de PhD jury ...............................................................................2 Inhoudsopgave ......................................................................................................3 Dankwoord.........................................................................................................................5 Lijst van afkortingen.........................................................................................................8 Glossarium .......................................................................................................................10 Inleiding: Een door evaluatie bijgestuurd gezondheidsbeleid.....................................12 DEEL I: KRITISCHE LITERATUURSTUDIE ..........................................................17 Hoofdstuk 1: Administratieve gegevensbanken: kwaliteit van de gegevens ..............19 1.1 Het beoordelen van de kwaliteit van gegevens. .................................................21 1.2 Doodsoorzakenstatistiek. Kwaliteit en volledigheid van de gegevens. ................59 1.3 Besluit ..........................................................................................................71 Hoofdstuk 2: Gebruik van administratieve gegevensbanken in een perspectief van een kwaliteitsvol volksgezondheidsbeleid......................................................................73 2.1 Kwaliteit ........................................................................................................76 2.2 Benadering gebaseerd op kwaliteitsindicatoren.................................................89 2.3 Benadering gebaseerd op incidenten. .............................................................115 2.4 Het ontsluiten van kwaliteitsindicatoren. .......................................................125 2.5 Besluit .........................................................................................................139 Hoofdstuk 3: Methodologische aspecten .....................................................................141 3.1 Audit: Statistische Methodologie ...................................................................141 3.2 Statistische aandachtspunten bij het omgaan met en rapporteren van kwaliteitsgegevens: kleine aantallen, correlatie, case mix variatie en meervoudig gelijktijdig toetsen. ............................................................................................156 3.3 Methoden voor het beoordelen van kwaliteit/performance ...............................160 3.4 Besluit .........................................................................................................173 DEEL II: CASUSSEN...................................................................................................175 Hoofdstuk 4: Kwaliteit van administratieve gegevens in België: overlijdensstatistieken en MKG...................................................................................177 4.1 Kwaliteit van codering en certificatie in Vlaanderen en België, 1980-1997.......177 4.2 Kwaliteit van de gegevens in een prospectief financieringssysteem ..................197 4.3 Algemeen besluit..........................................................................................217
4 Hoofdstuk 5: Kwaliteit van zorgen ...................................................................219 5.1 Inleiding: Kwaliteit van zorgen, organisatorische cultuur en adequate gegevens.219 5.2 Kan het screenen voor interziekenhuis verschillen in keizersnedencijfer bij laagrisico verlossingen door middel van administratieve gegevens bijdragen tot kwaliteitsinitiatieven in de gezondheidszorg? ......................................................226 5.3 Interziekenhuis vergelijking van letaliteitcijfers na een opname voor acuut myocardinfarct. .................................................................................................268 5.4 Kwaliteit van zorgen: Algemeen Besluit ........................................................298 Hoofdstuk 6: Complementariteit van gegevensbanken. Gebruik van routinematig verzamelde gegevens om de reproductieve gezondheid te beoordelen in een gemeenschap gevestigd rond twee verbrandingsovens ..............................................301 6.1. Inleiding .....................................................................................................302 6.2 Methoden ....................................................................................................304 6.3 Resultaten ....................................................................................................307 6.4 Bespreking...................................................................................................313 6.5 Besluit .........................................................................................................317 ALGEMEEN BESLUIT EN AANBEVELINGEN.....................................................319 SAMENVATTING........................................................................................................323 SUMMARY....................................................................................................................327 Literatuur.......................................................................................................................331 Curriculum vitae Willem H. G. Aelvoet......................................................................397 Literatuurlijst Willem AELVOET ..............................................................................399
5 Dankwoord Pas op het einde van je proefschrift realiseer je hoeveel mensen, elk op hun manier, bijgedragen hebben tot het ontstaan en welslagen ervan. Dan pas ga je beseffen dat het dankwoord niet alleen een academische geplogenheid is maar een te summiere weergave van een groeiproces dat je nooit alleen zou voltooid hebben. Van harte wil ik mijn promotoren Prof.dr. M. van Sprundel en Prof. dr. G. Molenberghs bedanken. Zij hebben mij aangemoedigd om dit avontuur te beginnen, door te zetten in ogenblikken van ontmoediging en te voltooien. Tijdens deze zesjarige tocht hebben ze mij begeleid in mijn zoektocht naar oplossingen voor de problemen die zich stellen wanneer je met administratieve gegevens werkt, en me geholpen wanneer ik in de knoei geraakte. Van Prof. dr. van Sprundel leerde ik aandacht te schenken aan het detail en toch de grote lijn niet uit het oog te verliezen. Hij uitte zijn bedenkingen en suggesties op een altijd vriendelijke en rustgevende manier. Prof. dr. G. Molenberghs was de statistische behoeder van dit proefschrift, een klankbord en hulp voor het proefschrift in zijn geheel. Met beide promotoren heb ik aan een aantal projecten gewerkt onder meer de Neerland studie, de codeerstudie, het keizersnedencijfer en het letaliteitcijfer na een opname voor een acuut myocardinfarct. Maar bovenal waren beide promotoren altijd “bereikbaar”, waarvoor ik hen zeer dankbaar ben. Veel andere mensen hebben op een of ander ogenblik een rol gespeeld in mijn ontwikkeling naar toegepast wetenschappelijk onderzoek. De professoren P. Mercenier en H. Van Balen leerden mij wat volksgezondheid is. Professor Lagasse begeleidde mijn eerste stappen in het schrijven van een wetenschappelijke tekst. De professoren H. Callaert, N. Veraverbeke en P. Jansen, verwelkomden en gaven raad aan een overjaarse ambtenaar met Grieks-Latijnse roots om niet helemaal verloren te lopen in de wereld van de statistiek. Professor A. Meheus en de vakgroep ESOC hebben mij over mijn laatste aarzeling geholpen om eraan te beginnen. Aan allen mijn dank.
6 Zonder Frieda, Josie, Rita, Luc, Peter, Francis, Karel en Johan, mijn collega’s van de Vlaamse Gemeenschap, zou het codeerverhaal nooit het licht gezien hebben. Ook Nathalie T, Nathalie V, Francis L. en Francis W., Greet H., mijn collega’s van de FOD Volksgezondheid, dank ik voor de steun, het geduld met een soms zenuwachtig celhoofd, het nalezen en aanvullen van teksten en de samenwerking aan de eerste multidimensionele feedback aan de ziekenhuizen. Mijn dank ook aan Dr. I. Mertens, mijn diensthoofd, die mij inwijdde in de complexe wereld van de Minimale Klinische Gegevens. Graag wil ik ook de mensen bedanken die met mij de Neerlandstudie tot een goed einde brachten: Dhr J. Vanoverloop, Dr. G. Schoeters en de Professoren M. van Sprundel en G. Molenberghs. Voor de studie over het keizersnedencijfer kon ik rekenen op de hulp van mijn collega Francis Windey (hij maakte onder meer de database aan, een hele opdracht) en van de Professoren P. Van Reempts, H. Verstraelen, G.Molenberghs en J.M.Foidart; voor het AMI-gerelateerde letaliteitcijfer op collega Nathalie Terryn (zij stelde de database samen, deed de meeste analyses en realiseerde de oefening over de transfer van AMI patiënten) en de input van de Professoren J.L.Van Overschelde, C.Vrints, G.De Backer en M.van Sprundel. Voor de studie over miscoding dank ik mijn collega’s auditeurs en in het bijzonder Myriam, mijn collega’s van de cel Studies en Dr C. Faes. Verder een blijde gedachte aan de collega’s van de dienst Datamanagement. Zij waren steeds bereid om te helpen en het ambtelijk leven te doen leven. Ook dank aan mij hiërarchische oversten, die mij de gelegenheid gaven mij te verdiepen in de noodzakelijke literatuur om de voormelde studies te onderbouwen. Een warme gedachte aan mijn overleden ouders, die mij een warm nest bezorgden en de mogelijkheid gaven om te studeren, aan mijn schoonvader, mijn schoonzoon, mijn (schoon)zussen en (schoon)broers, (schoon)tantes en schoonoom.
7 Tenslotte ben ik aan Martine, Evelyne en Christian, Thomas en Kathy, en Stéphane veel verschuldigd voor de warmte die ze me gaven tijdens het langdurige proces dat tot dit proefschrift leidde en waarbij zij al te vaak verwaarloosd werden. Martine gaf mij sterkte, ook wanneer zij meer nodig had dan de hulp die ik haar gaf. Ik hoop het goed te kunnen maken.
8 Lijst van afkortingen ACOG AHRQ AIM AMI AMI-LC APACHE AP-DRG APR-DRG AROC BI (OG;BG) CABG CAD CEA CHD CHF COLD CQI CR CSI CVA DRG GEE HCFA HMO ICC ICD-9(-CM) IHD IQI KS KSC LBTB MAS MKG MMPS MONICA NEC NHQR NICU NIS NOS NPV NSTEMI OR (OG;BG)
American College of Obstetricians and Gynecologists Agency for Healthcare Research and Quality Acuity Index Method Acuut MyocardInfarct Letaliteitcijfer tgv AMI Acute Physiology And Chronic Health Evaluation All Patients Diagnosis Related Groups All Patients Refined Diagnosis Related Groups Area under the Receiver Operating Characteristic curve Betrouwbaarheidsinterval (Ondergrens; Bovengrens) Coronary Artery Bypass Graft Coronary Artery Disease Carotisendarterectomie Coronary Heart Diseases (Coronaire hartaandoeningen) Congestive Heart Failure Chronic Obstructive Lung Disease Continuous Quality Improvement Comparability ratio Computerized Severity Index CerebroVasculair Accident Diagnosis Related Groups Generalized Estimating Equations Health Care Financing Administration Health Maintenance Organization Intraclass Correlation Coefficient International Classification of Diseases, Ninth Revision, (Clinical Modification) Ischemic Heart Diseases (Ischemische hartziekten) Inpatient Quality Indicators Keizersneden Keizersnedencijfer Linker Bundel Tak Blok Meconium Aspiratie Syndroom Minimale Klinische Gegevens Medicare Mortality Predictor System Multinational Monitoring of Trends and Determinants in Cardiovascular Disease Not Elsewhere Classified National Healthcare Quality Report Neonatal Intensif Care Unit Nationaal Instituut voor de Statistiek Not Otherwise Specified Negative Predictive Value (negatieve voorspellende waarde) Niet- ST segment Elevatie MyocardInfarct Odds Ratio (Ondergrens; Bovengrens)
9 PCI PMC PPCI PPS PPV PSI PTCA QI RDS ROC ROM RR SOI SCD SES SMR SPE STEMI TTN VBAC/VBS VRGT ZH
Percutaneous Coronary Intervention Patient Management Categories Primary Percutaneous Coronary Intervention Prospective Payment System, Prospectief financieringssysteem Positive Predictive Value (positieve voorspellende waarde) Patient Safety Indicators Percutaneous Transluminal Coronary Angioplasty (balloon) Quality Indicator (Kwaliteitsindicator) Respiratory Distress Syndrome (Hyaliene membraanziekte) Receiver Operating Characteristic curve Risk of mortality Relatief Risico Severity of illness Sudden Cardiac Death Sociaal-economische Status Standardised Mortality Ratio Studiecentrum Perinatale Epidemiologie ST segment Elevatie MyocardInfarct Tachypnee van de neonaat Vaginal Birth After Cesarean (Section)/Vaginale Bevalling na Sectio Vlaamse Vereniging voor Respiratoire Gezondheidszorg en Tuberculosebestrijding Ziekenhuis
10 Glossarium TERM
Definitie/Omschrijving
Administratieve gegevens
alle types en bronnen van gegevens bedoeld voor de administratie (van de gezondheidszorg)
Benchmark
een benchmark is een methode om de prestatie van verschillende systemen, apparaten of organisaties met elkaar te kunnen vergelijken.
Capitation
vast periodiek bedrag per patiënt
Case mix
is een manier om het product of de output van een ziekenhuis te definiëren door klinisch homogene groepen van patiënten te identificeren, die een zelfde “pakket” behandelingen, testen en diensten gebruiken.1
Diagnosis Related Group (DRG)
Case mix maat die in het prospectieve financieringssysteem (PPS) van Medicare gebruikt wordt voor de omschrijving van ziekenhuisdiensten en gebaseerd is op de hoofddiagnose, nevendiagnoses, chirurgische ingrepen, leeftijd, geslacht en de aanwezigheid van complicaties.”2
Fee for service
terugbetaling per prestatie
Health Maintenance Organization
voor een vast periodisch bedrag per patiënt worden gezondheidszorgen verstrekt aan de leden ongeacht de diensten die werkelijk verstrekt werden
Major Diagnostic Category (MDC)
Mutueel exclusieve categorieën van hoofddiagnoses, gegroepeerd per lichaamsstelsel, die de basis vromen voor de DRGs
Managed care
Zorgmanagement
Doeltreffendheid
Beantwoordt de vraag in welke mate een behandeling het beoogde resultaat bereikt. Men onderscheidt de "potentiële doeltreffendheid" ("efficacy") van een behandeling/programma van zijn "reële doeltreffendheid" ("effectiveness") op basis van het feit dat ze vastgesteld wordt in een experimentele gecontroleerde context (klinische studie), die in ideale omstandigheden uitgevoerd werd, en niet gemeten werd na een werkelijke toepassing van de behandeling/ programma op bevolkingsniveau.
Doelmatigheid
"Rendement" van een collectief uitgeoefende medische activiteit; verband tussen de kosten (financiële, menselijke en materiële hulpbronnen) van die activiteit en de voordelen voor de betrokken bevolking (afname van de morbiditeit of sterfte, individueel lijden en ongelijkheid t.o.v. de ziekte)
11 Epidemiologie
Geneeskundige discipline waar de factoren bestudeerd worden die een rol spelen bij het optreden van ziekten en de verschillende ziekteverschijnselen alsmede de frequentie ervan, de geografische en sociaal-economische spreiding en de evolutie
Letaliteit
Verhouding dodelijke gevallen van een aandoening op het aantal gediagnosticeerde gevallen
Mortaliteit
Aantal sterfgevallen ten gevolge van een bepaalde ziekte binnen de bevolking, in het algemeen gedurende een jaar,
Statistische significantie
Verschil vastgesteld tussen twee groepen patiënten of ingrepen enz., is statistisch relevant op niveau 5% (of 1%) als er minstens 5% (of 1%) kans is dat dit aan toeval te wijten is
Vertekening
Term in de statistiek en de epidemiologie voor de verborgen oorzaak van een fout of een onduidelijke factor leidend tot een verkeerde logische conclusie, een onvrijwillige vooringenomenheid bij de waarnemer (“confounding”)
Inleiding
12 Inleiding: een door evaluatie bijgestuurd gezondheidsbeleid
Na een jarenlange activiteit als analist van de doodsoorzakenstatistieken en de Minimaal Klinische Gegevens (MKG) leek het ogenblik gekomen om stimulerende concepten, bevindingen en voorbeelden op het terrein en uit de literatuur, en ook de ervaring en inzichten, die progressief gegroeid zijn, te bundelen. Vermits de gegevens uit deze registraties noodzakelijk geacht worden voor de onderbouwing van de beleidsvoering3-7 en mijn beroepsactiviteit zich voornamelijk op dat terrein situeert, leek een onderzoek naar het beleidsonderbouwend potentieel van administratieve gegevensbanken hiervoor de geschikte vorm. De bruikbaarheid van administratieve gegevensbanken ten behoeve van het beleid en niet het beleid zelf vormen bijgevolg het centrale onderwerp van dit proefschrift. Naarmate het proefschrift vorderde werd het duidelijk dat het beleid in een brede betekenis diende verstaan te worden en met name dat het zich op meerdere niveaus situeert te weten het centrale, het intermediaire (zoals de “Begeleidingscommissie voor ziekenhuisperformantie” en de “Colleges van geneesheren”) en het lokale (zoals ziekenhuisdirecties). Een gezondheidsbeleid kan op verschillende wijzen geconcipieerd worden. Als mogelijke uitgangspunten kunnen bijvoorbeeld de optimalisering van het bestaande zorgensysteem8, evidence-based medecine9;10 of kostenbeheersing11;12 geciteerd worden. Welk ook het vertrekpunt is, steeds dienen er keuzes gemaakt en alternatieven afgewogen te worden. Hiervoor zijn betrouwbare gegevens van fundamenteel belang. Niet alleen dient men over gegevens te beschikken, zij moeten ook ingebed worden in een toepassingskader. Evaluatie lijkt hiervoor aangewezen.6;13 Zij laat immers het voeren van een coherent gezondheidsbeleid toe, dat op ieder ogenblik aangepast kan worden in functie van de evoluerende gezondheidsproblemen en van de beschikbare middelen. Een door evaluatie bijgestuurd gezondheidsbeleid
is een cybernetisch concept.14 Het
wordt, in zijn meest elementaire vorm, schematisch weergegeven in figuur 1. Prioritaire gezondheidsproblemen worden geïdentificeerd, grote streefdoelen gedefinieerd en vertaald in concrete doelstellingen. Activiteiten worden gepland en de nodige middelen voorzien. Resultaten worden vergeleken met de doelstellingen (doeltreffendheid) en met de gebruikte middelen (doelmatigheid). Naast doeltreffendheid en doelmatigheid wordt
Inleiding
13
ook de impact nagegaan, die door Reinke gedefinieerd wordt als de ratio van de totale uitkomsten over de output of het effect per eenheid van dienstverlening.6 De pertinentie van de geplande activiteiten wordt beoordeeld ten opzichte van de concrete doelstellingen, de concrete Figuur 1: Schematische voorstelling van een door evaluatie bijgestuurd gezondheidsbeleid.
Prioritaire gezondheidsproblemen 3
⇓
Streefdoelen 3
⇓
Concrete doelstellingen 3
⇓
⇘
Activiteiten ⇓
Middelen
2
1
Resultaten
1) doeltreffendheid 2) doelmatigheid 3) relevantie, pertinentie, geëigendheid doelstellingen ten opzichte van de grote streefdoelen, die op hun beurt getoetst worden aan de prioritaire gezondheidsproblemen. Deze relevantietoetsing wordt van bij de eerste stap in het planningsproces doorgevoerd en een positief toetsingsresultaat is telkens de
Inleiding
14
noodzakelijke voorwaarde voor het zetten van de volgende stap in dit proces. Zo zijn bijvoorbeeld relevante streefdoelen de noodzakelijke voorwaarde om doelstellingen te kunnen formuleren. Tenslotte wordt het billijkheidsbeginsel6;15;16 (“equity”) gehanteerd, dat in iedere fase van het cybernetisch proces en bij elke afweging een belangrijke rol speelt. De prioritaire gezondheidsproblemen vormen het vertrekpunt van deze evaluatiecyclus en kunnen als volgt op bondige wijze omschreven worden. Gezondheidsproblemen worden prioritair genoemd indien ze frequent en ernstig zijn, wanneer er een operationeel uitvoerbare en aanvaardbare oplossing voor bestaat, als ze door het beleid en door de bevolking als ernstig gepercipieerd worden en wanneer de evolutie ervan in stijgende lijn gaat. De ernst wordt niet alleen uitgedrukt in termen van morbiditeit, tijdelijke of blijvende beperkingen, en mortaliteit maar ook in economische en sociale kosten.14 De rol van ambtelijke registraties in de evaluatiecyclus bestaat voornamelijk in het verstrekken
van
gegevens
over
de
frequentie
en
ernst
van
prioritaire
gezondheidsproblemen benevens output en uitkomstgegevens voor de doelmatigheid- en doeltreffendheidanalyses en voor de toetsing van het billijkheidsbeginsel6;7;17-20 Dit gebeurt op een routinematige manier zodat ook de evolutie over de tijd kan gevolgd worden. Het is duidelijk dat de doodsoorzakenstatistieken en MKG een noodzakelijke maar te smalle basis vormen voor een onderbouwd gezondheidsbeleid. Dit heeft niet alleen nood aan een breder spectrum van gezondheidsgegevens maar onder meer ook aan sociaaldemografische en economische gegevens, aan gegevens over personeelsbezetting en personeelsvooruitzichten, over de verwachtingen en het zich betrokken weten van de gemeenschap, over sociale en beroepsorganisaties en over de politieke context.15 Kwaliteit van de gegevens was een eerste aandachtspunt. We meenden echter dat de kwaliteitsbewaking van gegevens geen alleenstaande activiteit was maar diende gezien te worden in een wisselwerking met hun gebruik. Rapporten in verband met uitwendige oorzaken van morbiditeit en mortaliteit21, de invloed van sociale factoren op de verblijfsduur22, de klinische indicatoren (zie hoofdstuk 5) en de invloed van de uitstoot van verbrandingsovens op de reproductieve gezondheid van de buurtbewoners (zie hoofdstuk 6) hebben niet alleen lacunes van de MKG en doodsoorzakenstatistiek aangetoond maar gaven tevens een aanzet tot hun verbetering. De aandacht ging hierbij
zowel naar
Inleiding
15
verbetering van de gegevensverzameling en van de gegevensanalyse als naar de gegevensdoorstroming en -uitwisseling tussen registraties.23;24 Het effectief gebruik van administratieve gegevens voor evaluatieve of volksgezondheidskundige doeleinden laat bijgevolg niet alleen een bijsturing toe van de te verstrekken promotionele, preventieve en curatieve zorgen maar maakt tevens gegevensbeperkingen zichtbaar zodat ook de gegevenskwaliteit gecorrigeerd kan worden. Vervolgens laat deze verbetering op haar beurt een fijnere evaluatie van de kwaliteit van zorgen op individueel en populatieniveau toe. Deze wisselwerking tussen het evaluatieve gebruik van administratieve gegevens en bewaking van hun kwaliteit kan een opwaartse spiraal van het gezondheidssysteem helpen schragen. Waar gezondheidsgegevens in België wel voorhanden zijn, is hun toegankelijkheid vaak een probleem. De probleemstelling in verband met de verbrandingsoven in Wilrijk, die verder in dit werk aan bod komt, de zoektocht naar de nodige gegevens voor de berekening van Disability Adjusted Life Years25 en het project Milieu en Gezondheid26zijn er voorbeelden van. Maar in afwachting dat alle nodige gegevens beschikbaar zijn en hun betrouwbaarheid getoetst is, moet er beleid gevoerd worden.27 Het is dan zaak het beschikbare materiaal voor het beleid te operationaliseren, er de volledigheid en accuratesse van aan te geven en tevens de gegevensbanken maximaal inpasbaar te maken in een volwaardig gezondheidsinformatiesysteem15;24;28. Meer concreet trachten we een antwoord te geven op volgende onderzoeksvragen: 1) In welke mate zijn de registratiegegevens kwaliteitsvol? 2) Gegeven hun beperkingen, zijn deze gegevens bruikbaar voor de beleidsondersteuning? 3) Hoe kan deze bruikbaarheid verbeterd worden? Dit proefschrift heeft de bedoeling een bijdrage te leveren bij het onderzoek naar een wetenschappelijk verantwoord gebruik van administratieve gegevens. Daarnaast heeft het ook de bedoeling aan de verantwoordelijken voor het gezondheidsbeleid en hun medewerkers bruikbare informatie en voorbeelden te verschaffen over het omgaan met en verbeteren van administratieve gegevens.
16
Inleiding
Vandaar ook de bewuste keuze het proefschrift in het Nederlands te schrijven. Ons operationeel onderzoek situeert zich op lokaal, intermediair en centraal niveau en dient geplaatst te worden in de cybernetische, evaluatieve benadering die we hierboven geschetst hebben. Het is duidelijk dat we in deze bundeling van elementen uit de literatuur en uit eigen onderzoek slechts een zeer beperkt aantal elementen van de globale opzet hebben kunnen ontwikkelen. We hopen verder op deze manier enkele aanzetten te geven voor verder te ondernemen acties en voor verdere, meer diepgaande reflecties. Het proefschrift werd dan als volgt opgebouwd. In een eerste deel, een literatuurstudie, wordt onderzocht hoe de kwaliteit van de gegevens in administratieve gegevensbanken onderzocht en verbeterd kan worden en in welke mate dit soort gegevens bruikbaar zijn voor de beoordeling van ziekenhuiszorgen. Een hoofdstuk wordt gewijd aan methodologische aspecten en voornamelijk het identificeren van “outlying” ziekenhuizen. In het tweede deel worden de besproken concepten en methoden gebruikt om een inzicht trachten te geven in de beperkingen en de mogelijkheden van twee Belgische gegevensbanken op gebied van beleidsonderbouwing, en geeft aan dat het samenbrengen van gegevens uit verschillende registraties soms noodzakelijk is voor het beantwoorden van een beleidsvraag.
DEEL I: KRITISCHE LITERATUURSTUDIE
18
De uitgevoerde literatuurstudie werd niet systematisch van in het begin uitgevoerd, maar was een stapsgewijze verkenning waarin de kwaliteit van de gegevens bestudeerd werd in een operationele benadering vertrekkend van de diagnosestelling tot de opslag van de gegevens. De ruggengraat hiervoor werd geleverd door het boek “Problem Solving. A Statistician's Guide. ” van C. Chatfield.23Andere boeken29-31, rapporten21;32-34, proefschriften35;36 en gerichte opzoekingen via Pubmed onderbouwden het hoofdstuk over kwaliteit van de gegevens. Er werd daarbij telkens aandacht geschonken aan voordelen en beperkingen van administratieve gegevens, en aan alternatieve gegevensbronnen. Ook zochten we steeds naar methoden voor de verbetering van gegevenskwaliteit. Ook voor de kwaliteit van de zorgen was de gevolgde benadering operationeel. Vertrekpunt hierbij was het project “Inpatient Quality Indicators”37 van de Agency for Healthcare Research and Quality (AHRQ) in samenwerking met de Stanford University, dat voorzien is van een omvangrijke literatuurlijst. Dit werd aangevuld met gerichte opzoekingen
in
Pubmed
kwaliteitsindicatoren,
voornamelijk
kwaliteit
van
over
zorgen,
types
en
ontwikkeling
interziekenhuis
van
vergelijkingen,
ziekenhuismortaliteit. Voor de besproken indicatoren werd de onderbouwing van de indicator uit het Amerikaanse model aangevuld door verder te bouwen op de AHRQ indicator en het actualiseren van de vermelde literatuur. Speciale aandacht werd telkens besteed aan de beperkingen van de gegevens, het bestaan van en de toepassing van richtlijnen en de vertaling van het Amerikaans model naar de Belgische situatie. De literatuur in verband met interziekenhuisvergelijkingen en kwaliteitsindicatoren, en het boek “Applied Logistic Regression” van Hosmer en Lemeshow38 hebben het methodologisch hoofdstuk onderbouwd. Wegens
de
niet
onbeperkte
toegang
tot
de
literatuur
van
sommige
beleidsverantwoordelijken werd er naar getracht voor sommige methodologische en conceptuele begrippen meerdere bronnen te vermelden die via Pubmed of Google vrij ter beschikking worden gesteld.
19 Hoofdstuk 1: Administratieve gegevensbanken: kwaliteit van de gegevens Een door evaluatie bijgestuurd gezondheidsbeleid rendeert optimaal in een systemische benadering van de volksgezondheid, die steunt op
de complementariteit van
gezondheidsbevordering, ziektepreventie en curatie, en die voor het aanpakken van prioritaire gezondheidsproblemen, waar nodig, beroep doet op samenwerking buiten het gezondheidssysteem.39 Zo zijn sterfte en invaliditeit ten gevolge van verkeersongevallen een
vanzelfsprekend
voorbeeld
van
prioritaire
gezondheidsproblemen,
die
een
intersectorale aanpak vereisen. Beleid werd in het verleden echter vaak strikt sectoraal gevoerd. In de ziekenhuissector bijvoorbeeld werden de toe te kennen toelagen voor ziekenhuisdiensten berekend in functie van de bevolkingstoename, van verhoogd gebruik van diensten, van technologische imperatieven en politieke druk.15 De evaluatie van de gezondheidszorg bestond voornamelijk uit de kritische beoordeling van uitkomstgegevens van bepaalde behandelingen en van de kwaliteit van zorgen in de instellingen, maar niet van de gezondheid van bevolkingen.15 Dergelijke benadering gaat ervan uit dat de noden op gebied van gezondheidszorgen op een gelijkmatige manier verdeeld zijn over de bevolking en dat gezondheidszorg de kritische determinant van gezondheid is. Dat dit een onjuiste veronderstelling is, blijkt uit de zwakke relatie, die er bestaat, tussen enerzijds de sterk stijgende gezondheidsuitgaven, onder meer voor kankerbestrijding en voor kostelijke hoogtechnologische onderzoeken en geneesmiddelen, en anderzijds de gezondheid van de bevolking.15;40 Deze medisch-technische benadering gaat immers voorbij aan sociaaleconomische factoren en hun complexe relatie met dienstengebruik.41-54 Hoe beter we echter
de
complexe
determinanten
van
gezondheid
begrijpen,
hoe
meer
aanknopingspunten we hebben om onze inspanningen te richten op de verbetering van de gezondheid van de ganse bevolking of van specifieke doelgroepen.55 Om over te gaan van een klassieke, vraaggestuurde en ziekenhuisgecentreerde benadering, naar een meer behoeftegestuurd en bevolkingsgericht gezondheidsbeleid is een degelijk gezondheidsinformatiesysteem (Health Information System of HIS) nodig. In afwezigheid ervan dient de aanwezige gezondheidsinformatie optimaal gebruikt te worden en kan een
Hoofdstuk 1: Administratieve gegevensbanken
20
HIS progressief opgebouwd worden uit de bestaande registraties en vervolledigd waar nodig. Idealiter dient een HIS informatie te verschaffen over de gezondheid van de bevolking, over
de
sociaal-economische risicofactoren,
over
het
gebruik
van
gezondheidsdiensten en uitgaven van de gezondheidszorg, en over de middelen die voor de gezondheidszorg ter beschikking worden gesteld.10;15;24;28 Hierin krijgen secundaire gegevensbanken een belangrijke rol toebedeeld. Secundaire gegevens zijn, niet door de onderzoekers zelf, maar door andere personen/instanties verzamelde gegevens, waarvan de oorspronkelijke bedoeling niet het beschrijven van de gezondheidsstatus
van
de
betrokken
gezondheidsinformatie kan bevatten.
56-59
persoon
was
maar
die
wel
relevante
Voorbeelden hiervan en tevens onderwerpen van
dit proefschrift zijn de ontslaggegevens van ziekenhuizen en overlijdenscertificaten.57 Zo is naast facturatie het beschrijven van de ziekenhuisactiviteiten een vaak voorkomend doeleinde van een ziekenhuisregistratie en zijn daarentegen kwaliteitsbewaking en informatie rond morbiditeit, diagnosen en behandelingen vaak geen oorspronkelijke maar wel afgeleide doeleinden van ziekenhuisregistratie.57;60-62Onze registratie van de Minimaal Klinische Gegevens (MKG) bijvoorbeeld heeft zowel een financieel als een kwaliteitsbevorderend doeleinde.3 Geboorte- en overlijdensberichten, waarvan de oorspronkelijke bedoeling het melden van een geboorte of het bekomen van de toelating tot begraving was, leveren daarenboven informatie die gebruikt wordt voor het monitoren van de gezondheid.35;56;62-68 In het kader van dit proefschrift zullen we voor ziekenhuisontslaggegevens, geboorte- en overlijdenscertificaten de vaak gebruikte term administratieve gegevens gebruiken.61;69 De combinatie van deze administratieve gegevens met demografische en sociaal-economische gegevens, en gegevens over milieuverontreiniging maakt het mogelijk sterfte- en ziektecijfers te berekenen en rekening te houden met verstorende variabelen en covariaten.15 Zo kunnen er rond de toegankelijkheid van diensten vragen gesteld worden, kan er aan de hand van verschillen in behandelingspatronen over streken, waarvan de bewoners nochtans een gelijkaardige gezondheidsstatus hebben, een antwoord gegeven worden op vragen naar geëigende cijfers voor ingrepen, behandelingswijzen of ziekenhuisopnamen.13;15;47;70-77Op basis van de Statistieken van de Burgerlijke Stand (1996)
21
Hoofdstuk 1: Administratieve gegevensbanken
konden we bijvoorbeeld vaststellen dat kinderen van Turkse moeders een groter risico op kindersterfte vertoonden. 35 Deze transitie van louter administratieve gegevensbanken naar beleidsonderbouwende gegevensbronnen is reeds begonnen. Ziekenhuisgegevens worden in toenemende mate gebruikt voor het vervaardigen van rapporten over morbiditeit, mortaliteit en activiteitencijfers.78 Ook moeten zij het mogelijk maken uitspraken te doen over de kwaliteit
en
de
uitkomsten
van
de
verstrekte
zorgen,
en
dienen
het
financieringsmechanisme van het zorgensysteem, vaak in een optiek van kostenbeheersing, te onderbouwen.15;79-83
Een laatste veld van toepassingen van administratieve
ziekenhuisgegevens betreft de evaluatiemogelijkheden, die ze bieden, voor andere sectoren van de volksgezondheid zoals het functioneren van de eerste lijn en de impact van de getroffen preventieve maatregelen.77;84-92 Maar zijn de administratieve gegevensbanken inderdaad bruikbaar voor deze doeleinden? Aan de hand van literatuurgegevens trachten wij zowel de kwaliteit van administratieve gegevens te omschrijven als hun bruikbaarheid in een perspectief van volksgezondheid aan te tonen.
1.1 HET BEOORDELEN VAN DE KWALITEIT VAN GEGEVENS.
Er bestaat een groeiende consensus dat een gegevensbank, bestaande uit elektronische patiënten dossiers, het ideale instrument is voor het verzamelen van kwaliteitsvolle gegevens ten behoeve van een efficiënt zorgmanagement (“managed care”). De concrete uitwerking van dit model echter, heeft te kampen met een aantal vooralsnog onvoldoend opgeloste problemen onder meer in verband met privacy en beroepsgeheim; de beveiliging van de gegevens; de noodzakelijkheid om een gestandaardiseerde inhoud te definiëren en de kosten waarmee een dergelijk systeem gepaard gaat.82 In afwachting wordt er beroep gedaan op administratieve gegevensbanken om kosten en performance te monitoren en de zorgverleners terug te betalen. Waar zij in de eerste plaats bedoeld zijn voor de facturatie van ziekenhuizen en hoewel zij ook nuttige patiëntengegevens registreren
26
, worden in
22
Hoofdstuk 1: Administratieve gegevensbanken
deze benadering administratieve gegevensbanken gebruikt als proxy voor klinische gegevensverzameling over kwaliteit en uitkomst van zorgen.82;93 De kwaliteit van de methoden die gebruikt worden voor het verzamelen van deze gegevens en hun verdere verwerking wordt derhalve belangrijker.79 Voor de onderzoeker, die van dergelijke gegevensbanken gebruik wil maken, bestaat de grootste uitdaging erin te bepalen of die secundaire gegevensbronnen voldoende accurate en valide informatie bevatten.94 Studies van de zeventiger jaren toonden immers aan dat gegevens zoals leeftijd, geslacht, datum van opname en van ontslag zeer accuraat geregistreerd werden maar dat het coderen van ingrepen en vooral van diagnosen minder betrouwbaar was. Ook in meer recente studies blijven de auteurs zich verder vragen stellen omtrent de accuratesse van het coderen van diagnosen 95 en over de validiteit van de diagnosen.96-99 Een andere reden van bekommernis betreft de validiteit van de besluiten van studies in aanwezigheid van verstorende variabelen. Zo stelt men zich de vraag of de vastgestelde verschillen tussen artsen, ziekenhuizen en behandelingen reëel zijn of artefacten te wijten aan vertekening door verschillen in case mix of risicofactoren, die niet meetbaar zijn via administratieve gegevens.80;100-105 Hoewel er in de wetenschappelijke literatuur zeer groot belang gehecht wordt aan de kwaliteit van de gegevens, bestaat er minder eenduidigheid over de inhoud van verschillende aspecten van kwaliteit. Termen zoals accuratesse en precisie worden als synoniemen gebruikt, validiteit wordt op verschillende manieren gedefinieerd en betrouwbaarheid, herhaalbaarheid en reproduceerbaarheid worden vaak door elkaar gebruikt.9 Ook de in deze context belangrijke term codering kan in de literatuur rond de ziekenhuisfinanciering het ganse proces van de diagnosestelling, als de abstrahering en het omzetten van de geabstraheerde medische termen in codevorm (codering stricto sensu) omvatten. Om zoveel mogelijk alle dubbelzinnigheid te vermijden aangaande termen en concepten wordt in de voorliggende tekst de terminologie overgenomen van “A Dictionary of Epidemiology”, een boek gesponsord door de International Epidemiological Association.9 Voor niet in het woordenboek voorkomende termen en begrippen, of bij gebruik van een
23
Hoofdstuk 1: Administratieve gegevensbanken
van het woordenboek afwijkende terminologie, wordt telkens de bron van de gebruikte betekenis aangegeven. Verder menen wij dat een korte omschrijving van enkele begrippen aangaande medische gegevens op zijn plaats is. Ook hier heerst er soms onduidelijkheid wegens een niet eenduidige terminologie. Een vaak gebruikte term, maar met een wisselende inhoud, is die van het “medical record”. Soms gaat het hierbij over een elektronische gegevensopslag, die door getraind personeel geabstraheerd werd uit het medisch dossier van een patiënt, de “chart”, en dit gewoonlijk zonder input van de geneesheer.9 Elders wordt de term ook gebruikt voor het medisch dossier in artsenkantoren of ziekenhuizen waarop zorgverleners diagnoses, klinische details en het ziekteverloop noteren.61 Tenslotte wordt de term ook gebruikt zonder te vermelden of het gaat over een elektronisch medisch dossier of niet60;63, kent men er beide betekenissen aan toe medical records.
108
106;107
of wordt er ook gesproken over papieren
De physician billing databases, zijn een elektronische gegevensopslag
van facturatiegegevens meestal afgeleid van het operatieverslag. Naast de chart houden artsen er soms nog een “daily log”, een persoonlijk dagboek, op na.109 Administratieve gegevens worden door Garnick et al61 gedefinieerd als “vorderingen geregistreerd door private of publieke betalers, opgeslagen verslagen bewaard door organisaties
van
zorgmanagement
of rapporten
van ziekenhuisopnamen
aan
staatsagentschappen.” Dezelfde auteurs stellen dat het onderscheid tussen administratieve en klinische gegevensbanken minder scherp wordt wegens twee ontwikkelingen. Enerzijds maken technologische ontwikkelingen het mogelijk dat klinische resultaten gemakkelijk kunnen geregistreerd worden en anderzijds worden in de publieke en privaatsector gegevensbestanden met zowel administratieve als klinische gegevens ontwikkeld om gemakkelijk de vragen van de overheid over het ziekenhuisgebeuren te kunnen beantwoorden. Scerbo et al.2 definiëren administratieve gegevens als “alle gegevenstypes en –bronnen, die bedoeld zijn voor de administratie van gezondheidsgegevens”. In de volgende paragrafen zullen we trachten op basis van literatuurgegevens een referentiekader
voor
het
beoordelen
van
kwaliteit
van
administratieve
en
mortaliteitsgegevens uit te werken en methoden van onderzoek en ervaringen op dit gebied weer te geven.
Hoofdstuk 1: Administratieve gegevensbanken
24
1.1.1 Uitwerking van een referentiekader voor de beoordeling van administratieve gegevens. Kwaliteit van gegevens is een relatief begrip, dat geoperationaliseerd kan worden door middel van volgende vraag: “Laten deze gegevens toe een antwoord te geven op de gestelde
vragen?”.23
Het
is
duidelijk
dat
een
vraag
over
de
voornaamste
gezondheidsproblemen in een land niet dezelfde kwalitatieve eisen stelt aan een gegevensbank als een vraag over de evolutie van die gezondheidsproblemen of over het relatief belang van het subendocardiaal infarct in de groep van ischemische hartaandoeningen. Het identificeren van de voornaamste gezondheidsproblemen vraagt slechts een benaderende grootteorde, waar er voor het schetsen van een evolutie een meer precieze omschrijving nodig is, zij het in tamelijk grove categorieën, en er voor het derde type probleem een grote accuratesse van de gegevens vereist is. Verder is het zo dat aan een gegevensbestand van een duizendtal records in de context van een gerandomiseerde klinische studie hogere kwaliteitseisen gesteld worden dan aan een MKG-bestand van meer dan een
miljoen observaties. In het eerste geval is het immers vrijwel steeds
mogelijk tot het medisch dossier terug te gaan voor verificatie en eventuele verbetering, waar dit in het tweede geval slechts in beperkte mate zo is. De kwaliteit van de gegevens wordt beïnvloed door de manier waarop deze gegevens verzameld worden: de weergave van het diagnose-behandelingsproces in het medisch dossier, de extractie van de opgeslagen informatie en omzetting ervan in codevorm aan de hand van de codeerregels van het gebruikte classificatiesysteem. We komen hier verder uitvoerig op terug. Verder is het vanzelfsprekend dat de kwaliteit ook sterk beïnvloed wordt door de context waarbinnen
de registratie zich voordoet (kwaliteitsbewakend,
epidemiologisch of financieel), de manier waarop de gegevens verzameld worden en de werklast, die de gegevensverzameling met zich meebrengt. Zo beschrijft Chatfield de gegevensverzameling van de ambtelijke statistieken als volgt: “At the time of writing there has been an explosion in the amount of data that hospital managers are trying to collect in the UK so that nurses and doctors spend a high proportion of their time in completing poorly designed forms rather than treating patients. Much of the information is
25
Hoofdstuk 1: Administratieve gegevensbanken
of dubious quality and some is never actually used. Insufficient attention has been given to specifying objectives and to questionnaire design”.23 Wyatt omschrijft gegevenskwaliteit als volgt: “De mate waarin de items van de gegevens accuraat zijn, volledig, relevant (beantwoorden de gegevens aan de doelen waarvoor ze verzameld werden?), tijdig, voldoende gedetailleerd, op de juiste manier weergegeven (bijvoorbeeld gecodeerd door middel van een klinisch codeersysteem), en met voldoende contextuele informatie om het nemen van beslissingen toe te laten.”
110
Het Federaal
Kenniscentrum voor de gezondheidszorg beoordeelde de kwaliteit van de Belgische gegevensbanken in termen van toegankelijkheid en duidelijkheid (actuele informatie over de gegevensbank in de vorm van metadata); relevantie en accuraatheid. Verdere aandachtspunten waren de volledigheid; consistentie (relaties tussen de entiteiten van de bank zijn constant zoniet verenigbaar); coherentie (de gegevens zijn gebaseerd op gemeenschappelijke concepten, definities, classificaties); en, tijdigheid en punctualiteit (naleven van de gemaakte afspraken i.v.m. oplevering van gegevens).32 Aan de hand van literatuurbevindingen zal derhalve getracht worden een evenwichtig geheel van aandachtspunten en analysemethoden samen te stellen en tevens voldoende vergelijkingsmateriaal te verzamelen om de kwaliteit van de gegevens van de in deze studie gebruikte Belgische administratieve gegevensbanken en de resultaten van de erop uitgevoerde analyses te toetsen. 1.1.1.1 Doeleinden van een registratie, verzamelwijze, diagnose, abstrahering en codering van de gegevens. Om op een gefundeerde manier uitspraken te kunnen doen over de gegevenskwaliteit dient men rekening te houden met de context waarbinnen en de doeleinden waarvoor ze verzameld werden.
Er bestaan verschillende methoden om gegevens te verzamelen:
steekproefsgewijs of exhaustief, via een questionnaire of via instructies (MKG of bevolkingsstatistieken, in de Amerikaanse literatuur “vital statistics” genaamd). Het design van de studie of van de bevraging is belangrijk in termen van interne en externe validiteit: “Gaat het over een gerandomiseerd experiment of niet, of gaat het over een observationeel onderzoek?” (cf. 1.1.8)
26
Hoofdstuk 1: Administratieve gegevensbanken
De manier van bevragen is belangrijk voor het bekomen van kwaliteitsvolle gegevens. Zo zijn onder meer de formulering van de vragen en het type van vragen (open of gesloten) belangrijk.62;111 Verder is de kwaliteit van de instructies voor het registreren van kapitaal belang voor de analyse, die later uitgevoerd wordt: geen enkel veld van een gegevensbank mag ingenomen worden door informatie, die op voorhand niet precies gedefinieerd werd.77 Het gebrek aan definities is een vaak opduikend probleem bij ziekenhuisregistraties, zeker wanneer het gaat over essentiële begrippen zoals de (hoofd)diagnose.60 Toch is de (hoofd)diagnose een essentieel en kritisch deel van het medisch dossier. Dit geldt zowel voor het klinisch beleid (bvb. bij heropname, het uitwerken van richtlijnen), voor het financieel beleid van het ziekenhuis en voor de volksgezondheid, meer bepaald voor het evalueren van de zorgenbehoeften en van incidentie-evoluties in de bevolking.112-115 Na de diagnosestelling is het abstraheerproces van de administratieve gegevens uit het patiëntendossier dikwijls een delicaat ogenblik bij de gegevensverzameling.116 Dit proces wordt meestal uitgevoerd door gespecialiseerd personeel, dat echter zelf geen arts is, en dit, wegens het vaak ontbreken van een abstraheervorm, meestal op een nietgestandaardiseerde manier. Overigens is het moeilijk om een abstraheervorm te ontwerpen omdat patiëntendossiers complex zijn en op zeer individuele manier bijgehouden worden.62 Verder is de kwaliteit van de gegevens functie van het gemak waarmee gegevens geregistreerd kunnen worden
en ook van het feit of de gegevens al dan niet uit
verschillende bronnen werden samengesmolten. In het laatste geval is het belangrijk na te gaan of er bij de samensmelting inconsistenties werden vastgesteld en hoe ervoor gecorrigeerd werd.23 Uiteindelijk dienen de medische gegevens voor hun verwerking in codevorm omgezet te worden.114Dit is geen gemakkelijke taak en vereist een specifieke vorming, een aanspreekpunt voor het beantwoorden van vragen i.v.m.codeerproblemen en een regelmatige updating van de codeerinstructies.114;115
27
Hoofdstuk 1: Administratieve gegevensbanken
Daarnaast moeten regelmatige, grootschalige audits ervoor zorgen dat de codeerkwaliteit bewaakt wordt.115We komen later in het vierde hoofdstuk, gewijd aan aan de mortaliteitstatistieken (sectie 4.1) en de kwaliteit van de gegevens in een prospectief financieringssysteem (sectie 4.2), meer in detail terug op de audit en de codeerproblematiek. 1.1.1.2 Gegevensopslag (“Data Entry”). “Since data entry precedes data utilization, the reliability of the information stored strongly depends on the quality of data input. ”.116 Het is derhalve aangewezen om gebruik te maken van technieken en routines, die erop gericht zijn het invoeren van foute gegevens of het verloren gaan van gegevens te vermijden. Het lijkt bijvoorbeeld aanbeveling te verdienen de invoer te herhalen van sleutelvariabelen, die de unieke omschrijving van een record
bepalen.116
Een
interessanter
alternatief
is
het
automatiseren
van
de
gegevensopslag.116 De kwaliteit van de gegevens kan verbeterd worden door het gebruik maken van template (automatisch overschrijven) en picture clausules (bvb. het omzetten van kleine letters in hoofdletters) in formaatspecificaties, zodat bepaalde digits per definitie vastliggen (bvb M voor een morfologiecode voor kankers) of dat bepaalde digits automatisch als hoofdletters geregistreerd worden.116 Een verdere methode bestaat erin te controleren of het “domein” van het “alfanumerisch” of “discreet” item gerespecteerd werd, of het “bereik” (de “range”) van een continu item.77 De hoogste graad van gegevenszekerheid wordt bereikt wanneer gegevens gegenereerd worden van reeds bestaande en gevalideerde gegevens door een “procesroutine”: bijvoorbeeld het berekenen van een Body Mass Index op basis van een gevalideerde lengte en gewicht.116 Een supplementaire manier om over kwalitatief goede gegevens te beschikken is de optimalisatie van de gegevensopslag. Zij omvat onder meer: (1) een aangepast formaat (indien mogelijk geen vrije tekst), (2) een onmiddellijk registreren op de formulieren, die zullen dienen voor de gegevensinvoer om zoveel mogelijk transcriptiefouten van de gegevens te verhinderen, (3) de scherm lay-out zoveel mogelijk laten gelijken op het
28
Hoofdstuk 1: Administratieve gegevensbanken
formulier, (4) het optisch inlezen, en (5) goede ergonomische voorwaarden.116 Met de moderne technologie werden geautomatiseerde routines uitgewerkt die het mogelijk maken een snelle en uitgebreide controle uit te voeren terzelfder tijd met de gegevensinvoer. Dit is verkieselijk boven een controle in een latere fase van gegevensverwerking.116 1.1.1.3. Opsporen en omspringen met fouten en outliers. “A result which looks interesting is probably wrong!”.23 Een outlier is een extreme observatie, die niet consistent lijkt te zijn met andere gegevens: bijvoorbeeld iemand van 129 jaar of van 246 cm. Outliers kunnen bijvoorbeeld omschreven worden als de waarden die buiten een gebied van waarden vallen, met als ondergrens: het eerste kwartiel – (1.5*Interkwartiel bereik), en als bovengrens: het derde kwartiel + (1.5*Interkwartiel bereik).117-119 Een outlier kan veroorzaakt zijn door een fout maar er bestaan ook echte outliers. Deze komen voornamelijk voor wanneer een verdeling sterk asymmetrisch is en de outlier uit de “lange” staart van de verdeling komt (bijvoorbeeld de verblijfsduur in functie van een bepaalde Diagnosis Related Groups (DRG)).23 Er bestaan verschillende foutentypes: waarnemingsfout (bijvoorbeeld het slecht aflezen van een instrument); tik- of schrijffout; transcriptiefout, een niet correcte kopij van een observatie; inversiefout, wat bij codes belangrijk kan zijn bvb. 401 (hypertensie) versus 410 (AMI); herhaling van een observatie, die vaak gecombineerd is met de verwijdering van een andere observatie; en tenslotte de falsificatie van een resultaat 23;60 Het insluipen van fouten kan ondanks maximale inspanningen niet vermeden worden. Fouten dienen derhalve opgespoord te worden. Het lijkt aangewezen hiervoor optimaal gebruik te maken van de gegevenseigenschappen om een aantal kwaliteitscontroles uit te voeren, die gebaseerd zijn op het type (numeriek, alfabetisch of alfanumeriek) en de aard (continu of discreet) van de meetbare gegevens. Een gegevenswoordenboek kan hierbij een zeer nuttige rol spelen. Het gaat daarbij over een metagegevensbank waarin alle items omschreven worden en hun eigenschappen bepaald.
Hoofdstuk 1: Administratieve gegevensbanken
29
Foute gegevens veroorzaken incoherenties en komen in conflict met een formele definitie, of “fitten” niet met andere feiten: bvb. type van kanker is “onbekend” en het type van differentiatie is “wel gedifferentieerd”.116 Dergelijke relationele controles zijn in geval van nominale of ordinale variabelen meestal deterministisch: de relationele controle geeft aan dat de geregistreerde waarde onverenigbaar is met de als “mogelijk” gedefinieerde waarde(n). Zo kan een adenocanthoma alleen “welgedifferentieerd” zijn. In geval van interval of ratio meetniveau of continue variabelen zal de controle meestal probabilistisch zijn: bij een welgedifferentieerd adenocanthoma heeft de kortste kernas een lengte van 2 tot 12 μm. Een lengte korter dan 2 is onmogelijk (deterministisch) en een lengte van boven de 12 is onwaarschijnlijk (probabilistisch).116 Voor de kwaliteitsbewaking van routinematig verzamelde gegevens wordt vaak beroep gedaan op een probabilistische benadering door het opsporen en verbeteren van “onwaarschijnlijke” waarden, de foutpositieven. De probabilistische benadering echter is duidelijk gericht op de detectie van fout positieve gegevens. Nu dient de “verbetering” van fout positieve gegevens afgewogen te worden tegen het bestaan van fout negatieve gegevens.120 Het is dan belangrijk om te beoordelen of de voorgenomen verbetering ook inderdaad een verbetering is. Wij hebben dit probleem behandeld in een studie over de voorspellende waarde van het geïnformatiseerde controleprogramma van de statistieken van de Burgerlijke Stand aan de hand van gegevens van 1988 en dat als volgt gepubliceerd werd: “Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8. 120” Nemen we als voorbeeld een record waarin bij een 20 jarige man een acuut myocard infarct geregistreerd (AMI) werd. Op dergelijke leeftijd is een AMI een zeldzaamheid en bestaat er het risico dat het over een fout positief geval gaat: er werd een code van AMI geregistreerd voor een aandoening, die geen AMI was. Wat is dan de probabiliteit dat het om een fout positief gegeven gaat?
30
Hoofdstuk 1: Administratieve gegevensbanken
Detectie en verbetering van foutpositieve waarden, de B van tabel 1 (vóór correctie), zijn alleen nuttig indien de waarde A, beter de gezochte waarde A+C benadert dan de oude waarde A+B, waarvan men vertrokken is. Tabel 1: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Theoretische benadering. Vóór “correctie” Diagnose Aanwezig Afwezig Totaal A B Ami in de Aanwezig A+B Registratie Afwezig C D C+D Totaal A+C B+D N
Na “correctie” Diagnose Aanwezig Afwezig Totaal A A C D* C+D* A+C D* N
Indien de waarde van A+B = A+C is het duidelijk dat de nieuwe schatter A verder verwijderd is van de gezochte waarde A+C, dan de oude schatter. Een eventuele correctie is dus maar zinvol als A+B > A+C. Het nut van een eventuele correctie houdt dan onmiddellijk verband met de relatieve waarde van B, de foutpositieven, ten opzichte van C, de foutnegatieven. Vóór correctie wordt A+C, het aantal personen met de aandoening, geschat door A+B, het aantal personen geregistreerd met de aandoening. Door het controleren van alle personen met een registratie van AMI, worden de fout positieve gevallen, de groep B, opgespoord en gereclasseerd in D. De D*, in de tabel na correctie, is dus gelijk aan B+D van vóór de correctie. Wat verandert, is de schatting van A+C, die na correctie nog uitsluitend geschat wordt door A. De nuttigheidsdrempel van de verbetering wordt bereikt wanneer B, de groep van fout positieven, gelijk is aan 2 maal C, de groep van fout negatieven: (A+B)- (A+C) = (A+C)-A Ù B = 2 x C, waarin (A+B)-(A+C) het verschil is tussen de oude schatter, (A+B), en de gezochte waarde, (A+C), en (A+C)-A, het verschil is tussen de gezochte waarde en de nieuwe schatter.
31
Hoofdstuk 1: Administratieve gegevensbanken
Tabel 2: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van een correctie, die tot een “slechtere” schatter leidt. Vóór “correctie” Diagnose Aanwezig Afwezig Totaal 1000 50 Ami in de Aanwezig 1050 Registratie Afwezig 50 3900 3930 Totaal 1050 3950 5000
Na “correctie” Diagnose Aanwezig Afwezig Totaal 1000 1000 50 3950 4000 1050 3950 5000
In tabellen 2 en 4 worden cijfermatige voorbeelden gegeven van nieuwe schatters, die respectievelijk slechtere en betere schatters zijn, dan de oorspronkelijke. In tabel 2 is het verschil tussen respectievelijk 1050 en1050 inderdaad kleiner dan dat tussen 1000 en 1050 en is de nieuwe schatter verder verwijderd van de geschatte waarde, waar dit in tabel 4 net het omgekeerde is. In tabel 2 is 2*C immers gelijk aan 100 waar B gelijk is aan 50 en in tabel 4 belopen deze waarden respectievelijk 100 voor 2*C en 120 voor B. Tabel 3 illustreert de nuttigheidsdrempel. Dit is de waarde, waarbij een correctie geen verbetering maar ook geen verslechtering van de schatter tot gevolg heeft en die de overgang vormt tussen een “nadelige” en een “voordelige” verbetering. Tabel 3: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van de nuttigheidsdrempel: correctie leidt noch tot een “betere” noch tot een “slechtere” schatter. Vóór “correctie” Diagnose Aanwezig Afwezig Totaal 1000 100 Ami in de Aanwezig 1100 Registratie Afwezig 50 3850 3900 Totaal 1050 3950 5000
Na “correctie” Diagnose Aanwezig Afwezig Totaal 1000 1000 50 3950 4000 1050 3950 5000
32
Hoofdstuk 1: Administratieve gegevensbanken
Tabel 4: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van een correctie, die tot een “betere” schatter leidt. Vóór “correctie” Diagnose Aanwezig Afwezig Totaal 1000 170 Ami in de Aanwezig 1170 Registratie Afwezig 50 3780 3830 Totaal 1050 3950 5000
Na “correctie” Diagnose Aanwezig Afwezig Totaal 1000 1000 50 3950 4000 1050 3950 5000
Het probleem blijft het inschatten van de relatieve waarden van B en C. Dit probleem is situatiegevoelig. In een context van mortaliteit bijvoorbeeld, is het voorkomen van een goedaardige tumor als doodsoorzaak dermate weinig waarschijnlijk dat het probleem van foutnegatieve tumoren als nagenoeg onbestaande kan beschouwd worden. Wanneer het gaat over variabelen zoals lengte, gewicht en andere meetbare grootheden zullen andere, distributionele overwegingen duidelijk moeten maken of de extremen van de verdeling dermate oververtegenwoordigd zijn dat men inderdaad kan aannemen dat B > 2*C. In sommige gevallen, zoals voor de AMI casus, kan er beroep gedaan worden op bestaande en gevalideerde leeftijds- en geslachtsverdelingen van de bestudeerde aandoening om de probabiliteiten in te schatten. Dit gegeven zijnde, lijkt een benadering, uitsluitend gebaseerd op foutpositieven een betwistbare aanpak. Het opsporen van fouten en outliers vormt een belangrijk onderdeel van de gegevensverwerking en –analyse. “Editing”, het controleren van de gegevens op fouten, en “Cleaning” zijn de daarvoor gebruikte procedures. Editing kan omschreven worden als het proces waarbij de accuratesse, de consistentie en de volledigheid nagegaan wordt.121 Op het gebied van codering bestaat editing uit het testen van de validiteit - bestaat de code? of de consistentie van de toegekende code.122 Onder data cleaning verstaat men het iteratieve voortdurende proces, waar door gebruik van logische en statistische controles, fouten opgespoord, verbeterd of verwijderd worden23;117 Andere auteurs spreken over cleaning als het proces van het verwijderen van incomplete records of records met inconsistente informatie.9 Het is duidelijk dat “cleaning”, zeker in de zin van het verwijderen van foute gegevens, dient gerapporteerd te worden 9 en indien mogelijk door een op probabiliteiten gesteunde benadering vervangen te worden.23
Hoofdstuk 1: Administratieve gegevensbanken
33
Fouten kunnen opgespoord worden via controles i.v.m. geloofwaardigheid (“range test”: valt een waarde buiten het op voorhand gespecificeerde bereik van plausibele waarden), consistentie (vergelijking van leeftijd met geboortedatum en overlijdensdatum, van geslacht met bepaalde aandoeningen) en volledigheid. Ook de frequentiedistributie van de variabelen aan de hand van histogrammen, kruistabellen, boxplots en scatterplots van paren variabelen laten toe outliers of systematische fouten op te sporen.23;121,123 Wanneer een gegeven als outlier wordt geïdentificeerd dient het verbeterd te worden waar mogelijk of verwijderd waar het moet. Voor extreme observaties kan het wijs zijn het advies te vragen van een expert ad-hoc. Robuuste methodes zoals trimming, i.e. het weglaten van enkele van de meest extreme observaties (bijvoorbeeld een vaste proportie in de uiteinden van een verdeling), kunnen aangewezen zijn117 of het nagaan van de invloedrijkheid van een outlier door het vergelijken van de resultaten met en zonder de outlier. Tenslotte dient er een duidelijke en liefst simpele volgorde te bestaan van te ondernemen stappen voor het aanbrengen van de vereiste verbeteringen. 1.1.1.4 Ontbrekende waarden en volledigheid van de registratie. Het is belangrijk te weten of en waarom er een waarde ontbreekt. Gaat het over een “missing completely at random” ( MCAR), onafhankelijk van zowel de afhankelijke als de onafhankelijke variabelen, of niet.23 Dit is de meest gunstige situatie. Het verwijderen van onvolledige records, de “complete-subject approach”, kan hier toegepast worden, tenminste als er niet teveel records ontbrekende waarden vertonen.121 Soms echter is een ontbrekende waarde gerelateerd met de independente of met de dependente variabele. In dergelijke gevallen kunnen multipele imputatie of specifieke, onvolledige-gegevens analysemethoden noodzakelijk zijn en is de benadering voldoende accuraat wanneer er een aantal covariaten aanwezig zijn. 23 De software waarover men vandaag beschikt laat een op een modellering gebaseerde imputatie toe.124 Het creëren van een speciale categorie voor ontbrekende waarden of het creëren van een indicator variabele voor elke variabele met ontbrekende waarden zijn foutieve oplossingen voor het omspringen met ontbrekende waarden. Deze methoden kunnen immers tot vertekende schatters leiden, zeker als de ontbrekende waarde een confounder van de studie is.121
34
Hoofdstuk 1: Administratieve gegevensbanken
Een ander aspect van ontbrekende waarden is de volledigheid van de registratie. Hierbij wordt bijvoorbeeld nagegaan of elk ziekenhuisverblijf al dan niet geregistreerd werd en of de verdeling van de niet-geregistreerde verblijven dezelfde is over de verschillende diensten van het ziekenhuis en over verschillende perioden van het jaar.60 Verder is het belangrijk ook de volledigheid van de deelaspecten van een verblijf, zoals ingrepen, diagnoses en voorschriften, na te gaan. Het verwachte volume kan bepaald worden aan de hand van op een zelfde manier berekende cijfers voor vergelijkbare periodes of voor een vergelijkbare bevolking. Men dient hierbij rekening te houden met eventuele seizoensgebonden fluctuaties, veranderingen in beschikbaarheid van diensten (toegankelijkheid en dekkingsgraad), verschillen over subgroepen (onder meer leeftijdsgroepen en geslacht), en geografische verschillen. Dergelijke oefeningen maken het mogelijk om de gegevens te toetsen en hun geloofwaardigheid in te schatten.2;21 1.1.1.5 Accuratesse en validiteit De accuratesse en validiteit van de gegevens zijn van uitzonderlijk belang voor de evaluatie van diensten, het monitoren van de evolutie van gezondheidsproblemen in de bevolking en het bepalen van beleidsprioriteiten.113-115Accuratesse is de mate waarin een meting of een schatting gebaseerd op metingen de werkelijke waarde weergeeft van het attribuut dat gemeten wordt.9 In geval van uniform verdeelde variabelen kan een onderzoek naar “last-digit-preference” problemen in verband met accuratesse aan het licht brengen. Zo stelden we een duidelijke “last-digit-preference” bij het medisch schooltoezicht (MSTgegevens 1994) vast voor lengte en gewicht, die volgens de richtlijnen dienen gemeten te worden op respectievelijk 100g en 1 mm na, en die belangrijke variabelen zijn voor het opvolgen van de groei.125 Omgekeerd biedt het nagaan van een ontbrekende laatste digit een mogelijkheid voor kwaliteitsbewaking.123 In de context van ontslaggegevens wordt accuratesse gedefinieerd als de proportie van ziekenhuisontslaggegevens, die dezelfde code (voor de hoofddiagnose) hebben als dewelke die toegekend werd door een onafhankelijk review van het ontslagformulier en/of van het medisch dossier.115 Een klassieke methode van peiling naar accuratesse en vaak de finale stap in het controleren van de gegevenskwaliteit is de “Chart review ”, de vergelijking van de
Hoofdstuk 1: Administratieve gegevensbanken
35
geregistreerde gegevens met de gegevens van het originele medisch dossier. De bedoeling van deze vergelijking is het vaststellen of de opgeslagen medische gegevens op een accurate manier de diagnoses, de diensten en ingrepen, die uitgevoerd of gepresteerd werden, weergeven.2;60 Het hoeft geen betoog dat deze voortreffelijke methode erg omslachtig en arbeidsintensief is. Bij de beoordeling van de kwaliteit van gegevens speelt het concept “validiteit” een hoofdrol. In functie van de context kan het gaan over de validiteit van een meting of meetmethode, van een onderzoek of van een gegevensbank. Validiteit van een meetmethode (validity, measurement) kan gedefinieerd worden als de mate waarin een meetmethode meet wat ze bedoelt te meten.9;126 Een eerste facet van validiteit is de begripsvaliditeit (“construct validity”), of de mate waarin de meetresultaten
overeenkomen met de theoretische concepten (het
begrippenkader) betreffende het bestudeerde gezondheidsfenomeen: bvb. indien de bloeddruk verandert in functie van de leeftijd dienen de meetresultaten dit te weerspiegelen. Een tweede facet is de inhoudsvaliditeit (“content validity”), of de mate waarin de meting overeenkomt met het domein van het bestudeerde verschijnsel: bvb. een meting van de functionele gezondheidsstatus dient onder meer de Activities of Daily Living (ADL, Activiteiten van het Dagelijkse Leven) te bevatten, en verder het beroeps, familiaal en sociaal functioneren.9 In geval van een klinische indicator spreekt men van content validiteit als de mate waarin de indicator ook werkelijk het probleem, dat men wenst te benaderen, weergeeft. Een voorbeeld: het voorkomen van een postoperatief longembool (de indicator) suggereert een inadequate preoperatieve profylaxe (het probleem)
bij
patiënten waarbij een belangrijke operatieve ingreep gepland was.127 De content validiteit kan verbeterd worden door het ontwikkelen en het gebruiken van duidelijk gedefinieerde registratie-items en door hun extensieve (over het ganse land) uittesten met feedback naar en beoordeling door de participanten.127 Een derde facet is de criterium validiteit, of de mate waarin de meting overeenstemt met een criterium, onafhankelijk van het bestudeerde verschijnsel. Hierin onderscheidt men de gelijktijdige en de voorspellende validiteit. Bij de gelijktijdige validiteit wordt nagegaan of de meting overeenkomt met een onafhankelijke toets, die op hetzelfde tijdstip uitgevoerd
36
Hoofdstuk 1: Administratieve gegevensbanken
wordt. Een voorbeeld ervan is de visuele inspectie van een wonde en het bacteriologisch onderzoek van een specimen genomen op het ogenblik van de inspectie. De voorspellende validiteit van een meting wordt uitgedrukt als zijn bekwaamheid om het toetsingsresultaat te voorspellen. Zo wordt een test i.v.m. de
academische geschiktheid van studenten
getoetst aan de hand van de daaropvolgende academische performance.127 Een vierde en laatste facet van validiteit is de indruksvaliditeit (“face validity”), of de mate waarin een meting, na oppervlakkige inspectie, als aanvaardbaar bestempeld wordt. In een context van klinische indicatoren spreekt men van klinische experts, benoemd door hun peers, die de medische deugdelijkheid en het geëigend zijn van de indicatoren waarborgen, door middel van een proces van uitgebreide gedachtewisseling en review.77;127 Validiteit van een onderzoek (validity, study), is de mate waarin de conclusies, die uit de studie afgeleid werden, gerechtvaardigd zijn. Hierbij wordt er rekening gehouden met de gebruikte studiemethoden, de representativiteit van de studiesteekproef en de natuur van de bevolking waaruit de steekproef getrokken werd. Men onderscheidt de interne en de externe validiteit.9;128 Om de interne validiteit te bepalen werden de index- en de vergelijkingsgroep(en) dusdanig geselecteerd en vergeleken dat de tussen hen geobserveerde verschillen wat de bestudeerde afhankelijke variabelen aangaat, behoudens een steekproeffout, alleen kunnen toegeschreven worden aan het bestudeerde veronderstelde effect. De externe validiteit of “generalizability” gaat de veralgemeenbaarheid van een studie na of m.a.w. stelt de vraag of de studie al dan niet tot vertekende conclusies leidt in een doelpopulatie. Bijvoorbeeld wanneer een studie alleen werd uitgevoerd op mannen en de ganse bevolking is de doelpopulatie, vraagt men zich af of de bevindingen ook geldig zijn voor vrouwen. De evaluatie van de veralgemeenbaarheid vereist veel meer een inhoudelijke beoordeling dan bij een evaluatie van de interne validiteit.9 De validiteit van een gegevensbank, of de mate waarin de gegevensbank de werkelijke biologische toestand van de geregistreerde weergeeft, geeft aan in welke mate de gestelde diagnoses correct zijn en de in het medisch dossier vermelde diensten of ingrepen ook werkelijk gepresteerd of
uitgevoerd werden.129
Hierbij stelt de validiteit van een
geregistreerde diagnose een speciaal probleem. De International Classification of Diseases (ICD), zowel ICD-9 als ICD-10, bevat immers, op enkele uitzonderingen zoals psychiatrische aandoeningen na, geen expliciete definities van ziekten.27;130 Het is dus een
Hoofdstuk 1: Administratieve gegevensbanken
37
zaak van klinisch oordeel of een ziekte aanwezig is of niet, en, wanneer bijkomende criteria voor de diagnose van sommige ziekten werden ontwikkeld door de WHO of door andere instanties, werden ze meestal niet op eenvormige manier toegepast.131 1.1.1.6 Betrouwbaarheid, herhaalbaarheid en reproduceerbaarheid Betrouwbaarheid (“Reliability”) is de mate van stabiliteit, die bereikt wordt bij herhaling van een meting onder dezelfde voorwaarden.9;126 Een gebrek aan betrouwbaarheid kan ontstaan wegens onenigheid onder waarnemers of meetinstrumenten, of onstabiliteit van het te meten kenmerk. De betrouwbaarheid van de gegevens van een gegevensbank kan in vergelijking met de medische dossiers uitgedrukt worden als de accuratesse waarmee het medisch dossier in de gegevensbank weergegeven wordt.129 De betrouwbaarheid van een indicator hangt sterk af van een zelfde manier van rapporteren door de participanten van een studie of een project.127 Herhaalbaarheid (“repeatability”) of reproduceerbaarheid (“reproducibility”) geven aan of een test of een meting herhaalbaar zijn. Deze begrippen refereren aan de actie van het herhaald uitvoeren van iets en niet naar de kwaliteit van de meting.
1.1.2 Kwaliteit van de gegevens van administratieve gegevensbanken. Aan de hand van concrete voorbeelden uit de literatuur en uit eigen onderzoek, uitgevoerd21;132 in
2001-2, wordt getracht een beeld te schetsen van de manier waarop
gegevensbanken op hun kwaliteit beoordeeld worden en van de factoren, die de kwaliteit beïnvloeden. 1.1.2.1 Epidemiologische en statistische methoden voor het beoordelen van de gegevenskwaliteit. 1.1.2.1.1 Vergelijking van gegevens binnen en tussen bestanden of gegevensbanken. Een manier om de kwaliteit van de gegevens van een register te onderzoeken bestaat erin ze te vergelijken met de gegevens uit een andere, onafhankelijke bron. Een voorbeeld hiervan is de vergelijking van het aantal incidente kankers uit een kankerregister met het aantal sterfgevallen door kankers van hetzelfde type in de overlijdensstatistieken, of door
Hoofdstuk 1: Administratieve gegevensbanken
38
een vergelijking van gelijkaardige gegevensbanken, zoals het aantal AIDS- en tuberculosepatiënten in een AIDS en een Tuberculose register, of het aantal ziekenhuisopnamen met een verblijfsduur van minstens een dag in geval van verkeersongevallen in de MKG en het Belgisch Instituut voor Verkeersveiligheid (BIVV) (Figuur 1), of de overeenkomst tussen MKG en het Nationaal Instituut voor de Statistiek of het Studiecentrum voor Perinatale Epidemiologie i.v.m. een aantal gegevens rond bevallingen (zie hoofdstuk 5: het Keizersnedencijfer).21;132-136 Figuur 1: Evolutie van het aantal niet-fatale verkeersongevallen zoals geregistreerd in het BIVV en de MKG, 1996-2001.
Evolutie van niet-fatale verkeersongevallen in het BIVV en de MKG 12500 10000 7500 5000 2500 0 1996
1997
1998
1999
BIVV
2000
2001
MKG
Een volgende methode bestaat erin twee types van gegevens in een zelfde register met mekaar
te
vergelijken,
zoals
bijvoorbeeld
overlevingsgegevens
met
incidente
kankergevallen, wat een idee geeft over de volledigheid van de overlevingsgegevens137, of bijvoorbeeld, zoals we elders meer uitvoerig rapporteerden21, door het nagaan of er bij registratie van een letsel ook de bijbehorende manier van ontstaan (de zogenaamde Ecode) geregistreerd werd of omgekeerd (Tabellen 5 en 6).
39
Hoofdstuk 1: Administratieve gegevensbanken
Om de volledigheid van het totale bestand na te gaan kan men verder, in afwezigheid van een andere, onafhankelijke bron, gebruik maken van “indirecte indicatoren”. Zo is het mogelijk gestandaardiseerde overlevingsgegevens voor een aantal kankers in een aantal landen te berekenen. Wanneer dan voor een bepaald type kanker de overleving in een land sterk verschilt vergeleken met die van de andere, is dit een aanduiding voor een onvolledigheid van de gegevens.137 Een andere methode is de vergelijking tussen de geregistreerde
gegevens
en
het
medisch
dossier
of
het
logboek
van
het
operatiekwartier.94;138;139 De audit van de MKG is hier een andere illustratie van (zie sectie 4.2).
Hoofdstuk 1: Administratieve gegevensbanken
40
Tabel 5: Percentage van ontbrekende letselcodes wanneer de E-code aanwezig is. MKG 1996-8. Gewest Brussel Vlaanderen Wallonië
Geslacht
1996
1997
1998
M
34,68
31,31
30,55
V
34,68
32,96
30,95
M
20,63
20,95
22,62
V
24,20
25,91
26,75
M
26,98
27,41
28,46
V
30,54
31,86
32.19
Tabel 6: Percentage van ontbrekende E-codes wanneer de letselcode aanwezig is. MKG 1996-8. Gewest Brussel Vlaanderen Wallonië
Geslacht
1996
1997
1998
M
82,00
77,18
74,79
V
79,85
74,65
72,76
M
82,74
81,55
80,71
V
80,90
80,08
78,91
M
75,76
73,36
71,53
V
75,01
72,88
70,65
In het kader van een gezondheidssysteem met een structurele uitbouw van de verwijzing van eerste lijn naar tweede lijn en omgekeerd, is de informatie in het ziekenhuisdossier over patiënt (naam en adres), de verwijsmodaliteit en de huisarts (naam en adres) essentieel. Dit systeem houdt tevens mogelijkheden van validatie in van diagnostische gegevens, waarvan de kwaliteit kan nagegaan worden door een vergelijking van bepaalde gegevens uit het ziekenhuisdossier met dezelfde informatie ingewonnen bij huisartsen via interviews en dossiers.78 Dit is een vooralsnog onontgonnen validatie mogelijkheid voor de MKG.
41
Hoofdstuk 1: Administratieve gegevensbanken
Bij dergelijke vergelijkingen is de nagestreefde precisiegraad belangrijk, bijvoorbeeld tot op de 3de of de 4de digit van de gecodeerde diagnose in functie van het kankertype, diagnose of ingreep.82;137 Voor de formulering van correcte besluiten en ook in een optiek van toetsing van de gegevenskwaliteit van administratieve gegevensbanken is het aangewezen bij dergelijke oefeningen zowel de geslaagde als de mislukte koppeling aan te geven, benevens de redenen van een mislukte koppeling.22;139 1.1.2.1.2 Steekproefsgewijze versus exhaustieve validatie. Het valideren van alle records in een volledige (ziekenhuis)registratie is praktisch onmogelijk. Vaak is werken op een steekproef hiervoor het enig werkbare alternatief. Verschillende 138;140
steekproef
methoden
werden
hiervoor
gebruikt:
werken
op
een
aselecte
139
, op een gestratificeerde steekproef , eventueel met een oversampling van
patiënten die behoren tot een categorie met een lagere positieve voorspellende waarde141, liefst met een op voorhand bepaalde steekproefgrootte.60 Een alternatief voor een steekproefsgewijze benadering is een vergelijking van de gegevenskwaliteit uit te voeren op subpopulaties van patiënten met een zeer beperkt spectrum van diagnoses of ingrepen
in een administratieve gegevensbank en een
gegevensbank, die kan beschouwd worden als de gouden standaard. De bevindingen uit deze vergelijking worden in een tweede tijd veralgemeend over de ganse administratieve gegevensbank. Zo werden uit een administratieve gegevensbank een groep patiënten met een myocardinfarct en een groep van vrouwen, die een obstetrische ingreep ondergingen, vergeleken met deze uit een peer review programma en werden de bevindingen uit deze vergelijking veralgemeend over het ganse administratieve bestand.82 1.1.2.1.3 Maten van overeenkomst. Bij de bestudering van de kwaliteit van bepaalde gegevens, zoals een diagnosestelling, wordt, in afwezigheid van een gouden standaard, vaak beroep gedaan op maten van interbeoordelaarsovereenstemming (“interrater agreement”), waarbij twee of meerdere onderzoekers hetzelfde studieobject beoordelen en de onderlinge overeenkomst gemeten wordt. Het nagaan van de overeenkomst tussen twee of meerdere waarnemers is immers een vaak aanwezig onderdeel van kwaliteitsbewaking van de gegevens in de
Hoofdstuk 1: Administratieve gegevensbanken
42
geneeskunde.142-149Andere voorbeelden zijn: vergelijking van een aantal items in een gegevensbestand en in de overeenstemmende medische dossiers, de abstractie van dezelfde gegevens door twee personen, het vergelijken van patiëntenkarakteristieken van dezelfde patiënten, die zich in twee gegevensbestanden bevinden. De hierbij gebruikte maten zijn de al dan niet gewogen kappa63;79;82;109;138;150-154, het percentage van overeenkomst of van afwijking23,26,44,73,105,106, intraclass correlation coefficient
45,89,109
, Cronbach’s alfa
118;126
en χ2 analyses van waargenomen versus te
verwachten waarden op basis van een bepaald percentage van overeenkomst109. Bij een kappatoets, zeker indien hij een tamelijke tot goede overeenkomst aangeeft, zoals een kappa tussen 0.4 en 0.75155, is het aangewezen de niet-diagonale elementen te analyseren om een systematische afwijking door een van de beoordelaars na te gaan.156 Standaard software zoals SAS® stelt hiervoor bepaalde symmetrietoetsen ter beschikking zoals de Mc Nemar en Bowker toetsen.157 Een andere reeks toetsen wordt gebruikt, wanneer bij een vergelijking één waarnemer als referentie fungeert, de zogeheten “Gouden standaard”, waaraan de andere waarnemer wordt getoetst. Sensitiviteit, specificiteit, positieve voorspellende waarde (PPV) en negatieve voorspellende waarde (NPV) en de “comparability ratio” (CR) worden hierbij nagegaan.113;158-160Wanneer men ontslagdiagnoses vergelijkt met gevalideerde gevallen weerspiegelt de CR het algemeen effect van misclassificatie.113 Kennedy et al.114 geven een belangwekkend voorbeeld van het belang van een juiste codering voor de registratie van een acuut myocardinfarct. Zij vergeleken de resultaten van de ziekenhuisregistratie met die van het cardiologisch surveillanceteam dat volgens strikte richtlijnen werkte (Tabel 7). Indien men dan de ziekenhuisregistratie wil gaan gebruiken als een indirecte indicator voor de incidentie van AMI , wordt het belang van een accurate en volledige gegevensabstractie en codering evident. Op basis van de ziekenhuisregistratie bekomen we een schatter van 110/20.386 of 0,54%, waar deze voor het cardiologische surveillanceteam 71/20.386 of 0,35% bedraagt, m.a.w. ⅓ lager.
43
Hoofdstuk 1: Administratieve gegevensbanken
Tabel 7: Sensitiviteit, specificiteit, PPV, NPV en CR van een ziekenhuis vergeleken met een cardiologisch surveillance team Cardiologisch surveillance team ICD-9: 410
Andere
Totaal
67
43
110
Andere
4
20.272
20.276
Totaal
71
20.315
20.386
Ziekenhuis- ICD-9: 410 registratie
Sensitiviteit: 94% (67/71); Specificiteit = 99% (20.272/20.315); PPV = 61% (67/110); NPV = 99% (20.272/20.276);CR= 65 % (71/110)
Een klassiek voorbeeld is de vergelijking van de resultaten, die behaald worden met een nieuwe test, met de resultaten van een referentie test.159 Dergelijke vergelijking wordt ook toegepast om bvb. de overeenkomst na te gaan tussen de code, zoals hij werd opgeslagen in
de
gegevensbank
en
de
code
zoals
hij
zich
in
het
medisch
dossier
bevond.63;82;94;95;135;138;141;152 Ook in de ambulante praktijk werd een gelijkaardige vergelijking gemaakt tussen drie methoden voor het beoordelen van de bekwaamheid van een arts en de kwaliteit van zijn praktijkvoering: de gestandaardiseerde patiënt (de gouden standaard), dossierabstractie en vignetten ( uitgeschreven ziektegevallen). Waar de vignetten als ongeveer gelijkwaardig kunnen beschouwd worden aan gestandaardiseerde patiënten, gaf de dossierabstractie over de meeste criteria minder goede resultaten.161;162 Waar wij het tot zover hadden over de vergelijking van de overeenkomst op het individuele niveau, gebeurt het vaak dat vergelijkingen gebeuren op geaggregeerd niveau tussen meer dan één gegevensbank. Bij het vergelijken van twee gegevensbanken, waarin gegevens verzameld worden over hetzelfde onderwerp bij ongeveer dezelfde bevolking, wordt voor categorische variabelen beroep gedaan op χ2-analyses, exacte Wilcoxon toetsen, odds ratio's en op de t-test voor continue variabelen.81 Indien men de vergelijking wil corrigeren voor een aantal covariaten, bvb. in een analyse van ziekenhuismortaliteit, kan een multipele logistische regressie gebruikt worden (zie sectie 5.2 Intramurale letaliteit na een acuut myocardinfarct).79;135;163
44
Hoofdstuk 1: Administratieve gegevensbanken
Meer en meer worden administratieve gegevens ook gebruikt voor predictieve doeleinden en doet men beroep op technieken zoals logistische regressie, Cox proportional hazard model, artificiële intelligentie en neurale netwerken.80;163 Het hoeft geen betoog dat voor dergelijke oefeningen de kwaliteit van de administratieve gegevens een vereiste is. Zo werd op basis van administratieve gegevens een gewogen comorbidity-index berekend en nadien ook uitgetest door de door het model voorspelde mortaliteit, bekomen via logistische regressie, te vergelijken met die van de herabstrahering.80 1.1.2.1.4 Accuratesse. Zoals voormeld is abstrahering het proces waarbij aan de hand van het medisch dossier van de patiënt de hoofddiagnose of hoofdingreep bepaald worden en tevens de eventuele nevendiagnosen en –ingrepen. Deze diagnosen en ingrepen worden vervolgens gecodeerd en opgeslagen. Het is evident dat tijdens deze fasen van de gegevensverwerking accuratesse van vitaal belang is. In de literatuur worden verschillende methoden vermeld, die gebruikt worden om de kwaliteit van het abstraheringsproces te onderzoeken. Een eerste manier bestaat in een herabstrahering door één gekwalificeerde abstractor, die gebruikt maakt van expliciete criteria.129 Een volgende is een dubbele herabstrahering door twee gekwalificeerde abstractors (waar de originele abstraheringen verricht werden door een niet gekwalificeerde klerk).1 Nog een andere is een dubbelblinde herabstrahering van het medisch dossier, uitgevoerd door twee onafhankelijke geneesheren uit dezelfde dienst. De gekozen observatieperiode is intentioneel van korte duur, dit om seizoensgebonden en leereffecten van de originele abstrahering zoveel mogelijk te vermijden. Alleen wanneer de twee “nieuwe” abstraheringen van de originele abstrahering verschillen werd de originele als fout bestempeld. Deze werkwijze laat toe het probleem van de gouden standaard te vermijden, die zeer moeilijk te bepalen kan vallen wegens het gebrek aan precisie bij de definitie van de hoofddiagnose60 Soms wordt in één onderzoek zowel de kwaliteit van de abstractie van gegevens uit het medisch dossier onderzocht als de toegekende code. In een dergelijke studie werden de opnieuw geabstraheerde en opnieuw gecodeerde hoofddiagnose of hoofdingreep, de standaard, vergeleken met de geregistreerde diagnoses of ingrepen in alle posities en
Hoofdstuk 1: Administratieve gegevensbanken
45
vervolgens met de hoofddiagnose of ingreep.95 De accuratesse van diagnosecodering varieerde sterk: wanneer alle posities in aanmerking genomen werden, varieerde de sensitiviteit van 0.58 voor perifere vaataandoeningen tot 0.97 voor borstkanker. Een gelijkaardig bereik werd aangetroffen voor de PPV. Voor de ingrepen was de accuratesse substantieel hoger: de sensitiviteit, alle posities, had een range van 0.88 voor hartkatheterisatie tot meer dan 0.95 voor 10 van 15 chirurgische ingrepen. Ook de PPV, voor alleen de hoofdingreep, had een tamelijk breed bereik: van een 0.89 voor hartkatheterisatie tot een 0.99 voor 7 chirurgische ingrepen.95 Bij dit soort oefeningen dient men er rekening mee te houden dat er een duidelijk verschil in precisie van definitie bestaat tussen klinische toestanden, vaak weinig precies of zelfs helemaal onbestaande, en de meer expliciet gedefinieerde codeerregels. Een verbetering van de codeerregels, zonder een verbetering van de omschrijving van de klinische toestand leidt derhalve niet steeds tot een verbetering van de kwaliteit van de gegevens. Zo werden er bijvoorbeeld nieuwe regels voor het coderen van AMI ontwikkeld, maar blijft de epidemiologische interpretatie van toegekende codes onzeker omdat er geen eenduidige klinische criteria vastgesteld en toegepast worden. Dit is veel minder een probleem voor chirurgische ingrepen omdat zij zeer precies gedefinieerd zijn en meer accuraat gecodeerd worden.95 In een gelijkaardige studie werd in een dienst van oncologische chirurgie in een universitair ziekenhuis gepeild naar de overeenkomst tussen de financieringsgegevensbank (“physician billing”), de medical record database en het persoonlijk handgeschreven logboek van de chirurg. Zeven fundamentele variabelen werden hierbij onder de loep genomen: het toevoegen of verwijderen van ziekenhuisopnamen, het identificatienummer van de patiënten, geboortedatum van de patiënt, datum van de ingreep, datum van opname en ontslag, code van de ingreep en code van de diagnose. Voor de beoordeling van de diagnosecode werd een uitgeschreven omschrijving van de code gebruikt en werd er nadien beoordeeld of de gedachte of de eruit voortvloeiende implicatie de gestelde diagnose voldoende benaderde. Bvb. indien er “malignant soft tissue tumor” i.p.v. “soft tissue sarcoma” genoteerd was, werd dit als correct aanvaard.109 De studie concludeert dat er slechts een gebrekkige overeenkomst bestaat tussen de
46
Hoofdstuk 1: Administratieve gegevensbanken
verschillende databases. De auteurs formuleren dan ook de aanbeveling dat, indien mogelijk, de informatie van een gegevensbank dient gevalideerd te worden vooraleer de resultaten van een daarop gebaseerde studie te interpreteren. Bij de audit wordt de accuratesse van onze MKG getoetst. In sectie 4.2 komen we hier uitvoerig op terug. 1.1.2.1.5 Betrouwbaarheid. Hierbij wordt nagegaan in welke mate dezelfde abstractor of codeur het abstraheren of het coderen bij herhaling op dezelfde manier doen.152 Een eenvoudige manier om de betrouwbaarheid van een gegevensbank na te gaan, is de vergelijking van (praktisch) onveranderlijke gegevens zoals geslacht, geboortedatum of sociaal-economische status (tijdens een zelfde kalenderjaar) bij patiënten met herhaalde opnamen.22;60 Uit eigen onderzoek22, uitgevoerd in 2002 in verband met de minimale klinische gegevens (MKG) en de minimale financiële gegevens (MFG), namen we dit voorbeeld over deze registraties m.b.t. 1996. Om de invloed van sociale factoren op de verblijfsduur in de acute ziekenhuizen22 te bestuderen werden de financiële aan de klinische gegevens gekoppeld om aan de patiënten een sociaal-economische status, berekend op basis van de financiële gegevens, toe te kennen (Figuur 2). Als koppelingsvariabelen werden het ziekenhuis- en het patiëntnummer gebruikt, die door dezelfde administratieve diensten voor MKG en MFG geregistreerd worden.
47
Hoofdstuk 1: Administratieve gegevensbanken Figuur 2: Schematische weergave van de koppeling van de MKG- en MFG-bestanden.
MKG
MFG
Verblijven Ziekenhuizen
Verblijven Ziekenhuizen
1.645.151
1.588.664
174 Ô
174
Ó Gekoppeld bestand MKFG Verblijven Ziekenhuizen 1.515.885
159
Wij verwijderden uit het MKG-bestand 67 verblijven van personen met een onbekend geslacht en 33 verblijven niet bruikbaar voor de berekening van een z-score wegens een te klein aantal (< 30) in een bepaalde DRG en leeftijdsgroep. Verder werden ook 105.252 verblijven van de 15 ziekenhuizen, die geen MFG-bestand afleverden, verwijderd en 23.914 verblijven in 108 ziekenhuizen, waarvoor geen koppeling met het MFG-bestand kon gemaakt worden. De oorzaken voor het niet realiseren van de koppeling waren de volgende: registratiefouten met betrekking tot de koppelingsvariabelen (Ziekenhuiscode en Patiëntnummer) of het toeleveren van een bestand waarin alleen mutualiteitpatiënten opgenomen werden. 1.1.2.1.6 Validiteit. Voor een beoordeling van de validiteit van gegevens is het gebruik van expliciete criteria of, minstens, van gestructureerde impliciete criteria vereist.152;164 Om de validiteit van een ziekenhuisgegevensbank op basis van ontslaggegevens na te gaan werd in een studie een gefaseerde methodologie gevolgd: eerst werd de accuratesse nagegaan door een vergelijking van de geregistreerde diagnoses met de ontslagdiagnoses in het medisch dossier. Ontslag diagnoses kunnen op een vage manier opgeschreven worden (bvb. reuma i.p.v. reumatoïde artritis) en gecodeerd (bvb. polyartritis i.p.v. reumatoïde artritis) of
Hoofdstuk 1: Administratieve gegevensbanken
48
gewoon fout ingetikt (“ lack of reliability”). Voor het toetsen van de validiteit werd vervolgens op een steekproef van ontslagdiagnoses met een vermelding van reumatoïde artritis een vergelijking gemaakt met een herabstrahering, uitgevoerd door een getrainde abstractor aan de hand van de criteria voor reumatoïde artritis van de Amerikaanse Vereniging ter bestrijding van gewrichtsreuma (ARA).129 De koppeling van twee ziektespecifieke gegevensbanken met aan elkaar gerelateerde aandoeningen (AIDS en TBC) bleek niet alleen de validiteit maar ook de volledigheid van de registers te verbeteren.135 In België werd het aantal gevallen en het aantal sterfgevallen door een acuut myocardinfarct (AMI) vergeleken tussen het MONICA register (Multinational monitoring of trends and determinants in cardiovascular diseases) en de MKG voor de regio’s Gent en Brugge (zie hoofdstuk 5) en het aantal sterfgevallen door AMI in de regio’s Gent en Charleroi tussen het MONICA register en de overlijdensstatistieken. In deze laatste studie, uitgevoerd in 1997-8 en waaraan we meewerkten, werd een belangrijke onderschatting van de AMI-sterfte aangetoond: slechts 65% der goed gedocumenteerde AMI gevallen werden in de overlijdensstatistieken als ischemische hartaandoeningen teruggevonden.165 Deze studie resulteerde in de publicatie: “De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from the WHO-MONICA Ghent-Charleroi Study in Belgium. J Epidemiol Community Health 1998;52:513-9.” Een andere methode voor het onderzoek van validiteit is de autopsie. Meer speciaal op het gebied van mortaliteit door cardiovasculaire epidemiologie is dit een noodzaak gebleken.9698;166
Laten we hierbij aanstippen dat de rol van de obductie als “Gouden Standaard” niet
perfect is. Zo zal bij een gewone obductie in geval van een zeer snel optredende dood na een acuut hartinfarct, waarvan de letsels op dat ogenblik slechts zichtbaar zijn mits gebruik van speciale technieken, geen myocardinfarct vastgesteld worden en omgekeerd kan obductie tot een fout positieve vaststelling leiden, wegens een eventuele grotere gedrevenheid van de obductor wanneer hij weet dat de overledene leed aan een coronaire aandoening.97 Op het gebied van acuut myocard infarct is men derhalve de mening
49
Hoofdstuk 1: Administratieve gegevensbanken
toegedaan dat er een belangrijk aantal zowel foutpositieve als foutnegatieve gevallen zijn, waarvan de verhoudingen niet constant zijn over de tijd.96;97 Een volgende methode om naar validiteit te peilen bestaat in de vergelijking van gegevens uit twee gegevensbanken waarin (grotendeels) dezelfde patiënten geregistreerd werden maar via een andere gegevensverzameling en met een andere vaststellingsmethode van de gevallen (case ascertainment).79 Voor acuut myocardinfarct werd de interne validiteit van twee gegevensbanken beoordeeld door een globale vergelijking op ziekenhuisniveau en een individuele vergelijking op patiëntenniveau en dit op het gemeenschappelijk patiënteel van beide gegevensbanken. Op ziekenhuisniveau werden basiskarakteristieken, klinische manifestaties en het gebruik van cardiologische ingrepen en uitkomsten vergeleken. Op patiënten niveau werden naast baselinekarakteristieken ook gegevens over behandeling, ziekteverloop, medicatie en ziekenhuismortaliteit vergeleken. De externe validiteit werd onderzocht aan de hand van vergelijkingen tussen patiënten met een bepaald sociaal profiel (Medicare), maar die niet in beide databases opgenomen waren.79 1.1.2.2 Ervaringen en moeilijkheden i.v.m. gegevenskwaliteit en aangereikte oplossingen. 1.1.2.2.1 Validiteit en volledigheid De validiteit van de gegevens en in het bijzonder die van de diagnose, is van fundamenteel belang voor de kwaliteit van administratieve gegevens. Deze bekommernis uitte zich onder meer in de controverse over het al dan niet bestaan van een epidemie van ischemische hartziekten in de twintigste eeuw.67;98;99;166-168 Het gebrek aan eenduidige, aanvaarde definities (zie sectie 1.1.5) heeft het ontstaan van dergelijke controverse zeker in de hand gewerkt
en men kan, meer algemeen, stellen dat totaal ontbrekende of suboptimale
definities een bron van problemen zijn. Een gebrekkige definitie van wat precies de hoofddiagnose is maakt het soms moeilijk de kwaliteit van de gegevens te beoordelen60, kan tot abstractiemoeilijkheden leiden1 en zo de vergelijkbaarheid van gegevensbanken bemoeilijken
163
. Dezelfde aandoening kan op
verschillende wijzen gedefinieerd worden wat bij een onderzoek naar de volledigheid van een register door een vergelijking met een ander register tot moeilijkheden kan leiden.135 Ook in de studie van Every et al. bleek het gebruik van verschillende definities voor
Hoofdstuk 1: Administratieve gegevensbanken
50 eenzelfde
begrip
zoals
een
recurrent
myocardinfarct
de
vergelijking
tussen
gegevensbanken te bemoeilijken.79 Een ander meldenswaardig aspect van deze studie betrof het koppelingsmechanisme. Dit bestond
erin
om
door
middel
van
samengestelde
sleutels,
gebaseerd
op
gemeenschappelijke variabelen, de gegevensbestanden te linken via een iteratief proces waarbij in een dalend aantal sleutelvariabelen en met bij elke iteratie relaxerende vereisten een koppeling bereikt werd.79 Uit de literatuur blijkt ook dat artsen van verschillende disciplines het oneens zijn over de diagnose bij een zelfde patiënt. Osteoarthritis van de heup en benigne prostaathypertrofie zijn hier voorbeelden van.131Verder werd de validiteit bestudeerd in functie van het type personeel, dat verantwoordelijk was voor de ontslagdiagnoses.129 Validiteit van de gegevens is tenslotte ook functie van het type eigenaarschap: publiek of privaat. Dit heeft te maken met het afleggen van verantwoording, het voldoen aan de performance- en rapporteervereisten van de zorgverzekeraars (“purchaser”), en de “reimbursement benefits” van deze organisaties. Dit zijn de directe geldelijke compensaties, ontvangen door een instelling, wanneer zij kan bewijzen dat ze diensten aan een bepaalde cliënt heeft bewezen. In functie van de vereisten van de zorgverzekeraar en van de baten voor de eigen instelling zal de gegevensverzameling met grotere accuratesse verlopen en zal de rapportage gemakkelijker waarheidsgetrouw gebeuren. “ … we found that measurement errors within administrative data systems were not small, random, or uncorrelated errors”.169 Vergelijkingen tussen gegevensbanken zijn een veelgebruikt middel voor validatie van de gegevens. Degelijke vergelijkingen kunnen nochtans bemoeilijkt worden door verschillen in volledigheid136 en/of van definities aangaande de gebruikte termen163. Ook internationale vergelijkingen tussen registers kunnen bemoeilijkt worden door de incomplete dekkingsgraad van de registers maar ook door de samenstelling van de “standaardbevolking”.137
Hoofdstuk 1: Administratieve gegevensbanken
51
1.1.2.2.2 Het abstraheerproces. De kwaliteit van de medische informatie is niet alleen problematisch vanuit een standpunt van validiteit, maar ze is vervolgens de meest kritische factor tijdens het abstraheerproces.1;60 In een review werd opgemerkt dat de hoofddiagnose in de samenvatting van het medisch dossier vaak niet in dezelfde bewoordingen geschreven was als deze op het ontslagformulier, dat nochtans door dezelfde arts was ingevuld.1 Het vermogen van de arts om de medische informatie volgens vaste regels te abstraheren blijft het sleutelelement voor datakwaliteit en dit probleem werd anno 1994 niet opgelost door beslissingsbomen noch door gecomputeriseerde expertsystemen.60 Als aanknopingspunten voor verbetering werden de vorming van de artsen over het invullen en het belang van de formulieren1 en de rigoureuze kwaliteitsbewaking van de gegevens in samenwerking tussen elke participant in het registratiegebeuren 60 vooropgesteld. 1.1.2.2.3 Ontbrekende en foutieve waarden. Ontbrekende en foutieve waarden zijn een meermaals optredend probleem. Vaak gaat het eerder over het niet voorhanden zijn van de informatie dan over een rapportagefout en deze lijken zich eerder voor te doen in de minder belangrijke gegevenscategorieën.138 De proportie ontbrekende records kan verschillen over de diensten en over de maanden van opname. Verder werd vastgesteld dat meer langdurige verblijven gepaard gaan met ontbrekende records.60 Fouten bij de gegevensopslag zijn eerder zeldzaam. In een studie werd een globaal cijfer van 1,5% dergelijke fouten vastgesteld.138 In een andere werden voor de codes 2% data entry fouten gevonden, met in 0,2% der gevallen een weerslag op het toekennen van DRGs.60 Dit type fouten deed zich minder vaak voor in de belangrijkste gegevenscategorieën, waar een cijfer van 0,6% werd vastgesteld.138Het niet terugvinden van het originele medisch dossier bij een vergelijking tussen gegevensbank en medisch dossier lijkt vrij beperkt: in twee studies werden volgende percentages opgegeven: 0,5% en van 0,7 % tot 3,4%.129;141 Codeerfouten zijn een vaak optredend euvel, verschillen in frequentie in functie van het type ziekenhuis, maar hebben slechts een kleine invloed op het toekennen van een DRG.60 Zij treden vaker op bij diagnosen dan bij ingrepen, die dikwijls belangrijk zijn voor de
52
Hoofdstuk 1: Administratieve gegevensbanken
terugbetaling.82;115;141In sectie 1.2.7 presenteren we de resultaten van de audit van de MKG 2003. Studies uit de negentiger jaren in het UK gaven als codeeraccuratesse voor diagnosen 84% aan en 97% voor ingrepen.115 Sommige ingrepen zoals bloedtransfusie worden echter vaak niet gecodeerd.82 Het aantal codeerfouten met betrekking tot diagnosen of ingrepen verhoogt bij toenemend aantal vergeleken digits: er worden meer fouten gemaakt op het niveau van de 4de digit dan op dat van de 3de digit.82;95 Hoewel deze vaststelling enigszins vanzelfsprekend is, kan ze in belangrijke mate een invloed hebben op de eindbeoordeling van een administratieve gegevensbank en geeft ze een eerste indicatie in verband met hun bruikbaarheid op gebied van volksgezondheid en epidemiologie. Zoals reeds gezegd is de codering van diagnosen minder accuraat dan die van de ingrepen, en kan men voor vele klinische aandoeningen van een beperkte accuratesse gewagen, al worden belangrijke medische aandoeningen zoals, heupfractuur, AMI en de meeste kankers correct gecodeerd.95 Verder worden de ernstiger letsels beter geregistreerd dan de relatief minder ernstige 139 en worden middelenverbruikende ingrepen zoals een CABG of een keizersnede met de grootste accuratesse geregistreerd.82;95Het gebruik van een exclusie algoritme kan de bruikbaarheid van administratieve gegevens voor de studie van een bepaalde aandoening verhogen. Zo bleek de PPV van een acuut myocard infarct in administratieve gegevensbanken door het gebruik maken van een exclusie algoritme, waarin onder meer een verblijfsduur van minder dan drie dagen en het ziekenhuis levend verlaten hebben, duidelijk hoger in dergelijke studie dan in andere studies, die niet zo een algoritme hanteerden.112 In de VS werden daarom een aantal richtlijnen gedefinieerd voor het gebruik van de gegevens van administratieve gegevensbanken. Hierin wordt aangeraden eerder te focussen op de codering van ingrepen dan op die van diagnosen. Hieronder wordt ook de techniek begrepen die erin bestaat om het uitvoeren van ingrepen te gebruiken als surrogaat voor bepaalde diagnosen. Verder wordt er aangeraden de interpretatie van de diagnose- of procedurecode te beperken tot de derde digit waar mogelijk, en te erkennen dat de meer objectief gedefinieerde en middelenverbruikende diagnosen en ingrepen meer accuraat gecodeerd worden.82 Het verweven zijn van diagnose en ingreep maakt dat deze
Hoofdstuk 1: Administratieve gegevensbanken
53
benadering niet altijd opgaat. Voor carotis-endarterectomie bijvoorbeeld wordt bij de indicatiestelling de graad van stenose, een diagnostisch begrip, als expliciet richtsnoer gebruikt en is er een hele discussie gaande over hoe die stenose dient gemeten te worden. In het raam van kwaliteitsbewaking is het duidelijk dat een vergelijking van het sterftecijfer naar aanleiding van een carotis-endarterectomie slechts zinvol is indien er ook rekening gehouden wordt met de indicatiestelling.170-175 Voor administratieve gegevensbanken is het cijfer van fout positieven (het registreren van een diagnose of een ingreep die niet aanwezig was of niet uitgevoerd werd) laag waar het cijfer van de fout negatieven (het niet registreren van een gestelde diagnose of een uitgevoerde ingreep) meer variabel is.82 1.1.2.2.4 Relatieve waarde van enkele gegevenstypes bij toegepast wetenschappelijk onderzoek. Het leek wenselijk de relatieve waarde van, bij toegepast wetenschappelijk onderzoek, vaak gebruikte gegevenstypes te omschrijven. Verschillende auteurs61;76;78;176-193 hebben de vóór- en nadelen van de verschillende gegevensbronnen nagegaan vanuit het standpunt van de kwaliteit van de zorgen (Tabellen 8 en 9). Het betreft hier overigens een zeer belangrijk aspect van het gebruik van administratieve gegevensbanken ten behoeve van de volksgezondheid dat verder meer uitvoerig behandeld zal worden 1.1.2.2.5 Codeerregels, registratiebeperkingen en het verlies van belangrijke informatie. Symptomen of tekens kunnen belangrijke uitkomsten zijn, die meestal niet gecodeerd worden tenzij de etiologie ervan onbekend is. Een voorbeeld hiervan is incontinentie bij bejaarden.136 Een mogelijke oplossing voor dergelijke problemen zou erin bestaan dat symptomen en tekens met een impact op de zorgenverstrekking op de ontslagformulieren vermeld zouden worden en vervolgens geregistreerd in de gegevensbank.136 Een speciaal probleem, inherent aan ziekenhuisontslaggegevens, bestaat in de moeilijkheid het onderscheid te kunnen maken tussen bij de opname bestaande aandoeningen (comorbiditeit) en verwikkelingen bij behandelingen. De ICD-9-CM codes en de All Patient Refined Diagnosis Related Groups zijn hiervoor ontoereikend.188;194-196 Dit fenomeen
54
Hoofdstuk 1: Administratieve gegevensbanken
belemmert het gebruik van administratieve gegevensbanken als instrument voor kwaliteitsbewaking: een verwikkeling tijdens een verblijf kan immers niet onderscheiden worden van een bestaande co-morbiditeit bij opname.136;188;196;197Bijvoorbeeld kan een ziekenhuis met een hoge mortaliteit door myocardinfarct na een bypass operatie, wegens de gebrekkige informatie onterecht beschouwd worden een laag, risicogecorrigeerde CABG letaliteitcijfer te hebben, indien verondersteld wordt dat die myocardinfarcten zich voorgedaan hebben vóór de ziekenhuisopname.198 Een voorgestelde oplossing voor dit probleem bestaat erin te noteren of een aandoening aanwezig was bij opname of niet en het registreren van labgegevens bij opname.93;198-200
55
Hoofdstuk 1: Administratieve gegevensbanken Tabel 8: Voor- en nadelen van secundaire gegevens bij het meten van de kwaliteit van zorgen. VOORDEEL
NADEEL
Gemakkelijk te verkrijgen.
Gebrek aan specificiteit en detail
Goedkoop.
Slechts een beperkt aantal uitkomsten kan bestudeerd worden: ziekenhuismortaliteit of mortaliteit binnen een gespecificeerde tijdsspanne, ziekenhuis verwikkelingen en heropnamen.
Mensen kunnen longitudinaal opgevolgd worden.
Studies op ziekenhuispatiënten lijden aan verwijzingvertekening: het is moeilijk op een adequate manier te corrigeren voor het feit dat iemand opgenomen wordt in een bepaald ziekenhuis.
Specifieke zorgverstrekkers kunnen opgevolgd worden.
Zorgen en diagnosen in een setting van ambulante zorgen kunnen een belangrijke invloed hebben op het ziekenhuisgebeuren.
Geen introductie van vertekening door de inclusie van alleen
Laat slechts in geringe mate het opsporen van onbedoelde uitkomsten
maar kwaliteitsvolle centra.
(“adverse events”) en “near misses” toe.
Onderzoekers beïnvloeden de praktijkvoering niet (geen
Verschillen in registratiepraktijken en verandering van praktijken in de
Hawthorne effect).
tijd.
Uniforme registratie over de ziekenhuizen wat toelaat
Beperkte correctie voor case mix en het ontwikkelen van een
ziekenhuizen te vergelijken
scoringssysteem is zeer technisch en complex. Overschatting van het volume-uitkomst verband.
Ook zeldzame ziekten kunnen bestudeerd worden. Minder ethische beperkingen dan andere studies
Hoofdstuk 1: Administratieve gegevensbanken
56
Tabel 9: Voor- en nadelen van primaire medische gegevens bij het meten van de kwaliteit van zorgen VOORDEEL
NADEEL
1) Gegevens uit het medisch dossier Verkrijgbaar.
Kostelijk om te bekomen.
Rijkere details dan administratieve gegevens.
Kunnen te weinig gedetailleerd zijn.
Indien ze gestandaardiseerd zijn en opgeslagen in een
Rekening houden met beroepsgeheim en privé-sfeer
elektronisch medisch dossier, reduceert dit de gegevensverzameling. 2) Prospectief verzamelde klinische gegevens. Het meest specifiek; men kan exact definiëren welke gegevens
Niet gemakkelijk te bekomen.
vereist zijn. Er bestaat een kwaliteitscontrole van de gegevensverzameling.
Kostelijk om te verkrijgen tenzij ze reeds vervat zijn in een elektronisch dossier. Strengere (dan voor administratieve gegevens) eisen op ethisch gebied
3) Enquête gegevens. Men kan verzamelen wat belangrijk is voor de patiënt.
Niet gemakkelijk verkrijgbaar.
Men verzamelt gegevens die anders niet beschikbaar zijn.
Kostelijk om te verzamelen. Een valide instrument is vereist.
57
Hoofdstuk 1: Administratieve gegevensbanken
Hoewel administratieve gegevensbanken proces- en uitkomstgegevens verschaffen, bemoeilijken de onderrapportering van letsels en het niet registreren van belangrijke prognostische variabelen de evaluatie van het ziekenhuisgebeuren in die mate, dat het waarschijnlijk beter is over een “screening” van mogelijke problemen te spreken veeleer dan over een echte evaluatie.77;139 In administratieve gegevensbanken wordt vaak ook geen onderscheid gemaakt tussen een opname van een patiënt met een nieuw letsel en een heropname van een patiënt met een chronisch letsel, wat implicaties heeft voor performance-evaluatie. Indien daarenboven de antecedenten van het letsel niet of onvoldoende geregistreerd worden kan een vergelijking van kosten-baten i.f.v. het type personeel vertekend zijn.81 Daarentegen verstrekken klinische gegevensbanken, gecreëerd op basis van abstraheringen van medische dossiers, gemaakt door artsen in het kader van een extern peer review programma, belangrijke uitkomstevaluaties, maar zijn vaak toegespitst op enkele ziekteaandoeningen wat hun veralgemeend gebruik beperkt.82;201 1.1.2.2.6 Het beheer van, of het opzetten van gegevensbanken en de gegevenskwaliteit. In een Engelse studie werd er gepeild naar de bruikbaarheid van ontslagabstraheringen voor het opzetten van een gegevensbank, die een vergelijking tussen diensten zou toelaten ten behoeve van zowel de clinici als de managers.150 Dit bleek voor de diensten inwendige ziekten en chirurgie niet mogelijk, maar wel voor de dienst verloskunde. Indien er in die dienst problemen werden opgemerkt i.v.m. de registratie, bleken die fouten systematisch te zijn en waren zij rechtstreeks te herleiden tot problemen i.v.m. definities. Een belangwekkende vaststelling was dat in die dienst de geregistreerde gegevens operationeel gebruikt worden door de vroedvrouwen, die ook voor een groot deel verantwoordelijk waren voor de gegevensinvoer. Verder werd de gegevensbank ook gebruikt voor routine audit, voor ad hoc vragen, voor meer gedetailleerde klinische studies en voor het definiëren van contracten met zorgverzekeraars. Het succes van het systeem kan gedeeltelijk toegeschreven worden aan het feit dat de dataset oorspronkelijk ontworpen was voor de behoeften van de dienst. De auteurs stellen deze ervaring tegenover de algemene bevinding dat routine gegevens van
een
onaanvaardbare
kwaliteit
zijn,
een
veelvoorkomend
verschijnsel
bij
Hoofdstuk 1: Administratieve gegevensbanken
58
gecentraliseerde ziekenhuiscomputersystemen. Zij schrijven dit fenomeen toe aan een vicieuze cirkel waarbij van de gegevens geen gebruik gemaakt wordt wegens hun onvolledigheid en onnauwkeurigheid, en dat eens de potentiële gebruikers hun vertrouwen verloren hebben er nog weinig ondernomen wordt om het peil van de registratie te verbeteren.150 Het ontwerpen van protocollen, met een gedefinieerde manier voor het opstellen van een problemenlijst op basis van overeengekomen diagnostische criteria, werd voorgesteld om tot een betere registratie te komen.78 138
bevordert de gegevenskwaliteit
Ook het gebruik van aangepaste formulieren
en gestructureerde rapportering is een leefbaar
alternatief voor gedicteerde vrije tekst, zeker wanneer het alleen gaat over de beschrijving en interpretatie van een technisch onderzoek, waar het superieur is151. Buiten de specifieke bevindingen van de studie van Every et al. op gebied van validiteit, bevatte ze ook implicaties voor het beheer en het opzetten van gegevensbanken. In de gecentraliseerde gestandaardiseerde
gegevensbank
met
abstraheerprocedures
centrale en
diagnosestelling validatie
door
op
basis
van
steekproefsgewijze
herabstrahering was er een twee jaar interval tussen gegevensopslag en feedback. In het meer gedecentraliseerd systeem, met eenvoudiger registratieformulieren en zonder validatie door steekproefsgewijze herabstrahering, werd er een driemaandelijkse feedback gerealiseerd. Deze snelle, continue feedback en het betrokken zijn van de lokale dienstenverstrekkers in het verzamelen en verwerken van de gegevens zijn erkende karakteristieken van kwaliteitsbevorderende activiteiten. Verder was het “gecentraliseerd” systeem beduidend duurder dan het “meer eenvoudige” maar kende het “meer eenvoudige” systeem ook een aantal tekortkomingen: mineure onderregistratie van in aanmerking komende patiënten, een geringe niet-overeenkomst voor CVA en recurrent myocardinfarct. De onderrapportering van deze “sentinel events” kan misschien een probleem vormen voor kwaliteitsverzekering.79 1.1.2.2.7 De algehele doelmatigheid van het registratie-instrument. Naast accuratesse en betrouwbaarheid dient ook met de algehele doelmatigheid van het instrument van de gegevensverzameling rekening gehouden te worden.152 De vooruitgang
Hoofdstuk 1: Administratieve gegevensbanken
59
van de IT-mogelijkheden zoals het automatiseren van de gegevensabstractie kunnen tot hooggestemde verwachtingen leiden over een winst in tijd en uitgaven. Dit bleek echter in een pilootstudie niet te kloppen en leidde tot het besluit dat de methodes van gegevensabstractie dienden verbeterd te worden of dat het aantal te registreren items diende verminderd te worden zodat de gegevensverzameling tijdig zou gebeuren en op een kosteffectieve manier.152 1.2 DOODSOORZAKENSTATISTIEK. KWALITEIT EN VOLLEDIGHEID VAN DE GEGEVENS.
Bij hun invoering hadden overlijdenscertificaten in de eerste plaats wettelijke bedoelingen en met name het verlenen van de toelating tot begraven4;56;64-66 Daarom mag men aannemen dat, op de perinatale periode33;202-204na, praktisch alle sterfgevallen geregistreerd worden en we dus van complete bevolkingsstatistieken kunnen gewagen.56;205 Deze wettelijke bepaling, die een quasi-exhaustiviteit waarborgt, heeft ook een minder begerenswaardig facet: elke arts, die een overlijden vaststelt, is gemachtigd een overlijdensbericht in te vullen en zal dit om begrijpelijke redenen vaak ook doen. De criteria, methodes en bevindingen die we presenteerden in verband met de kwaliteit van administratieve gegevens zijn vanzelfsprekend ook van toepassing op de doodsoorzakenstatistieken. Wij belichten hierna enkele, voor deze statistieken specifieke problemen i.v.m. de gegevenskwaliteit. 1.2.1 Invloed van het genererings- en het verwerkingproces, en van de epidemiologische transitie op de kwaliteit van de gegevens. “Vele werkers in de gezondheidszorg menen dat deze registratie een grote onbetrouwbaarheid combineert met een geringe toegevoegde waarde.”206Gegeven hun finaliteit en hun ontstaanswijze, lijkt enige argwaan aangaande de kwaliteit van de gegevens overigens gewettigd. Het gaat hier immers over gegevens, die niet uit een degelijk opgezette studie voortkomen, maar wel uit de ambtelijke registratie van geboorten en sterfgevallen.4 Vervolgens zijn er verschillende personen en diensten betrokken bij het
60
Hoofdstuk 1: Administratieve gegevensbanken
aanmaken van deze statistieken: de gegevenstoeleveraars, namelijk artsen en gemeentelijke diensten, en de ambtelijke registrators, namelijk encodeurs en codeurs. Toch stelde Friedman in 1980: “Er worden belangrijke problemen en onnauwkeurigheid toegeschreven aan overlijdensberichten. Nochtans vormen zij een wijd toegepaste gegevensverzameling over fatale aandoeningen, die gebruikt kunnen worden om het voorkomen van ziekten te bestuderen op het lokale, nationale en internationale niveau.”207 Een gelijkaardig geluid horen we ook op het einde van de negentiger jaren bij Moolgavkar: “Ondanks de beperkingen van de gegevens en de methodologie, zijn de analyses van incidentie en mortaliteitsgegevens in staat ons bruikbare inzichten te verschaffen in de temporele evolutie van een ziekte in een bevolking. Deze analyses laten ons soms toe kwesties te behandelen die niet gemakkelijk op een andere manier behandeld kunnen worden, voornamelijk wanneer trends zich uitstrekken over periodes die ruim de tijdsspanne van follow-up en case-control studies overschrijden.”208 In de volgende paragrafen trachten we elementen aan te reiken over de waarde van deze gegevens. Hierbij wordt aandacht geschonken aan aspecten van reproduceerbaarheid / precisie en validiteit / vertekening.128;160;207 Vervolgens komen ook kwantitatieve aspecten aan bod. Een diagnose stellen is uiteraard geen eenvoudige taak. Daarenboven veranderen de diagnostische hulpmiddelen en dus de precisie niet alleen over de tijd maar ook volgens de plaats en de situatie: behandelende arts, reanimerende arts of arts die de dood komt vaststellen, ervaren arts of arts in opleiding.4;209 Ook in functie van het type van aandoening worden er verschillen in accuratesse van de overlijdensstatistieken vastgesteld. Ze is groter wanneer het gaat over langdurige, goed gekarakteriseerde aandoeningen dan over relatief plots en niet geobserveerde sterfgevallen.210 Verder kunnen ook verschillen in opleiding van de artsen een rol spelen bij de diagnosestelling211; maken huisartsen minder certificatiefouten dan ziekenhuis artsen212; nemen die fouten toe bij toenemende leeftijd van de overledene, bij toenemende leeftijd van de arts en verminderen zij bij toenemend kwalificatieniveau van het ziekenhuis212; en, zijn de kennis en vorming op het gebied van het invullen van een overlijdensbericht onvoldoende met onder meer een verwarring tussen het principe van ernst en het toe te passen principe van causaliteit.206;212;213 Tenslotte is de
Hoofdstuk 1: Administratieve gegevensbanken
61
kwaliteit van de diagnose ook een functie van de bekendheid van de certificerende arts met de overledene: een reanimerende arts kan een stervende aantreffen op een ogenblik dat het al te laat is om de doodsoorzaak vast te stellen. Naast het hierboven beschreven diagnoseprobleem stellen er zich vaak nog een aantal specifieke certificatieproblemen. De sterfgevallen worden gecertificeerd door een groot aantal artsen, die dit uiteraard op een gedecentraliseerde manier doen wat duidelijk de eenvormigheid van certificeren niet in de hand werkt.32 Ook andere factoren spelen een rol in de variabiliteit tussen de certificerende artsen. Met name het correct weergeven van de causale keten, die leidt tot een overlijden, is niet eenvoudig. Het beginpunt van deze causale keten is de oorspronkelijke doodsoorzaak of “underlying cause of death”, die via één of meerdere intermediaire doodsoorzaken verder verloopt en eindigt met een onmiddellijke doodsoorzaak.27 Nu is de eerste bedoeling van de overlijdensstatistieken preventief: men tracht namelijk het leven te verlengen door te verhinderen dat de oorspronkelijke doodsoorzaak optreedt. Het is dus bij uitstek deze doodsoorzaak die gepubliceerd wordt en vaak is het de enig beschikbare214. De steeds toenemende vergrijzing van de bevolking heeft echter het overlijdenspatroon gewijzigd van een meer eenvoudig, door infectieziekten206;215;216 en maternale sterfte217 gedomineerd beeld, tot een meer complex geheel waarin chronische aandoeningen een steeds meer prominente rol zijn gaan spelen en waarin bij één individu meerdere chronische aandoeningen kunnen aanwezig zijn. Wegens deze epidemiologische transitie is het dan ook veel moeilijker geworden een unieke oorspronkelijke doodsoorzaak aan te duiden.210;215;218 Voor een groot aantal van de sterfgevallen zal deze unieke doodsoorzaak, hoe goed ze ook geselecteerd werd, de aan de dood voorafgaande morbide condities niet langer op adequate manier beschrijven. Vandaar de nood aan een multipele doodsoorzaken statistiek die naast de oorspronkelijke doodsoorzaak ook andere op het certificaat vermelde doodsoorzaken opneemt.
214;215;219-226
Zo rapporteerden we bijvoorbeeld in de doodsoorzakenstatistiek 1994 dat de oorspronkelijke doodsoorzaak van zelfmoord door de certificerende arts soms spontaan verder werd verduidelijkt door een andere doodsoorzaak zoals het aanwezig zijn van een kanker. Deze andere of “secundaire doodsoorzaken” verschaffen bijkomende medische informatie en leveren inzichten in de onderlinge samenhang van doodsoorzaken.33;220-
Hoofdstuk 1: Administratieve gegevensbanken
62 222;227;228
Het registreren van meerdere doodsoorzaken biedt daarenboven de mogelijkheid
om de invloed op de overlijdensstatistieken na te gaan van een verandering in de selectiemethode van de oorspronkelijke doodsoorzaak zoals bij het invoeren van een nieuwe classificatie, bij een verandering van interpretatie van een codeerregel van de Internationale Classificatie van Ziekten of bij het overschakelen op geautomatiseerd coderen.27;214;229 In het perspectief van beleidsvoorbereiding is het begrip van onderlinge samenhang belangrijk - men spreekt dan van “competing risks” - wanneer men tracht na te gaan wat de impact van het elimineren van één bepaalde doodsoorzaak op de totale sterfte is.223;230 Conventioneel worden doodsoorzaken als onafhankelijk van elkaar beschouwd in die zin dat wanneer men een oorzaak van een voortijdig overlijden wegneemt de winst gelijk gesteld wordt aan het aantal levensjaren dat door de geëlimineerde doodsoorzaak zou ontnomen zijn. Nu is het zo dat een mens voortdurend blootgesteld wordt aan verschillende gelijktijdig optredende risico’s zoals kanker of hartziekte en dat deze risico’s met elkaar in competitie treden om als oorspronkelijke doodsoorzaak te fungeren. Verder bestaat er onder concurrerende risico’s een grote verscheidenheid in termen van afhankelijkheid, inclusief totale onafhankelijkheid. Ook kunnen personen die overlijden t.g.v. een aandoening een groter of kleiner risico hebben te sterven aan een concurrerende oorzaak dan deze die weerspiegeld wordt door het overlijdenspatroon van de algemene bevolking.223Nochtans zou onafhankelijkheid van doodsoorzaken geredelijkerwijze aangenomen kunnen worden indien er bij de geanalyseerde doodsoorzaken geen gemeenschappelijke risicofactoren aanwezig zijn.223;230 In het algemeen kan men stellen dat, vermits er goede redenen bestaan om te geloven dat er een onderregistratie bestaat van concurrerende doodsoorzaken, het wijs lijkt de op conventionele manier berekende winsten op gebied van levensverwachting ten gevolge van de uitschakeling van een doodsoorzaak als een overschatting te beschouwen van de werkelijk te verwachten winst.223 Om de vergelijkbaarheid van de overlijdensstatistieken te bevorderen heeft de Wereld Gezondheidsorganisatie (WGO) een aantal initiatieven genomen.
Hoofdstuk 1: Administratieve gegevensbanken
63
Om het eenvormig certificeren te bevorderen stelt ze een formulier ter beschikking voor het certificeren van een overlijden met tevens een aantal begripsomschrijvingen.27 Wegens zijn fundamenteel belang voor de statistiek geven we hier de definitie weer van de oorspronkelijke doodsoorzaak: “De oorspronkelijke doodsoorzaak is (a) de ziekte of de verwonding die de aaneenschakeling van gebeurtenissen, die uiteindelijk tot de dood leidden, teweegbracht, of (b) de omstandigheden van het ongeval of geweld die de fatale verwonding veroorzaakten.”231;232 Het “Internationaal Formulier van Medisch Certificaat van Doodsoorzaak” is onderverdeeld in een deel I, bedoeld voor de weergave van de causale keten waarvan de oorspronkelijke doodsoorzaak de basis vormt, en een deel II waarin ander significante aandoeningen - de zogenaamde bijkomende doodsoorzaken opgenomen kunnen worden, die bijgedragen hebben tot het overlijden zonder nochtans verband te houden met de ziekte, de verwonding of de aandoening die de dood veroorzaakte. Een approximatief tijdsinterval biedt een ruggensteun voor het correct invullen van het certificaat.232Waar België er voordien een eigen(gereid) model op nahield, is het Belgisch certificaat sinds 1998 conform gemaakt aan het WGO-model (Figuur 1).
64
Hoofdstuk 1: Administratieve gegevensbanken
Figuur 1: Het Belgische Certificaat en het WGO-model
Naast certificeringrichtlijnen heeft de WGO ten behoeve van de codering een aantal regels en nota’s uitgevaardigd met als bedoeling de meest bruikbare of informatieve oorspronkelijke doodsoorzaak te identificeren.232 Al zijn een aantal regels en richtlijnen
Hoofdstuk 1: Administratieve gegevensbanken
65
aanvechtbaar – zo wordt bijvoorbeeld wel aangenomen dat HIV een Kaposi-sarcoom maar niet dat Schistosoma Haematobium een uretercarcinoom kan veroorzaken of een hepatitisvirus een levercarcinoom233 - toch menen wij dat door dit geheel van richtlijnen, definities en regels de vergelijkbaarheid van de overlijdensstatistieken over de verschillende landen gemaximaliseerd wordt. Een herziening van de ICD-classificatie, noodzakelijk om de classificatie aan te passen aan het veranderend relatief belang van aandoeningen, de veranderende medische terminologie of het opnemen van nieuwe aandoeningen, brengt een ander type probleem met zich mee, namelijk een artificiële breuk in tijdsreeksen, zeker indien de herziening gepaard gaat met een wijziging in de codeerregels, zoals dit gebeurde bij de overgang van de negende naar de tiende herziening.229 Zoals bij elke herziening werd ook nu het aantal ziektecategorieën gevoelig verhoogd van een 5.000-tal naar een 8.000-tal met bijvoorbeeld een opsplitsing van de unieke code voor acuut myocardinfarct in ICD-9 tot zes codes in ICD-10, die de plaats van het infarct preciseren. Hoofdstukken van de classificatie werden herbenoemd, herschikt of nieuwe hoofdstukken werden aan de classificatie toegevoegd. Zo werd bijvoorbeeld het hoofdstuk gewijd aan het Zenuwstelsel en de Zintuigen opgesplitst in drie hoofdstukken namelijk dat van het zenuwstelsel, dat van het oog en zijn adnexa, en dat van het oor en van de processus mastoideus. Regel 3, die stipuleert dat wanneer een door de algemene regel, of door regels 1 of 2 geselecteerde oorzaak duidelijk het rechtstreeks gevolg is van een andere op het certificaat vermelde oorzaak deze oorzaak dient geselecteerd te worden, werd uitvoerig uitgewerkt met als meest in het oog springend gevolg dat het aantal sterfgevallen ten gevolge van pneumonie of bronchopneumonie gevoelig daalden.229;233 Ook ziekten of symptomen werden herbenoemd en/of geherklasseerd. Zo werden septische shock en respiratoir falen van het hoofdstuk symptomen in ICD-9 overgebracht respectievelijk naar het hoofdstuk infecties en ziekten van ademhalingsstelsel, en verhuisde de groep van myelodysplastische syndromen van het hoofdstuk “Bloed en bloedvormende organen” naar dat van ”Nieuwvormingen”.229
66
Hoofdstuk 1: Administratieve gegevensbanken
Al deze veranderingen maken dat vergelijkingen over de tijd, ook op hoofdstukniveau, niet onmiddellijk uitgevoerd kunnen worden maar het uitwerken vereisen van een vergelijkbaarheidsratio, met als formule Ci = Di,ICD-10/Di,ICD-9.In deze formule staat Ci voor de vergelijkbaarheidratio voor ziekte i, Di,ICD-10 voor het aantal sterfgevallen ten gevolge van ziekte i bij toepassing van de ICD-10classificatie en Di,ICD-9 voor het aantal sterfgevallen ten gevolge van ziekte i bij toepassing van ICD-9. In de Verenigde Staten leidden deze veranderingen voor hartziekten tot een Ci van 0,9858 of een artificiële vermindering van ongeveer 1,5%. Voor kwaadaardige neoplasmata bedroeg de Ci 1,0068 maar bleken er belangrijke verschuivingen te bestaan van pneumonie naar kanker, van kanker naar HIV, en van respiratoire kanker naar andere types van kanker. Voor influenza en pneumonie bedroeg de Ci 0.6982, voor HIV 1,0637, voor virale hepatitis 0,8343, voor verkeersongevallen door motorvoertuigen 0,8527 en voor accidentele val 0,8409. Voor een uitvoerige bespreking van het onderzoek naar de invloed van de ICD-10 herziening op de overlijdensstatistieken van de Verenigde Staten verwijzen we naar het werk van Anderson et al.229;234 Teneinde een grotere eenvormigheid te bereiken op gebied van het coderen – de regelgeving van de WGO laat
immers ruimte voor interpretatie235 - werden in de
Verenigde Staten een aantal softwareprogramma’s ontwikkeld.236;237 Het eerste programma was het Automated Classification of Medical Entities (ACME) en had als bedoeling uit de op het certificaat vermelde doodsoorzaken de oorspronkelijke doodsoorzaak te selecteren aan de hand van een geheel van beslissingstabellen waarin de ICD-9 regels en nota’s verwerkt zijn. Deze beslissingstabellen vormen de kern van het systeem waarop de hele automatisering gebaseerd is. Nadien werden hieraan de Mortality Medical Indexing, Classification, and Retrieval (MICAR) en SuperMICAR systemen toegevoegd, die een verdere automatisering van het coderen mogelijk maakten. SuperMICAR laat het invoeren toe van een totaal vrije, literaire tekst, zoals hij door een arts op het overlijdensbericht wordt ingevuld, en converteert deze literaire tekst tot Entity Reference Numbers (ERN’s), die via MICAR, die
67
Hoofdstuk 1: Administratieve gegevensbanken
de ENRs tot ICD-codes omzet, en vervolgens via ACME gecodeerd worden. Van de certificaten, die niet automatisch verwerkt kunnen worden via MICAR en SuperMICAR, worden de doodsoorzaken manueel tot codes omgezet en vervolgens verder verwerkt via ACME. Ondanks
enkele
mineure
problemen
onder
meer
het
overcoderen
van
het
overlijdensmechanisme zoals verschillende aritmieën, nierfalen, in plaats van een etiologische, specifieke doodsoorzaak.237, zijn deze systemen de facto de internationale standaard geworden voor het automatisch coderen van sterftegegevens.229;237 Noteren we ook dat deze software het voor de Verenigde Staten mogelijk maakte de vergelijkbaarheidstudie uit te voeren voor de overgang van ICD-9 naar ICD-10 aan de hand van de bestaande 1996 sterftegegevensbestanden.229
1.2.2 Internationale studies in verband met kwaliteit van certificatie en codering. Een aantal studies hadden als opzet na te gaan of, en in welke mate, de internationaal verschillende overlijdenspatronen ook werkelijke verschillen waren dan wel artefacten te wijten aan certificatie- en/of coderingspraktijken.211;235;238-242Voor dergelijke studies werd vaak gebruik gemaakt van papieren patiënten. Een medische geschiedenis werd in de deelnemende landen aan een aantal artsen ter certificatie voorgelegd. Deze certificaten werden vervolgens door de nationale centra gecodeerd en door een referentie-eenheid opnieuw gecodeerd.211;238-240 Soms bleef de opzet beperkt tot het vaststellen van eventuele verschillen in codeerpraktijken en werden bestaande certificaten door een referentieeenheid opnieuw gecodeerd.235;241Deze studies toonden aan dat internationale verschillen gedeeltelijk reëel waren, maar dat er toch belangrijke vertekeningen waren wegens uiteenlopende certificatie- en codeerpraktijken en dat de vertekeningen in functie van het bestudeerde onderwerp in belangrijkheid verschilden. In andere studies werden certificaten vergeleken met autopsie rapporten243, met hospitaaldossiers244;245, met registers134;165 en soms werd een specifieke enquête georganiseerd246 waarbij aan de informant gevraagd wordt een aantal vragen te beantwoorden over de
gezondheidsgeschiedenis
van
de
overledene.
Ook
een
vergelijking 247
overlijdensberichten met meerdere andere gegevensbronnen werd uitgevoerd.
van
68
Hoofdstuk 1: Administratieve gegevensbanken
De resultaten van dergelijke vergelijkingen tonen aan dat de juistheid van de gegevens niet feilloos is.247;248 In het algemeen varieert de overeenkomst tussen overlijdenscertificaten en diagnose afkomstig uit andere bronnen (autopsie, hospitaal dossiers) sterk in functie van de beschouwde doodsoorzaak en vermindert bij stijgende leeftijd.36;246 Voor coronaire hartaandoeningen (CHD), een van de belangrijkste doodsoorzaken, bestaat er in de VS een aanzienlijke overschatting249 en in andere landen onder meer België een aanzienlijke onderschatting (meer dan 40%).165;250 In de VS bleken overigens de sensitiviteit en de positieve voorspellende waarde van een beroerte kleiner dan die van CHD, die op haar beurt kleiner was dan die van kankers. De specificiteit en de negatieve predictieve waarde bleken groot te zijn voor deze aandoeningen, waren lager bij vrouwen dan bij mannen en daalden bij toenemende leeftijd. Verder bleek er geen trend te bestaan van deze waarden over drie decades.249 Een moeilijkheid bij CHD bestaat erin dat een aantal sterfgevallen zich buiten het ziekenhuis voordoen en dat die vaak onterecht gecertificeerd worden als CHD.64 Een studie, waarbij het overlijdensbericht vergeleken werd met alle beschikbare medische informatie, leverde een vergelijkbaarheidratio op van 1,44 voor “de out-of-hospital” CHDgevallen en 0,90 voor de “in-hospital” gevallen; verder een PPV van 0,83 vs 0,60, een sensitiviteit van 0,75 versus 0,87 en een fout positieve fractie van 0,08 versus 0,63 voor respectievelijk in-hospital versus out-of-hospital CHD.64Uit een andere, op een gelijkaardige manier opgezette studie bleek dat het gelijkstellen van hartstilstand (ICD-9 code: 427.5) met een “sudden cardiac death” (SCD) een sensitiviteit had van 24% en een specificiteit van 85%.251 Het interpreteren van een hartstilstand als een SCD en vervolgens in afwezigheid van ander belangrijke pathologie als een CHD geeft aanleiding tot een overschatting van de CHDs. Voor colo-rectale kanker als oorspronkelijke doodsoorzaak bleek in de VS de ratio van het aantal kankers bekomen op basis van de doodsoorzakenstatistiek over dit aantal bekomen via experten-review praktisch gelijk aan 1 en dit zowel in 1937 als in 1947, 1970-1, en in 1975-1987. Voor colo-rectale kanker, als bijkomende doodsoorzaak, bleek dit veel minder het geval.252
Hoofdstuk 1: Administratieve gegevensbanken
69
Voor een eerder zeldzame aandoening zoals Amyotrofische Lateraalsclerose (ALS) bleek de overlijdensstatistieken een voldoende betrouwbaar instrument voor epidemiologische doeleinden, al is er ook voor deze aandoening sprake van een verminderende betrouwbaarheid in functie van de leeftijd maar niet in functie van het jaar van overlijden.247 Om het belang van chronisch obstructief longlijden behoorlijk in te schatten bleek het noodzakelijk een analyse op alle doodsoorzaken uit te voeren omdat chronisch obstructief longlijden in aanwezigheid van ischemische hartaandoeningen vaak als bijkomende doodsoorzaak vermeld wordt. Waar chronisch obstructief longlijden op 8,0% van alle overlijdenscertificaten vermeld werd, was het slechts in 59,8% ervan als oorspronkelijke doodsoorzaak vermeld. Verder bleek het onderscheid tussen astma en chronisch obstructief longlijden vaak niet correct gemaakt te worden met een voorkeur van astma voor vrouwen en jongere leeftijdsgroepen; bleken bronchitis en niet nader gespecificeerd chronisch obstructief longlijden meer frequent gebruikt te worden in de oudste leeftijdsgroepen dan de specifieke vormen van chronisch obstructief longlijden.205;209 Een in het Verenigd Koninkrijk toegepaste techniek bestaat erin het overlijdensbestand te linken met ziekenhuisontslag gegevensbestand om de “uitkomst” van levensbedreigende aandoeningen, zoals femurhalsfractuur en beroerte (ICD-9 codes: 431-4,436), na te gaan.176;184;185;253 Dit soort studies werd opgezet naar aanleiding van de vaststelling in autopsiestudies dat een ziekte wel aanwezig kan zijn bij het overlijden, maar niet noodzakelijk op het overlijdensbericht vermeld wordt.185 Zo werden er in functie van het type aandoening grote verschillen vastgesteld in de overeenkomst tussen de hoofddiagnose in het ontslagbericht van het ziekenhuis en het certificaat, bij personen die binnen de vier weken na de ziekenhuisopname overleden.185 Voor verschillende kankertypes, beroerte, ischemische hartaandoeningen, spina bifida, ziekten van de voorhoorncellen en multipele sclerose bleek de hoofddiagnose voor ongeveer 90% van de gevallen terug te vinden op het overlijdenscertificaat.
70
Hoofdstuk 1: Administratieve gegevensbanken
Voor intracraniaal letsel, diabetes, en niet-medicinale intoxicaties was dit tussen de 60 en 70%, en voor femurhalsfractuur, anemie, astma en medicamenteuze en drugsintoxicaties bedroeg dit 40% of minder. Ook de mate waarin deze aandoeningen gecertificeerd waren als oorspronkelijke of bijkomende doodsoorzaak verschilde in functie van het type aandoening.185 Uit een gelijkaardige studie maar nu bij personen, die binnen een tijdsspanne van een jaar na de ziekenhuisopname overleden, bleek dat een femurhalsfractuur vaak niet vermeld wordt op een overlijdensbericht zelfs wanneer het overlijden zich vlug na de fractuur voordeed en dat de Standardised Mortalty Ratio (SMR) voor femurhalsfractuur niet alleen veel hoger is dan in de algemene bevolking van vergelijkbare leeftijdsgroepen maar dat de SMR gedurende verscheidene maanden verhoogd bleef.253 Verder bleek er in de periode 1994-8 over de ziekenhuizen heen geen significante verschillen in ziekenhuissterfte ten gevolge van femurhalsfractuur te bestaan, bestond er een duidelijke sociaal-economische trend en bleek er voor de periode 1968-98 na een aanvankelijke vermindering van de letaliteit sinds het begin van de tachtiger jaren geen verdere vermindering op te treden in de letaliteit van de aandoening. Ook werd een toename van leeftijdsspecifieke incidenties vastgesteld met derhalve een duidelijke implicatie in termen van preventie van osteoporose.176;253 Voor beroerte gingen de bevindingen eerder in de tegenovergestelde richting: het beroerte sterftecijfer daalde over de laatste decennia en letaliteitcijfers bleken goede predictoren te zijn voor ziekenhuisrangen, indien de cijfers berekend werden berekend op basis van de gekoppelde bestanden.184 Naast deze oorzaakspecifieke studies werd voor de periode 1963-1998 ook de chirurgiegerelateerde mortaliteit via deze koppelingsstrategie onderzocht. Dit onderzoek wees uit dat de 30-dagen ziekenhuissterfte voor de periode 1963-74 79,3% van de totale sterfte bedroeg, voor de periode 1975-86 bedroeg haar aandeel 71,2% en voor 1987-98 61,2%. Hieruit leiden de auteurs van de studie af dat ziekenhuissterfte alleen een onvoldoende maat is voor de chirurgie gerelateerde mortaliteit wegens de toegenomen
71
Hoofdstuk 1: Administratieve gegevensbanken transfer
van
kritisch
zieke
patiënten
en
wegens
de
afgenomen
ziekenhuisverblijfsduur.183Dergelijke studies zijn belangrijk bij de interpretatie van interziekenhuis verschillen in letaliteit en verblijfsduur. 1.3 BESLUIT
Om over te gaan van een klassieke vraaggestuurde en ziekenhuisgecentreerde benadering, naar een meer behoeftengestuurd en bevolkingsgericht gezondheidsbeleid is een degelijk gezondheidsinformatiesysteem nodig. Hierin krijgen secundaire gegevensbanken een belangrijke rol toebedeeld, met name het in kaart brengen van de gezondheidsstatus van de bevolking en het mogelijk maken om verantwoording af te leggen over het gebruik van de toegekende middelen en over de kwaliteit en de uitkomsten van de verstrekte zorgen. Vraag is dan in welke mate administratieve gegevensbanken die rol ook kunnen vervullen. Om hierop een antwoord te kunnen geven werd op basis van literatuurgegevens een referentiekader voor het beoordelen van kwaliteit uitgewerkt en werden statistische en epidemiologische onderzoeksmethoden voor het bestuderen van gegevenskwaliteit verkend. Een zorgvuldig design van de registratie met inbegrip van de te gebruiken formulieren of beeldschermen; de selectie van te registreren items (zoals klinische, radiologische en labgegevens, EKG en beeldvorming); eenduidige instructies; het toepassen van internationaal aanvaarde classificatiesystemen en bijbehorende codeerregels; het op systematische wijze verzamelen, verwerken en interpreteren van de gegevens en het monitoren ervan over de tijd zijn basisvereisten voor kwaliteitsverzekering.
73
Hoofdstuk 2: Gebruik van administratieve gegevensbanken in een perspectief van een kwaliteitsvol volksgezondheidsbeleid. Volksgezondheid, epidemiologie en gezondheidsdiensten zijn brede terreinen waarbinnen intensief gebruik gemaakt wordt van administratieve gegevensbanken. Hoewel deze drie domeinen een eigen specificiteit hebben, is het duidelijk dat ze niet los van elkaar staan en dat er overlapping optreedt. Deze concepten werden immers als volgt omschreven9: “Volksgezondheid is één van de inspanningen georganiseerd door de gemeenschap om de gezondheid van de bevolking te beschermen, te bevorderen en te herstellen. Het is een combinatie van wetenschappen, vaardigheden en overtuigingen, die erop gericht is de gezondheid van de ganse bevolking te bewaren en te verbeteren door collectieve of sociale acties. De erbij betrokken programma’s, dienstverlening en instellingen benadrukken de ziektepreventie en de gezondheidsnoden van de bevolking in zijn geheel. De activiteiten op het gebied van volksgezondheid veranderen samen met de veranderende technologie en sociale waarden, maar de doeleinden blijven dezelfde: het verminderen van de ziektelast, van voortijdig overlijden, van door ziekte geïnduceerde ongemakken en van tijdelijke of definitieve beperkingen in de bevolking. Volksgezondheid is dus een sociale institutie, een tak van de wetenschap, en een praktijk”. “Gezondheidsdiensten leveren diensten, die uitgevoerd worden door professionele beoefenaars van de gezondheidszorg, of door anderen onder hun leiding, met de bedoeling de gezondheid te bevorderen, te bewaren of te herstellen. Naast individuele gezondheidszorg, treffen gezondheidsdiensten maatregelen ter bescherming en ter bevordering van de gezondheid, en van ziektepreventie”. “Epidemiologie is de studie van de verspreiding en de determinanten van gezondheidsgerelateerde toestanden of gebeurtenissen in bevolkingen, en de toepassing van deze studie om gezondheidsproblemen onder controle te houden.” Niettegenstaande
hun
conceptuele
overlapping
zijn
volksgezondheid
en
gezondheidsdiensten vaak twee verschillende werelden, zowel in de geest van de betrokken sectoren als van het beleid.15;254 Nochtans bestaat er conceptueel geen verschil tussen de volksgezondheidsindicator van vermijdbare sterfte en het gebruik van
74
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
onbedoelde uitkomsten - “adverse events” in de Engelstalige literatuur – als indicatoren voor gezondheidsdiensten.254 Er bestaan overigens voorbeelden van het gebruikmaken van ziekenhuisgegevens als evaluatie-instrument voor de volksgezondheid.15;77;85-90;92;255 Meer en meer groeit het bewustzijn dat effectieve gezondheidstussenkomsten een op elkaar afstemmen vereisen van het zorgsysteem, dat voornamelijk op individuen gericht is en op het gezond maken van zieken, en het volksgezondheidssysteem, dat op de bevolking gericht is en het verhinderen dat gezonde mensen ziek worden.256 Er bestaan nochtans tal van voorbeelden van potentiële synergie tussen beide werelden, zoals bijvoorbeeld het versterken van gezondheidsbevorderende activiteiten via de massamedia wanneer een gerenommeerd clinicus in die activiteit betrokken wordt.256 Het ontwikkelen van gemeenschappelijke prestatie indicatoren in een context van gezamenlijke verantwoordelijkheid en verantwoording afleggen kan een vertrekpunt zijn voor een integratie van beide benaderingen in een biopsychosociaal interventiemodel.256 Toepassingsvoorbeelden
hiervan
zijn
seksuele
gezondheid
(bvb.
ongewenste
zwangerschappen) en geweld (bvb. kindermisbruik) die zowel bevolkingsgebaseerde (zoals een gezonde, sociale omgeving) als klinische (zoals behandeling, identificeren van risico-individuen) benaderingen vereisen.256 De essentiële, initiële stappen om tot de gewenste integratie te komen bestaan uit (1) een nationaal forum waar experts uit beide werelden elkaar ontmoeten; en, (2) de afbakening van
de
rol
en
verantwoordelijkheid
van
de
verschillende
belanghebbenden
(“stakeholders”). Het verwezenlijken van de eerste stap veronderstelt naast politieke wil, ook technische en politieke vaardigheden. De realisatie van de tweede stap is nog problematischer, want hij veronderstelt het overstijgen van de bestaande breuk tussen twee culturen, tussen organisaties, en verder de definitie van verantwoordelijkheid en het toekennen van de nodige middelen.256 In een recent rapport, waarin in opdracht van de Nederlandse overheid een raamwerk voor het ontwikkelen van prestatie-indicatoren werd ontwikkeld, werd in figuur 1 een synthese voorgesteld van de benadering vanuit de wereld van de volksgezondheid en
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
75
vanuit de wereld van de kwaliteitssystemen. Daarbij worden respectievelijk indicatoren van gezondheid en informatie over de kwaliteit van de geleverde zorg verzameld.72 Figuur 1: Determinanten en indicatoren van gezondheid (volksgezondheidsinformatie) en domeinen van managementinformatie over het zorgsysteem in één raamwerk.
Bron: Delnoij et al.13
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
76
Dit proefschrift beoogt dan ook bij te dragen tot een vervaging van deze kunstmatige scheiding
tussen
volksgezondheid
en
gezondheidsdiensten
om
een
efficiënt
volksgezondheidsbeleid te bevorderen. Het omschrijven van de mogelijkheden die administratieve gegevensbanken bieden i.v.m. de beoordeling van kwaliteit van gezondheidsdiensten lijkt ons een uitgelezen toepassing van dit streven. De beoordeling van dit fundamenteel aspect en de eruit voortvloeiende bijsturing van het gezondheidsbeleid is immers alleen maar mogelijk door het samenbrengen van gegevens uit de verschillende ondersystemen van het gezondheidssysteem (onder meer eerste lijn en ziekenhuizen). Het is tevens een peilen naar de bruikbaarheid van dergelijke gegevensbanken voor het beleid, waarbij ook de complementariteit met alternatieve benaderingen van kwaliteitsbeoordeling aan bod komt.
2.1 KWALITEIT “The quality of care. How can it be assessed? There was a time, not too long ago, when this question could not have been asked. The quality of care was considered to be something of a mystery: real, capable of being perceived and appreciated, but not subject to measurement. The very attempt to define and measure quality seemed, then, to denature and belittle it. Now, we may have moved too far in the opposite direction. Those who have not experienced the intricacies of clinical practice demand measures that are easy, precise, and complete – as if a sack of potatoes was being weighted”.257
“Although adverse events and iatrogenic injury are relatively common among hospitalized patients, identifying substandard care is elusive”. 258 2.1.1 Kwaliteit, prestatie en een beleid gebaseerd op kostenbeheersing. Kwaliteit kan op meerdere manieren gedefinieerd worden, afhankelijk van de plaats waarop men zich binnen het zorgsysteem bevindt en van de natuur en de omvang van zijn verantwoordelijkheid.257 Het Insitute of Medecine (IOM) definieert kwaliteit als volgt:
77
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
“De
mate
waarin
gezondheidsdiensten
voor
individuen
en
bevolkingen
de
waarschijnlijkheid van verlangde gezondheidsuitkomsten verhogen en in overeenstemming zijn met de huidige beroepskennis”. 259 In het conceptueel kader voor het Amerikaanse National Healthcare Quality Report worden twee te meten dimensies vermeld, namelijk kwaliteit van zorg (met aspecten zoals veiligheid, effectiviteit, patiëntgerichtheid en tijdigheid) en consumentenperspectief (met aspecten zoals gezond blijven, beter worden, leven met ziekte of beperkingen, omgaan met sterven) met een voortdurende toetsing aan het principe van billijkheid (“equity”). Efficiëntiemeting is in dit opzet vooralsnog in beperkte mate aanwezig.260 Een gelijkaardig kader voor kwaliteitsverbetering werd ook voor België aanbevolen.261 Het begrip prestatie - performance in de Angelsaksische literatuur - overlapt in grote mate het begrip kwaliteit.72;262 Soms wordt het, zoals in het European Community Health Indicators project van de Europese Commissie, min of meer als een synoniem ervoor gebruikt.72 Prestatie omvat onder meer aspecten van aansprakelijkheid/verantwoording afleggen
(“accountability”),
rendement
(”return”),
maar
ook
kwaliteit
van
gezondheidsdiensten70-72;263;264, hoewel een prestatie-indicator, strikt genomen, niet noodzakelijk inferenties over kwaliteit maakt.263 Delnoij omschrijft prestatie-indicatoren als volgt: ”Dit zijn indicatoren die iets zeggen over het functioneren van het gezondheidssysteem: doet het systeem wat het geacht wordt te doen (mensen beter maken, onnodige sterfte vermijden) en gebeurt dit op een veilige en patiëntvriendelijke manier?”72 Prestatie-indicatoren zijn derhalve meestal gericht op het meten van de mate waarin doelstellingen bereikt werden.72;73 De volgende definitie, die ten behoeve van het U.S. Department of Health and Human Services door een panel experts werd gegeven, illustreert deze zienswijze: “Performance Measure: a quantitative indicator that can be used to track progress toward an objective, i.e., to detect change over time and difference in change across programs”.73 Degelijke informatie is fundamenteel voor het voeren van een gezondheidsbeleid. Prestatie- en kwaliteitsindicatoren vormen hiervan een essentieel onderdeel, zeker voor een “terugtredende” overheid, die de dagdagelijkse verantwoordelijkheid voor de zorgen
78
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
“uitbesteedt” maar wel de “toezichthouder, marktmeester en de borger van publieke belangen”72 blijft. Om tot het concept kwaliteitsvolle volksgezondheid te komen en zo de synthese tussen volksgezondheidsbenadering en kwaliteitssystemen te concretiseren, volgen we hier de overkoepelende kwaliteitsbenadering van Donabedian, waarin zowel technische als interpersonele aspecten (Figuur 1) aan bod komen en kwaliteit in een ruime, maatschappelijke context geplaatst wordt, waarin ook de aspecten opgenomen zijn, die onder performance verstaan worden.257;265 Het voortreffelijk zijn van technische zorgen wordt beoordeeld door de verwachte verbetering van de gezondheidstoestand te vergelijken met de gerealiseerde, rekening houdend met wat de huidige wetenschap en technologie van gezondheidszorg hebben mogelijk gemaakt. Wanneer we “doeltreffendheid” (“effectiveness”) omschrijven als de gerealiseerde fractie van wat mogelijk(“efficacy”) is, dan wordt de kwaliteit van de technische zorg proportioneel tot zijn doeltreffendheid en wordt er een verband gelegd tussen kwaliteit en prestatie.257
Hoofdstuk 2: Gebruik van administratieve gegevensbanken Figuur 1: Kwaliteit in zijn maatschappelijke context.
79
80
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Een volgende stap is het uitzetten van de teweeggebrachte verbetering van de gezondheid tegen de kost waarmee ze gepaard gaat of doelmatigheid (“efficiency”). Hoewel zij niet hoeven te interfereren met een optimale uitkomst zijn onnodige zorg en onnodig kostelijke zorg dermate verbonden met zorgeloosheid en sociale onverantwoordelijkheid dat men het doelmatigheidsaspect bezwaarlijk kan loskoppelen van kwaliteit.265 Ook voor de Wereld Gezondheidsorganisatie heeft doelmatigheid een hoge prioriteitswaarde wanneer ze prestatie omschrijft als het beste resultaat dat kan bereikt worden gegeven de beschikbare middelen.70;72;265 Kost en kwaliteit zijn in mekaar verstrengeld: tot op zekere hoogte zal de winst in gezondheid toenemen bij toenemende uitgaven. Nochtans gaat de toename in kosten onverminderd door waar dit voor de gezondheidswinst niet zo is (wet van het degressief rendement14). Dit leidt tot twee punten op de curve van de nuttige toevoegingen aan zorg: enerzijds een punt van “optimaal” doeltreffende zorg (beste verhouding kwaliteit en kosten), door Donabedian “optimaliteit” (Figuur 2) genoemd, en anderzijds een punt van “maximaal” doeltreffende zorg (best mogelijke kwaliteit maar met proportioneel hogere kosten dan op het optimaliteitspunt, respectievelijk punten B en A in figuur 2.1.2).257;265
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
81
Figuur 2: Definiëren van doelmatigheid en doeltreffendheid bij het beoordelen van kwaliteit
Bron: Donabedian257
Een andere, minder optimistische visie stelt dat de relatie tussen kost en kwaliteit niet monotoon is. Wanneer de investeringen in het gezondheidssysteem zich op een laag niveau bevinden, zullen grotere investeringen waarschijnlijk resulteren in meer gezondheid en betere kwaliteit. Maar op een bepaald ogenblik zullen bijkomende investeringen en veranderingen in financiële stimulansen waarschijnlijk uitmonden in het verstrekken van niet geëigende zorg.266 Heel wat mensen uit de sector van de volksgezondheid zijn overigens de mening toegedaan dat het verhogen van budgetten of enkel het behouden van dezelfde budgetten niet kan zonder een betere verantwoording van het rendement t.o.v. de gedane investeringen in programma’s.73 Donabedian voegt de begrippen aanvaardbaarheid van de behandeling, legitimiteit en billijkheid (“equity”) toe aan potentiële doeltreffendheid (“efficacy”), doeltreffendheid 13
82
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
(“effectiveness”), doelmatigheid en optimaliteit – samen de “zeven pijlers” die de kwaliteit schragen – om tot een overkoepelende visie van kwaliteit te komen.265 Aanvaardbaarheid van de behandeling houdt in dat artsen rekening houden met patiëntenvoorkeuren, met zijn vragen en bekommernissen waaronder de kosten, en hem de doeltreffendheid van de zorg zodanig uitlegt dat de patiënt een geïnformeerde keuze kan maken. Deze speciale focus op de patiënt, de zogenaamde patient-centeredness en ook op het tijdig verstrekken van zorgen krijgen overigens heden ten dage steeds meer aandacht bij de beoordeling van kwaliteit.265;267;268 Legitimiteit betekent dat de zorg aanvaardbaar moet zijn voor de maatschappij. Kwaliteitselementen kunnen elkaar versterken of integendeel met mekaar in conflict komen. De meest storende conflicten ontstaan wanneer maatschappelijke en individuele voorkeuren verschillen. Het is dan de billijkheid, de faire verdeling over de ganse bevolking van zorgen en het nut ervan, die het arbitrageproces dient te leiden.265 Kwaliteit, waarin de begrippen van aanvaardbaarheid voor de individuele patiënten en voor de maatschappij vervat zijn, kan dus niet alleen in technische termen beoordeeld worden door gezondheidszorgprofessionelen.257;265;269 De notie van kwaliteitszorg impliceert dat middelen toegekend worden in functie van medische noden, risico en nut.270 Het interpersonele element is het vehikel waarmee de technische zorg wordt uitgevoerd en waarvan zijn succes afhangt. Respect voor privacy, confidentialiteit, het mogelijk maken van een onderbouwde keuze, bezorgdheid, empathie, eerlijkheid, takt, gevoeligheid zijn kenmerken van een goede interpersonele relatie.257;265 Donabedian vraagt zich af: “Als dit aspect van zorg zo belangrijk is, waarom wordt er dan zo vaak aan voorbij gegaan bij de beoordeling van de kwaliteit van zorgen257?” Vooreerst is dit soort informatie vaak niet beschikbaar, bestaan er vooralsnog weinig goed ontwikkelde criteria en standaarden waaraan de interpersonele relatie kunnen getoetst worden, en zijn ze moeilijk te ontwikkelen omwille van de zeer uiteenlopende verwachtingen en voorkeuren van individuele patiënten.257
83
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Het IOM echter stelt dat kwaliteit kan gemeten worden, dat er een substantieel verschil bestaat tussen de gemiddelde kwaliteit en de beste die bereikt kan worden, en dat dit zowel geldt in de setting van de prestatiegeneeskunde als in het zorgmanagement (“managed care”).266;271;272Met een uitdrukkelijke referentie naar de IOM definitie van kwaliteit en aansluitend bij het kiemkrachtig werk rond belangrijke verschillen in kwaliteit, besprak de nationale rondetafel over kwaliteit van de gezondheidszorg in de US drie manieren waarop kwaliteit van zorgen en diensten in het gedrang kunnen komen: -
overgebruik zoals het toedienen van antibiotica als ze niet effectief zijn,
-
ondergebruik zoals het niet voorschrijven van β-blockers in geval van AMI
-
en, misbruik namelijk de te voorkomen verwikkelingen van behandelingen.271-273
“De convergentie van de bezorgdheid over de kost van medische zorg, het beschikbaar zijn van grote hoeveelheden van klinische uitkomstgegevens in gecomputeriseerde gegevensbestanden, en de opzienbarende vooruitgang in de beoordelingsmethodes van factoren gerelateerd aan uitkomsten hebben een nieuw tijdperk ingeluid van het afleggen van verantwoording door artsen, ziekenhuizen en gezondheidssystemen.”274 Zorgverleners, ziekteverzekeraars, ziekenfondsen, beleidsmakers en patiënten maken meer en meer gebruik van kwaliteits- en prestatie-indicatoren en dit voor kwaliteitsverbetering, voor het nemen van beslissingen en voor beleidsvoering. 13;70;72;77;254;262;269;275 Er wordt sinds een twintigtal jaren in de gezondheidssector van de meeste Westerse landen, waaronder België, een beleid van kostenbeheersing gevoerd.
72;73;266;275-278
266;277
vreest dat dit ten nadele van de kwaliteit van de zorgen zal uitvallen,
Men
kwaliteit die zelf
al verontrustend is271;279. In de VS worden tienduizenden ziekenhuissterfgevallen per jaar toegeschreven aan medische fouten279 en krijgen slechts 54,9% van de patiënten de aanbevolen zorgen.280 Men spreekt over een wijder wordende kloof tussen optimale en verstrekte kwaliteit.271;281Er wordt gesteld dat kwaliteit ongelijk verdeeld is over de bevolking277 en dat er praktisch geen gegevenssets van klinische kwaliteitsmaten in veralgemeend gebruik zijn277.
84
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Tezelfdertijd groeit het besef dat verantwoording dient afgelegd te worden zowel door de gezondheidssector zelf als door de overheid.72;73;266;276;282-284 Waar iedereen het erover eens is dat de kwaliteit van de verstrekte zorgen beoordeeld moet worden, blijft de operationele vertaling ervan, vooral in ambulante setting, een probleem.269;285In deze context is de ontwikkeling van kwaliteitsindicatoren een noodzaak.70;72;262Dit is echter een complexe aangelegenheid en veronderstelt een waaier aan competenties.72;77;181;254;262;263 Het invoeren van performance metingen in openbare diensten had als bedoeling het afleggen van verantwoording te bevorderen. Dit soort metingen zou toelaten outliers te identificeren, gevolgd door een meer diepgaand onderzoek bij minder goed of beter presterende zorgverleners. Hierbij is een afzetten tegen een gemiddelde een belangrijk kenmerk van deze metingen.286 Het opkrikken van de performance van ondermaatse zorgverleners of hun verwijdering uit het systeem, én het identificeren van aspecten die leiden tot beter dan gemiddelde uitkomsten zou leiden tot een algemene verbetering.272;286 Vaak worden gezondheidsuitkomsten zoals niet-gecorrigeerde opnamecijfers voor astma, epilepsie en diabetes gebruikt als prestatie-indicatoren. Dit is een oneigenlijk gebruik van uitkomsten omdat bij prestatiemeting alleen die aspecten van zorg in aanmerking genomen dienen te worden, die hadden kunnen beïnvloed worden door het gezondheidspersoneel, dat beoordeeld wordt, en er hier ook patiëntgebonden factoren een rol spelen.287 Als er vergelijkingen gemaakt worden dient dit immers op een correcte manier te gebeuren en dient de eventuele kritiek geuit te worden aan het adres van hen die ervoor verantwoordelijk zijn. Of dit toepasbaar is op de performance maten die nu gebruikt worden is vooralsnog onzeker.286 “... De suggestie dat een uitkomst van een substantiële publieke investering opgevolgd en beoordeeld dient te worden is niet onredelijk. Een bijkomend argument stelt dat, indien klinische richtlijnen en de audit ervan betekenisvol willen zijn, hun doeltreffendheid ook gemeten dient te worden in termen van de bevolking die ziekenhuizen bedienen. De kwestie is daarom niet “al dan niet” maar wel “hoe?”.286 Deze visie wordt door andere auteurs bijgetreden.269;285
85
Hoofdstuk 2: Gebruik van administratieve gegevensbanken 2.1.2 Beoordeling van kwaliteit: de visie van de consument en van de zorgverlener.
Ondanks het bestaan van een arsenaal kwaliteitsindicatoren weten we onvoldoende wat de waarden en voorkeuren zijn van de consumenten aangaande de kwaliteit van zorgen. Recent onderzoek dat erop gericht was hoe consumenten kwaliteit definiëren leverde een aantal belangrijke bevindingen op. Vooreerst worden gemaksvoorzieningen zoals voeding, parking en netheid als zeer verschillend beschouwd van kwaliteitszorg. Vervolgens dient het begrip van tevredenheid onderscheiden te worden van kwaliteit. Een consument kan tevreden zijn met zorgen, die niet een hoge kwaliteitswaarde hebben en ontevreden zijn met kwaliteitszorg. Tenslotte bleken kwesties zoals met respect behandeld te worden en betrokken te worden in beslissingen over behandelingen, aspecten van gezondheidszorg die niet vaak in satisfactie-enquêtes opgenomen worden, van zeer groot belang voor de patiënten.288 Toch blijven er nog een aantal vragen open over welke informatie betreffende kwaliteit consumenten wensen te beschikken en hoe zij kwaliteit definiëren. Een aantal uitgeteste vragen (valide en betrouwbaar) aan consumenten laten een beoordeling van de zorgkwaliteit toe. Die vragen gaan over zowel proces (ervaringen van de consument gedurende een bepaalde klinische episode) als uitkomst
(gezondheidsgerelateerde
levenskwaliteit [“health-related quality of life” (HRQL)] voor en na een behandeling). Dergelijke, gerichte vragen geven beter de kwaliteit van zorgen weer, zijn beter interpreteerbaar en meer bruikbaar voor actie dan bevraging over satisfactie en excellentie van zorgen. Ondanks de vele dwingende argumenten voor het verzamelen en het onder het publiek verspreiden van informatie over HRQL, bestaan er praktische en theoretische bezwaren om dit te doen. Vooreerst zijn veel van die HRQL uitkomsten niet nauw verbonden met kwaliteit. Dit veronderstelt immers een wel gedefinieerde patiëntengroep (medisch en demografisch) en een welbepaald etiologisch mechanisme, dat de medische tussenkomst relateert met de uitkomst, en verder dienen de uitkomsten specifiek te zijn voor de medische aandoening. Aan deze voorwaarden wordt zelden voldaan. Tenslotte is de noodzakelijke risicocorrectie voor HQRL uitkomsten meestal zeer moeilijk.60;288;289 Meer
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
86
algemeen dient men bij studies, waarbij de gezondheidszorg door consumenten beoordeeld wordt, aandacht te schenken aan de manier waarop correctie voor case mix (voornamelijk de inschatting van de eigen gezondheidstoestand) werd doorgevoerd en hoe er omgegaan werd met het probleem van response vertekening ( hogere opleidingsgraad wordt soms geassocieerd met minder positieve evaluaties).60 Het meten van het “goed zijn” vereist accurate gegevens, die op een gepaste manier gebruikt worden zonder het gezondheidspersoneel te demoraliseren of te demotiveren.269 Vermits er niet zoiets bestaat als de perfecte of juiste maatstaf, kunnen niet-geëigende maatstaven uitmonden in perverse stimulansen en de rechtvaardiging zijn van gegevensmanipulatie of leiden tot demotivatie, disfunctie of crisis. Momenteel wordt de selectie van kwaliteitsmaatstaven vaak eerder gestuurd door wat kan gemeten worden, dan door een definitie van wat goed is gevolgd door een daarvan afgeleide maatstaf.269 Kenmerken van kwaliteitsmaatstaven zijn: het valide, mededeelbaar, doeltreffend, betrouwbaar,
objectief,
beschikbaar,
contextueel,
toeschrijfbaar,
interpreteerbaar,
vergelijkbaar, remedieerbaar, aanvaardbaar en herhaalbaar zijn.263;269 Bij de keuze van een maatstaf moet de bedoeling duidelijk zijn, de alternatieven besproken worden en de beperkingen openlijk erkend worden. Verder moet het duidelijk zijn dat de bedoeling verbetering is, niet veroordeling. Tenslotte is geduide feedback belangrijk. Hij moet gedragen worden door leiderschap en dient over de nodige middelen te beschikken.269 Laten we eraan herinneren dat naast de toetsing aan professionele maatstaven kwaliteit eveneens functie is van de appreciatie van gezondheidszorgen door de patiënten en door het publiek.257;265;269 Nu berust de keuze van een wel bepaalde zorgverlener - de uitdrukking van hoe de patiënt de graad van “goed zijn” bepaalt - niet alleen op vergelijkingen van de zorguitkomst, maar ook van wachttijden en van de vroegere individuele ervaringen.269
87
Hoofdstuk 2: Gebruik van administratieve gegevensbanken 2.1.3 Beoordeling van kwaliteit en administratieve gegevens.
Na het omschrijven van een algemeen kader voor het voeren van een kwaliteitsvol volksgezondheidsbeleid, met de ruime betekenis van het concept kwaliteit zoals Donabedian het formuleerde, verkennen we vervolgens de mogelijkheden, die administratieve
gegevensbanken
bieden,
om
de
onderdelen
zorgen-
en
consumentenperspectief en de eraan grenzende onderdelen van de volksgezondheid- en managementinformatie gestalte te geven en hun verwevenheid aan te tonen. Het is vanzelfsprekend dat administratieve gegevens onmogelijk over alle aspecten van kwaliteit informatie kunnen verschaffen. Ziekenhuisontslaggegevens bevatten immers slechts diagnostische en therapeutische informatie, die uit het medisch dossier werden geabstraheerd. De diagnostische informatie is in België beperkt tot diagnoses, waarvoor er meestal geen dwingende definitie bestaat, en bevat geen informatie over de resultaten van laboratorium en andere technische onderzoeken. Hierbij dient opgemerkt dat het aantal registreerbare diagnoses en ingrepen in ons land onbeperkt is, met derhalve de mogelijkheid om co-morbiditeit en (iatrogene) verwikkelingen te vermelden.
Administratieve gegevens kunnen behulpzaam zijn om problemen in verband met klinische performance te signaleren, kwaliteitsverbeterende activiteiten te onderbouwen, het nadenken over de klinische praktijk uit te lokken, en belangrijke problemen te identificeren ten behoeve van verder onderzoek.290Ook is het gebruik van dit soort gegevens aantrekkelijk: de gegevens zijn gemakkelijk beschikbaar en stellen minder ethische problemen dan het plannen, werven van fondsen en uitvoeren van langdurige experimentele studies.180;182 De keerzijde van de medaille is echter niet onbeduidend en wanneer men onderzoek wenst te doen met dit soort gegevens dient men rekening te houden
met
de
beperkingen
eigen
aan
administratieve
gegevens.182Onderzoek
veronderstelt immers (1) een precieze omschrijving van welke patiënten in de studie worden opgenomen of niet, (2) een adequate risicocorrectie, (3) een correcte weergave van de werkelijkheid door de geregistreerde behandelingen of zorgprocessen, en (4) een
88
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
correcte weergave van de uitkomst met inbegrip van eventuele verwikkelingen.182 Onderzoek vergt derhalve een toetsing van al deze veronderstellingen. Een eerste reeks tekortkomingen heeft te maken met de validiteit, accuratesse, volledigheid en betrouwbaarheid van de gegevens180;182 en gaat over opzettelijk fout coderen, het niet bij machte zijn gevallen van ondermaatse zorg op te pikken177, slechts het intramuraal facet van de sterfte te bevatten176;182-185, het veranderen van codeerpraktijken in de tijd180 (zie ook 1.1.2 en 4.2), en conflicterende bevindingen met bijvoorbeeld een gering verband tussen onbedoelde uitkomsten (“adverse events”) en sterfte180. In vergelijking met ingreepgegevens zijn vooral diagnoses problematisch.82;182 Dit onderscheid is misschien overschat omdat de reden waarvoor een ingreep verricht wordt op de diagnose berust en dat ze belangrijk is zowel bij de evaluatie van processen als van uitkomsten. Verder zijn administratieve gegevens gekenmerkt door een lage sensitiviteit en een niet-adequate betrouwbaarheid.290 Een tweede reeks tekortkomingen gaat over de gebrekkige risicocorrectie en andere belanrijke factoren178;180 De verschillende, bestaande manieren om de ziekte-ernst te bepalen kunnen tot verschillende resultaten leiden188;196Geen risicocorrectie uitvoeren is overigens geen optie.192 Het verband tussen volume en kwaliteit wordt in observationele studies op basis van administratieve gegevens soms overschat.193De beschikbaarheid van diensten is een andere vertekenende, contextuele factor.287Verder heeft een aantal beperkingen te maken met de ICD-9-CM codering.290;291 Het gaat hierbij vooral over het beperkte aantal standaard en E-codes om medische fouten te identificeren, het ontbreken van precieze klinische definities, aan PPS gerelateerde discoding en, zoals voormeld, het moeilijk onderscheid tussen bestaande co-morbiditeit en in het ziekenhuis verworven verwikkelingen, wanneer niet aangegeven is welk pathologieën aanwezig waren bij opname of niet.93;180;186;187;189;196;198;200;290;292 In tegenstelling met gegevensbanken van ziekenfondsen, die “levenslange” informatie heeft over haar leden, heeft de MKG alleen longitudinale informatie over zieken, die in een bepaald ziekenhuis gedurende een bepaald jaar werden opgenomen.182
89
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Het is de bedoeling van dit proefschrift te onderzoeken of, ondanks deze tekortkomingen, administratieve gegevens bruikbaar zijn voor kwaliteitsscreening. Dit onderzoek lijkt ons aangewezen omdat administratieve gegevens het enige middel is dat ter beschikking staat van de overheid om haar verantwoordelijkheid als borger van de publieke belangen op te nemen. We
zullen
hierbij
twee
benaderingen
volgen:
een
eerste,
gebaseerd
op
kwaliteitsindicatoren, en een tweede, gebaseerd op een analyse van onbedoelde uitkomsten293 (“adverse events”). Kwaliteitsindicatoren gaan uit van structuur, proces en uitkomst van de gezondheidszorg - de triade van Donabedian - met aandacht voor overgebuik (“overuse”), ondergebruik (“underuse”) en een foutief gebruik (“misuse”) van een zorg. Zij gaan over specifieke aandoeningen en ingrepen en worden uitgedrukt onder vorm van een cijfer (“rate”). De benadering via onbedoelde uitkomsten vertrekt van een foutief gebruik van zorg, van een ongustig voorval of een incident, is generisch van natuur en wordt op individueel of geaggregeerd niveau behandeld. 2.2 BENADERING GEBASEERD OP KWALITEITSINDICATOREN.
2.2.1 Types en gebruik van kwaliteitsindicatoren. 2.2.1.1 Domeinen waarbinnen kwaliteitsindicatoren gebruikt worden. Kwaliteitsindicatoren worden in drie domeinen toegepast: structuur, proces en uitkomst.72;77;257;261;276;294;295 Structuur wordt door de American Medical Association (AMA) omschreven als “ ... voorzieningen, uitrusting, diensten , en de mankracht beschikbaar voor zorg, benevens de credentialen
en
gezondheidszorg”.
kwalificaties 276
van
de
professionele
beoefenaars
van
de
Zij verwoordt proces als “ ... de inhoud van de zorg, d.w.z. hoe de
patiënt zich beweegt in, doorheen, en uit het gezondheidszorgsysteem en de diensten die verstrekt werden tijdens de zorgepisode”.276
90
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Uitkomst wordt geformuleerd als “... de resultaten van de zorg, en omvat onder meer biologische veranderingen in ziekte, komfort, het vermogen tot zelfzorg, fysiek functioneren en mobiliteit, emotionele en intellectuele prestaties, patiëntensatisfactie en de perceptie van de eigen gezondheid, gezondheidskennis en therapietrouw, en leefbaarheid van de familie, baan, en het sociaal functioneren”.276 Uitkomsten zijn derhalve multidimensioneel, vaak kwalitatief en wisselend over subgroepen.296 De veronderstelde schakel tussen deze domeinen en kwaliteit bestaat erin dat goede structuren, waarschijnlijk goede zorg bevorderen en dat dit waarschijnlijk tot betere uitkomsten leidt.
Het is noodzakelijk dat deze relatie ook werkelijk aangetoond
wordt257;276;294 vooraleer enige afzonderlijke component van een structuur, proces of uitkomst kan gebruikt worden voor het beoordelen van kwaliteit257. Indien criteria op gebied van zorgenkwaliteit, gebaseerd op structuur- of procesgegevens, geloofwaardig willen overkomen, dan moet aangetoond kunnen worden dat verschillen in de kenmerken, die zij meten, leiden tot verschillen in uitkomst. Voor uitkomst criteria zal er aangetoond moeten worden dat veranderingen in zorgprocessen ook leiden tot veranderingen in uitkomsten.297 Over structuren weten we relatief weinig en structuren zijn vooralsnog een eerder stomp instrument voor kwaliteitsbewaking. Ook de beoordeling van interpersonele relaties bevindt zich nog in de kinderschoenen. De relatie tussen technische zorg en uitkomst is op sommige gebieden vaststaand, op andere helemaal niet, en hetzelfde type beperkingen geldt ook voor procesbeoordelingen. Het kan daarbij niet sterk genoeg benadrukt worden dat ons vermogen om kwaliteit te beoordelen gebonden is aan de sterkten en zwakten van de klinische wetenschap. Dit geldt zeker wanneer men uitkomsten bestudeert, gegeven de veelvuldigheid van factoren die een uitkomst beïnvloeden. Bevestiging is nodig door beoordeling van het proces zelf.257 Wat ook de sterkte en beperkingen zijn van patiëntensatisfactie, er dient terdege rekening mee gehouden te worden.257;276;288;294Zij kan gezien worden als een uitdrukking van (1) de
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
91
interpersonele relatie, (2) de kwaliteit van specifieke componenten van technische zorg en de uitkomst. Hierbij dienen ook gedragingen gerekend te worden, die onrechtstreeks ontevredenheid suggereren zoals gebrekkige therapietrouw, voortijdig stopzetten van behandeling, veranderen van arts of van gezondheidsplan of hulp zoeken buiten het zorgsysteem.257;276 2.2.1.2 Processen of uitkomsten? Er bestaat nog steeds onenigheid of proces- dan wel uitkomstmetingen een betere weergave van kwaliteit van zorgen zijn.288 Hoewel de uiteindelijke beoordeling van de kwaliteit van gezondheidszorg gebeurt aan de hand van patiëntenuitkomsten, waarin patiënten en zorgverzekeraars bij uitstek geïnteresseerd zijn, zijn er een aantal voordelen verbonden om procesmetingen te gebruiken voor de evaluatie van zorgkwaliteit boven uitkomsten.257;273;277 Mortaliteit, de meest gebruikte uitkomstindicator levert immers minder aanknopingspunten voor kwaliteitsverbetering258 dan procesindicatoren, waarvoor artsen veel gemakkelijker hun verantwoordelijkheid aanvaarden en die bruikbaarder zijn in veel voorkomende chronische aandoeningen dan uitkomsten, die zich vaak jaren later voordoen, zoals hypertensie en een beroerte.273;298Verder zijn in de praktijk procesgegevens in het medisch dossier aanwezig, als het ware op het ogenblik dat ze zich voordoen zodat onmiddellijke actie kan ondernomen worden en bestaat er een grotere consensus over geëigende processen en over streefcijfers (ongeveer 100%).257;294
Ook vereist het meten van
zorgprocessen vaak geen risicocorrectie, die zo vaak omstreden is bij vergelijkingen van uitkomsten. Tenslotte is het gemakkelijker kritische zorgprocessen die niet uitgevoerd werden te identificeren, onder meer door ze te vergelijken met bestaande richtlijnen, en te corrigeren dan te bepalen waarom uitkomsten niet optimaal zijn.263;277;280 Uitkomsten hebben dan het voordeel dat ze alle bijdragen tot zorg weerspiegelen met inbegrip van de bijdrage van de patiënt.257;294 Maar het kan meerdere jaren duren voor een aantal belangrijke uitkomsten zich manifesteren, en, vermits significante en
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
92
verwezenlijkbare verbeteringen in uitkomsten meestal veel kleiner zijn in relatieve termen dan verbeteringen in processen, zijn er onrealistische grote steekproeven nodig voor het meten van significante verbeteringen in uitkomsten. In tegenstelling hiermee is de steekproefgrootte
voor
processen
veel
realistischer
en
zijn
ze
gemakkelijker
interpreteerbaar.277 Daarenboven dient men er bij uitkomstmetingen, hoe goed de correctie voor ziekte-ernst ook was, rekening mee te houden dat er steeds plausibele verklaringen kunnen gegeven worden, die niets van doen hebben met kwaliteit, en dat, in geval van werkelijke verschillen in sterfte, er steeds onderzocht dient te worden waaraan ze te wijten zijn.178 Verder kan de keuze tussen uitkomst en procesmaten bepaald worden aan de hand van een aantal operationele elementen zoals het verkiezen van een procesindicator, indien de beschikbare tijd kort is.299 Ook voor- en nadelen in termen van middelen spelen een rol bij de keuze: men kan een uitkomstmaat verkiezen omdat die minder vaak moet aangepast worden dan een procesmaat.300 Tenslotte zijn validiteit en gebruiksvriendelijkheid factoren waarmee bij de keuze van het type indicator rekening gehouden wordt.300 Zo zijn procesindicatoren vaak onbegrijpelijk voor de leek, maar zijn overleving en levenskwaliteit zeer vatbare begrippen.294;300 Ook de overheid, die verantwoordelijk is voor het borgen van de publieke belangen en met name het garanderen van kwaliteitsvolle en betaalbare zorgen, hecht groot belang aan resultaatindicatoren.70;72;262;301 In het algemeen is het best in een beoordelingssysteem elementen van structuur, proces en uitkomst op te nemen.257;294 Dit laat de aanvulling toe van de zwakte van één benadering door de sterkte van een andere, het helpt de bevindingen te interpreteren en, indien die bevindingen zinloos lijken, kan dit leiden tot een herbeoordeling van de studieopzet en een in vraag stellen van de accuratesse van de gegevens.257 Tenslotte kan men stellen dat de meest doeltreffende manier van kwaliteitsverbetering erin bestaat processen en zorgstructuren te identificeren, die de grootste impact hebben op patiëntenuitkomsten en daaraan middelen toe te kennen.294 Nochtans bestaan er grenzen aan deze op uitkomsten gebaseerde benadering van kwaliteitsverbetering. Sterfte, de meest gebruikte uitkomstmaat, is gewoonlijk een
93
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
zeldzaam voorval wat resulteert in onvoldoend statistisch vermogen of, in tegendeel, is voor ziekten zoals longkanker een verwachte uitkomst. Verder is risicocorrectie een belangrijk aspect bij de interpretatie van een op sterfte gebaseerde indicator. Niet-fatale uitkomsten zijn veel moeilijker te meten en uitkomsten doen zich vaak slechts geruime tijd na een zorgepisode voor, wat een terugkoppeling naar kwaliteitsverbetering inefficiënt maakt. Tenslotte is er een toenemende deelname in de besluitvorming vanwege de patiënten. Ondanks haar beperkingen bestaat er een sterke, heroplevende belangstelling voor dit type van indicatoren: men erkent dat het gebruik van structuur- of procesvariabelen alleen niet valide kunnen zijn en dat uitkomstmaten meer valide zijn omdat ze direct gericht zijn op gezondheidsstatus.294
2.2.1.3 Verband tussen structuur of proces en uitkomst. Structuur beschrijft het kader waarin zorg verstrekt wordt en het vermogen van de setting om kwaliteit te produceren.72;77;257;276Slechts een beperkt aantal verbanden tussen structuur en uitkomst werden bestudeerd: het patiënten- en ingrepenvolume van ziekenhuizen, het feit een academisch ziekenhuis te zijn of niet, de erkende kwalificatie van de artsen, het percentage geregistreerde verpleegkundigen, het percentage van de artsenpraktijk binnen het ziekenhuis en de deelname van de zorgverleners in de besluitvorming van het ziekenhuis.15;77;294;297;302-309 Voor vele van deze structuurgebonden variabelen werden tegenstrijdige resultaten i.v.m. patiëntenuitkomst geobserveerd en voor anderen bleek de omzetting ervan in beleid- of praktijkverandering moeilijk, indien niet onmogelijk.294 Overigens is van deze structuurelementen
eigenlijk
alleen
het
volume
een
goed
vehikel
voor
77;104
kwaliteitsverbetering, vermits de andere niet gemakkelijk te veranderen zijn.
De volume-uitkomst verbanden schijnen een surrogaat marker te zijn voor een aantal met structuur en proces verbonden variabelen, die beter rechtstreeks gemeten zouden worden.294 Toch worden volume-indicatoren ook nu nog gebruikt en tonen studies met een hoge graad van risicocorrectie het verband tussen volume en uitkomst aan en dit op
94
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
ziekenhuisniveau.218;310;311 In een review over het verband tussen volume en kwaliteit geven Halm et al.312 de volume-uitkomst weer in een conceptueel raamwerk (Figuur 1). Figuur 1: Conceptueel raamwerk: Hoe zou volume kwaliteit kunnen beïnvloeden?
Bron: Halm et al. 312
Bij dit kader formuleren de auteurs volgende bedenkingen. Patiëntenselectie gebeurt op verschillende manieren. Soms hebben patiënten weinig tijd of keuze (bvb. patiënten met een geruptureerd aorta abdominalis aneurysma) maar in minder dringende situaties en zeker voor electieve chirurgie is het omgekeerde waar. We weten ook weinig over het verband tussen patiëntenselectie en -volume. Is het aannemelijk dat patiënten in grootvolume ziekenhuizen meer of minder aangewezen kandidaten zijn voor chirurgie dan patiënten in kleinvolume ziekenhuizen? Een enkele studie toont aan dat grootvolume chirurgen meer geneigd waren een niet-aangewezen carotisendarterectomie uit te voeren dan kleinvolume chirurgen.312 Bij vergelijkingen tussen ziekenhuizen is een terdege risicocorrectie (ziekte-ernst en comorbiditeit) een fundamentele vereiste, zeker als grootvolume chirurgen de ziekere of minder zieke patiënten behandelen. Zoniet zouden zij tot niet-valide besluiten leiden. Volumes kunnen niet rechtstreeks betere resultaten teweeg brengen, maar wel via verschillen in de zorgcomponenten: vaardigheden van de arts en andere zorgverleners of organisatorische vaardigheden.312
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
95
Er werden een aantal significante verbanden gelegd tussen processen en uitkomst wanneer de patiënt als eenheid van analyse genomen werd. Dit was bijvoorbeeld het geval voor hartfalen, acuut hartinfarct en pneumonie.294 Maar de meeste pogingen om zulk een verband te leggen met het ziekenhuis als eenheid van analyse, waren niet overtuigend omwille van beperkingen van de studieopzet, nietadequate risicocorrectie, of het gebruik van ondertussen achterhaalde procescriteria.294 2.2.1.4 Risicocorrectie en maten van ziekte-ernst (“severity of illness”). 2.2.1.4.1 Waarom dient men voor risico te corrigeren? Ziekenhuissterfte is een veel gebruikte kwaliteitsindicator waarmee ziekenhuizen of artsen vergeleken worden.69;313 Dergelijke vergelijkingen dienen voorzichtig doorgevoerd te worden want ook nu nog is het zo dat verschillen in sterfte naast verschillen in kwaliteit van zorgen ook te wijten kunnen zijn aan verschillen in case mix76;101;302;314-316, leeftijd en/of geslacht101;314;317. Verschillen in volledigheid, betrouwbaarheid en validiteit van de gegevens (onder meer in codeerpraktijken)101;191;275;282;318;318-322, en in nomenclatuur of definities van diagnoses en ingrepen163;318spelen hierbij eveneens een rol. Verder beïnvloeden verschillen in ziekte-ernst en co-morbiditeit,74;105;313;314;317;319;323-326 en het in rekening nemen of niet van de co-morbiditeit geregistreerd tijdens (een) vorige opname(s)327de uitkomst. Ook kunnen verschillen in uitkomst te wijten zijn aan onvoldoende risicocorrectie101-105;328, aan het feit of een ingreep gepland was of niet314;317, en aan patiëntenselectie312;319. Tenslotte kunnen het ontbreken van het tijdsinterval tussen diagnose en overlijden302;317 en de beperkingen van de gebruikte risicomaten, die voornamelijk op de eerste drie dagen van de opname gericht zijn319artificiële verschillen in ziekenhuisletaliteit veroorzaken. Uit een review over het volume-uitkomst verband bij CABG stelden Sowden et al. vast dat, naarmate men bij dit type studies sterfte beter gaat corrigeren, de “klaarblijkelijke” winst van grootvolume t.o.v. kleinvolume ziekenhuizen verdwijnt.192 Dergelijke “shrinkage” van volume-uitkomst verbanden en/of van een betere risicocorrectie werd overigens door meerdere auteurs vermeld en wijst op haar belang.74;101;102;105;192;320;329-331
96
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Uitkomsten van behandelingen, waaronder sterfte, kunnen uitgedrukt worden als de som van de doeltreffendheid van de behandeling plus risicofactoren, die het antwoord op de behandeling beïnvloeden, plus kwaliteit van de zorg plus toeval.188 Vermits de doeltreffendheid van een behandeling gekend is en de toevalsfactor door statistische methodologie kan ondervangen worden, is het mogelijk de kwaliteit van de verstrekte zorgen te beoordelen op voorwaarde dat men corrigeert voor de risicofactoren.178;188 Nu beïnvloeden verscheidene patiëntenkenmerken het risico, waaronder leeftijd, geslacht, acute fysiologische stabiliteit, hoofddiagnose en haar ernst, co-morbiditeit, functionele status, psychosociale en culturele factoren, sociaaleconomische karakteristieken. Het meten van sommige kenmerken is echter niet eenvoudig en kan duur zijn. Verder kunnen patiënten en artsen een totaal andere mening hebben over het functioneren van de patiënt. Met wiens zienswijze moet men dan rekening houden? Ook is het mogelijk dat niet-verzekerde patiënten minder kwaliteitsvolle ziekenhuiszorgen krijgen dan andere. Correctie voor type betaler kan deze belangrijke verschillen verdoezelen.188 “Gecorrigeerde” uitkomstcijfers zijn aantrekkelijk 1) voor clinici, die ze zouden kunnen gebruiken voor audits, 2) voor verzekeraars, ziekenhuisverantwoordelijken en huisartsen, die ze zouden kunnen gebruiken voor het opstellen van zinvolle en meetbare standaarden en om hun patiënten/cliënten te informeren over hun keuze van zorgverlener, en 3) voor de patiënten, die hierop hun keuze van een zorgverlener kunnen baseren.178 Er werd echter te weinig aandacht besteed aan het vermogen van uitkomstmaten om werkelijke verschillen in performance aan te tonen.178 Zo werden twee ziekenhuizen vergeleken, elk met een verzorgingsgebied van ongeveer 300.000 inwoners en een gelijkaardige demografische samenstelling (leeftijd, sociale klas, etnische mix). Voor beide ziekenhuizen waren
sterftegegevens over drie jaar beschikbaar, die perfect
gecorrigeerd waren voor ernst en waarbij eenzelfde methode gebruikt werd voor het definiëren en het vaststellen van gevallen. Ondanks haar omvang bleek de studie onvoldoende gevoelig om sterfte door hartinfarct te gebruiken als een maat voor kwaliteit.178 Daartegenover staat dat relatief korte audits over het zorgproces in staat zijn relevante verschillen tussen ziekenhuizen vast te stellen.178
97
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Wenst men met factoren zoals leeftijd, geslacht, co-morbiditeit en ziekte-ernst rekening te houden dan doet men hiervoor in principe beroep op statistische technieken zoals onder meer stratificatie, multipele lineaire of logistische regressiemethoden, en hiërarchische modellen. Nochtans maakt geen enkele van de gangbare risicocorrigerende systemen gebruik van deze technieken.77 Al is iedereen het er over eens dat een of andere vorm van risicocorrectie noodzakelijk is, toch bestaat er onenigheid over welke risicofactoren en hoe ze te meten.163;188 Orchard formuleert het als volgt: “Bruto ziekenhuiscijfers kunnen gevaarlijk misleidend zijn en dienen voor case mix gecorrigeerd te worden, maar het identificeren van en wegen voor prognostisch belangrijke patiëntenkarakteristieken is problematisch omwille van conceptuele, methodologische en praktische redenen.”316
Hoewel onderzoekers
gedetailleerde risicocorrectoren hebben ontworpen, bleken deze methoden vaak te duur om op brede schaal te worden toegepast voor ziekenhuisrapportering.188;190 Waarmee beginnen? Vaak wordt er een compromis gesloten tussen gedetailleerde klinische risicobepaling, logistieke uitvoerbaarheid en redelijke kosten. Daarenboven is het opzetten van een totaal nieuwe methode zeer duur. Dus is de keuze van een reeds bestaande methode zeer aantrekkelijk.77;188 Heden ten dage bestaan er heel wat methoden, de “severity measures” genaamd, voor het voorspellen van de ziekenhuismortaliteit als middel voor ziekenhuisvergelijking. De meest belangrijke praktische aangelegenheid is dan het kiezen van een gegevensbron: klinische gegevens of ontslagabstracties. In de eerste groep horen onder meer APACHE III (Acute Physiology And Chronic Health Evaluation), CSI (Computerized Severity Index), MMPS (Medicare Mortality Predictor System), in de tweede AIM (Acuity Index Method), APRDRGs (All Patient Refined Diagnosis Related Groups) en PMC (Patient Management Categories).188 Om tot een grotere vergelijkbaarheid te komen werd er naar gestreefd naast klinische gegevens ook laboratoriumgegevens te verzamelen en bevindt er zich bijvoorbeeld in APACHE III een module “acid-base subscore”.332 Verder bleek dat het toevoegen van laboratoriumgegevens de voorspelling van het middelengebruik verbeterde, de nood aan
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
98
diagnostische gegevens verminderde en, wanneer gekoppeld aan beperkte administratieve gegevens, accurate predicties toelaten in termen van ziekenhuismortaliteit voor aandoeningen zoals AMI, CVA,CHF of pneumonie.332;333 Ook het opnemen van verpleegkundige gegevens draagt bij tot een betere uitkomstvoorspelling en is complementair aan DRGs en APR-DRGs.334;335 Met het invoeren van het prospectieve financieringssysteem (PPS) in 1983, dat gebaseerd is op DRGs, werd de bekommernis voor maten van ernst een uiterst belangrijke aangelegenheid. Zoals voormeld maken de DRGs gebruik van geabstraheerde ontslaggegevens.
Dit
zijn
in
feite
demografische
gegevens,
betalerinformatie,
hoofddiagnose en nevendiagnosen en ingrepen, gecodeerd volgens de ICD-9-CM, en wijze van ontslag. Nadelen van een op DRGs gebaseerde aanpak zijn enerzijds het gevaar voor “creep” en anderzijds het ondercoderen van belangrijke risicofactoren zoals chronische aandoeningen.1;83;140;336-338 Voordelen zijn de uniformiteit, de algemene verspreidheid en de leesbaarheid voor de computer.
PPS deed de bekommernis toenemen over de kwaliteit van zorgen en meer bepaald over het gevaar dat ziekenhuizen zouden beknibbelen op de uit de pan rijzende kosten en (ziekere) patiënten sneller zouden ontslaan.188 De eerste gegevens over ziekenhuismortaliteit in het Medicare systeem bleken problematisch en verschillende methodologische gebreken, onder meer niet-adequate correctie voor ernst, werden vastgesteld. Op basis van klinische gegevensbanken werden op het einde van de tachtiger jaren ernstmaten
ontworpen,
die
zowel
wetenschappelijk
geldig
als
klinisch
geloofwaardig waren. Maar de kosten voor het verzamelen van deze klinische gegevens bleken een hinderpaal. In een studie in Pennsylvania bijvoorbeeld bedroegen ze 17.43$ /patiënt.188 Daarom gingen in de negentiger jaren verschillende staten over tot het gebruik van APR-DRGs, maar terechte
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
99
bekommernis over de geloofwaardigheid en de accuratesse van ontslaggegevens bleef bestaan.101;103;188;333 In een studie in Californië bleek dat de verschillen in sterftecijfers tussen ziekenhuizen voor een belangrijk deel te verklaren waren door verschillen in codeerpraktijken: zo bleek in de ziekenhuizen met een veronderstelde hoge mortaliteit er voor 10 % “upcoding” plaats te vinden waar dit in ziekenhuizen met een veronderstelde lage mortaliteit 74% was. Derhalve bevinden zich de huidige initiatiefnemers van een vergelijking van risicogecorrigeerde mortaliteitscijfers in twee kampen: zij die bereid zijn en zij die het niet zijn om te betalen voor de abstractie van de klinische gegevens uit de medische dossiers.188 Niet alleen bij het bestuderen van ziekenhuissterfte is het noodzakelijk te corrigeren voor risico, dit geldt ook voor de financiering van het gezondheidszorgsysteem, de tweede invalshoek.339 Waar het DRG-systeem aanvankelijk uitsluitend gericht was op “resource intensity” werd de nood aan een uitgebreider systeem gaandeweg duidelijker.195 Dit systeem diende volgende toe te laten: (1) de vergelijking van ziekenhuizen in een wijde waaier van middelen en uitkomstmaten; (2) de evaluatie van verschillen in “inpatient ” mortaliteitscijfers; (3) het uitvoeren en ondersteunen van klinische paden; 4) het identificeren van “continue kwaliteitsverbeterende” projecten; (5) de basis te vormen voor intern management en planning systemen; en (6) het management van “capitated payment arrangements”.114 Dit leidde tot de ontwikkeling van de APR-DRGs195, het algoritme dat ook in onze MKG wordt gebruikt. Reeds in de negentiger jaren stelde men in de US en West-Europa een toename vast van zorgmanagement, een antwoord op het groeiende bewustzijn van de onomkeerbare schaarste van de middelen die ter beschikking van de gezondheidszorg gesteld worden en werd het meer en meer duidelijk dat de gezondheidssector verantwoording diende af te leggen voor de toegekende middelen.71;72;263;339;340 Terzelfder tijd streefde men naar een financiering die een gelijke toegang tot de zorgen zou verzekeren aan de ganse bevolking. Bij dit soort oefeningen dient men rekening te houden met de zorgbehoeften, die ongelijk verdeeld zijn over de bevolking, of anders uitgedrukt, men dient een risicocorrectie toe te passen.339
100
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
2.2.1.4.2 Onderlinge vergelijking van de maten van ernst. Om te kiezen uit de verschillende voorgestelde maten van ernst lijkt het aangewezen na te gaan in welke mate de verschillende systemen tot hetzelfde beoordelingsresultaat komen. Totnogtoe is er echter weinig “extern” onderzoek geweest van de diverse maatstaven. Vergelijkingen zijn trouwens zeer moeilijk bij gebrek aan één gegevensbank, die over alle gegevenselementen in de juiste vorm beschikt zoals dit voor de verschillende maten van ernst vereist is.188 Iezzoni et al. waren tot in 1997 de enige groep, die een uitgebreid extern onderzoek verrichtten over de predictieve waarde van commerciële “maten van ernst” voor sterftecijfers.188;189 In termen van de c statistiek56;333;341 ook c index342 genaamd, die aangeeft hoe goed de maat van ernst patiënten die bleven leven onderscheidde van degenen die overleden, en van de R² 56;341 bleken de “klinisch gebaseerde maten van ernst” het beter te doen dan de “op ontslagabstractie gebaseerde maten van ernst” voor pneumonie en beroerte maar was het omgekeerde waar voor AMI en CABG.188;189 Hierbij dient echter opgemerkt dat in de
“ontslagabstractie gebaseerde maten van ernst” in
tegenstelling tot de “klinisch gebaseerde maten van ernst” ook laattijdige diagnosen, bijvoorbeeld verwikkelingen na een ingreep, in de ernstbepaling meegenomen wordt. Dit verhoogt weliswaar het discriminatievermogen maar ondergraaft terzelfder tijd de validiteit van het kwaliteitsonderzoek.188;189;333 Een aantal studies gingen verder in op de waarde van APR-DRGs als instrument voor risicocorrectie. Hieruit bleek dat, indien men alleen rekening hield met de ziekte-ernst (Severity of Illness (SOI)) toegekend door het algoritme, de SOI beter de ziekenhuisletaliteit van AMI en CABG voorspelde, dan systemen, die een uitgebreide abstractie van klinische variabelen vergden. De Risk Of Mortality (ROM) module van APR-DRG, bezat een minder goede voorspellende waarde dan de SOI, indien de diagnosen beperkt bleven tot de aandoeningen, aanwezig bij de opname en men niet met de nadien ontstane verwikkelingen rekening hield.196 Het gebruik van de verblijfsduur als studieobject lijkt wat minder problematisch, indien het middelengebruik het voorwerp van studie is. Mozes et al. menen overigens dat in geval van tijdens het verblijf optredende verwikkelingen het vaker om niet-vermijdbare verwikkelingen gaat dan om iatrogene en
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
101
dat de laatste categorie dient opgespoord te worden via maatregelen op het gebied van kwaliteitsverzekering.332 Een volgend aspect betreft het voorspellen van de ziekenhuismortaliteit niet in functie van een pathologie maar van een patiënt. In dit soort oefeningen wordt nagegaan in welke mate het stervensrisico voor een zelfde patiënt door de verschillende maten van ernst op dezelfde manier wordt ingeschat. Dit verschil bleek substantieel te zijn niet alleen tussen de “klinische maten van ernst” en de “op ontslagabstractie gebaseerde maten van ernst” maar ook tussen de “op ontslagabstractie gebaseerde maten van ernst” onderling, bvb. in 60.7% van de CABG patiënten waren PMC en APR-DRG het oneens.188;189De vaststelling van verschillen tussen maten van ernst op patiëntenniveau leidde tot een vergelijking van globale mortaliteitscijfers op ziekenhuisniveau, en ook hier bleken er verschillen tussen maten van ernst te bestaan. Het viel in deze studie overigens op dat de overeenkomst tussen bruto-sterftecijfers en gecorrigeerde sterftecijfers volgens een bepaalde maat van ernst soms beter was dan tussen gecorrigeerde sterftecijfers gemeten met een andere maat van ernst.188
Implicaties 1) Globaal genomen suggereren deze analyses dat individuele ziekenhuizen zich zorgen kunnen maken over op basis van welke sterftecijfers (al dan niet gecorrigeerde) en van welke maat van ernst ze beoordeeld worden.188 Het punitieve gebruik van sterftecijfers, gecorrigeerd voor ernst, is niet aangewezen vermits de beoordeling afhankelijk is van het gebruikte type correctie.343 Ondanks hun statistische performance, pleiten de codeervolledigheid en de financiële motivatie voor het coderen tegen de op “ontslagabstractie gebaseerde maten van ernst”. Hierbij is het zo dat het coderen van de ziekte-ernst niet beperkt blijft tot de vooraf bestaande aandoeningen, maar ontaardt in “death code creep”, het overcoderen van catastrofale gebeurtenissen bij stervende patiënten als ziekenhuisantwoord op ziekenhuisprofielen, gebaseerd op ontslaggegevens.188
2) Wat betekenen risicogecorrigeerde ziekenhuis sterftecijfers dan?
102
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Ziekenhuizen verschillen in hun niet-gecorrigeerde sterftecijfers maar ook de maten van ernst falen om deze verschillen volledig uit te leggen en een deel van de verschillen kunnen toegeschreven worden aan de nauwkeurigheid van de gegevens. De centrale en vooralsnog onopgeloste vraag van “Is de risicocorrectie zo goed dat de verschillen in uitkomsten tussen ziekenhuizen alleen aan verschillen in kwaliteit toe te schrijven zijn?” blijft open en uitsluitsel is onwaarschijnlijk op korte termijn. De vereiste research is duur, tijdsverslindend, logistiek moeilijk en methodologisch complex. Slechts een handvol dergelijke studies werden uitgevoerd en kwamen tot tweeslachtige bevindingen.188 Vergelijkingen van mortaliteitscijfers over ziekenhuizen, die alleen gebaseerd zijn op administratieve gegevens, kunnen vertekend zijn en misleidend, zelfs indien de c-statistiek excellente resultaten oplevert. Administratieve gegevens kunnen derhalve alleen gebruikt worden als een initiële screening of als een aanzet tot verdere studies.333 3) Waarom dan corrigeren voor risico? De voornaamste reden is dat hoe onvolmaakt ook er geen andere manier bestaat om een productieve dialoog te beginnen met de artsen en andere zorgverleners over het gebruikmaken van informatie van uitkomsten om kwaliteitsverbetering te motiveren.188 Een tweede dwingende reden voor het uitvoeren van risicocorrectie is te vermijden dat zorgverleners die hoogrisico patiënten behandelen gestraft zouden worden.188;344 2.2.1.5 Evaluatiekader voor het ontwikkelen van kwaliteitsindicatoren (QI). Het ontwikkelen van kwaliteitsindicatoren is erg complex en vraagt de inzet van een aantal onderzoekers met een waaier van deskundigheden72;181;262;345, wat duidelijk buiten het bestek van dit proefschrift ligt en overigens voor België nog niet uitgevoerd werd. Een alternatief is dan het gebruiken van in het buitenland ontwikkelde indicatoren, waarbij er aandacht besteed wordt aan de gegevens die gebruikt werden voor het ontwikkelen van de indicatoren, aan de manier waarop en de redenen waarvoor die indicatoren geselecteerd worden, en aan de interpretatie van de bekomen resultaten.346 In een Amerikaans project: “Refinement of the Healthcare Cost and Utilization Project Quality Indicators”77 , ontwikkeld door het Stanford Evidence-based Practice Center ten behoeve van de Agency for Healthcare Research and Quality, wordt volgend evaluatiekader gebruikt voor de ontwikkeling van kwaliteitsindicatoren (QI):
103
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
1) “Face validity” of indruksvaliditeit: ook wel “logische validiteit” genoemd (bvb. het op één voet kunnen staan als indicator voor evenwicht), gezonde klinische en/of empirische basis voor het gebruik van een QI. Vat de indicator een kwaliteitsaspect dat algemeen als belangrijk beschouwd wordt en dat voldoende beïnvloedbaar is voor de dienstverstrekker of het systeem van volksgezondheid? 2) Precisie: grote variabiliteit van de QI over de zorgverleners of areas, en die niet te wijten
is
aan
toevalsvariabiliteit
(niet
waargenomen
omgevings-
of
patiëntenkarakteristieken); 3) Minimale vertekening: de QI is weinig of niet gevoelig voor systematische verschillen in patiënten case mix of voor verschillen in opnamepolitiek. Mocht er vertekening aanwezig zijn, dan is het mogelijk risicocorrectie of statistische methoden (Bayesiaans) toe te passen om het grootste deel van of gans de vertekening weg te nemen. Risicocorrectie wordt echter bemoeilijkt door codeerproblemen (codeerfouten, upcoding en undercoding), beperkingen op het aantal toegelaten nevendiagnosen en het ontbreken van een onderscheid tussen ziekenhuiscomplicaties en reeds bij de opname bestaande ziektetoestanden. 4) “Construct validity” of begripsvaliditeit: sensitiviteit, specificiteit en voorspellende waarde van een indicator zijn belangrijke eigenschappen voor het opsporen van een echt kwaliteitsprobleem t.h.v. een ziekenhuis of eerste lijn. Daarom wordt de begripsvaliditeit uitgetest waarbij men nagaat in welke mate de QI onderbouwd wordt door resultaten die in dezelfde richting gaan als deze van andere indicatoren, die dezelfde of gelijkaardige kwaliteitsaspecten meten, of door de bewezen performance in het identificeren van zorgverleners met kwaliteitsproblemen. 5) De QI bevordert een reële kwaliteitsverbetering. Er wordt nagegaan of de indicator ongevoelig is voor perverse stimulansen waarbij de zorgverleners “aangemoedigd” worden hun gerapporteerde performance te verbeteren door het vermijden van moeilijke of complexe gevallen, of tegen andere “antwoorden”, die niet met een kwaliteitsbevordering gepaard gaan bvb. voortijdig ontslag om tot een lager cijfer van ziekenhuismortaliteit te komen. 6) De QI werd reeds toegepast in het verleden en/of heeft een groot potentieel voor complementariteit met andere indicatoren, die momenteel in gebruik zijn.
104
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Ook in Nederland,waar men een kader geschetst heeft voor de ontwikkeling van prestatieindicatoren, formuleerde men een zeer vergelijkbare lijst van vereisten, waaraan prestatieindicatoren moeten voldoen: gebaseerd zijn op heldere en consistente definities; valide zijn (werkelijk meten wat zij pretenderen te meten); niet vatbaar zijn voor manipulatie; beknopt zijn en beperkt zijn in aantal; gebaseerd zijn op geloofwaardige, betrouwbare informatie; acceptabel zijn voor de organisatie; betekenisvol zijn.72 2.2.1.6 Een alternatief voor kwaliteitsindicatoren: het peer review. Methoden voor het beoordelen van kwaliteit kunnen gaan van het gebruikmaken van totaal expliciete tot totaal impliciete criteria/standaarden. Waar impliciete criteria kunnen aangepast worden aan de precieze karakteristieken van ieder geval, wat individuele beoordelingen mogelijk maakt die beantwoorden aan het multidimensionele concept van kwaliteit, zijn ze echter zeer kostelijk en minder precies dan expliciete criteria.257 Voornamelijk de reproduceerbaarheid en accuratesse van impliciete criteria stellen problemen.181;347 Expliciete criteria zijn duur om te ontwikkelen, maar laten, eenmaal zij ontwikkeld zijn, meer precieze metingen tegen een lagere kost toe. Een sequentiële combinatie van beiden kan aangewezen lijken: beginnen met een korte expliciete om verdachte gevallen te identificeren en voortgaan met een impliciete benadering voor de verdachte gevallen.257 Tussen beide in bevinden zich wat men gestructureerde, impliciete reviews noemt en die, indien mogelijk, op een blinde manier uitgevoerd worden, zodat de onderzoeker niet weet welke de uitkomst van het bestudeerde geval is. Het formulier geeft geen expliciete instructies aan de arts hoe hij de kwaliteit moet rangschikken, wel is het eerder bedoeld om de arts te helpen een aantal topics in de beoordeling te betrekken. Bij een gestuctureerd impliciet review worden vragen gesteld zoals “tijdigheid van de diagnostische evaluatie van zich presenterende problemen”.164;181;279 Er bestaan een aantal algemene bezwaren i.v.m. (gestructureerde, impliciete) reviews. Voorzichtigheid is geboden bij de interpretatie van causale verklaringen op basis van retrospectieve reviews. Medische fouten kunnen onderschat zijn (men kan weigerachtig staan tegenover het inschatten van de zorg van een collega en veel fouten kunnen niet in
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
105
het dossier opgenomen zijn). Maar medische fouten kunnen ook overschat worden precies omdat men weet dat het over sterfgevallen of ongunstige gebeurtenissen gaat. Verder zijn artsen geneigd om de overlevingskansen van zieke patiënten te hoog in te schatten en om gecorrigeerde fouten zonder onbedoelde uitkomsten of minimaal onbedoelde uitkomsten niet als een fout te bestempelen. Beoordelaar overeenstemming is overigens steeds een pijnpunt ook al gaat het over fundamentele dingen zoals het vaststellen of een ongunstige gebeurtenis zich al dan niet heeft voorgedaan.258;279;348;349Bijvoorbeeld de overeenstemming tussen verschillende beoordelaars was slechts matig in de Harvard Medical Practice Study en in de Quality in Australian Health Care Study350;351met kappas van ongeveer 0,6. Het zijn onder meer deze studies waarop het IOM zich baseert om van tienduizenden, vermijdbare sterfgevallen te gewagen284;352. Een studie, waarbij overeenstemming tussen verschillende beoordelaars centraal stond, toonde aan dat de meningen van beoordelaars in verband met de voorkoombaarheid van onbedoelde uitkomsten sterk verschilden; dat ze een schuine verdeling hadden; en, dat de notie van vermijdbaarheid ook sterk verschilde in functie van de klinische toestand en dus de te verwachten uitkomst. Bijvoorbeeld meningen van beoordelaars kunnen verschillen wanneer men de vermijdbaarheid van eenzelfde sterfgeval achtereenvolgens gaat beschouwen als een vermijdbaar sterfgeval; of, als een vermijdbaar sterfgeval gecorrigeerd voor de probabiliteit van het ziekenhuis levend te verlaten; of, als een vermijdbaar sterfgeval gecorrigeerd voor de probabiliteit van het ziekenhuis levend te verlaten en in goede cognitieve gezondheid.279 Toch wordt het impliciet interview om een aantal redenen nog steeds gebruikt. Het is gemakkelijk te ontwerpen en toe te passen, en heeft een goede indruksvaliditeit (“face validity”). Het is verder vrij eenvoudig om het interview te actualiseren door beroep te doen op up-to-date experts. Het weerspiegelt overigens de volledige waaier van klinische beslissingen die op een bepaalde patiënt van toepassing zijn en heeft het vermogen om, in tegenstelling tot kwaliteitsindicatoren, de interpersonele relaties bij de beoordeling te betrekken.257;349 Tenslotte is men erin geslaagd de bruikbaarheid van het gestructureerd impliciet interview te verbeteren door zich te beperken tot aandoeningen, waarbij men beschikt over goede evidentie over wat kwaliteitszorg is.349
106
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
2.2.2 Kwaliteitsindicatoren op basis van administratieve gegevens. 2.2.2.1 Aan structuur gerelateerde maten: volume. Kwaliteitsbevorderende strategieën gebaseerd op volume werden aanbevolen 308;310-312;314;353
104;218;297;302-
niet alleen wegens de onomstotelijke evidentie over het verband tussen
volume en uitkomst maar ook omdat andere opties voor kwaliteitsverbetering als onpraktisch of ineffectief beschouwd werden.104 Procesmaten werden niet goed verstaan, regulerende
benaderingen
werden
met
weinig
enthousiasme
begroet,
continue
kwaliteitsverbetering werd buiten het gebied van de hartchirurgie nauwelijks toegepast104;320 en het publiekelijk vrijgeven van sterftecijfers bleek niet in staat het consumentengedrag significant te doen veranderen.104;354 In tegenstelling hiermee bleken op volume gebaseerde verwijzingsstrategieën in het algemeen te leiden tot betere uitkomsten.104
Verder kunnen op volume gebaseerde
drempels gebruikt worden om consumenten aan te sporen om naar bepaalde ziekenhuizen te gaan, om vereisten van erkenning voor referentiecentra te rechtvaardigen, om het opzetten van nieuwe diensten onder controle te houden en om als leidraad voor de professionele vormingsvereisten te dienen.104;320 Laten we nagaan in welke mate volume als proxy bruikbaar is voor kwaliteitsvolle, risicogecorrigeerde ziekenhuissterfte, de meest gebruikte uitkomstmaat.104 Modern onderzoek naar het verband tussen volume en uitkomst begon met het baanbrekend werk van Luft en collega’s.330. Voor een aantal ingrepen, waaronder CABG, werd vastgesteld dat ziekenhuizen met meer dan 200 ingrepen per jaar een 25 tot 41 % lagere voor case mix gecorrigeerd sterftecijfer hadden dan in ziekenhuizen met minder dan 200 dergelijke ingrepen.Voor een tweede groep aandoeningen, waaronder colectomie, was er nog steeds een dergelijk verband maar lagen de volumedrempels een behoorlijk stuk lager, namelijk 10 tot 50 ingrepen. Voor een laatste groep ingrepen, waaronder cholecystectomie bleek er geen dergelijke verband te bestaan. Deze auteurs identificeerden een aantal principes en vragen, die de basis vormden voor verder onderzoek. Hierbij werd het duidelijk dat de toepasbaarheid van het volume-
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
107
uitkomst verband zich beperkte tot complexe ingrepen en het uitwerken van ingreepspecifieke functionele verbanden en drempels. Verder diende de respectievelijke rol van chirurgen- en ziekenhuisvolume nagegaan te worden. Het werd belangrijk geacht de onzekere causaliteit van het volume-uitkomst verband verder uit te klaren. Ook aan het onderzoeken van de potentiële risico’s en voordelen van regionalisatie diende aandacht besteed te worden. Tenslotte bleef men de nood aan uitgebreide, risicogecorrigeerde gegevens als een belangrijke, op te vullen leemte beschouwen. Latere studies hebben dit volume-uitkomst verband bevestigd.104 In een recent artikel bijvoorbeeld werd de invloed van ziekenhuisvolume op postoperatieve mortaliteit bestudeerd voor 14 complexe ingrepen. Hierbij werden vergelijkingen gemaakt, gebaseerd op zo homogeen mogelijke patiëntengroepen in termen van leeftijd, indicaties voor ingrepen (bvb geen thoraco-abdominaal aneurysma bij ingrepen voor abdominaal aneurysma), en zekerheid van diagnose. Mortaliteit verminderde bij toenemend volume voor de 14 bestudeerde ingrepen, maar het relatief belang van het volume varieerde sterk in functie van de ingreep: bvb voor pancreasectomie bedroeg het absoluut verschil 12,5 % tussen laag (16.3%) en hoog volume (3,8%) ziekenhuizen.310 De auteurs menen dat de vastgestelde resultaten het verschil in chirurgische kwaliteit weerspiegelen tussen “hoog volume” en “laag volume” ziekenhuizen. Zij geven ook een aantal beperkingen aan zoals het niet in de studie opnemen van mensen van minder dan 65 jaar, de niet perfecte meting van volume, een gebrekkige benadering van de sociaal-economische status van de patiënten, een aantal factoren, die eventueel de uitkomst beïnvloeden (grootte van het ziekenhuis, teaching status, het volume per individuele chirurg en personeelspatronen van de intensieve zorgen) en, vermits er gebruik gemaakt werd van administratieve gegevens, een eventueel onvoldoende rekening houden met case mix verschillen.310 Kankerstudies hebben overigens de impact aangetoond van volume op andere uitkomsten dan ingrepenmortaliteit. Dit weerspiegelt het belang niet alleen van chirurgische vaardigheid maar ook van procesaangelegenheden zoals keuze van behandeling, adjuvante therapie en follow-up op lange termijn.104;311 Verder is het verband tussen volume en uitkomst merkwaardig consistent over de tijd en over de studies. Dit verband is ook klinisch plausibel: waarschijnlijk meer gespecialiseerde chirurgen, meer consistente processen voor postoperatieve zorg, beter van personeel
108
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
voorziene eenheden voor intensieve zorg, en in het algemeen grotere middelen om met postoperatieve verwikkelingen om te gaan. Een recent review kwam tot gelijkaardige bevindingen over het verband tussen hoog volume en betere uitkomst, de variabele graad van sterkte van het verband over de ingrepen maar ook de vermindering van de sterkte van het verband bij gebruik van klinische i.p.v. administratieve gegevensbanken.355 Andere auteurs zijn de mening toegedaan dat de omgekeerde relatie tussen volume en uitkomst voor een ingreep niet specifiek is voor die ingreep maar dat het veeleer gaat over het algemeen functioneren van een ziekenhuis en met name de gemeenschappelijke structurele en proceskarakteristieken en stellen dat het vermijden van een aantal ingrepen gerelateerde sterfgevallen niet het meest overtuigende argument voor regionalisatie is.356;357Verder blijkt er een aanzienlijke overlap te bestaan qua resultaten tussen hoogvolume en laagvolume zorgverleners.104 Het volume-uitkomst verband werd beschreven voor ziekenhuizen en voor artsen. Sommige onderzoekers menen dat dit verband sterker is voor ziekenhuizen dan voor artsen; het aandeel van de proportie zieken behandeld door laagvolume artsen is hierbij echter belangrijk en in hoogvolume ziekenhuizen kunnen de prestaties van laagvolume artsen verdoezeld zijn.104;307;308 Er blijven nog veel onbeantwoorde vragen over het belang van de algemene operatieve ervaring van chirurgen, het uitvoeren van nauw aanverwante ingrepen, het gelijktijdig uitoefenen in meerdere ziekenhuizen, aanvankelijke verwerving van versus onderhouden van vaardigheden, over voorbijgaand of permanent laagvolume chirurgen.104;218 Ondanks het overwicht aan studies die het volume-uitkomst verband schragen en het toenemend gebruik358 van deze hypothese om belangrijke beslissingen op gebied van gezondheidspolitiek te verrechtvaardigen, blijven er vele vragen onbeantwoord.320 Er zijn gevallen bekend van klein/matig volume en hoge kwaliteit en omgekeerd. Hoewel enkele studies gebaseerd zijn op klinische gegevens, steunde het merendeel op ontslaggegevens, wat hun waarde beperkt: over het algemeen is de risicocorrectie minder goed dan bij klinische gegevens en bestaan er belangrijke rapporteringproblemen met onder meer up- en undercoding van morbiditeiten.320 Overigens zijn vele van de studies achterhaald t.o.v. de gemaakte vorderingen in medische en chirurgische zorg. Verder
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
109
stelde men vast dat naarmate de risicocorrectie verbeterde de odds ratio (laag versus hoog volume) van sterfte daalde, hoewel het onwaarschijnlijk is dat dit de algemene natuur van het waargenomen verband zou omkeren.104;320;359 Een andere methodologische bekommernis gaat over de cross-sectionele natuur van de meeste studies. In een recente longitudinale studie, die gebruik maakt van hiërarchische modellen, werd daarentegen geen verband vastgesteld tussen chirurgvolume en ziekenhuissterfte bij CABG.104Daarenboven is de prestatie van enkele extreem laagvolume zorgverleners grotendeels verantwoordelijk voor de significante resultaten van vele studies. In de meeste studies heeft het eindpunt, gewoonlijk de mortaliteit, immers een lage incidentie. Uit de aard van de studieopzet verschilt de steekproefgrootte substantieel tussen de ziekenhuizen en is hij soms zeer klein, wat om speciale statistische methodes vraagt (“shrinkage”, hiërarchische modellen). Daarom beschouwen onderzoekers kleine steekproeven als een van de meest verontrustende methodologische zwakheden van de volume-uitkomst research, net zoals het een limiterende factor is in het produceren van geloofwaardige uitkomst rapporten.104 Het gebrek aan een formele statistische benadering voor het identificeren en schatten van het volume veranderingspunt is een ander controversieel punt in het volume-uitkomst debat. Vooraf moet bepaald worden of het selectief verwijzen naar de zorgverleners met de beste prestaties de bedoeling is, wat een drempel probleem is, of dat het erover gaat te voorspellen welk volumeniveau zal toelaten een vooraf bepaalde standaard te bereiken, wat een omgekeerd voorspellingsprobleem is. Ook andere aspecten van volume-uitkomst studies stellen problemen bij een klassieke statistische analyse omwille van de sterke correlatie van zorgverleners karakteristieken die de relatie volume-uitkomst beïnvloeden: bvb. hoog volume en universitair ziekenhuis. Het is moeilijk hier het effect van het volume te isoleren, zelfs met gesofisticeerde statistische technieken.104 De juiste aard van de relatie tussen volume en uitkomst is nog steeds niet uitgeklaard. De literatuur suggereert twee basismodellen voor de verhouding tussen volume en uitkomst77;104;304;306;307;309. Een eerste model is dat van “oefening baart kunst” (“practice makes perfect”), waarbij de nadruk gelegd wordt op de noodzakelijkheid om een
110
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
technische vaardigheid te onderhouden (“maintenance”). Een tweede model is dat van de “selectieve verwijzing”, waar kwaliteit niet het gevolg is van het grote volume, maar waar het grote volume het gevolg is van de hoge kwaliteit. Het eerste model domineert in spoedsituaties zoals een acuut myocardinfarct of een niet geplande CABG. Selectieve verwijzing treedt op in situaties zoals geplande CABG en heupprothese. In geval van selectieve verwijzing is een op volume gebaseerde indicator een “signaal” van een lage of hoge kwaliteit van de verstrekker, die alleen de toestand kan verbeteren door de algemene kwaliteit van de zorgen te verbeteren, dit aan de potentiële patiënten mee te delen en op bijkomende patiënten te wachten. In geval van “oefening baart kunst” is de situatie vanuit een standpunt van kwaliteit soms minder gunstig: een beleid dat erop gericht is bijkomende patiënten naar dergelijke centra te verwijzen is immers niet altijd optimaal. Het kan immers dat een surplus aan zieken teveel de mogelijkheden van een zorgverlener onder druk zet en de zorguitkomsten verslechtert.77;360 Wij menen op basis van voorgaande een aantal besluiten te kunnen formuleren. Volumegebaseerde verwijzingsstrategieën zijn aangewezen voor complexe ingrepen met grote uitkomstverschillen i.f.v. het volume zoals oesofagectomie en pancreatectomie en voor bepaalde hoogrisico subgroepen. Voor andere complexe ingrepen met een kleiner uitkomstverschil kunnen volumestandaarden gebruikt worden als een rode vlag om de aandacht te vestigen op de kleinste volume ziekenhuizen, niet omdat zij eenvormig minder kwaliteit zouden bieden, maar omdat hun kleine aantallen het moeilijk maken om nauwkeurig hun prestaties te beoordelen. Indien mogelijk dienen risicogecorrigeerde uitkomstgegevens deze volumestandaarden aan te vullen of te vervangen.104 2.2.2.2 Aan proces gerelateerde maten: gebruik van ingrepen in ziekenhuizen. Tegenover het begrip van volume staat dat van “gebruik” (“utilization”). Dit berust erop dat er een grote variatie bestaat over ziekenhuizen of gebieden en dat er zowel over- als ondergebruik bestaat. Daarbij kan het dat een hoog volume vereist is voor het bewaren van de nodige technische vaardigheid voor het uitvoeren van ingreep, die alles samen genomen schadelijk is voor de patiënten en zich gemakkelijk leent tot overgebruik. Small-area onderzoek laat toe het onderscheid te kunnen maken tussen de uitkomst effecten van hoog volume en overgebruik. Het suggereert soms dat de gezondheidsgevolgen van variaties in
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
111
de geneigdheid van zorgverleners om patiënten aan een bepaalde therapie te onderwerpen (het gebruikseffect) de effecten verkleint van de variaties in technische vaardigheid, die vereist is voor het uitvoeren van deze therapieën (het volume effect). Dit suggereert dat het gebruik van en niet het volume een meer belangrijke determinant is van kwaliteit.77 Carotisendarterectomie (CEA) is hiervan een illustratie. De publicatie van gunstige klinische studies leidde tot een dramatische verhoging van het aantal uitvoeringen van CEA. Hierbij ontstond er bezorgdheid over de ontstane discrepantie tussen de potentiële doeltreffendheid in de klinische studies en de veel lagere doeltreffendheid in de dagelijkse praktijk, vooral in geval van asymptomatische carotisstenose.77;170;171;308;361-363 Een deel van de uitleg is waarschijnlijk toe te schrijven aan een “verruiming” van de indicatie van de ingreep tot patiënten, die uit de klinische studie waren uitgesloten.77;171;308 Concluderend gesteld, hoog volume kan een indicator zijn voor goede kwaliteit in een specifieke populatie, en hoge gebruikscijfers voor een bredere bevolking kan in feite een indicator zijn van ondermaatse kwaliteit.77 Gebruiksmaten van ingrepen worden gebruikt voor het vaststellen van zowel overgebruik als ondergebruik. Overgebruik kan leiden tot 1) nadelige uitkomsten (ziekte, handicap, dood) door patiënten bloot te stellen aan het risico van nevenwerkingen of van verwikkelingen en 2) onnodige kosten voor gezondheidszorg. Ondergebruik kan leiden tot vermijdbare nadelige uitkomsten.77 Variatie in ingrepencijfers over geografische gebieden en over zorgverleners kunnen heel wat redenen hebben. Geografische variatie kan te wijten zijn aan verschillen in case mix, toegang tot zorgen of verschillen in praktijkvoering, die een weerspiegeling zijn van een combinatie van onzekerheid over de effecten van ingrepen in bepaalde patiënten en van de vertrouwdheid van de zorgverlener met bepaalde behandelingsmethoden.255;364 Daarom kan men stellen dat geografische variatie een indicatie is van eventueel overgebruik of ondergebruik van een ingreep, maar ook kan veroorzaakt zijn door andere belangrijke verklaringen die verder onderzocht moeten worden.77;255;365 Om verschillen in praktijkvoering te kunnen isoleren van geografische verschillen in gediagnosticeerde ziekte, dient men zowel over ziekenhuisontslaggegevens als over gegevens uit de eerstelijns geneeskunde te beschikken.365
112
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
De ingrepen, die het meest bestudeerd werden, zijn veel gebruikte ingrepen (bvb. het keizersnedencijfer waar we in hoofdstuk 5 uitvoerig op terugkomen), die op gebiedsniveau waarschijnlijk geen noemenswaardige variatie kennen ten gevolge van kleine aantallen. Elk van die potentieel te veel gebruikte ingrepen heeft een geëigend gebruik bij sommige patiënten. Vandaar de nood aan risicocorrectie bij een vergelijking van gebruikscijfers. Verder is het zo dat patiëntenvoorkeur in ruime mate de gebruikscijfers beïnvloeden. Daarom kan men stellen dat het ideale cijfer voor vele ingrepen niet gekend is en wordt er in de US nog steeds gedebatteerd over het “correcte” streefcijfer voor keizersnede en vaginale verlossing na keizersnede, twee gebruiksmaten, die opgenomen waren in de doelstellingen van “Healthy people 2010”.77 Tenslotte dient erop gewezen te worden dat de klinische gegevens, nodig voor risicocorrectie, vaak niet in de ontslaggegevens, zoals onze MKG, opgenomen zijn. Het is derhalve aangewezen voorzichtig om te springen met kwaliteitsindicatoren, gebaseerd op gebruikscijfers berekend op basis van ontslaggegevens. Dit kan immers leiden tot ongewenste effecten zoals het toepassen van ingrepen, die ondergebruikt worden, bij mensen, die geen geëigende kandidaten zijn, of het niet toepassen van een ingreep op mensen, die hem nodig hebben, omwille van een bestaand overdadig gebruik.77 2.2.2.3 Uitkomstmaten. Sterfte, morbiditeit, functionele status, levenskwaliteit, zorgenkosten, verblijfsduur, terug gaan werken en patiëntensatisfactie zijn de belangrijke uitkomsten.163 In grote gegevensbestanden is sterfte echter de meest geanalyseerde uitkomstmaat en als dusdanig is sterfte ook het onderwerp geweest van de meeste debatten.77;163 Er werden overigens sterke variaties in sterftecijfers genoteerd, vooral voor nietchirurgische aandoeningen.77;343 Ook suggereren een aantal recente overzichtsartikelen dat duizenden te voorkomen chirurgische sterfgevallen zich elk jaar in de US voordoen omdat electieve maar hoogrisico chirurgie uitgevoerd wordt in ziekenhuizen, waar er onvoldoende ervaring is met die chirurgische ingrepen.255;310;312 Er wordt patiënten aangeraden voor een aantal ingrepen naar hoog volume ziekenhuizen te gaan en een aantal consumentgerichte websites beginnen informatie te verstrekken over bereikte volumes in ziekenhuizen in hun buurt.310
113
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Toch stellen velen de toepasbaarheid heden ten dage van oudere studies in vraag, vermits deze mortaliteit sindsdien aanzienlijk gedaald is en het relatief belang van het volume misschien aan het dalen is.310 Vervolgens hebben de meeste van die studies gebruik gemaakt van gegevensbanken op staatsniveau of van regionale bevolkingen, die bediend werden door een klein aantal centra met hoge volumes. Verder zijn die studies meestal beperkt gebleven tot hartchirurgie of uitgevoerd op te kleine steekproeven.310 “Het zou handig zijn mochten ziekenhuizen met hogere sterftecijfers, geïdentificeerd op basis van gemakkelijk verzamelde administratieve gegevens (leeftijd, geslacht, vorige ziekenhuisopname, diagnose), inderdaad ook blijken zorgen te verstrekken van lagere kwaliteit”.319 Maar is een hoog sterftecijfer inderdaad een marker van slechte kwaliteit? Waar
we
weten
dat
sterftecijfers
verschillen
in
functie
van
specifieke
ziekenhuiskarakteristieken en van ervaring ( i.e. volume), weten we weinig over hoeveel van de variabiliteit te wijten is aan verschillen in ziekte-ernst en co-morbiditeit, hoeveel aan verschillen in kwaliteit en hoeveel aan toeval of selectie-effecten, zoals onder meer verschillen in opnamepraktijken.54;319 Een ander probleem wordt gevormd door de gelukkig kleine aantallen, die vaak leiden tot niet significante resultaten, en, zelfs als dan significantie kan worden aangetoond, door de moeilijkheid om het falende proces aan te tonen.77 In een studie waarin het verband bestudeerd werd tussen kwaliteit van zorgen, sterftecijfers en ziekte-ernst voor congestief hartfalen (CHF) en acuut myocardinfarct (AMI) bleken de verschillen in sterftecijfers tussen ziekenhuizen niet verklaard te kunnen worden door verschillen in de kwaliteit van zorgen. Een deel van de niet-uitgelegde variabiliteit kan voortvloeien uit de manier waarop de kwaliteit gemeten wordt, die voornamelijk de processen van de eerste drie dagen onderzoekt. Op het niveau van de individuele patiënt bleek hogere ziekte-ernst op een merkbare manier het stervensrisico te verhogen en bleek betere kwaliteit, zij het in minder uitgesproken mate dan de ernst, een vermindering van het stervensrisico te veroorzaken. Het is echter onwaarschijnlijk dat ziekenhuizen, die zorgen van lagere kwaliteit verstrekken, kunnen geïdentificeerd worden door middel van administratieve gegevens en 1-jaars sterftecijfers.319
114
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Al lijden beoordelingen van vermijdbare sterfte door experts onder een gebrekkige overeenkomst tussen beoordelaars, toch schijnt er enige correlatie te bestaan tussen risicogecorrigeerde sterftecijfers en kwaliteitsproblemen, geïdentificeerd door peer review organisaties.77 Significant hogere sterftecijfers kunnen gedeeltelijk toegeschreven worden aan moeilijk te meten verschillen in ziekte-ernst, al werd er in een aantal studies vastgesteld dat potentieel te voorkomen onbedoelde uitkomsten tenminste zwak geassocieerd zijn met de gemeten sterftecijfers.77 Ziekenhuismortaliteit wordt verder beïnvloed door de verblijfsduur en men weet overigens dat factoren die korte termijnsterfte beïnvloeden, verschillen van lange termijnsterfte.191 Oplossingen zoals de “dertig dagen ziekenhuissterfte” zijn niet vrij van vertekening366: de verandering van de uitkomstdefinitie: “eender welke ziekenhuissterfte” tot de “dertig dagen ziekenhuissterfte” veranderde in een studie over hartchirurgen hun rangorde op ingrijpende manier: op 78 chirurgen veranderde de rangorde bij 30 van hen met meer dan tien plaatsen191 al moet men voorzichtig omspringen met rangorden, zeker wanneer het gaat over sterfte76. Nochtans bleek uit een meer recente studie over hartinsufficiëntie dat ziekenhuizen met lagere ziekenhuissterfte SMRs geen hogere naontslag sterftecijfers hadden en besluiten de auteurs dat ziekenhuissterfte een redelijk valide marker mag genoemd worden voor 30-dagen mortaliteit367. Birkmeyer et al.310 kwamen in hun studie over een aantal belangrijke ingrepen tot een gelijkaardige conclusie evenals studies in het UK183;184. In een enkele recente studie over femurhals fracturen bleek de dertig dagen mortaliteit tot vertekende conclusies te leiden.253 Wanneer andere ongunstige uitkomsten dan sterfte het onderwerp van studie uitmaken zoals bijvoorbeeld postoperatieve verwikkelingen, wordt een analyse op basis van ontslaggegevens bemoeilijkt door de beperkingen van de ICD-9-CM, die alleen het zich al dan niet voordoen van verwikkelingen aangeeft en niet de ernst van de verwikkeling. Een voorbeeld van verwikkelingen bij laparoscopische cholecystectomie wordt door Taylor gegeven.368 Tenslotte kan men stellen dat het gebruiken van uitkomstgegevens voor vergelijkingen het nuttigst is wanneer men wenst de zorg op te volgen bij hoogvolume verstrekkers en dit
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
115
over lange tijdsperiodes. Andere waardevolle toepassingen zijn het opsporen van gebieden voor kwaliteitsverbetering of van problemen bij het implementeren van zorgprocessen. Een laatste nuttig gebruik van uitkomstgegevens is het bestuderen van het ganse zorgsysteem.299 Wanneer een studie afgesloten is stelt zich onvermijdelijk het probleem van het kenbaar maken van de resultaten. Het publiekelijk vrijgeven van de resultaten van uitkomst- en procesvergelijkingen tussen ziekenhuizen of individuele zorgverleners neemt meer en meer toe. Hierbij moet een evenwicht gezocht worden tussen de mogelijke schade die men kan aanrichten door onjuiste informatie te verstrekken, omwille van methodolgische tekortkomingen, en het recht van de consument om een voor hem zo goed mogelijke keuze te maken voor de zorgverlening die hij nodig heeft. Wij komen hier later uitgebreid op terug. 2.3 BENADERING GEBASEERD OP INCIDENTEN.
2.3.1 Patiëntveiligheid Patiëntveiligheid beantwoordt ongetwijfeld aan de definitie van een prioritair gezondheidsprobleem in termen van ernst, frequentie, sociale en economische kosten, en perceptie door het beleid en de gemeenschap. Dit vertaalde zich onder meer in rapporten en het opzetten van agentschappen om dit probleem aan te pakken.291 Verschillende initiatieven werden genomen zoals veiligheidsorganisaties, rapportage systemen voor onbedoelde uitkomsten (“adverse events”) en oproepen tot het hertekenen van het gezondheidszorgsysteem.291 Vraag is dan welke zijn de sleutelelementen van deze inspanningen, waar zijn ze werkelijk op gericht, en zijn ze voldoende rijp voor een toepassing in andere landen? Arah en Klazinga291 geven enkele behartigenswaardige beschouwingen. Zij stellen onder meer dat er te veel organisaties actief zijn die zich met deze problematiek bezig houden. Verder observeren ze dat er te veel onenigheid bestaat rond basisbegrippen, dat de gevolgde benadering te beperkt is, met name praktisch exclusief op de patiënt gericht, en te weinig oog heeft voor het gezondheidssysteem en zijn bredere omgeving. Ook stellen ze
116
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
vast dat de medische praktijkomgeving “prohibitief procesziek” blijft. Verder menen ze dat de verwachtingen van zero tolerantie te hoog gespannen zijn en dat “safety” indicatoren gebaseerd op administratieve gegevens nog problematischer zijn dan andere kwaliteitsindicatoren voor eindgebruikers. Ook Chang et al. betreuren het fragmentarisch karakter van de verschillende benaderingen, die in de zorgsector gebruikt worden om “near misses”, onbedoelde uitkomsten (“adverse events”) en andere concepten i.v.m. patiëntveiligheid
te definiëren.369Deze auteurs
ontwierpen een overkoepelend concept over patiëntveiligheid, dat berust op een systeembenadering, en benadrukken het belang van a priori beslissingen over de sleutelveranderingen in structuur en proces die in verband gebracht worden met elk voorval i.v.m. patiëntveiligheid.369 De moeilijkheid om tot dit concept te komen bestond uit het ontrafelen van het ingewikkelde netwerk van informatie gekarakteriseerd door gebeurtenissen, setting, individuen, teams, protocollen, procedures, beleid, en communicatie in een onzekere omgeving.369 Het vertrekpunt voor een benadering van patiëntveiligheid is vaak de onbedoelde uitkomst, die als volgt kan omschreven worden: “Onbedoelde of ongewenste voorvallen in het gezondheidszorgproces, die een negatieve impact hebben of kunnen hebben op een patiënt of patiënten, en resulteren of kunnen resulteren uit een onderdeel van een gezondheidszorgproces”.370 Een andere omschrijving luidt als volgt: “... schade, die veroorzaakt werd door het medisch beleid eerder dan door de onderliggende ziekte en die tot de dood leidde, een levensbedreigende ziekte veroorzaakte, een ziekenhuisverblijf verlengde of veroorzaakte, een lichamelijke ongeschiktheid veroorzaakte op het ogenblik van het ontslag, of beide.”293;350;371 Bij een onbedoelde uitkomst treft men volgende drie karakteristieken370 in mindere of meerder mate aan: -
negativiteit: het gaat over een nadelig voorval dat uit de aard van zijn natuur onwenselijk of schadelijk is voor het gezondheidszorgproces of voor de patiënt,
117
Hoofdstuk 2: Gebruik van administratieve gegevensbanken -
(potentieel) impact op de patiënt. Bredere definities beschouwen een potentiële impact als een ongunstige gebeurtenis waar meer strikte definities een definieerbaar en identificeerbaar schadelijk gevolg voor de patiënt vereisen,
-
oorzakelijk verband: er moet een aanduiding bestaan dat het voorval het resultaat is van een onderdeel van het zorgproces zelf (ofwel door het begaan van een fout ofwel door verzuim) eerder dan door een voorval van buiten het proces zoals handelingen van de patiënt of het natuurlijk verloop van de ziekte.
De voormelde omschrijvingen van onbedoelde uitkomst hebben slechts een beperkte bruikbaarheid omdat zij de omstandigheden of voorvallen, die een onbedoelde uitkomst uitmaken, in onvoldoend concrete termen definiëren om zulke voorvallen op betrouwbare wijze te identificen.370 Daarom maken metingen van onbedoelde uitkomsten meestal gebruik van een reeks uitdrukkingen of criteria zoals niet-geplande terugkeer naar de operatiezaal, transfer naar een andere instelling voor acute zorgen, lage Apgar score.370 Verdere analyses (1) beschrijven de weerslag op de patiënt in termen van ernst en persistentie; (2) gaan de oorzakelijke genese na van het voorval om het te kunnen toeschrijven aan bepaalde onderdelen van de gezondheidszorgorganisatie; en, (3) beoordelen de vermijdbaarheid
om een expliciet professionele beoordeling van de
370
zorgkwaliteit te maken.
Nalatigheid (“negligence”) werd gedefinieerd als: “.. zorg die onder de standaard viel, die van artsen in hun gemeenschap verwacht werd.”350 De oorzaken van onbedoelde gebeurtenissen (incident of “event”) en uitkomsten werden omschreven als het niet uitvoeren van een geplande actie (fout in de uitvoering); het toepassen van een verkeerd plan om het doel te bereiken (fout in de planning); onzorgvuldigheid, slordigheid (door vaardigheden bepaalde fout); manier waarop processen zijn ingericht in de organisatie (organisatiegebonden
factoren);
fouten
ontstaan
door
een
technisch
falen
en
patiëntgerelateerde factoren zoals co-morbiditeit en gebrek aan therapietrouw.293 De scheidingslijn tussen fout en nalatigheid is niet altijd even gemakkelijk: bijvoorbeeld een verkeerde radiografie-interpretatie van een hartfalen als een pneumonie, een pleurapunctie bij het plaatsen van een centraal veneuze katheter of een perforatie van de
118
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
darm bij een ingreep voor een adhaesieve darmobstructie. Ook zijn de beoordelingscriteria vaak niet gedefinieerd wat kan leiden tot uiteenlopende beoordelingen. Daarom dienen praktijkstandaarden altijd een zekere mate van fouten te aanvaarden.372 Een moeilijkheid bij de op fouten gebaseerde benadering zijn haar methodologische beperkingen: de studies hebben het over “verbanden” maar meten de sterkte van de relatie tussen fout en slechte uitkomst niet. Verder stelt zich het probleem van de typische post hoc situatie: men vertrekt van een slechte uitkomst en gaat dan zoeken wat er fout gelopen is met vaak een door die wetenschap bijgekleurde conclusie348;352 Ook zijn de concepten “fouten” en “onbedoelde uitkomsten” begrippen die mekaar gedeeltelijk en in onbekende mate overlappen348 zoals blijkt uit figuur 1. Dikwijls wordt overigens de aandacht gevestigd op uitzonderlijke en zeer ernstige fouten en gaan meer frequente en niet onbelangrijke fouten vaak onopgemerkt voorbij zoals het niet toe dienen van ß-blockers na een AMI.348 In de figuur 2 worden fouten voorgesteld in functie van hun enormiteit en van hun causaliteit. Hofer et al. stellen dat medische fouten gedefinieerd moeten worden in termen van gefaalde processen, waarvan op een rigoureuze manier werd aangetoond dat zij nadelige gevolgen veroorzaakten.348
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
119
Figuur 1: Conceptuele definities van te voorkomen, nalatige, onbedoelde en ongewenste uitkomsten en fouten.348
Bron: Hofer348
Figuur 2: Classificatie van fouten in functie van hun enormiteit (“egregiousness”) en van hun bijdrage tot de uitkomst (“contribution to outcome”).
Bron: Hofer.348
120
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Een dergelijke classificatie van onbedoelde uitkomsten wordt meestal uitgevoerd via een professioneel peer review.370 De wetenschappelijke rigor waarmee reviews doorgevoerd worden is erg wisselend en gaat van één beroepsbeoefenaar, die een op impliciete criteria gebaseerde beoordeling uitvoert, tot een multidisciplinair team dat expliciete en gedefinieerde criteria gebruikt.370Ook de ervaringen over intra-rater en inter-rater betrouwbaarheid lopen uiteen en leren dat het bereiken van een betrouwbaar oordeel meer meervoudige beoordelingen vergt dan praktisch doenbaar.370 2.3.2 Gegevensbronnen over onbedoelde uitkomsten Een eerste bron is het screenen van het klinisch dossier van patiënten, gedurende of na het zorgproces, door personeel dat beslist of er al dan niet een ongunstige gebeurtenis geweest was en hoe dit dient geklasseerd te worden. Hieraan zijn twee belangrijke nadelen gekoppeld. De klinische informatie kan ontoereikend zijn om tot een besluit te komen en het is mogelijk dat onbedoelde uitkomsten niet geregistreerd worden. Medische dossiers zijn daarenboven een samenvatting van de verstrekte zorgen en behandelingen eerder dan een weergave van elke handeling en incident.370 Een andere bron van informatie over onbedoelde uitkomsten is de zelfrapportering van incidenten door klinische beroepsbeoefenaars. Omwille van het weinig voor de hand liggende karakter van deze handelswijze en omwille van de verschillen in definities van onbedoelde uitkomsten, die de verschillende beroepsbeoefenaars kunnen hanteren, kan de betrouwbaarheid van dit soort gegeven nog meer in vraag gesteld worden.370 Een laatste bron van gegevens zijn ziekenhuisontslaggegevens. De meeste onbedoelde uitkomsten kunnen op deze manier echter niet geïdentificeerd worden tenzij het volledig medisch dossier geïnformatiseerd en beschikbaar is.370 Wanneer onbedoelde uitkomsten gebruikt worden in kwaliteitsmeting worden twee wegen bewandeld. Sommigen identificeren eenvoudig de onbedoelde uitkomsten en onderzoeken ze, in navolging van het “kritische incident”-techniek, op een kwalitatieve manier.370
121
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Velen maken gebruik van een kwantitatieve analyse waarbij de onbedoelde uitkomsten geteld worden, geaggregeerd, en omgezet tot cijfers (“rates”), gecorrigeerd voor een aantal factoren.370 De “face” en “content” validiteit van “onbedoelde uitkomsten”-maten kunnen als goed beschouwd worden.370 De criterion validiteit is niet afdoend onderzocht. De enkele studies hieromtrent
gebeurden
op
basis
van
een
impliciete
beoordeling
door
een
beroepsbeoefenaar, waarvan de beperkte validiteit (hoog fout positief cijfer) en betrouwbaarheid bekend zijn.370 Voor de “construct” validiteit liggen, omwille van de schaarsheid van onderliggende theorie en constructs, de zaken nog moeilijker. Nochtans kon onder meer worden aangetoond dat onbedoelde uitkomsten verband houden met een toename van de verblijfsduur en verhoogd middelengebruik, dat de cijfers verschillen over specialiteiten, type van ziekenhuizen, en type patiënten (urgente gevallen, ernstiger zieken hebben meer onbedoelde uitkomsten).370 2.3.3 Omvang van en acties rond onbedoelde uitkomsten Hoewel de overgrote meerderheid van de medische fouten zonder nadelen gepaard gaat of slechts met minimale, tijdelijke effecten, toch is de schade door medische fouten belangrijk en schat het IOM dat er in de US jaarlijks tussen de 44.000 en 98.000 mensen sterven tengevolge van een fout in het medische management.284;350;372;373 Over de precieze omvang van deze cijfers werd uitvoerig gedebatteerd en een groot deel van de discussie kan teruggevoerd worden op beperkingen van de Harvard Medical Practice Study(MPS)350;372: het gaat over een retrospectieve studie gebaseerd op het medisch dossier waarin 1) veel belangrijke voorvallen niet opgetekend werden, 2) fouten geïdentificeerd werden door een impliciet oordeel door een arts, en 3) waar, omwille van zijn retrospectief karakter, een “hindsight”-vertekening, de neiging om een causaliteit toe te kennen aan een handeling wanneer de (slechte) uitkomst gekend is. Ad 1) kan men zich aan een belangrijke onderschatting verwachten, ad 2) vallen zowel onderschatting als overschatting te verwachten, die mekaar waarschijnlijk opheffen, en ad 3) is een overschatting de te verwachten vertekening 352. Er bestaan redenen om aan te nemen dat het IOM niet overdreef. Het lijkt onwaarschijnlijk dat beoordelaars onbedoelde uitkomsten zouden vinden die niet bestonden en dat het hier
122
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
eerder om een benedengrens zou gaan dan om een overschatting. Ook werd alleen ziekenhuismortaliteit in rekening genomen en niet de ambulante chirurgie. Tenslotte liggen in prospectieve studies de fouten- en schadecijfers meestal veel hoger.352 Tegenstanders stellen dat het IOM noch de auteurs van de MPS uitleggen hoe zij precies aan die cijfers komen374; dat veel van die vermijdbare sterfgevallen zich voordoen bij mensen die anders sowieso op korte termijn gestorven zouden zijn – wat de auteurs van de MPS ook vermeldden350 –, en, dat een cijfer zoals 100.000 ziekenhuissterfgevallen toe te schrijven is aan outlieropinie en de geringe betrouwbaarheid van een impliciet review door een arts.279;375-378 Laten we hierbij opmerken dat de auteurs van de MPS zelf ook aangeven dat het aantal opgegeven sterfgevallen in economisch opzicht niet vergelijkbaar is met hetzelfde aantal sterfgevallen bij verkeersongevallen waar de slachtoffers over het algemeen jonger en gezonder zijn.350 Uit een andere studie bleek dat een beoordelaarovereenkomst met een intraclass correlation coefficient (ICC) van 0,34 – in de MPS studie bedroeg de ICC slechts 0,24 - een beperkende factor is. Dergelijk ICC geeft aan dat wanneer de eerste beoordelaar een overlijden bestempelt als “zeker, of waarschijnlijk het gevolg van een medische fout”, de tweede beoordelaar dit overlijden zou bestempelen als “zeker niet” met een waarschijnlijkheid van 16% voor de eerste versus 18% voor de tweede beoordelaar. Zoals voormeld bleken er zich duidelijk minder “waarschijnlijk of zeker” te voorkomen sterfgevallen voor te doen indien er rekening werd gehouden
met de
probabiliteit het ziekenhuis levend te verlaten, met de betrouwbaarheid van de beoordelaars en met de probabiliteit van drie maanden later in leven te zijn en in goede cognitieve toestand.279 Hoewel ook de opzet van deze studie zijn beperkingen heeft en dat ook terminale patiënten recht hebben op een zo kwaliteitsvol mogelijke zorg350;379;380, toch menen wij dat zij terecht de aandacht vestigt op het heikele probleem van het overeenstemming tussen verschillende beoordelaars381 en op een goede omschrijving van wat men onder “vermijdbaar” en “dood ten gevolge van een medische fout”378;382 verstaat. Verder is het duidelijk dat een juiste risicocorrectie vereist is om tot betrouwbare schattingen van het aantal sterfgevallen ten gevolge van medische fouten te komen.283;383 Tenslotte kan men aanvoeren dat mocht het gaan over 10.000 sterfgevallen per jaar in
123
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
plaats van 100.000, het nog steeds een belangrijk probleem blijft voor de volksgezondheid.384 Dit argument samen met de uitspraak van het IOM, dat een vork aangeeft van 44.000 tot 98.000 vermijdbare sterfgevallen, maken duidelijk dat de omvang van dit belangrijk probleem vooralsnog slechts zeer ruw kan geschat worden. Reeds uitgevoerde studies leggen de nadruk op een aantal behartigenswaardige feiten. Hoewel medische tijdschriften uitvoerig rapporteren en debatteren over onbedoelde uitkomsten en medische fouten284;376-385 schijnt er een kloof te bestaan tussen het kennis hebben van dergelijke feiten en de opleiding van artsen - seminaries van artsen in opleiding zijn hier nochtans een uitgelezen plek voor – waar aan dit soort problemen te weinig aandacht wordt besteed.385 Het type eigenaarschap van ziekenhuizen bleek in een studie uit de US geen verband te houden met ongelukkige voorvallen, maar wel met nalatigheid, die veel kleiner was in private en universitaire ziekenhuizen en groter in ziekenhuizen met een groot percentage minderheidspatiënten.386 Ook de invloed van leeftijd op onbedoelde uitkomsten werd meermaals bestudeerd. Bij oudere patiënten ( 65 jaar+) worden meer onbedoelde uitkomsten genoteerd.350;372;373;387 Dit zou te wijten zijn aan de grotere complexiteit van de ziektegevallen of behandelingen en aan de langere risicoblootstelling en niet aan een leeftijdsdiscriminatie.372;373;387 Tenslotte zijn fouten door verzuim meer frequent dan bedreven fouten.351 Agressieve casusopsporing via observationele en autopsie studies identificeerden schade en fouten, die zich niet in het medisch dossier bevinden.387 Een prospectieve gegevensverzameling lijkt derhalve te verkiezen boven een crosssectionele (met duidelijk minder gevallenopsporing) gelijkaardige
gevallenopsporing)
omdat
ze
of een retrospectieve (met een
beter
past
in
het
raam
van
kwaliteitsverbetering. Ze is meer geschikt (1) om artsen ervan te overtuigen dat hun fouten bijdragen tot het ontstaan van onbedoelde uitkomsten; (2) voor het bestuderen van organisatorische en menselijke factoren; en, (3) voor het meten van programma’s die een risicoreductie nastreven.371 Een laatste invalshoek betreffende acties i.v.m. “medische fouten” bestaat uit het trekken van lessen uit de pogingen om kwaliteit te verbeteren in organisaties buiten de
124
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
gezondheidszorg. Ambiguïteit en het veronachtzamen van problematische handelswijzen om toch maar de “job uitgevoerd te krijgen” zijn belangrijke en verbeterbare factoren die bijdragen tot het ontstaan van medische fouten. In deze context wordt ambiguïteit verstaan als een gebrek aan perfecte klaarheid rond (1) de doelstellingen van wat men tracht te bereiken, (2) wie verantwoordelijk is voor welke taak, (3) hoe informatie, diensten of materiaal uitgewisseld dienen te worden, en (4) hoe precies een taak moet uitgevoerd worden. Verbeteringsacties worden best “klein en simpel” opgezet. Niet het ganse systeem ineens maar wel enkele specifieke acties zoals patiënten dienen hun geneesmiddelen tijdig te krijgen, op de vereiste manier en in de vereiste dosis.388 2.3.4 Indicatoren van patiëntveiligheid De eerste aanzetten op het gebied van patiëntveiligheid, die in de US gegeven werden, waren niet erg hoopgevend. In een belangrijke studie werd het Complications Screening Program (CSP) toegepast op administratieve gegevens met als bedoeling op een geautomatiseerde manier ondermaatse zorg op te sporen.177;258In tegenstelling tot andere gelijkaardige programma’s, beperkt het zich niet tot de complicatiecodes (ICD-9-CM: 996-999), wat een aansporing kan betekenen voor niet-invulling, maar bevat 28 “screens” over heel de classificatie. De door het programma geflagde gevallen werden op twee manieren onderzocht: een review van de gevallen door verpleegkundigen aan de hand van expliciete criteria177en een review door artsen op een aselecte steekproef van geflagde gevallen258. Uit de eerste studie kon niet besloten worden dat het CSP enig screeningsvermogen had waar uit de tweede bleek dat de geflagde gevallen een duidelijk hogere proportie kwaliteitsproblemen vertoonde dan de niet-geflagde. De predictieve waarde van de geflagde gevallen was duidelijke hoger voor chirurgische dan voor medische gevallen. De auteurs, waaronder er een aantal ook auteurs waren van het eerste artikel waarnaar verwezen wordt, besluiten dat voor sommige types van verwikkelingen het CSP op nuttige wijze gevallen kan identificeren ten behoeve van een artsen review.258 Ondanks deze eerste ervaringen, de codeerproblemen en de beperkte klinische details, stellen ander auteurs dat indicatoren van patiëntveiligheid (PSI) gegenereerd op basis van administratieve gegevens gebruikt kunnen worden als een “screen” voor potentiële
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
125
problemen, die verder onderzoek verrechtvaardigen.290 Het is dan, gegeven hun beperkingen, wel belangrijk hun toepassingsgebied duidelijk te omschrijven. Naast hun screeningsfunctie komen ze verder in aanmerking voor epidemiologisch onderzoek naar de incidentie, de gevolgen van en factoren die verband houden met medische schadegevallen.290;389PSIs kunnen ook gebruikt worden als instrumenten voor screening op lokaal en nationaal vlak.290Verder onderzoek is nochtans vereist om te bepalen of en onder welke omstandigheden ze op een valide manier kunnen gebruikt worden voor een vergelijking tussen ziekenhuizen.290 Wellicht zal informatie technologie toelaten om via elektronische screens, toegepast op elektronische patiëntengegevens, een betere voorspellende waarde te bekomen dan die we nu kennen.292 Toch kunnen administratieve gegevens reeds nu nuttig zijn voor het opsporen van onbedoelde uitkomsten. Het bestaan van conflicterende gegevens in hetzelfde record kunnen een aanwijzing vormen, zoals bijvoorbeeld een acuut myocardinfarct bij een patiënt met een urineweg infectie als opnamediagnose.292 Dergelijke benaderingen zijn een efficiënt en relatief goedkoop alternatief voor de huidige, spontane rapportering van onbedoelde uitkomsten, die slechts een klein aantal van die uitkomsten identificeert.390 Zij bieden ook het voordeel dat ze op reeds bestaande gegevens kunnen toegepast worden en zo een minder vertekende indruk kunnen geven van een eventuele evolutie.390Dit zou echter een groter risico voor rechtszaken met zich kunnen meebrengen al hoeft dit niet zo te zijn indien wetgeving en regelgeving een betere bescherming zouden bieden aan gezondheidszorgdiensten.390;391
2.4 HET ONTSLUITEN VAN KWALITEITSINDICATOREN. Na door middel van kwaliteitsindicatoren eventuele kwaliteitsproblemen gescreend gescreend te hebben en het daaropvolgende onderzoek te hebben uitgevoerd stelt zich de vraag wat met de resultaten van het onderzoek moet gebeuren. Kwaliteitsprogramma’s gebaseerd op indicatoren omspannen een breed methodologisch gamma van manieren waarop deze vraag beantwoord kan worden, gaande van “Profielen” tot “Collaborative peer education”, gebaseerd op de filosofie van de voortdurende kwaliteitsverbetering (Continuous Quality Improvement) .392
126
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
Het gebruik van administratieve gegevens is de invalshoek waarop in de volgende paragrafen op deze vraag nader wordt ingegaan 2.4.1 De publiekelijke ontsluiting van kwaliteitsindicatoren: reacties van zorgverleners, consumenten, verzekeraars en ziekenhuisdirecties. “The people and communities who depend on health care have a right to know how good that care is. The organizations that arrange and provide that care have a duty to tell them”.393 De publiekelijke ontsluiting van kwaliteitsgegevens door een overheid of instelling is een belangrijk concept. Een beproefde vorm hiervan zijn de “profielen”. De methode bestaat erin ziekenhuizen in volgorde te rangschikken volgens de resultaten van een meting, bijvoorbeeld het postoperatieve sterftecijfer bij CABG, en de rangen vervolgens onder vorm van een profiel weer te geven. Het is duidelijk dat dergelijke profielen op een zeer begrijpelijke manier een keuzemogelijkheid aanreiken aan onder meer consumenten, verzekeraars, peer review, verzekeringsinstellingen en overheid om in één oogopslag de prestaties te beoordelen en uit te maken wie “beter” of “slechter” scoort dan het “gemiddelde”.394-396
“Informatie over ziekenhuisperformance, professionele beoefenaars van gezondheidszorg, en gezondheidszorgorganisaties zijn in de US al meer dan een decennium publiekelijk vrijgegeven. De te verwachten winst van deze onthullingen werd nooit duidelijk gemaakt, en zowel de voordelen als de potentiële risico’s kregen slechts minimale empirische aandacht. Het blijkt dan ook moeilijk te oordelen of de voordelen van publiekelijke ontsluiting opwegen tegen de nadelen”.397 De meest gangbare verwachting is dat de publicatie van uitkomsten de zorgverleners wel degelijk motiveert en verder, in een context van markteconomie, een geïnformeerde consumentenkeuze toelaat, waarbij voor betere kwaliteit gekozen wordt. Als gevolg hiervan zouden minder kwaliteitsvolle zorgverleners verdwijnen of hun kwaliteit verbeteren.397-403
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
127
Dit uitgangspunt berust op een dubbele veronderstelling: zorgprocessen en -uitkomsten kunnen gemeten worden én de variaties in deze metingen zijn een teken van variatie in kwaliteitszorg.401 Andere elementen voor de motivering van het gebruik van profielen zijn: het bevorderen van het verantwoording afleggen door de zorgverstrekkers en de systeembewakers aan de gemeenschap; kwaliteitsverbetering te bevorderen, onder meer door het identificeren van “benchmarks” voor zorg; het bevorderen van een regelgeving, gebaseerd op valide informatie; en, te helpen bij het afsluiten van doeltreffende verzekeringsovereenkomsten tussen verzekeraars en zorgverstrekkers.286;400;401;403;404 Weinigen zullen het met deze doelstellingen oneens zijn, maar gegeven de kwaliteit van de gegevens die gepubliceerd worden en de belangen die op het spel staan voor zowel de consument (kwaliteitsvolle zorgen) als de zorgverlener (goede naam, financiële belangen, werkvoorwaarden en werkgelegenheid), is het belangrijk het openbaar maken van zorggegevens op een correcte en begrijpbare manier te organiseren.72;301;394;398;405-408 Het sterkste argument ten voordele van de profielen is dat het een van de weinige middelen is waarover de systeemregulatoren beschikken voor het monitoren van en het bekomen van aansprakelijkheid van de zorgverleners. Vastgestelde belangrijke afwijkingen zouden dan gebruikt kunnen worden als vertrekpunt voor verder onderzoek. Maar dit werd vooralsnog te zelden doorgevoerd.394 Verder leerde ervaring dat het gebruik van performancegegevens bij interne audit niet leidde tot de verhoopte kwaliteitsverbetering, al hoopte men dat het publiceren van dergelijke informatie door een verhoogde gevoeligheid voor de eigen performance dit wel zou verwezenlijken.400 De klaarblijkelijke successen, die door zijn voorstanders aan het profileringsysteem worden toegeschreven, zoals een terugdringen van sterftecijfers bij CABG over het geheel der ziekenhuizen en nog meer in het terciel met de hoogste sterftecijfers, zijn niet noodzakelijk het gevolg van het openbaar maken van ziekenhuiscijfers.392 Alleen het feit van gegevens te verzamelen kan immers ziekenhuizen stimuleren om zich toe te leggen op het verbeteren van uitkomsten en kwaliteit, lang voor dergelijke gegevens naar het publiek
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
128
toe worden vrijgegeven.392 De grote verlooptijd tussen gegevensverzameling en publicatie, zeker als het over individuele chirurgen gaat, maken het moeilijk een direct, causaal verband
te
leggen
ziekenhuissterfte.392;409
tussen
publicatie
Ondertussen
doen
en er
daaropvolgende zich
verbeteringen
wijzigingen
voor
in
in het
ziekenhuispersoneel; treden er veranderingen op in interne processen en worden er structurele veranderingen doorgevoerd; worden er nieuwe patiëntengroepen behandeld; en evolueert de techniek op gebied van diagnose en behandeling.392 Zo kunnen de verbeterde CABG mortaliteitcijfers grotendeels toegeschreven worden aan de veralgemeende ontwikkeling van interne kwaliteitsprogramma’s van ziekenhuizen met onder meer het onderkennen en corrigeren van suboptimale processen zoals het preoperatief stabiliseren van niet-stabiele angina en standaardisatie van operatieve technieken.392 Verder dient er rekening gehouden te worden met een verbetering van deze sterftecijfers over het ganse land ook in staten waar geen profielen gebruikt worden. Zo was bijvoorbeeld de verbetering in Massachussets (geen profielen, noch enig specifiek kwaliteitsbevorderend programma) identiek met die van New York (wel profielen). De proportionele, risicogecorrigeerde verbetering van de CABG sterftecijfers van de staat New York werden alleen geëvenaard door die van New England, waar er een agressieve maar volledig confidentiële CQI benadering plaatsvond.392;410 Shahian et al. besluiten: “Deze vaststelling suggereert dat het opzetten van een formeel kwaliteitsbevorderend proces de sleutel is, ongeacht of het over een publieke of een confidentiële inspanning gaat.”392 Andere auteurs menen dat er toch enige verbeteringen in gezondheidszorg gestimuleerd werden door het openbaar maken van kwaliteitsindicatoren397;400;402 en dit waarschijnlijk door het onthullen van ondermaatse praktijken aan organisatiemanagers.402 Zo stelde men voor de periode 1996-1999 bijvoorbeeld vast dat de inentingsgraad voor varicella en voor mazelen, dikoor en rubella respectievelijk van 40% tot 64%, en van 52% tot 59% opliepen en dat bij patiënten met een acuut myocardinfarct het toedienen van β-blockers van 62% naar 85% steeg.402 Maar de afwezigheid van een controlegroep, met name een groep niet blootgesteld aan openbare rapportering, blijft een zwakte voor deze stelling.402 Nochtans toonde een meta-analyse van gerandomiseeerde klinische studies van profielen een
129
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
significant positief effect aan op het gebruik van zorgen maar met een minimaal klinisch belang.273 Toch is dit instrument gevaarlijk en dit om verscheidene redenen. Het houdt geen rekening met de stochastische variabiliteit, die zeer uitgesproken kan zijn wanneer het gaat over zeer kleine aantallen zoals bij postoperatieve mortaliteit, wat niet alleen hoge of lage puntschatters oplevert voor “normale” ziekenhuizen maar anderzijds vaak te weinig statistische power heeft om slecht presterende ziekenhuizen te identificeren.407 Verder – ook al worden er betrouwbaarheidsintervallen rond de puntschatters gebouwd – impliceren profielen een rangorde, die zeer misleidend kan zijn (zie hoofdstuk 3).396 Vermits er bij het opstellen van profielen er steeds een “eerste” en een “laatste” zijn, ook al is het verschil klinisch en of statistisch niet significant, kan dit, zeker indien er geen rekening gehouden wordt
met
stigmatiseren.
case
mix,
een
ziekenhuis
of
een
arts
ten
onrechte
77;191;296;394;395;405;407;411
Daar profielen gebaseerd zijn op gecomputerizeerde gegevens dient men een onderscheid te maken tussen reële kwaliteitsproblemen en artefacten ten gevolge van de gebrekkige kwaliteit van de gegevens, wat er bijvoorbeeld de Health Care Financing Administration toe leidde de in 1988 aangekondigde plannen voor het publiceren van de rangordening van artsenspecifieke uitkomstgegevens al in 1993 stop te zetten wegens de beperkte gegevenskwaliteit.275 We verwijzen hier verder naar het onderhoofdstuk over risicocorrectie waar de kwaliteit van de gegevens als belemmerende factor voor een goede risicocorrectie uitvoerig besproken werd. Ook bevat dit soort gegevens geen informatie over eventuele voorkeur van artsen en patiënten voor een chirurgische behandeling boven een alternatieve medische behandeling, wat eveneens een weerslag heeft op een chirurgische mortaliteit.275;412 Het vermijden van hoogrisicopatiënten – de mensen die de behandeling het meest nodig hebben en er het meest baat bij ondervinden – te behandelen, ook “cherry picking”296 of “skimming”413 274;392;403
profielen.
genaamd,
is
een
potentieel
ongewenste
nevenwerking
van
Waar de empirische evidentie suggereert dat afdoende risicocorrectie
voldoende waarborg biedt aan de chirurg om dit type patiënt te behandelen, bestaat er
130
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
tegenstrijdige evidentie over het al dan niet meespelen van het “cherry picking” fenomeen in de vermindering van het CABG-sterftecijfer van de staat New York191;392;410 percipiëren chirurgen het behandelen van hoogrisico patiënten als een gevaar voor hun carrière; en, rapporteren cardiologen dat het moeilijk is een chirurg te vinden voor dergelijke patiënten.344 Verder werd vastgesteld dat hoogrisico CABG-kandidaten minder vaak de geëigende behandeling krijgen dan gelijkaardige hoogrisicopatiënten met aorta dissectie.392 Ook voor diabetes werd het potentieel voor “cherry picking” aangetoond en werd de onbetrouwbaarheid van profielen van individuele artsen zowel voor het beoordelen van de kwaliteit als de kosten van een diabetesbehandeling aangetoond.329 Om “cherry picking” te ontmoedigen werden een aantal oplossingen voorgesteld: het maken van specifieke rapporten voor hoogrisico patiënten, wat echter het probleem van de kleine aantallen verergert; het uitsluiten van dit type patiënten uit de profielen – maar dit soort patiënten zijn vaak het meest leerrijk in het kader van kwaliteitsverbetering –, en, naast sterftecijfers, ook andere eindpunten voor kwaliteitsbeoordeling te gebruiken.392 “Gaming”, een andere nevenwerking van profielen, tracht op kunstmatige wijze de performance te verbeteren. Hieronder worden onder meer volgende technieken verstaan: het opwaarderen van preoperatieve co-morbiditeit; het veranderen van de ingreepklasse; en, het transfereren van postoperatieve patiënten in kritieke toestand naar een andere verzorgingsinstelling.77;83;191;274;296;301;338;354;392;394;402;403 Zo werden er om de vermindering van de CABG sterfte in New York te beschrijven twee componenten onderscheiden: enerzijds een vermindering van de waargenomen sterfte en anderzijds een verhoging van de verwachte sterfte. Deze laatste bleek vooral het gevolg van een stijging in het coderen van risicofactoren zoals preoperatief nierfalen, hartinsufficiëntie, COLD, niet-stabiele angina en kleine ejectiefractie.191 Ook in andere staten werden gelijkaardige fenomenen vastgesteld.392 Het veranderen van een ingreepklasse naar een andere, die eventueel niet in het profielen systeem voorzien is, zoals bijvoorbeeld die van een CABG in een geval van een ischemische mitralis regurgitatie, met een “grijze zone” regurgitatie die niet imperatief een ingreep vereist, naar een CABG-mitralisklep herstelling door het aanbrengen van enkele commissuurhechtingen, is vrij eenvoudig. Zij realiseert daarenboven een optimalisatie van zowel de CABG-cijfers als de CABG-mitralisklep herstellingcijfers door het herklasseren
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
131
van een geval met een mindere gunstige prognose uit de CABG-klasse in de CABGmitralis herstelling klasse waar ditzelfde geval een relatief gunstigere prognose heeft.392;412 Om deze “grijze zone” transacties tegen te gaan wordt voorgesteld de mortaliteit voor het ganse spectrum van de ziekte te rapporteren ook al verschillen de ingrepen uitgevoerd voor de subgroepen ervan.412 Meer algemeen gesteld heeft een lage chirurgische mortaliteit slechts betekenis wanneer zij gerapporteerd wordt voor de ganse bevolking met inbegrip van hen die geen ingreep ondergingen.412 De laatste vorm van gaming, namelijk het transfereren naar een andere verzorgingsinstelling van patiënten in een kritieke toestand wordt in de hand gewerkt doordat vaak sterftegevallen in andere verzorgingsinstellingen niet in verband gebracht (kunnen) worden met de indexingreep. Het verzamelen van uitkomstgegevens voor alle patiënten op een vastgesteld ogenblik, zoals een dertig dagen mortaliteit, en dit ongeacht een eventuele transfer, kan hiervoor een oplossing betekenen.392 Toch bestaan er naast upcoding andere deelverklaringen voor de stijging van gecodeerde risicofactoren en met name een verfijning van definities en initiële onderraportering354, wat niet wegneemt dat een zekere graad van upcoding ten gevolge van publiekelijke vrijgave van profielen waarschijnlijk is392. Het opstellen van zo eenduidig mogelijke definities, het trainen van gegevensabstraheerders en het aselect uitvoeren van externe audits om de accuratesse van de gegevens te bewaken worden aanbevolen om upcoding tegen te gaan.392 Uit de opgedane ervaring in de US blijkt dat consumenten en zorgverzekeraars erg uiteenlopende vragen stellen in verband met kwaliteitsinformatie, vaak de rapporten niet begrijpen en er relatief weinig gebruik van maken.397;398;400;402 Consumentenenquêtes leren dat minder dan 50% van de Amerikanen gelooft dat er grote kwaliteitsverschillen bestaan tussen ziekenhuizen, huisartsen en gezondheidsplannen; dat minder dan 1/3 gelooft dat er grote verschillen bestaan tussen specialisten; en dat minder dan 1/3 rapporteert enige kwaliteitsinformatie rond gezondheidszorg gezien te hebben.402In Pennsylvania, de staat die een voortrekkersrol gespeeld heeft op gebied van openbare ontsluiting van performance-indicatoren met sterftegegevens op individueel ziekenhuis- en artsenniveau315;414 en waar de overheid voor een extensieve verspreiding van die gegevens
132
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
zorgde, leverde een patiëntenenquête volgende resultaten op: < 20% waren op de hoogte van het bestaan van sterftegegevens, < 12% bekeek ze voor een ingreep, en < 1% meldde dat die informatie hen van arts of ziekenhuis deed veranderen.402 Verder verwijten de consumenten aan de profielen 1) dat ze teveel informatie bevatten, die niet genoeg aangeeft hoe ermee moet omgesprongen worden, 2) dat ze geen prijsinformatie bevatten, 3) dat het moeilijk is deze informatie te verzamelen en zorgverleners te vergelijken, en 4) dat de informatie te weinig in het oog springt.402Gelijkaardige bevindingen werden bij consumenten vastgesteld wanneer het ging over verschillen tussen een systeem gebaseerd op terugbetaling per prestatie (fee for service) versus een vast periodisch bedrag per patiënt (“capitation”) en die konden kiezen tussen beide systemen: ongeveer 30% van de ondervraagden wisten bijna niets over Health Maintenance Organisations322, die werken met een vast periodisch bedrag, en 41% van de overigen wist er duidelijk veel te weinig over.415 Tenslotte lijken bij consumenten quantitatieve gegevens minder zwaar te wegen dan persoonlijke ervaring, zoals de aanbevelingen van vertrouwde zorgverleners, informele netwerken en aanbevelingen van familieleden en vrienden.309;397;400;402 Het lijkt derhalve weinig waarschijnlijk dat de “slapende reus” van de consumentenkeuze zal ontwaken.402 Vaak gebruiken zorgverzekeraars dit soort informatie niet op een zinvolle manier. In tegenspraak met de conventionele markteconomische theorie, domineerden enkele plannen met de slechtste resultaten op gebied van consumentensatisfactie de markt. Andere dan kwaliteitsbeschouwingen spelen hierbij een rol: snelle uitbetaling in geval van claims, netwerken, lage prijzen, en het niet verplicht karakter van de performance van de gezondheidsplannen (21 op de 54 van die plannen gaven geen gegevens vrij en scoorden significant slechter dan de andere).402 Kleine werkgevers ( < 50 werknemers) vertegenwoordigen 96% van de US arbeidsmarkt. Bij hen komen kwaliteitszorg en accreditatie op de vijfde en zesde plaats op de zes factoren, die beschouwd werden voor de aankoop van een verzekering voor hun werknemers, na prijs, voordelenpakket en beschikbaarheid van de artsen.402
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
133
De rol van de media lijkt vrij beperkt: de mensen schijnen weinig rekening te houden met de ziekenhuisrangen en media krijgen meer reacties vanwege ziekenhuizen en gezondheidssystemen dan vanwege consumenten.402 Artsen staan sceptisch ten opzichte van profielen en maken er weinig gebruik van bijvoorbeeld bij verwijzing van patiënten, hoewel een studie vaststelde dat huisartsen rekening houden met de geboden kwaliteit bij een verwijzing.283;309;344;397;400;402;407 In een studie in Schotland bleek dat de redenen voor de geringe impact van publiekelijke ontsluiting op artsen de volgende waren: de geloofwaardigheid van de indicator omwille van de kwaliteit van de gebruikte gegevens, de grote tijdsspanne tussen de feiten en de publicatie ervan, de geringe doorstroming van de indicatoren naar alle leden van de ziekenhuisstaf, gebrek aan vorming over het gebruik van en interpretatie van kwaliteitsindicatoren en het afwezig zijn van een verantwoordelijke voor het begeleiden van het gebruikmaken van de indicatoren, het ontbreken van een formeel systeem van performance beoordeling waaraan een stimulans verbonden is, het belang van bijkomende informele informatie via professionele netwerken die belangrijker leken dan “laattijdige” indicatoren, procesindicatoren worden verkozen boven uitkomstindicatoren, de geringe externe aansprakelijkheid vanwege patiënten, vertegenwoordigers van patiënten en gezondheidsdiensten.416 In tegenstelling met deze relatieve inertie bij artsen bleken kwaliteitsrapporten in Ontario wel tot kwaliteitsverbeterende initiatieven aanleiding te geven in veel ziekenhuizen.298 Ziekenhuizendirecties reageren immers wel op dit soort informatie, zij het op uiteenlopende wijze: ofwel op een negatieve en defensieve manier door het rapport te bekritiseren, ofwel door een concrete kwaliteitsverbetering en men stelt vast dat de weerstand van zorgverleners t.o.v. profielen in de VS toeneemt.397;400;402In Canada schijnt de afkeer voor profielen veel minder uitgesproken te zijn, maar worden ze vooral als nuttig beschouwd wanneer het over procesindicatoren gaat.298 Er werden pogingen ondernomen om aan de nadelen van profielen te verhelpen. Een betere en tevens meer gebruiksvriendelijke benadering komt uit de industriële wereld, namelijk de “control chart”.394;417-420 Bij deze benadering, die afgeleid is van de statistische
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
134
procescontrole, beschouwt men de performance van ziekenhuizen als één industrieel proces waarvan men aanneemt dat het homogeen is, wat niet uitsluit dat er zelfs in het meest perfect opererend systeem onvermijdelijk enige variabiliteit optreedt in het eindproduct.394;420
In
tegenstelling
tot
de
“league
tables”,
die
een
95%
betrouwbaarheidsinterval gebruiken voor de individuele zorgverstrekker en wat leidt tot het beschouwen als outlier van 1 op 20 zorgverleners, wordt hier een gemiddelde berekend en twee controle limieten, die er 3 σ van verwijderd zijn, wat leidt tot een interval dat 99.7% der observaties bevat in geval van een normaal verdeling.421 Verder suggereert deze manier van voorstellen geen rangen, al worden outliers wel in beeld gebracht en is de methode die voor het bepalen van outliers gebruikt wordt (zij houdt geen rekening met correlaties) niet helemaal correct. Hoewel conceptueel erg aanlokkelijk, toch lijkt ons deze benadering enigszins gewaagd. In de industriële setting gaat het immers over een proces dat zich afspeelt in een tijdsperspectief, wat hier duidelijk niet het geval is vermits het ziekenhuisuitkomsten op een bepaald ogenblik vergelijkt. Wij werkten zelf een alternatieve aanpak uit (Zie hoofdstuk 3). We wensen hier enkele woorden te wijden aan het probleem van het profileren van individuele artsen omdat hier de nadelen van profielen maximaal uitvergroot worden. Hofer et al.329trokken uit een profielenstudie m.b.t. bloedwaarden (HbA1c-spiegel) bij diabetici in een huisartsensetting een aantal belangrijke conclusies. Vooreerst dienen de makers van profielen een realistischer beoordeling te maken van de betrouwbaarheid van hun methoden, die vooralsnog niet in staat bleken echte verschillen in praktijkvoering op een betrouwbare manier aan te tonen. Vervolgens dient de case mix geoptimaliseerd te worden - correctie voor leeftijd en geslacht is amper beter dan helemaal geen correctie – en dienen er genoeg observaties per zorgverlener en genoeg zorgverleners te zijn om de echte betrouwbaarheid van hun meting te schatten. Tenslotte moet men er zich van bewust te zijn dat de toepassing van profielen gaming kan uitlokken (het “verwijderen” van 1 tot 3 van de zwaarste gevallen is voldoende om een outlier status om te buigen naar een inlier status) en dat dit fenomeen de meest zieke en meest kwetsbare patiënten treft.329 Of de bestaande evidentie voor of tegen publiekelijke ontsluiting pleit, is open voor debat. Voorstanders focussen op de kleine maar significante winst, die geboekt werd, stellen dat
135
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
traditionele methoden onvoldoende subtiele veranderingen meten en dat de voornaamste impact zich pas over jaren zal laten voelen. Tegenstanders concentreren zich op de negatieve bevindingen en op de kleine winst in verhouding tot de belangrijke investering in tijd en middelen.397 Concluderend kan men stellen dat een toenemende graad van publiekelijke ontsluiting van gezondheidszorg performance gegevens onvermijdbaar is en de grotere vraag naar informatie en aansprakelijkheid in alle levensdomeinen weerspiegelt.397;422 Men mag aannemen dat het gebruik van dergelijke gegevens door de consumenten en zorgenkopers of voor reguleringsdoeleinden relatief minder belangrijk zal zijn dan als een katalysator om interne kwaliteit te stimuleren en te bevorderen bij zorgverleners.397 2.4.2 Continuous Quality Improvement (CQI). In tegenstelling met profielen legt CQI de klemtoon op proces en systeemverbetering veeleer dan op de opsporing en rapportering van outliers, waarvan het de onbedoelde negatieve consequenties, voornamelijk het niet uitvoeren van ingrepen bij de hoogrisico patiënten en “gaming” zoekt te vermijden.392 Verder is het onrealistisch eerlijk zelfonderzoek te verwachten onder de bedreiging van publiekelijke ontsluiting.392 De CQIbenadering wordt dan ook als volgt omschreven
“... CQI maakt gebruik van
samenwerking, uitwisselingsbezoeken in een niet-bedreigende sfeer, en vaststelling van de beste praktijken om de kwaliteit te verhogen en de variabiliteit onder de samenwerkende instellingen te verbeteren”.392 In New England heeft CQI een werkelijke kwaliteitsverbetering teweeg gebracht. Vraag is echter in welke mate deze specifieke setting, gekenmerkt door vrijwillige deelname en geringe competitie onder de deelnemers, veralgemeenbaar is naar een nationale setting met competitie onder de deelnemers.392 2.4.3 Hybriede vormen CQI, hoe aantrekkelijk
ook
aansprakelijkheidsprincipe.
Vandaar
als
systeem, dat
er
voldoet
gezocht
echter
wordt
naar
niet
aan
het
vormen
van
kwaliteitsborging, die wel aan deze basisvereiste beantwoorden zonder de voordelen van CQI te verliezen noch in de nadelen van profielen te delen.392
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
136
Hybriede vormen, die een CQI benadering combineren met een basis report card, kunnen misschien het beste compromis zijn.392 Zo stellen Topol en Califf274, en Califf et al.289 een benadering voor, die wellicht minder tot misinterpretatie zou leiden dan bij profielen. Zij zou erin bestaan een aanvaardbare spreidingsbreedte van de uitkomst te definiëren en alleen tot publiceren van specifieke puntschatters over te gaan indien de waargenomen waarde voor een arts of een instelling buiten deze spreidingsbreedte ligt of wanneer de geobserveerde verschillen statistisch significant zijn en na bevestiging van de outlier status door een adequaat peer review. Dezelfde auteurs bepleiten verder dat cardiologen en hartchirurgen ook een vermelding maken op het formulier van de geïnformeerde toestemming van het risicoprofiel en de uitkomstcijfers in hun patiëntenpraktijk, met 95% betrouwbaarheidsintervallen, én gecertificeerd door een onafhankelijke peer review groep.274;289 Naast een adequate risicocorrectie zou de uitkomstenbeoordeling ook baat vinden bij een meer volledige registratie namelijk vanaf de verwijzing voor hartchirurgie en voor een langere follow-up. Dit zou het mogelijk maken “skimming” op te sporen en de langere termijn uitkomsten in rekening te brengen.289 Aangepaste statistische modellen kunnen hierbij nuttig zijn. Bayesiaanse hiërarchische modellen laten toe bij profielen een grenswaarde te kiezen, die niet op probabiliteiten of op een vergelijking met de gemiddelde performance van de zorgverleners berust maar op een standaard gebaseerd op een aanvaardbare medische praktijkvoering en op kost en nut voor het publiek.423 Een alternatief voor de “aanvaardbare” praktijkvoering kan de “beste” praktijkvoering zijn wat overeenkomt met de twintigste percentiel.403 2.4.4 Slotbeschouwingen rond het ontsluiten van kwaliteitsgegevens De ervaring uit de US leert dat een of andere vorm van publiekelijke ontsluiting van perfomancegegevens in de zorgensector waarschijnlijk onvermijdbaar is.397;400 Ze is overigens wenselijk in een context van kostenbeheersing, waar alléén de kosten zouden bepalen
welke
artsen
bepaalde
ingrepen
zouden
uitvoeren
zonder
enige
424
kwaliteitsoverweging als inbreng bij de beslissing. Deze
ervaring
suggereert
verder
dat
gesofisticeerde
kwaliteitsmetingen
en
rapporteringsystemen niet geleid hebben tot de consumentenkeuzes zoals ze te verwachten waren in een context van markteconomie, waarbij voor betere kwaliteit gekozen wordt
137
Hoofdstuk 2: Gebruik van administratieve gegevensbanken met het verdwijnen van minder kwaliteitsvolle zorgverstrekkers als gevolg of
het
verbeteren van hun kwaliteit.402 Verder dienen we er ons bewust van te zijn “dat het gezondheidszorgsysteem zich gewoonweg de kosten niet kan veroorloven van een voldoende encyclopedische set van kwaliteitsmaten te maken, die beantwoordt aan de noden van iedere patiënt en dat voor alle aandoeningen.”402 Waarschijnlijk hebben we het einde bereikt van de inspanningen om de presentatieformaten van kwaliteitsinformatie te verbeteren en is het verspreiden de te nemen horde.402 Zorgverleners kunnen immers gemakkelijk informatie die hen ‘bijt’ ondermijnen, consumenten hebben waarschijnlijk tijd noch zin om de nodige inzichtingen te verwerven en internet is hiervoor geen oplossing want consumenten interesseren zich voor ziekten en behandelingen niet voor kwaliteit.402 We dienen echter beter te weten welk type van informatie consumenten en verzekeraars nodig hebben en kunnen gebruiken. 397;400;402Het meten van kwaliteit dient verder te gaan maar de resultaten moeten bij voorkeur naar organisaties gaan, zoals de National Committee for Quality Assurance (NCQA).402 Op een aantal fundamentele vragen moet een antwoord verschaft worden zoals op de te gebruiken types van indicatoren (proces en/of uitkomst), de vereiste graad van risicocorrectie nodig om faire en betekenisvolle vergelijkingen te maken, hoe de informatie verspreiden en hoe de nevenwerkingen best op te vangen.400 Dit veronderstelt enerzijds een evenwichtige afweging van wetenschappelijke rigorisme, dogma en gezond verstand,
maar
ook
een
aanvaarding
door
de
professionele
beoefenaar
van
gezondheidszorgen en de gezondheidssector.400 Het gebruik van hiërarchische modellen, inclusief een afdoende correctie voor multipele toetsing, ondervangt de meeste van de statistische en rapporteringproblemen waarmee de klassieke profileringmethoden gepaard gaan. Hun waarde is functie van de kwaliteit van het gegevensbestand, van de correcte specificatie en fit van het model.423 Naylor stelt voor vormen van op maat gesneden partnership te ontwikkelen tussen clinici, medische
centra
en
regulatoren
en
geloofwaardige
agentschappen
voor
138
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
kwaliteitsbevordering, die niet alleen de inspanningen tot kwaliteitsverbetering ondersteunen maar ook de resultaten zullen genereren, die openlijk met patiënten gedeeld worden.409 “But public disclosure of information about the quality of healthcare is a weak strategy for ensuring quality”.402 Ongunstige gevolgen zijn duidelijk belangrijk voor gezondheidszorgorganisaties, niet alleen omwille van hun impact op patiënten maar ook omdat ze inlichtingen kunnen verschaffen over de kwaliteit van de gezondheidszorg en tevens aan de clinici de kans bieden voor kwaliteitsverbetering.370 Anderzijds kan kwaliteitsverbetering niet uitsluitend gebaseerd zijn op negatieve ervaringen want dat werkt demotiverend voor de clinici en geeft een vertekend beeld van kwaliteit dat gebaseerd is op outliers, technische kwaliteit en problemen van patiëntenveiligheid.370 Verder dient men rekening te houden met een aantal belangrijke praktische problemen, zeker indien een kwantitatieve benadering gevolgd wordt: 1) het ontwikkelen van definities van onbedoelde uitkomsten die betekenisvol, betrouwbaar en valide zijn is moeilijk, 2) meestal wordt gebruik gemaakt van impliciet professioneel review dat vaak onbetrouwbaar is, en 3) de meeste van de gebruikte maatstaven werden onvoldoende uitgetest in termen van validiteit, betrouwbaarheid en veralgemeenbaarheid.370 In een optiek van kwaliteitsverbetering is het noodzakelijk dat men zich, in geval van een “ramp” zoals bij de pediatrische hartchirurgie in Bristol318;425, niet beperkt tot het individueel falen van artsen maar er zich rekenschap van geeft dat het meestal over een “organisatorische pathologie” gaat en dat de ervaring leert dat het niet gemakkelijk is systemen te veranderen.426 Dit soort problemen doet zich namelijk veelal voor in een organisatie met een zwak leiderschap, met geografische isolatie en zonder zelfevaluatie, met een gebrek aan basis management systemen en processen, met ondermaatse interne en externe communicatie, en waar de staf noch de patiënten hun bekommernis kunnen uiten.426 Ook het IOM beklemtoont dat medische fouten meestal resulteren uit fouten van het systeem niet uit die van onzorgvuldige zorgverleners. Het voorkomen van fouten en schade vereist een hertekening van het systeem niet het straffen van individuën284 of zoals Leape het stelt: “Errors result from faulty systems not from faulty people, so it is systems that must be fixed. Errors are excusable; ignoring them is not.”352
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
139
Het IOM beveelt twee types van rapportage aan: 1) een vrijwillige in geval van minimale of geen schade, en 2) een verplichte, wanneer het gaat over een sterfgeval of over een ernstige blijvende schade.284 Dergelijke aanbevelingen omzetten tot realiteit vergt een nationale inspanning.284 2.5 BESLUIT
De concepten volksgezondheid, gezondheidsdiensten en epidemiologie overlappen elkaar grotendeels waar zij erop gericht zijn de gezondheid van de ganse bevolking te bewaren, te bevorderen en te herstellen. Toch lijken er twee, los van elkaar staande werelden te bestaan: een van volksgezondheid en een andere van gezondheidsdiensten, met twee eigen informatiesystemen,
respectievelijk
volksgezondheidsinformatie
en
managementinformatie. Het is dan zaak om naar Nederlands voorbeeld de conceptuele eenheid te herstellen door te streven naar een kwaliteitsvolle volksgezondheid. Hiervoor wordt de benadering gevolgd van Donabedian, een op zeven pijlers gebaseerde globale zorgenkwaliteit bestaande uit: de maximale doeltreffendheid, de gerealiseerde doeltreffendheid, de doelmatigheid, de optimaliteit, de aanvaardbaarheid voor de patiënt, de legitimiteit ten overstaan van de maatschappij en de billijkheid. In deze visie wordt er rekening gehouden met zowel met technische aspecten als met interpersonele relaties. Na een omschrijving van wat kwaliteit is, wordt nagegaan welke van haar aspecten aan de hand van administratieve gegevens kunnen beschreven worden. Hierbij worden twee benaderingswijzen gevolgd. Een eerste benadering is gebaseerd op kwaliteitsindicatoren. Achtereenvolgens worden de types en het gebruik van kwaliteitsindicatoren besproken, en de mogelijkheden van administratieve gegevens om ondermaatse of bovenmaatse kwaliteit aan te tonen onderzocht. Een tweede benadering is deze gebaseerd op incidenten n.a.v. toegediende zorgen. Het begrip “onbedoelde uitkomst” wordt omschreven, gegevensbronnen worden vermeld, de
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
140
omvang van het fenomeen geschetst en de bruikbaarheid van administratieve gegevensbanken aangegeven. Administratieve gegevensbanken laten niet toe de kwaliteit van zorgen te meten omwille van hun inherente beperkingen, zij zijn immers alleen een neerslag van technische aspecten van zorg en zijn verder gekenmerkt door onvolledigheid en onvolmaaktheid van de gegevens. Een screening van onder- en bovenmaatse kwaliteit van zorgen lijkt wel een bruikbare werkhypothese. Op gebied van incidenten lijkt de rol van administratieve gegevens nog beperkter. In een laatste deel van het hoofdstuk wordt nagegaan hoe, in het licht van buitenlandse ervaringen, met de resultaten van de uitgevoerde screening kan omgegaan worden rekening houdend met de fundamentele plicht van aansprakelijkheid van de gescreende en van de overheid, en het fundamentele recht op persoonlijke integriteit van de gescreende. Hierbij is het duidelijk dat de aandacht uitgaat naar organisaties, naar het verbeteren van hun functioneren, en niet naar individuele artsen. Het identificeren van de inhoud en vorm van
de
informatie
ten
verzekeringsinstellingen,
behoeve is
een
van
nog
de
lopend
bevestiging/ontkenning van screeningsresultaten.
consument, proces
ziekenhuismanagers
benevens
de
wijze
en van
141 Hoofdstuk 3: Methodologische aspecten Zowel het opsporen van ziekenhuizen met een afwijkend codeergedrag als het identificeren van ziekenhuizen met een ondermaatse of bovenmaatse zorgenkwaliteit, zijn twee belangrijke onderdelen van dit proefschrift, die we verder (Hoofdstukken 4 en 5) uitvoerig zullen behandelen. Zij doen een beroep op dezelfde statistische methodologie, zij het in een totaal andere setting. Het gaat hierbij immers over het opsporen van outliers. Het leek dan ook de moeite aan deze technieken een hoofdstuk te wijden en hierin tevens de beperkingen van deze methoden en de daarop gebaseerde analyses op te nemen. Wij trachtten hierbij het aspect van de omvang van het bestudeerde fenomeen aan bod te laten komen naast het statistisch concept van significantie, vermits we hier immers vaak te maken hadden met zeer grote aantallen en derhalve gemakkelijk significant. Bij de analyse diende verder de nodige aandacht geschonken te worden aan de beperkingen eigen aan administratieve gegevens. 3.1 AUDIT: STATISTISCHE METHODOLOGIE
3.1.1 Globale beoordeling van de evolutie van het ziekenhuissysteem op gebied van ligduur en ziekte-ernst, en opsporing van afwijkende ziekenhuizen De beoordeling van de doeltreffendheid en doelmatigheid van het zorgsysteem is fundamenteel voor de beleidsonderbouwing. Het is daarbij belangrijk ziekenhuizen op te sporen, die door hun systematisch afwijkend codeergedrag deze beoordeling bemoeilijken (zie Hoofdstuk 4, Sectie 4.2). Het is verder de bedoeling deze systematisch afwijkende ziekenhuizen in geval van bewust over- of ondercoderen te bestraffen en zo de financiële motivatie voor frauduleus codeergedrag weg te nemen. Het lijkt dan ook belangrijk de statistische methodologie van de beoordeling van het ziekenhuissysteem en de opsporing van de afwijkende ziekenhuizen meer in detail te bespreken.
Hoofdstuk 3: Methodologische aspecten
142
Onze analyses bestaan uit drie verschillende onderdelen. 1) In een eerste onderdeel wordt de evolutie van het ziekenhuisgebeuren op nationaal niveau, de stabiliteit van het systeem, onder de loep genomen. Dit gebeurt door middel van een
klassieke
variantie-analyse
(van
het
type
herhaalde
metingen,
“repeated
measurements”)427 en linear mixed models428 voor continue antwoordvariabelen, en door middel van marginale modellen (Generalized Estimating Equations of GEE)
429-431
voor
categorische antwoordvariabelen. Deze modellen laten toe rekening te houden met correlatie van de gegevens. 2) In een tweede onderdeel bestuderen we de ziekenhuizen op een globale manier. Hierbij is het de bedoeling ziekenhuizen met een globaal afwijkend codeergedrag, de “outliers”, op te sporen. Vermits onze aandacht uitgaat naar het geheel der Belgische ziekenhuizen en we geïnteresseerd zijn in het identificeren van outliers, maken we gebruik van zogenaamde “fixed- effects” modellen.432;433 Hiërarchische modellen, vaak de zogenaamde “randomeffects” modellen, hadden een alternatief kunnen zijn.434 Het is echter zo dat deze modellen niet bedoeld zijn om outliers te identificeren. Verder moet de theoretische grondslag voor het vaststellen van outliers nog ontwikkeld worden voor “linear mixed” modellen en is het voor “non-linear mixed” modellen onmogelijk outliers te identificeren.434;435Herinneren we er tenslotte aan dat bij “random-effects” modellen de ziekenhuizen beschouwd worden als een aselecte steekproef uit een ruimere populatie van ziekenhuizen, wat in tegenspraak is met ons studieobject, namelijk het geheel der Belgische ziekenhuizen. Om de evolutie van het systeem te beoordelen doen we, in geval van een continue antwoordvariabele, beroep op een multivariate variantie analyse (van het type herhaalde metingen).427 Ook fitten we in een “linear mixed” model, dat rekening houdt met de correlatie van de gegevens, het verschil tussen geobserveerde en de gestandaardiseerde verblijfsduur om de stabiliteit van het systeem op te volgen. Deze benadering laat toe (1) de tijdsevolutie in zijn geheel te beoordelen en dus niet door middel van een paarsgewijze vergelijking van de jaargemiddelden, (2) rekening te houden met de correlatie die tussen de herhaalde metingen bestaat, en (3) afwijkende ziekenhuizen te identificeren. We modelleren het (gewogen) verschil tussen de geobserveerde en gestandaardiseerde
40BHoofdstuk 3: Methodologische aspecten
143
gemiddelde verblijfsduur omdat ze gemakkelijk kunnen vertaald worden in een statistisch model en verder omdat ze op een gemakkelijker interpreteerbare manier grafisch kunnen weergegeven worden dan een gelijktijdige vergelijking van twee curven per ziekenhuis voor een geheel van 114 ziekenhuizen. Een zelfde multivariate variantie analyse (van het type herhaalde metingen), ditmaal uitgebreid met een interactie term tussen een lineaire tijdstrend en de individuele ziekenhuizen, wordt uitgevoerd om ziekenhuizen met een abnormaal codeergedrag te identificeren. Meer precies vergelijken we de “slope” van de tijdstrend van elk ziekenhuis met die van alle ziekenhuizen (de “nationale trend”) door middel van lineaire contrasten.117;427;436 Ook deden we beroep op de Mahalanobis437-440 afstand [een probabilistische afstand tussen twee punten (t.t.z. rekening houdend met verschillen in variantie en correlatie tussen twee variabelen) in een multivariate context], om “outlying” ziekenhuizen op te sporen. De Mahalanobis-afstand is verwant met een z score [z = (xμ)/σ] in het kwadraat, waarbij x de waarde voor het bestudeerde ziekenhuis is, μ de gemiddelde ziekenhuiswaarde en σ de standaardafwijking van de ziekenhuiswaarden. In geval van een categorische antwoordvariabele maken we gebruik van de logistische regressie waarbij de ratio van het aantal gevallen / aantal verblijven, de antwoordvariabele vormt en waarbij de tijdsevolutie wordt weergegeven door een variabele die het jaar of het semester van de waarneming weergeeft. Ook hier wordt de tijdsevolutie in zijn geheel geanalyseerd. Deze benadering laat verder de opsporing toe van eventueel afwijkende ziekenhuizen door de interactie tussen tijdsevolutie en individueel ziekenhuis versus het nationale gemiddelde na te gaan. De analyse gebeurt op “globale” indicatoren zoals ligduur (LOS), Severity of Illness (SOI),
Comorbiditeit, en outliers op gebied van
financiering (zie hoofdstuk 4). De eerste twee onderdelen vormen samen de analyse op macroniveau. 3) In een derde onderdeel, het microniveau, gaan we gericht te werk. Indien een ziekenhuis op macroniveau een outlier is, wordt zijn codeergedrag bestudeerd op een aantal pathologieën, ingrepen of behandelingen, de zogenaamde “knipperlichten” waarvan
144
Hoofdstuk 3: Methodologische aspecten
aangenomen wordt dat zij zich gemakkelijk lenen tot lucratief overcoderen. Ook hiervoor maken we gebruik van de logistische regressie met als bedoeling na te gaan of de globaal afwijkende ziekenhuizen voor een bepaald knipperlicht een duidelijk afwijkend patroon vertonen. In statistische termen wordt dit uitgedrukt door het nagaan van een significante interactieterm tussen de tijdstrend en de individuele ziekenhuizen (via het gebruik van contrasten). Bij de analyse dient er een correctie te gebeuren voor de tijdscorrelatie en voor het meervoudig gelijktijdig toetsen (zie 3.3.3).313;438 3.1.2 Trend en interactie Elke modellering tracht een goede fit te bereiken en zo eenvoudig mogelijk de relatie tussen de antwoordvariabele en het geheel van verklarende variabelen te beschrijven. Het meest gewone voorbeeld van modellering is de lineaire regressie, waarvan de uitkomst variabele verondersteld wordt continu te zijn. Laten we trachten het begrip trend in deze regressiecontext te verduidelijken. Voor ieder probleem, dat men aan de hand van regressietechnieken tracht op te lossen, vormt de gemiddelde waarde van de uitkomstvariabele de “sleutelwaarde”. Deze waarde wordt het “conditioneel gemiddelde” genoemd of de verwachte waarde van Y gegeven de waarde van X. Ze wordt uitgedrukt als: E(Y|x)441. De lineariteit van een verklarende variabele laat een eenvoudige interpretatie van het regressieprobleem toe: de toename met 1 eenheid van X heeft een lineaire toename in Y als gevolg. Indien Y dichotoom is, dan is E(Y|x) niet lineair maar S-vormig (Figuur 2, bovenste deel). Onder dichotoom verstaan we hier de aanwezigheid van een uitkomst of niet: bvb. overleden of niet, gezond of ziek. In het probleem dat ons nu bezig houdt gaan we na of het aantal keren dat een fenomeen zich voordoet op dezelfde wijze in de tijd evolueert in het geheel der ziekenhuizen. Bijvoorbeeld de per semester evolutie (de verklarende variabele) van het aantal verblijven met
als nevendiagnose septicemie (de
antwoordvariabele). Indien met een transformatie van de antwoordvariabele de linearisatie van de tijdsvariabele kan bereikt worden, spreekt men van een lineaire tijdstrend en kan deze tijdstrend tussen ziekenhuizen vergeleken worden door middel van de interactie tussen tijdstrend en ziekenhuizen.442
40BHoofdstuk 3: Methodologische aspecten
145
De eventuele correlatie tussen zieken in een ziekenhuis en van ziekenhuizen over de tijd uit zich in het fenomeen van de “overdispersion”443, waarbij de variabiliteit van de gegevens groter is dan degene die voortvloeit uit de veronderstelde binomiale, Poisson of normale verdeling. We corrigeren voor “overdispersion” door middel van de “rescaling”techniek (de standaardfouten gebruikt voor de testen worden vermenigvuldigd met een factor die gelijk is aan de vierkantswortel van de ratio van de goodness-of-fit chi-kwadraat en het aantal vrijheidsgraden)444. Om een correcte beoordeling te maken van de tijdsevolutie in een bepaald ziekenhuis vergeleken met die van het nationale gemiddelde gebruiken we contrasten.427;428;436;445-447 We trachten dit begrip aan de hand van een voorbeeld duidelijk te maken. Stel dat we vier ziekenhuizen willen vergelijken. Het is mogelijk hieraan aangepaste hypothesetoetsen uit te voeren door een L vector te specificeren voor het toetsen van de hypothese Lβ = 0, die aangeeft dat de trends van de bestudeerde ziekenhuizen niet verschillen. In een eerste stap vergelijken we de trend van ziekenhuis 1 (ZH1 in figuur 1) met de gemiddelde trend van de vier ziekenhuizen (H1, H2, H3, H4). De nul hypothese wordt dan: 1β1 + 1β2 + 1β3 + 1β4 H0: 1β1 = --------------------------4 waarbij βi de trend is voor ziekenhuis i. We herhalen dit procédé voor alle ziekenhuizen en uiteindelijk wordt de matrix van contrasten gefit in de logistische regressie. Om te kunnen besluiten of een ziekenhuis een significant afwijkende trend heeft, gaan we na of de interactie term tussen trend en ziekenhuis significant is. Hiervoor “contrasteren” we op de hierboven beschreven manier de trend van een ziekenhuis versus de nationale trend. Interactie betekent in deze context een niet parallel verloop van de trend van een of meerdere ziekenhuizen met die van het nationale gemiddelde. In figuur 1 vertonen ziekenhuizen drie (ZH3) en vier (ZH4) onderling een significante interactie en ook met de
Hoofdstuk 3: Methodologische aspecten
146
ziekenhuizen 1 (ZH1) en 2 (ZH2). De trends van de ziekenhuizen één en twee verlopen daarentegen parallel, wat interactie uitsluit. Bij opsporing van mogelijke fraude via de knipperlichten gaat de aandacht naar de “stijgers” of “dalers”, zoals ziekenhuis 3 op de grafiek. Een “stijger” of “daler” kan zowel een ziekenhuis zijn dat van onder-codering evolueert naar correcte codering als een ziekenhuis dat evolueert naar up-coding of creep, of dat meer en meer zwaardere pathologieën aantrekt. Alleen de audit kan bepalen of het een geval van up-coding is of niet. Figuur 1: Interziekenhuis verschillen in evolutie van een cijfer in de tijd: interactie
Interactie 80 70
Rate (%)
60 50 40 30 20 10 0 Jaar 1
Jaar 2
Jaar 3
Jaar 4
Evolutie in de tijd ZH1
ZH2
ZH3
ZH4
3.1.3 Interpretatie van een odds ratio bij interactie van een trend en een categorische variabele Zoals hoger vermeld is de antwoordvariabele in de logistische regressie binair, ligt E(Y|x), het conditionele gemiddelde, tussen 0 en 1 en heeft een S-vorm (Figuur 2, bovenste deel). Dit betekent dat de verandering in E(Y|x) per eenheid verandering in x progressief kleiner
147
40BHoofdstuk 3: Methodologische aspecten
wordt naarmate het conditioneel gemiddelde de waarden 0 of 1 benadert.441 Dit laat, in tegenstelling met de lineaire regressie, geen eenvoudige interpretatie toe van een toename met een eenheid in X van een continue verklarende variabele, die een toename met een vaste grootte in Y ten gevolge heeft. Om aan dit euvel te verhelpen en deze eenvoudige interpretatie mogelijk te maken, wordt een logit transformatie toegepast. De verklarende variabelen worden omgevormd tot logits. Laten we om de notatie te vereenvoudigen de gezochte E(Y|x) in de logistische distributie voorstellen als π(x), met exp(ß0 + ß1x) π(x) = ------------------------1+exp( ß0 + ß1x) De logit transformatie van π(x), weergegeven als π(x) g(x) = ln ---------1- π(x]
= ß0 + ß1x,
maakt de S vorm lineair (Figuur 2, onderste deel). Noteren we dat de logit,
π(x) logit = ln ---------1- π(x]
waarvan
,
π(x) ---------1- π(x]
de ziekte odds aangeeft, ook de log odds genoemd wordt.448
Hoofdstuk 3: Methodologische aspecten
148
In zijn eenvoudigste vorm, waar de verklarende variabele, x, gecodeerd wordt als nul of een, is π(x) ---------1- π(x]
=
π (1) / [1- π (1)] --------------------π (0) / [1- π (0)]
waar π (1) / [1- π (1)], de “odds”, de kans is van een ziekte te hebben over de kans ze niet te hebben in aanwezigheid van een bepaalde karakteristiek en π (0) / [1- π (0)] dezelfde odds is, maar dan in afwezigheid van die karakteristiek. De logit transformatie wordt doorgevoerd in de logistische regressie. Laten we nogmaals veronderstellen dat de verklarende variabele, x, gecodeerd wordt als nul of een. Het verschil in de logit van een bepaald ziekenhuis (met x = 1) en de logit van het geheel der ziekenhuizen (met x = 0) is g(1)-g(0) = (ß0 + ß1) - (ß0) = ß1. Dit verschil in logits is, na het nemen van het antilogaritme, gelijk aan de “odds ratio” (OR), een gekende associatiemaat: OR = exp
ln [π 1/(1- π 1)] – ln [ π 0/(1- π 0)]
= exp[(β0+β1) -β0] = exp(β1).
De odds ratio (OR) wordt vaak gebruikt in de epidemiologie (Tabel 1) omdat ze benaderend aangeeft hoe veel meer (on)waarschijnlijk het is dat een uitkomst aanwezig is bij iemand waar X = 1 (blootstelling aanwezig) dan waar X = 0 (blootstelling niet aanwezig). Zij is gelijk aan A x D / C x B. Een eenvoudige schatter van de standaardfout van de log-odds ratio is de vierkantswortel van 1/A +1/B +1/C +1/D, die, na het nemen van het antilogaritme, kan gebruikt worden als standaardfout voor de odds ratio.449Deze standaardfout laat toe een betrouwbaarheidsinterval te berekenen en tevens de probabiliteit bij een Wald toets voor het toetsen van de hypotheses dat de odds ratio al dan niet gelijk is aan één. Noteren we dat een OR=1 aangeeft dat blootstelling geen effect heeft. Passen wij de odds ratio meer specifiek toe in een audit context (Tabel 1, sectie b) dan wordt het voorkomen van een verblijf, met als nevendiagnose knipperlicht Y, in een
149
40BHoofdstuk 3: Methodologische aspecten
bepaald ziekenhuis Z vergeleken met het voorkomen van een gelijkaardig verblijf in het geheel van de Belgische ziekenhuizen tijdens het jaar A. Tabel 1: De odds ratio in zijn epidemiologische en audit context.
A) EPIDEMIOLOGISCHE CONTEXT
Y=1
Blootstelling Totaal
Ziekenhuizen
X=1
X=0
ZH
Alle ZH
A
B
+
A
B
A+B
-
C
D
C+D
A+C
B+D
N
A+B
Uitkomst
Totaal
Knipperlicht Y=0
Totaal
B) AUDIT CONTEXT
C
D
C+D
A+C
B+D
N
Totaal
Hoe wordt dan een odds ratio geïnterpreteerd in geval van een interactie van een trend (X), een continue variabele, en een categorische variabele(F)? De logistische regressie drukt de twee categorieën van de verklarende variabele (het bestudeerde ziekenhuis versus alle ziekenhuizen) als een log-odds ratio uit. Deze log- odds ratio is niet constant in het verloop van de tijd maar moet met een factor vermenigvuldigd worden om de gezochte log-odds te bekomen voor jaar A+1. Deze factor echter is wel constant - vandaar de naam (lineaire) trend – tenminste zolang we met de log-odds ratio werken, maar is niet langer constant wanneer we de antilog nemen om de odds ratio te bekomen. De geïnteresseerde lezer wordt naar het boek van Hosmer en Lemeshow verwezen voor de volledige details van deze modellering.442
150
Hoofdstuk 3: Methodologische aspecten
Figuur 2: CHD prevalentie per leeftijdsgroep uitgedrukt als een proportie en als een logodds ratio
Bron: Hosmer en Lemmshow441
40BHoofdstuk 3: Methodologische aspecten
151
In essentie stellen deze auteurs volgende drie-stappen procedure voor om tot de gewenste odds ratio te komen: 1) g(f1,x) = ß0 + ß1f1+ß2x+ß3f1*x , en g(f0,x) = ß0 + ß1f0+ß2x+ß3f0*x bepaal de log-odds ratio door hun verschil te berekenen 2) log OR = ß1(f1-f0) + ß3x (f1-f0) exponentieer de log-odds ratio 3) OR= exp[ß1(f1-f0) + ß3x (f1-f0)] Als de risicofactor F dichotoom is en we nemen aan dat f1=1 en f0=0, dan herleidt de formule zich tot: ln[OR(F=1,F=0,X=x)] = ß1+ß3x. Dit is het geval in onze studie, vermits we een ziekenhuis (F=1) vergelijken met het geheel der Belgische ziekenhuizen (F=0). Omdat we de case mix van de ziekenhuizen onvoldoende kennen, zijn we voornamelijk geïnteresseerd in de evolutie van de odds ratio en minder in zijn werkelijke waarde. Wij spitsen dan ook onze aandacht toe op ß3x, de evolutie in de tijd van de log-odds ratio (de trend) van een specifiek ziekenhuis en identificeren outliers in functie van hun trend. De interpretatie van een odds ratio (OR) bij interactie van een trend en een categorische variabele illustreren we aan de hand van volgend voorbeeld, overgenomen uit het gerefereerde boek (Figuur 3).442 In deze studie wordt het verband bestudeerd tussen het gewicht (< 50 kg of ≥ 50kg), de categorische variabele (F), en de leeftijd van de moeder, de continue variabele, op het geboortegewicht van haar kind, de dichotome uitkomstvariabele [aanwezigheid van een laag geboortegewicht (LBW) of niet]. Het model LBW= F + X + F*x wordt gefit met als resultaat: intercept (β0 = 0,744), gewicht van de moeder minder dan 50 kg (β1 = -1,9444), leeftijd van de moeder (β2 = -0,080), en interactie laag gewicht van de moeder en leeftijd van de moeder (β3x = 0,132). Wanneer we ln [OR(F=1,F=0, X=x)] = β1 + β3x exponentiëren komen we tot een OR van1,04 op de leeftijd van 15 jaar, van 2,01 op de leeftijd van 20 jaar, van 3,90 op de leeftijd van 25 jaar,
Hoofdstuk 3: Methodologische aspecten
152
en van 7,55 op de leeftijd van 30 jaar. Uit figuur 3, waarin de neperiaanse logaritme van de odds ratio (lnOR) en de OR worden weergegeven, blijkt duidelijk dat de log-odds ratio van de interactie gewicht en leeftijd van de moeder op het geboortewicht van het kind lineair is maar niet de OR. Vertaald naar onze setting van detectie van over-codering of onder-codering is het ziekenhuis de categorische variabele (F) en de semestriële trend de continue variabele. Figuur 3: Effect van gewicht (< 50kg) en leeftijd van de moeder op laag geboortegewicht 8 7 6 5 4 3 2 1 0 15 jaar
20 jaar
25 jaar Ln(OR)
30 jaar
OR
3.1.4. Steekproefgrootte voor de knipperlichten 3.1.4.1 Principe van de berekening De overheid neemt aan dat het verschil tussen auditeur en geauditeerde tenminste 5% moet bedragen
(het
“toegelaten
verschil”)
vooraleer
men
frauduleus
coderen
kan
veronderstellen. Het minimum aantal onenigheden, nodig om fraude te laten vermoeden, kan dan als volgt bepaald worden. Men berekent het 95% betrouwbaarheidsinterval van de proportie van verblijven waarvan de ondergrens groter is dan, maar tevens zo kort mogelijk de grens van de toegelaten verschilmarge benadert155. Indien men in het kader van een audit op knipperlichten bijvoorbeeld 60 verblijven nakijkt moeten er tenminste 7 onenigheden vastgesteld worden vooraleer men fraude kan veronderstellen. Indien men 70 verblijven nakijkt bedraagt dit aantal 8 (zie tabel 2).
40BHoofdstuk 3: Methodologische aspecten
153
Voor zover de theorie wanneer het aantal beschikbare verblijven waaruit de steekproef getrokken wordt als oneindig (bvb. 500 of meer) beschouwd kan worden. Wanneer de steekproef getrokken wordt uit een eindig aantal verblijven dan gaat deze benadering niet meer op en dient in de formule van het betrouwbaarheidsinterval een correctie aan de standaardfout aangebracht te worden. Immers, hoe meer de steekproef het totaal aantal beschikbare verblijven benadert, hoe minder variabiliteit er bestaat bij het schatten van de te verwachten proportie. In dergelijke gevallen gebruikt men een ‘finite population correction’, met name door de standaardfout te vermenigvuldigen met √ ((N- n)/N), de ‘sampling fraction’, waarbij n de steekproefgrootte is en N het aantal verblijven met het knipperlicht
waaruit de steekproef getrokken wordt.450 Stel n=N dan wordt de
correctiefactor gelijk aan 0 en is er geen variabiliteit meer. Indien we bvb. een ‘steekproef’ van 80 verblijven hebben uit 80 verblijven met de knipperlichtcode, dan wordt de toegelaten marge van 5% of 4 verblijven overschreden wanneer er bij 5 verblijven geen elementen gevonden worden om deze diagnose te verrechtvaardigen.
3.1.4.2 Berekening van het aantal onvoldoend gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten Stel n = het aantal te controleren verblijven (de steekproefgrootte); N = het aantal verblijven met het knipperlicht waaruit de steekproef getrokken wordt; y = het aantal onvoldoend gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten; P= de proportie van onvoldoend gemotiveerde verblijven; PL = de ondergrens van het 95% betrouwbaarheidsinterval van P, die groter is dan de toegelaten proportie (5%) en tevens de toegelaten proportie zo kort mogelijk benadert.
- Indien ((N-n)/N) groter dan of gelijk is aan 0.9, dan verloopt de berekening451 van PL, als volgt: (2*n*P)+ ((CI²)-1)-A) PL= ---------------------------------2*(n+(CI²))
Hoofdstuk 3: Methodologische aspecten
154
Waar: CI=1.96 (95% betrouwbaarheidsinterval); P=y/n; q=1-P; A=CI*(√((CI²)(2+(1/n))+(4*P*((n*q)+1)))) Aan de hand van deze formule werd tabel 1 opgesteld. - Indien het aantal beschikbare verblijven klein is en met name indien ((N-n)/N) kleiner is dan 0.9 wordt de formule voor het bepalen van de PL als volgt aangepast: (2*n*P)+(CI²)*((N-n)/N)-1)-A PL = --------------------------------------2*(n+(CI²)*(N-n)/N) Waar CI=1.96 (95% BI); P=y/n; q=1-P; A=CI*√((N-n)/N)*(√((CI²)*((N-n)/N)-2 +(1/n))+(4*P*((n*q)+1)))) ; Indien men in het kader van een audit op knipperlichten bijvoorbeeld 60 verblijven nakijkt uit 1000 beschikbare verblijven met dat knipperlicht, dan is ((N-n)/N) groter dan 0.9 en moeten er tenminste 7 onenigheden vastgesteld worden vooraleer men fraude kan veronderstellen. Indien men 70 verblijven nakijkt bedraagt dit aantal 8. Indien men uit 80 beschikbare verblijven 70 verblijven nakijkt dan is ((N-n)/N) kleiner dan 0.9 en bedraagt dit aantal 6.
155
40BHoofdstuk 3: Methodologische aspecten
Tabel 2: Minimum aantal verblijven nodig om een waarschijnlijke fraude op te sporen.
n
Y
P
PL
30
5
.1667 .0630
35
5
.1429 .0538
40
6
.1500 .0625
45
6
.1333 .0554
50
7
.1400 .0628
55
7
.1273 .0569
60
7
.1167 .0521
65
8
.1231 .0584
70
8
.1143 .0541
75
8
.1067 .0505
80
9
.1125 .0559
85
9
.1059 .0526
90 10
.1111 .0575
95 10
.1053 .0544
100 10
.1000 .0516
n = aantal te controleren verblijven; y = aantal onvoldoende gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten; P= proportie van onvoldoend gemotiveerde verblijven; PL = ondergrens van het 95% betrouwbaarheidsinterval van P, die groter is dan de toegelaten proportie en de toegelaten proportie zo kort mogelijk benadert.
156
Hoofdstuk 3: Methodologische aspecten
3.2 STATISTISCHE AANDACHTSPUNTEN BIJ HET OMGAAN MET EN RAPPORTEREN VAN KWALITEITSGEGEVENS: KLEINE AANTALLEN, CORRELATIE, CASE MIX VARIATIE EN MEERVOUDIG GELIJKTIJDIG TOETSEN.
De analyse en de rapportering van kwaliteitsmetingen blijven een belangrijke uitdaging.104;452 De consument verwacht van kwaliteitsmeting onder meer een antwoord op de vraag of de “uitkomst” er anders zou uitzien mocht hij in een andere eenheid behandeld geweest zijn.452 Derhalve zouden verschillen tussen zorgeenheden te wijten aan verschillen in patiëntenkarakteristieken en niet aan reële verschillen tussen zorgeenheden uit de vergelijking moeten “verwijderd” worden.452 Directe en indirecte standaardisatie komen hiervoor niet in aanmerking omwille van het zeer beperkt aantal variabelen waarvoor zij kunnen corrigeren en omwille van de moeilijk te vervullen voorwaarden voor een nietvertekende toepassing: een gelijkaardige bevolkingsverdeling bij de te vergelijken zorgeenheden en constante risicoverhouding.155;452-454 Aanvankelijk werden niet-adequaat risicogecorrigeerde sterfteresultaten vrijgegeven wat tot verhitte discussies aanleiding gaf. Derhalve werden er talrijke statistische modellen ontwikkeld om aan dit euvel te verhelpen.104;163;188;359;392;452;455 Het gaat hierbij typisch over een schatting van de waarschijnlijkheid van een postoperatief sterfgeval op individueel patiëntenniveau, gevolgd door aggregatie op ziekenhuis- of artsenniveau, waarbij het aantal vastgestelde sterfgevallen vergeleken wordt met het te verwachten, gevolgd door een outlier-status bepaling.392 De resultaten van deze oefening worden dan gepubliceerd392 onder vorm van “report cards” in de US of “league tables” in het UK, die we in een Belgische context het best benaderen met het woord “profielen” (Zie hoofdstuk 2.4.1). De gesofisticeerde statistische modellen (logistische regressie) waarop deze bepalingen in de US steunden, benevens de precisiegraad waarmee zij publiekelijk gerapporteerd werden zoals bijvoorbeeld in Pennsylvanië315;414, verleenden aan deze profielen een overdreven aura van wetenschappelijke nauwkeurigheid.392 In werkelijkheid zijn de beschikbare gegevens en methodes niet volmaakt, zijn ze onderhevig aan uiteenlopende interpretaties en zijn ze vaak te technisch om voor de gewone leek volledig vatbaar te zijn.392
157
40BHoofdstuk 3: Methodologische aspecten
Belangrijke redenen voor bekommernis zijn: 1) de inherente beperkingen van risicopredictie modellen op patiëntenniveau, 2) het onvermogen van profielen om de statistische onzekerheid van hun resultaten voldoende en adequaat weer te geven, 3) het gelijktijdig meervoudig toetsen, 4) het geen rekening houden met correlatie binnen zorgeenheden en over
de
tijd,
risicocorrectie.
en
5)
het
gebruik
van
niet-adequate
maatstaven
en
275;283;313;392;423;456
Logistische regressie modellen op patiëntenniveau – maar ook Bayesiaanse of neurale netwerken - berusten op een niet-exacte benadering van de complexiteit van biologische processen.392;423 Niet-verklaarde variatie is in belangrijke mate aanwezig omwille van risicofactoren die niet werden opgenomen in het risicoalgoritme of omwille van het herleiden van complexe ziektetoestanden tot dichotome of discrete variabelen met een verlies aan predictief vermogen.191;289;392;423;457 Ook de performance van deze modellen is niet maximaal. Hun discriminatoir vermogen kan bijvoorbeeld als goed bestempeld worden maar niet als perfect: typisch ligt de C-index voor CABG-sterfte in een spreidingsbreedte van 0,76 tot 0,82 wat kan leiden tot een nietcorrecte risicobepaling voor vele patiënten. Ongekende predictoren zijn hiervoor de waarschijnlijke verklaring.392 Gegeven de argwaan van artsen ten aanzien van de gebruikte risicocorrecties274 leek het geraadzaam hen eraan te herinneren dat statistische modellen even goed of zelfs beter zijn in het voorspellen van uitkomsten dan klinische experts.289 Vermits het aantonen van variabiliteit tussen zorgverleners en het bepalen van outliers de hoofdbedoelingen zijn van profielen, dient met de verschillende componenten van de variabiliteit rekening gehouden te worden. Variabiliteit tussen zorgverleners kan voortspruiten uit 1) systematische patiëntenverschillen ten gevolge van gemeten of ongemeten co-morbiditeit, 2) stochastische variabiliteit, of 3) werkelijke verschillen in zorgenkwaliteit. Meestal echter werd, voor het opstellen van profielen, een logistische regressie, die geen rekening houdt met correlatie, gebruikt met als gevolg een overschatting van systematische verschillen en een onderschatting van stochastische variatie (extra-binomiale of extra-Poisson variatie399;443;444;458).275;392;423;459 Alleen wanneer de steekproeven groot genoeg zijn om de standaard fouten van de intraunit variabiliteit
verwaarloosbaar te maken t.o.v. de inter-unit variabiliteit is deze
Hoofdstuk 3: Methodologische aspecten
158
vertekening verwaarloosbaar. Maar dit is niet vaak het geval bij profielen, zeker wanneer het over mortaliteit gaat.459 Een longitudinale benadering kan de intra-unit variabiliteit grotendeels opvangen én de temporele evolutie weergeven.287;319;401;455 Ook bij deze benadering blijft een hiërarchische modellering verkieselijk omdat op die manier rekening wordt gehouden met de hiërarchische structuur, wat leidt tot meer precieze schatters.401;430 Derhalve vergen deze twee problemen: kleine aantallen en variabiliteit een speciale aandacht. Kleine aantallen (ie met een verwachte frequentie van minder dan 10)423, een vaak voorkomend gegeven bij sterfte318;459, vormen een probleem i.v.m. de bepaling van betrouwbaarheidsintervallen. Hierbij gaat de vaak gebruikte benadering van de Poisson verdelingen door de normaal verdeling niet op - met voornamelijk vals positieve outliers bij
de
hoge
mortaliteitscijfers
–
maar
is
de
156;275;392;423;460;461
betrouwbaarheidsintervallen noodzakelijk.
exacte
bepaling
van
de
Verder is het gemiddeld
sterftecijfer niet de beste schatter van het “echt” onderliggend sterftecijfer maar wel de “gekrompen” (“shrunken”) schatter bekomen via een hiërarchisch model.392;423 Daarenboven is de patiënt de eenheid van analyse in de gebruikte modellen en is de eenheid van inferentie de zorgenverstrekker. Hoe geëigend zijn deze geaggregeerde kengetallen? Als we wensen een onderscheid te maken tussen intrazorgverlener en interzorgverlener variabiliteit, die zowel stochastische als systematische componenten bevat, is dit onmogelijk door middel van de vaak gebruikte logistische regressie, die hiermee geen rekening houdt. Hiërarchische of multilevel modellen daarentegen corrigeren voor verschillen in steekproefgrootte door middel van shrinkage schatters, houden rekening met clustering van de gegevens, maken op een adequate manier het onderscheid tussen intra- en interzorgverlener variabiliteit, verhinderen het optreden van een regression-to-the-mean462-466 vertekening, laten toe performance te toetsen aan medisch, sociaal
en
economisch
relevante
standaarden
(met
waarden
van
het
betrouwbaarheidsinterval die substandaard en voorbeeldige zorg weerspiegelen) en kunnen – in tegenstelling met de logistische regressie - in staat blijken in grote mate het probleem te
corrigeren
van
het
meervoudig
profileringen.76;104;275;286;392;423;425;428;430;452;459;467;468
gelijktijdig
toetsen,
inherent
aan
159
40BHoofdstuk 3: Methodologische aspecten
Het probleem van het meervoudig gelijktijdig toetsen doet zich voor wanneer men verschillende zorgverleners gaat vergelijken met een standaard. Past men voor één vergelijking het klassieke 95%-betrouwbaarheidsinterval toe dan bedraagt de probabiliteit van één vals alarm 5 op 100. Maar wanneer men twintig vergelijkingen maakt bedraagt de kans op minstens één vals alarm 1- (1-.05)N of .642.469 Om de inflatie van fout positieven tegen te gaan bestaan er verschillende methodes die gebaseerd zijn op de Bonferroni-procedure117;417;470-473, die er benaderend in bestaat de alfa van het significantieniveau (gewoonlijk 0,05) te delen door het aantal toetsen dat men wenst uit te voeren, wat echter een zeer conservatieve techniek is. Deze benadering is erop gericht te behoeden voor een type I fout of het onterecht verwerpen van de nul hypothese, maar de prijs die hiervoor betaald wordt is de type II fout, het onterecht niet verwerpen van de nul hypothese, of zoals Rothman het formuleert: “Loont het de moeite de fout positieven te doen dalen ten koste van een stijging van de fout negatieven?”473 Verder is het zo dat een Bonferroni-correctie de gelijktijdige vergelijkingen als onafhankelijk van elkaar beschouwt wat tot een veel te conservatieve test leidt indien de set vergelijkingen met elkaar gecorreleerd zijn.474-476 Het is daarom raadzaam beroep te doen op minder conservatieve verfijningen op de Bonferroni zoals die van Holm en Hochberg.477-480
Het
is
echter
mogelijk
door
middel
van
bootstrap-
en
permutatietechnieken, toegankelijk gemaakt voor een breder publiek via de MULTTEST procedure van SAS481, rekening te houden met correlaties. Deze technieken zijn alternatieven voor de Bonferroni-correctie en de erop geïnspireerde technieken.
Hoofdstuk 3: Methodologische aspecten
160
3.3 METHODEN VOOR HET BEOORDELEN VAN KWALITEIT/PERFORMANCE “The desire of health care payers for simple measures of hospital performance, conflicts with the skepticism of health care providers about the validity and fairness of the assessment process” 313 3.3.1 Rangorde, een aantrekkelijke maar vaak misleidende methode Op het eerste zicht lijkt het toekennen van een rang of “ranking” een aantrekkelijke vergelijkingsmethode.394 Toch hebben we ze niet weerhouden. Rangen van instellingen zijn uiterst onbetrouwbare statistische samenvattingen van performance en het is mogelijk dat instellingen met kleinere aantallen gevallen ten onrechte “gestraft” of “beloond” worden bij vergelijkingsoefeningen, waar aan de hand van bijkomende statistische analyse het mogelijk kan zijn om de enkele instellingen te identificeren waarvoor verder onderzoek de moeite loont. Verder zou elke puntschatter van een performance indicator altijd vergezeld moeten zijn van een geassocieerde statistische maat van onzekerheid (betrouwbaarheidsinterval) variability”).
te
wijten
aan
de
steekproefvariabiliteit
(“sampling
396
Het gerefereerde artikel396 gebruikt hiervoor de analyse van het succescijfer van klinieken, die in vitro fertilisatie aanbieden, als een mooi voorbeeld (Figuur 1). Figuur 1: Geschat cijfer van levende geboorten : mediaan en 95% BI van de rang van elk ziekenhuis.
Bron: Marshall EC396
161
40BHoofdstuk 3: Methodologische aspecten
“Why use league tables at all? The main advantage is that they are easy to read. One can see at a glance who is at the top and who is at the bottom. But if the information is both high impact and misleading, poor decisions are made and the source loses credibility.”395 Vermits er bij het opstellen van profielen er steeds een “eerste” en een “laatste” is, ook al is het verschil klinisch en of statistisch niet significant, kan dit, zeker indien er geen rekening gehouden wordt met de case mix, een ziekenhuis of een arts ten onrechte stigmatiseren.77;191;296;394;395;405;407;411 3.3.2. Schatting van het relatieve risico (RR) door middel van een logistische regressie In plaats van rangen toe te kennen, trachten we een methode uit te werken waarbij kwaliteit centraal staat en die met standaard statistische software, routinematig uitgevoerd kan worden. We trachten daarbij in eerste instantie een benchmark voor goede kwaliteit te bepalen en ziekenhuizen met belangrijke kwaliteitsproblemen op te sporen, om hen, indien de kwaliteit inderdaad ondermaats blijkt te zijn, te stimuleren de kwaliteit te verbeteren. Onze aandacht gaat derhalve voornamelijk uit naar het identificeren van zowel bovenmaatse als ondermaatse kwaliteit, m.a.w. naar outliers. Vermits we alle Belgische ziekenhuizen daarop onderzoeken, doen we beroep op zogenaamde fixed effects modellen en, omwille van de categorische antwoordvariabele, op de logistische regressie. Zoals in sectie 3.1.1 vermeld, staat de theorie voor het bepalen van outliers in linear mixed models overigens nog niet vast en is GEE hiervoor niet bedoeld. Non-linear mixed models komen zeker niet in aanmerking omdat hier geen outliers kunnen bepaald worden. De logistische regressie is een elegante methode maar houdt geen rekening met correlatie van de gegevens - hiervoor corrigeren we echter door “rescaling” (zie 3.1.2) - en kent ook gemakkelijker een outlier status toe aan de hoogste waarden van de verdeling.275;392;461 Voor de resultaten op nationaal niveau voeren we naast de logistische regressie ook analyses uit van het type Generalized Estimating Equations (GEE) rekening houden met correlatie van de gegevens.
431;482-484
, die wel
162
Hoofdstuk 3: Methodologische aspecten
Verder wordt er met de andere in 3.2 vermelde aandachtspunten zoveel mogelijk rekening gehouden: we kozen eerst prioritaire problemen (belangrijke incidentie) als indicatoren en doen omwille van de onvolmaakte risicocorrectie (zie voorbeeld hieronder) geen uitspraken maar spreken van “screening”. Verder corrigeren we voor meervoudig gelijktijdig toetsen door middel van de Bonferroni-correctie en verstrekken een anonieme feedback aan de ziekenhuizen, Artsencolleges en het centrale beleid. Ook geven we de graad van de bestaande evidentie aan en bieden hulp aan voor de interpretatie (sectie 3.3.6). Rekening houdend met de problemen van accuratesse en volledigheid van administratieve gegevens, bepalen we daarenboven een zone van niet-interpretatie.100 In een optiek van het bepalen van een eerste benchmark (de bovenmaatse kwaliteit) en vermits dit de eerste analyses zijn, trachten we verder zoveel mogelijk het voorkomen van vals positieven te vermijden en gebruiken daarvoor de meest conservatieve techniek, de Bonferroni-correctie. Het is verder zo dat deze eerste, “data-driven” benchmark dient gezien te worden als een eventueel beter vergelijkingspunt dan het nationale periodecijfer of trend in termen van identificatie van ondermaatse kwaliteit en zelfevaluatie voor de ziekenhuizen.485 De keuze van de uiteindelijk te gebruiken benchmark zal in overleg met de sector moeten gebeuren in functie van wat haalbaar en wenselijk lijkt.485Benchmarks zoals het gemiddelde van de beste performance voor tenminste 10 %van de bevolking werden voorgesteld.485 Door middel van de logistische regressie gaan we na of er in ziekenhuis ‘A’ een groter risico bestaat op een mindere behandeling dan in het geheel der ziekenhuizen ‘A-Z’. We illustreren dit aan de hand van het sterftecijfer van een hersenbloeding (Tabel 1). In ziekenhuis ‘A’ sterven er 10 van de 100 patiënten met een hersenbloeding. Voor het geheel der ziekenhuizen ‘A-Z’ is dit 100 op 2000.
163
40BHoofdstuk 3: Methodologische aspecten Tabel 1: Relatief risico en odds ratio voor een overlijden t.g.v. een hersenbloeding in ziekenhuis A vergeleken met het geheel der ziekenhuizen Uitkomst
Ziekenhuizen
Totaal
Uitkomst
ZH ‘A’ ZH ‘A-Z’
Ziekenhuizen
Totaal
ZH ‘A’ ZH ‘A-Z’
Dood
A
B
A+B
Dood
10
100
110
Levend
C
D
C+D
Levend
90
1900
1990
Totaal
A+C
B+D
N
Totaal
100
2000
2100
Hier kan het relatief risico (RR) gemakkelijk als volgt berekend worden: 1) berekenen van het sterftecijfer: 10/100 = 10% voor ZH ‘A’ en 100/2000 = 5% voor het geheel der ziekenhuizen ‘A-Z’, 2)
de ratio berekenen van deze cijfers = RR = 2.
In deze tabel wordt het relatief risico (RR) als volgt berekend: RR= (A/A+C)/(B/B+D) en de odds ratio (OR) als: OR= (A/C)/(B/D). Indien men nu rekening wenst te houden met ernst en co-morbiditeit is deze eenvoudige methode niet langer mogelijk en maakt men gebruik van de logistische regressie, die het RR schat via de OR. Deze is gelijk aan (A/C)/(B/D), - in ons voorbeeld OR = 2.11 - een overschatting van het werkelijke relatief risico. Zolang het gezondheidsverschijnsel dat we bestuderen relatief klein is (t.t.z. < 10%, bijvoorbeeld mortaliteit) en de 0.5
Hoofdstuk 3: Methodologische aspecten
164
Deze betrouwbaarheidsintervallen geven de mate van onzekerheid aan in de schatting van de RRZ of OR.487 en laten toe vast te stellen hoe groot het effect, de RRZ of OR, is - het belangrijkste aandachtspunt - en of het al dan niet statistisch significant is. Een ondergrens ≥ 1 geeft aan dat de RRZ/OR groter is in ZH ‘A’ dan in de andere ziekenhuizen, en een bovengrens ≤ 1 geeft het omgekeerde aan. Een betrouwbaarheidsinterval biedt overigens bescherming tegen de misinterpretatie van niet-significante resultaten in kleine studies, waar door onvoldoende statistische power een werkelijk effect niet aangetoond kan worden.488;489 Daarentegen geeft een p-waarde alleen aan of een bevinding statistisch significant is of niet, en geeft geen indicatie betreffende de grootte van het bestudeerde effect, maar biedt anderzijds hulp om niet al te vlug een grote puntschatter in kleine studies als belangrijk te gaan interpreteren. Vooraanstaande tijdschriften zoals het “British Medical Journal”, “The Lancet”, het “American Journal of Public Health”, en het “International Journal for Quality in Health Care” vragen dat de voornaamste
resultaten
van
een
studie
meegedeeld
worden
met
betrouwbaarheidsintervallen, en wordt deze zienswijze gedeeld door het “Committee of Medical
Journal
Editors.”460;490
Een
p-waarde
kan
vervolgens
aan
het
betrouwbaarheidsinterval toegevoegd worden. Wij berekenden hiervoor een Wald toets, gebaseerd op RRZ en zijn standaard fout.441;491;492 Een Bayesiaanse aanpak is een interessant alternatief voor de hier voorgestelde methode.
3.3.3. Meervoudig gelijktijdig toetsen Wanneer we in een groep ziekenhuizen de performance van elk ziekenhuis vergelijken met het gemiddelde van die ziekenhuizen, stelt zich het probleem van het meervoudig gelijktijdig toetsen met als gevolg een sterke stijging van het aantal vals positieven (VP). Om dit effect tegen te gaan passen we de Bonferroni-correctie313;474-476;480 toe, waarbij de alfa van de gebruikte toets gedeeld wordt door het aantal gelijktijdige vergelijkingen, hier het aantal ziekenhuizen. Het nadeel hiervan is het optreden van vals negatieven (VN) of het ten onrechte niet vaststellen van een werkelijk verschil. We verstrekken daarom twee types betrouwbaarheidsintervallen waarbinnen de vermoedelijke performance van het ziekenhuis zich bevindt: een zeer ruim interval met
40BHoofdstuk 3: Methodologische aspecten
165
Bonferroni-correctie (weinig VP maar meer VN) dat moet toelaten ziekenhuizen met zeer vermoedelijk bovenmaatse of ondermaatse kwaliteit te identificeren en een nauwer interval zonder Bonferroni-correctie (minder VN maar meer VP) dat aangeeft dat er een kans bestaat dat het ziekenhuis eerder ondermaats of bovenmaats presteert. Het ruime interval (Bonferroni) dient tot een meer diepgaand onderzoek te leiden indien de puntschatter van het betrouwbaarheidsinterval zich buiten de zone van niet-interpretatie bevindt (zie sectie 3.3.7). Het nauwere interval (95 % BI) tracht aan het ziekenhuis een gevoeliger aanknopingspunt te verschaffen voor zelfanalyse en eventuele actie. 3.3.4 Risicocorrectie Bij het uitvoeren van de logistische regressie trachten we rekening te houden met de ernst van de aandoening en co-morbiditeit (risicocorrectie).105 Volgende figuren illustreren dat statistische significantie m.b.t. over- of ondermortaliteit ook functie is van de gebruikte risicocorrectie. Wij presenteren hier de positieve of negatieve “afwijking” ( afwijking = RRZ –1, uitgedrukt onder vorm van een percentage) van de ziekenhuizen t.o.v. het nationale gemiddelde.
In deze figuren worden significant afwijkende ziekenhuizen
gevisualiseerd door de weergave van hun anoniem ziekenhuisnummer. Volgende risicocorrecties werden doorgevoerd: figuur 2:geen; figuur 3: leeftijd en geslacht; figuur 4: leeftijd, geslacht en severity of illness (SOI); figuur 5: leeftijd, geslacht en risk of mortality (ROM); figuur 6: leeftijd, geslacht en Charlson’s comorbidity index, zoals toegepast door D’Hoore (drie digit ICD-9-CM codes) (Tabel 2).325;326;493 Uit de figuren blijkt dat in functie van de gebruikte correctie de afwijking en eventueel de significantie van de afwijking veranderen. Voor ZH 54 bijvoorbeeld bedraagt de afwijking ongeveer + 110 indien er 1) geen risicocorrectie uitgevoerd wordt, of 2) er gecorrigeerd wordt voor leeftijdsgroep en geslacht. In deze gevallen is de afwijking niet alleen belangrijk wegens zijn omvang maar ook statistische significant na een Bonferroni correctie. Daarentegen indien er gecorrigeerd wordt voor leeftijd, geslacht en 1) Severity of Illness (SOI), of 2) Risk of Mortality (ROM), of 3) Charlson daalt de afwijking tot ongeveer + 70 en is het niet langer significant bij Bonferroni correctie. Voor ZH 77 zien we een omgekeerd beeld, behalve wanneer we corrigeren voor leeftijd, geslacht en Charlson. Dit fenomeen van veranderende significanties gaat, bij toenemende
Hoofdstuk 3: Methodologische aspecten
166 risicocorrectie,
vaak
in
de
richting
van
een
verminderende
interziekenhuis
variabiliteit.101;189;329;331 Naast leeftijd en geslacht kozen we de Charlson comorbidity index voor de risicocorrectie in deze studie. Deze index is gebaseerd op ICD-9-CM codes waarover we in de MKG beschikken en houdt minder dan SOI en ROM rekening met verwikkelingen die optraden tijdens het ziekenhuisverblijf. SOI en ROM kunnen dus eventueel mindere kwaliteit reflecteren, hiervoor corrigeren leidt dan tot overadjustment.188;196;197;494 De risicocorrectie met de Charlson’s comorbidity index leidt in het heupfractuur voorbeeld tot het verdwijnen van alle significantie t.o.v. het nationale gemiddelde. Dit neemt niet weg dat er tussen ziekenhuizen significante verschillen bestaan: wanneer anoniem ziekenhuis 45 als vergelijkingsbasis genomen wordt i.p.v. het nationale gemiddelde zijn er 11 ziekenhuizen die significant verschillen met p <0,0001 wat beduidend kleiner is dan de Bonferroni-drempel van p =0,000439.
Figuur 2: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, geen risicocorrectie.
167
40BHoofdstuk 3: Methodologische aspecten Tabel 2: Charlson’s comorbidity index (naar D’Hoore) Punten 1
Nevendiagnosen
ICD-9-CM codes
Myocardinfarct
410
Hartinsufficiëntie
398, 402, 428
Aandoeningen van de perifere
440 – 447
bloedvaten Cerebro-vasculair accident
430 – 433, 435
Dementie
290, 291, 294
Chronische pulmonaire aandoeningen
491 – 493
Systeemziekten
710, 714, 725
Gastro-duodenaal ulcus
531 – 534
Minder ernstige leverziekten
571, 573
Hemiplegie
342, 434, 436, 437
Nierziekten
403, 404, 580 – 586
Diabetes
250
Tumoren
140-195
Leukemie
204 – 208
Lymfomen
200, 202, 203
3
Ernstige leverziekten
070, 570, 572
6
Metastasen
196 – 199
2
Voor een eerste analyse over performance / kwaliteitsindicatoren opteerden we er voor het nationale gemiddelde als referentiepunt te nemen, dat later in het licht van de toetsing van de screening aan de werkelijkheid aangepast kan worden.
168
Hoofdstuk 3: Methodologische aspecten
Figuur 3: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd en geslacht.
Figuur 4: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en SOI
40BHoofdstuk 3: Methodologische aspecten
169
Figuur 5: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, t.o.v. het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en ROM
Figuur 6: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en Charlson’s comorbidity index.
170
Hoofdstuk 3: Methodologische aspecten
3.3.5 Type van uitgevoerde analyses Bij de analyse van een indicator komen er twee aspecten aan bod: een periodeaspect en een evolutie-over-de-tijd aspect (de trend). Door middel van het periodeaspect gaan we na of er ziekenhuizen zijn, die over gans de beschouwde periode samen genomen en vergeleken met al de andere ziekenhuizen significant meer of minder processen of uitkomsten van een bepaald type uitvoeren respectievelijk registreren. Door middel van het evolutieaspect gaan we na of er ziekenhuizen zijn, die over de tijd (per semester/jaar) en vergeleken met al de andere ziekenhuizen significant meer of minder processen of uitkomsten van een bepaald type gaan uitvoeren of registreren. Het is niet eenvoudig een trendanalyse te interpreteren wanneer het aantal observaties per semester klein is (bvb. in geval van mortaliteit) en daarenboven dient men rekening te houden met het fenomeen van de in sectie 3.2 vermelde “regression towards the mean”. De twee types van analyse zijn complementair. Het periodeaspect is preciezer want gebaseerd op grotere aantallen maar is terzelfder tijd meer blootgesteld aan bias omwille van patiëntenselectie en differentiële kwaliteit van de gegevens.313;355;355 Het evolutieaspect daarentegen is minder precies maar minder gevoelig voor bias: het is weinig waarschijnlijk dat patiëntenselectie en gegevenskwaliteit in belangrijke mate gaan veranderen in een korte tijdsspanne. Wel dient er rekening gehouden te worden met een mogelijk fenomeen van “regression to the mean”. 3.3.6 Hulp bij de interpretatie De bedoeling van de analyse is het aanreiken van elementen ter verbetering van de kwaliteit van zorgen binnen het ziekenhuis en niet het “shame and blame of individuals”.495;496 Vooraleer uitspraken te doen over de vermoedelijke kwaliteit van de zorgen dient men na te gaan of codeerproblemen niet de verklaring zijn van de voorgestelde resultaten. Indien er zich geen belangrijke codeerproblemen voordoen, stellen we volgende werkwijze voor. Neem de omvang van de afwijking als aanknopingspunt voor de interpretatie. Vooralsnog nemen we her nationale gemiddelde als “benchmark” waarmee de afwijking
40BHoofdstuk 3: Methodologische aspecten
171
van de individuele ziekenhuizen wordt vergeleken. Verder stellen we voor eerst aandacht te besteden aan het periodeaspect en nadien aan het evolutieaspect (trend). Wegens de inherente beperkingen van administratieve gegevens lijkt het voorzichtig geen “uitspraak” te doen indien de afwijking voor de periode zich tussen + 35% en - 25% bevindt100, een zone van niet-interpretatie, en bij dergelijke waarden eerder aandacht te besteden aan het implementeren van “Algemene maatregelen” (zie verder). Indien de afwijking groter is dan + 35% of kleiner dan – 25% stellen we voor de beschikbare evidentie om tot een outlying ziekenhuis te besluiten als volgt te omschrijven: 1. sterk: indien de probabiliteit om een afwijking te vinden met een waarde, gelijk aan de waarde van het beschouwde ziekenhuis, die kleiner of gelijk is aan 0,05/aantal vergeleken ziekenhuizen (significant na Bonferroni correctie), 2. matig: indien de probabiliteit om een afwijking te vinden met een waarde, gelijk aan de waarde van het beschouwde ziekenhuis, die kleiner of gelijk is aan 0,05 maar groter dan 0,05/aantal ziekenhuizen, 3. zwak: indien de probabiliteit om een afwijking te vinden met een waarde, gelijk aan de waarde van het beschouwde ziekenhuis, die groter is dan 0,05. Voor de trendanalyse volgen we een gelijkaardige benadering. Hier stellen we echter voor 1) alleen een uitspraak te doen indien de omvang van de afwijking voor de trend groter is dan + 5% of kleiner is dan – 5%, en 2) rekening te houden met het fenomeen van “regression to the mean”464 , indien de omvang van de afwijking voor de periode groter of gelijk is aan + 5% of kleiner of gelijk is aan –5%. Wij trachten bij de interpretatie te helpen door ziekenhuizen met zowel potentieel bovenmaatse als met potentieel ondermaatse kwaliteit te identificeren. Voor beide extremen wordt een externe audit aanbevolen om uit te maken of het gaat over een werkelijk (on)gunstige toestand. Verder wordt, in functie van de graad van de aanwezige evidentie, interne audit aanbevolen of ter overweging aangeboden. In alle gevallen worden “Algemene maatregelen” aanbevolen zoals het opvolgen van richtlijnen en protocollen, en het scheppen van een verbeteringsklimaat. Dit bestaat uit sterk en gedreven leiderschap, duidelijke organisatorische verantwoordelijkheid m.b.t. kwaliteit, het toekennen van de
Hoofdstuk 3: Methodologische aspecten
172
nodige middelen voor verbeteringsactiviteiten, klinische audit en zorgvuldige monitoring van vooruitgang en impact.496-498 De beslisboom voor de interpretatie wordt als “Bijlage 1” in hoofdstuk 5, sectie 5.2 verstrekt. 3.3.7 Trend Simulatie Voor het periode aspect van de analyse hadden we in de literatuur een aanknopingspunt voor het bepalen van een zone van niet-interpretatie. Voor het trend aspect hadden we dat niet. We hebben ons derhalve zeer voorzichtig opgesteld. Een kleine simulatie (Tabel 3) waarbij afwisselend een bovengrens en ondergrens van een zone van niet interpretatie voor de trend worden verstrekt geeft aan hoe groot de reële “toegelaten” afwijking wordt bij een trend van 5%, 4%, 3% en 2% boven en onder de nationale trend. Onze gebruikte 5% is werkelijk zeer tolerant. Tabel 3: Trend: simulatie van de invloed van de waarde van de toegestane afwijking (in %) op de boven- en ondergrens van de zone van niet-interpretatie. 5% OG
BG
4% OG
BG
3% OG
BG
2% OG
BG
Semester 1 1,05 0,95 1,04 0,96 1,03 0,97 1,02 0,98 Semester 2 1,10 0,90 1,08 0,92 1,06 0,94 1,04 0,96 Semester 3 1,16 0,86 1,12 0,88 1,09 0,91 1,06 0,94 Semester 4 1,22 0,81 1,17 0,85 1,13 0,89 1,08 0,92 Semester 5 1,28 0,77 1,22 0,82 1,16 0,86 1,10 0,90 Semester 6 1,34 0,74 1,27 0,78 1,19 0,83 1,13 0,89 Semester 7 1,41 0,70 1,32 0,75 1,23 0,81 1,15 0,87 Semester 8 1,48 0,66 1,37 0,72 1,27 0,78 1,17 0,85
40BHoofdstuk 3: Methodologische aspecten
173
3.4 BESLUIT De gevolgde methodologie is een eerste benadering. De opvolging van deze screening zal moeten uitwijzen in welke mate de ziekenhuizen die vermoedelijk outliers zijn dat ook werkelijk zijn. Het valt te verwachten dat de grenzen van de zone van niet-interpretatie voor het trend aspect moeten herzien worden, want te weinig gevoelig. De huidige benchmark bepaling heeft als voornaamste objectief een zinvolle screening mogelijk te maken, waarbij het nationale periodecijfer of trend niet noodzakelijk een ideaal instrument zijn. De keuze van de uiteindelijk te gebruiken benchmark zal in overleg met de sector moeten gebeuren in functie van wat haalbaar en wenselijk lijkt. Het is daarbij belangrijk dat de overheid de nodige middelen ter beschikking stelt en de anonimiteit van de ziekenhuizen opheft voor een visitatie door uit en door de sector erkende experts.
DEEL II: CASUSSEN
177 Hoofdstuk 4: Kwaliteit van administratieve gegevens in België: overlijdensstatistieken en MKG Na in hoofdstuk 1 een referentiekader uitgewerkt te hebben voor het beoordelen van administratieve gegevens, passen we het hier toe op de kwaliteit van de gegevens van de Overlijdensstatistieken en de Minimaal Klinische Gegevens. De bedoeling van dit onderzoek was na te gaan in welke mate deze gegevens bruikbaar zijn voor de beleidsvoering en hoe deze bruikbaarheid kan verhoogd worden. 4.1 KWALITEIT VAN CODERING EN CERTIFICATIE IN VLAANDEREN EN BELGIË, 19801997. We vatten hier het werk samen dat we uitgevoerd hebben tussen 1988 en 2004. Meer uitgebreide versies werden elders gepubliceerd.20;21;33;34;36;120;499-505 Vertrekkend van de vaststelling dat het geïnformatiseerd controleprogramma, dat in België gebruikt werd voor het nagaan van de codeerkwaliteit, slechts een beperkte predictieve waarde had, hebben we een codeervergelijking doorgevoerd met het WGO referentiecentrum van Parijs, waaruit duidelijk de beperkingen van onze codering bleken. Op basis van deze ervaring, van de uitgevoerde kwaliteitscontroles op de gegevens met feedback en discussie naar de codeurs toe (1988-1993) en het informatiseren van de WGO codeerregels werd geleidelijk aan het controleprogramma verder ontwikkeld (1993-1997). Naast de codeerproblematiek hebben we ook de kwaliteit van de certificering onderzocht en meegewerkt aan het conform maken van de Belgische certificaten aan de WGO modellen. Het inzetten van een gecentraliseerd en opgeleid codeerteam in 1993 en dit initiële werk leidden tot een progressieve verbetering van de codeerkwaliteit. Dit vond onder meer een neerslag in volgende publicaties20;120;500: - Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8. - Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg.Diegem Editorial: Kluwer; 1997. p. 914-21.
178
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
- Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997: Quality of coding. Arch Public Health 2005;63(2):127-48. Een verdere neerslag was een master thesis36 en een aantal rapporten21;33;34;499;501-503. Naast de beperkingen op gebied van de kwaliteit van de gegevens hebben we ook andere beperkingen van de overlijdensstatistieken, waaronder het gebrek aan bruikbare sociaaleconomische gegevens, verkend en gepubliceerd.504;505 4.1.1 Codering 4.1.1.1 Inleiding De doodsoorzakenstatistieken zijn in België, zoals in andere landen, een zeer belangrijke informatiebron voor de volksgezondheid.4;35;207;208;227;246;506 Hoewel deze statistieken, op enkele perinatale randgevallen na, als exhaustief kunnen beschouwd worden, is hun accuratesse beperkt zoals onder meer bleek uit de vergelijking van overlijdenscertificaten met medische dossiers of autopsiebevindingen.203;243;244;507;508 Zowel nationale als internationale verschillen in sterftepatronen werden onder meer op gebied van vaatziekten, neoplasmata en diabetes aangetoond.235;509-515De interpretatie van die
verschillen
was
echter
moeilijk
wegens
verschillen
in
certificering-
en
coderingpraktijken, en dit ondanks het bestaan van internationaal geldende regels voor certificering en codering.211;238-242;516Voor ons land bijvoorbeeld werden er in vergelijking met andere Europese landen zowel verschillen in certificering als codering vastgesteld.238Ook de vergelijking van de mortaliteit t.g.v. een acuut myocardinfarct in de doodsoorzakenstatistiek en in de “Multinational Monitoring of Trends and Determinants in Cardiovascular Diseases (MONICA)” registratie toonde een belangrijk probleem van misclassificatie van ischemische hartziekten aan.165 Het gebruik van een van het WGO model27 afwijkend certificaat (Figuur 1), het tot 1993 gedecentraliseerd
coderen,
en
de
voormelde
vastgestelde
codering-
en
certificeringproblemen zetten ons er toe aan de codeerkwaliteit verder te onderzoeken. Voor de evolutie van de codeerkwaliteit in Vlaanderen is het niet onbelangrijk de oprichting in 1993 te vermelden van een centraal codeerteam, dat bestaat uit
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België Figuur 1: Het Belgisch Certificaat en het WGO-model
179
180
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
medewerkers van de Vlaamse Vereniging voor Respiratoire Gezondheidszorg en Tuberculose bestrijding (VRGT). Het Belgische certificaat, dat geldig was tijdens de ganse studieperiode (1980-1997), week in belangrijke mate af van het internationaal model. Het stelde in principe slechts ruimte ter beschikking voor het invullen van een oorspronkelijke en een onmiddellijke doodsoorzaak, hoewel er in de praktijk soms meerdere doodsoorzaken ingevuld werden.33 In figuur 1 worden ter vergelijking het toenmalige Belgische certificaat en het WGO-model nogmaals afgebeeld. Het is evident dat ons certificaat een adequate rapportering van een ingewikkelde causale keten niet echt vergemakkelijkte. 4.1.1.2 Materiaal en methoden De voor de codering gebruikte ICD-9 classificatie bestaat uit 17 hoofdstukken en een bijkomende classificatie voor uitwendige oorzaken. Zij is verder opgedeeld in een aantal onderhoofdstukken, die een aantal verwante aandoeningen groepeert. Aan elke aandoening wordt een code toegekend bestaande uit drie of vier digits, waarbij de vierde digit vaak een verdere verfijning is van een in drie digits weergegeven aandoening. Zo staat 157 voor pancreaskanker en 157.0 voor kanker van de pancreaskop. Om de internationale vergelijkbaarheid te bevorderen bevat de ICD-classificatie in de secties “Regels” en “Noten” een aantal richtlijnen over de manier waarop de oorspronkelijke doodsoorzaak dient geselecteerd te worden.231 Op deze “Regels” en “Noten” hebben wij ons gebaseerd om vier codeeroefeningen uit te voeren. Hierbij werden de codeerfouten als volgt geklasseerd: 0: totale overeenkomst tussen coderen en hercoderen; 1: fout ter hoogte van de vierde digit; 2: fout ter hoogte van de derde digit; 3: fout ter hoogte van een onderhoofdstuk; en, 4: fout ter hoogte van een hoofdstuk. Tabel 1 geeft hier een voorbeeld van. Volgens de Belgische wetgeving dienen de geboorte- en overlijdenscertificaten vernietigd te worden zodra het verificatieproces van de certificaten afgesloten is. Een belangrijk onderdeel van dit proces is het toetsen van de aan de medische gegevens toegekende codes aan de richtlijnen van de ICD-classificatie. Dit houdt in dat na het beëindigen van dit
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
181
proces alleen gecodeerde medische gegevens beschikbaar zijn en dat men niet langer een directe vergelijking tussen certificaat en geregistreerde doodsoorzaak kan maken. Een eerste oefening had als doel de predictieve waarde van het nationale, geautomatiseerde controleprogramma na te gaan, dat de codes en/of anthropometrische waarden van de geboorte- en overlijdenscertificaten verifieert. Van de 10.679 nog niet-vernietigde certificaten van de maand maart 1987 werden er door het programma 122 codes als “na te kijken” opgegeven en verder 178 anthropometrische waarden, die we hier verder buiten de bespreking laten. We gingen na of de 122 als fout bestempelde codes inderdaad fout waren. Om een idee te krijgen over de negatieve voorspellende waarde van het programma, werd ook de accuratesse van de niet gewraakte codes nagegaan. Hierbij was het mogelijk alle codeerregels en -noten te toetsen. Een tweede codeeroefening voerden we uit in samenwerking met het Parijse WGO referentiecentrum op een systematische steekproef van 566 nog niet vernietigde certificaten van het jaar 1988. Ook hier konden alle codeerregels en -noten getoetst worden. Bij het inzetten van een Vlaams gecentraliseerd codeerteam in 1993 werd een derde codeeroefening uitgevoerd. Ditmaal werden in een systematische steekproef van 704 certificaten, gecodeerd door provinciale codeurs van de gezondheidsinspecties in 19891990 en blind hergecodeerd door het nieuwe team in opleiding, de toegekende codes vergeleken met een referentiecode, die met alle codeerregels en –noten rekening hield. Voor een vierde codeeroefening bezorgden het Nationaal Instituut voor de Statistiek en de Administratie Gezondheidszorg van het Ministerie van de Vlaamse Gemeenschap ons de mortaliteitsgegevens voor België voor de jaren 1980-1997 over personen van tenminste één jaar oud. Per individu werden het geslacht, de leeftijdsgroep (minder dan 25 jaar, 2564 jaar en 65 jaar en meer), de woonplaats, de gecodeerde oorspronkelijke en onmiddellijke doodsoorzaken verstrekt. Hier was uiteraard slechts een partiële toetsing van regels en noten mogelijk. Zij beperkte zich tot een beoordeling van de mate waarin een aantal codeerregels opgevolgd werden, die bepalen hoe de oorspronkelijke doodsoorzaak moet gekozen worden.
182
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Belangrijke oorzaken voor het ontstaan van codeervertekeningen zijn het niet toepassen van de regels in verband met “Senilitas”, “Slecht gedefinieerde aandoeningen”, en de zogenaamde “linkage” regel. Deze laatste stelt dat een doodsoorzaak, aanvankelijk gekozen als oorspronkelijke doodsoorzaak, in welomschreven gevallen uiteindelijk niet als oorspronkelijke doodsoorzaak weerhouden wordt. Wanneer de certificerende arts bvb. atherosclerose (ICD-9: 440) als oorspronkelijke doodsoorzaak opgeeft en hartinfarct (ICD9:410) als onmiddellijke, wordt door toepassing van de regel het hartinfarct weerhouden als oorspronkelijke doodsoorzaak en wordt de atherosclerose als bijkomende geregistreerd. Na de voormelde Regels en Noten van de classificatie geprogrammeerd te hebben was het vervolgens mogelijk de gepubliceerde statistieken hieraan te toetsen en een “gecorrigeerde” versie te produceren, die ermee in overeenstemming was gebracht. Tenslotte vergeleken we de “gepubliceerde” met de “gecorrigeerde” versie. Voor deze oefening voerden we voornamelijk grafische analyses uit, aangevuld met een meer formele statistische benadering om op een synthetische manier de determinanten van codeerfouten weer te geven benevens evoluties in de tijd, en conclusies te kunnen trekken over onze nationale en regionale statistieken. We gebruikten hiervoor een multinomiaal logistisch regressie model.517Hierbij groepeerden we, wegens de kleine aantallen, de leeftijdsgroepen van minder dan 25 jaar en die van 25-64 jaar en corrigeerden voor “overdispersion” ten gevolge van correlatie van de gegevens.484 Om de performance van de geprogrammeerde foutendetectie te beoordelen pasten we de geprogrammeerde foutendetectie ook toe op het bestand, dat we gebruikten voor de vergelijking
tussen
Vlaanderen
en
het
WGO
referentiecentrum.
Vermits
de
geprogrammeerde foutendetectie alleen fouten kan opsporen als de gecodeerde onmiddellijke doodsoorzaak verschilt van de gecodeerde oorspronkelijke doodsoorzaak, analyseerden we hier ook de “subset” van gegevens waarin meer dan één doodsoorzaak gecodeerd was.
183
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België Tabel 1: Classificatie van codeerfouten. Originele codering Onmiddellijke Beschrijving doodsoorzaak 198.3 Secundair kwaadaardig neoplasma van de hersenen 036.0 Meningokokken meningitis 410.x Acuut myocard infarct 304.9 Drugsverslaving 571.2 Levercirrose
Beschrijving Oorspronkelijke doodsoorzaak Trachea kanker 162.0
Hercodering Beschrijving Oorspronkelijke doodsoorzaak Trachea kanker 162.0
036.0
413.x
Meningokokken septicemie Angina pectoris
292.9 303.x
Drugspsychose Alcoholafhankelijkheid
304.9 571.2
036.2
410.x
Meningokokken meningitis Acuut myocard infarct Drugsverslaving Levercirrose
Classificatie van een codeerfout 0
1 2 3 4
184
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
4.1.1.3 Resultaten Predictieve waarde van het geautomatiseerd controleprogramma. Van de 122 als fout bestempelde codes bleken er 109 ook fout, of een positieve predictieve waarde van 89%. Daarenboven bleken er zich in deze groep certificaten nog 122 codeerfouten te bevinden, die niet door het programma als verdacht gesignaleerd waren. Niet alleen waren deze door het programma niet-gedetecteerde fouten talrijker maar ook ernstiger (RR:1,35 [95% BI: 1,06;1,72]) dan de gedetecteerde fouten (Tabel 2). Tabel 2: Ernstigheidsgraad en frequentie van de gedetecteerde en niet-gedetecteerde fouten Foutentype
Ernstigheidsgraad 3 of 4
1 of 2
Totaal
Gedetecteerd
51
58
109
Niet-gedetecteerd
77
45
122
Vergelijking Vlaanderen versus WGO Referentie centrum De vergelijking tussen Vlaanderen en het WGO Referentie centrum brengt een groot aantal belangrijke codeerfouten aan het licht: in ¼ van de gevallen betrof het een fout op het niveau van hoofdstuk of onderhoofdstuk (Tabel 3). Vooral in de hoofdstukken van de symptomen (overschatting) en uitwendige oorzaken (onderschatting) werden heel wat codeerfouten aangetroffen.36In de onderhoofdstukken bleken voornamelijk arteriosclerose en “andere respiratoire aandoeningen” overschat en bleken de hartvaatziekten (zonder arteriosclerose) onderschat.
185
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Tabel 3:Verschil tussen de oorspronkelijke (Vlaanderen) en referentie (WGO Frankrijk) codering. Vlaanderen 1988. Verschil
Frequentie
Percent
315
55,7
4e digit
36
6,4
3e digit
74
13,1
Onderhoofdstuk
66
11,7
Hoofdstuk
75
13,3
566
100.0
Geen
Totaal
Vergelijking van provinciale codeurs met de vier leden van een centraal team Uit deze vergelijking blijkt duidelijk dat de leden van het nieuw codeerteam significant minder fouten maakten dan de provinciale codeurs (Tabel 4). Wanneer we de leden van het nieuwe team onderling vergeleken waren de codeerverschillen niet langer significant. Tabel 4:Vergelijking van provinciale codeurs met de vier leden van een centraal team m.b.t. de coderingsprecisie, uitgedrukt als verschil t.o.v. een referentiecode. Verschil Geen 4e digit 3e digit Onderhoofdstuk Hoofdstuk Totaal
Provinciaal 432 (- 5,9) 42 (+2,5) 81 (+9,4) 42 (+3,7) 107 (+8,6) 704
VRGT A 598 (+1,0) 28 (-2,1) 22 (-1,4) 22 (-0,4) 34 (-2,0) 704
VRGT B 629 (+2,3) 18 (-2,0) 11 (-3,4) 14 (-2,0) 32 (-2,3) 704
VRGT C VRGT D 595 (+0,9) 614 ( +1,7) 28 (- 0,1) 28 (- 0,1) 23 (- 1,2) 12 (- 3,3) 23 (- 0,2) 19 (- 1,0) 35 (- 1,9) 31 (- 2,4) 704 704
( ) Vierkantswortel van de celbijdrage tot de chi-kwadraat toets: waarde = 279.983 voor 16 df., met prob. < 0.001
Evolutie van de codeerfouten in de tijd in functie van woonplaats, geslacht en leeftijdsgroep De voornaamste resultaten van de derde oefening500 kunnen als volgt samengevat worden. Over de jaren heen verminderde het aantal codeerfouten significant (van ongeveer 100 ‰ tot 10‰) (Figuur 2).
186
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Figuur 2: Evolutie van het globale foutencijfer en het foutencijfer in functie van hun ernstigheidsgraad in België, 1980-1997. 120
Cijfer(/000)
100 80 60 40 20
Totaal
Hoofdstuk
Onderhoofdstuk
Derde digit
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
1985
1984
1983
1982
1981
1980
0
Vierde digit
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Verder veranderden in de loop der jaren de omvang en het patroon van de codeerfouten in functie van het Gewest van de woonplaats, van het geslacht en van de leeftijdsgroep (hogere foutencijfers in de oudere leeftijdsgroep, lagere cijfers in Brussel) (Fig 3 en 4). De belangrijke proportie certificaten waarin slechts één doodsoorzaak vermeld werd, maakte een analyse in functie van het type pathologie onmogelijk. Figuur 3: Evolutie van het globale foutencijfer in België, per Regio,1980-1997. 140
Cijfer (/1000)
120 100 80 60 40 20
Brussel
Vlaanderen
Wallonië
België
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
1985
1984
1983
1982
1981
1980
0
187
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België Figuur 4: Evolutie van het globale foutencijfer, per geslacht en per leeftijdsgroep. België,1980-1997. 120
Cijfer (/1000)
100 80 60 40 20
01-24jaar
25-64jaar
65jaar+
Mannen
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
1985
1984
1983
1982
1981
1980
0
Vrouwen
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Zoals voormeld is het niet toepassen van de zogenaamde linkage-regel een belangrijke oorzaak voor het ontstaan van de codeervertekeningen, die we illustreerden door figuren 5 en 6. Hierin werd voor de oorspronkelijke doodsoorzaken van ischemische hartzieken (IHD), cerebrovasculair accident (CVA), atherosclerose (ART), en andere hartziekten (OHD) aangegeven in welke mate de geregistreerde onmiddellijke doodsoorzaak door het toepassen van de regel had hergecodeerd moeten worden als oorspronkelijke doodsoorzaak.
188
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Figuur 5: Effect van het hercoderen op de doodsoorzakenstatistieken. Ischemische hartziekten (IHD) en Cerebro-vasculaire accidenten (CVA). België1980-1997.
Cijfer (/1000)
180 160 140 120 100 80 60 40
IHD oorspronkelijk CVA oorspronkelijk
6 19 9
4 19 9
2 19 9
0 19 9
8 19 8
6 19 8
4 19 8
2 19 8
19 8
0
20 0
IHD hergecodeerd CVA hergecodeerd
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Figuur 6: Effect van het hercoderen op de doodsoorzakenstatistieken. Andere hartziekten (OHD) en atherosclerose (ART). België1980-1997.
160
Cijfer (/1000)
140 120 100 80 60 40 20
OHD oorspronkelijk ART oorspronkelijk
19 96
19 94
19 92
19 90
19 88
19 86
19 84
19 82
19 80
0
OHD hergecodeerd ART hergecodeerd
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
189
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Performance van de geprogrammeerde foutendetectie We pasten de geprogrammeerde foutendetectie toe op het bestand, dat gebruikt werd voor de vergelijking tussen Vlaanderen en het WGO referentie centrum (oefening 2) en maakten ook hier een subset aan van de certificaten waarin meer dan één doodsoorzaak gecodeerd werd. Tabel 5: Verdeling van de codeerfouten opgespoord via de geprogrammeerde foutendetectie (volledig bestand en “subset”) versus vastgesteld door het referentiecentrum. Vlaanderen 1988. Fout 0 1 2 3 4 Totaal
Pgm
(%)
Referentie
504 (89.0) 1 (0.2) 14 (2.5) 28 (4.9) 19 (3.4) 566 (100.0)
(%)
315 (55.7) 36 (6.4) 74 (13.1) 66 (11.7) 75 (13.3) 566 (100.2)
PgmNU
(%)
167 (77.7) 1 (0.5) 2 (0.9) 28 (13) 17 (7.9) 215(100.0)
RefNU
(%)
95 (44.2) 14 (6.5) 27 (12.6) 45 (20.9) 34 (15.8) 215 (100.0)
Pgm: geprogrammeerde foutendetectie toegepast op het volledige bestand; Referentie: fouten geïdentificeerd door het referentiecentrum in het volledige bestand; PgmNU: geprogrammeerde foutendetectie toegepast op de subset;RefNU: fouten geïdentificeerd door het referentiecentrum in de subset. Bron: Ministerie van de Vlaamse Gemeenschap
Zoals blijkt uit tabel 5 is de performance van de geprogrammeerde foutendetectie significant kleiner dan die van het Referentiecentrum en dit zowel voor het ganse bestand (p <0.01) als voor de subset (p <0.01). Bij het ganse bestand stelde het referentiecentrum ongeveer driemaal meer fouten van klasse drie en vier vast en bij de subset was dit ongeveer tweemaal zoveel. 4.1.1.4 Discussie Het coderen van overlijdenscertificaten verbeterde aanzienlijk tijdens de periode 19801997. Verscheidene factoren hebben bijgedragen tot deze verbetering. Vergelijkingen met het buitenland via deelname aan internationale studies235;238; contacten met het WGO referentiecentrum;
samenwerking
met
onderzoekers36;120;
en,
vergelijking
met
gespecialiseerde registers zoals het kankerregister134 en MONICA165 speelden hierin een belangrijke rol. Noteren we dat ook door het MONICA register er een duidelijke ondercodering van IHD (36% in Vlaanderen en 32% in Wallonië) werd vastgesteld in de overlijdensstatistieken en een nog belangrijkere ondercodering van het acuut
190
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
myocardinfarct (respectievelijk 41% en 59% in Vlaanderen en Wallonië).165 Verdere op verbetering gerichte acties bestonden uit (1) supervisie van het coderen; (2) samenwerking van de codeerverantwoordelijken van beide Gemeenschappen36; (3) “bevraging”518 van de certificerende artsen wanneer er zich een codeerprobleem voordeed, en (4) initiële en continue vorming van de codeurs in Vlaanderen in 1993 en soortgelijke initiatieven in Wallonië. Bij deze vaststellingen dient men er rekening mee te houden dat de provinciale codeurs géén specifieke vooropleiding gekregen hadden en dat coderen slechts een onderdeel van hun takenpakket vormde. De mindere codeerprestaties in het verleden waren dan ook grotendeels onvermijdelijk. Ze kunnen zeker niet toegeschreven worden aan een gebrek aan inzet van de provinciale codeurs. De vastgestelde verbeteringen mogen echter niet tot een overdreven optimisme leiden. De performance van de geprogrammeerde detectie is immers beperkt zodat een groot aantal codeerfouten niet opgespoord wordt. Verschillende codeerregels en noten vereisen immers een aanpassing van het overlijdenscertificaat aan het WGO-model, wat slechts in 1998 gebeurde. Op de grote proportie van certificaten met slechts één gecodeerde doodsoorzaak (39,5%) kon derhalve de geprogrammeerde detectie niet toegepast worden. De geleidelijke en ongelijke verbetering van de codeerkwaliteit heeft als gevolg dat er voorzichtigheid geboden is bij de interpretatie van (1) tijdreeksen onder meer m.b.t. harten bloedvatenaandoeningen, zoals hartinfarcten en cerebro-vasculaire accidenten, en (2) geografische
verschillen.
Gelukkig
lijkt
vermijdbare
sterfte,
een
belangrijke
gezondheidsindicator, die cruciaal is voor het ontwikkelen en evalueren van een preventieve gezondheidspolitiek en op jongere leeftijdsgroepen (< 65 jaar) van toepassing is, minder aangetast. Een laatste belangrijke tekortkoming van de overlijdensstatistieken is dat zij veel te laattijdig beschikbaar zijn: de laatste Belgische gegevens dateren van 1997.110Dit staat in schrille tegenstelling tot de EU suggestie van een tijdsinterval van ongeveer twee jaar tussen het jaar waarvan de gegevens verzameld worden en hun publicatie.519 Vergeten we
191
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
daarbij niet dat zulke oude gegevens weinig bruikbaar zijn voor de beleidsvoering en dat zij de beleidsmakers slechts matig motiveren om voor de verbetering en de tijdige oplevering van de overlijdensstatistieken de nodige middelen vrij te maken. 4.1.2 Certificatie 4.1.2.1 Inleiding Zoals voormeld in sectie 1.3.1 is de diagnosestelling geen eenvoudige taak en wordt zij beïnvloed door situatiegebonden kenmerken zoals de ter beschikking staande diagnostische middelen en voorkennis over de patiënt. Daarnaast werden er, zoals voormeld,
bij
internationale
vergelijkingen
belangrijke
verschillen
in
certificeringpraktijken vastgesteld.211;238;239;242;516 Een belangrijke oversterfte in december 1989 na een griepepidemie (zie de pijl in Figuur 1) leek dan ook een uitgelezen gelegenheid om de validiteit van de certificering in Vlaanderen te onderzoeken. Figuur 1: Aantal sterfgevallen per maand. België, 1978-1991.
4.1.2.2 Methoden Naar aanleiding van deze oversterfte vroegen we aan 398 Vlaamse artsen het overlijden van een patiënt te hercertificeren op basis van het medisch dossier. Daarvoor dienden ze een vragenlijst in te vullen (zie Bijlage), die onder meer een definitie van de oorspronkelijke, onmiddellijke en bijkomende doodsoorzaken bevatte.36 In overleg met de Orde van de geneesheren en met de medewerking van de gemeentelijke diensten van de burgerlijke stand werd een speciale procedure uitgewerkt om de anonimiteit van de
192
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
overledene kenbaar te maken aan de arts en toch de anonimiteit te bewaren voor de onderzoekers. Van de 398 aangeschreven artsen kregen we 334 antwoorden waarvan er 309 bruikbaar waren voor verdere analyse. De antwoorden werden als niet-bruikbaar bestempeld wanneer de arts meldde dat hij geen toegang had tot het medisch dossier. Voor de vergelijking van de oorspronkelijke certificatie met de hercertificatie op basis van het medisch dossier, klasseerden we de mate van overeenkomst als volgt: 1) zelfde oorspronkelijke doodsoorzaak 2) een omruiling van de originele oorspronkelijke doodsoorzaak met een toenmalige onmiddellijke of bijkomende doodsoorzaak, of, een grotere precisie m.b.t. de natuur of anatomische localisatie van de aandoening of letsel (bvb. Tumor van de long versus longkanker) 3) duidelijk andere oorspronkelijke doodsoorzaak Verder gingen we na of de hercertificatie leidde tot een grotere precisie. Hiervoor werden de diagnoses tentatief gehergroepeerd in: 1) vaag: als het ging over (1) symptomen of hoge leeftijd (ICD-9: 780-799), (2)kankers waarvan de primaire localisatie onbekend was (ICD-9:199), (3) hartfalen (ICD-9: 428-9), en andere ademhalingsziekten (ICD-9: 518.8), 2) precies in de andere gevallen 4.1.2.3. Resultaten Bij de 309 bruikbare antwoorden vonden we een overeenkomst in
188
gevallen
(60,8 %), een omruiling of verschillen in precisie in 58 gevallen (18,8 %) en een totaal andere oorspronkelijke doodsoorzaak in 63 gevallen (20,4 %) (Tabel 1). Het verschil in overeenkomst tussen certificering en hercertificering was veel groter in de oudere leeftijdsgroep (OR: 2,04 [ 95% BI: 1,50; 2,78]).
193
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Tabel 1: Overeenstemming over de oorspronkelijke doodsoorzaak zoals ze oorspronkelijk vermeld was en na hercertificatie. Leeftijdsgroep Overeenstemmend
Omruiling/
Niet
Precisie
overeenstemmend
Totaal
< 80 jaar
155 (67,1 %)
43 (18,6 %)
33 (14,3 %)
231
≥ 80 jaar
33 (42,3 %)
15 (19,2 %)
30 (38,5 %)
78
188 (60,8 %)
58 (18,8 %)
63 (20,4 %)
309
Totaal
In tegenstelling tot de oudere leeftijdsgroep, waar we veeleer een verandering dan wel een precisering (p: 0,53) leken te noteren, leidde de hercertificatie in de jongere leeftijdsgroep blijkbaar wel tot een grotere precisie (p < 0,03). We konden geen significant verschil aantonen tussen het hercertificeren door de arts, die het certificaat invulde, of het hercertificeren door een andere arts. Tabel 2: Graad van precisie van de oorspronkelijke doodsoorzaak zoals ze oorspronkelijk vermeld was en na hercertificatie. < 80 jaar Hercertificatie Certificatie Vaag Precies Totaal 6 4 10 Vaag 13 208 221 Precies 19 212 231 Totaal McNemar: 4,765,df=1,p: 0,0290
≥ 80 jaar Hercertificatie Certificatie Vaag Precies Totaal 5 4 9 Vaag 6 63 69 Precies 11 67 78 Totaal McNemar: 0,400,df=1,p: 0,5271
4.1.2.4. Discussie In de literatuur werden herhaalde malen onnauwkeurigheden bij het invullen van overlijdenscertificaten gedocumenteerd.211;238;239;243;244;508;516 Deze onnauwkeurigheden worden in de hand gewerkt door de moeilijkheid om een unieke, oorspronkelijke doodsoorzaak te definiëren. Zoals voormeld dateert dit concept uit de tijd dat maternale sterfte en infectieuze aandoeningen belangrijke doodsoorzaken waren, maar blijkt het niet adequaat om het ganse proces dat tot de dood leidde weer te geven wanneer er zich verschillende levensbedreigende aandoeningen voordeden.215;219;226;228;246 Een typisch voorbeeld van deze problematiek treffen we aan bij het prostaatcarcinoom bij oudere
194
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
mannen waar het vaak moeilijk is een onderscheid te maken tussen een sterfgeval tengevolge van een prostaatcarcinoom en een sterfgeval waarbij naast een andere oorspronkelijke doodsoorzaak ook een prostaatcarcinoom vermeld wordt.520 Het zal dan ook geen verwondering wekken dat zowel het concept van één oorspronkelijke doodsoorzaak als het WGO-formulier in de oudere leeftijdsgroepen dermate inadequaat bevonden werden dat er in de VS aan een speciaal overlijdensbericht gedacht wordt246. Men kan zich overigens de vraag stellen of een oorspronkelijke doodsoorzaak bij mensen van 80 jaar en meer erg zinvol is in termen van preventie van deze doodsoorzaak. Het is wellicht zinvoller de beperkingen, die optreden bij het ouder worden en de levenskwaliteit negatief beïnvloeden, te registreren en als vertrekpunt te gebruiken voor preventie. Verscheidene methodes werden voorgesteld om de validiteit van het certificeren te bestuderen: een vergelijking tussen overlijdenscertificaat en (1) autopsie rapporten243, (2) ziekenhuisontslaggegevens244, en (3) specifieke enquêtes ter validatie van overlijdenscertificaten246. Wij stelden hier een benadering voor waarbij aan een arts gevraagd werd een sterfgeval te hercertificeren aan de hand van een vragenlijst. Deze vragenlijst bevatte een aantal gesloten vragen en definities. Uit onze vergelijking van het oorspronkelijk certificaat en de hercertificering blijkt duidelijk dat de validiteit van de overlijdensstatistieken, beperkt tot oorspronkelijke doodsoorzaak, zwak is, zeker in de leeftijdsgroep van de tachtig plussers. Het positieve aspect aan deze oefening is de vaststelling dat duidelijker instructies de precisie van de statistiek kunnen verbeteren, zoals blijkt uit de grotere precisie na hercertificatie in de jongere leeftijdsgroep. In de oudere leeftijdsgroep waren de aantallen dermate klein dat we misschien power misten om een eventueel verschil aan te kunnen tonen.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België Bijlage: Vragenlijst
195
196
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
197
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 4.2 KWALITEIT VAN DE GEGEVENS IN EEN PROSPECTIEF FINANCIERINGSSYSTEEM
Wanneer ontslaggegevens in verband met ziekenhuisverblijven alleen gebruikt worden voor de financiering van die ziekenhuizen, is het niet ondenkbeeldig dat de kwaliteit van de registratie door deze finaliteit beïnvloed wordt. Vermits die gegevens naast hun financieringsdoeleinden ook voor kwaliteitsinitiatieven gebruikt worden leek een onderzoek naar hun kwaliteit wenselijk. Gebaseerd op dit onderhoofdstuk, dat onderzoek uit 2004-6 weergeeft, werd aan de Revue d’Epidémiologie et Santé Publique (RESP) volgend manuscript aangeboden: “Miscoding a threat to the hospital care system: How to detect it?”met als auteurs Aelvoet W., Terryn N, Windey F, Redivo M., Faes C, en de Cell Audit.
4.2.1 Inleiding. Vanuit een standpunt van ziekenhuismanagement bleek het wenselijk ziektebeelden met gelijkaardige behandelingen en kosten te hergroeperen. Dit gaf aanleiding tot het ontstaan van het concept Diagnosis Related Group (DRG).2;195 De idee om DRGs te gebruiken als maat voor case mix1 in het kader van terugbetaling van ziekenhuiskosten, berustte op het gegeven dat de verblijfsduur, de afhankelijke variabele bij de bepaling van DRGs, behoorlijk goed correleerde met de totale ziekenhuiskosten.83 Het
prospectief
financieringssysteem,
waarop
ook
het
Belgische
ziekenhuisfinancieringssysteem berust, is gebaseerd op DRGs. Hieronder verstaat men dat ziekenhuizen een vast bedrag ontvangen voor het behandelen van patiënten geklasseerd in een bepaalde ziekte, ongeacht de verblijfsduur of het type zorg, met uitzondering van sommige patiënten met uitzonderlijk hoge kosten, outliers genaamd.521;522Deze tarifering wordt vastgesteld voorafgaandelijk aan de periode waarin de ziekenhuisopnamen zich voordoen, die aan dit tarief zullen terugbetaald worden. In ons land berust dit systeem op de “All Patient Refined Diagnosis Related Groups” (APR-DRGs). In functie van de ernst van de aandoening kent het klassificatie algoritme binnen de APR-DRGs een Severity of Illness (SOI) toe, die in functie van een stijgende ernst van 1 tot 4 gescoord wordt. Het kan dan aanlokkelijk zijn de hoofddiagnose van een verblijfsduur, die te lang is voor de APR-DRG waarin het verblijf geklasseerd werd, zodanig te herformuleren dat zij leidt tot een meer lucratieve classificatie bijvoorbeeld tot
198
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
een classificatie in andere APR-DRG met een gemiddeld langere duur of in dezelfde APRDRG maar met een hogere SOI. Het systematisch en intentioneel overwaarderen van de case mix om een hogere terugbetaling te bekomen wordt
“DRG creep” of
“upcoding” genaamd.83 Men
onderscheidt optimalisatie, wat in overeenstemming is met de codeerregels en “creep”, wat het niet is. Een voorbeeld van optimalisatie is het selecteren van een aanvaardbare, alternatieve hoofddiagnose (“selection” of “gaming”) of het toevoegen van meer secundaire diagnosen (“supplementation”).336 Een voorbeeld van “gaming” is het klasseren van iemand met een systeem lupus en een “milde” chronische nierinsufficiëntie in DRG 316 (“Renal failure diagnoses without dialysis”) i.p.v. in DRG 240 (“Connective-tissue disorders with complicating condition or age > 69”) wat leidt tot een met een derde verhoogde terugbetaling.337 Stippen we hierbij echter aan dat volgens de huidige codeerregels de voormelde systemische lupus verplicht geselecteerd moet worden.523 Bronnen van creep zijn: misspecificatie, fout coderen (“miscoding”) en herrangschikken van diagnosen (“resequencing”). Een codeur, die een TIA codeert als een cerebro-vasculair accident en een informaticus die de door de arts weerhouden hoofddiagnose van acute bronchitis omruilt met de secundaire diagnose van chronische obstructieve longaandoening zijn voorbeelden van respectievelijk fout coderen en herrangschikken.336 Misspecificatie is het ten onrechte specificeren van een diagnose als hoofddiagnose en het optekenen van diagnosen of ingrepen, die niet voorkomen in het medisch dossier.140 Bijvoorbeeld wanneer een behandelende arts voor een opname van een pneumonie, een niet gerelateerd myocardinfarct, dat zich na de opname voordeed, tegen de regels in selecteert als hoofddiagnose spreekt men van misspecificatie. In uitzonderlijke omstandigheden kan een arts verkeerdelijk een diagnose of ingreep vermelden om bij een patiënt een naar zijn mening noodzakelijke behandeling uit te voeren, waarvoor de patiënt bij de geldende regels niet in aanmerking komt, en die door deze misspecificatie wel kan. Dergelijke handeling, hoewel ethisch niet correct, beantwoordt aan het verwachtingspatroon, eigen aan de arts-patiënt relatie. Om dit soort praktijken tegen te gaan is een gezamenlijke inspanning vereist zoals het opstellen of aanpassen van richtlijnen.524-528
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
199
Naast “upcoding” werd ook het tegenovergestelde fenomeen, ondercodering genaamd of “undercoding” in de Angelsaksische literatuur, vastgesteld. Dit bestaat vaak uit een onzorgvuldige abstractie en codering die tot een DRG leiden met een gemiddeld kortere verblijfsduur.1 Soms kan er echter sprake zijn van frauduleuze praktijken waarbij er, door een bewuste ondercodering, naar gestreefd wordt “outlier” te worden in een DRG met een kortere gemiddelde verblijfsduur en daaruit financiële winst te puren. Een DRG studie, uitgevoerd op 7050 opnames onmiddellijk na het invoeren van het prospectieve financieringsmechanisme , toonde een hoog percentage (20,8%) ernstige codeerfouten met een verandering van terugbetaling tot gevolg. Hoewel vroeger ook tussen ongeveer 20 en 75 percent ernstige codeerfouten werden opgetekend, bleken de codeerfouten nu echter niet langer neutraal te zijn maar leidden ze in 61,7% van de gevallen tot een overbetaling.140Misspecificatie door de artsen gaf aanleiding tot de helft van de codeerfouten; in de andere gevallen ging het over het coderen van nietgeattesteerde diagnoses, het toekennen van foutieve ICD-9-CM codes en het herrangschikken van de diagnoses, die door de arts werden opgegeven.336 Als remedie tegen creep formuleerde de Amerikaanse overheid een aantal voorstellen. Een eerste betrof het zich concentreren op een aantal DRGs en een aantal ziekenhuizen. Verder stelde ze voor aselect een voldoende aantal ontslagen na te gaan om de globale integriteit van het systeem te onderzoeken, wat terzelfder tijd een “ontradend” karakter heeft.336 Tenslotte werden artsen verplicht de opgegeven diagnoses te certificeren en werden er peer review organisaties (PROs) opgezet voor de bewaking van de gegevenskwaliteit. Deze maatregelen bleven niet zonder gevolg zoals uit een nieuwe nationale DRG validatie studie bleek: het percentage van ernstige codeerfouten was dan teruggelopen 14,7%, en de codeerfouten resulteerden niet langer systematisch in een hogere terugbetaling.140 De Amerikaanse gezondheidszorgadministratie gaf echter toe niet te beschikken over dergelijke preventieve mechanismen voor de problemen van het foutief coderen of van het herrangschikken.140 Naast een directe vaststelling van creep, werd ook een indirecte maat voor fraude-detectie ontwikkeld: de Medicare Case-mix Index (MCI), die het relatieve gewicht van de
200
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
pathologieën in de financiering weergeeft. Een econometrische analyse over de periode 1980-6 toonde een onterechte toename in “meer rendabele” DRGs, die ongeveer 10% van de toename in de MCI verklaarde. Een ander verrassend en sterk resultaat van de studie betrof de rol van de Peer Review Organisations (PROs): hoe inschikkelijker een PRO hoe hoger de gemiddelde MCI van zijn ziekenhuizen.321 Een samenvatting van de Amerikaanse gegevens voor de fiscale jaren 1981-1987 waarbij de MCI werd opgedeeld in reële en upcoding effecten, geeft aan dat na een aanvankelijke sterke stijging van upcoding, tot 68% van de totale MCI-toename, een afzwakking ervan werd vastgesteld tot 24% van de totale MCI-toename.338Deze systematische opwaardering van de MCI in de hand gewerkt door de invoering van het prospectieve financieringssysteem had het ontstaan van een breuk in de epidemiologische tijdreeksen als gevolg.529 In België zijn er verschillende elementen aanwezig, die het ontstaan van “creep” bevorderen. Vooreerst is er het toenemende belang van de, op het prospectieve financieringsmechanisme
gebaseerde,
verantwoorde
activiteit
waarbij
men
een
overschakeling krijgt van de notie van “erkende” ziekenhuisbedden naar de notie van door pathologie “verantwoorde” ziekenhuisbedden.
Deze verantwoorde activiteit wordt
berekend op basis van oudere MKG-registratiejaren (prospectieve financiering). In het nieuwe systeem hangt de financiering nog alleen af van het aantal gerechtvaardigde verpleegdagen. Hierin spelen APR-DRG, SOI en leeftijd een fundamentele rol. Vervolgens komen APR-DRG en SOI in belangrijke mate tussen in de berekening van het Forfait Klinische Biologie, een andere nieuwe ontwikkeling. Ook de op ons afkomende financieringsmechanismen zoals de referentiebedragen en de forfaitarisering van de verzekeringstegemoetkoming voor de vergoedbare farmaceutische specialiteiten in het ziekenhuis zijn eveneens functie van APR-DRG en SOI. Een juiste codering van deze elementen is bijgevolg een basisvoorwaarde voor de financiering. Naast het prospectieve financieringsmechanisme zijn de geringe frequentie waarmee vooralsnog de controles op de codeerkwaliteit uitgevoerd worden en de beperkte aselecte steekproef (een veertigtal ziekenhuisverblijven), waarop zij gebaseerd zijn, weinig “creepontradend”. Ook wordt in geval van creep, wegens de bestaande gaten in de mazen van het
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
201
juridisch arsenaal, vooralsnog niet tot een concrete bestraffing overgegaan. Vermits er daarenboven in een systeem van een gesloten enveloppe gewerkt wordt, zal een systematische fraude van een ziekenhuis negatieve gevolgen hebben op de financiering van de andere ziekenhuizen. Om al deze redenen werd er besloten een onderzoek uit te voeren om na te gaan of er al dan niet een algemene tendens bestaat van over-codering en frauderende ziekenhuizen op te sporen. 4.2.2 Methodes Design van de studie Voortbouwend op de Amerikaanse ervaringen en op de methodologie ontwikkeld door Kirkhove et al.530 wordt eerst op “macroscopisch” niveau nagegaan (1) of het ziekenhuissysteem in zijn geheel al dan niet een tendens vertoont tot verzwaring van de pathologie, die, indien ze kunstmatig is, de stabiliteit van het systeem in gevaar brengt, en (2) of een eventuele verzwaring geheel of gedeeltelijk te wijten is aan veranderingen in de registratiepraktijk. Twee types van methoden worden hiervoor gebruikt: 1) Het volgen van het verschil in
evolutie tussen de geobserveerde en de
gestandaardiseerde verblijfsduur, berekend volgens de methodologie van de financiering der ziekenhuizen. 2) Het volgen van de evolutie over de jaren van de proportie verblijven met een severity of illness (SOI), graad =1. Het eerste type analyse moet toelaten de algemene efficiëntie van het systeem te beoordelen: een kleiner wordend verschil - vergeleken met de gestandaardiseerde verblijfsduur wordt de geobserveerde verblijfsduur korter - zou wijzen op een systeem dat efficiënter wordt, een constant en een groter wordend verschil zouden respectievelijk op stabiliteit en op een verlies aan efficiëntie wijzen. Bij gebrek aan een onderbouwde referentie, is het echter moeilijk een onderscheid te maken tussen winst in efficiëntie en het effect van een veranderende codeer- of ontslagpraktijk van de ziekenhuizen (bijvoorbeeld d.m.v. een voortijdig ontslag tot een kortere verblijfsduur komen). Een veranderende codeerpraktijk kan op zijn beurt het gevolg zijn zowel van een verbetering van een voorafgaande ondercodering tot een correcte codering als van een overcodering338.
202
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Met het tweede type analyse trachten we aan te tonen of er zich een algemene verzwaring van de pathologie voordoet of niet. Ook hier dient een onderscheid gemaakt te worden tussen reële en artificiële toename. Naast het aspect verzwaring van de pathologie werden ook de “rest diagnosegroepen” bestudeerd, die iets zeggen over de algemene kwaliteit van de gegevens. Type 1, geeft aan dat er geen of geen aanvaardbare hoofddiagnose vermeld werd (APR-DRG 955 en 956). Type 2 (APR-DRG 950, 951 en 952) gaat over verblijven waarvoor een belangrijke chirurgische ingreep vermeld werd, die niet overeenstemt met de hoofddiagnose. In beide gevallen wordt er in de financiering geen gemiddelde verblijfsduur berekend.531 Na een beoordeling van het systeem in zijn geheel wordt er overgegaan tot een globale beoordeling van de individuele ziekenhuizen. Net zoals voor de studie van de stabiliteit van het systeem, werd voor de individuele ziekenhuizen de evolutie van zowel het (gewogen) verschil tussen de geobserveerde en gestandaardiseerde verblijfsduur bestudeerd, als de proportie van verblijven met SOI gelijk aan 1 of van verblijven die in een restdiagnose geklasseerd worden. Tenslotte kan een ziekenhuis handig inspelen om via overcoderen en/of ondercoderen een outlier status te bekomen, die financiële baten oplevert. Daarom worden “kleine” outliers bij SOI klassen 3 en 4 bij personen die levend het ziekenhuis verlaten, en “grote” outliers bij SOI klassen 1 en 2 onderzocht. Waar we niet beschikken over een op de pathologie gebaseerde typologie van de ziekenhuizen, lijkt een vergelijking van SOI en APR-DRG over een globale periode weinig pertinent. Voor individuele ziekenhuizen mag er echter aangenomen worden dat er zich weinig veranderingen in het APR-DRG en SOI patroon “spontaan” zullen voordoen in een tijdsspanne van enkele jaren en lijkt een longitudinale benadering derhalve aangewezen. Dergelijke benadering laat overigens niet alleen het identificeren toe van ziekenhuizen met een “afwijkend temporeel gedrag”, maar biedt tevens een gedeeltelijke correctie voor het fenomeen van stochastische variaties, die maken dat sommige ziekenhuizen – vooral de kleinere – ten onrechte als outlier beschouwd zouden worden. Indien uit de globale beoordeling blijkt dat een ziekenhuis als “afwijkend” t.o.v. het landsgemiddelde dient beschouwd te worden, wordt er, om tot een meer efficiënte fraudeopsporing te komen, overgegaan tot een “gerichte” benadering. Hiervoor doet men
203
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
beroep op de zogenaamde “knipperlichten”. Zij gaan ervan uit dat men de ernstigheidsgraad
van een ziekenhuisopname artificieel kan opwaarderen door een
techniek (zoals mechanische ventilatie) of een pathologie (zoals chronisch obstructief longlijden, septicemie of morbide obesitas) aan het verblijf toe te voegen. Het vergelijkend tijdsverloop van dergelijke pathologie of techniek tussen een individueel ziekenhuis en het geheel der ziekenhuizen laat toe systematisch afwijkende (“outlying”) ziekenhuizen te identificeren en een gerichte keuze van te auditeren dossiers te maken. Het is tevens een supplementaire
screeningsmethode
om
ziekenhuizen
met
eventueel
onjuiste
codeerpraktijken op te sporen. Stippen we hierbij aan dat de audit - het ter plaatse toetsen aan het medisch dossier van de toegekende codes - bepaalt of de statistisch vastgestelde evolutie al dan niet een artefact is. Er werden, op basis van hun klinische waarschijnlijkheid, 21 knipperlichten gedefinieerd. We geven ze hier, zoals in tabellen 2 en 3, onder vorm van hun ICD-9-CM code weer: 038.9: septicemie; 278.00: niet-gespecificeerde obesitas; 278.01: morbide obesitas; 285.1: acute post-hemorragische anemie; 285.9: niet-gespecificeerde anemie; 287.5: niet gespecificeerde thrombocytopenie; 413.9: ander en niet gespecificeerde angor pectoris; 425.4:
primaire
cardiomyopathie;
geleidingsstoornissen;429.79:
overige
426.89: sequelen
overige
gespecificeerde
van
myocardinfarct
NEC;491.21:obstructieve chronische bronchitis met acute exacerbatie; 496: chronische obstructieve longaandoening; 511.9: niet gespecificeerde pleurale uitstorting; 518.81 niet gepreciseerde respiratoire decompensatie; 530.2: slokdarmulcus; 560.39: intestinale impactie, andere; 584.9: niet gespecificeerde nierinsufficiëntie; 585: chronische nierinsufficiëntie; 707.0: doorligwonde; 799.0: asfyxie; V46.1: mechanische ventilatie (“ijzeren long”). Aansluitend op de resultaten van de globale analyse en van de knipperlichten worden er twee types van audit uitgevoerd: 1) een aselecte audit, en 2) een audit op knipperlicht of “gerichte” audit. In geval van een niet-afwijkende globale analyse gaat men over tot een aselecte audit op een gestratificeerde, aselecte steekproef van 48 dossiers, waarbij de stratificatie gebeurt aan de hand van volgende criteria: All Patients Diagnosis Related Groups (AP-DRG) met of zonder verwikkelingen en vier leeftijdsgroepen: < 35 jaar, 35-
204
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
54 jaar, 55-74 jaar en 75 jaar en meer. In geval van een afwijkende globale analyse wordt een
audit op knipperlichten uitgevoerd. Men speurt dan afwijkende proporties van
“lucratieve” aandoeningen op 1) over een globale periode, of 2) in de loop van de tijd (per semester trend). Telkens wordt hierbij een ziekenhuis vergeleken met het geheel van de andere ziekenhuizen. Vermits er belangrijke verschillen bestaan in case mix tussen de ziekenhuizen gaat de aandacht vooral uit naar de evolutie per semester (trend) van het cijfer van het knipperlicht. Een voorbeeld van een afwijkende trend voor septicemie wordt in figuur 1 gegeven. Figuur 1: Septicemie: nationale trend versus een afwijkende trend van een ziekenhuis.
De te selecteren aandoeningen worden gekozen op basis van een rooster met de periodeen evolutiecijfers van de 21 knipperlichten, dat hiervoor werd aangemaakt voor de periode 2000-3. Voor de ziekenhuizen met een macroscopisch afwijkend patroon wordt er, indien er voor een of meerdere knipperlichten een afwijkend verloop wordt vastgesteld, een selectie gemaakt van een 80-tal dossiers op basis van de proportie van dossiers per leeftijdscategorie.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
205
De auditeurs gaan vervolgens na of er zich voldoende gegevens bevinden in de geselecteerde dossiers om de knipperlichtcode te verrechtvaardigen of niet. Zij dienen uit te maken of de afwijkende trend het gevolg is van een reële toename in de frequentie van het bestudeerde knipperlicht of van veranderende codeerpraktijken (het evolueren van ondercoderen naar correct coderen, of van ondercoderen of correct coderen naar overcoderen). Voor de MKG van 2003 werd vanuit een financieringsperspectief een audit gepland voor 6.154 verblijven in 102 ziekenhuizen. Voor 90 (1,5%) verblijven kon het dossier in het ziekenhuis niet terug gevonden worden. 987 dossiers gingen over daghospitalisaties, die niet tussenkomen in de berekening van de ligduur en derhalve niet bruikbaar voor deze studie. Van de 5.077 resterende dossiers werden er 104 verblijven uitgesloten omdat ze betrekking hadden op ziekenhuizen die niet via het toenmalige financieringssysteem betoelaagd werden. We presenteren hier de resultaten van de audits op de bruikbare dossiers (N=4973). Het gaat over 63 aselecte audits waarbij 2.158 verblijven onder de loep werden genomen en over 40 gerichte audits (knipperlichten) over 2.815 verblijven. De statistische methodologie hebben we uitvoerig beschreven in hoofdstuk 3.
4.2.3 Resultaten 4.2.3.1 Macroscopische analyse De variantie-analyse toont aan dat het verschil tussen de geobserveerde (O) en gestandaardiseerde (E) gemiddelde verblijfsduur een significante daling vertoont. Zij kon niet aantonen dat deze daling verschilde in functie van het type ziekenhuis (al dan niet een universitaire functie of publiek versus privaat ziekenhuis). De daling van dit verschil bedraagt ongeveer 0,87 dagen (Tabel 1).
206
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Tabel 1: Geobserveerde en verwachte gemiddelde ligduur. België, 2000-2003. 2000 2001 2002 2003 Geobserveerde gemiddelde verblijfsduur 7,36
7,23
7,06
6,87
Verwachte gemiddelde verblijfsduur
6,94
7,05
7,20
7,32
Verschil gemiddelde verblijfsduur
0,42
0,18
-,14
-,45
In vergelijking met de geobserveerde gemiddelde ligduur voor 2000, dient deze daling als belangrijk beschouwd te worden. Ook is de evolutie van dit verschil niet dezelfde voor het geheel der ziekenhuizen (Figuur 2). Figuur 2: Evolutie van het verschil tussen de geobserveerde en de verwachte gemiddelde ligduur nationaal en in een afwijkend ziekenhuis. België, 2000-2003.
1,5 1
Verschil
0,5 Nationaal
0
Afw. ZH
-0,5 -1 -1,5 2000
2001
2002
2003
Jaar
De analyse van de ratio (O-E)/√E leidt tot gelijkaardige vaststellingen. De Mahalanobis-afstand
(Figuur 3) toont het bestaan aan van drie afwijkende
ziekenhuizen met een probabiliteit ≤ de Bonferroni-gecorrigeerde significantie drempel van 0,000442 (= 0,05/114).118;438;532 Voor 4 ziekenhuizen werd een probabiliteit ≤ 0,01 en groter dan 0,001 genoteerd en voor 7 andere ziekenhuizen was ze ≤ 0,05 en > 0,01. In figuur 3 stelt de y-as de “geobserveerde”probabilistische afstand ten opzichte van de
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
207
evolutie van de nationale gemiddelde verblijfsduur voor. De x-as is dan de “verwachte” probabilistische afstand mocht een ziekenhuis dezelfde evolutie van de verblijfsduur hebben als de nationale. De volle lijn, die de spreiding van de probabilistische afstanden weergeeft indien al de ziekenhuizen een met de nationale vergelijkbare evolutie kennen, is een visuele hulp bij de interpretatie van deze figuur. Figuur 3: Mahalanobis-afstand voor de Belgische Ziekenhuizen, 2000- 2003.
De evolutie van de proportie ziekenhuisverblijven met een SOI gelijk aan één vertoont een significante en aanzienlijk dalende trend (trend van de ORSOI=1 vs SOI >1= 0.90). Hij kan niet toegeschreven worden aan een verschuiving van patiënten met SOI=1 van de klassieke naar de daghospitalisatie, vermits dit fenomeen zich ook in die sector voordoet (Figuur 4). Voor de periode 2000-2003 noteerden we, vergeleken met de nationale trend, een significant lagere trend voor 35 en een significant hogere trend voor 47 ziekenhuizen.
208
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Figuur 4: Evolutie van het percentage verblijven van de SOI klassen in de acute ziekenhuizen en daghospitalisatie.
Percentage verblijven m et SO I = 1 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 2000
2001
D aghospitalisatie
2002
2003
2004
Klassieke H ospitalisatie
Zoals hoger vermeld definieert de financiering van de ziekenhuizen kleine en grote outliers. Voor de kleine outliers stellen we, vergeleken met het nationale gemiddelde, bij 6 ziekenhuizen significant minder outliers vast, bij 22 significant meer en voor 86 geen significant verschil. Voor de grote outliers bedragen deze cijfers respectievelijk, 11, 25 en 78. De proportie ziekenhuizen “met significant meer outliers” is significant groter dan die “met significant minder outliers” en dit zowel voor de kleine (p= 0,0025) als voor de grote (p=0,018) outliers. 4.2.3.2 Gerichte analyse: de knipperlichten Zoals voormeld werden er voor de periode 2000-2003 twee roosters aangemaakt: één rooster met trend-ORs en één met periode-ORs. Voorbeelden van beide roosters worden in tabellen 2 en 3 gegeven. In tabel 2 stemmen de waarden van de eerste rij (in het blauw en vet) overeen met de nationale trend over de semesters van de knipperlichten. De waarden van de vier volgende rijen stemmen overeen met de afwijking voor elk knipperlicht in de eerste vier ziekenhuizen t.o.v. die nationale trend.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
209
Voor 12 knipperlichten was de nationale trend stijgend, voor 7 was hij stationair en voor 2 daalde hij. De laatste kolom met als hoofding “Totaal” geeft aan hoeveel knipperlichten als afwijkend moeten geïnterpreteerd worden. Voor de ziekenhuizen en voor de nationale trend worden alle niet-significant stijgende odds ratio’s als 1 weergegeven. In tabel 3 worden de periode odds ratio’s voor dezlfde vier ziekenhuizen weergegeven. Ook hier worden de niet significant afwijkende ORs voor de leesbaarheid als 1 weergegeven en geeft de kolom “Totaal” aan hoeveel knipperlichten als afwijkend moeten geïnterpreteerd worden. Hier wordt geen nationale odds ratio berekend omdat die per definitie gelijk is aan 1. 4.2.3.3 Resultaten van de audit In het kader van fraude detectie stelt de politieke overheid dat men alleen tot fraude kan besluiten indien een systematische foutieve codering ook daadwerkelijk leidt tot een financiële winst voor het frauderend ziekenhuis. De onenigheden tussen auditeur en geauditeerde worden in tabel 4 weergegeven. Hierin worden het aantal en de proporties van juiste en foute coderingen weergegeven, benevens hun globale weerslag op de ligduur (LOS).
210
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Tabel 2: Overzichtstabel van de trend van odds ratio's, waarbij een ziekenhuis met het nationale gemiddelde vergeleken wordt, voor een selectie knipperlichten en ook de trend van het geheel der Belgische ziekenhuizen (in het vet). België, 2000-2003. 0389278002780128512859 1 1,14 1,12 1,09 1,19 1 1 1.16 1.32 1 1 1 1 1 1.16 1 1 1 1.12 1.12 1 1.34 1.41 1 1.48
2875 4139 4254 42689 42979 49121 496 5119 51881 5302 56039 5849 585 7070 1 1,07 0,75 1 1 1 1,19 1,48 0,89 1 1,06 1,09 1 1,1 1.16 1 1 1 1.15 1.21 1.29 1 1 1 1.15 1 1.25 1 1.16 1.26 1.86 1 1.22 1 1.19 1 1 1.60 1 1 1 1 1 1 1.14 1 1 1.37 1.17 1 1 1 1 1 1.10 1.26 1.22 1 1 1 1 1 1 1 1.20 1 1 1 1 1
7990 V461 Totaal 1,26 1,47 14 1.12 1 9 1 1 7 1 1 7 1.20 1 6
Nota’s: 1) de hoofding van de kolommen bevat de ICD-9-CM code van de verschillende knipperlichten. 2) de niet-significante odds ratio's worden in de tabel met een 1 weergegeven. 3) een rij wordt gevormd door de waarden voor een bepaald ziekenhuis van elk knipperlicht. Deze waarden geven telkens de afwijking van een ziekenhuis t.o.v.de nationale trend weer 4) de rij met vette cijfers geeft voor elk knipperlicht de waarde van de nationale trend aan. Tabel 3: Overzichtstabel van de periode ORs voor een selectie knipperlichten. België, 2000-2003. 0389 27800
27801
2851
2859
2875
4139
4254
49121
496
5119
51881
5302
56039
5849
585
7070
7990
V461
Totaal
1.72
1
4.46
1.65
4.13
1
1
1
42689 42979 1
1
14.50
2.46
1
1
2.11
1
1.39
1.39
1
1
134.77
10
2.24
1
1
1
1
2.56
1
1
1
1
13.43
1
1
1
3.39
1
1
1
1
1
2.81
5
2.04
1
3.55
2.21
1
1.36
3.49
1
1
1
14.92
1
6.01
2.69
1
1
1
1
1
1.56
9.13
10
1
3.55
1
1
1
1
1
1
1
1
32.63
1
1.59
1
1
1
2.56
1
1
1.40
164.53
6
Nota’s: 1) de hoofding van de kolommen bevat de ICD-9-CM code van de verschillende knipperlichten. 2) de niet-significante odds ratio's worden in de tabel met een 1 weergegeven. 3) een rij wordt gevormd door de waarden voor een bepaald ziekenhuis van elk knipperlicht. Deze waarden geven telkens de afwijking van een ziekenhuis t.o.v. het nationale gemiddelde weer
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
211
Aangezien de audit ging over verschillende AP-DRGs/ knipperlichten en uitgevoerd werd door verschillende auditeurs is het moeilijk besluiten te trekken op ziekenhuisniveau. Toch menen we dat op nationaal niveau een aantal voorzichtige vaststellingen mogelijk zijn. Er lijken nog steeds een groot aantal codeerfouten gemaakt te worden: respectievelijk 38,6 % voor de aselecte audit en 44,4% voor de gerichte audit. Dat er significant meer onenigheden (RR:1,14; 95%BI [1,07-1,22]) aangetroffen worden in de gerichte steekproef beantwoordt aan de verwachtingen. Evenmin lijkt het verwonderlijk dat, n.a.v. een gerichte audit, er zich in belangrijke mate meer veranderingen in de toekenning van de APR-DRG voordoen wanneer tijdens een aselecte audit het ganse dossier wordt doorgenomen (RR:3,03; 95% BI [2,33-3,93]) en niet alleen de gewraakte nevendiagnose. Het is verder opmerkelijk dat voor beide types audit ongeveer 7/10 van de onenigheden geen weerslag hebben in termen van APR-DRG, SOI en LOS, al zijn ze proportioneel significant talrijker bij de aselecte audit (RR: 1,06; 95% BI [1,00 - 1,12]). In geval er alleen een verandering optreedt van SOI, blijken er bij de gerichte audit duidelijk meer en significante veranderingen te bestaan (RR:1,72; 95% BI [1,39-2,12]), die significant vaker in de richting gaan van een dalende SOI dan bij een aselecte audit (RR:1,59; 95% BI [1,35-1,88]). Bij de aselecte audits is de proportie (0,56) van verblijven met dalende SOI (65) over het totaal van verblijven niet significant verschillend van 0,5 (p = 0.2273). Voor de gerichte audit bedraagt deze proportie 0,89 (95%BI [0,85;0,92]) en p <0,0001. Al deze bevindingen schijnen erop te wijzen dat er nog een groot aantal codeerfouten gemaakt worden, dat er nog steeds ondercodering bestaat (56,0% van de verblijven van de gerichte audits, uitgevoerd wegens een afwijkende stijgende trend, bleken correct gecodeerd), dat de gerichte audits bij foutieve codering een fraudedetecterend vermogen lijken te hebben, en dat aselecte audits aantonen dat er in ziekenhuizen met een nietafwijkend codeergedrag er nog een belangrijk aantal codeerfouten gemaakt worden.
212
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Tabel 4: Onenigheden tussen auditeur en geauditeerde. Per type audit: aantal, percentage, weerslag op APR-DRG-, SOI toekenning aan de verblijven, en verschil in ligduur. Aselect Geanalyseerde verblijven
Verblijven
%
2158
Gericht Dagen
Verblijven
%
Dagen
100
2815
100
1326
61,5
1575
56,0
832
38,6
-28.23
1240
44,0
- 642,68
574
26,7
0
906
32,2
0
142
6,6
8,75
74
2,6
-224,61
51
2,4
148,28
28
1,0
0,59
65
3,0
-185,26
232
8,2
- 418,65
Verblijven zonder onenigheden Verblijven met onenigheden Verblijven met foutieve codes zonder weerslag op gebied van APR-DRG /SOI Verblijven met een verandering van APRDRG en eventueel SOI Verblijven met een toename van SOI zonder verandering van APRDRG Verblijven met een daling van SOI zonder verandering van APRDRG
APR-DRG: all patient refined diagnosis related groups; SOI: severity of illness; Dagen: veranderingen in LOS uitgedrukt in dagen = dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit.
Vermits de selectie van de knipperlichten gebaseerd is op hun fraudepotentieel, beoordeeld op gronden van klinische waarschijnlijkheid, lijkt het zinvol hun waarde als opsporingsmiddel van “up-coding” beter te omschrijven aan de hand van de opgedane ervaring. Daarom keken we ook, in gevallen van onenigheid, naar de mate van onenigheid tussen auditeur en geauditeerde per knipperlicht (Tabel 6).
213
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Vooral chronische obstructieve longaandoening (496), morbide obesitas (278.01), niet gepreciseerde respiratoire decompensatie (518.81), chronische nierinsufficiëntie (585) en doorligwonden (707) schijnen efficiënte knipperlichten te zijn. Acute post-hemorragische (285.1) en niet-gespecificeerde anemie (285.9) schijnen weinig efficiënte knipperlichten op gebied van fraudedetectie en lijken meer een teken van onzorgvuldig coderen te zijn. Tabel 6: Onenigheid tussen auditeur en geauditeerde voor een bepaalde aandoening: aantal, percentage en weerslag op de LOS. ICD-9-CM code
V
D+
V
038.9
13
108.53
278.01
4
285.1
D-
V
D0
V
Totaal
28 -122.69
87
0
128
-14.16
34.94
22
-74.91
76
0
102
-39.97
5
39.22
3
-5.39
59
0
67
33.82
285.9
13
32.51
8
-75.23
70
0
91
-42.73
287.5
1
2.72
4
-8.65
59
0
64
-5.92
425.4
1
23.30
15
-79.65
25
0
41
-56.35
426.89
0
0
0
0
18
0
18
0
429.79
0
0
2
-8.10
33
0
35
-8.10
496
6
34.31
72 -171.93 322
0
400 -137.62
518.81
13
43.24
77 -400.17
56
0
146 -356.92
560.39
1
1.94
1
-2.88
33
0
35
-0.94
585
3
24.57
7
-21.49
92
0
102
3.09
707.0X
1
0.33
3
-17.20
7
0
11
-16.87
Totaal
61
345.62 242 -988.30 937
0 1240 -642.68
V: aantal verblijven; D+: toename van LOS uitgedrukt in dagen (dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit ); D- : daling van LOS uitgedrukt in dagen (dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit ); D0: geen verandering in LOS
214
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Naast deze explorerende benadering wordt op dit ogenblik op basis van het algoritme dat de SOI toekent195 systematisch gezocht naar nieuwe knipperlichten. Deze aanpak moet toelaten het detectiearsenaal te optimaliseren. Merken we tenslotte op dat er naast evidentie van een evolutie van onder-coderen naar normo-coderen er een groot aantal abstractie- en codeerfouten gemaakt worden zonder weerslag op de financiering maar die wel andere toepassingen van de MKG, zoals indicatoren van performance/kwaliteit, in gevaar kunnen brengen.
4.2.4 Discussie Wij hebben een belangrijke evolutie kunnen aantonen van het verschil tussen de waargenomen en verwachte gemiddelde ligduur in de Belgische ziekenhuizen. Ook stelden we een aanzienlijk aantal codeerfouten vast zonder financiële implicaties en dit zowel tijdens de aselecte als de gerichte audits. Bij gerichte audits, uitgevoerd wegens een opwaartse trend van een knipperlicht, werd er in meer dan de helft der gevallen geen codeerfout aangetroffen, wat, indien supplementatie uitgsloten werd, wijst op een verbetering van de codeerpraktijk in die ziekenhuizen. Verder bleken de codeerfouten vastgesteld tijdens een aselecte audit zeer bi-directioneel te zijn, waar dit voor de gerichte audits helemaal niet het geval was. In het laatste geval werd er een onterechte verlenging van de verblijfsduur vastgesteld van 642,68 dagen voor 334 verblijven wat ons vermoeden van fraude bevestigde. Deze bevindingen kunnen bijgedragen hebben tot de veranderingen in de geobserveerde en verwachte verblijfsduur. Ook op het niveau van de individuele ziekenhuizen stelden we sterk afwijkende tijdtrends vast en dit zowel op het niveau van de macroanalyse als op dat van de knipperlichten. Het fout coderen heeft meerdere ongewenste gevolgen. Naast de financiële en epidemiologische
implicaties op het gebied van respectievelijk kostenbeheersing en
529
tijdsreeksen , bemoeilijken zij de analyse van kwaliteitsindicatoren op basis van administratieve gegevens door hun vertekenend impact op de co-morbiditeit en bijgevolg op de risicocorrectie. Ook benadeelt het frauduleus coderen door een ziekenhuis de financiering van de andere ziekenhuizen omdat voor de ziekenhuisfinanciering een vast bedrag voorzien is voor het geheel der ziekenhuizen. Verder kunnen codeerafwijkingen leiden tot moeilijkheden bij de interpretatie van de evolutie van belangrijke kenmerken van
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
215
het zorgsysteem zoals de zwaarte van de pathologie. Tenslotte kunnen zij de evaluatie van het functioneren van het zorgsysteem verstoren, met name wanneer de geobserveerde verblijfsduur vergeleken wordt met de verwachte verblijfsduur kan een systematische overcodering de berekening van de verwachte verblijfsduur verstoren. Fraude is derhalve een praktijk die niet alleen de financiering van het gezondheidssysteem maar ook de bruikbaarheid van de MKG voor het volksgezondheidsbeleid in gevaar brengt. Nochtans toont de ervaring aan dat het fraudebevorderend effect van het PPS kan tegengegaan worden. Maatregelen zoals het verplicht attesteren door de behandelende geneesheer van de bij ontslag vermelde diagnoses en ingrepen, en de kordate audit van de ontslaggegevens met financiële weerslag in geval van fraude hebben hun doeltreffendheid bewezen.140;321;336 Onze studie vertoont een aantal beperkingen. Zo is de keuze van knipperlichten, gebaseerd op hun klinisch potentieel, voor verbetering vatbaar. Een selectie gebaseerd op een grondige analyse van het algoritme dat de SOI-klasse toekent is wellicht efficiënter. Verder is het niet onmogelijk dat de lineaire trend, die we gebruikten, niet altijd in de best mogelijk fit van het model resulteerde. We menen nochtans dat de bereikte fits een efficiënte, routinematig uitgevoerde fraudedetectie toelieten. Tenslotte is het aannemelijk dat ziekenhuizen, die reeds lang frauduleus coderen en een bepaald fraudeniveau aanhouden, ontsnappen aan onze, op een trendanalyse toegespitste fraudeopsporing. Aan dit euvel kan verholpen worden door imput van de aselecte audits te gebruiken en door een classificatie van de ziekenhuizen in termen van case mix uit te werken, die de periodeanalyse meer zinvol zou maken. Een andere zwakte van onze studie bestaat uit een mogelijk maar moeilijk te meten gebrek aan interbeoordelaar betrouwbaarheid tussen de auditeurs, wat tot verschillende appreciaties zou kunnen geleid hebben bij een zelfde type van codeerprobleem. Interbeoordelaar variabiliteit is een welbekend nadeel verbonden aan het peer-review 279;349
, waaraan we trachten te verhelpen door intensieve casusbesprekingen door de
auditeurs, door het uitwerken van en verwijzen naar nationale codeerrichtlijnen en door in de mogelijkheid te voorzien om beroep aan te tekenen voor een ziekenhuis dat zich onrechtvaardig behandeld voelt.
216
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
Het was vooralsnog niet mogelijk, wegens het beperkt aantal auditeurs, op een correcte manier aselecte en gerichte audits met elkaar te vergelijken op hun doeltreffendheid. Dergelijke doelstelling veronderstelt immers het uitvoeren in dezelfde ziekenhuizen van beide types van audit op hetzelfde ogenblik, een doelstelling die we in de toekomst hopen te verwezenlijken. Zoals voormeld vertoont het ‘systeem’ een neiging tot verzwaring van de pathologie en dit zowel voor ziekenhuisopnamen als voor daghospitalisaties. Is dit een reëel verschijnsel en betekent dit dat de gezondheid van de bevolking erop achteruit gaat, of dat zieken meer laattijdig opgenomen worden (verminderde toegankelijkheid van het gezondheidssysteem), of vertaalt dit een groeiend bewustzijn bij de artsen van een tot dan onderschat gezondheidsprobleem, of heeft dit te maken met het aanbieden van meer gespecialiseerde diensten, of is dit een gevolg van veranderende codeergewoonten? We hebben het bestaan aangetoond zowel van verbetering van het coderen als van het overcoderen. Het is niet onwaarschijnlijk dat nog andere van deze fenomenen bijdragen tot de vastgestelde verzwaring van de pathologie. De voorgestelde knipperlichtmethodologie is alleen een screening: namelijk het vaststellen van een afwijkende evolutie van een knipperlicht. Het is de audit die uiteindelijk bepaalt of en in welke mate de afwijkende evolutie te wijten is aan het ten onrechte toekennen van «verzwarende» codes. De knipperlichtenmethode, vooralsnog een concept, heeft nood aan feedback en input van de auditeurs om zijn nut aan te tonen en te verhogen. Het chronisch gebrek aan dit type personeel is hierbij een te betreuren belemmering. Een sporadisch uitgevoerde audit kan overigens niet dezelfde graad van ontrading genereren op de ziekenhuizen om niet-correct te coderen als een regelmatige audit. Tenslotte wensen wij de noodzaak te onderstrepen om de MKG te gebruiken vanuit meerdere, complementaire invalshoeken. De kwaliteit van de gegevens is hier een illustratie van. Het overcoderen bijvoorbeeld, berust vaak op een kunstmatige verzwaring van de pathologie en verwikkelingen, zoals septicemie, zijn hiervoor een geschikt instrument.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
217
De ICD-9CM classificatie en de erop gebaseerde APR-DRG en SOI bepalingen, maken geen onderscheid tussen bestaande en in het ziekenhuis opgelopen verwikkelingen. Vermits de financiering op haar beurt gebaseerd is op APR-DRGs en SOIs, levert dit bijgevolg ook winst op aan het ziekenhuis in termen van de “verantwoorde activiteit”. Toch lijkt het niet onlogisch dat de meerkosten die voortvloeien uit de behandeling van verwikkelingen vergoed worden, ook al zijn ze iatrogeen. Het is dan wel nodig dat de kwaliteit van de zorgen bijgestuurd wordt. Dit zorgenaspect veronderstelt een goede monitoring van de zorgenkwaliteit via de MKG, die op zijn beurt een adequate risicocorrectie veronderstelt. De gerichte audit lijkt derhalve belangrijk om, gecombineerd met de aselecte audit, de codeerkwaliteit van het geheel der ziekenhuizen op te volgen en te evalueren, en op die manier de monitoring van de kwaliteit van zorgen gebaseerd op onze administratieve gegevens op een zinvolle manier mogelijk te maken.
4.3 ALGEMEEN BESLUIT Tijdens het ganse verzamelings- en verwerkingsproces, van af de diagnosestelling tot het aanmaken van het gegevensbestand kunnen onvolmaaktheden, fouten en vergetelheid de kwaliteit van de gegevens aantasten en doen ze dit ook werkelijk. Ook varieert de kwaliteit van de gegevens over de tijd en is functie van de leeftijd, geslacht van de geregistreerde; van het type aandoening; van het type medische handeling (diagnose, ingreep); van het gebruik van de gegevens door de diensten, die registreren; en, van het registratiesysteem en zijn bewakingsmechanismen. Dit betekent niet dat deze gegevens onbruikbaar zijn – laten we de baby niet weggooien met het badwater533 – wel (1) dat ze grondig op hun waarde getoetst moeten worden, en (2) dat er voorzichtig omgesprongen wordt met de interpretatie van de resultaten van uitgevoerde studies. De nodige methoden en na te volgen voorbeelden van “hoe het kan” zijn voorhanden. Verder zijn samenwerking met andere registraties, creativiteit bij de validatie, feedback en intensieve audit noodzakelijk, zeker wanneer deze gegevens een belangrijke rol blijken te spelen in het financieringsmechanisme van ziekenhuizen en het gebruik van kwaliteitsindicatoren. Vorming van de artsen, stringente regelgeving op het aanmaken van
218
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
de gegevensbestanden met inbegrip van het verplicht attesteren van de diagnosen door de arts en intensief peer review kunnen in belangrijke mate de verstoring van de gegevenskwaliteit veroorzaakt door het financieringsmechanisme opvangen. De kwaliteit van de gegevens van de overlijdensstatistieken deelt grotendeels in de gebreken van de ziekenhuisontslaggegevens. Specifieke moeilijkheden worden gesteld door de certificatie met zijn specifieke, oorzakelijke logica, waar artsen vaak geneigd zijn te redeneren vanuit het principe van de ernst. Ook hier lijkt een adequate vorming van de artsen een noodzakelijke voorwaarde voor verbetering. Hoewel over het ganse land een duidelijke verbetering van de codeerkwaliteit wordt vastgesteld blijft de tijdigheid van de statistiek problematisch in het zuidelijk landsgedeelte en derhalve ook van de nationale statistiek.
Vergeten
we
hierbij
niet
“dat
er
binnen
het
systeem
van
de
bevolkingsstatistieken geen enkele andere bron voor gezondheidsgegevens bestaat, die even
universeel 250
sterftegegevens.”
is
in
dekkingsgraad,
in
uniformiteit,
en
tijdigheid
als
de
219 Hoofdstuk 5: Kwaliteit van zorgen In dit hoofdstuk trachten we aan de hand van twee casussen het gebruik te illustreren van administratieve gegevens, in casu de MKG, ten behoeve van de volksgezondheid. Zij geven de mogelijkheden en beperkingen van administratieve gegevens weer op gebied van het beoordelen van de kwaliteit van zorgen in de Belgische ziekenhuizen. Dit gebeurt enerzijds via de analyse van interziekenhuis verschillen m.b.t. het keizersnedencijfer, een procesindicator, en anderzijds via een gelijkaardige analyse maar dit keer op gebied van letaliteit na een opname voor acuut myocardinfarct, een uitkomstindicator. Deze twee kwaliteitsindicatoren werden uitgewerkt volgens de in deel I voorgestelde concepten en uitgewerkte methodologie Kwaliteit is echter organisatiegebonden en kwaliteitsinitiatieven vinden plaats binnen organisaties, die zelf deel uitmaken van het gezondheidssysteem. Veranderingen zullen derhalve een “multifaceted” en organisatorische aanpak vragen.534-536 Het is hier onze bedoeling beide kwaliteitsinitiatieven te kaderen in een organisatorisch perspectief, dat een aantal aanknopingspunten biedt voor hun welslagen. 5.1 INLEIDING: KWALITEIT VAN ZORGEN, ORGANISATORISCHE CULTUUR EN ADEQUATE GEGEVENS.
Sinds oktober 1990 worden de Minimale Klinische Gegevens (MKG) door de ziekenhuizen geregistreerd en vervolgens door de overheid verzameld en verwerkt. Deze gegevensset werd ontwikkeld in overeenstemming met Europese aanbevelingen.537 Vooralsnog werden de MKG voornamelijk gebruikt voor de financiering van de ziekenhuizen. Het is in dit proefschrift de bedoeling het toepassingsgebied van de MKG uit te breiden naar kwaliteit257/performance264 van de zorgen en de resultaten van deze eerste verkenning ter beschikking te stellen van clinici, ziekenhuisverantwoordelijken, artsencolleges en de overheid, als “borger” van de publieke belangen.72 Dergelijke informatie, hoe partieel ook, biedt niet alleen aan de zorgensector de mogelijkheid tot kwaliteitstoetsing en verbetering waar nodig maar is ook fundamenteel voor het voeren van een gezondheidsbeleid, zeker voor een “terugtredende” overheid, die de
220
Hoofdstuk 5: Kwaliteit van zorgen
dagdagelijkse verantwoordelijkheid voor de zorgen “uitbesteedt” maar wel de “toezichthouder, marktmeester en de borger van publieke belangen” blijft.72 Zoals voormeld (Hoofdstuk 2, sectie 2.1.1) zijn kwaliteit en performance echter complexe begrippen, die op verschillende manieren gedefinieerd worden en die mekaar vaak overlappen.72;262 doeltreffendheid 6;15;16;538;539
en 265
waarvan
(“efficacy”),
doeltreffendheid13 13
doelmatigheid
(“effectiveness”),
potentiële
(“efficiency”), billijkheid (“equity”)
en verantwoording afleggen (“accountability”)70;71;540;541 door zorgverstrekkers
en overheid basisbegrippen vormen(Hoofdstuk 2, sectie 2.1.1). Donabedian voegt hieraan de begrippen aanvaardbaarheid van de behandeling, legitimiteit en optimaliteit toe om tot een overkoepelende visie van kwaliteit te komen.265 Aanvaardbaarheid van de behandeling houdt in dat artsen rekening houden met patiëntenvoorkeuren, met zijn vragen en bekommernissen waaronder de kosten, en hem de doeltreffendheid van de zorg zodanig uitlegt dat de patiënt een werkelijk geïnformeerde keuze kan maken. Deze speciale focus op de patiënt, de zogenaamde patientcenteredness265;268;542, en ook op het tijdig verstrekken van zorgen krijgen overigens heden ten dage steeds meer aandacht bij de beoordeling van kwaliteit268;543. Legitimiteit betekent dat de zorg aanvaardbaar moet zijn voor de maatschappij. Optimaliteit tenslotte wordt bereikt wanneer de verstrekte zorg “optimaal” doeltreffend is of bij de beste verhouding tussen kwaliteit en kosten. Kwaliteitselementen kunnen elkaar versterken of integendeel met mekaar in conflict komen. De meest storende conflicten ontstaan wanneer maatschappelijke en individuele voorkeuren verschillen. Het is dan de faire verdeling over de ganse bevolking van zorgen in functie van medische noden, risico en het nut van de zorgen, die het arbitrageproces dient te leiden.265;270Kwaliteit, waarin het begrip aanvaardbaarheid voor de individuele patiënt en voor de maatschappij vervat zijn, kan dus niet alleen in technische termen beoordeeld worden door professionele zorgverleners.257;265;269 In deze visie, die onze analyses inspireerde, wordt er bijgevolg rekening gehouden met zowel technische aspecten als interpersonele relaties.257;265
221
Hoofdstuk 5: Kwaliteit van zorgen
Administratieve gegevens, zoals onze MKG, laten echter niet toe de kwaliteit van zorgen in hun totaliteit te meten. Zij zijn immers alleen een neerslag van een selectie van technische aspecten van zorg in verband met diagnose, behandeling en uitkomsten. Uitkomsten van behandelingen kunnen uitgedrukt worden als de som van de doeltreffendheid van de behandeling plus risicofactoren, die het antwoord op de behandeling beïnvloeden, plus kwaliteit van de zorg plus toeval.188Vermits de doeltreffendheid van een behandeling gekend is en de toevalsfactor door statistische methodologie kan ondervangen worden, is het mogelijk de kwaliteit van de verstrekte zorgen te beoordelen op voorwaarde dat men corrigeert voor de risicofactoren.178;188Door de afwezigheid van een ideaal systeem van risicocorrectie en het feit dat de gebruikte systemen tot verschillende resultaten leiden is deze correctie, zoals voormeld (Hoofdstuk 2, sectie 2.2.1.4), geen eenvoudige zaak189;325 en stelt men dat de grootste voorzichtigheid geboden
is
bij
102;103;319;494
gegevens
de
interpretatie
van
studies
gebaseerd
op
administratieve
.Verder is het zo dat risicocorrectie niet alleen problemen kan stellen
wanneer het over uitkomstindicatoren gaat maar ook bij de interpretatie van procesindicatoren zoals het onder- of overgebruik van diensten. Overigens hebben we te maken met nog andere beperkingen en onzekerheden: verschillen in definities van diagnosen en ingrepen, en onvoldoende correctie voor vertekening (“confounding”) door geen of onvoldoende rekening te houden met de sociaaleconomische status (SES) en met verwijzingspatronen en andere vormen van patiëntenselectie544.
Een
laatste,
dubbele
onzekerheid
houdt
verband
met
de
onvolmaaktheid van de gegevens en dit enerzijds wegens problemen in verband met het abstraheerproces en het toekennen van een diagnose en
anderzijds wegens
codeerproblemen (overcodering en ondercodering), die maken dat de vergelijkingen tussen ziekenhuizen vertekend kunnen zijn.1;60;79;101;135;138;163;169;189;312;319. Administratieve gegevens laten derhalve geen definitieve uitspraken toe op gebied van kwaliteit/performance. Hun gebruik als een screening545 naar onder- en bovenmaatse kwaliteit van zorgen op basis van duidelijk omschreven en goed geregistreerde processen (bijvoorbeeld het keizersnedencijfer) of uitkomsten [bijvoorbeeld perinatale uitkomsten na keizersnede, en sterfte na een acuut myocardinfarct (AMI)] lijkt wel een bruikbare
222
Hoofdstuk 5: Kwaliteit van zorgen
werkhypothese. Laten we ervan uitgaan dat het adagium “Wat niet gemeten kan worden kan ook niet veranderd worden” het begin is van de wijsheid ook bij het onderzoek over gezondheidsdiensten546, en dat elke benadering voor het beoordelen van kwaliteit kan bekritiseerd worden, of de meting nu berust op ontslaggegevens of op patiëntendossiers. 547 Daar we ons bewust zijn van de beperkingen bij de analyses, trachten we verder de nodige caveats op een zichtbare manier aan te brengen en rekenen op de inbreng van de clinici en de Colleges van geneesheren om deze indicatoren tot een voor hen bruikbaar instrument te maken.409;548 Concluderend: de bij de indicatoren gewonnen informatie is een screening545, die alleen via een verder onderzoek tot een vaststelling kan leiden. Zij tracht aan de ziekenhuizen een aanknopingspunt aan te reiken voor zelfevaluatie en eventuele verbetering, helpt de Colleges ziekenhuizen met vermoedelijke bovenmaatse en ondermaatse
zorgen te
identificeren, en biedt hen en aan de overheid de mogelijkheid om bepaalde facetten en oorzaken
van
mogelijke
verscheidenheid364
binnen
het
gezondheidssysteem
te
identificeren, aanknopingspunten voor verder te ondernemen acties. Voor onbedoelde voorvallen (Hoofdstuk 2, sectie 2.3) lijkt, zoals voormeld, de rol van administratieve gegevens echter beperkter en situeert zich vooralsnog veeleer in hun monitoring zowel op een globaal nationaal vlak als op dat van individuele ziekenhuizen dan wel in een vergelijking tussen ziekenhuizen.177;258Verder zijn sommige auteurs ervan overtuigd dat, wegens de mogelijke gerechtelijke implicaties, het melden van een ongewenste gebeurtenis een systeem veronderstelt dat bescherming biedt aan de melder behalve in geval van patente nalatigheid.495;549;550 Vanuit een standpunt van kwaliteitsverbetering en van gedeelde verantwoordelijkheid van alle partners in het zorgsysteem, lijkt het daarentegen beter openheid na te streven. Een melding laat immers toe verbeteringsacties op te zetten en biedt ook op gerechtelijk vlak het voordeel kwaliteitsvolle praktijken te kunnen aantonen.496;551 Voor onze analyses deden wij beroep op de indicatoren van de Agency of Healthcare Research and Quality (AHRQ), uitgewerkt door de AHRQ in samenwerking met het Evidence-based Practice Center van de Stanford universiteit. Deze, naar we menen, uitstekend
onderbouwde
indicatoren
zijn
net
als
de
onze
gebaseerd
op
Hoofdstuk 5: Kwaliteit van zorgen
223
ziekenhuisontslaggegevens, ICD-9-CM codering, AP-DRGs en APR-DRGs. 77;552 Bij deze oefening stellen we twee indicatoren voor: het keizersnedencijfer bij laagrisico verlossingen en ziekenhuisletaliteit na opname voor acuut myocardinfarct. We menen echter dat een aantal processen en structuurelementen gemeenschappelijk zijn binnen een ziekenhuis en dat hiermee rekening dient gehouden te worden bij de verbeteringsacties die men, naar aanleiding van de resultaten van de uitgevoerde screening, wil opzetten. Het verzekeren van de verantwoordelijkheid en de verbetering van de kwaliteit zijn twee van de meest betekenisvolle uitdagingen waarvoor de gezondheidssystemen geplaatst worden553: “Health systems fail to provide treatments that are know to work, persist in using treatments that don’t work, enforce delays and tolerate high levels of error”.554Om hieraan te verhelpen is er inzicht nodig in wat een organisatie is en hoe een verandering best doorgevoerd wordt, maar ook welke rol de MKG hierin eventueel kunnen vervullen. Een werkelijke verbetering vereist niet alleen een verandering van de individuele praktijkvoering maar ook van het zorgsysteem als organisatie.555 Het is immers zo dat organisatorische problemen - het “systeem” en niet de “individuen” - en organisatorische cultuur bijna altijd de oorzaak zijn van “rampen” op gebied van mortaliteit en dat ze, wanneer onderkend, een vertrekput zijn voor verbeteringsacties.426;495-498;556 “In aviation it is not merely the pilot who is responsible for the outcome of a flight; it is the pilot, the air traffic controllers, the maintenance crew, the stewards, and the ground staff – in other words, the aviation system.”495 Als men wenst een organisatie te veranderen lijkt het aangewezen die strategieën voor kwaliteitsverbetering te gebruiken die de grootste slaagkans bieden.557 Dit houdt onder meer in (1) dat men beter interventies plant met meerdere facetten dan enkelvoudige zoals het verspreiden van richtlijnen of opvoedkundig materiaal; (2) dat men grotere slaagkansen heeft indien interventies gecombineerd zijn met audit en feedback, en met een “onderscheiding” voor kwaliteitsvolle organisaties; en, (3) dat financiële stimulansen verandering kunnen teweegbrengen, maar een bot instrument zijn en er gevaar bestaat voor perverse reacties.557
224
Hoofdstuk 5: Kwaliteit van zorgen
Elke veranderingsstrategie van de organisatorische cultuur dient een evenwicht na te streven tussen continuïteit en vernieuwing, waarbij een identificatie gebeurt van de te behouden en versterken, en de te veranderen culturele aspecten.558Succesvolle strategieën houden rekening met de noden, vrees en motivatie van het personeel en dit op alle niveaus.558Het is daarbij belangrijk voor ogen te houden dat diepgewortelde meningen en waarden zoals de autonomie van de clinicus bijvoorbeeld moeilijk te veranderen zijn.558 Verandering heeft overigens alleen een slaagkans wanneer degenen waarvan het werk bestudeerd wordt ook in het veranderingsproces betrokken werden.555 Een aantal ervaringen kunnen behulpzaam zijn bij de concrete uitwerking van een veranderingsinitiatief. Hoewel een uitgebreide artsenparticipatie in een kwaliteitsteam wenselijk is, lijkt ook een intense deelname van ziekenhuisstaf en managers belangrijk en stelt men dat samenwerking tussen beide groepen de sleutel tot verandering is.547;559 Het is ook niet zeker dat clinici, die vrijwilligers zijn voor de rol van klinische leiders, de nodige ervaring met organisatorische verandering hebben.557 Men acht het in het algemeen verkieslijk beroep te doen op multidisciplinaire teams om veranderingen te verwezenlijken, maar dit vereist volgehouden aandacht en aanpassing.560 Hierbij dient men er rekening mee te houden dat een inzet van meerdere eenheden in een ziekenhuis best gebeurt voor aan elkaar gerelateerde kwaliteitsprojecten. Immers, indien men ze inzet voor een wijde waaier van ongerelateerde kwaliteitsprojecten is het gevaar voor focusvervaging niet ondenkbeeldig.547 Een randvoorwaarde voor succes van een nationale, kwaliteitsverbeterende strategie is de voortdurende investering in een passende infrastructuur en in beschermde tijd
voor
kwaliteitsbevorderende activiteiten.557 Veranderingen veronderstellen namelijk tijd en ruimte waarbinnen de nieuwe vaardigheden kunnen verworven worden zoals controle op het werkproces, ontwikkelen en implementeren van klinische paden, en het veranderen van de natuur van het professionele werk.561 Adequate informatie, die verschillen beschrijft tussen gezondheidszorgverleners in kwaliteit, kosten en beschikbaarheid van diensten, wordt vaak als essentieel beschouwd voor verbeteringsinitiatieven. Zij zou onder meer tot een bewuste en gefundeerde
Hoofdstuk 5: Kwaliteit van zorgen
225
consumentenkeuze kunnen leiden, die op haar beurt de zorgensector zou verplichten tot kwaliteitsverbetering.562 In een studie, waarbij het effect van niet of nauwelijks risicogecorrigeerde “profielen” op het consumentengedrag bestudeerd werd, bleken profielen dit gedrag echter niet te beïnvloeden,562 zelfs indien dat publiek het verlangen naar dergelijke informatie kenbaar gemaakt had.402;553 Zijn de consumenten ontevreden over wat zij beschouwen als de sluier van geheimhouding en beroepsbescherming en/of verlangen zij niet steeds te handelen als consument in alle aspecten van het moderne leven? 553 Profielen stimuleerden echter wel organisaties om hun eigen gegevenssystemen te ontwikkelen en te verbeteren.553 Wegens het vaak misleidende karakter van profielen (zie hoofdstuk 3, sectie 3.3.1) verkozen wij een anonieme feedback te verstrekken aan de clinici en de verschillende beleidsinstanties. Wij maakten op de anonimiteitregel één uitzondering: in de feedback naar de Colleges van geneesheren kan de anonimiteit van de Bonferroni-gecorrigeerde “outlier” ziekenhuizen opgeheven worden, indien de betrokken ziekenhuizen hiermee instemmen. Het leek ons overigens noodzakelijk dat de feedback naar de clinici gedragen werd door gezaghebbende instanties zoals de Colleges van geneesheren, dat hij verbetering als bedoeling had, dat hij duidelijk de graad van evidentie aangaf en dat hij voorzag in een hulp bij de interpretatie. Gegevens gebruikt voor verbeteringsinitiatieven moeten accuraat genoeg zijn om acties op te zetten maar hoeven niet perfect zijn553;554omdat het bekomen van perfecte gegevens uitermate kostelijk en tijdsverslindend190;553is. We gaan er derhalve van uit dat pragmatisme de sleutel voor verandering is. Bijvoorbeeld bleek het gebruik maken van kleine representatieve steekproeven met zowel kwantitatieve als kwalitatieve gegevens en het inbouwen van gegevensverzameling in het dagelijkse werk gepaard te gaan met een toename van het voorgeschreven oogonderzoek bij diabeteslijders van 65% tot 85%.554 Een stevige structuur voor adequate gezondheidsinformatie is bijgevolg een belangrijke hulp voor het opzetten van verbeteringsinitiatieven in de gezondheidszorg.563Het is dan zaak na te gaan of de MKG voldoende accuraat zijn om zinvolle kwaliteitsinitiatieven te laten kiemen.
226
Hoofdstuk 5: Kwaliteit van zorgen
5.2 KAN HET SCREENEN VOOR INTERZIEKENHUIS VERSCHILLEN IN KEIZERSNEDENCIJFER BIJ LAAGRISICO VERLOSSINGEN DOOR MIDDEL VAN ADMINISTRATIEVE GEGEVENS BIJDRAGEN TOT KWALITEITSINITIATIEVEN IN DE GEZONDHEIDSZORG?
Gebaseerd op dit onderhoofdstuk, dat onderzoek uit 2004-6 weergeeft, boden we een manuscript aan: Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk deliveries using administrative data. An initiative to improve the quality of care. BMC Health Services Research 2008;8(1)3.133
5.2.1 Inleiding Tijdens de laatste drie decennia namen de keizersnedencijfers (KSCs) voortdurend toe en werden er ruime verschillen in KSCs vastgesteld tussen landen, streken en zelfs ziekenhuizen, met een vergelijkbaar sociaal-economisch profiel.564-574. Dit leidde er toe dat keizersneden (KS) gingen beschouwd worden als een te vaak gebruikte ingreep. Zowel electieve herhalingssectio’s als primaire electieve KS droegen in belangrijke mate bij tot de stijging van het KSC. In de VS bijvoorbeeld, steeg, tijdens de periode 1998 tot 2001, het KSC met ongeveer 14%, en stegen de cijfers voor een primaire en een electieve, primaire KS met respectievelijk 13% en 53%.575 terzelfder tijd daalde, tijdens de periode 1996 tot 2000, het cijfer van de vaginale bevallingen na sectio (VBS) met 27% wegens, de zelden
optredende
maar
potentieel
catastrofale
risico’s
en
medico-legale
576-582
beschouwingen.
In afwezigheid van gerandomiseerde klinische studies is het moeilijk de balans op te maken tussen een electieve KS en een vaginale bevalling.572 De bestaande evidentie suggereert dat verschillen in korte en lange termijn uitkomsten voor moeder en kind tussen een electieve KS en vaginale bevalling verminderen583 maar geeft nog steeds aan vaginale bevalling het voordeel565;573;583-588, hoewel sommige auteurs stellen dat een electieve KS even veilig is of zelfs veiliger dan een vaginale bevalling589-592.
227
Hoofdstuk 5: Kwaliteit van zorgen
De korte en lange termijn verwikkelingen na een vaginale bevalling bestaan onder meer uit perineale pijn; urinaire en fecale incontinentie (vooral na een forceps
583;590;593-595
) en
maternale transmissie van bepaalde infectieziekten. Een poging tot vaginale bevalling kan resulteren in een spoedkeizersnede, die geassocieerd wordt met een verhoogde maternale mortaliteit en morbiditeit. Tenslotte kunnen vaginale verlossingen gepaard gaan met intrapartum sterfgevallen en geboorte traumata’s.583;589 Voor KS omvatten de korte en lange termijn verwikkelingen pijn; urinaire en wondinfecties; maternale sterfte; thrombo-embolische verwikkelingen; abruptio placentae (2-4%); placenta previa (1-4%) en accreta (toegenomen met een factor van 10 over de laatste 50 jaar) tijdens de volgende zwangerschappen; hysterectomie van het post-partum (0.25-4.6%); ectopische zwangerschap;
belangrijke obstetrische bloedingen bij de
volgende bevallingen; beschadiging van de bekkenbodem; fecale en urinaire incontinentie, zij
het
waarschijnlijk
in
574;583;589;590;593;595;596;596-598
bevalling.
mindere
mate
dan
na
een
vaginale
Daarenboven zijn keizersneden gekenmerkt door
hogere kosten voor moeder en maatschappij564;568;593 en ging de toename van het KSC niet gepaard met een lagere perinatale sterfte of met lagere asfyxiecijfers.574 Financiële motieven en relatieve gemakkelijkheid kunnen tussenkomen in de besluitvorming en het kan moeilijk zijn een onderscheid te maken tussen patiënten- en artsenkeuze.565;572;583585;589;599-601
Geïnformeerde toestemming; voorkeur en autonomie van de moeder; en
artsenfactor spelen eveneens een rol.573;574;583;602-606 De afnemende pariteit (de meeste vrouwen hebben minder dan twee zwangerschappen) en medico-legale beschouwingen kunnen de beslissing over de wijze van bevalling beïnvloeden.583;589;590;594 Om in een context van een eventueel overgebruik een valide, interziekenhuis vergelijking van KSCs te maken, dient men de verplichte keizersneden uit te sluiten, uitgevoerd wegens medische indicaties. Na exclusie van vrouwen, die reeds een keizersnede ondergingen, identificeerden Gregory et al., o.b.v administratieve gegevens over 463.196 bevallingen, een aantal klinische indicaties voor een electieve (vóór de arbeid), primaire KS (een vrouw die nog geen KS onderging).577 Twaalf klinische entiteiten bleken in 92,9% van alle keizersneden terug gevonden te worden: malpresentatie met inbegrip van stuit (57,6%), antepartum bloeding (10,1%), herpes (5,49%), ernstige hypertensie (4,01%), ander uteruslitteken (1,12%), meerlingzwangerschap (2,33%), macrosomie (4,52%), niet-
228
Hoofdstuk 5: Kwaliteit van zorgen
ingedaald foetaal hoofd (1,57%), maternale collageenziekten (1,60%), andere hypertensie (3,03%), preterme zwangerschap (1,49%), fetale congenitale aandoening (0,15%), andere (7,13%). Deze auteurs bepaalden een normatief cijfer van 4% primaire, electieve KS, en stelden dat bij lagere cijfers ondergebruik dient vermoed te worden. 577 Een andere studie, ditmaal over de ganse VS, bevestigde niet alleen deze bevindingen maar stelde daarenboven tussen 1997 en 2001 een significante toename vast van primaire, electieve keizersneden. Meer bepaald voor ICD-9-CM codes m.b.t. malpresentatie (van 26.1 naar 29.8 ‰), antepartum bloeding (van 4,3 naar 5,9 ‰), ernstige hypertensie (van 1,9 naar 2,8 ‰), niet-ingedaald hoofd (van 1,0 naar 2,2 ‰), preterme zwangerschap (van 0,8 naar 2,0 ‰), maternale collageenziekten (van 0,9 naar 1,8 ‰) werden deze toenamen vastgesteld. Dit wijst ofwel op een toegenomen incidentie van ernstiger vormen van deze aandoeningen ofwel op een verandering van praktijkvoering, waarbij de arts voor dezelfde indicatie voor een andere wijze van verlossing opteert.575 Doeltreffendheid,
doelmatigheid,
billijkheid
en
verantwoording
afleggen
zijn
basisbegrippen die gebruikt worden door zorgverstrekkers, onderzoekers, internationale organisaties en overheden om performance en kwaliteit te beschrijven.6;7;15;16;70-72;265;538;539 We steunden hierbij op de definitie van het Institute of Medicine (IOM): “Kwaliteit van zorg is de mate waarin de gezondheidsdiensten voor individuen en bevolkingen de waarschijnlijkheid van verhoopte uitkomsten verhogen en overeenstemmen met de huidige professionele kennis” en erkennen we de noodzaak om zowel processen als uitkomsten te betrekken bij het beoordelen van kwaliteit.272;607 Verder inspireren we ons op het National Healthcare Quality Report, dat een kader uitwerkte voor kwaliteit in de gezondheidszorg met elementen zoals effectiviteit, veiligheid, tijdigheid, patiëntengerichtheid, billijkheid en patiëntennoden (bijvoorbeeld gezond blijven, beter worden, leven met ziekte en onbekwaamheid, omgaan met het einde van het leven).608 Tenslotte ontlenen we aan Donabedian het inzicht dat kwaliteit technische, interpersonele en maatschappelijke aspecten bevat, en dat daarbij rekening dient gehouden te worden met de aanvaardbaarheid van de zorg voor de maatschappij.257;265
229
Hoofdstuk 5: Kwaliteit van zorgen
Ondanks de complexiteit van de keuze tussen electieve KS en vaginale bevalling bij laagrisico verlossingen, menen we, zoals voormeld, dat de bestaande evidentie in het voordeel pleit van een vaginale bevalling. Overigens zijn er verschillende landen waar lage KSCs gepaard gaan met lage perinatale sterftecijfers, wat suggereert dat goede perinatale uitkomsten geen hogere KSCs vereisen en dat lagere gestandaardiseerde cijfers overeenkomen met betere obstetrische zorgen, hoewel een optimaal KSC nog niet bepaald werd en ondergebruik van KS beschreven werd.
573;607
Klinische en epidemiologische
beschouwingen en ook het feit dat verschillende landen de wijze van verlossing als kwaliteitsindicator564;609 gebruiken of gaan gebruiken, en dat geïnformeerde toestemming en maatschappelijke beschouwingen tussenkomen in de besluitvorming leidden er ons toe het KSC te gebruiken als kwaliteitsindicator. We dienden dan wel aan te tonen dat verschillen in KSC tot verschillen in uitkomst leidden. 257;276;294;607 In een perspectief van kwaliteitsverbetering toonden we in deze studie klinisch en statistisch belangrijke interziekenhuis verschillen aan in KSCs en een opwaartse nationale KSC trend bij laagrisico bevallingen. Verder stelden we ook vast dat ziekenhuizen met een hoog KSC geen betere neonatale uitkomsten hebben en dat er ook sprake was van ondergebruik. 5.2.2 Methoden 5.2.2.1 Gegevensbronnen De MKG bevat patiëntengegevens (waaronder geboortejaar, geslacht, verblijfplaats, een anoniem ziekenhuisidentificatienummer), verblijfgegevens(waaronder het jaar en de maand van opname en ontslag, transfer vanuit en naar een ander ziekenhuis met specificatie van het type ziekenhuis) en een onbeperkt aantal nevendiagnosen en ingrepen. De ziekenhuizen worden verder gekarakteriseerd volgens onderwijsopdracht (al dan niet), type van eigenaar (publiek of privé) en het al dan niet beschikken over intensieve maternale en neonatale zorgen. De MKG verzamelt gegevens over alle verblijven met inbegrip van niet-residenten. Omdat we niet beschikken over een uniek identificatienummer dat zou toelaten een transfer van een kind van één ziekenhuis naar een ander op te volgen, zijn de maternale en
230
Hoofdstuk 5: Kwaliteit van zorgen
de geboortegegevens van een getransfereerd kind niet beschikbaar in het opnemend ziekenhuis. Deze gegevens zijn echter wel beschikbaar in het ontslagend ziekenhuis. Om de volledigheid en de accuratesse van de gegevens na te gaan, welbekende pijnpunten van administratieve gegevens182, werden ze vergeleken met gegevens van (1) het Nationaal Instituut voor de Statistiek (NIS), dat voornamelijk betrekking heeft op residenten, (2) het Studiecentrum voor Perinatale Epidemiologie (SPE)
610
en (3) elders gepubliceerde611
gegevens, om vervolgens te bepalen welke gegevens zouden gebruikt worden voor de analyse.
In het SPE register worden de perinatale sterfgevallen en de geboorten
geregistreerd, die zich in de Vlaamse obstetrische eenheden (residenten en niet-residenten) voordoen, en verder een proportie van thuisbevallingen, die ongeveer 1 % van alle bevallingen uitmaken. De gegevens worden op continue wijze verzameld en onderworpen aan een georganiseerd systeem van kwaliteitsbewaking.610 5.2.2.2 Definitie van de studiepopulatie Een valide interziekenhuis vergelijking van KSCs vereist ofwel een correctie voor case mix of de definitie van een homogene risicogroep. In deze studie, trachtten we een deelgroep van
parturiënten te identificeren met een laag risico op een KS.607;612;613
Daarvoor steunden we op het werk van de Agency for Healthcare Research and Quality (AHRQ)564, op literatuur die de redenen voor een verplichte KS575;577;607 aangeeft, op input van het “College van geneesheren voor de moeder en pasgeborene” en op de volledigheid en accuratesse van de gegevens. Uit het geheel der bevallingen werden de laagrisico bevalling afgezonderd door exclusie van bevallingen gekarakteriseerd door een abnormale ligging (met inbegrip van stuit), een prematuriteit (< 37 weken), een doodgeboorte, een meerlingzwangerschap, een ingreep voor stuitligging, wat de exclusiecriteria van de AHRQ zijn. Op vraag van het College werden daarenboven bevallingen van kinderen met intra-uteriene groeirestrictie (IUGR) (< 2500g) of macrosomie (> 4499g) uitgesloten. Alle maternale karakteristieken werden geïdentificeerd aan de hand van DRGs, of ICD-9-CM diagnoses and ingrepencodes (Precieze ICD-9-CM diagnose en ingrepencodes kunnen op de AHRQ website gevonden worden : (p. A27 http://www.qualityindicators.ahrq.gov/iqi_download.htm)).
231
Hoofdstuk 5: Kwaliteit van zorgen
Vanuit de MKG identificeerden we, voor de periode 2001 tot 2004, 459.171 levend geboren eenlingen, in hoofdligging. Voor 455.933 kinderen, de bronpopulatie, konden we de obstetrische gegevens van hun moeder terugvinden. Hiervan werden er 86.310 kinderen (18,96%) via een keizersnede geboren. Door toepassing van de voormelde criteria op de bronpopulatie definieerden we een studie en een controle populatie met respectievelijk 381.989 en 73.944 kinderen waarvan er respectievelijk 49.578 (12,98%) en 36.732 (49,68%) via keizersnede geboren werden.
5.2.2.3 Analyse De analyse had als bedoeling kwaliteitsinitiatieven te onderbouwen en niet het blameren van individuen.495;496 We streefden ernaar zowel ziekenhuizen te identificeren met bovenmaatse
als
met
ondermaatse
kwaliteit.
De
eersten
als
benchmark
en
voorbeeldfunctie, de laatsten om hen te helpen hun kwaliteit te verbeteren. Daarom werd ieder Belgisch ziekenhuis vergeleken met het geheel der ziekenhuizen. Twee types analyses werden uitgevoerd: een eerste gericht op de KSCs van de ganse tijdsspanne van de studie (de periode) en een tweede waarbij de aandacht uitgaat naar de semestriële evolutie (de trend) van de KSCs. In de literatuur werd er gesuggereerd dat administratieve gegevens niet de nodige informatie van voldoende kwaliteit bevatten om systematische verschillen in case mix te corrigeren in geval van een eerder klein relatief risico (RR), zoals een RR van 0,75.100 Daarom bepaalden we een zone van niet-interpretatie waarin we het cijfer of trend van een ziekenhuis, vergeleken met het nationale cijfer en trend, als niet interpreteerbaar in termen van “hoger” of “lager” beschouwden. Om de grenzen van dit gebied vast te leggen berekenden we eerst de afwijking van een ziekenhuis ten opzichte van het nationale cijfer en trend als volgt: afwijking (in %) = (RR -1) x 100. Vervolgens werd voor het KSC de ondergrens gedefinieerd als een afwijking van - 25 % - wat overeenstemt met de RR van 0,75 - en de bovengrens als een afwijking van + 35%. Voor de trend, waar we over geen literatuurreferentie beschikten, bepaalden we de boven- en ondergrens respectievelijk als + 5% en - 5%. In de andere gevallen, met een belangrijke afwijking, werden de resultaten van de “screening” in functie van de beschikbare evidentie geïnterpreteerd.
232
Hoofdstuk 5: Kwaliteit van zorgen
Deze getallen werden eerder als een maatstaf van statistische evidentie gezien. Wij noemden ze 1) “sterk” indien de probabiliteit om een even grote of nog grotere afwijking aan te treffen als die van het bestudeerde ziekenhuis, gelijk is aan of kleiner dan 0,05/aantal te vergelijken ziekenhuizen (de zogenaamde Bonferroni-correctie voor meervoudig gelijktijdig toetsen); 2) “matig” indien die probabiliteit kleiner is dan 0.05 maar groter dan 0,05/aantal te vergelijken ziekenhuizen; en 3) in de andere gevallen “zwak”. 5.2.2.4 Doelstellingen van de studie De feedback van deze analyses viseert drie doelen: een feedback naar de ziekenhuizen om kwaliteitsverbetering te stimuleren, een feedback naar de Colleges van geneesheren om hen toe te laten ziekenhuizen te identificeren met zowel bovenmaatse als ondermaatse kwaliteit, en een feedback naar de overheid om haar beleid te onderbouwen. Hij bestaat hoofdzakelijk uit een grafische weergave van de afwijkingen van alle ziekenhuizen van het nationale cijfer/trend, en uit een tabel met deze afwijkingen met een aanduiding van hun statistische evidentie. Een hulp bij de interpretatie, met informatie over zowel de periode als trendanalyse wordt er tevens in verstrekt. De beslissingsboom ervan wordt in “Bijlage 1” gegeven. In de grafieken presenteren we drie categorieën ziekenhuizen: een groep met een “hoog KSC”, bestaande uit de ziekenhuizen waarvan het betrouwbaarheidsinterval van het keizersnedencijfer (na Bonferroni correctie) boven de zone van niet-interpretatie ligt; een “laag KSC” groep bestaande uit de ziekenhuizen waarvan het betrouwbaarheidsinterval van het keizersnedencijfer (na Bonferroni correctie) onder de zone van niet-interpretatie ligt; en, in de andere gevallen, een “gemiddeld KSC” groep. 5.2.2.5 Neonatale eindpunten Daar het optimale KSC onbekend is, vergeleken we de drie KSC groepen op gebied van neonatale uitkomsten. Perinatale morbiditeit en mortaliteit zijn voornamelijk te wijten aan ademhalingsstoornissen, waarvan hyaliene membraanziekte (RDS), meconium aspiratie syndroom (MAS) en tachypnee van de neonaat (TTN) de meest frequente zijn.614;615 Wij selecteerden 1-minuut Apgar scores616-618; RDS, MAS, TTN, respectievelijk ICD-9-CM
233
Hoofdstuk 5: Kwaliteit van zorgen
codes 769,770.1 en 770.6; nood aan ademhalingondersteunende behandeling, en transfer naar een gespecialiseerde dienst als perinatale eindpunten. Merk op dat in onze ogen de 1minuut Apgar scores, die in essentie foetaal lijden weerspiegelen, eerder als procesindicator dan als uitkomstindicator dient beschouwd te worden. De 5-minuut Apgar scores dienden dan om gevallen te identificeren van borelingen die langs vaginale weg geboren waren en die wellicht beter via een KS zouden geboren zijn. Om variabiliteit tussen verschillende waarnemers tegen te gaan en in overeenstemming met de literatuur categoriseerden we de Apgar scores in drie groepen: “zeer lage” (Apgar 0-3), “lage” (Apgar 4-6), en “goede” (Apgar > 6) scores.
618-620
De volledigheid van de
Apgar scores is wellicht beter dan die van de andere neonatale eindpunten vermits ze opgevraagd worden door middel van expliciet in te vullen items in tegenstelling tot de andere, die van het type “open vragen” zijn en door een ziekenhuis al dan niet geregistreerd worden. Omdat sommige majeure congenitale afwijkingen gerelateerd kunnen zijn met een lagere Apgar score (Bijlage 2)621, voerden we de analyses ook uit met uitsluiting van die gevallen. 5.2.2.6 Statistische methodes Wij veronderstelden dat wij via onze selecties een "Studie populatie" van laagrisico bevallingen geïdentificeerd hadden. Om dit na te gaan hebben we het relatief risico en zijn 95% betrouwbaarheidsinterval berekend van een bevalling via keizersnede in de "Studie populatie"
versus
in
de
"Controle
Populatie".
Deze
RRs
en
hun
95%
betrouwbaarheidsinterval werden berekend door middel van StatCalc, een statistische module van Epi Info 2000, gecreëerd door de Centers for Disease Control, en het Global Program on IADS van de WGO. Vermits onze aandacht voornamelijk uitging naar het geheel van de Belgische ziekenhuizen en naar het identificeren van “outlying” ziekenhuizen, maakten we gebruik van de zogenaamd “fixed effects” modellen.622 Hiërarchische modellen, gewoonlijk een zogenaamd “random-effects” model, zouden een alternatief kunnen geweest zijn. Deze modellen werden echter niet ontwikkeld om outliers te identificeren. Verder dient de theorie voor het bepalen van wat outliers zijn nog ontwikkeld te worden voor de “linear mixed” modellen en is het onmogelijk om outliers te identificeren in “non-linear mixed”
234
Hoofdstuk 5: Kwaliteit van zorgen
modellen. Tenslotte worden ziekenhuizen in de random-effects modellen beschouwd als een aselecte steekproef uit de populatie van alle ziekenhuizen, wat in deze studie, waarin alle ziekenhuizen zijn opgenomen, niet het geval was. We vergeleken elk individueel ziekenhuis met alle Belgische ziekenhuizen door middel van een logistische regressie442;484;623 om zowel een praktisch relevante als statistisch significante afwijking van het nationale cijfer of trend te bepalen. Door een interactie term in te bouwen in de logistische regressie tussen een lineaire tijdstrend, uitgedrukt in semesters, en de individuele ziekenhuizen, werden ziekenhuizen met een abnormale tijdsevolutie geïdentificeerd. Meer precies, vergeleken we de “slope” van de trend van elk ziekenhuis met de nationale trend door middel van lineaire contrasten. In geval van een frequente uitkomst (> 10%), of wanneer de odds ratio (OR) groter is dan 2,5 of kleiner dan 0,5, kan de schatting van het RR door de odds ratio’s, die de logistische regressie produceert, in belangrijke mate vertekend worden. Zoals vermeld in hoofdstuk 3 deden we, om deze vertekening te verminderen, beroep op de benadering van het RR door Zhang486, die we in de tekst en tabellen zullen vermelden als RRZ, en die we gebruikten om de bovenvermelde afwijking te berekenen. Het verband tussen RRZ en OR kan als volgt gelegd worden: RRZ= OR/ ((1-P0)+(P0*OR)), waar P0 staat voor de incidentie van de bestudeerde uitkomst in de niet-blootgestelde groep, namelijk het geheel van de Belgische ziekenhuizen.486 Zoals reeds vermeld hielden we rekening met het probleem van het meervoudige, gelijktijdige toetsen door het berekenen van Bonferroni-gecorrigeerde p-waarden.313;438;607 In de hoofdanalyse, maakten we een correctie voor leeftijd van de moeder en per-semester evolutie van de KSCs. In een nevenanalyse werden het type van ziekenhuis (privé versus publiek, met versus zonder onderwijsfunctie) en verblijfplaats van de moeder beschouwd als determinanten, waarvan men kan veronderstellen dat ze zowel het KSC van een ziekenhuis kunnen beïnvloeden als ze beïnvloedbaar zijn door kwaliteitsgerichte initiatieven. Ook met de correlatie van de gegevens hielden we rekening door middel van “rescaling” technieken.
443;444
Deze techniek bestaat erin de standaard fouten van de
Hoofdstuk 5: Kwaliteit van zorgen
235
parameters te vermenigvuldigen met de vierkantswortel van de ratio van de “goodness-offit” chi-kwadraten over het aantal vrijheidsgraden. Om een eventuele nationale trend op te sporen maakten we gebruik van de zogenaamde Generalised Estimating Equations (GEE), een verfijning van de logistische regressie waarbij er rekening gehouden wordt met de correlatie van de gegevens. 430;431;483;624 Voor de Apgar categorieën, een multinomiale uitkomst, planden we een zogenaamd ‘proportional odds’ logistisch model te fitten, op voorwaarde dat de veronderstelling van een constante OR niet weerlegd werd.625 Al deze analyses werden uitgevoerd met SAS version 8.1, SAS Institute Inc., SAS Campus Drive, Cary, North Carolina 27513,US. 5.2.3 Resultaten 5.2.3.1 Volledigheid en accuratesse van de gegevens Vergeleken met de gegevens van het NIS bleken de MKG zeer vergelijkbaar wat betreft de aantallen levendgeborenen en hun verdeling volgens de woonplaats van de moeder (Tabel 1). Voor de vergelijking met het SPE en met het Office de la Naissance et de l’Enfance (ONE) selecteerden we in de MKG respectievelijk de ziekenhuizen, die meewerken aan de SPE registratie, en de ziekenhuizen gelegen in Brussel (behalve het UZ-VUB) en Wallonië. Wat de perinatale aspecten betreft stelden we een aanvaardbare overeenkomst vast tussen MKG en SPE
i.v.m. meerlingzwangerschap, zwangerschapsduur, verlossing door
keizersnede, ligging van het kind, geboortegewicht, geslacht en Apgar score (Tabellen 2 en 3). Voor hypertensie, diabetes, inductie van de arbeid, epidurale anesthesie, en voorgeschiedenis van een keizersnede, stelden we echter belangrijke verschillen vast. Een vergelijking tussen MKG en het ONE is zeer bevredigend wat de geboortegewichten tussen 2,500 en 4,500 kg betreft. De lage Apgar scores lijken daarentegen frequenter voor te komen in de MKG (Tabel 2). Voor andere perinatale eindpunten, vonden we vergelijkbare gegevens in de literatuur. In de MKG bedroeg de incidentie van het meconium aspiratie syndroom (MAS) 0,69%, waar er waarden tussen 0,12 % en 7,87 % geciteerd worden.615;626-628 De incidentie (uitgedrukt in %) per week zwangerschapsduur bedroeg 0,54 voor week 36, 0,37 voor
236
Hoofdstuk 5: Kwaliteit van zorgen
week 37, 0,42 voor week 38, 0,61 voor week 39, 0,83 voor week 40, 1,27 voor week 41, en 1,50 voor week 42, cijfers die vergelijkbaar zijn met deze van Yoder et al.615 De associatie van MAS met 1-minuut en 5-minuut Apgar scores, uitgedrukt als odds ratio’s en hun 95% betrouwbaarheidsinterval, waren kleiner in onze gegevens maar gingen wel in dezelfde richting als deze vermeld door Wiswell et al.626: 6,21 (5,71;6,76) versus 10,03 (5,97;16,88) op één minuut en 8,71(7,62;9,97) versus 21,35 (8,65;53,04) op vijf minuten. Wanneer we onze gegevens met die van Levin et al.629 vergeleken, stelden we een gelijkaardig verband vast tussen hyaliene membranenziekte (RDS) en transiënte tachypnee (TTN) met de wijze van verlossing. Uitgedrukt als odds ratio’s en hun 95% betrouwbaarheidsinterval, bedroeg de associatie respectievelijk 3,0 (1,6;5,3) versus 3,1 (2,8;3,4) in geval van RDS, and 3,3 (2,6; 3,9) versus 3,2 (2,9;3,6) in geval van TTN. 5.2.3.2 Laagrisico verlossingen en interziekenhuis verschillen in KSC Wanneer we de studiebevolking (N=381.989 waarvan 12,98 % met een KS geboren werden) vergeleken met de controle populatie (N=73.944 waarvan 49,68 % met een KS geboren werden) , vonden we voor de controle populatie een RR om via keizersnede geboren te worden van 3,83 ( 95% BI [3,79;3,87]). Deze bevinding suggereert dat we er aan de hand van deze inclusie criteria tenminste gedeeltelijk in slaagden laag risicoverlossingen te identificeren. Hoewel onze studie over laagrisico verlossingen ging, stelden we belangrijke interziekenhuis verschillen vast (Figuren 1 en 2). Voor de periodeanalyse varieerden de afwijkingen tussen de – 65 % en de + 75 %. In termen van outliers onderscheidden we 9 “hoog KSC” en 13 “laag KSC” outlying ziekenhuizen. De trendafwijkingen situeerden zich tussen de – 6 % en + 6% en er waren geen outlying ziekenhuizen. Wanneer de gevallen van congenitale anomalie uitgesloten werden bleef de variatiebreedte nagenoeg dezelfde zowel voor de periode als de trend. De figuren waren merkwaardig gelijkend (Figuren 1 en 2, sectie 2). Er waren overigens slechts minimale verschillen betreffende outlying ziekenhuizen: ziekenhuis 30 werd significant en ziekenhuis 26 was
Hoofdstuk 5: Kwaliteit van zorgen
237
het niet langer. Noteer dat in beide gevallen de afwijking praktisch niet veranderde, wat impliceert dat de verandering het gevolg was van het weglaten van enkele gevallen. Naast de figuren bevatte de feedback naar de ziekenhuizen een tabel, waarin de periode- en trendafwijkingen met hun Bonferroni-gecorrigeerd en hun 95 % BI intervallen gegeven worden, verder een p-waarde waarbij de hypothese van een afwijking = 0 getoetst wordt, en tenslotte een hulp bij de interpretatie.Een voorbeeld van deze feedback voor de eerste tien ziekenhuizen vindt u in Tabel 4.
238
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 1: Percentage levend geboren kinderen i.f.v. de verblijfplaats van de moeder.Vergelijking tussen MKG en NIS, 2001-4. 2001 MKG NIS Verblijfplaats (N=113.600) (N=114.172) België 52,6 53,1 Vlaanderen 33,7 34,2 Wallonië 13,2 12,7 Brussel 0,5 Buitenland
2002 2003 2004 MKG NIS MKG NIS MKG NIS (N=111.609) (N=111.225) (N=112.704) (N=112.149)(N=116.142)(N=115.618) 53,1 53,7 52,6 53,5 53,0 53,9 33,2 33,8 33,0 33,5 32,4 32,9 13,1 12,5 13,7 13,1 13,8 13,1 0,6 0,7 0,8 -
NIS: Nationaal Instituut voor de statistiek
Tabel 2: Verdeling (in %) van geboortegewicht en Apgar scores.Vergelijking tussen MKG (2001) en gepubliceerde cijfers voor SPE (2000) en ONE (2000).
MKG-2001 Geboortegewicht < 500 g 500-1499 g < 1500 g 1500-2499 < 2500 g 2500-4499 g 4500 g+ Apgar scores <4 <7
ONE-2000
MKG-2001
SPE-2000
0,02 0,96 0,98 7,02 8,00 91,39 0,61
0,06 1,18 1,24 6,25 7,48 90,77 1,75
0,02 0,83 0,85 5,76 6,61 92,43 0,96
n/b 0,9 0,9 5,66 6,56 92,49 0,95
4,2 17,5
2,8 14,4
3,7 18,6
2,5 18,1
ONE: Office de la naissance et de l’enfance
SPE: Studiecentrum voor Perinatale
n/b:nietbeschikbaar
239
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 3a: Perinatale karakteristieken, uitgedrukt als een percentage. Vergelijking tussen MKG en SPE, 2001-4.
VERLOSSINGEN Tweelingen Meerlingen (>=3) Hypertensie Diabetes Zwangerschapsduuur: 20-31 weken 32-36 weken >=37 weken Inleiding van de arbeid Epidurale anesthesie Keizersnede Vorige keizersnede
2001 2002 2003 2004 MKG SPE MKG SPE MKG SPE MKG SPE (N=58.158) (N=59.750) (N=58.194) (N=58.841) (N=56.678) (N=59.253) (N=59.126) (N=61.647) 2,1 1,7 2,3 2,0 2,3 1,9 2,0 1,6 0,1 0,0 0,1 0,0 0,1 0,0 0,1 0,0 5,4 4,9 5,5 4,9 5,7 4,8 5,8 4,8 1,5 ng 1,6 1,2 2,1 1,4 2,1 1,4 1,0 1,0 1,0 1,0 1,1 1,3 1,1 1,1 5,9 6,1 6,1 6,3 6,4 6,1 6,4 6,5 92,9 92,8 92,9 92,7 92,6 92,6 92,8 92,5 19,6 30,7 19,4 30,1 18,4 30,0 17,7 27,6 47,8 62,7 48,3 63,2 47,1 64,4 51,3 61,6 17,4 17,1 18,1 17,7 18,6 18,3 18,5 18,3 3,9 7,7 4,6 7,6 5,2 7,6 5,7 8,2
240
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 3b: Perinatale karakteristieken, uitgedrukt als een percentage. Vergelijking tussen MKG en SPE, 2001-4. (vervolg) MKG SPE MKG SPE MKG SPE MKG SPE (N=58.302) (N=60.813) (N=58.529) (N=60.048) (N=56.848) (N=60.406) (N=59.110) (N=62.657) 74,3 70,3 72,5 69,9 71,8 70,0 71,3 70,2 Type geboorte: spontaan 8,5 10,5 8,5 10,3 8,7 9,7 9,1 9,7 vacuum 0,6 1,2 0,6 1,1 0,6 1,0 0,5 0,9 forceps 16,9 17,6 17,9 18,3 18,4 18,9 18,2 18,9 keizersnede 0,6 0,4 0,5 0,4 0,5 0,3 0,4 0,3 vaginale stuit 0,8 1,1 0,8 1,2 0,9 1,2 0,8 1,1 Geboortegewicht: <1500 g 5,4 5,9 5,6 6,2 5,7 6,2 5,4 5,8 1500-2499 g 93,4 92,9 93,3 92,7 93,5 92,7 93,7 93,1 >=2500 g 51,4 51,3 51,4 51,4 51,2 51,1 51,4 51,4 Geslacht: man 48,6 48,6 48,6 48,6 48,8 48,9 48,6 48,6 vrouw 3,0 1,5 3,0 1,8 3,0 1,6 3,1 1,6 Congenitale afwijkingen 18,8 17,1 17,9 17,9 18,9 18,2 17,9 17,8 Transfer =>gespecialiseerde eenheid GEBOORTEN
241
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 4: Afwijking van het KSC van een ziekenhuis (uitgedrukt in percent) t.o.v. het nationale KSC of trend, België, 2001- 4. ID1
Periode 2 3 OG_B OG_95 A(%) BG_955 BG_B6 BI_957 BI_B8
1 -18 24 2 -20 3 9 4 -20 5 9 6 0 7 -32 8 -12 9 -45 10 1
4
-10 33 -10 18 -11 14 7 -26 -7 -40
3 44 5 31 1 21 16 -19 1 -33
16 56 23 44 15 29 26 -11 10 -26
28 66 38 56 27 35 35 -5 17 -19
NS + NS + NS + + NS -
NS + NS + NS + + NS -
P9 0,68283 0,00000 0,49978 0,00000 0,88383 0,00000 0,00061 0,00001 0,75745 0,00000
OG_B2 -11 -8 -16 -8 -10 0 -9 -10 -2 -7
OG_953 -7 -5 -11 -4 -6 2 -7 -7 1 -3
A(%)
4
-2 -1 -5 0 0 5 -3 -3 4 1
Trend BG_955 BG_B6 4 3 2 5 5 8 1 1 8 6
8 6 8 9 10 10 4 4 11 9
IP10 BI_957 NS NS NS NS NS + NS NS + NS
BI_B8 NS NS NS NS NS + NS NS NS NS
P9 0,51065 0,57928 0,18024 0,90712 0,93539 0,00045 0,11081 0,10727 0,01709 0,67442
ID: Anoniem ziekenhuisnummer; OG_B: Ondergrens van het Bonferroni betrouwbaarheidsinterval; 3 OG_95: Ondergrens van het 95% betrouwbaarheidsinterval; 4 A: Afwijking van het ziekenhuis KS cijfer/trend vergeleken met het nationale KS cijfer/trend; 5 BG_95: Bovengrens of the 95% betrouwbaarheidsinterval; 6 BG_B: Bovengrens van het Bonferroni betrouwbaarheidsinterval; 7 BI_95: +: het 95% BI suggereert een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het 95% BI suggereert een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het 95% BI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend. 8 BI_B: +: het Bonferroni−gecorrigeerd BI suggereert sterk een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het Bonferroni−gecorrigeerd BI suggereert sterk een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het Bonferroni−gecorrigeerd BI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend. 9 P: Probabiliteit dat een ziekenhuisafwijking t.o.v. het nationale KS cijfer/trend = 0. 10 IP: Interpretatie: EAE: Externe audit en algemene maatregelen aanbevolen; AMG: algemene maatregelen aanbevolen. 2
AMG EAE A>0 AMG AMG AMG AMG AMG AMG AMG EAE A<0
242
Hoofdstuk 5: Kwaliteit van zorgen
Figuur 1: Interziekenhuis verschillen in keizersnedencijfers, congenitale afwijkingen inbegrepen (bovenste deel van de figuur) en uitgesloten (onderste deel van de figuur).
Nationaal KSC: 13%
Hoofdstuk 5: Kwaliteit van zorgen Figuur 2: Interziekenhuis verschillen in keizersnedentrend, congenitale afwijkingen inbegrepen (bovenste deel van de figuur) en uitgesloten (onderste deel van de figuur).
243
244
Hoofdstuk 5: Kwaliteit van zorgen
5.2.3.3 Nationaal KSC en zijn determinanten We berekenden een KSC van 18,93% in de populatie van levend geboren eenlingen in hoofdligging en een KSC van 12,98% voor de studiebevolking. Vermits we ons vooral interesseerden voor de evolutie van de KSC en hoewel een model waarin leeftijdsgroep en semester als categorische variabelen gefit werden tot een betere fit leidde, verkozen we het model waarin evolutie over de tijd als een trend gefit werd en dat de gegevens op een meer spaarzame en praktisch bruikbare manier samenvatte (Tabel 5, sectie a). Beginnend bij het eerste semester van 2001 vonden we een nationale trend, gecorrigeerd voor leeftijdsgroep, van ongeveer 2% per semester. De resultaten van een multivariabele GEE waarin de waarschijnlijkheid van een KS de afhankelijke variabele was en waarin, benevens de trend en de leeftijdsgroep, de andere determinanten de onafhankelijk variabelen vormen, worden in Tabel 5, sectie b getoond. Zo werden bij toenemende leeftijd van de moeder ook toenemende KSCs waargenomen en waren de verblijfplaats van de moeder en de dag van opname op een significante manier geassocieerd met de wijze van verlossing. Verder vonden we in functie van de opnamedag belangrijke en statistisch significante verschillen in aantallen borelingen en proporties van keizersneden, die varieerden tussen 64.422 en 14,84% op maandag; en, 33.836 en 7,21% op zaterdag, cijfers die wijzen op een intens medisch ingrijpen rond de geboorte (Tabel 6). Verlossingen op 37 en 38 weken en op 41 en 42 weken waren geassocieerd met een verhoogde KSC. We konden echter geen significante associatie aantonen tussen het keizersnedencijfer en het type eigenaarschap of een opleidingsfunctie van een ziekenhuis (Tabel 7). In een analyse met exclusie van congenitale afwijkingen kwamen we tot zeer vergelijkbare resultaten. Noteren we dat we in de “hoog KSC” groep op de 35.287 verlossingen 19,3% keizersneden telden. Voor de “gemiddeld KSC” groep bedroegen die cijfers respectievelijk 298.204 en 12,9%, en voor de “laag KSC” groep 48.436 en 8,8%.
Hoofdstuk 5: Kwaliteit van zorgen
245
Tabel 5: Nationale keizersnedentrend, gecorrigeerd voor leeftijdsgroep, en determinanten. OR P a) Nationale keizersnedentrend gecorrigeerd voor leeftijdsgroep Semestriële trend basis 1ste semester 2001 1,02 (1,02;1,02) <,0001 Leeftijdsgroep 20-24 jaar vs < 20 jaar 1,11 (1,11;1,11) <,0001 25-29 jaar vs < 20 jaar 1,30 (1,30;1,30) <,0001 30-34 jaar vs < 20 jaar 1,53 (1,53;1,53) <,0001 35-39 jaar vs < 20 jaar 1,86 (1,86;1,86) <,0001 40 jaar+ vs < 20 jaar 2,41 (2,41;2,41) <,0001 b) Nationale keizersnedentrend, gecorrigeerd voor leeftijdsgroep, en determinanten Semestriële trend 1,02 (1,01;1,02) basis 1ste semester 2001 Leeftijdsgroep 20-24 jaar vs < 20 jaar 1,12 (1,02;1,22) 25-29 jaar vs < 20 jaar 1,31 (1,20;1,43) 30-34 jaar vs < 20 jaar 1,55 (1,42;1,69) 35-39 jaar vs < 20 jaar 1,89 (1,73;2,07) 40 jaar+ vs < 20 jaar 2,45 (2,21;2,71) Zwangerschapsduur 37-38 weken vs 39-40 weken 1,95 (1,88;2,01) 41-42 weken vs 39-40 weken 1,29 (1,24;1,34) Verblijfplaats Antwerpen vs Elke woonplaats 0,99 (0,94;1,05) Brussel vs Elke woonplaats 0,89 (0,84;0,94) Brabant (Vl) vs Elke woonplaats 0,97 (0,91;1,05) Brabant (Wa) vs Elke woonplaats 0,82 (0,75;0,89) West Vlaanderen vs Elke woonplaats 1,10 (1,02;1,18) Oost Vlaanderen vs Elke woonplaats 1,06 (1,00;1,13) Henegouwen vs Elke woonplaats 0,94 (0,88;1,00) Luik vs Elke woonplaats 1,34 (1,25;1,44) Limburg vs Elke woonplaats 1,24 (1,14;1,34) Luxemburg vs Elke woonplaats 1,01 (0,86;1,18) Namen vs Elke woonplaats 0,83 (0,77;0,90) Buitenland vs Elke woonplaats 0,93 (0,79;1,09) Type eigenaarschap Publiek vs Privaat 0,98 (0,95;1,01) Teaching status Geen Ù wel specialisten in opleiding 0,98 (0,94;1,03) Dag van opname Maandag vs Zondag 1,22 (1,15;1,29) Dinsdag vs Zondag 1,13 (1,06;1,19) Woensdag vs Zondag 1,17 (1,10;1,23) Donderdag vs Zondag 1,17 (1,11;1,24) Vrijdag vs Zondag 0,85 (0,80;0,90) Zaterdag vs Zondag 0,55 (0,52;0,59) OR: odds ratio; ( ) :95% betrouwbaarheidsinterval; P: probabiliteit van OR=1.
<,0001 0,0188 <,0001 <,0001 <,0001 <,0001 <,0001 <,0001 0,7271 <,0001 0,2848 <,0001 0,0001 0,0054 0,0034 <,0001 <,0001 0,9151 <,0001 0,2006 0,1478 0,4271 <,0001 <,0001 <,0001 <,0001 <,0001 <,0001
246
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 6: Maternale karakteristieken van de studiepopulatie en wijze van verlossing. België 2001-2004. KS
%
Aantal
Leeftijdsklassen < 20 jaar 20-24 jaar 25-29 jaar 30-34 jaar
KS
%
Aantal
Semester 765
9,40
8.140
2001-1
5.672 11,99 47.287
5.910 10,37
57.010
2001-2
5.975 12,43 48.058
15.987 11,92 134.071
2002-1
5.757 12,51 46.023
17.342 13,75 126.098
2002-2
6.254 13,14 47.605
35-39 jaar
7.746 16,27
47.613
2003-1
6.161 13,27 46.421
40 jaar+
1.828 20,18
9.057
2003-2
6.550 13,55 48.356
Dag van opname
Woonplaats (provincie)
Maandag
9.560
14,84
64.422
Antwerpen
7.411 12,58 58.924
Dinsdag
8.827
13,80
63.948
Brabant (Vlaams)
4.492 12,80 35.098
Woensdag
8.780
14,22
61.762
Brabant (Waals)
1.476 11,35 13.009
Donderdag
8.961
14,29
62.729
Brussel
5.947 11,43 52.024
Vrijdag
5.212
10,73
48.555
West-Vlaanderen
4.867 13,42 36.262
Zaterdag
2.441
7,21
33.836
Oost-Vlaanderen
6.195 13,13 47.175
Zondag
5.797
12,40
46.737
Henegouwen
5.785 12,21 47.388
Luik
6.043 16,75
MAAND
36.07
Januari
4.280
13,20
32.434
Limburg
3.766 14,83 25.399
Februari
3.821
12,98
29.428
Luxemburg
1.281 12,69 10.098
Maart
4.032
12,56
32.112
Namen
1.920 11,08 17.326
April
3.941
12,56
31.365
Buitenland
Mei
4.025 12,69
31.726
Juni
4.109 12,99
31.626
Juli
4.357 12,78
34.093
Augustus
4.206 12,76
32.968
September
4.319 13,28
32.519
Oktober
4.114 12,89
31.923
November
4.040 13,40
30.158
December
4.334 13,70
31.637
KS: keizersnede; %: proportie van keizersneden uitgedrukt als een percentage.
395 12,28
3.216
247
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 7: Neonatale en ziekenhuis karakteristieken van de studiepopulatie en wijze van verlossing. België 2001-2004. KS
%
Neonati
1) Neonatale Geslacht Jongens Meisjes Onbepaald
KS 2) Ziekenhuis Micu
12,23
185.755 Publiek
17.210
13,12
131.176
23 Privaat
32.368
12,91
250.813
43.393
13.03
332.953
6.185
12,61
49.036
3
Specialisten
3000-3499 g
20.431
12,18
167.699 Ja
3500-3999 g
15.119
12.89
117.250 Neen
4.584
16,07
28.529
68.511 in opleiding
37-38 weken
18.531
18,77
98.712
39-40 weken
25.628
10,56
242.645
41-42 weken
5.419
13,34
40.632
10
16,13
62
<4
1.141
21,61
5.281
4- 6
2.857
14,65
19.507
45.570
12,76
357.139
10
15,38
65
<4
163
21,73
750
4- 6
703
18,03
3.898
48.702
12,91
377.276
RDS
480
31,27
1.535
Wet lung
552
32,43
1.702
Meconium Aspiratie
510
19,23
2.652
Intubatie/Ventilatie
959
27,88
3.440
Congenitale Afw.
559
16.57
3.374
9.850
15,31
64.326
Zwangerschapsduur
1 min Apgar
5 min Apgar
>6 Respiratoire Syndromen
Transfer
1.251
22.713
13,78
Ontbrekend
23,82
196.191 Eigenaarschap
9.444
>6
290
13,69
2500-2999 g
Ontbrekend
Neonati
26.862
Geboortegewicht
4000-4499 g
%
KS: keizersnede; %: proportie van keizersneden uitgedrukt als een percentage.
248
Hoofdstuk 5: Kwaliteit van zorgen
5.2.3.4 Neonatale uitkomsten Zeer lage één-minuut Apgar scores (Tabel 8) schenen meer frequent te zijn in geval van KS en vooral in de “laag KSC” groep. Noteren we nochtans dat de proportie van zeer lage scores in de “hoog KSC” groep versus de “laag KSC” groep hoger leek in geval van een vaginale verlossing dan na een keizersnede. Een gelijkaardig fenomeen deed zich voor m.b.t. de vijf minuten Apgar scores (Tabel 8), hoewel de incidentie van zeer lage vijf-minuten Apgar-scores veel kleiner was. Voor RDS en MAS (Tabel 8) troffen we in de drie KSC groepen praktisch dezelfde incidentie aan na een vaginale verlossing, maar bleken er belangrijke verschillen te bestaan na een keizersnede. Inderdaad, de “gemiddeld KSC” groep leek na een keizersnede een kleinere incidentie te hebben in geval van RDS, waar in geval van MAS er vooral een lage incidentie werd vastgesteld in de “hoog KSC” groep. TTN scheen minder een probleem te vormen in de “hoog KSC” groep, welke ook de wijze van verlossing was (Tabel 9). Voor de “laag KSC” groep scheen de nood aan respiratoire ondersteuning het grootst en dit zowel na een keizersnede als na een vaginale verlossing. De verschillen in proporties van pasgeborenen, die in een gespecialiseerde afdeling opgenomen werden waren uiterst verschillend: in de “hoog KSC” groep deed zulke opname zich vijfmaal minder voor dan in de andere, en dit voor beide types van verlossing (Tabel 9). Bij het doorvoeren van een analyse waarbij congenitale afwijkingen uitgesloten waren kwamen we tot zeer vergelijkbare resultaten.
249
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 8: 1 minuut en 5 minuut Apgar scores, RDS en MAS in functie van de wijze van verlossing en van KSC groep
Hoog 1 min Apgar Vaginaal <4 4 –6 >6 KS <4 4 –6 >6 5 min Apgar Vaginaal <4 4 –6 >6 KS <4 4 –6 >6 RDS Vaginaal Afwezig Aanwezig KS Afwezig Aanwezig MAS Vaginaal Afwezig Aanwezig KS Afwezig Aanwezig Totaal Vaginaal Keizersnede
KSC groep (%) Gemiddeld (%) Laag
299 1,05 1.512 5,31 26.680 93,64 96 1,41 349 5,14 6.351 93,45
32 0,11 180 0,63 28.279 99,26 11 0,16 51 0,75 6.734 99,09 28.405 99,68 90 0,32 6.718 98,84 79 1,16 28.331 99,42 164 0,58 6.744 99,22 53 0,78 28.495 6.797
(%): kolom percentage
(%)
Totaal
3.169 1,22 672 1,52 4.140 12.857 4,95 2.281 5,16 16.650 243.671 93,83 41.218 93,31 311.569 918 2,38 2.223 5,77 35.366 91,84
127 2,98 285 6,68 3.853 90,34
1.141 2.857 45.570
478 0,18 77 0,17 587 2.533 0,98 482 1,09 3195 256.686 98,84 43.609 98,73 328.574 135 0,35 564 1,46 37.808 98,18
17 0,40 88 2,06 4.160 97,54
163 703 48.702
258.913 99,69 44.038 99,66 331.356 816 0,31 149 0,34 1.055 38.174 99,12 340 0,88
4.206 98,57 61 1,43
49.098 480
257.974 99,32 43.964 99,50 330.269 1.755 0,68 223 0,50 2.142 38.116 98,97 398 1,03 259.729 38.514
4.208 98,62 59 1,38 44.187 4.267
49.068 510 332.411 49.578
250
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 9: TTN, nood aan respiratoire ondersteuning en transfer naar een N*/NIC dienst, in functie van de wijze van verlossing en van KSC groep
Hoog TTN Vaginaal Afwezig 28.425 Aanwezig 70 KS Afwezig 6.740 Aanwezig 57 Intubatie/Ventilatie Vaginaal Afwezig 28.295 Aanwezig 200 KS Afwezig 6.670 Aanwezig 127 Transfer Vaginaal Afwezig 27.818 Aanwezig 677 KS Afwezig 6.459 Aanwezig 338 Totaal Vaginaal 28.495 Keizersnede 6.797
KSC groep (%) Gemiddeld (%) Laag 99,75 0,25 99,16 0,84 99,30 0,70 98,13 1,87 97,62 2,38 95,03 4,97
(%)
Totaal
258.814 99,65 44.022 99,63 331.261 915 0,35 165 0,37 1.150 38.082 98,88 432 1,12
4.204 98,52 63 1,48
49.026 552
257.854 99,28 43.781 99,08 329.930 1.875 0,72 406 0,92 2.481 37.804 98,16 710 1,84
4.145 97,14 122 2,86
48.619 959
212.951 81,99 37.166 84,11 277.935 46.778 18,01 7.021 15,89 54.476 29.950 77,76 8.564 22,24 259.729 38.514
3.319 77,78 948 22,22 44.187 4.267
39.728 9.850 332.411 49.578
(%): kolom percentage
Vermits de “proportional odds” veronderstelling onjuist bleek, voerden we een general logits analyse uit om de associatie tussen wijze van verlossing, KSC groep en 1 minuut Apgar scores op een meer formele manier te analyseren. Hieruit bleek dat er duidelijk minder gevallen van zeer lage Apgar scores waren in de “hoog KSC” groep dan in de “gemiddeld KSC” groep, die op zijn beurt significant minder vaak geassocieerd bleek met zeer lage Apgar scores dan de “laag KSC” groep (Tabel 10). Voor de lage Apgar scores vonden we niet langer een significant verschil tussen de “gemiddeld KSC” groep en de “hoog KSC” groep, maar wel tussen de “gemiddeld KSC” en de “laag KSC” groepen. Een deel van dit verschijnsel was misschien te wijten aan sociaal-economische status gerelateerde verstorende variabelen, die we, uit de natuur zelf van onze gegevens, niet uit de analyse konden verwijderen. Opmerkelijk is het feit dat, wanneer we de “hoog KSC”
Hoofdstuk 5: Kwaliteit van zorgen
251
groep vergeleken met de andere groepen, we een relatief exces van zeer lage Apgar scores vaststelden wanneer het een vaginale verlossing betrof, waar we dat eerder na een keizersnede, uitgevoerd voor medische redenen, verwachtten. Deze bevinding suggereert dat het exces aan KS in de“hoog KSC” groep voor een deel te wijten was aan nietmedische redenen en schijnt te wijzen op een niet-adequate selectie van de wijze van bevalling. Noteren we tenslotte dat mannelijk geslacht negatief geassocieerd was met de Apgar scores. Ook wanneer gevallen van congenitale afwijking uitgesloten werden kwamen we bij deze analyses tot zeer gelijkaardige vaststellingen. We gingen ook het verband na tussen wijze van verlossing, KSC groep en respiratoire syndromen, bepaalde types van ademhalingsondersteunende behandelingen en/of de opname van een boreling in een gespecialiseerde pediatrische dienst of in een NICU (Tabel 11). In de volgende secties zijn de odds ratio’s voor KSC, leeftijdsgroep, wijze van verlossing, zwangerschapsduur, geslacht, en tenslotte een interactie term tussen KSC en wijze van verlossing voor elkaar gecorrigeerd. Voor al deze eindpunten bleek er een significant verband te bestaan tussen keizersnede en minder goede uitkomst, wat consistent is met wat reeds geweten was over het verband tussen een electieve herhalingssectio en RDS, respiratoire problemen zoals TTN en persistente pulmonaire hypertensie, zelfs bij een levend geboren, voldragen eenling.629 Voor mannelijk geslacht stelden we, op MAS na, een gelijkaardig verband vast. Wanneer we de “hoog KSC” en de “laag KSC” groepen vergeleken met de “gemiddeld KSC” groep stelden we voor de eerst vermelde groepen een exces aantal RDS gevallen vast. Deze excessen waren bijzonder belangrijk in geval van keizersnede. Voor MAS stelden we, wanneer we de drie KSC groepen onderling vergeleken, een exces vast in de “laag KSC” groep, vooral na een keizersnede. Voor een deel kan dit fenomeen te wijten zijn aan de correctie voor de zwangerschapsduur, vermits er significant meer verlossingen waren op 41 en 42 weken in de “laag KSC” groep (RR: 1.09; 95% CI [1.07;1.12]). In tegenstelling hiermee vonden we significant meer gevallen van MAS in de “laag KSC” groep na een keizersnede.
Ademhalingsondersteunende behandelingen bleken vaker
noodzakelijk in de “laag KSC” groep. Verder stelden we een negatief verband vast tussen
252
Hoofdstuk 5: Kwaliteit van zorgen
neonatale opname in een gespecialiseerde dienst en “hoog KSC” en “laag KSC” groepen, voornamelijk na een vaginale bevalling. Verlossingen op 37-38 weken en op 41-42 weken bleken vaak gecorreleerd met minder gunstige eindpunten. Deze bevinding stemt overeen met de literatuur die stelt dat een electieve KS beter uitgevoerd wordt op een leeftijd van 39 à 40 weken, eerder dan op 37-38 weken, wat het geval is in België (Tabel 5).574 Op dat ogenblik echter, namelijk voor het begin van een spontane arbeid, doen zich vaker ademhalingsproblemen voor. Wanneer we de KSC groepen vergeleken in termen van de ratio van het aantal KS uitgevoerd op die zwangerschapsduur over het aantaal aantal sectio’s vonden we 40,1% in de “hoog KSC” versus 24,2% en 37,2% in respectievelijk de “laag KSC” en “gemiddeld KSC” groepen. Tabel 10: Effect van KSC-groep en wijze van verlossing, gecorrigeerd voor geslacht, leeftijdsklas en semester, op 1-minuut Apgar scores.
Mannen vs Vrouwen KS vs VB KSC groep: Hoge vs Lage KSC groep: Hoge vs Gemiddelde KSC groep: Lage vs Gemiddelde Hoge KSC groep en KS vs Lage KSC groep en VB Hoge KSC groep en KS vs Gemiddelde en VB Lage KSC groep en KS vs Gemiddelde en VB
Dependente Variabele Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6 Apgar 0-3 Apgar 4-6
1,32 1,22 1,76 1,17 0,56 0,87 0,71 0,97 1,27 1,12
OR (1,25; (1,19; (1,59; (1,10; (0,48; (0,80; (0,63; (0,91; (1,14; (1,04;
1,40) 1,26) 1,95) 1,24) 0,65) 0,95) 0,80) 1,03) 1,40) 1,19)
P <0,0001 <0,0001 <0,0001 <0,0001 <0,0001 0,0016 <0,0001 0,333 <0,0001 0,0016
0,82 0,85 0,82 0,90 1,01 1,06
(0,70; (0,78; (0,73; (0,85; (0,91; (0,99;
0,95) 0,93) 0,93) 0,96) 1,12) 1,14)
0,0083 0,0003 0,0017 0,0016 0,8843 0,0864
KS: keizersnede; VB: vaginale bevalling; OR: odds ratio; ( ) :95% BI; P: prob. van OR=1.
Het verband tussen zwangerschapsduur en MAS was bijzonder in die zin dat het negatief was bij een zwangerschapsduur van 37-38 weken en positief voor een zwangerschapsduur van 41-42 weken. Dit is nochtans niet in tegenspraak met de literatuur, die meldt dat de hoogste cijfers voor MAS vastgesteld worden bij borelingen met een zwangerschapsduur van 41-42 weken en dat onder meer veranderingen in het hartritme patroon, foetale
253
Hoofdstuk 5: Kwaliteit van zorgen
acidose, meconium in de trachea, KS, en lage Apgar scores de voornaamste risico factoren zijn. 615;615;626;628 Wanneer we ons herinneren dat de gecorrigeerde odds ratio voor KS 1,63 bedroeg en dat, daarenboven, veel van de andere risico factoren kunnen vermeden worden door een electieve KS op week 37-38, kan de lage incidentie van MAS bij borelingen met die zwangerschapsduur niet beschouwd worden in tegenspraak te zijn met de literatuur. 5.2.4 Discussie 5.2.4.1 Voornaamste bevindingen Onze resultaten suggereerden voor laag risico verlossingen het bestaan van een belangrijke interziekenhuis variabiliteit, die zich vertaalde in afwijkingen van het nationale cijfer variërend tussen – 65 % en + 75 % en die tevens statistisch significant waren. Ze berustten op een zeer conservatieve analyse en interpretatieve benadering, die erin bestond een zone te definiëren waarin geen interpretaties gemaakt worden en in het gebruik van aanzienlijke drempelwaarden vooraleer een afwijking van het nationale cijfer of trend als belangrijk bestempeld werd. Meer in het bijzonder corrigeerden we voor meervoudige, gelijktijdige vergelijkingen en voor de aanwezigheid van correlatie in de gegevens. 313;444 Verder verstrekten we graden van evidentie m.b.t. de vastgestelde afwijking van een ziekenhuis en ook een hulp bij de interpretatie. Wel dient er rekening gehouden te worden met een eventuele “regression to the mean”.
462
Op die manier trachtten we vals alarm en
valse geruststelling te vermijden en tevens het onderscheid toe te laten tussen een reël verschil en een statistisch artefact. Dit soort problemen duikt vaak op bij een kwantitatieve analyse, zeker wanneer zij gebaseerd is op administratieve gegevens.180;319;396 Een ander belangrijk resultaat was de vaststelling van een KSC evolutie, die het best kan geresumeerd worden als een trend van 2 % per semester. Een veranderende medische praktijkvoering kan hierin een rol gespeeld hebben. Deze medische, groeiende beïnvloeding van het geboortegebeuren uitte zich verder in de geografische en ziekenhuisgerelateerde verdelingen 364;630 van het KSC, en de temporele verdeling van het aantal verlossingen en de wijze van verlossing, hoewel de evidentie van doelmatigheid van dergelijke tussenkomsten nog dient geleverd te worden.571
254
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 11: Voorkomen van respiratoire syndromen, respiratoire ondersteuning, opname in een gespecialiseerde dienst geassocieerd met wijze van verlossing en KSC groep, gecorrigeerd voor geslacht, leeftijd van de moeder, zwangerschapsduur en semester van verlossing. RDS OR Wijze van verlossing Keizersnede vs vaginaal 2,47 (2,18;2,81) KSC Hoog vs Gemiddeld 0,98 (0,79;1,22) Laag vs Gemiddeld 1,08 (0,90;1,28) Geslacht Jongens vs Meisjes 1,64 (1,48;1,82) Leeftijd van de moeder < 20 jaar vs 40 jaar+ 1,02 (0,69;1,51) 20-24 jaar vs 40 jaar+ 0,71 (0,53;0,94) 25-29 jaar vs 40 jaar+ 0,67 (0,51;0,89) 30-34 jaar vs 40 jaar+ 0,71 (0,54;0,93) 35-39 jaar vs 40 jaar+ 0,82 (0,61;1,10) Zwangerschapsduur 37-38 weken vs 39-40 weken 2,15 (1,93;2,39) 41-42 weken vs 39-40 weken 1,29 (1,09;1,54) Semester 2001-1 vs 2004-2 1,12 (0,93;1,35) 2001-2 vs 2004-2 0,96 (0,79;1,16) 2002-1 vs 2004-2 0,81 (0,66;0,99) 2002-2 vs 2004-2 0,93 (0,76;1,13) 2003-1 vs 2004-2 1,00 (0,82;1,21) 2003-2 vs 2004-2 0,97 (0,80;1,18) 2004-1 vs 2004-2 0,90 (0,74;1,09) Interactie wijze van verlossing en KSC groep KS en Hoog vs VB en Gemiddeld 1,34 (0,97;1,86) KS en Laag vs VB en Gemiddeld 1,53 (1,11;2,12)
MAS OR
TTN OR
Resp.Ond. OR
N*of NIC OR
1,64 (1,47; 1,82)
2,83 (2,52;3,18)
2,45 (2,23;2,68)
1,30 (1,26;1,34)
0,90 (0,77; 1,05) 0,74 (0,64; 0,85)
0,68 (0,53;0,86) 1,06 (0,90;1,25)
0,97 (0,83;1,13) 1,27 (1,14;1,43)
0,11 (0,10;0,12) 0,86 (0,84;0,89)
1,04 (0,97; 1,12)
1,46 (1,32;1,61)
1,36 (1,27;1,46)
1,05 (1,03;1,07)
0,76 0,89 0,80 0,79 0,89
0,95 0,87 0,82 0,77 0,81
1,21 0,91 0,88 0,84 0,85
1,49 1,25 1,04 0,92 0,90
(0,54; 1,08) (0,70; 1,12) (0,64; 1,00) (0,63; 0,99) (0,70; 1,13)
(0,63;1,43) (0,66;1,16) (0,62;1,07) (0,58;1,01) (0,60;1,08)
(0,90;1,62) (0,72;1,13) (0,71;1,09) (0,68;1,04) (0,67;1,06)
(1,37;1,62) (1,17;1,34) (0,98;1,11) (0,86;0,98) (0,84;0,96)
0,51 (0,46; 0,57) 1,75 (1,59 ; 1,93)
2,16 (1,96;2,39) 1,12 (0,94;1,33)
1,43 (1,33;1,55) 1,43 (1,28;1,59)
1,20 (1,17;1,22) 0,91 (0,88 ;0,94)
0,95 (0,83 ; 1,10) 0,78 (0,67 ; 0,90) 0,83 (0,72 ; 0,97) 0,83 (0,72 ; 0,96) 0,69 (0,60 ; 0,81) 0,81 (0,70; 0,93) 0,99 (0,86; 1,14)
0,61 0,53 0,65 0,57 0,75 0,79 0,87
1,08 1,06 1,28 1,27 1,37 1,08 0,95
1,30 1,15 1,03 1,06 1,09 1,08 1,03
0,87 (0,63; 1,20) 1,74 (1,29; 2,36)
1,08 (0,75;1,55) 1,26 (0,92;1,72)
KS: keizersnede; VB: vaginale bevalling; OR: odds ratio; ( ) :95% betrouwbaarheidsinterval.
(0,51;0,73) (0,44;0,65) (0,55;0,79) (0,47;0,68) (0,63;0,89) (0,66;0,93) (0,74;1,02)
(0,94;1,25) (0,92;1,23) (1,11;1,47) (1,11;1,46) (1,20;1,57) (0,94;1,25) (0,82;1,10)
1,04 (0,81;1,34) 1,23 (0,98;1,55)
(1,26 ;1,35) (1,11 ;1,19) (0,99 ;1,07) (1,02 ;1,10) (1,05 ;1,13) (1,04;1,13) (0,99;1,07)
1,66 (1,43;1,93) 1,18 (1,08;1,29)
255
Hoofdstuk 5: Kwaliteit van zorgen
Structurele problemen zoals verpleegkundige bestaffing, beschikbaarheid van artsen en anesthesiologen, die niet in de MKG geregistreerd worden, kunnen ook een rol gespeeld hebben bij de beslissing om een electieve keizersnede uit te voeren. 607 5.2.4.2 Beperkingen van de studie Sommige van de beperkingen van onze studie zijn intrinsiek aan gegevens afkomstig van de statistieken van de burgerlijke stand631 en van ziekenhuisontslaggegevens100. Meer specifiek, zijn ze beperkt in volledigheid en in accuratesse van het coderen van obstetrische gegevens.
632
Bijvoorbeeld bleken onze gegevens i.v.m. inleiding van de
arbeid, epidurale anesthesie en KS voorgeschiedenis onvolledig en stelden we een waarschijnlijke over-registratie vast van hypertensie en diabetes (Tabel 1). Het feit hiermee geen rekening te kunnen houden kon tot foutieve conclusies leiden bij de interziekenhuis vergelijking. Deze ingrepen en aandoeningen zijn immers allen gerelateerd aan een hoger KSC en kunnen verschillen in ziekenhuispraktijk weerspiegelen. Wegens de omvang van het voorkomen en het miscoderen van deze ingrepen en aandoeningen (1) lieten we ze buiten beschouwing bij het samenstellen van onze studiebevolking, en (2) gebruiken we de term van “screening” voor de interziekenhuis verschillen, die aangevuld dient te worden door externe en interne audits. Uit de aard zelf van onze gegevens was het ook onmogelijk het onderscheid te maken tussen primaire electieve en herhalingssectio’s. Dit kan als een andere tekortkoming van onze studie beschouwd worden. Al zijn analyses betreffende primaire electieve keizersneden van vitaal belang - het beteugelen van dit type KS precies het uitgangspunt is voor het verhinderen van het verder stijgen van het KSC - toch is de analyse van het totale keizersnedencijfer bruikbaar voor het beantwoorden van de onderzoeksvraag van deze studie. Onze definitie van een laagrisico verlossing, die voortbouwde
op het werk van de
564
AHRQ , dat gebaseerd is op de basis triade van “ voldragen (37 weken en meer) eenlingen in kruinligging”, en die recent gebruikt werd om maternale risicoprofielen te beschrijven612, is wellicht onvolledig. Een meer uitgesponnen selectieprocedure, gebaseerd op ICD-9-CM codes, en waarin diabetes, hypertensieve aandoeningen, placenta previa en een aantal congenitale afwijkingen werden opgenomen, werd onlangs gebruikt door Kabir
256
Hoofdstuk 5: Kwaliteit van zorgen
et al..633 Hoewel de medische noodzaak voor het uitvoeren van een KS in geval van diabetes zonder macrosomie601;634 en hypertensie (met uitzondering van enkele gevallen van eclampsie met langdurig foetaal lijden635) nog niet aangetoond werd, is het zo dat zij in de gewone praktijk geassocieerd zijn met hogere KSCs. Anderzijds kunnen placenta previa en sommige congenitale afwijkingen terecht beschouwd worden als een indicatie voor KS. Wegens de vaak zwakke identificatie in administratieve gegevens van gevallen d.m.v. diagnose codes180;182, namen we een intermediaire positie aan. Hierbij sloten we gevallen uit van abnormale ligging (met inbegrip van stuit en ingrepen voor stuit), prematuren, doodgeboorte, meerlingzwangerschap, en geboortegewicht van minder dan 2500g of meer dan 4499 g. Onze gegevens bevatten ook geen informatie over sommige vormen van dystocie (zoals disproportie en obstructie van de arbeid), en sociaal-economische status, die onze bevindingen konden vertekend hebben.604;630;636Rekening houdend met de laagrisico aard van de verlossingen en vermits in ons land bijna de ganse bevolking geniet van een ziekteverzekering, die het grootste deel van de kosten voor medische zorgen draagt, lijkt een SES vertekening echter klein. Ook de kleine odds ratio (1.034 met 95% B.I.[1.003; 1.066]), die we vaststelden wanneer we het KSC vergeleken tussen openbare en privé ziekenhuizen (waarin, zeer approximatief gesteld, de meer bemiddelde moeders bevallen), schraagde deze veronderstelling. De afwezigheid van maternale eindpunten vormt een ander minpunt van onze studie. Hoewel ernstige onder−registratie beschreven werd in verschillende Europese landen597, kan maternale sterfte bruikbaar zijn voor vergelijkingen tussen landen, maar is ze onbruikbaar voor interziekenhuizen vergelijkingen wegens haar lage incidentie (8 gevallen in de studiebevolking in 4 jaar tijd en 12 gevallen in de bronpopulatie). Maternale morbiditeit, het andere maternale eindpunt, is totnogtoe niet duidelijk omschreven. Aandoeningen met blijvende beperkingen voor de moeder zoals infertiliteit en vaginale fistels zijn uitzonderlijk in Europa.597 “Near misses” of “levensbedreigende voorvallen” en zwangerschaps− of verlossinggerelateerde letsels, die leiden tot urinaire of fecale incontinentie worden beschouwd als mogelijke indicatoren voor moederlijke morbiditeit
Hoofdstuk 5: Kwaliteit van zorgen
257
maar moeten nog vertaald worden in bruikbare indicatoren.597Hierbij dient men op te merken dat deze indicatoren, wanneer ze berekend worden op basis van administratieve gegevens verwant zijn aan indicatoren van patiëntveiligheid en dat men dan geredelijk kan veronderstellen dat zij delen in hun beperkingen, meer bepaald de zeer beperkte validiteit van hun gebruik voor interziekenhuis vergelijkingen.290 Tenslotte komen de beperkingen van administratieve gegevens gedeeltelijk voort uit het spanningsveld dat erin bestaat dezelfde gegevens te gebruiken voor terugbetaling en voor het meten van kwaliteit in ziekenhuizen. “When the use is reimbursement, there is a tendency to perform coding quickly and to maximize the coding of complications and comorbidities. When the use is to assess quality, however, it is important for coders to have a complete record and to restrict diagnosis coding to conditions that affect patient care.”637 Het is bijvoorbeeld dat hypertensie en diabetes tussenkomen in het algoritme, dat gebruikt wordt voor het bepalen van de case mix van een verblijf en derhalve financieel lucratief, waar dit niet het geval is voor inductie van de arbeid, epidurale anesthesie en een voorgeschiedenis van een vroegere keizersnede. 5.2.4.3 Sterkten van de studie De vergelijking van de voor de studie geselecteerde variabelen en de beschikbare informatie (Tabel 1), toont een goede overeenkomst aan in termen van volledigheid en accuratesse. Verder toonde onderzoek aan dat keizersneden praktisch altijd correct geclassificeerd worden82;95;632en werd er aangetoond dat een analyse d.m.v. een beperkt aantal variabelen met gekende betrouwbaarheid tot een interziekenhuis vergelijking komt, die behoorlijk overeenstemt met een interziekenhuis vergelijking gebaseerd op gegevens uit een medisch dossier638. Stippen we tenslotte aan dat we door het toepassen van onze, bij de klassieke triade bijkomende criteria op de bronbevolking zich vertaalde in een verdere KSC reductie van 12%.
258
Hoofdstuk 5: Kwaliteit van zorgen
Hoewel leeftijd van de moeder vaak, maar niet altijd, erkend wordt als een onafhankelijke risicofactor594;639-641, stemt de leeftijdscorrectie die we gebruikten overeen met de tijdens de studieperiode geldende obstetrische praktijk630;640 en heeft ze wellicht de interziekenhuis vergelijkbaarheid verbeterd.
5.2.4.4 Perinatale eindpunten Wij namen de neonatale sterfte niet op bij de te bestuderen perinatale eindpunten omdat ze beïnvloed wordt door neonatale zorgen, wat buiten de scope ligt van deze studie, en vervolgens omdat ze een zeldzaam verschijnsel is, dat zich niet leent tot een interziekenhuis vergelijking. Tenslotte kan de neonatale sterfte, tengevolge van onze registratiemodaliteiten, niet gekoppeld worden aan de wijze van verlossing in geval van een transfer naar een ander ziekenhuis, wat dus, precies bij een risicogroep, de voor deze studie nodige informatie ontoegankelijk maakt. Daarentegen ontbreekt de informatie over Apgar scores slechts zeer zelden: in 0,39 % der gevallen in een Zweedse studie642 en zelfs minder vaak in de onze. Zeer lage en lage één minuut Apgar scores worden beschouwd als een uitdrukking van een niet−geruststellende toestand643 of als een marker van een foetus in moeilijkheden615;628, die de toestand van de foetus onmiddellijk voor de geboorte weerspiegelt. Bij correct gebruik, laten één minuut Apgar scores toe de obstetrische praktijk616 over de ziekenhuizen te vergelijken en de evolutie van de obstetrische zorgen te evalueren.617;618 De evidentie, die we verzamelden, over verschillen in neonatale uitkomsten in functie van de KSC van de ziekenhuizen, kunnen als gemengd omschreven worden. Het verband tussen een “hoog” KSC en minder “zeer lage” één minuut Apgar scores schenen in het voordeel te pleiten van deze groep. Zoals hoger vermeld was het nochtans in deze groep dat we een relatief exces aantroffen van zeer lage Apgar scores na een vaginale verlossing, waar men eerder het omgekeerde had verwacht. Deze vaststelling impliceert dat minstens een deel van de keizersneden niet verricht werd voor medische redenen. Dit wijst op een minder goede indicatie stelling, een nochtans belangrijk onderdeel van deze procesindicator, en derhalve een minder goede kwaliteit.
259
Hoofdstuk 5: Kwaliteit van zorgen
Meer algemeen gesteld, van de 45.104 borelingen, zonder congenitale afwijking en met een goede één minuut Apgar score, is tenminste een groot deel verlost d.m.v. een keizersnede voor niet−medische redenen. Evidentie vanuit Vlaanderen toont aan dat ongeveer 8 % van de vrouwen, die bevielen tijdens onze studieperiode, al een keizersnede ondergaan hadden644. Wanneer we deze informatie op het hele land toepassen en ervan uitgaan dat vrouwen met een voorgeschiedenis van KS ook via een keizersnede verlost worden, zou een meer precieze benadering een bovengrens van overgebruik aangeven van ongeveer 40.000 keizersneden over vier jaar, aangenomen dat hogere leeftijd van de moeder geen indicatie is voor een KS en dat de Apgar scores correct geregistreerd werden. Anderzijds werd er in de groep van borelingen zonder congenitale afwijkingen geen keizersnede uitgevoerd bij 574 met een “zeer lage” en 3.114 met een “lage” 5-minuten Apgar score, waar zij er wellicht voordeel bij gehad zouden hebben via een keizersnede geboren te zijn, wat ondergebruik van de ingreep suggereert. Vijf minuten Apgar scores worden immers nog altijd beschouwd als een valide predictor van neonatale sterfte en soms van neurologische letsels.619;620 Hun gebruik als predictor voor neurologische letsels echter staat ter discussie.619;620;645-647 Noteren we dat onze bevinding van zowel over− als ondergebruik van KS overeenstemmen met die van een andere, gelijkaardige studie.607 Het kan moeilijk of tegenaangewezen zijn Apgar waarden te interpreteren in geval van vroeggeboorte, ernstige afwijkingen, meerlingzwangerschap, rookgedrag, drugs, trauma, infecties, hypoxie, hypovolemie, laag geboortewicht, IUGR, stuit of van toenemende maternale leeftijd.
621;642;645
Ook een spontane, tijdelijke verlaging van de neonatale
bloedsomloop en ademhalingsstelsel kan de interpretatie van de Apgar scores bemoeilijken.642 Electieve KS, een zwangerschapsduur van < 38 en > 41weken, mannelijk geslacht, foetale asfyxie, moederlijk astma en diabetes, en type van anesthesie648 (regionale versus algemene) zijn risicofactoren voor respiratoir lijden bij borelingen. Vermits we meerlingzwangerschappen, gevallen van prematuriteit, IUGR, congenitale afwijkingen, en abnormale ligging met inbegrip van stuitligging
621;642;645
uit onze studie sloten, vermeden
we tenminste een belangrijk deel van deze beperkingen en verder kunnen we de invloed van anesthesie als minimaal beschouwen op voorwaarde van een oordeelkundige keuze van type anesthesie en pijnstillende medicatie.649;650
260
Hoofdstuk 5: Kwaliteit van zorgen
Zoals het wel vaker voorkomt op diagnostisch gebied en in peer review, kan men terecht stellen
dat
Apgar
scores
onderhevig
129;131;145;148;279;349;643;645;651-654
waarnemers.
zijn
aan
variabiliteit
tussen
Hieraan menen we ten dele verholpen te hebben
door de categorisatie van de score in internationaal, gebruikelijke klassen.618-620;642;651 Verder menen we door de gehanteerde exclusiecriteria dit probleem nog verder verkleind te hebben, vermits het zich vooral voordoet bij de lagere scores145. Spijtig genoeg hadden we geen gegevens over andere bronnen van minder gunstige Apgar scores zoals ongunstige sociaal−economische status655, roken en andere factoren die rechtstreeks of onrechtstreeks Apgar scores kunnen beïnvloeden zoals geboren worden “buiten de diensturen”, op een bepaalde dag in de week of op een feestdag. Met uitzondering van SES kunnen die factoren aangepakt worden door organisatorische maatregelen en adviezen aan de zwangeren, en zijn dus in zekere mate kwaliteitsgebonden.642;656;657 Verder verschaffen Apgar scores informatie over een “gecompromitteerde” neonatus, die niet altijd kan ingewonnen worden door biochemische metingen.642 Een ander, operationeel argument ten voordele van de Apgar score bestaat in zijn praktisch volledige registratie in de MKG, wat niet zondermeer kan aangenomen worden voor de andere neonatale eindpunten. Tenslotte ontbreekt het ons vooralsnog aan algemeen aanvaarde en over het ganse land beschikbare alternatieven.642;658 De resultaten voor de andere neonatale eindpunten waren ook niet éénduidig. We twijfelden daarenboven aan de volledigheid van onze gegevens, wegens het “open vragen” type van de registratie en het proportioneel zeer lage opnamecijfer in gespecialiseerde diensten van borelingen met ongunstige neonatale eindpunten in de “hoog KSC” groep. Verder scheen KS voor de meeste van deze eindpunten geassocieerd te zijn met minder gunstige uitkomsten en schenen de ziekenhuizen met een laag KSC het minder goed te doen, wat ook elders werd vastgesteld607. Deze bevindingen suggereren dat ziekenhuizen met een gemiddeld KSC wellicht de betere benchmark zijn. 5.2.4.5 Organisationele aspecten Ondanks onze inspanningen om de typische beperkingen van administratieve gegevens zoveel mogelijk te omzeilen, kunnen onze bevindingen best omschreven worden als een “bruikbare screening”, die kan aanzetten tot het nemen van kwaliteitsbevorderende
261
Hoofdstuk 5: Kwaliteit van zorgen
initiatieven in de ziekenhuizen, veeleer dan als uitspraken over kwaliteit van de zorgen.180;659 In onze benadering werden ziekenhuizen beschouwd als individuele structuren van het gezondheidssysteem, waarvan de diensten een gemeenschappelijk organisatorische cultuur en een aantal gemeenschappelijk processen deelden, en die verantwoording dienden af te leggen. Zoals voormeld werden niet het tot schande maken, noemen en blameren van individuen of instituten maar het identificeren van organisatie− en cultuurgerelateerde problemen beschouwd als het aanknopingspunt voor kwaliteitsbevorderende acties.269;426;495-498;556;660 Daarom was deze feedback anoniem en had als doel de clinici, diensten en ziekenhuizen informatie te verschaffen, die hen toeliet zich met de anderen op een zinvolle manier te vergelijken. Daarenboven is het mogelijk dat niet ziekenhuisspecifieke KS−gerelateerde informatie zoals de nationale opwaartse trend, de toenemende incidentie van respiratoire problemen na KS, en het KSC in functie van opnamedag hen kan gestimuleerd hebben eventuele structurele problemen in het eigen ziekenhuis op te sporen. Vermelden we hierbij het werken met shiften; het zich teveel verlaten op te weinig ervaren personeel ’s nachts; het beschikbaar zijn en de kwaliteit van artsen, verpleegkundigen en ander personeel; en, de mogelijkheid om diagnostische testen en ingrepen uit te voeren.656;657 5.2.4.6 College van geneesheren Hoewel er aangetoond werd dat feedback kwaliteitsinitiatieven kan stimuleren566, schijnt het verkieselijker dat hij zou gedragen worden door iemand, gevormd in de interpretatie van gegevens, die geldt als een autoriteit en over de nodige middelen beschikt.269 Daarom werd aan het College van geneesheren
dezelfde feedback voorgelegd als aan de
ziekenhuizen. Hij zou hen kunnen helpen ziekenhuizen te identificeren, met zowel bovenmaatse als ondermaatse kwaliteit, om een benchmark vast te leggen en om ziekenhuizen met kwaliteitsproblemen te helpen ze op te lossen. Daarenboven kan de feedback en het betrokken zijn in verbeteringsprocessen hen wijzen op problemen die niet onmiddellijk door de indicator bestudeerd worden zoals de relevantie van het “informed consent”, electieve keizersneden met inbegrip van de KS op vraag van de moeder575;605, stuitligging, en de afwezigheid van protocollen en richtlijnen. Vermits
medico-legale
implicaties
op
indirecte
manier
de
vooruitgang
van
kwaliteitsbevorderende initiatieven kunnen vertragen, is het interessant te weten dat het
262
Hoofdstuk 5: Kwaliteit van zorgen
opvolgen van protocollen meer en meer in rechtszaken gebruikt wordt, en dat, in de meeste staten van de VS, het toepassen van klinische paden beschouwd wordt als relevante maar niet beslissende informatie om vast te stellen of een arts afweek van de standaardbehandeling.661 In deze context, wordt het College geadviseerd zijn houding te definiëren betreffende drie belangrijke ter discussie staande topics, te weten: stuitligging en vaginale verlossing, vaginale verlossing na sectio, en keizersnede op vraag van de moeder.
1) Stuitligging en vaginale verlossing Stuitligging bij een voldragen zwangerschap is een vrij vaak voorkomend (3 tot 4 % van alle zwangerschappen) en fel gedebatteerd fenomeen. De “Term Breech Trial” concludeerde dat een KS aanbieden in dit geval tot betere resultaten leidde voor de foetus dan een vaginale verlossing, en tot even goede resultaten voor de moeder.662;663 De resultaten van deze ene studie deden de medische praktijkvoering in grote mate en universeel veranderen.580 Zowel methodologische gebreken als inherente beperkingen bij het toepassen van een grootschalige, gerandomiseerde klinische studie op een complex fenomeen, waarbij zorgverstrekkers integraal deel uitmaken van de behandeling, doen twijfelen aan de conclusies van de studie.580;581;664 Het in acht nemen van de inclusie− en exclusiecriteria vormen een majeur probleem bij het beoordelen van de conclusies: bijvoorbeeld bij meer dan 30% van de moeders (in beide armen van de studie) waren er gevallen van hyperextensie van het foetaal hoofd, die hadden moeten uitgesloten worden; tweelingen, prematuren en doodgeboren kinderen waren ten onrechte opgenomen in de studie; en, er waren significant meer borelingen met een gewicht van > 4.000 g in de arm van de vaginale verlossing.580 Daarenboven hield de studie onvoldoende rekening met de het complexe karakter van een verlossing bij stuitligging, die een correcte uitvoering van een grootschalige, gerandomiseerde klinische studie uiterst moeilijk maakt581;665 en lijkt het bovendien zeer moeilijk om terzelfder tijd kwaliteit te verzekeren in 121 centra.581 Verder nodigde het protocol de deelnemende centra uit om hun cijfer van vaginale bevallingen op
Hoofdstuk 5: Kwaliteit van zorgen
263
te drijven en daarvoor de noodzakelijke veiligheidscriteria te versoepelen (het protocol stond een dilatatie van 0,5 cm/uur toe en van 3,5 uur voor het tweede stadium).580;581 Tenslotte dienden de auteurs toe te geven dat een electieve KS, vergeleken met een vaginale bevalling, na twee jaar geen voordeel meer bleek te bieden.666;667 Een grote Zweedse cohort studie gekoppeld met een gevallen−controle studie, kwam tot de bevinding dat een geplande KS in geval van stuitligging leidde tot een significante vermindering van perinatale en kindersterfte.668 Zij vermeldde nochtans dat een Noorse en Finse studie concludeerden dat een vaginale bevalling voor een voldragen stuit in passende gevallen, na zorgvuldige selectie, strikte foetale monitoring en in aanwezigheid van een ervaren obstetrisch team, kan geadviseerd worden.668 Een Schotse bevolkingsstudie die reikte tot de schoolleeftijd en waarbij gevallen van doodgeboorte en neonatale sterfte uitgesloten waren, kwam tot de conclusie dat in geselecteerde gevallen van een voldragen stuitligging een geplande vaginale bevalling met KS wanneer nodig, even veilig was als een KS in termen van lange termijn handicap.669 Een recente observationele studie670 over een voldragen stuitligging, waaraan ons land deelnam, stelde naast belangrijke interregionale praktijkverschillen in wijze van verlossing,
een laag cijfer (1.59%; 95%CI (1.33-1.89)) vast van de gecombineerde
neonatale uitkomst (foetale en neonatale mortaliteit of ernstige neonatale morbiditeit) en geen significante verschillen (OR: 1.10; 95% BI [0.75-1.61]) tussen de geplande vaginale verlossingsgroep (N = 2.502) en de geplande keizersnedengroep (N = 5.573). In geval van een voldragen stuitligging, werd er in Nederland voorgesteld aan ouders het advies te verstrekken dat een geplande KS niet zou resulteren in een verminderd sterfterisico noch in een verbetering van de neurologische uitkomst na twee jaar.671
2) Vaginale verlossing na sectio. Hoewel arbeidsmanagement en objectieve criteria voor het diagnosticeren van dystocie hoekstenen zijn van een institutionele verbetering van de keizersnedenpraktijk577, blijft vaginale bevalling na sectio een waardevol alternatief voor een herhalingssectio hoewel hiertegen een probleem in termen van veiligheid aangevoerd wordt.564;577;672-675
264
Hoofdstuk 5: Kwaliteit van zorgen
Bij de vergelijking van een proefarbeid met een electieve KS, vonden McMahon et al. tweemaal zoveel belangrijke maternale verwikkelingen (hysterectomie, uterusruptuur en operatief letsel) in de arm van de proefarbeid. Apgar scores, opname in een NICU, en perinatale mortaliteit, waren nochtans vergelijkbaar bij borelingen van moeders met een proefarbeid en die waarvan de moeder een electieve herhalingssectio ondergingen.675 Het risico van een uterusruptuur werd bevestigd in andere studies.632;676 Toegenomen perinatale mortaliteit en morbiditeit werden eveneens geassocieerd met een proefarbeid na voorafgaande sectio.567;588;632;676 Vermelden we dat in de VS ongeveer één derde van de sectio’s herhalingssectio’s zijn.564;677 Men vindt grote interziekenhuis praktijkverschillen, die niet verklaard kunnen worden door verschillen in de klinische bevolkingen of in het type van ziekenhuis. Markers van SES schijnen het meest uitgesproken effect te hebben op het cijfer van de pogingen tot vaginale bevalling na een eerdere keizersnede.629;678 Recente rapporten verdedigen nochtans een vaginale bevalling na een eerdere keizersnede, al dan niet op voorwaarde dat het advies voor vaginale bevalling na een eerdere keizersnede gebaseerd zou zijn op een scoresysteem.576;578;579;679-681 Bij gebrek aan gerandomiseerde klinische studies, besloot een peer−reviewed evidentie rapport dat de uitkomsten vergeleek van een electieve herhalingssectio met een proefarbeid voor een vaginale bevalling na een eerdere keizersnede (met inbegrip van de studie van McMahon) dat maternale sterftecijfers niet verschilden; dat infectiecijfers hoger lagen bij electieve herhalingssectio, maar dat in subgroepanalyses voor proefarbeid al dan niet gevolgd door een KS deze cijfers hoger lagen in de groep vrouwen die uiteindelijk een sectio ondergingen. Verder stelde men vast dat in geval van uterusruptuur het risico voor een maternale hysterectomie 4,8/ 10.000 bedraagt en het risico voor perinatale sterfte 1,5/10.000; en, dat er onvoldoende materiaal beschikbaar is om het effect van de wijze van verlossing op Apgar scores en respiratoire morbiditeit vast te stellen.576 In een review van 2005 concludeerden de auteurs dat studies op een consistente manier hoge slaagcijfers ( 60 tot 80 %) rapporteerden bij vaginale bevalling na een eerdere keizersnede bij vrouwen die eerder een lage segment incisie gehad hadden en dat : “De
Hoofdstuk 5: Kwaliteit van zorgen
265
huidige evidentie suggereert dat de meeste vrouwen, die insneden van het lage segment hadden bij een vorige keizersnede, veilig een proefarbeid kunnen ondergaan.”680 Voortbouwend op het AHRQ Evidence Report Number 71, werden er klinische richtlijnen uitgewerkt, met inbegrip van de beoordeling van de waarschijnlijkheid op succes van een vaginale bevalling na een eerdere keizersnede.682 Van twee lopende gerandomiseerde klinische studies wordt uitsluitsel verwacht betreffende de VABC problematiek.680 Onnodig te zeggen dat deze problematiek uitvoerig met de patiënte dient besproken te worden vooraleer een beslissing rond de bevallingswijze genomen wordt.588;682;683
3) Keizersnede op vraag van de moeder. Het National Institute for Clinical Excellence adviseert dat zwangere vrouwen, die om een KS vragen, er niet automatisch een krijgen indien er daarvoor geen medische redenen bestaan.684 Ook ACOG waarschuwt voor een electieve herhalingssectio voor niet−medische redenen, zeker bij vrouwen die meerdere kinderen verlangen, omdat het risico op placenta previa en accreta stijgen bij iedere KS.685 Naast medische redenen toonde het National Collaborating Centre for Women's and Children's Health aan dat significante kostenbesparingen kunnen gemaakt worden door een beleid te voeren dat erop gericht is de maternale vraag naar KS te verminderen.593 Beide aspecten zijn essentieel in Donabedian’s benadering van kwaliteit.265 5.2.4.7 Feedback naar beleidsverantwoordelijken Onze feedback kan, naast ziekenhuizen en het College, ook nuttig blijken voor beleidsverantwoordelijken. Hij kan immers de groeiende medicalisering van het geboortegebeuren onder hun aandacht brengen en meer bepaald een aantal van zijn structurele oorzaken. Dit materiaal kan een beleid schragen dat erin bestaat een operationele structuur te creëren die ermee belast wordt de toekomstige nationale feedbacks te begeleiden, de ontwikkeling van hierop gebaseerde kwaliteitsbevorderende acties en het initiëren van bijkomende indicatoren.Verder zullen lokale initiatieven, die aansluiten op de feedback, aangemoedigd worden. Zowel een continue investering in een infrastructuur voor kwaliteitsbevordering als het voorzien in een beschermde tijd voor deze activiteiten zijn vereist om het project te laten slagen.557
266
Hoofdstuk 5: Kwaliteit van zorgen
Tenslotte blijkt uit deze feedback duidelijk dat de organisatie van de obstetrische zorgen van fundamenteel belang is voor het beheersen van het keizersnedencijfer. Dit probleem zal in overleg tussen de verschillende niveaus dienen aangepakt te worden. Elementen van overweging bevatten (1) regionalisatie van diensten zodat er ook tijdens de weekends en buiten de diensturen altijd over het nodige personeel kan beschikt worden, (2) herziening van het financieringsmechanisme met onder meer een relatieve opwaardering van de vaginale verlossing en een betaling voor een zwangerschapsepisode, (3) operationele opsplitsing
van
het
specialisme
gynecologie-obstetrie,
en
herwaardering
en
herpositionering van de vroedvrouw, (4) aanduiding door de bevoegde overheden van een groep experten waarop de rechters dienen beroep te doen in geval van een gerechtelijk proces,
(5) een door de Colleges en beroepvereningingen uit te werken “informed
consent” waarin de indicaties voor een keizersnede objectief worden toegelicht, en (6) objectieve informatie naar de toekomstige moeders waarbij het beeld van “de keizersnede als de uiteindelijke manier van verlossing” objectief benadert wordt. Bijlage 1: Feedback. Beslisboom. Stap1: Periode analyse In overeenstemming met de aanwezige informatie wordt een periode score toegekend. Afwijking > + 35 > + 35 < - 25 < - 25 < + 36 en > 26 > + 35 < - 25
Bonferroni bovengrens
95% bovengrens
95% ondergrens ≥0
≤0 >0
≤0 <0 >0
Bonferroni onder grens ≥0 <0
Periode score 1 2 3 4 5 6 7
267
Hoofdstuk 5: Kwaliteit van zorgen Stap 2: Trend analysis In overeenstemming met de aanwezige informatie wordt een trend score toegekend. Afwijking >+5 >+5 <-5 <-5 < 6 en > -6
Bonferroni bovengrens
95% bovengrens
>0 ≤0
≤0
95% ondergrens ≥0
Bonferroni onder grens ≥0 <0
Trend score 1 2 3 4 5
Stap 3: Combinatie van periode en trend analyse Periode score Trend score 1 1 1 2 1 3 1 4 1 5 2 1 2 2 2 3 2 4 2 5 3 1 3 2 3 3 3 4 3 5 4 1 4 2 4 3 4 4 4 5 5 1 5 2 5 3 5 4 5 5 6 Eender welke 7 Eender welke
Cat 1 1 2 2 1 2 2 3 3 2 5 5 7 7 7 6 6 5 5 5 2 3 5 5 4 3 5
Feedback EAE A>0 EAE A>0 IAI A>0 IAI A>0 EAE A>0 IAI A>0 IAI A>0 iai A>0 iai A>0 IAI A>0 iai A<0 iai A<0 EAE A<0 EAE A<0 EAE A<0 IAI A<0 IAI A<0 iai A<0 iai A<0 iai A<0 IAI A>0 iai A>0 iai A<0 iai A<0 AMG iai A>0 iai A<0
Cat: globale score; EAE: externe audit aanbevolen; IAI: interne audit aanbevolen; iai: interne audit valt te overwegen; AMG: neem algemene maatregelen. A < 0: afwijking < 0; A > 0: afwijking > 0.
268
Hoofdstuk 5: Kwaliteit van zorgen
Bijlage 2: Majeure congenitale afwijkingen mogelijkerwijs gerelateerd met geboorte asfyxie Congenitale afwijking Neuraalbuis defecten Hersenafwijkingen Microcefalie Majeure aangeboren hartafwijkingen Cerebrovasculaire anomalie Anomalie van het ademhalingstelsel Gastrointestinale anomalie Renale/blaas anomalie Cranosynostose Defect van de abdominale wand Down syndroom Andere congenitale afwijkingen Multipele anomalieën niet gespecificeerd
ICD−9−CM 740.0−741.9 742.0, 742.2−742.4, 745.9 742.1 745.0−745.3, 745.6, 746.0−746.9, 747.1, 747.3, 747.41 747.81 748.3−748.6 750.3, 751.0−751.5,751.8, 751.9 753.0−753.9 756.0 756.7 758.0 758.1−758.9 759.7
5.3 INTERZIEKENHUIS VERGELIJKING VAN LETALITEITCIJFERS NA EEN OPNAME VOOR ACUUT MYOCARDINFARCT.
De tekst van dit hoofdstuk is gebaseerd op onderzoek van de jaren 2004 tot 2007. Vertrekkend van een tekst van de AHRQ wordt de analyse van deze kwaliteitsindicator met input van de Collegs van cardiologen, intensivisten en urgentisten, en van het MONICA-register (Gent-Brugge) verfijnd en aangepast aan de Belgische context. 5.3.1 Inleiding Het acuut myocardinfarct (AMI) is een belangrijk gezondheidsprobleem in termen van frequentie, ernst, sociale en economische kosten, behandelbaarheid, en wordt beschouwd als een prioriteit door beleidsmakers en gemeenschap.500;686;687 Het is gekenmerkt door een hoog letaliteitcijfer (AMI-LC), tot negen maal meer in de oudere leeftijdsgroepen (> 65 jaar)688. Deze leeftijdsgroepen vertonen overigens minder typische symptomen en vaker een cardiogene shock.688
Hoofdstuk 5: Kwaliteit van zorgen
269
Acute hartdecompensatie doet zich binnen de 24 uur na een AMI voor bij 30% van de patiënten en leidt in 7-10 % der patiënten tot een cardiogene shock, de meest gevreesde verwikkeling van AMI.689 Dergelijke shock is gekenmerkt door een sombere prognose en doet zich ongeveer in 1/3 der gevallen vóór de ziekenhuisopname voor.690-696 Indien systematisch en onmiddellijk een angioplastie, wat door de Europese richtlijn697 aanbevolen werd, toegepast wordt, situeert de intramurale letaliteit bij cardiogene shock zich rond 25% versus ongeveer 1% indien het een AMI zonder shock is.693 Er bleek anno 2000 weinig of geen letaliteit- en therapieverschil tussen mannen en vrouwen meer te bestaan, wel verschillen in symptomatologie.698-703 Daartegenover staat dat er bij oudere patiënten een ondergebruik bestaat van thrombolytische therapie.688 In de midden-negentiger jaren stelde men dat het natuurlijk verloop van AMI moeilijk te beschrijven was wegens het bestaan van asymptomatische infarcten, van fatale acute coronaire sterfgevallen buiten het ziekenhuis en van verschillen in de gebruikte diagnostische methodologie.697 De “community” 30-dagen AMI-sterfte werd op een consistente manier geëvalueerd op 50% waarvan de helft binnen de eerste twee uur.697 De intramurale AMI letaliteit evolueerde van een 25-30% in de 60ger jaren tot een 18% in de midden-tachtiger jaren, de extramurale sterfte daarentegen veranderde in Europa, in tegenstelling met Minnesota (Verenigde Staten)704, in die tijdsspanne nagenoeg niet697. Het type ziekenhuis (met of zonder een cardiologiedepartement) scheen een invloed te hebben op behandeling en uitkomst na een AMI, gekenmerkt door een lagere mortaliteit en minder hartfalen. Men slaagde in ziekenhuizen met een cardiologiedepartement er vaker in de doorstroming te herstellen.705 Hoewel er aangetoond werd dat richtlijnen het AMI-LC doen dalen706-709, werden ze in Europea710-712 en Noord-Amerika688;713-717 niet altijd en niet eenvormig toegepast, onder meer wegens het niet doorstromen van richtlijnen uit “cardiologen” tijdschriften naar huisartsen en internisten.706;714;718Verder schijnt het zo te zijn dat er een omgekeerd verband bestaat tussen de ernst van een geval en het toepassen van richtlijnen, 710en zijn de richtlijnen voor thrombolyse in oudere patiënten niet eenduidig688. Het publiekelijk vrijgeven van AMI-LC schijnt in een Canadese context een positieve invloed uit te oefenen op kwaliteitsinitiatieven.298
270
Hoofdstuk 5: Kwaliteit van zorgen
Om de zorg van AMI-patiënten te rationaliseren, werd in België een cardiaal zorgprogramma ingevoerd.719 Een structuur bestaande uit drie niveaus werd opgezet: basiszorg ziekenhuizen (met A als label) zonder catheterisatie mogelijkheden, intermediaire ziekenhuizen (met B1 als label) waar coronaire angiografieën kunnen uitgevoerd worden maar geen percutaneous coronary intervention (PCI), en tertiaire ziekenhuizen (met B2-B3 als label), die de ganse gamma van cardiale therapieën aanbieden met inbegrip van PCI en coronary artery bypass graft (CABG). Nochtans bleek een recente studie niet bij machte een betere uitkomst aan te tonen voor patiënten, behandeld in een dienst waar een PCI uitgevoerd kon worden.720 Een vergelijking van de intramurale AMI-LC tussen de ziekenhuizen is geen eenvoudige opgave. Als voormeld doen een groot deel van de sterfgevallen zich voor in de eerste twee uur na het infarct, wat tot het niet-stellen van een “vaste klinische” diagnose op basis van de klassieke criteria (symptomen, EKG en enzymen) kan leiden, en bestaan er verschillen in diagnosestelling met een eventuele weerslag op teller en noemer van het letaliteitcijfer.697;721 Twee van de belangrijkste problemen in verband met cardiale zorg, te weten het volumeuitkomst verband voor PCI en de superioriteit van primaire angioplastie ten aanzien van thrombolytische therapie, beheersten anno 2000 - onze studieperiode liep van 2002 tot 2005 - het wetenschappelijke debat.716Hierbij dient men er rekening mee te houden dat in het “reële leven” patiënten in eerste instantie beroep doen op lokale spoeddiensten en lokale ziekenhuizen en dat daar de therapeutische beslissing over een eventuele angioplastie versus thrombolyse genomen wordt.722In België bepaalde de toenmalig geldende bepalingen trouwens dat patiënten door de spoeddiensten naar het dichtstbijzijnde ziekenhuis moesten gebracht worden.720 Laten we om een faire interziekenhuis vergelijking te kunnen doorvoeren de toenmalige, zich ontwikkelende en actuele stand van de wetenschap summier trachten weer te geven. Wij baseerden ons hiervoor bij voorkeur op klinische studies of meta-analyses. Men nam aan dat er een onderscheid diende gemaakt te worden tussen ST segment elevatie myocardinfarct (STEMI) en nieuwe Linker Bundeltakblok (LBTB), en niet-ST
Hoofdstuk 5: Kwaliteit van zorgen
271
segment elevatie myocardinfarct (NSTEMI), wegens hun verschillende prognose en behandeling.697;705;717;723;724 In geval van STEMI of een nieuwe LBTB gold het voorschrift zo snel mogelijk de perfusie te herstellen.697;704;713;717;725-727Dit gebeurde dan liefst via PCI of CABG697;728-732, zeker in de hoogrisico gevallen697, maar ook als een thrombolyse niet tijdig kon doorgevoerd worden.733 Verder kwam men tot de bevinding dat het veilig was patiënten te vervoeren van basiszorg naar tertiaire ziekenhuizen733, op voorwaarde dat verkeersopstoppingen geen courant probleem vormden725. Men stelde vast dat hoogrisicopatiënten – er bestonden bruikbare classificatiesystemen om hen te identificeren734 - en patiënten met extensieve infarcten beter getransporteerd werden voor een angioplastie dan dat ze een thrombolyse kregen735-737. Wel bestonden er opinieverschillen over transfer bij slechte hemodynamische toestand (o.a. cardiogene shock)725;733;738-740. Het was ook zo dat patiënten met contra-indicaties voor thrombolyse bijna steeds d.m.v. een invasieve benadering konden behandeld worden in competente centra.739Het begon eveneens duidelijk te worden dat stents en abciximab - een bloedplaatjesaggregatie inhibitor - de uitkomsten van primaire angioplastie verbeteren.739 Het inzicht groeide dat primaire angioplastie meer kosten-effectief zou zijn dan thrombolyse, en dat primaire angioplastie waarschijnlijk veilig uitgevoerd kon worden zonder chirurgische back-up, mits het rigoureus toepassen van eligibiliteitscriteria.739 De relatieve merites van pre-hospitaal (“on-site”) thrombolyse en Primary PCI (PPCI) stonden ter discussie736;741en pre-hospitaal thrombolyse werd als efficiënter beschouwd dan intramurale thrombolyse.742 Men stelde verder vast dat een opname buiten de diensturen het starten van de therapie vertraagde, wat vooral in geval van thrombolyse tot slechtere resultaten leidde743en dat het volume van uitgevoerde PTCAs omgekeerd evenredig was met mortaliteit717;738;741;744. De gehanteerde definitie en veranderingen in de definitie van AMI kunnen in grote mate de incidentie en letaliteitcijfers van AMI beïnvloed hebben, net zoals de verscheidenheid van de verschillende cardiale troponine assays.721;745-749 Er bleek overigens slechts een
272
Hoofdstuk 5: Kwaliteit van zorgen
matige overeenkomst te bestaan tussen diagnose bij opname en bij ontslag.712 Verder maakte de Internationale Classificatie van Ziekten, Negende Herziening, Klinische Modificatie194 (ICD-9-CM) voor 2006 – dus tijdens de studieperiode - geen onderscheid tussen STEMI en NSTEMI, hoewel ze daarvoor nu richtlijnen verschaft.750 STEMI wordt gecodeerd als 410.0-6, 410.8; NSTEMI als 410.7; en AMI “Not Otherwise Specified” (AMI NOS) als 410.9. Het wordt dan, behalve het problematische AMI NOS, mogelijk de codering te herinterpreteren in overeenstemming met deze update. Een volgende moeilijkheid betreft het presenteren van de eventuele verschillen in AMILCs tussen de ziekenhuizen. “League tables” (profielen zonder adequate risicocorrectie) zijn hiervoor inadequate instrumenten.286 Administratieve gegevens en meer specifiek hun correctie-maten (zoals ROM) dienen in deze context van risicocorrectie trouwens zeer omzichtig gebruikt te worden.188;196Verschillende alternatieve benaderingen werden ontwikkeld. Vaak gaat het dan over geselecteerde studiegroepen of leeftijden.715;751 Een eenvoudig drievariabelen model, bestaande uit leeftijd, hartslag en systolische bloeddruk bij opname (allen als continue variabelen gemodelleerd) bleek voor patiënten van alle leeftijdsgroepen een goede predictor te zijn voor de 30-dagen mortaliteit zoals uit een “area under the receiver operatings characteristic curve” (AROC) van ongeveer 0,75 bleek.751Geslacht leek geen invloed uit te oefenen, maar leeftijd alleen bleek een AROC van 0,71 op te leveren.751 Ongeveer gelijktijdig werden in Canada twee modellen, gebaseerd op elf secundaire oorzaken of op Charlson’s comorbidity index in ziekenhuisontslaggegevens, ontwikkeld, die vergelijkbare resultaten opleverden (met iets betere resultaten voor het elfvariabelen model), ook wanneer het toegepast werd op een bevolking in de VS.752 Naast klinische en epidemiologische bevindingen, die een verband aantoonden tussen betere zorg en betere uitkomst707;753, leidden de maatschappelijke implicaties bij de programmering van cardiale zorgen en het feit dat meerdere landen AMI-LC reeds als kwaliteitsindicator gebruikten286;301;752 of van plan waren te gaan gebruiken ons er toe AMI-LC te gebruiken als kwaliteitsindicator. Onder voorbehoud over voldoend volledige en accurate gegevens te beschikken, trachtten we aan de hand van ontslaggegevens het bestaan aan te tonen van (1) klinisch belangrijke
Hoofdstuk 5: Kwaliteit van zorgen
273
en statistisch significante interziekenhuis verschillen in AMI-LC, en (2) een nationale trend van het AMI-LC. Daarenboven trachtten we de letaliteit te vergelijken in functie van het type ziekenhuis. 5.3.2 Methoden 5.3.2.1 Gegevensbronnen De Minimale Klinische Gegevens (MKG) bevatten patiëntengegevens (waaronder geboortejaar, geslacht, verblijfplaats, een anoniem ziekenhuisidentificatienummer), verblijfsgegevens (waaronder het jaar en de maand van opname en ontslag, transfer vanuit en naar een ander ziekenhuis) en een onbeperkt aantal nevendiagnosen en ingrepen. De MKG verzamelt gegevens over alle verblijven met inbegrip van verblijven van patiënten, die in het buitenland verblijven. Een uniek identificatienummer, dat het opvolgen van een getransfereerde patiënt moet toelaten, ontbreekt. Daarentegen is het mogelijk de “Charlson’s comorbidity index” te berekenen, die bijzonder geschikt lijkt voor het bestuderen van de ziekenhuisletaliteit bij patiënten met een ischemische hartziekte.326 Daar volledigheid en accuratesse van de gegevens welgekende beperkingen zijn van administratieve gegevens182;718 vergeleken we onze gegevens met die van het MONICA (Multinational Monitoring of Trends and Determinants in Cardiovascular Disease) register, die verzameld worden volgens de WGO richtlijnen.745 Deze vergelijking dient met de grootste omzichtigheid uitgevoerd te worden: de studiepopulatie is niet helemaal identiek en de definitie van de gevallen gebeurt niet op dezelfde manier. Voor MONICA wordt de studiepopulatie gedefinieerd als alle personen woonachtig in de studieregio i.e. in Groot Gent en in het arrondissement Brugge, met uitzondering van Knokke-Heist. De nietfatale gevallen worden opgespoord via een gestandaardiseerde benadering van de ziekenhuizen in de regio en via een bevraging van huisartsen van de studieregio met inbegrip van gevallen elders in België en het buitenland. Voor de fatale gevallen wordt daarenboven beroep gedaan op de overlijdensberichten van personen woonachtig in de studieregio. Uit de MKG selecteerden wij alle personen met een woonplaats in de studieregio. Waar de criteria voor het definiëren van een AMI-geval op eenvormige manier gehanteerd wordt in de MONICA registratie (gebaseerd op kliniek, EKG en cardiale enzymen), die dezelfde blijven over de jaren kunnen we dit niet zo maar veronderstellen
274
Hoofdstuk 5: Kwaliteit van zorgen
voor de MKG. In functie van de aanwezige evidentie onderscheidt MONICA onder meer “bewezen”, “mogelijke” en “fatale gevallen met onvoldoende gegevens”. Zoals Kuch et al. het stellen berust de klinische definitie van AMI op een aan de hand van symptomen, EKG en enzymen gestelde diagnose van acuut myocardinfarct wat overeenkomt met een “bewezen” geval van MONICA.721Merken we hierbij op dat MONICA om de tijdstrend van AMI-gevallen en de resultaten van hun behandeling te volgen geen beroep doet op de meer gevoelige nieuwere cardiale enzymen. Tenslotte dient men er rekening mee te houden dat de AMI diagnose van de MKG gebaseerd is op de diagnose bij opname waar dit voor MONICA de diagnose bij ontslag is. 5.3.2.2 Studiepopulatie Voortbouwend op het werk van de Agency for Healthcare Research and Quality (AHRQ)753, selecteerden we voor de periode van 2002 tot 2005 uit de MKG alle verblijven met een hoofddiagnose van AMI (ICD-9-CM code 410.*1). Gevallen zonder informatie betreffende de vitale status bij ontslag of van minder dan 18 jaar werden uitgesloten. Vermits ziekenhuizen met zeer weinig observaties ook extreme, niet significante waarden vertonen, die de
interpretatie van de figuren bemoeilijken, sloten wij daarenboven
ziekenhuizen met minder dan 20 gevallen per jaar uit. Wegens problemen verbonden aan het transfereren van zieken, met name het dubbel tellen van gevallen, en om de vergelijking tussen de ziekenhuizen zo eerlijk mogelijk door te voeren, werd naar het voorbeeld van het AHRQ het AMI-LC op twee manieren berekend. Een eerste, de zogenaamde IQI 15753 waarin de “uitgaande” transfers werden uitgesloten (om geen nationale cijfers te berekenen met tweemaal getelde observaties) (N = 46287) en een tweede, de zogenaamde IQI 32754, waarin zowel de “binnenkomende” als de “uitgaande” transfers werden uitgesloten (om een vergelijking tussen ziekenhuizen mogelijk te maken in de subset van gevallen die er van opname tot ontslag behandeld werden) (N = 38121). We hebben het probleem van de transfers meer uitvoerig bestudeerd op basis van de MKG 2001-2004.
275
Hoofdstuk 5: Kwaliteit van zorgen
5.3.2.3 Analyse Voor de bedoeling, de eenheid van analyse, de bepaling van een “zone van nietinterpretatie”, de gegenereerde feedback en zijn interpretatie, en de statistische analyse verwijzen we naar de gelijknamige secties in 5.2.2 van onze studie m.b.t. het keizersnedencijfer. Bij gebrek aan een uniek identificatienummer trachtten we getransfereerde patiënten te identificeren met een samengestelde sleutel bestaande uit het geboortejaar van de patiënt; geslacht; woonplaats; jaar en maand van opname en ontslag; en, in de veronderstelling van zeer korte transfer tijden, weekdag van het ontslag (in het ziekenhuis van waaruit getransfereerd werd) of opname (in het ziekenhuis waar naartoe getransfereerd werd). Wegens het numerieke en therapeutisch belang van transfers na een AMI, trachtten we na te gaan hoe belangrijk dit fenomeen in onze studie was. Verder zou uit de transfer reconstructie ook belangrijke aanduidingen i.v.m. kwaliteit van de gegevens en van de zorgen kunnen gewonnen worden. Het zou mogelijk zijn bij dergelijke patiënten na te gaan (1) of de Charlson’s comorbidity index constant bleef en (2) hoelang de patiënt in het ziekenhuis van de uitgaande transfer verbleef vooraleer hij getransfereerd werd. Een constante
Charlson’s
co-morbidity
index
is
belangrijk
in
termen
van
codeervergelijkbaarheid en derhalve voor onze risicocorrectie. De verblijfsduur vóór transfer is belangrijk om het onderscheid te kunnen maken tussen een onmiddellijke doorverwijzing of een noodangioplastie na een mislukte thrombolyse en een latere transfer voor een electieve PTCA in afwezigheid van spontane of provoceerbare ischemie, die noch het functioneren van de linker ventrikel, noch de overlevingskansen verbetert.697 Tenslotte voerden we een sensitiviteitsanalyse uit door cardiogene shock aan het model toe te voegen al dan niet in combinatie met angioplastie en STEMI, waarbij STEMI uit drie categorieën bestond, afgeleid op basis van de voormelde ICD-9-CM codes en met name STEMI, NSTEMI en AMI NOS. Het al dan niet toedienen van een thrombolytische therapie kan op basis van de MKG alleen niet achterhaald worden, maar vereist een koppeling met de RIZIV gegevens. Vermits deze koppeling een bijzondere toelating vereist (waarvoor de procedure nog niet definitief vastligt) konden we thrombolyse in deze studie niet opnemen en dient de bruikbaarheid van dit gegeven voor een routine analyse nog uitgeklaard te worden.
276
Hoofdstuk 5: Kwaliteit van zorgen
5.3.3 Resultaten 5.3.3.1 Volledigheid en accuratesse van de gegevens. Vergelijking tussen MKG en MONICA Gent Brugge Bij de vergelijking van de gegevens tussen beide registratiesystemen vallen de bijzonder grote verschillen op zowel qua aantallen gevallen als qua aantallen fatale gevallen (Tabel 1). Het gaat hierbij over een veel groter aantal gevallen in de MKG registratie, op de vrouwen in Gent na, en over een veel groter aantal fatale gevallen geregistreerd in de MONICA registratie. Noteren we dat in de MONICA registratie 32 van de 77 sterfgevallen zich in het eerste uur na het ontstaan van de symptomen voordeden (Tabel 2), toen die patiënten zich waarschijnlijk nog in de spoeddienst bevonden en derhalve niet als een AMI geregistreerd werden in de MKG. Verder is het mogelijk dat een deel van de patiënten die na meer dan 24 uur overleden, thuis overleden zijn. Tabel 1 Volledigheid en accuratesse van de gegevens Vergelijking tussen MKG en MONICA Gent Brugge BRUGGE Leeftijd 25-34 35-44 45-54 55-64 65-69 70-74 Totaal GENT Leeftijd 25-34 35-44 45-54 55-64 65-69 70-74 Totaal
Mannen MKG MONICA Fatale Totaal Fatale Totaal gevallen gevallen 0 0 0 0 0 5 0 6 1 38 5 44 1 51 5 48 1 23 5 21 2 26 5 27 5 143 20 146
Vrouwen MKG MONICA Fatale Totaal Fatale Totaal gevallen gevallen 0 0 0 0 0 1 0 1 0 2 1 6 1 5 1 5 0 7 3 11 2 13 4 16 3 28 9 39
Mannen MKG MONICA Fatale Totaal Fatale Totaal gevallen gevallen 0 2 0 2 0 8 1 13 1 26 5 31 5 46 12 49 0 16 4 21 4 25 9 24 10 123 31 140
Vrouwen MKG MONICA Fatale Totaal Fatale Totaal gevallen gevallen 0 3 0 2 0 0 0 1 1 4 3 9 1 11 5 11 1 5 2 9 0 15 7 15 3 46 17 47
277
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 2: Aantal fatale gevallen per tijdsperiode van overlijden, geregistreerd in de MONICA registratie. Tijdsperiode van overlijden
Brugge
Gent
Totaal
Mannen Vrouwen Mannen Vrouwen < 1 uur
6
2
17
7
32
1-24 uur
6
4
9
5
24
> 24 uur
8
3
5
5
21
20
9
31
17
77
Totaal
5.3.3.2 Transfers We bestudeerden het probleem van de transfers op basis van de MKG 2001-4. Zoals blijkt uit figuur 1 werd er bij 23.556 (37%) van de 63.237 verblijven, met AMI (410.*1) als hoofddiagnose, een transfer geregistreerd. De onvolledigheid van de registratie m.b.t. transfers kwam aan het licht wanneer we de binnenkomende (IN) en uitgaande transfers (OUT), respectievelijk 6.555 en 12.409 trachtten te koppelen. We konden dan slechts 2.524 van de inkomende transfers terugvinden in de uitgaande transfers. Van deze 2524 inkomende transfers waren er daarenboven 513 afkomstig uit een B2-B3 ziekenhuis en getransfereerd naar een A of B1 ziekenhuis. Het ging hierbij waarschijnlijk over patiënten afkomstig uit een A of B1 ziekenhuis, doorverwezen naar een B2-B3 ziekenhuis voor een angioplastie, na behandeling terug opgenomen in het eerste ziekenhuis en waarbij de transfers onvolledig geregistreerd waren. De verblijven met transfers, waarbij we een koppeling hebben kunnen maken tussen binnenkomende en uitgaande transfers, werden verder onderzocht met een dubbele bedoeling. Een eerste ging over de accuratesse van de gegevens en met name in welke mate de co-morbiditeit bij dezelfde patiënt in twee ziekenhuizen eenvormig geregistreerd werd. Hiervoor vergeleken we de kwartielenwaarden van de Charlson scores in het ziekenhuis van waaruit de patiënten getransfereerd werden met de kwartielenwaarden van de Charlson scores voor dezelfde patiënten in het ziekenhuis waarheen zij getransfereerd werden. Deze nogal summiere vergelijking leverde volgend resultaat op: vóór transfer
278
Hoofdstuk 5: Kwaliteit van zorgen
bedroegen de kwartielwaarden voor het eerste kwartiel 0, voor de mediaan 0 en voor het derde kwartiel 2. Na transfer bedroegen die waarden respectievelijk 0, 1 en 2. Wanneer we de Charlson’s comorbidity index vóór en na transfer bij de binnenkomende (IN) en binnenkomende en uitgaande transfers (IN én OUT) bleken de drie kwartielen van de scores dezelfde waarde te hebben. Dit wijst, menen we, op een aanvaardbare codeervergelijkbaarheid in de meerderheid van de gevallen en met een beperkte weerslag op de riscocorrectie. Figuur 1: Interziekenhuizen transfer van patiënten in geval van een verblijf met AMI (410.*1) als hoofddiagnose. MKG 2001-4
Hoofddiagnose = AMI 63267 verblijven
39711 verblijven zonder transfer (63%)
6555 verblijven transfer IN (10%)
23556 verblijven met transfer (in en/of out) (37%)
12409 verblijven transfer OUT (20%)
4592 verblijven transfer IN èn OUT (7%)
Een tweede aandachtspunt betrof het ogenblik van de transfer. Dit gegeven laat immers toe na te gaan of de transfer gebeurde voor een onmiddellijke (“rescue”) angioplastie, in principe minder dan 24 uur. Bij deze groep patiënten was de verblijfsduur (LOS) vóór een transfer naar een B2-B3 ziekenhuis groter dan 24 uur bij minstens 50% der patiënten (Mediaan van LOS = 2). Dit suggereert dat het in een behoorlijk aantal gevallen niet om een transfer voor een spoed angioplastie ging maar wel voor een electieve angioplastie.
Hoofdstuk 5: Kwaliteit van zorgen
279
5.3.3.3 Sensitiviteitsanalyse Vertrekkend van een basismodel met leeftijd, geslacht en Charlson’s comorbidity index als verklarende variabelen, voegden we eerst het al dan niet aanwezig zijn van een cardiogene shock en vervolgens het uitvoeren van een angioplastie als verklarende variabelen aan het basismodel toe. We herhaalden deze opzet maar nu met een het al dan niet aanwezig zijn van een STEMI in plaats van een shock. Zowel de periode als trendanalyses werden telkens uitgevoerd. Deze oefening deden we zowel voor de gegevens zonder uitgaande transfers (IQI 15) als voor de gegevens waarbij alle transfers werden uitgesloten (IQI 32). Voor deze analyses maakten we gebruik van MKG 2002-5. Om de invloed van het toevoegen van verklarende variabelen aan het model te resumeren, hebben we de ziekenhuizen in zeven categorieën ondergebracht. Zij varieerden van sterke: categorie 1, matige: categorie 2, zwakke: categorie 3 evidentie van een afwijking boven het nationale gemiddelde cijfer en trend; over geen of geen interpreteerbaar verschil: categorie 4; tot zwakke: categorie 5, matige: categorie 6 en sterke: categorie 7 evidentie van een afwijking onder het nationale gemiddelde cijfer en trend. Hierbij gingen we na of de verschillende modellen ook leidden tot een verandering van categorie voor de ziekenhuizen. We vonden geen invloed, onafhankelijk van de gebruikte correctie en van de selectie van de verblijven in functie van een eventuele transfer, in 26 ziekenhuizen [20 maal categorie 4; 2 maal categorie 1 en 2 maal categorie 5; 1 maal categorie 2; 1 maal categorie 7]. De ziekenhuizen met een constante categorie 1 en categorie 7 waren van het type A. Bij 61 ziekenhuizen vonden we een geringe invloed van de gebruikte correctie. Hierbij definieerden we gering als maximaal 2 categorieën verschil tussen hoogste en laagste score. Voor 18 ziekenhuizen bestempelden we de invloed van de gebruikte correctie als belangrijk. We deden dit wanneer er een verschil van drie categorieën werd vastgesteld maar er consistent boven of onder categorie 4 gescoord werd. We besloten tot een uitzonderlijke invloed voor de andere 4 ziekenhuizen (Tabel 3).
280
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 3: Invloed van het al dan niet uitsluiten van binnenkomende transfers en van de gebruikte correcties op de afwijking van een ziekenhuis tov het nationale gemiddelde of de nationale trend. Cardiaal zorgprogramma
Invloed geen
A B1 B2-B3 Totaal
gering
belangrijk
Totaal uitzonderlijk
17 (27,87) 40 (65,57)
2 ( 3,28)
2 (3,28)
61
4 (21,05) 12 (63,16)
3 (15,79)
0 (0,00)
19
13 (44,83)
2 (6,90)
29
5 (17,24) 26
9 (31,03) 61
18
4
109
( ): rij percentage
In de MKG 2002-5 stelden we bij vier ziekenhuizen, 2 A ziekenhuizen en 2 B2-B3 ziekenhuizen, een uitzonderlijke invloed van de gebruikte correctie vast. Op 29 B2-B3 ziekenhuizen bleken er 15 een belangrijke of uitzonderlijke invloed te ondergaan t.g.v. de modellering. Het ging daarbij vaak om een verslechtering van de AMI-LC categorie wanneer aan een model met een basiscorrectie (leeftijd, geslacht, Charlson score en trend) en een correctie voor shock, nadien een model gefit werd waarbij ook gecorrigeerd werd voor angioplastie en dit zowel wanneer de inkomende transfers in de analyse werden opgenomen (IQI15) als wanneer dit niet gebeurde (IQI32). We illustreren de invloed van de verschillende modellen op de categorisatie van de B2-B3 ziekenhuizen aan de hand van tabel 4.
281
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 4: Voorbeeld van de invloed van het gebruikte statistisch model op de categorisatie van drie B2-B3 ziekenhuizen.
ID
Model
21 B BS BSA BST BSTA 56 B BS BSA BST BSTA 65 B BS BSA BST BSTA
Periode (%) Trend (%) Categorie Invloed 17 30 52 20 34 -34 -31 5 -29 -5 5 3 49 3 35
7 4 4 9 10 -3 -4 -1 -4 -2 -8 -12 -11 -8 -8
3 4 1 3 3 7 7 4 7 4 5 5 2 5 5
3
3
4
ID: Anoniem ziekenhuisnummer; B: basiscorrectie (leeftijd, geslacht, Charlson score en trend) BS: basiscorrectie + correctie voor shock BSA: basiscorrectie + correctie voor shock + correctie voor angioplastie BST: basiscorrectie + correctie voor STEMI BSTA: basiscorrectie + correctie voor STEMI + correctie voor angioplastie Periode (%): afwijking van het ziekenhuis bij de periodeanalyse Trend (%):afwijking van het ziekenhuis bij de trendeanalyse
Een verdere analyse volgens het model “basiscorrectie + correctie voor shock + correctie voor angioplastie” uitgevoerd op de groep van B2-B3 ziekenhuizen toonde aan dat het AMI-LC een zeer belangrijke invloed onderging zowel van shock (OR: 28,8; 95% BI [25,2; 32,8]) als van het uitvoeren van een angioplastie (OR: 0,24; 95% BI [0,20;0,29]). Verder stelden we vast dat de B2-B3 ziekenhuizen met een
“belangrijke” of
“uitzonderlijke” invloed significant meer angioplasties uitvoerden (OR: 1,26; 95% BI [1,19;1,33]) dan de andere B2-B3 ziekenhuizen. Verder bleken ze daarenboven significant meer angioplasties uit te voeren in geval van STEMI zoals de interactie term tussen “belangrijke” of “uitzonderlijke” invloed versus “geen” of “matige” invloed en het al dan niet corrigeren voor STEMI (OR: 1,11; 95% BI [1,02;1,21]) aantoonde.
282
Hoofdstuk 5: Kwaliteit van zorgen
5.3.3.4 Interziekenhuis verschillen in AMI-LC, MKG 2002-5 We stelden belangrijke en significante (Bonferroni-gecorrigeerd) interziekenhuis verschillen vast (Figuren 2a, 2b, 3a en 3b). Voor de periodeanalyse (bovenste deel van de figuren) varieerden de afwijkingen tussen de – 63 % en de + 182 %, indien alleen de uitgaande transfers werden uitgesloten. Ze varieerden tussen de – 65 % en de + 196 %, wanneer alle transfers werden uitgesloten. Voor de trend analyse bedroegen deze cijfers respectievelijk –41% en + 30%, en – 47% en + 39%. Een overzicht van de invloed van de verschillende modellen op de afwijking presenteren we in volgende tabel. Tabel 5: Sensitiviteitsanalyse van intramurale letaliteit na een opname voor AMI. Bereik van de puntschatters van de “afwijkingen” per model. MKG 2002-5. B
B+ Sh
Max Min Max Min Geen
Periode
uitgaande
Trend
B + Sh + A Max
B + St
B + St +A
Min Max Min Max Min
140
-64
182
-63
152
-70
97
-59
91
-64
25
-38
30
-41
29
-42
27
-54
26
-31
153
-62
196
-65
163
-71
104
-64
84
-63
29
-42
39
-47
42
-48
30
-32
31
-33
transfer Geen transfer
Periode Trend
B: basismodel (leeftijd, geslacht en Charlson); B+Sh: basismodel + shock; B+ Sh +A: basismodel +shock + angioplastie; B + St: basismodel + STEMI; B + St +A: basismodel + STEMI + angioplastie; Max en Min: respectievelijk maximum en minimumwaarde van het bereik.
Het al dan niet uitsluiten van de inkomende transfers bleek voor sommige ziekenhuizen een belangrijke invloed te hebben op hun afwijking t.o.v. het nationale gemiddelde/trend. Een voorbeeld van deze feedback voor de eerste tien ziekenhuizen vindt u in tabel 6. Binnen de groep B2-B3 ziekenhuizen bleken er eveneens belangrijke verschillen in AMILC te bestaan (Figuren 4 en 5).
283
Hoofdstuk 5: Kwaliteit van zorgen Tabel 6: Afwijking van het AMI-LC van een ziekenhuis (uitgedrukt in percent) t.o.v. het nationale AMI-LC of trend, België, 2001-4. ID1
Periode OG_B OG_95 A(%) BG_955 BG_B6 BI_957 BI_B8 2
4
3
P
9
2
3
OG_B OG_95
A(%)
4
BG_95
5
Trend BG_B6
IP10 BI_95
7
8
BI_B
P
9
1 2
-52 -14
-42 2
-25 26
-5 53
15 78
+
NS NS
0.00000 0.03696
-15 -15
-8 -9
2 0
12 9
21 16
NS NS
NS NS
0.61403 0.88558
3
-45
-33
-13
10
33
NS
NS
0.03606
-29
-23
-15
-5
3
-
NS
0.00000
4
26
56
101
152
195
+
+
0.00013
-7
3
17
32
45
+
NS
0.02095
5 6
-63 -47
-43 -20
-1 29
62 98
127 165
NS NS
NS NS
0.94745 0.23656
-14 -36
2 -23
26 -3
54 21
79 43
+ NS
NS NS
0.03412 0.73364
7 8 9 10
102 -60 -42 -51
136 -46 -17 -36
182 -21 28 -12
230 13 88 20
268 48 146 51
+ NS NS NS
+ NS NS NS
0.00000 0.01782 0.20483 0.20888
-18 -18 -34 -16
-11 -8 -22 -6
-1 6 -4 7
10 22 16 23
19 35 35 36
NS NS NS NS
NS NS NS NS
0.81802 0.35683 0.50037 0.23705
1
ID: Anoniem ziekenhuisnummer; OG_B: Ondergrens van het Bonferroni betrouwbaarheidsinterval; 3 OG_95: Ondergrens van het 95% betrouwbaarheidsinterval; 4 A: afwijking van het ziekenhuis AMI-LC vergeleken met het nationale AMI-LC cijfer/trend; 5 BG_95: Bovengrens of the 95% betrouwbaarheidsinterval; 6 BG_B: Bovengrens van het Bonferroni betrouwbaarheidsinterval; 7 BI_95:+: a 95% CI suggereert een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: a 95% CI suggereert een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: a 95% CI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend. 8 BI_B: +: het Bonferroni−gecorrigeerd CI suggereert sterk een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het Bonferroni−gecorrigeerd CI suggereert sterk een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het Bonferroni−gecorrigeerd CI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend. 9 P: Probabiliteit dat een ziekenhuisafwijking t.o.v. het nationale cijfer/trend = 0. 10 IP: Interpretatie: EA: External audit en algemene maatregelen aanbevolen; AGM: algemene maatregelen aanbevolen. 2
AMG AMG iai A<0 EAE A>0 iai A>0 AMG EAE A>0 AMG AMG AMG
284
Hoofdstuk 5: Kwaliteit van zorgen
Figuur 2a: Periode-analyse van interziekenhuis verschillen in AMI-LC met alleen inkomende transfers. MKG 2002-5.
Figuur 2b: Periode-analyse van interziekenhuis verschillen in AMI-LC, geen transfers. MKG 2002-5.
Hoofdstuk 5: Kwaliteit van zorgen Figuur 3a: Trend-analyse van interziekenhuis verschillen in AMI-LC met alleen inkomende transfers. MKG 2002-5
Figuur 3b: Trend-analyse van interziekenhuis verschillen in AMI-LC, geen transfers. MKG 2002-5
285
286
Hoofdstuk 5: Kwaliteit van zorgen
Figuur 4: Periodeanalyse van verschillen tussen B2-B3 ziekenhuizen in AMI-LC. Geen transfers. MKG 2002- 5.
Figuur 5: Trendanalyse van verschillen tussen B2-B3 ziekenhuizen in AMI-LC. Geen transfers. MKG 2002- 5.
Hoofdstuk 5: Kwaliteit van zorgen
287
5.3.3.5 Het nationale AMI-LC, trend en determinanten Voor de periode 2002-2005 noteerden we in België 7.099 fatale gevallen voor 46.287opnamen of een bruto AMI-LC van 15,34% (95% BI:15,01%; 15,67%). Van de modellen die gefit werden in de sensitiviteitsanalyse weerhielden we de modellen met als verklarende variabelen leeftijd, geslacht, Charlson, trend, en shock. We deden dit om de invloed van het type ziekenhuis niet te neutraliseren door angioplastie in het model op te nemen. Omwille van de uitgesproken associatie tussen shock en STEMI verkozen we shock te nemen als verklarende variabele en niet STEMI. Vooreerst is shock een betere predictor van letaliteit, verder is er minder eenduidigheid rond STEMI - de verschillen in EKG diagnose bij opname en ontslag zijn belangrijk712 - en tenslotte omdat de groep AMI NOS een supplementaire categorie opleverde, die eigenlijk als missing te beschouwen valt in termen van STEMI, en moeilijk te interpreteren valt. De AMI NOS als een derde categorie behandelen is overigens niet correct.121 Wanneer we de basis modellen en de modellen met shock fitten stellen we vast dat het sterfterisico (1) bij elke bijkomende leeftijdsgroep van 5 jaar met ongeveer 40% toeneemt; (2) bij mannen ongeveer 10% lager is; (3) bij elke toename van Charlson’s comorbidity index met één eenheid stijgt met 5 à 10 %; en, (4) bij shock in uiterst belangrijke mate toeneemt. Verder noteerden we een licht dalende AMI-LC trend van ongeveer 1% per semester. Verder vonden we een lager AMI-LC in de B2-B3 ziekenhuizen en dit zowel t.o.v. de A als B1 ziekenhuizen (Tabel 7). Noteren we dat er tussen de ziekenhuizen B2-B3 grote verschillen bestaan (Figuren 4 en 5)..
288
Hoofdstuk 5: Kwaliteit van zorgen
Tabel 7: Odds ratio’s en 95% betrouwbaarheidsinterval ( ) van AMI-letaliteit in functie van leeftijd (toename per 5 jaar), geslacht, co-morbiditeit, per semester trend, met al dan niet cardiogene shock, cardiaal zorgprogramma en met uitsluiting of niet van binnenkomende transfers. Basis 1
Basis 2
Shock 1
Shock 2
Leeftijd
1,37(1,35;1,40) 1,36(1,34;1,39)
1,36 (1,34;1,39)
1,35(1,32; 1,38)
Mannen
0,90(0,84;0,96) 0,92(0,86;0,99)
0,91 (0,84;0,98)
0,93(0,86; 1,01)
Charlson
1,09(1,08;1,10) 1,07(1,06;1,09)
1,06 (1,05;1,08)
1,05(1,04; 1,06)
Trend (semester)0,98(0,96;0,99) 0,98(0,97;1,00)
0,98 (0,96;0,99)
0,99(0,97; 1,00)
23,0 (20,9;25,2)
21,0(19,0; 23,2)
.
Shock
.
.
.
.
.
A vs B2-B3
1,21(1,12;1,30) 1.47(1,37;1,59)
1,39 (1,28;1,50)
1,61(1,48; 1,75)
B1 vs B2-B3
1,08(0,99;1,19) 1,38(1,25;1,52)
1,23 (1,11;1,36)
1,48(1,33; 1,65)
Basis 1: uitgaande transfers uitgesloten; Basis 2: alle transfers uitgesloten; Shock 1: uitgaande transfers uitgesloten; Shock 2: alle transfers uitgesloten
In termen van de c-statistiek zijn de modellen met shock duidelijk beter dan de basismodellen: 0.84 versus 0.74. Een overzicht van de waarden van de c-statistiek van alle gefitte modellen vindt u in tabel 8. Tabel 8: Waarden van de c-statistiek, bereikt bij de verschillende gefitte modellen en dit zowel voor de periode als de trend analyse. Model
Binnenkomende transfers Geen transfers Periode Trend Periode Trend 0,736 0,741 0,733 0,739 Basis 0,840 0,844 0,832 0,837 Shock 0,853 0,856 0,848 0,852 Shock en angioplastie 0,782 0,785 0,781 0,785 Stemi 0,791 0,794 0,793 0,797 Stemi en angioplastie
Hoofdstuk 5: Kwaliteit van zorgen
289
5.3.4 Discussie 5.3.4.1 AMI een diagnostisch probleem In het kader van kwaliteitsverbetering, die vertrekt van een interziekenhuis vergelijking, dient men over één enkele definitie te beschikken, die overal kan toegepast worden.559 Het in gebruik nemen van troponinen, beschouwd als de “definitive marker”747, en de verschillende assays voor hun bepaling hebben echter voor een substantiële verwarring gezorgd bij clinici en klinische biologen747. Deze troponinen waren gevoeliger en specifieker dan de oudere en detecteren ook minimale hartletsels.747;755 Verder konden in functie van de gebruikte definitie patiënten met één van de acute coronaire syndromen met elk zijn eigen mortaliteitsrisico al dan niet als AMI beschouwd worden.745;748Op het ogenblik van de registratie van onze gegevens (2001-5) diende het gebruik van de assays nog gestandaardiseerd te worden. Onder meer diende informatie over de graad van precisie van de assays, referentie intervallen en andere voor het laboratorium belangrijke gebruiksvoorwaarden nog geleverd te worden.747 Deze onduidelijkheden en verschillen zijn niet zonder invloed op de risicocorrectie bij het berekenen en het vergelijken van AMI-LCs, en zijn een hinderpaal voor het beoordelen van lange termijn trends in myocardinfarct voorvallen.746;747;755 5.3.4.2 Accuratesse en volledigheid van de gegevens De volledigheid en accuratesse van de gegevens is een belangrijke beperking in onze studie. De vergelijking met de MONICA gegevens toont immers duidelijk een onderschatting aan van het letaliteitcijfer, een in epidemiologisch opzicht belangrijke tekortkoming van de MKG. Het lager dodenaantal in de MKG kan wellicht voor een deel verklaard worden door het overlijden van een belangrijk deel van de patiënten vóór er een vaste klinische diagnose gesteld werd.721 De betere registratie van het aantal gevallen kan wellicht toe te schrijven zijn aan verschillen in voormelde diagnostische criteria en meer bepaald in het type en de interpretatie van het cardiale enzym.746;747 Kuch et al.721 vergeleken het AMI-LC zoals het bekomen werd wanneer AMI volgens epidemiologische criteria (MONICA criteria) gedefinieerd werd en wanneer het via een klinische diagnose gedefinieerd werd. In hun studie bedragen de cijfers respectievelijk 28% en 13,5 %, wat duidelijk verschilt van de analoge cijfers voor het MONICA-registratie gebied van Gent en Brugge waar ze respectievelijk 25,7% en
290
Hoofdstuk 5: Kwaliteit van zorgen
7,7% bedragen voor Gent en 15,7% en 4,7% voor Brugge. Merken we op dat AMILC voor gans België (klinische definitie) 15,5% bedraagt, duidelijk beter vergelijkbaar met de Duitse cijfers en met de Europese intramurale AMI letaliteitcijfers van de 80ger jaren697. Dit schijnt te wijzen op een onderregistratie van letale gevallen door de MKG in de arrondissementen Gent en Brugge. Een gelijkaardige vergelijking uitgevoerd in samenwerking met MONICA-Luxemburg kwam tot de bevinding dat de MKG een sensitiviteit van 87% en een specificiteit van 55% hadden.756 Bevolkingsstudies toonden overigens aan dat de 30-dagen STEMI mortaliteit tussen de 30 en 50% ligt waarvan ongeveer de helft in de eerste twee uur.757 Het adagium “Time is myocardium and time is outcomes” is hier de weerspiegeling van. De MKG biedt vooralsnog – in afwachting van de nieuwe spoedregistratie - geen enkele informatie over (1) de tijd die verloopt tussen het ontstaan van de symptomen en het inroepen van hulp, (2) de tijd die verloopt tussen inroepen van hulp en de aankomst met de ziekenwagen in het ziekenhuis, en (3) de tijd die verloopt tussen de aankomst in het ziekenhuis en het instellen van de thrombolyse of de angioplastie. De eerste is mogelijkerwijs beïnvloedbaar door gezondheidsopvoeding en voorlichting. De tweede is organisatorisch beïnvloedbaar door de spoeddiensten, maar wordt verder bepaald door de afstand en eventuele verkeersopstoppingen.
De derde kan
organisatorisch verbeterd worden. Alle aspecten zijn in mindere of meerdere mate kwaliteitsgebonden en alle verdienen aandacht.747 De onderregistratie van fatale gevallen was waarschijnlijk niet uniform over de ziekenhuizen zoals de vergelijking met MONICA aantoonde. Verder weten we niet welke criteria in de Belgische ziekenhuizen gehanteerd werden voor het stellen van een diagnose van AMI. Het is niet onwaarschijnlijk dat die zoals elders niet uniform waren, zeker als het over de keuze van het type, het uitvoeren en interpreteren van de cardiale enzymen gaat. Ook shock als verklarende variabele stelde een interpretatie probleem: was hij aanwezig bij opname, vóór het instellen van de behandeling of was hij het gevolg van de behandeling?
Hoofdstuk 5: Kwaliteit van zorgen
291
Verder stelt de AHRQ: “Er bestaat een spanningsveld wanneer gegevens gebruikt worden zowel voor terugbetaling als voor het meten van kwaliteit. Wanneer het over terugbetaling gaat is men geneigd om snel te coderen en om het coderen van verwikkelingen en comorbiditeit te maximaliseren. Daarentegen wanneer het over kwaliteitsbeoordeling gaat is het belangrijk voor de codeurs over het gehele medisch dossier te beschikken en het coderen van diagnoses te beperken tot aandoeningen die de zorg voor de patiënt beïnvloeden”.637 Toch bleek in een recente studie dat administratieve gegevens een redelijk surrogaat zijn voor klinische gegevens uit het medisch dossier.758Het dient wel opgemerkt dat in die studie belangrijke gegevens uit vorige opnamen en transfers van patiënten routinematig konden gebruikt of opgevolgd worden. In de MKG was dat ten tijde van de studie beperkt tot verblijven in hetzelfde ziekenhuis en hetzelfde kalenderjaar. 5.3.4.3 Nationale trend van het AMI-LC en interziekenhuis verschillen. Onze studie suggereerde dat het AMI-LC functie was van leeftijd, co-morbiditeit en vooral shock. De evidentie van een betere uitkomst voor mannen was zwak: ze bevond zich in de zone van niet interpretatie. Er was verder slechts een indicatie van een kleine verbetering van de uitkomsten over de tijd. Wel stelden we betere uitkomsten vast in B2-B3 ziekenhuizen. Toch vonden we geen aanwijzing – geen significante interactie tussen cardiaal zorgprogramma en trend - voor een verbetering van evolutie van de letaliteit in functie van het zorgprogramma, waar dit elders wél werd vastgesteld.759 Deze studie kan niet zomaar met die van Van Brabandt et al720 vergeleken worden. Hun studie gaat over de periode van 1999 tot 2001, de onze echter over de periode 2002 tot 2005 en er bestaat evidentie dat de behandeling van AMI over de jaren verbetert.759;760Verder beschikten zij over de gekoppelde gegevens, die hun toegang gaf tot alle therapeutische gegevens, en beschikten zij over een uniek identificatienummer dat hen toeliet nauwkeurig de eventuele transfers van patiënten op te volgen. Het is nochtans zo dat hun vaststellingen i.v.m. B2-B3 ziekenhuizen niet in tegenspraak zijn met de onze.
292
Hoofdstuk 5: Kwaliteit van zorgen
De nochtans vermoedelijk belangrijke interziekenhuizen verschillen, die we vaststelden, zijn moeilijk interpreteerbaar en, wegens de klaarblijkelijke, onvoldoende accuratesse en volledigheid van de gegevens, moeilijk becijferbaar. Dit leidt onvermijdelijk tot de vraag of dit “good enough, easy to get data?”554 zijn om in een context van kwaliteitsverbetering gebruikt te worden. Inderdaad, de volledigheid en accuratesse van de ziekenhuisontslaggegevens zijn in de arrondissementen van Brugge en Gent problematisch. Maar dit geldt misschien niet voor België in zijn geheel, zoals gesuggereerd wordt door het voormelde nationale letaliteitcijfer. Onze bevindingen gebaseerd op de MKG worden wellicht, ondanks onze inspanningen om de typische beperkingen van administratieve gegevens zoveel mogelijk te omzeilen, best omschreven als een “bruikbare screening”, die kan aanzetten tot het nemen van kwaliteitsbevorderende initiatieven in de ziekenhuizen, veeleer dan als uitspraken over kwaliteit van de zorgen.180;659 Vanuit een kwaliteitsstandpunt kon het nuttig zijn bijkomende informatie in te winnen over de ziekenhuizen die op constante manier een bovenmaatse of ondermaatse outliers schijnen te zijn. Verder menen we aanwijzingen gevonden te hebben dat B2-B3 centra electieve PTCAs uitvoerden bij laattijdig getransfereerde patiënten, waarvan de Europese richtlijnen stellen dat ze geen enkel functioneel of overlevingsvoordeel opleveren.697Wij baseerden ons hiervoor op de gegevens in verband met het ogenblik van de transfer waaruit bleek dat de mediaan van de verblijfsduur voor transfer 2 “dagen” bedroeg. De wisselende afwijking ten opzichte van het nationale cijfer en trend wanneer het uitvoeren van een angioplastie in de modellering wordt opgenomen dient verder bestudeerd te worden. Het schijnt hier meestal te gaan over B2-B3 ziekenhuizen, die meer angioplasties uitvoeren op een meer oordeelkundige manier dan de andere B2-B3s. Daar deze bevinding zichtbaar werd bij een verschillende modellering van dezelfde data kan men geredelijk aannemen dat ze geen artefact is. Tenslotte vraagt de schijnbare heterogeniteit van de B2-B3 ziekenhuizen op gebied van AMI-LC een verklaring. 5.3.4.4 Transfer Bij een vergelijking van AMI-LC was het belangrijk rekening te houden met transfer van zieken. Soms gaat men ervan uit - een beetje zoals het “intention to treat” principe bij
Hoofdstuk 5: Kwaliteit van zorgen
293
klinische studies - dat de uitkomst van de AMI episode toegeschreven wordt aan het ziekenhuis waar de patiënt opgenomen wordt.720;751;752;758In navolging van het AHRQ model753 werden bij een eerste reeks analyses, waarbij de uitgaande transfers werden uitgesloten, de uitkomsten toegeschreven aan het ontvangende ziekenhuis. Mochten de transfers op systematische manier met inachtneming van de heersende richtlijnen697 gebeuren viel wellicht de eerste zienswijze te verkiezen. In de toenmalige Belgische context, waarbij een ruim deel van de transfers niet als een onmiddellijke transfer voor PCI of een “rescue angioplasty” na een niet-geslaagde thrombolyse kon beschouwd worden, leek dit niet de meer aangewezen manier. Het is ook zo, menen we, dat deze niet-urgente transfers voor een electieve PTCA niet als een teken van kwaliteitsvol klinisch handelen kunnen gezien worden. 5.3.4.5 Risicocorrectie Een ideaal model dient een goede balans te maken tussen zuinigheid van het aantal verklarende variabelen en het gemakkelijk verzamelen van gegevens enerzijds, en zijn predictief vermogen anderzijds.”715 Onze modellen met leeftijd, geslacht, Charlson’s comorbidity index en shock als verklarende variabelen, en met binnenkomende transfers al dan niet opgenomen in de studiepopulatie hadden met een c-statistiek761;762 van ongeveer 0.84, een zeer goed discriminatievermogen. Deze modellen hadden duidelijk een beter discriminatie vermogen dan de modellen zonder shock en dan de voormelde, uitgevoerde studies715;751;752. Een recente Amerikaanse studie gebaseerd op administratieve gegevens had een AROC van 0,71 in een finaal model met 27 variabelen.758
Het lijkt dan
voorzichtig aan te nemen dat het discriminatievermogen van onze modellen met shock, wegens een niet gekende proportie van in het ziekenhuis opgelopen verwikkelingen, vertekend zijn. Hoe dan ook beide soorten modellen (basis, of basis met shock) leidden tot dezelfde conclusies betreffende de verklarende variabelen. Het letaliteitcijfer van AMI is gekenmerkt door een grote variabiliteit over de ziekenhuizen, die niet noodzakelijk een weerspiegeling is van werkelijke verschillen inzake performance. Correctie voor het risico is derhalve belangrijk en in het bijzonder voor de uiterste waarden, zoniet zouden bepaalde verzorgingsinstellingen incorrect als “outliers” geklasseerd kunnen worden298;753. Onze keuze van Charlson’s comorbidity index
294
Hoofdstuk 5: Kwaliteit van zorgen
was gebaseerd op de excellente c-statistiek (0,83) in een studie over mortaliteit door ischemische hartaandoeningen bij ziekenhuispatiënten.325;326 In tegenstelling met Severity of Illness and Risk of Mortality, de risicocorrectie van de All Patient Refined Diagnosis Related Groups (APR-DRGs)195houdt deze index geen rekening met verwikkelingen die na de
optreden196;197;758.
opname
Wel
is
co-morbiditeit,
zoals
voormeld,
637
codeergevoelig. Hierdoor vermijdt men gedeeltelijk dat een ziekenhuis ten onrechte “beloond” wordt voor verwikkelingen, die misschien te wijten waren aan slechtere zorg.196;301;751;758 5.3.4.6 Andere beperkingen van de studie Hoewel er meestal een goede correlatie bestaat tussen de intra-ziekenhuis mortaliteit en de dertig dagen mortaliteit
367
is het mogelijk dat verschillen in ontslagpraktijken
de cijfers beïnvloeden. In geval van AMI kan de mortaliteit op 30 dagen beduidend van
de
ziekenhuissterfte
verschillen753.
Hoewel
letaliteit
vergeleken
met
procesindicatoren een minder gevoelige performance/kwaliteit indicator van AMI is blijft
ze
waardevol
procesindicatoren,
voor
het
beoordelen
van
richtlijnen
en
178;706;763
want: “In tegenstelling tot structuur en proces, verschaffen
uitkomsten een meer globale beoordeling van de kwaliteit van de gezondheidszorg en vertegenwoordigen ze wat voor de patiënten het belangrijkst is”. 758 Zoals voornoemd berust de AMI behandeling op een snel hulp zoeken van de patiënt, een snelle en adequate opvang, diagnose en behandeling in functie van de diagnose en het type ziekenhuis. Er is daarbij een potentiële rol weggelegd voor gezondheidsvoorlichting om patiënten sneller medische hulp te laten zoeken in geval van symptomen van een (nakend) AMI.704
Benevens de toegediende behandeling (zelf functie van de leeftijd van de
patiënt)688 is de prognose functie van de verstopte slagader(s), het aantal getroffen bloedvaten, variabiliteit van het hartritme, en van de leeftijd van de patiënt. Niet alleen strikt medische factoren maar ook het sociaal-economische niveau spelen een belangrijke rol in de AMI-epidemiologie. Zo genereerde een zwakke sociaal-economische toestand in de jaren ’80 hoge mortaliteitscijfers voor coronaire aandoeningen met hoge letaliteitcijfers
voor
een
eerste
hartaanval
en
dat
zowel
voor
als
na
de
295
Hoofdstuk 5: Kwaliteit van zorgen
ziekenhuisopname764;765. De letaliteit verklaarde bij de mannen voor de helft en bij vrouwen voor meer dan een derde het verschil inzake mortaliteit tussen de groepen met hoge en lage inkomens8. Er moet verder op gewezen worden dat geneesmiddelen voor secundaire preventie, een belangrijk gegeven voor de verdere prognose en derhalve een kwaliteitsaspect559;758, minder vaak aan patiënten van de lagere sociaal-economische klassen764 voorgeschreven werden. Jammer genoeg beschikken we in de MKG maar fragmentarisch over al die gegevens en lijdt onze kwaliteitsbenadering onder hetzelfde euvel. Wij konden in deze studie alleen corrigeren shock.
voor
325;326;493
leeftijd,
geslacht,
co-morbiditeit
(Charlson-d’Hoore
index)
en
Andere kwaliteitsaspecten dan letaliteit konden wij niet analyseren. Het is
dus niet onmogelijk dat een ziekenhuis dat een goed AMI-LC heeft niet goed is voor andere aspecten en omgekeerd. Een laatste beperking van onze studie is het belangrijke tijdsinterval tussen de registratie en de rapportering. Hoewel er hier door de verdere automatisering van de gegevensverzameling en -verwerking winst zal geboekt worden, zal er wel altijd minstens een jaar verlopen vooraleer deze processen afgesloten zijn. Daarenboven zijn er een minimale analyse- en rapporteringtijd nodig. Toch lijkt dit tijdsinterval minder belangrijk voor uitkomstindicatoren, die een ruimere interpretatie vergen met terugkoppeling naar verschillende belanghebbenden en niet noodzakelijk een onmiddellijke terugkoppeling naar de zorgverleners vereisen, dan voor procesindicatoren, waar een onmiddellijke terugkoppeling door de clinici als een noodzaak aangevoeld wordt. 5.3.4.7 AMI-LC en kwaliteitsinitiatieven In onze benadering werden ziekenhuizen eerder gezien als individuele structuren van het gezondheidssysteem, met een gemeenschappelijk organisatorische cultuur en een aantal gemeenschappelijk processen, en die verantwoording dienden af te leggen. Niet het tot schande maken, noemen en blameren van individuen of ziekenhuizen maar het identificeren van organisatie− en cultuurgerelateerde problemen werden beschouwd als het aanknopingspunt voor kwaliteitsbevorderende acties.269;426;495-498;556;660 Daarom was deze
296
Hoofdstuk 5: Kwaliteit van zorgen
feedback anoniem en had als doel de clinici, diensten en ziekenhuizen informatie te verschaffen, die hen toeliet zich met de anderen op een zinvolle manier te vergelijken. Het betrokken zijn van senior managers en ziekenhuisstaf bij kwaliteitsverbetering kan succesvol zijn547, op voorwaarde dat het over een veranderingsproces gaat met meerdere facetten ( protocollen, richtlijnen die ook de niet-cardiologen bereiken, lokale kwaliteitsbevorderende groepen)557;766 in samenwerking met de personen waarvan het werk onderzocht wordt555. Formele of informele beoordeling van de zorg door peers en feedback kunnen de beoogde veranderingen vergemakkelijken.557 Hoewel er aangetoond werd dat feedback kwaliteitsinitiatieven kan stimuleren566, schijnt het verkieslijker dat hij zou gedragen worden door iemand, gevormd in de interpretatie van gegevens, die geldt als een autoriteit en over de nodige middelen beschikt.269;718 Daarom werd aan het College van geneesheren dezelfde feedback voorgelegd als aan de ziekenhuizen. Hij zou hen kunnen helpen ziekenhuizen te identificeren, met zowel bovenmaatse als ondermaatse kwaliteit, om een benchmark vast te leggen en om ziekenhuizen met kwaliteitsproblemen te helpen ze op te lossen. Ervaring uit de UK suggereert dat mensen meer geneigd zijn op een adequate manier te werken als ze weten dat er iemand is die observeert en registreert wat zij doen.559 Daarenboven kan de feedback en het betrokken zijn in verbeteringsprocessen hen wijzen op problemen die niet onmiddellijk door de indicator bestudeerd worden zoals het voorschrijven van adequate medicatie na een opname voor AMI. Verder menen we dat de Colleges en andere beroepsverenigingen kwaliteitsverbetering kunnen stimuleren door het opstellen en verspreiden van richtlijnen, het opstellen van doelstellingen (zoals tegen 1 januari 2008 zal 90% van de AMI patiënten bij ontslag een voorschrift hebben van geneesmiddelen voor secundaire preventie) en de artsen helpen bij het overstijgen van wat zij aanvoelen als een verlies van professionele autonomie.718 Voor de overheid is een rol weggelegd die erin bestaat een operationele structuur te creëren die ermee belast wordt de toekomstige nationale feedbacks te begeleiden, de ontwikkeling van hierop gebaseerde kwaliteitsbevorderende acties te ondersteunen - de
297
Hoofdstuk 5: Kwaliteit van zorgen
uitbouw van de secundaire preventie is een van de belangrijke uitdagingen - en bijkomende indicatoren te initiëren. Verder zullen lokale initiatieven, die aansluiten op de feedback, aangemoedigd worden. Een continue investering in een infrastructuur voor kwaliteitsbevordering en ook het voorzien in een beschermde tijd voor deze activiteiten zijn vereist om het project te laten slagen.557 Tenslotte menen we dat de overheid zich dient te buigen over het probleem van de koppeling van relevante gegevens over dezelfde personen in geval van transfer versus de bescherming van de privé-sfeer. Dergelijke koppeling is noodzakelijk voor de evaluatie van de zorg en dus ook voor de toekomstige behandeling van de nieuwe en de niet overleden AMI patiënten. 5.3.4.8 Besluit en perspectieven Hoewel de complexiteit van de case mix niet volledig door administratieve gegevens kan ondervangen worden716, dient men er zich rekenschap van te geven dat alleen dit soort gegevens toelaat landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix.758 Willen we de MKG in het domein van AMI gebruiken voor kwaliteitsbewaking dan is er dringend nood aan een harmonisatie van de registratie en een betere registratie bij opname. Ook het registreren bij de pathologieën en symptomen of ze al dan niet aanwezig waren bij opname lijkt een belangrijk aandachtspunt. Het opzetten van de nieuwe spoedregistratie en de nieuwe minimale ziekenhuisgegevens (MZG), waarin MKG en Minimaal Verpleegkundige Gegevens versmolten zijn, zal hier ongetwijfeld verbetering brengen. Het meenemen van gegevens uit vroegere opnamen en het traceren van transfers, wat in de MZG alleen binnen hetzelfde ziekenhuis zal mogelijk zijn,
zou niet alleen betere
vergelijkingen en evaluaties toelaten maar ook ten goede komen van de patiënten. Naast deze verbeteringen aan het registratiesysteem vallen er ook een aantal analyseaspecten bij te schaven, die tot een meer bruikbare indicator kunnen leiden. Wij denken hier onder meer aan (1) het uitsluiten van verblijven van ≤ 1 dag758, (2) weekend opnamen767, (3) een geografische analyse en (4) een analyse van de verblijfsduur753. Verder kan het gebruik van propensity scores484;716 en hiërarchische regressie modellen758 de analyses verrijken. Tenslotte vallen er een aantal structurele en operationele maatregelen te treffen in verband met het aantal centra waar PCI kan uitgevoerd worden. Volume-uitkomst beschouwingen
298
Hoofdstuk 5: Kwaliteit van zorgen
rond primaire PCI dienen echter ook rekening te houden met geografische en sociaaleconomische toegankelijkheid van de zorgen.716 Tenslotte bestaat er nood aan ”low tech” strategieën om te verzekeren dat de PPCI uitgevoerd wordt binnen de 90 minuten, een doelstelling die zou kunnen bereikt worden via continuous quality improvement.704
5.4 KWALITEIT VAN ZORGEN: ALGEMEEN BESLUIT
Wij hebben onze benadering voor verbeteringsinitiatieven van zorgenkwaliteit door middel van administratieve gegevens geschetst. Een goede organisatie en organisatorische cultuur zijn hiervoor de randvoorwaarden. Kwaliteit van zorgen is een dagdagelijkse, gedeelde verantwoordelijkheid tussen patiënt, zorgverleners, ziekenhuisdirecties, College van geneesheren en beroepsverenigingen. De verantwoordelijkheid van de overheid als borger van de belangen voor de gemeenschap bestaat erin kwaliteitsinitiatieven te ondersteunen en te laten ontkiemen. Bij de analyse van kwaliteitsindicatoren kwamen we tot het besluit dat uit de aard zelf van onze gegevens, we alleen van een screening konden gewagen. Zij bood wel perspectieven voor kwaliteitsinitiatieven maar vereiste verder onderzoek vooraleer uitspraken konden gedaan
worden.
Verder
gaf
deze
screening
bruikbare
informatie
voor
verbeteringsinitiatieven op het gebied van de kwaliteit van de gegevens. Vermits het om een screening gaat wordt de feedback gericht tot clinici, ziekenhuisdirecties, College van geneesheren, beroepsverenigingen en overheid. Om dezelfde reden is hij ook anoniem. De voornaamste resultaten van de analyse van het keizersnedencijfer bij laagrisico verlossingen kunnen als volgt samengevat worden. Er bestaan in België belangrijke interziekenhuis verschillen in keizersnedencijfer, een nationale opwaartse trend van 2% per semester, en een intens medisch ingrijpen rond het geboortegebeuren. Als men verlangt het keizersnedencijfer om te buigen zal dit een georganiseerde aanpak vereisen en dit zowel op het centraal als intermediair en lokaal niveau.
Hoofdstuk 5: Kwaliteit van zorgen
299
Voor de analyse van het letaliteitcijfer bij AMI wijzen de voornaamste resultaten eerder naar de beperkingen van de gegevens. De nood aan een eenvormige definitie, de volledigheid van de gegevens, de traceerbaarheid van patiënten en een goede risicocorrectie zijn daarbij de voornaamste aandachtspunten. Het is daarbij belangrijk dat men zich, vanuit het standpunt van de bescherming van de privé-sfeer, realiseert dat traceerbaarheid noodzakelijk is voor de evaluatie van de behandeling en bijgevolg voor het welzijn van de patiënten in de toekomst. Op gebied van kwaliteit van de zorgen kunnen reeds een aantal behartigenswaardige bevindingen verder uitgediept worden. De belangrijke interziekenhuis verschillen zijn wellicht moeilijk interpreteerbaar maar lijken toch belangrijk genoeg om verder onderzocht te worden. Ook de transfer van AMI-patiënten voor een electieve PCI verdient de aandacht.
301 Hoofdstuk 6: Complementariteit van gegevensbanken. Gebruik van routinematig verzamelde gegevens om de reproductieve gezondheid te beoordelen in een gemeenschap gevestigd rond twee verbrandingsovens Deze casus geeft weer hoe door het samenbrengen van gegevens uit verscheidene bestaande administratieve en klinische gegevensbanken in een beperkte tijdsspanne de beleidsvoering in verband met een dringend milieuprobleem in niet onbelangrijke mate kan onderbouwd worden. Het veldonderzoek waarop hij gebaseerd is werd uitgevoerd in 1997. De voorliggende tekst is een vertaling van het hierover gepubliceerde manuscript: “Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely Collected Data for the Assessment of the Reproductive Health of a Community Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch Public Health 2005; 63:259-278.” 768 Abstract Background. Na herhaalde klachten over congenitale afwijkingen in de buurt van twee verbrandingsovens, gesloten wegens het overschrijden van de emissienormen, besloot de overheid de herneming van de activiteiten slechts toe te laten indien aan die normen voldaan werd en indien de resultaten van een uit te voeren studie over de mogelijke schadelijke gevolgen op de perinatale gezondheid van de buurt dit toelieten. Aangezien de lokale bevolking weigerachtig stond t.a.v. een deelname aan dergelijke studie, konden we alleen op routinegegevens beroep doen. Methoden. Het betrof een observationele studie over de Neerland wijk in de Antwerpse agglomeratie, met een ecologische en een retrospectieve cohort component, waarbij gegevens uit verschillende medische en administratieve gegevensbanken gekoppeld werden. In een gegevensbank van alle kinderen (N= 506.632), die in Vlaanderen geboren waren tijdens de periode 1989-1996,
werd een groep van 636 kinderen, waarvan de
moeder ooit in Neerland woonachtig was, geïdentificeerd en vergeleken met de doorsnee Vlaamse bevolking. Resultaten. De vergelijking met de doorsnee bevolking, afgezien van een meerlingenexces, toonde geen significant teveel aan van congenitale afwijkingen (gecorrigeerde odds ratio (OR)
1,20;
95%
Betrouwbaarheidsinterval
(BI)
0,69-2,08),
302
Hoofdstuk 6: Complementariteit van gegevensbanken
perinatale mortaliteit, laag geboortegewicht, korte zwangerschapsduur, verminderde pariteit of omkering van de geslachtsratio. Binnen de groep van Neerland kinderen werd wel een significant en negatief verband vastgesteld tussen blootstellingduur van de moeder en het voorkomen van congenitale afwijkingen (OR 0,78; 95% BI 0,60-0,95). Conclusies. Hoewel de studie duidelijk een aantal beperkingen vertoonde en hoewel een overmaat van congenitale afwijkingen noch bevestigd noch uitgesloten kon worden, leken de vaststellingen geen ernstige gezondheidsbedreigingen te suggereren.
6.1. INLEIDING De publieke bezorgdheid over de gezondheidsrisico’s die verband houden met milieuverontreiniging is groot, zeker als de bron van de verontreiniging zich in de onmiddellijke buurt bevindt.769-776 In de jaren die aan deze studie voorafgingen, hebben de inwoners van Neerland, een wijk van Wilrijk in de agglomeratie van Antwerpen, herhaaldelijk het voorkomen van gevallen van congenitale afwijkingen zonder gevolg aan de overheid gemeld. Ze schreven deze afwijkingen toe aan de dioxine uitwasemingen van twee huisvuilverbrandingsovens in de buurt, die op minder dan twee kilometer van elkaar stonden. Wegens het niet naleven van de geldende dioxine-uitstootnormen was op het ogenblik van de studie de eerste van de verbrandingsovens (gelegen in het zuidoosten van Neerland) definitief en de tweede voorlopig gesloten777. Gebaseerd op de hoeveelheden verbrand afval en het filtratietype van de uitstootgassen, werd de mass-flow van beide verbrandingsovens berekend vanaf hun opstarting. Hierop gebaseerd werd de neerslag (depositie) van de dioxines in de omgeving berekend en vergeleken met de dioxineconcentraties in bodemstalen, genomen in de buurt van de ovens. Hieruit bleek niet alleen dat de berekende bodemvervuiling kleiner was dan de gemeten, maar ook dat het depositiepatroon in functie van de twee methodes tamelijk verschillend was, wat op de aanwezigheid van andere belangrijke bronnen van dioxineblootstelling wees. Het gebied van maximale blootstelling aan de uitstoot van de tijdelijk gesloten oven stemt overeen met de Neerlandwijk, die zich tussen 1 en 2 kilometer ten noordoosten van de oven bevindt, de richting van de overheersende winden.
Hoofdstuk 6: Complementariteit van gegevensbanken.
303
Alarmerende rapporten over aangeboren afwijkingen, toenemende druk van de plaatselijke bevolking en de media lokten bij de politieke overheden de beslissing uit om de herneming van de activiteiten afhankelijk te maken van het naleven van de normen èn van een onderzoek betreffende de reproductieve gezondheid van de buurtbewoners. De studie diende rekening te houden met een hele waaier van mogelijke, voor de gezondheid schadelijke effecten, die in verband stonden met de verontreinigende stoffen, en hun vermoedelijke bron. Dioxines en aanverwante stoffen werden in verband gebracht met congenitale afwijkingen, immunologische stoornissen, omgekeerde geslachtsratio, kanker, vertraagde groei, endocriene en neurale gedragstoornissen.778-794 Vroegere studies wezen uit dat gezondheidsrisico’s te wijten aan de uitstoot van verbrandingsovens èn zeer klein èn onbetekenend waren t.o.v. ander achtergrondbronnen, op voorwaarde dat de ovens volgens de regels van de kunst gebouwd en uitgebaat werden.779;795;796 Eventuele gezondheidseffecten kunnen de vorm aannemen van meerlingzwangerschap797;798, fertiliteitsstoornissen799 en misschien kanker tijdens de kinderjaren800;801. Ten gevolge van een politieke beslissing diende de studie uitgevoerd te worden in een tijdsspanne van slechts drie maand. Omdat de plaatselijke bevolking weigerachtig stond tegenover een deelname aan dergelijke studie, was het onmogelijk een klassieke epidemiologische studie uit te voeren zoals een patiënt-controle onderzoek. 802;803 Daar we ons uitsluitend dienden te verlaten op routinematig verzamelde gegevens uit verscheidene medische en administratieve gegevensbanken met een wisselende graad van bruikbaarheid 202;631;804;805
, dienden we relevante stukken informatie te identificeren en tot voldoend
overtuigende evidentie samen te bundelen om een onderbouwd antwoord op de gestelde vraag te kunnen geven. De voornaamste onderzoeksvraag bestond erin of er voldoende volksgezondheidskundige redenen waren om de activiteiten van de tijdelijk gesloten verbrandingsoven te hernemen. Wetenschappelijke argumenten kunnen afgeleid worden (1) uit de wetenschappelijke literatuur, (2) een studie gebaseerd op bestaande informatiebronnen, en (3) een helemaal
304
Hoofdstuk 6: Complementariteit van gegevensbanken
opnieuw uitgetekende studie. Wij verkozen een combinatie van (1) en (2), omdat (3) een, in deze omstandigheden, onaanvaardbaar lange tijdsduur voor de studie zou vergen. De juiste definitie van de onderzoeksvragen en van de studieopzet worden in de volgende sectie beschreven. 6.2 METHODEN
6.2.1 Eindpunten van de studie Omdat voor de gezondheid schadelijke effecten van verbrandingsovens het probleem van congenitale afwijkingen overstijgen, hebben we ook meerdere andere eindpunten van reproductieve gezondheid in de studie opgenomen: spontane en medisch geïnduceerde abortussen, perinatale mortaliteit, laag geboortegewicht, korte zwangerschapsduur, minder gunstige leeftijd van de moeder, verminderde pariteit, omgekeerde geslachtsratio, een overmaat van meerlingzwangerschappen of van medisch begeleide totstandkomingen van de zwangerschap. 6.2.2 Gegevensverzameling Wij maakten gebruik van medische en openbare gegevensbanken, ons ter beschikking gesteld door officiële en private instanties. Van het gemeentelijk register van Antwerpen ontvingen we twee bestanden met gegevens van de periode van 1989 tot 1997. (1) Een bestand van alle kinderen geboren in de Antwerpse agglomeratie en waarvan de moeder op enig ogenblik in Neerland verbleven had. Deze gegevens bestonden uit volgende variabelen: geslacht, geboortedatum, de geboortedatum van de moeder en haar nummer van het rijksregister. (2) Een bestand met alle vrouwen die op enig ogenblik in Neerland verbleven met hun geboortedatum, nummer van het Rijksregister, de datum waarop ze in een bepaalde woning gingen wonen met het precies adres, en de datum van vertrek, wanneer dit van toepassing was. Het Rijksregister verstrekte de lijst van hun nakomelingen, wat de identificatie mogelijk maakte van kinderen geboren buiten Antwerpen. Het Studiecentrum voor Perinatale epidemiologie (SPE) stelde een bestand ter beschikking van 506.632 geboorten voor de periode van 1989 tot 1996. Sinds 1989 registreerde dit centrum meer dan 90% van alle levend geborenen in Vlaanderen, en daarnaast, de
305
Hoofdstuk 6: Complementariteit van gegevensbanken.
doodgeboren kinderen (van minstens 500g) en de gevallen van neonatale sterfte. De gegevens bevatten onder meer de geboortedatum van moeder en kind, de zwangerschapsduur, geboortegewicht, geslacht anoniem ziekenhuisnummer, verblijfplaats van de moeder, en voorkomen en type van congenitale afwijking. Vanaf 1991 werden ook de pariteit en de manier van de totstandkoming van de zwangerschap geregistreerd. Geboortedatum van moeder en kind, verblijfplaats van de moeder en volgorde bij de geboorte
in
geval
van
meerlingzwangerschap
werden
gebruikt
als
uniek
“identificatienummer” om de SPE gegevens te koppelen met de Neerlandbestanden. Het gekoppelde gegevensbestand maakte het mogelijk een groep van 636 kinderen te identificeren waarvan de moeder ooit in Neerland woonachtig was. De volkstelling van 1991 en de statistieken van het fiscaal inkomen verschaften een ruwe schatting van de sociaal-economische status (SES) van de wijk, die hoger was dan die van Vlaanderen in zijn geheel. Tenslotte, om in onze analyse rekening te kunnen houden met de SES van de individuele moeders van de wijk, koppelden we de subset van 636 kinderen met de officiële geboortebestanden van 1989 tot 1996, wat toeliet hun gegevens aan te vullen met de beroepsgroep van beide ouders, die we gebruikten als een proxy voor SES. 6.2.3 Opzet Daar we ons moesten verlaten op geregistreerde gegevens, zonder details over individuele blootstelling, dienden we een “post-hoc small-area” studie op te zetten. Verder waren we verplicht ons, uit de aard van de beschikbare gegevens, te beperken tot de periode van 1 januari 1989 tot 31 december 1996. Vermits we over het volledige adres en de juiste duur van iedere verblijfsperiode beschikten, was het nochtans mogelijk een retrospectieve cohort studie uit te voeren over de reproductieve gezondheid, door de verblijfsduur te nemen als een proxy voor blootstelling. Wij gebruikten hiervoor drie niveaus van vergelijkingen. Op een eerste niveau werd de relatieve frequentie van zwangerschapsgerelateerde problemen in Neerland vergeleken met Vlaanderen min Neerland, dat we verder in tekst en tabellen als Vlaanderen zullen benoemen. In deze vergelijking waren de eindpunten
306
Hoofdstuk 6: Complementariteit van gegevensbanken
meestal eenduidig. Congenitale afwijkingen echter worden noch op uniforme manier vastgesteld, noch geregistreerd, wat de vergelijkingsmogelijkheden beperkte tot de frequentie van het voorkomen van congenitale afwijkingen in beide groepen, zonder verdere specificatie. Omdat er bij de vergelijking met Vlaanderen een behoorlijk aantal obstetrici betrokken waren, wat tot een wisselende graad van overeenstemming tussen de verschillende beoordelaars kon leiden, vergeleken we op een tweede niveau het voorkomen van congenitale afwijkingen bij borelingen van moeders, die ooit woonachtig waren in Neerland, met borelingen van moeders, die in dezelfde verloskundige eenheden bevielen en nooit in Neerland gewoond hadden. Op een derde niveau bestudeerden we binnen de groep van Neerland moeders het verband tussen het voorkomen van congenitale afwijkingen en volgende verklarende variabelen: leeftijd van de moeder (opgesplitst in minder dan 35 jaar of niet); beroepsgroep van de ouders; meerlingzwangerschap; geslacht; totale verblijfsduur en verblijfsduur tijdens de tien aan de geboorte voorafgaande jaren; kalenderjaar en, wanneer van toepassing, tijdsspanne tussen vertrekdatum en geboorte. We gebruikten verblijfsduur als een proxy voor blootstelling. Een positief dosis-antwoord verband zou wijzen op een etiologische bijdrage van de ovens in het voorkomen van congenitale afwijkingen.9;806-808Hierbij dient men er rekening mee te houden dat deze blootstellingvariabele een surrogaat is voor de werkelijke blootstelling, die men bij de analyses wenst te gebruiken maar waarover men niet beschikt. Dit impliceert bijgevolg een grote voorzichtigheid bij de interpretatie van de vatstellingen. Voor vrouwen die in Neerland kwamen wonen werd de datum van inschrijving in het gemeenteregister genomen als beginpunt van de verblijfsduur. Voor vrouwen met meerdere episodes van immigratie en emigratie berekenden we een globale verblijfsduur. Vermits Neerland een gebied is waarin vaak verhuisd wordt, bleek het onmogelijk een juiste afstand te bepalen tussen de woonplaats en de ovens.
307
Hoofdstuk 6: Complementariteit van gegevensbanken.
6.2.4 Statistische aspecten. Leeftijd van de moeder, geboortegewicht en zwangerschapsduur, die gekarakteriseerd zijn door een niet-lineaire associatie met de bestudeerde perinatale eindpunten, werden gecategoriseerd.809 Voor nominale multinomiale variabelen gebruikten we voor het toetsen van verschillen tussen proporties de “likelihood ratio” toets en, waar nodig de Fisher’s exact toets. In geval van interval variabelen gebruikten we de Cochran-Armitage trend test.156 Voor
binomiale
variabelen 460
betrouwbaarheidsintervallen.
berekenden
we
odds
ratio’s
en
hun
95%
We rapporteren ze als volgt: OR (OG,BG), waar OG staat
voor ondergrens en BG voor bovengrens. Voor de multivariabele analyses gebruikten we de dichotome logistische regressie in geval van binomiale variabelen en de generalised logit modelling (baseline category)156in geval van een multinomiale antwoordvariabele. De modellen werden a priori geformuleerd, gebaseerd op wetenschappelijk inzicht. Daar onze aandacht vooral uitging naar de mogelijke invloed van verblijfplaats op de bestudeerde perinatale eindpunten, bleef de modellering beperkt tot het bereiken van een goede fit en tot de vaststelling of verblijfplaats al dan niet significant was. In dat geval zullen odds ratio’s en hun betrouwbaarheidsintervallen gepresenteerd worden. 6.3 RESULTATEN
6.3.1 Vergelijking tussen Neerland en Vlaanderen Hoewel gecorrigeerde odds ratio’s belangrijker zijn dan de niet-gecorrigeerde, geloven we dat het aanbeveling verdient beide te rapporteren voor een studie die, althans gedeeltelijk, uitgevoerd werd wegens de bezorgdheid van een gemeenschap. Puntschatters en 95% betrouwbaarheidsintervallen, die de grootte van de evidentie aantonen, worden in Tabel 1 weergegeven. De odds ratio’s van perinatale sterfte (p=0,089) en van congenitale afwijkingen (p=0,414) zijn niet significant. Mocht men al iets willen zeggen i.v.m. perinatale mortaliteit, zou het zijn dat ze lager zou kunnen zijn in de Neerland groep.
308
Hoofdstuk 6: Complementariteit van gegevensbanken
Tabel 1: Verdeling van de binaire eindpunten van de reproductieve gezondheid volgens de verblijfplaats van de moeder. Vlaanderen, 1989-1996. Neerland
Vlaanderen
Odds Ratio ( 95% BI) Neerland versus Vlaanderen
1/636
4.344/505.996
0,18 (0,03;1,29)
Congenitale afwijking
13/636
8.259/505.996
1,26 (0,73;2,18)
Meerlingen
55/636
17.601/505.996
2,62 (1,99;3,47)
340/636
259.629/505.996
1,09 (0,93;1,27)
Perinatale sterfte
Jongens
Onze analyse i.v.m. congenitale afwijkingen had slechts een power van 0.20.453;810We zouden immers 122 gevallen nodig gehad hebben uit 5847 geboorten om significantie te bereiken met een power van 0,80. Wel vonden we een belangrijk en significant teveel van meerlingen in Neerland (Tabel 1). Daarentegen schenen leeftijd van de moeder, zwangerschapsduur, geboortegewicht, proportie jongens bij de geboorte (een equivalent voor geslachtsratio), de pariteit van moeders bij eenlingzwangerschappen en de leeftijdsopbouw van de moeders een gelijkaardige verdeling te vertonen (Tabellen 1 en 2). De puntschatters 95% betrouwbaarheidsintervallen en de probabiliteiten van de multivariabele analyse werden weergegeven in tabellen 3 en 4. Zij weerspiegelen in essentie dezelfde informatie als de univariate analyse over perinatale sterfte, geslachtsratio, congenitale afwijkingen of meerlingen. Medisch begeleide totstandkomingen van de zwangerschap bij eenlingen waren vergelijkbaar in beide groepen (Tabel 3). Daarentegen waren er significant meer medisch begeleide totstandkomingen van de zwangerschap bij moeders van meerlingen in Neerland (Tabel 3). Zwangerschapsduur, geboortegewicht en pariteit bij eenlingen waren echter zeer vergelijkbaar verdeeld (Tabel 4)
309
Hoofdstuk 6: Complementariteit van gegevensbanken.
Tabel 2: Verdeling van multi-categorie eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder, Vlaanderen, 1989-1996. NEERLAND VLAANDEREN Leeftijd van de moeder (in verstreken jaren)
N
%
< 20 jaar
9
1,42
10.605
2,10
580
91,19
461.432
91,19
47
7,39
33.959
6,71
636
100,00
505.996
100,00
3
0,52
3.506
0,72
19
3,27
19.527
4,00
>= 2500 g
559
96,21
465.362
95,28
Totaal
581
100,00
488.395
100,00
3
0,52
3.582
0,73
28
4,82
20.707
4,24
>= 37 weken
550
94,66
464.106
95,03
Totaal
581
100,00
488.395
100,00
1
226
45,29
179.989
45,84
2
173
34,67
136.272
34,71
3
72
14,43
51.078
13,01
4
17
3,41
15.639
3,98
5+
11
2,20
9.658
2,46
499
100,00
392.636
100,00
20 - 34 jaar > 34 jaar Totaal
N
%
Likelihood ratio chi-square: p=0.366
Geboortegewicht (eenlingen) < 1500 g 1500 – 2499 g
Likelihood ratio chi-square: p=0.539
Zwangerschapsduur (eenlingen) < 32 weken 32 – 36 weken
Likelihood ratio chi-square: p=0.649
Pariteit (Eenlingen)
Totaal
Likelihood ratio chi-square: p=0,926 ; Cochran-Armitage trend test (two-tailed): p=0,995
310
Hoofdstuk 6: Complementariteit van gegevensbanken
Tabel 3: Eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder. Resultaten van de logistische regressie, Vlaanderen, 1989-1996. Eindpunt
Gecorrigeerd
Goodness-of-fit
voor
(Deviance)
Verblijfplaats
Odds Ratio (95% CI) Neerland versus Vlaanderen
Vg
Chi²
Prob.
Vg
Chi²
Prob.
Perinatale sterfte
M, G, A, C, B
58
58,52
0,456
1
3,173
0,0750
0,16 (0,01; 1,77)
Geslacht
M, A, C
14
13,07
0,521
1
1,167
0,2800
1,09 (0,91; 1,31)
Meerlingen
A, G
5
5,511
0,357
1
26,04
0,0001
2,25 (1,65; 3,07)
Congenitale afwijking
M, G, A, D
16
9,471
0,893
1
0,430
0,5120
1,20 (0,69, 2,08)
Medisch Begeleide
A
Zwangerschap
2
1,536
0,463
1
2,490
0,1150
2,04 (0,71; 5,82)
- Eenlingen
1
0,031
0,860
1
8,045
0,0046
2,50 (1,16; 5,38)
Totstandkoming van de
- Meerlingen Gecorrigeerd voor: M: meerlingen, G: geslacht, A: leeftijd van de moeder, C: congenitale afwijking, D: zwangerschapsduur, B: geboorte gewicht; Vg: vrijheidsgraden.
311
Hoofdstuk 6: Complementariteit van gegevensbanken
Tabel 4: Eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder. Resultaten van het modelleren van baselinecategory logits, Neerland versus Vlaanderen, 1989-1996. Eindpunt
Gecorrigeerd voor
Goodness-of-fit
Verblijfplaats
Conclusie
(Likelihood ratio) Vg
Chi²
Prob.
Vg
Chi²
Prob.
Zwangerschapsduur
M, G, A, C
26
32,78
0,169
2
1,86
0,395
NS
Geboorte gewicht
M, G, A, C
26
27,35
0,391
2
1,88
0,390
NS
Parity
A
8
3,34
0,911
4
1,40
0,845
NS
Gecorrigeerd voor: M: meerlingen, G: gender, A: leeftijd van de moeder, C: congenitale afwijking, D: zwangerschapsduur, B: geboorte gewicht; Vg: vrijheidsgraden.
312
Hoofdstuk 6: Complementariteit van gegevensbanken.
6.3.2 Voorkomen van congenitale afwijkingen bij moeders ooit woonachtig versus nooit woonachtig in Neerland, die in dezelfde obstetrische eenheden bevielen 578 van de 636 baby’s van de ooit in Neerland woonachtige moeders werden in 12 obstetrische eenheden geboren en worden vergeleken met 83.474 andere baby’s, die daar geboren werden. 12 gevallen van congenitale afwijkingen werden vastgesteld bij de Neerland kinderen versus 1297 bij de andere kinderen, wat overeenkomt met een nietsignificante odds ratio van 1,34 (0,72-2,44) en praktisch dezelfde als we observeerden bij de vergelijking met Vlaanderen min Neerland. Een multivariabele analyse, met correctie voor leeftijd van de moeder, geslacht en meerlingzwangerschap resulteerde ook in een niet-significante odds ratio van 1,29 (0,732,23). 6.3.3 Frequentie van congenitale afwijkingen en van meerlingzwangeschappen bij de moeders ooit woonachtig in Neerland. We bestudeerden het dosis-antwoord verband tussen een congenitale afwijking en de verklarende variabelen,namelijk leeftijd van de moeder (gedichotomiseerd in al dan niet minder dan 35 jaar); beroepsgroep van de ouders; meerlingzwangerschap; geslacht, totale verblijfsduur en verblijfsduur gedurende de tien jaar voorafgaand aan de geboorte; kalenderjaar en tijdsspanne tussen vertrekdatum en geboorte. Om mogelijke vertekeningen te vermijden bij de keuze van de modellen, gebruikten we hier de automatische selectie opties ter beschikking gesteld door de LOGISTIC Procedure van SAS.811Telkens verkregen we een model bestaande uit één enkele verklarende variabele, namelijk de prenatale verblijfsduur van de moeder met een odds ratio van 0,78 (0,60- 0,95). Noteren we dat alle gevallen van congenitale afwijking zich voordeden bij moeders met een verblijfsduur van 6 jaar of minder, ongeveer 2/3de van de totale cohort (Figuur 1). Daarentegen was het voorkomen van meerlingzwangerschap niet significant gerelateerd met de verblijfsduur.
Hoofdstuk 6: Complementariteit van gegevensbanken.
313
Figuur 1: Aantal kinderen met of zonder een congenitale afwijking volgens verblijfsduur (in jaren) van de moeder in Neerland vóór de geboorte Congenitale afwijkingen N
90 80 70 60 50 Afwezig
40
Aanwezig
30 20 10 0 0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16
Verblijfsduur in jaren
6.4 BESPREKING 6.4.1 Opzet van de studie Het luik over congenitale afwijkingen in onze studie was duidelijk van het “post hoc” type. In dergelijke gevallen kan het gebied waarover men zich zorgen maakt de administratieve grenzen overschrijden en een verdunning van de reële effecten veroorzaken wegens de grootte van deze eenheden, die vaak aanzienlijk groter zijn dan het blootgestelde gebied. Een “natuurlijke” reactie hierop is het vernauwen van de grenzen door het kunstmatig afbakenen van het blootgestelde gebied met een maximale concentratie van gevallen, zoals in Neerland gebeurde.772 We hadden dus te kampen met problemen van occult meervoudig toetsen en grensvernauwing, wat leidde tot een overschatting van de prevalentie van ongenitale afwijkingen.
769;772;812;813
Zelfs al was de SES in Neerland hoger, kan, in deze
context, de niet-gecorrigeerde odds ratio van 1,20 (0,69- 2,08) als een geringe evidentie voor een overmaat van congenitale afwijkingen beschouwd worden.
314
Hoofdstuk 6: Complementariteit van gegevensbanken
Vermits er regionale verschillen in het beoordelen van casussen kunnen bestaan vergeleken we het voorkomen van congenitale afwijkingen bij moeders die ooit in Neerland woonden met moeders die er nooit gewoond hadden en die in dezelfde obstetrische eenheden bevielen. Die vergelijking leverde praktisch dezelfde resultaten op als de vergelijking met Vlaanderen. 6.4.2 Statistische aspecten Zoal reeds vermeld zijn statistische toetsen vertekend in een “post hoc” situatie. Toch moesten we, in een context van een wantrouwige gemeenschap802 en een delicate, te onderbouwen politieke beslissing, de omvang van mogelijke gezondheidsbedreigingen inschatten. De statistische methodes, die we gebruikten, zijn klassieke methodes, waarbij problemen met de onderliggende geografische spreiding van de bestudeerde eindpunten uit de weg gegaan worden. Vermits de geografische precisie van onze gegevens veel groter was in de index populatie dan in Vlaanderen, onze referentie populatie, waren spatiale methodes niet bruikbaar.772 Wegens de intense verhuisbewegingen in Neerland konden ze ook niet gebruikt worden voor de analyse van de in Neerland woonachtige moeders. Noteren we tenslotte dat 338 van de 636 kinderen in onze studie, waaronder 6 van de 13 gevallen van congenitale afwijkingen, niet in Neerland geboren werden en niet in aanmerking zouden genomen zijn door methodes van geografische analyse. De gevolgde methodologie bood hier enige bescherming tegen migratiebias.631 6.4.3 Waarde van routinematig verzamelde gegevens Geregistreerde gegevens laten een objectieve classificatie toe, voorafgaandelijk aan enige kennis van een eindpunt, wat een ingebouwde bescherming biedt tegen informatie bias. De kleine tijdsspanne tussen het voorkomen van een gezondheidsfenomeen en zijn registratie vermindert ook het gevaar voor misclassificatie en voor een verlies aan statistische power met een vertekening van de resultaten in de richting van geen associatie.814 In tegenstelling met de andere eindpunten van de studie, die eenduidig zijn, vormen congenitale afwijkingen een complex probleem.805 Specifieke nadelen behelzen onder meer laattijdige detectie, prenatale diagnose en codering.803;815 Verder zijn congenitale afwijkingen eerder prevalenties dan incidenties, en kunnen in competitie treden met andere eindpunten van reproductieve epidemiologie.816 Daarenboven registreert het SPE slechts
Hoofdstuk 6: Complementariteit van gegevensbanken.
315
foetussen met een geboortegewicht van tenminste 500g en sluit op die manier vroege miskramen en medisch geïnduceerde abortussen uit.610 Het nationale abortusregister, dat alleen de provincie van de woonplaats registreert, was hierbij van weinig nut. Merken we nochtans op dat al deze nadelen van toepassing zijn zowel op de index als de referentie bevolking en dat het precies de vergelijking is tussen deze twee groepen, die het belangrijkste aandachtspunt vormt, en niet het cijfer van congenitale afwijkingen. Men mag aannemen dat de volledigheid van de SPE-gegevens groot is. In de deelnemende Vlaamse moederhuizen worden immers alle perinatale sterfgevallen en levend geboren kinderen geregistreerd, op een deel van de thuisbevallingen na, die slechts ongeveer 1% van de verlossingen uitmaken. De gegevens worden op continue wijze verzameld en worden onderworpen aan een georganiseerd systeem van kwaliteitsbewaking.610 Om onze cohort studie te corrigeren voor SES werd het SPE-bestand gekoppeld aan de officiële geboortebestanden met een geslaagde koppeling in 96% der gevallen. Noteren we dat we in ons eindbestand alle gevallen terugvonden, die gemeld waren door de Neerland bewoners en zich tijdens de studieperiode voordeden. De gegevens van het Antwerpse gemeenteregister en van het Rijksregister kunnen we als praktisch volledig en kwaliteitsvol beschouwen, vermits zij vaak gebruikt worden voor administratieve doeleinden. 6.4.4 Eindpunten van de studie Op de meerlingen na bleek geen enkel ander eindpunt statistisch significant te verschillen in index en referentie populatie. Betreffende congenitale afwijkingen liet een power analyse toe de grijze zone van niet-significante odds ratio’s te beperken tot odds ratio’s van minder dan twee. Een mogelijk “oogst” effect, waarbij bij lage dosissen randgevallen worden geëlimineerd, kan geresulteerd hebben in minder gevallen en een hogere sterfte.817 De cijfers van perinatale mortaliteit en congenitale afwijkingen in de index versus de referentie populatie, de afwezigheid van een exces mortaliteit en van een omgekeerde geslachtsratio onderbouwen deze hypothese niet.791 Het schijnbaar beschermende effect, aangegeven door een omgekeerde dosis-antwoord relatie, kan te wijten zijn aan het gebruiken van de verblijfsduur als een niet adequaat surrogaat voor een kwantitatieve blootstellingsmaat818 of aan de competitie met andere
316
Hoofdstuk 6: Complementariteit van gegevensbanken 803
reproductieve eindpunten zoals zeer vroegtijdige zwangerschapsonderbreking.
Geen
van deze twee hypotheses kunnen we uitsluiten. Ook de andere eindpunten, behalve meerlingzwangerschap, en de bodemstudie, die de aanwezigheid van andere, belangrijke bronnen van dioxine blootstelling aanduidt, schijnen een significante etiologische bijdrage van de verbrandingsovens uit te sluiten. De wetenschappelijke discussie over het verband tussen het voorkomen van meerlingzwangerschap en milieuverontreiniging is nog steeds lopend. Mocht ze bestaan, dan zou ze eerder klein en niet eenduidig zijn.798Het lijkt vermeldenswaard dat er zich, in een straal van minder dan vijf kilometer rond Neerland, drie centra bevinden waar medisch begeleide totstandkoming van de zwangerschap toegepast wordt. Hun aanwezigheid kan meer vraag naar dit soort medische zorg gestimuleerd hebben en hebben bijgedragen tot het meerlingzwangerschappenexces.255 Men kan verder aanvoeren dat vergeleken met Vlaanderen de praktisch identieke pariteit van de Neerland moeders, de leeftijdsverdeling, de vergelijkbare geslachtsratio en de afwezigheid van een dosis-antwoord verband tussen blootstelling en het voorkomen van congenitale afwijkingen of van een overmaat van meerlingzwangerschappen bij moeders, die ooit woonachtig waren in Neerland, weinig evidentie
opleveren
voor
een
verminderde
fertiliteit
ten
gevolge
van
een
milieuverontreiniging. 6.4.5 Risicoperceptie en -communicatie Gemeentelijke verbrandingsovens waren
vroeger
zware
vervuilers,
die
hinder
veroorzaakten en misschien een bedreiging vormden voor de gezondheid. De vreesverwekkende factoren aanwezig in Neerland kunnen in belangrijke mate bijgedragen hebben tot de risicoperceptie. Zij bestonden onder meer uit een ongewilde blootstelling, waaraan door persoonlijke voorzorgsmaatregelen niet kon ontsnapt worden, en een nieuwe, door de mens gecreëerde bron van verontreiniging, die onomkeerbare schade toebracht aan kleine kinderen.819 Daarenboven werden de klachten van de plaatselijke bevolking al te lang genegeerd door de autoriteiten en verder bestond er geen systeem dat bekwaam was om snel en effectief een antwoord te geven op milieuproblemen.818;820 Dit alles, op zijn beurt, kan langdurige stress veroorzaakt hebben. 821
Hoofdstuk 6: Complementariteit van gegevensbanken.
317
6.5 BESLUIT Studie van clusters dragen slechts zelden bij tot de wetenschap en zouden moeten vermeden worden.812In de gegeven omstandigheden echter werd een snel en onderbouwd advies gevraagd. Geconfronteerd met een weinig meewerkende plaatselijke gemeenschap, hadden we geen andere keuze dan een post hoc clusteranalyse uit te voeren betreffende congenitale afwijkingen en de reproductieve gezondheid te beoordelen, gebruik makend van beschikbare, routinematig verzamelde gegevens. Onze studie gaat gebukt onder verschillende methodologische beperkingen. De analyse – een suboptimale vergelijking tussen gemeenschappen818 i.p.v., bijvoorbeeld, een patiëntcontrole onderzoek – bleef beperkt tot alleen maar een vergelijking van gevallen in een blootgesteld gebied met deze van de algemene bevolking, zonder een precieze beschrijving van de letsels en zonder informatie over vroegtijdige miskramen en abortussen. Daarenboven beschikten we niet over voldoende details i.v.m. SES, type en bron van vervuiling, en intensiteit van de blootstelling, wat een formele uitsluiting van een cluster van congenitale afwijkingen uitsloot. Nochtans vertrouwen we erop, wegens de ingebouwde beveiliging tegen misclassificatie, dat deze gegevens ons toelieten een eventueel exces van congenitale afwijkingen te beperken tot een odds ratio van minder dan twee, en, vermits de baseline frequentie zeer laag is, voldoende evidentie verschaft te hebben om een zorgwekkende situatie i.v.m. de reproductieve gezondheid in Neerland uit te sluiten. De Neerland studie onderstreept het belang van een efficiënte risicocommunicatie vanwege de overheid naar een ongeruste gemeenschap in geval van een milieuprobleem. Tenslotte maakt ze duidelijk dat de koppeling van gegevens van bestaande gegevensbanken in een beperkte tijdspanne nuttige informatie kan verschaffen wanneer zich dergelijke problemen stellen. Het is dan zaak het gemeenschappelijke belang af te wegen tegen het individuele recht op bescherming van zijn privé-sfeer.
318
Hoofdstuk 6: Complementariteit van gegevensbanken
Bedankingen We danken de professoren Bartsch, Van Larebeke en Van Oyen voor hun opbouwende kritiek over de opzet en de resultaten van onze studie. We zijn grote dank verschuldigd aan Mevr. E. Wallyn van het Antwerpse Register van de Burgerlijke Stand, het SPE en het Rijksregister voor hun vriendelijke en behulpzame samenwerking.
319 ALGEMEEN BESLUIT EN AANBEVELINGEN Een door evaluatie bijgestuurd beleid heeft nood aan bruikbare gegevens, die toelaten een beleid te voeren gefundeerd op prioritaire gezondheidsproblemen. Op basis hiervan formuleren lokale, intermediaire en landelijke beleidsmakers algemene en specifieke doelstellingen, die op hun beurt vertaald worden in activiteiten, die uitmonden in prestaties en vervolgens in uitkomsten. In deze benadering is het gebruik van administratieve gegevensbanken - alleen of in combinatie - fundamenteel: zij leveren aanknopingspunten voor de evaluatiecyclus (definitie van prioritaire gezondheidsproblemen, evaluatie van prestaties en uitkomsten, evaluatie van de pertinentie van het gevoerde beleid) ten behoeve van het beleid op alle niveaus. Wegens een aantal beperkingen laten de administratieve gegevensbanken slechts tot op zekere hoogte toe een onderbouwd beleid te voeren op alle niveaus van het gezondheidssysteem. Deze beperkingen vloeien deels voort uit de ongelijke kwaliteit van de gegevens, deels uit het vooralsnog eenzijdig gebruik van de Minimaal Klinische Gegevens in een financiële optiek en deels uit de versnippering, de geringe toegankelijkheid en de te beperkte scoop van de bestaande gegevensbanken. Laten we daarbij niet uit het oog verliezen dat, hoewel de complexiteit van de case mix niet volledig door administratieve gegevens kan ondervangen worden, alleen dit soort gegevens toelaat landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix. De kwaliteit van de gegevens van de overlijdensstatistieken deelt grotendeels in de gebreken van de ziekenhuis ontslaggegevens. Specifieke moeilijkheden worden gesteld door de certificatie met zijn specifieke, oorzakelijke logica, waar artsen vaak geneigd zijn te redeneren vanuit het principe van de ernst. Ook hier lijkt een adequate vorming van de artsen een noodzakelijke voorwaarde voor verbetering. Hoewel over het ganse land een duidelijke verbetering van de codeerkwaliteit wordt vastgesteld blijft de tijdigheid van de statistieken problematisch in het zuidelijk landsgedeelte en derhalve ook die van de nationale statistieken. Vergeten we hierbij niet dat er geen enkele andere bron voor
320
Algemeen Besluit en Aanbevelingen
gezondheidsgegevens bestaat, die even universeel is in dekkingsgraad, in uniformiteit, en tijdigheid als de sterftegegevens binnen het systeem van de bevolkingsstatistieken. Toch wensen wij hier duidelijk te stellen dat de voormelde administratieve gegevens zeker geen antwoord kunnen verstrekken op alle beleids- of onderzoeksvragen. Vaak kunnen zij slechts een nuttige screening verschaffen en dient er op basis hiervan een gericht wetenschappelijk onderzoek volgens de regels der kunst uitgevoerd te worden. Het kan hierbij noodzakelijk blijken een specifieke registratie op te zetten. De internationaal vastgestelde verschillen in mortaliteit ten gevolge van ischemische hartziekten, die leidden tot het opzetten van het MONICA project, is hiervan een mooie illustratie. In andere gevallen, zoals voor het uitvoeren van een kosten baten analyse van een vaccinatie voor humaan pappilomavirus en baarmoederhalskanker, kunnen de administratieve gegevens geen nuttige informatie leveren en zal wetenschappelijk onderzoek, gebaseerd op door de onderzoekers verzameld feitenmateriaal nodig zijn, om dat soort vragen te beantwoorden. Om de bruikbaarheid van deze administratieve gegevensbanken te verhogen lijkt een strategie, gebaseerd op een progressieve verbetering een haalbaar project. Zij berust erop dat
de kwaliteit van de gegevens en dus hun beleidsonderbouwend potentieel zal
verbeteren indien ze ook voor volksgezondheidkundige doeleinden gebruikt worden. Zoals de beperkte ervaring, die in dit proefschrift weergegeven wordt, leert is het mogelijk aan de hand van kwaliteitsindicatoren niet alleen problemen in verband met kwaliteit van zorgen te identificeren maar ook problemen in verband met de kwaliteit van de gegevens. Deze laatste kunnen via de audits die de FOD Volksgezondheid uitvoert onderzocht en waar nodig gecorrigeerd worden. Het kan hierbij zowel over overcoderen (bijvoorbeeld comorbiditeit) als ondercoderen (bijvoorbeeld het niet coderen van een vermelde vorige keizersnede) gaan. Problemen in verband met de kwaliteit van zorgen kunnen aangepakt worden in een brede samenwerking binnen de sector tussen clinici en het management, tussen de sector en het College van geneesheren en beroepsverenigingen, en in samenwerking met de overheid. Dit veronderstelt een brede mentaliteits- en gedragsverandering, met een herdenking van de organisatie op alle niveaus, een openheid naar en een implicatie van de patiënt en de
321
Algemeen Besluit en Aanbevelingen
gemeenschap, waarbij de overheid niet alleen gezien wordt en zich gedraagt als een controlerende instantie maar als een heuse partner, die, naast zijn verantwoordelijkheid voor het opzetten van administratieve gegevensbanken en het analyseren van de gegevens, ook zijn verantwoordelijkheid als borger van de publieke belangen opneemt. Een eerste belangrijk initiatief van een brede samenwerking op alle niveaus werd genomen. Het bestaat in de creatie van een operationele structuur, die ermee belast wordt (1) de toekomstige nationale feedbacks, bestaande uit klinische en niet-klinische indicatoren,
te
begeleiden,
(2)
de
ontwikkeling
van
hierop
gebaseerde
kwaliteitsbevorderende acties te initiëren en (3) het identificeren van bijkomende indicatoren.Verder zullen lokale initiatieven, die aansluiten op de feedback, aangemoedigd worden. Zowel een continue investering in een infrastructuur voor kwaliteitsbevordering als het voorzien in een beschermde tijd voor deze activiteiten zijn vereist om het project te laten slagen. Een goede samenwerking tussen de bestaande gegevensbanken, naar het Canadese voorbeeld, moet een volgende doelstelling zijn. In onze Neerland studie menen we niet alleen aangetoond te hebben dat een samenwerking mogelijk is, maar tevens dat de voor het beleid noodzakelijke informatie op deze manier kon verzameld worden. Deze doelstelling zal echter alleen verwezenlijkt kunnen worden indien de politieke overheden zich hiervoor inzetten. De versnippering van de bevoegdheden over het federaal en het gemeenschapsniveau, en de huidige wetgeving in verband met de bescherming van de persoonlijke levenssfeer maken deze opzet niet eenvoudig. Toch moet het mogelijk zijn via geijkte procedures een koppeling van gegevens mogelijk te maken en de voorwaarden tot koppeling te versoepelen in functie van het minder of meer dringend karakter van de aanvraag. Tenslotte formuleren we volgende dubbele aanbeveling: 1) het opzetten van een operationeel landelijk gezondheidsinformatie systeem, dat de noodzakelijke gegevens toegankelijk maakt, de kwaliteit ervan waarborgt, ze tijdig verwerkt en ze op een correcte manier met de nodige garanties voor de
322
Algemeen Besluit en Aanbevelingen persoonlijke levenssfeer ter beschikking stelt voor het beleid en de wetenschappelijke wereld, 2) het structureel verankeren van een tijdige oplevering van de landelijke mortaliteitsgegevens.
323 SAMENVATTING Een behoeftengestuurd en bevolkingsgericht gezondheidsbeleid vereist een betrouwbaar gezondheidsinformatiesysteem. Hierbij lijkt er een belangrijke rol weggelegd voor secundaire gegevensbanken. Hij bestaat in het in kaart brengen van de gezondheidsstatus van de bevolking en het om het verantwoording afleggen over het gebruik van de toegekende middelen en over de kwaliteit en de uitkomsten van de verstrekte zorgen mogelijk te maken. Op basis van literatuurgegevens werd een referentiekader voor het beoordelen van gegevenskwaliteit uitgewerkt met een bijzondere nadruk op de potentieel negatieve invloed van het financieringsmechanisme van ziekenhuizen hierop. Meer speciaal gaat onze aandacht uit naar het “creep” fenomeen, het kunstmatig verzwaren van de case mix van een ziekenhuis om een hogere terugbetaling te krijgen. Tijdens het ganse verzamelings- en verwerkingsproces van de gegevens tasten onvolmaaktheden, fouten en vergetelheid de kwaliteit van de gegevens aan. De gegevenskwaliteit varieert over de tijd en in functie van leeftijd; geslacht van de geregistreerde; het type aandoening; het type medische handeling (diagnose, ingreep); het gebruik van de gegevens door de diensten die registreren; en, het registratiesysteem en zijn bewakingsmechanismen. Dit betekent dat ze grondig op hun waarde getoetst moeten worden en dat er voorzichtig omgesprongen wordt met de interpretatie van de resultaten van uitgevoerde studies. Een zorgvuldig design van de registratie is uiterst belangrijk. De bewaking van de gegevenskwaliteit omvat de te gebruiken formulieren of beeldschermen; de selectie van te registreren items (zoals klinische, radiologische en laboratoriumgegevens, EKG en beeldvorming); eenduidige instructies; het toepassen van internationaal aanvaarde classificatiesystemen en bijbehorende codeerregels; het op systematische wijze verzamelen, verwerken en interpreteren van de gegevens en het monitoren ervan over de tijd. Verder zijn gegevensvergelijking en samenwerking met andere registraties, creativiteit bij de validatie, feedback en intensieve audit noodzakelijk, zeker wanneer deze gegevens een belangrijke rol blijken te spelen in het financieringsmechanisme van ziekenhuizen.
324
Samenvatting
Er lijken twee, los van elkaar staande werelden te bestaan: een van volksgezondheid en een andere van gezondheidsdiensten, met twee eigen informatiesystemen, respectievelijk volksgezondheidsinformatie en managementinformatie. Wij trachten de conceptuele eenheid te herstellen door te streven naar een kwaliteitsvolle volksgezondheid. Na een omschrijving van wat kwaliteit is, wordt nagegaan welke van haar aspecten aan de hand van administratieve gegevens kunnen beschreven worden. Een eerste benadering is gebaseerd op kwaliteitsindicatoren. Achtereenvolgens worden de types en het gebruik van kwaliteitsindicatoren besproken, en de mogelijkheden van administratieve gegevens om ondermaatse of bovenmaatse kwaliteit aan te tonen onderzocht. Een tweede benadering is gebaseerd op incidenten n.a.v. toegediende zorgen. Het begrip “onbedoelde uitkomst” wordt omschreven, gegevensbronnen worden vermeld, de omvang van het fenomeen geschetst en de beperkte bruikbaarheid van administratieve gegevensbanken aangegeven. Wij wijdden een hoofdstuk aan methodologische aspecten in verband met de analyse van administratieve gegevens voor het opsporen van afwijkend codeergedrag en het identificeren van ziekenhuizen met een vermoedelijke, bovenmaatse of ondermaatse kwaliteit. In beide gevallen gaat het over een “outlier” probleem. We gebruikten hiervoor de logistische regressie en corrigeerden voor het multipel gelijktijdig toetsen d.m.v.de Bonferroni correctie en voor de correlatie tussen de gegevens d.m.v.“rescaling” technieken. Kwaliteit van zorgen is een dagdagelijkse, gedeelde verantwoordelijkheid tussen patiënt, zorgverleners, ziekenhuisdirecties, College van geneesheren en beroepsverenigingen. De verantwoordelijkheid van de overheid als borger van de belangen voor de gemeenschap bestaat erin kwaliteitsinitiatieven te ondersteunen en te stimuleren. In onze benadering werden ziekenhuizen eerder gezien als individuele structuren van het gezondheidssysteem, waarvan de diensten een gemeenschappelijk organisatorische cultuur en een aantal gemeenschappelijk processen deelden, en die verantwoording dienden af te leggen. Niet het tot schande maken, noemen en blameren van individuen of instituten maar het identificeren van organisatie− en cultuurgerelateerde problemen werden beschouwd als het aanknopingspunt voor kwaliteitsbevorderende acties.
Samenvatting
325
De voornaamste resultaten van de analyse van het keizersnedencijfer bij laagrisico verlossingen kunnen als volgt samengevat worden. Er bestaan in België belangrijke en onverklaarde interziekenhuis verschillen in keizersnedencijfer, een nationale opwaartse trend van 2% per semester, en een intens medisch ingrijpen rond het geboortegebeuren. Als men verlangt het keizersnedencijfer om te buigen zal dit een georganiseerde aanpak vereisen en dit zowel op het centraal als intermediair en lokaal niveau. Voor de analyse van het letaliteitcijfer bij AMI wijzen de voornaamste resultaten eerder naar de beperkingen van de gegevens. De nood aan een eenvormige definitie, de volledigheid van de gegevens, de traceerbaarheid van patiënten en een goede risicocorrectie zijn daarbij de voornaamste aandachtspunten. Op gebied van kwaliteit van de zorgen kunnen reeds een aantal behartigenswaardige bevindingen verder uitgediept worden. De belangrijke interziekenhuis verschillen zijn wellicht moeilijk interpreteerbaar maar lijken toch belangrijk genoeg om verder onderzocht te worden. Ook de transfer van AMI-patiënten voor een electieve PCI verdient de aandacht. Hoewel de complexiteit van de case mix niet volledig door administratieve gegevens kan ondervangen worden, dient men er zich tenslotte rekenschap van te geven dat alleen dit soort gegevens toelaat landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix. Bij de analyse van kwaliteitsindicatoren kwamen we tot het besluit dat, uit de aard zelf van onze gegevens, die alleen informatie bevatten over een aantal technische aspecten maar niet over interpersonele relaties, we alleen van een screening konden gewagen. Daarom werd de feedback gericht tot clinici, ziekenhuisdirecties, College van geneesheren, beroepsverenigingen en overheid. Om dezelfde reden was hij ook anoniem. De Neerland studie gaf aan dat het eventueel exces aan congenitale aandoeningen beperkt bleef tot een odds ratio van maximaal twee en dat er voldoende evidentie voorhanden was om een bedreiging voor de reproductieve gezondheid uit te sluiten. Ze benadrukte het belang voor de overheden om te luisteren naar een verontruste gemeenschap en om tot een echte risicocommunicatie te komen. Ze maakte ook duidelijk dat koppeling van gegevens van bestaande gegevensbanken nuttige informatie kan verschaffen.
326
Samenvatting
De moeilijkheid om het juiste evenwicht te vinden tussen de bescherming van het individuele recht op privacy en het gemeenschappelijk belang komt tot zowel uiting in de studie van het letaliteitcijfer na een opname voor een AMI als in de Neerland problematiek. Het is in het eerste geval belangrijk zich te realiseren dat traceerbaarheid een randvoorwaarde is voor de evaluatie van de behandeling van een AMI en bijgevolg voor het toekomstige welzijn van dit type patiënten. In het tweede geval hadden we nooit een verontrustende gezondheidssituatie kunnen uitsluiten zonder een koppeling van de gegevens tussen registers. Samenvattend kan men stellen dat administratieve gegevensbanken in beperkte mate toelaten een onderbouwd beleid te voeren op alle niveaus van het gezondheidssysteem. De beperkingen vloeien voort deels uit de gebrekkige kwaliteit van de gegevens, deels uit het vooralsnog eenzijdig gebruik van de Minimaal Klinische Gegevens in een financiële optiek en deels uit de versnippering, de geringe toegankelijkheid en de te beperkte scoop van de bestaande gegevensbanken. De kwaliteit van de gegevens en dus hun beleidsonderbouwend
potentieel
zal
verbeteren
indien
ze
ook
voor
volksgezondheidkundige doeleinden gebruikt worden. De kwaliteit van de zorgen is hiervan een belangrijk domein. Om deze doelstelling te bereiken is een opbouwende samenwerking van alle beleidsniveaus noodzakelijk.
327 SUMMARY A need-driven and population-directed health policy requires a reliable health information system. Herein secondary databases may play an important part. Indeed they contribute to the assessment of the health status of the population and allow health services to be accountable for the use of the resources, placed at their disposal, and the quality and outcomes of the care they offer. Based on the literature, a frame of reference has been elaborated to assess the quality of data laying an emphasis on the potential negative influence of the financing mechanism of the hospitals hereupon. In particular we paid attention to the phenomenon of creep, which consists in the artificially aggravating of a hospital’s case mix in order to obtain a higher reimbursement. During the whole process of data collection and processing the data may be fraught with imperfections, errors and forgetfulness. Data quality varies over time and according to age and gender of the patient; the type of the disorder; the type of medical act (diagnosis, procedure); the use of their own data by the registering services; and, the registration system and its control mechanisms. This means that administrative data are to be scrutinized and to be handled with great care when interpreting the results of studies carried out using them. A careful design of the registration is of the utmost importance. The assurance of the quality of the data includes the forms or screens to be used, the selection of items to be registered (such as clinical, radiological and laboratory data, ECG and medical imaging); univocal instructions; the implementation of international agreed to classification systems and accompanying rules; the systematic collecting, processing and analyzing of the data and its monitoring in time. Comparison of the data and collaboration with other registries; creativity while validating; feedback and intensive audit; all are required, especially if the data
play
an
important
role
in
the
financing
mechanism
of
hospitals.
328
Summary
Two separate worlds seem to exist: the world of public health and the world of health services. Both have their own information system, respectively information of public health and management information. We try to restore the conceptual unity by aiming at a public health of superior health care quality. Having defined the concept of quality, we examined to which extent it could be analyzed using administrative data. A first approach relies on quality indicators. Successively the differential types and uses of these indicators are discussed. We also examined the potential of administrative data to identify both superior and inferior quality of care. A second approach is that of the patient safety indicators, based on adverse events. The concept of adverse event is described; sources of data are mentioned; the magnitude of the phenomenon is outlined and the limitations in the use of administrative data in that respect are reported. We dedicated a chapter to the methodological aspects regarding the use of administrative data both to detect deviant coding practices as to identify hospitals of superior or inferior quality of care. In both cases it is about a problem of outliers. To handle these problems we made use of logistic regression techniques and corrected for multiple, simultaneous testing by the Bonferroni correction and for correlation within the data by rescaling techniques. Quality of care is a continuous, shared responsibility between patients, care providers, hospital directions, College of physicians and professional bodies. The responsibility of the authorities, the guarantor of the community’s interests, consists in supporting and eliciting quality initiatives. In our approach hospitals are considered individual structures of the health care system, consisting of services sharing a common organizational culture and certain common processes and being accountable to the community. Not the “shame, name and blame” of individuals or organizations but the identification of organizational problems was considered a starting point for quality improvement. The main results of our analysis regarding the cesarean section rate in low risk deliveries may be summarized as follows. In Belgium important and unexplained differences in rates exist between hospitals. We found a national upward trend of 2% per semester and a
Summary
329
pervading medicalization of childbirth. An organized approach on lokal, intermediate and central level will be required to stop the rise of the cesarean section rate. The main results of the analysis of the in hospital case fatality rate of AMI point to the limitations of the data. The need of a univocal definition of an AMI, the completeness of the data, the traceability of transferred patients and an adequate risk adjustment draw particular attention. Some of our findings in the field of quality of care are worthy to be further examined. Although it may show difficult to interpret the between hospital differences, they seemed sufficiently important to be investigated. The transfer of patients with AMI to undergo an elective PCI requires attention as well. Finally, although it is impossible to completely reflect the complexity of the case mix by means of administrative data, one has to realize that only this type of data allows to dajust countrywide inter-hospital comparisons for case mix. Analyzing quality indicators led us to the conclusion that, due to the very nature of our data, which contain only information about technical aspects of care but not about interpersonal relations, we provided only a screening of and not a firm statement about quality. Therefore our feedback has been directed to the clinicians, hospital directions, College of physicians, professional bodies and authorities. For that same reason our feedback remained anonymous. The Neerland study showed able to restrict the potential excess of cases of congenital anomalies to an odds ratio of less than two and to have furnished sufficient evidence to exclude a worrisome situation regarding the reproductive health in Neerland. The study highlighted the need for the authorities of listening to and communicating with a community about its health risks. It made it clear that linking of data between existing registries may provide the needed information. The difficulty of striking a balance between the common good and the right to the protection of one’s privacy is common to both the case fatality rate of AMI and the Neerland study. In the first case it seems important to realize that traceability constitutes a prerequisite for the evaluation of the treatment of AMI and as a consequence for the well
330
Summary
being of this type of patients in the future. In the second case we would never have been able to exclude a worrisome health situation without the linkage of data between registries. Concluding, one may argue that administrative data allow to a certain extent the underpinning of a policy on all the levels of the health care system. The limitations are due to the perfectible quality of the data; to the until now almost exclusive, financial use of the Minimal Clinical Data; and, to the poor accessibility and the too restricted scope of the existing data banks. The quality of data and hence their policy-sustaining potential will increase if the data are used in a perspective of public health, wherein quality of care constitutes an important domain. To realize this objective a constructive collaboration is required of all levels of both the public health and the health services worlds.
331 Literatuur (1) Doremus HD, Michenzi EM. Data quality. An illustration of its potential impact upon a diagnosis-related group's case mix index and reimbursement. Med Care 1983; 21(10):1001-1011. (2) Scerbo M, Dickstein C, Wilson A. Health Care Data and the SAS System. Cary NC: SAS Institute Inc.; 2001. (3) Belgisch Staatsblad, Moniteur Belge. Koninklijk besluit houdende oprichting van een Commissie voor toezicht op en evaluatie van statistische gegevens die verband houden met de medische aktiviteiten in de ziekenhuizen. 21-6-1990. (4) Hill AB. The Aim of the Statistical Method. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 1-21. (5) Baker TD, Reinke WA. Epidemiologic Base for Health Planning. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 117-130. (6) Reinke WA. Health Services Program Evaluation. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 42-53. (7) Cochrane AL, St Leger AS, Moore F. Health service 'input' and mortality 'output' in developed countries. J Epidemiol Community Health 1978; 32(3):200-205. (8) Reinke WA. Health Systems Reserch in Relation to Planning. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 31-41. (9) Last JM, Spasoff RA, Harris SS, Thuriaux MC, Anderson JB. A Dictionary of Epidemiology. 4th ed. New York: Oxford University Press; 2001. (10) Van Oyen H. Belang van gezondheidgegevens voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg.Verslagboek. Diegem Editorial: Kluwer; 1997. 74-82. (11) Gonnella JS, Louis DZ, Zeleznik C, Turner BJ. The problem of late hospitalization: a quality and cost issue. Acad Med 1990; 65(5):314-319. (12) Asch SM, Sloss EM, Hogan C, Brook RH, Kravitz RL. Measuring underuse of necessary care among elderly Medicare beneficiaries using inpatient and outpatient claims. JAMA 2000; 284(18):2325-2333.
Literatuur
332
(13) Cochrane AL. L'inflation médicale. Réflexions sur l'efficacité de la médicine. Paris: Galilée; 1977. (14) Mercenier P. Santé Publique. Notes de cours. Antwerpen: CIPS, ITG; 1976. (15) Roos NP, Black C, Roos LL, Frohlich N, DeCoster C, Mustard C et al. Managing health services: how the Population Health Information System (POPULIS) works for policymakers. Med Care 1999; 37(6 Suppl):JS27-JS41. (16) WHO. Health for all targets: the health policy for Europe. 4, 199-215. 1991. Geneva, WHO. European Health for All Series. (17) Anonymous. Estimation of the incidence of acute myocardial infarction using record linkage: a feasibility study in Nova Scotia and Saskatchewan. Nova Scotia-Saskatchewan Cardiovascular Disease Epidemiology Group. Can J Public Health 1989; 80(6):412-417. (18) Cotter JJ, Smith WR, Rossiter LF, Pugh CB, Bramble JD. Combining state administrative databases and provider records to assess the quality of care for children enrolled in Medicaid. Am J Med Qual 1999; 14(2):98-104. (19) Haas JS, Brandenburg JA, Udvarhelyi IS, Epstein AM. Creating a comprehensive database to evaluate health coverage for pregnant women: the completeness and validity of a computerized linkage algorithm. Med Care 1994; 32(10):1053-1057. (20) Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 914-921. (21) Aelvoet W, Mertens I, van Sprundel M. Uitwendige oorzaken in de Minimale Klinische Gegevens. 2002. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen en Leefmilieu. (22) Aelvoet W, Bogaert J, Gillet P, Molenberghs G. Bepaling van de invloed van sociale factoren en van het individueke ziekenhuis op de verblijfsduur in de sector van de acute ziekenhuizen, aan de hand van de gekoppelde MKG- en MFG-1996. 2001. Brussel, Ministerie van Sociale Zaken, Volksgezondheid en Leefmilieu. (23) Chatfield C. Problem Solving. A Statistician's Guide. 2nd ed. London: Chapman&Hall; 1995. (24) Van Oyen H, Moens G. Conceptueel kader van een gezondheidsinformatiesysteem. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 881-895.
Literatuur
333
(25) Baert E, Byttebier G, De Backer G, Van Oyen H, Aelvoet W, De Henauw S. Ontwikkeling van geïntegreerde gezondheidsindicatoren op basis van bestaande Vlaamse gegevens in zake ziekte en gezondheid. PBO/UG/43, 1-98. 2001. Gent, RUG. (26) Vandenbroeck H, Van Loon H. Evaluatie van bestaande pathologieregistraties. Onderzoek Milieu & Gezondheid. 2000. Brussel, Ministerie van de Vlaamse Gemeenschap. (27) WHO. International Classification of Diseases.1975 Revision. Ninth Revision. ed. Geneva.: World Health Organisation.; 1977. (28) Roos NP, Black C, Roos LL, Frohlich N, DeCoster C, Mustard C et al. Managing health services: how administrative data and population- based analyses can focus the agenda. Health Serv Manage Res 1998; 11(1):49-67. (29) MacMahon B, Pugh TF. Sources of Data. In: MacMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 73-102. (30) MacMahon B, Trichopoulos D. Epidemiology. Principles and Methods. New York: Little, Brown and Company; 1996. (31) Rothman KJ, Greenland S. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. (32) Van de Sande S, De Wachter D, Swartenbroeckx N, Peers J, Debruyne H, Moldenaers I et al. Inventaris van databanken gezondheidszorg. KCE reports vol.30A, 1-135. 2006. (33) Aelvoet W, Bogaerts K, Capet F. Gezondheidsindicatoren 1994. Brussel: Ministerie van de Vlaamse Gemeenschap; 1996. (34) Aelvoet W, Bogaerts K, Capet F, Quataert PK. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap; 1997. (35) Mackenbach JP. Mortality and medical care:studies of mortality by cause of death in the Netherlands and other European countries. Rotterdam, Erasmus Universiteit; 1988. (36) Aelvoet W. Vital Statistics in Flanders. An Exploration of Possible Biases due to Coding and Certification Practices. Limburgs Universitair Centrum; 1994. (37) AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004.
334
Literatuur
(38) Hosmer DW, Lemeshow S. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. (39) Grundy F, Reinke WA. Recherche en Organisation Sanitaire et Techniques de Managemenet. [No 51]. 1973. Genève, Organisation Mondiale de la Santé. Cahiers de Santé Publique. (40) Charlton JR, Hartley RM, Silver R, Holland WW. Geographical variation in mortality from conditions amenable to medical intervention in England and Wales. Lancet 1983; 1(8326 Pt 1):691-696. (41) Weissman J, Epstein AM. Case mix and resource utilization by uninsured hospital patients in the Boston metropolitan area. JAMA 1989; 261(24):35723576. (42) Ayanian JZ, Weissman JS, Schneider EC, Ginsburg JA, Zaslavsky AM. Unmet health needs of uninsured adults in the United States. JAMA 2000; 284(16):2061-2069. (43) Closon MC, Maes N, Duchaine A, Bellemans M, Gilbert P, Van Hee W. Impact des facteurs sociaux sur la durée de séjour et les coûts dans les hôpitaux. Bruxelles, CIES: 1998. (44) Peeters RF, Van der Veen F. De perinatale en zuigelingensterfte van ethnische minderheden in België/Vlaanderen. 1989. Antwerpen, UA ESOC. (45) Alexander S. Crosscultural aspects of risks in pregnancy. Ph D Thesis. ULB; 1995. (46) Bollini P, Siem H. No real progress towards equity: health of migrants and ethnic minorities on the eve of the year 2000. Soc Sci Med 1995; 41(6):819-828. (47) Aelvoet W, Vanoverloop J, Molenberghs G, Buekens P, Timmerman C, De Muynck A. Loop je in Vlaanderen, als je een baby van een Turkse moeder bent, een groter risico op kindersterfte? In: Aelvoet W, Capet F, Vanoverloop J, editors. Gezondheisindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap; 1998. 105-107. (48) Hadley J, Steinberg EP, Feder J. Comparison of uninsured and privately insured hospital patients. Condition on admission, resource use, and outcome. JAMA 1991; 265(3):374-379.
Literatuur
335
(49) Ancona C, Agabiti N, Forastiere F, Arca M, Fusco D, Ferro S et al. Coronary artery bypass graft surgery: socioeconomic inequalities in access and in 30 day mortality. A population-based study in Rome, Italy. J Epidemiol Community Health 2000; 54(12):930-935. (50) Franks P, Clancy CM, Gold MR. Health insurance and mortality. Evidence from a national cohort. JAMA 1993; 270(6):737-741. (51) Closon MC, Azoury E, Duchaine A, Caes T, Bellemans M. Impact des facteurs sociaux sur la durée de séjour dans les hôpitaux. 1997. Bruxelles, CIES. (52) Epstein AM, Stern RS, Tognetti J, Begg CB, Hartley RM, Cumella E et al. The association of patients' socioeconomic characteristics with the length of hospital stay and hospital charges within diagnosis- related groups. N Engl J Med 1988; 318(24):1579-1585. (53) Epstein AM, Stern RS, Weissman JS. Do the poor cost more? A multihospital study of patients' socioeconomic status and use of hospital resources. N Engl J Med 1990; 322(16):1122-1128. (54) Miller MG, Miller LS, Fireman B, Black SB. Variation in practice for discretionary admissions. Impact on estimates of quality of hospital care. JAMA 1994; 271(19):1493-1498. (55) Rose G. The Strategy of Preventive Medicine. New York: Oxford University Press; 1992. (56) McMahon B, Pugh TF. Sources of Data. In: McMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 73-85. (57) Billings J. Using Administrative Data To Monitor Access, Identify Disparities, and Assess Performance of the Safety Net. 2003. http://www.ahrq.gov/data/safetynet/billings.htm. (58) Research Methods Server in the Division of Social Sciences. SoLaSSGCU. Sources & Uses of Secondary Data. http://oassis.gcal.ac.uk/rms/crml/ crml.html. (59) Data and Information Services Center UoW-M. An Introduction to Using Data at DPLS. 2003. http://www.disc.wisc.edu/types/indextxt.html, acceeded 280107.
336
Literatuur
(60) Colin C, Ecochard R, Delahaye F, Landrivon G, Messy P, Morgon E et al. Data quality in a DRG-based information system. Int J Qual Health Care 1994; 6(3):275-280. (61) Garnick DW, Hendricks AM, Comstock CB. Measuring quality of care: fundamental information from administrative datasets. Int J Qual Health Care 1994; 6(2):163-177. (62) Buehler JW. Surveillance. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 435-457. (63) Kantor J, Margolis DJ. The accuracy of using a wound care specialty clinic database to study diabetic neuropathic foot ulcers. Wound Repair Regen 2000; 8(3):169-173. (64) Coady SA, Sorlie PD, Cooper LS, Folsom AR, Rosamond WD, Conwill DE. Validation of death certificate diagnosis for coronary heart disease: the Atherosclerosis Risk in Communities (ARIC) Study. J Clin Epidemiol 2001; 54(1):40-50. (65) Inoue M, Tajima K, Tominaga S, Sugiura T, Inuzuka K. Evaluation of the death certificate follow-up method for the analysis of survival rate: data from Aichi Prefecture, Japan. Jpn J Clin Oncol 1998; 28(1):30-35. (66) Messite J, Stellman SD. Accuracy of death certificate completion: the need for formalized physician training. JAMA 1996; 275(10):794-796. (67) McMahon B, Pugh TF. Concepts of Cause. In: McMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 17-27. (68) Hill AB. Standardised Death-rates and Indices. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 181-198. (69) Shapiro MF, Park RE, Keesey J, Brook RH. The effect of alternative case-mix adjustments on mortality differences between municipal and voluntary hospitals in New York City. Health Serv Res 1994; 29(1):95-112. (70) WHO. World Health Report 2000. Health Systems: Improving Performance. 1206. 2000. Geneva, WHO. (71) OECD. Measuring Up. Immproving Health System Performance In OECD Countries. http://www1.oecd.org/publications/e-book/8102011E.PDF: OECD; 2002.
Literatuur
337
(72) Delnoij DMJ, ten Asbroek AHA, Arah OA, Custers T, Klazinga NS. Bakens zetten. Naar een Nederlands raamwerk voor de gezondheidszorg. 1-44. 2002. http://www.ggzbeleid.nl/pdfstelsel/vws_bakenszetten.pdf, Ministerie van Volksgezondheid, Welzijn en Sport. (73) Perrin EB, Koshell JJ. Assessment of Performance Measures for Public Health, Substance Abuse, and Mental Health. 1-160. 1997. Washington,DC, National Academy Press.
(74) Ansari MZ, Ackland MJ, Jolley DJ, Carson N, McDonald IG. Inter-hospital comparison of mortality rates. Int J Qual Health Care 1999; 11(1):29-35. (75) Thomas JW, Holloway JJ, Guire KE. Validating risk-adjusted mortality as an indicator for quality of care. Inquiry 1993; 30(1):6-22. (76) Marshall EC, Spiegelhalter D. Institutional Performance. In: Leyland AH, Goldstein H, editors. Multilevel Modelling of Health Statistics. Chichester: John Wiley & Sons, LTD; 2001. 127-142. (77) Davies SM, Geppert J, McClellan M. Refinement of the HCUP Quality Indicators. Technical Review Number 4 (Prepared by UCSF-Stanford Evidencebased Practice Center under Contract No. 209-97-0013). No.01-0035. 2001. Rockville,MD, Agency for Healthcare Research and Quality. (78) Hobbs FD, Parle JV, Kenkre JE. Accuracy of routinely collected clinical data on acute medical admissions to one hospital. Br J Gen Pract 1997; 47(420):439440. (79) Every NR, Frederick PD, Robinson M, Sugarman J, Bowlby L, Barron HV. A comparison of the national registry of myocardial infarction 2 with the cooperative cardiovascular project. J Am Coll Cardiol 1999; 33(7):1886-1894. (80) Malenka DJ, McLerran D, Roos N, Fisher ES, Wennberg JE. Using administrative data to describe casemix: a comparison with the medical record. J Clin Epidemiol 1994; 47(9):1027-1032. (81) Gabriel SE, Amadio PC, Ilstrup D. The feasibility and validity of studies comparing orthopedists and non-orthopedists caring for musculoskeletal injuries: results of a pilot study. Arthritis Care Res 1997; 10(3):163-168. (82) Meyer GS, Krakauer H. Validity of the Department of Defense Standard Inpatient Data Record for quality management and health services research. Mil Med 1998; 163(7):461-465.
338
Literatuur
(83) Simborg DW. DRG creep: a new hospital-acquired disease. N Engl J Med 1981; 304(26):1602-1604. (84) Weissman JS, Gatsonis C, Epstein AM. Rates of avoidable hospitalization by insurance status in Massachusetts and Maryland. JAMA 1992; 268(17):23882394. (85) Casanova C, Starfield B. Hospitalizations of children and access to primary care: a cross- national comparison. Int J Health Serv 1995; 25(2):283-294. (86) Pappas G, Hadden WC, Kozak LJ, Fisher GF. Potentially avoidable hospitalizations: inequalities in rates between US socioeconomic groups. Am J Public Health 1997; 87(5):811-816. (87) Jackson G, Tobias M. Potentially avoidable hospitalisations in New Zealand, 1989-98. Aust N Z J Public Health 2001; 25(3):212-221. (88) Bindman AB, Grumbach K, Osmond D, Komaromy M, Vranizan K, Lurie N et al. Preventable hospitalizations and access to health care. JAMA 1995; 274(4):305-311. (89) Begley CE, Slater CH, Engel MJ, Reynolds TF. Avoidable hospitalizations and socio-economic status in Galveston County, Texas. J Community Health 1994; 19(5):377-387. (90) Djojonegoro BM, Aday LA, Williams AF, Ford CE. Area income as a predictor of preventable hospitalizations in the Harris County Hospital District, Houston. Tex Med 2000; 96(1):58-62. (91) Parchman ML, Culler S. Primary care physicians and avoidable hospitalizations. J Fam Pract 1994; 39(2):123-128. (92) Kozak LJ, Hall MJ, Owings MF. Trends in avoidable hospitalizations, 19801998. Health Aff (Millwood) 2001; 20(2):225-232. (93) Glance LG, Dick AW, Osler TM, Mukamel DB. Accuracy of hospital report cards based on administrative data. Health Serv Res 2006; 41(4 Pt 1):1413-1437. (94) Pilpel D, Fraser GM, Kosecoff J, Brook RH. Validation of a centrally maintained computerized hospital database: comparison with operating room logbooks. Isr J Med Sci 1993; 29(5):287-291. (95) Fisher ES, Whaley FS, Krushat WM, Malenka DJ, Fleming C, Baron JA et al. The accuracy of Medicare's hospital claims data: progress has been made, but problems remain. Am J Public Health 1992; 82(2):243-248. (96) Smith CJ, Scott SM, Wagner BM. The necessary role of the autopsy in cardiovascular epidemiology. Hum Pathol 1998; 29(12):1469-1479.
Literatuur
339
(97) Burnand B, Feinstein AR. The role of diagnostic inconsistency in changing rates of occurrence for coronary heart disease. J Clin Epidemiol 1992; 45(9):929-940. (98) Stehbens WE. The quality of epidemiological data in coronary heart disease and atherosclerosis. J Clin Epidemiol 1993; 46(12):1337-1346. (99) Kesteloot H, Joossens JV. The quality of epidemiological data on coronary heart disease. J Clin Epidemiol 1995; 48(2):293-295. (100) Mark DH. Race and the limits of administrative data. JAMA 2001; 285(3):337338. (101) Dubois RW, Rogers WH, Moxley JH, Draper D, Brook RH. Hospital inpatient mortality. Is it a predictor of quality? N Engl J Med 1987; 317(26):1674-1680. (102) Jencks SF, Daley J, Draper D, Thomas N, Lenhart G, Walker J. Interpreting hospital mortality data. The role of clinical risk adjustment. JAMA 1988; 260(24):3611-3616. (103) Kahn KL, Brook RH, Draper D, Keeler EB, Rubenstein LV, Rogers WH et al. Interpreting hospital mortality data. How can we proceed? JAMA 1988; 260(24):3625-3628. (104) Shahian DM, Normand SL. The volume-outcome relationship: from Luft to Leapfrog. Ann Thorac Surg 2003; 75(3):1048-1058. (105) Green J, Wintfeld N, Sharkey P, Passman LJ. The importance of severity of illness in assessing hospital mortality. JAMA 1990; 263(2):241-246. (106) Merriam-Webster. Medical Dictionary. http://www.intelihealth.com/IH/ihtIH/: Meriam-Webster.; 2002. (107) U.S.Department of Labour. Occupational Outlook Handbook. 2002-03. ed. http://www.bls.gov/oco/print/ocos103.htm: U.S. Department of Labour. Bureau of Labor Statistics.; 2002. (108) McGuire MR. Automation of thePatient Medical Record:Steps Toward a Universal Patient Record. 2000. http://www.uprforum.com/Promises.htm. (109) Holt G, Feurer ID, Schwartz HS. An analysis of concordance among hospital databases and physician records. Ann Surg Oncol 1998; 5(6):553-556. (110) Wyatt JC, Liu JL. Basic concepts in medical informatics. J Epidemiol Community Health 2002; 56(11):808-812.
340
Literatuur
(111) Freedman AM, Gay GA, Brockert JE, Potrzebowski PW, Rothwell CJ. The 1989 revisions of the US Standard Certificates of Live Birth and Death and the US Standard Report of Fetal Death. Am J Public Health 1989; 78(2):168172. (112) Petersen LA, Wright S, Normand SL, Daley J. Positive predictive value of the diagnosis of acute myocardial infarction in an administrative database. J Gen Intern Med 1999; 14(9):555-558. (113) Rosamond WD, Chambless LE, Sorlie PD, Bell EM, Weitzman S, Smith JC et al. Trends in the sensitivity, positive predictive value, false-positive rate, and comparability ratio of hospital discharge diagnosis codes for acute myocardial infarction in four US communities, 1987-2000. Am J Epidemiol 2004; 160(12):1137-1146. (114) Kennedy GT, Stern MP, Crawford MH. Miscoding of hospital discharges as acute myocardial infarction: implications for surveillance programs aimed at elucidating trends in coronary artery disease. Am J Cardiol 1984; 53(8):10001002. (115) Campbell SE, Campbell MK, Grimshaw JM, Walker AE. A systematic review of discharge coding accuracy. J Public Health Med 2001; 23(3):205-211. (116) Fleege JC, van Diest PJ, Baak JP. Quality control methods for data entry in pathology using a computerized data management system based on an extended data dictionary. Hum Pathol 1992; 23(2):91-97. (117) Armitage P, Berry G. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. (118) Everitt BS. The Cambridge Dictionary of Statistics in the Medical Sciences. Cambridge: University Press; 1995. (119) Hoaglin DC, Mosteller F, Tukey JW. Exploring Data Tables, Trends and Shapes. New York: John Wiley & Sons; 1985. (120) Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in Vlaanderen. Arch Public Health 1991; 49:1-17. (121) Greenland S, Rothman KJ. Fundamentals of Epidemiologic Data Analysis. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 201-229. (122) Pavillon G, Coleman M, Johansson LA, Jougla E, Kardaun J. Coding of Causes of Death in European Community. OS/E3/98/COD/3, 1-180. 1998. Luxembourg, Eurostat.
Literatuur
341
(123) Stellman SD. The case of the missing eights. An object lesson in data quality assurance. Am J Epidemiol 1989; 129(4):857-860. (124) Molenberghs G, Burzykowski T, Michiels B, Kenward MG. Analysis of incomplete public health data. Rev Epidemiol Sante Publique 1999; 47(6):499514. (125) Capet F, Bogaerts K, Aelvoet W. Verwerking Registratiegegevens van het Medisch Schooltoezicht. Lengte en gewicht. 4-5. 1996. Brussel, Ministerie van de Vlaamse Gemeenschap. (126) Bravo G, Potvin L. Estimating the reliability of continuous measures with Cronbach's alpha or the intraclass correlation coefficient: toward the integration of two traditions. J Clin Epidemiol 1991; 44(4-5):381-390. (127) Booth JL, Collopy BT. A national clinical indicator database: issues of reliability and validity. Aust Health Rev 1997; 20(4):84-95. (128) Kleinbaum DG, Kupper LL, Morgenstern H. Validity: General Considerations. In: Kleinbaum DG, Kupper LL, Morgenstern H, editors. Epidemiologic Research.Principles and Quantitative Methods. New York: Van Nostrand Reinhold; 1982. 183-193. (129) Tennis P, Bombardier C, Malcolm E, Downey W. Validity of rheumatoid arthritis diagnoses listed in the Saskatchewan Hospital Separations Database. J Clin Epidemiol 1993; 46(7):675-683. (130) WHO. International Classification of Diseases. Tenth Revision. Geneva: World Health Organisation.; 1992. (131) McKee M. Routine data: a resource for clinical audit? Qual Health Care 1993; 2(2):104-111. (132) Human, social and economic costs due to non-fatal motor vehicle traffic accidents. An approach based on routinely collected data. [ 2003. (133) Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk deliveries using administrative data. An initiative to improve the quality of care. BMC Health Services Research 2008;8(1);3. (134) Haelterman G, Capet F. Kankerregistratie in Vlaanderen. In: Aelvoet W, Bogaerts K, Capet F, Quataert PK, editors. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap; 1997. (135) Gollub EL, Trino R, Salmon M, Moore L, Dean JL, Davidson BL. Cooccurrence of AIDS and tuberculosis: results of a database "match" and investigation. J Acquir Immune Defic Syndr Hum Retrovirol 1997; 16(1):44-49.
342
Literatuur
(136) Berlowitz DR, Brand HK, Perkins C. Geriatric syndromes as outcome measures of hospital care: can administrative data be used? J Am Geriatr Soc 1999; 47(6):692-696. (137) Berrino F, Gatta G, Chessa E, Valente F, Capocaccia R. Introduction: the EUROCARE II Study. Eur J Cancer 1998; 34(14 Spec No):2139-2153. (138) Crabbe T, Donmall M, Millar T. Validation of the University of Manchester Drug Misuse Database. J Epidemiol Community Health 1999; 53(3):159-164. (139) Hunt JP, Baker CC, Fakhry SM, Rutledge RR, Ransohoff D, Meyer AA. Accuracy of administrative data in trauma. Surgery 1999; 126(2):191-197. (140) Hsia DC, Ahern CA, Ritchie BP, Moscoe LM, Krushat WM. Medicare reimbursement accuracy under the prospective payment system, 1985 to 1988. JAMA 1992; 268(7):896-899. (141) Cattaruzzi C, Troncon MG, Agostinis L, Garcia Rodriguez LA. Positive predictive value of ICD-9th codes for upper gastrointestinal bleeding and perforation in the Sistema Informativo Sanitario Regionale database. J Clin Epidemiol 1999; 52(6):499-502. (142) Cassidy LD, Marsh GM, Holleran MK, Ruhl LS. Methodology to improve data quality from chart review in the managed care setting. Am J Manag Care 2002; 8(9):787-793. (143) Margo CE. A pilot study in ophthalmology of inter-rater reliability in classifying diagnostic errors: an underinvestigated area of medical error. Qual Saf Health Care 2003; 12(6):416-420. (144) Korteweg FJ, Gordijn SJ, Timmer A, Erwich JJ, Bergman KA, Bouman K et al. The Tulip classification of perinatal mortality: introduction and multidisciplinary inter-rater agreement. BJOG 2006; 113(4):393-401. (145) O'donnell CP, Kamlin CO, Davis PG, Carlin JB, Morley CJ. Interobserver variability of the 5-minute Apgar score. J Pediatr 2006; 149(4):486-489. (146) Hofer TP, Asch SM, Hayward RA, Rubenstein LV, Hogan MM, Adams J et al. Profiling quality of care: Is there a role for peer review? BMC Health Serv Res 2004; 4(1):9. (147) Lok CE, Morgan CD, Ranganathan N. The accuracy and interobserver agreement in detecting the 'gallop sounds' by cardiac auscultation. Chest 1998; 114(5):1283-1288.
Literatuur
343
(148) Scheel AK, Schmidt WA, Hermann KG, Bruyn GA, D'Agostino MA, Grassi W et al. Interobserver reliability of rheumatologists performing musculoskeletal ultrasonography: results from a EULAR "Train the trainers" course. Ann Rheum Dis 2005; 64(7):1043-1049. (149) Shibata A, Longacre TA, Puligandla B, Parsonnet J, Habel LA. Histological classification of gastric adenocarcinoma for epidemiological research: concordance between pathologists. Cancer Epidemiol Biomarkers Prev 2001; 10(1):75-78. (150) Cleary R, Beard RW, Coles J, Devlin HB, Hopkins A, Roberts S et al. The quality of routinely collected maternity data. BJOG 1994; 101(12):1042-1047. (151) Kuhn K, Gaus W, Wechsler JG, Janowitz P, Tudyka J, Kratzer W et al. Structured reporting of medical findings: evaluation of a system in gastroenterology. Methods Inf Med 1992; 31(4):268-274. (152) Audet AM, Scott HD. The Uniform Clinical Data Set: an evaluation of the proposed national database for Medicare's quality review program. Ann Intern Med 1993; 119(12):1209-1213. (153) Gjorup T. The kappa coefficient and the prevalence of a diagnosis. Methods Inf Med 1988; 27(4):184-186. (154) May SM. Modelling observer agreement--an alternative to kappa. J Clin Epidemiol 1994; 47(11):1315-1324. (155) Fleiss JL. Statistical Methods for Rates and Proportions. 2nd ed. New York: John Wiley; 1981. (156) Agresti A. Categorical Data Analysis. New York: John Wiley &Sons.; 1990. (157) SAS Institute Inc. The FREQ Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1247-1362. (158) Weiss NS. Diagnostic and Screening Tests:Measuring Their Ability to Predict Adverse Outcomes of Illness. In: Weiss NS, editor. Clinical Epidemiology:the Study of the Outcome of Illness. New York: Oxford University Press; 1996. 946. (159) Coggon D, Rose G, Barker DJP. Epidemiology for the Uninitiated. Forth ed. http://bmj.com/collections/epidem/epid.shtml: BMJ; 1997. (160) Rose G, Barker DJP. Epidemiology for the Uninitiated. BMJ; 1986. (161) Luck J, Peabody JW. Using standardised patients to measure physicians' practice: validation study using audio recordings. BMJ 2002; 325(7366):679.
344
Literatuur
(162) Peabody JW, Luck J, Glassman P, Dresselhaus TR, Lee M. Comparison of vignettes, standardized patients, and chart abstraction: a prospective validation study of 3 methods for measuring quality. JAMA 2000; 283(13):1715-1722. (163) Grover FL, Hammermeister KE, Shroyer AL. Quality initiatives and the power of the database: what they are and how they run. Ann Thorac Surg 1995; 60(5):1514-1521. (164) Kahn KL, Rubenstein LV, Sherwood MJ, Brook RH. Structured implicit interview for physician implicit measurement of quality of care: development of the form and guidelines for its use. N-3016-HCFA. 1989. http://www.rand.org/publications/N/N3016/, The RAND Corporation. (165) De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from the WHO-MONICA Ghent-Charleroi Study in Belgium. J Epidemiol Community Health 1998; 52(8):513-519. (166) Nieto FJ. Cardiovascular disease and risk factor epidemiology: a look back at the epidemic of the 20th century. Am J Public Health 1999; 89(3):292-294. (167) Tunstall-Pedoe H, Kuulasmaa K, Amouyel P, Arveiler D, Rajakangas AM, Pajak A. Myocardial infarction and coronary deaths in the World Health Organization MONICA Project. Registration procedures, event rates, and casefatality rates in 38 populations from 21 countries in four continents. Circulation 1994; 90(1):583-612. (168) Porta M, Marrugat J, Perez G. Trends in cardiovascular mortality and the quality of vital statistics. J Clin Epidemiol 1997; 50(2):221-222. (169) Wolff N, Helminiak TW. Nonsampling measurement error in administrative data: implications for economic evaluations. Health Econ 1996; 5(6):501-512. (170) Biller J, Feinberg WM, Castaldo JE, Whittemore AD, Harbaugh RE, Dempsey RJ et al. Guidelines for carotid endarterectomy: a statement for healthcare professionals from a Special Writing Group of the Stroke Council, American Heart Association. Circulation 1998; 97(5):501-509. (171) Chaturvedi S, Halliday A. Concerns regarding carotid endarterectomy guidelines. Stroke 1998; 29(7):1475-1476. (172) Rothwell PM, Eliasziw M, Gutnikov SA, Fox AJ, Taylor DW, Mayberg MR et al. Analysis of pooled data from the randomised controlled trials of endarterectomy for symptomatic carotid stenosis. Lancet 2003; 361(9352):107-116. (173) Rothwell PM, Eliasziw M. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1656.
Literatuur
345
(174) Russell DA, McPherson S, Gough MJ. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1655. (175) Robless P, Bicknell C, Chataway J, Cheshire N, Wolfe J. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1655. (176) Roberts SE, Goldacre MJ. Time trends and demography of mortality after fractured neck of femur in an English population, 1968-98: database study. BMJ 2003; 327(7418):771-775. (177) Iezzoni LI, Davis RB, Palmer RH, Cahalane M, Hamel MB, Mukamal K et al. Does the Complications Screening Program flag cases with process of care problems? Using explicit criteria to judge processes. Int J Qual Health Care 1999; 11(2):107-118. (178) Mant J, Hicks N. Detecting differences in quality of care: the sensitivity of measures of process and outcome in treating acute myocardial infarction. BMJ 1995; 311(7008):793-796. (179) To err is human: building a safer health system. Kohn LT, Corrigan JM, Donaldson MS, editors. 1-312. 2000. Washington DC, National Academy Press. (180) Powell AE, Davies HT, Thomson RG. Using routine comparative data to assess the quality of health care: understanding and avoiding common pitfalls. Qual Saf Health Care 2003; 12(2):122-128. (181) Rubin HR, Pronovost P, Diette GB. From a process of care to a measure: the development and testing of a quality indicator. Int J Qual Health Care 2001; 13(6):489-496. (182) Schwartz RM, Gagnon DE, Muri JH, Zhao QR, Kellogg R. Administrative data for quality improvement. Pediatrics 1999; 103(1 Suppl E):291-301. (183) Goldacre MJ, Griffith M, Gill L, Mackintosh A. In-hospital deaths as fraction of all deaths within 30 days of hospital admission for surgery: analysis of routine statistics. BMJ 2002; 324(7345):1069-1070. (184) Roberts SE, Goldacre MJ. Case fatality rates after admission to hospital with stroke: linked database study. BMJ 2003; 326(7382):193-194. (185) Goldacre MJ. Cause-specific mortality: understanding uncertain tips of the disease iceberg. J Epidemiol Community Health 1993; 47(6):491-496. (186) Shwartz M, Iezzoni LI, Ash AS, Mackiernan YD. Do severity measures explain differences in length of hospital stay? The case of hip fracture. Health Serv Res 1996; 31(4):365-385.
346
Literatuur
(187) Iezzoni LI, Ash AS, Shwartz M, Landon BE, Mackiernan YD. Predicting inhospital deaths from coronary artery bypass graft surgery. Do different severity measures give different predictions? Med Care 1998; 36(1):28-39. (188) Iezzoni LI. The risks of risk adjustment. JAMA 1997; 278(19):1600-1607. (189) Iezzoni LI, Ash AS, Shwartz M, Daley J, Hughes JS, Mackiernan YD. Predicting who dies depends on how severity is measured: implications for evaluating patient outcomes. Ann Intern Med 1995; 123(10):763-770. (190) Iezzoni LI. How much are we willing to pay for information about quality? Ann Intern Med 1997; 126(5):391-393. (191) Green J, Wintfeld N. Report cards on cardiac surgeons. Assessing New York State's approach. N Engl J Med 1995; 332(18):1229-1232. (192) Sowden AJ, Deeks JJ, Sheldon TA. Volume and outcome in coronary artery bypass graft surgery: true association or artefact? BMJ 1995; 311(6998):151155. (193) Spiegelhalter DJ. Mortality and volume of cases in paediatric cardiac surgery: retrospective study based on routinely collected data. BMJ 2002; 324(7332):261-263. (194) ICD-9-CM International Classification of Diseases, 9th Revision, Clinical Modification. Sixth Edition 2005 ed. 2004. (195) Averill RF, Goldfield N, Steinbeck BA, Grant T, Muldoon J, Brough AJ et al. All Patient Refined Diagnosis Related Groups (APR-DRGs). Version 15.0. 98054 Rev. 00, 1-34. 1998. Wallingford, CT, 3M Health Information Systems. (196) Romano PS, Chan BK. Risk-adjusting acute myocardial infarction mortality: are APR- DRGs the right tool? Health Serv Res 2000; 34(7):1469-1489. (197) Aelvoet W. On the use of administrative databases to support planning activities: a comment. Eur J Public Health 2005; 15(2):215. (198) Glance LG, Dick AW, Osler TM, Mukamel DB. Does date stamping ICD-9-CM codes increase the value of clinical information in administrative data? Health Serv Res 2006; 41(1):231-251. (199) Froom P, Shimoni Z. Prediction of hospital mortality rates by admission laboratory tests. Clin Chem 2006; 52(2):325-328. (200) Bindman AB, Bennett A. Date stamping: will it withstand the test of time? Health Serv Res 2006; 41(4 Pt 1):1438-1443.
Literatuur
347
(201) Legrand V, Wijns W, Vandenbranden F, Benit B, Boland J, Claeys M et al. Recommendations for Percutaneous Coronary Intervention in Belgium. 1-24. 2003. Belgian Working Group on Invasive Cardiology. (202) Hertoghe L, De Wals P, Piron M, Bertrand F, Lechat MF. Quality of perinatal death registration. A study in Hainaut, Belgium. Eur J Pediatr 1987; 146(5):473-476. (203) Keirse MJ. Perinatal mortality rates do not contain what they purport to contain. Lancet 1984; 1(8387):1166-1169. (204) Derom R, Vlietinck R. Beschikbaarheid van perinatale gegvens met het oog op een preventief gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 930-941. (205) Hansell AL, Walk JA, Soriano JB. What do chronic obstructive pulmonary disease patients die from? A multiple cause coding analysis. Eur Respir J 2003; 22(5):809-814. (206) Westendorp RG. Dwalingen in de methodologie. VI. Doodsoorzaken in perspectief. [Roaming through methodology. VI. Medical perspective on the causes of death]. Ned Tijdschr Geneeskd 1998; 142(35):1950-1953. (207) Friedman GD. Primer of Epidemiology. New York: McGraw-Hill Book Company; 1980. (208) Moolgavkar SH, Lee JAH, Stevens RG. Analysis of Vital Statistics Data. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 481-497. (209) Anonymous. Death certification in asthma. Lancet 1984; 2(8404):676. (210) Lenfant C, Friedman L, Thom T. Fifty years of death certificates: the Framingham Heart Study. Ann Intern Med 1998; 129(12):1066-1067. (211) Farebrother MJ, Kelson MC, Heller RF. Death certification of farmer's lung and chronic airway diseases in different countries of the EEC. Br J Dis Chest 1985; 79(4):352-360. (212) Lu TH, Shau WY, Shih TP, Lee MC, Chou MC, Lin CK. Factors associated with errors in death certificate completion. A national study in Taiwan. J Clin Epidemiol 2001; 54(3):232-238. (213) Berrill WT. Trends in asthma mortality. Death certification in asthma is inaccurate. BMJ 1997; 315(7114):1013. (214) Goldacre MJ, Roberts SE, Griffith M. Multiple-cause coding of death from myocardial infarction: population-based study of trends in death certificate data. J Public Health Med 2003; 25(1):69-71.
348
Literatuur
(215) Israel RA, Rosenberg HM, Curtin LR. Analytical potential for multiple cause-ofdeath data. Am J Epidemiol 1986; 124(2):161-179. (216) Fries JF. Aging, natural death, and the compression of morbidity. N Engl J Med 1980; 303(3):130-135. (217) Ayeni O, Banoub SN, Denton CF, Grimley-Evans J, Gore MS, Kalache A et al. Applications de l'épidémiologie à l'étude du vieilissement. Rapport d'un Groupe scientifique de l'OMS à l'étude du viellissement. 706, 1-93. 1984. Genève, OMS. Rapports techniques. (218) Epstein AM. Volume and outcome--it is time to move ahead. N Engl J Med 2002; 346(15):1161-1164. (219) Dorn HF, Moriyama IM. Uses and significance of multiple cause tabulations for mortality statistics. Am J Public Health 1964; 54:400-406. (220) Steenland K, Nowlin S, Ryan B, Adams S. Use of multiple-cause mortality data in epidemiologic analyses: US rate and proportion files developed by the National Institute for Occupational Safety and Health and the National Cancer Institute. Am J Epidemiol 1992; 136(7):855-862. (221) Mackenbach JP. Secundaire doodsoorzaken. Gezondheidszorg 1987; 65:524-528.
Tijdschrift
voor
Sociale
(222) Mackenbach JP, Kunst AE, Lautenbach H, Bijlsma F, Oei YB. Competing causes of death: an analysis using multiple-cause-of- death data from The Netherlands. Am J Epidemiol 1995; 141(5):466-475. (223) Mackenbach JP, Kunst AE, Lautenbach H, Oei YB, Bijlsma F. Competing causes of death: a death certificate study. J Clin Epidemiol 1997; 50(10):10691077. (224) Dorn HF. Underlying and Contributory Causes of Death. Natl Cancer Inst Monogr 1966; 19:421-430. (225) Guralnick L. Some Problems in the Use of Multiple Causes of Death. J Chronic Dis 1966; 19:979-990. (226)
An Alternative Procedure for Classifying and Analizing Mortality Data. LIEGE: International Union for the Scientific Study of Populations; 1973.
(227) Schadé E, Ijzermans CJ. Hoe informeert de huisarts het Centraal Bureau Statistiek over de doodsoorzaak? Tijdschrift voor Sociale Gezondheidszorg 1987; 65(3):74-78.
Literatuur
349
(228) Crews DE, Stamler J, Dyer A. Conditions other than underlying cause of death listed on death certificates provide additional useful information for epidemiologic research. Epidemiology 1991; 2(4):271-275. (229) Anderson RN, Minino AM, Hoyert DL, Rosenberg HM. Comparability of cause of death between ICD-9 and ICD-10: preliminary estimates. Natl Cancer Inst Monogr 2001; 49(2):1-32. (230) Llorca J, Delgado-Rodriguez M. Competing risks analysis using Markov chains: impact of cerebrovascular and ischaemic heart disease in cancer mortality. Int J Epidemiol 2001; 30(1):99-101. (231) WHO. Definitions and Recommandations. In: WHO, editor. International Classification of Diseases. 1975 Revision. 9th Revision. ed. WHO; 1977. 763768. (232) WHO. Medical Certification and Rules for Classification. In: WHO, editor. International Classification of Diseases. 1975 Revision. 9th Revision. ed. WHO; 1977. 697-741. (233) WHO. Rules and guidelines for mortality and morbidity coding. In: WHO, editor. International Statistical Classification of Diseases and Related Health Problems. Tenth Revision. 10th Revision. ed. Geneva: WHO; 1993. 30-123. (234) Anderson RN, Rosenberg HM. Disease classification: measuring the effect of the Tenth Revision of the International Classification of Diseases on cause- ofdeath data in the United States. Stat Med 2003; 22(9):1551-1570. (235) Jougla E, Papoz L, Balkau B, Maguin P, Hatton F. Death certificate coding practices related to diabetes in European countries--the 'EURODIAB Subarea C' Study. Int J Epidemiol 1992; 21(2):343-351. (236)
New approaches to Coding and Analyzing Mortality Data. American Statistical Association; 1972.
(237) Lu TH. Using ACME (Automatic Classification of Medical Entry) software to monitor and improve the quality of cause of death statistics. J Epidemiol Community Health 2003; 57(6):470-471. (238) Kelson MC, Heller RF. The effect of death certification and coding practices on observed differences in respiratory disease mortality in 8 E.E.C. countries. Rev Epidemiol Sante Publique 1983; 31(4):423-432. (239) Kelson M, Farebrother M. The effect of inaccuracies in death certification and coding practices in the European Economic Community (EEC) on international cancer mortality statistics. Int J Epidemiol 1987; 16(3):411-414.
350
Literatuur
(240) Heller RF, Kelson MC. Respiratory disease Mortality in Agricultural workers in eight member countries of the European community. Int J Epidemiol 1982; 11(2):170-174. (241) Percy C, Dolman A. Comparison of the coding of death certificates related to cancer in seven countries. Public Health Rep 1978; 93(4):335-350. (242)
An assessment of the contribution of differences in coding and certification practices to reported levels of avoidable deaths in the European Community. EC Workshop on Health Services on Avoidable Mortality; 1988.
(243) Kircher T, Nelson J, Burdo H. The autopsy as a measure of accuracy of the death certificate. N Engl J Med 1985; 313(20):1263-1269. (244) Gittelsohn A, Senning J. Studies on the reliability of vital and health records: I. Comparison of cause of death and hospital record diagnoses. Am J Public Health 1979; 69(7):680-689. (245) Percy C, Stanek E, Gloeckler L. Accuracy of cancer death certificates and its effect on cancer mortality statistics. Am J Public Health 1981; 71(3):242-250. (246) Feinleib M, editor. Causes of Death Among the Elderly.Information From the Death Certificate. Hyattsville,MD: NCHS; 1991. (247) Chio A, Magnani C, Oddenino E, Tolardo G, Schiffer D. Accuracy of death certificate diagnosis of amyotrophic lateral sclerosis. J Epidemiol Community Health 1992; 46(5):517-518. (248) Flanders WD. Inaccuracies of death certificate information. Epidemiology 1992; 3(1):3-5. (249) Lloyd-Jones DM, Martin DO, Larson MG, Levy D. Accuracy of death certificates for coding coronary heart disease as the cause of death. Ann Intern Med 1998; 129(12):1020-1026. (250) Lozano R, Murray CJL, Lopez AD, Satoh T. Miscoding and misclassification of ischaemic heart disease mortality. Working Paper No.12, 1-19. 2001. World Health Organisation. Global Programme on Evidence for Health Policy. (251) Iribarren C, Crow RS, Hannan PJ, Jacobs DR, Luepker RV. Validation of death certificate diagnosis of out-of-hospital sudden cardiac death. Am J Cardiol 1998; 82(1):50-53. (252) Ederer F, Geisser MS, Mongin SJ, Church TR, Mandel JS. Colorectal cancer deaths as determined by expert committee and from death certificate: a comparison. The Minnesota Study. J Clin Epidemiol 1999; 52(5):447-452.
Literatuur
351
(253) Goldacre MJ, Roberts SE, Yeates D. Mortality after admission to hospital with fractured neck of femur: database study. BMJ 2002; 325(7369):868-869. (254) Klazinga NS, Stronks K, Delnoij DMJ, Verhoeff A. Indicators without a cause. Reflections on the development and use of indicators in health care from a public health perspective. Int J Qual Health Care 2001; 13(6):433-438. (255) Gittelsohn A, Powe NR. Small area variations in health care delivery in Maryland. Health Serv Res 1995; 30(2):295-317. (256) Lubetkin EI, Sofaer S, Gold MR, Berger ML, Murray JF, Teutsch SM. Aligning quality for populations and patients: do we know which way to go? Am J Public Health 2003; 93(3):406-411. (257) Donabedian A. The quality of care. How can it be assessed? JAMA 1988; 260(12):1743-1748. (258) Weingart SN, Iezzoni LI, Davis RB, Palmer RH, Cahalane M, Hamel MB et al. Use of administrative data to find substandard care: validation of the complications screening program. Med Care 2000; 38(8):796-806. (259) Lohr KN, Schroeder SA. A strategy for quality assurance in Medicare. N Engl J Med 1990; 322(10):707-712. (260) AHRQ. NHQR Preliminary Measure Set. Establish conceptual framework. 2003. http://www.ahcpr.gov/qual/measurix.htm. (261) Quaethoven P. Over klinische performantie-indicatoren. Acta Hospitalia 2003;(1):87-106. (262) Public Health Development Unit. Quality and performance in the NHS:Clinical Indicators. 1-90. 1999. http://www.doh.gov.uk/nhsci.pdf, NHS. (263) Campbell SM, Braspenning J, Hutchinson A, Marshall MN. Research methods used in developing and applying quality indicators in primary care. BMJ 2003; 326(7393):816-819. (264) Arah OA, Klazinga NS, Delnoij DM, ten Asbroek AH, Custers T. Conceptual frameworks for health systems performance: a quest for effectiveness, quality, and improvement. Int J Qual Health Care 2003; 15(5):377-398. (265) Donabedian A. The seven Pillars of Quality. Arch Pathol Lab Med 1990; 114:1115-1118. (266) Brook RH. Managed care is not the problem, quality is. JAMA 1997; 278(19):1612-1614.
352
Literatuur
(267) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496. (268) AHRQ. 2005 National Healthcare Quality Report. 06-0018, 1-95. 2005. Rockville, MD. (269) Pringle M, Wilson T, Grol R. Measuring "goodness" in individuals and healthcare systems. BMJ 2002; 325(7366):704-707. (270) Fiscella K, Franks P, Gold MR, Clancy CM. Inequality in quality: addressing socioeconomic, racial, and ethnic disparities in health care. JAMA 2000; 283(19):2579-2584. (271) Shine KI. Health care quality and how to achieve it. Acad Med 2002; 77(1):9199. (272) Chassin MR, Galvin RW, National Roundtable on Heath Care Quality. The Urgent Need to Improve Health Care Quality. JAMA 1998; 280(11):1000-1005. (273) Weiss KB, Wagner R. Performance measurement through audit, feedback, and profiling as tools for improving clinical care. Chest 2000; 118(2 Suppl):53S58S. (274) Topol EJ, Califf RM. Scorecard and Cardiovascular Medicine Its Impact and Future Directions. Ann Intern Med 1994; 120(1):65-70. (275) Localio AR, Hamory BH, Fisher AC, TenHave TR. The Public Release of Hospital and Physician Mortality Data in Pennsylvania A Case Study. Med Care 1997; 35(3):272-286. (276) Quality of care. Council on Medical Service. JAMA 1986; 256(8):1032-1034. (277) Jencks SF, Cuerdon T, Burwen DR, Fleming B, Houck PM, Kussmaul AE et al. Quality of medical care delivered to Medicare beneficiaries: A profile at state and national levels. JAMA 2000; 284(13):1670-1676. (278) Health Care Systems in Transition. Belgium 2000. 1-85. 2000. Copenhagen, European Observatory on Health Car Systems. (279) Hayward RA, Hofer TP. Estimating hospital deaths due to medical errors: preventability is in the eye of the reviewer. JAMA 2001; 286(4):415-420. (280) McGlynn EA, Asch SM, Adams J, Keesey J, Hicks J, DeCristofaro A et al. The quality of health care delivered to adults in the United States. N Engl J Med 2003; 348(26):2635-2645.
Literatuur
353
(281) Meyer GS. Building the bridge across the quality chasm. Bulletin of th world Health Organization 2003; 81(5):313. (282) McLoughlin V, Leatherman S, Fletcher M, Owen JW. Improving performance using indicators. Recent experiences in the United States, the United Kingdom, and Australia. Int J Qual Health Care 2001; 13(6):455-462. (283) Wu AW. The measure and mismeasure of hospital quality: appropriate riskadjustment methods in comparing hospitals. Ann Intern Med 1995; 122(2):149150. (284) Richardson WC, Berwick DM, Bisgard JC, Bristow LR, Buck CR, Cassel CK et al. The Institute of Medicine Report on Medical Errors: misunderstanding can do harm. Quality of Health Care in America Committee. MedGenMed 2000; 2(3):E42. (285) Fihn SD. The quest to quantify quality. JAMA 2000; 283(13):1740-1742. (286) Leyland AH, Boddy FA. League tables and acute myocardial infarction. Lancet 1998; 351(9102):555-558. (287) Giuffrida A, Gravelle H, Roland M. Measuring quality of care with routine data: avoiding confusion between performance indicators and health outcomes. BMJ 1999; 319(7202):94-98. (288) Cleary PD, Edgman-Levitan S. Health care quality. Incorporating consumer perspectives. JAMA 1997; 278(19):1608-1612. (289) Califf RM, Jollis JG, Peterson ED. Operator-Specific Outcomes A Call to Professional Responsibility. Circulation 1996; 93:403-406. (290) Zhan C, Miller MR. Administrative data based patient safety research: a critical review. Qual Saf Health Care 2003; 12 Suppl 2:ii58-ii63. (291) Arah OA, Klazinga NS. How safe is the safety paradigm? Qual Saf Health Care 2004; 13(3):226-232. (292) Bates DW, Evans RS, Murff H, Stetson PD, Pizziferri L, Hripcsak G. Detecting adverse events using information technology. J Am Med Inform Assoc 2003; 10(2):115-128. (293) Begrippenkader Patientveiligheid. 2005. http://www.onderzoekpatientveiligheid.nl/begrippenkader.htm (294) Hammermeister KE, Shroyer AL, Sethi GK, Grover FL. Why it is important to demonstrate linkages between outcomes of care and processes and structures of care. Med Care 1995; 33(10 Suppl):OS5-O16.
354
Literatuur
(295) Mainz J. Defining and classifying clinical indicators for quality improvement. Int J Qual Health Care 2003; 15(6):523-530. (296) Kuttner R. The risk-adjustment debate. N Engl J Med 1998; 339(26):1952-1956. (297) Brook RH, McGlynn EA, Cleary PD. Quality of health care. Part 2: measuring quality of care. N Engl J Med 1996; 335(13):966-970. (298) Tu JV, Cameron C. Impact of an acute myocardial infarction report card in Ontario, Canada. Int J Qual Health Care 2003; 15(2):131-137. (299) Palmer RH. Using health outcomes data to compare plans, networks and providers. Int J Qual Health Care 1998; 10(6):477-483. (300) Rubin HR, Pronovost P, Diette GB. The advantages and disadvantages of process-based measures of health care quality. Int J Qual Health Care 2001; 13(6):469-474. (301) Jollis JG, Romano PS. Pennsylvania's Focus on Heart Attack--grading the scorecard. N Engl J Med 1998; 338(14):983-987. (302) Begg CB, Cramer LD, Hoskins WJ, Brennan MF. Impact of hospital volume on operative mortality for major cancer surgery. JAMA 1998; 280(20):1747-1751. (303) Hannan EL, Siu AL, Kumar D, Kilburn H, Chassin MR. The decline in coronary artery bypass graft surgery mortality in New York State. The role of surgeon volume. JAMA 1995; 273(3):209-213. (304) Dudley RA, Johansen KL, Brand R, Rennie DJ, Milstein A. Selective referral to high-volume hospitals: estimating potentially avoidable deaths. JAMA 2000; 283(9):1159-1166. (305) Wennberg DE, Lucas FL, Birkmeyer JD, Bredenberg CE, Fisher ES. Variation in carotid endarterectomy mortality in the Medicare population: trial hospitals, volume, and patient characteristics. JAMA 1998; 279(16):1278-1281. (306) Luft HS, Hunt SS, Maerki SC. The volume-outcome relationship: practicemakes-perfect or selective-referral patterns? Health Serv Res 1987; 22(2):157182. (307) Hannan EL, Racz M, Ryan TJ, McCallister BD, Johnson LW, Arani DT et al. Coronary angioplasty volume-outcome relationships for hospitals and cardiologists. JAMA 1997; 277(11):892-898. (308) Cebul RD, Snow RJ, Pine R, Hertzer NR, Norris DG. Indications, outcomes, and provider volumes for carotid endarterectomy. JAMA 1998; 279(16):1282-1287.
Literatuur
355
(309) Luft HS, Garnick DW, Mark DH, Peltzman DJ, Phibbs CS, Lichtenberg E et al. Does quality influence choice of hospital? JAMA 1990; 263(21):2899-2906. (310) Birkmeyer JD, Siewers AE, Finlayson EV, Stukel TA, Lucas FL, Batista I et al. Hospital volume and surgical mortality in the United States. N Engl J Med 2002; 346(15):1128-1137. (311) Begg CB, Riedel ER, Bach PB, Kattan MW, Schrag D, Warren JL et al. Variations in morbidity after radical prostatectomy. N Engl J Med 2002; 346(15):1138-1144. (312) Halm EA, Chassin MR. Appendix C. How is volume related to quality in health care? A systematic review of the research literature. In: Hewitt M, editor. Interpreting the Volume-Outcome Relationship in the Context of Health care Quality: Workshop Summary. Washington,DC: National Academy Press; 2000. 27-102. (313) Localio AR, Hamory BH, Sharp TJ, Weaver SL, TenHave TR, Landis JR. Comparing hospital mortality in adult patients with pneumonia. A case study of statistical methods in a managed care program. Ann Intern Med 1995; 122(2):125-132. (314) Showstack JA, Rosenfeld KE, Garnick DW, Luft HS, Schaffarzick RW, Fowles J. Association of volume with outcome of coronary artery bypass graft surgery. Scheduled vs nonscheduled operations. JAMA 1987; 257(6):785-789. (315) Pennsylvania Health Care Cost Containment Council. Focus on Heart Attack in Southeastern Pennsylvania. A 1993 Summary Report for Health Benefits Purchasers, Health Care Providers, Policy-makers and Consumers. 1-75. 1996. http://www.phc4.org/adobe/h_se.pdf. (316) Orchard C. Comparing healthcare outcomes. BMJ 1994; 308(6942):1493-1496. (317) Jarman B, Gault S, Alves B, Hider A, Dolan S, Cook A et al. Explaining differences in English hospital death rates using routinely collected data. BMJ 1999; 318(7197):1515-1520. (318) Stark J, Gallivan S, Lovegrove J, Hamilton JR, Monro JL, Pollock JC et al. Mortality rates after surgery for congenital heart defects in children and surgeons' performance. Lancet 2000; 355(9208):1004-1007. (319) Park RE, Brook RH, Kosecoff J, Keesey J, Rubenstein L, Keeler E et al. Explaining variations in hospital death rates. Randomness, severity of illness, quality of care. JAMA 1990; 264(4):484-490. (320)
Interpreting the Volume-Outcome Relationship in the Context of Health Care Quality: Workshop Summary. Washington,DC: National Academy Press; 2000.
356
Literatuur
(321) Goldfarb MG, Coffey RM. Change in the Medicare case-mix index in the 1980s and the effect of the prospective payment system. Health Serv Res 1992; 27(3):385-415. (322) Majeed A, Bindman AB, Weiner JP. Use of risk adjustment in setting budgets and measuring performance in primary care II: advantages, disadvantages, and practicalities. BMJ 2001; 323(7313):607-610. (323) Greenfield S, Aronow HU, Elashoff RM, Watanabe D. Flaws in mortality data. The hazards of ignoring comorbid disease. JAMA 1988; 260(15):2253-2255. (324) Elixhauser A, Steiner C, Harris DR, Coffey RM. Comorbidity measures for use with administrative data. Med Care 1998; 36(1):8-27. (325) D'Hoore W, Sicotte C, Tilquin C. Risk adjustment in outcome assessment: the Charlson comorbidity index. Methods Inf Med 1993; 32(5):382-387. (326) D'Hoore W, Bouckaert A, Tilquin C. Practical considerations on the use of the Charlson comorbidity index with administrative data bases. J Clin Epidemiol 1996; 49(12):1429-1433. (327) Stukenborg GJ, Wagner DP, Connors_ AF. Comparison of the performance of two comorbidity measures, with and without information from prior hospitalizations. Med Care 2001; 39(7):727-739. (328) Cleary R, Beard R, Coles J, Devlin B, Hopkins A, Schumacher D et al. Comparative hospital databases: value for management and quality. Qual Health Care 1994; 3(1):3-10. (329) Hofer TP, Hayward RA, Greenfield S, Wagner EH, Kaplan SH, Manning WG. The unreliability of individual physician "report cards" for assessing the costs and quality of care of a chronic disease. JAMA 1999; 281(22):2098-2105. (330) Luft HS, Bunker JP, Enthoven AC. Should operations be regionalized? The empirical relation between surgical volume and mortality. N Engl J Med 1979; 301(25):1364-1369. (331) Hartz AJ, Krakauer H, Kuhn EM, Young M, Jacobsen SJ, Gay G et al. Hospital characteristics and mortality rates. N Engl J Med 1989; 321(25):1720-1725. (332) Mozes B, Easterling MJ, Sheiner LB, Melmon KL, Kline R, Goldman ES et al. Case-mix adjustment using objective measures of severity: the case for laboratory data. Health Serv Res 1994; 28(6):689-712. (333) Pine M, Norusis M, Jones B, Rosenthal GE. Predictions of hospital mortality rates: a comparison of data sources. Ann Intern Med 1997; 126(5):347-354.
Literatuur
357
(334) Welton JM, Halloran EJ. A comparison of nursing and medical diagnoses in predicting hospital outcomes. Proc AMIA Symp 1999;171-175. (335) Long LE, Mann R. Casemix: challenges for nursing care. Med J Aust 1998; 169 Suppl:S44-S45. (336) Hsia DC, Krushat WM, Fagan AB, Tebbutt JA, Kusserow RP. Accuracy of diagnostic coding for Medicare patients under the prospective-payment system. N Engl J Med 1988; 318(6):352-355. (337) Stern RS, Epstein AM. Institutional responses to prospective payment based on diagnosis-related groups. Implications for cost, quality, and access. N Engl J Med 1985; 312(10):621-627. (338) Lungen M, Lauterbach KW. [Upcoding--a risk for the use of diagnosis-related groups]. Dtsch Med Wochenschr 2000; 125(28-29):852-856. (339) Carr-Hill RA, Jamison JQ, O Reilly D, Stevenson MR, Reid J, Merriman B. Risk adjustment for hospital use using social security data: cross sectional small area analysis. BMJ 2002; 324(7334):390. (340) Elliott MN, Swartz R, Adams J, Spritzer KL, Hays RD. Case-mix adjustment of the National CAHPS benchmarking data 1.0: a violation of model assumptions? Health Serv Res 2001; 36(3):555-573. (341) Steyerberg EW, Harrell FEJr. Statistical Models for Prognostication. Development of Regression Models. In: Max MB, Lynn J, editors. Interactive Textbook of Symptom Research. Bethesda MD: National Institute of Dental Research, Department of Health and Human Services.http://symptomresearch.nih.gov; 2003. 1-12. (342) DeLong ER, Peterson ED, DeLong DM, Muhlbaier LH, Hackett S, Mark DB. Comparing Risk-Adjustment Methods for Provider Profiling. Stat Med 1997; 16:2645-2664. (343) Iezzoni LI, Ash AS, Shwartz M, Daley J, Hughes JS, Mackiernan YD. Judging hospitals by severity-adjusted mortality rates: the influence of the severityadjustment method. Am J Public Health 1996; 86(10):1379-1387. (344) Schneider EC, Epstein AM. Influence of cardiac-surgery performance reports on referral practices and access to care. A survey of cardiovascular specialists. N Engl J Med 1996; 335(4):251-256. (345) Mainz J. Developing evidence-based clinical indicators: a state of the art methods primer. Int J Qual Health Care 2003; 15 Suppl 1:i5-11.
358
Literatuur
(346) Caminal J, Starfield B, Sanchez E, Casanova C, Morales M. The role of primary care in preventing ambulatory care sensitive conditions. Eur J Public Health 2004; 14(3):246-251. (347) Smeets PM, Verheggen FW, Pop P, Panis LJ, Carpay JJ. Assessing the necessity of hospital stay by means of the appropriateness evaluation protocol: how strong is the evidence to proceed? Int J Qual Health Care 2000; 12(6):483-493. (348) Hofer TP, Kerr EA, Hayward RA. What is an error? Eff Clin Pract 2000; 3(6):261-269. (349) Hofer TP, Asch SM, Hayward RA, Rubenstein LV, Adams J, Kerr EA. Profiling quality of care: Is there a role for peer review? BMC Health Services Research 2004; 4(1):9. (350) Brennan TA, Leape LL, Laird NM, Hebert L, Localio AR, Lawthers AG et al. Incidence of adverse events and negligence in hospitalized patients. Results of the Harvard Medical Practice Study I. N Engl J Med 1991; 324(6):370-376. (351) Wilson RM, Harrison BT, Gibberd RW, Hamilton JD. An analysis of the causes of adverse events from the Quality in Australian Health Care Study. Med J Aust 1999; 170(9):411-415. (352) Leape LL. Institute of Medicine medical error figures are not exaggerated. JAMA 2000; 284(1):95-97. (353) Hannan EL, O'Donnell JF, Kilburn H, Bernard HR, Yazici A. Investigation of the relationship between volume and mortality for surgical procedures performed in New York State hospitals. JAMA 1989; 262(4):503-510. (354) Chassin MR, Hannan EL, DeBuono BA. Benefits and hazards of reporting medical outcomes publicly. N Engl J Med 1996; 334(6):394-398. (355) Halm EA, Lee C, Chassin MR. Is volume related to outcome in health care? A systematic review and methodologic critique of the literature. Ann Intern Med 2002; 137(6):511-520. (356) Urbach DR, Bell CM, Austin PC. Differences in operative mortality between high- and low-volume hospitals in Ontario for 5 major surgical procedures: estimating the number of lives potentially saved through regionalization. CMAJ 2003; 168(11):1409-1414. (357) Urbach DR, Baxter NN. Does it matter what a hospital is "high volume" for? Specificity of hospital volume-outcome associations for surgical procedures: analysis of administrative data. BMJ 2004; 328(7442):737-740. (358) Sibbald B. Move to close low-volume surgical sites gaining speed. CMAJ 2002; 167(2):177.
Literatuur
359
(359) Shroyer AL, Marshall G, Warner BA, Johnson RR, Guo W, Grover FL et al. No continuous relationship between Veterans Affairs hospital coronary artery bypass grafting surgical volume and operative mortality. Ann Thorac Surg 1996; 61(1):17-20. (360) Tucker J. Patient volume, staffing, and workload in relation to risk- adjusted outcomes in a random stratified sample of UK neonatal intensive care units: a prospective evaluation. Lancet 2002; 359(9301):99-107. (361) Benavente O, Moher D, Pham B. Carotid endarterectomy for asymptomatic carotid stenosis: a meta- analysis. BMJ 1998; 317(7171):1477-1480. (362) Warlow C. Carotid endarterectomy for asymptomatic carotid stenosis. Better data, but the case is still not convincing. BMJ 1998; 317(7171):1468. (363) Barnett HJ, Meldrum HE, Eliasziw M. The appropriate use of carotid endarterectomy. CMAJ 2002; 166(9):1169-1179. (364) Wennberg DE. Variation in the delivery of health care: the stakes are high. Ann Intern Med 1998; 128(10):866-868. (365) Pekoz EA, Shwartz M, Iezzoni LI, Ash AS, Posner MA, Restuccia JD. Comparing the importance of disease rate versus practice style variations in explaining differences in small area hospitalization rates for two respiratory conditions. Stat Med 2003; 22(10):1775-1786. (366) Jencks SF, Williams DK, Kay TL. Assessing hospital-associated deaths from discharge data. The role of length of stay and comorbidities. JAMA 1988; 260(15):2240-2246. (367) Rosenthal GE, Baker DW, Norris DG, Way LE, Harper DL, Snow RJ. Relationships between in-hospital and 30-day standardized hospital mortality: implications for profiling hospitals. Health Serv Res 2000; 34(7):1449-1468. (368) Taylor B. Common bile duct injury during laparoscopic cholecystectomy in Ontario: does ICD-9 coding indicate true incidence? CMAJ 1998; 158(4):481485. (369) Chang A, Schyve PM, Croteau RJ, O'Leary DS, Loeb JM. The JCAHO patient safety event taxonomy: a standardized terminology and classification schema for near misses and adverse events. Int J Qual Health Care 2005; 17(2):95-105. (370) Walshe K. Adverse events in health care: issues in measurement. Qual Health Care 2000; 9:47-52. (371) Michel P, Quenon JL, de_Sarasqueta AM, Scemama O. Comparison of three methods for estimating rates of adverse events and rates of preventable adverse events in acute care hospitals. BMJ 2004; 328(7433):199.
360
Literatuur
(372) Leape LL, Brennan TA, Laird N, Lawthers AG, Localio AR, Barnes BA et al. The nature of adverse events in hospitalized patients. Results of the Harvard Medical Practice Study II. N Engl J Med 1991; 324(6):377-384. (373) Thomas EJ, Brennan TA. Incidence and types of preventable adverse events in elderly patients: population based review of medical records. BMJ 2000; 320(7237):741-744. (374) Sox_Jr HC, Woloshin S. How many deaths are due to medical error? Getting the number right. Eff Clin Pract 2004; 3(6):277-283. (375) McDonald CJ, Weiner M, Hui SL. Deaths due to medical errors are exaggerated in Institute of Medicine report. JAMA 2000; 284(1):93-95. (376) Anderson RE. How many deaths are due to medical errors? JAMA 2000; 284(17):2188; author reply 2. (377) Hayward RA. Counting deaths due to medical errors. JAMA 2002; 288(19):2404-5; author reply 2405. (378) McDonald CJ, Weiner M, Siu AL. How many deaths are due to medical errors? JAMA 2000; 284(17):2188; author reply 2-2189; author reply 2. (379) Leape LL. Counting deaths due to medical errors. JAMA 2002; 288(19):2405; author reply 2. (380) Barach P, Mohr JJ. Preventable deaths from medical errors. JAMA 2001; 286(22):2813-2814. (381) Hayward RA, Hofer TP. Preventable deaths from medical errors. In reply. JAMA 2001; 286(22):2814. (382) Hughes CM. How many deaths are due to medical errors? JAMA 2000; 284(17):2187; author reply 2. (383) Gabel RA. Counting deaths due to medical errors. JAMA 2002; 288(19):2404; author reply 2. (384) Honig P, Phillips J, Woodcock J. How many deaths are due to medical errors? JAMA 2000; 284(17):2187-8; author reply 2188. (385) Pierluissi E, Fischer MA, Campbell AR, Landefeld CS. Discussion of medical errors in morbidity and mortality conferences. JAMA 2003; 290(21):2838-2842. (386) Brennan TA, Hebert LE, Laird NM, Lawthers A, Thorpe KE, Leape LL et al. Hospital characteristics associated with adverse events and substandard care. JAMA 1991; 265(24):3265-3269.
Literatuur
361
(387) Weingart SN, Wilson RM, Gibberd RW, Harrison B. Epidemiology of medical error. BMJ 2000; 320(7237):774-777. (388) Spear SJ, Schmidhofer M. Ambiguity and workarounds as contributors to medical error. Ann Intern Med 2005; 142(8):627-630. (389) Romano PS, Geppert JJ, Davies S, Miller MR, Elixhauser A, McDonald KM. A national profile of patient safety in U.S. hospitals. Health Aff (Millwood ) 2003; 22(2):154-166. (390) Bates DW, Evans RS, Murff H, Stetson PD, Pizziferri L, Hripcsak G. Policy and the future of adverse event detection using information technology. J Am Med Inform Assoc 2003; 10(2):226-228. (391) Pawlson LG, O'Kane ME. Malpractice prevention, patient safety, and quality of care: a critical linkage. Am J Manag Care 2004; 10(4):281-284. (392) Shahian DM, Normand SL, Torchiana DF, Lewis SM, Pastore JO, Kuntz RE et al. Cardiac Surgery Report Cards: Comprehensive Review and Statistical Critique. Ann Thorac Surg 2001; 72:2155-2168. (393) Berwick DM. Public Performance Reports and the Will for Change. JAMA 2002; 288(12):1523-1524. (394) Adab P, Rouse AM, Mohammed MA, Marshall T. Performance league tables: the NHS deserves better. BMJ 2002; 324(7329):95-98. (395) Sanderson C, McKee M. Commentary: How robust are rankings? The implications of confidence intervals. BMJ 1998; 316:1705. (396) Marshall EC, Spiegelhalter DJ. Reliability of league tables of in vitro fertilisation clinics: retrospective analysis of live birth rates. BMJ 1998; 316(7146):1701-4; discussion 1705. (397) Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public release of performance data: what do we expect to gain? A review of the evidence. JAMA 2000; 283(14):1866-1874. (398) Hibbard JH, Slovic P, Peters E, Finucane ML. Strategies for reporting health plan performance information to consumers: evidence from controlled studies. Health Serv Res 2002; 37(2):291-313. (399) Wakefield JC, Best NG, Waller L. Bayesian approaches to disease mapping. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 104-127. (400) Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public disclosure of performance data: learning from the US experience. Qual Health Care 2000; 9:53-57.
362
Literatuur
(401) Bronskill SE, Normand SL, Landrum MB, Rosenheck RA. Longitudinal profiles of health care providers. Stat Med 2002;(21):1067-1088. (402) Schneider EC, Lieberman T. Publicly disclosed information about the quality of health care: response of the US public. Qual Health Care 2001; 10:96-103. (403) Howley PP, Gibberd R. Using hierarchical models to analyse clinical indicators: a comparison of the gamma-Poisson and beta-binomial models. Int J Qual Health Care 2003; 15(4):319-329. (404) McCormick D, Himmelstein DU, Woolhandler S, Bor DH, Wolfe SM. Relationship Between Low Quality-of-Care Scores and HMOs' Subsequent Public Disclosure of Quality-of-Care Scores. JAMA 2002; 288(12):1484-1490. (405) Epstein A. Performance reports on quality--prototypes, problems, and prospects. N Engl J Med 1995; 333(1):57-61. (406) McCormick D, Himmelstein DU, Woolhandler S, Bor DH, Wolfe SM. Public disclosure of health plan quality of care. JAMA 2003; 289(7):845-847. (407) McKee M. Indicators of clinical performance. BMJ 1997; 315(7101):142. (408) Ravaud P, Giraudeau B, Roux PM, Durieux P. [Are mortality indicators acceptable indicators for the quality of health care?]. Presse Med 1999; 28(29):1604-1609. (409) Naylor CD. Public Profiling of Clinical Performance. JAMA 2002; 287(10):1323-1325. (410) Peterson ED, DeLong ER, Jollis JG, Muhlbaier LH, Mark DB. The Effects of New York's Bypass Surgery Provider Profiling on Access to Care and Patient Outcomes in the Elderly. J Am Coll Cardiol 1998; 32:993-999. (411) Kassirer JP. The use and abuse of practice profiles. N Engl J Med 1994; 330(9):634-636. (412) Jones RH. In Search of the Optimal Surgical Mortality. Circulation 1989; 79(Suppl I):I-132-I-136. (413) Schokkaert E, Van de Voorde C. Belgium: Risk adjustment and financial responsibility in a centralised system. Health Policy 2003; 65(1):5-19. (414) Pennsylvania Health Care Cost Containment Council. Focus on Heart Attack in Pennsylvania. Research Methods and Results. 1-36. 1996. http://www.phc4.org/adobe/fhrrm.pdf.
Literatuur
363
(415) Hibbard JH, Jewett JJ, Engelmann S, Tusler M. Can Medicare Beneficiaries Make Informed Choices? Health Aff (Millwood) 1998; 17(6):181-193. (416) Mannion R, Goddard M. Impact of published clinical outcomes data: case study in NHS hospital trusts. BMJ 2001; 323(7307):260-263. (417) Ryan TP. Control Charts for Measurements with Subgrouping (for One Variable). In: Ryan TP, editor. Statistical Methods for Quality Improvement. New York: John Wiley & Sons; 2000. 77-132. (418) Johnson RA, Wichern DW. Applied Multivariate Statistical Analysis. Upper Saddle River, NJ: Prentice Hall; 1998. (419) Tekkis PP, McCulloch P, Steger AC, Benjamin IS, Poloniecki JD. Mortality control charts for comparing performance of surgical units: validation study using hospital mortality data. BMJ 2003; 326(7393):786-788. (420) Mohammed MA, Cheng KK, Rouse A, Marshall T. Bristol, Shipman, and clinical governance: Shewhart's forgotten lessons. Lancet 2001; 357(9254):463467. (421) Ryan TP. Control Charts for Attributes. In: Ryan TP, editor. Statistical Methods for Quality Improvement. New York: John Wiley & Sons; 2000. 152-185. (422) Hoey J, Todkill AM, Flegel K. What's in a name? Reporting data from public institutions. CMAJ 2002; 166(2):193-194. (423) Christiansen CL, Morris CN. Improving the Statistical Approach to Health Care Provider Profiling. Ann Intern Med 1997;(127):764-768. (424) Brook RH. Appropriateness: the next frontier. BMJ 1994; 308(6923):218-219. (425) Aylin P, Alves B, Best N, Cook A, Elliott P, Evans SJ et al. Comparison of UK paediatric cardiac surgical performance by analysis of routinely collected data 1984-96: was Bristol an outlier? Lancet 2001; 358(9277):181-187. (426) Walshe K. Understanding and learning from organisational failure. Qual Saf Health Care 2003; 12:81-82. (427) Littell RC, Freund RJ, Spector PC. Repeated-Measures Analysis of Variance. SAS® System for Linear Models. Third ed. Cary,NC: SAS® Institute Inc.; 1991. 265-291. (428) Verbeke G, Molenberghs G. Linear Mixed Models in Practice: A Sas-oriented Approach. New York: Springer-verlag.; 1997. (429) Molenberghs G, Verbeke G. Generalized Estimating Equations. Longitudinal data analysis. Diepenbeek: Limburgs Universitair Centrum; 2002. 336-363.
364
Literatuur
(430) Burton P, Gurrin L, Sly P. Extending the simple linear regression model to account for correlated responses: an introduction to generalized estimating equations and multi-level mixed modelling. Stat Med 1998; 17(11):1261-1291. (431) Stokes ME, Davis CS, Koch GG. Generalized Estimating Equations. Categorical Data Analysis Using the SAS System. Second ed. Cary, NC: SAS Institute Inc., 2000. 469-549. (432) Armitage P, Berry G. Comparison of Several Groups. Statistical Methods in Medical Research. Oxford: 1994. 207-237. (433) Neter J, Wasserman W, Kutner MH. Single-factor ANOVA Model and Tests. In: Neter J, Wasserman W, Kutner MH, editors. Applied Linear Statistical Models Regression, Analysis of Variance and Experimental Designs. Third ed. Homewood,IL: IRWIN; 1990. 519-567. (434) Verbeke G, Molenberghs G. Linear Mixed Models for Longitudinal Data. New York: Springer-verlag.; 2000. (435) Molenberghs G, Verbeke G. Models for Discrete Longitudinal Data. New York: Springer-verlag.; 2005. (436) Rosenthal R, Rosnow RL. Contrast analysis: Focused comparisons in the analysis of variance. New York: Cambridge University Press; 1985. (437) Johnson RA, Wichern DW. Inferences about a Mean Vector. Applied Multivariate Statistical Analysis. Upper Saddle River, NJ: Prentice Hall; 1998. 224-289. (438) Armitage P, Berry G. Multiple Measurements. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 312-385. (439) Soudan M. Détection de Valeurs Aberrantes dans les Données Administratives à Variables Multiples Obtenues par Extrapolation, dans le Cadre de la Comptabilité Nationale Belge. CES/AC.68/2002/10, 1-10. 18-2-2002. Genève, Réunion commune CEE/Eurostat/OCDE sur la comptabilité nationale. 18-22002. (440) Friendly M. Multivariate Statistical Methods. SAS System for Statistical Graphics. First ed. SAS Institute Inc., Cary,NC,USA; 1991. 447-498. (441) Hosmer DW, Lemeshow S. Introduction to the Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 1-30.
Literatuur
365
(442) Hosmer DW, Lemeshow S. Interpretation of the Fitted Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 47-90. (443) Collett D. Overdispersion. In: Collett D, editor. Modelling binary data. Boca Raton: Chapman & Hall/CRC; 1991. 188-222. (444) Allison PD. Logit Analysis of Contingency Tables. In: Allison PD, editor. Logistic Regression Using the SAS System: Theory and Application. Cary, NC: SAS Institute Inc., 1999. 81-110. (445) SAS Institute Inc. The GLM Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1465-1636. (446) SAS Institute Inc. The LOGISITC Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1901-2042. (447) SAS Institute Inc. The GENMOD Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1363-1464. (448) Breslow NE, Day NE. Unconditional Logistic Regression for Large Strata. Lyon: IARC; 1980. 191-246. (449) Bland JM, Altman DG. Statistics notes. The odds ratio. BMJ 2000; 320(7247):1468. (450) Armitage P, Berry G. Sampling. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 78-92. (451) Fleiss JL. Inferences about a Single Proportion. Statistical Methods for Rates and Proportions. 2nd ed. New York: John Wiley; 1981. 13-17. (452) Zaslavsky AM. Statistical issues in reporting quality data: small samples and casemix variation. Int J Qual Health Care 2001; 13(6):481-488. (453) Clayton D, Hills M. The size of investigations. In: Clayton D, Hills M, editors. Statistical Models in Epidemiology. Oxford: Oxford University Press; 1993. 205-213. (454) Breslow NE, Day NE. Statistical Methods in Cancer Research. Volume II - The Design and Analysis of Cohort Studies. 1-406. 1987. Lyon, IARC. IARC Scientific Publications No. 82. (455) Marshall G, Shroyer AL, Grover FL, Hammermeister KE. Time series monitors of outcomes. A new dimension for measuring quality of care. Med Care 1998; 36(3):348-356.
366
Literatuur
(456) Wears RL. Performance charts and multiple comparisons. BMJ 2002; bmj.com/cgi/eletters. (457) Clement S. Scorecard Medicine -- Measuring Process and Outcome. Ann Intern Med 1994; 120(11):971-972. (458) Diggle PJ. Overview of statistical methods for disease mapping and its relationship to cluster detection. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 87-103. (459) Burgess JF, Christiansen CL, Michalak SE, Morris CN. Medical profiling: improving standards and risk adjustments using hierarchical models. J Health Econ 2000;(19):291-309. (460) Altman DG, Machin D, Bryant TN, Gardner MJ. Statistics with Confidence. Bristol: BMJ Books; 2000. (461) Luft HS, Brown BWJr. Calculating the Probability of Rare Events: Why Settle for an Approximation? Health Serv Res 1993; 28(4):419-439. (462) Bland JM, Altman DG. Statistics Notes: Regression towards the mean. BMJ 1994; 308(6942):1499. (463) Barnett AG, van der Pols JC, Dobson AJ. Regression to the mean: what it is and how to deal with it. Int J Epidemiol 2005; 34(1):215-220. (464) Bland JM. Regression towards the mean or Why was Terminator III such a disappointment?1-1-2004. (465) Morton V, Torgerson DJ. Effect of regression to the mean on decision making in health care. BMJ 2003; 326(7398):1083-1084. (466) Bland JM, Altman DG. Some examples of regression towards the mean. BMJ 1994; 309(6957):780. (467) Rice N. Binomial Regression. In: Leyland AH, Goldstein H, editors. Multilevel Modelling of Health Statistics. Chichester: John Wiley & Sons, LTD; 2001. 2743. (468) Normand SL, Zou KH. Sample size considerations in observational health care quality studies. Stat Med 2002; 21:331-345. (469) Drijver M, Melse JM. Ziekteclusters en milieuverontreiniging II Inventarisatie van statistische methoden en achtergronden van clusteronderzoek. T Soc Gezondheidsz 1992; 70:624-630.
Literatuur
367
(470) Savitz DA, Olshan AF. Multiple comparisons and related issues in the interpretation of epidemiologic data. Am J Epidemiol 1995; 142(9):904-908. (471) Goodman SN. Multiple comparisons, explained. Am J Epidemiol 1998; 147(9):807-12; discussion 815. (472) Thompson JR. Invited commentary: Re: "Multiple comparisons and related issues in the interpretation of epidemiologic data". Am J Epidemiol 1998; 147(9):801-806. (473) Rothman KJ. Fundamentals of Epidemiologic Data Analysis. In: Rothman KJ, editor. Modern Epidemiology. Boston: Little, Brown and Company; 1986. 131151. (474) Bland JM, Altman DG. Multiple significance tests: the Bonferroni method. BMJ 1995; 310(6973):170. (475) Perneger TV. What's wrong with Bonferroni adjustments. BMJ 1998; 316(7139):1236-1238. (476) Bender R, Lange S. Multiple test procedures other than Bonferroni's deserve wider use. BMJ 1999; 318(7183):600-601. (477) Neter J, Wasserman W, Kutner MH. Applied Linear Statistical Models: Regression, Analysis of Variance, and Experimental Design. Third ed. Homewood, IL: Irwin; 1990. (478) Anonymous. Address Multiple Comparisons before Starting a Study. June 2002. http://vanbelle.org/rom%5CROM_2002_06.pdf (479) Levin B. On the Holm, Simes, and Hochberg multiple test procedures. Am J Public Health 1996; 86(5):628-629. (480) Aickin M, Gensler H. Adjusting for multiple testing when reporting research results: the Bonferroni vs Holm methods. Am J Public Health 1996; 86(5):726728. (481) SAS Institute Inc. The MULTTEST Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 2313-2356. (482) Diggle PJ, Liang K-Y, Zeger SL. Analysis of Longitudinal Data. Oxford: Oxford University Press; 1994. (483) Hanley JA, Negassa A, Edwardes MD, Forrester JE. Statistical analysis of correlated data using generalized estimating equations: an orientation. Am J Epidemiol 2003; 157(4):364-375.
368
Literatuur
(484) Allison PD. Logit Analysis of Longitudinal and Other Clustered Data. In: Allison PD, editor. Logistic Regression Using the SAS System: Theory and Application. Cary, NC: SAS Institute Inc., 1999. 179-216. (485) Kiefe CI, Weissman NW, Allison JJ, Farmer R, Weaver M, Williams OD. Identifying achievable benchmarks of care: concepts and methodology. Int J Qual Health Care 1998; 10(5):443-447. (486) Zhang J, Yu KF. What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA 1998; 280(19):1690-1691. (487) Altman DG. Why We Need Confidence Intervals. World J Surg 2005. (488) Altman D, Bland JM. Confidence intervals illuminate absence of evidence. BMJ 2004; 328(7446):1016-1017. (489) Greenhalgh T. How to read a paper. Statistics for the non-statistician. II: "Significant" relations and their pitfalls. BMJ 1997; 315(7105):422-425. (490) Orav EJ. Statistical presentation. Int J Qual Health Care 2001; 13(2):151-153. (491) Armitage P, Berry G. Further Analysis of Categorical Data. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 402-447. (492) Hosmer DW, Lemeshow S. Multiple Logistic Regression. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 31-46. (493) D'Hoore W. Mise en oeuvre de l'évaluation de la qualité des soins par l'approche des résultats - Application à une banque de résumés d'hospitalisations - [ UCL ESP Département des Sciences Hospitalières et Médicales; 1993. (494) Krumholz HM, Rathore SS, Chen J, Wang Y, Radford MJ. Evaluation of a consumer-oriented internet health care report card: the risk of quality ratings based on mortality data. JAMA 2002; 287(10):1277-1287. (495) Liang BA. A system of medical error disclosure. Qual Saf Health Care 2002; 11(1):64-68. (496) Reason J. Human error: models and management. BMJ 2000; 320(7237):768770. (497) Hart E, Hazelgrove J. Understanding the organisational context for adverse events in the health services: the role of cultural censorship. Qual Health Care 2001; 10(4):257-262.
Literatuur
369
(498) Walshe K, Offen N. A very public failure: lessons for quality improvement in healthcare organisations from the Bristol Royal Infirmary. Qual Health Care 2001; 10(4):250-256. (499) Aelvoet W, Cloots Gezondheidsindicatoren Gemeenschap; 2000.
H, Fortuin M, Hooft P, Vanoverloop J. 1998. Brussel: Ministerie van de Vlaamse
(500) Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997: Quality of coding. Arch Public Health 2005; 63(2):127-148. (501) Aelvoet W. Gezondheidsindicatoren 1993. Brussel: Ministerie van de Vlaamse Gemeenschap; 1995. (502) Aelvoet W, Capet F, Vanoverloop J. Gezondheidsindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap; 1998. (503) Aelvoet W, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1997. Brussel: Ministerie van de Vlaamse Gemeenschap; 1999. (504) Aelvoet W. Mortinataliteit en zuigelingensterfte. In: Van Der Haeghe H, editor. Over sterfte. Brussel: CBGS; 1991. 69-80. (505) Aelvoet W, Capet F, Vanoverloop J. Verhoogde sterfte in het arrondissement Dendermonde. Kunnen overlijdensstatistieken hierover uitsluitsel brengen? Tijdschr voor Geneeskunde 1998; 54(22):1548-1557. (506) Van Oyen H, Aelvoet W, Tafforeau J. Overlijdenspatroon in het Vlaamse Gewest. Tijdschr voor Geneeskunde 1993; 49:821-828. (507) MacFarlane A. Perinatal mortality surveys. Br Med J (Clin Res Ed) 1984; 289(6457):1473-1474. (508) Carter JR. The problematic death certificate. N Engl J Med 1985; 313(20):12851286. (509) Holland WW. European Community Atlas of Avoidable Death. Oxford: Oxford University Press; 1988. (510) Humblet P, Lagasse R, Moens G, Van de Voorde H, Wollast E. Atlas de la mortalité évitable en Belgique - Atlas van de vermijdbare sterfte in België (1974-1978). 1-94. 1986. Bruxelles, Ecole de Santé Publique. (511) Humblet PC, Lagasse R, Moens GF, Wollast E, Van de Voorde H. [Avoidable mortality in Belgium]. Soc Sci Med 1987; 25(5):485-493. (512) Lagasse R, Humblet P, Hooft P, Van de Voorde H, Wollast E. Atlas of avoidable mortality in Belgium 1980-1984. Arch Public Health 1992; 50:1-97.
370
Literatuur
(513) Leveque A, Humblet PC, Lagasse R. Atlas of avoidable mortality in Belgium 1985-1989. Arch Public Health 1999; 57:1-87. (514) Moens GF, Haenen W, Van de Voorde H. Epidemiological aspects of suicide among the young in selected European countries. J Epidemiol Community Health 1988; 42(3):279-285. (515) Moens GFG, Lagasse R, Humblet P, Van de Voorde H, Wollast E. "Vermijdbare sterfte": een evaluatie-instrument van de Gezondheidszorg in België? Tijdschr voor Geneeskunde 1986; 42(13):921-931. (516) Mackenbach JP, Van Duyne WM, Kelson MC. Certification and coding of two underlying causes of death in The Netherlands and other countries of the European Community. J Epidemiol Community Health 1987; 41(2):156-160. (517) Hosmer DW, Lemeshow S. Special Topics: The Multinomial Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 260-287. (518) Rosenberg HM. The Impact of Cause-of-death Querying. 45, 1-7. 1991. Bethesda,Maryland, International Institute for Vital Registration and Statistics. Technical Papers. (519) Hooft P. Verslag van de bijeenkomst van de Eurostat "Technical Group on Causes of Death Statistics". 2004. (520) Newschaffer CJ, Otani K, McDonald MK, Penberthy LT. Causes of death in elderly prostate cancer patients and in a comparison nonprostate cancer cohort. J Natl Cancer Inst 2000; 92(8):613-621. (521) RAND. Effects of Medicare's Prospective Payment System on the Quality of Hospital Care. RB-4519, 1-3. 1998. http://www.rand.org/publications/RB/RB4519/. (522) American Hospital Directory. Medicare Prospective Payment System. 2006. http://www.ahd.com/pps.html acceeded 13/06/2007, American Hospital Directory. (523) ICD-9-CM Coding Fundamentals, Multiple Coding. ICD-9-CM International Classification of Diseases 9th Revision Clinical Modification Sixth Edition 2005. 2004. 19-78. (524) Kinghorn W. Should doctors ever lie on behalf of patients? JAMA 1999; 282(17):1674.
Literatuur
371
(525) Webster G. Serving two masters: medical practice vs administrative ethics. JAMA 1999; 282(17):1678-1679. (526) Rifkin DE. Community considerations: the many effects of miscoding. JAMA 1999; 282(17):1676-7, 1679. (527) Ubel PA. Physicians' duties in an era of cost containment: advocacy or betrayal? JAMA 1999; 282(17):1675. (528) Weinstein MC. Should physicians be gatekeepers of medical resources? J Med Ethics 2001; 27(4):268-274. (529) Roger VL. Invited commentary: Will heart attacks be "gone with the century"? Am J Epidemiol 2004; 160(12):1147-1149. (530) Kirkhove P, Gillet P, Terryn N, Aelvoet W. Des Audits Aléatoires à des Audits Ciblés. Le Bulletin 2002; http:/www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/ (acceeded 15/06/2005):1-9. (531) Bijlage 3 aan het koninklijk besluit van 25 april 2002. Annexe N° 3 à l'arrêté royal du 25 avril 2002. Vaststelling van een gemiddelde ligduur per diagnosegroep en berekening van een aantal verantwoorde bedden. Fixation d'une durée de séjour moyenne par groupe de diagnostics et calcul d'un nombre de lits justifiés. 25-4-2002. (532) Campbell MJ, Daly LE, Machin D. Special Topics. In: Altman DG, Machin D, Bryant TN, Gardner MJ, editors. Statistics with Confidence. Bristol: BMJ Books; 2000. 153-167. (533) Black C, Roos NP. Administrative data. Baby or bathwater? Med Care 1998; 36(1):3-5. (534) Chaillet N, Dumont A. Evidence-based strategies for reducing cesarean section rates: a meta-analysis. Birth 2007; 34(1):53-64. (535) Curry SJ. Organizational interventions to encourage guideline implementation. Chest 2000; 118(2 Suppl):40S-46S. (536) Kostis WJ, Demissie K, Marcella SW, Shao YH, Wilson AC, Moreyra AE. Weekend versus weekday admission and mortality from myocardial infarction. N Engl J Med 2007; 356(11):1099-1109. (537) Roger-France FH, Mertens I. Case Mix in Belgium: A Rapid Coverage and a Progressive AP-DRG Use. In: Roger-France FH, Mertens I, Closon MC, Hofdijk J, editors. Case Mix: Global Views, Local Actions. 2001. 31-39.
372
Literatuur
(538) Lorant V, Boland B, Humblet P, Deliege D. Equity in prevention and health care. J Epidemiol Community Health 2002; 56(7):510-516. (539) Starfield B. Equity in health. J Epidemiol Community Health 2002; 56(7):483484. (540) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412. (541) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412. (542) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496. (543) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496. (544) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412. (545) Iezzoni LI. Assessing quality using administrative data. Ann Intern Med 1997; 127(8 Pt 2):666-674. (546) Clancy CM. AHRQs National Healthcare Quality and Disparities Reports: resources for health services researchers. Health Serv Res 2006; 41(2):xiii-xxix. (547) Weiner BJ, Alexander JA, Shortell SM, Baker LC, Becker M, Geppert JJ. Quality improvement implementation and hospital performance on quality indicators. Health Serv Res 2006; 41(2):307-334. (548) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412. (549) Sheldon T. Netherlands 8. BMJ 2004; 329(7457):68.
plans
system
for
reporting
errors
(550) Beresford NW, Evans TW. Legal safeguards for the audit process. Are essential for effective clinical governance. BMJ 1999; 319(7211):654-655. (551) Walshe K. Legal safeguards for audit process are a bad idea. BMJ 1999; 319(7223):1499.
Literatuur
373
(552) AHRQ Quality Indicators. Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality and Utilization. Version2.1, Revision 4. 02R0204, 1-179. 22-12-0004. Rockville, MD, Agency for Healthcare Research and Quality. (553) Marshall MN. Accountability and quality improvement: the role of report cards. Qual Health Care 2001; 10(2):67-68. (554) Smith J. Redesigning health care. BMJ 2001; 322(7297):1257-1258. (555) Moss F, Garside P, Dawson S. Organisational change: the key to quality improvement. Qual Health Care 1998; 7 Suppl:S1-S2. (556) Buetow SA, Roland M. Clinical governance: bridging the gap between managerial and clinical approaches to quality of care. Qual Health Care 1999; 8(3):184-190. (557) Roland M. Choosing effective strategies for quality improvement. Qual Health Care 2001; 10(2):66-67. (558) Davies HT, Nutley SM, Mannion R. Organisational culture and quality of health care. Qual Health Care 2000; 9(2):111-119. (559) Pearson M. Lessons from the management of acute myocardial infarction. Heart 2005; 91 Suppl 2:ii28-ii30. (560) Firth-Cozens J. Multidisciplinary teamwork: the good, bad, and everything in between. Qual Health Care 2001; 10(2):65-66. (561) Smith J, Walshe K, Hunter DJ. The "redisorganisation" of the NHS. BMJ 2001; 323(7324):1262-1263. (562) Vladeck BC, Goodwin EJ, Myers LP, Sinisi M. Consumers and hospital use: the HCFA "death list". Health Aff (Millwood ) 1988; 7(1):122-125. (563) Detmer DE. Erring is human: will we cross the quality chasm? Qual Health Care 2001; 10(2):68-69. (564) Cesarean Delivery Rate. In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 67-69. (565) Belizan JM, Althabe F, Barros FC, Alexander S. Rates and implications of caesarean sections in Latin America: ecological study. BMJ 1999; 319(7222):1397-1400.
374
Literatuur
(566) Main EK. Reducing cesarean birth rates with data-driven quality improvement activities. Pediatrics 1999; 103(1 Suppl E):374-383. (567) Smith GC, Pell JP, Cameron AD, Dobbie R. Risk of perinatal death associated with labor after previous cesarean delivery in uncomplicated term pregnancies. JAMA 2002; 287(20):2684-2690. (568) Lucet C, Di Zinno T, De Gauquier K, Remacle A. Recours à la césarienne en Belgique: évolution générale et disparités Gebruik van keizersneden in België: algemene evolutie en discrepanties. Intermutualistisch Agentschap, editor. 1-23. 2006. Brussel. (569) Villar J, Valladares E, Wojdyla D, Zavaleta N, Carroli G, Velazco A et al. Caesarean delivery rates and pregnancy outcomes: the 2005 WHO global survey on maternal and perinatal health in Latin America. Lancet 2006; 367(9525):1819-1829. (570) Ronsmans C, Campbell OM, McDermott J, Koblinsky M. Questioning the indicators of need for obstetric care. Bull World Health Organ 2002; 80(4):317324. (571) Johanson R, Newburn M, MacFarlane A. Has the medicalisation of childbirth gone too far? BMJ 2002; 324(7342):892-895. (572) Anderson GM. Making sense of rising caesarean section rates. BMJ 2004; 329(7468):696-697. (573) Guihard P, Blondel B. Trends in risk factors for caesarean sections in France between 1981 and 1995: lessons for reducing the rates in the future. BJOG 2001; 108(1):48-55. (574) Kolas T, Saugstad OD, Daltveit AK, Nilsen ST, Oian P. Planned cesarean versus planned vaginal delivery at term: Comparison of newborn infant outcomes. Am J Obstet Gynecol 2006. (575) Meikle SF, Steiner CA, Zhang J, Lawrence WL. A national estimate of the elective primary cesarean delivery rate. Obstet Gynecol 2005; 105(4):751-756. (576) Guise JM, McDonagh MS, Hashima J, Kraemer DF, Berlin M, Nygren P et al. Vaginal Birth After Cesarean (VBAC). AHRQ Publication No. 03-E018, 1526. 2003. Rockville,MD, AHRQ. (577) Gregory KD, Korst LM, Gornbein JA, Platt LD. Using administrative data to identify indications for elective primary cesarean delivery. Health Serv Res 2002; 37(5):1387-1401.
Literatuur
375
(578) Gonen R, Tamir A, Degani S, Ohel G. Variables associated with successful vaginal birth after one cesarean section: a proposed vaginal birth after cesarean section score. Am J Perinatol 2004; 21(8):447-453. (579) Zweifler J, Garza A, Hughes S, Stanich MA, Hierholzer A, Lau M. Vaginal birth after cesarean in California: before and after a change in guidelines. Ann Fam Med 2006; 4(3):228-234. (580) Glezerman M. Five years to the term breech trial: the rise and fall of a randomized controlled trial. Am J Obstet Gynecol 2006; 194(1):20-25. (581) Kotaska A. Inappropriate use of randomised trials to evaluate complex phenomena: case study of vaginal breech delivery. BMJ 2004; 329(7473):10391042. (582) Wareham V, Bain C, Cruickshank D. Caesarean section audit by peer review. Eur J Obstet Gynecol Reprod Biol 1993; 48(1):9-14. (583) Minkoff H, Chervenak FA. Elective primary cesarean delivery. N Engl J Med 2003; 348(10):946-950. (584) Stirrat GM, Dunn PM. Elective caesarean section on request. Obstetricians are more than technicians. BMJ 1999; 318(7176):120-121. (585) Castro A. Commentary:increase in cesarean sections may reflect medical control not woma's choice. BMJ 2006; 319:1401-1402. (586) van Roosmalen J. Elective caesarean section on request. Unnecessary caesarean sections should be avoided. BMJ 1999; 318(7176):121. (587) Idama TO, Lindow SW. Elective caesarean section on request. Safest option is still to aim for vaginal delivery. BMJ 1999; 318(7176):121. (588) Greene MF. Vaginal delivery after cesarean section--is the risk acceptable? N Engl J Med 2001; 345(1):54-55. (589) Paterson-Brown S, Fisk NM. Caesarean section: every woman's right to choose? Curr Opin Obstet Gynecol 1997; 9(6):351-355. (590) Paterson-Brown S. Should doctors perform an elective caesarean section on request? Yes, as long as the woman is fully informed. BMJ 1998; 317(7156):462-463. (591) Norman B, Crowhurst JA, Plaat F. Elective caesarean section on request. All types of anaesthesia carry risks. BMJ 1999; 318(7176):120. (592) Rozenberg P. [Evaluation of cesarean rate: a necessary progress in modern obstetrics]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(4):279-289.
376
Literatuur
(593) National Collaborating Centre for Women's and Children's Health. Caesarean Section. Moody J, editor. 1-143. 2004. London NW1 4RG, RCOG Press. (594) Amu O, Rajendran S, Bolaji II. Should doctors perform an elective caesarean section on request? Maternal choice alone should not determine method of delivery. BMJ 1998; 317(7156):463-465. (595) Rortveit G, Daltveit AK, Hannestad YS, Hunskaar S. Urinary incontinence after vaginal delivery or cesarean section. N Engl J Med 2003; 348(10):900-907. (596) Usta IM, Hobeika EM, Musa AA, Gabriel GE, Nassar AH. Placenta previaaccreta: risk factors and complications. Am J Obstet Gynecol 2005; 193(3 Pt 2):1045-1049. (597) Alexander S, Wildman K, Zhang W, Langer M, Vutuc C, Lindmark G. Maternal health outcomes in Europe. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S78-S87. (598) Kritchevsky SB, Braun BI, Gross PA, Newcomb CS, Kelleher CA, Simmons BP. Definition and adjustment of Cesarean section rates and assessments of hospital performance. Int J Qual Health Care 1999; 11(4):283-291. (599) Gonen R, Tamir A, Degani S. Obstetricians' opinions regarding patient choice in cesarean delivery. Obstet Gynecol 2002; 99(4):577-580. (600) Langer A, Villar J. Promoting evidence based practice in maternal care. BMJ 2002; 324(7343):928-929. (601) Naylor CD, Sermer M, Chen E, Sykora K. Cesarean delivery in relation to birth weight and gestational glucose tolerance: pathophysiology or practice style? Toronto Trihospital Gestational Diabetes Investigators. JAMA 1996; 275(15):1165-1170. (602) Bastia H. Commentary:"health has become secondary to a sexually attractive body". BMJ 2006; 319:1402. (603) Showalter E, Griffin A. Commentary: all women should have a choice. BMJ 1999; 319:1401. (604) Penn Z, Ghaem-Maghami S. Indications for caesarean section. Best Pract Res Clin Obstet Gynaecol 2001; 15(1):1-15. (605) Jacquemyn Y, Ahankour F, Martens G. Flemish obstetricians' personal preference regarding mode of delivery and attitude towards caesarean section on demand. Eur J Obstet Gynecol Reprod Biol 2003; 111(2):164-166.
Literatuur
377
(606) Lavender T, Kingdon C, Hart A, Gyte G, Gabbay M, Neilson JP. Could a randomised trial answer the controversy relating to elective caesarean section? National survey of consultant obstetricians and heads of midwifery. BMJ 2005; 331(7515):490-491. (607) Gould JB, Danielsen B, Korst LM, Phibbs R, Chance K, Main E et al. Cesarean delivery rates and neonatal morbidity in a low-risk population. Obstet Gynecol 2004; 104(1):11-19. (608) Agency for Healthcare Research and Quality. 2003 National Healthcare Quality Report. 1-208. 2003. Rockville,MD, U.S. Department of Health and Human Services, Agency for Healthcare Research and Quality. (609) Zeitlin J, Wildman K, Breart G, Alexander S, Barros H, Blondel B et al. Selecting an indicator set for monitoring and evaluating perinatal health in Europe: criteria, methods and results from the PERISTAT project. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S5-S14. (610) Bekaert A, Martens G, Devlieger H, Amy JJ. Perinatal Activities in Flanders,1996. 1-62. 1997. Brussels, SPE. (611) Buitendijk S, Zeitlin J, Cuttini M, Langhoff-Roos J, Bottu J. Indicators of fetal and infant health outcomes. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S66-S77. (612) Declercq E, Menacker F, MacDorman M. Maternal risk profiles and the primary cesarean rate in the United States, 1991-2002. Am J Public Health 2006; 96(5):867-872. (613) Elliott JP, Russell MM, Dickason LA. The labor-adjusted cesarean section rate-a more informative method than the cesarean section "rate" for assessing a practitioner's labor and delivery skills. Am J Obstet Gynecol 1997; 177(1):139143. (614) Dani C, Reali MF, Bertini G, Wiechmann L, Spagnolo A, Tangucci M et al. Risk factors for the development of respiratory distress syndrome and transient tachypnoea in newborn infants. Italian Group of Neonatal Pneumology. Eur Respir J 1999; 14(1):155-159. (615) Yoder BA, Kirsch EA, Barth WH, Gordon MC. Changing obstetric practices associated with decreasing incidence of meconium aspiration syndrome. Obstet Gynecol 2002; 99(5 Pt 1):731-739. (616) Papile LA. The Apgar score in the 21st century. N Engl J Med 2001; 344(7):519-520.
378
Literatuur
(617) Baumer JH, Wright D, Mill T. Illness severity measured by CRIB score: a product of changes in perinatal care? Arch Dis Child Fetal Neonatal Ed 1997; 77(3):F211-F215. (618) Patel D, Piotrowski ZH, Nelson MR, Sabich R. Effect of a statewide neonatal resuscitation training program on Apgar scores among high-risk neonates in Illinois. Pediatrics 2001; 107(4):648-655. (619) Moster D, Lie RT, Irgens LM, Bjerkedal T, Markestad T. The association of Apgar score with subsequent death and cerebral palsy: A population-based study in term infants. J Pediatr 2001; 138(6):798-803. (620) Casey BM, McIntire DD, Leveno KJ. The continuing value of the Apgar score for the assessment of newborn infants. N Engl J Med 2001; 344(7):467-471. (621) Wu YW, Backstrand KH, Zhao S, Fullerton HJ, Johnston SC. Declining diagnosis of birth asphyxia in California: 1991-2000. Pediatrics 2004; 114(6):1584-1590. (622) Neter J, Wasserman W, Kutner MH. Two-Factor Analysis of Variance - Equal Sample Sizes. In: Neter J, Wasserman W, Kutner MH, editors. Applied Linear Statistical Models Regression, Analysis of Variance and Experimental Designs. Third ed. Homewood,IL: IRWIN; 1990. 673-729. (623) Collett D. Modelling data from epidemiological studies. In: Collett D, editor. Modelling binary data. Boca Raton: Chapman & Hall/CRC; 1991. 223-276. (624) Molenberghs G, Verbeke G. Generalized Estimating Equations. Models for Discrete Longitudinal Data. New York: Springer; 2005. 151-187. (625) Agresti A. Multinomial Response Models. Categorical Data Analysis. New York: John Wiley &Sons.; 1990. 306-346. (626) Wiswell TE, Gannon CM, Jacob J, Goldsmith L, Szyld E, Weiss K et al. Delivery room management of the apparently vigorous meconium-stained neonate: results of the multicenter, international collaborative trial. Pediatrics 2000; 105(1 Pt 1):1-7. (627) Fraser WD, Hofmeyr J, Lede R, Faron G, Alexander S, Goffinet F et al. Amnioinfusion for the prevention of the meconium aspiration syndrome. N Engl J Med 2005; 353(9):909-917. (628) Dargaville PA, Copnell B. The epidemiology of meconium aspiration syndrome: incidence, risk factors, therapies, and outcome. Pediatrics 2006; 117(5):17121721. (629) Levine EM, Ghai V, Barton JJ, Strom CM. Mode of delivery and risk of respiratory diseases in newborns. Obstet Gynecol 2001; 97(3):439-442.
Literatuur
379
(630) Freeman RK, Cohen AW, Depp III R, Frigoletto Jr FD, Hankins GDV, Lieberman E et al. Evaluation of Cesarean Delivery. American College of Obstetricians and Gynecologists Task Force on Cesarean Delivery Rates, editor. i-5. 2000. Washington,DC, The American College of Obstetricians and Gynecologists. (631) Arnold RA, Diamond ID, Wakefield JC. The use of population data in spatial epidemiology. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 30-50. (632) Lydon-Rochelle M, Holt VL, Easterling TR, Martin DP. Risk of uterine rupture during labor among women with a prior cesarean delivery. N Engl J Med 2001; 345(1):3-8. (633) Kabir AA, Pridjian G, Steinmann WC, Herrera EA, Khan MM. Racial differences in cesareans: an analysis of U.S. 2001 National Inpatient Sample Data. Obstet Gynecol 2005; 105(4):710-718. (634) Jovanovic L, Pettitt DJ. Gestational diabetes mellitus. JAMA 2001; 286(20):2516-2518. (635) Sibai BM. Diagnosis, prevention, and management of eclampsia. Obstet Gynecol 2005; 105(2):402-410. (636) Krieger N. Overcoming the absence of socioeconomic data in medical records: validation and application of a census-based methodology. Am J Public Health 1992; 82(5):703-710. (637) AHRQ. AHRQuality Indicators e-Newsletter: AHRQ QI TIPS: ICD-9-CM Coding Issues. 2005. http://qualityindicators.ahrq.gov/newsletter/2005September-AHRQ-QI-Newsletter.htm (638) DiGiuseppe DL, Aron DC, Payne SM, Snow RJ, Dierker L, Rosenthal GE. Risk adjusting cesarean delivery rates: a comparison of hospital profiles based on medical record and birth certificate data. Health Serv Res 2001; 36(5):959-977. (639) Rosenthal AR. Elective caesarean section on request. Maternal age is important. BMJ 1999; 318(7176):121-122. (640) Cleary-Goldman J, Malone FD, Vidaver J, Ball RH, Nyberg DA, Comstock CH et al. Impact of maternal age on obstetric outcome. Obstet Gynecol 2005; 105(5 Pt 1):983-990. (641) Heffner LJ, Elkin E, Fretts RC. Impact of labor induction, gestational age, and maternal age on cesarean delivery rates. Obstet Gynecol 2003; 102(2):287-293.
380
Literatuur
(642) Thorngren-Jerneck K, Herbst A. Low 5-minute Apgar score: a population-based register study of 1 million term births. Obstet Gynecol 2001; 98(1):65-70. (643) MacLennan A. A template for defining a causal relation between acute intrapartum events and cerebral palsy: international consensus statement. BMJ 1999; 319(7216):1054-1059. (644) Perinatale Activiteiten in Vlaanderen 2005. Cammu H, Martens G, De Coen K, Van Mol C., Defoort P, editors. Perinatale Activiteiten in Vlaanderen 2005. 171. 2006. Brussel, Studiecentrum Perinatale Epidemiologie. (645) ACOG Committee Opinion. Number 333, May 2006 (replaces No. 174, July 1996): The Apgar score. Obstet Gynecol 2006; 107(5):1209-1212. (646) Fan AP, Eaton WW. Longitudinal study assessing the joint effects of socioeconomic status and birth risks on adult emotional and nervous conditions. Br J Psychiatry Suppl 2001; 40:s78-s83. (647) Young P, Hamilton R, Hodgett S, Moss M, Rigby C, Jones P et al. Reducing risk by improving standards of intrapartum fetal care. J R Soc Med 2001; 94(5):226-231. (648) Stutchfield P, Whitaker R, Russell I. Antenatal betamethasone and incidence of neonatal respiratory distress after elective caesarean section: pragmatic randomised trial. BMJ 2005; 331(7518):662. (649) Littleford J. Effects on the fetus and newborn of maternal analgesia and anesthesia: a review. Can J Anaesth 2004; 51(6):586-609. (650) Pottecher J, Benhamou D. [Labor pain and obstetric analgesia]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(3):179-191. (651) Lopriore E, van Burk GF, Walther FJ, de Beaufort AJ. Correct use of the Apgar score for resuscitated and intubated newborn babies: questionnaire study. BMJ 2004; 329(7458):143-144. (652) Boog G. La souffrance foetale aiguë [Acute fetal distress]. J Gynecol Obstet Biol Reprod (Paris) 2001; 30(5):393-432. (653) Stoler MH, Schiffman M. Interobserver reproducibility of cervical cytologic and histologic interpretations: realistic estimates from the ASCUS-LSIL Triage Study. JAMA 2001; 285(11):1500-1505. (654) Grotta JC, Chiu D, Lu M, Patel S, Levine SR, Tilley BC et al. Agreement and variability in the interpretation of early CT changes in stroke patients qualifying for intravenous rtPA therapy. Stroke 1999; 30(8):1528-1533.
Literatuur
381
(655) Hemminki E, Malin M, Rahkonen O. Mother's social class and perinatal problems in a low-problem area. Int J Epidemiol 1990; 19(4):983-990. (656) Stewart JH, Andrews J, Cartlidge PH. Numbers of deaths related to intrapartum asphyxia and timing of birth in all Wales perinatal survey, 1993-5. BMJ 1998; 316(7132):657-660. (657) Gould JB, Qin C, Chavez G. Time of birth and the risk of neonatal death. Obstet Gynecol 2005; 106(2):352-358. (658) McNutt RA, Abrams R, Arons DC. Patient safety efforts should focus on medical errors. JAMA 2002; 287(15):1997-2001. (659) Lanier DC, Roland M, Burstin H, Knottnerus JA. Doctor performance and public accountability. Lancet 2003; 362(9393):1404-1408. (660) Lilford R, Mohammed MA, Spiegelhalter D, Thomson R. Use and misuse of process and outcome data in managing performance of acute medical care: avoiding institutional stigma. Lancet 2004; 363(9415):1147-1154. (661) Ransom SB, Studdert DM, Dombrowski MP, Mello MM, Brennan TA. Reduced medicolegal risk by compliance with obstetric clinical pathways: a case--control study. Obstet Gynecol 2003; 101(4):751-755. (662) Hannah ME, Hannah WJ, Hewson SA, Hodnett ED, Saigal S, Willan AR. Planned caesarean section versus planned vaginal birth for breech presentation at term: a randomised multicentre trial. Term Breech Trial Collaborative Group. Lancet 2000; 356(9239):1375-1383. (663) Lumley J. Any room left for disagreement about assisting breech births at term? Lancet 2000; 356(9239):1369-1370. (664) Boutron I, Tubach F, Giraudeau B, Ravaud P. Methodological differences in clinical trials evaluating nonpharmacological and pharmacological treatments of hip and knee osteoarthritis. JAMA 2003; 290(8):1062-1070. (665) Boutron I, Ravaud P, Giraudeau B. Inappropriateness of randomised trials for complex phenomena: single trial is never enough evidence to base decisions on. BMJ 2005; 330(7482):94. (666) Hannah M. Inappropriateness of randomised trials for complex phenomena: are the results of the term breech trial generalisable? BMJ 2005; 330(7482):95. (667) Whyte H, Hannah ME, Saigal S, Hannah WJ, Hewson S, Amankwah K et al. Outcomes of children at 2 years after planned cesarean birth versus planned vaginal birth for breech presentation at term: the International Randomized Term Breech Trial. Am J Obstet Gynecol 2004; 191(3):864-871.
382
Literatuur
(668) Term breech delivery in Sweden: mortality relative to fetal presentation and planned mode of delivery. Acta Obstet Gynecol Scand 2005; 84(6):593-601. (669) Danielian PJ, Wang J, Hall MH. Long-term outcome by method of delivery of fetuses in breech presentation at term: population based follow up. BMJ 1996; 312(7044):1451-1453. (670) Carayol M, Alexander S, Goffinet F. [Mode of delivery and term breech presentation in the PREMODA cohort]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(1 Suppl):S37-S44. (671) Scherjon SA, van RJ. [Breech presentation at term: the caesarean section that is routinely advised is ultimately not safe for the child]. Ned Tijdschr Geneeskd 2005; 149(40):2204-2206. (672) Varma R, Gupta JK. Internationally agreed strategy is needed on vaginal birth after caesarean. BMJ 2004; 329(7462):403. (673) Janssen PA, Lee SK, Ryan EM, Etches DJ, Farquharson DF, Peacock D et al. Outcomes of planned home births versus planned hospital births after regulation of midwifery in British Columbia. CMAJ 2002; 166(3):315-323. (674) Verschoore S, Martens G, Delbaere I, Temmerman M. Vaginale bevalling na sectio in vergelijking met een herhalingssectio gevolgen voor moeder en kind. In: Cammu H, Martens G, De Coen K, Van Mol C., Defoort P, editors. Perinatale Activiteiten in Vlaanderen 2005. Brussel: Studiecentrum Perinatale Epidemiologie; 2006. 59-66. (675) McMahon MJ, Luther ER, Bowes WA, Jr., Olshan AF. Comparison of a trial of labor with an elective second cesarean section. N Engl J Med 1996; 335(10):689-695. (676) Smith GC, Pell JP, Pasupathy D, Dobbie R. Factors predisposing to perinatal death related to uterine rupture during attempted vaginal birth after caesarean section: retrospective cohort study. BMJ 2004; 329(7462):375. (677) Vaginal birth after cesarean birth--California, 1996-2000. MMWR Morb Mortal Wkly Rep 2002; 51(44):996-998. (678) Dunsmoor-Su R, Sammel M, Stevens E, Peipert JL, Macones G. Impact of sociodemographic and hospital factors on attempts at vaginal birth after cesarean delivery. Obstet Gynecol 2003; 102(6):1358-1365. (679) Brill Y, Windrim R. Vaginal birth after Caesarean section: review of antenatal predictors of success. J Obstet Gynaecol Can 2003; 25(4):275-286. (680) Guise JM, Hashima J, Osterweil P. Evidence-based vaginal birth after Caesarean section. Best Pract Res Clin Obstet Gynaecol 2005; 19(1):117-130.
383
Literatuur
(681) Durnwald C, Mercer B. Vaginal birth after Cesarean delivery: predicting success, risks of failure. J Matern Fetal Neonatal Med 2004; 15(6):388-393. (682) Wall E, Roberts R, Deutchman M, Hueston W, Atwood LA, Ireland B. Trial of Labor After Caesarean (TOLAC), Formerly Trial of Labor Versus Elective Repeat Cesarean Section for the Woman With a Previous Cesarean Section A Review of the Evidence and Recommendations by the American Academy of Family Physicians. 1-18. 2005. AAFP. (683) Rozenberg P. [The counselling of patient with prior C-section]. Gynecol Obstet Fertil 2005; 33(12):1003-1008. (684) Kmietowicz Z. NICE advises against caesarean section on demand. BMJ 2004; 328(7447):1031. (685)
ACOG.
Patient-Requested
Cesarean
Update.
5-9-2006.
http://ftp.acog.org/from_home/publications/press_releases/nr05-09-061.cfm (686) Danchin N, De Benedetti E, Urban P. Acute myocardial infarction. Am Fam Physician 2003; 68(3):519-521. (687) OECD Health Data 2005: Statistics and Indicators for 30 Countries. 2005. (688) Boucher JM, Racine N, Thanh TH, Rahme E, Brophy J, LeLorier J et al. Agerelated differences in in-hospital mortality and the use of thrombolytic therapy for acute myocardial infarction. CMAJ 2001; 164(9):1285-1290. (689) Bednar F, Widimsky P, Groch L, Aschermann M, Zelizko M, Krupicka J. Acute myocardial infarction complicated by early onset of heart failure: safety and feasibility of interhospital transfer for coronary angioplasty. Subanalysis of Killip II-IV patients from the PRAGUE-1 study. J Interv Cardiol 2003; 16(3):201-208. (690) Dauerman HL, Ryan TJ, Jr., Piper WD, Kellett MA, Shubrooks SJ, Robb JF et al. Outcomes of percutaneous coronary intervention among elderly patients in cardiogenic shock: a multicenter, decade-long experience. J Invasive Cardiol 2003; 15(7):380-384. (691) Zeymer U, Vogt A, Zahn R, Weber MA, Tebbe U, Gottwik M et al. Predictors of in-hospital mortality in 1333 patients with acute myocardial infarction complicated by cardiogenic shock treated with primary percutaneous coronary intervention (PCI); Results of the primary PCI registry of the Arbeitsgemeinschaft Leitende Kardiologische Krankenhausarzte (ALKK). Eur Heart J 2004; 25(4):322-328.
384
Literatuur
(692) Hochman JS, Sleeper LA, Webb JG, Sanborn TA, White HD, Talley JD et al. Early revascularization in acute myocardial infarction complicated by cardiogenic shock. SHOCK Investigators. Should We Emergently Revascularize Occluded Coronaries for Cardiogenic Shock. N Engl J Med 1999; 341(9):625634. (693) Antoniucci D, Valenti R, Santoro GM, Bolognese L, Trapani M, Moschi G et al. Systematic direct angioplasty and stent-supported direct angioplasty therapy for cardiogenic shock complicating acute myocardial infarction: in-hospital and long-term survival. J Am Coll Cardiol 1998; 31(2):294-300. (694) Goldberg RJ, Samad NA, Yarzebski J, Gurwitz J, Bigelow C, Gore JM. Temporal trends in cardiogenic shock complicating acute myocardial infarction. N Engl J Med 1999; 340(15):1162-1168. (695) White HD, Assmann SF, Sanborn TA, Jacobs AK, Webb JG, Sleeper LA et al. Comparison of percutaneous coronary intervention and coronary artery bypass grafting after acute myocardial infarction complicated by cardiogenic shock: results from the Should We Emergently Revascularize Occluded Coronaries for Cardiogenic Shock (SHOCK) trial. Circulation 2005; 112(13):1992-2001. (696) Babaev A, Frederick PD, Pasta DJ, Every N, Sichrovsky T, Hochman JS. Trends in management and outcomes of patients with acute myocardial infarction complicated by cardiogenic shock. JAMA 2005; 294(4):448-454. (697) Acute myocardial infarction: pre-hospital and in-hospital management. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 1996; 17(1):43-63. (698) Rathore SS, Foody JM, Radford MJ, Krumholz HM. Sex differences in use of coronary revascularization in elderly patients after acute myocardial infarction: a tale of two therapies. Chest 2003; 124(6):2079-2086. (699) Leape LL, Hilborne LH, Bell R, Kamberg C, Brook RH. Underuse of cardiac procedures: do women, ethnic minorities, and the uninsured fail to receive needed revascularization? Ann Intern Med 1999; 130(3):183-192. (700) Roeters Van Lennep JE, Zwinderman AH, Roeters Van Lennep HW, Westerveld HE, Plokker HW, Voors AA et al. Gender differences in diagnosis and treatment of coronary artery disease from 1981 to 1997. No evidence for the Yentl syndrome. Eur Heart J 2000; 21(11):911-918. (701) Gottlieb S, Harpaz D, Shotan A, Boyko V, Leor J, Cohen M et al. Sex differences in management and outcome after acute myocardial infarction in the 1990s: A prospective observational community-based study. Israeli Thrombolytic Survey Group. Circulation 2000; 102(20):2484-2490.
Literatuur
385
(702) Watson RE, Stein AD, Dwamena FC, Kroll J, Mitra R, McIntosh BA et al. Do race and gender influence the use of invasive procedures? J Gen Intern Med 2001; 16(4):227-234. (703) Harrold LR, Esteban J, Lessard D, Yarzebski J, Gurwitz JH, Gore JM et al. Narrowing gender differences in procedure use for acute myocardial infarction: insights from the Worcester heart attack study. J Gen Intern Med 2003; 18(6):423-431. (704) Gibson CM. Time is myocardium and time is outcomes. Circulation 2001; 104(22):2632-2634. (705) Gottwik M, Zahn R, Schiele R, Schneider S, Gitt AK, Fraunberger L et al. Differences in treatment and outcome of patients with acute myocardial infarction admitted to hospitals with compared to without departments of cardiology; results from the pooled data of the Maximal Individual Therapy in Acute Myocardial Infarction (MITRA 1+2) Registries and the Myocardial Infarction Registry (MIR). Eur Heart J 2001; 22(19):1794-1801. (706) Schiele F, Meneveau N, Seronde MF, Caulfield F, Fouche R, Lassabe G et al. Compliance with guidelines and 1-year mortality in patients with acute myocardial infarction: a prospective study. Eur Heart J 2005; 26(9):873-880. (707) Marciniak TA, Ellerbeck EF, Radford MJ, Kresowik TF, Gold JA, Krumholz HM et al. Improving the quality of care for Medicare patients with acute myocardial infarction: results from the Cooperative Cardiovascular Project. JAMA 1998; 279(17):1351-1357. (708) Mehta RH, Montoye CK, Gallogly M, Baker P, Blount A, Faul J et al. Improving quality of care for acute myocardial infarction: The Guidelines Applied in Practice (GAP) Initiative. JAMA 2002; 287(10):1269-1276. (709) Eagle KA, Montoye CK, Riba AL, DeFranco AC, Parrish R, Skorcz S et al. Guideline-based standardized care is associated with substantially lower mortality in medicare patients with acute myocardial infarction: the American College of Cardiology's Guidelines Applied in Practice (GAP) Projects in Michigan. J Am Coll Cardiol 2005; 46(7):1242-1248. (710) Bassand JP, Priori S, Tendera M. Evidence-based vs. 'impressionist' medicine: how best to implement guidelines. Eur Heart J 2005; 26(12):1155-1158. (711) Van de WF, Ardissino D, Betriu A, Cokkinos DV, Falk E, Fox KA et al. Management of acute myocardial infarction in patients presenting with STsegment elevation. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 2003; 24(1):2866.
386
Literatuur
(712) Hasdai D, Behar S, Wallentin L, Danchin N, Gitt AK, Boersma E et al. A prospective survey of the characteristics, treatments and outcomes of patients with acute coronary syndromes in Europe and the Mediterranean basin; the Euro Heart Survey of Acute Coronary Syndromes (Euro Heart Survey ACS). Eur Heart J 2002; 23(15):1190-1201. (713) White CW. Simplicity's virtue scorned. Precision comes to TIMI flow grading and the results are ...surprising. Circulation 1996; 93(5):853-856. (714) Bestul MB, McCollum M, Stringer KA, Burchenal J. Impact of a critical pathway on acute myocardial infarction quality indicators. Pharmacotherapy 2004; 24(2):173-178. (715) Krumholz HM, Chen J, Wang Y, Radford MJ, Chen YT, Marciniak TA. Comparing AMI mortality among hospitals in patients 65 years of age and older: evaluating methods of risk adjustment. Circulation 1999; 99(23):2986-2992. (716) Jollis JG, Romano PS. Volume-outcome relationship in acute myocardial infarction: the balloon and the needle. JAMA 2000; 284(24):3169-3171. (717) Ryan TJ, Antman EM, Brooks NH, Califf RM, Hillis LD, Hiratzka LF et al. 1999 update: ACC/AHA Guidelines for the Management of Patients With Acute Myocardial Infarction: Executive Summary and Recommendations: A report of the American College of Cardiology/American Heart Association Task Force on Practice Guidelines (Committee on Management of Acute Myocardial Infarction). Circulation 1999; 100(9):1016-1030. (718) O'Connor GT, Quinton HB, Traven ND, Ramunno LD, Dodds TA, Marciniak TA et al. Geographic Variation in the Treatment of Acute Myocardial Infarction. JAMA 1999; 281(7):627-633. (719) Moniteur Belge, Belgisch Staatsblad. Arrêté royal fixant les normes auxquelles les programmes de soins "pathologie cardiaque" doivent répondre pour être agréés. 15 Juillet 2004. 2004. (720) Van Brabandt H, Camberlin C, Vrijens F, Parmentier Y, Ramaekers D, Bonneux L. More is not better in the early care of acute myocardial infarction: a prospective cohort analysis on administrative databases. Eur Heart J 2006; 27(22):2649-2654. (721) Kuch B, Bolte HD, Hoermann A, Meisinger C, Loewel H. What is the real hospital mortality from acute myocardial infarction? Epidemiological vs clinical view. Eur Heart J 2002; 23(9):714-720. (722) Dalby M, Bouzamondo A, Lechat P, Montalescot G. Transfer for primary angioplasty versus immediate thrombolysis in acute myocardial infarction: a meta-analysis. Circulation 2003; 108(15):1809-1814.
Literatuur
387
(723) Antman EM, Fox KM. History of guidelines for unstable angina/non-STelevation MI. Eur Heart J Supplements 2001;J1-J5. (724) Bertrand ME, Simoons ML, Fox KA, Wallentin LC, Hamm CW, McFadden E et al. Management of acute coronary syndromes: acute coronary syndromes without persistent ST segment elevation; recommendations of the Task Force of the European Society of Cardiology. Eur Heart J 2000; 21(17):1406-1432. (725) Zijlstra F, van't Hof AW, Liem AL, Hoorntje JC, Suryapranata H, de Boer MJ. Transferring patients for primary angioplasty: a retrospective analysis of 104 selected high risk patients with acute myocardial infarction. Heart 1997; 78(4):333-336. (726) Ross AM, Coyne KS, Moreyra E, Reiner JS, Greenhouse SW, Walker PL et al. Extended mortality benefit of early postinfarction reperfusion. GUSTO-I Angiographic Investigators. Global Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded Coronary Arteries Trial. Circulation 1998; 97(16):1549-1556. (727) Brodie BR, Stuckey TD, Wall TC, Kissling G, Hansen CJ, Muncy DB et al. Importance of time to reperfusion for 30-day and late survival and recovery of left ventricular function after primary angioplasty for acute myocardial infarction. J Am Coll Cardiol 1998; 32(5):1312-1319. (728) Boersma E. Does time matter? A pooled analysis of randomized clinical trials comparing primary percutaneous coronary intervention and in-hospital fibrinolysis in acute myocardial infarction patients. Eur Heart J 2006; 27(7):779788. (729) Zijlstra F, Hoorntje JC, de Boer MJ, Reiffers S, Miedema K, Ottervanger JP et al. Long-term benefit of primary angioplasty as compared with thrombolytic therapy for acute myocardial infarction. N Engl J Med 1999; 341(19):14131419. (730) Morrow DA, Antman EM, Charlesworth A, Cairns R, Murphy SA, de Lemos JA et al. TIMI risk score for ST-elevation myocardial infarction: A convenient, bedside, clinical score for risk assessment at presentation: An intravenous nPA for treatment of infarcting myocardium early II trial substudy. Circulation 2000; 102(17):2031-2037. (731) Grines CL, Browne KF, Marco J, Rothbaum D, Stone GW, O'Keefe J et al. A comparison of immediate angioplasty with thrombolytic therapy for acute myocardial infarction. The Primary Angioplasty in Myocardial Infarction Study Group. N Engl J Med 1993; 328(10):673-679.
388
Literatuur
(732) Weaver WD, Simes RJ, Betriu A, Grines CL, Zijlstra F, Garcia E et al. Comparison of primary coronary angioplasty and intravenous thrombolytic therapy for acute myocardial infarction: a quantitative review. JAMA 1997; 278(23):2093-2098. (733) Widimsky P, Budesinsky T, Vorac D, Groch L, Zelizko M, Aschermann M et al. Long distance transport for primary angioplasty vs immediate thrombolysis in acute myocardial infarction. Final results of the randomized national multicentre trial--PRAGUE-2. Eur Heart J 2003; 24(1):94-104. (734) Madias JE. Killip and Forrester classifications: should they be abandoned, kept, reevaluated, or modified? Chest 2000; 117(5):1223-1226. (735) Lim R, Walters MI, Norell MS. Transferring patients for primary infarct angioplasty. Heart 1997; 78(4):325-326. (736) Widimsky P, Groch L, Zelizko M, Aschermann M, Bednar F, Suryapranata H. Multicentre randomized trial comparing transport to primary angioplasty vs immediate thrombolysis vs combined strategy for patients with acute myocardial infarction presenting to a community hospital without a catheterization laboratory. The PRAGUE study. Eur Heart J 2000; 21(10):823-831. (737) Zijlstra F. Angioplasty vs thrombolysis for acute myocardial infarction: a quantitative overview of the effects of interhospital transportation. Eur Heart J 2003; 24(1):21-23. (738) Andersen HR, Nielsen TT, Rasmussen K, Thuesen L, Kelbaek H, Thayssen P et al. A comparison of coronary angioplasty with fibrinolytic therapy in acute myocardial infarction. N Engl J Med 2003; 349(8):733-742. (739) Wharton TP, Jr., McNamara NS, Fedele FA, Jacobs MI, Gladstone AR, Funk EJ. Primary angioplasty for the treatment of acute myocardial infarction: experience at two community hospitals without cardiac surgery. J Am Coll Cardiol 1999; 33(5):1257-1265.
(740) Vermeer F, Oude Ophuis AJ, vd Berg EJ, Brunninkhuis LG, Werter CJ, Boehmer AG et al. Prospective randomised comparison between thrombolysis, rescue PTCA, and primary PTCA in patients with extensive myocardial infarction admitted to a hospital without PTCA facilities: a safety and feasibility study. Heart 1999; 82(4):426-431. (741) Bonnefoy E, Lapostolle F, Leizorovicz A, Steg G, McFadden EP, Dubien PY et al. Primary angioplasty versus prehospital fibrinolysis in acute myocardial infarction: a randomised study. Lancet 2002; 360(9336):825-829.
Literatuur
389
(742) Morrison LJ, Verbeek PR, McDonald AC, Sawadsky BV, Cook DJ. Mortality and prehospital thrombolysis for acute myocardial infarction: A meta-analysis. JAMA 2000; 283(20):2686-2692. (743) de Jaegere PP, Serruys PW, Simoons ML. Should all patients with an acute myocardial infarction be referred for direct PTCA? Heart 2004; 90(11):13521357. (744) Magid DJ, Calonge BN, Rumsfeld JS, Canto JG, Frederick PD, Every NR et al. Relation between hospital primary angioplasty volume and mortality for patients with acute MI treated with primary angioplasty vs thrombolytic therapy. JAMA 2000; 284(24):3131-3138. (745) Tunstall-Pedoe H, Kuulasmaa K, Amouyel P, Arveiler D, Rajakangas AM, Pajak A. Myocardial infarction and coronary deaths in the World Health Organization MONICA Project. Registration procedures, event rates, and casefatality rates in 38 populations from 21 countries in four continents. Circulation 1994; 90(1):583-612. (746) Salomaa V, Koukkunen H, Ketonen M, Immonen-Raiha P, Karja-Koskenkari P, Mustonen J et al. A new definition for myocardial infarction: what difference does it make? Eur Heart J 2005; 26(17):1719-1725. (747) Apple FS, Wu AH. Myocardial infarction redefined: role of cardiac troponin testing. Clin Chem 2001; 47(3):377-379. (748) Fox KA, Birkhead J, Wilcox R, Knight C, Barth J. British Cardiac Society Working Group on the definition of myocardial infarction. Heart 2004; 90(6):603-609. (749) Abildstrom SZ, Rasmussen S, Madsen M. Changes in hospitalization rate and mortality after acute myocardial infarction in Denmark after diagnostic criteria and methods changed. Eur Heart J 2005; 26(10):990-995. (750) Official ICD-9-CM Alerts Archives. Acute myocardial infarction.
2005.
(751) Dorsch MF, Lawrance RA, Sapsford RJ, Oldham J, Greenwood DC, Jackson BM et al. A simple benchmark for evaluating quality of care of patients following acute myocardial infarction. Heart 2001; 86(2):150-154. (752) Tu JV, Austin PC, Walld R, Roos L, Agras J, McDonald KM. Development and validation of the Ontario acute myocardial infarction mortality prediction rules. J Am Coll Cardiol 2001; 37(4):992-997.
390
Literatuur
(753) Acute Myocardial Infarction Mortality Rate (IQI 15). In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 54-56. (754) Acute Myocardial Infarction Mortality Rate, Without Transfer Cases (IQI 32). In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals Volume, Mortality, and Utilization. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 54-56. (755) Luepker RV, Apple FS, Christenson RH, Crow RS, Fortmann SP, Goff D et al. Case definitions for acute coronary heart disease in epidemiology and clinical research studies: a statement from the AHA Council on Epidemiology and Prevention; AHA Statistics Committee; World Heart Federation Council on Epidemiology and Prevention; the European Society of Cardiology Working Group on Epidemiology and Prevention; Centers for Disease Control and Prevention; and the National Heart, Lung, and Blood Institute. Circulation 2003; 108(20):2543-2549. (756) Gilbert M, Thimus A, Roger-France FH, Jeanjean M, Camberlain C, Mertens I et al. L'infarctus du myocarde/Myocardinfarct. In: Gilbert M, Thimus A, RogerFrance FH, Camberlain C, Mertens I, Figeys A et al., editors. Validité des données hospitalières pour leur exploitation en épidémiologie/ De validiteit van ziekenhuisgegevens voor gebruik in de epidemiologie. SSTC/AG/10/031 ed. Bruxelles/Brussel: Agora; 2004. 10-13. (757) Van de WF, Ardissino D, Betriu A, Cokkinos DV, Falk E, Fox KA et al. Management of acute myocardial infarction in patients presenting with STsegment elevation. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 2003; 24(1):2866. (758) Krumholz HM, Wang Y, Mattera JA, Wang Y, Han LF, Ingber MJ et al. An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with an acute myocardial infarction. Circulation 2006; 113(13):1683-1692. (759) Stenestrand U, Lindback J, Wallentin L. Long-term outcome of primary percutaneous coronary intervention vs prehospital and in-hospital thrombolysis for patients with ST-elevation myocardial infarction. JAMA 2006; 296(14):1749-1756. (760) Gandjour A, Kleinschmit F, Lauterbach KW. European comparison of costs and quality in the treatment of acute myocardial infarction (2000-2001). Eur Heart J 2002; 23(11):858-868.
Literatuur
391
(761) Harrell FE, Jr., Lee KL, Califf RM, Pryor DB, Rosati RA. Regression modelling strategies for improved prognostic prediction. Stat Med 1984; 3(2):143-152. (762) Shwartz M, Ash AS. Evaluating Risk-Adjustment Models Empirically. In: Iezzoni LI, editor. Risk Adjustment for Measuring Health Care Outcomes. Third ed. Chicago, IL: 2003. 231-273. (763) Eagle KA, Lim MJ, Dabbous OH, Pieper KS, Goldberg RJ, Van de WF et al. A validated prediction model for all forms of acute coronary syndrome: estimating the risk of 6-month postdischarge death in an international registry. JAMA 2004; 291(22):2727-2733. (764) Salomaa V, Miettinen H, Niemela M, Ketonen M, Mahonen M, Immonen-Raiha P et al. Relation of socioeconomic position to the case fatality, prognosis and treatment of myocardial infarction events; the FINMONICA MI Register Study. J Epidemiol Community Health 2001; 55(7):475-482. (765) Kunst AE, Groenhof F, Mackenbach JP, Health EW. Occupational class and cause specific mortality in middle aged men in 11 European countries: comparison of population based studies. EU Working Group on Socioeconomic Inequalities in Health. BMJ 1998; 316(7145):1636-1642. (766) Zijlstra F. Does it matter where you go with an acute myocardial infarction? Eur Heart J 2001; 22(19):1764-1766. (767) Kostis WJ, Demissie K, Marcella SW, Shao YH, Wilson AC, Moreyra AE. Weekend versus weekday admission and mortality from myocardial infarction. N Engl J Med 2007; 356(11):1099-1109. (768) Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely Collected Data for the Assessment of the Reproductive Health of a Community Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch Public Health 2005; 63:259-278. (769) Thomas DC. The problem of multiple inference in identifying point-source environmental hazards. Environ Health Perspect 1985; 62:407-414. (770) Wartenberg D, Greenberg M. Detecting disease clusters: the importance of statistical power. Am J Epidemiol 1990; 132(1 Suppl):S156-S166. (771) Neutra RR. Counterpoint from a cluster buster. Am J Epidemiol 1990; 132(1):1-8. (772) Olsen SF, Martuzzi M, Elliott P. Cluster analysis and disease mapping--why, when, and how? A step by step guide. BMJ 1996; 313(7061):863-866. (773) Kulldorff M, Athas WF, Feurer EJ, Miller BA, Key CR. Evaluating cluster alarms: a space-time scan statistic and brain cancer in Los Alamos, New Mexico. Am J Public Health 1998; 88(9):1377-1380.
392
Literatuur
(774) Geschwind SA, Stolwijk JA, Bracken M, Fitzgerald E, Stark A, Olsen C et al. Risk of congenital malformations associated with proximity to hazardous waste sites. Am J Epidemiol 1992; 135(11):1197-1207. (775) Dolk H, Vrijheid M, Armstrong B, Abramsky L, Bianchi F, Garne E et al. Risk of congenital anomalies near hazardous-waste landfill sites in Europe: the EUROHAZCON study. Lancet 1998; 352(9126):423-427. (776) Fielder HMP, Poon-King CM, Palmer SR, Moss N, Coleman G. Assessment of impact on health of residents living near the Nant- y-Gwyddon landfill site: retrospective analysis. BMJ 2000; 320(7226):19-22. (777) Schoeters G, Cornelis C, De Fré R, Hooghe R, Collier M, Maes C et al. Studie van gezondheidsaspecten en gezondheidsrisico's ten gevolge van de milieuverontreiniging in de Neerlandwijk te Wilrijk. 1998/TOX/R/009., 1-139. 1998. Mol, VITO. (778) Birnbaum LS. Workshop on perinatal exposure to dioxin-like compounds. V. Immunologic effects. Environ Health Perspect 1995; 103 Suppl 2:157-160. (779) Fries GF, Paustenbach DJ. Evaluation of potential transmission of 2,3,7,8tetrachlorodibenzo-p-dioxin-contaminated incinerator emissions to humans via foods. J Toxicol Environ Health 1990; 29(1):1-43. (780) Neubert R, Maskow L, Webb J, Jacob-Muller U, Nogueira AC, Delgado I et al. Chlorinated dibenzo-p-dioxins and dibenzofurans and the human immune system. 1. Blood cell receptors in volunteers with moderately increased body burdens. Life Sci 1993; 53(26):1995-2006. (781) Koopman-Esseboom C, Weisglas-Kuperus N, de Ridder MA, Van der Paauw CG, Tuinstra LG, Sauer PJ. Effects of polychlorinated biphenyl/dioxin exposure and feeding type on infants' mental and psychomotor development. Pediatrics 1996; 97(5):700-706. (782) Kogevinas M, Becher H, Benn T, Bertazzi PA, Boffetta P, Bueno-de-Mesquita HB et al. Cancer mortality in workers exposed to phenoxy herbicides, chlorophenols, and dioxins. An expanded and updated international cohort study. Am J Epidemiol 1997; 145(12):1061-1075. (783) Feeley MM. Workshop on perinatal exposure to dioxin-like compounds. III. Endocrine effects. Environ Health Perspect 1995; 103 Suppl 2:147-150. (784) Egeland GM, Sweeney MH, Fingerhut MA, Wille KK, Schnorr TM, Halperin WE. Total serum testosterone and gonadotropins in workers exposed to dioxin. Am J Epidemiol 1994; 139(3):272-281.
Literatuur
393
(785) Weisglas-Kuperus N. Neurodevelopmental, immunological and endocrinological indices of perinatal human exposure to PCBs and dioxins. Chemosphere 1998; 37(9-12):1845-1853. (786) Peper M, Klett M, Frentzel-Beyme R, Heller WD. Neuropsychological effects of chronic exposure to environmental dioxins and furans. Environ Res 1993; 60(1):124-135. (787) Mukerjee D. Health impact of polychlorinated dibenzo-p-dioxins: a critical review. J Air Waste Manag Assoc 1998; 48(2):157-165. (788) James WH. Re: "Male pesticide exposure and pregnancy outcome". Am J Epidemiol 1999; 149(3):290-291. (789) Williams FL, Lawson AB, Lloyd OL. Low sex ratios of births in areas at risk from air pollution from incinerators, as shown by geographical analysis and 3dimensional mapping. Int J Epidemiol 1992; 21(2):311-319. (790) Mocarelli P, Brambilla P, Gerthoux PM, Patterson DG, Needham LL. Change in sex ratio with exposure to dioxin. Lancet 1996; 348(9024):409. (791) Hansen D, Moller H, Olsen J. Severe periconceptional life events and the sex ratio in offspring: follow up study based on five national registers. BMJ 1999; 319(7209):548-549. (792) Clapp R, Ozonoff D. Where the boys aren't: dioxin and the sex ratio. Lancet 2000; 355(9218):1838-1839. (793) Mocarelli P, Gerthoux PM, Ferrari E, Patterson DG, Kieszak SM, Brambilla P et al. Paternal concentrations of dioxin and sex ratio of offspring. Lancet 2000; 355(9218):1858-1863. (794) James WH. Re: "Total serum testosterone and gonadotropins in workers exposed to dioxin". Am J Epidemiol 1995; 141(5):476-7; discussion 477-8. (795) Nessel CS, Butler JP, Post GB, Held JL, Gochfeld M, Gallo MA. Evaluation of the relative contribution of exposure routes in a health risk assessment of dioxin emissions from a municipal waste incinerator. J Expo Anal Environ Epidemiol 1991; 1(3):283-307. (796) Pleus RC, Kelly KE. Health effects from hazardous waste incineration facilities: five case studies. Toxicol Ind Health 1996; 12(2):277-287. (797) Lloyd OL, Lloyd MM, Williams FL, Lawson A. Twinning in human populations and in cattle exposed to air pollution from incinerators. Br J Ind Med 1988; 45(8):556-560.
394
Literatuur
(798) Rydhstroem H. No obvious spatial clustering of twin births in Sweden between 1973 and 1990. Environ Res 1998; 76(1):27-31. (799) James WH. Secular trends in monitors of reproductive hazard. Hum Reprod 1997; 12(3):417-421. (800) Knox E. Childhood cancers, birthplaces, incinerators and landfill sites. Int J Epidemiol 2000; 29(3):391-397. (801) Savitz DA. Environmental exposures and childhood cancer: our best may not be good enough. Am J Public Health 2001; 91(4):562-563. (802) Neutra RR. Epidemiology for and with a distrustful community. Environ Health Perspect 1985; 62:393-397. (803) Weinberg CR, Wilcox AJ. Reproductive Epidemiology. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 585-608. (804) Staines A, Järup L. Health event data. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 15-29. (805) De Wals P, Vincotte-Mols M, Lys F, Borlee I, Lechat MF. [Evaluation of the registration of congenital abnormalities in Belgian civilian vital statistics]. Arch Belg 1987; 45(11-12):441-451. (806) Sedman RM, Esparza JR. Evaluation of the public health risks associated with semivolatile metal and dioxin emissions from hazardous waste incinerators. Environ Health Perspect 1991; 94:181-187. (807) Hill AB. Statistical Evidence and Inference. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 285-296. (808) Rothman KJ, Greenland S. Causation and Causal Inference. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 7-28. (809) Buekens P, Derom R, De Wals P. Perinatal health in Belgium: an introduction. Biol Neonate 1989; 55(1):6-9. (810) Oakes MW. Statistical Inference. One Newton Executive Park,Newton Lower Falls: One Newton Epidemiology Resources Inc.; 1990. (811) SAS Institute Inc. The LOGISTIC Procedure. In: SAS Institute Inc., editor. SAS/STAT User's Guide, Version 6. Fourth ed. Cary, NC: SAS Institue Inc.; 1989. 1071-1126.
Literatuur
395
(812) Rothman KJ. A sobering start for the cluster busters' conference. Am J Epidemiol 1990; 132(1 Suppl):S6-13. (813) Quataert PK, Armstrong B, Berghold A, Bianchi F, Kelly A, Marchi M et al. Methodological problems and the role of statistics in cluster response studies: a framework. Eur J Epidemiol 1999; 15(9):821-831. (814) McMahon B, Trichopoulos D. Epidemiology: Principles and Methods. 2 ed. Boston: Little, Brown and Company; 1996. (815) Dolk H, De Wals P. Congenital Anomalies. In: Elliott P, Cuzick J, English D, Stern R, editors. Geographical and Environmental Epidemiology: Methods for Small- Area Studies. Oxford: Oxford University Press.; 1992. 72-88. (816) Rothman KJ, Greenland S. Measures of Disease Frequency. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 29-46. (817) Schwartz J. Harvesting and long term exposure effects in the relation between air pollution and mortality. Am J Epidemiol 2000; 151(5):440-448. (818) Hertz-Picciotto I. Environmental Epidemiology. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 555-583. (819) Bennett P. Understanding responses to risk: some basic findings. In: Bennett P, Calman K, editors. Risk communication and public health. Oxford University Press; 2001. 3-19. (820) Rothenberg RB, Thacker SB. Guidelines for the investigation of clusters of adverse health events. In: Elliott P, Cuzick J, English D, Stern R, editors. Geographical and Environmental Epidemiology: Methods for Small- Area Studies. Oxford: Oxford University Press.; 1992. 264-277. (821) Dolk H. Commentary: impact on health needs assessing from different angles. BMJ 2000; 320(7226):23.
397 Curriculum vitae Willem H. G. Aelvoet MD, MPH, MSc(Biost.), geboren:14/02/1947. Ervaring: I Sinds 1/11/2000 tot op heden. Geneesheer-statisticus op de F.O.D. Volksgezondheid, Veiligheid van de Voedselketen en Leefmilieu - DG1 - Datamanagement - Cel Studies, verantwoordelijke voor de cel studies en belast met analyses en rapportage van de Minimale Klinische Gegevens (MKG). Voornaamste opdrachten : uitwerken en begeleiden van klinische performance indicatoren en methodologische ondersteuning bij de kwaliteitsbewaking van de MKG. Vanaf het academisch jaar 2002-2003 tot op heden: verstrekken van een cursus over Gezondheidsindicatoren voor de “Interuniversitaire opleiding Geneesheer specialist in het beheer van gezondheidsgegevens.” II 1987 tot oktober 2000 Verantwoordelijk voor de Geboorte en Sterftestatistiek van Vlaanderen Verantwoordelijk voor de kwaliteitsbewaking van het coderen, het verzamelen, verwerken en rapporteren van de geboorte- en overlijdensstatistieken ten behoeve van het gezondheidsbeleid. Voornaamste verwezenlijkingen: centralisatie en evaluatie van het codeergebeuren; tijdige rapportage van de geboorte- en overlijdensstatistieken onder vorm van gezondheidsindicatoren met inbegrip van risicogedrag (bijvoorbeeld Tabaksgerelateerde mortaliteit); III Projectleider: Projet Centre d'Instruction Médicale de Maroua, Kameroen, 1980-6. Werkte mee aan het ontwikkelen van en was verantwoordelijk voor het uitvoeren van een geïntegreerd eerstelijns en tweedelijns gezondheidzorg pilootproject in het Diamaré district. IV Geneesheer-directeur van het rurale ziekenhuis Miabi en zijn attractie-zone, Zaire 1972-1979.
398
Curriculum vitae
Opleiding: Diploma
Instelling
Jaar
Master of Science in Biostatistics
Limburgs Universitair
1994
Centrum Université Libre de Bruxelles
1987
Maîtrise en Santé Publique
IMT, Antwerpen
1977
Diploma Tropische Geneeskunde
ITG, Antwerpen
1971
Doctor in de Genees-, Heel- en Verloskunde
Katholieke Universiteit
1971
Statistical, Epidemiological and Operational Methods Applied in Medicine and Public Health
Leuven Cursussen & Workshops 1) Longitudinal Data Analysis januari-maart 2005 Censtat, UHasselt 2) Workshop on Statistical Inference. LUC Diepenbeek: April 10-12,2000. 3) Bayes and Empirical Bayes methods for data analysis. KUL, TA Louis: Dec. 9/11/1998 4) Spatial Statistical Methods in Epidemiology. A. Lawson: March 24-26/1998 at BCTKUL. 5) Exact Methods for Contingency Tables and Logistic Regression. C. Mehta: 9/06/1995. Hasselt. 6) Fourth International Course on Ageing. A. Kalache, London School of Hygiene & Tropical Medecine: 30 August-23 September 1988
399 Literatuurlijst Willem AELVOET ARTIKELS Lauwers P, Aelvoet W, Sneppe R, Remion M. Effect of car driving on the electrocardiogram of patients with myocardial infarction and an E.C.G. at rest devoid of dysrhythmia and repolarisation abnormalities: comparison with the E.C.G. changes obtained during exercise. Acta Cardiol. 1973;28(1):27-43. Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruik maken van een geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8. Snacken R, Lion J, Van Casteren V, Cornelis R, Yane F, Mombaerts M, Aelvoet W, Stroobant A. Five years of sentinel surveillance of acute respiratory infections (19851990): the benefits of an influenza early warning system. Eur J Epidemiol. 1992 Jul;8(4):485-90. Van Oyen H, Aelvoet W, Tafforeau J. Overlijdenspatroon in het Vlaamse Gewest. Tijdschrift voor Geneeskunde 1993; 49:821-828 Beutels M, Van Damme P, Aelvoet W, Desmyter J, Dondeyne F, Goilav C, Mak R, Muylle L, Pierard D, Stroobant A, Van Loock F, Waumans P, Vranckx R. Prevalence of hepatitis A, B and C in the Flemish population. Eur J Epidemiol. 1997 Apr;13(3):275-80.
De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from the WHO-MONICA GhentCharleroi Study in Belgium. J Epidemiol Community Health 1998;52:513-9.
400
Literatuurlijst Willem Aelvoet
Aelvoet W, Capet F, Vanoverloop J. Verhoogde sterfte in het arrondissement Dendermonde. Kunnen overlijdensstatistieken hierover uitsluitsel brengen? Tijdschrift voor Geneeskunde 1998;54:1548-57. Moens G, Capet F, Aelvoet W, Van Oyen H, Drieskens S, Van Casteren V. De recente evolutie van suïcidaal gedrag in Vlaanderen. Tijdschrift voor Geneeskunde 1999; 55(2):96104. Aelvoet W, Wildemeersch D. De peilpraktijken en het gezondheidsbeleid: een toekomstperspectief voor de Vlaamse overheid. Huisarts Nu 1, 46-47. 2000. Aelvoet W. On the use of administrative databases to support planning activities: a comment. Eur.J.Public Health 2005;15:215 (letter). Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997: Quality of coding. Arch Public Health 2005;63:127-48. Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely Collected Data for the Assessment of the Reproductive Health of a Community Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch Public Health 2005;63:259-78. Aelvoet W, Terryn N, Windey F, Redivo M, Faes C. Miscoding a threat to the hospital care system: how detect it ? Submitted RESP,2007. Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk deliveries using administrative data. An initiative to improve the quality of care. BMC Health Services Research 2008;8(1);3.
Literatuurlijst Willem Aelvoet
401
HOOFDSTUKKEN IN BOEK Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In Nijs H, Denekens J, eds.Preventieve Gezondheidszorg, pp 914-21. Diegem Editorial: Kluwer, 1997. Depoorter AM, Aelvoet W, Bogaerts K, Capet F, De Greef M, Dewolf D et al. Gezondheidgegevens m.b.t. de jeugd in Vlaanderen. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 942-968. Aelvoet W. Mortinataliteit en zuigeligensterfte. In Van Der Haeghe H, ed. Over sterfte, pp 69-80. Brussel: CBGS, 1991. RAPPORTEN Aelvoet W. Essai de rationalisation d’un service médical de zone rurale au Zaire MPH Thesis. IMT/ITG Antwerpen 1977 Aelvoet, W. Vital Statistics in Flanders. An Exploration of Possible Biases due to Coding and Certification Practices. 1-46. 1994. MSc Thesis. Limburgs Universitair Centrum. Van Oyen H., Tafforeau J., Aelvoet W., Felten G.: Overlijden en oorzaakspecifiek overlijden in de Vlaamse Gemeenschap 1987. Brussel: COOV, IHE, 1992. Tafforeau J, Van Oyen H, Drieskens S, Demoulin P, Pirenne Y, Aelvoet W et al. Statistiques de décès en communauté francaise: 1987. 1992. Bruxelles, CROSP, IHE. Van Oyen H., Tafforeau J., Aelvoet W., Felten G.: Overlijden en oorzaakspecifiek overlijden in de Vlaamse Gemeenschap 1988. Brussel: COOV, IHE, 1994. Van Oyen H., Drieskens S., Tafforeau J., Aelvoet W., Felten G.: Geboorten, perinatale sterfte en kindersterfte, 1987. Brussel. COOV, IHE, 1994.
402
Literatuurlijst Willem Aelvoet
Tafforeau J, Van Oyen H, Drieskens S, Squilbin G, Demoulin P, Aelvoet W. Naissancces, mortalité périnatale et infantile: statistiques 1988 et 1989. 1996. Bruxelles, CROSP, IHE. Capet F, Bogaerts K, Aelvoet W. Verwerking Registratiegegevens van het Medisch Schooltoezicht. Lengte en gewicht. 1996. Brussel, Ministerie van de Vlaamse Gemeenschap. Tafforeau J, Van Oyen H, Drieskens S, Demoulin P, Pirenne Y, Aelvoet W et al. Statistiques de décès en communauté francaise: 1989-1991. 1997. Bruxelles, CROSP, IHE. Aelvoet W, Nelen V, Schoeters G, Vanoverloop J, Wallijn E, Vlietinck R: Risico op gezondheidsschade bij kinderen van de Neerlandwijk te Wilrijk. Rapport 1998/TOX/R/030, 1998. Aelvoet, W., Bogaert, J., Gillet, P., and Molenberghs, G. Bepaling van de invloed van sociale factoren en van het individuele ziekenhuis op de verblijfsduur in de sector van de acute ziekenhuizen, aan de hand van de gekoppelde MKG- en MFG-1996. 2001. Brussel, Ministerie van Sociale Zaken, Volksgezondheid en Leefmilieu. Baert, E., Byttebier, G., De Backer, G., Van Oyen, H., Aelvoet, W., and De Henauw, S. Ontwikkeling van geïntegreerde gezondheidsindicatoren op basis van bestaande Vlaamse gegevens in zake ziekte en gezondheid. PBO/UG/43, 1-98. 2001. Gent, RUG. Aelvoet, W., Mertens, I., and van Sprundel, M. Uitwendige oorzaken in de Minimale Klinische Gegevens.
2002. Brussel, FOD Volksgezondheid, Veiligheid van de
Voedselketen en Leefmilieu. Kirkhove P, Gillet P, Terryn N, Aelvoet W. Des Audits Aléatoires à des Audits Ciblés. Le Bulletin
2002;
http:/www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/
(acceeded 15/06/2005):1-9.
403
Literatuurlijst Willem Aelvoet
Aelvoet, W., Dargent, G., Delvaux, A., Iweins, F., Terryn, N, Mertens, I, and van Sprundel, M. Human, social and economic costs due to non-fatal motor vehicle traffic accidents. An approach based on routinely collected data. 2003. FOD Volksgezondheid, Veiligheid van de Voedselketen en Leefmilieu. Aelvoet W, Terryn N, Windey F, Loosen F, Faes C, Molenberghs G et al. Audit MKG en fraudeopsporing - ontwikkeling van een methodologie.
1-45. 2006. Brussel, FOD
Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. MKG en screening van problemen i.v.m. performance/kwaliteit van zorgen.
1-24. 2006. Brussel, FOD Volksgezondheid,
Veiligheid van de Voedselketen, Leefmilieu Aelvoet W, Terryn N, Windey F, Loosen F. Keizersnedencijfer (IQI 21). 1-28. 2006. Brussel,
FOD
Volksgezondheid,
Veiligheid
van
de
Voedselketen,
Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. Laparoscopische Cholecystectomie (IQI 23). 1-24. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu Aelvoet W, Terryn N, Windey F, Loosen F. Intraziekenhuis letaliteit na opname voor Acuut Myocardinfarct (AMI) (IQI 15 en IQI 15 en IQI 32). 1-27. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu. Aelvoet W, Terryn N, Windey F, Loosen F. Ziekenhuisletaliteit na een opname voor Pneumonie (Community-Acquired Pneumonia) (CAP) (IQI 20). 1-26. 2006. Brussel, FOD Volksgezondheid,
Veiligheid
van
de
Voedselketen,
Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. Ziekenhuisletaliteit na opname voor Heupfractuur (IQI 19). 1-25. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.
404
Literatuurlijst Willem Aelvoet
GEZONDHEIDSINDICATOREN VLAAMSE GEMEENSCHAP Aelvoet W. Gezondheidsindicatoren 1993. Brussel: Ministerie van de Vlaamse Gemeenschap., 1995. Aelvoet W. Bogaerts K, Capet F. Gezondheidsindicatoren 1994. Brussel: Ministerie van de Vlaamse Gemeenschap., 1996. Aelvoet W, Bogaerts K, Capet F, Quataert PK. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap., 1997. Aelvoet W, Capet F, Vanoverloop J. Gezondheidsindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap., 1998. Aelvoet W, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1997. Brussel: Ministerie van de Vlaamse Gemeenschap., 1999. Aelvoet W, Cloots H, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1998. Brussel: Ministerie van de Vlaamse Gemeenschap., 2000.