Detectie van anomalieën in facturatiegegevens Screening onrealistische waarden
Bruynseels Patrick, actuariaatsinspecteur Datamanagement Cel, RIZIV SAS Forum BELUX Louvain-La-Neuve, 3/10/2013
Overzicht
1. Facturatiegegevens geneesmiddelen
2. Business Problem: onrealistische waarden
3. Geïntegreerde oplossing
4. Screening
5. Resultaten
1. Facturatiegegevens geneesmiddelen
Verpleegdagen Geneesmiddelen Radio-isotopen Bloed Geneeskundige verstrekkingen Klinische biologie Medische beeldvorming Implantaten … Gedetailleerde gegevens betreffende verleende zorgen
•Verzekeringsinstelling (VI)
•Patient •ziekenhuis polikliniek opname daghospitalisatie
Bestanden PH Bestanden AZV Bestanden ADH …
•RIZIV Geaggregeerde statistische gegevens
controle
informatiestromen Financiële stromen
1. Facturatiegegevens geneesmiddelen
3 bestanden i.v.m. geneesmiddelen : PH, ADH en AZV -
allen geven informatie over product, verpleeginrichting, periode van aflevering + elk model specifiek bijkomende parameters
Bestanden PH
polikliniek daghospitalisatie
Detail record
aantal records
Terugbetaald bedrag
per trimester
2.6 mio
580 mio €
per behandeling
14 mio
910 mio €
per opname
46 mio
495 mio €
ziekenhuisopname Bestanden ADH
daghospitalisatie
Bestanden AZV ziekenhuisopname
Info over terugbetaling van 4500 producten in 235 verpleeginrichtingen Per trimester, per verblijf en/of per dag
-> 60 mio records per jaar
1. Facturatiegegevens geneesmiddelen/controle
Kwaliteit individuele record • Controle van de syntax, de inhoud en combinaties van de zones • Van vrij simpel tot redelijk complex • Aan de hand van 50-tal regels en 20-tal referentiebestanden
Volledigheid • Vergelijking met andere bronnen
Betrouwbaarheid • Nagaan evolutie(s) aan de hand van één of meerdere parameters • Ad hoc onderzoek bij exploitatie van gegevens Indien niet aanvaardbaar -> vraag om nieuwe, verbeterde gegevens
-> gegevens van hoge kwaliteit
2. Onrealistische waarden/bestaan Toch … 2004: Bij een studie in verband met het antibiotica*verbruik in België: …
Dienst
Trimester aflevering
22 22 22 22
20021 20022 20023 20024
…
product
…
0764746 0764746 0764746 0764746
ZIV-bedrag
Eenheden
334.665,54 2.838,93 2.789,70 2.756,88
Ciproxine IV flexibag 400 MG/200 ML met glucose 5%
In 1 ziekenhuis, 1 dienst, … Totaal over alle ziekenhuizen, alle diensten : 60.000 eenheden Onderzoek gevraagd bij VI : • 34 eenheden in plaats van 10.197 • 333.549,66 euro gerecupereerd *Antibiotica: ongeveer 8% van het totaal aantal records
10.197 88 85 84
…
2. Onrealistische waarden/probleem
Eender welke selectiemethode - op een volledig bestand - levert 100-den records die mogelijk onrealistische waarden bevatten (bv. ‘outliers’ op product en/of ziekenhuisniveau) Analyse van enkele leert dat de meeste toch aanvaardbaar zijn (cfr. voorbeeld) -> alle records met mogelijke onrealistische waarden moeten geanalyseerd worden, indien niet risico enkel dossiers over te maken die aanvaardbaar zijn Analyse van alle ‘kandidaten’ is moeizaam en complex diversiteit van producten karakter ziekenhuis verwerken en analyseren van miljoenen records gevalideerde gegevens laattijdig beschikbaar geen (aangepaste) gestructureerde databank … Huidige organisatie laat niet toe om alle mogelijke onrealistische waarden te analyseren binnen de beschikbare tijd -> mogelijk dat er geen dossiers gevonden worden
2. Onrealistische waarden/voorbeeld aanvaardbaar Voorbeeld analyse - mogelijk NOVOSEVEN 120 K.I.U. – 4,3 ml oplossing (facturatie per K.I.U.) …
Dienst
Trimester aflevering
99 99 99
20073 20072 20072
…
product
…
ZIV-bedrag
747675 747675 747675
1.478,82 4.436,46 272.102,88
Eenheden 120 360 22080
Onrealistisch? Nee, de 8,5 ml oplossing wordt meestal gebruikt NOVOSEVEN 240 K.I.U. – 8,5 ml oplossing (facturatie per K.I.U.) 99 99 72 99 99 72 72 72 99 99
20073 20072 20073 20074 20072 20074 20073 20072 20073 20072
747667 747667 747667 747667 747667 747667 747667 747667 747667 747667
2.950,51 5.901,02 5.901,02 35.406,14 70.812,28 407.170,63 401.269,59 212.436,84 165.228,68 380.616,06
240 480 480 2880 5760 33120 32640 17280 13440 30960
…
2. Onrealistische waarden/opbouw expertise
‘kandidaten’ blijven analyseren Opdoen productkennis, karakter ziekenhuis, … Testen technische mogelijkheden, analysetechnieken, …
Teneinde meest risicovolle gevallen te behandelen recuperatie ongeveer 6 mio euro
2007 : 1 dossier overgemaakt aan VI:
ZIV-bedrag
2008 : 1 dossier overgemaakt aan DGEC (RIZIV): 1.400.000 1.200.000 1.000.000 800.000 600.000 400.000 200.000 0
DGEC
daling ongeveer 2 mio euro per jaar
Teneinde aanvaardbare gevallen sneller te elimineren -> Meer ‘kandidaten’ kunnen worden onderzocht -> Mogelijk echt onrealistische waarden kunnen grondiger worden bestudeerd 2009 :15-tal dossiers overgemaakt aan VI voor totaal bedrag van ongeveer 1 mio euro
3. Geïntegreerde oplossing/ 2010
Herstructurering Controles • • • •
Alles in eigen beheer Aansturing via Dashboard Centralisatie BusinessRules en Referentielen in één repertorium Automatische productie rapporten/bestanden met anomalieën
Organisatie DWH • • • • •
Onmiddellijke beschikbaarheid van ontvangen gegevens (gigabytes) Beschikbaarheid van andere jaren en andere gegevens (terabytes) Uniforme bestanden Organisatie in bestanden volgens periode/editie/… (deelvolumes) Toegankelijkheden strikt geregeld en beveiligd
SAS entreprise guide -> datamining • alle gegevens, (tussen)resultaten, bewerkingen in projectview • op intuïtieve wijze verwerken en exploreren van gegevens in soepele wisselwerking met andere tools als excel
4. Screening/aanwending nieuwe tools
Zoeken naar mogelijk onrealistische waarden (in miljoenen records) • Filters: • Query’s : • Grafieken :
tussen, gelijk aan, groter dan, … Minima, maxima, gemiddelden, totalen, deviaties, … Boxplots, bubble plots, scatterplots, …
Opzoeken zoveel mogelijk detail en/of bijkomende informatie (in miljoenen records) • List :
reeks producten (‘outliers’, ‘analogen’), verblijfsnummers, … (100, 500, …) vanuit excel, access, SAS, … • Rank: indien teveel detail (tienduizenden records) -> top 20, 50, 100 … • Link/Append : andere jaren/bronnen/tussenresultaten (tienduizenden records)
Verwerken & Analyseren, ook met Excel (-> send tot excel) • Elimineren mogelijk aanvaardbare waarden • Detecteren en accentueren hoogstwaarschijnlijk onrealistische waarden
Iteratief trial & error proces
4. Screening/elimineren
Elimineren mogelijk aanvaardbare waarden Dikwijls bij / omwille van -
Speciale producten: kanker, hemofilie, zeldzame ziekten, … Ernstige/intensieve behandelingen Specifiek karakter (specialisatie) van het ziekenhuis
-
Gebruik van/voorkeur voor bepaald product van zelfde groep (cfr. novoseven) Wijze van factureren (cfr. voorbeeld) …
Bij sommige producten is dosering en doseerfrequentie sterk individueel bepaald bv. op basis van lichaamsgewicht of lichamelijk toestand Gevoelig om uitleg te vragen over mogelijk onrealistische waarde in speciale of ernstige gevallen en/of bij gespecialiseerde verpleeginrichtingen
Ongeveer 1 op 1 miljoen records geeft mogelijk kans op vertekening bij exploitatie (studies, analyses, berekeningen, publicaties, …)
4. Screening/elimineren
Voorbeeld analyse - mogelijk …
Dienst
Trimester aflevering
anoniem patientnummer
720 24Aug2011 26190870000 720 09Aug2011 00053978097 720 17Dec2010 00088121146 720 04Feb2011 00021130813 720 10Dec2010 00052202338 720 30Jan2012 00184358034 720 20Jan2011 00064294713 720 30Jan2012 00103398726 720 12Nov2010 W876398DVO1 720 25Nov2010 W876398DVO1 720 09Dec2010 W876398DVO1 720 23Dec2010 W876398DVO1 720 06Jan2011 W876398DVO1 720 03Feb2011 W876398DVO1 720 17Feb2011 W876398DVO1 … Toegediende hoeveelheid 140 120 100 80
Aantal Records
60 40 20
0 1
6 10 15 18 21 24 27 30 33 36 39 42 60 350
opname nummer
produit
019 021 005 015 001 028 005 034 002 003 004 005 006 007 008 …
0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 0785683 …
…
ZIV-bedrag 197263,50 40579,92 37198,26 33816,60 30434,94 27053,28 27053,28 23671,62 22544,40 22544,40 22544,40 22544,40 22544,40 22544,40 22544,40 …
Eenheden
…
350 72 66 60 54 48 48 42 40 40 40 40 40 40 40 …
Facturatie van 5 maanden op één maand Patient … 201106 201107 201108 201109 201110 201111 201112 201201 201202 201203 … P1 114 76 389 78 79 78 P2 74 111 74 74 74 74 111 74 74 74 P3 72 72 72 72 72 106 72 71 70 70 P4 68 68 102 68 68 68 68 68 102 68 P5 103 71 71 70 72 71 71 70 105 70 P6 66 99 66 66 66 66 99 66 66 66 P7 68 68 103 68 68 68 66 66 68 68 P8 66 66 33 67 99 67 66 66 66 66 P9 80 40 40 80 80 81 80 80 80 P10 71 70 70 71 105 70 70 35 70 70 …
4. Screening/accentueren
Voorbeeld dossier aan VI oa_vi_id account_yy_ss stay_place_id hosp_serv_id realization_date reimbt_cat_id drug_code relative_care_id
amount_reimbd qty
amount_not_reimbd
888
20126
71077323
220
20121
756081
0781773
000000
90,81
1
0,00
888
20126
71077323
720
20114
750934
0781773
000000
718,66
2
22,00
888
20126
71077323
720
20121
750934
0781773
000000
2.887,44
8
75,20
888
20126
71077323
720
20122
750934
0781773
000000
36.493,86 106
60,24
888
20126
71077323
990
20121
750934
0781773
000000
359,03
1
11,30
vorige semesters 888
20117
71077323
720
20113
750934
0781773
000000
3.608,10
10
65,96
888
20117
71077323
720
20114
750934
0781773
000000
2.522,71
7
69,60
888
20116
71077323
720
20111
750934
0781773
000000
1.800,35
5
51,30
888
20116
71077323
720
20101
750934
0781773
000000
1.441,72
4
28,82
888
20117
71077323
720
20112
750934
0781773
000000
1.437,32
4
44,00
888
20116
71077323
720
20112
750934
0781773
000000
722,36
2
18,30
top andere ziekenhuizen (> 15) 888
20126
71077233
720
20121
750934
0781773
000000
7.913,86
22
233,40
888
20116
71077017
720
20111
750934
0781773
000000
7.186,60
20
220,00
888
20116
71077233
720
20111
750934
0781773
000000
7.201,40
20
205,20
888
20117
71077233
720
20113
750934
0781773
000000
6.856,87
19
179,40
888
20126
71077006
720
20121
750934
0781773
000000
5.744,48
16
180,80
888
20117
71077017
720
20113
750934
0781773
000000
5.760,38
16
164,90
888
20117
71077017
720
20114
750934
0781773
000000
5.756,68
16
168,60
888
20117
71077233
720
20114
750934
0781773
000000
5.393,65
15
161,30
888
20116
71077009
720
20111
750934
0781773
000000
5.401,05
15
153,90
Situering ten opzichte van voorgaande semesters en ten opzichte van andere ziekenhuizen
5. resultaten
Verbetering kwaliteit Boeking
…
…
produit
…
Dienst
Trimester aflevering
ZIVbedrag
1ste sem 2011
210
20111
0734301
244.218,71
16.713
1ste sem 2012
210
20111
0734301
-244.101,82
-16.708
1ste sem 2011
730
20111
0788265
121.355,00
441
1ste sem 2012
730
20111
0788265
-115.576,19
-420
1ste sem 2011
990
20111
0788281
121.355,00
441
1ste sem 2012
990
20111
0788281
-115.576,19
-420
Alleen snelle detectie leidt tot verbetering van de kwaliteit (late regularisatie komt onder aparte code in ander model)
Eenheden
5. resultaten
Doeltreffend
4.000.000 3.500.000
ZIV-bedrag
3.000.000 2.500.000 2.000.000
betrokken bedrag
90% terecht
1.500.000 fout bevestigd
1.000.000 trend
500.000 0 1ste sem 2de sem 1ste sem 2de sem 1ste sem 2de sem 1ste sem 2009 2009 2010 2010 2011 2011 2012
2009 : aarzelend begin : grote onzekerheid, beperkt aantal dossiers effectief overgemaakt 2010 : DWH en Enterprise Guide : snellere verwerking, meer zekerheid betreffende screening, meer dossiers effectief overgemaakt t.w.v. gemiddeld 2.5 mio euro per semester 2012 : dalende trend -> indirect effect: kwaliteit wordt beter
5. resultaten
Sterk signaal met duidelijke impact Gemiddeld gaat het om 3 à 4 mio euro aan ‘toevallige’ fouten per jaar (1 op 1 miljoen records) •10 of 100 in plaats van 1 •21 pillen in plaats van 1 (uit een doosje van 21 pillen) •5 ml in plaats van 1 flacon (van 5 ml) negatieven (zichtbare regularisaties) in bestanden PH
Onder impuls van de screening wordt sneller, beter en/of meer geregulariseerd Soms zodanig snel dat sommige fouten dezelfde semester geneutraliseerd worden -> geen dossier meer
0,00 -500.000,00 -1.000.000,00 -1.500.000,00 -2.000.000,00 -2.500.000,00 -3.000.000,00 -3.500.000,00 -4.000.000,00 -4.500.000,00 -5.000.000,00
Dit wil niet zeggen dat ‘toevallige’ fouten niet meer gebeuren wel dat ze meer en sneller opgemerkt, en geregulariseerd worden, door de verpleeginrichting, door de verzekeringsinstelling, door het RIZIV -> verbetering kwaliteit. Het RIZIV heeft een sterk en duidelijk signaal gegeven dat het zeer precies fouten detecteert, situeert en vraagt deze te regulariseren
Conclusie
zoektocht naar enkele records – tussen miljoenen andere – die een reëel risico zijn op een fout of op een vertekening bij studies, analyses, berekeningen, publicaties, …
mogelijk deze te detecteren en te verbeteren
met als resultaat
verbetering van de kwaliteit van de gegevens en recuperatie van middelen
dankzij de inspanningen, expertise en samenwerking van RIZIV-diensten, verzekeringsinstellingen en verpleeginrichtingen