Koppelingsprocedure PRN 2003 en 2004 met ABCD bestand 2003-2004
Stichting Perinatale Registratie Nederland Postbus 18 3720 AA Bilthoven Tel. 030-274 8835 direct Tel. 030-229 4162 algemeen Fax 030-229 4162 www.perinatreg.nl
[email protected]
Klinische Informatiekunde1 Public Health Epidemiology2 Academisch Medisch Centrum 1100 DE Amsterdam Tel. 020-566 5269 Fax: 020-691 9840 http://kik.amc.uva.nl/KIK
[email protected]
PRN/KIK-rapport Klinische Informatiekunde Technisch rapport 2006-03 In opdracht van Uitvoering door
Stichting Perinatale Registratie Nederland LinKID-projectteam AMC
Datum
Sept 2006
Auteurs
M Tromp1,
[email protected] ACJ Ravelli1,
[email protected] GJ Bonsel2,
[email protected]
Aantal pagina’s
57
Inhoudsopgave 1. 2.
Inleiding ........................................................................................................................ 4 Doelstellingen koppeling ABCD - PRN......................................................................... 5 2.1 De kwaliteit van de koppeling PRN jaarbestanden (LVR1^LVR2^LNR).................. 5 2.2 Deelname en representativiteit ................................................................................ 6 2.3 Datakwaliteit ............................................................................................................. 7 3. Projecten en bestanden................................................................................................ 8 4. Methoden.................................................................................................................... 10 4.1 Voorbereiding ......................................................................................................... 10 4.2 Koppeling ............................................................................................................... 11 4.3 Validatie niet-gekoppelde ABCD records............................................................... 13 5. Resultaten voorbereiding bestanden.......................................................................... 14 5.1 Beschrijving bestanden 2003 en 2004 ................................................................... 14 5.2 Selectie bestanden................................................................................................. 15 5.3 Onderzoeken potentiële koppelvariabelen en hun vergelijkbaarheid .................... 16 6. Resultaten koppeling ABCD – PRN 2003 .................................................................. 19 6.1 Keuze koppelvariabelen 2003................................................................................ 19 6.2 Resultaten voor eenlingen 2003 ............................................................................ 20 6.3 Resultaten voor meerlingen 2003 .......................................................................... 24 6.4 Resultaten voor niet-gekoppelde eenling- met meerlingrecords 2003 .................. 25 6.5 Niet-gekoppelde ABCD records 2003 .................................................................... 26 6.6 Creatie eindbestand ABCD-PRN koppeling 2003.................................................. 26 7. Resultaten koppeling ABCD – PRN 2004 .................................................................. 27 7.1 Keuze koppelvariabelen 2004................................................................................ 27 7.2 Resultaten voor eenlingen 2004 ............................................................................ 27 7.3 Resultaten voor meerlingen 2004 .......................................................................... 31 7.4 Resultaten voor niet-gekoppelde eenling- met meerlingrecords 2004 .................. 32 7.5 Niet-gekoppelde ABCD records 2004 .................................................................... 33 7.6 Creatie eindbestand ABCD-PRN koppeling 2004.................................................. 33 8. Resultaten ABCD-PRN koppeling 2003 en 2004 ....................................................... 34 8.1 Eindbestand ABCD-PRN koppeling 2003 en 2004................................................ 34 8.2 Niet-gekoppelde ABCD records 2003 en 2004...................................................... 35 9. De kwaliteit van de koppeling PRN jaarbestanden (LVR1^LVR2^LNR) .................... 37 9.1 LVR1, LVR2 en LNR koppeling algemeen............................................................. 37 9.2 Koppeling van meerlingen...................................................................................... 40 9.3 Inzicht in kwaliteit GBA-PRN koppeling ................................................................. 42 9.4 Het proces van aankoppeling van een extern onderzoeksbestand ....................... 43 10. Deelname en representativiteit................................................................................... 44 10.1 Deelnemende praktijken .................................................................................... 44 10.2 Inzicht in noemer verschillen “in zorg” en “ingezetene”. .................................... 45 11. Datakwaliteit ............................................................................................................... 46 11.1 Koppelvariabelen ............................................................................................... 46 11.2 Sterfte................................................................................................................. 47 11.3 Etniciteit.............................................................................................................. 51 12. Conclusies .................................................................................................................. 53 12.1 PRN koppelingen ............................................................................................... 53 12.2 Deelname en representativiteit PRN ................................................................. 54 12.3 Datakwaliteit....................................................................................................... 54 13. Aanbevelingen ............................................................................................................ 55 14. Referenties ................................................................................................................. 56 Bijlage 1 Non-response analyse ABCD o.b.v. data PRN .................................................... 57
Pagina 3 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
1. Inleiding De aanleiding van dit onderzoek is de gegevensaanvraag 04.24 ingediend bij de Stichting Perinatale Registratie Nederland (PRN) door de projectleiders van de ABCD studie (Amsterdam Born Children and their Development). In deze gegevensaanvraag wordt om een koppeling tussen het ABCD bestand totaal (onderzoeksbestand en non-response bestand) en twee jaargangen PRN bestanden verzocht. De aanvraag betreft een regio in Nederland, namelijk Amsterdam. De Stichting PRN vindt het belangrijk dat de PRN gegevens door zorgverleners optimaal gebruikt kunnen worden. Het ondersteunen van grote onderzoeken binnen de perinatale zorg valt ook onder de doelstellingen. Daarnaast kan de koppeling van de PRN met een onderzoeksbestand zoals het ABCD onderzoeksbestand (groot, gevalideerd cohort met informatie over zorgverleners) ook informatie geven over de kwaliteit van het PRN bestand. De gegevensaanvraag is op 23 juni 2004 goedgekeurd door de Stichting PRN. Omdat dit een koppelingsonderzoek is, heeft de Stichting PRN de LinKID projectgroep, AMC Amsterdam, gevraagd deze gegevensaanvraag uit te voeren. Hiervoor is een projectvoorstel geschreven [1]. De LinKID projectgroep voert ook de reguliere koppelingen voor de PRN uit. Het voorliggende eindrapport beschrijft en evalueert de koppelingsresultaten van het ABCD totaalbestand met de PRN registratie van 2 jaren (2003 en 2004). Dit is een uitbreiding van een eerder, voorlopig, rapport over de koppeling van 2003 dat in het voorjaar van 2006 is verschenen [2]. De resultaten van de koppeling tussen het ABCD totaalbestand en de PRN registratie voor het jaar 2003 zijn beschreven in een apart rapport omdat reeds veel informatie beschikbaar was over de slaagkansen van de aankoppeling van een extern studiebestand en de voorwaarden waaronder deze slaagkansen (voldoende) groot zijn. Dit rapport over 2003 is aangevuld met de resultaten van de koppeling van 2004. Daarnaast zijn enkele andere vragen naar aanleiding van de koppeling, in het bijzonder over de kwaliteit c.q. validiteit van (variabelen van) de PRN in het huidige rapport beantwoord. Het project inclusief documentatie is uitgevoerd in de periode oktober 2005 -juli 2006. In dit eindrapport wordt ingegaan op de resultaten van de koppeling tussen het ABCD totaalbestand en de PRN registratie voor de jaren 2003 en 2004 en belangrijke bevindingen ten aanzien van de PRN koppelingen, de datakwaliteit en de representativiteit van de PRN registratie. In hoofdstuk 2 worden de doelstellingen beschreven en in hoofdstuk 3 de projecten en bestanden. De gehanteerde methoden worden beschreven in hoofdstuk 4, gevolgd door de resultaten van de voorbereiding van de koppeling in hoofdstuk 5 en koppelingsresultaten per kalenderjaar in hoofdstuk 6, 7 en 8. De implicaties van de resultaten voor de PRN koppeling worden beschreven in hoofdstuk 9. De bevindingen ten aanzien van deelname en representativiteit worden beschreven in hoofdstuk 10 en ten aanzien van datakwaliteit in hoofdstuk 11. Het rapport wordt afgesloten met algemene conclusies in hoofdstuk 12 en aanbevelingen in hoofdstuk 13.
Pagina 4 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
2. Doelstellingen koppeling ABCD - PRN De gegevensaanvraag vanuit de ABCD betreft het verzoek tot een koppeling van een gegevensbestand van de vrouwen en kinderen die hebben deelgenomen aan de ABCD-studie, met de PRN gegevensbestanden uit de jaren 2003 en 2004. Daarnaast omvat de gegevensaanvraag ook een koppeling van de vrouwen en kinderen uit het ABCD cohort die niet hebben deelgenomen aan de ABCD-studie, maar voor wie wel elementaire koppelsleutelgegevens beschikbaar zijn (ABCD nonresponse bestand). Van deze vrouwen en kinderen vraagt de ABCD gegevens op geaggregeerd (niet-individueel) niveau om mogelijke vertekening in hun onderzoekspopulatie te analyseren (zie bijlage 1). Voor deze koppeling is toestemming gevraagd en ontvangen op 23 juni 2004 van de PRN privacy commissie. De Stichting PRN streeft een optimaal gebruik van de registratie gegevens na. In dat kader past het verlenen van steun aan zorgverleners en grote onderzoeksprojecten die onderschreven worden door hulpverleners. Om praktische redenen is bij de start van het project het koppelingsproject in 2 afzonderlijke projecten onderverdeeld: 2003 en 2004. Het hoofddoel van het project 2003 was het realiseren van de koppeling tussen het PRN jaarbestand 2003 en het ABCD totaalbestand met geboortes in 2003 met daarbij informatie over de kwaliteit van deze koppeling. Op basis van de opgedane ervaringen in dit project is de ABCD vervolgkoppeling van het jaar 2004 gedefinieerd. Deze informatie was toen ook beschikbaar voor andere partijen met vergelijkbare vragen (met name Generation R). De resultaten van beide koppelingen staan beschreven in dit rapport. Naast het hoofddoel van de PRN-ABCD koppeling, kunnen een aantal subdoelen beschreven worden. De subdoelen van de PRN-ABCD koppeling betreffen de kwaliteit van de koppeling van de PRN jaarbestanden, de representativiteit van de PRN registratie en de datakwaliteit van de PRN variabelen. Op die subdoelen gaan we hieronder in. 2.1 De kwaliteit van de koppeling PRN jaarbestanden (LVR1^LVR2^LNR) De koppeling tussen de PRN registratie en het ABCD onderzoeksbestand kan informatie geven over de kwaliteit van de koppeling van de PRN jaarbestanden (LVR1, LVR2 en LNR) algemeen, ten aanzien van meerlingen en ten aanzien van vrouwen zonder kindinformatie (in de PRN) in het bijzonder. Daarnaast kan de koppeling ook inzicht geven in de (potentiële) kwaliteit van een PRN-GBA koppeling (in het ABCD totaalbestand zit namelijk GBA informatie). 2.1.1 Validatie LVR1, LVR2 en LNR koppeling algemeen Door de koppeling met het ABCD totaalbestand uit te voeren op basis van LVR1, LVR2 en LNR gegevens uit het gekoppelde PRN jaarbestand wordt inzicht verkregen in de validiteit van de door LinKID uitgevoerde PRN koppeling, niet alleen in Amsterdam, maar waarschijnlijk voor Nederland als geheel. Voorbeeld: een ABCD record koppelt met zowel een LVR1 als een LVR2 record, terwijl deze door onvolledige of onjuiste informatie tot nog toe niet door LinKID aan elkaar zijn gekoppeld. De ABCD-studie levert daarbij diverse ingangen om ook de achtergrond van de discrepanties vast te stellen, van belang voor eventuele verbetertrajecten van de interne PRN (LVR1&LVR2&LNR) koppeling.
Pagina 5 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
2.1.2 Koppeling van meerlingen De ABCD studie bevat ook vrouwen met een meerlingzwangerschap. Door de koppeling van het ABCD totaalbestand met het GBA is met zekerheid bekend welke meerlingkinderen bij welke vrouw horen. Door de koppeling van het ABCD totaalbestand met de PRN kan er inzicht worden verkregen in de eerder gerapporteerde specifieke koppelingsproblemen van meerlingen. Tevens kan er informatie worden verkregen over de juistheid van de “unieke vrouw” identificatie in het PRN bestand ten behoeve van het PRN tabellenjaarboek. Hierbij is de mogelijkheid om terug te kunnen gaan naar de bron (zorgverlener). 2.1.3 Koppeling van vrouwen zonder kind informatie De losse zwangerschapsrecords (vrouw records zonder kindinformatie) in de LVR1 vormen een probleem bij de LVR1^LVR2^LNR koppeling omdat deze records te weinig identificerende informatie bevatten om deze te kunnen koppelen met een ander LVR1 en/of LVR2 record. Er zijn wat betreft de omgang met deze records belangrijke beslissingen genomen op basis van ‘circumstantial evidence’; dit is de eerste gelegenheid om te controleren of de LinKID-groep hierin correct heeft geschat wat de werkelijke situatie is. Indien het mogelijk is deze PRN records te koppelen met records uit de ABCD studie kan dit informatie geven over de oorzaak/verklaring van deze lastige records: abortus/vroege sterfte, verhuizers, einde zorg zonder reden, overige verklaringen waaronder administratieve slordigheid. 2.1.4 Inzicht in kwaliteit GBA-PRN koppeling Door de koppeling tussen het PRN en ABCD totaalbestand op deterministische en probabilistische wijze uit te voeren op basis van de variabelen die in het GBA beschikbaar zijn, kunnen de resultaten van beide methoden vergeleken worden. Deze resultaten kunnen extra input leveren voor het project “Pilot koppeling perinatale registraties met de GBA registratie/doodsoorzaken registratie” uitgevoerd door het CBS en LinKID/PRN. In dat laatste project is teruggaan naar de bron voor opheldering van de discrepanties niet mogelijk door wetten en bezwaren. 2.1.5 Het proces van aankoppeling van een extern onderzoeksbestand De koppeling tussen het PRN en ABCD totaalbestand kan inzicht leveren in het proces van aankoppeling van een extern studiebestand aan de PRN registratie. 2.2 Deelname en representativiteit 2.2.1 Deelnemende praktijken Alle zwangere vrouwen in het ABCD totaalbestand zouden ook aanwezig moeten zijn in de PRN, aangezien de verwachting is dat alle verloskundigenpraktijken in Amsterdam in 2003 en 2004 hebben deelgenomen aan de PRN registratie en hebben deelgenomen aan de ABCD-studie. Koppeling kan uitwijzen of dit inderdaad zo is en, indien niet, wat de omvang en mogelijke oorzaken zijn van het ontbreken van zwangere vrouwen en/of kinderen in de PRN en van het ontbreken van deelnemersstatus informatie bij de PRN. Daarnaast is het ook mogelijk dat deelnemende praktijken aan de ABCD studie niet alle zwangere vrouwen hebben gemeld voor de ABCD studie. Een analyse van de PRN records uit de regio Amsterdam in de inclusieperiode van de ABCD studie die niet zijn gekoppeld met een ABCD record, kan uitwijzen of dit voorkomt, en zo ja, of dit samenhangt met speciale kenmerken.
Pagina 6 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
2.2.2 Inzicht in noemer verschillen ‘in zorg’ en ‘ingezetene’ In het ABCD cohort is vastgelegd wat de reden was van het niet vinden van kindinformatie in het GBA bij een zwangere vrouw (wel wonend en in zorg in Amsterdam maar geen GBA nummer). De koppeling tussen PRN en ABCD kan informatie geven over de omvang van het noemerverschil en tussen ‘in zorg’ en ‘ingezetene’ voor de gekoppelde records met kindinformatie. 2.3 Datakwaliteit De datakwaliteit van de PRN en ABCD variabelen kan vergeleken worden voor de gekoppelde records. Koppeling tussen de PRN data en ABCD data zal ook overeenkomsten en discrepanties tussen kernvariabelen aan het licht brengen. Doorgaans zal het ABCD onderzoeksbestand als gouden standaard kunnen worden gebruikt in het kader van dit onderzoek. De aanname is dat de data kwaliteit van een onderzoeksbestand hoger is dan van een registratiebestand, bovendien is het ABCD totaalbestand gevalideerd met het GBA bestand. Voor deze variabelen zal de PRN inzicht krijgen in de datakwaliteit. Andere variabelen zullen in geval van discrepanties onderdeel dienen te vormen van een validatietraject met zorgverlener gegevens. 2.3.1 Meerlingen De koppeling tussen PRN en ABCD wordt apart uitgevoerd voor eenlingen en meerlingen. Vergelijking van de meerlingvariabelen tussen PRN en ABCD geeft informatie over de kwaliteit van de meerlingvariabelen. 2.3.2 Sterfte Vergelijking van variabelen over sterfte in beide bestanden zal speciale aandacht krijgen. De ABCD studie heeft voor vrouwen waar geen kind in het GBA gevonden is onderzocht of sterfte kind/vrouw hiervan de oorzaak is. 2.3.3 Etniciteit In de PRN wordt etniciteit vrouw door de zorgverlener geregistreerd als ‘type vrouw’, dit wordt vastgelegd in 7 groepen op basis van huidkleur / naam e.d. In het ABCD onderzoeksbestand wordt het geboorteland van de zwangere geregistreerd. Wegens het verschil in definitie en vastlegging is een directe vergelijking van etniciteit tussen het PRN en ABCD totaalbestand niet mogelijk. Dit subdoel was dus niet te realiseren. In een later stadium is de PRN typering vrouw (7 groepen) wel vergeleken met het geboorteland vrouw (8 groepen en 19 groepen) voor de gekoppelde records om het verschil in vastlegging zichtbaar te maken.
Pagina 7 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
3. Projecten en bestanden ABCD studie De ABCD studie ‘Amsterdam Born Children and their Development’ is een longitudinaal onderzoek naar leefgewoonten en psychosociale omstandigheden tijdens de zwangerschap in relatie tot de gezondheid van het kind bij de geboorte en op latere leeftijd [3,4]. De studie richt zich op alle zwangere vrouwen in de regio Amsterdam. De aanleiding voor de ABCD studie vormde de nog steeds grote uitkomstverschillen tussen zwangeren van autochtone dan wel allochtone afkomst. Aan het bereiken van allochtonen zwangeren is veel aandacht besteed. Deze koppelingsstudie kan daarom ook de specifieke koppelingsproblemen van juist deze groep bestuderen. Inclusie heeft plaatsgevonden tussen januari 2003 en maart 2004. Zwangere vrouwen zijn door de Amsterdamse verloskundige zorgverleners benaderd voor deelname aan de ABCD studie tijdens het eerste bezoek aan de verloskundige (gemiddeld bij 12 weken zwangerschap, bij allochtone vrouwen vaak later). Alle vrouwen die op enig moment in de zwangerschap een prenatale screening ontvingen, zijn dus benadert. Het percentage deelnemende zwangere vrouwen aan de ABCD studie was 67% (8.397 / 12.560). Iedere zwangere die na dit 1e contact instemt, is in principe deelneemster van de ABCD studie. Zij ontvangt een vragenlijst en er wordt een extra buisje bloed afgenomen. In de ongecompliceerde situatie wordt het (levend) geboren kind aangegeven, opgenomen in het GBA, waarna de afdeling jeugdgezondheidszorg (JGZ) van GGD een mutatieformulier ontvangt. De gegevens van moeder en kind (NAW, geboortedatum) op dit formulier worden verwerkt in het zogeheten cliëntenbestand, tezamen met de geboortegegevens verzameld bij de hielprik (uitgevoerd rond 7e dag geboorte door JGZ). Op basis van dit JGZ-cliëntenbestand wordt de ABCD-moeder bij het kind gezocht en gelinkt met een uniek volgnummer. Meer informatie over de ABCD studie is beschreven in de Jaarrapportage Volksgezondheid Amsterdam 2004 en per september 2005 op de website www.abcd-study.nl [3,4]. Het ABCD totaalbestand van 10 augustus 2005 is gebruikt voor deze studie. ABCD totaalbestand Het ABCD totaalbestand bestaat uit het ABCD onderzoeksbestand (ABCD deelnemers) en het ABCD non-response bestand (ABCD niet-deelnemers). Het ABCD totaalbestand bevat geboortes van 13 januari 2003 tot en met 27 oktober 2004 in Amsterdam (postcode 1000-1109). De ABCD dataset bevat 2 soorten bestanden: 1) de naam, adres en woonplaats gegevens (NAW) van moeder en kind, inclusief geboortegegevens (geboortegewicht en zwangerschapsduur) voor alle benaderde vrouwen; en 2) geanonimiseerde gegevens m.b.t. leefgewoonten van de moeder en geboorte-uitkomsten voor de deelnemende vrouwen. Voor de volledigheid noemen we nog dat a) het ABCD onderzoeksbestand nog steeds wordt aangevuld met nieuwe vragenlijstgegevens en b) de data manueel gevalideerd zijn. Het ABCD totaalbestand van 10 augustus 2005 is gebruikt voor deze studie. Input bestand ABCD totaal: - ‘tabel-zwanger-kindtotaal-3_2nov05.sav’ van 2 november 2005
Pagina 8 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
PRN jaarbestand De Stichting Perinatale Registratie (PRN) jaarbestanden bestaan uit de gekoppelde perinatale registraties; LVR1, LVR2 en LNR. De perinatale registratie bevat gegevens over de zorg verleend aan zwangere vrouwen, zorg rondom de bevalling en zorg in de kraamperiode en gegevens over de gezondheidstoestand van pasgeborenen en in de eerste levensmaand opgenomen kinderen. De deelname onder gynaecologen en verloskundigen ligt boven de 95%; de deelname van de verloskundig actieve huisartsen (verantwoordelijk voor ca. 5% van alle bevallingen) is in ontwikkeling. De deelname van kinderartsen binnen NICU’s is in principe 100% en binnen de kinderartspraktijken ongeveer 50%. De vooraf verwachting is dat de meeste verloskundige en gynaecologie praktijken in Amsterdam en omgeving deelnemen aan de PRN. Meer informatie over de PRN bestanden is te vinden op www.perinatreg.nl en in PRN jaarboek “Perinatale Zorg in Nederland” 2001, 2002 en 2003 [5-8]. De LVR1, LVR2 en LNR registratie zijn per jaar gekoppeld om tot één perinatale registratie jaarbestand te komen. Meer informatie over de door LinKID, AMC Amsterdam, uitgevoerde koppeling van de PRN bestanden is beschreven op de website van de afdeling Klinische Informatiekunde: http://kik.amc.uva.nl/KIK bij technical reports 2005-04 en 2006-01 [9,10]. De twee validatie studies die zijn uitgevoerd van de koppeling 2001 staan beschreven in de KIK technical reports 2004-01 en 2005-06 [11,12]. De koppelingsmethodiek is ook beschreven in twee artikelen [13,14]. Inputbestanden PRN: - ‘lvr1_lvr2_lnr_2003_versie10.sas7bdat’ van 26 mei 2005 - ‘lvr1_lvr2_lnr_2004_versie10.sas7bdat’ van 20 februari 2006
Pagina 9 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
4. Methoden 4.1 Voorbereiding In deze paragraaf worden de verschillende stappen van de voorbereiding van de bestanden voor de koppeling beschreven. De resultaten van de voorbereiding van de bestanden zullen gecombineerd voor de 2003 en 2004 koppeling beschreven worden. 4.1.1 Beschrijving bestanden Het gehele ABCD totaalbestand is in oktober 2005 aangeleverd in SPSS. Dit bestand bevat de records van zowel respondenten en non-respondenten. Het aantal records in het bestand, de responsrate, het aantal eenlingen en meerlingen en het aantal records zonder kindinformatie is geanalyseerd voor het ABCD totaalbestand en wordt beschreven in hoofdstuk 5. Het aantal eenlingen en meerlingen, de samenstelling van de records en het aantal records zonder kindinformatie is geanalyseerd voor het PRN bestand. Daarnaast zijn het ABCD en PRN bestand vergeleken op regio en periode. 4.1.2 Selectie bestand voor koppeling Uit beide bestanden is een selectie gemaakt om vergelijkbare (koppelbare) bestanden te krijgen wat betreft de regio (Amsterdam) en periode (2003 of 2004). Het ABCD totaalbestand bevat zwangerschappen uit 2003 en 2004 voor de regio Amsterdam. Voor de 2003 koppeling zijn uit het ABCD totaalbestand de records met een zwangerschapsuitkomst in 2003 geselecteerd en de ABCD records waarbij het geboortejaar onbekend is. Voor de 2004 koppeling zijn uit het ABCD totaalbestand de records met een zwangerschapsuitkomst in 2004 geselecteerd en de ABCD records waarbij het geboortejaar onbekend is, en die niet gekoppeld waren na de 2003 koppeling. Het PRN jaarbestand bevat zwangerschappen onder begeleiding van een verloskundige en/of gynaecoloog met een zwangerschapsuitkomst in dat jaar. Uit het PRN jaarbestand 2003 en 2004 is een selectie gemaakt voor de regio Amsterdam op basis van de postcodegebieden die door de ABCD-studie worden gedekt. Alle PRN records van vrouwen met een postcode tussen 1000 en 1200 zijn geselecteerd. De postcode range is iets ruimer dan bij het ABCD totaalbestand (1000-1109), aangezien ook postcode 1183 voorkwam in het ABCD totaalbestand. De regio keuze van het landelijk PRN bestand heeft geen consequenties voor de resultaten, omdat het ABCD totaalbestand als uitgangspunt is genomen bij het beschrijven van de resultaten. Beide bestanden zijn gesplitst voor eenlingen en meerlingen, op basis van de variabele ‘omvang meerling’ in het PRN bestand en op basis van de variabele ‘aantal’ in het ABCD totaalbestand. 4.1.3 Onderzoeken potentiële koppelvariabelen en vergelijkbaarheid De variabelen in beide bestanden zijn onderzocht op vergelijkbaarheid ten aanzien van de definitie en het tijdstip van vastleggen. Van gemeenschappelijke variabelen zijn de definities vergeleken. Voor variabelen met meerdere bronnen, is een keuze gemaakt over welke waarde gebruikt wordt bij de koppeling. Vooral postcode is hier een goed voorbeeld: In de PRN wordt in de LVR1 de postcode vaak vastgelegd bij het eerste bezoek aan de verloskundige en in de LVR2 vaak na de bevalling (hier kan 6 maanden tussen liggen). In het ABCD totaalbestand wordt de postcode geregistreerd op de vragenlijst bij het eerste bezoek aan de verloskundige en nadat het kind geboren is wordt de postcode uit de GBA opgenomen.
Pagina 10 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
De keuze van gebruik van de waarde (zie tabel 4.1) is voor het PRN bestand gedaan volgens de systematiek die ook gebruikt is voor het PRN jaarboek. Per variabele wordt een keuze gemaakt op basis van definitie/periode van vastlegging en frequentie van voorkomen. Voor de koppelvariabelen was dat vaak de LVR2 waarde; als deze niet beschikbaar was de LVR1 waarde, en als deze ook niet beschikbaar was de LNR waarde. Voor postcode en aterme datum wordt de voorkeur gegeven aan de LVR1 waarde boven de LVR2 waarde. De aterme datum in het ABCD totaalbestand is ook vastgelegd bij het eerste bezoek aan de verloskundige en de vergelijkbaarheid is voor deze waarden dus het grootst. Niet voor alle ABCD kinderen is het gelukt een koppeling met de GBA te maken (de postcode van het kind is dan onbekend), terwijl voor alle records de postcode van de vrouw bij het eerste bezoek aan de verloskundige bekend is. Deze variabele komt het best overeen met de LVR1 postcode. Indien de voorkeursvariabele niet beschikbaar was (missing), is de variabele met daarna de grootste voorkeur genomen. Tabel 4.1 geeft per variabele de voorkeurswaarde aan in het ABCD en PRN bestand, afhankelijk van de beschikbaarheid. Tabel 4.1 Voorkeursvariabelen binnen ABCD en PRN bestand ten behoeve van de ABCD-PRN koppeling Variabele Vragenlijst Geboortedatum moeder Postcode Aterme datum Graviditeit Zwangerschapsduur Geboortedatum kind Geboortegewicht kind Geslacht kind Praktijknummer
ABCD Streeklab
GBA X
X X
LVR1
LNR
X X
X X
X X X X X
X X X X
PRN LVR2 X
X
4.2 Koppeling In deze paragraaf worden kort de verschillende onderdelen van de koppeling beschreven. Voor meer informatie over de koppelingsprocedures uitgevoerd door het LinKID team, AMC Amsterdam, zijn de technische rapporten te raadplegen op de website van de afdeling Klinische Informatiekunde van het AMC (http://kik.amc.uva.nl/KIK). In de beschrijving van de koppelingsresultaten wordt steeds geredeneerd vanuit het ABCD totaalbestand. 4.2.1 Keuze koppelvariabelen Op basis van de kwaliteit van een variabele en de vergelijkbaarheid van deze variabele tussen de beide bestanden is een variabele geselecteerd als koppelvariabele. Hierbij is ook gekeken naar de afhankelijkheid tussen variabelen, omdat het algoritme de koppelgewichten schat, onder de aanname dat de variabelen onafhankelijk zijn. 4.2.2 Koppelstrategie bepalen Voor alle koppelvariabelen zijn de koppelgewichten berekend op basis van de geschatte mi- en ui-kansen. De mi-kans is de kans dat een variabele overeenstemt onder matches (betrouwbaarheid) en de ui-kans is de kans dat een variabele overeenstemt onder non-matches (discriminerend vermogen) [11]. De kansen
Pagina 11 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
worden geschat op basis van de eenlingbestanden met behulp van een expectationmaximization algoritme (EM-algoritme). Het koppelgewicht voor overeenkomst is berekend door: 2log(mi/ui). Het koppelgewicht voor geen-overeenkomst is berekend door: 2log((1-mi)/(1-ui)). Voor sommige variabelen is er naast volledige overeenkomst ook een ‘close’ overeenkomst gedefinieerd; de variabele waarde komt niet exact overeen, maar het verschil is klein en dat wordt beschouwd als aanwijzing voor overeenstemming. De grootte van de bestanden liet het toe om de koppeling zonder blocking uit te voeren. De koppeling is apart uitgevoerd voor eenlingen en meerlingen conform de interne PRN koppeling. De koppeling is in twee stappen uitgevoerd, in stap 1 wordt het ABCD totaalbestand gekoppeld met het PRN bestand van de regio Amsterdam en in stap 2 worden de niet-gekoppelde ABCD records gekoppeld met het PRN bestand van de rest van Nederland. Dit staat beschreven in figuur 6.2 en 6.3. Alle records uit ABCD totaalbestand worden vergeleken met alle records uit het PRN bestand. Op basis van de vergelijking worden de koppelgewichten voor de afzonderlijke koppelvariabelen toegekend en het totaalgewicht van een paar is de optelsom van deze gewichten. Alle paren met een totaalgewicht boven het afkappunt, zijn meegenomen als koppeling. Bij de koppeling tussen de niet-gekoppelde ABCD records uit stap 1 met het PRN bestand van de rest van Nederland is blocking toegepast op geboortedatum moeder (alleen recordparen die overeenstemmen op de geboortedatum van de moeder worden vergeleken). Na de afzonderlijke eenling- en meerlingkoppeling in twee stappen (PRN regio Amsterdam en PRN rest van Nederland), zijn de niet-gekoppelde eenlingrecords uit het ene bestand nog gekoppeld met de niet-gekoppelde meerlingrecords uit het andere bestand. 4.2.3 Afkappunt bepalen Het afkappunt voor de koppeling stap 1 en stap 2 is bepaald op basis van de door het EM-algoritme geschatte prevalentie van links en het nader bestuderen van de recordparen rondom het afkappunt. 4.2.4 Clusters analyseren en oplossen Bij de verschillende stappen van de koppeling ontstonden clusters. Clusters zijn groepjes recordparen waarbij één record uit het ene bestand koppelt met meer dan één record uit het andere bestand en/of andersom. De oplossingsstrategie voor de clusters is afhankelijk van het aantal paren in een cluster en de samenstelling hiervan. Clusters met 2 paren komen veel voor, en bestaan uit 2 records uit het ene bestand die beide koppelen met 1 record uit het andere bestand. Dit kan veroorzaakt worden door gemiste administratieve dubbeltellingen of door gemiste links (PRN bestand), beide paren zijn dan meegenomen als link. Clusters met 4 paren bestaan vaak uit 2 records uit 1 bestand die beide koppelen met 2 records uit het andere bestand. Dit wordt vaak veroorzaakt doordat twee records erg op elkaar lijken, terwijl het verschillende kinderen betreft, de beste 2 paren zijn in dat geval geselecteerd. De oplossingsstrategie is bij meerlingen anders dan bij eenlingen, omdat records van kinderen van een meerling automatisch in één cluster terecht komen. 4.2.5 Onderzoeken niet-gekoppelde records Bij een vooraf verwachting dat alle records uit het ene bestand of uit beide bestanden zullen koppelen, is een analyse van de niet-gekoppelde records noodzakelijk. De vooraf verwachting was dat alle ABCD records gekoppeld konden worden aan een Pagina 12 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
PRN record. De verhouding van het aantal records per praktijk die gekoppeld zijn aan een PRN record is geanalyseerd om te onderzoeken of bepaalde praktijken zijn oververtegenwoordigd onder de niet-gekoppelde records. Tevens is een aantal kenmerken van de niet-gekoppelde ABCD records onderzocht die een mogelijke verklaring kunnen zijn voor het niet koppelen. Deze kenmerken zijn de respons, of er kindinformatie aanwezig was, sterfte en de zwangerschapsduur in geval van sterfte. Daarnaast is er ook een analyse uitgevoerd naar de PRN records die niet koppelden aan een ABCD record, terwijl ze afkomstig waren uit de regio Amsterdam in de periode dat de ABCD studie werd uitgevoerd. Analyse van deze records kan informatie geven over inclusie van de ABCD studie. Als de analyse van de nietgekoppelde records niet voldoende verklaart waarom ABCD records niet zijn gekoppeld aan een PRN record, kan een validatiestudie noodzakelijk zijn. 4.2.6 Creatie eindbestand De koppeling is uitgevoerd in een aantal verschillende stappen apart voor 2003 en 2004. In de laatste stap zijn alle resultaatbestanden samengevoegd. Het eindproduct bestaat uit het ABCD onderzoeksbestand met, indien gelukt, aan ieder ABCD record precies één PRN record. Daarnaast bevat het eindproduct geaggregeerde gegevens voor de non-respondenten van de ABCD studie. 4.3 Validatie niet-gekoppelde ABCD records Indien het onderzoeken van de niet-gekoppelde records op basis van informatie in de bestanden niet voldoende antwoord geeft, kan een validatiestudie noodzakelijk zijn. In een validatiestudie kan bij de praktijken die de ABCD vrouwen hebben aangeleverd worden nagevraagd wat de mogelijke oorzaak kan zijn dat deze vrouwen niet in de PRN registratie zijn opgenomen.
Pagina 13 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
5. Resultaten voorbereiding bestanden 5.1 Beschrijving bestanden 2003 en 2004 Er zijn 2 ABCD bestanden: een ‘zwangere’ bestand en een ‘kind’ bestand. Voor de koppeling zijn de twee ABCD bestanden ‘zwangere’ en ‘kind’ door ABCD medewerkers op basis van identificatienummers samengevoegd tot 1 vrouw-kind bestand (het ABCD totaalbestand) waarmee een met de PRN vergelijkbare bestandsstructuur ontstaat. Bij meerlingen zijn twee of meer records aangemaakt met dezelfde zwangere vrouw informatie (op basis van het ‘zwangere’ record) en verschillende kindinformatie (op basis van de ‘kind’ records). Het ABCD 2003-2004 totaalbestand bestaat uit 12.560 records van zwangerschappen in 2003 en 2004 (Tabel 5.1). Van de 12.560 benaderde vrouwen namen 8.397 vrouwen deel aan de ABCD studie (67%). Niet van alle zwangerschappen is kindinformatie bekend, dit kan verschillende oorzaken hebben (abortus, sterfte, verhuizing). Mede hierdoor is niet van alle ABCD records bekend of de geboorte in 2003 of 2004 plaatsvond. Tabel 5.1 Inhoud ABCD totaalbestand
ABCD totaalbestand Respons Toestemming PRN koppeling
Geboortejaar kind 2003 2004 Onbekend 3.692 4.658 47 3.156 3.970 29
Totaal 8.397 7.155
% 67% 57%
Records zonder kindgegevens* Records met kindgegevens Sterfte kind (met/zonder gegevens)
127 5.175 343
60 6.445 220
4 0 186
191 11.620 749
1,5% 93% 6%
Eenlingkinderen Meerlingkinderen
5098 204
6349 156
4 0
11.451 360
91% 3%
Totaal aantal records 5.645 6.725 190 12.560 100% * Zonder kindgegevens = record vrouw zwangerschap zonder gegevens geboorte kind.
Op basis van een vergelijking van de praktijken die gegevens hebben aangeleverd voor de ABCD en de praktijken die gegevens hebben aangeleverd voor de PRN is geconstateerd dat twee praktijken geen gegevens aan de PRN hebben aangeleverd in 2003. Dit betrof praktijk A (ABCD code 5, PRN code 1003) en praktijk B (ABCD code 23, PRN code 1780) (namen zijn bij de PRN bekend). Voor 2003 bevatte het ABCD totaalbestand 357 records uit deze twee praktijken. Daarnaast leverden verloskundig actieve huisartsen in 2003 en 2004 niet aan voor de PRN, 7 praktijken (31 records in het ABCD totaalbestand 2003 en 61 records in het ABCD totaalbestand 2004). Het PRN jaarbestand is een gecombineerd vrouw-kind bestand. De PRN records bevatten afhankelijk van de LVR1^LVR2^LNR koppeling informatie uit 1, 2 of 3 bronnen (Tabel 5.2). Het PRN jaarbestand 2003 bestaat uit 206.778 records [8]. Het PRN jaarbestand 2004 bestaat uit 199.859 records [9].
Pagina 14 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Tabel 5.2 Inhoud PRN bestanden 2003 en 2004 PRN bestand
2003
2004 % # % LVR1 77.894 38% 74.952 38% wv zonder kindgegevens* 12.429 16% 14.188 19% wv met kindgegevens 65.465 84% 60.764 81% LVR1 en LVR2 69.193 33% 65.787 33% LVR2 27.276 13% 28.233 14% LVR2 en LNR 9.065 4% 9.130 5% LVR1 en LNR 2.126 1% 1.759 1% LVR1 en LVR2 en LNR 19.552 9% 18.180 9% LNR 1.672 1% 1.818 1% wv zonder moederinfo 909 54% 1.097 60% wv met moederinfo 763 46% 721 40% Totaal 206.778 100% 199.859 100% Eenlingrecords 198.281 96% 191.516 96% Meerlingrecords 8.497 4% 8.343 4% Records zonder kindinformatie 12.429 6% 14.188 7% Totaal 206.778 100% 199.859 100% * Zonder kindgegevens = record vrouw zwangerschap zonder gegevens geboorte kind. #
We zijn er vanuit gegaan dat zowel in het ABCD totaalbestand als in het PRN jaarbestand geen administratieve dubbeltellingen meer voorkwamen. 5.2 Selectie bestanden Uit het PRN jaarbestand 2003 en 2004 is de regio Amsterdam geselecteerd op basis van de postcodes 1000-1200. Dit bestand bevat 13.983 records voor 2003 en 14.279 records voor 2004 (Tabel 5.3). De selectie meerling in het PRN bestand is uitgevoerd op basis van de variabele ‘meerling omvang’, ‘meerling rangnummer’ en verwijzing/ontvangst wegens meerling zwangerschap. Het PRN bestand 2003 voor de regio Amsterdam bestond uit 13.481 eenlingen en 502 meerlingen. Het PRN bestand 2004 voor de regio Amsterdam bestond uit 13.786 eenlingen en 493 meerlingen. Tabel 5.3 Selectie PRN bestand voor 2003 en 2004 koppeling PRN jaarbestand 2003 PRN eenling records regio Amsterdam (postcode 1000-1200) PRN meerling records regio Amsterdam (postcode 1000-1200) PRN eenlingen en meerlingen 2003 regio Amsterdam
206.778 13.481 502 13.983
PRN jaarbestand 2004 PRN eenling records regio Amsterdam (postcode 1000-1200) PRN meerling records regio Amsterdam (postcode 1000-1200) PRN eenlingen en meerlingen regio Amsterdam
199.859 13.786 493 14.279
Het ABCD totaalbestand bevat 5.645 records met geboortes in 2003, 6.725 records met geboortes in 2004 en 190 records waarvan het geboortejaar onbekend is (Tabel 5.4). Voor de 2003 koppeling zijn de geboortes waarvan het geboortejaar onbekend is, toegevoegd aan het 2003 bestand (5.645 + 190 = 5.835). De selectie meerling in het ABCD totaalbestand is gedaan op basis van de variabele ‘aantal’ (aantal
Pagina 15 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
kinderen in deze zwangerschap). Het ABCD totaalbestand met (mogelijke) geboortes in 2003 bestond uit 5.631 eenlingen en 204 meerlingen. Voor de koppeling 2004 zijn de records waar het geboortejaar onbekend is en die niet zijn gekoppeld aan een PRN 2003 record, toegevoegd aan het 2004 bestand (6.725 + 147 = 6.872). Het ABCD totaalbestand met (mogelijke) geboortes in 2004 bestond uit 6.716 eenlingen en 156 meerlingen. Tabel 5.4 Selectie ABCD totaalbestand voor 2003 en 2004 koppeling ABCD totaalbestand 2003 ABCD geboortejaar 2003 ABCD geboortejaar onbekend ABCD eenlingen 2003 + onbekend ABCD meerlingen 2003 + onbekend ABCD eenlingen en meerlingen 2003 + onbekend
5.645 5.645 190 5.631 204 5.835
ABCD totaalbestand 2004 ABCD geboortejaar 2004 ABCD geboortejaar onbekend (niet gekoppeld in 2003) ABCD eenlingen 2004 + onbekend ABCD meerlingen 2004 + onbekend ABCD eenlingen en meerlingen 2004 + onbekend
6.725 6.725 147 6.716 156 6.872
Men kan de koppeling op 2 manieren benaderen, vanuit PRN (‘hoeveel PRN records zijn terug te vinden in het ABCD totaalbestand’), of vanuit ABCD (‘hoeveel ABCD records zijn terug te vinden in de PRN-registratie’). Omdat in dit onderzoek de vraag vanuit de ABCD studie komt, worden de uitkomsten van de ABCD-PRN koppeling gerelateerd aan het ABCD totaalbestand. Totaal is het maximale aantal matches voor de ABCD studie 12.560 (5.835 + 6.725). 5.3 Onderzoeken potentiële koppelvariabelen en hun vergelijkbaarheid In tabel 5.5 wordt een overzicht gegeven van de potentiële koppelvariabelen in beide bestanden. In tabel 5.6 wordt een overzicht gegeven van de percentages missende waarden op de potentiële koppelvariabelen. Tabel 5.5 Beschikbare koppelvariabelen in ABCD en PRN ABCD Geboortedatum moeder Postcode moeder (4 cijfers) Geboortedatum kind A terme datum Zwangerschapsduur bij geboorte Geboortegewicht kind Graviditeit/Pariteit Praktijknummer (onder zorg) Geboortelocatie (thuis/ziekenhuis) zonder naam ziekenhuis. 10 Geslacht kind 11 Meerling
PRN Geboortedatum moeder Postcode moeder (4 cijfers) Geboortedatum kind A terme datum Zwangerschapsduur bij geboorte Geboortegewicht kind Graviditeit/Pariteit Praktijknummer (LVR1 of LVR2) Geboorteplaats (thuis/ ziekenhuis, incl naam ziekenhuis) Geslacht kind Meerling
12 Abortus / sterfte kind
Abortus (sterfte < 20 wkn zwngsduur) Sterfte (sterfte >= 20 wkn zwngsduur)
1 2 3 4 5 6 7 8 9
Pagina 16 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Wanneer de keuzes ten aanzien van de waarde van een variabele met meerdere bronnen gemaakt worden zoals beschreven in §4.1.3, worden de volgende aantallen missende waarden gevonden (zie tabel 5.6 en 5.7). In het ABCD totaalbestand valt op dat aterme datum een hoog percentage missende waarden heeft. In beide bestanden hebben de kindvariabelen (geboortedatum, geboortegewicht, geslacht, geboortetijdstip) relatief hoge percentages missende waarden door het voorkomen van records zonder kindinformatie (zie tabel 5.1 en 5.2). In het PRN Amsterdam bestand 2003 zijn de percentages missende waarden voor de kindvariabelen zo’n 4 procent hoger dan in het landelijke PRN bestand, in 2004 is dit zo’n 2 procent. Daarnaast worden in de LNR registratie van opgenomen kinderen de aterme datum, graviditeit, geboorte-uur en geboorteminuut niet geregistreerd, waardoor deze variabelen bij de losse LNR records altijd missing zijn (N=120 in PRN Amsterdam bestand 2003 en N=40 in PRN Amsterdam bestand 2004). Tabel 5.6 Aantal en percentage missende waarden op kernvariabelen in ABCD en PRN 2003 Variabele
Geboortedatum moeder Postcode A terme datum Graviditeit Pariteit Zwangerschapsduur Geboortedatum kind Geboortegewicht kind Geslacht kind Geboorte-uur Geboorteminuut Meerling Geboorteloc. (thuis/zkhs) Zorginstellingsnr
ABCD totaal bestand 2003-2004 (N=12.560) # missing % 0 0% 0 0% 2.655 21% 852 7% 711 6% 737 6% 990 8% 814 6% n.v.t. n.v.t. 0 0% 830 7% 0 0% 0 0%
PRN jaarbestand 2003 (N=206.778) # missing % 1.033 0,5% 1.247 0,6% 4.712 2% 1.733 0,8% 16.406 12.429 12.651 12.774 15.767 14.107 0 n.v.t. 0
8% 6% 6% 6% 8% 7% 0% 0%
PRN Amsterdam 2003 (N=13.481) # missing % 12 0% 8 0% 317 2% 121 1% 1.628 1.340 1.348 1.358 1.586 1.460 0 n.v.t. 0
12% 10% 10% 10% 12% 11% 0% 0%
Tabel 5.7 Aantal en percentage missende waarden op kernvariabelen in ABCD en PRN 2004 Variabele
Geboortedatum moeder Postcode A terme datum Graviditeit Pariteit Zwangerschapsduur Geboortedatum kind Geboortegewicht kind Geslacht kind Geboorte-uur Geboorteminuut Meerling Geboorteloc. (thuis/zkhs) Zorginstellingsnr
ABCD totaal bestand 2003-2004 (N=12.560) # missing % 0 0% 0 0% 2.655 21% 852 7% 711 6% 737 6% 990 8% 814 6% n.v.t. n.v.t. 0 0% 830 7% 0 0% 0 0%
PRN jaarbestand 2004 (N=199.859) # missing % 965 <1% 903 <1% 4.626 2% 1.577 1%
Pagina 17 van 57
17.601 13.895 14.088 14.191 15.442 15.433 0
9% 7% 7% 7% 8% 8%
PRN Amsterdam 2004 (N=13.786) # missing % 12 <1% 15 <1% 197 1% 55 <1% 1.471 1.283 1.295 1.307 1.323 1.323 0 0
11% 9% 9% 9% 10% 10%
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Niet alle variabelen stonden in hetzelfde formaat in beide bestanden. De datumvariabelen in het aangeleverde SPSS ABCD totaalbestand zijn omgezet in SAS datumvariabelen. De codering van geslacht in het ABCD totaalbestand is omgecodeerd naar de PRN codering voor geslacht. De codering van de praktijken/instellingen is ook omgecodeerd naar de PRN codering. De koppeling en alle analyses zijn uitgevoerd in het statische pakket SAS, versie 9.1.
Pagina 18 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
6. Resultaten koppeling ABCD – PRN 2003 6.1 Keuze koppelvariabelen 2003 De gemeenschappelijke variabelen in de twee bestanden zijn vergeleken op overeenkomst van definitie dan wel meting c.q. vastlegging. Bij twee variabelen was er uiteindelijk onvoldoende overeenkomst om ze geschikt te doen zijn als koppelvariabele, n.l. zwangerschapsduur en praktijkcode. De ABCD praktijkcode is de praktijk van het eerste bezoek en de PRN praktijkcode is van de praktijk waar de vrouw onder zorg was (vaak ziekenhuis bij 2e lijnsbevalling). Beide afgekeurde koppelvariabelen kunnen wel achteraf bij de beoordeling van twijfel-koppelingen een rol spelen. Dat laatste geldt ook voor de niet-koppel variabelen abortus en sterfte. De meerlingvariabele ontbreekt in tabel 6.1 omdat deze niet als koppelvariabele wordt gebruikt, maar om data te splitsen waardoor voor eenling en meerling verschillende koppelstrategieën mogelijk zijn. De gekozen 7 koppelvariabelen voor de ABCD-PRN koppeling 2003 zijn: geboortedatum moeder, postcode, graviditeit, geboortedatum kind, aterme datum, geboortegewicht en geslacht kind. Voor de variabelen aterme datum, geboortedatum kind en geboortegewicht kind is additioneel een ‘close’ overeenkomst gedefinieerd. Voor aterme datum is ‘close’ een verschil van maximaal 14 dagen, voor geboortedatum kind een verschil van maximaal 2 dagen en voor geboortewicht een verschil van maximaal 20 gram. De geboortedatum van het kind en de aterme datum zijn sterk afhankelijk, terwijl bij het schatten van de koppelgewichten wordt uitgegaan van onafhankelijkheid. De aterme datum wordt daarom alleen vergeleken als de geboortedatum van het kind ontbreekt in een van beide bestanden. Afhankelijkheid geldt ook voor postcode en praktijkcode, praktijkcode zit niet in de koppelsleutel. Voor postcode wordt er naast overeenkomst tussen de LVR1/PRN postcode en de ABCD postcode van de moeder bij het eerste bezoek aan de verloskundige, ook gekeken naar overeenkomst tussen de LVR2/PRN postcode en de postcode van het kind volgens de GBA. Dit kan ook beschouwd worden als een soort close overeenkomst. In tabel 6.1 worden de mi- en ui-kansen en gewichten voor overeenkomst en geen overeenkomst weergegeven voor de set koppelvariabelen.
Pagina 19 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Tabel 6.1 Koppelgewichten koppelvariabelen ABCD – PRN (regio Amsterdam) eenlingen 2003 Koppelvariabele
mi-kans
ui-kans
Gewicht overeenkomst 12,06 5,82
Gewicht geen overeenkomst -5,04 -5,23
0,9697 0,0002 geboortedatum moeder 0,3170 0,0056 postcode postcode (close alle 0,6568 0,0127 5,69 combinaties) 0,9796 0,0028 8,47 -8,22 geboortedatum kind 0,0171 0,0109 0,65 geboortedatum kind close 2 dgn 0,7284 0,0027 8,10 -4,64 aterme datum 0,2345 0,0734 1,68 aterme datum close 14 dgn 0,8391 0,0041 7,66 -3,53 geboortegewicht 0,0763 0,0208 1,88 geboortegewicht close 20 gr 0,8993 0,2628 1,77 -2,87 graviditeit 0,9914 0,5001 0,99 -5,86 geslacht kind p=0.000079 36,77 -30,75 * Alle combinaties betekent het vergelijken van PRN LVR1, LVR2 en LNR postcode met de ABCD 1e contact vrouw postcode en GBA postcode kind.
In dit hoofdstuk zullen nu achtereenvolgens de koppelingsresultaten voor eenlingen en meerlingen worden beschreven en de koppelingsresultaten voor niet-gekoppelde eenlingen met niet-gekoppelde meerlingrecords. De koppeling wordt telkens in twee stappen uitgevoerd. Een totaaloverzicht van de koppeling voor eenlingen wordt gegeven in figuur 6.2 en voor meerlingen in figuur 6.3. Daarna worden de kenmerken van de niet-gekoppelde ABCD records beschreven en de creatie van het gekoppelde PRN-ABCD eindbestand voor 2003. 6.2 Resultaten voor eenlingen 2003 Koppeling stap 1 van het ABCD eenlingen bestand 2003 (N=5.631) en het PRN regio Amsterdam eenlingen bestand 2003 (N=13.481) leverde 75.911.511 paren (5.631 * 13.481). Op basis van de geschatte prevalentie (0.000079) is het geschatte aantal links 5.997 records en is de indicatie voor het afkappunt bij een totaalgewicht van 8,4. Na visuele beoordeling van grote groepen rondom het afkappunt, is gekozen voor een afkappunt van 13,8, zoals hierna wordt toegelicht (zie ook figuur 6.1 voor de verdeling van paren rondom het afkappunt). Een grote groep met een totaal koppelgewicht van 8.48 bestond uit 330 paren waarbij de postcode, graviditeit, geboortedatum kind en geslacht overeenkwamen en de geboortedatum van de moeder en het geboortegewicht niet overeenkwamen. Bij het bekijken van de verschillen in geboortedatum moeder en geboortegewicht en de praktijkcode (geen koppelvariabele) leek het onwaarschijnlijk dat deze paren bij elkaar hoorden. Dit gold ook voor een tweede grote groep met een totaal koppelgewicht van 10.65 die bestond uit 119 paren waar de postcode, graviditeit en aterme datum overeenkwamen, de geboortedatum van de moeder niet overeenkwam en de overige variabelen missing waren.
Pagina 20 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
800 indicatie afkappunt
700
gekozen afkappunt
600
C o u n t
500 400 300 200 100 0
5.25
8.25
11.25 14.25 17.25 20.25 23.25 26.25 29.25 32.25 35.25 Totaal koppelgewicht
Figuur 6.1 Aantal paren per koppelgewicht rondom het afkappunt eenlingen ABCD-PRN 2003
Er waren 5.184 paren met een totaalgewicht boven het afkappunt van 13,8. Van deze 5.184 paren, koppelden 4.527 paren uniek en kwamen 657 paren in clusters terecht. Er waren 276 clusters met 2 paren, 20 clusters met 3 paren, 10 clusters met 4 paren en 1 cluster met 5 paren (zie tabel 6.2). De clusters met 2 paren bestonden voornamelijk uit 2 PRN records die aan hetzelfde ABCD record koppelden en bij elkaar horen. Deze paren zijn beide meegenomen als link. De clusters met 4 paren bestonden voornamelijk uit 2 ABCD records die koppelden met 2 PRN records. Deze clusters zijn opgelost door de twee beste paren (paren met het hoogste koppelgewicht) mee te nemen als link. Deze varianten kwamen beide voor binnen de clusters met 3 paren. Afhankelijk van de samenstelling, zijn deze clusters conform de clusters met 2 paren of conform de clusters met 4 paren opgelost. Bij het oplossen van de clusters werden tevens 4 administratieve dubbeltellingen in het ABCD totaal bestand gevonden (GBA-nummer kind kwam overeen). Dit was vooraf niet verwacht. Het oplossen van de clusters resulteerde in 619 ABCD-PRN paren, met 327 ABCD records die aan 1 of meer PRN records koppelden. Het totale aantal paren in stap 1 was 4.527 + 619 = 5.146 paren met 4.527 + 327 = 4.854 ABCD records. Na deze stap waren er nog 773 ABCD records die niet koppelden aan een PRN record. Tabel 6.2 Aantal clusters naar aantal paren per cluster eenlingen ABCD-PRN 2003 Aantal paren per cluster 2 paren 3 paren 4 paren 5 paren Totaal aantal paren
Aantal clusters 276 20 10 1 657
Pagina 21 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Bij het oplossen van de clusters werden 132 paren gevonden waar 1 ABCD record koppelt aan 2 PRN records van praktijknr 1501 en 1808. Praktijk 1501 is gestopt op 30 september 2003, het waren voornamelijk zwangerschapsrecords van praktijk 1501 en volledige records van 1808. Deze ‘dubbele’ records waren niet gevonden bij de interne PRN LVR1^LVR1 koppeling, doordat de zwangerschapsrecords zonder kind uitkomsten te weinig identificerende informatie bevatten om goed te kunnen koppelen. De nog niet-gekoppelde ABCD records (N=773) zijn vervolgens gekoppeld met de PRN eenling records buiten regio Amsterdam in koppeling stap 2. Er werden nog 69 paren boven het afkappunt gevonden. Van deze 69 paren koppelden 61 paren uniek en 8 paren in clusters. Het oplossen van de clusters resulteerde in 8 ABCD-PRN paren, met 4 ABCD records die aan 2 PRN records koppelden. Het totale aantal paren in stap 2 was 61 + 8 = 69 met 61 + 4 = 65 ABCD records. Het totale aantal links bij de ABCD-PRN eenlingen koppeling in stap 1 en stap 2 was 5.146 + 69 = 5.215 paren met 4.854 + 65 = 4.919 ABCD records. Het aantal ABCD eenlingen 2003 records dat niet gekoppeld was na stap 1 en stap 2 was 5.631 – 4.919 – 4 = 708. In paragraaf 6.5 gaan we hier verder op in. In figuur 6.2 wordt een flowchart getoond van de ABCD-PRN koppeling 2003 voor eenlingen.
Pagina 22 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Figuur 6.2 Flowchart ABCD-PRN koppeling eenlingen 2003 stap1 en 2
Pagina 23 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
6.3 Resultaten voor meerlingen 2003 De koppeling van meerlingen is aanzienlijk complexer dan de koppeling van eenlingen, zoals bekend uit eerdere rapportages [9,10,12]. Koppeling van het ABCD meerlingen totaalbestand 2003 (N=204) en het PRN regio Amsterdam meerlingen bestand 2003 (N=514) leverde 104.856 paren (204 * 514) op. Het afkappunt van de eenlingkoppeling van 13,8 is ook bij de meerlingkoppeling aangehouden. Er waren 414 paren met een totaalgewicht boven het afkappunt van 13,8. Van deze 414 paren koppelden 4 paren uniek en kwamen 410 paren in clusters terecht. Er was 1 cluster met 2 paren, 86 clusters met 4 paren, 2 clusters met 5 paren en 9 clusters met 6 paren (zie tabel 6.3). De clusters met 4 paren bestonden uit 2 ABCD records en 2 PRN records van dezelfde meerling. Deze clusters zijn opgelost door de twee beste paren (paren met het hoogste koppelgewicht) mee te nemen als link. Geboortegewicht en geslacht zijn de enige twee koppelvariabelen die kunnen verschillen tussen meerlingkinderen. Overeenkomst op deze variabelen zorgde ervoor dat de paren met records van hetzelfde kind een hoger koppelgewicht kregen dan paren met records van de verschillende kinderen. De cluster met 2 paren en de clusters met meer dan 4 paren zijn handmatig op basis van additionele bestandsinformatie opgelost. Het oplossen van de clusters resulteerde in 214 paren, met 196 unieke ABCD records. Het totale aantal links in stap 1 was 214 + 4 = 218 paren, met 200 unieke ABCD records. Na deze stap waren er 4 ABCD records die niet koppelden aan een PRN record. Tabel 6.3 Aantal clusters naar aantal paren per cluster meerlingen ABCD-PRN 2003 Aantal paren per cluster 2 paren 3 paren 4 paren 5 paren 6 paren Totaal aantal paren
Aantal clusters 1 0 86 2 9 410
De 4 ABCD meerlingrecords die niet koppelden aan een PRN record waren van 2 vrouwen. 2 van deze 4 records zijn van een tweeling waarvan de bevalling in het buitenland plaatsvond. De andere twee records zijn ook van één tweeling en het is niet duidelijk waarom deze niet koppelen aan een PRN record in de regio Amsterdam. Wanneer we deze records aanbieden aan de PRN meerlingrecords van de rest van Nederland in stap 2, vinden we een match. In deze records staat aangegeven dat de vrouw is overgenomen vanuit de praktijk in Amsterdam die staat aangegeven in het ABCD record. Er koppelen dus nog 2 ABCD meerlingrecords in stap 2. Het totale aantal gekoppelde ABCD meerlingrecords 2003 na stap 1 en stap 2 was 200 + 2 = 202 records. Na stap 1 en stap 2 waren er 2 ABCD meerlingrecords 2003 die niet koppelden met een PRN record uit 2003. De reden dat deze 2 ABCD meerlingrecords uit 2003 niet koppelen aan een PRN record, was omdat de vrouw in het buitenland is bevallen en er dus geen PRN gegevens aanwezig zijn. In figuur 6.2 wordt een flowchart getoond van de ABCD-PRN koppeling 2003 voor meerlingen.
Pagina 24 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
PRN jaarbestand meerlingen 2003
ABCD bestand 2003
PRN 2003 meerlingen 8.479 records
ABCD 2003 bestand 5.835 records
PRN meerlingen rest van NL 7.965 records
ABCD eenlingen 2003 5.631 records PRN meerlingen regio Amsterdam 514 records
ABCD 2003 meerlingen 204 records
PRN ^ ABCD 104.856 paren
PRN ^ ABCD boven afkappunt 414 paren
410 paren in 195 clusters
Niet-gekoppelde ABCD 4 records
Niet-gekoppelde ABCD 2 records
196 ABCD-PRN paren
4 Unieke ABCD-PRN paren
2 ABCD-PRN paren
Niet-gekoppelde ABCD records 2 records “bevalling in het buitenland”
Gekoppeld ABCD-PRN paren 202 paren
Figuur 6.3 Flowchart ABCD-PRN koppeling meerlingen 2003 stap 1 en 2
6.4 Resultaten voor niet-gekoppelde eenling- met meerlingrecords 2003 ABCD niet-gekoppeld eenling - PRN niet-gekoppeld meerling Van de 708 niet-gekoppelde ABCD eenlingrecords, koppelden 8 records met een PRN meerlingrecord. 4 van deze 8 records koppelden uniek aan een PRN record. De overige 4 ABCD eenlingrecords koppelden aan twee PRN records van verschillende kinderen van één meerling. Bij 1 meerling zijn volgens de PRN beide kinderen overleden ante partu < 28 weken. Bij een andere meerling is 1 kind volgens de PRN overleden ante partu <28 weken). Bij de overige records is niet duidelijk waarom het volgens de PRN een meerling kind betreft en volgens de ABCD een eenling kind. Na deze stap zijn er 700 ABCD eenlingrecords over die niet koppelen aan een PRN record. ABCD niet-gekoppeld meerling - PRN niet-gekoppeld eenling Er waren geen niet-gekoppelde ABCD meerling records.
Pagina 25 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
6.5 Niet-gekoppelde ABCD records 2003 Er zijn 700 records (allen eenlingen) van de 5.835 ABCD records (12%) die niet koppelen aan een PRN record in 2003. Van de 700 records hebben 147 records (21%) een onbekend geboortejaar. Deze records worden opnieuw meegenomen bij de 2004 koppeling. De kenmerken van de niet-gekoppelde ABCD records worden besproken in paragraaf 7.7 na de ABCD-PRN koppeling 2004. 6.6 Creatie eindbestand ABCD-PRN koppeling 2003 Het eindbestand van de ABCD-PRN koppeling 2003 wordt gevormd door de gekoppelde ABCD-PRN records uit stap 1 en stap 2 voor eenlingen en meerlingen. Dit waren voor eenlingen 4.920 ABCD records en voor meerlingen 202 records. De koppelingen die nog gevonden zijn bij de koppeling van niet-gekoppelde eenlingen met niet-gekoppelde meerlingrecords worden hieraan toegevoegd. Bij deze koppeling koppelden nog 8 ABCD records. In totaal zijn 5.130 ABCD records met een geboorte in 2003 of een onbekend geboortejaar gekoppeld aan een PRN record. Van de records waarbij het geboortejaar onbekend is, zijn 43 records gekoppeld aan een PRN record uit 2003. Tenslotte worden de 700 niet-gekoppelde ABCD eenling records en de 2 niet-gekoppelde ABCD meerling records (bevalling in het buitenland) toegevoegd aan het eindbestand. Het eindbestand bestaat uit 5.130 gekoppelde ABCD records en 702 niet-gekoppelde ABCD records. De 4 administratieve dubbeltellingen zijn verwijderd uit het ABCD bestand. Als er een validatiestudie wordt uitgevoerd met de 700 ABCD records (12%) die niet zijn gekoppeld aan een PRN record kunnen deze aantallen nog veranderen.
Pagina 26 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
7. Resultaten koppeling ABCD – PRN 2004 7.1 Keuze koppelvariabelen 2004 De gekozen koppelvariabelen, close waarden en keuzes bij afhankelijke variabelen voor de ABCD-PRN koppeling 2004 zijn gelijk aan de 2003 koppeling. In tabel 7.1 worden mi- en ui-kansen en de gewichten voor overeenkomst en geen overeenkomst weergegeven voor de set koppelvariabelen. Tabel 7.1 Koppelgewichten koppelvariabelen ABCD – PRN (regio Amsterdam) eenlingen 2004 Koppelvariabele
mi-kans
ui-kans
0,9765 0,0002 geboortedatum moeder 0,3192 0,0058 postcode 0,6583 0,0123 postcode (close alle combinaties*) 0,8933 0,2758 graviditeit 0,7072 0,0027 aterme datum 0,2558 0,0739 close 14 dgn 0,9785 0,0027 geboortedatum kind 0,0169 0,0109 close 2 dgn 0,9923 0,5003 geslacht kind 0,8494 0,0044 geboortegewicht 0,0687 0,0217 close 20 gr p=0.000077 * Alle combinaties betekent het vergelijken van PRN LVR1, ABCD 1e contact vrouw postcode en GBA postcode kind.
Gewicht Gewicht geen overeenovereenkomst komst 12,04 -5,41 5,78 -5,45 5,74 1,70 -2,76 8,05 -4,64 1,79 8,48 -7,74 0,63 0,99 -6,02 7,60 -3,57 1,66 44,64 -35,60 LVR2 en LNR postcode met de
In dit hoofdstuk zullen nu achtereenvolgens de koppelingsresultaten voor eenlingen en meerlingen worden beschreven en de koppelingsresultaten voor niet-gekoppelde eenlingen met niet-gekoppelde meerlingrecords. De koppeling wordt telkens in twee stappen uitgevoerd. Een totaaloverzicht van de koppeling voor eenlingen wordt gegeven in figuur 7.2 en voor meerlingen in figuur 7.3. Daarna worden de kenmerken van de niet-gekoppelde ABCD records beschreven en de creatie van het gekoppelde PRN-ABCD eindbestand voor 2004. 7.2 Resultaten voor eenlingen 2004 Koppeling stap 1 van het ABCD eenlingen totaalbestand 2004 (N=6.716) en het PRN regio Amsterdam eenlingen bestand 2004 (N=13.786) leverde 95.586.776 paren (6.716 * 13.786). Op basis van de geschatte prevalentie (0.000077) is het geschatte aantal links 7.129 records en is de indicatie voor het afkappunt bij een totaalgewicht van 7,95. Na visuele beoordeling van grote groepen rondom het afkappunt, is gekozen voor een afkappunt van 13,2. Zie figuur 7.1 voor de verdeling van paren rondom het afkappunt. Een grote groep met een totaal koppelgewicht van 7,97 bestond uit 427 paren waarbij de postcode, graviditeit, geboortedatum kind en geslacht overeenkwamen en de geboortedatum van de moeder en het geboortegewicht niet overeenkwamen. Bij het bekijken van de verschillen in geboortedatum moeder en geboortegewicht en de praktijkcode (geen
Pagina 27 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
koppelvariabele) leek het onwaarschijnlijk dat deze paren bij elkaar hoorden. Dit gold ook voor een tweede groep met een totaal koppelgewicht van 10,2 die bestond uit 88 paren waar de postcode, graviditeit en aterme datum overeenkwamen, de geboortedatum van de moeder niet overeenkwam en de overige variabelen missing waren. Een derde grote groep in dit gebied die bestond uit 85 paren had een totaal koppelgewicht van 8,29 en hier kwamen alleen geboortedatum moeder en graviditeit overeen en waren de overige variabelen missing.
800
indicatie afkappunt
gekozen afkappunt
700 600
C o u n t
500 400 300 200 100 0 5 .4
7.8
10 .2 12. 6
15
17. 4 1 9.8 22 .2 24.6
27
29. 4 3 1.8 34. 2
wg tto t
Figuur 7.1 Aantal paren per koppelgewicht rondom het afkappunt eenlingen ABCD-PRN 2004
Er waren 6.371 paren met een totaalgewicht boven het afkappunt van 13,8. Van deze 6.371 paren, koppelde 5.698 paren uniek en kwamen 673 paren in clusters terecht (1 PRN record koppelde aan meerdere ABCD records en/of andersom). Er waren 293 clusters met 2 paren, 21 clusters met 3 paren en 6 clusters met 4 paren (zie tabel 7.2). De clusters met 2 paren bestonden voornamelijk uit 2 PRN records die aan hetzelfde ABCD record koppelden en bij elkaar horen. Deze paren zijn beide meegenomen als link. De clusters met 4 paren bestonden voornamelijk uit 2 ABCD records die koppelden met 2 PRN records. Deze clusters zijn opgelost door de twee beste paren (paren met het hoogste koppelgewicht) mee te nemen als link. Deze varianten kwamen beide voor binnen de clusters met 3 paren. Afhankelijk van de samenstelling, zijn deze clusters conform de clusters met 2 paren of conform de clusters met 4 paren opgelost. Bij het oplossen van de clusters werden tevens 3 administratieve dubbeltellingen in het ABCD totaalbestand gevonden (GBA-nummer kind kwam overeen). Dit was vooraf niet verwacht. Het oplossen van de clusters resulteerde in 638 paren, met 338 ABCD records die aan 1 of meer PRN records koppelden. Het totale aantal paren in stap 1 was 5.698 + 638 = 6.336 paren met 6.036 ABCD records. Na deze stap waren er 677 ABCD records die niet koppelden aan een PRN record.
Pagina 28 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Tabel 7.2 Aantal clusters naar aantal paren per cluster eenlingen ABCD-PRN 2004 Aantal paren per cluster 2 paren 3 paren 4 paren Totaal aantal paren
Aantal clusters 293 21 6 673
De niet-gekoppelde ABCD records (N=677) zijn vervolgens gekoppeld met de PRN eenling records buiten regio Amsterdam in koppeling stap 2. Er werden 132 paren boven het afkappunt gevonden. Van deze 132 paren koppelden 122 paren uniek en 10 paren in clusters. Het oplossen van de clusters resulteerde in 10 paren, met 5 ABCD records die aan 2 PRN records koppelden. Het totale aantal paren in stap 2 was 122 + 10 = 132, met 122 + 5 = 127 ABCD records. Het totale aantal links bij de ABCD-PRN eenlingen koppeling in stap 1 en stap 2 was 6.336 + 132 = 6.468 paren met 6.036 + 127 = 6.163 ABCD records. Het aantal ABCD eenlingen 2004 records dat niet gekoppeld was na stap 1 en stap 2 was 6.716 – 6.163 – 3 = 550. In figuur 7.2 wordt een flowchart getoond van de ABCD-PRN koppeling 2004 voor eenlingen.
Pagina 29 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Figuur 7.2 Flowchart ABCD-PRN koppeling eenlingen 2004 stap 1 en 2
Pagina 30 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
7.3 Resultaten voor meerlingen 2004 Deze koppeling is aanzienlijk complexer, zoals bekend uit eerdere rapportages. Koppeling van het ABCD meerlingen totaalbestand 2004 (N=156) en het PRN regio Amsterdam meerlingen bestand 2004 (N=493) leverde 76.908 paren (156 * 493). Het afkappunt van de eenlingkoppeling van 13,8 is ook bij de meerlingkoppeling aangehouden. Er waren 311 paren met een totaalgewicht boven het afkappunt van 13,8. Van deze 311 paren koppelden 0 paren uniek en kwamen 311 paren in clusters terecht (2 of meer PRN records koppelde aan 2 of meer ABCD records). Er waren 64 clusters met 4 paren, 3 clusters met 5 paren, 5 clusters met 6 paren en 1 cluster met 10 paren (zie tabel 7.3). De clusters met 4 paren bestonden uit 2 ABCD records en 2 PRN records van dezelfde meerling. Deze clusters zijn opgelost door de twee beste paren (paren met het hoogste koppelgewicht) mee te nemen als link. Geboortegewicht en geslacht zijn de enige twee koppelvariabelen die kunnen verschillen tussen meerlingkinderen. Overeenkomst op deze variabelen zorgde ervoor dat de paren met records van hetzelfde kind een hoger koppelgewicht kregen dan paren met records van de verschillende kinderen. De cluster met 2 paren en de clusters met meer dan 4 paren zijn handmatig opgelost. Het oplossen van de clusters resulteerde in 160 paren, met 146 ABCD records die aan 1 of meer PRN records koppelden. Het totale aantal links in stap 1 was 160 paren, met 146 ABCD records. Na deze stap waren er 10 ABCD records die niet koppelden aan een PRN record. Tabel 7.3 Aantal clusters naar aantal paren per cluster meerlingen ABCD-PRN 2004 Aantal paren per cluster 2 paren 3 paren 4 paren 5 paren 6 paren 10 paren Totaal aantal paren
Aantal clusters 0 0 64 3 5 1 311
De 10 ABCD records die niet koppelden aan een PRN record waren van 5 moeders. Bij drie meerlingen (6 records) was in het ABCD bestand aangegeven dat de moeder uit Amsterdam was verhuisd. Bij 1 meerling was 1 van de kinderen overleden. Wanneer we deze records aanbieden aan de PRN meerlingrecords van de rest van Nederland, vinden we een match voor 8 records. Er koppelen dus nog 8 ABCD meerlingrecords in stap 2. Het totale aantal gekoppelde ABCD meerlingrecords 2004 na stap 1 en stap 2 was 146 + 8 = 154 records. Na stap 1 en stap 2 waren er 2 ABCD meerlingrecords 2004 die niet koppelden met een PRN record uit 2004. Het was niet duidelijk waarom deze 2 ABCD meerlingrecords uit 2004 niet koppelen aan een PRN record. In figuur 7.3 wordt een flowchart getoond van de ABCD-PRN koppeling 2004 voor meerlingen.
Pagina 31 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
PRN jaarbestand meerlingen 2004
ABCD bestand 2004
PRN 2004 meerlingen 8.343 records
ABCD 2004 bestand 6.872 records
PRN meerlingen rest van NL 7.965 records
ABCD eenlingen 2004 6.716 records PRN meerlingen regio Amsterdam 493 records
ABCD 2004 meerlingen 156 records
PRN ^ ABCD 76.908 paren
PRN ^ ABCD boven afkappunt 311 paren
311 paren in 73 clusters
Niet-gekoppelde ABCD 10 records
Niet-gekoppelde ABCD 2 records
146 ABCD-PRN paren
0 Unieke ABCD-PRN paren
8 ABCD-PRN paren
Niet-gekoppelde ABCD records 2 records
Gekoppeld ABCD-PRN paren 154 paren
Figuur 7.3 Flowchart ABCD-PRN koppeling meerlingen 2004 stap 1 en 2
7.4 Resultaten voor niet-gekoppelde eenling- met meerlingrecords 2004 ABCD niet-gekoppeld eenling - PRN niet-gekoppeld meerling Van de 550 niet-gekoppelde ABCD records, koppelden 6 records met PRN meerling records. Twee ABCD records koppelden uniek aan een PRN record en beide PRN records zijn van een meerling volgens reden overdracht. De overige 4 records koppelden aan twee of drie PRN records van verschillende kinderen van één meerling. Eén ABCD record koppelde aan 3 records van een drieling, waarvan alle kinderen zijn overleden. Van een tweeling was 1 kind overleden na de geboorte volgens de LNR. Van de overige twee tweelingen is niet duidelijk waarom het volgens het PRN bestand een meerling betreft en volgens het ABCD bestand een eenling. Na deze stap zijn er 544 ABCD eenlingrecords over die niet koppelen aan een PRN record.
Pagina 32 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
ABCD niet-gekoppeld meerling - PRN niet-gekoppeld eenling De twee ABCD meerlingrecords die niet koppelden aan een PRN meerling record, koppelen wel met 1 PRN eenlingrecord. 7.5 Niet-gekoppelde ABCD records 2004 Er zijn 544 records (allen eenlingen) van de 6.872 ABCD records (8%) die niet koppelen aan een PRN record. Dit percentage is iets lager dan voor 2003 (12%), doordat er minder records met onbekend geboortejaar zijn meegenomen in 2004. De kenmerken van de niet-gekoppelde ABCD records worden besproken in paragraaf 7.7. 7.6 Creatie eindbestand ABCD-PRN koppeling 2004 Het eindbestand van de ABCD-PRN koppeling 2004 wordt gevormd door de gekoppelde ABCD-PRN records uit stap 1 en stap 2 voor eenlingen en meerlingen. Dit waren voor eenlingen 6.163 ABCD records en voor meerlingen 154 records. De koppelingen die nog gevonden zijn bij de koppeling van niet-gekoppelde eenlingen met niet-gekoppelde meerlingrecords worden hieraan toegevoegd. Bij deze koppeling koppelden nog 8 ABCD records. In totaal zijn 6.325 ABCD records met een geboorte in 2004 of een onbekend geboortejaar gekoppeld aan een PRN record. Van de records waarbij het geboortejaar onbekend is, zijn 42 records gekoppeld aan een PRN record uit 2004. Tenslotte worden de 544 niet-gekoppelde ABCD eenling records toegevoegd aan het eindbestand. Het eindbestand bestaat uit 7.193 records van 6.325 gekoppelde ABCD records en 544 niet-gekoppelde ABCD records. De 3 administratieve dubbeltellingen zijn verwijderd uit het ABCD totaalbestand.
Pagina 33 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
8. Resultaten ABCD-PRN koppeling 2003 en 2004 8.1 Eindbestand ABCD-PRN koppeling 2003 en 2004 Het gecombineerde eindbestand bestaat uit 13.195 ABCD-PRN paren van 12.553 ABCD records. Van de 12.553 ABCD records, zijn 11.456 (91%) ABCD records gekoppeld aan één of meer PRN records. Het aangeleverde ABCD totaalbestand bestond uit 12.560 records, 7 ABCD records zijn verwijderd omdat dit administratieve dubbeltellingen waren van andere ABCD records. De nummers zijn doorgegeven aan de ABCD groep. Voor het creëren van het eindbestand van de ABCD-PRN koppeling voor 2003 en 2004 worden de eindbestanden van 2003 en 2004 gecombineerd. Het eindbestand voor 2003 bestaat uit 6.149 records en het eindbestand voor 2004 uit 7.193 records. Uit het gekoppelde ABCD-PRN 2004 eindbestand worden de ABCD records waarvan het geboortejaar onbekend is en die niet zijn gekoppeld aan een PRN record uit 2004 verwijderd (N=105). Deze records komen namelijk ook voor in het ABCD 2003 bestand. De ABCD records waarvan het geboortejaar onbekend is, die wel zijn gekoppeld met een PRN record uit 2004 worden verwijderd uit het 2003 eindbestand (N=42). ABCD-PRN eindbestand versie 1.0 De ABCD records die aan meer dan 1 PRN record koppelden, zijn meerdere keren opgenomen in het ABCD-PRN eindbestand 2003-2004 versie 1.0. Per ABCD record is er dan één PRN record aangekoppeld. De noemer van het eindbestand is daardoor groter dan de noemer van het ABCD onderzoeksbestand. ABCD-PRN eindbestand versie 2.0 Op verzoek van medewerkers van de ABCD studie is een tweede eindbestand aangemaakt om analyses met het eindbestand eenvoudiger uit te kunnen voeren, zonder daarbij rekening te hoeven houden met de clusters. Het ABCD-PRN eindbestand 2003-2004 versie 2.0 is een bestand waarin ieder ABCD record maar één keer voorkomt. Hiervoor zijn in het geval dat 2 PRN records aan 1 ABCD record koppelden, de PRN records zoveel mogelijk samengevoegd. Dit houdt in dat als twee PRN records aan 1 ABCD record koppelden en er geen overlap was in de registratie informatie binnen de PRN records, ze zijn samengevoegd. Vb. Een PRN record met LVR1 en LVR2 informatie koppelt aan een ABCD record. Daarnaast koppelt ook een PRN record met alleen LNR informatie aan hetzelfde ABCD record. Omdat er geen overlap is in registratie informatie wordt de lege LNR informatie in het 1e record overschreven met de LNR informatie van het tweede PRN record. Omdat het ook vaak voorkwam dat een tweede record met LVR1 informatie koppelde aan hetzelfde ABCD record, is er een tweede LVR1 record opgenomen in het totale gekoppelde ABCD-PRN bestand, waar aan alle LVR1 variabelen ‘_b’ is toegevoegd. Voor veruit de meeste clusters (2 PRN records aan 1 ABCD record) vormde deze aanpak een oplossing. Bij clusters waar 3 PRN records aan 1 ABCD record koppelden, gaat het 3e PRN record verloren als het niet in elkaar geschoven kan worden (N=9). De records zijn echter toegevoegd in volgorde op basis van het hoogste koppelgewicht en dus de meeste waarschijnlijkheid dat ze bij elkaar horen.
Pagina 34 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
In het versie 1.0 bestand is terug te zien aan welk record het ABCD record nog meer koppelde. Daarnaast zijn er een aantal ‘lastige gevallen’ waar de records niet in elkaar konden worden geschoven (N=34 paren in 16 clusters). Dit zijn voor de helft de paren die volgens het ene bestand een meerling zijn en volgens het andere bestand een eenling. Voor deze paren is geen technische oplossing gevonden en deze paren zijn opgenomen in een apart bestand. Toegevoegde variabelen eindbestand Er is een aantal variabelen toegevoegd aan het ABCD-PRN eindbestand 2003 en 2004 versie 1.0 en versie 2.0. Deze variabelen worden vooraf gegaan door ‘l_’ om aan te geven dat het een door LinKID aangemaakte variabele is ten behoeve van de ABCD-PRN koppeling: -
‘l_cluster’; geeft bij eenlingen aan welke paren bij hetzelfde ABCD record horen, bij meerlingen geeft ‘cluster’ aan welke kinderen van dezelfde moeder zijn en eventueel daarbinnen welke twee paren bij hetzelfde ABCD record horen ‘l_meerling’; 0=eenling, 1=meerling, 2=eenling volgens 1 bestand, meerling volgens andere bestand ‘l_koppel’; 0=niet-gekoppeld record, 1=gekoppeld record ‘l_x_agree’; geeft per koppelvariabele (x) aan of deze variabele overeenkomt tussen de twee records ‘l_wgttot’; het totale ABCD-PRN koppelgewicht (zekerheid link)
De records binnen het eindbestand van de ABCD-PRN koppeling 2003-2004 versie 1.0 en versie 2.0 waar de zwangere vrouw toestemming heeft gegeven voor de PRN koppeling, zijn op 18 en 26 juli 2006 geleverd aan de ABCD studie. Dit betreft 7.155 van de 11.438 gekoppelde ABCD records (63%). Voor a) de non-respondenten en b) de zwangere vrouwen die geen toestemming hebben gegeven voor de koppeling met de PRN gegevens wordt het bestand niet geleverd en worden gegevens op geaggregeerd niveau geleverd aan de ABCD studie, met onderscheid naar a en b [bijlage 1]. De output bestanden van het project: - ‘abcdresptoest.sas7bdat’ versie 1.0 van 29 mei 2006 - ‘abcdresptoest.sav’ versie 1.0 van 29 mei 2006 - ‘abcdresptoest_18jul06.sas7bdat’ versie 2.0 van 18 juli 2006 - ‘abcdresptoest_18jul06.sav’ versie 2.0 van 18 juli 2006 - ‘abcdresptoest_lastig_18jul06.sas7bdat’ versie 2.0 van 18 juli 2006 - ‘abcdresptoest_lastig_18jul06.sav’ versie 2.0 van 18 juli 2006 8.2 Niet-gekoppelde ABCD records 2003 en 2004 Het totaal aantal niet-gekoppelde ABCD records na de ABCD-PRN koppeling 2003 en 2004 is 1.097 records (700+544-105-42=1.097 records). Dit is 8,7% van het totale aantal ABCD records. De niet-gekoppelde ABCD records zijn ook opgenomen in het eindbestand. Na de ABCD-PRN koppeling 2003 waren er 700 ABCD records die niet gekoppeld konden worden aan een PRN record. Van deze 700 ABCD records, waren er 147 records met een onbekend geboortejaar. Deze 147 records zijn opnieuw meegenomen bij de ABCD-PRN 2004 koppeling en toen koppelden er 42 records aan een PRN 2004 record (29%). Na de ABCD-PRN 2004 koppeling waren
Pagina 35 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
er 544 ABCD records die niet gekoppeld konden worden aan een PRN record en dit was inclusief de 105 records met een onbekend geboortejaar. Van de 1.097 ABCD records (allen eenlingen) die niet koppelen aan een PRN record, zijn 544 records van ABCD deelnemers (50%) en 553 records van niet-deelnemers (50%) (zie tabel 8.1). Het aandeel van records zonder kindinformatie is groter bij de niet-deelnemers aan de ABCD studie dan bij de deelnemers (51% t.o.v. 17%). Door het ontbreken van kindinformatie zijn de records veel moeilijker te koppelen. Het aandeel niet-deelnemers binnen de niet-gekoppelde records is groter dan in de totale ABCD populatie. Dit wordt mede veroorzaakt door het vaker ontbreken van kindinformatie bij de niet-deelnemers. Van de 1.097 ABCD records die niet koppelen aan een PRN record, bleken er bij grondige controle 184 records afkomstig te zijn van praktijken die in het geheel niet hebben aangeleverd aan de PRN registratie in 2003 en/of 2004, en 913 records van praktijken die wel hebben aangeleverd. Binnen de niet-gekoppelde ABCD records zijn er 95 records (27 van ABCD deelnemers, 68 van niet-deelnemers) waarin sterfte van het kind staat aangegeven. In 86 gevallen was dit onder de 20 weken zwangerschapsduur. Tabel 8.1 Niet met PRN gekoppelde ABCD records in 2003 en 2004 PRN deelnemer (praktijk)
Totaal
Geen PRN deelnemer (praktijk)
#
%
ABCD deelnemer Geen kindinformatie Levend kind Sterfte kind Subtotaal
76 362 23 461
15 64 4 83
91 426 27 544
17% 78% 5% 100%
Geen ABCD deelnemer Geen kindinformatie Levend kind Sterfte kind Subtotaal
235 154 63 452
48 48 5 101
283 202 68 553
51% 37% 12% 100%
Totaal Geen kindinformatie Levend kind Sterfte kind Totaal
311 516 86 913
63 112 9 184
374 628 95 1.097
34% 57% 9% 100%
Van de 1.097 niet-gekoppelde ABCD records zijn er 362 records van respondenten uit praktijken die hebben aangeleverd aan de PRN en waar kindinformatie vanuit de ABCD studie beschikbaar is. Het is niet duidelijk waarom deze records niet gekoppeld kunnen worden aan een PRN record. Alleen handmatige validatie aan de bron (in de praktijk) kan hier duidelijkheid geven. Mogelijke verklaringen zijn: software pakketten die missende en foute records niet verzenden of muteren, slordigheid/ zoekraken, etc. Voor validatie zouden de volgende groepen in aanmerking komen: - Alle sterfgevallen met een zwangerschapsduur van tenminste 20 wk (N=9), - ABCD deelnemers in praktijken in PRN met kindinformatie (N=362), - ABCD deelnemers in praktijken in PRN zonder kindinformatie (N=76).
Pagina 36 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
9. De kwaliteit van de koppeling PRN jaarbestanden (LVR1^LVR2^LNR) In dit hoofdstuk worden de implicaties van de ABCD-PRN koppelingsresultaten voor 2003 en 2004 zoals beschreven in hoofdstuk 6, 7 en 8, voor de PRN koppeling beschreven. De implicaties van de ABCD-PRN koppelingsresultaten worden beschreven voor de PRN koppeling algemeen, voor de koppeling van meerlingen en de koppeling van vrouwen zonder kindinformatie in het bijzonder, voor het inzicht in de GBA-PRN koppeling en voor inzicht in de aankoppeling van externe onderzoeksbestanden aan de PRN registratie. De ABCD-PRN koppeling is een ander soort koppeling dan de PRN-koppeling van de drie losse registraties LVR1, LVR2 en LNR. Bij de ABCD-PRN koppeling was de vooraf verwachting dat alle ABCD records terug te vinden waren in de PRN registratie. Deze verwachting was medebepalend voor de uiteindelijke koppelstrategie, in die zin dat het afkappunt ‘minder streng’ gekozen is dan bij de PRN LVR1^LVR2^LNR koppelingen. Bij de PRN-koppeling is de mate van overlap tussen de losse registraties onbekend (schatting 30-40% overdracht) en zeker geen 100%. 9.1 LVR1, LVR2 en LNR koppeling algemeen De koppelingsstrategie zoals deze wordt toegepast bij de PRN koppeling van de LVR1, LVR2 en LNR was ook toepasbaar voor de ABCD-PRN koppeling. Echter er zijn twee verschillen, het gebruiken van blocking en het oplossen van de clusters. Bij de ABCD-PRN koppeling stap 1 was het niet nodig om blocking te gebruiken door de relatief kleine bestanden. In stap 2 was blocking wel noodzakelijk. Bij de 2003 en 2004 koppeling tussen het gekoppelde PRN eenlingen bestand en het ABCD eenlingen bestand ontstonden een aantal clusters boven het afkappunt. Deze clusters bestonden bijna allemaal uit meerdere PRN records die aan één ABCD record koppelden. Deze clusters ontstonden door gemiste koppelingen bij de PRN koppeling van de LVR1, LVR2 en LNR registratie. Deze koppelingen werden gemist door het ontbreken van informatie of door fouten in de informatie in de 3 bronregistraties LVR1, LVR2 en LNR. Er kunnen 4 groepen worden onderscheiden met ontbrekende of onjuiste informatie waardoor clusters ontstonden: records van vrouwen zonder kindinformatie, records van verhuizers, losse LNR records, en records van opgeheven/overgenomen LVR1 praktijken. Bij de koppeling bestond een aantal clusters uit 2 ABCD records die koppelden aan hetzelfde PRN record. Dit bleken gemiste administratieve dubbeltellingen in het ABCD totaalbestand. Er werden 4 administratieve dubbeltellingen gevonden in 2003 (ABCD volgnr 1416, 3524, 3677 en 6574) en 3 administratieve dubbeltellingen in 2004 (ABCD volgnr 8167, 10101 en 10903). Algemeen geldt dat het bij de ABCD-PRN Amsterdam koppeling niet nodig was om blocking te gebruiken, doordat met veel kleinere bestanden gewerkt wordt dan bij de interne PRN koppeling. Records met veel missende waarden kunnen nu toch boven het afkappunt komen als de geboortedatum moeder (blocking variabele bij interne LVR1 en LVR1^LVR2 koppeling) overeenkomt. Daarnaast wordt er informatie uit een andere bron gebruikt. Wanneer deze externe bron aangeeft dat er maar 1 ABCD deelneemster is waarbij de gegevens overeenkomen met een onvolledig record (alleen moeder informatie en aterme datum) en met een volledig PRN record, worden deze twee PRN records bij elkaar
Pagina 37 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
gevonden. Bij de interne PRN koppeling is deze informatie niet beschikbaar en was er onvoldoende informatie in de records aanwezig om de koppeling te kunnen maken. Records van zwangere vrouwen zonder kindinformatie Het PRN jaarbestand 2003 eenlingen voor de regio Amsterdam bestond uit 13.860 records, hiervan waren 1.340 losse zwangerschaprecords (geen kindinformatie aanwezig). Het PRN jaarbestand 2004 eenlingen voor de regio Amsterdam bestond uit 13.786 records, hiervan waren 1.283 losse zwangerschaprecords (geen kindinformatie aanwezig). Bij de ABCD-PRN koppeling 2003, koppelden 247 losse zwangerschaprecords uniek aan een ABCD record. Bij 108 records van de 247 (44%) is er in het ABCD record ook geen geboortedatum van het kind aanwezig. Van deze 108 records is in 39 records (36%) aangegeven dat de vrouw verhuisd is uit Amsterdam en in 21 records (19%) dat de vrouw verhuisd is uit Nederland. Bij de ABCD-PRN koppeling 2004, koppelden 129 losse zwangerschaprecords uniek aan een ABCD record. Bij 59 records van de 129 (46%) is er in het ABCD record ook geen geboortedatum van het kind aanwezig. Van deze 129 records is in 55 records (43%) aangegeven dat de vrouw verhuisd is uit Amsterdam en in 11 records (9%) dat de vrouw verhuisd is uit Nederland. Bij de 2003 ABCD-PRN koppeling ontstonden 143 clusters met 2 PRN records en 1 ABCD record, waarbij 1 PRN record geen kindinformatie bevatte. Van deze 143 clusters bestonden 38 clusters naast een ABCD record uit een LVR1 en LVR2 record en 105 clusters uit 2 LVR1 records. Bij de ABCD-PRN 2004 koppeling ontstonden 190 clusters met 2 PRN records en 1 ABCD record, waarbij 1 PRN record geen kindinformatie bevatte. Van deze 190 clusters bestonden 45 clusters naast een ABCD record uit een LVR1 en LVR2 record en 145 uit 2 LVR1 records. Vaak ontbreekt in het LVR1 record zonder kindinformatie ook de aterme datum of komt deze datum niet overeen met het ABCD record. Implicaties voor de PRN De hierboven beschreven bevindingen voor losse zwangerschapsrecords hebben geen directe implicaties voor de PRN koppeling. Informatie uit een andere bron (ABCD in dit geval) is thans nodig om de koppeling te kunnen maken tussen het losse zwangerschapsrecord zonder kindinformatie en een ander PRN record. Wanneer deze informatie niet beschikbaar is, is er te weinig informatie in de records aanwezig om de koppeling te kunnen maken. Dit zal ook bij een nieuwe registratie blijven voorkomen. Wel kan daar gesteld worden dat er maar 3 mogelijke uitkomsten zijn voor het afsluiten van een LVR1 record: foetale sterfte, overdracht of informatie over het kind. De koppeling met een regionaal bestand biedt wel de mogelijkheid om het landelijke PRN bestand ook na een 1e versie te kunnen verbeteren (updateoptie). Records van verhuizers Naast losse zwangerschapsrecords in de LVR1 die moeilijk zijn te koppelen door het ontbreken van kindinformatie, zijn records van verhuizers ook lastig te koppelen. In 2003 waren er 79 clusters met 2 of 3 PRN records en 1 ABCD record, waar de PRN records niet gekoppeld waren omdat de postcode was veranderd en in 2004 138 clusters. In het ABCD record is de postcode bij het eerste bezoek aan de verloskundige en de postcode van het kind in de GBA aanwezig. Doordat het ene PRN record koppelt op basis van de eerste postcode en het andere PRN record op basis van de latere postcode, worden deze PRN records nu toch bij elkaar gevonden. In totaal ontvingen 174 ABCD vrouwen in 2003 en 182 ABCD vrouwen in 2004 zorg van twee verloskundige eerstelijns praktijken tijdens de gehele periode van Pagina 38 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
zwangerschap/bevalling/kraambed. Dit is 3.2% (356 / 11.082) van de gekoppelde ABCD eenlingrecords. Implicaties voor de PRN Bij de LVR1-LVR1 schoningskoppeling worden alleen administratieve dubbeltellingen verwijderd (een LVR1 record is dubbel ingevoerd door een verloskundige). Bij het oplossen van de clusters bij de LVR1 – LVR2 koppeling zou ook aandacht besteedt kunnen worden aan het voorkomen van 2 LVR1 records over dezelfde vrouw uit verschillende praktijken doordat de vrouw tijdens de zwangerschap verhuisd is. Tot nu toe worden deze paren alleen bij elkaar gevonden als ze op alle koppelvariabelen overeenstemmen, deze aanpak lijkt nu te streng in het geval van verhuizers en moet heroverwogen worden op basis van de ABCD-PRN koppeling. Records van opgeheven/overgenomen LVR1 praktijken Naast verhuizen van vrouwen tijdens de zwangerschap is een fusie of overname van een praktijk een andere reden voor het voorkomen van meerdere records over 1 vrouw in de LVR1. Bij de 2003 koppeling ontstonden 52 clusters met paren van records uit PRN praktijk 1501 en 1808 die aan hetzelfde ABCD record koppelden. Praktijk 1501 is in september 2003 gestopt. 52 ABCD records koppelden aan een los zwangerschapsrecord van praktijk 1501 en een volledig record van praktijk 1808. Implicaties voor de PRN Niet voor het eerst, maar nooit zo duidelijk bleek het cruciale belang van up-to-date informatie over alle registrerende praktijken en hun correcte praktijkcode. Gemakkelijk gaan op landelijk niveau honderden lokale records verloren of worden records (minder makkelijk door ontdubbelingstechnieken) dubbel meegenomen. Indien vanuit de PRN informatie beschikbaar is over het samengaan of overnemen van LVR1, LVR2 of LNR praktijken, kan deze informatie gebruikt worden bij bv. de LVR1-LVR1 schoningskoppeling vooraf. Zonder dat deze PRN informatie vooraf beschikbaar is, is er te weinig informatie in de records aanwezig om de records van 1 vrouw uit 2 praktijken bij elkaar te vinden. Losse LNR records Binnen de clusters werden ook 7 losse LNR records in 2003 en 6 losse LNR records in 2004 gevonden die aan hetzelfde ABCD record koppelden als een LVR1 en/of LVR2 record. Vier koppelingen zijn gemist bij de koppeling van LNR met LVR1 en LVR2 door een (logische) fout in de geboortedatum van de moeder (1 januari i.p.v. 1 juli en precies 1 jaar verschil in de geboortedatum) of het ontbreken van de geboortedatum moeder in het LNR record. Bij 1 paar komt de geboortedatum van het kind niet overeen en dit lijkt geen gemiste link, maar twee verschillende records. Vier gemiste links worden veroorzaakt door een verschil in de geboortedatum van het kind van 1 of 2 dagen (geboortedatum kind is de blockingsvariabele bij de koppeling van LNR met LVR1 en LVR2) en één door een verschil van 3 dagen (8 december i.p.v. 5 december). De andere links zijn gemist door veel missende waarden en/of een verschil in geboortegewicht in de PRN records. Implicaties voor de PRN De hierboven beschreven bevindingen voor losse LNR records hebben geen implicaties voor de huidige aanpak van de PRN koppeling. Er werden 13 losse LNR records alsnog gekoppeld aan een LVR1 en/of LVR2 record door de ABCD-PRN koppeling. Fouten in de koppelvariabelen of missende waarden waren de oorzaak dat de koppeling gemist was bij de PRN koppeling. De informatie van een externe bron (ABCD studie in dit geval) was nodig om de koppeling te kunnen maken. Pagina 39 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
9.2 Koppeling van meerlingen In het ABCD totaalbestand zit een variabele ‘aantal’ die aangeeft of het een meerling betreft (aantal>1). Het ABCD meerlingenbestand voor 2003 bestond uit 204 tweelingrecords van 102 vrouwen en het meerlingenbestand voor 2004 bestond uit 156 tweelingrecords van 78 vrouwen. Binnen het ABCD totaalbestand zijn geen variabelen die aangeven welk kind als eerste geboren is (meerlingcode of geboortetijdstip). Voor de ABCD-PRN koppeling is geboortegewicht de enige gemeenschappelijke onderscheidende variabele voor meerlingkinderen van hetzelfde geslacht. Bij de ABCD-PRN koppeling was het niet mogelijke de strategie voor het koppelen van meerlingkinderen te gebruiken zoals die bij de PRN koppeling wordt gebruikt. (Deze strategie houdt in dat records van meerlingkinderen alleen kunnen koppelen als het paar een totaalgewicht boven het afkappunt heeft (idem aan eenlingkoppeling) én de meerlingcode overeenkomt tussen de twee records.) Aan de andere kant waren de aantallen zo klein dat ‘handmatig’ alle probleemgevallen (clusters met meer of minder dan 4 paren) konden worden opgelost. Het afkappunt van de eenlingen is aangehouden bij de meerlingkoppeling en alle paren boven dat afkappunt zijn meegenomen als links (414 voor 2003 en 311 voor 2004). Binnen deze clusters kwamen voornamelijk clusters met 4 paren voor (86 in 2003 en 64 in 2004) en daarnaast nog enkele clusters met minder dan 4 paren (1 in 2003 en 0 in 2004) en met meer dan 4 paren (11 in 2003 en 9 in 2004). De clusters met 4 paren bestonden uit twee ABCD records die beide koppelden aan twee PRN records (kind 1 en kind 2 van een meerling in het PRN bestand koppelen aan kind 1 en kind 2 van een meerling in het ABCD bestand). De clusters zijn opgelost door het maximale gewicht van twee paren binnen die cluster mee te nemen. De aanname hierbij was dat doordat het geboortegewicht en eventueel het geslacht van meerlingkinderen verschilt, de paren waar dit overeenkomt een hoger gewicht krijgen. De clusters die uit 6 paren bestaan, worden gevormd door 1 LVR1 record bij de twee LVR2 records (6x) of twee LNR records bij de 2 LVR2 records. Dit zijn over het algemeen ook gemiste koppelingen. In een later stadium van het ABCD-PRN koppelingsproject (februari, 2006) was voor een aantal meerlingkinderen (48 meerlingen, 96 meerlingkinderen) de informatie uit het zuigelingenbestand al beschikbaar van de ABCD-studie, waarin ook de meerlingcode geregistreerd staat. Deze informatie is als controle gebruikt voor de meerling koppelstrategie. Het kwam 3 keer voor dat in het zuigelingenbestand beide kinderen van een tweeling dezelfde meerlingcode hadden. Daarnaast was er 4 keer een discrepantie wat betreft de meerlingcode tussen het PRN bestand en het zuigelingenbestand. Bij drie van deze vier discrepanties was het koppelgewicht voor beide meerlingkinderen gelijk (hoogste koppelgewicht is dan geen oplossing) en was de toewijzing verkeerd. Bij de andere discrepantie lijkt de meerlingcode in het ABCD bestand fout, omdat het geboortegewicht tussen het PRN en ABCD bestand exact overeenkomt en het geboortetijdstip in het PRN bestand aangeeft welk kind als eerste geboren is. In alle overige 41 gevallen kwam de meerlingcode in beide bestanden overeen tussen de gemaakte links. De clusters met minder of meer dan 4 paren (12 clusters voor 2003 en 9 clusters voor 2004) zijn handmatig opgelost. Alle paren binnen een cluster hoorden bij dezelfde meerling.
Pagina 40 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
In totaal was er 1 cluster met 2 paren, 5 clusters met 5 paren, 14 clusters met 6 paren en 1 cluster met 10 paren. De cluster met 2 paren bestond uit 1 LVR1 los zwangerschapsrecord van een eenling, met reden overdracht meerling. Bij de clusters met 5 paren was er 1 LVR1 of LNR record naast 2 PRN-ABCD paren. Dit record was niet eerder gekoppeld door fouten in geboortedatum moeder, postcode en/of geboortedatum kind. Van de 14 clusters met 6 paren, ontstonden 8 clusters door een los LVR1 record wat aan beide ABCD records koppelde. In het LVR1 record stond aangegeven dat het een meerlingzwangerschap betrof, maar er werd toch slechts 1 LVR1 record gevonden. Daarnaast waren er 4 clusters waar 2 LVR1 records bestonden, maar er slecht 1 was gekoppeld aan een LVR2 en/of LNR. De laatste 2 clusters met 6 paren werden veroorzaakt door 1 of 2 LNR records die niet gekoppeld waren aan het LVR1 en/of LVR2 record. Alle clusters met minder of meer dan 4 paren werden veroorzaakt door gemiste koppelingen bij de PRN-koppeling. De koppelingen zijn gemist bij de PRN-koppeling door fouten of veranderingen in de koppelvariabelen, met name in de postcode, geboortedatum moeder (LNR records) en de geboortedatum van het kind. Al met al zijn alle meerlingkinderen uit het ABCD totaalbestand teruggevonden in het PRN jaarbestand 2003 of 2004 (m.u.v. 1 bevalling die in het buitenland plaatsvond). Implicaties voor de PRN Door de beperkte bestandsgroottes bij dit koppelingsproject, kon de koppeling van meerlingen vrij uitvoerig uitgezocht worden. Dit is niet mogelijk bij de interne PRN koppeling door de omvang van het PRN bestand. De nieuwe strategie die hier is toegepast zonder gebruik te maken van de meerlingcode, kan mogelijk (deels) toegepast worden bij de interne PRN koppeling, maar dit zal nader onderzoek vergen. Moederidentificatie Het PRN jaarbestand is een kindbestand en bevat geen moederidentificatie variabele. Voor de analyses op moeder niveau in het PRN jaarboek is er een moederidentificatie aangemaakt door LinKID. De moederidentificatie zoals die is aangemaakt voor het PRN jaarboek om kinderen van een meerling bij elkaar te vinden is vergeleken tussen de PRN meerling records die aan ABCD meerlingrecords van dezelfde moeder koppelen. De moederidentificatie is aangemaakt op basis van het administratienummer van de vrouw binnen de praktijk en haar geboortedatum. Er is één paar waarbij het administratienummer niet overeenkomt, doordat de eerste 0 van het nummer is weggevallen in 1 record. De moederidentificatie zoals die is aangemaakt voor het PRN tabellenboek lijkt dus een betrouwbare variabele om voor meerlingkinderen 1 vrouw te definiëren. Implicaties voor de PRN Uit de koppeling van ABCD meerlingen met PRN meerlingen bleek dat de moederidentificatie zoals die is aangemaakt voor het PRN tabellenboek een betrouwbare variabele is om meerlingkinderen van 1 vrouw te definiëren. De clusters bij de ABCD-PRN koppeling met minder of meer dan 4 paren brachten 23 tot nu toe gemiste PRN koppelingen aan het licht. In 7 gevallen betrof het wederom een los zwangerschapsrecord dat door het ontbreken van informatie bij de PRN-koppeling niet gekoppeld kon worden. 9 losse LNR records konden alsnog gekoppeld worden aan een LVR1 of LVR2 record, bij 5 ontbrak de geboortedatum moeder of bevatte deze een fout. Bij de overige 7 gevallen bevatte het niet-gekoppelde record fouten, waardoor het bij de PRN-koppeling niet gekoppeld was. De gehanteerde strategie voor de koppeling van records van meerlingkinderen bij de ABCD-PRN koppeling kan mogelijk in de toekomst toegepast worden bij de LVR1Pagina 41 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
LVR2 meerlingkoppeling voor zolang verbetering van de vastlegging uitblijft. Een validatiestudie zou moeten uitwijzen of deze strategie betere resultaten oplevert dan de huidige strategie. De gehanteerde strategie is helaas niet direct toepasbaar voor de LNR-LNR koppeling van opnames van meerlingkinderen omdat hier geen sprake is van een 1 op 1 koppeling, maar van een 1 op n koppeling. 9.3 Inzicht in kwaliteit GBA-PRN koppeling Door de koppeling tussen het PRN en ABCD bestand op deterministische en probabilistische wijze uit te voeren op basis van de variabelen die in het GBA beschikbaar zijn, kunnen de resultaten van beide methoden vergeleken worden. Deze resultaten kunnen input leveren voor het project “Pilot koppeling perinatale registraties met de GBA/doodsoorzaken registraties (CBS)” uitgevoerd door het CBS en LinKID/PRN. De eenlingkoppeling tussen het ABCD en PRN bestand voor 2003 levert 5.184 paren op boven het afkappunt. Voor de GBA-PRN koppeling zijn 6 variabelen beschikbaar: geboortedatum moeder, postcode, geboortedatum kind, geslacht kind, meerlingstatus en sterfte. De meerlingstatus wordt gebruikt om de koppeling apart voor eenlingen en meerlingen uit te voeren en sterfte is niet geschikt als koppelvariabele. Bij een koppeling met overeenkomst op de overige vier beschikbare variabelen bij de GBA-PRN koppeling bij het CBS worden 3.923 paren gevonden (zie tabel 9.1). Wanneer hierbij het geslacht wordt vrijgelaten en ook overeenkomst op de overige postcode wordt toegestaan, worden 3.996 paren gevonden (zie tabel 9.1). Een probabilistische koppeling op deze 4 variabelen levert 4.829 paren. Een optimale deterministische strategie op de 4 beschikbare koppelvariabelen voor de GBA-PRN koppeling levert dus ongeveer 83% van de paren in vergelijking met de optimale probabilistische strategie op die 4 variabelen. In vergelijking tot de optimale probabilistische strategie op basis van alle variabelen, levert de deterministische strategie op 4 variabelen slechts 77% van de paren op. Deze analyses zijn niet herhaald voor 2004, omdat de resultaten vergelijkbaar zullen zijn. Tabel 9.1 Vergelijking koppelstrategieën voor ABCD-PRN koppeling op basis van 4 GBA variabelen (geboortedatum moeder, postcode, geboortedatum kind en geslacht kind). Koppelstrategie Aantal paren % Probabilistische koppeling op 7 variabelen 5.184 100% Deterministische full koppeling op 4 GBA variabelen Deterministische koppeling op 4 GBA variabelen (geslacht vrijgelaten, postcode alle combinaties) Probabilistische koppeling op 4 GBA variabelen
3.923 3.996
76% 77%
4.829
93%
Implicaties voor de PRN Deze implicaties bestaan op het niveau van het PRN-GBA/CBS koppelingsproject. De ABCD-PRN koppeling laat zien dat een probabilistische koppeling betere koppelingsopbrengsten geeft dan een deterministische koppeling. Daarnaast kunnen er meer koppelingen gemaakt worden tussen het ABCD en PRN bestand omdat er meer koppelvariabelen beschikbaar zijn, dan de vier variabelen die beschikbaar zijn in het de GBA/CBS bestand. Tenslotte is in het gehele ABCD-PRN koppelingsproject gebleken dat probabilistisch koppelen flexibel is, d.w.z. precies kan worden ‘aangepast’ op gebleken kenmerken van de data in juist deze bestanden.
Pagina 42 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
9.4 Het proces van aankoppeling van een extern onderzoeksbestand De PRN blijkt zeer geschikt voor aankoppeling van andere (regionale) onderzoeksbestanden. Voor een aankoppeling van een onderzoeksbestand aan de PRN is het noodzakelijk dat er voldoende koppelvariabelen van voldoende kwaliteit beschikbaar zijn in het onderzoeksbestand. Geboortedatum moeder, postcode (liefst postcode-historie), geboortedatum kind (aterme datum als geboortedatum kind niet bekend is), geslacht, meerlingstatus en geboortegewicht mogen niet ontbreken en geboortetijdstip, graviditeit, zwangerschapsduur en sterfte informatie kunnen de koppeling verder verbeteren. Daarnaast moet er informatie beschikbaar zijn over het moment van vastleggen van variabelen en over eventueel gebruikte coderingen. Het totale ABCD-PRN koppelingsproject heeft 9 maanden geduurd. Het project kan worden opgedeeld in de volgende fasen: kennismaking en voorbereiding onderzoeksbestanden, koppeling, analyse en documentatie. De vier fasen hebben ongeveer even veel tijd in beslag genomen bij het ABCD-PRN koppelingsproject. De ABCD-PRN koppeling is apart uitgevoerd voor 2003 en 2004. Dat was een voorzichtige aanpak – eventueel kon het project worden stopgezet bij onoplosbare problemen, terwijl dan maar 50% van het koppelwerk was gedaan. Achteraf gezien bleek dat niet nodig en had een aantal stappen overgeslagen kunnen worden als de PRN jaarbestanden over de periode van het onderzoeksbestand vooraf waren samengevoegd. Nadeel hiervan is dat er met grotere bestanden gewerkt moet worden, en, afhankelijk van de grootte, dat er blocking moet worden toegepast bij de koppeling. De tijd die benodigd is voor de analysestap is afhankelijk van het aantal analyses dat uitgevoerd moet worden. Bij de ABCD-PRN koppeling zijn de clusters, de nietgekoppelde records, de vergelijking van sterfte informatie en de vergelijking van etniciteitinformatie zeer uitvoerig uitgezocht wat veel tijd kostte. In deze fase kan tijd bespaard worden door alleen koppeling gerelateerde zaken te analyseren en verdere vergelijking tussen de twee bestanden achterwege te laten. Bij de ABCD-PRN koppeling leverde deze vergelijkingen interessante informatie op voor de PRN. Waarschijnlijk zullen de bevindingen ten aanzien van compleetheid, datakwaliteit en de PRN koppeling vergelijkbaar zijn bij de aankoppeling van een ander (regionaal) onderzoeksbestand zodat deze vergelijking in de toekomst achterwege kan blijven, tenzij bijvoorbeeld ter ondersteuning van regionale verbeterslagen in de registratie. Implicaties voor de PRN De aankoppeling van (regionale) onderzoeksbestanden aan de PRN is goed mogelijk. Het opstellen van specificaties voor de benodigde koppelvariabelen in een onderzoeksbestand (t.a.v. format en codering) en het beperken van het aantal analyses op het gekoppelde bestand, kan de tijd die benodigd is voor zo’n koppelingsproject beperken.
Pagina 43 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
10. Deelname en representativiteit In dit hoofdstuk worden de bevindingen ten aanzien van de deelname en representativiteit beschreven. De bevindingen zijn op basis van de resultaten van de ABCD-PRN 2003 en 2004 koppeling. 10.1
Deelnemende praktijken
Deelname van praktijken aan PRN Twee van de 40 Amsterdamse verloskunde praktijken (5%) bleken achteraf geen PRN gegevens te hebben aangeleverd in 2003. Daarnaast konden 1.097 records van de 12.553 records van zwangere vrouwen in de regio Amsterdam niet terug gevonden worden in de PRN registratie (8,7%). Validatie moet uitwijzen of deze records daadwerkelijk niet aanwezig zijn in de PRN (en zo ja, wat hiervan de reden kan zijn) of dat door fouten in koppelvariabelen deze records niet gekoppeld konden worden. Gelet op onze handmatige inspanningen lijkt het laatste niet zo waarschijnlijk, terwijl het eerste een probleem zou kunnen betekenen voor de PRN. Deelname van praktijken aan ABCD De deelname van praktijken aan de ABCD studie is bekeken bij PRN records uit de regio Amsterdam van deelnemende praktijken aan de PRN van de laatste drie maanden van 2003 en de eerste 3 maanden van 2004. Er is hier gekozen voor de laatste drie maanden van 2003, om opstart problemen met de inclusie van de ABCD studie uit te sluiten. Het aantal records per praktijk binnen de niet-gekoppelde PRN records van de laatste drie maanden, is vergeleken met het aantal records per praktijk in de PRN van de laatste drie maanden. Hetzelfde is gedaan voor de (nietgekoppelde) PRN records van de eerste drie maanden van 2004. Er waren 2 praktijken waarbij meer dan 20% van de PRN records van de laatste drie maanden van 2003 niet gekoppeld waren met een ABCD record. Dit waren de ABCD praktijkcodes: 9 (28% niet gekoppeld) en 6 (24% niet gekoppeld) (PRN praktijkcodes resp. 1005 en 1124). Er waren 2 praktijken waarbij meer dan 20% van de PRN records van de eerste drie maanden van 2004 niet gekoppeld waren met een ABCD record. Dit waren de ABCD praktijkcodes: 3 (21% niet gekoppeld) en 29 (22% nietgekoppeld) (PRN praktijkcodes resp. 1261 en 288). Tenslotte was er 1 praktijk waarvan in 2003 en 2004 meer dan 20% van de PRN records niet koppelde met een ABCD record (67% in 2003 en 51% in 2004 niet gekoppeld). Dit was de ABCD praktijkcode 19 en PRN praktijkcode 1293. De reden hiervoor is niet bekend. Implicaties voor de PRN De koppeling tussen de PRN registratie en het ABCD studiebestand toont aan dat het belangrijk is om een up-to-date overzicht te hebben van praktijken die gegevens aanleveren aan de PRN registratie. Nu bleek door de aankoppeling van een regionaal bestand dat twee praktijken geen gegevens hadden aangeleverd aan de PRN registratie in 2003. Een deel van de ABCD records die niet gekoppeld konden worden aan een PRN record is te verklaren door deze niet-aanleverende praktijken (N=184) en door het ontbreken van kindinformatie in ABCD records (N=311). Voor de overige 602 records is het niet duidelijk waarom ze niet gekoppeld konden worden aan een PRN record. Het lijkt er op dat er PRN records ontbreken van praktijken die hebben aangeleverd aan de PRN. Het achterhalen van de reden hiervan is van belang voor de PRN.
Pagina 44 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
10.2
Inzicht in noemer verschillen “in zorg” en “ingezetene”.
Van de 12.553 ABCD records, zijn 11.456 ABCD records gekoppeld aan 1 of meer PRN records uit 2003 of 2004. Van deze 11.456 ABCD records zijn 10.431 records gekoppeld aan een GBA record (91%). Van de 1.097 niet-gekoppelde ABCD records zijn 533 gekoppeld aan een GBA record (49%). Dit percentage is veel lager dan bij de gekoppelde records en dit wordt waarschijnlijk veroorzaakt doordat deze records vaker geen kindinformatie bevatten. Van de gekoppelde records waren 443 vrouwen verhuisd uit Amsterdam (4%) en 34 vrouwen verhuisd uit Nederland (0,3%) waardoor er geen koppeling met GBA Amsterdam gemaakt kon worden. Bij 139 vrouwen (1%) was er sprake van abortus/sterfte waardoor er geen GBA record bestond en bij 1 geval was er sprake van sterfte moeder. Daarnaast waren er 77 records van illegalen/asielzoekers (0,7%) die niet in de GBA stonden. Voor de overige 329 records (3%) was de ABCD informatie ‘reden anders of onbekend’ waarom er geen koppeling met de GBA was. Wanneer de records van meerlingkinderen apart worden beschouwd, is het percentage gekoppelde ABCD records dat aan een GBA record gekoppeld kon worden 94%. Implicaties voor de PRN De informatie over koppeling met de GBA registratie in de gekoppelde ABCD-PRN records, laat zien dat in de regio Amsterdam ongeveer 5% van de vrouwen niet in de GBA zit (verhuizers niet meegerekend). Van deze groep zit 0,7% niet in de GBA omdat het illegalen/asielzoekers betreft. Daarnaast is er bij 1% sprake van abortus of sterfte, waardoor het kind nooit in de GBA is opgenomen (de ABCD-GBA koppeling is op basis van kindinformatie, de moeders kunnen dus wel voorkomen in de GBA).
Pagina 45 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
11. Datakwaliteit In dit hoofdstuk worden de bevindingen op basis van de ABCD-PRN koppelingsresultaten ten aanzien van de datakwaliteit beschreven. Hierbij wordt speciale aandacht aan sterfte gegeven. 11.1
Koppelvariabelen
Een probabilistische koppeling tolereert fouten in koppelvariabelen wanneer de overige variabelen genoeg informatie geven dat twee records bij elkaar horen. (We laten eenling/meerling variabelen buiten beschouwing.) Bij de koppeling van ABCDPRN 2003 en 2004 zijn er 7.449 paren die koppelen met overeenkomst op de volledige sleutel. Dit is slechts 62% van de 12.094 paren boven het afkappunt (7.449 / 12.094). Bij de overige paren ontbreken gegevens of komt de waarde voor een variabele niet overeen tussen het ABCD en PRN record. De hoge percentages missende waarden voor de kindvariabelen (geboortedatum, aterme datum, geslacht en geboortegewicht) zijn lastig bij de koppeling omdat dit geen informatie voor of tegen een link geeft. In tabel 11.1 is per koppelvariabele aangegeven hoe vaak de variabele overeenkomt onder de gekoppelde paren, hoe vaak de variabele bijna overeenkomt (close), hoe vaak de variabele niet overeenkomt en hoe vaak de variabele missend is in een van beide of beide records. Graviditeit, aterme datum en geboortegewicht zijn de koppelvariabelen met de meeste discrepanties tussen het ABCD en PRN record (resp. 10%, 26% en 13%). Voor aterme datum en geboortegewicht wordt een deel van deze discrepanties weggevangen door middel van de gedefinieerde closes (resp. 20% en 6%). Alle drie de variabelen hebben als kenmerk dat deze gemeten moeten worden bij de vrouw (graviditeit en laatste menstruatiedatum voor bepalen aterme datum) of bij het kind (geboortegewicht). Indien verschillende zorgverleners dit op verschillende tijdstippen navragen en achteraf registreren kunnen er verschillen ontstaan. Tabel 11.1 Overeenkomst, close overeenkomst en geen overeenkomst op de koppelvariabelen onder gekoppelde ABCD-PRN paren 2003-2004 Variabele
Overeenkomst
Close overeenkomst # % nvt
Geen overeenkomst # % 105 1%
Missing
Totaal
# % # % # Geboortedatum 11.984 99% 5 <0,1% 12.094 moeder Postcode 10.734 89% 1.060 9% 293 2% 7 <0,1% 12.094 (andere pc) Graviditeit 10.109 84% nvt 1.183 10% 802 7% 12.094 Geboortedatum 10.948 91% 147 1% 42 0,3% 957 8% 12.094 kind (± 2 dgn) Aterme datum 557 75% 146 20% 43 6% 746* (± 14 dgn) Geslacht 11.034 91% nvt 69 0,6% 991 8% 12.094 Gewicht 9.363 77% 785 6% 859 7% 1.087 9% 12.094 (± 20 gram) * Aterme datum wordt alleen vergeleken wanneer de geboortedatum van het kind ontbreekt in 1 van beide of in beide records.
Pagina 46 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
Implicaties voor de PRN De vergelijking van de ABCD en PRN waarde van een variabele laat zien welke variabelen het meest gevoelig zijn voor fouten en/of veranderingen. Het zijn juist de variabelen die gemeten moeten worden, die ook de meeste discrepanties laten zien. Geboortedatum moeder, geboortedatum kind en geslacht kind zijn zeer betrouwbare variabelen. De vergelijking van postcode laat zien dat het beschikbaar zijn van alle postcodes in de periode van zwangerschap tot en met opname kind in GBA een meerwaarde oplevert bij een koppeling (9% close overeenstemming). 11.2
Sterfte
De ABCD en PRN sterfte informatie in het gekoppelde ABCD-PRN bestand is vergeleken. De sterfte informatie kon worden vergeleken voor 10.957 records met informatie over een zwangerschap van tenminste 22 weken (volgens de PRN informatie) van de gekoppelde ABCD-PRN paren uit 2003 en 2004. Voor de vergelijking van de sterfte informatie zijn in het PRN bestand eerste nieuwe variabelen aangemaakt die de sterfte informatie uit de drie losse registraties combineren (conform de regels van het PRN jaarboek). Volgens de PRN informatie zijn er 71 doodgeborenen in het gecombineerde ABCD-PRN bestand met een zwangerschapsduur van tenminste 22 weken (zie tabel 11.2). Volgens de ABCD informatie zijn er 61 doodgeborenen in het gecombineerde ABCD-PRN bestand met een zwangerschapsduur van tenminste 22 weken. Tabel 11.2 Vergelijking foetale sterfte ≥22.0 wkn ABCD en PRN 2003-2004 PRN informatie Frequentie ante ante Totaal partum partum dooddurante Levend <28 wkn >= 28 wkn partu geboren geboren ABCD informatie ante partum < 28 wkn ante partum >= 28 wkn durante partu Totaal doodgeboren Levend geboren Totaal
23 0 0 23 9 32
3 28 1 32 7 39
0 0 0 0 0 0
26 28 1 55 16 71
5 1 0 6 10.880 10.886
Totaal
31 29 1 61 10.896 10.957
In tabel 11.3 is de vergelijking weergegeven voor de foetale en neonatale sterfte tussen de PRN en ABCD informatie.
Pagina 47 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
Tabel 11.3 Vergelijking neonatale sterfte ≥22.0 wkn ABCD en PRN 2003-2004 PRN informatie Neonale sterfte niet ovl Frequentie ovl dood- binnen ovl 2eovl 8e - binnen 28 dg Overleden 24h 7e dag 28e dag geboren ABCD informatie 55 1 0 0 doodgeboren 5 61 0 17 0 0 0 ovl binnen 24h 17 3 6 0 0 op geboortedag 1 10 1 1 2 ovl 2e - 7e dag 2 2 8 ovl voor 1e verjaardag ovl na 1e verjaardag Niet overleden Overleden
0
0
1
6
11
0
0
0
0
6
12 71
1 26
8
10.824 25
6 13 95
10.849
108
18
3
Totaal
Vet
Totaal
10.837 120 10.957
= Perinatale sterfte t/m 7 dagen vanaf 22.0 wkn = Discrepantie in perinatale sterfte
Wanneer de informatie uit tabel 11.2 en 11.3 wordt gecombineerd, kunnen we twee vormen van discrepanties onderscheiden: harde discrepanties en zachte discrepanties. Van een harde discrepantie is sprake als er volgens de informatie uit één bron sprak was van perinatale sterfte, terwijl er volgens de andere bron geen sprake was van perinatale sterfte. Van een zachte discrepantie is sprake als het tijdstip van overlijden niet overeenkomt tussen de twee bronnen. In tabel 11.4 worden de harde discrepanties weergegeven in perinatale sterfte (perinatale sterfte t/m 7 dagen vanaf 22.0 weken). In 86 gevallen was volgens beide bronnen sprake van perinatale sterfte. In 10 gevallen is er volgens de ABCD informatie sprake van perinatale sterfte en volgens de PRN informatie niet. In 14 gevallen is er volgens de PRN informatie sprake van perinatale sterfte en volgens de ABCD informatie niet. Tabel 11.4 Discrepanties in perinatale sterfte (22wkn - 7 dgn post partum) ABCD en PRN 2003-2004 PRN informatie ABCD informatie perinatale sterfte niet overleden 86 10 perinatale sterfte 14 10847 niet overleden
In tabel 11.5 zijn de 24 paren weergegeven waar een harde discrepantie bestaat wat betreft de perinatale sterfte. Voor alle paren is het moment van sterfte volgens beide bronnen weergegeven, de zwangerschapsduur, het geboortegewicht en het feit of er informatie over het kind aanwezig was in het record.
Pagina 48 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
Tabel 11.5 Kenmerken van records met discrepanties tussen PRN en ABCD in perinatale sterfte Perinatale sterfte volgens ABCD, in leven na 7 dagen volgens PRN Sterfte informatie Zwngsduur Gewicht kindinformatie ABCD PRN ABCD PRN ABCD PRN ABCD PRN ovl <16 wkn in leven 6 39 . 2974 0 1 1 ovl <16 wkn in leven . 41 . 3540 0 1 2 ovl <16 wkn in leven . 41 . 3850 0 1 3 ovl <16 wkn in leven 12 40 . 3714 0 1 4 ovl wkn onb in leven 26 26 990 990 1 1 5 op geb dag in leven 38 38 2860 2860 1 1 6 ovl 2-7 dgn in leven 42 42 . 3140 1 1 7 ovl 2-7 dgn in leven 41 41 2850 2850 1 1 8 ovl 2-7 dgn ovl 8-28 dgn 35 35 . 2185 1 1 9 ovl 8-28 dgn 29 29 795 795 1 1 10 ovl 2-7 dgn Perinatale sterfte volgens PRN in leven na 7 dagen volgens ABCD Sterfte informatie Zwngsduur Gewicht ABCD PRN ABCD PRN ABCD PRN ovl <28 wkn . 22 . 350 11 in leven ovl <28 wkn . 24 . . 12 in leven ovl <28 wkn . 22 . 350 13 in leven ovl <28 wkn . 22 . 270 14 in leven ovl <28 wkn . 27 . 920 15 in leven ovl <28 wkn 24 24 . 60 16 in leven ovl <28 wkn . 24 . 600 17 in leven ovl ≥28 wkn . 37 . 2210 18 in leven ovl ≥28 wkn . 34 . 2215 19 in leven ovl ≥28 wkn . 34 . 2275 20 in leven ovl ≥28 wkn . 39 . 3750 21 in leven ovl ≥28 wkn . 38 . 2280 22 in leven ovl ≥28 wkn 37 37 3470 3770 23 in leven ovl 2-7 dgn 37 37 3120 3120 24 voor 1 jr
kindinformatie ABCD PRN 0 1 0 1 0 1 0 1 0 1 1 1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 1 1
Bij de records 1 t/m 4 is er volgens de ABCD informatie een vroege miskraam geweest, terwijl er volgens de PRN informatie na een normale zwangerschapsduur een levend kind ter wereld kwam. Het lijkt er op dat dit in de PRN de informatie van de volgende zwangerschap van dezelfde vrouw betreft. Bij de records 5 t/m 8 is er volgens de ABCD sprake van sterfte en in de PRN staat dit niet vermeld, terwijl in beide bronnen kindinformatie aanwezig die ook overeenkomt. Het is mogelijk dat het kind thuis werd geboren of levend naar huis ging na een ziekenhuisbevalling, en dat sterfte plaatsvond thuis of in een niet LNRdeelnemend ziekenhuis na een ‘gezonde’ tussenperiode of dat de informatie over sterfte pas beschikbaar kwam na het afsluiten van het PRN record. Het zijn deze sterftes waar de PRN baat zou hebben bij een reguliere koppeling met het GBA. Bij record 9 en 10 is er in het ABCD record sprake van (late) perinatale sterfte en staat er in het PRN record aangegeven dat het kind is overleden tussen 8 en 28 dagen na de geboorte. Dit zijn dus twee zachte discrepanties in het tijdstip van overlijden. Bij 11 van de 14 records waar volgens de PRN informatie sprake was van perinatale sterfte en volgens de ABCD informatie niet, is geen kindinformatie aanwezig in het ABCD record. Discrepanties werden hier dus veroorzaakt door het ontbreken van informatie aan ABCD kant. Bij de overige 3 records is wel sprake van discrepantie. Record 16 betreft een kind van een meerling, volgens de PRN informatie zijn beide kinderen overleden en
Pagina 49 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
volgens de ABCD informatie was 1 kind nog in leven, wat onwaarschijnlijk is gezien het gewicht en zwangerschapsduur. Bij record 23 is het niet duidelijk waarom het kind volgens de PRN informatie doodgeboren is en volgens de ABCD informatie niet is overleden. Bij record 24 is er sprake van een zachte discrepantie; in het ABCD bestand staat aangegeven dat het kind al na 10 dagen is overleden. In tabel 11.6 worden de zachte discrepanties weergegeven in het tijdstip van overlijden. Er zijn 11 gevallen waar het tijdstip van overlijden niet overeenkomt. Tabel 11.6 Discrepanties in moment van sterfte ABCD en PRN 2003-2004 PRN informatie ABCD ante partum ante partum durante ovl binnen ovl 2e-7e informatie < 28 wkn ≥ 28 wkn partu 24 uur dag ante partum 3 1 < 28 wkn ante partum >= 28 wkn durante partum ovl binnen 24 uur ovl op 2 1 geboortedag 1 1 ovl 2e-7e dag
Pagina 50 van 57
ovl 8-28e dag
2
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
11.3
Etniciteit
De vergelijking van etniciteit vrouw in het PRN en ABCD bestand is lastig door het verschil in definitie en vastlegging van de variabele in beide bestanden. In het PRN bestand wordt het type vrouw (Nederlands, Mediterraan, ander Europees, Creools, Hindoestaans, Aziatisch of overig) door de verloskundige en/of gynaecoloog vastgelegd op basis van huidskleur, naam en overige uiterlijke kenmerken. In het ABCD bestand is voor de respondenten het geboorteland van de moeder gevraagd in de vragenlijst (Nederland, Suriname, Antillen/Aruba, Turkije, Marokko, Ghana, overig niet-westers land, overig westers land). Daarnaast is via de koppeling met het GBA, het geboorteland van de moeder verkregen zoals dat in de GBA is vastgelegd. Geboorteland Nederland betekent niet altijd dat het type vrouw Nederlands is. In tabel 11.7 is de vergelijking te zien tussen het geboorteland van de vrouw op basis van de vragenlijst en de PRN typering vrouw. De PRN typering vrouw is een samengestelde variabele op basis van de LVR1 en LVR2 informatie. Voor de ABCD non-respondenten is er geen vragenlijst informatie beschikbaar (N=3.597). Van de 5.719 vrouwen die door de PRN als Nederlands worden getypeerd, is voor 4.343 vrouwen (76%) het geboorteland Nederland. 403 vrouwen (8%) met geboorteland Nederland zijn volgens de PRN typering niet getypeerd als Nederlands. Bijna alle vrouwen met geboorteland Turkije of Marokko worden als Mediterraan getypeerd in de PRN (873 van de 927, 94%). De grijze vakjes vormen onwaarschijnlijke combinaties; deze komen zelden voor. Een groter probleem is dat de PRN registratie erg onvolledig is (796 uit 11.438). Tabel 11.7 Vergelijking etniciteit vastlegging ABCD (vragenlijst vrouw) en PRN (typering vrouw door verloskundige) 2003-2004 PRN type vrouw in 7 groepen ABCD geboorteland moeder Mediter- ander Hindoe(vragenlijst) Nederlands raan Europees Creools staans Aziatisch Onbekend Nederland 4343 195 20 121 31 36 89 Suriname 7 0 228 67 19 63 53 Antillen/ 21 2 0 40 2 0 22 Aruba Turkije 1 1 9 9 303 5 0 Marokko 3 0 13 13 570 0 0 Ghana 2 0 162 0 0 6 4 overig niet63 126 12 125 67 112 193 westers overig 173 47 325 2 3 33 100 westers . 1040 1347 167 499 121 122 301 Totaal 5719 2599 529 1177 295 323 796
Totaal 4835 437 87
In tabel 11.8 is de vergelijking te zien tussen het geboorteland van de vrouw zoals geregistreerd in de GBA administratie en de PRN typering vrouw. In de tabel worden alleen de landen weergegeven met een frequentie van minimaal 40. De overige landen met een frequentie lager dan 40 zijn samengevoegd in de categorie ‘anders’. 5.102 van de 6.121 vrouwen (83%) met geboorteland Nederlands zijn volgens de PRN typering getypeerd als Nederlands. Van de 794 vrouwen met geboorteland Suriname, zijn 109 vrouwen getypeerd als Nederlands (14%), 385 als Creools (48%) en 128 als Aziatisch (16%).
Pagina 51 van 57
328 599 174 698 683 3597 11438
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
Tabel 11.8 Vergelijking etniciteit vastlegging ABCD (geboorteland vrouw GBA) en PRN (typering vrouw door verloskundige) 2003-2004 PRN type vrouw in 7 groepen ABCD geboorteland Hindoe ander moeder GBA Nederlands Mediterraan Europees Creools staans Aziatisch Onbekend Nederland 5102 399 68 258 52 79 163
Totaal 6121
Suriname
109
26
3
385
128
26
117
794
Nederlandse Antillen Turkije
24
3
3
58
3
0
27
118
45
550
11
5
4
4
13
632
Marokko
71
1287
20
19
8
2
43
1450
Ghana
15
7
4
242
0
1
17
286
Egypte
7
105
4
4
1
1
25
147
Duitsland
47
6
50
0
0
0
6
109
Pakistan
7
17
5
2
41
23
13
108
Engeland + Wales Afghanistan
19
4
52
1
2
1
8
87
7
12
0
0
2
13
22
56
Frankrijk
14
3
30
1
0
1
5
54
VS
16
4
10
2
0
0
21
53
India
2
2
0
2
30
11
4
51
Indonesie
8
2
1
1
2
28
8
50
Irak
3
15
1
0
0
7
24
50
Joegoslavie
2
2
28
2
0
0
6
40
Spanje
5
19
14
0
0
0
2
40
Anders
216
136
225
195
22
126
272
1192
5719
2599
529
1177
295
323
796
11438
Totaal
Pagina 52 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
12. Conclusies De belangrijkste conclusie van het ABCD-PRN koppelingsproject is dat de koppeling tussen het ABCD studiebestand 2003-2004 en de PRN jaarbestanden 2003 en 2004 is geslaagd. 11.456 van de 12.553 ABCD records (91%) zijn terug te vinden in de PRN registratie. In totaal zijn er 1.097 ABCD records niet gekoppeld aan een PRN record (8,7%). Deels werd dit veroorzaakt door PRN praktijken die geen gegevens aan de PRN hadden aangeleverd in 2003 en/of 2004 (N=184, 17%) en deels door het ontbreken van kindinformatie in de ABCD records (N=311, 28%). Voor de overige 602 records (55%) is het niet duidelijk waarom deze records niet gekoppeld konden worden aan een PRN record. De koppeling is apart uitgevoerd voor eenlingen en meerlingen per jaar en hierbij zijn 7 koppelvariabelen gebruikt. De tijdsperiode voor de realisatie van het totale ABCD-PRN koppelingsproject 2003/2004 was 9 maanden (oktober 2005 – juli 2006). Daarnaast kan een aantal belangrijke conclusies worden getrokken over de PRN koppelingen, de deelname en representativiteit van de PRN en de datakwaliteit. Voor de ABCD studie levert de ABCD-PRN koppeling informatie over de geleverde zorg aan de ABCD studiepopulatie en maakt een non-response analyse mogelijk. De koppeling bracht daarnaast 7 administratieve dubbeltellingen in het ABCD totaalbestand aan het licht. 12.1
PRN koppelingen
De PRN registratie blijkt zeer geschikt voor aankoppeling van externe bestanden. De meerwaarde voor de aanvragers en voor de PRN stijgt als de deelname 100% is of als duidelijk is welke praktijken niet hebben aangeleverd in een bepaald jaar. De PRN kan de inspanningen voor een koppelingsproject aan haar kant beperken door duidelijke specificaties op te stellen voor de aanlevering van een bestand en door het analyseren van het gekoppelde bestand over te laten aan de aanvragers. Koppeling van de PRN registratie met het ABCD totaalbestand, heeft de PRN informatie opgeleverd over de LVR1&LVR2&LNR koppeling, de compleetheid van de registratie en de keuzes gemaakt ten aanzien van het PRN jaarboek. De keuze voor het PRN jaarboek om de losse LVR1 records en de losse LNR records niet mee te nemen voor de analyses, bleek juist. Een aantal van deze records kon alsnog gekoppeld worden aan een ander PRN record door de extra ABCD informatie. Het wel meenemen van deze records voor de analyses in het PRN jaarboek zou dus tot dubbeltellingen leiden. Door de ABCD-PRN koppeling werden een aantal LVR1 records van verhuizers alsnog bij elkaar gevonden (2 LVR1 records van 1 vrouw in 2 praktijken). De interne LVR1&LVR1 koppeling om administratieve dubbeltellingen te vinden, moet heroverwogen worden. De strategie is nu te streng om deze records bij elkaar te vinden (in de huidige strategie moeten alle koppelvariabelen overeenkomen). Voor de ABCD-PRN koppeling van meerlingen is een koppelstrategie gebruikt zonder gebruik te maken van de meerlingcode. In het ABCD bestand is namelijk geen meerlingcode aanwezig, die bij de interne PRN koppelingen gebruikt wordt om meerlingkinderen uit elkaar te houden. De koppeling kon in een later stadium deels gevalideerd worden door het beschikbaar komen van het ABCD zuigelingenbestand en de strategie bleek goed te werken.
Pagina 53 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, CONCEPT, sept 2006.
12.2
Deelname en representativiteit PRN
De koppeling met het ABCD totaalbestand van 2003 toonde aan dat twee LVR1 praktijken geen gegevens hadden aangeleverd aan de PRN in 2003 en dat twee praktijken gefuseerd waren in 2003. Deze informatie was vooraf niet bekend bij de PRN. Hoewel de vooraf verwachting was dat alle ABCD records zouden zijn terug te vinden in de PRN, konden 1.097 van de 12.553 ABCD records (8,7%) niet gekoppeld worden aan een PRN record. PRN praktijken die geen gegevens hebben aangeleverd in 2003 en/of 2004 en ABCD records zonder kindinformatie waren er de oorzaak van dat een aantal ABCD records niet gekoppeld kon worden aan een PRN record (respectievelijk 184 en 311 ABCD records). Voor de overige 602 ABCD records (55%) is niet duidelijk of het ontbreken, veroorzaakt wordt door het onvolledig zijn van de PRN of door het onvolledig of onjuist zijn van informatie in de ABCD en/of PRN records. Het tweede lijkt onwaarschijnlijk omdat er in de koppeling gecorrigeerd wordt voor fouten en onvolledigheden en omdat de ABCD informatie handmatig gecontroleerd is. Het eerste zou een probleem voor de PRN betekenen en een nadere studie is hier noodzakelijk om de oorzaken van het ontbreken van PRN records te achterhalen. 12.3
Datakwaliteit
Hoewel validatie van de vastgelegde informatie in het onderzoeksbestand en de nationale registratie geen doel van deze studie was, levert een vergelijking nuttige informatie op. Slechts 62% van de gekoppelde paren heeft een volledige overeenkomst op de 7 koppelvariabelen, hoewel de informatie grotendeels door dezelfde zorgverleners is vastgelegd. Dit vormt een aansprekende argumentatie ten gunste van probabilistisch koppelen (91%). Variabelen die goed overeenkomen zijn geboortedatum moeder (1% discrepanties), geboortedatum kind (1% discrepanties) en geslacht kind (0,6% discrepanties). Graviditeit, aterme datum en geboortegewicht zijn de koppelvariabelen met de meeste discrepanties tussen het ABCD en PRN record (resp. 10%, 26% en 13%). Voor aterme datum en geboortegewicht wordt een deel van deze discrepanties weggevangen door middel van de gedefinieerde closes (resp. 20% en 6%). Alle drie de variabelen hebben als kenmerk dat deze gemeten moeten worden bij de vrouw (graviditeit en laatste menstruatiedatum voor bepalen aterme datum) of bij het kind (geboortegewicht). Indien verschillende zorgverleners dit op verschillende tijdstippen navragen kunnen er verschillen ontstaan. Bij discrepanties tussen de ABCD en PRN informatie kan op voorhand niet worden gezegd welke bron correct is. Een vergelijking van de perinatale sterfte vanaf 22.0 weken t/m 7 dagen post partum tussen de PRN en ABCD informatie is mogelijk voor 10.957 records. Volgens de ABCD informatie zijn er 96 gevallen van perinatale sterfte (8,8‰) en volgens de PRN informatie 100 (9,1‰). Voor 10.933 van de 10.957 komt de informatie over perinatale sterfte overeen tussen de PRN en ABCD, waarvan in 86 gevallen sprake was van perinatale sterfte. Voor 6 records was er een onbegrepen discrepantie in perinatale sterfte en voor 14 records was er een verschil in tijdstip van overlijden. De vergelijking van de ABCD informatie over etniciteit (het geboorteland van de moeder volgens de vragenlijst en GBA informatie) met de PRN informatie over etniciteit (typering vrouw) liet zien dat 17% van de vrouwen met Nederland als geboorteland niet als Nederlands getypeerd worden binnen de PRN, maar als Mediterraan of Creool. Daarnaast hebben 11% van de volgens de PRN als Nederlands getypeerde vrouwen een ander geboorteland dan Nederland.
Pagina 54 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
13. Aanbevelingen Op basis van de conclusies beschreven in hoofdstuk 12 kunnen een aantal aanbevelingen worden gedaan: Algemeen levert de koppeling van een PRN jaarbestand met een extern studiebestand (regionaal) veel informatie op over de interne PRN koppeling, de registratie compleetheid en de datakwaliteit. Een aanbeveling is om in toekomst dit soort externe koppelingen met onderzoeksbestanden te blijven ondersteunen en de technische adviezen te implementeren. De koppeling van de PRN registratie met een regionaal onderzoeksbestand heeft aangetoond dat informatie over overnames, fusies en sluitingen van praktijken onmisbaar is bij de koppeling. Het ontbreken van deze informatie is waarschijnlijk de grootste op korte termijn verbeterbare foutenbron, die leidt tot missende records en dubbeltellingen in de registratie. Een klemmende aanbeveling is om deze informatie up-to-date beschikbaar te hebben bij het PRN bureau, zodat deze informatie gebruikt kan worden bij de koppelingen en bij het gebruik van de registratie bestanden. De koppeling LVR1&LVR2&LNR is goed. Zonder externe informatie blijkt de koppeling niet te verbeteren. In de schoningsfase voorafgaand aan de koppeling kan een aanpassing plaatsvinden door rekening te houden met eventuele fusies en overnames van praktijken. De vergelijking van de ABCD en PRN informatie van de koppelvariabelen en de sterfte en etniciteitinformatie laat zien dat er discrepanties bestaan. Met de aanname dat de datakwaliteit van het ABCD onderzoeksbestand hoger is dan van de PRN registratie, omdat er veel handmatige controles op de gegevens zijn uitgevoerd en de ABCD records ook met GBA informatie zijn gevalideerd, is een aanbeveling om de datakwaliteit van deze PRN koppel- en uitkomstvariabelen te verhogen. Voor de informatie over sterfte van 7 tot 28 dagen post partum, kan een koppeling van de PRN met GBA informatie wellicht bijdragen aan de kwaliteitsverhoging. De analyse van de ABCD records die niet koppelden aan een PRN record heeft 3 groepen geïdentificeerd die in aanmerking komen voor een nadere studie: ABCD respondenten met kindinformatie, ABCD respondenten zonder kindinformatie en ABCD records met sterfte informatie (na een zwangerschapsduur van tenminste 20 weken). Een aanbeveling is om een nadere studie uit te voeren om de redenen te achterhalen waarom deze records niet zijn terug te vinden in de PRN registratie, omdat het gaat om een substantieel aantal terwijl al veel redenen lijken te zijn uitgesloten.
Pagina 55 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
14. Referenties [1]
Projectvoorstel externe koppeling ABCD-PRN jaarbestanden, juli 2005.
[2]
M Tromp, ACJ Ravelli, GJ Bonsel. KIK technical report 2006-03, “Koppeling PRN registratie 2003 met ABCD onderzoeksbestand 2003”, AMC Amsterdam, 2006. http//kik.amc.uva.nl/KIK
[3]
Jaarrapportage Volksgezondheid Amsterdam 2004 (GG&GD, 2004).
[4]
Website ABCD studie: www.abcd-study.nl
[5]
Website Stichting Perinatale Registratie Nederland: www.perinatreg.nl
[6]
Stichting Perinatale Registratie Nederland “Perinatale Zorg in Nederland 2001”, Bilthoven 2005.
[7]
Stichting Perinatale Registratie Nederland “Perinatale Zorg in Nederland 2002”, Bilthoven 2005.
[8]
Stichting Perinatale Registratie Nederland “Perinatale Zorg in Nederland 2003”, Bilthoven 2006.
[9]
N Méray, M Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel. KIK Technical Report 2005-04, “Koppelingsprocedure PRN 2003: Beschrijving en Toelichting”, AMC Amsterdam, 2005. http//kik.amc.uva.nl/KIK
[10] J McDonnell, M Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel. KIK Technical Report 2006-01, “Koppelingsprocedure PRN 2004: Beschrijving en Toelichting”, AMC Amsterdam, 2006. http//kik.amc.uva.nl/KIK [11] GJ Bonsel, ACJ Ravelli, JB Reitsma, N Méray. KIK Technical Report 2004-01, “Validatie koppelingsprocedure PRN 2001: Empirische validatie LVR1&LVR2 koppeling”, AMC Amsterdam, 2004. http//kik.amc.uva.nl/KIK [12] M Tromp, ACJ Ravelli, N Méray, JB Reitsma, GJ Bonsel. KIK Technical Report 2005-06, “LNR-registratie Compleetheid, Datakwaliteit en Validatie LNR koppeling”, AMC Amsterdam, 2006. http//kik.amc.uva.nl/KIK [13] Tromp M, Méray N, Ravelli ACJ, Reitsma JB, Bonsel GJ. Medical record linkage of anonymous registries without validated sample linkage of the Dutch perinatal registries. Stud Health Technol Inform. 2005;116:125-30. [14] Méray N, Reitsma JB, Ravelli ACJ, Bonsel GJ. Probabilistic Record Linkage is a valid and transparent tool to combine databases without a patient identification number. Accepted for publication in Journal of Clinical Epidemiology 2006.
Pagina 56 van 57
Koppeling PRN registratie 2003 en 2004 met ABCD onderzoeksbestand 2003-2004, conceptversie, juni 2006.
Bijlage 1 Non-response analyse ABCD o.b.v. data PRN Binnen de ABCD zijn drie respons groepen te onderscheiden : a. respons ABCD en toestemming opvragen gegevens LVR b. respons ABCD, geen toestemming opvragen gegevens LVR c. geen respons ABCD De gegevens die we van deze groepen graag op geaggregeerd niveau willen krijgen zijn: Indeling categorieën en/of gemiddelde
Determinanten Etniciteit Pariteit Leeftijd Meerlingzwangerschap Uitkomsten Apgarscore Zwangerschapsduur Geboortegewicht Sterfte t/m 7 dagen na geboorte Indien sterfte ja
Verleende zorg Welke lijn
Tertiaire zorg NICU opname Bevalling ingeleid Aard partus Tijdstip waarop in zorg
Geografisch gebied Verdeling naar wijk Verdeling naar stadsdeel
0 <20 Nee
1 20-35 Ja
2+ ≥ 35
Gemiddelde Gemiddelde Gemiddelde
<4 <32.0 <500 Nee
4-6 32.0-36.6 500-1000 Ja
≥7 37.0-42.6 ≥ 43.0 Etc. per 500 gram
Gemiddelde Gemiddelde Gemiddelde
Ante partum, bij 22+, 28+, 32+ weken (?)
Durante partum
Post partum, 1/2/3/4/5/6/7 dagen
Begonnen Begonnen in 1e in 1e bevallen in bevallen in 1e 2e Nee Ja, VU Nee Ja Nee Ja Volgens standaardindeling PRN Voor 12e 12-18e week week
Begonnen in 2e bevallen in 2e
NB 2e óf 3e, code 1e en 2e lijn, niet herleidbaar
Ja, AMC
18-24e week
Na week 24
Gemiddeld
Standaardindeling wijken Amsterdam Standaardindeling stadsdelen Amsterdam
Met een non-response analyse willen we antwoord krijgen op de volgende vragen: • is de relatie tussen determinanten en zorg, • en determinanten en uitkomsten hetzelfde in de drie responsgroepen (a,b,c).
Pagina 57 van 57