PRN Koppelingsprocedure 2005 (LVR1, LVR2 en LNR-registratie)
Stichting Perinatale Registratie Nederland Postbus 8588 3503 RN Utrecht Tel. 030-28 23 165 www.perinatreg.nl
[email protected]
Klinische Informatiekunde1 Klinische Epidemiologie & Biostatistiek2 Afdeling Verloskunde & Gynaecologie3 Academisch Medisch Centrum 1100 DE Amsterdam Tel. 020-566 4624 Fax: 020-691 9840 http://kik.amc.uva.nl/KIK
PRN/AMC-rapport Klinische Informatiekunde Technisch rapport 2007-03
In opdracht van Uitvoering door
Stichting Perinatale Registratie Nederland LinKID-projectteam AMC
Datum
April 2007
Auteurs
Aantal pagina’s Aantal bijlagen
1 Marc Tromp (
[email protected]) Miranda Tromp1 (
[email protected]) Anita CJ Ravelli1 (
[email protected] ) Hans JB Reitsma2 (
[email protected]) Joris AM van der Post3 (
[email protected])
59 1
Inhoudsopgave
Inhoudsopgave ..............................................................................................2 Summary in English ......................................................................................3 Samenvatting .................................................................................................6 Inleiding ..........................................................................................................9 Samenvatting resultaten en leeswijzer ................................................................................ 11
Hoofdstuk 1 Schoningskoppelingen..........................................................12 §1.1 Koppeling LVR1 ^ LVR1 .............................................................................................. 12 §1.2 Koppeling LVR2 ^ LVR2 .............................................................................................. 14 §1.3 Koppeling LNR ^ LNR .................................................................................................. 16
Hoofdstuk 2 Koppeling LNR ^ LNR voor vinden van heropnames .........17 §2.1 Koppeling LNR ^ LNR voor vinden van heropnames bij eenlingen............................. 17 §2.2 Koppeling LNR ^ LNR voor vinden van heropnames bij meerlingen........................... 19 §2.3 Koppeling niet-gekoppelde LNR eenlingen ^ meerlingen............................................ 20
Hoofdstuk 3 Koppeling LVR1 ^ LVR2 ........................................................22 §3.1 Koppeling LVR1 ^ LVR2 eenlingen.............................................................................. 22 §3.2 Koppeling LVR1 ^ LVR2 meerlingen ........................................................................... 25 §3.3 Koppeling niet-gekoppelde LVR1 eenlingen met LVR2 meerlingen............................ 27 §3.4 Koppeling niet-gekoppelde LVR1 meerlingen met LVR2 eenlingen............................ 27 §3.5 Creatie LVR1^LVR2 eindbestand ................................................................................ 27
Hoofdstuk 4 Koppeling (LVR1 ^ LVR2) ^ LNR...........................................28 §4.1 Koppeling (LVR1 ^ LVR2) ^ LNR eenlingen ................................................................ 28 §4.2 Koppeling LVR12 ^ LNR meerlingen ........................................................................... 31 §4.3 Koppeling niet-gekoppelde LVR12 eenlingen met LNR meerlingen ........................... 31 §4.4 Koppeling niet-gekoppelde LVR12 meerlingen met LNR eenlingen ........................... 31 §4.5 Creatie eindbestand (LVR1 ^ LVR2) ^ LNR................................................................. 33
Hoofdstuk 5 PRN jaar 2005 bestanden ......................................................35 §5.1 Beschrijving eindbestanden ......................................................................................... 35 §5.2 Toegevoegd variabelen ............................................................................................... 36 §5.3 Mogelijke dubbeltelling................................................................................................. 40 §5.4 Controles op het gekoppelde PRN bestand ................................................................ 40 §5.5 Versie beheer en bestandnaam................................................................................... 40 §5.6 Validatie koppeling LNR-registratie ............................................................................. 40
Epiloog..........................................................................................................41 Referenties ...................................................................................................43 Begrippen .....................................................................................................45 Appendix: Contents gekoppelde bestand LVR1^LVR2^LNR 2005..........47
Pagina 2 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Summary in English Linking three Dutch LVR1, LVR2 and LNR registries to combine medical information on pregnancy, childbirth and postnatal period for the year 2005
Introduction In the Netherlands, approximately 59% of births are attended by an obstetrician, 33% by a midwife and around 7% by a general practitioner. Less than a third of births take place at home, although a further 6% of deliveries begin at home but end in a hospital after referral during labour [www.knov.nl]. Following birth, the child may be admitted to a paediatric unit and will be seen by a paediatrician. As a result, both mother and child may be seen by more than one caregiver. Depending on the profession of the caregivers involved in prenatal care, delivery and subsequent postnatal care, details of the pregnancy (including demographic data on the mother), birth and possible hospital admissions will be recorded in one or more of three registries: the LVR1 (National Obstetric Registry (primary care)), the LVR2 (National Obstetric Registry (secondary care)) and the LNR (National Neonatal Registry). In table 1 the number of records in the separate and in the combined linked registry is described. Table 1: Number of records in the separate LVR1, LVR2, LNR and linked PRN registries Year LVR1 registry LVR2 registry LNR registry
Unit “pregnancy women/ delivery child” “delivery” “admission”
2005 163,764 118,553 36,805
Combined linked PRN registry Linked LNR^LNR registratie
“child” “child”
193,724 36.635
Under Dutch privacy law, information within these registries must be rendered anonymous to any parties outside of the treating institution. A unique key, which identifies individuals, simply does not exist. Therefore, in order to collate information on the same woman, pregnancy and child, anonymous linking of the three prenatal registries is required.
The linkage procedure and linkage methods Below, we briefly describe the linkage procedure used by the LinKID group to achieve a valid, combined registry through a series of transparent, repeatable steps. The first step in a linkage was to ‘clean’ each of the three datasets i.e. remove duplicate records. No other data cleaning (such as the removal of ‘impossible’ date values) was carried out. Next, the LVR1 registry was first matched to the LVR2. Separate linkages were done for singleton and multiple births, after which data were recombined. Then the matched file (LVR12) was matched to the LNR. Linkage methods can be classified as either deterministic or as probabilistic. Under both methods, variables which partially identify a patient and which are present in more than one registry and are of sufficient quality (in terms of coding and degree of missingness) are chosen as linkage variables. In deterministic linkage, a pair of records (one from each dataset) is considered a match if all linkage variables match. A variation on this rule is to consider a pair as a match if they differ on only a (pre-specified) small number of variables, usually one ('n-1' linking, where n is the number of linking variables used). Pagina 3 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
In probabilistic linkage, weights are calculated for each linking variable separately in case of agreement or disagreement. The weight calculation is based on the probability of a match on each variable in both true matches and non-matches (accidental agreement)[2]. These variable-specific weights assign ‘rewards’ to each record pair for all variables that agree by assigning the pair a positive score (specific to each variable) and to ‘punish’ the record pair (by assigning negative weights) for all variables that differ. The total weight for each record pair is calculated by summing all the weights for each linkage variable. Pairs with a high total weight are likely to be matches, while pairs with a low score are unlikely to be a match. Deterministic linkage was only used to ‘clean’ the data of the separte registries. All other linkages were made using probabilistic linkage [2,3]. A number of variables may not be recorded identically in the two registries. For example, birth weight may be recorded as 3010 gm in one registry, but may be rounded down to 3000 gm in another. Probabilistic linkage can be extended to include so-called ‘close’ matches. Record pairs with a close match on a given variable are given a smaller reward than a full match, but this procedure will still identify many true matches. A computer algorithm computes the variable-specific weights. Because of this it is possible to estimate the ‘threshold value’ above which total scores are assumed to represent a match. The threshold reflects an estimate of the prevalence of matches among all possible record pairs. Usually, the great majority of record pairs falls well below the threshold (no match) and a small number fall well above the threshold. The quality of the linkage procedure can be crudely judged when looking to the number of record pairs on both sides of the threshold. The smaller this grey area, the better the discriminatory performance of the linkage procedure. The choice of the correct threshold and the best decision rule on record pairs in the grey area usually requires a judgement based on contextual knowledge in addition to information drawn from the computer output. Given the large number of records (particularly in the LVR1 and LVR2), it is computationally impossible to compare all possible pairs of records from two datasets. To overcome this problem, the data are ‘blocked’ on certain variables. For example, in creating the link between the LVR1 and LVR2, the data were first blocked on the mother's date of birth: only pairs in which the mother's date of birth was identical in both datasets were considered. This reduced 10 the number of record pairs to be considered from approximately 2 x 10 to just over 3 million. Subsequently, non-matched records were blocked on the postal code of the mother to identify any matches missed by the first blocking. Similarly, records in the LVR12^LNR linkage were blocked first on the child’s date of birth and, subsequently, on the mother’s postal code (see Figure 2). From validation and comparative studies, it is now known that the LinKID probabilistic linkage procedure performs very well in absolute terms, and considerably better than the best deterministic alternative. Additionally, it provides quantitative information on the success of the linkage and the main sources of error.
Results Here we present a selection of information from the 2005 linkage study, which, in total, involves 14 separate steps. First we present the variables used in the LVR1-LVR2 singleton link (after blocking on the mother’s date of birth) with their estimated weights (see Table 2). From Table 2 one can read that agreement of postcode provides the highest positive award (10.48) being, apparently, the most informative variable if correct! Date of birth is less informative (8.47). However, the weights assigned to disagreement are -4.78 and -7.28, respectively, indicating that the error rate in recording the postcode is much higher than in recording birth date.
Pagina 4 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Table 2: linkage weights for the LVR1^LVR2 linkage singletons 2005
Variable Postcode (mother) Date of birth (child, full match) Date of birth (close, ±1 day) Expected date of birth (full) Expected DOB (close, ±7 days) Birth weight (full) Birth weight (close, ±10gm) Place of birth Minute of birth Hour of birth Gravidity Gender (child)
Weights Agree Disagree 10.48 -4.78 8.47 -7.28 1.81 n.a. 8.43 -6.49 1.20 n.a. 8.08 -4.68 0.94 n.a. 6.98 -3.41 5.72 -3.83 4.51 -5.24 1.59 -3.72 0.99 -6.40
In Table 3, we present the final linking results after all steps have been taken. The combined dataset consists of 193,724 different records (children), of which 98,799 represent record pairs or triplets that comprise data from two or three registries. Table 3: number of links between the LVR1 LVR2 and LNR registries 2005 Records with information from
Number of matches or links 71,941 21,537 1,447 66,860 1,877 7,703 22,359
LVR1 LVR2 LNR LVR1^LVR2 LVR1^LNR LVR2^LNR LVR1^LVR2^LNR PRN (LVR1^LVR2^LNR) registration
193,724
Conclusion We successfully linked the three LVR1, LVR2, LNR Dutch perinatal registries in the PRN registry 2005. As a result, all information concerning the same pregnancy and child have been combined into one medical record, making it possible to obtain information across the entire prenatal care period (table 4). Table 4: The linked LVR1 LVR2 and LNR perinatal registries 2005 File LVR1_LVR2_LNR_2005 LNR_LNR_2005
Version Versie 1.0 Versie 1.0
Date 24 april 2007 24 april 2007
Records 193.724 36.635
It is important to stress that any linkage needs to be validated after it has been carried out. Also, the linkage itself cannot solve the problem as to the 'true' value of a variable in a matched record, if this variable - despite the match - has a different value in the two data sources. Apparently, the positive weights associated with the remaining linking variables was sufficient to overcome such disagreement, but the procedure itself provides no information on which, if either, of the two values is 'true’.
Pagina 5 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Samenvatting Hier wordt in het kort de koppeling van drie Nederlandse perinatale registraties (LVR1, LVR2 en LNR) besproken, die als doel heeft om medische gegevens over de zwangerschap, geboorte van het kind en de postnatale periode samen te voegen voor het jaar 2005.
Inleiding In Nederland wordt ongeveer 59% van de zwangerschappen begeleid door de gynaecoloog, 33% door een verloskundige en 7% door de huisarts. Minder dan een derde van de bevallingen gebeurt thuis, en bovendien begint 6% van de bevallingen thuis, maar eindigt in het ziekenhuis [www.knov.nl]. In sommige gevallen wordt het kind na de geboorte opgenomen op een neonatale afdeling, en wordt onderzocht door de kinderarts. Dit betekent dus dat de moeder en het kind door verschillende zorgverleners worden gezien. Afhankelijk van de zorgverlener die betrokken is bij de prenatale zorg, bevalling en postnatale zorg, worden gegevens over de bevalling (inclusief demografische gegevens over de moeder), geboorte en verwijzingen naar het ziekenhuis geregistreerd in een of meer van de drie registraties. Dit zijn de LVR1 (Landelijke Verloskundige Registratie (eerste lijn)) de LVR2 (Landelijke Verloskundige Registratie (tweede lijn)) en de LNR (Landelijke Neonatale Registratie). In tabel 1 staat het aantal records in de verschillende registraties en in het uiteindelijke gekoppelde PRN bestand. Tabel 1: Aantal records in de verschillende perinatale registraties in 2005 Registratie LVR1 registratie los LVR2 registratie los LNR registratie los Gekoppelde PRN (LVR1^LVR2^LNR) registratie Gekoppelde LNR^LNR registratie
Eenheid Zwangerschap/baring vrouw + geboorte kind Geboorte kind Opname kind
118.553 36.805
Kind
193.724
Opname kind
Aantal Records 163.764
36.635
Vanwege de Nederlandse privacy wetgeving moet de informatie in deze registraties eerst geanonimiseerd worden, voordat andere partijen buiten de zorginstellingen deze mogen gebruiken. Een unieke sleutel, die individuen identificeert, is dus niet toegestaan. Om informatie over dezelfde vrouw, zwangerschap en kind uit deze 3 registraties te kunnen koppelen wordt een anonieme koppelingsprocedure gebruikt.
De koppelingsprocedure en koppelingsmethoden Hieronder beschrijven we de koppelingsprocedure, die bestaat uit een aantal stappen en wordt gebruikt door het LinkID team om een valide, gekoppelde registratie te verkrijgen De eerste stap in het koppelingsproces is om elk van deze drie datasets op te schonen, met andere woorden het verwijderen van dubbele records. Er worden geen andere schoningsstappen uitgevoerd (zoals het verwijderen van onwaarschijnlijke waarden) Vervolgens wordt de LVR1 registratie gekoppeld met de LVR2 registratie. Hierbij worden eenlingen en meerlingen apart behandeld, en na de koppeling weer samengevoegd. Het gekoppelde bestand (LVR12) wordt hierna gekoppeld met het LNR bestand. Men onderscheidt twee belangrijke koppelingsmethoden, deterministisch en probabilistisch. Bij beide methoden worden er koppelvariabelen gekozen, die partieel identificerend zijn voor een patiënt, daarnaast in beide registraties voorkomen en bovendien van voldoende kwaliteit zijn (laag percentage missings)
Pagina 6 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Bij de deterministische methode wordt een recordpaar beschouwd als een match als alle koppelvariabelen overeenkomen. Een altenatieve en minder strenge methode is om een paar als match aan te merken als een klein aantal variabelen verschilt (meestal één, de zogenaamde n-1 koppeling, waarin n is het aantal gebruikte koppelvariabelen) Bij de probabilistische methode worden er gewichten uitgerekend voor iedere koppelvariabele, zowel voor ‘overeenstemming’ als ‘geen overeenstemming’. De berekening van het gewicht is gebaseerd op de kans op overeenstemming van iedere variabele voor zowel de werkelijke matches als de niet-matches.[2]. Deze variabele-specifieke gewichten geven een beloning (door middel van een positieve score) voor ieder variabele die overeenkomt binnen het recordpaar, en een straf (door middel van een negatieve score) voor iedere variabele die verschilt binnen het recordpaar. Het totale gewicht voor ieder recordpaar wordt berekend door het optellen van de gewichten van de afzonderlijke koppelvariabelen. Paren met een hoog totaalgewicht zijn waarschijnlijk matches, en paren met een lage score waarschijnlijk geen matches. De deterministische methode wordt alleen gebruikt om de losse registraties op te schonen. Voor alle andere koppelingen wordt de probabilistische methode gebruikt [2,3]. Een aantal variabelen wordt soms niet precies gelijk in de beide registratie opgenomen. Het geboortegewicht van een kind zou bijvoorbeeld in de ene registratie als 3010 gram zijn geregistreerd en in de andere registratie afgerond naar 3000 gram. Om deze close-waarden te ondervangen kan de probabilistisch methode worden uitgebreid. Recordparen met een close match op een bepaalde variabele krijgen een lagere beloning dan recordparen met een full match Een algoritme berekent de variabele-specifieke gewichten. Hierdoor wordt het mogelijk om het afkappunt te schatten; paren met een hogere totaalscore worden beschouwd als een link. Het afkappunt geeft een schatting weer van de prevalentie van de matches tussen alle mogelijke recordparen. In het algemeen valt de grote meerderheid van de records ver beneden het afkappunt (geen match) en een klein aantal ruim boven het afkappunt. De kwaliteit van de koppelingsprocedure kan beoordeeld worden door een aantal recordparen aan beide kanten van het afkappunt te onderzoeken. Hoe kleiner het grijze gebied, hoe beter het discriminerend vermogen van de koppelingsprocedure. De keuze van het juiste afkappunt voor de recordparen in het grijze gebied wordt zowel bepaald door informatie die de output van de computer oplevert, als door kennis over de context. Vanwege het grote aantal records (met name in de LVR1 en LVR2), is het onmogelijk (lees: zeer tijdrovend) om met de computer alle mogelijke recordparen te vergelijken in beide datasets. Om dit probleem op te lossen, wordt de data ‘geblocked’ op een bepaalde variabele. Om bijvoorbeeld de koppeling tussen de LVR1 en LVR2 te realiseren wordt de data eerst geblocked op de geboortedatum van de moeder: er worden dan alleen paren met een identieke geboortedatum van de moeder vergeleken. Hierdoor wordt het aantal recordsparen 10 6 dat wordt beschouwd als mogelijke match gereduceerd van ongeveer 2 x 10 naar 3 x 10 . Vervolgens worden de niet-gekoppelde records geblocked op postcode van de moeder, om matches te vinden, die bij de eerste blocking zijn gemist. Op een vergelijkbare manier worden de records in de LVR12^LNR koppeling eerst geblocked op de geboortedatum kind, en vervolgens op de postcode van de moeder. Uit de validatie en vergelijkende studies is gebleken dat de probabilistische koppelingsprocedure goed presteert in absolute zin, en behoorlijk beter dan het beste deterministische alternatief. Bovendien hebben deze studies kwantitatieve informatie opgelevert over het succes van de koppelingsprocedure, en de belangrijkste bronnen van fouten.
Resultaten Hier presenteren we een selectie van de informatie uit de koppelingsstudie van 2005, die in totaal uit 14 verschillende stappen bestaat. Eerst tonen we de variabelen die zijn gebruikt in de LVR1-LVR2 eenling koppeling (na blocking op geboortedatum moeder) met de bijbehorende geschatte gewichten (zie tabel 2)
Pagina 7 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
In tabel 2 kan men de zien dat de overeenstemming op postcode de hoogste positieve score geeft (10.48) en daarmee geeft het de meest informatieve waarde. De geboortedatum van het kind is minder informatief (8.47). De bijbehorende gewichten voor ‘geen overeenstemming’ zijn respectievelijk -4.78 and -7.28. Dit geeft aan dat het foutenpercentage bij het registreren van de postcode veel hoger is dan bij de geboortedatum. Tabel 2: koppelgewichten voor de LVR1^LVR2 koppeling voor singletons
Variabele Postcode (moeder) Geboortedatum (kind, full match) Geboortedatum (close, ±1 dag) Aterme datum (full) Aterme datum (close, ±7 dagen) Geboorte gewicht (full) Geboorte gewicht (close, ±10g) Geboorteplaats Geboorte minuut Geboorte uur Graviditeit Geslacht (kind)
Gewichten Agree Disagree 10.48 -4.78 8.47 -7.28 1.81 nvt 8.43 -6.49 1.20 nvt 8.08 -4.68 0.94 nvt 6.98 -3.41 5.72 -3.83 4.51 -5.24 1.59 -3.72 0.99 -6.40
In Tabel 3, staan de uiteindelijke resultaten nadat alle koppelingsstappen zijn uitgevoerd. Het gekoppelde PRN eindbestand bevat 193.724 verschillende records (moeder-kind combinaties), waarvan 98.799 recordparen data bevatten uit twee of drie registraties. Tabel 3: aantal links tussen de LVR1, LVR2 en LNR registraties 2005 Records met informatie uit LVR1 LVR2 LNR LVR1^LVR2 LVR1^LNR LVR2^LNR LVR1^LVR2^LNR
Aantal records 71.941 21.537 1.447 66.860 1.877 7.703 22.359
PRN linked LVR1^LVR2^LNR registratie 2005
193.724
Conclusie We hebben de drie Nederlandse perinatale registraties (LVR1, LVR2 en LNR) succesvol gekoppeld tot het PRN 2005 eindbestand. Het resultaat is dat alle informatie over dezelfde zwangerschap en hetzelfde kind gecombineerd zijn in één medisch record. Dit maakt het mogelijk om informatie te verkrijgen over de gehele periode van perinatale zorg (tabel 4). Tabel 4: de gekoppelde eindbestanden LVR1, LVR2 en LNR koppeling 2005 Naam bestand LVR1_LVR2_LNR_2005 LNR_LNR_2005
Versienummer Versie 1.0 Versie 1.0
Datum bestand 24 april 2007 24 april 2007
Records 193.724 36.635
Het is belangrijk om iedere koppeling na afloop te valideren. De koppeling zelf kan het probleem van de werkelijke waarde van een variabele, als deze verschillend is in de twee registraties bij een link, niet oplossen. Het positieve gewicht van de overige koppelvariabelen was voldoende om het verschil te overkomen, maar de procedure geeft geen informatie over welke van de twee waardes de werkelijke waarde is. Pagina 8 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Inleiding Voor u ligt de rapportage van de PRN koppeling van de perinatale registraties (LVR1, LVR2 en LNR) voor het jaar 2005. Dit koppelingsproject is een vervolg op het LinKID koppelingsproject van de perinatale registraties voor de jaren 2000 tot en met 2004 [3-8]. Deze rapportage is de verantwoording van de koppeling van 2005 en de documentatie bouwt daarbij primair voort op de uitgebreide documentatie van de koppeling van 2001 [3] en volgende jaren (Koppelingsprocedure PRN 2001: Deel I Hoofdlijnen en Deel II Beschrijving en Toelichting en Koppelingsprocedure PRN 2002: Beschrijving en Toelichting) [3-4]. De PRN koppelingsmethodiek is in 2003 in opdracht van Stichting PRN ontwikkeld in het AMC door prof dr GJ Bonsel, dr N Méray, dr ACJ Ravelli en dr JB Reitsma. Deze PRN koppelingsmethodiek is door dr Nora Meray, drs Miranda Tromp en drs Joseph McDonnel toegepast op vervolg jaren 2000-2004 van de PRN registratie. Deze PRN koppelingsmethodiek bouwt voort op het koppelingswerk van dr JB Reitsma en Prof dr GJ Bonsel voor de Hartstichting in het kader van het proefschrift van Reitsma [2]. De PRN koppelingen van 2001 en 2002 zijn op validiteit getest [9-11], en functioneren daarom in het vervolg als referentie. De documentatie van de koppeling van 2001 tot en met 2005 is beschikbaar op de website van de Stichting Perinatale Registratie Nederland (www.perinatreg.nl) en de website van de afdeling Klinische Informatiekunde van het AMC (kik.amc.uva.nl/KIK/) onder ‘Technical Reports’. De uitgangspunten voor de PRN koppeling van 2005 zijn niet veranderd ten opzichte van de eerdere jaren. De Stichting PRN heeft begin februari 2007 de afdeling Klinische Informatiekunde van het AMC opdracht gegeven om, op basis van de ontwikkelde PRN koppelingsmethodiek, de koppeling uit te voeren van de LVR1, LVR2 en LNR registratie bestanden van 2005 t/m 2008. Het vervolgkoppelingsproject 2005 is uitgevoerd op de afdeling Klinische Informatiekunde, AMC Amsterdam, door medische informatiekundige Marc Tromp, onder begeleiding van medische informatiekundige Miranda Tromp en epidemioloog Anita Ravelli. Het projectteam wordt sinds het vertrek van prof dr GJ Bonsel naar de ErasmusMC in Rotterdam gesuperviseerd door gynaecoloog prof dr JAM van de Post. Als begeleidingsgroep zijn dr JB Reistma, een verloskundige, een gynaecoloog en een neonatoloog benoemd. De projectuitvoering van de LVR1^LVR2^LNR 2005 koppeling liep vanaf 1 februari 2007 t/m 15 april 2007. Er is voor de koppeling van 2005 een aantal kleine veranderingen doorgevoerd in de koppelmethodiek ten opzichte van de PRN koppeling van het jaar 2004 [8]. Ten eerste is, op basis van de ABCD^PRN koppeling [12], de schoningskoppeling LVR1 van de administratieve dubbeltellingen minder streng uitgevoerd. Bij overeenkomst op 8 variabelen werd een record als administratieve dubbeltelling weggeschreven ten opzichte van overeenkomst op 9 variabelen in voorgaande jaren. Ten tweede is de LVR1^LVR2 meerlingkoppeling aangepast. Een LVR1 record dat als meerlingrecord is meegenomen omdat de reden verwijzing naar de e 2 lijn een meerlingzwangerschap betrof, kan nu koppelen aan de twee bijbehorende LVR2 meerlingrecords. Voorheen was dit niet mogelijk omdat de ‘meerlingcode’ en ‘omvang meerling’ overeen moesten stemmen. Ten slotte is er een nieuwe koppelingsstrategie ontwikkeld voor de LNR^LNR meerling koppeling. Uit de LNR validatiestudie uitgevoerd in 2005, bleek immers dat de ‘meerlingcode’ geen betrouwbare koppelvariabele is om de opnames van meerlingkinderen uit elkaar te houden (zie §5.6). Deze nieuwe methode is beschreven in §3.2. De gegevens van LNR heropnames van meerlingkinderen zijn vanaf 2005 weer te gebruiken voor analyses door deze nieuwe strategie. Het gekoppelde PRN (LVR1 LVR2 LNR) 2005 bestand kan wederom in combinatie gebruikt worden in samenhang met de eerder door LinKID gekoppelde PRN bestanden van 2000 tot en met 2004.
Pagina 9 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Het LVR1 bronbestand 2005 bestond uit 163.764 records, het LVR2 bronbestand uit 118.553 records en het LNR bronbestand uit 36.805 records. Tabel 1 Aantal records per LVR1, LVR2 en LNR bestand Jaar 2005
Aantal Records
Datum Bronbestand Prismant
LVR1 registratie LVR2 registratie LNR registratie
163.764 118.553 36.805
06-apr-2006 02-oct-2006 07-jun-2006
Datum ontvangst AMC voor koppeling 09-feb-2007 07-feb-2007 07-feb-2007
Aantal Deelnemende Praktijken 434 98 57
Het gekoppelde PRN eindbestand 2005 bestaat uit 193.724 records. 52.4 % van de LVR1 records (89.219 records) kon gekoppeld worden aan een LVR2 record. Van 2.627 kinderen zijn meerdere opnames als heropname van hetzelfde kind geïdentificeerd in de LNR. Er zijn 31.939 LVR1 en/of LVR2 records gekoppeld aan een LNR record.
Tabel 2 Trend in LVR1, LVR2, LNR en gekoppelde PRN registratie 2000-2005 [13-15] PRN gekoppeld bestand
2000
2001
2002
2003
2004
2005
LVR1 registratie LVR2 registratie LNR registratie
154.742 124.716 32.189
155.832 125.061 30.130
162.649 122.859 31.996
169.326 125.150 35.462
160.967 121.716 33.545
163.764 118.553 36.805
PRN gekoppelde registratie
204.584
202.904
202.778
206.778
199.859
193.724
Pagina 10 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Samenvatting resultaten en leeswijzer Alles bijeen zijn voor de PRN 2005 koppeling er 14 koppelingen uitgevoerd. De schoningskoppelingen zijn beschreven in §1: - LVR1 ^ LVR1 - voor het herkennen van administratieve dubbeltellingen (§1.1). - LVR2 ^ LVR2 - voor het herkennen van administratieve dubbeltellingen (§1.2). - LNR ^ LNR - voor het herkennen van administratieve dubbeltellingen (§1.3). De koppelingen tussen de LNR ^ LNR registratie zijn beschreven in §2: - Herkennen van heropnames van hetzelfde kind binnen de groep eenlingen. (§2.1). - Herkennen van heropnames van hetzelfde kind binnen de groep meerlingen. (§2.2). - Koppelen van niet-gekoppelde LNR eenlingen met niet-gekoppelde LNR tweelingen voor het vinden van heropnames (§2.3). De koppelingen tussen de LVR1 en LVR2 registratie zijn beschreven in §3: - Koppelen van eenlingen LVR1 ^ LVR2 (§3.1). - Koppelen van meerlingen LVR1 ^ LVR2 (§3.2). - Koppelen van niet-gekoppelde LVR1 eenlingen met niet-gekoppelde LVR2 meerlingen (§3.3). - Koppelen van niet-gekoppelde LVR1 meerlingen met niet-gekoppelde LVR2 eenlingen (§3.4). De koppelingen tussen de gekoppelde LVR1^LVR2 registratie met de LNR registratie zijn beschreven in §4: - Koppelen van eenlingen LVR1 ^ LVR2 met LNR (§4.1). - Koppelen van meerlingen LVR1 ^ LVR2 met LNR (§4.2). - Koppelen van niet-gekoppelde LVR1 ^ LVR2 eenlingen met niet-gekoppelde LNR meerlingen (§4.3). - Koppelen van niet-gekoppelde LVR1 ^ LVR2 meerlingen met niet-gekoppelde LNR eenlingen (§4.4). In §5: wordt het gekoppelde PRN jaarbestand beschreven In de epiloog wordt een vergelijking gemaakt tussen de eerdere jaren.
Pagina 11 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Hoofdstuk 1 Schoningskoppelingen In §1.1 t/m § 1.3 worden de interne koppelingen LVR1^LVR1, LVR2^LVR2, en LNR^LNR besproken. Dit zijn voorbereide of schoningskoppeling voordat de verschillende registratie tussen elkaar kunnen worden gekoppeld.
§1.1 Koppeling LVR1 ^ LVR1 Hier wordt de interne koppeling van de LVR1 registratie beschreven. Het doel van de toegepaste interne LVR1 ^ LVR1 koppeling is het verwijderen van administratieve dubbeltellingen uit het LVR1 bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 10 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR1 2005 ASCII bestand (Z:\Jaarbestand\ASCII\LVR1\lvr1jaar2005.dat) wordt ingelezen en omgezet in een SAS jaarbestand (Z:\Jaarbestand\SAS jaar\LVR1\lvr1jr05.sas7bdat), het LVR1 2005 bestand bestaat uit 163.764 records. Daarnaast wordt ook het LVR1 2004 (Z:\Jaarbestand\SAS Jaar\LVR1\lvr1jr04) bestand ingelezen (160.967 records). Uit dit bestand worden de records geselecteerd waarbij de à terme datum in 2005 is, records waarbij de geboorte datum van het kind en de à terme datum missend is en records waarbij de à terme datum na 1 december 2004 is (6.881 records). In totaal zijn er nu 170.645 LVR1 records uit 2005 (bestand ‘V’). Zie figuur 1A (volgende bladzijde) voor een flowchart van de LVR1 ^ LVR1 koppeling. Het LVR1 bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (2.337.764 paren). Voor de interne LVR1-LVR1 koppeling worden de volgende 10 variabelen vergeleken: postcode moeder (geboortedatum moeder bij blocking op postcode), praktijknummer, graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur en geboorte minuut. Daarnaast worden nog meerlingcode en omvang meerling meegenomen. Records worden als een administratieve dubbeltelling beschouwd als 9 van de 10 variabelen overeenkomen of als 8 van de 10 variabelen overeenkomen en daarnaast ook sprake is van een eenling. Er is in 2005 nog een extra situatie voor een administratieve dubbeltelling, namleijk als 7 van de 10 variabelen overeenkomen en daarnaast niet alleen sprake is van een eenling, maar ook de praktijkcodes overeenkomen en de aterme datum missing is. Op deze manier worden 400 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode overeenkomt worden aangemaakt (9.308.344). Administratieve dubbeltellingen worden op dezelfde wijze geselecteerd, maar nu met geboortedatum moeder als koppelvariabele in plaats van postcode moeder. Er worden geen extra administratieve dubbeltellingen gevonden. De 400 gevonden administratieve dubbeltellingen worden samengevoegd en er worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er worden 6 administratieve tripels gevonden. Van iedere administratieve dubbel wordt het tweede record verwijderd en van iedere administratieve trippel wordt daarnaast ook het derde record verwijderd. Van de 170.645 LVR1 records zijn nu 394 administratieve dubbeltellingen verwijderd, waardoor er nog 170.251 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (v_admin1) na positie 1 waar de recordidentificatie (v_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR1 2005 bestand wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2005\lvr1_opgeschoond.sasb7dat
Pagina 12 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Inlezen LVR 1 2004 bestand Z:\Jaarbestand \SASjaar \LVR 1\ lvr 1jaar 2004 .dat
Inlezen LVR 1 2005 bestand Z:\Jaarbestand \SASjaar \LVR 1 \lvr 1jaar 2005 .dat
LVR 1 2004 bestand (lvr 1jr 04) 160 .967 records
LVR1 2005 bestand (lvr1jr05 ) 163 .764 records
A terme datum voor dec 200 4 154 . 086 records
LVR1 2004 records die mogelijk met LVR 1 2005 records kunnen koppelen 6.881 records
LVR1 2005 bestand 163.764 records
LVR1 2005 bestand 170.645 records
Blocking geboortedatum moeder Administratieve dubbeltellingen 394 records
Blocking postcode moeder Administratieve dubbeltellingen 0 records
Opgeschoond LVR 1 2005 bestand 170.251 records
Opslaan opgeschoond LVR 1 2005 bestand Z:\jaarbestand \SASjaar \gekoppelde bestanden \ 2005 \lvr1_opgeschoond .sas 7bdat
Figuur 1A Flowchart LVR1 ^ LVR1 koppeling
Pagina 13 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
§1.2 Koppeling LVR2 ^ LVR2 Het doel van de toegepaste interne LVR2 ^ LVR2 koppeling is het verwijderen van administratieve dubbeltellingen uit het LVR2 bestand. De methodiek van deze LVR2^LVR2 koppeling is een deterministische koppeling. De LVR2^LVR2 koppeling vond plaats op basis van 11 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR2 2005 ASCII (Z:\Jaarbestand\ASCII\LVR2\lvr2jaar2005.dat) bestand wordt ingelezen en omgezet in een SAS jaarbestand (Z:\Jaarbestand\SAS jaar\LVR2\lvr2jr05.sasb7dat). Het LVR2 2005 bestand bestaat uit 118.553 records. Zie figuur 2 voor een flowchart van de LVR2 ^ LVR2 koppeling. Het LVR2 bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling en selectie van administratieve dubbeltellingen vindt op dezelfde, strengere wijze plaats dan bij de LVR1 koppeling. Met blocking op geboortedatum moeder worden 89 administratieve dubbeltellingen gevonden. De nietgekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Er worden nog 5 extra administratieve dubbeltellingen gevonden. De 94 gevonden administratieve dubbeltellingen worden samengevoegd en er worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er wordt 1 administratieve tripel gevonden. Van de administratieve dubbeltellingen wordt ieder tweede record verwijderd en van de tripel wordt het tweede en derde record verwijderd. Van de 118.553 LVR2 records zijn nu 94 administratieve dubbeltellingen verwijderd waardoor er nog 118.459 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (g_admin1) na positie 1 waar de recordidentificatie (g_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR2 2005 bestand wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2005\lvr2_opgeschoond.sasb7dat
Pagina 14 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Inlezen LVR2 2005 bestand Z:\ Jaarbestand\SAS jaar\LVR2\lvr2jaar2005.dat
LVR 2 2005 bestand 118 .553 records
Blocking geboortedatum moeder Administratieve dubbeltellingen 89 records
Blocking postcode moeder Administratieve dubbeltellingen 5 records
Opgeschoond LVR2 2005 bestand 118 .459 records
Opslaan opgeschoond LVR2 2005 bestand Z:\Jaarbestand \SAS jaar\gekoppelde bestanden\2005\ lvr 2_opgeschoond .sas7bdat
Figuur 1B Flowchart LVR2 ^ LVR2 koppeling
Pagina 15 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
§1.3 Koppeling LNR ^ LNR Het doel van de toegepaste interne LNR ^ LNR koppeling is het verwijderen van administratieve dubbeltellingen uit het LNR bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 11 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van het kind gebruikt en daarna de postcode van de moeder. Deze koppeling is iets meer veeleisender omdat heropnames kunnen voorkomen. Het LNR 2005 ASCII (Z:\Jaarbestand\ASCII\LNR\lnrjaar2005.dat) bestand wordt ingelezen en omgezet in een SAS jaarbestand (Z:\Jaarbestand\SAS jaar\LNR\lnrjaar2005.sas7bdat). Het LNR 2005 bestand bestaat uit 36.805 records. Het LNR bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (1.895.805 paren). Voor de koppeling worden de volgende 11 variabelen vergeleken: postcode moeder (geboortedatum kind bij blocking op postcode), geboortedatum moeder, amenorroeduur, gewicht, geslacht, datum opname, datum ontslag, LNR praktijkcode, meerlingcode en omvang meerling. Records worden als een administratieve dubbeltelling beschouwd als alle variabelen overeenkomen of als 1 variabele niet overeenkomt maar in ieder geval meerlingcode, omvang meerling, opname datum, ontslagdatum en LNR praktijkcode overeenkomen. Op deze manier worden 166 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Hierbij worden 17 extra administratieve dubbeltellingen gevonden. De 183 gevonden administratieve dubbeltellingen worden samengevoegd en er worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er worden 7 administratieve tripels gevonden en 1 quintuple. Van de administratieve dubbeltellingen wordt ieder tweede record verwijderd, van de tripel wordt het tweede en derde record verwijderd en van de quintuple bovendien ook het vierde en het vijfde record.
Van de 36.805 LNR records zijn nu 170 administratieve dubbeltellingen verwijderd, waardoor er nog 36.635 LNR records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (n_admin1) na positie 1 waar de recordidentificatie (n_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LNR 2005 bestand wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2005\lnr_opgeschoond.sasb7dat
Pagina 16 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Hoofdstuk 2 Koppeling LNR ^ LNR voor vinden van heropnames Het doel van de toegepaste interne LNR ^ LNR koppeling is het vinden van heropnames behorend bij hetzelfde kind in het LNR bestand. De methodiek van deze koppeling is een probabilistische koppeling op basis van 8 koppelvariabelen, apart voor eenlingen en meerlingen. Als blocking-variabele is eerst de geboortedatum van het kind gebruikt en daarna de postcode van de moeder.
§2.1 Koppeling LNR ^ LNR voor vinden van heropnames bij eenlingen Het opgeschoonde LNR bestand met 36.635 records ($1.3) wordt ingelezen vanaf Z:\Jaarbestand\SAS jaar\LNR\lnr2005_schoon. Uit dit bestand worden de eenlingrecords en meerling records gescheiden. Er zijn 33.039 eenling records en 3.596 meerling records in het LNR 2005 bestand. Zie figuur 2A voor de flowchart van de LNR ^ LNR eenlingkoppeling. Het LNR bestand wordt probabilistisch met zichzelf gekoppeld voor het vinden van heropnames. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (1.521.818 paren). Voor de koppeling worden de volgende 8 variabelen vergeleken (zie Tabel 2.1): geboortedatum moeder, amenorroeduur in weken, postcode (geboortedatum kind bij blocking op postcode), gewicht, geslacht, Apgarscore na 5 minuten en patiëntidentificatie. Voor de variabele geboortegewicht wordt naast een full match ook een close gedefinieerd. Er is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 50 gram. Tabel 2.1 Frequentietabel koppelvariabelen LNR^LNR heropnames eenlingen 2005 Variabele label Geboortedatum moeder Apgar score na 5 minuten Postcode (4 cijfers) Gewicht kind Patiëntidentificatie Geboortedatum kind Amenorroeduur in weken Geslacht kind
Variabele naam n_ddgebmoe n_Apgar_5 n_pc n_gew n_patid n_ddgebkind n_amww n_gesl
Aantal missend 4.665 1.766 333 291 3 0 0 0
% Missend 14% 5% <1% <1% <1% 0% 0% 0%
Tabel 2.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de ui en mi waarden. De ui waarden zijn berekend op basis van de randtotalen en de mi waarden op basis van fitting met een non-lineaire procedure. Tabel 2.2 Gewichten koppelvariabelen LNR ^ LNR heropnames eenlingen 2005 Variabele Geboortedatum moeder Patiëntidentificatie Postcode (4 cijfers) Gewicht kind (full) Gewicht kind (+/- 50 gr) Amenorroeduur in weken Apgar-score na 5 minuten Geslacht kind
mi waarden 0,9198 0,6069 0,9484 0,8597 0,1059 0,9399 0,9521 0,9755
ui waarden 0,00016 0,000271 0,000958 0,00218 0,0375 0,1269 0,3867 0,5026
Gewicht bij agree 12,49 11,13 9,95 8,62 1,50 2,89 1,30 0,96
Gewicht bij disagree -3,64 -1,35 -4,28 -4,80 nvt -3,86 -3,86 -4,34
Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht men 0.00235 * 1.521.818 = 3.576 matches te vinden. Op basis van de geschatte prevalentie en het bekijken van de paren wordt een afkappunt van 8,0 gekozen en worden 3.302 paren geselecteerd als match.
Pagina 17 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Figuur 2A Flowchart LNR ^ LNR eenlingkoppeling
Pagina 18 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder hetzelfde is (530.703 paren). Paren boven het afkappunt van 8,0 en waarbij de geboortedatum van het kind niet overeenkomt worden geselecteerd (6 paren). In totaal zijn er 3.308 paren geselecteerd als matches. Er worden clusters aangemaakt van deze paren om alle heropnames van een kind bij elkaar te vinden. In totaal zijn er 2.173 kinderen die meer dan één keer zijn opgenomen (1.719 kinderen die twee keer zijn opgenomen, 396 kinderen drie keer, 45 kinderen vier keer, 11 kinderen vijf keer, 1 kind zes keer en 1 kind zeven keer.). Het overgebleven LNR eenlingbestand (28.165 records) bestaat uit kinderen die één keer zijn opgenomen (tabel 2.3). Tabel 2.3 Aantal opnames bij LNR eenlingen 2005 Opname 1 2 3 4 5 6 7 Totaal
Aantal Records 28.165 3.438 1.188 180 55 6 7 33.039
Aantal kinderen 28.165 1.719 396 45 11 1 1 30.338
% aantal records 85,2% 10,0% 3,6% 0,5% 0,1% <0,1% <0,1% 100,0 %
Het uiteindelijke LNR 2005 eenlingbestand bestaat uit de samenvoeging van het bestand van kinderen die één keer zijn opgenomen (28.165 records) en het bestand van de kinderen met heropnames (4.874 records van 2.173 kinderen). Dit bestand bestaat in totaal uit 33.039 records en wordt weggeschreven naar: …\2005\ lnr_2005_singleton.sasb7dat. Dit bestand zal gebruikt worden voor de eenlingkoppeling met het gekoppelde LVR1^LVR2 bestand.
§2.2 Koppeling LNR ^ LNR voor vinden van heropnames bij meerlingen Het vinden van heropnames bij meerlingen gebeurt op dezelfde wijze als bij eenlingen. Nu worden alleen de meerlingrecords geselecteerd uit het Z:\Jaarbestand\SAS jaar\LNR\lnr2005_schoon bestand (3.596 records). Zie figuur 2B voor een flowchart van de LNR^LNR meerlingkoppeling. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (21.094 paren). Er worden net als bij de eenlingkoppeling 8 variabelen vergeleken. Alle paren boven het afkappunt 8,7 worden geselecteerd als match (2.409 paren). De meerlingcode en omvang meerlingcode worden nu niet meegenomen, omdat uit de LNR validatiestudie bleek dat deze waarden niet betrouwbaar zijn [9,10]. Er is voor de PRN koppeling 2005 een nieuwe systematiek bedacht om heropnames van meerlingen in de clusters in de LNR registratie op te lossen (oftewel de juiste heropname aan het juiste meerlingkind te koppelen). Uit de validatiestudie bleek namelijk ook dat het algoritme er goed in slaagde om alle opnames van kinderen van één meerling bij elkaar te vinden maar binnen een meerlingpaar heropnames verwisselde indien er een fout zat in de meerlingcode. Blocking op postcode moeder levert nog 2 extra paren op. In totaal zijn er 2.411 paren geselecteerd als match. Van de 2.411 paren boven het afkappunt, koppelen 966 paren uniek en 1.445 paren in clusters. De 966 ‘unieke’ paren bestaan in dit geval uit een eerste opname met een heropname of uit twee opnames, elk van een verschillend kind van één tweeling. Er worden clusters aangemaakt van de 1.445 paren om de juiste opnames bij elkaar te vinden. In totaal zijn er 261 clusters gevonden van verschillende grootte (zie tabel 2.4) De clusters bevatten nu alle opnames van alle kinderen van één meerling en bevatten dus ook “foutieve” matches, namelijk tussen opnames van verschillende kinderen van een meerling. De foutieve links zijn er uit gehaald door tijdens de koppeling een tweede totaalgewicht te berekenen. Dit totaalgewicht is alleen gebaseerd op variabelen die kunnen verschillen tussen kinderen van een meerling (gewicht kind, geslacht, apgarscore 5 min en meerlingcode) daarnaast wordt voor de meerlingcode een gewicht van +1 toegekend als de code overeenkomt en een gewicht van -1 als de code verschilt.
Pagina 19 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Het blijkt dat dit tweede totaalgewicht een goed discriminerend vermogen heeft voor de paren binnen één cluster. Links tussen opnames van dezelfde kinderen van een meerling krijgen een hoge positieve score, en links tussen opnames van verschillende kinderen van een meerling een negatieve score, en in sommige gevallen een lage positieve score. Na visuele inspectie van de verschillende clusters blijkt het afkappunt 5.0 voor zowel de clusters als het ‘unieke’ bestand goed te voldoen. Het cluster bestand en het ‘unieke’ bestand zijn samengevoegd en op basis van het afkappunt worden er 650 paren gevonden. Dit is een selectie van de 1.445 paren boven het 2e afkappunt. Tabel 2.4 Clusters LNR ^ LNR heropnames meerlingen 2005 Aantal paren per cluster 2 3 4 5 6 7 8 9 10 11 12 13 15 21 28 Totaal
Aantal clusters 30 93 8 7 79 3 3 2 11 4 1 1 15 2 2 261
Aantal paren 60 279 32 35 474 21 24 18 110 44 12 13 225 42 56 1.445
Er worden opnieuw clusters aangemaakt om de heropnames van hetzelfde kind te vinden. Er zijn 454 meerlingkinderen die meer dan één keer zijn opgenomen (372 kinderen zijn 2 keer opgenomen, 71 kinderen 3 keer, 10 kinderen 4 keer en 1 kind 5 keer). Het overgebleven LNR meerlingbestand (2.594 records) bestaat uit kinderen die één keer zijn opgenomen. Het uiteindelijke LNR 2005 meerlingbestand bestaat uit de samenvoeging van het bestand van kinderen die één keer zijn opgenomen (2.594 records) en het bestand van de kinderen met heropnames (1.002 records van 454 kinderen). Dit bestand bestaat in totaal uit 3.596 records en wordt weggeschreven naar: …..\gekoppelde bestanden\lnr_2005_meerling.sasb7dat. Dit bestand zal gebruikt worden voor de meerlingkoppeling met het gekoppelde LVR1^LVR2 bestand. Tabel 2.3 Aantal (her)opnames bij LNR meerlingen 2005 Opname 1 2 3 4 5 Totaal
Aantal records 2.594 744 213 40 5 3.596
Aantal kinderen 2.594 372 71 10 1 3.048
% aantal records 72,1% 20,7% 5,9% 1,1% 0,1% 100,0 %
§2.3 Koppeling niet-gekoppelde LNR eenlingen ^ meerlingen Het niet-gekoppelde LNR eenlingbestand (28.165 records) wordt gekoppeld met het nietgekoppelde LNR meerlingbestand (2.594 records). Met blocking op geboortedatum kind en met blocking op postcode moeder worden in dit jaar geen extra paren gevonden.
Pagina 20 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Figuur 2B Flowchart LNR ^ LNR meerlingkoppeling
Pagina 21 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Hoofdstuk 3 Koppeling LVR1 ^ LVR2 Het doel van de LVR1 ^ LVR2 koppeling is het koppelen van LVR1 records en LVR2 records die bij dezelfde zwangerschap horen. De LVR1 ^ LVR2 koppeling wordt voor eenlingen en meerlingen afzonderlijk uitgevoerd. De methodiek van de koppelingen is een probabilistische koppeling op basis van 10 variabelen, met blocking op geboortedatum moeder en vervolgens op postcode moeder.
§3.1 Koppeling LVR1 ^ LVR2 eenlingen Het opgeschoonde LVR1 bestand wordt ingelezen (170.251 records). Uit dit bestand worden de eenlingrecords geselecteerd (165.489 records). Het opgeschoonde LVR2 bestand wordt ingelezen (118.459 records). Uit dit bestand worden de eenlingrecords geselecteerd (111.463 records). Zie figuur 3A voor een flowchart van de LVR1^LVR2 eenlingkoppeling. Het LVR1 en LVR2 bestand worden probabilistisch gekoppeld met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (3.006.256 paren). Voor de koppeling worden de volgende 11 variabelen vergeleken (zie Tabel 3.1): postcode (geboortedatum moeder bij blocking op postcode), graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur, plaats bevalling en geboorte minuut. Voor de variabelen geboortedatum kind, à terme datum en geboortegewicht worden naast een full match ook een close gedefinieerd. Bij geboortedatum kind is er sprake van een close als de geboortedatum niet meer dan 1 dag verschilt. Bij à terme datum is er sprake van een close als de à terme datum niet meer dan 1 week verschilt. Bij gewicht is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 10 gram. De à terme datum wordt alleen vergeleken als de geboortedatum van het kind ontbreekt. De plaats bevalling wordt alleen vergeleken als de postcode van de moeder ontbreekt of niet overeenkomt. Tabel 3.1 Frequentietabel koppelvariabelen LVR1 ^ LVR2 eenlingen 2005 Variabele label LVR1 (n=170.251) Ziekenhuisnummer bevalling* Gewicht kind* Geboorte uur kind* Geboortedatum kind* À terme datum Geslacht kind* Geboorte minuut* Plaats bevalling* Postcode moeder (4 cijfers) Graviditeit Geboortedatum moeder
Variabele naam
Aantal missend
% Missend
v_klin v_kop_gew v_gebuur v_ddgebkind v_ddaterm v_kop_gesl v_gebmin v_pltsbev v_kop_pc v_grav v_ddgebmoe
63.102 22.042 21.898 21.883 19.462 22.133 21.898 19.442 378 65 0
38% 13% 13% 13% 13% 12% 12% 12% 0,23% <0,1%
LVR2 (n=111.463) Postcode moeder (4 cijfers) Geslacht kind Gewicht kind À terme datum Geboorte minuut Graviditeit Geboortedatum moeder Geboortedatum kind Geboorte uur kind Lvr-nummer praktijk Plaats bevalling
g_kop_pc g_kop_gesl g_kop_gew g_ddaterm g_gebmin g_grav g_ddgebmoe g_ddgebkind g_gebuur g_lvr g_pltsbev
1212 211 134 52 4 2 0 0 0 0 0
1% 0,19% 0,12% <0,1% <0,1% <0,1%
*Missend is hier soms het gevolg van het terecht (logisch) ontbreken van informatie, een hoog missing percentage betekent in deze gevallen dus niet een op voorhand lage data kwaliteit.
Pagina 22 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Inlezen LVR 1 2005 bestand Z :\ Jaarbestand \ SAS jaar \Gekoppelde bestanden \2005 \ lvr 1 _ opgeschoond .sas 7 bdat
Inlezen LVR 2 2005 bestand Z :\Jaarbestand \SAS jaar \Gekoppelde bestanden \2005 \lvr 2_ opgeschoond .sas 7 bdat
LVR 1 2005 bestand 170 . 251 records
LVR 2 2005 bestand 118 .459 records
LVR 1 2005 meerlingbestand 4 . 762 records
LVR 2 2005 meerlingbestand 6 .99 6 records LVR 1 2005 eenlingrecords 165 . 489 records
LVR 2 2005 eenlingrecords 111 .463 records Blocking op geboortedatum moeder LVR 1 ^ LVR 2 links 3.006 .256 paren
Niet gekoppelde LVR eenlingrecords 79 .930 records
1
LVR 1 ^ LVR 2 paren boven afkappunt 85 .583 paren
LVR 1 records niet gekoppeld 213 records
LVR 1 Administratieve dubbeltellingen 8 28 records
Niet gekoppelde LVR eenlingrecords 26 .924 records
Oplossen ties 105 3 clusters 21 20 paren
LVR 1 ^ LVR 2 matches Na oplossen ties 1055 paren
2
LVR 2 records niet gekoppeld 21 records
LVR 1 ^ LVR 2 matches Niet in de clusters 83 .463 paren
LVR 2 administratieve dubbeltellingen 0 records
LVR 1 ^ LVR 2 matches 8 4.518 paren Niet gekoppelde LVR eenlingrecords 80 .143 records
1
Niet gekoppelde LVR eenlingrecords 26 .945 records
2
Blocking op postcode moeder LVR 1 ^ LVR 2 links 804 .707 paren
Niet gekoppelde LVR eenlingrecords 79 .631 records
1
Niet gekoppelde LVR eenlingrecords 26 .433 records
LVR 1 ^ LVR 2 paren boven afkappunt en geboortedatum moeder ongelijk 512 paren
LVR 1 records niet gekoppeld 1 records
Niet gekoppelde LVR 1 records uit 2004 6 . 295 records
LVR 2 records niet gekoppeld 1 record
Oplossen ties 1 cluster 2 paren
LVR 1 ^ LVR 2 matches Na oplossen ties 1 paren
2
LVR 1 ^ LVR 2 matches Niet in de clusters 510 paren
Blocking op postcode moeder LVR 1 ^ LVR 2 matches 511 paren
Niet gekoppelde LVR 1 eenlingrecords 73 .337 records
LVR 1 ^ LVR 2 matches 85.029 paren
Niet gekoppelde LVR 2 eenlingrecords 26 .434 records
LVR 1 ^LVR 2 gekoppeld eenlingbestand 184 .800 records
Opslaan gekoppeld lvr 1 ^lvr 2 2005 eenlingbestand Z :\ Jaarbestand \SAS jaar \gekoppelde bestanden \2005 \ lvr 1 _lvr 2 _2005 _singleton . sas 7bdat
Figuur 3A Flowchart LVR1 ^ LVR2 eenlingkoppeling
Pagina 23 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Tabel 3.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de ui en mi waarden. De ui waarden zijn berekend op basis van de randtotalen en de mi waarden op basis van fitting met een non-lineaire procedure. Tabel 3.2 Gewichten koppelvariabelen LVR1 ^ LVR2 eenlingen 2005 Variabele Postcode (4 cijfers) Geboortedatum kind (full) Geboortedatum kind (± 1dg) À terme datum (full) À terme datum (± 7 dgn) Gewicht kind (full) Gewicht kind (± 10 gr) Plaats bevalling Geboorte minuut Geboorte uur kind Graviditeit Geslacht kind
mi waarden 0,9635 0,9740 0,0199 0,9210 0,0700 0,9443 0,0171 0,9101 0,9350 0,9754 0,9488 0,9941
ui waarden 0,0006 0,0029 0,0056 0,0027 0,0373 0,0035 0,0102 0,0075 0,0177 0,0424 0,3121 0,5003
Gewicht bij ’agreement’ 10,54 8,42 1,83 8,41 0,91 8,07 0,75 6,92 5,72 4,52 1,60 0,99
Gewicht bij ’disagreement’ -4,78 -7,34 nvt -6,74 nvt -4,68 nvt -3,46 -3,92 -5,28 -3,75 -6,40
Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht men 0,0290 * 3.006.256 = 87.181 matches te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 13,0 gekozen en worden 85.583 paren geselecteerd als match. Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 83.463 paren die uniek gekoppeld zijn en 2.120 paren die in de clusters terecht komen (1.041 clusters met 2 paren, 10 clusters met 3 paren en 2 met 4 paren). De clusters worden bekeken. Er is besloten om 828 LVR1 records zonder kind informatie de zogenaamde ‘losse zwangerschaps’ records te verwijderd omdat het andere LVR1 ^ LVR2 record cluster paar meer informatiebevat over dezelfde vrouw en kind. Deze records worden in een los bestand weggeschreven. Vervolgens wordt van iedere cluster het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 1.055 paren geselecteerd als match en bestaat het totale gematchte bestand uit 84.518 recordparen (83.463 + 1.055). De gekoppelde LVR1 records worden verwijderd uit het LVR1 eenlingbestand dat daarna nog bestaat uit 80.971 records (165.489 – 84.518). Vervolgens worden ook nog de LVR1 ‘losse zwangerschapsrecords’ (828) verwijderd en bestaat het LVR1 eenling restbestand uiteindelijk uit 80.143 records. De gekoppelde LVR2 records worden verwijderd uit het LVR2 eenlingrestbestand, dat daarna nog bestaat uit 26.945 records (111.463 – 84.518). Deze restbestanden worden vervolgens gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode moeder overeenkomt worden aangemaakt (1.146.144 paren). Paren boven het afkappunt van 14,5 en waarbij de geboortedatum van de moeder niet overeenkomt worden geselecteerd (512 paren). Er worden clusters aangemaakt, waarvan alleen het paar met het hoogste gewicht wordt geselecteerd. Er worden dus 511 extra paren gevonden met blocking op postcode moeder. Het totale aantal matches is 84.518 + 511 = 85.029 paren na deze tweede koppelingsronde. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR1 eenlingbestand, dat nu nog uit 79.632 records bestaat (80.143 – 511). Uit dit bestand worden de extra toegevoegde 6.295 LVR1 records uit 2004 verwijderd die niet gekoppeld zijn aan een LVR2 record van 2005, waardoor het niet-gekoppelde LVR1 bestand bestaat uit 73.337 records. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR2 eenlingbestand, dat nu nog uit 26.434 records bestaat (26.945 – 511). Het totale gekoppelde LVR1^LVR2 eenlingbestand bestaat uit de niet-gekoppelde LVR1 records (73.337), de gekoppelde LVR1^LVR2 records (85.029) en de niet-gekoppelde LVR2 records (26.434). Het gekoppelde eenlingbestand bestaat uit 184.800 records en wordt weggeschreven naar: …\2005\lvr1_lvr2_2005_singleton.sasb7dat. Pagina 24 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
§3.2 Koppeling LVR1 ^ LVR2 meerlingen De meerlingrecords worden geselecteerd uit het opgeschoonde LVR1 bestand (4.762 records). De meerlingrecords worden geselecteerd uit het opgeschoonde LVR2 bestand (6.996 records). Zie figuur 3B voor een flowchart van de LVR1 ^ LVR2 meerlingkoppeling. De meerlingkoppeling wordt op dezelfde manier uitgevoerd als de eenlingkoppeling, alleen wordt er nu ook gekeken naar de LVR1, LVR2 variabelen meerlingcode en omvang meerling. De ui en mi waarden die op basis van het eenlingbestand LVR1^LVR2 zijn berekend worden ook hier bij de meerlingkoppeling gebruikt. Alle paren waarbij de geboortedatum van de moeder hetzelfde is, worden aangemaakt (14.499 paren). Alle paren boven het afkappunt van 13.02 waarbij de meerlingcode en omvang meerling overeenkomen of de meerlingcode en omvang meerling beide 1 zijn, worden geselecteerd als match (4.171 paren). Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 3.868 paren die uniek gekoppeld zijn en 303 paren die in de clusters terecht komen. De clusters worden bekeken en administratieve dubbeltellingen worden alsnog verwijderd. (44 LVR1 records). Hier geldt dat records worden beschouwd als administratieve dubbeltelling, als het een ‘los zwangerschaprecord’ betreft of als geen enkele vector niet overeenkomt (waarde 0 heeft). Vervolgens wordt van iedere cluster het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 202 paren geselecteerd als match en bestaat het totale match bestand uit 4.070 recordparen. Er komen 50 dubbele LVR1 records voor in het bestand. LVR1 records met omvang meerling “1” zijn e meegenomen als meerling als de reden verwijzing naar de 2 lijn een meerlingzwangerschap was. Dit LVR1 record is aan beide LVR2 records van deze meerling gekoppeld en komt daardoor dubbel voor in het gekoppelde bestand. De gekoppelde LVR1 records worden verwijderd uit het LVR1 meerlingbestand dat nu nog bestaat uit 698 records (4.762 – 4.020 – 44). De gekoppelde LVR2 records worden verwijderd uit het LVR2 meerlingbestand dat nu nog bestaat uit 2.926 records (6.996 – 4.070). Deze bestanden worden vervolgens gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode moeder overeenkomt worden aangemaakt (1.591 paren). Paren boven het afkappunt van 15.0 en waarbij de geboortedatum van de moeder niet overeenkomt en bovendien de meerlingcodes gelijk zijn of beide 1, worden geselecteerd (28 paren). Er is één cluster. Na selectie van het recordpaar met hoogste gewicht zijn er 27 extra paren gevonden met blocking op postcode moeder. Het totale aantal matches is 4.070 + 27 = 4.097 paren. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR1 meerlingbestand, dat nu nog uit 671 records bestaat (698 - 27). Uit dit bestand worden de 97 records uit 2004 verwijderd, waardoor het niet-gekoppelde LVR1 meerlingbestand bestaat uit 574 records. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR2 meerlingbestand, dat nu nog uit 2.899 records bestaat (2.926 - 27). Het totale gekoppelde LVR1^LVR2 meerlingbestand bestaat uit de niet-gekoppelde LVR1 records (574), de gekoppelde LVR1^LVR2 records (4.097) en de niet-gekoppelde LVR2 records (2.899). Het gekoppelde bestand bestaat uit 7.570 records en wordt weggeschreven naar: ….\2005\lvr1_lvr2_2005_meerling.sas7bdat.
Pagina 25 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Inlezen LVR1 2005 bestand Z:\ Jaarbestand\SAS jaar \Gekoppelde bestanden\2005\ lvr1_ opgeschoond.sas7bdat
Inlezen LVR2 2005 bestand Z:\Jaarbestand\SAS jaar\Gekoppelde bestanden\2005\lvr2_opgeschoond.sas7 bdat
LVR1 2005 bestand 170. 251 records
LVR2 2004 bestand 118.459 records
LVR1 2004 eenlingbestand 1 65. 489 records
LVR2 2004 eenlingbestand 111 .463 records LVR1 2004 meerlingrecords 4.762 records
LVR2 2004 meerlingrecords 6.996 records Blocking op geboortedatum moeder LVR1 ^ LVR2 links 14.499 paren
Niet gekoppelde LVR1 meerlingrecords 591 records
LVR1 ^ LVR2 paren boven afkappunt 4.171 paren
LVR1 records niet gekoppeld 107 records
LVR1 Administratieve dubbeltellingen 44 records
Oplossen ties 129 clusters 303 paren
LVR1 ^ LVR2 matches Na oplossen ties 202 paren
Niet gekoppelde LVR2 meerlingrecords 2.825 records
LVR2 records niet gekoppeld 101 records
LVR1 ^ LVR2 matches Niet in de clusters 3.868 paren
LVR1 ^ LVR2 matches 4.070 paren Niet gekoppelde LVR1 meerlingrecords 698 records
Niet gekoppelde LVR2 meerlingrecords 2.926 records Blocking op postcode moeder LVR1 ^ LVR2 links 1.591 paren
Niet gekoppelde LVR1 meerlingrecords 671 records
Niet gekoppelde LVR2 meerlingrecords 2.899 records
LVR1 ^ LVR2 paren boven afkappunt en geboortedatum moeder ongelijk 27 paren
Blocking op postcode moeder LVR1 ^LVR2 matches 27 paren Niet gekoppelde LVR1 records uit 2004 97 records
Niet gekoppelde LVR1 meerlingrecords 574 records
LVR1 ^ LVR2 matches 4.097 paren
Niet gekoppelde LVR2 meerlingrecords 2.899 records
LVR1^LVR2 gekoppeld meerlingbestand 7.570 records
Opslaan gekoppeld lvr1^lvr2 2005 meerlingbestand Z:\ Jaarbestand\SAS jaar\gekoppelde bestanden\2005\ lvr1_lvr2_2005_meerling.sas7bdat
Figuur 3B Flowchart LVR1 ^ LVR2 meerlingkoppeling
Pagina 26 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
§3.3 Koppeling niet-gekoppelde LVR1 eenlingen met LVR2 meerlingen Het niet-gekoppelde LVR1 eenlingbestand (73.337 records) wordt gekoppeld met het nietgekoppelde LVR2 meerlingbestand (2.899 records). Bij blocking op geboortedatum moeder worden 70 paren gevonden boven het afkappunt van 22,85. Na het oplossen van de clusters worden 64 paren geselecteerd als match. Blocking op postcode moeder levert geen extra paren.
§3.4 Koppeling niet-gekoppelde LVR1 meerlingen met LVR2 eenlingen Het niet-gekoppelde LVR1 meerlingbestand (574 records) wordt gekoppeld met het nietgekoppelde LVR2 eenlingbestand (26.434 records). Bij blocking op geboortedatum moeder worden 29 paren gevonden boven het afkappunt van 20. Blocking op postcode moeder levert geen extra paren.
§3.5 Creatie LVR1^LVR2 eindbestand Uit het LVR1^LVR2 eenling eindbestand (184.800 records) worden de records verwijderd die nog gekoppeld zijn bij de koppeling van niet-gekoppelde eenlingen met meerlingen (93 paren). Het LVR1^LVR2 eenling eindbestand bestaat uit 184.707 records. De gevonden matches bij de koppeling van niet-gekoppelde eenlingen met meerlingen worden toegevoegd aan het meerling eindbestand (93 paren). Tevens worden de records die nog gekoppeld zijn, verwijderd uit het meerling eindbestand (93 records). Het LVR1^LVR2 meerling eindbestand bestaat uit 7.570 records (zie tabel 3.3).
Tabel 3.3 Overzicht van de LVR1 ^ LVR2 koppeling 2005
Geschoond bestand LVR1 eenling LVR2 eenling LVR^LVR2 eenling
Begin 165.489 111.463
LVR1 meerling LVR2 meerling LVR1^LVR2 meerling
4.762 6.996
Eind
184.707
7.570
Pagina 27 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Hoofdstuk 4 Koppeling (LVR1 ^ LVR2) ^ LNR Het doel van de (LVR1 ^ LVR2) ^ LNR koppeling is het koppelen van LVR12 records en LNR records die bij dezelfde moeder en kind horen voor eenlingen en meerlingen. De methodiek van de koppelingen is een probabilistische koppeling op basis van 7 variabelen, met blocking op geboortedatum kind en vervolgens op postcode moeder.
§4.1 Koppeling (LVR1 ^ LVR2) ^ LNR eenlingen Het gekoppelde LVR12 eenlingbestand (184.707 records) en het gekoppelde LNR eenlingbestand (33.039 records) wordt ingelezen. Uit het gekoppelde LNR bestand wordt van ieder kind maar één record geselecteerd (30.338 records). Zie figuur 4A voor een flowchart van de (LVR1^LVR2)^LNR eenlingkoppeling. Het LVR12 en LNR bestand worden probabilistisch gekoppeld met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (14.490.859 paren). Voor de koppeling worden de volgende 7 variabelen vergeleken (zie Tabel 4.1): postcode (geboortedatum kind bij blocking op postcode), geboortedatum moeder, zwangerschapsduur in weken, gewicht, geslacht en Apgarscore na 5 minuten. Voor de variabele geboortegewicht wordt naast een full match ook een close gedefinieerd: er is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 20 gram. Tabel 4.1 Frequentietabel koppelvariabelen LVR12 ^ LNR eenlingen Variabele label LVR12 (n=184.707) Zwangerschapsduur in weken Geslacht kind Apgarscore na 5 minuten Gewicht kind Geboortedatum kind Postcode moeder (4 cijfers) Geboortedatum moeder LNR (n=33.039) Geboortedatum moeder Apgarscore na 5 minuten Postcode moeder (4 cijfers) Gewicht kind Geboortedatum kind Zwangerschapsduur in weken Geslacht kind
Variabele naam
Aantal missend
% Missend
vg_amwk vg_gesl vg_apg vg_gew vg_ddgebkind vg_pc vg_ddgebmoe
14.301 13.313 13.290 13.151 13.037 460 0
7,7% 7,2% 7,2% 7,1% 7,1% 0,3%
n_ddgebmoe n_apg n_pc n_gew n_ddgebkind n_amww n_gesl
3.335 1.501 288 259 0 0 0
11,0% 5,0% 1,0% 0,9%
Pagina 28 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Figuur 4A Flowchart (LVR1 ^ LVR2) ^ LNR eenlingkoppeling
Pagina 29 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Tabel 4.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de ui en mi waarden. De ui waarden zijn berekend op basis van de randtotalen en de mi waarden op basis van fitting met een non-lineaire procedure. Tabel 4.2 Gewichten koppelvariabelen LVR12 ^ LNR eenlingen blocking op geboortedatum kind Variabele Geboortedatum moeder Postcode moeder Gewicht kind (full) Gewicht kind (± 20 gr) Zwangerschapsduur in weken Geslacht kind Apgarscore na 5 minuten
mi waarden 0,9789 0,9697 0,8990 0,0516 0,9562 0,9877 0,8914
ui waarden 0,000164 0,000538 0,00282 0,0173 0,1533 0,5009 0,4707
Gewicht bij ’agreement’ 12,54 10,81 8,31 1,58 2,64 0,98 0,92
Gewicht bij ’disagreement’ -5,57 -5,04 -5,46 nvt -4,31 -5,34 -2,29
Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht men 0.00205 * 14.490.859 = 29.706 matches te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 7,7 gekozen en worden 29.325 paren geselecteerd als match. Zie figuur 4B voor de verdeling van de links rond het afkappunt. 2500
2000
C o u n t
1500
1000
500
0 2 .4
4.8
7.2
9.6
12
14 .4
16.8
19.2
21.6
24
26 .4
28.8
wgtt ot
Figuur 4B LVR1^LVR2^LNR paren met blocking geboorte datum moeder Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder overeenkomt (3.010.658 paren). Paren boven het afkappunt van 7,7 en waarbij de geboortedatum van het kind niet overeenkomt, worden geselecteerd (211 paren). Het totale matchbestand bestaat nu uit 29.536 records. Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 28.465 paren die uniek gekoppeld zijn en 1.071 paren die in de clusters terecht komen. Vervolgens worden van iedere cluster de recordparen met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 535 paren geselecteerd als match en bestaat het totale matchbestand uit 29.000 recordparen (28.465 + 535). De gekoppelde LVR12 records worden verwijderd uit het LVR12 eenlingbestand dat nu nog bestaat uit 155.707 records (184.707 – 29.000). De gekoppelde LNR records worden verwijderd uit het LNR eenlingbestand dat nu nog bestaat uit 1.338 records (30.338 – 29.000). Pagina 30 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Het totale gekoppelde LVR12^LNR eenlingbestand bestaat uit de niet-gekoppelde LVR12 records (155.707), de gekoppelde LVR12^LNR records (29.000) en de niet-gekoppelde LNR records (1.338). Het gekoppelde eenlingbestand bestaat uit 186.045 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2005\lvr1_lvr2_lnr_singleton.sasb7dat
§4.2 Koppeling LVR12 ^ LNR meerlingen Het gekoppelde LVR12 meerlingbestand (7.570 records) en het gekoppelde LNR meerlingbestand (3.596 records) wordt ingelezen. Uit het gekoppelde LNR bestand wordt van ieder kind maar één record geselecteerd (3.048 records). Zie figuur 4B voor een flowchart van de LVR12 ^ LNR meerlingkoppeling. De meerlingkoppeling wordt op dezelfde manier uitgevoerd als de eenlingkoppeling, alleen wordt er nu ook gekeken naar de meerlingcode en omvang meerling. De ui en mi waarden die op basis van het eenlingbestand zijn berekend worden ook hier gebruikt. Alle paren waarbij de geboortedatum van het kind hetzelfde is, worden aangemaakt (70.760 paren). Het afkappunt van de eenlingkoppeling wordt aangehouden. Alle paren met een totaalgewicht groter of gelijk aan 14,8 en waarbij ofwel de meerlingcode en omvang meerling overeenkomen, ofwel deze codes gelijk zijn aan ‘1’, worden geselecteerd als match (2.754 paren). Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder overeenkomt (19.945 paren). Paren boven het afkappunt van 14,8 waarbij de geboortedatum van het kind niet overeenkomt, de meerlingcode en omvang meerling overeenkomen, ofwel gelijk zijn aan ‘1’, worden geselecteerd (27 paren). Het totale match bestand bestaat nu uit 2.781 paren. Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 2.603 paren die uniek gekoppeld zijn en 178 paren die in de clusters terecht komen (89 clusters). Van iedere cluster worden de recordparen met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 89 paren geselecteerd als match en bestaat het totale match bestand uit 2.692 (2.603 + 89) recordparen. De gekoppelde LVR12 records worden verwijderd uit het LVR12 meerlingbestand dat nu nog bestaat uit 4.878 records (7.570 – 2.692). De gekoppelde LNR records worden verwijderd uit het LNR meerlingbestand dat nu nog bestaat uit 356 records (3.048 – 2.692). Het totale gekoppelde LVR12^LNR meerlingbestand bestaat uit de niet-gekoppelde LVR12 records (4.878), de gekoppelde LVR12^LNR records (2.692) en de niet-gekoppelde LNR records (356). Het gekoppelde bestand bestaat uit 7.926 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2005\lvr1_lvr2_lnr_2005_meerling.sasb7dat
§4.3 Koppeling niet-gekoppelde LVR12 eenlingen met LNR meerlingen Het niet-gekoppelde LVR12 eenlingbestand (155.707 records) wordt gekoppeld met het nietgekoppelde LNR meerlingbestand (356 records). Bij blocking op geboortedatum kind worden 15 matches gevonden boven het afkappunt van 9. Geen van deze paren zitten in clusters. Blocking op postcode moeder levert geen extra paren op. In totaal zijn er dus 15 matches.
§4.4 Koppeling niet-gekoppelde LVR12 meerlingen met LNR eenlingen Het niet-gekoppelde LVR12 meerlingbestand (4.878 records) wordt gekoppeld met het nietgekoppelde LNR eenlingbestand (1.338 records). Bij blocking op geboortedatum kind worden 294 matches gevonden boven het afkappunt van 14.8. Blocking op postcode moeder levert nog 3 extra paren. Van deze in totaal 297 paren zijn er 169 uniek en 128 die in een cluster zitten. Oplossen van de clusters levert 63 extra paren. Er zijn in totaal dus 232 matches.
Pagina 31 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Figuur 4C Flowchart (LVR1 ^ LVR2) ^ LNR meerlingkoppeling
Pagina 32 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
§4.5 Creatie eindbestand (LVR1 ^ LVR2) ^ LNR De extra gevonden matches bij de koppeling van niet-gekoppelde eenlingrecords met meerlingrecords (247 paren) worden verwijderd uit het LVR12^LNR eenling eindbestand (186.045 records). Het LVR12^LNR 2005 eenling eindbestand bestaat uit 185.798 records. De extra gevonden matches bij de koppeling van niet-gekoppelde eenlingrecords met meerlingrecords (247 paren) worden toegevoegd aan het meerlingbestand (7.926 records). Tevens worden de records die nu nog gekoppeld zijn, verwijderd uit het meerling eindbestand. Het LVR12^LNR 2005 meerling eindbestand bestaat uit 7.926 records. Het eenling eindbestand en het meerling eindbestand vormen samen het totale eindbestand van de 2005 koppeling. Dit PRN gekoppeldbestand 2005 bestaat uit 193.724 records (zie tabel 4.3). Als laatste stap wordt het gekoppelde LVR12^LNR eenlingen gecombineerd met het bestand met de niet-gekoppelde LVR12 meerlingen plus de niet-gekoppelde LNR eenlingen. Dit wordt daarna gecombineerd met het bestand met de niet-gekoppelde LVR12 eenlingen plus het niet-gekoppelde LNR meerlingen. Dubbele (eenling) records worden verwijderd uit het gekoppelde eenlingbestand. Dit wordt beschouwd als het definitieve eenlingbestand. Dit proces wordt herhaald voor het gekoppelde meerlingbestand. Het definitieve gekoppelde PRN LVR12^LNR 2005 bestand is de combinatie van de definitieve eenling en de definitieve meerling bestanden. Zie figuur 4D.
Tabel 4.3 Overzicht van de LVR1 ^ LVR2^LNR koppeling 2005
Geschoond bestand LVR1^LVR2 eenling LNR eenling LVR1^LVR2^LNR eenling LVR1^LVR2 meerling LNR meerling LVR1^LVR2^LNR meerling
Begin 184.707 30.338
Eind
185.798 7.570 3.596 7.926
LVR1^LVR2^LNR totaal
193.724
Pagina 33 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Inlezen LVR12^LNR 2005 LVR12 niet-gekoppelde meerling / LNR niet-gekoppelde eenling bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden lnvr1nkmrl_lnrnksing_2005sas7bdat
Inlezen LVR12^LNR 2005 LVR12 niet-gekoppelde eenling/ LNR niet-gekoppelde meerling bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden lnvr1nksing_lnrnkmeer_2005sas7bdat
232 records
15 records
Inlezen LVR12^LNR 2005 gekoppelde eenling bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden lnvr1_lvr2_lnr_2005_singleton.sas7bdat
247 records
Alle eenlingrecords 185.798
186.045 records
Verwijder dubbel records
Geschoonde finale eenlingbestand
Opslaan finale LVR 12^LNR eenlingbestand Z:\Jaarbestand\ SAS jaar\gekoppelde bestanden\2005\ Lvr12_lnr_singleton_2005_final. sas7bdat
Figuur 4D Flowchart aanmaken finale eenlingbestand
Pagina 34 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Hoofdstuk 5 PRN jaar 2005 bestanden §5.1 Beschrijving eindbestanden Als product van het PRN koppelingsproject 2005 wordt het totale gekoppelde bestand LVR1^LVR^LNR 2005 opgeleverd aan de Stichting PRN. Het totale gekoppelde bestand wordt aangeleverd in twee delen: het “LVR1 LVR2 LNR 2005 versie 1.0.sas7bdat” bestand (1e opname in LRN) en het “LNR LNR 2005 versie 1.0.sas7bdat” bestand met alle opnames van hetzelfde kind bij elkaar. Een beschrijving van alle variabelen die in het aangeleverde gekoppelde bestand voorkomen, wordt gegeven aan het einde van dit document. Naam bestand LVR1_LVR2_LNR_2005 LNR_LNR_2005
Versienummer Versie 1.0 Versie 1.0
Datum bestand 24 april 2007 24 april 2007
Records 193.724 36.635
Het totale gekoppelde PRN bestand 2005 (LVR1^LVR2^(LNR 1e opname) bestaat uit 193.724 records en 427 variabelen. Het totale gekoppelde LNR 2005 bestand (met alle LNR opnames) bestaat uit 36.635 records en 179 variabelen. Deze bestanden zijn gemaakt in SAS en zijn geconverteerd naar ASCII formaat en worden aan de PRN geleverd in twee formaten. Het SAS bestanden bevat ook label informatie over de variabelen (zie appendix 1).
Een aantal variabelen werd gedefineerd voor het koppelen. Deze variabels zijn (o.a): LVR1 registratie: - v_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LVR1 record. - v_admin1 is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de eerste administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - v_admin2 is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de tweede administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - v_admin3 is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de derde administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - v_admin4 is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de vierde administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. LVR2 registratie: - g_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LVR2 record. - g_admin1 is de door LinKID aangemaakte recordidentificatie van het LVR2 record, dat de eerste administratieve dubbeltelling van het in de zesde kolom (g_recid) gedefinieerde LVR2 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - g_admin2 is de door LinKID aangemaakte recordidentificatie van het LVR2 record, dat de tweede administratieve dubbeltelling van het in de zesde kolom (g_recid) gedefinieerde LVR2 record is. Deze administratieve dubbeltelling is door LinKID
Pagina 35 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. LNR registratie: - n_recid1 is de door LinKID aangemaakte recordidentificatie van het LNR record. - n_admin1 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de negende kolom (n_recid1) gedefinieerde LNR record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde opname van een kind twee keer geteld zou worden. - n_recid2 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een tweede opname is van het kind waarvan het in de negende kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin2 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de elfde kolom (n_recid2) gedefinieerde LNR record is. - n_recid3 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een derde opname is van het kind waarvan het in de negende kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin3 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de dertiende kolom (n_recid3) gedefinieerde LNR record is. - n_recid4 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een vierde opname is van het kind waarvan het in de negende kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin4 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de vijtiende kolom (n_recid4) gedefinieerde LNR record is. - n_recid5 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een vijfde opname is van het kind waarvan het in de negende kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin5 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de zeventiende kolom (n_recid5) gedefinieerde LNR record is.
§5.2 Toegevoegd variabelen Een aantal variabelen zijn toegevoegd aan het gekoppelde bestand. Variabelen die gedefineerd zijn binnen het LVR1 bestand hebben het voorvoegsel “v_”, variabelen gedefineerd binnen het LVR2 bestand hebben het voorvoegsel “g_” en die binnen LNR hebben het voorvoegsel “n_”. Sommige variabelen zijn ook gebruikt om de koppeling uit te voeren. Dit wordt ook aangegeven met het tussenvoegsel “kop”. Er is ook een klein aantal variabelen toegevoegd die gebruikt worden op het gekoppelde bestand. Ze hebben het voorvoegsel “l_” (LINKID variabelen). Hieronder is een tabel met de namen van de variabelen, hun definitie en hun eigenschappen. Variabelen zonder definitie zijn direct gelezen van de brondata (LVR1, LVR2, LNR).
Pagina 36 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Bron LVR1
Naam v_recid v_ddgebmoe v_ddgebkind v_ddaterm v_dat1ond v_datvlies v_datovdr v_pariteit
Beschrijving recordidentificatie geboortedatum moeder geboortedatum kind a terme datum datum 1e onderzoek datum breken vliezen datum overdracht pariteit
v_kop_par v_multipari
pariteit (koppelvariabel) multipariteit (j/n)
v_amddd
amenorroeduur in dagen
v_amwww v_kop_amd v_kop_gesl
amenorroeduur in weken amenorroeduur in dagen (koppelvariabel) geslacht (koppelvariabel)
v_kop_omv
meerling (j/n) (koppelvariabel)
v_kop_gew
v_lft_link
geboortegewicht kind (koppelvariabel) kind overleden in 1e of 2e lijn (koppelvariabel) postcode (koppelvariabel) eerste twee cijfers postcode (koppelvariabel) leeftijd moeder
v_kop_uur g_recid
v_kop_mort v_kop_pc v_kop_pc2
LVR2
Definitie v<jaar>_
Verschil tussen graviditeit en aantal abortussen (gelijk aan graviditeit als aantal abortussen missend) gelijk aan pariteit =1 als pariteit>=2 =0 als pariteit=1 280 + verschil tussen geboortedatum en a terme datum amenorroeduur gedeeld door 7 gelijk aan amenorroeduur in dagen
Type string datum datum datum datum datum datum integer
Range
integer binair
0/1
integer
84-329
continu integer
12-47
=1 jongen =2 meisje =0 als kind eenling is =1 als kind een van een meerling is gelijk aan geboortegewicht kind
integer
=0 als kind niet overleden =1 als kind overleden gelijk aan postcode gelijk aan eerste twee letters postcode
integer integer integer
1000-9999 10-99
gelijk aan leeftijd moeder
integer
11-60
geboorteuur kind (koppelvariabel)
gelijk aan geboorteuur kind
integer
0-24
recordidentificatie
g<jaar>_
string
Pagina 37 van 59
binair
0/1
continu
200-6000gm
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
LNR
g_ddgebmoe g_ddgebkind g_ddaterm g_ddvorkin g_dat1ond g_ddontsl g_pariteit
geboortedatum moeder geboortedatum kind a terme datum datum vorige bevalling datum 1e onderzoek ontslagdatum pariteit
g_kop_par g_multipari
Pariteit (koppelvariabel) multipariteit (j/n)
g_amddd
amenorroeduur in dagen
g_amwww g_kop_amd g_kop_gesl
amenorroeduur in weken amenorroeduur in dagen (koppelvariabel) geslacht, koppelvariabel
g_kop_omv
meerling (j/n), koppelvariabel
g_kop_pc g_kop_pc2 g_lft_link
postcode, koppelvariabel eerste twee cijfers postcode, koppelvariabel leeftijd moeder
g_kopovern_var
overgenomen uit 1e lijn (j/n)
g_kop_mort
kind overleden in 1e of 2e lijn
g_kop_uur
geboorteuur kind, koppelvariabel
n_recid n_ddgebkind n_ddgebmoe
recordidentificatie geboortedatum kind geboortedatum moeder
Verschil tussen graviditeit en aantal abortussen (gelijk aan graviditeit als aantal abortussen missend) gelijk aan pariteit =1 als pariteit>=2 =0 als pariteit=1 280 + verschil tussen geboortedatum en a terme datum amenorroeduur gedeeld door 7 gelijk aan amenorroeduur
datum datum datum datum datum datum integer
0-20
integer integer integer
84-329
continu integer
12-47
binair
1/2
=1 jongen =2 meisje =0 als kind eenling is =1 als kind een van een meerling is gelijk aan postcode gelijk aan eerste twee letters postcode
binair
0/1
integer integer
1000-9999 10-99
gelijk aan leeftijd moeder
integer
11-60
=1 als overgenomen =0 als niet overgenomen =0 als kind niet overleden =1 als kind overleden gelijk aan geboorte uur kind
Integer
n<jaar>_
string datum datum
Pagina 38 van 59
integer integer
0-24
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
LINKID
n_ddopname n_dd1000gram n_ddontslag
opnamedatum datum 1000g ontslagdatum
l_her
(her)opnamenummer
l_kindovl
kind overleden in de LNR (j/n, ongeacht in welke heropname) Identificatienummer LINKID
l_kind
datum datum datum =1 1e opname =2e opname of 1e heropname =1 als kind is overleven =0 als kind is niet overleden
integer integer String
Pagina 39 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
§5.3 Mogelijke dubbeltelling Bij het aanmaken van het gekoppelde LVR1 bestand zijn een aantal records uit het voorafgaande jaar ingelezen als kandidaten voor koppeling met records uit het LVR1 bestand. Niet gekoppelde records van het voorafgaande jaar zijn verwijderd van het ‘huidige’ LVR1 bestand maar zijn niet verwijderd van het oudere bestand. Het is dus mogelijk dat sommige records zijn geteld zowel in het LVR1 bestand van een betreffende jaar als in het LVR1 bestand van het voorgaande jaar. Bij gebruik van de gekoppelde bestanden over meerdere jaren moet hiermee rekening worden gehouden.
§5.4 Controles op het gekoppelde PRN bestand De volgende controles zijn uitgevoerd op het gekoppelde PRN bestand: 1) aantal records: voor elk bestand (LVR1/LVR2/LNR) moet het aantal records (inclusief administratieve dubbeltellingen en heropnames) gelijk zijn aan het aantal records in het oorspronkelijke bestand. 2) elke record in het ASCII bestand moet precies één keer voorkomen in de gekoppelde bestanden (inclusief administatieve dubbels en heroponames). 3) het geboortejaar van het kind moet overeenkomen met het jaar waarin het koppeling word gedaan.
§5.5 Versie beheer en bestandnaam Bij het afronden van een gekoppeld jaarbestand krijgt het jaarbestand het versie 1.0 nummer. Indien er nog kleine wijzingingen doorgevoerd worden op het bestand naar aanleiding van commentaar gebruikers, wordt er een nieuwe bestand uitgegeven. Dit bestand krijgt dan versienummer 1.1 enz. Indien de procedure of het algoritme wordt aangepast en er een update plaatsvindt van de koppelingsmethodiek, wordt er een nieuw bestand uitgegeven met versienummer 2.0.
§5.6 Validatie koppeling LNR-registratie In 2004 is de LVR1^LVR2 koppeling voor het jaar 2001 gevalideerd [9,10]. In 2005 is de LNR^LNR koppeling voor het jaar 2001 gevalideerd [11]. De doelen van de validatie waren: 1) om te kijken of er voldoende onderscheid is tussen heropnames en administratieve dubbeltellingen 2) om te kijken naar de kwaliteit van de koppelingvariabelen 3) om te valideren of de koppeling er in geslaagd is heropnames van een kind te onderscheiden van die van zijn/haar sibling Een conclusie van de validatiestudie is dat de datakwaliteit over het algemeen goed is, behalve van de geboortedatum van de moeder en de meerlingvariabelen ‘meerlingcode’ en ‘omvang meerling’. Bij de koppeling van LNR records van eenlingen zijn weinig fouten gevonden en het koppelalgoritme hoeft niet aangepast te worden. Meer fouten traden op bij de koppeling van records van kinderen van een meerling. De voornaamste oorzaak is de lage datakwaliteit van de variabele ‘meerlingcode’ die een belangrijke rol speelt bij de koppeling. Op basis van de validatieresultaten is het algoritme voor de LNR^LNR koppeling van meerlingen aangepast in 2005.
Pagina 40 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
Epiloog De koppeling van de LVR1, LVR2 en LNR perinatale registraties voor 2005 heeft geleid tot een PRN jaarbestand 2005, wat op dezelfde wijze gebruikt kan worden als het PRN jaarbestand 2000, 2001, 2002, 2003 en 2004. Er zijn enige aanpassingen gedaan aan de koppelingsmethodiek ten opzichte van 2000-2004. Ten eerste is de schoningskoppeling LVR1 van de administratieve dubbeltellingen minder streng uitgevoerd, op basis van de ABCD^PRN koppeling uitgevoerd in 2006 [12-13]. Ten tweede is de LVR1^LVR2 meerlingkoppeling aangepast. Ten slotte is er een nieuwe koppelingsstrategie ontwikkeld voor de LNR^LNR meerling koppeling, naar aanleiding van de LNR validatiestudie uitgevoerd in 2005. (zie §5.6). De resultaten van de koppeling van 2005 zijn vergelijkbaar met de resultaten van 2000, 2001, 2002, 2003 en 2004 en de zes bestanden kunnen in combinatie gebruikt worden voor PRN gegevensverstrekkingen en PRN producten zoals het PRN jaarboek.
Vergelijking met PRN koppelingen van andere jaren Wanneer we aannemen dat de bronbestanden voor 2000 tot en met 2005 vergelijkbaar zijn wat betreft omvang, samenstelling, gebruikte classificaties voor de variabelen, toegepaste coderingsregels en voorbewerking tot aan de aanlevering aan LinKID, is de vergelijking van de resultaten voor de verschillende jaren zinvol (valide) en van groot belang voor het beoordelen van de stabiliteit van het koppelingsprotocol. Een zeer gevoelige maat hiervoor zijn de koppelgewichten die op basis van de datasets berekend worden. Alleen als in alle opzichten de koppeling vergelijkbaar is en de databestanden gelijk van inhoud, ontstaan vergelijkbare gewichten. Tabel 1, 2 en 3 geven de koppelgewichten weer voor de LVR1^LVR2 koppeling, de LNR^LNR koppeling en de (LVR1^LVR2)^LNR eenlingkoppeling voor 2003, 2004 en 2005. De gewichten zijn zeer goed vergelijkbaar voor de drie jaren. Tabel 1 Koppelgewichten LVR1^LVR2 eenling koppeling (Blocking op geboortedatum moeder)
Variabele postcode moeder geboortedatum kind (full) geb.dat. kind (close ±1 dag) aterme datum (full) aterme datum (close ±7 dgn) geboortegewicht (full) geboortegewicht (close ±10g) plaats bevalling geboorte minuut geboorte uur graviditeit geslacht kind
Gewichten 2003 agree disagree 10,75 -4,70 8,47 -7,03 1,82 nvt 8,45 -6,19 1,22 nvt 8,04 -4,53 0,88 nvt 7,06 -3,40 5,70 -3,70 4,50 -5,14 1,67 -3,79 0,99 -6,08
Gewichten 2004 agree disagree 10,48 -4,78 8,47 -7,28 1,81 nvt 8,43 -6,49 1,20 nvt 8,08 -4,68 0,94 nvt 6,98 -3,41 5,72 -3,83 4,51 -5,24 1,59 -3,72 0,99 -6,40
Gewichten 2005 agree disagree 10,54 -4,78 8,42 -7,34 1,83 nvt 8,41 -6,74 0,91 nvt 8,07 -4,68 0,75 nvt 6,92 -3,46 5,72 -3,92 4,52 -5,28 1,60 -3,75 0,99 -6,40
Tabel 2 Koppelgewichten LNR^LNR koppeling (Blocking op geboortedatum kind)
Variabele geboortedatum moeder patiënt id (SIG) postcode moeder geboortegewicht (full) geboortegew. (close ± 100g)*
Gewichten 2003 agree disagree 12,16 -4,69 13,67 -1,21 9,78 -5,47 8,47 -5,53 0,88 nvt
Pagina 41 van 59
Gewichten 2004 agree disagree 12,53 -5,01 10,08 -1,28 9,86 -6,08 8,54 -5,66 0,91 nvt
Gewichten 2005 agree disagree 12,49 -3,64 11,13 -1,35 9,95 -4,28 8,62 -4,80 1,50 nvt
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
zwangerschapsduur in weken apgar-score na 5 min geslacht kind
2,97 1,34 0,98
-5,14 -3,49 -5,56
2,98 1,35 0,98
-6,19 -4,06 -6,35
2,89 1,30 0,96
-3,86 -3,68 -4,34
* Bij 2005 was de close value voor geboortegewicht ± 50g
Tabel 3 Koppelgewichten LVR12^LNR koppeling (Blocking op geboortedatum kind) Gewichten 2003 Gewichten 2004 Variabele agree disagree agree disagree geboortedatum moeder 12,49 -5,51 12,59 -5,48 postcode moeder 10,78 -5,73 10,80 -4.94 geboortegewicht (full) 8,26 -5,96 8,29 -5,46 geboortegewicht (close ±20g)* 3,27 nvt 0,07 nvt zwangerschapsduur in weken 2,66 -4,27 2,65 -4,21 geslacht kind 0,97 -5,15 0,98 -5,28 apgar-score na 5 min 0,95 -2,44 0,94 -2,23 * Bij 2003 was de close value voor geboortegewicht ± 50g, bij 2004 ± 100g
Pagina 42 van 59
Gewichten 2005 agree disagree 12,54 -5,57 10,82 -5,04 8,31 -4,31 1,58 nvt 2,64 -4,27 0,98 -5,34 0,92 -2,29
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
Referenties [1] Newcombe HB. Handbook of Record Linkage, Methods for Health and Statistical Studies. Oxford University Press, 1998. [2] Registers in Cardiovascular Epidemiology. Reitsma JB, thesis University Amsterdam, ISBN 90 901 3206 6, Nov 1999.
Rapportage van eerdere PRN koppelingen: [3] Koppelingsprocedure PRN 2001: Deel I. Hoofdlijnen. GJ Bonsel, JB Reitsma, N Méray, ACJ Ravelli Afdeling Klinische Informatiekunde Technisch rapport 2004-03, AMC, Amsterdam, Juni 2004. [4] Koppelingsprocedure PRN 2001: Deel II. Beschrijving en Toelichting. GJ Bonsel, JB Reitsma, ACJ Ravelli, N Méray, M Tromp Afd. Klinische Informatiekunde Technisch rapport 2004-04, AMC, Amsterdam, Juni 2004. [5] Koppelingsprocedure PRN 2002: Beschrijving en Toelichting. N Méray, M Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2005-03, AMC, Amsterdam, Feb 2005. [6] Koppelingsprocedure PRN 2003: Beschrijving en Toelichting. N Méray, M Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klinische Informatiekunde, Technisch rapport 2005-04, AMC, Amsterdam, Mei 2005. [7] Koppelingsprocedure PRN 2000: Beschrijving en Toelichting. Auteurs Marc Tromp, Miranda Tromp, JB Reitsma, ACJ Ravelli Afd. Klinische Informatiekunde Technisch rapport 2005-05, AMC, Amsterdam, Okt 2005. [8] Koppelingsprocedure PRN 2004: Beschrijving en Toelichting. Auteurs J McDonnell, M Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2006-01, AMC, Amsterdam, Mrt 2006.
Rapportages van validatie studies van de PRN koppelingen [9] Validatie koppelingsprocedure PRN 2001. Empirische validatie LVR1 & LVR2 koppeling. Auteurs GJ Bonsel, ACJ Ravelli, JB Reitsma, N Méray Afd. Klinische Informatiekunde Technisch rapport 2004-01, AMC, Amsterdam, Mei 2005. [10] Validatie koppelingsprocedure PRN 2001. Technische beschrijving Validatie LVR1 & LVR2 koppeling. Auteurs GJ Bonsel, N Méray, ACJ Ravelli, JB Reitsma Afd. Klinische Informatiekunde Technisch rapport 2004-02, AMC, Amsterdam, Mei 2005. [11] LNR-registratie Compleetheid, Datakwaliteit en Validatie LNR koppeling Auteurs M Tromp, ACJ Ravelli, N Méray, JB Reitsma, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2005-06, AMC, Amsterdam, Dec 2005.
Rapportages van koppelingen PRN bestand met externe bestanden [12] Koppelingsprocedure PRN 2003 met ABCD bestand 2003. Auteurs M Tromp, ACJ Ravelli, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2006-02, AMC, Amsterdam, April 2006.
Pagina 43 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
[13] Koppelingsprocedure PRN 2003 en 2004 met ABCD bestand 2003-2004. Auteurs M Tromp, ACJ Ravelli, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2006-03, AMC, Amsterdam, Sept 2006.
Output rapportages op basis van de gekoppelde PRN bestanden [14] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2001. ISBN 90 901 9204-2, Bilthoven, mei 2005. [15] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2002. ISBN 97 890-809-66-28, Bilthoven, dec 2005. [16] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2003. ISBN 97 890-809-66-35, Bilthoven, juli 2006. Artikelen op basis van de koppeling van de perinatale registraties
[17] Record Linkage: Making the most out of errors in linking variables. Tromp M, Reitsma JB, Ravelli, Meray N, Bonsel GJ AMIA Annual Symposium Proc, 2006;779-83. [18] Probabilistic record linkage is a valid and transparent tool to combine databases without a patient identification number. Méray N, Reitsma JB, Ravelli ACJ, Bonsel GJ, Journal of Clinical Epidemiology, 2007, in press.
Websites KNOV website: (maart 2007),
www.knov.nl/themas/de_bevalling/
cijfers_over_bevallen_in_/index.xml
Stichting PRN website: www.perinatreg.nl Afdeling Klinische Informatiekunde website: http://kik.amc.uva.nl/KIK2/index.jsp
Pagina 44 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
Begrippen Gegeven Uitkomst Eenling
Meerling Administratieve dubbeltelling
Cross-sectioneel koppelen Longitudinaal koppelen
Deterministisch koppelen
Probabilistisch koppelen
Match (non-matches) Link (non-links) Koppel(ings)sleutel Blocking-variabele
Vector
Gegeven zoals vastgelegd in registratie. Een meetbare representatie van het doel van zorg op individuniveau. Een record dat informatie bevat van een zwangere met een enkel(voudig)e zwangerschap. Tot een enkele zwangerschap wordt beslist bij afwezigheid van aanwijzingen voor een meerling in 2 variabelen: meerlingcode en reden overdracht: wegens meerlingzwangerschap. Ook wordt soms de term singleton gebruikt. Een record dat informatie bevat van een zwangere met een meerling zwangerschap. Alle niet enkele zangerschappen. Twee of meer records in een bestand die volledig identiek zijn op de koppelsleutel; dit kan bij koppelen van een bestand met zichzelf het gevolg zijn van een echt duplicaat record of van de aanwezigheid van een record met dezelfde koppelsleutel. Het koppelen van gegevens waarbij de gegevens van slechts 1 primaire gebeurtenis (hier zwangerschap) met elkaar worden verbonden in tegenstelling tot longitudinaal koppelen (zie aldaar). Het koppelen van gegevens van verschillende primaire gebeurtenissen die in de tijd gescheiden zijn. Dit kan zowel betrekking hebben op gegevens uit 1 registratie of uit meerdere registraties. Koppeling waarbij alle (of een bepaald aantal van het totaal van de koppelsleutel) variabelen overeen moeten komen om te spreken van een link. Als de koppelsleutel n variabelen bevat spreekt men over een volledig deterministische koppeling als n waarden moeten corresponderen, over n-1 koppeling als er 1 willekeurig welke variabele mag verschillen, etc.
Koppeling waarbij voor iedere variabele van de koppelsleutel een mate van overeenstemming wordt bepaald die via een statistische bewerking wordt vertaald in een gewicht dat hoger is naarmate de kans op overeenstemming van het betreffende record op basis van deze variabele groter is. De statistische bewerking voorziet in, per variabele, een gewicht dat commensurabel is waardoor een totaalgewicht kan worden berekend. A priori of via berekening wordt bij probabilistisch koppelen een drempel vastgesteld waarboven twee gekoppelde records worden verondersteld te behoren tot dezelfde registratie-eenheid (dit heet 'link'). Wanneer externe informatie over de werkelijke status (al dan niet behorend tot dezelfde eenheid; 'match' of 'non-match') beschikbaar is, dus een gouden standaard, dan kan het begrippenapparaat worden toegepast dat ontwikkeld is ten behoeve van evaluatie van (medische) tests om de kwaliteit van de koppeling te beschrijven (b.v. x% fout positieve links, etc.). (E) Twee records horen bij elkaar op basis van de werkelijke status. (E) Twee records horen vermoedelijk (niet) bij elkaar op basis van het gewicht van de koppelsleutel. De set gemeenschappelijke variabelen uit 2 of meer te koppelen bestanden die voor het koppelen wordt gebruikt. (E) Records worden alleen met elkaar vergeleken als ze overeenstemmen op de blocking-variabele; een blocking-variabele is idealiter foutloos en informatierijk; toepassing van blocking vereenvoudigt de omvang van het koppelen aanzienlijk. Geeft het overeenkomen van koppelvariabelen weer met een positie
Pagina 45 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007.
Full Close
mi (1-mi) ui (1-ui) Afkappunt
Tie
voor iedere koppelvariabele, die de uitslag van overeenstemming weergeeft voor die variabele (‘1’ bij overeenstemming, ‘2’ bij klein verschil, ‘0’ bij groot verschil, ‘.’ bij missende waarde). (E) adjectief om op variabelenniveau aan te geven dat een koppelvariabele qua waarde exact overeenkomt tussen records. (E) adjectief om op variabelenniveau aan te geven dat een koppelvariabele niet exact overeenkomt, maar wel - op gedefinieerde wijze - voldoende overeenkomt om niet van 'fout' te kunnen spreken. De kans dat koppelvariabele i overeenstemt (verschilt) onder paren die werkelijk bij elkaar horen (matches). De kans dat koppelvariabele i overeenstemt (verschilt) onder paren die niet bij elkaar horen (non-matches). Synoniem: drempel, (E) threshold. Een gekozen totaalgewicht bij een probabilistische koppeling, waarboven paren als een link worden beschouwd. (E) een record uit het ene koppelbestand koppelt aan meerdere records uit het andere koppelbestand, deze multiple koppelingen heten ties; bij deterministisch koppellen en de eis van volledige overeenstemming berust een tie per definitie op een administratieve dubbeltelling (zie boven).
Pagina 46 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Appendix: Contents gekoppelde bestand LVR1^LVR2^LNR 2005 Variables in Creation Order # Variable
Type Len Format
Label
1 v_recid
Char
18
recordidentificatie –LinKID
2 v_id
Char
4
registratie identificatie
3 v_prak
Num
8
uniek praktijk nr
4 v_actie
Num
8
actiecode SIG
5 v_admin
Char
6
Patient administratienr binnen praktijk
6 v_mc
Num
8
meerlingcode
7 v_omv
Num
8
omvang meerling
8 v_ozA
Char
1
onze zorg betrof (A)
9 v_ozB
Char
1
onze zorg betrof (B)
10 v_ozTOT
Char
2
onze zorg betrof A+B
11 v_nrvk
Char
4
nr vk/ha
12 v_dd1ond
Char
6
datum 1e onderzoek
13 v_d1ond_d
Num
8
dag, datum 1e onderzoek
14 v_d1ond_m
Num
8
maand, datum 1e onderzoek
15 v_d1ond_j
Num
8
jaar, datum 1e onderzoek
16 v_contact
Num
8
hoe kwam contact tot stand
17 v_ddgebm
Char
6
geboorte datum moeder
18 v_mdat_d
Num
8
gebdatum moeder, dag
19 v_mdat_m
Num
8
gebdatum moeder, maand
20 v_mdat_j
Num
8
gebdatum moeder, jaar
21 v_pc2
Num
8
eerste twee cijfers van postcode
22 v_pc
Num
8
postcode -4 cijfers
23 v_her
Num
8
herkomst moeder
24 v_grav
Num
8
graviditeit
25 v_abo
Num
8
aant.abortus
26 v_addat
Char
6
datum ateme ddmmyy
27 v_addat_d
Num
8
dag, datum ateme
28 v_addat_m
Num
8
maand, datum ateme
29 v_addat_j
Num
8
jaar, datum ateme
30 v_zek
Num
8
zekerheid amen
31 v_ovlg
Num
8
overlegsit/medium risk
32 v_redovlg
Char
3
reden overlegsituatie/medrisk
33 v_ondA
Char
2
onderzoek/verrichting A
34 v_ondB
Char
2
onderzoek/verrichting B
Pagina 47 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
35 v_ondC
Char
2
onderzoek/verrichting C
36 v_aangep
Num
8
aangepakt door
37 v_superv
Num
8
supervisie door
38 v_ddvlies
Char
4
datum breken vliezen (ddmm)
39 v_vlies_d
Num
8
dag, datum breken vliezen
40 v_vlies_m
Num
8
maand, datum breken vliezen
41 v_uuvlies
Num
8
uur breken vliezen
42 v_amnio
Num
8
amniotomie
43 v_vrwat
Num
8
kleur vruchtwater
44 v_ontsl
Num
8
ontsluitingsduur
45 v_uupers
Num
8
uur begin meepersen
46 v_mmpers
Num
8
min begin meepersen
47 v_lig
Num
8
ligging
48 v_peri1
Num
8
perineum/vulva 1
49 v_peri2
Num
8
perineum/vulva 2
50 v_peri3
Num
8
perineum/vulva 3
51 v_medicpp
Num
8
medicatie na geb kind
52 v_hpp
Num
8
bloedverlies
53 v_gesl
Num
8
geslacht
54 v_ddgeb
Char
6
kind geboortedatum ddmmyy
55 v_kind_d
Num
8
kind geboortedatum, dag
56 v_kind_m
Num
8
kind geboortedatum, maand
57 v_kind_j
Num
8
kind geboortedatum, jaar
58 v_gebuur
Num
8
uur geboorte kind
59 v_gebmin
Num
8
min geboorte kind
60 v_apg
Num
8
apgar na 5 min
61 v_gew
Num
8
gewicht
62 v_weeg
Num
8
weegmethode
63 v_kraam
Num
8
kraamzorg
64 v_voed
Num
8
voeding 7e dag
65 v_lyn2red1
Char
3
reden zorg 2e lijn 1
66 v_lyn2red2
Char
3
reden zorg 2e lijn 2
67 v_mort1
Num
8
kind overleden 1e lijn
68 v_mort2
Num
8
kind overleden 2e lijn
Pagina 48 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
69 v_pltsplan
Num
8
geplande plaats bevalling
70 v_pltsecht
Num
8
echte plaats bevalling
71 v_klin
Num
8
ziekenhuisnr bevalling
72 v_lconsgyn
Num
8
laatste consult gyn
73 v_redcon1
Char
3
reden consult gyn 1
74 v_redcon2
Char
3
reden consult gyn 2
75 v_redcon3
Char
3
reden consult gyn 3
76 v_overdr
Num
8
overdracht naar 2e lijn
77 v_klinovdr
Num
8
ziekenhuisnr overdracht
78 v_ddovdr
Char
6
datum overdracht, ddmmyy
79 v_ovdr_d
Num
8
dag, datum overdracht
80 v_ovdr_m
Num
8
maand, datum overdracht
81 v_ovdr_j
Num
8
jaar, datum overdracht
82 v_redovd1
Char
3
reden overdracht 1
83 v_redovd2
Char
3
reden overdracht 2
84 v_redovd3
Char
3
reden overdracht 3
85 v_conska
Num
8
consult kinderarts
86 v_redconka
Char
2
reden consult kinderarts
87 v_overdrka
Char
1
overdracht kinderarts
88 v_redovdka
Char
2
reden overdr kinderarts
89 v_klinka
Num
8
ziekenhuis kinderarts
90 v_probk1
Char
2
problemen kind 1
91 v_probk2
Char
2
problemen kind 2
92 v_probk3
Char
2
problemen kind 3
93 v_bijz1
Char
2
bijzonderheden 1
94 v_bijz2
Char
2
bijzonderheden 2
95 v_bijz3
Char
2
bijzonderheden 3
96 v_probmoe1
Char
3
problemen moeder 1
97 v_probmoe2
Char
3
problemen moeder 2
98 v_probmoe3
Char
3
problemen moeder 3
99 v_indcode1
Char
2
individule codering 1
100 v_indcode2
Char
2
individule codering 2
101 v_indcode3
Char
2
individule codering 3
102 v_partus
Char
6
partusnummer -vrouw binnen praktijk
Pagina 49 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
103 v_lft
Num
8
leeftijd moeder -Prismant
104 v_amwwd
Num
8
zwangerschapsduur in ww+d -Prismant
105 v_epzwk
Num
8
eigen prenatale zorg vanaf n-de wk -Prismant
106 v_indzorg
Num
8
indicatie zorg -Prismant
107 v_amwws
Num
8
am.duur in weeken -Prismant
108 v_par
Num
8
pariteit -Prismant
109 v_jaar
Num
8
registratiejaar -Prismant
110 v_ddgebmoe
Num
8
geboortedatum moeder, date -LinKID
111 v_ddgebkind
Num
8
geboortedatum kind, date -LinKID
112 v_ddaterm
Num
8
a terme datum, date -LinKID
113 v_dat1ond
Num
8
datum 1e onderzoek, date -LinKID
114 v_datovdr
Num
8
datum overdracht, date -LinKID
115 v_pariteit
Num
8
pariteit -LinKID
116 v_kop_par
Num
8
pariteit als koppelvariabel -LinKID
117 v_multipari
Num
8
multipari j/n -LinKID
118 v_amddd
Num
8
amenorroeduur in dagen -LinKID
119 v_amwww
Num
8
amenorroeduur in weken -LinKID
120 v_kop_amd
Num
8
am.duur in dagen als koppelvariabel -LinKID
121 v_kop_gesl
Num
8
geslacht als koppelvariabel -LinKID
122 v_kop_omv
Num
8
meerling, volgens meerlingcode, j/n -LinKID
123 v_omv_ovdr
Num
8
meerling, volgens reden overdracht, j/n -LinKID
124 v_kop_gew
Num
8
gewicht als koppelvariabel -LinKID
125 v_kop_mort
Num
8
kind overleden in 1e of 2e lijn -LinKID
126 v_kop_pc
Num
8
postcode (4 cijfers) als koppelvariabele -LinKID
127 v_kop_pc2
Num
8
postcode (2 cijfers) als koppelvariabele -LinKID
128 v_lft_link
Num
8
leeftijd moeder -LinKID
129 v_kop_uur
Num
8
geboorteuur kind als koppelvariabele -LinKID
130 v_datvlies
Num
8
datum breken vliezen, date -LinKID
131 g_recid
Char
18
132 g_JAAR
Num
8 4.
registratiejaar -Prismant
133 g_lvr
Num
8 3.
lvr-nummer praktijk
134 g_SUBPOP
Num
8 1.
subpopulatie
135 g_AMWW
Num
8 2.
amenorroeduur in wk
136 g_AMDDD
Num
8 3.
amenorroeduur in dagen -LinKID
recordidentificatie -LinKID
Pagina 50 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
137 g_INTBEG
Num
8 1.
interventies begin baring
138 g_INTEIND
Num
8 1.
interventies einde baring
139 g_PARTUS
Char
6 6.
partusnummer
140 g_MC
Num
8 1.
meerlingcode
141 g_OMV
Num
8 1.
omvang meerling
142 g_AANTKIND
Num
8 1.
aant kinderen dit partusnr
143 g_UNIMOE
Num
8 1.
unieke moeder
144 g_LFT
Num
8 2.
leeftijd moeder -Prismant
145 g_DDGEBM
Num
8 DDMMYY6. geboortedatum moeder
146 g_PC
Num
8 4.
postcode
147 g_HER
Num
8 1.
herkomst moeder
148 g_PAR
Num
8 1.
pariteit -Prismant
149 g_GRAV
Num
8 2.
graviditeit
150 g_ABO
Num
8 1.
aant.abortus
151 g_FETLOSS
Num
8 1.
aantal fetal loss (>20 wkn)
152 g_DD_VOR
Num
8 DDMMYY6. datum vorige bevalling
153 g_LVR_VOR
Num
8 4.
lvrnr zkhs vorige bevalling
154 g_BGL
Num
8 1.
begeleiding door u
155 g_DD1OND
Num
8 DDMMYY6. datum 1e onderzoek, date -LinKID
156 g_EPZDAG
Num
8 3.
eigen zorg gyn bij n dagen amen
157 g_IUVD1
Num
8 1.
dood bij 1e ond
158 g_OVERNAME
Num
8 1.
overname uit 1e/2e lijn
159 g_PRAK_OV
Num
8 4.
praktijknr overname
160 g_ADMIN
Char
6 6.
administratienr uit 1e lijn
161 g_REDOV1
Char
2 2.
reden 1 overname
162 g_REDOV2
Char
2 2.
reden 2 overname
163 g_REDOV3
Char
2 2.
reden 3 overname
164 g_TEN
Num
8 3.
hoogste diastolische tensie
165 g_PROT
Num
8 1.
proteinurie j/n
166 g_PROT_MG
Num
8 4.
proteinurie in mg/l
167 g_CONCEP1
Num
8 1.
wijze conceptie 1
168 g_CONCEP2
Num
8 1.
wijze conceptie 2
169 g_CONMED1
Char
2 2.
medicatie 1 conceptie
170 g_CONMED2
Char
2 2.
medicatie 2 conceptie
Pagina 51 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
171 g_CONMED3
Char
2 2.
medicatie 3 conceptie
172 g_IVFNR
Char
5 5.
IVF-nummer
173 g_DDAT
Num
8 DDMMYY6. a terme datum
174 g_ZEK
Num
8 1.
zekerheid amen
175 g_BB1
Num
8 1.
begin baring 1
176 g_BB2
Num
8 1.
begin baring 2
177 g_INDBEG
Num
8 1.
indicatie inl/scp
178 g_STIMUL
Num
8 1.
stimulatie
179 g_PIJN1
Num
8 1.
pijnbestrijding 1
180 g_PIJN2
Num
8 1.
pijnbestrijding 2
181 g_DUUREPZ
Num
8 4.
duur eigen zorg in dagen
182 g_DDVLIES
Num
8 DDMMYY6. datum breken vliezen
183 g_UUVLIES
Num
8 2.
uur breken vliezen
184 g_GVL
Num
8 4.
duur gebroken vliezen in uren
185 g_AANGEP
Num
8 1.
aangepakt door
186 g_GYN
Num
8 4.
gynnr baring
187 g_SUPERV
Num
8 1.
supervisie door
188 g_GYNSUP
Num
8 4.
gynnr supervisie
189 g_LIG
Num
8 1.
ligging
190 g_HLP1
Num
8 1.
hulp bij baring 1
191 g_HLP2
Num
8 1.
hulp bij baring 2
192 g_INDHLP
Num
8 1.
indicatie hulp
193 g_UUPERS
Num
8 2.
uur begin meepersen
194 g_MMPERS
Num
8 2.
min begin meepersen
195 g_UITMIN
Num
8 4.
uitdrijvingsduur in min
196 g_PERI1
Num
8 1.
perineum 1
197 g_PERI2
Num
8 1.
perineum 2
198 g_NAGEB1
Num
8 1.
nageboortetijdperk 1
199 g_NAGEB2
Num
8 1.
nageboortetijdperk 2
200 g_GESL
Num
8 1.
geslacht
201 g_DDGEB
Num
8 DDMMYY6. geboortedatum kind
202 g_DAG_PART
Num
8 1.
dagindicatie partus
203 g_GEBUUR
Num
8 2.
uur geboorte
204 g_GEBMIN
Num
8 2.
min geboorte
Pagina 52 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
205 g_GEW
Num
8 4.
gewicht
206 g_GEWPCTL
Num
8 2.
cat-kloost pctiel
207 g_GEWPCTL_
Num
8 5.2
gewicht pctiel
208 g_APG
Num
8 2.
apgar na 5 min
209 g_MORT
Num
8 1.
mortaliteit
210 g_CGM1
Char
2 2.
cong.afw/trauma 1
211 g_CGM2
Char
2 2.
cong.afw/trauma 2
212 g_CGM3
Char
2 2.
cong.afw/trauma 3
213 g_PEDIAT
Num
8 1.
pediatr.betrokkenheid
214 g_HUIS
Num
8 1.
kind mee naar huis
215 g_DDONTM
Num
8 DDMMYY6. datum ontslag moeder
216 g_VERBLMOE
Num
8 3.
verblijfsduur moeder p.p. in dagen
217 g_MATMORT
Num
8 1.
maternale mort
218 g_BIJZ1
Char
2 2.
bijz.-1
219 g_BIJZ2
Char
2 2.
bijz.-2
220 g_BIJZ3
Char
2 2.
bijz.-3
221 g_BIJZ4
Char
2 2.
bijz.-4
222 g_BIJZ5
Char
2 2.
bijz.-5
223 g_BIJZ6
Char
2 2.
bijz.-6
224 g_BIJZ7
Char
2 2.
bijz.-7
225 g_RECNR
Num
8 6.
recordnummer
226 g_epzwk
Num
8 2.
eigen prenatale zorg vanaf n-de wk -Prismant
227 g_amwwd
Num
8 3.
zwangerschapsduur in ww+d -Prismant
228 g_ddgebmoe
Num
8
geboortedatum moeder, date -LinKID
229 g_ddgebkind
Num
8
geboortedatum kind, date -LinKID
230 g_ddaterm
Num
8
a terme datum, date -LinKID
231 g_ddvorkin
Num
8
datum vorige bevalling, date -LinKID
232 g_ddontsl
Num
8
ontslagdatum, date -LinKID
233 g_pariteit
Num
8
pariteit -LinKID
234 g_kop_par
Num
8
pariteit als koppelvariabel -LinKID
235 g_multipari
Num
8
multipariteit j/n -LinKID
236 g_amwww
Num
8
amenorroeduur in weken -LinKID
237 g_kop_amd
Num
8
am. duur in dagen als koppelvariabele -LinKID
238 g_kop_gesl
Num
8
geslacht als koppelvariabel -LinKID
Pagina 53 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
239 g_kop_omv
Num
8
meerling, volgens meerlingcode -LinKID
240 g_kop_pc
Num
8
postcode (4 cijfers) als koppelvariabele -LinKID
241 g_lft_link
Num
8
leeftijd moeder -LinKID
242 g_kopovern_var Num
8
overgenomen uit 1e ijn? j/n -LinKID
243 g_kop_mort
Num
8
kind overleden in 1e of 2e lijn -LinKID
244 g_kop_uur
Num
8
geboorteuur kind als koppelvariabele -LinKID
245 l_vgn_wgttot
Num
8
linkage weight bij LVR12^LNR -LinKID
246 l_vg_wgtmax
Num
8
maximum weight van niet gekoppelde lvr1^lvr2 -LinKID
247 n_recid
Char
20
248 n_id
Char
3
identificatie (LNR)
249 n_actie
Num
8
actiecode
250 n_lnr
Num
8
LNR-nr opname
251 n_patnrprk
Num
8
praktijkpatientnummer
252 n_patnrzhs
Num
8
ziekenhuispatientnummer
253 n_pc
Num
8
postcode (1e 4)
254 n_ddgeb
Char
6
geboortedatum kind
255 n_daggeb
Char
2
geboortedatum kind, dag
256 n_mndgeb
Char
2
geboortedatum kind, maand
257 n_jrgeb
Char
2
geboortedatum kind, jaar
258 n_gesl
Num
8
geslacht
259 n_amww
Num
8
amenorroeduur in weken
260 n_amd
Num
8
amenorroeduur +dagen
261 n_gew
Num
8
geboortegewicht
262 n_mc
Num
8
meerlingvolgnr
263 n_omv
Num
8
meerling omvang
264 n_ddgebm
Char
6
geboortedatum moeder
265 n_daggebm
Char
2
geboortedatum moeder, dag
266 n_mndgebm
Char
2
geboortedatum moeder, maand
267 n_jrgebm
Char
2
geboortedatum moeder, jaar
268 n_bmoe1
Num
8
bijz moeder 1
269 n_bmoe2
Num
8
bijz moeder 2
270 n_bmoe3
Num
8
bijz moeder 3
271 n_bmoe4
Num
8
bijz moeder 4
272 n_bmoe5
Num
8
bijz moeder 5
LNR record identificatie -LinKID
Pagina 54 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
273 n_bmoe6
Num
8
bijz moeder 6
274 n_bmoe7
Num
8
bijz moeder 7
275 n_bmoe8
Num
8
bijz moeder 8
276 n_bmoe9
Num
8
bijz moeder 9
277 n_bmoe10
Num
8
bijz moeder 10
278 n_gebplts
Num
8
plaats geboorte
279 n_zorg
Num
8
zorgverlener zwangerschap
280 n_prak
Num
8
praktijknummer 1e lijn
281 n_admin
Num
8
administratienr 1e lijn
282 n_lvr
Num
8
prak.nr lvr-2
283 n_partus
Num
8
partusnr lvr-2
284 n_IVFnr
Num
8
ivf-nr
285 n_bpart1
Num
8
bijz partus 1
286 n_bpart2
Num
8
bijz partus 2
287 n_bpart3
Num
8
bijz partus 3
288 n_bpart4
Num
8
bijz partus 4
289 n_Apgar_1
Num
8
Apgar na 1 min
290 n_Apgar_5
Num
8
Apgar na 5 min
291 n_rean1
Num
8
reanimatie 1
292 n_rean2
Num
8
reanimatie 2
293 n_rean3
Num
8
reanimatie 3
294 n_nrvlgprk
Num
8
volgnr van kind in praktijk (ka)
295 n_opnnr
Num
8
opnamenummer
296 n_ddopn
Char
6
datum opname
297 n_dagopn
Char
2
datum opname, dag
298 n_mndopn
Char
2
datum opname, maand
299 n_jropn
Char
2
datum opname, jaar
300 n_herkopn
Num
8
herkomst bij deze opname
301 n_herkzkhs
Num
8
ziekenhuisnummer herkomst
302 n_spectran
Num
8
speciaal transport
303 n_diag1
Num
8
diagnose 1
304 n_diag2
Num
8
diagnose 2
305 n_diag3
Num
8
diagnose 3
306 n_diag4
Num
8
diagnose 4
Pagina 55 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
307 n_diag5
Num
8
diagnose 5
308 n_diag6
Num
8
diagnose 6
309 n_diag7
Num
8
diagnose 7
310 n_diag8
Num
8
diagnose 8
311 n_diag9
Num
8
diagnose 9
312 n_diag10
Num
8
diagnose 10
313 n_diag11
Num
8
diagnose 11
314 n_diag12
Num
8
diagnose 12
315 n_diag13
Num
8
diagnose 13
316 n_diag14
Num
8
diagnose 14
317 n_diag15
Num
8
diagnose 15
318 n_diag16
Num
8
diagnose 16
319 n_diag17
Num
8
diagnose 17
320 n_diag18
Num
8
diagnose 18
321 n_diag19
Num
8
diagnose 19
322 n_diag20
Num
8
diagnose 20
323 n_diag21
Num
8
diagnose 21
324 n_diag22
Num
8
diagnose 22
325 n_diag23
Num
8
diagnose 23
326 n_diag24
Num
8
diagnose 24
327 n_diag25
Num
8
diagnose 25
328 n_diag26
Num
8
diagnose 26
329 n_diag27
Num
8
diagnose 27
330 n_diag28
Num
8
diagnose 28
331 n_diag29
Num
8
diagnose 29
332 n_diag30
Num
8
diagnose 30
333 n_indic1
Num
8
opname-indicatie 1
334 n_indic2
Num
8
opname-indicatie 2
335 n_indic3
Num
8
opname-indicatie 3
336 n_cgm1
Num
8
cong afwijking 1
337 n_cgm2
Num
8
cong afwijking 2
338 n_cgm3
Num
8
cong afwijking 3
339 n_cgm4
Num
8
cong afwijking 4
340 n_cgm5
Num
8
cong afwijking 5
Pagina 56 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
341 n_cgm6
Num
8
cong afwijking 6
342 n_cgm7
Num
8
cong afwijking 7
343 n_cgm8
Num
8
cong afwijking 8
344 n_cgm9
Num
8
cong afwijking 9
345 n_cgm10
Num
8
cong afwijking 10
346 n_cgm11
Num
8
cong afwijking 11
347 n_cgm12
Num
8
cong afwijking 12
348 n_cgm13
Num
8
cong afwijking 13
349 n_cgm14
Num
8
cong afwijking 14
350 n_cgm15
Num
8
cong afwijking 15
351 n_cgm16
Num
8
cong afwijking 16
352 n_cgm17
Num
8
cong afwijking 17
353 n_cgm18
Num
8
cong afwijking 18
354 n_cgm19
Num
8
cong afwijking 19
355 n_cgm20
Num
8
cong afwijking 20
356 n_beh1
Num
8
behandeling 1
357 n_beh2
Num
8
behandeling 2
358 n_beh3
Num
8
behandeling 3
359 n_beh4
Num
8
behandeling 4
360 n_beh5
Num
8
behandeling 5
361 n_beh6
Num
8
behandeling 6
362 n_beh7
Num
8
behandeling 7
363 n_beh8
Num
8
behandeling 8
364 n_beh9
Num
8
behandeling 9
365 n_beh10
Num
8
behandeling 10
366 n_beh11
Num
8
behandeling 11
367 n_beh12
Num
8
behandeling 12
368 n_beh13
Num
8
behandeling 13
369 n_beh14
Num
8
behandeling 14
370 n_beh15
Num
8
behandeling 15
371 n_beh16
Num
8
behandeling 16
372 n_beh17
Num
8
behandeling 17
373 n_beh18
Num
8
behandeling 18
374 n_beh19
Num
8
behandeling 19
Pagina 57 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
375 n_beh20
Num
8
behandeling 20
376 n_beh21
Num
8
behandeling 21
377 n_beh22
Num
8
behandeling 22
378 n_beh23
Num
8
behandeling 23
379 n_beh24
Num
8
behandeling 24
380 n_beh25
Num
8
behandeling 25
381 n_beh26
Num
8
behandeling 26
382 n_beh27
Num
8
behandeling 27
383 n_beh28
Num
8
behandeling 28
384 n_beh29
Num
8
behandeling 29
385 n_beh30
Num
8
behandeling 30
386 n_restver1
Num
8
restverschijnsel 1
387 n_restver2
Num
8
restverschijnsel 2
388 n_restver3
Num
8
restverschijnsel 3
389 n_restver4
Num
8
restverschijnsel 4
390 n_restver5
Num
8
restverschijnsel 5
391 n_restver6
Num
8
restverschijnsel 6
392 n_dd1000g
Char
6
datum 1000 g
393 n_dag1000g
Char
2
datum 1000 g, dag
394 n_mnd1000g
Char
2
datum 1000 g, maand
395 n_jr1000g
Char
2
datum 1000 g, jaar
396 n_icdg
Num
8
dagen ic
397 n_hcdg
Num
8
dagen hc
398 n_cpapdg
Num
8
dagen cpap
399 n_ippvdg
Num
8
dagen ippv
400 n_pvoedg
Num
8
dagen parent voeding
401 n_o2dg
Num
8
dagen O2
402 n_couvdg
Num
8
dagen couveuse
403 n_monitdg
Num
8
dagen monitor
404 n_infdg
Num
8
dagen infuus
405 n_fotodg
Num
8
dagen fototherapie
406 n_ddont
Char
6
ontslagdatum
407 n_dagont
Char
2
ontslagdatum, dag
408 n_mndont
Char
2
ontslagdatum, maand
Pagina 58 van 59
Koppelingsprocedure PRN 2005: Beschrijving en Toelichting, versie 1.0, april 2007
Variables in Creation Order # Variable
Type Len Format
Label
409 n_jront
Char
2
ontslagdatum, jaar
410 n_wijzeont
Num
8
wijze van ontslag
411 n_lnrovpl
Num
8
zkhs overplaatsing
412 n_redovpl
Num
8
reden overpl naar NICU door NICU
413 n_mort
Num
8
kind overleden
414 n_obductie
Num
8
obductie verricht
415 n_postichc
Num
8
post IC-HC dagen
416 n_patid
Char
10
417 n_prism_k
Num
8
Prismant keurmerk
418 l_ddgebkind
Num
8
geboortedatum kind, date -LinKID
419 l_ddgebmoe
Num
8
geboortedatum moeder, date -LinKID
420 l_ddopname
Num
8
opnamedatum, date -LinKID
421 l_dd1000gram
Num
8
datum 1000g, date -LinKID
422 l_ddontslag
Num
8
datum ontslag, date -LinKID
423 l_her
Num
8
kind meerdere keren opgenomen in LNR -LinKID
424 l_kindovl
Num
8
kind in LNR overleden -LinKID
425 l_kind
Num
8
kindnummer in LNR -LinKID
426 l_vgn_wgtmax
Num
8
maximum weight van niet gekoppelde lvr12^lnr -LinKID
427 l_vg_wgttot
Num
8
linkage weight bij LVR1^LVR2 -LinKID
patient ID
Pagina 59 van 59