PRN Koppelingsprocedure 2009 (LVR1, LVRh, LVR2 en LNR-deelregistraties)
Stichting Perinatale Registratie Nederland Postbus 8588 3503 RN Utrecht Tel. 030 – 28 23 165 www.perinatreg.nl
[email protected]
In samenwerking met Afdeling Klinische Informatiekunde & Verloskunde en Gynaecologie, AMC, Amsterdam
Datum
maart 2013
Auteurs
Dr. J. Dijs-Elsinga (
[email protected]) Dr. Anita CJ Ravelli (
[email protected]) Prof. Dr. Ameen Abu-Hanna (
[email protected]) Prof. Dr. Joris AM van der Post (
[email protected])
Aantal pagina’s
64
Aantal bijlagen
2
Versienummer
1.1
Versienummer Versie 0.4 Versie 0.5 Versie 1.1
Status Concept PRN Concept LinkID Definitief
Pagina 1 van 65
Inhoudsopgave
Inhoudsopgave .............................................................................................. 2 Summary in English ...................................................................................... 3 Inleiding .......................................................................................................... 6 Knelpunten,aanbevelingen en vervolgplannen ........................................... 8 Samenvatting resultaten en leeswijzer ........................................................ 9 Hoofdstuk 1 Schoningskoppelingen .......................................................... 10 §1.1 Voorbewerking registratiebestanden LVR1, LVRh, LVR2 en LNR .............................. 10 §1.2 Koppeling LVR1 ^ LVR1 .............................................................................................. 12 §1.3 Koppeling LVRh ^ LVRh .............................................................................................. 14 §1.4 Samenvoegen LVR1 en LVRh & koppeling LVR1h ^ LVR1h ...................................... 16 §1.5 Koppeling LVR2 ^ LVR2 .............................................................................................. 17 §1.6 Koppeling LNR ^ LNR .................................................................................................. 18
Hoofdstuk 2 Koppeling LNR ^ LNR voor vinden van heropnames ......... 19 §2.1 Koppeling LNR ^ LNR voor vinden van heropnames bij eenlingen ............................. 19 §2.2 Koppeling LNR ^ LNR voor vinden van heropnames bij meerlingen ........................... 21 §2.3 Koppeling niet-gekoppelde LNR eenlingen ^ meerlingen ............................................ 22 §2.4 Creatie LNR^LNR eindbestanden opname en kind ..................................................... 22
Hoofdstuk 3 Koppeling LVR1h ^ LVR2 ...................................................... 25 §3.1 Koppeling LVR1h ^ LVR2 eenlingen ............................................................................ 25 §3.2 Koppeling LVR1h ^ LVR2 meerlingen ......................................................................... 28 §3.3 Koppeling niet-gekoppelde LVR1h eenlingen met LVR2 meerlingen.......................... 30 §3.4 Koppeling niet-gekoppelde LVR1h meerlingen met LVR2 eenlingen.......................... 30 §3.5 Creatie LVR1h^LVR2 eindbestand .............................................................................. 30
Hoofdstuk 4 Koppeling (LVR1h ^ LVR2) ^ LNR ........................................ 31 §4.1 Koppeling (LVR1h ^ LVR2) ^ LNR eenlingen .............................................................. 31 §4.2 Koppeling LVR1h2 ^ LNR meerlingen ......................................................................... 34 §4.3 Koppeling niet-gekoppelde LVR1h2 eenlingen met LNR meerlingen ......................... 34 §4.4 Koppeling niet-gekoppelde LVR1h2 meerlingen met LNR eenlingen ......................... 34 §4.5 Creatie eindbestand (LVR1h ^ LVR2) ^ LNR ............................................................... 36
Hoofdstuk 5 PRN jaar 2009 bestanden ...................................................... 37 §5.1 Beschrijving gekoppelde eindbestanden ..................................................................... 37 §5.2 Toegevoegd variabelen ............................................................................................... 38 §5.3 Mogelijke dubbeltelling ................................................................................................. 42 §5.4 Controles op het gekoppelde PRN jaarbestand .......................................................... 42 §5.5 Versie beheer en bestandnaam PRN Jaarbestand ..................................................... 42 §5.6 Versie beheer van PRN rapporten over PRN Jaarbestand ......................................... 42
Epiloog .......................................................................................................... 43 Referenties ................................................................................................... 45 Begrippen ..................................................................................................... 48 Appendix A: Aantal LNR records in 2009 per praktijk .............................. 50 Appendix B: Contents gekoppelde bestand LVR1h^LVR2^LNR 2009 .... 52 Addendum over aanvullende (LVR1h) ^ LNR koppeling 2009 ................. 66
Pagina 2 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Summary in English This document describes the procedure of linking four Dutch perinatal registries (LVR1, LVRh, LVR2 and LNR) to combine medical information on pregnancy, childbirth and postnatal period for the year 2009. Combined, LVR1, LVRh, LVR2 and LNR form the Netherlands Perinatal Registry (PRN).
Introduction In the Netherlands most pregnant women are seen by an independent midwife. Referral of women to the obstetrician during gestation or labour takes place frequently. Approximately one third of the births are attended by a midwife and two thirds by an obstetrician, and less than 5% by a general practitioner. Following birth, around 15% of the children are admitted to a paediatric unit and are seen by a paediatrician. As a result, both mother and child may be seen by more than one caregiver. Depending on the profession of the caregivers involved in perinatal care, details of the pregnancy (including demographic data on the mother), birth and possible hospital admissions are recorded in one or more of the following four registries: LVR1 (National Obstetric Registry (primary care)), LVRh (National Obstetric Registry of General Practitioners (primary care)), LVR2 (National Obstetric Registry (secondary care)) and LNR (National Neonatal Registry). Combined, LVR1, LVRH, LVR2 and LNR form the Netherlands Perinatal Registry (PRN). For the year 2009, for the first time, data of the general practitioners have also been linked. In table 1 the number of records in the separate registries is described. Table 1: Number of records in the separate LVR1, LVRh, LVR2 and LNR registries in 2009 Year LVR1 registry LVRh registry LVR2 registry LNR registry
Unit “pregnancy women/ delivery child” “pregnancy women/ delivery child” “pregnancy women/ delivery child” “admission of a child”
2009 180,770 1,248 126,256 29,790
Information within these registries is rendered anonymous to any parties outside of the treating institution. A unique key, which identifies individuals, does not exist. Therefore, in order to collate information on the same woman, pregnancy and child, anonymous linking of the four perinatal registries is required. [1,2]
The linkage procedure and linkage methods Below, we briefly describe the linkage procedure developed by the LinKID group of the Academic Medical Centre Amsterdam to achieve a valid, combined PRN registry through a series of transparent, repeatable steps. The first step in this linkage was to ‘clean’ each of the four datasets i.e. remove duplicate records. No other data cleaning (such as the removal of ‘impossible’ date values) was carried out. In addition the LVRh registry was converted to the LVR1 layout, after which these two registries were simply attached to each other. Another ‘cleaning’ step was performed to remove any additional created duplicates. Next, the LVR1-LVRh registry was first linked to the LVR2. Separate linkages were done for singleton and multiple births, after which data were recombined. Then the linked file (LVR1h2) was linked to the LNR. Linkage methods can be classified as either deterministic or probabilistic. Under both methods, variables which partially identify a patient and which are present in more than one registry and are of sufficient quality (in terms of coding and degree of missing), are chosen as linkage variables. In deterministic linkage, a pair of records (one from each dataset) is considered a match if all linkage variables agree. A variation on this rule is to consider a pair as a match if they differ Pagina 3 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
on only a (pre-specified) small number of variables, usually one ('n-1' linking, where n is the number of linking variables used). In probabilistic linkage, weights are calculated for each linking variable separately in case of agreement or disagreement. The weight calculation is based on the probability of agreement on each variable in both true matches and non-matches (accidental agreement) [2]. These variable-specific weights assign ‘rewards’ to each record pair for all variables that agree by assigning the pair a positive score (specific to each variable) and to ‘punish’ the record pair (by assigning negative weights) for all variables that differ. The total weight for each record pair is calculated by summing all the weights of the individual linkage variables. Pairs with a high total weight are likely to be matches, while pairs with a low score are unlikely to be a match. Deterministic linkage was only used to ‘clean’ the data of the separate registries. All other linkages were made using probabilistic linkage [2,6,32-35]. A number of variables may not be recorded identically in two registries. For example, birth weight may be recorded as 3010 gm in one registry, but may be rounded down to 3000 gm in another. Probabilistic linkage can be extended to include so-called ‘close’ weights. [30-33] Record pairs with a close match on a given variable are given a smaller reward than a full match, but this procedure will still identify many true matches. A computer algorithm computes the variable-specific weights. Because of this it is possible to estimate the ‘threshold value’ above which total scores are assumed to represent a match. The threshold reflects an estimate of the prevalence of matches among all possible record pairs. Usually, the great majority of record pairs falls well below the threshold (no match) and a small number fall well above the threshold. The quality of the linkage procedure can be crudely judged when looking to the number of record pairs on both sides of the threshold. The smaller this grey area, the better the discriminatory performance of the linkage procedure is. The choice of the correct threshold and the best decision rule on record pairs in the grey area usually requires a judgement based on contextual knowledge in addition to information drawn from the computer output. Given the large number of records (particularly in the LVR1 and LVR2 registries), it is computationally impossible to compare all possible pairs of records from two datasets. To overcome this problem, the data are ‘blocked’ on certain variables. For example, in creating the link between the LVR1h and LVR2, the data were first blocked on the mother's date of birth: only pairs in which the mother's date of birth was identical in both datasets were considered. This reduced the number of record pairs to be considered from approximately 2 x 10 10 to just over 3 million. Subsequently, non-linked records were blocked on the postal code of the mother to identify any links missed by the first blocking. Similarly, records in the LVR1h2^LNR linkage were blocked first on the child’s date of birth and, subsequently, on the mother’s postal code (see Figure 2). From validation and comparative studies, it is now known that the LinKID probabilistic linkage procedure performs very well in absolute terms, and considerably better than the best deterministic alternative. [32-35] Additionally, it provides quantitative information on the success of the linkage and the main sources of error.
Results Here we present a selection of information from the 2009 linkage study, which, in total, involves 20 separate steps. First we present the variables used in the LVR1h-LVR2 singleton linkage (after blocking on the mother’s date of birth) with their estimated weights (see Table 2). From Table 2 one can read that agreement of postal code provides the highest positive award (10.47) apparently, being the most informative variable if agreed. Date of birth of the child is also informative (8.44). However, the weights assigned to disagreement are -4.87 and -7.52, respectively, indicating that the error rate in recording the postal code is much higher than in recording birth date of the child. Pagina 4 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Table 2: linkage weights for the LVR1h^LVR2 linkage singletons 2009 Variable Postal code (mother) Date of birth (child, full match) Date of birth (close, 1 day) Expected Date of Birth (DOB) (full match), close, 7 days) Birth weight (full match), (close, 5gm) Place of birth (hospital number) in case of hospital birth Minute of birth Hour of birth Gravidity Gender (child)
Agree 10.47 8.44 8.41 8.25 6.75 5.75 4.52 1.60 0.99
Weights Close Disagree -4.87 -7.52 1.84 0.78 -7.40 0.98 -4.66 -2.93 -4.11 -5.52 -3.67 -6.73
In Table 3, we present the final linking results after all steps have been taken. The combined dataset consists of different records (children), of which represent record pairs or triplets that comprise data from two or three registries. Table 3: number of links between the LVR1h LVR2 and LNR registries 2009 Records with information from LVR1h (only) LVR2 (only) LNR (only) LVR1h^LVR2 (combined) LVR1h^LNR (combined) LVR2^LNR (combined) LVR1h^LVR2^LNR (combined) PRN (LVR1h^LVR2^LNR) registry
Number of links 72.350 15.520 1.514 86.700 1.886 4.826 19.150 201.946
Percentage of links 35.8% 7.7% 0.7% 42.9% 0.9% 2.4% 9.5%
Conclusion We successfully linked the four LVR1, LVRh, LVR2, LNR Dutch perinatal registries in the PRN registry 2009. As a result, all information concerning the same pregnancy and child have been combined into one medical record, making it possible to obtain information across the entire perinatal care period (table 4). Table 4: The linked LVR1 LVRh LVR2 and LNR perinatal registries 2009 File LVR1h_LVR2_LNR_2009 LNR_LNR_2009 LNR_LNR_kind_2009
Records 201.946 29.668 27.376
It is important to stress that any linkage needs to be validated after it has been carried out. Also, the linkage itself cannot solve the problem of the 'true' value of a variable in a linked record, if this variable - despite the match - has a different value in the two data sources. Apparently, the positive weights associated with the remaining linking variables were sufficient to overcome such disagreement, but the procedure itself provides no information on which, if either, of the two values is 'true’.
Pagina 5 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inleiding Voor u ligt de rapportage van de PRN koppeling van de perinatale deelregistraties LVR1, LVRh, LVR2 en LNR voor het jaar 2009. Dit koppelingsproject is een vervolg op het LinKID koppelingsproject van deze perinatale deelregistraties voor de jaren 2000 tot en met 2008 [716]. Deze rapportage is de verantwoording van de koppeling van 2009 en de documentatie bouwt daarbij primair voort op de uitgebreide documentatie van de koppeling van 2001 [7] en volgende jaren (Koppelingsprocedure PRN 2001: Deel I Hoofdlijnen en Deel II Beschrijving en Toelichting en Koppelingsprocedure PRN 2002: Beschrijving en Toelichting, alsmede die over 2003 tot en met 2008) [7-16]. De PRN koppelingsmethodiek is in 2003 in opdracht van Stichting PRN ontwikkeld op de afdeling klinische informatiekunde (KIK) van het AMC door dr. N Méray, dr. ACJ Ravelli, dr. JB Reitsma en prof dr. GJ Bonsel [32-35]. Deze PRN koppelingsmethodiek is door dr. Nora Méray, drs. Miranda Tromp, drs. Joseph McDonnel en Marc Tromp BSc toegepast op de jaren 1999 tot en met 2008 van de PRN deelregistraties. De PRN koppelingsmethodiek bouwt voort op het koppelingswerk van dr. JB Reitsma en Prof dr. GJ Bonsel voor de Hartstichting in het kader van het proefschrift van Hans Reitsma [2]. De PRN koppelingen van 2001 en 2002 zijn op validiteit getest [17-19], en functioneren daarom in het vervolg als referentie. De documentatie van de koppeling van 2001 tot en met 2008 is beschikbaar op de website van de Stichting Perinatale Registratie Nederland [36] en de website van de afdeling Klinische Informatiekunde van het AMC [37] onder ‘Technical Reports’. De uitgangspunten voor de PRN koppeling van 2009 zijn niet veranderd ten opzichte van de eerdere jaren. Wel zullen dit jaar voor het eerst ook records uit de LVRh registratie toegevoegd worden aan het koppelingsproject. Het vervolgkoppelingsproject 2009 is uitgevoerd bij de Stichting PRN door epidemioloog dr. Joyce Dijs, onder begeleiding van epidemioloog dr. Anita Ravelli (AMC-KIK). Het project van de LVR1^LVRh^LVR2^LNR 2009 koppeling is uitgevoerd in 2011 op het PRN bureau te Utrecht. De verslaglegging vond plaats tijdens het project. Vanaf 2008 hebben de kinderartsen volgens een herziene LNR registratie aangeleverd. In principe bevat deze herziene set extra identificerende variabelen. Evenals in 2008 zijn er in 2009 echter in deze registratie nog geen of onvoldoende extra identificerende variabelen geregistreerd, zoals BSN. Voor de PRN koppeling van 2009 zijn er derhalve geen veranderingen doorgevoerd in de koppelmethodiek ten opzichte van het jaar 2008 [16]. Wel is er in 2009 weer extra aandacht besteed aan het aantal aanleverende centra/praktijken (zie grafiek A en B). Daarnaast is getracht de datakwaliteit van de koppelvariabelen van de LNR registratie (zie appendix A) inzichtelijk te krijgen en mogelijk hierdoor te verbeteren. Het LVR1 bronbestand 2009 bestond uit 180.770 records, het LVRh bronbestand uit 1.248 records, het LVR2 bronbestand uit 126.256 records en het LNR bronbestand uit 29.790 records (tabel 1 en 2). Tabel 1 Aantal records per LVR1, LVRh, LVR2 en LNR bestand 2009 Jaar 2009
Aantal Records
LVR1 registratie LVRh registratie LVR2 registratie LNR registratie
180.770 1.248 126.256 29.790
Aantal deelnemende praktijken waarvan 476 (3 prk<=5) 50 (geen excl) 94 (geen excl) 46 (1 prk <=5)
Het aantal deelnemende LVR1 praktijken in 2009 is hoger in vergelijking met voorafgaande jaren. (N=476 t.o.v. 471 in 2008). Het aantal deelnemende LVR2 praktijken is afgenomen; dit houdt vooral verband met allerlei fusies en de beslissing om in de NICU-ziekenhuizen nog maar onder 1 code te registreren in plaats van 2 in eerdere jaren. Het aantal deelnemende LNR praktijken is dit jaar verder afgenomen (van 58 naar 46).
Pagina 6 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Het gekoppelde PRN eindbestand 2009 bestaat uit 201.846 records. 55,5% van de LVR1h records (105.850) kon gekoppeld worden aan een LVR2 record, dit was 83,8% van de LVR2 records. Tabel 2 Trend in LVR1, LVR2, LNR en gekoppelde PRN registratie 2000-2009 [7-16,23-31] PRN gekoppeld bestand
2000
LVR1 registratie LVRh registratie LVR2 registratie LNR registratie
154.742
PRN gekoppelde registratie
2001
155.832
2002
162.649
2003
169.326
2004
160.967
2005
163.764
2006
168.010
2007
2008
2009
167.399
175.378
180.770 1.248
124.716
125.061
122.859
125.150
121.716
118.553
119.593
118.874
123.041
126.256
32.189
30.130
31.996
35.462
33.545
36.805
34.882
34.482
30.453
29.790
204.584
202.904
202.778
206.778
199.859
193.724
193.888
192.360
198.061
201.946
Ten opzichte van het jaar 2000 is ook in 2009 het aantal records in de LVR1 registratie weer toegenomen (180.770 records versus 154.742). Nieuw is dat dit jaar het LVRh bestand ook in de koppelingsstappen is opgenomen. In de LVR2 registratie was in eerdere jaren een duidelijke neerwaartse trend te zien, maar net als het vorige jaar is het aantal records in 2009 toegenomen ten opzichte van 2008 (126.256 versus 123.041). Het aantal records in de LNR registratie wisselt tussen de 36.805 (2005) en 29.790 (2009). Het aantal records in het gekoppelde bestand is in 2009 201.946 (versus 198.061 in 2008) (tabel 2 en figuur 1). Deze trend komt overeen met het aantal geboren kinderen in Nederland. De trend wordt verder beschreven in de epiloog en in de PRN jaarboeken [23-31].
250.000
204.584 202.904 202.778 206.778 199.8
Aantal records
200.000 154.742 155.832
162.649
169.326
160.9
150.000
124.716 125.061 122.859 125.150 121.7
Figuur 1 Trend in aantallen records in LVR1, LVRh, LVR2, LNR en gekoppelde PRN registratie 2000-2009 [7-16,23-31]
100.000
Pagina 7 van 65
50.000
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Knelpunten,aanbevelingen en vervolgplannen Naar aanleiding van de PRN 2009 koppeling zijn de volgende knelpunten en aanbevelingen geformuleerd. In het voortraject vóór de aanlevering en bij de bewerking van de losse bestanden blijken namelijk problemen voor te komen die de PRN koppeling nadelig beïnvloeden. Voor enkele knelpunten/aanbevelingen is hieronder tevens een plan van aanpak geformuleerd.
Het aantal deelnemende LNR praktijken is in het registratie jaar 2009 nog verder verminderd van 57% (2008) tot 46%. Mogelijk heeft dit te maken met de herziene registratie. PRN heeft sinds de invoer van de nieuwe dataset extra inspanningen geleverd om de kinderartsen weer deel te laten nemen. Dit heeft er toe geleid dat er vanaf begin 2010 weer nieuwe aanmeldingen zijn voor deelname aan de LNR. Daarnaast is datakwaliteit van de koppelvariabelen in de LNR registratie verbeterd maar nog steeds laag voor de geboortedatum moeder en postcode moeder. In de afgelopen jaren zagen we een verbetering in de datakwaliteit (zie tabel E5 in de epiloog) in het vastleggen van geboortedatum moeder in de LNR echter, in 2009 zijn deze belangrijke LNR koppelvariabelen weer vaker niet ingevuld. In 11,7% van de LNR records is de geboortedatum moeder nog niet ingevuld, in 7,3% is de postcode vrouw onbekend, en is de Apgar-score na 5 minuten bij 3,3% missing. Ontbrekende informatie van deze LNR koppelvariabelen is de belangrijkste reden dat het aantal niet te koppelen LNR records met de LVR1h-LVR2 (circa 1.500) nog steeds te hoog is. Hierop is besloten om het veld geboortedatum moeder en postcode moeder weer als een verplicht in te vullen item in de LNR op te nemen. In het kader van wisselende deelname en ontbrekende data zal de terugkoppeling aan alle zorgverleners over de aanlevering via PRN gaan verlopen in plaats van via Tieto, de bewerker van de PRN-gegevens. Praktijken die een sterk afwijkend aantal records ten opzichte van eerdere jaar/jaren hebben aangeleverd zullen door PRN benaderd worden om de reden hiervoor te achterhalen. Door uitbreiding van de “foutenrapportage” die alle berichtgevers standaard krijgen bij het insturen van het jaarbestand zal de datakwaliteit meer inzichtelijk worden gemaakt. Eventueel zal dit uitgebreider gedaan worden met praktijken waar een groot aantal gegevens van de koppelvariabelen ontbreken. Hopelijk lukt het op deze manier om alle datasets completer te krijgen en ook de datakwaliteit te verbeteren. Verder zal er nauwer overlegd gaan worden met de verschillende beroepsverenigingen over het daadwerkelijk aantal praktijken in een registratiejaar. Bij de invoering van de nieuwe LNR dataset zijn er een flink aantal nieuwe variabelen opgenomen in de LNR. Hier zit een aantal potentiële nieuwe koppelvariabelen bij, zoals geboorte-uur en geboorte-minuut, en andere sterk identificerende variabelen zoals BSN of naam. Een eerste verkenning met achternaam moeder laat zien dat die nauwelijks toegevoegde waarde heeft in de koppeling in verband met verschrijvingen in de naam en ook veelal ontbrekende naamsdata. Over de mogelijkheid van het gebruik van de BSN als koppelvariabele in de deelregistraties van de PRN, kan nu nog geen uitspraak worden gedaan, aangezien deze variabele nog niet in de LVR1 en de LVR2 aanwezig is. Ieder jaar zal opnieuw bekeken moeten worden of er extra variabelen met betrouwbare en goed ingevulde informatie beschikbaar zijn die gebruikt zouden kunnen worden voor het koppelen. Dit is zeker van belang nu vanaf het registratiejaar 2010 ook de LVR1 en LVR2 aan de overgang naar de nieuwe dataset zijn begonnen. Identificatie en koppeling van meerling kinderen blijft een probleem. De feitelijke meerlingstatus van een kind in een PRN record blijft niet altijd duidelijk en ook zijn niet altijd bij een tweeling 2 kind records aanwezig in de PRN en bij een drieling 3 kind records. In toekomstige koppelingen verdient de identificatie en vooraf controle van het aantal meerlingrecords per vrouw in de PRN basis koppeling extra aandacht.
Pagina 8 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Samenvatting resultaten en leeswijzer In totaal zijn voor de PRN 2009 koppeling 20 koppelingsstappen uitgevoerd. Hoofdstuk 1: de schoningskoppelingen - LVR1 ^ LVR1 - voorbereidende stappen in de koppeling (§1.1). - LVRh ^ LVRh – voorbereidende stappen in de koppeling (§1.2). - LVR1 ^ LVRh – voorbereidende stappen in de koppeling (§1.3). - LVR2 ^ LVR2 - voorbereidende stappen in de koppeling (§1.4). - LNR ^ LNR - voorbereidende stappen in de koppeling (§1.5). Hoofdstuk 2: beschrijving koppelingen tussen de LNR ^ LNR registratie: - Herkennen van heropnames van hetzelfde kind binnen de groep eenlingen. (§2.1). - Herkennen van heropnames van hetzelfde kind binnen de groep meerlingen. (§2.2). - Koppelen van niet-gekoppelde LNR eenlingen met niet-gekoppelde LNR tweelingen voor het vinden van heropnames (§2.3). Hoofdstuk 3: beschrijving koppelingen tussen de LVR1h en LVR2 registratie - Koppelen van eenlingen LVR1h ^ LVR2 (§3.1). - Koppelen van meerlingen LVR1h ^ LVR2 (§3.2). - Koppelen van niet-gekoppelde LVR1h eenlingen met niet-gekoppelde LVR2 meerlingen (§3.3). - Koppelen van niet-gekoppelde LVR1h meerlingen met niet-gekoppelde LVR2 eenlingen (§3.4). Hoofdstuk 4: beschrijving koppelingen tussen de gekoppelde LVR1h^LVR2 registratie met de LNR registratie - Koppelen van eenlingen LVR1h ^ LVR2 met LNR (§4.1). - Koppelen van meerlingen LVR1h ^ LVR2 met LNR (§4.2). - Koppelen van niet-gekoppelde LVR1h ^ LVR2 eenlingen met niet-gekoppelde LNR meerlingen (§4.3). - Koppelen van niet-gekoppelde LVR1h ^ LVR2 meerlingen met niet-gekoppelde LNR eenlingen (§4.4). Hoofdstuk 5: beschrijving van het gekoppelde PRN jaarbestand Epiloog: een vergelijking gemaakt met voorgaande jaren.
Pagina 9 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Hoofdstuk 1 Schoningskoppelingen In §1.1 worden de voorbewerkingen op de losse registratiebestanden besproken en in § 1.2 t/m § 1.5 worden de interne koppelingen LVR1^LVR1, LVRh^LVRh, LVR1^LVRh, LVR2^LVR2, en LNR^LNR besproken. Dit zijn voorbereidende of schoningskoppelingen voor het verwijderen van administratieve dubbeltellingen, voordat de verschillende registratie met elkaar kunnen worden gekoppeld.
§1.1 Voorbewerking registratiebestanden LVR1, LVRh, LVR2 en LNR De schoningskoppelingen worden uitgevoerd voor het verwijderen van administratieve dubbeltellingen in de losse registratiebestanden. Administratieve dubbeltellingen kunnen voorkomen doordat een record foutief dubbel is ingevoerd of doordat praktijken zijn gefuseerd en beide praktijken de records hebben aangeleverd. Dit probleem speelt vooral bij de LVR1. Er zijn een aantal voorbewerkingstappen toegevoegd om dit in een eerder stadium te signaleren. a) Verwijderen: records van niet-deelnemende praktijken Een eerste stap is inzichtelijk maken hoeveel records per praktijk zijn aangeleverd. In grafiek A is een overzicht gegeven van het aantal records in LVR1 praktijken. In 2009 hebben 476 van de 505 LVR1 praktijken aangeleverd (94,3%) [3]. Hiervan blijken drie LVR1 praktijken 5 of minder records te hebben aangeleverd. Deze records worden, conform afspraak, verwijderd uit het bestand.
Grafiek A. Verdeling LVR1 praktijken naar aantal records in 2009
Het LVRh bestand wordt niet door Tieto aangeleverd, maar is bij PRN aanwezig. Een minimum van 5 formulieren per jaar wordt niet hierop toegepast, gezien het geringe aantal bevallingen dat nog onder begeleiding van een huisarts plaatsvindt. Van 50 verloskundig actieve huisartsen zijn er gegevens ontvangen [6]. In grafiek B is een overzicht gegeven van het aantal records in LVR2 praktijken. In 2009 hebben 94 van de 95 LVR2 praktijken aangeleverd (99%) [4]. Alle 94 LVR2 praktijken hebben meer dan 5 records aangeleverd en voldoen daarmee aan de norm.
Pagina 10 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Grafiek B. Verdeling LVR2 praktijken naar aantal records in 2009 In appendix A is een overzicht gegeven van het aantal LNR records per praktijk. In 2009 hebben 46 van de 95 LNR praktijken aangeleverd (48%) [6]. Er blijkt 1 LNR praktijk niet te voldoen aan de norm (minimaal 5 records per praktijk). De records van deze LNR praktijk zijn verwijderd uit het bestand. b) Controleren: registratieperiode LVR1 praktijken De tweede stap is het controleren per LVR1 praktijk of gedurende het volledige jaar wordt geregistreerd. Er blijken praktijken later te starten dan januari 2009 en eerder te stoppen dan 31 december 2009. Voor 2009 zijn er 45 LVR1 praktijken die niet gedurende het hele jaar records hebben aangeleverd. Bij navraag bleek de reden hiervoor in de meeste gevallen onbekend te zijn. Het is echter mogelijk dat deze praktijken alsnog records hebben aangeleverd na de afsluitingsdatum voor de bestanden, ondanks waarschuwingen dat de jaarbestanden afgesloten gaan worden. Er zijn voor zover bekend geen fusies geweest tussen praktijken. Op dit punt kan er winst behaald worden qua compleetheid van registratie. c) Verbeteren: datakwaliteit LNR variabelen Uit de PRN koppeling van voorgaande jaren weten we dat de datakwaliteit van bepaalde LNR koppelvariabelen (m.n. geboortedatum moeder) niet optimaal is, er is sprake van een hoog percentage missings wat de koppeling bemoeilijkt. Als pilot zijn in het jaar 2007 ziekenhuizen benaderd om de informatie alsnog aan te leveren. Hiermee is het belang van de data kwaliteit extra benadrukt. We zagen het volgende jaar een duidelijke verbetering in het aantal missende waarden op de koppelvariabele geboortedatum vrouw. Inmiddels ligt dit aantal echter weer op het oude niveau. Het percentage missings voor geboortedatum moeder is dit jaar 11,7% t.o.v. van 11% in 2007 / 4,5% in 2008. Het percentage missing in Apgar-score 5 minuten 3,3% is ook hoog. Appendix A bevat een tabel met het aantal missende waarden voor de belangrijkste koppelvariabelen per ziekenhuispraktijk.
Pagina 11 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§1.2 Koppeling LVR1 ^ LVR1 Het doel van de toegepaste interne LVR1^LVR1 koppeling is het verwijderen van administratieve dubbeltellingen uit het LVR1 bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 10 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR1 2009 ASCII bestand (K:\Jaarbestanden\LVR1\lvr1jr2009.dat) wordt ingelezen en omgezet in een SAS jaarbestand (K:\Koppeling databestanden\2009\SAS\databestanden \LVR1\lvr1jr09.sas7bdat), het LVR1 2009 bestand bestaat uit 180.770 records. Dit aantal komt overeen met de LVR1 praktijkanalyse.[3] In totaal worden 10 records van 5 of minder records deelnemende LVR1 praktijken verwijderd (zie §1.1), waardoor het LVR1 bestand na exclusie bestaat uit 180.760 records. Voor de koppeling wordt ook het LVR1 2008 (K:\Jaarbestanden\LVR1\lvr1jr08.dat) bestand ingelezen (175.378 records). Uit dit bestand worden de records geselecteerd waarbij de à terme datum in 2009 is, records waarbij de geboorte datum van het kind en de à terme datum missend is en records waarbij de à terme datum na 1 december 2008 is (9.158 records). In totaal zijn er nu 189.918 LVR1 records uit 2009 (bestand ‘V’). Zie figuur 1A voor een flowchart van de LVR1^LVR1 koppeling. Het LVR1 bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (2.774.107 paren). Voor de interne LVR1^LVR1 koppeling worden de volgende 10 variabelen vergeleken: postcode moeder (geboortedatum moeder bij blocking op postcode), praktijknummer, graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur en geboorte minuut. Daarnaast worden nog meerlingcode en omvang meerling meegenomen. Records worden als een administratieve dubbeltelling beschouwd als 9 van de 10 variabelen overeenkomen of als 8 van de 10 variabelen overeenkomen en daarnaast ook sprake is van een eenling. Er is vanaf 2005 nog een extra situatie voor een administratieve dubbeltelling omdat in sommige gevallen de à terme datum missing is in het ene LVR1 record en aanwezig is in het andere record; voor deze situaties is de volgende extra regel geformuleerd: namelijk als 7 van de 10 variabelen overeenkomen en daarnaast niet alleen sprake is van een eenling, maar ook de praktijkcodes overeenkomen en de à terme datum missing is. Op deze manier worden 557 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode overeenkomt worden aangemaakt (11.353.769). Administratieve dubbeltellingen worden op dezelfde wijze geselecteerd, maar nu met geboortedatum moeder als koppelvariabele in plaats van postcode moeder. Er worden 20 extra administratieve dubbeltellingen gevonden. Van de 577 gevonden administratieve dubbeltellingen worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er worden 18 administratieve tripels gevonden, 1 record waarbij er 4 records linken en 1 record waarbij zelfs 5 records linken. Van iedere administratieve dubbel wordt het tweede record verwijderd en van iedere administratieve trippel wordt daarnaast ook het derde record verwijderd, van het cluster met 4 records wordt ook het vierde record verwijderd en van het cluster met 5 records wordt ook het vijfde record verwijderd. Per cluster blijft er op deze manier maar 1 gekoppeld record over. Van de 189.918 LVR1 records zijn nu 554 administratieve dubbeltellingen verwijderd, waardoor er nog 189.346 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (v_admin1) na positie 1 waar de recordidentificatie (v_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR1 2009 bestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr1_opgeschoond.sasb7dat
Pagina 12 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LVR1 2008 bestand K:\koppeling databestanden\datasets Tieto\lvr1jaar2008.dat
Inlezen LVR1 2009 bestand K:\koppeling databestanden\datasets Tieto\lvr1jaar2009.dat
LVR1 2008 bestand (jvr1jr08) 175.378 records
LVR1 2009 bestand (jvr1jr09) 180.770 records
Aterme datum voor dec 2008 166.220 records
<5 per praktijk eruit 10 records
LVR1 2008 records die mogelijk met LVR1 2009 records kunnen koppelen 9.158 records
LVR1 2009 bestand 180.760 records
LVR1 2009 bestand 189.918 records
Blocking geb.datum / pc moeder administratieve dubbeltellingen 577 records Opgeschoond LVR1 2009 bestand 189.346 records
Opslaan opgeschoond LVR1 2009 bestand K:\koppeling databestanden\ 2009\SAS\ databestanden\lvr1_opgeschoond.sas
Figuur 1A Flowchart LVR1 ^ LVR1 koppeling
Pagina 13 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§1.3 Koppeling LVRh ^ LVRh Het doel van de toegepaste interne LVRh ^ LVRh koppeling is het verwijderen van administratieve dubbeltellingen uit het LVRh bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 10 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVRh 2009 ASCII bestand (K:\Jaarbestanden/LVR-h/lvrh 2009.dat) wordt ingelezen en omgezet in een SAS jaarbestand (K:\Koppeling databestanden\datasets Tieto \lvrhjr09.sas7bdat), het LVRh 2009 bestand bestaat uit 1.248 records. Omdat in 2009 voor het eerst LVRh records aangekoppeld worden, worden er geen records uit bestanden van eerdere jaren ingelezen. Bij volgende jaren zou dit wel een mogelijkheid kunnen zijn. Het bestand LVRh 2009 bevat dus 1.248 records (bestand ‘H’). Zie figuur 2A voor een flowchart van de LVRh ^ LVRh koppeling. Het LVRh bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (171 paren). Voor de interne LVRh ^ LVRh koppeling worden de volgende 10 variabelen vergeleken: postcode moeder (geboortedatum moeder bij blocking op postcode), praktijknummer, graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur en geboorte minuut. Daarnaast worden nog meerlingcode en omvang meerling meegenomen. Records worden als een administratieve dubbeltelling beschouwd als 9 van de 10 variabelen overeenkomen of als 8 van de 10 variabelen overeenkomen en daarnaast ook sprake is van een eenling. Op deze manier worden 9 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode overeenkomt worden aangemaakt. Administratieve dubbeltellingen worden op dezelfde wijze geselecteerd, maar nu met geboortedatum moeder als koppelvariabele in plaats van postcode moeder. Er worden geen extra administratieve dubbeltellingen gevonden. Van de gevonden administratieve dubbeltellingen worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er worden geen administratieve tripels gevonden. Van iedere administratieve dubbel wordt het tweede record verwijderd. Van de 1.248 LVRh records zijn nu 9 administratieve dubbeltellingen verwijderd, waardoor er nog 1.239 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (h_admin1) na positie 1 waar de recordidentificatie (h_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVRh 2009 bestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvrh_opgeschoond.sasb7dat
Pagina 14 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LVRh 2008 bestand
Inlezen LVRh 2009 bestand K:\koppeling databestanden\datasets Tieto\lvrhjaar2009.dat
nvt
LVRh 2008 bestand (jvrhjr08) nvt
LVRh 2009 bestand (jvrhjr09) 1.248 records
Aterme datum voor dec 2008 nvt
LVRh 2008 records die mogelijk met LVRh 2009 records kunnen koppelen 9.158 records
LVRh 2009 bestand 1.248 records
LVRh 2009 bestand 1.248 records
Blocking geb.datum / pc moeder administratieve dubbeltellingen 9 records Opgeschoond LVRh 2009 bestand 1.239 records
Opslaan opgeschoond LVRh 2009 bestand K:\koppeling databestanden\2009\SAS\ databestanden\lvrh_opgeschoond.sas
Figuur 2A Flowchart LVRh ^ LVRh koppeling
Pagina 15 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§1.4 Samenvoegen LVR1 en LVRh & koppeling LVR1h ^ LVR1h Er is eerst bekeken in hoeverre er een overlap bestond tussen de losse LVR1 en LVRh bestanden. Indien namelijk het merendeel van de records in beide bestanden terug te vinden zou zijn, zou dit suggereren dat de LVR1 en LVRh achter elkaar gekoppeld moet worden, zoals dat ook met de LVR1 en LVR2 gebeurd. Aangezien dit niet het geval bleek, is er voor gekozen om een gecombineerd LVR1 en LVRh bestand te maken. Gezien het feit dat verdere koppelingsstappen zijn gebaseerd op de LVR1 is er voor gekozen om dit als basis bestand te gebruiken en dit bestand aan te vullen met de LVRh. Hiertoe zijn alle items die voor de LVRh worden ingevoerd bekeken en is per item beslist met welk LVR1 item dit het beste overeenkomt en welke coderingen hierbij horen (die wijken namelijk nog wel eens af). Na het afronden van deze samenvoeging is besloten om voor de zekerheid nog een keer een interne koppeling uit voeren, om nieuwe administratieve dubbeltellingen die nu mogelijk ontstaan zijn te verwijderen. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 10 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR1h 2009 bestand (K:\Koppeling databestanden\2009\SAS\databestanden\ lvr1_lvrh.sasb7.dat) wordt ingelezen, het LVR1h 2009 bestand bestaat uit 190.585 records. Het LVR1h bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (2.791.050 paren). Voor de interne LVR1h ^ LVR1h koppeling worden de volgende 10 variabelen vergeleken: postcode moeder (geboortedatum moeder bij blocking op postcode), praktijknummer, graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur en geboorte minuut. Daarnaast worden nog meerlingcode en omvang meerling meegenomen. Records worden als een administratieve dubbeltelling beschouwd als 9 van de 10 variabelen overeenkomen of als 8 van de 10 variabelen overeenkomen en daarnaast ook sprake is van een eenling. Er is vanaf 2005 nog een extra situatie voor een administratieve dubbeltelling omdat in sommige gevallen de à terme datum missing is in het ene LVR1 record en aanwezig is in het andere record; voor deze situaties is de volgende extra regel geformuleerd: namelijk als 7 van de 10 variabelen overeenkomen en daarnaast niet alleen sprake is van een eenling, maar ook de praktijkcodes overeenkomen en de à terme datum missing is. Op deze manier worden 10 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode overeenkomt worden aangemaakt (11.439.526). Administratieve dubbeltellingen worden op dezelfde wijze geselecteerd, maar nu met geboortedatum moeder als koppelvariabele in plaats van postcode moeder. Er worden geen extra administratieve dubbeltellingen gevonden. Van de 10 gevonden administratieve dubbeltellingen worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er word geen administratieve tripels gevonden. Van iedere administratieve dubbel wordt het tweede record verwijderd. Van de 190.585 LVR1h records zijn nu 10 administratieve dubbeltellingen verwijderd, waardoor er nog 190.575 records over zijn. Verderop in het koppelingsproces blijkt dat een aantal records dubbel zijn aangeleverd door verschillende praktijken. Deze worden er niet uitgefilterd met het ontdubbelen, maar moeten er toch uitgehaald worden. Hierdoor worden nog eens 39 extra dubbelen verwijderd en bestaat het uiteindelijke LVR1h-bestand uit 190.536 records. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (v_admin1) na positie 1 waar de recordidentificatie (v_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR1h 2009 bestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr1h_opgeschoond.sasb7dat
Pagina 16 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§1.5 Koppeling LVR2 ^ LVR2 Het doel van de toegepaste interne LVR2 ^ LVR2 koppeling is het verwijderen van administratieve dubbeltellingen uit het LVR2 bestand. De methodiek van deze LVR2^LVR2 koppeling is een deterministische koppeling. De LVR2^LVR2 koppeling vond plaats op basis van 11 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR2 2009 ASCII (K:\Jaarbestanden\LVR2\lvr2jaar2008.dat) bestand wordt ingelezen en omgezet in een SAS jaarbestand (K:\Koppeling databestanden\2009\SAS\databestanden\ lvr2jr09.sasb7dat). Het LVR2 2009 bestand bestaat uit 126.256 records. Dit aantal komt overeen met de LVR2 praktijkanalyse van Tieto.[4] Het LVR2 bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling en selectie van administratieve dubbeltellingen vindt op dezelfde wijze plaats als bij de LVR1 koppeling. Met blocking op geboortedatum moeder worden 59 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Er wordt één extra administratieve dubbeltellingen gevonden. Van de 60 gevonden administratieve dubbeltellingen worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er worden geen administratieve tripels gevonden. Van de administratieve dubbeltellingen wordt ieder tweede record verwijderd. Van de 126.256 LVR2 records zijn nu 60 administratieve dubbeltellingen verwijderd waardoor er nog 126.196 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (g_admin1) na positie 1 waar de recordidentificatie (g_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR2 2009 bestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr2_opgeschoond.sasb7dat
Pagina 17 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§1.6 Koppeling LNR ^ LNR Het doel van de toegepaste interne LNR ^ LNR koppeling is het verwijderen van administratieve dubbeltellingen uit het LNR bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 10 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van het kind gebruikt en daarna de postcode van de moeder. Deze koppeling is iets veeleisender omdat heropnames kunnen voorkomen. Het LNR 2009 SAS (K:\Jaarbestanden\LNR\lnr2009.sas7bdat) bestand wordt ingelezen en weggeschreven (K:\Koppeling databestanden\2009\SAS\databestanden\lnrjr09.sas7bdat). Het LNR 2009 bestand bestaat uit 29.790 records. Dit aantal komt overeen met de LNR praktijkanalyse van Tieto.[5] Hiervan blijkt één LNR praktijk 5 of minder records te hebben aangeleverd (praktijknummer 263). Deze records worden, conform afspraak, verwijderd uit het bestand. Dit bestand bestaat nu uit 29.788 records. Het LNR bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (1.241.384 paren). Voor de koppeling worden de volgende 10 variabelen vergeleken: postcode moeder (geboortedatum kind bij blocking op postcode), geboortedatum moeder, amenorroeduur, gewicht, geslacht, datum opname, datum ontslag, LNR praktijkcode, meerlingcode en omvang meerling. Records worden als een administratieve dubbeltelling beschouwd als alle variabelen overeenkomen of als 1 variabele niet overeenkomt, het een eenling betreft en in ieder geval opname datum, ontslagdatum en LNR praktijkcode overeenkomen. Op deze manier worden 123 administratieve dubbeltellingen gevonden. De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Hierbij worden geen extra administratieve dubbeltellingen gevonden. Er worden clusters aangemaakt om te controleren of er administratieve tripels bijzitten. Er worden 5 administratieve tripels gevonden. Er wordt 1 administratieve quadripel gevonden. Van de administratieve dubbeltellingen wordt ieder tweede record verwijderd, van de tripel wordt het tweede en derde record verwijderd, en van de quadripel wordt het tweede, derde en vierde record verwijderd. Van de 29.788 LNR records zijn nu 110 administratieve dubbeltellingen verwijderd, waardoor er nog 29.668 LNR records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het ‘sleutelbestand’ op positie 2 (n_admin1) na positie 1 waar de recordidentificatie (k_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LNR 2009 bestand wordt weggeschreven naar: K:\Koppelingdatabestanden\2009\SAS\databestanden\lnr_opgeschoond.sasb7dat
Pagina 18 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Hoofdstuk 2 Koppeling LNR ^ LNR voor vinden van heropnames Het doel van de toegepaste interne LNR ^ LNR koppeling is het vinden van heropnames behorend bij hetzelfde kind in het LNR bestand. De methodiek van deze koppeling is een probabilistische koppeling op basis van 8 koppelvariabelen, apart voor eenlingen en meerlingen. Als blocking-variabele is eerst de geboortedatum van het kind gebruikt en daarna de postcode van de moeder.
§2.1 Koppeling LNR ^ LNR voor vinden van heropnames bij eenlingen Het opgeschoonde LNR bestand met records ($1.6) wordt ingelezen vanaf K:\Koppeling databestanden\2009\SAS\databestanden\lnr_opgeschoond.sasb7dat. Uit dit bestand worden de eenlingrecords (26.896) en meerlingrecords (2.772) gescheiden. Zie figuur 3A voor de flowchart van de LNR ^ LNR eenlingkoppeling. Het LNR bestand wordt probabilistisch met zichzelf gekoppeld voor het vinden van heropnames. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (1.009.822 paren). Voor de koppeling worden de volgende 7 variabelen vergeleken (zie Tabel 2.1): geboortedatum moeder, amenorroeduur in weken, postcode (geboortedatum kind bij blocking op postcode), gewicht, geslacht, Apgarscore na 5 minuten. Daarnaast worden enkele controlevariabelen gebruikt: geboorte-uur, geboorte-minuut, opnamedatum en ontslagdatum. Voor de variabele ‘geboortegewicht’ wordt naast een full match ook een close gedefinieerd. Er is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 20 gram. Tabel 2.1 Frequentietabel koppelvariabelen LNR^LNR heropnames eenlingen 2009 Variabele label (N=26.896) Variabele naam Aantal missend % Missend Geboortedatum moeder k_ddgebmoe 3.164 11,76% Apgar-score na 5 minuten k_kop_apg5 919 0,13% Postcode (4 cijfers) k_kop_pc 1.961 7,29% Gewicht kind k_kop_gew 214 0,80% Amenorroeduur in weken k_kop_amw 225 0,84% Geslacht kind k_kop_gesl 6 0,02% Geboortedatum kind k_ddgebkind 0 0% Tabel 2.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de ui en mi waarden met blocking op geboortedatum kind. De ui waarden zijn berekend op basis van de randtotalen en de m i waarden op basis van fitting met een non-lineaire procedure. Tabel 2.2 Gewichten koppelvariabelen LNR ^ LNR heropnames eenlingen 2008 Variabele Geboortedatum moeder Postcode (4 cijfers) Gewicht kind (full) Gewicht kind (+/- 20 gr) Geboortedatum kind* Amenorroeduur in weken Apgar-score na 5 minuten Geslacht kind
mi waarden 0,9680 0,9498 0,8721 0,0428 0,9908 0,9780 0,9430 0,9866
ui waarden 0,000173 0,00132 0,00221 0,0150 0,00277 0,1269 0,3862 0,5023
Gewicht bij ‘agreement’ 12,45 9,49 8,62 1,51 8,48 2,95 1,29 0,97
Gewicht bij ‘disagreement’ -4,97 -4,31 -3.53 -0,04 -6,76 -5,31 -3,43 -5,21
* deze waarden zijn berekend met blocking op postcode moeder
Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht men 0,00284 * 1.009.822 = 2.867 links te vinden. Op basis van de geschatte prevalentie en het bekijken van de paren wordt een afkappunt van 10,0 gekozen en worden 2.295 paren geselecteerd als link.
Pagina 19 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LNR opgeschoond 2009 bestand K:\koppeling databestanden\2009\SAS\ databestanden\lnr_opgeschoond.sas
Opgeschoond LNR 2009 bestand 29.668 records LNR meerlingen bestand 2.772 records
LNR eenlingen bestand 26.896 records
Paren aanmaken (blocking op geboortedatum kind & postcode moeder) LNR ^ LNR links
Totaal LNR ^ LNR paren boven afkappunt 2.305 records
LNR records van kinderen die 1 keer zijn opgenomen 23.404 records
Oplossen ties 1.576 clusters, 3.492 paren
Records van eenling kinderen die meerdere keren zijn opgenomen 3.402 records
Records van eenling kinderen die 1 keer zijn opgenomen 23.404 records
LNR 2009 eenlingen bestand 26.896 records
Opslaan LNR 2009 eenlingen bestand K:\koppeling databestanden\2009\ databestanden\lnr_2009_singleton.sas.
Figuur 3A Flowchart LNR ^ LNR eenlingkoppeling
Pagina 20 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder hetzelfde is (2.081.552 paren). Paren boven het afkappunt van 11,0 en waarbij de geboortedatum van het kind niet overeenkomt worden geselecteerd (10 paren). In totaal zijn er 2.305 paren geselecteerd als links. Er worden clusters aangemaakt van deze paren om alle heropnames van een kind bij elkaar te vinden. In totaal zijn er 1.576 kinderen die meer dan één keer zijn opgenomen (1.238 kinderen die twee keer zijn opgenomen, 254 kinderen drie keer, 32 kinderen vier keer, 8 kinderen vijf keer, en 1 kind zes keer.). Het overgebleven LNR eenlingbestand (23.404 records) bestaat uit kinderen die één keer zijn opgenomen (tabel 2.3). Tabel 2.3 Aantal opnames bij LNR eenlingen 2009 Opname 1 2 3 4 5 6 Totaal
Aantal opnames 23.404 2.566 762 128 30 6 26.896
Aantal kinderen 23.404 1.283 254 32 6 1 24.980
% Aantal records 87,3% 9,2% 2,8% 0,5% 0,1% <0,1% 100,0 %
Het uiteindelijke LNR 2009 eenlingbestand bestaat uit de samenvoeging van het bestand van kinderen die één keer zijn opgenomen (23.404 records) en het bestand van de kinderen met heropnames (3.492 records van 1.576 kinderen). Dit bestand bestaat in totaal uit 26.896 opnamerecords van 24.980 kinderen en wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lnr_2009_singleton.sasb7dat. Dit bestand zal gebruikt worden voor de eenlingkoppeling met het gekoppelde LVR1^LVR2 bestand.
§2.2 Koppeling LNR ^ LNR voor vinden van heropnames bij meerlingen Het vinden van heropnames bij meerlingen gebeurt op dezelfde wijze als bij eenlingen. Nu worden alleen de meerlingrecords geselecteerd uit het K:\Koppeling databestanden\2009\ SAS\databestanden\lnr_opgeschoond.sasb7dat bestand (2.772 records). Zie figuur 2B voor een flowchart van de LNR^LNR meerlingkoppeling. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (12.647 paren). Er worden net als bij de eenlingkoppeling 7 variabelen vergeleken. Alle paren boven het afkappunt 7,0 worden geselecteerd als link (1.921 paren). Blocking op postcode moeder levert nog 2 extra paren op. In totaal zijn er 1.923 paren geselecteerd als link. De meerlingcode en omvang meerlingcode worden nu niet meegenomen, omdat uit de LNR validatiestudie bleek dat deze waarden niet betrouwbaar zijn [19]. Er is vanaf de PRN koppeling 2005 een nieuwe systematiek bedacht om heropnames van meerlingen in de clusters in de LNR registratie op te lossen (oftewel de juiste heropname aan het juiste meerlingkind te koppelen). Uit de validatiestudie bleek namelijk ook dat het algoritme er goed in slaagde om alle opnames van kinderen van één meerling bij elkaar te vinden maar binnen een meerlingpaar heropnames verwisselde indien er een fout zat in de meerlingcode. Deze nieuwe systematiek is in 2008 koppeling wederom toegepast. Er worden clusters aangemaakt van de 1.923 paren boven het afkappunt, om de juiste opnames bij elkaar te vinden. In totaal zijn er 1.099 clusters gevonden van verschillende grootte (zie tabel 2.4) Een tweede totaalgewicht wordt gebruikt om de clusters op te lossen (opnames van 1 meerlingkind bij elkaar te zoeken). Dit tweede totaalgewicht is alleen gebaseerd op variabelen die kunnen verschillen tussen kinderen van een meerling (gewicht kind, geslacht, Apgar-score 5 min en meerlingcode) daarnaast wordt voor de meerlingcode een gewicht van +1 toegekend als de code overeenkomt en een gewicht van -1 als de code verschilt.
Pagina 21 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Na visuele inspectie van de verschillende clusters blijkt het afkappunt 5.0 goed te voldoen. Op basis van het afkappunt voor het tweede totaalgewicht worden er 447 paren gevonden. Dit is een selectie van de 1.923 paren met het eerste totaalgewicht boven het afkappunt. Tabel 2.4 Clusters LNR ^ LNR heropnames meerlingen 2008 Aantal paren per cluster 2 3 4 5 6 8 9 10 11 12 15 21 28 Totaal
Aantal clusters
Aantal paren
26 68 1 1 77 1 2 4 2 1 13 1 2 199
52 204 4 5 462 8 18 40 22 12 195 21 56 1.923
Er worden opnieuw clusters aangemaakt om de heropnames van hetzelfde kind te vinden. Er zijn 318 meerlingkinderen die meer dan één keer zijn opgenomen (273 kinderen zijn 2 keer opgenomen, 34 kinderen 3 keer, 9 kinderen 4 keer en 2 kinderen 5 keer). Het overgebleven LNR meerlingbestand (2.078 records) bestaat uit kinderen die één keer zijn opgenomen. Het uiteindelijke LNR 2009 meerlingbestand bestaat uit de samenvoeging van het bestand van kinderen die één keer zijn opgenomen (2.078 records) en het bestand van de kinderen met heropnames (694 records van 318 kinderen). Dit bestand bevat in totaal 2.772 records van 2.396 kinderen en wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lnr_2009_meerling.sasb7dat. Dit bestand zal gebruikt worden voor de meerlingkoppeling met het gekoppelde LVR1^LVR2 bestand. Tabel 2.3 Aantal (her)opnames bij LNR meerlingen 2009 Opname 1 2 3 4 5 Totaal
Aantal records 2.078 546 102 36 10 2.772
Aantal kinderen 2.078 273 34 9 2 2.396
% Aantal records 86,7% 11,4% 1,4% 0,4% 0,1%
§2.3 Koppeling niet-gekoppelde LNR eenlingen ^ meerlingen Het niet-gekoppelde LNR eenlingbestand (23.404 records) wordt gekoppeld met het nietgekoppelde LNR meerlingbestand (2.078 records). Met blocking op geboortedatum kind en met blocking op postcode moeder worden in dit jaar geen extra paren gevonden. Er zijn in 2009 geen records gekoppeld bij de koppeling van niet-gekoppelde LNR eenlingen met nietgekoppelde meerlingen.
§2.4 Creatie LNR^LNR eindbestanden opname en kind Als vast onderdeel van de koppeling worden vanaf 2006 twee gekoppelde LNR eindbestanden aan de stichting PRN geleverd, een opname LNR bestand (met alle opnames onder elkaar) en een kind LNR bestand (met alle opnames per kind naast elkaar). Het LNR
Pagina 22 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
opnamebestand wordt gevormd door het LNR eenling eindbestand (26.896 opnamerecords van 24.980 kinderen) en het LNR meerling eindbestand (2.772 opnamerecords van 2.396 kinderen) samen te voegen, en bestaat uit 29.668 opname records (van 27.376 kinderen). Het LNR kindbestand wordt gevormd door per opnamerecord alle variabelen van een kind te voorzien van een opname nummer en deze op kind niveau naast elkaar te zetten (27.376 kinderen). Het gekoppelde LNR^LNR opnamebestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lnr_lnr_totaal2009_final.sas7bdat. Het gekoppelde LNR^LNR kindbestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lnr_lnr_kind_2009_v10_sas7bdat. Het LNR administratieve dubbel eindbestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\ lnr_admindubbel _2009_final.sas7bdat.
Pagina 23 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LNR opgeschoond 2009 bestand K:\koppeling databestanden\2009\SAS\ databestanden\lnr_opgeschoond.sas
Opgeschoond LNR 2009 bestand 29.668 records LNR eenlingen bestand 26.896 records
LNR meerlingen bestand 2.772 records
Paren aanmaken (blocking op geboortedatum kind & postcode moeder) LNR ^ LNR links
Totaal LNR ^ LNR paren boven afkappunt 1.923 records
LNR records van kinderen die 1 keer zijn opgenomen 1.410 records
Oplossen ties 1.099 clusters, 1.923 paren
Totaal LNR ^ LNR paren boven 2e afkappunt 447 paren
LNR records van kinderen die 1 keer zijn opgenomen 668 records
Records van meerling kinderen die meerdere keren zijn opgenomen 694 records
Records van meerling kinderen die 1 keer zijn opgenomen 2.078 records
LNR 2009 meerlingen bestand 2.772 records
Opslaan LNR 2009 meerlingen bestand K:\koppeling databestanden\2009\ databestanden\lnr_2009_meerling.sas.
Figuur 3B Flowchart LNR ^ LNR meerlingkoppeling
Pagina 24 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Hoofdstuk 3 Koppeling LVR1h ^ LVR2 Het doel van de LVR1h ^ LVR2 koppeling is het koppelen van LVR1h records en LVR2 records die bij dezelfde zwangerschap horen. De LVR1h ^ LVR2 koppeling wordt voor eenlingen en meerlingen afzonderlijk uitgevoerd. De methodiek van de koppelingen is een probabilistische koppeling op basis van 10 variabelen, met blocking op geboortedatum moeder en vervolgens op postcode moeder.
§3.1 Koppeling LVR1h ^ LVR2 eenlingen Het opgeschoonde LVR1h bestand wordt ingelezen (190.536 records). Uit dit bestand worden de eenlingrecords geselecteerd (185.584 records). Het opgeschoonde LVR2 bestand wordt ingelezen (126.196 records). Uit dit bestand worden de eenlingrecords geselecteerd (119.781 records). Zie figuur 3A voor een flowchart van de LVR1h^LVR2 eenlingkoppeling. Het LVR1h en LVR2 bestand worden probabilistisch gekoppeld met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (3.489.380 paren). Voor de koppeling worden de volgende 11 variabelen vergeleken (zie Tabel 3.1): postcode (geboortedatum moeder bij blocking op postcode), graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur, plaats bevalling en geboorte minuut. Voor de variabelen geboortedatum kind, à terme datum en geboortegewicht worden naast een full match ook een close gedefinieerd. Bij geboortedatum kind is er sprake van een close als de geboortedatum niet meer dan 1 dag verschilt. Bij à terme datum is er sprake van een close als de à terme datum niet meer dan 1 week verschilt. Bij gewicht is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 5 gram. De à terme datum wordt alleen vergeleken als de geboortedatum van het kind ontbreekt. De plaats bevalling wordt alleen vergeleken als de postcode van de moeder ontbreekt of niet overeenkomt. Tabel 3.1 Frequentietabel koppelvariabelen LVR1h ^ LVR2 eenlingen 2009 Variabele label LVR1h (N=185.584) Ziekenhuisnummer bevalling* Geslacht kind* Gewicht kind* Geboorte uur kind* Geboorte min kind* Geboortedatum kind* Plaats bevalling* À terme datum Postcode moeder (4 cijfers) Graviditeit Geboortedatum moeder LVR2 (N=119.781) Gewicht kind Postcode moeder (4 cijfers) Geslacht kind Graviditeit À terme datum Geboorte min kind Geboorte uur kind Geboortedatum moeder Geboortedatum kind Lvr-nummer praktijk Plaats bevalling
Variabele naam
Aantal missend
% Missend
v_klin v_kop_gesl v_kop_gew v_kop_uur v_kop_min v_ddgebkind v_pltsbev v_ddaterm v_kop_pc v_kop_grav v_ddgebmoe
65.518 30.326 30.315 30.046 30.048 29.908 27.532 20.106 469 113 5
35,3% 16,3% 16,3% 16,2% 16,2% 16,1% 13,8% 10,8% 0,26% <0,1% <0,1%
g_kop_gew g_kop_pc g_kop_gesl g_kop_grav g_ddaterm g_kop_min g_kop_uur g_ddgebmoe g_ddgebkind g_lvr g_pltsbev
327 261 223 23 8 1 0 0 0 0 0
0,27% 0,22% 0,19% 0,02% <0,01% <0,01%
*Missend is hier soms het gevolg van het terecht (logisch) ontbreken van informatie, een hoog missing percentage betekent in deze gevallen dus niet een op voorhand lage data kwaliteit.
Pagina 25 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LVR1h 2009 bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr1h_opgeschoond.sas
Inlezen LVR2 2009 bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr2_opgeschoond.sas
LVR1h 2009 bestand 190.536 records
LVR2 2009 bestand 126.196 records
LVR1h 2009 meerlingen bestand 4.952 records
LVR 2009 meerlingen bestand 6.415 records LVR1h 2009 eenlingen 185.584 records
LVR2 2009 eenlingen 119.781 records
Paren aanmaken (blocking op geboortedatum moeder&pc) LVR1h ^ LVR2 links
Niet gekoppelde LVR1 eenlingen records 83.959 records
Totaal LVR1h ^ LVR2 paren boven afkappunt 103.326 paren
LVR1 records niet gekoppeld 1.238 records
Oplossen ties 1.677 clusters, 3.378 paren
LVR1h^LVR2 links Na oplossen ties 1.677 paren
Niet gekoppelde LVR1 eenlingen records 82.721 records
Niet gekoppelde LVR2 eenlingen records 18.156 records
LVR1h^LVR2 links niet in de clusters 99.948 paren
Totaal LVR1h ^ LVR2 paren boven afkappunt 101.625 paren
Niet gekoppelde LVR2 eenlingen records 18.156 records
Totaal LVR1h ^ LVR2 paren boven afkappunt 101.625 paren
Niet gekoppelde LVR2 eenlingen records 18.156 records
Niet gekoppelde LVR1h records uit 2008 9.068 records
Niet gekoppelde LVR1 eenlingen records 73.653 records
LVR1h^LVR2 gekoppeld eenlingen bestand 193.434 records
Opslaan gekoppeld LVR1h^LVR2 2009 eenlingen bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr1_lvr2_2009_singleton.sas
Figuur 4A Flowchart LVR1h ^ LVR2 eenlingkoppeling
Pagina 26 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Tabel 3.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de ui en mi waarden met blocking op geboortedatum moeder. De ui waarden zijn berekend op basis van de randtotalen en de m i waarden op basis van fitting met een non-lineaire procedure. De ui en mi waarden met blocking op postcode zijn vergelijkbaar. Tabel 3.2 Gewichten koppelvariabelen LVR1h ^ LVR2 eenlingen 2009 Variabele Geboortedatum moeder* Postcode (4 cijfers) Geboortedatum kind (full) Geboortedatum kind ( 1dg) À terme datum (full) À terme datum ( 7 dgn) Gewicht kind (full) Gewicht kind ( 5 gr) Plaats bevalling Geboorte min kind Geboorte uur kind Graviditeit Geslacht kind
mi waarden 0,9960 0,9659 0,9748 0,0198 0,9310 0,0635 0,9531 0,00764 0,8697 0,943 0,9792 0,9461 0,9953
ui waarden 0,000661 0,000682 0,00281 0,00552 0,00273 0,0371 0,00312 0,00388 0,00808 0,01750 0,04260 0,31180 0,5004
Gewicht bij ’agreement’ 10,56 10,47 8,44 1,84 8,41 0,78 8,25 0,98 6,75 5,75 4,52 1,60 0,99
Gewicht bij ’disagreement’ -7,96 -4,87 -7,52 nvt -7,45 nvt -4,66 nvt -2,93 -4,11 -5,52 -3,67 -6,73
* deze waarden zijn berekend met blocking op postcode moeder
Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht men 0,0315 * 3.489.380 = 109.915 links te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 10,5 gekozen en worden 103.037 paren geselecteerd als link. Het LVR1h en LVR2 bestand worden nu gekoppeld met blocking op postcode paren waarbij de postcode van de moeder overeenkomt, worden aangemaakt. het afkappunt van 10,0 en waarbij de geboortedatum van de moeder niet worden geselecteerd (289 paren). Het totale gelinkte bestand bestaat recordparen (103.037+289).
moeder. Alle Paren boven overeenkomt uit 103.326
Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 99.948 paren die uniek gekoppeld zijn en 3.378 paren die in 1.677 clusters terecht komen. Er worden 1.238 LVR1h records zonder kind informatie (zogenaamde ‘losse zwangerschap’-records) verwijderd uit de clusters omdat een ander LVR1h record met meer informatie aan hetzelfde LVR2 record koppelde. Vervolgens wordt van ieder cluster het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 1.677 paren geselecteerd als link en bestaat het totale gekoppelde bestand uit 101.625 recordparen (99.948 + 1.677). De gekoppelde LVR1h records worden verwijderd uit het LVR1h eenlingbestand dat daarna nog bestaat uit records. Vervolgens worden de LVR1h ‘losse zwangerschapsrecords’ (1.238) verwijderd en bestaat het LVR1h eenling restbestand uit 82.721 records. Tot slot worden uit dit bestand de extra toegevoegde 9.068 LVR1h records uit 2008 verwijderd die niet gekoppeld zijn aan een LVR2 record van 2009, waardoor het niet-gekoppelde LVR1h bestand bestaat uit 73.653 records. De gekoppelde LVR2 records worden verwijderd uit het LVR2 eenling restbestand, dat daarna nog bestaat uit 18.156 records. Het totale gekoppelde LVR1h^LVR2 eenlingbestand bestaat uit de niet-gekoppelde LVR1h records (73.653), de gekoppelde LVR1h^LVR2 records (101.625) en de niet-gekoppelde LVR2 records (18.156). Het gekoppelde eenlingbestand bestaat uit 193.434 records en wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr1_lvr2_2009_singleton.sasb7dat.
Pagina 27 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§3.2 Koppeling LVR1h ^ LVR2 meerlingen De meerlingrecords worden geselecteerd uit het opgeschoonde LVR1h bestand (4.952 records) en uit het opgeschoonde LVR2 bestand (6.415 records). Zie figuur 3B voor een flowchart van de LVR1h ^ LVR2 meerlingkoppeling. De meerlingkoppeling wordt op dezelfde manier uitgevoerd als de eenlingkoppeling, alleen wordt er nu ook gekeken naar de LVR1h en LVR2 variabelen meerlingcode en omvang meerling. De ui en mi waarden die op basis van het eenlingbestand LVR1h^LVR2 zijn berekend worden ook hier bij de meerlingkoppeling gebruikt. Alle paren waarbij de geboortedatum van de moeder hetzelfde is, worden aangemaakt (14.407 paren). Alle paren boven het afkappunt van 14.5 waarbij de meerlingcode en omvang meerling overeenkomen of de meerlingcode en omvang meerling beide 1 zijn, worden geselecteerd als match (4.236 paren). Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 3.946 paren die uniek gekoppeld zijn en 290 paren die in de clusters terecht komen. De clusters worden bekeken en administratieve dubbelingen worden alsnog verwijderd (29 LVR1h records). Hier geldt dat records worden beschouwd als administratieve dubbeltelling, als het een ‘los zwangerschapsrecord’ betreft of als iedere waarde in de vector overeenkomt. Vervolgens wordt van ieder cluster het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 163 paren geselecteerd als link en bestaat het totale gelinkte bestand uit 4.109 recordparen. Er komen 18 LVR1h records meerdere keren voor in het bestand (4.071 unieke LVR1h records). LVR1h records met omvang meerling “1” zijn meegenomen als meerling als de reden verwijzing naar e de 2 lijn een meerlingzwangerschap was. Ieder LVR1h record is aan twee (en 1 maal aan drie) LVR2 records van deze meerling gekoppeld en komt daardoor meerdere keren voor in het gekoppelde bestand. De gekoppelde LVR1h records worden verwijderd uit het LVR1h meerlingbestand dat nu nog bestaat uit 852 records. De gekoppelde LVR2 records worden verwijderd uit het LVR2 meerlingbestand dat nu nog bestaat uit 2.306 records. Deze bestanden worden vervolgens gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode moeder overeenkomt worden aangemaakt (1.608 paren). Paren boven het afkappunt van 9.5 en waarbij de geboortedatum van de moeder niet overeenkomt en bovendien de meerlingcodes gelijk zijn of beide 1, worden geselecteerd (22 paren). Er zijn geen clusters. Het totale aantal links is 4.109 + 22 = 4.131 paren. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR1 meerlingbestand, dat nu nog uit 830 records bestaat (852-22). Uit dit bestand worden de 153 records uit 2008 verwijderd, waardoor het niet-gekoppelde LVR1h meerlingbestand bestaat uit 677 records. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR2 meerlingbestand, dat nu nog uit 2.284 records bestaat (2.306 - 22). Het totale gekoppelde LVR1h^LVR2 meerlingbestand bestaat uit de niet-gekoppelde LVR1h records (677), de gekoppelde LVR1h^LVR2 records (4.131) en de niet-gekoppelde LVR2 records (2.284). Het gekoppelde bestand bestaat uit 7.092 records en wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr1_lvr2_2009_meerling.sas7bdat.
Pagina 28 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LVR1h 2009 bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr1h_opgeschoond.sas
Inlezen LVR2 2009 bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr2_opgeschoond.sas
LVR1h 2009 bestand 190.554 records
LVR2 2009 bestand 126.196 records
LVR1h 2009 eenlingen bestand 185.602 records
LVR 2009 eenlingen bestand 119.781 records LVR1h 2009 meerlingen 4.952 records
LVR2 2009 meerlingen 6.415 records Blocking op geboortedatum moeder LVR1h ^ LVR2 links 14.407 paren
Niet gekoppelde LVR1 meerlingen records 716 records
Totaal LVR1h ^ LVR2 paren boven afkappunt 4.236 paren
LVR1 records niet gekoppeld 107 records
LVR1 administratieve dubbeltellingen 29 records
LVR2 records niet gekoppeld 127 records
Oplossen ties 125 clusters, 290 paren
LVR1h^LVR2 links Na oplossen ties 163 paren
Niet gekoppelde LVR2 meerlingen records 2.179 records
LVR1h^LVR2 links niet in de clusters 3.946 paren
Totaal LVR1h ^ LVR2 paren boven afkappunt 4.109 paren Niet gekoppelde LVR1 meerlingen records 852 records
Niet gekoppelde LVR1 meerlingen records 830 records
Niet gekoppelde LVR1h records uit 2008 153 records
Niet gekoppelde LVR1 meerlingen records 677 records
Blocking op postcode moeder LVR1h ^ LVR2 links 1.608 paren
Niet gekoppelde LVR2 meerlingen records 2.306 records
LVR1h ^ LVR2 paren boven afkappunt en geboortedatum moeder ongelijk: 22 paren
Niet gekoppelde LVR2 meerlingen records 2.284 records
Blocking op postcode LVR1h ^ LVR2 links 22 paren
Blocking op postcode*gebm LVR1h ^ LVR2 links 4.131 paren
Niet gekoppelde LVR2 meerlingen records 2.284 records
LVR1h^LVR2 gekoppeld meerlingen bestand 7.092 records
Opslaan gekoppeld LVR1h^LVR2 2009 meerlingen bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr1_lvr2_2009_meerling.sas
Figuur 4B Flowchart LVR1h ^ LVR2 meerlingkoppeling
Pagina 29 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§3.3 Koppeling niet-gekoppelde LVR1h eenlingen met LVR2 meerlingen Het niet-gekoppelde LVR1h eenlingbestand (73.665 records) wordt gekoppeld met het nietgekoppelde LVR2 meerlingbestand (4.159 records). Bij blocking op geboortedatum moeder worden 56 paren gevonden boven het afkappunt van 27,0. Na het oplossen van de clusters worden er 54 paren geselecteerd als link. Blocking op postcode moeder levert geen extra paren.
§3.4 Koppeling niet-gekoppelde LVR1h meerlingen met LVR2 eenlingen Het niet-gekoppelde LVR1h meerlingbestand (2.551 records) wordt gekoppeld met het nietgekoppelde LVR2 eenlingbestand (18.143 records). Bij blocking op geboortedatum moeder worden 43 paren gevonden boven het afkappunt van 19.0. Na het oplossen van de clusters worden er 40 paren geselecteerd als link. Blocking op postcode moeder levert geen extra paren.
§3.5 Creatie LVR1h^LVR2 eindbestand Uit het LVR1h^LVR2 eenling eindbestand (193.434 records) worden de records verwijderd die nog gekoppeld zijn bij de koppeling van niet-gekoppelde eenlingen met meerlingen (94 paren). Het LVR1h^LVR2 eenling eindbestand bestaat uit 193.340 records. De gevonden links bij de koppeling van niet-gekoppelde eenlingen met meerlingen worden toegevoegd aan het meerling eindbestand (40 paren). Tevens worden de records die nog gekoppeld zijn, verwijderd uit het meerling eindbestand (40 records). Het LVR1h^LVR2 meerling eindbestand bestaat uit 7.092 records (zie tabel 3.3). De gekoppelde LVR1h^LVR2 eenling en meerling eindbestanden worden weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\ lvr1_lvr2_singleton_2009_final.sas7bdat. K:\Koppeling databestanden\2009\SAS\databestanden\ lvr1_lvr2_meerling_2009_final.sas7bdat. De LVR1 en LVR2 administratieve dubbel eindbestanden worden weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\ lvr1_admindubbel_final _2009.sas7bdat. K:\Koppeling databestanden\2009\SAS\databestanden\ lvr2_admindubbel_final_2009.sas7bdat.
Tabel 3.3 Overzicht van de LVR1h ^ LVR2 koppeling 2009
Geschoond bestand LVR1h eenling LVR2 eenling LVR1h^LVR2 eenling LVR1h meerling LVR2 meerling LVR1h^LVR2 meerling
Voor koppeling
Na koppeling
Na eenling/meerling koppeling
193.434
193.340
7.092
7.092
185.584 119.781 4.952 6.415
Pagina 30 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Hoofdstuk 4 Koppeling (LVR1h ^ LVR2) ^ LNR Het doel van de (LVR1h ^ LVR2) ^ LNR koppeling is het koppelen van LVR1h2 records en LNR records die bij dezelfde moeder en kind horen voor eenlingen en meerlingen. De methodiek van de koppelingen is een probabilistische koppeling op basis van 7 variabelen, met blocking op geboortedatum kind en vervolgens op postcode moeder.
§4.1 Koppeling (LVR1h ^ LVR2) ^ LNR eenlingen Het gekoppelde LVR1h2 eenlingbestand (193.340 records) en het gekoppelde LNR eenlingbestand (26.896 records) wordt ingelezen. Uit het gekoppelde LNR bestand wordt van ieder kind maar één record geselecteerd (24.980 records). Zie figuur 4A voor een flowchart van de (LVR1h^LVR2)^LNR eenlingkoppeling. Het LVR1h2 en LNR bestand worden probabilistisch gekoppeld met blocking op geboortedatum kind en variabelen vergeleken (zie Tabel 4.1): postcode (geboortedatum kind bij blocking op postcode), geboortedatum moeder, zwangerschapsduur in weken, gewicht, geslacht en Apgar-score na 5 minuten. Voor de variabele geboortegewicht wordt naast een full match ook een close gedefinieerd: er is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 20 gram. Tabel 4.1 Frequentietabel koppelvariabelen LVR1h2 ^ LNR eenlingen Variabele label LVR1h2 (n=193.340) Zwangerschapsduur in weken Geslacht kind Apgar-score na 5 minuten Gewicht kind Geboortedatum kind Postcode moeder (4 cijfers) Geboortedatum moeder LNR (n=24.980) Geboortedatum moeder Apgar-score na 5 minuten Postcode moeder (4 cijfers) Gewicht kind Zwangerschapsduur in weken Geslacht kind Geboortedatum kind
Variabele naam
Aantal missend
% Missend
vg_kop_amw vg_kop_gesl vg_kop_apg vg_kop_gew vg_ddgebkind vg_kop_pc vg_ddgebmoe
19.728 18.869 18.807 18.773 18.582 282 1
10,2% 9,7% 9,7% 9,7% 9,6% 0,1% <0,01%
n_ddgebmoe n_kop_apg n_kop_pc n_kop_gew n_kop_amw n_kop_gesl n_ddgebkind
2.861 833 1.827 197 209 6 0
11,5% 3,3% 7,3% 0,8% 0,8% 0,02% 0%
Pagina 31 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LVR1h2 2009 bestand K:\Koppeling databestanden\ 2009\SAS\ databestanden\ lvr1h_lvr2_2009_singleton_final.sas
Inlezen LNR 2009 bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lnr_2009_singleton.sas
LNR 2009 eenlingen bestand 126.196 records
Heropnames 1.916 records
LVR1h2 2009 eenlingen 193.340 records
LNR 2009 eenlingen 1 record per kind 24.980 records
Paren aanmaken (blocking op geboortdatum kind & postcode) LVR1h2^LNR links
Niet gekoppelde LVR1h2 eenlingen records 169.419 records
Totaal LVR1h2 ^ LNR paren boven afkappunt 23.941 paren
LVR1h2 records niet gekoppeld 273 records
Niet gekoppelde LVR1h2 eenlingen records 169.692 records
LNR records niet gekoppeld 20 records
Oplossen ties 278 clusters, 571 paren
LVR1h2^LNR links Na oplossen ties 278 paren
Niet gekoppelde LNR eenlingen records 1.312 records
LVR1h^LVR2 links niet in de clusters 23.370 paren
Totaal LVR1h2 ^ LNR paren boven afkappunt 23.648 paren
Niet gekoppelde LNR eenlingen records 1.332 records
LVR1h2^LNR gekoppeld eenlingen bestand 194.672 records
Opslaan gekoppeld LVR1h2^LNR 2009 eenlingen bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr1_lvr2_lnr_2009_eenling.sas
Figuur 5A Flowchart (LVR1h^ LVR2) ^ LNR eenlingkoppeling
Pagina 32 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Tabel 4.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de ui en mi waarden. De ui waarden zijn berekend op basis van de randtotalen en de mi waarden op basis van fitting met een non-lineaire procedure. Tabel 4.2 Gewichten koppelvariabelen LVR1h2 ^ LNR eenlingen blocking op geboortedatum kind Variabele Geboortedatum moeder Postcode moeder Geboortedatum kind* Gewicht kind (full) Gewicht kind ( 20 gr) Zwangerschapsduur in weken Geslacht kind Apgar-score na 5 minuten
mi waarden 0,9852 0,9771 0,9832 0,9116 0,0430 0,9704 0,9883 0,9132
ui waarden 0,000152 0,000546 0,00272 0,00269 0,0176 0,1546 0,5007 0,4869
Gewicht bij ’agreement’ 12,66 10,81 8,50 8,40 1,29 2,65 1,00 0,91
Gewicht bij ’disagreement’ -6,08 -5,45 -5,89 -4,43 nvt -4,84 -8,20 -2,56
* deze waarden zijn berekend met blocking op postcode moeder
Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht men 0,00201*12.150.010=24.421 links te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 12.8 gekozen en worden 23.741 paren geselecteerd als link. Zie figuur 4B voor de verdeling van de links rond het afkappunt.
1750 1500
Count
1250 1000 750 500 250 0 3.5
5.5
7.5
9.5 11.5 13.5 15.5 17.5 19.5 21.5 23.5 25.5 27.5 29.5 31.5 33.5
wgttot Figuur 5B LVR1h^LVR2^LNR paren met blocking geboorte datum moeder 2009 Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder overeenkomt (2.844.606 paren). Paren boven het afkappunt van 8,6 en waarbij de geboortedatum van het kind niet overeenkomt, worden geselecteerd (200 paren). Het totale gelinkte bestand bestaat nu uit 23.941 records. Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 23.370 paren die uniek gekoppeld zijn en 571 paren die in de clusters terecht komen. Vervolgens worden van iedere cluster de recordparen met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 278 paren geselecteerd als link en bestaat het totale gelinkte bestand uit 23.648 recordparen (23.370 + 278).
Pagina 33 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
De gekoppelde LVR1h2 records worden verwijderd uit het LVR1h2 eenlingbestand dat nu nog bestaat uit 169.692 records. De gekoppelde LNR records worden verwijderd uit het LNR eenlingbestand dat nu nog bestaat uit 1.332 records. Het totale gekoppelde LVR1h2^LNR eenlingbestand bestaat uit de niet-gekoppelde LVR1h2 records (169.692), de gekoppelde LVR1h2^LNR records (23.648) en de niet-gekoppelde LNR records (1.332). Het gekoppelde eenlingbestand bestaat uit 194.672 records en wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr1_lvr2_lnr_singleton.sasb7dat
§4.2 Koppeling LVR1h2 ^ LNR meerlingen Het gekoppelde LVR1h2 meerlingbestand (7.092 records) en het gekoppelde LNR meerlingbestand (2,772 records) wordt ingelezen. Uit het gekoppelde LNR bestand wordt van ieder kind maar één record geselecteerd (2.396 records). Zie figuur 4B voor een flowchart van de LVR1h2 ^ LNR meerlingkoppeling. De meerlingkoppeling wordt op dezelfde manier uitgevoerd als de eenlingkoppeling, alleen wordt er nu ook gekeken naar de meerlingcode en omvang meerling. De ui en mi waarden die op basis van het eenlingbestand zijn berekend worden ook hier gebruikt. Alle paren waarbij de geboortedatum van het kind hetzelfde is, worden aangemaakt (51.389 paren). Alle paren met een totaalgewicht groter of gelijk aan 15.5 en waarbij ofwel de meerlingcode en omvang meerling overeenkomen, ofwel deze codes gelijk zijn aan ‘1’, worden geselecteerd als link (2.209 paren). Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder overeenkomt (14.671 paren). Paren boven het afkappunt van 12.1 waarbij de geboortedatum van het kind niet overeenkomt, de meerlingcode en omvang meerling overeenkomen, ofwel gelijk zijn aan ‘1’, worden geselecteerd (86 paren). Het totale gelinkte bestand bestaat nu uit 2.295 paren. Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 2.030 paren die uniek gekoppeld zijn en 265 paren die in de clusters terecht komen (113 clusters). Van iedere cluster worden de recordparen met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 113 paren geselecteerd als link en bestaat het totale gelinkte bestand uit 2.143 (2.030+113) recordparen. De gekoppelde LVR1h2 records worden verwijderd uit het LVR1h2 meerlingbestand dat nu nog bestaat uit 4.949 records. De gekoppelde LNR records worden verwijderd uit het LNR meerlingbestand dat nu nog bestaat uit 253 records. Het totale gekoppelde LVR1h2^LNR meerlingbestand bestaat uit de niet-gekoppelde LVR1h2 records (4.949), de gekoppelde LVR1h2^LNR records (2.143) en de niet-gekoppelde LNR records (253). Het gekoppelde bestand bestaat uit 7.345 records en wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr1_lvr2_lnr_2008_meerling.sasb7dat
§4.3 Koppeling niet-gekoppelde LVR1h2 eenlingen met LNR meerlingen Het niet-gekoppelde LVR1h2 eenlingbestand (169.692 records) wordt gekoppeld met het nietgekoppelde LNR meerlingbestand (253 records). Bij blocking op geboortedatum kind worden 14 links gevonden boven het afkappunt van 10,0. Vier van deze paren zitten in clusters, waarvan het paar met het hoogste koppelgewicht wordt geselecteerd. Blocking op postcode moeder levert geen extra paren op. In totaal zijn er dus 12 links.
§4.4 Koppeling niet-gekoppelde LVR1h2 meerlingen met LNR eenlingen Het niet-gekoppelde LVR1h2 meerlingbestand (4.949 records) wordt gekoppeld met het nietgekoppelde LNR eenlingbestand (1.332 records). Bij blocking op geboortedatum kind worden 80 links gevonden boven het afkappunt van 21,5. Blocking op postcode moeder levert geen extra paren op. Van deze 80 paren zijn er 40 uniek en 40 die in een cluster zitten. Oplossen van de clusters levert 19 extra paren. Er zijn in totaal dus 59 links.
Pagina 34 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Inlezen LVR1h2 2009 bestand K:\Koppeling databestanden\ 2009\SAS\ databestanden\ lvr1h_lvr2_2009_meerling_final.sas
Inlezen LNR 2009 bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lnr_2009_meerling.sas
LNR 2009 meerlingen bestand 2.772 records
Heropnames 376 records
LVR1h2 2009 meerlingen 7.092 records
LNR 2009 meerlingen 1 record per kind 2.396 records
Paren aanmaken (blocking op geboortdatum kind & postcode) LVR1h2^LNR links
Niet gekoppelde LVR1h2 meerlingen records 4.851 records
Totaal LVR1h2 ^ LNR paren boven afkappunt 2.295 paren
LVR1h2 records niet gekoppeld 98 records
Niet gekoppelde LVR1h2 meerlingen records 4.949 records
LNR records niet gekoppeld 51 records
Oplossen ties 113 clusters, 265 paren
LVR1h2^LNR links Na oplossen ties 113 paren
Niet gekoppelde LNR meerlingen records 202 records
LVR1h^LVR2 links niet in de clusters 2.030 paren
Totaal LVR1h2 ^ LNR paren boven afkappunt 2.143 paren
Niet gekoppelde LNR meerlingen records 253 records
LVR1h2^LNR gekoppeld meerlingen bestand 7.345 records
Opslaan gekoppeld LVR1h2^LNR 2009 meerlingen bestand K:\Koppeling databestanden\2009\SAS\ databestanden\lvr1_lvr2_lnr_2009_meerling.sas
Figuur 5C Flowchart (LVR1h ^ LVR2) ^ LNR meerlingkoppeling
Pagina 35 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
§4.5 Creatie eindbestand (LVR1h ^ LVR2) ^ LNR De extra gevonden links bij de koppeling van niet-gekoppelde eenlingrecords met meerlingrecords (12 paren) worden verwijderd uit het LVR1h2^LNR eenling eindbestand (194.660 records). Het LVR1h2^LNR 2009 eenling eindbestand bestaat uit 194.601 records. De extra gevonden links bij de koppeling van niet-gekoppelde eenlingrecords met meerlingrecords (59 paren) worden toegevoegd aan het meerlingbestand (7.345 records). Tevens worden de records die nu nog gekoppeld zijn, verwijderd uit het meerling eindbestand. Het LVR1h2^LNR 2009 meerling eindbestand bestaat uit 7.345 records. Het eenling eindbestand en het meerling eindbestand vormen samen het totale eindbestand van de 2008 koppeling. Dit PRN gekoppeld bestand 2009 bestaat uit 201.946 records (zie tabel 4.3). Het totale gekoppelde LVR1h^LVR2^LNR eindbestand wordt weggeschreven naar: K:\Koppeling databestanden\2009\SAS\databestanden\lvr12_lnr_totaal2009_final.sas7bdat.
Tabel 4.3 Overzicht van aantal records in de LVR1h^LVR2^LNR koppeling 2009
Geschoond bestand LVR1h^LVR2 eenling LNR eenling LVR1h^LVR2^LNR eenling LVR1h^LVR2 meerling LNR meerling LVR1h^LVR2^LNR meerling LVR1h^LVR2^LNR totaal
Voor koppeling
Na koppeling
Na eenling/meerling koppeling
194.672
194.601
7.345
7.345 201.946
193.340 26.896 7.092 2.772
Pagina 36 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Hoofdstuk 5 PRN jaar 2009 bestanden §5.1 Beschrijving gekoppelde eindbestanden Als product van het PRN koppelingsproject 2009 wordt het totale gekoppelde bestand LVR1h^LVR2^LNR 2009 opgeleverd aan de Stichting PRN. Het totale gekoppelde bestand wordt aangeleverd in drie delen: 1) het “LVR1h_LVR2_LNR_2009 versie 1.0.sas7bdat” e bestand (1 opname in LNR), 2) het “LNR_LNR_2009 versie 1.0.sas7bdat” bestand met alle opnames van hetzelfde kind onder elkaar (noemer = opname), en 3) het “LNR_LNR_kind_2009 versie 1.0.sas7bdat” bestand met alle opnames van hetzelfde kind achter elkaar (noemer = kind). Een beschrijving van alle variabelen die in het aangeleverde gekoppelde bestand voorkomen, wordt gegeven aan het einde van dit document. Naam bestand LVR1h_LVR2_LNR_2009 LNR_LNR_2009 LNR_LNR_kind_2009
Versienummer Versie 1.0 Versie 1.0 Versie 1.0
Aantal records 201.946 29.668 27.376 e
Het totale gekoppelde PRN bestand 2009 (LVR1h^LVR2^(LNR 1 opname)) bestaat uit 201.946 records en 599 variabelen. Het totale gekoppelde LNR 2009 bestand (met alle LNR opnames) bestaat uit 29.668 records en 319 variabelen. Het totale gekoppelde LNR kindbestand 2009 bestaat uit 27.376 records en 1.879 variabelen. Deze bestanden zijn gemaakt in SAS en zijn geconverteerd naar ASCII formaat en worden aan de PRN geleverd in twee formaten. Het SAS bestanden bevat ook label informatie over de variabelen (zie appendix B).
Een aantal variabelen werd gedefinieerd voor het koppelen. Deze variabels zijn (o.a.): LVR1h registratie: - v_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LVR1 record. - v_recid_b is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de eerste administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - v_recid_c is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de tweede administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - v_recid_d is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de derde administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. LVR2 registratie: - g_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LVR2 record. - g_recid_b is de door LinKID aangemaakte recordidentificatie van het LVR2 record, dat de eerste administratieve dubbeltelling van het in de zesde kolom (g_recid) gedefinieerde LVR2 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden.
Pagina 37 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
LNR registratie: - k_recid_1 is de door LinKID aangemaakte recordidentificatie van het LNR record. - k_admin_1 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de negende kolom (n_recid1) gedefinieerde LNR record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde opname van een kind twee keer geteld zou worden. - k_recid_2 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een tweede opname is van het kind waarvan het in de negende kolom gedefinieerde record (n_recid1) de eerste opname betreft. - k_admin_2 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de elfde kolom (n_recid2) gedefinieerde LNR record is. - k_recid_3 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een derde opname is van het kind waarvan het in de negende kolom gedefinieerde record (n_recid1) de eerste opname betreft. - k_admin_3 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de dertiende kolom (n_recid3) gedefinieerde LNR record is. - Indien meerdere opnames worden ook meerdere volgnummers gegeven
§5.2 Toegevoegd variabelen Een aantal variabelen zijn toegevoegd aan het gekoppelde bestand. Variabelen die gedefinieerd zijn binnen het LVR1 bestand hebben het voorvoegsel “v_”, variabelen gedefinieerd binnen het LVRh bestand die niet omgevormd konden worden tot een LVR1 variabele hebben het voorvoegsel “h_”, variabelen gedefinieerd binnen het LVR2 bestand hebben het voorvoegsel “g_” en die binnen LNR hebben sinds 2009 het voorvoegsel “k”, vanwege de nieuwe LNR dataset (de vorige LNR dataset had n_ als voorvoegsel). Sommige variabelen zijn ook gebruikt om de koppeling uit te voeren. Dit wordt ook aangegeven met het tussenvoegsel “kop”. Er is ook een klein aantal variabelen toegevoegd die gebruikt worden op het gekoppelde bestand. Ze hebben het voorvoegsel “l_” (LINKID variabelen). Hieronder is een tabel met de namen van de variabelen, hun definitie en hun eigenschappen. Variabelen zonder definitie zijn direct gelezen van de brondata (LVR1, LVRh, LVR2, LNR).
Pagina 38 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
Bron LVR1
LVRh
Naam v_recid v_ddgebmoe v_ddgebkind v_ddaterm v_dat1ond v_datvlies v_datovdr v_pariteit
Beschrijving Recordidentificatie geboortedatum moeder geboortedatum kind a terme datum e datum 1 onderzoek datum breken vliezen datum overdracht Pariteit
Definitie v<jaar>_
v_kop_grav v_multipari
graviditeit (koppelvariabel) multipariteit (j/n)
v_amddd v_amwww v_kop_amd v_kop_gesl
amenorroeduur in dagen amenorroeduur in weken amenorroeduur in dagen (koppelvariabel) geslacht (koppelvariabel)
v_kop_omv
meerling (j/n) (koppelvariabel)
v_kop_gew v_kop_mort
geboortegewicht kind (koppelvariabel) kind overleden in 1e of 2e lijn (koppelvariabel)
v_kop_pc v_kop_uur v_kop_min
postcode (koppelvariabel) geboorteuur kind (koppelvariabel) geboortemin kind (koppelvariabel)
v_recid v_ddgebmoe v_ddgebkind v_ddaterm v_dat1ond v_datvlies v_datovdr v_pariteit
Recordidentificatie Geboortedatum moeder Geboortedatum kind A terme datum Datum 1e onderzoek Datum breken vliezen Datum overdracht Pariteit
v_kop_grav v_multipari
Graviditeit (koppelvariabel) Multipariteit (j/n)
v_amddd v_amwww
Amenorroeduur in dagen Amenorroeduur in weken
Verschil tussen graviditeit en aantal abortussen (gelijk aan graviditeit als aantal abortussen missend) gelijk aan graviditeit 1 = pariteit>=2 0 = pariteit=1 280 + verschil tussen geboortedatum en a terme datum amenorroeduur gedeeld door 7 gelijk aan amenorroeduur in dagen 1 = jongen 2 = meisje 0 = kind eenling 1 = kind (een van een) meerling gelijk aan geboortegewicht kind 0 = kind niet overleden 1 = kind overleden gelijk aan postcode gelijk aan geboorteuur kind gelijk aan geboortemin kind v<jaar>_
Verschil tussen graviditeit en aantal abortussen (gelijk aan graviditeit als aantal abortussen missend) Gelijk aan graviditeit 1 = pariteit>=2 0 = pariteit=1 280 + verschil tussen geboortedatum en a terme datum Amenorroeduur gedeeld door 7 Pagina 39 van 65
Type string datum datum datum datum datum datum integer integer binair
Range
0/1
integer continu integer integer
84-329 12-47
binair
0/1
continu integer
200-6000gm
integer integer integer
1000-9999 0-24 0-59
String Datum Datum Datum datum Datum Datum Integer Integer binair
0/1
Integer Continu
84-329 12-47
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
LVR2
LNR
v_kop_amd v_kop_gesl
Amenorroeduur in dagen (koppelvariabel) Geslacht (koppelvariabel)
v_kop_omv
Meerling (j/n) (koppelvariabel)
v_kop_gew v_kop_mort
Geboortegewicht kind (koppelvariabel) Kind overleden in 1e of 2e lijn (koppelvariabel)
v_kop_pc v_kop_uur v_kop_min
Postcode (koppelvariabel) Geboorteuur kind (koppelvariabel) Geboortemin kind (koppelvariabel)
g_recid g_ddgebmoe g_ddgebkind g_ddaterm g_ddvorkin g_dat1ond g_ddontsl g_pariteit
Recordidentificatie geboortedatum moeder geboortedatum kind a terme datum datum vorige bevalling datum 1e onderzoek Ontslagdatum Pariteit
g_kop_grav g_multipari
graviditeit (koppelvariabel) multipariteit (j/n)
g_amddd g_amwww g_kop_amd g_kop_gesl
amenorroeduur in dagen amenorroeduur in weken amenorroeduur in dagen (koppelvariabel) geslacht (koppelvariabel)
g_kop_omv
meerling (j/n) (koppelvariabel)
g_kop_pc g_kopovern_var
postcode (koppelvariabel) overgenomen uit 1e lijn (j/n)
g_kop_mort
kind overleden in 1e of 2e lijn
g_kop_uur g_kop_min
geboorteuur kind (koppelvariabel) geboortemin kind (koppelvariabel)
k_recid k_ddgebkind
Recordidentificatie geboortedatum kind
Gelijk aan amenorroeduur in dagen 1 = jongen 2 = meisje 0 = kind eenling 1 = kind (een van een) meerling Gelijk aan geboortegewicht kind 0 = kind niet overleden 1 = kind overleden Gelijk aan postcode Gelijk aan geboorteuur kind Gelijk aan geboorteminuut kind
Integer Integer
g<jaar>_
string datum datum datum datum datum datum integer
Verschil tussen graviditeit en aantal abortussen (gelijk aan graviditeit als aantal abortussen missend) gelijk aan graviditeit 0 = pariteit=1 1 = pariteit>=2 280 + verschil tussen geboortedatum en a terme datum amenorroeduur gedeeld door 7 gelijk aan amenorroeduur 1 = jongen 2 = meisje 0 = kind eenling 1 = kind (een van een) meerling gelijk aan postcode 0 = niet overgenomen 1 = overgenomen 0 = kind niet overleden 1 = kind overleden gelijk aan geboorte uur kind gelijk aan geboorte min kind n<jaar>_
Pagina 40 van 65
Binair Continu Integer Integer Integer integer
0-20
integer integer integer continu integer binair
84-329 12-47
binair
0/1
integer Integer
1000-9999
1/2
integer integer integer string datum
0-24 0-59
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.0, maart 2012
LINKID
k_ddgebmoe k_ddopname k_ddontslag k_kop_amw k_kop_gew k_kop_gesl
geboortedatum moeder Opnamedatum Ontslagdatum amenorroeduur in weken (koppelvariabel) geboortegewicht kind (koppelvariabel) geslacht (koppelvariabel)
k_kop_pc k_kop_apg
postcode (koppelvariabel) Apgar-score (5 min) (koppelvariabel)
l_vg_wgtmax l_vg_wgttot l_vgn_wgtmax l_vgn_wgttot l_her
max weight van niet gekoppelde LVR1^LVR2 linkage weight bij LVR1^LVR2 max weight van niet gekoppelde LVR12^LNR linkage weight bij LVR12^LNR (her)opnamenummer
l_kindovl
kind overleden in de LNR (j/n, ongeacht in welke heropname) Identificatienummer LINKID
l_kind
gelijk aan amenorroeduur gelijk aan geboortegewicht kind 1 = jongen 2 = meisje gelijk aan postcode gelijk aan Apgar-score (5 min)
e
1 = 1 opname e e 2 = 2 opname of 1 heropname e e n = n opname of (n-1) heropname 0 = kind niet overleden 1 = kind overleven
Pagina 41 van 65
datum datum datum integer continu binair
<6000gm 1/2
integer integer
1000-9999 0-10
continu continu continu continu integer
integer String
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
§5.3 Mogelijke dubbeltelling Bij het aanmaken van het gekoppelde LVR1 bestand zijn een aantal records uit het voorafgaande jaar ingelezen als kandidaten voor koppeling met records uit het LVR1 bestand. Niet gekoppelde records van het voorafgaande jaar zijn verwijderd van het ‘huidige’ LVR1 bestand maar zijn niet verwijderd van het oudere bestand. Het is dus mogelijk dat sommige records zijn geteld zowel in het LVR1 bestand van het betreffende jaar als in het LVR1 bestand van het voorgaande jaar. Bij gebruik van de gekoppelde bestanden over meerdere jaren moet hiermee rekening worden gehouden. In de gekoppelde PRN bestanden die bewerkt zijn voor de PRN jaarboeken is dit probleem niet aanwezig.
§5.4 Controles op het gekoppelde PRN jaarbestand De volgende controles zijn uitgevoerd op de drie gekoppelde PRN eindbestanden bestand: 1) aantal records: voor elk bestand (LVR1/LVRh/LVR2/LNR) moet het aantal records (inclusief administratieve dubbeltellingen en heropnames) gelijk zijn aan het aantal records in het oorspronkelijke bestand. 2) elke record in het ASCII bestand moet precies één keer voorkomen in de gekoppelde bestanden (inclusief administratieve dubbels en heropnames). 3) het geboortejaar van het kind moet overeenkomen met het jaar waarin de koppeling wordt gedaan. 4) een 15-tal niet koppelvariabelen wordt gecontroleerd op voorkomen (freq) in het eindbestand.
§5.5 Versie beheer en bestandnaam PRN Jaarbestand Bij het afronden van een gekoppeld jaarbestand krijgt het jaarbestand het versie 1.0 nummer. Indien er nog kleine wijzigingen doorgevoerd worden op het bestand naar aanleiding van commentaar gebruikers, wordt er een nieuw bestand uitgegeven. Dit bestand krijgt dan versienummer 1.1 enz. Indien de procedure of het algoritme wordt aangepast en er een herziening plaatsvindt van de koppelingsmethodiek, wordt er een nieuw bestand uitgegeven met versienummer 2.0. Bij het afronden van de documentatie krijgt het rapport versie 1.0 nummer. Indien er tekstuele wijzigingen in het rapport worden doorgevoerd naar aanleiding van commentaar gebruikers, wordt er een nieuw rapport uitgegeven met versienummer 1.1. Deze documentatie behoort nog steeds bij jaarbestand versie 1.0. Bij aanpassing van de procedure of algoritme, met een nieuw bestand (versie 2.0) kan een nieuwe documentatie worden uitgegeven met versienummer 2.0.
§5.6 Versie beheer van PRN rapporten over PRN Jaarbestand e
De rapportage over de PRN koppeling heeft ook een versiebeheer. Het totale 1 concept is intern bij PRN besproken en in de tussentijd is dit concept beoordeeld door dr. A.C. Ravelli. Dit aangepaste concept wordt aangeboden aan het LinkID team van het AMC. Hierna zal het rapport definitief gemaakt worden. Indien er later tekstuele aanpassingen plaatsvinden in de rapporten krijgt dit rapport een versienummer 1.1. Naam rapport LVR1h_LVR2_LNR_2009 LVR1h_LVR2_LNR_2009 LVR1h_LVR2_LNR_2009
Versienummer Versie 0.4 Versie 0.5 Versie 1.0
Status Concept PRN Concept LinkID Definitief
Pagina 42 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Epiloog De koppeling van de LVR1, LVRh, LVR2 en LNR perinatale deelregistraties voor 2009 heeft geleid tot een PRN jaarbestand 2009, wat op dezelfde wijze gebruikt kan worden als de PRN jaarbestanden 2000 tot en met 2008. Er zijn geen aanpassingen gedaan aan de koppelingsmethodiek ten opzichte van 2008. De resultaten van de koppeling van 2009 zijn vergelijkbaar met de resultaten van 2000 tot en met 2008. De tien bestanden kunnen in combinatie gebruikt worden voor PRN gegevensverstrekkingen en PRN producten zoals het PRN jaarboek.
Vergelijking met PRN koppelingen van andere jaren Wanneer we aannemen dat de bronbestanden voor 2000 tot en met 2009 vergelijkbaar zijn wat betreft omvang, samenstelling, gebruikte classificaties voor de variabelen, toegepaste coderingsregels en voorbewerking tot aan de aanlevering aan PRN, is de vergelijking van de resultaten voor de verschillende jaren zinvol en van belang voor het beoordelen van de stabiliteit van het koppelingsprotocol. Een zeer gevoelige maat hiervoor zijn de koppelgewichten die op basis van de datasets berekend worden. Alleen als in alle opzichten de koppeling vergelijkbaar is en de databestanden gelijk van inhoud, ontstaan vergelijkbare gewichten. Tabel E1, E2 en E3 geven de koppelgewichten weer voor de LVR1h^LVR2 koppeling, de LNR^LNR koppeling en de (LVR1h^LVR2)^LNR eenlingkoppeling voor 2007, 2008 en 2009. De gewichten zijn goed vergelijkbaar voor de drie jaren. Tabel E1 Koppelgewichten LVR1h^LVR2 eenling koppeling [15-16] (Blocking op geboortedatum moeder) Variabele Gewichten 2007 Gewichten 2008 agree disagree agree disagree 1 geboortedatum moeder 10,49 -7,53 10,51 -7,70 postcode moeder 10,45 -4,76 10,52 -4,85 geboortedatum kind (full) 8,45 -7,52 8,48 -7,47 geb.dat. kind (close 1 dag) 1,74 Nvt 1,82 nvt aterme datum (full) 8,45 -7,04 8,47 -7,14 aterme datum (close 7 dgn) 0,82 Nvt 0,94 nvt geboortegewicht (full) 8,16 -4,59 8,16 -4,60 geboortegewicht (close 5g) 0,99 Nvt 1,11 nvt plaats bevalling 6,83 -3,28 6,77 -3,33 geboorte minuut 5,73 -4,04 5,77 -4,03 geboorte uur 4,51 -5,49 4,52 -5,46 graviditeit 1,60 -3,67 1,61 -3,61 geslacht kind 0,99 -6,53 0,99 -6,48 1
Gewichten 2009 agree disagree 10,56 -7,96 10,47 -4,87 9,44 -7,52 1,84 Nvt 8,41 -7,45 0,78 Nvt 8,25 -4,66 0,98 Nvt 6,75 -2,93 5,75 -4,11 4,52 -5,52 1,60 -3,67 0,99 -6,73
deze waarden zijn berekend met blocking op postcode moeder
Tabel E2 Koppelgewichten LNR^LNR koppeling [15-16] (Blocking op geboortedatum kind) Variabele geboortedatum moeder patiënt id (binnen ziekenhuis) postcode moeder geboortegewicht (full) geboortegewicht (close 50g) 1 geboortedatum kind zwangerschapsduur in weken Apgar-score na 5 min geslacht kind 1
Gewichten 2007 agree disagree 12,34 -3,60 12,63 -1,35 10,00 -4,68 8,60 -5,12 1,58 nvt 8,48 -4,84 2,94 -4,49 1,22 -2,70 0,95 -4,14
Gewichten 2008 agree disagree 10,22 -3,20 nvt nvt 9,66 -4,67 8,78 -3,23 1,77 Nvt 8,45 -6,94 3,00 -5,37 1,30 -3,73 0,97 -5,04
deze waarden zijn berekend met blocking op postcode moeder
Pagina 43 van 65
Gewichten 2009 Agree disagree 12,45 -4,97 Nvt Nvt 9,49 -4,31 8,62 -3,53 1,51 -0,04 8,48 -6,76 2,95 -5,31 1,29 -3,43 0,97 -5,21
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Tabel E3 Koppelgewichten LVR1h2^LNR koppeling [15-16] (Blocking op geb. datum kind) Variabele geboortedatum moeder postcode moeder 1 geboortedatum kind geboortegewicht (full) geboortegewicht (close 20g) zwangerschapsduur in weken geslacht kind Apgar-score na 5 min 1
Gewichten 2007 agree disagree 12,62 -5,59 10,81 -4,92 8,48 -6,11 8,38 -4,37 1,45 nvt 2,65 -4,55 0,98 -5,18 0,91 -2,34
Gewichten 2008 Agree disagree 12,69 -4,68 10,73 -5,29 8,47 -5,97 8,42 -5,13 1,61 nvt 2,66 -4,63 0,98 -5,13 0,90 -2,41
deze waarden zijn berekend met blocking op postcode moeder
Pagina 44 van 65
Gewichten 2009 agree disagree 12,66 -6,08 10,81 -5,45 8,50 -5,89 8,40 -4,43 1,29 Nvt 2,65 -4,84 1,00 -8,20 0,91 -2,56
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Referenties [1] Newcombe HB. Handbook of Record Linkage, Methods for Health and Statistical Studies. Oxford University Press, 1998. [2] Registers in Cardiovascular Epidemiology. Reitsma JB, thesis University Amsterdam, ISBN 90 901 3206 6, Nov 1999.
Rapportages losse registraties: [3] PRN/Tieto. Praktijkanalyse LVR1 2009. e 1 Lijns verloskunde, Bunnik, apr 2010. [4] PRN/Tieto. Praktijkanalyse LVR2 2009. Verloskundig jaarverslag, Bunnik, mrt 2010 [5] PRN. Praktijkanalyse LNR 2009. Landelijke Neonatale registratie, Utrecht, juli 2010. [6] PRN. Rapportage LVRh 2009. Rapportage verloskundig actieve huisartsen, Utrecht 2010.
Rapportage van eerdere PRN koppelingen: [7] Koppelingsprocedure PRN 2001: Deel I. Hoofdlijnen. Auteurs GJ Bonsel, JB Reitsma, N Méray, ACJ Ravelli Afd.Klin. Informatiekunde Technisch rapport 2004-03, versie 1.0, AMC, Amsterdam, Juni 2004. [8] Koppelingsprocedure PRN 2001: Deel II. Beschrijving en Toelichting. Auteurs GJ Bonsel, JB Reitsma, ACJ Ravelli, N Méray, Miranda Tromp Afd. Klin. Informatiekunde Technisch rapport 2004-04, versie 1.0, AMC, Amsterdam, Juni 2004. [9] Koppelingsprocedure PRN 2002: Beschrijving en Toelichting. Auteurs N Méray, Miranda Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klin. Informatiekunde Technisch rapport 2005-03, versie 1.0, AMC, Amsterdam, Feb 2005. [10] Koppelingsprocedure PRN 2003: Beschrijving en Toelichting. Auteurs N Méray, Miranda Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klin. Informatiekunde, Technisch rapport 2005-04, versie 1.0, AMC, Amsterdam, Mei 2005. [11] Koppelingsprocedure PRN 2000: Beschrijving en Toelichting. Auteurs J McDonnell, Miranda Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klin. Informatiekunde Technisch rapport 2005-05, versie 1.0, AMC, Amsterdam, Okt 2005. [12] Koppelingsprocedure PRN 2004: Beschrijving en Toelichting. Auteurs J McDonnell, Miranda Tromp, ACJ Ravelli, JB Reitsma, GJ Bonsel Afd. Klin. Informatiekunde Technisch rapport 2006-01, versie1.0, AMC, Amsterdam, Mrt 2006. [13] Koppelingsprocedure PRN 2005: Beschrijving en Toelichting. Auteurs Marc Tromp, Miranda Tromp, ACJ Ravelli, JB Reitsma, JAM van der Post Afd. Klin. Informatiekunde Technisch rapport 2007-03, versie1.0 AMC, Amsterdam, Apr 2007. [14] Koppelingsprocedure PRN 2006: Beschrijving en Toelichting. Auteurs Marc Tromp, Miranda Tromp, ACJ Ravelli, JB Reitsma, JAM van der Post Afd. Klin. Informatiekunde Technisch rapport 2007-05, versie1.1, AMC, Amsterdam, Nov 2007. [15] Koppelingsprocedure PRN 2007: Beschrijving en Toelichting. Auteurs Marc Tromp, Miranda Tromp, ACJ Ravelli, JB Reitsma, JAM van der Post Afd. Klin. Informatiekunde Technisch rapport 2008-03, versie1.0, AMC, Amsterdam, Okt 2008. [16] Koppelingsprocedure PRN 2008: Beschrijving en Toelichting. Auteurs Marc Tromp, ACJ Ravelli, JB Reitsma, JAM van der Post Afd. Klin. Informatiekunde Technisch rapport 2009-01, versie1.0, AMC, Amsterdam, Sep 2009.
Rapportages van validatie studies van de PRN koppelingen [17] Validatie koppelingsprocedure PRN 2001. Empirische validatie LVR1 & LVR2 koppeling. Auteurs GJ Bonsel, ACJ Ravelli, JB Reitsma, N Méray Afd. Klinische Informatiekunde Technisch rapport 2004-01, AMC, Amsterdam, Mei 2005. [18] Validatie koppelingsprocedure PRN 2001. Technische beschrijving Validatie LVR1 & LVR2 koppeling. Auteurs GJ Bonsel, N Méray, ACJ Ravelli, JB Reitsma Afd. Klinische Informatiekunde Technisch rapport 2004-02, AMC, Amsterdam, Mei 2005.
Pagina 45 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
[19] LNR-registratie Compleetheid, Datakwaliteit en Validatie LNR koppeling Auteurs Miranda Tromp, ACJ Ravelli, N Méray, JB Reitsma, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2005-06, AMC, Amsterdam, Dec 2005.
Rapportages van koppelingen PRN bestand met externe bestanden [20] Koppelingsprocedure PRN 2003 met ABCD bestand 2003. Auteurs M Tromp, ACJ Ravelli, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2006-02, AMC, Amsterdam, April 2006. [21] Koppelingsprocedure PRN 2003 en 2004 met ABCD bestand 2003-2004. Auteurs M Tromp, ACJ Ravelli, GJ Bonsel Afd. Klinische Informatiekunde Technisch rapport 2006-03, AMC, Amsterdam, Sept 2006. [22] Pilot koppeling PRN- en CBS-registraties. Methoden en resultaten. Auteurs M Berger-van Sijl, M Tromp, A de Bruin, ACJ Ravelli, A Gast, JWPF Kardaun, WP Schaasberg, GJ Bonsel Afd. Klinische Informatiekunde, Technisch rapport 2007-07, AMC, Amsterdam, mei 2007.
Output rapportages op basis van de gekoppelde PRN bestanden [23] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2001. ISBN 90 901 9204-2, Bilthoven, mei 2005. [24] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2002. ISBN 978-90-809666-2-8, Bilthoven, dec 2005. [25] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2003. ISBN 978-90-809666-3-5, Bilthoven, juli 2006. [26] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2004. ISBN 978-90-809666-4-2, Utrecht, dec 2007. [27] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2005. ISBN 978-90-809666-5-9, Utrecht, mei 2008. [28] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2006. ISBN 978-90-809666-6-6, Utrecht, sep 2008. [29] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2007. ISBN 978-90-809666-7-3, Utrecht, aug 2009. [30] Stichting Perinatale Registratie Nederland. Perinatale Zorg in Nederland 2008. ISBN 978-90-809666-8-0, Utrecht, apr 2011. [31] Stichting Perinatale Registratie Nederland. 10 jaar Perinatale Registratie Nederland, de grote lijnen. ISBN 978-90-809666-0-4, Utrecht, okt 2011.
Artikelen op basis van de koppeling van de perinatale registraties [32] Record Linkage: Making the most out of errors in linking variables. Tromp M, Reitsma JB, Ravelli ACJ, Méray N, Bonsel GJ AMIA Annual Symposium Proc, 2006;779-83. [33] Probabilistic record linkage is a valid and transparent tool to combine databases without a patient identification number. Méray N, Reitsma JB, Ravelli ACJ, Bonsel GJ, Journal of Clinical Epidemiology, 60 (2007) 883-391. [34] Ignoring dependency between linking variables and its impact on the outcome of probabilistic record linkage studies Tromp M, Méray N, Ravelli ACJ, Reitsma JB, Bonsel GJ J Am Med Inform Assoc. 2008 Jun 25. [Epub ahead of print] [35] An efficient validation method of record linkage including readmissions and twins Tromp M, Ravelli ACJ, Méray N, Reitsma JB, Bonsel GJ Methods Inf Med. 2008;47(4):356-63.
Pagina 46 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Websites [36] Stichting PRN website: www.perinatreg.nl [37] Afdeling Klinische Informatiekunde website: http://www.amc.nl/web/Research/Departments/Overview/Medical-Informatics-KIK-1/Medical-InformaticsKIK.htm [38] CBS website: http://statline.cbs.nl
Pagina 47 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Begrippen Gegeven Uitkomst Eenling
Meerling
Administratieve dubbeltelling
Cross-sectioneel koppelen Longitudinaal koppelen
Deterministisch koppelen
Probabilistisch koppelen
Match (non-matches) Link (non-links) Koppel(ings)sleutel Blocking-variabele
Vector
Full Close
Gegeven zoals vastgelegd in registratie. Een meetbare representatie van het doel van zorg op individuniveau. Een record dat informatie bevat van een zwangere met een enkel(voudig)e zwangerschap. Tot een enkele zwangerschap wordt beslist bij afwezigheid van aanwijzingen voor een meerling in 2 variabelen: meerlingcode en reden overdracht: wegens meerlingzwangerschap. Ook wordt soms de term singleton gebruikt. Een record dat informatie bevat van een zwangere met een meerling zwangerschap. Deze informatie betreft meerlingcode niet gelijk 1 en/of overdracht wegens meerlingzwangerschap. Twee of meer records in een bestand die volledig identiek zijn op de koppelsleutel; dit kan bij koppelen van een bestand met zichzelf het gevolg zijn van een echt duplicaat record of van de aanwezigheid van een record met dezelfde koppelsleutel. Het koppelen van gegevens waarbij de gegevens van slechts 1 primaire gebeurtenis (hier zwangerschap) met elkaar worden verbonden in tegenstelling tot longitudinaal koppelen (zie onder). Het koppelen van gegevens van verschillende primaire gebeurtenissen die in de tijd gescheiden zijn. Dit kan zowel betrekking hebben op gegevens uit 1 registratie of uit meerdere registraties. Koppeling waarbij alle (of een bepaald aantal van het totaal van de koppelsleutel) variabelen overeen moeten komen om te spreken van een link. Als de koppelsleutel n variabelen bevat spreekt men over een volledig deterministische koppeling als n waarden moeten corresponderen, over n-1 koppeling als er 1 willekeurig welke variabele mag verschillen, etc. Koppeling waarbij voor iedere variabele van de koppelsleutel een mate van overeenstemming wordt bepaald die via een statistische bewerking wordt vertaald in een gewicht dat hoger is naarmate de kans op overeenstemming van het betreffende record op basis van deze variabele groter is. De statistische bewerking voorziet in, per variabele, een gewicht dat commensurabel is waardoor een totaalgewicht kan worden berekend. A priori of via berekening wordt bij probabilistisch koppelen een drempel vastgesteld waarboven twee gekoppelde records worden verondersteld te behoren tot dezelfde registratie-eenheid (dit heet 'link'). Wanneer externe informatie over de werkelijke status (al dan niet behorend tot dezelfde eenheid; 'match' of 'non-match') beschikbaar is, dus een gouden standaard, dan kan het begrippenapparaat worden toegepast dat ontwikkeld is ten behoeve van evaluatie van (medische) tests om de kwaliteit van de koppeling te beschrijven (bv. x% fout positieve links, etc.). (E) Twee records horen bij elkaar op basis van de werkelijke status. (E) Twee records horen vermoedelijk (niet) bij elkaar op basis van het gewicht van de koppelsleutel. De set gemeenschappelijke variabelen uit 2 of meer te koppelen bestanden die voor het koppelen wordt gebruikt. (E) Records worden alleen met elkaar vergeleken als ze overeenstemmen op de blocking-variabele; een blocking-variabele is idealiter foutloos en informatierijk; toepassing van blocking vereenvoudigt de omvang van het koppelen aanzienlijk. Geeft het overeenkomen van koppelvariabelen weer met een positie voor iedere koppelvariabele, die de uitslag van overeenstemming weergeeft voor die variabele (‘1’ bij overeenstemming, ‘2’ bij klein verschil, ‘0’ bij groot verschil, ‘.’ bij missende waarde). (E) adjectief om op variabelenniveau aan te geven dat een koppelvariabele qua waarde exact overeenkomt tussen records. (E) adjectief om op variabelenniveau aan te geven dat een koppelvariabele niet exact overeenkomt, maar wel - op gedefinieerde wijze - voldoende overeenkomt om niet van 'fout' te Pagina 48 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
mi (1-mi) ui (1-ui) Afkappunt
Tie
kunnen spreken. De kans dat koppelvariabele i overeenstemt (verschilt) onder paren die werkelijk bij elkaar horen (matches). De kans dat koppelvariabele i overeenstemt (verschilt) onder paren die niet bij elkaar horen (non-matches). Synoniem: drempel, (E) threshold. Een gekozen totaalgewicht bij een probabilistische koppeling, waarboven paren als een link worden beschouwd. (E) een record uit het ene koppelbestand koppelt aan meerdere records uit het andere koppelbestand, deze multiple koppelingen heten ties; bij deterministisch koppellen en de eis van volledige overeenstemming berust een tie per definitie op een administratieve dubbeltelling (zie boven).
Pagina 49 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Appendix A: Aantal LNR records in 2009 per praktijk en datakwaliteit koppelvariabelen in de losse niet geschoonde LNR registratie Tabel A1: Algemene ziekenhuizen LNR praktijk N01 N02 N03 N04 N05 N06 N07 N08 N09 N10 N11 N12 N13 N14 N15 N16 N17 N18 N19 N20 N21 N22 N23 N24 N25 N26 N27 N28 N29 N30 N31 N32 N33 N34 N35 N36 N=36
aantal records
Frequentie missings geb. datum moeder postcode*
#
#
%
#
%
779 603 74 657 295 937 883 634 60 507 457 102 368 345 338 1110 751 559 18 812 154 502 175 2077 2 371 1498 322 1191 445 1042 423 403 1271 1706 625 22.496
6 550 0 60 3 12 10 25 54 493 4 3 31 280 7 14 8 22 1 6 2 1 161 40 0 3 18 6 9 11 5 231 375 49 14 1 2.515
0,8 91,2 0 9,1 1,0 1,3 1,1 3,9 90,0 97,2 0,9 2,9 8,4 81,2 2,1 1,3 1,1 3,9 5,6 0,7 1,3 0,2 92,0 1,9 0,0 0,8 1,2 1,9 0,8 2,5 0,5 54,6 93,1 3,9 0,8 0,2 11,2
1 13 0 7 2 4 0 2 47 302 4 3 26 46 10 11 16 400 2 3 0 2 81 6 0 1 20 11 24 1 7 366 244 13 0 3 1.678
0,1 2,2 0 1,1 0,7 0,4 0 0,3 78,3 59,6 0,9 2,9 7,1 13,3 3,0 1,0 2,1 71,6 11,1 0,4 0 0,4 46,3 0,3 0 0,3 1,3 3,4 2,0 0,2 0,7 86,5 60,5 1,0 0 0,5 7,5
*in een aantal gevallen is i.p.v. de postcode een andere variabele missing (bv gewicht)
Pagina 50 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Tabel A2: Academische ziekenhuizen (NICU aanlevering) LNR praktijk N44 N45 N46 N47 N48 N49 N50 N51 N52 N53 N=10
aantal records # 315 1.147 304 610 1.329 1.118 454 492 752 773 7.294
Frequentie missings geb. datum moeder postcode* # % # 19 6,0 2 12 1,0 41 16 5,3 77 1 0,2 1 851 64,0 323 23 2,1 1 2 0,4 2 9 1,8 3 15 2,0 1 10 1,3 2 958 13,1 453
% 0,6 3,6 25,3 0,2 24,3 0,1 0,4 0,6 0,1 0,3 6,2
A3: Totaal LNR praktijken LNR praktijk N= 46
aantal records 29.790
Frequentie missings geb. datum moeder postcode* 3.473 11,7% 2.131 7,2%
*in een aantal gevallen is i.p.v. de postcode een andere variabele missing (bv gewicht)
Pagina 51 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Appendix B: Contents gekoppelde bestand LVR1h^LVR2^LNR 2009 # Variable
Type
Len Label
1 v_recid
Char
2 v_id
Char
4 registratie identificatie
3 v_prak
Num
8 uniek praktijk nr
4 v_actie
Num
8 actiecode SIG
5 v_admin
Char
6 padministratienr binnen praktijk
6 v_mc
Num
8 meerlingcode
7 v_omv
Num
8 omvang meerling
8 v_ozA
Char
1 onze zorg betrof (A)
9 v_ozB
Char
1 onze zorg betrof (B)
10 v_ozTOT
Char
2 onze zorg betrof A+B
11 v_nrvk
Char
4 nr vk/ha
12 v_dd1ond
Char
6 datum 1e onderzoek
13 v_d1ond_d
Num
8 dag, datum 1e onderzoek
14 v_d1ond_m
Num
8 maand, datum 1e onderzoek
15 v_d1ond_j
Num
8 jaar, datum 1e onderzoek
16 v_contact
Num
8 hoe kwam contact tot stand
17 v_ddgebm
Char
6 geboorte datum moeder
18 v_mdat_d
Num
8 gebdatum moeder, dag
19 v_mdat_m
Num
8 gebdatum moeder, maand
20 v_mdat_j
Num
8 gebdatum moeder, jaar
21 v_pc2
Num
8 postcode -2 cijfers
22 v_pc
Num
8 postcode -4 cijfers
23 v_her
Num
8 herkomst moeder
24 v_grav
Num
8 graviditeit
25 v_abo
Num
8 aant.abortus
26 v_addat
Char
6 datum aterme ddmmyy
27 v_addat_d
Num
8 dag, datum aterme
28 v_addat_m
Num
8 maand, datum aterme
29 v_addat_j
Num
8 jaar, datum aterme
30 v_zek
Num
8 zekerheid amen
31 v_ovlg
Num
8 overlegsit/medium risk
32 v_redovlg
Char
3 reden overlegsituatie/medrisk
33 v_ondA
Char
2 onderzoek/verrichting A
34 v_ondB
Char
2 onderzoek/verrichting B
35 v_ondC
Char
2 onderzoek/verrichting C
36 v_aangep
Num
8 aangepakt door
37 v_superv
Num
8 supervisie door
38 v_ddvlies
Char
4 datum breken vliezen (ddmm)
39 v_vlies_d
Num
8 dag, datum breken vliezen
40 v_vlies_m
Num
8 maand, datum breken vliezen
41 v_uuvlies
Num
8 uur breken vliezen
18 recordidentificatie -LinKID
Pagina 52 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
42 v_amnio
Num
8 amniotomie
43 v_vrwat
Num
8 kleur vruchtwater
44 v_ontsl
Num
8 ontsluitingsduur
45 v_uupers
Num
8 uur begin meepersen
46 v_mmpers
Num
8 min begin meepersen
47 v_lig
Num
8 ligging
48 v_peri1
Num
8 perineum/vulva 1
49 v_peri2
Num
8 perineum/vulva 2
50 v_peri3
Num
8 perineum/vulva 3
51 v_medicpp
Num
8 medicatie na geb kind
52 v_hpp
Num
8 bloedverlies
53 v_gesl
Num
8 geslacht
54 v_ddgeb
Char
6 kind geboortedatum ddmmyy
55 v_kind_d
Num
8 kind geboortedatum, dag
56 v_kind_m
Num
8 kind geboortedatum, maand
57 v_kind_j
Num
8 kind geboortedatum, jaar
58 v_gebuur
Num
8 uur geboorte kind
59 v_gebmin
Num
8 min geboorte kind
60 v_apg
Num
8 Apgar-score na 5 min
61 v_gew
Num
8 gewicht
62 v_weeg
Num
8 weegmethode
63 v_kraam
Num
8 kraamzorg
64 v_voed
Num
8 voeding 7e dag
65 v_lyn2red1
Char
3 reden zorg 2e lijn 1
66 v_lyn2red2
Char
3 reden zorg 2e lijn 2
67 v_mort1
Num
8 kind overleden 1e lijn
68 v_mort2
Num
8 kind overleden 2e lijn
69 v_pltsplan
Num
8 geplande plaats bevalling
70 v_pltsecht
Num
8 echte plaats bevalling
71 v_klin
Num
8 ziekenhuisnr bevalling
72 v_lconsgyn
Num
8 laatste consult gyn
73 v_redcon1
Char
3 reden consult gyn 1
74 v_redcon2
Char
3 reden consult gyn 2
75 v_redcon3
Char
3 reden consult gyn 3
76 v_overdr
Num
8 overdracht naar 2e lijn
77 v_klinovdr
Num
8 ziekenhuisnr overdracht
78 v_ddovdr
Char
6 datum overdracht, ddmmyy
79 v_ovdr_d
Num
8 dag, datum overdracht
80 v_ovdr_m
Num
8 maand, datum overdracht
81 v_ovdr_j
Num
8 jaar, datum overdracht
82 v_redovd1
Char
3 reden overdracht 1
83 v_redovd2
Char
3 reden overdracht 2
84 v_redovd3
Char
3 reden overdracht 3
Pagina 53 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
85 v_conska
Num
8 consult kinderarts
86 v_redconka
Char
2 reden consult kinderarts
87 v_overdrka
Char
1 overdracht kinderarts
88 v_redovdka
Char
2 reden overdr kinderarts
89 v_klinka
Num
8 ziekenhuis kinderarts
90 v_probk1
Char
2 problemen kind 1
91 v_probk2
Char
2 problemen kind 2
92 v_probk3
Char
2 problemen kind 3
93 v_bijz1
Char
2 bijzonderheden 1
94 v_bijz2
Char
2 bijzonderheden 2
95 v_bijz3
Char
2 bijzonderheden 3
96 v_probmoe1
Char
3 problemen moeder 1
97 v_probmoe2
Char
3 problemen moeder 2
98 v_probmoe3
Char
3 problemen moeder 3
99 v_indcode1
Char
2 individule codering 1
100 v_indcode2
Char
2 individule codering 2
101 v_indcode3
Char
2 individule codering 3
102 v_partus
Char
6 partusnummer -vrouw binnen praktijk
103 v_lft
Num
8 leeftijd moeder -Prismant
104 v_amwwd
Num
8 zwangerschapsduur in ww+d -Prismant
105 v_epzwk
Num
8 eigen prenatale zorg vanaf n-de wk -Prismant
106 v_indzorg
Num
8 indicatie zorg -Prismant
107 v_amwws
Num
8 am.duur in weeken -Prismant
108 v_par
Num
8 pariteit -Prismant
109 v_jaar
Num
8 registratiejaar -Prismant
110 v_fout
Char
1 foutcode -Prismant
111 v_ddgebmoe
Num
8 geboortedatum moeder, date -LinKID
112 v_ddgebkind
Num
8 geboortedatum kind, date -LinKID
113 v_ddaterm
Num
8 a terme datum, date -LinKID
114 v_dat1ond
Num
8 datum 1e onderzoek, date -LinKID
115 v_datovdr
Num
8 datum overdracht, date -LinKID
116 v_pariteit
Num
8 pariteit -LinKID
117 v_kop_grav
Num
8 graviditeit als koppelvariabel -LinKID
118 v_multipari
Num
8 multipari j/n -LinKID
119 v_amddd
Num
8 amenorroeduur in dagen -LinKID
120 v_amwww
Num
8 amenorroeduur in weken -LinKID
121 v_kop_amd
Num
8 am.duur in dagen als koppelvariabel -LinKID
122 v_kop_gew
Num
8 gewicht als koppelvariabel -LinKID
123 v_kop_gesl
Num
8 geslacht als koppelvariabel -LinKID
124 v_kop_omv
Num
8 meerling, volgens meerlingcode, j/n -LinKID
125 v_omv_ovdr
Num
8 meerling, volgens reden overdracht, j/n -LinKID
126 v_kop_mort
Num
8 kind overleden in 1e of 2e lijn -LinKID
127 v_kop_pc
Num
8 postcode (4 cijfers) als koppelvariabele -LinKID
Pagina 54 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
128 v_kop_uur
Num
8 geboorteuur kind als koppelvariabele -LinKID
129 v_kop_min
Num
8 geboortemin kind als koppelvariabele -LinKID
130 h_agbnr
Num
8 agb-nummer
132 h_prkovn
Num
8 praktijknummer waaruit patiënte is overgenomen
133 h_geblm
Char
20 geboorteland moeder
134 h_gebpltsm
Char
21 geboorteplaats moeder
135 h_ddvor
Char
8 geboortedatum laatste kind
136 h_ddvor_d
Num
8 geboortedatum laatste kind, dag
137 h_ddvor_m
Num
8 geboortedatum laatste kind, maand
138 h_ddvor_j
Num
8 geboortedatum laatste kind, jaar
139 h_par
Num
8 pariteitsnummer
140 h_conc
Num
8 wijze conceptie
141 h_gyn1con
Num
8 gynaecologisch consult1
142 h_gyn2con
Num
8 gynaecologisch consult2
143 h_klincon
Num
8 praktijknummer waar patiënte gynaecoloog geconsulteerd heeft
144 h_pcpltsbev
Num
8 indien geen thuis bevalling, pc plaats bevalling
145 h_waarn
Num
8 functie aanpakker
146 h_prwaarn
Num
8 praktijknummer aanpakker
147 h_uubb
Num
8 uur begin baring
148 h_minbb
Num
8 minuut begin baring
149 h_medicpp_b
Num
8 medicatie na geboorte2
150 h_medicpp_c
Num
8 medicatie na geboorte3
151 h_ddgebkind
Num
8 geboortedatum kind, date -LinKID
152 h_tijd_begin
Char
24 tijdstip begin baring
153 h_tijd_pers
Char
24 tijdstip begin actief meepersen
155 l_vg_wgtmax
Num
156 g_recid
Char
157 g_id
Char
4 recordnummer
158 g_lvr
Num
8 lvr-nummer praktijk
159 g_actie
Num
8 actiecode -Prismant
160 g_partus
Char
6 partusnummer
161 g_mc
Num
8 meerlingcode
162 g_omv
Num
8 omvang meerling
163 g_ddgebm
Char
6 geboortedatum moeder
164 g_moegeb_d
Num
8 dag geboortedatum moeder
165 g_moegeb_m
Num
8 maand geboortedatum moeder
166 g_moegeb_j
Num
8 jaar geboortedatum moeder
167 g_pc
Num
8 postcode
168 g_pc2
Num
8 eerste 2 cijfers van postcode
169 g_her
Num
8 herkomst moeder
170 g_grav
Num
8 graviditeit
171 g_abo
Num
8 aant.abortus
172 g_dd_vor
Char
6 datum vorige bevalling
8 maximum weight van niet gekoppelde lvr1^lvr2 -LinKID 18 recordidentificatie -LinKID
Pagina 55 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
173 g_ddvor_d
Num
8 dag datum vorige bevalling
174 g_ddvor_m
Num
8 maand datum vorige bevalling
175 g_ddvor_j
Num
8 jaar datum vorige bevalling
176 g_lvr_vor
Num
8 lvrnr zkhs vorige bevalling
177 g_overname
Num
8 overname uit 1e/2e lijn
178 g_prak_ov
Num
8 praktijknr overname
179 g_bgl
Num
8 begeleiding door u
180 g_dd1ond
Char
4 datum 1e onderzoek, date -LinKID
181 g_dd1ond_d
Num
8 dag datum 1e onderzoek
182 g_dd1ond_m
Num
8 maand datum 1e onderzoek
183 g_iuvd1
Num
8 dood bij 1e ond
184 g_ten
Num
8 hoogste diastolische tensie
185 g_ddat
Char
6 a terme datum
186 g_ddat_d
Num
8 dag a terme datum
187 g_ddat_m
Num
8 maand a terme datum
188 g_ddat_j
Num
8 jaar a terme datum
189 g_zek
Num
8 zekerheid amen
190 g_aangep
Num
8 aangepakt door
191 g_gyn
Num
8 gynnr baring
192 g_superv
Num
8 supervisie door
193 g_gynsup
Num
8 gynnr supervisie
194 g_bb1
Num
8 begin baring 1
195 g_bb2
Num
8 begin baring 2
196 g_indbeg
Num
8 indicatie inl/scp
197 g_ddvlies
Char
4 datum breken vliezen
198 g_ddvlies_d
Num
8 dag datum breken vliezen
199 g_ddvlies_m
Num
8 maand datum breken vliezen
200 g_uuvlies
Num
8 uur breken vliezen
201 g_fetloss
Num
8 aantal fetal loss (>20 wkn)
202 g_uupers
Num
8 uur begin meepersen
203 g_mmpers
Num
8 min begin meepersen
204 g_lig
Num
8 ligging
205 g_hlp1
Num
8 hulp bij baring 1
206 g_hlp2
Num
8 hulp bij baring 2
207 g_indhlp
Num
8 indicatie hulp
208 g_peri1
Num
8 perineum 1
209 g_peri2
Num
8 perineum 2
210 g_nageb1
Num
8 nageboortetijdperk 1
211 g_nageb2
Num
8 nageboortetijdperk 2
212 g_gesl
Num
8 geslacht
213 g_ddgeb
Char
6 geboortedatum kind
214 g_kindgeb_d
Num
8 dag geboortedatum kind
215 g_kindgeb_m
Num
8 maand geboortedatum kind
Pagina 56 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
216 g_kindgeb_j
Num
8 jaar geboortedatum kind
217 g_gebuur
Num
8 uur geboorte
218 g_gebmin
Num
8 min geboorte
219 g_gew
Num
8 gewicht
220 g_apg
Num
8 Apgar-score na 5 min
221 g_mort
Num
8 mortaliteit
222 g_cgm1
Char
2 cong.afw/trauma 1
223 g_cgm2
Char
2 cong.afw/trauma 2
224 g_cgm3
Char
2 cong.afw/trauma 3
225 g_pediat
Num
8 pediatr.betrokkenheid
226 g_huis
Num
8 kind mee naar huis
227 g_ddontm
Char
4 datum ontslag moeder
228 g_ddontm_d
Num
8 dag datum ontslag moeder
229 g_ddontm_m
Num
8 maand datum ontslag moeder
230 g_matmort
Num
8 maternale mort
231 g_bijz1
Char
2 bijz.-1
232 g_bijz2
Char
2 bijz.-2
233 g_bijz3
Char
2 bijz.-3
234 g_bijz4
Char
2 bijz.-4
235 g_bijz5
Char
2 bijz.-5
236 g_bijz6
Char
2 bijz.-6
237 g_bijz7
Char
2 bijz.-7
238 g_redov1
Char
2 reden 1 overname
239 g_redov2
Char
2 reden 2 overname
240 g_redov3
Char
2 reden 3 overname
241 g_concep1
Num
8 wijze conceptie 1
242 g_concep2
Num
8 wijze conceptie 2
243 g_conmed1
Char
2 medicatie 1 conceptie
244 g_conmed2
Char
2 medicatie 2 conceptie
245 g_conmed3
Char
2 medicatie 3 conceptie
246 g_stimul
Num
8 stimulatie
247 g_pijn1
Num
8 pijnbestrijding 1
248 g_pijn2
Num
8 pijnbestrijding 2
249 g_prot
Num
8 proteinurie j/n
250 g_prot_mg
Num
8 proteinurie in mg/l
251 g_IVFnr
Char
5 IVF-nummer
252 g_admin
Char
6 administratienr uit 1e lijn
253 g_par
Num
8 pariteit -Prismant
254 g_lft
Num
8 leeftijd moeder -Prismant
255 g_amwwd
Num
8 zwangerschapsduur in ww+d -Prismant
256 g_epzwk
Num
8 eigen prenatale zorg vanaf n-de wk -Prismant
257 g_ddgebmoe
Num
8 geboortedatum moeder, date -LinKID
258 g_ddgebkind
Num
8 geboortedatum kind, date -LinKID
Pagina 57 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
259 g_ddaterm
Num
8 a terme datum, date -LinKID
260 g_ddvorkin
Num
8 datum vorige bevalling, date -LinKID
261 g_ddontsl
Num
8 ontslagdatum, date -LinKID
262 g_pariteit
Num
8 pariteit -LinKID
263 g_kop_grav
Num
8 graviditeit als koppelvariabel -LinKID
264 g_multipari
Num
8 multipariteit j/n -LinKID
265 g_amddd
Num
8 amenorroeduur in dagen -LinKID
266 g_amwww
Num
8 amenorroeduur in weken -LinKID
267 g_kop_amd
Num
8 am. duur in dagen als koppelvariabele -LinKID
268 g_kop_gew
Num
8 gewicht als koppelvariabel -LinKID
269 g_kop_gesl
Num
8 geslacht als koppelvariabel -LinKID
270 g_kop_omv
Num
8 meerling, volgens meerlingcode -LinKID
271 g_kop_pc
Num
8 postcode (4 cijfers) als koppelvariabele -LinKID
272 g_kopovern_var
Num
8 overgenomen uit 1e ijn? j/n -LinKID
273 g_kop_mort
Num
8 kind overleden in 1e of 2e lijn -LinKID
274 g_kop_uur
Num
8 geboorteuur kind als koppelvariabele -LinKID
275 g_kop_min
Num
8 geboortemin kind als koppelvariabele -LinKID
276 l_vg_wgttot
Num
8 linkage weight bij LVR1^LVR2 -LinKID
278 l_kind
Num
8 kindnummer in LNR -LinKID
279 l_vgk_wgttot
Num
8 linkage weight bij LVR12^LNR -LinKID
280 k_recid
Char
20 LNR record identificatie -LinKID
281 k_moeID
Char
10 MoederID
282 k_kindid
Char
10 KindID
283 k_opnid
Char
10 OpnameOntslagID
284 k_lnr
Num
285 k_typ_zrg
Char
286 praktijknummergeboorte
Num
8 praktijknummer geboorte kind
289 k_ddgebm
Num
8 Geboortedatumvrouw
290 k_jrgebm
Num
8 Geboortejaarvrouw
291 k_mndgebm
Num
8 Geboortemaandvrouw
292 k_daggebm
Num
8 Geboortedagvrouw
294 k_lnd_NLmoe
Num
8 GeboortelandNederlandvrouw
295 k_land_moe
Num
8 Geboortelandvrouw
296 k_contvro
Num
8 Geboortecontinentvrouw
297 k_toe_reg
Num
8 Toestemmingregistratievrouwenkind
298 k_toe_verif
Num
8 Toestemmingverificatieregistratiegegevensvrouwenkind
299 k_pc_moe
Num
8 Postcodevrouw
300 k_patid_moe
Char
301 k_verzek
Num
8 Verzekeringvrouw
302 k_opl_moe
Num
8 Opleidingvrouw
304 k_lnd_NLpart
Num
8 Nederlandgeboortelandpartnervanvrouw
305 k_land_part
Num
8 Geboortelandpartnervanvrouw
306 k_contpart
Num
8 Geboortecontinentpartnervanvrouw
8 VroPraktijknummergeboorte 22 type zorgverlener
30 PIDnrinuwpraktijkvrouw
Pagina 58 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
307 k_behopn
Num
8 Behandelingenvrouwtijdensopname
308 k_typebeh8
Char
1 TypeBehandelingenvrouwtijdensopname9
309 k_typebeh1
Char
1 TypeBehandelingenvrouwtijdensopnameA
310 k_typebeh2
Char
1 TypeBehandelingenvrouwtijdensopnameB
311 k_typebeh3
Char
1 TypeBehandelingenvrouwtijdensopnameC
312 k_typebeh4
Char
1 TypeBehandelingenvrouwtijdensopnameD
313 k_typebeh5
Char
1 TypeBehandelingenvrouwtijdensopnameE
314 k_typebeh6
Char
1 TypeBehandelingenvrouwtijdensopnameF
315 k_typebeh7
Char
1 TypeBehandelingenvrouwtijdensopnameG
316 k_drugs
Num
8 Drugsgebruiktijdensdezwangerschap
317 k_typedrugs1
Char
1 Typedrugsgebruiktijdensdezwangerschap1
318 k_typedrugs2
Char
1 Typedrugsgebruiktijdensdezwangerschap2
319 k_typedrugs3
Char
1 Typedrugsgebruiktijdensdezwangerschap3
320 k_typedrugs4
Char
1 Typedrugsgebruiktijdensdezwangerschap4
321 k_typedrugs5
Char
1 Typedrugsgebruiktijdensdezwangerschap5
322 k_typedrugs6
Char
1 Typedrugsgebruiktijdensdezwangerschap6
323 k_typedrugs7
Char
1 Typedrugsgebruiktijdensdezwangerschap7
324 k_typedrugs8
Char
1 Typedrugsgebruiktijdensdezwangerschap8
325 k_typedrugs9
Char
1 Typedrugsgebruiktijdensdezwangerschap9
326 k_typedrugs10
Char
2 Typedrugsgebruiktijdensdezwangerschap10
327 k_typedrugs11
Char
2 Typedrugsgebruiktijdensdezwangerschap11
328 k_bloedmoe
Num
8 Bloedgroepvrouw
329 k_rheD_moe
Num
8 RhesusDfactorvrouw
330 k_grav
Num
8 Graviditeitsnummer
331 k_pari
Num
8 Pariteitsnummer
332 k_omv
Num
8 Meerlingomvang
335 k_gesl
Num
8 Geslachtkind
336 k_ddgeb
Num
8 Geboortedatumkind
337 k_jrgeb
Num
8 Geboortejaarkind
338 k_mndgeb
Num
8 Geboortemaandkind
339 k_daggeb
Num
8 Geboortedagkind
340 k_mc
Num
8 Volgnummermeerlingzwangerschapkind
341 k_lnd_NLkind
Num
8 GeboortelandNederlandKind
342 k_land_kind
Num
8 IndiengeboortelandkindnietNederland
343 k_etn
Num
8 EtniciteitRaskind
344 k_pc_ki
Char
6 Postcodekind
346 k_patid_ki
Char
347 k_gebplts
Num
8 Plaatsvangeboortekind
348 k_zkhsnrbar
Num
8 Ziekenhuisnummerbaring
349 k_amww
Num
8 Zwangerschapsduurweken
350 k_amd
Num
8 Zwangerschapsduurdagen
351 k_amdd
Num
8 Zwangerschapsduurindagenbijgeboortekind
352 k_gew
Num
8 Geboortegewichtkind
30 PIDnrinuwpraktijkkind
Pagina 59 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
353 k_gew_23_977
Num
8 Geboortegewichtp23of977bevestiging
354 k_geb_len
Num
8 Geboortelengtekind
355 k_ligkind
Num
8 Liggingkindbijgeboorteenpresentatievoorliggenddeel
356 k_mort
Num
8 Sterftekind
357 k_apgar_1
Num
8 Apgar-score na 1 min
358 k_apgar_5
Num
8 Apgar-score na 5 min
359 k_apgar57
Num
8 Apgar-score 5-7 bevestiging
360 k_rean_ki
Num
8 Reanimatiekind
361 k_rean1
Char
1 MiddelreanimatiekinddoorkinderartsA
362 k_rean2
Char
1 MiddelreanimatiekinddoorkinderartsB
363 k_rean3
Char
1 MiddelreanimatiekinddoorkinderartsC
364 k_rean4
Char
1 MiddelreanimatiekinddoorkinderartsD
365 k_rean5
Char
1 MiddelreanimatiekinddoorkinderartsE
366 k_pHaum
Num
8 pHaumbilicaliskind
367 k_pHaum_val
Char
7 WaardepHaumbilicaliskind
368 k_Beaum
Num
8 BEaumbilicaliskind
369 k_Beaum_val
Char
7 WaardeBEaumbilicaliskind
370 k_bloedki
Num
8 Bloedgroepkind
371 k_rheD_ki
Num
8 RhesusDfactorkind
372 k_klr_vrw
Num
8 Kleurenconsistentievruchtwaternavliesscheur
373 k_kunstver
Num
8 Vaginalekunstverlossingalsinterventiebaring
374 k_kunstver1
Char
1 VaginalekunstverlossingalsinterventiebaringA
375 k_kunstver2
Char
1 VaginalekunstverlossingalsinterventiebaringB
376 k_kunstver3
Char
1 VaginalekunstverlossingalsinterventiebaringC
377 k_kunstver4
Char
1 VaginalekunstverlossingalsinterventiebaringD
378 k_kunstver5
Char
1 VaginalekunstverlossingalsinterventiebaringE
379 k_kunstver6
Char
1 VaginalekunstverlossingalsinterventiebaringF
380 k_kunstver7
Char
1 VaginalekunstverlossingalsinterventiebaringG
381 k_kunstver8
Char
1 VaginalekunstverlossingalsinterventiebaringH
382 k_sec_int
Num
8 SectioCaesareaalsinterventiebaring
383 k_sec_ind1
Char
1 SectioCaesareaindicatieA
384 k_sec_ind2
Char
1 SectioCaesareaindicatieB
385 k_sec_ind3
Char
1 SectioCaesareaindicatieC
386 k_sec_ind4
Char
1 SectioCaesareaindicatieD
387 k_sec_ind5
Char
1 SectioCaesareaindicatieE
388 k_sec_ind6
Char
1 SectioCaesareaindicatieF
389 k_sec_ind7
Char
1 SectioCaesareaindicatieZ
390 k_zorg_stf
Num
8 MORSterftekindZorgperiodevanoverlijden
391 k_ddmort
Num
8 MORSterftekind16wekendatumoverlijden
392 k_jrmort
Num
8
393 k_mndmort
Num
8
394 k_dagmort
Num
8
395 k_tijd_stf_16w
Num
8 MORSterftekind16wekenTijdstipoverlijden
Pagina 60 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
396 k_mrtind_con
Num
8 MORIndicatiecongenitaleafwijkingenbijoverledenkind
397 k_eol_dec
Num
8 MOREndoflifedecisionbijoverlijdenkind
398 k_obductie
Num
8 MORObductieverrichtbijoverlijdenkind
399 k_aan_psa
Num
8 MORAanmeldingvoorperinatalesterfteaudit
400 k_fu_dd
Num
8 FUMDatumvan3maandsfollowupmetingindienkindisoverleden
401 k_fu_jr
Num
8
402 k_fu_mnd
Num
8
403 k_fu_dag
Num
8
404 k_fu_obd
Num
8 FUMUitslagObductie3maandsfollowup
405 k_fu_psa
Num
8 FUMUitslagPerinataleSterfteAudit3maandsfollowup
406 k_cong_stf1
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind1
407 k_cong_stf2
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind2
408 k_cong_stf3
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind3
409 k_cong_stf4
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind4
410 k_cong_stf5
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind5
411 k_cong_stf6
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind6
412 k_cong_stf7
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind7
413 k_cong_stf8
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind8
414 k_cong_stf9
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind9
415 k_cong_stf10
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind10
416 k_cong_stf11
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind11
417 k_cong_stf12
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind12
418 k_cong_stf13
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind13
419 k_cong_stf14
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind14
420 k_cong_stf15
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind15
421 k_cong_stf16
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind16
422 k_cong_stf17
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind17
423 k_cong_stf18
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind18
424 k_cong_stf19
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind19
425 k_cong_stf20
Num
8 MORWelkecongenitaleafwijkingenbijoverledenkind20
426 k_dood_vrloorzaak1
Num
8 MORSterftekindDoodsoorzaakvoorlopig1
427 k_dood_vrloorzaak2
Num
8 MORSterftekindDoodsoorzaakvoorlopig2
428 k_dood_vrloorzaak3
Num
8 MORSterftekindDoodsoorzaakvoorlopig3
429 k_fu_doodorz
Num
8 FUMDoodsoorzaakkind3maandsfollowup
430 k_ddopn
Num
8 Beginzorgkinddatum
431 k_jropn
Num
8 Beginzorgkindjaar
432 k_mndopn
Num
8 Beginzorgkindmaand
433 k_dagopn
Num
8 Beginzorgkinddag
434 k_strtzrg_pra
Num
8 Periodevanstartzorgindezepraktijkkind
435 k_herkopn
Num
8 Herkomstkind
436 k_praknr_verw
Num
8 Verwijzerpraktijknummer
437 k_indic1
Char
1 OpnameindicatiekindA
438 k_indic2
Char
1 OpnameindicatiekindB
Pagina 61 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
439 k_indic3
Char
1 OpnameindicatiekindC
440 k_indic4
Char
1 OpnameindicatiekindD
441 k_indic5
Char
1 OpnameindicatiekindE
442 k_indic6
Char
1 OpnameindicatiekindF
443 k_indic7
Char
1 OpnameindicatiekindG
444 k_indic8
Char
1 OpnameindicatiekindH
445 k_indic9
Char
1 OpnameindicatiekindI
446 k_indic10
Char
1 OpnameindicatiekindJ
447 k_indic11
Char
1 OpnameindicatiekindK
448 k_indic12
Char
1 OpnameindicatiekindL
449 k_indic13
Char
1 OpnameindicatiekindM
450 k_indic14
Char
1 OpnameindicatiekindN
451 k_indic15
Char
1 OpnameindicatiekindO
452 k_indic16
Char
1 OpnameindicatiekindZ
453 k_opn_ber
Num
8 Waarvandaankomthetkindbijopnameberoepsgroep
454 k_spectran
Num
8 Gespecialiseerdtransportkindbijopname
455 k_ddont
Num
8 Eindezorgkinddatum
456 k_jront
Num
8 Eindezorgkindjaar
457 k_mndont
Num
8 Eindezorgkindmaand
458 k_dagont
Num
8 Eindezorgkinddag
459 k_opnduur
Num
8 Totaalaantalligdagen
460 k_eindzrg_pra
Num
8 Periodevaneindezorgindezepraktijkkind
461 k_wijzeont
Num
8 Wijzeontslagkind
462 k_praknr_be
Num
8 Praktijknummerbestemming
463 k_redovd_ic
Num
8 RedenoverdrachtNICU
464 k_uit_ont
Num
8 Einduitkomstkindbijontslag
465 k_asfyxie
Num
8 Verdenkingasfyxiebijontslagkind
466 k_indrestv
Num
8 Indicatierestverschijnselenkindbijontslag
467 k_faczorg
Num
8 Factoreninzorgverleningaanvrouwenkind
468 k_fac_perA
Char
1 FactoreninzorgverleningaanvrouwenkindperiodeA
469 k_fac_perB
Char
1 FactoreninzorgverleningaanvrouwenkindperiodeB
470 k_fac_perC
Char
1 FactoreninzorgverleningaanvrouwenkindperiodeC
471 k_fac_perD
Char
1 FactoreninzorgverleningaanvrouwenkindperiodeD
472 k_fac_perE
Char
1 FactoreninzorgverleningaanvrouwenkindperiodeE
473 k_indcon
Num
8 Indicatiecongenitaleafwijkingenkind
474 k_indcon_oms
Char
4 Indicatieofvrijveldcongenitaleafwijkingkind
475 k_cong_oms
Char
476 k_indbeh
Num
8 Indicatiebehandelingenkindtijdensopname
477 k_icdg
Num
8 TotaalaantaldagenIntensiveCare
478 k_postichc
Num
8 TotaalaantaldagenpostICHCkind
479 k_hcdg
Num
8 TotaalaantaldagenHighCare
480 k_tot_ichc
Num
8 TotaalICpostICHCenHC
481 k_beaddg
Num
8 Totaalaantalbeademingsdagenkind
50 Vrijveldcongenitaleafwijkingenkind
Pagina 62 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
482 k_cpapdg
Num
8 TotaalaantalbehandeldagenCPAP
483 k_o2dg
Num
8 TotaalaantalO2dagenkind
484 k_totbeacpap
Num
8 BerekendaantaltotaalbeademingsenCPAPdagen
485 k_restver1
Num
8 Welkesoortrestverschijnselenkindbijontslag_1
486 k_restver2
Num
8 Welkesoortrestverschijnselenkindbijontslag_2
487 k_restver3
Num
8 Welkesoortrestverschijnselenkindbijontslag_3
488 k_restver4
Num
8 Welkesoortrestverschijnselenkindbijontslag_4
489 k_restver5
Num
8 Welkesoortrestverschijnselenkindbijontslag_5
490 k_restver6
Num
8 Welkesoortrestverschijnselenkindbijontslag_6
491 k_diag1
Num
8 Welkediagnosenkindtijdensopnameperiode_1
492 k_diag2
Num
8 Welkediagnosenkindtijdensopnameperiode_2
493 k_diag3
Num
8 Welkediagnosenkindtijdensopnameperiode_3
494 k_diag4
Num
8 Welkediagnosenkindtijdensopnameperiode_4
495 k_diag5
Num
8 Welkediagnosenkindtijdensopnameperiode_5
496 k_diag6
Num
8 Welkediagnosenkindtijdensopnameperiode_6
497 k_diag7
Num
8 Welkediagnosenkindtijdensopnameperiode_7
498 k_diag8
Num
8 Welkediagnosenkindtijdensopnameperiode_8
499 k_diag9
Num
8 Welkediagnosenkindtijdensopnameperiode_9
500 k_diag10
Num
8 Welkediagnosenkindtijdensopnameperiode_10
501 k_diag11
Num
8 Welkediagnosenkindtijdensopnameperiode_11
502 k_diag12
Num
8 Welkediagnosenkindtijdensopnameperiode_12
503 k_diag13
Num
8 Welkediagnosenkindtijdensopnameperiode_13
504 k_diag14
Num
8 Welkediagnosenkindtijdensopnameperiode_14
505 k_diag15
Num
8 Welkediagnosenkindtijdensopnameperiode_15
506 k_diag16
Num
8 Welkediagnosenkindtijdensopnameperiode_16
507 k_diag17
Num
8 Welkediagnosenkindtijdensopnameperiode_17
508 k_diag18
Num
8 Welkediagnosenkindtijdensopnameperiode_18
509 k_diag19
Num
8 Welkediagnosenkindtijdensopnameperiode_19
510 k_diag20
Num
8 Welkediagnosenkindtijdensopnameperiode_20
511 k_diag21
Num
8 Welkediagnosenkindtijdensopnameperiode_21
512 k_diag22
Num
8 Welkediagnosenkindtijdensopnameperiode_22
513 k_diag23
Num
8 Welkediagnosenkindtijdensopnameperiode_23
514 k_diag24
Num
8 Welkediagnosenkindtijdensopnameperiode_24
515 k_diag25
Num
8 Welkediagnosenkindtijdensopnameperiode_25
516 k_diag26
Num
8 Welkediagnosenkindtijdensopnameperiode_26
517 k_diag27
Num
8 Welkediagnosenkindtijdensopnameperiode_27
518 k_diag28
Num
8 Welkediagnosenkindtijdensopnameperiode_28
519 k_diag29
Num
8 Welkediagnosenkindtijdensopnameperiode_29
520 k_diag30
Num
8 Welkediagnosenkindtijdensopnameperiode_30
521 k_cgm1
Num
8 Welkecongenitaleafwijkingenkind_1
522 k_cgm2
Num
8 Welkecongenitaleafwijkingenkind_2
523 k_cgm3
Num
8 Welkecongenitaleafwijkingenkind_3
524 k_cgm4
Num
8 Welkecongenitaleafwijkingenkind_4
Pagina 63 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
525 k_cgm5
Num
8 Welkecongenitaleafwijkingenkind_5
526 k_cgm6
Num
8 Welkecongenitaleafwijkingenkind_6
527 k_cgm7
Num
8 Welkecongenitaleafwijkingenkind_7
528 k_cgm8
Num
8 Welkecongenitaleafwijkingenkind_8
529 k_cgm9
Num
8 Welkecongenitaleafwijkingenkind_9
530 k_cgm10
Num
8 Welkecongenitaleafwijkingenkind_10
531 k_cgm11
Num
8 Welkecongenitaleafwijkingenkind_11
532 k_cgm12
Num
8 Welkecongenitaleafwijkingenkind_12
533 k_cgm13
Num
8 Welkecongenitaleafwijkingenkind_13
534 k_cgm14
Num
8 Welkecongenitaleafwijkingenkind_14
535 k_cgm15
Num
8 Welkecongenitaleafwijkingenkind_15
536 k_cgm16
Num
8 Welkecongenitaleafwijkingenkind_16
537 k_cgm17
Num
8 Welkecongenitaleafwijkingenkind_17
538 k_cgm18
Num
8 Welkecongenitaleafwijkingenkind_18
539 k_cgm19
Num
8 Welkecongenitaleafwijkingenkind_19
540 k_cgm20
Num
8 Welkecongenitaleafwijkingenkind_20
541 k_beh1
Num
8 Welkebehandelingkindtijdensopname_1
542 k_beh2
Num
8 Welkebehandelingkindtijdensopname_2
543 k_beh3
Num
8 Welkebehandelingkindtijdensopname_3
544 k_beh4
Num
8 Welkebehandelingkindtijdensopname_4
545 k_beh5
Num
8 Welkebehandelingkindtijdensopname_5
546 k_beh6
Num
8 Welkebehandelingkindtijdensopname_6
547 k_beh7
Num
8 Welkebehandelingkindtijdensopname_7
548 k_beh8
Num
8 Welkebehandelingkindtijdensopname_8
549 k_beh9
Num
8 Welkebehandelingkindtijdensopname_9
550 k_beh10
Num
8 Welkebehandelingkindtijdensopname_10
551 k_beh11
Num
8 Welkebehandelingkindtijdensopname_11
552 k_beh12
Num
8 Welkebehandelingkindtijdensopname_12
553 k_beh13
Num
8 Welkebehandelingkindtijdensopname_13
554 k_beh14
Num
8 Welkebehandelingkindtijdensopname_14
555 k_beh15
Num
8 Welkebehandelingkindtijdensopname_15
556 k_beh16
Num
8 Welkebehandelingkindtijdensopname_16
557 k_beh17
Num
8 Welkebehandelingkindtijdensopname_17
558 k_beh18
Num
8 Welkebehandelingkindtijdensopname_18
559 k_beh19
Num
8 Welkebehandelingkindtijdensopname_19
560 k_beh20
Num
8 Welkebehandelingkindtijdensopname_20
561 k_beh21
Num
8 Welkebehandelingkindtijdensopname_21
562 k_beh22
Num
8 Welkebehandelingkindtijdensopname_22
563 k_beh23
Num
8 Welkebehandelingkindtijdensopname_23
564 k_beh24
Num
8 Welkebehandelingkindtijdensopname_24
565 k_beh25
Num
8 Welkebehandelingkindtijdensopname_25
566 k_beh26
Num
8 Welkebehandelingkindtijdensopname_26
567 k_beh27
Num
8 Welkebehandelingkindtijdensopname_27
Pagina 64 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
# Variable
Type
Len Label
568 k_beh28
Num
8 Welkebehandelingkindtijdensopname_28
569 k_beh29
Num
8 Welkebehandelingkindtijdensopname_29
570 k_beh30
Num
8 Welkebehandelingkindtijdensopname_30
571 conversie
Char
1 record geconverteerd of niet?
572 versiedataset
Char
5 welke versie van de dataset is gebruikt?
573 recnr
Num
8
574 jaar
Num
8
575 lftkind
Num
8 leeftijd kind bij deze opname
576 opnduur
Num
8 opnameduur in dagen
577 lft
Num
8 leeftijd moeder
578 k_geb_uur
Num
8 Geboorteuurkind
579 k_geb_min
Char
5 Geboorteminkind
580 k_ddgebkind
Num
8 geboortedatum kind, date -LinKID
581 k_ddgebmoe
Num
8 geboortedatum moeder, date -LinKID
582 k_ddopname
Num
8 opnamedatum, date -LinKID
583 k_ddontslag
Num
8 datum ontslag, date -LinKID
584 k_kop_amw
Num
8 am.duur in dagen als koppelvariabel -LinKID
585 k_kop_gew
Num
8 gewicht als koppelvariabel -LinKID
586 k_kop_gesl
Num
8 geslacht als koppelvariabel -LinKID
587 k_kop_pc
Num
8 postcode (4 cijfers) als koppelvariabele -LinKID
588 k_kop_apg5
Num
8 Apgar-score (5min) als koppelvariabele -LinKID
589 k_kop_uur
Num
8 geboorte-uur als koppelvariabele -LinKID
590 k_kop_min
Char
5 geboorte-min als koppelvariabele -LinKID
591 k_kop_vrl
Char
10 voorletters als koppelvariabele -LinKID
592 k_kop_naamvrouw
Char
30
593 k_zrgvrl_nr
Num
8
594 l_her
Num
8 kind meerdere keren opgenomen in LNR -LinKID
595 l_kindovl
Num
8 kind in LNR overleden -LinKID
596 l_vgk_wgtmax
Num
8 maximum weight van niet gekoppelde lvr12^lnr -LinKID
597 l_koppel_sing_mrl
Num
8 koppelingsstatus eenling/meerling -LinKID
598 pltsbev_agree
Num
8
599 wgttot
Num
8
Pagina 65 van 65
Koppelingsprocedure PRN 2009: Beschrijving en Toelichting, versie 1.1, maart 2013
Addendum over aanvullende (LVR1h) ^ LNR koppeling 2009 Na het voltooien van het koppelingsproces van de jaarbestanden van 2009, bleken – bij het maken van de jaarboektabellen – 597 LVR1h records ten onrechte te zijn verwijderd (594 eenlingen en 3 meerlingen). Dit heeft plaatsgevonden na de LVR1h^LVR2 koppeling bij de stap waarbij ongekoppelde records uit het jaar 2008 verwijderd werden en betrof records die oorspronkelijk uit de LVRh kwamen. Aangezien het records betrof die niet koppelden in de gebruikelijke LVR1^LVR2 koppeling, alsmede het geringe aantal records, is besloten deze groep apart te koppelen aan de LNR volgens dezelfde methodiek als waarop de LVR1h2 aan de LNR is gekoppeld. Bij de eenlingen konden bij blocking op geboortedatum moeder 8 records aanvullend gekoppeld worden. Blocking op postcode leverde geen extra matches op. Bij de meerlingen leverde zowel blocking op geboortedatum moeder als op postcode geen matches op. Er zijn geen clusters gevonden. De LVR1h^LNR eenlingen en meerlingen bestanden zijn samengevoegd (597 records), waarna deze records zijn toegevoegd aan het oorspronkelijke 2009 eindbestand (201.946 records). Dit bestand bevat hierdoor 202.543 records. Hierin zouden echter dubbele LNR records voor kunnen komen, nl. records die ongekoppeld in het eindbestand zaten, maar nu bij deze aanvullende koppelstap gekoppeld zijn aan een LVR1h record. Er zijn volgens verwachting 8 dubbelen gevonden. Geen van deze 8 records was gekoppeld aan een LVR2 record. Deze controle liet echter wel zien dat 2 van deze LNR records aan een LVR1 (dus niet LVRh!) record waren gekoppeld. Nadere inspectie heeft laten zien dat van deze bevallingen zowel een LVRh, als een LVR1 als een LNR record aangeleverd is. Bij de controle op dubbelen tussen de LVRh en de LVR1, maar ook na het samenvoegen van de LVRh en de LVR1 zijn deze records niet als identiek naar voren gekomen. Voor nu is besloten deze records naast elkaar te handhaven, maar voor toekomstige koppelingen moet nogmaals kritisch bekeken worden of de records van de huisartsenregistratie niet in een separate koppelingsstap moeten worden gekoppeld. Van de overige 6 dubbele LNR records is het record dat niet gekoppeld is aan de LVRh verwijderd. Hierdoor komt het gereviseerde jaarbestand 2009 uit op 202.537 records. Hieronder staan alle gezette stappen van deze aanvullende koppeling schematisch weergegeven.
Inlezen ontbrekende LVR1h eenlingen 594 records
Inlezen LNR 2009 eenlingen bestand 26.196 records
Heropnames 1.916 records
LVR1h 2009 ontbrekende eenlingen 594 records
Inlezen LNR 2009 meerlingen bestand 2.772 records
Inlezen ontbrekende LVR1h meerlingen 3 records
LNR 2009 meerlingen 1 record per kind 2.396 records
LVR1h 2009 ontbrekende meerlingen 3 records
Heropnames 376 records
LNR 2009 eenlingen 1 record per kind 24.980 records Paren aanmaken LVR1h^LNR links
Niet gekoppelde LVR1h 586 records
Paren aanmaken LVR1h^LNR links
LVR1h2 ^ LNR paren boven afkappunt 8 paren
Niet gekoppelde LNR 2.396 records
Niet gekoppelde LNR 24.972 records
Gekoppelde LVR1h^LNR eenlingen 594 records
Gekoppelde LVR1h^LNR 597 records
Oorspronkelijk 2009 eind bestand 201.946 records
Gecombineerd nieuw 2009 bestand 202.543 records
Aangepast 2009 eind bestand 202.537 records
LVR1h2 ^ LNR paren boven afkappunt 0 paren
Gekoppelde LVR1h^LNR meerlingen 3 records
Niet gekoppelde LNR records 6 records
Opslaan aangepast 2009 eind bestand K:\koppeling databestanden\ 2009\SAS\databestanden\lvr12_lnr_totaal2009_final_revisie.sas7bdat 202.537 records
Pagina 66 van 65
Niet gekoppelde LVR1h 3 records