INSTALLATIE EN WERKING DECENTRALE APPLICATIE LANDELIJKE GEGEVENSVERZAMELING FEDERATIE OPVANG
Federatie Opvang Amersf oort , 15 januari 2013
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 15 januari 2012
Status 3.0 (Concept)
Auteur G. van Dam Aan Leden Federatie Opvang en leveranciers cliënt enregistratieystemen voor de Maat schappelijke- en Vrouw enopvang.
INSTALLATIE EN WERKING DECENTRALE APPLICATIE LANDELIJKE GEGEVENSVERZAMELING FEDERATIE OPVANG
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
Versiebeheer Versies Datum 01-07-2004 06-11-2012 15-01-2013
Versie 1.0 2.0 3.0
Door F. van Zuilen G. van Dam G. van Dam
Verspreiding Versie: B. Koppenaal (Federatie Opvang) Leveranciers Leden T. Schuurmans (Federatie Opvang)
Omschrijving Definitief Concept Concept 3.0 X X
Wijzigingen 3.0 t.o.v. 1.0 Wijzigingen Dit document is geschreven voor DCA versie 2.7 en hoger die het mogelijk maakt de gegevensset versie 1104 te verw erken. De applicatie maakt gebruik van Microsoft Framew ork 4. De executable naam is aangepast van f o.fodca.exe naar fodca.exe De referentieset heef t een grot e w ijziging ondergaan, voorzieningcodes zijn niet meer nodig en bij coderingen staan nu ook de omschrijvingen. Toevoegingen Applicatie accepteert command line parameters voor integratie met informatiesystemen. De applicatie maakt een xml rapport age om geautomatiseerde verw erking te vereenvoudigen. Naast het ge-encrypte bestand is ook het geconvert eerde XML bestand beschikbaar. Instellingen kunnen precies zien w at er is aangepast. De applicatie accept eert CSV best anden voor conversie naar XML volgens het formaat 1104 (Federatie Opvang gegevensset 2011) Conversie van lokale w aarden naar coderingen die in de Federatie Opvang gegevensset st aan is mogelijk door het toevoegen van een inst elling specifiek configuratiebestand.
1
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
Inhoudsopgave 1. INLEIDING ................................................................................ 3 2. DOELSTELLING DECENTRALE APPLICATIE (DCA).......................... 3 3. INSTALLATIE DCA .................................................................... 4 3.1 TECHNISCHE SPECIFICATIES ........................................................ 4 3.2 INSTALLATIEPROCEDURE............................................................ 4 3.2.1 Installatie: Stap 1 .......................................................... 4 3.2.2 Installatie: Stap 2 .......................................................... 4 3.2.3 Installatie: Stap 3 .......................................................... 4 3.2.4 Installatie: Stap 4 .......................................................... 6 3.2.5 Installatie: Stap 5 .......................................................... 7 3.2.6 Installatie: Stap 6 .......................................................... 8 3.3 RELEVANTE DIRECTORIES ........................................................... 8 3.4 A CTIES ACHTERAF................................................................... 8 4. FUNCTIONALITEIT DCA ............................................................. 9 4.1 HOOFDSCHERM ...................................................................... 9 4.2 OPTIES-SCHERM ................................................................... 10 4.3 STAPSGEWIJZE VERWERKING .................................................... 11 4.3.1 Openen best and .......................................................... 12 4.3.2 Checken best and ......................................................... 13 4.3.3 Bew erken bestand ....................................................... 14 4.3.4 Bew aren best and ......................................................... 14 4.3.5 Result aten van de processtappen ................................... 15 4.4 W IZARD VERWERKING............................................................. 15 4.5 COMMAND LINE VERWERKING ................................................... 15 4.5.1 Commandline actie Parse, Check en Process ................... 16 4.5.2 Commandline actie convert ........................................... 16 4.5.3 Commandline actie Configuratie .................................... 16 4.6 CONVERSIE CSV NAAR XML.................................................... 17 4.7 CONVERSIE VAN DECENTRAAL NAAR CENTRAAL .............................. 18 5. CONTROLE OP INHOUD ........................................................... 19 5.1 EEN VOORBEELD VAN CONTROLE OP INHOUD BIJ HET DOMEIN GESLACHT . 22 6. ANONIMISEREN ...................................................................... 24 7. VERWERKINGSSNELHEID EN GEHEUGENGEBRUIK VAN DE APPLICATIE ............................................................................... 24 8. RAPPORTAGE ........................................................................ 25 8.1 V OORBEELD VAN EEN XML LOG MET FOUTEN IN DE XML.................... 26 8.2 V OORBEELD VAN EEN XML LOG NA EEN CSV CONVERSIE .................... 27
2
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
1. Inleiding Dit document beschrijft de inst allatie en de globale w erking van de decentrale applicatie (DCA). De DCA is benodigd bij de gegevensuitw isseling tussen de lidinst ellingen en de Federatie Opvang. In
de volgende hoofdstukken komt achtereenvolgens aan de orde: doelst elling decentrale applicatie (DCA); inst allatie DCA; functionalit eit DCA.
2. Doelstelling decentrale applicatie (DCA) De decentrale applicatie (DCA) is benodigd bij de gegevensuitw isseling van de gegevens tussen de lidinstellingen en de Federatie Opvang, omdat de aan te leveren gegevens eerst, uit privacy overw egingen, moeten w orden versleuteld en aangepast voordat zij opgestuurd kunnen w orden naar de Federatie Opvang. De DCA zal voor het anonimiseren en beveiligen: Een Landelijk Uniek Nummer (LUN) voor een cliënt genereren op basis van een aant al persoonskenmerken, zodat de cliënt, ongeacht de instelling, uniek identificeerbaar is in de Landelijke Gegevens Verzameling van de Federatie Opvang (LGVFO). Bij ontvangst w ordt het unieke nummer nogmaals versleuteld om ervoor te zorgen dat het decentraal gegenereerde nummer niet gelijk is aan het nummer in de LGVFO. Verw ijderen van een aant al privacy-gevoelige persoonskenmerken van een cliënt; Versleutelen van datumvelden, zodat de feitelijke geboort edatum van de cliënt en de overige datums -zoals aanmelddatum, begindatum dienstenaanbod etc.- niet meer te acht erhalen zijn. Encrypten van de op te st uren bestanden, na verw erking, zodat de inhoud niet door derde partijen op een eenvoudige w ijze kan w orden achterhaald. Een secundaire doelstelling van de DCA is het voort ijdig signaleren van eventuele fout en in de aangeleverde bestanden van de lidinst ellingen, zodat de lidinstellingen vroegtijdig in staat w orden gesteld de event uele fouten te corrigeren. Hierdoor w ordt tevens voorkomen dat de Federatie Opvang onnodig w ordt belast met foutieve aangeleverde bestanden.
3
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
3. Installatie DCA
3.1 Technische specificaties De computer w aarop de DCA w ordt geïnst alleerd moet minimaal aan de volgende hardw are- en softw are-eisen voldoen: Hardw are: o Processor : Intel Pentium 4 o Intern geheugen : 256 Mb o Voldoende schrijfruimte om de te verw erken bestanden te kunnen bew aren. Dit is per instelling afhankelijk. Softw are: o Best uringssysteem: XP of hoger o .NET Framew ork : versie 4.0 of hoger
3.2 Installatieprocedure 3.2.1 Inst allatie: Stap 1
Start “ Setup.exe”
3.2.2 Inst allatie: Stap 2
Het volgende scherm verschijnt:
Klik op “ Next” om verder te gaan, of Klik op “ Cancel” om de installatie te beëindigen.
3.2.3 Inst allatie: Stap 3
Het volgende scherm verschijnt:
4
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
Bepaal de direct ory w aarin de DCA moet w orden geïnstalleerd, in dit geval “ c:\dca” maar dat kan ook een andere locatie zijn. Klik op “ Next” om verder te gaan, of Klik op “ Back” om terug te gaan naar de vorige stap, of Klik op “ Cancel” om de installatie te beëindigen.
5
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
3.2.4 Inst allatie: Stap 4
Het volgende scherm verschijnt:
Klik op “ Next ” om de inst allatie te voltooien, of Klik op “ Back” om terug te gaan naar de vorige stap, of Klik op “ Cancel” om de installatie te beëindigen.
6
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
3.2.5 Inst allatie: Stap 5 Het volgende scherm verschijnt: de DCA w ordt geïnstalleerd.
Klik op “ Cancel” om de inst allatie af te breken.
7
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
3.2.6 Inst allatie: Stap 6 Nadat de DCA geïnstalleerd verschijnt het volgende scherm:
Klik op “ Close” om het installatieprogramma af te sluiten.
3.3 Relevante directories Standaard kent de DCA de volgende soort direct ories: “ bin” : bevat de programmatuur van de DCA; “ etc” : bevat o transformatie bestanden, deze w orden door de DCA gebruikt om het aangeleverde document te valideren; o per versie een direct ory, hierin staan alle versie specifieke bestanden zoals het XML schema, regels, ref erentieset (refset.xml), conversie XML best and en de xml rapportage regels. “ in” : de standaard directory die de best anden bevat die door de DCA moeten w orden verw erkt. “ log” : bevat de logbestanden die w orden aangemaakt tijdens het verw erkingsproces van de DCA. “ out” : bevat de goed verw erkte en ge-encrypt e bestanden die aan de Federatie Opvang moeten w orden opgestuurd. De locatie van de directories “ in” , “ log” en “ out” zijn met behulp van de DCA configureerbaar. 3.4 Acties achteraf Plaat sen van een conversiebest and die specifiek is voor de organisatie. DCA 3.0 kan elementen in het bronbestand convert eren naar coderingen die in de gegevensset van de Federatie Opvang zijn gedefinieerd. De DCA zoekt, na inlezen van het bronbest and, naar ‘ refset_< code van de inst elling> .xml. Deze code w ordt uit het bronbest and gelezen. 8
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4. Functionaliteit DCA
4.1 Hoofdscherm Nadat de DCA is opgestart verschijnt het volgende scherm:
Alvorens de verw erking van de bestanden te behandelen (paragraf en “ Stapsgew ijze Verw erking” en “ Wizard Verw erking” ) w ordt eerst het optiescherm besproken.
9
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4.2 Opties-scherm Het Opties-scherm kan w orden benaderd met behulp van de volgende menuopties: Extra\Opties:
De inst ellingen w orden opgeslagen in de bin direct ory onder de filenaam fodca.exe.config. De meeste onderdelen van het optie scherm kunnen ook via de command line interf ace aangepast w orden. Uitleg over de command line interface is verderop beschreven. Elke w aarde, de key value, heeft een naam. De volgende zaken zijn configureerbaar via de user interf ace en command line: Locatie invoerbestanden: Dit is de locatie (“ in” -directory) w aar de te verw erken best anden zijn opgeslagen. Key value voor command line verw erking = defaultInDir. Locatie uitvoerbestanden: Dit is de locatie (“ out” -direct ory) w aar de goed verw erkte en ge-encrypte bestanden w orden opgeslagen nadat een aangeboden best and is verw erkt. Tevens w ordt de verw erkingsrapportage hierin opgeslagen. Key value voor command line verw erking = def ault OutDir. Locatie logbestanden: Dit is de locatie (“ log” -directory) w aar de logbestanden w orden opgeslagen die tijdens de verw erking w orden aangemaakt. Key value voor command line verw erking = def ault LogDir. Scherm Log niveau: bepaalt het niveau van (fouten-)rapportage van het verw erkingsproces zoals dat tijdens de verw erking op het scherm w ordt getoond (Tabblad “ Scherm Log” van het hoofdscherm). Hierbij best aat de keuze uit de volgende opties: o Fout: Alleen de processt appen en de eventuele fout en w orden getoond. o Normaal: Zie vorige punt, plus alle controlestappen tijdens het verw erkingsproces, ook indien een controlest ap goed verloopt.
10
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
o
Debug en Alles: zijn opties die moeten w orden toegepast indien een verw erkingsprobleem tot in det ail moet w orden geanalyseerd. Key value voor command line verw erking = tb_logger_f ence. Bestand Log Niveau: bepaalt het niveau van (fouten-)rapportage van het verw erkingsproces dat in het bijbehorende logbestand zal w orden w eggeschreven. Key value voor command line verw erking = file_logger_fence. Rapport opties: o Breedte: Bepaalt de lengte van de regel(s) van de verw erkingsrapportage zoals dat op het scherm zal w orden get oond na verw erking (Tabblad “ Rapport” ) en zal w orden aangemaakt in de “ out” -direct ory. o Rapporteer status Goed: Bepaalt of ook de goed gecontroleerde gegevens moeten w orden get oond/afgedrukt in de verw erkingsrapportage. o Rapporteer status Wijzigen: Bepaalt of ook de gegevens die een foutieve codering hebben maar zijn vervangen door een algemene codering moeten w orden get oond/afgedrukt in de verw erkingsrapportage. o Rapporteer status Fout: Bepaalt of ook de foutief verw erkte gegevens moeten w orden getoond/afgedrukt in de verw erkingsrapportage. o Bestand log naar XML rapport: Met deze optie gaat de out put voor de bestand log ook naar het XML rapport. Key value voor command line verw erking = xmlReportbestandlog Maximum aantal fouten: Bepaalt het aant al fout en dat maximaal mag optreden tijdens de verw erking van een bestand alvorens de verw erking af te breken. Als een bestand veel fout en bevat kan het proces lang doorgaan.
4.3 Stapsgewijze verwerking Een best and w ordt in 4 stappen gecontroleerd, versleut eld en geencrypt: Openen bestand; Checken bestand: het bestand w ordt op basis van een aantal controlestappen op inhoud gecontroleerd; Bew erken best and: het gecontroleerde bestand w ordt zodanig bew erkt zodat de privacy van de cliëntgegevens is gew aarborgd: o.a. generatie Landelijke Uniek Nummer (LUN), verw ijderen van een aantal cliëntkenmerken die gebruikt zijn bij de generatie van de LUN, versleutelen van de dat umvelden naar de 1 e dag van de maand, introductie van duren, etc. Bew aren bestand: het bew erkte best and w ordt ge-encrypt en vervolgens gecomprimeerd, zodat de inhoud niet (eenvoudig) door een derde partij kan w orden achterhaald.
11
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4.3.1 Openen bestand Het te verw erken best and kan w orden geopend met behulp van de menuopties: Bestand\Openen. Na selectie van het bestand verschijnt het volgende scherm:
Het geselect eerde best and w ordt getoond: Veld “ Bestand” en in het “ Scherm Log” Door op “ Check” te klikken w ordt het “ check proces” gest art.
12
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4.3.2 Checken bestand
De
volgende gegevens van het geselecteerde best and w orden getoond: Bestand: De naam van het geselect eerde bestand; Bestandstype: Het bestandstype, zorgDocument of beheerDocument Instelling: De code van de instelling w aarvoor gegevens w orden aangeleverd; Registratiepunt: De code van het registratiepunt die de gegevens aanlevert; Registratiejaar: Het registratiejaar w aarop de gegevens betrekking hebben; Registratieperiode: De periode (veelal maand) w aarvoor de gegevens in cumulatieve zin w orden aangeboden; Verzenddatum en Verzendtijd: De dat um en tijd w aarop de gegevens zijn aangemaakt door het cliëntregistratiesysteem.
Acties: Tijdens het “ check proces” w ordt in het tabblad “ Scherm Log” , overeenkomstig de gekozen opties in het “ Opties-scherm” , de voortgang van het proces get oond. Door op “ Bew erk” te klikken w ordt het “ bew erk proces” gestart.
13
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4.3.3 Bew erken best and
Tijdens het “ bew erk proces” w ordt in het tabblad “ Scherm Log” , overeenkomstig de gekozen opties in het “ Opties-scherm” , de voortgang van het proces get oond. Door op “ Bew aar” te klikken w ordt het “ bew aar proces” gestart.
4.3.4 Bew aren bestand
Tijdens het “ bew aar proces” w ordt in het tabblad “ Scherm Log” , overeenkomstig de gekozen opties in het “ Opties-scherm” , de voortgang van het proces get oond. Hierna kan een ander best and w orden verw erkt. 14
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4.3.5 Resultaten van de processtappen Tijdens, en als gevolg van, de verschillende stappen kunnen de volgende soorten bestanden w orden aangemaakt: Logbestand: Bevat de resultaten van de verschillende (sub-)st appen overeenkomstig de gekozen opties in het “ Opties-scherm” (Bestand Log Niveau). Dit bestand is te vinden in de “ log” -direct ory, en w ordt tevens get oond in het tabblad “ Best and Log” . Dit bestand kent de volgende naamsconventie: 1. 2.
Rapportagebestand: Bevat de (fout en-)rapportage van het totale verw erkingsproces overeenkomstig de gekozen opties in het “ Opties-scherm” (Rapport Opties). Dit bestand is te vinden in de “ out” -directory, en w ordt tevens get oond in het tabblad “ Rapport” . Dit bestand kent de volgende naamsconventie: 1. 2.
< Registratiepunt> _< Jaar> < Periode> _log_< Bestandstype> .txt Bijvoorbeeld: 104001_200499_log_zorgDocument.txt
< Registratiepunt> _< Jaar> < Periode> _rap_< Bestandstype> .txt Bijvoorbeeld: 104001_200499_rap_zorgDocument.txt
Outputbestanden: Wordt pas aangemaakt indien geen fat ale fouten zijn geconstat eerd. Per aanlevering w orden drie bestanden gemaakt: 1. Het aangepaste inputbest and in XML vorm; 2. De ge-encrypte XML; 3. Een rapport in leesbare tekst .. Het ge-encrypte best and moet w orden opgestuurd naar de Federatie Opvang en is te vinden in de “ out” -directory. Dit bestand kent de volgende naamsconventie: 4. 5.
In
< Registratiepunt> _< Jaar> < Periode> _out_< Bestandstype> .xml.gz.enc Bijvoorbeeld: 104001_200499_out_zorgDocument.xml.gz.enc
het rapportagebestand w orden de volgende feiten vermeld: Het feit of al dan niet een out put bestand is aangemaakt; Met w elke versie van de DCA het bestand is gecontroleerd; De gegevens zoals die ook in het hoof dscherm w orden getoond: Bestand, Bestandstype, Instelling, Registratiepunt, Registratiejaar, Registratieperiode, Verzenddatum en Verzendtijd. De samenvattinggegevens zoals gedefinieerd in het bestand (* .xml). Aantal fatale fouten, w aardoor al dan niet een out putbestand kan w orden aangemaakt. Aantal w ijzigingen, zijnde het aantal keer dat een foutieve codering is aangeboden, maar is gew ijzigd in een bepaalde code zodat de verw erking w el kon doorgaan. Per gevonden fout, w ijziging: 1. Gegevenstype: de sectie (tag) in het xml-bestand w aar het feit is opgetreden; 2. Inst ance: het nummer van de instance; 3. Res(ult aat): F(out), W(ijziging) of G(oed); 4. Code: De code van de rule die is toegepast; 5. Veldw aarde: de w aarde van het veld; 6. Omschrijving: de omschrijving van het geconst ateerde feit.
4.4 Wizard verwerking Met behulp van de knop “ Wizard” kan in één keer al de vier de stappen van de “ St apsgew ijze verw erking” w orden uitgevoerd. 4.5 Command line verwerking Het is mogelijk de applicatie met paramet ers te start en voor integratie met andere informatiesyst emen of batchverw erking. De eerste 15
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
parameter is altijd de actie die uit gevoerd moet w orden. Af hankelijk van de actie zijn tw ee of drie parameters nodig. Eerste parameter, de actie Parse Check Process Convert Configuratie
Tweede parameter
Derde parameter
< bestandnaam> < bestandnaam> < bestandnaam> < bestandnaam> < key uit fodca.config appsettings>
< w aarde>
4.5.1 Commandline actie Parse, Check en Process De actie paramet er is niet hoofdlettergevoelig. Parse: alleen het bestand inlezen en valideren. Check: inlezen, regels uitvoeren en rapport ageregels uitvoeren. Process: inlezen, regels uitvoeren, rapportageregels uitvoeren, bew erken en opslaan. 4.5.2 Commandline actie convert Bij deze actie w ordt een csv bestand omgezet naar een XML volgens de structuur van versie 1104. Er w ordt niet gekeken naar inhoud, het is een rechtstreekse omzetting naar XML. Voorbeeld: fodca convert lgvfodecentraal1104csv.csv In het inst allatieprogramma is dit best and als voorbeeld beschikbaar. Zonder pad verw ijzing zal de DCA de ‘ def aultInDir’ configuratie lezen en vanuit die direct ory openen. De uitvoer is ‘ lgvf odecent raal1104csv.csv.xml’ en staat in dezelf de direct ory als het invoerbestand. 4.5.3 Commandline actie Configuratie De < key> parameter bij de actie configuratie is WEL hoofdlettergevoelig. Configuratie def aultIndir def ault LogDir def aultOutDit File_logger_fence Tb_logger_fence xmlReport bestandlog
Waarde < direct ory> < direct ory> < direct ory> < 1,5,7> < 1,5,7> < true,false>
Unc paden zijn toegestaan. 1 = error, 5 = normaal, 7 = debug 1 = error, 5 = normaal, 7 = debug True: de out put van bestandlog gaat ook naar de xml rapport age.
Voorbeelden: Fodca configuratie def ault InDir \\fileserver\reportshare\log Fodca xmlReportbestandlog false
16
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
4.6 Conversie CSV naar XML Via bestand\openen is het mogelijk een CSV best and te selecteren. Standaard staat het filter op xml maar csv is ook mogelijk. De DCA kan niet alle CSV best anden inlezen, het bestand moet voldoen aan een aantal eisen. Deze zijn: Het is een komma gescheiden best and. De velden mogen in dubbele quotes staan. Bijvoorbeeld “ Locatienaam” Datums in het formaat: jjjj-mm-dd Elke regel in het bestand is een record. De DCA herkent de volgende recordtypes:
Recordidentifier
Aantal velden (inclusief de recordidentifier)
Extra veld als unieke identifier
Beheerinformatie Locatie Client Kenmerk Demografisch Dienst Problematiek Woonsituatie woonsituatieEind Seksueelgeweld LocatieDienst 1. “locatieDienst” 2.
3. 4. <sectorcode> 5. 6. Capaciteit 1. “capaciteit” 2. 3. 4. <einddatum> 5. 6.
12 8 6 8 13 20 4 4 4 10 6
Nee Nee Nee Nee Nee Nee Nee Nee Nee Nee Ja
6
Gebruikt een unieke identifier van een ander recordtype
Ja
Volgorde van recordtype in het csv bestand is niet van belang. Elk recordtype heeft een vast aant al velden, elk veld moet aangegeven zijn in het csv best and. Een leeg veld is in het csv best and ook leeg. Voorbeeld: k enmer k , c l i ent _c ode_i ns t el l i ng, 01, , , 1, 12, 1, 5000
17
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
Veld vier en vijf zijn leeg. De DCA zal de volgende xml genereren bij deze regel na het anonimiseren:
De volgorde van de velden bij elk recordtype is de volgorde zoals die ook in het XML schema is opgegeven. De inhoud van de velden moeten voldoen aan de eisen van het XML schema. Bij locatieDienst en Capaciteit is een extra kolom noodzakelijk. In de XML is de capaciteit van de dienst in de dienst opgenomen. Bij een CSV bestand is de relatie tussen capaciteit en de dienst expliciet aangegeven.
4.7 Conversie van decentraal naar centraal Vanaf DCA versie 3.0 kan de applicatie het aangeleverde XML bestand aanpassen. Het gaat hier om de situatie waarin geregistreerde items niet overeen komen met de coderingen die in de gegevensset van de Federatie Opvang zijn genoemd. In onderstaand voorbeeld wordt duidelijk wat de bedoeling is. Voorbeeld: In een registratiesysteem bij een instelling wordt per cliënt het geslacht geadministreerd. Hiervoor zijn de volgende opties gedefniëerd: Code Omschrijving Code Federatie Opvang M Man 1 V Vrouw 2 O Onbekend 0 In de gegevensset van de Federatie Opvang zijn de codes M, V en O niet bekend en wordt 0,1 of 2 verwacht. Bij elke domein in de gegevensset met een gesloten karakter is het mogelijk de DCA de waarden M,V en O te laten converteren naar 1,2 en 0. Om die conversie uit te voeren moet de DCA weten dat M naar 1 omgezet moet worden en V naar 2, etc. Deze gegevens moeten in een XML configuratiebestand worden aangeboden. Bestaat het bestand niet of is er geen omzetting van een bepaalde code aanwezig dan blijft de code zoals is gegeven en zal de waarde door onderliggende regels worden nagekeken.
18
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
Het XML bestand is eenvoudig en bevat de volgende structuur (xsd):
Met het schema kan het XML bestand gemaakt worden. In dit geval zal de DCA alle codes m vervangen door 1 van alle elementen die zijn gekoppeld aan het domein geslacht. Men hoeft niet specifiek aan te geven welke elementen dat zijn.
5. Controle op inhoud Het XML bestand wordt nagekeken op structuur en inhoud. Een fout in de structuur geeft direct een foutmelding bij het laden van het document. 19
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
Als de structuur van het document in orde is kijkt de DCA of er een conversiebestand aanwezig is, zie ‘conversie decentraal naar centraal’. Het conversiebestand moet in de betreffende versiedirectory van de etc directory staan en heeft de volgende syntax qua naamgeving: refset_.xml. De code van de instelling wordt gelezen uit het XML bestand. Voor de controle op inhoud maakt de DCA gebruik van een referentieset en regels. Voor versie 1104 van de gegevensset staat de referentieset (refset.xml) in etc\1104\. De referentieset bevat alle coderingen met omschrijving van de gegevensset. Deze referentieset wordt gebruikt door de DCA maar kan ook door andere informatiesystemen gebruikt worden. Controle op inhoud doet de DCA met behulp van regels die in XML zijn geconfigureerd. Er zijn 52 regels, 42 kunnen een fatale fout geven waardoor er geen output document gemaakt kan worden. Regel D014-D023 zijn regels die de kijken of cliënten genoemd in diverse onderdelen van het exportdocument bestaan. Zie de omschrijving bij de tabel in deze paragraaf. Regel D101-D129 zijn regels die antwoorden vergelijken met de referentieset. Antwoorden die niet in de referentieset staan krijgen een foutmelding. Ongebruikte domeinen geven geen foutmelding. Zo worden bijvoorbeeld regel D125-D129 niet gebruikt als er geen seksueelgeweld registratie aanwezig is in het exportdocument.
De volgende regels zijn van toepassing op de gegevensset versie 1104. code
Fataal
D001
Omschrijving Kijk na of de instellingcode in de beheerinformatie bestaat in de referentie data Elke instelling heeft een eigen code die door de Federatie Opvang is toegekend. In het exportdocument moet deze code aanwezig zijn. De referentieset die is geleverd bij de DCA bevat alle instellingscodes.
D002
Kijk na of de verzendings datum in de beheerinformatie na het einde van de batch periode valt
Nee
D003
Kijk na of het aantal locaties in de beheerinformatie klopt
Nee
D004
Kijk na of het aantal capacteiten in de beheerinformatie klopt
Nee
D005
Kijk na of het aantal clienten in de beheerinformatie klopt
Nee
D006
Kijk na of het aantal demografisch in de beheerinformatie klopt
Nee
D007
Kijk na of het aantal kenmerken in de beheerinformatie klopt
Nee
D008
Kijk na of het aantal diensten van clienten in de beheerinformatie klopt
Nee
D009
Nee
D010
Kijk na of het aantal problematieken in de beheerinformatie klopt Kijk na of de registratiepunt code in de beheerinformatie bestaat in de referentie data. Net als een instellingscode is er ook een registratiepuntcode. De registratiepuntcode is ook toegewezen door de Federatie Opvang. In theorie is het mogelijk dat 1 organisatie uit meerdere informatiesystemen gegevens kan aanleveren.
D011
Kijk na of het registratiejaar in de beheerinformatie bestaat in de referentie data
Nee
D012
Kijk naar het bestaan van de registratieperiode in de beheerinformatie in de referentie data
Nee
D013
Check of client geboortedatum voor of gelijk aan vandaag is Check of de clienten in client_demografisch bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. De client_code_instelling wordt niet opgenomen in het output document, zie hiervoor het onderdeel anonimiseren. Check of de clienten in client_kenmerk bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel
Ja
D014 D015
20
Nee
Nee
Ja Ja
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
cliënt.
D016
D017
D018
D019
D020
D021
D022
D023
Check of de clienten in client_risicoscreening bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de clienten in client_eergerelateerdDreigingredenen bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de clienten in client_dienst bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de hoofdaanmelders in client_dienst bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de clienten in client_problematiek bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de clienten in client_woonsituatie bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de clienten in client_woonsituatieEind bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Check of de clienten in client_seksueelgeweld bestaan. Dit onderdeel bevat een client_code_instelling die moet verwijzen naar een cliënt in het onderdeel cliënt. Kijk geslacht na De DCA zal alle antwoorden op geslacht vergelijken met de mogelijke antwoorden die in de referentieset zijn opgenomen. Hieronder is een stukje van de referentieset geplaatst. De DCA kijkt naar de inhoud van het element code, 0=onbekend, 1=man, 2=vrouw.
D101
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
Ja
D102
Kijk burgelijkestaat na
Ja
D103
Kijk burgelijkestaat_Islamitische_wet na
Ja
D104
Kijk opleiding na
Ja
D105
Kijk specifieke_doelgroep na
Ja
D106
Kijk sectorcode na in client_dienst
Ja
D107
Kijk sectorcode na in aanbod
Ja
D108
Kijk dienstaanbodreden_eind na
Ja
D109
Kijk verwijzing_binnen_buiten_groep na
Ja
D110
Kijk verwijzer_buiten_binnen_groep na
Ja
D111
Kijk code_risicoscreening_vertrek na
Ja
21
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
D112
Kijk code_risicoscreening_aanvang na
Ja
D113
Kijk sociale_verhouding na
Ja
D114
Kijk woonsituatie_begin na
Ja
D115
Kijk laatsteverblijfplaats na
Ja
D116
Kijk dienst_categorie na
Ja
D117
Kijk woonsituatieEind na
Ja
D118
Kijk woonsituatie na
Ja
D119
Kijk probleemgebied na
Ja
D120
Kijk schuldenindicatie na
Ja
D121
Kijk bronvaninkomstenindicatie na
Ja
D122
Kijk bronvaninkomstensoort na
Ja
D123
Kijk eergerelateerdDreigingIndicatie na
Ja
D124
Kijk dagbesteding na
Ja
D125
Kijk seksueelgeweldtijdstip na
Ja
D126
Kijk seksueelgewelddadertype na
Ja
D127
Kijk seksueelgeweldletsel na
Ja
D128
Kijk seksueelgeweldmeldingpolitie na
Ja
D129
Kijk seksueelgeweldaard na
Ja
5.1 Een voorbeeld van controle op inhoud bij het domein geslacht Een van de inhoudelijke checks is het nakijken van het domein geslacht. In de beschrijving van de gegevensset staat het volgende over het geslacht beschreven: Definitie: Herkomst: Type: Informatie: Lengte: 1 Tabel: Code 0 1 2
Geslacht van de cliënt. FO Alfanumeriek Ja
Omschrijving Onbekend Man Vrouw
In de referentieset is het domein opgenomen en kan de DCA het exportdocument op inhoud controleren. Elke inhoudelijke controle staat beschreven in een configuratiebestand. Deze configuratie is aan te passen en daar waar nodig uit te breiden of in te perken. Stel er zijn vier cliënten opgenomen in een exportbestand. Bij deze cliënten zijn de volgende geslachten gedefiniëerd: 1,5,2,1. De tweede cliënt heeft waarde 5 als geslacht en is geen waarde uit de referentieset. De DCA zal een foutmelding genereren.
22
De regel voor het domein geslacht
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
concat('geslacht: ',.,' bestaat in de referentie-set') concat('geslacht: ',.,' bestaat niet in de referentie-set') <match item="client" instance="1" fieldvalue="1">geslacht: 1 bestaat in de referentie-set <nomatch item="client" instance="2" fieldvalue="5">geslacht: 5 bestaat niet in de referentie-set <match item="client" instance="3" fieldvalue="2">geslacht: 2 bestaat in de referentie-set <match item="client" instance="4" fieldvalue="1">geslacht: 1 bestaat in de referentie-set
23
Het resultaat van een regel.
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
6. Anonimiseren Als het exportdocument klaar is kan het nog niet verzonden w orden. Om de privacy van de cliënt te garanderen moet het document geanonimiseerd w orden. Hiervoor is een speciale applicatie ontw ikkeld die het exportdocument inleest, verw erkt, anonimiseert en versleuteld. Deze decentrale applicatie (DCA) heeft een aanpassing gekregen voor deze gegevensset. De DCA anonimiseert cliëntgegevens en zal datums aanpassen. Bij de cliëntgegevens w ordt de achternaam, voorlet ter en client_code_inst elling vervangen door een uniek nummer. Voor het anonimiseren van cliënt gegevens moet de achternaam en voorletter verdw ijnen Hieronder een voorbeeld uit een export document vóór anonimiseren:
Na anonimiseren is de XML aangepast. Er is een andere cliënt geplaat st om te voorkomen dat met deze gegevensde met hodiek en sleutel gekraakt kan w orden. Nieuw is de toevoeging van het element lunquality, deze is toegevoegd om de kw aliteit van de code w eer te geven. Als een cliënt onw aarschijnlijk oud is of de cliënt heeft geen voorletter dan zal de w aarde van lunquality geen 11 zijn maar 00, 10 of 01. De geboortedat um w ordt ook aangepast naar de eerste dag van de geboortemaand.
Alle andere datums w orden aangepast naar de eerst e van de maand. 7. Verw erkingssnelheid en geheugengebruik van de applicatie De DCA voert verschillende taken uit, de ene wat sneller dan de ander. Openen van een XML bestand: Elke regel wordt door de DCA nagekeken op schemafouten. De DCA gebruikt het schema dat in de directory ‘etc\\’ staat. Met versie 1104 zal het schema ‘etc\1104\lgvfo.xsd’ gebruikt worden. Afhankelijk van de snelheid van de computer en grootte van het XML bestand kan dit enkele minuten duren. Check het bestand: 24
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
De DCA zal het XML document nakijken op inhoud. Dit kan enkele minuten duren. Een werkstation met intel Xeon processor (2,8GHz en 4GB RAM) doet ongeveer 30 seconden om 5000 cliënten na te kijken. Bewerk het bestand: De meeste tijd is nodig voor het anonimiseren van cliëntgegevens. Het anonimiseren kan enkele minuten duren. Het anonimiseren van 5000 cliëntgegevens duurt ongeveer acht minuten (Xeon 2,8GHZ werkstation). Bewaar het bestand: Een aantal seconden, de XML wordt gecomprimeerd en versleuteld. Tijdens het verwerken van het XML bestand wordt de XML in zijn geheel ingelezen. Een XML bestand met 5000 cliënten en dienstgebruik vereist 400-450MByte aan werkgeheugen. Niet alle bestanden 8. Rapportage De rapportage heeft meer functionaliteit gekregen. Er is, in lijn met de regels die de inhoud nakijken, een configuratiebestand toegevoegd die regels bevat voor de rapportage. De uitvoer gaat naar een xml bestand en de huidige tekst rapportage. Een voorbeeld van de tekst rapportage is hieronder een voorbeeld gegeven. Er is een output bestand aangemaakt: 999001_201112_out_lgvfoDecentraal.xml ---------------------------------------------------------------------------------------------------Dca version:2.7.4732.17523 ---------------------------------------------------------------------------------------------------Bestand:lgvfoDecentraal1104.xml Bestandstype:lgvfoDecentraal Instelling:999 Registratiepunt:999001 Registratiejaar:2011 Registatieperiode:12 Verzenddatum:2012-04-03 VerzendTijd:1801 Aantal Clienten: 4 ---------------------------------------------------------------------------------------------------Aantal fatale fouten (F):0 Aantal wijzigingen (W):0 ---------------------------------------------------------------------------------------------------Aantal locaties: 3 Aantal clienten: 4 Aantal cliënten met geslacht ongelijk man of vrouw: 0 Aantal diensten: 3 Aantal diensten MO: 2 Aantal diensten VO: 1 Aantal cliënten met geboorteland Nederland: 1 Het xml rapport bevat naast de rapportage output ook elementen die informatiesystemen kunnen lezen om de resultaten te monitoren. De XML rapportage heeft de volgende structuur: Het XML rapport staat in de log directory en heeft de volgende naam: _report.xml. 25
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
De extensie van het inputbestand is vervangen door xml als het inputbestand een csv bestand is. Voorbeeld: in = lgvfoDecentraal1104.xml uit = lgvfoDecentraal1104_report.xml
[melding] [waarde] Level 0 en 1 meldingen komen altijd in de XML te staan. Afhankelijk van de configuratie waarde xmlReportbestandlog (true|false) komen hogere levels ook in de XML terecht. Log levels 0 Intern. Geeft de processtappen aan.
1 5
Error. Zie 7.1 voor een voorbeeld. Normaal niveau, informerend
8.1 Voorbeeld van een xml log met fouten in de XML
26
Log level is 0,1,5 of 7.
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 17 december 2012
Status 3.0 (Concept)
8.2 Voorbeeld van een xml log na een csv conversie
27