INSTALLATIE EN WERKING DECENTRALE APPLICATIE LANDELIJKE GEGEVENSVERZAMELING FEDERATIE OPVANG
Federatie Opvang Amersf oort , 29 april 2013
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 29 april 2013
Status 3.1 (Concept)
Auteur G. van Dam Aan Leden Federatie Opvang en leveranciers cliëntenregistratieyst emen voor de Maat schappelijke- en Vrouw enopvang.
INSTALLATIE EN WERKING DECENTRALE APPLICATIE LANDELIJKE GEGEVENSVERZAMELING FEDERATIE OPVANG
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Versiebeheer Versies Datum 01-07-2004 06-11-2012 15-01-2013 08-02-2013 29-04-2013
Versie 1.0 2.0 3.0 3.1 3.2
Door F. van Zuilen G. van Dam G. van Dam G. van Dam G. van Dam
Verspreiding Versie: B. Koppenaal (Federatie Opvang) Leveranciers Leden T. Schuurmans (Federatie Opvang)
Omschrijving Definitief Concept Concept Concept Concept 3.0 X X
Wijzigingen 3.1 t.o.v. 1.0 Wijzigingen Dit document is geschreven voor DCA versie 3.1 en hoger die het mogelijk maakt de gegevensset versie 1104 te verw erken. De applicatie maakt gebruik van Microsoft Framew ork 4. De executable naam is aangepast van f o.fodca.exe naar fodca.exe De referentieset heeft een grote w ijziging ondergaan, voorzieningcodes zijn niet meer nodig en bij coderingen st aan nu ook de omschrijvingen. Het XML schema is aangepast. Veel elementen met de eigenschap nillable= " true" hebben een extra eigenschap minoccurs= ” 0” gekregen. Dit heeft als voordeel dat elementen w aar geen geen gegevens van zijn ook niet in de XML voor hoeven te komen. Bij een aantal element en in de XML is het attribuut met de naam ‘ instance’ vereist. Vanaf versie 3.1 is dit attribuut optioneel en de DCA zal als het attribuut niet aanw ezig is zelf toevoegen. Toevoegingen Applicatie accepteert command line parameters voor integratie met inf ormatiesystemen. De applicatie maakt een xml rapportage om geaut omatiseerde verw erking t e vereenvoudigen. Naast het ge-encrypte bestand is ook het geconverteerde XML bestand beschikbaar. Inst ellingen kunnen precies zien w at er is aangepast . De applicatie accepteert CSV bestanden voor conversie naar XML volgens het formaat 1104 (Federatie Opvang gegevensset 2011) Conversie van lokale w aarden naar coderingen die in de Federatie Opvang gegevensset staan is mogelijk door het toevoegen van een instelling specifiek configuratiebestand. Changelog vanaf 3.1 Omschrijving Soort Command line interf ace: aanpassing voor process actie Wijziging Command line interf ace: toevoeging environment variabele Toevoeging errorlevel w ordt gebruikt als return value.
Versie 3.2 3.2
1
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Inhoudsopgave 1. INLEIDING ................................................................................ 3 2. DOELSTELLING DECENTRALE APPLICATIE (DCA).......................... 3 3. INSTALLATIE DCA .................................................................... 4 3.1 TECHNISCHE SPECIFICATIES ........................................................ 4 3.2 INSTALLATIEPROCEDURE............................................................ 4 3.2.1 Installatie: Stap 1 .......................................................... 4 3.2.2 Installatie: Stap 2 .......................................................... 4 3.2.3 Installatie: Stap 3 .......................................................... 4 3.2.4 Installatie: Stap 4 .......................................................... 6 3.2.5 Installatie: Stap 5 .......................................................... 7 3.2.6 Installatie: Stap 6 .......................................................... 8 3.3 RELEVANTE DIRECTORIES ........................................................... 8 3.4 A CTIES ACHTERAF................................................................... 8 4. FUNCTIONALITEIT DCA ........................................................... 10 4.1 HOOFDSCHERM .................................................................... 10 4.2 OPTIES-SCHERM ................................................................... 11 4.3 STAPSGEWIJZE VERWERKING .................................................... 12 4.3.1 Openen best and .......................................................... 13 4.3.2 Checken best and ......................................................... 14 4.3.3 Bew erken bestand ....................................................... 15 4.3.4 Bew aren best and ......................................................... 16 4.3.5 Result aten van de processtappen ................................... 16 4.4 W IZARD VERWERKING............................................................. 17 4.5 COMMAND LINE VERWERKING ................................................... 17 4.5.1 Commandline actie Configuratie .................................... 17 4.5.2 Commandline actie Parse, Check en Process ................... 18 4.5.3 Commandline actie convert ........................................... 18 4.5.4 Environmentvariabele errorlevel ..................................... 18 4.6 CONVERSIE CSV NAAR XML.................................................... 19 4.7 CONVERSIE VAN DECENTRAAL NAAR CENTRAAL .............................. 20 5. CONTROLE OP INHOUD ........................................................... 21 5.1 EEN VOORBEELD VAN CONTROLE OP INHOUD BIJ HET DOMEIN GESLACHT . 24 6. ANONIMISEREN ...................................................................... 26 7. VERWERKINGSSNELHEID EN GEHEUGENGEBRUIK VAN DE APPLICATIE 26 8. RAPPORTAGE ........................................................................ 27 8.1 V OORBEELD VAN EEN XML LOG MET FOUTEN IN DE XML.................... 28 8.2 V OORBEELD VAN EEN XML LOG NA EEN CSV CONVERSIE .................... 29
2
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
1. Inleiding Dit document beschrijft de inst allatie en de globale w erking van de decentrale applicatie (DCA). De DCA is benodigd bij de gegevensuitw isseling tussen de lidinstellingen en de Federatie Opvang. In
de volgende hoofdstukken komt achtereenvolgens aan de orde: doelst elling decentrale applicatie (DCA); inst allatie DCA; functionalit eit DCA.
2. Doelstelling decentrale applicatie (DCA) De decentrale applicatie (DCA) is benodigd bij de gegevensuitw isseling van de gegevens tussen de lidinst ellingen en de Federatie Opvang, omdat de aan te leveren gegevens eerst, uit privacyoverw egingen, moet en w orden versleut eld en aangepast voordat zij opgest uurd kunnen w orden naar de Federatie Opvang. De DCA zal voor het anonimiseren en beveiligen: Een Landelijk Uniek Nummer (LUN) voor een cliënt genereren op basis van een aantal persoonskenmerken, zodat de cliënt, ongeacht de inst elling, uniek identificeerbaar is in de Landelijke Gegevens Verzameling van de Federatie Opvang (LGVFO). Bij ontvangst w ordt het unieke nummer nogmaals versleuteld om ervoor te zorgen dat het decentraal gegenereerde nummer niet gelijk is aan het nummer in de LGVFO. Verw ijderen van een aant al privacy-gevoelige persoonskenmerken van een cliënt; Versleutelen van datumvelden, zodat de feitelijke geboort edatum van de cliënt en de overige datums -zoals aanmelddatum, begindatum dienstenaanbod etc. niet meer te achterhalen zijn. Encrypten van de op te st uren bestanden, na verw erking, zodat de inhoud niet door derde partijen op een eenvoudige w ijze kan w orden acht erhaald. Een secundaire doelstelling van de DCA is het voort ijdig signaleren van event uele fouten in de aangeleverde best anden van de lidinstellingen, zodat de lidinstellingen vroegtijdig in staat w orden gesteld de eventuele fouten te corrigeren. Hierdoor w ordt tevens voorkomen dat de Federatie Opvang onnodig w ordt belast met foutieve aangeleverde bestanden.
3
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
3. Installatie DCA
3.1 Technische specificaties De computer w aarop de DCA w ordt geïnst alleerd moet minimaal aan de volgende hardw are- en softw are-eisen voldoen: Hardw are: o Processor : Intel Pentium 4 o Intern geheugen : 256 Mb o Voldoende schrijfruimte om de te verw erken bestanden te kunnen bew aren. Dit is per instelling afhankelijk. Softw are: o Best uringssysteem: XP of hoger o .NET Framew ork : versie 4.0 of hoger
3.2 Installatieprocedure 3.2.1 Inst allatie: Stap 1
Start “ Setup.exe”
3.2.2 Inst allatie: Stap 2
Het volgende scherm verschijnt:
Klik op “ Next” om verder te gaan, of Klik op “ Cancel” om de installatie te beëindigen.
3.2.3 Inst allatie: Stap 3
Het volgende scherm verschijnt:
4
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Bepaal de direct ory w aarin de DCA moet w orden geïnstalleerd, in dit geval “ c:\dca” maar dat kan ook een andere locatie zijn. Klik op “ Next” om verder te gaan, of Klik op “ Back” om terug te gaan naar de vorige stap, of Klik op “ Cancel” om de installatie te beëindigen.
5
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
3.2.4 Inst allatie: Stap 4
Het volgende scherm verschijnt:
Klik op “ Next” om de inst allatie te voltooien, of Klik op “ Back” om terug te gaan naar de vorige stap, of Klik op “ Cancel” om de installatie te beëindigen.
6
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
3.2.5 Inst allatie: Stap 5 Het volgende scherm verschijnt: de DCA w ordt geïnstalleerd.
Klik op “ Cancel” om de installatie af te breken.
7
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
3.2.6 Inst allatie: Stap 6 Nadat de DCA geïnstalleerd verschijnt het volgende scherm:
Klik op “ Close” om het installatieprogramma af te sluiten.
3.3 Relevante directories Standaard kent de DCA de volgende soort direct ories: “ bin” : bevat de programmatuur van de DCA; “ etc” : bevat o transformatie bestanden, deze w orden door de DCA gebruikt om het aangeleverde document te valideren; o per versie een direct ory, hierin staan alle versie specif ieke bestanden zoals het XML schema, regels, ref erentieset (refset.xml), conversie XML best and en de xml rapportage regels. “ in” : de standaard directory die de best anden bevat die door de DCA moeten w orden verw erkt. Het setup programma bevat een aantal voorbeeldbestanden die de DCA kan verw erken. “ log” : bevat de logbestanden die w orden aangemaakt tijdens het verw erkingsproces van de DCA. “ out” : bevat de goed verw erkte en ge-encrypt e bestanden die aan de Federatie Opvang moeten w orden opgestuurd. De locatie van de directories “ in” , “ log” en “ out” zijn met behulp van de DCA configureerbaar. 3.4 Acties achteraf Plaat sen van een conversiebest and die specifiek is voor de organisatie. DCA 3.0 kan elementen in het bronbestand convert eren naar coderingen die in de gegevensset van de Federatie Opvang zijn gedefinieerd. De DCA zoekt, na inlezen van het bronbestand, naar ‘ refset_< code van de instelling> .xml. Deze code w ordt uit het bronbestand gelezen. 8
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
9
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
4. Functionaliteit DCA
4.1 Hoofdscherm Nadat de DCA is opgestart verschijnt het volgende scherm:
Alvorens de verw erking van de bestanden te behandelen (paragraf en “ Stapsgew ijze Verw erking” en “ Wizard Verw erking” ) w ordt eerst het optiescherm besproken.
10
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
4.2 Opties-scherm Het Opties-scherm kan w orden benaderd met behulp van de v olgende menuopties: Extra\Opties:
De inst ellingen w orden opgeslagen in de bin direct ory onder de filenaam fodca.exe.config. De meeste onderdelen van het optie scherm kunnen ook via de command line interface aangepast w orden. Uitleg over de command line int erf ace is verderop beschreven. Elke w aarde, de key value, heeft een naam. De volgende zaken zijn configureerbaar via de user interf ace en command line: Locatie invoerbestanden: Dit is de locatie (“ in” -directory) w aar de te verw erken best anden zijn opgeslagen. Key value voor command line verw erking = defaultInDir. Locatie uitvoerbestanden: Dit is de locatie (“ out” -direct ory) w aar de goed verw erkte en ge-encrypt e bestanden w orden opgeslagen nadat een aangeboden bestand is verw erkt. Tevens w ordt de verw erkingsrapportage hierin opgeslagen. Key value voor command line verw erking = defaultOutDir. Locatie logbestanden: Dit is de locatie (“ log” -directory) w aar de logbestanden w orden opgeslagen die tijdens de verw erking w orden aangemaakt. Key value voor command line verw erking = defaultLogDir. Scherm Log niveau: bepaalt het niveau van (fouten-)rapportage van het verw erkingsproces zoals dat tijdens de verw erking op het scherm w ordt get oond (Tabblad “ Scherm Log” van het hoofdscherm). Hierbij bestaat de keuze uit de volgende opties: o Fout: Alleen de processt appen en de eventuele fout en w orden get oond. o Normaal: Zie vorige punt, plus alle controlestappen tijdens het verw erkingsproces, ook indien een controlestap goed verloopt. o Debug en Alles: zijn opties die moeten w orden toegepast indien een verw erkingsprobleem tot in detail moet w orden geanalyseerd. Key value voor command line verw erking = tb_logger_f ence. Bestand Log Niveau: bepaalt het niveau van (fouten-)rapportage van het verw erkingsproces dat in het bijbehorende logbest and zal w orden w eggeschreven. Key value voor command line verw erking = file_logger_f ence. 11
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Rapport opties: o Breedte: Bepaalt de lengte van de regel(s) van de verw erkingsrapportage zoals dat op het scherm zal w orden getoond na verw erking (Tabblad “ Rapport” ) en zal w orden aangemaakt in de “ out” -directory. o Rapporteer status Goed: Bepaalt of ook de goed gecontroleerde gegevens moeten w orden getoond/afgedrukt in de verw erkingsrapportage. o Rapporteer status Wijzigen: Bepaalt of ook de gegevens die een foutieve codering hebben maar zijn vervangen door een algemene codering moet en w orden get oond/afgedrukt in de verw erkingsrapportage. o Rapporteer status Fout: Bepaalt of ook de foutief verw erkte gegevens moeten w orden get oond/afgedrukt in de verw erkingsrapportage. o Bestand log naar XML rapport: Met deze optie gaat de out put voor de bestand log ook naar het XML rapport. Key value voor command line verw erking = xmlReportbestandlog Maximum aantal fouten: Bepaalt het aant al fout en dat maximaal mag optreden tijdens de verw erking van een bestand alvorens de verw erking af te breken. Als een bestand veel fouten bevat kan het proces lang doorgaan.
4.3 Stapsgewijze verwerking Een best and w ordt in 4 stappen gecontroleerd, versleut eld en ge-encrypt: Openen bestand; Checken bestand: het bestand w ordt op basis van een aantal controlest appen op inhoud gecontroleerd; Bew erken best and: het gecontroleerde bestand w ordt zodanig bew erkt zodat de privacy van de cliëntgegevens is gew aarborgd: o.a. generatie Landelijke Uniek Nummer (LUN), verw ijderen van een aantal cliënt kenmerken die gebruikt zijn bij de generatie van de LUN, versleutelen van de datumvelden naar de 1 e dag van de maand, introductie van duren, etc. Bew aren bestand: het bew erkte best and w ordt ge-encrypt en vervolgens gecomprimeerd, zodat de inhoud niet (eenvoudig) door een derde partij kan w orden achterhaald.
12
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
4.3.1 Openen bestand Het te verw erken best and kan w orden geopend met behulp van de menuopties: Best and\Openen. Na selectie van het bestand verschijnt het volgende scherm:
De
volgende gegevens van het geselecteerde best and w orden getoond: Bestand: De naam van het geselect eerde bestand; Instelling: De code van de instelling w aarvoor gegevens w orden aangeleverd; Registratiepunt: De code van het registratiepunt die de gegevens aanlevert; Registratiejaar: Het registratiejaar w aarop de gegevens betrekking hebben; Registratieperiode: De periode (veelal maand) w aarvoor de gegevens in cumulatieve zin w orden aangeboden; Bestandstype: Het bestandstype; Bestandsversie: In het XML document is een element opgenomen die de versie van dat document w eergeeft; Labelbestand aanwezig: Een labelbestand kan w aarden in het XML document omzett en naar andere w aarden. Hierdoor is het mogelijk lokale w aarden te converteren naar w aarden die in de gegevensset zijn gedefinieerd.
Afhankelijk van het soort bestand zal de DCA één of meerdere acties uitvoeren. In onderst aande tabel zijn de mogelijkheden benoemd: Soort bestand Komma gescheiden bestand (CSV) XML best and die 100% voldoet aan de eisen van het schema
Actie Conversie van CSV naar XML. Zie paragraaf 4.6 voor meer informatie. De DCA zoekt altijd naar een labelbestand voor conversie, zie paragraaf 4.7. De DCA zal elke regel van het XML doorlopen om te valideren tegen het schema.
Resultaat Het XML bestand staat in de directory van het bronbestand. < naam bronbestand> .xml De DCA zet de knop ‘ check’ aan als het document correct is. Foutmeldingen zijn op het scherm en in een log best and zichtbaar.
13
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
XML best and w aarvan de coderingen niet overeen komen met de gegevensset .
Bij dit type bestand is een labelbestand voor conversie noodzakelijk. Als het best and aanw ezig is zal de DCA eerst een conversie uitvoeren.
Zonder conversiebestand is de kans groot dat de DCA f outmeldingen gaat geven. Bij een conversiebestand heeft de DCA het resultaat geplaatst in: < naam bronbestand> _converted.xml
Na de conversie gaat de DCA het XML doorlopen om te valideren tegen het schema. XML best and met ont brekende kenmerken ‘ inst ance’
Het instance kenmerk is bij enkele element en in het XML gew enst. Dit kenmerk is noodzakelijk voor de rapportage van de DCA. Deze versie van de DCA, versie 3.1, kan zelf deze kenmerken genereren.
De DCA heeft het result aat geplaatst in: < naam bronbestand> [_converted]_inst ance.xml Wat tussen blokhaken staat is afhankelijk van de aanw ezigheid van een conversiebestand.
Door op “ Check” te klikken zal de DCA het best and op inhoud nakijken.
4.3.2 Checken bestand
Acties: Tijdens het “ check proces” w ordt in het tabblad “ Scherm Log” , overeenkomstig de gekozen opties in het “ Opties-scherm” , de voortgang van het proces getoond. Door op “ Bew erk” te klikken w ordt het “ bew erk proces” gestart.
14
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
4.3.3 Bew erken best and
Tijdens het “ bew erk proces” w ordt in het tabblad “ Scherm Log” , overeenkomstig de gekozen opties in het “ Opties-scherm” , de voortgang van het proces getoond. Door op “ Bew aar” te klikken w ordt het “ bew aar proces” gestart.
15
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
4.3.4 Bew aren bestand
Tijdens het “ bew aar proces” w ordt in het tabblad “ Scherm Log” , overeenkomstig de gekozen opties in het “ Opties-scherm” , de voortgang van het proces getoond. Hierna kan een ander best and w orden verw erkt.
4.3.5 Resultaten van de processtappen Tijdens, en als gevolg van, de verschillende stappen kunnen de volgende soorten bestanden w orden aangemaakt: Logbestand: Bevat de resultaten van de verschillende (sub-)st appen overeenkomstig de gekozen opties in het “ Opties-scherm” (Bestand Log Niveau). Dit bestand is te vinden in de “ log” -directory, en w ordt tevens get oond in het tabblad “ Bestand Log” . Dit best and kent de volgende naamsconventie: 1. 2.
Rapportagebestand: Bevat de (fout en-)rapportage van het totale verw erkingsproces overeenkomstig de gekozen opties in het “ Opties-scherm” (Rapport Opties). Dit best and is te vinden in de “ out” -directory, en w ordt tevens get oond in het tabblad “ Rapport” . Dit best and kent de volgende naamsconventie: 1. 2.
< Registratiepunt> _< Jaar> < Periode> _log_< Bestandstype> .txt Bijvoorbeeld: 104001_200499_log_zorgDocument.txt
< Registratiepunt> _< Jaar> < Periode> _rap_< Bestandstype> .txt Bijvoorbeeld: 104001_200499_rap_zorgDocument.txt
Outputbestanden: Wordt pas aangemaakt indien geen fat ale fouten zijn geconstateerd. Per aanlevering w orden drie bestanden gemaakt: 1. Het aangepaste inputbest and in XML vorm; 2. De ge-encrypte XML; 3. Een rapport in leesbare tekst .. Het ge-encrypte best and moet w orden opgestuurd naar de Federatie Opvang en is te vinden in de “ out” -directory. Dit bestand kent de volgende naamsconventie: 4. 5.
< Registratiepunt> _< Jaar> < Periode> _out_< Bestandstype> .xml.gz.enc Bijvoorbeeld: 104001_200499_out_zorgDocument.xml.gz.enc
16
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
In
het rapportagebestand w orden de volgende feiten vermeld: Het feit of al dan niet een out put bestand is aangemaakt; Met w elke versie van de DCA het bestand is gecontroleerd; De gegevens zoals die ook in het hoof dscherm w orden getoond: Bestand, Bestandstype, Instelling, Registratiepunt, Registratiejaar, Registratieperiode, Verzenddatum en Verzendtijd. De samenvattinggegevens zoals gedefinieerd in het bestand (* .xml). Aantal fatale fouten, w aardoor al dan niet een out putbestand kan w orden aangemaakt. Aantal w ijzigingen, zijnde het aantal keer dat een foutieve codering is aangeboden, maar is gew ijzigd in een bepaalde code zodat de verw erking w el kon doorgaan. Per gevonden fout, w ijziging: 1. Gegevenstype: de sectie (tag) in het xml-bestand w aar het feit is opgetreden; 2. Inst ance: het nummer van de instance; 3. Res(ult aat): F(out), W(ijziging) of G(oed); 4. Code: De code van de rule die is toegepast; 5. Veldw aarde: de w aarde van het veld; 6. Omschrijving: de omschrijving van het geconst ateerde feit.
4.4 Wizard verwerking Met behulp van de knop “ Wizard” kan in één keer al de vier de stappen van de “ Stapsgew ijze verw erking” w orden uitgevoerd. Deze verw erking geldt alleen voor XML best anden. Het openen van CSV bestanden gaat alleen via het menu best and-openen. 4.5 Command line verwerking Het is mogelijk de applicatie met paramet ers te start en voor integratie met andere informatiesystemen of bat chverw erking. De eerste paramet er is altijd de actie die uitgevoerd moet w orden. Afhankelijk van de actie zijn tw ee of drie paramet ers nodig. Eerste parameter, de actie Parse Check Process Convert Configuratie
Tweede parameter
Derde parameter
Vierde parameter
< bestandnaam> < bestandnaam> < bestandnaam> < bestandnaam> < key uit fodca.config appsettings>
/log| out:< direct ory> /log| out:< direct ory> /log| out:< direct ory> < w aarde>
/log| out:< direct ory> /log| out:< direct ory> /log| out:< direct ory> -
Bij parse, check en process is het mogelijk de uitvoer directory en de logdirectory af te dw ingen. 4.5.1 Commandline actie Configuratie Bij dit commando zal het configuratiebestand (fodca.exe.config) aangepast w orden. Het configuratiebestand staat in dezelf de direct ory als de executable fodca.exe. In het geval dat de gebruiker niet het recht heeft in die directory het configuratiebestand te w ijzigen is er de oplossing door bij parse, check of process de log en/of out directory te veranderen. De < key> parameter bij de actie configuratie is WEL hoofdlettergevoelig. Configuratie def aultIndir def ault LogDir
Waarde < direct ory> < direct ory>
Unc paden zijn toegestaan. 17
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
def aultOutDit File_logger_fence Tb_logger_fence xmlReport bestandlog
< < < <
direct ory> 1,5,7> 1,5,7> true,false>
1 = error, 5 = normaal, 7 = debug 1 = error, 5 = normaal, 7 = debug True: de out put van bestandlog gaat ook naar de xml rapport age.
Voorbeelden: Fodca configuratie def ault InDir \\fileserver\reportshare\log Fodca xmlReportbestandlog false
4.5.2 Commandline actie Parse, Check en Process De actie paramet er is niet hoofdlettergevoelig. Parse: alleen het bestand inlezen en valideren. Check: inlezen, regels uitvoeren en rapport ageregels uitvoeren. Process: inlezen, regels uitvoeren, rapportageregels uitvoeren, bew erken en opslaan. Bij elk van deze acties is het mogelijk de log direct ory en/of de out directory op te geven. De applicatie zal geen w ijzigingen aanbrengen in het configuratiebest and. 4.5.3 Commandline actie convert Bij deze actie w ordt een csv bestand omgezet naar een XML volgens de structuur van versie 1104. Er w ordt niet gekeken naar inhoud, het is een rechtstreekse omzetting naar XML. Voorbeeld: fodca convert lgvfodecentraal1104csv.csv In het inst allatieprogramma is dit best and als voorbeeld beschikbaar. Zonder pad verw ijzing zal de DCA de ‘ def aultInDir’ configuratie lezen en vanuit die directory openen. De uitvoer is ‘ lgvf odecent raal1104csv.csv.xml’ en staat in dezelf de direct ory als het invoerbestand. 4.5.4 Environmentvariabele errorlevel Tijdens de executie van het programma w ordt de environmentvariabele errorlevel aangepast. Op deze manier kan de applicatie aan andere applicatie aangeven w at de st atus is van de verw erking. Waarde Omschrijving 100 Start van de verw erking 99 Onbekende actie bij command line verw erking 98 Onbekend bestand 97 Onbekende key bij de actie configuratie 96 Foutief csv bestand bij de actie conversie 95 Incorrect aantal parameters bij command line verw erking 94 Incorrect pad bij /out: of /log: parameter 0 Voor het uitlezen van errorlevel kan een bat ch file behulpzaam zijn. start /w ait fodca.exe process ..\in\testgroot.xml /out:c:\temp\out /log:c:\temp\log echo % errorlevel% In het bat chbestand w ordt fodca.exe niet direct aangeroepen maar via start /w ait. Dit is een w orkarround om te voorkomen dat het fodca proces in de acht ergrond gaat lopen w aardoor het lastiger is het proces te monit oren.
18
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
4.6 Conversie CSV naar XML Via bestand\openen is het mogelijk een CSV best and te selecteren. Standaard staat het filter op xml maar csv is ook mogelijk. De DCA kan niet alle CSV best anden inlezen, het bestand moet voldoen aan een aantal eisen. Deze zijn: Het is een komma gescheiden best and. De velden mogen in dubbele quotes staan. Bijvoorbeeld “ Locatienaam” Datums in het formaat: jjjj-mm-dd Elke regel in het bestand is een record. De DCA herkent de volgende recordtypes:
Recordidentifier
Aantal velden (inclusief de recordidentifier)
Extra veld als unieke identifier
Beheerinformatie Locatie Client Kenmerk Demografisch Dienst Problematiek Woonsituatie woonsituatieEind Seksueelgeweld LocatieDienst 1. “locatieDienst” 2.
3. 4. <sectorcode> 5. 6. Capaciteit 1. “capaciteit” 2. 3. 4. <einddatum> 5. 6.
12 8 6 8 13 20 4 4 4 10 6
Nee Nee Nee Nee Nee Nee Nee Nee Nee Nee Ja
6
Gebruikt een unieke identifier van een ander recordtype
Ja
Volgorde van recordtype in het csv bestand is niet van belang. Elk recordtype heeft een vast aant al velden, elk veld moet aangegeven zijn in het csv bestand. Een leeg veld is in het csv best and ook leeg. Voorbeeld: k enmer k , c l i ent _c ode_i ns t el l i ng, 01, , , 1, 12, 1, 5000
19
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Veld vier en vijf zijn leeg. De DCA zal de volgende xml genereren bij deze regel na het anonimiseren:
De volgorde van de velden bij elk recordtype is de volgorde zoals die ook in het XML schema is opgegeven. De inhoud van de velden moeten voldoen aan de eisen van het XML schema. Bij locatieDienst en Capaciteit is een extra kolom noodzakelijk. In de XML is de capaciteit van de dienst in de dienst opgenomen. Bij een CSV bestand is de relatie tussen capaciteit en de dienst expliciet aangegeven.
4.7 Conversie van decentraal naar centraal Vanaf DCA versie 3.0 kan de applicatie het aangeleverde XML bestand aanpassen. Het gaat hier om de situatie waarin geregistreerde items niet overeen komen met de coderingen die in de gegevensset van de Federatie Opvang zijn genoemd. In onderstaand voorbeeld wordt duidelijk wat de bedoeling is. Voorbeeld: In een registratiesysteem bij een instelling wordt per cliënt het geslacht geadministreerd. Hiervoor zijn de volgende opties gedefniëerd: Code Omschrijving Code Federatie Opvang M Man 1 V Vrouw 2 O Onbekend 0 In de gegevensset van de Federatie Opvang zijn de codes M, V en O niet bekend en wordt 0,1 of 2 verwacht. Bij elke domein in de gegevensset met een gesloten karakter is het mogelijk de DCA de waarden M,V en O te laten converteren naar 1,2 en 0. Om die conversie uit te voeren moet de DCA weten dat M naar 1 omgezet moet worden en V naar 2, etc. Deze gegevens moeten in een XML configuratiebestand worden aangeboden. Bestaat het bestand niet of is er geen omzetting van een bepaalde code aanwezig dan blijft de code zoals is gegeven en zal de waarde door onderliggende regels worden nagekeken.
Het XML bestand is eenvoudig en bevat de volgende structuur (xsd):
20
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Met het schema kan het XML bestand gemaakt worden. In dit geval zal de DCA alle codes m vervangen door 1 van alle elementen die zijn gekoppeld aan het domein geslacht. Men hoeft niet specifiek aan te geven welke elementen dat zijn.
5. Controle op inhoud Het XML bestand wordt nagekeken op structuur en inhoud. Een fout in de structuur geeft direct een foutmelding bij het laden van het document. Als de structuur van het document in orde is kijkt de DCA of er een conversiebestand aanwezig is, zie ‘conversie decentraal naar centraal’. Het conversiebestand moet in 21
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
de betreffende versiedirectory van de etc directory staan en heeft de volgende syntax qua naamgeving: refset_.xml. De code van de instelling wordt gelezen uit het XML bestand. Voor de controle op inhoud maakt de DCA gebruik van een referentieset en regels. Voor versie 1104 van de gegevensset staat de referentieset (refset.xml) in etc\1104\. De referentieset bevat alle coderingen met omschrijving van de gegevensset. Deze referentieset wordt gebruikt door de DCA maar kan ook door andere informatiesystemen gebruikt worden. Controle op inhoud doet de DCA met behulp van regels die in XML zijn geconfigureerd. Er zijn 41 regels gemaakt die rapporteren over de inhoud. Regel D101-D129 zijn regels die de DCA leest om de inhoud van het XML te vergelijken met de referentieset. Er zal een melding komen op als een bepaalde waarde niet in de referentieset is opgenomen. Een onbekende waarde is niet fataal voor het proces.
De volgende regels zijn van toepassing op de gegevensset versie 1104. code
D001
Omschrijving Kijk na of de instellingcode in de beheerinformatie bestaat in de referentie data Elke instelling heeft een eigen code die door de Federatie Opvang is toegekend. In het exportdocument moet deze code aanwezig zijn. De referentieset die is geleverd bij de DCA bevat alle instellingscodes.
D003
Kijk na of het aantal locaties in de beheerinformatie klopt
D004
Kijk na of het aantal capacteiten in de beheerinformatie klopt
D005
Kijk na of het aantal clienten in de beheerinformatie klopt
D006
Kijk na of het aantal demografisch in de beheerinformatie klopt
D007
Kijk na of het aantal kenmerken in de beheerinformatie klopt
D008
Kijk na of het aantal diensten van clienten in de beheerinformatie klopt
D009
D010
Kijk na of het aantal problematieken in de beheerinformatie klopt Kijk na of de registratiepunt code in de beheerinformatie bestaat in de referentie data. Net als een instellingscode is er ook een registratiepuntcode. De registratiepuntcode is ook toegewezen door de Federatie Opvang. In theorie is het mogelijk dat 1 organisatie uit meerdere informatiesystemen gegevens kan aanleveren.
D011
Kijk na of het registratiejaar in de beheerinformatie bestaat in de referentie data
D012
Kijk naar het bestaan van de registratieperiode in de beheerinformatie in de referentie data
D013
Check of client geboortedatum voor of gelijk aan vandaag is Kijk geslacht na De DCA zal alle antwoorden op geslacht vergelijken met de mogelijke antwoorden die in de referentieset zijn opgenomen. Hieronder is een stukje van de referentieset geplaatst. De DCA kijkt naar de inhoud van het element code, 0=onbekend, 1=man, 2=vrouw.
D101
22
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
D102
Kijk burgelijkestaat na
D103
Kijk burgelijkestaat_Islamitische_wet na
D104
Kijk opleiding na
D105
Kijk specifieke_doelgroep na
D106
Kijk sectorcode na in client_dienst
D107
Kijk sectorcode na in aanbod
D108
Kijk dienstaanbodreden_eind na
D109
Kijk verwijzing_binnen_buiten_groep na
D110
Kijk verwijzer_buiten_binnen_groep na
D111
Kijk code_risicoscreening_vertrek na
D112
Kijk code_risicoscreening_aanvang na
D113
Kijk sociale_verhouding na
D114
Kijk woonsituatie_begin na
D115
Kijk laatsteverblijfplaats na
D116
Kijk dienst_categorie na
D117
Kijk woonsituatieEind na
D118
Kijk woonsituatie na
D119
Kijk probleemgebied na
D120
Kijk schuldenindicatie na
D121
Kijk bronvaninkomstenindicatie na
D122
Kijk bronvaninkomstensoort na
D123
Kijk eergerelateerdDreigingIndicatie na
D124
Kijk dagbesteding na
D125
Kijk seksueelgeweldtijdstip na
D126
Kijk seksueelgewelddadertype na
D127
Kijk seksueelgeweldletsel na
D128
Kijk seksueelgeweldmeldingpolitie na
D129
Kijk seksueelgeweldaard na
23
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
5.1 Een voorbeeld van controle op inhoud bij het domein geslacht Een van de inhoudelijke checks is het nakijken van het domein geslacht. In de beschrijving van de gegevensset staat het volgende over het geslacht beschreven: Definitie: Herkomst: Type: Informatie: Lengte: 1 Tabel: Code 0 1 2
Geslacht van de cliënt. FO Alfanumeriek Ja
Omschrijving Onbekend Man Vrouw
In de referentieset is het domein opgenomen en kan de DCA het exportdocument op inhoud controleren. Elke inhoudelijke controle staat beschreven in een configuratiebestand. Deze configuratie is aan te passen en daar waar nodig uit te breiden of in te perken. Stel er zijn vier cliënten opgenomen in een exportbestand. Bij deze cliënten zijn de volgende geslachten gedefiniëerd: 1,5,2,1. De tweede cliënt heeft waarde 5 als geslacht en is geen waarde uit de referentieset. De DCA zal een foutmelding genereren.
De regel voor het domein geslacht
des c r i pt i on=" Ki j k ges l ac ht na" x s l t empl at e=" r ul ePar Temp" c ode=" D102" > c onc at ( ' ges l ac ht : ' , . , '
bes t aat i n de r ef er ent i e - s et ' )
c ox s : mat c h> c onc at ( ' ges l ac ht : ' , . , '
bes t aat ni et i n de r ef er ent i e - s et ' )
c ox s : nomat c h> c ox s : v al i dat e> c ox s : r ul e> c ox s : def i ni t i on>
v er s i on=" 1. 0" enc odi ng=" ut f - 16" ?>
Het resultaat van een regel.
<mat c h i t em=" c l i ent " i ns t anc e=" 1" f i el dv al ue=" 1" > ges l ac ht : 1 bes t aat i n de r ef er ent i e - s et mat c h> <nomat c h i t em=" c l i ent " i ns t anc e=" 2" f i el dv al ue=" 5" > ges l ac ht : 5 bes t aat ni et i n de r ef er ent i e - s et nomat c h> <mat c h i t em=" c l i ent " i ns t anc e=" 3" f i el dv al ue=" 2" > ges l ac ht : 2 bes t aat i n de r ef er ent i e - s et mat c h>
24
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
<mat c h i t em=" c l i ent " i ns t anc e=" 4" f i el dv al ue=" 1" > ges l ac ht : 1 bes t aat i n de r ef er ent i e - s et mat c h> r es ul t >
25
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
6. Anonimiseren Als het exportdocument klaar is kan het nog niet verzonden w orden. Om de privacy van de cliënt te garanderen moet het document geanonimiseerd w orden. Hiervoor is een speciale applicatie ontw ikkeld die het export document inleest , verw erkt, anonimiseert en versleut eld. Deze decentrale applicatie (DCA) heeft een aanpassing gekregen voor deze gegevensset. De DCA anonimiseert cliëntgegevens en zal datums aanpassen. Bij de cliëntgegevens w ordt de achternaam, voorlet ter en client_code_inst elling vervangen door een uniek nummer. Voor het anonimiseren van cliënt gegevens moet de achternaam en voorletter verdw ijnen Hieronder een voorbeeld uit een export document vóór anonimiseren:
Na anonimiseren is de XML aangepast. Er is een andere cliënt geplaat st om te voorkomen dat met deze gegevensde met hodiek en sleut el gekraakt kan w orden. Nieuw is de toevoeging van het element lunquality, deze is toegevoegd om de kw alit eit van de code w eer te geven. Als een cliënt onw aarschijnlijk oud is of de cliënt heeft geen voorletter dan zal de w aarde van lunquality geen 11 zijn maar 00, 10 of 01. De geboortedat um w ordt ook aangepast naar de eerste dag van de geboortemaand.
Alle andere datums w orden aangepast naar de eerst e van de maand. Tot slot staat de DCA geen tekstvelden toe bij de diverse domeinen. Mocht door een fout in de export bijvoorbeeld privacygevoelige informatie in het element ‘ opleiding’ komen dan zal de DCA het bestand niet kunnen verw erken. 7. Verw erkingssnelheid en geheugengebruik van de applicatie De DCA voert verschillende taken uit, de ene wat sneller dan de ander. Openen van een XML bestand: Elke regel wordt door de DCA nagekeken op schemafouten. De DCA gebruikt het schema dat in de directory ‘etc\\’ staat. Met versie 1104 zal het schema ‘etc\1104\lgvfo.xsd’ gebruikt worden. Afhankelijk van de snelheid van de computer en grootte van het XML bestand kan dit enkele minuten duren. 26
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
Check het bestand: De DCA zal het XML document nakijken op inhoud. Dit kan enkele minuten duren. Een werkstation met intel Xeon processor (2,8GHz en 4GB RAM) doet ongeveer 9 seconden om 5000 cliënten na te kijken. Bewerk het bestand: De meeste tijd is nodig voor het anonimiseren van cliëntgegevens. Het anonimiseren kan enkele minuten duren. Het anonimiseren van 5000 cliëntgegevens duurt ongeveer vijf minuten (Xeon 2,8GHZ werkstation). Bewaar het bestand: Een aantal seconden, de XML wordt gecomprimeerd en versleuteld. Tijdens het verwerken van het XML bestand wordt de XML in zijn geheel ingelezen. Een XML bestand met 5000 cliënten en dienstgebruik vereist 400-450MByte aan werkgeheugen. 8. Rapportage De rapportage heeft meer functionaliteit gekregen. Er is, in lijn met de regels die de inhoud nakijken, een configuratiebestand toegevoegd die regels bevat voor de rapportage. De uitvoer gaat naar een xml bestand en de huidige tekst rapportage. Een voorbeeld van de tekst rapportage is hieronder een voorbeeld gegeven. Er is een output bestand aangemaakt: 999001_201112_out_lgvfoDecentraal.xml ---------------------------------------------------------------------------------------------------Dca version:2.7.4732.17523 ---------------------------------------------------------------------------------------------------Bestand:lgvfoDecentraal1104.xml Bestandstype:lgvfoDecentraal Instelling:999 Registratiepunt:999001 Registratiejaar:2011 Registatieperiode:12 Verzenddatum:2012-04-03 VerzendTijd:1801 Aantal Clienten: 4 ---------------------------------------------------------------------------------------------------Aantal fatale fouten (F):0 Aantal wijzigingen (W):0 ---------------------------------------------------------------------------------------------------Aantal locaties: 3 Aantal clienten: 4 Aantal cliënten met geslacht ongelijk man of vrouw: 0 Aantal diensten: 3 Aantal diensten MO: 2 Aantal diensten VO: 1 Aantal cliënten met geboorteland Nederland: 1 Het xml rapport bevat naast de rapportage output ook elementen die informatiesystemen kunnen lezen om de resultaten te monitoren. De XML rapportage heeft de volgende structuur: Het XML rapport staat in de log directory en heeft de volgende naam: 27
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
_report.xml. De extensie van het inputbestand is vervangen door xml als het inputbestand een csv bestand is. Voorbeeld: in = lgvfoDecentraal1104.xml uit = lgvfoDecentraal1104_report.xml
[melding] [waarde]
Log level is 0,1,5 of 7.
Level 0 en 1 meldingen komen altijd in de XML te staan. Afhankelijk van de configuratie waarde xmlReportbestandlog (true|false) komen hogere levels ook in de XML terecht. Log levels 0 Intern. Geeft de processtappen aan.
1 5
Error. Zie 7.1 voor een voorbeeld. Normaal niveau, informerend
8.1 Voorbeeld van een xml log met fouten in de XML
28
Rapport Project Landelijke Gegevensverzameling FO
Nummer FO-12-RAP
Versie datum 8 februari 2013
Status 3.1 (Concept)
8.2 Voorbeeld van een xml log na een csv conversie
29