Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Data (mis-)management Een gebruikers perspectief R.L. Zijdeman IISH / Utrecht University / Stirling University
June 24, 2013
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Outline
Introductie Ervaringen met het gebruik van data Ervaringen met het deponeren van data Aandachtspunten
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Het belang van deponeren van data
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Het belang van deponeren van data
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Het belang van deponeren van data
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Vindplaats • Bijv. DANS EASY: https://easy.dans.knaw.nl/ui/home • Overzichtelijk zoeken op kernbegrippen • Weergave per item en categorie • Identifiers van datasets
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Vindplaats • Bijv. DANS EASY: https://easy.dans.knaw.nl/ui/home • Overzichtelijk zoeken op kernbegrippen • Weergave per item en categorie • Identifiers van datasets • Nog te wensen: • Internationale koppeling van archieven • Zoeken op variabele-namen
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Vindplaats • Bijv. DANS EASY: https://easy.dans.knaw.nl/ui/home • Overzichtelijk zoeken op kernbegrippen • Weergave per item en categorie • Identifiers van datasets • Nog te wensen: • Internationale koppeling van archieven • Zoeken op variabele-namen
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Gebruiksgemak
• Normalisatie van variabelen • beroepen: (H)ISCO, HISCAM, ISEI • plaatsen: Amsterdamse code • etc. • Mail met referentie data en databronnen (IPUMS) • Mail met updates van gebruikte databronnen • Mail met syntax (script) om data in te lezen
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Aandachtspunten
Kwaliteit
• Data in platte tekst (.txt, .csv, .xml) • Minder afhankelijk van veranderingen in software over de tijd • Toegankelijkheid data zonder licentie-kosten • Dus niet zoals de belangrijke Enquete Beroeps Bevolking in DANS EASY
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Aandachtspunten
Kwaliteit
• Data in platte tekst (.txt, .csv, .xml) • Minder afhankelijk van veranderingen in software over de tijd • Toegankelijkheid data zonder licentie-kosten • Dus niet zoals de belangrijke Enquete Beroeps Bevolking in DANS EASY • Data-signature • Bijvoorbeeld:
http://www.stata.com/manuals13/ddatasignature.pdf
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Kwaliteit • Standaard checks, zoals aantal cases over tijd en plaats
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Zelf deponeren van data
• Eenvoudig
• Relatief onbekend bij collega’s • Weinig erkenning
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Coherentie
• Internationale coherentie in vereisten bij deponering • Maar ook de basale zaken: Author ID
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Coherentie
• Internationale coherentie in vereisten bij deponering • Maar ook de basale zaken: Author ID
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Opleiding • Data management ontbreekt in de opleiding • Hoe noem ik mijn variabelen? • Wat is UTF-8? • Hoe koppel ik bestanden? • Waar moet een codeboek aan voldoen? • Waar deponeer ik mijn data?
Aandachtspunten
Introductie
Ervaringen met het gebruik van data
Ervaringen met het deponeren van data
Valorisatie
• Nu vooral: Nut voor bedrijven en publiek
• Zou ook moeten zijn: Gedegen deponeren data
Aandachtspunten