Zoeken naar onderzoeksdata
3 uur onderzoeksdata • • •
• • • • • •
13:30 ‐ 13:45 Research Data Line‐up (The usual suspects) 13:45 ‐ 14:00 Wat verstaan we onder onderzoeksdata? En hoe zien onderzoeksdata er bij jullie instelling uit? 14:00 ‐ 14:30 Presentatie "In Search 4 Data" ‐ Waarom staan onderzoeksdata in de aandacht” ‐ Hoe vind ik onderzoeksdata? 14:30 ‐ 14:50 Oefening: Zoeken naar research data repositories 14:50 ‐ 15:05 Koffie 15:05 ‐ 15:30 Vervolg presentatie 15:30 ‐ 16:00 Zoeken in tweetallen (drie opdrachten voor drie tweetallen) 16:00 ‐ 16:30 Presentatie van resultaten aan mede‐studenten 16:30 ‐ 17:00 Line‐out en 'Staying up to data'
Line-Up
data, wat is het?
Research data is defined as the recorded factual material, commonly accepted in the scientific community as necessary to validate research findings
http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1186&context=lib_research
alles wat van belang is voor het begrip/traceren van de publicatie. niet alleen onderzoeksdata zelf, maar ook manier waarop data verzameld: context, metadata, supplementary material
DATA bij NATUURWETENSCHAPPEN o Observaties, metingen, nummers,
meetpunten, coördinaten, frequenties, opgeslagen in b.v. spreadsheets en databases o Discipline-specifiek, b.v. • Life-Sciences: genexpressies, DNAto-RNA translations, protein sequences, eiwitstucturen, NMR data van biomoleculen • Sterrenkunde: foto’s, mapping the universe • …….
DATA bij SOCIALE WETENSCHAPPEN o Survey-onderzoek • Interviews • Vragenlijstonderzoek o Data uit experimenten (je brengt mensen in voorbeeldsituaties en noteert wat ze doen) o Filmpjes/stimulusmateriaal bij deze experimenten o Programmatuur, simulaties (gefingeerde data) o Onderzoek met bestaande datasets o …
Onderzoek(sdata) bij jullie • Welke onderzoeksprojecten vinden in jullie instelling plaats? • Tot welke onderzoeksdata leidt dat? • Van welke ruwe data maken jullie (onderzoekers) gebruik (of zouden ze gebruik van WILLEN maken) ?
DATA formats Een data formaat of bestandsformaat is de vorm waarin informatie gecodeerd is. De informatie is op zo'n manier gecodeerd dat een programma of toepassing (application) de data kan herkennen, lezen en gebruiken
http://dataintelligence.3tu.nl/ii-data-management/data-formaten/
DATA formats
OPEN formats The safest option to guarantee long-term data access and usable data is to convert data to standard formats that most software are capable of interpreting, and that are suitable for data interchange and transformation
http://www.data-archive.ac.uk/create-manage/format/formats
OPEN formats This typically means using open or standard formats such as OpenDocument Format (ODF), ASCII, tabdelimited format, comma-separated values, XML - as opposed to proprietary ones. Some proprietary formats, such as MS Rich Text Format, MS Excel, SPSS, are widely used and likely to be accessible for a reasonable, but not unlimited, time
http://www.data-archive.ac.uk/create-manage/format/formats
HOW (re)USABLE?
Waarom
staan onderzoeksdata in de aandacht?
I Waarom? omdat het kan
II Waarom? omdat het ‘good scientific practice’ bevordert
When data becomes detached from the published conclusions ..
http://royalsociety.org/uploadedFiles/Royal_Society_C ontent/policy/projects/sape/2012‐06‐20‐SAOE‐ Summary.pdf
III Waarom? omdat we als cultuur de shift naar ‘open access’, networked science aan het maken zijn
https://www.gov.uk/government/news/g8‐ science‐ministers‐statement
IV Waarom? omdat het meerwaarde biedt
1982
1996
2003
http://www.oldweather.org/
In the 21st century, information literacy is a key attribute for everyone, irrespective of age or experience. Information literacy is evidenced through understanding the ways in which information and data is created and handled, developing skills in its management and use and modifying attitudes, habits and behaviours to appreciate the role of information literacy in learning and research
Information Literacy has gone data http://www.vitae.ac.uk/CMS/files/upload/Vitae_Information_Literacy_Lens_on_the_RDF_Apr_2012.pdf
HOW (re)USABLE? Hergebruik = Interesse x Vindbaarheid x gebruiksvriendelijkheid
Zoeken naar onderzoeksdata
Onderzoeksdata vinden
data paper
We define a data paper as a scholarly publication of a searchable metadata document describing a particular online accessible dataset, or a group of datasets published in accordance to the standard academic practices
Onderzoeksdata vinden
data paper
data lab
Onderzoeksdata vinden
data paper
research data repository
data lab
Onderzoeksdata vinden directory/registry of research data repositories
data paper
research data repository
data lab
Registry of research data repositories
Oefening 1 • Zoek via http://www.re3data.org/ een research data repository op het vakgebied naar keuze. Probeer zowel ‘Search’ als ‘Browse’ • Kies een data repository uit (visit the repository URL) • Zoek indien mogelijk in de repository naar een dataset (soms is een login nodig) • Hoe heb je de dataset gevonden?
Zoeken en vinden van datasets 1. Metadata 2. Persistent identifier
Metadata
Scientific metadata provide the information necessary for investigators separated by time, space, institution or disciplinary norm to establish common ground
http://dataintelligence.3tu.nl/ii-data-management/metadata/
Metadata
The gray line separates medata from data
PERSISTENT identifiers Een Persistent Identifier identificeert het object zélf onafhankelijk van de plaats waar deze staat
URN urn:nbn:nl:ui:13-7yu-x43 = http://www.persistent-identifier.nl/?identifier=urn:nbn:nl:ui:13-7yu-x43
URN
http://dataintelligence.3tu.nl/nl/iii-technischevaardigheden/data-citeren/
Handle
DOI • DOI stands for "Digital Object Identifier (http://datacite.org/whatisdoi) • Gebaseerd op Handle, maar een handle maakt het niet uit WAT er geidentificeerd wordt terwijl bij een DOI metadata relevant voor citatie mee worden geregistreerd
Data citatie
The practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to articles
http://ands.org.au/guides/data‐citation‐awareness.html
Data citatie
Data citatie
Getting credit through formal citation, obtaining copies of articles that use the data, and learning of products or publications that use the data are just some of the conditions that will help encourage data sharing
http://www.plosone.org/article/info:doi/10.1371/journal.po ne.0021101
IMPACT
Onderzoeksdata vinden directory/registry of research data repositories
data paper
research data repository
data lab
Research Data Repository • disciplinair
Research Data Repository • disciplinair
Research Data Repository • disciplinair
Research Data Repository • disciplinair
Research Data Repository • disciplinair • institutioneel
Research Data Repository • disciplinair • institutioneel • nationaal
Research Data Repository • • • •
disciplinair institutioneel nationaal algemeen
Research Data Repository • • • •
disciplinair institutioneel nationaal algemeen
Research Data Repository • • • •
disciplinair institutioneel nationaal algemeen
Onderzoeksdata vinden directory/registry of research data repositories
data paper
research data repository
data lab
zoeken naar data in meerdere data repositories
data portal
Research Data Portal
http://datacentrum.3tu.nl/nieuws-agenda/nieuwsbericht/datasets3tudatacentrum-ook-in-narcis/
Research Data Portal
Research Data Portal
1 jaar geleden
Research Data Portal
http://www.dansdataportal.nl/
Research Data Portal
http://www.dansdataportal.nl/
Research Data Portal
Review https://docs.google.com/document/d/16xTJHxlu‐ HbsJvbss5OWfNTscwe39f2z1fhb7IaW6bE/edit?pli=1
The Data Citation Index captures all available metadata for the data repositories we index
http://thomsonreuters.com/products_services/science/training/dci/
Oefenen in drietallen
http://www.flickr.com/photos/75772706@N06/8356541305/
Drietal 1 ‐ Zoek in NARCIS de ‘IDRA weather radar measurements’ die afkomstig zijn uit 3TU.Datacentrum. Hoeveel hits krijg je? ‐ En via http://data.3tu.nl/repository/? Krijg je een verschil? Zo ja, kun je dit verschil verklaren? Kijk eventueel op de helppagina http://data.3tu.nl/repository/resource:repository/object/search?q=? - Zoek via de Data Citation Index http://apps.webofknowledge.com/ uit of de datasets van DANS en 3TU.Datacentrum aanwezig zijn EXTRA Zoek via de Data Citation Index naar (data type) surveys op het gebied van zwangerschap (pregnancy) – Bij wat voor type data archieven kom je uit? (source titles)
Drietal 2 ‐ Je gaat via het data portal http://worldwidescience.org/wws/ zoeken naar de dataset van het ‘majorana’ deeltje (geschreven door o.a. Sergey Frolov). Voordat je begint: Staat 3TU.Datacentrum bij de ‘Data sources’ genoemd? ‐ Vink nu alle bronnen uit, behalve ‘Data sources’. Die laatste is dus juist aangevinkt ‐ Ga nu zoeken naar de dataset die hoort bij de ontdekking van het ‘majorana’ deeltje ‐ Als de zoekresultaten tonen, klik je op het tabblad ‘Data’. ‐ Waar kom je terecht als je op de juiste link klikt? ‐ In de ‘Data sources’ staat 3TU.Datacentrum niet genoemd. Hoe kan het dat je de dataset toch vindt? (hint: zie je antwoord op de vorige vraag) ‐ Zoek nu via DataCite Metadata Search http://search.datacite.org/ui nogmaals naar de dataset met het Majorana deeltje.
Drietal 3 ‐ Zoek in NARCIS www.narcis.nl met het trefwoord ‘majorana’ o Wat voor hits krijg je? Hoeveel hits? o In welk data archief zijn de data beschikbaar? ‐ Zoek via DANS Data Portal http://dansdataportal.nl met het trefwoord ‘majorana’ o Hoeveel hits? o Verschilt het type hits van die bij vraag 1? o Hoe komt dat? ‐ EXTRA Zoek via de Data Citation Index http://apps.webofknowledge.com/
Uitwerkingen
Drietal 1 ‐ Zoek in NARCIS de ‘IDRA weather radar measurements’ die afkomstig zijn uit 3TU.Datacentrum. Hoeveel hits krijg je? ‐ En via http://data.3tu.nl/repository/? Krijg je een verschil? Zo ja, kun je dit verschil verklaren? Kijk eventueel op de helppagina http://data.3tu.nl/repository/resource:repository/object/search?q=? - Zoek via de Data Citation Index http://apps.webofknowledge.com/ uit of de datasets van DANS en 3TU.Datacentrum aanwezig zijn EXTRA Zoek via de Data Citation Index naar (data type) surveys op het gebied van zwangerschap (pregnancy) – Bij wat voor type data archieven kom je uit? (source titles)
1818 resultaten bij 3TU.Datacentrum en 953 bij NARCIS HUH?
HUH ? Wat kan ik hier allemaal vinden? (Als het er niet is, kan ik het ook niet vinden) Hoe kan ik dat allemaal vinden?
Drietal 2 ‐ Je gaat via het data portal http://worldwidescience.org/wws/ zoeken naar de dataset van het ‘majorana’ deeltje (geschreven door o.a. Sergey Frolov). Voordat je begint: Staat 3TU.Datacentrum bij de ‘Data sources’ genoemd? ‐ Vink nu alle bronnen uit, behalve ‘Data sources’. Die laatste is dus juist aangevinkt ‐ Ga nu zoeken naar de dataset die hoort bij de ontdekking van het ‘majorana’ deeltje ‐ Als de zoekresultaten tonen, klik je op het tabblad ‘Data’. ‐ Waar kom je terecht als je op de juiste link klikt? ‐ In de ‘Data sources’ staat 3TU.Datacentrum niet genoemd. Hoe kan het dat je de dataset toch vindt? (hint: zie je antwoord op de vorige vraag) ‐ Zoek nu via DataCite Metadata Search http://search.datacite.org/ui nogmaals naar de dataset met het Majorana deeltje.
HUH ? Wat kan ik hier allemaal vinden? (Als het er niet is, kan ik het ook niet vinden) Hoe kan ik dat allemaal vinden?
Drietal 3 ‐ Zoek in NARCIS www.narcis.nl met het trefwoord ‘majorana’ o Wat voor hits krijg je? Hoeveel hits? o In welk data archief zijn de data beschikbaar? ‐ Zoek via DANS Data Portal http://dansdataportal.nl met het trefwoord ‘majorana’ o Hoeveel hits? o Verschilt het type hits van die bij vraag 1? o Hoe komt dat? ‐ EXTRA Zoek via de Data Citation Index http://apps.webofknowledge.com/
EASY vs DANS DATA PORTAL EASY DATA REPOSITORY
DANS DATA PORTAL
Direct download of datasets
Doorverwijzing naar andere repositories/websites/XML‐schemes – niet persé naar een dataset
Collections:
Meest Nederlandse en Belgische instituten
http://dans.knaw.nl/en/content/easys‐collection
Zoeken in metadata
Via Google zoeken binnen de sites van aangewezen instituten
HUH ? Wat kan ik hier allemaal vinden? (Als het er niet is, kan ik het ook niet vinden) Hoe kan ik dat allemaal vinden?
Zoekmogelijkheden verschillen
Staying up to data • • • • • •
https://www.surfspace.nl/sig/28-research-data/ http://datapub.cdlib.org/ http://datapool.soton.ac.uk/ http://digital-scholarship.org/rdcb/rdcb.htm Naslag http://libguides.library.uu.nl/onderzoeksdata Geupdate cursus “Data Intelligence 4 Librarians” -> start voorjaar 2013
Staying up to data http://www.thepress.purdue.edu/titles/format/9781557536648
Tot data •
De plaatjes zonder bronvermelding zijn gemaakt door Marina Noordegraaf (www.verbeeldingskr8.nl) behalve de roze bewegende bloemenzee (weet iemand wie die gemaakt heeft?)