z z z
Onderzoeksdata en toegangsrechten
Jacquelijn Ringersma Max Planck Instituut voor Psycholinguïstiek Nijmegen
z z z
Max Planck Instituut voor psycholinguïstiek
Max Planck Gesellschaft 78 onderzoeksinstituten (Duitsland) 3 buiten Duitsland: 2 Italië (kunst) 1 in Nederland (psycholinguïstiek) Onderzoek naar cognitieve, mentale processen die gebruikt worden bij het produceren van taal en spraak, het begrijpen van taal en taalverwerving. Tevens wordt er onderzoek gedaan naar de relatie tussen taal, denken, gedachtegoed en cultuur.
z z z
Max Planck Instituut voor psycholinguïstiek
z z z
Technische Groep
1. Ondersteuning voor onderzoekers 2. Digitaal onderzoeksdata archief 3. Eigen onderzoek naar data-mining en onderzoeksinfrastructuur 4. Archief software ontwikkeling
Ongeveer 25 mensen, waarvan: 2 archiefbeheerders 2 archief software ontwikkelaars 10 LAT software ontwikkelaars
z z z
Onderzoeksdata in een archief?
z z z
Onderzoeksdata: Documentatie van (bedreigde) talen
Audio resources: weergave van gesproken taal Video resources: informatie over de sociale en linguïstische context Verrijkingen: Transcripties, vertalingen, woordenboeken etc.
z z z
MPI onderzoeksdata Multimedia lexica
Beschreven Corpora
Typed relaties in de lexica
Fotos
Geannoteerde media files
z z z
Onderzoeksdata archief
Waar wordt de data opgeslagen? Digitale en online beschikbare databases/archieven: DoBeS & MPI-archief, AILLA (Austin), Paradise© (Sydney)
Archief voor linguïstische data (MPI en DoBeS) Data in het archief Meer dan 400.000 objecten, ongeveer 20 terabytes Organisatie: Metadata beschrijvingen, data base
z z z
Sharing resources
How can the data be accessed? 1. Browsing When represented in an organized manner (e.g. tree or by category)
z z z
Onderzoeksdata archief
Voor wie is de data? Onderzoeksteam Collega onderzoekers Algemene publiek – onderwijs, informatie Taalgemeenschap – delen van kennis, herinvoering van de taal
z z z
Onderzoeksdata archief
Toegang tot de data 1. Browsing Database weergave in de vorm van een online tree browser
z z z
Onderzoeksdata archief
Toegang tot de data 1. Browsing Database weergave in de vorm van een online tree browser 2. Door middel van een search op de metadata 3. Door middel van een search in de content van de transcripties
z z z
Sharing resources
z z z
z z z
z z z
Onderzoeksdata archief
Toegang tot de data 1. Browsing Database weergave in de vorm van een online tree browser 2. Door middel van een search op de metadata 3. Door middel van een search in de content van de transcripties 4. Via een Google overlay 5. Via speciale webportals
z z z
Sharing resources
How can the data be accessed? 1. Browsing When represented in an organized manner (e.g. tree or by category) 2. Metadata search 3. Content search (only when users have access rights) 4. Geographic browsing
z z z
z z z
Toegangsrechten
Issues in het debat over toegangsrechten (Cultureel) gevoelige data Van wie is de data (Intellectual property rights – IPR - debate) Onderzoeksdoeleinden Nationale en internationale regelgeving Gedragscodes
z z z
AMS – Access Management System
Op alle resources in de database kunnen onderzoekers zelf de toegangsrechten zetten: Per gebruiker of groep gebruikers Per resource type (video, audio, annotatie, image, info file) Met beperkte of oneindige geldigheid Met of zonder gedragscode ter ondertekening
AMS is online, bereikbaar vanuit de browser
z z z
AMS – Access Management System
z z z
AMS – Access Management System
Voor wie is de data? Onderzoeksteam Collega onderzoekers Algemene publiek – onderwijs, informatie Taalgemeenschap – delen van kennis, herinvoering van de taal
AMS werkt voor: Onderzoeksteam Collega onderzoekers Taalgemeenschap – delen van kennis, herinvoering van de taal
Maar niet voor: Algemene publiek – onderwijs, informatie
z z z
RRS – Resource request system
Toegangsregeling voor algemeen publiek 1.
X bezoekt browser en via metadata vindt hij een intressante resource
2.
Maar hij heeft geen toegang
3.
Hij vraagt toegang aan via een web formulier
z z z
RRS – Resource request system
Opdracht: Maak een flowchart voor de (geautomatiseerde) afhandeling van een verzoek tot toegang tot een ‘single’ resource
1.
Wat willen we van de aanvrager weten? Naam, organisatie, waarom wil hij de resource bekijken, hoe lang wil hij toegang, is aanvrager al een bekende van AMS?
2.
Wat weten we van de resource? Unieke en persistente identifier (handle) Eigenaar (met e-mail adres) Gedragscode op de resource
z z z
3.
RRS – Resource request system
Afhandeling (waar je aan moet denken) Controle of gebruiker al bekend is in AMS en of gebruiker al de juiste gedragscode getekend heeft (heeft gebruiker wellicht al toegang?) of gebruiker moet worden toegevoegd aan AMS: een username en een pw toegekend krijgen/of zelf laten kiezen (?) Gebruiker moet ergens in het proces de gedragscode tekenen (en dit moet worden opgenomen in AMS zodat bij een volgende aanvraag niet opnieuw een code moet worden getekend Eigenaar van de resource moet toestemming geven en mogelijk extra informatie vragen aan de gebruiker Rechten in AMS moeten worden gezet Database moet worden ge-update voor zover het de toegangsrechten betreft.
z z z
3.
RRS – Resource request system
Afhandeling (waar je aan moet denken) Let op: Sommige resources zijn open, bij dergelijke resources moet RRS niet in actie komen Andere resources zijn semi-open, de aanvrager moet wel de gedragscode tekenen, maar heeft daarna toegang zonder verdere toestemming Tijdens de afhandeling moet de aanvrager tijdig en redelijke feedback ontvangen van het RRS
z z z
Flowcharts
Start en einde: cirkel, ovaal Proces: rechthoeken Beslissing: Ruitvormen Input/output: parallellogrammen Flow richting: pijlen