Is onze catalogus nog wel VAN ONS?
Ontsluiting in de netwerkcultuur Annemieke de Jong Nederlands Instituut voor Beeld en Geluid
Stelling: steeds meer metadata wordt buiten het archief geproduceerd • • • • • •
Doelbewust en onwilleurig Automatisch en manueel Tijdelijk en permanent Embedded, opgeslagen in databases Formele en inhoudelijke gegevens Lagere en hogere semantiek
Voorheen… Archivaris/documentalist beheerst de catalogus
Inmiddels…
Metadata vanuit de produktieomgeving Metadata gegenereerd door ‘intelligente’ software Gebruikers produceren metadata
I Metadata-creatie door ‘makers’ en systemen
• Dynamisch, decentraal • Door bedenkers, technici, redacteuren, productiemedewerkers, rechtenhouders etc. • Technische, administratieve, procesgerelateerde en inhoudelijke metadata • Gestructureerde en/of ongestructureerde import in de archiefomgeving • Embedded en los, tijdelijk en permanent, doelbewust en onwillekeurig, formele en inhoudelijke gegevens, hogere en lagere semantiek Correctie, completering, classificatie, verrijking en contextualisering door het archief
II
Metadata-creatie door algoritmen
Library Creation Offline
Digital Compression
Speech Recognition
Natural Language Image Interpretation Extraction
Segmentation
Indexed Video Database Segmented Indexed Transcript Compressed Audio/Video
DISTRIBUTION
TO USERS
Library Exploration Online Interactive Story Selection Spoken Natural Language Query Semantic-expansion Translation
Indexed Video Database Segmented Indexed Transcript Compressed Audio/Video
Requested Video Segment
• Formele en vormkenmerken (bv. camerabewegingen, wipes, transities) • Tekst in captions, logo’s en inserts • Personen, objecten, settings • Transcript gesproken woord & voice-over • Kaarten, graphics, tijdlijnen • Contextinformatie in het netwerk • Koppeling thesaurus, classificatiesysteem • Automatisch, doelbewust, permanent, hogere en lagere semantiek Correctie, classificatie, verrijking en contextualisering door het archief
III
Metadata-creatie door gebruikers
1
De Expertontsluiting Het laten ontsluiten van materiaal door externe catalogiseerders die deskundigheid bezitten op een specifiek terrein, bijv. onderwijsdidactiek, mediahistorie of de kunsten
Teleblik : beschrijven voor onderwijsgebruikers
Hoofdtitel
Realisatie/Reeks
Titel
Swiebertje
Professionele beschrijving
Overkoepelende beschrijving
Realisatie/Reeks
Gegeven
Legendarische jeugdserie (1972: 6 miljoen kijkers). Swiebertje is een zwerver omstreeks 1900. Ademt daardoor de sfeer van oude kinderboeken, maar er komen geen kinderen in voor.
Museum beschrijving
Zend Gemachtigde
Realisatie/Reeks
Zend Gemachtigde
NCRV
Titel aflevering
Expressie
Titel
Korte inhoud aflevering
Expressie
Samenvatting
Beschrijving Aflevering
ri h Expressiec s e B
g n i jv
o vo
Beschrijving
Professionele s beschrijving r e k e o
z e b Vaarwel Swiebertje m eu s u m r Laatste aflevering: Swiebertje vertrekt
naar Canada. Hij krijgt een afscheidsfeest in het dorp.
Swiebertje speelt zich altijd af in hetzelfde dorp. De wereld buiten het naamloze dorp lijkt niet te bestaan. Daarom is Swiebertjes vertrek naar Canada een hele schok: er is dus toch een buitenwereld. Swiebertje stopte omdat het programma te wereldvreemd en ouderwets werd gevonden in vergelijking met de modernere kinderprogramma’s zoals Stratemakeropzeeshow. De hoofdrolspelers kwamen nooit meer van hun personages af: Joop Doderer is voor eeuwig Swiebertje gebleven.
Museum Beschrijving
Museum beschrijving
Museum beschrijving
2
Crowdsourcing Taken van archivarissen en documentalisten (research, beschrijven) worden uitgevoerd door online gebruikers, door middel van een open oproep om bijdragen
Haags gemeentearchief: informatie geven over foto’s
Nationaal Archief : commentaar geven in de Beeldbank
• • • • • • •
Inzet kennis gebruikers Via e-mail, online formulieren of in de database Kostenbesparend Interactief Betrokkenheid gebruikers(groepen) Gebruiker leren kennen Doelbewust, permanent, inhoudelijke gegevens, hogere semantiek
Correctie, classificatie en contextualisering door het archief
3
Social tagging User generated metadata Folksonomy
3
Social tagging (hier) Het online toekennen van trefwoorden aan gedigitaliseerde objecten uit bestaande culturele collecties door het grote publiek
Steve Museum VS – schilderijen taggen
Ondergrond.nl : taggen en vergelijken
• • • • • • •
Kostenbesparend Interactief Betrokkenheid, coherentie gebruikers Meerdere gezichtspunten Gebruiker leren kennen (tbv profiling) Verbanden tussen andere gebruikers (tbv recommendation) Doelbewust, permanent, inhoudelijke gegevens, hogere en lagere semantiek
Correctie, classificatie en contextualisering door het archief ? OF Gebruiken als (extra) autonome zoekingangen ?
Taxonomy vrs Folksonomy • Aristoteles en Dewey vrs de nieuwe digitale ‘chaosorde’ • Intentie van de maker gelijk aan gezichtspunt van de gebruiker • De opmars van de wereldwijde categorie ‘Diversen’ • Betekenis = relatief • Hoe meer tags hoe meer impliciete informatie • Context en verbanden tussen tags, gebruikers, objecten, collecties worden aangebracht door automatische clusteringen
Audiovisuele collecties & social tagging ?
De ‘audiovisuele’ ontsluiting • Specifieke informatieve waarde (de beschrijving als vervanging) • Economisch belang (hergebruik) • Item gericht
Semantische lagen audiovisuele produktie • Informatie-inhoud : waar gaat het over? Inhoudsanalyse: wie, wat, wanneer, hoe en waarom • Audiovisuele inhoud : wat is er te zien? Beschrijving scenes, shots, citaten, vormkenmerken, sfeer • Stockshots Beschrijving fragmenten die in een andere produktie kunnen worden hergebruikt -Algemene en specifieke beelden objecten, natuur, mensen, plaatsen en gebeurtenissen etc.
Anders dan bij veel andere (archief)collecties werd AV-materiaal altijd al vanuit meerdere gezichtspunten beschreven !
Is onze catalogus nog wel VAN ONS?
Conclusies
Ontsluiten in de netwerkcultuur: invoerkant • Onze catalogus zal steeds meer worden gevoed met metadata afkomstig uit andere omgevingen Import vanuit de produktie omgeving -
Automatisch gegenereerde transcripts, shotbeschrijvingen, lagere semantiek Directe en indirecte input van de gebruikers
• Gebruik van professionele standaarden zal verminderen • Meer recall, minder precisie • Manuele kwaliteitscheck en het gebruik van metadata standaarden worden een belangrijke ‘asset’ van een digitaal item • Professioneel/gecontroleerd geannoteerde en getaggede materialen dragen een kwaliteits- en betrouwbaarheidsmerk
Ontsluiten in de netwerkcultuur: gebruikskant • Catalogusinformatie zal in vele nieuwe contexten terugkomen • Gekoppeld met andere catalogi, collecties, databases, websites, AV en niet-AV • Vermengd met andere professionele beschrijvingen en met ‘user generated’ metadata • Interactiviteit: annotatie & zoekproces proces komen nader tot elkaar : ‘semantic gap’ wordt overbrugd • De catalogus als proces • Van een stand alone catalogus naar een gemeenschappelijk informatieplatform binnen talloze virtuele netwerken
Is onze catalogus nog wel VAN ONS?
Ontsluiting in de netwerkcultuur Annemieke de Jong
[email protected]