Instituut voor Media en Informatie Management
Paper Z811-3 Content en Distributie
Paper
Erik de Groot, ZV11
Docent
Raoul Boers
27-03-2009
Inhoud Paper Metadata ‘The narrow view’ ‘Verdrinken in een informatiestroom’ Content analist vs. Metator Content distributie Bronnen
Paper Z811-3 Content en Distributie
1
5
Paper Metadata
Metadata. Een populair begrip in contentmanagement. Een begrip dat door het steeds grotere aanbod van content veel belangrijker is geworden. Maar wat houdt het nou precies in? Een duidelijke definitie van het woord metadata is vaak niet terug te vinden in de bekende woordenboeken. Simpel gezegd is het begrip metadata uit te leggen als data over data. Bijvoorbeeld wanneer er bij een artikel vermeldt wordt wanneer het geschreven is. De data over de datum geeft informatie over het artikel. Metadata dus. Het voordeel van metadata is vooral terug te vinden in het zoekgemak. Zonder goede informatie over een artikel verdrinkt het in de grote hoeveelheid informatie die tegenwoordig gegenereerd wordt. En een artikel dat niet gelezen wordt heeft weinig toegevoegde waarde. Over wat metadata in zijn volledigheid beslaat zijn verschillende versies. In het boek ‘The Content Management Bible’ geschreven door de Amerikaanse contentmanagement goeroe Bob Boiko worden twee visies uitgelicht. De nauwe visie en de wijde versie. (Boiko, 2001) ‘The narrow view’ In de nauwe visie wordt metadata uitzonderlijk gebruikt om het beheer te regelen. Deze visie is voort gekomen uit de verschillende bestandseigenschappen. Data over de grote van het bestand, de datum van aanmaken en simpelweg de naam van het bestand. Gelooft wordt dat metadata uitzonderlijk gebruikt wordt om gebruik van het bestand mogelijk te maken. Boiko beschrijft in zijn boek echter een veel bredere definitie van metadata. Het verschil is volgens hem veroorzaakt doordat je bestanden in zijn geheel verschillend kan bekijken. Je kan bijvoorbeeld een website als een geheel bekijken. Dan zijn de belangrijke metadata voor jou vooral beschrijvend. Welke informatie staat op de site en door wie is het geschreven/ gemaakt. Maar een website is niet een bestand. Het zijn vaak meerdere bestanden die samen een website maken. Elk los component heeft eigen metadata nodig. Metadata die beschrijven waar op de site het
Paper Z811-3 Content en Distributie
6
component voor moet komen, wat zijn functie is en wie er toegang hebben tot de informatie. Deze verschillende vormen van metadata verdeelt Boiko onder in vijf categorieën. • • • • •
Format metadata Structure metadata Access metadata Management metadata Inclusion metadata
De eerste categorie format metadata geven informatie over welk formaat het bestand heeft. Is het een PDF bestand of een XML bestand. Deze informatie wordt weergegeven in de eerste categorie. De tweede categorie geeft juist weer hoe een document opgebouwd wordt. Wat is de structuur van een bestand. Wat moet waar komen. Wanneer de informatie eenmaal geplaatst is moet bekeken worden wie er toegang krijgt tot deze informatie. Misschien is het wel bedrijfsgevoelige informatie die je niet met je concurrent moet delen. Wie er toegang hebben tot het bestand is terug te lezen in de access metadata. Management metadata is de meest bekende vorm van metadata. Deze data geven onder andere informatie over de auteur, grote van het bestand en de beheerder. De laatste vorm van metadata die Boiko in zijn boek hanteert zijn inclusional metadata. Deze vorm beslaat de externe links naar bestanden die niet aanwezig zijn tussen jou eigen bestanden. Een veelgebruikte vorm zijn video’s van Youtube. Inclusional metadata geven in dit geval informatie over waar de bron van het bestand te vinden is. ‘Verdrinken in een informatiestroom’ Vijf verschillende soorten metadata dus. Maar wat heb je nou aan al die informatie die gegeven wordt? Het hebben van steeds meer informatie klinkt als een verbetering. Des ter meer informatie je hebt des ter meer je weet. Wanneer je veel weet is de kans groter dat je een juiste beslissingen kan maken. De hedendaagse informatiestroom is echter zo groot dat het de vraag is of nog meer informatie wel wenselijk is. Toch ligt juist hier de oorsprong van metadata. Deze data moeten ordening brengen aan de informatie
Paper Z811-3 Content en Distributie
7
die op je af komt. Door metadata wordt het voor de gebruiker van de informatie mogelijk om de data op waarde in te schatten en in te delen. De betekenis van de verschillende informatie wordt door metadata verduidelijkt. Tegenwoordig is dit dus niet meer de enige vorm van metadata die gebruikt wordt in content management. Vooral bij het uitwisselen van data worden de voordelen van metadata duidelijk. Door slim gebruik van metadata hoeft data niet constant overnieuw aangemaakt te worden. De verschillende systemen kunnen informatie van elkaar ‘lenen’ en door metadata vertalen naar toepassingen die door de beheerder gewild zijn. Wanneer je werkt met een content management systeem is het mogelijk om informatie een maal aan te maken op te slaan en vervolgens verschillende malen automatisch te laten aanroepen. Al die aangemaakte data van een bedrijf kunnen worden opgeslagen in een centrale database. Grote bedrijven krijgen zo een enorme database. Al die informatie is zonder metadata niet meer uit elkaar te houden. Juiste metadatering blijkt dus ook op dit punt belangrijk. Voor gemak in het beheer dus. Het belangrijkste voordeel van metadata in huidige content management systemen is dat deze systemen door goede metadatering bestanden kunnen verenigen. Het kan de informatie en functionaliteit automatisch uit de verschillende data halen. Wat meteen komt tot voor vele de meest belangrijke reden om na te denken over metadata. Het kan namelijk geld besparen. Door de genoemde automatisering kan er tot een optimaliseren komen van manuren en het onderhoud minimaliseren. (University of Wyoming (z.j.)) Goed gebruik van metadata kan dus manuren schelen, maar optimaal gebruik wordt vaak bereikt door er goed over metadatering na te denken. Hoewel vaak geprobeerd wordt om metadatering te automatiseren is hier tot op heden weinig succes geboekt. Metadata heeft daarom zijn eigen professionals gekregen. Deze specialisten worden doorgaans metator genoemd. De metator vult het gat dat auteurs vaak achterlaten op het gebied van metadata. Auteurs hebben vaak niet de juiste kennis om goed om te gaan met het toevoegen van metadata. De basis kan heel goed gedaan worden door de auteurs. Het ‘taggen’ van de eigen naam of datum van creatie levert vaak weinig problemen op. Goede metadatering vereist echter diepgaandere kennis. De metator is degene die deze kennis
Paper Z811-3 Content en Distributie
8
paraat heeft. Hij is in staat om XML toe te voegen. Ook heeft hij de verantwoordelijkheid over de toegevoegde metadata. Hij controleert deze en verandert het wanneer nodig. In kleine organisaties gebeurt dit vaak meer onofficieel. Er wordt niet specifiek iemand aangesteld om hierop te letten. Naar mate de organisatie groter wordt en de content mee groeit wordt ook de metator steeds belangrijker. De kern van zijn werkzaamheden is dat hij ervoor zorgt dat content op de goede plaatsen in het systeem komt en ook wanneer gevraagd op de juiste plaatsen aangeroepen kunnen worden. Om duidelijkheid te scheppen voor auteurs zorgt hij ook voor een goede en actuele ‘metatorial guide’. Hierin komen gemaakte afspraken binnen de organisatie over het gebruik van metadata. Onderwerpen die hierin naar voren komen zijn wie er waarvoor verantwoordelijk is en wat elk element in de website is. De metator zorgt er vervolgens voor dat deze gids up-to-date blijft en consistent is met het systeem waar de metadata in ingevoerd worden. De metator is ook verantwoordelijk voor de toepassing van het ‘metatorial framework’. Het metatorial framework beslaat enkele afspraken met betrekking tot het metadata gebruik. Het vormt de basis van elk goed ingericht content management systeem. In principe valt het te vergelijken met de afspraken die redacteuren maken om alle gemaakte content tot een geheel te maken. Hetzelfde idee komt terug in het metatorial framework. De afspraken gaan hierin alleen over het metadata gebruik. In een volledig framework worden vier delen besproken, namelijk; (Sedic. (z.j.)) •Meta informatie in divisies; met afspraken hoe grote delen content opgedeeld kunnen worden naar componenten en elementen. •Toegang meta informatie; bepaalt hoe content logisch opgespoord kan worden. Opgedeeld in vier categorieën. • • •
Hiërarchieën; beschrijft de content in hogere en lagere concepten Index; termen waarin content wordt beschreven in woorden en zinnen Verbanden; beschrijft overeenkomsten tussen verschillende content
Paper Z811-3 Content en Distributie
•
9
Zoek klassen; beschrijft welk stuk content gezien moet worden na welk ander stuk content in geval van opeenvolgende klassen.
•Management meta informatie; voegt extra informatie toe aan content zoals, unieke identificatienummers en naam van de auteur. •Insluiting meta informatie; maakt het mogelijk om een deel content bij een ander stuk content in te voegen.
Content analist vs. Metator De metator zorgt voor de naleving van de gemaakte afspraken en regels uit het metatorial framework. De content analist is degene die deze regels opgesteld heeft. Hij is als geen ander gespecialiseerd in het ordenen en opslaan van informatie. De basis van zijn werkzaamheden ligt bij het maken van een concept en uiteindelijk uitwerken van een logisch ontwerp. In dit ontwerp geeft een content analist precies aan wat hij voor ogen heeft. Wat hij wilt dat het content management systeem gaat doen en wat er allemaal uiteindelijk in zal moeten komen. Allemaal vragen die beantwoordt moeten zijn voordat er begonnen wordt aan het ontwerpen van een goed en volledig systeem. Het ontwerp zorgt er nagedacht is over een logisch en optimaal systeem voor het ‘taggen’ van de data. Uiteindelijk zal dit ontwerp ook de basis vormen van het metatorial framework. Om tot een goed ontwerp te komen zijn er verschillende doelgroepen die in het ontwerpproces mee genomen moeten worden. Wie zijn uiteindelijk de gebruikers. Zijn dit de auteurs? Dan moet het systeem dermate logisch en begrijpelijk zijn ingericht dat ook deze doelgroep ermee overweg kan. Maar ook de programmeurs moeten meegenomen worden. Wat is er daadwerkelijk mogelijk? Hij moet dus verstand hebben van beide kanten van het proces. Zowel de kant van de redactie en auteurs als wel de technische kant die komt kijken bij het maken van een goed content management systeem. Hij moet ook kennis hebben van alle systemen die gebruikt worden binnen de organisatie waarin hij werkt.
Paper Z811-3 Content en Distributie
10
Veel van zijn werkzaamheden lijken overeenkomsten te vertonen met de werkzaamheden van de metator. Toch zijn er enkele duidelijke verschillen tussen de twee beroepen. De rollen zijn het best te vergelijken met het systeem bij bijvoorbeeld een krant. Er lopen verschillende redacteuren rond die content invullen. Daarboven staat een hoofdredacteur die zorgt voor goede redactionele afspraken en maakt de beslissing welke informatie nodig is. De content analist is in dit voorbeeld de hoofdredacteur. Hij maakt de afspraken welke metadata en systemen gebruikt worden. De rol van redacteur wordt ingevuld door de metator. Hij is degene die de metadata velden invult. Hij moet werken naar de afspraken en regels die gesteld zijn door de content analist. Een goede metator heeft alle nodige kennis om te werken met metadata. Vaak wordt deze rol gevuld door iemand die nog niet de juiste kennis en ervaring heeft om als content analist ingezet te worden. Content distributie In dit gehele verhaal staat een woord steeds weer centraal. Content. Het komt terug bij content management en content analyse. Content is simpel gezegd toegepaste informatie. Informatie wordt toegepaste informatie wanneer het specifiek gebundeld en gepresenteerd wordt voor een bepaald doel. (Sedic. (z.j.)) Websites bestaan vaak grotendeels uit content. Artikelen, reclamemateriaal en foto’s het is allemaal content. Content management systemen zijn ontstaan omdat grote bedrijven zo’n enorme stroom content genereerde dat het zonder een goed en duidelijk systeem niet meer te beheersen was. De informatie was aan de voorkant van de site overzichtelijk en gestructureerd. Voor de beheerder was het meer een nachtmerrie. Toch heeft deze module van de minor Content management en ePublishing niet de naam Content en beheersbaarheid gekregen. Met een goed content management systeem is namelijk veel meer mogelijk dan alleen maar ordenen en beheersen van de toegevoegde content. Een goed systeem kan zorgen voor een veel dynamischere website. Dynamiek dus. Het is met een content management systeem mogelijk om informatie automatisch aan te laten roepen. Het verschil komt al naar voren wanneer je beide definities in een
Paper Z811-3 Content en Distributie
11
woordenboek opzoekt. Beheersbaarheid wordt gedefinieerd als ‘in bedwang houden’. In het geval van content en beheersbaarheid zou het dus betekenen dat het voornaamste doel is om de stroom van content in bedwang te houden. Niets meer niets minder. Distributie wordt echter betiteld als ‘verdelen/ uitdelen’. De mogelijkheden van een content management systeem komen hierbij meer tot hun recht. Voorbeeld Neem een site als NU.nl. De homepage is te verdelen in verschillende categorieën. Het algemene nieuws neemt de meest prominente plek in. Midden op de pagina bovenaan. Daaronder volgende de headlines van economie, sport, internet, overig en video’s. Hetgeen dat in deze kaders terug te vinden is zijn dus alleen headlines, kopteksten bedoeld om de lezer te bewegen om verder te lezen. Wanneer een van de headlines je aandacht trekt en je wilt er meer over weten volg je de link naar het volledige bericht. De link die je gevolgd ben blijkt dan de titel van het artikel. NU.nl kan op deze manier automatisch zorgen voor een actuele homepage. Wanneer een bericht ingevoerd wordt moet de titel speciaal ingevoerd worden. Door gebruik te maken van snippets kan er met een content management systeem automatisch een actueel overzicht gemaakt te worden. Het vereist niet meer de handmatige invoeren. Dit heeft een aantal voordelen. Ten eerste is het sneller. Wanneer een bericht gepubliceerd wordt kan de link naar het bericht direct op de homepage verschijnen. Ten tweede bespaart het kosten. Er zijn minder manuren nodig. Automatisering zorgt voor een beter resultaat met minder kosten.
In het bovenstaande voorbeeld komt het voordeel van metadata ook goed naar voren. Bijvoorbeeld het invoeren van de titel. De titel van het bericht is een metadata. Vervolgens wordt deze gebruikt om een goed overzicht te bieden op de homepage. De keuze voor beheersbaarheid zou dus ook te verantwoorden zijn. Uiteindelijk zorgt een content management systeem ook voor beheersbaarheid. Het wordt management geeft daar eigenlijk al de voorzet voor. Het bovenstaand voorbeeld laat zien dat er veel mee mogelijk is dan beheersen van content alleen.
Paper Z811-3 Content en Distributie
12
Paper Z811-3 Content en Distributie
2
13
Bronnen
Boiko, B. (15 december 2001). Content Management Bible. New York: Hungry Minds Sedic (Asociacion Espanola de Documentacion e Informacion), (z.j.) Content Management Concepts. Geraadpleegd op 25 maart 2009 Van: www.sedic.es/documentos_boletin_km/ Content_management.doc University of Wyoming. (z.j.). Why is metadata important?. Geraadpleegd op 23 maart 2009 van: http://www.sdvc.uwyo.edu/ metadata/why.html
Paper Z811-3 Content en Distributie
15