Zoeken binnen Pleio Moderne zoektechnologie in een sociale omgeving
Next2Know, maart 2014
Inhoud Zoeken op Pleio ........................................................................................................................ 1 De pijlers van Pleio ............................................................................................................... 1 Information Retrieval als sociale activiteit .............................................................................. 1 Geavanceerd zoeken binnen Pleio ........................................................................................ 2
i
ZOEKEN BINNEN PLEIO – EEN GEDACHTE
Zoeken op Pleio Pleio is een omgeving die fysiek gestalte geeft aan het concept Ambtenaar 2.0. De gedachte is dat overheidsfunctionarissen niet moeten trachten het wiel opnieuw uit te vinden maar veel meer van elkaar moeten leren door ervaring te delen. In die zin kan gesteld worden dat expliciete vormen van samenwerking en kennisdeling moeten leiden tot een kennisrijke overheid als geheel, de overheid als een zichzelf ontwikkelend - en daarmee hopelijk steeds efficiënter wordend - dienstbaar apparaat. Uiteindelijk leidend tot goed functionerende ketens van wetgeving en uitvoering, van controle en dienstbaarheid, etc. Hoe komen deze hoogdravende gedachten terug in de herkenbare pijlers van Pleio? En wat kan zoek- en vindtechnologie (Information Retrieval, IR) hierbinnen voor rol vervullen? De sleutelgedachte in dit stuk is dat we de keten van kennisdeling moeten benaderen als een sociaal proces. En wanneer we dat doen dan blijken de 'best practices' voor het oprapen in de praktijk van alledag.
De pijlers van Pleio Pleio is gebaseerd op een viertal conceptuele gedachten: 1. Gebruikers werken in een social media context. Dit leidt tot een besef dat men opereert in de publieke ruimte. Uiteraard hoeft men niet alle informatie zichtbaar te maken voor derden maar in de kern is Pleio een omgeving waar gebruikers samenkomen met de bedoeling e.e.a. te delen. 2. De omgeving ondersteunt educatieve processen (er wordt hiervoor gebruik gemaakt van Moodle). Mogelijkheden tot **leren en verrijken** vormen belangrijke ingrediënten van Pleio. De gedachte is dat leren en verrijken tevens hand in hand gaan met het delen van ervaringen. 3. Gebruikersprofielen kunnen gedeeld worden via **portfolio's**. Om het 'elkander ontmoeten en van elkaar leren' te bevorderen moet men elkaar kunnen vinden. D.w.z. men moet gelijkgestemden of anderszins interessante contacten kunnen vinden op grond van interesse, kennisdomein, ervaring en activiteiten, etc. 4. Er zijn middelen voor real-time document collaboration (gerealiseerd m.b.v. Etherpad). Deze component complementeert het rijtje van eigenschappen dat is vereist voor een virtuele projectruimte.
Information Retrieval als sociale activiteit In de beschrijving van de pijlers van Pleio komt duidelijk naar voren dat er idealiter sprake zal zijn van een levendige uitwisseling van passende informatie tussen mensen die elkaar verder kunnen helpen. Wat is 'passende informatie'? Hiermee bedoelen we niets anders dan 'de juiste informatie op het juiste moment bij de juiste persoon'. Dit kan plaatsvinden in zowel een push-scenario ('de informatie wordt ongevraagd gebracht op de plaats van bestemming' ) als een pull-variant ('de ontvanger vraagt de informatie expliciet aan'). In het geval van informatie 'push' kan men bv. denken aan het aanbieden van gerelateerde content op het moment dat men iets leest, of het tijdens het uitvoeren van een zoekopdracht wijzen op aanwezige expertise over het gezochte bij andere gebruikers. Wanneer we in de context van Pleio spreken over 'information retrieval' dan doelen we vooral op retrieval als onderdeel van kennisuitwisseling. Immers, de informatie die wordt gedeeld is in de regel informatie die door andere gebruikers wordt toegevoegd. Anders dan bij het vinden van informatie op het web is men als Pleio gebruiker een onderdeel van de kennisketen. Het 1
ZOEKEN BINNEN PLEIO – EEN GEDACHTE feit dat bv. een gebruiker A een bepaald document belangrijk vindt kan op zich belangrijke informatie zijn voor gebruiker B omdat deze zich met dezelfde materie bezighoudt. Hoe men ook aan passende informatie denkt te komen, te allen tijde is het van belang iets te weten over de ontvanger. Wie is de gebruiker die op zoek is naar informatie, tot welke doelgroep behoort hij of zij, wat is zijn of haar kennisdomein c.q. -niveau? En in het verlengde hiervan: wat weten we over de gebruikersgroep(en) waar hij of zij toe behoort? Kortom, we proberen voorspellingen te doen over de informatiebehoefte van de ontvanger. Deze informatiebehoefte trachten we te vangen in een profiel. Het bepalen van het profiel noemen we profiling. Wanneer we scherp bepaalde profielen hebben dan kunnen we deze vergelijken met profielen van andere gebruikers of gebruikersgroepen. Ook kunnen we deze profielen 'afbeelden op de informatieverzameling. D.w.z. we gebruiken het profiel om gevonden content te filteren naar bruikbaarheid in de context van de ontvanger. Kortom, het profiel moet ervoor zorgen dat we 'de juiste informatie op het juiste moment bij de juiste persoon brengen'. Het 'matchen van profielen' met content en/of andere profielen is iets wat we in de sociale omgang ook impliciet doen: "dit boek moet je ook lezen, echt iets voor jou", "ik ken iemand die hier ervaring mee heeft en die je verder moet kunnen helpen", etc. Vaak kan een **gedeeltelijke match** onverwacht interessant zijn: "ik ken haar via de sportvereniging en zij heeft me gewezen op de mogelijkheden van taaltechnologie voor ons probleem". Wanneer we een computer willen laten bepalen of er sprake is van een interessante hele of gedeeltelijke match dan moeten we criteria hebben om te vergelijken. Wat ons rest is te bedenken hoe goede bruikbare profielen t.b.v. matching bepaald kunnen worden.
Geavanceerd zoeken binnen Pleio De belangrijkste regel voor het bepalen van profielen t.b.v. het zoekproces is dat alle informatie over een entiteit (persoon, document, website, etc.) een bruikbaar aanknopingspunt voor vergelijking kan leveren. Dus niet alleen de strakke Dublin Core metadata maar bv. ook meer impliciete informatie als "waar gaat dit document over?", "aan welke geografische informatie wordt binnen een tekst gerefereerd?", "met welke documenten hangt deze tekst samen?". Ook de normalisatie van informatie speelt een belangrijke rol: wanneer wij zoeken naar teksten met "premier Rutte" dan willen wij waarschijnlijk ook "de minister-president" vinden, maar niet de "fractievoorzitter van de VVD". Wanneer wij binnen Pleio iemand zoeken met kennis over de sociale zekerheid in Nederland dan kunnen personen die documenten over AOW of AKW publiceren interessant zijn voor ons. Wanneer dit niet in de metadata van de documenten staat dan zouden we toch in staat moeten zijn om te bepalen of documenten betrekking hebben op de voor ons belangrijke onderwerpen. In dat geval kan de tekstuele analyse van een document ons leiden naar de auteur achter een document. Voor alles dat niet is vastgelegd in metadata kunnen we succesvol terugvallen op taaltechnologie of NLP (natural language processing) en statistiek. Met behulp van linguïstische en statistische analyses zijn we in staat nieuw gevonden metagegevens aan een zoekindex toe te voegen. Op deze wijze kunnen we bepalen dat "minister-president Rutte" een persoon is en bovendien dezelfde als "premier Rutte". We doen dit niet door het 'stiekem aan de computer te vertellen' maar door geautomatiseerde ontleding van teksten.
2
ZOEKEN BINNEN PLEIO – EEN GEDACHTE Wat kunnen we op deze wijze dan nog meer bereiken? Het volgende rijtje is een niet uitputtende opsomming van de mogelijkheden van geavanceerde retrieval technologie: -
-
Automatisch samenvatten van teksten Classificatie van teksten Verfijnde suggesties aanbieden: "waarschijnlijk bent u ook geïnteresseerd in..." Sentimentanalyse Slim zoeken met nauwkeurige resultaten zonder daarbij gebruik te maken van een al aanwezige thesaurus (volledig en zonder redundantie, d.w.z. met een "high recall and precision") Het geautomatiseerd vinden van synoniemrelaties
etc. Wanneer we dit alles samenvatten onder de noemer "geavanceerd zoeken" dan is de vraag wat de toegevoegde waarde kan zijn voor Pleio. Geavanceerd zoeken binnen Pleio moet de eerder genoemde pijlers van de omgeving ondersteunen. Het moet met name een rol spelen met betrekking tot -
eigentijdse zoek- en vind mogelijkheden: goede zoekresultaten in de vorm van volledige en relevante informatie op maat ondersteuning van het zoekproces: zichtbaar/vindbaar maken van binnen Pleio beschikbare onderwerpen en personen actieve push functionaliteit: attenderingen die passen bij en gewenst zijn door de ontvanger
Extra functionele voorbeelden die passen binnen de conceptuele gedachte achter Pleio zijn onder meer: -
-
-
Thematische dynamische collecties Het automatisch up-to-date houden van (publieke) informatieverzamelingen die gaan over een specifiek onderwerp. Dit kan worden gerealiseerd door de inzet van tools voor automatische classificatie of informatieclustering. Word clouds (woordwolken) ten behoeve van navigatie Door automatische onderwerpsdetectie kan men een gebruiker snel inzicht geven in beschikbare onderwerpen. Ook ziet men snel welke aanpalende thema’s er zijn. Automatisch clusteren van personen en/of gebruikersgroepen op grond van hetgene waar ze zich mee bezig houden Indien men dit wenst kan men een gebruiksprofiel bij laten houden en publiek aanbieden t.b.v. vindbaarheid.
Dit is uiteraard geen uitputtend lijstje maar dient slechts als voorbeeld voor het nadenken over de inzet van geavanceerde ontsluitingstechnologie. Gulden regel is dat een gebruiker geholpen moet worden met het verkrijgen van grip op de aangeboden informatie. Dit betekent dat de content toegankelijk moet worden gepresenteerd: de gebruiker moet het gevoel krijgen dat hij of zij snel haar weg zal weten te vinden. Navigatiemiddelen en onderwerpsdetectie zijn hierbij van eminent belang. Maar ook het begrijpen van een zoekvraag door mee te zoeken naar spellingvarianten, synoniemen, etc. Dit alles vraagt om ‘zoektechnologie in een eigentijds jasje’. Otto Lange, maart 2014
3