Zoeken naar personen Evaluatie van 50 dagen “nieuwe zoekrobot” search.arch.be (27 juni 2011-15 augustus 2011)
Lucie Verachten 1. Inleiding De zoekrobot ‘zoeken naar personen’ geeft toegang tot de metadata van ca. 4 miljoen documenten en ca. 14 miljoen namen. De databank groeit regelmatig aan. De gegevens worden voornamelijk door vrijwiliggers ingevoerd. Een beperkt aantal projecten zijn gebaseerd op systematische analyses van documenten in het kader van inventarisatieopdrachten van het wetenschappelijk personeel van het Rijksarchief.
Project
Doc. Type Document Akte
Structuur van de gegevens Voor structuur van de gegevens wordt gekozen voor een relationeel model waarbij een document (een akte, een archiefdocument, een beschrijvingseenheid in een archiefdocument, ..) afzonderlijk beschreven wordt. De beschrijvingen van het document worden vervolgens gekoppeld aan de beschrijvingen van de personen die vermeld staan in het document. Voor elke persoon wordt vermeld welke rol hij in het document ‘speelt’ (bij voorbeeld in een huwelijksakte: bruid, bruidegom, vader bruid, ...). Zowel voor de omschrijving van het document als voor de beschrijving van de personen zijn diverse velden voorzien. Deze worden enkel ingevuld voor zover de gegevens in het document voorkomen. Zowel voor de omschrijving van het document als voor de personen zijn een minimum aantal gegevens noodzakelijk.
Persoon …
Persoon 1
Persoon 2
De gegevens met betrekking tot de documenten worden gegroepeerd per project. Dit maakt het mogelijk om een al dan niet uitgebreide beschrijving te maken van de doelstellingen van het
1
analyseproject, de medewerkers aan het project, de status van het project, de opties die genomen werden bij de invoer enz. Aangezien in de verschillende projecten vaak gelijksoortige documenten geanalyseerd worden (bij voorbeeld parochieregisters dopen enz....), wordt eveneens een tabel met de aard van de documenten aangemaakt. Ook hier is het mogelijk een algemene beschrijving van een typedocument te maken, een voorbeeld op te nemen van het archiefdocument, .enz.
Nieuwe zoekrobot De nieuwe zoekrobot 'zoeken naar personen' werd gelanceerd op 24 juni 2011. De link werd beschikbaar gesteld via de website van het Rijksarchief onder de titel 'zoeken naar personen' en de nieuwe toepassing werd op dezelfde dag vermeld in de algemene nieuwsbrief die naar ongeveer 8000 abonnees gestuurd wordt. Op 20 juli 2011 werd intern een e-mail gestuurd naar alle diensten om de nieuwe toepassing voor te stellen. Op 25 juli werden via email VVF-Vlaanderen en Faronet uitgenodigd om kennis te nemen van de nieuwe website. Beide verenigingen plaatsten onmiddellijk een aankondiging op de eigen website.
Aangezien zowel de beschrijving van de projecten als deze van de typedocumenten zeer verschillend kan zijn, wordt de informatie slechts gedeeltelijk in een database geplaatst en verder aangevuld als een html-document.
In de nieuwe zoekrobot werden de gegevens uit de oude databank overgenomen. Enkel de beschrijving van de projecten de typedocumenten werd uitgebreid. De vernieuwing heeft dus voornamelijk betrekking op de verbetering en uitbreiding van de zoekfunctionaliteiten en de presentatie. Rekening houdend met de grote hoeveelheid informatie was nl. vooral de antwoordsnelheid en de stabiliteit van het systeem een probleem geworden.
Gegevens Bij de lancering van de nieuwe zoekrobot waren de gegevens van iets meer dan 4 miljoen documenten en 13,5 miljoen namen beschikbaar. De gegevens zijn het resultaat van de invoer in het kader van 47 projecten. De omvang van de projecten is zeer verschillend. Sommige projecten hebben betrekking op de beschrijving van meer dan 100.000 documenten en meer dan een miljoen namen terwijl andere projecten nauwelijks enkele honderden beschrijvingen omvatten.
De belangrijkste vernieuwingen zijn de mogelijkheid om full-text te zoeken in de volledige databank en de optie om documenten op te zoeken waarin twee personen vermeld staan.
Het overgrote deel van de beschrijvingen betreft parochieregisters en akten van de burgerlijke stand en in mindere mate notarisakten. Daarnaast worden ook steeds vaker analyses van andere types archiefdocumenten ingevoerd: bij voorbeeld documenten in verband met soldaten tijdens de Franse periode, bouwaanvragen, stadsrekeningen enz. Een grote meerderheid van de gegevens heeft betrekking op Vlaanderen. Dit is volledig afhankelijk van het aanbod van de gegevens.
2
2. Gebruik van de zoekrobot
Enkele kencijfers
Het gebruik van de website search.arch.be wordt gemonitored via awstats1 geïnstalleerd op de webserver enerzijds en via google analytics anderzijds. Beide statistieken vullen elkaar aan en tonen gelijkaardige cijfers. Google analytics biedt echter veel meer mogelijkheden voor de analyse van de gegevens. Het gebruik van de zoekrobot wordt dan ook voornamelijk hierop gebaseerd. Aangezien de gegevens van google analytics slechts beschikbaar zijn vanaf 27 juni 2011 werd ervoor gekozen om hier ook een periode van 50 dagen te kiezen: namelijk van 27 juni tot en met 15 augustus 2011.
33.811 Bezoeken 676 Gemiddeld aantal bezoeken per dag 13.306 Absoluut unieke bezoekers 1.101.811 Paginaweergaves 32,59 Gemiddelde aantal paginaweergaves per bezoek 00:20:07 Tijd op site
Aantal bezoeken per dag
Bezoeken per dag, per weekdag, per uur In totaal werden 33.811 bezoeken genoteerd over een periode van 50 dagen. Dit komt neer op een gemiddelde 676 bezoeken per dag. De grafiek toont schommelingen in het dagelijks aantal bezoeken. De terugval op zondag 3 juli en maandag 4 juli was te wijten aan een onderbreking van de service. Op woensdag 27 juli werd het hoogst aantal bezoekers genoteerd namelijk 909. Over de gehele periode is een duidelijk stijgende trend vast te stellen.
1
Awstats is een freeware analysetool om de logfiles van websites, ftp-servers, … te analyseren. (http://awstats.sourceforge.net/)
3
Aantal bezoeken per dag van de week De bezoeken zijn evenredig verdeeld over de dagen van de week. De afwijking tussen het hoogste en laagste cijfer is nauwelijks 2,3 %. Op woensdagen worden het meeste aantal bezoeken geteld terwijl op maandag het cijfer het laagst is.
Aantal bezoeken per uur van de dag Het hoogste aantal bezoeken wordt genoteerd om 17.00. Uit de grafiek blijkt dat de website vooral bezocht wordt in de late voormiddag en vervolgens in de namiddag tot ongeveer 22.00.
4
Aantal unieke bezoekers per dag
Unieke bezoekers en nieuwe bezoekers Tijdens de referentieperiode werden 13.306 unieke bezoekers geteld. Dit betekent dat elke bezoeker gemiddeld 2,5 keer de website bezocht. Elke dag raadpleegden 470 unieke bezoekers de website. Ook voor de bezoeken valt een stijgende trend te noteren. De grafiek van het aantal unieke bezoekers vertoont een gelijkaardig verloop als de grafiek van het aantal bezoeken.
Aantal nieuwe bezoekers per dag
Het aantal nieuwe bezoekers dat de website bezoekt per dag, schommelt zeer fel. We merken bij voorbeeld een sterke toename na 25 juni. Deze stijging kan onmiddellijk verklaard worden door de vermelding van de nieuwe zoekrobot op de websites van VVFVlaanderen en Faronet. Het gemiddeld aantal nieuwe bezoekers per dag schommelt rond de 268 en dit gemiddelde cijfer is vrij stabiel over de gehele periode.
5
Aantal bezoeken per bezoeker
Bezoekersloyauteit 40 % van de bezoekers heeft de website éénmaal bezocht in de referentieperiode. 22% van de bezoekers heeft de website tussen de 9 en de 50 keer bezocht.
Duur van een bezoek
Duur van het bezoek Gemiddeld duurt een bezoek ongeveer 20 minuten. 18 % verlaat de website na maximaal 30 seconden. Daar tegenover staat dat 43 % van de bezoeken meer dan 10 minuten duren. Een gemiddelde van 20 minuten is vrij hoog en kan betekenen dat de bezoekers ook daadwerkelijk informatie terugvinden en verder op zoek gaan naar meer informatie.
6
Gemiddeld aantal pagina’s per bezoek
Aantal pagina’s per bezoek Gemiddeld worden 32 pagina’s bekeken per bezoek. Gedurende de referentieperiode is er een lichte stijgende trend merkbaar voor wat betreft het aantal geraadpleegde pagina’s per bezoek. De gemiddelde duur per pagina is 38 sec.
Gemiddeld bouncepercentage
Bouncepercentage Het bouncepercentage geeft het aantal bezoekers weer dat de website na één pagina verlaat. Het gemiddelde bouncepercentage bedraagt 11,85 %. Het percentage schommelt weliswaar maar de algemene trend is stabiel en situeert zich rond de 12 % voor de gehele referentieperiode. In vergelijking met andere websites is dit bouncepercentage zeer laag. Google geeft immers aan dat een bouncepercentage tussen 40 % en 60 % voor een website normaal is. Dit betekent dat de referenties naar de website en naar het juiste publiek gericht zijn en dat de website uitnodigt om verder te klikken en te zoeken.
7
Herkomst van bezoekers
Herkomst van de bezoekers Op basis van het IP-adres van de computer van de gebruiker kan bepaald worden vanuit welke plaats het onderzoek gebeurt De bezoekers zijn afkomstig uit 57 verschillende landen. Het zwaartepunt van het aantal bezoeken ligt in België en in tweede instantie de buurlanden en vervolgens in de andere Europese landen. Azië, Noord- en Zuid-Amerika en Australië zijn vertegenwoordigd maar Afrika en de Arabische wereld zijn niet of zeer beperkt vertegenwoordigd.
België Frankrijk Nederland
Bezoeken 68,67% 13,79% 11,92%
Zowel voor wat betreft het aantal bezoeken als het aantal bezoekers behaalt Frankrijk en Nederland na België de hoogste cijfers. De andere landen volgen met 1 % of minder.
Unieke bezoekers 60,50% 17,91% 15,09%
Een gemiddelde van 147 paginaweergaves per bezoek en 16 bezoeken toont aan dat er een bijzonder geïnteresseerde onderzoeker in Thailand de website raadpleegt. Ook het gemiddelde van 110 paginaweergaves en 2 bezoeken wijst op een bijzondere interesse bij een onderzoeker in Guadeloupe. Het hoogste cijfer voor de gemiddelde duur van het websitebezoek wordt gehaald in Polen, namelijk 53 minuten en dit voor een totaal van 110 bezoeken. In totaal werd de website dus bijna 100 uur vanuit Polen geraadpleegd. De onderzoeken uit Malta, Colombia, Indonesië, Aruba en Frans Polynesië waren niet zeer vruchtbaar. Reeds na één bladzijde verlieten de bezoekers opnieuw de website.
8
Naast het land kan op basis van het ip-adres van de computer ook de herkomst per provincie achterhaald worden. Hoewel kleine afwijkingen mogelijk zijn, geven de cijfers een zeer duidelijk beeld.
Bezoeken per provincie
In absolute aantallen scoren Antwerpen, Oost-Vlaanderen en Brussel het hoogste aantal bezoeken. Luxemburg, Namen en Waals-Brabant scoren zeer laag.
Unieke bezoekers per provincie
Ook het aantal unieke bezoekers per provincie geeft een gelijkaardig resultaat. Het is opmerkelijk dat sommige buitenlandse regio’s hoger scoren dan Belgische provincies. Het Franse departement Nord-Pas-deCalais situeert zich tussen Brussel en Vlaams-Brabant. Het Franse departement Île-de-France en de Nederlandse provincie Noord-Brabant staan vlak vóór Limburg. Waals-Brabant moet 20 voornamelijk Franse departementen en Nederlandse provincies laten voorgaan.
9
De absolute cijfers van het aantal bezoeken en/of aantal unieke bezoekers kunnen een vertekend beeld geven. Er werd een herberekening gemaakt rekening houdend met het aantal inwoners per provincie.
Unieke bezoekers per 100.000 inwoners
De grafiek toont het aantal bezoekers per 100.000 inwoners. West-Vlaanderen haalt met 134 bezoekers het hoogste cijfer gevolgd door Oost-Vlaanderen, het Brussels Hoofstedelijk Gewest en Antwerpen. De cijfers voor Waals-Brabant, Luxemburg en Namen blijven ook na de correctie op basis van het aantal inwoners nog zeer laag. Het is niet verwonderlijk dat de hoge scores in overeenstemming kunnen gebracht worden met die provincies waar heel wat analyseprojecten door vrijwilligers uitgevoerd worden. De beschikbaarheid van de informatie heeft een directe invloed op de aantrekkelijkheid van de website en dus op het aantal bezoeken en bezoekers. Gemiddeld ..
Aantal bezoeken per bezoeker
Duur per bezoek
Aantal paginaweergaves per bezoek
Het gemiddeld aantal bezoeken per bezoeker, de gemiddelde duur per bezoek en het gemiddelde aantal paginaweergaves per bezoeker geven geen duidelijk verklaarbaar beeld.
Antwerpen
2,80
0:21:26
32,48
Oost-Vlaanderen
2,62
0:20:11
32,94
West-Vlaanderen
2,85
0:26:43
44,61
Brussels Hoofstedelijk Gewest
3,41
0:20:30
32,92
Vlaams-Brabant
2,71
0:22:12
35,36
Henegouwen
2,52
0:21:55
33,67
Luik
2,12
0:14:04
24,33
Limburg
1,56
0:21:36
35,70
Waals- Brabant
1,91
0:19:38
22,74
Namen
2,15
0:33:57
50,41
Luxemburg
1,65
0:18:16
31,64
Niettegenstaande het klein aantal bezoekers uit de provincie Namen is de gemiddelde duur van het bezoek zeer hoog en wordt ook het hoogst aantal paginaweergaves per bezoek genoteerd. De provincies Limburg en Luxemburg tonen het laagste aantal bezoeken per bezoeker terwijl het Brussels Hoofstedelijk Gewest het hoogste aantal terugkomers telt.
10
Infrastructuur van de bezoeker
Taal van de browser van de bezoekers
Taal van de bezoeker De taal van de bezoeker wordt genoteerd op basis van de taal van de browser. In totaal werden 41 verschillende talen genoteerd. Sommige talen komen in meerdere varianten voor bij voorbeeld: nlbe en nl-nl of fr-be en fr-fr. Bij de verwerking werden ze echter samengenomen. Meer dan 58 % van de bezoekers maakt gebruikt van een Nederlandstalige browser. Bijna 30 % een Franstalige en 11 % een Engelstalige browser. Duits is nauwelijks goed voor 0,75 % en ook de andere talen scoren eerder laag.
Browsers
Browsers In het licht van de verdere ontwikkeling van de website is het belangrijk een overzicht te hebben van de gebruikte browsers. Er dient immers op toegezien te worden dat de website compatibel is met de gebruikte browsers. Bijna 65 % van de lezers gebruikt één of andere versie van Internet Explorer. Firefox komt op de tweede plaats met bijna 19 % gevolgd door Chrome met bijna 10 %. Ook Safari gebruikt door 7 % van de bezoekers is een niet te verwaarlozen browser. Van de Internet Explorer-gebruikers meerderheid IE 8.0 gevolgd door IE 9.0.
11
gebruikt
de
overgrote
Besturingssystemen
Besturingssystemen Meer dan 91 % van de bezoekers gebruikt een toestel met Windows als besturingssysteem. Macintosh is goed voor 7 %. Ipad, Androïd, Iphone zijn goed voor bijna 1 % maar deze laatste zullen ongetwijfeld in de komende maanden en jaren in aandeel groeien. Scherminstellingen, flashversies De instellingen van het scherm hebben een belangrijke invloed op de presentatie en leesbaarheid van de informatie op scherm. De analyse leert ons dat er 287 verschillende schermresoluties gebruikt worden. Het is onmogelijk om alle mogelijke combinaties te testen. Er dient gefocused te worden op de vaakst voorkomende en evnetueel op basis van feedback van bezoekers bijgestuurd worden daar waar nodig. Ook de 62 gebruikte flashversies kunnen niet allemaal getest worden. Wel kan er kan op de website vermeld worden voor welke systemen de website geoptimaliseerd is en hoe eventuele problemen gesignaleerd kunnen worden.
12
Hoe vinden bezoekers de weg naar de website?
Oorsprong
83 % van de bezoekers komt via de website van het Rijksarchief op de webpagina ‘zoekrobot personen’. Iets meer dan 10 % komt rechtstreeks op de website. Dit betekent dat ze het adres rechtstreeks in de browser invoeren ofwel dat ze de pagina opgenomen hebben in de favorieten en vanuit deze lijst rechtstreeks naar de website gaan. In totaal bereikt nauwelijks 3,70 % de website vanuit links uit andere websites. De hoogste scores worden gehaald door verwijzingen op de websites van familiekunde-Vlaanderen, stamboomforum.nl, geneachtimi.com en faronet.be. In totaal worden nochtans een twintigtal websites vermeld die we op basis van hun adres als ‘genelaogische websites’ kunnen catalogeren en die gebruikt worden als link naar search.arch.be. Het aandeel van verwijzingen uit zoekrobots is nog zeer beperkt. Iets meer dan 2 % van bezoekers heeft de website via Google gevonden terwijl de andere zoekrobots nauwelijks goed zijn voor 0,12 %.
13
namelijk tussen de 10 en 25 seconden. De beschikbare informatie op deze pagina's is dan ook nog zeer beperkt.
Wat bekijkt men op de website? In totaal werden tijdens de referentieperiode 1.101.811 pagina’s geraadpleegd. Het betreft 307.133 unieke bladzijden. Dit hoge cijfer kan verklaard worden. Elke ontsloten akte wordt immers als een unieke bladzijde weergegeven. De website telt dus bijna 5 miljoen unieke pagina’s.
Het merendeel van de paginaviews heeft betrekking op de raadpleging van de gegevens met betrekking tot één geanalyseerd document. Het is opmerkelijk dat sommige pagina's tot 40 maal geraadpleegd werden. Ongetwijfeld werden ze door een gebruiker als bookmark opgeslagen of als voorbeeld gebruikt. De meeste pagina's werden maar één keer geraadpleegd. De gemiddelde duur van een paginaview varieert zeer sterk en is afhankelijk van de informatie die getoond wordt en van de relevantie voor het onderzoek. Sommige pagina's bevatten tot 100 vermelde personen, opmerkingen, ... terwijl andere pagina's een zeer summiere analyse geven en slechts één of twee namen vermelden.
Er zijn vier types pagina’s te onderscheiden: - inleiding, toelichting bij zoekrobot, .. - beschrijvingen van de projecten - beschrijvingen van typedocumenten - analyse per document De vaakst geraadpleegde pagina’s zijn de homepage van de website en de pagina die naar de zoekrobot leidt. Verder is het opmerkelijk dat de pagina met het overzicht van de projecten 9618 aangeklikt wordt. Dit betekent dus dat er heel wat interesse is voor het overzicht van de projecten. Gemiddeld wordt deze pagina gedurende 25 seconden bekeken. Aangezien de handleiding als een pdf-document opgenomen is, is niet mogelijk het aantal views hiervan te bekijken. De detailpagina’s met de beschrijvingen van de diverse projecten zijn goed voor 7418 views. Deze pagina's zijn bereikbaar vanaf de overzichtspagina 'projecten' en vanaf de resultatenlijst en vanaf de pagina met de analyse per document. De detailpagina's scoren een vrij hoge gemiddelde ‘paginaview’ namelijk tussen de 20 en 60 seconden. De bladzijde met betrekking tot het project ontsluiting van huwelijksakten in Vlaams-Brabant en Brussel werd het vaakst geraadpleegd, namelijk 669 keer. De detailpagina's per typedocument worden minder vaak geraadpleegd. Ze zijn samen goed voor 1768 views. Deze pagina's zijn enkel bereikbaar vanaf de resultatenlijst en vanaf de pagina met de analyse per document. De gemiddelde paginaview is laag
14
genealogische website. De vermelding op Faronet en VVFVlaanderen op 25 juli heeft nagenoeg geen impact gehad op het aantal ingevulde enquêtes.
3. Evaluatie van de gebruikersreacties Bij de lancering van de nieuwe zoekrobot werd aan de gebruikers gevraagd hun waardering over de nieuwe zoekrobot uit te spreken. De enquête heeft betrekking op de zoekmogelijkheden, de snelheid van de toepassing en de presentatie. Voor elk van deze elementen wordt een waardering gevraagd op een schaal van 1 tot 10 en wordt de mogelijkheid geboden bijkomende informatie in te voeren. De enquête kon anoniem ingevuld worden of men kon ervoor opteren om naam en e-mailadres te vermelden.
Anoniem versus vermelding van contactgegevens 65 % van de respondenten vermelden naam en e-mailadres. De gegevens werden niet gecontroleerd maar we gaan ervan uit dat de gegevens correct zijn. 32 % vult de enquête anoniem in.
Aantal reacties In totaal vulden 563 personen het enquêteformulier over het gebruik van de zoekrobot in.
Oorsprong van gebruik Een kwart van de gebruikers vermeldt dat ze de lancering van de nieuwe website gelezen hebben in de nieuwsbrief en 14 % hebben de link op een website gevolgd. De vraag vanaf welke website men doorverwezen werd, werd slechts door een zeer beperkt aantal gebruikers ingevuld. Ongetwijfeld hebben velen de link op de homepage van het Rijksarchief gevolgd. 12 % heeft de website via vrienden of kennis leren kennen. 42 % van de gebruikers vermeldt dat ze de nieuwe website toevallig ontdekt hebben. Dit hoge cijfer
Vooral tijdens de twee eerste dagen na de lancering van de nieuwe website noteren we heel wat reacties. Naderhand valt het aantal terug maar die blijft toch schommelen rond de 10 reacties per dag. Er is geen onmiddellijke verklaring voor de piek rond 13 juli. Waarschijnlijk werd een link vermeld op één of andere
15
70 % van de respondenten geeft aan dat ze de vroegere zoekrobot gebruikt heeft, 30 % geeft aan dat ze de vorige versie van de zoekrobot nooit gebruikt hebben.
'toevallige bezoekers' moet ongetwijfeld lager ingeschat worden en kan gedeeltelijk verklaard worden omdat dit de laatste optie was.
Infrastructuur van gebruikers Aangezien de infrastructuur van de gebruikers een belangrijke invloed heeft op de presentatie en beschikbaarheid van zoekmogelijkheden, werden deze gegevens automatisch geregistreerd bij het invullen van de enquête.
Als referentiewebsites worden volgende URL-adressen vermeld. -
-
www.vvf.be – www.familiekunde-vlaanderen.be (4 vermeldingen) www.faronet.be (2 vermeldingen) www.vrijwilligersrab.be (4 vermeldingen) www.geneahuy.be (3 vermeldingen) www.stamboomforum.nl – www.stamboomvragenforum.nl www.genealogieforum.nl (4 vermeldingen) www.geneachtimi.fr – www.geneachtimi.com (3 vermeldingen) www.geneanet.fr (2 vermeldingen) www.genealogie.com (1 vermelding) www.geni.com (1 vermelding) www.genedinant.be (1 vermelding) http://www.geneaknowhow.net (1 vermelding) HerveGeneNet (1 vermelding) GenWalBru (1 vermelding)
De overgrote meerderheid gebruikt een Windowssysteem. Windows XP, Windows 7 en Windows Vista worden het vaakst gebruikt. Er werden 34 verschillende browsers en versies genoteerd. Omwille van de leesbaarheid van het resultaat werden de browsers samengebracht per belangrijke release.
Deze adressen hebben we ook genoteerd bij de 'oorsprong' van het bezoek op basis van google analytics.
16
opgegeven omdat ze wellicht een foutief begrip hadden van de inhoud van de database.
De grote meerderheid van de respondenten (66 %) gebruikt één of andere versie van Internet Explorer. Mozilla Firefox neemt met meer dan 21 % toch ook een belangrijk aandeel in. Google Chrome komt op de derde plaats gevolgd door Apple Safari. Het merendeel van de respondenten gebruikt een recente browser. Slechts een zeer kleine minderheid gebruikt een oude versie van Internet Explorer of Mozilla.
Een meer gedetailleerde analyse leert dat meer dan de helft van de respondenten 8, 9 of 10/10 als score aanduiden en dat bijna 75% 7 of meer geeft. De lage cijfers kunnen in verband gebracht worden met de opmerkingen over een beperkt resultaat op de vragen (zie hierover verder in de analyse van de opmerkingen).
Evaluatie van zoekcriteria De gemiddelde score voor de zoekcriteria is 7,1. Er is geen significant verschil tussen de respondenten die naam en e-mailadres opgaven (7,2) en diegenen die anoniem de enquête invulden (6,9).
Evaluatie snelheid van de zoekmotor De snelheid waarmee de zoekopdrachten uitgevoerd worden, krijgt een gemiddelde score van 7,8. Het verschil tussen de respondenten die de vorige zoekmotor gebruikten (7,8) en de ‘nieuwelingen’ (7,6) is eerder beperkt.
Het verschil tussen de respondenten die de vorige website gebruikten en de nieuwelingen is iets groter: respectievelijk 7,4 en 6,5. Zoals verder uit een meer gedetailleerde analyse van de commentaar blijkt, hebben heel wat respondenten een laag cijfer
17
Een meer gedetailleerde analyse leert dat meer dan 82% van de respondenten 7 of meer als resultaat geven. De snelheid van de antwoorden in een zoekrobot die momenteel 4 miljoen akten en 14 miljoen namen telt, is zeer goed. Zowel bij eenvoudige vragen als full-text opzoekingen of gedetailleerde en complexe zoekvragen is de performantie van het systeem zeer goed.
Een gedetailleerde analyse toont aan dat de helft van de respondenten 8 of meer geven voor presentatie. Bijna 75 % geeft 7 of meer. Opmerkingen De respondenten konden naast een score ook commentaar toevoegen bij elk van de vragen (zoekcriteria, snelheid, presentatie) en een algemene opmerking toevoegen.
Evaluatie van de presentatie van de gegevens Ook voor de presentatie van de gegevens haalt de website een hoge score namelijk 7,2. De score ligt hoger bij diegene die de vroegere website gebruikten (7,4) dan bij de nieuwelingen (6,6). Ook hier spelen de verwachtingen met betrekking tot de antwoorden een doorslaggevende rol. Heel wat respondenten beoordelen niet de presentatie maar de inhoud van de antwoorden zelf.
45 % van de respondenten gaven bijkomende commentaar. Aangezien de inhoud van de drie commentaarvelden vaak overlappend is, worden alle commentaren samen behandeld. 41 % van deze commentaren bevatten expliciete positieve opmerkingen: “mooie gewaardeerde vooruitgang”, “een dikke proficiat”, “je suis vraiment très contente de votre site”, “très bonne conception du programme”, “I am happy with the improvements.
Er is geen verschil tussen de respondenten die anoniem antwoordden en de respondenten die naam en e-mailadres opgeven.
18
Because of those I have been able to find some new ancestors”’ enz. 31 % van de commentaren waren negatief. Het merendeel van de negatieve opmerkingen heeft betrekking op het niet terugvinden van informatie: “j’ai des ancêtres dont je ne trouve pas de trace pourtant j’ai les dates et la ville”. “ça ne fonctionne pas, me dit toujours 0 personne”, “ik heb niet de geboorteaktes of de overlijdensaktes kunnen vinden”. “Ik heb de nummers van de microfilms waar de gegevens zouden moeten opstaan, maar dat kan ik zo te zien ook niet inbrengen”, “I’m filling in my family tree and can not find anything on my grandparents who were from Belgium !”, “heb alleen maar zeer slecht getikt omdat ik nergens toekwam”. Interessanter zijn echter die opmerkingen die specifieke problemen weergeven, suggesties doen, ... al dan niet in combinatie met een positieve of een negatieve opmerking. Deze opmerkingen worden in het volgende hoofdstuk gegroepeerd en geanalyseerd.
19
naar een bladzijde waarop toegelicht wordt waarom het resultaat zo beperkt is. 1) inhoudsomschrijving van de database 2) suggestie voor aanpassing van de zoekcriteria a. minder zoekcriteria invoeren b. gebruik van wildcards
IV. Vragen, suggesties, ... van gebruikers De vragen en suggesties van de gebruikers worden gegroepeerd rond drie thema’s: inhoud, zoekmogelijkheden en presentatie. Telkens wordt een omschrijving gegeven van de vraag, klacht of suggestie, gevolgd door een voorstel voor verbetering of een verklaring waarom een bepaalde technische keuze gemaakt werd en de suggestie van de lezer dus niet kan gevolgd worden.
Volledigheid van de inhoud Een aantal personen beklaagt er zich over dat de gegevens niet altijd volledig zijn. In de eerste plaats zijn de beschikbare gegevens verschillend van project tot project. Sommige vrijwilligers hebben er immers voor gekozen om alle gegevens in te voeren ; anderen hebben zich beperkt tot de meest essentiële informatie. Sommige respondenten vragen dat er meer informatie ingevoerd zou worden dan beschikbaar in het document zelf.
geeft aan dat de optie voor verbetering nog verder onderzocht dient te worden of geïmplementeerd moet worden geeft aan dat aan de vraag, suggestie niet kan tegemoet gekomen worden om technische of praktische redenen
In de handleiding of in een afzonderlijke bladzijde kan nog eens extra gewezen worden op de beperkingen met betrekking tot de volledigheid van de informatie.
geeft aan dat er een oplossing werd uitgewerkt
A. INHOUD
Fouten in de gegevens
Fout begrip van inhoud
5 respondenten geven aan dat het nuttig is om fouten te signaleren in de gegevens. In het verleden hebben we vastgesteld dat lezers via e-mail fouten signaleren in de gegevens of aanvullingen voorstellen. Soms gaat het inderdaad om fouten (foute interpretatie, foute lezing of tikfout) maar vaak suggeren lezers een verbetering op basis van informatie die ze in andere documenten hebben kunnen lezen. In de analyse worden de gegevens opgenomen zoals ze terug te vinden zijn in het geanalyseerde document. Eventueel kan door middel van [sic] aangegeven worden dat de gegevens wel degelijk zo vermeld staan. Eventuele verbeteringen of suggesties voor verbetering kunnen opgenomen worden in de opmerking.
Uit de opmerkingen en in beperkte mate uit de scores blijkt dat heel wat gebruikers een totaal verkeerd beeld hebben van de inhoud van de databank. Zij gaan ervan uit dat de website ‘alle inwoners van het huidige België’ bevat met geboortedatum, overlijdensdatum enwoonplaats en dit voor de periode van de middeleeuwen tot halfweg de 20ste eeuw. De inhoud van de databank wordt nochtans duidelijk beschreven in de inleiding, de handleiding en er werd een overzicht gemaakt van de projecten. Rekening houdend met de frequentie van de reactie wordt onderzocht of het mogelijk is bij ‘geen resultaat’ en eventueel bij een resultaat kleiner dan 10 met een link door te klikken
Het valt te overwegen om te onderzoeken of het opportuun is en technisch haalbaar om een antwoordformulier te voorzien via hetwelke lezers rechtstreeks vanaf het resultatenformulier
20
heeft betrekking op het opnemen van een lijst van gelijkluidende familienamen zodat op die manier kan verder gezocht worden.
fouten kunnen signaleren. Dit hangt samen met de mogelijkheid om een persoonlijke pagina te creëren en bookmarks te maken. Intussentijd dient in de handleiding een vermelding opgenomen te worden dat fouten kunnen gemeld worden via
[email protected].
Het is belangrijk aan te geven dat de gegevens ingevoerd worden zoals ze in de documenten teruggevonden worden (eventueel met een toevoeging [sic] of een toelichting in de opmerking. Het uniformiseren van de gegevens door zoveel verschillende personen zou immers leiden tot onbruikbare en foutieve gegevens. Aan de interessante suggestie om een lijst op te nemen met verschillende schrijfwijzen en/of afleidingen van familienamen kan helaas geen gevolg gegeven worden. Er bestaan nl. een aantal publicaties met betrekking tot de oorsprong van familienamen die ook verschillende schrijfwijzen opnemen.2 De lezer kan in de zoekmotor gebruik maken van de zoekopties om te zoeken op afwijkende schrijfwijzen.
Nieuwe gegevens, updates 3 lezers vragen of het mogelijk is aan te geven welke gegevens recent werden toegevoegd. Op die manier dient men alle antwoorden niet volledig te doorlopen. Er kan slechts ten dele worden tegemoet gekomen aan deze vraag. In het datamodel is voorzien dat de laatste wijzigingsdatum van elk gegeven kan geregistreerd worden. In de praktijk blijkt dat deze gegevens niet altijd kunnen aangegeven worden. In het kader van langlopende projecten (bij voorbeeld huwelijksakten West-Vlaanderen, huwelijksakten Vlaams-Brabant, notarisakten Antwerpen) geeft men er de voorkeur aan om telkens de volledige versie van de gegevens opnieuw door te sturen en te laten verwerken in plaats van aanvullingen, schrappingen en wijzigingen door te geven. Bij elke nieuwe upload worden dus alle gegevens verwijderd en opnieuw toegevoegd. Voor een beperkt aantal projecten worden echte updates uitgevoerd (bij voorbeeld Demogen project, GSU-project). Op elke projectpagina wordt nu reeds de laatste statusdatum vermeld alsook het aantal ingevoerde gegevens en een aanduiding van de voortgang van het project. De mogelijkheid wordt onderzocht of het technisch haalbaar is om de zoekvragen te beperken tot de gegevens die ingevoerd zijn na een bepaalde datum. Een andere mogelijkheid is het toevoegen van een bladzijde ‘historiek’ waarbij de nieuwigheden systematisch vermeld worden.
Link naar de originele documenten Zes lezers vragen dat de link kan gelegd worden naar het originele archiefdocument. De optie om door te klikken naar ‘zoeken naar archieven’ en daar eventueel door te koppelen naar het gedigitaliseerde document is voorzien in het datamodel. In de praktijk zal dit echter slechts voor een zeer beperkt aantal projecten mogelijk zijn. Enkel de projecten waarbij de analyses gemaakt werden op basis van gedigitaliseerde documenten en waarbij de link naar het archiefdocument opgenomen werd, komen in aanmerking voor een eventuele directe link. Indien deze informatie niet aanwezig is, kan hoogstens doorgeklikt worden naar het archiefblok (en eventueel archiefbestanddeel) maar niet naar de juiste bladzijde in het document.
Uniformisatie van gegevens Een lezer suggereert om alle voornamen te uniformiseren om op die manier gemakkelijker te kunnen zoeken. Een andere suggestie
2
Bij voorbeeld. Debrabandere, F. Woordenboek van de familienamen in België en Noord-Frankrijk - Dictionnaire des noms de famille de Belgique et du nord de la France. Amsterdam, 2003.
21
B. ZOEKMOGELIJKHEDEN Zoekmogelijkheid: ‘begint met’ ‘eindigt op’ Handleiding In de vorige versie van de zoekrobot was de mogelijkheid voorzien om te zoeken op een familienaam die begint of eindigt met een bepaalde lettergroep. De zoekvraag 'eindigt op "poorten"' leverde dan resultaten op zoals Vanderpoorten, Van de poorten, Verpoorten, ... In de nieuwe website is deze optie niet expliciet weergegeven maar is deze nog steeds mogelijk. Door het gebruik van de klassieke wildcards "*” voor een onbepaald aantal karakters of ‘?’ ter vervanging van één karakter heeft men zelfs meerdere mogelijkheden dan via de oude website. De wildcards kunnen immers gebruikt worden in alle velden en alle combinaties ‘begint met’, ‘eindigt op’ en ‘bevat’ zijn mogelijk. 16 respondenten stellen voor om een mogelijkheid te voorzien om te zoeken met de optie ‘begint /eindigt’. 1 respondent geeft aan dat het nuttig zou zijn om familienamen te zoeken met of zonder spaties (bij voorbeeld vanderpoorten en vander poorten). 3 respondenten geven aan dat het zoeken met wildcards heel wat meer mogelijkheden biedt dan in de vorige website.
8 respondenten geven aan dat het nuttig zou zijn dat er een handleiding voorzien wordt. Aangezien de handleiding blijkbaar niet gemakkelijk terug te vinden was op de website, werd een bijkomende link toegevoegd naar de handleiding onmiddellijk onder de knop ‘zoeken’. Complexiteit van de website en zoekmogelijkheden 9 respondenten geven aan dat de website te complex is, te moeilijk om te gebruiken, niet bruikbaar voor oudere personen,... Een aantal vragen hadden betrekking op de opties in het zoekscherm. 6 lezers hebben de werking van de knop ‘geboorte’, ‘overlijden’ niet correct begrepen. Via deze optie kan de lezer akten opzoeken van personen op basis van een gekende geboorteplaats of –datum en/of overlijdensplaats of –datum. Met deze optie wordt de zoekvraag niet beperkt tot respectievelijk geboorte- of overlijdensakten. Hiervoor dient een aktetype gekozen te worden.
Het zoeken met wildcards is een optie die in de handleiding verder dient uitgewerkt te worden. In relatie tot een aantal andere vragen kan het nuttig zijn om een afzonderlijk document te maken met voorbeelden van uitgewerkte zoekvragen.
Een lezer geeft aan dat het nuttig zou zijn dat wanneer ‘Moeskroen’ gezocht wordt ook automatisch de akten met als plaatsnaam ‘Mouscron’ zouden geselecteerd worden. Deze lezer heeft duidelijk de communicatie rond de zoekmotor en/of de handleiding niet geraadpleegd aangezien dit juist één van de nieuwigheden is.
Zoekmogelijkheid ‘klinkt als’ De zoekmogelijkheid ‘klinkt als’ maakt het mogelijk om op basis van fuzzy logic algoritmes op zoek te gaan naar gegevens die niet exact overeenkomen met de ingevoerde zoekwoorden maar ‘klinken als’. Zoals ook in de handleiding wordt toegelicht is deze optie taalgevoelig en kan het resultaat zeer verschillend zijn. De reacties van de respondenten zijn zeer verschillend: sommige respondenten geven aan dat deze optie nuttig is terwijl anderen aangeven dat deze optie te veel resultaten geeft die ver afwijken van de gezochte gegevens.
Deze opmerkingen kunnen deels opgevangen worden via de handleiding. Hier is echter een taak weggelegd voor de leeszaalvoorzitters die gebruikers in de leeszaal kunnen bijstaan of voor genealogische verenigingen die hun leden wegwijs kunnen maken in de genealogische bronnen en on-line hulpmiddelen die ter beschikking staan.
22
afwijkende schrijfwijzen. 6 respondenten vragen hierbij aansluitend of het mogelijk is te zoeken in een bepaalde regio. De wijze waarop zij dit zien is zeer verschillend: per provincie, in de omgeving van een bepaalde stad, ...
Gezien de zeer uiteenlopende reacties van de gebruikers en aangezien ‘klinkt als’ een extra mogelijkheid is die al dan niet kan aangeklikt worden, wordt de optie bewaard. Er kan eventueel wel onderzocht worden of het mogelijk is andere fuzzy logic algoritmes te gebruiken die nauwer aansluiten bij het Nederlands en Frans taalgevoel.
Bij de voorbereiding van de zoekrobot werd nagedacht over een dergelijke mogelijkheid. Deze zal echter eerst geïmplementeerd worden voor het opzoeken van gegeolokaliseerde documenten (zoals historische kaarten). In een tweede stadium kan onderzocht worden hoe deze optie kan uitgebreid worden op basis van de hulptabel ‘gemeenten’ voor andere types van gegevens. De gebruiker heeft momenteel wel de mogelijkheid om de zoekvraag te beperken tot één project, hetgeen meestal geografisch duidelijk afgebakend is.
Wissen alle zoekmogelijkheden Een aantal respondenten geeft aan dat het omslachtig is om bij complexe zoekvragen alle zoekopties te verwijderen alvorens een nieuwe zoekvraag te starten. Er werd een knop toegevoegd ‘Wis alle zoekvoorwaarden.’
Zoeken op basis van gemeente Eén respondent geeft aan dat hij bij het invoeren van een gemeentenaam meer resultaten krijgt dan verwacht. Hij voert ‘Beerse’ in als zoekterm en krijgt als resultaat ook ‘Beersel’. Er werd vastgesteld dat bij de invoer heel wat bijkomende gegevens aan de gemeentenaam werden toegevoegd (bij voorbeeld Beveren (OVl), Zandvoorde (bij Oostende), Brussel/Bruxelles, ...) Indien enkel op basis van het exact voorkomen van de zoekwoorden gezocht wordt, worden heel wat records niet weergegeven. Er werd dan ook voor geopteerd om alle records weer te geven die beginnen met het zoekwoord. In de toekomst wordt het hulpscherm ‘gemeenten’ waarbij automatisch kan gezocht worden op gemeentenamen in verschillende talen en afwijkende schrijfwijzen verder uitgebreid zodat meer exact kan gezocht worden. Zoeken op basis van een regio De nieuwe zoekmethode 'gemeenten' maakt het mogelijk te zoeken naar gemeentenamen in verschillende talen en op basis van
23
In de huidige versie van de zoekrobot is (nog) geen loginmogelijkheid voorzien zodat lezers hun eigen voorkeuren, selecties, ... kunnen bewaren. Dit onderdeel is wel voorzien voor het onderdeel 'zoeken naar personen'. In een volgende fase kan eventueel bekeken worden of dit onderdeel ook voor 'zoeken naar personen' kan geïmplementeerd worden.
C. LAY-OUT EN PRESENTATIE Algemene lay-out - presentatie Er zijn relatief weinig opmerkingen met betrekking tot de lay-out en de presentatie van de gegevens. Er werd een opmerking gemaakt over de grootte van het detailscherm en een opmerking over het feit dat men dient naar beneden te scrollen om op de zoekknop te klikken.
Taal en vertaling Bij de lancering was één foutmelding niet correct vertaald in het Frans. 4 lezers merkten dit op en vermelden dit in de opmerkingen. Twee lezers melden dat de Engelse vertaling niet volledig is. Een aantal lezers hadden opmerkingen over de taal van de 'inhoud van de akten'.
De grootte en het overzicht op scherm zijn echter afhankelijk van de scherminstellingen. Gezien het lage aantal reacties gaan we ervan uit dat er geen wezenlijke problemen zijn. Doorklikken vanaf detailscherm
De Franse vertaling werd onmiddellijk toegevoegd. Intussen is ook een Duitse vertaling klaar en geïmplementeerd. De Engelse vertaling dient echter nog toegevoegd te worden. De vertaling heeft echter enkel betrekking op de website zelf en de keuzelijsten (bijvoorbeeld rollen, projecten, ...) maar niet op de inhoud van de analyses zelf.
9 bezoekers gaven aan dat het nuttig zou zijn om vanaf het detailscherm telkens door te kunnen klikken naar de volgende akte zonder terug te keren naar de resultatenlijst. Aangezien het detailscherm in een popup getoond wordt, dient onderzocht te worden of het technisch haalbaar is een vorige en volgende knop te voorzien die rekening houdt met de resultatenlijst. Printen van een selectie van gegevens - bewaren van gegevens Momenteel werd voorzien dat de gebruikers de gegevens akte per akte kunnen printen (en eventueel printen naar een pdf). 2 lezers vragen of het mogelijk is om een volledige selectie van de gegevens te bewaren of te printen. Daarbij sluit eveneens de vraag aan van vijf lezers om de gegevens te kunnen exporteren naar een bestand. Eén lezer vraagt zelfs om de gegevens rechtstreeks te kunnen exporteren naar een GED-formaat zoals in genealogische software gebruikt wordt.
24
IV. Besluit De website is over het algemeen zeer goed onthaald bij de gebruikers. In de enquête werden een aantal nuttige voorstellen voor verbetering gesuggereerd die in de verdere ontwikkeling zullen meegenomen worden. De website wordt zeer intensief gebruikt. In de referentieperiode van 50 dagen werd gedurende 11270 uur onderzoek gedaan via de website. Elke dag (zaterdag en zondag inbegrepen) is de website dus goed voor 225 uur onderzoek (of het equivalent van 28 full-time onderzoekers in een klassieke leeszaal die gedurende 8 uur per dag open is). Uit de analyse blijkt dat enerzijds de verwachtingen bij de genealogen zeer hoog gespannen zijn en anderzijds dat er een duidelijke relatie bestaat tussen de beschikbare projecten en de regio's waar de website vaak geraadpleegd wordt. Een groei van het informatieaanbod en een meer gediversifieerd aanbod, zal het aantal gebruikers ongetwijfeld verder laten toenemen en de stijgende trend in het aantal bezoeken en bezoekers verder laten doorzetten.
25