Discussie: De historische woordenboeken online Van acht (507) tot zwangerschap (1851): historische lexicografie van boek tot internet Marijke Mooijaart*
•
1 Historische woordenboeken van het Nederlands online Hoe oud is acht en hoe komen we aan zwangerschap? Het telwoord acht is al bekend uit de bron voor het alleroudste Nederlands, de Lex Salica (507-800) maar het komt eerder in de voor-Nederlandse fase voor. Zwangerschap verving midden negentiende eeuw het meer gebruikelijke zwangerheid; het basiswoord daarvan, zwanger, kwam pas na het Middelnederlands in gebruik na en naast woorden als drachtig, bevaan, bevest, gezegend, groot, vruchtbaar en zwarig. Simpele vragen als die hierboven en de verzameling woordenboeken die daarop het antwoord kunnen geven, vertegenwoordigen twee verschillende werelden. De eenentwintigste-eeuwse vragen staan tegenover producten van soms veel ouder wetenschappelijk werk en een kort verzoek tegenover een welhaast onafzienbare hoeveelheid wetenswaardigheden in heel gevarieerde stijlen van informatievoorziening.
*
[email protected]. De auteur was redacteur van het WNT en ONW en is nu voor de historische woordenschat verbonden aan de Taalbank Nederlands van het INL. Veel dank aan Katrien Depuydt voor enkele nuttige suggesties.
Nederlandse Taalkunde, jaargang 16, 2011-2
141
Marijke Mooijaart
De internetapplicatie van het Oudnederlands Woordenboek, Vroegmiddelnederlands Woordenboek, Middelnederlandsch Woordenboek en Woordenboek der Nederlandsche Taal (resp. ONW, VMNW, MNW en WNT), sinds 2009 compleet, doet alles om deze kloof te overbruggen en de vragenstellers naar een snel en bevredigend antwoord te leiden door inhoudelijke aanvullingen en praktische functionaliteiten.1 En werkt dit ook? De “gewone” gebruikers kunnen met hun commentaar en zoekproblemen terecht bij de helpknop en bij de servicedesk van de applicatie, en hun vragen geven een indicatie van de mogelijkheden en beperkingen van de online woordenboeken. Vakgenoten (taal- en letterkundigen) kregen in dit nummer van Nederlandse Taalkunde de gelegenheid om vanuit hun eigen specialisme hun bevindingen te melden met de woordenboeken in hun elektronische vorm. Onvermijdelijk kwam daarbij ook de inhoud van de woordenboeken ter sprake. Het commentaar in de negen bijdragen kan niet los gezien worden van de inhoud van de woordenboeken en de achtergronden van de digitalisering. Daarop gaan we eerst in; in de bijlagen kan men nog wat “feiten en cijfers” vinden.
•
2 De woordenboeken en hun inhoud: producten van hun tijd De periodes van vervaardiging van de woordenboeken geven al een aanwijzing voor de verschillen in methode en inhoud die men kan verwachten. Het WNT kan bogen op een geschiedenis van anderhalve eeuw aaneengesloten redactionele activiteit.2 Consistentie was er in elk geval in de spelling: tot en met 2001 was dat die van De Vries & Te Winkel. Daarentegen veroorzaakte de opeenvolging van redacties (de traditie spreekt van vijf generaties redacteuren) onvermijdelijke verschillen in aanpak. Een andere oorzaak van de ongelijkheid van de verschillende delen was de voortdurende toevoeging van bronnen, waardoor de oudste artikelen op veel minder materiaal berusten dan de jongste. Bij de start had het woordenboek ongeveer 1000 werken ter beschikking. De nadruk lag op zeventiende- en negentiende-eeuws literair materiaal. Dat de eerste redacteuren niet genoeg hadden aan het aanwezige citatenmateriaal kan blijken uit het ruime gebruik van zgn. “poëmen”, zelfbedachte voorbeeldzinnen. Vooral allerlei, ook spreektalige, verbindingen vonden zo een plek in het woordenboek. Men bleef daarnaast nieuwe bronnen toevoegen op allerlei gebied en gaf daarvan rekenschap in bronnenlijsten.3 Uitbreiding was nodig door een verruiming van de doelstellingen van het woordenboek, waardoor bijvoorbeeld meer zestiende-eeuwse werken werden beschreven en er een beter even-
1 Woordenboeken met inleiding en andere informatie staan op http://gtb.inl.nl. 2 Hoewel er veel over het WNT is gepubliceerd, is er nog geen allesomvattende studie van de geschiedenis en inhoud van dit woordenboek. Een schetsmatig portret is Van Sterkenburg (1992); zie verder ook Van Sterkenburg (2011). De inhoud wordt uitvoerig beschreven in de Handleiding van Moerdijk (1994); detailstudies over diverse aspecten vindt men in de ‘voltooiingsbundel’, Heyvaert e.a. (1998). Over de grondleggers schrijven Van Driel & Noordegraaf (1998). Een bibliografisch overzicht (veelomvattend maar niet per se volledig) en andere documentatie is te vinden op www.inl.nl. Voor een beknopt overzicht van de WNT-chronologie, zie de bijlage. 3 Zie over de bronnenlijsten en de verdeling van de bronnen over de diverse domeinen Moerdijk (1994: 274289); zie over lacunes in de bronnen ook Mooijaart (2004).
142
Van acht (507) tot zwangerschap (1851): historische lexicografie van boek tot internet
wicht tussen literair en niet-literair materiaal werd nagestreefd. Ook dienden zich hele categorieën nieuwe uitgaven aan, zoals dialectwoordenboeken (zie de bijdrage hierachter van Van Keymeulen & Devos). Wat de toegevoegde bronnen opleverden is prachtig te zien als men een “oud” A-artikel vergelijkt met een herziene of aanvullende versie van datzelfde artikel in het supplement, in de applicatie onder één trefwoord weergegeven. Zo zien we het artikel assignatie (1894), omvang halve kolom, met de aanvulling uit het Supplement (1954), bijna vier kolommen groot, inclusief de als opnoemers opgenomen samenstellingen briefassignatie, assignatiebank, assignatiebrief en assignatiestelsel.4 Daarnaast zijn er de nieuwe artikelen assignement en assigneeren, samen twee en een halve kolom. Van Leuvensteijn, die in zijn hierna volgende bijdrage een revisie van oude WNT-delen bepleit in de trant van het Supplement rekent ons dan ook voor dat dat tot een gigantische omvangsvergroting van het woordenboek zou leiden. De gebruiker die deze bronnentoename in zijn achterhoofd heeft bij het raadplegen van het woordenboek moet bedenken dat die toename niet precies het alfabet volgt. Men heeft niet bewerkt van A, B naar C en zo verder, maar vanaf A, G en O naar B en H, en vervolgens met nog enkele andere sprongen heen en terug door het alfabet naar de Z, waardoor B, G en O als eerst bewerkte letters tot de meest gebrekkige delen behoren, zoals ook Van Leuvensteijn terecht opmerkt. Zie ook bijlage 2. Ook het feit dat de eindgrens van de beschreven periode eerst steeds opschoof van 1864-1976, dus steeds bij het moment van bewerking lag, en in 1976 teruggezet werd naar 1921, zorgt voor verschil in bronmateriaal. Recente werken konden na 1976 niet meer verwerkt worden in de woordenboekartikelen.5 Ook in de redactionele terminologie is de lange bewerkingsduur voelbaar. De opeenvolgende redacties bedienden zich van het taalkundige jargon van hun tijd. Zo worden voor het begrippenpaar transitief en intransitief in het WNT de termen bedrijvend en onzijdig gebruikt en komt men in de oudste delen termen als gehemelteletter (1877) en ruischmedeklinker (1872) tegen. Gaandeweg werden er afspraken over gemaakt, maar er bleef variatie. Het MNW van Verwijs & Verdam (1851-1929) heeft een minder lange bewerkingsduur gehad en is voor het grootste deel door één redacteur, Jacob Verdam, samengesteld. Hierdoor en doordat het een al afgesloten periode beschrijft, is te verklaren dat de delen onderling minder verschillen.6 Toch kleven ook aan dit woordenboek nadelen: het is om te beginnen verre van volledig. Van de 11.000 bronnen (hoofd- en subtitels) die in de Bouwstoffen zijn opgesomd, blijken er maar 4100 geciteerd te zijn. Een deel van de Middelnederlandse woordenschat mist men in het MNW; daarin is overigens enigszins voorzien 4 5
6
Een opnoemer of sublemma is een samengesteld woord, dat als beknopt lemma behandeld wordt aan het eind van het artikel van het basiswoord. De publicatiedatum wordt in de internetapplicatie steeds onderaan elk artikel vermeld en geeft de gebruiker indirect informatie over wat men verwachten kan. De datering van het artikel betreft steeds het “hoofdwerk”; toevoegingen uit Supplement (1942-1956) en/of Aanvullingen (2001) krijgen geen eigen jaartal (een verbeterpunt). Ook over het MNW is geen monografie beschikbaar. Behalve in Van Sterkenburg (te verschijnen) geeft de Inleiding op het Supplement bij het Middelnederlandsch Handwoordenboek (1983) van Van der Voort van der Kleij nuttige feiten.
143
Marijke Mooijaart
door toevoegingen in het Middelnederlandsch Handwoordenboek en door het Supplement daarop (Van der Voort van der Kleij 1983). Verder is de kwaliteit van de gebruikte edities, zeker gemeten naar moderne maatstaven, soms onder de maat; van de talrijke nieuwe tekstuitgaven heeft men geen gebruik kunnen maken. Desondanks is het nog steeds het beste hulpmiddel bij het lezen van Middelnederlandse teksten; menige teksteditie getuigt daarvan. De woordenboeken die de oudste taalfasen beschrijven, zijn de jongste lexicografische producten; VMNW (1998) en ONW (2008) zijn beide dan ook als digitaal woordenboek vervaardigd. Dit is al met het blote oog zichtbaar door de systematische indeling van de kopjes (de secties aan het hoofd van de artikelen, met niet-semantische informatie): bij elk artikel worden de verschillende informatiecategorieën een voor een afgewerkt. Deze bevatten, anders dan in WNT en MNW, tamelijk volledige informatie op het vlak van spelling en morfologie; daarbij worden veelal kwantitatieve gegevens verstrekt. Vormkenmerken spelen immers in onderzoek naar de oudste taalfasen een grote rol. Beide woordenboeken hebben ook gemeen dat er geografische informatie toegevoegd is aan het citatenmateriaal; een logische keuze daar het om een taalfase gaat waarin nog niet van een eenheidstaal sprake was. Beide jonge woordenboeken wijken ook af van de oudere doordat ze een gesloten corpus als basis hebben. Voor het VMNW is dat het Corpus-Gysseling, de verzameling van alle Nederlandstalige handschriften uit de 13de eeuw die zijn overgeleverd. Het oudste literaire en ambtelijke Middelnederlands is daardoor zo volledig als bij de toch beperkte overlevering mogelijk is, beschreven en degelijk gedocumenteerd.7 Het ONW berust op een zeer kleine en diverse materiaalverzameling. Er zijn maar enkele doorlopende teksten en tekstfragmenten; de losse woorden zijn glossen in Latijnse teksten, elementen van toponiemen en gereconstrueerde woorden uit Oudfranse teksten en uit de Lex Salica.8 Veel minder dan in het VMNW konden de betekenissen van royaal citatenmateriaal voorzien worden. Bijzonder is dat er in het ONW en VMNW veel naamkundig materiaal is verwerkt: plaatsnamen en persoonsnamen. Schwager merkt in zijn bijdrage hierachter terecht op dat voornamen, verwerkt in het VMNW, ook in het ONW op hun plaats zouden zijn. De vier woordenboeken worden waarschijnlijk het meest geraadpleegd voor de woordbetekenis. In de behandeling daarvan staat het WNT tegenover de andere drie. Het bezigt in principe analytische definities (de klassieke definitievorm waarbij een woord beschreven wordt door de overkoepelende categorie en de differentiërende kenmerken te noemen), vaak gevolgd door synoniemen. De andere woordenboeken benaderen de oudere taalfase die ze beschrijven als vreemde taal en kunnen dus met een eenwoordsvertaling in het moderne Nederlands volstaan. Uitgebreidere beschrijvingen komen echter ook voor, vooral als er cultuur-historische achtergrondinformatie is. De woordenboeken gaan dikwijls ver in het onderscheiden van verschillende betekenisnuances, wat voor de gebruiker niet altijd navolgbaar is. Alleen het ONW blijft soms op de vlakte: er is nogal eens te weinig materiaal en te weinig context om de betekenis preciezer af te bakenen. Bij de betekenisstructurering is er geen afstemming tussen de 7 8
144
Zie de inleiding op het VMNW (ook online) met de literatuurverwijzingen aldaar en Pijnenburg & Schoonheim (1996). Zie de inleiding op het ONW met de literatuurverwijzingen aldaar, Pijnenburg (2003) en Schoonheim (2008).
Van acht (507) tot zwangerschap (1851): historische lexicografie van boek tot internet
woordenboeken geweest, wat het samenstellen van een chronologisch overzicht van betekenissen van een woord niet altijd makkelijk maakt. Vaste verbindingen ten slotte, idiomatische en niet-idiomatische, nemen in alle woordenboeken een belangrijke plaats in. In de boeken zijn ze herkenbaar met een voorafgaand liggend streepje of een label. Voor de internetapplicatie bleek het een uitdaging om ze tevoorschijn te halen.
•
3 De internetapplicatie Sinds het Leidse Instituut voor Nederlandse Lexicologie in 1967 werd opgericht, was het verantwoordelijk voor de wetenschappelijke woordenboeken van het Nederlands.9 Het aanleggen van een elektronische databank van het Nederlands als basis hiervoor en voor andere toepassingen was een tweede doelstelling. Voor de materiaalverzameling van het WNT kwam de digitale revolutie te laat: dit woordenboek is tot en met de Aanvullingen op basis van papieren fiches gemaakt. Toen besloten werd het woordenboek als cd-rom uit te geven (1995-2000-2003), moest de gedrukte tekst grotendeels handmatig ingevoerd worden; hetzelfde gold enkele jaren later, in 1998, voor het MNW. Er zijn maar beperkt tekstfouten bij de digitalisering ontstaan (Gärtner verwijst er in zijn bijdrage naar); ze zijn storend maar relatief makkelijk te verhelpen. Het realiseren van een digitale artikelstructuur, met eenduidig gekenmerkte informatiecategorieën, was moeilijker en tijdrovender, omdat men maar voor een deel van typografische kenmerken uit kon gaan. Hoofdtrefwoorden bijvoorbeeld, die in het WNT kapitaal en vet zijn, konden automatisch herkend worden; voor citaten en bronaanduidingen was dat veel lastiger. Er is een enorme inspanning verricht om de belangrijkste informatiecategorieën in de MNW- en WNT-artikelen herkenbaar en dus opvraagbaar te maken (zie Depuydt & De Does 2008 en Geirnaert 2009 voor meer technische details). In het VMNW en ONW, die immers als elektronische woordenboeken waren gemaakt, waren de informatietypen al gescheiden. Dit maakte de weg naar de internetapplicatie veel eenvoudiger. Uiteindelijk gingen in 2007 het WNT en VMNW, en in 2009 het MNW en ONW online. Inmiddels zijn ook al enkele releases met correcties en aanvullingen uitgevoerd. De belangrijkste artikelelementen en zoekfuncties, in elk geval die punten die in de volgende bijdragen besproken worden, laten we hieronder de revue passeren. Het eerste element waarop men meestal zoekt, het trefwoord, heeft een overkoepelende standaardvorm gekregen. Dit betekent dat aan alle artikelen, naast het gestandaardiseerde Oudnederlandse, Middelnederlandse en Nieuwnederlandse lemma (de laatste volgens de spelling De Vries & Te Winkel) in respectievelijk ONW, VMNW, MNW en WNT, een modern trefwoord is toegekend. Dit volgt in principe de spellingregels van 2005. Wie het woord mens in “Mod. Ned. trefwoord” invoert, krijgt de ingangen ONW mennisko, VMNW mensche, MNW mensce en WNT mensch als “origineel trefwoord” gepresenteerd en kan ver9 Op het INL wordt nu gewerkt aan het woordenboek van het moderne Nederlands (Algemeen Nederlands Woordenboek, ANW); een ander project was het Etymologisch Woordenboek van het Nederlands (EWN). Woordonderzoek wordt ook in het kader van andere dan woordenboekprojecten verricht.
145
Marijke Mooijaart
volgens naar de gewenste artikelen. Deze originele trefwoorden zijn ook rechtstreeks op te vragen, zinvol niet alleen in verband met referenties in bestaande literatuur, maar ook omdat die vormen dichter bij daadwerkelijk in teksten aangetroffen woordvormen liggen. Het helpt de gebruiker verder dat zowel de bijvormen van de trefwoorden als de subtrefwoorden (“opnoemers”) ook trefwoordstatus hebben en opzoekbaar zijn. Schwager merkt op dat de moderne trefwoorden niet altijd etymologisch verantwoord zijn; het praktische doel heeft dan geprevaleerd. Overigens is de trefwoordtoekenning nog niet afgerond. De woordsoortaanduiding die onmiddellijk aan het trefwoord is gekoppeld, is in de applicatie qua vorm genormaliseerd; er wordt bijvoorbeeld voor het zelfstandig naamwoord nog maar één afkorting gebruikt (znw.). Maar zoals eerder gezegd, is voor het overige de terminologie gevarieerd. Afgekorte termen kan men in een afkortingenlijst vinden, maar geen uitputtende lijst taalkundige termen. De bestanddelen van de gelede woorden zijn in de jonge woordenboeken systematisch beschreven en ook opvraagbaar. Voor het WNT en MNW wordt deze functie node gemist, blijkt ook uit de bijdrage van Van Santen. Er wordt gewerkt aan uitbreiding (in een andere informatiestructuur). Zoeken van de betekenis van een gegeven woord is bekend. Een voordeel van de applicatie is dat complexe WNT-artikelen in verkorte vorm gepresenteerd kunnen worden: met of zonder subbetekenissen en citaten. Zoeken vanuit begrip naar woorden is een optie die vereist dat de betekenisomschrijvingen aan strikte eisen van systematiek voldoen. Het ANW, het moderne woordenboek van het INL, is zo ingericht dat zo’n onomasiologische benadering mogelijk is (Moerdijk 2008). Bij de historische woordenboeken is dat niet per se het geval; wel kan men een heel eind komen bij bepaalde woorden, bijvoorbeeld als ze gedefinieerd zijn met steeds eenzelfde, algemene term. Het is bijvoorbeeld mogelijk tientallen woorden en uitdrukkingen voor ‘zwanger (zijn)’ te vinden van het Oudnederlands tot eind twintigste eeuw, doordat alle redacties in dat geval het woord zwanger in de definities hebben gebruikt (“Uitgebreid zoeken – Betekenis – Woord in betekenis”). Niet alleen voor diachrone variatie maar ook voor dialectvariatie kan deze optie nuttig zijn: Van Keymeulen & Devos gaan zo na welke Zuidnederlandse benamingen van de vlinder in de woordenboeken te vinden zijn. Een groot goed is de mogelijkheid het volledige citatenmateriaal te doorzoeken: woorden komen immers ook in citaten voor bij andere trefwoorden. Het aantal gedateerde en gelokaliseerde vindplaatsen kan op die manier behoorlijk worden vermeerderd en het “WNT-corpus” kan zo als basis dienen voor onderzoek naar verschillende typen talige ontwikkelingen (Mooijaart 2004). De bijdragen van Hoeksema, Verkuyl en Van der Wouden laten daar interessante resultaten van zien. Er zijn rond de citaten ook meer specifieke vragen mogelijk: het zoeken van citaten binnen bepaalde tijdsgrenzen, en citaten naar de titel of auteur (in “Uitgebreid zoeken – Citaten – Brongegevens”). We kunnen dan constateren dat Wolkers in 54 aanhalingen een prettig tegenwicht van de Vriesiaanse woordenschat biedt, in trefwoorden als frites, gozer en seks / sex; het laatste in een vroeg voorbeeld van de uitdrukking sex hebben (1963). Het hele tijdvak 1960-1969 bevat 12.585 citaten. Het WNT is maar beperkt in de beschreven dialectwoordenschat zoals ook Van Keymeulen & Devos laten zien. Taalgeografisch onderzoek voor de oudste taalfasen (tot en met het Middelnederlands) is daartegenover een mogelijkheid die de internetapplicatie toevoegt aan ONW, VMNW en MNW, doordat de citaten daarin van een min of meer glo146
Van acht (507) tot zwangerschap (1851): historische lexicografie van boek tot internet
bale plaats- en/of regioaanduiding zijn voorzien. De zoekterm Gent levert dan 316 citaten in het ONW en 11.719 in het VMNW, het MNW is alleen globaal opvraagbaar op regio’s. Dit woordenboek bevat 81.509 citaten uit Vlaanderen. Alle mogelijke meerwoordcombinaties kunnen in Basiszoeken gezocht worden door ze in te voeren tussen aanhalingstekens. De zoekterm blauw als levert dan onder meer vergelijkingen op met azuur, lei, lood, de hemel en een schalie. Collocaties zijn daarnaast een afzonderlijke informatiecategorie in de applicatie en opvraagbaar binnen “Uitgebreid zoeken” door een woord erin op te vragen. Erg eenvoudig is deze optie niet; de standaardvorm in het desbetreffende woordenboek én de flexievorm binnen de collocatie moeten bekend zijn. Voor het WNT is deze functionaliteit nog in voorbereiding. Bij de zoekacties kan men de resultaten in verschillende vormen op het scherm krijgen: als lijst artikelen, maar ook lijst definities of als verzameling citaten. De resultaten kunnen bovendien geëxporteerd worden. De woordenboeken zijn aan elkaar verbonden door de gemeenschappelijke trefwoorden; ze zijn ook in beperkte mate onderling gelinkt. Verder zijn er bij het WNT links naar andere naslagwerken: o.a. de kaarten van de Taalatlas van Noord en Zuid, het EWN en het EWA (Etimologiewoordeboek van Afrikaans). Ook op dit punt wordt aan uitbreiding gewerkt.
•
4 Gebruikerservaringen De auteurs van de negen bijdragen die hierna volgen, hebben elk een of meer woordenboeken van de INL-applicatie bekeken vanuit hun specialisme: diachrone semantiek (Hoeksema, Verkuyl), dialect (Van Keymeulen & Devos), collocaties (Van der Wouden), morfologie (Van Santen), Oudnederlands (Schwager), Middelnederlands (Van Driel), Vroegnieuwnederlands (Van Leuvensteijn) en de relatie Duits-Nederlands (Gärtner). Het resulteerde in een verslag van gebruikservaringen waarbij zij ook verbeterpunten zowel op inhoudelijk vlak als op het terrein van de internetfunctionaliteiten aan hebben gewezen. Hierboven is hiervan al een en ander aangestipt. Enkele opvallende punten wat de inhoud betreft: nog steeds vervullen de woordenboeken een belangrijke functie bij het interpreteren van teksten, zoals Van Driel, Van Leuvensteijn en Gärtner laten zien. Het is niet moeilijk dan leemten aan te wijzen in MNW en WNT. Daartegenover staat dat de nieuwe benaderingen zoals zoeken in de volledige woordenboektekst informatie oplevert die in de gedrukte boeken nauwelijks vindbaar is. Zo kunnen dialectwoorden voor een bepaald begrip, net als andere varianten, opgespoord worden door in de betekenissen te zoeken (Van Keymeulen & Devos). Onderzoek in het citatenmateriaal als corpus is een populaire gebruiksvorm aan het worden, die hier is toegepast door Hoeksema, Verkuyl en Van der Wouden. Daarbij helpen de toegevoegde dateringen, geüniformeerde bronaanduidingen en een aantal tools. De laatste zijn wel voor uitbreiding en verbetering vatbaar. Van der Wouden merkt op dat het taalmateriaal wel aanwezig is, maar dat collocatie-software de toegang zou kunnen vergemakkelijken. Ook uitbreiding van de morfologische zoekmogelijkheden zou wenselijk zijn. Van Santen zou ook op affixen in het Nieuwnederlands willen zoeken; nu is dat nog niet mogelijk omdat ze in WNT (en MNW) niet systematisch gemarkeerd zijn, evenmin als de basiswoorden van samenstellingen. Zoeken van strings als *lijk en ont* kan wel 147
Marijke Mooijaart
bevredigende resultaten geven als men deze affixen zoekt, maar bij *aard en be* wordt dat al problematisch. Bij alle wijzigingen in de woordenboekeninhoud ter wille van uniformiteit en volledigheid kan men zich afvragen hoe nodig en nuttig het is om de vorm van het oorspronkelijke woordenboek in de applicatie te handhaven. Waar de een prijs stelt op herkenbaarheid daarvan en bijvoorbeeld graag de volledige nomenclatuurlijst gepresenteerd wil zien (Gärtner), vindt de ander dat hinderlijke ballast (Verkuyl). Een digitaal werk nodigt uit om verbindingen aan te leggen met andere naslagwerken. Eerder waren het volledige Corpus-Gysseling en nog 290 andere Middelnederlandse teksten beschikbaar op de cd-rom Middelnederlands. Zoals o.m. uit de bijdrage van Van Driel blijkt, hebben mediëvisten aan die eerste digitale verzameling Middelnederlands veel plezier beleefd; nu kan men daarvoor bij de dbnl en de TST-centrale (INL) terecht (zie voor cd-rom en internetapplicatie van het MNW Geirnaert 2009). Verbindingen op grotere schaal stelt Gärtner voor: het zou nu mogelijk en wenselijk zijn om de woordenboeken van de Oudgermaanse talen te koppelen, en ook een verbinding van de Middeleeuwse taalfasen van Duits en Nederlands hoort tot de mogelijkheden. Een laatste, praktische en belangrijke voorziening die o.a. door Schwager en Gärtner wordt gemist, is een gebruikersinstructie in het Engels en Duits. Alle gebruikers zouden gebaat zijn bij registers van taalkundige termen en afkortingen met moderne Nederlandse, Duitse en Engelse equivalenten. Zo’n termenlijst had ook Hoeksema kunnen vertellen dat hij de “middle-constructie” onder de term subjectverwisseling had kunnen zoeken.
•
5 Slot: de toekomst Krijgen we (nog) betere woordenboeken? Jazeker, maar niet meer op de traditionele manier. Het INL gaat alle lexicale data verder integreren in de Taalbank Nederlands en op diverse manieren toegankelijk maken. Er zal gekeken worden naar nieuwe manieren om lacunes in de beschrijving van de woordenschat van het Nederlands op te vullen. Een belangrijk voordeel daarvan zal zijn dat de beperkingen van een individueel woordenboek niet meer zullen bestaan, waardoor veel meer woorden een beschrijving zullen krijgen, ook woorden die slechts tijdelijk heel frequent gebruikt zijn. Op kortere termijn zal de bestaande applicatie worden verbeterd, waardoor gesignaleerde onvolkomenheden worden rechtgezet en meer gebruiksgemak wordt geleverd. En, wat minstens zo belangrijk is, de woordenschat uit de vier internetwoordenboeken dient als basis voor nieuwe projecten die ruimere toepassingsmogelijkheden hebben. Men inventariseert bijvoorbeeld alle spelling- en vormvarianten van een bepaald trefwoord in de historische woordenboeken (zoals de varianten houuot, hoyued en hoiuet, houet, hovet, hovede enz., om met behulp daarvan OCR-technieken van oude teksten te verbeteren.10 In het ONW is al te zien dat deze vormvarianten gehighlight (hieronder: vetgedrukt) zijn; ze zijn dus te isoleren van de context en in een lexicon te koppelen aan de lemmavorm. Ook voor de andere woordenboeken wordt deze bewerking voorbereid. Zo ontstaan bij elk lemma reeksen historische vormvarianten. 10 Dit gebeurt in het Europese project IMPACT; zie www.impact-project.eu.
148
Van acht (507) tot zwangerschap (1851): historische lexicografie van boek tot internet
1.1. Hoofd. Genoemd in verband met de geestelijke vermogens. Thu geunisso (l. geuuisso) druftin infangere min bistu, guolike min in ubhenoude (l. ubheuonde) houuot min. Jij evenwel, Heer, jij bent mijn beschermer, mijn glorie en degene die mijn hoofd opheft. WPs (hs. FA) 003,03 Zuid-Nederrijn, Nederrijn, 901-1000 (kopie 1591-1610). Vulgaat: Tu autem, domine, susceptor meus es, gloria mea, et exaltans caput meum. (...) dona, (...) mid then ich rationem mentis mee˛ kunne gerichtan ad suspiranda ˛terna, e also thaz hoyued richtet ce˛etera membra, (...) Geschenken (...), waarmee ik het verstand van mijn geest kan sturen om de eeuwigheid te begeren, zoals het hoofd de overige ledematen richt. LW 032,10 Egmond, Holland, ca. 1100. (...) also thaz hoiuet rihtet ce˛tera membra, Zoals het hoofd de overige ledematen richt. LW 133,09 Egmond, Holland, ca. 1100. ONW, citaten uit artikel hoofd
- ho¯vit
Een dergelijk lexicon, dat alle Nederlandse woorden en woorddelen bevat met basale informatie zoals woordsoort en spelling, is al in ontwikkeling voor de Taalbank Nederlands onder de naam GiGaNT (Depuydt 2010). Hierbij worden alle woorden (lemma’s) gekoppeld aan geattesteerde woordvormen, en deze weer aan de tekst waarin zijn voorkomen – teksten die het nieuwe diachrone onderzoekscorpus vormen. Raadpleging van de bestaande woordenboekinformatie blijft daarbij mogelijk. Een van de uitdagingen zal zijn om ook de betekenisinformatie zoals die nu bij de lemma’s in de woordenboeken binnen de internetapplicatie te vinden is, in het lexicon toegankelijk te maken.
•
Bibliografie Woordenboeken Mnl. Hwdb.: Middelnederlandsch Handwoordenboek. Bewerkt door J. Verdam. ’s-Gravenhage: Martinus Nijhoff, z.j. [1932]. Voort van der Kleij, J.J. van der (1983). Verdam Middelnederlandsch Handwoordenboek, Supplement. Leiden/Antwerpen, Martinus Nijhoff. MNW: Middelnederlandsch Woordenboek. Red. E. Verwijs en J.Verdam. ’s-Gravenhage: Martinus Nijhoff, 1885-1952. Ook in: http://gtb.inl.nl, 2009. ONW: Oudnederlands Woordenboek. Red. T.H. Schoonheim, K. Louwen, M.A. Mooijaart, W.J.J. Pijnenburg en A. Quak. Leiden: Instituut voor Nederlandse Lexicologie. In: http://gtb.inl.nl, 2009. VMNW: Vroegmiddelnederlands Woordenboek. Red. W.J.J. Pijnenburg, K.H. van DalenOskam, K.A.C. Depuydt, T.H. Schoonheim. Leiden: Instituut voor Nederlandse Lexicologie, 2001. Ook in: http://gtb.inl.nl, 2007. WNT: Woordenboek der Nederlandsche Taal. Red. M. de Vries, L.A. te Winkel e.a. ’s-Gravenhage / Leiden: Martinus Nijhoff / Brill, 1882-1998. Supplement A, 1956. Aanvullingen, 2001. Ook in: http://gtb.inl.nl, 2007. Corpus Gysseling: Gysseling, Maurits (1977-1987). Corpus van Middelnederlandse teksten (tot en met het jaar 1300). Bouwstoffen voor een woordarchief van de Nederlandse taal. M.m.v. Willy Pijnenburg. ’s-Gravenhage: Martinus Nijhoff. 149
Marijke Mooijaart
EWN: Etymologisch Woordenboek van het Nederlands. M. Philippa, F. Debrabandere, A. Quak, T. Schoonheim en N. van der Sijs. Amsterdam: Amsterdam University Press, 2004-2009. Ook in: http://www.etymologie.nl; www.etymologiebank.nl. Overige literatuur Depuydt, Katrien (2010). Developing GiGaNT, a Lexical Infrastructure covering 16 centuries. In: Anne Dykstra & Tanneke Schoonheim (red.), Proceedings of the XIV Euralex International Congress. Leeuwarden: Fryske Akademy (cd-rom); http://www. euralex.org. Depuydt, Katrien & Jesse de Does (2008). United in Diversity. Dutch Historical Dictionaries Online. In: Elisenda Berndal & Janet De Cesaris (red.), Proceedings of the XIII EURALEX International Congress (Barcelona, 15-19 July 2008), 1237-1241. Driel, L. van & J. Noordegraaf (1998). De Vries en Te Winkel. Een duografie. Den Haag/ Antwerpen: Sdu Uitgevers/Standaard Uitgeverij. Geirnaert, Dirk (2009). Werken aan de toekomst van het verleden.Van MNW naar MNW_online. In: Egbert Beijk et al. (red.), Fons Verborum. Feestbundel voor prof. dr. A.F.M.J. (Fons) Moerdijk, aangeboden door vrienden en collega’s bij zijn afscheid van het Instituut voor Nederlandse Lexicologie. Leiden/Amsterdam: Instituut voor Nederlandse Lexicologie/Gopher, 201-214. Heyvaert, Frans e.a. (red.) (1998). Het grootste woordenboek ter wereld. Een kijkje achter de kolommen van het Woordenboek der Nederlandse Taal (WNT). Den Haag/Antwerpen: Sdu Uitgevers/Standaard uitgeverij. Moerdijk, A. (1994). Handleiding bij het Woordenboek der Nederlandsche Taal. ’s-Gravenhage: SDU Uitgeverij Koninginnegracht. Moerdijk, F. (2008). Frames and semagrams; meaning description in the General Dutch Dictionary. In: Elisenda Berndal & Janet De Cesaris (red.), Proceedings of the XIII EURALEX International Congress (Barcelona, 15-19 July 2008), 561-569. Mooijaart, M. (2004). Citations in the Woordenboek der Nederlandsche Taal. In: Julie Coleman and Anne McDermott (red.), Historical Dictionaries and Historical Dictionary Research. Tübingen: Max Niemeyer Verlag. 201-211. Pijnenburg, W. (2003). Das altniederländische Wörterbuch. In: Willy Pijnenburg e.a. (red.), Quod Vulgo Dicitur. Studien zum Altniederländischen. Amsterdamer Beiträge zur älteren Germanistik 57, 5-18. Pijnenburg, Willy & Tanneke Schoonheim (1996). Het Vroegmiddelnederlands Woordenboek (1200-1300), De geschiedenis van een project. Tijdschrift voor Nederlandsche Taal- en Letterkunde 112, 152-164. Schoonheim, Tanneke (2008). The sources of the Old Dutch Dictionary. In: Marijke Mooijaart & Marijke van der Wal (red.), Yesterday’s Words. Contemporary, Current and Future Lexicography. Cambridge: Cambridge Scholars Publishing, 266-275. Sterkenburg, Piet van (1992). Het Woordenboek der Nederlandsche Taal. Portret van een Taalmonument. ’s-Gravenhage: Sdu Uitgeverij. Sterkenburg, Piet van (2011). Van woordenlijst tot woordenboek. 2de, herziene druk. Schiedam: Scriptum.
150
Van acht (507) tot zwangerschap (1851): historische lexicografie van boek tot internet
•
Bijlage 1 Gegevens woordenboeken
•
woordenboek
beschreven periode
periode van bewerking
omvang
trefwoorden
ONW
500-1200
1999-2008
-
4.500
VMNW
1200-1300
1989-1998
4 banden
25.000
MNW
1250-1550
1850?-1929
9 banden +2
75.000
WNT
1500-1921/1976
1851-1998
29 delen = 40 banden+3
400.000
Bijlage 2 Periodisering WNT 1851 presentatie Ontwerp van een Nederlandsch Woordenboek 1864 eerste aflevering (A-Aanhaling) 1882 eerste deel (A-AJUIN) met Inleiding van M. de Vries 1956 Supplement op A (vervaardigd 1942-1956) 1976 besluiten t.b.v. versnelde voltooiing: er worden geen bewijsplaatsen van na 1921 meer opgenomen er worden geen nieuwe bronnen meer verwerkt 1995 cd-rom (t/m deel 26); 2000 (t/m dl. 29); 2003 (t/m Aanvullingen) 1998 voltooiing, laatste (29ste) deel (ZUID-ZYTHUM) 2001 Aanvullingen op A-Z (drie delen) Volgorde bewerking WNT-artikelen:
R 1914-1924 riant-ruzing A 1864-1894 K 1915-1941 k-kozijn (III) O 1869-1876 o-onderrichten S 1920-1941 G 1872-1896 T 1928-1979 O 1890-1910 onderrichter-ozon B 1895-1903 A Sup 1942-1956 H-I-J 1896-1915 R 1947-1981 r-rhythmus M-N 1904-1913 V 1947-1987 K 1906-1911 kr-kwitantie U 1975-1984 C-D-E-F 1908-1920 W 1988-1993 L 1911-1924 X-Y-Z 1993-1998 P-Q 1912-1949 A-Z Aanv. 2001
151