Informatie over de presentaties en de sprekers 10.45 ‐ 12.15 : BLOK 1: TERMINOLOGIE EN AUTOMATISCHE TAALTOEPASSINGEN 10.45 – 11.05: plenaire presentatie
Mart Trautwein, GridLine Automatische trefwoordtoekenning aan Tweede Kamer‐stukken m.b.v. de Parlementsthesaurus Voor de Tweede Kamer is het van groot belang om snel over alle stukken te beschikken die betrekking hebben op een actueel dossier, inclusief de meest recente artikelen in de media. De informatiedienst van de Tweede Kamer ondersteunt dit door handmatig tienduizenden documenten per jaar van trefwoorden uit de Parlementsthesaurus te voorzien. Tweede Kamerleden kunnen deze documenten vervolgens opsporen door gebruik te maken van een zoekmachine. Hoewel dit goede resultaten oplevert, is het een relatief traag proces, waardoor er makkelijk enkele weken overheen kunnen gaan voordat een nieuw artikel beschikbaar is via het archief van de Tweede Kamer. Om dit te ondervangen, laat de informatiedienst momenteel een systeem ontwikkelen waarmee documenten automatisch van trefwoorden kunnen worden voorzien. Vooruitlopend op redactionele controle kunnen deze stukken alvast beschikbaar komen in de zoekmachine. Ook de redactie is ermee geholpen, want zij hoeft alleen maar te controleren of de toegekende trefwoorden juist zijn. Trautwein promoveerde in de informatica en taaltechnologie aan de Universiteit van Amsterdam. Vervolgens werkte hij 15 jaar in het bedrijfsleven als ontwikkelaar en analist op het gebied van Information Retrieval en Text Mining, bij onder meer Perot Systems, KPN, Contrado en ATOS Origin. Bij GridLine is Trautwein werkzaam als senior architect en projectmanager.
11.15 ‐ 12.15 : INTERACTIEVE SESSIE (PARALLELLE INLOOPPRESENTATIES)
Christophe Deloo, TU Delft Workbench voor terminologische classificatiesystemen Informatiediensten gebruiken vaak geavanceerde trefwoordsystemen voor de ontsluiting van hun boeken en documenten. Het toekennen van de trefwoorden was lange tijd handwerk, maar tegenwoordig kan dit ook automatisch. Om na te gaan in hoeverre een classificatiesysteem de juiste termen toekent aan de tekstdocumenten is het van belang om de classificaties te evalueren. Omdat handmatige evaluatie tijdrovend is, heeft GridLine geïnvesteerd in de ontwikkeling van een workbench voor het evalueren van classificatiesystemen. De workbench omvat zowel traditionele binaire evaluatietechnieken als een techniek die classificaties beoordeelt aan de hand van conceptafstanden gedefinieerd door een thesaurus. Stel dat het classificatiesysteem de term "energiebron" toegekend heeft in plaats van de term "windenergie". Traditionele technieken zouden deze toekenning simpelweg beoordelen als fout. De techniek gebaseerd op conceptafstanden zal de toekenning juist als vrij goed beoordelen gezien de grote mate van gerelateerdheid tussen de termen. De workbench zal worden gedemonstreerd aan de hand van het classificatieprobleem van de Tweede Kamer. Deloo is student aan de Technische Universiteit van Delft. Voor zijn masterscriptie heeft hij als stagiair bij GridLine een workbench ontwikkeld heeft voor het evalueren van classificatiesystemen. Vervolgens schreef hij een afstudeerscriptie over dit project. ___________________________________________________________________________________
Dennis de Vries, GridLine Vaktermen verzamelen met de NTU‐Termtreffer GridLine is de grootste aanbieder van Nederlandstalige taaltoepassingen rond terminologie. Denk bijvoorbeeld aan documentclassificatie door automatische toekenning van trefwoorden, verrijking van zoekopdrachten m.b.v. synoniemen uit een thesaurus (eventueel meertalig) en de ondersteuning van tekstschrijvers bij correct en duidelijk gebruik van vaktermen en organisatienamen. Het probleem waar veel organisaties tegenaan lopen is dat ze geen lijst hebben van hun eigen vaktermen. Het handmatig aanmaken van zo’n lijst door analyse van bedrijfsdocumenten of expert‐ interviews is erg duur en tijdrovend. Dit gaat veel efficiënter met ons product GridWalker X voor het
automatisch verzamelen van organisatiespecifieke termen vanuit documentcollecties. Ook de uitbouw tot een thesaurus behoort tot de mogelijkheden. In deze presentatie kunt u zien hoe wij termenlijsten aanmaken en wat het oplevert. Dit wordt gedemonstreerd met behulp van de Termtreffer, een eindgebruikerstool voor termextractie die GridLine voor de Nederlandse Taalunie (NTU) heeft ontwikkeld. De presentatie richt zich specifiek op de datasets die ten grondslag liggen aan de Klinkende Taal standaardlijsten voor overheidsterminologie, medische terminologie en GGD‐terminologie. Hieraan wordt ook aandacht besteed in de parallelpresentaties. De Vries studeerde aan de RUG en behaalde een MSc in de Kunstmatige intelligentie. Zijn scriptie ging over optimalisatie van zoekresultaten. Hij is tevens opgeleid aan de Fast‐academie. Bij GridLine werkt hij als developer taaltechnologie aan de ontwikkeling van toepassingen op het terrein van zoeken, woordenlijstbeheer en taalcontrole. ___________________________________________________________________________________
Oele Koornwinder, GridLine Woordenlijstbeheer: hulpmiddelen en praktijktoepassingen, Oele Koornwinder (GridLine) GridLine is de grootste aanbieder van Nederlandstalige taaltoepassingen rond terminologie. Voor dit soort toepassingen ‐ classificatie, zoeken en schrijfadvies ‐ is het essentieel dat de klant over een organisatiespecifieke terminologielijst beschikt en dat deze lijst wordt bijgehouden. Hiervoor biedt GridLine een divers palet aan oplossingen onder de verzamelnaam Woordenlijstbeheer. Als een klant bijvoorbeeld een eigen woordenlijst opbouwt door middel van automatische terminologie‐ extractie, dan stelt Woordenlijstbeheer hem in staat om de ruwe resultatenlijst zelf te bekijken, termen te bewerken en selecties te maken. Desgewenst kan hij de termen ook semi‐automatisch verrijken met informatie uit bestaande woordenboeken en termenlijsten. Als de klant zijn woordenlijst wil inzetten voor jargonvereenvoudiging in Klinkende Taal, helpt Woordenlijstbeheer de klantredactie bij het selecteren van moeilijke termen uit een standaardlijst of een nieuw aangemaakte lijst en het toevoegen van eenvoudige alternatieven. Woordenlijstbeheer biedt ook ondersteuning voor het beheren en uitbreiden van corporate language, bijvoorbeeld lijsten met officiële organisatienamen. Een laatste toepassing van Woordenlijstbeheer is het online ontsluiten en beheren van vakthesauri (c.q. netwerk van termen en betekenisrelaties). In deze presentatie zal de spreker enkele van deze toepassingen demonstreren aan de hand van interessante klantcases, in samenwerking met twee klantvertegenwoordigers: Erna de Vries (namens GGD Gelre Ijssel) en Martijn van der Wind (namens Gemeente Den Bosch).
Te bespreken praktijktoepassingen ‐ Stromende toegang tot water‐terminologie: demonstratie van de Woordenlijstbeheer‐toepassing van Informatiehuis Water. Het gaat om een publieke website met zoek‐ en beheeromgeving voor de Aquo‐ objectcatalogus c.q. thesaurus van water‐ en waterschapstermen (demonstratie, zonder klantvertegenwoordiger) ‐ Klare Taal met heldere overheidsterminologie: ontwikkeling, inzet en beheer van de lijst Overheidsterminologie voor begrijpelijke taal‐controle bij de Gemeente Den Bosch (demonstratie door eerste spreker, met toelichting door taaladviseur Martijn van der Wind van Texplain) ‐ Gezondheidswinst door begrijpelijke taal: ontwikkeling, inzet en beheer van de lijst GGD‐terminologie voor begrijpelijke taal‐controle bij de GGD Gelre Ijssel (demonstratie door eerste spreker, met toelichting door communicatieadviseur Erna de Vries van GGD Gelre Ijssel) Oele Koornwinder studeerde taalkunde aan de UU, waar hij later promoveerde op een onderzoek in de computationele lexicologie. Hij ontwikkelde de morfologische database voor het Nederlands voor Van Dale Lexicografie. Sinds 2005 werkt hij bij GridLine als ontwikkelaar en consultant van taaltoepassingen. Hiernaast is hij bestuurslid van Stichting NOTaS en van Vereniging NL‐Term. ___________________________________________________________________________________
Erna de Vries, GGD Gelre Ijssel Gezondheidswinst door begrijpelijke taal GGD Gelre‐IJssel gebruikt vaak geschreven tekst om onze doelgroepen te bereiken. Dat zijn uitnodigingen voor onderzoeken, brieven en folders, maar ook via de website richten wij ons tot de mensen. Door heldere taal te gebruiken is meteen duidelijk waar het over gaat. Ouders begrijpen waarom, waar en wanneer hun kind voor een onderzoek opgeroepen wordt, publiekscampagnes leveren meer effect op en rapporten zijn prettiger te lezen en te begrijpen. Bij de GGD werken veel hoogopgeleide mensen: academici en onderzoekers. Voor hen is het vaak lastig om in eenvoudig taalgebruik hun boodschap over te brengen. Klinkende taal helpt hierbij, onder meer door moeilijke vaktermen aan te strepen. Als communicatieadviseur schrijf je zelf veel teksten, maar word je ook vaak gevraagd teksten te beoordelen. Daarvoor ontbreekt meestal tijd. Doordat de collega’s de Klinkende Taal Word Plugin gebruiken, kunnen ze zelf het taalgebruik aanpassen. En dat scheelt de afdeling communicatie veel tijd! ___________________________________________________________________________________
Martijn van der Wind Klare Taal met heldere overheidsterminologie Begin 2011 heeft het Algemeen Management Team (AMT) van de Gemeente ’s‐Hertogenbosch bepaald dat publieksteksten voortaan in Klare taal de deur uitgaan. Het gaat om brieven en e‐mails aan inwoners en teksten op de gemeentepagina’s in de Bossche Omroep en op de website. Taalniveau B1 is daarbij de norm. Ter ondersteuning van dit besluit kregen alle medewerkers de Klinkende Taal Word‐plugin. De Word‐plugin helpt bij het schrijven van correcte, begrijpelijke teksten. Het is een speciale knop die teksten op taalniveau beoordeelt en laat zien wat de auteur kan doen om het taalniveau aan te passen. BiIj Den Bosch is de plugin uitgebreid met extra taalmodules voor het nakijken van teksten op het gebruik van (on)heldere overheidsterminologie en spelfouten (uiteraard met verbetersuggesties). Medewerkers kunnen ook zelf laten weten welke woorden de Plugin nog meer moet markeren. Zo raakt de controle steeds meer afgestemd op het taalgebruik van de Gemeente Den Bosch. Martijn van der Wind heeft een bachelor in journalistiek en een universitaire master in communicatie. Hij is directeur van Texplain. Daarnaast schrijft hij teksten, begeleidt hij mensen bij publieke optredens en geeft hij verschillende soorten trainingen, zoals schrijven in eenvoudige taal. Hij was nauw betrokken bij de implementatie van de Klinkende Taal Word‐plugin bij Gemeente Den Bosch. ___________________________________________________________________________________ Channah Zijlstra
Begrijpelijke geneesmiddelinformatie voor de patiënt Stichting Health Base schrijft begrijpelijke geneesmiddelinformatie voor de patiënt (GIP). Deze informatie is een aanvulling op de bijsluiter van de fabrikant. De bijsluiter van de fabrikant is een wettelijk document en bevat daardoor (te) veel informatie. De wettelijke bijsluiter is volgens patiënten vaak niet leesbaar en niet toepasbaar. Het gevaar is dat patiënten hierdoor medicijnen niet goed gebruiken. De GIP moet daarom leesbaar en toepasbaar zijn. Dit bereiken we door Klinkende Taal in te zetten. Klinkende Taal meet het taalniveau en helpt je om dit taalniveau omlaag te krijgen. Een extra druk op de leesbaarheid van de GIP komt door gebruik van medische termen. Met de aan Klinkende Taal gekoppelde vaktermbeheermodule lukt het om de medische termen zoveel mogelijk te vervangen. Dit levert een nog leesbaarder tekst op voor de patiënt, waardoor het medicijngebruik verbetert.
Channah Zijlstra heeft een achtergrond als apotheker. In haar functie als apotheker‐redacteur schrijft Channah geneesmiddelinformatie voor patiënten. Dagelijks zet ze wetenschappelijke informatie over geneesmiddelen om in begrijpelijke taal voor Nederlanders vanaf 12 jaar. ___________________________________________________________________________________
Nathalie de Sutter, CrossLang Professioneel terminologiebeheer in bedrijven CrossLang is een onafhankelijk Gents bedrijf dat gespecialiseerd is in het integreren van automatische vertaaloplossingen. Het verzamelen en beheren van terminologie neemt daarbij een belangrijke plaats in. Crosslang richt zich op de professionele (ver)taalwereld, maar is ook actief in wetenschappelijke projecten op Europees niveau. Nathalie is onder meer betrokken bij het TEXSIS‐project (Terminology Extraction for Semantic Interoperability and Standardisation) waarvan komende week de uitkomsten gepresenteerd worden aan de universiteit van Gent. Nathalie kan u alles vertellen over realistisch terminologiebeheer, geïntegreerd in een professionele vertaalomgeving. Nathalie De Sutter behaalde een Master in Oosterse Talen en Culturen en een Master na Master in Meertalige Bedrijfscommunicatie. Ze startte haar carrière als computerlinguïst bij Lernout & Hauspie en bouwde sindsdien ruime ervaring op in diverse taal‐ en spraaktechnologieën zoals text‐to‐speech, machinevertaling en workflowapplicaties. Momenteel is Nathalie actief als business consultant bij CrossLang, een onafhankelijk Gents bedrijf dat zich door de jaren heen specialiseerde in het integreren van automatische vertaaloplossingen.
13.15 ‐ 14.45 : BLOK 2 –TERMINOLOGIE, TREFWOORDEN EN ALLEDAAGSE TAAL
Hans Bennis, Meertens Instituut Het Korterlands Het Korterlands bestaat uit variëteiten van het Nederlands waarin de taal korter wordt gesproken of geschreven dan in het Standaardnederlands. In deze lezing zal ik mij richten op het geschreven Nederlands waarin Korterlands in veel vormen voorkomt. We kennen het uit de krant ‐koppen als Nederland: Griekenland uit de EU of advertenties zoals aantr.m.zkt.bl.vr. ‐ uit handschriften al vanaf de middeleeuwen en uit allerlei min of meer gebruikelijke registers ‐is het NL, NED, of NLD? of hoe werkt de apostrof in A'dam? Ook nieuwe media als sms en twitter laten veel verkortingen zien. In deze lezing zal ik vooral ingaan op de grammaticale processen die gebruikt worden bij de productie van Korterlands. Hans Bennis is directeur van het Meertens Instituut en hoogleraar Taalvariatie aan de Universiteit van Amsterdam. Hij bereidt een boek voor over het Korterlands. __________________________________________________________________________________
Tanneke Schoonheim, Instituut voor Nederlandse Lexicologie Nederland wordt steeds slimmer, vaktaal in het algemeen Nederlands Algemene woordenboeken van het Nederlands beschrijven in principe de algemene woordenschat van het Nederlands. Voor de zogenoemde ‘vakwoordenschat’, die specifiek is voor een bepaald vakgebied en daarbinnen ook redelijk exclusief gebruikt wordt, zijn er andere woordenboeken, namelijk vakwoordenboeken. Hoewel over het algemeen redelijk goed is uit te maken wat tot de algemene woordenschat behoort en wat tot de vakwoordenschat gerekend moet worden, zit daartussenin een grijs gebied met woorden die in beweging zijn, en dan met name met woorden die zich van de vakwoordenschat in de richting van de algemene woordenschat bewegen. Een van de terreinen waarop dit goed zichtbaar is, is het vakgebied van de geneeskunde. Waar vroeger in het dagelijks taalgebruik gesproken werd over aderverkalking, hersenvliesontsteking en suikerziekte, vinden we hiervoor tegenwoordig meer en meer (ook) de termen arteriosclerose, meningitis en diabetes. Deze van oorsprong medische termen lijken zich een plaats te hebben verworven in de algemene woordenschat, en dat geldt ook voor een flink aantal van hun collega’s: wordt Nederland inderdaad, zoals de reclame van de LOI (Leidse Onderwijsinstellingen) suggereert, steeds slimmer? Als woorden van de vaktaalwoordenschat in de algemene woordenschat terechtkomen, komen ze binnen de reikwijdte van de algemene woordenboeken. Mijn bijdrage gaat over de manier waarop deze woordenboeken hiermee omgaan.
Tanneke Schoonheim werkt op het Instituut voor Nederlandse Lexicologie. Zij is hoofd van de afdeling Descriptie & Productie en hoofdredacteur van het Algemeen Nederlands Woordenboek. ___________________________________________________________________________________
Folkert Zijlstra, NATO Terminology Office NATO Terminology Programme Waarom standaardiseert de NAVO haar terminologie? Hoe doet zij dit? Dit zijn enkele vragen die zullen worden beantwoord door Folkert Zijlstra van het NAVO‐agentschap voor normalisatie, NATO Standardization Agency, in Brussel. De heer Zijlstra zal beschrijven hoe de NAVO de ISO‐normen voor terminologie toepast en hoe de normalisatie van terminologie is ingekaderd in het besluitvormingsproces. Na zijn studies Engelse Taal‐ en Letterkunde en International Relations, begon Folkert Zijlstra in 1989 als Vertaler Engels bij de vertaaldienst van het ministerie van Defensie in Den Haag en werd twee jaar later hoofd van deze dienst. In deze hoedanigheid maakte hij deel uit van de Nederlandse delegatie bij de terminologie‐vergaderingen van de NAVO. In 2005 stapte de heer Zijlstra over naar de NAVO, waar hij nu de dagelijkse leiding heeft over het NATO Terminology Office, dat toeziet op een correcte uitvoering van het NATO Terminology Programme en dit programma ondersteunt. ___________________________________________________________________________________
Anne Dykstra, Fryske Akademy Het Taalweb: Nederlands‐Friese schrijfhulp voor vaktermen In de loop der jaren is er een zekere norm voor het geschreven Fries ontstaan. Die norm is niet officieel en vaak nogal los, zelfs in de woordenboeken van het Fries. Om de taalnorm te versterken wordt er voor het eerst in de geschiedenis van het Fries gewerkt aan een tegenhanger van het Groene boekje: de Standertwurdlist Frysk. De Standertwurdlist is de basis voor het online Taalweb dat bij de Fryske Akademy ontwikkeld wordt. Het Taalweb bestaat uit een bijzondere spellingcontrole, een automatische vertaler Nederlands – Fries en vice versa, en een woordenboekportaal. Eén van de onderliggende doelen van het taalweb is om het schrijven van ambtelijk Fries te bevorderen. In de lezing zal worden gedemonstreerd hoe de verschillende onderdelen van het Taalweb worden ingezet om dat doel te bereiken. Anne Dykstra (1949) is sinds 1983 lexicograaf bij de Fryske Akademy in Leeuwarden. Hij heeft gewerkt aan het wetenschappelijke Woordenboek der Friese taal (zie gtb.inl.nl) en hij heeft in 2000 het Frysk‐ Ingelsk wurdboek gepubliceerd. In 2011 is hij gepromoveerd op het Friese lexicografische werk van Joost Halbertsma (1789‐1869). In 1985 stond hij mede aan de wieg van de Taaldatabank Frysk.
15.15 – 16.30 : BLOK 3 –TERMINOLOGIE, VELDONDERZOEK EN VERTALEN
Hennie van der Vliet, Steunpunt Nederlandstalige Terminologie Waarheen, waarvoor? De veldenquête van NL‐TERM Volgens haar statuten wil de vereniging NL‐TERM de belangen behartigen van Nederlandstaligen inzake de terminologie. Het is niet eenvoudig zo’n ruime doelgroep te bereiken … In de praktijk beperkt de vereniging zich tot wie zich professioneel met vaktaal bezighoudt. Dat is een flinke inperking, maar de doelgroep is nog steeds uiterst divers. Een medisch informaticus heeft heel andere wensen en verlangens dan een vertaler, een wetenschapjournalist of een vuurtorenwachter die in maritiem Engels communiceert. Het is moeilijk om zoveel mensen met zulke diverse belangen te bereiken, het is ook moeilijk erachter te komen waar nu precies die belangen liggen die NL‐TERM wil behartigen. Dat was voor NL‐TERM treden om nu eens niet zelf te gaan invullen, maar om de doelgroep rechtstreeks te bevragen. Hennie van der Vliet, één van de drie enquêteurs, zal vertellen hoe NL‐TERM dat aanpakt en wat de voorlopige resultaten zijn. Naar verwachting zal hij ook de zaal aan de tand voelen. Hennie van der vliet is universitair docent aan de Vrije Universiteit, bij de studierichting Taal en Communicatie. Hij houdt zich vooral bezig met het computationele lexicon en met terminologie. Sinds 2007 coördineert hij het Steunpunt Nederlandstalige Terminologie, dat door de Nederlandse Taalunie is ingesteld. U vindt het Steunpunt op www.nedterm.nl ___________________________________________________________________________________
Bert Keurentjes, Radboud in'to Languages Universitaire vertaaldiensten en hogeronderwijsterminologie Het merendeel van de Nederlandse en Vlaamse universiteiten heeft een talencentrum, dat zich vaak met name richt op het verzorgen van taalcursussen. Een aantal universitaire talencentra heeft daarnaast een vertaal‐ en redactiedienst. De omvang, opzet en doelgroep van deze dienst is bij elk talencentrum weer anders. Dit geldt ook voor de omgang met hogeronderwijsterminologie. Dankzij verscheidene initiatieven begint hier nu verandering in te komen. Op nationaal niveau is er de themagroep Vertalen van de NUT (Vereniging Nederlandse Universitaire Talencentra). Deze themagroep heeft afgelopen jaren veel bijgedragen aan de uitwisseling van kennis, expertise en ervaringen tussen universitaire vertaaldiensten. De uitwisseling van hogeronderwijsterminologie gebeurt vooral via de Higher Education Terms Wiki.
Daarnaast is er een European Translation Focus Group in het leven geroepen. Op korte termijn is het belangrijkste doel van deze groep om een partnerschap op vertaal‐ en terminologiegebied aan te gaan met EU‐project TUNING Educational Structures in Europe. Bert Keurentjes coördineert de vertaal‐ en redactiedienst van universitaire talencentra Radboud in’to Languages (Nijmegen) en Language Services (Wageningen). Daarnaast is hij voorzitter van de NUT‐ themagroep Vertalen en lid van de European Translation Focus Group. ___________________________________________________________________________________
Serge Verlinde, KU‐Leuven – Instituut voor levende talen (ILT) De Interactive Language Toolbox, óók voor terminologen “Wat je eigenlijk nodig hebt, in plaats van een woordenboek, is een schrijf‐ of spreekhulp.” (H. van der Vliet) Een bijdrage leveren op een terminologiedag zonder over terminologie te spreken, lijkt paradoxaal. Terminologie in gebruik staat echter niet los van de 'algemene' taal en bij de redactie van een 'technische' tekst, rechtstreeks in L1 of als resultaat van een L1‐L2 vertaling, speelt die 'algemene' taal hoe dan ook een belangrijke rol. Het raadplegen van diverse lexicografische bronnen, meer en meer via het internet, is bij dit proces dan ook onvermijdelijk. Door het overaanbod dreigt men echter te vervallen in de 'Paradox of choice ‐ Why more is less', naar de titel van een boek van de Amerikaanse psycholoog Barry Schwartz (2004). De Interactive Language Toolbox wil daarom een gebruiksvriendelijke schrijfhulp aanbieden voor (voorlopig) het Engels, het Frans en het Nederlands, bestaande uit een 'predictive writing aid' en een 'corrective writing aid' (Ziyuan 2012). De toepassing is in eerste instantie bedoeld voor studenten in opleiding, maar telt zeker ook tal van interessante functies voor meer gevorderde gebruikers. Serge Verlinde is docent français sur objectifs spécifiques en directeur van het Instituut voor levende talen van de KU Leuven. Als lexicograaf is hij co‐auteur van leerwoordenboeken voor het Frans (o.a. de Dictionnaire d’apprentissage du français des affaires). In zijn huidig onderzoek probeert hij een brug te slaan tussen lexicografie, corpuslinguïstiek, natural language processing en computer assisted language learning.