Inhoud Voorwoord
2
POLITIE & JUSTITIE
38
Inleiding
4
Interview: Forensische schrijveridentificatie
40
ACCESS
44
TOKEN
8
ANITA
46
ToKeN Facts & Figures
10
BEST
48
ToKeN Highlights
12
CASSANDRA
50
ToKeN Toekenningen
14
DALE
52
ToKeN Proefschriften
16
EVIDENCE
54
IPOL
56
LAYLA
58
TRIGRAPPH
60
ZORGSECTOR
62
Samenwerking met de Raad voor de Rechtspraak OPLEIDING & CULTUUR
18 20
Interview: Automatische beeldherkenning en cultureel erfgoed
22
Interview: Optimaal benutten van informatie op de IC
64
AUTHENTIC
26
CHIME
28
I-CATCHER
68
DUMPERS
30
DIME
70
EIDETIC
32
MIA
72
I2RP
34
NARRATOR
74
VINDIT
36
TIMEBAYES
76
Voorwoord Dr. Louis B.J. Vertegaal Directeur NWO Exacte Wetenschappen, NWO Chemische Wetenschappen en ACTS
2
Voor u liggen de Highlights van tien jaar ToKeN, een programma dat door NWO Exacte Wetenschappen is opgezet om de interactie tussen een menselijke gebruiker en kennis- en informatiesystemen te bevorderen. De afkorting staat voor Toegankelijkheid en Kennisontsluiting in Nederland, waarbij toegankelijkheid verwijst naar de mate waarin individuele burgers kunnen beschikken over kennis en informatie die voor hun van belang is. Kennisontsluiting slaat op methoden die voor de gebruiker kennis halen uit gegevens en informatie. Cognitiewetenschappers en informatici buigen zich over kennis die anders niet beschikbaar zou zijn. In deze bundel maken we de balans op van dit interdisciplinaire onderzoeksprogramma en tonen we een overzicht van, en de highlights uit de projecten. Daaruit blijkt dat ToKeN heeft geleid tot mooie resultaten en langdurige en vruchtbare samenwerkingsverbanden. Samenwerking tussen informatici en vertegenwoordigers uit de drie toepassingsgebieden: Politie & Justitie, de Zorgsector en Opleiding & Cultuur. Toen het onderzoeksprogramma ToKeN in 1999 van start ging had niemand durven dromen dat het zoveel zou opleveren: vele proefschriften, gezamenlijke publicaties, reguliere site visits, jaarlijkse bijeenkomstenen een hechte community. Tien jaar ToKeN is gelukkig niet het einde van een tijdperk. De drie toepassingsgebieden ontwikkelen zich verder in nieuwe programma’s als de subsidieprogramma’s Continuous Access to Cultural Heritage (CATCH) van NWO Exacte Wetenschappen, Diseasemanagement Chronische Ziekten van ZonMW en een nieuw subsidieprogramma Forensic Science. ToKeN krijgt zelf mogelijk een vervolg in een programma gericht op raakvlakken binnen de IT en de rechtspraak. Ik wens u veel leesplezier: laat de resultaten van tien jaar ToKeN u verrassen en inspireren!
3
‘Succes valt niet zomaar uit de lucht’
4
Inleiding Prof. dr. Jaap van den Herik
De interdisciplinaire samenwerking in het ToKeNprogramma tussen informatici en wetenschappers uit de toepassingsgebieden heeft de afgelopen tien jaar mooie resultaten opgeleverd. ToKeN leidde niet alleen tot wetenschappelijke doorbraken en een indrukwekkend aantal proefschriften, maar ook tot gelijkgestemde onderzoekers en diverse vervolgprogramma’s. Een interview met het boegbeeld van ToKeN, Jaap van den Herik.
Jaap van den Herik is voorzitter van de programmacommissie van ToKeN en medeoprichter van het programma. ‘We hebben in alle drie de domeinen de afgelopen tien jaar op wetenschappelijk gebied veel bereikt. Maar persoonlijk vind ik het mooiste aan ToKeN dat er een community is ontstaan van mensen met heel uiteenlopende achtergronden die op dezelfde manier denken, kijken en werken’, zegt Van den Herik in zijn werkkamer in het statige Kamerlingh Onnes Gebouw van de Universiteit Leiden. Interdisciplinaire samenwerking is hem niet vreemd: in Leiden is hij hoogleraar Juridische informatica. Bij de faculteit Rechtsgeleerdheid houdt hij zich bezig met onderwerpen als juridische data mining, elektronische surveillance en privacy, en de rol van de computer in de feitelijke rechtspraak.
5
Daarnaast is hij hoogleraar aan de Universiteit van
we onder andere kregen van het toenmalige Nationale
Tilburg en directeur van het Tilburg Centre for Creative
Actieprogramma Elektronische Snelwegen (NAP).’ In
Computing (TiCC). Dit centrum is onderdeel van de
eerste instantie kon ToKeN alleen starten met projecten
faculteit Geesteswetenschappen en doet onderzoek
op het gebied van Opleiding & Cultuur, later kwamen
naar kunstmatige intelligentie, menscomputer interactie
daar ook het toepassingsgebied Politie & Justitie en
en games.
de Zorgsector bij. ‘Het was best lastig om iedere keer
Domeinoverstijgend
opnieuw op zoek.’
financiering te vinden. In ieder domein moet je weer De gedachte dat informatica meerwaarde heeft voor andere vakgebieden en de wens om informatica meer
6
Grote doorbraak
uitstraling te geven, waren eind vorige eeuw bij NWO
Die moeite is niet voor niets geweest. De interdiscipli-
Exacte Wetenschappen de aanleidingen om een nieuw,
naire samenwerking in de twintig projecten leidde tot
domeinoverstijgend onderzoeksprogramma in het leven
een groot aantal proefschriften en volop inhoudelijke
te roepen. ‘Informatica is een enabler. Met ToKeN wil-
successen, zoals het onderzoek naar de authenticiteits-
den we laten zien waarvoor je het allemaal kunt
bepaling van schilderijen, vertelt Van den Herik
gebruiken’, zegt Van den Herik. Hij herinnert zich nog
enthousiast. ‘Met de software van het project
goed hoe het begon: ‘In een werkgroep hebben we
AUTHENTIC kun je aan de hand van penseelstreken met
eerst ideeën verzameld, zoals het automatisch herken-
grote waarschijnlijkheid de maker van een schilderij
nen van schilderijen, computers laten rechtspreken en
vaststellen. Een grote doorbraak voor het Van Gogh
het gebruik van expertsystemen in de zorg. Op basis van
Museum, waar veel publiciteit over is geweest.’ Het
dergelijke toepassingen hebben we een voorstel
project CASSANDRA leverde technieken op waarmee de
geschreven en zijn we op zoek gegaan naar geld, dat
veiligheid in openbare ruimten kan worden vergroot.
Op basis van beelden afkomstig van cameratoezicht-
samenwerking te brengen. Het is ons gelukt om tussen
systemen, in combinatie met analyse van geluiden in de
allerlei faculteiten stevige bruggen te bouwen en daar-
omgeving, wordt opkomende agressie gespot. Beveili-
bij inspiratie, enthousiasme en vernieuwing te
gingsmedewerkers krijgen bij bijzondere gebeurtenissen
realiseren. Voor mij zijn dat de trefwoorden die bij
een seintje, zodat zij in de controlekamer niet voortdu-
ToKeN horen.’ Succes wordt daarnaast gevoed door
rend naar een muur vol beeldschermen hoeven te turen.
eerder onderzoek, inzichten van anderen en nieuwe
Projectleider Dariu Gavrila ontving in 2007 de I/O Award
contacten’, vervolgt hij. ‘En bovenal door alert te zijn
van het Gebiedsbestuur van NWO Exacte Wetenschap-
op verrassende wendingen in je onderzoek en oog te
pen voor de beste publiciteit over ICT-onderzoek. Voor
hebben voor nieuwe onderzoeksrichtingen. Alleen dan
het zorgdomein is in het project MIA een veelbelovende
kun je doorbraken bewerkstelligen. Ik ben er trots op
technologie ontwikkeld waarmee het Elektronisch
dat de onderzoekers van ToKeN, soms tegen de stroom
Patiënten Dossier (EPD) beter kan functioneren. ‘Techno-
in, prijswinnend onderzoek hebben verricht.’ Dat de
logisch is er met het EPD eigenlijk niets mis, maar er is
informatica via ToKeN haar toegevoegde waarde heeft
wel veel discussie over privacyaspecten. Met behulp van
laten zien, is voor Van den Herik evident. Veel van de
software agents kun je de privacy van patiënten waar-
resultaten, maar ook nieuwe onderzoeksrichtingen, zijn
borgen, blijkt uit dit en ander ToKeN-onderzoek.’
inmiddels terechtgekomen in vervolgprogramma’s.
Verrassende wendingen Hoe komt het dat ToKeN zo’n succesvol programma is? ‘Succes valt niet zomaar uit de lucht’, benadrukt Van den Herik. ‘Dat kun je alleen bereiken door heel veel mensen met uiteenlopende achtergronden tot nauwe
7
8
ToKeN Toegankelijkheid en Kennisontsluiting in Nederland
9
ToKeN Facts & Figures ToKeN staat voor Toegankelijkheid en Kennis-
Gefinancierd zijn 40 aio’s, 14,5 postdoc-posities
ontsluiting in Nederland
en 5 fte niet-wetenschappelijk personeel.
ToKeN is een interdisciplinair onderzoeks-
Binnen ToKeN zijn drie toepassingsgebieden
programma dat zich richt op de interactie
• Opleiding & Cultuur
tussen een menselijke gebruiker en kennis-
• Politie & Justitie
en informatiesystemen.
• Zorgsector
Deze fase van het ToKeN subsidieprogramma
Researchteams bestaan uit onderzoekers uit
loopt van 1999 tot 2010 (tot 2004 heette het
de informatica, cognitiewetenschappen en soms
ToKeN2000).
onderzoekers uit de toepassingsgebieden.
Het programmabudget is ongeveer M€ 10.
10
Tot en met 2009 zijn 23 proefschriften
Het programmabureau wordt gevoerd door
verschenen.
NWO Exacte Wetenschappen.
ToKeN wordt aangestuurd door een programma-
ToKeN-financiers zijn
commissie, onder leiding van prof. dr. Jaap van den
• Nederlandse Organisatie voor Wetenschappelijk
Herik van de Universiteit van Tilburg.
Onderzoek (NWO) - Algemeen Bestuur en de gebieden Exacte Wetenschappen en Maatschappij- en Gedragswetenschappen • Nederlandse organisatie voor gezondheids-
Een gebruikerscommissie is aangesteld om de voortgang binnen de projecten te volgen. Deze commissie bestaat uit experts uit de drie toepassingsgebieden en vertegenwoordigers van de
onderzoek en zorginnovatie (ZonMw) • Nationaal ActieProgramma Elektronische Snelwegen (NAP) • Raad voor de Rechtspraak
betrokken ministeries.
11
ToKeN Highlights Vertegenwoordiging op congressen ToKeN heeft regelmatig deelgenomen aan andere congressen, zoals het Medische Informatica Congres en het ICT kenniscongres (wat later is omgevormd tot ICTDelta). De bijdrage vanuit ToKeN bestond bijvoorbeeld uit het houden van een demonstratie of het organiseren van een side-meeting.
Site visits
Pattern Recognition Letters
Voor de gebruikerscommissie van ToKeN organiseren de
Het journal Pattern Recognition Letters heeft in april
projecten regelmatig site visits, om hen op de hoogte te
2007 een speciale editie uitgegeven, ‘Pattern Recogni-
houden van de voortgang en de resultaten van het
tion in Cultural Heritage and Medical Applications’,
onderzoek. Deze site visits worden goed bezocht en
waarin het ToKeN-onderzoek centraal stond. Gastredac-
gewaardeerd, de projectleden besteden hier veel zorg
teuren voor deze editie waren Eric Postma, Jaap van den
aan.
Herik en Jan van der Lubbe. Vanuit ToKeN zijn in totaal vier artikelen opgenomen.
12
Jaarlijkse bijeenkomsten Om de ToKeN-community te versterken wordt jaarlijks een bijeenkomst georganiseerd voor de achterban en geïnteresseerden. Veelal verzorgen de projecten een posterpresentatie, met de Best Poster Award voor de meest heldere bijdrage. Vanuit een aantal projecten worden boeiende presentaties gehouden, waarbij de beste presentatie wordt beloond met de Best Oral Presentation Award. Maar bovenal zijn de bijeenkomsten dé plek om betrokkenen te ontmoeten en op de hoogte te blijven van de ontwikkelingen in het vakgebied.
Media-aandacht Door de jaren heen zijn de ToKen-projecten zeer regelmatig in het nieuws geweest. Kijk bij de highlights van de verschillende projecten voor een greep uit de gegenereerde media-aandacht.
13
ToKeN Toekenningen Eerste subsidieronde Om het onderzoek op te starten zijn in de zomer van 2001 twee voorstellen van de ToKeN2000 kerngroep gehonoreerd binnen het toepassingsgebied Opleiding & Cultuur: • EIDETIC: Intelligent Content-based Image Retrieval (Prof.dr. E.O. Postma, UvT) • I2RP: Intelligent Information Retrieval and Presentation in Public Historical Multimedia Databases (Prof.dr. L.R.B. Schomaker, RUG) Tweede subsidieronde Voor de toepassingsgebied Opleiding & Cultuur werden in het voorjaar 2002 vier aanvragen gehonoreerd, voor het toepassingsgebied Politie & Justitie één en voor het toepassingsgebied Zorgsector vijf: Cultuur & Opleiding • AUTHENTIC: Knowledge discovery and disclosure for visual art: authentication and dating of graphic art paintings (Dr.ir. J.C.A. van der Lubbe, TUD) • CHIME: Cultural Heritage in an Interactive Multimedia Environment (Prof.dr. H.L. Hardman, CWI) • DUMPERS: Distributed user modeling and Exploration in Personalized Recommender Systems (Dr. M.W. van Someren, UvA) • VINDIT: Combining visual and textual information for information retrieval (Prof.dr. E.O. Postma, UvT)
14
Politie & Justitie • ANITA: Administrative Normative Information Transaction Agents (Dr.mr. C.N.J. de Vey Mestdagh, RUG) Zorgsector • DIME: Distributed Interactive Medical Exploratory for 3D Medical Images (Prof.dr.ir. J.H.C. Reiber, LUMC) • I-CATCHER: Intensive-Care Acces to Terminology & Course of Health Exploration & Retrieval (Dr. A. Abu-Hanna, AMC) • MIA: Medical Information Agent (Prof.dr.ir. A. Hasman, UM) • NARRATOR: Narrative Disclosure of Health Care Knowledge (Dr. P.J. Toussaint, LUMC) • TIMEBAYES: Building and Using Temporal Bayesian Models in a CPR Setting (Dr. P. Lucas, RU) Derde subsidieronde In de ronde van 2004 zijn acht onderzoeken gehonoreerd binnen het toepassingsgebied Politie & Justitie: • ACCESS: Agent-based Criminal Court Electronic Support Systems (Prof.dr. F.M.T. Brazier, VU) • BEST: Intelligent disclosure of case-law using Semantic Web technology to determine BATNAs in damages disputes (Dr. A.R. Lodder, VU) • CASSANDRA: Context-Aware SenSing for AggressioN Detection and Risk Assessment (Prof.dr. D.M. Gavrila, UvA) • DALE: Data Assistance for Law Enforcement (Dr. W.A. Kosters, UL) • EVIDENCE: Making sense of evidence: software support for crime investigations (Prof.dr.mr. H. Prakken, UU) • IPOL: Intelligence led policing. An effective law enforcement strategy or a threat to civil liberties and the principles of criminal law? (Prof.mr. Th.A. de Roos, UL) • LAYLA, the Layman's Legal Assistant: Assisting consumers in business-consumer conflicts by diagnosing, advising and mediating (Dr. R.E. Leenes, UvT) • TRIGRAPH: tri-modal writer indentification (Prof.dr. L.R.B. Schomaker, RUG)
15
ToKeN proefschriften Egon van den Broek (EIDETIC, RU)
Human-Centered Content-Based Image Retrieval
21 september 2005
Xandra van Montfort (EIDETIC, TU/e)
Gist and its role in memory for images
20 juni 2006
Boban Arsenijvic (I2RP, UL)
Inner aspect and telicity: The decompositional and quantificational nature of eventualities at the syntax-semantics interface
Stefano Bocconi (I2RP, CWI)
Vox Populi: generating video documentaries from semantically annotated media repositories
Wouter Teepe (ANITA, RUG)
18 januari 2007
Autonomy vs. Conformity. An Institutional Perspective on Norms and Protocols
4 juni 2007
Theodore Charitos (TIMEBAYES, UU)
Reasoning with Dynamic Networks in Practice
17 september 2007
Niek Bergboer (EIDETIC, UM)
Context-Based Image Analysis
10 oktober 2007
Lilit Axner (DIME, UvA)
16
30 november 2006
Reconciling Information Exchange and Confidentiality: A Formal Approach
Huib Aldewereld (ANITA, UU)
11 oktober 2006
High Performance Computational Hemodynamics with the Lattice Boltzmann Method
18 december 2007
Vera Hollink (DUMPERS, UvA)
Optimizing Hierarchical Menus a usage-based approach
31 januari 2008
Henk Herman Nap (NARRATOR, TU/e)
Stress in Senior Computer Interaction
18 maart 2008
Guido de Croon (VindIT, UM) Stephan Visscher (TIMEBAYES, UU) Loes Braun (MIA, UM) . . Rasa Jurgelenaite (TIMEBAYES, RU) Hilke Reckman (NARRATOR, UL)
Adaptive Active Vision
26 juni 2008
Bayesian network models for the management of ventilator-associated pneumonia
30 september 2008
Pro-active medical information retrieval
29 oktober 2008
Symmetric Causal Independence Models
19 januari 2009
Flat but not shallow; Towards flatter representations in deep semantic parsing for precise and feasible inferencing
18 maart 2009
Stijn VanderLooy (IPOL, UM)
Ranking and reliable classification
1 juli 2009
Leendert van Maanen (I2RP, RUG)
Context effects on memory retrieval
14 september 2009
Floris Bex (EVIDENCE, RUG)
Evidence for a good story, A hybrid theory of arguments, stories and criminal evidence
29 oktober 2009
Wouter Koelewijn (ANITA, UL)
an Institutional Perspective on Norms and Protocols
4 november 2009
Tim Cocx (DALE, UL)
Algorithmic tools for data-oriented law enforcement
2 december 2009
Igor Berezhnoy (AUTHENTIC, UM)
Digital analysis of paintings
7 december 2009
Jeroen Laros (DALE, UL)
Metrics and Visualisation for Crime Analysis and Genomics
21 december 2009
17
Samenwerking Raad voor de Rechtspraak
18
Op 1 juli 2004 hebben NWO en de Raad voor de Rechtspraak een overeenkomst getekend, waarin zij bevestigden om intensief samen te werken binnen ToKeN. De Raad voor de Rechtspraak hecht veel belang aan onderzoek op dit terrein, omdat de aandacht is gericht op informatiesystemen die de prestaties verbeteren. De rechtspraak stond voor de taak het groeiend aantal zaken, en de toenemende bewerkelijkheid ervan op te vangen. Het is daarom noodzakelijk om de effectiviteit te vergroten. In het bijzonder richtte het onderzoek zich op het vergroten van de (digitale) toegankelijkheid, de rechtseenheid en het verkorten van de doorlooptijden. Inhoudelijk is aan deze samenwerking gestalte gegeven door in de loop van 2003 in samenwerking met de Raad een aantal vraagstukken te formuleren. Deze vormden samen met andere onderwerpen het kader van de derde subsidieronde. De Raad heeft de volgende onderwerpen bij NWO aangedragen voor onderzoek: • De digitalisering van werkprocessen. • Het ontwikkelen van kennis- en expertsystemen. • Het creëren van innovatieve ICT voorzieningen. • De ontwikkeling van informatiearchitecturen met een lange levenscyclus. De samenwerking met de Raad voor de Rechtspraak bood een uitstekende kans de grote afstand tussen beleid en wetenschap te verkleinen.
19
OPLEIDING & CULTUUR Interview Eric Postma Projectomschrijvingen
‘Musea en instellingen voor cultureel erfgoed worstelen met heel basale vragen‘
22
Automatische beeldherkenning en cultureel erfgoed Prof. dr. Eric Postma
In de cultureel erfgoedsector bestaat grote behoefte om in grote databases te zoeken naar specifieke afbeeldingen. Voor zowel informatici als psychologen een interessant thema, vindt Eric Postma. Hij leidde de projecten VindIT en EIDETIC.
Ondanks alle ontwikkelingen in de informatica en de toegenomen rekenkracht van computers is het vinden van afbeeldingen in grote databases niet eenvoudig. Het realiseren van automatische beeldherkenning kent een groot aantal uitdagingen, vertelt Eric Postma van het Tilburg centre for Creative Computing (TiCC). ‘Het lijkt heel makkelijk omdat het voor ons mensen een onbewust proces is, maar er is niets zo moeilijk als beeldherkenning. Je hebt geen idee wat zich bij visuele waarneming in je hoofd afspeelt‘, legt hij uit. ‘Dat merk je pas als je het in algoritmes wilt vastleggen.‘ Veel valt daarbij te leren van hoe mensen naar afbeeldingen kijken. Vandaar dat aan deze twee ToKeN-projecten zowel informatici als psychologen hebben gewerkt.
23
Gezichtsdetectie
bepalen, en vervolgens weer informatie uit de context
‘Een mens kan heel snel de essentie uit een plaatje
te gebruiken om te verifiëren of het ook werkelijk
halen. Een miniem detail zorgt er al voor dat je in een
gezichten zijn. Dit algoritme is breder toepasbaar dan
stadsbeeld Parijs herkent‘, geeft Postma als
alleen voor gezichtsdetectie, het is ook geschikt voor
voorbeeld. ‘Welke elementen dat zijn is onderzocht in
objectherkenning in andere domeinen.
Eindhoven. De psychologische experimenten die daar zijn uitgevoerd, geven inzicht in waar we precies naar
Combineren
kijken, wat de gist van een afbeelding is.‘ Een promo-
Hoewel de twee projecten het thema beeldherkenning
vendus uit mijn groep, vervolgt Postma, maakte ook
met elkaar gemeen hadden, was er ook een verschil: de
gebruik van psychologische kennis: ‘Hij baseerde zijn
onderzoekers van project EIDETIC * gingen alleen af op
algoritme op de manier waarop mensen bij een
informatie die uit het beeld te halen valt, het project
bepaalde zoektaak actief de inhoud van een afbeelding
VindIT daarentegen combineerde beeld met tekstuele
in zich opnemen. Wanneer je op een schilderij zoekt
informatie. Postma: ‘De database van het Rijksmuseum
naar iemand die een hoed draagt, scannen je ogen
bijvoorbeeld bevat zowel schilderijen als toelichtingen.
onbewust de hogere delen van het beeld. Zijn algoritme
Vaak is er overlap, bijvoorbeeld als in de beschrijving
kan met zulke kennis over de context van de zoekvraag
staat dat het schilderij een vrouw in een winkelstraat
efficiënter naar bepaalde delen van een afbeelding
toont. Maar als op de achtergrond een straathond te
afzoeken, zonder het hele schilderij te hoeven verwer-
zien is, heeft iemand die onderzoek doet naar schilde-
ken.‘ Weer een andere aio maakte
rijen met honden niets aan de tekst. Door beide
gezichtsdetectiealgoritmen betrouwbaarder. Hij drong
bronnen te combineren krijg je meer en betrouwbaar-
het aantal false positives (het algoritme ziet gezichten
der zoekresultaten.‘
die er niet zijn) terug door eerst kandidaatgezichten te *Een Eidetic memory is een fotografisch geheugen.
24
Omdat de projecten inhoudelijk heel dicht bij elkaar
je als projectleider wel in een spagaat: die praktische
lagen en Postma ze allebei leidde, kon hij samenwer-
problemen bieden niet voldoende wetenschappelijke
king en uitwisseling faciliteren tussen de onderzoekers
diepgang. Het is soms best lastig de afweging te maken
in Nijmegen, Tilburg, Maastricht, Delft en Eindhoven. In
tussen nut voor het vakgebied versus nut voor de sector.
regelmatig georganiseerde projectbijeenkomsten inspi-
Ik zie het ToKeN-programma als een verkenning van het
reerden informatici en psychologen elkaar en wisselden
grensvlak tussen informatica, psychologie en cultureel
de onderzoekers kennis, psychologische modellen over
erfgoed, die voor veel uitstraling en nieuwe projecten
waarneming en algoritmes uit. Ook kwam het tot geza-
heeft gezorgd. De ToKeN-projecten hebben inzicht
menlijke publicaties.
gegeven in de ICT-behoeften van musea en instellingen en wat er komt kijken bij de transfer van toepassingen.
Inzicht in ICT-behoeften
Binnen het vervolgprogramma CATCH kun je dit uitbou-
‘Het uiteindelijke doel van dergelijk onderzoek is heel
wen. Dat gebeurt onder andere doordat informatici zich
praktisch: het opleveren van software waar de instellin-
op de vloer van de instelling bevinden. Ik ben erg blij
gen voor cultureel erfgoed wat aan hebben. Maar dat is
dat NWO dat heeft ingezien.‘
in het bestek van een promotieonderzoek teveel gevraagd: een aio produceert prototypes en publicaties‘, vindt Postma. ‘De samenwerking met musea was er in deze projecten ook niet intensief genoeg voor. Dat is echter wel nodig, want deze sector staat nog behoorlijk aan het begin van informatisering. Musea en instellingen worstelen nog met heel basale vragen en zij hebben behoefte aan concrete oplossingen. Dat brengt
25
AUTHENTIC Knowledge discovery and disclosure for visual art: authentication and dating of graphic art and paintings Hoofdaanvrager Dr. ir. Jan (J.C.A.) van der Lubbe (TUD) Uitvoerders Igor (I.E.) Berezhnoy promotie 07-12-2009 Ana-Ioana (A.I.) Deac Looptijd 01-01-2003 tot 01-01-2007
In 2008 werd wereldwijd aandacht besteed, onder andere in Nature, aan een door de TU Delft ontwikkelde techniek om onderschilderingen zichtbaar te maken. In dit geval ging het om een Van Gogh.
26
Budget Eur 271.524 voor personele kosten Eur 45.131 voor materiële kosten Partners Informatie en Communicatie Theorie (TUD) Instituut voor Kennis en Agent Technologie (UM)
Echt of toch niet? Hoe bepaal je of een schilderij vals is? Ervaren kunst-
In het project is nauw samengewerkt met diverse
kenners kunnen dit op het oog beoordelen, maar
musea, kunsthistorische instituten en veilinghuizen.
computers hebben een objectievere en vaak ook
Naast een toolbox voor automatische analyse van kunst-
betrouwbaardere mening. In het AUTHENTIC-project
werken, is ook een bijdrage geleverd aan het zoeken
ontwikkelden onderzoekers een manier om schilderijen
van beelden in multimedia bestanden.
met elkaar te vergelijken. Highlights
In de kunstgeschiedenis en kunsthandel spelen authenti-
• Er zijn artikelen over het onderzoek geplaatst in onder
citeitsbepaling en datering van kunstwerken een
andere NRC Handelsblad, De Volkskrant, VPRO gids en
belangrijke rol. Veel van het onderzoek op dit gebied
Het Brabants Dagblad en internationaal in de New York
geschiedt nog handmatig en met een hoge mate van
Times en de International Herald Tribune.
subjectiviteit. In het AUTHENTIC-project is onderzocht welke beeldverwerkingsmethoden en methoden vanuit computationele intelligentie en data mining een ondersteunende rol kunnen spelen.
• De publicatie van een artikel in de New Scientist ‘Detecting art fakes at a Stroke’ in 2006. • Op 14 en 15 mei 2007 vond de First International Workshop on Image Processing for Artist Identification plaats, onder andere ontstaan uit het AUTHENTIC-project.
Nieuwe methoden zijn ontwikkeld voor de automatische extractie van lokale en globale kenmerken, variërend van penseelstreken tot compositie, stijl en
• Er is een documentaire gemaakt door RTL4 over de identificatie van een valse Karel Appel. • Tijdens de AAAI 2008 Conference on Artificial Intelligence
school. Data mining technieken zijn gebruikt om ver-
won AUTHENTIC de Best Video Award voor de video
banden te leggen tussen de geëxtraheerde kenmerken,
‘Digital Analysis of Van Gogh Paintings’.
om zo inzicht te krijgen in het eigene van een kunstenaar. 27
CHIME Cultural Heritage in an Interactive Multimedia Environment
Hoofdaanvrager Prof. dr. Lynda (L.) Hardman (CWI) Uitvoerders Mark (M.F.J). van Assem - promotiedatum n.n.b. Vadim (V.I.) Chepegin Kateryna (K.I.) Falkovych Frank-Michael (F.M.) Nack - postdoc
Binnen CHIME is de SampLe demo ontwikkeld, een semiautomatisch raamwerk om multimediale presentaties te ontwerpen.
28
Looptijd 01-11-2002 tot 01-09-2007 Budget Eur 489.694 voor personele kosten Eur 18.152 voor materiële kosten Partners Information Systems Group (CWI) Business Informatics Section (VU) Information Systems Group (TU/e)
Gebruikers gemodelleerd Het CHIME-onderzoek richtte zich op het gebruik van
multimediale aspecten en het hergebruik van gebruikers-
semantische modellen om presentatie van culturele
profielen bij meerdere applicaties.
informatie toe te spitsen op verschillende typen
CHIME heeft gekeken naar het genereren van domein-
gebruikers. De culturele informatie komt uit bestaande
representaties uit databanken van cultureel erfgoed
verzamelingen en is opgebouwd uit heterogene
instellingen. Vocabulaires spelen hierbij een centrale rol,
collecties van media items.
bijvoorbeeld de Art en Architecture Thesaurus (Getty) en WordNet (Princeton). In het kader van CHIME zijn
Tekstgebaseerde zoektechnieken maakten culturele
representaties van deze en andere vocabulaires
informatie uit databanken met heterogene collecties wel
gebouwd en ingezet.
toegankelijk, maar lieten rijkere expressiemogelijkheden
De zoekopdrachten in het onderzoek zijn gebaseerd op
buiten beschouwing. Ook werden samenhangende en
‘De Stijl’ van Mondriaan. Gecombineerde indexerings-
doelgerichte presentaties van resultaten niet onder-
woordenlijsten zijn gebruikt om informatie over
steund.
Mondriaan te vinden in verschillende bronnen. Het
Het onderzoek binnen CHIME richtte zich op het creëren
CHIME project heeft de grondslagen onderzocht en
van semantische modellen op basis van domeinseman-
ontwikkeld waardoor later het CATCH-project CHIP een
tiek en discoursesemantiek, die ook aspecten van
goede start kon maken.
gebruikersmodellen in beschouwing nemen. Zo is beschreven hoe een bestaand hypermediasysteem kan
Highlights
communiceren met een alleenstaande gebruikersserver
• De publicatie en het online beschikbaar stellen van
en kan de output van eerdere zoekopdrachten worden gebruikt als input voor vervolgopdrachten. Speciale aandacht ging uit naar het representeren van kennis uit
WordNet in RDF/OWL bij W3C. • Leden van CHIME zaten in het team dat in 2006 de Semantic Web Challenge won.
29
DUMPERS Distributed user modeling and Exploration in Personalized Recommender Systems Hoofdaanvrager Dr. Maarten (M.W.) van Someren (UvA) Uitvoerders Stephan (S.H.G.) ten Hagen - postdoc Vera (V.) Hollink - promotie 31-01-2008 Looptijd 01-11-2002 tot 31-07-2008
Tijdens de AAAI Workshop on Intelligent Techniques for Web Personalization te Vancouver is de workshop ‘The SeniorGezond Recommender: Exploration Put into Practice‘ gegeven in 2007.
30
Budget Eur 183.563 voor personele kosten Eur 12.726 voor materiële kosten Partners SeniorGezond (LUMC en TNO)
Vinden op het web Dankzij het internet is voor iedereen een grote hoeveel-
informatiesysteem SeniorGezond. Dit systeem is ontwik-
heid informatie toegankelijk. Het is echter lang niet altijd
keld voor een breed spectrum van gebruikers en bevat
eenvoudig om bepaalde informatie te vinden. Binnen
een grote, heterogene hoeveelheid informatie. Daar-
DUMPERS zijn verschillende manieren onderzocht om
door kan gebruikersondersteuning worden toegevoegd
internetters in hun zoektocht te ondersteunen.
en geëvalueerd.
In het DUMPERS-project is het gedrag van internet-
Highlights
gebruikers geobserveerd en geanalyseerd. Patronen in
• Publicatie ‘Navigation behavior models for link structure
het gebruikersgedrag zijn gecombineerd met informatie uit de inhoud van de webpagina's, om zo navigatiestructuren van websites te optimaliseren.
optimization‘ in User Modelling and User-Adapted Interaction in 2007. • Publicatie ‘A Semi-Automatic Usage-Based Method
Nieuwe ideeën zijn onder meer het automatisch optimali-
for Improving Hyperlink Descriptions in Menus‘ in Inter-
seren van menustructuren. Uit de informatie die is
national Journal of Human-Computer Studies in 2009.
opgeslagen in logfiles, zijn modellen van het gedrag van de gebruikers geconstrueerd. Menu’s zijn bedoeld voor
Informatica Vera Hollink heeft een methode ontwikkeld,
gebruikers die niet goed gebruik kunnen maken van een
waarbij gebruikers zelf bepalen hoe een website wordt
zoekmachine, omdat ze hun informatiebehoeften niet
gestructureerd. Haar programma volgt hoe gebruikers
goed kunnen formuleren. Menu’s die het zoeken onder-
door websites bladeren en op welke punten in de sites
steunen blijken echter vaak niet optimaal. Op basis van
links worden aangeklikt. Verwijzingen die tot verkeerde
modellen van het zoekgedrag is berekend hoe menu's
keuzes leiden worden verwijderd, verplaatst of voorzien
moeten worden aangepast, zodat gebruikers sneller
van een duidelijker tekst. Bovendien is samen met de
komen bij de informatie die ze nodig hebben.
ontwikkelaars een functie gemaakt, die interessante
Het onderzoek vond plaats in samenwerking met het
links aanbiedt aan bezoekers. 31
EIDETIC Intelligent Content-based Image Retrieval
Hoofdaanvrager Prof. dr. Eric (E.O.) Postma (UvT) Uitvoerders Niek (N.A.) Bergboer - promotie 10-10-2007 Egon (E.L.) van den Broek - promotie 21-09-2005 Xandra (X.A.) Montfort - promotie 20-06-2006 Hector (H.) Moreu Otal Mark (M.) van Staalduinen
In een special issue van de Pattern Recognition Letters is in 2007 een analyse gepubliceerd van de trade-off tussen efficiëntie en kwaliteit.
32
Looptijd 01-09-2001 tot 01-08-2008 Budget Eur 568.619 voor personele kosten Eur 24.391 voor materiële kosten Partners Mens Techniek Interactie groep (TU/e) Informatie en Communicatie Theorie groep van (TUD) Nijmegen Instituut voor Cognitie en Informatie (RU)
Zoeken naar beelden Binnen EIDETIC zijn technieken en methoden onderzocht
bladeren. Hiertoe zijn in een speciale experimentele
die de gebruiker ondersteunen bij het zoeken naar visueel
opzet proefpersonen geconfronteerd met verschillende
materiaal in culturele databases. Hierbij zijn de gebruikers-
wijzen van presentatie.
aspecten, bijvoorbeeld het gebruiksvriendelijk zoeken in grote hoeveelheden data, en de technische aspecten van
Tevens is onderzocht wat de meest gebruikersvriende-
het zoeken naar beelden, bijvoorbeeld automatische
lijke wijze is om te zoeken naar kleuren of combinaties
detectie van objecten, onderzocht.
van kleuren en vormen. In het technische onderzoek zijn geavanceerde programma’s ontwikkeld die automati-
Zoeken naar specifieke afbeeldingen in een grote beeld-
sche detectie en herkenning van specifieke objecten
database werd eerst gedaan door een gebruiker, want
mogelijk maken. De focus lag op objectspecifieke
met bestaande technologieën was het niet mogelijk om
activiteitspatronen, die van groot belang zijn voor de
beelden te herkennen. In het kader van het EIDETIC-
ontwikkeling van brein-computerinterfaces. Met behulp
onderzoek zijn technieken en methoden onderzocht die
van automatische leertechnieken zijn deze getraind op
de gebruiker ondersteunen bij het zoeken naar visueel
de visuele kenmerken van een klasse van visuele
materiaal in de context van culturele databases (bijvoor-
objecten (bijvoorbeeld gezichten). In het gebruikers-
beeld een museale database met afbeeldingen van
onderzoek bleek dat de waarneming van de essentie
visuele kunst). Het EIDETIC-project is uniek in haar com-
van een beeld subjectief is, en dat mensen deze gebrui-
binatie van onderzoek naar de gebruikersaspecten en
ken om te bepalen of een beeld is veranderd.
de technische aspecten van het zoeken naar beelden. Highlights
In het gebruikersonderzoek is bepaald op welke wijze
• Publicatie in Image and Vision Computing in 2006.
gebruikers op de meest prettige en efficiënte manier
• Publicatie in Proceedings van de Human Brain Mapping
door grote hoeveelheden visuele gegevens kunnen
conferentie. 33
I2RP Intelligent Information Retrieval and Presentation in Public Historical Multimedia Databases Hoofdaanvrager Prof. dr. Lambert (L.R.B.) Schomaker (RUG)
Het geheugenmodel van Leendert van Maanen verklaart gedrag en kan individuele keuzes voorspellen op basis van feiten uit het geheugen.
34
Uitvoerders Boban (B.) Arsenijevic - promotie 11-10-2006 Yulia (Y.) Bachvarova Stefano (S.) Bocconi - promotie 30-11-2006 Judith (J.D.M.) Grob Zhisheng (Z.) Huang - postdoc Leendert (L.) van Maanen - promotie 14-09-2009 Floris (F.J.) Wiesman -postdoc Looptijd 01-01-2002 tot 01-04-2009 Budget Eur 542.275 voor personele kosten Eur 45.197 voor materiële kosten Partners CUYPERS - Centrum voor Wiskunde en Informatica (CWI) OPTIMA - Rijksuniversiteit Groningen (RUG) GO - Universiteit Maastricht (UM) SPREEKBUIS - Universiteit Leiden (UL)
Afgestemde multimediale gegevens I2RP heeft het ophalen en weergeven van multimediale
worden gehanteerd. Hieruit is een demo voortgekomen.
gegevens, uit bijvoorbeeld digitale museumbestanden,
Op basis van de beschikbaarheid van een semantisch
geoptimaliseerd. Hierbij wordt de informatie op een
netwerk op een historisch onderwerp is het mogelijk
voor de gebruiker afgestemde wijze aangeboden.
gemaakt om niet alleen visuele maar ook gesproken informatie aan de gebruiker te geven. De programma’s
Dit project ontwikkelde oplossingen voor het zoeken
DISC en Vox Populi zijn twee concrete resultaten vanuit
naar multimedia, en voornamelijk voor de integratie
het programma. Zij genereren presentaties, respectieve-
van meerdere facetten in een multimediale zoekcon-
lijk op het gebied van cultureel erfgoed en video’s.
text. Hoewel de prestaties van beeldzoekmachines steeds beter worden, zijn voor een effectief gebruik
Highlights
meer systeemfuncties nodig rondom de kern van een
• Winnaar International Semantic Web Challenge bij het
zoekalgoritme. In het project is gefocust op een dynami-
ISWC 2006.
sche en contextgevoelige weergave van media, die rekening houdt met de eisen van de gebruiker en de limieten van zijn of haar computerplatform. Om de interesses en intenties van de gebruiker te modelleren, is een lerend gebruikersmodel ontwikkeld. Omdat gebruikers hun kennis organiseren op basis van semantiek, was het nodig methoden te ontwikkelen die op een natuurlijke en interactieve wijze semantische categorisatie en reorganisatie van kennis toelaten. Zo is onderzocht in hoeverre tijd als bepalende factor kan 35
VINDIT Combining visual and textual information for information retrieval Hoofdaanvrager Prof. dr. Eric (E.O.) Postma (UvT) Uitvoerders Guido (G.C.H.E.) de Croon - promotie 26-06-2008 Franciscus (F.A.) Grootjen - postdoc Pramod (P.N.) Raikar Menno (M.M.) van Zaanen - postdoc
VindIT heeft de Best Paper Award op European Workshop on Evolutionary Computation in Image Analysis and Signal Processing (EVOIASP) gewonnen.
36
Looptijd 01-11-2002 tot 16-05-2009 Budget Eur 359.815 voor personele kosten Eur 27.228 voor materiële kosten Partners Faculteit Communicatie en Cultuur - Taal- en informatiewetenschap (UvT) Nijmeegs Instituut voor Cognitie en Informatie (RU)
Tekst en beeld gecombineerd Sommige databases bevatten zowel beeld als tekst,
kunnen de resultaten van beide analyses worden
bijvoorbeeld bij musea. VindIT heeft het mogelijk
gecombineerd tot een betrouwbaardere identificatie
gemaakt om in deze databases efficiënt te zoeken
van het interieur van een kasteel. Door het combineren
op beide variabelen.
van informatie uit twee onzekere bronnen wordt nieuwe informatie gegenereerd. Deze kennisveredeling
Met de snelle toename in de omvang van databanken
levert nieuwe informatie op die kan worden gebruikt
wordt het vinden van informatie steeds moeilijker. Het
om de bestaande informatie uit te breiden. Zo wordt
VindIT-project heeft technieken en methoden ontwik-
bijvoorbeeld het schilderij voorzien van metadata,
keld die het de gebruiker gemakkelijker maken om
oftewel gegevens over de inhoud (het schilderij toont
informatie te vinden uit databases die zowel visueel
het interieur van een kasteel).
(bijvoorbeeld schilderijen) als tekstueel materiaal (bijvoorbeeld toelichtingen bij de schilderijen) bevatten.
Highlights
De database van het Rijksmuseum is hier een goed voor-
• Perceptual Recognition Workshop in Maastricht in 2006.
beeld van.
• Het verschijnen van de publicatie ‘Comparing Active Vision Models‘ in Image and Vision Computing in 2009.
In het VindIT-project zijn zowel de afbeeldingen als de tekst automatisch geanalyseerd. Hierbij is gebruik gemaakt van automatische leertechnieken.
Voor alledaagse actie bewegen we onze ogen gemiddeld
Het resultaat van iedere analyse afzonderlijk levert
drie maal per seconde. Voor een computermodel is dit
doorgaans onvolledige informatie op. Zo kan bijvoor-
gedrag moeilijk te vatten. Guido de Croon onderzocht
beeld het resultaat van de visuele analyse zijn dat het
computermodellen die oogbewegingen maken, wat
schilderij een interieur toont. Indien het resultaat van de
onder andere kan leiden tot een grotere inzetbaarheid
tekstuele analyse aangeeft dat het om een kasteel gaat,
en autonomie van kleine robots. 37
POLITIE & JUSTITIE Interview Lambert Schomaker Projectomschrijvingen
39
‘ToKeN heeft het vakgebied een enorme stimulans gegeven‘
40
Forensische schrijveridentificatie Prof. dr. Lambert Schomaker
Informatici van de Rijksuniversiteit Groningen en de Radboud Universiteit zoeken naar manieren om automatische schrijveridentificatie te verbeteren. In het project TRIGRAPH deden zij dat samen met het Nederlands Forensisch Instituut. Projectleider Lambert Schomaker vertelt hoe dat in zijn werk ging.
‘Door de enorme verbetering van beeld- en patroonherkenning kun je de computer inzetten voor taken die je eerst met de hand deed. Bijvoorbeeld om handschriften te onderzoeken‘, zegt Lambert Schomaker van de afdeling Kunstmatige Intelligentie van de RUG. Hij werkt al jaren samen met de afdeling Schriftexpertise van het Nederlands Forensisch Instituut (NFI), en kent de vraagstukken van dichtbij: ‘Het gaat om handgeschreven documenten, variërend van dreigbrieven tot de handtekening onder een hotelrekening. Daarvan wil je de schrijver kunnen identificeren, of kunnen verifiëren dat het geschrevene afkomstig is van iemand van wie je al een schriftmonster bezit.‘
41
Bijzonder
‘Voor mij persoonlijk een bijzonder resultaat, omdat ik
Er bestaan drie methoden voor identificatie en verificatie
vroeger onderzoek heb gedaan naar het motorisch
van handschriften, vandaar de projectnaam TRIGRAPH,
schrijfproces. Hier kwamen mijn twee onderzoeksterrei-
legt Schomaker uit. ‘Je kunt de computer naar de statis-
nen, beeldanalyse en motoriek, onverwacht bij elkaar.’
tiek van kleine onderdelen in het schriftbeeld laten
42
kijken, zoals de textuur van de inkt en de richting en
Uitknippen
kromming van de lijnen. De tweede manier is om losse
Niet alleen de beeldgebaseerde methode is verbeterd,
letters of letterfragmenten door de computer te laten
ook bij het vullen van de tabel met lettervormen is een
vergelijken met een tabel die lettervormen en varianten
grote sprong voorwaarts gemaakt. Dit deel van het
bevat. Bij de derde methode verricht een expert van het
project speelde zich af in Nijmegen. ‘Voorheen werden
NFI handmatig metingen in het schriftbeeld. Binnen het
letters met de hand uitgeknipt; nu scannen we de
onderzoek van TRIGRAPH zijn de eerste twee manieren
handschriften in, waarna de computer de afzonderlijke
verbeterd. Daarnaast hebben we onderzocht wat je met
letters selecteert en deze vergelijkt met prototypes in de
de afzonderlijke methoden kunt bereiken, en of je tot
tabel. Daar is bij elke letter ook te vinden wat de exacte
een beter systeem komt door ze te combineren.’
schrijfvolgorde is‘, zegt Schomaker. ‘Een schrijver wordt
Eerder onderzoek van de RUG leidde in 2004 tot een
gekenmerkt door het specifieke gebruik van lettervor-
beeldgebaseerde methode die een doorbraak betekende.
men. Voor het vergelijken van twee schrijvers gebruiken
Het in Groningen uitgevoerde deel van TRIGRAPH bor-
we statistische methoden en combineren we informatie
duurde daarop voort en leidde tot het inzicht dat de
over textuur en lettervorm.‘ De ontwikkelde methoden
helling en kromming van een handschrift niet alleen
blijken zo krachtig, dat geschiedkundigen ze willen
samenhangen met de schrijfhand, maar ook met de
gebruiken bij hun onderzoek naar oude handschriften.
manier waarop iemand zijn pen vasthoudt. Schomaker:
‘Onze software helpt hen nu om de schrijvers van
oorkondes in tijd en plaats te volgen. Ook proberen
zijn, vertelt Schomaker. ‘We weten nu dat onze statisti-
historici te bepalen hoeveel verschillende personen
sche methoden bruikbaar zijn, maar alleen als je een
de Dode Zeerollen hebben geschreven.‘ Voor zowel
tekst van tenminste honderd letters hebt. Anders kun
paleografisch als forensisch onderzoek bleek beeldver-
je beter een expert inzetten. De lettergebaseerde
betering belangrijk. ‘We hebben de software voor beide
methode met een tabel blijft arbeidsintensief, omdat
beroepsgroepen verbeterd met de optie om vlekken en
de gebruiker op het scherm de letters van het schrift-
kreukels te verwijderen.‘
monster moet herschikken en controleren.’
In een vervolgproject binnen het aandachtsgebied
Hoe kijkt Schomaker terug op het onderzoek? ‘Het
politie en justitie hopen de onderzoekers de bruikbaar-
ToKeN-programma heeft het vakgebied patroonherken-
heid voor forensisch onderzoek verder te vergroten:
ning een enorme stimulans gegeven, omdat we zonder
‘In rechtszaken speelt de verklaarbaarheid van resulta-
ToKeN dit type onderzoek niet hadden kunnen doen.
ten een grote rol: waarom lijken twee schriftmonsters
Het is erg specifiek, en de resultaten zullen niet snel in
op elkaar? Het resultaat van de software laat op dat
het bedrijfsleven inzetbaar zijn. Voor zo’n project krijg
vlak nog te wensen over, de expert moet die uitleg zelf
je niet makkelijk een aanvraag gehonoreerd. Ondanks
opstellen. Ook het inbedden in de werkprocessen van
dat blijken de resultaten toch breed bruikbaar, wat het
een forensisch laboratorium is nog een puzzel. Zo’n ver-
project ook voor de wetenschap geslaagd maakt. In de
volgtraject past goed in het nieuwe NWO-programma
samenwerking met politie en justitie doet zich overigens
Forensic Science.‘
een merkwaardig verschijnsel voor: de hoge werkdruk in dat werkveld vraagt om innovatieve technologie,
Paradox
terwijl men tegelijkertijd vanwege de hoge werkdruk
Gaandeweg is steeds meer helder geworden wat de
niet te teveel wil veranderen. Voor informatici is het een
relatieve voor- en nadelen van de drie benaderingen
uitdaging om die paradox te doorbreken.’
43
ACCESS Agent-based Criminal Court Electronic Support Systems
Hoofdaanvrager Prof. dr. Frances (F.M.T.) Brazier (VU) Uitvoerders Martin (M.) Apistola - postdoc Reinier (R.J.) Timmer Martijn (M.E.) Warnier - postdoc
In het Journal of Software is in maart 2008 de publicatie ‘Security of Distributed Digital Criminal Dossiers‘ verschenen.
44
Looptijd 01-10-2005 tot 01-08-2009 Budget Eur 348.847 voor personele kosten Eur 27.000 voor materiële kosten Partners Rechtbank Amsterdam Raad voor de Rechtspraak
Vinden in een dossier De werkdruk van rechters en officieren van justitie
De omgeving van een digitaal dossier is (semi)gesloten,
wordt lager als ze makkelijk relevante informatie in
waardoor processen en toegang tot data duidelijk
dossiers kunnen vinden. Binnen ACCESS zijn hiertoe de
kunnen worden gedefinieerd. Dit maakte het mogelijk
eerste stappen gezet door het inzetten van software-
om de technische en juridische ontwerpvoorwaarden
agenten, die zelfstandig informatie kunnen beheren en
vast te stellen, en een prototype van een agentsysteem
verwerken.
te implementeren. Nauwe samenwerking met het Openbare Ministerie, de Rechtbank Amsterdam en de
Bij de rechtbanken van Amsterdam en Rotterdam
Raad voor de Rechtspraak bleek hiervoor noodzakelijk.
hebben studies plaatsgevonden over het gebruik van
De resultaten uit het onderzoek kunnen ook worden
digitale dossiers. De digitale beschikbaarheid van de
gebruikt voor algemene technische en juridische
informatie in dossiers bood uitdagingen voor het
aandachtspunten in meer open systemen, zoals in
verbeteren van werkprocessen, waarmee de werkdruk
e-government en medische domeinen.
van rechters en medewerkers bij rechtbank en parket is verlicht. Hiertoe zijn softwareagenten ingezet.
Highlights • Case study tijdens de 3rd International Multiconference
Softwareagenten zijn programma's die zelfstandig
on Computer Science and Information Technology
taken kunnen verrichten, waaronder het (proactief)
(IMCSIT'08) in Wisla, Polen.
beheren en verwerken van informatie in digitale dossiers. Aan het gebruik van softwareagenten zijn wel voorwaarden verbonden, zowel juridisch als technisch. Integriteitsmanagement is een van de belangrijkste
• Een presentatie tijdens de 11th International Conference on Artificial Intelligence and Law (ICAIL'07) in Stanford, USA. • Een workshop tijdens de 2nd International Workshop on
onderdelen van het systeemontwerp: verandert de data
Dependability and Security in e-Government (DeSeGov
tussentijds niet en verlopen de processen zoals bedoeld.
2007) in Wenen, Oostenrijk. 45
ANITA ANITA: Administrative Normative Information Transaction Agents Hoofdaanvrager Dr. mr. Kees (C.N.J.) de Vey Mestdagh (RUG)
Het onderzoek van Wouter Teepe (RUG), in het kader van ToKeN, kreeg veel aandacht in de pers; onder andere in de Staatscourant, De Volkskrant, NRC Handelsblad, NOS Radio1 en in een stuk van de Eerste Kamer.
46
Uitvoerders Huib (H.M.) Aldewereld - promotie 04-06-2007 Pieter (P.) Dijkstra - promotiedatum n.n.b. Hugo (H.H.) Kielman - promotiedatum n.n.b. Wouter (W.I.) Koelewijn - promotie 04-11-2009 Evgueni (E.N.) Smirnov - postdoc Pieter (P.H.M.) Spronck - postdoc Wouter (W.) Teepe - promotie 18-01-2007 Looptijd 01-11-2002 tot 19-06-2008 Budget Eur 477.457 voor personele kosten Eur 29.990 voor materiële kosten Partners Koninklijke Landelijke Politie Dienst (KLPD)
Privacy bij de politie Het ANITA-project heeft om een normatief multi-
gegevens en bepaalt welke verzoeken om informatie
agentsysteem ontwikkeld voor de toepassing van het
worden gehonoreerd op grond van regels voor informa-
privacyrecht in gedistribueerde databaseomgevingen,
tie-uitwisseling, bijvoorbeeld privacyregels en
zoals bij de politie.
privacybeleid. Zoekagenten en poortwachteragenten onderhandelen samen over het vrijgeven van bepaalde
In veel computernetwerken is informatie en de (juridi-
informatie. Een van de charmes van deze technologie is
sche en technische) kennis voor de verwerking van die
dat er parallellen zijn met de menselijke communicatie
informatie gedistribueerd aanwezig en aan voortdu-
en taakverdeling. Binnen het ANITA-project is de juridi-
rende verandering onderhevig. Dit is onder andere het
sche kennis geïnventariseerd waarover deze agenten
geval bij de politie. Informatie wordt hier uitgewisseld
moeten beschikken en zijn formele en technische
onder de beperkingen van het privacyrecht en de beper-
modellen uitgewerkt voor de toepassing van deze ken-
kingen vanuit het lokale beleid, zoals de bescherming
nis in multi-agentsystemen. De resultaten kunnen onder
van lokale informanten. Er is geen centraal punt waar
andere worden toegepast in de rechtspraktijk.
alle informatie en (lokale) kennis toegankelijk zijn. Er bestaat wel behoefte aan het uitwisselen van informatie
Highlights
over het netwerk, maar een enkel centraal opererend
• Door een eigen bijdrage van de RUG leidt het project tot
computerprogramma kan dit probleem niet oplossen. Intelligent agents wisselen min of meer autonoom en
vijf in plaats van drie promoties. • Het onderzoek zorgt voor veel wetenschappelijke spin
op grond van eigen (lokale) kennis informatie uit in een
off. Zo is er vervolgonderzoek gaande op het gebied van
computernetwerk. Een zoekagent gaat op basis van de
norm based agent negotation, onder andere resulterend
informatiebehoefte van zijn menselijke gebruiker in het
in de bijdrage ‘An implementation of norm-based agent
netwerk op zoek naar bepaalde informatie. Een poort-
negotiation’ tijdens de 11th International Conference on
wachteragent beheert een lokale database met
Artificial Intelligence and Law in Stanford in 2007. 47
BEST Intelligent disclosure of case-law using Semantic Web technology to determine BATNAs in damages disputes Hoofdaanvrager Dr. Arno (A.R.) Lodder (VU)
Op het terrein van EBay in San Jose is een workshop georganiseerd ter gelegenheid van de 4th International Workshop on Online Dispute Resolution in juni 2007.
48
Uitvoerders Rinke (R.J.) Hoekstra - postdoc Michel (M.C.A.) Klein - postdoc Rory (R.L.L.) Sie Wouter (W.) van Steenbergen Heiner (H.) Stuckenschmidt - postdoc Elisabeth (E.M.) Uijttenbroek Looptijd 01-02-2005 tot 01-01-2011 Budget Eur 340.049 voor personele kosten Eur 10.000 voor materiële kosten Partners Leibniz Center for Law Rechtenfaculteit van de UvA
Mediation of een proces? De keuze tussen een rechtszaak en mediation wordt
toepassingsdomein door het open karakter van het
meestal gemaakt op basis van de verwachte uitkomst
recht en een gebrek aan een bruikbare ontologie.
van een gerechtelijke procedure. BEST ontwikkelde een
Een ontologie verschilt van een databank doordat een
model waardoor een consument beter de keuze kan
ontologie niet alleen feiten bevat maar ook regels,
maken.
gevat in logische formules. Uit dergelijke regels zijn nieuwe feiten af te leiden.
Door het toenemend aantal zaken is de druk op de rechterlijke macht groot en staan alternatieve vormen
Concrete resultaten zijn onder andere een website met
van geschillenbeslechting, in het bijzonder mediation,
de mogelijkheid voor leken om in hun eigen woorden
in de belangstelling. Voor de keuze tussen een rechts-
een verhaal in te voeren en een website met gangbare
zaak en mediation is informatie over de waarschijnlijke
begrippen uit de jurispudentie. Verder is een vergelij-
uitkomst van een gerechtelijke procedure relevant. Deze
king tussen de ontologie van leken en juristen gemaakt
informatie wordt in de juridische onderhandelingslitera-
en de invoering hiervan in het programma Protegé.
tuur Best Alternative To a Negotiated Agreement (BATNA) genoemd.
Highlights • De organisatie van de ‘Workshop on Semantic Web
Binnen de informatica was het niet mogelijk om op basis van relevante jurisprudentie nauw verwante
technology for Law‘ te Stanford in 2007. • Een bijdrage ‘Retrieval of Case Law to Provide Layman
documenten te vinden in rechterlijke uitspraken. In dit
with Information about Liability: Preliminary Results of
project is hiervoor de techniek toegepast van ontology-
the BEST-project‘ aan het boek ‘Computable models of
based search en navigation.
the law‘ van Casanovas.
Het juridische domein in het algemeen en schadevergoedingsrecht in het bijzonder, vormt een uitdagend
• Lancering van een experimental portal met een basisset aan juridische begrippen in juni 2009. 49
CASSANDRA Context-Aware SenSing for AggressioN Detection and Risk Assessment Hoofdaanvrager Prof. dr. Dariu (D.M.) Gavrila (UvA) Uitvoerders Martijn (M.) Liem - promotiedatum n.n.b. Julian (J.F.P.) Kooij - postdoc Johannes Dirk (J.D.) Krijnders - promotiedatum n.n.b. Wojciech (W.P.) Zajdel - postdoc
Tijdens SIREN (Scientific ICT Research Event Netherlands) is door NWO Exacte Wetenschappen de I/O Award 2007 uitgereikt aan Dariu Gavrila, voor de beste publiciteit rondom ICT-onderzoek.
50
Looptijd 01-09-2005 tot 01-10-2010 Budget Eur 384.311 voor personele kosten Eur 24.000 voor materiële kosten Partners Leibniz Center for Law Rechtenfaculteit van de UvA
Detectie van agressie Binnen CASSANDRA is een intelligent bewakingssys-
met beelden die vanuit een bewakingsoogpunt moge-
teem onderzocht dat agressieve situaties in publieke
lijk relevant zijn. Omdat de aanloop naar openlijke
ruimtes herkent. In een realistische, drukke omgeving
agressie moeilijk is te detecteren, zijn binnen CASSAN-
worden posities en bewegingen van de aanwezige
DRA zowel beelden als geluiden geanalyseerd.
mensen en het omgevingsgeluid geanalyseerd, om bij
Voor de beeldanalyse zijn de posities en bewegingen
gevaar een operator in de controlekamer te kunnen
van personen van belang. Voor de geluidsanalyse is een
waarschuwen.
verzameling relevante geluiden gedefinieerd, zoals
Door het toenemende belang van publieke veiligheid
gelegd tussen het beeld en geluid, waarbij kennis van
worden cameratoezichtsystemen steeds vaker ingezet
de toepassingsomgeving is betrokken. Dit heeft
voor het beveiligen van stations, winkelcentra, hang-
uiteindelijk geresulteerd in een realistische veldtest op
plekken, enzovoorts. Bij traditionele cameratoezicht-
het Amsterdam-Amstel station.
geschreeuw en brekende objecten. Vervolgens is de link
systemen speurt een menselijke uitkijker in een controlekamer naar een muur van beeldschermen. Dit
Highlights
is niet alleen duur, maar ook foutgevoelig.
• CASSANDRA werd in verschillende krantenartikelen
Vandaar de roep om slimme camera's. Camera’s die niet
(NRC, de Volkskrant) genoemd, en verscheen KRO’s
slechts kijken, maar ook zien. Zelfdenkende ogen, die
programma ‘De Toekomst is Nu’ (April 2008).
op eigen houtje de beelden kunnen selecteren die de moeite van het bekijken waard zijn. Zodat de bewakers
• Op de IEEE International Conference on Advanced Video and Signal-Based Surveillance (AVSS’07) in Londen heeft
in de controlekamer daar hun aandacht op kunnen
het artikel ‘CASSANDRA: audio-video fusion for aggres-
richten.
sion detection’ de Best Paper Award gewonnen.
Geavanceerde bewakingssystemen kunnen beschikbare informatie verrijken door de uitkijker slechts te voorzien 51
DALE Data Assistance for Law Enforcement
Hoofdaanvrager Dr. Walter (W.A.) Kosters (UL) Uitvoerders Tim (T.K.) Cocx - promotie 02-12-2009 Jeroen (J.F.J.) Laros - promotie 21-12-2009 Looptijd 01-03-2005 tot 01-05-2009
In verschillende jaren is een bijdrage geleverd aan de Belgium-Netherlands Conference on Artificial Intelligence (BNAIC) en de Industrial Conference on Data Mining (ICDM).
52
Budget Eur 320.058 voor personele kosten Eur 10.000 voor materiële kosten Partners Koninklijke Landelijke Politie Dienst (KLPD)
Data in de strijd tegen criminaliteit In de strijd tegen criminaliteit worden enorme data-
iemand die 100 fietsen steelt en iemand die er 101
bases doorzocht naar patronen. Door de inzet van
steelt. Dit verschil is gemodelleerd.
data mining is dit binnen het DALE-project mogelijk
Tevens is een raamwerk ten behoeve van data mining
gemaakt.
voor wetshandhaving gecreëerd op basis van werkelijke problemen uit het toepassingsgebied en in samenwer-
Het hoofddoel binnen DALE was het vinden van begrij-
king met domeinexperts. Criminele carrières zijn met
pelijke patronen in een enorme hoeveelheid informatie.
elkaar vergeleken om voorspellingen te doen over het
Een dergelijke zoektocht is onder andere onmisbaar
verdere verloop daarvan.
voor de wetshandhaving, in het bijzonder voor
Tot slot is het automatisch detecteren van misbruik op
crimineel onderzoek, en nog specifieker in de strijd
websites van sociale netwerken onderzocht. De wens
tegen het terrorisme. Het onderzoek richtte zich op
van geheimhouding, cruciaal bij veel activiteiten binnen
semigestructureerde data en basispatronen.
de wetshandhaving, en de wens van openbaarheid van
Databases op het gebied van wetshandhaving zijn
onderzoeksresultaten blijven echter op gespannen voet
doorgaans erg groot, en bevatten gegevens van vrije
met elkaar staan.
en veranderende formaten. De data zijn tijdelijk, dynamisch en vol ruis. En om het geheel nog ontoe-
Highlights
gankelijker te maken wordt informatie vaak ook nog
• Het verzorgen van een workshop ‘Enhancing the Auto-
gemaskeerd.
mated Analysis of Criminal Careers‘, op het gebied van
Binnen het doorzoeken van de databases staan
Link Analysis, Counterterrorism, and Security (LATCS),
afstandsmaten centraal. Ter illustratie, het verschil
tijdens de SIAM International Data Mining Conference in
tussen een persoon die geen fietsen steelt en iemand
2008 in Atlanta.
die er 1 heeft gestolen is groter dan het verschil tussen
53
EVIDENCE Making sense of EVIDENCE: software support for crime investigations Hoofdaanvrager Prof. dr. mr. Henry (H.) Prakken (UU) Uitvoerders Floris (F.J.) Bex - promotie 29-10-2009 (cum laude) Susan (S.W.) van den Braak - promotie 15-03-2010
Het artikel ‘Formalising Argumentative Story-based Analysis of Evidence’ heeft de Don Berman Award for Best Student Paper op de 11th International Conference on Artificial Intelligence and Law (ICAIL 2007) gewonnen.
54
Looptijd 01-03-2005 tot 16-06-2009 Budget Eur 320.058 voor personele kosten Eur 32.000 voor materiële kosten
Gekoppelde media Rechercheonderzoek is een ingewikkeld en intensief
De software stelt rechercheurs in staat om zowel hun
proces, waarbij fouten ernstige gevolgen kunnen
hypotheses te formuleren als hun scenario's van wat er
hebben. EVIDENCE onderzocht software waarmee
gebeurd zou kunnen zijn. Dit sluit aan bij recente theo-
rechercheurs beter overzicht krijgen van een complexe
rieën dat dit de meest praktisch werkbare manier is om
zaak en waarmee een onderzoeksdossier inzichtelijker
een grote hoeveelheid bewijs te structureren. Dit inzicht
wordt voor latere fases van een onderzoek.
is nader uitgewerkt in een theoretisch deelonderzoek naar de verankering van scenario's in het beschikbare
De ontwikkelde software helpt rechercheurs om hun
bewijs door middel van evidentiële redeneringen.
denken over een zaak in kaart te brengen en de denkpatronen vervolgens met hulp van de computer te
Highlights
analyseren. Zo kan een rechercheur op basis van het ver-
• Het artikel ‘Sense-making software for crime investiga-
zamelde bewijs hypotheses opstellen en gestructureerd aangeven hoe het bewijs de hypotheses ondersteunt dan wel in twijfel trekt. Met hulp van een computer
tion: how to combine stories and arguments?‘ is in het journal Law, Probability & Risk gepubliceerd in 2007. • Een ‘Workshop on Reasoning about Legal Evidence’
kan de rechercheur zo'n structurering visualiseren en
tijdens de 23rd World Congresses on Philosophy of Law
analyseren en zo patronen, inconsistenties of ontbre-
and Social Philosophy in Krakow in augustus 2007.
kend bewijs ontdekken. Doordat de structurering wordt verbonden met het oorspronkelijke onderzoeksdossier, kunnen anderen in latere fases van een onderzoek beter inzicht krijgen in het dossier.
55
IPOL Intelligence led policing. An effective law enforcement strategy or a threat to civil liberties and the principles of criminal law? Hoofdaanvrager Prof. mr. Theo (Th.A.) de Roos (UvT) Uitvoerders Stijn (S.) Vanderlooy - promotie 01-07-2009 Thijs (T.) Vis - promotiedatum n.n.b. Looptijd 01-09-2005 tot 01-09-2009
Stijn Vanderlooy is gepromoveerd op digitale data-analyse binnen de wetshandhaving, waarmee hij kan voorspellen of iemand een terrorist is.
56
Budget Eur 320.058 voor personele kosten Eur 15.000 voor materiële kosten
Privacygevoelige ICT profielen Het inzetten van door ICT gegenereerde profielen en
is antwoord gegeven op de volgende vragen. Wat is
analyses blijft lastig binnen de politie. Aan de ene kant
de stand van zeken op het gebied van intelligence led
moet de privacy worden gewaarborgd en aan de
policing in Nederland en Europa? Hoe is de verhouding
andere kant vormt de bescherming van de privacy een
tussen privacybeginselen en beginselen van het straf-
obstakel om de juiste analyses te doen. Binnen IPOL is
recht? Moeten deze beginselen worden aangepast aan
onderzocht welke ICT middelen wel effectief kunnen
de noden van de tijd? Hoe ver is intelligence led policing
worden ingezet.
in de Verenigde Staten ontwikkeld, en hoe wordt daar omgegaan met de balans tussen veiligheid, privacy en
In Nederland wordt het sturingsconcept 'informatie-
de beginselen van het strafrecht? Welke ICT-middelen
gestuurde opsporing' steeds verder doorgevoerd. De
dienen aanwezig te zijn alvorens intelligence led poli-
ontwikkeling ging echter voorbij aan de fundamentele
cing op verantwoorde wijze kan worden ingezet?
vragen over de toepasbaarheid binnen ons strafrechts-
Bijzondere aandacht is besteed aan de relatie tussen de
systeem, bijvoorbeeld waarborgen tegen inbreuk op de
proactieve rechercheactiviteiten van de politie en de
persoonlijke levenssfeer. Anderzijds lieten privacy- en
werkzaamheden van de inlichtingendiensten, mede in
strafrechtelijke bezwaren geen ruimte voor nieuw
historisch perspectief.
beleid. Complicerende factor hierbij is dat de mensen laag in de politieorganisatie de meeste discretionaire
Highlights
bevoegdheden hebben, en is er geen strakke hiërarchi-
• Bijdrage aan het boek ‘intelligence led policing ontleed‘
sche controle.
in 2005. • Publicatie ‘Veranderingsprocessen bij politie: intelligence
Een onderdeel van intelligence led policing helpt de
led policing‘ in het journal Panopticon: tijdschrift voor
politie in haar opsporingswerk met een proactieve
strafrecht, criminologie en forensisch welzijnswerk in
handhaving middels profielen en analyses. Binnen IPOL
2008. 57
LAYLA The Laymans Legal Assistant: Assisting consumers in businessconsumer conflicts by diagnosing, advising and mediating Hoofdaanvrager Prof. dr. Ronald (R.E.) Leenes (UvT) Uitvoerders Michiel (M.) van Galen Laura (L.) Klaming - postdoc Jelle (J.) van Veenen - promotiedatum n.n.b.
Elementen van het binnen Layla ontwikkelde model zijn toegepast in onder andere de rechtwijzer (www.rechtwijzer.nl, 7500 bezoekers per maand).
58
Looptijd 15-03-2005 tot 15-03-2009 Budget Eur 234.095 voor personele kosten Eur 18.500 voor materiële kosten Partners Raad voor de Rechtsbijstand
Zelf geschillen oplossen Hoe kan je als consument een geschil oplossen, zonder
De communicatie tussen partijen is van groot belang.
dat je meteen kosten maakt voor juridische bijstand?
Layla maakt een constructief communicatieproces
Het Layla-project ontwikkelt een model voor geschil-
mogelijk, waarbij partijen zakelijk praten over hun
oplossing op basis van integratief onderhandelen. Hoe
geschil, maar waarin ook ruimte is voor emoties. Layla
kan een consument worden ondersteund in het zelf aan
zorgt voor beter geïnformeerde consumenten die een
de slag gaan? Welke informatie heeft iemand nodig om
realistisch beeld hebben ten aanzien van de mogelijk-
sterk te staan, en hoe wordt deze informatie gebruikt?
heden hun geschil op te lossen. Zij realiseren deze oplossing zoveel mogelijk met behulp van ODR in plaats
Mensen weten vaak niet waar ze juridisch aan toe zijn
van met een beroep op de rechter.
wanneer ze een geschil krijgen met een ander. Hierdoor zien sommigen ervan af hun recht te halen, terwijl
Highlights
anderen hun geschil onverantwoord en tegen relatief
• Er is een innovatief model ontwikkeld voor het online
hoge kosten doorzetten tot aan de rechter. Dit terwijl
oplossen van geschillen.
alternatieve methoden, zoals Alternative Dispute Reso-
• Samenwerking met de praktijk.
lution (ADR) en Online Alternative Dispute Resolution
• Er is fundamenteel empirisch onderzoek uitgevoerd naar
(ODR), beschikbaar zijn.
de effecten van informatie in online onderhandeling. Twee publicaties kwamen hieruit voort: ‘I want the oppo-
Online hulpmiddelen op basis van integratief onderhan-
site of what you want: Reducing fixed-pie perceptions in
delen zijn ontwikkeld. Hierin is aandacht voor het
online negotiations‘ in het Journal of Dispute Resolution,
proces (hoe kan je het beste met een tegenpartij
en een publicatie in ontwikkeling ‘Facilitating Dispute
praten? Wat moet je zeggen?) en voor de benodigde
Resolution: Do People Use Objective Criteria When They
kennis (wat is het geschil je waard? Wat is een normale
Negotiate Outcomes?‘.
oplossing voor dit probleem?). 59
TRIGRAPPH tri-modal writer identification
Hoofdaanvrager Prof. dr. Lambert (L.R.B.) Schomaker (RUG) Uitvoerders Ralph (R.M.J.) Niels - promotiedatum n.n.b. Axel (A.A.) Brink - promotiedatum n.n.b. Looptijd 16-01-2005 tot 01-12-2009
Het programma heeft de bijdrage ‘Towards explainable writer verification and identification using vantage writers‘ geleverd aan de 9th International Conference on Document Analysis and Recognition (ICDAR’07).
60
Budget Eur 328.051 voor personele kosten Eur 16.000 voor materiële kosten Partners Nederlands Forensisch Instituut (NFI)
De schrijver ontmaskerd Binnen TRIGRAPH is gewerkt aan computerprogramma’s
methoden heeft een belangrijke verbetering teweeg-
om handschriften in grote databases te herkennen.
gebracht in forensische schrijveridentificatie.
Niet alleen op basis van het schriftbeeld, maar ook door
Inzichten uit de automatische herkenning van tekst en
middel van patroonherkenning en beeldbewerking.
de daarbij gebruikte letterprototypes zijn toegepast bij schrijveridentificatie: er wordt kwantitatief bepaald
In het licht van toenemende terroristische dreigingen en
welke lettervormen door een schrijver worden gebruikt.
de ontwikkeling van witteboordencriminaliteit, wordt
Zo kan er automatisch worden gezocht naar documenten
forensisch onderzoek naar automatische schrijveridentifi-
met een stijlspecifieke verzameling van lettervormen.
catie steeds belangrijker. Bestaande systemen voor het
De deelnemende instituten hebben al veelbelovende
automatisch identificeren van een schrijver op basis van
resultaten bereikt in de berekening van een schriftbeeld
een schriftmonster waren voor grote verbetering vatbaar.
op basis van beeldkenmerken.
Het onderzoek vertaalt kennis uit de forensisch, grafonomisch, cognitief en informaticaonderzoek naar werkende
Highlights
en bruikbare computerprogramma's door de integratie
Drie publicaties in de IEEE Transactions. on Pattern Analysis
van kennis over ‘machinale intelligentie’, menselijke
and Machine Intelligence (PAMI):
cognitie, forensische expertise en menselijk schrijfgedrag.
• ‘Writer Identification and Verification Using Textural
Traditionele schrijveridentificatie is gebaseerd op handmatige metingen in het schriftbeeld, maar de toegenomen rekenkracht en ontwikkelingen op het gebied
and Allographic Features‘ in een speciale uitgave over ‘Biometrics: Progress and Directions‘ • ‘Automatic writer identification using connected
van beeldbewerking en patroonherkenning maken het
component contours and edge based features of
mogelijk om automatisch beeldkenmerken en letter-
uppercase Western script‘
vormen te gebruiken in grootschalige zoekprocessen in beeldbestanden. De combinatie van de drie hoofd-
• ‘Automatic allograph matching in forensic writer identification‘ 61
62
ZORGSECTOR Interview Ameen Abu-Hanna Projectomschrijvingen
63
‘Informatici en artsen vullen elkaar prima aan‘
64
Optimaal benutten van informatie op de IC
Dr. Ameen Abu-Hanna
In het project I-CATCHER werkten informatici samen met artsen van de afdeling Intensive Care om informatieproblemen op te lossen. Projectleider Ameen Abu-Hanna van de afdeling Klinische Informatiekunde van het AMC aan het woord.
Op een afdeling Intensive Care (IC) is informatie letterlijk van levensbelang. Patiënten worden daarom 24 uur per dag door allerlei apparatuur gemonitord. ‘Dat resulteert in enorme databases en de vraag is hoe je daar iets zinnigs uit kunt halen om de kwaliteit van intensieve zorg te verbeteren’, zegt Ameen Abu-Hanna. ‘Zijn er patronen in te herkennen, waardoor je eerder kunt ingrijpen als het met een patiënt slechter gaat? Kun je modellen ontwikkelen om mortaliteit te voorspellen?’ Data mining was dan ook een van de onderzoekslijnen van het project I-CATCHER, dat tussen 2003 en 2007 door twee postdocs en een aio van UMC/UvA en VU is uitgevoerd.
65
Automatisch matchen
eerste‘, vertelt Abu-Hanna. ‘Het leuke is dat zo’n match-
De andere onderzoekslijn van I-CATCHER had betrek-
ingsalgoritme ook andere toepassingsmogelijkheden
king op de gebruikte terminologie in de zorg.
heeft. Je kunt een arts bij het intypen van de opnamere-
‘Ziekenhuizen gebruiken verschillende vocabulaires om
den alternatieven aanbieden, waardoor de kwaliteit van
ziekten, of in ons geval redenen voor IC-opname, te
data-invoer sterk verbetert. Ook kun je de begrippenlijst
beschrijven. Het gebrek aan een gemeenschappelijke
van een ziekenhuis of afdeling op kwaliteit beoordelen:
taal maakt het lastig op een hoger niveau data te analy-
door deze te matchen met een standaardlijst is te zien
seren, bijvoorbeeld om patiënten te selecteren voor een
of de lijst compleet en voldoende specifiek is.‘
studie. We hebben daarom algoritmes ontwikkeld om
66
termen automatisch te matchen.‘ Dat gebeurde met
Data mining
behulp van de vocabulaires van het OLVG en het AMC,
Het eerdergenoemde data mining-deelonderzoek
die op twee manieren zijn gematcht: door naar over-
leverde ook mooie resultaten op, vindt Abu-Hanna.
eenkomsten in de woorden te zoeken en door het
‘Op een IC wordt dagelijks per patiënt van zes organen
gebruik van achtergrondkennis. Deze achtergrondken-
bijgehouden hoe goed zij functioneren. Dat levert een
nis bestond uit de hiërarchische indeling van het
score per orgaan en een totaalscore op. In deze scores
AMC-vocabulaire. Het algoritme kan daarmee aan woor-
hebben we naar patronen gezocht, bijvoorbeeld de
den betekenis toekennen, waardoor bijvoorbeeld aorta
verandering van de nierfunctie op drie opeenvolgende
gematcht wordt met slagader. ‘We hebben getest welk
dagen. Onze modellen gebruiken die patronen, naast
algoritme het beste werkt door een arts van het AMC
andere patiëntgegevens, om per dag per patiënt een
bij tweehonderd termen handmatig te laten aangeven
prognose – de kans op overlijden in IC of ziekenhuis –
welke bij elkaar horen. Het tweede algoritme scoort op
op te stellen. Zulke voorspellingen geven inzicht in de
een dergelijke Gouden Standaard veel beter dan het
patiëntenpopulatie en je kunt ze gebruiken om artsen,
patiënten en hun familieleden te informeren. Tot nu toe
Prettige samenwerking
gaan artsen vooral op hun eigen kennis en ervaring af;
De samenwerking tussen informatici en artsen verliep
het zou interessant zijn om te onderzoeken of een arts
heel prettig, vindt Abu-Hanna. ‘We vullen elkaar prima
anders handelt als hij de prognose van het model te
aan: informatici zitten vol ideeën voor allerlei – soms
zien krijgt. Stelt hij zijn eigen inschatting bij, welk effect
wilde – toepassingen, terwijl de Intensive Care arts het
heeft dat op zijn beslissingen en gaat hij anders met
vooral praktisch wil houden. Dat geeft ons sturing en
patiënten en hun familie communiceren? Dat willen we
maakt wat we doen zeer zinnig. Een uitdaging voor
graag verder onderzoeken.’
informatici in de zorg is het grote verschil tussen beide
Ook is gezocht naar patronen in orgaanfalen op opeen-
disciplines: het kost tijd om elkaar te begrijpen. Dit
volgende dagen. ‘Als de ademhaling van een patiënt op
project heeft voor mij de belangrijke rol van de klinische
dag twee faalt, wat kun je dan op dag drie bij hem ver-
informatica weer eens bevestigd.‘ Lastig aan dit soort
wachten? Blijft de situatie stabiel of zet er een nieuw
interdisciplinaire onderzoeken, vertelt Abu-Hanna
orgaanfalen in?’, legt Abu-Hanna uit. De nieuwe model-
tot slot, is dat er zo moeilijk geld voor te vinden is
len maken voor intensivisten de relaties tussen het falen
vanwege de traditionele segregatie tussen de discipline-
van het ene orgaansysteem en het andere duidelijk.
gebonden subsidiegevers. ‘Juist daarom was het ToKeN-
Voor zowel het voorspellen van mortaliteit als van
programma zo waardevol‘, zegt hij.
orgaanfalen op de volgende dag zijn de modellen gevalideerd door ze te vergelijken met wat er werkelijk gebeurde. ‘De gebruikte technieken blijken opvallend veel meerwaarde te bieden, omdat we de artsen daarmee patronen kunnen tonen.’
67
I-CATCHER Intensive-Care Acces to Terminology & Course of Health Exploration & Retrieval Hoofdaanvrager Dr. Ameen (A.) Abu-Hanna (AMC)
Vanuit I-Catcher is een vervolgproject opgestart om de voorspellende modellen op temporele patronen toe te passen in twee Intensive Care Units in Nederland.
68
Uitvoerders Edwina (E.) Beirne Michel (M.C.A.) Klein - postdoc Niels (N.B.) Peek - postdoc Antoon (A.K.) Prins Winston (W.G.) Tjon Sjoe Sjoe Tudor (T.) Toma Looptijd 01-10-2003 tot 01-10-2007 Budget Eur 409.265 voor personele kosten Eur 13.614 voor materiële kosten Partners Klinische Informatiekunde (AMC) Sectie Kunstmatige Intelligentie (VU)
Inzicht in de Intensive Care I-CATCHER leverde methoden voor de IC-afdeling van
reerde terminologie op een gestructureerde termino-
een ziekenhuis om terminologiesystemen met elkaar te
logie over opnameredenen af te beelden. Hiervoor is
vergelijken en om voorspellende temporele patronen in
gebruik gemaakt van semantic webideeën.
data te ontdekken. Voorspellende modellen: Over iedere IC-patiënt worden Intensieve zorg is een complexe en kostbare vorm van
dagelijks vele gegevens verzameld, waaruit voorspel-
medische zorgverlening, waarin het optimaal benutten
lende modellen zijn geïnduceerd. Het eerste model
van de beschikbare informatie en kennis cruciaal is.
voorspelt elke dag voor elke patiënt de kans op zieken-
Informatiemanagement wordt in de moderne IC-afdeling
huismortaliteit door het identificeren van temporele
ondersteund door ICT-hulpmiddelen zoals het Elektro-
patronen die vervolgens zijn gebruikt als variabelen in
nisch Patiënten Dossier (EPD). Binnen I-CATCHER zijn
een logistisch regressiemodel. Het tweede model voor-
twee nieuwe informatiemanagementfuncties onder-
spelt elke dag de kans op orgaanfalen op de volgende
zocht. Allereerst het afbeelden van een terminologie op
dag. Hiervoor zijn Markov-modellen gebruikt.
een andere terminologie met achtergrondkennis, en ook het voorspellen van ongunstige gebeurtenissen (zoals
Highlights
mortaliteit en orgaanfalen) met temporele patronen.
• Gastpresentaties zijn gehouden tijdens ICT-Delta (2007), het NWO-congres Digitalisering en Informatisering
Terminologiesystemen: Veel medische kennis is gebaseerd op een uitgebreid medisch-biologisch vocabulaire waarin ziekten, symptomen en behandelingen zijn beschreven. Er zijn vele terminologiesystemen in
(2005), en de Token workshop tijdens het MIC (2003). • I-Catcher heeft 37 bijdragen geleverd aan internationale conferenties. • Twintig publicaties op het gebied van (medische) infor-
omloop, die verschillen in gebruikte termen en structuur.
matica en geneeskunde zijn verschenen in internationale
Met behulp van achtergrondkennis is een niet-gestructu-
tijdschriften. 69
DIME Distributed Interactive Medical Exploratory for 3D Medical Images Hoofdaanvrager Prof. dr. ir. Hans (J.H.C.) Reiber (LUMC) Uitvoerders Lilit (L.) Axner - promotie 18-12-2007 Jan-Maarten (J.M.) Luursema - promotiedatum n.n.b. Jorrit (J.) Schaap -postdoc
Interview met Lilit Axner op IPN-website (www.ictonderzoek.net) en in I/O Magazine.
70
Looptijd 01-10-2002 tot 01-01-2008 Budget Eur 359.815 voor personele kosten Eur 19.114 voor materiële kosten Partners Universiteit van Amsterdam (UvA) Leids Universitair Medisch Centrum (LUMC) Universiteit Twente (UT)
Bereken de doorbloeding In het kader van DIME is software ontwikkeld waarmee,
omleidingen (bypasses) op de doorbloeding te bepalen.
op basis van 3D scans, de anatomie van en de bloed-
Dit is gedaan voor beelden van de grotere slagaders,
stroming door vaten wordt berekend. Ook kan het effect
met name van de abdominale aorta, gebaseerd op
van omleidingen op de doorbloeding worden bepaald.
nieuwe internetontwikkelingen in transparante datadistributie met behulp van de gridtechnologie, 3D
Sinds enkele jaren is de ontwikkeling, de research en
beeldanalyse en virtual reality.
het klinisch gebruik van moderne medische scanners in een stroomversnelling geraakt. Deze scanners leveren
Een trainingssysteem voor jonge chirurgen is opgezet
een zeer grote hoeveelheid driedimensionale (3D)
om voor een operatie een operatieplan vast te stellen.
beeldgegevens over de anatomie van het menselijk
De focus lag hierbij niet alleen op het aanleren van han-
lichaam en de functies van organen. In de huidige
delingen, maar ook op het leerproces dat de chirurgen
klinische praktijk wordt nog maar in zeer beperkte mate
doormaken. Onder andere de leercurves van chirurgen
gebruik gemaakt van de beschikbare 3D informatie,
zijn in kaart gebracht.
aangezien de medisch specialisten hun beslissingen nog steeds voornamelijk baseren op de visuele beoordeling van de afzonderlijke tweedimensionale doorsneden. Informatica Lilit Axner heeft samen met collega's de
Om deze gegevensstromen optimaal te benutten is
HemoSolve ontwikkeld, een computersysteem dat de
computersoftware nodig, die de specialist in staat stelt
bloedstroom in slagaderen kan simuleren. Daarnaast kan
om gegevens in 3D te beoordelen en om objectieve
het chirurgische ingrepen als een bypassoperatie naboot-
gegevens uit de beelden af te leiden. Binnen DIME is
sen en het succes van deze ingreep bepalen. HemoSolve
software ontwikkeld om de anatomie en de bloeddoor-
kan worden gebruikt voor de planning van operaties of
stroming door vaten te berekenen, en het effect van
voor de training van artsen. 71
MIA Medical Information Agent
Hoofdaanvrager Prof. dr. ir. Arie (A.) Hasman (AMC) Uitvoerders Loes (L.M.M.) Braun - promotie 29-10-2008 Agnieszka (A.A.) Latoszek-Berendsen promotiedatum n.n.b. Ivan (I.B.) Vermeulen - promotiedatum n.n.b.
Loes Braun won de ToKeN Best Oral Presentation Award 2006 en de Best Poster Award tijdens de European Coordinating Committee for Artificial Intelligence (ECAI’07).
72
Looptijd 01-12-2002 tot 01-02-2009 Budget Eur 389.637 voor personele kosten Eur 32.334 voor materiële kosten Partners Instituut voor Kennis en Agent Technologie (UM) Medische Informatica (UM) Computational Intelligence and Multi-agent Games (CWI) Klinische Informatiekunde (AMC)
Relevante informatie over chronische patiënten Het MIA-project kende twee doelen. Ten eerste onder-
met betrekking tot de patiënt. Artsen hebben vaak
steunt MIA de arts bij het nemen van betere medische
onvoldoende tijd om relevante literatuur op te zoeken.
beslissingen. Ten tweede worden afspraken gemaakt die
Door gebruik te maken van het elektronisch patiënten-
efficiënter zijn voor zowel de patiënten als de ziekenhuis-
dossier kan de retrievalagent bepalen wat de mogelijke
afdelingen.
informatiebehoefte van de arts is, en zelfstandig op zoek gaan naar relevante literatuur. Uit evaluatie bleek
Het MIA-project onderzocht hoe softwareagenten
dat deze agent prima in staat is relevante informatie-
kunnen worden ingezet. Zo'n agent is een computer-
behoeften te formuleren, en in beperktere mate daarbij
programma dat namens een menselijke gebruiker
ook relevante literatuur te vinden.
bepaalde taken zelfstandig kan uitvoeren. De eerste persoonlijke agent is de feedbackagent:
Patiënten willen zo kort mogelijk wachten, terwijl afde-
deze helpt de arts beter gebruik te maken van medische
lingen hun mensen en apparatuur zo efficiënt mogelijk
richtlijnen. Er bestaan vele richtlijnen voor diagnose en
willen inzetten. Door het onderzoek worden afspraken
behandeling van ziekten. Zo zijn er programma's die de
efficiënter en flexibeler ingepland, waarbij rekening
arts waarschuwen als deze van de richtlijn afwijkt. Het
wordt gehouden met verschillende groepen patiënten.
kan echter gebeuren dat de arts om een goede reden van
Hierbij werd gebruikt gemaakt van de afspraakgege-
de precieze richtlijn afwijkt, maar wel volgens de intentie
vens van patiënten van het AMC.
van de richtlijn handelt. In dat geval moet de arts niet worden gewaarschuwd. De feedbackagent kent de inten-
Highlights
ties van de richtlijn en kan erover redeneren.
• Publicatie in Artificial Intelligence in Medicine.
De tweede persoonlijke agent is de retrievalagent: deze
• Twee publicaties in het International Journal of Medical
voorziet de arts van medische literatuur die relevant is
Informatics. 73
NARRATOR Narrative Disclosure of Health Care Knowledge
Hoofdaanvrager Dr. Pieter (P.J.) Toussaint (LUMC) Projectleider Prof. dr. Bertie (J.H.M.) Schonk (LUMC)
Publicatie ‘Illness stories on the Internet: what do breast cancer patients want at the end of treatment?‘ in het journal Psycho-oncology.
74
Uitvoerders Henk Herman (H.H.) Nap - promotie 18 -03-2008 Hilke (H.G.B.) Reckman - promotie 18-03-2009 Regina (R.I.) Overberg - promotiedatum n.n.b. Looptijd 01-12-2002 tot 18-03-2008 Budget Eur 389.637 voor personele kosten Eur 13.614 voor materiële kosten Partners Klinische informatiekunde (LUMC) Semantische representatie (UL) Mens-machine-interactie (TU/e)
Verhalende informatie Doel van het NARRATOR-project was het gebruik van
Een deelonderzoek heeft zich gericht op borstkanker-
narratieven (verhalen) in zorgcommunicatie door de
verhalen. Hieruit bleek dat de mogelijkheden van het
inzet van ICT mogelijk te maken en te ondersteunen.
internet nog niet ten volle worden benut. Het ontsluiten van verhalen met behulp van taaltechnologie bleek lastig
Kennisontsluiting binnen de gezondheidszorg heeft vaak
en vereiste aanpassingen aan de methode waarmee
een sterk medisch-feitelijk karakter. Moratiliteitsstatistie-
natuurlijke taal wordt geïnterpreteerd door de computer.
ken en medische feiten over behandelingen vormen het
Een ‘verhalen-op-maat’-systeem, met een dialoogmana-
leeuwendeel van de informatie op het internet. Daar-
ger om voorkeuren expliciet te maken, zou hiertoe een
naast is er op beperktere schaal ruimte voor narratieve
goede oplossing zijn.
informatie, zoals verhalen van lotgenoten. Deze laatste categorie van informatie is in principe slecht gestructu-
Met experimenten is onderzocht hoe een digitaal
reerd, en dat maakt het vinden van relevante
informatiesysteem moet worden vormgegeven, zodat
verhaalverhalen lastig. In het NARRATOR-project zijn de
de oudere gebruiker efficiënt, effectief en prettig kan
randvoorwaarden onderzocht voor een informatiesys-
werken. Met de verkregen kennis wordt een zorginfor-
teem dat relevante lotgenootverhalen ontsluit met een
matiesysteem vormgegeven, waarmee borstkanker-
geavanceerde dialoogmanagement- en een taaltechnolo-
patiënten met weinig stress kunnen zoeken naar
giecomponent.
lotgenotenverhalen.
De dialoogmanagementcomponent zorgt voor het vast-
Volgens Henk Herman Nap zijn voor senioren grote fonts
stellen van de belangrijkste zoeksleutels op basis van het
en knoppen, de moedertaal, een touchscreen en een
gebruikersprofiel en de informatiebehoefte. De taaltech-
ABCDE keyboard belangrijk om succesvol om te kunnen
nologie component speelt een belangrijke rol in het
gaan met een computer. Bovendien reduceert positieve
ontsluiten van de verhalen.
feedback de stresservaring van senioren. 75
TIMEBAYES Building and Using Temporal Bayesian Models in a CPR Setting
Hoofdaanvrager Dr. Peter (P.J.F.) Lucas (RU) Uitvoerders Theodoros (T.) Charitos - promotie 17-09-2007 Jacqueline (J.M.) Dake . . Rasa (R.) Jurgelenaite - promotie 19-01-2009 Stefan (S.) Visscher - promotie 30-09-2008
Vanuit TIMEBAYES is een bijdrage geleverd aan het Medisch Informatica Congres in 2004 en 2005, met daaruit voortvloeiend een publicatie in Studies in Health care technology and Informatics.
76
Looptijd 01-04-2003 tot 15-01-2008 Budget Eur 389.637 voor personele kosten Eur 27.614 voor materiële kosten Partners Universiteit van Utrecht (UU) Radboud Universiteit Nijmegen (RU) Universitair Medisch Centrum Utrecht (UMCU) Centrum voor Wiskunde en Informatica (CWI)
Data om te beslissen Het TIMEBAYES-project ontwikkelde grafische modellen
gen, waarmee de logica door de tijd heen is gemodel-
om artsen te ondersteunen bij het nemen van beslissin-
leerd. De combinatie van het wiskundige model en de
gen. Als voorbeelddomein diende onder andere het
data over transcriptie in andere organismen leverde een
ontstaan, de diagnose en de behandeling van infectie-
lijst op van tien mogelijke transcriptiefactoren van mala-
ziekten.
riaparasieten.
Het TIMEBAYES-project heeft methoden, technieken en
Highlights
hulpmiddelen ontwikkeld voor het gebruiken van tem-
Papers ingediend voor de
porele gegevens in de geneeskunde. Bijvoorbeeld om te
• 3rd European Medical and Biological Engineering
voorspellen of een patiënt met een carcinoïde ook werkelijk een hartziekte zal ontwikkelen. Hiertoe zijn grafische statistische modellen, Bayesiaanse netwerken, als uitgangspunt gekozen. Deze maken het mogelijk om onzekere kennis, zowel op basis van kennis
Conference (EMBEC) • 10th en 11th Conference on Artificial Intelligence in Medicine (AIME) • 6st International Symposium on Biological and Medical Data Analysis (ISBMDA)
uit een domein als op basis van feitelijke gegevens, af te leiden.
Stefan Visscher ontwikkelde een model om vast te
Ook bieden Bayesiaanse netwerken de mogelijkheid om
stellen wanneer iemand géén longontsteking heeft.
temporele en atemporele verbanden voor te stellen en
Onnodige behandeling met antibiotica kan zo worden
erover te redeneren. In het project is aandacht besteed
voorkomen. Visschers model berekent de kans dat een
aan de structuur van temporele Bayesiaanse netwerken,
individuele patiënt lijdt aan longontsteking, voorspelt
het leren van temporele netwerken uit data en aan de
welke bacterie de veroorzaker is en geeft aan welke
rol die expertkennis hierbij speelt. Zo is onderzoek
antibiotica het beste kunnen worden voorgeschreven.
gedaan naar de genetische regulatie van malariamug77
78
79
NWO Exacte Wetenschappen Bezoekadres Anna van Saksenlaan 51 2593 HW Den Haag Postadres Postbus 93460 2509 AL Den Haag www.nwo.nl/ew www.nwo.nl/token
Redactie Christiane Klöditz Sabine Zinsmeister Interviews Daphne Riksen Foto’s Peter van Beek Beeld Shutterstock Vormgeving WAT ontwerpers, Utrecht Druk Zalsman Kampen bv