Inhoud. Voorwoord 2 Inleiding 4

Inhoud Voorwoord

2

POLITIE & JUSTITIE

38

Inleiding

4

Interview: Forensische schrijveridentificatie

40

ACCESS

44

TOKEN

8

ANITA

46

ToKeN Facts & Figures

10

BEST

48

ToKeN Highlights

12

CASSANDRA

50

ToKeN Toekenningen

14

DALE

52

ToKeN Proefschriften

16

EVIDENCE

54

IPOL

56

LAYLA

58

TRIGRAPPH

60

ZORGSECTOR

62

Samenwerking met de Raad voor de Rechtspraak OPLEIDING & CULTUUR

18 20

Interview: Automatische beeldherkenning en cultureel erfgoed

22

Interview: Optimaal benutten van informatie op de IC

64

AUTHENTIC

26

CHIME

28

I-CATCHER

68

DUMPERS

30

DIME

70

EIDETIC

32

MIA

72

I2RP

34

NARRATOR

74

VINDIT

36

TIMEBAYES

76

Voorwoord Dr. Louis B.J. Vertegaal Directeur NWO Exacte Wetenschappen, NWO Chemische Wetenschappen en ACTS

2

Voor u liggen de Highlights van tien jaar ToKeN, een programma dat door NWO Exacte Wetenschappen is opgezet om de interactie tussen een menselijke gebruiker en kennis- en informatiesystemen te bevorderen. De afkorting staat voor Toegankelijkheid en Kennisontsluiting in Nederland, waarbij toegankelijkheid verwijst naar de mate waarin individuele burgers kunnen beschikken over kennis en informatie die voor hun van belang is. Kennisontsluiting slaat op methoden die voor de gebruiker kennis halen uit gegevens en informatie. Cognitiewetenschappers en informatici buigen zich over kennis die anders niet beschikbaar zou zijn. In deze bundel maken we de balans op van dit interdisciplinaire onderzoeksprogramma en tonen we een overzicht van, en de highlights uit de projecten. Daaruit blijkt dat ToKeN heeft geleid tot mooie resultaten en langdurige en vruchtbare samenwerkingsverbanden. Samenwerking tussen informatici en vertegenwoordigers uit de drie toepassingsgebieden: Politie & Justitie, de Zorgsector en Opleiding & Cultuur. Toen het onderzoeksprogramma ToKeN in 1999 van start ging had niemand durven dromen dat het zoveel zou opleveren: vele proefschriften, gezamenlijke publicaties, reguliere site visits, jaarlijkse bijeenkomstenen een hechte community. Tien jaar ToKeN is gelukkig niet het einde van een tijdperk. De drie toepassingsgebieden ontwikkelen zich verder in nieuwe programma’s als de subsidieprogramma’s Continuous Access to Cultural Heritage (CATCH) van NWO Exacte Wetenschappen, Diseasemanagement Chronische Ziekten van ZonMW en een nieuw subsidieprogramma Forensic Science. ToKeN krijgt zelf mogelijk een vervolg in een programma gericht op raakvlakken binnen de IT en de rechtspraak. Ik wens u veel leesplezier: laat de resultaten van tien jaar ToKeN u verrassen en inspireren!

3

‘Succes valt niet zomaar uit de lucht’

4

Inleiding Prof. dr. Jaap van den Herik

De interdisciplinaire samenwerking in het ToKeNprogramma tussen informatici en wetenschappers uit de toepassingsgebieden heeft de afgelopen tien jaar mooie resultaten opgeleverd. ToKeN leidde niet alleen tot wetenschappelijke doorbraken en een indrukwekkend aantal proefschriften, maar ook tot gelijkgestemde onderzoekers en diverse vervolgprogramma’s. Een interview met het boegbeeld van ToKeN, Jaap van den Herik.

Jaap van den Herik is voorzitter van de programmacommissie van ToKeN en medeoprichter van het programma. ‘We hebben in alle drie de domeinen de afgelopen tien jaar op wetenschappelijk gebied veel bereikt. Maar persoonlijk vind ik het mooiste aan ToKeN dat er een community is ontstaan van mensen met heel uiteenlopende achtergronden die op dezelfde manier denken, kijken en werken’, zegt Van den Herik in zijn werkkamer in het statige Kamerlingh Onnes Gebouw van de Universiteit Leiden. Interdisciplinaire samenwerking is hem niet vreemd: in Leiden is hij hoogleraar Juridische informatica. Bij de faculteit Rechtsgeleerdheid houdt hij zich bezig met onderwerpen als juridische data mining, elektronische surveillance en privacy, en de rol van de computer in de feitelijke rechtspraak.

5

Daarnaast is hij hoogleraar aan de Universiteit van

we onder andere kregen van het toenmalige Nationale

Tilburg en directeur van het Tilburg Centre for Creative

Actieprogramma Elektronische Snelwegen (NAP).’ In

Computing (TiCC). Dit centrum is onderdeel van de

eerste instantie kon ToKeN alleen starten met projecten

faculteit Geesteswetenschappen en doet onderzoek

op het gebied van Opleiding & Cultuur, later kwamen

naar kunstmatige intelligentie, menscomputer interactie

daar ook het toepassingsgebied Politie & Justitie en

en games.

de Zorgsector bij. ‘Het was best lastig om iedere keer

Domeinoverstijgend

opnieuw op zoek.’

financiering te vinden. In ieder domein moet je weer De gedachte dat informatica meerwaarde heeft voor andere vakgebieden en de wens om informatica meer

6

Grote doorbraak

uitstraling te geven, waren eind vorige eeuw bij NWO

Die moeite is niet voor niets geweest. De interdiscipli-

Exacte Wetenschappen de aanleidingen om een nieuw,

naire samenwerking in de twintig projecten leidde tot

domeinoverstijgend onderzoeksprogramma in het leven

een groot aantal proefschriften en volop inhoudelijke

te roepen. ‘Informatica is een enabler. Met ToKeN wil-

successen, zoals het onderzoek naar de authenticiteits-

den we laten zien waarvoor je het allemaal kunt

bepaling van schilderijen, vertelt Van den Herik

gebruiken’, zegt Van den Herik. Hij herinnert zich nog

enthousiast. ‘Met de software van het project

goed hoe het begon: ‘In een werkgroep hebben we

AUTHENTIC kun je aan de hand van penseelstreken met

eerst ideeën verzameld, zoals het automatisch herken-

grote waarschijnlijkheid de maker van een schilderij

nen van schilderijen, computers laten rechtspreken en

vaststellen. Een grote doorbraak voor het Van Gogh

het gebruik van expertsystemen in de zorg. Op basis van

Museum, waar veel publiciteit over is geweest.’ Het

dergelijke toepassingen hebben we een voorstel

project CASSANDRA leverde technieken op waarmee de

geschreven en zijn we op zoek gegaan naar geld, dat

veiligheid in openbare ruimten kan worden vergroot.

Op basis van beelden afkomstig van cameratoezicht-

samenwerking te brengen. Het is ons gelukt om tussen

systemen, in combinatie met analyse van geluiden in de

allerlei faculteiten stevige bruggen te bouwen en daar-

omgeving, wordt opkomende agressie gespot. Beveili-

bij inspiratie, enthousiasme en vernieuwing te

gingsmedewerkers krijgen bij bijzondere gebeurtenissen

realiseren. Voor mij zijn dat de trefwoorden die bij

een seintje, zodat zij in de controlekamer niet voortdu-

ToKeN horen.’ Succes wordt daarnaast gevoed door

rend naar een muur vol beeldschermen hoeven te turen.

eerder onderzoek, inzichten van anderen en nieuwe

Projectleider Dariu Gavrila ontving in 2007 de I/O Award

contacten’, vervolgt hij. ‘En bovenal door alert te zijn

van het Gebiedsbestuur van NWO Exacte Wetenschap-

op verrassende wendingen in je onderzoek en oog te

pen voor de beste publiciteit over ICT-onderzoek. Voor

hebben voor nieuwe onderzoeksrichtingen. Alleen dan

het zorgdomein is in het project MIA een veelbelovende

kun je doorbraken bewerkstelligen. Ik ben er trots op

technologie ontwikkeld waarmee het Elektronisch

dat de onderzoekers van ToKeN, soms tegen de stroom

Patiënten Dossier (EPD) beter kan functioneren. ‘Techno-

in, prijswinnend onderzoek hebben verricht.’ Dat de

logisch is er met het EPD eigenlijk niets mis, maar er is

informatica via ToKeN haar toegevoegde waarde heeft

wel veel discussie over privacyaspecten. Met behulp van

laten zien, is voor Van den Herik evident. Veel van de

software agents kun je de privacy van patiënten waar-

resultaten, maar ook nieuwe onderzoeksrichtingen, zijn

borgen, blijkt uit dit en ander ToKeN-onderzoek.’

inmiddels terechtgekomen in vervolgprogramma’s.

Verrassende wendingen Hoe komt het dat ToKeN zo’n succesvol programma is? ‘Succes valt niet zomaar uit de lucht’, benadrukt Van den Herik. ‘Dat kun je alleen bereiken door heel veel mensen met uiteenlopende achtergronden tot nauwe

7

8

ToKeN Toegankelijkheid en Kennisontsluiting in Nederland

9

ToKeN Facts & Figures ToKeN staat voor Toegankelijkheid en Kennis-

Gefinancierd zijn 40 aio’s, 14,5 postdoc-posities

ontsluiting in Nederland

en 5 fte niet-wetenschappelijk personeel.

ToKeN is een interdisciplinair onderzoeks-

Binnen ToKeN zijn drie toepassingsgebieden

programma dat zich richt op de interactie

• Opleiding & Cultuur

tussen een menselijke gebruiker en kennis-

• Politie & Justitie

en informatiesystemen.

• Zorgsector

Deze fase van het ToKeN subsidieprogramma

Researchteams bestaan uit onderzoekers uit

loopt van 1999 tot 2010 (tot 2004 heette het

de informatica, cognitiewetenschappen en soms

ToKeN2000).

onderzoekers uit de toepassingsgebieden.

Het programmabudget is ongeveer M€ 10.

10

Tot en met 2009 zijn 23 proefschriften

Het programmabureau wordt gevoerd door

verschenen.

NWO Exacte Wetenschappen.

ToKeN wordt aangestuurd door een programma-

ToKeN-financiers zijn

commissie, onder leiding van prof. dr. Jaap van den

• Nederlandse Organisatie voor Wetenschappelijk

Herik van de Universiteit van Tilburg.

Onderzoek (NWO) - Algemeen Bestuur en de gebieden Exacte Wetenschappen en Maatschappij- en Gedragswetenschappen • Nederlandse organisatie voor gezondheids-

Een gebruikerscommissie is aangesteld om de voortgang binnen de projecten te volgen. Deze commissie bestaat uit experts uit de drie toepassingsgebieden en vertegenwoordigers van de

onderzoek en zorginnovatie (ZonMw) • Nationaal ActieProgramma Elektronische Snelwegen (NAP) • Raad voor de Rechtspraak

betrokken ministeries.

11

ToKeN Highlights Vertegenwoordiging op congressen ToKeN heeft regelmatig deelgenomen aan andere congressen, zoals het Medische Informatica Congres en het ICT kenniscongres (wat later is omgevormd tot ICTDelta). De bijdrage vanuit ToKeN bestond bijvoorbeeld uit het houden van een demonstratie of het organiseren van een side-meeting.

Site visits

Pattern Recognition Letters

Voor de gebruikerscommissie van ToKeN organiseren de

Het journal Pattern Recognition Letters heeft in april

projecten regelmatig site visits, om hen op de hoogte te

2007 een speciale editie uitgegeven, ‘Pattern Recogni-

houden van de voortgang en de resultaten van het

tion in Cultural Heritage and Medical Applications’,

onderzoek. Deze site visits worden goed bezocht en

waarin het ToKeN-onderzoek centraal stond. Gastredac-

gewaardeerd, de projectleden besteden hier veel zorg

teuren voor deze editie waren Eric Postma, Jaap van den

aan.

Herik en Jan van der Lubbe. Vanuit ToKeN zijn in totaal vier artikelen opgenomen.

12

Jaarlijkse bijeenkomsten Om de ToKeN-community te versterken wordt jaarlijks een bijeenkomst georganiseerd voor de achterban en geïnteresseerden. Veelal verzorgen de projecten een posterpresentatie, met de Best Poster Award voor de meest heldere bijdrage. Vanuit een aantal projecten worden boeiende presentaties gehouden, waarbij de beste presentatie wordt beloond met de Best Oral Presentation Award. Maar bovenal zijn de bijeenkomsten dé plek om betrokkenen te ontmoeten en op de hoogte te blijven van de ontwikkelingen in het vakgebied.

Media-aandacht Door de jaren heen zijn de ToKen-projecten zeer regelmatig in het nieuws geweest. Kijk bij de highlights van de verschillende projecten voor een greep uit de gegenereerde media-aandacht.

13

ToKeN Toekenningen Eerste subsidieronde Om het onderzoek op te starten zijn in de zomer van 2001 twee voorstellen van de ToKeN2000 kerngroep gehonoreerd binnen het toepassingsgebied Opleiding & Cultuur: • EIDETIC: Intelligent Content-based Image Retrieval (Prof.dr. E.O. Postma, UvT) • I2RP: Intelligent Information Retrieval and Presentation in Public Historical Multimedia Databases (Prof.dr. L.R.B. Schomaker, RUG) Tweede subsidieronde Voor de toepassingsgebied Opleiding & Cultuur werden in het voorjaar 2002 vier aanvragen gehonoreerd, voor het toepassingsgebied Politie & Justitie één en voor het toepassingsgebied Zorgsector vijf: Cultuur & Opleiding • AUTHENTIC: Knowledge discovery and disclosure for visual art: authentication and dating of graphic art paintings (Dr.ir. J.C.A. van der Lubbe, TUD) • CHIME: Cultural Heritage in an Interactive Multimedia Environment (Prof.dr. H.L. Hardman, CWI) • DUMPERS: Distributed user modeling and Exploration in Personalized Recommender Systems (Dr. M.W. van Someren, UvA) • VINDIT: Combining visual and textual information for information retrieval (Prof.dr. E.O. Postma, UvT)

14

Politie & Justitie • ANITA: Administrative Normative Information Transaction Agents (Dr.mr. C.N.J. de Vey Mestdagh, RUG) Zorgsector • DIME: Distributed Interactive Medical Exploratory for 3D Medical Images (Prof.dr.ir. J.H.C. Reiber, LUMC) • I-CATCHER: Intensive-Care Acces to Terminology & Course of Health Exploration & Retrieval (Dr. A. Abu-Hanna, AMC) • MIA: Medical Information Agent (Prof.dr.ir. A. Hasman, UM) • NARRATOR: Narrative Disclosure of Health Care Knowledge (Dr. P.J. Toussaint, LUMC) • TIMEBAYES: Building and Using Temporal Bayesian Models in a CPR Setting (Dr. P. Lucas, RU) Derde subsidieronde In de ronde van 2004 zijn acht onderzoeken gehonoreerd binnen het toepassingsgebied Politie & Justitie: • ACCESS: Agent-based Criminal Court Electronic Support Systems (Prof.dr. F.M.T. Brazier, VU) • BEST: Intelligent disclosure of case-law using Semantic Web technology to determine BATNAs in damages disputes (Dr. A.R. Lodder, VU) • CASSANDRA: Context-Aware SenSing for AggressioN Detection and Risk Assessment (Prof.dr. D.M. Gavrila, UvA) • DALE: Data Assistance for Law Enforcement (Dr. W.A. Kosters, UL) • EVIDENCE: Making sense of evidence: software support for crime investigations (Prof.dr.mr. H. Prakken, UU) • IPOL: Intelligence led policing. An effective law enforcement strategy or a threat to civil liberties and the principles of criminal law? (Prof.mr. Th.A. de Roos, UL) • LAYLA, the Layman's Legal Assistant: Assisting consumers in business-consumer conflicts by diagnosing, advising and mediating (Dr. R.E. Leenes, UvT) • TRIGRAPH: tri-modal writer indentification (Prof.dr. L.R.B. Schomaker, RUG)

15

ToKeN proefschriften Egon van den Broek (EIDETIC, RU)

Human-Centered Content-Based Image Retrieval

21 september 2005

Xandra van Montfort (EIDETIC, TU/e)

Gist and its role in memory for images

20 juni 2006

Boban Arsenijvic (I2RP, UL)

Inner aspect and telicity: The decompositional and quantificational nature of eventualities at the syntax-semantics interface

Stefano Bocconi (I2RP, CWI)

Vox Populi: generating video documentaries from semantically annotated media repositories

Wouter Teepe (ANITA, RUG)

18 januari 2007

Autonomy vs. Conformity. An Institutional Perspective on Norms and Protocols

4 juni 2007

Theodore Charitos (TIMEBAYES, UU)

Reasoning with Dynamic Networks in Practice

17 september 2007

Niek Bergboer (EIDETIC, UM)

Context-Based Image Analysis

10 oktober 2007

Lilit Axner (DIME, UvA)

16

30 november 2006

Reconciling Information Exchange and Confidentiality: A Formal Approach

Huib Aldewereld (ANITA, UU)

11 oktober 2006

High Performance Computational Hemodynamics with the Lattice Boltzmann Method

18 december 2007

Vera Hollink (DUMPERS, UvA)

Optimizing Hierarchical Menus a usage-based approach

31 januari 2008

Henk Herman Nap (NARRATOR, TU/e)

Stress in Senior Computer Interaction

18 maart 2008

Guido de Croon (VindIT, UM) Stephan Visscher (TIMEBAYES, UU) Loes Braun (MIA, UM) . . Rasa Jurgelenaite (TIMEBAYES, RU) Hilke Reckman (NARRATOR, UL)

Adaptive Active Vision

26 juni 2008

Bayesian network models for the management of ventilator-associated pneumonia

30 september 2008

Pro-active medical information retrieval

29 oktober 2008

Symmetric Causal Independence Models

19 januari 2009

Flat but not shallow; Towards flatter representations in deep semantic parsing for precise and feasible inferencing

18 maart 2009

Stijn VanderLooy (IPOL, UM)

Ranking and reliable classification

1 juli 2009

Leendert van Maanen (I2RP, RUG)

Context effects on memory retrieval

14 september 2009

Floris Bex (EVIDENCE, RUG)

Evidence for a good story, A hybrid theory of arguments, stories and criminal evidence

29 oktober 2009

Wouter Koelewijn (ANITA, UL)

an Institutional Perspective on Norms and Protocols

4 november 2009

Tim Cocx (DALE, UL)

Algorithmic tools for data-oriented law enforcement

2 december 2009

Igor Berezhnoy (AUTHENTIC, UM)

Digital analysis of paintings

7 december 2009

Jeroen Laros (DALE, UL)

Metrics and Visualisation for Crime Analysis and Genomics

21 december 2009

17

Samenwerking Raad voor de Rechtspraak

18

Op 1 juli 2004 hebben NWO en de Raad voor de Rechtspraak een overeenkomst getekend, waarin zij bevestigden om intensief samen te werken binnen ToKeN. De Raad voor de Rechtspraak hecht veel belang aan onderzoek op dit terrein, omdat de aandacht is gericht op informatiesystemen die de prestaties verbeteren. De rechtspraak stond voor de taak het groeiend aantal zaken, en de toenemende bewerkelijkheid ervan op te vangen. Het is daarom noodzakelijk om de effectiviteit te vergroten. In het bijzonder richtte het onderzoek zich op het vergroten van de (digitale) toegankelijkheid, de rechtseenheid en het verkorten van de doorlooptijden. Inhoudelijk is aan deze samenwerking gestalte gegeven door in de loop van 2003 in samenwerking met de Raad een aantal vraagstukken te formuleren. Deze vormden samen met andere onderwerpen het kader van de derde subsidieronde. De Raad heeft de volgende onderwerpen bij NWO aangedragen voor onderzoek: • De digitalisering van werkprocessen. • Het ontwikkelen van kennis- en expertsystemen. • Het creëren van innovatieve ICT voorzieningen. • De ontwikkeling van informatiearchitecturen met een lange levenscyclus. De samenwerking met de Raad voor de Rechtspraak bood een uitstekende kans de grote afstand tussen beleid en wetenschap te verkleinen.

19

OPLEIDING & CULTUUR Interview Eric Postma Projectomschrijvingen

‘Musea en instellingen voor cultureel erfgoed worstelen met heel basale vragen‘

22

Automatische beeldherkenning en cultureel erfgoed Prof. dr. Eric Postma

In de cultureel erfgoedsector bestaat grote behoefte om in grote databases te zoeken naar specifieke afbeeldingen. Voor zowel informatici als psychologen een interessant thema, vindt Eric Postma. Hij leidde de projecten VindIT en EIDETIC.

Ondanks alle ontwikkelingen in de informatica en de toegenomen rekenkracht van computers is het vinden van afbeeldingen in grote databases niet eenvoudig. Het realiseren van automatische beeldherkenning kent een groot aantal uitdagingen, vertelt Eric Postma van het Tilburg centre for Creative Computing (TiCC). ‘Het lijkt heel makkelijk omdat het voor ons mensen een onbewust proces is, maar er is niets zo moeilijk als beeldherkenning. Je hebt geen idee wat zich bij visuele waarneming in je hoofd afspeelt‘, legt hij uit. ‘Dat merk je pas als je het in algoritmes wilt vastleggen.‘ Veel valt daarbij te leren van hoe mensen naar afbeeldingen kijken. Vandaar dat aan deze twee ToKeN-projecten zowel informatici als psychologen hebben gewerkt.

23

Gezichtsdetectie

bepalen, en vervolgens weer informatie uit de context

‘Een mens kan heel snel de essentie uit een plaatje

te gebruiken om te verifiëren of het ook werkelijk

halen. Een miniem detail zorgt er al voor dat je in een

gezichten zijn. Dit algoritme is breder toepasbaar dan

stadsbeeld Parijs herkent‘, geeft Postma als

alleen voor gezichtsdetectie, het is ook geschikt voor

voorbeeld. ‘Welke elementen dat zijn is onderzocht in

objectherkenning in andere domeinen.

Eindhoven. De psychologische experimenten die daar zijn uitgevoerd, geven inzicht in waar we precies naar

Combineren

kijken, wat de gist van een afbeelding is.‘ Een promo-

Hoewel de twee projecten het thema beeldherkenning

vendus uit mijn groep, vervolgt Postma, maakte ook

met elkaar gemeen hadden, was er ook een verschil: de

gebruik van psychologische kennis: ‘Hij baseerde zijn

onderzoekers van project EIDETIC * gingen alleen af op

algoritme op de manier waarop mensen bij een

informatie die uit het beeld te halen valt, het project

bepaalde zoektaak actief de inhoud van een afbeelding

VindIT daarentegen combineerde beeld met tekstuele

in zich opnemen. Wanneer je op een schilderij zoekt

informatie. Postma: ‘De database van het Rijksmuseum

naar iemand die een hoed draagt, scannen je ogen

bijvoorbeeld bevat zowel schilderijen als toelichtingen.

onbewust de hogere delen van het beeld. Zijn algoritme

Vaak is er overlap, bijvoorbeeld als in de beschrijving

kan met zulke kennis over de context van de zoekvraag

staat dat het schilderij een vrouw in een winkelstraat

efficiënter naar bepaalde delen van een afbeelding

toont. Maar als op de achtergrond een straathond te

afzoeken, zonder het hele schilderij te hoeven verwer-

zien is, heeft iemand die onderzoek doet naar schilde-

ken.‘ Weer een andere aio maakte

rijen met honden niets aan de tekst. Door beide

gezichtsdetectiealgoritmen betrouwbaarder. Hij drong

bronnen te combineren krijg je meer en betrouwbaar-

het aantal false positives (het algoritme ziet gezichten

der zoekresultaten.‘

die er niet zijn) terug door eerst kandidaatgezichten te *Een Eidetic memory is een fotografisch geheugen.

24

Omdat de projecten inhoudelijk heel dicht bij elkaar

je als projectleider wel in een spagaat: die praktische

lagen en Postma ze allebei leidde, kon hij samenwer-

problemen bieden niet voldoende wetenschappelijke

king en uitwisseling faciliteren tussen de onderzoekers

diepgang. Het is soms best lastig de afweging te maken

in Nijmegen, Tilburg, Maastricht, Delft en Eindhoven. In

tussen nut voor het vakgebied versus nut voor de sector.

regelmatig georganiseerde projectbijeenkomsten inspi-

Ik zie het ToKeN-programma als een verkenning van het

reerden informatici en psychologen elkaar en wisselden

grensvlak tussen informatica, psychologie en cultureel

de onderzoekers kennis, psychologische modellen over

erfgoed, die voor veel uitstraling en nieuwe projecten

waarneming en algoritmes uit. Ook kwam het tot geza-

heeft gezorgd. De ToKeN-projecten hebben inzicht

menlijke publicaties.

gegeven in de ICT-behoeften van musea en instellingen en wat er komt kijken bij de transfer van toepassingen.

Inzicht in ICT-behoeften

Binnen het vervolgprogramma CATCH kun je dit uitbou-

‘Het uiteindelijke doel van dergelijk onderzoek is heel

wen. Dat gebeurt onder andere doordat informatici zich

praktisch: het opleveren van software waar de instellin-

op de vloer van de instelling bevinden. Ik ben erg blij

gen voor cultureel erfgoed wat aan hebben. Maar dat is

dat NWO dat heeft ingezien.‘

in het bestek van een promotieonderzoek teveel gevraagd: een aio produceert prototypes en publicaties‘, vindt Postma. ‘De samenwerking met musea was er in deze projecten ook niet intensief genoeg voor. Dat is echter wel nodig, want deze sector staat nog behoorlijk aan het begin van informatisering. Musea en instellingen worstelen nog met heel basale vragen en zij hebben behoefte aan concrete oplossingen. Dat brengt

25

AUTHENTIC Knowledge discovery and disclosure for visual art: authentication and dating of graphic art and paintings Hoofdaanvrager Dr. ir. Jan (J.C.A.) van der Lubbe (TUD) Uitvoerders Igor (I.E.) Berezhnoy promotie 07-12-2009 Ana-Ioana (A.I.) Deac Looptijd 01-01-2003 tot 01-01-2007

In 2008 werd wereldwijd aandacht besteed, onder andere in Nature, aan een door de TU Delft ontwikkelde techniek om onderschilderingen zichtbaar te maken. In dit geval ging het om een Van Gogh.

26

Budget Eur 271.524 voor personele kosten Eur 45.131 voor materiële kosten Partners Informatie en Communicatie Theorie (TUD) Instituut voor Kennis en Agent Technologie (UM)

Echt of toch niet? Hoe bepaal je of een schilderij vals is? Ervaren kunst-

In het project is nauw samengewerkt met diverse

kenners kunnen dit op het oog beoordelen, maar

musea, kunsthistorische instituten en veilinghuizen.

computers hebben een objectievere en vaak ook

Naast een toolbox voor automatische analyse van kunst-

betrouwbaardere mening. In het AUTHENTIC-project

werken, is ook een bijdrage geleverd aan het zoeken

ontwikkelden onderzoekers een manier om schilderijen

van beelden in multimedia bestanden.

met elkaar te vergelijken. Highlights

In de kunstgeschiedenis en kunsthandel spelen authenti-

• Er zijn artikelen over het onderzoek geplaatst in onder

citeitsbepaling en datering van kunstwerken een

andere NRC Handelsblad, De Volkskrant, VPRO gids en

belangrijke rol. Veel van het onderzoek op dit gebied

Het Brabants Dagblad en internationaal in de New York

geschiedt nog handmatig en met een hoge mate van

Times en de International Herald Tribune.

subjectiviteit. In het AUTHENTIC-project is onderzocht welke beeldverwerkingsmethoden en methoden vanuit computationele intelligentie en data mining een ondersteunende rol kunnen spelen.

• De publicatie van een artikel in de New Scientist ‘Detecting art fakes at a Stroke’ in 2006. • Op 14 en 15 mei 2007 vond de First International Workshop on Image Processing for Artist Identification plaats, onder andere ontstaan uit het AUTHENTIC-project.

Nieuwe methoden zijn ontwikkeld voor de automatische extractie van lokale en globale kenmerken, variërend van penseelstreken tot compositie, stijl en

• Er is een documentaire gemaakt door RTL4 over de identificatie van een valse Karel Appel. • Tijdens de AAAI 2008 Conference on Artificial Intelligence

school. Data mining technieken zijn gebruikt om ver-

won AUTHENTIC de Best Video Award voor de video

banden te leggen tussen de geëxtraheerde kenmerken,

‘Digital Analysis of Van Gogh Paintings’.

om zo inzicht te krijgen in het eigene van een kunstenaar. 27

CHIME Cultural Heritage in an Interactive Multimedia Environment

Hoofdaanvrager Prof. dr. Lynda (L.) Hardman (CWI) Uitvoerders Mark (M.F.J). van Assem - promotiedatum n.n.b. Vadim (V.I.) Chepegin Kateryna (K.I.) Falkovych Frank-Michael (F.M.) Nack - postdoc

Binnen CHIME is de SampLe demo ontwikkeld, een semiautomatisch raamwerk om multimediale presentaties te ontwerpen.

28

Looptijd 01-11-2002 tot 01-09-2007 Budget Eur 489.694 voor personele kosten Eur 18.152 voor materiële kosten Partners Information Systems Group (CWI) Business Informatics Section (VU) Information Systems Group (TU/e)

Gebruikers gemodelleerd Het CHIME-onderzoek richtte zich op het gebruik van

multimediale aspecten en het hergebruik van gebruikers-

semantische modellen om presentatie van culturele

profielen bij meerdere applicaties.

informatie toe te spitsen op verschillende typen

CHIME heeft gekeken naar het genereren van domein-

gebruikers. De culturele informatie komt uit bestaande

representaties uit databanken van cultureel erfgoed

verzamelingen en is opgebouwd uit heterogene

instellingen. Vocabulaires spelen hierbij een centrale rol,

collecties van media items.

bijvoorbeeld de Art en Architecture Thesaurus (Getty) en WordNet (Princeton). In het kader van CHIME zijn

Tekstgebaseerde zoektechnieken maakten culturele

representaties van deze en andere vocabulaires

informatie uit databanken met heterogene collecties wel

gebouwd en ingezet.

toegankelijk, maar lieten rijkere expressiemogelijkheden

De zoekopdrachten in het onderzoek zijn gebaseerd op

buiten beschouwing. Ook werden samenhangende en

‘De Stijl’ van Mondriaan. Gecombineerde indexerings-

doelgerichte presentaties van resultaten niet onder-

woordenlijsten zijn gebruikt om informatie over

steund.

Mondriaan te vinden in verschillende bronnen. Het

Het onderzoek binnen CHIME richtte zich op het creëren

CHIME project heeft de grondslagen onderzocht en

van semantische modellen op basis van domeinseman-

ontwikkeld waardoor later het CATCH-project CHIP een

tiek en discoursesemantiek, die ook aspecten van

goede start kon maken.

gebruikersmodellen in beschouwing nemen. Zo is beschreven hoe een bestaand hypermediasysteem kan

Highlights

communiceren met een alleenstaande gebruikersserver

• De publicatie en het online beschikbaar stellen van

en kan de output van eerdere zoekopdrachten worden gebruikt als input voor vervolgopdrachten. Speciale aandacht ging uit naar het representeren van kennis uit

WordNet in RDF/OWL bij W3C. • Leden van CHIME zaten in het team dat in 2006 de Semantic Web Challenge won.

29

DUMPERS Distributed user modeling and Exploration in Personalized Recommender Systems Hoofdaanvrager Dr. Maarten (M.W.) van Someren (UvA) Uitvoerders Stephan (S.H.G.) ten Hagen - postdoc Vera (V.) Hollink - promotie 31-01-2008 Looptijd 01-11-2002 tot 31-07-2008

Tijdens de AAAI Workshop on Intelligent Techniques for Web Personalization te Vancouver is de workshop ‘The SeniorGezond Recommender: Exploration Put into Practice‘ gegeven in 2007.

30

Budget Eur 183.563 voor personele kosten Eur 12.726 voor materiële kosten Partners SeniorGezond (LUMC en TNO)

Vinden op het web Dankzij het internet is voor iedereen een grote hoeveel-

informatiesysteem SeniorGezond. Dit systeem is ontwik-

heid informatie toegankelijk. Het is echter lang niet altijd

keld voor een breed spectrum van gebruikers en bevat

eenvoudig om bepaalde informatie te vinden. Binnen

een grote, heterogene hoeveelheid informatie. Daar-

DUMPERS zijn verschillende manieren onderzocht om

door kan gebruikersondersteuning worden toegevoegd

internetters in hun zoektocht te ondersteunen.

en geëvalueerd.

In het DUMPERS-project is het gedrag van internet-

Highlights

gebruikers geobserveerd en geanalyseerd. Patronen in

• Publicatie ‘Navigation behavior models for link structure

het gebruikersgedrag zijn gecombineerd met informatie uit de inhoud van de webpagina's, om zo navigatiestructuren van websites te optimaliseren.

optimization‘ in User Modelling and User-Adapted Interaction in 2007. • Publicatie ‘A Semi-Automatic Usage-Based Method

Nieuwe ideeën zijn onder meer het automatisch optimali-

for Improving Hyperlink Descriptions in Menus‘ in Inter-

seren van menustructuren. Uit de informatie die is

national Journal of Human-Computer Studies in 2009.

opgeslagen in logfiles, zijn modellen van het gedrag van de gebruikers geconstrueerd. Menu’s zijn bedoeld voor

Informatica Vera Hollink heeft een methode ontwikkeld,

gebruikers die niet goed gebruik kunnen maken van een

waarbij gebruikers zelf bepalen hoe een website wordt

zoekmachine, omdat ze hun informatiebehoeften niet

gestructureerd. Haar programma volgt hoe gebruikers

goed kunnen formuleren. Menu’s die het zoeken onder-

door websites bladeren en op welke punten in de sites

steunen blijken echter vaak niet optimaal. Op basis van

links worden aangeklikt. Verwijzingen die tot verkeerde

modellen van het zoekgedrag is berekend hoe menu's

keuzes leiden worden verwijderd, verplaatst of voorzien

moeten worden aangepast, zodat gebruikers sneller

van een duidelijker tekst. Bovendien is samen met de

komen bij de informatie die ze nodig hebben.

ontwikkelaars een functie gemaakt, die interessante

Het onderzoek vond plaats in samenwerking met het

links aanbiedt aan bezoekers. 31

EIDETIC Intelligent Content-based Image Retrieval

Hoofdaanvrager Prof. dr. Eric (E.O.) Postma (UvT) Uitvoerders Niek (N.A.) Bergboer - promotie 10-10-2007 Egon (E.L.) van den Broek - promotie 21-09-2005 Xandra (X.A.) Montfort - promotie 20-06-2006 Hector (H.) Moreu Otal Mark (M.) van Staalduinen

In een special issue van de Pattern Recognition Letters is in 2007 een analyse gepubliceerd van de trade-off tussen efficiëntie en kwaliteit.

32

Looptijd 01-09-2001 tot 01-08-2008 Budget Eur 568.619 voor personele kosten Eur 24.391 voor materiële kosten Partners Mens Techniek Interactie groep (TU/e) Informatie en Communicatie Theorie groep van (TUD) Nijmegen Instituut voor Cognitie en Informatie (RU)

Zoeken naar beelden Binnen EIDETIC zijn technieken en methoden onderzocht

bladeren. Hiertoe zijn in een speciale experimentele

die de gebruiker ondersteunen bij het zoeken naar visueel

opzet proefpersonen geconfronteerd met verschillende

materiaal in culturele databases. Hierbij zijn de gebruikers-

wijzen van presentatie.

aspecten, bijvoorbeeld het gebruiksvriendelijk zoeken in grote hoeveelheden data, en de technische aspecten van

Tevens is onderzocht wat de meest gebruikersvriende-

het zoeken naar beelden, bijvoorbeeld automatische

lijke wijze is om te zoeken naar kleuren of combinaties

detectie van objecten, onderzocht.

van kleuren en vormen. In het technische onderzoek zijn geavanceerde programma’s ontwikkeld die automati-

Zoeken naar specifieke afbeeldingen in een grote beeld-

sche detectie en herkenning van specifieke objecten

database werd eerst gedaan door een gebruiker, want

mogelijk maken. De focus lag op objectspecifieke

met bestaande technologieën was het niet mogelijk om

activiteitspatronen, die van groot belang zijn voor de

beelden te herkennen. In het kader van het EIDETIC-

ontwikkeling van brein-computerinterfaces. Met behulp

onderzoek zijn technieken en methoden onderzocht die

van automatische leertechnieken zijn deze getraind op

de gebruiker ondersteunen bij het zoeken naar visueel

de visuele kenmerken van een klasse van visuele

materiaal in de context van culturele databases (bijvoor-

objecten (bijvoorbeeld gezichten). In het gebruikers-

beeld een museale database met afbeeldingen van

onderzoek bleek dat de waarneming van de essentie

visuele kunst). Het EIDETIC-project is uniek in haar com-

van een beeld subjectief is, en dat mensen deze gebrui-

binatie van onderzoek naar de gebruikersaspecten en

ken om te bepalen of een beeld is veranderd.

de technische aspecten van het zoeken naar beelden. Highlights

In het gebruikersonderzoek is bepaald op welke wijze

• Publicatie in Image and Vision Computing in 2006.

gebruikers op de meest prettige en efficiënte manier

• Publicatie in Proceedings van de Human Brain Mapping

door grote hoeveelheden visuele gegevens kunnen

conferentie. 33

I2RP Intelligent Information Retrieval and Presentation in Public Historical Multimedia Databases Hoofdaanvrager Prof. dr. Lambert (L.R.B.) Schomaker (RUG)

Het geheugenmodel van Leendert van Maanen verklaart gedrag en kan individuele keuzes voorspellen op basis van feiten uit het geheugen.

34

Uitvoerders Boban (B.) Arsenijevic - promotie 11-10-2006 Yulia (Y.) Bachvarova Stefano (S.) Bocconi - promotie 30-11-2006 Judith (J.D.M.) Grob Zhisheng (Z.) Huang - postdoc Leendert (L.) van Maanen - promotie 14-09-2009 Floris (F.J.) Wiesman -postdoc Looptijd 01-01-2002 tot 01-04-2009 Budget Eur 542.275 voor personele kosten Eur 45.197 voor materiële kosten Partners CUYPERS - Centrum voor Wiskunde en Informatica (CWI) OPTIMA - Rijksuniversiteit Groningen (RUG) GO - Universiteit Maastricht (UM) SPREEKBUIS - Universiteit Leiden (UL)

Afgestemde multimediale gegevens I2RP heeft het ophalen en weergeven van multimediale

worden gehanteerd. Hieruit is een demo voortgekomen.

gegevens, uit bijvoorbeeld digitale museumbestanden,

Op basis van de beschikbaarheid van een semantisch

geoptimaliseerd. Hierbij wordt de informatie op een

netwerk op een historisch onderwerp is het mogelijk

voor de gebruiker afgestemde wijze aangeboden.

gemaakt om niet alleen visuele maar ook gesproken informatie aan de gebruiker te geven. De programma’s

Dit project ontwikkelde oplossingen voor het zoeken

DISC en Vox Populi zijn twee concrete resultaten vanuit

naar multimedia, en voornamelijk voor de integratie

het programma. Zij genereren presentaties, respectieve-

van meerdere facetten in een multimediale zoekcon-

lijk op het gebied van cultureel erfgoed en video’s.

text. Hoewel de prestaties van beeldzoekmachines steeds beter worden, zijn voor een effectief gebruik

Highlights

meer systeemfuncties nodig rondom de kern van een

• Winnaar International Semantic Web Challenge bij het

zoekalgoritme. In het project is gefocust op een dynami-

ISWC 2006.

sche en contextgevoelige weergave van media, die rekening houdt met de eisen van de gebruiker en de limieten van zijn of haar computerplatform. Om de interesses en intenties van de gebruiker te modelleren, is een lerend gebruikersmodel ontwikkeld. Omdat gebruikers hun kennis organiseren op basis van semantiek, was het nodig methoden te ontwikkelen die op een natuurlijke en interactieve wijze semantische categorisatie en reorganisatie van kennis toelaten. Zo is onderzocht in hoeverre tijd als bepalende factor kan 35

VINDIT Combining visual and textual information for information retrieval Hoofdaanvrager Prof. dr. Eric (E.O.) Postma (UvT) Uitvoerders Guido (G.C.H.E.) de Croon - promotie 26-06-2008 Franciscus (F.A.) Grootjen - postdoc Pramod (P.N.) Raikar Menno (M.M.) van Zaanen - postdoc

VindIT heeft de Best Paper Award op European Workshop on Evolutionary Computation in Image Analysis and Signal Processing (EVOIASP) gewonnen.

36

Looptijd 01-11-2002 tot 16-05-2009 Budget Eur 359.815 voor personele kosten Eur 27.228 voor materiële kosten Partners Faculteit Communicatie en Cultuur - Taal- en informatiewetenschap (UvT) Nijmeegs Instituut voor Cognitie en Informatie (RU)

Tekst en beeld gecombineerd Sommige databases bevatten zowel beeld als tekst,

kunnen de resultaten van beide analyses worden

bijvoorbeeld bij musea. VindIT heeft het mogelijk

gecombineerd tot een betrouwbaardere identificatie

gemaakt om in deze databases efficiënt te zoeken

van het interieur van een kasteel. Door het combineren

op beide variabelen.

van informatie uit twee onzekere bronnen wordt nieuwe informatie gegenereerd. Deze kennisveredeling

Met de snelle toename in de omvang van databanken

levert nieuwe informatie op die kan worden gebruikt

wordt het vinden van informatie steeds moeilijker. Het

om de bestaande informatie uit te breiden. Zo wordt

VindIT-project heeft technieken en methoden ontwik-

bijvoorbeeld het schilderij voorzien van metadata,

keld die het de gebruiker gemakkelijker maken om

oftewel gegevens over de inhoud (het schilderij toont

informatie te vinden uit databases die zowel visueel

het interieur van een kasteel).

(bijvoorbeeld schilderijen) als tekstueel materiaal (bijvoorbeeld toelichtingen bij de schilderijen) bevatten.

Highlights

De database van het Rijksmuseum is hier een goed voor-

• Perceptual Recognition Workshop in Maastricht in 2006.

beeld van.

• Het verschijnen van de publicatie ‘Comparing Active Vision Models‘ in Image and Vision Computing in 2009.

In het VindIT-project zijn zowel de afbeeldingen als de tekst automatisch geanalyseerd. Hierbij is gebruik gemaakt van automatische leertechnieken.

Voor alledaagse actie bewegen we onze ogen gemiddeld

Het resultaat van iedere analyse afzonderlijk levert

drie maal per seconde. Voor een computermodel is dit

doorgaans onvolledige informatie op. Zo kan bijvoor-

gedrag moeilijk te vatten. Guido de Croon onderzocht

beeld het resultaat van de visuele analyse zijn dat het

computermodellen die oogbewegingen maken, wat

schilderij een interieur toont. Indien het resultaat van de

onder andere kan leiden tot een grotere inzetbaarheid

tekstuele analyse aangeeft dat het om een kasteel gaat,

en autonomie van kleine robots. 37

POLITIE & JUSTITIE Interview Lambert Schomaker Projectomschrijvingen

39

‘ToKeN heeft het vakgebied een enorme stimulans gegeven‘

40

Forensische schrijveridentificatie Prof. dr. Lambert Schomaker

Informatici van de Rijksuniversiteit Groningen en de Radboud Universiteit zoeken naar manieren om automatische schrijveridentificatie te verbeteren. In het project TRIGRAPH deden zij dat samen met het Nederlands Forensisch Instituut. Projectleider Lambert Schomaker vertelt hoe dat in zijn werk ging.

‘Door de enorme verbetering van beelden patroonherkenning kun je de computer inzetten voor taken die je eerst met de hand deed. Bijvoorbeeld om handschriften te onderzoeken‘, zegt Lambert Schomaker van de afdeling Kunstmatige Intelligentie van de RUG. Hij werkt al jaren samen met de afdeling Schriftexpertise van het Nederlands Forensisch Instituut (NFI), en kent de vraagstukken van dichtbij: ‘Het gaat om handgeschreven documenten, variërend van dreigbrieven tot de handtekening onder een hotelrekening. Daarvan wil je de schrijver kunnen identificeren, of kunnen verifiëren dat het geschrevene afkomstig is van iemand van wie je al een schriftmonster bezit.‘

41

Bijzonder

‘Voor mij persoonlijk een bijzonder resultaat, omdat ik

Er bestaan drie methoden voor identificatie en verificatie

vroeger onderzoek heb gedaan naar het motorisch

van handschriften, vandaar de projectnaam TRIGRAPH,

schrijfproces. Hier kwamen mijn twee onderzoeksterrei-

legt Schomaker uit. ‘Je kunt de computer naar de statis-

nen, beeldanalyse en motoriek, onverwacht bij elkaar.’

tiek van kleine onderdelen in het schriftbeeld laten

42

kijken, zoals de textuur van de inkt en de richting en

Uitknippen

kromming van de lijnen. De tweede manier is om losse

Niet alleen de beeldgebaseerde methode is verbeterd,

letters of letterfragmenten door de computer te laten

ook bij het vullen van de tabel met lettervormen is een

vergelijken met een tabel die lettervormen en varianten

grote sprong voorwaarts gemaakt. Dit deel van het

bevat. Bij de derde methode verricht een expert van het

project speelde zich af in Nijmegen. ‘Voorheen werden

NFI handmatig metingen in het schriftbeeld. Binnen het

letters met de hand uitgeknipt; nu scannen we de

onderzoek van TRIGRAPH zijn de eerste twee manieren

handschriften in, waarna de computer de afzonderlijke

verbeterd. Daarnaast hebben we onderzocht wat je met

letters selecteert en deze vergelijkt met prototypes in de

de afzonderlijke methoden kunt bereiken, en of je tot

tabel. Daar is bij elke letter ook te vinden wat de exacte

een beter systeem komt door ze te combineren.’

schrijfvolgorde is‘, zegt Schomaker. ‘Een schrijver wordt

Eerder onderzoek van de RUG leidde in 2004 tot een

gekenmerkt door het specifieke gebruik van lettervor-

beeldgebaseerde methode die een doorbraak betekende.

men. Voor het vergelijken van twee schrijvers gebruiken

Het in Groningen uitgevoerde deel van TRIGRAPH bor-

we statistische methoden en combineren we informatie

duurde daarop voort en leidde tot het inzicht dat de

over textuur en lettervorm.‘ De ontwikkelde methoden

helling en kromming van een handschrift niet alleen

blijken zo krachtig, dat geschiedkundigen ze willen

samenhangen met de schrijfhand, maar ook met de

gebruiken bij hun onderzoek naar oude handschriften.

manier waarop iemand zijn pen vasthoudt. Schomaker:

‘Onze software helpt hen nu om de schrijvers van

oorkondes in tijd en plaats te volgen. Ook proberen

zijn, vertelt Schomaker. ‘We weten nu dat onze statisti-

historici te bepalen hoeveel verschillende personen

sche methoden bruikbaar zijn, maar alleen als je een

de Dode Zeerollen hebben geschreven.‘ Voor zowel

tekst van tenminste honderd letters hebt. Anders kun

paleografisch als forensisch onderzoek bleek beeldver-

je beter een expert inzetten. De lettergebaseerde

betering belangrijk. ‘We hebben de software voor beide

methode met een tabel blijft arbeidsintensief, omdat

beroepsgroepen verbeterd met de optie om vlekken en

de gebruiker op het scherm de letters van het schrift-

kreukels te verwijderen.‘

monster moet herschikken en controleren.’

In een vervolgproject binnen het aandachtsgebied

Hoe kijkt Schomaker terug op het onderzoek? ‘Het

politie en justitie hopen de onderzoekers de bruikbaar-

ToKeN-programma heeft het vakgebied patroonherken-

heid voor forensisch onderzoek verder te vergroten:

ning een enorme stimulans gegeven, omdat we zonder

‘In rechtszaken speelt de verklaarbaarheid van resulta-

ToKeN dit type onderzoek niet hadden kunnen doen.

ten een grote rol: waarom lijken twee schriftmonsters

Het is erg specifiek, en de resultaten zullen niet snel in

op elkaar? Het resultaat van de software laat op dat

het bedrijfsleven inzetbaar zijn. Voor zo’n project krijg

vlak nog te wensen over, de expert moet die uitleg zelf

je niet makkelijk een aanvraag gehonoreerd. Ondanks

opstellen. Ook het inbedden in de werkprocessen van

dat blijken de resultaten toch breed bruikbaar, wat het

een forensisch laboratorium is nog een puzzel. Zo’n ver-

project ook voor de wetenschap geslaagd maakt. In de

volgtraject past goed in het nieuwe NWO-programma

samenwerking met politie en justitie doet zich overigens

Forensic Science.‘

een merkwaardig verschijnsel voor: de hoge werkdruk in dat werkveld vraagt om innovatieve technologie,

Paradox

terwijl men tegelijkertijd vanwege de hoge werkdruk

Gaandeweg is steeds meer helder geworden wat de

niet te teveel wil veranderen. Voor informatici is het een

relatieve voor- en nadelen van de drie benaderingen

uitdaging om die paradox te doorbreken.’

43

ACCESS Agent-based Criminal Court Electronic Support Systems

Hoofdaanvrager Prof. dr. Frances (F.M.T.) Brazier (VU) Uitvoerders Martin (M.) Apistola - postdoc Reinier (R.J.) Timmer Martijn (M.E.) Warnier - postdoc

In het Journal of Software is in maart 2008 de publicatie ‘Security of Distributed Digital Criminal Dossiers‘ verschenen.

44

Looptijd 01-10-2005 tot 01-08-2009 Budget Eur 348.847 voor personele kosten Eur 27.000 voor materiële kosten Partners Rechtbank Amsterdam Raad voor de Rechtspraak

Vinden in een dossier De werkdruk van rechters en officieren van justitie

De omgeving van een digitaal dossier is (semi)gesloten,

wordt lager als ze makkelijk relevante informatie in

waardoor processen en toegang tot data duidelijk

dossiers kunnen vinden. Binnen ACCESS zijn hiertoe de

kunnen worden gedefinieerd. Dit maakte het mogelijk

eerste stappen gezet door het inzetten van software-

om de technische en juridische ontwerpvoorwaarden

agenten, die zelfstandig informatie kunnen beheren en

vast te stellen, en een prototype van een agentsysteem

verwerken.

te implementeren. Nauwe samenwerking met het Openbare Ministerie, de Rechtbank Amsterdam en de

Bij de rechtbanken van Amsterdam en Rotterdam

Raad voor de Rechtspraak bleek hiervoor noodzakelijk.

hebben studies plaatsgevonden over het gebruik van

De resultaten uit het onderzoek kunnen ook worden

digitale dossiers. De digitale beschikbaarheid van de

gebruikt voor algemene technische en juridische

informatie in dossiers bood uitdagingen voor het

aandachtspunten in meer open systemen, zoals in

verbeteren van werkprocessen, waarmee de werkdruk

e-government en medische domeinen.

van rechters en medewerkers bij rechtbank en parket is verlicht. Hiertoe zijn softwareagenten ingezet.

Highlights • Case study tijdens de 3rd International Multiconference

Softwareagenten zijn programma's die zelfstandig

on Computer Science and Information Technology

taken kunnen verrichten, waaronder het (proactief)

(IMCSIT'08) in Wisla, Polen.

beheren en verwerken van informatie in digitale dossiers. Aan het gebruik van softwareagenten zijn wel voorwaarden verbonden, zowel juridisch als technisch. Integriteitsmanagement is een van de belangrijkste

• Een presentatie tijdens de 11th International Conference on Artificial Intelligence and Law (ICAIL'07) in Stanford, USA. • Een workshop tijdens de 2nd International Workshop on

onderdelen van het systeemontwerp: verandert de data

Dependability and Security in e-Government (DeSeGov

tussentijds niet en verlopen de processen zoals bedoeld.

2007) in Wenen, Oostenrijk. 45

ANITA ANITA: Administrative Normative Information Transaction Agents Hoofdaanvrager Dr. mr. Kees (C.N.J.) de Vey Mestdagh (RUG)

Het onderzoek van Wouter Teepe (RUG), in het kader van ToKeN, kreeg veel aandacht in de pers; onder andere in de Staatscourant, De Volkskrant, NRC Handelsblad, NOS Radio1 en in een stuk van de Eerste Kamer.

46

Uitvoerders Huib (H.M.) Aldewereld - promotie 04-06-2007 Pieter (P.) Dijkstra - promotiedatum n.n.b. Hugo (H.H.) Kielman - promotiedatum n.n.b. Wouter (W.I.) Koelewijn - promotie 04-11-2009 Evgueni (E.N.) Smirnov - postdoc Pieter (P.H.M.) Spronck - postdoc Wouter (W.) Teepe - promotie 18-01-2007 Looptijd 01-11-2002 tot 19-06-2008 Budget Eur 477.457 voor personele kosten Eur 29.990 voor materiële kosten Partners Koninklijke Landelijke Politie Dienst (KLPD)

Privacy bij de politie Het ANITA-project heeft om een normatief multi-

gegevens en bepaalt welke verzoeken om informatie

agentsysteem ontwikkeld voor de toepassing van het

worden gehonoreerd op grond van regels voor informa-

privacyrecht in gedistribueerde databaseomgevingen,

tie-uitwisseling, bijvoorbeeld privacyregels en

zoals bij de politie.

privacybeleid. Zoekagenten en poortwachteragenten onderhandelen samen over het vrijgeven van bepaalde

In veel computernetwerken is informatie en de (juridi-

informatie. Een van de charmes van deze technologie is

sche en technische) kennis voor de verwerking van die

dat er parallellen zijn met de menselijke communicatie

informatie gedistribueerd aanwezig en aan voortdu-

en taakverdeling. Binnen het ANITA-project is de juridi-

rende verandering onderhevig. Dit is onder andere het

sche kennis geïnventariseerd waarover deze agenten

geval bij de politie. Informatie wordt hier uitgewisseld

moeten beschikken en zijn formele en technische

onder de beperkingen van het privacyrecht en de beper-

modellen uitgewerkt voor de toepassing van deze ken-

kingen vanuit het lokale beleid, zoals de bescherming

nis in multi-agentsystemen. De resultaten kunnen onder

van lokale informanten. Er is geen centraal punt waar

andere worden toegepast in de rechtspraktijk.

alle informatie en (lokale) kennis toegankelijk zijn. Er bestaat wel behoefte aan het uitwisselen van informatie

Highlights

over het netwerk, maar een enkel centraal opererend

• Door een eigen bijdrage van de RUG leidt het project tot

computerprogramma kan dit probleem niet oplossen. Intelligent agents wisselen min of meer autonoom en

vijf in plaats van drie promoties. • Het onderzoek zorgt voor veel wetenschappelijke spin

op grond van eigen (lokale) kennis informatie uit in een

off. Zo is er vervolgonderzoek gaande op het gebied van

computernetwerk. Een zoekagent gaat op basis van de

norm based agent negotation, onder andere resulterend

informatiebehoefte van zijn menselijke gebruiker in het

in de bijdrage ‘An implementation of norm-based agent

netwerk op zoek naar bepaalde informatie. Een poort-

negotiation’ tijdens de 11th International Conference on

wachteragent beheert een lokale database met

Artificial Intelligence and Law in Stanford in 2007. 47

BEST Intelligent disclosure of case-law using Semantic Web technology to determine BATNAs in damages disputes Hoofdaanvrager Dr. Arno (A.R.) Lodder (VU)

Op het terrein van EBay in San Jose is een workshop georganiseerd ter gelegenheid van de 4th International Workshop on Online Dispute Resolution in juni 2007.

48

Uitvoerders Rinke (R.J.) Hoekstra - postdoc Michel (M.C.A.) Klein - postdoc Rory (R.L.L.) Sie Wouter (W.) van Steenbergen Heiner (H.) Stuckenschmidt - postdoc Elisabeth (E.M.) Uijttenbroek Looptijd 01-02-2005 tot 01-01-2011 Budget Eur 340.049 voor personele kosten Eur 10.000 voor materiële kosten Partners Leibniz Center for Law Rechtenfaculteit van de UvA

Mediation of een proces? De keuze tussen een rechtszaak en mediation wordt

toepassingsdomein door het open karakter van het

meestal gemaakt op basis van de verwachte uitkomst

recht en een gebrek aan een bruikbare ontologie.

van een gerechtelijke procedure. BEST ontwikkelde een

Een ontologie verschilt van een databank doordat een

model waardoor een consument beter de keuze kan

ontologie niet alleen feiten bevat maar ook regels,

maken.

gevat in logische formules. Uit dergelijke regels zijn nieuwe feiten af te leiden.

Door het toenemend aantal zaken is de druk op de rechterlijke macht groot en staan alternatieve vormen

Concrete resultaten zijn onder andere een website met

van geschillenbeslechting, in het bijzonder mediation,

de mogelijkheid voor leken om in hun eigen woorden

in de belangstelling. Voor de keuze tussen een rechts-

een verhaal in te voeren en een website met gangbare

zaak en mediation is informatie over de waarschijnlijke

begrippen uit de jurispudentie. Verder is een vergelij-

uitkomst van een gerechtelijke procedure relevant. Deze

king tussen de ontologie van leken en juristen gemaakt

informatie wordt in de juridische onderhandelingslitera-

en de invoering hiervan in het programma Protegé.

tuur Best Alternative To a Negotiated Agreement (BATNA) genoemd.

Highlights • De organisatie van de ‘Workshop on Semantic Web

Binnen de informatica was het niet mogelijk om op basis van relevante jurisprudentie nauw verwante

technology for Law‘ te Stanford in 2007. • Een bijdrage ‘Retrieval of Case Law to Provide Layman

documenten te vinden in rechterlijke uitspraken. In dit

with Information about Liability: Preliminary Results of

project is hiervoor de techniek toegepast van ontology-

the BEST-project‘ aan het boek ‘Computable models of

based search en navigation.

the law‘ van Casanovas.

Het juridische domein in het algemeen en schadevergoedingsrecht in het bijzonder, vormt een uitdagend

• Lancering van een experimental portal met een basisset aan juridische begrippen in juni 2009. 49

CASSANDRA Context-Aware SenSing for AggressioN Detection and Risk Assessment Hoofdaanvrager Prof. dr. Dariu (D.M.) Gavrila (UvA) Uitvoerders Martijn (M.) Liem - promotiedatum n.n.b. Julian (J.F.P.) Kooij - postdoc Johannes Dirk (J.D.) Krijnders - promotiedatum n.n.b. Wojciech (W.P.) Zajdel - postdoc

Tijdens SIREN (Scientific ICT Research Event Netherlands) is door NWO Exacte Wetenschappen de I/O Award 2007 uitgereikt aan Dariu Gavrila, voor de beste publiciteit rondom ICT-onderzoek.

50

Looptijd 01-09-2005 tot 01-10-2010 Budget Eur 384.311 voor personele kosten Eur 24.000 voor materiële kosten Partners Leibniz Center for Law Rechtenfaculteit van de UvA

Detectie van agressie Binnen CASSANDRA is een intelligent bewakingssys-

met beelden die vanuit een bewakingsoogpunt moge-

teem onderzocht dat agressieve situaties in publieke

lijk relevant zijn. Omdat de aanloop naar openlijke

ruimtes herkent. In een realistische, drukke omgeving

agressie moeilijk is te detecteren, zijn binnen CASSAN-

worden posities en bewegingen van de aanwezige

DRA zowel beelden als geluiden geanalyseerd.

mensen en het omgevingsgeluid geanalyseerd, om bij

Voor de beeldanalyse zijn de posities en bewegingen

gevaar een operator in de controlekamer te kunnen

van personen van belang. Voor de geluidsanalyse is een

waarschuwen.

verzameling relevante geluiden gedefinieerd, zoals

Door het toenemende belang van publieke veiligheid

gelegd tussen het beeld en geluid, waarbij kennis van

worden cameratoezichtsystemen steeds vaker ingezet

de toepassingsomgeving is betrokken. Dit heeft

voor het beveiligen van stations, winkelcentra, hang-

uiteindelijk geresulteerd in een realistische veldtest op

plekken, enzovoorts. Bij traditionele cameratoezicht-

het Amsterdam-Amstel station.

geschreeuw en brekende objecten. Vervolgens is de link

systemen speurt een menselijke uitkijker in een controlekamer naar een muur van beeldschermen. Dit

Highlights

is niet alleen duur, maar ook foutgevoelig.

• CASSANDRA werd in verschillende krantenartikelen

Vandaar de roep om slimme camera's. Camera’s die niet

(NRC, de Volkskrant) genoemd, en verscheen KRO’s

slechts kijken, maar ook zien. Zelfdenkende ogen, die

programma ‘De Toekomst is Nu’ (April 2008).

op eigen houtje de beelden kunnen selecteren die de moeite van het bekijken waard zijn. Zodat de bewakers

• Op de IEEE International Conference on Advanced Video and Signal-Based Surveillance (AVSS’07) in Londen heeft

in de controlekamer daar hun aandacht op kunnen

het artikel ‘CASSANDRA: audio-video fusion for aggres-

richten.

sion detection’ de Best Paper Award gewonnen.

Geavanceerde bewakingssystemen kunnen beschikbare informatie verrijken door de uitkijker slechts te voorzien 51

DALE Data Assistance for Law Enforcement

Hoofdaanvrager Dr. Walter (W.A.) Kosters (UL) Uitvoerders Tim (T.K.) Cocx - promotie 02-12-2009 Jeroen (J.F.J.) Laros - promotie 21-12-2009 Looptijd 01-03-2005 tot 01-05-2009

In verschillende jaren is een bijdrage geleverd aan de Belgium-Netherlands Conference on Artificial Intelligence (BNAIC) en de Industrial Conference on Data Mining (ICDM).

52

Budget Eur 320.058 voor personele kosten Eur 10.000 voor materiële kosten Partners Koninklijke Landelijke Politie Dienst (KLPD)

Data in de strijd tegen criminaliteit In de strijd tegen criminaliteit worden enorme data-

iemand die 100 fietsen steelt en iemand die er 101

bases doorzocht naar patronen. Door de inzet van

steelt. Dit verschil is gemodelleerd.

data mining is dit binnen het DALE-project mogelijk

Tevens is een raamwerk ten behoeve van data mining

gemaakt.

voor wetshandhaving gecreëerd op basis van werkelijke problemen uit het toepassingsgebied en in samenwer-

Het hoofddoel binnen DALE was het vinden van begrij-

king met domeinexperts. Criminele carrières zijn met

pelijke patronen in een enorme hoeveelheid informatie.

elkaar vergeleken om voorspellingen te doen over het

Een dergelijke zoektocht is onder andere onmisbaar

verdere verloop daarvan.

voor de wetshandhaving, in het bijzonder voor

Tot slot is het automatisch detecteren van misbruik op

crimineel onderzoek, en nog specifieker in de strijd

websites van sociale netwerken onderzocht. De wens

tegen het terrorisme. Het onderzoek richtte zich op

van geheimhouding, cruciaal bij veel activiteiten binnen

semigestructureerde data en basispatronen.

de wetshandhaving, en de wens van openbaarheid van

Databases op het gebied van wetshandhaving zijn

onderzoeksresultaten blijven echter op gespannen voet

doorgaans erg groot, en bevatten gegevens van vrije

met elkaar staan.

en veranderende formaten. De data zijn tijdelijk, dynamisch en vol ruis. En om het geheel nog ontoe-

Highlights

gankelijker te maken wordt informatie vaak ook nog

• Het verzorgen van een workshop ‘Enhancing the Auto-

gemaskeerd.

mated Analysis of Criminal Careers‘, op het gebied van

Binnen het doorzoeken van de databases staan

Link Analysis, Counterterrorism, and Security (LATCS),

afstandsmaten centraal. Ter illustratie, het verschil

tijdens de SIAM International Data Mining Conference in

tussen een persoon die geen fietsen steelt en iemand

2008 in Atlanta.

die er 1 heeft gestolen is groter dan het verschil tussen

53

EVIDENCE Making sense of EVIDENCE: software support for crime investigations Hoofdaanvrager Prof. dr. mr. Henry (H.) Prakken (UU) Uitvoerders Floris (F.J.) Bex - promotie 29-10-2009 (cum laude) Susan (S.W.) van den Braak - promotie 15-03-2010

Het artikel ‘Formalising Argumentative Story-based Analysis of Evidence’ heeft de Don Berman Award for Best Student Paper op de 11th International Conference on Artificial Intelligence and Law (ICAIL 2007) gewonnen.

54

Looptijd 01-03-2005 tot 16-06-2009 Budget Eur 320.058 voor personele kosten Eur 32.000 voor materiële kosten

Gekoppelde media Rechercheonderzoek is een ingewikkeld en intensief

De software stelt rechercheurs in staat om zowel hun

proces, waarbij fouten ernstige gevolgen kunnen

hypotheses te formuleren als hun scenario's van wat er

hebben. EVIDENCE onderzocht software waarmee

gebeurd zou kunnen zijn. Dit sluit aan bij recente theo-

rechercheurs beter overzicht krijgen van een complexe

rieën dat dit de meest praktisch werkbare manier is om

zaak en waarmee een onderzoeksdossier inzichtelijker

een grote hoeveelheid bewijs te structureren. Dit inzicht

wordt voor latere fases van een onderzoek.

is nader uitgewerkt in een theoretisch deelonderzoek naar de verankering van scenario's in het beschikbare

De ontwikkelde software helpt rechercheurs om hun

bewijs door middel van evidentiële redeneringen.

denken over een zaak in kaart te brengen en de denkpatronen vervolgens met hulp van de computer te

Highlights

analyseren. Zo kan een rechercheur op basis van het ver-

• Het artikel ‘Sense-making software for crime investiga-

zamelde bewijs hypotheses opstellen en gestructureerd aangeven hoe het bewijs de hypotheses ondersteunt dan wel in twijfel trekt. Met hulp van een computer

tion: how to combine stories and arguments?‘ is in het journal Law, Probability & Risk gepubliceerd in 2007. • Een ‘Workshop on Reasoning about Legal Evidence’

kan de rechercheur zo'n structurering visualiseren en

tijdens de 23rd World Congresses on Philosophy of Law

analyseren en zo patronen, inconsistenties of ontbre-

and Social Philosophy in Krakow in augustus 2007.

kend bewijs ontdekken. Doordat de structurering wordt verbonden met het oorspronkelijke onderzoeksdossier, kunnen anderen in latere fases van een onderzoek beter inzicht krijgen in het dossier.

55

IPOL Intelligence led policing. An effective law enforcement strategy or a threat to civil liberties and the principles of criminal law? Hoofdaanvrager Prof. mr. Theo (Th.A.) de Roos (UvT) Uitvoerders Stijn (S.) Vanderlooy - promotie 01-07-2009 Thijs (T.) Vis - promotiedatum n.n.b. Looptijd 01-09-2005 tot 01-09-2009

Stijn Vanderlooy is gepromoveerd op digitale data-analyse binnen de wetshandhaving, waarmee hij kan voorspellen of iemand een terrorist is.

56

Budget Eur 320.058 voor personele kosten Eur 15.000 voor materiële kosten

Privacygevoelige ICT profielen Het inzetten van door ICT gegenereerde profielen en

is antwoord gegeven op de volgende vragen. Wat is

analyses blijft lastig binnen de politie. Aan de ene kant

de stand van zeken op het gebied van intelligence led

moet de privacy worden gewaarborgd en aan de

policing in Nederland en Europa? Hoe is de verhouding

andere kant vormt de bescherming van de privacy een

tussen privacybeginselen en beginselen van het straf-

obstakel om de juiste analyses te doen. Binnen IPOL is

recht? Moeten deze beginselen worden aangepast aan

onderzocht welke ICT middelen wel effectief kunnen

de noden van de tijd? Hoe ver is intelligence led policing

worden ingezet.

in de Verenigde Staten ontwikkeld, en hoe wordt daar omgegaan met de balans tussen veiligheid, privacy en

In Nederland wordt het sturingsconcept 'informatie-

de beginselen van het strafrecht? Welke ICT-middelen

gestuurde opsporing' steeds verder doorgevoerd. De

dienen aanwezig te zijn alvorens intelligence led poli-

ontwikkeling ging echter voorbij aan de fundamentele

cing op verantwoorde wijze kan worden ingezet?

vragen over de toepasbaarheid binnen ons strafrechts-

Bijzondere aandacht is besteed aan de relatie tussen de

systeem, bijvoorbeeld waarborgen tegen inbreuk op de

proactieve rechercheactiviteiten van de politie en de

persoonlijke levenssfeer. Anderzijds lieten privacy- en

werkzaamheden van de inlichtingendiensten, mede in

strafrechtelijke bezwaren geen ruimte voor nieuw

historisch perspectief.

beleid. Complicerende factor hierbij is dat de mensen laag in de politieorganisatie de meeste discretionaire

Highlights

bevoegdheden hebben, en is er geen strakke hiërarchi-

• Bijdrage aan het boek ‘intelligence led policing ontleed‘

sche controle.

in 2005. • Publicatie ‘Veranderingsprocessen bij politie: intelligence

Een onderdeel van intelligence led policing helpt de

led policing‘ in het journal Panopticon: tijdschrift voor

politie in haar opsporingswerk met een proactieve

strafrecht, criminologie en forensisch welzijnswerk in

handhaving middels profielen en analyses. Binnen IPOL

2008. 57

LAYLA The Laymans Legal Assistant: Assisting consumers in businessconsumer conflicts by diagnosing, advising and mediating Hoofdaanvrager Prof. dr. Ronald (R.E.) Leenes (UvT) Uitvoerders Michiel (M.) van Galen Laura (L.) Klaming - postdoc Jelle (J.) van Veenen - promotiedatum n.n.b.

Elementen van het binnen Layla ontwikkelde model zijn toegepast in onder andere de rechtwijzer (www.rechtwijzer.nl, 7500 bezoekers per maand).

58

Looptijd 15-03-2005 tot 15-03-2009 Budget Eur 234.095 voor personele kosten Eur 18.500 voor materiële kosten Partners Raad voor de Rechtsbijstand

Zelf geschillen oplossen Hoe kan je als consument een geschil oplossen, zonder

De communicatie tussen partijen is van groot belang.

dat je meteen kosten maakt voor juridische bijstand?

Layla maakt een constructief communicatieproces

Het Layla-project ontwikkelt een model voor geschil-

mogelijk, waarbij partijen zakelijk praten over hun

oplossing op basis van integratief onderhandelen. Hoe

geschil, maar waarin ook ruimte is voor emoties. Layla

kan een consument worden ondersteund in het zelf aan

zorgt voor beter geïnformeerde consumenten die een

de slag gaan? Welke informatie heeft iemand nodig om

realistisch beeld hebben ten aanzien van de mogelijk-

sterk te staan, en hoe wordt deze informatie gebruikt?

heden hun geschil op te lossen. Zij realiseren deze oplossing zoveel mogelijk met behulp van ODR in plaats

Mensen weten vaak niet waar ze juridisch aan toe zijn

van met een beroep op de rechter.

wanneer ze een geschil krijgen met een ander. Hierdoor zien sommigen ervan af hun recht te halen, terwijl

Highlights

anderen hun geschil onverantwoord en tegen relatief

• Er is een innovatief model ontwikkeld voor het online

hoge kosten doorzetten tot aan de rechter. Dit terwijl

oplossen van geschillen.

alternatieve methoden, zoals Alternative Dispute Reso-

• Samenwerking met de praktijk.

lution (ADR) en Online Alternative Dispute Resolution

• Er is fundamenteel empirisch onderzoek uitgevoerd naar

(ODR), beschikbaar zijn.

de effecten van informatie in online onderhandeling. Twee publicaties kwamen hieruit voort: ‘I want the oppo-

Online hulpmiddelen op basis van integratief onderhan-

site of what you want: Reducing fixed-pie perceptions in

delen zijn ontwikkeld. Hierin is aandacht voor het

online negotiations‘ in het Journal of Dispute Resolution,

proces (hoe kan je het beste met een tegenpartij

en een publicatie in ontwikkeling ‘Facilitating Dispute

praten? Wat moet je zeggen?) en voor de benodigde

Resolution: Do People Use Objective Criteria When They

kennis (wat is het geschil je waard? Wat is een normale

Negotiate Outcomes?‘.

oplossing voor dit probleem?). 59

TRIGRAPPH tri-modal writer identification

Hoofdaanvrager Prof. dr. Lambert (L.R.B.) Schomaker (RUG) Uitvoerders Ralph (R.M.J.) Niels - promotiedatum n.n.b. Axel (A.A.) Brink - promotiedatum n.n.b. Looptijd 16-01-2005 tot 01-12-2009

Het programma heeft de bijdrage ‘Towards explainable writer verification and identification using vantage writers‘ geleverd aan de 9th International Conference on Document Analysis and Recognition (ICDAR’07).

60

Budget Eur 328.051 voor personele kosten Eur 16.000 voor materiële kosten Partners Nederlands Forensisch Instituut (NFI)

De schrijver ontmaskerd Binnen TRIGRAPH is gewerkt aan computerprogramma’s

methoden heeft een belangrijke verbetering teweeg-

om handschriften in grote databases te herkennen.

gebracht in forensische schrijveridentificatie.

Niet alleen op basis van het schriftbeeld, maar ook door

Inzichten uit de automatische herkenning van tekst en

middel van patroonherkenning en beeldbewerking.

de daarbij gebruikte letterprototypes zijn toegepast bij schrijveridentificatie: er wordt kwantitatief bepaald

In het licht van toenemende terroristische dreigingen en

welke lettervormen door een schrijver worden gebruikt.

de ontwikkeling van witteboordencriminaliteit, wordt

Zo kan er automatisch worden gezocht naar documenten

forensisch onderzoek naar automatische schrijveridentifi-

met een stijlspecifieke verzameling van lettervormen.

catie steeds belangrijker. Bestaande systemen voor het

De deelnemende instituten hebben al veelbelovende

automatisch identificeren van een schrijver op basis van

resultaten bereikt in de berekening van een schriftbeeld

een schriftmonster waren voor grote verbetering vatbaar.

op basis van beeldkenmerken.

Het onderzoek vertaalt kennis uit de forensisch, grafonomisch, cognitief en informaticaonderzoek naar werkende

Highlights

en bruikbare computerprogramma's door de integratie

Drie publicaties in de IEEE Transactions. on Pattern Analysis

van kennis over ‘machinale intelligentie’, menselijke

and Machine Intelligence (PAMI):

cognitie, forensische expertise en menselijk schrijfgedrag.

• ‘Writer Identification and Verification Using Textural

Traditionele schrijveridentificatie is gebaseerd op handmatige metingen in het schriftbeeld, maar de toegenomen rekenkracht en ontwikkelingen op het gebied

and Allographic Features‘ in een speciale uitgave over ‘Biometrics: Progress and Directions‘ • ‘Automatic writer identification using connected

van beeldbewerking en patroonherkenning maken het

component contours and edge based features of

mogelijk om automatisch beeldkenmerken en letter-

uppercase Western script‘

vormen te gebruiken in grootschalige zoekprocessen in beeldbestanden. De combinatie van de drie hoofd-

• ‘Automatic allograph matching in forensic writer identification‘ 61

62

ZORGSECTOR Interview Ameen Abu-Hanna Projectomschrijvingen

63

‘Informatici en artsen vullen elkaar prima aan‘

64

Optimaal benutten van informatie op de IC

Dr. Ameen Abu-Hanna

In het project I-CATCHER werkten informatici samen met artsen van de afdeling Intensive Care om informatieproblemen op te lossen. Projectleider Ameen Abu-Hanna van de afdeling Klinische Informatiekunde van het AMC aan het woord.

Op een afdeling Intensive Care (IC) is informatie letterlijk van levensbelang. Patiënten worden daarom 24 uur per dag door allerlei apparatuur gemonitord. ‘Dat resulteert in enorme databases en de vraag is hoe je daar iets zinnigs uit kunt halen om de kwaliteit van intensieve zorg te verbeteren’, zegt Ameen Abu-Hanna. ‘Zijn er patronen in te herkennen, waardoor je eerder kunt ingrijpen als het met een patiënt slechter gaat? Kun je modellen ontwikkelen om mortaliteit te voorspellen?’ Data mining was dan ook een van de onderzoekslijnen van het project I-CATCHER, dat tussen 2003 en 2007 door twee postdocs en een aio van UMC/UvA en VU is uitgevoerd.

65

Automatisch matchen

eerste‘, vertelt Abu-Hanna. ‘Het leuke is dat zo’n match-

De andere onderzoekslijn van I-CATCHER had betrek-

ingsalgoritme ook andere toepassingsmogelijkheden

king op de gebruikte terminologie in de zorg.

heeft. Je kunt een arts bij het intypen van de opnamere-

‘Ziekenhuizen gebruiken verschillende vocabulaires om

den alternatieven aanbieden, waardoor de kwaliteit van

ziekten, of in ons geval redenen voor IC-opname, te

data-invoer sterk verbetert. Ook kun je de begrippenlijst

beschrijven. Het gebrek aan een gemeenschappelijke

van een ziekenhuis of afdeling op kwaliteit beoordelen:

taal maakt het lastig op een hoger niveau data te analy-

door deze te matchen met een standaardlijst is te zien

seren, bijvoorbeeld om patiënten te selecteren voor een

of de lijst compleet en voldoende specifiek is.‘

studie. We hebben daarom algoritmes ontwikkeld om

66

termen automatisch te matchen.‘ Dat gebeurde met

Data mining

behulp van de vocabulaires van het OLVG en het AMC,

Het eerdergenoemde data mining-deelonderzoek

die op twee manieren zijn gematcht: door naar over-

leverde ook mooie resultaten op, vindt Abu-Hanna.

eenkomsten in de woorden te zoeken en door het

‘Op een IC wordt dagelijks per patiënt van zes organen

gebruik van achtergrondkennis. Deze achtergrondken-

bijgehouden hoe goed zij functioneren. Dat levert een

nis bestond uit de hiërarchische indeling van het

score per orgaan en een totaalscore op. In deze scores

AMC-vocabulaire. Het algoritme kan daarmee aan woor-

hebben we naar patronen gezocht, bijvoorbeeld de

den betekenis toekennen, waardoor bijvoorbeeld aorta

verandering van de nierfunctie op drie opeenvolgende

gematcht wordt met slagader. ‘We hebben getest welk

dagen. Onze modellen gebruiken die patronen, naast

algoritme het beste werkt door een arts van het AMC

andere patiëntgegevens, om per dag per patiënt een

bij tweehonderd termen handmatig te laten aangeven

prognose – de kans op overlijden in IC of ziekenhuis –

welke bij elkaar horen. Het tweede algoritme scoort op

op te stellen. Zulke voorspellingen geven inzicht in de

een dergelijke Gouden Standaard veel beter dan het

patiëntenpopulatie en je kunt ze gebruiken om artsen,

patiënten en hun familieleden te informeren. Tot nu toe

Prettige samenwerking

gaan artsen vooral op hun eigen kennis en ervaring af;

De samenwerking tussen informatici en artsen verliep

het zou interessant zijn om te onderzoeken of een arts

heel prettig, vindt Abu-Hanna. ‘We vullen elkaar prima

anders handelt als hij de prognose van het model te

aan: informatici zitten vol ideeën voor allerlei – soms

zien krijgt. Stelt hij zijn eigen inschatting bij, welk effect

wilde – toepassingen, terwijl de Intensive Care arts het

heeft dat op zijn beslissingen en gaat hij anders met

vooral praktisch wil houden. Dat geeft ons sturing en

patiënten en hun familie communiceren? Dat willen we

maakt wat we doen zeer zinnig. Een uitdaging voor

graag verder onderzoeken.’

informatici in de zorg is het grote verschil tussen beide

Ook is gezocht naar patronen in orgaanfalen op opeen-

disciplines: het kost tijd om elkaar te begrijpen. Dit

volgende dagen. ‘Als de ademhaling van een patiënt op

project heeft voor mij de belangrijke rol van de klinische

dag twee faalt, wat kun je dan op dag drie bij hem ver-

informatica weer eens bevestigd.‘ Lastig aan dit soort

wachten? Blijft de situatie stabiel of zet er een nieuw

interdisciplinaire onderzoeken, vertelt Abu-Hanna

orgaanfalen in?’, legt Abu-Hanna uit. De nieuwe model-

tot slot, is dat er zo moeilijk geld voor te vinden is

len maken voor intensivisten de relaties tussen het falen

vanwege de traditionele segregatie tussen de discipline-

van het ene orgaansysteem en het andere duidelijk.

gebonden subsidiegevers. ‘Juist daarom was het ToKeN-

Voor zowel het voorspellen van mortaliteit als van

programma zo waardevol‘, zegt hij.

orgaanfalen op de volgende dag zijn de modellen gevalideerd door ze te vergelijken met wat er werkelijk gebeurde. ‘De gebruikte technieken blijken opvallend veel meerwaarde te bieden, omdat we de artsen daarmee patronen kunnen tonen.’

67

I-CATCHER Intensive-Care Acces to Terminology & Course of Health Exploration & Retrieval Hoofdaanvrager Dr. Ameen (A.) Abu-Hanna (AMC)

Vanuit I-Catcher is een vervolgproject opgestart om de voorspellende modellen op temporele patronen toe te passen in twee Intensive Care Units in Nederland.

68

Uitvoerders Edwina (E.) Beirne Michel (M.C.A.) Klein - postdoc Niels (N.B.) Peek - postdoc Antoon (A.K.) Prins Winston (W.G.) Tjon Sjoe Sjoe Tudor (T.) Toma Looptijd 01-10-2003 tot 01-10-2007 Budget Eur 409.265 voor personele kosten Eur 13.614 voor materiële kosten Partners Klinische Informatiekunde (AMC) Sectie Kunstmatige Intelligentie (VU)

Inzicht in de Intensive Care I-CATCHER leverde methoden voor de IC-afdeling van

reerde terminologie op een gestructureerde termino-

een ziekenhuis om terminologiesystemen met elkaar te

logie over opnameredenen af te beelden. Hiervoor is

vergelijken en om voorspellende temporele patronen in

gebruik gemaakt van semantic webideeën.

data te ontdekken. Voorspellende modellen: Over iedere IC-patiënt worden Intensieve zorg is een complexe en kostbare vorm van

dagelijks vele gegevens verzameld, waaruit voorspel-

medische zorgverlening, waarin het optimaal benutten

lende modellen zijn geïnduceerd. Het eerste model

van de beschikbare informatie en kennis cruciaal is.

voorspelt elke dag voor elke patiënt de kans op zieken-

Informatiemanagement wordt in de moderne IC-afdeling

huismortaliteit door het identificeren van temporele

ondersteund door ICT-hulpmiddelen zoals het Elektro-

patronen die vervolgens zijn gebruikt als variabelen in

nisch Patiënten Dossier (EPD). Binnen I-CATCHER zijn

een logistisch regressiemodel. Het tweede model voor-

twee nieuwe informatiemanagementfuncties onder-

spelt elke dag de kans op orgaanfalen op de volgende

zocht. Allereerst het afbeelden van een terminologie op

dag. Hiervoor zijn Markov-modellen gebruikt.

een andere terminologie met achtergrondkennis, en ook het voorspellen van ongunstige gebeurtenissen (zoals

Highlights

mortaliteit en orgaanfalen) met temporele patronen.

• Gastpresentaties zijn gehouden tijdens ICT-Delta (2007), het NWO-congres Digitalisering en Informatisering

Terminologiesystemen: Veel medische kennis is gebaseerd op een uitgebreid medisch-biologisch vocabulaire waarin ziekten, symptomen en behandelingen zijn beschreven. Er zijn vele terminologiesystemen in

(2005), en de Token workshop tijdens het MIC (2003). • I-Catcher heeft 37 bijdragen geleverd aan internationale conferenties. • Twintig publicaties op het gebied van (medische) infor-

omloop, die verschillen in gebruikte termen en structuur.

matica en geneeskunde zijn verschenen in internationale

Met behulp van achtergrondkennis is een niet-gestructu-

tijdschriften. 69

DIME Distributed Interactive Medical Exploratory for 3D Medical Images Hoofdaanvrager Prof. dr. ir. Hans (J.H.C.) Reiber (LUMC) Uitvoerders Lilit (L.) Axner - promotie 18-12-2007 Jan-Maarten (J.M.) Luursema - promotiedatum n.n.b. Jorrit (J.) Schaap -postdoc

Interview met Lilit Axner op IPN-website (www.ictonderzoek.net) en in I/O Magazine.

70

Looptijd 01-10-2002 tot 01-01-2008 Budget Eur 359.815 voor personele kosten Eur 19.114 voor materiële kosten Partners Universiteit van Amsterdam (UvA) Leids Universitair Medisch Centrum (LUMC) Universiteit Twente (UT)

Bereken de doorbloeding In het kader van DIME is software ontwikkeld waarmee,

omleidingen (bypasses) op de doorbloeding te bepalen.

op basis van 3D scans, de anatomie van en de bloed-

Dit is gedaan voor beelden van de grotere slagaders,

stroming door vaten wordt berekend. Ook kan het effect

met name van de abdominale aorta, gebaseerd op

van omleidingen op de doorbloeding worden bepaald.

nieuwe internetontwikkelingen in transparante datadistributie met behulp van de gridtechnologie, 3D

Sinds enkele jaren is de ontwikkeling, de research en

beeldanalyse en virtual reality.

het klinisch gebruik van moderne medische scanners in een stroomversnelling geraakt. Deze scanners leveren

Een trainingssysteem voor jonge chirurgen is opgezet

een zeer grote hoeveelheid driedimensionale (3D)

om voor een operatie een operatieplan vast te stellen.

beeldgegevens over de anatomie van het menselijk

De focus lag hierbij niet alleen op het aanleren van han-

lichaam en de functies van organen. In de huidige

delingen, maar ook op het leerproces dat de chirurgen

klinische praktijk wordt nog maar in zeer beperkte mate

doormaken. Onder andere de leercurves van chirurgen

gebruik gemaakt van de beschikbare 3D informatie,

zijn in kaart gebracht.

aangezien de medisch specialisten hun beslissingen nog steeds voornamelijk baseren op de visuele beoordeling van de afzonderlijke tweedimensionale doorsneden. Informatica Lilit Axner heeft samen met collega's de

Om deze gegevensstromen optimaal te benutten is

HemoSolve ontwikkeld, een computersysteem dat de

computersoftware nodig, die de specialist in staat stelt

bloedstroom in slagaderen kan simuleren. Daarnaast kan

om gegevens in 3D te beoordelen en om objectieve

het chirurgische ingrepen als een bypassoperatie naboot-

gegevens uit de beelden af te leiden. Binnen DIME is

sen en het succes van deze ingreep bepalen. HemoSolve

software ontwikkeld om de anatomie en de bloeddoor-

kan worden gebruikt voor de planning van operaties of

stroming door vaten te berekenen, en het effect van

voor de training van artsen. 71

MIA Medical Information Agent

Hoofdaanvrager Prof. dr. ir. Arie (A.) Hasman (AMC) Uitvoerders Loes (L.M.M.) Braun - promotie 29-10-2008 Agnieszka (A.A.) Latoszek-Berendsen promotiedatum n.n.b. Ivan (I.B.) Vermeulen - promotiedatum n.n.b.

Loes Braun won de ToKeN Best Oral Presentation Award 2006 en de Best Poster Award tijdens de European Coordinating Committee for Artificial Intelligence (ECAI’07).

72

Looptijd 01-12-2002 tot 01-02-2009 Budget Eur 389.637 voor personele kosten Eur 32.334 voor materiële kosten Partners Instituut voor Kennis en Agent Technologie (UM) Medische Informatica (UM) Computational Intelligence and Multi-agent Games (CWI) Klinische Informatiekunde (AMC)

Relevante informatie over chronische patiënten Het MIA-project kende twee doelen. Ten eerste onder-

met betrekking tot de patiënt. Artsen hebben vaak

steunt MIA de arts bij het nemen van betere medische

onvoldoende tijd om relevante literatuur op te zoeken.

beslissingen. Ten tweede worden afspraken gemaakt die

Door gebruik te maken van het elektronisch patiënten-

efficiënter zijn voor zowel de patiënten als de ziekenhuis-

dossier kan de retrievalagent bepalen wat de mogelijke

afdelingen.

informatiebehoefte van de arts is, en zelfstandig op zoek gaan naar relevante literatuur. Uit evaluatie bleek

Het MIA-project onderzocht hoe softwareagenten

dat deze agent prima in staat is relevante informatie-

kunnen worden ingezet. Zo'n agent is een computer-

behoeften te formuleren, en in beperktere mate daarbij

programma dat namens een menselijke gebruiker

ook relevante literatuur te vinden.

bepaalde taken zelfstandig kan uitvoeren. De eerste persoonlijke agent is de feedbackagent:

Patiënten willen zo kort mogelijk wachten, terwijl afde-

deze helpt de arts beter gebruik te maken van medische

lingen hun mensen en apparatuur zo efficiënt mogelijk

richtlijnen. Er bestaan vele richtlijnen voor diagnose en

willen inzetten. Door het onderzoek worden afspraken

behandeling van ziekten. Zo zijn er programma's die de

efficiënter en flexibeler ingepland, waarbij rekening

arts waarschuwen als deze van de richtlijn afwijkt. Het

wordt gehouden met verschillende groepen patiënten.

kan echter gebeuren dat de arts om een goede reden van

Hierbij werd gebruikt gemaakt van de afspraakgege-

de precieze richtlijn afwijkt, maar wel volgens de intentie

vens van patiënten van het AMC.

van de richtlijn handelt. In dat geval moet de arts niet worden gewaarschuwd. De feedbackagent kent de inten-

Highlights

ties van de richtlijn en kan erover redeneren.

• Publicatie in Artificial Intelligence in Medicine.

De tweede persoonlijke agent is de retrievalagent: deze

• Twee publicaties in het International Journal of Medical

voorziet de arts van medische literatuur die relevant is

Informatics. 73

NARRATOR Narrative Disclosure of Health Care Knowledge

Hoofdaanvrager Dr. Pieter (P.J.) Toussaint (LUMC) Projectleider Prof. dr. Bertie (J.H.M.) Schonk (LUMC)

Publicatie ‘Illness stories on the Internet: what do breast cancer patients want at the end of treatment?‘ in het journal Psycho-oncology.

74

Uitvoerders Henk Herman (H.H.) Nap - promotie 18 -03-2008 Hilke (H.G.B.) Reckman - promotie 18-03-2009 Regina (R.I.) Overberg - promotiedatum n.n.b. Looptijd 01-12-2002 tot 18-03-2008 Budget Eur 389.637 voor personele kosten Eur 13.614 voor materiële kosten Partners Klinische informatiekunde (LUMC) Semantische representatie (UL) Mens-machine-interactie (TU/e)

Verhalende informatie Doel van het NARRATOR-project was het gebruik van

Een deelonderzoek heeft zich gericht op borstkanker-

narratieven (verhalen) in zorgcommunicatie door de

verhalen. Hieruit bleek dat de mogelijkheden van het

inzet van ICT mogelijk te maken en te ondersteunen.

internet nog niet ten volle worden benut. Het ontsluiten van verhalen met behulp van taaltechnologie bleek lastig

Kennisontsluiting binnen de gezondheidszorg heeft vaak

en vereiste aanpassingen aan de methode waarmee

een sterk medisch-feitelijk karakter. Moratiliteitsstatistie-

natuurlijke taal wordt geïnterpreteerd door de computer.

ken en medische feiten over behandelingen vormen het

Een ‘verhalen-op-maat’-systeem, met een dialoogmana-

leeuwendeel van de informatie op het internet. Daar-

ger om voorkeuren expliciet te maken, zou hiertoe een

naast is er op beperktere schaal ruimte voor narratieve

goede oplossing zijn.

informatie, zoals verhalen van lotgenoten. Deze laatste categorie van informatie is in principe slecht gestructu-

Met experimenten is onderzocht hoe een digitaal

reerd, en dat maakt het vinden van relevante

informatiesysteem moet worden vormgegeven, zodat

verhaalverhalen lastig. In het NARRATOR-project zijn de

de oudere gebruiker efficiënt, effectief en prettig kan

randvoorwaarden onderzocht voor een informatiesys-

werken. Met de verkregen kennis wordt een zorginfor-

teem dat relevante lotgenootverhalen ontsluit met een

matiesysteem vormgegeven, waarmee borstkanker-

geavanceerde dialoogmanagement- en een taaltechnolo-

patiënten met weinig stress kunnen zoeken naar

giecomponent.

lotgenotenverhalen.

De dialoogmanagementcomponent zorgt voor het vast-

Volgens Henk Herman Nap zijn voor senioren grote fonts

stellen van de belangrijkste zoeksleutels op basis van het

en knoppen, de moedertaal, een touchscreen en een

gebruikersprofiel en de informatiebehoefte. De taaltech-

ABCDE keyboard belangrijk om succesvol om te kunnen

nologie component speelt een belangrijke rol in het

gaan met een computer. Bovendien reduceert positieve

ontsluiten van de verhalen.

feedback de stresservaring van senioren. 75

TIMEBAYES Building and Using Temporal Bayesian Models in a CPR Setting

Hoofdaanvrager Dr. Peter (P.J.F.) Lucas (RU) Uitvoerders Theodoros (T.) Charitos - promotie 17-09-2007 Jacqueline (J.M.) Dake . . Rasa (R.) Jurgelenaite - promotie 19-01-2009 Stefan (S.) Visscher - promotie 30-09-2008

Vanuit TIMEBAYES is een bijdrage geleverd aan het Medisch Informatica Congres in 2004 en 2005, met daaruit voortvloeiend een publicatie in Studies in Health care technology and Informatics.

76

Looptijd 01-04-2003 tot 15-01-2008 Budget Eur 389.637 voor personele kosten Eur 27.614 voor materiële kosten Partners Universiteit van Utrecht (UU) Radboud Universiteit Nijmegen (RU) Universitair Medisch Centrum Utrecht (UMCU) Centrum voor Wiskunde en Informatica (CWI)

Data om te beslissen Het TIMEBAYES-project ontwikkelde grafische modellen

gen, waarmee de logica door de tijd heen is gemodel-

om artsen te ondersteunen bij het nemen van beslissin-

leerd. De combinatie van het wiskundige model en de

gen. Als voorbeelddomein diende onder andere het

data over transcriptie in andere organismen leverde een

ontstaan, de diagnose en de behandeling van infectie-

lijst op van tien mogelijke transcriptiefactoren van mala-

ziekten.

riaparasieten.

Het TIMEBAYES-project heeft methoden, technieken en

Highlights

hulpmiddelen ontwikkeld voor het gebruiken van tem-

Papers ingediend voor de

porele gegevens in de geneeskunde. Bijvoorbeeld om te

• 3rd European Medical and Biological Engineering

voorspellen of een patiënt met een carcinoïde ook werkelijk een hartziekte zal ontwikkelen. Hiertoe zijn grafische statistische modellen, Bayesiaanse netwerken, als uitgangspunt gekozen. Deze maken het mogelijk om onzekere kennis, zowel op basis van kennis

Conference (EMBEC) • 10th en 11th Conference on Artificial Intelligence in Medicine (AIME) • 6st International Symposium on Biological and Medical Data Analysis (ISBMDA)

uit een domein als op basis van feitelijke gegevens, af te leiden.

Stefan Visscher ontwikkelde een model om vast te

Ook bieden Bayesiaanse netwerken de mogelijkheid om

stellen wanneer iemand géén longontsteking heeft.

temporele en atemporele verbanden voor te stellen en

Onnodige behandeling met antibiotica kan zo worden

erover te redeneren. In het project is aandacht besteed

voorkomen. Visschers model berekent de kans dat een

aan de structuur van temporele Bayesiaanse netwerken,

individuele patiënt lijdt aan longontsteking, voorspelt

het leren van temporele netwerken uit data en aan de

welke bacterie de veroorzaker is en geeft aan welke

rol die expertkennis hierbij speelt. Zo is onderzoek

antibiotica het beste kunnen worden voorgeschreven.

gedaan naar de genetische regulatie van malariamug77

78

79

NWO Exacte Wetenschappen Bezoekadres Anna van Saksenlaan 51 2593 HW Den Haag Postadres Postbus 93460 2509 AL Den Haag www.nwo.nl/ew www.nwo.nl/token

Redactie Christiane Klöditz Sabine Zinsmeister Interviews Daphne Riksen Foto’s Peter van Beek Beeld Shutterstock Vormgeving WAT ontwerpers, Utrecht Druk Zalsman Kampen bv

Inhoud. Voorwoord 2 Inleiding 4

Recommend Documents