SYMPOSIUM ONTDEK E-DISCOVERY ZOEK BETER EN VIND MEER MET DE NIEUWSTE TECHNIEKEN
CREATING TOMORROW
SYMPOSIUM ONTDEK E-DISCOVERY ZOEK BETER EN VIND MEER MET DE NIEUWSTE TECHNIEKEN
PROGRAMMA
24 APRIL 2012
09.00 uur
Ontvangst en gelegenheid voor de informatiemarkt
09.45 - 9:50 uur
Opening: dr. ir. Hans Henseler, lectoraat E-Discovery
HvA CREATE-IT applied research
09.50 uur
Text-Mining for Early Case Assessment in eDiscovery.- prof. dr. ir Jan C. Scholtes, Universiteit van Maastricht / ZyLaB
When implementing an Early Case Assessment (ECA), next to the traditional quantitative data-processing eDiscovery approach which includes techniques such as selected collection, de-duplication, batch coding and machine assisted review, it is also possible to use advanced text, audio and image search in combination with content analytics and data visualization for a more qualitative Early Case Assessment approach. As a result, valuable insights can be gained from the earliest early case assessment that can help steer the
Geachte deelnemer,
eDiscovery strategy and budget, and minimize the legal risk, exposure and expenses from later stages of the eDiscovery process. Examples of such an approach and a brief overview
Welkom op de derde editie van het symposium Ontdek E-Discovery. E-Discovery is nog steeds volop in ontwikkeling, zowel in aantallen en soorten van onderzoeken als in de manier waarop E-Discovery wordt uitgevoerd. In de voorgaande jaargangen hebben we uitgelegd wat E-Discovery inhoudt, wie er mee te maken krijgen en wat het belang is van zorgvuldig digitaal onderzoek.
of available technology will be provided to the audience. 10.30 uur
Slimmer zoeken en documenteren: met een paar trucs kun je al heel veel – drs. Ewoud Sanders
WoordWerk
Hoe zorg je dat je zoekresultaten zo relevant mogelijk zijn? Hoe sla je de gevonden informatie zó op dat je gegevens slim kunt doorzoeken en makkelijk kunt terugvinden?
Dit jaar gaan we in op de technieken die gebruikt worden in E-Discovery. Daarom is het thema Technology Assisted Review, oftewel de inzet van technieken om het doorzoeken, doorlezen en classificeren van informatie te verbeteren. Want één ding is duidelijk: met de explosie aan informatie blijkt dat het doorzoeken op trefwoorden en vervolgens handmatig analyseren van informatie niet langer haalbaar is.
En: hoe zorg je dat je onderzoek herhaalbaar en dus controleerbaar is? Soms zijn geavanceerde data- en tekstminingsprogramma’s de beste oplossing, maar in de praktijk kun je vaak al ver komen met simpele trucs en relatief eenvoudige tools. In zijn voordracht geeft Ewoud Sanders daar verschillende praktische voorbeelden van. 11.00 - 11.15
Koffie en informatiemarkt
11.15 uur
Digitaal bewijs in de Vastgoedfraude – mr. Willem Koops
Sterker nog, uit onderzoek blijkt dat een dergelijke benadering niet alleen veel duurder is maar dat de kwaliteit ook duidelijk minder is dan de kwaliteit die met de inzet van technieken kan worden behaald. Daarbij gaat het overigens niet alleen om de technieken maar ook om het proces waarmee deze technieken worden ingezet. Het is daarom niet meer dan logisch dat we dit jaar het woord geven aan de E-Discovery-specialisten die u eerder op onze informatiemarkt bent tegengekomen.
Spighthoff Litigators
Namens de Hogeschool van Amsterdam wens ik u een bijzonder informatieve dag toe.
12.00 uur
Structured data in E-Discovery – ir. Hans Wim Tinholt
KPMG Forensic
In de vastgoedfraude is in het totaal 7 terabyte aan digitale informatie door de Fiscale inlichtingen- en opsporingsdienst (FIOD) in beslag genomen. Met een groot team en geavanceerde middelen is een selectie gemaakt van uiteenlopende e-mails, documenten en transacties die als bewijs in de rechtszaak zijn aangevoerd. Hoe kan een advocaat van de verdachte in korte tijd en met beperkte middelen bepalen of deze selectie op de juiste manier is gemaakt?
Hans Henseler, lector E-Discovery Hogeschool van Amsterdam Domein Media, Creatie en Informatie CREATE-IT applied research
De hoeveelheid data die door een gemiddeld bedrijf per jaar geproduceerd wordt is de afgelopen jaren sterk gestegen. In reactie op deze trend slaan organisaties informatie steeds vaker op in gestructureerde formaten zoals databases en spreadsheets. Alhoewel E-Discovery zich vaak hoofdzakelijk richt op e-mail en elektronische documenten, kan de analyse van deze gestructureerde data ook tot belangrijke inzichten leiden. 2
3
PROGRAMMA Maar hoe maak je deze data inzichtelijk voor reviewers? We gaan in op enkele technieken
uit de praktijk, zoals het visualiseren van geldstromen binnen een bedrijf en geautomatiseerde
Hiermee worden betere en efficiëntere manieren voor informatieontsluiting voor forensische onderzoekers gerealiseerd. In de presentatie gaan we in op de TREC Legal track en in
patroonherkenning in datasets.
het bijzonder op recente ontwikkelingen omtrent semantisch zoeken.
12.45 - 13.45
Lunch en informatiemarkt
16.00 uur
Predictive Coding in email review: Glazen Bol of Black Box? - dr. ir. Hans Henseler
13.45 uur
De nabije toekomst van E-Discovery – Matthijs van der Wel MBA, CISSP, CISA
HvA CREATE-IT applied research
Ernst & Young Accountants LLP
Predictive coding is een techniek waarmee onderzoekers een computer aan de hand van
Welke nieuwe technieken staan ons over 3 jaar ter beschikking op het gebied van
voorbeelddocumenten leren wat relevant is en wat niet. Dit lijkt de ultieme oplossing als
E-Discovery? En welke invloed hebben deze technieken op de wijze waarop we onderzoek
vervanging voor het opstellen van zoekvragen waarvan inmiddels bekend is dat ze niet erg
verrichten? Welke eisen stellen we over 3 jaar aan E-Discovery soft- en hardware? In deze
effectief zijn. Op zichzelf is het trainen van een patroonherkenner geen nieuwe uitvinding
interactieve sessie gaan we in op een aantal verwachte ontwikkelingen in E-Discovery.
en zijn de voor- en nadelen van verschillende technieken bekend. Probleem daarbij is dat
U bent van harte uitgenodigd met ons mee te denken.
de door de computer automatisch afgeleide mathematische modellen onbegrijpelijk zijn
14.30 uur
E-Discovery meets Data Analytics – drs. mr. Gerwin Naber
voor de onderzoekers. Dit lijkt haaks te staan op de wens om een controleerbaar proces te
PricewaterhouseCoopers
hebben. In de presentatie wordt uitgelegd hoe predictive coding werkt, en hoe het toch
Voor het uitvoeren van feitenonderzoek heeft E-Discovery een onmiskenbare plaats
mogelijk is om de kwaliteit van dit soort technieken te controleren.
veroverd in de onderzoekswereld. In deze context wordt gesproken over analyse van (semi)
16.30 - 17.30 uur
ongestructureerde data zoals e-mailcorrespondentie en andere documenten. Potentieel is er ook zeer veel informatie beschikbaar in gestructureerde data over bedrijfsprocessen, financiële verantwoording en bedrijfsunieke (en veelal kritische) applicaties waarin handelingen van betrokkenen worden geregistreerd. In onze praktijk constateren we een toenemende behoefte van advocaten en toezichthouders om deze data te betrekken in de analyse. Tijdens deze presentatie behandelen we de volgende vragen:
- Wat is data-analyse en welke bedrijfsinformatie wordt daar normaliter bij betrokken?
- In welke situatie dient een organisatie gestructureerde bedrijfsinformatie te ontsluiten?
- Wat zijn de kansen en bedreigingen bij het reviewen van gestructureerde
- Hoe kan gestructureerde bedrijfsinformatie bijdragen aan efficiëntie in
15.15 - 15.30
Korte pauze en gelegenheid voor de informatiemarkt
15.30 uur
Semantische zoekmachines voor E-Discovery en TREC Legal - dr. Edgar Meij
Universiteit van Amsterdam (UvA)
bedrijfsinformatie? ‘klassieke’ E-Discovery?
Binnen E-Discovery wordt digitale informatie zoals e-mails en documenten automatisch geanalyseerd. De Legal Track van Text Retrieval Conference (TREC) richt zich op het meten van de kwaliteit van zoekmachine technologieën in deze context, met name in hoeverre zij aansluiten bij de wensen van advocaten, rechters en toezichthouders. Een groot aantal teams uit verschillende landen doet mee en binnen TREC worden de individuele bijdragen vergeleken en geanalyseerd. Tot nog toe worden hiervoor min of meer traditionele zoekmachine technologieën ingezet. Recentelijke ontwikkelingen – in het bijzonder rondom semantische zoekmachines – stellen ons in staat om relevante entiteiten, attributen, thema’s, gebeurtenissen, etc. in teksten te herkennen en in te zetten tijdens het zoeken. 4
5
Borrel en gelegenheid om informatiemarkt te bezoeken
SPREKERS
Prof. dr. ir Jan C. Scholtes is bijzonder hoogleraar text-mining aan de Universiteit van Maastricht en Chief Strategy Officer bij ZyLAB. In het verleden is hij betrokken geweest bij de implementatie van E-Discovery software voor organisaties zoals VN, oorlogstribunalen, de FBI-ENRON onderzoeken, het EOP (Witte Huis) en duizenden andere gebruikers wereldwijd. Scholtes heeft een M.Sc. in de Informatica van de TU Delft en een Ph.D. in Computational Linguistics aan de UvA. Daarnaast is hij een senior researcher van de Nederlandse School voor informatie-en kennissystemen (SIKS) en lid van de raad van bestuur van de Association of Information and Image Management (AIIM).
Drs. Ewoud Sanders is taalhistoricus en journalist. Hij is vaste medewerker van onder meer NRC Handelsblad, Onze Taal en E-Data. In NRC Handelsblad heeft hij wekelijks een taalcolumn, WoordHoek geheten. Voor de universiteiten van Leiden en Amsterdam schreef hij in het najaar 2011 een zoekgids getiteld Eerste Hulp Bij e-Onderzoek, dat inmiddels ruim 28.000 maal is verspreid. Speciaal voor de Hogeschool van Amsterdam schreef hij een nieuwe, uitgebreide editie, die onlangs is verspreid onder 15.000 HvA-studenten. De gidsen maken deel uit van een project om docenten, studenten en scholieren slimmer te leren zoeken op internet. Ter ondersteuning van dit project ontving Sanders eind 2011 een donatie van Google VS van 15.000 dollar.
6
Willem Koops Mr. Willem Koops is gespecialiseerd in strafrechtelijk procederen en trad op voor de hoofdverdachte in de vastgoedfraude. Hij heeft ruime ervaring met fraudezaken, van schikkingsonderhandelingen tot de Hoge Raad. Willem Koops behartigde de belangen van zijn cliënten onder andere in Brazilië en op Curaçao en Bermuda. Hij weet wat hem te doen staat bij verhoor, arrestatie of beslag. Hij smoort de zaak het liefst in de kiem.
7
Hans Wim Tinholt studeerde Informatica aan de Universiteit Twente en richtte zich daarbij onder andere op Artificial Intelligence, Data Mining en Language processing. Binnen KPMG is Hans Wim Tinholt manager in de Forensic Technology groep, die zich specialiseert in de technische aspecten van forensische onderzoeken en incident response. Hans Wim Tinholt heeft veel kennis en ervaring op het gebied van computer forensics, E-Discovery, data-analyse en cyber security. Hij heeft gewerkt aan een breed scala van projecten, zowel nationaal als internationaal. Daarnaast leidt Hans Wim Tinholt de technische ontwikkeling van software voor de toepassing van data-analyse bij de jaarrekeningcontrole
SPREKERS
Matthijs van der Wel (MBA, CISSP en CISA) is Senior Manager bij Ernst & Young’s Forensic Technology & Discovery Services. In deze functie is hij verantwoordelijk voor E-Discovery, forensisch IT onderzoek en fraud data analytics. Matthijs van der Wel heeft ruime ervaring op het gebied van internationaal forensisch IT onderzoek en is ingeschreven in het Landelijk Register Gerechtelijk Deskundigen.
Drs. Mr. Gerwin Naber is verantwoordelijk voor de Forensic Technology Solution (FTS) praktijk van PwC Nederland. Daarnaast coördineert hij de FTS activiteiten voor PwC op continentaal Europa. Gerwin Naber houdt zich ruim acht jaar bezig met forensische onderzoeken en heeft in die hoedanigheid ruime ervaring op het gebied van forensische technologie, forensische accountancy, computer forensics, cyber incident response, (internationale) E-Discovery en data analyse. Tevens heeft Gerwin Naber geacteerd als rechtbank deskundige. Gerwin Naber is zeer ervaren in het combineren van nieuwe technologieën in de traditionele forensische onderzoeksomgeving. Hierbij worden innovatieve oplossingen ontworpen om bedrijven dan wel voor te bereiden of te helpen in tijden van crisis, met als doel hoge integriteitstandaarden te bewerkstellingen.
8
Dr. Edgar Meij is onderzoeker bij de Information and Language Processing Systems groep aan het Instituut voor Informatica van de Universiteit van Amsterdam. Hij promoveerde op een onderzoek naar het intelligenter maken van zoekmachines, door het toepassen van informatie uit kennisbronnen zoals Wikipedia. Zijn huidige onderzoek richt zich op het laten begrijpen van teksten door zoekmachines en draait om het samenbrengen van statistische, bottom-up methoden en conceptuele, top-down kennis. Als deze samenkomen ontstaat er een vorm van semantisch zoeken met vooruitstrevende mogelijkheden en uiteenlopende toepassingen.
9
Dr. ir. Hans Henseler studeerde informatica aan de TU Delft en is gepromoveerd op het onderwerp Artificiële Neurale Netwerken aan de Universiteit Maastricht. In 1992 heeft hij de afdeling Forensisch Computeronderzoek opgericht bij het Nederlands Forensisch Instituut en was hij vicevoorzitter van de International Organisation on Computer Evidence. Van 1998-2000 gaf Hans Henseler leiding aan de divisie Informatiesystemen van TNO-TPD, gespecialiseerd in kennismanagement, taaltechnologie, beeldverwerking en logistieke informatiesystemen. Van 2000-2006 was hij technisch directeur van ZyLAB Technologies waar hij verantwoordelijk was voor de ontwikkeling, testen en support van ZyLABs E-Discovery suite. Van 2006-2010 was Hans Henseler director Forensic Technology Solutions bij PWC en voerde nationale en internationale projecten voor E-Discovery en Financiële Data Analyse uit. Sinds 2009 is Hans Henseler lector E-Discovery aan de Hogeschool van Amsterdam en sinds 2010 is hij partner bij Fox-IT.
INFORMATIEMARKT Op de informatiemarkt presenteren verschillende bedrijven zich. Deze bedrijven zijn actief op het gebied van E-Discovery of hebben raakvlakken met E-Discovery.
Fox-IT heeft als doel technische en innovatieve oplossingen te bieden die voor een veiligere samenleving zorgen. De forensic IT experts van Fox-IT voeren digitaal forensisch onderzoek uit en zijn gespecialiseerd in het terugvinden en interpreteren van digitale sporen. Fox-IT is pionier op het gebied van digitale recherche en past zich constant aan aan de veranderende omstandigheden die slimmere onderzoekstechnieken vereisen. Corporate securities, advocatenkantoren, bedrijfsjuristen, overheden of interne onderzoeksafdelingen: ze hebben allemaal te maken met steeds groter wordende hoeveelheden informatie die ze in korte tijd moeten doorzoeken. Fox-IT combineert haar expertise met state of the art E-Discovery software zoals Clearwell en Trident en traditionele Computer Forensics zoals Encase en Forensic Toolkit om snel inzicht en overzicht in een onderzoek krijgen. Met deze kennis biedt Fox-IT ook trainingen aan zoals digitaal forensisch onderzoek, rechercheren op internet, feitenonderzoek op internet voor advocaten en juristen en digitaal forensisch onderzoek in databases.
eDiscovery & Information Management
ZyLAB ontwikkelt oplossingen om informatie doorzoekbaar en toegankelijk te maken. Specifiek betreft het hier krachtige technologie voor enterprise search zoals: dossier-, e-mail-, document- en kennismanagement; compliancy ondersteuning en E-Discovery. De oplossingen bestaan uit een volledige installatie, projectmanagement en integratiediensten.
De afdeling Forensic Technology Solutions (FTS) van PricewaterhouseCoopers Advisory helpt bij het in kaart brengen van informatie in uw organisatie. Het FTS-team verzamelt digitale informatie en verwerkt, analyseert en reproduceert deze voor onderzoeksdoeleinden. De forensische specialisten van FTS: maken de organisatie van uw informatie inzichtelijk; ondersteunen juristen en forensische accountants in financiële en administratieve onderzoeken; ontdekken patronen en verbanden door gegevens te structureren en geldstromen, organisatiestructuren en sociale netwerken te visualiseren; adviseren hoe u zich kunt voorbereiden op een digitaal forensisch onderzoek; zijn gespecialiseerd in het faciliteren van zowel kleinschalige als grootschalige e-mail reviews.
10
Ernst & Young is wereldwijd toonaangevend op het gebied van assurance, tax, transactions en advisory. Juridische en notariële dienstverlening wordt in een strategische alliantie met tax verzorgd door Holland Van Gijzen. Onze 152.000 mensen delen wereldwijd dezelfde waarden en staan voor kwaliteit. Wij maken het verschil door onze mensen, onze cliënten en de samenleving te helpen hun mogelijkheden optimaal te benutten. Ernst & Young heeft in Nederland een historie die teruggaat tot 1883 en is daarmee de oudste firma in zijn branche.
KPMG Forensic koppelt specialistische kennis van forensische IT-technieken aan een uitgebreide ervaring met feiten- en fraudeonderzoeken. KPMG Forensic is in staat om in het kader van dergelijke onderzoeken grote hoeveelheden informatie veilig te stellen, aan elkaar te koppelen, inzichtelijk te maken en informatie te selecteren die voor het onderzoek relevant is. De opdrachtgever kan deze informatie vervolgens gebruiken om een beslissing te nemen in juridische procedures en integratiediensten of om processen aan te scherpen.
11
DataExpert is distributeur van forensische tools Encase van Guidance en FTK van AccessData. Daarnaast levert DataExpert een groot aantal andere producten die gebruikt worden bij de analyse van informatie zoals het bekende Analyst Notebook. Voor meer informatie zie de website van DataExpert.
Dutchear is expert op het gebied van spraaktechnologie. De oplossingen van Dutchear maken processen en interfaces efficiënter, veiliger en gebruikersvriendelijker. Dutchear realiseert maatwerkoplossingen en levert kant-en-klare producten. Als enige in Nederland, werkt Dutchear intensief samen met alle wereldwijd leidende ‘technology vendors’. Dutchear ontwerpt en realiseert de best-of-breed oplossing op basis van deze technologieën, die voor uw organisatie de beste prijs-kwaliteit verhouding oplevert. Dutchear is dochter van TNO en werkt nauw samen met Prime Vision, dé expert op het gebied van (handschrift-) herkenning. Het lectoraat E-Discovery valt onder het kenniscentrum CREATE-IT applied research van de Hogeschool van Amsterdam. Bij dit lectoraat gaat het erom dat informatie op forensisch verantwoorde wijze veiliggesteld en slim verwerkt wordt. Het lectoraat onderzoekt de selectie, verwerking en productie van digitaal opgeslagen gegevens als bewijs in particuliere, civiele of strafrechtelijke onderzoeken.
Hogeschool van Amsterdam Domein Media, Creatie en Informatie CREATE-IT applied research, www.create-it.hva.nl @ediscoverynl
[email protected] www.hva.nl/e-discovery