Lesmateriaal voor Computer Assisted Reporting
Dick van Eijk Henk van Ess
Uitgegeven in 2003 door de ‘Vereniging van Onderzoeksjournalisten’ (VVOJ) Postbus 92049 1090 AA Amsterdam (Nederland) Tel. +31 6 55 11 48 29
[email protected] www.vvoj.nl Kol. Bourgstraat 90 B-1030 Brussel (België) Tel. +32 2 705 59 19
[email protected] www.vvoj.be Copyright 2003 ©, Dick van Eijk, Henk van Ess Niets uit deze uitgave mag worden verveelvoudigd en/of openbaar gemaakt door middel van druk, fotokopie, microfilm of op welke wijze ook zonder voorafgaande schriftelijke toestemming van de uitgever. Vormgeving: Anne Van Hootegem
Voorwoord Journalisten vergaren informatie, wegen, selecteren en bewerken die. En vervolgens verschaffen ze op hun beurt informatie aan hun lezers. Het ligt dus voor de hand dat informatietechnologie het werk van journalisten kan vergemakkelijken en verbeteren. Computers zouden de natuurlijke partners van journalisten moeten zijn. In de praktijk is dit nauwelijks het geval. Nagenoeg iedere journalist tikt zijn of haar teksten op een computer. Maar afgezien van de tekstverwerker vormen computerprogramma’s onderbenut gereedschap in ons vak. De oprichters van de Vereniging van Onderzoeksjournalisten waren zich bewust van deze onderbenutting, want velen van hen waren op de hoogte van de potentie van informatietechnologie. Een deel van hen had zelf uitvoerig ervaring opgedaan met het op een computer analyseren van gegevens ten behoeve van journalistieke publicaties, anderen hadden in presentaties op de internationale conferentie over onderzoeksjournalistiek in Kopenhagen gezien wat collega’s in andere landen zoal doen op dit terrein. Onze vereniging wilde zich dan ook van meet af aan inzetten voor verspreiding van de kennis over de inzet van informatietechnologie in de nieuwsgaring, of in de gangbaarder Amerikaanse terminologie, over computer assisted reporting. We wilden collega’s leren hoe ze beter kunnen zoeken naar gegevens en documenten op internet, hoe ze gegevens kunnen ordenen en analyseren op hun eigen computer, en hoe ze hieruit nieuws kunnen halen. De vraag was hoe hiermee te beginnen. Om een vliegende start te kunnen maken is gekeken naar hoe in de Verenigde Staten en Denemarken journalisten informatietechnologie leren inzetten in hun werkzaamheden. Dit rapport vormt een weerslag van dit onderzoek Tijdens de eerste Nederlands-Vlaamse conferentie over onderzoeksjournalistiek, november 2002 in Utrecht, heeft de VVOJ achttien trainingen aangeboden. Deze zijn alle uitvoerig geëvalueerd. Ook de rapportage daarvan is in dit rapport ondergebracht. Bij elkaar geeft dit de vereniging een kader om de verdere activiteiten op het gebied van trainingen in computer assisted reporting en het ontwikkelen van lesmateriaal ter hand te nemen. De vereniging dankt beide auteurs, Dick van Eijk (NRC Handelsblad) en Henk van Ess (Utrechts Nieuwsblad) voor hun bijdragen, en het Bedrijfsfonds voor de Pers voor zijn financiële steun, zonder welk dit onderzoek niet gerealiseerd had kunnen worden.
Amsterdam, juni 2003 Marjan Agerbeek Voorzitter VVOJ
`
Inhoud 3
Voorwoord
5
Inhoud
7
Hoofdstuk 1 :
9 12 12
15
Hoofdstuk 2 :
16 18
21 21 25 27 27 30 30
31 34
Nederlands lesmateriaal Trainingen op de conferentie onderzoeksjournalistiek Evaluatie van de trainingen
Hoofdstuk 5 :
41
Deens lesmateriaal De cursusinhoud De Deense didactiek Openbaarmaking van digitale bronnen Conferentie in Kopenhagen Internationaal netwerk van CAR-trainers Slotopmerkingen
Hoofdstuk 4 :
39
Amerikaans lesmateriaal NICAR Europese ervaringen met Amerikaans lesmateriaal
Hoofdstuk 3 :
31
Inleiding Geschiedenis van Computer Assisted Reporting Scholing op CAR-gebied Opzet van dit onderzoek
Conclusie
Literatuur
6
Hoofdstuk 1 :
Inleiding
Sinds de jaren negentig van de vorige eeuw zijn computers alomtegenwoordig in de journalistiek. In hoogontwikkelde landen als Nederland en België bestaan waarschijnlijk geen professionele journalisten meer die nooit een computer gebruiken. Hoe snel dit is veranderd moge blijken uit het feit dat het ook bij grote kranten midden jaren tachtig nog gebruikelijk was dat journalisten hun teksten met schrijfmachines tikten op doorslagpapier. Voor de meeste journalisten was de computer dan ook in de eerste plaats een moderne schrijfmachine. Uitgevers investeerden fors in redactionele automatisering, niet zozeer om journalisten beter werk te kunnen laten leveren, maar om grote delen van de pre-press afdeling te kunnen wegbezuinigen: de zetterij, de correctieafdeling, later de opmaak. Het is dan ook niet verwonderlijk dat computers ter redactie in de eerste plaats werden ingezet als productiegereedschap: tekstinvoer, later paginaopmaak en nog later fotobewerking. De redactie nam veel taken van de pre-press afdelingen over. Dit soort toepassingen van computers in de journalistiek is NIET wat wordt bedoeld met de term Computer Assisted Reporting. Journalisten ontdekten, niet zelden op individuele basis, dat ze met een computer meer konden dan een stukje tikken. Sommigen keken van documentalisten af dat je kon zoeken in online databases als Lexis Nexis, Dialog of FT Profile. Anderen ontdekten de kracht van een digitale kaartenbak, of van de analyse-mogelijkheden van een rekenprogramma. Kortom, ze ontdekten dat computers ook nuttig konden zijn vóórdat ze begonnen te tikken aan hun stukje. Het zijn dit soort toepassingen van computers in de journalistiek die worden bedoeld met de term Computer Assisted Reporting. Samengevat: Computer Assisted Reporting is de toepassing van informatietechnologie in de nieuwsgaring. De term is overgewaaid uit Amerika en wordt inmiddels in veel landen gebruikt. Pogingen om vertalingen ingang te doen vinden zijn in de meeste talen tot dusverre op niets uitgelopen. Dit heeft Computer Assisted Reporting – doorgaans afgekort tot CAR – overigens gemeen met soortgelijke termen als Computer Aided Design (CAD). Met name in oudere literatuur komt men ook nog wel de term Computer Assisted Reporting and Research (CARR) tegen, maar vandaag de dag wordt research doorgaans als een onlosmakelijk onderdeel gezien van reporting. Voor een beter begrip is het handig om onderscheid te maken tussen vier typen activiteiten waarin informatietechnologie voor journalisten een belangrijke meerwaarde kan vertegenwoordigen: 1. 2. 3. 4.
Zoeken Ordenen Analyseren Converteren
Dit is een ideaaltypische indeling in de zin dat deze activiteiten wel analytisch te scheiden zijn, maar in de praktijk veelal in elkaar overlopen. Ook veel software is in meer dan één categorie inzetbaar. Hieronder worden deze activiteiten kort gekarakteriseerd en worden de voornaamste programma’s beschreven die hierbij worden toegepast.
7
1. Zoeken Het gaat zowel om het zoeken naar tekstdocumenten als kranten- en tijdschriftartikelen, wetteksten en vonnissen, als om het zoeken naar gestructureerde gegevens als namen, adressen, telefoonnummers en bedrijfsgegevens. Het gaat zowel om het zoeken op het ‘vrije’ internet, als in besloten online databases als Lexis Nexis, Mediargus, Kamer van Koophandel en Kadaster, als in lokaal opgeslagen databases, bijvoorbeeld op cd-rom. Qua methoden gaat het hier om kennis van zoekstrategieën en algemene zoeksyntactische kennis, zoals booleaanse logica. Belangrijke programma’s zijn webbrowsers – die tevens toegang verschaffen tot de diverse webinterfaces van allerlei online databases – en zoekprogramma’s voor internet zoals Copernic en Webferret. Voor het zoeken in lokale data kunnen ook data-baseprogramma’s als Microsoft Access en rekenprogramma’s als Microsoft Excel relevant zijn, alsmede programma’s om grote hoeveelheden tekst op een eigen harde schijf te doorzoeken, zoals askSam, Enfish en ISYS. 2. Ordenen Vooral wanneer de hoeveelheid gegevens toeneemt – of dit nu gestructureerde data zijn of platte teksten – dan wordt het nodig om die gegevens op een of andere manier te ordenen, zowel om ze te kunnen terugvinden als om ze te kunnen analyseren. Dit speelt zowel in het geval een journalist de gegevens stuk voor stuk zelf bijeengebracht heeft, als in het geval een complete verzameling gegevens is verkregen van een of andere instantie. Qua methoden gaat het hier om kennis van databasestructuren en normalisatieprincipes. De belangrijkste gereedschappen zijn databaseprogramma’s als Microsoft Access en rekenprogramma’s als Microsoft Excel, hier toegepast als eenvoudige database. Ook programma’s voor het gestructureerd opslaan van teksten, zoals askSam en Enfish, vinden toepassing als ordeningsinstrument. 3. Analyseren Het primaire doel van elk onderzoek is datareductie: het terugbrengen van een veelheid aan gegevens tot een getal, een begrip of enkele alinea’s tekst. Onderzoeksjournalistiek brengt veelal het vergaren van zeer veel gegevens met zich mee, terwijl de beschikbare ruimte voor publicatie van de weerslag van het onderzoek niet evenredig groter is dan bij een alledaags nieuwsbericht. Kortom, onderzoeksjournalistiek vergt meer datareductie en dus een krachtiger analyse van de beschikbare gegevens. Qua methoden gaat het om een zeer breed scala. Rekenen en statistiek spelen een belangrijke rol, al gaat het er maar om vast te stellen welke de grootste is, de beste of de snelste groeier. Geografische analyse kan een rol spelen, evenals tekstanalyse of netwerkanalyse. Deels kan worden geput uit sociaal-wetenschappelijke kennis, zij het dat de journalistiek andere doelen heeft en daarom ook andere regels hanteert. De belangrijkste gereedschappen zijn rekenprogramma’s als Microsoft Excel, databaseprogramma’s als Microsoft Access, desktop mapping programma’s als MapInfo en ArcView, statistische software als SPSS en diverse nog gespecialiseerder gereedschappen.
8
4. Converteren Gegevens zoals die worden aangetroffen op het internet of worden aangeleverd door een instantie hebben niet altijd de structuur die vanuit oogpunt van analyse gewenst is. Een eenvoudig voorbeeld: de gegevens bevatten een veld voor de naam, terwijl men liever drie afzonderlijke velden voor voornaam, tussenvoegsels en achternaam zou willen hebben. In zulke gevallen is conversie van de gegevens nodig. Het gaat soms om simpele dingen als het omrekenen van valuta of buitenlandse maten en gewichten. Maar het kan ook gaan om soms zeer complexe operaties om specifieke gegevens geautomatiseerd uit grote lappen tekst te lichten. Qua methoden is kennis van datastructuren nodig, een basiskennis programmeren en enige kennis van reguliere expressies. Belangrijke gereedschappen zijn teksteditors als UltraEdit – zelfs met een tekstverwerker als Microsoft Word komt men een eind – alsmede de eerder genoemde databases en rekenprogramma’s. Daarnaast bestaan er allerlei gespecialiseerde conversiegereedschappen als Monarch, Aerial, DBMS/Copy, TextPipe, WordPort en ParseRat. Ook programmeertalen als Perl en Visual Basic kunnen hun nut bewijzen. Het converteren van data, ook wel data cleansing genoemd, is een activiteit voor gevorderden. In de eerste plaats omdat men in staat moet zijn te definiëren wat voor datastructuur men nodig heeft, en dit vergt kennis van zowel analysemethoden als van de mogelijkheden en beperkingen van de te gebruiken software, in de tweede plaats omdat het soms zeer gespecialiseerde kennis vergt en zeer gespecialiseerde software.
Geschiedenis van Computer Assisted Reporting
De inzet van informatietechnologie heeft twee beginpunten 1 . Er is een grootschalig beginpunt in 1952, toen CBS een Remington Rand UNIVAC computer inzette om de uitslag van de presidentsverkiezingen te voorspellen op basis van de eerste tellingen. Voorafgaand aan de verkiezingen was voorspeld dat het een nek-aan-nekrace zou worden tussen de beide kandidaten Dwight Eisenhower en Adlai Stevenson. Op basis van de eerste tellingen oorspelde het computermodel dat Eisenhower met een straatlengte voorsprong zou winnen. Maar de leiding bij CBS vertrouwde de zaak niet en wachtte eindeloos met het uitzenden van de voorspelling. Toen ze dat uiteindelijk wel deden – de computer kreeg gelijk – werd de spot met ze gedreven omdat ze de computer niet hadden geloofd.... Sindsdien hebben de grote Amerikaanse televisie networks computers gebruikt in de verwerking en voorspelling van verkiezingsuitslagen. Hoewel de networks computers inzetten in de nieuwsgaring, speelde zich dit volledig af op management-niveau. Van verslaggevers en eindredacteuren vergde deze inzet van informatietechnologie geen nieuwe of bijzondere kennis. De redactionele verwerking van de uitkomsten van het computermodel verschilde niet wezenlijk van de verwerking van externe voorspellingen van bureaus als Gallup. Het tweede beginpunt was kleinschalig – op het niveau van individuele verslaggevers – en zou uiteindelijk wel leiden tot een grote verandering in de rol van informatietechnologie in 1
Over de geschiedenis van computer assisted reporting in de Verenigde Staten is inmiddels het een en ander gepubliceerd. Voor dit hoofdstuk is met name geput uit Cox (2000), Meyer (1991) en Poynter (1999).
9
verslaggeving. Philip Meyer, toen verslaggever bij de Detroit Free Press, ondervroeg in 1967 zwarten over hun deelname aan de rassenrellen in Detroit. Hij werd hierin bijgestaan door twee onderzoekers van de University of Michigan. De antwoorden werden geanalyseerd met behulp van een IBM 360 mainframe computer. De analyse toonde aan dat in tegenstelling tot wat iedereen dacht zwarten met een hogere opleiding net zo vaak meededen aan de rellen als zwarten die hun middelbare school niet hadden afgemaakt. Het leverde een Pulitzer Prize op. Meyer was niet zo zeer geïnteresseerd in de inzet van informatietechnologie, als wel in de inzet van sociaal-wetenschappelijke onderzoeksmethoden in de journalistiek. Hij was een jaar eerder overtuigd geraakt van de wenselijkheid hiervan toen hij als Nieman Fellow een studiejaar doorbracht aan Harvard University. Zijn ideeën hierover heeft hij uitgewerkt in het boek Precision Journalism, dat verscheen in 1973. In 1991 verscheen een herziene versie als The New Precision Journalism. Geheel los van Meyer liet Clarence Jones van de The Miami Herald in 1968 rechtenstudenten gegevens uit rechtbankdossiers intikken op een computer. De gegevens werden opgeslagen op 13.000 ponskaarten. Analyse van de gegevens liet zien dat sommige categorieën verdachten vaker en zwaarder werden gestraft dan andere. Dit was de eerste keer dat journalisten overheidsdata analyseerden met inzet van computers.
Ook The New York Times analyseerde begin jaren zeventig criminaliteitsgegevens met een computer. Precision journalism en het analyseren van overheidsdata kwamen bij elkaar in 1973, toen Don Barlett en James Steele van de The Philadelphia Inquirer gegevens uit vonnissen invoerden in een computer en Philip Meyer hen bijstond in de analyse ervan. ‘Unequal Justice’ heette de serie artikelen die hieruit voortkwam. Meyer was inmiddels hoogleraar journalistiek aan de University of North-Carolina in Chapel Hill, ‘om de hoek’ bij de Inquirer. Meyer stond vaker journalisten bij in het analyseren van gegevens. Zo ook in 1978, toen Rich Morin en Fred Tasker van de The Miami Herald als eerste gebruik maakten van het feit dat overheidsinstanties zelf ook steeds meer gegevens in computers gingen vastleggen. Ze analyseerden een magneetband met gegevens over onroerendezaakbelasting en concludeerden dat de taxaties van onroerend goed aanzienlijke discrepanties vertoonden. Nog een stap verder ging een andere pionier, Elliot Jaspin van The Providence Journal, die midden jaren tachtig als eerste journalist verscheidene overheidsbestanden aan elkaar koppelde en zo kon vaststellen dat menig schoolbuschauffeur een geschiedenis van verkeersovertredingen en veroordelingen wegens drugshandel had. Hij kwam erop om dit uit te zoeken toen in korte tijd drie kinderen waren doodgereden door een schoolbus. De definitieve doorbraak van computer assisted reporting als discipline kwam in 1989. In dat jaar wonnen Bill Dedman en Dwight Morris van The Atlanta Journal-Constitution een Pulitzer voor de serie ‘The Color of Money’ waarmee zij aantoonden dat wie in een buurt met veel zwarten woonde onevenredig vaak een hypotheek werd geweigerd. En Rich Mauer van de Anchorage Daily News won een Pulitzer voor zijn analyse van de doodsoorzaken van eskimo’s in Alaska. Sindsdien is vrijwel elk jaar ten minste één Pulitzer toegekend aan een verhaal dat met inzet van informatietechnologie tot stand is gekomen. Hetzelfde geldt voor de IRE Awards.
10
De eerder genoemde Elliot Jaspin maakte het dat jaar zijn collega’s bij andere media een stuk gemakkelijker om bestanden van overheden te analyseren: samen met Dan Woods schreef hij het computerprogramma 9-Track Express, waarmee de inhoud van magneetbanden met data van mainframecomputers zoals overheden die hanteerden gemakkelijk kon worden overgezet naar de harde schijf van een personal computer. Sindsdien hoefden journalisten geen toegang meer te hebben tot grote computers om zulke bestanden te analyseren. In datzelfde jaar richtte de University of Missouri School of Journalism het Missouri Institute for Computer Assisted Reporting (MICAR) op, met wederom Elliot Jaspin als instigator. Het instituut moest journalisten trainen in het vinden, verkrijgen en analyseren van gegevens. Aangezien IRE op dezelfde campus was gevestigd, ontstond al snel een innige band tussen beide organisaties. Sinds 1994 heet het instituut National Institute for Computer Assisted Reporting (NICAR) en is het een samenwerkingsverband van de universiteit en IRE. Het instituut heeft sindsdien zo’n duizend trainingen georganiseerd in alle delen van de Verenigde Staten. De oprichting van MICAR markeert de overgang van computer assisted reporting als pionierswerk naar computer assisted reporting als onderdeel van mainstream journalistiek. Vanaf dat moment was CAR iets dat je kon leren in een cursus. Deze overgang werd gefaciliteerd door de opmars van de personal computer in redactielokalen vanaf het midden van de jaren tachtig. Weliswaar werkten de meeste journalisten toen nog niet op een pc – krantenredacties beschikten toen doorgaans over speciale redactionele systemen met ‘domme’ terminals die geen andere programma’s konden draaien dan het programma waarmee de krantenpagina’s werden geproduceerd – maar veelal waren al wel enkele pc’s beschikbaar, bijvoorbeeld voor toegang tot online databases en voor het analyseren van gegevens. Ook waren er verslaggevers die van hun eigen geld een pc kochten en thuis analysewerk deden. De hierboven beschreven evolutie van computer assisted reporting betreft vooral het ordenen en analyseren van data, en het converteren ervan. Het gebruik van online bronnen ontwikkelde zich min of meer gelijktijdig, maar betrekkelijk onafhankelijk hiervan. Hierin speelden niet alleen verslaggevers maar ook documentalisten, bibliothecarissen (news librarians) of hoe ze ook werden en worden genoemd een belangrijke rol. Het Poynter Institute in St. Petersburg, Florida, groeide uit tot het belangrijkste kenniscentrum op dit terrein in het begin van de jaren negentig, vooral dankzij het pionierswerk van Nora Paul, die voor haar aanstelling als directeur van de bibliotheek van het Poynter Institute een carrière als news librarian bij The Miami Herald had doorlopen. De ontwikkeling van het gebruik van online bronnen is aanzienlijk minder goed gedocumenteerd dan die van de analyse van gegevensbestanden. Ook het gebruik van informatietechnologie ‘on deadline’ voor kleine dingen als het berekenen van groeipercentages is nauwelijks vastgelegd. Dit is wel verklaarbaar: grote data-analyseprojecten leidden veelal tot gezichtsbepalende publicaties en soms ook tot journalistieke prijzen. Zulke gebeurtenissen zijn naar hun aard geregistreerd, en de daders zijn uitgeroepen tot helden van het vak. Maar met het scheppen van mogelijkheden om in enkele minuten essentiële feiten te checken in een alledaags bericht – bijvoorbeeld door toegang tot een online bron of door een snelle berekening uit te voeren met een spreadsheet – wint men geen prijzen en sleept men geen professionele onsterfelijkheid in de wacht. De geschiedenis van computer assisted reporting buiten de Verenigde Staten is slechts fragmentarisch geboekstaafd, al was het alleen maar omdat elk land nu eenmaal zijn eigen
11
geschiedschrijving kent en er in dit opzicht door journalisten weinig over de grens wordt gekeken. Nederland behoorde met Zweden en Denemarken tot de eerste landen in Europa waar CAR toepassing vond. Vast staat dat NRC Handelsblad sinds 1993 met enige regelmaat grotere onderzoeksprojecten heeft aangepakt waarin informatietechnologie een belangrijke rol speelde. Bekend zijn onder meer de pagina’s met kaarten na verkiezingen – voor het eerst gepubliceerd in mei 1994 – en de onderzoeken naar goede en slechte buurten in grote steden. Ook Trouw behoorde tot de voorlopers. Met name het onderzoek naar de prestaties van middelbare scholen – voor het eerst gepubliceerd in 1997 – behoort tot de hoogtepunten van de Nederlandse onderzoeksjournalistiek.
Scholing op CAR-gebied
In de Verenigde Staten worden sinds 1989 cursussen computer assisted reporting aangeboden, zowel aan werkende journalisten als aan studenten journalistiek, zowel door NICAR als door de journalistiek-opleidingen van de universiteiten. In de eerste helft van de jaren negentig begonnen ook de Zweedse en Deense organisaties van onderzoeksjournalisten en het European Journalism Centre in Maastricht zulke cursussen aan te bieden. Vaak werden daartoe Amerikaanse docenten ingevlogen. Ook op enkele Nederlandse journalistiekopleidingen is inmiddels een beetje ervaring met CAR-training. Nog nergens is het een vast onderdeel van het curriculum. In enkele gevallen hebben media op de eigen redactie cursussen georganiseerd, hetzij onder leiding van docenten van buiten, hetzij onder leiding van eigen redacteuren. Voorbeelden hiervan zijn de regionale kranten van Wegener en NRC Handelsblad. In geen van deze gevallen heeft dat geleid tot gestandaardiseerd lesmateriaal. In het Nederlands taalgebied bestaan geen leerboeken over CAR, er is alleen een cahier van de School voor de Journalistiek in Utrecht waarin staat beschreven wat CAR is. Kortom, wie in Nederland of België trainingen wil geven op het gebied van computer assisted reporting, moet óf zijn eigen lesmateriaal ontwikkelen, óf teruggrijpen op buitenlands, met name Amerikaans lesmateriaal. In de Verenigde Staten zijn wel diverse leerboeken verschenen over CAR, onder meer uitgegeven door IRE. Ook ontwikkelden tal van universiteiten syllabi, die soms ook via internet beschikbaar zijn voor buitenstaanders. In de loop der jaren is met name in de Verenigde Staten een heel palet aan trainingen ontwikkeld. Op de jaarlijkse conferenties van NICAR en IRE worden workshops aangeboden die typisch één à twee uur duren. Omdat ze op allerlei niveaus worden aangeboden kunnen ze zowel fungeren als kennismaking met een bepaalde techniek of een bepaald programma, als ook als verdieping van reeds aanwezige kennis. Aan het andere uiteinde staan de zogeheten bootcamps waarin cursisten een week lang worden ondergedompeld in allerlei verschillende CAR-technieken en kennismaken met vele programma’s.
Opzet van dit onderzoek
Bij de oprichting van de Vereniging van Onderzoeksjournalisten in februari 2002 stond het voor de betrokkenen reeds vast dat de mogelijkheden van informatietechnologie prominent aandacht zouden vergen. Sommige oprichters hadden daar zelf uitgebreid ervaring mee opgedaan en waren vertrouwd met wat er zoal in de Verenigde Staten op dit terrein werd gedaan. Nagenoeg alle oprichters hadden op de eerste wereldwijde conferentie
12
over onderzoeksjournalistiek in Kopenhagen in april 2001 voorbeelden gezien van interessante onderzoeksprojecten die zich uitsluitend dankzij het slim inzetten van informatietechnologie lieten realiseren. Op de eerste Nederlands-Vlaamse conferentie over onderzoeksjournalistiek in november 2002 is dan ook amper ruimte geschapen voor het aanbieden van CAR-trainingen. Bij de opzet van deze trainingen luidde direct de vraag: wat gaan we aanbieden en op basis van welk materiaal? Net als bij andere activiteiten heeft ook hier de VVOJ expliciet gekeken naar de ervaringen van buitenlandse zusterorganisaties. Het heeft immers niet zo veel zin om het wiel opnieuw uit te vinden. Indien bepaalde praktijken in andere landen telkens succesvol zijn, of juist falen, dan moeten we daaruit tijdig lering trekken. Omdat in de Verenigde Staten en Denemarken een instituut bestaat voor computer assisted reporting hebben we ons onderzoek geconcentreerd op deze twee landen. Daarbij hebben we met name gekeken naar de volgende vragen: +
Welke methodische kennis wordt aan journalisten onderwezen?
+
Welke software wordt hiervoor ingezet?
+
Welke vaardigheden in die software wordt journalisten bijgebracht?
+
Zijn er volgorden van presentatie in methoden en vaardigheden die zich in de praktijk hebben bewezen?
+
Welke data worden in de trainingen gebruikt?
+
Wat is er zoal aan schriftelijk (elektronisch) lesmateriaal beschikbaar?
Op wat langere termijn – dit strekt zich uit buiten het bestek van dit onderzoeksproject – willen we gestandaardiseerd Nederlandstalig lesmateriaal ontwikkelen. Dit onderzoek moet onder meer antwoord geven op de vraag in hoeverre buitenlands lesmateriaal zou kunnen worden vertaald en/of bewerkt om voor de Nederlandstalige markt geschikt te zijn. Uiteindelijk zijn op de conferentie in Utrecht in november 2002 achttien trainingen aangeboden, waarin reeds een deel van de hierboven genoemde ervaringen was verwerkt. Deze trainingen zijn alle uitvoerig geëvalueerd. Op basis hiervan heeft de VVOJ de eerste conclusies getrokken over de verdere ontwikkeling van lesmateriaal. In dit rapport komt in het volgende hoofdstuk eerst het Amerikaanse lesmateriaal aan bod. Hierbij zal expliciet aandacht worden besteed aan de ervaring die in Europa is opgedaan met Amerikaans lesmateriaal, zowel door Europese als Amerikaanse docenten. De tekst is gebaseerd op een inventarisatie van online materiaal, gesprekken met medewerkers van NICAR en uitvoerige persoonlijke ervaring van de auteurs met CAR-trainingen in Nederland, België, Engeland, Zweden en Denemarken. In het derde hoofdstuk wordt ingegaan op het Deense lesmateriaal. Aan het Deense instituut voor computer assisted reporting (DICAR) is tamelijk systematisch lesmateriaal ontwikkeld. Voor een deel is dit materiaal ook in het Engels vertaald, en er is enige ervaring opgedaan in het werken met dit materiaal tijdens internationale cursussen. De tekst is gebaseerd op gesprekken met medewerkers van DICAR tijdens een werkbezoek aan het instituut, alsmede
13
op de ervaring van de auteurs met het lesmateriaal van DICAR in internationale cursussen in Denemarken en Engeland. In het vierde hoofdstuk wordt beschreven welke cursussen zijn aangeboden tijdens de Nederlands-Vlaamse conferentie in Utrecht en waarom. Tevens wordt ingegaan op de overwegingen die ten grondslag lagen aan het ontwikkelen van het benodigde lesmateriaal. Ook worden de resultaten van de evaluaties door de deelnemers beschreven. Hierna is het in het vijfde hoofdstuk tijd om conclusies te trekken. Wat kan de Vereniging van Onderzoeks-journalisten leren van deze Amerikaanse, Deense en eigen ervaringen? Hoe moeten we verder om computer assisted reporting in Nederland en Vlaanderen op de kaart te zetten? Welke stappen zijn nodig om in de komende jaren hiervoor adequaat lesmateriaal te ontwikkelen? Het rapport wordt afgesloten met een beknopte literatuurlijst.
14
Hoofdstuk 2 :
Amerikaans lesmateriaal
In de Verenigde Staten is sinds 1989 ervaring met allerlei CAR-cursussen aan journalisten. Instituten als het Missouri Institute of Computer Assisted Reporting en het National Institute for Advanced Reporting liepen voorop. Inmiddels vervult NICAR, de aan IRE gerelateerde opvolger van MICAR, veler behoefte met circa vijftig bootcamps, conferenties en speciale trainingen per jaar. Alle reguliere journalistiekopleidingen hebben elementen van computer assisted reporting opgenomen in hun curricula. Vele redacties hebben in eigen huis trainingen georganiseerd voor hun medewerkers, hetzij verzorgd door hun eigen specialisten, hetzij door ingehuurde krachten van elders. Voor een deel van deze trainingen en cursussen is lesmateriaal ontwikkeld, variërend van tipsheets tot complete readers of boeken, al dan niet met bijbehorende datasets. Enkele boeken zijn gewoon in de winkel te koop, of bij IRE te bestellen, zoals die van Houston en van Cohen. Veel tipsheets zijn online te raadplegen, zij het soms alleen voor leden van IRE. Een van de meest gebruikte programma’s voor het analyseren van data door journalisten is Microsoft Excel, een spreadsheet of rekenprogramma. Over dit programma zijn letterlijk duizenden boeken verschenen, van Excel for Dummies tot Excel 2000 Formulas. Voor cursussen aan journalisten blijken die boeken stuk voor stuk onbruikbaar, was een vroege ervaring van docenten en cursisten computer assisted reporting. De reden hiervoor is tweeledig. In de eerste plaats zijn vrijwel alle boeken over Excel geschreven voor kwantitatief georiënteerde mensen. De meeste journalisten moeten echter een flinke drempel over voor ze zich op een pagina met cijfers storten. Des te belangrijker is het dat gebruikte voorbeelden passen in hun denken. De tweede reden dat gewone Excelboeken niet geschikt zijn voor CAR-trainingen is dan ook dat de meeste voorbeelden zijn ontleend aan praktijken van marketing en verkoop. Voor de meeste journalisten zijn die voorbeelden te ver van hun bed. Een typische Exceltraining voor journalisten heeft een tweeledig doel dat niet aansluit bij standaard boeken. In de eerste plaats moet de training de journalisten ervan overtuigen dat ze een programma als Excel binnen hun eigen journalistieke werkzaamheden op een zinvolle manier kunnen inzetten, met andere woorden, dat ze dat nieuws oplevert: betere stukken, primeurs, hun naam op de voorpagina. Om dit missiewerk te verrichten is het veelal nuttig om te laten zien hoe reeds bekende journalistieke werkzaamheden makkelijker, sneller of beter kunnen worden uitgevoerd met behulp van een programma. In de tweede plaats moeten in de training concrete vaardigheden worden aangeleerd: waarop moet je klikken om wat te doen? Omdat de meeste journalisten weinig affiniteit hebben met rekenen, heeft die vaardigheidstraining veelal zowel betrekking op het programma in engere zin als op de achterliggende rekenkundige theorie (Wat is een procent groei? Wat is een gemiddelde?). Naarmate journalisten meer ervaring hebben met CAR is er minder missiewerk nodig en kunnen de cursussen worden geconcentreerd op vaardigheden pur sang. Voor zeer gevorderde gebruikers is een grotere afstand tot de journalistieke praktijk geen ramp: zij zijn doorgaans in staat om gebruikte voorbeelden te abstraheren en vervolgens te vertalen naar de eigen beroepspraktijk. De pioniers in de discipline hebben het immers ook op deze manier onder de knie gekregen: door voorbeelden uit volkomen andere praktijken, zoals marketing en verkoop, te vertalen naar de journalistiek, drijvend op hun eigen fantasie.
15
Dit impliceert dat de hoogste didactische eisen moeten worden gesteld aan cursussen en lesmateriaal voor beginners. Een typische beginnerscursus bevat de volgende elementen: 1. Werving: door dit te leren word je een betere journalist. Dit is het missiewerk. Het gaat erom beginners te laten zien dat ze in hun bestaande beroepspraktijk verder kunnen komen door te leren werken met een spreadsheet, of te leren zoeken in een of andere database. 2. Overtuiging: je kúnt het leren. Juist omdat veel journalisten ‘bang’ zijn voor cijfers of voor computers in het algemeen is het van belang hen ervan te overtuigen dat ze geen raketgeleerde hoeven te zijn om de gepresenteerde vaardigheden onder de knie te krijgen. Het bijbrengen van enig zelfvertrouwen is essentieel om mensen de drempel over te krijgen om een programma of een techniek daadwerkelijk te gaan gebruiken. 3. Theorie: wat wil je eigenlijk weten en hoe kom je daarachter? In veel gevallen gaat het om elementaire rekenkunde of brugklaswiskunde: percentages, totalen, gemiddelden, lopende gemiddelden, veranderingen, verdelingen. Mensen móeten begrijpen wat ze doen: krachtig rekentuig in handen van degenen die niet weten wat ze aan het doen zijn is vragen om een goed gevulde rubriek Correcties & Aanvullingen. 4. Praktijk: hoe moet je het doen? Het gaat om de concrete bediening van het programma. Welke menu-opties heb je nodig, op welke knoppen moet je klikken? Het heeft de voorkeur om per cursus of cursus-item niet te veel opties te behandelen. Liever maakt men de cursisten daadwerkelijk vertrouwd met een beperkt aantal mogelijkheden. Vooral bij beginnerscursussen moeten docenten erop bedacht zijn dat journalisten flinke lacunes kunnen hebben in algemene computerkennis, bijvoorbeeld niet weten hoe ze een bestand dat ze aantreffen op het web kunnen opslaan op hun eigen harde schijf, of dat ze meer dan één programmavenster tegelijk open kunnen hebben. Deze elementen keren overal terug in het Amerikaanse lesmateriaal, zowel in de boeken van auteurs als Houston, Garrison en Cohen, als in de talloze tipsheets van NICAR/IRE. Voor het gebruik van online bronnen blijkt de drempel lager dan voor het gebruik van analysegereedschap. Moest begin jaren negentig ook op dit front nog aan werving en overtuiging worden gewerkt, nu is dit nauwelijks meer nodig. Iedere journalist heeft ervaring met het intikken van een trefwoord in Google. Van daaruit is er nog erg veel te leren, maar de gemeenschappelijke basis is een stuk steviger dan die voor kwantitatieve analyses.
NICAR
Op de website van NICAR zijn honderden zogeheten tipsheets te vinden met uitgewerkte voorbeelden en stukjes theorie voor bepaalde facetten van computer assisted reporting. Het zijn los van elkaar staande documenten, van vele tientallen verschillende auteurs. Tussen sommige tipsheets bestaat een aanzienlijke overlap, tussen andere gapen forse kloven. In elk geval is de inhoud van de documenten niet op elkaar afgestemd. Het is
16
mogelijk in de bibliografische gegevens van de documenten te zoeken, maar er is geen systematische lijst van tipsheets voorhanden. Het gefragmenteerde karakter van de tipsheets vloeit deels voort uit opzet. Zoals Jeff South, docent journalistiek aan de Virginia Commonwealth University in Richmond, schrijft in een handleiding voor het maken van lesmateriaal voor CAR-trainingen: +
Keep training materials short
+
Focus on just one skill, like ‘calculating percentage change in Excel’ or ‘joining tables with Access’
Dezelfde Jeff South heeft tevens handzame inventarisaties gemaakt van vaardigheden in Excel en Access die voor journalisten nuttig zijn. Deze inventarisaties zouden kunnen dienen als uitgangspunt voor het aanleggen van een verzameling handleidingen. De bibliografische informatie over de NICAR tipsheets kan worden doorzocht op http://www.ire.org/resourcecenter/initial-search-tipsheets.html Bij nadere beschouwing blijken er twee typen tipsheets te bestaan: enerzijds zijn er handleidingen waarin een bepaalde vaardigheid aan de orde komt (zoals het berekenen van groeipercentages in Excel), anderzijds zijn er handleidingen over een bepaalde toepassing (zoals tips voor CAR-verhalen over onderwijs). Van die tweede categorie gaat maar een deel van de tipsheets in op daadwerkelijke vaardigheden. De rest bevat overzichten van potentiële (online) bronnen en suggesties van wat je zou kunnen analyseren, zonder in detail uit te leggen hoe je dat moet doen. Uitgebreider en systematischer dan de tipsheets zijn de boeken over bepaalde journalistieke portefeuilles (beats) die IRE/NICAR uitgeeft. Deze gaan gedetailleerd en systematisch in op een specifieke journalistieke data-analysetaak, bijvoorbeeld hoe je ongelijkheid in het verlenen van hypotheken kunt opsporen, hoe je misdaadcijfers kunt analyseren, en hoe je gegevens over luchtvaartveiligheid kunt onderzoeken. Deze boeken bieden een op maat gesneden combinatie van inhoudelijke kennis en praktische vaardigheden. Ze zijn typisch ruim honderd pagina’s dik en voorzien van een spiraalrug, zodat ze goed open blijven liggen naast de computer en de gebruiker de voorbeelden stap voor stap door kan lopen. Nadeel is dat de inhoud zo Amerikaans is dat de boeken buiten de Verenigde Staten weinig praktische waarde hebben. De opzet ervan kan dus voor het Nederlands taalgebied wel als voorbeeld dienen, maar een vertaling of bewerking is zinloos. Het boek van Houston, werkzaam bij IRE/NICAR, is breder van opzet en omvat vele portefeuilles. Net als voor de beat-boeken geldt dat de inhoud is toegespitst op de Amerikaanse situatie. Maar uit de opzet zijn wel lessen te trekken en sommige onderdelen zijn wel te bewerken met Nederlands of Belgisch materiaal. Een voorbeeld hiervan is het vergelijken van gemeentelijke begrotingen van verschillende jaren waarvoor Houston uitgewerkte voorbeelden geeft, compleet met oefeningen en datasets. Het boek van Cohen gaat weliswaar over rekenen en statistiek in de journalistiek, maar gaat meer in op de benodigde theoretische kennis – Wat is een procent of een gemiddelde? Wanneer is een enquête betrouwbaar? – dan op praktische analysevaardigheden. Dit wat abstractere karakter maakt het boek beter bewerkbaar voor de Nederlandstalige markt, maar tevens minder bruikbaar als CAR-leerboek.
17
Europese ervaringen met Amerikaans lesmateriaal
De eerste ervaringen met CAR-trainingen in Europa zijn stuk voor stuk opgedaan met Amerikaans lesmateriaal. Dit geldt zowel voor trainingen op het gebied van data-analyse als voor trainingen in het gebruik van online bronnen. Het European Journalism Centre in Maastricht, de NetMedia conferenties in Londen, en de Zweedse en Deense verenigingen van onderzoeksjournalisten waren pioniers in het aanbieden van CAR-scholing in Europa. Aanvankelijk – in de periode 1993 tot 2000 – werden hiervoor vooral Amerikaanse docenten ingevlogen, die hier het lesmateriaal gebruikten dat ze thuis ook gebruikten. Later namen Europeanen een steeds groter deel voor hun rekening. Maar ook Europese docenten van het eerste uur als Peter Verweij van de School voor Journalistiek in Utrecht putten aanvankelijk uit Amerikaanse voorbeelden. De eerste ervaringen met dit lesmateriaal waren niet onverdeeld positief. Dat bleek ook doordat de traditie van computer assisted reporting in Europa nauwelijks werd opgepikt. En degenen die er wél zelf mee aan de slag gingen waren veelal niet degenen die in Europa een cursus hadden gevolgd, maar die de vaardig-heden zelf hadden ontwikkeld, of in de Verenigde Staten inspiratie hadden opgedaan. Gezien de eerdere Amerikaanse ervaringen is dit – achteraf gezien – ook wel verklaarbaar: de Amerikaanse voorbeelden stonden in het algemeen tamelijk ver af van de Europese beroepspraktijk. Zo werden veelal Amerikaanse overheidsdata gebruikt die in de meeste Europese landen voor journalisten volstrekt onbereikbaar zouden zijn, bijvoorbeeld om privacyredenen. Door deze discrepantie tussen lesmateriaal en eigen ervaring c.q. mogelijkheden konden cursisten CAR afdoen als ‘interessant, maar in mijn situatie niet toepasbaar’. In de loop van de jaren negentig moeten er vele honderden journalisten uit Europa CARtrainingen hebben gevolgd. In de media zag men daar tot voor kort zeer weinig van terug. Zowel degenen die wél CAR-technieken toepasten als degenen die hierin trainingen verzorgden begonnen in te zien dat de trainingen op de eerste twee punten – werving en overtuiging – tekort schoten. Cursisten hadden na een training niet het idee dat ze met Excel beter hun werk zouden kunnen doen, en ze hadden niet het idee dat ze er nu zelf mee aan de slag konden. Trainingen in het gebruik van online bronnen hadden in dit opzicht meer succes, omdat het gebruik van online bronnen al snel veel breder ingang vond en docenten snel lokale voorbeelden gingen gebruiken. Op basis van deze ervaringen drong gestaag het besef door dat lokaal, of op zijn minst Europees trainingsmateriaal nodig was. Het Deense instituut DICAR begon al eind jaren negentig met de systematische ontwikkeling van eigen lesmateriaal, dat voor een deel ook in het Engels is vertaald ten behoeve van internationale trainingen. Op de NetMedia conferentie in Londen in 2000 werd reeds behoorlijk wat Europees materiaal gebruikt. Bij de trainingen op de eerste Global Investigative Journalism Conference in Kopenhagen in 2001 werd vrijwel uitsluitend Europees materiaal gebruikt, overwegend van DICAR. Buiten de trainingen was een sessie gewijd aan wat de perspectieven van CAR zijn in landen waar je niet al die overheidsdatabases tot je beschikking hebt zoals in de Verenigde Staten. Aan de hand van met name Nederlandse en Zweedse voorbeelden werd getoond dat ook in Europese landen het zelf analyseren van data door journalisten een aanzienlijke meerwaarde kan hebben: dat relevante data beschikbaar zijn, en dat er echt nieuws in de zin van voorpaginapublicaties uit te halen is voor wie weet wat hij met die data kan doen.
18
Op de tweede Global Investigative Journalism Conference in Kopenhagen in 2003 nam de aandacht voor niet-Amerikaanse toepassingen van computer assisted reporting verder toe. Er waren zelfs aansprekende voorbeelden uit Zuid-Amerika. Qua ontwikkeling van lesmateriaal buiten de Verenigde Staten blijkt Denemarken voorop te lopen.
19
20
Hoofdstuk 3 :
Deens lesmateriaal
Iedere journalist hoort een basistraining informatietechnologie te volgen van twee weken, zegt Flemming Svith, directeur opleidingen van het Deense DICAR (Danish Institute for Computer-Assisted Reporting). Pas dan wordt het mogelijk om creatieve verbanden te leggen met behulp van de computer. “Welke knoppen gebruik ik? Van welke moet ik juist afblijven? Basiskennis van pc en software is het fundament van CAR. Daarna volgt al het andere.” CAR werd lange tijd niet serieus genomen in journalistiek Denemarken. Vijandigheid (‘ga weg, hebben we niet nodig’) ging over in argwaan (‘eerst zien, dan geloven’) en evolueerde in oprechte interesse. Volgens Nils Mulvad, directeur van DICAR, staan de Deense media nu open voor CAR. “De primeurs zijn gekomen. Journalisten beseffen dat de computer belangrijk is.” Bijna vijfhonderd journalisten volgden sinds 1999 CAR-cursussen op het werk of in Århus, de zetel van DICAR. Het instituut is verbonden aan de Deense journalistenschool en wordt financieel gesteund door Deense media, bonden, persverenigingen en scholingsinstituten. In Århus heeft DICAR twee moderne lesruimtes met dertig computers die permanent in verbinding staan met internet. Er werken zes mensen. De meeste cursussen zijn voor de geldschieters gratis. DICAR gaf ook les aan (honderd) Noren, Albanezen, Moldaviërs, Hongaren en Roemenen. Europees speelt het instituut een voortrekkersrol op het gebied van de ontwikkeling van lesmateriaal voor CAR. DICAR steekt in het bijzonder veel tijd in basistraining, lesmethodieken, en bewerkstelliging van openbaarmaking van overheidsinformatie. Deze onderwerpen komen in achtereenvolgende paragrafen nader aan bod. DICAR verzorgde workshops op de wereldconferentie voor onderzoeksjournalistiek in Kopenhagen in 2003 en smeedde een internationale netwerk van CAR-trainers. Ook hieraan worden afzonderlijke paragrafen gewijd. In ‘Slotopmerkingen’ staan enige suggesties voor nieuw te ontwikkelen lesmateriaal.
De cursusinhoud
Bij Deense (en ook Nederlandse) media bestaat een duidelijke wil om journalistieke uitingen efficiënter en goedkoper te produceren met behulp van informatietechnologie. Kennis en kwaliteit van apparatuur verschillen echter sterk per onderneming. In de ene organisatie is ‘de computerkenner’ de persoon die weet hoe een harde schijf moet worden gedefragmenteerd. Bij een ander bedrijf is dat de whizzkid die via de programmeertaal Perl ‘rauwe data’ kan schonen. Bij het ene bedrijf worden elk jaar de computers vervangen, bij een ander pas eens in de vijf jaar. Software op pc’s kent minder grote verschillen. De meeste journalisten werken met Internet Explorer (voor surfen op internet) en Microsoft Office (waarin Word, Excel en soms ook Access zit). Dat is ruim voldoende voor een eerste kennismaking met CAR. Het Deens lesmateriaal gaat uit van het aanleren van drie basisvaardigheden:
21
A.Kennis van computers en software B. Vaardigheden die niet gerelateerd zijn aan computers C. Sociologische kennis, analytische vaardigheden en de mogelijkheid om CAR te combineren met andere journalistieke vormen (Overige vaardigheden) A en B zijn direct aan te leren en kunnen worden getest met examens. De derde kwalificatie, C, moet vooral in de journalistiek praktijk gestalte krijgen. DICAR onderscheidt vijf niveaus van computer- en softwarekennis. Tot nu heeft het instituut voornamelijk de eerste drie niveaus gedoceerd. Voor het moeilijkere, maar wel noodzakelijke vierde en vijfde niveau verwacht het instituut de komende jaren meer belangstelling. A. Kennis van computers en software NIVEAU 1: Besturingssysteem (Windows) 1. Openen, verwijderen en verplaatsen van mappen 2. Openen, verwijderen en verplaatsen van bestanden 3. Bestanden delen met anderen
Tekstverwerker (Microsoft Word) 1. Nieuw document openen 2. Tekst openen, onderdelen wijzigen, kopiëren, verplaatsen en invoegen 3. Verschillende bestandsformaten openen 4. Meerdere teksten tegelijkertijd raadplegen 5. Zoeken en vervangen 6. Eigenschappen van documenten 7. Taalopties en leestekens 8. Opmaken van teksten, lettergrootte wijzigen, paragrafen aanpassen
Internet (Internet Explorer) 1. Inhoud en navigatie kennen van de tien meest gebruikte websites op je eigen vakgebied 2. Navigeren met internet via voorkeuren, URL-adressen en surfen. 3. Organiseren van favoriete bookmarks 4. Booleaans zoeken 5. Web zoeken 6. Zoeken in archieven van kranten en speciale websites 7. Validiteit van website inschatten (begrip van URL, crosschecken)
E-mail (Outlook of Outlook Express) 1. Ontvangen en verzenden 2. Tekst kopiëren vanuit tekstverwerker naar e-mailclient en omgekeerd. 3. Ontvangen van bestanden, opslaan in de relevante map, openen van aanhangsels. 4. Bestanden meesturen 5. Adressenlijsten maken 6. Gebruik van carbon copy- en blind carbon copy-velden 7. Aanmelden op mailinglijst. 8. Post sorteren, post delen met anderen 9. Doorsturen post, automatisch antwoord bij afwezigheid, handtekening instellen
22
Communicatie (notebook met modem) 1. Kennis over communicatieprocessen met modem 2. Werken met een mobiele computer buiten het bedrijf
Rekenprogramma 1 (Excel) 1. Structuur rekenbladen, intikken van cijfers, letters en formules, gebruik van muisfuncties 2. Importeren tekstbestanden 3. Importeren van html- en pdf-files. 4. Data schonen, rekenen met formules en functies. 5. Transformeren van tabellen in grafische plaatjes 6. Indexeren van berekeningen 7. Sorteren van data
NIVEAU 2 Rekenprogramma 2 (Excel) 1. Data schonen en in verticale rijen zetten 2. Rijen in kolommen omzetten 3. Waardes invoegen 4. Subtotalen bepalen 5. Filters gebruiken 6. Draaitabel toepassen 7. Papieren documenten invoeren
Mapping 1 1. Kaart openen 2. Groeperen van data, fractals of lineair 3. Lagen toevoegen in kaart 4. Kaart omzetten in grafische afbeelding
Database 1 1. Openen van nieuwe tabel, data invoeren 2. Zoekactie in tabel uitvoeren 3. Selecteer data volgens bepaalde criteria 4. Groepeer, calculeer, bepaal gemiddelde, elimineer decimalen 5. Relaties tussen tabellen 6. Sorteren data 7. Importeren en exporteren 8. Gelaagde zoekacties 9. Data genereren en delen met anderen
NIVEAU 3 Rekenprogramma 3 (Excel) 1. Patronen ontdekken 2. Voorbeeldtabellen maken 3. Zoeken in databases en internet
Mapping 2 1. Eigen kaart maken
23
2. Kaartprojectie manipuleren
Database 2 (Access) 1. Expressies maken 2. Zoekacties aanmaken, verwijderen en toevoegen 3. Formulieren maken 4. Rapporten maken 5. Fouten opsporen en data controleren 6. Referentietabellen en zoekacties op internet
NIVEAU 4: Database 3 (Access) 1. Ontwerpen van eigen database met vele relaties 2. Macro’s gebruiken
Statistieken (SPSS) 1. Afhankelijke en onafhankelijke variabelen 2. Hypotheses formuleren 3. Importeren van data in SPSS 4. Distributie van data testen 5. Nieuwe variabelen maken en crosschecken 6. Analyse lineaire regressie 7. Intervallen 8. Willekeurige testen
NIVEAU 5 1. Aanpassen van data 2. Clusteranalyse 3. Multivariabele analyse
B. Vaardigheden die niet gerelateerd zijn aan computers 1. Wiskundige basiskennis 2. Interviewtechniek – verwerken in data 3. Kennis van waar data is te vinden en in welke vorm (mondeling, op papier of digitaal) 4. Begrip van verschillen tussen ‘schone’ en ‘ruwe data’ 5. Kennis van regels toegang tot data
C. Overige vaardigheden 1. Feiten vinden 2. Vergelijkingen maken 3. Tendensen ontdekken 4. Patronen zien 5. Systemen doorgronden, werkelijkheid toetsen 6. Sociologische vaardigheden
24
Toepasbaarheid voor Nederlandstalige journalisten De cursusaanpak leidde tot tientallen artikelen. Zo kwamen rariteiten in wachtlijsten in de Deense gezondheidszorg aan het licht. In het district Randers blijken vaker dan elders in Denemarken misdaden door fietsers te worden gepleegd. En een groot aantal Deense politiemensen zit in de gemeenteraad of is anderszins actief in de politiek. De opzet van deze verhalen was vrijwel steeds hetzelfde: 1. Vraag bij de overheid de cijfers op of dwing ze desnoods af via (dreigen met) de rechter. 2. Zorg ervoor dat de data digitaal wordt aangeleverd volgens een vast formaat. 3. Maak de data gemakkelijk manipuleerbaar, bijvoorbeeld via conversie. 4. Spoor met filters opmerkelijke verbanden en associaties op (hoogste, laagste, kleinste, grootste). 5. Is dat eenmaal gelukt, geef dan een context aan het nieuwsfeit
Deze aanpak is zondermeer toepasbaar voor Nederland. DICAR doceert Access en SPSS. Statistiek en het manipuleren van databases is echter met de nieuwere versies van Excel ook mogelijk. Hoe minder software een journalist hoeft te bedienen, hoe prettiger en praktischer dat is. Access leren omwille van het leren van Access is weinig zinvol. Access leren is nuttig als men met Excel onvoldoende uit de voeten kan, omdat de bestanden te groot of te ingewikkeld zijn, of het risico op fouten te groot wordt. DICAR gebruikt in veel oefeningen Deens cijfermateriaal. De meeste datasets zijn dan ook niet bruikbaar voor Nederlands lesmateriaal. De heldere afbakening van het lesmateriaal van DICAR verdient navolging. Vooraf moet goed worden nagedacht over het minimumniveau van kennis over informatietechnologie.
De Deense didactiek
Flemming Svith, directeur opleidingen van DICAR, vindt dat CAR-trainingen een speciale didactische aanpak vereisen. Zijn denkbeelden zijn gebaseerd op de ‘Teach to Teach’-methode, zie ook http://www.teachtoteach.dk. Uit de gesprekken met Svith zijn acht didactische principes te destilleren: 1. Begin goed en herhaal vaak Journalisten zijn vaak hun eigen leermeester op het vlak van informatietechnologie. Slechte gewoontes zijn moeilijk af te leren. Alleen door een regelmatige en langdurige kennisoverdracht is het gedrag te beïnvloeden. Eén cursusdag per jaar is onvoldoende. Na een basistraining van twee weken zijn regelmatig opfriscursussen nodig. 2. Verander de mentaliteit: journalistiek is geen ambacht Journalisten beschouwen hun vak ten onrechte als ambacht. Daarmee doen ze zichzelf tekort. De wetenschap biedt journalisten belangrijke vaardigheden, maar de meeste collega’s halen hun neus op voor sociologie, statistiek, informatietechnologie of rekenkunde. DICAR schuwt uitstapjes naar andere disciplines niet..
25
3. Creëer verschillende impulsen Zien, ervaren, lezen, horen en zelf doen. Bij CAR-trainingen is het belangrijk om de methoden van kennisoverdracht te variëren. De één pikt informatie liever op via een beeldscherm, de ander wil het lezen, de derde luistert liever. DICAR stopt in alle lesmodules bewust ‘voor elk wat wils’. Bij het ontwerpen van de lesprogramma’s wordt zorgvuldig rekening gehouden met een juiste balans tussen de verschillende lesvormen. 4. Creëer een spiraal van behoeftes Componeer de lessen zó dat een elk probleem steeds opnieuw de nieuwsgierigheid opwekt en doet verlangen naar het horen van de oplossing, net zo lang totdat de hele lesstof is behandeld. 5. Stap voor stap op de trap Rafel de bij te brengen vaardigheid uiteen in een serie handelingen met de pc. Leg elke handeling zorgvuldig uit en bouw stap voor stap verder. Kijk nooit verder vooruit dan één traptrede. 6. Begrijpen is geen leren. Leren is geen begrijpen Vermeng de uitleg van een vaardigheid niet met het aanleren van een vaardigheid. Begrijpen en leren zijn twee totaal verschillende processen. Laat CARcursisten eerst begrijpen wat het probleem is, anders hebben ze geen baat bij de oplossing. Leer pas daarna de vaardigheid aan. 7. Speel niet na, maar laat mensen zelf ervaren Fout volgens DICAR: “Ik heb met Excel het rekenkundige gemiddelde genomen van kabeltarieven in Nederland en wat bleek: de meeste Utrechtse gemeenten hebben een hoger kabeltarief dan in de rest van het land. Kijk, dat heb ik op deze manier berekend.” In veel CAR-cursussen kunnen deelnemers te weinig zélf het probleem ervaren, laat staan de oplossing vinden. De lessen zijn voorgekauwd. Een DICAR-trainer speelt een case niet na, maar laat mensen eerst het probleem ervaren. 8. Zorg voor een goede opstelling en werkende techniek DICAR onderzocht de ideale opstelling van techniek en meubilair. Gekozen is voor een vierkante opstelling van bureau’s in het midden van de lesruimte. De pc’s zijn tegen de muurkant geplaatst. Zo kan een cursist gemakkelijk overgaan van luisteren naar oefenen en omgekeerd. Hij hoeft slechts de stoel naar achteren of naar voren te schuiven. In Nederland is nog weinig nagedacht over de didactische aanpak van CAR-onderwijs. Wegener Medialab schakelde eenmalig een onderwijsdeskundige in, stelde leerdoelen vast en evalueerde elke les. De School voor Journalistiek in Utrecht formuleerde enige randvoorwaarden in een lesplan. De Deense methode lijkt op korte termijn in Nederland toepasbaar voor adviezen 3 tot en met 7; dat zijn didactische adviezen die niet aan ruimte, tijdsduur of budgetten zijn gebonden.
26
Openbaarmaking van digitale bronnen
Bij de start van DICAR was Deense overheidsinformatie niet of onvoldoende digitaal beschikbaar. De organisatie stak veel tijd in het delven van digitale data en riep daarbij de hulp in van een gespecialiseerde jurist. De inspanningen leidden tot de leidraad ‘Toegang tot elektronische data’. De belangrijkste principes zijn: Geen digitaal gegoochel met overheidsgegevens Een verzoek tot openbaarmaking gaat niet over de manier waarop de data is opgeslagen, maar altijd over de inhoud. DICAR merkt bij herhaling dat de regels voor inzage of gebruik van data verslechteren wanneer het door de overheid van papier naar een digitaal bestand wordt overgezet. Data in vaste formaten, geschikt voor gangbare software De overheid moet de gegevens niet aanbieden in exotische bestandsformaten (zoals het CBS in Nederland af en toe nog doet), maar in gangbare. De informatie moet toegankelijk zijn via internet of pc met normale software. Uniformiteit van data De overheid moet openbare data van parlement, registers, rechtbanken, overheidsinstanties op uniforme wijze aanbieden: dezelfde systematiek van indeling, een heldere toegankelijkheid en goede doorzoekbaarheid. Gegevens van de overheid zijn publiek domein Juridisch gesproken is de overheid vaak geen eigen eigenaar van de informatie, maar behoort deze toe aan het publiek. In Nederland komen steeds meer bronnen digitaal beschikbaar, al dan niet tegen betaling. Het kadaster geeft journalisten sinds anderhalf jaar dezelfde inzage in gegevens als banken en notarissen hebben en staat ook zoeken op persoonsnamen toe. De Kamer van Koophandel heeft in mei 2003 de zoekmogelijkheden aanzienlijk uitgebreid maar laat zoeken op personen nog niet toe. Parlementaire stukken en wetteksten zijn ook digitaal toegankelijk. De toegang tot de digitale domeindelver van de Stichting Internet Domeinregistratie Nederland, bedoeld voor ‘hoor- en wederhoor’ via het web, is onlangs weer teruggeschroefd. De VVOJ probeert leveranciers van openbare data te verleiden tot uitgebreidere zoekmogelijkheden. Later is de vereniging van plan actief te lobbyen voor digitalisering van nu nog niet of moeilijk toegankelijke overheidsinformatie. De ervaringen van DICAR kunnen daarbij van pas komen.
Conferentie in Kopenhagen
Van 1 tot en met 4 mei 2003 vond in Kopenhagen de tweede Global Investigative Journalism Conference plaats voor onderzoeksjournalisten. DICAR was één van de organisatoren en leverde vijf CAR-trainers en enige sprekers.
27
Gedurende drie dagen werden in blokken van anderhalf uur de volgende CAR-trainingen gegeven: +
‘CAR-training: meer over het web’,
+
Excel 1 (formules), Excel 2 (sorteren data) en Excel 3 (draaitabellen)
+
Access 1 (tabellen doorzoeken), Access 2 (Criteria) en Access 2 (importeren en exporteren)
+
Eigen data vinden via het web
+
Statistiek met bevolkingscijfers
+
Mapping 1 en 2: werken met Maps en ArcView
+
Source management
Negentien CAR-trainers gaven de goed bezochte trainingen. In het leslokaal stonden vijftien laptops voorzien van redelijk moderne software, maar abusievelijk deels in het Deens. De opstelling van meubilair en pc’s leek sterk op die van DICAR. Alle cursisten beschikten over draadloos internet (WLAN). Bezitters van een laptop met eigen WLAN-kaart konden ook gratis internet gebruiken. De lesmethodiek van DICAR-docenten kwam overeen met de aanpak die eerder is beschreven. Hieronder volgen enige impressies van de trainingen in Kopenhagen. De cursus ‘meer over het web’ was oppervlakkig. ‘Ga naar Google News en zoek daar op Noorwegen, of als je in een ander land woont, zoek dan op de naam van je eigen land.’ Informatie ontbrak over zoektechnieken (welke bronnen gebruik je), zoekmethodes (‘denk als een document’) of zoektrucs met frases, mintekens of speciale opdrachten als titelzoeken en zoeken naar alleen Worddocumenten. Bij de Mapping-cursus werd per ongeluk te sterk accent op zelfwerkzaamheid gelegd. Cursisten klaagden over de onleesbaarheid van Deense software en onduidelijke instructies over de installatie van bestanden. De Noorse docenten gaven geen assistentie, want ‘pas door zelf doen snap je het probleem’. Pas achteraf begrepen de docenten de irritatie van de meeste cursisten. Maps 7.0 bevat veel Nederlandse kaarten. Neem een Excel-bestand met Nederlandse statistieken over bijvoorbeeld misdaad en onveilige plekken. Stop het in het programma en genereer automatisch een kaart. Het oogt Spartaans, maar het werkt. De Excel en Access-cursussen voldeden wel aan de verwachtingen. Aan de hand van praktische voorbeelden werd getoond hoe een journalist grote hoeveelheden informatie kan manipuleren en (dwars)verbanden sneller kan ontdekken. Een verrassing was de cursus statistiek met bevolkingscijfers. De docent, politiek adviseur van een socialistische partij in Denemarken, legde helder uit hoe je statistisch verantwoorde conclusies kunt trekken uit een grote hoeveelheid cijfers. Hij toonde overtuigend aan waarom bepaalde stukken in kranten onzin zijn, bijvoorbeeld ‘Mannen boven de 40 beter in seks’. Het onderzoek toont aan dat bij 185 mannen tussen de 30 en 59 jaar ruim 15 procent boven de 46 jaar problemen heeft met erecties en 22 procent onder de 46 jaar. Dit onderzoek van Lorraine Boul haalde niet alleen Deense kranten, maar ook de BBC (http://news.bbc.co.uk/1/hi/health/1875224.stm). Met een paar simpele formules wordt het verhaal volledig onderuit gehaald. Er is statistisch geen significant verschil tussen mensen van boven of onder de 40.
28
Op de conferentie kwam CAR ook aan de orde in vijf workshops: +
Computer-assisted Reporting: Blending it with traditionel investigations.
+
Tracking people across borders: How to find information on people that operate in several countries.
+
The poor and the rich: How to examine the split in local and global economies? How to find and publish income tax for thousands of politicians?
+
New media and investigative journalism: How to publish investigative stories on the net, and how to use the net for interacting with readers to improve investigative results. Status, problems and solutions.
+
Assessing your schools: Using budgets, test scores and services to compare – how to get electronic data in Europe.
+
International data: What’s there and how to report across borders
Enige highlights uit deze workshops: ‘We zijn allemaal nerds now’ begint de goed bezochte bijeenkomst over computer assisted research. Brant Houston (IRE) liet voorbeelden zien van geslaagde research met behulp van de computer, ook bij regionale kranten. The Philadelphia Inquirer legde een verband tussen het aantal verkeersongelukken (hoog) de ligging van bars (veel) en de plek waar de politie controleert (op de verkeerde plek). Een uitgebreid overzicht van nieuws dat tot stand kwam dankzij internet en het gebruik van databases staat op http://www.ire.org/extraextra/car.html De belastinggegevens van zesduizend politici, die zijn natuurlijk geheim. Maar de Braziliaanse journalist Rodrigues vond een oude wet waarmee de inkomensgegevens van verkiesbare politici in 27 staten opvraagbaar zijn. De staten gaven de informatie alleen op papier. Rodrigues maakte er een database van, te vinden op http://www.controlepublico.com.br. De tienduizenden gegevens werden handmatig ingetikt door steeds twee mensen. Daarna werden beide datasets met elkaar vergeleken. Een derde persoon controleerde de fouten. Mark Hunter, een Amerikaan in Frankrijk (al 22 jaar), heeft het vooral over de strategie van zoeken. Wie zoek je? Waarom zoek je? Wil je hun wereld binnentreden? Zo ja, hoe doe je dat? Hij speelt een case na. Zijn opdracht was: kom via internet aan een vals paspoort. Hij tikt "fake id" in Google Groups in. Op alt.2500.fakeid leest hij over mensen die een vals paspoort weten te fabriceren. Hij was verbijsterd. Hij kreeg informatie van fabrikanten van paspoortdrukkerijen en allerlei directe aanbiedingen voor de vervaardiging van een eigen, verzonnen paspoort. Tot werkelijke aankoop ging hij niet over.
In een besloten discussiegroep werd lesmateriaal uitgewisseld tussen Europese CAR-trainers. De formule om op verschillende niveaus vaardigheden aan te leren met Excel is zonder meer toepasbaar in Nederland. De mappingsoftware is vanwege de Nederlandse kaarten goed bruikbaar. De cursussen over research met internet laten slechts een glimp zien van de vele journalistieke mogelijkheden en zijn daarom nauwelijks nuttig te noemen. Aardig is de DICAR-cursus in statistiek. Journalisten zijn na een training in staat om sneller vraagtekens te plaatsen bij uitkomsten van wetenschappelijke onderzoeken en polls. De workshops bevatten veel prachtige voorbeelden van nuttige CAR-projecten, maar gingen niet al te diep in op methodologie van elk onderzoek.
29
Internationaal netwerk van CAR-trainers
In Kopenhagen werd op 5 mei een internationaal netwerk van CAR-trainers opgericht onder auspiciën van DICAR. De oprichters zijn Dick van Eijk, Henk van Ess, Peter Verweij (Nederland), Flemming Svith, Mogens Møller Olesen (Denemarken), Gabriel Giurgiu, (Roemenië) en Sevko Bajic, (Bosnië Herzegovina). Doel is om Europese CAR-methodieken en lesmaterialen uit te wisselen. Het netwerk gebruikt een mailinglijst om met elkaar te communiceren. Dicar maakt in samenwerking met de CAR-trainers een website met links en uitleg van researchmethodieken in Europese landen. Een derde besluit is een gids voor Engelstalig CAR-trainingsmateriaal. De samenwerking brengt wellicht een regelmatige uitwisseling van lesmateriaal op gang, waarmee de kennis over methodiek, didactiek en inhoud en van CAR kan worden vergroot.
Slotopmerkingen
Het Deense lesmateriaal gaat vooral over ordenen, analyseren en converteren van data. Dat is pas mogelijk als de informatie er al is. DICAR gebruikt informatietechnologie nauwelijks als instrument om zélf feiten te vergaren. Trainingen in het gebruik van zoekmachines worden aan het Deense instituut maar mondjesmaat gegeven. Met geavanceerde zoektechnieken is het mogelijk om het antwoordenlijstje aanzienlijk kleiner te maken en kan ook gericht naar documenten worden gezocht. Ook aparte trainingen over zoeken naar cijfers ontbreken. Lesmateriaal voor het vinden van nieuwsbronnen heeft DICAR niet, ondanks nieuwe ontwikkelingen op internet. Zo zorgen RSS-readers voor constante aanvoer van het laatste nieuws op elk vakgebied en kunnen journalisten met speciale software een seintje ontvangen wanneer en hoe de informatie van een website is gewijzigd. Afzonderlijke lesmodules over het bepalen van betrouwbaarheid van websites en web ‘hoor en wederhoor’ heeft DICAR niet, net als trainingen in Personal Information Managers (PIM’s). PIM’s geven journalisten de mogelijkheid om dwarsverbanden te leggen tussen afzonderlijk opgeslagen informatie (denk aan apart opgeslagen rechtbankrollen, archiefstukken, e-mail). DICAR onderschrijft het belang en nut van dit soort trainingen “We zijn er domweg nog niet aan toegekomen”, zegt Flemming Svith. Het Deense instituut overweegt in nieuwe lesprogramma’s meer aandacht te besteden aan nieuwsgaring via CAR. De verwachting is dat het internationale netwerk van CAR-trainers daarin een ondersteunende rol gaat spelen.
30
Hoofdstuk 4 :
Nederlands lesmateriaal
In Nederland en België bestaan geen instituten die zich hebben toegelegd op het aanbieden van trainingen computer assisted reporting voor werkende journalisten. Het European Journalism Centre in Maastricht biedt zeer incidenteel wel eens een Engelstalige cursus aan. Enkele jaren geleden is een Nederlandstalige pilot opgezet voor een online training voor economieredacteuren. Deze behelsde zowel het gebruik van online bronnen als het analyseren van data met een spreadsheet. Deze pilot heeft echter nooit een vervolg gekregen en het lesmateriaal is niet verder ontwikkeld. Ook de derde-geldstroominstituten van de scholen voor journalistiek bieden wel eens cursussen zoeken of analyseren van data. Nergens is dit echter geïnstitutionaliseerd tot een echte leergang. Voorts vinden binnen sommige uitgeverijen wel cursusactiviteiten plaats, bijvoorbeeld in het kader van het Wegener Medialab. Er bestaan geen boeken in het Nederlands over de toepassing van informatietechnologie in nieuwsgaring. Wel bestaan er enkele Nederlandstalige boeken over zoeken op het internet; deze zijn echter niet specifiek voor journalisten geschreven. Boeken over data-analyse voor journalisten bestaan niet in het Nederlands. Voor zo ver je kunt spreken van Nederlands(talig) lesmateriaal op het gebied van computer assisted reporting heeft dit de vorm van ad hoc handouts van individuele docenten, hetzij staf van een journalistiek-opleiding, hetzij werkende journalisten die wel eens lesgeven aan collega’s. Nergens bestaat een overzicht van dit materiaal, nergens wordt het verzameld. Voor zo ver bekend heeft nooit iemand een poging gedaan lesmateriaal te schrijven dat breder inzetbaar is dan voor een eigen training. De VVOJ heeft de ambitie zulk materiaal te ontwikkelen of te doen ontwikkelen. Consequentie van het voorgaande is dat dit vrijwel vanaf de grond zal moeten geschieden, waarbij hopelijk lessen kunnen worden getrokken uit buitenlandse ervaringen en uit de schaarse ervaringen met CAR-training in Nederland.
Trainingen op de conferentie onderzoeksjournalistiek
Op de conferentie over onderzoeksjournalistiek in Utrecht op 8 en 9 november 2002 organiseerde de VVOJ tien verschillende trainingen in computer assisted reporting (CAR), variërend van zoeken op internet tot rekenen met Excel. Sommige trainingen werden meer dan één keer aangeboden, zodat in totaal achttien sessies zijn georganiseerd. Hiervoor waren in de conferentieruimte Oudaen in Utrecht drie zalen beschikbaar, met in totaal 36 cursistenplaatsen voorzien van een laptop. Voor de trainers was eveneens een laptop beschikbaar, gekoppeld aan een beamer. Alle computers waren via een intern netwerk aangesloten op internet. Omdat Oudaen noch computerfaciliteiten had, noch over een netaansluiting beschikte, is het hele pakket inclusief een netaansluiting bestaande uit zes ISDN-lijnen door KPN geleverd. Drie systeemredacteuren van kranten waren gedurende de hele conferentie aanwezig om problemen op te lossen. Zij stonden tevens de KPNmedewerkers bij in het opbouwen en afbreken van het netwerk.
31
De belangstelling voor de trainingen was overweldigend: er waren aanzienlijk meer aanmeldingen dan plaatsen. Daarom werden de deelnemers op basis van hun tevoren kenbaar gemaakte voorkeuren ingedeeld. In totaal zijn zo 215 deelnemersplaatsen vergeven, waarmee alle trainingen op één na vol waren. Overigens is niet iedereen die zich heeft aangemeld komen opdagen. Het gros van de vrijkomende plaatsen werd direct door anderen ingenomen. Hoeveel mensen uiteindelijk hebben deelgenomen is niet geteld. Waarschijnlijk iets meer dan tweehonderd. Zes van de tien trainingen hadden betrekking op online zoeken, de overige hadden componenten van ordenen en analyseren in zich. Hieronder korte beschrijvingen van de trainingen zoals ze in het conferentieprogramma waren opgenomen. Bewust is ervoor gekozen om voornamelijk beginnerscursussen aan te bieden: er is immers nog weinig ervaring met computer assisted reporting in Nederland en Vlaanderen. Alleen voor het gebruik van online bronnen zijn ook trainingen voor wat meer gevorderden aangeboden, omdat zoeken op internet inmiddels gemeengoed is en menig journalist op dit terrein reeds over de basiskennis beschikt. 1. Basiscursus zoeken op internet Op een eenvoudige manier zijn de resultaten van een zoektocht op internet sterk te verbeteren. Tijdens deze training komen de basisbegrippen aan de orde die van belang zijn bij het zoeken op het web en elders op internet. Verder: keuze van het juiste zoekgereedschap, formuleren van het einddoel en de zoekvraag, zoeken door te combineren, zoeken in het onzichtbare deel van het web. Docent: Theo Stielstra (de Volkskrant). 2. Geavanceerd zoeken op internet Zoekmachines kunnen meer dan je denkt, maar pas als je slimme vragen stelt, krijg je een bruikbare reactie. Met twee journalistieke cases: vertrouwelijke VN-documenten op straat, plus de ontmaskering van AltaVista. Met aandacht voor bijzondere zoektrucs (de kracht van frase-zoeken, koppensnellen, speciale documenten vinden, interne testdatabases van zoekmachines gebruiken), associatief zoeken met Google Labs en DMOZ (Soms heeft u een vreselijk vage vraag, waarmee u niet bij een zoekmachine durft aan te kloppen. Probeer het toch.), verdwenen websites opsporen (De gevoelige website is verdwenen van het net. Wat nu?) en nieuws zoeken. Docent: Henk van Ess (Utrechts Nieuwsblad). 3. Personen zoeken via internet Met twee journalistieke cases: hoe vind ik het geheime nummer van Linda de Mol en de handelaar in GBH-drugs? Verder speciale aandacht voor ‘Clavannen’ zoeken (Nederlandse onderzoeksdatabank, interne mailinglijsten van beroepsgroepen – van huisartsen tot voetbal-scheidsrechters – gericht gebruik van nieuwsgroepen), ‘gewone mensen’ zoeken (‘hoe vind ik een werkloze autofanaat’, zoeken naar jongeren, doorzoeken van elektronische buurthuizen, de kracht van het kadaster), e-mailadressen zoeken, zoeken van telefoonnummers (ook op nummer of met heel weinig gegevens) en persoonsprofielen samenstellen via internet. Docent: Henk van Ess (Utrechts Nieuwsblad).
32
4. Zoeken buiten de gevestigde orde Voetbalsupporters, krakers, anti-globalisten, dieren- en milieuactivisten: allemaal gebruiken ze internet om onderling te communiceren en om hun standpunten en inzichten naar voren te brengen. Hoe vind je als de plaatsen waar deze uitwisselingen zich afspelen, hoe ga je te werk bij het in kaart brengen van deze groepen of personen? Aan de orde komen onder meer: keuze van het juist zoekgereedschap en de juiste zoektermen, zoeken door te combineren, in kaart brengen van een netwerk rond personen, zoeken naar personen, zoeken buiten het web. Docent: Arjan Dasselaar (freelance). 5. Zoeken naar cijfers op internet De krant zakt over twintig minuten. In een nog te redigeren bericht staat dat in Nederland de benzineprijzen het hoogst zijn in de wereld. Dit kan niet kloppen, denkt de eindredacteur. Maar hoe vind je binnen twintig minuten de juiste cijfers? Bij een verhaal voor de krant van morgen over de olijfproductie in ZuidEuropa moet nog een kaartje waarop is te zien waar de meeste bomen staan. Wie beschikt over de gegevens? Bijna alles wat te tellen is, wordt ook geteld. Maar het vinden van de juiste bron is vaak een hele opgave – zeker als het snel moet. In deze training wordt getoond hoe het internet van dienst kan zijn bij het vinden van betrouwbare statistieken onder tijdsdruk. Docent: Arlen Poort (NRC Handelsblad). 6. Zoeken naar bedrijfsgegevens Wie in een paradijs verkeert waar ze Bloomberg of Reuters terminals hebben, mag zich gelukkig prijzen. Maar vele journalisten moeten het doen met wat internet te bieden heeft. Dat is nog heel wat. Zowel aandacht voor grote, internationaal opererende bedrijven, als voor midden- en kleinbedrijf. Hoe kom je erachter wie de bestuurders zijn van een buitenlandse vennootschap? Juist in onderzoeksprojecten loop je vaak op tegen allerlei schimmige vertakkingen van BV-netwerken. Hoe sprokkel je die gegevens bij elkaar met hulp van online bronnen? Ook: hoe presteert de Mexicaanse beurs ten opzichte van Europese beurzen? Docent: Pieter Kort (Quote Finance) en Arjan Dasselaar (freelance). 7. Je eigen documentatie in een fulltext database Artikelen bewaren in mapjes is goeddeels overbodig aan het worden. Dankzij de pc en internet is het tegenwoordig heel eenvoudig om nieuws en achtergronden rond je specialisaties op systematische wijze te volgen, je selecties vervolgens in elektronische vorm op te slaan en daar vervolgens snel weer dossiers uit samen te stellen. Deze workshop gaat over het opzetten van je eigen elektronische documentatiesysteem en het werken met een snel doorzoekbaar fulltext databaseprogramma (AskSam). Docent: Marcel Metze (freelance). 8. Rekenen met Excel Ook de journalistiek ingegaan omdat je een hekel had aan rekenen? Met een spreadsheet-programma als Excel wordt rekenen simpel en bijna net zo leuk als het schrijven van een ‘stukkie’. In een handomdraai en een muisklik zet je bij een bericht over hoogte van de werkloosheid of de instroom van het aantal
33
asielzoekers een grafiekje, of bereken je een percentageverschil of een gemiddelde. Met een plaatje of een grafiekje wordt het bericht leuker om te lezen; een gemiddelde zegt meer dan een rijtje afzonderlijke cijfers. In deze workshop gaat het om een eerste kennismaking met het programma, en om het laten zien van het belang van een spreadsheet voor berichtgeving en onderzoek. Docent: Peter Verweij (School voor Journalistiek). 9. Excel voor economieredacteuren Daar zit je dan, met een stapel jaarverslagen of een lange lijst met namen en getallen. En dan? Hoe zet je koele cijfers om in nieuws? Excel helpt. Een workshop over de talloze analytische mogelijkheden van werken met spreadsheets: ordenen, rekenen en spelen met cijfers. Na een algemene inleiding waarin basisvaardigheden als indexeren, sorteren en belangrijke functies als gemiddelden berekenen en grafieken maken worden behandeld, volgt een bijzondere praktijkopdracht: Graaien aan de top. Oftewel: wat zijn de optiepakketten van de Nederlandse topmanagers waard? Docent: Pieter Kort (Quote Finance). 10. Zelf databases maken met Excel Kenmerk van nogal wat onderzoeksjournalistiek is dat je in de loop van een project erg veel informatie verzamelt. Bepaalde typen informatie lenen zich heel goed voor opname in een gestructureerde database: zegslieden, adressen, transacties, gebeurtenissen, bezittingen, bronverwijzingen. Zolang het niet al te ingewikkeld wordt zijn zulke gegevens prima bij te houden met Microsoft Excel. In deze training leer je hoe je zelf een database maakt in Excel, hoe je er gegevens aan toevoegt, en hoe je die gegevens kunt ordenen en doorzoeken. Vereiste voorkennis: geen. Het is wel aan te bevelen het programma Excel een keer te bekijken. Docent: Dick van Eijk (NRC Handelsblad).
Evaluatie van de trainingen
Na afloop van elke training werd de deelnemers verzocht een online evaluatieformulier in te vullen. Na de conferentie is aan iedereen die zich voor een training had ingeschreven een mailtje verstuurd met het verzoek het evaluatieformulier alsnog in te vullen indien men dat nog niet had gedaan. Al met al zijn 143 ingevulde formulieren binnengekomen, een respons van ongeveer zeventig procent. Aan de deelnemers zijn acht meerkeuzevragen en twee open vragen gesteld. Per vraag volgt hieronder een samenvatting van de resultaten met een beknopte interpretatie. Indien een cursus meer dan één keer is gegeven zijn de resultaten bijeengevoegd. 1. Was je voorkennis voldoende om de cursus te kunnen volgen? 1=Onvoldoende 2=Matig 3=Voldoende 4=Goed 5=Zeer goed
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde
34
3,8 3,9 4,1 3,3 3,7
Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
2,8 3,3 2,7 4,4 2,5
In het algemeen was de voorkennis van de deelnemers ruim voldoende. De trainingen waren dus niet te moeilijk. Rekenen blijkt voor journalisten een lastig vak. 2. Wat vind je van de wijze van werken, zoals kennisoverdracht, oefensituaties en de eventuele handouts? 1=Onvoldoende 2=Matig 3=Voldoende 4=Goed 5=Zeer goed
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
3,8 3,9 4,1 3,3 3,7 2,8 3,3 2,7 4,4 2,5
De meeste trainingen scoren ten minste ruim voldoende. Drie blijven steken tussen matig en voldoende: de twee waarvoor de deelnemers hun voorkennis onvoldoende vonden en de askSam-trainingen. Maar het blijkt niet zo te zijn dat degenen die hun voorkennis onvoldoende achtten de wijze van werken en de handouts als onvoldoende beoordelen. In tegendeel: de relatief lage score bij Zoeken naar bedrijfsgegevens en Rekenen met Excel komt vooral door degenen die hun voorkennis wél voldoende achtten. De lage score van de askSam-trainingen wordt voor een dele veroorzaakt door technische problemen bij een van deze trainingen. 3. De behandelde stof was: 1=veel te makkelijk 2=iets te makkelijk 3=precies goed 4=iets te moeilijk 5=veel te moeilijk
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
2,6 3,1 2,9 3,3 3,0 2,8 3,3 2,7 2,5 3,2
Alle trainingen scoren binnen een halve punt van ‘precies goed’. Dit is in overeenstemming met de antwoorden op vraag 1. Opmerkelijk is dat Rekenen met Excel niet als te moeilijk wordt ervaren.
35
4. De opdrachten/oefeningen waren: 1=veel te makkelijk 2=iets te makkelijk 3=precies goed 4=iets te moeilijk 5=veel te moeilijk
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
2,9 3,2 2,8 3,3 3,0 2,8 3,3 2,7 2,7 3,5
Wederom scoren alle trainingen binnen een halve punt van ‘precies goed’. 5. De begeleiding was: 1=Onvoldoende 2=Matig 3=Voldoende 4=Goed 5=Zeer goed
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
3,5 4,0 3,8 3,3 3,8 2,8 3,3 2,7 4,4 2,6
De meeste trainingen scoren ten minste ruim voldoende. Drie trainingen scoren net onder voldoende, namelijk dezelfde drie waarbij deelnemers hun voorkennis tekort vonden schieten en waarbij de werkwijze onder de 3 bleef steken. 6. Heeft de cursus aan je verwachtingen voldaan? 1=helemaal niet 2=nauwelijks 3=enigszins 4=behoorlijk 5=volkomen
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
3,7 4,1 4,0 3,3 3,8 2,8 3,3 2,7 4,4 2,7
Geavanceerd zoeken, Personen zoeken en Zelf databases maken met Excel springen er in positieve zin uit. De drie trainingen die bij eerdere vragen het laagste scoorden doen dat bij deze vraag wederom.
36
7. Waren de organisatie en de omstandigheden (zoals cursusruimte en apparatuur) naar tevredenheid? 1=helemaal niet 2=nauwelijks 3=enigszins 4=behoorlijk 5=volkomen
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
3,4 3,6 3,8 3,3 2,9 2,8 3,3 2,7 4,3 2,1
De lage score van de askSam-trainingen valt regelrecht terug te voeren op de technische problemen bij de eerste training (de eerste training scoorde 1,9 de tweede 2,5). De hoge score van Zelf databases maken met Excel hangt er wellicht mee samen dat voor deze training geen internetverbinding nodig was, zodat de krappe bandbreedte niet tot vertragingen leidde. 8. Ik geef de training het cijfer: 1=Onvoldoende 2=Matig 3=Voldoende 4=Goed 5=Zeer goed
Basiscursus zoeken op internet Geavanceerd zoeken op internet Personen zoeken via internet Zoeken naar cijfers op internet Zoeken buiten de gevestigde orde Zoeken naar bedrijfsgegevens Excel voor economieredacteuren Rekenen met Excel Zelf databases maken met Excel Je eigen documentatie in een fulltext database
3,6 3,9 4,2 3,3 3,6 2,8 3,3 2,7 4,3 2,2
Na de antwoorden op de eerdere vragen levert het eindcijfer geen verrassingen meer op. 9. Aan welke soorten trainingen of workshops heb je in de nabije toekomst behoefte? Ruim de helft van de respondenten (82) hebben op deze vraag een antwoord gegeven. Een deel van de antwoorden kan vooral worden opgevat als een aanmoediging voor de VVOJ, in de zin van ‘ga vooral zo door’. Zoals een deelnemer schreef: “Meer en langer van dit!” Een andere veel voorkomende algemene opmerking is dat men graag langere trainingen wil (een halve dag of een dag). “Tempo is te hoog om meer te doen dan er aan ruiken”, schreef een deelnemer. Voorts wordt er expliciet gevraagd naar, in afnemende frequentie: +
Geavanceerd zoeken
+
Personen zoeken
+
Excel voor gevorderden
+
Databases (sommigen noemen expliciet Access, sommigen laten het open en kunnen dus ook fulltext databases of online bronnen bedoelen)
37
+
Documenteren en archiveren
+
Zoeken buiten de gevestigde orde
+
Bedrijfsgegevens zoeken
+
Jaarverslagen lezen
+
Wobben
+
Interviewen
+
Methoden van onderzoeksjournalistiek
De honger naar zoekkennis lijkt niet te stillen. Gelukkig hebben we op dat terrein ook de meeste docenten. 10. Heb je nog opmerkingen of vragen? Bijna een derde van de respondenten (44) heeft bij deze vraag iets ingevuld. Vier typen opmerkingen domineren: +
Algemene waardering, zowel voor het hele initiatief als voor afzonderlijke docenten
+
Klachten over de techniek: velen vonden de internetverbinding te traag (navraag leert dat KPN op zo korte termijn niet meer bandbreedte kon leveren voor een enigszins redelijke prijs), sommigen hadden graag een externe muis gehad
+
De trainingen waren te kort waardoor er te weinig tijd was voor oefeningen
+
De opzet was te Nederlands, van het toetsenbord (veel Belgen werken op een azerty in plaats van een qwerty) tot de gebruikte voorbeelden
De handouts die de docenten hadden gemaakt voor de trainingen zijn inmiddels in aangepaste vorm beschikbaar gesteld aan alle VVOJ-leden via het ledendeel van de website.
38
Hoofdstuk 5 :
Conclusie
Uit de jarenlange Amerikaanse ervaringen kunnen direct lessen worden getrokken voor de Vereniging van Onderzoeksjournalisten: Het is in het algemeen nodig om specifiek op de journalistieke beroepspraktijk toegesneden lesmateriaal te ontwikkelen indien men journalisten wil scholen in technieken van computer assisted reporting. Voor andere doelgroepen gemaakt lesmateriaal is hoogstens geschikt voor zeer ervaren gebruikers. Er is een duidelijke hiërarchie aan te brengen in CAR-vaardigheden. Het basisniveau behelst zoekvaardigheden en het gebruik van een spreadsheet, alsmede algemene computervaardigheden. Een tree hoger staan complexe zoekvaardigheden, ook buiten het world wide web, en het gebruik van databaseprogramma’s. Op het derde niveau komt het converteren van data en het gebruik van desktop mapping. Op het hoogte niveau qua moeilijkheidsgraad staat het gebruik van statistiekprogramma’s en programmeren. Voor het aanbieden van trainingen verhouden deze niveaus zich tot elkaar als hoogtelagen in een piramide: er moet een zekere basiskennis op niveau één beschikbaar zijn eer het zin heeft om een training op niveau twee te ontwikkelen, etcetera. De VVOJ zou moeten beginnen om trainingen en lesmateriaal op de onderste twee lagen te ontwikkelen. Nadat aanvankelijk veel verschillende computerprogramma’s werden gebruikt door Amerikaanse CAR- specialisten, is de laatste jaren een standaardisatie opgetreden. Bij de keuze van software gaat het dan niet zo zeer om wat het beste programma is, maar welk programma door de meeste journalisten wordt gebruikt. Immers, voor dat programma is relatief eenvoudig hulp te krijgen binnen de journalistieke gemeenschap, bijvoorbeeld via discussielijsten op internet die specifiek over computer assisted reporting gaan. De VVOJ doet er goed aan meteen aan te sluiten bij deze in de Verenigde Staten ontwikkelde voorkeuren. Voor wat betreft spreadsheets en databases zijn dit Microsoft Excel en Microsoft Access. De ervaringen met Amerikaans lesmateriaal in Europa leren dat niet alleen de software en de aan te leren vaardigheden ertoe doen, maar ook de data en de te behandelen journalistiek vragen. Data en vragen moeten aansluiten bij de beroepservaringen van de cursisten. Die aansluiting moet beter zijn naarmate de ervaring van de cursisten geringer is. Voor de VVOJ betekent dit dat ook bij de bewerking van buitenlands lesmateriaal Nederlandse en Belgische data moeten worden gezocht, en journalistieke vragen moeten worden geformuleerd waarmee Nederlandse en Vlaamse journalisten zich vertrouwd voelen. Uit de ervaringen bij het Deense DICAR blijkt vooral dat het nuttig is goed doordacht lesmateriaal te maken. DICAR geeft drie kwalificaties, maar deze zijn niet volledig. Zo ontbreken kwalificaties voor onderzoek met internet en het gebruik van moderne gereedschappen om informatie op te slaan en terug te vinden. In het bijzonder de suggesties voor basisvaardigheden met software en pc van DICAR zijn toepasbaar in Nederland. De ‘Deense didactiek’ is interessant. Voornamelijk het onderscheid tussen begrijpen en leren en het ‘zelf ervaren’ van lesstof geeft houvast voor nog te ontwikkelen Nederlandstalig lesmateriaal voor CAR. DICAR heeft veel kennis opgedaan voor het verkrijgen van toegang tot digitale bronnen. Die kennis is bruikbaar voor het losweken van Nederlandse data.
39
De cursussen in statistiek en Excel, gegeven op de wereldconferentie voor onderzoeksjournalisten in Kopenhagen, zijn zonder meer toepasbaar in Nederland. DICAR heeft minder kennis van het zelf vergaren van informatie via internet. Een Europees netwerk van CAR-trainers gaat onder auspiciën van DICAR kennis en lesmateriaal uitwisselen. Hiermee kan de kennis over methodiek, didactiek en inhoud van CAR worden vergoot. Uit de trainingen die de VVOJ op de conferentie in Utrecht heeft aangeboden blijkt in de eerste plaats dat er onder Nederlandse en Vlaamse journalisten een grote behoefte bestaat aan scholing in technieken van computer assisted reporting. Bovendien bleek dat het werken met Nederlands lesmateriaal en Nederlandse data werkt. De cursisten waren enthousiast, waardeerden de trainingen, die in het algemeen aansloten op hun eigen mogelijkheden en ervaringen. Dit sluit aan bij de Amerikaanse en Deense ervaring dat lesmateriaal moet worden toegesneden op de lokale beroepspraktijk. De VVOJ zou daarom een programma kunnen formuleren met vaardigheden waarvoor ze de komende jaren lesmateriaal en oefendata wil (doen) ontwikkelen. Naast dit ontwikkelwerk is verder onderzoek nodig naar de effectiviteit van lesmateriaal. Zo is bijvoorbeeld niets bekend over de rekenkundige voorkennis van journalisten in Nederland en Vlaanderen, wat het lastig maakt om cursisten op het juiste niveau aan te spreken. Een cursus Excel voor wie percentages en gemiddelden gesneden koek vormen ziet er anders uit dan zo’n cursus voor wie tevens moet worden bijgeschoold in rekenen. Bij het ontwikkelwerk is bovendien aandacht nodig voor de soms aanzienlijke verschillen tussen Nederland en Vlaanderen.
40
Literatuur +
Sarah Cohen, Numbers in the Newsroom. IRE, Columbia, 2001.
+
Melisma Cox, ‘The Development of Computer-Assisted Reporting’. Paper gepresenteerd aan de University of North-Carolina in Chapel Hill in maart 2000.
+
Bruce Garrison, ‘Online Information Use in Newsrooms: A longitudal Diffusion Story’. Paper gepresenteerd op de conferentie Media in the New Millennium: Technology, Images, Issues, in februari 2000.
+
Brant Houston, Computer-Assisted Reporting: A Practical Guide (2nd edition). Bedfords/St. Martin’s, New York, 1998.
+
Philip Meyer, The New Precision Journalism. Indiana University press, Bloomington & Indianapolis, 1991.
+
Poynter Institute, When Nerds and Words Collide. Poynter Institute, St. Petersburg, 1999.
+
Joel Simon & Carol Napolitano, ‘We’re All Nerds Now’, in Columbia Journalism Review, maart/april 1999.
+
Jeff South, ‘Make great training materials in 30 minutes or less’. Paper voor de NICAR conferentie in Boston, maart 1999.
+
Jeff South, ‘Checklist of spreadsheet skills (Excel)’. Paper voor de NICAR conferentie in Boston, maart 1999.
+
Jeff South, ‘Checklist of database management skills’. Paper voor de NICAR conferentie in Boston, maart 1999.
+
Peter Vasterman & Peter Verwey, Computer Assisted Research and Reporting. Cahiers Journalistiek en Communicatie, nummer 11. HvU Press, Utrecht, 1992.
+
Peter Verwey, CAR revisited – Ontwikkelingen in digitale journalistiek. Cahiers Journalistiek en Communicatie, nummer 22. HvU Press, Utrecht, 2000.
41