Internetresearch
Internetresearch Arjan Dasselaar
Culemborg
ISBN: 978-90-5940-480-9 NUR: 988 Trefw.: internet Omslag: Artifex Graphics, Roosendaal Vormgeving (concept): Aad Metz, De Meern Opmaak: Van Duuren Media, Culemborg
Dit boek is gezet met Corel VENTURA™ 10. Dit boek is gedrukt op een papiersoort die niet met chloorhoudende chemicaliën is gebleekt. Hierdoor is de productie van dit boek minder belastend voor het milieu. © Copyright 2010 Van Duuren Media B.V. Van Duuren Informatica is een imprint van Van Duuren Media B.V. Op dit werk is de Creative Commons-licentie CC BY-NC-SA 4.0 van toepassing. De volledige details en voorwaarden van deze licentie vindt u op https://creativecommons.org/licenses/bync-sa/4.0/.
Ondanks alle aan de samenstelling van dit boek bestede zorg kan noch de redactie, noch de auteur, noch de uitgever aansprakelijkheid aanvaarden voor schade die het gevolg is van enige fout in deze uitgave.
Overige series bij Van Duuren Media... ...in je broekzak De serie ...in je broekzak kent diverse kleine referentiegidsjes boordevol basisvaardigheden, tips, trucs, nuttige websites en naslaginformatie over het beschreven onderwerp. De inhoud is bondig, relevant, helder en informatief, waarbij het onderwijzende aspect iets minder prominent aanwezig is. Leer jezelf SNEL... De serie Leer jezelf SNEL... kenmerkt zich door een opzet van bondige hoofdstukken in een boekje dat qua formaat uitnodigt tot lezen en zelfstudie. De serie ontleent haar naam aan het feit dat de stof snel kan worden doorgewerkt en opgenomen. Leer jezelf MAKKELIJK... De serie Leer jezelf MAKKELIJK... is bedoeld voor de lezer die duizelt van onbegrijpelijk jargon, Engelse termen, complexe constructies en ondoorgrondelijke voorbeelden. Gelardeerd met afbeeldingen, vele praktijkvoorbeelden en nuttige tips en wetenswaardigheden, is de serie Leer jezelf MAKKELIJK... voor nagenoeg elke computergebruiker – beginner of gevorderde – een verademing. Leer jezelf PROFESSIONEEL... De serie Leer jezelf PROFESSIONEEL... biedt wat de naam reeds doet vermoeden: professionele onderwerpen, beschreven op een hoog doch begrijpelijk niveau. Zonder te verzanden in minutieuze details beschrijven de auteurs van deze serie ingewikkelde onderwerpen op een heldere en duidelijke wijze, waarbij complexere voorbeelden niet worden geschuwd. Superboek De serie Superboek omvat titels die complexe onderwerpen op een geavanceerd niveau beschrijven, zonder onbegrijpelijk te worden. Ook hier blinkt het taalgebruik uit in doorzichtigheid en leesbaarheid, evenals de vele voorbeelden, tips en achtergronden. Boeken in de serie Superboek kunnen als naslagwerk worden bestempeld, maar ook als referentiegids en geavanceerd cursusmateriaal. Megatips De serie Megatips bevat boeken boordevol tips over een bepaald onderwerp. Deze tips zijn op diverse manieren gerubriceerd en ingedeeld, zodat opzoeken zeer eenvoudig wordt gemaakt. Enkele titels zijn voorzien van een cd-rom met aanvullende software en een zoekmachine. De serie is opgezet voor de hobbyist of de professional die over een waardevol naslagwerk wil beschikken. Computer Idee... Duidelijk voor iedereen De serie Computer Idee... Duidelijk voor iedereen is bedoeld voor de enthousiaste computergebruiker. De serie behandelt diverse aspecten van het praktisch omgaan met hardware en software. De auteurs van deze serie zijn stuk voor stuk ervaren computergebruikers die hun sporen in de journalistiek ruimschoots hebben verdiend. Ga voor het actuele titeloverzicht naar www.vanduurenmedia.nl
Registreer uw boek!
Van Duuren Media biedt haar lezers een unieke service. Op de website www.vanduurenmedia.nl kunt u dit boek kosteloos registreren. Als klant van Van Duuren Media hebt u via de website toegang tot speciale gebieden met: • Nieuwsberichten • Interessante links • Speciale e-zines en archieven
Registratiecode van deze titel:
HBK-4420-7 Registreer u vandaag nog en krijg gratis toegang tot de discussiefora op de website van Van Duuren Media. Bovendien maakt u dan regelmatig kans op gratis boeken en leuke prijzen, en ontvangt u tweemaandelijks een nieuwsbrief, met: • • • •
Tips en trucs Extra informatie Wetenswaardigheden Nuttige links
Om te registreren: • Ga naar www.vanduurenmedia.nl. • Klik op Registreer!
Over de auteur Arjan Dasselaar (1975, www.arjandasselaar.nl) werkt sinds 1997 als journalist voor het weekblad Elsevier. Ook ontwikkelde hij de eerste sites van dit tijdschrift, zette hij in 2000 de eerste vierkoppige internetredactie van Elsevier op, en was hij geruime tijd internetcolumnist voor dit blad. Met die laatste activiteit verwierf hij een eervolle vermelding bij de verkiezing van het Gouden Pennetje. Dasselaar werkte tevens geruime tijd voor de redactie van Planet Internet als onder meer columnist en onderzoeksjournalist. Hij was een van de founding bloggers van Quotenet.nl en daarmee een van de eerste betaalde bloggers in Nederland. Nog altijd schrijft hij voor het blog bizz.nl. Tevens is hij columnist van nieuwssite NU.nl. Voor het Financieele Dagblad schrijft hij daarnaast over technologie. Dasselaar doceerde aan journalistiekopleidingen van de Universiteit Leiden (2005-2007), de Rijksuniversiteit Groningen (2007-2009) en de Erasmus Universiteit (2010). Sinds 2001 gaf en geeft Dasselaar incompany trainingen en strategisch advies bij uiteenlopende instellingen als het Europees Parlement, Wegener, het toenmalige PCM, VNU, Reed Business en diverse regionale mediaorganisaties. Verder was hij contentmanager bij zakensite zibb.nl. Eerdere boeken van Dasselaar: • Handboek Digitale Criminaliteit (2005, 2e herziene druk in 2008) • Handboek voor de ZZP’er (2009, 2e herziene druk in 2010) • Handboek Crossmediale Journalistiek en Redactie (2010)
Trainingsmogelijkheden U wilt dat uw medewerkers snel leren de vaardigheden uit dit boek in de praktijk toe te passen? Auteur Arjan Dasselaar geeft met zijn bedrijf ISOPEDA sinds 2001 intensieve researchtrainingen bij kranten, tijdschriften, tv-zenders en andere bedrijven. Ook geeft hij trainingen in webredactie, SEO en webschrijven binnen de journalistieke praktijk, en crossmediale redactievoering. Zo gaf Arjan onder meer trainingen bij de Weekbladpers, RTL Nieuws, het Europees Parlement, Reed Business, VNU, de Fontys Hogeschool Journalistiek, de Christelijke Hogeschool Windesheim en de Persgroep toen dat bedrijf nog PCM heette. De inhoud van het trainingsprogramma is maatwerk. Afhankelijk van uw voorkeuren en het voorkennisniveau van de cursisten kunt u kiezen voor een stoomcursus van een dag, maar ook voor een gedetailleerd meerdaags programma. Het lesprogramma over meerdere dagdelen of data verdelen, behoort uiteraard ook tot de mogelijkheden, net als het uitbreiden van de cursus met journalistieke en/of computergerelateerde onderwerpen die buiten het bestek van dit boek vallen. Neemt u vrijblijvend contact op voor een offerte door een e-mail te sturen naar
[email protected], of te bellen naar 020-7072189.
Inhoud 1
2
Basis van zoekstrategie
1
Goed gereedschap Nuttige computerprogramma’s Internet Explorer – www.microsoft.com/windows/ie/ Firefox – www.getfirefox.com Google Chrome – chrome.google.com Google Desktop – desktop.google.com Copernic Desktop Search – www.copernic.com Nuttige sites Google Language Tools – www.google.com/language_tools Babel Fish – babelfish.yahoo.com Uw computer beter bedienen tijdens het zoeken Algemene Windows-wenken Internet Explorer Firefox Chrome Algemene zoekstrategie Drie gouden zoekregels
2 4 4 6 7 7 9 10 10 11 12 12 13 14 16 16 17
Zoekmachines en internetgidsen
19
Wat zijn zoekmachines en internetgidsen De werking van een zoekmachine Spiders en crawlers Tekstanalyse en heuristiek Metadata Autoriteit Spamdexing Bediening van zoekmachines Booleaanse operatoren Bediening van internetgidsen Rubrieksindeling Zoekveld
20 23 24 24 25 25 27 27 27 30 30 31
ix
Inhoud
3
x
Kenmerken van goede zoekmachines en internetgidsen Scheiding commercie en inhoud Hulp Transparantie
31 31 32 32
Google
33
De basismogelijkheden van Google Met alle woorden Met de exacte woordcombinatie Met een van deze woorden Zonder de woorden Op datum zoeken Speciale functies van Google Een site doorzoeken Verdwenen documenten terughalen Zoeken op documenttype Verborgen documenten vinden, ofwel: het combineren van de voorgaandedrie zoekopdrachten Geavanceerd gebruik van de cache Google als woordenboek Google als rekenmachine Google als synoniemenzoeker Soortgelijke pagina’s vinden Taalfuncties Google dijt uit Google Maps Google Persoonlijk Google Web History Google Custom Search Engine Google Scholar Google Books Google N(i)e(u)ws Google Finance Google Images Google Video Google Products Experimentele Google-functies Google Sets Google Experimental Google-software Google Toolbar Google Earth Google Desktop Overige functies van Google
34 37 38 39 43 45 47 47 49 50 54 58 59 59 60 61 62 64 64 65 66 66 66 66 67 67 67 67 67 68 68 70 70 70 70 71 71
Handboek – Internetresearch
4
5
Overige zoekmachines
73
Nederlandse zoekmachines Zoeken.nl – www.zoeken.nl Ilse – www.ilse.nl Kobala – www.kobala.nl Buitenlandse zoekmachines Yahoo! – www.yahoo.com Wolfram|Alpha – www.wolframalpha.com Bing – www.bing.com Ask.com – www.ask.com Alexa – www.alexa.com AltaVista – www.altavista.com Gigablast – www.gigablast.com WikiAnswers – http://answers.wikia.com/ Metazoekmachines Clusty – www.clusty.com Dogpile – www.dogpile.com Freebase – www.freebase.com Gespecialiseerde zoekmachines Google Directory – directory.google.com/Top/Computers/Internet/Searching/ Search_Engines/Specialized Wikipedia’s lijst van zoekmachines – en.wikipedia.org/wiki/ List_of_search_engines Beaucoup – www.beaucoup.com Pandia – www.pandia.com/powersearch Informatie en nieuws over zoekmachines SearchEngineWatch – www.searchenginewatch.com Voelspriet – www.voelspriet.nl InfoPeople-lijsten – www.infopeople.org/search Bruce Clay – www.bruceclay.com/searchenginerelationshipchart.htm
74 74 74 75 75 75 76 77 78 78 78 79 80 80 81 82 82 83
Internetgidsen en het diepe web
89
Goede versus slechte internetgidsen Startpagina – www.pagina.nl Yahoo! – dir.yahoo.com About.com – www.about.com DMOZ – www.dmoz.nl Google Directory – www.google.com/dirhp en www.google.nl/dirhp Best of the Web – botw.org ipl2 – www.ipl2.org Library of Congress – international.loc.gov en www.loc.gov Intute – www.intute.ac.uk
90 90 91 91 92 92 93 94 94 95
83 84 84 84 86 86 87 87 88
xi
Inhoud
Het diepe web Infomine – infomine.ucr.edu Google Scholar – scholar.google.com CompletePlanet – www.completeplanet.com
6
7
8
xii
96 99 100 100
Lui zoeken
101
De lui-zoeken-via-Google-truc Inleiding tot expertdiensten Library of Congress – www.loc.gov/rr/askalib Ask an ipl2 Librarian – www.ipl2.org/div/askus/ People’s Network (Groot-Brittannië) – www.peoplesnetwork.gov.uk Ask a Librarian (Schotland) – www.nls.uk/info/readingrooms/askalibrarian.html AllExperts – www.allexperts.com Answers.com – wiki.answers.com LinkedIn Answers – www.linkedin.com/answers Hunch – www.hunch.com Aardvark – www.aardvark.com Uclue – www.uclue.com Answerbag – www.answerbag.com Profnet – profnet.prnewswire.com MAD – www.madsci.org/submit.html Yahoo! Answers – answers.yahoo.com KEN – www.steljevraag.nl Automatisch op de hoogte blijven via websites Google Alerts – www.google.nl/alerts en www.google.com/alerts Yahoo! Pipes – pipes.yahoo.com Automatisch op de hoogte blijven via software
102 103 103 104 105 106 106 107 108 108 109 110 111 111 112 112 114 115 115 117 118
De structuur van internet
121
In den beginne… Waarom internet niet bestand is tegen een kernaanval Waarom IP en DNS voor researchers toch onmisbaar zijn Url’s en de opbouw van webadressen Het ontleden van websites Voorbij het WWW
122 125 127 128 131 134
Bronverificatie
137
Fameuze blunders De Paaseierenregel™ Sites die niet zijn wat ze lijken WHOIS, of: de personen achter een website AllWhois – www.allwhois.com
138 140 141 143 146
Handboek – Internetresearch
9
CentralOps – centralops.net/co/ SIDN-whois – https://www.sidn.nl/nc/over-nl/whois/ Alternatief voor SIDN – tools.webtic.nl/domein_nl.php Gerelateerde WHOIS-diensten Domain Tools Suggestions – domain-suggestions.domaintools.com Siteautoriteit: zoeken naar een second opinion Rechtstreeks via een zoekmachine Via Submit Express – tools.marketleap.com/publinkpop Werking en nut van traceroutes en reverse DNS-scans Traceroute Reverse DNS-scans
149 149 151 151 151 152 152 154 155 155 158
Personen, deskundigen en bedrijven zoeken
163
Sneeuwballen gooien Adresgegevens en telefoonnummers van personen achterhalen De Telefoongids – www.telefoongids.nl Infobel – www.infobel.com Adresgegevens en telefoonnummers van bedrijven achterhalen Gouden Gids – www.goudengids.nl Kamer van Koophandel – www.kvk.nl/handelsregister Reverse lookups Nummerboek – www.nummerboek.com Nummerzoeker – www.nummerzoeker.com Ik heb je – www.ikhebje.nl WhitePages – www.whitepages.com/reverse-lookup Personen vinden met internetregisters Wieowie.nl – www.wieowie.nl Pipl – www.pipl.com Hyves – www.hyves.nl Schoolbank – www.schoolbank.nl Schoolpagina – www.schoolpagina.nl Dienstmakkers – www.dienstmakkers.nl Kadaster – www.kadaster.nl Naymz – www.naymz.com Yahoo! People Search – people.yahoo.com Diverse personenzoekmethoden – zoeken.beginthier.nl Deskundigen vinden Nederlandse Onderzoek Databank – www.onderzoekinformatie.nl BIG-register (gezondheidszorg) – www.bigregister.nl Advocaten – www.advocatenorde.nl/nova/advocaten2b.nsf/zoek?openform Diplomaten (Oranje Boekje) – www.mfa.nl Zakenlui vinden – www.forbes.com/peopletracker E-mailadressen opspeuren Andere manieren om personen op te sporen
164 164 165 166 167 167 167 168 169 170 170 171 172 172 173 173 174 175 175 176 177 177 178 179 179 179 180 181 182 182 183
xiii
Inhoud
10
11
xiv
Nieuws vergaren met RSS
185
Wat is RSS? Hoe RSS helpt bij research Het voordeel van RSS boven nieuwsbrieven Welke sites bieden RSS? Weblogs Nieuwssites Bedrijven Verschillende standaarden RSS lezen FeedDemon – www.feeddemon.com FeedReader – www.feedreader.com Snarfer – www.snarfware.com Sharpreader – www.sharpreader.net RssReader – www.rssreader.com NetNewsWire – http://netnewswireapp.com/ (OS X) Mozilla Thunderbird – www.mozilla-europe.org/nl/products/thunderbird/ (Windows, Linux, OS X) RSSOwl – www.rssowl.org (Windows, Linux, OS X) RSS-feeds bekijken via websites Google Reader – www.google.com/reader Bloglines – www.bloglines.com RSS-feeds vinden 1 – Via RSS-zoekmachines 2 – Via de site zelf 3 – Via directory’s – www.newsisfree.com/sources/bycat 4 – Via Google 5 – Zelf een RSS-feed maken
186 187 188 190 190 193 195 196 197 197 198 198 199 199 200
Usenet
211
Wat is Usenet? Toepassingen van Usenet Het Usenet-idioom: wat betekent wat? Het nut van Usenet voor research Google Discussiegroepen (Google Groups) gebruiken voor Usenet-research Personen zoeken met Google Groups Personen zoeken met Google Groups – een praktisch voorbeeld Research naar onderwerpen met Google Groups Nieuwsgroepen over specifieke onderwerpen vinden via Google Groups Usenet-research automatiseren Software voor langdurige Usenet-research
212 212 214 215 215 216 221 222 222 227 227
200 200 202 202 202 203 203 204 206 206 208
Handboek – Internetresearch
12
13
E-mail als informatiebron
231
Wat zijn mailinglijsten Het nut van mailinglijsten Hoe u relevante mailinglijsten vindt Yahoo! Groups – groups.yahoo.com Google Groups – groups.google.nl of groups.google.com L-soft – www.lsoft.com/lists/listref.html Tile – www.tile.net/lists Topica – lists.topica.com The Mail Archive – www.mail-archive.com Wat zijn e-mailheaders? E-mailheaders vinden Microsoft Outlook 2000, Outlook XP, Outlook 2003, Outlook 2007 Microsoft Outlook Express Mozilla Thunderbird Op de Mac: OS X Mail E-mailheaders begrijpen E-mailheaders analyseren
232 232 233 234 234 235 235 236 237 237 237 237 238 239 240 240 241
Social networks, chatdiensten en andere sociale sites
247
Social networks Twitter – www.twitter.com Facebook – www.facebook.com Foursquare – www.foursquare.com LinkedIn – www.linkedin.com Hyves – www.hyves.nl MySpace – nl.myspace.com Orkut – www.orkut.com Friendster – www.friendster.com Andere sociale sites Scribd – www.scribd.com Slideshare – www.slideshare.net Google Wave – wave.google.com YouTube – www.youtube.com Chatdiensten IRC (Internet Relay Chat) – www.mirc.com De kenmerken van IRC Het gebruik van IRC Zoeken naar IRC-channels IRC-opdrachten
248 248 250 250 251 252 252 253 253 253 253 254 254 255 255 256 256 257 260 260
xv
Inhoud
Overige chatdiensten Windows Live Messenger – messenger.live.com ICQ – www.icq.com/whitepages Trillian – www.ceruleanstudios.com
262 262 262 263
A
Nuttige researchwebsites
265
B
Overzicht van TLD’s
289
Index
xvi
297
1
Basis van zoekstrategie
Z
oals de Almelose cabaretier Herman Finkers ooit zong: wie een stier wil castreren, moet over een scherp mes beschikken. En – wat Finkers niet meldde – over de juiste anatomische kennis. Evenzo heeft het weinig zin om onvoorbereid te beginnen met zoeken. Van belang is daarbij zowel het gereedschap als de kennis van de researcher. Daarom komen in dit hoofdstuk zowel nuttige software en hardware aan de orde als de basisvaardigheden waarover een succesvolle onderzoeker moet beschikken.
U leert in dit hoofdstuk:
Welke software en hardware een researcher in elk geval nodig heeft. Welke sites en computerprogramma’s het zoeken prettiger maken. Tips en trucs om uw computer tijdens het zoeken efficiënter te gebruiken. De drie basisstappen in een succesvolle zoektocht.
Hoofdstuk 1 – Basis van zoekstrategie
Goed gereedschap Om te kunnen zoeken op internet hebt u een computer nodig en een internetverbinding. Dat klinkt eenvoudig, maar die uitspraak is ongeveer net zo volledig als te zeggen dat u om auto te rijden een stuk blik op vier wielen nodig hebt plus een paar liter benzine. Zit u dagelijks vierhonderd kilometer op de weg, dan doet u dat bij voorkeur niet met een in degelijk Oost-Europees plastic uitgevoerde Lada van voor die Wende, maar in een comfortabele wagen. Evenzo geldt voor internetresearch dat de lol – en daarmee de efficiëntie – er snel vanaf is wanneer u met slechte spullen werkt. Minimaal hebt u een pc nodig waarop Internet Explorer zonder problemen kan draaien, en waarvan de vaste schijf niet fanatiek aan het ratelen slaat op het moment dat u meerdere browservensters geopend hebt. De hoeveelheid intern geheugen is belangrijker dan de snelheid: zeker op computers met Windows 7 is ten minste vier gigabyte aan intern geheugen aan te raden. Meer is altijd beter. Let op: zorg voor de 64-bitsversie van Windows 7! De 32-bitsversie werkt niet goed samen met grote hoeveelheden geheugen. Werkt u nog met Windows XP of Vista, dan is dit een mooi moment om over te schakelen. Voor nieuwe Mac-modellen geldt dat minimaal vier gigabyte standaard is op onder meer iMacs. Wilt u uw bestaande computer zelf uitbreiden, of gelijk een nieuw modelletje aanschaffen: goedkope computers en computeronderdelen zijn te vinden via de website Tweakers, op www.tweakers.net/ pricewatch.
Afbeelding 1.1
2
Tweakers, voor uw onpartijdige computeraankoopadviezen.
Handboek – Internetresearch
1h002
Wat betreft de internetverbinding geldt iets soortgelijks. Eén keer zes seconden wachten totdat een pagina geladen is, gaat nog wel. Maar wanneer u serieus werk maakt van internetresearch, zult u in een sessie misschien honderd pagina’s bekijken. Zeshonderd seconden wachten staat gelijk aan tien minuten, die u ook had kunnen gebruiken om sneller te vinden wat u zocht, in plaats van u te ergeren. Investeer daarom in een fatsoenlijk DSL(2)-abonnement. Die zijn relatief goedkoop, zelfs bij kwaliteitsaanbieders als TweakDSL en XS4ALL (in geen van welke bedrijven de auteur overigens aandelen heeft). Toch te duur? De Consumentenbond publiceert regelmatig tests van de beste internetaanbieders. Daarnaast wil zoeken op de naam van de aanbieder via www.webwereld.nl nog wel eens nuttige aanvullende informatie opleveren. Zo kunt u via deze nieuwssite bijvoorbeeld snel te weten komen of een internetaanbieder de laatste tijd veel ontevreden klanten heeft. Op de site www.internetten.nl vindt u een feitelijk overzicht van de diverse aanbieders en abonnementsvormen. Veel aantrekkelijke aanbiedingen komen van providers zoals Tele2 en Alice die telefonie- en internetdiensten gebundeld verkopen. Dat kan voordelig zijn, maar hou er wel rekening mee dat u zich met handen en voeten aan één partij bindt.
Afbeelding 1.2 Op www.internetten.nl vindt u een overzicht van de diverse aanbieders en abonnementsvormen.
1h003
3
Hoofdstuk 1 – Basis van zoekstrategie
Nuttige computerprogramma’s Internet Explorer – www.microsoft.com/windows/ie/ Dit programma zit standaard bij ieder exemplaar van Microsoft Windows en wordt gebruikt om pagina’s op het World Wide Web te bekijken. Aanvankelijk begon Internet Explorer (IE) als een poging om Microsoft-concurrent Netscape de voet dwars te zetten. In die tijd was IE duidelijk minder goed dan de Netscape-browsers, maar die situatie is veranderd. IE kan qua functionaliteit heel aardig meekomen. Bovendien is het gratis. Althans, de kosten ervan zijn verdisconteerd in de prijs die u voor Windows hebt betaald.
Afbeelding 1.3 Internet Explorer dankte zijn aanvankelijke populariteit vooral aan fel zakendoen, maar is tegenwoordig een kwalitatief prima product.
1h004
4
Toch heeft Internet Explorer wel wat nadelen. Zo is IE qua beveiliging ongeveer net zo effectief als een golden retriever met een pond zolpidem achter de kiezen. Dat kan ervoor zorgen dat allerlei vervelende programma’s zich zonder uw toestemming op uw pc nestelen, met als doel het stelen van uw persoonlijke gegevens voor marketingdoeleinden – of erger. Deze zogeheten spyware moet u met grote regelmaat verwijderen.
Handboek – Internetresearch
Gratis programma’s om dat te doen vindt u op www.microsoft.com/ security_essentials, www.malwarebytes.org (kent zowel een gratis als een betaalde versie) en op www.safer-networking.org (Spybot Search & Destroy, een Duits programma met dienovereenkomstige subtiliteit in de naamgeving). Echte fanatiekelingen installeren daarna nog Spyware Blaster, te vinden op www.javacoolsoftware.com.
Afbeelding 1.4
Malwarebytes Anti-Malware. In de smaken ‘Gratis’ en
‘Duur’.
ir5-h1-1
Een ander nadeel van IE is dat het geheugen slurpt. Dat is niet zo’n probleem als u altijd in een en hetzelfde browservenster werkt, maar wel wanneer u er tien tegelijk open hebt staan. Verderop in dit boek zult u leren dat het soms heel handig kan zijn om veel vensters geopend te hebben. In dat geval is het nogal vervelend als blijkt dat uw computer al die onderzoeksdrift niet aankan.
Afbeelding 1.5 Spybot Search & Destroy kunt u downloaden via het icoon aan de rechterkant van het scherm, maar ook door (inderdaad) Download te selecteren in het linkermenu en vervolgens wat naar beneden te scrollen. Spybot staat boven in de lijst.
5
Hoofdstuk 1 – Basis van zoekstrategie
1h006 Firefox – www.getfirefox.com IE heeft, zoals u hiervoor kon lezen, nogal wat nadelen. Bent u het beginnerstadium ook maar enigszins ontstegen, schakel dan over op een alternatief. Een van deze alternatieven is Firefox. Deze IE-vervanger beleefde in de zomer van 2004 een flinke doorbraak. Volgens door Wikipedia-vrijwilligers berekende gemiddelden heeft Firefox anno juni 2010 een wereldwijd marktaandeel van 28,75 procent. Dat zo veel gebruikers overschakelen op Firefox is logisch. Firefox is een stuk veiliger en beter beschermd tegen spyware. Of dat komt doordat Firefox beter gebouwd is, of doordat het minder liefhebbers heeft zodat het een minder aantrekkelijk doelwit is voor kwaadwillenden, laten we in het midden. Minstens zo belangrijk: Firefox gaat beter om met geheugen. Tien vensters geopend in Firefox belasten uw pc minder zwaar dan dezelfde tien vensters in IE. Dat heeft voordelen, zeker als u een oudere computer hebt. Mocht Firefox crashen, dan slaagt het programma er achteraf meestal in om u verder te laten gaan op de plek waar u was gebleven. Firefox onthoudt namelijk welke sites u aan het bekijken was. Ook bevat Firefox diverse speciale opdrachten die het leven van de gevorderde internetresearcher een stuk eenvoudiger maken. Zo bevat Firefox een mogelijkheid om met één toetsencombinatie (Ctrl+E) een zoekopdracht voor Google in te voeren. Ten slotte
Afbeelding 1.6
6
Firefox is een betere browser dan Internet Explorer.
Handboek – Internetresearch
zijn er voor Firefox allerlei gratis uitbreidingen beschikbaar, waardoor u bijvoorbeeld speciale muisopdrachten tot uw beschikking krijgt, of het weerbericht automatisch kunt laten binnenhalen (https://addons.mozilla.org). Speciaal voor de lezers van dit boek is een lijstje met de nuttigste Firefoxuitbreidingen beschikbaar. U kunt dit vinden op www.arjandasselaar.nl/ internetresearch.html.
Google Chrome – chrome.google.com 1h008 Op dit moment (juni 2010) de beste browser. (Wel jammer dat – vooralsnog – er geen Mac- en Linux-versies beschikbaar zijn.) Zoals de naam al aangeeft, wordt Google Chrome gemaakt door – inderdaad – Google. Chrome is snel – sneller dan andere browsers. Voor Chrome zijn bovendien ook uitbreidingsprogramma’s verkrijgbaar, die u vindt op https://chrome.google.com/ extensions/.
Afbeelding 1.7 Het is wel degelijk Chrome wat daar blinkt. (U mag nu een boze brief sturen aan Seth Gaaikema.)
ir5-h1-2 Google Desktop – desktop.google.com Wie snel wil kunnen zoeken op internet, moet eerst zijn eigen (elektronische) huis op orde hebben. Soms staat de informatie die u nodig hebt immers op uw vaste schijf. In andere gevallen zult u gegevens op uw computer moeten terugvinden – de naam van een contactpersoon bijvoorbeeld – om uw internetzoektocht te kunnen beginnen. In beide gevallen hebt u veel aan programma’s die uw computer doorzoekbaar maken.
7
Hoofdstuk 1 – Basis van zoekstrategie
De ingebouwde zoekfunctie van Windows XP voldoet voor dat doel niet, want deze is veel te traag. Ook op de ingebouwde zoekmachine van Vista valt het nodige aan te merken. En de zoekmachine van Windows 7 – hoewel beter dan alle voorgaande – breekt evenmin snelheidsrecords.
Afbeelding 1.8
1googledesktop
Informatie op uw bureaublad.
Kortom: hebt u regelmatig last van het syndroom ‘in welk bestand of e-mailtje heb ik dat nu weer voor het laatst gezien’, dan doet u er goed aan Google Desktop te downloaden. Dit programma maakt een index van alle bestanden op uw vaste schijf die teksten bevatten, van Word-documenten tot uw e-mails. Het installeren van Google Desktop doet u het best op een mooie zomerochtend, net voordat u naar het strand vertrekt. Wanneer u alle verkeersinfarcten van de afgelopen tien jaar bij elkaar optelt, hebt u een goede benadering van de tijd die Google Desktop nodig heeft om zich op uw pc te nestelen. Als Google Desktop eenmaal werkt, bespaart het programma u echter zo veel tijd, dat u met liefde over dit ongemak heen zult stappen. Bonus: het programma is beschikbaar voor Windows, OS X en Linux.
1x1
Google Desktop heeft beperkingen. Voor professionele computeraars met grote hoeveelheden documenten en e-mails kan het uitstekende programma X1 (www.x1.com) een prima alternatief zijn. X1 werkt veel sneller dan Google Desktop, met name tijdens het zoeken, maar is echter niet gratis.
8
Handboek – Internetresearch
Afbeelding 1.9
X1, chaoten zweren erbij.
Copernic Desktop Search – www.copernic.com Een goed en eveneens gratis alternatief voor Google-haters die vrezen dat hun volledige vaste schijf door Google Desktop rechtstreeks wordt gekopieerd naar de computers van de CIA. De werking van Copernic Desktop Search verschilt echter weinig van die van Google Desktop, al zit de interface net even iets anders in elkaar. Probeer ze beide uit en kijk welke voor u het prettigst werkt.
Afbeelding 1.10
Het programma Copernic Desktop Search 2: net even anders.
9
Hoofdstuk 1 – Basis van zoekstrategie
Nuttige sites Verderop in dit boek zult u leren zoeken. Maar wat hebt u aan informatie die u niet kunt begrijpen? Veel beginnende researchers laten sites links liggen omdat die in talen zijn geschreven die ze niet begrijpen. Niet nodig. Allerlei diensten kunnen u helpen de informatie op die sites toch te gebruiken.
Google Language Tools – www.google.com/language_tools Via www.google.com is de vertaaldienst van de zoekmachine Google te vinden. Die werkt heel eenvoudig. U voert een zoekopdracht in – bijvoorbeeld “Le Monde”, naar de gelijknamige Franse krant – en klikt vervolgens op Translate this page. Die woorden treft u aan op de eerste, blauwe regel van het zoekresultaat. Hetzelfde trucje kunt u gebruiken in tal van andere talen. Experimenteer maar eens met El País, Corriere della Serra of Al Jazeera. Voorwaarde is wel dat u via de Engelstalige variant van Google zoekt. Dat doet u door op www.google.com voor de optie Google.com in English te kiezen. Weliswaar beschikt de Nederlandse Google-variant ook over een aantal vertaaldiensten, maar die zijn minder uitgebreid. Wilt u de Googletaalhulpmiddelen rechtstreeks benaderen, ga dan naar www.google.com/ language_tools.
Afbeelding 1.11 Google Language Tools is evenmin een talenwonder, maar lijdt in tegenstelling tot SYSTRAN en Babel Fish niet onder kunstmatige beperkingen.
10
Handboek – Internetresearch
Een groot voordeel van Google Language Tools is dat het hier mogelijk is om behalve websites ook teksten uit documenten integraal te vertalen, door deze te kopiëren en te plakken naar het Language Tools-scherm. Via translate.google.com kunt u zelfs documenten uploaden ter vertaling. Concurrerende diensten zoals SYSTRAN (www.systran.co.uk) en het daarop gebaseerde Yahoo! Babel Fish houden er bij dergelijke vertalingen na een beperkt aantal woorden mee op. 1lemonde Babel Fish – babelfish.yahoo.com De naam van deze vertaaldienst is gebaseerd op het gelijknamige visje (jawel) uit het cultboek The Hitchhiker’s Guide to the Galaxy van Douglas Adams. Hoofdpersoon Arthur Dent moet dit visje in zijn oor stoppen om zo allerlei buitenaardse talen te kunnen verstaan. U hoeft geen haring tegen uw trommelvlies aan te drukken om van de vertaaldienst Babel Fish gebruik te maken (al mag het natuurlijk wel, op eigen risico). Deze op de software van vertaalpionier SYSTRAN gebaseerde site is een bruikbaar alternatief voor de diensten van Google.
Afbeelding 1.12 SYSTRAN maakt soms pijnlijk duidelijk dat een computer bij lange na niet in staat is om menselijke vertalers te evenaren.
11
Hoofdstuk 1 – Basis van zoekstrategie
Uw computer beter bedienen tijdens het zoeken Internet Explorer, Firefox en Chrome beschikt over toetsencombinaties die het zoeken vergemakkelijken. Ook het Windows-besturingssysteem bevat enkele nuttige mogelijkheden. Het zal u wellicht opvallen dat deze toetsencombinaties functies activeren die vaak ook met de muis kunnen worden bediend. Toch kan het bijzonder praktisch zijn om niet steeds van toetsenbord naar muis te hoeven wisselen. Daarnaast zijn toetsencombinaties vaak sneller dan muisopdrachten waarvoor u eerst door een aantal menu’s moet klikken.
Algemene Windows-wenken Voor alle onderstaande toetsencombinaties geldt dat ze in veel verschillende Windows-programma’s werken. • Ctrl+F Opent een venster waarmee u kunt zoeken naar een woord of woordcombinatie in een lopende tekst. Is bijvoorbeeld te gebruiken in Word, maar ook in lange webpagina’s als u niet precies weet waar de door u gezochte woordcombinatie zich bevindt. • Ctrl+C Kopiëren. Als u met de muis een stuk tekst selecteert en vervolgens op Ctrl+C drukt, slaat Windows de geselecteerde tekst tijdelijk in het geheugen op. U kunt diezelfde tekst weer dupliceren met behulp van plakken. • Ctrl+V Plakt de met Ctrl+C gekopieerde tekst op de gewenste plek in bijvoorbeeld een document, de adresbalk van de browser of het invoerveld van een zoekmachine als Google. • Ctrl+P Drukt het huidige document, de huidige e-mail of webpagina af. • Alt+Tab en Alt+Shift+Tab Door de Alt-toets ingedrukt te houden en gelijktijdig een of meerdere malen de Tab-toets in te drukken, kunt u tussen meerdere programma’s schakelen zonder dat u daarvoor met de muis naar de programmabalk van Windows hoeft af te dalen. Dat is handig als u meerdere browservensters geopend hebt. Met Alt+Shift+Tab doet u hetzelfde, maar dan in omgekeerde richting. Waarschuwing: dit vergt enige oefening. • Alt+F4 Met deze toetsencombinatie sluit u het programma of het browservenster waarin u aan het werk bent.
12
Handboek – Internetresearch
Altijd nieuw venster Open potentieel interessante zoekresultaten altijd in een nieuw venster. Zo voorkomt u dat u al zoekende de draad kwijtraakt en niet meer kunt terugvinden welke resultaten de zoekmachine nog meer heeft opgeleverd.
Internet Explorer
1h012
• Ctrl+B Hiermee maakt u een bookmark oftewel een bladwijzer. Daarmee kunt u de site waarop u bent, later snel terugvinden in het menu Favorieten. • Ctrl+N Opent een nieuw venster. Tussen vensters schakelen doet u met de eerder besproken toetsen Alt+Tab en Alt+Shift+Tab. • Ctrl+T Vanaf Internet Explorer 7.0. Opent een nieuw tabblad. Tabbladen lijken op vensters, maar maken het werken overzichtelijker als u veel websites tegelijkertijd open hebt staan. • Ctrl+Tab en Ctrl+Shift+Tab Vanaf Internet Explorer 7.0. Met deze toetsen kunt u wisselen tussen de verschillende tabbladen, vergelijkbaar met de manier waarop u Alt+Tab en Alt+Shift+Tab gebruikt voor het schakelen tussen applicaties of vensters. • Ctrl+O Als u naar een nieuwe website wilt gaan, kunt u natuurlijk met de muis naar de adresbalk gaan. U kunt ook op Ctrl+O drukken en u die moeite besparen. Na Ctrl+O opent zich namelijk een venster waarin u het gewenste adres rechtstreeks kunt invoeren. • Ctrl+W Hiermee sluit u het huidige venster. • Shift+linkermuisknop Zoals elders in dit hoofdstuk aan de orde is geweest, verdient het aanbeveling tijdens het zoeken resultaten in een nieuw browservenster te openen. De ‘ouderwetse’ methode daarvoor binnen Internet Explorer bestaat uit het met de muisaanwijzer op de koppeling (hyperlink) te gaan staan die in een nieuw venster geopend moet worden, op de rechtermuisknop te drukken en vervolgens Openen in nieuw venster te selecteren. Veel simpeler is: op de koppeling klikken die in een nieuw venster geopend moet worden, maar nu tegelijkertijd de Shift-toets ingedrukt te houden. • Ctrl+linkermuisknop Vanaf Internet Explorer 7.0. Hiermee opent u een hyperlink in een nieuw tabblad. • Ctrl+E Vanaf Internet Explorer 7.0. Met deze toetsencombinatie gaat u rechtstreeks naar het zoekveld. • F5 Soms is er aanleiding om de website die u bekijkt opnieuw te laden, bijvoorbeeld omdat deze in eerste instantie onvolledig is binnengekomen, of omdat de site in de tussentijd kan zijn gewijzigd. Dat laatste wil bij nieuwssites nogal eens het geval zijn.
13
Hoofdstuk 1 – Basis van zoekstrategie
• F11 Laat de huidige webpagina in de zogeheten modus full screen zien, waarbij het hele scherm wordt gebruikt om de site te tonen, zonder ruimte. Dat kan handig zijn als u over een klein scherm beschikt of de site in kwestie nogal uit de kluiten is gewassen. Als u een tweede keer op F11 drukt, gaat u terug naar de normale situatie. • Backspace en Shift+Backspace Hiermee gaat u respectievelijk terug naar de vorige pagina die u hebt bezocht, en een pagina vooruit. Twee terug Sommige sites sluiten u op in een virtuele gevangenis. Op het moment dat u op de knop Vorige van uw browser klikt, wordt u vooruit gebonjourd naar de site waar u juist weg wilde. Dit komt omdat de voorgaande pagina een code bevat die uw computer onmiddellijk terugstuurt. De truc is dus om niet de voorgaande pagina, maar de pagina daarvoor te pakken te krijgen. Oftewel: doe twee stappen terug in plaats van één. Druk daartoe op het kleine pijltje naar beneden dat u rechts van de knop Vorige aantreft. U krijgt dan een lijst met alle voorgaande pagina’s te zien. Selecteer vervolgens de tweede pagina van boven.
Afbeelding 1.13 Het kleine pijltje naast de knop Vorige of Back laat een lijst zien van alle sites die u eerder hebt bezocht in het desbetreffende venster.
Firefox • • • • • •
14
F5 Zorgt ervoor dat de huidige pagina opnieuw wordt ingeladen. F11 Toont de website over het volledige scherm. Ctrl+B Maak een bookmark (bladwijzer) voor de huidige pagina. Ctrl+N Opent een nieuw venster Ctrl+W Venster of tabblad sluiten. Ctrl+T Nieuw tabblad, een manier om een extra venster te openen zonder dat onder in de Windows-taakbalk een nieuw pictogram verschijnt.
Handboek – Internetresearch
1h013
• Ctrl+L Een toets waardoor u rechtstreeks in de adresbalk een nieuwe site kunt invoeren. • Ctrl+E Biedt snelle toegang tot een zoekmachine. Zo kunt u bijvoorbeeld in zoekmachine Google een zoekopdracht opgeven zonder eerst naar www.google.nl te gaan. • Shift+linkermuisknop en Ctrl+linkermuisknop De combinatie Shift+linkermuisknop zorgt ervoor dat de gewenste koppeling in een nieuw venster wordt geopend. De combinatie Ctrl+Shift+linkermuisknop echter opent de koppeling in een nieuw tabblad, dus zonder nieuw pictogram onder in de Windows-taakbalk. • Ctrl+PageUp en Ctrl+PageDown Met deze toetsencombinaties snelt u makkelijk door de diverse tabbladen binnen Firefox. • Daarnaast kan Firefox worden uitgebreid met een speciaal programmatje, een zogeheten plug-in, waardoor u ook met de muis opdrachten kunt geven. Na het installeren van All-in-One Gestures (https://addons.mozilla.org/nl/firefox/addon/12) drukt u de rechtermuisknop in en maakt u vervolgens een beweging die correspondeert met een bepaalde computerhandeling. De belangrijkste muisopdrachten zijn: • Omhoog Hiermee opent u een nieuw tabblad. • Omlaag Hiermee opent u een nieuw venster. • Naar links Hiermee gaat u een pagina in uw browsergeschiedenis terug. Voor gevorderden: probeer ook eens (in hoog tempo) op de rechtermuisknop te klikken, deze ingedrukt te houden en vervolgens op de linkermuisknop te klikken. • Naar rechts Hiermee gaat u een pagina in uw browsergeschiedenis vooruit. Voor gevorderden: probeer ook eens (in hoog tempo) op de linkermuisknop te klikken, deze ingedrukt te houden en vervolgens op de rechtermuisknop te klikken. • Omlaag, naar rechts Met deze opdracht (een ‘L-figuur’) sluit u het huidige venster.
Afbeelding 1.14 Bij Firefox geldt net als bij Internet Explorer dat u met het kleine naar beneden gerichte pijltje een lijst opent van de sites die u eerder in het desbetreffende venster hebt bezocht.
15
Hoofdstuk 1 – Basis van zoekstrategie
Chrome • F5 Zorgt ervoor dat de huidige pagina opnieuw wordt ingeladen. • F11 Toont de website over het volledige scherm. • Ctrl+B Doet de balk met bookmarks (bladwijzers) verschijnen of verdwijnen. • Ctrl+D Bookmark de huidige pagina. • Ctrl+N Opent een nieuw venster • Ctrl+W Venster of tabblad sluiten. • Ctrl+T Nieuw tabblad, een manier om een extra venster te openen zonder dat onder in de Windows-taakbalk een nieuw pictogram verschijnt. • Ctrl+L Het adres in de vraagbalk wordt geselecteerd. Hierdoor kunt u rechtstreeks in de adresbalk een nieuwe site invoeren. • Ctrl+E Maakt het mogelijk om gelijk een zoekopdracht in te voeren. Het verschil met Ctrl+L is dat bij het gebruik van Ctrl+E een vraagteken in de adresbalk verschijnt. • Shift+linkermuisknop en Ctrl+linkermuisknop De combinatie Shift+linkermuisknop zorgt ervoor dat de gewenste koppeling in een nieuw venster wordt geopend. De combinatie Ctrl+linkermuisknop echter opent de koppeling in een nieuw tabblad, dus zonder nieuw pictogram onder in de Windows-taakbalk. • Ctrl+PageUp en Ctrl+PageDown Met deze toetsencombinaties schakelt u tussen de verschillende tabbladen.
Algemene zoekstrategie U weet aan welke eisen uw computer en software moeten voldoen, en u hebt geleerd waar de knoppen zitten die research makkelijker maken. In autotermen weet u thans waar de versnellingsbak en het gaspedaal zitten. Wat nog ontbreekt, is het autorijden zelf: hoe komt u van A naar B? Hoe u met uw computer bij de informatie komt die u zoekt, leert u in de overige hoofdstukken van dit boek. Voor nu is het belangrijk om de juiste ‘zithouding’ aan te leren: vanuit welke uitgangspositie begint u iedere zoektocht? Vuistregel bij iedere zoektocht Bekijk na het invoeren van een zoekvraag slechts de eerste twintig zoekresultaten en ga alleen verder als bij deze eerste twintig resultaten nuttige sites lijken te staan. Staat er daarentegen niets interessants bij de eerste twintig, dan deugt uw zoekvraag niet. Pas de vraag aan en begin opnieuw.
16
Handboek – Internetresearch
Drie gouden zoekregels 1 Definieer De allerbelangrijkste regel voor succesvol zoeken op internet is simpel: denk na! Het heeft geen zin om te zoeken als u niet weet wat u zoekt. U stapt ook niet in een auto zonder een bestemming in uw achterhoofd te hebben. Hoewel dit een open deur lijkt, wordt deze fout maar al te vaak gemaakt. Bedenk daarom eerst wat u wilt vinden. Pas dan heeft het nut om na te denken over hoe het te vinden zou kunnen zijn. 2 Specificeer Oftewel: zoek niet met omwegen uit angst iets te missen, maar ga recht op uw doel af. Niemand rijdt vanuit Den Helder naar Groningen via Maastricht. Het blijkt dat het gros van de zoekmachines opdrachten van slechts één tot drie woorden te verwerken krijgt. Dat is zonde, want een zoekmachine kan u beter helpen wanneer u duidelijk bent over wat u wilt. Bent u op zoek naar gegevens over de gebeurtenissen in Den Haag tijdens de Februaristaking in de Tweede Wereldoorlog, zoek dan ook op de termen “Den Haag”, “Februaristaking” en “Tweede Wereldoorlog”. Wie enkel zoekt op “Den Haag” en “Tweede Wereldoorlog” zal zo veel informatie te zien krijgen dat hij erin verzuipt, en juist daardoor veel informatie missen. Elders in dit boek zult u allerlei methoden leren om zo specifiek mogelijk te zoeken; voor nu gaat het alleen om de intentie. 3 Zoek in de omgeving Het nadeel van niet-specifiek zoeken is dat u vermoedelijk verdwaalt in de informatiebrij. Helaas kan ook specifiek zoeken soms voor problemen zorgen. Vergelijk het met een autorit naar een bioscoop in een stad die u niet kent. Als het vooraf opgezochte huisnummer net niet juist blijkt te zijn, is het verstandig om de omgeving te verkennen. Hetzelfde geldt voor internet. Een te specifieke zoekvraag moet in dat geval wat algemener worden opgesteld. Hou wel altijd de volgorde uit deze lijst aan: eerst specifiek zoeken, dan pas de zoekvraag algemener maken. U gaat per slot van rekening ook niet eerst doelloos door de buurt crossen en daarna pas op de plattegrond kijken die naast u ligt.
17
2
Zoekmachines en internetgidsen
Z
oekmachines en internetgidsen lijken op elkaar, maar vormen wezenlijk verschillende manieren om de enorme hoeveelheid informatie op internet te doorzoeken. Waar een zoekmachine grotendeels door computers wordt bijgehouden, heeft een internetgids een menselijke redactie. Dat heeft niet alleen invloed op het soort informatie dat beide bevatten, maar ook op de bediening en de toepassingsmogelijkheden. In dit hoofdstuk komen algemene kenmerken van beide soorten sites aan de orde. Ook wordt duidelijk wat goede zoekmachines en internetgidsen van hun malafide soortgenoten onderscheidt.
U leert in dit hoofdstuk:
Wat het verschil is tussen zoekmachines en internetgidsen. Hoe zoekmachines en internetgidsen gebruikt moeten worden. Aan welke criteria goede zoekmachines en internetgidsen voldoen.
Hoofdstuk 2 – Zoekmachines en internetgidsen
Wat zijn zoekmachines en internetgidsen Google, Ilse, Alltheweb, Yahoo!, Bing: voor de gemiddelde researcher lijken alle pagina’s waarmee hij of zij zoekt op elkaar. Een invoerveld biedt de mogelijkheid zoektermen in te voeren en de website reageert door in een grote kaartenbak met verschillende websites te kijken of er sites zijn die aan de gewenste criteria voldoen. Vervolgens krijgt de researcher een rijtje meer of minder relevante websites te zien. Toch zijn er grote verschillen tussen deze zoekhulpmiddelen. Grofweg volstaat de indeling in zoekmachines en internetgidsen. Daarbij zijn zoekmachines sites waarvan de kaartenbak is gevuld door een computer. Google (www.google.nl) is een goed voorbeeld van een zoekmachine. Internetgidsen maken voor het formuleren van hun antwoorden gebruik van een door een menselijke redactie bijgehouden lijst met internetsites. Een voorbeeld van zo’n internetgids is Yahoo! (directory.yahoo.com).
20
Afbeelding 2.1
De Nederlandse website van zoekmachine Google…
Afbeelding 2.2
…en de website van internetgids Yahoo!
Handboek – Internetresearch
2h002 2h001
Dit onderscheid is van groot belang bij de vraag van welk zoekhulpmiddel u bij een gegeven zoekvraag moet gebruikmaken. Een zoekmachine werkt rigide, zoals u van een computer mag verwachten. Om te kunnen reageren op zoektermen beschikt een zoekmachine vaak over een bijna letterlijke transcriptie van miljoenen of zelfs miljarden webpagina’s. Daardoor is zo’n site bij uitstek geschikt voor het zoeken naar feiten. Wilt u weten wat er op 6 maart 1972 in Detroit gebeurde, of welke voetballer in de recente nacompetitie goed scoorde tegen de Vroomshoopse Boys, dan is een zoekmachine bij uitstek behulpzaam.
Afbeelding 2.3 Niet alleen de voetbalkwaliteiten van de Vroomshoopse Boys doen zeer aan de ogen.
2h003 2vrooms
Voor meer generieke informatie is een internetgids nuttig. Omdat internetgidsen door mensen zijn gevuld, bevatten ze geen miljoenen of miljarden websites. Wat ze wel bevatten, is een op onderwerp gesorteerde verzameling websites. Vanwege de inmenging van een menselijke redactie bevat een goede internetgids weinig slechte websites: die worden simpelweg verworpen tijdens het selectieproces.
21
Hoofdstuk 2 – Zoekmachines en internetgidsen
Afbeelding 2.4
De internetgids van Ilse.
Wie even snel de belangrijkste drie websites over Nederlandse architectuur wil vinden, maar totaal niet thuis is in het onderwerp, kan zijn of haar zoektocht het best beginnen bij een internetgids. Om het verwarrend te maken, is het onderscheid tussen zoekmachines en internetgidsen soms nogal diffuus. De zoekmachine Ilse (www.ilse.nl) maakte voor het vullen van de kaartenbak lange tijd onder meer gebruik van de informatie van de internetgids Startpagina (www.pagina.nl). (In 2009 kwam de leiding over Ilse opnieuw in handen bij de oprichters, die aankondigden een nieuwe richting met de site in te willen slaan.) Startpagina is een vrijwilligersproject bestaande uit ruim zesduizend miniinternetgidsen (peildatum: juni 2010) over verschillende onderwerpen, variërend van het houden van bijen tot het onderhouden van auto’s. In ruil voor hun vrijwillige assistentie krijgen de medewerkers van Startpagina de helft van de advertentieopbrengsten die met hun pagina’s wordt gegenereerd. Hoewel Ilse dus een computer is, zou deze zonder de inbreng van tweebenige zoogdieren niet veel klaarspelen. (Met deze inbreng presteert Ilse overigens nog steeds niet briljant, maar daarover meer in hoofdstuk 4.) 2h004
22
Handboek – Internetresearch
Afbeelding 2.5 Startpagina, een site vol verwijzingen naar sites over diverse onderwerpen, fungeert als toeleverancier van informatie voor Ilse.
Daar komt nog bij dat sommige zoeksites zowel een zoekmachine als een internetgids bevatten. Zowel Google als Yahoo! behoren tot deze categorie. In hoofdstuk 4 en 5 worden de verschillende zoekmachines en internetgidsen afzonderlijk besproken, inclusief hun respectievelijke voor- en nadelen. In hoofdstuk 3 komt Google – als absolute, kwalitatieve marktleider – uitgebreid aan bod. In dit hoofdstuk ligt de nadruk op de algemene werking en bediening van zoekmachines en internetgidsen.
De werking van een zoekmachine Net zoals een automobilist een basaal begrip moet hebben van de principes achter gemotoriseerd vervoer, zo is het essentieel dat een goede researcher enig idee heeft van de werking van een zoekmachine. Wie niet weet wat wielen zijn of wat een motor doet, zal het contactsleuteltje niet durven omdraaien, en wie niet begrijpt waarom een zoekmachine juist die resultaten teruggeeft en geen andere, zal de moed voor internetresearch al snel opgeven. Een kanttekening vooraf is op zijn plaats: zoekmachines houden hun exacte werkwijze graag geheim. Wie precies snapt hoe een zoekmachine ertoe komt om bepaalde sites een hoge plaats in de zoekresultaten te geven, kan die kennis immers benutten om zijn eigen site te promoten. Hoe hoger de plek in de zoekresultaten, hoe meer bezoek immers.
23
Hoofdstuk 2 – Zoekmachines en internetgidsen
Spiders en crawlers Een zoekmachine baseert zijn antwoorden op zoekvragen op informatie uit een enorme gedigitaliseerde kaartenbak met websites. Maar die kaartenbak moet wel eerst zijn gemaakt en vervolgens worden bijgehouden. Dat is de taak van een zogeheten spider of crawler. Dit is een computerprogramma dat websites bezoekt en er digitale uittreksels van maakt, bestemd voor opslag in een kaartenbak. De locaties van de te bezoeken sites haalt de spider uit twee bronnen. Ten eerste biedt vrijwel iedere zoekmachine de mogelijkheid aan eigenaren van websites om hun site aan te melden voor opname in de zoekmachine. Ten tweede bevatten sites die door de crawler worden bezocht zelf veelal adressen van andere websites, bijvoorbeeld in de vorm van koppelingen.
Tekstanalyse en heuristiek Een spider baseert zich in eerste instantie op de letterlijke informatie op een site. Daarom is het via zoekmachines mogelijk naar een specifiek citaat te zoeken: een beetje crawler onthoudt de volledige tekst van een internetpagina. Vervolgens worden op deze tekst bewerkingen toegepast. Hoe vaker een bepaald woord wordt genoemd, hoe representatiever dat woord waarschijnlijk is voor de inhoud. Voorbeeld: twintig keer ‘Willem van Hanegem’ op een site geeft een sterkere indicatie dat de site de voormalige voetballer als onderwerp heeft, dan wanneer Van Hanegem maar eenmaal wordt genoemd. Met deze basale analyse komt een zoekmachine er niet. Wie halverwege de jaren negentig via een zoekmachine zocht naar medische informatie over menselijke voortplanting, kwam niet zelden terecht op een pornosite. De reden: websites, met name van het ranzige soort, namen massaal woordenlijsten op met populaire zoektermen, om zo meer bezoekers naar hun sites te lokken. Om dergelijke slimmeriken voor te zijn, maken zoekmachines tegenwoordig gebruik van zogeheten heuristische technieken: methoden om met behulp van logische analyse een idee te krijgen van de inhoud van een website. Een methode daarvoor is het kijken naar woordverbanden. Als op een site gerelateerde termen voorkomen als ‘voetbal’, ‘middenstip’ en ‘scheidsrechter’, zal de zoekmachine een seksueel getinte term of de naam van een automerk negeren. Verder zijn zoekmachines tegenwoordig in grote meerderheid ronduit wantrouwend tegenover pagina’s waarop een en dezelfde term tientallen malen wordt herhaald.
24
Handboek – Internetresearch
Metadata De naam zegt het al: metadata vormen informatie over informatie, ongeveer zoals boeken in een bibliotheek zijn ingedeeld op trefwoord. Metadata geven korte, beknopte informatie in de vorm van steekwoorden over de inhoud van de onderliggende webpagina. Zoekmachines gebruikten deze informatie vooral vroeger om een zoekvraag beter te koppelen aan de letterlijke tekst van een website. Voorbeeld: een site waarop wijlen prins Bernhard tien keer wordt genoemd én waarvan de metadata zeggen dat het hier inderdaad een site met biografische informatie over prins Bernhard gaat, zal daardoor hoger eindigen bij een zoekvraag naar prins Bernhard dan een site zonder of met andere metadata. Dat laatste is immers ook mogelijk: op een site over wijlen prinses Juliana wordt Bernhard ook regelmatig genoemd, zonder dat de site hem als onderwerp heeft. Omdat misbruik van metadata eenvoudig is, gebruiken steeds minder zoekmachines echter de hierin vervatte informatie. Of en wat voor metadata een site bevatten, is eenvoudig te zien. Ga hiervoor in Internet Explorer naar de eerste pagina van een site. Klik op de rechtermuisknop en selecteer Bron weergeven of View source. In Firefox is de procedure vrijwel hetzelfde, alleen moet hier via de rechtermuisknop View page source worden gekozen. Alternatief in Firefox is het gebruik van de toetsencombinatie Ctrl+U. Google heeft sommige vormen van metadata volledig afgezworen (voor de liefhebbers: het gaat dan om Meta name=”keywords”), maar er is geëxperimenteerd met zoekmachines die de mogelijkheid bieden enkel op metadata te zoeken. Het rendement van deze zoekmachines is zeer beperkt. Ga maar na: de eigenaar van de site bepaalt wat er in de metadata komt te staan. Dat biedt alle ruimte voor manipulatie. Metadata als enige bron voor een zoekmachine werkt dus louter als de machine zich beperkt tot een serie betrouwbare sites, waarvan de metadata gegarandeerd correct zijn.
Autoriteit Het klinkt zo logisch: een zoekmachine kijkt ook naar de autoriteit van een site om te bepalen hoe hoog een pagina moet eindigen in de zoekresultaten. Maar hoe weet een zoekmachine nu of een site belangrijk is? Een van de slimste methoden om dit te doen – en daarom in gebruik bij zoekmachine Google – is om te kijken naar de mening van andere internetgebruikers. Omdat een zoekmachine geautomatiseerd zijn werk doet en dus niet de internetgebruikers daadwerkelijk iets kan vragen, wordt een truc toe-
25
Hoofdstuk 2 – Zoekmachines en internetgidsen
gepast. De zoekmachine kijkt naar het aantal keren dat andere websites een koppeling hebben opgenomen naar de onderhavige site. Stel dat de zoekmachine in zijn digitale kaartenbak ziet dat in totaal tweehonderd websites een koppeling hebben opgenomen naar de website www.elsevier.nl en slechts honderd websites een koppeling bevatten naar www.wolters-kluwer.com, dan zal www.elsevier.nl hoger uit de bus komen dan www.wolters-kluwer.com als een zoekmachine gevraagd wordt naar ‘uitgever’ te zoeken. Een slimme zoekmachine als Google kijkt echter niet alleen naar het aantal inkomende links, maar ook naar de kwaliteit ervan. Zijn de tweehonderd sites die linken naar www.elsevier.nl allemaal volstrekt impopulaire en nauwelijks bijgehouden blogs, en de honderd sites die linken naar www.wolters-kluwer.com juist actuele, hoog gewaardeerde sites van prestigieuze universiteiten, dan is de kans groot dat de afweging van de zoekmachine alsnog in het voordeel van www.wolters-kluwer.com uitvalt. Hoe Google bepaalt of een linkende site belangrijk is? Simpel: door te kijken naar de sites die dáár weer naar linken – enzovoort. Wilt u meer details, leest u dan en.wikipedia.org/wiki/PageRank.
Afbeelding 2.6 Het PageRank-algoritme: de wijze waarop Google het belang van een pagina vaststelt. Eitje toch?
26
Handboek – Internetresearch
ir5-h2-1
Een andere manier om de mening van internetgebruikers mee te nemen in de beoordeling, is te kijken naar hun klikgedrag. Stel dat een zoekmachine op de zoekvraag ‘uitgever’ www.wolters-kluwer.com op de eerste plaats toont, en www.elsevier.nl op de tweede plek. Vervolgens blijkt echter dat de overgrote meerderheid van alle zoekers voor de nummer twee kiest. Een zoekmachine kan dan besluiten om www.elsevier.nl voortaan maar op de eerste plaats te zetten, omdat deze site blijkbaar beter voldoet aan de verwachtingen van zoekers.
Spamdexing Het is hiervoor even aan de orde gekomen: het kan lonen om zoekmachines te foppen. Sommige bedrijven specialiseren zich hier zelfs in. Tegen betaling beloven ze een site hoger te laten eindigen in de resultaten van bekende zoekmachines. Zo wist een slimme Nederlandse autohandelaar met behulp van de kennis onder het kopje ‘Autoriteit’ zijn eigen bedrijf als hoogste te laten eindigen voor wie via Google zocht naar een bekend automerk in Nederland. Hij had vele duizenden nepwebsites gecreëerd die allemaal een koppeling bevatten naar zijn eigen site. De straf van Google was niet mals: toen het bedrijf ontdekte dat het belazerd was, werd het desbetreffende bedrijf onmiddellijk onder in de zoekresultaten gezet. Bovendien paste Google de eigen spidersoftware aan. De truc werkt tegenwoordig niet meer. Moraal van het verhaal: bedrog loont niet, en wie zijn site wil promoten, doet er beter aan om de inhoud en bijbehorende metadata te verbeteren. Terzijde: mocht u geïnteresseerd zijn in het verbeteren van de score van de site, ook wel Search Engine Optimization genoemd, dan biedt www.seomoz.org/article/search-ranking-factors een aardig vertrekpunt.
Bediening van zoekmachines Iedere zoekmachine heeft een eigen gebruiksaanwijzing en eigen speciale opdrachten. Verderop komen met name de bijzondere eigenschappen van Google uitgebreid aan de orde. Maar er zijn ook overeenkomsten tussen zoekmachines. Deze worden hieronder toegelicht.
Booleaanse operatoren Booleaanse operatoren ontlenen hun naam aan de Britse wiskundige en filosoof George Boole (1815-1864), wiens werk ook nu nog wordt toegepast in moderne zoekmachines. Booleaanse operatoren, soms in het spraakgebruik foutief aangeduid als booleans, zijn logische opdrachten waarmee een zoekmachine kan worden verteld iets wel of juist niet te doen.
27
Hoofdstuk 2 – Zoekmachines en internetgidsen
Ze worden in hun oorspronkelijke vorm altijd in hoofdletters geschreven, al hebben sommige zoekmachines tegenwoordig andere manieren om booleaanse operatoren te gebruiken. In hoofdstuk 3 en 4 komen we daarop terug. De belangrijkste booleaanse operatoren zijn:
Afbeelding 2.7 George Boole bewijst dat wiskundigen wel degelijk een mannelijke kaaklijn kunnen hebben.
2h005
28
• AND AND vertelt een zoekmachine dat deze de woorden aan weerskanten van AND beide moet meenemen in een zoekvraag. De opdracht fiets AND fietsenmaker leidt dus tot pagina’s waarop zowel het woord fiets als fietsenmaker voorkomt. Goede zoekmachines, zoals Google, zoeken standaard met de booleaanse operator AND. • OR OR is vergelijkbaar met AND; de opdracht werkt op de woorden links en rechts van OR. Wie zoekt op chocola OR chocolade krijgt dus pagina’s waarop alleen chocola staat én pagina’s waarop alleen chocolade staat, maar ook pagina’s waarop beide termen voorkomen. OR is handig voor wie wil zoeken op verschillende spellingsvarianten van een woord of naam, en kan ook worden gebruikt om te zoeken naar de combinatie van een persoon en meerdere onderwerpen. Einstein relativity OR peace zoekt naar de beroemde geleerde in documenten die over vrede of relativiteit gaan. (Of over beide, maar het aantal pagina’s waarop Einstein in combinatie met beide onderwerpen wordt genoemd, is vermoedelijk nogal beperkt). Slechte zoekmachines zijn eraan te herkennen dat ze standaard met OR zoeken. De reden hiervoor is simpel: dit levert meer zoekresultaten op, zodat het lijkt alsof de zoekmachine groter is dan in werkelijkheid het geval is.
Handboek – Internetresearch
• NOT Een vaak onderschatte, maar uiterst nuttige booleaanse operator. NOT vertelt de zoekmachine dat het resultaat een bepaalde term absoluut niet mag bevatten. Hoewel het op het eerste gezicht nogal onzinnig lijkt om de zoekmachine te vertellen waarnaar deze niet moet zoeken, is NOT erg handig om zoekresultaten uit te dunnen. Wie zoekt naar de geleerde Krajicek, maar geen pagina’s over de voormalige Nederlandse tennisser wil krijgen, voegt aan zijn zoekvraag simpel NOT tennis toe. • NEAR Waar AND de zoekmachine vertelt dat twee termen beide op een pagina moeten voorkomen, is NEAR nog wat specifieker: de termen moeten dicht bij elkaar staan, meestal met maximaal twintig woorden tussenruimte. Dit is handig, want de zoekopdracht Wim NEAR Kok levert niet alleen pagina’s op waarop Wim Kok staat, maar ook alle wetenschappelijke publicaties van ‘Kok, Wim’. Helaas wordt NEAR tegenwoordig nauwelijks nog ondersteund. • Wildcards Ondergeschikt aan het belang van booleaanse operatoren, maar niettemin nuttig bij zoekmachines die ze ondersteunen, zijn wildcards, ook wel jokers geheten. Een wildcard is het symbool * en wordt gebruikt om een ontbrekend of variabel gedeelte van een zoekvraag op te vullen. Voorbeeld: “De * valt niet ver van de boom” zal resultaten opleveren met ieder willekeurig woord op de plek van de *. De wildcard is dus uitstekend geschikt om te gebruiken als u op zoek bent naar een exact citaat, maar niet meer precies weet hoe dit citaat ook alweer luidde. Sommige zoekmachines staan het ook toe om een wildcard in een woord te gebruiken. Voorbeeld: “Jans*en” levert zowel pagina’s op met de term ‘Jansen’ als ‘Janssen’. Waar het gebruik van dergelijke wildcards in 2004, bij het verschijnen van de eerste editie van dit boek, nog nut had, is Google anno 2010 zo slim geworden dat de machine in veel gevallen zelf zal zoeken op meerdere varianten van een woord. Dat heeft zo weer zijn eigen nadelen, want soms wilt u dat helemaal niet. Dwing in dat geval Google om bij de les te blijven door een plusteken vast te plakken aan de voorkant van de zoekterm. Voorbeeld: +Jansen.
29
Hoofdstuk 2 – Zoekmachines en internetgidsen
Bediening van internetgidsen Enkele bijzondere internetgidsen komen verderop in het boek uitgebreid aan de orde. Meer algemeen gelden voor het bedienen van internetgidsen de volgende wenken.
Rubrieksindeling Internetgidsen plaatsen hun lemma’s in een rubrieksindeling die is opgebouwd volgens een soort boomstructuur. Dit maakt het voor de redacteuren van de internetgids eenvoudiger om sites te classificeren. Een goed voorbeeld daarvan is te zien op www.dmoz.nl, een internetgids die door vrijwilligers wordt bijgehouden. Deze rubrieksindelingen vertonen onderling grote overeenkomsten en dus is het raadzaam om er goede studie van te maken bij een internetgids die u veel gebruikt. Die kennis komt ook bij andere zoekmachines weer van pas. In het algemeen loont het om voordat u een zoektocht via een internetgids begint, eerst te bedenken in welke rubriek een bepaalde gezochte site zich zou kunnen bevinden. Zoekt u naar de site van een ambassade van een buitenlandse mogendheid, dan kan het bijvoorbeeld zinvol zijn om te beginnen bij de rubriek Government (in het geval van http://dir.yahoo.com) of de rubriek Regionaal (een anglicisme waaronder Nederlandse internetgidsen buitenlandse sites plaatsen, zie bijvoorbeeld www.dmoz.nl).
Afbeelding 2.8
30
De internetgids DMOZ bestaat bij de gratie van vrijwilligers.
Handboek – Internetresearch
2h006 Zoekveld Hetzelfde invoerveld dat zo karakteristiek is bij veel zoekmachines ontbreekt tegenwoordig ook niet bij de meeste internetgidsen. Waarom is een raadsel dat qua onbegrijpelijkheid vergelijkbaar is met de Nederlandse gewoonte om op Koninginnedag de jeugd vuilnis op straat te laten verkopen. Het invoerveld ondergraaft de inherent logische rubrieksindeling van een internetgids volledig. Niet zelden leidt het gebruik ervan tot volkomen onzinnige resultaten. De site kan immers alleen een antwoord geven op basis van de beschrijvingen die de redacteuren aan de diverse opgenomen sites hebben gegeven. Deze beschrijvingen zijn bedoeld om door mensen begrepen te worden, niet om doorzoekbaar te zijn, met alle gevolgen van dien. Een gunstige uitzondering is de internetgids van Google op directory.google.com of directory.google.nl. Deze kan redelijk goed overweg met zoekvragen via het invoerveld. Desondanks is het jammer dat eigenaren van internetgidsen met het invoerveld hun bezoekers denken een plezier te doen, terwijl het resultaat van het gebruik ervan meestal louter afschrikt.
Kenmerken van goede zoekmachines en internetgidsen Verderop in dit boek komen, zoals gezegd, specifieke zoekmachines en internetgidsen aan de orde. Een volledige opsomming kan echter alleen al vanwege ruimtegebrek niet gegeven worden: er zijn immers honderden, zo niet duizenden zoekmachines en internetgidsen. Bovendien wordt hun aantal vrijwel dagelijks groter. Daarom treft u hieronder een lijst kenmerken aan waarmee u zelf kunt beoordelen of een specifieke zoekmachine of internetgids aan basiskwaliteitseisen voldoet.
Scheiding commercie en inhoud Zonder enige twijfel de belangrijkste toetssteen voor alle zoekmachines en internetgidsen. Wie via Google zoekt, zal regelmatig aan de rechterkant van het scherm een rij duidelijk als zodanig aangegeven advertenties zien. In zo’n geval is er niets aan de hand: het is niet meer dan logisch dat een zoekmachine of internetgids gemaakte kosten wil terugverdienen. U leest per slot van rekening ook nog steeds een krant ondanks de grote aantallen advertenties daarin. Het wordt gevaarlijk wanneer redactionele inhoud en commercie zich gaan vermengen. Dit vaststellen is overigens lang niet altijd even een-
31
Hoofdstuk 2 – Zoekmachines en internetgidsen
voudig. Een belangrijke indicatie is ironisch genoeg het ontbreken van advertenties. In dat geval zijn ze er waarschijnlijk wel, maar worden ze simpelweg niet als zodanig aangegeven, met als gevolg dat u zonder het te weten een commercieel en dus subjectief antwoord op een zoekvraag kunt krijgen. Oordeel overigens niet te snel: sommige licht anarchistische sites als www.dmoz.nl bevatten geen advertenties uit ideële motieven. In dat soort gevallen is op de site echter vrijwel altijd een toelichting te vinden over het redactionele beleid (zie ook de subparagraaf Transparantie).
Hulp Zelfs bij een plantenspuit zit meestal een gebruiksaanwijzing, dus die mag ook bij een internetgids of zoekmachine niet ontbreken. Is dat wel het geval, dan nemen de makers hun eigen site niet serieus, wat bij voorbaat ernstige twijfels oproept over de inhoud. Een Help-functie, veelal te herkennen aan (inderdaad) het woordje ‘Help’ ergens op de pagina, bevat (als het goed is) niet alleen tips voor beginners, maar is ook voor gevorderden vaak essentieel. Op de hulppagina’s behoren namelijk alle speciale functies van de desbetreffende site te worden beschreven en toegelicht. Een zoekmachine of internetgids zonder hulpfunctie is als een Formule 1-wagen op de handrem: het rijdt, maar met de hendel naar beneden gaat het net wat vlotter.
Transparantie Geeft de site duidelijkheid over wat er gebeurt met gegevens die de eigenaren via de zoekmachine of internetgids verzamelen, bijvoorbeeld in de vorm van een privacy statement? Is bekend hoe de site omgaat met adverteerders? Wordt duidelijk hoe de inhoud van de site tot stand komt en onder welke regels een eventuele redactie werkt? Is er een manier om in contact te komen met de makers? Bevat de site informatie over het bedrijf dat verantwoordelijk is voor de inhoud? Duidelijkheid over het hoe en waarom van een site is op internet geen pre, maar een voorwaarde. Waar rook is, is in dit geval niet zozeer vuur maar een enorme vlammenzee. En wilt u voor uw informatie afhankelijk zijn van een mogelijk dubieuze bron terwijl er keus genoeg is?
32
3
Google
H
oewel het de meest gebruikte zoekmachine ter wereld is, benutten veel researchers de mogelijkheden van Google onvoldoende. Feit is dat de kracht van Google die van alle zoekmachines overtreft. Dat wekt op zijn beurt zo veel wrevel op dat er geen week voorbij gaat of het einde van deze zoekmachine wordt voorspeld. Allemaal kinnesinne: wie met Google zoekt, hoeft zich er zeker niet toe te beperken, maar zonder Google kan geen researcher.
U leert in dit hoofdstuk:
De basismogelijkheden van Google gebruiken. Hoe de geavanceerde opties van Google werken. Welke diensten Google aanbiedt naast het reguliere zoekgedeelte.
Hoofdstuk 3 – Google
De basismogelijkheden van Google Google ziet er in eerste instantie uit als iedere andere zoekmachine en wellicht daarom wordt de kracht van Google vaak onderschat. Een andere reden is dat wie geen kennis heeft van de mogelijkheden van Google, die ook niet zal gebruiken. .com versus .nl Het verschil tussen www.google.nl en www.google.com zit verborgen in de taalinstellingen: bij een bezoek aan www.google.nl gaat de zoekmachine ervan uit dat u Nederlander bent en biedt deze bijvoorbeeld standaard de mogelijkheid om louter Nederlandse pagina’s als resultaat weer te geven. Ook als u die optie niet selecteert, zult u merken dat de ‘Nederlandse’ variant van Google een sterke voorkeur vertoont voor binnenlandse zoekresultaten. De site www.google.com bevat de standaardversie van Google. Google heeft zijn eigenaardigheden: soms zult u bij een bezoek aan www.google.com automatisch worden doorgestuurd naar www.google.nl. Hebt u daar geen behoefte aan, selecteer dan Google.com in English in het Google.nlscherm. Het gebruik van de Engelstalige Google is in veel gevallen aan te raden, al is het maar omdat nieuwe foefjes over het algemeen eerst in de internationale Google-variant worden geïntroduceerd. De belangrijkste fout die Google-gebruikers maken, is dat ze geen rekening houden met de grootte van Google. Die is enorm en wordt geschat op enkele tientallen miljarden pagina’s. Toch behandelen veel onervaren researchers Google nog altijd als een zoekmachine met een geheugen als een vergiet. Want hoe anders is het te verklaren dat veel gebruikers in het zoekvenster slechts één of twee woorden invullen, uit angst een resultaat te missen? Google versus andere zoekmachines Een belangrijk verschil tussen Google en andere zoekmachines is de hoeveelheid in de index opgenomen unieke pagina’s: die is groter dan waar ook. Hoewel andere zoekmachines hun waarde hebben als aanvulling, moet Google altijd het startpunt zijn. Een belangrijke stelregel bij het gebruik van Google – en iedere zoekmachine die deze naam waard is – luidt: maak het de zoekmachine zo lastig mogelijk. Het is zinvoller om zes zoekwoorden in te voeren en slechts 25 resultaten terug te krijgen, dan twee zoekwoorden in te vullen en er drie miljoen te zien.
34
Handboek – Internetresearch
Van die drie miljoen bekijkt u er hoogstens enkele tientallen, waardoor u net zo goed resultaten over het hoofd ziet, namelijk bijna drie miljoen pagina’s. Vergeet de illusie van volledigheid, die bestaat niet op internet (noch elders in het leven, maar dit is geen filosofieboek). Door Google precies te vertellen wat u wilt, behoudt u tenminste zelf de controle over wat u niet te zien krijgt.
Afbeelding 3.1 Over het algemeen is een gebrek aan zoekresultaten niet echt een probleem.
32 woorden Google kan maximaal 32 zoekwoorden tegelijk verwerken. Maak gebruik van die ruimte! Aan te veel zoekresultaten hebt u niets, die kunt u toch niet allemaal bekijken.
Afbeelding 3.2
3maxquery
Google kan maximaal 32 zoekwoorden tegelijk verwerken.
Er zijn grofweg twee manieren om te zoeken in Google: via het standaardvenster of via het venster Geavanceerd zoeken. Het standaardvenster is te vinden op www.google.nl (voor Google Nederland) of www.google.com (de internationale versie van Google); Geavanceerd zoeken benadert u door vanaf het hoofdvenster op Geavanceerd zoeken (Advanced Search) te klikken. Beide bieden dezelfde functionaliteit, maar het venster Geavanceerd zoeken is eenvoudiger te bedienen. Omdat bij ieder invoerveld in het ven-
35
Hoofdstuk 3 – Google
ster Geavanceerd zoeken een equivalent in het standaard Google-venster hoort, komen beide tegelijkertijd aan de orde. Het verdient overigens de voorkeur om van het venster Geavanceerd zoeken een zogeheten bookmark of bladwijzer te maken, zodat u deze pagina eenvoudig kunt terugvinden. Hoe dit moet, hebt u kunnen lezen in hoofdstuk 1.
Afbeelding 3.3 U bereikt het venster Geavanceerd zoeken door naar www.google.nl te gaan en in dit venster op Geavanceerd zoeken te klikken.
Afbeelding 3.4 Bij de internationale versie van Google op www.google.com heet Geavanceerd zoeken Advanced Search.
3advsearch 3h002
36
Boven in het venster Geavanceerd zoeken ziet u een blauw vak met daarin vier invoervelden. Dit bevat de basisfunctionaliteit van Google (oftewel de manier waarop Google gebruikmaakt van een aantal booleaanse operatoren; zie hoofdstuk 2). Deze regels worden in de volgende paragrafen besproken.
Handboek – Internetresearch
Afbeelding 3.5 Het venster Geavanceerd zoeken. In het bovenste veld bevinden zich de basisfuncties van Google.
3h003 Met alle woorden Dit veld doet precies hetzelfde als het standaardvenster van Google. Als u hier iets invult, krijgt u pagina’s terug waarop alle woorden voorkomen die u hebt ingevuld. In booleaanse-termen: Google gebruikt hier standaard AND. Wilt u bijvoorbeeld zoeken naar pagina’s die zowel over chimpansees als bonobo’s gaan, dan is dit het veld dat u moet hebben. Er is overigens een uitzondering op de regel dat Google standaard op alle ingevulde woorden zoekt. Sommige veelvoorkomende termen (de, het, een, and, the) worden door Google genegeerd. Zoek maar eens op Bert en Ernie: u zult merken
Afbeelding 3.6
Het zoeken naar Bert en Ernie zonder +…
37
Hoofdstuk 3 – Google
Afbeelding 3.7
…en met +.
dat er ook zoekresultaten bijstaan waarbij het woordje ‘en’ niet op de pagina voorkomt, zoals Engelstalige pagina’s. U zult het wellicht niet vaak gebruiken, maar in dergelijke gevallen kunt u Google dwingen toch te zoeken op het desbetreffende woord door er aan de voorkant een + aan vast te plakken (zonder spatie tussen de + en het door Google genegeerde woord). In het geval van Bert en Ernie moet u dan Bert +en Ernie invoeren. Vergelijk het aantal treffers: in het laatste geval krijgt u er minder. 3h005 3h004 Met de exacte woordcombinatie Het gebruik van met alle woorden heeft een groot nadeel. Wie zoekt naar Wim Kok, krijgt behalve sites over de voormalige regeringsleider ook sites terug waarop zowel Wim de Bruijn als uitgeverij Kok uit Kampen worden genoemd. Met alle woorden garandeert dat de ingevulde woorden op de pagina voorkomen, maar zegt niets over de plek van die woorden. Door gebruik te maken van het invoerveld met de exacte woordcombinatie kunt u eventueel leed afwenden. Wie op deze plek Wim Kok typt, zal alleen pagina’s terugzien waarin deze twee woorden in deze exacte volgorde voorkomen. Dit is niet alleen handig voor persoonsnamen, maar ook bijvoorbeeld voor het achterhalen van de context van citaten of zinnen uit boeken.
38
Handboek – Internetresearch
U kunt ook in het standaardvenster van Google deze zoektechniek gebruiken. Zet daartoe de zoekterm tussen aanhalingstekens, dus: ”Wim Kok”.
Afbeelding 3.8
Dit levert hetzelfde resultaat op als…
Afbeelding 3.9
…dit.
Punt! Door in plaats van spaties punten te typen, kunt u Google vertellen dat de zoekmachine moet zoeken op de exacte woordcombinatie. Voorbeeld: Wim.Kok geeft hetzelfde resultaat als “Wim Kok”.
Met een van deze woorden ‘Beroerde’ zoekmachines als Ilse zoeken standaard op deze manier, waarbij alle pagina’s worden getoond waarop een of meer van de woorden voorkomen die u invult. Het gevolg is dat wie op Vrij Nederland zoekt, alle pagina’s krijgt waarop of het woordje Vrij, of het woordje Nederland of de combinatie voorkomt. Dat levert dus veel meer resultaten op dan zoeken via met alle woorden of met de exacte woordcombinatie.
39
Hoofdstuk 3 – Google
3h011 3h010
40
Afbeelding 3.10
Deze zoekopdracht…
Afbeelding 3.11
…levert slechts weinig resultaten op.
Toch heeft deze optie nut. Stel dat u moet zoeken naar informatie over de primatoloog Frans de Waal. Meer specifiek: u wilt weten wat hij over de apensoorten chimpansees en bonobo’s heeft gezegd. In dat geval vult u bij met de exacte woordcombinatie natuurlijk Frans de Waal in. Maar daar kunt u chimpansees en bonobo’s niet achter plaatsen: Google zou dan zoeken naar pagina’s waarop de tekst “Frans de Waal chimpansees bonobo’s” voorkomt. Deze twee termen zet u dus neer bij met een van deze woorden. Het voordeel daarvan is dat u pagina’s terugkrijgt waarop slechts één van beide apensoorten hoeft voor te komen. Had u chimpansees en bonobo’s in het eerste invoerveld geplaatst, dan had u alleen pagina’s gezien waarop Frans de Waal in combinatie met beide diersoorten wordt genoemd. U zult zien dat Google het woordje OR plaatst tussen de woorden die u bij met een van deze woorden hebt ingevuld. OR is de gelijknamige booleaanse operator uit hoofdstuk 2.
Handboek – Internetresearch
Afbeelding 3.12
Terwijl het gebruikmaken van de optie met een van deze
woorden…
Afbeelding 3.13
3h009 3h008
…de hoeveelheid nuttige pagina’s drastisch uitbreidt.
Wilt u Google laten kiezen uit meerdere woordcombinaties, dan kan dat ook. Gebruik hiervoor aanhalingstekens om de verschillende woordgroepen van elkaar te scheiden. Wilt u pagina’s waarop de Ford Sierra of de Volkswagen Golf voorkomen, dan vult u dus “Ford Sierra” “Volkswagen Golf” in. Google zal automatisch het OR-commando toevoegen tussen beide woordcombinaties. U kunt natuurlijk ook via de gewone Google-zoekpagina uw opdracht invoeren. Wel moet u dan handmatig de OR-opdracht toevoegen. De zoekopdracht wordt dan “Ford Sierra” OR “Volkswagen Golf”.
41
Hoofdstuk 3 – Google
Afbeelding 3.14 Bij de Engelstalige variant van Geavanceerd zoeken laat Google onmiddellijk zien waar de aanhalingstekens en de OR-opdracht moeten staan.
Afbeelding 3.15 U kunt aanhalingstekens gebruiken om woordgroepen aan te geven op de regel Met een van deze woorden…
Afbeelding 3.16 …Google zal automatisch op de juiste plek het ORcommando toevoegen.
42
Handboek – Internetresearch
Afbeelding 3.17 Uiteraard is het ook mogelijk om het zoekcommando OR handmatig toe te voegen via het gewone Google-zoekscherm.
Spreid uw kansen Op zoek naar een persoon maar u weet de exacte spelling van zijn of haar naam niet? Zoek dan vanaf het standaard Google-venster volgens de notatie “Eerste mogelijke spelling van naam” OR “Tweede mogelijke spelling van naam”. Als u Henk Jansen moet hebben, maar u twijfelt over het aantal s’en in zijn achternaam, wordt de zoekopdracht dus “Henk Jansen” OR “Henk Janssen”. Gebruikt u het scherm Geavanceerd zoeken, typ dan “Henk Jansen” “Henk Janssen” in het invoervak met een van deze woorden. De Engelstalige versie van Geavanceerd zoeken (Advanced Search) biedt bij one or more of these words wel drie aparte velden waarvan u er in dit geval twee kunt gebruiken om de naam van Henk Jans(s)en in te voeren.
Zonder de woorden Dit lijkt een eigenaardig invoervak. Waarom zou u immers op iets niet willen zoeken? Toch is dit invulveld, het equivalent van de booleaanse operator NOT uit hoofdstuk 2, erg nuttig. Het maakt het mogelijk om snel te schiften in grote hoeveelheden informatie. Stel dat u op zoek bent naar informatie over de wiskundige Krajicek, dan loopt u een behoorlijke kans veel sites over de gelijknamige tennisser voor uw neus te krijgen. Door bij zonder de woorden tennis en Richard te typen, reduceert u die kans behoorlijk. Perfect werkt deze methode natuurlijk niet. Een site waarop Richard Krajicek enkel wordt genoemd als ‘Wimbledon-winnaar Krajicek’, wordt op deze manier niet weggefilterd. De functionaliteit zonder de woorden is ook via het standaardvenster van Google te gebruiken. Daartoe koppelt u een minteken aan het woord waarvan u niet wilt dat het in de zoekresultaten voorkomt. In het geval van Krajicek wordt de opdracht dan Krajicek -tennis -Richard. De min moet zonder spatie aan het te negeren woord voorafgaan.
43
Hoofdstuk 3 – Google
Het moge overigens duidelijk zijn dat zonder deze woorden nooit alleen mag worden gebruikt, maar altijd in combinatie met ten minste één ander invoerveld. U moet Google immers altijd iets geven waarnaar hij wél kan zoeken. Anders valt er ook niets uit te filteren.
Afbeelding 3.18
U zoekt op Krajicek…
Afbeelding 3.19 …en krijgt allemaal pagina’s over de bekende tennissers Michaëlla en Richard Krajicek.
44
Afbeelding 3.20
Door het veld zonder de woorden in te schakelen…
Afbeelding 3.21
…reduceert u het aantal pagina’s over tennis dramatisch.
Handboek – Internetresearch
Google Dance U krijgt op de ene computer andere zoekresultaten via Google dan een collega of kennis met dezelfde opdracht? Dan bent u slachtoffer geworden van de zogeheten Google Dance. Google bestaat uit meerdere computers die verschillende zoekresultaten kunnen geven op dezelfde vraag. Vermoedelijk test Google op deze manier nieuwe toevoegingen aan haar dienst. Op www.seochat.com/googledance is te zien hoe de Google Dance in zijn werk gaat.
Afbeelding 3.22 Google Dance zet de resultaten van de ‘verschillende persoonlijkheden’ van Google naast elkaar.
3h020 Op datum zoeken Last van te veel oude pagina’s bij het zoeken? Google kent de mogelijkheid om de zoekresultaten te beperken tot die van de laatste drie maanden, zes maanden of het laatste jaar. In de praktijk werkt deze functie niet altijd even goed, hoewel ze de laatste jaren steeds beter is gaan functioneren. Toch proberen veel sites nog steeds Google voor de gek te houden door net te doen alsof pagina’s veel nieuwer zijn dan ze zijn. Zo denken deze sites meer bezoek te genereren, omdat internetgebruikers en zoekmachines grosso modo een voorkeur hebben voor actuele pagina’s. Een alternatief is daarom om bij met een van deze woorden een aantal recente jaartallen in te vullen, in de hoop dat dit jaartal in de tekst van de pagina’s voorkomt die u zoekt. U kunt natuurlijk ook slechts één jaartal gebruiken, maar dan loopt u de kans wel erg weinig resultaten terug te krijgen. Een honderd procent efficiënte methode om op datum te zoeken, bestaat helaas niet.
45
Hoofdstuk 3 – Google
Afbeelding 3.23 Google biedt een mogelijkheid om te zoeken naar recente documenten. Deze levert echter sterk wisselende resultaten op.
Afbeelding 3.24 Een alternatief is om te zoeken naar een aantal jaartallen, waarvan er ten minste eentje in de tekst van de gezochte documenten moet voorkomen. Hiervoor gebruikt u de functie met een van deze woorden.
Afbeelding 3.25
betere resultaten.
46
In de praktijk leidt het zoeken op jaartallen soms tot
Handboek – Internetresearch
Speciale functies van Google Google bezit een aantal meer geavanceerde mogelijkheden. Sommige daarvan zijn uniek voor Google, andere niet, maar allemaal zijn ze bijzonder nuttig.
Een site doorzoeken Niet alle sites hebben een eigen zoekfunctie en als ze er wel over beschikken, dan is de kwaliteit vaak matig. Google schiet gelukkig te hulp, en wel met een functie die het mogelijk maakt om alleen zoekresultaten te retourneren die zich op een bepaalde website bevinden. Dat kan handig zijn als u bijvoorbeeld alle pagina’s wilt hebben op www.amsterdam.nl die het woord ‘begroting’ bevatten. Er zijn twee manieren om deze functie te gebruiken. U kunt naar het venster Geavanceerd zoeken gaan en daar in het veld Domein de website invullen waartoe u wilt dat Google zich beperkt. Voer hier alleen de laatste twee gedeelten van het siteadres in. Dus niet: www.amsterdam.nl, maar amsterdam.nl.
Afbeelding 3.26 Bij het invoerveld Domein typt u de naam van de website, zonder voorvoegsels als www. In dit geval typt u bij domein amsterdam.nl en bij zoek resultaten met alle woorden de term begroting, om te zoeken naar documenten binnen de site van de gemeente Amsterdam die deze term bevatten.
site: Wilt u alle pagina’s zien die Google van een bepaalde website in de aanbieding heeft? Zoek dan alleen op site:naamvansite.nl en klik op De zoekbewerking herhalen met de weggelaten resultaten als deze tekst onder in de Google-resultaten verschijnt. De tweede manier is om in het standaardscherm van Google de opdracht site: te gebruiken. Aan site: koppelt u vervolgens de naam van de website waarbinnen u wilt zoeken. Net als bij de eerste methode laat u het eerste gedeelte van het siteadres weg. Zoeken binnen www.amsterdam.nl doet u dus met de opdracht site:amsterdam.nl.
47
Hoofdstuk 3 – Google
Afbeelding 3.27 Met de opdracht site: kunt u binnen een bepaald domein zoeken zonder naar het venster Geavanceerd zoeken te hoeven gaan.
Landen doorzoeken U kunt de opdracht site: ook gebruiken om binnen een bepaald land te zoeken. Dat doet u door site: te combineren met de landcodes in appendix B, achter in dit boek. Voor Nederland is de internetlandcode .nl. Zoeken binnen Nederlandse sites doet u dus door site:.nl in te voeren, of bij het invoerveld Domein in het venster Geavanceerd zoeken .nl te typen. Het is van belang dat er een punt staat voor de landcode.
Afbeelding 3.28 Door de opdracht site: te koppelen aan een van de landcodes uit appendix B, beperkt u de zoekresultaten tot websites die geregistreerd staan in dat land.
48
Handboek – Internetresearch
3h026
Een kanttekening: met deze functie doorzoekt u uiteraard alleen door Google bekeken pagina’s. Dit zijn niet per se alle pagina’s die een site bevat: geen zoekmachine op internet is immers compleet.
Verdwenen documenten terughalen Vroeger – we praten nu over lang geleden, zo rond 1998 – kwam het regelmatig voor: de zoekmachine liet een veelbelovend resultaat zien, u klikte erop en het resultaat was een melding in de trant van ‘Page not found’ of ‘Error 404’. Ook met Google kan dat gebeuren, maar nodig is het niet. Google beschikt namelijk over een bijzondere eigenschap. Op het moment dat deze zoekmachine een site bezoekt, maakt Google gelijk een kopie voor zichzelf. Het goede nieuws: die kopieën zijn op te vragen. Op het moment dat u via Google op een pagina terechtkomt die niet meer bestaat, kunt u terugvallen op deze veiligheidskopie. De veiligheidskopie benadert u door in het venster met zoekresultaten op de tekst In cache of Cached te klikken. Deze woorden vindt u op de onderste regel van een zoekresultaat, na de groene tekst. Een waarschuwing: deze cacheversie of veiligheidskopie is niet altijd even actueel. Het is immers de kopie die Google maakte bij het laatste bezoek aan de desbetreffende site. Dat kan alweer even geleden zijn. Houd er dus rekening mee dat de informatie die u op deze manier verkrijgt, verouderd kan zijn. Laat Google arceren Een bijkomend voordeel van het gebruik van de cachefunctie is dat Google de gebruikte zoekwoorden in de tekst van de doelpagina arceert. Dat kan handig zijn om snel de gezochte termen in een lange tekst terug te vinden. Overigens kunt u ook de toetsencombinatie Ctrl+F gebruiken om binnen een pagina te zoeken. U kunt de cachefunctie ook gebruiken om informatie te lezen die websitebeheerders liever voor zichzelf houden. Om zo hoog mogelijk in de zoekresultaten te eindigen, geven sommige site-eigenaren Google ongehinderd toegang tot alle informatie op de site, zich niet realiserend dat Google meteen een kopie maakt. Als u om een wachtwoord wordt gevraagd bij het klikken op een zoekresultaat of u wordt verplicht om u te registreren voor toegang tot een site, dan kunt u dat soms omzeilen door terug te gaan naar het venster met zoekresultaten en daar op In cache te klikken.
49
Hoofdstuk 3 – Google
Websitebeheerders zijn uiteraard ook niet op hun achterhoofd gevallen en nemen steeds vaker tegenmaatregelen. Zo zijn veel Amerikaanse kranten, wiens archieven vaak gratis waren in te zien door gebruik van In cache, ertoe overgegaan om gedeelten van hun sites af te schermen van Googles cachefunctie. Het resultaat daarvan is dat niet bij alle zoekresultaten de woorden In cache staan. In dat geval kunt u altijd nog proberen om een passend wachtwoord te vinden op de site www.bugmenot.com.
Afbeelding 3.29 De cachefunctie is nuttig om verdwenen pagina’s terug te vinden, maar ook om toegang te krijgen tot pagina’s waarvoor u normaal gesproken geregistreerd moet zijn.
3h029 Zoeken op documenttype Vrijwel alle zoektochten op internet eindigen op een zogeheten HTMLpagina: een internetpagina die is geschreven in de opmaaktaal HTML, een afkorting die staat voor HyperText Markup Language. Op internet zwerven echter veel meer soorten documenten. Een aantal daarvan wordt door Google herkend en in de zoekindex opgenomen. Dat zijn: • Adobe Acrobat PDF Een afkorting voor Portable Document Format: in dit soort documenten staan opgemaakte teksten inclusief eventueel fotoen illustratiemateriaal. Documenten in PDF zien er altijd hetzelfde uit, ongeacht de computer waarop ze worden bekeken. • Adobe PostScript Populair onder vormgevers voor het opslaan van opgemaakte pagina’s. Niet interessant voor het gros der researchers. • Autodesk DWF Ontwerpers slaan tekeningen van hun bouwsels soms op in DWF-bestanden. U hebt een speciaal programma nodig om deze DWF-bestanden te kunnen bekijken: www.autodesk.com/ designreview-download.
50
Handboek – Internetresearch
• Google Earth KML Verderop in dit hoofdstuk komt het programma Google Earth aan de orde, waarmee u satellietbeelden op uw computer kunt bekijken. KML-bestanden werken samen met Google Earth, bijvoorbeeld om u snel naar een bepaalde, interessante locatie te leiden. • Google Earth KMZ Feitelijk hetzelfde als KML-bestanden, met dit verschil dat KMZ-bestanden gecomprimeerd zijn. Oftewel: de inhoud van de bestanden is op een ingewikkelde manier kleiner gemaakt. • Microsoft Excel Financiële informatie staat vaak in Excel-bestanden. Excel is een zogeheten spreadsheetprogramma, bedoeld om grote hoeveelheden cijfers te ver- en bewerken. Het Microsoft-programma Excel wordt verder gebruikt om informatie op te slaan die baat heeft bij een gestructureerde indeling, zoals tabellen met adresgegevens. • Microsoft PowerPoint Populair bij iedereen die regelmatig presentaties geeft en berucht bij wie ze moet bijwonen: in PowerPoint kunnen sheets worden opgeslagen voor gebruik bij lezingen, presentaties en (saaie) partijen. Computerexpert Clifford Stoll zei over PowerPoint: “It’s a perfect way of delivering a terrible talk” (zie verder www.zachtei.nl/ presentatie.ppt). • Microsoft Word Het bekende formaat waarin Microsoft Word tekstbestanden opslaat. • Rich Text Format De armeluivariant van Microsoft Word, met minder mogelijkheden dan zijn grote broer. Het bij Windows geleverde Wordpad slaat documenten op in dit formaat. • Shockwave Flash Voor animaties wordt op internet vaak het Flashbestandsformaat gebruikt.
Afbeelding 3.30 Klikken op Elk formaat of op het zwarte pijltje ernaast toont de verschillende documentformaten waarbinnen Google kan zoeken.
3h030
Met Google is het mogelijk om specifiek op een van deze documentsoorten te zoeken. Ga daartoe naar het venster Geavanceerd zoeken en klik bij de regel Bestandsformaat op Elk formaat. (Klikken op het kleine zwarte pijltje rechts daarvan levert hetzelfde resultaat op.) Er wordt een keuzelijst weer-
51
Hoofdstuk 3 – Google
gegeven met de hiervoor genoemde bestandsformaten. Door een van de opties te combineren met zoekwoorden, geeft u Google opdracht alleen binnen bepaalde documentsoorten te zoeken. Gebruik van deze mogelijkheid heeft vooral zin voor: • Adobe Acrobat PDF Veel overheden, bedrijven en non-profitorganisaties publiceren hun rapporten of andere belangrijke documenten in PDFformaat. Het maken van PDF-bestanden vereist speciale software en enige kennis van zaken: een particulier zal niet snel PDF-documenten publiceren. Bent u dus op zoek naar serieuze of officiële informatie, dan kunt u door alleen op PDF-documenten te zoeken, het aantal zoekresultaten drastisch beperken. Voorbeeld: als u op zoek bent naar documenten over het broeikaseffect, vermijdt u heel veel sites met minder serieuze informatie door alleen op PDF-documenten te zoeken. • Google Earth KML Typ een onderwerp (bijvoorbeeld: Space Shuttle) of plaatsnaam (bijvoorbeeld: Wierden) en zoek op dit bestandsformaat. In veel gevallen zult u informatie tegenkomen, waarvan u niet had kunnen vermoeden dat ze op internet stond. • Microsoft Excel Oftewel: XLS- en XLSX-bestanden. Begrotingen, adreslijsten, financiële gegevens: vaak staan ze in Excel-bestanden. Zoeken naar dit soort bestanden kan soms tot zeer interessante vondsten leiden, zeker als u deze mogelijkheid combineert met andere Google-opties (zie: Verborgen documenten vinden op pagina 54). • Microsoft PowerPoint Een minder ethische tip, maar wel een nuttige. Als u ooit een presentatie moet houden over een willekeurig onderwerp, biedt deze zoekoptie de mogelijkheid om ‘inspiratie’ op te doen. PowerPoint-bestanden heten ook wel PPT- en PPTX-bestanden. • Microsoft Word Bevat vaak saaie informatie, maar minder zorgvuldige organisaties willen nog wel eens interessante, interne Word-documenten op hun site laten slingeren (zie: Verborgen documenten vinden, even verderop). Staan ook bekend als DOC- en DOCX-bestanden.
52
Handboek – Internetresearch
Waar is de cacheversie? Het valt u wellicht op dat u bij het zoeken op specifieke documenttypen de mededeling In cache niet te zien krijgt. In plaats daarvan ziet u op de tweede regel van ieder zoekresultaat de tekst HTMLversie. Dit is het equivalent van In cache. Het opvragen van de HTML-versie is handig omdat programma’s die nodig zijn voor het bekijken van PDF-, Excel-, PowerPoint- of Word-bestanden dan niet geladen hoeven te worden. Bovendien zijn de HTML-versies vaak kleiner dan de originele documenten, wat resulteert in een kortere downloadtijd. Uitzondering: bij PDF-bestanden kunt u ook de optie Snelle weergave tegenkomen.
Afbeelding 3.31 HTML-versie betekent hetzelfde als In cache: u benadert hiermee de kopie die Google van een document heeft bewaard.
Afbeelding 3.32 Bij PDF-bestanden kunt u zowel de optie HTML-versie als Snelle weergave verwachten. Het verschil: de optie Snelle weergave probeert de layout van het PDF-bestand te tonen. Ironisch genoeg is Snelle weergave daardoor langzamer dan de optie HTML-versie. Dit merkt u vooral via mobiele verbindingen. Mocht u toevallig klant zijn bij T-Mobile, dan wensen we u extra veel sterkte.
53
Hoofdstuk 3 – Google
Afbeelding 3.33 Klikt u op Snelle weergave, dan kunt u vervolgens doorklikken naar Gewone HTML voor de (inderdaad) HTML-versie zonder layout. Tip: u kunt zowel in Snelle weergave als in Gewone HTML in het bestand zoeken met behulp van de toetscombinatie Ctrl+F.
ir5-h3-2 ir5-h3-1 3h031
U hoeft het venster Geavanceerd zoeken niet te gebruiken om op bestandstype te zoeken. U kunt ook gebruikmaken van de opdracht filetype:, gecombineerd met de zogeheten extensie, de letters waarop bestanden van het desbetreffende type altijd eindigen. Dat levert de volgende opdrachten op: • • • • • • • • • •
Adobe Acrobat PDF filetype:pdf Adobe PostScript filetype:ps Autodesk DWF filetype:dwf Google Earth KML filetype:kml Google Earth KMZ filetype:kmz Microsoft Excel filetype:xls Microsoft PowerPoint filetype:ppt Microsoft Word filetype:doc Rich Text Format filetype:rtf Shockwave Flash filetype:swf
Verborgen documenten vinden, ofwel: het combineren van de voorgaandedrie zoekopdrachten U weet nu hoe u moet zoeken binnen een site, u weet dat er meer op internet te vinden is dan louter HTML-bestanden en u weet dat Google kopieën maakt van alles wat het tegenkomt. Als u deze drie mogelijkheden combineert, hebt u een krachtig gereedschap in handen om een site door te pluizen op bestanden die een minder oplettende websitebeheerder daar ooit heeft laten slingeren.
54
Handboek – Internetresearch
Google is genadeloos. De zoekmachine probeert alles wat deze tegenkomt in de zoekindex op te nemen. Soms kan dat websites noodlottig worden. Want sommige bedrijven en organisaties vergeten dat ze documenten, zoals Excelbestanden met begrotingen of PDF-bestanden met nog niet openbare rapporten, op dezelfde computer hebben staan waarop de eigen website draait. Vertrouwelijke informatie Veel website-eigenaren zijn slordig met wat ze op hun site laten slingeren. Het kan dus lonen om via Google te kijken of er wellicht vertrouwelijke of anderszins interessante informatie terug te vinden is. Als u zoekt naar informatie die vertrouwelijk is, geldt bijna per definitie dat u niets tot zeer weinig weet over de inhoud. U kunt dus niet zoeken op basis van zoektermen. Toch zijn dergelijke documenten soms terug te vinden via Google, en wel met de volgende methode. De auteur van dit boek past die standaard toe op iedere organisatie of bedrijf waarmee hij te maken krijgt. De kans op succes is weliswaar niet groot, maar de tijdsinspanning is minimaal en het potentiële resultaat bijzonder aanlokkelijk, zoals hieronder zal blijken. De methode bestaat uit vier eenvoudige stappen. 1 Beslis wat het doel is U hebt te maken met de Universiteit van Amsterdam? Zoek dan uit wat de website is van deze organisatie. In dit geval is dat www.uva.nl. U hebt geleerd dat u binnen een site kunt zoeken door bij Domein de naam van de site in te vullen. Doe dat nu en typ in het desbetreffende veld uva.nl. 2 Doorzoek de site op XLS- en XLSX-bestanden Reden: zoals hiervoor vermeld, bevatten XLS- en XLSX-bestanden vaak nuttige informatie, zoals adresgegevens of begrotingen. Door enkel op domein en bestandstype te zoeken, dwingt u Google alle XLS- en XLSX-bestanden te tonen die de zoekmachine op die site heeft aangetroffen. 3 Doorzoek de site op PDF-bestanden Hetzelfde principe als bij punt 2. 4 Doorzoek de site op Word-bestanden Uiteraard kunt u deze methode ook gebruiken voor andere bestandstypen, zoals PostScript-bestanden. Verhoudingsgewijs treft u hier echter minder vaak interessante informatie aan.
55
Hoofdstuk 3 – Google
Wanneer we stap 1 en 2 toepassen op de site uva.nl krijgen we het volgende resultaat:
Afbeelding 3.34 De resultaten van een zoektocht naar Microsoft Excelbestanden binnen het domein van de Universiteit van Amsterdam.
invoeg
U ziet nu verschillende XLS-bestanden. Diverse daarvan bevatten adreslijsten. Zo zal het u opvallen dat een gebruiker van de uva.nl-webserver allerlei adreslijsten lijkt te verzamelen van organisaties die de belangen van diverse groepen nieuwe Nederlanders behartigen. Als u met dit stappenplan te veel resultaten krijgt, kunt u natuurlijk gerichter gaan zoeken. Wie wil schrijven over een organisatie en benieuwd is naar financiële gegevens, kan simpelweg begroting invullen bij met alle woorden, en bij Bestandsformaat Microsoft XLS-bestanden selecteren, aangevuld met de naam van de site bij het invoerveld Domein. Probeert u maar eens de website van de gemeente Amsterdam (www.amsterdam.nl) te doorzoeken, eerst alleen op XLS-bestanden in combinatie met amsterdam.nl bij Domein. Dat leidt tot erg veel resultaten. Typ nu begroting bij met alle woorden en u zult zien dat het aantal resultaten fors terugloopt.
56
Handboek – Internetresearch
Afbeelding 3.35 In één keer uw adressenbestand uitgebreid dankzij Google. Tip: gebruik de optie HTML-versie om bestanden sneller te laden als u ze voor het eerst bekijkt. Als u bestanden wilt bewaren, kunt u beter wel voor de originele versie kiezen (deze afbeelding kan verouderd zijn op het moment dat u dit boek leest).
3fig30_03
Afhankelijk van het onderwerp waarnaar u regelmatig research doet, kunt u deze opdrachten gebruiken om documenten te vinden die voor u interessant zijn. Nog een voorbeeld: u wilt het telefoonnummer hebben van een bepaald Tweede Kamerlid. Google op de naam van die persoon, voeg ’06-‘ toe (de eerste twee cijfers die in elk mobiel nummer voorkomen) en beperk de zoekresultaten tot Excel-documenten. Voilà: sommige Kamerleden kunt u vanaf heden gewoon thuis bellen.
Afbeelding 3.36 In dit boek is het 06-nummer van mevrouw Hamer uitgewit. Via Google is het echter gewoon vindbaar.
57
Hoofdstuk 3 – Google
Lukt het niet in één keer? Probeer dan varianten. Bedenk bijvoorbeeld dat niet op alle adres- of telefoonlijsten voornamen zullen worden gebruikt, en zoek dus ook op achternaam in combinatie met initialen. Kijk ook uit met aanhalingstekens, want ook al wordt de voornaam wel vermeld, dan nog zal de volgorde voornaam-achternaam niet altijd worden gehanteerd. Vaak zijn het cijfers Houd er bij het zoeken in XLS- en XLSX-bestanden wel rekening mee dat u zoekt in bestanden die grotendeels uit cijfers bestaan. Te veel woorden typen leidt al snel tot nul resultaten. Kies dus voor generieke termen als ‘begroting’, ‘adressen’ of ‘rapport’. Geen toegang Mocht u een interessant bestand vinden dat achter een wachtwoord of registratieprocedure blijkt te zitten, vraag dan de cacheversie op. Dat doet u door op HTML-versie, Snelle weergave of In cache te klikken. Er is een goede kans dat de websitebeheerder te lui is geweest om het desbetreffende document af te schermen voor Google.
Geavanceerd gebruik van de cache Soms komt u alsnog op de huidige pagina van de site terecht als u op In cache klikt. Dat kan bijvoorbeeld omdat de oude versie van de pagina instructies bevat om (andere delen van) de huidige site te laden. Dit kunt u omzeilen door met de rechtermuisknop op In cache te klikken en Doel opslaan als (Save target as) te selecteren.
Afbeelding 3.37 In de Nederlandse versie van Internet Explorer gaat u met de muis naar In cache. Druk op de rechtermuisknop en selecteer Doel opslaan als. In de Engelse versie van Internet Explorer kiest u Save target as; bij Firefox is Koppeling opslaan als (Save link as) de juiste keuze.
58
Handboek – Internetresearch
Open het opgeslagen bestand vervolgens met Kladblok: op het moment dat u het zou openen in een browser, wordt u immers weer doorgestuurd! Temidden van alle HTML-opmaakcodes staat (hopelijk) de tekst die u zoekt. 3fig31_03 Google als woordenboek Een eenvoudige manier om snel de betekenis van een woord te achterhalen, is gebruik te maken van het commando define:. Hieraan plakt u vervolgens het woord of de naam van de persoon over wie u meer wilt weten. Het maakt daarbij niet uit of u dit invult bij Met alle woorden in het venster Geavanceerd zoeken of op de standaardpagina van Google. De betekenis van het woord ‘procrastination’ achterhaalt u door define:procrastination te typen; wilt u weten wie William Shakespeare ook al weer was, dan typt u define:William Shakespeare.
Afbeelding 3.38
Google kent de raarste woorden.
3h032 Google als rekenmachine U kunt Google gebruiken als rekenmachine, simpelweg door de berekening te typen in het zoekveld. Ook hierbij maakt het niet uit of u dit invult bij met alle woorden in het venster Geavanceerd zoeken of op de standaardpagina van Google. Wilt u weten hoeveel twee plus twee is, typ dan 2+2. Een kleine valkuil: voor vermenigvuldigingen moet u de asterisk (*) gebruiken in plaats van het maalteken. De berekening zes maal vijf schrijft u dus als 6*5. De Google-rekenmachine is ook uitstekend geschikt voor het converteren van vreemde eenheden. U wilt weten hoeveel liter zes Amerikaanse gallons zijn? Typ dan 6 gallons. Britse gallons kent Google ook: typ bijvoorbeeld 6 imperial gallons. Experimenteren loont, want Google kent zo veel eenheden dat de makers zelf niet eens de moeite hebben genomen ze op te schrijven.
59
Hoofdstuk 3 – Google
Enkele voorbeelden: het invoeren van 82 degrees Fahrenheit in degrees Celsius rekent keurig de temperatuur om naar een voor Nederlanders begrijpelijk getal, en welk resultaat 6 times the speed of light oplevert, laat zich raden. In een melige bui? Tik dan: the answer to life, the universe and everything.
Afbeelding 3.39
Google assisteert zelfs bij het tanken over de grenzen.
Google als synoniemenzoeker 3h033 Voor sommige woorden bestaan veel alternatieven die exact hetzelfde betekenen. Met Google kunnen dergelijke synoniemen in één keer tijdens de zoekopdracht worden meegenomen. Plak daartoe een tilde, ofwel het teken ~, aan de voorkant van het woord vast waarvan u Google ook naar de synoniemen wilt laten zoeken. Deze opdracht werkt het beste bij Engelse woorden. Voorbeeld: ~helicopter
Afbeelding 3.40 De synoniemenfunctie zorgt ervoor dat Google met u mee gaat denken, al levert dat niet altijd iets op.
60
Handboek – Internetresearch
geeft sites waarop zowel het woord helicopter voorkomt, als alternatieve varianten zoals chopper. In te vullen bij met alle woorden in het venster Geavanceerd zoeken of op de standaardpagina van Google. 3h034 Soortgelijke pagina’s vinden Met de opdracht link: kunt u sites vinden die naar een bepaalde website linken. Voorbeeld: de opdracht link:www.volkskrant.nl levert sites op die naar de website van de Volkskrant linken. Het voordeel van het gebruik van deze methode is dat u zo meer pagina’s van hetzelfde soort kunt vinden. Ga maar na: onder de koppelingen die naar de Volkskrant verwijzen, zitten vaak overzichten waarin meerdere soortgelijke sites zijn verzameld of andere sites die op enige manier een verwantschap hebben met de Volkskrant. Een ander voorbeeld: de website van de uitgever Jane’s, voor al uw militaire en geopolitieke informatie, heet www.janes.com. Sites met betrouwbare militaire informatie zijn schaars, dus daar zou u er wel wat meer van willen hebben. De opdracht link: bewijst dan goede diensten. Denk er wel aan om deze optie te gebruiken in combinatie met zowel het volledige siteadres als het siteadres zonder www, dus link:www.janes.com en link:janes.com. De reden hiervoor is dat niet alle websites netjes naar andere sites linken: sommige schrijven de namen van andere websites met www, andere weer zonder. U moet dus met beide mogelijkheden rekening houden. U vult de opdracht link: in het standaardvenster van Google in. Als u het venster Geavanceerd zoeken gebruikt, typt u alleen het adres van de website op de onderste regel, bij het woord Links. U moet ook hier het adres zowel met als zonder www invoeren.
Afbeelding 3.41 Onder in het venster Geavanceerd zoeken treft u de opties Links en Soortgelijk aan. Bij Links vult u het adres van de website waarnaar u wilt zoeken in.
3h036 3h035
Google heeft ook de mogelijkheid om zogeheten gelijkwaardige pagina’s weer te geven. Deze treft u aan op de onderste regel van een zoekresultaat, na de woorden In cache. Waarom de mogelijkheid bestaat, is de auteur een raadsel: de dag dat deze functie een nuttig resultaat oplevert, is de dag dat prins Willem-Alexander eetbaar ondergoed gaat verkopen. Ook deze functie heeft overigens een
61
Hoofdstuk 3 – Google
Afbeelding 3.42 Bij een zoektocht naar pagina’s die verwijzen naar de Volkskrant, staan diverse internetgidsen met koppelingsoverzichten naar andere (Nederlandse) kranten.
plek in het venster Geavanceerd zoeken en wel achter het woord Soortgelijk.
Taalfuncties De sectie Geavanceerd zoeken van Google bevat de zoekopties Taal en Regio. Gebruik van deze functionaliteit is vooral nuttig als u uw zoekgebied tot een taalgebied of geografisch gebied wilt beperken. Stel dat u sites zoekt over voormalig bondskanselier Helmut Kohl, dan kunt u ervoor kiezen alleen sites in Duitsland te doorzoeken met behulp van de regel Pagina’s zoeken in. U krijgt dan treffers in alle talen waarin ze beschikbaar zijn, met als overeenkomst dat alle resultaten zich geografisch in Duitsland bevinden. Aangezien bijvoorbeeld Duitse universiteiten de nodige informatie in het Engels beschikbaar hebben, kan dat nuttig zijn. U kunt ook de eerste optie gebruiken, getiteld Alleen pagina’s geschreven in het. Kiest u hier Duits als taal, dan krijgt u pagina’s van sites overal ter wereld, maar alleen in de Duitse taal. Eventuele Engelstalige analyses van de voormalige bondskanselier gaan aan uw neus voorbij. Op vergelijkbare wijze kunt u op zoek gaan naar Franse pagina’s in België – oftewel een selectie maken tussen Waalse en Vlaamse treffers. De sectie Taalhulpmiddelen (op www.google.nl/language_tools) is handig bij zoektermen die in meer talen voorkomen. Als u moet zoeken naar een
62
Handboek – Internetresearch
serieus artikel over influenza (griep), dan is de kans vrij groot dat de eerste treffer een Nederlandse site betreft. Door bij Zoeken naar pagina’s die zijn geschreven in te klikken op Specifieke talen en als taal Engels te selecteren, kunt u dit voorkomen. Tegelijkertijd sluit u zo Engelstalige documenten van Nederlandse organisaties niet van uw zoekvraag uit. Een alternatief is overigens het gebruik van de eerder genoemde opdracht site:. Zoeken op influenza site:.gb (Groot-Brittanië), influenza site:.us (Verenigde Staten) en influenza site:.org (niet-commerciële organisaties) levert hoofdzakelijk Engelstalige pagina’s op over griep. Met influenza site:.nl zoekt u in sites binnen het nl-domein (Nederland). Taalhulpmiddelen helpt u niet alleen bij het zoeken binnen een opgegeven taal. Google kan een door u getypte tekst
Afbeelding 3.43 Het taalhulpmiddelenmenu van Google kan helpen de zoekresultaten te beperken tot een taalgebied of geografisch gebied. U kunt ook voor automatisering kiezen: in dat geval opteert u voor Automatisch geselecteerde talen.
3h038
(dat hoeft geen Nederlands te zijn) of een gekozen webpagina in enkele tientallen verschillende talen omzetten. Voer de gegevens in en klik op de knop Vertaal.
63
Hoofdstuk 3 – Google
Google dijt uit Schoenmakers schijnen bij hun leest te moeten blijven, maar Google breidt steeds verder uit. Allerlei extra functies van de zoekgigant maken het leven van de researcher potentieel makkelijker, maar in eerste instantie bepaald niet overzichtelijker. Met de nu volgende lijst schept u orde in de informatiechaos.
Google Maps Via Google Maps (maps.google.nl voor de Nederlandse, of maps.google.com voor de Amerikaanse versie) kunt u ronddwalen over een wereldkaart, compleet met satellietbeelden, wegen en zelfs restaurants. Google Maps is bijzonder handig voor het vinden van bedrijven en instellingen, of ieder ander denkbaar ding dat op de kaart vermeld is. Typ maar eens de zoekopdracht speeltuin Den Haag. Voor een maximaal resultaat is het noodzakelijk dat u grofweg op dat gedeelte van de kaart bent ingezoomd waar het gezochte zich bevindt. Echter, om het adres van de auteur te vinden, hoeft u niet eerst op Amsterdam in te zoomen, maar kunt u gewoon Arjan Dasselaar invoeren. Belt u wel even voordat u langskomt, dan staat de koffie bruin. Wilt u zelf ook zo goed vindbaar worden op Google Maps? Ga dan naar https://www.google.com/local/add/login?hl=nl. Google Maps beschikt over Streetview, waarmee u kunt zien hoe een bepaalde straat eruitziet. Sleep hiertoe het poppetje dat u boven aan de in-/uitzoomslider vindt naar een plek op de kaart. Streetview werkt niet
Afbeelding 3.44 Het poppetje waarmee u Google Streetview gebruikt binnen Google Maps vindt u omcirkeld boven aan de in-/uitzoomslider.
64
Handboek – Internetresearch
overal. Als een straat niet blauw omrand wordt als u met het poppetje sleept, is de fotoauto van Google er nog niet doorheen gereden. ir5-h3-3
Met Google Maps kunt u ook routebeschrijvingen laten maken. Merk op dat het mogelijk is een door Google bedachte route bij te stellen door simpelweg met uw muis de op de kaart getekende lijn te verslepen. Grappige varianten op Google Maps vindt u op mars.google.com en op moon.google.com. Op sky.google.com kunnen amateurastronomen hun lol op.
Google Persoonlijk Nogal wat internetgebruikers hebben een vast aantal sites dat ze regelmatig bezoeken. Bovendien zoeken ze regelmatig naar hetzelfde soort onderwerpen. Via Google Persoonlijk (www.google.com/ig, Google Personalized Search voor gebruikers van de Engelstalige Google-site) kunt u sites die u vaak bezoekt in één keer overzien, en bovendien gepersonaliseerde zoekresultaten verkrijgen. Voor het volgen van sites die u belangrijk vindt, moet u ze eerst toevoegen aan uw persoonlijke pagina. Kies daarvoor (na het maken van een persoonlijke pagina, wat zich vanzelf wijst) voor de optie Items toevoegen (Add stuff) en vervolgens voor Feed of gadget toevoegen (Add feed or gadget). Vervolgens knipt en plakt u het adres van de RSS-feed van de site die u wilt toevoegen. Meer over de werking van RSS leest u in hoofdstuk 10.
Afbeelding 3.45
Google Persoonlijk.
65
Hoofdstuk 3 – Google
3persoonlijk Google Web History Wie kent het niet: u zoekt informatie waarvan u zeker weet dat u deze twee weken geleden al eens bent tegengekomen. Maar op welke site ook alweer? Voor dit soort problemen biedt Google Web History (www.google.com/ psearch) de oplossing. Deze site houdt bij welke pagina’s u hebt bezocht na een zoekopdracht via Google. Derhalve is deze dienst niet geschikt voor Jacob Kohnstamm.
Google Custom Search Engine Als u vaak in steeds dezelfde sites zoekt – u bent bijvoorbeeld beurshandelaar die een select aantal bedrijven in de gaten moet houden – kan Google Custom Search Engine (www.google.com/cse) zijn nut bewijzen. Hiermee maakt u, zoals de naam al zegt, een zoekmachine op maat. U hebt wel een website nodig om de Custom Search Engine op te kunnen plaatsen. Voor al te privacygevoelige doelen is deze Google-dienst dan ook niet geschikt, al kunt u er uiteraard voor kiezen om het adres van deze website niet met de buitenwereld te delen. Houd er echter rekening mee dat uw site wel in de Google-zoekresultaten kan opduiken.
Google Scholar Een ideale site voor iedereen die aan een universiteit werkt of anderszins regelmatig in wetenschappelijke databanken moet vertoeven. Via Google Scholar (scholar.google.com) zoekt u naar allerhande geleerde publicaties. Minder bekend is de bijzonder handige mogelijkheid om Google Scholar virtueel te koppelen aan de bibliotheek van de universiteit waar u werkt of studeert. Ga daarvoor naar Scholar Preferences en vul de naam van uw universiteit in op de regel Library Links. Klik op Find Library, vink het lege vakje voor de naam van uw universiteit aan, en klik onder in de pagina op Save Preferences. Wanneer u nu een zoekopdracht invoert, zult u zien dat Google bij sommige treffers automatisch de mogelijkheid biedt om door te klikken naar het relevante artikel in uw universiteitsbibliotheek.
Google Books Voorbij is de tijd dat u een boek daadwerkelijk moest lezen om precies te weten te komen wat erin stond. Met Google Books (www.google.com/ books) kunt u niet alleen op titel of auteur zoeken, maar ook bijvoorbeeld op bepaalde trefwoorden. Of natuurlijk uw eigen naam als u wilt weten of u ooit bent aangehaald door een schrijver. Tip: mocht u binnen Google Books geen toegang krijgen tot een pagina met een treffer (meestal omdat de uitgever van het boek de inhoud niet of niet volledig heeft vrijgegeven), ga dan
66
Handboek – Internetresearch
naar www.amazon.com. Op die site kunt u soms in de volledige tekst van boeken zoeken. U moet dan wel een account maken. Zoek vervolgens op de titel van het boek, klik op het boek, en klik op Search inside. Typ vervolgens uw bij Google eerder ingevoerde zoektermen nogmaals in.
Google N(i)e(u)ws Handig: Googles zoekmachine voor nieuws op http://nieuws.google.nl. Binnen Google Nieuws zoekt u eenvoudig op onderwerp binnen ongeveer vierhonderd Nederlandstalige nieuwsbronnen. Bekijk ook de Amerikaanse variant op http://news.google.com/news?ned=us. Deze ontsluit zo’n 4.500 nieuwsbronnen.
Google Finance Voor de liefhebber van de beurs. Google Finance (www.google.com/finance) combineert financiële informatie met berichten uit Google News. Zo kunt u niet alleen beurskoersen volgen, maar ook uit de berichtgeving afleiden waarom een aandeel stijgt of juist daalt.
Google Images Plaatje nodig? Via www.google.com/images is het heel eenvoudig te vinden. Uiteraard gebruikt u andermans afbeeldingen niet op uw site zonder daarvoor eerst toestemming te hebben gevraagd (toch?). Firefox-gebruikers kunnen overwegen om de grafisch indrukwekkende uitbreiding Piclens te installeren (addons.mozilla.org/en-US/firefox/addon/5579).
Google Video Via Google Video (video.google.com) is het mogelijk om naar – inderdaad – videofilmpjes te zoeken. Tussen het vaak door amateurs aangeleverde beeldmateriaal zitten veel verrassingen. Kort na de overname door Google van YouTube in 2006 wordt ook de inhoud van die laatse populaire filmpjessite via Google Video getoond. Ook filmpjes van diverse andere videosites zijn via Google Video te vinden.
Google Products Vooral handig voor wie wel eens wat over de grens winkelt. Via Google Products (www.google.com/products) vindt u snel de goedkoopste Amerikaanse leverancier voor een product. In combinatie met www.bongous.com een goede manier om geld te besparen in tijden dat de dollar laag staat. (Het verband tussen Google Products en internetresearch heeft wellicht wat inlevingsvermogen nodig.)
67
Hoofdstuk 3 – Google
Experimentele Google-functies Google is niet vanzelf groot geworden, daar is veel innovatie voor nodig geweest. Met de concurrentie op de hielen probeert Google de beste te blijven door almaar nieuwe functies te ontwikkelen. Deze zijn te vinden op de website labs.google.com. Noot vooraf: voor vrijwel al deze experimentele mogelijkheden geldt dat ze gericht zijn op de Engelstalige markt en matig tot slecht overweg kunnen met het Nederlands.
Afbeelding 3.46
Alle experimentele functies staan bij elkaar op
labs.google.com.
3googlelabs Google Sets U kunt Google Sets beschouwen als de zoekmethode ‘puntje-van-uw-tong’. Google Sets probeert op basis van een serie termen te voorspellen welke woorden nog meer in dezelfde reeks thuishoren. Typ maar eens de namen van drie grote internationale organisaties, bijvoorbeeld NATO, EU en OECD. Sommige bekende Nederlandse organisaties krijgen Google Sets ook in beweging, zoals blijkt na het invoeren van Ajax, FC Utrecht en PSV. Google Sets is vooral sterk in het vinden van verbanden tussen organisaties, objecten en activiteiten; maar minder sterk in personen. Rechtstreekse koppeling: labs.google.com/sets.
68
Handboek – Internetresearch
Afbeelding 3.47
Geef Google Sets drie voetbalclubs…
Afbeelding 3.48 …en hij weet zonder problemen te vertellen hoe die ene club uit Rotterdam ook weer heet.
69
Hoofdstuk 3 – Google
3h040 3h039 Google Experimental Benieuwd naar de zoekfuncties die wellicht in de toekomst onderdeel van Google zullen worden? Via Google Experimental (www.google.com/ experimental) kunt u er alvast wat mee spelen.
Google-software Hoe groot de ambities van Google zijn, blijkt uit de inmiddels forse hoeveelheid gratis computerprogramma’s die het bedrijf aanbiedt. Allemaal hebben ze gemeen dat ze informatie helpen ontsluiten. Maar daar houden de onderlinge overeenkomsten ook wel op. Enkele ervan worden hier kort besproken.
Google Toolbar Te vinden op toolbar.google.com. Dit programma nestelt zich in Internet Explorer of Firefox, en maakt het mogelijk een aantal Google-functies te benaderen terwijl u zich niet op www.google.nl of www.google.com bevindt. Het voordeel daarvan is dat u sneller een onverwacht opkomende zoekvraag kunt beantwoorden. Als u bijvoorbeeld in een artikel van de New York Times de naam Dorothy Parker tegenkomt, en u wilt gelijk weten wie dat is, kunt u dat eenvoudig opzoeken zonder eerst naar de Google-site te hoeven gaan. Ook handig is de functie ‘markeerstift’: klik op het plaatje van de (inderdaad) markeerstift, en de termen waarmee u gezocht hebt, worden gearceerd weergegeven. Zo kunt u snel zien waar de door u gezochte informatie zich op een resultaatpagina bevindt.
Google Earth Met Google Earth (earth.google.com) kunt u satellietbeelden van onder meer Nederland op uw computer binnenhalen. Het verschil met het eerder genoemde Google Maps zit met name in de hoeveelheid toeters en bellen: Google Earth heeft aanzienlijk meer mogelijkheden. Zo zit in de software een volledig astronomisch programma met de naam Google Sky. Bovendien zit in Google Earth een vliegsimulatieprogramma verwerkt. Er is ook een betaalde versie met de naam Google Earth Pro beschikbaar met nog meer foefjes.
70
Handboek – Internetresearch
Google Desktop Minder amusant, maar bijzonder praktisch is het (ook in hoofdstuk 1 genoemde) programma Google Desktop (desktop.google.com). Dit handige stuk software brengt alle documenten en e-mails op uw computer in kaart. U kunt deze informatie vervolgens razendsnel doorzoeken.
Overige functies van Google Veel is al gezegd over Google, maar de dienst biedt een aantal faciliteiten dat buiten het bestek van dit hoofdstuk valt. Verderop in het boek komen deze wel aan de orde. Het zijn: • Google Directory De Google-internetgids. Zie hoofdstuk 5. • Google Alerts Automatisch nieuwsberichten ontvangen en automatisch bericht krijgen wanneer er sites zijn die aan uw eisen voldoen. Zie hoofdstuk 6. • Google Blog Search Zoeken in weblogs. Zie hoofdstuk 10. • Google Groups Zoeken in Usenet, oftewel internetdiscussiegroepen. Zie hoofdstuk 11. • Orkut Een sociaal netwerk, bedacht door een Google-medewerker. Zie hoofdstuk 13.
71
4
Overige zoekmachines
G
oogle is slechts een van de vele zoekmachines. Er zijn er meer die weliswaar niet zo goed zijn als Google, maar niettemin een nuttige aanvulling kunnen bieden op wat Google presteert. Zo zijn er metazoekmachines, die de resultaten van verschillende bronnen combineren. Andere zoekmachines specialiseren zich op onderwerp. De veranderingen op dit gebied hoeft u gelukkig niet zelf bij te houden: er zijn sites die dat voor u doen.
U leert in dit hoofdstuk:
De voors en tegens van enkele andere zoekmachines. Wat metazoekmachines zijn en hoe ze te gebruiken. Hoe u zoekmachines vindt die zijn gespecialiseerd in regio’s, onderwerpen, beeld en geluid. Waar op internet u actuele informatie kunt vinden over de mogelijkheden van zoekmachines.
Hoofdstuk 4 – Overige zoekmachines
Nederlandse zoekmachines Een hardnekkig fabeltje wil dat zoeken naar Nederlandse pagina’s het best gaat met een in Nederland gevestigde zoekmachine. Niets is minder waar. Het draaiend houden van een goede zoekmachine kost heel veel geld en vereist een schaalgrootte waar Nederlandse bedrijven niet aan lijken te komen. Wie het niet gelooft, kan de resultaten van onderstaande zoekmachines vergelijken met die van Google, en zal daarna (hopelijk) zijn mening herzien.
Zoeken.nl – www.zoeken.nl Zoeken.nl is een prima site. En nee, dat is niet in strijd met de inleiding van dit gedeelte, waarin wordt beweerd dat Nederlandse zoektechnologie vanwege de kleinere schaalgrootte bijna per definitie inferieur is aan buitenlandse zoekmachines. Zoeken.nl speelt voor het beantwoorden van vragen leentjebuur bij de (buitenlandse) concurrentie. Oftewel: het gaat hier om een metazoekmachine. Dit houdt in dat de site bij andere zoekmachines te rade gaat, de resultaten door elkaar husselt en u voorschotelt wat daarvan overblijft. Toch betekent dit niet dat Zoeken.nl (en zustersite Vinden.nl, met vrijwel identieke zoekresultaten) een aanrader is. Want waarom zou u niet gewoon meteen naar Google gaan? Het nadeel van een metazoekmachine is bovendien dat u nog meer resultaten krijgt, waar u – uitzonderingen daargelaten – er meestal al teveel van hebt. Meer over buitenlandse metazoekmachines leest u overigens verderop in dit hoofdstuk.
Ilse – www.ilse.nl In een Elsevier Webgids die in de prehistorie (1999) door de auteur van dit boek werd samengesteld, stonden in de bespreking van Ilse woorden met als strekking: “Alleen opgenomen bij wijze van waarschuwing. Beginners raken gegarandeerd in de war van Ilse”. Daarmee was Ilse, tegenwoordig eigendom van uitgeverij Sanoma, niet blij, maar ruim een decennium later hoeft er, ook bij de vijfde herziening van dit boek in juni 2010, weinig van die constatering terug te worden genomen. Hoewel: aan de horizon gloort enige hoop. Want de oprichters van Ilse – Merien ten Houten en Robert Klep – kregen begin 2010 de touwtjes van de site in handen. Tot dusver heeft dat niet tot echt grote verbeteringen geleid maar wat niet is, kan nog komen. Ten Houten en Klep hebben in het verleden laten zien wat in hun mars te hebben, al vormen in het verleden behaalde rendementen natuurlijk geen enkele garantie voor de toekomst.
74
Handboek – Internetresearch
Kobala – www.kobala.nl Zoektechnologie uit Eindhoven, die ook is gebruikt voor de Wegener-site: www.track.nl. Minder beroerd dan Ilse, maar daar is dan ook weinig voor nodig. Het advies luidt daarom niet anders dan bij Zoeken.nl en Ilse.nl: waarom binnenlands moeilijk doen, als het buitenlands beter kan?
Buitenlandse zoekmachines Er zijn veel meer zoekmachines dan Google en sommige daarvan kunnen een welkome aanvulling vormen. Andere zoekmachines zijn niet per se goed, maar verdienen vanwege hun populariteit of potentie een bespreking. De belangrijkste spelers op een rij.
Yahoo! – www.yahoo.com Yahoo! schijnt een afkorting te zijn die staat voor Yet Another Hierarchical Officious Oracle. Ooit begon Yahoo! als internetgids (http://dir.yahoo.com, zie hoofdstuk 5), maar inmiddels biedt de site veel meer, zoals een van de beste nieuwsdiensten van internet (http://news.yahoo.com) én een zoekmachine (www.yahoo.com).
Afbeelding 4.1
En de prijs voor Flipperkast van de Week gaat naar…
75
Hoofdstuk 4 – Overige zoekmachines
Yahoo! is de enige echt overgebleven Google-concurrent, en is alleen daarom al waard om in de gaten te houden. Op www.altavista.com en www.alltheweb.com treft u overigens (vrijwel) dezelfde zoekresultaten aan als op Yahoo!. 4yahoo Wolfram|Alpha – www.wolframalpha.com Werkelijk briljante zoekmachine. Maar wacht even, schreef die Dasselaar hiervoor niet dat Yahoo! de enige echte overgebleven Google-concurrent was? Dat klopt, maar Wolfram|Alpha is geen gewone zoekmachine. Eigenlijk is Wolfram|Alpha een gespecialiseerde zoekmachine (zie verderop in dit hoofdstuk), die zoekt in een beperkte selectie van door de maker betrouwbaar geachte bronnen. We noemen deze site toch hier omdat Wolfram| Alpha de intentie heeft uit te groeien tot een aanmerkelijk bredere zoekmachine dan thans het geval is. Want op dit moment is Wolfram|Alpha vooral goed in het beantwoorden van wetenschappelijke en statistische vragen. Voer maar eens ‘aaccagtagag’ in. Bij Google krijgt u nul resultaten, bij Wolfram|Alpha krijgt u te zien waar deze basensequentie zich op de menselijke chromosomen bevindt. U kunt Wolfram|Alpha ook gebruiken voor het maken van grafiekjes. Voer maar eens ‘average gdp growth eu, germany, netherlands’ in en u zult een
Afbeelding 4.2 Er zijn maar 10 soorten mensen die Wolfram|Alpha gebruiken: zij die wel binair snappen, en zij die dat niet doen.
76
Handboek – Internetresearch
grafiekje krijgen van de economische groei in Nederland en Duitsland, vergeleken met het EU-gemiddelde. Op www.wolframalpha.com/examples/ treft u een intimiderend overzicht aan van de mogelijkheden van Wolfram|Alpha. Warm aanbevolen.
Bing – www.bing.com 4wolfram U hebt er vast wel eens van gehoord: bedrijven die het zo verprutst hebben bij hun achterban dat ze een nieuwe naam aannemen omdat de oude te besmet is. Dat is het geval bij Bing (voorheen Live Search, Windows Live Search en MSN). Bing is zo slecht dat het ondanks de enorme macht van eigenaar Microsoft – die deze zoekmachine kan promoten via de eigen browser Internet Explorer – nog steeds weinig meer dan een marginaal marktaandeel kan verwerven. Microsoft gooit er al jaren bakken met geld tegenaan om haar zoekmachine op te stuwen in de vaart der volkeren. Tevergeefs. Want ondanks forse investeringen presteert Bing nog steeds minder goed dan Google én Yahoo!. Geen wonder dat Microsoft in 2008 Yahoo! wilde overnemen. Niettemin zou het een vergissing zijn Microsoft af te schrijven. Het bedrijf heeft diepe zakken en heeft in het verleden aangetoond zich terug te kunnen vechten. Ooit had Microsoft ook een achterstand op de internetbrowser van Netscape; tegenwoordig is Internet Explorer dominant en weet vrijwel niemand van de nieuwe generatie computergebruikers wie of wat Netscape was.
Afbeelding 4.3 Bing zou geen schijn van kans maken zonder de enorme marketingmogelijkheden van maker Microsoft.
4live
77
Hoofdstuk 4 – Overige zoekmachines
Ask.com – www.ask.com Een zoekmachine die zijn populariteit heeft verworven omdat het mogelijk was om in ‘gewone mensentaal’ een vraag te stellen. Die technologie had echter nogal wat beperkingen. Vandaar dat Ask.com zijn vroegere naam Ask Jeeves met bijbehorend butlerlogo overboord heeft gezet. Tegenwoordig is Ask.com een ‘normale’ zoekmachine, gebaseerd op de technologie van www.teoma.com.
Afbeelding 4.4
Ask.com heeft het butlerlogo gedumpt.
4ask Alexa – www.alexa.com Goh, nog een zoekmachine. Wat moet u met deze? De zoekresultaten van Alexa zijn niet spannend, maar wel interessant zijn de zogeheten Traffic Rankings. Daarmee kunt u kijken hoe vaak een bepaalde website wordt bezocht. En dat is ook voor niet-commercieel ingestelde mensen interessant. Want wie gelooft u eerder als het bijvoorbeeld om medische informatie gaat: een klein blog, of een grote site van een universiteit?
AltaVista – www.altavista.com Ooit synoniem met zoeken op internet, tegenwoordig veroordeeld tot de reservebank (van het Nigeriaanse schaatsteam). Veel zakelijk geklungel heeft ervoor gezorgd dat AltaVista zijn leidende positie is kwijtgeraakt. Ook technisch ging het niet altijd even goed bij het bedrijf. In 2001 meldde de website WebWereld (www.webwereld.nl) dat de digitale kaartenbak met zoekresultaten van de Nederlandse AltaVista-variant zo’n vier maanden niet was bijgewerkt. Inmiddels is AltaVista een slaafse volgeling van Yahoo! geworden. Jammer, maar vergane glorie.
78
Handboek – Internetresearch
Afbeelding 4.5
Op de reservebank.
4altavista Gigablast – www.gigablast.com En het geschiedde in het begin van de 21ste eeuw dat keizer Google oppermachtig was. Heel de wereld viel onder het bewind van de machtige zoekgigant uit Mountain View. Heel de wereld? Nee, een kleine website bleef dapper verzet bieden tegen de hegemonie van Google. Matt Wells, volgens geruchten als kind in de ketel met Red Bull gevallen, stampte in zijn eentje de website Gigablast uit de grond.
Afbeelding 4.6 Zoals u op deze zwart-witscreendump niet kunt zien, heeft Gigablast kleurtechnisch veel op met het koningshuis.
79
Hoofdstuk 4 – Overige zoekmachines
4gigablast WikiAnswers – http://answers.wikia.com/ Geen echte zoekmachine en toch ook weer wel. U kunt op WikiAnswers vragen stellen en die worden vervolgens door andere mensen beantwoord. Of – en dat gaat natuurlijk een stuk sneller – uw vraag is al beantwoord, en de site kan u op grond van het archief gelijk plezieren met een nuttige reactie op uw vraag. In juni 2010 bevatte de site al bijna 9 miljoen antwoorden, waardoor u op veel voorkomende vragen snel een antwoord kunt krijgen.
Afbeelding 4.7
Tal van nuttige antwoorden op WikiAnswers.
4wikia
Metazoekmachines Zoekmachines zijn niet volledig. Zoals in hoofdstuk 5 duidelijk zal worden, is een groot deel van internet niet eens te ‘zien’ door zoekmachines. Maar ook het gedeelte van internet dat wel zichtbaar is, wordt door geen enkele zoekmachine volledig in kaart gebracht. Daarvoor is internet simpelweg te groot en te veranderlijk. Een sluitende oplossing hiervoor is er niet, maar er is wel een mogelijkheid om althans een gedeelte van de leemten op te vullen. Verschillende zoekmachines maken namelijk verschillende keuzen waar het aankomt op de beslissing welke sites wel en welke sites niet in de kaartenbak worden opgenomen. Nu kunt u natuurlijk met een en dezelfde vraag meerdere zoekmachines benaderen, maar u kunt ook een zogeheten metazoekmachine gebruiken. Dit zijn sites die de resultaten van meerdere zoekmachines combineren, dubbele resultaten filteren en wat er overblijft aan de zoeker presenteren. Dat klinkt ideaal, maar toch is het niet aan te raden om een zoektocht standaard te beginnen bij een metazoekmachine.
80
Handboek – Internetresearch
Hiervoor is een aantal redenen. Zo beschikken metazoekmachines vaak niet over de speciale functies van de zoekmachines waarvan ze informatie als bron gebruiken. De bijzondere mogelijkheden van Google bijvoorbeeld gaan grotendeels aan u voorbij. Ook geldt dat overdaad schaadt. Eerder is er in dit boek op gewezen dat slechts weinig researchers last hebben van te weinig zoekresultaten. Zomaar metazoekmachines gebruiken, kan de verwarring vergroten. Toch zijn er gevallen denkbaar dat u last hebt van te weinig zoekresultaten. Dat kan het geval zijn als u research doet naar een redelijk obscuur onderwerp. Metazoekmachines zijn daarnaast bijzonder nuttig bij het doen van onderzoek naar personen, zeker als de persoon in kwestie geen al te grote bekendheid geniet (pagina’s over Barack Obama zijn in ruime mate voorhanden). Een laatste noot. Google beschikt over een cachefunctie waarmee van internet verdwenen pagina’s alsnog kunnen worden teruggehaald. Metazoekmachines hebben die functie niet. Toch kan ook een ongeldig zoekresultaat nut hebben, omdat de metazoekmachine vaak wel een korte samenvatting geeft van de inhoud. Ook het verdwenen internetadres zelf kan nuttige informatie bevatten. Hebt u bijvoorbeeld gezocht op de naam van een persoon en komt daar een zoekresultaat uit dat naar een verdwenen pagina binnen www.nivra.nl leidt, dan is de kans groot dat de desbetreffende persoon iets met accountancy te maken heeft. Het NIVRA is immers het Koninklijk Nederlands Instituut van Registeraccountants. Een ‘Google’ onder de metazoekmachines bestaat niet: geen van alle presteren ze indrukwekkend. Hierna worden de belangrijkste besproken.
Clusty – www.clusty.com Interessant omdat deze metazoekmachine resultaten ‘clustert’, oftewel probeert te groeperen naar onderwerp. Daartoe tracht de computer verwante woorden en begrippen met elkaar te associëren. In theorie moet dat gebruikers helpen snel een grote berg zoekresultaten te schiften. Dat werkt overigens lang niet altijd perfect.
81
Hoofdstuk 4 – Overige zoekmachines
Dogpile – www.dogpile.com De nestor onder de hier vermelde metazoekmachines. Dogpile haalt naar eigen zeggen zoekresultaten van onder meer Google, Yahoo!, Bing, Ask.com en About.com. Niettemin zorgt Dogpile regelmatig voor rare resultaten. Een zoekvraag gesteld aan Google levert vaak meer resultaten op dan dezelfde vraag via Dogpile, terwijl de laatste naast Google nog diverse andere sites raadpleegt en dus feitelijk meer resultaten zou moeten kunnen tonen. Maar als u een metazoekmachine gebruikt, laat het dan deze zijn.
Afbeelding 4.8 Dogpile lijkt inderdaad op een hond: hij probeert trouw te doen wat u beveelt, maar slaagt daar niet altijd in.
4h001 Freebase – www.freebase.com Maak een lange, heel erg lange lijst met websites die nuttige informatie bevatten. Bouw er vervolgens een zoekmachine omheen. Zo ongeveer werkt Freebase, dat vooral dienst doet als naslagsite. Op encyclopedische onderwerpen scoort deze metazoekmachine goed, bij obscure kwesties en zoektochten naar personen laat Freebase het afweten.
Afbeelding 4.9 Alle informatie over deze relatief onbekende Amerikaan vindt u via Freebase.
82
Handboek – Internetresearch
Gespecialiseerde zoekmachines Internet is groot en daardoor door geen enkele zoekmachine volledig in kaart te brengen. Daar komt bij dat sommige researchers niet zitten te wachten op een zoekmachine die desondanks verwoede pogingen doet het gehele internet te doorploegen. Daardoor kan immers ook de ruis toenemen. Meer zoekresultaten is met andere woorden niet altijd beter: enige selectiviteit van zoekmachines kan juist heel handig zijn. Deze twee redenen tezamen verklaren het bestaan van gespecialiseerde zoekmachines, die zich richten op een beperkt gedeelte van het informatieaanbod op internet. Het voordeel voor de zoekmachine: het is makkelijker om een beperkt gedeelte van internet in kaart te brengen dan te streven naar volledigheid. Het voordeel voor de researcher: deze hoeft niet met allerlei trucs te proberen zijn zoekvraag tot een bepaald onderwerp te beperken. Grofweg vallen gespecialiseerde zoekmachines in een van de drie volgende categorieën. • Zoeken op onderwerp Voorbeeld: een zoekmachine die gespecialiseerd is in sociale wetenschappen of sport. • Zoeken op regio Voorbeeld: een zoekmachine die zich beperkt tot zoekresultaten in een bepaald land, zoals Nederland of Frankrijk. • Zoeken op medium of doelbestand Voorbeeld: een zoekmachine die alleen muziekbestanden of afbeeldingen kan opsporen. Een aantal gespecialiseerde zoekmachines wordt in Appendix A besproken. In dit hoofdstuk wordt volstaan met een uitleg hoe u dergelijke zoekmachines kunt vinden. Er is een aantal sites dat u daarbij behulpzaam kan zijn.
Google Directory – directory.google.com/Top/Computers/Internet/Searching/ Search_Engines/Specialized De bovenstaande koppeling leidt u niet naar een website die louter over zoekmachines gaat, maar naar een rubriek uit Google Directory, een internetgids waarover u in hoofdstuk 5 meer zult lezen. Vanwege de lengte van de koppeling is het aan te raden voor deze pagina een bladwijzer te maken. Dit is een koppeling voor gevorderden: deze geeft toegang tot veel verschillend gespecialiseerde zoekmachines op allerlei terreinen. Die overvloed kan verwarrend zijn.
83
Hoofdstuk 4 – Overige zoekmachines
Afbeelding 4.10
Hoeveel gespecialiseerde zoekmachines had u gehad
willen hebben?
4h003 Wikipedia’s lijst van zoekmachines – en.wikipedia.org/wiki/
List_of_search_engines Het voordeel van de Engelstalige Wikipedia-pagina’s is dat ze regelmatig worden bijgewerkt. Hoewel dit overzicht van zoekmachines verre van volledig is, bevat het vaak meer actuele verwijzingen dan veel andere lijsten.
Beaucoup – www.beaucoup.com Bevat een lijst met algemene zoekmachines, plus een index van zoekmachines in diverse landen. Tevens voorzien van rubrieken met zoekmachines die gespecialiseerd zijn in computers, software, maatschappelijke rubrieken, gezondheid, kunst, media, sport en het zakenleven. 4beaucoup Pandia – www.pandia.com/powersearch Deze site bevat goede verwijzingen naar zoekmachines die zich richten op bestanden, zoals beeld, geluid of computerprogramma’s. Pandia scoort minder goed waar het op andere gespecialiseerde zoekmachines aankomt, maar maakt dat weer goed met een (in de context van dit hoofdstuk minder relevante) uitstekende verzameling tips over hoe te zoeken op internet.
84
Handboek – Internetresearch
Afbeelding 4.11
Helaas geen omeletrecepten.
Afbeelding 4.12 Pandia bevat veel informatie, maar vergt door de opmaak van de site wel enige inspanning van de lezer.
4h004
85
Hoofdstuk 4 – Overige zoekmachines
Informatie en nieuws over zoekmachines Het gezegde wil dat niets zo veranderlijk is als de mens, maar aangezien internet de veranderlijkheid van honderden miljoenen mensen bundelt, is deze uitspraak wellicht aan revisie toe. Op zoekmachinegebied veranderen er in elk geval vrijwel dagelijks zaken. Doet u vaak research naar uiteenlopende onderwerpen, dan is enigszins bijblijven raadzaam. Hierna volgen daarom besprekingen van sites die u van actuele informatie over zoekmachines kunnen voorzien, evenals enkele sites die het zoeken zelf eenvoudiger maken.
SearchEngineWatch – www.searchenginewatch.com De nestor onder alle sites over zoekmachines, gemaakt door Danny Sullivan. Nog altijd is de site goed voor kundig gratis nieuws en dito analyses, maar een deel van de inhoud is alleen voor betalende bezoekers beschikbaar. Gelukkig zijn de nieuwsbrieven gratis, op de speciale twee keer per maand verschijnende Search Engine Update na: die is alleen voor leden bestemd.
Afbeelding 4.13 Onder Rating & Stats in de menubalk aan de linkerkant van het scherm treft u een overzicht aan van diverse zoekmachines.
86
Handboek – Internetresearch
4h005 Voelspriet – www.voelspriet.nl De website van de Nederlander Henk van Ess is een amalgaam van allerlei hulpmiddelen die een serieuze researcher nodig heeft. Daaronder bevinden zich diverse tips en trucs om bepaalde zoektochten (zoals het vinden van personen) sneller af te ronden. Van Ess gebruikt voor het zoeknieuws een forum, wat ertoe kan leiden dat u op enkele discussiërende zoeknerds kunt stuiten. Van Ess geeft – net als de auteur van dit boek – trainingen aan researchers, dus deze vermelding is mede mogelijk gemaakt door de Nederlandse Mededingingsautoriteit. (Zo goed, meneer Kalbfleisch?)
Afbeelding 4.14
Helaas ontbreekt een bord met ‘Opgepast, overstekende
nerds’.
4h006 InfoPeople-lijsten – www.infopeople.org/search Bevat de Search Tools Chart. Het is aan te raden dit document af te drukken en naast uw computer te leggen, net zoals sommigen onder u vroeger wellicht deden met de minihandleidingen voor WordPerfect. De Search Tools Chart bestaat uit twee pagina’s met daarop een samenvatting van de sterke punten van de belangrijkste zoekmachines. De InfoPeople-lijsten maken daarnaast duidelijk hoe u bij de behandelde zoekmachines gebruik kunt maken van booleaanse operatoren.
87
Hoofdstuk 4 – Overige zoekmachines
Bruce Clay – www.bruceclay.com/searchenginerelationshipchart.htm Hoe staan zoekmachines met elkaar in verband? De ‘internet business consultants’ van Bruce Clay hebben de relaties tussen de belangrijkste zoekmachines en internetgidsen in een interactief schema gezet. Het praktische nut is beperkt, maar tijdens het volgende verjaardagsfeestje bent u mooi uw neefje van elf te slim af (wat zoekmachines betreft, dan).
Afbeelding 4.15 Het schema op de site van Bruce Clay maakt de relaties tussen verschillende zoekmachines inzichtelijk.
4bruce
88
5
Internetgidsen en het diepe web
Z
oekmachines zijn niet de enige manier om op internet te zoeken, gelukkig maar. Zoals in hoofdstuk 2 is besproken, doen zoekmachines geautomatiseerd hun werk. Internetgidsen daarentegen worden door mensen samengesteld. Hoewel dat soms tot slechte resultaten leidt, heeft het ook een groot voordeel: mensen hebben inzicht in het diepe web, het deel van internet dat voor zoekmachines onvindbaar is. Kortom, dit hoofdstuk is een ode aan het meest dominante tweepotige zoogdier van de planeet Aarde.
U leert in dit hoofdstuk:
Wat het verschil is tussen goede en slechte internetgidsen. Enkele slechte zoekmachines van dichtbij kennen. Enkele goede zoekmachines van dichtbij kennen. Wat het diepe web is en waarom zoekmachines er geen vat op hebben. Hoe u het diepe web toch kunt doorzoeken.
Hoofdstuk 5 – Internetgidsen en het diepe web
Goede versus slechte internetgidsen Een kleine herhaling van hoofdstuk 2: een internetgids is een gerubriceerde indeling van door (al dan niet volledig) menselijke redacteuren bezochte en geëvalueerde sites. Die moeten niet alleen beslissen welke sites ze opnemen, maar ook in welke rubriek deze vervolgens worden geplaatst. Dat geeft gelijk al aan waar de potentieel zwakke punten van een internetgids liggen: op het gebied van structuur, kwantiteit en kwaliteit. • Structuur Een internetgids zonder logische rubrieksindeling is onbruikbaar. Van belang is ook hoe de redacteuren van de internetgids zich aan hun eigen structuur houden. Dat lijkt een open deur, maar veel internetgidsen vallen hier door de mand. Een heldere rubrieksindeling maken valt al niet mee, maar deze consequent handhaven, mislukt zeer regelmatig. • Kwantiteit Volledig kan een internetgids nooit zijn. Dat lukt een zoekmachine niet eens. Maar een goede internetgids moet zich niet beperken tot een aantal rubrieken of de meest bekende sites voor een bepaald onderwerp. Bestaat een internetgids alleen uit sites uit de laatste categorie, dan voegt deze immers weinig toe aan wat veel researchers al weten. Het nadeel van een internetgids met weinig rubrieken is dat u een waslijst aan nuttige internetgidsen moet bijhouden om al uw onderzoeksbehoeften op te kunnen botvieren. • Kwaliteit Zeker gezien de beperkingen ten aanzien van kwantiteit moeten de koppelingen die overblijven veel beter zijn dan de resultaten die een zoekmachine uitspuugt. Wie een database heeft van miljarden internetpagina’s, kan best wat rotte appels verdragen; wie er slechts enkele honderden of duizenden in de aanbieding heeft, moet ervoor zorgen dat zijn gehele aanbod tenminste aan enige basale kwaliteitseisen voldoet. Uit het voorgaande blijkt dat het maken van een goede internetgids heel veel tijd en geld kost. Een aantal van de internetgidsen dat hierna besproken wordt voldoet daaraan, andere niet.
Startpagina – www.pagina.nl Een internetgids die maar aan een van de drie genoemde criteria voldoet: kwantiteit. Op Startpagina staan heel veel koppelingen, bij elkaar geharkt door vrijwilligers. Deze krijgen in ruil daarvoor een gedeelte van de advertentie-inkomsten op hun deel van de Startpagina-site. Helaas wisselt de kwaliteit van deze verschillende gedeelten, ook wel Startpagina-dochters genoemd, onderling sterk. Sommige dochters zijn zeer commercieel, andere
90
Handboek – Internetresearch
bevatten daadwerkelijk goede koppelingen, wat een bezoek aan Startpagina onvoorspelbaar maakt. De rubricering is een rommeltje: meer dan eens staan sites in rubrieken waar ze niet thuishoren. Ook zijn er sites die in meerdere rubrieken prima tot hun recht zouden komen, maar slechts eenmaal worden vermeld.
Yahoo! – dir.yahoo.com Hoe je een goed concept om zeep helpt, laat Yahoo! zien. Het bedrijf dat de internetbevolking de eerste goedwerkende internetgids liet zien, heeft zijn bedenksel laten verpieteren. De gids zit vol met verouderde of niet-relevante links, en wat betreft kwantiteit scoort Yahoo! ook niet goed. Bij de eerste druk van dit boek in 2004 wist Yahoo! geen andere landelijke kranten te noemen dan De Telegraaf, de Volkskrant en NRC Handelsblad. Bij het verschijnen van deze vijfde, geactualiseerde druk in 2010 is dat nog steeds niet veranderd. (In 2012 kijken we opnieuw, al bestaat natuurlijk de kans dat er tegen die tijd überhaupt maar drie kranten zijn overgebleven.) Gebruik de rubrieksindeling Gebruik bij het zoeken in internetgidsen de rubrieksindeling. Redacteuren van een internetgids maken de indeling van koppelingen immers ook op basis van deze structuur. Weliswaar bevatten veel internetgidsen een zoekveld, maar deze functie werkt vaak niet optimaal.
About.com – www.about.com Zo kan het ook. De Amerikaanse site About.com wordt net als Startpagina volgeschreven door vrijwilligers die meedelen in de advertentiewinst. Het verschil is dat deze vrijwilligers aanzienlijk beter hun best doen: de About.com-vrijwilligers geven niet alleen een verzameling koppelingen naar andere sites, maar ook advies en actuele informatie. Zo had About.com na de aanslagen van 11 september 2001 binnen korte tijd uitstekende overzichten met koppelingen. Deze grondige aanpak vertaalt zich wel in een kwantitatieve beperking: Startpagina heeft meer dochters dan About.com op onderwerp gespecialiseerde internetgidsen heeft. Gebruik nooit het zoekveld op About.com, maar gebruik het rubriekssysteem: dit om terminale verwarring te voorkomen. Veel About.com-gidsen zijn overigens eenvoudig te vinden door het desbetreffende onderwerp voor het siteadres te zetten. De About.com-gids over islam is bijvoorbeeld te vinden op islam.about.com; die over politieke humor op politicalhumor.about.com. Tip: uit het laatste voorbeeld blijkt al dat u de Amerikaans-Engelse spelling moet gebruiken, waarin veel Britse woorden met ‘ou’ met een ‘o’ worden gespeld.
91
Hoofdstuk 5 – Internetgidsen en het diepe web
Afbeelding 5.1
Laat u niet afschrikken door het al te gelikte uiterlijk.
5h001 DMOZ – www.dmoz.nl Directory MOZilla, beter bekend als het Open Directory Project, is een goede en uitgebreide internetgids. De site wordt volledig gevuld door vrijwilligers die hiervoor geen enkele compensatie ontvangen. Het zwakste punt van DMOZ is de structuur: heel trots meldt de site zelf dat men over meer dan 590.000 categorieën beschikt. Dat is echter niet iets om blij mee te zijn. Het gebruik van onbezoldigde vrijwilligers heeft daarnaast nog een ander nadeel: het duurt soms geruime tijd voordat nieuwe sites worden toegevoegd aan de index. Ook fouten in de categorie-indeling worden niet altijd even prompt hersteld. Soms zwerven er op DMOZ zelfs rubrieken rond die allang niet meer in gebruik zijn.
Google Directory – www.google.com/dirhp en www.google.nl/dirhp Google Directory baseert zich op de inhoud van DMOZ, waaraan de eigen zoektechnologie is toegevoegd. Het voordeel daarvan is dat de informatie uit DMOZ ook via een invoerveld is te doorzoeken. Door de kracht van Googles zoektechnologie levert dit veel betere resultaten op dan bij andere internetgidsen die deze mogelijkheid bieden. Wie op ‘architectuur’ zoekt, zal bijvoorbeeld door Google worden geadviseerd naar de rubriek World/Nederlands/Kunst/Architectuur te gaan, waar allerlei koppelingen over dit onderwerp gesorteerd bij elkaar staan.
92
Handboek – Internetresearch
Als Google een dergelijk advies kan geven, staat dat boven in het venster met zoekresultaten onder de noemer Gerelateerde categorieën. Het nadeel daarvan is dat Google een onhebbelijkheid van DMOZ heeft overgenomen: de zoekfunctie verwijst u soms naar rubrieken die geen dienst meer doen. Overigens steekt Google jammer genoeg niet meer zo veel energie in de Directory. Meer sites Door bij Google Directory de naam van een u bekende website in te vullen, kunt u vaak eenvoudig meer sites over hetzelfde onderwerp vinden.
Onder aan de pagina kunt u ook de Nederlandse versie van Google Directory kiezen. Rechtstreeks naar www.google.nl/dirhp gaan voert u naar dezelfde pagina.
Afbeelding 5.2
5h002 Best of the Web – botw.org Geen volledige webgids, maar een overzicht van wat de redacteuren van Best of the Web de (inderdaad) beste sites op het web vinden. Positief is de bereidheid van Best of the Web om te investeren in kwaliteitsredacteuren. In april 2008 werd bekend dat ruim dertig medewerkers van DMOZ (zie elders in dit hoofdstuk) waren overgestapt naar Best of the Web. Aanzienlijk minder prettig is de bereidheid van het bedrijf om te sjoemelen met de scheiding tussen redactie en commercie. Websites die graag opgenomen willen worden in de index, kunnen tegen betaling een voorkeursbehandeling krijgen.
93
Hoofdstuk 5 – Internetgidsen en het diepe web
ipl2 – www.ipl2.org Deze site is ontstaan als fusie van de Internet Public Library (van de University of Michigan School of Information) en de Librarians’ Index to the Internet. Beide waren sites van, en voornamelijk ook voor, informatieprofessionals, en zijn in 2010 samengegaan. Ook de nieuwe site wordt samengesteld door professionals en dat is te merken. De makers van ipl2 streven overduidelijk niet naar kwantiteit, maar naar kwaliteit. Dat is tegelijkertijd het zwakke punt van ipl2, waar soms essentiële sites ontbreken die door de samenstellers wellicht te gewoontjes werden geacht. ipl2 is niettemin een uitstekend startpunt voor met name meer academisch getinte zoektochten. Leuk zijn de special collections, vaak gericht op relatief actuele onderwerpen. Het is ook mogelijk (research)vragen te stellen aan de bibliothecarissen die de site maken.
Afbeelding 5.3 De voorpagina van ipl2 verbergt de rijkdom erachter. Klik dus snel op een van de vijf hoofdcategorieën.
5h003 Library of Congress – international.loc.gov en www.loc.gov Hoe u ook over de Amerikanen denkt, deze site van de Amerikaanse volksvertegenwoordiging mag u niet missen. Professionele documentalisten hebben een werkelijk uitstekende internetgids gemaakt. Het meest interessant is de internationale internetgids op international.loc.gov. In de sectie Portals to the world treft u hier mini-internetgidsen aan over vrijwel alle landen ter wereld. Op de hoofdpagina van Library of Congres (www.loc.gov) is het gedeelte Resources for researchers aan te raden. Hier houdt zich ook veel interessante informatie schuil, maar deze extraheren vereist meer werk.
94
Handboek – Internetresearch
Afbeelding 5.4 Behalve Portals to the World is ook de sectie Research guides and databases aan te raden.
5h005 Intute – www.intute.ac.uk Een internetgids die zich richt op academische informatie. Intute verzamelt websites in een aantal wetenschappelijke disciplines, variërend van Bioengineering tot aan Ethnographic Studies. Nogal verstopt is de knop A-Z, waarmee u eenvoudig op onderwerp kunt zoeken. Nou ja, eenvoudig: u moet niet al te snel afgeleid worden. Intute is namelijk behoorlijk volledig.
Afbeelding 5.5 Een zoektocht via Intute kunt u bijvoorbeeld beginnen door een van de rubrieken bij Browse Web resources by subject te kiezen.
95
Hoofdstuk 5 – Internetgidsen en het diepe web
Het diepe web Het diepe web wordt ook wel het onzichtbare web genoemd, en dat heeft een goede reden. Het gaat hier om dat gedeelte van internet dat onzichtbaar is voor zoekmachines. Inderdaad, er zijn delen van internet die u wel kunt zien, maar die voor een zoekmachine verborgen blijven. Dat is niet altijd zo geweest: in vroegere tijden was veel meer van internet ‘zichtbaar’ – al waren zoekmachines in die tijd nog niet zo goed om daar optimaal van te kunnen gebruikmaken. Het onzichtbare web wordt (vermoedelijk, want serieus recent onderzoek is er niet) steeds groter. Volgens een schatting van de Amerikaanse internetpublicatie Salon.com uit maart 2004 is 99 procent van het web niet meer zichtbaar voor zoekmachines. Omdat het diepe web per definitie moeilijk vindbaar is, blijft het echter lastig om accurate uitspraken te doen over de omvang ervan. In één regel samengevat bestaat het onzichtbare of diepe web uit informatie die wel via websites te benaderen is, maar niet echt op die websites staat, maar bijvoorbeeld op computersystemen die daarachter hangen. Om te begrijpen hoe dat kan, is het handig om internet van weleer te vergelijken met een wildweststadje aan het eind van de negentiende eeuw, bestaande uit één hoofdstraat waarlangs alle belangrijkste winkels zich bevonden. Wie een inventarisatie wilde maken van de goederen die de diverse winkels aanboden, kon volstaan met een wandeling door de hoofdstraat en een grondige blik in de diverse etalages. De persoon die door de hoofdstraat loopt met een notitieblokje om deze inventarisatie te maken, is in dit voorbeeld uiteraard de zoekmachine; de winkels en hun voorraad staan respectievelijk voor websites en de aangeboden informatie. Inmiddels is dat wildweststadje veranderd in een metropool à la New York. Er zijn meer winkels dan ooit tevoren, maar hun voorraad is niet eenvoudig meer te inventariseren. Wat er in de etalages staat, is maar een heel klein deel van het werkelijke assortiment. Het grootste deel staat in het magazijn. Weliswaar kan het bedienend personeel van de winkels zonder problemen de gewenste goederen leveren, maar alleen als een klant naar binnen stapt en erom vraagt. Het spreekt voor zich dat het personeel nogal geïrriteerd zou raken als degene die de inventarisatie maakt (de zoekmachine) de vraag zou stellen om de gehele magazijnvoorraad even op te dreunen.
96
Handboek – Internetresearch
Zo gaat het ook op internet. Vroeger waren websites simpel: ze bestonden uit een aantal pagina’s, vaak geschreven in de internetopmaaktaal HTML. Dit waren zogeheten statische pagina’s, die niet of nauwelijks aan verandering onderhevig waren. Een zoekmachine kon daar relatief eenvoudig greep op krijgen. Tegenwoordig bestaan heel veel sites niet meer louter uit dergelijke statische pagina’s. In plaats daarvan is het statische gedeelte beperkt en louter nog bedoeld om toegang te geven tot achterliggende informatie. Dit is meestal een database oftewel een kaartenbak met gegevens. De bezoeker van de site gebruikt vaak een invoerveld om op te geven welke informatie deze wil, waarna hij of zij de gegevens te zien krijgt. Deze pagina’s zijn dynamisch. Dat wil zeggen dat ze louter op uw verzoek zijn gemaakt en ook niet langer bestaan dan de tijd waarin u ze weergeeft. Een zoekmachine zal ze nooit zien en heeft zelf geen toegang tot een achterliggende database (waar bovendien soms ook nog een slot op zit in de vorm van een betaalverplichting aan de uitgever van de site). De enige manier waarop een zoekmachine te weten zou kunnen komen welke informatie de achterliggende database van een website bevat, is de website te gaan ‘bevragen’ op alle mogelijke letter- en woordcombinaties. Een voorbeeld. Als u op Google zoekt naar Kamerhandelingen “Delft Instruments” levert dat geen relevante treffers op (wel krijgt u wat verwijzingen naar dit boek te zien). Gaat u echter naar de website Officiële Bekendmakingen van de Rijksoverheid (https://zoek.officielebekendmakingen.nl/) en zoekt u daar op “Delft Instruments” (met alle zoekopties aangevinkt), dan treft u legio documenten aan over het Delftse bedrijf dat ooit in het nieuws kwam als leverancier van nachtkijkers aan het Irak van Saddam Hussein.
Afbeelding 5.6
Voor al uw kamerstukken.
97
Hoofdstuk 5 – Internetgidsen en het diepe web
5h007
Nog een voorbeeld. Stel, u zoekt wetenschappelijke studies over griep in Nederland, oftewel influenza. Als u bij Google influenza netherlands “scientific studies” typt, krijgt u weliswaar veel kaf te zien, maar is de oogst aan relevante resultaten mager. Gaat u echter naar PubMed (www.pubmed.gov) en typt u daar influenza netherlands, dan hebt u gegarandeerd meer succes. Op deze site staan namelijk ruim negentien miljoen medisch-wetenschappelijke studies bij elkaar. Die zijn niet allemaal gratis te bekijken, maar de samenvattingen meestal wel. Google kent de meeste studies in PubMed niet. Alleen wanneer een arts zo ijdel is geweest zijn in PubMed opgenomen studie ook op zijn eigen website op te nemen, hebt u met Google nog wel eens een kansje.
Afbeelding 5.7 Veel gepubliceerde medisch-wetenschappelijke artikelen komen in PubMed terecht, al zijn ze niet allemaal gratis te bekijken.
5h008
De vraag luidt nu: hoe kunt u toch zoeken in het diepe web. Het antwoord, ietwat teleurstellend, is: uiterst moeizaam. Uit de voorgaande twee voorbeelden is duidelijk geworden dat u om in het diepe web te zoeken, moet weten welke sites toegang geven tot bepaalde gedeelten van dat diepe web. Zo geeft PubMed toegang tot een medischwetenschappelijk gedeelte en geeft de website Officiële Bekendmakingen toegang tot stukken van onder meer het Nederlandse parlement. In welke situatie u via het diepe web moet zoeken en hoe u dat het best aanpakt, kunt u bepalen met de volgende drietrapsstrategie.
98
Handboek – Internetresearch
1 Zoek specifiek U begint uw zoektocht zoals u in hoofdstuk 1 hebt geleerd: door specifiek te zoeken via Google. Wellicht kunt u zich zo veel tijd besparen alvorens u op het diepe web te richten. 2 Zoek breed Google heeft niets opgeleverd, andere relevante zoekmachines ook niet. Nu moet u een diepe website proberen te vinden die wel de informatie bevat die u zoekt. Het kenmerkende van diepe websites is, zoals gezegd, dat de meeste informatie niet zichtbaar is voor zoekmachines. Slechts de ‘voorgevel’ van een dergelijke site is te vinden via zoekmachines. Op deze pagina’s staat vaak elementaire informatie over de inhoud van de site die wel in zoekmachines wordt opgenomen. Daarvan kunt u dan ook gebruikmaken. Anders gezegd: u kunt de website Officiële Bekendmakingen niet vinden door op Delft Instruments te zoeken. Maar als u bij Google “officiële bekendmakingen” overheid had getypt, was u wel op de site Officiële Bekendmakingen geëindigd. En had u gezocht op medical publications, dan was u bij PubMed geëindigd. Werkt dat ook niet? Probeer dan een overzichtssite te vinden. Voorbeeld: als u op een zeer specifieke psychiatrische aandoening zoekt via Google, maar nul op het rekest krijgt, probeer dan een algemenere zoekvraag als “mental health” om zo te proberen een overzichtssite over een bepaald onderwerp te vinden. 3 Zoek nogmaals specifiek U hebt de desbetreffende site gevonden die toegang geeft tot het stukje diepe web waar zoekmachines niet bij kunnen. Hier moet u uw oorspronkelijke, specifieke zoekvraag opnieuw stellen. Levert dat niets op, ga dan terug naar de vorige stap en probeer meer diepe websites te vinden over hetzelfde onderwerp. Maak een bladwijzer Het zoeken naar diepe websites kan een langdurig en soms frustrerend proces zijn. Daarom is het aan te raden om onmiddellijk een bladwijzer te maken van nuttige diepe websites over onderwerpen waarnaar u vaak research doet. De voorgaande strategie is bedoeld als een algemene methode om diepe websites te vinden. Er zijn echter ook in het diepe web gespecialiseerde sites die u hierbij een handje kunnen helpen. Let op: voor alle sites die hier besproken worden, geldt uiteraard dat u begint met zoeken vanaf stap 2: Zoek breed.
Infomine – infomine.ucr.edu Een werkelijk uitstekende site met tienduizenden academische hulpbronnen op allerlei gebied. Deze site kan u helpen met het vinden van diepe websites op allerlei gebieden.
99
Hoofdstuk 5 – Internetgidsen en het diepe web
Om het meeste rendement te halen uit Infomine doet u er goed aan eerst een rubriek te selecteren en daarna het invoerveld te gebruiken om te zoeken. Gebruik stap 2 uit de zoekstrategie voor het diepe web: zoek dus op “European Union” law als u op zoek bent naar een Europese richtlijn, en niet naar Directive 95/46/EC.
Afbeelding 5.8 Selecteer voor de beste resultaten eerst een van de rubrieken voordat u een zoekwoord typt.
5h009 Google Scholar – scholar.google.com Al genoemd in hoofdstuk 3, dus waarom hier nog een keer? Simpel: Google Scholar ontsluit een deel van internet dat anders moeilijk te benaderen is: dat van wetenschappelijke artikelen. Die zijn verspreid over tientallen sites van uitgeverijen. Met Google Scholar wordt het zoeken in academische teksten bijzonder eenvoudig. De dienst heeft twee nadelen. Ten eerste moet u over inlogcodes (van een universiteit of een wetenschappelijke uitgever) beschikken om de zoekresultaten volledig te kunnen bekijken. Ten tweede doet Google nogal geheimzinnig over de omvang van Scholar. Dat laatste is lastig voor wetenschappers, die deze informatie nodig hebben om te kunnen beargumenteren hoe volledig hun literatuurzoektocht is geweest.
CompletePlanet – www.completeplanet.com Deze site komt nog steeds voor in veel overzichten van zoekmachines voor het diepe web. Helaas is de inhoud zwaar verouderd, omdat eigenaar BrightPlanet blijkbaar belangrijkere dingen te doen heeft. U ook, dus mijd CompletePlanet.
100
6
Lui zoeken
B
ent u na het lezen van de hoofdstukindeling gelijk maar hier begonnen? Gefeliciteerd, u bent een echte Hollander! Wees gerust, de titel van dit hoofdstuk is niet misleidend. Het is echt mogelijk om met bijzonder luie methoden toch zinvolle informatie te vergaren. Uiteraard zitten er wel een paar fikse adders onder het gras: de hier genoemde methoden om lui te zoeken werken niet in alle situaties en leveren zelfs in vergelijkbare gevallen met regelmaat zeer onvoorspelbare resultaten. Lui zoeken is daarom iets voor de doorzetter. Durft u nog verder te lezen?
U leert in dit hoofdstuk:
De lui-zoeken-via-Google-truc. Wat expertdiensten zijn en hoe u ze kunt benutten. Hoe u professionele documentalisten gratis voor u kunt laten werken. Met welke websites u automatisch op de hoogte blijft van veranderingen binnen Google, het wereldnieuws en in websites. Welke software u kunt gebruiken om websites in de gaten te houden.
Hoofdstuk 6 – Lui zoeken
De lui-zoeken-via-Google-truc De nu volgende truc wordt door Henk van Ess, de maker van de site Voelspriet (www.voelspriet.nl), ‘slim zoeken’ genoemd. Dat is te veel eer en bovendien enigszins misleidend, want wie deze methode gebruikt, moet zijn of haar intelligentie juist zoveel mogelijk uitschakelen. In de voorgaande hoofdstukken hebt u meermalen gehoord dat een goede zoektocht begint met een gedegen voorbereiding, die zich laat samenvatten als ‘eerst denken, dan pas wat typen bij Google’. Dat mag u nu weer vergeten. Lui zoeken vereist helemaal geen voorbereiding: u typt bij Google de zin waarmee u verwacht het gewenste antwoord aan te treffen. Een voorbeeld: als u wilt weten op welke dag John F. Kennedy werd doodgeschoten, typt u “John F. Kennedy was shot on”. In feite typt u een zin minus het ontbrekende maar gezochte feit.
Afbeelding 6.1
6h001
Lui zoeken is soms zeer effectief.
Deze truc werkt dankzij de enorme omvang van internet. Er wordt zoveel gepubliceerd op het web dat het heel waarschijnlijk is dat de door u gewenste informatie inderdaad ooit al eens is opgeschreven door iemand die er dezelfde manier van zinnen opbouwen op nahoudt als u. Enkele nadelen heeft de methode wel. Zo kunt u soms zeer onverwachte antwoorden krijgen. Zoek maar eens, analoog aan de poging de sterfdatum
102
Handboek – Internetresearch
van JFK te vinden, naar “Pim Fortuyn werd doodgeschoten op”. U krijgt nu niet de datum te zien, maar de plaats waar de moord plaatsvond. Bovendien zijn Angelsaksische zoekopdrachten in het voordeel, simpelweg omdat het web nog altijd Engels als voertaal heeft en Amerikanen een navenant groot deel van alle internetpublicaties voor hun rekening nemen. Verder leent de lui-zoeken-methode zich vooral goed voor algemene weetjes en historische feiten, maar minder goed voor zeer specifieke vragen en zoektochten naar relatief zeldzame informatie. De kans dat iemand obscure informatie in exact dezelfde zin heeft verpakt die u verzint, is vrijwel nul.
Inleiding tot expertdiensten Vergrendelt zelfs de sociaal van u afhankelijke ‘buurnerd’ de deuren als u een vraag komt stellen? Dan is het wellicht tijd om elders hulp te gaan zoeken. Dat geldt overigens ook voor lezers die gefortuneerd genoeg zijn om in een buurt zonder nerds te kunnen wonen. Via internet zijn diverse diensten te benaderen die u helpen bij het oplossen van researchvragen. Sommige daarvan zijn gratis, andere niet. Voor allemaal geldt dat degenen die de dienst aanbieden meestal niet dol zijn op al te voor de hand liggende vragen. Omwille van uzelf en degenen die na u komen geldt daarom: houd de motivatie van de mensen achter deze sites hoog door hun hulp pas te vragen wanneer het echt nodig is.
Library of Congress – www.loc.gov/rr/askalib Amerikanen zijn vrijgevochten types die het niet zo hebben op het concept ‘overheid’. De consequentie daarvan is dat overheidsdiensten meer dan in Nederland hun belastinggeld waar moeten maken, en in dit geval heeft dat geleid tot een dienst die voor researchers bijzonder handig is. De (uiteraard met Amerikaans overheidsgeld betaalde) documentalisten van de Library of Congress bieden via deze website hun niet geringe capaciteiten bij het internetpubliek aan. Gratis uiteraard, met dank aan de Amerikaanse belastingbetaler. Op gezette tijden zijn de dames en heren zelfs in speciale chatruimten aanwezig, zodat ze meteen antwoord kunnen geven op uw vraag.
103
Hoofdstuk 6 – Lui zoeken
Afbeelding 6.2 Ter bestrijding van de eenzame zaterdagavonden biedt de site ook een chatdienst aan, voor een goed gesprek van mens tot bibliothecaris.
6h002 Ask an ipl2 Librarian – www.ipl2.org/div/askus/ De dames en heren van Ask an ipl2 Librarian (ipl2) maken niet alleen een uiterst kritische internetgids (zie hoofdstuk 5), maar bieden ook een gratis antwoordservice voor moeilijke researchvragen aan. Het beantwoorden kost gemiddeld genomen meer dan drie dagen, dus bij haast is dit niet de site voor u. Ipl2 begint pas aan de klus nadat u een redelijk uitgebreid vragenformulier hebt ingevuld. Even jokken is nodig: ipl2 wil weten of u de informatie nodig hebt voor een werkstuk. Het is wellicht handig om hier ontkennend op te antwoorden, en ook verdient het aanbeveling om bij de vraag ‘How will you use this information?’ niet te vertellen dat u de kennis nodig hebt voor een zakelijke deal van 150 miljoen. De kans bestaat dat ipl2 de enigszins gerechtvaardigde conclusie trekt dat u dan zelf maar een onderzoeker moet betalen.
104
Handboek – Internetresearch
Afbeelding 6.3 Het uitgebreide formulier maakt duidelijk dat u deze site niet voor wissewasjes moet gebruiken.
6h003 People’s Network (Groot-Brittannië) – www.peoplesnetwork.gov.uk Britse bibliothecarissen proberen uw vraag te beantwoorden. Hoewel de site zich primair op Engelse en Schotse ingezetenen richt, worden ook vragen uit andere streken en landen in behandeling genomen. De dienst is bijzonder omdat u meteen een antwoord krijgt op een gestelde vraag. Dat houdt ook in dat de site openingstijden kent: van maandag tot en met zaterdag tussen tien uur ’s ochtens en zes uur ’s middags (9 tot 5 Britse tijd).
Afbeelding 6.4
Druk op ‘Enquire’ en u kunt aan de slag.
105
Hoofdstuk 6 – Lui zoeken
6h004 Ask a Librarian (Schotland) – www.nls.uk/info/readingrooms/askalibrarian.html Ook de Schotten bieden een gratis vraag-en-antwoorddienst aan. De verwerkingstijd van een vraag is lang: de site zelf houdt het erop dat de meeste vragen één tot drie weken nodig hebben om beantwoord te worden. De Schotse Ask A Librarian heeft geen probleem met vragen over genealogische bronnen, al waarschuwt de site niet de expert te zijn op dat gebied en moet u voor het daadwerkelijke genealogische onderzoek nog altijd zelf aan de slag.
Afbeelding 6.5 Deze Schotse antwoorddienst doet lang over het leveren van een antwoord.
6h005 AllExperts – www.allexperts.com Ze zullen het zelf ontkennen totdat ze blauw zien, maar een bibliothecaris weet ook niet alles. En daarom is het goed dat de website AllExperts er is, waar enkele duizenden vrijwilligers zich beschikbaar stellen om vragen op ieder denkbaar terrein te beantwoorden. Navigeren door de site gaat via een rubrieksindeling zoals u die inmiddels kent van veel internetgidsen uit hoofdstuk 5. AllExperts zegt dat de meeste vrijwilligers binnen een dag een antwoord gereed hebben – een belofte die niet altijd wordt waargemaakt. Aan de andere kant geldt: niet goed, geld terug – en AllExperts is gratis.
106
Handboek – Internetresearch
Afbeelding 6.6
Onbegrensd gratis advies uit het land van de dito mogelijk-
heden.
6h006 Answers.com – wiki.answers.com Een site met grote ambities, maar helaas ook veel huis-, tuin- en keukenvragen, soms met een hoog opendeurgehalte: ‘Waar kan ik het best antiek kopen?’ Positief is wel dat de steller van die laatste, toch niet bijster ingewikkelde vraag een serieus en vriendelijk antwoord krijgt.
Afbeelding 6.7 Nee, maar als je goed hard drukt, kun je misschien wel de siliconenvulling eruit persen.
107
Hoofdstuk 6 – Lui zoeken
6wikianswers LinkedIn Answers – www.linkedin.com/answers LinkedIn is een zogeheten social network, een plek waar mensen online hun relaties in kaart kunnen brengen, en waarover in hoofdstuk 13 meer zal worden verteld. Toch wordt LinkedIn ook hier genoemd, omdat het sociale netwerk beschikt over een vraag-en-antwoorddienst. Beperk u in de onderwerpkeuze tot zakelijke kwesties, want dat is de focus van LinkedIn.
Afbeelding 6.8 Altijd goed voor een antwoord op vragen als ‘Moet ik mijn medewerkers behandelen als militaire recruten?’
6linkedin Hunch – www.hunch.com Heeft het collectief altijd gelijk? In elk geval hebben de makers van Hunch genoeg vertrouwen in grote groepen mensen om antwoorden op vragen samen te stellen op basis van gezamenlijke voorkeuren. Hunch is ondermeer opgericht door Caterina Fake, een van de mensen achter de bekende fotografiesite Flickr.com. Een interessant experiment om in de gaten te houden.
108
Handboek – Internetresearch
Afbeelding 6.9
Ach, het is in elk geval beter dan een collectieve steniging.
6hunch Aardvark – www.aardvark.com Wie heeft het niet meegemaakt. U hebt net een nieuw huisdier, maar mensen die u vraagt wat voor mening ze hebben over uw nieuwe hangbuikzwijntje, weten er slechts uit te persen dat ze het ‘heel bijzonder’ vinden. Welnu, zoiets is de site Aardvark ook. Heel bijzonder. In theorie klinkt het perfect. Deze door Google overgenomen dienst kunt u zowel via de site als via chat (Google Talk) bedienen. U stelt een vraag en Aardvark kijkt vervolgens of er iemand te vinden is die hem kan beantwoorden. Helaas wordt de site gehinderd door een vooralsnog onvoldoende goed werkende kunstmatige intelligentie. Maar wat niet is, kan nog komen. Ook kleine hangbuikzwijntjes worden tenslotte groot. Nou ja, in elk geval groter dan ze op hun kleinst waren.
109
Hoofdstuk 6 – Lui zoeken
Afbeelding 6.10 Deze klassieker zou Aardvark toch echt uit zijn virtuele hoofd moeten kennen.
6aardvark Uclue – www.uclue.com Vroeger was er Google Answers, een dienst waar u tegen betaling mensen antwoord kon laten geven op wat moeilijker vragen. Nu is er Uclue, waar u hetzelfde kunt laten doen, en vaak door dezelfde mensen. Sommige Google Answers-onderzoekers zijn namelijk overgestapt naar Uclue toen Google de Answers-dienst ophief. Sterker nog: als u geen research deed voor Google Answers dan wil Uclue u (vooralsnog) niet hebben als onderzoeker.
Afbeelding 6.11
110
Uclue. Voor als u geen lokale researcher wilt inhuren.
Handboek – Internetresearch
6uclue Answerbag – www.answerbag.com Hebt u een vraag, gooi ’m dan in de groep. Dat is ongeveer het principe van Answerbag en het werkt. Soms. Rondom bepaalde vragen ontstaan verhelderende discussies. Helaas is niet iedereen op Answerbag geboren met een IQ van 130.
Afbeelding 6.12 Wel op Answerbag: was Jezus de Messias. Niet op Answerbag: waarom stoofpeertjesvla niet het hele jaar door verkrijgbaar is. Tja, prioriteiten. (De firma Campina mag rechtstreeks contact opnemen met de auteur.)
6answerbag Profnet – profnet.prnewswire.com Deze site richt zich op het koppelen van journalisten aan deskundigen. ProfNet beperkt zich niet tot specifiek wetenschappelijke vragen. De auteur van dit boek heeft ProfNet weleens ingeschakeld voor een verhaal in Intermediair over de effecten van spam ofwel ongewenste e-mail op de arbeidsproductiviteit. Dat leverde negen berichten op van Amerikaanse deskundigen en bedrijven, waarvan er vier bruikbaar waren.
111
Hoofdstuk 6 – Lui zoeken
De medewerkers van ProfNet zien er streng op toe dat de reacties die u krijgt zich tot uw researchvraag beperken. Dit om te voorkomen dat journalisten de dienst onbetrouwbaar gaan vinden en ProfNet zijn inkomsten kwijtraakt: de aangesloten experts moeten namelijk betalen om u te mogen antwoorden.
Afbeelding 6.13
ProfNet, voor al uw transatlantische inzichten.
6h008 MAD – www.madsci.org/submit.html Gekke geleerden bestaan echt, want anders zouden ze hun diensten niet gratis aanbieden. Er zijn wel wat haken en ogen verbonden aan het stellen van vragen via het MadSci Network. Zo mag de gestelde vraag niet al eerder op de site zijn beantwoord; geen geringe voorwaarde omdat de site al ruim 25 duizend vragen en antwoorden bevat. De site waarschuwt dan ook dat zestig tot zeventig procent van alle vragen alleen al om die reden afvalt. Stel dus alleen uw echt ingewikkelde vragen aan het MadSci Network. 6h009 Yahoo! Answers – answers.yahoo.com U hebt een domme vraag? U bent niet alleen, want op Yahoo! Answers stikt het van de types met van weinig doorzettingsvermogen getuigende vragen. Als u ook wilt weten wat de postcode is van een bepaald gebied, omdat u geen zin hebt om even te googlen op ‘postcodeboek’, dan is dit de site voor u.
112
Handboek – Internetresearch
Afbeelding 6.14
En de prijs voor ‘Site met het Hoogste Migrainerisico’ gaat
naar…
Afbeelding 6.15 Het juiste antwoord is natuurlijk dat NASA over heel stevige touwen beschikt.
113
Hoofdstuk 6 – Lui zoeken
6yahooanswers KEN – www.steljevraag.nl Hij mag dan zijn gedumpt door Barbie, in Delft is deze plastic pop nog altijd volop actief. KEN staat voor Knowledge Explosion Network en deze ietwat overdreven naam geeft aan dat er studenten bij betrokken zijn, van de Technische Universiteit Delft in dit geval. Het stellen van vragen via KEN is relatief omslachtig. Zo moet de eigenlijke vraag in twee gedeelten worden getypt, te weten een omschrijving en de vraag zelf. Daarna kijkt KEN eerst of de vraag al eens is gesteld en het antwoord dus wellicht gelijk te geven is. Zo niet, dan moet de researcher nog diverse vensters doorwerken voordat de vraag in behandeling wordt genomen. Het grootste voordeel van KEN is daarmee het Nederlandse karakter; voor internationale zoekvragen zijn er, zoals hiervoor beschreven is, betere alternatieven.
Afbeelding 6.16
vragen.
114
KEN kunt u het best gebruiken voor typisch Nederlandse
Handboek – Internetresearch
Automatisch op de hoogte blijven via websites Een expert het zware werk laten doen, is natuurlijk heel mooi. Maar het zal de efficiënte werkers onder u zijn opgevallen dat u daarvoor iedere keer naar een website moet om de vraag neer te leggen. Dat is nog wel te doen als de researchvraag steeds verschilt, maar betreft het altijd hetzelfde onderwerp, dan wordt een mens daar op lange termijn niet vrolijk van. Het zou veel aangenamer zijn als u kon volstaan met een eenmalig bezoek aan een site en voortaan altijd automatisch op de hoogte bleef van nieuwe ontwikkelingen betreffende uw researchvraag. Welnu, lang leve de automatisering: er is een aantal websites dat dergelijke diensten aanbiedt. Hieronder bespreken we er drie.
Google Alerts – www.google.nl/alerts en www.google.com/alerts Deze dienst van Google maakt het mogelijk om diverse soorten zoekopdrachten te automatiseren. U hoeft alleen te verzinnen wat u wilt weten en uw e-mailadres achter te laten. Google Alerts stuurt u vervolgens elke keer een mailtje als er nieuwe treffers op uw zoekvraag zijn gevonden. En ja, u kunt het aantal mails beperken tot één bericht per zoekvraag per dag. Google Alerts biedt de mogelijkheid om meerdere soorten zoekvragen achter te laten. Die zijn achtereenvolgens (tussen haakjes de Nederlandse variant op www.google.nl/alerts): • News (Nieuws) Hiermee zoekt u in het Google-nieuwsoverzicht, dat in hoofdstuk 3 is besproken. Via deze optie kunt u bijvoorbeeld zoekopdrachten geven om bepaalde personen of onderwerpen die regelmatig in het nieuws zijn, te blijven volgen. Dat is bijzonder handig voor journalisten, die in de loop van hun carrière vaak over tientallen of zelfs honderden mensen hebben geschreven. De optie News is ook handig om bij te blijven op uw vakgebied. Voert u bijvoorbeeld “aerospace industry” in, dan krijgt u een dagelijks overzicht met artikelen waarin dit onderwerp wordt genoemd. Let er wel op dat u bij Google Alerts-opdrachten altijd de optie once a day of once a week selecteert bij de vraag hoe vaak u e-mails wilt ontvangen. Kiest u namelijk as-it-happens en blijkt uw zoekopdracht tot bijzonder veel resultaten te leiden, dan loopt u de kans enigszins geïrriteerd te raken door de vele e-mail. Enige uitzondering: zaken waarvan u meteen op de hoogte wilt zijn. Het resultaat op de zoekvraag “terrorist attack on the United States” wilt u vermoedelijk niet pas een halve dag na het bewuste feit ontvangen. Uiteraard kunt u de optie News ook gebruiken voor privétoepassingen, zoals het volgen van uw favoriete artiest of sportclub.
115
Hoofdstuk 6 – Lui zoeken
• Blogs (geen Nederlandse tegenhanger) Bedoeld voor het zoeken in weblogs, ook wel blogs genoemd: dagboekachtige websites die meestal door particulieren worden volgeschreven. Voor meer over weblogs: zie www.arjandasselaar.nl/thefifthestate.pdf. De blogoptie is nuttig voor onder meer bedrijven, die hiermee eenvoudig in de gaten kunnen houden wat hun klanten op internet over ze zeggen. • Everything (Alles) Voor als u niet snel tevreden bent, en in alles wilt zoeken wat Google te bieden heeft. • Video (geen Nederlandse tegenhanger) Helemaal verslingerd aan filmpjes over dansende kalkoenen? Of als medewerker van Clingendael betrokken bij belangwekkende onderzoeken naar Al Qaeda? Met de juiste zoekvraag en deze optie hebt u altijd verse huppelende vogels, dan wel mensen in een bivakmuts in uw inbox. Google Alerts heeft geen limiet voor het aantal zoekopdrachten per e-mailadres. U ontvangt bovendien geen e-mail als een zoekopdracht geen resultaat oplevert, ook niet bij het gebruik van de optie once a day. Schroom dus niet om zo veel Alerts te maken als u wilt. Totdat de zoekvraag daadwerkelijk resultaat oplevert, merkt u er verder niets van.
Afbeelding 6.17 Informatieveelvraten kiezen voor Everything. Maar matigheid loont: een overvloed aan e-mails motiveert niet om ze te lezen.
Aanhalingstekens Aanhalingstekens werken bij Google Alerts net zoals bij de rest van Google: u geeft ermee aan dat u op een specifieke woordcombinatie wilt zoeken. Vergeet daarom niet om ze waar nodig toe te passen!
116
Handboek – Internetresearch
Filtermogelijkheden van uw e-mailprogramma Het nadeel van informatie per e-mail ontvangen is dat het standaard in uw Postvak IN terechtkomt en dus afleidt van uw normale werkzaamheden. Gebruik daarom de filtermogelijkheden van uw e-mailprogramma en laat berichten van diensten als Google Alerts en Google Alert automatisch in een aparte map plaatsen. Kijk daar eens per dag in. Dit zal u veel minder tijd kosten dan steeds tussendoor de postbus bijwerken.
Yahoo! Pipes – pipes.yahoo.com Voor de fijnproever met doorzettingsvermogen. Ontbreken bij u een of beide van de voorgaande kwalificaties, martel uzelf dan niet en blijf uit de buurt van Yahoo! Pipes. Deze website biedt een zeer veelzijdige methode om een eigen informatiedienst te ontwikkelen. Met Yahoo! Pipes kunt u volledig geautomatiseerd data van één of meer websites extraheren en combineren. Klinkt vaag? Dat komt omdat de mogelijkheden zo groot zijn. Een voorbeeld. Yahoo! Pipes kan zelfstandig uitzoeken wat de belangrijkste onderwerpen zijn die worden genoemd op een nieuwssite en daar vervolgens bijpassende foto’s bij zoeken en tonen op een website. Voordat u zelf een Yahoo! Pipes-applicatie hebt gebouwd, bent u een paar uurtjes verder.
Afbeelding 6.18 Schuiven met digitale LEGO-blokjes wordt het helemaal deze lente/zomer/herfst/winter (jaargetijden die niet van toepassing zijn doorstrepen).
6yahoopipes
117
Hoofdstuk 6 – Lui zoeken
Automatisch op de hoogte blijven via software Via Google Alerts is het mogelijk om nieuwe resultaten op een bepaalde zoekvraag automatisch gemaild te krijgen. Dat is echter niet altijd voldoende. Soms zult u voor bepaalde informatie afhankelijk zijn van websites van bedrijven of instellingen. Vaak gaan er weken of maanden voorbij voordat deze sites worden bijgewerkt. Over een waarschuwingsfunctie per e-mail beschikken veel van dergelijke sites niet en het is niet realistisch om deze sites regelmatig handmatig te controleren. Toch zijn er methoden om bij te houden of sites veranderen. Zo kunt u bij Google Alerts een zoekopdracht instellen als site:www.naamvanorganisatie.nl. Daardoor krijgt u automatisch een bericht wanneer Google een verandering constateert in de desbetreffende website. Echter, aan te raden is deze methode niet. Ten eerste is deze methode aspecifiek: ze staat garant voor veel valse alarmen. Wanneer de desbetreffende website een kleine, onbeduidende verandering op de pagina met adresgegevens ondergaat, krijgt u al een mailtje, terwijl u wellicht alleen geïnteresseerd bent in veranderingen op de nieuwspagina. Ten tweede worden lang niet alle websites door Google even nauwkeurig in de gaten gehouden. Internet is groot en u loopt daardoor het risico dat Google een cruciale verandering mist. Dit kunt u voorkomen door het programma Webmon (www.markwell.btinternet.co.uk/webmon/ – let op: inclusief de schuine streep aan het eind) te installeren. Dit gratis programma heeft wat minder mogelijkheden dan het hierna genoemde Website Watcher, maar daar staat tegenover dat het u geen cent kost. Ook gratis is de site ChangeDetection (www.changedetection.com). Geld over? Dan kunt u Website Watcher downloaden (www.aignes.com). Dit programma is in eerste instantie gratis. Mocht het u bevallen, dan wordt u geacht na dertig dagen de creditcard te trekken en minimaal 29,95 euro aan de maker te fourneren (49,95 euro als u niet de basisversie maar de uitgebreidere Personal Edition wilt aanschaffen). Het programma werkt zeer eenvoudig. In de titelbalk boven in Internet Explorer of Firefox verschijnt na het installeren van Website Watcher een oogje. (De maker gaf in mei 2010 aan niet te weten of het programma ooit zou samenwerken met Google Chrome.) Wanneer u op een website bent aangekomen die u voortaan regelmatig wilt laten controleren op wijzigingen, klikt u op het oogje. Website Watcher doet de rest en controleert met regelmatige, instelbare intervallen of de site is veranderd. Zeker wanneer u veel verschillende pagina’s in de gaten moet houden, bespaart Website Watcher u tijd. Bovendien bent u sneller op de hoogte van mogelijk belangrijke informatie. In tijden van een goedkope
118
Handboek – Internetresearch
dollar vormt UpdatePatrol (www.updatepatrol.com) vanwege de prijs van 69,95 dollar mogelijk een goed alternatief voor Website Watcher. Probeer wel eerst de proefversie uit, natuurlijk.
Afbeelding 6.19
Website Watcher vangt de steken op die Google Alert(s)
laat vallen.
6h011
119
7
De structuur van internet
U
hoeft geen monteur te zijn om te kunnen autorijden, maar weten waar de wielen voor dienen, verhoogt vaak het rijplezier. Zo is het ook met internetresearch. Enige basale kennis van de geschiedenis en technische opbouw van internet komt uitstekend van pas als u een betere onderzoeker wilt worden. Het lezen van dit hoofdstuk wordt des te meer aanbevolen als u zich bezig wilt houden met meer geavanceerde vormen van internetresearch, zoals bronverificatie (hoofdstuk 8) en het traceren van personen (hoofdstuk 9) en e-mailafzenders (hoofdstuk 12).
U leert in dit hoofdstuk:
Hoe internet tot stand is gekomen. Waar IP en DNS voor staan. Waarom internet niet echt bestand is tegen een kernaanval. Wat een url is en hoe deze is opgebouwd. Dat internet meer is dan alleen het WWW.
Hoofdstuk 7 – De structuur van internet
In den beginne… …was er ARPA, Advanced Research Projects Agency (www.darpa.mil), de wetenschappelijke tak van het Amerikaanse leger. (Sinds 1972 gaat ARPA als DARPA door het leven aangezien toen de D voor Defense aan de afkorting werd toegevoegd. In 1993 werd het weer ARPA, in 1996 weer DARPA.) In de jaren zestig was de Koude Oorlog op een hoogtepunt en was de angst voor een nucleaire aanval van Rusland groot. Daarom gaf ARPA in 1962 aan de denktank RAND (www.rand.org) de opdracht om een methode te bedenken voor een communicatienetwerk dat ook zou blijven functioneren tijdens een kernoorlog. Defensiespecialisten voorzagen een groot probleem. In die tijd waren communicatienetwerken nog opgebouwd volgens het zogeheten gecentraliseerde principe. Dat houdt in dat op cruciale plekken de vele kabels van een netwerk in knooppunten bij elkaar kwamen. In een
Afbeelding 7.1
Paul Baran, de man met wie internet begon.
Afbeelding 7.2 Deze RAND-studie uit 1964 laat het verschil tussen een gecentraliseerd en gedistribueerd netwerk duidelijk zien.
122
Handboek – Internetresearch
oorlogssituatie zou dat ertoe kunnen leiden dat een groot deel van de kabels nog intact zou zijn, maar het netwerk onbruikbaar zou zijn door de vernietiging van de knooppunten. fig01_07 fig02_07
RAND-medewerker Paul Baran (www.rand.org/about/history/baran.html) bedacht als oplossing daarvoor het zogeheten gedistribueerde netwerk (www.rand.org/publications/RM/RM3420). Hierin zijn geen centrale knooppunten aanwezig, en dus is het netwerk veel beter bestand tegen beschadigingen. Als een van de vele knooppunten uitvalt, kan het verkeer altijd een andere route kiezen. Om dit mogelijk te maken, maakte Baran gebruik van het zogeheten packet switching, overigens een vinding uit 1961 van Leonard Kleinrock. Bij packet switching wordt communicatie opgedeeld in kleine brokjes die hun weg door het netwerk zoeken. Pakketjes zoeken daarbij altijd de snelste route en kiezen automatisch een omleiding op het moment dat zich onderweg problemen voordoen.
Afbeelding 7.3 Een site van DARPA, een organisatie die nog altijd werkt aan ambitieuze defensieprojecten.
fig03_07
Het aan elkaar koppelen van computers mag tegenwoordig niets bijzonders meer zijn, in de jaren zestig was het dat wel. De eerste verbinding tussen computers ooit werd gelegd in 1965. Lawrence Roberts van het Massachusetts Institute of Technology koppelde toen zijn TX-2-computer aan de Q-32computer van Thomas Marill in Santa Monica. Het duurde tot 1969 voordat het huidige internet begon.
123
Hoofdstuk 7 – De structuur van internet
Dit zogeheten ARPANet bestond uit slechts vier computers op de Amerikaanse universiteiten UCLA, Stanford, de University of California Santa Barbara en de University of Utah. In de beginjaren maakten vooral wetenschappers en militairen gebruik van het netwerk. ARPANet bleek al snel populair te worden voor het communiceren met collega’s elders in het land, vooral nadat Ray Tomlinson in 1971 e-mail introduceerde. In 1972 werd e-mail gemeengoed op ARPANet.
Afbeelding 7.4
Ray Tomlinson verzond vermoedelijk de eerste e-mail ooit
via internet.
Geschiedenis van internet Wilt u meer weten over de geschiedenis van internet, dan is Where Wizards Stay Up Late door Katie Hefner en Matthew Lyon een aanrader (ISBN: 0684832674). Grote delen van de wereld merkten niets van dit alles. Internet bleef tot begin jaren negentig het terrein van wetenschappers en militairen. Niet dat er veel te beleven viel, want fraai opgemaakte websites waren destijds nog niet te zien. Sterker nog: er waren helemaal geen websites, wat pas veranderde toen in 1991 het World Wide Web werd geboren. Dat gebeurde in Genève door onderzoeker Tim Berners-Lee, die een methode zocht om grote hoeveelheden informatie aan elkaar te kunnen koppelen. Berners-Lee bedacht vervolgens de methode en de technische infrastructuur om websites en -pagina’s te maken. Dit zogeheten World Wide Web bleek een groot succes.
124
Handboek – Internetresearch
Afbeelding 7.5
Tim Berners-Lee, de vader van het wereldwijde web.
Waarom internet niet bestand is tegen een kernaanval Computers op internet vinden elkaar door middel van getallen, oftewel zogeheten IP-nummers. Deze nummers zijn enigszins vergelijkbaar met telefoonnummers. Een IP-nummer is een combinatie van vier getallen, elk met een waarde tussen 0 en 255. Een voorbeeld: 83.160.148.167 is een geldig IPadres. Iedere op internet aangesloten computer krijgt zo’n nummer, ook de uwe als u op het web surft. Dat is ook nodig: een website die informatie naar u wil versturen, moet weten waar die informatie naartoe moet. Om diezelfde reden hebben alle websites een IP-nummer. IP-nummers Een IP-nummer is niet altijd gekoppeld aan één computer. Met name mensen die internetten via een inbelverbinding (in Nederland ongebruikelijk maar in veel andere landen niet), hebben per sessie een ander IP-nummer. Kabel- en ADSL-gebruikers beschikken vaak over een IP-nummer dat lange tijd of zelfs permanent gelijk blijft. Daaruit blijkt al dat het IP-nummersysteem een groot nadeel heeft: een normaal mens wordt niet wijs uit al die getallen. U moet er vermoedelijk niet aan denken om 157.166.226.26 te moeten tikken als u naar de website www.cnn.com wilt. Om die reden is het DNS of Domain Name System bedacht. DNS is te vergelijken met een soort elektronische telefonist die het mogelijk maakt om namen aan deze IP-nummers te koppelen.
125
Hoofdstuk 7 – De structuur van internet
Op het moment dat u in uw browser een webadres als teletekst.nos.nl typt, bevraagt uw computer een zogeheten DNS-server. Deze server (oftewel centrale computer) zoekt vervolgens het bijbehorende IP-nummer op en stuurt dat terug naar uw computer. Gewapend met die kennis kan uw browser de site dan eindelijk bezoeken. Dit proces gaat zo snel dat u hier niets van merkt. DNS heeft ook een nadeel. Hoewel internet oorspronkelijk zo is ontworpen dat informatie bij schade aan het netwerk via een omweg toch aankomt, is DNS niet op deze decentrale manier opgebouwd. DNS bestaat dankzij een beperkt aantal DNS-hoofdcomputers. In totaal zijn er dertien zogeheten root nameservers, waarvan de meeste in de Verenigde Staten. In oktober 2002 werden deze DNS-hoofdcomputers aangevallen door computercriminelen. Was de aanval geslaagd, dan was internet praktisch onbruikbaar geworden. Alleen degenen die de IP-nummers van hun favoriete internetbestemmingen hadden opgeschreven of uit hun hoofd hadden geleerd – oftewel bijzonder weinig mensen – hadden dan nog op internet kunnen werken, en waren zelfs dan op grote problemen gestuit.
Afbeelding 7.6
kwam.
fig06_07
126
23 oktober 2002, de dag dat internet bijna tot stilstand
Handboek – Internetresearch
Waarom IP en DNS voor researchers toch onmisbaar zijn Zowel IP als DNS biedt een aantal grote voordelen voor researchers. Veel actieve internetgebruikers laten sporen achter in de vorm van de IP-nummers die ze gebruikten bij hun werkzaamheden op internet. Deze nummers blijven bijvoorbeeld achter bij het verzenden van e-mail, maar ook bij het participeren in discussieforums. Stel dat u op de naam van een persoon hebt gezocht via Google en terechtkomt op zo’n discussieforum, waar u niet alleen de gezochte naam aantreft maar ook een IP-nummer. U kunt nu een aantal dingen met dat nummer doen. De eerste stap is het IP-nummer tussen aanhalingstekens te zetten (bijvoorbeeld “83.160.148.167") en het in te voeren bij Google. Zo komt u wellicht op andere sites waar dit nummer is achtergelaten. Het eerder gemaakte voorbehoud over de uniciteit van een IP-nummer blijft uiteraard van kracht. Heeft de persoon die u zoekt toevallig een inbelverbinding met internet, dan is de kans groot dat niet alle treffers met hetzelfde IP-nummer ook daadwerkelijk tot die persoon behoren.
Afbeelding 7.7 Als u een aangetroffen IP-nummer tussen aanhalingstekens zet, kunt u Google laten kijken of het nummer nog op meer pagina’s voorkomt.
fig07_07
Maar er kan nog meer met een IP-nummer. Zo is het bijvoorbeeld vaak mogelijk om erachter te komen bij welke geografische locatie een bepaald IP-nummer hoort. Dat betekent dat u met behulp van een IP-nummer soms
127
Hoofdstuk 7 – De structuur van internet
degene kunt opsporen – of in elk geval een idee kunt krijgen van diens woonplaats. Meer hierover leest u in hoofdstuk 8, meer over IP en e-mail in hoofdstuk 12. Zoeken op IP-nummer Komt u een IP-nummer tegen op een discussieforum, zet het dan tussen aanhalingstekens en voer het in bij Google. Wellicht zijn er nog meer discussieforums waarop hetzelfde IP-nummer voorkomt. Houd wel in de gaten dat een IP-nummer niet altijd persoonsgebonden is. De mogelijkheden van DNS zijn minstens zo interessant. DNS bevat de namen van websites en de bijbehorende IP-nummers, maar ook de adresgegevens van de persoon die of het bedrijf dat de site in beheer heeft. Deze gegevens zijn, afhankelijk van het land, openbaar en eenvoudig op te vragen. Hoe, dat komt in hoofdstuk 8 aan de orde.
Url’s en de opbouw van webadressen De kreet url zult u op internet regelmatig tegenkomen. Deze staat voor Uniform Resource Locator en betekent zoveel als ‘de afgesproken manier om adressen op het World Wide Web op te schrijven’. Een url bestaat uit twee gedeelten, waarvan het eerste gedeelte uw browser vertelt welke taal deze met de computer aan de andere kant moet spreken. Dit zogeheten protocol is bijna altijd http://, een afkorting die staat voor HyperText Transfer Protocol, oftewel een manier om HyperText te versturen. HyperText is tekst die verwijzingen of koppelingen bevat naar andere documenten op internet, en het is een van de vindingen die het World Wide Web mogelijk maken. Het tweede gedeelte van een webadres is relevanter voor researchers. Dit is het gedeelte na http://. Begrip van de structuur van een webadres helpt u bij het systematisch kunnen doorzoeken van een site. Een voorbeeldadres ziet er als volgt uit: http://www.eenvoorbeeld.nl/hierdedirectory/hierdebestandsnaam.htm(l) In dit voorbeeld zijn de volgende onderdelen te onderscheiden: • .nl Het Top Level Domain of TLD, de benaming voor een bepaalde categorie domeinnamen. Er zijn twee soorten TLD’s: land-TLD’s, die
128
Handboek – Internetresearch
fig08_07
(inderdaad) bepalen tot welk land een TLD behoort, en zogeheten generieke TLD’s, die niet landgebonden zijn, maar vaak wel iets zeggen over de aard van de site. Zo zijn adressen die eindigen op .com oorspronkelijk bedoeld voor commerciële organisaties, en .org voor non-profitinstanties. Een oude internetgrap luidt dat directeur Jeff Bezos van het succesvolle internetwarenhuis Amazon.com zijn bedrijf diende te herdopen in Amazon.org, omdat de onderneming lange tijd geen winst maakte. De meeste generieke TLD’s staan open voor iedereen. Vier uitzonderingen op die regel zijn .mil, exclusief voor het Amerikaanse leger, .edu voor Amerikaanse onderwijsinstellingen, .gov voor de Amerikaanse overheid en .int voor internationale organisaties zoals bijvoorbeeld de Europese Unie. Verreweg de meeste variatie bestaat er bij TLD’s die bepalen tot welk land de site behoort. Voor Nederland is het TLD .nl, voor België .be en voor Duitsland .de. Een volledige lijst van alle generieke en landTLD’s treft u achterin dit boek aan bij appendix B. • eenvoorbeeld De domeinnaam, de unieke naam van een site binnen een bepaald TLD. In hoofdstuk 8 zult u leren hoe u adresgegevens bij deze domeinnaam kunt achterhalen. Sub-TLD’s Sommige landen zoals Groot-Brittannië en Australië gebruiken naast het TLD ook sub-TLD’s die bedoeld zijn om aan te geven om wat voor site het gaat. Commerciële Australische sites zijn herkenbaar aan .com.au, commerciële Britse sites aan co.uk. Iets soortgelijks geldt voor academische sites: die eindigen in Australië op .edu.au en in Groot-Brittannië op .ac.uk. Nederland kent een dergelijk gebruik niet. • www De computernaam. Het is een wijdverbreid misverstand dat alle WWW-pagina’s met www zouden moeten beginnen. Die keuze is geheel aan de eigenaar van de site. Sommige van hen kiezen ervoor om het ‘www’ in het webadres facultatief te maken. Zo is www.cnn.com net zo goed te bereiken door cnn.com te typen. Ook komt het voor dat eigenaren hun keuzevrijheid gebruiken om meerdere sites bereikbaar te maken via één domeinnaam. Het adres infomine.ucr.edu levert bijvoorbeeld een geheel andere pagina op dan www.ucr.edu. Ten slotte gebruiken met name druk bezochte sites verschillende computernamen voor dezelfde site. Wie www2.goldmansachs.com invoert, krijgt dezelfde pagina te zien als wie www.goldmansachs.com bezoekt.
129
Hoofdstuk 7 – De structuur van internet
.cx Een TLD kan u soms al veel vertellen over de betrouwbaarheid van een site. Wanneer een Amerikaans bedrijf een website exploiteert met een adres dat eindigt op .cx, moet u op uw hoede zijn. Het TLD .cx behoort toe aan Christmas Island en is voor sitebeheerders vergelijkbaar met wat Zwitserland is voor bezitters van zwart geld: een prima plek om anoniem zaken te doen. Een volledige lijst met TLD’s staat in appendix B.
Afbeelding 7.8 Christmas Island, met tropische stranden, zoete cocktails en vage domeinnamen.
Afbeelding 7.9 Een aanzienlijk leesbaarder versie van de TLD-lijst treft u achter in dit boek aan.
130
Handboek – Internetresearch
fig09_07
• hierdedirectory De map op de computer waarin de gezochte informatie staat. Dit kunt u vergelijken met de namen van mappen binnen Microsoft Windows. Ook daarin gebruikt u vermoedelijk verschillende mappen om informatie te structureren. Om diezelfde reden gebruiken veel sites meerdere mappen om het beheer overzichtelijk te houden. • hierdebestandsnaam.htm(l) De naam van het bestand dat u wilt bekijken. De naam van een bestand kan op talloze lettercombinaties eindigen, zogeheten extensies. Een veelvoorkomende is .htm of .html. Dat staat voor HyperText Markup Language, de opmaaktaal van webpagina’s. In hoofdstuk 3 zijn diverse andere bestandssoorten besproken, zoals .pdf, .xls en .doc. Andere extensies die u vaak tegen zult komen zijn .asp (een Microsoft-programmeertaal) en .php (een gratis alternatief voor .asp). Tilde in webadres Bevat een webadres een tilde (~, als in www.xs4all.nl/~jandevries), dan gaat het vrijwel altijd om een persoonlijke pagina. De inhoud zeer kritisch beschouwen is aan te raden, want de autoriteit is lastiger te verifiëren. De eigenaar van de domeinnaam (XS4ALL in dit voorbeeld) is namelijk vrijwel nooit verantwoordelijk voor de inhoud. Zoeken in de database van domeineigenaren, waarover u in hoofdstuk 8 meer leest, heeft in dit soort gevallen minder zin. Tildes raken overigens steeds meer in onbruik, maar bij XS4ALL komt u ze nog altijd tegen.
Het ontleden van websites Stel: uw zoektocht naar een beleidsnotitie over de Leidschendammer-hout heeft u via Google op de volgende webpagina doen belanden: http://www.xs4all.nl/~sjaak/vwgvl/politiek/bancken.html. U wilt meer te weten komen over de persoon achter deze pagina. In hoofdstuk 8 zult u meer geavanceerde methoden leren om de autoriteit en authenticiteit van een pagina te kunnen bepalen, maar ook van de url vallen al twee dingen af te lezen: • De pagina draait op een computer van de internetaanbieder XS4ALL. Dit kunt u vaststellen door de domeininformatie op te vragen (zie hoofdstuk 8) of door enkel het eerste deel van de site in de adresbalk van de browser in te voeren en de site te openen (http://www.xs4all.nl). • De tilde (~) geeft aan dat het hier om een persoonlijke pagina gaat. De pagina is dus eigendom van een zekere Sjaak of althans iemand die zich zo noemt.
131
Hoofdstuk 7 – De structuur van internet
Vaak heeft het in dergelijke gevallen zin om met het webadres te spelen om er zo achter te komen of er elders op de site meer informatie over de achtergronden van de maker is te vinden. De auteur van dit boek hanteert daarvoor de ‘Chinese methode’, die eruit bestaat om systematisch van achteren naar voren het webadres in te korten.
Afbeelding 7.10 In een hypothetisch scenario bent u via Google op deze pagina terechtgekomen.
fig10_07
• Eerst haalt u het laatste stukje van de url weg. In plaats van op www.xs4all.nl/~sjaak/vwgvl/politiek/bancken.html komt u dus terecht op www.xs4all.nl/~sjaak/vwgvl/politiek.
Afbeelding 7.11 Door het laatste gedeelte van het webadres weg te halen, komen we hier terecht. Dit is geen internetpagina, maar een zogeheten open directory, oftewel een inkijkje in de computer waarop de site draait.
fig11_07
132
• Daar ziet u een zogeheten open directory. U kijkt als het ware rechtstreeks in de computer waarop de internetpagina’s zijn gehuisvest. Traditioneel zorgen sitebeheerders ervoor dat dit niet kan gebeuren: hieruit
Handboek – Internetresearch
kunt u dus afleiden dat de heer Sjaak of degene die zijn site technisch verzorgt, weinig verstand heeft van computers. Nog wat verder inkorten brengt u op www.xs4all.nl/~sjaak/vwgvl. U kunt ook op Parent Directory klikken. • Op www.xs4all.nl/~sjaak/vwgvl blijkt dat Sjaak actief is in de Vogelwerkgroep Vlietland. Daaruit mag blijken dat de informatie op zijn site en de selectie daarvan niet per se apolitiek zal zijn. Uitkijken dus!
Afbeelding 7.12 Weer een korter internetadres, en nu komen we uit op wat de hoofdpagina lijkt te zijn.
fig12_07
• Onder aan de pagina staat zijn naam: Sjaak Schilperoort. Daarop klikken levert een korte biografie op. Veel internetgebruikers lijden onder een al dan niet milde egomanie waardoor op bijna iedere hobbyistische of persoonlijke site informatie over de maker is te vinden. • Nog één stapje verder: ga naar www.xs4all.nl/~sjaak. Als u op een van de vogeltrips klikt, komt u nogmaals bij zijn e-mailadres uit.
Afbeelding 7.13 Na een laatste keer inkorten, blijkt dat Sjaak toch nog meer informatie op de site heeft staan. Waaruit blijkt dat het kan lonen om door te spitten.
fig13_07
133
Hoofdstuk 7 – De structuur van internet
• Gaat u nog een stap naar beneden, en voert u www.xs4all.nl in, dan eindigt u op de site van de internetaanbieder. Zoals hiervoor al gezegd, had u dat al kunnen afleiden uit de tilde (~). • U kunt nu teruggaan naar het hoofdvenster van de eigenlijke site. Deze bevond zich op www.xs4all.nl/~sjaak/vwgvl. Vanaf hier kunt u via de menustructuur links systematisch de hele site doorwandelen. Als u dat niet doet vanaf het hoofdvenster, loopt u de kans dat u zaken over het hoofd ziet.
Voorbij het WWW Dat internet niet hetzelfde is als het World Wide Web, is u inmiddels genoegzaam duidelijk. Internet is niets meer of minder dan een verzameling kabels waarover wereldwijd computers met elkaar praten. Het World Wide Web is een van de vele toepassingen die van die kabels gebruikmaakt. Maar er zijn er veel meer. Een bloemlezing. • E-mail Bestaat op internet sinds 1972. Is niet alleen een populaire methode voor communicatie tussen twee personen, maar zeker ook om groepen gelijkgestemden te binden. Dat gaat met behulp van mailinglijsten. Twee varianten zijn interessant: de nieuwsbrief (met één afzender, veel geadresseerden) en de discussielijst (alle geadresseerden zijn ook potentiële afzenders). • Usenet Sinds 1982 verkrijgbaar in Europa. Usenet is een verzameling van digitale prikborden waarop geïnteresseerden met elkaar kunnen discussiëren of informatie kunnen uitwisselen. Usenet-discussies kunnen veel trager verlopen dan die via mailinglijsten. Berichten worden namelijk als een soort Post-it-memo opgehangen. Andere geïnteresseerden kunnen er hun eigen kattebelletje onderhangen wanneer hen dat schikt, of dit nu een minuut, een dag, een week of een jaar later is. Een ander verschil met mailinglijsten is dat Usenet aanzienlijk meer mogelijkheden tot anonimiteit biedt. Vrijwel alle Usenet-forums zijn vrij toegankelijk zonder aanmelding. • IRC Oftewel: Internet Relay Chat. Een van de oudste bekende methoden om digitaal te kletsen, in 1988 ontwikkeld door de Fin Jarkko Oikarinen (www.kumpu.org). Discussiëren gebeurt op zogeheten channels, ofwel kanalen. Op IRC hangen veel nerds rond, maar om diverse technische redenen is IRC ook een ideale vrijhaven voor minder frisse groepen zoals pedofielen, hooligans, criminelen en zelfs terroristen (zie hiervoor het Handboek Digitale criminaliteit van dezelfde auteur).
134
Handboek – Internetresearch
Afbeelding 7.14
fig14_07
Knakworst, de gezondste groente van Finland.
• IM Ook wel Instant Messaging genoemd. Moderne chatprogramma’s als Google Talk, Windows Live Messenger, Yahoo! Messenger en ICQ zijn allemaal IM-programma’s. Ze verschillen van IRC door de manier waarop gesprekspartners worden gesorteerd. IM-programma’s werken daartoe meestal met lijsten van bekenden. Ook zijn IM-programma’s gemiddeld genomen gebruiksvriendelijker dan IRC. • FTP File Transfer Protocol. Een methode voor het verzenden en ontvangen van digitale bestanden. FTP wordt vooral gebruikt voor het transport van grote hoeveelheden informatie. • Peer to peer-sharing (P2P) Recent populair geworden technologie waarbij een groep internetgebruikers (peers) een deel van de eigen computer openstelt voor anderen (sharing) en zo onder meer muziek- en videobestanden uitwisselt. Programma’s als KaZaA, BitTorrent en eMule hebben P2P berucht gemaakt bij met name de platenindustrie. • Telnet Antiek systeem uit de tijd dat de pc nog niet alomtegenwoordig was. Wordt gebruikt om een zich elders bevindende computer op afstand te bedienen. De eigen computer, van waaraf het Telnet-programma wordt gedraaid, wordt in die situatie gedegradeerd tot toetsenbord en dient enkel nog om instructies te geven aan de computer op afstand. Telnet dateert uit de tijd dat computers nog simpel waren en weinig capaciteit hadden, en dus alleen nut hadden als afstandsbediening (of zogeheten terminal) voor de ‘echte’ computer (de zogeheten server of het mainframe) op afstand. Tegenwoordig alleen nog gebruikt door nerds.
135
Hoofdstuk 7 – De structuur van internet
Enkele van deze internettoepassingen zijn in het bijzonder interessant voor de researcher. Daarom komen deze in latere hoofdstukken uitgebreid aan de orde. Het zijn: • Usenet Hoe u moet zoeken op Usenet leest u in hoofdstuk 11. • E-mail Alles over e-mail als informatiebron staat in hoofdstuk 12. • IRC en Instant Messaging Hoe u chatdiensten kunt gebruiken om meer informatie over personen en minder frisse bevolkingsgroepen te vergaren, leert u in hoofdstuk 13.
136
8
Bronverificatie
H
et is geen paranoia te denken dat ze écht achter u aanzitten. Oftewel: het loont om wantrouwend te zijn op internet. Vaak is het niet duidelijk wie verantwoordelijk is voor een bepaalde site, en daardoor kunt u aardig miskleunen. Toch is het mogelijk om ook internetinformatie aan een grondige controle te onderwerpen.
U leert in dit hoofdstuk:
Het nut van bronauthenticatie waarderen dankzij diverse historische blunders. Wat de ‘Paaseierenregel’™ is. Wat de WHOIS-database is en hoe haar te gebruiken. Hoe u erachter komt wat andere sites van een dubieuze site vinden. Wat traceroutes en reverse DNS-scans zijn.
Hoofdstuk 8 – Bronverificatie
Fameuze blunders ‘Al-Qaeda ontplooit telemarketingactiviteiten in de Verenigde Staten.’ Het klonk al niet erg waarschijnlijk, het bericht in de Amerikaanse krant The Onion, waarin werd gemeld dat de organisatie van Bin Laden tegenwoordig burgers terroriseert met aanbiedingen van goedkope leningen, bij voorkeur rond etenstijd. Toch bleek een Amerikaanse sheriff uit de staat Michigan de site serieus genoeg te nemen om een waarschuwing de wereld in te sturen. De man liet een persbericht uitgaan om met name ouderen te waarschuwen voor de vermeende gevaarlijke telefoontjes. Helaas voor de sheriff: The Onion is de grootste satirische krant van de Verenigde Staten.
Afbeelding 8.1
Al-Qaeda dringt werkelijk tot alle lagen van de samenleving
door.
8h001
138
Deze sheriff kan zich troosten met de gedachte dat hij niet de enige is die zich laat bedriegen. Toen de Nederlandse website www.geenstijl.nl, bekend om zijn minder subtiele berichtgeving, er in april 2004 (naar later bleek tijdelijk) mee ophield, gebeurde dat met een grap. Geenstijl maakte bekend dat een van zijn medewerkers in elkaar zou zijn geslagen vanwege het politiek
Handboek – Internetresearch
rechtse karakter van veel berichten. De verontwaardiging was groot, en de internetnieuwswebsite Webwereld.nl wijdde er een bericht aan. Totdat bleek dat het verhaal verzonnen was: een poging van de makers van Geenstijl om met een ‘stijlloze’ grap de site uit te zwaaien.
Afbeelding 8.2 Zelfs professionele internetjournalisten zijn soms niet in staat het verschil tussen nep en echt op internet te bepalen.
Afbeelding 8.3
De stijlloze site van Geenstijl.
139
Hoofdstuk 8 – Bronverificatie
8geenstijl 8h002
Een laatste voorbeeld komt uit Canada. Daar bleek een antihomoseksuele organisatie een groot ‘wetenschappelijk’ rapport te hebben geproduceerd waaruit zou blijken dat homoseksuelen scholen gebruiken als rekruteringsgebied voor nieuwe roze aanwas. Helaas kwam deze informatie ook uit The Onion. Dat de desbetreffende antihomo-organisatie vervolgens zei zeven weken te hebben besteed aan internetresearch voordat ze hun rapport publiceerden, maakte hen niet geloofwaardiger. Het geeft tevens aan dat u op internet niet voorzichtig genoeg kunt zijn.
Ook dit satirische artikel van The Onion trok de belangstelling van goedgelovige lezers.
Afbeelding 8.4
De Paaseierenregel™ Het voordeel van internet is dat iedereen er zijn ei kwijtkan. Dat zorgt ervoor dat u op internet informatie kunt vinden die soms nergens anders te krijgen is. Het nadeel van internet daarentegen is dat iedereen er zijn ei kwijtkan. En soms zitten er een hoop rotte, zwavelrijke exemplaren tussen al die eieren. Om te controleren of informatie op internet deugt, hanteert de auteur de door hemzelf verzonnen Paaseierenregel™.
140
Handboek – Internetresearch
Deze luidt als volgt: één bron is geen bron, twee bronnen zijn een halve bron, drie bronnen vormen een bron. Dit betekent dat u informatie die u op slechts één website tegenkomt niet moet vertrouwen. Gezien het grote aantal personen dat op internet klakkeloos van elkaar overschrijft, is twee bronnen ook niet genoeg. Pas wanneer u drie keer de desbetreffende informatie op verschillende websites aantreft, is er een redelijke kans dat de aangetroffen feiten kloppen, en dan nog alleen als duidelijk is wie er achter de desbetreffende websites zit. Hoe u die moet opsporen, komt verderop aan de orde.
Sites die niet zijn wat ze lijken In het voorgaande gedeelte is gewezen op het belang van bekendheid met de bron. Wie niet weet wie achter bepaalde informatie schuilgaat, loopt een groot risico de mist in te gaan. De kwaliteit van de bron is immers minstens zo belangrijk als de kwantiteit. De website van The Onion (www.theonion.com) ziet er bijvoorbeeld uit als die van een serieuze internetpublicatie. Alleen de – overduidelijk ironische – teksten geven aan dat het hier om een parodie gaat. Soms is het bedrog subtieler. Kijkt u bijvoorbeeld eens op www.martinlutherking.org.
Afbeelding 8.5
Deze site lijkt op het eerste gezicht een serieuze site te zijn.
141
Hoofdstuk 8 – Bronverificatie
8h004
Dit lijkt een serieuze website over Martin Luther King. De vormgeving van de site oogt professioneel – en dat is logisch, voor wie weet dat deze precies hetzelfde is als de vroegere site van de erven van dr. King. De personen erachter zijn echter lid van een Amerikaanse neonaziorganisatie. Dat werpt, voorzichtig uitgedrukt, een heel ander licht op de kwaliteit van de informatie. Bij de volgende website is het bedrog iets duidelijker.
Afbeelding 8.6
8h005
Niet de echte website van het Witte Huis.
Deze website is, voor alle duidelijkheid, niet de officiële pagina van het Witte Huis. De auteur heeft echter voldoende cursisten voorbij zien komen die, geconfronteerd met deze site, toch meenden dat George W. Bush ervoor verantwoordelijk was. De volgende website lijkt een bijzonder doorzichtige grap te bevatten voor wie ooit scheikunde in zijn pakket heeft gehad. In de praktijk valt dat tegen.
Afbeelding 8.7
142
Terwijl je toch aan je water voelt dat er iets niet klopt.
Handboek – Internetresearch
8h006
De website Dihydrogen Monoxide Research Division pretendeert een waarschuwende functie te hebben tegen de gevaren van ‘dihydrogen monoxide’. Dat waarschuwen gebeurt met paniekerige uitspraken, zoals de mededeling dat dihydrogen monoxide in vrijwel alle soorten kanker een rol van betekenis speelt. Dit klopt. Wat de site niet meldt, is dat dihydrogen monoxide de chemische naam is voor H2O, oftewel water, een stof die noodzakelijk is voor al het leven, dus ook voor kankercellen. Het was niettemin genoeg aanleiding voor de gemeenteraad van de milieubewuste Californische stad Aliso Viejo om wegwerpbekers te willen verbieden, omdat bij de productie daarvan dihydrogen monoxide wordt gebruikt. De moraal Vertrouw een site nooit zonder voorbehoud. Zelfs een professioneel uitziende pagina kan onjuiste, gekleurde of manipulatieve informatie bevatten. Doe daarom bij een eerste kennismaking met een site alle mogelijke autoriteitscontroles die in dit hoofdstuk worden besproken.
WHOIS, of: de personen achter een website Omdat het op internet stikt van de bedrieglijke en onjuiste informatie, is het van groot belang om de personen of organisaties achter een website te kunnen traceren. In dat geval kunt u ze per e-mail of telefoon om opheldering vragen. Soms kan zelfs de naam van een persoon of organisatie al genoeg duidelijkheid verschaffen over de accuratesse, betrouwbaarheid of onpartijdigheid van een website. Een site met negatieve verhalen over varkensvlees die op naam staat van een veganistische organisatie, moet wellicht met wat meer scepsis worden bekeken dan een site met kritische verhalen over vlees die zijn verzameld door de Consumentenbond. De adresgegevens van sitebezitters zijn over het algemeen redelijk eenvoudig te traceren. Iedereen die een domeinnaam (zie hoofdstuk 7) aanvraagt, moet zijn of haar adresgegevens laten opslaan in de zogeheten WHOIS-database. Deze database is openbaar. Zoals in hoofdstuk 7 aan de orde is gekomen, kent internet vele verschillende Top Level Domains of TLD’s. Ieder TLD heeft zijn eigen WHOISkaartenbak. Dat houdt dus eigenlijk in dat u voor de adresgegevens van een Franse website een andere WHOIS-dienst zou moeten gebruiken dan voor een Belgische pagina. Om dergelijke omslachtige zwerftochten te voorkomen, zijn er diverse websites die in alle TLD’s ter wereld kunnen zoeken. Dergelijke websites worden verderop besproken.
143
Hoofdstuk 8 – Bronverificatie
Het traceren van adressen van Nederlandse domeinbezitters is een verhaal apart. In principe zijn de verderop genoemde diensten in staat om in de WHOIS-databases van alle landen ter wereld te zoeken, en dus ook de Nederlandse. Echter, de toegang tot deze database is flink ingeperkt door de Stichting Internet Domeinregistratie Nederland (SIDN), verantwoordelijk voor de uitgifte van domeinnamen en de WHOIS-database in dit land. De SIDN staat het gebruikers van haar database sinds begin 2010 uit privacyoverwegingen niet langer toe om adresgegevens op te vragen. De SIDN heeft een traditie van roomser-dan-de-paus-gedrag (googlet u maar eens op ‘Stichting Internet Domeindominatie Nederland’) en deze maatregel is geen uitzondering. Want op het moment dat deze vijfde editie naar de drukker ging, was het nog wel mogelijk om van bijvoorbeeld Belgische websites de WHOISgegevens te achterhalen. De door SIDN verstrekte Nederlandse WHOIS-gegevens zijn echter sterk beperkt. U kunt alleen nog de naam en een mailadres krijgen van de persoon of organisatie achter de site, en niet langer het telefoonnummer. Dat is erg jammer, want juist dat telefoonnummer was bijzonder handig bij het bereiken van bedrijven die zich op hun websites verschuilen achter ingewikkelde contactformulieren en dure betaalnummers. Gelukkig maakt het vermelden van de naam door SIDN het nog wel mogelijk om aan bronverificatie te doen: u weet in elk geval of de site is van de persoon die zegt de eigenaar van het domein te zijn. Wilt u toch nog Nederlandse WHOIS-gegevens achterhalen, dan zult u met papieren van opsporingsinstanties moeten komen (zie https://www.sidn.nl/ en/about-nl/whois/whois-access-for-investigative-agencies/). Of registrar worden. Oftewel: u bij SIDN aansluiten als domeinuitgevende instantie. Dat kost geld: 205 euro exclusief btw per kwartaal (in 2010). En er is een ander nadeel. Hoewel nog geen Nederlandse journalistieke organisatie hieraan heeft gewaagd, is het goed mogelijk dat deze sluiproute door SIDN snel zal worden dichtgetimmerd op het moment dat bijvoorbeeld een krant besluit het registrar-schap aan te vragen. Maar u kunt het proberen – 820 euro exclusief btw is jaarlijks best op te brengen door een beetje bedrijf. (Het zal niet voor niets zijn dat op de registrar-lijst van de SIDN ook namen staan van communicatiebureaus.) De SIDN kent nog een beperking. U mag slechts tien WHOIS-zoekvragen per dag stellen. Voor u als particuliere gebruiker is dat ruim voldoende. Maar als u via een gespecialiseerde website zoals centralops.net de zoektocht begint in de SIDN-kaartenbak, denkt de SIDN niet dat u de aanvraag doet, maar de betreffende site. U kunt zich voorstellen dat u niet de enige gebruiker bent van die gespecialiseerde site, en dat de kans vrij groot is dat er zich eerder op de dag reeds tien andere Nederlanders hebben gemeld met een
144
Handboek – Internetresearch
vraag voor de Nederlandse WHOIS. In dat geval bent u het best af wanneer u de zoekopdracht rechtstreeks voorlegt aan de site van de SIDN, om zo uw eigen quotum van tien WHOIS-zoekvragen per dag aan te kunnen spreken. De informatie in de WHOIS-database hoeft overigens niet altijd accuraat te zijn. Waar in Nederland de SIDN streng toeziet op het invullen van de juiste gegevens, is er meer dan één Amerikaanse website waarvan de eigenaar op 123 Sesame Street woont. Voor het bepalen van de betrouwbaarheid van een website maakt dit echter niet zoveel uit. Wanneer een site-eigenaar overgaat tot dergelijk overduidelijk bedrog, belooft dat immers niet veel goeds voor de accuratesse van de site zelf. Mogelijke uitzonderingen zijn websites van politieke dissidenten of andere personen die in de problemen kunnen komen wanneer hun identiteit bekend raakt. In dergelijke extreme gevallen hebt u echter sowieso een probleem, aangezien zulke informatie vrijwel nooit te verifiëren is. Omdat de WHOIS-dienst veel wordt gebruikt, zijn de sites die het mogelijk maken om in WHOIS te zoeken, niet altijd even goed bereikbaar. Er wordt hier dan ook een aantal van dergelijke diensten besproken. De werking is steeds hetzelfde en wordt daarom alleen bij de eerste dienst toegelicht. Samengevat bevatten de WHOIS-gegevens vier soorten informatie: • Geregistreerde/registrant De persoon of organisatie op wiens naam het desbetreffende domein is geregistreerd. • Administratieve contactpersoon/administrative contact/admin De persoon of organisatie die verantwoordelijk is voor het dagelijkse beheer van de inhoud van de site en de rekeningen voor het domein betaalt. • Registrator/registrar De partij of het bedrijf op wiens autoriteit de domeinnaam is aangevraagd.
Afbeelding 8.8 De SIDN heeft begin 2010 de toegang tot de Nederlandse WHOIS flink beperkt.
145
Hoofdstuk 8 – Bronverificatie
• Technische contactpersoon/technical contact/tech De persoon of het bedrijf verantwoordelijk voor het technische beheer van de domeinnaam. Pas op: heeft vaak niets met de inhoud van de site te maken. Het moge duidelijk zijn dat voor researchdoeleinden vooral de gegevens van de registrant en de administrative contact van belang zijn. Vaak zijn deze twee overigens hetzelfde. 8wijzigingen AllWhois – www.allwhois.com Om adresgegevens van een domeinnaam te achterhalen, voert u deze zonder toevoegingen als www in bij het veld Check Any Domain in the World.
Afbeelding 8.9 De site AllWhois. De naam van het siteadres vult u zonder www in achter www.
8whois1
146
In het bovenstaande voorbeeld voert u het adres in van de inmiddels bekende neonazisite over Martin Luther King, zonder de toevoeging www. Dat wordt dus martinlutherking.org. Klik vervolgens op Search. U krijgt dan het volgende venster te zien.
Handboek – Internetresearch
Afbeelding 8.10
De zoekresultaten verschijnen in het aanvankelijk lege
witte veld.
8whois2
Zoals u ziet, is er in het aanvankelijk lege witte veld nu allerlei tekst verschenen. Het eerste gedeelte daarvan is niet zo interessant, maar wanneer u in het veld naar beneden scrollt, krijgt u het volgende te zien.
Afbeelding 8.11 Door naar beneden te scrollen, krijgt u interessantere informatie te zien. Let vooral op de informatie bij Registrant.
147
Hoofdstuk 8 – Bronverificatie
8whois3
De naam Don Black duikt op, net als de organisatie Stormfront, een club die meestal niet met een voorliefde voor charismatische zwarte leiders wordt geassocieerd. Het woord registrant betekent dat het gaat om de persoon en de organisatie op wiens naam de domeinnaam is geregistreerd. Als u verder scrollt, ziet u dat WHOIS een tweede categorie adresgegevens bevat.
Afbeelding 8.12
De gegevens bij Admin komen vaak overeen met die bij
Registrant.
8whois4
De Admin-gegevens laten zien wie er verantwoordelijk is voor het dagelijkse beheer (administration) van de site. Niet iedere partij die ooit een site op zijn naam wilde zetten, heeft ook de tijd of de behoefte om de inhoud te verzorgen; reden waarom de Registrant en de Admin twee verschillende personen of organisaties kunnen zijn.
Afbeelding 8.13 Stormfront blijkt zelf verantwoordelijk voor het technische beheer van de site. Vaak wordt dit uitbesteed.
148
Handboek – Internetresearch
8whois5
Deze Tech-gegevens vertellen u welke partij of persoon verantwoordelijk is voor de technische realisatie van de website. In dit geval lijkt Stormfront zijn eigen technische zaakjes op te knappen, maar in de meeste gevallen is dit een andere organisatie dan degene die de site daadwerkelijk gebruikt. De Registrar-gegevens ontbreken in dit voorbeeld grotendeels: in afbeelding 8.11 is enkel de Sponsoring Registrar te zien, met een codenummer. Bij de uitleg van de website van de SIDN komen de volledige gegevens van de Registrar wel aan bod.
CentralOps – centralops.net/co/ Een alternatief voor AllWhois, maar met diverse extra’s. De functie Domain Dossier biedt de mogelijkheid om naast de adresgegevens uit WHOIS ook allerlei andere informatie te vergaren, zoals de geografische locatie van de website, een functie die overigens niet altijd even goed werkt. Hebt u geen behoefte aan al dat soort poespas, zoek dan met de functie Auto Whois.
Afbeelding 8.14 De functie Auto Whois staat in de linkermenubalk, en ook aan de onderkant van het venster; Domain Dossier vindt u bovenaan.
8h007 SIDN-whois – https://www.sidn.nl/nc/over-nl/whois/ Via deze pagina, die u het best als de bliksem kunt bookmarken, kunt u adressen behorend bij Nederlandse domeinnamen achterhalen. In dit geval nemen we de website www.arjandasselaar.nl als voorbeeld. Schakel allereerst het vakje Uitgebreid zoeken in. Bij Domein vult u alleen arjandasselaar in, zonder www en zonder nl op het eind.
149
Hoofdstuk 8 – Bronverificatie
Afbeelding 8.15
8h008
Vervolgens klikt u op Zoek. Dat levert het volgende resultaat op.
Afbeelding 8.16
bij AllWhois.
150
Vergeet niet Uitgebreid zoeken te selecteren.
Het resultaat van de WHOIS bij de SIDN lijkt veel op dat
Handboek – Internetresearch
8h009 Alternatief voor SIDN – tools.webtic.nl/domein_nl.php Bent u door uw raadpleegbeurten voor de officiële Nederlandse WHOIS van de SIDN heen? Ga dan naar deze site. Niet alleen is het adres net iets makkelijker te typen, u kunt ook in redelijkheid hier terecht voor WHOISinformatieaanvragen als de SIDN daar geen gelegenheid meer toe biedt.
Gerelateerde WHOIS-diensten In sommige, toegegeven, zeldzame gevallen kan het nuttig zijn om te weten te komen welke domeinnamen lijken op die waarvan u de gegevens zoekt. U wilt bijvoorbeeld weten welke domeinnamen er nog meer zijn waarin het woord ‘Janssen’ voorkomt. Er is dan een site die u daarbij kan helpen.
Domain Tools Suggestions – domain-suggestions.domaintools.com Zoekt in .com, .net, .org, .info, .biz en .us-domeinen. Voorbeeld: als u Coca Cola typt, laat Domain Tools zien in welke domeinnamen deze woorden voorkomen. De resultaten worden weergegeven in de vorm van een matrix. De in gebruik zijnde domeinen kunt u herkennen aan de grijze bolletjes. Op deze bolletjes klikken, levert u de WHOIS-informatie voor de desbetreffende domeinnaam op. Domain Tools verzint ook een flink aantal nietbestaande domeinnamen, met het doel deze aan u te verkopen.
Afbeelding 8.17 De vakjes met bolletjes geven aan dat het hier om in gebruik zijnde domeinnamen gaat.
151
Hoofdstuk 8 – Bronverificatie
Deel van de sitenaam Domain Tools is prima te gebruiken als u een bepaalde site zoekt, maar de exacte naam bent vergeten. Met een deel van de sitenaam komt u er vaak toch nog uit.
Siteautoriteit: zoeken naar een second opinion In de echte wereld staan u tal van hulpmiddelen ter beschikking om uw mening te vormen over de betrouwbaarheid van een persoon of instantie. Wanneer u meer wilt weten over de reputatie van een persoon, kunt u diens vrienden, kennissen, collega’s en zakenrelaties benaderen. Bij instanties zijn er vaak brancheorganisaties en verwante instellingen waar u navraag kunt doen. Op internet is iets soortgelijks mogelijk: u kunt kijken naar wat andere sites van de site vinden die u als informatiebron wilt gaan gebruiken. Veel zoekmachines houden bij welke sites verwijzingen hebben opgenomen naar andere sites. Die informatie kunt u opvragen. Daaruit kunt u twee dingen afleiden: • Aantal verwijzende pagina’s Een site die claimt een autoriteit te zijn op het gebied van koningin Beatrix, maar waarnaar slechts twee andere sites verwijzen, is vermoedelijk niet zo geliefd als de maker zou willen. • Aard van de verwijzende pagina’s Een site over koningin Beatrix waarnaar honderden andere sites verwijzen, kan nog altijd onzin bevatten. Het is bijvoorbeeld heel goed mogelijk dat de site in kwestie een zeer populaire parodie bevat. Vaak wordt dit duidelijk gemaakt op de verwijzende pagina’s. Er zijn twee methoden om erachter te komen welke sites naar een bepaalde site verwijzen.
Rechtstreeks via een zoekmachine Deze methode vergt enig handwerk. Er zijn twee zoekmachines die u hierbij in het bijzonder van dienst kunnen zijn: Google (www.google.com) en Yahoo! (www.yahoo.com). Bij zowel Google als Yahoo! typt u link:www.naamvansite.com, waarbij op de plek van naamvansite.com uiteraard de domeinnaam van de te onderzoeken site komt te staan. Om de meest volledige resultaten te krijgen, is het aan te raden om zowel op link:www.naamvansite.com als link:naamvansite.com te zoeken. Niet iedere site heeft koppelingen naar andere sites netjes op orde en daarom worden de verwijzingen soms met en soms zonder www geschreven.
152
Handboek – Internetresearch
Yahoo! gaat wat anders om met het link:-commando dan Google. De site stuurt u door naar de Yahoo! Site Explorer (siteexplorer.search.yahoo.com). Het link:-commando invoeren vanaf de homepage (www.yahoo.com) invoeren werkt echter sneller, omdat u dan minder handelingen hoeft te verrichten. Wanneer u de domeinnaam invoert bij Site Explorer moet u daarna nog doorklikken op het knopje Inlinks om hetzelfde resultaat te krijgen.
Afbeelding 8.18
Bij Google gebruikt u de opdracht link:.
Afbeelding 8.19
Hetzelfde geldt voor Yahoo!.
153
Hoofdstuk 8 – Bronverificatie
Voor alle zoekopdrachten geldt dat u meer resultaten krijgt als u verschillende zoekmachines om raad vraagt. Anders dan in de meeste andere gevallen kunt u in dit geval echter niet volstaan met Google. Meestal geeft Yahoo! juist meer verschillende resultaten. link: De opdracht link: is niet alleen bruikbaar om een second opinion over een bepaalde site te krijgen. U kunt deze opdracht ook gebruiken om meer interessante sites over een bepaald onderwerp te vinden. Als u via Google op link:www.volkskrant.nl zoekt, is de kans groot dat u sites tegenkomt waar de website van de Volkskrant is opgenomen in een overzicht met soortgelijke sites. Het spreekt voor zich dat deze sneeuwbalmethode nuttig kan zijn bij het doen van research naar onderwerpen waarover u nog maar weinig sites hebt kunnen vinden. Met een beetje geluk kunt u met link: zo in één klap uw sitecollectie uitbreiden.
Via Submit Express – tools.marketleap.com/publinkpop De website Submit Express bevraagt diverse zoekmachines zoals Google en Yahoo! automatisch. Daarna krijgt u een overzicht van het aantal aangetroffen links naar de door u gespecificeerde site(s). Tevens biedt Submit Express in het overzicht een aantal bekende sites met hun linkscores, die u als referentie kunt gebruiken. Voor de aard van de verwijzingen moet u echter nog steeds doorklikken naar de resultaten van de respectievelijke zoekmachines. Dat is gelukkig heel eenvoudig. Een nadeel van Submit Express is dat u afhankelijk bent van een derde partij, die op ieder moment kan besluiten er de brui aan te geven. Dat is niet theoretisch. In de vierde druk van dit boek stond op deze plaats de dienst Marketleap, die er in november 2009 plots mee ophield. Kennis van het ouderwetse handwerk, zoals hiervoor beschreven, blijft daarom essentieel.
154
Handboek – Internetresearch
Afbeelding 8.20
Submit Express. Here today, gone tomorrow?
Werking en nut van traceroutes en reverse DNS-scans Als u voorbij de kop van dit gedeelte bent gekomen, dan bent u een dapper mens. Traceroute en reverse DNS-scan zijn twee gereedschappen die u kunnen helpen meer te weten te komen over websites. Met traceroute is het vaak mogelijk de geografische locatie van een website te bepalen; via reverse DNS kunt u soms te weten komen welke websites nog meer tot dezelfde persoon of instantie behoren.
Traceroute Traceroute helpt u bij het bepalen van de geografische locatie van een website of IP-nummer. Zeker bij websites die op .com eindigen en waarbij de WHOIS-informatie onvolledig of onjuist is, blijkt het vaak een crime om te bepalen in welk land een bepaalde website is ondergebracht. Traceroute biedt soms een oplossing voor dit probleem. Bij een traceroute wordt in kaart gebracht welke route informatie moet afleggen om vanaf de desbetreffende website naar u te komen. De eenvoudigste manier om een
155
Hoofdstuk 8 – Bronverificatie
traceroute te doen, is gebruik te maken van een Windows-programma dat tracert heet. U start dit programma door linksonder in het Windows-venster op Start te klikken en (bij Windows 7 en Windows Vista) command te typen (in oudere Windows-versies moet u command invoeren na het aanklikken van Run of Uitvoeren). Typ in de box die nu is verschenen vervolgens tracert gevolgd door een spatie en de naam van de website waarvoor u een traceroute wilt uitvoeren. Om de box te sluiten typt u exit. Op domeinnaam U hebt niet per se een IP-nummer nodig voor een traceroute. U kunt ook gewoon een domeinnaam invoeren. Vanwege de omslachtigheid en omdat niet alle Apple-gebruikers wat aan tracert hebben, is het wel zo handig om een website te gebruiken voor traceroutes. Dit kan via de eerdergenoemde website van CentralOps, maar het is verstandig om een Nederlandse traceroutesite te gebruiken, zoals bijvoorbeeld zelfservice.nl.uu.net/netwerk/pops/trace.uunet. U wilt immers de route volgen die informatie door verschillende landen moet afleggen om bij u terecht te komen. Als u een Amerikaanse site gebruikt, vindt ook de traceroute plaats tussen de Amerikaanse site en de site die u hebt ingevoerd. Daardoor kan sneller verwarring ontstaan.
Afbeelding 8.21 Via de traceroutesite van UUNet kunt u de route tussen twee computers in kaart brengen.
8h012
Nadat u op zelfservice.nl.uu.net/netwerk/pops/trace.uunet een adres hebt ingevoerd en op Start hebt geklikt, ontstaat het beeld als in afbeelding 8.22.
8h013
U ziet hier de route die informatie tussen beide computers volgt. De onderste regel betreft veelal de naam van de computer die zich geografisch het dichtst bevindt bij de computer die u zoekt. Soms moet u nog eerst een
156
Handboek – Internetresearch
Afbeelding 8.22
Een typisch tracerouteresultaat.
WHOIS uitvoeren voor de domeinnaam van deze computer voordat u de locatie kunt bepalen. In het voorbeeld kunt u aan de naam van de computer zien dat deze zich vermoedelijk in Atlanta bevindt, vanwege de letters ‘Atl’ bij stap 16. Zoeken met een IP-nummer Als u alleen de beschikking hebt over een IP-nummer, kunt u ook daarmee een traceroute uitvoeren. Als u dit allemaal te ingewikkeld is, kunt u overwegen om het programma Visual Route aan te schaffen (www.visualroute.com). De resultaten van traceroutes worden door Visual Route grafisch weergegeven. Zo kunt u
Afbeelding 8.23
Een grafische traceroute.
157
Hoofdstuk 8 – Bronverificatie
vanaf een landkaart aflezen waar een bepaalde website of bepaald IPnummer zich bevindt. Het programma is vijftien dagen gratis te gebruiken. Vanwege het grote gebruiksgemak is dat het overwegen waard als u vaak traceroutes gaat uitvoeren. Op visualroute.visualware.com kunt u gratis dergelijke visuele traceroutes uitvoeren. 8h014 Reverse DNS-scans Bij een reverse DNS-scan kijkt u of bij een bepaald IP-nummer ook een domeinnaam hoort. Een voorbeeld: de reverse DNS van het IP-nummer 64.236.29.120 zou www.cnn.com opleveren. Als u het nummer 64.236.29.120 in de adresbalk van uw browser typt, zult u merken dat u naar de CNN-website gaat. Een eenvoudige reverse DNS als in het voorgaande voorbeeld kunt u doen via de website Lookup Server (www.lookupserver.com) bij het invoerveld IP-address. Zo zoekt u de naam van een site bij een IP-nummer.
Afbeelding 8.24 U vult het IP-nummer in bij IP-address. Als er een adres is gekoppeld aan het nummer, krijgt u dat te zien nadat u het nummer hebt ingevuld en op de Enter-toets heeft gedrukt.
8openrbl
158
Handboek – Internetresearch
Veel interessanter is het echter om reverse DNS te gebruiken als truc om erachter te komen welke computers nog meer tot een bepaald bedrijf of een organisatie behoren. In hoofdstuk 7 is globaal beschreven hoe IP werkt: iedere met internet verbonden computer heeft een IP-nummer. Een IP-nummer is een combinatie van vier getallen, die ieder tussen de 0 en 255 zijn. Maar wat nu als een bedrijf meerdere computers heeft waarop meerdere websites draaien? Hoe komt u daar achter? Het antwoord ligt besloten in reverse DNS. Want waar de namen van websites totaal onvoorspelbaar zijn, zijn de IP-nummers waar deze sites bereikbaar zijn, dat niet. Om dat te begrijpen, moet eerst worden uitgelegd wat een C-net is. IP-nummers worden in bundels van 256 stuks ‘uitgedeeld’. Zo’n bundel heet ook wel een C-net. Bij een C-net zijn de eerste drie getallen van het IPnummer steeds hetzelfde. De IP-nummers 145.58.30.0, 145.58.30.1, 145.58.30.2, 145.58.30.3 enzovoort tot en met 145.58.30.255, behoren allemaal tot hetzelfde C-net. Voor researchers zijn C-netten interessant, omdat de kans aanwezig is dat de eigenaar van IP-nummer 145.58.30.1 dezelfde is als die van IP-nummer 145.58.30.254. Een C-net wordt immers vaak als bundel weggegeven. En bij al die IP-nummers kunnen namen van websites horen, namen die via een reverse DNS-zoekvraag zijn te verkrijgen. Het goede nieuws: er is een website die automatisch de 256 reverse DNSopdrachten uitvoert die voor een volledige speurtocht door een bepaald Cnet nodig zijn. Meerdere gebruikers Niet alle IP-nummers in een C-net behoren per definitie tot dezelfde persoon. Het is goed mogelijk dat bijvoorbeeld een internetaanbieder de IP-nummers onder meerdere partijen heeft verdeeld. Wilt u een volledige reverse DNS-scan door een C-net doen, dan gaat u als volgt te werk. 1 Achterhaal het IP-nummer van de website die u al hebt Het eenvoudigste doet u dat via de website CentralOps (centralops.net/co). Hier klikt u op Domain Dossier. Vervolgens vult u de naam van een website in. In dit voorbeeld gebruiken we de website van Radio Nederland Wereldomroep, met als adres www.rnw.nl. Het bijbehorende IP-nummer ziet u verschijnen achter het woord addresses: 145.58.28.152.
159
Hoofdstuk 8 – Bronverificatie
Afbeelding 8.25 Typ de naam van de site en CentralOps levert het bijbehorende IP-nummer.
2 Ga naar tools.webtic.nl/dnsscan Hier voert u het IP-nummer van de site in. Vervolgens klikt u op Go. Omdat een reverse DNS-scan uit veel verschillende zoekopdrachten bestaat, kan het resultaat even op zich laten wachten. Uiteindelijk zult u (althans in het RNW-voorbeeld) een lijst zien met internetadressen en de bijbehorende IP-nummers. Uit de adressen kunt u vaak al het nodige afleiden over de organisatie of het bedrijf dat u aan het onderzoeken bent. Zo ziet u bij de resultaten ondermeer de VPRO en de NCRV staan, wat suggereert dat er een verband is tussen deze organisaties en www.rnw.nl. En dat is natuurlijk ook zo: al deze organisaties zijn onderdeel van de publieke omroep.
Afbeelding 8.26 Vul het IP-nummer in, klik op Go en de reverse DNS-scan levert een lijst met internetadressen binnen het desbetreffende C-net.
160
Handboek – Internetresearch
3 Diep de resultaten uit Met alleen een lijst internetadressen bent u er niet. Het is nu zaak om verder op onderzoek uit te gaan. Bezoek bijvoorbeeld alle nieuw verkregen internetadressen. Ziet u bij de adressen andere domeinnamen staan, dan kunt u hier WHOIS op loslaten om zo aan nieuwe adresgegevens te komen. Twee voorbehouden moeten gemaakt worden. Het is mogelijk dat het desbetreffende C-net uitsluitend de site bevat waarmee u de zoektocht begon. En wanneer u de eerste stap oversloeg en een reverse DNS-scan begon met een IP-nummer zonder dat u wist of daar een site bij hoorde, is het zelfs mogelijk dat u geen enkel resultaat krijgt. Als alternatief voor tools.webtic.nl kunt u de site yougetsignal.com gebruiken. Dit heeft als aanvullend voordeel dat yougetsignal.com soms sneller werkt, en soms ook uitgebreidere resultaten oplevert. Voert u bijvoorbeeld zachtei.nl in op www.yougetsignal.com/tools/web-sites-on-web-server/, dan krijgt u een lange lijst met andere websites die zich op dezelfde server bevinden.
Afbeelding 8.27 De servergenoten van zachtei.nl eenvoudig in kaart gebracht met yougetsignal.com.
8yougetsignal
161
9
Personen, deskundigen en bedrijven zoeken
I
nternet biedt diverse handige hulpmiddelen om mensen of instanties te kunnen vinden. Zo is het mogelijk om met enkel een telefoonnummer adresgegevens te achterhalen of om iemand te vinden als u louter de beschikking hebt over diens familienaam. Daarnaast biedt het web allerlei gespecialiseerde diensten voor het opspeuren van ex-schoolgenoten, militairen, oud-collega’s, wetenschappers, medisch personeel en advocaten.
U leert in dit hoofdstuk:
Hoe u adresgegevens van personen en bedrijven achterhaalt. Wat reverse lookups zijn. Hoe u met behulp van een postcode telefoonnummers achterhaalt, en met een telefoonnummer adresgegevens. Welke internetregisters u kunnen helpen bij het opsporen van personen en deskundigen.
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Sneeuwballen gooien Het belangrijkste bij het zoeken naar persoonsgegevens kan geen boek u leren: inventiviteit. U zult in dit hoofdstuk diverse sites en methoden leren kennen waarmee u in sommige gevallen een persoon, bedrijf of instantie kunt opspeuren. Het is de kunst om deze methoden te leren combineren, oftewel: sneeuwballen. Een internetdienst hoeft u niet per se het definitieve antwoord te geven, zolang u maar voldoende informatie krijgt om het elders nog eens te proberen met de nieuwe puzzelstukjes die u hebt gekregen. Op die manier kunt u in sommige gevallen met gebrekkige informatie toch heel ver komen. Zo moest de auteur van dit boek in opdracht van een landelijke tv-zender ooit de persoon achterhalen die achter een website van en voor pedofielen zat. De website was ondergebracht bij een Amerikaans bedrijf dat gratis webruimte uitdeelt. Een WHOIS-zoektocht als beschreven in hoofdstuk 8 had dus geen zin. Op de website zelf werd enkel een nietszeggend e-mailadres genoemd. Dat bleek uiteindelijk voldoende te zijn. Want het e-mailadres, eenmaal ingevoerd bij Google, leverde een andere site op waarop hetzelfde e-mailadres voorkwam. Het systematisch doorspitten van die site leidde naar een pagina waarop steeds weer dezelfde naam voorkwam. Deze gegevens werden vervolgens ingevoerd bij de Nationale Telefoongids (zie verderop), waar het mogelijk is om met louter een achternaam door heel Nederland te zoeken. Uiteindelijk leverde de zoektocht niet alleen de naam van de man op, maar ook zijn adres- en telefoongegevens. Zo, en nu u.
Adresgegevens en telefoonnummers van personen achterhalen Soms is het traceren van een persoon heel eenvoudig, bijvoorbeeld als u diens naam al weet. U kunt dan in een internettelefoonboek zoeken. Verderop worden er twee besproken. Van belang is wel om te bedenken dat inmiddels meer dan één miljoen Nederlanders de beschikking hebben over een geheim nummer, en dus in geen enkel telefoonboek zijn opgenomen.
164
Handboek – Internetresearch
De Telefoongids – www.telefoongids.nl Vroeger kende Nederland twee grote online telefoonboeken. De Nationale Telefoongids van Truvo en De Telefoongids van KPN Telecom. Het voordeel van de eerste was dat je ermee in heel Nederland kon zoeken. Je tikte ‘Dasselaar’ in, en u zag onmiddellijk welke geluksvogels in Nederland zowel gezegend waren met deze prachtige achternaam als een niet-geheim telefoonnummer. Het slechte nieuws: de Nationale Telefoongids is opgeslokt door KPN Telecom, het bedrijf dat ooit een mooi, goedfunctionerend journalistiek bedrijf om zeep hielp (iets waar de auteur in het geheel niet bitter over is). Het goede nieuws: de mogelijkheid om in heel Nederland te zoeken is gebleven. En dat is handig, want (opnieuw) vroeger kon dat niet met De Telefoongids van KPN Telecom. In heel Nederland zoeken is handig als u op een website bijvoorbeeld een naam hebt aangetroffen, maar geen overige contactgegevens. Door bij De Telefoongids op de naam van een persoon te zoeken bij Wie en het veld Waar leeg te laten, zoekt u automatisch in heel Nederland. Om het aantal zoekresultaten enigszins te beperken, is het verstandig om de achternaam inclusief de eerste initiaal in te voeren, en wel in de volgorde achternaam, initiaal. Voorbeeld: Jansen J.
Afbeelding 9.1
Eigenaren van dit boek krijgen geen korting op een auto-
wasbeurt.
9telefoongids
165
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Infobel – www.infobel.com Deze site bevat koppelingen naar telefoonboeken en Gouden Gids-equivalenten over de hele wereld. Hoewel het op de beginpagina van de site lijkt alsof het landaanbod beperkt is, kunt u middenboven in het venster op Kies een land klikken, waarna een uitputtende lijst verschijnt. Hebt u een land geselecteerd en op OK geklikt, dan verschijnt er op dezelfde plek een uitklapmenu met de beschikbare informatiebronnen over dat land. Keuzemogelijkheden zijn onder meer white pages, voor het normale telefoonboek, en yellow pages, voor de plaatselijke Gouden Gids.
Afbeelding 9.2 Via het keuzemenu kunt u via Infobel de telefoonboeken van vrijwel alle landen ter wereld opvragen.
9infobel
166
Handboek – Internetresearch
Adresgegevens en telefoonnummers van bedrijven achterhalen Het opspeuren van bedrijven is over het algemeen eenvoudiger dan het vinden van een persoon. Waar de laatsten soms prijs stellen op hun privacy, betalen bedrijven juist voor aandacht. Twee sites kunnen u bijzonder van nut zijn bij speurtochten naar bedrijven.
Gouden Gids – www.goudengids.nl Een onderdeel van De Telefoongids waarin u kunt zoeken op bedrijfsnamen in het hele land. Ook is het handig dat u automatisch bedrijven in dezelfde branche te zien krijgt na een zoektocht op naam. Het is via de Gouden Gids dus erg eenvoudig om vast te stellen wat voor soort bedrijf u op het spoor bent gekomen. Helaas is de Gouden Gids blijkbaar niet verbonden met de Kamer van Koophandel – het bedrijf van de auteur stond ruim anderhalf jaar na verhuizing nog altijd op het oude, foute adres geregistreerd.
Afbeelding 9.3 Hou er bij de Gouden Gids rekening mee dat de gegevens verouderd kunnen zijn, zoals het screenshot (gemaakt in juli 2010) laat zien – het betreffende bedrijf verhuisde eind 2008.
9goudengids Kamer van Koophandel – www.kvk.nl/handelsregister Wat ons op de noodzaak van de site van de Kamer van Koophandel (KvK) brengt, want bedrijven zijn verplicht hun verhuizingen hier aan te melden. Via het Handelsregister op de site van de KvK zijn gegevens op te vragen voor alle bij de Kamer van Koophandel geregistreerde bedrijven en organisa-
167
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
ties in Nederland. En dat zijn er heel wat. U kunt zoeken op de naam van het bedrijf, maar ook op adres of het KvK-nummer, op deze site dossiernummer genoemd. Bijzonder nuttig is de mogelijkheid om met het Handelsregister alle bedrijven in een bepaalde buurt op te zoeken. U doet dit door de optie postcode te selecteren onder het zoekveld ‘plaats’. Hiermee kunt u een (deel van een) buurt in kaart brengen door enkel de vier cijfers van een postcode in te voeren, of iets minder breed zoeken door ook de postcodeletters te gebruiken. Daarnaast is er de mogelijkheid om op postcode én vanaf een bepaald huisnummer te zoeken. De postcode-optie maakt het mogelijk om erachter te komen of op het adres van een door u onderzocht bedrijf nog andere ondernemingen zijn gevestigd. Van alle in het register opgenomen bedrijven en organisaties zijn tegen betaling uittreksels verkrijgbaar, en soms ook jaarrekeningen.
Afbeelding 9.4 De postcodezoekfunctie van het Handelsregister is bijzonder handig.
Reverse lookups Soms hebt u alleen een telefoonnummer, maar geen andere informatie. In andere gevallen hebt u misschien enkel een postcode waarop een persoon of bedrijf dat u zoekt zich bevindt. Een aantal websites kan u in die gevallen helpen, met behulp van zogeheten reverse lookups. Hierbij zoekt u, zoals de term al zegt, omgekeerd: in plaats van een telefoonnummer bij een naam, krijgt u een naam bij een telefoonnummer of namen, adressen en telefoonnummers na het invullen van een postcode. Let wel op: informatie in reverse-lookupbestanden kan verouderd zijn. Dat heeft alles te maken met
168
Handboek – Internetresearch
het feit dat reverse lookups in Nederland niet worden toegejuicht door De Telefoongids BV. Om die reden moeten de gegevens op ‘omgekeerdzoekensites’ eerst worden geëxtraheerd van de zogeheten CD-foongids, later omgedoopt in De Telefoongids Professioneel, oftewel: het telefoonboek op een schijfje (over.detelefoongids.nl/corporate/show/id=40941). Daarvoor gebruiken ze het programma Foondump (www.foondump.nl). Eind 2007 werden verschillende omgekeerdzoekensites dan ook aangeschreven door het College Bescherming Persoonsgegevens (CBP) en telecomwaakhond OPTA. Uiteindelijk concludeerde de OPTA dat omgekeerdzoekensites op zichzelf niet onrechtmatig zijn (www.opta.nl/asp/publicaties/ document.asp?id=2433). Uiteraard is het niet uitgesloten dat die mening in de toekomst wordt bijgesteld. In dat geval kunt u, op eigen risico, altijd nog zelf aan de slag met het hiervoor genoemde programma Foondump en een CD-foongids die u bijvoorbeeld op Marktplaats op de kop tikt.
Nummerboek – www.nummerboek.com Heeft van alle reverse-lookupsites de meeste zoekopties en is dus eerste keus. U kunt niet alleen op telefoonnummer zoeken, maar ook op een gedeelte daarvan. Daarnaast is het mogelijk om te zoeken op alleen een postcode, of alleen de vier cijfers daarin.
Afbeelding 9.5
Liefst twee minuten duurde de zoekopdracht op de begin-
cijfers ‘02068’.
169
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Heel erg handig is de mogelijkheid om zoekresultaten te downloaden in de vorm van een Excel-bestand. Zo kunt u in het gelijknamige databaseprogramma verder stoeien met de door u bij elkaar geharkte gegevens. Jammer genoeg is de exportfunctie beperkt tot een maximum van honderd resultaten. Let wel op: als u zoekt op een ingewikkelde opdracht, zoals de eerste vijf cijfers van een telefoonnummer, kan het behoorlijk lang duren voordat uw resultaten klaar zijn. 9nummerboek Nummerzoeker – www.nummerzoeker.com Een site met de nodige beperkingen. Zo moet u minimaal de eerste acht cijfers van het telefoonnummer waarop u wilt zoeken, specificeren. Alleen de vier cijfers uit een postcode zijn evenmin voldoende om een opdracht te kunnen geven aan deze site. Daar moet u minimaal de eerste letter van de postcode aan toevoegen. Daar staat dan weer een groot voordeel tegenover: de site kent nummers die Nummerboek niet kent. Zo werd het nieuwe telefoonnummer van de auteur in juli 2010 wel op Nummerzoeker gevonden maar niet op Nummerboek.
Ik heb je – www.ikhebje.nl Deze site lijkt gezien zijn naam bestemd voor stalkers, maar bevat vooral veel koppelingen naar diensten waarmee u bedrijven ‘opspoort’ die geld aan u willen verdienen. De koppeling Omgekeerd tel. zoeken biedt daarentegen een nuttig overzicht van nog meer sites die omgekeerd zoeken aanbieden.
Afbeelding 9.6 De opties bij Omgekeerd tel. zoeken. Ervaring met flipperkasten strekt tot aanbeveling.
170
Handboek – Internetresearch
Het overzicht is niet altijd even actueel, maar kan uitkomst bieden als de eerdergenoemde omgekeerdzoekensites niet voldoen. Reverse lookup Reverse lookups zijn erg handig als u op een website enkel een telefoonnummer hebt aangetroffen. Met de adresgegevens die een reverse lookup kan opleveren, kunt u soms de naam van de persoon achter de site achterhalen. Zeker bij Amerikaanse sites is dit nogal eens het geval. Hebt u eenmaal de naam van een persoon, dan hebt u een goed uitgangspunt voor een verdere speurtocht.
WhitePages – www.whitepages.com/reverse-lookup In de Verenigde Staten zijn reverse lookups geen taboe. Om een zoektocht op nummer te doen, moet u op Search by phone klikken en daar het telefoonnummer typen. Voorbeeld: zoeken op 202-456-1414 levert het adres van de Amerikaanse president op. Denk er wel aan om de voorloop-1 weg te laten, ondanks de Amerikaanse gewoonte deze ook bij binnenlandse nummers soms te vermelden.
Afbeelding 9.7
Ook geschikt voor niet-staatshoofden.
9white
171
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Personen vinden met internetregisters De eenvoudigste manier om een persoon te vinden, is simpelweg de naam typen bij Google, en als dat niet het gewenste resultaat heeft, bij andere zoekmachines als Yahoo!. Ook het gebruik van een metazoekmachine (zie hoofdstuk 4) wil nog weleens een gunstig resultaat opleveren. Maar mocht u tot dusver steeds bot hebben gevangen, dan is de trukendoos nog verre van leeg. Allerlei sites verzamelen persoonsgegevens die niet via Google of een andere zoekmachine te vinden zijn, omdat ze tot het diepe web behoren.
Wieowie.nl – www.wieowie.nl Een metazoekmachine voor Nederlandse personen. Wieowie.nl kijkt in tal van websites naar de door u gezochte naam. Maar de dienst heeft een groot nadeel, zoals het screenshot laat zien. Het is mogelijk om ten onrechte de identiteit van een persoon te claimen. Daar zijn wel stappen in gezet. Zo zijn diverse valse Jan Peter Balkenendes sinds de vorige, vierde editie van dit boek van de site verwijderd. Maar het blijft raadzaam om op uw hoede te blijven.
Afbeelding 9.8 Dankzij Oil of Olaz behield Jan Peter zijn jeugdige teint. Screenshot uit 2008. Inmiddels heeft Wieowie.nl zijn leven enigszins gebeterd.
172
Handboek – Internetresearch
9wieowie Pipl – www.pipl.com Een soort Wieowie.nl, maar dan beter. Of moeten we zeggen: minder slecht? Handig aan Pipl is dat de site gelijk een samenvattend overzicht geeft van wat er over die persoon op internet wordt gezegd. Ook kijkt Pipl in serieuze bronnen, zoals de wetenschappelijke zoekmachine Google Scholar.
Afbeelding 9.9
Zong REM al niet: “Shiny happy pipl laughing”?
9piplHyves – www.hyves.nl Hyves is eigenlijk een social network (zie verder hoofdstuk 13), maar wordt hier ook vermeld aangezien de site de dominante plek heeft ingenomen die Schoolbank jarenlang bezat (voordat die laatste haar gebruikers wegjoeg door geld te gaan vragen voor bepaalde diensten). Via Hyves is het inmiddels mogelijk om te zoeken naar (oud-)klasgenoten van een bepaalde school. De site is ook bijzonder handig voor werkgevers (‘Wat voert mijn toekomstige werknemer uit in het weekend?’) en docenten (‘Heeft die student echt hoofdpijn, of staat er toevallig een foto van middernachtelijk kroegvertier in zijn profiel?’).
173
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Afbeelding 9.10 In de vierde editie van dit boek vroegen we ons af waar de Cosa Nostra-hyves bleef. Welnu…
9hyves Schoolbank – www.schoolbank.nl Deze website, sinds 2007 in handen van Ilse Media, heeft als doel om oudklasgenoten te herenigen. Er kan worden gezocht op vrijwel iedere onderwijsinstelling in Nederland, van basisschool tot universiteit. U moet zich hiertoe wel eerst aanmelden. Het voordeel van Schoolbank is het grote bereik van de site: veel Nederlanders, hoewel uiteraard lang niet allemaal, hebben zich ooit in het pre-Hyves-tijdperk aangemeld. Overigens hoeft u uiteraard niet op exact dezelfde school te hebben gezeten om iemand te vinden. Kennis van zijn of haar onderwijscarrière is handig, maar ook niet nodig. Via de optie Zoek persoon kunt u ook op naam zoeken. Zoeken op Schoolbank is gratis, helaas moet er betaald worden wanneer u daadwerkelijk contact wilt zoeken met een gevonden persoon.
174
Handboek – Internetresearch
Afbeelding 9.11 Om daadwerkelijk iets te weten te komen op Schoolbank is registratie verplicht.
9h003 Schoolpagina – www.schoolpagina.nl Toen Schoolbank in januari 2005 de mogelijkheden voor gratis gebruik inperkte, zorgde dat voor veel publiciteit voor concurrent Schoolpagina. Volledige deelname aan en gebruik van deze site is gratis. Blootstelling aan het kromme taalgebruik (‘Dit is grootste gratis reünie website van Nederland!’) krijgt u eveneens cadeau.
Dienstmakkers – www.dienstmakkers.nl Een site van de makers van Schoolbank, volgens exact hetzelfde model. Via deze dienst zijn (ex-)militairen op te speuren aan de hand van hun naam of krijgsmachtonderdeel. Net als Schoolbank moet Dienstmakkers het hebben van vrijwillige inschrijvingen, waardoor de dekking nooit honderd procent kan zijn.
175
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Afbeelding 9.12
Gelukkig zonder virtuele drilsergeant.
9h004 Kadaster – www.kadaster.nl Niet gratis, wel nuttig. Met de online diensten van het Kadaster kunt u bijvoorbeeld achterhalen wie of wat eigenaar is van een bepaald gebouw. Dit doet u met een ‘Kadastraal bericht eigendom’. De kosten zijn 2,95 euro per aanvraag (juli 2010).
Afbeelding 9.13
schaffen.
176
U kunt ook uittreksels van kadastrale kaarten online aan-
Handboek – Internetresearch
9h005 Naymz – www.naymz.com Blijf weg bij dit zichzelf agressief profilerende bedrijf. Naymz gaat onzorgvuldiger om met persoonlijke informatie dan het weekblad Privé. Zo worden de gegevens geregistreerd van iedereen die profielen van op Naymz vermelde personen bezoekt. Die gegevens worden vervolgens doorverkocht aan de personen waar die profielpagina’s over gaan. Uiteraard alleen als die laatsten daar voor willen betalen.
Afbeelding 9.14
Big Brother is selling you.
9naymz Yahoo! People Search – people.yahoo.com In de Verenigde Staten zijn veel registers openbaar waarvoor u in Nederland een gerechtelijk dwangbevel nodig hebt. Gevangenisbestanden, echtscheidingsregisters, welke boten of vliegtuigen een persoon op zijn naam heeft staan: het is allemaal te achterhalen. De informatie die Yahoo! zelf te bieden heeft, is gratis. Yahoo! Werkt echter ook samen met www.intelius.com, dat tegen betaling uitgebreide rapporten kan verstrekken met informatie uit diverse registers.
177
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Afbeelding 9.15 Yahoo! People Search maakt het mogelijk om door te klikken naar een bedrijf dat zich specialiseert in antecedentenonderzoek.
9h006 Diverse personenzoekmethoden – zoeken.beginthier.nl Een vergaarbak van goede en minder goede sites die voor het grootste deel te maken hebben met het opsporen van mensen. De kwaliteit is zoals gezegd wisselend, maar voor sommige zoekniches zoals het terugvinden van adoptiekinderen of het speuren naar vermiste personen kan deze site toch nut hebben. De meeste relevante sites die u hier aantreft, zijn echter al elders in dit boek besproken.
Afbeelding 9.16 Met iets minder reclame had dit een uitstekende site kunnen zijn. Nu is het vooral een laatste strohalm.
178
Handboek – Internetresearch
Deskundigen vinden Specifieke beroepsgroepen hebben hun eigen specifieke websites. Hierna leest u over de belangrijkste.
Nederlandse Onderzoek Databank – www.onderzoekinformatie.nl De Nederlandse Onderzoek Databank (NOD) wordt ook wel gekscherend de Dr. Clavan-database genoemd (althans door de auteur van dit boek), omdat de NOD bij uitstek geschikt is om bij een bepaald onderwerp een deskundige te vinden. Typ bijvoorbeeld diabetes in het zoekveld en u krijgt een overzicht van allerlei onderzoekers die zich met dit onderwerp bezighouden of -hielden. U kunt de NOD echter ook uitstekend gebruiken om een wetenschapper op te speuren. Het typen van zijn of haar naam in het zoekveld leidt tot het tonen van alle in de NOD voorkomende onderzoekers, met hun gegevens. De NOD is daardoor bijzonder geschikt om een onderzoeker te vinden van wie u alleen de naam hebt gehoord, terwijl u geen idee hebt bij welke universiteit hij of zij werkt.
Afbeelding 9.17 Vul eender welk onderwerp in, en NOD spuwt een lijst van onderzoekers en onderzoeken.
9h008 BIG-register (gezondheidszorg) – www.bigregister.nl De Wet BIG, oftewel Beroepen In de Gezondheidszorg, is een gruwel voor sommigen die er beroepshalve mee te maken hebben, maar een zegen voor de researcher. Niet alleen artsen, maar ook verpleegkundigen, fysiotherapeuten, apothekers, bepaalde categorieën psychologen en verloskundigen moeten zich verplicht in het BIG-register laten opnemen. Helaas blinkt het register niet uit door ontsluitbaarheid. Zo kunt u niet louter op naam van een beroepsbeoefenaar zoeken, en dat zou nu juist zo prettig zijn geweest.
179
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
Wel kunt u iemands status als ingeschrevene verifiëren als u behalve de naam ook nog beschikt over de woonplaats of de geboortedatum van de betreffende persoon. Vervolgens krijgt u te zien of de persoon is ingeschreven, en zo ja, met welk specialisme. Ook handig voor journalisten: het overzicht van bevoegdheidsbeperkingen. Zo ontdekt u snel of een zorgverlener ruzie heeft gehad met een tuchtrechter (en verloren).
Afbeelding 9.18
De site van het BIG-register biedt u meerdere zoek-
mogelijkheden.
9bigreg Advocaten – www.advocatenorde.nl/nova/advocaten2b.nsf/zoek?openform U hebt een middag illegale software binnengehaald en die gekraakt met niet zo frisse programmatuur van de site astalavista.box.sk. In dat geval hebt u een advocaat nodig, en die kunt u via deze site vinden. Ook tijdens het doen van research bewijst deze site zijn nut, bijvoorbeeld als u louter de beschikking hebt over de naam van een persoon, weet dat deze advocaat is en hem of haar wilt bereiken.
180
Handboek – Internetresearch
Extra handig is het dat de site adressen van advocaten in den vreemde bevat, al moet u in dat geval wel voor ieder land een nieuwe zoektocht beginnen. Overigens, laat u niet intimideren door het ingewikkelde webadres. U kunt het zoekvenster ook vinden via www.advocatenorde.nl. Dat vereist wel enig doorklikken. Daartoe klikt u in het linkermenu op Zoek een advocaat.
Afbeelding 9.19
Altijd handig als de sirenes steeds dichterbij komen.
9h009 Diplomaten (Oranje Boekje) – www.mfa.nl Nederlandse ambassadeurs en de nodige diplomaten vindt u via deze site van het ministerie van Buitenlandse Zaken. Helaas krijgt u niet met één druk op de knop de namen van alle medewerkers te zien. Wel komt u via deze pagina eenvoudig op de eigen sites van Nederlandse ambassades en consulaten. Daarop staan vaak wel de namen van ambassadeurs en consuls vermeld.
Afbeelding 9.20 Het online Oranje Boekje is een goed startpunt voor een zoektocht naar diplomaten en ambassadeurs.
181
Hoofdstuk 9 – Personen, deskundigen en bedrijven zoeken
9h010 Zakenlui vinden – www.forbes.com/peopletracker Zo’n 120 duizend zakenlui en notoire rijkaards zijn via deze dienst van het Amerikaanse zakenblad Forbes te volgen. Onder dit enorme aantal zitten overbekende namen als Bill Gates en Warren Buffett, plus alle personen die een vermelding op de rijkenlijst hebben verdiend die het blad jaarlijks uitgeeft, maar ook aanzienlijk obscuurdere zakenlui. De site bewijst onder meer zijn nut bij het opsporen van succesvolle Nederlanders in den vreemde. Forbes bezit niet alleen biografische informatie van de opgenomen personen, maar weet veelal ook de hoogte van het salaris te geven.
Afbeelding 9.21
Ja, Forbes kent echt *kuch* iedereen.
E-mailadressen opspeuren Helaas, er bestaan geen goede manieren om het e-mailadres van een persoon te achterhalen. De reden dat het vinden van e-mailadressen van personen zo lastig is, valt samen te vatten met het woord ‘spam’. Spam, oftewel ongewenste reclame, zorgt ervoor dat veel internetgebruikers uiterst huiverig zijn om hun e-mailadres op internet achter te laten. In de geschiedenis van het World Wide Web zijn diverse pogingen gedaan om openbare e-mailregisters te beginnen, als de online equivalenten van telefoonboeken. Hoewel er tot voor vijf jaar geleden nog e-mailadreszoekmachines waren die u soms uit de brand konden helpen, hebben de noemenswaardige exemplaren ondertussen allemaal het bijltje erbij neergelegd.
182
Handboek – Internetresearch
Andere manieren om personen op te sporen Over een aantal methoden om personen op te sporen, valt meer te vertellen. Dat komt soms omdat de methoden zelf veel uitleg vragen en soms omdat deze methoden gebruikmaken van internetdiensten waaraan aparte hoofdstukken zijn gewijd. Elders in dit boek leest u daarom nog: • Personen vinden via Usenet Usenet is een oud onderdeel van internet, dat kort aan de orde is gekomen in hoofdstuk 7. Op Usenet wordt door uiteenlopende mensen met elkaar gediscussieerd. Meer hierover leest u in hoofdstuk 11. • Verzenders van anonieme e-mail opsporen Deze methode maakt deel uit van hoofdstuk 12, dat in zijn geheel aan e-mail is gewijd. • De kracht van chatdiensten mobiliseren om mensen te vinden Hoofdstuk 13 gaat over methoden om digitaal te kletsen, zoals Live Messenger, ICQ en IRC. Chatdiensten zijn met name onder jongeren en jongvolwassenen erg populair en beschikken vaak over grote registers waarin de leden zich geregistreerd hebben. • Social networks inschakelen bij uw research Social networks zijn diensten waarbij vrienden, kennissen of zakenrelaties hun relationele netwerk invoeren op een website. Meer hierover leest u eveneens in hoofdstuk 13.
183
10
Nieuws vergaren met RSS
E
en van de grootste problemen die veel researchers tegenkomen op internet, is het grote aantal websites dat ze in de gaten moeten houden, zeker voor wat betreft vaak terugkerende researchonderwerpen. De dagelijkse bezoeken zijn ondoenlijk, vooral omdat niet iedere site dagelijks wordt ververst. Steeds meer sites bieden daarom RSS aan, een ‘nieuwsdienst’ waarmee de researcher onmiddellijk op samenvattingen van nieuwe berichten kan worden geattendeerd. Wie RSS wil gebruiken, moet speciale maatregelen nemen om zogeheten RSS-feeds te kunnen volgen. Dat kan met websites zoals Google Reader, maar ook met speciale RSS-software. Daarmee is het vaak mogelijk om nieuws van sites met vergelijkbare onderwerpen automatisch door de computer te laten sorteren. Bovendien gaan steeds meer websites ertoe over om hun inhoud in zeer fijnmazige RSSfeeds te publiceren, waardoor irrelevante berichten u minder snel bereiken. Het bijhouden van de juiste RSS-feeds bespaart dus aan de ene kant tijd en maakt het aan de andere kant mogelijk om meer informatiebronnen grondiger in de gaten te houden.
U leert in dit hoofdstuk:
Wat RSS is, en hoe het kan helpen bij research. Welke soorten websites RSS aanbieden. Welke software u nodig hebt om RSS te gebruiken.
Hoofdstuk 10 – Nieuws vergaren met RSS
Wat is RSS? RSS staat voor Really Simple Syndication of RDF Site Summary. Dat zijn obscure namen voor wat gewoon een manier is om informatie te publiceren. Met RSS is het mogelijk om automatisch en regelmatig op de hoogte te worden gebracht wanneer een site is voorzien van nieuwe artikelen. Oftewel: RSS is onmisbaar voor de serieuze researcher. Waarom hoort u dan zo weinig over RSS? Simpel: omdat RSS vooral in het begin een steile leercurve heeft. Maar doorzettingsvermogen wordt beloond. Om RSS goed te kunnen gebruiken, is enig inzicht in de principes van deze technologie noodzakelijk. RSS-informatie lijkt wel wat op een pagina met nieuwskoppen op een actualiteitenwebsite. Het grote verschil is dat RSS is ontdaan van alle opmaak, plaatjes en andere franje. Dat RSS er zo anders uitziet dan een gewone webpagina, heeft een technische reden. RSS is namelijk niet bedoeld om te worden bekeken met een browser als Internet Explorer of Firefox. Een website is geschreven in de taal HTML. RSS maakt echter gebruik van een andere taal: XML ofwel eXtensible Markup Language. De praktische consequentie daarvan is dat RSS er in een normaal browservenster nogal ‘vreemd’ uitziet. Zelfs in Internet Explorer 7 (zie afbeelding 10.1). Deze browser beschikt weliswaar over een ingebouwde RSS-lezer, maar die doet onder voor (gratis verkrijgbare) externe RSS-lezers. Overigens zijn er voor Firefox wel speciale volwaardige RSSuitbreidingen beschikbaar, zoals Sage (https://addons.mozilla.org/nl/firefox/ addon/77/) en infoRSS (https://addons.mozilla.org/nl/firefox/addon/361/). Als serieuze researcher bent u echter beter af met een speciale RSS-lezer, dan met houtje-touwtjeoplossingen. Die RSS-lezer, waarover verderop in dit hoofdstuk meer, kan verschillende vormen aannemen. Zo zijn er speciale afzonderlijke programma’s waarin u RSS kunt gebruiken. Net zoals veel computeraars hun e-mail afhandelen in Outlook of Thunderbird, zo kunt u RSSinformatie bekijken met software als FeedDemon of NetNewsWire (waarover verderop in dit hoofdstuk meer). Goed uitgeslapen lezers zullen nu wellicht opmerken dat voor e-mail allang geen afzonderlijk programma meer nodig is. Elektronische post kan prima worden afgehandeld via een website als Gmail (www.gmail.com). Deze lezers hebben gelijk. U hebt ook de mogelijkheid om een online RSS-lezer te gebruiken, zoals Google Reader (zie elders in dit hoofdstuk). Dat heeft voordelen, want u kunt dan overal bij uw RSS-informatie, maar ook nadelen, want online RSS-lezers zijn (vooralsnog) relatief traag in het gebruik.
186
Handboek – Internetresearch
Met alleen een RSS-lezer bent u er niet. De site die u met behulp van een RSS-lezer wilt volgen, moet zelf de RSS-technologie ondersteunen. RSS is een tweetrapssysteem. Met alleen een RSS-lezer schiet u als researcher niets op als de website die u in de gaten wilt houden geen RSS-informatie aanbiedt. De plek waarop die RSS-informatie te vinden is, heet een RSS-feed of RSSkanaal. Het adres van zo’n RSS-feed ziet eruit als een gewoon webadres, bijvoorbeeld www.zachtei.nl/index.rdf of www.arjandasselaar.nl/feed/. Eenmaal opgenomen in een RSS-lezer kan de feed worden gevolgd. Wie veel research doet naar specifieke, steeds terugkerende onderwerpen, is gebaat bij diverse feeds van de sites die hij of zij nu nog vaak bezoekt.
Afbeelding 10.1
Met alleen een browser RSS-feeds raadplegen werkt niet
echt handig.
10h001 Hoe RSS helpt bij research Wanneer op een site met RSS-ondersteuning nieuwe informatie verschijnt, zal dit automatisch in de RSS-lezer verschijnen. Daardoor bespaart RSS meestal tijd. Naar een site toegaan om te zien of er al nieuws is, kan betekenen dat het gezochte nieuws er nog niet staat (waarmee tijd is verspild) of het gezochte nieuws er al stond (waardoor de researcher wellicht een informatieachterstand heeft opgelopen). RSS toont informatie over het algemeen sneller, al kan de eigenaar van een RSS-feed besluiten om zijn feed slechts eens per uur, of per dag, of zelfs per week bij te werken.
187
Hoofdstuk 10 – Nieuws vergaren met RSS
Omdat RSS zo efficiënt werkt, is het ook mogelijk om meer sites in de gaten te houden dan handmatig haalbaar is. Zelfs de meest fanatieke researcher houdt het vermoedelijk niet vol om dagelijks getrouw tientallen sites af te stropen. Daarbij komt dat de informatie die via RSS binnenkomt veel makkelijker te structureren is dan informatie op een website. RSS-lezers bieden over het algemeen de mogelijkheid om de informatie uit RSS-feeds naar wens te filteren en te sorteren. Zo is het bijvoorbeeld mogelijk om berichten van verschillende feeds over Amerikaanse politiek in één map terecht te laten komen. Researchers kunnen zo eenvoudig een overzicht krijgen van wat op een bepaald terrein speelt, en researchers die meerdere onderwerpen in de gaten moeten houden, wordt het via RSS makkelijker gemaakt om prioriteiten te stellen. Wie een dag geen tijd heeft om te lezen wat voor nieuws het weblog etruskischewoestijnbevers.web-log.nl biedt over het uitsterven van de Etruskische woestijnbever, slaat simpelweg de map Etruskische woestijnbevers over en klikt in zijn RSS-lezer alleen op de belangrijkere onderwerpen.
Het voordeel van RSS boven nieuwsbrieven Wellicht hebt u inmiddels een parallel tussen RSS en nieuwsbrieven ontdekt. Ook bij nieuwsbrieven komt het nieuws grotendeels naar u toe en met een goed e-mailprogramma is het mogelijk om die nieuwsbrieven ook nog keurig op onderwerp te laten sorteren. Toch zijn er grote verschillen. Zo ligt bij nieuwsbrieven het primaat volledig bij de verzender. De ontvanger kan alleen maar afwachten wanneer de nieuwsbrief komt, en dat is vaak dagelijks of wekelijks. In de tussentijd moet deze maar afwachten. Bovendien kosten nieuwsbrieven meer tijd, omdat ze meer ballast met zich meebrengen, zoals afbeeldingen en advertenties. RSS levert meestal alleen ‘pure’ informatie, die bovendien vaak verfijnder is. (Helaas zijn RSS-feeds met ingebouwde advertenties wel in opkomst.) Want waar bijvoorbeeld kranten slechts één of hoogstens een paar verschillende nieuwsbrieven aanbieden, publiceert de Britse kwaliteitskrant The Daily Telegraph maar liefst enkele tientallen afzonderlijke RSS-feeds (www.telegraph.co.uk/rssfeeds/). De inhoud van die feeds varieert van zeer specifiek tot zeer algemeen, zodat verschillende lezersgroepen hun berichtenstroom zo breed of zo smal kunnen maken als ze zelf wensen. En waar het abonneren op drie verschillende nieuwsbrieven van een krant behoorlijk wat extra leestijd kost – iedere e-mail moet immers worden geopend – kunnen de berichten uit drie verschillende RSS-feeds automatisch door de RSS-lezer worden gesorteerd, waarna u zelf een betere selectie kunt maken van wat u wel of niet wilt lezen.
188
Handboek – Internetresearch
Afbeelding 10.2
10h002
The Daily Telegraph biedt zijn lezers veel keuze in RSS-feeds.
Een soortgelijke keuzevrijheid is er bij de nieuwszoekmachine Google Nieuws (nieuws.google.nl). Niet alleen op het hoofdscherm, maar ook wanneer u een zoekopdracht invoert, krijgt u links de tekst RSS te zien. Met de woorden waarmee u zoekt, bepaalt u dus zelf de inhoud van de RSS-feed.
Afbeelding 10.3 Het laatste nieuws over het enige echte bier van Nederland in uw eigen RSS-lezer. Als dat geen vooruitgang is!
189
Hoofdstuk 10 – Nieuws vergaren met RSS
10grolsch
Ten slotte is daar het probleem ‘spam’. Veel internetgebruikers klagen over een overvolle postbus en het abonneren op een nieuwsbrief is niet zonder risico: de kans dat het opgegeven e-mailadres bijvoorbeeld bij faillissement in verkeerde handen komt, met nog meer e-mail tot gevolg, is verre van nul. Bij RSS hoeft een researcher geen persoonlijke informatie prijs te geven. Daarbij is het de vraag hoe lang nieuwsbrieven nog interessant zullen blijven voor uitgevers. Veel nieuwsbrieven bestaan bij de gratie van advertenties, en die worden steeds vaker geblokkeerd door e-mailprogramma’s. Zelfs marktleider Microsoft, toch niet de meest vooruitstrevende softwarefabrikant ter wereld, heeft in zijn e-mailprogramma Outlook aanpassingen gemaakt die het adverteerders lastig maken. Standaard worden afbeeldingen in courante Outlook-versies niet getoond, en daar moeten veel uitgevers het wat betreft hun inkomsten juist van hebben.
Welke sites bieden RSS? Niet iedere site beschikt al over een RSS-feed, maar drie categorieën sites doen dat vaak wel, en deze zijn voor researchers zeer interessant.
Weblogs Weblogs zijn sites die korte berichten in dagboekvorm brengen, gesorteerd op datum, geschreven op een persoonlijke toon en vaak karig vormgegeven. Vaker wel dan niet beschikken ze over een RSS-feed. Hoewel het weblog vooral bekend is als uithuilplek voor veertienjarigen die hun geliefde betreu-
Afbeelding 10.4 Een typisch persoonlijk weblog, in dit geval van de auteur van dit boek, die er ook regelmatig beschouwingen over journalistieke (on)kunde op plaatst.
190
Handboek – Internetresearch
ren en foto’s van de hond met de wereldgemeenschap menen te moeten delen, zijn er ook serieuze varianten. 10h003
Het blijkt dat weblogs steeds vaker worden gebruikt door personen die op een bepaald terrein deskundig zijn en via een weblog hun kennis delen. Zo houdt de Amerikaan Rand Simberg een weblog bij over ontwikkelingen in de ruimtevaartindustrie (www.transterrestrial.com) en schrijft Derek Lowe op zijn site (www.corante.com/pipeline) regelmatig over nieuwe bevindingen in de zoektocht naar betere medicijnen. Ook Nederlanders ontbreken niet. Inmiddels zijn er honderdduizenden blogs in dit land, waarvan het niveau overigens sterk uiteenloopt (zie ook www.arjandasselaar.nl/thefifthestate.pdf). Zoals uit het voorgaande al een beetje blijkt, is het weblog onder journalisten groot. Zeker in de Verenigde Staten. Relatief bekend is Andrew Sullivan (www.andrewsullivan.com), een homoseksuele Britse Amerikaan die op zijn log commentaar geeft op politieke en morele ontwikkelingen in de Verenigde Staten. Henk Blanken, adjunct-hoofdredacteur van het Dagblad van het Noorden, schrijft op www.henkblanken.nl over ontwikkelingen op mediagebied.
Afbeelding 10.5 Journalist en homoseksueel Andrew Sullivan becommentarieert op zijn weblog Amerikaanse politieke en morele ontwikkelingen.
Blogs zijn volwassen geworden. Ook kwaliteitskranten als NRC Handelsblad laten hun redacteuren tegenwoordig bloggen (zie bijvoorbeeld weblogs.nrc.nl/weblog/opklaringen). De Volkskrant richtte een speciale weblogdienst in voor lezers én redacteuren (www.volkskrantblog.nl). En het zakenblad Quote is al geruime tijd actief op www.quotenet.nl.
191
Hoofdstuk 10 – Nieuws vergaren met RSS
Afbeelding 10.6 Adjunct-hoofdredacteur Henk Blanken van het Dagblad van het Noorden pakt op zijn blog regelmatig zijn collega-journalisten aan.
Weblogs zijn voor researchers zeer interessant. Zo wordt er in blogs vaak verwezen naar broninformatie. In reguliere berichtgeving ontbreken dergelijke hyperlinks nogal eens. Een ander voordeel is dat veel blogs worden bijgehouden door personen met expertkennis van een bepaald onderwerp.
Afbeelding 10.7
192
NRC Handelsblad.
Handboek – Internetresearch
Afbeelding 10.8 Zakenblad Quote bedient lezers met berichten over de Hollandse zakenwereld.
Hierdoor geven dergelijke blogs vaak vroeg en diepgaand inzicht in nieuwe ontwikkelingen. RSS-feeds van de juiste weblogs van de juiste deskundigen bijhouden, kan zo een informatievoorsprong geven. 10quote 10nrc 10blanken 10sullivan Nieuwssites Het nut dat websites van kranten, tijdschriften en andere media kunnen hebben voor researchers, behoeft geen toelichting. Dat steeds meer van deze sites RSS gebruiken om hun informatie te verspreiden, behoeft dat wel. Met name de Engelstalige media weten wel raad met RSS. De hiervoor genoemde Britse, rechtse kwaliteitskrant The Daily Telegraph (www.telegraph.co.uk) is niet de enige met een forse selectie aan verschillende RSS-feeds (www.telegraph.co.uk/rssfeeds/). Ook het Nederlandse opinieweekblad Elsevier doet fanatiek mee (www.elsevier.nl/web/Service/ RSS.htm). Het aantal RSS-feeds van de Britse publieke omroep BBC is eveneens aanzienlijk (news.bbc.co.uk/2/hi/help/rss). In het algemeen geldt: hoe meer feeds, hoe beter, aangezien u dan kunt beschikken over fijnmaziger informatie. Speciale vermelding verdient daarom de Volkskrant, die het mogelijk maakt om feeds op maat te maken (www.volkskrant.nl/service/article309771.ece#rss). Over een soortgelijke
193
Hoofdstuk 10 – Nieuws vergaren met RSS
functionaliteit beschikken de al eerder genoemde nieuwszoekmachines van Google (nieuws.google.nl en news.google.com/news?ned=us).
Afbeelding 10.9 Handig als u alleen de commentaren wilt lezen, of juist alleen het nieuws.
Zelf een RSS-feed op maat maken is heel eenvoudig. Een kind kan de was doen (qua Bush is wat meer twijfel wellicht gerechtvaardigd).
Afbeelding 10.10
194
Handboek – Internetresearch
10volkskrant 10elsevier Bedrijven Bij het bedrijfsleven heeft de opkomst van RSS minder voortvarend toegeslagen. En dat is jammer. Juist sites van bedrijven worden onregelmatig bijgewerkt, maar zouden gebaat zijn bij een RSS-feed, om zo de researcher te verlossen van verplichte maar lang niet altijd zinvolle tochtjes naar de site om te kijken of die al is bijgewerkt. Gelukkig wordt bijvoorbeeld in de informatietechnologie al wel met RSS gewerkt. Zo publiceert Google RSS-feeds met persberichten voor journalisten (http://googlepress.blogspot.com/feeds/ posts/default).
NRC Handelsblad, de Volkskrant, Trouw, het Algemeen Dagblad, De Telegraaf: allemaal bieden ze inmiddels RSS-feeds aan.
Afbeelding 10.11
195
Hoofdstuk 10 – Nieuws vergaren met RSS
Het hoeft geen verbazing te wekken dat Google tijdig inspeelt op nieuwe technologieën.
Afbeelding 10.12
Verschillende standaarden
10mspers 10kranten
Het is onvermijdelijk in de computerindustrie: zodra er iets nuttigs wordt bedacht, bedenken nerds over de hele wereld verschillende manieren om hetzelfde te doen. Zoals een oude techneutengrap luidt: het mooie van standaarden is dat er zoveel zijn om uit te kiezen. In het geval van RSS betekent dit dat er inmiddels diverse varianten zijn bedacht (te weten 0.90, 0.91, 0.92, 0.93, 0.94, 1.0, 2.0 en 2.0.1, al worden deze niet allemaal in de praktijk gebruikt). Daarnaast woedt er al enige tijd een (voor niet-nerds grotendeels oninteressante) ruzie tussen RSS en makers van een alternatief dat Atom heet. Voor de eindgebruiker heeft al dit technische gehakketak hoogstens nadelen. U wilt immers zonder problemen alle RSS-feeds die u tegenkomt kunnen lezen zonder op problemen te stuiten, omdat de desbetreffende site toevallig net een afwijkende RSS-variant gebruikt. In de paragraaf RSS lezen staat daarom aangegeven of de diverse RSS-lezers, computerprogramma’s om RSS-feeds te gebruiken, wel alle beschikbare technische varianten ondersteunen, zodat u zo min mogelijk last hebt van deze controverse.
196
Handboek – Internetresearch
RSS-versie Vuistregel: Mocht u op een site kunnen kiezen uit RSS-feeds in meerdere technische smaken, kies dan de variant met het hoogste getal. Vaak is dit RSS 2.0. In weerwil van wat nerds zullen beweren, maakt het voor researchdoeleinden weinig uit welke variant u kiest. Sites die Atom gebruiken, bieden lang niet altijd een RSS-feed aan: daar is de keuze dus makkelijk.
RSS lezen Voordat RSS-feeds gelezen kunnen worden, is eerst een speciale RSS-lezer nodig. Hieronder worden kort vier van dergelijke programma’s besproken. Ook komt de ietwat omslachtige mogelijkheid aan de orde om RSS-feeds te volgen zonder extra software, en wel via online diensten.
FeedDemon – www.feeddemon.com Al lange tijd is FeedDemon een van de beste RSS-lezers op de markt. Het enige nadeel was dat FeedDemon geld kostte. Maar die tijd is voorbij. Thans is FeedDemon gratis. FeedDemon kan met alle smaken RSS-feeds overweg. Atom levert evenmin problemen op. Zit u op een site en kunt u het adres van de RSS-feed niet vinden? Geef FeedDemon dan alleen het adres van de site. In nogal wat gevallen is het programma zelf in staat te achterhalen waar de RSS-feed zich bevindt. Dit werkt overigens minder briljant bij sites die meerdere RSS-feeds hebben, zoals kranten. FeedDemon bevat een ingebouwde webbrowser.
Afbeelding 10.13
FeedDemon heeft onder meer een ingebouwde internet-
browser.
197
Hoofdstuk 10 – Nieuws vergaren met RSS
10feeddemon FeedReader – www.feedreader.com Een gratis RSS-lezer die zowel RSS als Atom ondersteunt. Voor Windowsgebruikers met een krappe beurs is FeedReader een aanrader. Niet-Windows-gebruikers kunnen echter niet met FeedReader werken; zij zijn dus op een alternatief aangewezen, zoals – bijvoorbeeld – NetNewsWire of Mozilla Thunderbird.
Afbeelding 10.14
Een prima gratis RSS-lezer.
10feedreader Snarfer – www.snarfware.com Deze RSS-lezer valt op door de kleine bestandsgrootte bij installatie. Het compacte programmeerwerk heeft een gunstig effect op de snelheid van Snarfer.
198
Handboek – Internetresearch
Een lollig logo moet deze dertien-in-een-dozijn RSS-lezer enig onderscheidend vermogen geven.
Afbeelding 10.15
10snarfer Sharpreader – www.sharpreader.net Simpel, eenvoudig, goed, snel en gratis. Sharpreader doet wat het moet doen, en zonder al te veel problemen. Wel jammer dat eerst het zogeheten .NET Framework geïnstalleerd moet worden, een nogal grote uitbreiding op Windows die Sharpreader het werken mogelijk maakt. Leest zowel RSS als Atom.
RssReader – www.rssreader.com Nog een gratis RSS-lezer, die eveneens RSS en Atom ondersteunt. Ook RssReader werkt snel en goed, en vereist installatie van het .NET Framework. Welke van de gratis lezers u kiest, is dan ook vooral een kwestie van smaak en individuele computereigenaardigheden: soms werkt een RSS-lezer op de ene configuratie probleemloos, om op een andere pc niet vooruit te branden te zijn.
199
Hoofdstuk 10 – Nieuws vergaren met RSS
NetNewsWire – http://netnewswireapp.com/ (OS X) Een van de betere RSS-lezers voor gebruikers van een Apple-computer. Kent enthousiaste fans, zoals sf-schrijver, internetjournalist en ‘nerdgoeroe’ Cory Doctorow.
Afbeelding 10.16
Ooit moest u betalen voor dit programma, tegenwoordig
is het gratis.
10netnewswire Mozilla Thunderbird – www.mozilla-europe.org/nl/products/thunderbird/
(Windows, Linux, OS X) Mac-gebruikers die niet tevreden zijn over NetNewsWire of RSSOwl kunnen een poging wagen met Mozilla Thunderbird. Eigenlijk is dit een e-mailprogramma, maar het bevat ingebouwde RSS-ondersteuning. Erg prettig: Thunderbird is beschikbaar voor Windows, OS X én Linux.
RSSOwl – www.rssowl.org (Windows, Linux, OS X) RSSOwl is een zogeheten cross-platform-RSS-lezer. In gewoon Nederlands betekent deze scrabbleterm dat RSSOwl voor meerdere computersystemen
200
Handboek – Internetresearch
Afbeelding 10.17
Met RSSOwl leert u heel snel oehoe u met RSS werkt.
beschikbaar is. Behalve Windows-gebruikers kunnen ook Apple-bezitters daarom met RSSOwl aan de slag, mits ze over OS X beschikken. RSSOwl werkt daarnaast ook onder Linux. Veiligheidskopie Niets is zo frustrerend als het kwijtraken van uw volledige lijst met RSS-feeds. Daarom bieden veel RSS-lezers de mogelijkheid om van deze lijst een veiligheidskopie te maken. Zoek hiervoor naar de optie om zogeheten OPML-bestanden te maken. U vindt deze optie in de gebruiksaanwijzing van uw RSS-lezer. Deze gebruiksaanwijzing is vaak te vinden onder de knop F1. In een OPML-bestand kan een lijst met RSS-feeds worden opgeslagen. OPLM-bestanden zijn ook bruikbaar om lijsten met favoriete feeds uit te wisselen met anderen.
201
Hoofdstuk 10 – Nieuws vergaren met RSS
Andermans feeds Bij Veiligheidskopie hebt u kunnen lezen hoe u eigen RSS-feeds kunt veiligstellen in een zogeheten OPML-bestand. Wat let u om via Google te zoeken naar andermans OPML-bestanden? Door simpelweg te zoeken op een onderwerp en het woord ‘opml’ kunt u soms zeer interessante lijsten met RSS-feeds tegenkomen.
RSS-feeds bekijken via websites Diverse websites zijn behulpzaam bij het in de gaten houden van RSS-feeds zonder dat hiervoor software hoeft te worden geïnstalleerd. Dat is handig, want dan kunt u overal met uw eigen RSS-feeds werken zolang er maar een internetverbinding aanwezig is. (En zelfs dat hoeft niet altijd – zie Google Reader verderop.) Hier volgen beknopt nog enkele belangrijke RSS-sites.
Google Reader – www.google.com/reader Warm aanbevolen door de auteur van dit boek, die anno 2010 – naast Twitter – bijna niets anders meer gebruikt om bij te blijven. Een groot voordeel van Google Reader en andere online RSS-lezers is zoals gezegd dat u overal waar maar een internetaansluiting aanwezig is, uw persoonlijke RSS-feeds kunt bekijken. Maar Google Gears gaat verder. Zo doen laptopgebruikers er goed aan om in combinatie met Google Reader het gratis programma Google Gears (gears.google.com) te gebruiken. Hiermee kunt u uw RSS-feeds downloaden en deze later bekijken op plekken waar geen internettoegang beschikbaar is. Bijvoorbeeld in de trein op weg naar uw werk. (Of op de achterbank van uw auto met chauffeur.) Hebt u al een RSS-lezer op uw pc geïnstalleerd, dan is het goed om te weten dat u via Google Reader uw OPML-bestand kunt uploaden, zodat u niet handmatig al uw RSS-feeds opnieuw hoeft in te voeren.
Bloglines – www.bloglines.com Twijfelgeval, want de site werd in 2009 al op sterven na dood verklaard door de bekende technologiesite Techcrunch.com. Op Bloglines is het mogelijk een persoonlijk profiel te maken waarin alle gewenste RSS-feeds kunnen worden opgeslagen. Het voordeel van deze aanpak is dat dit profiel overal ter wereld te raadplegen is, dus ook in internetcafés in verre oorden. Nadeel: hoewel Bloglines nu nog gratis is, kan dat altijd veranderen. Zo’n stap zal Google niet zo snel zetten. Nog groter is het risico dat Bloglines er gewoon mee ophoudt.
202
Handboek – Internetresearch
Lidmaatschap van Bloglines geeft toegang tot diverse praktische diensten.
Afbeelding 10.18
RSS-feeds vinden Zonder feeds is een RSS-lezer waardeloos, maar waar vindt u ze? Sommige sites maken het overduidelijk dat ze een RSS-feed aanbieden; andere verstoppen hun feeds en er zijn zelfs websites die zelf geen RSS gebruiken, maar die zo populair zijn dat een externe partij deze taak van ze heeft overgenomen. Grofweg zijn er vijf manieren om RSS-feeds te vinden, die in de volgende paragrafen worden besproken.
1 – Via RSS-zoekmachines Soms kan een zoekmachine helpen. Er zijn diverse gespecialiseerde sites die zich voornamelijk op blogs richten. Die hebben bijna per definitie een RSSfeed, zeldzame uitzonderingen daargelaten. Google Blog Search – blogsearch.google.com Via Google Blog Search kunt u niet alleen blogs vinden over onderwerpen die u interesseren en vervolgens de RSS-feeds daarvan toevoegen aan uw lezer, maar ook RSS-feeds maken waarbij u alle door Google Blog Search geïndexeerde blogs op een door u te specificeren zoekopdracht kunt volgen. Tip: als u een oogje wilt houden op wat er over uw bedrijf of organisatie wordt gezegd, voer dan het webadres (bijvoorbeeld www.unilever.nl) in als zoekopdracht.
203
Hoofdstuk 10 – Nieuws vergaren met RSS
Afbeelding 10.19
Via de RSS-optie kunt u zoekopdrachten in uw RSS-lezer
volgen.
10blogsearch
Technorati – www.technorati.com Niet meer de beste, maar nog altijd de moeder aller blogzoekmachines: Technorati. Ook kunt u via Technorati gepersonaliseerde zoekopdrachten uitzetten en hiervan een RSS-feed in uw RSS-lezer opnemen. Handig als u bijvoorbeeld in de gaten wilt houden of uw bedrijf of uzelf ergens op een weblog wordt genoemd. Icerocket – www.icerocket.com Icerocket is een relatief onbekende blogzoekmachine, maar presteert ondanks dat prima. U kunt Icerocket gebruiken om de resultaten van Technorati en Google Blog Search aan te vullen.
2 – Via de site zelf Sommige sites maken zelf duidelijk dat ze een RSS-feed aanbieden. Vaak wordt ergens op de pagina een oranje rechthoek met de letters XML getoond om dat aan te geven. Niet alle sites zijn echter zo duidelijk. Soms is de RSSfeed verstopt. Probeer in zo’n geval eerst de tekst van de hoofdpagina van de site te doorzoeken op de termen RSS en XML. Dit doorzoeken doet u door de toetsen Ctrl en F tegelijkertijd in te drukken als de internetbrowser actief is (zie afbeelding 10.20 en 10.21).
204
Handboek – Internetresearch
Het is handig om, in de zoekbalk onderin, eerst te zoeken op RSS, en pas XML in te vullen als u daarmee geen resultaat boekt.
Afbeelding 10.20
En zo gaat u te werk in Internet Explorer. Merk op dat de zoekbalk die verschijnt na het invoeren van Ctrl + F in dit geval bovenin het scherm verschijnt.
Afbeelding 10.21
10rssie 10rssxml
Als de site een eigen zoekmachine heeft, dan kan het zin hebben om de site te doorzoeken op diezelfde termen. Het voordeel van die benadering is dat de zoektocht zich dan niet beperkt tot de hoofdpagina. Groot nadeel is dat lang niet alle sites een eigen zoekmachine hebben en dat de sites die er wel over beschikken vaak niet in de meest briljante zoektechnologie hebben geïnvesteerd. Voor een echt grondige zoektocht kan het daarom soms nodig zijn uit te wijken naar Google (zie Via Google).
205
Hoofdstuk 10 – Nieuws vergaren met RSS
Een andere truc, die echter geen succes garandeert, is om te spelen met de domeinnaam van de site. RSS-feeds bevinden zich vaak op dezelfde plek binnen een site. Het webadres waar de RSS-feeds te vinden zijn, eindigt daarnaast bijna standaard op xml of rdf (Resource Description Framework). Zo hebben veel RSS-feeds een webadres volgens de formule: www.naamvansite.nl/index.rdf of www.naamvansite.nl/index.xml of www.naamvansite.nl/rss/index.rdf of www.naamvansite.nl/rss/index.xml of www.naamvansite.nl/feed/. Toegepast op de website www.zachtei.nl zal de RSS-feed zich dus mogelijk bevinden op www.zachtei.nl/index.rdf. In dit voorbeeld is dat inderdaad het geval, maar een vrij internet brengt met zich mee dat niet iedereen zich even voorspelbaar gedraagt. Bovendien is het mogelijk dat u andere RSS-feeds van dezelfde site op deze manier over het hoofd ziet.
3 – Via directory’s – www.newsisfree.com/sources/bycat Internet heeft gidsen voor zo’n beetje alles en dus zijn er ook directory’s of indexen waarin allerhande RSS-feeds samen zijn gebracht. Op de site Newsisfree (www.newsisfree.com/sources/bycat/) zijn veel interessante nieuwsbronnen samengebracht, keurig gerubriceerd op onderwerp zoals technologie, wetenschap of sport. Ook kan er op de naam van een medium worden gezocht. Een waarschuwing is op zijn plaats: Newsisfree bevat niet alleen verwijzingen naar bestaande RSS-feeds van andere media, maar biedt ook eigen feeds aan met daarin inhoud uit andere media. Wie de RSS-feed van de New York Times selecteert, krijgt dus niet rechtstreeks de informatie van de New York Times, maar een door Newsisfree bewerkte versie. Deze aangepaste feeds bevatten over het algemeen minder berichten dan de originele feeds. Ook is er reclame voor Newsisfree aan toegevoegd en dat zal door sommige researchers als irritant worden ervaren. Het kan dus raadzaam zijn om zelf op zoek te gaan naar een alternatief voor sommige Newsisfree-feeds (zie Via Google).
4 – Via Google Raar maar waar: sommige websites hebben een RSS-feed, maar geven er geen ruchtbaarheid aan. Daar kunnen verschillende redenen voor zijn: soms betreft het een testfeed, soms gaat het om een voorziening voor intern gebruik en in andere gevallen is de website simpelweg nalatig geweest door onvoldoende aandacht te geven aan de feed. In al deze scenario’s is het echter vaak mogelijk om via Google alsnog achter de locatie van de RSS-feed te komen. Hiervoor maken we onder meer gebruik van de opdracht site: die in hoofdstuk 3 aan de orde is gekomen. 10h004
206
Handboek – Internetresearch
De categorie-indeling van Newsisfree maakt het mogelijk snel te zoeken naar thematische RSS-feeds op nieuwssites.
Afbeelding 10.22
1 Probeer allereerst via Google binnen de website van het desbetreffende medium te zoeken of er sprake is van een RSS-feed. Als voorbeeld gebruiken we de New York Times. Die website heeft als adres www.nytimes.com. Het eerste gedeelte van de zoekopdracht wordt dus site:nytimes.com. Daarmee zijn we er nog niet, want we moeten Google ook vertellen dat we op zoek zijn naar een RSS-feed. De meest simpele methode om dat te doen is middels de zoekterm rss. De volledige zoekopdracht wordt zo site:nytimes.com rss. 2 Als dat niet heeft gewerkt, is het altijd nog mogelijk om te zoeken op een van de specifieke kenmerken van een RSS-feed. Zoals we bij Via de site zelf hebben gezien, eindigt het webadres van een feed vaak op rdf of xml. Omdat de afkorting rdf minder courant is dan xml en we het aantal valse treffers zoveel mogelijk willen beperken, beginnen we dus met te zoeken naar rdf. De zoekopdracht wordt dan: site:nytimes.com rdf. 3 Mocht dit niet het gewenste resultaat opleveren, probeer het dan met site:nytimes.com xml. Het risico op valse treffers wordt hierbij overigens fors groter, want xml is een veelgebruikte afkorting. In dit voorbeeld levert het vele pagina’s op die eindigen op xml, maar niets te maken hebben met RSS.
207
Hoofdstuk 10 – Nieuws vergaren met RSS
4 Omdat het ook goed mogelijk is dat een onafhankelijke derde een RSSfeed heeft gemaakt, kunt u vervolgens nog een poging wagen zonder de opdracht site:. Daarbij moet u dan wel de volledige naam van het medium gebruiken. De zoekopdracht wordt nu “new york times” rss. Daarna kunt u op dit stramien de stappen 2 en 3 toepassen, zodat u de zoekopdrachten “new york times” rdf en “new york times” xml verkrijgt. De echte durfals zoeken daarna nog op “new york times” opml, in de hoop dat ergens een bestand rondzwerft met daarin meerdere feeds. Mocht u na het volgen van het bovenstaande stappenschema nog geen succes hebben, dan rest nog één laatste mogelijkheid: het zelf maken van een RSS-feed voor de desbetreffende site.
5 – Zelf een RSS-feed maken Deze optie heet ook wel scraping – u schraapt als het ware uw eigen feed bij elkaar – maar is niet risicovrij. Wanneer u gebruikmaakt van een van de nu volgende diensten om zelf een RSS-feed te creëren, bent u in feite iets aan het doen dat de maker van de website die u wilt volgen, niet heeft voorzien (of heeft gewild). Dankzij technische kunstgrepen is het weliswaar mogelijk om de inhoud van een website geautomatiseerd om te zetten in een RSSfeed, maar dat brengt met zich mee dat een computer moet gaan interpreteren wat er op de betreffende website gebeurt. U raadt het al: daar maken computers nogal eens wat fouten in. Wie met deze relativering in het achterhoofd aan het werk gaat, bespaart zichzelf teleurstellingen. Feedity – feedity.com Werkt heel simpel. Voer het adres in van de website waarvoor u een RSSfeed wilt. Klik vervolgens op Preview. U krijgt nu de informatie te zien die Feedity uit de pagina weet te extraheren. Het resultaat kunt u rechts nog verfijnen, of u kunt gelijk kiezen voor Get feed. In dat laatste geval moet u wel een categorie selecteren. 10feedity
FeedYes – www.feedyes.com De werking van FeedYes lijkt sterk op die van Feedity, met dit verschil dat u de vraag krijgt in welke taal de website die u wilt gaan volgen is geschreven. Feed43 – feed43.com Voor nerds. Feed43 onderscheidt zich door nadrukkelijk de mogelijkheid te bieden zelf aan de te genereren RSS-feed te knutselen.
208
Handboek – Internetresearch
Afbeelding 10.23
Feedity.
Ponyfish – www.ponyfish.com Om achter de hand te houden als de voorgaande sites om wat voor reden dan ook niet bereikbaar zijn. Als u op deze site een RSS-feed wilt maken, moet u bereid zijn de portemonnee te trekken, óf genoegen te nemen met grote beperkingen.
209
11
Usenet
L
ang voordat het World Wide Web populair werd, was Usenet er al. Dit discussienetwerk duikt voor het eerst op in 1979 en is dan voornamelijk het terrein van academici, al dan niet in opleiding, en de relatief zeldzame hobbyisten die toegang hebben tot het vroege internet. Ook nu wordt Usenet nog veel gebruikt, zij het door een aanzienlijk heterogener gezelschap dan in 1979. Omdat de gesprekken op Usenet sinds 11 mei 1981 zijn gearchiveerd, kan de dienst voor researchers groot nut hebben.
U leert in dit hoofdstuk:
Wat Usenet is en hoe het is opgebouwd. Welke soorten research baat hebben bij Usenet. Hoe u binnen Usenet zoekt. Hoe u Usenet-research deels automatiseert. Welke software nodig is voor langdurige Usenet-research.
Hoofdstuk 11 – Usenet
Wat is Usenet? Usenet staat voor Unix User Network. Dat is een verwijzing naar het besturingssysteem Unix, dat in de begindagen van internet net zo dominant was als Microsoft Windows nu. Het werd in 1979 bedacht door Tom Truscott, Jim Ellis en Steve Bellovin. Op het vroege internet werden via Usenet discussies gevoerd. Usenet gebruikt daarvoor een zogeheten prikbordsysteem. Dat houdt in dat deelnemers een bericht achterlaten als ware het een notitie op een prikbord. Andere Usenet-gebruikers kunnen dit bericht later lezen en erop reageren door er een elektronisch kattebelletje onder te hangen. Anders dan chatdiensten (zie hoofdstuk 13) zijn Usenet-discussies niet aan tijd gebonden. Deelnemers hebben de vrijheid om een seconde, maar ook een minuut, een uur, een dag of een week later te reageren.
Toepassingen van Usenet Het vroege Usenet was serieus: de aanwezige humor ging vaak over computers en sciencefiction, oftewel typische nerdzaken. Toen de Nederlander Piet Beertema op 1 april 1984 een grap uithaalde waarbij hij zich uitgaf voor Konstantin Chernenko, de toenmalige secretaris-generaal van de Sovjet-Unie, viel dat dan ook niet bij iedereen in goede aarde. De notie dat een Sovjetleider toegang had tot een door Amerikanen gedomineerd Usenet, bleek voor sommigen nogal beangstigend. Toen duidelijk werd dat ‘Chernenko’ in feite een Nederlander was, kreeg Beertema niet louter waarderende reacties te verwerken.
Afbeelding 11.1
212
Piet Beertema in zijn volle glorie.
Handboek – Internetresearch
Afbeelding 11.2
11h001 11h002
De meest geslaagde grap uit Beertema’s leven.
Grofweg zijn er drie terreinen waarop Usenet tegenwoordig wordt toegepast. • Discussiëren De oorspronkelijke toepassing van Usenet: het voeren van serieuze gesprekken over bepaalde onderwerpen. Voor research zijn deze serieuze discussies nuttig omdat ze vaak informatie kunnen opleveren over zeer obscure onderwerpen. Ook kan Usenet gebruikt worden om inzicht te krijgen in verhitte wetenschappelijke debatten. • Ouwehoeren Omdat internet tegenwoordig vooral gebruikers heeft buiten de traditionele groep van wetenschappers en computerliefhebbers, is het serieuze gehalte van Usenet de afgelopen jaren gedaald. Hoewel de technische complexiteit van Usenet (gelukkig) een drempel opwerpt voor al te grote groepen gebruikers, blijven er nog voldoende slimme internetgebruikers over met te veel tijd. Dat heeft geleid tot het ontstaan van discussieforums op Usenet waar werkelijk geen enkel zinvol gesprek plaatsvindt. Een voorbeeld is de Nederlandse discussiegroep nl.eeuwig.september. (Ter verdediging van de bijzonder fanatieke deelnemers van nl.eeuwig.september moet hier wel worden opgemerkt dat zij kwalitatief zeer hoogwaardige onzin produceren, en dat ook al meer dan een decennium volhouden.) Voor researchers is het ouwehoergedeelte van Usenet niettemin interessant, omdat u soms tot verbazingwekkende inzichten kunt komen over de deelnemers aan dergelijke debatten. Dat zou bijvoorbeeld iemand kunnen zijn naar wie u net research doet. Het voormalige LPF-Kamerlid Cor Eberhard kan hierover meepraten, en hij is verderop in dit hoofdstuk dan ook lijdend voorwerp van een voorbeeldzoektocht door Usenet.
213
Hoofdstuk 11 – Usenet
• Illegale praktijken Hoewel Usenet oorspronkelijk bedoeld is als digitaal prikbord waar eenieder zijn kattebelletjes kwijt kan, wordt het tegenwoordig ook gebruikt voor het achterlaten van pakketjes met geheelde goederen. Het uitwisselen van illegaal gekopieerde films, muziek en software is voor sommige Usenet-gebruikers zelfs de enige reden om het aloude systeem te gebruiken. Daarnaast is Usenet een dankbare bron van vermaak voor pornoliefhebbers. Minder aangenaam is het dat via Usenet nog altijd kinderporno wordt verspreid. Helaas valt hier weinig aan te doen vanwege de doctrine ‘Hamster onder het tapijt’: wanneer de bobbel op de ene plek wordt platgetimmerd, verplaatst deze zich simpelweg naar een andere.
Het Usenet-idioom: wat betekent wat? Usenet heeft zijn eigen taaltje, waarvan enige kennis noodzakelijk is voordat u efficiënt research via dit discussienetwerk kunt doen. De belangrijkste begrippen zijn: • Article De naam voor een bericht op Usenet. Ook wel message of post. • Author De auteur van een bijdrage op Usenet. • Binaries Een andere naam voor Usenet-berichten die geen tekst bevatten, maar beeld, geluid of software. Binaries kennen vooral illegale toepassingen. • Discussiegroepen Zie nieuwsgroepen. • Groups De digitale variant van een thematische discussieruimte. Omdat Usenet een grote chaos zou worden als alle discussies door elkaar zouden gaan lopen, worden mogelijke gespreksonderwerpen onderverdeeld in groups. Groups zijn goed te vergelijken met thematische prikborden: voor discussies over fietsen moeten Usenet-bezoekers een ander prikbord gebruiken dan voor discussies over Nederlandse politiek. Usenet kent tegenwoordig vele tienduizenden groups voor vrijwel ieder denkbaar onderwerp. • Hiërarchie of hierarchy Zoals discussieonderwerpen omwille van de overzichtelijkheid zijn onderverdeeld in groups, zo zijn de groups zelf weer ondergebracht in hiërarchieën. Nederlandse groups vallen bijvoorbeeld onder de nl-hiërarchie, Belgische onder de be-hiërarchie. • Message Een andere naam voor article of post. • News reader Een gespecialiseerd programma om Usenet te gebruiken. • Nieuwsgroepen of news groups Een andere naam voor groups. • Post Een andere naam voor article of message. • Thread Letterlijk: draad. Op Usenet wordt hiermee een verzameling berichten over hetzelfde onderwerp aangeduid.
214
Handboek – Internetresearch
Het nut van Usenet voor research Usenet heeft twee nuttige toepassingen voor onderzoekers, te weten: • Research naar personen Het beschikbare archief van Usenet-discussies, waarover verderop meer, gaat terug tot 1981. In die tijd hebben grote aantallen internetgebruikers berichten achtergelaten op Usenet. Vaak zijn deze bewaard gebleven. De kans is dus zeer wel aanwezig dat u in Usenet-archiefmateriaal berichten tegenkomt die zijn geschreven door een persoon waarnaar u research doet. Ook is het mogelijk dat de desbetreffende persoon zelf onderwerp van gesprek is geweest. • Research naar onderwerpen Deze spreekt voor zich. Vanwege de tienduizenden discussieforums op Usenet zit er daar altijd wel een bij waarin actuele ontwikkelingen worden gevolgd op een terrein dat u interesseert. Helaas heeft op dergelijke onderwerpforums de eerder genoemde ouwehoerfactor vaak ongenadig hard toegeslagen. Niettemin blijft Usenet interessant voor onderwerpgerelateerde research, en zeker waar het onderwerpen betreft die zich enigszins buiten de gevestigde orde bevinden. Op discussieforums over voetbal komt u soms aan bronnen die u op officiële websites niet snel zult aantreffen, zoals verwijzingen naar sites met foto’s van hooligangeweld. Ook de polls van internet, oftewel: wat vindt ‘de internetgemeenschap’ van een onderwerp, is via Usenet vaak goed te peilen. Daar moet trouwens wel bij worden aangetekend dat dit, vanwege de hoge technische instapdrempel, niet voor alle onderwerpen geldt. Boze consumenten begeven zich bijvoorbeeld vaak op forums van websites in plaats van Usenet. Deze groep kunt u vinden via www.forumgrazer.net.
Google Discussiegroepen (Google Groups) gebruiken voor Usenet-research Google heeft grote hoeveelheden discussies sinds 1981 bewaard en op een website toegankelijk gemaakt. Die website heet Google Groups (Google Discussiegroepen voor de Nederlandse versie, maar dat bekt niet lekker) en is te vinden op groups.google.nl of groups.google.com. Tegenwoordig zijn op deze sites overigens ook Google-discussiegroepen te vinden die losstaan van Usenet. Zoeken via Google Groups doet u via het venster Geavanceerd zoeken. Dit zoekvenster werkt grotendeels hetzelfde als het venster Geavanceerd zoeken bij de ‘normale’ Google uit hoofdstuk 3.
215
Hoofdstuk 11 – Usenet
Afbeelding 11.3 Ga naar groups.google.nl en selecteer daar Geavanceerd zoeken in discussiegroepen.
Afbeelding 11.4 Van het venster dat nu wordt geopend, kunt u het best een bookmark maken.
11h004 11h003 Personen zoeken met Google Groups Voor het zoeken naar een persoon hebt u de naam nodig. Maar daarmee bent u er niet. Usenet is een discussieforum: er wordt zowel door als over mensen gepraat. Als voorbeeld gaan we een zoektocht doen naar Karin Spaink, een publicist die onder meer schreef voor de Amsterdamse krant Het
216
Handboek – Internetresearch
Parool en op internet bekendheid verwierf door haar juridische botsingen met de Scientology Kerk.
Afbeelding 11.5
Vul de naam Karin Spaink in bij De exacte woorden of het
zinsdeel.
11h005
Allereerst zoeken we op de naam Karin Spaink. Dit werkt net zoals bij de zoekmachine Google: alle woorden die u typt, moeten in de resultaten terugkomen. Wanneer u bij Webpagina’s vinden met het invoerveld al deze woorden gebruikt, krijgt u resultaten waarin de woorden Karin en Spaink beide voorkomen, maar niet noodzakelijkerwijs in die volgorde. Gebruik daarom bij Webpagina’s vinden met het invoerveld de exacte woorden of het zinsdeel. Zo krijgt u alleen resultaten waarin de woorden Karin en Spaink in exact deze volgorde voorkomen. Het resultaat ziet eruit als in de afbeelding.
Afbeelding 11.6 Alle berichten waarin de woorden Karin Spaink in die exacte volgorde voorkomen.
11h006
U ziet dat er zo’n 17 duizend zoekresultaten zijn. Het valt u wellicht op dat de berichten niet chronologisch gesorteerd staan. Standaard probeert Google Groups namelijk een inschatting te maken van de relevantie van berichten om u niet te vermoeien met minder belangrijke zoekresultaten.
217
Hoofdstuk 11 – Usenet
Helaas levert deze computergestuurde sortering niet altijd een goed resultaat op. Om de berichten antichronologisch weergegeven te krijgen, klikt u op Sorteren op datum, een optie die u bijna helemaal rechtsboven in het venster aantreft.
Afbeelding 11.7 Na het klikken op Sorteren op datum krijgt u de berichten in antichronologische volgorde te zien.
11h007
De berichten zijn nu gesorteerd op datum. Bij nadere bestudering blijkt echter dat al deze berichten weliswaar melding maken van Karin Spaink, maar dat ze niet door haar zijn geschreven. Om alleen berichten te krijgen die door haarzelf zijn geschreven, moeten we terug naar het venster Geavanceerd zoeken.
Afbeelding 11.8 Vul de naam Karin Spaink in bij het veld Geef alleen berichten geschreven door de auteur.
218
Handboek – Internetresearch
11h008
Nu vult u de naam Karin Spaink in bij het veld Geef alleen berichten geschreven door de auteur. Dat levert, na opnieuw sorteren op datum, het zoekresultaat op in de volgende afbeelding.
Afbeelding 11.9
11h009
Nog altijd krijgt u veel resultaten.
Het valt u wellicht op dat veel berichten gaan over Scientology, een omstreden religieuze beweging waarmee Spaink veel ruzie heeft (gehad). Stel dat we die berichten willen wegfilteren, dan kan dat eenvoudig door bij Geavanceerd zoeken het woord ‘scientology’ toe te voegen op de regel een van deze ongewenste woorden:
Afbeelding 11.10
Vul het woord ‘scientology’ in op de juiste plaats…
219
Hoofdstuk 11 – Usenet
…en weg zijn de ongewenste resultaten. Let op: u moet steeds opnieuw sorteren op datum.
Afbeelding 11.11
11spaink4 11spaink3
Laat de berichten nogmaals op datum sorteren. Nu moet u de berichten nog lezen. Om dat te doen, klikt u op het bericht zelf, zoals u op een zoekresultaat in de ‘normale’ Google-resultaten zou klikken. U krijgt nu het bericht te zien. Van belang is in dit venster vooral de optie Alles samenvouwen, boven aan de pagina. Als u hierop klikt, krijgt u het verloop van de discussie te zien.
Afbeelding 11.12
11spaink2 11spaink1
220
Kies Alles samenvouwen…
Handboek – Internetresearch
…en u krijgt een overzicht van alle berichten die tot dusver in de discussie zijn uitgewisseld.
Afbeelding 11.13
Personen zoeken met Google Groups – een praktisch voorbeeld U hebt nu geleerd hoe u via Google Groups naar personen moet zoeken. Hoe onthullend zo’n zoektocht kan zijn, wordt afdoende geïllustreerd door het nu volgende voorbeeld. Ga daarvoor opnieuw naar het venster Geavanceerd zoeken van Google Groups en vul bij het veld Auteur de naam Cor Eberhard in, het voormalige LPF-Kamerlid. Het zal u opvallen dat bij de zoekresultaten een aantal berichten staan die toch wat vreemd zijn voor een voormalig Kamerlid.
Afbeelding 11.14
Zoveel mensen, zoveel meningen over romantiek.
221
Hoofdstuk 11 – Usenet
11eber
De berichten spreken boekdelen: Eberhard heeft een verleden als pornoondernemer. Interessanter is de onparlementaire manier waarop hij zich uitspreekt. Toen Eberhard in 2002 in de Tweede Kamer belandde, zorgden zijn Usenet-bijdragen dan ook voor wat reuring toen deze via Google Groups boven water kwamen. En dit is geen uitzondering: de auteur van dit boek heeft in zijn journalistieke loopbaan diverse malen persoonlijke feiten over onder meer interviewkandidaten kunnen achterhalen via Usenet. Hierbij moet wel worden opgemerkt dat Usenet de laatste tijd steeds meer in onbruik is geraakt, en het aantal resultaten naarmate de tijd vordert dus navenant lager wordt. Verifieer de informatie Uiteraard geldt de in hoofdstuk 8 genoemde Paaseierenregel™ ook voor informatie die u via Google Groups achterhaalt. Wellicht geeft iemand zich uit voor de persoon waarnaar u research doet. Verifieer daarom altijd de gevonden informatie elders.
Research naar onderwerpen met Google Groups U kunt Google Groups ook gebruiken om onderzoek te doen naar bepaalde onderwerpen. U zoekt dan via Google Groups op dezelfde manier als u via een zoekmachine naar informatie zou zoeken: door de vraag zo specifiek mogelijk te definiëren en, als dat onvoldoende resultaat oplevert, de zoekvraag te verbreden of anders te formuleren. Houd er bij het zoeken via Google Groups rekening mee dat u in discussies zoekt. Usenet-zoektochten kunnen bijzonder geschikt zijn om inzicht te krijgen in de verschillende standpunten over een literair of wetenschappelijk heet hangijzer, maar de kans bestaat dat u verdwaalt in de meningsverschillen. Voor specifieke zoekvragen blijft daarom gelden dat u het best af bent met een goede zoekmachine, zoals Google of Yahoo!. Niettemin kan Google Groups u behulpzaam zijn bij het nemen van de pols van internet, en u bij research naar onderwerpen soms op inzichten brengen die anders verborgen waren gebleven.
Nieuwsgroepen over specifieke onderwerpen vinden via Google Groups U kunt Google Groups gebruiken als een zoekmachine voor Usenet door zeer specifiek te zoeken, maar u kunt ook de omgekeerde benadering gebruiken: door op zoek te gaan naar een nieuwsgroep waar wellicht over een onderwerp wordt gedebatteerd dat u interesseert. Die kennis kan ook later weer van pas komen, bijvoorbeeld als u vaker over hetzelfde onderwerp schrijft.
222
Handboek – Internetresearch
Er zijn twee methoden om nieuwsgroepen te vinden. De eerste is de meest eenvoudige, maar werkt niet in alle omstandigheden. De tweede is wat omslachtiger, maar heeft een grotere kans op succes. Gebruikmaken van hiërarchieën Om efficiënt naar specifieke nieuwsgroepen te zoeken, hebt u wat basiskennis nodig over de opbouw van Usenet. Het belangrijkste zijn de eerdergenoemde hiërarchieën, de wijze waarop nieuwsgroepen bij bepaalde families zijn ingedeeld. Een aantal belangrijke hiërarchieën is door Google al voorgeselecteerd in het beginvenster van Google Groups; ze worden als hoofdcategorieën (Computers, Nieuws, Gezondheid enzovoort) weergegeven.
Afbeelding 11.15
Een aantal belangrijke hoofdcategorieën is door Google al
voorgeselecteerd.
11disc
Minstens zo handig zijn de hiërarchieën die behoren tot bepaalde landen. Nieuwsgroepen die beginnen met de landcode nl. behoren bijvoorbeeld tot de Nederlandse Usenet-hiërarchie. Als u naar groups.google.nl/groups/dir gaat, ziet u het standaardoverzicht dat Google geeft. Echter, via Zoeken in heel Usenet onder de Google-rubricering komt u op een andere, minstens zo bruikbare indeling van alle hiërchieën. Klik vervolgens op nl. en u ziet de nl.-hiërarchie.
223
Hoofdstuk 11 – Usenet
Afbeelding 11.16
Klik op Zoeken in heel Usenet…
…en vervolgens op Nl. U kunt deze pagina het beste bookmarken. Bedenk wel dat Google nogal eens webadressen verandert.
Afbeelding 11.17
Afbeelding 11.18
224
Een overzicht van Nederlandse nieuwsgroepen.
Handboek – Internetresearch
11disc2 11hierarchie2 11hierarchie1
Zoals u ziet, spreken de namen van de meeste nieuwsgroepen behoorlijk voor zich. Zo is de groep nl.filosofie bedoeld voor – inderdaad – filosofie. Wellicht valt het u op dat achter sommige namen een ster staat. Dat betekent dat er meerdere nieuwsgroepen zijn waarvan de naam begint met dezelfde woorden. Als voorbeeld nemen we nl.kunst.*. Wanneer we hierop klikken, krijgen we het venster te zien uit afbeelding 11.19.
Afbeelding 11.19
11disc3
Er zijn zeven nieuwsgroepen die beginnen met nl.kunst.
U ziet dat er in totaal zeven nieuwsgroepen zijn die allemaal beginnen met nl.kunst. We klikken nu op nl.kunst.sf+fantasy, en daarna nog een keer op nl.kunst.sf+fantasy.
Een lijst met recente bijdragen aan de nieuwsgroep nl.kunst.sf+fantasy.
Afbeelding 11.20
11disc4
Google Groups geeft nu een lijst met in antichronologische volgorde alle berichten die recent in nl.kunst.sf+fantasy zijn achtergelaten. Dit is het punt
225
Hoofdstuk 11 – Usenet
om een bookmark te maken als u van plan bent regelmatig een kijkje te gaan nemen in deze nieuwsgroep. U krijgt dan altijd de meest recente toevoegingen aan de nieuwsgroep te zien. Maar er is meer mogelijk met Google Groups. Stel dat u op zoek was naar meningen van internetgebruikers over de Britse sf-serie Doctor Who. U hebt nu weliswaar de juiste groep gevonden, maar dat wil nog niet zeggen dat de berichten die u zoekt ook bij de laatste discussiebijdragen staan. Om exact de berichten te krijgen die u zoekt, typt u in het zoekveld bovenin de naam van de artiest die u zoekt. In dit voorbeeld gebruiken we zoals gezegd Doctor Who. Typ daarom in het zoekveld naast de knop Zoeken in deze groep de tekst “Doctor Who”. De aanhalingstekens zijn nodig omdat u op zoek bent naar vermeldingen van zijn volledige naam. Klik vervolgens op Zoeken in deze groep of druk op de Enter-toets. Maak een bladwijzer Wanneer u van plan bent regelmatig terug te komen in een bepaalde nieuwsgroep, is het handig een bladwijzer te maken van de desbetreffende Google Groups-pagina.
Klik op Sorteren op datum om de berichten over Doctor Who op datum te sorteren.
Afbeelding 11.21
11disc5
226
U bent er nu bijna. Want u hebt weliswaar berichten over Doctor Who uit een relevante nieuwsgroep, maar de informatie staat nogal door elkaar. Klik daarom rechtsboven in het scherm op Sorteren op datum.
Handboek – Internetresearch
Afbeelding 11.22
11disc6
Berichten over Doctor Who in antichronologische volgorde.
En ziedaar, alle recente berichten over Doctor Who staan bij elkaar. Uiteraard werkt deze methode ook met de categorieën zoals die vermeld staan in het hoofdvenster van Google Groups. Beperk u niet tot Usenet Beperk u niet tot Usenet als u deskundige meningen over specifieke onderwerpen zoekt, maar benut ook Forumgrazer.net en Twitter.com. De laatste site wordt nader besproken in hoofdstuk 13.
Usenet-research automatiseren In veel gevallen zult u Usenet niet dagelijks nodig hebben, maar wilt u wel op de hoogte worden gesteld wanneer een bepaalde persoon of een bepaald onderwerp wordt genoemd. In dat geval gebruikt u de in hoofdstuk 6 besproken dienst Google Alerts (www.google.nl/alerts of www.google.com/ alerts). Vervolgens selecteert u als type zoekvraag Discussies of Discussions. Voor meer informatie: zie hoofdstuk 6.
Software voor langdurige Usenet-research Het valt buiten het bestek van dit boek om volledig te zijn over Usenet: de voor research essentiële aspecten zijn eerder behandeld. Wilt u echter meer uit Usenet halen, zoals actief deelnemen aan discussies of het langere tijd volgen van een groot aantal nieuwsgroepen, dan worden de beperkingen van Google Groups snel duidelijk.
227
Hoofdstuk 11 – Usenet
Weliswaar zijn beide met Google Groups mogelijk, maar nogal omslachtig. Voor het posten op Usenet via Google Groups moet u zich bijvoorbeeld eerst registreren op www.google.com/accounts. Daarnaast is het in de gaten houden van meerdere nieuwsgroepen via Google Groups een onoverzichtelijke klus. Met een speciaal Usenet-computerprogramma, ook wel een news reader genoemd, zijn deze problemen overkomelijker. Een news reader maakt het mogelijk om verse berichten uit meerdere nieuwsgroepen automatisch binnen te halen. Ook het reageren op andermans berichten is met een news reader eenvoudiger, al kan het instellen van het computerprogramma even lastig zijn.
Door u in te schrijven bij Google, kunt u via Google Groups aan Usenet-discussies meedoen.
Afbeelding 11.23
11account
228
Een goed programma om Usenet mee te volgen, is het (in hoofdstuk 10 al genoemde) e-mailprogramma Mozilla Thunderbird, dat tevens kan samenwerken met Usenet (www.mozilla-europe.org/nl/products/thunderbird). Dit programma is in het Nederlands én het Engels beschikbaar (net als in het Punjabi, als dat meer uw ding is) en bevat een ingebouwde gebruiksaanwijzing. Na het installeren moet u kiezen tussen een betaalde versie of gratis
Handboek – Internetresearch
variant met minder mogelijkheden. De laatste voldoet in de meeste gevallen uitstekend. Vervolgens moet u Mozilla Thunderbird voorzien van de juiste informatie om met Usenet verbinding te kunnen maken. U hebt daar gegevens van uw internetaanbieder over de zogeheten news server voor nodig. Deze informatie hebt u als het goed is bij het afsluiten van uw internetabonnement gekregen. Zo niet, dan kan de helpdesk van uw internetaanbieder u daarover informeren.
Helaas is er nog geen versie in het Fries, maar toch is Mozilla Thunderbird een prima gratis programma voor de intensieve Usenetgebruiker.
Afbeelding 11.24
229
11thun
12
E-mail als informatiebron
E
-mail is een communicatiemiddel dat u kunt gebruiken om actief informatie te vergaren. Het medium is echter ook geschikt om u van dienst te zijn terwijl u zelf een passieve rol aanneemt. Via zogeheten mailinglijsten kunt u de kennis van deskundigen mobiliseren op terreinen waarop u regelmatig onderzoek doet, zonder daar zelf veel tijd aan kwijt te zijn. E-mail kan u ook van dienst zijn bij het opspeuren van personen. Aan het eind van dit hoofdstuk leert u de zogeheten e-mailheaders begrijpen: de afzendinstructies die met ieder elektronisch bericht worden meegestuurd en die u kunt gebruiken om meer te weten te komen over de verzender van een anonieme e-mail.
U leert in dit hoofdstuk:
Wat mailinglijsten zijn. Wat het verschil is tussen een discussielijst en een nieuwsbrief. Hoe u mailinglijsten vindt die voor u relevant zijn. Wat e-mailheaders zijn en hoe deze zijn opgebouwd. Hoe u e-mailheaders kunt gebruiken om (soms) de verzender van anonieme e-mail op te speuren.
Hoofdstuk 12 – E-mail als informatiebron
Wat zijn mailinglijsten Mailinglijsten distribueren e-mails onder een groep geadresseerden die daar meestal vooraf toestemming voor hebben gegeven. U kunt mailinglijsten vergelijken met de verzendlijsten van bijvoorbeeld een sportvereniging, die het clubblaadje naar een vaste lijst geadresseerden stuurt. Het lidmaatschap van mailinglijsten staat vaak open voor iedereen, maar er zijn ook vele mailinglijsten waartoe buitenstaanders geen toegang hebben. Het gaat dan vaak om besloten organisaties of bedrijven die via mailinglijsten betaalde informatie verspreiden. Grofweg zijn er twee soorten mailinglijsten: • Nieuwsbrief Dit type mailinglijst lijkt nog het meest op een traditioneel tijdschrift. De nieuwsbrief kent één afzender, maar vele geadresseerden, die allemaal lezen wat de afzender heeft verstuurd. Onderlinge communicatie tussen de geadresseerden is niet mogelijk via de nieuwsbrief, wat de hoeveelheid e-mails vaak sterk beperkt. • Discussielijst Bij dit type mailinglijst zijn alle geadresseerden ook potentiële afzenders. Dat kan zorgen voor een grote hoeveelheid e-mail. In de praktijk maakt een deel van de geadresseerden meestal geen gebruik van die mogelijkheid. Zij heten daarom ook wel lurkers, wat is afgeleid van het Engelse werkwoord to lurk, dat zoveel betekent als ‘verborgen blijven’. Soms zijn er een of meerdere toezichthouders, zogeheten moderators, die ingrijpen als een discussie uit de hand loopt of de lijstregels anderszins worden overtreden.
Het nut van mailinglijsten Omdat vrijwel niemand last heeft van te weinig e-mail, vraagt u zich wellicht af waarom u nog meer elektronische post in huis zou moeten halen. De reden daarvoor is dat mailinglijsten een uitstekende manier kunnen zijn om een ander het zware werk voor u te laten doen. Thematische mailinglijsten kunnen veel nuttige informatie bevatten over vakgebieden waar u regelmatig research naar doet, bijvoorbeeld omdat ze worden samengesteld door experts die hun kennis graag ter beschikking aan derden stellen. Zo is de auteur van dit boek geabonneerd op een aantal mailinglijsten over internetresearch. Het bijhouden van nieuwe ontwikkelingen kost daardoor aanzienlijk minder tijd. Uiteraard staat of valt dit tijdbesparende effect met een aantal factoren.
232
Handboek – Internetresearch
• Het soort mailinglijst In het algemeen zijn discussielijsten minder geschikt voor researchdoeleinden. Deze leveren u namelijk vaak veel extra post op, die allemaal gelezen moet worden. Een ander nadeel van discussielijsten is dat ze vaak vergeven zijn van mensen die tijd teveel hebben en dus per definitie ook niet altijd even deskundige bijdragen leveren. In de meeste gevallen doet u er daarom goed aan u tot nieuwsbrieven te beperken. • De kwaliteit van de mailinglijst Het spreekt voor zich dat u niets hebt aan een mailinglijst waarin negen van de tien keer enkel onzin wordt verkondigd. • Uw eigen discipline Een mailinglijst die u niet leest, heeft geen enkel nut. Maak er daarom een goede gewoonte van dit wel te doen. Uw e-mailprogramma kan u helpen de discipline hoog te houden. Veel van dit soort programma’s beschikt over filtermogelijkheden. Deze filters kunt u zo instellen dat post van mailinglijsten automatisch in een aparte map wordt gezet, en dus niet in uw postbus terechtkomt. (Raadpleeg de gebruiksaanwijzing van uw e-mailprogramma om te lezen hoe u dit in uw specifieke geval moet doen.) Het voordeel daarvan is dat u uw postbus overzichtelijk houdt en u uw dagelijkse werk niet hoeft te onderbreken. Uiteraard moet u de desbetreffende mailinglijstberichten nog altijd lezen. Doe dat in het geval van nieuwsbrieven eens per week. In de praktijk is dit efficiënter dan deze e-mails tussen de bedrijven door te verwerken. Bij discussielijsten is deze aanpak vanwege het grote volume niet aan te raden. Lees in dit laatste geval de e-mails dus eens per dag. • Het vermogen om afscheid te durven nemen Iets is niet altijd beter dan niets. Als een mailinglijst u lange tijd geen nuttige informatie heeft opgeleverd, zeg het abonnement dan op. De definitie van ‘lang’ is relatief en hangt af van de frequentie van de mailinglijst. Ga uit van twee weken in het geval van een discussielijst of dagelijkse nieuwsbrief, vier weken in het geval van een wekelijkse nieuwsbrief of drie maanden in het geval van een maandelijkse nieuwsbrief.
Hoe u relevante mailinglijsten vindt In de ervaring van de auteur vindt u de meeste nuttige mailinglijsten volgens het aloude principe van de serendipiteit, oftewel: gelukkig toeval. Niettemin kunt u dat toeval soms afdwingen met de verderop vermelde sites, die stukvoor-stuk lijsten bevatten met mailinglijsten over tal van onderwerpen. Mocht u daarmee geen succes hebben, dan kunt u zoekmachines inzetten voor het vinden van mailinglijsten. Gebruik daarvoor de methode die in hoofdstuk 10 wordt beschreven om zogeheten RSS-feeds op te speuren. In de praktijk levert de inzet van zoekmachines meestal weinig op, reden waarom geen verdere aandacht aan deze methode wordt besteed.
233
Hoofdstuk 12 – E-mail als informatiebron
Yahoo! Groups – groups.yahoo.com Een site die het iedere internetgebruiker mogelijk maakt zonder technische voorkennis een mailinglijst te beginnen. Dat maakt deze pagina erg populair bij zowel hobbyisten als deskundigen. De index van mailinglijsten is te doorzoeken via het invoerveld onder de tekst Find a Yahoo! group. U kunt ook gebruikmaken van het rubrieksysteem, maar omdat degenen die een mailinglijst via Yahoo! Groups beginnen zelf mogen kiezen onder welke rubriek ze vallen, is deze indeling in een regelrechte puinhoop veranderd. Yahoo! Groups bevat ook Nederlandse mailinglijsten. Om die te vinden, kunt u het best gewoon Nederlandse zoektermen gebruiken.
Afbeelding 12.1
Yahoo! Groups.
Google Groups – groups.google.nl of groups.google.com Deze site is uitgebreid in het vorige hoofdstuk besproken als toegangspoort voor Usenet. Google Groups huisvest echter ook diverse mailinglijsten. Die kunt u het best opsporen via groups.google.com/groups/dir.
234
Handboek – Internetresearch
L-soft – www.lsoft.com/lists/listref.html Ruim 50 duizend mailinglijsten bij elkaar, die u het handigst doorzoekt door gelijk op Search for a mailing list of interest te klikken, net onder het kopje List information. Ook handig is de optie om alleen mailinglijsten met veel abonnees te tonen. Dit maakt de kans kleiner dat u wordt geconfronteerd met hobbyistische en daardoor vaak nutteloze mailinglijsten.
Afbeelding 12.2
Niet mooi, wel handig.
Tile – www.tile.net/lists Een site die bijna ten onder gaat aan de slechte manier waarop de (interessante) informatie wordt ontsloten. Hoewel Tile heel veel mailinglijsten bevat, is de menustructuur vrijwel onbruikbaar. Zoekt u een mailinglijst, gebruik dan het zoekveld rechtsboven in het scherm. Naast de beroerde menustructuur is ook de manier waarop gevonden mailinglijsten worden getoond niet erg handig: u moet doorklikken op een resultaat om iets meer te weten te komen over de zoektreffers.
Afbeelding 12.3 Zoeken gaat het best door het onderwerp waarover u mailinglijsten wilt vinden, rechtsboven in het scherm in te vullen.
235
Hoofdstuk 12 – E-mail als informatiebron
Topica – lists.topica.com De flipperkast onder de sites met mailinglijsten. Is te doorzoeken via een rubrieksysteem of via een invoerveld. Let wel op: Topica bevat niet alleen serieuze mailinglijsten, maar verstopt er ook diverse commerciële varianten tussen.
236
Afbeelding 12.4
Op de commercie na een handige site.
Afbeelding 12.5
Gelukkig minder rommelig dan een klassieke archiefkast.
Handboek – Internetresearch
The Mail Archive – www.mail-archive.com Geen zoekmachine voor mailinglijsten in strikte zin. The Mail Archive slaat echter alle berichten op van mailinglijsten die zich bij The Mail Archive hebben aangesloten. Scoort op Nederlandse onderwerpen niet bijster goed.
Wat zijn e-mailheaders? Zoals een pakketje via DHL vergezeld gaat van een pakbon, zo bestaat ieder e-mailbericht gedeeltelijk uit zogeheten e-mailheaders. Deze headers bevatten informatie over de afzender van de e-mail en over de route die het bericht heeft gevolgd voordat het bij u terecht kwam. Daarmee zijn de headers een stuk uitgebreider dan de vrij basale afzenderinformatie die u in de meeste e-mailprogramma’s ziet. Hier wordt alleen het e-mailadres van de afzender getoond. Aangezien iedere e-mailverzender zelf kan opgeven welk e-mailadres dat is, zijn de mogelijkheden voor misbruik groot. Met name verzenders van spam, ofwel ongewenste commerciële e-mail, hebben er een handje van op deze plek een niet-bestaand e-mailadres te laten zien. Maar ook als u een anonieme tipgever wilt opsporen, of simpelweg digitaal wordt lastiggevallen, kan het frustrerend zijn om met een vervalst afzenderadres geconfronteerd te worden. In dergelijke gevallen is het nuttig om meer te weten over de opbouw van e-mailheaders. Wie deze headers kan lezen en begrijpen, kan zo in sommige gevallen alsnog de verzender van een bericht opsporen, ook al gebruikt deze een valse naam.
E-mailheaders vinden Voordat u e-mailheaders kunt gaan analyseren, moet u eerst weten hoe u ze uit berichten kunt extraheren. De manier waarop is afhankelijk van het e-mailprogramma dat u gebruikt. In dit gedeelte vindt u instructies voor de programma’s Microsoft Outlook 2000, Outlook XP, Outlook 2003, Outlook 2007, Outlook Express, Mozilla Thunderbird en OS X Mail.
Microsoft Outlook 2000, Outlook XP, Outlook 2003, Outlook 2007 Allereerst moet u naar het bericht gaan waarvan u de headers wilt bekijken. Klik op dit bericht, maar zonder het te openen, zoals ook te zien is in afbeelding 12.6.
237
Hoofdstuk 12 – E-mail als informatiebron
Afbeelding 12.6
Klik op het bericht…
Afbeelding 12.7 …en druk op de rechtermuisknop, waar u Opties (Berichtopties) of Options (Message Options) selecteert.
Wanneer u het bericht op deze wijze hebt geselecteerd, klikt u met de rechtermuisknop. U ziet nu een menu. Selecteer vervolgens Opties (Options) of Berichtopties (Message Options). U ziet de internetheaders onder in het venster dat nu wordt geopend.
Microsoft Outlook Express De procedure in Outlook Express lijkt erg op die in Outlook 2000, XP, 2003 en 2007. U moet het bericht selecteren en op de rechtermuisknop drukken. Daarna klikt u op Eigenschappen (Properties). Vervolgens selecteert u het tabblad Details. Klik desgewenst op Bron van bericht (Message Source) om de complete bron van het bericht te kunnen zien.
238
Handboek – Internetresearch
Afbeelding 12.8
Onder in het venster dat nu wordt geopend staan de
internetheaders.
Afbeelding 12.9 Selecteer het bericht, klik met de rechtermuisknop en kies Eigenschappen of Properties.
Mozilla Thunderbird Dit e-mailprogramma is vooral populair onder Microsoft-haters. Het bekijken van de headers is bijzonder eenvoudig. Klik linksboven in het menu op View. Selecteer vervolgens Headers en vink daar het woord All aan.
239
Hoofdstuk 12 – E-mail als informatiebron
Klik vervolgens op het tabblad Details om de internetheaders te zien te krijgen.
Afbeelding 12.10
Op de Mac: OS X Mail Kies bij View de optie Customize Toolbar en sleep Long Headers op de werkbalk. Vanaf nu krijgt u de headers te zien als u op Long Headers klikt terwijl u een e-mail hebt geopend. Een alternatief is het indrukken van Shift+z+H terwijl u een e-mailbericht hebt geopend.
Afbeelding 12.11
De optie Long Headers is aan de werkbalk toegevoegd.
E-mailheaders begrijpen E-mailheaders bestaan uit verschillende onderdelen, die u eerst moet leren kennen voordat u de headers kunt gebruiken voor opsporingsdoeleinden. De belangrijkste zijn: • From: Deze regel geeft aan van wie de e-mail afkomstig is. Helaas is de informatie bij From: eenvoudig te vervalsen. Overigens is er ook nog een variant waarbij From niet vergezeld gaat van een dubbele punt, maar van een spatie. Deze komt echter zelden voor, maar kan in dergelijke gevallen iets anders aangeven dan From:.
240
Handboek – Internetresearch
• To: Redelijk vanzelfsprekend. Het veld To: laat zien aan wie de e-mail in eerste instantie gericht is. Toch hoeft dit niet de enige persoon te zijn die de e-mail heeft ontvangen. Sterker nog, het veld To: kan zelfs leeg zijn, als de verzender heeft gebruikgemaakt van Cc: of Bcc: (zie verderop). • Cc: Carbon copy, oftewel het veld dat wordt gebruikt om meerdere mensen tegelijk aan te schrijven. • Bcc: Blind carbon copy. Dit veld kunt u niet zien in de e-mailheaders. Het wordt gebruikt om e-mails te versturen naar personen zonder hun e-mailadres zichtbaar te laten worden. Veel nieuwsbrieven werken op deze wijze. Bcc: is het veld dat wordt gebruikt als bij To: of Cc: niets staat. • Reply-to: Dit veld vertelt uw e-mailprogramma waar een eventueel antwoord op de e-mail die u aan het lezen bent naartoe moet. Het veld Reply-to: is vaak hetzelfde als het veld From:, maar hoeft dat niet per se te zijn. • Return-path: Bevat dezelfde informatie als Reply-to:. • X-mailer: Dit veld vertelt u welk e-mailprogramma de verzender van het bericht heeft gebruikt. Daardoor kunt u soms afleiden wat voor computer deze bezit. • X-Originating-IP: Dit treft u vaak aan in e-mails die door gratis diensten als Hotmail zijn verstuurd. Dergelijke diensten werden en worden regelmatig misbruikt om anonieme e-mails te versturen. De dader lag dan op het kerkhof, want in de e-mailheaders stonden enkel de gegevens van Hotmail en niet van de afzender. Om misbruik tegen te gaan, voegen Hotmail en andere bedrijven thans het originele IP-nummer toe van de computer waarop de e-mail werd getypt. • Received: Het belangrijkste onderdeel van de headers. Met behulp van de informatie bij Received: kunt u de werkelijke afzender soms opsporen. Alle overige onderdelen van de headers zijn van minder of geen belang.
E-mailheaders analyseren Uit de voorgaande opsomming van headerelementen blijkt al dat de meeste potentiële informatie is af te leiden uit de informatie bij Received:. Het veld From: kan immers vervalst zijn en met de informatie bij X-mailer: komt u er hoogstens achter of iemand van Apple-computers houdt, wat bij het opsporen van een e-mailverzender de lijst met kandidaten niet echt werkbaar korter maakt. Aan de hand van drie voorbeelden wordt duidelijk hoe u de authenticiteit van een e-mail kunt vaststellen en de e-mailverzender soms kunt opsporen.
241
Hoofdstuk 12 – E-mail als informatiebron
Return-Path:
Received: from listserv-mail.surfnet.nl (listserv-mail.surfnet.nl [192.87.5.141]) by newns.webtic.nl (8.12.10/8.12.9) with ESMTP id i4H8dlPp081399 for <[email protected]>; Mon, 17 May 2004 10:39:47 +0200 (CEST) (envelope-from [email protected]) Received: from listserv-mail (192.87.5.141) by listserv-mail.surfnet.nl (LSMTP for Windows NT v1.1b) with SMTP id <[email protected]>; Mon, 17 May 2004 10:39:46 +0200 Received: from DTIC.MIL by DTIC.MIL (LISTSERV-TCP/IP release 1.8e) with spool id 12118 for [email protected]; Mon, 17 May 2004 04:39:42 -0400 Approved-By: [email protected] Received: from dtics22b.dtic.mil ([172.16.105.86]) by list2.dtic.mil (8.12.10+Sun/8.12.10) with SMTP id i4H8bxMS001227 for ; Mon, 17 May 2004 04:38:04 -0400 (EDT) Received: from mails.dtic.mil ([131.84.1.19]) by dtics22b.dtic.mil (SAVSMTP 3.1.1.32) with SMTP id M2004051704380319637 for ; Mon,17 May 2004 04:38:03-0400 Received: from tweety.orha.centcom.mil (failover.orha.centcom.mil [199.112.45.17]) by mails.dtic.mil (8.11.7p1+Sun/) with SMTP id i4H8c0D08220 for ; Mon, 17 May 2004 04:38:01 -0400 (EDT) Received: from EXCHGS3.orha.centcom.mil (exchgs3.orha.centcom.mil [10.10.4.15]) by tweety.orha.centcom.mil with ESMTP id i4H8KtgD029490 for ; Mon, 17 May 2004 08:20:55 GMT Received: from exchgs2.orha.centcom.mil ([10.10.4.7]) by EXCHGS3.orha.centcom.mil with Microsoft SMTPSVC(5.0.2195.6713); Mon, 17 May 2004 12:37:56 +0400 X-MimeOLE: Produced By Microsoft Exchange V6.0.6375.0 content-class: urn:content-classes:message MIME-Version: 1.0 Content-Type: text/plain; charset="iso-8859-1" X-MS-Has-Attach: X-MS-TNEF-Correlator: Thread-Topic: MORE CHANGES: MEDIA ADVISORY for Monday, May 17th Thread-Index: AcQs8nkfOjYwr45vRCiaLxZAqnVALgO7wcUwAAIDpDA= X-OriginalArrivalTime: 17 May 2004 08:37:56.0547 (UTC) FILETIME=[409A8130:01C43BEA] Content-Transfer-Encoding: 8bit X-MIME-Autoconverted: from quoted-printable to 8bit by list2.dtic.mil id i4H8c4ML001275 Message-ID: Date: Mon, 17 May 2004 12:37:56 +0400 Reply-To: “Cauthen, Catherine Ms. (CIV)” Sender: CPA Public Affairs Office List From: “Cauthen, Catherine Ms. (CIV)” Subject: MORE CHANGES: MEDIA ADVISORY for Monday, May 17th Comments: To: [email protected] To: [email protected] Precedence: list X-Scanned-By: MIMEDefang 2.42
242
Handboek – Internetresearch
Status: O X-UID: 8078 Content-Length: 1122
Het grootste deel van de headers kunt u negeren. Van belang is in dit voorbeeld om vast te stellen of de persoon van wie wordt beweerd dat deze de email heeft verstuurd, dat ook daadwerkelijk heeft gedaan. De officiële afzender is te vinden bij From:, waar staat: “Cauthen, Catherine Ms. (CIV)” . Nu kijkt u naar de informatie bij Received:. Wellicht valt het u op dat er meerdere regels zijn met deze toevoeging. Dat komt omdat een e-mail niet altijd rechtstreeks zijn weg vindt naar uw computer. Vaak maakt een bericht een omweg via verschillende zogeheten e-mailservers, gespecialiseerde computers die zich bezighouden met het transport van elektronische post. Iedere e-mailserver voegt zijn eigen regel Received: toe aan het e-mailbericht. Dit gebeurt in antichronologische volgorde: de bovenste regel Received: is altijd de meest recente; de oudste regel Received: staat onderaan. Daaruit volgt dat u de herkomst van het bericht kunt vaststellen met behulp van de onderste regel Received:. Deze is immers toegevoegd door de allereerste e-mailserver die het bericht ter verwerking kreeg aangeboden, oftewel de e-mailserver van de verzendende persoon, instantie of diens internetaanbieder. Van belang is de computernaam die gelijk achter Received: from staat. Hier is de e-mail zijn reis begonnen. Op deze onderste regel Received: staat: Received: from exchgs2.orha.centcom.mil ([10.10.4.7]) by EXCHGS3.orha.centcom.mil with Microsoft SMTPSVC(5.0.2195.6713); Mon, 17 May 2004 12:37:56 +0400
Gelijk is duidelijk dat de afzender vermoedelijk legitiem is. Het e-mailadres [email protected] bevat dezelfde domeinnaam als de regel Received:, te weten orha.centcom.mil. In theorie is het echter mogelijk dat de naam van de e-mailserver, exchgs2.orha.centcom.mil, vervalst is. Daarom kunt u om absolute zekerheid te krijgen altijd een reverse DNS uitvoeren op het IP-nummer dat u achter het serveradres ziet staan. (Alles over reverse DNS vindt u in hoofdstuk 8.) Dit keer levert een reverse DNS niets op. In dat geval staat u nog de mogelijkheid van een traceroute (zie andermaal hoofdstuk 8) open. Doen we die via de site centralops.net, dan levert ook dit geen resultaat op. Received: from Van belang is de computernaam die gelijk achter Received: from staat. Hier is de e-mail zijn reis begonnen.
243
Hoofdstuk 12 – E-mail als informatiebron
Daarmee zijn de beperkingen van het analyseren van e-mailheaders gelijk duidelijk geworden. Wie echt onvindbaar wil zijn, kan dat voor elkaar krijgen. In dit geval analyseerden we headers van een e-mail van een militaire organisatie en wel het Amerikaanse leger. Aangezien het Amerikaanse leger voor een deel verantwoordelijk is voor de bouw van internet, heeft het uiteraard allerlei mogelijkheden om zich aan controles te onttrekken. Toch kunt u met de voorgaande technieken wel degelijk de authenticiteit van een e-mailverzender vaststellen, zoals blijkt uit onderstaand voorbeeld. Return-Path: <[email protected]> Received: from zachtei.nl (spij-ak-21add.adsl.wanadoo.nl [81.70.56.221]) by newns.webtic.nl (8.12.10/8.12.9) with ESMTP id i4J9XFPp062891 for <[email protected]>; Wed, 19 May 2004 11:33:16 +0200 (CEST) (envelope-from [email protected]) Message-Id: <[email protected]> From: [email protected] To: [email protected] Subject: Re: Failure Date: Wed, 19 May 2004 11:33:15 +0200 MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="----=_NextPart_000_0016----=_NextPart_000_0016" X-Priority: 3 X-MSMail-Priority: Normal X-Spam-Score: 6.263 (~~~~~~) MIME_BOUND_NEXTPART,MISSING_MIMEOLE,MSGID_FROM_MTA_SHORT,NO_REAL_NAME,PRIORITY_NO_NAME X-Scanned-By: MIMEDefang 2.42 X-IMAPbase: 1080206536 8631 Status: O X-UID: 8631 Content-Length: 42123 X-Keywords:
Eerder in dit hoofdstuk is duidelijk gemaakt dat de computernaam die meteen achter Received: from staat, het belangrijkste is. Maar hoewel deze e-mail zogenaamd afkomstig is van het adres [email protected], staat op deze plek iets raars, namelijk dat de e-mail afkomstig is van zachtei.nl. Dit is hetzelfde domein dat in het veld To: staat. Dat zou betekenen dat degene die de e-mail heeft verzonden, te weten zachtei.nl, ook de ontvanger is. Dit roept eens te meer wantrouwen op omdat het adres van de afzender een geheel andere domeinnaam bevat, namelijk intervideoinc.com. Allereerst voeren we daarom een WHOIS uit op intervideoinc.com. Hoe u dat moet doen, kunt u lezen in hoofdstuk 8. Een
244
Handboek – Internetresearch
WHOIS-zoektocht via de site centralops.net/co levert een adres in de Verenigde Staten op. Dat rijmt niet met het adres dat hoort bij de domeinnaam zachtei.nl, dat volgens de Nederlandse WHOIS-database op tools.webtic.nl/domein_nl.php hoort bij een adres in Amsterdam (om precies te zijn, van de auteur van dit boek). En er is nog iets dat niet klopt. In de regel Received: staat achter zachtei.nl nog een tweede gedeelte, te weten (spij-ak-21add.adsl.wanadoo.nl [81.70.56.221]). Het gedeelte ‘spij-ak-21add.adsl.wanadoo.nl’ is eigenaardig omdat het aangeeft dat de mail is verstuurd door een klant van de Nederlandse internetaanbieder Wanadoo. Het ‘spij’ aan het begin van dit stuk duidt erop dat die persoon woont in een plaats beginnend met de letters ‘Spij’. Amsterdam, waar de eigenaar van de site zachtei.nl woont, begint niet met die letters. De opsporing wordt hier bemoeilijkt doordat veel e-mailverzenders zelf geen e-mailservers bezitten, maar deze van hun internetaanbieder gebruiken. Zou u een opsporingsinstantie zijn, dan had u bij internetaanbieder Wanadoo navraag kunnen doen naar de identiteit van de e-mailverzender. In dit geval moet u tevreden zijn met de kennis dat de afzender van deze e-mail een Nederlander was die wellicht in Spijkenisse woont, of een ander oord dat met ‘Spij’ begint. (In dit geval woont de verzender in Spijkenisse–De Akkers. De code ‘Spij-ak’ in de domeinnaam staat namelijk voor de telefooncentrale in dat gebied. Deze codes staan op de site www.geek.nl/adsl/telefooncentrales.txt en ook op www.actw.nl/KPN%20Nummercentrales.htm. U zult echter niet altijd zo veel geluk hebben.)
Tip: veel ADSL-gebruikers zijn op te sporen, omdat in hun internetheaders de code is vermeld van de telefooncentrale in hun buurt. Op deze site staan de namen en adressen van die telefooncentrales.
Afbeelding 12.12
245
Hoofdstuk 12 – E-mail als informatiebron
Soms echter maken de e-mailheaders duidelijk dat niet een internetaanbieder, maar een persoon of bedrijf met eigen e-mailfaciliteiten verantwoordelijk is voor het verzenden van het bericht. In dat geval kunt u meestal wel de exacte locatie van een afzender bepalen. Het laatste voorbeeld illustreert dit. Return-Path: Received: from x (localhost.tic [127.0.0.1]) by newns.webtic.nl (8.12.10/8.12.9) with SMTP id i4JBaAPp066984; Wed, 19 May 2004 13:37:16 +0200 (CEST) (envelope-from [email protected]) Date: Wed, 19 May 2004 13:36:14 +0200 (CEST) From: [email protected] Message-Id: <[email protected]> Subject: Yo my friend To: undisclosed-recipients:; X-Spam-Score: 6.804 (~~~~~~) DATE_MISSING,FROM_NO_LOWER,MSGID_FROM_MTA_SHORT Content-Type: multipart/mixed; boundary="----------=_1084966690-48851-340" MIME-Version: 1.0 X-Scanned-By: MIMEDefang 2.42 Status: O X-UID: 8658 Content-Length: 1246 X-Keywords:
Het e-mailtje is officieel afkomstig van [email protected], wat suggereert dat medeoprichter van Microsoft, Bill Gates, het bericht heeft verstuurd. Omdat dit nogal onwaarschijnlijk is, kijken we naar wat er rechtstreeks achter Received: from staat. Hier zien we dat het e-mailtje is verstuurd via de zogeheten localhost. Localhost wil niets anders zeggen dan ‘een lokale gebruiker van een computernetwerk’. In dit geval is het e-mailtje dus verstuurd door iemand met rechtstreekse toegang tot de mailserver newns.webtic.nl. U kunt nu een WHOIS uitvoeren op de domeinnaam uit het adres van de e-mailserver, namelijk webtic.nl. Dit leidt naar de adresgegevens van een Amsterdams bedrijf. Een van de medewerkers van dit bedrijf moet de e-mail hebben verstuurd. Wat ook klopt: de eigenaar van Webtic deed dat op verzoek van de auteur van dit boek. Localhost Laat u niet misleiden door de term localhost in een e-mailheader. Deze geeft aan dat het e-mailbericht is verstuurd door iemand met rechtstreekse toegang tot de e-mailserver die in dezelfde regel Received: staat vermeld.
246
13
Social networks, chatdiensten en andere sociale sites
E
en belangrijke functie van internet is het met elkaar in contact brengen van mensen. Daartoe worden zowel chatdiensten als social networks ingezet. Chatdiensten zijn, ietwat kort door de bocht, methoden om digitaal te kletsen; social networks proberen om relatienetwerken van mensen in kaart te brengen en zo deelnemers in staat te stellen nieuwe contacten op te doen. Researchers kunnen hiervan gebruikmaken om groepen te vinden die zich in de ‘echte’ wereld niet zo duidelijk laten zien, zoals antiglobalisten, neonazi’s of fanatieke voetbalsupporters. Ook is het mogelijk de ledenregisters van social networks en chatdiensten te gebruiken bij het zoeken naar personen. Tot slot zijn er allerlei sociale sites waarop het netwerkaspect naar de achtergrond is verdwenen, maar mensen vrijelijk hun producties met elkaar delen.
U leert in dit hoofdstuk:
Hoe social networks functioneren, en hoe ze inzetbaar zijn bij het opsporen van personen. Welke andere sociale sites van pas kunnen komen. Wat chatdiensten zijn, en welk nut ze hebben bij het doen van research. Hoe u chatdiensten gebruikt om personen, obscure groepen en organisaties te vinden.
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
Social networks Sinds 2003 zijn ze populair, en anno 2010 behoren ze tot de meest bezochte sites van het web: zogeheten social networks die proberen om relatienetwerken van mensen in kaart te brengen en zo deelnemers in staat te stellen nieuwe contacten op te doen. Inmiddels is er een veelvoud van dergelijke diensten, maar lang niet alle daarvan zijn even succesvol. Een voordeel van het steeds grotere aantal social networks is dat er specialisatie heeft plaatsgevonden. Zo zijn er social networks die zich enkel richten op het leggen van zakelijke contacten. Hierna worden de belangrijkste besproken.
Twitter – www.twitter.com Volslagen onbegrijpelijk bij uw eerste bezoek, maar heb geduld. Twitter beloont rustige researchkarakters. Dit sociale netwerk dubbelt als blogdienst: deelnemers kunnen kattebelletjes van maximaal honderdveertig karakters aan hun vrienden of de wereld meedelen. Die beperkte lengte heeft alles te maken met de intrinsieke beknoptheid van een SMS-bericht, want ook via hun mobiele telefoon kunnen ‘Twitteraars’ (oftewel: gebruikers van Twitter) op de hoogte blijven van wat er zoal op hun favoriete site gebeurt. Althans, in sommige landen – Nederland behoort daar helaas niet toe (peildatum juli 2010). Twitter kunt u op twee manieren gebruiken. 1 U kunt uw eigen netwerk opbouwen en dat inzetten op het moment dat u een researchvraag hebt. Doe dat opbouwen rustig en met beleid. Ga voor duurzaamheid (probeer Twitter dus minimaal een half jaar) en investeer dagelijks 10 minuten in het serieus leren kennen van de mensen die u letterlijk en figuurlijk aanspreken. Interessante Twitter-gebruikers vindt u ondermeer op twittergids.nl en wefollow.com, maar ook door goed op te letten naar de namen die op Twitter genoemd worden door de mensen wiens Twitter-berichten u al leest. Alleen een Twitteraccount aanmaken en eens in de zoveel tijd om hulp roepen werkt niet. Bedenk dat mensen het meest genegen zijn om u te helpen als ze u beschouwen als lid van de brede gemeenschap die Twitter heeft gecreeerd. Wie alleen vraagt zonder ooit wat terug te geven, zal vermoedelijk teleurgesteld worden. Twitteraars hebben een broertje dood aan sociale parasieten die even snel lid worden van Twitter, een vraag in het digitale luchtledige schreeuwen en vervolgens ook nog beledigd zijn als er niet binnen twee tellen een antwoord komt. Twitter is een kroeg, zoals Erwin Blom, kenner van sociale media, ooit opmerkte. En in een kroeg wil ook niemand u een tientje lenen als u er voor het eerst komt.
248
Handboek – Internetresearch
2 U zoekt in de gesprekken die op Twitter gevoerd worden. Dit doet u bijvoorbeeld met search.twitter.com, of, beter nog, met search.twitter.com/advanced. Mocht er bijvoorbeeld wereldnieuws komen van Texel (je weet nooit), dan kunt u eenvoudig alle Twitterberichten waarin het woord ‘Texel’ voorkomt, via deze zoekpagina opsporen. U bent nog slimmer bezig als u onderaan de Advanced-pagina het hokje bij ‘Containing links’ aanvinkt. U krijgt dan alleen Twitterberichten waarin een verwijzing naar een bron voorkomt. En zoals u weet, zijn wij internetresearchers dol op bronnen. Bovendien reduceert dit het aantal zinloze treffers enigszins. Wilt u meer zoekopdrachten tegelijkertijd volgen, overweeg dan het gebruik van monitter.com of twitterfall.com. Een andere gespecialiseerde zoekoptie treft u aan op backtweets.com. Hier kunt u te weten komen of een bepaald webadres ergens op Twitter is genoemd. Voorbeeld: u schrijft een artikel over Philips, dan zoekt u via Backtweets naar vermeldingen van philips.nl.
Afbeelding 13.1
Ook op Twitter: de laatste sportbeschouwingen.
13twitter
249
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
Facebook – www.facebook.com Een vanwege het privacybeleid niet onomstreden site, maar wel een populaire. Dit sociale netwerk was aanvankelijk vooral geliefd onder Amerikaanse studenten, maar inmiddels hebben ook goed opgeleide (en allang afgestudeerde) Nederlanders Facebook ontdekt. Zoeken in Facebook is heel eenvoudig. Vul de naam, of een gedeelte daarvan, in bij Search, en druk op Enter. Om iemands profiel te bekijken, is het vaak nodig om die persoon aan uw netwerk toe te voegen.
Afbeelding 13.2 Het nadeel van Facebook: als u vrienden hebt, bestaat het gevaar dat u meer tijd op de site doorbrengt dan voor research strikt noodzakelijk is.
13facebook Foursquare – www.foursquare.com Op het eerste gezicht, en trouwens ook op het tweede en derde, hebt u helemaal niets aan Foursquare. Ga maar na: via Foursquare kunt u zien wie recent bepaalde (semi-)publieke gelegenheden zoals kroegen, restaurants en bedrijven heeft bezocht. Wie zit daar nou op te wachten?
250
Handboek – Internetresearch
Nou, journalisten bijvoorbeeld. Stel dat u wilt weten of het waar is dat politicus A van de VVD en politcus B van D66 inderdaad regelmatig in café C zijn gesignaleerd, dan biedt Foursquare uitkomst. U gaat naar Foursquare en u zoekt op de naam van het café. (Tip: als dit niet het gewenste resultaat oplevert, klik dan op de plaats waar Foursquare denkt dat u zich bevindt, en verander die in de plaats waar het café is gevestigd.) U krijgt vervolgens ondermeer te zien wie de stamgasten van deze kroeg zijn. Dat is handig, want die kunt u meestal benaderen (als ze tenminste een link naar hun Twitter- of Facebook-pagina op hun profielpagina hebben opnomen). Zodat u het gerucht over liberale politici snel kunt controleren.
Afbeelding 13.3 Een oude journalistieke waarheid klopt ook op internet: nieuws vind je in de kroeg.
13foursquare LinkedIn – www.linkedin.com Deze site probeert zakenlieden in staat te stellen van elkaars relatienetwerk gebruik te maken. Net als bij Orkut geldt echter dat u uitgenodigd moet worden door iemand die al lid is. Als u dat eenmaal is gelukt, dan kent LinkedIn een handige methode om uw netwerk uit te breiden. De site kan namelijk uw Outlook-adresboek inlezen (kijk op www.linkedin.com/outlook), en ook uw contacten van webmaildiensten als Gmail en (god verhoede) Hotmail. Voor researchdoeleinden is dat overigens niet per se nodig. U kunt boven in het scherm, na ingelogd te zijn, in de box achter People de naam invullen van de persoon die u zoekt. Klik op het pijltje naar beneden naast het woord People, en u kunt ook zoeken in ondermeer bedrijven. Verder is er de rubriek Answers waar LinkedIn-leden elkaar vragen stellen.
251
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
Afbeelding 13.4
De zoekoptie vindt u boven in het scherm.
13linked Hyves – www.hyves.nl Hyves is een social network dat in korte tijd erg populair werd onder met name Nederlandse studenten en scholieren. In april 2010 heeft het netwerk naar eigen zeggen al zo’n tien miljoen leden, die zich overigens niet allemaal in Nederland bevinden. Daarbij is het bijzonder lastig om een eenmaal aangemaakt Hyves-lidmaatschap te verwijderen, dus moet het getal van 10 miljoen wellicht voorzien worden van enige natriumchloride. Inhoudelijk is Hyves weinig bijzonder. De makers hebben zich duidelijk laten inspireren door concurrent Orkut (zie verder). Daarbij heeft de site meer dan eens te maken gehad met groeistuipen, met technische problemen tot gevolg. Niettemin is het niet verantwoord om Hyves over te slaan als u op zoek bent naar informatie over een Nederlander, zeker niet als die jonger is dan 25.
MySpace – nl.myspace.com Houdt u van Amerikaanse tieners en popmuziek, dan houdt u van MySpace. Ook in Nederland probeert dit sociale netwerk, in samenwerking met jongerensite Spunk, een positie te verwerven. Vooralsnog lukt dat matig, maar wat niet is kan nog komen.
252
Handboek – Internetresearch
Orkut – www.orkut.com Opgenomen om historische redenen, want tegenwoordig is Orkut in Nederland zo dood als een pier. Dit social network is bedacht door een medewerker van Google, programmeur Orkut Buyukkokten (www.stanford.edu/ ~orkut). Na een aanvankelijke hype rond Orkut is het thans verdacht rustig rondom de site, althans wat de activiteit van Nederlandse deelnemers betreft. In India en Brazilië is Orkut daarentegen bijzonder populair.
Friendster – www.friendster.com De grijze nestor onder de social networks, eveneens opgenomen uit historische overwegingen. Friendster was het eerste social network dat grote bekendheid verwierf, maar is thans uit de gratie.
Andere sociale sites Niet alleen op sociale netwerken wordt de eigenlijke inhoud van de site bepaald door gebruikers. Er zijn ook andere sociale sites. We bespreken er vier die nuttig kunnen zijn voor researchers.
Scribd – www.scribd.com Als u een tekst schrijft, gooit u het resultaat misschien niet gelijk online. De gebruikers van Scribd doen dat wel. En in hun producties kunt u zoeken. Dat is dan ook zeker aan te raden.
Afbeelding 13.5 U doet via Scribd heel eenvoudig onderzoek naar bekende karateka’s (11 juli 2010).
253
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
13scribd Slideshare – www.slideshare.net Wat Scribd is voor documenten, is Slideshare voor presentaties. Niet de minste sprekers zetten hier hun slides online. Profiteer ervan!
Afbeelding 13.6 Andermans presentatie jatten omdat u geen zin heeft er zelf eentje te maken? Het kan, maar u heeft die tip niet van ons.
13slideshare Google Wave – wave.google.com Een dienst van Google die zijn tijd ver vooruit is. Met Wave kunnen gebruikers discussies voeren, maar dan op een heel andere manier dan u tot dusver gewend bent. Hoe anders? Dat kunt u beter zelf uitproberen. Voor researchers volstaat het om te weten dat u in deze wereldwijde discussies kunt zoeken in het zoekveld achter New wave. Voer hier uw zoekopdracht in gevolgd door de woorden with:public. Die laatste toevoeging is nodig om Google Wave te vertellen dat u wereldwijd wilt zoeken.
254
Handboek – Internetresearch
Afbeelding 13.7 Wat werd er gezegd over Oranje na de desastreus verlopen WK-finale van 2010?
13googlewave YouTube – www.youtube.com Natuurlijk kent u deze site vol videofilmpjes al. Maar hebt u er ooit bij stilgestaan dat er op YouTube van alles te vinden is dat voor een researcher van belang kan zijn? Veel nuttige informatie is nu eenmaal niet in tekstvorm beschikbaar, doch alleen als bewegend beeld. Vandaar dat we deze site graag even bij u in herinnering brengen.
Chatdiensten Chatten is populair. Wie kinderen heeft, kent de enorme voorliefde van met name de jongere generatie voor de Microsoft-chatdienst Windows Live Messenger. Dit zou tot de bedrieglijke en onterechte indruk kunnen leiden dat chatdiensten enkel nut hebben als vermaaksinstrument voor de jeugd. Niets is minder waar. Chatdiensten worden steeds vaker in het bedrijfsleven toegepast als methode om werknemers efficiënter te laten samenwerken. Via een chatdienst contact zoeken met een collega kost immers vaak minder tijd dan een telefoontje of het versturen van een e-mail. Daaruit volgt dat de ledenregisters van deze chatdiensten een nuttige bron van informatie kunnen zijn. Speciale aandacht verdient IRC, het oudste chatnetwerk ter wereld, dat een bijzondere aantrekkingskracht uitoefent op meer obscure (en soms minder frisse) groepen, zoals antiglobalisten, voetbalsupporters en pedofielen. Daaruit volgt dat een researcher met het nodige doorzettingsvermogen IRC kan gebruiken voor het opsporen van dergelijke groepen.
255
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
In dit boek worden drie chatdiensten behandeld, te weten IRC, ICQ en Windows Live Messenger. Ook komt aan het eind van dit gedeelte het programma Trillian aan de orde, waarmee u meerdere chatdiensten met hetzelfde programma kunt benaderen. Vanwege de complexiteit van IRC zal aan deze chatdienst verhoudingsgewijs de meeste aandacht worden besteed.
IRC (Internet Relay Chat) – www.mirc.com De kenmerken van IRC IRC is kort aan bod gekomen in hoofdstuk 7. Van de vijf in dit hoofdstuk behandelde chatdiensten is IRC verreweg het oudst: het werd al in 1988 ontwikkeld door de Fin Jarkko Oikarinen (www.kumpu.org). IRC verschilt op een aantal belangrijke punten van andere chatsystemen. • IRC is onafhankelijk In tegenstelling tot bijvoorbeeld ICQ of Live Messenger is IRC geen product van een bedrijf, maar een technische standaard, die door iedere willekeurige internetgebruiker benut kan worden. Iedereen kan in principe zijn eigen IRC-dienst beginnen. • IRC is diverser De onafhankelijkheid van IRC leidt tot diversiteit. Grote chatdiensten zoals Live Messenger hebben grote commerciële belangen. Dergelijke diensten zullen dus snel ingrijpen als hun dienst wordt gebruikt voor een doel dat de verantwoordelijke bedrijven niet zien zitten. Als gevolg daarvan is de IRC-populatie aanzienlijk veelzijdiger dan die van de commerciële chatdiensten. • IRC biedt meer technische mogelijkheden Op IRC is het mogelijk om chatruimten, zogeheten kanalen of channels, te maken die onzichtbaar zijn voor de rest van de wereld. Deze channels kunnen vervolgens worden omgebouwd tot ware digitale vestingen, waar gesprekspartners alleen toegang toe krijgen als ze over een wachtwoord beschikken, óf worden uitgenodigd door iemand die zich al in het channel bevindt. • IRC trekt criminelen aan Ieder voordeel heeft een nadeel. De grote technische mogelijkheden van IRC én het feit dat iedereen een onafhankelijke IRC-dienst kan beginnen, maken IRC uiteraard erg aantrekkelijk voor wie kwaad in de zin heeft. Criminelen op IRC variëren van de relatief onschuldige soort tot de meest verwerpelijke variant. In de eerste categorie vallen de relatief onschuldige jongeren die IRC gebruiken als middel om illegale spelletjes, films en muziek met elkaar uit te wisselen. Tot de laatste categorie mogen bijvoorbeeld pedofielen worden gerekend, die de anonimiteit van IRC misbruiken voor het uitwisselen van de producten van kindermisbruik. • IRC is dé plek om oude rotten te vinden Met name de oude garde internetgebruikers is bijzonder eigenwijs en mijdt om die reden vaak Live
256
Handboek – Internetresearch
Messenger of ICQ, die als te nieuwerwets en commercieel worden beschouwd. Live Messenger heeft daarnaast het nadeel dat het een product is van Microsoft, een bedrijf dat bij deze groep niet altijd even geliefd is. • IRC legt de nadruk op groepsgesprekken Moderne chatdiensten leggen de nadruk op een-op-eencontact. Discussies op IRC zijn vaak groepsfenomenen die plaatsvinden op de hiervoor genoemde channels, al kent ook IRC ampele mogelijkheden voor een-op-eengesprekken. • IRC heeft geen adresboek De deelnemers aan IRC zijn niet in een centrale database opgenomen. U hebt dus het meeste aan IRC als hulpmiddel om bepaalde sociale groepen in kaart te brengen of daar contacten op te doen.
Het gebruik van IRC Het is mogelijk om IRC volledig via een website te gebruiken. Dit komt verderop aan de orde bij Zoeken naar IRC-channels. Het is echter aan te raden om een speciaal computerprogramma te gebruiken voor IRC, net zoals u uw e-mail hoogstwaarschijnlijk via een apart programma afhandelt. Een goed IRC-programma is mIRC, dat u gratis kunt downloaden op www.mirc.com. mIRC is zogeheten shareware, wat betekent dat u wordt geacht om twintig dollar te betalen als u langer dan dertig dagen gaat gebruikmaken van de software. Het installeren van mIRC spreekt voor zich. Voordat u echt met IRC aan de slag kunt, moet u echter een aantal begrippen kennen.
Afbeelding 13.8 Op de site van mIRC kunt u het programma downloaden door aan de bovenkant van het scherm op Download te klikken.
257
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
13mirc1
• IRC Server Zoals gezegd kan iedereen zijn eigen IRC-dienst beginnen. Een computer waarop de desbetreffende IRC-dienst draait, heet de IRCserver. • IRC Network Onafhankelijkheid klinkt leuk, maar in je eentje praten is weinig amusant. Om die reden hebben veel IRC-servers zich georganiseerd in grotere verbanden, zogeheten networks. Bekende networks zijn onder meer Dalnet, EFnet, IRCnet en Undernet. • Nickname Waarom uw eigen naam gebruiken als u ook Wonko de Waanzinnige kunt heten? IRC-gebruikers kiezen vaak een bijnaam, oftewel nickname. • Channel Een digitale ruimte waar gelijkgestemden met elkaar kunnen discussiëren (of illegale software, films en muziek uitwisselen). Op een IRC-server draaien vaak meerdere channels. Afhankelijk van de server loopt hun aantal uiteen van enkele tot vele duizenden. De overvloed aan verschillende channels zorgt voor een grote variatie in het discussieaanbod op IRC. Dit stelt de researcher echter voor de uitdaging om de voor hem relevante channels te vinden, iets waarop bij Zoeken naar IRCchannels verder zal worden ingegaan. Als u mIRC voor het eerst start, moet u een aantal zaken instellen. Zo moet u een nickname kiezen, plus een alternatief voor als blijkt dat de door u gekozen nickname al door iemand anders wordt gebruikt. Ook wordt u gevraagd naar uw volledige naam en e-mailadres. Het is echter aan te raden om hier niet uw echte gegevens in te voeren. U loopt het risico dat uw e-mailadres wordt misbruikt voor het toezenden van spam, oftewel ongewenste reclamee-mail.
Afbeelding 13.9 In dit venster moet u een naam, e-mailadres en bijnaam of nickname invullen.
13mirc4
258
Handboek – Internetresearch
Hebt u al deze gegevens ingevoerd, dan komt een wat lastiger onderdeel. U moet instellen met welke IRC-server u verbinding wilt leggen. Dit doet u door links in het menu op de optie Servers te klikken. Nu kunt u een IRCnetwork selecteren. Meestal kunt u het best IRCnet kiezen, in combinatie met Random server. Dit laatste betekent dat u zelf niet op zoek hoeft naar een server die is aangesloten bij een bepaald network, maar dat mIRC dit voor u doet. Bijkomend voordeel is dat de optie Random server uitkomst biedt als een IRC-server het onverhoopt niet zou blijken te doen. mIRC zoekt dan automatisch een andere IRC-server die tot hetzelfde network behoort. 13mirc3 13mirc2
Welk network u moet kiezen, hangt af van het channel waarop u wilt eindigen. En welk channel voor u nuttig is, leest u in het volgende gedeelte.
Afbeelding 13.10
Door op Servers te klikken in het linkermenu…
Afbeelding 13.11
…kunt u een van de vele IRC-networks uitkiezen.
259
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
Zoeken naar IRC-channels Er is een aantal zoekmachines dat helpt bij het vinden van channels die voor u relevant zijn. Om technische redenen werken deze sites soms beter met Internet Explorer dan met andere browsers. Ook moet u zo veel mogelijk velden bij mIRC hebben ingesteld. De zoekmachine SearchIRC (searchirc.com) werkt heel eenvoudig. U voert een woord of woorden in waarvan u wilt dat ze in de naam van het desbetreffende channel voorkomen, waarna de zoekmachine een lijst met channels uitspuwt. Door vervolgens bij een relevant zoekresultaat op irc:// te klikken, wordt mIRC automatisch naar het goede channel gedirigeerd.
Afbeelding 13.12
Na een zoektocht klikt u op ‘irc://’ bij SearchIRC.
13h001 IRC-opdrachten Nadat u op irc:// hebt geklikt, kan zich nog een aantal problemen voordoen. Zo kan bijvoorbeeld blijken dat uw nickname al door iemand anders in gebruik is. Dit lost u op door /nick nieuwenickname in te voeren. Wilt u de standaardinstellingen voor uw nickname veranderen, ga dan naar het menu File, linksboven in het scherm, selecteer daar Select server en klik in het dan verschijnende menu op Connect. (Een alternatief is het gebruiken van de toetsencombinatie Alt+E, waarna u opnieuw Connect moet selecteren.) Ook is het mogelijk dat u een mededeling te zien krijgt dat u uw nickname eerst moet registreren. Dit doet u met de opdracht /NickServ register wachtwoord uwemailadres. Op dat e-mailadres krijgt u een bericht met een speciale opdracht die u moet invoeren. Die opdracht zal eruitzien als /NickServ auth code of een iets uitgebreidere variant daarop. De volgende keer dat u zich aanmeldt bij dezelfde dienst, kunt u met de opdracht /NickServ identify wachtwoord uw nickname terugvorderen. Om uw
260
Handboek – Internetresearch
e-mailadres te verbergen, is het handig om hierna nog even de opdracht /NickServ set hide email on in te voeren. Nu u eindelijk een naam op IRC hebt, moet u nog altijd naar het channel, oftewel de chatruimte. De kans is groot dat dit niet automatisch is gebeurd, zeker niet als u problemen had met uw nickname. U moet dan de opdracht /join #naamvanchannel invoeren. De naam van het channel kunt u vinden bij de resultaten van de IRC-zoekmachine, en is herkenbaar aan het hekje (#) ervoor. Zoals gezegd is IRC vooral nuttig voor het in kaart brengen van sociale groepen en het identificeren van mensen die zich in die groepen bewegen. Dat laatste bevindt zich op de grens van de forensische computerwetenschap en valt dus buiten het bestek van dit boek. Een vingerwijzing in die richting valt wel te geven. Als u een persoon ziet van wie u meer wilt weten, kunt u de opdracht /whois nickname invoeren, waarbij nickname uiteraard de nickname van de desbetreffende persoon is. De resultaten van deze actie krijgt u echter niet in hetzelfde venster te zien. U moet hiervoor naar het hoofdvenster gaan. Hier komt u door op een van de vakjes te klikken die u linksboven in het venster ziet en wel het vakje op de tweede regel onder het woord File. In afbeelding 13.13 ziet u welk vakje wordt bedoeld om de gegevens te zien te krijgen.
Om de resultaten van de opdracht /whois te kunnen zien, moet u klikken op het vakje met de muiscursor erop, linksboven in het venster.
Afbeelding 13.13
13whois
De resultaten die u hier ziet, kunnen u helpen een persoon op te sporen. Mocht er bij de resultaten een IP-nummer staan, dan kunt u bijvoorbeeld met de in hoofdstuk 8 genoemde technieken voor reverse DNS-scans en traceroutes proberen de geografische locatie van de desbetreffende persoon te vinden.
261
Hoofdstuk 13 – Social networks, chatdiensten en andere sociale sites
Overige chatdiensten Windows Live Messenger – messenger.live.com Uit het voorgaande valt af te leiden dat IRC zeker niet de meest eenvoudige manier is om te chatten. Vandaar dat simpelere methoden vaak de voorkeur hebben van het gros van de internetgebruikers. Windows Live Messenger (WLM), voorheen bekend als MSN Messenger is een zeer populaire chatdienst. Verwant aan Windows Live Messenger is Windows Live Profile, te vinden op profile.live.com. Hier kunt u zoeken (bij Search contacts and more) naar personen die (hopelijk) een goedgevuld profiel hebben achtergelaten met nuttige informatie voor u als researcher. Dat is vooral kansrijk bij jonge mensen.
ICQ – www.icq.com/whitepages De eerste succesvolle eenvoudige chatmethode was ICQ, uit te spreken als I Seek You. Waar het nut van IRC ligt in het opsporen van afwijkende groepen, is ICQ een handig gereedschap bij het opsporen van specifieke personen. Hiertoe gaat u naar de site www.icq.com/people. Daar kunt u de naam invoeren van de persoon die u zoekt. Vink voordat u op Search klikt, wel eerst het vakje Online Users uit. Klik vervolgens bij het zoekresultaat op de naam van de persoon om meer informatie over hem of haar te krijgen. Een groot voordeel van de ICQ-ledengids is dat veel deelnemers persoonlijke informatie over zichzelf hebben ingevoerd. Soms zijn dit alleen hobby’s, in
Afbeelding 13.14
262
Vergeet niet het vakje Online Users uit te vinken.
Handboek – Internetresearch
andere gevallen zal blijken dat iemand een e-mailadres plus zijn telefoon- en adresgegevens heeft ingevoerd. Om die reden kan een personenzoektocht niet zonder een bezoekje aan ICQ. Een nadeel van ICQ is dat nieuwe internetgebruikers ondervertegenwoordigd zijn, en u met andere woorden dus vooral internetveteranen vindt. 13icqTrillian – www.ceruleanstudios.com Op de site van Cerulean Studios is het programma Trillian te downloaden, waarmee u alle voorgaande chatdiensten kunt bedienen. Wanneer u vaak chatdiensten gebruikt, is dit programma daarom een aanrader. Naast de commerciële versie die 15 dollar kost, is er ook een uitgeklede gratis versie beschikbaar.
Afbeelding 13.15
De Basic-versie van Trillian is gratis.
13trillian
263
A
Nuttige researchwebsites
D
eze lijst met nuttige researchwebsites pretendeert niet volledig of zelfs maar representatief te zijn. Wat het wel is: een verzameling koppelingen die u in veel gevallen van pas zullen komen, en in elk geval op ideeën zal brengen om zelf meer uit internet te halen. In de meeste gevallen zijn websites die elders in dit boek aan de orde zijn gekomen hier niet herhaald, tenzij daar zwaarwegende redenen voor waren.
Appendix A – Nuttige researchwebsites
Archieven Archiefnet – www.archiefnet.nl Bevat verwijzingen naar sites met archiefmateriaal in Nederland en Vlaanderen. Ook op gemeenteniveau in te zien: wat voor archiefmateriaal heeft Assen online staan?
Hennekam – www.archieven.org Onmisbare en uiterst extensieve site van Eric Hennekam Agora, onofficieel archieforakel van de lage landen. Hennekam weet ontstellend veel over archieven en deelt die kennis vrijelijk op zijn site, die als enig nadeel heeft dat er zoveel op staat dat u even bezig zult zijn om greep te krijgen op de materie. Fanatieke zoekers kunnen veel hebben aan het forum van de site, op forum.archieven.org.
Betaalde informatie Factiva – www.factiva.com Een dienst van Dow Jones. Factiva geeft gebruikers toegang tot zo’n 28.000 bronnen in 157 landen.
Lexis-Nexis – www.lexis-nexis.com Een site van de uitgever Reed Elsevier, die vooral sterk is op het gebied van juridische en zakelijke informatie, maar ook veel nieuws bevat. Wie echter goedkoop de belangrijkste Nederlandse kranten wil lezen, kan zich beter vervoegen bij de Koninklijke Bibiotheek (zie sectie Bibliotheken).
ProQuest – www.proquest.com Via ProQuest krijgt u toegang tot 125 miljard pagina’s vol met krantenarchieven en andere databases.
266
Handboek – Internetresearch
Credo reference – corp.credoreference.com Credo reference biedt toegang tot meer dan honderdvijftig databases en doet dat op een prettige, gestructureerde manier. Het slechte nieuws: Credo references verkoopt niet aan eindgebruikers, louter aan instellingen, bedrijven en overheden. Het goede nieuws: omdat de makers graag willen dat u uw werkgever of plaatselijke bibliotheek zo ver krijgt een abonnement op Credo reference te nemen, is het mogelijk om een gratis maandabonnement te nemen via http://corp.credoreference.com/index.php?option= com_content&view=article&id=60&Itemid=67.
Bibliotheken Koninklijke Bibliotheek – www.kb.nl Bevat niet alleen een index van alle Nederlandse auteurs en hun boeken, maar tal van andere nuttige databanken, zoals Picarta, met de inventaris van zo’n zeshonderd bibliotheken. Het (goedkope) lidmaatschap van de Koninklijke Bibliotheek is noodzakelijk voor het gebruik van sommige functies, maar zeker aan te raden. Vooral omdat u toegang krijgt tot de Krantenbank, waarin de belangrijkste Nederlandse kranten zijn opgenomen.
Library of Congress – catalog.loc.gov Ruim twaalf miljoen boeken, muziekstukken, geluidsopnamen en kaarten staan in deze index van de bibliotheek van het Amerikaanse Congres. Vrijwel iedere titel in het Engelse taalgebied kan op deze site worden gevonden.
Biografieën Biografieën – www.biography.com Snel biografische informatie nodig? Op deze site staan ruim 25 duizend levensbeschrijvingen bij elkaar. Een nadeel is de sterke focus op NoordAmerika.
Kerkhoven – www.findagrave.com Een niet te onderschatten hulpmiddel bij het zoeken naar biografische informatie: deze site bevat de gegevens van 9,4 miljoen (min of meer) beroemde overledenen. Van Jim Morrison tot Pim Fortuyn: ze zijn er allemaal.
267
Appendix A – Nuttige researchwebsites
Cijfers Berekeningen – www.martindalecenter.com/Calculators.html Een bonte verzameling koppelingen naar sites die u kunnen helpen met berekeningen op allerlei gebieden. Of dat nu een ingewikkelde som is of het omrekenen van kledingmaten, deze site helpt bij het vinden van het antwoord.
Eenheden – www.digitaldutch.com/unitconverter Een handige site om diverse eenheden van onder meer lengte, gewicht of temperatuur te converteren.
Cultuur Films wereldwijd – www.imdb.com De Internet Movie Database (IMDB) is een onmisbare site met onwaarschijnlijk veel informatie over zo’n beetje alle films van enig formaat die ooit gemaakt zijn. IMDB is op verschillende manieren te doorzoeken, bijvoorbeeld op namen van films, acteurs, regisseurs en zelfs producenten.
Geliefde boeken – www.amazon.com/purchasecircles Boekhandel Amazon.com houdt bij welke boeken geliefd zijn in bepaalde landen, regio’s en zelfs bij welke bedrijven. Via de site is deze informatie in te zien.
Nederlandse films – www.nfdb.nl Ruim twintigduizend korte en lange films van eigen bodem staan op deze site bij elkaar. Vergeleken met de IMDB (zie ‘Films wereldwijd’ hiervoor) is de informatie wat magertjes.
268
Handboek – Internetresearch
Drugs Erowid – www.erowid.org Een bijzonder uitgebreide site waarop veel achtergrondinformatie over uiteenlopende psychoactieve stoffen als cafeïne en heroïne. Erowid waagt zich niet aan waardeoordelen, waardoor de site informatie bevat die bijna nergens anders te vinden is.
Lycaeum – www.lycaeum.org Een wat minder toegankelijke site met informatie over psychoactieve chemicaliën en planten.
Economie & geld Behr – www.behr.nl Beurskoersen in de gaten houden kan via deze site, die het ook mogelijk maakt een persoonlijk profiel te maken met uw eigen portfolio. Voor deze diensten moet helaas wel betaald worden. Geen geld? Ga naar www.google.com/finance.
IEX – www.iex.nl Bijzonder handige site voor beleggers, met nieuws, opinie en koersinformatie. Lid worden van IEX is gratis, het tijdschrift IEX Magazine is dat overigens niet.
Landinformatie IMF – www.imf.org/external/country Het Internationaal Monetair Fonds geeft op zijn site een overzicht van diverse landen en de relatie die het IMF daarmee heeft. Daardoor geeft de site waardevolle achtergrondinformatie over de economische situatie van een land.
Wisselkoersen – www.oanda.com/convert/classic Deze site biedt niet alleen de meest recente wisselkoersen, maar ook historische. Bepalen wat de dollar op 12 september 2002 ‘deed’ tegenover de euro, wordt zo erg eenvoudig.
269
Appendix A – Nuttige researchwebsites
Encyclopedieën Columbia Encyclopedia – www.infoplease.com/encyclopedia.html Ruim 57 duizend artikelen uit de Columbia Encyclopedia zijn gratis in te zien via deze site.
Encyclopaedia Britannica – www.britannica.com ‘s Werelds beroemdste encyclopedie vraagt geld voor entree, al kunnen journalisten zich gratis registreren. Zie voor informatie hierover poynter.org/ column.asp?id=32&aid=3011.
Wikipedia – www.wikipedia.org Een vrijwilligersproject. Deze encyclopedie wordt constant bijgewerkt door eenieder die dat wil. Desondanks is Wikipedia geen grote chaos geworden, maar een bijzonder nuttige – en gratis – bron van informatie. Vooral de Engelse versie van Wikipedia, te vinden op en.wikipedia.org, is van goede kwaliteit.
Zoek in veel encyclopedieën – www.freeality.com/encyclopt.htm Bijzonder lelijke site die desalniettemin nuttig is, omdat hij toegang geeft tot diverse gratis online encyclopedieën.
Genealogie Genlias – www.genlias.nl Op Genlias staan genealogische gegevens van de Nederlandse burgerlijke stand. De site gaat voor de meeste provincies terug tot 1811. Voor Limburg, Zeeuws-Vlaanderen en een deel van Noord-Brabant geldt dat er zelfs gegevens zijn die teruggaan tot eind 18e eeuw. Een waarschuwing: Genlias is groot, maar niet volledig. Nog regelmatig wordt nieuwe informatie aan de site toegevoegd.
Familienamen – www.meertens.knaw.nl/databanken.html Altijd al benieuwd geweest naar de diepere betekenis en geschiedenis van uw familienaam? Het Meertens Instituut schiet te hulp.
270
Handboek – Internetresearch
FamilySearch – www.familysearch.org Een site van de Kerk van Jezus Christus van de Heiligen der Laatste Dagen, in de volksmond beter bekend als ‘Mormonen’, hoewel degenen die daarmee bedoeld worden deze aanduiding verafschuwen. De leden van deze kerk hebben een grote belangstelling voor genealogie, die ze via deze site delen met de rest van de wereld. Via FamilySearch zijn bijna een miljard (!) namen op te vragen van families over de hele wereld, al ligt de nadruk uiteraard op Noord-Amerika en WestEuropa.
Geografie Afstand – www.indo.com/distance Handige site om snel de afstand tussen twee steden te berekenen.
Dynamische landkaarten – www.nationalgeographic.com/maps Prachtige site met mooie kaarten, die helaas niet altijd even diepgravend zijn, maar vaak wel interactief, wat zo veel betekent als dat er lekker gespeeld kan worden. Niettemin een bezoek waard, al was het alleen maar vanwege de satellietfoto’s.
Oddens – oddens.geog.uu.nl Wereldberoemde site van kaartenliefhebbers, met zo’n 22.500 verwijzingen naar kaartensites over de hele wereld. Wordt met grote regelmaat bijgewerkt.
Thematische kaarten – www.lib.utexas.edu/maps Een site van de University of Texas at Austin, die interessant is vanwege de uitgebreide verzameling koppelingen naar historische en thematische kaarten. Deze vindt u in de linkermenubalk.
271
Appendix A – Nuttige researchwebsites
Gezondheid Amerikaanse medicijnen – www.rxlist.com Site met uitputtend veel informatie over alle in de Verenigde Staten verkrijgbare medicijnen. Aangezien die grotendeels overeenkomen met wat in Europa te koop is, kan RxList erg nuttig zijn wanneer de Geneesmiddeleninformatiebank niet de gewenste informatie levert. Tip: zoek op (de Engelse variant van de) stofnaam, deze is internationaal vaak (vrijwel) hetzelfde, in tegenstelling tot de merknaam. RxList is niet al te kieskeurig en weet om te gaan met kleine spelfouten.
Bijsluiters – www.consumed.nl Informatie over ruim zesduizend in Nederland en België toegelaten medicijnen.
BMJ – bmj.bmjjournals.com/search.dtl De inhoud van alle uitgaven van het British Medical Journal sinds 1994 staat online, en is via deze pagina te doorzoeken en gratis te lezen.
eMedicine voor professionals – www.emedicine.com De laatste medische ontwikkelingen in de medische wetenschap op hoog niveau. eMedicine richt zich vooral op artsen en andere gezondheidsprofessionals.
Farmacotherapeutisch kompas – www.fk.cvz.nl/ Voor de gevorderde medicijnman (m/v) is dit overzicht van in Nederland geregistreerde medicijnen onmisbaar. Het Farmacotherapeutisch Kompas geeft een overzicht van werkzaamheid, therapeutische dosering en bijwerkingen. Boven in het scherm bevinden zich tabbladen, vanwaar u kunt doorklikken naar het minstens zo handige Diagnostische Kompas, dat helpt bij het stellen van een diagnose. Medische kennis op tenminste verpleegkundigenniveau is voor beide sites gewenst.
Geestelijke gezondheid – www.mentalhealth.com Diverse geestelijke ziektebeelden omschreven, inclusief zelftests. De ziektebeelden zijn gebaseerd op de DSM-IV, hét psychiatrische standaardwerk. Vaak zijn zowel de Europese als Amerikaanse definities beschikbaar – die willen nog weleens verschillen.
272
Handboek – Internetresearch
Kosten van ziekten – www.rivm.nl/kostenvanziekten De naam zegt het al: op deze site heeft het RIVM de kosten van diverse aspecten van volksgezondheid inzichtelijk gemaakt. De cijfers dateren uit 1999.
Kruiden – www.herbmed.org Over kruidengeneeskunde, ofwel fytotherapie, wordt veel onzin verteld. Deze site, samengesteld door onder meer artsen en doctoren (waaronder ‘Zwevende Beer’, zie www.nlm.nih.gov/mesh/bear.html), probeert met enig succes nuchtere informatie te verschaffen over de geneeskundige eigenschappen van sommige kruiden. Een nadeel is dat de site lijdt onder geldgebrek en dus soms rare kuren vertoont. Ook is de site hierdoor niet zo actueel als zou kunnen.
Medische gidsen – www.merck.com/pubs Diverse medische handboeken, gratis toegankelijk gemaakt door farmaceut Merck.
Nationale Atlas Volksgezondheid – www.rivm.nl/vtv/home/Atlas/ Allerlei statistische gegevens over gezondheid in Nederland zijn te raadplegen via deze prima site van het RIVM.
Nederlandse medicijnen – www.cbg-meb.nl/CBG/nl/humane-geneesmiddelen/ geneesmiddeleninformatiebank/default.htm Rechtstreekse toegang tot de Geneesmiddeleninformatiebank, én een mooi scrabblewoord erbij. Alle in Nederland officieel toegelaten medicijnen plus hun bijsluiters zijn hier te vinden. U kunt zowel zoeken op stofnaam als op naam van het geneesmiddel.
Overzicht Nederlandse gezondheidszorgregistraties – www.zorggegevens.nl Over veel gezondheidsterreinen worden in Nederland grote kaartenbakken bijgehouden met informatie over onder meer patiënten. Deze zogeheten registraties zijn op deze duidelijke, doch ietwat ambtelijke site bij elkaar gebracht.
273
Appendix A – Nuttige researchwebsites
PubMed – www.pubmed.gov Ruim veertien miljoen medische onderzoeken zijn via PubMed te vinden, al zijn vaak alleen de samenvattingen gratis te lezen. Niettemin onmisbaar voor iedere gezondheidsprofessional.
Vitamines – ods.od.nih.gov/showpage.aspx?pageid=48 De IBIDS-database geeft toegang tot serieus wetenschappelijk onderzoek naar de werkzaamheid van voedingssupplementen.
WebMD – www.webmd.com Goede consumentensite die de laatste ontwikkelingen op gezondheidsgebied redelijk volgt. WebMD bevat meer informatie dan op het eerste gezicht het geval lijkt. Doorklikken naar Medscape brengt u op een site die vooral bedoeld is voor gezondheidsprofessionals.
Ziekenhuis – www.ziekenhuis.nl Een medisch woordenboek, een geneesmiddelengids en een goede verzameling met ziektebeelden maakt deze site een aanvaardbaar alternatief voor wie het Engels niet voldoende machtig is om van de veel betere Amerikaanse websites op dit gebied gebruik te maken.
Internationaal Landgidsen CIA – www.cia.gov/cia/publications/factbook Hebt u stiekem een hekel aan uw kinderen? Adviseer ze dan deze site voor hun spreekbeurten. De Amerikaanse inlichtingendienst CIA heeft over alle landen ter wereld een onwaarschijnlijke hoeveelheid cijfers geproduceerd, die ooit van pas gaan komen – alleen niet bij spreekbeurten, daarvoor bevat de site simpelweg te veel informatie. Wist u bijvoorbeeld dat Nederland vijf vliegvelden heeft met onverharde landingsbanen die korter zijn dan 914 meter?
Landgidsen BBC – news.bbc.co.uk/2/hi/country_profiles Ze zijn niet zo goed als de landgidsen van The Economist (zie verder), maar desondanks verdienen de beknopte landgidsen van de BBC een eervolle vermelding.
274
Handboek – Internetresearch
Landgidsen The Economist – www.economist.com/countries ’s Werelds beste tijdschrift biedt duidelijke en informatieve landgidsen voor belangrijke zakenbestemmingen en koppelt trivia en feitelijkheden aan een overzicht van recent nieuws voor het desbetreffende land.
Tijd – www.timeanddate.com Een zeer uitgebreide wereldklok op de computer.
Internet Archief – www.archive.org Webdienst die poogt een archief aan te leggen van websites zoals ze er vroeger uitzagen. Archive.org doet dat door een kopie te maken van een site op verschillende tijdsmomenten. Helaas faalt Archive.org jammerlijk, want over menig opgenomen site is maar weinig te vinden.
FAQ’s – www.faqs.org/faqs FAQ’s zijn lijsten met vaakgestelde vragen, oftewel Frequently Asked Questions. Via deze site kunt u de FAQ’s lezen van Usenet-nieuwsgroepen.
Mythes – www.vmyths.com Ooit wel eens een paniekerig e-mailtje ontvangen waarin u werd bang gemaakt met een eng verhaal over een computervirus? De site Vmyths ontzenuwt zulke verhalen. Voordat u een dergelijke e-mail serieus neemt, doet u er goed aan eerst hier te controleren of u niet met een grap te maken hebt.
Netiquette – web.inter.nl.net/users/Maurice.Makaay Ook internet kent gedragsregels, de zogeheten Netiquette. De digitale variant van Amy Groskamp-Ten Have wijdt u op deze site gaarne in.
Onbekende termen – whatis.techtarget.com Met deze site bluft u zelfs uw computerslimme neefje eruit. Veel onbekende computertermen worden op deze site van een betekenis voorzien.
275
Appendix A – Nuttige researchwebsites
RFC’s – www.rfc-editor.org De Request For Comments (RFC’s) zijn de onofficiële wetboeken van internet. Op deze site zijn ze te lezen. Tip: lees voor een staaltje nerdhumor RFC 2322. (Als u de grap niet leuk vindt, bent u vermoedelijk voorzien van een normaal sociaal leven.)
Internetgidsen Amerikaanse meningen – www.epinions.com Deze site hoort feitelijk overal en nergens bij. Deelnemers geven hun mening over alles, van hamburgerrestaurants tot auto’s. Sterker nog, ze beoordelen zelfs elkaar, en zorgen er zo voor dat al te zeurderige participanten snel het veld moeten ruimen. Wat overblijft is een bijzonder handige site waar informatie te vinden is over de kwaliteit van tal van producten, bedrijven, diensten, films, cd’s, vakantiebestemmingen en nog veel meer.
H2G2 – www.bbc.co.uk/dna/h2g2 De Hitchhiker’s Guide to the Galaxy is een cultboek, maar ook een populaire website waar experts uit allerlei disciplines (waaronder een aantal nogal afwijkende) u gratis van advies voorzien. Deze site is zeer warm aanbevolen.
Omgevallen boekenplanken – www.refdesk.com De site Refdesk.com schijnt de favoriete pagina van Colin Powell te zijn, waaruit valt af te leiden dat de beste man dol moet zijn op lezen. Refdesk staat vol met koppelingen naar de meest uiteenlopende informatiebronnen. De charme van Refdesk is niet zozeer de overzichtelijkheid – die is er namelijk niet – maar de uitputtende volledigheid. Refdesk is bij uitstek geschikt voor een regenachtige zondagmiddag om u te verbazen over de enorme hoeveelheid informatie die internet bevat, en om nieuwe ideeën op te doen voor uw eigen researchwerkzaamheden.
Vragen staat vrij – www.askanowner.nl Een internetgids op maat, in de zin dat u vragen kunt stellen aan personen die zich deskundig achten op een bepaald gebied.
276
Handboek – Internetresearch
Wetenschappelijke omgevallen boekenplanken – www.martindalecenter.com Heel veel koppelingen naar sites over vrijwel alle denkbare wetenschappelijke disciplines. Martindale’s The Reference Desk, zoals de site formeel heet, is een uitstekend startpunt om een idee te krijgen van wat internet op wetenschappelijk gebied voor u kan betekenen. Enige minpunt: overdonderend.
Journalistiek Handboek van de Nederlandse pers en publiciteit – www.handboeknederlandsepers.nl Een uitgeklede versie van het bekende papieren standaardwerk. Wie meer informatie wil, hoeft overigens het gedrukte Handboek niet per se te kopen, maar kan ook verderop kijken bij MissMag.
Journalistenhulp Nederland – www.villamedia.nl Een redelijke site van de Nederlandse Vereniging van Journalisten. Bevat een goed overzicht met journalistiek nuttige sites, medianieuws en een prikbord voor vacatures.
Journalistenhulp België – www.journalinks.be Een nuttig overzicht met koppelingen die vooral voor journalisten interessant zijn, maar ook voor nieuwsjunkies.
MissMag – www.missmag.nl MissMag geeft online gegevens weg waar u bij het eerdergenoemde Handboek voor de Nederlandse pers en publiciteit voor moet betalen, zoals adressen.
Nature – press.nature.com De wereldberoemde Nature-tijdschriften zijn voor journalisten gratis toegankelijk via deze site. U dient zich wel eerst te registreren en bewijsmateriaal te overleggen dat u inderdaad voor een medium werkzaam bent.
277
Appendix A – Nuttige researchwebsites
Persberichten – www.nieuwsbank.nl Een site die zijn geld verdient met de distributie van – inderdaad – persberichten. IT-journalisten doen er goed aan hun licht ook eens op te steken bij www.persberichten.com.
Poynter Online – www.poynter.org Een uitstekende site van het Amerikaanse Poynter Institute over alle aspecten van alle vormen van journalistiek. Met forums, boekbesprekingen, internetgidsen en nog veel meer.
Wetenschapsjournalistiek Europa – www.alphagalileo.org Deze site distribueert persberichten van Europese universiteiten en onderzoeksinstellingen naar journalisten, die een profiel met hun interesses kunnen creëren om zo verschoond te blijven van minder boeiende kwesties. Registratie is noodzakelijk. Ook moet u aantonen in de journalistiek te werken. Als u het lidmaatschap van deze site combineert met deelname aan EurekAlert (zie hierna), blijft u behoorlijk op de hoogte.
Wetenschapsjournalistiek Verenigde Staten – www.eurekalert.org De laatste onderzoeken uit de Verenigde Staten krijgt u op maat gesneden in uw elektronische brievenbus – als u zich eerst door de accrediteringsprocedure heen worstelt, want de Amerikanen zijn als de dood voor misbruik. Met reden, want via EurekAlert wordt regelmatig koersgevoelige informatie verspreid. Wie eenmaal geregistreerd is, krijgt ook gratis toegang tot sites van diverse tijdschriften, waaronder Cell, The Lancet, PNAS en Science. Voor Science is een speciaal mediawachtwoord beschikbaar, dat echter goed verstopt is op www.eurekalert.org/jrnls/sci/scienceOnlineSkeleton.php. Dit webadres is alleen toegankelijk als u al geregistreerd bent.
Militair Federation of American Scientists – www.fas.org Prima site van een groep Amerikaanse wetenschappers met een kritische houding ten opzichte van wapens en militarisme. Niettemin bulkt de site van informatie over alles wat met oorlog, wapens, legers en geheime diensten te maken heeft.
278
Handboek – Internetresearch
Jane’s – www.janes.com De wereldberoemde militaire uitgeverij Jane’s heeft een uitstekende site, waarop genoeg informatie gratis beschikbaar is om de pagina ook interessant te houden voor wie zich het (hoge) abonnementsgeld niet kan of wil veroorloven.
Stratfor – www.stratfor.com Een Amerikaans bedrijf dat zich specialiseert in geopolitieke analyses. Hoewel Stratfor geld vraagt voor zijn diensten, levert het ook een gratis lezenswaardige nieuwsbrief waarin de situatie in roerige gebieden wordt besproken.
Nederland Buurtinformatie – www.funda.nl en www.cbsinuwbuurt.nl Formeel een site om een huis te kopen, maar in werkelijkheid ook erg handig om een indicatie te krijgen van de sociaal-economische status van een bepaalde buurt. Voer daartoe een postcode in, hoop dat er een huis in de desbetreffende buurt te koop staat en klik op het huis. U krijgt nu een menu met tabbladen te zien, waarvan er eentje ‘Buurt’ heet. Klik hierop. Voorheen was het mogelijk om rechtstreeks deze buurtinformatie op te vragen, maar deze functionaliteit is door Funda uitgeschakeld. Wilt u meer informatie? Probeer het dan op www.cbsinuwbuurt.nl, een site van het Centraal Bureau voor de Statistiek.
Misdaad – www.ad.nl/misdaadmeter Leuker kunnen ze het bij het Algemeen Dagblad niet maken. Wel duidelijker. Na een bezoek aan deze site weet u precies hoeveel risico u loopt op een inbreker. Voor actuele misdaden kunt u terecht op www.misdaadkaart.nl.
Nederlandse gemeenten – www.zoekplaats.nl Informatie over zo’n zesduizend Nederlandse gehuchten, buurtschappen, dorpen en steden.
279
Appendix A – Nuttige researchwebsites
Onderwijs Plagiaat opspeuren – www.ephorus.nl en www.turnitin.com Als het vak ‘Overschrijven’ niet op het curriculum van uw onderwijsinstelling staat, is dit een handige site. Het helpt bij het opspeuren van creatieve kopieerders (en ook bij de minder creatieve variant). Nadeel van Ephorus en turnitin: gebruik is niet gratis. Turnitin heeft daarnaast nog een extra nadeel, namelijk dat de dienst zich richt op de Engelstalige markt.
Schoolprestaties – www.onderwijsinspectie.nl De Inspectie van het Onderwijs heeft een site gebouwd die niet echt uitblinkt in gebruiksgemak. Alternatief: www.trouwcommunities.nl/onderwijs/ schoolprestaties.html.
Politiek en overheid (Nederland) Eerste en Tweede Kamer – www.parlement.nl De websites van de Eerste en Tweede Kamer zijn toegankelijk via deze website.
Officiële bekendmakingen – https://zoek.officielebekendmakingen.nl/ De Handelingen van de Tweede en Eerste Kamer zijn te vinden via deze site, net als Kamerstukken, Kamervragen en publicaties uit het Staatsblad. Nog mooier: de site is geheel gratis.
Rechtspraak – www.rechtspraak.nl Deze site bevat informatie over Nederlandse rechtbanken en gerechtshoven, maar ook belangrijke uitspraken die zelfs doorzoekbaar zijn. De vonnissen zijn wel geanonimiseerd.
Sociaal en Cultureel Planbureau – www.scp.nl Publicaties van het Sociaal en Cultureel Planbureau worden op deze site aangekondigd en soms ook gratis vrijgegeven. Verder bevat de site koppelingen naar diverse eerdere enquêtes en onderzoeken.
280
Handboek – Internetresearch
Politiek en overheid (internationaal) Internationale organisaties in Genève – www.intl.ch In de Zwitserse hoofdstad Genève zijn veel internationale en non-gouvernementele organisaties gevestigd. Deze site biedt een overzicht.
Internationale organisaties elders – www.lib.umich.edu/government-documents-center/explore/browse/ international-organizations/256/search/ Deze site van de University of Michigan is een goede aanvulling op de site met internationale organisaties in Genève. Gebruik vooral de zoekmogelijkheid, want de alfabetische volgorde waarin de organisaties standaard staan vermeld, maakt het zoeken niet echt eenvoudiger.
Leiders – https://www.cia.gov/library/publications/world-leaders-1/index.html Wie is de baas in welk land? De Amerikaanse inlichtingendienst CIA houdt het nauwkeurig bij. Handig als u een dictator wilt afzetten en bang bent de verkeerde persoon te grazen te nemen.
Overheden – www.gksoft.com/govt/en Een overzichtssite waarop vrijwel alle overheden ter wereld staan vermeld, inclusief koppelingen naar de bijbehorende websites. Nadeel: al geruime tijd niet meer bijgewerkt, al levert dat relatief weinig problemen op.
Politieke webgids – www.politicalresources.net Sites van politieke partijen, regeringen en wat dies meer zij staan op deze site keurig geografisch gesorteerd bij elkaar.
Publieke databases – www.searchsystems.net Met name in Noord-Amerika zijn veel overheidsdatabases openbaar. Maar ook publieke databanken in andere delen van de wereld zijn via deze site te vinden. Overigens beperken de databases op deze site zich niet louter tot overheids- en politieke informatie.
281
Appendix A – Nuttige researchwebsites
Staatslieden in heden en verleden – www.worldstatesmen.org Op zoek naar de naam van de mannen die aan het eind van de 16e eeuw de leiding hadden over Brazilië? Of simpelweg naar de huidige premier van Nieuw-Zeeland? Al deze informatie staat op de lelijke maar functionele site World Statesmen.
Recht Europese rechtspraak –curia.europa.eu De website van het Europese Hof van Justitie en het Gerecht van Eerste Aanleg geeft uitleg over procedures en werkwijze van deze instellingen. Alle gecreëerde jurisprudentie is doorzoekbaar via de site.
Mensenrechten – www.echr.coe.int De website van het Europees Hof voor de Rechten van de Mens, met uiteraard een overzicht van uitspraken die het Hof heeft gedaan.
Nederlandse wetgeving – wetten.overheid.nl De Nederlandse wetgeving, inclusief Algemene maatregelen van bestuur (Amvb’s), is via deze site op woordniveau te doorzoeken, maar ook op titel.
Wereldwijde wetgeving – www.worldlii.org Helaas is deze site, die pretendeert een overzicht te geven van wat er wereldwijd op juridisch gebied speelt, niet volledig. Bij gebrek aan beter kunt u echter hier terecht als u op zoek bent naar juridische informatie die de landsgrenzen overschrijdt. Bevat een overzicht van koppelingen naar juridische websites over de hele wereld.
Religie Bijbel – bijbel.opurk.nl De Staten-, Luther- en Leidsche vertaling van de bijbel op één site. De drie versies kunnen afzonderlijk worden gelezen, maar ook naast elkaar worden gelegd.
282
Handboek – Internetresearch
Metareligie – www.religioustolerance.org Een uitputtend overzicht van verschillen en overeenkomsten tussen diverse religies. De site is grotendeels samengesteld door een agnost.
Statistieken – www.adherents.com Op deze site is cijfermateriaal over ruim 4.200 religies te vinden, al hebben de auteurs niet echt hun best gedaan het geheel visueel aantrekkelijk te maken.
Software Adobe Reader – www.adobe.com/products/reader Een gratis programma waarmee u zogeheten PDF-bestanden kunt bekijken. Deze worden op veel sites gebruikt om documenten in op te slaan. Zonder Adobe Reader gaat veel informatie aan u voorbij.
Copernic – www.copernic.com Met het op deze site gratis te downloaden programma Copernic Agent Basic kunt u zoekopdrachten naar meerdere zoekmachines sturen, en de resultaten vervolgens opslaan.
Gratis programma’s – www.download.com Op deze site is een gigantische hoeveelheid software gratis te downloaden. Voor sommige programma’s, de zogeheten shareware, moet na een proefperiode alsnog worden betaald.
PGPI – www.pgpi.org Met dit gratis programma kunt u uw e-mail omzetten in geheimtaal die zo krachtig is dat zelfs een inlichtingendienst er vermoedelijk niet achter komt wat u hebt geschreven. Zie ook www.gnupg.org.
283
Appendix A – Nuttige researchwebsites
Statistiek Amerikaanse statistieken – www.fedstats.gov Hoeveel cijfers had u gehad willen hebben? Op Fedstats vindt u verwijzingen naar zo’n honderd Amerikaanse overheidsinstellingen die statistische informatie online aanbieden.
Cursus statistiek – nilesonline.com/data De Amerikaanse journalist Robert Niles leert u in deze gratis online cursus de meest gemaakte statistische interpretatiefouten vermijden.
Europese statistieken –epp.eurostat.ec.europa.eu Omdat de Europese eenwording toch al zo weinig geld kost, vraagt het Europese statistische bureau Eurostat keiharde doekoe voor nogal wat van haar producten. Er blijft gelukkig nog genoeg over om de site interessant te houden.
Nederlandse statistieken – statline.cbs.nl De website Statline van het Centraal Bureau voor de Statistiek bevat zo veel informatie dat het raadzaam is bij het gedeelte ‘Zoeken’ eerst op Zoeken help te klikken om niet te verdwalen in de cijferbrij. Daarna kunt u met een gerust hart kijken of het tv-bezit in Nederland de afgelopen jaren is toe- of afgenomen.
Taal Afkortingen – www.acronymfinder.com Onduidelijke afkorting? Acronym Finder brengt snel duidelijkheid, wat maar goed is ook, want op zo’n foeilelijke site wilt u geen seconde langer blijven dan nodig is.
Engelse thesaurus –thesaurus.com Deze site bevat zowel een thesaurus als een woordenboek. U hoeft hiervoor alleen maar even bij het zoekveld de juiste selectie te maken.
284
Handboek – Internetresearch
Merriam-Webster – www.m-w.com Een uitstekende site met een goed Engelstalig woordenboek. Merriam-Webster geeft bij veel termen zelfs etymologische informatie. Ook zijn programmaatjes te downloaden die het makkelijker maken om woordbetekenissen op te zoeken als u gebruikmaakt van Internet Explorer of Firefox.
Nederlandse taaldatabanken – www.onzetaal.nl/koppling/woorden.php Een overzicht van de meeste, gratis toegankelijke databanken en websites die zich op enige manier bezighouden met de Nederlandse taal.
Taalkwesties – vrttaal.net/taaldatabanken_master/algemeen/home.shtml De Belgen winnen chronisch bij Tien voor Taal, en dus is deze Vlaamse site met taaladviezen er eentje om serieus te nemen. Mocht u uw zoektocht liever tot Nederland beperken, dan zijn taaladvies.net en www.onzetaal.nl/advies/index.php goede sites.
Van Dale – www.vandale.nl Het volledige woordenboek krijgt u uiteraard niet gratis, maar voor een snelle controle op de juiste spelling van een woord is de Van Dale-site vaak bijzonder handig.
Vervoer Auto’s – www.autoweek.nl De site van AutoWeek beschikt over CarBase, een bijzonder handige database waarin vrijwel alle op de markt zijnde auto’s vermeld staan, inclusief technische details en informatie over de marktwaarde.
Havens – www.ports.com Een site met informatie over 920 havens in 105 verschillende landen, die zich vooral beperkt tot koppelingen naar de sites van de desbetreffende havens.
285
Appendix A – Nuttige researchwebsites
Luchtvaart – www.landings.com Site met luchtvaartnieuws en heel veel koppelingen naar andere sites over luchtvaart, die aan de onderkant van de pagina zijn verstopt. Wel een erg lelijke site.
Reisplanner OV – www.9292ov.nl De wellicht overbekende site waarmee een route van deur tot deur kan worden gepland. Reizigers krijgen een reisadvies gebaseerd op trein, bus, tram, metro en benenwagen.
Routeplanner – route.anwb.nl Er zijn vele routeplanners op internet, maar deze is snel en betrouwbaar.
Spitsvoorspelling – www.vid.nl/Prognose/show Niets meer, niets minder.
Webmedia Alle kranten ter wereld – www.thepaperboy.com Nou ja, bijna alle. Selecteer een land, en The Paperboy toont u een lijst met kranten plus koppelingen naar de desbetreffende sites. The Paperboy is zo goed om bij elke krant de taal waarin deze geschreven is, te vermelden. Dat scheelt veel frustraties. The Paperboy heeft een zustersite voor tijdschriften, te weten The Magazine Boy (www.themagazineboy.com), maar deze is lang niet zo volledig.
Geheime documenten – www.thesmokinggun.com Als iemand in de Verenigde Staten documenten in de openbaarheid wil hebben, kan hij een journalist gaan zoeken – of het gewoon faxen naar de mensen achter The Smoking Gun. Deze site heeft daarom regelmatig smakelijke primeurs.
Nederlandse kranten – www.kranten.com Een site die een overzicht geeft van actuele krantenkoppen in vrijwel alle Nederlandse dagbladen. Heeft gespecialiseerde secties voor onder meer Belgisch nieuws en sport.
286
Handboek – Internetresearch
Tijdschriftartikelen – findarticles.com Beter dan The Magazine Boy (www.themagazineboy.com) is deze site, die claimt bijna drie miljoen tijdschriftartikelen te ontsluiten. Uiteraard voeren de Angelsaksische bladen de boventoon.
Wetenschap Amerikaanse patenten – www.uspto.gov Deze site doet wat hij belooft: u kunt hier eenvoudig op zoek naar Amerikaanse patenten plus alle bij de patenten behorende documentatie.
Europese patenten – www.european-patent-office.org De site van het Europese patentenbureau. Naar goed Europees gebruik is de site overigens niet erg helder opgebouwd. Onder het gedeelte ‘Search engines and site index’ zijn de koppelingen verborgen naar sites die het daadwerkelijke zoeken in de Europese patentendatabase mogelijk maken.
Onderzoekers – www.onderzoekinformatie.nl Een bijzonder handige site om snel te weten te komen welke onderzoekers zich in Nederland met een bepaald onderwerp bezighouden. Zo weet u snel bij wie u navraag kunt doen over de fijnere details van vCJD-morbiditeit dan wel neo-Keynesiaanse regulatietheorie. Extra bonus voor journalisten: dankzij deze site is het niet langer nodig elke keer dezelfde deskundigen uit te nodigen voor uw tv-programma of opiniepagina.
Wat zweeft daar – www.heavens-above.com Een site waarop te zien is waar de Space Shuttle of het ruimtestation ISS zweeft, plus diverse andere kunstmatige hemellichamen zoals satellieten.
Zoekmachines Cracks-zoekmachine – astalavista.box.sk Voor educatieve doeleinden opgenomen. Via deze site verspreiden criminelen programma’s (maar pas op: ook virussen!) waarmee het mogelijk is om illegaal software te gebruiken waarvoor niet betaald is. Deze site moet u dan ook niet voor eigen gebruik aanwenden, dat zou niet netjes zijn.
287
Appendix A – Nuttige researchwebsites
Nieuws – news.google.com Een product van Google dat in zo’n 4.500 nieuwsbronnen wereldwijd zoekt. Google heeft ook een blogzoekmachine, op blogsearch.google.com.
Nieuws en weblogs – www.icerocket.com Via Icerocket zoekt u zowel in ‘officiële’ nieuwsbronnen als in op nieuws gerichte weblogs; veelal door particulieren samengestelde sites die sterk persoonlijk van toon zijn.
Scirus (wetenschappelijke zoekmachine) – www.scirus.com Scirus is met 167 miljoen wetenschappelijke pagina’s minder groot dan Phibot, maar is dusdanig geliefd bij de wetenschappelijke gemeenschap dat een vermelding niettemin op zijn plaats is. Via Scirus is het onder meer goed zoeken naar medische informatie, maar ook naar patenten. Een speciale kanttekening betreft het auteursrecht over dit hoofdstuk. Net zoals bij de rest van dit boek vallen de begeleidende teksten daaronder. Echter, ook de compilatie van webadressen is wettelijk beschermd, en wel volgens het databankenrecht (Europese Richtlijn 96/9/EG). De auteur van dit boek zal ongeoorloofde verspreiding met alle juridische middelen, en zo nodig wat Dobermanns, bestrijden.
288
B
Overzicht van TLD’s
D
eze appendix geeft een overzicht van alle zogeheten Top Level Domains (TLD‘s). U kunt aan de hand van de TLD de afkomst of de oorsprong van een website of e-mailadres over het algemeen vaststellen.
Deze appendix bestaat uit twee onderdelen:
Een overzicht van alle generieke TLD’s Een overzicht van alle landen-TLD’s
Appendix B – Overzicht van TLD’s
Generieke TLD’s TLD
Betekenis
.aero .asia .biz .cat
Bestemd voor bedrijven en organisaties die werkzaam zijn in de luchtvaart Bestemd voor bedrijven, organisaties en personen in Azië Bestemd voor bedrijven Bestemd voor sites die zich bezighouden met de Catalaanse taal en/of cultuur Oorspronkelijk bedoeld voor commerciële organisaties, tegenwoordig voor iedereen beschikbaar Bedoeld voor coöperaties Afkorting voor informatie. Staat open voor iedereen. Voor alle sites die iets met banen of werkgelegenheid te maken hebben Sites speciaal bedoeld om bekeken te worden op gsm-toestellen en smartphones Bestemd voor musea Bedoeld voor natuurlijke personen die bijvoorbeeld een site onder hun eigen naam willen Vrij beschikbaar Bedoeld voor niet-commerciële organisaties, maar iedereen kan een .orgdomein registreren Enkel voor personen die in de Verenigde Staten een baan hebben in de accountancy, advocatuur of gezondheidszorg Bedoeld voor telefoniediensten Bestemd voor de reisindustrie
.com .coop .info .jobs .mobi .museum .name .net .org .pro .tel .travel
Exclusieve generieke TLD’s TLD
Betekenis
.edu
Voor Amerikaanse instellingen voor hoger onderwijs die geaccrediteerd zijn door het Amerikaanse ministerie van Onderwijs Alleen voor Amerikaanse overheidsinstanties Domein voor internationale organisaties Voor gebruik door het Amerikaanse leger
.gov .int .mil
Land-TLD’s TLD
Naam land (Engels)
Nederlandse naam (indien verschillend)
.ac .ad .ae .af .ag
Ascension Island Andorra United Arab Emirates Afghanistan Antigua and Barbuda
Verenigde Arabische Emiraten (VAE)
290
Antigua en Barbuda
Handboek – Internetresearch
.ai .al .am .an .ao .aq .ar .as .at .au .aw .ax .az .ba .bb .bd .be .bf .bg .bh .bi .bj .bm .bn .bo .br .bs .bt .bv .bw .by .bz .ca .cc .cd .cf .cg .ch .ci .ck .cl .cm .cn .co .cr .cu
Anguilla Albania Armenia Netherlands Antilles Angola Antarctica Argentina American Samoa Austria Australia Aruba Åland Islands Azerbaijan Bosnia and Herzegovina Barbados Bangladesh Belgium Burkina Faso Bulgaria Bahrain Burundi Benin Bermuda Brunei Darussalam Bolivia Brazil Bahamas Bhutan Bouvet Island Botswana Belarus Belize Canada Cocos (Keeling) Islands The Democratic Republic of the Congo Central African Republic Congo (Republic of) Switzerland Côte d’Ivoire Cook Islands Chile Cameroon China (Zhongguo) Colombia Costa Rica Cuba
Albanië Armenië Nederlandse Antillen
Argentinië Amerikaans Samoa Oostenrijk Australië Åland-eilanden Azerbeidzjan Bosnië-Herzegovina
België Bulgarije Bahrein
Brunei Bolivia Brazilië Bahama’s Bhutan
Wit-Rusland
Cocos (Keeling)-eilanden Democratische Republiek Congo Centraal-Afrikaanse Republiek Congo-Brazzaville Zwitserland Ivoorkust Cookeilanden Chili Kameroen China
291
Appendix B – Overzicht van TLD’s
.cv .cx .cy .cz .de .dj .dk .dm .do .dz .ec .ee .eg .eh .er .es .et .eu .fi .fj .fk .fm .fo .fr .ga .gb .gd .ge .gf .gg .gh .gi .gl .gm .gn .gp .gq .gr .gs .gt .gu .gw .gy .hk .hm
292
Cape Verde Christmas Island Cyprus Czech Republic Germany Djibouti Denmark Dominica Dominican Republic Algeria Ecuador Estonia Egypt Western Sahara Eritrea Spain Ethiopia European Union Finland Fiji Falkland Islands Federated States of Micronesia Faroe Islands France Gabon Great Britain Grenada Georgia French Guiana Guernsey Ghana Gibraltar Greenland Gambia Guinea Guadeloupe Equatorial Guinea Greece South Georgia and the South Sandwich Islands Guatemala Guam Guinea-Bissau Guyana Hong Kong Heard Island and McDonald Islands
Kaapverdië
Tsjechië Duitsland Denemarken Dominicaanse Republiek Algerije Estland Egypte West-Sahara (momenteel niet in gebruik) Spanje Ethiopië Europese Unie
Falkland-eilanden Micronesië Faeröer Eilanden Frankrijk Groot-Brittannië Georgië Frans-Guyana
Groenland Republiek Guinee Equatoriaal-Guinea Griekenland Zuid-Georgië en de Zuidelijke Sandwicheilanden
Guinee-Bissau
Heard en McDonald-eilanden
Handboek – Internetresearch
.hn .hr .ht .hu .id .ie .il .im .in .io .iq .ir .is .it .je .jm .jo .jp .ke .kg .kh .ki .km .kn .kp .kr .kw .ky .kz .la .lb .lc .li .lk .lr .ls .lt .lu .lv .ly .ma .mc .md .me .mg
Honduras Croatia/Hrvatska Haiti Hungary Indonesia Ireland Israel Isle of Man India British Indian Ocean Territory Iraq Iran Iceland Italy Jersey Jamaica Jordan Japan Kenya Kyrgyzstan Cambodia Kiribat Comoros Saint Kitts and Nevis Korea, Democratic People’s Republic Republic of Korea Kuwait Cayman Islands Kazakhstan Lao People’s Democratic Republic Lebanon Saint Lucia Liechtenstein Sri Lanka Liberia Lesotho Lithuania Luxembourg Latvia Libyan Arab Jamahiriya Morocco Monaco Republic of Moldova Montenegro Madagascar
Kroatië Haïti Hongarije Indonesië Ierland Israël
Irak IJsland Italië
Jordanië Kenia Kirgizië Cambodja Comoren St. Kitts en Nevis Noord-Korea Zuid-Korea Koeweit Kaaiman-eilanden Kazachstan Laos Libanon Sint Lucia
Litouwen Luxemburg Letland Libië Marokko Moldavië Madagaskar
293
Appendix B – Overzicht van TLD’s
.mh .mk .ml .mm .mn .mo .mp .mq .mr .ms .mt .mu .mv .mw .mx .my .mz .na .nc .ne .nf .ng .ni .nl .no .np .nr .nu .nz .om .pa .pe .pf .pg .ph .pk .pl .pm .pn .pr .ps .pt .pw .py .qa .re .ro
294
Marshall Islands Macedonia Mali Myanmar Mongolia Macao Northern Mariana Islands Martinique Mauritania Montserrat Malta Mauritius Maldives Malawi Mexico Malaysia Mozambique Namibia New Caledonia Niger Norfolk Island Nigeria Nicaragua Netherlands Norway Nepal Nauru Niue New Zealand Oman Panama Peru French Polynesia Papua New Guinea Philippines Pakistan Poland Saint Pierre and Miquelon Pitcairn Island Puerto Rico Palestinian territory, occupied Portugal Palau Paraguay Qatar Reunion Island Romania
Marshall-eilanden Macedonië
Mongolië Macau Noordelijke Marianen Mauritanië
Maleisië Namibië Nieuw-Caledonië Norfolk-eiland
Nederland Noorwegen
Nieuw-Zeeland
Frans Polynesië Papoea-Nieuw-Guinea Filipijnen Polen St. Pierre en Miquelon Pitcairn-eiland Palestijnse bezette gebieden
Réunion Roemenië
Handboek – Internetresearch
.rs .ru .rw .sa .sb .sc .sd .se .sg .sh .si .sj .sk .sl .sm .sn .so .sr .st .su
Serbia Russian Federation Rwanda Saudi Arabia Solomon Islands Seychelles Sudan Sweden Singapore Saint Helena Slovenia Svalbard and Jan Mayen Islands Slovakia Sierra Leone San Marino Senegal Somalia Suriname Sao Tome and Principe Former Soviet Union
.sv .sy .sz .tc .td .tf .tg .th .tj .tk .tl .tm .tn .to .tp
El Salvador Syrian Arab Republic Swaziland Turks and Caicos Islands Chad French Southern Territories Togo Thailand Tajikistan Tokelau East Timor Turkmenistan Tunisia Tonga East Timor
.tr .tt .tv .tw .tz .ua .ug .uk .us
Turkey Trinidad and Tobago Tuvalu Taiwan Tanzania Ukraine Uganda United Kingdom United States of America
Servië Rusland Saoedi-Arabië Salomonseilanden Seychellen Zweden St. Helena Slovenië Svalbard en Jan Mayen Slowakije
Somalië Sao Tomé en Principe Voormalige Sovjet-Unie (wordt nog steeds gebruikt) Syrië Turks- en Caicos-eilanden Tsjaad Franse Zuidelijke en Antarctische Gebieden
Tadzjikistan Oost-Timor (nieuwe code) Tunesië Oost-Timor (oude code, wordt nog steeds gebruikt) Turkije Trinidad en Tobago
Oekraïne Oeganda Verenigd Koninkrijk Verenigde Staten van Amerika
295
Appendix B – Overzicht van TLD’s
.uy .uz .va .vc .ve .vg .vi .vn .vu .wf .ws .ye .yt .za .zm .zw
Uruguay Uzbekistan Holy See (Vatican City State) Saint Vincent and the Grenadines Venezuela Virgin Islands (UK) Virgin Islands (USA) Vietnam Vanuatu Wallis and Futuna Islands Samoa Yemen Mayotte South Africa Zambia Zimbabwe
Oezbekistan Vaticaanstad St. Vincent en de Grenadinen
Britse Maagdeneilanden Amerikaanse Maagdeneilanden
Wallis en Futuna
Zuid-Afrika
Daarnaast bestaan er enkele TLD’s in niet-westerse schriften. Deze zijn niet in dit boek opgenomen.
296
Index * 29 .be 129 .com 129 .de 129 .edu 129 .gov 129 .int 129 .mil 129 .nl 129 .org 129 /join 261 /nick 260 /whois 261 + 38 Aanhalingstekens 39, 116 Aardvark 109 About.com 91 Acronym Finder 284 Administrative contact 145 Adobe Acrobat PDF 50, 52, 54 Adobe PostScript 50, 54 Adobe Reader 283 Adresgegevens bedrijven 167 personen 164 Advocaten 180 Afkortingen 284 Afstand 271 Afzenderinformatie 237 Alexa 78 Algemene zoekstrategie 16 AllExperts 106 Alltheweb 20 AllWhois 146 AltaVista 78
Amerikaanse medicijnen 272 Amerikaanse meningen 276 Amerikaanse patenten 287 AND 28, 37 Andrew Sullivan 191 Answerbag 111 Answers.com 107 Archief 275 Archiefnet 266 ARPA 122 ARPANet 124 Article 214 Ask 78 Ask a Librarian 106 Ask an ipl2 Librarian 104 Ask.com 78 Atom 196-197 Author 214 Autodesk DWF 50, 54 Automatisch op de hoogte blijven via software 118 via websites 115 Autoriteit 25 Autoriteitscontrole 143 Auto's 285 Baran, Paul 123 BBC 193, 274 Bcc: 241 Beaucoup 84 Behr 269 Berekeningen 268 Berners-Lee, Tim 124 Betrouwbaarheid 145 Beveiliging 4 Bibliotheken 267
Index
BIG-register 179 Bijbel 282 Bijsluiters 272 Binaries 214 Bing 20, 77 Biografieën 267 BitTorrent 135 Bladwijzer 13, 226 Bloglines 202 Blunders 138 Boolean 27, 37 British Medical Journal 272 Bronverificatie 141 Bruce Clay 88 Buurtinformatie 279 Cache 81 geavanceerd gebruik 58 versie 53 zoekwoorden arceren 49 Cc: 241 CentralOps 149 Channel 258 Chatdienst 247, 255 Chatruimte 256 Chatten 255 Chinese methode 132 Chrome 7 toetsencombinaties 16 CIA 274 Cijfers 268 Clusty 81 C-net 159 Columbia Encyclopedia 270 Computer 2 beter bedienen tijdens het zoeken 12 Computerprogramma 4 Computertermen 275 Copernic 283 Copernic Desktop Search 9 Cracks-zoekmachine 287 Crawler 24 Credo reference 267 Cultuur 268 Daily Telegraph, The 188, 193 DARPA 122 Datum 45 De Telefoongids 165 Define: 59
298
Deskundigen vinden 179 Dienstmakkers.nl 175 Diepe web 96 Diplomaten 181 Directory MOZilla Zie Dmoz.nl Directory.google.com 31 Directory.google.nl 31 Discussie 212-213 Discussieforum 127 Discussielijst 232 Dmoz.nl 30, 32, 92 DNS 125, 127 reverse scan 155, 158 DNS-server 126 Documentsoort 51 Dogpile 82 Domain Name System 125 Domeinbezitter 144 Domeinnaam traceroute 156 Dow Jones 266 Drugs 269 DSL 3 Dynamische landkaarten 271 Economie & geld 269 Eenheden 268 Eerste en Tweede Kamer 280 Elsevier Webgids 74 E-mail 8, 134 afzenderinformatie 237 als informatiebron 231 filteren 117 E-mailadres 182 E-mailheader 237 analyseren 241 begrijpen 240 eMedicine 272 eMule 135 Encyclopaedia Britannica 270 Encyclopedieën 270 Engelse thesaurus 284 Erowid 269 Europees Hof voor de Rechten van de Mens 282 Europese Hof van Justitie 282 Europese patenten 287 Europese rechtspraak 282
Handboek – Internetresearch
Expertdienst 103 Extensible Markup Language 186 Facebook 250 Factiva 266 Familienamen 270 FamilySearch 271 FAQ 275 Farmacotherapeutisch kompas 272 Federation of American Scientists 278 Fedstats 284 FeedDemon 197 FeedReader 198 File Transfer Protocol 135 Filetype: 54 Films wereldwijd 268 Firefox 6, 186 toetsencombinaties 14 Foondump 169 Foursquare.com 250 Freebase 82 Friendster 253 From: 240 FTP 135 Gedistribueerd netwerk 123 Geenstijl.nl 138 Geestelijke gezondheid 272 Geheime documenten 286 Geheugen 2 Geld 269 Geliefde boeken 268 Genealogie 270 Geneesmiddeleninformatiebank 273 Genève 281 Genlias 270 Geografie 271 George Boole 27 Gerecht van Eerste Aanleg 282 Gereedschap 2 Geschiedenis van internet 124 Gezondheid 272 Gezondheidszorg 179 Gigablast 79 Google 20, 23, 31, 54, 81, 195, 205-206 IP-nummers zoeken 127 Alerts 115 als rekenmachine 59 als synoniemenzoeker 60 als woordenboek 59
basismogelijkheden 34 Blog Search 203 Books 66 cache 49 Custom Search Engine 66 Desktop 71 Earth 70 Experimental 70 experimentele functies 68 Finance 67 geavanceerd gebruik van de cache 58 Groups 215, 222, 228 Language Tools 10 lui zoeken 102 Maps 64 maximaal aantal zoekwoorden 35 met alle woorden 37 met de exacte woordcombinatie 38 met een van deze woorden 39 Nieuws 67 overige functies 71 Persoonlijk 65 Products 67 Reader 202 Scholar 66 Sets 68 software 70 soortgelijke pagina's vinden 61 speciale functies 47 Toolbar 70 versus andere zoekmachines 34 Video 67 Web History 66 zonder de woorden 43 Google Chrome Zie Chrome Google Dance 45 Google Directory 83, 92 Google Earth KML 51-52, 54 Google Earth KMZ 51, 54 Google Wave 254 Gouden Gids 167 Gouden zoekregels 17 Groups 214 Handboek van de Nederlandse pers en publiciteit 277 Havens 285 Header 237
299
Index
Hennekam 266 Heuristiek 24 Hiërarchie 214, 223 Hitchhiker's Guide to the Galaxy 276 HTML 50, 97 Hulp 32 Hunch 108 HyperText Markup Language 131 HyperText Transfer Protocol 128 Hyves.nl 173, 252 ICQ 135, 256, 262 IEX 269 Ikhebje.nl 170 Ilse 20, 22, 39, 74 IM 135 Infobel 166 Infomine 99 InfoPeople 87 Inspectie van het Onderwijs 280 Instant Messaging 135 Intern geheugen 2 Internationaal 274 Internationaal Monetair Fonds 269 Internationale organisaties 281 Internet 2, 97, 275 betrouwbaarheid 140 geschiedenis 124 meer dan het WWW 134 Internet Explorer 77, 186 browser 4 toetsencombinaties 13 Internet Relay Chat 134, 256 Internetgids 20 bediening 30 goed versus slecht 90 kenmerken van goede 31 versus zoekmachine 22 Internetgidsen 276 Internetregister 172 Internetresearch 2, 23 Internetsites lijst met 20 Internetverbinding 2 IP 127 Ipl2 94, 104 IP-nummer 125, 127 traceroute 157
300
IRC 134, 255-256 channels zoeken 260 gebruik 257 kenmerken 256 opdrachten 260 ISS 287 Jane's 279 Jarkko Oikarinen 134, 256 Joker 29 Journalistenhulp België 277 Journalistenhulp Nederland 277 Journalistiek 277 Kadaster 176 Kamer van Koophandel 167 Kamerhandelingen 97 KaZaA 135 KEN 114 Kerkhoven 267 Kobala 75 Koninklijke Bibliotheek 267 Kosten van ziekten 273 Kranten 286 Nederlandse 286 Kruiden 273 Kwaliteit 90 Kwantiteit 90 Landen doorzoeken 48 Landgidsen BBC 274 Landgidsen CIA 274 Landgidsen The Economist 275 Landinformatie IMF 269 Lawrence Roberts 123 Leiders 281 Lexis-Nexis 266 Library of Congress 94, 103, 267 Link: 61, 154 LinkedIn 251 LinkedIn Answers 108 Localhost 246 L-soft 235 Luchtvaart 286 Lui-zoeken-via-Google-truc 102 Lurker 232 Lycaeum 269 MAD 112 MadSci Network 112 Mail 232
Handboek – Internetresearch
Mailinglijst 232 NOT 29 kwaliteit 233 Nummerboek 169 nut 232 Nummerzoeker 170 over internetresearch 232 Oddens 271 relevante vinden 233 Officiële Bekendmakingen 97, 99, 280 Marill, Thomas 123 Oikarinen, Jarkko 134, 256 Medische gidsen 273 Onion, The 138 Mensenrechten 282 Onderwijs 280 Merriam-Webster 285 Open Directory Project 92 Message 214 OR 28 Met alle woorden 37 Orkut 253 Met de exacte woordcombinatie 38 OS X Mail 240 Met een van deze woorden 39 Outlook Express 238 Metadata 25 Overheden 281 Metareligie 283 internationaal 281 Metazoekmachine 74, 80 Nederland 280 Microsoft 4 P2P 135 Microsoft Excel 51-52, 54 Paaseierenregel 140 Microsoft Outlook 237 Packet switching 123 Microsoft PowerPoint 51-52, 54 PageRank 26 Microsoft Word 51-52, 54 Pagina Militair 278 soortgelijke vinden 61 mIRC 257 Pandia 84 Misdaad 279 Patenten 287 MissMag 277 Paul Baran 123 MySpace 252 PDF-bestand 283 Mythes 275 Peer to peer 135 Nationale Atlas Volksgezondheid 273 People's Network 105 Nature 277 Persberichten 278 Naymz 177 Personen vinden 172 NEAR 29 Persoonlijke pagina 131 Nederlandse films 268 PGPI 283 Nederlandse gemeenten 279 Piet Beertema 212 Nederlandse gezondheidszorgregistraties 273 Pipl 173 Nederlandse medicijnen 273 Plagiaat opspeuren 280 Nederlandse Onderzoek Databank 179 Politiek Nederlandse taaldatabanken 285 internationaal 281 Nederlandse Vereniging van Journalisten 277 Nederland 280 Netiquette 275 webgids 281 Netscape 4, 77 Poll 215 New York Times 206 Post 214 News reader 214 Poynter Online 278 Newsisfree 206 Prikbordsysteem 212 Nickname 258 ProfNet 111 Nieuws 288 ProQuest 266 Nieuwsbrief 232 Publieke databases 281 Nieuwsgroep 214, 222 PubMed 98, 274 Nieuwssite 193 Quote 191
301
Index
RDF 206 Ray Tomlinson 124 Really Simple Syndication 186 Received: 241 Received: from 243 Recht 282 Rechtspraak 280 Reed Elsevier 266 Refdesk.com 276 Registrant 145 Registrar 145 Reisplanner OV 286 Rekenmachine 59 Relatienetwerk 248 Religie 282 Reply-to: 241 Request For Comments 276 Research naar onderwerpen 215 naar onderwerpen met Google Groups 222 naar personen 215 RSS 187 Researchvragen 103 Resource Description Framework 206 Return-path: 241 Reverse DNS-scan 155, 158 Reverse lookup 168 via telefoonnummer 171 Rich Text Format 51, 54 RIVM 273 Roberts, Lawrence 123 Routebeschrijving 65 Routeplanner 286 RSS 186 feed bekijken via website 202 feeds vinden 203 hulp bij research 187 lezen 197 standaarden 196 voordeel boven nieuwsbrieven 188 waar te vinden 190 RSSOwl 200 RssReader 199 Rubrieksindeling 30, 91 RxList 272 Schoolbank.nl 174 Schoolpagina.nl 175
302
Schoolprestaties 280 Scirus 288 Scribd 253 SearchEngineWatch 86 SearchIRC 260 Second opinion 154 Shareware 283 Sharpreader 199 Shockwave Flash 51, 54 SIDN 144, 149 alternatief 151 Site bedriegelijk 141 doorzoeken 47 Site: 47 Siteautoriteit 152 Slideshare 254 Sociaal en Cultureel Planbureau 280 Social network 247-248 Software 283 gratis 283 Usenet-research 227 Space Shuttle 287 Spam 182, 237 Spamdexing 27 Spider 24 Spitsvoorspelling 286 Spybot Search & Destroy 5 Spyware 4, 6 Staatslieden 282 Startpagina 22, 90 Statistiek 283-284 Amerikaans 284 cursus 284 Europees 284 Nederlands 284 Steljevraag.nl 114 Stichting Internet Domeinregistratie Nederland 144 Stratfor 279 Streetview 64 Structuur 90 Submit Express 154 Sub-TLD 129 Sullivan, Andrew 191 Synoniemen 60 Taal 284 Taalfuncties 62
Handboek – Internetresearch
Taalkwesties 285 Technical contact 146 Technorati 204 Tekstanalyse 24 Telefoongids, De 165 Telefoonnummers bedrijven 167 personen 164 Telnet 135 The Onion 141 Thematische kaarten 271 Thomas Marill 123 Thread 214 Tijd 275 Tijdschriftartikelen 287 Tilde 131 Tile 235 Tim Berners-Lee 124 TLD 128, 143, 289 betrouwbaarheid 130 To: 241 Toetsencombinatie 12 Tomlinson, Ray 124 Top Level Domain 128, 143, 289 Topica 236 Traceroute 155 Tracert 156 Transparantie 32 Trillian 256, 263 Tweede en Eerste Kamer 280 Twitter 248 Uclue 110 Uniform Resource Locator 128 Unix 212 Url 128 Usenet 134, 211-212 idioom 214 nut voor research 215 research automatiseren 227 research via Google Groups 215 software voor research 227 toepassingen 212 Van Dale 285 Verborgen documenten vinden 54 Verdwenen documenten terughalen 49 Vertrouwelijke informatie 55 Vervoer 285 Vitamines 274
Voelspriet 87, 102 Vorige 14 Vragen staat vrij 276 Wat zweeft daar 287 Web (diep) 96 Webadres 128, 131 Weblog 190, 288 WebMD 274 Webmedia 286 Webmon 118 Website automatisch op de hoogte blijven 115 inhoud analyseren 24 nuttig 10 ontleden 131 vertrouwen 141 Website Watcher 118 WebWereld 3, 78 Wetenschap 287 Wetenschappelijke disciplines 277 Wetenschappelijke zoekmachine 288 Wetenschapsjournalistiek Europa 278 Verenigde Staten 278 Wetgeving Nederland 282 wereldwijd 282 WhitePages 171 WHOIS 143, 155, 245 betrouwbaarheid 145 gerelateerde diensten 151 zoektocht 164 Whois Source 151 Wieowie.nl 172 WikiAnswers 80 Wikipedia 84, 270 Wildcard 29 Windows 2, 4 algemene wenken 12 Windows Live Messenger 255-256, 262 Wisselkoersen 269 Wolfram|Alpha 76 Woordcombinaties 41 Woordenboek 59 Word-document 8 World Wide Web 4, 124, 128, 134 X1 8 XLS 56
303
Index
X-mailer: 241 XML 186 X-Originating-IP: 241 Yahoo! 20, 23, 75, 91 Groups 234 Messenger 135 People Search 177 YouTube 255 Zakenlui 182 Ziekenhuis 274 Zoek in veel encyclopedieën 270 Zoeken advocaat 180 deskundigen 179 dienstmakkers 175 diepe web 99 diplomaten 181 e-mailadres 182 geavanceerd 35 in een site 47 in landen 48 IRC-channels 260 lui 102 op datum 45 op documenttype 50 op doelbestand 83 op IP-nummer 128 op medium 83 op onderwerp 83 op regio 83 oud-klasgenoten 174 personen 172 personen met Google Groups 216, 221 zakenlui 182
304
Zoeken.nl 74 Zoekindex 55 Zoekmachine 20, 24, 287 autoriteit 25 bediening 27 buitenlands 75 foppen 27 gespecialiseerd 83 informatie over 86 kenmerken van goede 31 metazoekmachine 80 Nederlands 74 overige 73 second opinion 152 versus internetgids 22 werking 23 wetenschappelijk 288 Zoekregels 17 Zoekresultaten in nieuw venster openen 13 Zoekstrategie 1, 16 Zoekterm 20, 24 in meerdere talen 62 Zoekveld 31 Zoekvraag 21 Zoekwoord 34 Zonder de woorden 43